快捷搜索:  汽车  科技

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)一般认为要能以计算化学准确仿真各种生物及材料系统 理论化学家需要研发出计算量仅与系统大小的平方甚至一次方成正比的准确量子化学方法。因此 我们可以预见 随着计算机技术和化学计算方法的进一步发展 计算化学必将对真正意义上的现代化学产生巨大的推动作用。成正比。因此 计算机计算功能的提升通常并无法将可准确仿真的系统加大多少。对不同的子领域 常见且经典的计算化学研究方式由于计算化学主要是依靠计算机作为硬件载体和实施手段的一门学科 因此 计算机技术的发展将对其起到一定的促进作用。由于计算机科技进步的速度非常快 因此不易预测长远的未来计算化学的发展。十五年来PC在功能上有超过1000倍的提升 而未来十五年的发展又是如何呢?依照专家的估计 由于物理定律的限制 类似现有的处理器结构在功能上大概只有十倍的成长空间。短期来看 平行处理的技术可大幅提升运算的效率:长远而言 或许光学计算机甚至于量子计算机将会提供现

世界的发展总是伴随着底层技术的应用与普及,与之相伴的是工作方式的迭代,甚至一些工种的消逝。如果我们顺着时代的脉络向未来看去,人工智能一定是未来那个改变世界的核心技术。

不久前,一个消息在化工圈引起了不小的波澜:北卡罗莱纳州立大学和布法罗大学的研究人员开发了一种称为“人工化学家”(Artificial chemist)的技术,该技术结合了人工智能(AI)和用于进行化学反应的自动化系统,一天能够摸索500个技术条件。而这一技术的底层逻辑,就是计算化学。作为一个前沿技术的分享平台,流动化学技术体系的整理了该学科相关知识,供您参考

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(1)

正文

1

对不同的子领域 常见且经典的计算化学研究方式

由于计算化学主要是依靠计算机作为硬件载体和实施手段的一门学科 因此 计算机技术的发展将对其起到一定的促进作用。由于计算机科技进步的速度非常快 因此不易预测长远的未来计算化学的发展。十五年来PC在功能上有超过1000倍的提升 而未来十五年的发展又是如何呢?依照专家的估计 由于物理定律的限制 类似现有的处理器结构在功能上大概只有十倍的成长空间。

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(2)

短期来看 平行处理的技术可大幅提升运算的效率:长远而言 或许光学计算机甚至于量子计算机将会提供现今无法想象的计算速率。然而 计算化学要有真正突破性的发展 除了硬件的进步外 理论上的研究似乎更为重要。目前对于大分子的计算限于理论的复杂性只能使用分子力学或半经验法;而且就算计算机功能上能有1000倍的提升 距离准确的量子仿真仍有一段距离。目前的理论方法 仅能对大约小于十个原子的系统达到化学误差(1-2kcal/mol1)内的准确度;而且这些准确的计算方法的计算量大约是跟系统大小的七次方

成正比。因此 计算机计算功能的提升通常并无法将可准确仿真的系统加大多少。

一般认为要能以计算化学准确仿真各种生物及材料系统 理论化学家需要研发出计算量仅与系统大小的平方甚至一次方成正比的准确量子化学方法。因此 我们可以预见 随着计算机技术和化学计算方法的进一步发展 计算化学必将对真正意义上的现代化学产生巨大的推动作用。

量子化学计算方法的演进主要分为

(1)分子轨道法(简称MO法)和(2)价键法。以MO法为例分子轨道法的核心是哈特里一福克一罗特汉方法 简称HFR方程 它是以三个在分子轨道法发展过程中做出卓越贡献的人命名的方程。

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(3)

1928年DR・哈特里( Hartree)提出了一个将N个电子体系中的每一个电子都看成是由其余的N-1个电子所提供的平均势场运动的假设。这样对于体系中的每个电子都得到了一个单电子方程(表示这个电子运动状态的量子力学方程) 称为哈特里方程使用自治场迭代方式求解这个方程(自治场分子轨道法) 就可以得到体系的电子结构和性质。哈特里方程未考虑由于电子的自旋而需要遵守泡利原理。

1930年 B•A・福克(Fock)和J・C斯莱特( Slater)分别提出了考虑泡利原理的自治场迭代方程 称为哈特里-福克方程。它的单电子轨函数(即分子轨道)取为自旋轨函数(即电子的空间函数与自旋函数的乘积)。泡利原理要求 体系的总电子波函数要满足反对称化要求 即对于体系的任何两个粒子的坐标交换都使总电子波函数改变正负号 而斯莱特行列式波函数正是满足反对称化要求的波函数将哈特里一福克方程用于计算多原子分子 会遇到计算上的困难。C・C・J・罗特汉( Roothaan)提出将分子轨道向组成分子的原子轨道(AO)展开这样的分子轨道称为原子轨道的线性组合(简称ICAO):使用LCAO-MO 原来积分微分形式的哈特里一福克方程就变为易于求解的代数方程 称为哈特里一福克一罗特汉方程 简称HFR方程。

RHF方程一闭壳层体系是指体系中所有的电子均按自旋相反的方式配对充満某些壳层(壳层指一个分子能级或能量相同的即简并的两个分子能级)这种体系的特点 是可用单斯菜特行列式表示多电子波函数(分于的状态) 描述这种体系的HFR方程称为限制性的HFR方程 所谓限制性 是要求每一对自旋相反的电子具有相同的空间函数限制性的HFR方程简称RHF方程UHF方程一一开売层体系是指体系中有未成对的电子(即有的壳层未充满)。

描述开壳层体系的波函数一般应取斯莱特行列式的线性组合 这样计算方案就将很复杂 然而对于开壳层体系的对应极大多重度(所谓多重度 指一个分子因总自旋角动量的不同而具有几个能量相重的状态)的状态即自旋角动量最大的状态)来说 可以保持波函数的单斯莱特行列式形式(近似方法)以描述这些体从头计算法一一原则上讲 有了HFR方程(不论是RIF方程或是LHF方程) 就可以计算任何多子体系的电子结构和性质、真正严格的计算称之为从头计算法。

在从头计算法里 分子轨道由组成体系的原子的全部原子轨道线性组合而成。对于原子轨道有不同的选法。斯莱持型轨道适于描写电子云的分布在计算一些积分时包含对无穷级数的积分 十分麻烦 所以在从头计算法里 常取高斯型函数做为基函数 取一个高斯型函数或数个高斯型函数的线性组合模拟一个原子轨道。已经有了不少进行多原子体系的从头计算法的标准的计算机程序 如J•A波普尔研究集体推出计算机程序系列:高斯系列该系列第一个公开的版本为高斯70(指1970年)以后差不多每年更新一次 功能逐次增多 算法也日趋完善势价轨道从头计算法一一从直观的化学观出发 可以想见 在原子形成分子时 仅仅原子的价层电子发生了较大的变形 而内层电子分布则改变较小。

为了节省计算时间 而又不失去计算精度 从20世纪70年代以来 开始只考虑原子的价电子 而把内层电子和原子核看成一个凝固的原子实 用一个核模型势来代替内层电子与价电子的从头计算法 称为赝势价轨道从头计算法:不同的方案对于赝势的取法不尽相同 且大都能得到与全电子从头计算法相近的结果 因而大大节省了计算时间 特别对于含有重原子的体系 恰好是全电子从头计算难以处理的。势价轨通从头计算法将会在过渡金属络合催化的量子化学研究方面发挥重要作用。

组态相互作用法一比从头计算法精确度更高的组态相互作用法有两个优点:一是不依赖于试探波函数的形式 就能原则上提非相对论薛丁谔方程的精确解;二是原则上可用于原子或分子体系的任何稳定态近似计算法一一在半经验计算法中 目前最常用的近似是零微分重叠(简称ZDO):近似程度最高的是全略微分重叠(简称CNDO)近似 是J•A•波普尔在1965年提出的。此外 在近似计算法中 还有休克尔分子轨道法和推广的分子轨道法。

2

新的计算化学技术和程序对所能处理的体系尺度和精度的影响

量子尺寸效应:当粒子尺寸下降到某一值时 金属费米能级附近的电子能级由准连续变为离散能级 以及能隙变宽 物理和化学随粒子数的增加出现不连续的变化。小尺寸效应:微粒尺寸与光波波长 徳布罗意波长等物理特征尺寸相当或更小时 晶体周期性的边界条件将被破坏 非晶态纳米微粒的颗粒表面层附近原子密度减小 导致声、光、电、磁、热、力学等特性呈现新的小尺寸效应纳米催化剂中的尺寸效应:纳米粒子与周期性大块固体物质物理和化学性质的显著差异 是造成其催化性能与传统催化剂非常不同的根本原因 相应地 纳米健化剂的催化活性、选择性也与大块固体催化剂的有显著不同 出现显著的:小尺寸效应n量子尺效应

一个原子一个原子的调节催化剂的活性和选择性理论计算的几个研究方面:纳米催化剂本身的性质及其中的尺寸效应:几.何构型.电荷分布 表面成键 能级 吸收谐等等.纳米催化剂与参加反应的物种的相互作用以及其中的尺寸效应:吸附形态 吸附能 成键 光谱信(红外 拉曼)等性质催化反应中的尺す效应:反机理 中间体 过渡态 反应速率 反应选择性等催化体系的理论模拟和催化剂的分子设在生物体系中的应用。

QM/MM(量子力学/分子力学方法)

1.计算化学和生物化学反应活性:酶催化反应机理

2.溶剂化作用:QM溶质和紧邻溶剂分子、MM溶剂体系

分子动力学应用:大分子模拟

1.碳水化合物的溶剂化效应;

2.生物膜的渗透:分子动力学模拟;

3.膜蛋白的环境:

4.分子动力学研究双脂层;

5.界面过程:界面聚集 界面反应和界面的传质过程:

6.蛋白质模型:折叠-去折叠动力学;

7.NA中的分子动力学;

8.核酸构象和柔性;

9蛋白质一核酸相互作用

精修实验结构

1.模拟退火法进行大分子结构计算和精修

2用NMR数据确定大分子结构及结枃精修

3.用X-射线晶体衍射确定大分子结构及结构精

构象分析

1.系统搜索、随机搜索、动力学模拟、遗传算法

2.构象平衡:溶剂对分子构象的影响

20 世纪80 年代以来,随着计算机性能的提高以及各种计算化学方法的改进, 分子模拟技术日渐成熟,并逐步发展成为人们进行科学研究的一项新的有效的工 具,在化学、制药、材料等相关的工业上发挥着越来越重要的作用。分子模拟之所以受到这样的重视,与它自身的特点和相关学科的发展是密不 可分的。

以前,采取的都是实验室人工合成一种新型化合物,但是有一些化合物 的合成繁琐而复杂,例如具有多种旋光性的药物,每一种新的药物合成都是一个 工作量巨大的实验过程,以往只能采用实验手段研究时,新药的实验过程经常持 续数十年,其间经历了许多失败的实验,耗费大量的人力物力。但是,在采用分 子模拟的方法后,可以通过计算机模拟的手段对实验进行大量的预先筛选,大大 加快了这一研究的进程。又如在对超临界流体的研究中,分子模拟和传统的实验 相比有着巨大的经济优势。

分子模拟的定义

分子模拟是一个广泛的概念,其包括基于量子力学的模拟和基于统计力学的模拟。前者为计算量子化学(computational quantum chemistry,简称CQC),后者 主要分为两个方法,分别是分子动力学模拟(molecular dynamics,MD)和蒙特卡 洛模拟(Monte Carlo,MC) 。三者中以计算量子化学的结果最为可靠,但是其计算量也是最大的,通常处理的体系也是比较小的.MC MD都是基于位能函数 的模拟,不同之处在于 MD 模拟过程与时间相关,除了和 MC 一样可以处理平 衡性质以外,在处理传递性质等与时间相关的问题时有天然的优势,当然 MD 和MC 相比程序的复杂程度要高,计算的难度要大一些。

分子模拟的方法

分子模拟的方法主要有四种:分子力学方法,分子动力学方法、蒙特卡洛方法、量子力学方法。

分子力学方法 分子力学法又称Force Field 方法,是在分子水平上解决问题的非量子力学技 术。其原理是,分子内部应力在一定程度上反映被计算分子结构的相对位能大小。分子力学法是依据经典力学的计算方法,即依据 Born-Oppenheimer 原理,计算 中将电子的运动忽略,而将系统的能量视为原子核种类和位置的函数,这些势能 函数被称为力场。分子的力场含有许多参数,这些参数可由量子力学计算或实验 方法得到。该法可用来确定分子结构的相对稳定性,广泛地用于计算各类化合物 的分子构象、热力学参数和谱学参数。

分子动力学方法 分子动力学模拟是一种用来计算一个经典多体系的平衡和传递性质的方法。它对于许多材料来说是一个很好的近似,在许多方面,分子动力学模拟与真实实 验相似。它以特定粒子(如原子、分子或者离子等)为基本研究对象,将系统看作 具有一定特征的粒子集合,运用经典力学方法研究微观分子的运动规律,得到体 系的宏观特性和基本规律。

由于分子力学所描述的是静态分子的势能,而真实分 子的构象除了受势能影响外,还受到外部因素如温度、压力等条件的影响,在这 种情况下,分子动力学方法应当是更合实际、更符合真实状态的计算方法。分子 动力学模拟已应用于模拟原子的扩散、相变、薄膜生长、表面缺陷等过程,可得 到原子结构因子、状态方程、弹性模量、热膨胀系数、热容、焓等物理量。

蒙特卡洛方法 蒙特卡洛法与一般计算方法的主要区别在于它能比较简单地解决多维或因 素复杂的问题,它利用统计学中的许多方法,又称统计实验方法。该方法不像常 规数理统计方法那样通过真实的实验来解决问题,而是抓住问题的某些特征,利 用数学方法建立概率模型,然后按照这个模型所描述的过程通过计算机进行数值 模拟实验以所得的结果作为问题的近似解。

因此,蒙特卡洛法是数理统计与计算 机相结合的产物。由于高分子链由大量的重复单元构成,聚合反应存在着随机性。分子量的大小分布、共聚物中的序列分布、高分子的构象、降解,都存在着随机 性问题,蒙特卡洛法无疑成为研究的最佳对象,几乎从其建立之日起,就在高分 子领域得到了应用。量子力学方法 量子力学方法借助计算分子结构中各微观参数,如电荷密度、键序、轨道、 能级等与性质的关系,设计出具有特定动能的新分子。

该法所描述的是简单的非 真实体系,计算的是绝对温度零度下真空中的单个小分子。其中从头算量子力学 计算广泛用于计算平衡几何形状、扭转势以及小分子的电子激发能。随着计算机 硬件和算法的发展,已将此技术用到大分子,包括聚合物的低聚物在内的模型, 并有较好的效果。

分子模拟在化学领域的应用

分子模拟在石油化工领域的应用 分子模拟技术与传统的实验手段相结合,正在开拓分子模拟技术在石油化工 领域如高分子材料设计、反应过程研究、催化剂和油品添加剂作用机理及分子设 计开发等方面的应用新局面,帮助研究人员更深入地理解所研究体系的反应机 理,选择更合理的研发途径,更快地进行新分子筛催化剂的改性和开发、高分子 复合材料的设计以及油品添加剂复合配方的研制,减少实验工作量,进一步推动 在石油化工领域的技术创新。

分子模拟在分子筛领域的应用

分子力学法在分子筛的吸附扩散研究中的应用实例 分子力学的计算中不考虑电子运动状态,系统的势能仅与体系中原子核的空 间坐标相关,把原子看作是球,化学键看作是弹簧,则分子可以看作是通过具有 不同弹性(力常数)的弹簧将各个球(原子)连接起来的体系。其优点是概念简单、 计算速度快,可以处理较大的体系,对处理分子构象、分子热力学性质等的计算 已取得了成功。

不足之处是分子力学不能提供和电子分布相关的性质,意味着它 不能处理电子效应起主导作用的化学体系。王巍采用基于 Monte Carlo 取样方法的分子力学模拟方法,研究了丙烯和4 C4单烯烃异构体在丝光沸石内的物理吸附,得到了单组分烯烃在丝光沸石上 的等压吸附性能曲线,以及等比例多组分体系和不等比例多组分体系的等压吸附 曲线。

分子动力学模拟在分子筛的吸附扩散研究中的应用实例 采用 MD可研究气相小分子在微孔中的扩散性质。June 等采用分子动力学 模拟的方法研究了甲烷、丁烷、己烷、氙气在 ZSM- 分子筛上的动力学性质,预测得到了自扩散系数,发现 300K 400K下组分自扩散系数均随着吸附量 的增大缓慢减小。Gergidis 等采用分子动力学模拟的方法对正丁烷 -甲烷混合物 体系在 ZSM- 分子筛上的传质性质进行了研究,发现混合物中一个组分的自扩散系数均随着另一个组分吸附量的增加而减小。

Sanborn 等运用分子动力学模 拟的方法研究了 CF4 和任意一种 C1- 10 直链烷烃(括甲烷,乙烷,丁烷,己烷 辛烷和葵烷)的二元混合物体系在八面沸石中的传质性质和分子筛的结构。表明 吸附量不同,不同种类扩散系数的大小不同。侯廷军等采用分子动力学模拟的方 法研究了纯硅 MCM- 22 型分子筛 (ITQ- 1)中苯分子的吸附行为。表明在较低吸附值的情况下,分子筛骨架的柔性对苯分子吸附和扩散并没有产生大的影响。

蒙特卡罗法在分子筛的吸附扩散研究中的应用实例 利用蒙特卡罗法可得到气体小分子在催化剂中的吸附性质,包括吸附位信 息、吸附量和吸附能。GCMC 方法最早被用于主体流体的模拟,后来推广到限 定空间。巨正则系综 Monte Carlo 方法广泛用于研究吸附质的吸附相平衡的研 究,它不仅可以模拟分子的静态结构和动态行为 (如氢键的缔合与解缔、吸附、 扩散等),也可以模拟微孔中吸附质的化学势、温度保持恒定时的平衡及预测分 子在微孔固体(如分子筛) 中的吸附性质,并且可以计算吸附等温线、结合位、 吸附热、扩散途径及分子选择性等。

Monte Carlo 模拟 [11] 已广泛应用于研究分子筛的吸附性能及分子筛内吸附 质的动态分布。Sebastian 等采用实验和 GCMC 相结合的方法研究了 Mn交换的 型分子筛中的吸附。实验得到的吸附等温线和模拟得到的吸附等温线基本吻合。在 A型分子筛中 ,Ar的吸附量随着 Mn 交换量的增加而增加;在粒状的 在低压下的吸附量随着Mn 交换量的增加而增加,在高压下稍微低于未经 Mn 交换的 型分子筛中,N2的吸附量随着 Mn 交换量的增加而增加。侯廷军等用 巨正则蒙特卡罗模拟方法研究了 NaY 分子筛中苯的扩散性质和纯硅 MCM- 22 型分子筛 (ITQ- 1)中苯分子的吸附行为

结果表明,在苯分子的扩散过程中,钠 分子筛中存在两个不同的吸附位点,而苯分子在ITQ- 基丁烷和二甲苯异构体在AlPO4-5 中的吸附,得了有关吸附平衡常数、吸附热、 吸附等温线及吸附位等信息。曾勇平等采用 GCMC 方法模拟了噻吩 苯二元组分和噻吩 正己烷三元组分在MFI MOR沸石中的吸附分离性能。

多种分子模拟方法结合研究分子筛的扩散系数 在分子筛的吸附扩散研究中,分子模拟技术已成为必不可少的研究手段。其 中,Monte Carlo 方法和分子动力学模拟的组合方法更是得到了广泛的应用,并 取得良好的效果。比如,巨正则 Monte Carlo 模拟用于研究吸附质的吸附相平衡 问题,分子动力学模拟可以广泛地用来研究吸附质在分子筛中的扩散性质。结合 分子动力学和巨正则 Monte Carlo 模拟可以得到吸附质在分子筛中的静态和动 态性质。

Song 等通过频率响应法、MonteCarlo 和分子动力学相结合的方法对苯、 对二甲苯等客体分子在 Silicalite- 中不同温度下平衡时的吸附能、吸附位及客体分子在扩散过程中的相互作用能进行了研究,并合理地解析了苯在 Silicalite- 中的扩散系数小于甲苯,而饱和环烷烃的扩散系数小于其相应的芳烃的原因。

单一的分子模拟方法已经不能满足现代工业对催化剂的研究和开发(包括分 子筛的吸附扩散研究中的应用)所提出的更高的要求,这就要求人们把组合方法 更好地应用到这个领域,即对某些关键部位使用精确的量子力学能量函数,而其 他部位使用分子力学的位能函数,实现优势互补,使得新方法既能模拟原子数目 很大的体系,又能考虑电子的结构及运动,充分发挥分子模拟方法的优势。

分子模拟高分子领域的应用

计算机模拟已经应用在高分子科学的各个方面,包括模拟高分子溶液、表面 和薄膜、非晶态、晶态、液晶态、共混体、嵌段共聚体、界面、生物聚合物、高 分子中的局部运动、液晶高分子的流变学、力学性质和电活性等 [12 13] 通过建立高分子的溶解和界面作用的模型,可以模拟固体内表面的几何优化,动力学、震动分析。从而准确地确定高分子混合物的热力学性质,如水合能、 蒸汽压、分配系数等。分子模拟同时可以获得小分子气体在高分子材料中扩散的 力学性能信息,对合成合适的高分子膜起到很大帮助。它还可以预测各种涂料的 界面信息,可以有效指导实验,寻找到最佳涂料。

另外,它还可以对高分子的共混相容性和力学性能进行模拟和研究 发展新的方法和算法是未来 发展的重要方向。分子模拟会进一步继续被应用在化学中各个领域中,此外,还会与化学与生 命科学等交叉学科中发挥重要作用,特别是药物设计,蛋白质-蛋白质作用,蛋 白质-配体作用等领域有重要应用前景。最后,发展新型的分子模拟软件,开发出新型的可用于计算机辅助分子裁剪、 分子设计、分子合成以及物性分析等用途的软件,从而使分子模拟具有广阔的应 用前景。

3

高通量筛选、机器学习等在功能分子开发,表面催化剂筛选等的应用

Nature Catalysis:下一个研发范式“机器学习 DFT ” — 预测和筛选新型电催化剂在电催化CO2还原的反应中(CO2RR),析氢反应(HER)是其主要的竞争反应,可能导致CO2的产物转化率比较低、产物的选择性较差,例如Cu催化剂;然而对于Au,Ag等催化剂,其主要产物是CO,CO2的转化率也比较高,但催化剂成本高。

在基于密度泛函理论(DFT)的计算中,对于CO2RR和HER催化剂的活性普遍分别使用CO和H在催化剂表面的吸附强弱来描述,这就是通常所说的基于描述因子的研究方法,已经广泛使用。需要指出的是,单个描述因子不能完全描述金属间化合物的催化性能,还需要分析该表面的稳定性、高覆盖下的热力学和动力学性能。采用DFT方法对催化剂的所有关键性质进行计算,实际上并不能加速实验中对电催化剂的研究,但是理论研究对催化剂的预筛选却具有较大的价值。这种做法可以缩小候选催化剂的空间,加速材料的筛选。

卡内基梅隆大学的Zachary W. Ulissi课题组,Kevin为第一作者发表在Nature Catalysis上的工作。介绍机器学习(ML)和优化的组合方法,全自动地指导DFT方法对ML预测得到的候选电催化剂进行高通量筛选,候选结构可在原文的SI中找到。

本文设计的全自动化筛选框架,使可考虑的搜索空间更大。

Mendeleev database:元素性质数据库,可以提取元素的多种性质,用以构成机器学习所需要的特征;在本文中则提取了吸附位点处不同元素的物理/化学性质作为其化学环境的表示,例如,原子序数、泡利电负性。

TPOP:一个自动化的机器学习工具,用来选择机器学习的回归方法,在本文中预测吸附能。

Fireworks:一个作业管理流程解决方案,用来自动创建任务,执行任务。本文中,可用来执行提取或创建晶体结构、创建不同指数的晶面(hkl)、提交DFT任务、提取能量、创建吸附构型、再提交任务、执行ML回归预测等一系列子任务。此外,Luigi与Fireworks具有类似的作业管理功能,这两种方法均在本文中搭配使用。

Material Project:一个材料晶体结构数据库。

Pymatgen 和Atomic simulation environment (ASE):用来创建晶体结构、表面结构和表面吸附结构。

本文提出对特殊性能材料的高通量筛选的流程(图1),利用机器学习方法预测大量候选物的性质,与理想值进行比较,从中选出最接近理想值的候选物,对这些候选(结构)针对性的进行DFT计算,再将这些新数据添加到训练集中,再进行模型训练,重复该筛选过程,直到无候选物可选。对于候选物的选择,采用高斯概率模型通过测量预测值与最优值之间的距离来确定DFT计算的候选结构,其标准差为0.2 eV。

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(4)

图1:自动化材料发现的工作流示意图

在机器学习中,特征的选取至关重要。该特征越能真实表示结构的信息(化学环境),预测结果则能越准确。但是,特征的提取是最难的一步。文中使用吸附位点处,用每个原子的四个属性表示该原子的化学环境[原子序数,电负性,原子配位数,本征吸附能]。考虑了吸附位点周围8个原子的属性,构成了32位的特征矢量,用以表示吸附位点的化学环境(图2)。

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(5)

图2:吸附位点处化学环境的数字化表示;TPOP是全自动的ML程序。

对CO2RR和HER,文中指出最优的CO和H的吸附能(无修正)分别是-0.67 eV 和-0.27 eV。从筛选的结果来看,对于CO2RR大部分接近最优吸附能的结构是含Cu的金属间化合物(图3),而大部分的合金表面不利于CO2RR。

从图3a可知,每月能够筛选出的候选物结构的数目很少,且不稳定,也能反映出ML模型的不稳定。新的DFT数据被添加到原始训练集中,并没有提高模型预测的准确度,可能的原因是特征不足以描述对应结构的化学环境。

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(6)

图3:鉴别CO2RR最优吸附表面

a. 每个月筛选所得最优表面的数目及绝对误差的分布;

b. 所有DFT计算所得CO吸附能在低覆盖度下的归一下分布、含Cu表面的吸附能分布;

c,d. 展示DFT、ML计算所得的CO吸附能分布。

对于HER的结果分析,文中用t-SNE分布可视化结构与H吸附能的关系(图4),除了Pt以外,还有一些金属间化合物表面具有接近最优值的H吸附能:As,Al,Si,Sb,Rh和Pd。DFT计算发现258个不同表面的H吸附能与最优值-0.27 eV相比,误差在0.1 eV之内。

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(7)

图4:HER性能的结果分析。

a. t-SNE可视化所有DFT计算的活性位点。

b. 所有DFT计算所得H吸附能在低覆盖度下的归一下分布。

本文设计了一个可自动化计算的框架(GASpy),结合任务管理、机器学习和DFT计算的一系列的操作。这种设计思路主要用来针对特定性质进行高通量材料筛选。本文应用于CO2RR和HER电催化剂的筛选,元素涉及到化学元素周期表中的大部分金属及部分非金属,最终筛选出上百种候选表面结构,极大的缩小了实验研究的范围。

计算筛选的研究方法也存在一些局限性,1)筛选出的候选材料未必稳定;2)未选出的材料未必不具有高的催化活性,因为本文只考虑低覆盖度的情况;3)ML模型的准确性比较差,一定程度上跟特征选取有关。

对于类似的模型,对于机器学习的模型,通过限定筛选材料的晶面指数,使得特征的选择尽可能的一致,有可能使模型的预测精度进一步提高,进一步极大的降低计算成本。

4

计算化学带来的新思想在化学反应动态学等全新领域注入的

新活力

计算机辅助分子设计包含着计算机药物(包括农药等)分子设计和计算机辅助材料设计。

计算化学任务之一:计算机辅助药物分子设计

计算机辅助药物分子设计的目标是先导化合物的发现及其优化方法。其研究方法主要有间接法、直接法两类。

间接法,即基于配体的设计方法。当缺少靶标(受体、酶等生物大分子)结构信息时,主要采用这种方法:从一组小分子化合物(一般需要十至几十个化合物)的结构和生物活性数据出发,研究其结构与活性的关系规律,在此基础上预测新化合物的生物活性,从而进行高活性分子的结构设计。主要是定量构效关系研究(QSAR),包括2D-QSAR (如:Hansch、Free Wilson法)和3DQSAR (如:CoMFA法、CoMSIA法)。

这些方法的主要问题在于需要合成一定数量并经过严格的药理学评价获得活性数据的化合物,我们将其称为“训练集”,然后通过机器学习,和统计学计算,获得相关性很好的QSAR方程。然而,我们在研究中经常会碰到一些十分尴尬和困惑的现象,即构建的非常好相关指数的QASR方程,但在预测外部数据集我们称之为“测试集”的活性时,却与实验数据大相径庭。可能存在“活性悬崖”的现象,即微小的结构变动带来活性极大变化,常常因此造成了设计上的失败。这也许是当今计算机辅助药物分子设计的瓶颈。究其原因仍然迫切需要人们探究和解析。

直接法,即基于受体的设计方法。已经获得靶标(生物大分子,如蛋白质、核酸、酶、离子通道等)的结构信息,来研究药物分子与受体的相互作用,从而获得药物分子的结构特征,设计出从空间形状和化学性质两方面都能很好地与靶标分子相结合的药物分子。随着分子生物学、细胞生物学和结构生物学的发展,越来越多的药物作用靶标分子(蛋白质、核酸、酶、离子通道) 被分离、鉴定,其三维结构被阐明,为直接药物设计方法的应用提供了有利的条件。直接药物设计包括全新药物设计(de novo drug design)和数据库搜寻(或称分子对接,Docking)两类。

全新药物设计,是根据靶标分子与药物分子相结合的活性部位的几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。数据库搜寻,首先应具备大量化合物(例如几十至100万个化合物) 的三维结构数据库基础上,将库中的分子逐一与靶标分子进行“对接”(Docking),通过不断优化小分子化合物的位置(空间取向)以及分子内部柔性键的二面角,寻找小分子化合物与靶标大分子作用的最佳构象,计算其相互作用及结合能。在库中所有分子均完成了对接计算之后,即可从中找出与靶标分子结合的最佳分子。

目前的药物设计主要是一种基于药物和靶标生物大分子三维结构的设计方法。即人们想知道的是药物分子是怎样与生物大分子结合的,它们的结合对人体会产生怎样的生理效应。然而,药物在人体的作用过程是非常复杂的系统。一个优良的药物除了与靶标分子产生所预期的相互作用之外,还应该具有良好的体内输运和分布性质以及良好的代谢性质,而这些要求在基于结构的药物设计方法中未能予以考虑,而且,也未考虑药物分子与受体活性中心结合是否对受体其它部位的结构变化而产生活性变化。

随着新世纪生命科学、计算机科学的发展,考虑药物作用不同机理和全部过程的药物设计—基于作用机理的药物设计方法(Mechanism—Based Drug Design)将逐步建立和完善。未来的药物设计,可能将从基于结构的药物设计向基于作用机理的药物设计方向发展。基于作用机理的药物设计,离不开计算化学,特别是量子力学,同时还需要化学、物理、生物等学科之间的紧密结合。虽然目前基于机理的药物设计还处于起步阶段,尚未形成系统的理论体系。

不管是间接法还是直接法,都要进行配体与受体的相互作用计算。它包含了上述所及的量子化学计算和分子模拟计算的各种方法。目前,被认为最为重要的方法是量子力学和分子力学(QM/MM)相结合的方法:药物分子与底物分子(酶、蛋白质分子)的结合中心位点,采用精确计算的量子化学QM法,而外围部分采用经典的分子力学MM的高效方法。这种结合的方法,目前正在发展中,而且已经取得一定的成果。

我们相信,随着新技术的不断涌现,药物在体内的作用形式、作用机理和性能的理论研究不断进步,新的统计学方法的引入,如支持向量机(SVM)新的机器学习方法的应用(小样本、非线性及高维模式识别),不久将来,计算机辅助药物分子设计的“瓶颈”将会突破,那时,计算机药物设计的辉煌时代将到来。

计算机辅助材料设计

目前计算化学发展最快、最为活跃、应用面最广的可以说是计算机辅助材料设计,而且已经取得了许多丰硕的成果。其主要包括特殊材料功能的设计、材料内部结构和特征的模拟与优化、材料内部损伤和晶体缺陷等对材料性能的影响计算和模拟仿真,等等。

目前材料研究主要集中在凝聚态,并且尤以固体材料研究为重点。固体材料从结构上大致分为两类:致密固体材料和多孔固体材料。致密固体材料,主要是磁,电,多铁性等性能的材料,包括热电材料,超导材料,铁电材料(多铁性材料),储氢材料(能源材料)、复合材料(纳米隐身复合材料)等。多孔固体材料,主要是能量转换与储存性能的材料,如:催化剂、蓄电池材料、储氢材料、燃料电池、光电池、发光材料、透明导体、隐身材料等。

材料的特性与原子或分子的结构、排列及其运动状态密切相关。因此,要研究材料的特性,必须掌握材料组成、内部微观粒子(原子)的空间架构和运动规律,理解它们对材料的变形与破坏的机理。但由于原子尺度在埃量级,直接观察非常困难。在这种背景下,对材料的原子尺度进行数值模拟就显得越来越重要。

利用计算机技术进行材料设计是发展新型材料的重要手段。材料设计通常分为3个层次。第一个是微观层次,即运用量子力学与量子统计力学来研究原子或分子的集体行为。第二个是介微层次,其大小在微米以上,研究的是许多原子或分子在一定范围内的平均性质,如形变、磁性等,一般用连续统计方程来描述。第三个层次是宏观层次,如宏观性能、生产流程与使用性能间的关系,材料的断裂以及微观结构的形成等一般采用分子动力学模拟。

计算机技术可以把3个层次的因素都考虑在内,通过建立模型(获取不同层数的数值参数,需要分别建立与之相适应的计算模型),然后进行计算和分子模拟。在此基础上,通过进行原子(或分子)替换和结构优化,得出符合预期性能的新材料的最佳成分、最佳结构以及最合理的工艺流程。计算机的高速计算能力、巨大的存储能力和逻辑判断能力与人的创造能力相结合,可对材料设计提出创造性的构思方案。

在材料研究方面,越来越多地采用QM/MM法。QM方法可以应用于研究化学反应,配位数的变化,而MM的方法可应用于经典粒子间的相互作用。在使用QM/MM方法时,重要的是,需要仔细考虑QM方法结合在MM的环境。

研究晶体(包括导体、绝缘体和半导体的晶体)电子的状态及其运动性质,离不开能带理论。能带理论认为晶体中的电子是在整个晶体内运动的共有化电子,并且共有化电子是在晶体周期性的势场中运动;结果得到:共有化电子的本征态波函数是Bloch函数形式,能量是由准连续能级构成的许多能带。能带理论在阐明电子在晶格中的运动规律、固体的导电机构、合金的某些性质和金属的结合能等方面取得了重大成就。为了更准确的能带结构的方法的需要,必须开发更有效的算法。

构效关系研究

世界万物的性质在一定条件下是由其结构决定的,这就是构效关系研究的基础。无论是药物还是材料,有什么样的结构,就可能具有什么样的性质和效果。药物的构效关系分析始于20世纪60年代Hansch所建立的方程

应用化学与化学有啥区别(普通的化学和计算机化学有啥不一样的)(8)

后来发展了分子力学和量子化学方法计算的参数与药物的药效进行相关分析,建立了含有量子参数的构效关系方程,使这方的研究又前进了一大步。20世纪80年代末90年代初,又推出了比较分子场分析等三维定量构效关系方法,是构效关系研究又上一个新台阶。

目前药物分子设计与构效关系研究,正在结合组合化学、高通量与高容量筛选及机器人筛选等新技术,推动有机化学及药物化学日新月异的发展。

计算化学任务之二:计算机辅助智能化化学结构解析

化学结构解析,即未知化合物结构的测定。它包含两个方面的内容。其一是合成化合物的结构测定。由于合成化合物是人们按照可能存在某种符合自己设想性能的化合物结构进行设计,所设计的化合物一般都是根据已有的化学反应知识和合成规则进行合成。由于有前体化合物的结构已知,最终化合物的结构分析可以通过几种常规的波谱分析表征,这是比较简单的结构解析。其二是已知其性能的某种化学物质,如某些天然产物、蛋白质、核酸等,只知其性能而不知其化学结构和组成。

他们通常是通过提取分离、或生物制备获得的产物,往往结构十分复杂,解析其化学结构十分困难,需要多种现代分析仪器进行结构测定。现代分析仪器发展已经十分成熟的今天,即使是经验十分丰富的化学家,有时对复杂的未知化合物的结构图谱解析也束手无策。

计算机辅助解析化学结构,已经引起了人们的高度重视。它包括两个方面的内容。其一是在某一或联合使用的分析仪器,加入计算机辅助分析软件,来帮助人们识别谱图,获得化学结构式。其二是独立的计算机结构分析系统,它是将各种分析仪器获得的光谱数据进行智能化谱图解析,自动获得化合物结构。

计算化学任务之三:计算机辅助合成路线设计

传统的化合物合成设计通常是化学工作者根据丰富的经验和灵感来完成工作。但是今天,以逻辑的方法而不是单凭经验和直觉来设计合成路线已经成为化学家设计合成路线的一个重要手段。虽然目前计算机合成路线设计还是初步的、辅助的,但已经迈出了这一步,经过几十年的发展和完善,可以预见,计算机辅助合成路线设计将变成最重要的手段,到时可以将“辅助”两个字去掉,成为化学合成路线设计的主要手段。

计算机辅助合成设计,包含了两个基本方式:其一是检索型的合成设计。即在现有的化学反应数据库中进行检索。尽管已有大量数据可供参考,化学反应体系的高度复杂性决定了难于用纯理论方法来解决合成路线设计问题,还只能从已知知识中找出共同规律,或从类比推测中来近似地解决这些问题。其二是推理型的合成设计。包含反应数据挖掘和反应知识发现、反应知识模型的表述和反应知识库的建立、化合物反应性能的预测、化学知识的类比推理等。

检索型合成设计,是基于现有的化学反应数据库。随着计算机科学和技术的发展,计算机在化学领域中得到越来越广泛的应用。从最初的简单数据处理,逐步发展到对化学结构的处理,以及目前的对化学信息的综合分析、知识获取和应用。其中化学数据库对化学工作者有着非常重要的作用和意义。化学反应数据库是从事化学合成的科技人员获取化合物合成信息的有效途径。数据库中存储着大量的已合成或发表的化合物的合成信息,根据这些信息,计算机通过来选择设计新的合成路线。同时人们凭经验和知觉,或者通过计算机分析来优化合成路线,达到合成步骤少、合成总产率高、原料简单便宜易得的目的。

推理型的合成设计,是基于计算机辅助合成设计系统,它是由反应知识库和反应合成分析两部分组成。首先计算机对用户提供的化合物结构进行分析,以确定该化合物的合成反应策略;再利用反应知识库中的反应知识和反应规则分析,以确定该化合物的前体。循环进行这二步操作,以最终获得起始反应原料为止。通过对这个循环过程路线的记录,便可得到一组可参考的该化合物合成路线的信息,这些信息辅助化学工作者的合成设计工作,以提高他们工作效率,并降低各个方面的消耗。

反应知识库,是一个开放式的数据库,在拥有目前已知的化学反应知识,包括的化学反应类型、反应机理、合成方法等,同时对于新发现的反应知识不断扩充到库中。而反应合成分析,是计算机对人们输入计算机的化合物结构,经过合成反应策略分析和确定后,通过反应知识库分析和所建立的数学模型的求解演算进行智能化的取舍,经过记录、分析、推断、归纳、判断这一整体的分析系统,即是逻辑推理过程,最后获得若干个反应路线。人们可以根据自己的合成实践经验、方法的熟练程度、实验室或工业生产的合成条件、原料性质和原料的价格,通过人机对话,优选一条合成路线。

未来的计算机合成路线的发展,除了进一步对推理型的合成设计充实和完善外,还应当对包含化学反应动力学的分析,即对所设计的合成路线的每一步反应,提出最佳的反应条件,如:反应物的摩尔比、催化剂选择和用量、溶剂选择和用量、反应温度、反应压力、反应时间、隔氧隔湿建议、可能的副产物、产物提取方案和纯化方案等等,甚至还要提出注意事项特别是反应过程容易发生易燃易爆有毒等危险的注意事项。

计算化学应用前景

通过对具体的分子系统进行理论分析和计算,能比较准确地回答有关稳定性、反应机理等化学问题。目前计算化学已被广泛用于化学合成、材料、催化和生物化学等研究领域。

计算化学在生物化学方面的应用,有金海晓等 [38] 采用计算化学方法探明蛋白激酶在水溶液中的动态行为,包括磷酸化对蛋白激酶构象的影响、磷酰基转移机理以及蛋白激酶与抑制剂的作用模式等,这些工作为合理设计药物提供了参考。

此外,曹冉等 [39] 对计算化学方法在基于受体结构的药物分子设计中的多种应用,包括小分子结合位点的成药性评估、化合物数据库的虚拟筛选、先导化合物的结构优化等进行了探讨。

计算化学在化学合成上多用于化合物的理论计算结果与其实验结果的对比。如邢波等 [40] 用GaussView软件模拟苯的分子结构,用量子化学计算软件Gaussian 03W的密度泛函法,在B3LYP/6-31G基组水平上,优化苯分子结构、计算能量和频率,及其红外光谱,并与实验结果对比。

根据成键轨道(natural bond orbital BO)和电子密度计算结果,探讨苯的稳定性,分子轨道能量,原子静电荷分布规律和前沿分子轨道组成的特征,计算得出HOMO和LUMO的能量差是0.25191 eV,HOMO是比较大的负值(−0.24819 eV),说明苯有较好的稳定性,看来采用纳米TiO2光催化方法降解苯是可行的。邢波等还 [41] 通过应用计算化学软件Gaussian 03WHF方法中的3—21G基组优化苯和甲苯分子结构,预测苯和甲苯分子的红外光谱。找到苯环振动吸收峰分别是苯红外图中的1658 cm。

与甲苯红外图中的1667 cm~。与苯和甲苯文献检索红外谱图相对应(特征吸收峰分别是1478和1485 cm−1),符合较好。还找到苯环C-H拉伸振动吸收峰3080 cm−1 (苯)和3040 cm−1 (甲苯)。此外,还有对多种类似化合物进行化学计算进行对比,如盛旭玲 [42] 采用Materials Studio软件中的DMol^3模块,对18种苯的二取代在药物研发过程中手性化合物绝对构型的确定是一个极其重要的问题,药物分子的立体构型与药物的疗效、毒性密切相关,因此,药物分子立体结构的研究具有重要意义。

目前,手性化合物立体结构的研究方法也倍受关注,运用计算化学方法确定手性化合物的立体构型是一种简便而有效的方法,已经被越来越多的研究者接受并采用。王重娟等 [43] 利用计算化学方法,对旋光计算、电子圆二色谱(ECD)计算、振动圆二色谱(VCD)计算,以及13C-核磁共振(13C-NMR)计算等方法进行综述。为了在化学领域中更好地应用微波能,需要深入研究微波与化学反应相互作用的机理,由于等效介电系数常常被用来描述在化学反应中微波的吸收和传输情况,因而,化学反应中反应物的等效介电系数就成为微波化学研究的关键问题之一。

华伟等 [44] 基于反应溶液中单位体积内的分子个数随温度变化的情况对黄卡玛提出的经验公式进行了改进。以碘化钾和高锰酸钾两个氧化还原反应为例,对实验结果和计算结果进行了分析比较,结果表明其具有很好的一致性,而且计算精度较改进前的公式得到了改善。

计算化学在对天然产物绝对构型的确定上也有重要应用。由于传统方法在天然产物绝对构型确定方面存在一定局限性和不足,而大部分工作交由计算机完成的计算化学方法,在保持同样高精确度的基础上,可以节约大量时间。李桢等 [45] 文章中有多个应用两种或多种计算光谱法相结合在天然产物绝对构型确证的实例,表明计算化学方法在天然产物研究中已经逐渐被认可。

目前计算化学的研究已经取得了很大的成果,其对化学学科的发展影响是巨大的。随着化学理论的不断发展,以及计算机性能的迅猛发展,计算化学通过对涵盖若干公理的一个系统方程的求解,解决化学的问题。它不依赖传统化学实验仪器设备、试剂和药品,是建立在理论的演绎思维的基础上的电脑模拟。计算化学的第一原理是具有公理结构的,经过数学和逻辑演绎而得到关于物质的形式理论体系,再从形式理论出发利用物理假设出发,利用物理模型近似,二次形式化和计算,得到理论预计值,最后在再去与实验结果核对。因此,以量子力学,统计力学为核心的计算化学在理论化学与实验化学之间起到了很大作用。

虚拟现实

计算化学是理论化学的执行者,而根据现实的化学实验环境编制的仿真性软件在计算机中营造一个接近真实环境的虚拟场景来完成各种预定的实验任务,可以验证理论模型,同时可以帮助科研人员理解、预测和发现新的化学现象和物理本质。这就是计算机虚拟化学实验室。这里包含着量子化学计算和分子模拟技术,对化学和生命科学领域的某些未知或未定问题进行科学模拟,它是在在特定数值模型的基础之上,对现实中的化学反应过程、物理化学过程、生命过程、化学工程的生产流程等实现仿真模拟。

各种材料都有其特性在,掌握原子结构、排列及其运动规律,对理解材料的变形与破坏的机理是至关重要。但由于原子尺度原因,人们目前尚无法直接进行观察。因此,对材料的多尺度进行数值模拟和仿真模拟都十分必要。

一种叫做“触觉量子化学”,它是通过一个量子力学的计算模型程序结合到计算机感应装置来反馈用户的触觉动作的虚拟仿真。例如,你手中握着一个笔式的触觉设备。

当你把一个分子移向另一个分子的时候,该设备将会把你的移动反馈给计算机,此时计算机立即计算出分子之间的吸引力或排斥力。这有点类似于人们在网络上打台球时用鼠标给台球施加力(长按给力健)台球的运动速度就加快感觉。于是,人们具有能够操纵系统原子核坐标的势能面的曲率的触觉感,让你以一个非常直观的方式觉察到分子的复杂信息:分子结构、原子能量梯度、原子轨道、电子密度等等其它性质。这种力的计算也将会让你感觉到一个优先的反应路径应该是什么,那么你就会考虑应该怎样做。这显然是一个令人兴奋的设想。因为,触觉量子化学方法能够把人们引进了更深层次科学问题的理解。目前已经有一些这样可用的方法,但他们只用经典力场来计算由设备表现的力,无法实现化学反应过程的模拟。

由于化学反应存在原子键的形成和断裂问题,只有采用精确的量子力学计算才能实现这一过程。然而量子力学计算量大,十分耗时,以目前的技术水平难以实现真正的“触觉量子化学”。于是,一种新的量子化学计算方法浮出水面,叫做“实时量子化学”。

为了实现对研究对象进行既快速又高精确性的计算,“实时量子化学”应运而生。其是通过鼠标、键盘或专用输入工具来驱动所研究体系中分子结构的操作,计算机将根据量子力学的波函数和相应能量及其梯度的活性分子体系的快速计算,其计算结果获得实时响应,操作者感觉到没有延迟的数据流。

“实时量子化学”实现实时响应,需要两个方面条件:其一是硬件条件,需要多核并联的中央处理器(CPU)和专用的图形处理器(GPU),来保证显示刷新间隔在100毫秒之内的速度;其二是波函数求解算法的优化,尤其是在密度泛函理论框架内自洽场(SCF)迭代快速收敛方法,同时需要选择合适的基组来加快计算速度的办法。最理想的是量子计算机的应用,可以真正满足“实时量子化学”的快速计算要求,从而实现“触觉量子化学”的化学反应过程的实时模拟和动态仿真。

实时量子化学,可能改变未来如何进行量子化学的研究方式。触觉量子化学,是人类更直观地对现有的科学数据的触觉感开发迈开的第一步,通过应用技术的更深嵌入,已经在虚拟现实领域朝发展这个终极目标方向进发。

在过去的50年里,计算化学的发展如火如荼,已将化学带入一个新时代,计算化学促进了现代化学研究领域的一场革命性的变化。当前,计算化学已经深入到化学研究领域的方方面面,正在或者将要起到“领军”作用。下一步,计算化学将面临更复杂更新的挑战。

目前薛定谔方程的求解,都是基于电子结构理论并应用各种简化算法方案进行求解。而含时的薛定谔方程的求解、相对论的薛定谔方程求解等工作正在展开,并开始在各方面应用。在过去的二十年中,量子化学的另一个分支:基于原子核运动理论的薛定谔方程,已经获得不含时的变分法解决方案,并快速的发展,多原子体系的核运动的薛定谔方程如同电子运动的势能面(PES)一样的“精确”。它宣告,我们现在已经处在量子化学的第四阶段。

第一到第三阶段主要是以电子结构技术为主体的发展阶段,而第四个阶段,则是以原子核运动为主体的发展阶段。在这个阶段中,我们以一个准确的方式将其纳入到量子化学来处理原子核运动。基于电子运动和基于原子核运动的量子化学联合求解方法,将会获得更多的分子结构和分子运动信息,也必将在各个应用领域获得突破性发展。

量子计算机的诞生,必将大大缩短了计算成本,从而使从头计算的范围大幅度的增加:从几百个原子的微观体系扩大到上万个原子聚合体计算,宏观体系的量子化学计算将成为可能。这意味着对蛋白质、核酸等大分子的生命载体和遗传信息载体的空间结构研究,将会有突破性进展。

随着后基因组时代的到来,人们开始把研究的重点转向了功能基因组,即从基因、蛋白质中研究生命的本质,理解结构与功能、发育与疾病的关系。随着计算机技术速度的大幅度提高,特别是量子计算机将要问世,“从头预测(Ab initio)”方法将可能成为蛋白质空间结构的主要预测方法。因为它不依赖于已有的结构数据信息,直接从蛋白质序列利用分子动力学原理预测和推断结构信息。从而可以揭示蛋白质的结构与功能的关系、总结蛋白质结构的构成规律、预测蛋白质肽链折叠和蛋白质的结构等。

同时,从头预测方法与蛋白质的比较建模(Comparafire mode)、折叠识别(Fold recognition)、网络模型和基于隐马尔可夫模型的机器学习方法等同源模建方法相比,延伸到了生命现象的核心。从蛋白质序列和三维结构中预测其功能信息,是后基因时代的一个重要课题。但目前尚需要解决的是:蛋白-蛋白相互作用;肽和肽模拟物;分子多样性和药理空间;分子药效学(意义、潜力和挑战);早期阶段的临床疗效和安全性等。

21世纪的化学不仅要面对简单体系,还要面对包括生命体系在内的复杂系统。因此,除了研究分子的成键和断键,即研究离子键和共价键那样的强作用力之外,还必须考虑复杂体系中的弱相互作用力,如氢键、范德华力等等,而目前的密度泛函理论尚不能解决这一问题,需要进一步发展。虽然氢键、范德华力等作用力较弱,但由此却组装成分子聚集体和分子互补体系。这种超分子体系常常具有全新的性能,或者可使通常无法进行的反应得以进行。基于分子识别观点进行设计、合成及组建新的、有各种功能的分子、超分子及纳米材料,将是未来一段时间中化学的重要研究内容。

而深入研究控制分子的各种作用力,研究它们的本质并深刻了解分子识别,是一个颇具重大意义也是一个充满挑战的课题。

生物大分子体系的量子化学计算一直是一个具有挑战性的研究领域,尤其对生物大分子体系的理论研究具有重要意义。由于量子化学可以在分子、原子、电子水平上对体系进行精细的理论研究,是其它理论研究方法所难以替代的。因此要深入理解有关酶的催化作用、基因的复制与突变、药物与受体之间的识别与结合过程及作用方式等,都很有必要运用量子化学的方法对这些生物大分子体系进行研究。

毫无疑问,这种研究可以帮助人们有目的地调控酶的催化作用,甚至可以有目的地修饰酶的结构、设计并合成人工酶;可以揭示遗传与变异的奥秘,进而调控基因的复制与突变,使之造福于人类;可以根据药物与受体的结合过程和作用特点设计高效低毒的新药等等,可见运用量子化学的手段来研究生命现象是十分有意义的。

化学键究竟是如何断裂和重组的? 分子是怎样吸收能量的?并是怎样在分子内激发化学键达到特定的反应状态的?复杂体系的化学动力学、非稳态粒子的动力学、超快的物化过程的实时探测和调控以及极端条件下的物理化学过程都已经成为重要的研究方向。向生命学习,研究生命过程中的各种化学反应和调控机制,正成为探索反应控制的重要途径,真正在分子水平上揭示化学反应的实质及规律将指日可待。

理论化学与功能基因组学的结合:将为预测和在分子水平上理解蛋白质的功能,奠定了坚实的基础。利用在蛋白质结构的特殊残基中的固有的,特殊的,化学的和静电的性质,进行催化或识别。这些不同寻常的性质可以通过计算获得,因为蛋白质的活性位点和结合位点可以通过三维结构精确预测。

目前,计算机的飞速发展,使计算化学在各行各业得到广泛的应用,逐渐与各相关学科形成了一些崭新的边缘或交叉学科,如微观反应动力学,量子催化、量子电化学和量子生物学等。与生命科学、材料科学的结合将会更加有力的推动分子生物学、药物设计、新材料的“分子设计”向纵深发展。同时,随着学科之间的交叉和相互渗透,也将启发我们参考、借鉴其它学科的研究方法,使其相互结合,扬长避短,走向一个新的高度。

总而言之,计算化学的目的在于理解、预言和发现新的化学现象及其物理本质。计算化学已经、正在引领未来的化学发展。因为,量子属于物理的、也属于化学的,属于量子世界的,也属于经典世界的。

猜您喜欢: