有机合成膦配体汇总(交叉偶联催化中膦配位态和反应活性的单变量分类)
有机合成膦配体汇总(交叉偶联催化中膦配位态和反应活性的单变量分类)Doyle课题组最初的研究包括19个膦,作者补充了15个额外的配体,以覆盖整个%Vbur值 (反应I,图2A)。作者还利用高通量实验收集了Ni催化Csp2-Csp2 Suzuki-Miyaura偶联(SMC)与芳基氯化物反应的数据。配体集合由Doyle和Merck Sharp & Dohme联合库组装,包括90个单齿膦,这些膦包含在kraken虚拟库中,应用k均值聚类,使广泛覆盖膦化学空间的结构选择成为可能。对这些配体进行了四次交叉偶联反应,其中芳卤和芳基硼酸发生了改变(反应II到V,图2A)。偶联伙伴包括一系列电子和空间特征,可以影响催化循环的基本步骤的不同方面。值得注意的是,在这些反应中,DinoPhos配体的产量都是最高的,还有DrewPhos,一种三芳基膦配体,在芳烃的远端3 5位置拥有叔丁基基团,类似于DinoPhos配体。图1过渡金属催化交叉偶联是识别反应性悬崖的一个相关案例研
交叉偶联催化中膦配位态和反应活性的单变量分类
文章出处:Samuel H. Newman-Stonebraker Sleight R. Smith Julia E. Borowski Ellyn Peters Tobias Gensch Heather C. Johnson Matthew S. Sigman Abigail G. Doyle. Univariate classification of phosphine ligation state and reactivity in cross-coupling catalysis. Science 2021 374 301-308.
摘要:化学家经常使用分子描述符对反应数据进行统计分析,以确定结构-反应关系,从而实现预测和机制理解。在本研究中,作者开发了一个广泛适用和定量的分类流程,使用单齿膦配体在11个Ni和Pd催化的交叉偶联数据中集中识别反应性悬崖。发现了一个独特的配体空间描述符,即最小掩埋体积百分比[%Vbur(min)],将这些数据集以相似的阈值划分为活性和非活性区域。有机金属研究表明,这一阈值对应双杂化与单杂化金属的二元结果,%Vbur(min)是催化中配体结构的物理意义和预测性表征。
化学家通常使用数据驱动模型来理解化学结构和反应性之间的许多复杂关系。对于许多反应来说,描述符(一种描述亚单位或分子整体的数学方法)和化学反应活性之间可以观察到连续的依赖关系,这是由线性自由能关系所捕捉到的。然而,有些过程表现出反应悬崖,其中必须满足给定描述或反应发生的标准或阈值(即二元响应)。识别与反应悬崖有机制联系的分子特征,可以根据结构对分子进行分类,预测未见例子的反应结果,并揭示关键的机制洞察力。
过渡金属催化交叉偶联是识别反应性悬崖的一个相关案例研究。这类反应在合成药物和材料方面有着广泛的应用,因此在合成方面具有重要的意义。此外,这些反应的成功高度依赖于辅助配体,单齿膦是最常用的配体(图1A)。鉴于存在成千上万个独特的结构例子,化学家已经开发了许多工具来定量描述单齿膦的不同的空间和电子性质。这些描述符——包括Tolman锥角、立体角、Sterimol和埋藏体积百分比(%Vbur) (图1B)——已被用于关联交叉耦合数据集中的结构-反应性趋势。然而,在某些情况下,表面上相似的配体会产生本质上不同的反应,这表明配体反应存在不连续性。
考虑到这一点,作者假设这些不连续面是反应性悬崖的证据,并与尚未确定的磷化氢结构特征有关。这种描述符的识别将不仅允许发展一种统计手段来分类活性和非活性配体,而且还提供了一个定量工具,以机制合理化配体性能。在这里,作者提供了实现这些目标的工作流和分析。利用Gensch等人(kraken)最近开发的有机磷(III)描述符库,对于数千个单齿膦,每个都有近200个具有构象代表性的描述符(图1C),作者能够根据金属优先配位到一个或两个膦(即催化剂配位态),将11个Ni和Pd催化的交叉偶联数据集划分为活性和非活性区域。光谱和晶体学有机金属研究表明,最小掩埋体积百分比[%Vbur(min)]是能够实现这一分类的单一描述符。尽管%Vbur描述了任何给定配体结构在金属中心3.5 Å范围内的空间体积,%Vbur(min),一个之前未被探索的描述符变体,量化了所有配体能量可达构象中最小的%Vbur。最终,该分析揭示了无机金属化学的非直观趋势,因此可以成为理解和预测交叉偶联催化中单齿膦的结构-反应性关系和催化剂配位状态的重要机制工具(图1D)。
作者最初研究配体反应性的平台是受到Doyle课题组最近的一项研究的启发,该研究确定了一类新的单齿膦配体——DinoPhos配体[TriceraPhos和TyrannoPhos(图1A)]——对于Ni催化的醛和芳基硼氧化合物的交叉偶联非常有效。DinoPhos配体与那些在反应中不太成功的配体的区别在于其高水平的远程空间体,通过大锥角和小的%Vbur值进行量化。DinoPhos配体的大锥角表明,它们的行为可能类似于在Pd催化的交叉偶联反应中形成的体积大的磷化氢[例如,P(t-Bu)3或CyJohnPhos (t-Bu = 叔丁基;Cy = 环己基),图1A],其中优先形成单配(表示为L1)Pd配合物已被证明是反应成功的关键。然而,小的%Vbur值将这些配体描述为类似于更小的结构[例如PPh3 (Ph = 苯基),图1A]倾向于形成双锯齿(表示为L2)配合物。观察到这种独特的空间构型是Ni催化反应成功的必要条件,提出了它对催化剂配位状态和催化活性的影响,促使作者将Ni催化交叉偶联反应作为一个案例研究来鉴定配体的反应性悬崖。
图1
Doyle课题组最初的研究包括19个膦,作者补充了15个额外的配体,以覆盖整个%Vbur值 (反应I,图2A)。作者还利用高通量实验收集了Ni催化Csp2-Csp2 Suzuki-Miyaura偶联(SMC)与芳基氯化物反应的数据。配体集合由Doyle和Merck Sharp & Dohme联合库组装,包括90个单齿膦,这些膦包含在kraken虚拟库中,应用k均值聚类,使广泛覆盖膦化学空间的结构选择成为可能。对这些配体进行了四次交叉偶联反应,其中芳卤和芳基硼酸发生了改变(反应II到V,图2A)。偶联伙伴包括一系列电子和空间特征,可以影响催化循环的基本步骤的不同方面。值得注意的是,在这些反应中,DinoPhos配体的产量都是最高的,还有DrewPhos,一种三芳基膦配体,在芳烃的远端3 5位置拥有叔丁基基团,类似于DinoPhos配体。
利用这些数据,作者试图确定kraken空间描述符与反应性能的关系。对于每个反应,产率是根据库中的代表性描述符进行评估的;三个例子如图2所示,锥角,Boltzmann平均配体构象的%Vbur值 [%Vbur (Boltz)],及最小掩埋体积百分比[%Vbur(min)]。虽然锥角描述符没有提供明确的反应性截止值,但%Vbur (Boltz)和%Vbur(min)都允许将配体性能分为“活性”和“非活性”两类(分类工具的细节将在下面描述,以便定量界定阈值),尽管前者也有一些例外情况。%Vbur(min)描述符在反应性上有明显的截断,其中几乎所有超过32%的配体都是不反应的。低于32%的%Vbur(min)值的未能提升反应活性的配体被归到自己的区域中,其中电子特征和催化剂中毒功能(如氰基、羰基和卤化物基团)似乎是其无活性的主要原因。使用%Vbur(min),而不是%Vbur (Boltz),允许各种高度柔性的骨架,如P(i-Bu)3,PBn3和小的(二烷基)邻联芳基(Buchwald型)膦,被成功地分类 (i-Bu = 异丁基,Bn = 苄基)。因此,这个空间描述符最好地将磷化氢分为活性和非活性区域,在所有研究的反应中,反应活性阈值约为32%的%Vbur(min)值。
在这些数据中存在相对于%Vbur(min)的反应性悬崖,这促使作者研究这一描述符重要性的机制基础。鉴于配位态在交叉偶联催化中的重要性,作者质疑这个描述符是否能预测形成L2M与L1M配合物(M = 金属)的偏好。从历史上看,大型配体的发展,即通过锥角描述符直观地捕捉到,是有利于L1M的既定原则,从而促进Pd催化反应的活性。虽然TriceraPhos和TyrannoPhos的锥角值都高于许多已知的膦并形成L1物种,%Vbur(min)将它们的反应性与形成L2Ni和Pd配合物进行了分类。因此,对观察到的反应性悬崖的这种解释表明,无论磷化氢的总体大小如何,金属第一配位球内的空间体主要决定配位态结果。
图2
为了验证这一假设,作者考察了Ni催化SMC反应中使用的配体的一个子集(28个膦),以确定配位态的光谱。以LnNi(4-氟苯甲醛)为平台,因为它的三个核磁共振(NMR)数据(1H、19F和31P)提供了在Ni(COD)2 (COD = 1 5-环辛二烯)与醛和两个等价物的膦反应时金属中心的原位配位状态的结果(反应VI,图3A)。根据观察到的光谱,每种配体都可形成L2Ni或L1Ni配合物。这些实验的结果将根据库中的空间位格特征进行评估,以确定哪些配体属于类似配位态的区域(图3B)。从交叉偶联反应的产率来看,锥角并不能分割配体。的确,DinoPhos配体和DrewPhos都能单独形成L2Ni配合物,尽管它们的锥角值在配体中是最大的。%Vbur (Boltz)描述符正确地将Dinophos型配体与其它L2型Ni形成膦分组;然而,一些柔性配体[MeJohnPhos,P(i-Bu)3和PBn3;Me = 甲基]与L1型Ni形成的配体仍存在错误分类。与催化反应类似,%Vbur(min)解决了这些异常值,导致L2Ni和L1Ni体系之间的急剧截止率低于32%。这个值与在反应I到V中观察到的反应阈值非常吻合。
图3
鉴于这一发现,作者假设自己可以预测新的配体的配位状态,从而实现对结构的预筛选,这可能是具有挑战性的合成。为了验证这一点,作者构想了一种新的DinoPhos配体,PteroPhos,它拥有两个芳香基团,在3 5位置上有2 4 6-三异丙基苯基(TRIP)取代基(图4A)。其计算锥角为235°,是所研究的单齿膦中最大的。尽管确定的锥角值表明该配体的尺寸巨大,但其相对较低的%Vbur(min)值仅为27.2%,表明PteroPhos应形成L2Ni配合物,并在Ni催化的SMCs中有效。事实上,在制备该配体时,作者发现它形成了一个L2Ni(4-氟苯甲醛)配合物(图3B),并且在Ni催化的反应I到V中具有中等活性,这与%Vbur(min)分类分析相一致。
然后,作者试图通过晶体学和计算研究(配合物1到4,图4A),首先解释为什么锥角不能预测配位状态。虽然作者对含DinoPhos配体的L2Ni(苯甲醛)配合物的结晶尝试没有成功,但作者能够获得具有X射线衍射质量的(DrewPhos) 2Ni(2-萘醛)晶体(配合物3,图4A)。在固体状态下,两个膦在配合物上以116o的顺式排列,由于DrewPhos具有207o的锥角,如果用锥角来描述磷化氢的大小,则表明两个固体之间存在90o的重叠,从而产生相当大的空间斥力或扭曲。与(PPh3)2Ni(2-萘醛) (配合物1,图4A)相比较,尽管DrewPhos的锥角比PPh3大48o,但两种配合物的Ni-P键长和P-Ni-P“咬入角”非常相似。锥角没有捕捉到的是远端金属配体结构的不均匀拓扑结构。这些密度较低、构象较灵活的区域可以在“锥”内以容纳第二配体和/或底物的方式排列,这一公认的限制导致了替代空间描述符的发展。在此基础上,锥角无法对所研究的磷化氢的配位状态和反应性进行分类。与L1[P(t-Bu)3]Ni(苯甲醛) (配合物2,图4A)相比较,密度泛函理论(DFT)优化的(PteroPhos)2Ni(苯甲醛)结构(配合物2,图4A)提供了L2配位的最显著的例子,该配位对大量的远端空间体是不可知的。
虽然本案例研究强调了配位状态对第一个配位球空间体的依赖,这是由%Vbur描述符捕获的,但图4A中研究的配体在它们的%Vbur(min)和%Vbur (Boltz)值之间有很小的变化。为了更好地理解%Vbur(min)在催化分类(图2B)和配位状态实验(图3B)中的结构重要性,作者研究了%Vbur(min)和%Vbur (Boltz)值差异最大的L2Ni-形成的配体P(i-Bu)3。对于该磷化氢,其最低能构象的%Vbur值和所有构象的Boltzmann加权平均值(分别为38.7%和39.5%)均显著高于其他L2Ni-形成的配体,甚至高于L1Ni-形成的配体P(t-Bu)3的%Vbur (Boltz)值(36.3%)。[P(i-Bu)3]2Ni(2-萘醛) (配合物5,图4B)证实了两个磷化氢与Ni结合,%Vbur值分别为29.0%和32.2%,与%Vbur(min)的值(31.1%)接近。该分析强调,当两个当量结合到金属中心时,%Vbur(min)是一个更好的磷化氢表征。这表明,在埋藏体积小于约32%的构象条件下,第二磷化氢与金属配合的能量效益大于该磷化氢的能量成本。
最后,考虑到强烈的催化和配位态反应悬崖,作者假设有一个强烈的依赖于L2Ni(苯甲醛)配合物与%Vbur(min)的磷化氢解离热力学。在图3中研究的28个磷化氢中,只有一个[Cy2P(t-Bu)]在L2Ni和L1Ni (L2: L1为1: 4)之间存在光谱可见的平衡,在配位状态截止附近的%Vbur(min)值为32.0%。以Cy2P(t-Bu)为参考,用DFT计算了20 L2Ni(苯甲醛)配合物的配体解离自由能(ΔGdissoc) (图4C),在本研究中没有发现ΔGdissoc依赖于电子形态。32%的%Vbur(min)将正和负ΔGdissoc区域清晰地分开,而DinoPhos配体和DrewPhos的遥远空间体积对离解能的影响很小。此外,当磷化氢的%Vbur(min)接近32%时,ΔGdissoc值急剧下降,对应于计算出的L2配合物的Ni-P键长大幅上升,这反映了在这个值填充Ni的第一个配位球所引起的空间位压增加。总之,这些研究证明了%Vbur(min)描述符和实验观察到的32%阈值的物理意义。
图4
通过在Ni SMC数据集中识别尖锐的反应性悬崖,作者试图将分析形式化,以帮助在不同的反应数据集中自动发现阈值和随后的配体分类。虽然%Vbur(min)是Ni催化交叉偶联反应中最成功的配体分类描述符,但工作流程设计使用了所有可用的描述符,实现如下:用户首先定义一个“成功”反应(无论是在“无配体”控制反应或单个催化剂的转化率之上)的百分率或选择性,然后数据被一个单节点决策树算法解析,该算法配有任何提供给它的描述符集。然后,该算法确定每个描述符的阈值(如果存在)的位置,以及评估二进制分类质量的统计措施。这种分析的结果是将数据集分解成一个混淆矩阵的四个象限:(i) 符合阈值配位状态标准的活性配体(真阳性),(ii) 不符合标准的非活性配体(真阴性),(iii) 不符合标准的活性配体(假阴性),以及(iv) 符合标准但因其它原因失败的非活性配体(假阳性)。这些分组可以使用统计模型进行进一步分析,或者作为机制评审的目标
将这个工作流应用到Ni数据集,作者能够评估该算法的计算识别和量化这些反应最初观察到的阈值的能力。在分类中,大多数假阳性的配体要么是电子缺失的,要么是含有催化中毒功能,因此不是由于配位状态而失败。例如,发现P(4-CF3Ph)3能形成L2Ni(4-氟苯甲醛)配合物,但在所有的催化反应中均无活性。
考虑到Ni催化交叉偶联反应分类工具的成功,作者试图确定是否%Vbur(min)也可以更广泛地用于识别反应性阈值。特别地,作者研究了多种Pd催化的交叉偶联反应,其中L1Pd与L2Pd的形成是决定反应结果的关键因素。在一个案例研究中,作者探索了Pd催化的芳基三氟酯SMC,其中L2Pd被认为是C-O键氧化加成的必要条件(反应VII,图5)。在Pd催化中对L2Pd的需求也为DinoPhos配体的首次测试提供了机会。作者使用56个膦生成了一个数据集,发现反应阈值为32.4% (反应VII,图5B)。反应性悬崖反映了Ni系在活性区和非活性区的截止值和方向性。此外,根据DrewPhos和CyTyrannoPhos的%Vbur(min)值低于阈值,它们都被正确地归类为活性配体,并分别与“未修饰”的PPh3和CyPPh2表现相似。光谱研究证实了这些结果,通过31P NMR检测了DrewPhos和Dinphos配体的L2Pd(dba),包括活性较低的CyTriceraPhos (dba = 二苄基丙酮)。反应VII分析的必要是对Buchwald型磷化氢分别进行划分和分类,而不论%Vbur(min)值的大小。这可能是由于它们能够占据两个配位位点的结果,这是这些配体的设计元素,允许它们通过稳定Pd-芳烃相互作用来模拟催化过程中的L2Pd物种。与之前Sigman实验室对三氟芳基SMCs化学选择性的研究一致,P(邻-甲苯)3在反应中是一个异常值,尽管在反应条件可能有利于L1Pd物种。
在接下来的一组案例研究中,作者用分类流程对涉及L1Pd物种的各种反应进行了评估。作者生成了两个Pd催化SMCs的数据集(反应VIII和IX,图5A)与芳基卤化物的反应,包括一个与空间阻碍偶联伙伴的反应,以及Buchwald-Hartwig胺化反应的数据集(反应X,图5)。对于两个SMCs,分类工具揭示了一个阈值约为29%的%Vbur(min),活性区域出现在该值以上,表明更大的配体[按%Vbur(min)定义]是有效催化所必需的(反应VIII和IX,图5B)。在比较反应VII和反应VIII时,观察到的阈值的相反方向与大量研究配位状态对三氟芳基与芳氯键激活的化学选择性影响的文献先例一致。也许最明显的例子是Buchwald-Hartwig胺化反应(反应X,图5B),产率高的反应与产率为0%且%Vbur(min)值在32%以下的反应之间有明显的反应性悬崖。从文献中提取的两个数据集也进行了评估:Biscoe、Sigman和合作者之前研究过Pd催化的立体定向SMC (反应XI,图5A)和Hartwig和合作者报道的Heck反应(反应XII,图5)。在这两种情况下,%Vbur(min)阈值都被观察到,这表明L1Pd物种负责催化(反应XI和XII,图5B)。
作者认识到,在某些情况下,配体的空间结构对反应结果的影响可能不是很大,因此不需要设定阈值。在作者的文献挖掘工作中,作者确定了两个没有发现膦空间阈值的数据集:由Dreher、Walsh和合作者报道的Pd催化的Csp3-H芳基化反应(反应XIII,图5)和由Zapf和Beller研究的Pd催化的Heck交叉偶联反应(反应XIV,图5)。对于这些例子,可能的解释包括高水平的无配体背景反应和/或催化循环对配位状态不太敏感,可能是由于催化活性Pd纳米粒子的产生。考虑到%Vbur(min)的物理意义,在数据集中快速识别这些场景的能力可以作为一种有价值的机制探究。
图5
图6总结了本文研究的每个数据集的阈值和方向性。通过对Ni和Pd催化反应的比较,揭示了Ni和Pd催化反应的一些有趣的机制特征,以及更普遍的膦空间效应。首先,Ni和Pd催化芳基卤化物SMC反应(反应II到V、VIII和IX)的阈值方向相反,表明两种金属对该反应的配位态要求不同。因此,分类工作流程提供了一种方法来比较Ni和Pd的头部,并阐明每个金属通常需要的正交配体设计原则。
其次,Ni和Pd数据集的阈值位置存在一定的变化。然而,对于所有测试的反应(除了反应X),可以观察到一个重叠区域,其中%Vbur(min)值介于29和32%之间的配体起作用,与阈值的方向无关。这可能意味着一个%Vbur(min)值区域,其中L2M在静息状态下具有热力学优势,但L1M也存在于溶液中;在此区域内,L2M和L1M之间的平衡会受到温度、溶剂和反应浓度的影响。众所周知,PCy3等膦的情况就是如此,ΔGdissoc值在29-32%之间的下降(图4C)证实了这一假设。即使在Ni催化的交叉偶联的数据中,最活跃的配体通常也在这些范围内(图2)。这一观察表明,L1中间体和/或过渡态可能与Ni催化有关,但达到L2静息态的能力是必要的,正如尖锐的反应性悬崖所证明的那样。
图6
作者开发了交叉偶联催化中单齿膦配位态和反应活性的二元分类策略。在寻找结构多样化的单齿膦的特征空间时,作者确定%Vbur(min)为基于催化剂配位状态的分岔数据集的描述符。作者设想,该工具将促进相关有机金属反应的机制研究,并通过预测活性和非活性以及单和双配位膦在合成前的反应发展。虽然作者认识到%Vbur(min)不能捕获所有膦的反应趋势,但在分析中识别异常值(特别是假阴性)的能力可以激发新的描述符和有针对性的机制研究的发展。综上所述,本研究强调了分类分析如何作为一个重要的机制和预测工具,以促进理解催化中的结构-反应性关系。