绿谷云计算(推出全生态蛋白计算设计平台)
绿谷云计算(推出全生态蛋白计算设计平台)为此,智峪生科选择在AlphaFold2的基础上进一步迭代升级——在保证预测精度的前提下,对各模块的计算效率进行了工业级别的提升改进并整合,实现蛋白质开发工作与合成生物的全流程自动化。据王晟透露,“面对一个长度为655的蛋白,AlphaFold模型需要耗时11个小时才能完成预测。现在ZCloud平台下的fastAF2模型仅需6分钟就能将目标蛋白筛选出来,加速了110倍。”2020年,由DeepMind研发的AlphaFold2横空出世,在多数蛋白质单体结构预测中首次达到与实验误差接近的准确性,极大影响了蛋白结构预测以及相关领域。但由于AlphaFold2并未公布训练代码,且代码基于JAX框架与TPU硬件实现,高度依赖Google内部生态系统,因而对于绝大多数生物科技企业及研究者而言,AlphaFold2在使用上具有较大的限制。另一方面,AlphaFold2庞大复杂的模型,致使其数据处理与训
9月21日,上海智峪生物科技有限公司(简称“智峪生科”)宣布,公司正式推出高通量、高精度、全生态、全流程生物计算平台“峪云ZCloud”,以解决大分子结构计算、分子结构模拟、药物设计、酶工程、大分子设计(包括蛋白、核酸、以及其复合物)等领域内计算问题。
智峪生科成立于2021年,定位于AI 蛋白质结构计算与设计平台型企业,主要服务于新药研发、合成生物,目标是实现蛋白质预测、设计、生产的自动化:从蛋白质序列的设计,到DNA合成的自动化,氨基酸序列的表达,蛋白质的合成、纯化及功能的验证。
据智峪生科王晟博士介绍,“公司致力于为客户在复杂、有挑战性的药物研发项目上提供低成本、高效率的一站式解决方案,即基于AI的高精度计算服务不止能辅助新药分子发现,还能部分代替临床前试验,让AI真正从研究实验走向工业化应用与生产。”据了解,王晟曾数次在国际蛋白质结构预测的顶级赛事CASP上获得突出成绩,曾为腾讯AI Lab前高级研究专家。
此前智峪生科已推出了包括FastAF2、PointSite、Docking、Virtual screening等在内的多个服务模块,累计服务了超过50多家生物科技企业及学术机构。此次峪云ZCloud的推出则是将公司积累的各类服务模块进行了一站式生态整合,以实现计算精度和速度工业数量级的跨越。
企业供图
王晟介绍到,“目前,中外在AI辅助制药领域基本处于同一起跑线,智峪生科希望将ZCloud打造成为生命科技的‘EDA(集成电路设计软件)’,自主研发核心技术,让当前半导体领域面临的‘卡脖子’风险不在生命科技领域重现。”
根据Anfinsen法则,蛋白质的氨基酸序列决定其三维结构,同时三维结构又是蛋白质行使其生物学功能的基础,直接关系到人类对疾病成因及治疗手段的探索。但由于蛋白质的多级结构和复杂的相互作用,使得精确预测三维结构充满挑战。
2020年,由DeepMind研发的AlphaFold2横空出世,在多数蛋白质单体结构预测中首次达到与实验误差接近的准确性,极大影响了蛋白结构预测以及相关领域。但由于AlphaFold2并未公布训练代码,且代码基于JAX框架与TPU硬件实现,高度依赖Google内部生态系统,因而对于绝大多数生物科技企业及研究者而言,AlphaFold2在使用上具有较大的限制。另一方面,AlphaFold2庞大复杂的模型,致使其数据处理与训练代价高昂,对大多数研究者来说较难承受。
为此,智峪生科选择在AlphaFold2的基础上进一步迭代升级——在保证预测精度的前提下,对各模块的计算效率进行了工业级别的提升改进并整合,实现蛋白质开发工作与合成生物的全流程自动化。据王晟透露,“面对一个长度为655的蛋白,AlphaFold模型需要耗时11个小时才能完成预测。现在ZCloud平台下的fastAF2模型仅需6分钟就能将目标蛋白筛选出来,加速了110倍。”
图片来源:智峪生科ZCloud平台 fastAF2在线预测
目前,除了蛋白质结构计算外,峪云ZCloud平台上还提供了多套生物计算领域前沿算法,譬如蛋白质结构建模fastAF2、蛋白质设计算法SWORD、绝对自由能计算(autoFEP)、口袋寻找(PointSite)、和分子对接和筛选(autoLigand)等,涵盖了大分子设计、分子模拟、自由能计算、药物分子发现、序列与结构检索等诸多领域,以满足药物研发或合成生物学元件设计过程中的序列优化、高通量结构预测、结合位点预测、虚拟筛选、自由能微扰等多种应用场景。
且据介绍,上述应用并非简单的堆砌,公司的目的还是在于要打通不同算法之间的使用壁垒,将各个子模块串联为一个完整的、彼此支撑的生态;而针对不同的问题,各个模块可以任意组合搭配,进而丰富可应用场景。
另外,峪云ZCloud平台还着重在操作使用层面进行了优化,提供简易操作的界面与可视化的视图工具,方便用户使用;此外,借助“私有云 公有云”的模式,峪云ZCloud平台还打造了从结构出发、高通量筛选再到先导物优化、分子评估推荐以及合成生物学相关模块的全产业链条服务。
峪云ZCloud应用效果及模块效果展示
在应用层面,王晟指出,目前在新药研发领域,峪云ZCloud已涵盖了药物研发的各个环节,可帮助生物医药企业“一键”完成新药研发前的蛋白质相关研究工作。“后续药企只用参照计算结果,即可顺畅完成药物发现的工作。”
至于在合成生物领域,根据其原理,合成生物学采月工程学“自下而上”的理念,即从系统表征自然界具有催化调控等功能的生物大分子,使其成为标准化“元件”,到创建“模块”、“线路”等全新生物部件与细胞“底盘”,构建有各类用途的人造生命系统。从基础来看,合成生物学需要设计和实现各类底层元件,比如催化元件、调控元件、感应元件和结构元件等。
为此,智峪生科除了在核心催化元件(例如酶)的设计与改造上取得突破外,ZCloud平台上的一系列算法已打通了单体核酸(如:RNA)以及蛋白-核酸复合物的结构计算,实现了调控元件的精准设计;基于RNA的调控元件许多重要功能特性,可在合成生物学领域进行广泛探索;此外,通过其标准化和自动化设计,能在一定程度实现合成生物学所许诺的“工程设计”理念。
而配合智峪生科自研的ZPod一体化“微型”数据中心使用,峪云ZCloud的性能还能有所提升。用户可通过采购多个 ZPod 来实现线性扩展以获取更强大的计算能力,而多个 ZPod 存储和计算算力的弹性扩容可确保用户“无感知”提速。据悉,ZPod是一个HPC 异构集群,它通过使用当前最新的CPU、GPU、网络和存储硬件,确保集群的聚合IO、计算、通讯以及线性扩展能力得到最大优化。
据悉,峪云ZCloud平台各模块已被广泛使用,上线12个月已经有50多家生物科技企业及学术机构通过峪云ZCloud模块完成了50多万个蛋白与核酸结构的预测,并挖掘出了之前未被发现的新酶,推动了诸如人体健康、猴痘候选疫苗、动物免疫、生物合成制品等现实世界问题研究。
公开资料也显示,基于蛋白质结构预测,上半年智峪生科就与引加生物合作主要聚焦在高端困难蛋白原料和辅助试剂的开发和生产、与维亚生物则在高通量辅助药物设计和新药分子发现方向展开合作。此前王晟也表示,希望通过与产业方和学术机构的各类合作,让“AI 分子设计”落地到实际项目中,譬如“研究某微生物重要靶点,治疗该微生物感染的潜在药物分子;为ADC药物寻找最合适的短肽linker;为药物研发平台进行机理解释和分子优化设计......”
按照智峪生科的设想,上游端,依靠蛋白质结构预测和设计能力,公司可以根据客户的需求解决成药过程中的痛点难题,也为公司自身合成生物学产品打好基础;下游端,公司掌握了包括放大、工艺研发、菌种设计、代谢工程在内的种种生产工艺,依照上游产出的预测及设计结果开启合成生物学领域布局,最终实现“一站式”服务。