洛阳吉恩特生物科技有限公司

新闻中心
联系我们
洛阳吉恩特生物科技有限公司

联 系 人:吉恩特客服
手  机:136-0866-9917(微信同号)
地  址:河南省洛阳市高新区火炬创业园

行业动态
当前位置:首页 | 新闻中心 > 行业动态

分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题

作者: 发布时间:2023-12-23 浏览次数:304
打印 收藏 关闭
字体【
视力保护色

蛋白质结构和功能的形成,很大程度上取决于侧链原子间的相互作用,因此,精准的蛋白质侧链预测(PSCP)是解决蛋白质结构预测和蛋白质设计难题的关键一环。但此前蛋白质结构预测大多聚焦于主链结构,侧链结构预测始终是一个未被完全解决的难题。

分子之心许锦波团队推出一种新的PSCP深度架构AttnPacker,在速度、内存效率和整体精度方面取得大幅提升,是目前已知的***优侧链结构预测算法,也是全球首创的可同时进行蛋白质侧链预测和序列设计的AI算法。

相关论文发表在了《美国国家科学院院刊》(PNAS)上,论文题为:An end-to-end deep learning method for protein side-chain packing and inverse folding。其预训练模型、源代码和推理脚本都已在Github上开源。

image.png

背景

蛋白质由数个氨基酸折叠而成,其结构分为主链和侧链。侧链的差异性对蛋白质的结构与功能有巨大影响,尤其是生物活性。基于对侧链结构的清晰认知,科学家们能够更精准地测定蛋白质三维结构,解析蛋白质-蛋白质之间的相互作用,并进行理性蛋白设计。应用到药物设计领域,科学家们便能更快、更准确地找到适合药物与受体的结合点位,甚至根据需要优化或设计结合点位;在酶优化领域,科学家们可以通过对序列的优化改造,让多个侧链参与催化反应,实现更***、特异性更高的催化效果。

当前大多数蛋白质结构预测算法主要针对主链的结构解析,但蛋白质侧链结构预测还是一个未被完全突破的难题。无论是AlphaFold2等热门蛋白质结构预测算法,还是DLPacker、RosettaPacker等专注侧链结构预测的算法,准确度或速度都不尽如人意。这也为蛋白质设计带来了***。

传统方法,如RosettaPacker,主要使用能量优化方法,先对侧链原子的分布进行分组,再针对某个特定氨基酸来搜索侧链的分组,寻找能量***小的组合。这些方法主要区别于研究者对旋转异构体文库、能量函数和能量***小化程序的选择,准确性受限于对搜索启发式方法和离散抽样程序的使用。业界也有基于深度学习的侧链预测方法,如DLPacker,它将PSCP表述为图像到图像的转换问题,并采用了U-net模型结构。但预测精度和速度依然不够理想。

方法

AttnPacker是一种端到端的预测蛋白质侧链坐标的深度学习方法。它联合模拟了侧链相互作用,直接预测的侧链结构在物理上更可行,具有更少的原子碰撞和更理想的键长和角度。

具体而言,AttnPacker引入了一种利用PSCP的几何和关系方面的深度图转换器架构。受AlphaFold2启发,分子之心提出了位置感知三角形更新,以使用基于图形的框架来计算三角形注意力和乘法更新,从而优化成对特征。

通过这种方法,AttnPacker的内存显著减少并拥有更高容量的模型。此外,分子之心探索了几种SE(3)等变注意力机制,并提出了一种用于从3D点学习的等变变换器架构。

image.png

图注:AttnPacker运行流程。以蛋白质主链坐标和序列作为输入,并基于坐标信息导出空间特征图和等变基。特征图由不变量graph-transformer模块处理,然后传递给一个等变的TFN-Transformer输出预测的侧链坐标、每个残基的置信度分数和可选的设计序列。预测坐标经过后处理,以去除所有空间冲突,并确保理想化的几何结构。

效果

在预测效果上,AttnPacker对天然和非天然主链结构都显示出准确性和效率上的改进。同时保证了物理上的可行性,与理想键长和角度的偏差可以忽略不计,且产生了***小的原子空间位阻。

分子之心在CASP13和 CASP14天然和非天然蛋白质主链数据集上对AttnPacker与目前***先进的方法——SCWRL4、FASPR、RosettaPacker和DLPacker进行对比测试。结果显示,AttnPacker在CASP13和CASP14天然主链上显著优于传统蛋白质侧链预测方法,平均重建RMSD比每个测试集上的次优方法低18%以上。AttnPacker还超越了深度学习方法DLPacker,平均RMSD降低了11%以上,同时也显著提高了侧链二面角精度。除了准确性,AttnPacker的原子碰撞明显少于其他方法。

DNA提取是分析农作物分子生物学性状的重要步骤,现阶段,常用的DNA提取技术有磁珠法和离心柱法,使用磁珠进行农作物的DNA提取,可以实现高通量、自动化的操作。由于磁珠对核酸的吸附灵敏度高,只需要少量的叶片或其他组织即可得到高得率、高纯度的DNA。吉恩特生物采用自主研发生产的纳米生物磁珠和磁珠法DNA提取试剂盒,可以从各种类型的农作物中提取高质量的核酸,配合核酸提取仪,可以达到快速自动化提取的目的。

洛阳吉恩特生物科技有限公司
联系人:吉恩特客服
手机:136-0866-9917(微信同号)
地址:河南省洛阳市高新区火炬创业园

版权所有:洛阳吉恩特生物科技有限公司 备案号:豫ICP备15029662号-1 流量统计:
logo 0379-6023 0863