又一个卡脖子技能:中国的AlphaFold在哪儿?_卵白质_开源
·7月尾,DeepMind公司称,AlphaFold预测出了2亿多个蛋白质构造。
·“有人在说AlphaFold开源了,我们国家不用搞了,这是大错特错。第一,他们所谓的开源,只是表层构造开源了,底层技能没有开源……”复旦大学繁芜体系多尺度研究院院长马建鹏在受访中表示。
在马建鹏看来,AlphaFold是又一个卡脖子的核心技能。
险些预测了全体蛋白质宇宙
2022年7月28日,英国DeepMind公司表示,AlphaFold已经预测了环球险些所有的蛋白质构造,短短一年韶光,他们的蛋白质构造数据库中的数据从200万个扩增到超2亿个。
AlphaFold也是继AlphaGo(阿尔法狗)之后,DeepMind重磅打造的一款智能人工系统,紧张被用来预测蛋白质构造。那么,AlphaFold运行基本事理是若何的?
它利用了机器学习算法,配置了深度学习神经网络,并且接管了蛋白质三维构造数据库(PDB)以及其他数据库中数十万个实验确定的蛋白质构造和序列的演习。
经由演习后,AlphaFold在面对一个新的基因序列时,首先在数据库中探求干系基因序列,然后经由大量的打算和比对,对新基因序列对应的蛋白质3D构造进行预测,它的预测结果具有非常可不雅观的精确度。
回溯到一年前,2021年7月,也便是AlphaFold发布蛋白质数据库和开源代码初期,DeepMind就已经用AlphaFold预测了98.5%的人类蛋白质构造,干系结果揭橥在《自然》杂志上。
在很多专家看来,AlphaFold还只是对未来的“惊鸿一瞥”,它将生物学带入了一个数字时期,并且它将改变环球生物医学研究现状。
目前,DeepMind与被忽略疾病药物倡议(DNDI)互助,来推进他们的研究成果。同时,DeepMind还对被天下卫生组织(WHO)确定为高度优先研究的生物体进行了却构预测,帮助科学家进一步研究麻风病和血吸虫病等顽疾。
DeepMind创始人Demis Hassabis。 视觉中国 资料图
对此,DeepMind创始人兼首席实行官戴密斯·哈萨比斯(Demis Hassabis)发出感慨,“AlphaFold已经对我们一些最大的环球寻衅产生了令人难以置信的影响。我们希望这个扩展的数据库将帮助无数科学家完成他们的主要事情,并为科学创造开辟全新的路子。”
AlphaFold给环球生命科学领域学者的科研事情供应了便利,我国学者正在致力于探索“属于中国的AlphaFold”。但做得怎么样,有无自己的原创技能?
如何打造一款中国的AlphaFold?
海内对AlphaFold的关注,是最近两年的事。
2020年底,冰洲石生物科技(AccutarBio)宣告完成了近亿美元融资,致力于利用通过深度学习和物理建模的办法在海量数据上进行演习得到的打算模型来替代生物学和化学实验,以此来加速创新药的研发。
AccutarBio创始人范捷博士表示,他们的愿景是用AI全面提升创新药物研发的速率和效率,推出拥有环球专利的药物产品,致力于利用颠覆性技能的力量不断去改变药物创造行业。
致力于AI跨界领悟的团队并非个例。2021年12月,北京深势科技推出一款蛋白质构造预测工具Uni-Fold,并同时开源演习代码和推理代码,供各界科学家和企业家测试利用。
由于AlphaFold只是开源了模型推理代码,并没有开源演习代码,因此科研职员只能按照AlphaFold设计好的流程进行利用,而不能对其演习过程做出调度,来迁移至更多的运用处景。
中科院院士、北京大学教授鄂维南表示,“只管DeepMind开源了推理代码,但模型的演习技能才是核心的竞争力”。
复旦大学教授马剑鹏。
同样,2021年12月,复旦大学繁芜体系多尺度研究院马剑鹏教授的团队和上海人工智能实验室互助,在《生物信息学简报》(Briefings in Bioinformatics)上揭橥了一篇名为“OPUS-Rota4: agradient-based protein side-chain modeling framework assisted by deeplearning-based predictors”的论文,简述了他们开拓的算法成果。
研究团队研发出的具有自主知识产权的OPUS系列算法,这个算法可以用于预测蛋白质主链和侧链的三维构造,值得一提的是,个中的蛋白质侧链预测算法即OPUS-Rota4算法,精度比AlphaFold更胜一筹。
详细而言,研究职员利用AlphaFold得到了15个蛋白的预测构造,并利用不同方法根据预测出的主链构造对其侧链进行重新建模。其结果显示,OPUS-Rota4的结果显著优于其它侧链建模方法,而且比AlphaFold2预测的侧链更靠近天然构象。
不同侧链建模方法对CASP14-AF2(15)的性能。
就在前不久,又有一家海内AI制药企业华深智药宣告,在AI和生命科学结合领域实现了一个主要进展,在蛋白质构造预测方面开拓出新的技能——OmegaFold。
总的来说,利用AI推动生命科学发展的研究正在海内各处着花。各大企业和高校团队在不断推进AI和生物制药的跨界领悟,他们正在努力赶超DeepMind公司的AlphaFold。很显然,这一领域的源头创新并不在我们手上,若何做才能保持上风呢?
“我们必须从底层技能做起”
蛋白质构造预测早已不是一个新的领域,科学家已经做了五十多年,但是直到AlphaFold的涌现,这一领域的研究才涌现打破性成果。
在很多业内专家看来,它的涌现某种程度上是靠科学家个人去发挥他们的创造性。但我国在这一领域发展也有一定上风,这便是打算机系统工程。科学问题的工程化,AlphaFold也是非常范例的例子之一。
目前,我国还没有能够完备超越AlphaFold的核心技能,要实现真正“从0到1”的打破,或许还须要一些韶光。
马建鹏在受访中表示,“有人在说AlphaFold开源了,我们国家不用搞了,这是大错特错。第一,他们所谓的开源只是表层构造开源了,底层技能没有开源。第二,你把它拿来你只能做他们的东西,你没有办法提高,就像航空发动机你买来可以,你能往前再进一步吗?”
马建鹏认为,我们必须从底层技能做起,节制核心算法。
参考资料
1. 对标AlphaFold2!
深势科技发布Uni-Fold蛋白构造预测工具,并开源演习代码.深势科技.
https://mp.weixin.***.com/s/Zhn3HJpLnznLM1bpu6D1ew
2. OPUS-Rota4: a gradient-based protein side-chain modeling framework assisted by deep learning-based predictors.Briefings in Bioinformatics.
https://academic.oup.com/bib/article/23/1/bbab529/6461160
3. 超越谷歌“AlphaFold2”,为新药研发供应利器:复旦繁芜体系多尺度研究院团队揭橥全新蛋白质侧链预测成果.复旦大学.
https://mp.weixin.***.com/s/idWh_IO66Nhry4LfeITmIA
https://www.sohu.com/a/510336879_629135
4. 环球首个!
华深智药完成单条序列蛋白质构造预测末了一块拼图.华深智药.
https://mp.weixin.***.com/s/DY3I13k_9QsIpCmyvQBlPg
5. AlphaFold reveals the structure of the protein universe.DeepMind.
https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
6. 对话复旦繁芜体系多尺度研究院院长:蛋白质构造预测为何打破.新浪科技.
https://finance.sina.com.cn/tech/2021-11-01/doc-iktzqtyu4671024.shtml
7. Finally, an answer to the question: AI — what is it good for?.VOX.
https://www.vox.com/future-perfect/2022/8/3/23288843/deepmind-alphafold-artificial-intelligence-biology-drugs-medicine-demis-hassabis
任务编辑:吴跃伟 图片编辑:张同泽
校正:施鋆
本文系作者个人观点,不代表本站立场,转载请注明出处!