Meta 预测出六亿种蛋白质结构 – 科学月刊Science Monthly

0
112

Author 作者 编辑部蛋白质生物蛋白质结构人工智慧胺基酸蛋白质是所有生物的必要组成成分,然而人类对如此重要的物质其实所知甚少。即使集结众多科学家之力所建构的蛋白质资料库(Protein Data Bank)也只解出近18 万种蛋白质结构,而这仅占生物圈的极小部分。不过,人工智慧(artificial intelligence,AI)带来了惊人的突破。去(2022)年初,Google 旗下的人工智慧公司DeepMind 利用AlphaFold 预测出两亿种蛋白质结构,几乎涵盖所有已知生物的DNA资料库。而另一个科技巨头Meta(Facebook 母公司)也不落人後,在去年10 月31 日宣布它们开发的ESMFold 预测出超过六亿种蛋白质结构,这当中还包含了许多潜藏未曾被发现的蛋白质。

Meta 采用一种称为「大型语言模型」(large language model)的AI 模型,该模型的原始用途是根据个别字母或字词来预测文本。此蛋白质结构计画的负责人里维斯(Alexander Rives)与研究人员利用此AI 模型,先输入已知的蛋白质结构,并使用字母代表20 种胺基酸训练AI 填补未知的胺基酸序列。虽然里维斯表示ESMFold的预测精准度尚不如AlphaFold,但速度却快上60 倍,所以可在短短两周内就累积如此庞大的资料库。目前这些资料已开放自由取用,将可帮助研究人员进一步探索更广大的蛋白质世界。(Photo by ANIRUDH on Unsplash)Lin, Z. et al. (2022). Evolutionary-scale prediction of atomic level protein structure with a language model. Preprint at bioRxiv.

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论