nature methods副主编,Arunima Singh,3月4日在nature methods上发表文章,探讨了基于深度学习的蛋白质结构预测方向近期的研究进展。
蛋白质结构预测是近几十年来的研究热点,理论方法使人们深入了解了实验难以处理的蛋白质结构。同时,随着测定蛋白质结构的实验方法的改进,大量高质量蛋白质结构数据可供研究,提高了训练数据的质量和预测算法的准确性。最终的研究目标是利用蛋白质的序列准确地预测蛋白质的三维结构。当然,在已知同源蛋白结构的情况下,是更容易预测的。
对于缺乏同源信息的蛋白质,准确预测蛋白质结构仍然是一个挑战。进化协方差数据已经被用于增强结构预测性能。可以对与靶序列相关的序列应用多序列比对(MSA),来识别在进化过程中发生突变的氨基酸,其原理是这些共同进化的残基将位于蛋白质的三维结构中的邻近位置或接触。这些接触图应用在几种流行的方法中都取得了一些成功。
基于深度学习的方法在第13届蛋白质结构预测技术评估测试(CASP13)中表现出很高的准确性,并且在无模板建模(FM)类(没有可用的同源结构)中表现极佳。谷歌DeepMind团队的新秀参赛者AlphaFold[1],赢得了此次比赛。它在FM类中正确预测的结构数量最多——43种蛋白质中正确预测了24种。在基于模板建模的类别中,AlphaFold的表现相当于或优于其他方法(尽管AlphaFold没有使用模板)。
参考资料
-
Senior, A. W. et al. Improved protein structure prediction using potentials from deep learning. Nature 577, 706–710 (2020).
-
Yang, J. et al. Improved protein structure prediction using predicted interresidue orientations. Proc. Natl Acad. Sci. USA 117, 1496–1503 (2020).
-
https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!