蛋白研究过程中,一般认为氨基酸的序列决定了蛋白的结构,结构决定功能(一般指蛋白的三维结构)。然而,近50年的研究中,有一种没有特定三维结构的蛋白不断被研究人员发现,由于这类蛋白无法折叠成稳定的三维结构而称为固有无序蛋白(intrinsically disordered regions,IDRs)。这类蛋白虽然缺乏稳定结构且高度可变,但是研究却发现他们在生物体内行驶着重要的生物学功能。
尤其是最近相变频繁登上CNS主刊,越来越多认识到IDRs在相变中的重要作用。2018 Cell系列相变最强综述,未来已来,你在哪/p>
-
相位分离在多种细胞过程中起作用,包括形成经典的无膜细胞器、信 复合物、细胞骨架和许多其他超分子组装。
-
相位分离的概念为理解序列简并(低复杂性)和蛋白质无序区域的功能提供了新的研究方向。
-
越来越多的证据表明,相变和无膜细胞器的失调在蛋白聚集相关的人类疾病中发挥关键作用。
-
理解蛋白质相位分离背后的物理原理和分子互作机制可促进新型生物材料的研发。
IDRs的存在,使得蛋白更容易形成液滴状,诱发相变生成和调控的发生。还在做经典生物调控的你,如果能关联下相变,可能既能更好的解释细胞中的调控作用(毕竟细胞不是我们平常见到的溶液,其极度粘稠的特性诱发不同的调控规则),又可以跟踪热点,提升下文章档次。
相变IDRs预测
我们推荐一款工具,MetaDisorder(http://iimcb.genesilico.pl/metadisorder/),一个整合了多种meta-method方法的蛋白无序预测平台,操作简单,只需2步,就可以预测研究的目标蛋白是否有可能参与相变,再决定是否进行后期的验证。
其使用方式如下图:
可视化结果仅展示了4种MetaDisorder相关的结果,关于其它多种预测算法的结果点击显示。
除了在线分析平台,DISOPRED也有软件版,供大批量蛋白结构的预测(软件下载地址:http://bioinfadmin.cs.ucl.ac.uk/downloads/DISOPRED/)。一般下载使用最新版。
IDRs预测方法
由于固有无序蛋白结构的不稳定性,很难通过实验手段使他们纯化结晶以得到可靠的实验数据,尤其是大规模地进行无序蛋白质结构测定更是十分困难。因此,各种IDRs预测软件快速发展起来,并通过每两年举办一次的蛋白质结构预测比赛(critical assessment of structure prediction,CASP)来评估各种预测软件的准确率。从CASP5开始加入了对无序蛋白质的预测,目前已经举行到CASP12(2016年),CASP13(2018年)比赛正在进行中(有兴趣的小伙伴可查看官 了解比赛:http://predictioncenter.org/casp13/index.cgi)
这些预测方法可分为四大类:
1. Sequence based
依赖人工神经 络 (artificial neural networks,ANNs)、支持向量机(support vector machines,SVMs)等机器学习方法开发的算法。
例如1997年Romero等开发的第一个无序区域预测的工具,它是基于数据库中67个无序区域 (1340个残基)和一些有序区域(16 543个残基)建立的一种“双层前馈式神经 络”,首次表明单纯从氨基酸序列可以预测无序区域。
之后利用计算技术开发了一系列的算法,如、、等。
第一类算法的缺点是不能很好地揭示潜在的序列性质。
2. clustering
该方法通过使用蛋白一级序列生成三级结构模型,并将模型彼此叠加以鉴别蛋白高度可变区域。这个方法建立在理论上,认为序列的位置在多个模型中应该是保持一定的秩序规则,然而变化的残基可能是无序的。和便是基于此方法的预测工具。
由于聚类方法不依赖于训练数据集,因此这种方法可能不太能显示关于无序区域长度的偏差。
3. template based
与聚类方法类似,基于蛋白的一级序列与已知的同源物做比对。如就是基于此方法的预测工具,同时也可以基于氨基酸序列做预测。这个方法认为,蛋白内在无序区域在蛋蛋白家族中应该是保守的,通过结合氨基酸序列的预测和同源比对的方法,也可划分到第四种预测方式中。
4. meta-predictor approaches
预测工具性能评估
为了测试各工具之间的效果差异,Jennifer D. Atkins 等人用已知结构的心肌肌肉LIM蛋白(MLP)进行检验。已知MLP的中心区域含长的无序区域,且-末端和-末端都含有一定程度的无序区域。
从上表中其实很难确定到底哪个工具预测最准确,因为所有的预测结果都不一样,甚至有些软件的预测结果与其他结果相差甚远。这体现了独个工具分析的局限性,也说明我们需要同时使用多个工具来尽可能清楚地解析给定序列中无序区域存在的可能性。
有研究者用其他已知结构的蛋白质做过类似的比较,得到了相似的效果,即不同的预测工具间结果存在不同程度的差异。基于前人的研究经验得出,似乎是比较可靠的预测方法,其预测最接近已知的无序区域。
我们不应单独使用某个预测软件,每个工具都有缺点和优点。尽管我们不能保证预测软件能100%地为我们提供正确的结果,但这些结果确实为我们提供了IDRs的较精准估计,从而使我们了解到一些无法通过实验得到的IDRs结构。
由上可知目前对IDRs的研究还存在诸多难题,由于结构不稳定而无法通过实验手段进行可靠的研究,就算有了众多的预测软件,但是也存在一定的局限性。机遇与挑战并存是生物研究中的常态,希望终有一天科学家们会揭开生物体内这些不同寻常的蛋白域的功能。如果有精力,开发这么一款软件和数据库也会对大家很有帮助。
参考文献
[1] 马冲, 杨冬, 姜颖等. 无序蛋白质的判定及其结构、功能和进化特征[J]. 生物化学与生物物理进展, 2015, 42(1): 16-24.
[2] Jennifer D. Atkins. Disorder Prediction Methods, Their Applicability to Different Protein Targets and Their Usefulness for Guiding Experimental Studies [J]. Int. J. Mol. Sci. 2015, 16, 19040-19054.
文献精读
-
肿瘤化疗无效是对预先存在的突变的选择还是诱发新突变,Cell给你答案
-
“人鸡胚胎”破解生命起源奥秘,百年来首次证实“组织者”存在于人体 |《Nature》发表重磅论文
-
被高中生物骗了这么多年,原来人体内细胞的DNA是有不同的/p>
-
周琪院士正面回应:60万一针有用吗干细胞治疗)
-
CRISPR-CAS9发展历程小记
-
一场大病引起的诺贝尔2017年生理学奖角逐
-
Science搞反狗脑 – 人脑和狗脑一样/p>
-
一篇压根不存在的文献被引用400次揭开” 幽灵文献” 的真面目
-
基于人工智能的文献检索,导师查找,更聪明
-
GeenMedical:文献查询、筛选、引用排序、相似文献、全文下载、杂志分区、影响因子、结果导出、杂志评述、直接投稿,一站服务
-
YANDEX搜索,不翻墙稳定使用近谷歌搜索
-
Nature我的研究对后人毫无用途:21%的学术论文自发布后从未被引用
-
SCI-HUB镜像, SSH隧道访问学校内
-
为了速成生物学,一位程序员探索了”爆款”基因背后的秘密
-
Nature邀请6位专家为您支招如何写出一流论文/p>
-
Cell:荧光标记out了,AI不用“侵入”也能识别细胞死活和类型
-
如果你经常用PubMed,那么这个插件将非常好用!
-
生物研究中不可缺少的数字概念,多少,多大,多快
-
王秀杰研究组合作发现m6A修饰在小脑发育中的新功能 (附2018上半年m6A研究文章和点评)
-
把人类宝宝和黑猩猩幼崽一起养大,会发生什么有趣的事情呢局可能是有些出乎意料的~~
-
你体内的细胞“成精了”然还互相看对了眼/p>
-
父爱无言!科学家首次发现来自爸爸的基因,可以通过胎儿来控制妈妈对宝宝的爱
-
2018 Cell系列相变最强综述,未来已来,你在哪/p>
更多阅读
画图三字经 生信视频 生信系列教程
心得体会 癌症数据库 Linux Python
高通量分析 在线画图 测序历史 超级增强子
培训视频 PPT EXCEL 文章写作 ggplot2
海哥组学 可视化套路 基因组浏览器
色彩搭配 图形排版 互作 络
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!