生命的编码-业余玩家怎么读懂AlphaFold的重要意义

生命的编码

  • 1、前言
  • 2、生命结构
    • 2.1 生命系统的结构层次
    • 2.2 九大系统
    • 2.3 人体器官
    • 2.4 组织
    • 2.5 细胞
      • 细胞的基本构成
      • 细胞壁
      • 细胞膜
      • 细胞质
      • 细胞器
      • 细胞核
      • 细胞的活动进程
      • 细胞的繁殖方式
      • 细胞的化学成分
    • 2.6 DNA
      • 主要类别
      • 基因组结构
      • 遗传密码
      • DNA复制
      • DNA与蛋白质的相互作用
      • 转录和翻译
      • 信使RNA
      • 转运RNA
    • 2.7 肽链
      • 肽链与肽键、氨基酸、水分子、蛋白质之间的联系
    • 2.8 蛋白质折叠
      • 研究意义
      • 理论模型
  • 3、相关工具
  • 4、人造生命体的探讨

转录的调节控制是基因表达调节控制中的一个重要环节。促进基因转录叫正调节,抑制基因转录叫负调节。

在原核生物方面1961年F.雅各布和J.莫诺提出的操纵子学说,得到许多人的验证和充实。操纵子通常的调控方式为:
①诱导和阻遏作用;②环腺苷酸(CAMP)和降解物活化蛋白(CAP)的调节作用;③弱化作用。

对真核细胞基因转录的调节控制目前知道得很少。同种高等生物每个个体的各个体细胞都有全套相同的基因,只是由于在发育过程中基因表达的调节控制(包括转录的调节控制)不同,因而发育成各种不同的组织和器官。目前认为,动物(包括人)都含有癌基因,但有的致癌,有的则不致癌,这也可能是由于转录与翻译的调控不同。另外,真核DNA中的结构基因只占总量的10%左右,大部分DNA顺序都可能起调节控制作用。

信使RNA

信使RNA,中文译名“信使核糖核酸”,是由DNA的一条链作为模板转录而来的、携带遗传信息能指导蛋白质合成的一类单链核糖核酸。

以细胞中基因为模板,依据碱基互补配对原则转录生成mRNA后,mRNA就含有与DNA分子中某些功能片段相对应的碱基序列,作为蛋白质生物合成的直接模板。mRNA虽然只占细胞总RNA的2%~5%,但种类最多,并且代谢十分活跃,是半衰期最短的一种RNA,合成后数分钟至数小时即被分解。

信使RNA(mRNA)是一大类RNA分子,它将遗传信息从DNA传递到核糖体,在那里作为蛋白质合成模板并决定基因表达蛋白产物肽链的氨基酸序列。 RNA聚合酶将初级转录物mRNA(称为前mRNA)转录成加工过的成熟mRNA,这种成熟的mRNA被翻译成蛋白质。

如在DNA中一样,mRNA遗传信息也保存在核苷酸序列中,其被排列成由每个三个碱基对组成的密码子。每个密码子编码特定氨基酸,但终止密码子例外,因为其终止蛋白质合成。

将密码子翻译成氨基酸的过程需要另外两种类型的RNA:转移RNA(tRNA)和核糖体RNA(rRNA)。tRNA介导密码子的识别并提供相应的氨基酸,rRNA是核糖体蛋白质制造机械的核心组成部分。

真核生物和原核生物之间的另一个区别是mRNA的转运。由于真核转录和翻译是在不同的细胞器内进行的,真核mRNA必须从细胞核输出到细胞质。 这一过程可能受不同信 通路的调节。成熟的mRNA通过其加工的修饰被识别,在结合帽结合蛋白CBP20和CBP80及转录/输出复合物(TREX)后通过核孔被输出到细胞质。

已经加工并转运至细胞质的真核mRNA(即成熟mRNA)在核糖体的翻译发生在细胞质中自由漂浮的核糖体中,或者通过信 识别颗粒导向到的内质 中。

因为原核mRNA不需要加工或转运,所以原核生物mRNA在核糖体的翻译可以在转录结束后立即开始。因此,可以说原核生物的mRNA翻译与转录偶联发生。

同一细胞内的不同mRNA具有不同的寿命(稳定性)。在细菌细胞中,单个mRNA可以存活数秒至超过一小时,但平均寿命为1至3分钟,因此,细菌mRNA的稳定性远低于真核mRNA。哺乳动物细胞mRNA的寿命从几分钟到几天不等。mRNA的稳定性越高,从该mRNA产生的蛋白质越多。 mRNA的有限寿命使细胞能够快速改变蛋白质合成以响应其不断变化的需求。有许多机制可导致mRNA的降解。

转运RNA

转运RNA(Transfer RNA),又称传送核糖核酸、转移核糖核酸,通常简称为tRNA。是一种由76-90个核苷酸所组成的RNA,其3’端可以在氨酰-tRNA合成酶催化之下,接附特定种类的氨基酸。

tRNA功能主要是携带氨基酸进入核糖体,在mRNA指导下合成蛋白质。即以mRNA为模板,将其中具有密码意义的核苷酸顺序翻译成蛋白质中的氨基酸顺序(见蛋白质的生物合成、核糖体)。tRNA与mRNA是通过反密码子与密码子相互作用而发生关系的。在肽链生成过程中,第一个进入核糖体与mRNA起始密码子结合的tRNA叫起始tRNA,其余tRNA参与肽链延伸,称为延伸tRNA,按照mRNA上密码的排列,携带特定氨基酸的tRNA依次进入核糖体。形成肽链后,tRNA即从核糖体释放出来。整个过程叫做tRNA循环,如下图所示。

生命的编码-业余玩家怎么读懂AlphaFold的重要意义
生物合成:在生物体内,DNA分子上的tRNA基因经过转录生成tRNA前体,然后被加工成成熟的tRNA。
人工合成:1981年,中国科学家王德宝等用化学和酶促合成相结合的方法首次全合成了酵母丙氨酸tRNA。它由76个核苷酸组成,其中包括天然分子中的全部修饰成分,产物具与天然分子相似的生物活性(见核糖核酸和核酸人工合成)。

2.7 肽链

肽链由多个氨基酸脱水缩合形成肽键(化学键)连接而成。

两个氨基酸相连为二肽,依此类推还有三肽、四肽……10个以下氨基酸组成的称寡肽(小分子肽),超过十个就是多肽,而超过五十个就被称为蛋白质。大分子蛋白质多是组成氨基酸超过100的长肽链。

肽链与肽键、氨基酸、水分子、蛋白质之间的联系

是指在氨基酸相互连接形成蛋白质时,各个氨基酸之间相互连接的那个化学键,就称为肽键。[其实肽键是在两个氨基酸连接时,由一个氨基酸的羧基(-COOH)与另一个氨基酸的氨基(-NH2)相互连接所形成的化学键(-NH-CO-]。

在两个氨基酸连接形成肽键时会脱出(或说生成)一分子水。即有多少个肽键形成,就会脱出多少分子水。那么一条肽链中含有多少个肽键,就会有多少个水分子脱出。

一条肽链含有多个肽键,一个蛋白质分子由一条或多条肽链组成。

肽键数=脱去的水分子数=氨基酸数-肽链数
蛋白质分子量=氨基酸总数×氨基酸平均分子量-脱去水分子数×18

2.8 蛋白质折叠

蛋白质折叠 是蛋白质获得其功能性结构和构象的过程。通过这一物理过程,蛋白质从无规则卷曲折叠成特定的功能性三维结构。在从mRNA序列翻译成线性的肽链时,蛋白质都是以去折叠多肽或无规则卷曲的形式存在。

结构决定功能,仅仅知道基因组序列并不能使我们充分了解蛋白质的功能,更无法知道它是如何工作的。蛋白质可凭借相互作用在细胞环境(特定的酸碱度、温度等)下自己组装自己,这种自我组装的过程被称为蛋白质折叠。

蛋白质折叠问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。从一级序列预测蛋白质分子的三级结构并进一步预测其功能,是极富挑战性的工作。

研究意义

蛋白质折叠机制的阐明将揭示生命体内的第二套遗传密码,这是它的理论意义。蛋白质折叠的研究,比较狭义的定义就是研究蛋白质特定三维空间结构形成的规律、稳定性和与其生物活性的关系。在概念上有热力学的问题和动力学的问题;蛋白质在体外折叠和在细胞内折叠的问题;有理论研究和实验研究的问题。这里最根本的科学问题就是多肽链的一级结构到底如何决定它的空间结构然前者决定后者,一级结构和空间结构之间肯定存在某种确定的关系,这是否也像核苷酸通过“三联密码”决定氨基酸顺序那样有一套密码呢人把这设想的一级结构决定空间结构的密码叫作“第二遗传密码”。

理论模型

框架模型 假设蛋白质的局部构象依赖于局部的氨基酸序列。在多肽链折叠过程的起始阶段,先迅速形成不稳定的二级结构单元; 称为“flickering cluster”,随后这些二级结构靠近接触,从而形成稳定的二级结构框架;最后,二级结构框架相互拼接,肽链逐渐紧缩,形成了蛋白质的三级结构。这个模型认为即使是一个小分子的蛋白也可以一部分一部分的进行折叠,其间形成的亚结构域是折叠中间体的重要结构。

在疏水塌缩模型[5]中,疏水作用力被认为是在蛋白质折叠过程中起决定性作用的力的因素。在形成任何二级结构和三级结构之前首先发生很快的非特异性的疏水塌缩。

该模型认为蛋白质的折叠起始于伸展肽链上的几个位点,在这些位点上生成不稳定的二级结构单元或者疏水簇,主要依靠局部序列的进程或中程(3-4个残基)相互作用来维系。它们以非特异性布朗运动的方式扩散、碰撞、相互黏附,导致大的结构生成并因此而增加了稳定性。进一步的碰撞形成具有疏水核心和二级结构的类熔球态中间体的球状结构。球形中间体调整为致密的、无活性的类似天然结构的高度有序熔球态结构。最后无活性的高度有序熔球态转变为完整的有活力的天然态。

根据这种模型,肽链中的某一区域可以形成“折叠晶核”,以它们为核心,整个肽链继续折叠进而获得天然构象。所谓“晶核”实际上是由一些特殊的氨基酸残基形成的类似于天然态相互作用的 络结构,这些残基间不是以非特异的疏水作用维系的,而是由特异的相互作用使这些残基形成了紧密堆积。晶核的形成是折叠起始阶段限速步骤。

此模型[9]的中心思想就是多肽链可以沿多条不同的途径进行折叠,在沿每条途径折叠的过程中都是天然结构越来越多,最终都能形成天然构象,而且沿每条途径的折叠速度都较快,与单一途径折叠方式相比,多肽链速度较快,另一方面,外界生理生化环境的微小变化或突变等因素可能会给单一折叠途径造成较大的影响,而对具有多条途径的折叠方式而言,这些变化可能给某条折叠途径带来影响,但不会影响另外的折叠途径,因而不会从总体上干扰多肽链的折叠,除非这些因素造成的变化太大以致于从根本上影响多肽链的折叠。

格点模型(也简称HP模型),最早是由Dill等人1989年提出的。格点模型可分为二维模型和三维模型两类。二维格点模型就是在平面空间中产生正交的单位长度的 格,每个氨基酸分子按在序列中排序的先后顺序依次放置到这些 格交叉点上,在序列中相邻的氨基酸分子放置在格点中时也必须相邻,即相邻氨基酸分子在格点模型中的距离为1。但是需要注意的是, 格中的每个交叉点最多只能放置一个氨基酸分子,如果序列中的某个氨基酸分子已经放置在此位置上,则后序的氨基酸分子就不可以再放置在这个格点上。如果在放置氨基酸分子的过程中出现当前所要放置的氨基酸分子没有位置可以放置了,那就说明该构型是不合理的,需要重新放置。三维格点模型和二维格点模型相似,它是在三维空间中产生的单位长度的立体 格。格点中放置氨基酸分子的方法和二维的相同,但在二维格点模型中放置氨基酸分子时除了序列前两个氨基酸分子外最多只有三个方向可以选择,而在三维格点模型中复杂度提高了很多,放置氨基酸分子最多可以有五个方向可选。

扩展阅读:
高效预测几乎所有人类蛋白质结构,AlphaFold再登Nature,数据库全部免费开放

3、相关工具

AutoDock

Autodock是一款开源的分子模拟软件,最主要应用于执行配体—蛋白分子对接。

SYBYL

SYBYL完全的结合计算化学和分子模拟的环境,提供了解分子结构和性质的基量,特别指的是新的化学实体的性质。
基本操作平台(包括开发平台)
基于配体的药物设计(药效团概念、QSAR和ADME)
药物设计(虚拟筛选和de novo设计)
组合化学 (化学库设计和分子多样性)
结构生物学(大分子模拟和同源模建)
信息学 (生物信息学和化学信息学)
NMR相关模块

Discovery Studio

Discovery Studio? (简称DS), 基于Windows/Linux系统和个人电脑、面向生命科学领域的新一代分子建模和模拟环境。它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白质结构功能研究,以及药物发现。为科学家提供易用的蛋白质模拟、优化和药物设计工具。通过高质量的图形、多年验证的技术以及集成的环境,DS将实验数据的保存、管理与专业水准的建模、模拟工具集成在一起,为研究队伍的合作与信息共享提供平台。
DS目前的主要功能包括:蛋白质的表征(包括蛋白-蛋白相互作用)、同源建模、分子力学计算和分子动力学模拟、基于结构药物设计工具(包括配体-蛋白质相互作用、全新药物设计和分子对接)、基于小分子的药物设计工具(包括定量构效关系、药效团、数据库筛选、ADMET)和组合库的设计与分析等。DS可以应用于生命科学以下研究领域:新药发现,生物信息学,结构生物学,酶学,免疫学,病毒学,遗传与发育生物学,肿瘤研究。

序列操作工具箱(Version 2)
序列操作套件V2翻译自Sequence Manipulation Suite(Version 2),它是一款JavaScript程序集合,可用于生成、格式化、分析相对较短的DNA序列和蛋白序列。一般被分子生物学家用于教学和程序算法测试。

4、人造生命体的探讨

从上述资料大家可以看到,从物理原子层面、到分子、到化合反应、到DNA、RNA的化学元素构成、再到肽链的合成,都十分清晰,整个过程是有理论基础相对可模拟的;但在肽链如何折叠、构造成不同功能性三维结构的蛋白质这块,是一个。

从一级序列预测蛋白质分子的三级结构并进一步预测其功能,是极富挑战性的工作。

那么研究清楚蛋白质结构与DNA的关系之后,是否就可以编码出人造生命体出来古生物例如恐龙、猛犸是否会再现人间/p>

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年6月22日
下一篇 2021年6月22日

相关推荐