【学习笔记】山东大学生物信息学-04 蛋白质结构预测与分析

课程地址山东大学生物信息学

文章目录

  • 四、蛋白质结构预测与分析
    • 4.1 蛋白质的二级结构
    • 4.2 蛋白质的三级结构
    • 4.3 三级结构可视化软件 VMD
    • 4.4 计算方法预测三级结构
    • 4.5 三级结构的比对
    • 4.6 蛋白质分子表面性质
    • 4.7 获取蛋白质四级结构
    • 4.8 蛋白质-蛋白质分子对接
    • 4.9 蛋白质-小分子分子对接
    • 4.10 虚拟筛选与反向对接
    • 4.11 分子动力学模拟

四、蛋白质结构预测与分析

4.1 蛋白质的二级结构

常见的二级结构单元

  • 详见视频蛋白质的二级结构-01 P73

  • 螺旋:最常见的就是 α 螺旋。还有三转角螺旋、五转角螺旋等。

  • β 折叠 () : β 折叠由 β 折片 () 平行排列而成。序列上可能相隔很远,但空间上并排在一起,彼此间形成氢键

  • 无规卷曲 (): 无规律松散结构。

  • β 转角 () : 如果肽链发生了急转弯(角度大于 90°),这个转弯结构叫 β 转角。

  • DSSP (Definition of Secondary Structure of Proteins),即,蛋白质二级结构定义词典。DSSP 并不预测二级结构,而是根据二级结构的定义对已经测定三级结构的蛋白质的各个位置指认出是哪种二级结构
    DSSP 址:http://swift.cmbi.ru.nl/gv/dssp

从 PDB 获取蛋白质二级结构信息

  • 详见视频蛋白质的二级结构-02 PDB P74
  • 自编程序 Biotools(打不开)http://1.51.215.28/~gongj/biotools/
    输入 PDB ID 自动从 上获取 dssp 文件并抽取出一级和二级结构的序列信息。

预测蛋白质二级结构

  • 详见视频蛋白质的二级结构-03 PDB P75
  • 对于未知结构的蛋白质,可以通过氨基酸序列,预测其二级结构。目前的二级结构预测软件只预测 α 螺旋和 β 折叠,不预测其他二级结构单元。
  • 常用软件:
    PSIPRED http://bioinf.cs.ucl.ac.uk/psipred
    Jpred3 http://www.compbio.dundee.ac.uk/www-jpred/
    PREDICTPROTEIN http://www.predictprotein.org/
    SSpro http://scratch.proteomics.ics.uci.edu/
    PSSpred http://zhanglab.ccmb.med.umich.edu/PSSpred/
    PREDATOR http://mobyle.pasteur.fr/cgi-bin/portal.pyforms::predator
    GOR V http://gor.bb.iastate.edu/

4.2 蛋白质的三级结构

  • 三级结构是指整条多肽链的三维空间结构,即,包括骨架和侧链在内的所有原子的空间排列。
  • 测定三级结构的方法:X 射线衍射法(X-ray Crystallography)、核磁共振法(NMR,Nuclear Magnetic Resonance)、冷冻电子显微镜技术等。
  • PDB 中绝大多数蛋白质的三级结构是用 X 射线衍射法测定的。
  • 无法结晶的蛋白质可以利用核磁共振法在液体环境中测定(只能用于测定质量小于 70kD 的分子,约 200 多个氨基酸的蛋白质)。
  • 详见视频蛋白质的三级结构 PDB P76

4.3 三级结构可视化软件 VMD

  • 详见视频三级结构可视化软件 VMD-01 鼠标操作 P77
  • SWISS-MODEL 是一款用同源建模法预测蛋白质三级结构的全自动在线软件

穿线法 I-TASSER

  • 原理不相似的氨基酸序列也可以对应着相似的蛋白质结构。(同源建模法找不到相似模板时使用)

  • 已知的蛋白质结构约 10 万个,其所具有的不同的结构拓扑只有 1393 个,且自 2008 年就没再有新的结构拓扑产生。

  • 把目标序列像线一样穿到目前现有的结构里,穿到哪个结构最舒服,就用哪个结构作为预测模板;并通过能量方程穿得舒服,能量就低,根据最舒服的穿法构建最终模型。

从头计算法:QUARK

  • 原理:1973 年《科学》Anfinsen : 蛋白质的三维结构决定于自身的氨基酸序列,并且处于最低自由能状态。
  • 有些特殊蛋白质用穿线法也预测不了三级结构模型,此时可以用从头计算法,模拟一个肽段在三维空间内所有可能存在的姿态,并计算每个姿态的自由能,最后将==自由能最低的姿态作为预测结果==(计算量大,轻易不使用)。
  • QUARK 是一款用从头计算法预测蛋白质三级结构的在线软件,适用于没有同源模板的蛋白质,且氨基酸序列长度 200 以内,计算时间约 2 天以上。
  • 详见视频计算方法预测三级结构-04 从头计算法 QUARK P84
  • 至少需要 3 个模型质量评估体系认为模型可靠,才能认为模型可靠。因此需要借助第三方模型评估软件
  • 详见视频计算方法预测三级结构-06 模型质量评估 P86
  • PDBePISAs 相互作用面分析
  • 详见视频蛋白质-小分子分子对接 AutoDock 使用 P95-96

4.10 虚拟筛选与反向对接

虛拟筛选

  • 虛拟筛选 Virtual screening () ,也称计算机筛选,即在进行生物活性筛选之前,在计算机上对化合物分子进行预筛选,以降低实际筛选化合物的数目,同时提高先导化合物的发现效率。(即,预筛选与蛋白质相互作用的小分子,挑虚拟筛选结果中结合得最好的小分子做实验验证。)
  • ZINC 数据库:化合物小分子数据库 http://zinc.docking.org
  • 虛拟筛选过程:
    1. 从小分子数据库 ZINC 下载小分子 3D 结构;
    2. 程序处理下载的小分子文件;
    3. 软件处理蛋白质分子,设定对接空间范围;
    4. AutoDock Vina 程序批量完成对接;
    5. 对接结果分析,筛选出适合的小分子:按自由能高低排序,低的在前。
    6. 软件分析排名第一的小分子对接状态
    7. 从销售商处购买筛选出的小分子,实验验证。
  • 用免费的 AutoDock Vina 做虛拟筛选
  • 详见视频虚拟筛选 P97
  • 详见视频AutoDock Vina 教程 P98

反向对接

  • 反向对接 ():是通过把一个小分子多个靶标蛋白进行分子对接,寻找潜在的靶标

  • 当前软件和技术:还 没有标准和成熟的免费软件来实现,只有少数收费软件能实现此功能,以及很少的科研单位通过自己的算法和对已有对接程序的改造来实现。

  • 靶标数据库 http://bioinfo-pharma.u-strasbg.fr/scPDB

  • scPDB: An Annotated Database of Druggable Binding Sites from the Protein DataBank

  • scPDB 收集了 PDB 数据库中有药物结合位点的蛋白。可根据配体、蛋白、结合方式为特征进行搜索。

  • 当前版本包含:8077 entries, 2377 proteins and 5233 ligands 可以下载到本地使用,每个蛋白一个单独的文件夹,每个文件夹都包含如下文件:
    ligand_xray.mol2: 从原始复合物中剥离的配体晶体结构
    protein.mol2: 去除配体结构的蛋白受体结构
    site.mol2: 去除配体结构的蛋白受体结构,仅包含结合位点

  • 反向对接 (= 多个正向对接
    ◆ 遍历蛋白数据库文件,获得每个蛋白质及其相关文件
    ◆ 软件自动探测结合位点,并标识结合区域自动循环,使小分子与每个蛋白受体对接
    ◆ 打分、筛选和排序

4.11 分子动力学模拟

  • 分子动力学模拟 (Molecular Dynamic Simulation,MDS):用计算机来模拟原子及分子的物理运动过程
  • 软件:NAMD,CHARMM,DESMOND, GAUSS 等(需要超级计算机完成)。
  • 详见视频分子动力学模拟 P100

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年5月7日
下一篇 2022年5月7日

相关推荐