接前文:分子对接教程 | (1) 软件安装准备
关于蛋白质结构的PDB文件,做分子对接,估计大家都知道PDB这个蛋白质数据库啦。这里简单的介绍一下。
蛋白质的三级结构是指整条多肽链的三维空间结构,也就是包括碳骨架和侧链在内的所有原子的空间排列。第一个蛋白质的三维空间结构于 1958 年用 X-射线衍射法(X-ray Crystallography)测定。这种方法目前仍然是获取蛋白质三级结构的主要方法。PDB 数据库中绝大多数蛋白质结构都是用这种方法测定的。另一个测定蛋白质三维空间结构的方法是核磁共振法(Nuclear Magnetic Resonance, NMR)。无法结晶的蛋白质,可以利用核磁共振法在液体环境中进行结构测定。但是核磁共振法只能用于质量小于 70 千道尔顿的分子,大约对应 200 个氨基酸的长度。除此之外,还有一些不太常用的方法也可以测定分子的三维空间结构,比如冷冻电子显微镜技术(Cyro-Electron Microscopy)。无论用什么方法测定的空间结构,都要提交到 PDB 数据库。所以我们获取蛋白质三级结构最直接的办法就是去PDB 搜索(http://www.rcsb.org/)。
比如我们搜索PI3K这个蛋白,结果是有很多的。可以看到有393个结构信息。
我们选择分辨率较好的在前。这里的0.9光波长度和分子直径的常用计量单位,值越小,分辨率越高,结构越准确。页面往下拉,可以看见这个值越来越大,我们优先选择值小的。我们可以从页面里面看见一下基本信息,比如方法,物种以及被解析的时间等。这里5GJI这个结构获取的方法就是X-RAY。
然后我们还要看这个蛋白的描述是不是我们想要的蛋白,从这里面感觉看起来比较费劲。这里我们借助uniprot这个数据库来选择是比较方便的。这里简单介绍一下这个数据库,可能有的同学是第一次知道。翻了多年前的笔记,粘贴在下面。
UniProt 数据库有三个层次。
第一层叫 UniParc,收录了所有 UniProt 数据库子库中的蛋白质序列,量大,粗糙。
第二层是 UniRef,他归纳了 UniProt 几个主要数据库并且是将重复序列去除后的数据库。
第三层是 UniProtKB,他有详细注释并与其他数据库有链接,分为 UniProtKB 下的 Swiss-Prot和 UniProtKB 下的 TrEMBL 数据库。
关系稍有点复杂,但实际上我们最常用的就是 UniProtKB下的 Swiss-Prot 数据库。
从 UniProt 数据库查看一条蛋白质序列(http://www.uniprot.org/)。在UniProt数据库的首页上有一个关于 UniProtKB 数据库的统计表。可以看到,TrEMBL 数据库里存储的序列数量远远大于 Swiss-Prot 中的。统计表里清楚的写着:TrEMBL 是自动注释的,没有经过检查,而 Swiss-Prot 是人工注释的,并且经过检查。
UniProtKB 中的数据库记录分成几个部分,左侧是注释标签,点击其中某一个标签可以直接跳转到该部分注释。上方是工具标签,可以用于和其他序列进行比较,格式转换,存储等。工具标签下方是这条蛋白质序列的基本信息,蛋白质的名字,基因的名字,所属物种,以及状态。这里有加星文档图标,是被人工检查过的,应该属于 Swiss-Prot 数据库。注释打分 5 星,说明注释得很全面,并且这些注释在蛋白质水平上有实验依据。
Names & Taxomomy: 给出了蛋白质的各种名字,包括全称、缩写以及别名。还列出了所属物种以及该物种的分类学谱系等。
新页面下直接选择Structure。左边就是显示结果,有一个列表给我们快速查看相关参数。可以根据这些参数选择合适的结构,注意positions这一栏,我们首先选择resolution小的,但结构不是我们要的,就不行,resolution这一栏只是该结构只是该蛋白的序列区段,比如这里1-143这一段氨基酸序列是不在该结构中的。我们需要根据一些文献知识,了解一般配体所在的部位即相关活性位点。有没有已知的结合区域来参考选择,我个人认为,如果不知道,越长的越好。有的还是多条肽链的复合物,如果是二聚体的,后面对接可以删除一个。总之,需要先了解这些所解析的晶体结构是否已经包含了拟对接分子的潜在结合位点,已知的配体和我们要对接的分子结构相似度。越相似越好,还需注意晶体结构中蛋白序列是否为野生型、是否含有PTM、是否存在有可能引起构象变化的特殊有机溶剂和别构效应分子等。如果系列晶体结构的性质都类似,选择分辨率最高的。
最后,这些都是在蛋白结构已知的蛋白分子对接,如果我们要对接的蛋白,没有晶体结构,在PDB中是检索不到的,在UniProt 中的Structure是不会显示的。比如DRAM1这个蛋白,是没有结构的,所以在UniProt 中的Structure是灰色。
文章知识点与官方知识档案匹配,可进一步学习相关知识Java技能树使用JDBC操作数据库数据库操作92024 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!