蛋白质结构与功能的预测方法总结和资料汇总
“折叠(fold)”的概念
“折叠(fold)”是近年来蛋白质研究中应用较广的一个概念,它是介与二级和三级结构之间的蛋白质结构层次,它描述的是二级结构元素的混合组合方式。
五. 常用蛋白序列和结构数据库
数据库说明 址链接
PDB蛋白质三维结构http://www.rcsb.org/pdb
SWISS-PROT蛋白质序列数据库http://kr.expasy.org/sprot/
PIR蛋白质序列数据库http://pir.georgetown.edu/
OWL非冗余蛋白质序列http://www.bioinf.man.ac.uk/dbbrowser/OWL/
EMBL核酸序列数据库http://www.embl-heidelberg.de/
TrEMBLEMBL的翻译数据库http://kr.expasy.org/sprot/
GenBANK核酸序列数据库http://www.ncbi.nih.gov/Genbank/
PROSITE蛋白质功能位点http://kr.expasy.org/prosite/
SWISS-MODEL从序列模建结构http://www.expasy.org/swissmod/SWISS-MODEL.html
SWISS-3DIMAGE三维结构图示http://us.expasy.org/sw3d/
DSSP蛋白质二级结构参数http://www.cmbi.kun.nl/gv/dssp/
FSSP已知空间结构的蛋白质家族http://www.ebi.ac.uk/dali/fssp/fssp.html
SCOP蛋白质分类数据库http://scop.mrc-lmb.cam.ac.uk/scop/
CATH蛋白质分类数据库http://www.biochem.ucl.ac.uk/bsm/cath/
Pfam蛋白质家族和结构域http://pfam.wustl.edu/**
(一)蛋白质一级数据库
1、 SWISS-PROT 数据库
SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库,目前这二个数据库在EMBL和GenBank数据库上均建立了镜像 (mirror) 站点。
SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT的序列数量呈直线增长。
2、TrEMBL数据库
SWISS-PROT的数据存在一个滞后问题,即把EMBL的DNA序列准确地翻译成蛋白质序列并进行注释需要时间。一大批含有开放阅读框(ORF) 的DNA序列尚未列入SWISS-PROT。为了解决这一问题,TrEMBL(Translated EMBL) 数据库被建立了起来。TrEMBL也是一个蛋白质数据库,它包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源,但这势必导致其注释质量的下降。
3、PIR数据库
PIR数据库的数据最初是由美国国家生物医学研究基金会(National Biomedical Research Foundation, NBRF)收集的蛋白质序列,主要翻译自GenBank的DNA序列。
1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database日本国家蛋白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息中心)合作,共同收集和维护PIR数据库。PIR根据注释程度(质量)分为4个等级。
4、 ExPASy数据库
目前,瑞士生物信息学研究所(Swiss Institute of Bioinformatics, SIB)创建了蛋白质分析专家系统(Expert protein analysis system, ExPASy )。涵盖了上述所有的数据库。
址:http://www.expasy.org
我国的北京大学生物信息中心(www.cbi.pku.edu.cn) 设立了ExPASy的镜像(Mirror)。
(二)蛋白质结构数据库
1、PDB数据库
实验获得的三维蛋白质结构均贮存在蛋白质数据库PDB(Protein Data Bank)中。PDB是国际上主要的蛋白质结构数据库,虽然它没有蛋白质序列数据库那么庞大,但其增长速度很快。PDB贮存有由X射线和核磁共振(NMR)确定的结构数据。
2、NRL-3D 数据库
NRL-3D(Naval Research Laboratory-3D)数据库提供了贮存在PDB库中蛋白质的序列,它可以进行与已知结构的蛋白质序列的比较。
3、HSSP数据库
对来自PDB中每个已知三维结构的蛋白质序列进行多序列列线(multiple sequence alignment)同源性比较的结果,被贮存在HSSP(homology-derived second structures of proteins)数据库中。被列为同源的蛋白质序列很有可能具有相同的三维结构,HSSP因此根据同源性给出了SWISS-PROT数据库中所有蛋白质序列最有可能的三维结构。
4、 SCOP数据库
要想了解对已知结构蛋白质进行等级分类的情况可利用SCOP(Structural classification of proteins)数据库,在该库中可以比较某一蛋白质与已知结构蛋白的结构相似性。
5、 CATH 数据库
CATH(Class, Architecture, Topology and Homologous superfamily)是与SCOP类似的一个数据库。
六. 结构预测相关程序及数据库
蛋白质预测分析 址集锦
物理性质预测
Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html
Peptidemasshttp://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://ftp.virginia.edu/pub/fasta/
SAPS http://ulrec3.unil.ch/software/SAPS_form.html
基于组成的蛋白质识别预测
AACompIdent http://expaxy.hcuge.ch … htmlAACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.embl-heidelberg.de/prs.html
二级结构和折叠类预测
nnpredict http://www.cmpharm.ucsf.edu/~nomi/nnpredict
Predictprotein http://www.embl-heidel … protein/SOPMA http://www.ibcp.fr/predict.html
SSPRED http://www.embl-heidel … prd_info.html
特殊结构或结构预测
COILS http://ulrec3.unil.ch/ … ILS_form.html
MacStripe http://www.wi.mit.edu/ … acstripe.html
蛋白质预测在线分析常用软件集锦
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!