原文:http://blog.csdn.net/shmilyringpull/article/details/7342246
生物信息学资料1,常用软件,酶切位点分析
一、生物信息学软件简介 (一)分类 机分析软件,如:winplas 线分析软件, 如:webcutter 物学数据库,如:NCBI, DDBJ, EBI (二)意义 1.分析和处理实验数据和公共数据,加快研究进度,缩短科研时间。 2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验。 3.用计算机管理实验数据。 |
(三)常用功能(核酸类) DNA 序列片断拼接—-Contig Express DNA序列测定图谱分析 分析mRNA开放读框 限制性酶切位点分析 DNA 模拟电泳 PCR 引物设计 RNA二级结构分析 |
常用功能(蛋白质类) 蛋白质一级结构分析(氨基酸分析) 蛋白质二级结构分析(结构域分析) 蛋白质三级结构分析(空间结构分析) 常用功能(共同类) DNA、蛋白质序列同源分析 进化树构建 常用功能(其它类) 质粒绘图类 图象处理软件 二、DNA 序列片断拼接(电子基因克隆) 得感兴趣的EST,在dbEST数据库中找出EST的最有途径是寻找同源序列,标准:长度≥100bp,同源性50%以上、85%以下。 后将检出序列组装为重叠群(contig),以此重叠群为被检序列,重复进行BLAST检索与序列组装,延伸重叠样系列,重复以上过程,直到没有更多的重叠EST检出或者说重叠群序列不能继续延伸,有时可获得全长的基因编码序列。 与GeneBank核酸数据库进行相似性检测,假如有精确匹配基因,将EST序列数据据EST六种阅读框翻译成蛋白质,接着与蛋白质序列数据库进行比较分析。 |
Vector NTI 5.2 中的contig Express Contig Express软件: Sequencer软件: ftp://genecodes.com/pub/SequencherPC.zip 三、DNA序列测定图谱分析 Chromas软件: http://www.technelysium.com.au/chromas230.exe |
四、限制性核酸内切酶位点的分析 (一)定义: 限制性核酸内切酶(restriction endonuclease) 识别DNA的特异序列,并在识别位点或其周围切割双链DNA的一类内切酶。即一类能识别双链DNA分子中特异核苷酸序列的DNA水解酶。 是细菌内存在的保护性酶。分为I、II、III三类。 其中的II类限制性核酸内切酶是重组DNA技术中的重要工具酶。 II类酶识别序列特点为回文结构,大多为 4~6 bp 回文结构(palindrome sequence), 如EcoRI 识别序列: n5’GAATTC 3’ 5’GGATCC 3’ |
|||||||||
限制性核酸内切酶命名 strong>Smith和Nathame命名原则(1973) 例如: 流感噬血杆菌d株 Hind Ⅲ Hind Ⅳ |
|||||||||
常用的限制性核酸内切酶酶切序列 限制酶 识别序列及切口 限制酶 识别序列及切口 Alu Ⅰ AG/CT Hind Ⅲ A/AGCTT BamHⅠ G/GATCC SalⅠ G/TCGAC BglⅠ A/GATCT SmaⅠ CCC/GGG EcoRⅠ G/AATTC
|
五、PCR 引物设计(包括杂交探针设计) (一)引物设计的原则 1.引物要跟模板紧密结合; 2.引物与引物之间不能有稳定的二聚体或发夹结构存在; 3.引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。 (二)引物设计需要考虑的因素 物长度(primer length), 物长度(product length), 列Tm值 (melting temperature), G值(internal stability), 物二聚体及发夹结构(duplex formation and hairpin), 误引发位点(false priming site), 物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。 (三)引物设计要点 般引物的长度为16-23bp,常用的长度为18-21bp,过长或过短都不合适。 物3’端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。 物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 物所对应模板序列的Tm值最好在72℃左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。 G值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。 般情况下,在Oligo 5.0软件的ΔG值窗口中,引物的ΔG值最好呈正弦曲线形状,即5’端和中间部分ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。 原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此5’端与中间段的ΔG值应较高,而3’端ΔG值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。 能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。 物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能进行。 引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。 |
(四)、引物设计软件的使用 荐使用自动搜索软件(商业软件): Primer Premier 5.0 荐使用引物评价软件(商业软件) : Oligo 6 其 址: http://www.oligo.net
计引物的免费在线软件Primer3,其 址: http://www-genome.wi.mit.edu/cgi-bin/primer/primer3.cgi 或http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi 我的评价: 是非常优秀的设计引物的软件! 是真正的“免费的午餐”! |
Winplas (商业软件) pDRAW32软件(商业软件),其 址: http://hjem.get2net.dk/acaclone,可以看到演示版和有关信息 Vector NTI (商业软件)
|
Plasmid processor 其免费下载的 址 http://www.hytti.uku.fi/%7Eoikari/plasmid.html MUP beta 其免费下载的 址 http://biosoft.im.ac.cn/down/dmup.zip Plasmid processor质粒作图软件是压缩软件,需要先将其解压到一个目录下(不需安装即可直接应 用),然后才能应用。(压缩文件是 络传输的最常用文件,目的是为了传输 方便); 1)在资源管理器中双击Plasmid.exe 文件(553kb),进入作图的界面; 2)点file–>new,在出来的对话框中填上Plasmid name和length,比如分别填 pBR322和4322(bp)(注意不能填4.322kb,否则软件不认识)。点击OK,进入 下一个界面,上面是一个圆,标着pBR322和4322bp。 3)点–>date–>restriction site加酶切位点,填酶的名称及定位; 4)点Date–>multiple–>Genes,填基因名称(如E6),位点在500至890处, 还是在此对话框中,选择右下角的style选所加基因的格式是箭头还是长的圆 弧等格式(根据喜好),选厚薄度(thichness),然后点击此对话框右上部分 的Add Gene,,在点击done,于是基因就加上了。基因和酶切位点可反复加多次。 5)但本软件缺陷之处上多克隆位点不能直接加,只能通过点–>date–> |
七、进化树分析软件 MEGA3.0:免费分子进化遗传分析软件 http://www.megasoftware.net Vector NTI:商业软件 Vector NTI Suit 同源比较—主窗口
|
随着人类基因组计划的开展,争夺有限基因资源的竞争日益激烈,利用 上软件分析未知序列,迅速得到尽可能多的信息显得尤为重要。仅仅在几年前, 上只零散地分布着一些功能简单的小程序用于新基因的鉴别,现在这些软件有了长足的发展。 目前,在国际上,一些优秀的软件根据功能归类被集中在一个 页上,极大地方便了使用。 http://bioinformatics.weizamann.ac.il/gdp/gdp.html |
http://www.bio-soft.net http://biosoft.im.ac.cn |
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!