DIAMOND: 超快的蛋白序列比对软件

相见恨晚，还好遇到了它

今天用BLASTX将我的转录本序列在UniProt蛋白数据库(700w条序列)中搜索，80个线程，过了1小时大概就分析1000条吧。实在是有点慢，于是我想到之前耳闻的DIAMOND，据说速度非常快，于是我测试了下。没想到，这工具居然那么快。

根据DIAMOND介绍，它有以下特点

我就看中它一点，速度快。

软件安装异常的简单，因为提供了预编译的64位可执行文件

因为 diamon的功能就是将蛋白或者翻译后的核苷酸和蛋白数据库进行比对，没有BLAST那么多功能，所以软件使用也是异常的简单。

第一步: 先从NCBI上下载蛋白数据库。 NR库是NCBI的非冗余蛋白数据库，

也可以从ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plant/下载植物的蛋白数据库

第二步: 建库。就两个参数，输入文件，输出的数据库前缀

第三步: 搜索。就两个子命令，blastp和blastx，前者比对蛋白，后者比对DNA序列

输入检索序列，输出文件，默认以输出结果和BLAST+的结果一致。

注意事项:

性能优化:

参考文献

Benjamin Buchfink, Chao Xie, and Daniel H. Huson. Fast and sensitive protein alignment
using diamond. Nature methods, 12(1):59–60, Jan 2015.

扫码即刻交流

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！