今天是第1174期日 。
QIIME 2: 全新微生物组分析平台在Nature Biotechnology正式发表
Nature Biotechnology
[IF:31.864]
发表于2010年的QIIME是基于Python2开发的微生物组领域高引分析流程,但在可重复、大数据方面无法满足当今需求; 为解决以上问题,由QIIME一作Gregory Caporaso发起的QIIIME2基于Python3编写了可重复、可扩展的全新微生物分析平台,79家单位112人参与; 目前平台支持扩增子、宏基因组和代谢组数据分析,未来将支持宏转录组、蛋白组; 平台分析过程可追溯、图表可交互、结果查看和分享方便,满足未来可重复分析和多人合作的要求。
QIIME:最高引的微生物组分析流程
Nature Methods
[IF:28.467]
2010年微生物组计划积累了海量数据,但分析工具有限; 一款基于Python的扩增子测序分析流程QIIME(读音chime)发布,是微生物生态学定量研究的缩写; 该流程实现从原始数据到发表级图表的全部分析,包括多样性、物种组成、差异比较、 络和核心物种等; 软件官 (qiime.org)提供16S/18S/ITS扩增子分析的教程和150+脚本满足不同数据类型的处理需求; 制定了多个行业标准,几十万字的帮助文档是学习和检索的资料库,推动了本领域的发展。
QIIME allows analysis of high-throughput community sequencing data
2010-05-01, doi: 10.1038/nmeth.f.303
mothur:引用过万跨平台的扩增子分析流程
Applied and Environmental Microbiology
[IF:4.077]
mothur是第一款整合了多种主流算法的独立扩增子分析流程,可实现从原始数据到OTU表、多样性、以及差异比较等分析; 整合的主要软件有比对工具NAST、OTU聚类DOTUR、群落比较SONS、UniFrac进化距离比较等工具,并实现了跨平台、多线程等众多优点; 软件包的最大优点是跨平台,允许用户在笔记本上几小时内完成分析; 但在上游处理不同数据类型和文库拆分,下游的统计和绘图仍需其它软件补充; mothur目前引用累计过万,且保持稳定增长。
Introducing mothur: open-source, platform-independent, community-supported software for describing and comparing microbial communities
2009-12-01, doi: 10.1128/AEM.01541-09
USEARCH: 引用近万最易上手的扩增子分析流程
Bioinformatics
[IF:4.531]
Search and clustering orders of magnitude faster than BLAST
2010-10-01, doi: 10.1093/bioinformatics/btq461
【主编评语】USEARCH由大神Robert C. Edgar单枪匹马开发的一款软件,整合了序列比对USEARCH、聚类UCLUST、嵌合体检测UCHIME、挑选代表性序列UPARSE、序列去噪UNOISE等众多流行算法,开发了200多种功能,可跨平台且体积小巧,可以完整实现扩增子分析全套流程,甚至包括机器学习、核心OTU鉴定等高级分析功能。截止2018年7月Google统计引用近万次,最新版11.0。虽然商业版价格不菲,但对于同行实验室经费允许还是推荐购买,节约学习时间成本,促进商业软件健康发展。中文系列教程详见:https://github.com/YongxinLiu/UsearchChineseManual(@刘永鑫)
VSEARCH:价值万元的64位USEARCH免费用
PeerJ
[IF:2.353]
VSEARCH: a versatile open source tool for metagenomics
05-29, doi: 10.7717/peerj.2584
DADA2: 去噪法鉴定扩增子测序中单碱基精度的代表序列(ASV)
Nature Methods
[IF:28.467]
DADA2是一个R包,可以实现Illumina扩增子测序数据的错误校正,获得单碱基精度的代表序列; 与经典OTU挑选算法UPARSE相比结果大部分一致,同时发现更多真实序列; 以阴道数据为例,DADA2可观察到6种卷曲乳酸杆菌序列变体在不同样品间存在差异; 基于高中低复杂度数据测试,DADA2与UPARSE、MED、Mothur和QIIME相比,可检测到最全的参考菌株序列,以及最少的假阳性结果; DADA2现己发展成为R语言的完整分析流程,也可在QIIME2平台中使用。
DADA2: High-resolution sample inference from Illumina amplicon data
2016-07-01, doi: 10.1038/nmeth.3869
UPARSE:OTU代表序列挑选最高引的算法
Nature Methods
[IF:28.467]
扩增子测序结果中存在大量测序错误、嵌合体等假阳性序列,导致过高估计物种数量; 其它OTU挑选方法均包含大于3%以上的错误碱基,而UPARSE挑选OTUs的碱基错误率小于1%; 以人工模拟群落数据测试,UPARSE结果最接近真实群落的物种数量; 基于人类微生物组数据集测试,UPARSE结果拥有最低的嵌合体比例; UPARSE算法可在USEARCH软件中通过clust_otu子命令实现一条命令完成聚类、去嵌合和挑选代表性序列的过程,被众多分析流程调用。
UPARSE: highly accurate OTU sequences from microbial amplicon reads
2013-10-01, doi: 10.1038/nmeth.2604
UCHIME:快而准的嵌合体检测方法
Bioinformatics
[IF:4.531]
在PCR扩增过程中会产生嵌合体,在扩增16S/ITS研究中尤为严重,导致高假阳性率和过高估计物种数量; UCHIME是一款嵌合体检测程序,可以从头或基于参考数据库鉴定嵌合体; 它比基于参考序列的ChimeraSlayer方法在短或噪音序列中表现更敏感,基于模拟群落数据从头鉴定比Perseus方法更敏感,且速度比这两种方法分别快1000倍和100倍; UCHIME可以作为独立的软件使用,也可以在USEARCH中实现,同时被众多扩增分析流程调用的必备分析步骤。
UCHIME improves sensitivity and speed of chimera detection
2011-08-15, doi: 10.1093/bioinformatics/btr381
【主编评语】Robert C. Edgar一作兼通讯的文章,也有行业第一高引大佬Rob Knight参与。2011提出了扩增子分析中嵌合体检测的新方法,一直延用至今,经久不衰。截止2019年7月Google学术统计引用高达6500多次。此步骤是扩增子分析中的必备环节,是众多扩增子分析流程调用的默认方法。关于嵌合体的介绍,参阅:http://www.drive5.com/usearch/manual/chimeras.html(@刘永鑫)
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!