一篇高质量的16s文章除了实验设计合理外,也需要在数据挖掘上下足功夫。在16s微生物群落数据分析中,我们一般遵循着从整体到精细、从群落结构差异到功能差异的分析思路。
一、功能分析的价值
在完成前期样本整体层面的物种组成、α多样性、β 多样性等分析之后,通过深入讨论样本中群落的功能,分析不同分组间群落存在的差异功能是一项必不可少的分析工作。功能分析在生物学价值上往往比单纯的物种组成分析更加重要,在组间差异区分上功能分析也有独特的意义。研究功能既能丰富文章研究内容、提升研究深度,也能为下游的菌群互作/响应机制研究提供了参考信息。
图1 16s 群落多样性研究分类
二、功能分析常见方法及原理
那么,功能分析究竟是怎么实现的,都有哪些方法进行功能分析?常见的功能研究方法可分为三类:
1.基于物种进行功能预测
2.功能基因扩增分析
3.宏基因组、宏转录组等全基因组扩增手段。
其中,16s 研究最常用的是第一类方法,基于预测软件,获得群落整体功能分类(pathway等)的大致分布,用于评估潜在的功能分布信息。这种功能分析方法成本低,只要有 16s 的测序数据就可以开展,不需要额外的数据进行补充。
基于物种进行功能预测的原理(图2),简单说来就是将测序、归类后得到的OTU 信息输入到预测软件中,预测软件将OTU序列信息与已测序的微生物基因组数据库中物种进行比对,将OTU注释为对应物种,并根据OTU的丰度输出功能类型以及对应功能丰度。
图2 功能预测软件的分析原理图示
三、PICRUSt 功能预测软件
因此,使用的预测软件以及软件所依赖的微生物基因组数据库在很大程度上决定了功能分析的成败。当前可供使用的软件有很多:PICRUSt、Tax4Fun、FAPROTAX、BugBase 等预测软件侧重方向不同,各有千秋。
其中,PICRUSt 预测软件在2013 年推出后受广大研究者青睐,这款软件依赖Greengene数据库,对输入的 OTU 信息进行比对,输出样本/分组的功能 count值信息(图 3)。通过对比研究发现在肠道微生物、土壤菌群等常规类型样本中,这种功能预测分析的结果与宏基因组测序获得的结果相当接近(部分样本相似度超过 95%),说明预测结果能很大程度上反映样本的功能基因组成。
图3PICRUSt1 软件分析原理示意
PICRUSt1软件依赖于G reengene数据库进行物种比对、功能数据输出。而Greengene数据库在 2013 年之后就停止了更新,距今为止已有7年。随着时间的推移,大量微生物基因组数据测序获得,而停止更新的Greengene数据库限制了PICRUSt 的功能预测范围。对于近年来测序获得微生物功能功能信息无法进行预测,满足不了当前的研究需求,成了这款软件的一块“短板”。
为了补上这块“短板”, PICRUSt 团队于近期升级了软件,正式公布了PICRUSt2。升级后的PICRUSt 软件不再依赖于Greengene 数据库进行比对,而是采用将待预测的 OTU代表序列置于软件中已有的系统发育树中进行物种注释,使用 IMG 微生物基因组数据进行功能信息的输出(图4)。
图4 PICRUSt 2 软件分析原理示意
PICRUSt2软件有着以下4个特点:
1.更加丰富的基因组信息
根据官方文献的 道,升级后数据库中可用于比对分析的基因组数据库扩增至上一版本的10 倍以上(图5),客观上提升了功能预测的精度水平。
图5 软件升级前后数据库规模对比[1]
2. 更加贴近实际环境的预测设置
PICRUSt2软件设置将待测OTU 序列输入至16s 参考序列进化树种进行基因家族拷贝数预测,而参考序列进化树可以根据不同样本类型(如肠道微生物、土壤微生物等)进行设置,自定义特定环境的参考数据库。
3. 更加严格的功能预测方式
4. 更广泛的使用范围
由于不再依赖于Greengene的 OTU 信息输入格式,使得PICRUSt2不但可以用于16s 细菌、古菌的功能预测,也可以用于18S、ITS真菌、藻类的功能预测。当前用于真菌、藻类的数据库正在不断升级更新,预计在不久的将来真菌、藻类预测能力也能达到16s的水平。
四、功能预测常见图形及工具
将PICRUSt2软件预测输出的功能数据进行整理分析,文章中常见的功能分析点为:功能总览、差异功能两方面内容,常见图形有柱形图、热图、箱型图等。通过柱状图、热图等展示各样本/分组的功能分布情况,阐述每个分组功能的特征等信息。之后,通过 T检验、秩和检验等方式判断组间差异功能,使用柱状图、箱型图的方式进行展现,阐述不同分组间处理效应带来的功能上的差异。
基迪奥生物Omicsmart微生物在线分析平台提供全面、准确的微生物群落分析服务。仅需上传下机的 16s去接头reads数据,就能全自动完成一整套微生物群落分析,并且可以根据您的分析需求调整相关流程质控参数、图形参数,点点鼠标就可以获得高质量的挖掘数据。升级后的PICRUSt2功能预测软件现已正式更新至Omicsmart平台!
图6Omicsmart 平台在线 告功能各分析模块
对这个功能强大的在线分析平台感兴趣吗? 扫描下方的二维码填写您的测序、分析意向,我们将从填写信息中 抽取20位,赠送价值500元的 Omicsmart VIP会员30天使用权限。Omicsmart的VIP会员拥有200G的超大存储空间,单个样本流程分析价格低至70元(市场价约350元)!赶快扫描下方二维码联系我们吧!
[1]Douglas G M, Maffei V J, Zaneveld J, et al. PICRUSt2: An improved and extensible approach for metagenome inference. bioRxiv, 2019.
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!