点击阅读原文观看视频!后台回复“王金锋”获得视频和讲稿下载链接。
用微生物组时序数据重现生物膜装配动态过程
主讲人介绍
横断数据或也称为剖面数据(cross-pal data),就是对单一时间点进行采样分析,例如对分娩前的孕妇的口腔、皮肤等多个部分进行微生物测序,这就是剖面的研究。
随着微生物组的研究,剖面数据发展为时序数据也称为纵向数据,纵向数据是针对同一个体进行多时间点采样而获得的数据,例如新生儿从出生时到出生后四个月的随访研究就是纵向数据。
时序数据能够描绘事物不同特征(菌群丰度、多样性)随时间变化的规律,也能更清晰地展现不同状态(健康或疾病)之间的转换情况,并根据之前的特征预测某些状态未来的发展。
追踪口腔生物膜的菌群动态
我们把口腔作为消化道入口,它的微生物种类和数量都比较丰富。早先普遍认为在胃酸屏障下,口腔微生物无法进入肠道。但近几年的研究发现口腔对肠道微生物的输送是持续的、频繁的。
研究消化道入口菌群动态的意义2
于是针对以上问题开展基于洗牙前后唾液和牙菌斑的时序数据对口腔微生物的组成影响的研究。
微生物在口腔的存在形式大致分为两种:一种是游离态,即存在在唾液中的微生物;一种附着态,例如牙菌斑。
通常通过洗牙来清除牙菌斑,但是洗牙后过一段时间又会产生牙菌斑,这段时间就是牙菌斑重新堆积的过程。基于此,研究9名成人在洗牙前后11个时间点的微生物群落变化,这是一个典型的时序数据分析。
微生物组成Alpha多样性
之后通过距离来查看菌群结构随时间变化的情况。
唾液菌群的多样性在整个采样周期低于牙菌斑菌群的多样性且基本保持平稳。牙菌斑菌群的个体间相似度在洗牙后3d最大,这与alpha多样性结果对应 (左下图)。
比较不同时间点和洗牙前进行比较,可以看到牙菌斑菌群在洗牙后7h-3d而非1h-4h,与洗牙前群落结构差异最大,之后的时间段里群落结构差异逐渐缩小,特别是3个月的时候和洗牙前就很相似了。
Bray-curtis距离进行PCoA分析
在OTU水平将前一个时间点作为源,后一个时间点作为汇,对每一个时间点的菌群进行溯源。结果显示微生物补充的方向主要是从唾液到牙菌斑,图中灰色的部分是不确定的外源,可以看到牙菌斑的所有时间点都进行了微生物的补充,洗牙后7h-7d、7d-1m的两个时间段的增幅较为明显,特别是前一个时间段,而唾液的外源微生物补充极少。
细菌丰度展现出的时间动态
左边的热图可以看到通过对时间段进行聚类能把所有时间点分为三个阶段,洗牙后的0 h至7 h、洗牙后1天到7天、洗牙后2 w到3 m和洗牙前这三个阶段。
右边的热图展示的是不同时间点与洗牙前相比丰度存在显著差异的菌,蓝色表示显著减少,红色表示显著增加,数字表示P值。可以看到与洗牙前相比,不同的菌在不同发育阶段的变化模式不尽相同——如多数菌在中后期已经恢复、卟啉单胞菌一直没有完全恢复、链球菌等只在中期显著增加。
不同发育阶段的微生物互作
-
研究了外力扰动(洁牙)时,崩解的口腔生物膜恢复到初始状态的过程,明确了其发生、发展和成熟三个时期的准确时间跨度。
-
揭示了口腔菌群的动态变化规律,为评估它们作为标志物的稳健性提供了新方法。
微生物组的时序数据的计算
针对上述提到的数据,可以将人群划分成不同的年龄段,然后计算微生物多样性随人群年龄增长变化的模式、比较组内同一年龄段个体间菌群的相似性、分析组间不同年龄段群体菌群的变化幅度。
比如这里的alpha多样性结果,每10岁是一个时间段,能看到随着年龄的增加微生物先增加后减少,而beta多样性也可以看到这样一个趋势。
Sourcetracker是基于贝叶斯模型的实现溯源的一个R包。
Sourcetracker使用方法
利用Feast溯源
桑基图是一个很好展示群落状态类型或群落门类随时间转换的形式。另一个是马尔科夫链,比如右图展示了随孕周增长,孕妇菌群各种群落状态类型(Community State Type)的自转率和它转率。线条粗细表示转换率高低。
桑基图和马尔科夫链绘制方法
虽然上文介绍的共存 络是一个无向 络,但是时序数据也可以用LSA来构建有向 络来推测 络在时间序列中的变化。
预测菌群状态的发展方向
-
以口腔生物膜菌群数据为例,通过追踪洗牙前后牙菌斑堆积来解析群落的重建过程,分享典型时序微生物组研究的分析思路及内容。
-
介绍菌群的多样性、相似性、聚簇、共存 络等常规分析手段在时序微生物组计算中的应用。
-
讲述如何依靠分组以及对同一批数据进行不同的分组比较和距离计算,来衡量菌群相似程度随时间梯度的变化,寻找群落结构高变或剧烈波动的时期。
-
在连续时间点的纵向研究中引入贝叶斯、马尔科夫链和机器学习算法,向大家推荐这些分析涉及到的计算工具及其使用方法。
刘永鑫老师总结亮点
-
时序数据分析可以应用处理公共大数据
-
可以对时序数据继续进一步分组,可能会发现更有意思的点
提问
-
Q: 络分析问题:样本通过聚类分为3个时间阶段,是对这3个时间阶段分别绘制 络吗是分别绘制的 络,那怎么把三个 络结果最终绘制成一个 络呢是对这3个时间阶段分别绘制 络。手动使用AI进行合并,可以选一个时间阶段对应的微生物属水平共存 络,再把剩下两个阶段的微生物属水平共存 络添加进去。另外也是由于通过相关系数筛选后,一般每个细菌最多与其他四个细菌相关,绝大多数是与一到两个细菌相关,所以很容易进行合并
-
Q:同一个生态位/生物膜有很多细菌呈现相似的功能,怎么通过 络展示这些细菌的关系等一个方式是做共线性 络,其实现原理是填入细菌或删除细菌来查看 络的变化;还有些方法是基于实验,例如将3,5种分离株或细菌混成一个个小的群落来看其变化。
-
Q:缺失数据是如何进行处理的缺失数据是没有获得这些数据,有些可能只缺了唾液,但是洁牙后其他时间点的数据都是有的,有的话就可以在后续分析中使用。
-
Q:时间序列检验一般用配对检验,但是因为数据存在缺失,所以会用秩和检验吗缺失就用秩和检验吗嗯,这篇文章主要就是用的秩和检验。
-
Q:怎么得到出PPT中热图展示的这23个菌每个时间点和洗牙前相比有丰度显著差异的属。
-
Q:分析中有没有校正了年龄、性别、饮食等因素校正有什么方法吗本批数据来自9个人的洁牙后11个时间阶段的数据,数据本身就比较难采集就没有收集更多的数据进行校正。
-
Q:随机森林怎么通过时间点1来预测时间点2依据目前的已知的时间点和菌群来训练模型,类似于横断数据使用随机森林的方式。用的先前时间点的数据预测其后时间点的数据状态。
文章对应链接Gut:北京生科院赵方庆团队揭示人体口腔菌群的稳定性和动态变化规律
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
文章知识点与官方知识档案匹配,可进一步学习相关知识OpenCV技能树首页概览11325 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!