linux分析测序数据,16S测序分析系列(一)菌属丰度表获取

软件准备

Linux环境:

1.       FastQC

质检下机数据

2.       Cutadapt

切除测序引物

3.       QIIME2

序列拼接、质控、比对、注释

软件版本:QIIME2 2018.4或QIIME2 2018.8

Windows环境:

1.       Filezilla

下载Linux环境中的数据或上传数据到Linux环境

2.       Excel

数据处理

3.  QIIME2 view

查看QIIME2输出的以.qzv为后缀的文件

数据准备

1.  Miseq 16S amplicon V3V4测序下机数据

*R1.fastq,*R2.fastq

2.  测序引物

p1 -> CCTACGGGNGGCWGCAG

p2 -> GACTACHVGGGTATCTAATCC

3.  表型文件metadata.txt

准备存放样本信息的表型文件,以tab键为分隔符。可以先在Excel中做表,然后保存为tsv文件。

格式如下:

流程概览

2. Cutadapt切引物

2.1. 检查引物的位置和序列

位置:5’端

序列:p1 -> CCTACGGGNGGCWGCAG; p2 -> GACTACHVGGGTATCTAATCC

2.3.   质检

Reads起始端质量明显提高,末端的低质量碱基可利用下面的DADA2来处理

4. 用DADA2进行切割、去嵌合体、拼接等

4.1. 使用10个线程运行DADA2

为保证碱基质量这里再次要对Reads进行切割。Reads起始端质量很高时N1 N2设为0即可;观察manifest.qzv确定reads1_cutpoint和reads2_cutpoint,这里我将其分别设为275和250。

qiime dada2 denoise-paired

–i-demultiplexed-seqs manifest.qza

–p-trim-left-f N1

–p-trim-left-r N2

–p-trunc-len-f reads1_cutpoint

–p-trunc-len-r reads2_cutpoint

–o-table table.qza

–o-representative-sequences rep-seqs.qza

–o-denoising-stats denoising-stats.qza

–p-n-threads 10

此步骤会生成三个新文件:

denoising-stats.qza是质检统计,如下表;

table.qza是细菌特征丰度表;

rep-seqs.qza是细菌特征代表性序列

4.2. DADA2统计结果可视化

qiime metadata tabulate

–m-input-file denoising-stats.qza

–o-visualization denoising-stats.qzv

最后一列是Clean data,它将被用于下游分析

7.2. 标准化菌属丰度表

把CSV文件导入到Excel中进行标准化,即每个菌属的原始丰度除以该菌所在样本的总菌属丰度得到标准相对菌属相对丰度

处理方法如下:

cf8ca1360e956a619b81fd78c260c8e2.png

以上就是我个人总结的“从Miseq测序数据中快速提取出可以用来统计分析的菌属相对丰度表”全部工作流程,如有问题可以留言交流,以后会继续推出“如何利用该菌属相对丰度表进行统计分析”的文章,如有兴趣可以关注。

文章知识点与官方知识档案匹配,可进一步学习相关知识CS入门技能树Linux入门初识Linux24717 人正在系统学习中 相关资源:顺丰快递单打印软件2.7可支持自定义快递模板-物流工具类资源-CSDN…

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年4月11日
下一篇 2021年4月11日

相关推荐