linux Centrifuge 纳米孔测序 微生物 16S全长
EPI2ME在线 站处理
差不多2021.6这之前不用注册,后面要注册了。而且只对购买仪器的开发-555-
操作流程官方学习 站github
操作流程官方学习 站Centrifuge指南
官 也描述到用Centrifuge分类物种
本地服务器处理如下流程:
① 拿到公司提供给你fastq格式文件,进行barcode和质量过滤,裁剪,这部分参考宏基因组处理吧。我自己用了NanoFilt处理,FastQC质量评估
② 下载安装 github下载
络不行就直接下载,解压后,拉进去服务器,体积小,很快。
切换到拉进去的文件夹 设置安装在的目录 /home/XXX/
设置PATH环境变量,也是启动软件的命令
③ 根据需求下载参考的序列的数据库 indexes下载地址
下面画红色的地方,找到你对应要的,16S直接右边的bacteria
== 建议用迅雷破解版的等等下载,15M每秒,比较快==
bug提示,需要变量需要character
⑦ result.tsv的理解:readID重复的次数等于numMatches的个数(所以我们提取result的 告需要将numMatches全部转化成1);seqID对应准确的taxonomy(但readID的hit是不同的,通过过滤hit,将相同的taxonomy合起来),而相同的readID对应不同的seqID(注意他们的hit是相同的,这里说明序列可能错误比对上多个物种的可能,而numMatces说明这个序列seqID比对上的多个,{下图3},说明分配到种水平是不准确的,只能处理到属水平)
所以需要将numMatches全部转化成1。然后在seqID匹配上taxonomy。
继续⑦, 去掉重复匹配到多个种水平的序列后,==测序量的read序列数。24690
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!