宏基因组测序在新发腹泻病毒鉴定中的应用
写在前面
发现和鉴定新病毒以及确定新病毒与疾病的关系是预防、诊断和治疗新发病毒性传染病的首要任务。高通量测序技术突破了传统技术方法的局限,可以直接以标本中所有的遗传物质为研究对象,从而能够快速地鉴定出标本中存在的病毒,形成了一门研究特定环境中病毒群落的新兴学科:病毒宏基因组学(宏病毒组)。
背景
2010年入冬以来,猪流行性腹泻病毒(PEDV)变异株开始在我国流行,并导致全国范围内的严重爆发,初生仔猪感染后死亡率达90%以上; 随后,可导致仔猪腹泻的新型肠道冠状病毒Delta冠状病毒(PDCoV)也被发现;冠状病毒的高变异特性目前已经成为仔猪腹泻防控的难点,给养猪业造成巨大经济损失,对养猪业的发展形成严重威胁。2017年初开始,广东部分猪场先后暴发免疫猪群新生仔猪腹泻、死亡的案例,临床发病比PEDV稍晚、死亡率稍低,实验室检测排除了常见的几种猪腹泻相关病毒感染。
研究方法
病料收集与反饲
采集来自三个猪场的32头生病仔猪排泄物用于检测常规的猪腹泻相关病毒和进行反饲实验。将20头5日龄仔猪分为四组,每组五头,其中三组实验组分别饲喂采集自三个猪场的病猪排泄物,每头饲喂5ml排泄物,一组作为对照。在接种后三天和五天每组分别剖杀2头猪进行尸检。
文库构建
将剖杀仔猪的小肠及肠道内容物制成匀浆并进行过滤,取上清用于RNA提取。提取的RNA在进行去除DNA和核糖体RNA后,通过体外随机引物反转录进行建库,测序在Illumina HiSeq平台进行。
图2 基于宏转录组测序鉴定病原及基因组组装流程
基因组注释
获得的病毒全基因组序列通过在ORF finder 站(https://www.ncbi.nlm.nih.gov/orffinder/) 进行在线的开放阅读框预测,查找潜在的蛋白编码片段。我们设定最小的开放阅读框大小为150 bp,并忽略嵌套存在的开放阅读框,其他为默认参数设置。
研究结果
使用二代测序数据质量质控软件cutadapt 1.9.1对测序原始数据去除接头以及低质量序列等,得到后续可用序列170,654,027条干净数据,平均读长为125 bp,Q20以上的数据比例为96%左右。其中99.5%的序列通过短序列比对软件bwa可以比对到猪的参考基因组susScr3上。
将不能匹配到宿主基因组上的0.5%的序列筛选出来,其中相当一部分可能是疑似病原的序列。我们将这些序列利用wgs-assembler软件进行拼接,共获得了131,070个拼接片段。借助在线的BLAST分析,发现其中一部分拼接片段(3%左右)与HKU2病毒相似性较高。我们以HKU2/GD/430/2006株的基因组作为参考基因组(Lau et al. 2007),将序列进行匹配,最终可以有效覆盖基因组的98.3%,覆盖度为1051X。利用samtools软件我们生成了初始的疑似病原基因组序列。目前该全基因组序列已经提交到NCBI数据库(MF167434),我们将该病毒命名为猪肠道Alpha冠状病毒(PEAV)。在不计算其3’末端多聚腺苷酸尾巴的情况下,其全长为27,171 nt。
通过ORF finder软件对PEAV基因组进行开放阅读框预测,发现了10个可能的阅读框,包括ORF1a, ORF1b, S, E, M, N, NS3, NS7a等(图3)。其注释的ORF信息与HKU2比较类似,除了ORF3和ORF10外。共有的开放阅读框序列的核苷酸相似性为80%到98%,氨基酸相似性为87%到100%。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!