宏基因组测序在新发腹泻病毒鉴定中的应用

写在前面

发现和鉴定新病毒以及确定新病毒与疾病的关系是预防、诊断和治疗新发病毒性传染病的首要任务。高通量测序技术突破了传统技术方法的局限，可以直接以标本中所有的遗传物质为研究对象，从而能够快速地鉴定出标本中存在的病毒，形成了一门研究特定环境中病毒群落的新兴学科：病毒宏基因组学(宏病毒组)。

背景

2010年入冬以来，猪流行性腹泻病毒(PEDV)变异株开始在我国流行，并导致全国范围内的严重爆发，初生仔猪感染后死亡率达90%以上; 随后，可导致仔猪腹泻的新型肠道冠状病毒Delta冠状病毒(PDCoV)也被发现；冠状病毒的高变异特性目前已经成为仔猪腹泻防控的难点，给养猪业造成巨大经济损失，对养猪业的发展形成严重威胁。2017年初开始，广东部分猪场先后暴发免疫猪群新生仔猪腹泻、死亡的案例，临床发病比PEDV稍晚、死亡率稍低，实验室检测排除了常见的几种猪腹泻相关病毒感染。

研究方法

病料收集与反饲

采集来自三个猪场的32头生病仔猪排泄物用于检测常规的猪腹泻相关病毒和进行反饲实验。将20头5日龄仔猪分为四组，每组五头，其中三组实验组分别饲喂采集自三个猪场的病猪排泄物，每头饲喂5ml排泄物，一组作为对照。在接种后三天和五天每组分别剖杀2头猪进行尸检。

文库构建

将剖杀仔猪的小肠及肠道内容物制成匀浆并进行过滤，取上清用于RNA提取。提取的RNA在进行去除DNA和核糖体RNA后，通过体外随机引物反转录进行建库，测序在Illumina HiSeq平台进行。

图2 基于宏转录组测序鉴定病原及基因组组装流程

基因组注释

获得的病毒全基因组序列通过在ORF finder 站(https://www.ncbi.nlm.nih.gov/orffinder/) 进行在线的开放阅读框预测，查找潜在的蛋白编码片段。我们设定最小的开放阅读框大小为150 bp，并忽略嵌套存在的开放阅读框，其他为默认参数设置。

研究结果

使用二代测序数据质量质控软件cutadapt 1.9.1对测序原始数据去除接头以及低质量序列等，得到后续可用序列170,654,027条干净数据，平均读长为125 bp，Q20以上的数据比例为96%左右。其中99.5%的序列通过短序列比对软件bwa可以比对到猪的参考基因组susScr3上。

将不能匹配到宿主基因组上的0.5%的序列筛选出来，其中相当一部分可能是疑似病原的序列。我们将这些序列利用wgs-assembler软件进行拼接，共获得了131,070个拼接片段。借助在线的BLAST分析，发现其中一部分拼接片段（3%左右）与HKU2病毒相似性较高。我们以HKU2/GD/430/2006株的基因组作为参考基因组（Lau et al. 2007），将序列进行匹配，最终可以有效覆盖基因组的98.3%，覆盖度为1051X。利用samtools软件我们生成了初始的疑似病原基因组序列。目前该全基因组序列已经提交到NCBI数据库（MF167434），我们将该病毒命名为猪肠道Alpha冠状病毒（PEAV）。在不计算其3’末端多聚腺苷酸尾巴的情况下，其全长为27,171 nt。

通过ORF finder软件对PEAV基因组进行开放阅读框预测，发现了10个可能的阅读框，包括ORF1a， ORF1b， S， E， M， N， NS3， NS7a等（图3）。其注释的ORF信息与HKU2比较类似，除了ORF3和ORF10外。共有的开放阅读框序列的核苷酸相似性为80%到98%，氨基酸相似性为87%到100%。

学习16S扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

EID：宏基因组测序在新发腹泻病毒鉴定中的应用