宏病毒组是病毒的宏基因组,该技术是随着高通量测序技术的兴起而发展起来的。该技术主要是使用大量微生物群体样本的测序数据和生物信息学分析手段,以多种数据库为基础,进行群体的种类和功能分析。因此,它主要的应用场景在于微生物群体研究,如肠道微生物、皮肤微生物、口腔微生物、水体微生物、土壤微生物等。一直以来宏基因组技术都是在细菌领域使用,病毒的样本收集困难、文库构建繁琐、数据库不完善,因此宏基因组技术未能获得普遍应用。上海探普生物科技有限公司立志专门解决病毒方向的基因组研究难题,开发了整套的样本处理和生信分析流程,基于这套流程,研究者们想对样本进行宏病毒组测序就很容易实现了。宏基因组测序能够检测出新发和罕见病原体。河北宏病毒组分析
病毒宏基因组学中包含兆级的短序列片段(Reads)。通过不同的序列拼接软件将Reads拼接较长的DNA序列片断(Contigs)。数据组装可通过K-mer分析评估各个样品的测序深度,通过对SOAPdenovo设置不同K值,筛选较好组装结果,对较好组装结果进行校正,并统计Reads利用率。接着利用已测序生物体的DNA序列构建数据库,将拼接后的Contigs通过不同的鉴定方案,与数据库里的DNA序列信息进行比对,确定该序列来自的生物群落,筛选有用的基因信息。此外,还可以用一些工具对序列进行基因预测(如Metagene、GeneMark、FragGeneScan等)。长沙宏病毒学测序分析宏基因组测序逐步在临床上得到了很多的应用。
病毒宏基因组学的研究过程包括以下几个步骤:样品的处理、病毒宏基因组学文库构建和数据分析与处理。样品的制备较关键的是样品的处理、遗传物质的分离和富集。样品的制备关键应做到提取能够表示该环境的高纯度样本,并除去非病毒核酸细胞和遗传物质的干扰。富集微生物及去除非目的性的细胞和遗传物质是分离高质量的遗传物质的前提,提取高纯度的表示特定环境中的遗传物质是宏基因组学研究过程中的难题。正切流过滤系统、差异过滤、梯度离心、空心纤维过滤、DNA酶和RNA酶处理、序列非依赖的单引物扩增(Sequence-independentsingleprimeramplification,SISPA)等技术可用于样品的制备,而SYBR金染色法可用于实时监测处理样品中病毒颗粒的数量。
目前技术的进一步成熟,未来二代测序病原体检测应进一步在成本下降、诊断标准完善、质量控制提升等方面进行完善。同时应进一步增加大样本量的研究,以建立中国传染病原体宏基因组学检测的标准规范。对于怀疑神经系统急性传染的患者,如有条件,推荐在抽取脑脊液时同步留取2mL脑脊液标本保存于-16~20℃冰箱。在完成常规生物化学检查和培养之后,若3d内未获得明确的病原学依据且经验性抗传染无效,推荐对留存的脑脊液标本进行二代测序检测。若未留存标本,可重新采集标本(A,Ⅱ)。所谓宏基因组学就是一种以环境样品中的微生物群体基因组为研究对象。
探普生物对样本进行宏病毒组测序实验基于二代测序技术。经过核酸纯化-文库构建-生物信息学分析这3大基本流程后,样本转换成了序列数据。首先,在核酸纯化环节,探普提供专门针对病毒的核酸纯化样本指南,以提高纯度和得率,与此同时探普生物也提供核酸纯化服务。第二,文库构建环节。样本的核酸具备浓度低,总量少的特点。探普生物专门针对这一点开发了超微量核酸文库构建,可以将0.01ng/μl甚至更低浓度的核酸构建成测序文库。第三,生物信息学分析环节。寄生性质的生物下机数据一般都伴随大量的宿主和其他微生物的数据。探普生物基于该特点,优化了自有数据库,搭载了专门用的的生物信息学分析流程,可处理复杂背景下的目标物种序列。高通量测序技术问世,给微生物鉴别打开一扇新的大门。河北宏病毒组分析
传统Sanger测序相比,NGS技术的发展使得一个小的研究小组可以拥有大量病毒株的全基因组序列。河北宏病毒组分析
病原微生物二代测序也称宏基因组测序(mNGS)是目前临床上针对病原较常用的基因测序方法。通过对疑似传染标本采集提取后(无需培养)直接进行高通量测序,利用病原微生物数据库比对和分析后可以获得疑似致病微生物种属信息。基于NGS的宏基因组学检测技术在2014年被用于临床传染患者的病原学诊断。目前,多个省市已经将病原微生物二代测序纳入医保报销,助力病毒检测!目前,国家微生物科学数据中心数据资源总量已超过300TB,数据记录数超过了40亿条。可用于临床的微生物数据库包括了超过18000条信息。河北宏病毒组分析