CN112967753A

CN112967753A - 一种基于纳米孔测序的病原微生物检测系统和方法

Info

Publication number: CN112967753A
Application number: CN202110213898.0A
Authority: CN
Inventors: 龚浩; 杨仁涛; 吴雅欣; 陈澎明; 王东生; 詹太平; 蒋华
Original assignee: Meige Medical Laboratory Guangzhou Co ltd
Current assignee: Guangzhou Jingwei Medical Technology Co ltd
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2021-06-15
Anticipated expiration: 2041-02-25
Also published as: CN112967753B

Abstract

本发明公开了一种基于纳米孔测序的病原微生物检测系统和方法，属于微生物检测技术领域。所述病原微生物检测系统包括：数据输入模块；数据库存储模块；病原微生物鉴定模块；结果输出模块。利用本发明的系统和方法，可快速分析样本中的细菌、真菌、病毒、寄生虫等病原体。其具有测序读长较长、序列读取快速准确等特点，可实现临床感染POCT检测需求。同时因其长度长的特点，可通过测序数据分析病原体对应的毒力及耐药基因。可有效辅助临床感染诊疗。

Description

一种基于纳米孔测序的病原微生物检测系统和方法

技术领域

本发明属于微生物检测技术领域，具体地，涉及一种基于纳米孔测序的病原微生物检测系统和方法。

背景技术

一代测序方法，可通过检测核酸序列，进行生物种类的鉴定，其优点准确性高，缺点是通量低。

二代测序方法，也称下一代高通量测序技术(Next Generation Sequencing，NGS)，其可一次性对几百万到十亿条DNA分子进行并行测序，是一组较一代测序通量更高、成本更低、用时更短且自动化程度更高的测序技术。

宏基因组(Metagenome)，即环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因，目前主要指环境样品中的细菌和真菌的基因组总和。宏基因组测序(mNGS)用于分析环境样品中存在的所有DNA或RNA信息，从而能够分析整个微生物组。

二代测序方法的应用让mNGS研究成为可能，以环境样品中的微生物群体基因组为研究对象，以功能基因筛选和/或测序分析为研究手段，对微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系进行研究。

病原宏基因组检测，是一种基于宏基因组测序技术的病原体检测方法。其不依赖于传统的微生物培养，直接对临床样本中的核酸进行高通量测序，然后与数据库进行比对分析，根据比对到的序列信息来判断样本包含的病原微生物种类，能够快速、客观的检测临床样本中的较多病原微生物(包括病毒、细菌、真菌、寄生虫)，且无需特异性扩增，尤其适用于急危重症和疑难感染的诊断。目前以神经系统感染和呼吸系统感染为主要应用方向。

由于目前该检测方法一般采用二代测序技术，主要有以下两大难题有待解决：

1.分析方法复杂，结果的判断和解读困难。由于NGS检测往往可以得到大量背景或者无关微生物片段，从中寻找或识别责任病原极为关键。

2.检测配置中心化和时效性。二代测序技术实验环节对环境要求高，测序仪体积大(多为台式)、成本高，并且需要配备专业的生物信息学分析团队，需要在专业化高的实验室进行，往往以检测中心的形式开展检测项目。实际检测过程需要经过样本采集、运送、收样、实验、上机测序、数据分析、报告出具等众多环节，尤其是从采样地点(通常为医院)到检测中心的样本运送过程占据了较多的时间。有限的检测中心难以临近众多采样地点，运输耗时随着采样地点与检测中心的距离增加而延长，严重影响检测时效性。然而，病原宏基因组测序往往用于急危重症病例，对时效性要求非常高。同时运输过程具有很大的不确定性，容易产生对样本降解、受污染等情况，影响检测质量。

纳米孔测序方法，相对于NGS，同样具有高通量的特点，其优势在于测序长度更长(纳米孔测序为几十到数百kb，NGS为数百bp)，测序仪器更小巧(手持式)；其缺点在于碱基错误率高(纳米孔测序碱基错误率为20％左右，而NGS以Illumina 测序仪为例，碱基错误率为1％以下)，测序成本较NGS更高。

发明内容

为了解决上述技术问题中的至少一个，本发明采用的技术方案如下：

本发明第一方面提供一种基于纳米孔测序的病原微生物检测系统，包括：

数据输入模块，用于接受样本基于纳米孔测序的原始序列集和样本信息的输入，并用于对所述原始序列集进行质控，得到高质量序列集；

数据库存储模块，用于存储病原微生物数据库；

病原微生物鉴定模块，分别与数据输入模块和数据库存储模块连接，用于将所述高质量序列集与所述病原微生物数据库进行多次比对，每次比对利用不同的参数，针对每次比对结果，过滤掉不能比对到所述病原微生物数据库的序列，得到不同的比对序列集，所有比对序列集的交集为病原微生物序列集，将病原微生物序列集及其相应的病原微生物信息作为病原微生物鉴定结果；

结果输出模块，与所述病原微生物鉴定模块连接，用于输出病原微生物鉴定结果。

在本发明中，基于纳米孔测序技术的病原微生物检测，具有以下特点：

1.其分析原理主要为检出序列与病原数据库序列整体一致性的比对分析，而非单碱基突变的分析，所以，当测序序列更长时，对一致性判断更为有效，其碱基错误率对的判断的影响也会降低；

2.当测序长度更长时，经过多种技术层面的优化后，可使其获得高可信度病原序列的几率随之提升，从而使单个样本的所需测序数据量更低，进而使测序成本明显降低；

3.同时，随着高可信度病原序列出现几率的提升，背景或者无关微生物片段的比例则会降低，从而降低结果的判断和解读难度。

在本发明的一些实施方案中，所述基于纳米孔测序的原始序列集是通过以下方法获得的：

(1)获得所述样本的核酸样本，并获得高质量的测序文库；

(2)基于所述高质量的测序文库，利用纳米孔测序平台进行测序，获得所述基于纳米孔测序的原始序列集。

在本发明中，所述病原微生物是指可以侵犯人体，引起感染甚至传染病的微生物，或称病原体。病原微生物指寄生虫(原虫、蠕虫、医学节肢动物)、真菌、细菌、螺旋体、支原体、立克次体、衣原体、病毒。

在本发明的一些具体实施方案中，步骤(1)的具体步骤如下：采用试剂盒进行提取、核酸质检、建立文库，其中，所述建立文库是指：加入内参序列；测DNA两侧先加上A碱基，使平末端变成粘性末端，然后再加上Y接头以及马达蛋白，并对建立的文库进行质检，得到所述高质量测序文库。

在本发明的一些具体实施方案中，利用Nanopore MinION测序仪进行测序，并利用配套的MinKNOW软件获得所述基于纳米孔测序的原始序列集，以达到控制仪器，测序与实时碱基识别，检测运行状态，数据采集等目的。

在本发明的一些实施方案中，所述样本信息包括但不限于样本类型、重点关注的物种和文库质量信息。

在本发明的一些实施方案中，所述数据输入模块根据所述基于纳米孔测序的原始序列集和所述样本信息，参照包括但不限于所述样本类型和所述重点关注的物种而自动选择数据质检方案，并自动调整处理和过滤参数。

在本发明的一些具体实施方案中，所述自动选择数据质检方案具体如下：

所述样本信息包括但不限于样本类型、检测项目、关注的病原体类型、抗菌素的使用、文库信息，及它们之间的关系；

所述数据质检参数，包括但不限于数据量、序列平均长度、最小质量值；

将各所述样本信息类型与数据质检参数的对应关系输入数据库；

质检前，根据样本信息从数据库中调取对应的数据质检参数，并将同类型的数据质检参数进行整合，得到样本信息对应的最适参数组合，形成数据质检方案。

在本发明的一些实施方案中，利用fastqc软件对所述基于纳米孔测序的原始序列集进行质检；并利用fastp软件对所述基于纳米孔测序的原始序列集进行质控，过滤不合格的序列，得到所述高质量序列集。任选地，所述质控为质检、低质量碱基过滤和接头过滤。

在本发明的一些实施方案中，所述病原微生物数据库包括病原微生物参考序列数据库和病原微生物注释数据库。

任选地，所述病原微生物参考序列数据库为非关系型的。在本发明的一些具体实施方案中，所述病原微生物参考序列数据库可以是或包括任意本领域技术人员知悉的包含病原微生物基因组序列的数据库，如NCBI公开数据库和KEGG数据库，包括但不限于细菌数据库、真菌数据库、DNA病毒数据库、RNA病毒数据库、质粒数据库和医学寄生虫数据库，该数据库能够随着网站公开信息的更新而随之更新。在本发明的另一些具体实施方案中，所述病原微生物参考序列数据库进一步去除了重复冗余或完整性较低的序列及物种相关信息。

在本发明的一些实施方案中，病原微生物参考序列数据库作为应用层级，用于比对。

在本发明中，数据库存储模块针对微生物宏基因组检测项目数据的特征，有效地整合了各个病原微生物宏基因组检测项目的项目信息、病例信息、文库信息、数据信息及测序和比对结果信息，建立可支持参考序列注释自动搜索、根据参考序列自动补充注释、根据注释列表自动补充参考序列，进而实现对海量病原体参考序列及注释数据的管理与应用，能够实现数据的自动载入、查询、下载、修改、统计的管理与应用的数据库管理。

任选地，所述病原微生物注释数据库为关系型的。在本发明的一些具体实施方案中，所述病原微生物注释数据库中所述注释包括但不限于基因组大小、致病性、人体常见部位。

在本发明的一些优选实施方案中，所述病原微生物参考序列数据库和病原微生物注释数据库可以自动或者手动进行更新，从而进一步丰富所述的微生物多数据库系统内容，生成一个更易于搜索、更有利于物种比对的病原微生物数据库。在本发明的一些更优选实施方案中，所述更新可以是定期也可以是不定期。

在本发明的一些实施方案中，在所述病原微生物鉴定模块中，所述比对采用minimap2算法，该算法能够快速将DNA或者mRNA序列比对到所述参考序列上。

在本发明的一些实施方案中，所述多次比对为二次比对，包括第一比对和第二比对，第一比对将所述高质量序列集利用第一参数与所述病原微生物数据库进行比对，能够比对上病原微生物数据库的序列为第一序列集，统计得到第一序列集比对到的第一病原微生物信息；第二比对将所述高质量序列集利用第二参数与所述病原微生物数据库进行比对，能够比对上病原微生物数据库的序列为第二序列集，统计得到第二序列集比对到的第二病原微生物信息，将第一病原微生物信息和第二病原微生物信息的交集作为病原微生物鉴定结果。

在本发明的一些实施方案中，所述病原微生物鉴定结果包括物种信息、物种reads数目、reads占该物种比例、覆盖度、深度和物种相对富集丰度。

在本发明中，

所述“物种reads数目”是指比对到该病原微生物物种的片段数。

所述“reads占该物种比例”是指对比上的该病原微生物序列片段数占比对上同类型病原微生物的总序列片段数的比例。

所述“覆盖度”是指测序序列覆盖长度占具有参考序列大小的比例。

所述“深度”是指测序得到该物种的bases数与参考基因组大小的比值。

所述“物种相对富集丰度”是指该物种存在于样品中的相对数量及其相对比例。

在本发明的一些实施方案中，所述病原微生物鉴定模块还对病原微生物鉴定结果进行验证：将所述病原微生物序列集进行在线BLAST比对，利用比对一致性和查询序列覆盖度信息剔除假阳性结果。在本发明的一些具体实施方案中，所述BLAST比对为BLASTN比对。

在本发明的一些实施方案中，所述病原微生物数据库还包括样本归纳信息数据库。任选地，所述样本归纳信息数据库是关系型的。在本发明的一些具体实施方案中，所述样本归纳信息数据库包括多个样本进行病原微生物检测后得到的病原微生物鉴定结果，该数据库初始时为空白数据库。为此，所述结果输出模块与数据库存储模块连接，用于将所述病原微生物鉴定结果输出至所述病原微生物数据库中，构建或更新所述样本归纳信息数据库。

本发明的第二方面提供一种基于纳米孔测序的病原微生物检测方法，包括以下步骤：

S1，构建病原微生物数据库，包括病原微生物参考序列数据库、病原微生物注释数据库；

S2，获得样本的纳米孔测序的原始数据和样本信息，对所述原始序列集进行质控，得到高质量序列集；

S3，将所述高质量序列集与病原微生物数据库进行多次比对，每次比对利用不同的参数，针对每次比对结果，过滤掉不能比对到所述病原微生物数据库的序列，得到不同的比对序列集；

S4，将所有比对序列集的交集作为病原微生物序列集，将病原微生物序列集及其相应的病原微生物信息作为病原微生物鉴定结果。

在本发明的一些实施方案中，所述方法进一步包括对所述病原微生物鉴定结果进行验证的步骤：

S5，将所述病原微生物序列集进行在线BLAST比对，利用比对一致性和查询序列覆盖度信息剔除假阳性结果。

在本发明的一些实施方案中，所述方法进一步包括以下步骤：

S6，利用所述病原微生物鉴定结果构建样本归纳信息数据库，并成为所述病原微生物数据库中的一部分，用于次分析使用。再次分析后，利用新的样本的病原微生物鉴定结果对所述样本归纳信息数据库进行更新。

本发明的系统和方面可在以方面进行应用：

(1)实现复杂的生境微生物组样品中单菌比例、单菌活力以及单菌单基因的绝对表达量的测定；

(2)实现宿主细胞、真核原核生物或真菌，通过与原核微生物进行区分，完成活力检测以及单个基因的表达量测定；

(3)跨门或跨种的互作研究，实现包括胞内寄生菌在内的细菌与细菌间丰度比例和/或基因表达上的差异分析；

(4)实现DNA病毒和/或RNA病毒的直接检测；

(5)建立人基因组水平上的DNA变异基线数据、宏甲基化基线数据以及宏转录组数据，进行三者的关联分析。

本发明的有益效果

本发明相对于现有技术，具有以下有益效果：

本发明创造了一种新的基于纳米孔测序技术的病原宏基因组检测系统和方法，改善了基于二代测序的病原宏基因组检测的两大缺点：结果的判断和解读困难和中心化检测带来的时效性问题，同时，还克服了纳米孔测序技术固有的两大技术缺陷：碱基错误率高和测序成本高，主要通过处理和分析流程的一体化和自动化来实现。

本发明的系统和方法能充分利用纳米孔测序仪小型化的特点，将检测技术直接投放到临床应用场所，以去中心化的形式开展病原宏基因组检测，能够极大地提高检测时效性，降低样本运输产生质量风险，为临床提供高质量检测服务，并扩大病原宏基因组检测的应用范围。

其他有益效果包括：

1)灵敏度和特异性更高

本发明所述方法和系统基于minimap2算法对基于纳米孔测序的数据进行分析处理。本发明所述方法和系统能够适应长读长、高测序错误的数据，降低假阳性与假阴性概率，在短时间内快速、准确地获得样本中检出的病原微生物物种；进一步，本发明所述方法和系统还能够计算报告检出病原微生物物种在样本中的相对富集丰度，获得相对定量信息；更进一步，本发明所述方法和系统还对测序数据的质量进行评估以及去除宿主基因组，能够进一步提高数据分析的准确性，降低数据的人工处理量，缩短处理时间，达到快速检测的目的。

2)运算速度更快

利用本发明的方法和系统进行分析，可以省略组装或者拼接等步骤，减少运算时间。

此外，本发明所述病原微生物数据库系统，具有层次清晰的逻辑结构——病原微生物参考序列数据库作为应用层级，用于比对；病原微生物注释数据库属于注释层级，用于注释；样本归纳信息属于信息层级，用于数据输入和形成信息池。病原微生物参考序列数据库整合多个权威数据库中病原微生物的较完整的基因组核酸序列，进一步去除重复冗余或完整性较低的序列及物种相关信息。病原微生物注释数据库是根据病原微生物参考序列数据库整理参考序列的基因组大小、致病性和人体常见部位等方面注释信息，并构建病原微生物注释数据库的索引。样本归纳信息可根据样本采集部分和结果病原微生物致病性等差异，统计归纳出常见病原微生物的检出情况。本发明所述方法和系统既保证参考基因组序列的完整性和全面性，又减少冗余比对，减少搜索时间，优化比对效率；进一步，本发明所述方法和系统可减少注释搜索时间，提高数据访问性能，降低计算机运算负担；更进一步，本发明所述方法和系统预先圈定常见病原微生物的范围，加速判定时间，但对罕见病原微生物不设局限且间接快速识别。本发明病原微生物数据库技术提供了一种集成多个异构数据源、实现序列及注释信息快速共享的有效方法。

3)报告出具流程更趋自动化

本发明的系统基于自动化流程，有效降低人工录入出错的风险，减少查询资料的时间，提高信息录入和报告出具等中间环节的工作效率，实现病原微生物检测结果的自动化或半自动化出具，降低数据的人工处理量，从而达到快速检测的目的。

4)检测范围更全

本发明所述系统和方法基于minimap2算法和自主构建的病原微生物多数据库系统的有机结合，有效解决了无法培养的病原微生物检测问题，无需预判未知病原微生物再进行检测。本发明所述方法病原微生物的鉴定具有无需培养、鉴定覆盖病原微生物范围广、检测速度快、灵敏度高、准确率高等优势。能够一次快速地从样本中检测各类型病原微生物。

附图说明

图1示出了本发明实施例1的一个病原微生物检测系统的示意图。

图2示出了本发明实施例1的数据库存储模块中数据库的结构示意图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。

实施例

以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白，下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术，因此可以视为实施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白，这里所公开的特定实施例可以做很多修改，仍然能得到相同的或者类似的结果，而非背离本发明的精神或范围。

除非另有定义，所有在此使用的技术和科学的术语，和本发明所属领域内的技术人员所通常理解的意思相同，在此公开引用及他们引用的材料都将以引用的方式被并入。

那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。

下述实施例中未作具体说明的分子生物学实验方法，均按照《分子克隆实验指南》(第四版)(J.萨姆布鲁克、M.R.格林，2017)一书中所列的具体方法进行，或者按照试剂盒和产品说明书进行。其他实验方法，如无特殊说明，均为常规方法。下述实施例中所用的仪器设备，如无特殊说明，均为实验室常规仪器设备；下述实施例中所用的试验材料，如无特殊说明，均为自常规生化试剂商店购买得到的。

实施例1一种基于纳米孔测序的病原微生物检测系统

本实施例提供一种基于纳米孔测序的病原微生物检测系统，如图1所示，包括：

数据输入模块101，用于接受样本基于纳米孔测序的原始序列集和样本信息的输入，并用于对原始序列集进行质控，得到高质量序列集；

数据库存储模块102，用于存储病原微生物数据库，包括病原微生物参考序列数据库、病原微生物注释数据库和样本归纳信息数据库；

病原微生物鉴定模块103，分别与数据输入模块101和数据库存储模块102连接，用于将高质量序列集与病原微生物数据库进行多次比对，每次比对利用不同的参数，针对每次比对结果，过滤掉不能比对到病原微生物数据库的序列，得到不同的比对序列集，所有比对序列集的交集为病原微生物序列集，将病原微生物序列集及其相应的病原微生物信息作为病原微生物鉴定结果；

结果输出模块104，与病原微生物鉴定模块103连接，用于输出病原微生物鉴定结果。

在本发明中，上述各模块通过构建相应的软件实现相应的功能，具体地：

利用《测序样本信息管理软件》接受样本信息输入并管理，记录并整合样本来源、性质、质检及对应文库信息。

利用《测序数据管理软件》接受样本基于纳米孔测序的原始序列集并管理，可对测序样本的测序数据和分析过程、结果进行存储、调取和管理。

利用《QC_for_nanopore》软件实现样本基于纳米孔测序的原始序列集的质检质控。

利用《测序数据质检自动化报告软件》实现样本基于纳米孔测序的原始序列集的质检质控结果输出。

利用《微生物参考序列数据库管理软件》实现病原微生物数据库管理，对各种微生物参考序列进行收集、整理、调用和索取，让参考序列的收集更新工作有效进行。

利用《纳米孔宏基因组测序病原微生物分析软件》实现病原微生物鉴定模块103的功能。

利用《病原微生物自动化报告软件》实现结果输出模块104的结果输出。

数据输入模块101根据基于纳米孔测序的原始序列集和样本信息，利用fastqc软件对基于纳米孔测序的原始序列集进行质检；并利用fastp软件对基于纳米孔测序的原始序列集进行质控，过滤低质量碱基的序列和接头序列，得到高质量序列集。

数据库存储模块102包括病原微生物参考序列数据库、病原微生物注释信息数据库和样本归纳信息数据库，示意图如图2所示。构建该模块的方法步骤如下：

创建病原微生物数据库，包括非关系型的病原微生物参考序列数据库、关系型病原微生物注释数据库，以及关系型样本归纳信息数据库。病原微生物参考序列数据库广泛整合多个权威数据库(如NCBI，KEGG等)中病原微生物的较完整的基因组核酸序列，进一步去除重复冗余或完整性较低的序列及物种相关信息；病原微生物注释数据库是根据病原微生物参考序列数据库整理参考序列的基因组大小、致病性和人体常见部位等方面注释信息，并构建病原微生物注释数据库的索引；样本归纳信息可根据样本采集部分和目标病原微生物致病性等差异，统计归纳出常见病原微生物的检出情况。病原微生物参考序列数据库作为应用层级，用于比对；病原微生物注释数据库属于注释层级，用于注释；样本归纳信息属于信息层级，用于数据输入和形成信息池。病原微生物数据库利用《微生物参考序列数据库管理软件》收集、整理、调用和索取各种微生物参考序列，让参考序列的收集和更新工作有序进行。病原微生物注释数据库利用《微生物参考序列数据库管理软件》针对微生物宏基因组检测项目数据的特征，有效地整合了各个病原微生物宏基因组检测项目的项目信息、病例信息、文库信息、数据信息及测序和比对结果信息，建立可支持参考序列注释自动搜索、根据参考序列自动补充注释、根据注释列表自动补充参考序列，进而实现对海量病原体参考序列及注释数据的管理与应用，能够实现数据的自动载入、查询、下载、修改、统计的管理与应用的数据库管理。

病原微生物注释数据库中注释包括但不限于基因组大小、致病性和人体常见部位。

在病原微生物鉴定模块103中，比对采用minimap2算法，该算法能够快速将DNA 或者mRNA序列比对到参考序列上。

在病原微生物鉴定模块103中，多次比对为二次比对，包括第一比对和第二比对，第一比对将高质量序列集利用第一参数与病原微生物数据库进行比对，能够比对上病原微生物数据库的序列为第一序列集，统计得到第一序列集比对到的第一病原微生物信息；第二比对将高质量序列集利用第二参数与病原微生物数据库进行比对，能够比对上病原微生物数据库的序列为第二序列集，统计得到第二序列集比对到的第二病原微生物信息，将第一病原微生物信息和第二病原微生物信息的交集作为病原微生物鉴定结果。

病原微生物鉴定结果包括物种信息、物种reads数目、reads占该物种比例、覆盖度、深度和物种相对富集丰度。

病原微生物鉴定模块103还对病原微生物鉴定结果进行验证：将病原微生物序列集进行在线BLASTN比对，利用比对一致性和查询序列覆盖度信息剔除假阳性结果。

实施例2实施例1的病原微生物检测系统在支气管肺泡灌洗液微生物检测鉴定中的应用

本实施例基于实施例1建立的基于纳米孔测序的病原微生物检测系统和方法，对支气管肺泡灌洗液微生物样本进行检测鉴定。

在检测鉴定时，加入重复对照和空白对照，实现平行质控。具体实施步骤如下：

1样本信息

收集2份疑似感染病人的支气管肺泡灌洗液样本。

患者一临床症状为：发现血糖高6年，纳差，乏力5天。临床诊断为：重症肺炎。用药信息：抗菌素：亚胺培南西司他丁，莫西沙星，替考拉宁。

患者二临床症状为：发热，咳嗽，咳痰。

根据临床症状，判断两者可能存在病原微生物感染。

样本信息录入：患者一样品编号为A1.1，患者二样品编号为A1.2。两份样本的临床症状，临床诊断和用药信息等样本信息如实录入至《测序样本信息管理软件》信息录入界面。

2样品收集及转运

根据临床标准收集疑似感染病人的支气管肺泡灌洗液样本，在0～4℃环境下保存及转运。

3样本核酸提取

本实施例检测项目均为病原体DNA检测。

1)颠倒混匀管内样本，各取500μL于1.5mL离心管进行12,000rpm离心2分钟，离心后各取400μL上清于1.5mL离心管进行DNA。采用天根试剂盒(TIANamp Micro DNA kit)，按试剂盒说明书操作并加入磁珠研磨细胞，使细胞裂解后提取样本总核酸，洗脱体积为60μL；

2)取1μL核酸样本采用QubitX-GreenII试剂盒在Qubit 3.0仪器上测定核酸浓度，按试剂盒说明书对样本进行核酸定量。

4测序前样本处理

提取后的核酸样本按照以下流程进行建库。建库方案选取自牛津纳米孔公司提供的1DNativebarcodingprotocol：

1)使用g-TUBE(Covaris)将1.2μg核酸样本在5,000转/分钟的条件下打断1分钟，获得片段化的DNA；

2)核酸的末端修复：在45μL片段化的DNA中加入3μLUltraⅡ End-prepenzymemix、7μLUltraⅡEnd-prepreactionbuffer和5μL nuclease-freewater，于 1.5mlPCR管中进行混匀，20℃反应5分钟过后65℃再反应5分钟；

3)加barcode：每个样本取末端修复后的核酸500ng，各加入2.5μLNativeBarcode和25μLBlunt/TALigaseMasterMix，混匀后21℃反应30分钟；

4)加接头：将上一步加好barcode的所有样本共取700ng，加入 20μLBarcodeAdapterMix和10μLQuickT4 DNALigase，混匀后室温反应10分钟。

5测序

1)文库上机：在NanoporeMinION便携式测序仪上进行测序。用Running Buffer FM576μL和Nuclease-free water 624μL温和吹吸混匀配成起始缓冲液。测序前，测序芯片port用800μL起始缓冲液室温孵育5分钟。将35μL Running Buffer FM， 25.5μLLibraryloadingbeads和DNA文库混合准备上机。将200μL起始缓冲液加入至测序仪sampleport中，避免引入气泡；将75μL文库温和吹吸混匀并逐滴加入sample port 中，先后将sample port和priming port关闭。

2)设置测序仪器参数，测序运行时间设为“24h”。开始测序。

6测序数据收集

2个样本中，样本A1.1与A1.2平行建库，有特定内参序列和空白对照NTC(即纯水)，则2个样本一共产生6套测序数据。其中，内参序列为人工合成的特定序列，核苷酸序列如下(5’-3’)：

TGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCACGGACT TCGGTCTGG

测序数据的分析流程如下：

1)将Nanopore MinION测序产生生物电信号通过《MinKNOW软件》控制仪器，将电信号转换为碱基信号，测序与实时碱基识别，检测运行状态，得到fastq格式的序列信息，生成数据集1，即为原始序列集；

2)根据《测序样本信息管理软件》录入的样本信息以及数据质检参数；样本信息包括样本类型、检测项目、关注的病原体类型、抗菌素的使用和文库质量及它们之间的关系等信息，数据质检参数，包括于数据量、序列平均长度、最小质量值；质检前，根据样本信息从数据库中调取对应的数据质检参数，并将同类型的数据质检参数进行整合，得到样本信息对应的最适参数组合，形成数据质检方案，并自动调整处理和过滤参数。

其中，本次minimap2算法快速比对，参数自动设置为“-ax map-ont-k 15”，参数意义是本次nanopore测序输出文件为sam格式，数据类型为map-ont，最小k-mer 长度为15，其余参数(如比对率，识别区块大小，置信度等)取默认值；

3)利用《QC_for_nanopore》对数据集1质控，生成数据集2：过滤小于150bp 的短序列，以及碱基质量分数低于15的序列将被剔除，质控后的数据集为数据集2，即高质量序列集；

4)质控后的数据集2使用《纳米孔宏基因组测序病原微生物分析软件》进行和自建病原数据库identifiable_species_DB数据库的分析流程，采用minimap2算法快速将DNA序列比对到病原微生物多数据库系统参考基因组上；并使用《微生物参考序列数据库管理软件》为宿主和微生物参考序列作分类、注释和管理；

5)《纳米孔宏基因组测序病原微生物分析软件》将数据集2比对得到的匹配序列生成数据集3，用于下步比对，

其中，本次minimap2算法快速比对，参数自动设置为“-ax map-ont-k 7”，参数意义是本次nanopore测序输出文件为sam格式，数据类型为map-ont，最小k-mer长度为7，其余参数(如比对率，识别区块大小，置信度等)取默认值；

6)数据集3匹配序列使用BLASTN与病原微生物多数据库系统中的参考基因组比对，参数自动设置为“-perc_identity 90–word_size 16-evalue 0.000 001”(比对率为90，识别区块大小为16，置信度e-value设定为0.000 001)，未匹配的序列定义为“未分类序列”；

7)为进一步了解比对详情，将数据集2、3中匹配到的序列提取出来，形成数据集4，进行在线BLAST比对，并挑选出比对一致性较好的基因组，用于下游分析并统计比对情况，包括比对一致性、查询序列覆盖度等信息；

8)剔除假阳性结果。

实施例2测序数据的基本信息如表1所示：

表1实施例2不同样本测序结果情况

7获得分析结果

测序结果如表2所示，使用《病原微生物自动化报告软件》生成病原微生物检测报告。

实施例2所述分析结果如表2所示：

表2实施例2不同样本分析结果

实施例3实施例1的病原微生物检测系统在血液微生物检测鉴定中的应用

本实施例基于实施例1建立的基于纳米孔测序的病原微生物检测系统和方法，对血浆样本进行检测鉴定。

1样本信息：

根据临床标准收集2份疑似感染病人的血浆样本。

患者二临床症状为：进行性贫血。临床诊断为：贫血查因。用药信息未提供。临床病原微生物检测结果：甲类传染病：阴性；HIV：阴性；结核：阴性。

根据临床症状，判断两者可能存在病原微生物感染。

样本信息录入：患者一样品编号为A2.1，患者二样品编号为A2.2。两份样本的临床症状，临床诊断、用药信息和临床病原微生物检测结果如实录入至《测序样本信息管理软件》信息录入界面。

2样品收集及转运

根据临床标准收集疑似感染病人的血浆样本，0～4℃环境下保存及转运。

3样本核酸提取

本实施例中检测项目均为病原体DNA和RNA检测。

1)DNA提取：颠倒混匀管内样本，各取500μL于1.5mL离心管进行12,000rpm 离心2分钟，离心后各取400μL上清于1.5mL离心管进行DNA提取。采用天根试剂盒(TIANampMicro DNA kit)，按试剂盒说明书操作并加入磁珠研磨细胞，使细胞裂解后提取样本总核酸，洗脱体积为60μL；

2)RNA提取：颠倒混匀管内样本，各取500μL于1.5mL离心管进行12,000rpm 离心2分钟，离心后各取400μL上清于1.5mL离心管进行RNA提取。采用天根试剂盒(RNAsimpleTotal RNA Kit)，按试剂盒说明书操作并加入磁珠研磨细胞，使细胞裂解后提取样本总核酸，洗脱体积为60μL；

3)取1μL核酸样本采用Qubit dsDNA assay试剂盒在Qubit 4.0仪器上测定核酸浓度，按试剂盒说明书对样本进行核酸定量。

4测序前样本处理

提取后的核酸样本按照以下流程进行建库。建库方案选取牛津纳米孔公司提供的1DNativebarcodingprotocol：

1)对RNA样品添加Poly U尾巴：用NEB M0337S Poly(U)Polymerase和TAKARA UTP对总RNA 3’端进行标记，实现与DNA的区分；

2)将带有Poly U尾巴的RNA反转录成cDNA，并在其5′端添加MID条形码序列，用于区分测序后样本信息；

3)使用g-TUBE(Covaris)将1.2μgDNA样本在5,000转/分钟的条件下打断1分钟，获得片段化的DNA；

4)将步骤2)得到的cDNA样品与步骤3)得到的DNA样品混合建库；

5)核酸的末端修复：每个样品取45μL混合核酸样本中加入3μLUltraⅡ End-prepenzymemix、7μLUltraⅡEnd-prepreactionbuffer和5μL nuclease-freewater，总计60μL的体系在1.5mlPCR管中进行混匀，20℃和65℃依次反应5分钟；

6)加barcode：每个样本取末端修复后的核酸片段500ng，各加入2.5μLNativeBarcode和25μLBlunt/TALigaseMasterMix，混匀后21℃反应30分钟；

7)加接头：将上一步加好barcode的所有样本共取700ng，加入 20μLBarcodeAdapterMix(BAM)和10μLQuickT4 DNALigase，混匀后室温反应10分钟。

5测序

1)文库上机：在NanoporeMinION便携式测序仪上进行测序。用Running Buffer FM576μL和Nuclease-free water 624μL温和吹吸混匀配成起始缓冲液。测序前，测序芯片port用800μL起始缓冲液室温孵育5分钟。将35μL Running Buffer FM， 25.5μLLibraryloadingbeads和DNA文库混合。将200μL起始缓冲液加入至测序仪 sampleport中，避免引入气泡；将75μL文库温和吹吸混匀并逐滴加入sample port中，先后将sample port和priming port关闭。

6测序数据收集

2个样本中，样本A2.1与A2.2平行建库，有特定内参序列和空白对照NTC(即纯水)，则2个样本一共产生6套测序数据。其中，内参序列为人工合成的特定序列，核苷酸序列如下(5’-3’)：

TGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCACGGACT TCGGTCTGG

测序数据的分析流程如下：

1)将Nanopore MinION测序产生生物电信号通过《MinKNOW软件》控制仪器，将电信号转换为碱基信号，测序与实时碱基识别，检测运行状态，得到fastq格式的序列信息；

2)每个样品两个个生物学重复，实现DNA和RNA的同时检测，因而可以对RNA 中每个基因覆盖度基于DNA文库中相应文库的覆盖层数进行校正后，再进行差异分析，生成数据集1，即为原始序列集；

3)利用《QC_for_nanopore》对数据集1质控，生成数据集2：过滤小于150bp 的短序列，以及碱基质量分数低于7的序列将被剔除，质控后的数据集为数据集2，即为高质量序列集；

4)如实施例1，根据录入的样本信息(如样本类型、重点关注的物种等)和文库质量等信息，自动选择预设方案，并自动调整处理和过滤参数，

5)质控后的数据集2使用《纳米孔宏基因组测序病原微生物分析软件》进行和自建病原数据库identifiable_species_DB数据库的分析流程，采用minimap2算法快速将DNA序列比对到病原微生物多数据库系统参考基因组上；并使用《微生物参考序列数据库管理软件》为宿主和微生物参考序列作分类、注释和管理；

6)《纳米孔宏基因组测序病原微生物分析软件》将数据集2比对得到的匹配序列生成数据集3，用于下步比对，

7)数据集3匹配序列使用BLASTN与病原微生物多数据库系统中的参考基因组比对，参数自动设置为“-perc_identity 90–word_size 16-evalue 0.000 001”(比对率为90，识别区块大小为16，置信度e-value设定为0.000 001)，未匹配的序列定义为“未分类序列”；

8)为进一步了解比对详情，将数据集2、3中匹配到的序列提取出来，形成数据集5，进行在线BLAST比对，并挑选出比对一致性较好的基因组，用于下游分析并统计比对情况，包括比对一致性、查询序列覆盖度等信息；

9)剔除假阳性结果。

实施例3测序数据的基本信息如表3所示：

表3实施例3不同样本测序结果情况

7获得分析结果：

测序结果如表4所示，使用《病原微生物自动化报告软件》生成病原微生物检测报告。

实施例3所述分析结果如表4所示：

表4实施例3不同样本分析结果

实施例4实施例1的病原微生物检测系统在脑脊液微生物检测鉴定中的应用

本实施例基于实施例1建立的基于纳米孔测序的病原微生物检测系统和方法，对脑脊液样本进行检测鉴定。

1样本信息

根据临床标准收集1份疑似感染病人的脑脊液样本。

患者临床症状为：发热，头痛1天，呕吐4次。临床诊断为：发热、头痛原因待查：疑似中枢神经系统感染。用药信息为：头孢曲松+阿昔洛韦抗感染，甘露醇降颅压。根据临床症状，判断其可能存在病原微生物感染。

样本信息录入：样品编号为A3。样本的临床症状，临床诊断和用药信息如实录入至《测序样本信息管理软件》信息录入界面。

其中，《测序样本信息管理软件》信息录入内容可以包括但不限于临床症状，临床诊断，用药信息，检测重点关注的物种等。

2样品收集及转运

根据临床标准收集疑似感染病人的脑脊液样本，在0～4℃环境下保存及转运。

3样本核酸提取

本实施例检测项目为病原体RNA检测。

1)RNA提取并纯化收集：颠倒混匀管内样本，取1mL于1.5mL离心管进行 12,000rpm离心2分钟，离心后取500μL上清于1.5mL离心管进行RNA提取。采用天根试剂盒(RNAsimpleTotal RNA Kit)，按试剂盒说明书操作提取样本总核酸。加入Beckman AMPure XP磁珠，按说明书的方法对RNA产物进行纯化收集，洗脱体积约为60μL。

2)取1μL核酸样本采用Quant-iT Picogreen试剂盒在Qubit 4.0仪器上测定核酸浓度，按试剂盒和仪器说明书对样本进行核酸定量。

4测序前样本处理

提取后的RNA核酸样本按照以下流程进行建库。建库方案选取牛津纳米孔公司提供的1DNativebarcodingprotocol：

3)cDNA的末端修复：在45μLcDNA中加入3μLUltraⅡEnd-prepenzymemix、 7μLUltraⅡEnd-prepreactionbuffer和5μL nuclease-freewater，1.5mlPCR管中进行混匀，金属浴20℃孵育5分钟过后65℃再孵育5分钟；

4)加barcode：取末端修复后的cDNA样本11.25μL，加入2.5μLNativeBarcode 和25μLBlunt/TALigaseMasterMix，混匀后21℃反应30分钟；

5)加接头：将上一步加好barcode的样本共取33μL，加入 20μLBarcodeAdapterMix1D和47μLNEXTflex^TMLigaseEnzymeMix，混匀后室温反应10 分钟。

5设定参数，测序

1)文库上机：在NanoporeMinION便携式测序仪上进行测序。用Running Buffer FM576μL和Nuclease-free water 624μL温和吹吸混匀配成起始缓冲液。测序前，测序芯片port用800μL起始缓冲液室温孵育5分钟。将35μL Running Buffer FM， 25.5μLLibraryloadingbeads和DNA文库混合。将200μL起始缓冲液加入至测序仪 sampleport中，避免引入气泡；将75μL文库温和吹吸混匀并逐滴加入sample port中，先后将sample port和priming port关闭；

6测序数据收集

1个样本中，样本A3平行建库，有特定内参序列和空白对照NTC(即纯水)，则 1个样本一共产生4套测序数据。其中，其中内参序列为人工合成的特定序列，，核苷酸序列(5’-3’)如下：

ATTGACGGCGTAGTACACACTATTGAATCAAACAGCCGACCAATTGCACTA CCATCACAA

测序数据的分析流程如下：

1)将Nanopore MinION测序产生生物电信号通过《MinKNOW软件》控制仪器，将电信号转换为碱基信号，测序与实时碱基识别，检测运行状态，得到fastq格式的序列信息，生成数据集1，即原始序列集；

2)如实施例1，根据录入的样本信息(如样本类型、重点关注的物种等)和文库质量等信息，自动选择预设方案，并自动调整处理和过滤参数，

3)利用《QC_for_nanopore》对数据集1质控，生成数据集2：过滤小于150bp 的短序列，以及碱基质量分数低于7的序列将被剔除，质控后的数据集为数据集2，即高质量序列集；

4)质控后的数据集2使用《纳米孔宏基因组测序病原微生物分析软件》进行和自建病原数据库identifiable_species_DB数据库的分析流程，采用minimap2算法快速将DNA序列比对到病原微生物多数据库系统参考基因组上；病原微生物多数据库系统中的宿主和微生物参考序列主要来源于公开的NCBI数据库，并使用《测序数据库管理软件》为宿主和微生物参考序列作分类、注释和管理；

5)《纳米孔宏基因组测序病原微生物分析软件》将数据集2第二次比对得到的匹配序列生成数据集3，用于下步比对，

8)剔除假阳性结果。

实施例4所述测序数据的基本信息如表5所示：

表5实施例4样本测序结果情况

7获得分析结果

经过生信分析计算的测序结果如表6所示，使用《病原微生物自动化报告软件》生成病原微生物检测报告。

实施例4所述分析结果如表6所示：

表6实施例4样本分析结果

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

1.一种基于纳米孔测序的病原微生物检测系统，其特征在于，包括：

数据库存储模块，用于存储病原微生物数据库；

2.根据权利要求1所述的病原微生物检测系统，其特征在于，所述病原微生物数据库包括病原微生物参考序列数据库和病原微生物注释数据库。

3.根据权利要求2所述的病原微生物检测系统，其特征在于，所述病原微生物鉴定结果包括物种信息、物种reads、reads占该物种比例、覆盖度、深度。

4.根据权利要求1所述的病原微生物检测系统，其特征在于，所述病原微生物鉴定模块还对病原微生物鉴定结果进行验证：将所述病原微生物序列集进行在线BLAST比对，利用比对一致性和查询序列覆盖度信息剔除假阳性结果。

5.根据权利要求4所述的病原微生物检测系统，其特征在于，所述BLAST比对为BLASTN比对。

6.根据权利要求2所述的病原微生物检测系统，其特征在于，所述病原微生物数据库还包括样本归纳信息数据库，包括一个或多个样本进行病原微生物检测后得到的病原微生物鉴定结果。

7.根据权利要求6所述的病原微生物检测系统，其特征在于，所述结果输出模块还与数据库存储模块连接，用于将所述病原微生物鉴定结果输出至所述病原微生物数据库中，对所述样本归纳信息数据库进行更新。

8.一种基于纳米孔测序的病原微生物检测方法，其特征在于，包括以下步骤：

9.根据权利要求8所述的方法，其特征在于，进一步包括对所述病原微生物鉴定结果进行验证的步骤：

10.根据权利要求9所述的方法，其特征在于，进一步包括以下步骤：

S6，利用所述病原微生物鉴定结果构建样本归纳信息数据库并存储至所述病原微生物数据库中，再次对样本进行病原微生物鉴定时，利用新的病原微生物鉴定结果对所述样本归纳信息数据库进行更新。