发明内容
为了解决上述技术问题中的至少一个,本发明采用的技术方案如下:
本发明第一方面提供一种基于纳米孔测序的病原微生物检测系统,包括:
数据输入模块,用于接受样本基于纳米孔测序的原始序列集和样本信息的输入,并用于对所述原始序列集进行质控,得到高质量序列集;
数据库存储模块,用于存储病原微生物数据库;
病原微生物鉴定模块,分别与数据输入模块和数据库存储模块连接,用于将所述高质量序列集与所述病原微生物数据库进行多次比对,每次比对利用不同的参数,针 对每次比对结果,过滤掉不能比对到所述病原微生物数据库的序列,得到不同的比对 序列集,所有比对序列集的交集为病原微生物序列集,将病原微生物序列集及其相应 的病原微生物信息作为病原微生物鉴定结果;
结果输出模块,与所述病原微生物鉴定模块连接,用于输出病原微生物鉴定结果。
在本发明中,基于纳米孔测序技术的病原微生物检测,具有以下特点:
1.其分析原理主要为检出序列与病原数据库序列整体一致性的比对分析,而非单碱基突变的分析,所以,当测序序列更长时,对一致性判断更为有效,其碱基错误率 对的判断的影响也会降低;
2.当测序长度更长时,经过多种技术层面的优化后,可使其获得高可信度病原序列的几率随之提升,从而使单个样本的所需测序数据量更低,进而使测序成本明显降 低;
3.同时,随着高可信度病原序列出现几率的提升,背景或者无关微生物片段的比例则会降低,从而降低结果的判断和解读难度。
在本发明的一些实施方案中,所述基于纳米孔测序的原始序列集是通过以下方法获得的:
(1)获得所述样本的核酸样本,并获得高质量的测序文库;
(2)基于所述高质量的测序文库,利用纳米孔测序平台进行测序,获得所述基于纳米孔测序的原始序列集。
在本发明中,所述病原微生物是指可以侵犯人体,引起感染甚至传染病的微生物,或称病原体。病原微生物指寄生虫(原虫、蠕虫、医学节肢动物)、真菌、细菌、螺 旋体、支原体、立克次体、衣原体、病毒。
在本发明的一些具体实施方案中,步骤(1)的具体步骤如下:采用试剂盒进行提取、核酸质检、建立文库,其中,所述建立文库是指:加入内参序列;测DNA两侧 先加上A碱基,使平末端变成粘性末端,然后再加上Y接头以及马达蛋白,并对建立 的文库进行质检,得到所述高质量测序文库。
在本发明的一些具体实施方案中,利用Nanopore MinION测序仪进行测序,并利用配套的MinKNOW软件获得所述基于纳米孔测序的原始序列集,以达到控制仪器, 测序与实时碱基识别,检测运行状态,数据采集等目的。
在本发明的一些实施方案中,所述样本信息包括但不限于样本类型、重点关注的物种和文库质量信息。
在本发明的一些实施方案中,所述数据输入模块根据所述基于纳米孔测序的原始序列集和所述样本信息,参照包括但不限于所述样本类型和所述重点关注的物种而自 动选择数据质检方案,并自动调整处理和过滤参数。
在本发明的一些具体实施方案中,所述自动选择数据质检方案具体如下:
所述样本信息包括但不限于样本类型、检测项目、关注的病原体类型、抗菌素的使用、文库信息,及它们之间的关系;
所述数据质检参数,包括但不限于数据量、序列平均长度、最小质量值;
将各所述样本信息类型与数据质检参数的对应关系输入数据库;
质检前,根据样本信息从数据库中调取对应的数据质检参数,并将同类型的数据质检参数进行整合,得到样本信息对应的最适参数组合,形成数据质检方案。
在本发明的一些实施方案中,利用fastqc软件对所述基于纳米孔测序的原始序列集进行质检;并利用fastp软件对所述基于纳米孔测序的原始序列集进行质控,过滤不 合格的序列,得到所述高质量序列集。任选地,所述质控为质检、低质量碱基过滤和 接头过滤。
在本发明的一些实施方案中,所述病原微生物数据库包括病原微生物参考序列数据库和病原微生物注释数据库。
任选地,所述病原微生物参考序列数据库为非关系型的。在本发明的一些具体实施方案中,所述病原微生物参考序列数据库可以是或包括任意本领域技术人员知悉的 包含病原微生物基因组序列的数据库,如NCBI公开数据库和KEGG数据库,包括但 不限于细菌数据库、真菌数据库、DNA病毒数据库、RNA病毒数据库、质粒数据库 和医学寄生虫数据库,该数据库能够随着网站公开信息的更新而随之更新。在本发明 的另一些具体实施方案中,所述病原微生物参考序列数据库进一步去除了重复冗余或 完整性较低的序列及物种相关信息。
在本发明的一些实施方案中,病原微生物参考序列数据库作为应用层级,用于比对。
在本发明中,数据库存储模块针对微生物宏基因组检测项目数据的特征,有效地整合了各个病原微生物宏基因组检测项目的项目信息、病例信息、文库信息、数据信 息及测序和比对结果信息,建立可支持参考序列注释自动搜索、根据参考序列自动补 充注释、根据注释列表自动补充参考序列,进而实现对海量病原体参考序列及注释数 据的管理与应用,能够实现数据的自动载入、查询、下载、修改、统计的管理与应用 的数据库管理。
任选地,所述病原微生物注释数据库为关系型的。在本发明的一些具体实施方案中,所述病原微生物注释数据库中所述注释包括但不限于基因组大小、致病性、人体 常见部位。
在本发明的一些优选实施方案中,所述病原微生物参考序列数据库和病原微生物注释数据库可以自动或者手动进行更新,从而进一步丰富所述的微生物多数据库系统 内容,生成一个更易于搜索、更有利于物种比对的病原微生物数据库。在本发明的一 些更优选实施方案中,所述更新可以是定期也可以是不定期。
在本发明的一些实施方案中,在所述病原微生物鉴定模块中,所述比对采用minimap2算法,该算法能够快速将DNA或者mRNA序列比对到所述参考序列上。
在本发明的一些实施方案中,所述多次比对为二次比对,包括第一比对和第二比对,第一比对将所述高质量序列集利用第一参数与所述病原微生物数据库进行比对, 能够比对上病原微生物数据库的序列为第一序列集,统计得到第一序列集比对到的第 一病原微生物信息;第二比对将所述高质量序列集利用第二参数与所述病原微生物数 据库进行比对,能够比对上病原微生物数据库的序列为第二序列集,统计得到第二序 列集比对到的第二病原微生物信息,将第一病原微生物信息和第二病原微生物信息的 交集作为病原微生物鉴定结果。
在本发明的一些实施方案中,所述病原微生物鉴定结果包括物种信息、物种reads数目、reads占该物种比例、覆盖度、深度和物种相对富集丰度。
在本发明中,
所述“物种reads数目”是指比对到该病原微生物物种的片段数。
所述“reads占该物种比例”是指对比上的该病原微生物序列片段数占比对上同类型病原微生物的总序列片段数的比例。
所述“覆盖度”是指测序序列覆盖长度占具有参考序列大小的比例。
所述“深度”是指测序得到该物种的bases数与参考基因组大小的比值。
所述“物种相对富集丰度”是指该物种存在于样品中的相对数量及其相对比例。
在本发明的一些实施方案中,所述病原微生物鉴定模块还对病原微生物鉴定结果进行验证:将所述病原微生物序列集进行在线BLAST比对,利用比对一致性和查询 序列覆盖度信息剔除假阳性结果。在本发明的一些具体实施方案中,所述BLAST比 对为BLASTN比对。
在本发明的一些实施方案中,所述病原微生物数据库还包括样本归纳信息数据库。 任选地,所述样本归纳信息数据库是关系型的。在本发明的一些具体实施方案中,所述样本归纳信息数据库包括多个样本进行病原微生物检测后得到的病原微生物鉴定结果,该数据库初始时为空白数据库。为此,所述结果输出模块与数据库存储模块连接, 用于将所述病原微生物鉴定结果输出至所述病原微生物数据库中,构建或更新所述样 本归纳信息数据库。
本发明的第二方面提供一种基于纳米孔测序的病原微生物检测方法,包括以下步骤:
S1,构建病原微生物数据库,包括病原微生物参考序列数据库、病原微生物注释数据库;
S2,获得样本的纳米孔测序的原始数据和样本信息,对所述原始序列集进行质控,得到高质量序列集;
S3,将所述高质量序列集与病原微生物数据库进行多次比对,每次比对利用不同的参数,针对每次比对结果,过滤掉不能比对到所述病原微生物数据库的序列,得到 不同的比对序列集;
S4,将所有比对序列集的交集作为病原微生物序列集,将病原微生物序列集及其相应的病原微生物信息作为病原微生物鉴定结果。
在本发明的一些实施方案中,所述方法进一步包括对所述病原微生物鉴定结果进行验证的步骤:
S5,将所述病原微生物序列集进行在线BLAST比对,利用比对一致性和查询序 列覆盖度信息剔除假阳性结果。
在本发明的一些实施方案中,所述方法进一步包括以下步骤:
S6,利用所述病原微生物鉴定结果构建样本归纳信息数据库,并成为所述病原微生物数据库中的一部分,用于次分析使用。再次分析后,利用新的样本的病原微生物 鉴定结果对所述样本归纳信息数据库进行更新。
本发明的系统和方面可在以方面进行应用:
(1)实现复杂的生境微生物组样品中单菌比例、单菌活力以及单菌单基因的绝对表达量的测定;
(2)实现宿主细胞、真核原核生物或真菌,通过与原核微生物进行区分,完成活 力检测以及单个基因的表达量测定;
(3)跨门或跨种的互作研究,实现包括胞内寄生菌在内的细菌与细菌间丰度比例和/或基因表达上的差异分析;
(4)实现DNA病毒和/或RNA病毒的直接检测;
(5)建立人基因组水平上的DNA变异基线数据、宏甲基化基线数据以及宏转录 组数据,进行三者的关联分析。
本发明的有益效果
本发明相对于现有技术,具有以下有益效果:
本发明创造了一种新的基于纳米孔测序技术的病原宏基因组检测系统和方法,改善了基于二代测序的病原宏基因组检测的两大缺点:结果的判断和解读困难和中心化 检测带来的时效性问题,同时,还克服了纳米孔测序技术固有的两大技术缺陷:碱基 错误率高和测序成本高,主要通过处理和分析流程的一体化和自动化来实现。
本发明的系统和方法能充分利用纳米孔测序仪小型化的特点,将检测技术直接投放到临床应用场所,以去中心化的形式开展病原宏基因组检测,能够极大地提高检测 时效性,降低样本运输产生质量风险,为临床提供高质量检测服务,并扩大病原宏基 因组检测的应用范围。
其他有益效果包括:
1)灵敏度和特异性更高
本发明所述方法和系统基于minimap2算法对基于纳米孔测序的数据进行分析处理。本发明所述方法和系统能够适应长读长、高测序错误的数据,降低假阳性与假阴 性概率,在短时间内快速、准确地获得样本中检出的病原微生物物种;进一步,本发 明所述方法和系统还能够计算报告检出病原微生物物种在样本中的相对富集丰度,获 得相对定量信息;更进一步,本发明所述方法和系统还对测序数据的质量进行评估以 及去除宿主基因组,能够进一步提高数据分析的准确性,降低数据的人工处理量,缩 短处理时间,达到快速检测的目的。
2)运算速度更快
利用本发明的方法和系统进行分析,可以省略组装或者拼接等步骤,减少运算时间。
此外,本发明所述病原微生物数据库系统,具有层次清晰的逻辑结构——病原微生物参考序列数据库作为应用层级,用于比对;病原微生物注释数据库属于注释层级, 用于注释;样本归纳信息属于信息层级,用于数据输入和形成信息池。病原微生物参 考序列数据库整合多个权威数据库中病原微生物的较完整的基因组核酸序列,进一步 去除重复冗余或完整性较低的序列及物种相关信息。病原微生物注释数据库是根据病 原微生物参考序列数据库整理参考序列的基因组大小、致病性和人体常见部位等方面 注释信息,并构建病原微生物注释数据库的索引。样本归纳信息可根据样本采集部分 和结果病原微生物致病性等差异,统计归纳出常见病原微生物的检出情况。本发明所 述方法和系统既保证参考基因组序列的完整性和全面性,又减少冗余比对,减少搜索 时间,优化比对效率;进一步,本发明所述方法和系统可减少注释搜索时间,提高数 据访问性能,降低计算机运算负担;更进一步,本发明所述方法和系统预先圈定常见 病原微生物的范围,加速判定时间,但对罕见病原微生物不设局限且间接快速识别。 本发明病原微生物数据库技术提供了一种集成多个异构数据源、实现序列及注释信息 快速共享的有效方法。
3)报告出具流程更趋自动化
本发明的系统基于自动化流程,有效降低人工录入出错的风险,减少查询资料的时间,提高信息录入和报告出具等中间环节的工作效率,实现病原微生物检测结果的 自动化或半自动化出具,降低数据的人工处理量,从而达到快速检测的目的。
4)检测范围更全
本发明所述系统和方法基于minimap2算法和自主构建的病原微生物多数据库系统的有机结合,有效解决了无法培养的病原微生物检测问题,无需预判未知病原微生 物再进行检测。本发明所述方法病原微生物的鉴定具有无需培养、鉴定覆盖病原微生 物范围广、检测速度快、灵敏度高、准确率高等优势。能够一次快速地从样本中检测 各类型病原微生物。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。
实施例
以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白,下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术,因此可以视为实 施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白,这里所公开 的特定实施例可以做很多修改,仍然能得到相同的或者类似的结果,而非背离本发明 的精神或范围。
除非另有定义,所有在此使用的技术和科学的术语,和本发明所属领域内的技术人员所通常理解的意思相同,在此公开引用及他们引用的材料都将以引用的方式被并 入。
那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的 发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。
下述实施例中未作具体说明的分子生物学实验方法,均按照《分子克隆实验指南》(第四版)(J.萨姆布鲁克、M.R.格林,2017)一书中所列的具体方法进行,或者按 照试剂盒和产品说明书进行。其他实验方法,如无特殊说明,均为常规方法。下述实 施例中所用的仪器设备,如无特殊说明,均为实验室常规仪器设备;下述实施例中所 用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
实施例1一种基于纳米孔测序的病原微生物检测系统
本实施例提供一种基于纳米孔测序的病原微生物检测系统,如图1所示,包括:
数据输入模块101,用于接受样本基于纳米孔测序的原始序列集和样本信息的输入,并用于对原始序列集进行质控,得到高质量序列集;
数据库存储模块102,用于存储病原微生物数据库,包括病原微生物参考序列数据库、病原微生物注释数据库和样本归纳信息数据库;
病原微生物鉴定模块103,分别与数据输入模块101和数据库存储模块102连接,用于将高质量序列集与病原微生物数据库进行多次比对,每次比对利用不同的参数, 针对每次比对结果,过滤掉不能比对到病原微生物数据库的序列,得到不同的比对序 列集,所有比对序列集的交集为病原微生物序列集,将病原微生物序列集及其相应的 病原微生物信息作为病原微生物鉴定结果;
结果输出模块104,与病原微生物鉴定模块103连接,用于输出病原微生物鉴定 结果。
在本发明中,上述各模块通过构建相应的软件实现相应的功能,具体地:
利用《测序样本信息管理软件》接受样本信息输入并管理,记录并整合样本来源、性质、质检及对应文库信息。
利用《测序数据管理软件》接受样本基于纳米孔测序的原始序列集并管理,可对测序样本的测序数据和分析过程、结果进行存储、调取和管理。
利用《QC_for_nanopore》软件实现样本基于纳米孔测序的原始序列集的质检质控。
利用《测序数据质检自动化报告软件》实现样本基于纳米孔测序的原始序列集的质检质控结果输出。
利用《微生物参考序列数据库管理软件》实现病原微生物数据库管理,对各种微生物参考序列进行收集、整理、调用和索取,让参考序列的收集更新工作有效进行。
利用《纳米孔宏基因组测序病原微生物分析软件》实现病原微生物鉴定模块103的功能。
利用《病原微生物自动化报告软件》实现结果输出模块104的结果输出。
数据输入模块101根据基于纳米孔测序的原始序列集和样本信息,利用fastqc软件对基于纳米孔测序的原始序列集进行质检;并利用fastp软件对基于纳米孔测序的原 始序列集进行质控,过滤低质量碱基的序列和接头序列,得到高质量序列集。
数据库存储模块102包括病原微生物参考序列数据库、病原微生物注释信息数据库和样本归纳信息数据库,示意图如图2所示。构建该模块的方法步骤如下:
创建病原微生物数据库,包括非关系型的病原微生物参考序列数据库、关系型病原微生物注释数据库,以及关系型样本归纳信息数据库。病原微生物参考序列数据库 广泛整合多个权威数据库(如NCBI,KEGG等)中病原微生物的较完整的基因组核 酸序列,进一步去除重复冗余或完整性较低的序列及物种相关信息;病原微生物注释 数据库是根据病原微生物参考序列数据库整理参考序列的基因组大小、致病性和人体 常见部位等方面注释信息,并构建病原微生物注释数据库的索引;样本归纳信息可根 据样本采集部分和目标病原微生物致病性等差异,统计归纳出常见病原微生物的检出 情况。病原微生物参考序列数据库作为应用层级,用于比对;病原微生物注释数据库 属于注释层级,用于注释;样本归纳信息属于信息层级,用于数据输入和形成信息池。 病原微生物数据库利用《微生物参考序列数据库管理软件》收集、整理、调用和索取 各种微生物参考序列,让参考序列的收集和更新工作有序进行。病原微生物注释数据 库利用《微生物参考序列数据库管理软件》针对微生物宏基因组检测项目数据的特征, 有效地整合了各个病原微生物宏基因组检测项目的项目信息、病例信息、文库信息、 数据信息及测序和比对结果信息,建立可支持参考序列注释自动搜索、根据参考序列 自动补充注释、根据注释列表自动补充参考序列,进而实现对海量病原体参考序列及 注释数据的管理与应用,能够实现数据的自动载入、查询、下载、修改、统计的管理 与应用的数据库管理。
病原微生物注释数据库中注释包括但不限于基因组大小、致病性和人体常见部位。
在病原微生物鉴定模块103中,比对采用minimap2算法,该算法能够快速将DNA 或者mRNA序列比对到参考序列上。
在病原微生物鉴定模块103中,多次比对为二次比对,包括第一比对和第二比对,第一比对将高质量序列集利用第一参数与病原微生物数据库进行比对,能够比对上病 原微生物数据库的序列为第一序列集,统计得到第一序列集比对到的第一病原微生物 信息;第二比对将高质量序列集利用第二参数与病原微生物数据库进行比对,能够比 对上病原微生物数据库的序列为第二序列集,统计得到第二序列集比对到的第二病原 微生物信息,将第一病原微生物信息和第二病原微生物信息的交集作为病原微生物鉴 定结果。
病原微生物鉴定结果包括物种信息、物种reads数目、reads占该物种比例、覆盖度、深度和物种相对富集丰度。
病原微生物鉴定模块103还对病原微生物鉴定结果进行验证:将病原微生物序列集进行在线BLASTN比对,利用比对一致性和查询序列覆盖度信息剔除假阳性结果。
实施例2实施例1的病原微生物检测系统在支气管肺泡灌洗液微生物检测鉴定 中的应用
本实施例基于实施例1建立的基于纳米孔测序的病原微生物检测系统和方法,对支气管肺泡灌洗液微生物样本进行检测鉴定。
在检测鉴定时,加入重复对照和空白对照,实现平行质控。具体实施步骤如下:
1样本信息
收集2份疑似感染病人的支气管肺泡灌洗液样本。
患者一临床症状为:发现血糖高6年,纳差,乏力5天。临床诊断为:重症肺炎。 用药信息:抗菌素:亚胺培南西司他丁,莫西沙星,替考拉宁。
患者二临床症状为:发热,咳嗽,咳痰。
根据临床症状,判断两者可能存在病原微生物感染。
样本信息录入:患者一样品编号为A1.1,患者二样品编号为A1.2。两份样本的临床症状,临床诊断和用药信息等样本信息如实录入至《测序样本信息管理软件》信息 录入界面。
2样品收集及转运
根据临床标准收集疑似感染病人的支气管肺泡灌洗液样本,在0~4℃环境下保存及转运。
3样本核酸提取
本实施例检测项目均为病原体DNA检测。
1)颠倒混匀管内样本,各取500μL于1.5mL离心管进行12,000rpm离心2分钟, 离心后各取400μL上清于1.5mL离心管进行DNA。采用天根试剂盒(TIANamp Micro DNA kit),按试剂盒说明书操作并加入磁珠研磨细胞,使细胞裂解后提取样本总核酸, 洗脱体积为60μL;
2)取1μL核酸样本采用QubitX-GreenII试剂盒在Qubit 3.0仪器上测定核酸浓度,按试剂盒说明书对样本进行核酸定量。
4测序前样本处理
提取后的核酸样本按照以下流程进行建库。建库方案选取自牛津纳米孔公司提供的1DNativebarcodingprotocol:
1)使用g-TUBE(Covaris)将1.2μg核酸样本在5,000转/分钟的条件下打断1分 钟,获得片段化的DNA;
2)核酸的末端修复:在45μL片段化的DNA中加入3μLUltraⅡ End-prepenzymemix、7μLUltraⅡEnd-prepreactionbuffer和5μL nuclease-freewater,于 1.5mlPCR管中进行混匀,20℃反应5分钟过后65℃再反应5分钟;
3)加barcode:每个样本取末端修复后的核酸500ng,各加入2.5μLNativeBarcode和25μLBlunt/TALigaseMasterMix,混匀后21℃反应30分钟;
4)加接头:将上一步加好barcode的所有样本共取700ng,加入 20μLBarcodeAdapterMix和10μLQuickT4 DNALigase,混匀后室温反应10分钟。
5测序
1)文库上机:在NanoporeMinION便携式测序仪上进行测序。用Running Buffer FM576μL和Nuclease-free water 624μL温和吹吸混匀配成起始缓冲液。测序前,测序芯片port用800μL起始缓冲液室温孵育5分钟。将35μL Running Buffer FM, 25.5μLLibraryloadingbeads和DNA文库混合准备上机。将200μL起始缓冲液加入至测 序仪sampleport中,避免引入气泡;将75μL文库温和吹吸混匀并逐滴加入sample port 中,先后将sample port和priming port关闭。
2)设置测序仪器参数,测序运行时间设为“24h”。开始测序。
6测序数据收集
2个样本中,样本A1.1与A1.2平行建库,有特定内参序列和空白对照NTC(即 纯水),则2个样本一共产生6套测序数据。其中,内参序列为人工合成的特定序列, 核苷酸序列如下(5’-3’):
TGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCACGGACT TCGGTCTGG
测序数据的分析流程如下:
1)将Nanopore MinION测序产生生物电信号通过《MinKNOW软件》控制仪器, 将电信号转换为碱基信号,测序与实时碱基识别,检测运行状态,得到fastq格式的序 列信息,生成数据集1,即为原始序列集;
2)根据《测序样本信息管理软件》录入的样本信息以及数据质检参数;样本信息包括样本类型、检测项目、关注的病原体类型、抗菌素的使用和文库质量及它们之间 的关系等信息,数据质检参数,包括于数据量、序列平均长度、最小质量值;质检前, 根据样本信息从数据库中调取对应的数据质检参数,并将同类型的数据质检参数进行 整合,得到样本信息对应的最适参数组合,形成数据质检方案,并自动调整处理和过 滤参数。
其中,本次minimap2算法快速比对,参数自动设置为“-ax map-ont-k 15”,参 数意义是本次nanopore测序输出文件为sam格式,数据类型为map-ont,最小k-mer 长度为15,其余参数(如比对率,识别区块大小,置信度等)取默认值;
3)利用《QC_for_nanopore》对数据集1质控,生成数据集2:过滤小于150bp 的短序列,以及碱基质量分数低于15的序列将被剔除,质控后的数据集为数据集2, 即高质量序列集;
4)质控后的数据集2使用《纳米孔宏基因组测序病原微生物分析软件》进行和自建病原数据库identifiable_species_DB数据库的分析流程,采用minimap2算法快速将DNA序列比对到病原微生物多数据库系统参考基因组上;并使用《微生物参考序列数 据库管理软件》为宿主和微生物参考序列作分类、注释和管理;
5)《纳米孔宏基因组测序病原微生物分析软件》将数据集2比对得到的匹配序列生成数据集3,用于下步比对,
其中,本次minimap2算法快速比对,参数自动设置为“-ax map-ont-k 7”,参数 意义是本次nanopore测序输出文件为sam格式,数据类型为map-ont,最小k-mer长 度为7,其余参数(如比对率,识别区块大小,置信度等)取默认值;
6)数据集3匹配序列使用BLASTN与病原微生物多数据库系统中的参考基因组 比对,参数自动设置为“-perc_identity 90–word_size 16-evalue 0.000 001”(比对率为90,识别区块大小为16,置信度e-value设定为0.000 001),未匹配的序列定义为“未 分类序列”;
7)为进一步了解比对详情,将数据集2、3中匹配到的序列提取出来,形成数据 集4,进行在线BLAST比对,并挑选出比对一致性较好的基因组,用于下游分析并 统计比对情况,包括比对一致性、查询序列覆盖度等信息;
8)剔除假阳性结果。
实施例2测序数据的基本信息如表1所示:
表1实施例2不同样本测序结果情况
7获得分析结果
测序结果如表2所示,使用《病原微生物自动化报告软件》生成病原微生物检测 报告。
实施例2所述分析结果如表2所示:
表2实施例2不同样本分析结果
实施例3实施例1的病原微生物检测系统在血液微生物检测鉴定中的应用
本实施例基于实施例1建立的基于纳米孔测序的病原微生物检测系统和方法,对血浆样本进行检测鉴定。
在检测鉴定时,加入重复对照和空白对照,实现平行质控。具体实施步骤如下:
1样本信息:
根据临床标准收集2份疑似感染病人的血浆样本。
患者一临床症状为:发现血糖高6年,纳差,乏力5天。临床诊断为:重症肺炎。 用药信息:抗菌素:亚胺培南西司他丁,莫西沙星,替考拉宁。
患者二临床症状为:进行性贫血。临床诊断为:贫血查因。用药信息未提供。临 床病原微生物检测结果:甲类传染病:阴性;HIV:阴性;结核:阴性。
根据临床症状,判断两者可能存在病原微生物感染。
样本信息录入:患者一样品编号为A2.1,患者二样品编号为A2.2。两份样本的临床症状,临床诊断、用药信息和临床病原微生物检测结果如实录入至《测序样本信息 管理软件》信息录入界面。
2样品收集及转运
根据临床标准收集疑似感染病人的血浆样本,0~4℃环境下保存及转运。
3样本核酸提取
本实施例中检测项目均为病原体DNA和RNA检测。
1)DNA提取:颠倒混匀管内样本,各取500μL于1.5mL离心管进行12,000rpm 离心2分钟,离心后各取400μL上清于1.5mL离心管进行DNA提取。采用天根试剂 盒(TIANampMicro DNA kit),按试剂盒说明书操作并加入磁珠研磨细胞,使细胞裂 解后提取样本总核酸,洗脱体积为60μL;
2)RNA提取:颠倒混匀管内样本,各取500μL于1.5mL离心管进行12,000rpm 离心2分钟,离心后各取400μL上清于1.5mL离心管进行RNA提取。采用天根试剂 盒(RNAsimpleTotal RNA Kit),按试剂盒说明书操作并加入磁珠研磨细胞,使细胞 裂解后提取样本总核酸,洗脱体积为60μL;
3)取1μL核酸样本采用Qubit dsDNA assay试剂盒在Qubit 4.0仪器上测定核酸浓度,按试剂盒说明书对样本进行核酸定量。
4测序前样本处理
提取后的核酸样本按照以下流程进行建库。建库方案选取牛津纳米孔公司提供的1DNativebarcodingprotocol:
1)对RNA样品添加Poly U尾巴:用NEB M0337S Poly(U)Polymerase和TAKARA UTP对总RNA 3’端进行标记,实现与DNA的区分;
2)将带有Poly U尾巴的RNA反转录成cDNA,并在其5′端添加MID条形码序 列,用于区分测序后样本信息;
3)使用g-TUBE(Covaris)将1.2μgDNA样本在5,000转/分钟的条件下打断1分 钟,获得片段化的DNA;
4)将步骤2)得到的cDNA样品与步骤3)得到的DNA样品混合建库;
5)核酸的末端修复:每个样品取45μL混合核酸样本中加入3μLUltraⅡ End-prepenzymemix、7μLUltraⅡEnd-prepreactionbuffer和5μL nuclease-freewater,总 计60μL的体系在1.5mlPCR管中进行混匀,20℃和65℃依次反应5分钟;
6)加barcode:每个样本取末端修复后的核酸片段500ng,各加入2.5μLNativeBarcode和25μLBlunt/TALigaseMasterMix,混匀后21℃反应30分钟;
7)加接头:将上一步加好barcode的所有样本共取700ng,加入 20μLBarcodeAdapterMix(BAM)和10μLQuickT4 DNALigase,混匀后室温反应10分 钟。
5测序
1)文库上机:在NanoporeMinION便携式测序仪上进行测序。用Running Buffer FM576μL和Nuclease-free water 624μL温和吹吸混匀配成起始缓冲液。测序前,测序芯片port用800μL起始缓冲液室温孵育5分钟。将35μL Running Buffer FM, 25.5μLLibraryloadingbeads和DNA文库混合。将200μL起始缓冲液加入至测序仪 sampleport中,避免引入气泡;将75μL文库温和吹吸混匀并逐滴加入sample port中, 先后将sample port和priming port关闭。
2)设置测序仪器参数,测序运行时间设为“24h”。开始测序。
6测序数据收集
2个样本中,样本A2.1与A2.2平行建库,有特定内参序列和空白对照NTC(即 纯水),则2个样本一共产生6套测序数据。其中,内参序列为人工合成的特定序列, 核苷酸序列如下(5’-3’):
TGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCACGGACT TCGGTCTGG
测序数据的分析流程如下:
1)将Nanopore MinION测序产生生物电信号通过《MinKNOW软件》控制仪器, 将电信号转换为碱基信号,测序与实时碱基识别,检测运行状态,得到fastq格式的序 列信息;
2)每个样品两个个生物学重复,实现DNA和RNA的同时检测,因而可以对RNA 中每个基因覆盖度基于DNA文库中相应文库的覆盖层数进行校正后,再进行差异分 析,生成数据集1,即为原始序列集;
3)利用《QC_for_nanopore》对数据集1质控,生成数据集2:过滤小于150bp 的短序列,以及碱基质量分数低于7的序列将被剔除,质控后的数据集为数据集2, 即为高质量序列集;
4)如实施例1,根据录入的样本信息(如样本类型、重点关注的物种等)和文库 质量等信息,自动选择预设方案,并自动调整处理和过滤参数,
其中,本次minimap2算法快速比对,参数自动设置为“-ax map-ont-k 15”,参 数意义是本次nanopore测序输出文件为sam格式,数据类型为map-ont,最小k-mer 长度为15,其余参数(如比对率,识别区块大小,置信度等)取默认值;
5)质控后的数据集2使用《纳米孔宏基因组测序病原微生物分析软件》进行和自建病原数据库identifiable_species_DB数据库的分析流程,采用minimap2算法快速将DNA序列比对到病原微生物多数据库系统参考基因组上;并使用《微生物参考序列数 据库管理软件》为宿主和微生物参考序列作分类、注释和管理;
6)《纳米孔宏基因组测序病原微生物分析软件》将数据集2比对得到的匹配序列生成数据集3,用于下步比对,
其中,本次minimap2算法快速比对,参数自动设置为“-ax map-ont-k 7”,参数 意义是本次nanopore测序输出文件为sam格式,数据类型为map-ont,最小k-mer长 度为7,其余参数(如比对率,识别区块大小,置信度等)取默认值;
7)数据集3匹配序列使用BLASTN与病原微生物多数据库系统中的参考基因组 比对,参数自动设置为“-perc_identity 90–word_size 16-evalue 0.000 001”(比对率为90,识别区块大小为16,置信度e-value设定为0.000 001),未匹配的序列定义为“未 分类序列”;
8)为进一步了解比对详情,将数据集2、3中匹配到的序列提取出来,形成数据 集5,进行在线BLAST比对,并挑选出比对一致性较好的基因组,用于下游分析并 统计比对情况,包括比对一致性、查询序列覆盖度等信息;
9)剔除假阳性结果。
实施例3测序数据的基本信息如表3所示:
表3实施例3不同样本测序结果情况
7获得分析结果:
测序结果如表4所示,使用《病原微生物自动化报告软件》生成病原微生物检测 报告。
实施例3所述分析结果如表4所示:
表4实施例3不同样本分析结果
实施例4实施例1的病原微生物检测系统在脑脊液微生物检测鉴定中的应用
本实施例基于实施例1建立的基于纳米孔测序的病原微生物检测系统和方法,对脑脊液样本进行检测鉴定。
在检测鉴定时,加入重复对照和空白对照,实现平行质控。具体实施步骤如下:
1样本信息
根据临床标准收集1份疑似感染病人的脑脊液样本。
患者临床症状为:发热,头痛1天,呕吐4次。临床诊断为:发热、头痛原因待 查:疑似中枢神经系统感染。用药信息为:头孢曲松+阿昔洛韦抗感染,甘露醇降颅 压。根据临床症状,判断其可能存在病原微生物感染。
样本信息录入:样品编号为A3。样本的临床症状,临床诊断和用药信息如实录入至《测序样本信息管理软件》信息录入界面。
其中,《测序样本信息管理软件》信息录入内容可以包括但不限于临床症状,临 床诊断,用药信息,检测重点关注的物种等。
2样品收集及转运
根据临床标准收集疑似感染病人的脑脊液样本,在0~4℃环境下保存及转运。
3样本核酸提取
本实施例检测项目为病原体RNA检测。
1)RNA提取并纯化收集:颠倒混匀管内样本,取1mL于1.5mL离心管进行 12,000rpm离心2分钟,离心后取500μL上清于1.5mL离心管进行RNA提取。采用 天根试剂盒(RNAsimpleTotal RNA Kit),按试剂盒说明书操作提取样本总核酸。加 入Beckman AMPure XP磁珠,按说明书的方法对RNA产物进行纯化收集,洗脱体积 约为60μL。
2)取1μL核酸样本采用Quant-iT Picogreen试剂盒在Qubit 4.0仪器上测定核酸浓 度,按试剂盒和仪器说明书对样本进行核酸定量。
4测序前样本处理
提取后的RNA核酸样本按照以下流程进行建库。建库方案选取牛津纳米孔公司 提供的1DNativebarcodingprotocol:
1)对RNA样品添加Poly U尾巴:用NEB M0337S Poly(U)Polymerase和TAKARA UTP对总RNA 3’端进行标记,实现与DNA的区分;
2)将带有Poly U尾巴的RNA反转录成cDNA,并在其5′端添加MID条形码序 列,用于区分测序后样本信息;
3)cDNA的末端修复:在45μLcDNA中加入3μLUltraⅡEnd-prepenzymemix、 7μLUltraⅡEnd-prepreactionbuffer和5μL nuclease-freewater,1.5mlPCR管中进行混匀,金属浴20℃孵育5分钟过后65℃再孵育5分钟;
4)加barcode:取末端修复后的cDNA样本11.25μL,加入2.5μLNativeBarcode 和25μLBlunt/TALigaseMasterMix,混匀后21℃反应30分钟;
5)加接头:将上一步加好barcode的样本共取33μL,加入 20μLBarcodeAdapterMix1D和47μLNEXTflexTMLigaseEnzymeMix,混匀后室温反应10 分钟。
5设定参数,测序
1)文库上机:在NanoporeMinION便携式测序仪上进行测序。用Running Buffer FM576μL和Nuclease-free water 624μL温和吹吸混匀配成起始缓冲液。测序前,测序芯片port用800μL起始缓冲液室温孵育5分钟。将35μL Running Buffer FM, 25.5μLLibraryloadingbeads和DNA文库混合。将200μL起始缓冲液加入至测序仪 sampleport中,避免引入气泡;将75μL文库温和吹吸混匀并逐滴加入sample port中, 先后将sample port和priming port关闭;
2)设置测序仪器参数,测序运行时间设为“24h”。开始测序。
6测序数据收集
1个样本中,样本A3平行建库,有特定内参序列和空白对照NTC(即纯水),则 1个样本一共产生4套测序数据。其中,其中内参序列为人工合成的特定序列,,核 苷酸序列(5’-3’)如下:
ATTGACGGCGTAGTACACACTATTGAATCAAACAGCCGACCAATTGCACTA CCATCACAA
测序数据的分析流程如下:
1)将Nanopore MinION测序产生生物电信号通过《MinKNOW软件》控制仪器, 将电信号转换为碱基信号,测序与实时碱基识别,检测运行状态,得到fastq格式的序 列信息,生成数据集1,即原始序列集;
2)如实施例1,根据录入的样本信息(如样本类型、重点关注的物种等)和文库 质量等信息,自动选择预设方案,并自动调整处理和过滤参数,
其中,本次minimap2算法快速比对,参数自动设置为“-ax map-ont-k 15”,参 数意义是本次nanopore测序输出文件为sam格式,数据类型为map-ont,最小k-mer 长度为15,其余参数(如比对率,识别区块大小,置信度等)取默认值;
3)利用《QC_for_nanopore》对数据集1质控,生成数据集2:过滤小于150bp 的短序列,以及碱基质量分数低于7的序列将被剔除,质控后的数据集为数据集2, 即高质量序列集;
4)质控后的数据集2使用《纳米孔宏基因组测序病原微生物分析软件》进行和自建病原数据库identifiable_species_DB数据库的分析流程,采用minimap2算法快速将DNA序列比对到病原微生物多数据库系统参考基因组上;病原微生物多数据库系统中 的宿主和微生物参考序列主要来源于公开的NCBI数据库,并使用《测序数据库管理 软件》为宿主和微生物参考序列作分类、注释和管理;
5)《纳米孔宏基因组测序病原微生物分析软件》将数据集2第二次比对得到的匹配序列生成数据集3,用于下步比对,
其中,本次minimap2算法快速比对,参数自动设置为“-ax map-ont-k 7”,参数 意义是本次nanopore测序输出文件为sam格式,数据类型为map-ont,最小k-mer长 度为7,其余参数(如比对率,识别区块大小,置信度等)取默认值;
6)数据集3匹配序列使用BLASTN与病原微生物多数据库系统中的参考基因组 比对,参数自动设置为“-perc_identity 90–word_size 16-evalue 0.000 001”(比对率为90,识别区块大小为16,置信度e-value设定为0.000 001),未匹配的序列定义为“未 分类序列”;
7)为进一步了解比对详情,将数据集2、3中匹配到的序列提取出来,形成数据 集4,进行在线BLAST比对,并挑选出比对一致性较好的基因组,用于下游分析并 统计比对情况,包括比对一致性、查询序列覆盖度等信息;
8)剔除假阳性结果。
实施例4所述测序数据的基本信息如表5所示:
表5实施例4样本测序结果情况
7获得分析结果
经过生信分析计算的测序结果如表6所示,使用《病原微生物自动化报告软件》 生成病原微生物检测报告。
实施例4所述分析结果如表6所示:
表6实施例4样本分析结果
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术 人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书 所限定的范围。