发明内容
为了解决上述技术问题中的至少一个,本发明采用了技术方案如下:
本发明的第一方面提供了一种结核分枝杆菌复合群鉴定引物组合,所述结核分枝杆菌复合群包括结核分枝杆菌,牛结核分枝杆菌,非洲分枝杆菌,田鼠分枝杆菌,所述引物组合包括以下10个引物对:靶向扩增结核分枝杆菌3个特异序列的引物对:SEQ ID No.1和SEQ ID No.2组成的第1引物对,SEQ ID No.3和SEQ ID No.4组成的第2引物对,SEQ IDNo.5和SEQ ID No.6组成的第3引物对,特异序列如SEQ ID No.41至SEQ ID No.43所示;
靶向扩增牛结核分枝杆菌3个特异序列的引物对:SEQ ID No.7和SEQ ID No.8组成的第4引物对,SEQ ID No.9和SEQ ID No.10组成的第5引物对,SEQ ID No.11和SEQ IDNo.12组成的第6引物对,特异序列如SEQ ID No.44至SEQ ID No.46所示;
靶向扩增非洲分枝杆菌2个特异序列的引物对:SEQ ID No.13和SEQ ID No.14组成的第7引物对,SEQ ID No.15和SEQ ID No.16组成的第8引物对,特异序列如SEQ IDNo.47至SEQ ID No.48所示;
靶向扩增田鼠分枝杆菌2个特异序列的引物对:SEQ ID No.17和SEQ ID No.18组成的第9引物对,SEQ ID No.19和SEQ ID No.20组成的第10引物对,特异序列如SEQ IDNo.49至SEQ ID No.50所示。
进一步地,所述引物组合还包括靶向扩增rpoB、katG、inhA、gyrA四个耐药基因位点特异序列的引物对:SEQ ID No.21和SEQ ID No.22组成的第11引物对,SEQ ID No.23和SEQ ID No.24组成的第12引物对,SEQ ID No.25和SEQ ID No.26组成的第13引物对,SEQID No.27和SEQ ID No.28组成的第14引物对,特异序列如SEQ ID No.51至SEQ ID No.54所示。
进一步地,所述引物组合还包括靶向扩增人源序列的引物对:SEQ ID No.29和SEQID No.30组成的第15引物对、SEQ ID No.31和SEQ ID No.32组成的第16引物对,SEQ IDNo.33和SEQ ID No.34组成的第17引物对,SEQ ID No.35和SEQ ID No.36组成的第18引物对,SEQ ID No.37和SEQ ID No.38组成的第19引物对,人源序列如SEQ ID No.55至SEQ IDNo.59所示。
进一步地,所述引物组合还包括靶向扩增内参序列的引物对:SEQ ID No.39和SEQID No.40组成的第20引物对,内参序列如SEQ ID No.60所示。
在一些优选实施例中,引物组合采用下列方式获得:以结核分枝杆菌复合群以及耐药位点的参考基因组序列组成基因组数据库,将不同种类的结核分枝杆菌的参考基因组以kmer的方式切割成150bp的长片段,片段之间允许有100bp的重叠区,将kmer片段与上述基因组数据库用软件进行比对,分析比对结果找出不同类型的结核分枝杆菌仅能比对上自身物种,且无法比对上其他物种的kmer片段集,得到的kmer片段集即为该物种的特异性序列集,通过以上方法,找出结核分枝杆菌复合群及耐药位点的特异性序列集,再以得到的结核分枝杆菌复合群及耐药位点的特异性序列集设计出扩增特异序列所需的引物,添加1对内参引物对以及5对人源引物对,共同组成引物组合。
本发明的第二方面提供了一种结核分枝杆菌复合群鉴定试剂盒,包括第一方面所述的引物组合。
本发明的第三方面提供了一种非诊断非治疗目的的结核分枝杆菌复合群鉴定的方法,包括如下步骤:
(1)利用本发明第一方面所述的引物组合进行多重PCR扩增,获得的高质量测序文库经测序后得到样本的原始序列集,接受样本的原始序列集和样本信息的输入,并用数据质控参数对所述原始序列集进行质控,得到高质量序列集;
(2)构建鉴定数据库,包括特异序列、注释信息以及样本归纳信息;
(3)将所述高质量序列集与鉴定数据库进行比对,过滤掉非靶标的序列,得到比对序列集;将比对序列集及其相应的结核分枝杆菌信息作为分析的鉴定结果。
(4)将分析得到的鉴定结果输出并存储到鉴定数据库中,对鉴定数据库进行更新。
在一些具体实施方案中,特异序列包括SEQ ID No.41至SEQ ID No.43所示的结核分枝杆菌的特异序列,SEQ ID No.44至SEQ ID No.46所示的牛结核分枝杆菌的特异序列,SEQ ID No.47至SEQ ID No.48所示的非洲分枝杆菌的特异序列,SEQ ID No.49和SEQ IDNo.50所示的田鼠分枝杆菌的特异序列,在一些具体实施方案中,还包括SEQ ID No.51至SEQ ID No.54所示的rpoB、katG、inhA、gyrA四个耐药基因位点的特异序列;在一些具体实施方案中,还包括SEQ ID No.55至SEQ ID No.59所示的人源序列;在一些具体实施方案中,还包括SEQ ID No.60所示的内参序列。
在本发明的一些具体实施方案中,步骤(1)的具体步骤如下:采用试剂盒进行提取、核酸质检、文库构建,其中,文库构建是指:加入内参序列;待测DNA两侧先加上A碱基,使平末端变成粘性末端,然后再加上Y接头以及马达蛋白,并对建立的文库进行质检,得到高质量测序文库。
在本发明的一些具体实施方案中,利用NextSeq 550测序仪对上述文库进行测序,得到的bcl文件,经bcl2fastq软件得到原始fastq格式的序列信息,为基于靶向测序技术的原始序列集。
在一些具体实施方案中,样本信息包括但不限于样本类型、临床表现、重点关注物种和文库质量信息;在一些具体实施方案中,数据质控参照包括但不限于所述样本类型和所述重点关注的物种而自动选择数据质检方案,并自动调整处理和过滤参数。
在一些具体实施方案中,自动选择数据质检方案具体如下:样本信息包括但不限于样本类型、检测项目、关注的病原体类型、抗菌素的使用、文库信息及它们之间的关系;在一些具体实施方案中,数据质控参数,包括但不限于数据量、序列平均长度、最小质量值;将各所述样本信息与数据质控参数的对应关系输入数据库。
在一些具体实施方案中,质检前,根据样本信息从数据库中调取对应的数据质控参数,并将同类型的数据质控参数进行整合,得到样本信息对应的最适参数组合,形成数据质检方案。
鉴定数据库中包含以下特异序列:SEQ ID No.41至SEQ ID No.50所示的结核分枝杆菌复合群特异序列,SEQ ID No.51至SEQ ID No.54所示的耐药位点特异序列,SEQ IDNo.55至SEQ ID No.59所示的人源异序列以及SEQ ID No.60所示的内参序列;具体地,包括3条结核分枝杆菌特异序列,3条牛结核分枝杆菌特异序列,2条非洲分枝杆菌特异序列,2条田鼠分枝杆菌特异序列这10个结核分枝杆菌复合群特异序列以及4个耐药位点特异序列,耐药位点包含的4条特异序列,分别对应rpoB、katG、inhA、gyrA四个耐药基因位点的检测序列;还包含1个内参序列、5个人源特异序列。
鉴定数据库中注释信息包括靶向特异序列的大小、物种名称、基因名称、耐药突变和药物名称;鉴定数据库中样本归纳信息为每次鉴定得到的鉴定结果,用于存储在鉴定数据库中对鉴定数据库进行更新。
在一些具体实施方案中,鉴定数据库的更新可以自动更新或者手动进行更新,从而进一步丰富鉴定数据库系统的内容,生成一个更易于搜索、更有利于物种比对的鉴定数据库。在本发明的一些实施方案中,鉴定数据库更新可以是定期更新或者不定期更新。
在一些具体实施方案中,序列的比对,将所述高质量序列集使用bwa软件与鉴定数据库进行比对,能够比对上鉴定数据库的为靶标序列集,统计得到靶标序列集比对到的鉴定物种信息,作为靶向病原微生物鉴定结果。
在一些具体实施方案中,鉴定结果包括但不限于物种信息、物种靶标序列数、物种靶标拷贝数、核酸突变结果、耐药位点信息。
发明的第四方面提供了一种结核分枝杆菌复合群鉴定系统,包括以下4个模块:
(1)数据输入模块,用于接受利用本发明的第一方面所述的引物组合进行多重PCR扩增获得的高质量测序文库经测序后得到的样本的原始序列集和样本信息的输入,并用数据质控参数对所述原始序列集进行质控,得到高质量序列集;
(2)数据库存储模块,用于存储鉴定数据库;
(3)病原微生物鉴定模块,分别与数据输入模块和数据库存储模块连接,用于将所述高质量序列集与鉴定数据库进行比对,过滤掉非靶标的序列,得到比对序列集,将比对序列集及其相应的结核分枝杆菌信息作为分析的鉴定结果;
(4)结果输出模块,与所述病原微生物鉴定模块连接,用于输出结核分枝杆菌鉴定结果,还与数据库存储模块连接,用于输出的鉴定结果的存储以及鉴定数据库的更新。
通过实施本发明的技术方案,可以达到以下有益效果:
(1)本发明设计的结核分枝杆菌复合群相关的高特异引物,可以高效地靶向扩增。其中利用本发明创造的引物设计方法得到的引物组合,对结核分枝杆菌复合群高度特异,一方面能克服样本中人源和其它微生物序列的干扰,使需求的测序量更低,明显降低测序成本,另一方面由于靶向扩增富集了样本中的结核分枝杆菌复合群核酸片段,能放大阳性与阴性样本的结果差异,从而设定更严格的检出阈值,增加判读的可信度;引物试剂还为高效靶向扩增提供了合适的扩增体系,能构建更高质量的文库用于测序,提高靶向测序的灵敏度和分辨率。
(2)本发明创造了一种新的基于靶向测序技术的结核分枝杆菌复合群鉴定及耐药位点检测方法,改善了结核分枝杆菌复合群及其耐药位点的一般鉴定方法中存在的检测范围窄及时效性低,主要通过高特异性引物试剂的开发以及分析流程的一体化和自动化来实现的这两大缺点。
(3)本发明的检测方法能充分利用靶向测序技术高灵敏以及高分辨率的特点,准确高效地对结核分枝杆菌复合群进行鉴定,并对耐药位点进行检测,为临床提供高质量检测服务。
(4)本发明所述结核分枝杆菌复合群及耐药位点的鉴定数据库,具有层次清晰的逻辑结构:结核分枝杆菌复合群及耐药位点的特异序列作为应用层级,用于比对;注释信息属于注释层级,用于注释。特异序列与高特异引物试剂配套,注释信息是根据特异序列整理特异序列的序列大小、耐药突变位点等方面注释信息,并构建注释信息索引。本发明所述方法和系统可减少注释搜索时间,提高数据访问性能,降低计算机运算负担,运算速度更快。
具体实施方式
除非另有说明、从上下文暗示或属于现有技术的惯例,否则本申请中所有的份数和百分比都基于重量,且所用的测试和表征方法都是与本申请的提交日期同步的。在适用的情况下,本申请中涉及的任何专利、专利申请或公开的内容全部结合于此作为参考,且其等价的同族专利也引入作为参考,特别这些文献所披露的关于本领域中的合成技术、产物和加工设计、聚合物、共聚单体、引发剂或催化剂等的定义。如果现有技术中披露的具体术语的定义与本申请中提供的任何定义不一致,则以本申请中提供的术语定义为准。
本申请中的数字范围是近似值,因此除非另有说明,否则其可包括范围以外的数值。数值范围包括以1个单位增加的从下限值到上限值的所有数值,条件是在任意较低值与任意较高值之间存在至少2个单位的间隔。例如,如果记载组分、物理或其它性质(如分子量,熔体指数等)是100至1000,意味着明确列举了所有的单个数值,例如100,101,102等,以及所有的子范围,例如100到166,155到170,198到200等。对于包含小于1的数值或者包含大于1的分数(例如1.1,1.5等)的范围,则适当地将1个单位看作0.0001,0.001,0.01或者0.1。对于包含小于10(例如1到5)的个位数的范围,通常将1个单位看作0.1。这些仅仅是想要表达的内容的具体示例,并且所列举的最低值与最高值之间的数值的所有可能的组合都被认为清楚记载在本申请中。
关于化学化合物使用时,除非明确地说明,否则单数包括所有的异构形式,反之亦然(例如,“己烷”单独地或共同地包括己烷的全部异构体)。另外,除非明确地说明,否则用“一个”,“一种”或“该”形容的名词也包括其复数形式。
术语“包含”,“包括”,“具有”以及它们的派生词不排除任何其它的组分、步骤或过程的存在,且与这些其它的组分、步骤或过程是否在本申请中披露无关。为消除任何疑问,除非明确说明,否则本申请中所有使用术语“包含”,“包括”,或“具有”的组合物可以包含任何附加的添加剂、辅料或化合物。相反,出来对操作性能所必要的那些,术语“基本上由……组成”将任何其他组分、步骤或过程排除在任何该术语下文叙述的范围之外。术语“由……组成”不包括未具体描述或列出的任何组分、步骤或过程。除非明确说明,否则术语“或”指列出的单独成员或其任何组合。
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。
实施例
以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白,下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术,因此可以视为实施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白,这里所公开的特定实施例可以做很多修改,仍然能得到相同的或者类似的结果,而非背离本发明的精神或范围。
除非另有定义,所有在此使用的技术和科学的术语,和本发明所属领域内的技术人员所通常理解的意思相同,在此公开引用及他们引用的材料都将以引用的方式被并入。那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。
下述实施例中未作具体说明的分子生物学实验方法,均按照《分子克隆实验指南》(第四版)(J.萨姆布鲁克、M.R.格林,2017)一书中所列的具体方法进行,或者按照试剂盒和产品说明书进行。其他实验方法,如无特殊说明,均为常规方法。下述实施例中所用的仪器设备,如无特殊说明,均为实验室常规仪器设备;下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
实施例1用于结核分枝杆菌复合群鉴定及耐药位点检测的特异性引物组合
在本发明中,结核分枝杆菌复合群包括结核分枝杆菌、牛结核分枝杆菌、非洲分枝杆菌和田鼠分枝杆菌。耐药位点包括rpoB基因的526、531位密码子,katG基因的315位密码子,inhA基因的-8、-15位密码子、gyrA基因的90、94位密码子。
首先,将结核分枝杆菌复合群以及耐药位点的参考基因组序列,组成结核分枝杆菌复合群基因组数据库。将上述不同类型结核分枝杆菌的参考基因组以kmer的方式切割成150bp的长片段,这些片段之间允许有100bp的重叠区,然后将不同类型结核分枝杆菌的kmer片段与上述的结核分枝杆菌复合群基因组数据库,使用bwa软件进行比对,得到上述kmer片段与数据库的比对结果,对以上比对结果进行综合分析,找出不同类型的结核分枝杆菌复合群仅能比对上自身物种,且无法比对上其他物种的kmer片段集,而该kmer片段集即可认为是该物种的特异性序列集。通过以上方法,分别找出结核分枝杆菌复合群及耐药位点对应的特异序列组成特异性序列集,再以上述特异性序列集使用primer3设计出扩增特异序列所需的引物。在此基础上,添加1对内参引物以及5对人源引物对,共同组成可用基于靶向测序技术的结核分枝杆菌复合群鉴定及耐药位点检测的引物组合。
本发明设计的引物序列如表1所示。
表1引物对应信息
利用结核分枝杆菌复合群阳性文库,测试上述特异性引物组合的有效性。
首先,将已知包含结核分枝杆菌复合群序列的文库与上述特异性引物组合采用两轮PCR法,第一步PCR是将目标序列与引物结合,扩增目标序列;第二步则是加上带有Index序列的测序通用接头,并对目标序列进行富集,纯化后即可完成检测文库的构建,再利用高通量测序进行扩增产物同步检测,对下机数据进行生物信息学分析,确认下机数据中包含特异性引物扩增的特异序列,即可证明特异性引物组合的有效性。
实施例2用于结核分枝杆菌复合群鉴定及耐药位点检测的数据库
本实施例基于实施例1得到的特异序列,来建立基于靶向测序技术的结核分枝杆菌复合群鉴定及耐药位点检测的鉴定数据库,如图1所示,包含:
(1)用于结核分枝杆菌复合群鉴定及耐药位点检测的特异序列,存储结核分枝杆菌、牛结核分枝杆菌、非洲分枝杆菌、田鼠分枝杆菌和人、内参的特异序列,以及存储包含rpoB基因的531、526位密码子;katG基因的315位密码子;inhA基因的-8、-15位密码子;gyrA基因的90、94位密码子的特异序列,作为所述物种和耐药的代表序列,用于生信分析,鉴定样本中是否含有所述特异序列及对应耐药突变存在。
(2)结核分枝杆菌复合群及耐药位点的注释信息,包括靶向特异序列的大小、物种名称、基因名称、耐药突变和药物名称。用于生信分析,将上述信息注释到比对上结核分枝杆菌复合群及耐药位点特异序列的靶标序列集。所述结核分枝杆菌复合群及常见耐药位点注释信息为关系型的。在一些具体实施方案中,所述结核分枝杆菌复合群及常见耐药位点的注释信息还包含但不限于序列大小、物种名称、基因名称和耐药突变信息。
(3)样本归纳信息,结核分枝杆菌复合群及耐药位点的鉴定结果作为样本归纳信息,存储至结核分枝杆菌复合群及耐药位点的鉴定数据库中,再次对样本进行结核分枝杆菌复合群及耐药位点鉴定时,利用新的结核分枝杆菌复合群及耐药位点鉴定结果对鉴定数据库进行更新。
结核分枝杆菌复合群及耐药位点的鉴定数据库可以自动或者手动进行更新,从而进一步丰富结核分枝杆菌复合群及耐药位点的鉴定数据库系统内容,生成一个更易于搜索、更有利于物种比对的结核分枝杆菌复合群及耐药位点的鉴定数据库。在本发明的一些实施方案中,所述更新可以是定期也可以是不定期。
实施例3非诊断非治疗目的的结核分枝杆菌复合群鉴定及耐药位点检测方法及系统
本实施例提供了非诊断非治疗目的的结核分枝杆菌复合群鉴定及耐药位点检测的方法,包括如下步骤:
利用前文所述的引物组合进行多重PCR扩增,获得的高质量测序文库经测序后得到样本的原始序列集,接受样本的原始序列集和样本信息的输入,并用数据质控参数对所述原始序列集进行质控,得到高质量序列集。
构建结核分枝杆菌复合群及常见耐药位点的鉴定数据库,包括结核分枝杆菌复合群及常见耐药位点的特异序列、注释信息;还包括鉴定结果的样本归纳信息,用于存储鉴定结果并利用存储的鉴定结果对结核分枝杆菌复合群及常见耐药位点的鉴定数据库进行更新。
将所述高质量序列集与结核分枝杆菌复合群及常见耐药位点的鉴定数据库进行比对,过滤掉非靶标的序列,得到比对序列集;将比对序列集及其相应的结核分枝杆菌复合群及耐药位点进行信息分析;将分析得到的鉴定结果输出并存储到结核分枝杆菌复合群及常见耐药位点的鉴定数据库中。
本实施例提供了基于靶向测序技术的结核分枝杆菌复合群鉴定及耐药位点检测系统,如图2所示,包括:
数据输入模块101,用于接受样本基于二代测序的原始序列集和样本信息的输入,并用数据质控参数对所述原始序列集进行质控,得到高质量序列集;其中,样本信息包括但不限于样本类型、临床表现、重点关注物种和文库质量信息;数据质控参照包括但不限于所述样本类型和所述重点关注的物种而自动选择数据质检方案,并自动调整处理和过滤参数。自动选择数据质检方案具体如下:样本信息包括但不限于样本类型、检测项目、关注的病原体类型、抗菌素的使用、文库信息及它们之间的关系;数据质控参数,包括但不限于数据量、序列平均长度、最小质量值;将各所述样本信息与数据质控参数的对应关系输入数据库。质检前,根据样本信息从数据库中调取对应的数据质控参数,并将同类型的数据质控参数进行整合,得到样本信息对应的最适参数组合,形成数据质检方案;
数据库存储模块102,用于存储结核分枝杆菌复合群及耐药位点的鉴定数据库,包括结核分枝杆菌复合群及常见耐药位点的特异序列、注释信息和样本归纳信息;
病原微生物鉴定模块103,分别与数据输入模块101和数据库存储模块102连接,用于将所述高质量序列集与所述结核分枝杆菌复合群及耐药位点的鉴定数据库进行比对,过滤掉非靶标序列,得到比对序列集,将比对序列集及其相应的结核分枝杆菌复合群及耐药位点信息作为分析的鉴定结果;
结果输出模块104,与病原微生物鉴定模块103连接,用于输出结核分枝杆菌复合群及耐药位点鉴定结果;还与数据库存储模块102连接,用于将所述结核分枝杆菌复合群鉴定及常见耐药位点检测结果输出并储存在结核分枝杆菌复合群及耐药位点的鉴定数据库中,对鉴定数据库进行更新。
在本发明中,上述各模块通过构建相应的软件实现相应的功能,具体地:利用《测序样本信息管理软件》接受样本信息输入并管理,记录并整合样本来源、性质、质检及对应文库信息。
利用《测序数据管理软件》接受样本基于二代测序的原始序列集并管理,可对测序样本的测序数据和分析过程、结果进行存储、调取和管理。
利用《fastp》软件实现样本基于二代测序的原始序列集的质检质控。
利用《靶向病原微生物二代测序分析软件》实现靶向病原微生物鉴定模块的功能。
数据输入模块根据基于二代测序的原始序列集和样本信息,利用fastp软件对基于二代测序的原始序列集进行质控,过滤低质量碱基的序列和接头序列,得到高质量序列集。在一些实施例中,采用过滤简单重复的短序列,以及碱基质量分数低于15的序列。
数据库存储模块包括结核分枝杆菌复合群及耐药位点的特异序列、注释信息以及样本归纳信息,样本归纳信息为结核分枝杆菌复合群及耐药位点鉴定结果信息,包括一个或多个样本进行结核分枝杆菌复合群鉴定及常见耐药位点检测后得到的结核分枝杆菌复合群鉴定及常见耐药位点鉴定结果。
在病原微生物鉴定模块中,比对使用bwa软件,该软件能够快速将DNA或者RNA序列比对到参考序列上,将所述高质量序列集使用bwa软件与结核分枝杆菌复合群及耐药位点的特异序列(含内参)进行序列比对,过滤掉非靶标的序列,将能够比对上结核分枝杆菌复合群及耐药位点的鉴定数据库的得到比对序列集,将比对序列集及其相应的结核分枝杆菌复合群及耐药位点信息作为分析的鉴定结果。
结核分枝杆菌复合群点鉴定及耐药位点检测鉴定结果包括但不限于物种信息、物种靶标序列数、物种靶标拷贝数、核酸突变结果、耐药位点信息。
实施例4结核分枝杆菌复合群鉴定及耐药位点检测在标准品中的测试
本实施例基于人工合成的10条物种特异序列、包含突变的4条耐药特异序列、5条人源特异序列组成的标准品,测试本发明所述基于靶向测序技术的结核分枝杆菌复合群鉴定及耐药位点检测方法的可行性。
一、获取标准品
根据所述共计19条特异序列合成得到含有这些标准序列的标准品。
特异序列及内参如实施例1中的特异序列SEQ ID No.41-SEQ ID No.60所示。
二、靶向建库
1、按表2记录的反应体系配制靶标基因多重PCR扩增体系。
表2多重PCR扩增体系
2、配制后,混合均匀,短暂离心。
按表3条件设置靶标基因多重PCR扩增程序。
表3多重PCR扩增程序
3、第一轮PCR产物纯化
(1)下机后离心,补水30 µL至总体积50 µL。
(2)YN DNA Clean Beads提前30 min置于室温进行平衡,混匀后分装45 µL(0.9×)磁珠于有标记的1.5 mL低吸附管。
(3)按每反应900 µL的量配制80%乙醇,配制方法:水体积:乙醇体积=2(8000):8(32000)。
(4)将第一轮PCR的产物补水30 µL(总体积50 µL),混匀后转至分装好磁珠的1.5mL低吸附管。
(5)混匀,短暂离心,置于室温5 min。
(6)将管置于磁力架上2-5 min,直至液体澄清,小心吸弃上清,不要吸到磁珠。
(7)加入200 µL 80%乙醇,静置30 sec,小心吸弃上清,不要吸到磁珠。
(8)将样本管瞬时离心后置于磁力架上,用10 µL移液器吸弃管底余液(不要吸到磁珠)。
(9)磁力架上开盖晾干至磁珠表面无水光干裂,将离心管从磁力架上移开,并加入27 µL DW水洗脱,涡旋混匀,短暂离心,室温孵育5 min。
4、取出PCR 反应体系Adp Primer F,Adp Primer R,2×PCR Mix,解冻后混匀离心,置于冰上。按表4反应体系配制PCR mix。具体地:组合成的正向接头引物Adp Primer F和反向接头引物Adp Primer R,其序列碱基组成如下:
Adptor F(5'-3'):
AATYATACGGCGACCACCGAGATCTACACTCTTTCN6-12CCTACACGACGCTCTTCCGATCT;
Adptor R(5'-3'):
CAAGCAGAAGACGGCATACGAGATN6-12GTYACTYGAGTTCAGACGTYTYCTCTTCCGATCT;
其中N代表A、T、C、G任一种;下标6-12代表该样本识别条码的碱基序列数为6-12bp。
其中,当样本识别条码的碱基序列数为6时,正向接头引物Adp Primer F的序列如SEQ ID No.61所示;反向接头引物Adp Primer R的序列如SEQ ID No.62所示。
当样本识别条码的碱基序列数为7时,正向接头引物Adp Primer F的序列如SEQID No.63所示;反向接头引物Adp Primer R的序列如SEQ ID No.64所示。
当样本识别条码的碱基序列数为8时,正向接头引物Adp Primer F的序列如SEQID No.65所示;反向接头引物Adp Primer R的序列如SEQ ID No.66所示。
当样本识别条码的碱基序列数分别为9时,正向接头引物Adp Primer F的序列如SEQ ID No.67所示;反向接头引物Adp Primer R的序列如SEQ ID No.68所示。
当样本识别条码的碱基序列数为10时,正向接头引物Adp Primer F的序列如SEQID No.69所示;反向接头引物Adp Primer R的序列如SEQ ID No.70所示。
当样本识别条码的碱基序列数为11时,正向接头引物Adp Primer F的序列如SEQID No.71所示;反向接头引物Adp Primer R的序列如SEQ ID No.72所示。
当样本识别条码的碱基序列数为12时,正向接头引物Adp Primer F的序列如SEQID No.73所示;反向接头引物Adp Primer R的序列如SEQ ID No.74所示。
表4PCR 反应体系
5、配制后吹打混匀,短暂离心,置于PCR仪上,在PCR仪上按照表5运行程序。
表5PCR反应程序
6、第二轮PCR产物纯化
(1)充分振荡混匀AMPureXP beads,取45 µL AMPureXP beads至1.5 mL低吸附管,再加入50 µL样本,混匀,短离心,室温放置5 min。
(2)5 min后将样本管置于磁力架上,计时5 min,等液体澄清后,小心弃去上清,注意不要扰动磁珠。
(3)加入200 µL 80%乙醇,注意不要对着磁珠加入,孵育30 s后移除上清。重复一遍,共漂洗2次。
(4)取下管子,离心30 s,将管子置于磁力架上,用小规格移液器将底部的液体吸干,打开盖子,晾干至表面龟裂。
(5)磁珠晾干后,将管子从磁力架上取下,加入102 µL Nuclease-Free Water,振荡混匀,短暂离心。室温放置5 min。
(6)5 min后将管子置于磁力架上,等待液体澄清,取上清100 µL收集于1.5 mL低吸附管,注意不要吸到磁珠。加入85 µL AMPureXP beads,盖上盖子,低速涡旋振荡混合均匀,室温静置5 min,短暂离心。
(7)将管置于磁力架上1 min,直至液体澄清。小心吸取183 µL上清至新的1.5 mL低吸附管中(不要吸到磁珠)。
(8)向上清中加入20 µL涡旋振荡后的AMPureXP beads,盖上盖子,低速涡旋振荡混合均匀,室温静置5 min,瞬离。
(9)将管置于磁力架上约2-5 min,直至液体澄清。小心吸弃上清,不要吸到磁珠。
(10)加入200 µL 80%乙醇,静置30 s,小心吸弃上清,不要吸到磁珠。重复一遍,共漂洗2次。盖上盖子,短暂离心。置于磁力架上1 min,待磁力架吸附磁珠后,用20 µL枪头将管底残留液体吸取,不要吸到磁珠。
(11)室温晾干至磁珠表面不反光(约2-5 min,不要让磁珠晾干至出现裂痕)。
(12)从磁力架上取下低吸附管管,加入24 µL Nuclease-free Water。盖上盖子,低速涡旋振荡混合均匀,室温静置5 min,短暂离心。将管置于磁力架上1 min直至液体澄清。
(13)小心转移22 µL上清至1.5 mL离心管中,注意不要吸到磁珠,得到标准品样本A0.1。
7、文库质控
取1µL标准品样本A0.1进行Qubit定量检测,定量结果如表6。
表6标准品样本A0.1文库qubit定量结果
三、高通量测序
质检合格后的文库,稀释至4 nM,取5 µL加入1.5 mL离心管,再加入5 µL 0.2 MNaOH,变性5 min,双链DNA变性成单链DNA,再稀释至符合上机的浓度。文库经NaOH变性为单链后,可与测序芯片上锚定的短链核酸互补配对,经桥式扩增方法将每个单链DNA分子富集成为一个簇(cluster),再用Illumina SBS测序方法读取序列。
四、测序数据分析
标准品样本中,样本A0.1建库,有空白对照NTC(即纯水),则一共产生2套测序数据。
测序数据的分析流程如下:
(1)将NextSeq 550测序仪测序得到的bcl文件经bcl2fastq软件得到原始fastq格式的序列信息,生成数据集1,即为原始序列集;
(2)根据《测序样本信息管理软件》录入的样本信息以及数据质控参数;样本信息包括样本类型、检测项目、关注的病原体类型、抗菌素的使用和文库质量及它们之间的关系等信息,数据质控参数,包括于数据量、序列平均长度、最小质量值;质检前,根据样本信息从数据库中调取对应的数据质控参数,并将同类型的数据质控参数进行整合,得到样本信息对应的最适参数组合,形成数据质检方案,并自动调整处理和过滤参数;
(3)利用《fastp》对数据集1质控,生成数据集2:过滤简单重复的短序列,以及碱基质量分数低于15的序列将被剔除,质控后的数据集为数据集2,即高质量序列集;
(4)质控后的数据集2使用《靶向病原微生物二代测序分析软件》进行和自建病原数据库的分析流程,采用bwa算法快速将DNA序列比对到结核分枝杆菌复合群及耐药位点的鉴定数据库;并使用《测序数据管理软件》为结核分枝杆菌复合群及耐药位点序列作分类、注释和管理;
(5)《靶向病原微生物二代测序分析软件》将数据集2比对得到的匹配序列生成数据集3,用于下步比对,其中,本次bwa mem算法快速比对,参数自动设置为“mem”,参数意义是本次nextseq测序算法为“BWA-MEM algorithm”,参数(如最小种子长度,输出最小得分,空位罚分等)取默认值;
(6)数据集3序列使用bcftools找出所有突变信息,将突变信息与突变注释信息匹配,找出关注的耐药突变;
(7)剔除假阳性结果。
标准品样本A0.1测序数据的基本信息如表7所示。
表7标准品样本A0.1测序结果情况
五、获得分析结果
标准品样本A0.1物种分析结果如表8所示。
表8标准品样本A0.1测试物种分析结果
标准品样本A0.1耐药分析结果如表9所示。
表9 标准品样本A0.1测试耐药分析结果
上述结果显示,本发明的方法可以对结核分枝杆菌、非洲分枝杆菌、牛分枝杆菌、田鼠分枝杆菌及gyrA、rpoB、katG、inhA四个耐药基因位点在同一样本中进行检测。
实施例5 利用支气管肺泡灌洗液样本进行结核分枝杆菌复合群鉴定及耐药位点检测验证
本实施例基于本发明前文记录的方法,对支气管肺泡灌洗液样本进行检测和鉴定,流程如图3所示。在检测鉴定时,加入空白对照,实现平行质控。具体验证步骤如下:
1、样本信息
收集2份疑似感染病人的支气管肺泡灌洗液样本。
患者一:女,53岁。临床症状为:胸痛10天,气短2天。临床诊断为:肺结核。用药信息:抗菌素:HREI。
患者二:男,47岁。临床症状为:咳嗽。临床诊断为:肺结核,肺部感染。用药信息:抗菌素:左氧、利奈唑胺。
根据临床信息,判断两者可能存在结核分枝杆菌感染。
样本信息录入:患者一样品编号为A1.1,患者二样品编号为A1.2。两份样本的临床症状,临床诊断和用药信息等样本信息如实录入至《测序样本信息管理软件》信息录入界面。
2、样品收集及转运
根据临床标准收集疑似感染病人的支气管肺泡灌洗液样本,在0~4℃环境下保存及转运。
3、样本核酸提取
本实施例检测项目均利用的是病原体DNA检测,DNA提取方法如下:
(1)原始样本颠倒混匀,各取400 µL样本至破壁管,设置破壁参数60 HZ 5 min进行破壁处理。
(2)加入裂解Buffer 200 µL、蛋白酶K 20 µL、蜗牛酶5 µL、溶壁酶5 µL、结合Buffer 200 µL,轻轻颠倒混匀5次,56℃孵育10 min。
(3)孵育结束后,高速离心,取上清600 µL至2.0 mL样本管,加入异丙醇350 µL,轻轻颠倒混匀,短暂离心,再加入20 µL磁珠,混匀离心,室温放置5 min,置于磁力架2 min。
(4)移弃上清,加入900 µL Wash A,振荡混匀,短暂离心,室温放置1 min,置于磁力架1 min,移弃上清,再重复一次。
(5)加入900 µL Wash B,振荡混匀,短暂离心,室温放置1 min,置于磁力架1 min,移弃上清,再重复一次。
(6)尽量移弃多余液体,晾干3 min,加入30 µL Nuclease-Free Water,混匀离心,室温放置2 min,置于磁力架2 min。
(7)转移上清至1.5 mL离心管,即提取得到样本核酸。
采用上述方法分别得到A1.1的核酸样本和A1.2的核酸样本。
4、靶向建库
利用提取得到的A1.1和A1.2的样本核酸进行靶向建库,得到样本文库A1.1和样本文库A1.2。
靶向建库与实施例4中记录的方法相同。对样本文库A1.1和样本文库A1.2进行文库质控:分别取1µL样本进行Qubit定量检测,定量结果如下表10所示。
表10肺泡灌洗液样本A1.1、A1.2文库qubit定量结果
5、高通量测序
高通量测序方法与实施例4中记录的方法相同。
6、测序数据分析
2个样本:样本A1.1与A1.2平行建库,有空白对照NTC(即纯水),则2个样本一共产生4套测序数据。
测序数据的分析流程与实施例4中记录的方法相同。
测序数据的基本信息如表11所示。
表11样本A1.1与A1.2测序结果情况
7 获得分析结果
样本A1.1与A1.2中物种分析以及耐药分析结果如表12、表13所示。
表12样本A1.1与A1.2物种分析结果
表13样本A1.1与A1.2耐药分析结果
上述验证结果显示:患者1体内存在结核分枝杆菌感染,没有产生耐药性,患者2体内存在结核分枝杆菌感染,对氟喹诺酮类、利福平、异烟肼产生耐药性,可作为中间结果为医生提供参考信息。
实施例6利用脑脊液样本进行结核分枝杆菌复合群鉴定及耐药位点检测验证
本实施例基于本发明前文记录的方法,对脑脊液样本进行检测鉴定。在检测鉴定时,加入空白对照,实现平行质控。具体验证步骤如下:
1、样本信息
收集2份疑似感染病人的脑脊液样本。
患者一:男,46岁。临床症状为:无诱因发热,精神异常。临床诊断为:结核疑似。用药信息:无。
患者二:女,48岁。临床症状为:抽搐,发热,咳嗽。临床诊断为:怀疑结核。用药信息:无。
根据临床信息,判断两者可能存在结核分枝杆菌感染。
样本信息录入:患者一样品编号为A2.1,患者二样品编号为A2.2。两份样本的临床症状,临床诊断和用药信息等样本信息如实录入至《测序样本信息管理软件》信息录入界面。
2、样品收集及转运
根据临床标准收集疑似感染病人的脑脊液样本,在0~4℃环境下保存及转运。
3、样本核酸提取
本实施例检测项目均利用的是病原体DNA检测,采用与实施例5相同的提取方法分别得到A2.1的核酸样本和A2.2的核酸样本。
4、靶向建库
利用提取得到的A2.1和A2.2的样本核酸进行靶向建库,得到样本文库A2.1和样本文库A2.2。
靶向建库与实施例4中记录的方法相同。对样本文库A2.1和样本文库A2.2进行文库质控:分别取1µL样本进行Qubit定量检测,定量结果如下表14所示。
表14肺泡灌洗液样本A2.1、A2.2文库qubit定量结果
5、高通量测序
高通量测序方法与实施例4中记录的方法相同。
6、测序数据分析
2个样本:样本A2.1与A2.2平行建库,有空白对照NTC(即纯水),则2个样本一共产生4套测序数据。
测序数据的分析流程与实施例4中记录的方法相同。
测序数据的基本信息如表15所示。
表15样本A2.1与A2.2测序结果情况
7 获得分析结果
样本A2.1与A2.2中物种分析以及耐药分析结果如表16、表17所示。
表16样本A2.1与A2.2物种分析结果
表17样本A2.1与A2.2耐药分析结果
上述验证结果显示:患者1体内不存在结核分枝杆菌的感染,也没有产生耐药性;患者2体内存在结核分枝杆菌的感染,并且对氟喹诺酮类产生耐药性,上述病原微生物和耐药检测结果,可作为中间结果为医生提供参考信息。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。