发明内容
本发明提供一种用于检测5种血流感染病原体的引物组、试剂盒及建库方法,
根据第一方面,一种实施例中提供一种用于检测5种血流感染病原体的引物组,其中上述5种血流感染病原体包括金黄色葡萄球菌、大肠杆菌、鲍曼不动杆菌、肺炎克雷伯菌、屎肠球菌;上述引物组包括:用于检测金黄色葡萄球菌的引物对SEQ ID NO:1~2、SEQ IDNO:3~4和SEQ ID NO:5~6中的至少之一,用于检测大肠杆菌的引物对SEQ ID NO:7~8、SEQ ID NO:9~10和SEQ ID NO:11~12中的至少之一,用于检测鲍曼不动杆菌的引物对SEQID NO:13~14、SEQ ID NO:15~16和SEQ ID NO:17~18中的至少之一,用于检测肺炎克雷伯菌的引物对SEQ ID NO:19~20、SEQ ID NO:21~22和SEQ ID NO:23~24中的至少之一,用于检测屎肠球菌的引物对SEQ ID NO:25~26、SEQ ID NO:27~28和SEQ ID NO:29~30中的至少之一,上述引物组用于在同一反应体系中,对上述5种血流感染病原体的特异序列进行多重PCR靶向扩增。
作为本发明的优选方案,上述引物组包括:用于检测金黄色葡萄球菌的引物序列SEQ ID NO:1~6,用于检测大肠杆菌的引物序列SEQ ID NO:7~12,用于检测鲍曼不动杆菌的引物序列SEQ ID NO:13~18,用于检测肺炎克雷伯菌的引物序列SEQ ID NO:19~24,用于检测屎肠球菌的引物序列SEQ ID NO:25~30。
作为本发明的优选方案,上述引物组还包括用作内参的引物对SEQ ID NO:31~32。
根据第二方面,一种实施例中提供一种用于检测5种血流感染病原体的试剂盒,其包括第一方面的引物组。
作为本发明的优选方案,上述试剂盒还包括靶向扩增试剂组分、末端修复试剂组分、接头连接试剂组分、文库PCR扩增试剂组分、阳性对照品试剂组分、阴性对照品试剂组分、纯化磁珠试剂组分中的一种或多种。
作为本发明的优选方案,上述靶向扩增试剂组分包括靶向扩增缓冲液和靶向扩增酶,优选地,上述靶向扩增酶是Taq DNA聚合酶。
作为本发明的优选方案,上述末端修复试剂组分包括末端修复缓冲液和末端修复酶,优选地,上述末端修复酶包括T4DNA聚合酶、T4PNK和rTaq。
作为本发明的优选方案,上述接头连接试剂组分包括连接缓冲液、连接酶和接头序列;优选地,上述连接酶是T4DNA连接酶;优选地,上述接头序列如SEQ ID NO:33~34所示。
作为本发明的优选方案,上述文库PCR扩增试剂组分包括PCR反应缓冲液、PCR反应聚合酶和PCR反应引物;优选地,上述PCR反应聚合酶是Taq DNA聚合酶;上述PCR反应引物如SEQ ID NO:35~36所示。
作为本发明的优选方案,上述阳性对照品试剂组分包括选自上述5种血流感染病原体中至少一种的DNA序列和人源细胞DNA;优选地,选自上述5种血流感染病原体中至少一种的DNA序列是金黄色葡萄球菌和大肠杆菌的DNA序列;上述人源细胞DNA是Hela细胞DNA。
作为本发明的优选方案,上述阴性对照品试剂组分是人源细胞DNA,优选Hela细胞DNA。
作为本发明的优选方案,上述纯化磁珠试剂组分包括磁珠和缓冲液;优选地,上述磁珠是Agencourt AMPure XP磁珠;上述缓冲液是TE缓冲液。
根据第三方面,一种实施例中提供一种用于检测5种血流感染病原体的建库方法,包括采用第一方面的引物组对血液样本核酸提取物进行多重PCR靶向扩增;然后对上述多重PCR靶向扩增的产物进行测序文库构建。该建库方法中建库步骤没有特别限定,只要使用本发明的多重PCR靶向扩增的产物为材料可以按照现有任何建库方法进行。
本发明的用于检测5种血流感染病原体的引物组特异性较强,一方面有效减少了非特异性扩增的情况,另一方面通过特异性引物扩增可以直接鉴定到细菌的种水平。采用本发明的引物组进行血流感染病原体的检测无需进行血培养操作,可直接对血液样本中的病原体进行检测,最快可在48h得到检测结果,大大缩短了检测周期。采用本发明的引物组进行特异性靶向扩增结合二代测序技术直接对检测序列进行读取,避免了信号转化或传递过程中导致的假阳性情况,检测结果可信度高,另外通过二代测序平台进行检测,具有检测通量高,检测成本低的特点,可以同时对上百例样本进行检测,单样本检测成本大大降低。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本发明提供了一种血流感染常见病原体检测引物组和试剂盒,弥补国内全血样本直接检测病原体产品的空白。本发明是一种可扩展性强的多重病原体检测技术,可实现对多个病原体或耐药基因同时进行检测,并且随着临床检测的需求,可随时扩展检测病原靶标。本发明针对特定感染症候群中的特定病原,通过Kmer序列比对的方法,设计种水平特异性强的引物对,并且通过引物效率筛选,将不同病原体的引物组合成引物集以实现同时对多种病原体进行检测的目的。本发明采用多重PCR和二代测序相结合的技术,对扩增后的产物直接进行序列读取,有效避免了间接检测信号导致的假阳性的情况。本发明基于二代测序平台进行检测,具有通量高、成本低的检测特点。可以同时对上百例样本进行检测,最快可以2天内完成,预期检测成本150-200元/样本。本发明提供一种高灵敏度的检测试剂盒,可以直接对全血样本进行检测,检测灵敏度可达到50-300CFU/mL。
以下通过一个实施例对本发明进行详细描述,需要说明的是,该实施例仅是示例性的,不能理解为对本发明保护范围的限制。
1)血流感染靶标病原体的确定
目标病原体的确定主要通过文献调研、卫生部全国细菌耐药监测网监测结果以及目前市面上的主流检测产品的目标病原信息,并且综合调研全国几所大型医院每年血培养阳性率结果,通过整理整合后确定了可引起血流感染的常见病原体及耐药基因集,分别为金黄色葡萄球菌、大肠杆菌、鲍曼不动杆菌、肺炎克雷伯菌、屎肠球菌。
2)靶标病原体特异性引物设计
将确定的病原体在NCBI上查找所有的参考序列集,并且通过Kmer序列比对的方式分别与病原微生物数据库和人参考基因组进行比对,寻找所有参考序列集中特异序列,进一步在种水平上进行特异序列筛选,挑选出种内共有率高,种间特异性强的序列作为靶标序列进行引物设计,每种靶标病原体筛选多个满足上述条件的特异性序列备用,此外,筛选一段人源特异片段作为反应体系内参对照。
将筛选出的靶标特异序列打包成序列集提交至引物设计系统(例如https://ampliseq.com/browse.action)进行特异引物设计,引物序列如表1,将设计的引物按照一定的比例进行混合后用于后续扩增反应。
表1检测靶标引物序列
需要说明的是:本发明实施例中,针对每种血流感染病原体设计3对靶标引物序列,例如针对金黄色葡萄球菌,Tg-1-F和Tg-1-R是一对引物序列、Tg-2-F和Tg-2-R是一对引物序列、Tg-3-F和Tg-3-R是一对引物序列,每对引物序列分别用于检测一个靶标,其余血流感染病原体的靶标引物序列情况类似。发明人已经证实,针对每种血流感染病原体只要采用1对或2对相应的靶标引物序列检测一个靶标即可实现该种血流感染病原体的检测。同时,发明人进一步证实,针对每种血流感染病原体同时采用3对靶标引物序列进行检测能够取得更加准确、有效的结果,相对于仅采用1对或2对靶标引物序列,其特异性和灵敏度更佳。因此,作为本发明的优选方案,针对每种血流感染病原体同时采用3对靶标引物序列进行检测。
众所周知,在进行多重靶向扩增时,由于引物序列众多往往造成互相之间的干扰或竞争现象存在,也可能产生非特异性扩增,因此多重靶向扩增对于引物选择非常苛刻,需要结合序列设计软件和实验验证才能最终确定效果良好的引物组合。本发明人经过反复设计和大量实验验证,采用本发明的引物序列,即使在针对每种血流感染病原体同时采用3对靶标引物序列的情况下,也不存在非特异性扩增及引物序列之间的干扰、竞争等现象,因此完全满足多重靶向扩增的要求,并且其特异性和灵敏度都非常好。
3)血流感染病原体检测实验流程
本发明一个实施例中提供一种用于检测血流感染常见病原体的试剂盒,包括多重PCR反应试剂和二代测序文库构建试剂,试剂盒组成如表2所示。
表2试剂盒组分
表3R7接头和R9PCR引物对
如图1所示,本发明一个实施例中检测血流感染常见病原体的方法流程如下:
(1)全血样本玻璃珠研磨处理,提取全血样本中的DNA;
(2)将提取的DNA进行纯化以彻底去除其中的杂质和反应抑制物;
(3)多重PCR扩增:使用特异性的PCR引物(表1)对样本中可能存在的病原体靶标进行扩增富集,每种病原体设置3个不同的区域进行富集,得到相应区域的PCR产物;
(4)PCR产物纯化:对(3)得到的PCR产物进行纯化,以去除产物中的剩余引物二聚体和其他干扰物质;
(5)纯化产物末端修复和加“A”:对(4)中得到的纯化产物进行末端修复,补平末端并在3’端添加A碱基形成粘性末端;
(6)接头连接:对(5)得到的产物进行接头连接,得到包含测序接头的文库;
(7)连接产物纯化:对连接接头以后的产物进行纯化,去除多余的接头序列和杂质;
(8)文库PCR:对(7)中的纯化产物进行PCR扩增,放大文库信号,满足上机需求;
(9)文库纯化和质控:对放大文库进行纯化,然后通过Qubit定量方式测定文库浓度,并通过Agilent 2100生物分析仪检测文库片段大小;
(10)BGISEQ-500测序:将质控后的多个文库混合(pooling),然后按照BGISEQ-500测序流程进行上机测序。
4)血流感染病原体检测信息分析流程
对测序样本的下机数据进行生物信息学分析,主要分析流程如下:
(1)对下机样本测序数据量进行质控:首先对下机的原始数据进行过滤,去除接头序列和低质量序列,去除读长不满足要求的序列;对过滤后的序列数进行质控,是否满足测序数据量要求;
(2)序列比对及内参质控:使用比对软件对质控后的数据与人源序列库进行比对,去除比对上的宿主序列,然后再与靶标序列库进行比对,生成靶标序列比对结果;对比对结果中的内参靶标占比进行质控,评估整个流程是否成功;
(3)比对结果标准化处理:对比对结果进行标准化处理,得到标准化的比对序列数结果。
5)病原体靶标阈值确定流程
通过测试200余例临床阴性样本,得到阴性样本中病原体靶标检出序列分布,根据阴性检测值分布情况,分别选取95%和99%分位点作为阈值进行测试,每种病原体测试10例模拟阳性样本,评估其在不同阈值下的检出准确性,最终确定以95%分为点阈值作为最终阈值结果,不同病原体靶标阈值如下表4:
表4靶标阈值情况
6)血流感染病原体检测结果解读流程
根据标准化后的序列比对结果,与对应的靶标阈值进行比对,根据比对结果生成解读报告,解读逻辑如下:
(1)对于每个靶标,当靶标检出序列数大于靶标阈值序列数,则判断为检出;
(2)对于每个病原体,分别有3个靶标区域,如果有2个及以上的靶标序列检出,则判断为该病原体检出;
(3)如果阴性对照样本中检出病原体靶标并超过阈值序列数,则本批次内该靶标检测失控,不予报告。
以下通过具体实施例详细说明本发明的技术方案和效果,应当理解实施例仅是示例性的,不能理解为对本发明保护范围的限制。以下实施例中采用的引物序列和试剂组分等如上述描述。
实施例1
选取临床血培养阳性样本和阴性全血样本以及R10和R11阴阳性对照品(如表2)进行测试,共10例样本。
1)样本前处理与核酸提取:
取450μL全血样本加入预先装有250μL 0.5mm玻璃珠的2.0mL离心管中,用封口膜封好管口,室温震荡20min,震荡完成后,去掉封口膜,将离心管放入离心机8000rpm离心30s,用移液器小心吸取200μL破壁后的全血样本进行核酸提取。核酸提取流程参照MagPureBlood DNA KF Kit说明书进行操作,核酸最终回融体积为40μL。
2)提取核酸纯化
将提取的核酸用1倍体积的R1磁珠(如表2)进行纯化,操作如下:核酸中加入40μL磁珠充分混匀,室温静置5min,将96孔板置于24头磁力架上,静置10min至澄清(若10min后液体仍不澄清,可以多静置2-3min;静置期间可用200μL或10μL无滤芯吸头将妨碍磁珠吸附的气泡戳破),用200μL带滤芯枪头小心吸去上清,加入200μL 70%乙醇,吹打8次,用200μL带滤芯枪头吸弃上清,重复乙醇清洗步骤一次,将乙醇清除干净,室温静置至磁珠干裂,往96孔板中加入40μL R2溶解液,充分溶解,静置5min,然后置于磁力架上吸附至液体澄清,吸取上清进行下一步反应操作。
3)多重PCR反应
将纯化后的核酸按照以下表5的反应体系进行多重PCR扩增:
表5
反应试剂 |
用量 |
R1靶向扩增缓冲液(如表2) |
9.6μl |
R2靶向扩增酶(如表2) |
0.4μl |
DNA |
10μl |
反应体积 |
20μl |
将上述反应液充分震荡混匀后放入PCR仪,按照以下反应程序进行反应:99℃2min;40个循环(99℃15s,60℃2min);4℃保持。
4)多重PCR反应产物纯化
将PCR反应产物用1倍体积的R1磁珠进行纯化,纯化操作按照2)中操作进行,最终用R2溶解液回融至43μl用于下一步反应。
5)末端修复和加“A”反应
将纯化后的PCR产物按照以下表6的反应体系进行末端修复和加“A”反应:
表6
反应体系充分震荡混匀后,放入PCR仪,按照以下程序进行反应:37℃,10min;65℃,15min,4C℃保持。
6)接头连接反应
将5)中得到的反应产物按照以下表7的体系进行接头连接反应:
表7
反应试剂 |
用量 |
R5连接缓冲液(如表2) |
27μl |
R6连接酶(如表2) |
1μl |
R7接头(如表2) |
2μl |
末修加A产物 |
50μl |
反应体积 |
80μl |
将反应液充分震荡混匀后,按以下反应条件进行反应:23℃,20min,4C℃保持。
7)连接产物纯化
将6)中的连接产物用0.5倍体积(40μL)的R1磁珠进行纯化,纯化操作按照2)中操作进行,最终回融至21μl用于下一步反应。
8)文库PCR
将上一步纯化产物按照以下表8的反应体系进行反应:
表8
反应条件如下:98℃2min;10个循环(98℃15s,56℃15s,72℃30s);72℃5min;4℃保持。
9)产物纯化
将文库PCR产物用1倍体积的R1磁珠进行纯化,纯化操作按照2)中所述操作进行,最终用R2溶解液回融至20μl。
10)文库定量和检测
将构建好的文库用Qubit进行定量,浓度大于2ng/μL时,视为文库合格,进一步用Agilent2100生物分析仪进行检测文库片段大小,当检测到260bp左右有明显的内参峰值时,视为合格,结果如图2所示,可进行下一步测序反应。
11)BGISEQ-500上机测序
将质控合格的文库按照BGISEQ-500或BGISEQ-50上机流程进行上机测序,详细流程参考相应试剂盒操作说明书。
12)下机数据信息分析
将10例样本下机后的数据首先按照信息分析流程进行数据过滤,然后将过滤后的数据分别与人源数据库和靶标数据库进行比对,生成比对结果。根据比对结果先判断内参占比是否满足要求,然后将比对结果进行标准化处理,生成标准化比对结果。
13)结果解读
将10例样本生成的标准化比对结果分别与相应靶标阈值进行对比。首先判断阴阳性对照品是否受控:阴性样本中应检测不出任何靶标病原体,阳性样本中对应的靶标病原体检测结果应为阳性。阴性对照和阳性对照解读结果如表9所示。
表9阴性对照和阳性对照解读结果
/>
确定阴性对照和阳性对照样本都受控以后,说明该批次临床样本检测结果真实可靠,对待测临床样本按照上述方法进行解读,结果如表10所示,表中S1-S8代表8例临床样本。
表10临床样本解读结果
经过阈值对比分析,检测到S1-S5为细菌阳性样本,S6-S8检测结果为靶标阴性。此外,S4样本中同时检测到金黄色葡萄球菌和屎肠球菌混合感染,并且Sanger验证结果证实金黄色葡萄球菌和屎肠球菌均为阳性(表11)。
14)与临床结果对比
表11与临床结果对比结果
不同检测方法检测结果对比发现,本发明与Sanger方法检出一致性100%,临床血培养阳性样本通过本发明方法检测可以全部检出,此外,对于血培养阴性样本,本发明可检出阳性,并且Sanger验证结果也为阳性,说明本发明可有效提高临床样本中病原体的检出。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
SEQUENCE LISTING
<110> 天津华大医学检验所有限公司
<120> 用于检测5种血流感染病原体的引物组、试剂盒及建库方法
<130> 18I26933
<160> 36
<170> PatentIn version 3.3
<210> 1
<211> 29
<212> DNA
<213> 人工序列
<400> 1
caattaaaat agaggtgttg caaaatggg 29
<210> 2
<211> 23
<212> DNA
<213> 人工序列
<400> 2
tcgactacgc gaatagattg gac 23
<210> 3
<211> 26
<212> DNA
<213> 人工序列
<400> 3
actgctagtg taggaatctc tttgtc 26
<210> 4
<211> 22
<212> DNA
<213> 人工序列
<400> 4
cccatccagc tgtgatgaca at 22
<210> 5
<211> 22
<212> DNA
<213> 人工序列
<400> 5
tagcgacagg tcctcttacg aa 22
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<400> 6
gtaatcccac tttcaaaaac acgct 25
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<400> 7
cactgcgtcc atctcgaaga 20
<210> 8
<211> 21
<212> DNA
<213> 人工序列
<400> 8
tggccaggta aaacgcttca t 21
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<400> 9
cgctgcacca gaaagatctc aa 22
<210> 10
<211> 22
<212> DNA
<213> 人工序列
<400> 10
gaagcaacat ctttggctgc tt 22
<210> 11
<211> 29
<212> DNA
<213> 人工序列
<400> 11
gcatatttgc gtccaatatt tctataccc 29
<210> 12
<211> 24
<212> DNA
<213> 人工序列
<400> 12
cgattatggc tgcacagtct catc 24
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<400> 13
taatgagctc agcattgccc aaa 23
<210> 14
<211> 26
<212> DNA
<213> 人工序列
<400> 14
ggttgggcat attcaaattg attggc 26
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<400> 15
cttaaagcga atggcggatt ca 22
<210> 16
<211> 22
<212> DNA
<213> 人工序列
<400> 16
tgagccactt cgttttggtc at 22
<210> 17
<211> 22
<212> DNA
<213> 人工序列
<400> 17
cgtcaaacac gtggcgatga ta 22
<210> 18
<211> 28
<212> DNA
<213> 人工序列
<400> 18
cccatacata acatgatctt caacttcg 28
<210> 19
<211> 22
<212> DNA
<213> 人工序列
<400> 19
tgtttaaacg ccacgagcag ta 22
<210> 20
<211> 22
<212> DNA
<213> 人工序列
<400> 20
gcagtcgata agtccagcca aa 22
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<400> 21
ctacgacaac atgttcgccg 20
<210> 22
<211> 19
<212> DNA
<213> 人工序列
<400> 22
aaaaccgcct ggatcgccc 19
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<400> 23
atgatgaagc gcaacatcac c 21
<210> 24
<211> 24
<212> DNA
<213> 人工序列
<400> 24
ccctgatagt cattgatgtc gttg 24
<210> 25
<211> 25
<212> DNA
<213> 人工序列
<400> 25
gggagcaaaa ggtccaaata ctttt 25
<210> 26
<211> 22
<212> DNA
<213> 人工序列
<400> 26
gtgagtaaca ccggaagaag gt 22
<210> 27
<211> 27
<212> DNA
<213> 人工序列
<400> 27
tccatttgca tctactacaa ttcctgt 27
<210> 28
<211> 24
<212> DNA
<213> 人工序列
<400> 28
atacgccgtt caagcaacaa atac 24
<210> 29
<211> 29
<212> DNA
<213> 人工序列
<400> 29
ggtaacgtct cataaatatc tgatagcct 29
<210> 30
<211> 23
<212> DNA
<213> 人工序列
<400> 30
caccagttac agtgatggac aca 23
<210> 31
<211> 21
<212> DNA
<213> 人工序列
<400> 31
caagccagtt atccctgtgg t 21
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<400> 32
ggtgtcctaa ggcgagctca g 21
<210> 33
<211> 58
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (32)..(41)
<223> n is a, c, g, or t
<400> 33
agtcggaggc caagcggtct taggaagaca annnnnnnnn ncaactcctt ggctcaca 58
<210> 34
<211> 38
<212> DNA
<213> 人工序列
<400> 34
ttgtcttcct aaggaacgac atggctacga tccgactt 38
<210> 35
<211> 17
<212> DNA
<213> 人工序列
<400> 35
gaacgacatg gctacga 17
<210> 36
<211> 17
<212> DNA
<213> 人工序列
<400> 36
tgtgagccaa ggagttg 17