CN117987573A - 一种针对复杂基因组的引物设计方法、病原微生物检测用引物组 - Google Patents

一种针对复杂基因组的引物设计方法、病原微生物检测用引物组 Download PDF

Info

Publication number
CN117987573A
CN117987573A CN202311832990.0A CN202311832990A CN117987573A CN 117987573 A CN117987573 A CN 117987573A CN 202311832990 A CN202311832990 A CN 202311832990A CN 117987573 A CN117987573 A CN 117987573A
Authority
CN
China
Prior art keywords
primer
seq
sequence
species
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311832990.0A
Other languages
English (en)
Inventor
卢将
舒静超
董超
张银
张晓亮
张瑞峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Autobio Diagnostics Co Ltd
Original Assignee
Autobio Diagnostics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Autobio Diagnostics Co Ltd filed Critical Autobio Diagnostics Co Ltd
Priority to CN202311832990.0A priority Critical patent/CN117987573A/zh
Publication of CN117987573A publication Critical patent/CN117987573A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于病原微生物检测与生物信息学技术领域,具体公开了一种针对复杂基因组的引物设计方法、病原微生物检测用引物组及检测试剂盒。本发明的方法利用公共数据库的基因组组装序列,按照contigs的长度进行排序,选取最长的数条contigs连接成一条长序列作为该物种的代表序列,再将目标物种的代表序列与同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域作为目标物种的特异性序列,针对该特异性序列设计引物,即得到目标物种的扩增引物。该方法设计原理简单、计算简便,可不依赖核糖体RNA区域短时间内获得目标物种的引物序列,对物种复杂度要求低,临床可实施性好,稳定性高,检测结果准确可靠。

Description

一种针对复杂基因组的引物设计方法、病原微生物检测用引 物组
技术领域
本发明属于病原微生物检测与生物信息学技术领域,具体涉及一种针对复杂基因组的引物设计方法,以及采用该方法设计得到的病原微生物检测用引物组及检测试剂盒。
背景技术
病原微生物是指可以侵犯人体,在宿主中生长繁殖、释放毒性物质等引起机体不同程度病理变化、发生感染的微生物,包括细菌、病毒、真菌、寄生虫、衣原体、支原体等。病原微生物检测在感染判定中意义重大,除了传统的检测方法如涂片染色、培养分离、免疫学检测、核酸检测外,还有新兴的基因芯片、二代测序技术(如mNGS)等。
二代测序(NGS)也称为高通量测序或大规模平行测序,可一次对数千到数十亿个DNA片段进行独立的序列测定。mNGS(宏基因组高通量测序)是以NGS为基础,对样本中所有微生物的DNA片段进行高通量测序的技术,测序后通过与特定的数据库进行比对分析,就能无偏倚的在同一样本中检测多种病原微生物。tNGS(靶向基因测序)又称为病原体靶向测序,是基于靶向捕获或超多重PCR、联合高通量测序技术开发的快速、低成本检测技术。tNGS不依赖于传统的微生物培养,可以直接对临床样本中的核酸进行富集,之后通过高通量测序和数据库比对分析判断样本中病原微生物的种类、毒力以及耐药基因,为临床诊断提供依据。尤其是tNGS中的PCR扩增子富集测序,将PCR与NGS的优势相结合,采用超多重PCR正向富集目标病原体的核酸,在提升检测灵敏度的同时排除了宿主核酸的干扰,经测序和生信分析可以实现不同症候群、感染脏器、患者类型等临床场景的核心病原鉴定。相较mNGS,tNGS极大提高了检测敏感性,缩短了检测时间,且可以兼顾DNA和RNA流程,具有检测精度高、性价比高、周期短、可定制化等优势,目前已广泛应用于呼吸道感染、血流感染、中枢神经系统感染等临床检验领域。
众所周知,基于tNGS进行物种鉴定需要针对物种的特异性序列设计引物,而用于物种鉴定的PCR引物的设计关键在于:既要找到物种的特异性序列,又要求该序列能够尽可能覆盖物种内的所有微生物,二者之间存在一定的关联与冲突。目前,针对物种鉴定的特异性序列的筛选与PCR引物的设计主要依赖于经验和文献检索。例如,中国专利申请CN116287357A(北京百奥益康)公开的一种基于靶向扩增子测序的呼吸道病原菌检测引物组及试剂盒,包含金黄色葡萄球菌、鲍曼不动杆菌、肺炎链球菌、铜绿色假单胞菌和化脓性链球菌的特异性扩增引物。然而,上述5种病原微生物虽在临床检验中较为常见,但可检测的呼吸道病原的种类仍较少。而常见的呼吸道病原除包括细菌外,还包括病毒、真菌、衣原体、支原体、立克次体等类型。然而,现有的针对多种病原体检测的特异性序列的筛选与引物设计方法多存在效率低、试错成本高、分类特异性差、物种覆盖度低等问题。为此,中国专利申请CN115719616A(先声医学诊断)提供了一种病原物种特异性序列筛选的方法,包括:(1)基于公共数据库(如Refseq、GenBank)进行病原物种序列的筛选和过滤,构建病原比对数据库;(2)从病原比对数据库中筛选高质量目标物种的基因组序列,如完整的基因组序列或染色体级别基因组序列;(3)对筛选出的基因组序列进行打断处理,合并所有打断的序列片段进行聚类;(4)基于聚类结果,从每个聚类cluster中随机挑选1条序列作为代表序列,将代表序列与病原比对数据库进行比对,将序列相似度M高于阈值、且除比对到目标物种外未比对到其他物种的代表序列作为该物种的特异性序列。该方法适用于多种病原体的特异性序列的筛选,具有准确性高、时间成本低等优点,且可用于亚种的分型。但是,该方法依赖于数据库中完整的基因组序列或染色体级别的基因组序列,对于复杂基因组的病原微生物无法实现特异性序列的筛选及引物设计,并且该方法采用正向思路,先筛选物种共有保守序列,再确定种间特异性序列,计算过程复杂且耗时。
因此,亟待开发一种针对复杂基因组的物种特异性序列筛选及引物设计方法。
发明内容
本发明主要解决的技术问题是提供一种针对复杂基因组的引物设计方法,该方法可不依赖核糖体RNA区域短时间内获得目标物种的引物序列,具有设计原理简单、计算简便、对物种复杂度要求低、临床可实施性好、稳定性高等特点,所得引物的检测结果准确可靠,相较传统16S rDNA、18S rDNA、ITS区域的鉴别效果更好。
其次,本发明提供一种病原微生物检测用引物组。
再次,本发明提供一种病原微生物检测试剂盒。
为解决上述技术问题,本发明提供了以下技术方案:
一种针对复杂基因组的引物设计方法,包括:
(1)获取目标物种及其同属其他物种的复杂基因组序列;
(2)将每个物种的复杂基因组序列按照contigs的长度进行排序,选取最长的数条contigs连接成一条长序列作为该物种的代表序列;
(3)将目标物种及其同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域作为目标物种的特异性序列;
(4)针对目标物种的特异性序列设计引物,即得。
作为本发明一种优选的实施方案,步骤(2)中,所述数条contigs至少为5条,可以为5、6、7、8、9、10条序列。
作为本发明一种优选的实施方案,步骤(2)中,所述数条contigs在连接成一条长序列时,在contigs之间添加若干个连续的N作为边界信号。例如,采用5个连续的N以物理隔离不同的contigs。
作为本发明一种优选的实施方案,步骤(3)中,所述多序列比对采用多序列比对软件,以同属所有物种的代表序列作为输入文件。例如,采用progressiveMauve软件及默认参数进行共线性比对。
作为本发明一种优选的实施方案,步骤(4)中,所述设计引物采用引物设计软件,以目标物种的特异性序列作为模板,设置包括GC含量、Tm值、引物长度、产物长度、返回引物数量在内的多个参数。例如,采用primer3软件,设置GC含量为40%-60%,Tm值为57-65℃,引物长度为17-27bp,产物长度为100-120bp,返回引物数量为3-10对。
作为本发明一种优选的实施方案,步骤(4)中,若最终没有返回合适的引物,则说明目标物种的特异性序列选取不当,返回步骤(2)重新选取contigs,连接后得到新的代表序列,再重新执行步骤(3)、步骤(4)的操作。例如,第一次选取最长的10条contigs进行连接,若没有返回合适的引物,第二次则选取最长的20条contigs进行连接,得到新的代表序列后,再次执行步骤(3)的操作,得到新的目标物种的特异性序列,之后再次执行步骤(4)的操作,针对新的目标物种的特异性序列设计得到新的引物。
作为本发明一种优选的实施方案,步骤(4)中,所述设计引物后对引物进行评估,包括但不限于引物特异性评估、物种覆盖度评估。
具体的,所述引物特异性评估是将引物比对回核酸数据库(如NCBI的NT库),若引物仅比对到目标物种,判定为通过。若引物除比对到目标物种外,还比对到其他物种,且序列相似度在96%以上,则去掉该引物。如此评估每对引物的特异性,若最终没有合适的引物,则说明设计的引物特异性欠佳,返回步骤(2)重新选取contigs,连接后得到新的代表序列,再重新执行步骤(3)、步骤(4)的操作。
具体的,所述物种覆盖度评估是将引物比对回该物种下所有菌株的基因组序列(可以从NCBI下载,包括代表基因组和所有非代表基因组),分析每对引物能够扩增出预期产物的菌株占比(即能够扩增出预期产物的菌株数/该物种下所有菌株的数目),比值大于设定阈值的判定为通过。所述阈值设定为80%、90%、95%,优选为90%。若比值小于设定阈值,则说明设计的引物的物种覆盖度欠佳,返回步骤(2)重新选取contigs,连接后得到新的代表序列,再重新执行步骤(3)、步骤(4)的操作。
作为本发明一种优选的实施方案,步骤(4)中,所述对引物进行评估后,当待检测病原微生物有多种、所用引物经组合后构成一个引物组时,还需要对引物组进行评估,包括但不限于引物二聚体评估、非特异性扩增产物评估。例如,采用Mfeprimer软件对引物组进行综合评估,对软件预测产生的引物二聚体及非特异性扩增产物分别进行评估,二者均判定为通过的引物组进行后续的实验验证;二者中任意一项判定为不通过的引物组需要重新设计引物,之后再进行引物及引物组的评估。优先对不符合非特异性扩增产物评估要求的引物进行重新设计。
具体的,所述引物二聚体评估中设定二聚体的|ΔG|≤20、且|ΔG|在10-20范围内的二聚体的数量/引物组中所有引物对的数量的比值≤1%的判定为通过。
具体的,所述非特异性扩增产物评估中设定非特异性扩增产物的数量/引物组中所有引物对的数量的比值≤1%的判定为通过。所述非特异性扩增产物的判定标准为:预测的扩增产物的Tm值>55℃、且上下游引物的Tm值的差值≤5。
具体的,所述复杂基因组序列为不完整的基因组序列。所述目标物种及其同属物种的基因组序列均为不完整的基因组序列。
具体的,所述contigs指代NCBI数据库中基因组的组装水平为“contig”的多个序列。
一种病原微生物检测用引物组,所述引物组包含针对以下任意一种或多种病原微生物的特异性序列(如下表1所示)设计的扩增引物:
(1)衣氏放线菌,其特异性序列如SEQ ID NO:1所示;
(2)土曲霉,其特异性序列如SEQ ID NO:2所示;
(3)侵肺戴阿李斯特菌,其特异性序列如SEQ ID NO:3所示;
(4)牙周梭杆菌,其特异性序列如SEQ ID NO:4所示;
(5)副流感嗜血杆菌,其特异性序列如SEQ ID NO:5所示;
(6)瘰疬分枝杆菌,其特异性序列如SEQ ID NO:6所示;
(7)苏尔加分枝杆菌,其特异性序列如SEQ ID NO:7所示;
(8)厌氧消化链球菌,其特异性序列如SEQ ID NO:8所示;
(9)小孢根霉,其特异性序列如SEQ ID NO:9所示;
(10)尖端赛多孢子菌,其特异性序列如SEQ ID NO:10所示;
(11)普通裂褶菌,其特异性序列如SEQ ID NO:11所示;
(12)脓肿诺卡菌,其特异性序列如SEQ ID NO:12所示;
(13)耶氏肺孢子菌,其特异性序列如SEQ ID NO:13所示;
(14)微小根毛霉,其特异性序列如SEQ ID NO:14所示;
(15)米根霉,其特异性序列如SEQ ID NO:15所示;
(16)灰色小克银汉霉,其特异性序列如SEQ ID NO:16所示;
(17)鸟肠球菌,其特异性序列如SEQ ID NO:17所示;
(18)伞枝横梗霉,其特异性序列如SEQ ID NO:18所示;
(19)总状毛霉,其特异性序列如SEQ ID NO:19所示;
(20)阿萨希毛孢子菌,其特异性序列如SEQ ID NO:20所示;
(21)皮炎芽生菌,其特异性序列如SEQ ID NO:21所示;
(22)热带念珠菌,其特异性序列如SEQ ID NO:22所示。
表1目标病原微生物的特异性序列
具体的,所述引物组包含以下任意一对或多对扩增引物(如下表2所示):
(1)衣氏放线菌,其扩增引物的核苷酸序列如SEQ ID NO:23-24所示;
(2)土曲霉,其扩增引物的核苷酸序列如SEQ ID NO:25-26所示;
(3)侵肺戴阿李斯特菌,其扩增引物的核苷酸序列如SEQ ID NO:27-28所示;
(4)牙周梭杆菌,其扩增引物的核苷酸序列如SEQ ID NO:29-30所示;
(5)副流感嗜血杆菌,其扩增引物的核苷酸序列如SEQ ID NO:31-32所示;
(6)瘰疬分枝杆菌,其扩增引物的核苷酸序列如SEQ ID NO:33-34所示;
(7)苏尔加分枝杆菌,其扩增引物的核苷酸序列如SEQ ID NO:35-36所示;
(8)厌氧消化链球菌,其扩增引物的核苷酸序列如SEQ ID NO:37-38所示;
(9)小孢根霉,其扩增引物的核苷酸序列如SEQ ID NO:39-40所示;
(10)尖端赛多孢子菌,其扩增引物的核苷酸序列如SEQ ID NO:41-42所示;
(11)普通裂褶菌,其扩增引物的核苷酸序列如SEQ ID NO:43-44所示;
(12)脓肿诺卡菌,其扩增引物的核苷酸序列如SEQ ID NO:45-46所示;
(13)耶氏肺孢子菌,其扩增引物的核苷酸序列如SEQ ID NO:47-48所示;
(14)微小根毛霉,其扩增引物的核苷酸序列如SEQ ID NO:49-50所示;
(15)米根霉,其扩增引物的核苷酸序列如SEQ ID NO:51-52所示;
(16)灰色小克银汉霉,其扩增引物的核苷酸序列如SEQ ID NO:53-54所示;
(17)鸟肠球菌,其扩增引物的核苷酸序列如SEQ ID NO:55-56所示;
(18)伞枝横梗霉,其扩增引物的核苷酸序列如SEQ ID NO:57-58所示;
(19)总状毛霉,其扩增引物的核苷酸序列如SEQ ID NO:59-60所示;
(20)阿萨希毛孢子菌,其扩增引物的核苷酸序列如SEQ ID NO:61-62所示;(21)皮炎芽生菌,其扩增引物的核苷酸序列如SEQ ID NO:63-64所示;
(22)热带念珠菌,其扩增引物的核苷酸序列如SEQ ID NO:65-66所示。
表2目标病原微生物的特异性序列的扩增引物
作为本发明一种优选的实施方案,所述引物组包含上述针对所有病原微生物的特异性序列设计的扩增引物。
一种病原微生物检测试剂盒,所述试剂盒包含所述病原微生物检测用引物组。
作为本发明一种优选的实施方案,所述试剂盒还包含聚合酶、扩增反应缓冲液等,用于扩增病原微生物的特异性序列,之后进行测序文库构建。
作为本发明一种优选的实施方案,所述试剂盒还包含接头、连接酶、连接反应缓冲液、测序靶标扩增引物、高保真扩增酶、高保真扩增反应缓冲液等,用于连接接头并扩增得到测序文库。
本发明的有益效果:
本发明提供了一种针对复杂基因组的引物设计方法,利用公共数据库的基因组组装序列,有选择性的对不完整的基因组序列进行拼接,具体为按照提供的contigs的长度进行排序,选取最长的数条contigs连接成一条长序列,作为该物种的代表序列,之后将目标物种的代表序列与同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域,作为目标物种的特异性序列,再针对该特异性序列设计引物,即可得到目标物种的特异性扩增引物。该方法设计原理简单、计算简便,可不依赖核糖体RNA区域短时间内获得目标物种的引物序列,对物种复杂度要求低,临床可实施性好,稳定性高,检测结果准确可靠,相较传统16S rDNA、18S rDNA、ITS区域的鉴别效果更好。
本发明还提供了一种病原微生物检测用引物组及检测试剂盒,可同时检测22种不具有完整基因组序列的病原微生物(包括衣氏放线菌、土曲霉、侵肺戴阿李斯特菌、牙周梭杆菌、副流感嗜血杆菌、瘰疬分枝杆菌、苏尔加分枝杆菌、厌氧消化链球菌、小孢根霉、尖端赛多孢子菌、普通裂褶菌、脓肿诺卡菌、耶氏肺孢子菌、微小根毛霉、米根霉、灰色小克银汉霉、鸟肠球菌、伞枝横梗霉、总状毛霉、阿萨希毛孢子菌、皮炎芽生菌和热带念珠菌),所用引物特异性强、物种覆盖度高,经实验验证几乎没有引物二聚体及非特异性扩增产物,检测结果准确可靠。
附图说明
图1为实验例中测序文库经生物分析仪检测的结果图。
为了更清楚地说明本发明实施例的技术方案,以上对实验例中得到的附图进行简单地介绍。应当理解,上述附图仅示出了本发明的某些实验例,不应看作是对权利要求保护范围的任何限制。对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图得到其他相关的附图。
具体实施方式
下面将结合具体实施例和实验例对本发明的技术方案进行清楚完整的描述。但本领域技术人员应当理解,实施例仅用于说明本发明的技术方案,而不应视为限制本发明的保护范围。基于下述实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的其他所有实施方案,例如修改、变形或简单替换后得到的实施方案,均应属于本发明的保护范围。
下述实施例及实验例中所使用的实验方法如无特殊说明,均为常规方法;所使用的原料、试剂、仪器等如无特殊说明,均为本领域常用的、公众可以得到或可通过商业途径获得的物品;所涉名词、缩写均为本领域的常规含义。
实施例1
本实施例提供了一种针对目标病原微生物灰色小克银汉霉(Cunninghamellabertholletiae)的复杂基因组设计引物的方法,包括以下步骤:
(1)获取目标物种的复杂基因组序列
在公共数据库NCBI的genome搜索框输入“Cunninghamella bertholletiae”,获得有关该物种的reference genome的组装ID号GCA_000697215.1,下载该组装基因组序列。
(2)获取与目标物种同属的其他物种的复杂基因组序列
在公共数据库NCBI的taxonomy搜索框输入“Cunninghamella bertholletiae”,显示灰色小克银汉霉的物种信息;点击“Cunninghamella”,向上搜索该属的所有物种,显示包含Cunninghamella bertholletiae、Cunninghamella blakesleeana、Cunninghamellaelegans、Cunninghamella echinulata在内的多个物种。
基于获得的物种信息,重复步骤(1),搜索并下载与目标物种同属的其他物种的复杂基因组序列。在本实施例中,为便于展示,仅选择同属Cunninghamella elegans(GCA_000697015.1)、Cunninghamella echinulata(GCA_025201675.1)的组装基因组序列进行下载。
(3)获取目标物种及其同属其他物种的代表序列
将每个物种的复杂基因组序列按照contigs的长度进行排序,选取最长的10条contigs,在相接的2条contigs之间用5个连续的N作为边界信号,将这10条contigs连接成一条长序列,作为该物种的代表序列。
(4)获取目标物种的特异性序列
采用progressiveMauve软件及默认参数对目标物种Cunninghamellabertholletiae及其同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域作为目标物种的特异性序列(由于该序列经验证选取不当,暂不做展示)。
(5)获取目标物种的特异性引物序列
采用primer3软件,针对目标物种的特异性序列设计引物,设置GC含量为40%-60%,Tm值为57-65℃,引物长度为17-27bp,产物长度为100-120bp,返回引物数量为3-10对,结果没有返回合适的引物,说明目标物种Cunninghamella bertholletiae的特异性序列选取不当,返回步骤(3),选取最长的20条contigs进行连接,得到新的代表序列;再次执行步骤(3)的操作,得到新的目标物种的特异性序列,如SEQ ID NO:16所示或见上表1;之后再次执行步骤(4)的操作,针对新的目标物种的特异性序列设计引物,得到5对目标物种Cunninghamella bertholletiae的特异性引物序列。
(6)引物特异性评估和物种覆盖度评估
对步骤(5)得到的引物进行评估,其中引物特异性评估是将引物比对回NCBI的NT库,结果显示,所有引物都可以比对到目标物种Cunninghamella bertholletiae,判定为通过。物种覆盖度评估是将引物比对回该物种下所有菌株的基因组序列,包括Cunninghamella bertholletiae175(GCA_000697215.1)和Cunninghamellabertholletiae B7461(GCA_000697315.1),分析每对引物能够扩增出预期产物的菌株占比,结果显示,所有引物都能够扩增出上述两菌株,比值(100%)大于设定阈值(90%),判定为通过。后续实验选取包含表2所示引物进行验证。
实施例2
本实施例提供了一种针对目标病原微生物脓肿诺卡菌(Nocardia abscessus)的复杂基因组设计引物的方法,包括以下步骤:
(1)获取目标物种的复杂基因组序列
在公共数据库NCBI的genome搜索框输入“Nocardia abscessus”,获得有关该物种的reference genome的组装ID号GCA_000308455.1,下载该组装基因组序列。
(2)获取与目标物种同属的其他物种的复杂基因组序列
在公共数据库NCBI的taxonomy搜索框输入“Nocardia abscessus”,显示脓肿诺卡菌的物种信息;点击“Nocardia”,向上搜索该属的所有物种,显示包含Nocardiabrasiliensis、Nocardia otitidiscaviarum、Nocardia acididurans、Nocardiabarduliensis在内的多个物种。
基于获得的物种信息,重复步骤(1),搜索并下载与目标物种同属的其他物种的复杂基因组序列。在本实施例中,为便于展示,仅选择同属Nocardia brasiliensis(GCF_002209125.2)、Nocardia otitidiscaviarum(GCF_007362295.1)的组装基因组序列进行下载。
(3)获取目标物种及其同属其他物种的代表序列
将每个物种的复杂基因组序列按照contigs的长度进行排序,选取最长的10条contigs,在相接的2条contigs之间用5个连续的N作为边界信号,将这10条contigs连接成一条长序列,作为该物种的代表序列。
(4)获取目标物种的特异性序列
采用progressiveMauve软件及默认参数对目标物种Nocardia abscessus及其同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域作为目标物种的特异性序列,如SEQ ID NO:12所示或见上表1。
(5)获取目标物种的特异性引物序列
采用primer3软件,针对目标物种的特异性序列设计引物,设置GC含量为40%-60%,Tm值为57-65℃,引物长度为17-27bp,产物长度为100-120bp,返回引物数量为3-10对,得到6对目标物种Nocardia abscessus的特异性引物序列。
在本发明的其他实施例中,对步骤(5)得到的引物进行评估,包括但不限于引物特异性评估和物种覆盖度评估。其中,引物特异性评估是将引物比对回NCBI的NT库,结果显示,所有引物都可以比对到目标物种Nocardia abscessus,判定为通过。物种覆盖度评估是将引物比对回该物种下所有菌株的基因组序列,包括Nocardia abscessus NBRC 100374(GCA_000308455.1)、Nocardia abscessus FDAARGOS_1596(GCA_020731305.1)、Nocardiaabscessus BJ06-0112(GCA_015478245.1)、Nocardia abscessus BJ06-0146(GCA_015477775.1)、Nocardia abscessus N-20(GCA_015477305.1)、Nocardia abscessus N-11(GCA_015477435.1)、Nocardia abscessus 740990467(GCA_029869045.1)、Nocardiaabscessus 740801264(GCA_029869705.1)、Nocardia abscessus 740800755(GCA_029867355.1)、Nocardia abscessus991556147(GCA_029868245.1)、Nocardia abscessus740800722(GCA_029867385.1)、Nocardia abscessus 740804333(GCA_029869165.1)、Nocardia abscessus 760185030(GCA_029868435.1)、Nocardia abscessus 760185009(GCA_029868845.1)、Nocardia abscessus 740800713(GCA_029869745.1)、Nocardiaabscessus 201222785(GCA_029867985.1)、Nocardia abscessus575193548(GCA_029867705.1)和Nocardia abscessus 991735609(GCA_029868145.1),分析每对引物能够扩增出预期产物的菌株占比,结果显示,所有引物都能够扩增出上述两菌株,比值(100%)大于设定阈值(90%),判定为通过。后续实验选取包含表2所示引物进行验证。
在本发明的其他实施例中,当待检测病原微生物有多种、所用引物经组合后构成一个引物组时,还需要对引物组进行评估,包括但不限于引物二聚体评估和非特异性扩增产物评估。具体采用Mfeprimer软件,对软件预测产生的引物二聚体及非特异性扩增产物分别进行评估,二者均判定为通过的引物组进行后续的实验验证;二者中任意一项判定为不通过的引物组需要重新设计引物,之后再进行引物及引物组的评估。其中,引物二聚体评估中设定二聚体的|ΔG|≤20、且|ΔG|在10-20范围内的二聚体的数量/引物组中所有引物对的数量的比值≤1%的判定为通过。非特异性扩增产物评估中设定非特异性扩增产物的数量/引物组中所有引物对的数量的比值≤1%的判定为通过,非特异性扩增产物的判定标准为:预测的扩增产物的Tm值>55℃、且上下游引物的Tm值的差值≤5。结果显示,表2所示引物中的一对或多对随意组合成引物组,经评估后均判定为通过。
实验例1
本实验例提供一种“干实验”方法,用于对比传统引物设计区域与本发明引物设计区域(即目标物种的特异性序列)的效果,具体操作步骤如下:
(1)选取表1中7个物种,根据传统引物设计区域设计引物,其中,脓肿诺卡菌为secA1区域,该区域为诺卡菌测序鉴定通用引物区域;衣氏放线菌为16S RNA区域;米根霉为基因组中的ITS1或ITS2区域;尖端赛多孢子菌为rDNA中基因间转录区ITS区域;阿萨希毛孢子菌为ITS2区域;总状毛霉为ITS1区域;灰色小克银汉霉为28S rRNA基因区域。根据这些区域分别设计各物种的引物,如下表3所示,用于后续比较分析。
(2)搭建微生物数据库
采用2种方法搭建微生物数据库,一种从地址https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/下载整个NT库的fasta格式的序列文件,makeblastdb建库后可供使用;一种是从https://ftp.ncbi.nlm.nih.gov/blast/db下载已经makeblastdb后的NT库文件,这是一种大文件被分割成很多小文件的策略,然后将这些小文件都解压到同一目录下,生成一个总的已经makeblastdb后的NT库文件,从而完成微生物数据库的搭建。
(3)引物序列回帖至微生物数据库
将表2所示引物序列以及根据传统引物设计区域设计出的引物序列一起,以fasta格式采用blastn软件对微生物数据库进行比对,以验证上述引物是否只能鉴定到预期物种,也即评估引物的特异性。
(4)结果解析与对比
通过比对结果确定比对物种,然后核对是否与预期物种相符,结果如下表3所示。
表3传统引物与本发明引物比对结果解析对比
表3以预期物种为判定标准,分别采用表2的引物序列以及传统引物序列回帖至微生物数据库,以快速鉴定上述引物的扩增产物是否具有“唯一性”,从而降低后续生信流程物种鉴定的难度。本实验例不需要实验即可快速有效的初步验证引物的有效性。通过表3不难看出,传统引物在鉴定物种方面尚有欠缺,有些只能明确该物种所在的属,无法进一步明确所在的种,而本发明的引物完全满足鉴定到种的需求。后续将结合“湿实验”验证表2的引物是否能真正扩增出产物。
实验例2
本实验例提供一种用模拟呼吸道病原样本验证引物特异性的方法,具体操作步骤如下:
(1)1st cDNA合成
使用市售的核酸提取试剂盒从模拟呼吸道病原样本中提取基因组DNA&RNA模板,按照下表4、表5所示体系配制反应液,进行1st cDNA合成。具体为:将Random Primer室温解冻后,颠倒混匀,置于冰上备用。按照表4配置反应液。使用移液器轻轻吹打混匀,瞬离将反应液离心至管底。于PCR仪上进行如下反应:(热盖80℃)70℃,5min;立即置于冰上3min。
表4引物和模板用量
将第一链合成试剂从-20℃取出,室温解冻,颠倒混匀后瞬离,按表5所示体系配制第一链cDNA合成的反应液,使用移液器轻轻吹打混匀,瞬离,将反应液离心至管底,于PCR仪上进行如下反应:(热盖105℃)25℃,5min;37℃,45min;85℃,5s;4℃,hold。
表5 1st cDNA合成反应体系
名称 体积(μL)
变性的RNA及DNA混合产物 8
10×1st Reaction Buffer 1
1st Strand Enzyme Mix 1
Total 10
(2)特异性扩增
使用步骤(1)产物为模板进行多重PCR扩增反应,多重引物在体系内终浓度为0.04μM,扩增体系如下表6所示。
表6多重PCR扩增反应体系
名称 体积(μL)
步骤(1)产物 10
特异性扩增引物 5
KAPA 2G Fast Multiplex Mix 15
Total 30
用移液枪(或者涡旋混匀仪)充分混匀,并短暂离心将反应液收集至管底,将PCR管置于PCR仪中,进行下表7所示程序的反应。
表7多重PCR扩增反应程序
/>
(3)特异性扩增产物纯化
使用已室温平衡30min的DNA Clean Beads对反应产物进行纯化,向30μL PCR合并产物中加入39μL室温平衡后的磁珠,用移液器轻缓吸打混匀20次,室温孵育5min后,将PCR管置于磁力架上静置3min,移除上清,PCR管继续放置在磁力架上,向管内加入180μL 80%乙醇溶液,静置30s,移除上清,PCR管继续放置在磁力架上,向管内加入180μL 80%乙醇溶液,静置30s后彻底移除上清,室温静置3min,使残留乙醇彻底挥发,将PCR管从磁力架取下,加入15μL Nuclease-free water,移液器轻轻吸打重悬磁珠,避免产生气泡,室温静置2min,再将PCR管重新置于磁力架上,静置3min,用移液器吸取13μL上清液,转移到新的200μL PCR管内,管内上清液为合并后的多重PCR产物。
(4)通用扩增
使用纯化后的特异性扩增产物进行通用扩增,扩增反应体系如下表8所示。
表8通用扩增反应体系
名称 体积(μL)
步骤(1)产物 10
纯化后特异性扩增产物 13
KAPA 2G Fast multiplex mix 15
正向通用扩增引物 1
反向通用扩增引物 1
用移液枪(或者涡旋混匀仪)充分混匀,并短暂离心将反应液收集至管底,将PCR管置于PCR仪中,进行下表9所示程序的反应。
表9通用扩增反应程序
(5)通用扩增产物纯化
使用已室温平衡30min的DNA Clean Beads对反应产物进行纯化,向30μL PCR反应体系中加入30μL室温平衡后的磁珠,用移液器轻缓吸打混匀20次,室温孵育5min后,将PCR管置于磁力架上静置3min,移除上清,PCR管继续放置在磁力架上,向管内加入180μL 80%乙醇溶液,静置30s,移除上清,PCR管继续放置在磁力架上,向管内加入180μL 80%乙醇溶液,静置30s后彻底移除上清,室温静置3min,使残留乙醇彻底挥发,将PCR管从磁力架取下,加入22.5μL Nuclease-free water,用移液器轻缓吸打混匀20次,重悬磁珠,避免产生气泡,室温静置2min,再将PCR管重新置于磁力架上,静置3min,用移液器吸取20μL上清液,转移到新的PCR管中,管中上清即为制备好的多重PCR文库。
(6)测序文库质控
测序文库经安捷伦2100生物分析仪检测,主峰在250bp左右,无明显异常峰,如图1所示。
(7)测序文库上机测序
对建好的文库采用Nextseq测序仪(或者其他有注册证的测序仪)进行上机测序,得到不同数据量下的测序读段。
(8)分析及结果统计
通过生信手段将原始测序读段回帖至微生物数据库,根据结果判断是否有相应的微生物检出,检测结果如下表10所示。
表10测序及生信分析结果
/>
表10中,第1列为拉丁名,第2列为物种属名,第3列为中文名,第4列为数据库代号,第5列为革兰氏阳性菌或阴性菌,第6列为测到的读段数目,第7列为该物种丰度,第8列为相似度平均值,第9列为引物对数,第10列为每对引物具体的读段数目,第11列为每对引物是否特异,第12列为该物种是否有微生物感染。其中,测序读段数最多的引物对应表2中引物,其余为根据其他的特异性序列(不同于表1,未列出)设计的引物。从表10第6列可以看出,本发明表2中引物均有检出,可以扩增出模拟呼吸道病原样本中目标病原微生物的特异性序列。
结合实验例1的分析结果可以看出,本发明提供的目标病原微生物的特异性序列相较传统的16S、18S、ITS区域或其他常用引物区域,不仅鉴别效果好,而且临床检测结果准确、可靠,稳定性高。
综上所述,本发明提供的针对复杂基因组的引物设计方法,利用公共数据库的基因组组装序列,有选择性的对不完整的基因组序列进行拼接,具体为按照提供的contigs的长度进行排序,选取最长的数条contigs连接成一条长序列,作为该物种的代表序列,之后将目标物种的代表序列与同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域,作为目标物种的特异性序列,再针对该特异性序列设计引物,即可得到目标物种的特异性扩增引物。该方法设计原理简单、计算简便,可不依赖核糖体RNA区域短时间内获得目标物种的引物序列,对物种复杂度要求低,临床可实施性好,稳定性高,检测结果准确可靠,相较传统16S rDNA、18S rDNA、ITS区域的鉴别效果更好。
本发明提供的病原微生物检测用引物组及检测试剂盒,可同时检测22种不具有完整基因组序列的病原微生物(包括衣氏放线菌、土曲霉、侵肺戴阿李斯特菌、牙周梭杆菌、副流感嗜血杆菌、瘰疬分枝杆菌、苏尔加分枝杆菌、厌氧消化链球菌、小孢根霉、尖端赛多孢子菌、普通裂褶菌、脓肿诺卡菌、耶氏肺孢子菌、微小根毛霉、米根霉、灰色小克银汉霉、鸟肠球菌、伞枝横梗霉、总状毛霉、阿萨希毛孢子菌、皮炎芽生菌和热带念珠菌),所用引物特异性强、物种覆盖度高,经实验验证几乎没有引物二聚体及非特异性扩增产物,检测结果准确可靠。
虽然上文中已经用一般性说明、具体实施方式及试验例对本发明的技术方案做了详尽的描述,但需要说明的是,实施例和试验例仅用于说明本发明的技术方案和技术效果,而不应视为对本发明保护范围的任何限制。基于本发明技术构思所做的简单变形、修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.一种针对复杂基因组的引物设计方法,其特征在于:所述方法包括:
(1)获取目标物种及其同属其他物种的复杂基因组序列;
(2)将每个物种的复杂基因组序列按照contigs的长度进行排序,选取最长的数条contigs连接成一条长序列作为该物种的代表序列;
(3)将目标物种及其同属其他物种的代表序列进行多序列比对,选取目标物种独有而同属其他物种没有的区域作为目标物种的特异性序列;
(4)针对目标物种的特异性序列设计引物,即得。
2.根据权利要求1所述的引物设计方法,其特征在于:步骤(2)中,所述数条contigs至少为5条。
3.根据权利要求1所述的引物设计方法,其特征在于:步骤(2)中,所述数条contigs在连接成一条长序列时,在contigs之间添加若干个连续的N作为边界信号。
4.根据权利要求1所述的引物设计方法,其特征在于:步骤(4)中,所述设计引物采用引物设计软件,以目标物种的特异性序列作为模板,设置的参数包括但不限于GC含量、Tm值、引物长度、产物长度、返回引物数量;
和/或,若最终没有返回合适的引物,则返回步骤(2)重新选取contigs,连接后得到新的代表序列,再重新执行步骤(3)、步骤(4)的操作。
5.根据权利要求1所述的引物设计方法,其特征在于:步骤(4)中,所述设计引物后对引物进行评估,包括但不限于引物特异性评估、物种覆盖度评估;
所述引物特异性评估是将引物比对回核酸数据库,若引物比对到目标物种,判定为通过;若引物除比对到目标物种外,还比对到其他物种,且序列相似度在96%以上,则去掉该引物;
和/或,所述物种覆盖度评估是将引物比对回该物种下所有菌株的基因组序列,分析每对引物能够扩增出预期产物的菌株占比,比值大于设定阈值的判定为通过。
6.根据权利要求1所述的引物设计方法,其特征在于:步骤(4)中,所述对引物进行评估后,当待检测病原微生物有多种、所用引物经组合后构成一个引物组时,再对引物组进行评估,包括但不限于引物二聚体评估、非特异性扩增产物评估;
所述引物二聚体评估中设定二聚体的|ΔG|≤20、且|ΔG|在10-20范围内的二聚体的数量/引物组中所有引物对的数量的比值≤1%的判定为通过;
和/或,所述非特异性扩增产物评估中设定非特异性扩增产物的数量/引物组中所有引物对的数量的比值≤1%的判定为通过。
7.一种病原微生物检测用引物组,其特征在于:所述引物组包含针对以下任意一种或多种病原微生物的特异性序列设计的扩增引物:
(1)衣氏放线菌,其特异性序列如SEQ ID NO:1所示;
(2)土曲霉,其特异性序列如SEQ ID NO:2所示;
(3)侵肺戴阿李斯特菌,其特异性序列如SEQ ID NO:3所示;
(4)牙周梭杆菌,其特异性序列如SEQ ID NO:4所示;
(5)副流感嗜血杆菌,其特异性序列如SEQ ID NO:5所示;
(6)瘰疬分枝杆菌,其特异性序列如SEQ ID NO:6所示;
(7)苏尔加分枝杆菌,其特异性序列如SEQ ID NO:7所示;
(8)厌氧消化链球菌,其特异性序列如SEQ ID NO:8所示;
(9)小孢根霉,其特异性序列如SEQ ID NO:9所示;
(10)尖端赛多孢子菌,其特异性序列如SEQ ID NO:10所示;
(11)普通裂褶菌,其特异性序列如SEQ ID NO:11所示;
(12)脓肿诺卡菌,其特异性序列如SEQ ID NO:12所示;
(13)耶氏肺孢子菌,其特异性序列如SEQ ID NO:13所示;
(14)微小根毛霉,其特异性序列如SEQ ID NO:14所示;
(15)米根霉,其特异性序列如SEQ ID NO:15所示;
(16)灰色小克银汉霉,其特异性序列如SEQ ID NO:16所示;
(17)鸟肠球菌,其特异性序列如SEQ ID NO:17所示;
(18)伞枝横梗霉,其特异性序列如SEQ ID NO:18所示;
(19)总状毛霉,其特异性序列如SEQ ID NO:19所示;
(20)阿萨希毛孢子菌,其特异性序列如SEQ ID NO:20所示;
(21)皮炎芽生菌,其特异性序列如SEQ ID NO:21所示;
(22)热带念珠菌,其特异性序列如SEQ ID NO:22所示。
8.根据权利要求7所述的引物组,其特征在于:所述引物组包含以下任意一对或多对扩增引物:
(1)衣氏放线菌,其扩增引物的核苷酸序列如SEQ ID NO:23-24所示;
(2)土曲霉,其扩增引物的核苷酸序列如SEQ ID NO:25-26所示;
(3)侵肺戴阿李斯特菌,其扩增引物的核苷酸序列如SEQ ID NO:27-28所示;
(4)牙周梭杆菌,其扩增引物的核苷酸序列如SEQ ID NO:29-30所示;
(5)副流感嗜血杆菌,其扩增引物的核苷酸序列如SEQ ID NO:31-32所示;
(6)瘰疬分枝杆菌,其扩增引物的核苷酸序列如SEQ ID NO:33-34所示;
(7)苏尔加分枝杆菌,其扩增引物的核苷酸序列如SEQ ID NO:35-36所示;
(8)厌氧消化链球菌,其扩增引物的核苷酸序列如SEQ ID NO:37-38所示;
(9)小孢根霉,其扩增引物的核苷酸序列如SEQ ID NO:39-40所示;
(10)尖端赛多孢子菌,其扩增引物的核苷酸序列如SEQ ID NO:41-42所示;
(11)普通裂褶菌,其扩增引物的核苷酸序列如SEQ ID NO:43-44所示;
(12)脓肿诺卡菌,其扩增引物的核苷酸序列如SEQ ID NO:45-46所示;
(13)耶氏肺孢子菌,其扩增引物的核苷酸序列如SEQ ID NO:47-48所示;
(14)微小根毛霉,其扩增引物的核苷酸序列如SEQ ID NO:49-50所示;
(15)米根霉,其扩增引物的核苷酸序列如SEQ ID NO:51-52所示;
(16)灰色小克银汉霉,其扩增引物的核苷酸序列如SEQ ID NO:53-54所示;
(17)鸟肠球菌,其扩增引物的核苷酸序列如SEQ ID NO:55-56所示;
(18)伞枝横梗霉,其扩增引物的核苷酸序列如SEQ ID NO:57-58所示;
(19)总状毛霉,其扩增引物的核苷酸序列如SEQ ID NO:59-60所示;
(20)阿萨希毛孢子菌,其扩增引物的核苷酸序列如SEQ ID NO:61-62所示;
(21)皮炎芽生菌,其扩增引物的核苷酸序列如SEQ ID NO:63-64所示;
(22)热带念珠菌,其扩增引物的核苷酸序列如SEQ ID NO:65-66所示。
9.一种包含如权利要求7-8中任一项所述的引物组的病原微生物检测试剂盒。
10.根据权利要求9所述的试剂盒,其特征在于:所述试剂盒还包含聚合酶、扩增反应缓冲液、接头、连接酶、连接反应缓冲液、测序靶标扩增引物、高保真扩增酶、高保真扩增反应缓冲液中的一种或多种。
CN202311832990.0A 2023-12-28 2023-12-28 一种针对复杂基因组的引物设计方法、病原微生物检测用引物组 Pending CN117987573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311832990.0A CN117987573A (zh) 2023-12-28 2023-12-28 一种针对复杂基因组的引物设计方法、病原微生物检测用引物组

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311832990.0A CN117987573A (zh) 2023-12-28 2023-12-28 一种针对复杂基因组的引物设计方法、病原微生物检测用引物组

Publications (1)

Publication Number Publication Date
CN117987573A true CN117987573A (zh) 2024-05-07

Family

ID=90896668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311832990.0A Pending CN117987573A (zh) 2023-12-28 2023-12-28 一种针对复杂基因组的引物设计方法、病原微生物检测用引物组

Country Status (1)

Country Link
CN (1) CN117987573A (zh)

Similar Documents

Publication Publication Date Title
Boughner et al. Microbial ecology: where are we now?
CN110004210A (zh) 一种用于构建细菌16S rDNA全长高通量测序文库的方法
CN109486923B (zh) 多重扩增子测序用引物系统、其应用以及测序文库的构建方法
CN109082479B (zh) 从样本中鉴定微生物物种的方法和装置
CN107586862B (zh) 肠道菌群在儿童反复呼吸道感染诊断中的应用
CN108998508A (zh) 扩增子测序文库的构建方法及引物组和试剂盒
CN103571822B (zh) 一种用于新一代测序分析的多重目的dna片段富集方法
CN102628082A (zh) 基于高通量测序技术进行核酸定性定量检测的方法
CN114134219A (zh) 一种多重核酸检测系统及其制备方法与应用
CN115976235B (zh) 德氏乳杆菌cicc 6047菌株的鉴定方法及其引物、试剂盒和应用
CN116287357A (zh) 一种基于靶向扩增子测序的呼吸道病原菌检测试剂盒
CN117987573A (zh) 一种针对复杂基因组的引物设计方法、病原微生物检测用引物组
CN116356054A (zh) 检测常见病原微生物及耐药基因的试剂盒及检测方法
CN115011695A (zh) 基于游离环状dna基因的多癌种识别标志物、试剂盒及应用
AU2020277502A1 (en) Methods for detection of rare DNA sequences in fecal samples
CN108642190A (zh) 基于14个常染色体snp遗传标记的法医学复合检测试剂盒
CN115992267B (zh) 一种高通量高精度检出多种病原菌的引物组、试剂盒及方法
CN109609668B (zh) 一种鼠伤寒沙门菌mlva分型的检测引物组、试剂盒及其应用
CN115595382B (zh) 用于检测猪肠道冠状病毒的引物组及其应用
CN118127187A (zh) 一种基于靶向测序的呼吸道病原微生物检测试剂盒及其应用
CN118272555A (zh) 一种靶向病原检测方法、系统和设备
CN115786547A (zh) 用于病原微生物检测的引物组、试剂盒及其应用方法
CN117025808A (zh) 一种病原微生物检测引物组合、试剂盒和检测方法
Tarquini et al. The Oxford Nanopore MinION as a Versatile Technology for the Diagnosis and Characterization of Emerging Plant Viruses
EP3696279A1 (en) Methods for noninvasive prenatal testing of fetal abnormalities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination