CN112687337A - 超多重引物设计方法 - Google Patents

超多重引物设计方法 Download PDF

Info

Publication number
CN112687337A
CN112687337A CN202011633512.3A CN202011633512A CN112687337A CN 112687337 A CN112687337 A CN 112687337A CN 202011633512 A CN202011633512 A CN 202011633512A CN 112687337 A CN112687337 A CN 112687337A
Authority
CN
China
Prior art keywords
primer
primers
designing
multiplex pcr
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011633512.3A
Other languages
English (en)
Other versions
CN112687337B (zh
Inventor
余成鹏
邹树勇
朱鹏远
吴春求
陈丹
张东东
陈嘉昌
柳俊
胡朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jinqirui Biotechnology Co ltd
Original Assignee
Guangzhou Jinqirui Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jinqirui Biotechnology Co ltd filed Critical Guangzhou Jinqirui Biotechnology Co ltd
Priority to CN202011633512.3A priority Critical patent/CN112687337B/zh
Publication of CN112687337A publication Critical patent/CN112687337A/zh
Application granted granted Critical
Publication of CN112687337B publication Critical patent/CN112687337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及核酸检测技术领域,具体而言,涉及一种超多重引物设计方法。所述方法包括:获取待检测的目标序列并设计引物,建立引物池;以待扩增目标区域分别进行横向及纵向排列,将所述引物池中各待扩增目标区域的引物标记在待扩增目标区域以建立二元矩阵,对矩阵内的单条引物的分值进行评价,将低于预期的引物进行替换,对合格的引物组合进行输出。该方法可根据预期需要检测的病原微生物选择特异性区域并设定罚分机制进行特异性引物设计,自建二元矩阵评分机制对引物序列特异性进行分析,减少实验摸索测试,可以高效快速地同时扩增多个基因。

Description

超多重引物设计方法
技术领域
本发明涉及核酸检测技术领域,具体而言,涉及一种超多重引物设计方法。
背景技术
多重PCR是PCR发展过程中衍生出的PCR为基础的扩增技术,可在一个反应体系中通过一对以上的引物,分别扩增不同模板而获得不同的扩增片段,既保留了常规PCR的特异性和敏感性,又减少了操作步骤及试剂用量的使用,降低因操作而导致的污染。随着高通量测序技术的发展,对PCR产物进行高灵敏度及高分辨率的检测成为了可能,多重PCR的限制由可同步扩增的片段数量上限变为多重PCR自身体系的限制,从而在NGS领域,衍生出超多重PCR技术。
超多重PCR的原理与多重PCR相似,但不同于传统的4-5重的多重PCR,辅以高通量测序能将PCR提升至上千重甚至上万重。基于超多重PCR的靶向NGS(tNGS)相较于普通宏基因组具有更高的灵敏度,更低的检测成本优势,该技术未来将在遗传病检测、癌症检测及病原微生物检测中有巨大的应用空间。基于超多重PCR的病原微生物tNGS是一种灵敏度高、特异性强的检测方法,具有无可比拟的优越性。tNGS不仅能针对病原微生物的科、属特异性、种特异性及种下分类进行鉴定,将病原微生物精确到不同的基因型,同时还能针对性地了解其毒力基因及耐药基因,为患者的诊疗提供参考。
然而,超多重PCR的设计需要综合考虑模板、引物及反应体系等诸多因素,目前依旧存在诸多难题。其中,引物设计是超多重PCR效果优劣的决定性因素。
超多重PCR设计的引物应具有极高的抗干扰性,使得引物间不会互补,尤其是引物3’端的互补。
引物扩增的目标区域应具有特异性,应保证引物不能扩增目标区域以外的区域。
超多重引物的长度研究应同时考虑自身二级结构及引物特异性等因素,引物越长,越容易形成引物二聚体。但为了保证引物扩增的特异性,常会设计更长的引物以结合特定模板。
发明内容
本发明的方法建立了一种超多重PCR引物设计方法。具体来说,即针对不同靶序列,设计多对特异性引物,用于基于超多重PCR。超多重引物设计装置系统能够设计上千甚至上万对引物并提供有效的引物组合方案,相对传统多重PCR,提高PCR的效率,缩短实验周期。
本发明的第一方面涉及一种超多重PCR引物设计方法,包括:
获取待检测的目标序列并设计引物,建立引物池;
以待扩增目标区域分别进行横向及纵向排列,将所述引物池中各待扩增目标区域的引物标记在待扩增目标区域以建立二元矩阵,对矩阵内的单条引物的分值进行评价,将低于预期的引物进行替换,对合格的引物组合进行输出;
其中,所述单条引物分值的评价方法包括a)和b):
a)通过如下罚分机制机进行评价,将所得分值低于阈值的引物进行替换:
a1)每条引物自身头尾存在连续2个以下碱基互补配对的情况,+2分;
引物自身头尾存在连续2-3个碱基互补配对的情况,+1分;
引物自身头尾存在连续3个以上碱基互补配对的情况,+0分;
a2)引物Tm值与Tm平均值的偏移程度在2℃以内的,每条引物+1分;
引物Tm值与Tm平均值的偏移程度在2℃以上的,每条引物+0分;
a3)引物GC含量在平均GC含量平均值5%以内的,每条引物+1分,引物GC含量在平均GC含量平均值5%以上的,每条引物+0分;
其中a1)~a3)无先后顺序;
b)以偏移Tm平均值最小的引物对作为标准引物,将所述标准引物与所构建的二元矩阵内的其他引物分别作互补分析测试,测试引物的初始得分为5分;每条测试引物与所述标准引物之间存在连续2个以上碱基互补配对的情况时,每超过1个碱基减2分;将分值低于3分或与其他引物互补分析分值低于3分所出现频次超50%以上的引物退回引物池,替换为另一条引物并重新计算。
可选的,如上所述的超多重PCR引物设计方法,步骤b)中,将所述标准引物设置为次于偏移Tm平均值且偏移量在0.5℃内所对应的引物。
可选的,如上所述的超多重PCR引物设计方法,步骤a)中,所述罚分机制还包括引入如下参数中的任一种,进行罚分评价:
引物发夹样二级结构、引物碱基分布随机性以及引物末端碱基种类。
可选的,如上所述的超多重PCR引物设计方法,若所述二元矩阵评分时各引物标准均无法满足预期的引物组合方案,则重新选择扩增区域或重新建立引物池。
可选的,如上所述的超多重PCR引物设计方法,所述引物池为各目标序列至少五对引物的集合。
可选的,如上所述的超多重PCR引物设计方法,所述待检测的目标序列为病原微生物。
可选的,如上所述的超多重PCR引物设计方法,所述待检测的目标序列包括所述病原微生物的功能区域、特异性区域及串联重复片段中的至少一种;
所述特异性区域包括属间、种间、或亚种间的特异性序列。
可选的,如上所述的超多重PCR引物设计方法,所述属间、种间、或种下的特异性序列在属内、种内或亚种内是保守的。
可选的,如上所述的超多重PCR引物设计方法,所述功能区域包括毒力基因和/或耐药基因;
可选的,如上所述的超多重PCR引物设计方法,所述待检测的目标序列相对于所述病原微生物的宿主基因组序列是特异的。
可选的,如上所述的超多重PCR引物设计方法,所述方法进一步包括设计建库接头序列及接头扩增引物。
本发明的第二方面涉及一种计算机可读存储介质,所述计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行如上所述的方法。
本发明的第三方面涉及一种电子设备,包括:
一个或多个处理器;以及
存储装置,存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的方法。
本发明的有益效果为:
本发明人深入研究上述问题,最终获得了一种超多重引物的设计方法,该方法可根据预期需要检测的病原微生物选择特异性区域并设定罚分机制进行特异性引物设计,自建二元矩阵评分机制对引物序列特异性进行分析,减少实验摸索测试,可以高效快速地同时扩增多个基因。当其用于病原微生物引物设计时,搭配tNGS技术不仅能对病原微生物进行科属种的鉴定,还具有检出未知病原微生物的能力,同时,针对毒力基因和耐药基因的检测结果,能为临床诊断提供诊疗意见。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例中基于罚分机制设计的引物体系的6个样本MT1-MT6扩增效果;
图2为本发明一个实施例中不基于罚分机制设计的引物体系的6个样本MT1-MT6扩增效果。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
术语“引物”是指短核酸(寡核苷酸),其充当在合适条件下通过核酸聚合酶合成多核苷酸链的起始点。多核苷酸合成和扩增反应一般包括合适的缓冲剂、dNTPs和/或rNTPs以及一种或多种任选的辅因子,并且于合适的温度进行。引物一般包括至少一个与靶序列至少基本上互补的靶杂交区。这个区域的长度一般为约15至约40个核苷酸。“引物对”是指与靶序列的相反链互补并被设计用于扩增靶序列的正向引物和反向引物(有时称为5'和3'引物)。正向和反向引物在靶序列上彼此可扩增的距离内排列,例如,约10-5000个核苷酸或约25-500个核苷酸。
术语“互补”是指多核苷酸中的核酸与第二多核苷酸中的另一核酸形成碱基对的能力。例如,序列5'-A-G-T-3'(对于RNA为5'-A-G-U-3')与序列3'-T-C-A-5'(对于RNA为3'-U-C-A-5')互补。互补可以是部分的,其中仅一些核酸根据碱基配对匹配,或者可以是完全的,其中所有的核酸都根据碱基配对匹配。如果探针或引物与靶序列至少部分互补,则认为所述探针或引物“对”靶序列“特异”。取决于条件,对于较短的核酸例如引物(例如,大于80%、90%、95%或更高),与对于较长序列相比,与靶序列的互补性程度一般更高。
术语“退火温度”是指互补的单链核酸分子群体中的一半在同源双链体或异源双链体中杂交的温度。退火温度可以基于解链温度(Tm),即,双链核酸分子群体的一半解离的温度。退火温度受溶液的离子强度和pH值,以及浓度、碱基组成和二级结构的影响。一对互补的核酸在给定条件下的退火温度可以通过实验确定,或借助于诸如Visual OMPTM(DNASoftware,Inc.,Ann Arbor,Mich.)的商业软件来预测。
术语“超多重PCR引物”,在本申请中指用于多重PCR反应体系引物对的数量至少为15对,或20对,或25对,或30对,或35对,或45对,或80对,或120对,或更多。
本发明的涉及一种超多重PCR引物设计方法,包括:
获取待检测的目标序列并设计引物,建立引物池;
以待扩增目标区域分别进行横向及纵向排列,将所述引物池中各待扩增目标区域的引物标记在待扩增目标区域以建立二元矩阵,对矩阵内的单条引物的分值进行评价,将低于预期的引物进行替换,对合格的引物组合进行输出;
其中,所述单条引物分值的评价方法包括a)和b):
a)通过如下罚分机制机进行评价,将所得分值低于阈值的引物进行替换:
a1)每条引物自身头尾存在连续2个以下碱基互补配对的情况,+2分;
引物自身头尾存在连续2-3个碱基互补配对的情况,+1分;
引物自身头尾存在连续3个以上碱基互补配对的情况,+0分;
a2)引物Tm值与Tm平均值的偏移程度在2℃以内的,每条引物+1分;
引物Tm值与Tm平均值的偏移程度在2℃以上的,每条引物+0分;
a3)引物GC含量在平均GC含量平均值5%以内的,每条引物+1分,引物GC含量在平均GC含量平均值5%以上的,每条引物+0分;
其中a1)~a3)无先后顺序;
b)以偏移Tm平均值最小的引物对作为标准引物,将所述标准引物与所构建的二元矩阵内的其他引物分别作互补分析测试,测试引物的初始得分为5分;每条测试引物与所述标准引物之间存在连续2个以上碱基互补配对的情况时,每超过1个碱基减2分;将分值低于3分或与其他引物互补分析分值低于3分所出现频次超50%以上的引物退回引物池,替换为另一条引物并重新计算。
容易理解,所述引物池中的引物,以及所述替换引物的设计可以符合本领域技术人员所公知的引物设计规则。所述引物设计规则可选包括如下指标中的至少一种,引物长度、扩增产物长度、退火温度、GC含量、引物发夹样二级结构、引物互补等,也可以自定义其他设计条件。
引物的设计可以采用公知的常用软件,诸如Primer Premier、Oligo7、BeaconDesigner、NCBI的Primer-Blast、Primer3、BathPrimer3.0、The PCR Suite、Primerbank、PrimerX、BiSearch等。
在一些实施方式中,步骤b)中,将所述标准引物设置为次于偏移Tm平均值且偏移量在0.5℃内所对应的引物。
在一些实施方式中,步骤a)中,所述罚分机制还包括引入如下参数中的任一种,进行罚分评价:
引物发夹样二级结构、引物碱基分布随机性以及引物末端碱基种类。
可对要求较高的条件设置更为苛刻的罚分机制,如发夹样二级结构等可能会对引物效果造成显著影响的参数,可设置更为苛刻的罚分。
在一些实施方式中,若所述二元矩阵评分时各引物标准均无法满足预期的引物组合方案,则重新选择扩增区域或重新建立引物池。
在一些实施方式中,所述引物池为各目标序列至少五对引物的集合。
在一些实施方式中,所述待检测的目标序列为病原微生物。
本发明扩增的目标序列可以为根据目标病原微生物种类检索文献获取常用语检测的生物学区间段,例如,序列来自Genebank中已收录或已发表文章中提及相关基因的序列,下载序列后使用mega软件对序列进行多序列比对分析,获取目标序列引物设计区域。
病原微生物可以包括所有直接或间接引起人类疾病的真菌、细菌及病毒中的数十种或数百种或更多,具体的目标检测数量可自由选择。针对不同种类病原微生物的引物分类设计。
在一些实施方式中,所述待检测的目标序列包括所述病原微生物的功能区域、特异性区域及串联重复片段中的至少一种;
所述特异性区域包括属间、种间、或亚种间的特异性序列。
在一些实施方式中,所述属间、种间、或种下的特异性序列在属内、种内或亚种内是保守的。
在一些实施方式中,所述功能区域包括毒力基因和/或耐药基因;
在一些实施方式中,所述待检测的目标序列相对于所述病原微生物的宿主基因组序列是特异的。
在一些实施方式中,所述方法进一步包括设计建库接头序列及接头扩增引物。
在本发明的一些实施方式中,所述测序法是高通量测序,也称作二代测序(“NGS”)。二代测序在并行的测序过程中同时产生数千至数百万条序列。NGS区别于“Sanger测序”(一代测序),后者是基于单个测序反应中的链终止产物的电泳分离。可用于本发明的NGS的测序平台可以是商用可得的,包括但不限于Illumina MiniSeq、NextSeq 550等。适用于该检测方法的待检测物是指含有或推测含有来自病原微生物核酸的任何组合物。该术语包括全血、血浆、血清、细胞、咽拭子、唾液、尿液、粪便、脑脊液、胸积水、羊水、阴道分泌物。
可以理解,当上述进行二元矩阵评分时若各引物标准均无法满足预期的引物组合方案,提示重新选择扩增区域或重新建立引物池。若出现无法进行引物设计的序列进行提示,同样可进行序列删除操作或引物设计规则变更操作,重新建立引物池。
本发明所提供的方法,结合高通量测序技术及生物信息学分析流程,可大幅提高病原微生物检测的灵敏度及准确度,适用于包括Illumina测序在内的所有基于高通量测序原理的检测方法。引物体系内既包含科,属的通用引物,也包含种,亚种特异性引物,通过通用引物与特异性引物的联合检查,既能鉴定已知病原体,又能对新发的同一科或属内的变异的,新型的病原及时监测,极大地提升引物体系的应用范围;串联重复序列的引物设计能够放大某些易丢失或低拷贝的微生物的信号,降低假阳性的产生。针对引物的特异性,设定罚分机制,建立二元矩阵评分标准,降低引物二级结构的产生,同时也将其他非特异性扩增的概率降到最低。在引物体系内,在一次性检测多种病原微生物的同时减少了非目标区域占用的测序数据量,极大地提高资源利用率,为企业的检测节省更多的成本。
本发明还涉及一种计算机可读存储介质,所述计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行如上所述的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
根据本发明的再一方面,还涉及一种电子设备,包括:
一个或多个处理器;以及
存储装置,存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的方法。
可选的,电子设备还可以包括收发器。处理器和收发器相连,如通过总线相连。需要说明的是,实际应用中收发器不限于一个,该电子设备的结构并不构成对本申请实施例的限定。
其中,处理器可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线可包括一通路,在上述组件之间传送信息。总线可以是PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。存储器802可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
下面将结合实施例对本发明的实施方案进行详细描述。
实施例1
本发明提供一种病原微生物超多重PCR引物设计装置系统输出引物组合方式,并用于高通量测序检测病原物的方法。本发明是根据待检测样本的特异性序列设计特异性引物组合方案,经验证后用于超多重PCR扩增,扩增产物经文库制备并测序,对样本中微生物种类及致病/耐药基因进行检测。以98种病原微生物检测为例。
通过文献检索选择常见的病原微生物98种共98个基因组序列,在Genebank上下载各病原微生物序列。针对上述病原微生物已有文献支持的功能区域、保守区域及串联重复片段的序列,使用mega软件进行多序列比对分析,比对获得的属间通用序列、种间特异性序列及种下分类亚种保守序列,以及各病原微生物相关致病基因及耐药基因序列共182个目标扩增区域。
针对上述序列,设计引物经引物特异性比对确认无非特异性扩增风险,并存放于引物池中,引物设计规则应达到以下标准:
(1)选择种特异性区间及科属保守性区间,耐药基因,毒力基因,每种病原设计5对引物,以确保敏感性及特异性。
(2)引物片段长度在18-24bp之间,扩增产物长度在110-120bp之间;
(3)引物退火温度在55-65℃之间;
(4)引物GC含量在40-60%之间;
(5)引物3’端应为C或者G;6.每条引物不出现连续4个及以上A或者T或者C或者G;
针对上述获得的引物池,按以下条件进行筛选配对,计算最佳引物组合方案:
(1)每条引物自身头尾存在连续2个以下碱基互补配对的情况,得2分,引物自身头尾存在连续2-3个碱基互补配对的情况,得1分,引物自身头尾存在连续3个以上碱基互补配对的情况,得0分;
(2)引物Tm值与Tm平均值的偏移程度在2℃以内的,每条引物+1分,引物Tm值与Tm平均值的偏移程度在2℃以上的,每条引物+0分;
(3)引物GC含量在平均GC含量平均值5%以内的,每条引物+1分,引物GC含量在平均GC含量平均值5%以上的,每条引物+0分;
(4)以偏移Tm平均值最小的引物对作为标准,并以标准引物对构建二元矩阵与其他引物分别作互补分析,每2条引物初始得分为5分,每条引物与之间存在连续2个以上碱基互补配对的情况,每超过1个碱基减2分;将分值低于3分或与其他引物互补分析分值低于3分所出现频次超50%以上的引物退回引物池,替换为另一条引物并重新计算。
经以上步骤筛选后,输出得分最高的引物组合方案,获得引物如表1所示。
表1引物信息
Figure BDA0002875586050000111
Figure BDA0002875586050000121
Figure BDA0002875586050000131
Figure BDA0002875586050000141
Figure BDA0002875586050000151
Figure BDA0002875586050000161
Figure BDA0002875586050000171
Figure BDA0002875586050000181
Figure BDA0002875586050000191
以上病原微生物超多重PCR特异性引物完整覆盖目标的175个区域,将该引物组合用于超多重PCR,其扩增产物用于建库及高通量测序。
选择引物设计覆盖范围内的98种微生物共846例已知阳性样本和引物设计覆盖范围外的3种微生物共48例已知样本,总计894例样本,经过DNA提取、PCR扩增、文库制备及上机测序。
所有引物设计覆盖内的样本均能正确检出,对应的病原微生物,阳性符合率为100%,如表2所示。所有引物设计覆盖范围外的样本均不检出病原微生物,阴性符合率为100%,如表3所示。以上引物设计覆盖范围内或范围外样本之间均不产生交叉污染现象,特异性较好。
表2引物设计覆盖范围内的样本检测结果
Figure BDA0002875586050000201
Figure BDA0002875586050000211
Figure BDA0002875586050000221
注:部分阳性标本较难收集,测试采用合成假病毒或购买商用质控品。
表3引物设计覆盖范围外的样本检测结果
序号 病原微生物 总数 阴性计数 阴性符合率(%)
1 土曲霉 5 5 100
2 洋葱伯克霍尔德菌 28 28 100
3 耶氏肺孢子菌 15 15 100
同时,选择8例呼吸道合胞病毒B型阳性样本,分别使用Sanger测序方法与基于本实施例所述超多种PCR引物组合的tNGS方法,并以Sanger测序作为标准,验证不同方法学的一致性。结果显示,Sanger测序与tNGS均能正确检出8例样本中的呼吸道合报病毒B型,一致性较好。
综合以上结果,证明本专利所述超多重PCR引物设计装置设计的引物组合对于检测范围内阳性或检测范围内阴性样本均能准确检出。
实施例2
选择实施例1中所述超多重PCR引物组合,选择不在上述引物设计中的肠道病毒近缘种柯萨奇病毒A6型进行检测,结果显示2例柯萨奇病毒A6型虽不在引物设计范围内,但根据通用引物序列,提示为肠道病毒属其他型别。该2例结果与已知的阳性结果一致,证明本引物组合拥有对未知样本的检出或预测能力,结果如表4所示。
表4近缘种检测
序号 病原微生物 总数 阳性计数 阳性符合率(%)
1 柯萨奇病毒A6型 2 2 100
实施例3
选择实施例1中所述目标序列不基于罚分机制进行引物设计获得引物组合,并与实施例1中所述超多重PCR引物组合对6个相同样本进行扩增,以扩增后产物浓度及扩增片段分布比较扩增效果。
通过对相同模板量的不同引物体系的反应体系进行扩增,测定浓度后并使用Qsep100分析扩增产物的片段长度,结果显示,对6个样本PCR扩增后的浓度进行分析,基于罚分机制设计的引物组合扩增后的浓度高于不基于罚分机制设计的引物组合,如表5所示;基于罚分机制的引物组合在40-60bp范围内不出现峰,而不基于罚分机制的引物组合在40-60bp范围内出现峰,即给予罚分机制的引物组合扩增后引物二聚体显著少于不基于罚分机制设计的引物组合,如图1、图2所示。
表5不同引物组合扩增后浓度比较
Figure BDA0002875586050000231
综上,本专利所述的罚分机制尤其是自建二元矩阵,可有效消除引物对之间的可能产生的引物二聚体,从而有效提高了超多重PCR的引物扩增特异性及扩增效率。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (13)

1.超多重PCR引物设计方法,其特征在于,包括:
获取待检测的目标序列并设计引物,建立引物池;
以待扩增目标区域分别进行横向及纵向排列,将所述引物池中各待扩增目标区域的引物标记在待扩增目标区域以建立二元矩阵,对矩阵内的单条引物的分值进行评价,将低于预期的引物进行替换,对合格的引物组合进行输出;
其中,所述单条引物分值的评价方法包括a)和b):
a)通过如下罚分机制机进行评价,将所得分值低于阈值的引物进行替换:
a1)每条引物自身头尾存在连续2个以下碱基互补配对的情况,+2分;
引物自身头尾存在连续2-3个碱基互补配对的情况,+1分;
引物自身头尾存在连续3个以上碱基互补配对的情况,+0分;
a2)引物Tm值与Tm平均值的偏移程度在2℃以内的,每条引物+1分;
引物Tm值与Tm平均值的偏移程度在2℃以上的,每条引物+0分;
a3)引物GC含量在平均GC含量平均值5%以内的,每条引物+1分,引物GC含量在平均GC含量平均值5%以上的,每条引物+0分;
其中a1)~a3)无先后顺序;
b)以偏移Tm平均值最小的引物对作为标准引物,将所述标准引物与所构建的二元矩阵内的其他引物分别作互补分析测试,测试引物的初始得分为5分;每条测试引物与所述标准引物之间存在连续2个以上碱基互补配对的情况时,每超过1个碱基减2分;将分值低于3分或与其他引物互补分析分值低于3分所出现频次超50%以上的引物退回引物池,替换为另一条引物并重新计算。
2.根据权利要求1所述的超多重PCR引物设计方法,其特征在于,步骤b)中,将所述标准引物设置为次于偏移Tm平均值且偏移量在0.5℃内所对应的引物。
3.根据权利要求1所述的超多重PCR引物设计方法,其特征在于,步骤a)中,所述罚分机制还包括引入如下参数中的任一种,进行罚分评价:
引物发夹样二级结构、引物碱基分布随机性以及引物末端碱基种类。
4.根据权利要求1所述的超多重PCR引物设计方法,其特征在于,若所述二元矩阵评分时各引物标准均无法满足预期的引物组合方案,则重新选择扩增区域或重新建立引物池。
5.根据权利要求1~4任一项所述的超多重PCR引物设计方法,其特征在于,所述引物池为各目标序列至少五对引物的集合。
6.根据权利要求1~4任一项所述的超多重PCR引物设计方法,其特征在于,所述待检测的目标序列为病原微生物。
7.根据权利要求6所述的超多重PCR引物设计方法,其特征在于,所述待检测的目标序列包括所述病原微生物的功能区域、特异性区域及串联重复片段中的至少一种;
所述特异性区域包括属间、种间、或亚种间的特异性序列。
8.根据权利要求7所述的超多重PCR引物设计方法,其特征在于,所述属间、种间、或种下的特异性序列在属内、种内或亚种内是保守的。
9.根据权利要求7所述的超多重PCR引物设计方法,其特征在于,所述功能区域包括毒力基因和/或耐药基因。
10.根据权利要求6所述的超多重PCR引物设计方法,其特征在于,所述待检测的目标序列相对于所述病原微生物的宿主基因组序列是特异的。
11.根据权利要求1~4、7~10任一项所述的超多重PCR引物设计方法,其特征在于,所述方法进一步包括设计建库接头序列及接头扩增引物。
12.一种计算机可读存储介质,所述计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行如权利要求1~11任一项所述的方法。
13.一种电子设备,包括:
一个或多个处理器;以及
存储装置,存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~11任一项所述的方法。
CN202011633512.3A 2020-12-31 2020-12-31 超多重引物设计方法 Active CN112687337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011633512.3A CN112687337B (zh) 2020-12-31 2020-12-31 超多重引物设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011633512.3A CN112687337B (zh) 2020-12-31 2020-12-31 超多重引物设计方法

Publications (2)

Publication Number Publication Date
CN112687337A true CN112687337A (zh) 2021-04-20
CN112687337B CN112687337B (zh) 2023-08-08

Family

ID=75456187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011633512.3A Active CN112687337B (zh) 2020-12-31 2020-12-31 超多重引物设计方法

Country Status (1)

Country Link
CN (1) CN112687337B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115101126A (zh) * 2022-02-22 2022-09-23 中国医学科学院北京协和医院 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统
CN116024360A (zh) * 2022-12-15 2023-04-28 广州市金圻睿生物科技有限责任公司 一种用于结核分枝杆菌复合群鉴定及耐药基因突变检测的引物组合及其应用
CN116092585A (zh) * 2023-01-30 2023-05-09 上海睿璟生物科技有限公司 基于机器学习的多重pcr扩增优化方法、系统、设备及介质
WO2023077491A1 (zh) * 2021-11-06 2023-05-11 江汉大学 一种呼吸道合胞病毒的mnp标记组合、引物对组合、试剂盒及其应用
CN115678967B (zh) * 2022-11-14 2024-04-26 武汉贝纳科技有限公司 一种微生物多重pcr靶向扩增引物池的设计方法
WO2024119481A1 (zh) * 2022-12-09 2024-06-13 深圳华大智造科技股份有限公司 一种快速制备多重pcr测序文库的方法及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060127916A1 (en) * 2003-07-15 2006-06-15 Michael Seul Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
CN105543361A (zh) * 2016-01-05 2016-05-04 华中科技大学同济医学院附属同济医院 一种检测诊断多囊肾致病基因的dna文库及其应用
CN107254541A (zh) * 2017-08-03 2017-10-17 广州万德基因医学科技有限公司 用于扩增cfDNA样品中多个目标的NGS建库引物池及应用
WO2018036176A1 (zh) * 2016-08-26 2018-03-01 广州永诺生物科技有限公司 一种扩增brca1/2基因的多重pcr引物及一种多重pcr引物的设计方法
CN109554449A (zh) * 2019-01-18 2019-04-02 集美大学 一种可同时检测气单胞菌7个毒力基因的多重pcr方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060127916A1 (en) * 2003-07-15 2006-06-15 Michael Seul Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
CN105543361A (zh) * 2016-01-05 2016-05-04 华中科技大学同济医学院附属同济医院 一种检测诊断多囊肾致病基因的dna文库及其应用
WO2018036176A1 (zh) * 2016-08-26 2018-03-01 广州永诺生物科技有限公司 一种扩增brca1/2基因的多重pcr引物及一种多重pcr引物的设计方法
CN107254541A (zh) * 2017-08-03 2017-10-17 广州万德基因医学科技有限公司 用于扩增cfDNA样品中多个目标的NGS建库引物池及应用
CN109554449A (zh) * 2019-01-18 2019-04-02 集美大学 一种可同时检测气单胞菌7个毒力基因的多重pcr方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑凯文;黄晓园;陈渡波;张俊杰;王菊芳;徐鸿绪;: "基于多重PCR和第二代高通量测序技术快速检测下呼吸道感染病原微生物方法的建立和应用", 国际检验医学杂志, no. 17 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023077491A1 (zh) * 2021-11-06 2023-05-11 江汉大学 一种呼吸道合胞病毒的mnp标记组合、引物对组合、试剂盒及其应用
CN115101126A (zh) * 2022-02-22 2022-09-23 中国医学科学院北京协和医院 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统
CN115678967B (zh) * 2022-11-14 2024-04-26 武汉贝纳科技有限公司 一种微生物多重pcr靶向扩增引物池的设计方法
WO2024119481A1 (zh) * 2022-12-09 2024-06-13 深圳华大智造科技股份有限公司 一种快速制备多重pcr测序文库的方法及其应用
CN116024360A (zh) * 2022-12-15 2023-04-28 广州市金圻睿生物科技有限责任公司 一种用于结核分枝杆菌复合群鉴定及耐药基因突变检测的引物组合及其应用
CN116024360B (zh) * 2022-12-15 2023-10-20 广州市金圻睿生物科技有限责任公司 一种用于结核分枝杆菌复合群鉴定及耐药基因突变检测的引物组合及其应用
CN116092585A (zh) * 2023-01-30 2023-05-09 上海睿璟生物科技有限公司 基于机器学习的多重pcr扩增优化方法、系统、设备及介质
CN116092585B (zh) * 2023-01-30 2024-04-19 上海睿璟生物科技有限公司 基于机器学习的多重pcr扩增优化方法、系统、设备及介质

Also Published As

Publication number Publication date
CN112687337B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN112687337B (zh) 超多重引物设计方法
JP7119014B2 (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
US10870880B2 (en) Systems and methods to detect rare mutations and copy number variation
US20240102101A1 (en) Systems and methods to detect rare mutations and copy number variation
KR102091312B1 (ko) 고유 분자 색인(umi)을 갖는 용장성 판독을 사용하는 서열분석된 dna 단편의 오류 억제
CN114574581A (zh) 检测稀有突变和拷贝数变异的系统和方法
Sarkar et al. Development and validation of cost-effective one-step multiplex RT-PCR assay for detecting the SARS-CoV-2 infection using SYBR Green melting curve analysis
Huang et al. Developing RT-LAMP assays for detection of SARS-CoV-2 in Saliva
JP2015188380A (ja) 腸内菌叢の老若判定方法及び菌群のスクリーニング方法
CA3079252A1 (en) Correcting for deamination-induced sequence errors
Hwang et al. Robust real-time reverse transcription-PCR for detection of foot-and-mouth disease virus neutralizing carryover contamination
Feng et al. Efficient large-scale screening of viral pathogens by fragment length identification of pooled nucleic acid samples (FLIPNAS)
Mordechai et al. Detection of A-to-I microRNA editing with miRmedon reveals widespread co-editing of mature microRNA in the human brain
WO2024044668A9 (en) Next-generation sequencing pipeline for detection of ultrashort single-stranded cell-free dna
JP2015188379A (ja) 腸内菌叢の老若判定方法及び菌群のスクリーニング方法
CN118006768A (zh) 胃癌相关分子标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant