CN109658982B - 一种用于基因测序的引物设计方法及系统 - Google Patents
一种用于基因测序的引物设计方法及系统 Download PDFInfo
- Publication number
- CN109658982B CN109658982B CN201811591649.XA CN201811591649A CN109658982B CN 109658982 B CN109658982 B CN 109658982B CN 201811591649 A CN201811591649 A CN 201811591649A CN 109658982 B CN109658982 B CN 109658982B
- Authority
- CN
- China
- Prior art keywords
- primer
- candidate
- primers
- characteristic value
- combined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于基因测序的引物设计方法及系统,本发明实施步骤包括计算每一个候选引物的各项基本特征值,获取对各项基本特征值量化求和计算引物综合量化特征值;对候选引物进行筛选简化、两两组合得到组合候选引物并计算组合候选引物综合特征值;若被设计引物为针对目标检测点设计,则选择一组组合候选引物综合特征值最优的组合候选引物输出;否则在等距离的前提下选择该区域附近引物综合特征值最佳的候选引物输出。本发明通过一次性搜索所有可能的引物并评估引物的各项特征后进行综合检测,从而一次性就能挑出所有的最优引物,具有挑出来的引物效果最优、操作方便快捷、引物设计效率高的优点。
Description
技术领域
本发明涉及生物基因测序领域,具体涉及一种用于基因测序的引物设计方法及系统。
背景技术
聚合酶链式反应(Polymerase Chain Reaction,简称PCR)是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火(复性)及适温延伸等反应组成一个周期,循环进行,使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便等特点。而PCR结合二代测序的方式更是由于能实现对数十数百个模板同时进行扩增测序,大幅降低实验成本,提高实验效率的优点,而越来越受到研究者们的欢迎。
在进行PCR反应之前,必须设计合适的引物。引物是一小段单链DNA或RNA,作为DNA复制的起始点,在核酸合成反应时,作为每个多核苷酸链进行延伸的出发点而起作用的多核苷酸链。引物设计的好坏直接影响整个实验的结果。引物设计的效果受到很多因素影响,包括引物长度、GC含量、溶解温度(tm)、特异性等等,设计合适的引物是一项艰巨的任务。
目前已有很多引物设计软件,但大部分只能一次性设计少量引物,操作麻烦,效率低,并且很大一部分只能设计面对面PCR引物,满足不了利用二代测序批量进行PCR扩增测序、以及多种引物方式的需求。另外,一般设计引物的策略是设定各项特征阈值,当搜索到满足所有要求的引物就停止,但可能搜索完了都没有满足条件的引物时,需要重新降低各项特征阈值,然后重新搜索,然后降低阈值再搜索,可能反反复复需要降低三四次阈值才能把所有的引物设计出来;这样不仅操作麻烦、效率低下,且对于设计出来的引物并不是最优引物。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种用于基因测序的引物设计方法及系统,本发明通过一次性搜索所有可能的引物并评估引物的各项特征后进行综合检测,从而一次性就能挑出所有的最优引物,具有挑出来的引物效果最优、操作方便快捷、引物设计效率高的优点。
为了解决上述技术问题,本发明采用的技术方案为:
一种用于基因测序的引物设计方法,实施步骤包括:
1)针对输入的模板序列按不同位置不同长度进行遍历得到候选引物序列;
2)计算每一个候选引物的各项基本特征值;
3)针对每一个候选引物,分别对各项基本特征值进行量化,并将所有的量化结果进行求和得到该候选引物的引物综合量化特征值;
4)对候选引物序列中的候选引物进行筛选简化;
5)针对筛选简化后的候选引物在符合方向要求的前提下进行两两组合得到组合候选引物,所述在符合方向要求的前提具体是指若被设计引物为面对面引物,则针对两两组合得到组合候选引物挑选方向相反的所有组合候选引物,若被设计引物为同向引物,则针对两两组合得到组合候选引物挑选方向相同的所有组合候选引物;
6)针对每一对组合候选引物,分别计算组合间距特征值以及距离特征值;
7)针对每一对组合候选引物,分别对组合间距特征值、距离特征值进行量化,并将量化结果与对应两个候选引物的引物综合量化特征值进行综合,从而得到组合候选引物综合特征值;
8)判断被设计引物的类型,若被设计引物为针对目标检测点设计,则选择组合候选引物综合特征值最优的一对组合候选引物输出;若被设计引物为针对整个区域设计,则在等距离的前提下选择该区域附近引物综合量化特征值最佳的候选引物输出。
可选地,步骤2)中候选引物的各项基本特征值包括:3′末端是否有A、3′末端poly结构评估值、引物长度、溶解温度、GC含量、3′末端GC含量与5′首端GC含量之差、GC最大差值、特异性。
可选地,所述3′末端poly结构评估值的计算步骤包括:获取候选引物中所有的poly结构,计算各个poly结构的长度及其到候选引物3′末端之间的距离得到单个poly结构特征信息,并综合所有poly结构特征信息得到3′末端poly结构评估值。
可选地,所述特异性的计算步骤如下:将候选引物与参考基因组进行比对,针对每个候选引物3′末端碱基匹配上的比对位置提取比对区域序列,计算该比对区域序列与候选引物的溶解温度Tm,若溶解温度Tm大于预设阈值,则认为该引物会扩增该区域,最终得到各个候选引物能扩增的区域数和相应各个区域的溶解温度Tm。
可选地,步骤3)和步骤7)中进行量化的详细步骤包括:预先针对待量化特征值确定最优量化值,并根据已有设计知识与经验确定待量化特征值的取值范围以及取值范围中对应最优量化值的最优取值区间,在进行量化时根据式(1)计算待量化特征值对应的量化结果;
式(1)中,s为待量化特征值对应的量化结果,v为待量化特征值,(Min,Max)为待量化特征值的取值范围,(Minb,Maxb)为待量化特征值的取值范围中的最优取值区间,Score为最优量化值;且针对特异性进行量化时,如果候选引物能扩增的区域数为1,则判定该候选引物特异性的量化结果为预设的最优量化值;如果候选引物能扩增的区域数大于或等于2,则根据次大溶解温度采用式(1)进行量化得到该候选引物特异性的量化结果。
可选地,步骤4)中对候选引物序列的候选引物进行筛选简化的详细步骤包括:
4.1)将所有的候选引物按照位置排序,用MinPos表示候选引物序列的最小位置,Maxpos指候选引物的最大位置;
4.2)将变量当前起始位置s和当前结束位置e初始化为候选引物的最小位置MinPos;
4.3)将当前起始位置s往更小的方向扩展指定范围后成为新的当前起始位置s、当前结束位置e往更大的方向扩展指定范围后成为新的当前结束位置e;
4.4)判断当前起始位置s和当前结束位置e构成的区间范围内是否有候选引物,如果有候选引物,则跳转执行下一步;否则,跳转执行步骤4.3);
4.5)在当前起始位置s和当前结束位置e构成的区间范围内选择最优的候选引物加入筛选简化后的结果,然后将选择的最优候选引物的位置及其间隔距离之和作为下一个当前起始位置s和当前结束位置e;
4.6)判断当前起始位置s小于候选引物的最大位置Maxpos是否成立,如果成立则跳转执行步骤4.3);否则,结束并跳转执行步骤5)。
可选地,步骤6)中计算组合间距特征值以及距离特征值的详细步骤包括:计算组合候选引物中两条候选引物之间的距离,获得组合间距特征值;若被设计引物为针对目标检测点设计,则计算组合候选引物中末端的候选引物和目标检测点的距离作为距离特征值;若被设计引物为针对整个区域设计,则判定距离特征值为0。
本发明还提供一种用于基因测序的引物设计系统,包括计算机设备,计算机设备被编程以执行本发明前述用于基因测序的引物设计方法的步骤;或者所述计算机设备的存储介质中存储有被编程以执行本发明前述用于基因测序的引物设计方法的计算机程序。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有被编程以执行本发明前述用于基因测序的引物设计方法的计算机程序。
本发明还提供一种用于基因测序的引物设计系统,包括:
候选引物生成程序单元,用于针对输入的模板序列按不同位置不同长度进行遍历得到候选引物序列;
基本特征计算程序单元,用于计算每一个候选引物的各项基本特征值;
引物综合特征值计算程序单元,用于针对每一个候选引物,分别对各项基本特征值进行量化,并将所有的量化结果进行求和得到该候选引物的引物综合量化特征值;
筛选简化程序单元,用于对候选引物序列中的候选引物进行筛选简化;
候选引物组合程序单元,用于针对筛选简化后的候选引物在符合方向要求的前提下进行两两组合得到组合候选引物,若被设计引物为面对面引物,则挑选方向相反的所有组合候选引物,若被设计引物为同向引物,则挑选方向相同的所有组合候选引物;
组合间距特征值以及距离特征值计算程序单元,用于针对每一对组合候选引物,分别计算组合间距特征值以及距离特征值;
组合候选引物综合特征值计算程序单元,用于针对每一对组合候选引物,分别对组合间距特征值、距离特征值进行量化,并将量化结果与对应两个候选引物的引物综合量化特征值进行综合,从而得到组合候选引物综合特征值;
候选引物输出程序单元,用于判断被设计引物的类型,若被设计引物为针对目标检测点设计,则选择组合候选引物综合特征值最优的一对组合候选引物输出;若被设计引物为针对整个区域设计,则在等距离的前提下选择该区域附近引物综合量化特征值最佳的候选引物输出。
和现有技术相比,本发明具有下述优点:本发明实施步骤包括计算每一个候选引物的各项基本特征值,获取对各项基本特征值量化求和计算引物综合量化特征值;对候选引物进行筛选简化、两两组合得到组合候选引物并计算组合候选引物综合特征值;若被设计引物为针对目标检测点设计,则选择一组组合候选引物综合特征值最优的组合候选引物输出;否则在等距离的前提下选择该区域附近引物综合特征值最佳的候选引物输出,本发明通过一次性搜索所有可能的引物并评估引物的各项特征后进行综合检测,从而一次性就能挑出所有的最优引物,具有挑出来的引物效果最优、操作方便快捷、引物设计效率高的优点。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例中筛选简化候选引物的流程示意图。
具体实施方式
如图1所示,本实施例用于基因测序的引物设计方法的实施步骤包括:
1)针对输入的模板序列按不同位置不同长度进行遍历得到候选引物序列;
2)计算每一个候选引物的各项基本特征值;
3)针对每一个候选引物,分别对各项基本特征值进行量化,并将所有的量化结果进行求和得到该候选引物的引物综合量化特征值;
4)对候选引物序列中的候选引物进行筛选简化;
5)针对筛选简化后的候选引物在符合方向要求的前提下进行两两组合得到组合候选引物,所述在符合方向要求的前提具体是指若被设计引物为面对面引物,则针对两两组合得到组合候选引物挑选方向相反的所有组合候选引物,若被设计引物为同向引物,则针对两两组合得到组合候选引物挑选方向相同的所有组合候选引物;
6)针对每一对组合候选引物,分别计算组合间距特征值以及距离特征值;
7)针对每一对组合候选引物,分别对组合间距特征值、距离特征值进行量化,并将量化结果与对应两个候选引物的引物综合量化特征值进行综合,从而得到组合候选引物综合特征值;
8)判断被设计引物的类型,若被设计引物为针对目标检测点设计,则选择组合候选引物综合特征值最优的一对组合候选引物输出;若被设计引物为针对整个区域设计,则在等距离的前提下选择该区域附近引物综合量化特征值最佳的候选引物输出。
本实施例中,步骤2)中候选引物的各项基本特征值包括:3′末端是否有A、3′末端poly结构(相同的碱基重复三个以上,例如:AAA、GGGGGG等)评估值、引物长度、溶解温度、GC含量、3′末端GC含量与5′首端GC含量之差、GC最大差值、特异性。
本实施例中,3′末端poly结构评估值的计算步骤包括:获取候选引物中所有的poly结构,计算各个poly结构的长度及其到候选引物3′末端之间的距离得到单个poly结构特征信息,并综合所有poly结构特征信息得到3′末端poly结构评估值。因为理论上,poly结构越长越接近3末端引物效果越不好,所以本实施例中综合上述信息得到3′末端poly结构评估值。
本实施例中,特异性的计算步骤如下:将候选引物与参考基因组进行比对,针对每个候选引物3′末端碱基匹配上的比对位置提取比对区域序列,计算该比对区域序列与候选引物的溶解温度Tm,若溶解温度Tm大于预设阈值(本实施例中预设阈值为45),则认为该引物会扩增该区域(扩增效率与溶解温度Tm值有关,溶解温度Tm越高则扩增效率越高),最终得到各个候选引物能扩增的区域数和相应各个区域的溶解温度Tm。
本实施例中,步骤3)和步骤7)中进行量化的详细步骤包括:预先针对待量化特征值确定最优量化值,并根据已有设计知识与经验确定待量化特征值的取值范围以及取值范围中对应最优量化值的最优取值区间,在进行量化时根据式(1)计算待量化特征值对应的量化结果;
式(1)中,s为待量化特征值对应的量化结果,v为待量化特征值,(Min,Max)为待量化特征值的取值范围,(Minb,Maxb)为待量化特征值的取值范围中的最优取值区间,Score为最优量化值;且针对特异性进行量化时,如果候选引物能扩增的区域数为1,则判定该候选引物特异性的量化结果为预设的最优量化值;如果候选引物能扩增的区域数大于或等于2,则根据次大溶解温度采用式(1)进行量化得到该候选引物特异性的量化结果。本实施例中,以(Score,Minb,Maxb,Min,Max)表示各个各项基本特征值的量化参数取值,各个各项基本特征值的某个量化参数取值实例及其说明如下:
3′末端是否有A:该基本特征值以0表示没有A,以1表示有A。该基本特征值的量化参数取值为(8,0,0,0,1),最优量化值为8,最优取值区间(Minb,Maxb)取值为(0,0),取值范围(Min,Max)为(0,1)。根据式(1)可知,如果3′末端没有A,则量化结果为8;如果3′末端有A,则量化结果为0。
3′末端poly结构评估值:该基本特征值的量化参数取值为(15,0,5,0,20),最优量化值为15,最优取值区间(Minb,Maxb)取值为(0,5),取值范围(Min,Max)为(0,20)。根据式(1)可知,若poly结构评估值为0~5,则量化结果为15,若为10,则量化结果为15*(1-(10-5)/(20-5))=10,若为20以上,则量化结果为0。
引物长度:该基本特征值的量化参数取值为(7,25,30,20,35),最优量化值为7,最优取值区间(Minb,Maxb)取值为(25,30),取值范围(Min,Max)为(20,35)。
溶解温度:该基本特征值的量化参数取值为(22,70,75,65,80),最优量化值为22,最优取值区间(Minb,Maxb)取值为(70,75),取值范围(Min,Max)为(65,80)。
GC含量:该基本特征值的量化参数取值为(2,0.5,0.65,0.3,0.8),最优量化值为2,最优取值区间(Minb,Maxb)取值为(0.5,0.65),取值范围(Min,Max)为(0.3,0.8)。
3′末端GC含量与5′首端GC含量之差:该基本特征值的量化参数取值为(6,-0.50,-0.25,-1,0.75),最优量化值为6,最优取值区间(Minb,Maxb)取值为(-0.50,-0.25),取值范围(Min,Max)为(-1,0.75)。
GC最大差值:该基本特征值的量化参数取值为(12,0,0.5,0,0.75),最优量化值为12,最优取值区间(Minb,Maxb)取值为(0,0.5),取值范围(Min,Max)为(0,0.75)。
特异性:该基本特征值的量化参数取值为(28,0,40,0,55),最优量化值为28,最优取值区间(Minb,Maxb)取值为(0,40),取值范围(Min,Max)为(0,55)。如果候选引物能扩增的区域数为1,则判定该候选引物特异性的量化结果为预设的最优量化值28;如果候选引物能扩增的区域数大于或等于2,则根据次大溶解温度采用式(1)进行量化得到该候选引物特异性的量化结果,如果次大溶解温度为0-40,则该候选引物特异性的量化结果为28;若次大溶解温度为55以上,则该候选引物特异性的量化结果为0。
本实施例中,步骤3)中对各项基本特征值以及特异性特征值进行量化时,对各项特异性特征值的详细步骤包括:针对各项特异性特征值进行量化具体是指将所有的特异性特征值量化为一项特异性量化结果,如果能扩增的区域数为1,则判定特异性量化结果为预设的最优量化值,否则针对溶解温度Tm的历史数据确定其取值范围、最优取值区间,如果溶解温度Tm在最优取值区间内则特异性量化结果为预设的最优量化值,否则判定特异性量化结果为0。例如:最优量化值最小值Minb、最优量化值最大值Maxb、最小值Min、最大值Max分别是(0,40,0,55),即0-40时最优量化值,40-55时递减到0分。本实施例中,3′末端是否有A的最优量化值为8分,3′末端是否有poly结构的最优量化值为15分,引物长度的最优量化值为7分,溶解温度的最优量化值为22分,GC含量的最优量化值为2分,3′末端GC含量与5′首端GC含量之差的最优量化值为6分,GC最大差值的最优量化值为12分,特异性量化结果的最优量化值为28分,总分为100分。
一般仅仅一条引物扩增的特异性不好,所以大部分情况需要设计两条引物配合扩增,来保证引物的特异性,两条引物可以是面对面PCR扩增,可以是同向类巢式扩增,可以针对目标位点设计,也可以全区域设计。通过前文步骤1)~步骤3)出来的所有候选引物结果,由于引物数多会导致两两组合数过多,所以为了提高运行速度,需要筛选简化引物数量。如图2所示,步骤4)中对候选引物序列的候选引物进行筛选简化的详细步骤包括:
4.1)将所有的候选引物按照位置排序,用MinPos表示候选引物序列的最小位置,Maxpos指候选引物的最大位置;
4.2)将变量当前起始位置s和当前结束位置e初始化为候选引物的最小位置MinPos;
4.3)将当前起始位置s往更小的方向扩展指定范围后成为新的当前起始位置s、当前结束位置e往更大的方向扩展指定范围后成为新的当前结束位置e;
4.4)判断当前起始位置s和当前结束位置e构成的区间范围内是否有候选引物,如果有候选引物,则跳转执行下一步;否则,跳转执行步骤4.3);
4.5)在当前起始位置s和当前结束位置e构成的区间范围内选择最优的候选引物加入筛选简化后的结果,然后将选择的最优候选引物的位置及其间隔距离之和作为下一个当前起始位置s和当前结束位置e;
4.6)判断当前起始位置s小于候选引物的最大位置Maxpos是否成立,如果成立则跳转执行步骤4.3);否则,结束并跳转执行步骤5)。
本实施例中,步骤6)中计算组合间距特征值以及距离特征值的详细步骤包括:计算组合候选引物中两条候选引物之间的距离,获得组合间距特征值;若被设计引物为针对目标检测点设计,则计算组合候选引物中末端的候选引物和目标检测点的距离作为距离特征值;若被设计引物为针对整个区域设计,则判定距离特征值为0。
本实施例中,步骤7)中将量化结果与对应两个候选引物的引物综合量化特征值进行综合时,具体是指将组合间距特征值的量化结果、距离特征值的量化结果、组合候选引物中两条候选引物两个候选引物的引物综合量化特征值四者进行求和。
本实施例还提供一种用于基因测序的引物设计系统,包括计算机设备,该计算机设备被编程以执行本实施例前述用于基因测序的引物设计方法的步骤。
本实施例还提供一种用于基因测序的引物设计系统,包括带有存储介质的计算机设备,该存储介质中存储有被编程以执行本实施例前述用于基因测序的引物设计方法的计算机程序。
本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程以执行本实施例前述用于基因测序的引物设计方法的计算机程序。
本实施例还提供一种用于基因测序的引物设计系统,包括:
候选引物生成程序单元,用于针对输入的模板序列按不同位置不同长度进行遍历得到候选引物序列;
基本特征计算程序单元,用于计算每一个候选引物的各项基本特征值;
引物综合特征值计算程序单元,用于针对每一个候选引物,分别对各项基本特征值进行量化,并将所有的量化结果进行求和得到该候选引物的引物综合量化特征值;
筛选简化程序单元,用于对候选引物序列中的候选引物进行筛选简化;
候选引物组合程序单元,用于针对筛选简化后的候选引物在符合方向要求的前提下进行两两组合得到组合候选引物,所述在符合方向要求的前提具体是指若被设计引物为面对面引物,则针对两两组合得到组合候选引物挑选方向相反的所有组合候选引物,若被设计引物为同向引物,则针对两两组合得到组合候选引物挑选方向相同的所有组合候选引物;
组合间距特征值以及距离特征值计算程序单元,用于针对每一对组合候选引物,分别计算组合间距特征值以及距离特征值;
组合候选引物综合特征值计算程序单元,用于针对每一对组合候选引物,分别对组合间距特征值、距离特征值进行量化,并将量化结果与对应两个候选引物的引物综合量化特征值进行综合,从而得到组合候选引物综合特征值;
候选引物输出程序单元,用于判断被设计引物的类型,若被设计引物为针对目标检测点设计,则选择组合候选引物综合特征值最优的一对组合候选引物输出;若被设计引物为针对整个区域设计,则在等距离的前提下选择该区域附近引物综合量化特征值最佳的候选引物输出。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种用于基因测序的引物设计方法,其特征在于实施步骤包括:
1)针对输入的模板序列按不同位置不同长度进行遍历得到候选引物序列;
2)计算每一个候选引物的各项基本特征值;
3)针对每一个候选引物,分别对各项基本特征值进行量化,并将所有的量化结果进行求和得到该候选引物的引物综合量化特征值;
4)对候选引物序列中的候选引物进行筛选简化;
5)针对筛选简化后的候选引物在符合方向要求的前提下进行两两组合得到组合候选引物,所述在符合方向要求的前提具体是指若被设计引物为面对面引物,则针对两两组合得到组合候选引物挑选方向相反的所有组合候选引物,若被设计引物为同向引物,则针对两两组合得到组合候选引物挑选方向相同的所有组合候选引物;
6)针对每一对组合候选引物,分别计算组合间距特征值以及距离特征值;
7)针对每一对组合候选引物,分别对组合间距特征值、距离特征值进行量化,并将量化结果与对应两个候选引物的引物综合量化特征值进行综合,从而得到组合候选引物综合特征值;
8)判断被设计引物的类型,若被设计引物为针对目标检测点设计,则选择组合候选引物综合特征值最优的一对组合候选引物输出;若被设计引物为针对整个区域设计,则在等距离的前提下选择该区域附近引物综合量化特征值最佳的候选引物输出。
2.根据权利要求1所述的用于基因测序的引物设计方法,其特征在于,步骤2)中候选引物的各项基本特征值包括:3′末端是否有A、3′末端poly结构评估值、引物长度、溶解温度、GC含量、3′末端GC含量与5′首端GC含量之差、GC最大差值、特异性。
3.根据权利要求2所述的用于基因测序的引物设计方法,其特征在于,所述3′末端poly结构评估值的计算步骤包括:获取候选引物中所有的poly结构,计算各个poly结构的长度及其到候选引物3′末端之间的距离得到单个poly结构特征信息,并综合所有poly结构特征信息得到3′末端poly结构评估值。
4.根据权利要求2所述的用于基因测序的引物设计方法,其特征在于,所述特异性的计算步骤如下:将候选引物与参考基因组进行比对,针对每个候选引物3′末端碱基匹配上的比对位置提取比对区域序列,计算该比对区域序列与候选引物的溶解温度Tm,若溶解温度Tm大于预设阈值,则认为该引物会扩增该区域,最终得到各个候选引物能扩增的区域数和相应各个区域的溶解温度Tm。
5.根据权利要求4所述的用于基因测序的引物设计方法,其特征在于,步骤3)和步骤7)中进行量化的详细步骤包括:预先针对待量化特征值确定最优量化值,并根据已有设计知识与经验确定待量化特征值的取值范围以及取值范围中对应最优量化值的最优取值区间,在进行量化时根据式(1)计算待量化特征值对应的量化结果;
式(1)中,s为待量化特征值对应的量化结果,v为待量化特征值,(Min,Max)为待量化特征值的取值范围,(Minb,Maxb)为待量化特征值的取值范围中的最优取值区间,Score为最优量化值;且针对特异性进行量化时,如果候选引物能扩增的区域数为1,则判定该候选引物特异性的量化结果为预设的最优量化值;如果候选引物能扩增的区域数大于或等于2,则根据次大溶解温度采用式(1)进行量化得到该候选引物特异性的量化结果。
6.根据权利要求1所述的用于基因测序的引物设计方法,其特征在于,步骤4)中对候选引物序列的候选引物进行筛选简化的详细步骤包括:
4.1)将所有的候选引物按照位置排序,用MinPos表示候选引物序列的最小位置,Maxpos指候选引物的最大位置;
4.2)将变量当前起始位置s和当前结束位置e初始化为候选引物的最小位置MinPos;
4.3)将当前起始位置s往更小的方向扩展指定范围后成为新的当前起始位置s、当前结束位置e往更大的方向扩展指定范围后成为新的当前结束位置e;
4.4)判断当前起始位置s和当前结束位置e构成的区间范围内是否有候选引物,如果有候选引物,则跳转执行下一步;否则,跳转执行步骤4.3);
4.5)在当前起始位置s和当前结束位置e构成的区间范围内选择最优的候选引物加入筛选简化后的结果,然后将选择的最优候选引物的位置及其间隔距离之和作为下一个当前起始位置s和当前结束位置e;
4.6)判断当前起始位置s小于候选引物的最大位置Maxpos是否成立,如果成立则跳转执行步骤4.3);否则,结束并跳转执行步骤5)。
7.根据权利要求1所述的用于基因测序的引物设计方法,其特征在于,步骤6)中计算组合间距特征值以及距离特征值的详细步骤包括:计算组合候选引物中两条候选引物之间的距离,获得组合间距特征值;若被设计引物为针对目标检测点设计,则计算组合候选引物中末端的候选引物和目标检测点的距离作为距离特征值;若被设计引物为针对整个区域设计,则判定距离特征值为0。
8.一种用于基因测序的引物设计系统,包括计算机设备,其特征在于:所述计算机设备被编程以执行权利要求1~7中任意一项所述用于基因测序的引物设计方法的步骤;或者所述计算机设备的存储介质中存储有被编程以执行权利要求1~7中任意一项所述用于基因测序的引物设计方法的计算机程序。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有被编程以执行权利要求1~7中任意一项所述用于基因测序的引物设计方法的计算机程序。
10.一种用于基因测序的引物设计系统,其特征在于包括:
候选引物生成程序单元,用于针对输入的模板序列按不同位置不同长度进行遍历得到候选引物序列;
基本特征计算程序单元,用于计算每一个候选引物的各项基本特征值;
引物综合特征值计算程序单元,用于针对每一个候选引物,分别对各项基本特征值进行量化,并将所有的量化结果进行求和得到该候选引物的引物综合量化特征值;
筛选简化程序单元,用于对候选引物序列中的候选引物进行筛选简化;
候选引物组合程序单元,用于针对筛选简化后的候选引物在符合方向要求的前提下进行两两组合得到组合候选引物,所述在符合方向要求的前提具体是指若被设计引物为面对面引物,则针对两两组合得到组合候选引物挑选方向相反的所有组合候选引物,若被设计引物为同向引物,则针对两两组合得到组合候选引物挑选方向相同的所有组合候选引物;
组合间距特征值以及距离特征值计算程序单元,用于针对每一对组合候选引物,分别计算组合间距特征值以及距离特征值;
组合候选引物综合特征值计算程序单元,用于针对每一对组合候选引物,分别对组合间距特征值、距离特征值进行量化,并将量化结果与对应两个候选引物的引物综合量化特征值进行综合,从而得到组合候选引物综合特征值;
候选引物输出程序单元,用于判断被设计引物的类型,若被设计引物为针对目标检测点设计,则选择组合候选引物综合特征值最优的一对组合候选引物输出;若被设计引物为针对整个区域设计,则在等距离的前提下选择该区域附近引物综合量化特征值最佳的候选引物输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811591649.XA CN109658982B (zh) | 2018-12-25 | 2018-12-25 | 一种用于基因测序的引物设计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811591649.XA CN109658982B (zh) | 2018-12-25 | 2018-12-25 | 一种用于基因测序的引物设计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109658982A CN109658982A (zh) | 2019-04-19 |
CN109658982B true CN109658982B (zh) | 2020-06-19 |
Family
ID=66116222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811591649.XA Active CN109658982B (zh) | 2018-12-25 | 2018-12-25 | 一种用于基因测序的引物设计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658982B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110491448B (zh) * | 2019-07-15 | 2023-02-07 | 广州奇辉生物科技有限公司 | 一种处理pcr引物的方法、系统、平台及存储介质 |
CN111681711B (zh) * | 2020-06-28 | 2021-03-16 | 江苏先声医学诊断有限公司 | 一种兼并引物的设计筛选方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1474870A (zh) * | 2000-09-19 | 2004-02-11 | ���л�ѧ��ʽ���� | 合成多核苷酸的方法 |
WO2005010200A2 (en) * | 2003-07-15 | 2005-02-03 | Bioarray Solutions, Ltd. | Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis |
CN106011230A (zh) * | 2016-05-10 | 2016-10-12 | 人和未来生物科技(长沙)有限公司 | 用于检测碎片化dna目标区域的引物组合物及其应用 |
CN107025385A (zh) * | 2016-11-07 | 2017-08-08 | 龚畅 | 一种环状rna引物的设计方法 |
CN108699505A (zh) * | 2015-12-03 | 2018-10-23 | 安可济控股有限公司 | 用于形成连接产物的方法和组合物 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1190092A2 (en) * | 1999-04-06 | 2002-03-27 | Yale University | Fixed address analysis of sequence tags |
CN103114131B (zh) * | 2012-11-30 | 2018-10-02 | 珠海市坤元农业科技有限公司 | 一种引物中部序列干扰pcr技术 |
KR101666506B1 (ko) * | 2015-04-15 | 2016-10-14 | 재단법인대구경북과학기술원 | 대규모 dna 시퀀스 데이터베이스에 대해 특이성 조건을 만족하는 유효한 모든 프라이머들을 디자인하는 방법 |
US10796783B2 (en) * | 2015-08-18 | 2020-10-06 | Psomagen, Inc. | Method and system for multiplex primer design |
CN106480020B (zh) * | 2015-09-02 | 2019-09-24 | 上海产业技术研究院 | 一种核酸扩增反应引物的设计方法及其应用 |
CN108220399B (zh) * | 2016-12-14 | 2023-04-14 | 李保伟 | 一种基于通用探针技术的荧光定量pcr方法 |
CN107937497A (zh) * | 2017-11-29 | 2018-04-20 | 拓普基因科技(广州)有限责任公司 | 一种基于Primer3的多重PCR引物设计方法 |
-
2018
- 2018-12-25 CN CN201811591649.XA patent/CN109658982B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1474870A (zh) * | 2000-09-19 | 2004-02-11 | ���л�ѧ��ʽ���� | 合成多核苷酸的方法 |
WO2005010200A2 (en) * | 2003-07-15 | 2005-02-03 | Bioarray Solutions, Ltd. | Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis |
CN108699505A (zh) * | 2015-12-03 | 2018-10-23 | 安可济控股有限公司 | 用于形成连接产物的方法和组合物 |
CN106011230A (zh) * | 2016-05-10 | 2016-10-12 | 人和未来生物科技(长沙)有限公司 | 用于检测碎片化dna目标区域的引物组合物及其应用 |
CN107025385A (zh) * | 2016-11-07 | 2017-08-08 | 龚畅 | 一种环状rna引物的设计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109658982A (zh) | 2019-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Linhart et al. | The degenerate primer design problem | |
US7809765B2 (en) | Sequence identification and analysis | |
CN109416927B (zh) | 用于核苷酸测序数据的二级分析的系统和方法 | |
CN109658982B (zh) | 一种用于基因测序的引物设计方法及系统 | |
CN101872386B (zh) | 利用双s形levenberg-marquardt和稳健线性回归的温度阶跃校正 | |
US20050272923A1 (en) | Mature microRNA prediction method using bidirectional hidden markov model and medium recording computer program to implement the same | |
US8321140B2 (en) | Quantification of nucleic acid molecules using multiplex PCR | |
JP2015536156A5 (zh) | ||
JP2007095070A (ja) | 可変クラスタ終点を用いるクラスタ分析によるct測定 | |
CN103131770B (zh) | 基于定量pcr的使用重复dna元件作为阴性对照预测用于下一代测序的靶标富集的效率的方法 | |
KR102165931B1 (ko) | 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법 | |
US20130309676A1 (en) | Biased n-mers identification methods, probes and systems for target amplification and detection | |
US8219366B2 (en) | Determination of elbow values for PCR for parabolic shaped curves | |
CN108368547B (zh) | 与靶核酸序列有关的信号提取 | |
US20210292817A1 (en) | Methods for quantitation of analytes in multiplexed biochemical reactions | |
EP1244815A2 (en) | Method of analyzing a nucleic acid | |
US11952622B2 (en) | Analysis of DNA-containing samples and resolution of mixed contributor DNA samples | |
CN110475871B (zh) | 用于确定靶核酸序列的存在的分析信号 | |
CN116130000B (zh) | 引物探针序列组合设计方法和装置 | |
Garbarine et al. | An information theoretic method of microarray probe design for genome classification | |
RU2414510C2 (ru) | Способ амплификации специфичных фрагментов нуклеиновых кислот с помощью рекуррентной цепной реакции | |
CN118588175B (zh) | 基于冻干微球技术的eb病毒优化检测方法 | |
CN115331736B (zh) | 基于文本匹配延伸高通量测序基因的拼接方法 | |
KR102111731B1 (ko) | 핵산 시퀀스를 분석하는 방법 및 장치 | |
JP4034740B2 (ja) | Dna合成用のプライマーの選定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 410000 No. 1101, C2 Building, Yuyuan, Lugu, 27 Wenxuan Road, Changsha High-tech Development Zone, Changsha City, Hunan Province Applicant after: Human and Future Biotechnology (Changsha) Co., Ltd. Address before: 410000 Building 1101, C2 Yuyuan, Lugu, No. 27 Wenxuan Road, Changsha High-tech Development Zone, Kaifu District, Changsha City, Hunan Province Applicant before: Human and Future Biotechnology (Changsha) Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |