CN115035948B - 一种str引物的设计方法和系统 - Google Patents
一种str引物的设计方法和系统 Download PDFInfo
- Publication number
- CN115035948B CN115035948B CN202210855955.XA CN202210855955A CN115035948B CN 115035948 B CN115035948 B CN 115035948B CN 202210855955 A CN202210855955 A CN 202210855955A CN 115035948 B CN115035948 B CN 115035948B
- Authority
- CN
- China
- Prior art keywords
- primer
- primers
- weight
- str
- sites
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013461 design Methods 0.000 title claims description 30
- 230000003321 amplification Effects 0.000 claims description 33
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 33
- 238000012360 testing method Methods 0.000 claims description 21
- 239000000539 dimer Substances 0.000 claims description 11
- 108091093088 Amplicon Proteins 0.000 claims description 10
- 239000012634 fragment Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000012007 large scale cell culture Methods 0.000 claims description 3
- 238000011144 upstream manufacturing Methods 0.000 claims description 3
- 238000003766 bioinformatics method Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 10
- 238000005251 capillar electrophoresis Methods 0.000 description 8
- 108091092878 Microsatellite Proteins 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012938 design process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 241000383675 Trama Species 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000001215 fluorescent labelling Methods 0.000 description 2
- 241000282465 Canis Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000012421 spiking Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Abstract
本申请涉及生物信息学分析技术领域,具体提供一种基于最大点权重团的CE平台多重多通道STR引物的设计方法和系统,通过合理的设计权重和边的连接,把多重多通道的毛细管电泳STR引物设计转换为求解带点权重的最大团(MVWCP)问题,设计的引物检出率高,且非特异极少。
Description
技术领域
本申请涉及生信分析技术领域,具体涉及一种基于最大点权重团的CE平台多重多通道 STR引物的设计方法及系统。
背景技术
短串联重复序列(short tandem repeat),也称做微卫星DNA(micrositelliteDNA),是由2-6个碱基作为核心串联合成的DNA序列,STR具有变异率高,多态性,易检测等特点,因此广泛的应用与法医相关的检测。
从1985年开始,STR就已经被应用到法医领域。检测的方法通常是通过毛细管电泳配合荧光标记来达到较高的通量。不同的STR位点被设计成有不同产物长度或者不同的荧光标记,这样就可以区分不同的STR位点。然而跟美国的情形略有不同的是,中国国内的人口基数大,因此需要设计更多的位点来进行个体区分,另一方面,在实际的案件侦破中,经常出现“异系同型”的问题,即不同的家系中的男性会有相同的Y-STR分型。这两个方面都促使STR的 panel变得越来越大。目前主流的panel都包含有几十个位点。然而,毛细管电泳的通量有限,一方面这是来自于长度的限制,虽然毛细管电泳能够检测到长度为1000bp的片段,但是只有在0-500bp的长度内荧光强度和产物浓度具有线性关系。另一方面,目前成熟的6色荧光技术在扩展到8色荧光的时候,经常出现荧光渗漏的现象,这会导致其它的通道内出现杂峰从而影响对最终分型结果的判断。因此需要在有限的通道和长度内尽可能的设计更多的STR位点。
STR引物设计有一些天然的难题,例如,个别STR位点的两侧会有大的重复区域,TPOX 的右侧就有一个大的重复区域,这导致它的右侧只有很少一段的区域可以设计引物。Y-STR 由于染色体长度短,而且STR密度大,好多STR位点都高度同源,设计起来难度就更大。例如,DYS389II包含了两个重复区域,两个重复区域间隔48bp,其中DYS389I是指第一个重复区域,而DYS389II则包含两个重复区域,也即DYS389I完全的包含在DYS389II内部,如果要在CE平台上区分这两个点,他们的左侧引物必须相同,而右侧引物只能设计在这48个bp里面。而且,STR引物设计要尽可能的避开SNP的位置,因为覆盖SNP的引物会导致无法扩增或者扩增效率降低,从而进一步导致分型错误。而STR附近天然的富集indel和SNP,例如D13S317在两个侧翼就包含了3个高频SNP位点,这也导致了一些试剂盒在实际应用中出现问题。除此之外,STR引物设计还要考虑多重、多通道、二聚体、非特异等因素。
针对以上的问题,本申请提出了一种自动设计毛细管电泳多重多通道引物的算法逻辑。通过合理的设计权重和边的连接,把多重多通道的毛细管电泳STR引物设计转换为求解带点权重的最大团问题。鉴于此,提出本申请。
发明内容
本申请要解决的核心技术问题是寻求一种基于最大点权重团的CE平台多重多通道STR 引物的设计方法和系统。
为解决上述技术问题,本申请建立了多重、多通道引物设计和最大权重团算法之间的联系。因为要考虑不同的位点之间扩增子长度的兼容性,这里的每一个顶点代表了一对引物而不是单个引物;又为了实现多通道的设计,这里把引物对进行了复制,其中的每一个拷贝代表一个通道。通过合理的设计权重和边的连接,把多重多通道的毛细管电泳STR引物设计转换为求解带点权重的最大团问题。
具体的,本申请提出如下技术方案:
本申请首先提供一种基于最大点权重团的CE平台多重、多通道STR引物的设计方法,所述方法包括:
1)获取初始引物集,针对每一个STR位点获得所有可能引物:
2)引物初筛过滤,针对得到初始引物集,对于每个STR位点,根据正反向引物集遍历所有的正反引物对组合,对于每个引物对,根据GC含量、二级结构、二聚体和/或Tm值进行引物对初筛过滤;
3)引物特异性检查,对非特异性引物进行删除或标记;
4)构建引物对间兼容性关系,建立引物对设计和MVWCP之间关系:
a、确定任意引物对之间是否兼容,制备候选引物对;
b、对于每个STR位点的每个候选引物对,将扩增子长度、Tm值、GC含量、引物长度信息分别赋权重;
c、对于每个STR位点的每个候选引物对,复制N份,所述N为CE荧光通道数,每份添加对应荧光颜色信息;汇总所有STR位点包含荧光颜色信息的引物对组成多重、多通道引物对候选集,把每个引物对作为一个顶点Vertex,并按规则连接成边;
基于上述权重以及顶点和边关系,建立引物对设计和MVWCP之间关系;
5)选取最优引物对,针对步骤4)的引物对设计和MVWCP之间关系,基于MVWCP相关算法获取引物最优组合。
进一步的,所述步骤1)中,所述获得为:
根据每个STR位点位置信息,分别在其上下游500bp序列中,以19-33bp为滑动窗口,以1-5个碱基为单位滑动,得到STR位点的正反向引物集合。
进一步的,所述步骤2)中,所述初筛条件包括如下任一或多个:
a、引物GC含量为20%-80%;
b、引物范围内不包含人群中MAF>1%的SNP;
c、引物之间不形成二聚体;
d、单条引物不形成二级结构;
e、引物Tm值范围54-60℃,任意两引物间温度最大差异为2℃;
f、引物对扩增长度小于panel规定的大小。
进一步的,所述步骤3)中,所述特异性检查包括如下任一或多个:
a、位点内部引物的特异性检查:若位点1中某对引物能够非特异扩增,则删除位点1中的此对引物;
b、位点间引物的特异性检查:若位点1中的某引物与位点2中的某引物能够非特异扩增,不删除该2个引物,将其分别标记;
进一步优选的,所述非特异扩增的扩增片段<1000bp。
进一步的,所述步骤4)中,所述兼容包括如下任一或多个:
a、引物之间不能形成二聚体;
b、引物之间Tm差异不超过2℃;
c、引物之间长度差异不超过5bp;
d、引物之间不产生非特异性扩增。
进一步的,所述步骤4)中,所述权重优先级为:扩增子长度权重>引物TM权重>GC含量权重>引物长度权重;
优选的实施例中,所述权重具体计算公式=10000×扩增子长度的权重+80×引物TM的权重+60×GC含量权重+40×引物长度权重+106。
进一步的,所述步骤4)中,所述顶点连边具体规则如下:
a、若两个引物对属于同一个位点,则不连接边;
b、若两个不同位点的引物对不兼容则不连接边;
c、若两个不同位点的兼容引物对不在同一荧光通道,则连边;
d、若两个不同位点的兼容引物对在同一荧光通道但是扩增长度冲突,则不连边,否则连边。
进一步的,所述步骤5)中,所述算法包括但不限于:LSCC算法等。
本申请还提供一种电子设备,包括:处理器和存储器;所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行上述任一项所述的方法。
本申请还提供一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行上述任一项所述的方法。
本申请至少具有如下有益技术效果:
本申请首次提出一种基于带点权重最大团的多重、多通道自动化STR引物设计方法,该方法直接输出引物的排布、温度、长度、GC含量等信息,设计的STR引物片段和排布尽可能小,本申请同时还考虑到TM值、特异性、二聚体、自身二级结构等特性。
附图说明
图1、基于CE平台的STR引物设计的整体流程图;
图2、引物兼容图的构建流程图;
图3、需要求解的带权重最大团的点和边的示意图;
图4、实施例1中设计的STR位点的排布图;
图5、实施例1中8个样本的检测结果;
图6、实施例2中设计的STR位点的排布图;
图7、实施例2中FAM通道D2S441、CSF1PO、D16S539、D18S51、FGA的扩增结果;
图8、实施例2中HEX通道TH01、D12S391、D13S317、D21S11、SE33、D3S1358的扩增结果;
图9、实施例2中TRAMA通道DYS391、D8S1179、D2S1338、VWA、Penta_D的扩增结果;
图10、实施例2中ROX通道TPOX、D6S1043、D5S818、D19S433、D7S820、Penta_E 的扩增结果;
图11、实施例2中设计的引物在血液中的扩增结果,因为是引物合成后直接测试而没有进行细微的调整(浓度、光谱等),部分位点存在荧光渗漏;
图12、实施例2中设计的引物在DNA中的扩增结果,因为是引物合成后直接测试而没有进行细微的调整(浓度、光谱等),部分位点存在荧光渗漏;
图13、实施例2中设计的引物在血卡中的扩增结果,因为是引物合成后直接测试而没有进行细微的调整(浓度、光谱等),部分位点存在荧光渗漏;
图14、实施例3中自动设计的引物排布图;
图15、实施例3中21个STR在不同温度下混扩的结果;
图16、实施例3中21个STR位点的检出结果。
具体实施方式
下面将结合实施例对本申请的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本申请,而不应视为限制本申请的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市场购买获得的常规产品。
部分术语定义
除非在下文中另有定义,本申请具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本申请。
如本申请中所使用,在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
如本申请中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive) 或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
本申请中的术语“大约”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本申请描述的实施方案能以不同于本申请描述或举例说明的其它顺序实施。
本文所述的“最大点权重团问题(The Maximum Vertex Weight Clique Problem,MVWCP)”指的是在一个无向图(Graph)中,其中的点有重量,而边没有重量,求解一个总重量最大的团。其中团的定义为一种子图,并且要求子图中的任意两个顶点必须有边连接。
以上术语或定义仅仅是为了帮助理解本申请而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。
下面结合具体实施例来阐述本申请。
实验例本申请方法构建
为实现自动的多重、多通道STR引物设计,本申请建立多重多通道引物设计和最大权重团算法之间的联系。因为要考虑不同的位点之间扩增子长度的兼容性,这里的每一个顶点代表了一对引物,又为了实现多通道的设计,这里把引物对进行了复制,其中的每一个拷贝代表一个通道。
详细的步骤如下:
1)获取初始引物集。根据每个STR位点的位置信息,分别在其上下游500bp序列上,以19-33bp为滑动窗口,以1-5个碱基(优选1个)为步长滑动,获取该STR位点所有的正反向引物集。
2)初始引物过滤。对于每个STR位点,根据正反向引物集遍历所有的正反引物对组合。对于每个引物对,根据GC含量、是否包含SNP位点、二级结构、二聚体、Tm值进行过滤,满足以下条件的引物对纳入该STR位点的候选引物对:
a、单条引物GC含量在[20%,80%]范围内;
b、引物范围内不能包含人群中MAF>1%的SNP;
c、引物之间不会形成二聚体;
d、单条引物不会形成二级结构;
e、单条引物Tm值在[54℃,60℃]范围内,不同引物之间Tm差异不超过2℃;
f、引物对的扩增长度要小于panel规定的长度。
3)引物的特异性检查
a、位点内部引物的特异性检查:若位点1中的某对引物能够扩增出非特异区域,则需要删除位点1中的此对引物。
b、位点间引物的特异性检查:若位点1中的某引物与位点2中的某引物,能够扩增,只需将其分别标记出来,不需要在引物集中删除这2个引物。
c、单个引物不能扩增,这是因为某些引物可能结合基因组上距离较近的在正负链上有相同序列的区域从而扩增产生产物。
其中引物非特异扩增的标准是扩增片段<1000bp的产物(少数包含同源序列、回文序列的STR位点除外)。
4)构建引物兼容图和权重
不同位点之间的引物对需要兼容。兼容的条件如下:
a、引物之间不能形成二聚体;
b、引物之间Tm差异不超过2℃;
c、引物之间长度差异不超过5bp;
d、引物之间不允许非特异性扩增。
因为每一对引物包含有两个引物,所以要验证两对引物不兼容,需要判断4对。假设位点 1为x,位点1左侧引物为x_l,位点1右侧引物为x_r。同理位点2引物为y_l和y_r。则下面4对引物必须都兼容则为兼容,否则为不兼容。引物(x_l和y_l),(x_l和y_r),(x_r和y_l),(x_r和y_r)都必须兼容。
对于每个STR位点的每个候选引物对,将扩增子长度、Tm值、GC含量、引物长度等信息分别归一化为权重A、B、C、D,根据以下公式对该引物对赋权重:
通常情况下,引物权重优先级为:扩增子长度的权重>引物TM的权重>GC含量的权重>引物长度的权重;
优选的,一个具体的权重可以是加权权重,比如如下:
加权权重=10000×A+80×B+60×C+40×D+106;
假设CE荧光通道数为N,对于每个STR位点的每个候选引物对,复制N份,每份添加上对应的荧光颜色信息。汇总所有STR位点包含荧光颜色信息的引物对组成多重多通道引物对候选集,把每个引物对作为一个顶点Vertex,并且连接边,基于权重、顶点和边关系,建立引物设计和MVWCP之间的关系,即将多重多通道引物设计的问题转化为MVWCP问题,顶点连边具体规则如下。
a、若两个引物对属于同一个位点,则不连接边;
b、若两个不同位点的引物对不兼容则不连接边,兼容性的定义如上;
c、若两个不同位点的兼容引物对不在同一荧光通道,则可以连边;
d、若两个不同位点的兼容引物对在同一荧光通道但是扩增长度冲突,则不连边;否则连接边;
5)构建好CE平台STR引物设计和引物兼容图Graph(V,E,Wv)之间的关系之后,可以使用MVWCP相关算法来计算得到带权重的最大团,本申请实施例中具体使用LSCC计算得到最优引物组合。
实施例1本申请方法验证1
为了测试本申请提出的引物设计流程,本实施例针对法医常用的位点设计了一套引物。选取了26个点,设计的panel如下表。首先使用本申请开发的引物设计流程,输出一套引物,包括STR位点所在的通道、引物、扩增范围、引物的TM值、扩增片段的大小等,作为初步的性能测试。本实施选取了其中的第一个通道的7个STR位点进行测试,随后把这些引物在多个样本中进行扩增测试。
其中引物设计流程的输入包括:1.STR位点的名称;2.重复区域在基因组上的位置;3.重复区域的片段大小范围;4.通道数、最大长度和最小间隔。
表1、位点信息表
1、本申请输出的引物和引物的排布如图4。
表2、流程自动输出的STR的引物、TM温度和扩增片段的大小范围,斜体是要测试的位点
2、测试条件
表3、实施例1的反应体系和扩增程序
毛细管电泳机型为3500,使用Genemapper进行下游结果的分析。
3、测试结果
测试结果如图5所示,虽然部分样本中看到了双尖峰现象,但测试的全部7个位点在8 个样本中均观察到了明显的扩增,检出率为100%。
实施例2本申请方法验证2
进一步针对法医常用的位点体系进行测试。首先使用本申请提出的引物设计软件,输出一套引物,包括STR位点所在的通道、引物、引物的TM值、扩增片段的大小等等。下一步是把这些引物在多个样本中进行单通道的扩增测试。更进一步为了测试整体性能,最后对这个panel的所有引物进行了整体的扩增测试。
表4、位点信息表
1、设计的引物的排布
针对22个法医位点,自动设计的4通道的STR引物,自动设计的引物排布如图6。
2、测试条件
毛细管电泳机型为3500,使用Genemapper进行下游结果的分析。
表5、实施例2的反应体系和扩增程序
3、测试结果
首先对每个通道进行扩增测试,测试的结果如图7-10,检出率为95%。
其次,在TRAMA通道中有两个点,DYS391和Penta_D有扩增问题,其余位点可扩增,但是均衡性略差。进一步本实施例把4个通道合并起来进行混合扩增测试,测试结果如图11- 13,可见通过荧光标记,测试设计的引物在血液、DNA和血卡中的效果,超过90%的引物都能够扩增,即检出率>90%。
实施例3、本申请方法验证3
犬21STR软件设计引物的混合扩增测试。
1、自动设计的引物排布如图14所示。
2、测试条件:
表6、实施例3的反应体系和扩增条件
3、测试结果
测试结果如图15-16所示,21个STR位点中仅有两个位点未出,检出率为>90%。
由此可见,采用本申请的方法能够有效设计CE平台多重多通道STR引物,引物检出率极高,并且非特异极少。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种基于最大点权重团的CE平台多重、多通道STR引物的设计方法,其特征在于,所述方法包括:
1)获取初始引物集,针对每一个STR位点获得所有可能引物:
2)引物初筛过滤,针对得到初始引物集,对于每个STR位点,根据正反向引物集遍历所有的正反引物对组合,对于每个引物对,根据GC含量、二级结构、二聚体和/或Tm值进行引物对初筛过滤;
3)引物特异性检查,对非特异性引物进行删除或标记;
4)构建引物对间兼容性关系,建立引物设计和最大点权重团MVWCP之间的关系:
a、确定任意引物对之间是否兼容,制备候选引物对;
b、对于每个STR位点的每个候选引物对,将扩增子长度、Tm值、GC含量、引物长度信息分别赋权重;
c、对于每个STR位点的每个候选引物对复制N份,所述N为CE荧光通道数;每份添加对应荧光颜色信息;汇总所有STR位点包含荧光颜色信息的引物对,组成多重多通道引物对候选集,把每个引物对作为一个顶点Vertex,并按规则连接成边;基于权重、顶点和边的关系,建立引物设计和MVWCP之间关系;
所述规则如下:
a、若两个引物对属于同一个位点,则不连接边;
b、若两个不同位点的引物对不兼容则不连接边;
c、若两个不同位点的兼容引物对不在同一荧光通道,则连边;
d、若两个不同位点的兼容引物对在同一荧光通道但是扩增长度冲突,则不连边,否则连边;
5)选取最优引物对,基于MVWCP相关算法,获取引物最优组合。
2.根据权利要求1所述的引物设计方法,其特征在于,所述步骤1)中,所述获得为:
根据每个STR位点位置信息,分别在其上下游500bp序列中,以19-33bp为滑动窗口,以1-5个碱基为单位滑动,得到STR位点的正反向引物集合。
3.根据权利要求1所述的引物设计方法,其特征在于,所述步骤2)中,所述初筛过滤的条件包括如下任一或多个:
a、引物GC含量为20%-80%;
b、引物范围内不包含人群中MAF>1%的SNP;
c、引物之间不形成二聚体;
d、单条引物不形成二级结构;
e、引物Tm值范围54-60℃,任意两引物间温度最大差异为2℃。
4.根据权利要求1所述的引物设计方法,其特征在于,所述步骤3)中,所述特异性检查包括如下任一或多个:
a、位点内部引物的特异性检查:若位点1中某对引物能够非特异扩增,则删除位点1中的此对引物;
b、位点间引物的特异性检查:若位点1中的某引物与位点2中的某引物能够非特异扩增,不删除该2个引物,将其分别标记;
所述非特异扩增的扩增片段<1000bp。
5.根据权利要求1所述的引物设计方法,其特征在于,所述步骤4)中,所述兼容包括如下任一或多个:
a、引物之间不能形成二聚体;
b、引物之间Tm差异不超过2℃;
c、引物之间长度差异不超过5bp;
d、引物之间不产生非特异性扩增。
6.根据权利要求1所述的引物设计方法,其特征在于,所述步骤4)中,所述权重的优先级为:扩增子长度权重>引物TM权重>GC含量权重>引物长度权重。
7.根据权利要求6所述的引物设计方法,其特征在于,所述权重的具体计算公式=10000*扩增子长度的权重+80*引物TM的权重+60*GC含量权重+40*引物长度权重+10#。
8.根据权利要求1所述的引物设计方法,其特征在于,所述步骤5)中,所述算法选自LSCC算法。
9.一种电子设备,其特征在于,包括:处理器和存储器;所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求1-8任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210855955.XA CN115035948B (zh) | 2022-07-20 | 2022-07-20 | 一种str引物的设计方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210855955.XA CN115035948B (zh) | 2022-07-20 | 2022-07-20 | 一种str引物的设计方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115035948A CN115035948A (zh) | 2022-09-09 |
CN115035948B true CN115035948B (zh) | 2023-01-24 |
Family
ID=83128213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210855955.XA Active CN115035948B (zh) | 2022-07-20 | 2022-07-20 | 一种str引物的设计方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115035948B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346539A (zh) * | 2013-07-29 | 2015-02-11 | 安捷伦科技有限公司 | 从目标测序面板中寻找变异的方法 |
CN106068330A (zh) * | 2014-01-10 | 2016-11-02 | 七桥基因公司 | 将已知等位基因用于读数映射中的系统和方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU785425B2 (en) * | 2001-03-30 | 2007-05-17 | Genetic Technologies Limited | Methods of genomic analysis |
CN107368705B (zh) * | 2011-04-14 | 2021-07-13 | 完整基因有限公司 | 分析生物体的基因组dna的方法和计算机系统 |
CN104919054A (zh) * | 2012-07-31 | 2015-09-16 | 胡安·卡洛斯·海梅 | 获得并检测待鉴定对象之标志物的方法、相关标志物、认证方法以及验证方法 |
US11473133B2 (en) * | 2018-09-24 | 2022-10-18 | Second Genome, Inc. | Methods for validation of microbiome sequence processing and differential abundance analyses via multiple bespoke spike-in mixtures |
EP3739064A1 (en) * | 2019-05-15 | 2020-11-18 | Biotype GmbH | Comparative analysis of microsatellites by capillary electrophoresis (ce) dna profiles |
CN113035271B (zh) * | 2020-12-22 | 2024-01-23 | 苏州奥根诊断科技有限公司 | 一种检测异源cfDNA的多重PCR引物设计、引物组及检测方法及其用途 |
-
2022
- 2022-07-20 CN CN202210855955.XA patent/CN115035948B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346539A (zh) * | 2013-07-29 | 2015-02-11 | 安捷伦科技有限公司 | 从目标测序面板中寻找变异的方法 |
CN106068330A (zh) * | 2014-01-10 | 2016-11-02 | 七桥基因公司 | 将已知等位基因用于读数映射中的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115035948A (zh) | 2022-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Massively parallel sequencing of forensic STRs and SNPs using the Illumina® ForenSeq™ DNA signature prep kit on the MiSeq FGx™ forensic genomics system | |
Hill et al. | Concordance and population studies along with stutter and peak height ratio analysis for the PowerPlex® ESX 17 and ESI 17 Systems | |
Fordyce et al. | Second-generation sequencing of forensic STRs using the Ion Torrent™ HID STR 10-plex and the Ion PGM™ | |
Bornman et al. | Short-read, high-throughput sequencing technology for STR genotyping | |
US10612096B2 (en) | Methods for determining fraction of fetal nucleic acids in maternal samples | |
Warshauer et al. | STRait Razor: a length-based forensic STR allele-calling tool for use with second generation sequencing data | |
Phillips et al. | Global patterns of STR sequence variation: sequencing the CEPH human genome diversity panel for 58 forensic STRs using the Illumina ForenSeq DNA Signature Prep Kit | |
Hussing et al. | Sequencing of 231 forensic genetic markers using the MiSeq FGx™ forensic genomics system–an evaluation of the assay and software | |
Müller et al. | Systematic evaluation of the early access applied biosystems precision ID Globalfiler mixture ID and Globalfiler NGS STR panels for the ion S5 system | |
CN108517363A (zh) | 一种基于二代测序的个体识别体系、试剂盒及其用途 | |
Li et al. | Developmental validation of the MGIEasy Signature Identification Library Prep Kit, an all-in-one multiplex system for forensic applications | |
Ren et al. | Forensic nanopore sequencing of STRs and SNPs using Verogen’s ForenSeq DNA signature prep kit and MinION | |
Wang et al. | Massively Parallel Sequencing of Forensic STR s Using the Ion Chef™ and the Ion S5™ XL Systems | |
CN110863056A (zh) | 一种人类dna精准分型的方法、试剂和应用 | |
Staadig et al. | An overall limited effect on the weight-of-evidence when taking STR DNA sequence polymorphism into account in kinship analysis | |
Mauger et al. | Comparison of commercially available whole-genome sequencing kits for variant detection in circulating cell-free DNA | |
Silva et al. | Sequence-based autosomal STR characterization in four US populations using PowerSeq™ Auto/Y system | |
CN115035948B (zh) | 一种str引物的设计方法和系统 | |
Hölzl-Müller et al. | Exploring STR sequencing for forensic DNA intelligence databasing using the Austrian National DNA Database as an example | |
Lu et al. | Improved tagmentation-based whole-genome bisulfite sequencing for input DNA from less than 100 mammalian cells | |
Lv et al. | Noninvasive prenatal testing of methylmalonic acidemia cblC type using the cSMART assay for MMACHC Gene Mutations | |
CN109055547B (zh) | 一组评估主动脉夹层风险的生物标志物及其应用 | |
Carson et al. | Strategies for the detection of copy number and other structural variants in the human genome | |
CN116926180A (zh) | 基因标志物组合在制备用于Noonan综合征谱系障碍诊断产品中的应用 | |
CN113981070B (zh) | 胚胎染色体微缺失的检测方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Design Method and System for STR Primers Granted publication date: 20230124 Pledgee: Zhongguancun Branch of Bank of Beijing Co.,Ltd. Pledgor: Beijing Yuewei Gene Technology Co.,Ltd. Registration number: Y2024110000029 |