CN118136119A - 一种用于Sanger测序的毛细管电泳迁移率校正方法 - Google Patents
一种用于Sanger测序的毛细管电泳迁移率校正方法 Download PDFInfo
- Publication number
- CN118136119A CN118136119A CN202410532827.0A CN202410532827A CN118136119A CN 118136119 A CN118136119 A CN 118136119A CN 202410532827 A CN202410532827 A CN 202410532827A CN 118136119 A CN118136119 A CN 118136119A
- Authority
- CN
- China
- Prior art keywords
- base
- waveform data
- mobility correction
- peak
- sanger sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000007480 sanger sequencing Methods 0.000 title claims abstract description 23
- 238000005251 capillar electrophoresis Methods 0.000 title claims abstract description 21
- 239000012634 fragment Substances 0.000 claims abstract description 31
- 238000001514 detection method Methods 0.000 claims abstract description 28
- 238000005457 optimization Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 239000007850 fluorescent dye Substances 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000002203 pretreatment Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000000840 electrochemical analysis Methods 0.000 abstract description 2
- 238000012163 sequencing technique Methods 0.000 description 25
- 108020004414 DNA Proteins 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 238000001962 electrophoresis Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000155 isotopic effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于Sanger测序的毛细管电泳迁移率校正方法,涉及电化学分析技术领域,包括步骤:以使碱基峰呈等间距分布为目标,进行目标优化函数的获取;基于碱基峰信号特性对原始波形数据进行前处理,提取出满足预设阈值条件的碱基峰波形数据;根据碱基片段长度对提取波形数据的影响特性进行迁移率修正起始位置的选取;以任一检测通道为参照通道,其它检测通道为漂移量修正通道,进行目标优化函数的优化;根据选取的迁移率起始位置以及优化后的目标优化函数,进行当前波形数据位置对应目标窗口时长下的修正值获取。本发明显著提高了Sanger测序分析的精度和效率,实现了碱基峰的精确识别和等间距分布,有利于自动化仪器的分析需求。
Description
技术领域
本发明涉及电化学分析技术领域,具体涉及一种用于Sanger测序的毛细管电泳迁移率校正方法。
背景技术
毛细管电泳(Capillary Electrophoresis,CE)结合Sanger测序技术以其高精确度、长读取能力及在众多科研应用中的灵活适应性而著称。其中Sanger测序基于链终止法,通过DNA聚合酶对结合于待测序列模板上的引物进行延伸。实验体系中包含A、T、C、G四种碱基的脱氧核苷酸三磷酸(dNTPs)以及与其对应的四种双脱氧核苷三磷酸(ddNTPs)。ddNTPs因缺少3'-OH基团,无法继续参与DNA链的延伸反应,从而在特定位置上导致链的终止。在随机掺入ddNTP的过程中,会产生一系列起始点相同但终止点各异的链终止产物,这些产物的长度与模板DNA序列中的每一个核苷酸位置相对应。
随后,通过高分辨率的变性凝胶电泳分离这些大小不一的片段,再借助X-光胶片放射自显影或非同位素标记进行检测。电泳过程中,片段按照大小有序排列,形成特征性的“电泳图谱”,通过对图谱中各峰位置的解析,即可推断出待测DNA序列。而随着四色荧光标记技术的应用,DNA测序逐渐实现了低成本化与自动化。在这种方法中,DNA片段被标记上不同颜色的荧光染料,使得在一次电泳运行中能够同时分析多条DNA序列。测序仪配备的检测系统能够实时捕捉并区分四种颜色的荧光信号,对应识别四种碱基的插入。
然而,荧光染料的存在对DNA片段在毛细管凝胶中的电泳迁移速率产生了显著影响。即使相同的DNA片段,由于标记了不同的荧光染料,其迁移速度也会有所差异,且片段越短,这种影响越大。由此导致的结果是:不同长度DNA片段的实际迁移率与其理论值之间存在漂移,即所谓的“迁移率偏差”。这种偏差可能导致起始碱基峰的排序混乱,部分碱基峰的先后顺序与实际序列不符;而对于长片段,尽管染料影响相对较小,但由于其本身迁移速度慢,峰型展宽大,不同片段间的迁移速度差异减小,可能导致尾部碱基峰严重重叠,影响序列解析准确性。
早期应对迁移率偏差的校正方法较为繁琐,需手动选定一种颜色染料信号作为参照,然后逐个调整其他颜色染料信号的位置,且移动距离受限于一个峰宽。这种方法不仅耗时,且无法满足现代仪器自动化分析的需求。
发明内容
为解决上述问题,部分厂家开始采用预定标校正法。该方法通过使用标准物预先计算出不同片段长度位置的漂移修正量,从而在数据分析阶段自动进行校正。这种方法虽提高了自动化程度,但对仪器的重复性和测序条件的一致性要求极高,通用性相对较差,可能无法充分适应多样化的实验环境与样本类型。为此,本发明提出了一种用于Sanger测序的毛细管电泳迁移率校正方法,包括步骤:
S1:以使碱基峰呈等间距分布为目标,进行目标优化函数的获取;
S2:基于碱基峰信号特性对原始波形数据进行前处理,提取出满足预设阈值条件的碱基峰波形数据;
S3:根据碱基片段长度对提取波形数据的影响特性进行迁移率修正起始位置的选取;
S4:以任一检测通道为参照通道,其它检测通道为漂移量修正通道,进行目标优化函数的优化;
S5:根据选取的迁移率起始位置以及优化后的目标优化函数,进行当前波形数据位置对应目标窗口时长下的修正值获取;
S6:根据修正值对提取后的碱基峰波形数据进行校正。
进一步地,所述S1步骤中,目标优化函数表示为如下公式:
式中,为标准差函数,G、A、T、C为四种碱基,/>为第i个碱基对应的检测通道,i为取值范围1至n的常数,/>为/>检测通道中的第i个碱基峰位,/>为/>检测通道中第i个碱基峰位的迁移率修正值。
进一步地,所述S2步骤中,前处理包括基线扣除、有效信号提取和峰型锐化。
进一步地,所述基线扣除采用窗口滑动最小值提取方法,进行窗口内含基线信号前提下,窗口最小值序列滤波处理的异常干扰基线信号滤除。
进一步地,所述有效信号提取通过信号积分值判定,将各个通道的信号叠加,计算叠加信号的积分值,进行预设阈值筛选下的有效信号区间提取。
进一步地,所述峰型锐化具体为,对原始波形数据进行低通滤波以及二阶导处理,将二阶导结果曲线取负处理后,负值部分全部赋0。
进一步地,所述S3步骤中,碱基片段长度对波形数据的影响特性具体为:原始波形数据前端相比后端碱基片段长度短,迁移率受荧光染料影响,原始波形数据后端相比前端碱基片段峰展宽大,信噪比低,峰值受基线信号干扰。
进一步地,所述S4步骤中,目标优化函数的优化表示为如下公式:
式中,至/>之间的2m+1个碱基峰位为目标窗口时长对应的窗口大小,当以碱基类型G的检测通道为参照通道,目标优化函数转换为如下公式:
式中,为当前窗口碱基类型A的检测通道中所有碱基峰位的迁移率修正值,为当前窗口碱基类型T的检测通道中所有碱基峰位的迁移率修正值,/>为当前窗口碱基类型C的检测通道中所有碱基峰位的迁移率修正值,/>表示为对应碱基类型下中/>的系数,/>指代/>。
进一步地,所述S5步骤中,以碱基类型G的检测通道为参照通道,修正值获取通过对如下公式进行线性方程组求解获得:
式中,为矩阵逆运算,T为矩阵转置运算,/>为由/>系数组成矩阵,Y为由/>组成的矩阵。
与现有技术相比,本发明至少含有以下有益效果:
(1)本发明所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,利用目标函数的等价转化,设计了一种专门针对测序信号迁移率修正值的优化求解算法。该算法能够快速找到一组最优的漂移修正值,确保了校正过程的高效性。通过精确计算,降低了假碱基峰位和漏碱基峰位对最终序列分析的影响,提高了数据处理的可靠性;
(2)采用短窗口滑动策略,连续计算不同局部区域的迁移率修正值,能够有效应对不同长度DNA片段迁移率漂移的差异性。这种方法灵活适应了不同片段在电泳过程中因长度、电荷效应等因素导致的迁移速率变化,确保了迁移率校正的精准性和针对性;
(3)通过对原始测序波形实施二阶导处理,增强了峰型的锐度,显著提高了相邻碱基峰的分离度。这有助于更精确地识别并区分不同类型的碱基峰,尤其是对于那些因峰型展宽而高度重叠的峰,从而提升了碱基识别的准确性,尤其是在测序尾部;
(4)引入中间段修正值变化趋势的线性拟合延伸方法,以补偿首尾端的修正值失真。这种补偿机制确保了整个序列的迁移率校正均匀一致,尤其在序列两端改善了信号的失真状况,增强了长序列测序结果的准确性。
附图说明
图1为一种用于Sanger测序的毛细管电泳迁移率校正方法的步骤图;
图2为测序获得的原始波形数据的波形图;
图3为峰型锐化处理示意图;
图4为迁移率漂移修正示意图;
图5为漂移修正值线性拟合预测示意图;
图6为迁移率修正前后测序波形示意图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
实施例一
毛细管电泳Sanger测序技术在DNA分析中展现出了卓越性能,但荧光染料引发的迁移率偏差问题对其准确性构成挑战。尽管已发展出一些校正策略,但仍需持续探索更为高效、普适的校正方法以优化测序结果,提升整体测序系统的自动化水平与可靠性。为此,如图1所示,本发明提出了用于Sanger测序的毛细管电泳迁移率校正方法,包括步骤:
S1:以使碱基峰呈等间距分布为目标,进行目标优化函数的获取;
S2:基于碱基峰信号特性对原始波形数据进行前处理,提取出满足预设阈值条件的碱基峰波形数据;
S3:根据碱基片段长度对提取波形数据的影响特性进行迁移率修正起始位置的选取;
S4:以任一检测通道为参照通道,其它检测通道为漂移量修正通道,进行目标优化函数的优化;
S5:根据选取的迁移率起始位置以及优化后的目标优化函数,进行当前波形数据位置对应目标窗口时长下的修正值获取;
S6:根据修正值对提取后的碱基峰波形数据进行校正。
自动迁移率修正的目标是使相邻的碱基峰呈等间距分布,基于这个思路,我们可以先构建目标优化函数,该函数存在四个通道的修正偏移量()使
(1)
式中,为标准差函数,/>为第i个碱基对应的检测通道,i为取值范围1至n的常数,/>为/>检测通道中的第i个碱基峰位,/>为/>检测通道中第i个碱基峰位的迁移率修正值。
见图2,正如前文所述,测序获得的原始波形数据由于荧光染料以及DNA片段自身长度的影响,导致电泳迁移率与不同长度DNA片段的漂移量各不相同,造成测序信号起始碱基峰的排序是错乱的,部分碱基峰的先后顺序与碱基序列可能不一致。虽然荧光染料对长片段迁移率的漂移量影响较小,但是长片段的迁移速度慢,造成峰型展宽变大,并且不同长片段之间的迁移速度的差异性变小,造成测序信号尾部的碱基峰发生严重重叠。因此,在对公式(1)进行迭代优化前,需要对测序获得的原始波形数据进行前处理。
首先,由于原始波形数据不同通道间信号基线存在差异,因此需要通过基线扣除确保通道间空白信号值一致。在这里,基线扣除采用的是窗口滑动最小值提取方法,其窗口宽度一般保证多数情况下窗口内必然有基线信号点。因此,取连续10个半峰宽的长度,窗口滑动步长为1个半峰宽。每滑动一个窗口输出窗口最小值,连续滑动最终可以得到一组窗口最小值序列,对序列进行中值滤波和低通滤波,去除异常干扰的基线信号。
而信号干扰的存在,还需进行有效信号的提取。在这里我们将四个通道的信号叠加,计算叠加信号的积分值,积分时长约为2个碱基峰宽度。从信号的首尾开始积分,积分值超过阈值时,则认为进入有效信号区域,并以此作为截取点依据,截取有效信号区间。
同时,由于原始波形数据在峰型分离度降低时,连续相同类型的碱基峰重叠度非常高,特别是在测序尾部峰型展宽变宽导致重叠度更高,不利于后续碱基峰搜索。为确保多数碱基峰能被识别,峰型锐化分离必不可少。所以本发明采用对原始波形进行低通滤波结合二阶导处理,将二阶导结果曲线取负处理后,负值部分全部赋0,处理前(原始波形)后(锐化波形)效果如图3所示。此处,通过对原始测序波形实施二阶导处理,增强了峰型的锐度,显著提高了相邻碱基峰的分离度。这有助于更精确地识别并区分不同类型的碱基峰,尤其是对于那些因峰型展宽而高度重叠的峰,从而提升了碱基识别的准确性,尤其是在测序尾部。
而在锐化处理后的波形中存在较多峰高较小的干扰峰,因此,碱基峰搜索过程中,识别为碱基峰位的条件为:a)一阶导数过零;b)过零点对应的锐化峰型值超过阈值;c)过零点对应的原始峰型值超过阈值;满足上述三个条件,则识别为碱基峰,并输出峰位。
通过前处理已获取了较为准确的四种碱基峰位的序列,但无法避免序列中存在假碱基峰位和漏碱基峰位。因此,通过公式(1)优化得到的修正量可能错误的,这个需要通过后续拟合进一步消除。
在原始波形数据中,前端测序信号的碱基片段长度短,荧光染料对迁移率的影响较大,造成碱基峰前后顺序较大概率发生错乱;后端测序信号的峰展宽变大,且信噪比降低,基线干扰峰影响增加;导致测序信号首尾的信号失真较为严重。
因此,迁移率修正最佳起始位置一般为DNA片段(测序峰个数大致为800个左右)的1/4至1/2范围内,通常取值250,在迁移率修正时,近似认为在短时间内,迁移率的漂移量基本保持不变。在迁移率修正优化时,设2m+1个碱基峰作为窗口时长,并以为中间碱基峰位,那么碱基峰位分布分别为/>,而为了满足短时长需求,采取短窗口滑动策略,连续计算不同局部区域的迁移率修正值,能够有效应对不同长度DNA片段迁移率漂移的差异性。这种方法灵活适应了不同片段在电泳过程中因长度、电荷效应等因素导致的迁移速率变化,确保了迁移率校正的精准性和针对性。因此,公式(1)可变为:
(2)
在窗口时长内,迁移率修正值只与通道类型有关,与碱基峰索引无关,此外修正量是相对的,可以将其中一个检测通道的信号作为参照,修正其他三个通道的漂移量。进一步将公式(2)等价转化为:
(3)
式中,表示迁移率校正后相邻碱基峰的间距。将公式(3)进行转换,可得
(4)
由于,所以/>,因此公式(4)中未知量只有四个,当以其中一个检测通道作为参照通道,修正其它三个检测通道的信号漂移量时,那么只有三个未知量,以G通道为参照通道为例,公式(4)可进一步简化为:
(5)
式中,为当前窗口碱基类型A的检测通道中所有碱基峰位的迁移率修正值,为当前窗口碱基类型T的检测通道中所有碱基峰位的迁移率修正值,/>为当前窗口碱基类型C的检测通道中所有碱基峰位的迁移率修正值,/>表示为对应碱基类型下中/>的系数,也即是/>为中碱基A通道的修正量,其它依次类推,/>指代。
最后,通过线性方程组求解公式(6),即可计算得到当前窗口对应的最优修正值。
(6)
式中,为矩阵逆运算,T为矩阵转置运算,/>为由/>系数组成矩阵,Y为由/>组成的矩阵。
基于此,通过实时监测当前碱基峰的分布特征,系统能够自适应地提取测序信号的迁移率漂移修正量,使其适应不同实验条件下的测序信号。这一特性增强了方法的通用性和鲁棒性,确保了在各种工况下都能获得高质量的测序结果。
实施例二
在上述实施例的基础上,本实施例以一组具体数据为例,来对本发明的技术效果进行说明。设置窗口起始位置为第250个碱基峰,滑动步长为一个碱基峰位,窗口向两边滑动,窗口每滑动一次输出一组三个通道的修正值。由此可以得到三个通道的修正值序列,如图4所示。
修正值序列在首尾出现明显的异常突变,但是在中间序列段,修正值呈现相对平稳变化,为获取首尾端正确的漂移修正值,进一步,采用中间准确的修正值以及变化趋势进行拟合延伸,以拟合延伸值作为首尾漂移修正值。
根据中间端修正值的变化趋势,采用线性拟合延伸预测首尾端的修正值,拟合数据一般取第150碱基峰作为拟合数据起始点,拟合数据结束点取决于碱基峰的总个数,一般取总数-200作为结束点,线性拟合效果如图5所示。
最终以拟合曲线值作为迁移率漂移修正值,逐一校正三个通道的碱基峰波形,校正前后波形如图6所示。
以G通道为参照,即=0,窗口内9个碱基峰位(碱基类型)如下:
{ 3084(C), 3094(G), 3112(G), 3136(A), 3153(A), 3172(T), 3183(C), 3205(T), 3216(C) }
带入公式(4)中,并转换为如下公式:
通过求解该公式,获得最优解:
综上所述,本发明所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,显著提高了Sanger测序分析的精度和效率,通过有效的峰型锐化、适应性局部修正、优化求解算法、首尾端失真补偿以及自适应漂移修正,解决了传统校正方法中手动调整繁琐、通用性差、对仪器重复性要求高、难以应对复杂信号环境等问题,实现了碱基峰的精确识别和等间距分布,有利于自动化仪器的分析需求,对提升基因测序领域的研究水平和应用效果具有重要意义。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
Claims (9)
1.一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,包括步骤:
S1:以使碱基峰呈等间距分布为目标,进行目标优化函数的获取;
S2:基于碱基峰信号特性对原始波形数据进行前处理,提取出满足预设阈值条件的碱基峰波形数据;
S3:根据碱基片段长度对提取波形数据的影响特性进行迁移率修正起始位置的选取;
S4:以任一检测通道为参照通道,其它检测通道为漂移量修正通道,进行目标优化函数的优化;
S5:根据选取的迁移率起始位置以及优化后的目标优化函数,进行当前波形数据位置对应目标窗口时长下的修正值获取;
S6:根据修正值对提取后的碱基峰波形数据进行校正。
2.如权利要求1所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述S1步骤中,目标优化函数表示为如下公式:
式中,为标准差函数,G、A、T、C为四种碱基,/>为第i个碱基对应的检测通道,i为取值范围1至n的常数,/>为/>检测通道中的第i个碱基峰位,/>为/>检测通道中第i个碱基峰位的迁移率修正值。
3.如权利要求1所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述S2步骤中,前处理包括基线扣除、有效信号提取和峰型锐化。
4.如权利要求3所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述基线扣除采用窗口滑动最小值提取方法,进行窗口内含基线信号前提下,窗口最小值序列滤波处理的异常干扰基线信号滤除。
5.如权利要求3所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述有效信号提取通过信号积分值判定,将各个通道的信号叠加,计算叠加信号的积分值,进行预设阈值筛选下的有效信号区间提取。
6.如权利要求3所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述峰型锐化具体为,对原始波形数据进行低通滤波以及二阶导处理,将二阶导结果曲线取负处理后,负值部分全部赋0。
7.如权利要求1所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述S3步骤中,碱基片段长度对波形数据的影响特性具体为:原始波形数据前端相比后端碱基片段长度短,迁移率受荧光染料影响,原始波形数据后端相比前端碱基片段峰展宽大,信噪比低,峰值受基线信号干扰。
8.如权利要求2所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述S4步骤中,目标优化函数的优化表示为如下公式:
式中,至/>之间的2m+1个碱基峰位为目标窗口时长对应的窗口大小,当以碱基类型G的检测通道为参照通道,目标优化函数转换为如下公式:
式中,为当前窗口碱基类型A的检测通道中所有碱基峰位的迁移率修正值,/>为当前窗口碱基类型T的检测通道中所有碱基峰位的迁移率修正值,/>为当前窗口碱基类型C的检测通道中所有碱基峰位的迁移率修正值,/>表示为对应碱基类型下中/>的系数,/>指代/>。
9.如权利要求8所述的一种用于Sanger测序的毛细管电泳迁移率校正方法,其特征在于,所述S5步骤中,以碱基类型G的检测通道为参照通道,修正值获取通过对如下公式进行线性方程组求解获得:
式中,为矩阵逆运算,T为矩阵转置运算,/>为由/>系数组成矩阵,Y为由/>组成的矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410532827.0A CN118136119A (zh) | 2024-04-30 | 2024-04-30 | 一种用于Sanger测序的毛细管电泳迁移率校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410532827.0A CN118136119A (zh) | 2024-04-30 | 2024-04-30 | 一种用于Sanger测序的毛细管电泳迁移率校正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118136119A true CN118136119A (zh) | 2024-06-04 |
Family
ID=91243234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410532827.0A Pending CN118136119A (zh) | 2024-04-30 | 2024-04-30 | 一种用于Sanger测序的毛细管电泳迁移率校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118136119A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1358868A (zh) * | 2000-11-29 | 2002-07-17 | 株式会社岛津制作所 | 核酸序列测定方法 |
CN103593659A (zh) * | 2013-11-26 | 2014-02-19 | 华南农业大学 | 一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法 |
WO2015015585A1 (ja) * | 2013-07-31 | 2015-02-05 | 株式会社日立製作所 | 遺伝子変異分析装置、遺伝子変異分析システム及び遺伝子変異分析方法 |
WO2015056329A1 (ja) * | 2013-10-17 | 2015-04-23 | 株式会社島津製作所 | 波形中のピーク端点検出方法および検出装置 |
CN108431236A (zh) * | 2015-11-03 | 2018-08-21 | 奥斯瑞根公司 | 用于重复序列的核酸大小检测的方法 |
CN108504774A (zh) * | 2018-02-26 | 2018-09-07 | 宁波海尔施基因科技有限公司 | 一种检测鼻病毒分型和肠道病毒的方法 |
CN112669903A (zh) * | 2020-12-29 | 2021-04-16 | 北京旌准医疗科技有限公司 | 基于Sanger测序的HLA分型方法及设备 |
WO2021210228A1 (ja) * | 2020-04-17 | 2021-10-21 | 株式会社島津製作所 | 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置 |
CN114391098A (zh) * | 2019-09-17 | 2022-04-22 | 株式会社日立高新技术 | 生物体试料分析装置、生物体试料分析方法 |
WO2023188982A1 (ja) * | 2022-03-29 | 2023-10-05 | 東レ株式会社 | 心電信号解析システム |
CN117705912A (zh) * | 2023-11-30 | 2024-03-15 | 中国农业科学院作物科学研究所 | 一种判断ssr毛细管电泳内标位置的方法 |
CN117743783A (zh) * | 2023-11-30 | 2024-03-22 | 公安部第一研究所 | 一种电泳迁移率偏移校正的方法及系统 |
-
2024
- 2024-04-30 CN CN202410532827.0A patent/CN118136119A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1358868A (zh) * | 2000-11-29 | 2002-07-17 | 株式会社岛津制作所 | 核酸序列测定方法 |
WO2015015585A1 (ja) * | 2013-07-31 | 2015-02-05 | 株式会社日立製作所 | 遺伝子変異分析装置、遺伝子変異分析システム及び遺伝子変異分析方法 |
WO2015056329A1 (ja) * | 2013-10-17 | 2015-04-23 | 株式会社島津製作所 | 波形中のピーク端点検出方法および検出装置 |
CN103593659A (zh) * | 2013-11-26 | 2014-02-19 | 华南农业大学 | 一种针对二倍体PCR产物的Sanger测序中个体内SNP的识别方法 |
CN108431236A (zh) * | 2015-11-03 | 2018-08-21 | 奥斯瑞根公司 | 用于重复序列的核酸大小检测的方法 |
CN108504774A (zh) * | 2018-02-26 | 2018-09-07 | 宁波海尔施基因科技有限公司 | 一种检测鼻病毒分型和肠道病毒的方法 |
CN114391098A (zh) * | 2019-09-17 | 2022-04-22 | 株式会社日立高新技术 | 生物体试料分析装置、生物体试料分析方法 |
WO2021210228A1 (ja) * | 2020-04-17 | 2021-10-21 | 株式会社島津製作所 | 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置 |
CN112669903A (zh) * | 2020-12-29 | 2021-04-16 | 北京旌准医疗科技有限公司 | 基于Sanger测序的HLA分型方法及设备 |
WO2023188982A1 (ja) * | 2022-03-29 | 2023-10-05 | 東レ株式会社 | 心電信号解析システム |
CN117705912A (zh) * | 2023-11-30 | 2024-03-15 | 中国农业科学院作物科学研究所 | 一种判断ssr毛细管电泳内标位置的方法 |
CN117743783A (zh) * | 2023-11-30 | 2024-03-22 | 公安部第一研究所 | 一种电泳迁移率偏移校正的方法及系统 |
Non-Patent Citations (3)
Title |
---|
贾二惠;李晓;张涛;李彬;赵丽华;常海龙;金川;: "基于动态规划的DNA碱基识别峰匹配方法的设计与实现", 分析仪器, no. 02, 28 March 2020 (2020-03-28), pages 76 - 82 * |
郑华;石岩;汪洁;王立强;陆祖康;: "DNA测序电泳荧光信号的小波去噪分析", 光学仪器, no. 02, 15 April 2007 (2007-04-15), pages 21 - 25 * |
马洪明, 路新枝, 王勇: "四色荧光标记DNA自动测序中一例典型错读码的校正", 海洋科学, no. 03, 29 March 2002 (2002-03-29), pages 11 - 14 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7228237B2 (en) | Automatic threshold setting and baseline determination for real-time PCR | |
Karabiber et al. | QuShape: rapid, accurate, and best-practices quantification of nucleic acid probing information, resolved by capillary electrophoresis | |
US20070073490A1 (en) | Ct determination by cluster analysis with variable cluster endpoint | |
ATE142272T1 (de) | Nukleinsäure-amplifikation unter verwendung eines einzelprimers | |
EP0897568A1 (en) | Multicomponent analysis method including the determination of a statistical confidence interval | |
CN106868140B (zh) | 多重荧光定量pcr的方法 | |
CN113913539B (zh) | 一种与鸡皮肤黄度性状相关的分子标记及其应用 | |
EP0463591A1 (en) | Method for determining DNA sequences | |
JP2002525576A (ja) | 蛍光ポリヌクレオチド分離装置のスペクトル較正 | |
CN107730521B (zh) | 一种图像中屋脊型边缘的快速检测方法 | |
CN102618646A (zh) | 一种基因拷贝数的定量检测方法 | |
CN118136119A (zh) | 一种用于Sanger测序的毛细管电泳迁移率校正方法 | |
Soong et al. | [36] Detection and quantification of mitochondrial DNA deletions | |
CN116189763A (zh) | 一种基于二代测序的单样本拷贝数变异检测方法 | |
US20080306694A1 (en) | Methods for Detecting Peaks in a Nucleic Acid Data Trace | |
CN109161584B (zh) | 一种荧光扩增曲线阴阳性判定方法及装置 | |
US5795455A (en) | Method for determining the nucleotide size of DNA fragments | |
CN117705912A (zh) | 一种判断ssr毛细管电泳内标位置的方法 | |
DE69109868T2 (de) | Verfahren zur bestimmung von dns-sequenzen. | |
JP2004527728A (ja) | ベースコーリング装置及びプロトコル | |
CN112331266A (zh) | 消除pcr荧光基线期波动的方法 | |
CN108949923B (zh) | 一种扩增msf1基因的方法及试剂盒与应用 | |
JP4873011B2 (ja) | 核酸の塩基配列決定方法 | |
CN110016498B (zh) | Sanger法测序中确定单核苷酸多态性的方法 | |
EP1997050B1 (en) | Methods for resolving convoluted peaks in a chromatogram |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |