CN107180163A - 一种基于芯片数字pcr的反应通孔数优化分析算法 - Google Patents
一种基于芯片数字pcr的反应通孔数优化分析算法 Download PDFInfo
- Publication number
- CN107180163A CN107180163A CN201710339481.2A CN201710339481A CN107180163A CN 107180163 A CN107180163 A CN 107180163A CN 201710339481 A CN201710339481 A CN 201710339481A CN 107180163 A CN107180163 A CN 107180163A
- Authority
- CN
- China
- Prior art keywords
- hole
- chip
- reaction
- particle
- random number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于芯片数字PCR的反应通孔数优化分析算法,其利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数,通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。该反应通孔数优化分析算法通过C程序的模拟计算可以得到数字PCR芯片反应通孔的最佳个数,使其在芯片数字PCR的设计过程中,通过分析计算得到芯片反应通孔的个数优化值,从而得到芯片反应通孔的最佳个数,进而在保证灵敏度的前提下,降低了实验成本,避免了反应通孔数量的非限性增长引发的设计难题与成本问题。
Description
技术领域
本发明涉及生物反应中的数值模拟计算技术领域,尤其是涉及一种基于芯片数字PCR的反应通孔数优化分析算法。
背景技术
PCR是指聚合酶链式反应,其是一种用于放大扩增特定的DNA片段的分子生物学技术,它可看作是生物体外的特殊DNA复制,PCR的最大特点是能将微量的DNA大幅增加。芯片数字PCR(cdPCR)是近年来正在迅速发展的一种全新的核酸检测技术。与传统的定量PCR相比,数字PCR不依赖于扩增曲线的循环阈值(Ct),也无需采用看家基因和标准曲线,因此具有高灵敏度、高精度、高耐受性、绝对定量等优点。cdPCR通过把反应液均匀分到芯片上的反应通孔中进行PCR反应,然后根据泊松分布和荧光信号阳性比例来计算目的核酸的拷贝数。在cdPCR具体的设计过程中,确定芯片最佳反应通孔数对cdPCR的设计至关重要。
若芯片反应通孔数过低,则芯片数字PCR的检测灵敏度无法满足要求;而芯片反应通孔数过高,则将带来工艺难度的提升与设计成本的增加,特对是对于目的核酸片段较少、检测灵敏度要求不高的实验,高昂的PCR仪显然与实际需求相违背。
因此,提供一种反应通孔数优化分析算法,使其在芯片数字PCR的设计过程中,通过分析计算得到芯片反应通孔的个数优化值,从而得到芯片反应通孔的最佳个数,进而在保证灵敏度的前提下,降低实验成本,避免反应通孔数量的非限性增长引发的设计难题与成本问题,就成为本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种反应通孔数优化分析算法,使其在芯片数字PCR的设计过程中,通过分析计算得到芯片反应通孔的个数优化值,从而得到芯片反应通孔的最佳个数,进而在保证灵敏度的前提下,降低实验成本,避免反应通孔数量的非限性增长引发的设计难题与成本问题。
为了实现上述目的,本发明提供一种基于芯片数字PCR的反应通孔数优化分析算法,利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数,通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。
该反应通孔数优化分析算法通过C程序的模拟计算可以得到数字PCR芯片反应通孔的最佳个数,使其在芯片数字PCR的设计过程中,通过分析计算得到芯片反应通孔的个数优化值,从而得到芯片反应通孔的最佳个数,进而在保证灵敏度的前提下,降低了实验成本,避免了反应通孔数量的非限性增长引发的设计难题与成本问题。
可选地,包括以下步骤:
S11:在C语言算法程序中生成m+n个随机数,该随机数的生成区间为[0,(m+n)*h/m],其中m为目标粒子个数、n为干扰粒子个数,h为芯片反应通孔个数;
S12:统计区间[0,h-1]内非重复随机数的总数N;
S13:将S1和S2过程重复R次,统计不同N对应的出现次数Y;
S14:根据不同h对应的N-Y曲线重叠度得到最佳通孔数。
可选地,包括以下步骤:
S21:在C语言算法程序中生成m+n个随机数,该随机数的生成区间为[0,(m+n)*h/m],其中m为目标粒子个数、n为干扰粒子个数,h为芯片反应通孔个数,m、n、h均为正整数;
S22:统计区间[0,h-1]内非重复随机数的总数N;
S23:将S1和S2过程重复R次,统计不同N对应的出现次数Y;
S24:根据不同h对应的N-Y主峰N随h的变化率。
可选地,目标粒子个数的随机数区间为[0,h-1],干扰粒子个数的随机数区间为[h,(m+n)*h/m)。
可选地,优化后得到的反应通孔个数与目标粒子个数之比为1:7。
可选地,优化后得到的反应通孔个数与目标粒子个数之比为1:8。
可选地,目标粒子的随机数和干扰粒子的随机数在同一个C算法程序中同时生成。
附图说明
图1为本发明所提供的反应通孔数优化分析算法一种具体实施方式的算法流程图。
具体实施例
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
请参考图1,图1为本发明所提供的反应通孔数优化分析算法一种具体实施方式的算法流程图。
在一种具体实施方式中,本发明提供的基于芯片数字PCR的反应通孔数优化分析算法,利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数,通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。该反应通孔数优化分析算法通过C程序的模拟计算可以得到数字PCR芯片反应通孔的最佳个数,使其在芯片数字PCR的设计过程中,通过分析计算得到芯片反应通孔的个数优化值,从而得到芯片反应通孔的最佳个数,进而在保证灵敏度的前提下,降低了实验成本,避免了反应通孔数量的非限性增长引发的设计难题与成本问题。
具体地,该算法包括以下步骤:
S11:在C语言算法程序中生成m+n个随机数,该随机数的生成区间为[0,(m+n)*h/m],其中m为目标粒子个数、n为干扰粒子个数,h为芯片反应通孔个数;
S12:统计区间[0,h-1]内非重复随机数的总数N;
S13:将S1和S2过程重复R次,统计不同N对应的出现次数Y;
S14:根据不同h对应的N-Y曲线重叠度得到最佳通孔数。
可选地,该算法包括以下步骤:
S21:在C语言算法程序中生成m+n个随机数,该随机数的生成区间为[0,(m+n)*h/m],其中m为目标粒子个数、n为干扰粒子个数,h为芯片反应通孔个数,m、n、h均为正整数;
S22:统计区间[0,h-1]内非重复随机数的总数N;
S23:将S1和S2过程重复R次,统计不同N对应的出现次数Y;
S24:根据不同h对应的N-Y主峰N随h的变化率。
具体地,目标粒子个数的随机数区间为[0,h-1],干扰粒子个数的随机数区间为[h,(m+n)*h/m),优化后得到的反应通孔个数与目标粒子个数之比为1:7或1:8,且目标粒子的随机数和干扰粒子的随机数在同一个C算法程序中同时生成。
下面以上述具体实施方式为例,详述数字PCR的技术过程。
数字PCR(dgital PCR,dPCR)是一种全新的核酸检测技术,与传统的定量PCR技术不同的是,数字PCR不依赖于扩增曲线的循环阈值(Ct),也无需采用看家基因和标准曲线,因此具有高灵敏度、高精度、高耐受性、绝对定量等优点。芯片数字PCR(cdPCR)通过把反应液均匀分配到芯片上的反应通孔中进行PCR反应,然后根据泊松分布和荧光信号阳性比例来计算目的核酸的拷贝数。
伯乐QX100数字PCR仪是目前主流的数字PCR仪,其技术过程及参数如下:
QX100数字PCR仪由液滴发生器和液滴分析仪组成,液滴发生器的最大处理通量为8个样本,其能利用微流控原理能将每份样本反应液分化成约2万个油包水的液滴,所有液滴大小几乎相同,体积均在nL水平。将经过微滴化处理的样品从微滴发生卡转移到PCR反应板上,并在普通PCR仪上进行扩增,PCR结束后,将PCR反应板置于液滴分析仪内;液滴分析仪具有32孔/小时的检测速度,能够检测液滴总数140万,检测精度达±10%,并可同时检测两种不同的荧光信号;液滴分析仪能对所有反应通孔内的液滴进行逐个检测,并根据荧光信号判断液滴的阴阳性,其中阳性表示液滴内存在目的核酸;最后利用分析软件根据液滴的阳性比例和泊松分布即可计算出目的核酸的起始浓度。
在反应通孔数的优化算法中,设m为目标粒子个数,n为干扰粒子个数,h为芯片反应通孔数,m、n、h均为正整数,且h≥m(由数字PCR检测要求决定)。
在[0,(m+n)*h/m)区间内生成m+n个随机数(整数),其中[0,h-1]区间内的随机数代表目标粒子,且总数为m;[h,(m+n)*h/m)区间内的随机数代表干扰粒子,且总数为n;然后统计[0,h-1]区间内非重复随机数的总数N,N表示m个目标粒子在h个反应通孔中的入孔总数;将上述过程重复R次,统计不同N对应的出现次数Y;最后根据不同h对应的N-Y曲线重叠度或N-Y主峰N值随h的变化率曲线判断芯片数字PCR的最佳反应通孔数。
假设目标粒子个数m=1000,干扰粒子个数n分别是目标粒子个数的0、1、10、100、1000和10000倍,反应通孔数h分别是目标粒子个数的1、2、3……、a倍(a为正整数),此时:
设m=1000,n=0,h=1000,如图1所示,利用语言C程序随机生成1000个介于[0,999]的随机数,其中随机数x时表示目标粒子落入标号为x的反应通孔内,统计1000个随机数的非重复总数N,其表示1000个目标粒子在1000个反应通孔中的入洞总数。将上述过程重复20万次,统计不同N对应的出现次数Y,由此得到1000个目标粒子在1000个反应通孔中的分布情况,其入洞总数非零区间为[589,674],其中当入洞总数N=632时出现次数最大。
设m=1000,n=0,h=2000,如图1所示,利用C语言程序随机生成1000个介于[0,1999]的随机数,其中随机数x时表示目标粒子落入标号为x的反应通孔内,统计1000个随机数的非重复总数N,其表示1000个目标粒子在1000个反应通孔中的入洞总数。将上述过程重复20万次,统计不同N对应的出现次数Y,由此得到1000个目标粒子在2000个反应通孔中的分布情况,其入洞总数非零区间为[745,829],其中当入洞总数N=787时出现次数最大。比较上述两结果发现,随着反应通孔数增加1000个目标粒子在反应通孔内的分布将更加均匀。
依次类推,可按图1所示步骤分别得到h=3000、4000、5000等时(m、n不变)目标粒子的分布情况,结果表明随着h的增大,1000个目标粒子在反应通孔内的分布将越发均匀,但随着h大于某阈值,均匀化增加幅度将趋于饱和。
设m=1000,n=1000,h=1000*a(a取1、2、3、……),利用C算法程序随机生成1000个介于[0,2*h]的随机数,且[0,h-1]之间的随机数1000个,代表目标粒子;[h,2*h)之间的随机数1000个,代表干扰粒子,当生成随机数x(0≤x≤h-1)时表示目标粒子落入标号为x的反应通孔内,统计代表目标粒子的1000个随机数的非重复数值的总数N,N就表示1000个目标粒子在1000个干扰粒子作用下在h个反应通孔中的入洞总数。将上述过程重复R次(R可以任意设置,但不要太小),统计不同入洞总数N对应的出现次数Y,从而得到1000个目标粒子在1000个干扰粒子作用下在h个反应通孔中的分布情况。
经统计分析发现,不管h取何值(h=1000*a,而a取1、2、3、……),其得到的分布结果与n=0时同一个h对应的分布结果几乎相同,由此表明干扰粒子对目标粒子分布的随机影响是均匀的,它不会改变目标粒子的分布情况。
本文对目标粒子个数m=1000,干扰粒子个数n分别是目标粒子个数的0、1、10、100、1000和10000倍,反应通孔数h分别是目标粒子个数的1、2、3……、a倍(a为正整数)的情况均按图1所示步骤作了相应的计算,但由于计算分析过程与上述计算分析过程相同,以下不再赘述。
利用图1所示算法进行计算后,得到如下结果:
1)无论干扰粒子有无或其存在多少,目标粒子都将具有基本相同的N-Y曲线分布;
2)在目标粒子个数为1000的情况下,无论干扰粒子有无或其存在多少,检测目标粒子的最佳反应通孔数均为7000或8000;
3)由2)推论可得,无论干扰粒子有无或其存在多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比应为1:7或1:8。
上述各实施例仅是本发明的优选实施方式,在本技术领域内,凡是基于本发明技术方案上的变化和改进,不应排除在本发明的保护范围之外。
Claims (7)
1.一种基于芯片数字PCR的反应通孔数优化分析算法,其特征在于,利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数,通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。
2.根据权利要求1所述的反应通孔数优化分析算法,其特征在于,包括以下步骤:
S11:在C语言算法程序中生成m+n个随机数,该随机数的生成区间为[0,(m+n)*h/m],其中m为目标粒子个数、n为干扰粒子个数,h为芯片反应通孔个数;
S12:统计区间[0,h-1]内非重复随机数的总数N;
S13:将S1和S2过程重复R次,统计不同N对应的出现次数Y;
S14:根据不同h对应的N-Y曲线重叠度得到最佳通孔数。
3.根据权利要求1所述的反应通孔数优化分析算法,其特征在于,包括以下步骤:
S21:在C语言算法程序中生成m+n个随机数,该随机数的生成区间为[0,(m+n)*h/m],其中m为目标粒子个数、n为干扰粒子个数,h为芯片反应通孔个数,m、n、h均为正整数;
S22:统计区间[0,h-1]内非重复随机数的总数N;
S23:将S1和S2过程重复R次,统计不同N对应的出现次数Y;
S24:根据不同h对应的N-Y主峰N随h的变化率。
4.根据权利要求2或3所述的反应通孔数优化分析算法,其特征在于,目标粒子个数的随机数区间为[0,h-1],干扰粒子个数的随机数区间为[h,(m+n)*h/m)。
5.根据权利要求1所述的反应通孔数优化分析算法,其特征在于,优化后得到的反应通孔个数与目标粒子个数之比为1:7。
6.根据权利要求1所述的反应通孔数优化分析算法,其特征在于,优化后得到的反应通孔个数与目标粒子个数之比为1:8。
7.根据权利要求1所述的反应通孔数优化分析算法,其特征在于,目标粒子的随机数和干扰粒子的随机数在同一个C算法程序中同时生成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710339481.2A CN107180163A (zh) | 2017-05-15 | 2017-05-15 | 一种基于芯片数字pcr的反应通孔数优化分析算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710339481.2A CN107180163A (zh) | 2017-05-15 | 2017-05-15 | 一种基于芯片数字pcr的反应通孔数优化分析算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107180163A true CN107180163A (zh) | 2017-09-19 |
Family
ID=59832508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710339481.2A Pending CN107180163A (zh) | 2017-05-15 | 2017-05-15 | 一种基于芯片数字pcr的反应通孔数优化分析算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107180163A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113699033A (zh) * | 2021-08-10 | 2021-11-26 | 上海交通大学 | 一种基于熔解曲线的多重数字核酸分析装置和分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202246700U (zh) * | 2011-09-23 | 2012-05-30 | 上海熙洛生物技术有限公司 | 一种用于pcr反应的试剂盒 |
WO2016131538A1 (de) * | 2015-02-20 | 2016-08-25 | Friz Biochem Gesellschaft Für Bioanalytik Mbh | Mikrofluidische kartusche für den nachweis von biomolekülen |
CN106229964A (zh) * | 2016-07-22 | 2016-12-14 | 南京工程学院 | 一种基于改进二进制粒子群算法的配电网故障定位方法 |
-
2017
- 2017-05-15 CN CN201710339481.2A patent/CN107180163A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202246700U (zh) * | 2011-09-23 | 2012-05-30 | 上海熙洛生物技术有限公司 | 一种用于pcr反应的试剂盒 |
WO2016131538A1 (de) * | 2015-02-20 | 2016-08-25 | Friz Biochem Gesellschaft Für Bioanalytik Mbh | Mikrofluidische kartusche für den nachweis von biomolekülen |
CN106229964A (zh) * | 2016-07-22 | 2016-12-14 | 南京工程学院 | 一种基于改进二进制粒子群算法的配电网故障定位方法 |
Non-Patent Citations (5)
Title |
---|
APECODER_17岁: "C语言 产生1-100万随机数,如果重复的话,能马上知道", 《HTTPS://BLOG.CSDN.NET/U010047161/ARTICLE/DETAILS/47747653》 * |
XINGJUAN CAI等: "Improved bat algorithm with optimal forage strategy and random disturbance strategy", 《BIO-INSPIRED COMPUTATION》 * |
ZHOU31146001: "如何提高程序运行速度", 《BBS.BCCN.NET/THREAD-468271-1-1.HTML》 * |
周云龙: "《转基因生物标准物质研制与应用》", 31 August 2014 * |
彭年才: "《数字PCR——原理、技术及应用》", 30 April 2017, 科学出版社 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113699033A (zh) * | 2021-08-10 | 2021-11-26 | 上海交通大学 | 一种基于熔解曲线的多重数字核酸分析装置和分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qiu et al. | Erosion reduces soil microbial diversity, network complexity and multifunctionality | |
CA2483056A1 (en) | QUANTITATIVE ANALYSIS OF NUCLEIC ACIDS BY GROWTH CURVES | |
WO2011097424A1 (en) | Methods for increasing multiplex level by externalization of passive reference in polymerase chain reactions | |
CN106202990A (zh) | 一种环状rna的高通量芯片数据处理及分析流程控制方法 | |
CN114134252B (zh) | 用于检测冠状病毒的引物和试剂盒 | |
CN109887546B (zh) | 基于二代测序的单基因或多基因拷贝数检测系统及方法 | |
CN103093119A (zh) | 一种利用网络结构信息识别显著生物通路的方法 | |
CN116486916A (zh) | 一种单细胞转录组濒死细胞和多细胞过滤方法、介质和设备 | |
CN107180163A (zh) | 一种基于芯片数字pcr的反应通孔数优化分析算法 | |
Williams et al. | Plant microRNA prediction by supervised machine learning using C5. 0 decision trees | |
CN110021352A (zh) | 一种基于miRBase数据库的植物有参的miRNA数据分析方法 | |
CN109949863A (zh) | 一种基于随机森林模型鉴别大曲质量的方法 | |
CN114038501B (zh) | 一种基于机器学习的背景菌判定方法 | |
Sonrani et al. | Array of semiconductor nanowires gas sensor for IoT in wastewater management | |
CN106636466A (zh) | 一种乙型肝炎病毒共价闭合环状dna精确定量的方法 | |
CN101250584B (zh) | 一种识别显著差异表达基因集合的方法 | |
CN103555859B (zh) | 一种检测甘蔗条纹花叶病毒的荧光定量rt-pcr试剂盒 | |
CN109871403A (zh) | 基于产业供应链的工业大数据分析方法 | |
CN102576389A (zh) | 用于扩增反应的分析工具 | |
CN107937595A (zh) | 一种基于ddPCR定量检测饲料中转基因玉米IE034 的方法、引物和探针及应用 | |
CN114373506A (zh) | 一种真核生物泛转录组注释方法 | |
CA3188680A1 (en) | Systems, devices and methods for determining most probable number in biological sample analysis | |
CN111814147A (zh) | 基于模型库的安卓恶意软件检测方法 | |
Wu et al. | Exploration of wheat yellow mosaic virus-responsive miRNAs and their targets in wheat by miRNA and degradome sequencing | |
Pearson et al. | High-throughput metabolite quantification for synthetic biology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170919 |
|
RJ01 | Rejection of invention patent application after publication |