CN107180163A

CN107180163A - 一种基于芯片数字pcr的反应通孔数优化分析算法

Info

Publication number: CN107180163A
Application number: CN201710339481.2A
Authority: CN
Inventors: 叶锋
Original assignee: Beijing Jingzhun Medical Technology Co Ltd
Current assignee: Beijing Jingzhun Medical Technology Co Ltd
Priority date: 2017-05-15
Filing date: 2017-05-15
Publication date: 2017-09-19

Abstract

本发明公开了一种基于芯片数字PCR的反应通孔数优化分析算法，其利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数，通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。该反应通孔数优化分析算法通过C程序的模拟计算可以得到数字PCR芯片反应通孔的最佳个数，使其在芯片数字PCR的设计过程中，通过分析计算得到芯片反应通孔的个数优化值，从而得到芯片反应通孔的最佳个数，进而在保证灵敏度的前提下，降低了实验成本，避免了反应通孔数量的非限性增长引发的设计难题与成本问题。

Description

一种基于芯片数字PCR的反应通孔数优化分析算法

技术领域

本发明涉及生物反应中的数值模拟计算技术领域，尤其是涉及一种基于芯片数字PCR的反应通孔数优化分析算法。

背景技术

PCR是指聚合酶链式反应，其是一种用于放大扩增特定的DNA片段的分子生物学技术，它可看作是生物体外的特殊DNA复制，PCR的最大特点是能将微量的DNA大幅增加。芯片数字PCR(cdPCR)是近年来正在迅速发展的一种全新的核酸检测技术。与传统的定量PCR相比，数字PCR不依赖于扩增曲线的循环阈值(Ct)，也无需采用看家基因和标准曲线，因此具有高灵敏度、高精度、高耐受性、绝对定量等优点。cdPCR通过把反应液均匀分到芯片上的反应通孔中进行PCR反应，然后根据泊松分布和荧光信号阳性比例来计算目的核酸的拷贝数。在cdPCR具体的设计过程中，确定芯片最佳反应通孔数对cdPCR的设计至关重要。

若芯片反应通孔数过低，则芯片数字PCR的检测灵敏度无法满足要求；而芯片反应通孔数过高，则将带来工艺难度的提升与设计成本的增加，特对是对于目的核酸片段较少、检测灵敏度要求不高的实验，高昂的PCR仪显然与实际需求相违背。

因此，提供一种反应通孔数优化分析算法，使其在芯片数字PCR的设计过程中，通过分析计算得到芯片反应通孔的个数优化值，从而得到芯片反应通孔的最佳个数，进而在保证灵敏度的前提下，降低实验成本，避免反应通孔数量的非限性增长引发的设计难题与成本问题，就成为本领域技术人员亟待解决的问题。

发明内容

本发明的目的是提供一种反应通孔数优化分析算法，使其在芯片数字PCR的设计过程中，通过分析计算得到芯片反应通孔的个数优化值，从而得到芯片反应通孔的最佳个数，进而在保证灵敏度的前提下，降低实验成本，避免反应通孔数量的非限性增长引发的设计难题与成本问题。

为了实现上述目的，本发明提供一种基于芯片数字PCR的反应通孔数优化分析算法，利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数，通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。

该反应通孔数优化分析算法通过C程序的模拟计算可以得到数字PCR芯片反应通孔的最佳个数，使其在芯片数字PCR的设计过程中，通过分析计算得到芯片反应通孔的个数优化值，从而得到芯片反应通孔的最佳个数，进而在保证灵敏度的前提下，降低了实验成本，避免了反应通孔数量的非限性增长引发的设计难题与成本问题。

可选地，包括以下步骤：

S11:在C语言算法程序中生成m+n个随机数，该随机数的生成区间为[0，(m+n)*h/m]，其中m为目标粒子个数、n为干扰粒子个数，h为芯片反应通孔个数；

S12:统计区间[0，h-1]内非重复随机数的总数N；

S13：将S1和S2过程重复R次，统计不同N对应的出现次数Y；

S14:根据不同h对应的N-Y曲线重叠度得到最佳通孔数。

可选地，包括以下步骤：

S21:在C语言算法程序中生成m+n个随机数，该随机数的生成区间为[0，(m+n)*h/m]，其中m为目标粒子个数、n为干扰粒子个数，h为芯片反应通孔个数，m、n、h均为正整数；

S22:统计区间[0，h-1]内非重复随机数的总数N；

S23：将S1和S2过程重复R次，统计不同N对应的出现次数Y；

S24:根据不同h对应的N-Y主峰N随h的变化率。

可选地，目标粒子个数的随机数区间为[0，h-1]，干扰粒子个数的随机数区间为[h，(m+n)*h/m)。

可选地，优化后得到的反应通孔个数与目标粒子个数之比为1：7。

可选地，优化后得到的反应通孔个数与目标粒子个数之比为1：8。

可选地，目标粒子的随机数和干扰粒子的随机数在同一个C算法程序中同时生成。

附图说明

图1为本发明所提供的反应通孔数优化分析算法一种具体实施方式的算法流程图。

具体实施例

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

请参考图1，图1为本发明所提供的反应通孔数优化分析算法一种具体实施方式的算法流程图。

在一种具体实施方式中，本发明提供的基于芯片数字PCR的反应通孔数优化分析算法，利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数，通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。该反应通孔数优化分析算法通过C程序的模拟计算可以得到数字PCR芯片反应通孔的最佳个数，使其在芯片数字PCR的设计过程中，通过分析计算得到芯片反应通孔的个数优化值，从而得到芯片反应通孔的最佳个数，进而在保证灵敏度的前提下，降低了实验成本，避免了反应通孔数量的非限性增长引发的设计难题与成本问题。

具体地，该算法包括以下步骤：

S12:统计区间[0，h-1]内非重复随机数的总数N；

S13：将S1和S2过程重复R次，统计不同N对应的出现次数Y；

S14:根据不同h对应的N-Y曲线重叠度得到最佳通孔数。

可选地，该算法包括以下步骤：

S22:统计区间[0，h-1]内非重复随机数的总数N；

S23：将S1和S2过程重复R次，统计不同N对应的出现次数Y；

S24:根据不同h对应的N-Y主峰N随h的变化率。

具体地，目标粒子个数的随机数区间为[0，h-1]，干扰粒子个数的随机数区间为[h，(m+n)*h/m)，优化后得到的反应通孔个数与目标粒子个数之比为1：7或1：8，且目标粒子的随机数和干扰粒子的随机数在同一个C算法程序中同时生成。

下面以上述具体实施方式为例，详述数字PCR的技术过程。

数字PCR(dgital PCR，dPCR)是一种全新的核酸检测技术，与传统的定量PCR技术不同的是，数字PCR不依赖于扩增曲线的循环阈值(Ct)，也无需采用看家基因和标准曲线，因此具有高灵敏度、高精度、高耐受性、绝对定量等优点。芯片数字PCR(cdPCR)通过把反应液均匀分配到芯片上的反应通孔中进行PCR反应，然后根据泊松分布和荧光信号阳性比例来计算目的核酸的拷贝数。

伯乐QX100数字PCR仪是目前主流的数字PCR仪，其技术过程及参数如下：

QX100数字PCR仪由液滴发生器和液滴分析仪组成，液滴发生器的最大处理通量为8个样本，其能利用微流控原理能将每份样本反应液分化成约2万个油包水的液滴，所有液滴大小几乎相同，体积均在nL水平。将经过微滴化处理的样品从微滴发生卡转移到PCR反应板上，并在普通PCR仪上进行扩增，PCR结束后，将PCR反应板置于液滴分析仪内；液滴分析仪具有32孔/小时的检测速度，能够检测液滴总数140万，检测精度达±10％，并可同时检测两种不同的荧光信号；液滴分析仪能对所有反应通孔内的液滴进行逐个检测，并根据荧光信号判断液滴的阴阳性，其中阳性表示液滴内存在目的核酸；最后利用分析软件根据液滴的阳性比例和泊松分布即可计算出目的核酸的起始浓度。

在反应通孔数的优化算法中，设m为目标粒子个数，n为干扰粒子个数，h为芯片反应通孔数，m、n、h均为正整数，且h≥m(由数字PCR检测要求决定)。

在[0，(m+n)*h/m)区间内生成m+n个随机数(整数)，其中[0，h-1]区间内的随机数代表目标粒子，且总数为m；[h，(m+n)*h/m)区间内的随机数代表干扰粒子，且总数为n；然后统计[0，h-1]区间内非重复随机数的总数N，N表示m个目标粒子在h个反应通孔中的入孔总数；将上述过程重复R次，统计不同N对应的出现次数Y；最后根据不同h对应的N-Y曲线重叠度或N-Y主峰N值随h的变化率曲线判断芯片数字PCR的最佳反应通孔数。

假设目标粒子个数m＝1000，干扰粒子个数n分别是目标粒子个数的0、1、10、100、1000和10000倍，反应通孔数h分别是目标粒子个数的1、2、3……、a倍(a为正整数)，此时：

设m＝1000，n＝0，h＝1000，如图1所示，利用语言C程序随机生成1000个介于[0，999]的随机数，其中随机数x时表示目标粒子落入标号为x的反应通孔内，统计1000个随机数的非重复总数N，其表示1000个目标粒子在1000个反应通孔中的入洞总数。将上述过程重复20万次，统计不同N对应的出现次数Y，由此得到1000个目标粒子在1000个反应通孔中的分布情况，其入洞总数非零区间为[589，674]，其中当入洞总数N＝632时出现次数最大。

设m＝1000，n＝0，h＝2000，如图1所示，利用C语言程序随机生成1000个介于[0，1999]的随机数，其中随机数x时表示目标粒子落入标号为x的反应通孔内，统计1000个随机数的非重复总数N，其表示1000个目标粒子在1000个反应通孔中的入洞总数。将上述过程重复20万次，统计不同N对应的出现次数Y，由此得到1000个目标粒子在2000个反应通孔中的分布情况，其入洞总数非零区间为[745，829]，其中当入洞总数N＝787时出现次数最大。比较上述两结果发现，随着反应通孔数增加1000个目标粒子在反应通孔内的分布将更加均匀。

依次类推，可按图1所示步骤分别得到h＝3000、4000、5000等时(m、n不变)目标粒子的分布情况，结果表明随着h的增大，1000个目标粒子在反应通孔内的分布将越发均匀，但随着h大于某阈值，均匀化增加幅度将趋于饱和。

设m＝1000，n＝1000，h＝1000*a(a取1、2、3、……)，利用C算法程序随机生成1000个介于[0，2*h]的随机数，且[0，h-1]之间的随机数1000个，代表目标粒子；[h，2*h)之间的随机数1000个，代表干扰粒子，当生成随机数x(0≤x≤h-1)时表示目标粒子落入标号为x的反应通孔内，统计代表目标粒子的1000个随机数的非重复数值的总数N，N就表示1000个目标粒子在1000个干扰粒子作用下在h个反应通孔中的入洞总数。将上述过程重复R次(R可以任意设置，但不要太小)，统计不同入洞总数N对应的出现次数Y，从而得到1000个目标粒子在1000个干扰粒子作用下在h个反应通孔中的分布情况。

经统计分析发现，不管h取何值(h＝1000*a，而a取1、2、3、……)，其得到的分布结果与n＝0时同一个h对应的分布结果几乎相同，由此表明干扰粒子对目标粒子分布的随机影响是均匀的，它不会改变目标粒子的分布情况。

本文对目标粒子个数m＝1000，干扰粒子个数n分别是目标粒子个数的0、1、10、100、1000和10000倍，反应通孔数h分别是目标粒子个数的1、2、3……、a倍(a为正整数)的情况均按图1所示步骤作了相应的计算，但由于计算分析过程与上述计算分析过程相同，以下不再赘述。

利用图1所示算法进行计算后，得到如下结果：

1)无论干扰粒子有无或其存在多少，目标粒子都将具有基本相同的N-Y曲线分布；

2)在目标粒子个数为1000的情况下，无论干扰粒子有无或其存在多少，检测目标粒子的最佳反应通孔数均为7000或8000；

3)由2)推论可得，无论干扰粒子有无或其存在多少，检测目标粒子的最佳反应通孔数与目标粒子个数之比应为1：7或1：8。

上述各实施例仅是本发明的优选实施方式，在本技术领域内，凡是基于本发明技术方案上的变化和改进，不应排除在本发明的保护范围之外。

Claims

1.一种基于芯片数字PCR的反应通孔数优化分析算法，其特征在于，利用C语言生成随机数集的方法得到目标粒子个数和干扰粒子个数，通过模拟目标粒子在干扰粒子作用下在芯片反应通孔中的分布情况得到芯片反应通孔个数。

2.根据权利要求1所述的反应通孔数优化分析算法，其特征在于，包括以下步骤：

S12:统计区间[0，h-1]内非重复随机数的总数N；

S13：将S1和S2过程重复R次，统计不同N对应的出现次数Y；

S14:根据不同h对应的N-Y曲线重叠度得到最佳通孔数。

3.根据权利要求1所述的反应通孔数优化分析算法，其特征在于，包括以下步骤：

S22:统计区间[0，h-1]内非重复随机数的总数N；

S23：将S1和S2过程重复R次，统计不同N对应的出现次数Y；

S24:根据不同h对应的N-Y主峰N随h的变化率。

4.根据权利要求2或3所述的反应通孔数优化分析算法，其特征在于，目标粒子个数的随机数区间为[0，h-1]，干扰粒子个数的随机数区间为[h，(m+n)*h/m)。

5.根据权利要求1所述的反应通孔数优化分析算法，其特征在于，优化后得到的反应通孔个数与目标粒子个数之比为1：7。

6.根据权利要求1所述的反应通孔数优化分析算法，其特征在于，优化后得到的反应通孔个数与目标粒子个数之比为1：8。

7.根据权利要求1所述的反应通孔数优化分析算法，其特征在于，目标粒子的随机数和干扰粒子的随机数在同一个C算法程序中同时生成。