CN109790537A - 供多重pcr的引物的设计方法 - Google Patents
供多重pcr的引物的设计方法 Download PDFInfo
- Publication number
- CN109790537A CN109790537A CN201780060228.1A CN201780060228A CN109790537A CN 109790537 A CN109790537 A CN 109790537A CN 201780060228 A CN201780060228 A CN 201780060228A CN 109790537 A CN109790537 A CN 109790537A
- Authority
- CN
- China
- Prior art keywords
- candidate region
- tagmeme
- amplification
- amplification candidate
- preferential
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 739
- 238000013461 design Methods 0.000 title claims abstract description 139
- 238000007403 mPCR Methods 0.000 title claims abstract description 91
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 537
- 230000003321 amplification Effects 0.000 claims abstract description 519
- 239000013611 chromosomal DNA Substances 0.000 claims abstract description 74
- 238000012408 PCR amplification Methods 0.000 claims abstract description 70
- 239000003814 drug Substances 0.000 claims description 226
- 229940079593 drug Drugs 0.000 claims description 226
- 238000003860 storage Methods 0.000 claims description 102
- 210000000349 chromosome Anatomy 0.000 claims description 12
- 239000002585 base Substances 0.000 description 419
- 238000004519 manufacturing process Methods 0.000 description 52
- 108020004414 DNA Proteins 0.000 description 34
- 102000053602 DNA Human genes 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 17
- 239000000539 dimer Substances 0.000 description 16
- 230000000295 complement effect Effects 0.000 description 15
- 230000007547 defect Effects 0.000 description 13
- 230000000052 comparative effect Effects 0.000 description 12
- 238000003205 genotyping method Methods 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 9
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 239000003513 alkali Substances 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000002844 melting Methods 0.000 description 5
- 230000008018 melting Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 230000004544 DNA amplification Effects 0.000 description 3
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 3
- 238000000126 in silico method Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 229930013930 alkaloid Natural products 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 210000003924 normoblast Anatomy 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
Abstract
本发明提供一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其特征在于附加上述优先序位的方法。
Description
技术领域
本发明涉及一种供多重PCR的引物的设计方法。
背景技术
利用近年来开发的DNA测序仪等可以容易地进行基因分析。然而,基因组的总碱基长度通常庞大,另一方面测序仪的读取能力是有限的。于是,作为通过仅扩增所需的特定的基因区域、并限定于其碱基序列进行读取来有效且高精度地进行基因分析的技术,正在普及PCR法。特别将通过同时对某一个PCR反应系统供给多种类型的引物来选择性地扩增多个基因区域的方法称为多重PCR。
由于多重PCR高效地从少量的DNA扩增多个区域,因此是用于进行非侵入性产前诊断的实用技术。
专利文献1中记载的是,针对同一染色体上按坐标顺序所配置的m个扩增候选区域,设计多重PCR中使用的引物的方法。在此,m为1以上的整数。
首先,从成为扩增对象的DNA的碱基序列中选出对应于第一个扩增候选区域X1的候选引物。此时,候选引物设为根据表示引物的解链温度、GC含量、碱基序列的长度、碱基序列的特异性、形成发夹结构及引物二聚体的难度的评分来选出。Tm(解链温度;MeltingTemperature)、GC含量及碱基序列的长度处于预定的范围内的、对应于扩增候选区域X1的n个候选引物中,将根据碱基序列的特异性、形成发夹结构及引物二聚体的难度计算出的表示候选引物的优越性的评分最高的候选引物称为P11、将评分第2高的候选引物称为P12、而且将第n个候选引物称为P1n。对应于第2个扩增候选区域X2的n’个候选引物P21,P22,…,P2n’也与上述同样地选出。对所有扩增候选区域重复同样的操作,选出对应于第m个扩增候选区域Xm的k个候选引物Pm1,Pm2,…,Pmk。
接着,为了从所选出的候选引物中选出最适于反应的引物的组合,调查不同的扩增候选区域的引物彼此之间是否在非预期的位置具有互补的碱基序列。在不同的扩增候选区域的引物彼此之间形成引物二聚体的可能性低的引物成为能够用于多重PCR的引物。
现有技术文献
专利文献
专利文献1:日本专利第5079694号公报
发明内容
发明要解决的技术课题
然而,在针对从单一细胞中提取的基因组DNA这样的冗余度低的少量DNA样本直接进行多重PCR时,由于互补性/特异性等引物设计的条件非常严格,因此,对于想要设计供多重PCR的引物的所有扩增候选区域,有时不能采用可在多重PCR中使用的引物。
其结果是,能够采用可在多重PCR中使用的引物的扩增候选区域(以下有时称为“扩增对象区域”。)的数量变少,并产生如下的问题。
第一个问题是,产生通过多重PCR进行的扩增失败的扩增对象区域,不能确保基因分型等分析所需的区域数。
第二个问题是,即使能够确保基因分型等分析所需的区域数,也不能实现高精度。
因此,本发明的课题在于,提供一种供多重PCR的引物的设计方法,即使是针对从单一细胞中提取的基因组DNA这样的冗余度低的少量DNA样本直接进行多重PCR的情况,也能够确保所需的区域数或能够实现高精度。
用于解决技术课题的手段
本发明人在探讨后发现,作为产生通过多重PCR进行的扩增失败的扩增对象区域的原因,存在因染色体缺损或DNA碎片化等而导致想要扩增的区域的至少一部分不再存在的情况,另外,即使作为可在多重PCR中使用的引物是通过计算机模拟(in silico)所采用的引物,也存在在生物体外(in vitro)的多重PCR实验系统中显现引物不适合的情况,进而,作为即使能够确保基因分型等分析所需的区域数也不能实现高精度的原因,当扩增对象区域所含的变异的变异频率不接近0.5时,为了实现所期望的精度而需要更多的区域数。
本发明人为了解决上述课题进一步反复进行了专心研究,结果得知,在对扩增候选区域附加优先序位、并按照优先序位设计用于对扩增候选区域进行PCR扩增的引物的供多重PCR的引物的设计方法中,通过确保有线序位先后的扩增候选区域之间的距离较大,可限定染色体的部分缺损或DNA碎片化等的影响波及的范围,并减少通过多重PCR进行的扩增失败的扩增对象区域的数量,另外,通过以使扩增候选区域中能够设计的候选引物的数量越少优先序位变得越高的方式附加优先序位,增加作为可在多重PCR中使用的引物而采用的引物的数量,并减少通过多重PCR进行的扩增失败的扩增对象区域的数量,进而,通过以使扩增候选区域所含的变异的变异频率越接近0.5优先序位变得越高的方式附加优先序位,能够以更少的区域数实现所期望的精度,完成了本发明。
即,本发明提供以下的[1]~[6]。
[1]一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位:
通过输入装置输入同一染色体DNA上的n处的扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;
运算装置从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置的第2优先序位设定工序;以及,
运算装置从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为i位、坐标值为ri、识别名为Ri的扩增候选区域及优先序位为j位、坐标值为rj、识别名为Rj的扩增候选区域,检索扩增候选区域Ri及扩增候选区域Rj,所述扩增候选区域Ri及所述扩增候选区域Rj满足如下条件:在上述扩增候选区域Ri及上述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域,接着,利用ri-j=(ri+rj)/2计算上述扩增候选区域Ri及上述扩增候选区域Rj的中点的坐标值ri-j,进而,检索具有最接近上述中点坐标值ri-j的坐标值的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置的第k优先序位设定工序;
自k=3至n重复上述附加优先序位k位的工序。
其中,n为满足3≤n的整数,k为满足3≤k≤n的整数,i及j为1≤i≤k-1、1≤j≤k-1,且i≠j,ri及rj为rmin≤ri≤rmax、rmin≤rj≤rmax,且ri≠rj,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
[2]一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;
运算装置从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置的第2优先序位设定工序;以及,
运算装置从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为i位、坐标值为ri、识别名为Ri的扩增候选区域及优先序位为j位、坐标值为rj、识别名为Rj的扩增候选区域,检索扩增候选区域Ri及扩增候选区域Rj,所述扩增候选区域Ri及所述扩增候选区域Rj满足如下条件:在上述扩增候选区域Ri及上述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域,接着,利用ri-j=(ri+rj)/2计算上述扩增候选区域Ri及上述扩增候选区域Rj的中点的坐标值ri-j,进而,检索具有最接近上述中点坐标值ri-j的坐标值的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置的第k优先序位设定工序;
自k=3至n重复上述附加优先序位k位的工序。
其中,n为满足3≤n的整数,k为满足3≤k≤n的整数,i及j为1≤i≤k-1、1≤j≤k-1,且i≠j,ri及rj为rmin≤ri≤rmax、rmin≤rj≤rmax,且ri≠rj,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
[3]一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;以及,
运算装置从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为k-1位的扩增候选区域的识别名Rk-1及坐标值rk-1,计算T=rk-1+t,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rk-1+t以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果不存在满足该条件的扩增候选区域,则对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t>rmax时,对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位的扩增候选区域附加优先序位k位,并存储于存储装置的第k优先序位设定工序;
自k=2至n重复上述第k优先序位设定工序。
其中,n为满足3≤n的整数,k为满足2≤k≤n的整数,t为满足t>0的实数,rk-1≠rk,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值
[4]一种供多重PCR的引物的设计方法,对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;以及,
运算装置从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为k-l位的扩增候选区域的识别名Rk-1及坐标值rk-1,计算T=rk-1+t,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rk-1+t以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果不存在满足该条件的扩增候选区域,则对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t>rmax时,对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位的扩增候选区域附加优先序位k位,并存储于存储装置的第k优先序位设定工序;
自k=2至n重复上述第k优先序位设定工序。
其中,n为满足3≤n的整数,k为满足2≤k≤n的整数,t为满足t>0的实数,rk-1≠rk,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
[5]一种供多重PCR的引物的设计方法,其对同一染色体上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及候选引物数信息,并存储于存储装置的工序;以及,
运算装置从存储装置所存储的上述扩增候选区域的识别信息及候选引物数信息中检索候选引物数的数量第k少的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置的第k优先序位设定工序;
自k=1至n重复上述第k优先序位设定工序。
其中,n为满足n≥2的整数,k为满足1≤k≤n的整数。
[6]一种供多重PCR的引物的设计方法,其对扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对扩增候选区域附加优先序位的方法来附加上述优先序位:
通过输入装置输入染色体DNA上的n个扩增候选区域的识别信息及变异频率信息,并存储于存储装置的工序;以及,
运算装置根据存储装置所存储的上述扩增候选区域的识别信息及变异频率信息计算具有识别名Ri及变异频率VFi的扩增候选区域的变异频率差=|0.5-VFi|,检索变异频率差第k个小的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置的第k优先序位设定工序;
自k=1至n重复上述第k优先序位设定工序。
其中,n为满足n≥2的整数,k为满足1≤k≤n的整数。
发明效果
根据本发明,可提供一种供多重PCR的引物的设计方法,该方法即使是针对从单一细胞中提取的基因组DNA这样的冗余度低的少量DNA样本直接进行多重PCR的情况,也能够确保所需的区域数,或能够实现高精度。
另外,根据本发明,能够减少受染色体缺损或DNA碎片化等的影响而使PCR扩增失败的扩增对象区域的数量,从而能够确保基因分型等分析所需的区域数。
另外,根据本发明,针对候选引物少的扩增候选区域,能够采用更多的可在多重PCR中使用的引物来减少PCR扩增失败的扩增对象区域的数量,从而能够确保基因分型等分析所需的区域数。
进而,根据本发明,通过提高所含的变异的变异频率接近0.5的区域在扩增对象区域中所占的比例,能够以更少的区域数实现高精度。
附图说明
图1是表示在本发明中的优先序位的设定中使用的硬件的概念图。
图2是表示本发明的本发明的第一方式的优先序位的设定方法的流程图。
图3是表示本发明的本发明的第一方式的优先序位的设定方法的另一实施方式的流程图。
图4是表示本发明的本发明的第二方式的优先序位的设定方法的流程图。
图5是表示本发明的本发明的第二方式的优先序位的设定方法的另一实施方式的流程图。
图6是表示目前的优先序位的设定方法的概念图。对于扩增候选区域,从坐标小的区域起依次附加优先序位。当想要对同一染色体DNA上的9处扩增候选区域中的5处进行扩增,而对于R01、R02、R03、R04、及R05设计引物并尝试扩增时,由于染色体DNA的相当于扩增候选区域R02、R03及R04的3处有缺损,所以只能扩增R01及R05至多2处。
图7是表示本发明的第一方式的优先序位的设定方法的概念图。对于扩增候选区域,以二分法的方式附加优先序位。当想要对同一染色体DNA上的9处扩增候选区域中的5处进行扩增,而对于R01、R03、R05、R07、及R09设计引物并尝试扩增时,由于染色体DNA的相当于扩增候选区域R02、R03及R04的3处有缺损,因此能够对R01、R05、R07、及R09这4处进行扩增。
图8是表示本发明的第二方式的优先序位的设定方法的概念图。对于扩增候选区域,基于距离阈值附加优先序位。当想要对同一染色体DNA上的9处扩增候选区域中的5处进行扩增,而对于R01、R02、R05、R06、及R09设计引物并尝试扩增时,由于染色体DNA的相当于扩增候选区域R02、R03及R04的3处有缺损,因此能够对R01、R05、R06、及R09这4处进行扩增。
图9是表示目前的优先序位的设定方法的概念图。对于扩增候选区域,从坐标小的区域起依次附加优先序位。同一染色体DNA上的扩增候选区域R01~R09的9处中,不能对R07及R08这2处进行扩增。
图10是用于解释本发明的第三方式的优先序位的设定方法的概念图。对于扩增候选区域,从候选引物的数量少的区域起依次附加优先序位。能够对同一染色体DNA上的扩增候选区域R01~R09这9处进行扩增。
图11是表示目前的优先序位的设定方法的概念图。对于扩增候选区域,从坐标小的区域起依次附加优先序位。当对9处中的5处扩增候选区域进行扩增、并进行基因分型分析时,不能获得较高的分析精度。
图12是用于解释本发明的第四方式的优先序位的设定方法的概念图。对于扩增候选区域,从SNP的变异频率接近0.5的区域起依次附加优先序位。当对9处中的5处扩增候选区域进行扩增、并进行基因分型分析时,可获得较高的分析精度。
图13是说明供多重PCR的引物的设计方法(1)的流程图。在设定扩增候选区域的优先序位后,按优先序位的次序选择对象区域,并设计引物。
图14是说明供多重PCR的引物的设计方法(2)的流程图。在设定扩增候选区域的优先序位后,按优先序位的次序选择对象区域,并设计引物。
图15是说明本发明的供多重PCR的引物的设计方法(3)的流程图。在设定扩增候选区域的优先序位后,选择对象区域并设计候选引物的碱基序列,然后按优先序位的次序进行各工序,并设计引物。
图16是说明本发明的供多重PCR的引物的设计方法(3)的变形例的流程图。在选择对象区域、设计候选引物的碱基序列后,设定扩增候选区域的优先序位,按优先序位进行后续的工序,并设计引物。
图17是表示比较例1中的对扩增候选区域附加优先序位的方法的图。对于扩增候选区域,从坐标小的区域起依次附加优先序位。设计引物的10处扩增候选区域中,对于X06、X07、及X08而言,由于染色体DNA的缺损,不进行扩增。因此,有可能不能达到分析所需的区域数。
图18是表示实施例1中的对扩增候选区域附加优先序位的方法的图。对于扩增候选区域,以二分法的方式附加优先序位。对于染色体DNA上的X06、X07、及X08而言,虽然有缺损,但由于未包括在设计引物的10处扩增候选区域中,因此没有影响。
图19是表示实施例2中的对扩增候选区域附加优先序位的方法的图。对于扩增候选区域,基于距离阈值附加优先序位。对于染色体DNA上的X06、X07、及X08而言,虽然有缺损,但由于未包括在设计引物的10处扩增候选区域中,因此没有影响。
具体实施方式
在本发明中,用“~”所表示的范围是指该范围包括记载于“~”前后的两端的范围。例如,关于A和B,“A~B”表示包括A及B的范围。
另外,本发明中,扩增候选区域为基因组DNA上的区域,是指用于基因分型或者染色体数定量等目的进行PCR扩增的候选的区域。
本说明书中使用的主要的简称及其意义如下所述。
DNA…脱氧核糖核酸(Deoxyribonucleic acid)
PCR…聚合酶链反应(Polymerase Chain Reaction)
SNP…单碱基多态性(Single Nucleotide Polymorphism)
SNPs…SNP的的复数形式
SNV…单碱基变异(Single Nucleotide Variant),SNP的上位概念
V.F.…变异频率(Variant Frequency)
ΔV.F.…变异频率差(与变异频率0.5之差的绝对值)
in silico…“使用计算机”的意思(生物信息学)
in vitro…相对于in silico,“通过体外试验”的意思(生物信息学)
[硬件(执行装置)]
对于执行本发明中的优先序位的设定方法的装置(也称作“硬件”或“执行装置”。),参照图1进行说明。
本发明中,通过具备运算装置(CPU;Central Processing Unit,中央运算处理装置)11、存储装置(内存)12、辅助存储装置(存储器)13、输入装置(键盘)14及显示装置(监视器)16的硬件(装置)来进行优先序位的设定。该装置可以进一步具备辅助输入装置(鼠标)15及输出装置(打印机)17等。
对各个装置进行说明。
输入装置(键盘)14是对装置输入指示及数据等的装置。辅助输入装置(鼠标)15可代替输入装置(键盘)14或与其一起来使用。
运算装置(CPU)11是进行运算处理的装置。
存储装置(内存)12是存储运算装置(CPU)11的运算处理的结果或存储来自输入装置(键盘)14的输入的装置。
辅助存储装置(存储器)13是保存操作系统、用于确定所需基因座数量的程序等的存储器。辅助存储装置(存储器)13还能够将其一部分用于扩展存储装置(内存)12(虚拟内存)。
[1.本发明的第一方式]
本发明的第一方式是对产生通过多重PCR进行的扩增失败的扩增对象区域、不能确保基因分型等分析所需的区域数这第一个问题提供解决方案。下面,适当参照图1、图2及图3进行说明。
本发明的第一方式是一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物。
利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位。
通过输入装置14输入同一染色体DNA上的n处的扩增候选区域的识别信息及坐标信息,并存储于存储装置12的工序(图2的S11)。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12的第1优先序位设定工序(图2的S12)。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置12的第2优先序位设定工序(图2的S13)。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为i位、坐标值为ri、识别名为Ri的扩增候选区域及优先序位为j位、坐标值为rj、识别名为Rj的扩增候选区域,检索扩增候选区域Ri及扩增候选区域Rj,所述扩增候选区域Ri及所述扩增候选区域Rj满足如下条件:在上述扩增候选区域Ri及上述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域,接着,利用ri-j=(ri+rj)/2计算上述扩增候选区域Ri及上述扩增候选区域Rj的中点的坐标值ri-j,进而,检索具有最接近上述中点坐标值ri-j的坐标值的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并在存储装置12中存储附加优先序位k位至检索的步骤,并存储于存储装置12的第k优先序位设定工序(图2的S15)。
自k=3至n重复上述附加优先序位k位的工序(图2的S14及S16)。
其中,n为满足3≤n的整数,k为满足3≤k≤n的整数,i及j为1≤i≤k-1、1≤j≤k-1,且i≠j,ri及rj为rmin≤ri≤rmax、rmin≤rj≤rmax,且ri≠rj,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
另外,也可以如图3所示,如下操作来附加优先序位1位及2位。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12的第1优先序位设定工序(图3的S12’)。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置12的第2优先序位设定工序(图3的S13’)。
本发明的第一方式是一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其特征在于,通过包括扩增候选区域选择工序、第1优先序位设定工序、第2优先序位设定工序和第k优先序位设定工序、且自k=3至k=n依次重复第k优先序位设定工序的附加优先序位的方法来附加上述优先序位。
<扩增候选区域选择工序>
扩增候选区域选择工序是选择同一染色体DNA上的n个扩增候选区域的工序。输入扩增候选区域n个识别信息及坐标信息(图2及图3的S11)。
在此,n为满足n≥3的整数。
n优选为5以上,更优选为10以上,进一步优选为50以上,更加优选为100以上,进一步更优选为500以上。如果能够对更多的扩增候选区域设计供多重PCR的引物,则会变得更容易满足所需区域数。
此外,如上所述,即使对所有的n个扩增候选区域附加了优先序位,也并非能够对所有n处的扩增候选区域设计供多重PCR的引物。
<第1优先序位设定工序/第2优先序位设定工序>
在上述n个扩增候选区域中,将具有最小的坐标rmin的扩增候选区域设为Rmin,将具有最大的坐标rmax的扩增候选区域设为Rmax。
《第1优先序位设定工序》
第1优先序位设定工序是对上述扩增候选区域Rmin及上述扩增候选区域Rmax这2个扩增候选区域中的一方附加优先序位1位的工序(图2的S12;图3的S12’)。
即,对扩增候选区域Rmin附加优先序位1位或者对扩增候选区域Rmax附加优先序位1位。
《第2优先序位设定工序》
第2优先序位设定工序是对上述扩增候选区域Rmin及上述扩增候选区域Rmax这2个扩增候选区域中的除了附加了上述优先序位1位的一方之外的另一方附加优先序位2位的工序(图2的S13;图3的S13’)。
即,在上述第1优先序位设定工序中,在对扩增候选区域Rmin附加了优先序位1位时,对扩增候选区域Rmax附加优先序位2位,在上述第1优先序位设定工序中,在对扩增候选区域Rmax附加了优先序位1位时,对扩增候选区域Rmin附加优先序位2位。
<第k优先序位设定工序>
在第k优先序位设定工序中,在已经附加了自1位至(k-1)位的优先序位的情况下,对于具有最接近附加了优先序位i位的扩增候选区域Ri及附加了优先序位j位的扩增候选区域Rj的中点的坐标(ri+rj)/2的坐标值的扩增候选区域,附加优先序位k位(图2及图3的S14~S16)。在此,ri及rj分别为扩增候选区域Ri及扩增候选区域Rj的坐标。
在扩增候选区域Ri及扩增候选区域Rj的组合存在2组以上的情况下,可以任意选择1组,也可以采用优先选择坐标小的区域或优先选择坐标大的区域等策略。
在具有最接近坐标(ri+rj)/2的坐标值的扩增候选区域存在2处的情况下,可以任意选择1处,也可以采用优先选择坐标小的区域或优先选择坐标大的区域等策略。
此外,在上述扩增候选区域Ri及上述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域。另外,R1为上述第1优先序位设定工序中附加了优先序位1位的Rmin或Rmax,R2为上述第2优先序位设定工序中附加了优先序位2位的Rmin或Rmax。
k为满足3≤k≤n的整数。
i及j为1≤i≤k-1,1≤j≤k-1,且i≠j。
ri及rj为rmin≤ri≤rmax,rmin≤ri≤rmax,且ri≠rj。
自k=3至k=n依次重复第k优先序位设定工序(图2及图3的S14~S16)。
在没有能够附加优先序位的扩增候选区域时,结束优先序位的设定。
进而,输出扩增候选区域的识别信息及优先序位信息(图2及图3的S17)。
此外,以优先序位不发生重复的方式进行对扩增候选区域的优先序位的设定。
<基于图7进行说明>
参照图7具体地说明。
图7中,为了简便起见,同一染色体DNA上的扩增候选区域R01~R09的9处扩增候选区域按自左至右坐标变大的顺序等间隔排列。
(1)对坐标最小的R01附加了优先序位1位。
(2)对坐标最大的R09附加了优先序位2位。
(3)对相当于R01和R09的中点的R05附加了优先序位3位。
(4)对相当于R01和R05的中点的R03附加了优先序位4位。
(5)对相当于R05和R09的中点的R07附加了优先序位5位。
(6)对相当于R01和R03的中点的R02附加了优先序位6位。
(7)对相当于R05和R07的中点的R06附加了优先序位7位。
(8)对相当于R03和R05的中点的R04附加了优先序位8位。
(9)由于没有了尚未附加序位的扩增候选区域,因此结束序位附加。
<本发明的第一方式的有益效果>
对比图6及图7进行说明。
在图6及图7中,对R01~R09的扩增候选区域附加自1位至9位的优先序位。
附加了优先序位的扩增候选区域中,按照优先序位制作用于对5处扩增候选区域进行扩增的引物。
在实际的染色体DNA中,R02、R03、及R04有缺损。
因此,在图6中,想要制作引物并扩增的扩增候选区域中,3处(R02、R03、及R04)的扩增失败。能够扩增的扩增候选区域不满足所需区域数的可能性大。
但是,在图7中,想要制作引物并扩增的扩增候选区域中,只有1处(R03)的扩增失败。能够扩增的扩增候选区域满足所需区域数的可能性大。
[2.本发明的第二方式]
本发明的第二方式是对产生通过多重PCR进行的扩增失败的扩增对象区域、不能确保基因分型等分析所需的区域数这第一个问题提供另外一种解决方案。下面,适当地参照图1、图4及图5进行说明。
本发明的第二方式是一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物。
利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位。
通过输入装置14输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置12的工序(图4的S21)。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12的第1优先序位设定工序(图4的S22)。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为k-1位的扩增候选区域的识别名Rk-1及坐标值rk-1,计算T=rk-1+t(图4的S24),
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rk-1+t以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位(图4的S25及S26),并存储于存储装置12,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果不存在满足该条件的扩增候选区域,则对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位(图4的S25及S27),并存储于存储装置12,
当T=rk-1+t>rmax时,对坐标值为Rmin以上、且具有最小坐标值的尚未被附加优先序位的扩增候选区域附加优先序位k位(图4的S25及S27),并存储于存储装置12的第k优先序位设定工序。
自k=2至n重复上述第k优先序位设定工序(图4的S23~S28)。
其中,n为满足3≤n的整数,k为满足2≤k≤n的整数,t为满足t>0的实数、rk-1≠rk,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
另外,也可以如图5所示,如下操作来附加优先序位1位。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12的第1优先序位设定工序(图5的S22’)。
本发明的第二方式是一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其特征在于,通过包括扩增候选区域选择工序、第1优先序位设定工序和第k优先序位设定工序、且自k=2至k=n依次重复第k优先序位设定工序的附加优先序位的方法来附加上述优先序位。
<扩增候选区域选择工序>
扩增候选区域选择工序是选择同一染色体DNA上的n个扩增候选区域的工序。
在此,n为满足n≥3的整数。
n优选为5以上,更优选为10以上,进一步优选为50以上,更加优选为100以上,进一步更优选为500以上。如果能够对更多的扩增候选区域设计供多重PCR的引物,则会变得更容易满足所需区域数。
此外,如上所述,即使对所有的n个扩增候选区域附加了优先序位,也并非能够对所有的n处扩增候选区域设计供多重PCR的引物。
<第1优先序位设定工序>
在上述n个扩增候选区域中,将具有最小的坐标rmin的扩增候选区域设为Rmin,将具有最大的坐标rmax的扩增候选区域设为Rmax。输入扩增候选区域n个识别信息及坐标信息(图4及图5的S21)。
第1优先序位设定工序是对存在于上述扩增候选区域Rmin及上述扩增候选区域Rmax这2个扩增候选区域之间、且具有满足rmin≤r1≤rmax的坐标r1的扩增候选区域R1附加优先序位1位的工序(图4的S22;图5的S22’)。
即,可以对扩增候选区域Rmin附加优先序位1位,也可以对扩增候选区域Rmax附加优先序位1位,还可以对与扩增候选区域Rmin及扩增候选区域Rmax中任一区域不同的扩增候选区域附加优先序位1位。
只要R1的坐标r1满足rmin≤r1≤rmax即可,没有特别限定,优选为rj=rmin或r1=rmax,更优选为rj=rmin。
<第k优先序位设定工序>
在第k优先序位设定工序中,在已经附加了自1位至(k-1)位的优先序位的情况下,对满足规定的条件的扩增候选区域附加优先序位k位(图4及图5的S23~S28)。
如下操作来确定上述满足规定的条件的扩增候选区域。
将附加了优先序位(k-1)位的扩增候选区域Rk-1的坐标设为rk-1,考虑对其加上阈值t的值“T=rk-1+t”。在此,t为满足t>0的实数,在本发明中有时称为“阈值”。
由于扩增候选区域的坐标的最大值为rmax,因此划分为下面的(1)及(2)这2种情况。
(1)T=rk-1+t≤rmax的情况
(2)T=rk-1+t>rmax的情况
进而,对于上述(1)的情况,根据坐标rk-1+t和rmax之间是否存在尚未被附加优先序位的扩增候选区域,划分为下面的(1)-1及(1)-2这2种情况。
(1)-1存在尚未被附加优先序位的扩增候选区域的情况
(1)-2不存在尚未被附加优先序位的扩增候选区域的情况
在相当于上述(1)-1的情况下,对坐标为(rk-1+t)以上且具有最小坐标值的、尚未被附加优先序位的扩增候选区域附加优先序位k位。
在这种情况下,t表示优先序位(k-1)位的扩增候选区域Rk-1与优先序位k位的扩增候选区域Rk之间的距离。t越大,Rk-1与Rk之间的距离也变得越大,通常相互影响变小。
在相当于上述(1)-2或者上述(2)的情况下,对坐标为rmin以上且具有最小坐标值的、尚未被附加优先序位的扩增候选区域附加优先序位k位。
k为满足2≤k≤n的整数。
t为满足t>0的实数,可根据染色体DNA尺寸、或扩增候选区域的坐标等适当设定,优选为100,000以上、更优选为1,000,000以上、进一步优选为5,000,000以上。
自k=2至k=n依次重复第k优先序位设定工序。
在没有可附加优先序位的扩增候选区域时,结束优先序位的设定。
此外,以优先序位不发生重复的方式进行对扩增候选区域的优先序位的设定。
<基于图8进行说明>
参照图8具体地说明。
图8中,为了简便起见,同一染色体DNA上的扩增候选区域R01~R09的9处扩增候选区域按自左至右坐标变大的顺序等间隔排列。将该间隔设为1,000,000(碱基对),将阈值t设为4,000,000。
(1)对坐标最小的R01附加优先序位1位。
(2)对相当于R01的坐标加上4,000,000的坐标的R05附加优先序位2位。
(3)对相当于R05的坐标加上4,000,000的坐标的R09附加优先序位3位。
(4)由于相当于R09的坐标加上4,000,000的坐标的扩增候选区域不存在,因此对R01的坐标以上且具有最小的坐标的尚未被附加优先序位的扩增候选区域即R02附加优先序位4位。
(5)对相当于R02的坐标加上4,000,000的坐标的R06附加优先序位5位。
(6)由于相当于R06的坐标加上4,000,000的坐标的扩增候选区域不存在,因此对R01的坐标以上且具有最小坐标的尚未被附加优先序位的扩增候选区域即R03附加优先序位6位。
(7)对相当于R03的坐标加上4,000,000的坐标的R07附加优先序位7位。
(8)由于相当于R07的坐标加上4,000,000的坐标的扩增候选区域不存在,因此对R01的坐标以上且具有最小坐标的尚未被附加优先序位的扩增候选区域即R04附加优先序位8位。
(9)对相当于R04的坐标加上4,000,000的坐标的R08附加优先序位9位。
(10)由于没有了尚未附加序位的扩增候选区域,因此结束序位附加。
<本发明的第二方式的有益效果>
对比图6及图8进行说明。
在图6及图8中,对R01~R09的扩增候选区域附加自1位至9位的优先序位。
附加了优先序位的扩增候选区域中,按照优先序位制作用于对5处扩增候选区域进行扩增的引物。
在实际的染色体DNA中,R02、R03、及R04有缺损。
因此,在图6中,想要制作引物并扩增的扩增候选区域中,3处(R02、R03、及R04)的扩增失败。能够扩增的扩增候选区域不满足所需区域数的可能性大。
但是,在图8中,想要制作引物并扩增的扩增候选区域中,只有1处(R02)的扩增失败。能够扩增的扩增候选区域满足所需区域数的可能性大。
[3.本发明的第三方式]
本发明的第三方式是对产生通过多重PCR进行的扩增失败的扩增对象区域,不能确保基因分型等分析所需的区域数这第一个问题提供另外又一种解决方案。下面,适当地参照图1进行说明。
本发明的第三方式是一种供多重PCR的引物的设计方法,其对同一染色体上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物。
利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位。
通过输入装置14输入同一染色体DNA上的n个扩增候选区域的识别信息及候选引物数信息,并存储于存储装置12的工序。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及候选引物数信息中检索候选引物数的数量第k少的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置12的第k优先序位设定工序。
自k=1至n重复上述第k优先序位设定工序。其中,n为满足n≥2的整数,k为满足1≤k≤n的整数。
由此,以使上述扩增候选区域中能够设计的候选引物的数量越少上述优先序位变得越高的方式来附加优先序位。
本发明的第三方式是一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其特征在于,以使上述扩增候选区域中能够设计的候选引物的数量越少上述优先序位变得越高的方式来附加优先序位。
参照图9及图10进行说明。
对于自R01至R09的各扩增候选区域,候选引物数如图9或图10所示。此外,候选引物是在后述的设计引物等的方法的“候选引物碱基序列制作”中所制作的候选引物的碱基序列。通常情况下,对于1个扩增候选区域,可制作多对用于对该扩增候选区域进行扩增的引物对。
图9是按目前方法从坐标小的区域起依次对扩增候选区域附加优先序位。在按坐标顺序依次附加优先序位的情况下,随着扩增候选区域数增加,互补性的条件变得严格,因此,在原本候选数少的R07及R08中,对与用于对其他扩增候选区域进行扩增的引物的引物二聚体形成性等进行了研究,结果作为可用于多重PCR的引物而采用的引物对变得过少,其结果是,扩增失败的可能性变大。
图10是按照本发明的第三方式、按照候选引物数少的顺序对扩增候选区域附加优先序位。在按照候选引物数少的顺序附加优先序位的情况下,随着区域数增加,互补性的条件变得严格,但由于原本的候选数多,因此对与用于对其他扩增候选区域进行扩增的引物的引物二聚体形成性等进行了研究,结果作为可用于多重PCR的引物而采用的引物对不会变得过少,其结果是,与目前方法相比扩增成功的可能性变大。
[4]本发明的第四方式
本发明的第四方式是对即使能够确保基因分型等分析所需的区域数也不能实现高精度这一问题提供解决方案。下面,适当参照图1进行说明。
本发明的第四方式是一种供多重PCR的引物的设计方法,其对扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物。
利用包括以下工序的对染色体DNA上的扩增候选区域附加优先序位的方法来附加上述优先序位。
通过输入装置14输入染色体DNA上的n个扩增候选区域的识别信息及变异频率信息,并存储于存储装置12的工序。
运算装置11根据存储装置所存储的上述扩增候选区域的识别信息及变异频率信息计算具有识别名Ri及变异频率VFi的扩增候选区域的变异频率差=|0.5-VFi|,检索变异频率差第k个小的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置12的第k优先序位设定工序。
自k=1至n重复上述第k优先序位设定工序。其中,n为满足n≥2的整数,k为满足1≤k≤n的整数。
由此,以使上述扩增候选区域所含的变异的变异频率越接近0.5上述优先序位变得越高的方式来附加优先序位。
本发明的第四方式是一种供多重PCR的引物的设计方法,其对扩增候选区域附加优先序位,按照上述优先序位设计用于对上述扩增候选区域进行PCR扩增的引物,其特征在于,以使上述扩增候选区域所含的变异的变异频率越接近0.5上述优先序位变得越高的方式来附加上述优先序位。
参照图11及图12进行说明。
对于自R01至R09的各扩增候选区域,SNP(Single Nucleotide Polymorphism;单碱基多态性)的V.F.(Variant Frequency;变异频率)及ΔV.F.(与变异频率0.5之差的绝对值)如图11及图12所示。
对自R01至R09的扩增候选区域附加优先序位1位至9位,当对上位5处的扩增候选区域制作引物,进行通过多重PCR的扩增、SNP分型及母子判定,并计算母子判定的准确度时,图11所示的例子比图12所示的例子的准确度高、精度差。为了在图11所示的例子中降低准确度、改善精度,需要增加SNP座位数、即扩增候选区域数。特别是在从单一细胞中提取的微量且无冗余度的基因组DNA等中,由于存在有时难以增加通过多重PCR同时进行扩增的区域数或座位数的情况,因此要求以更少的区域数或座位数实现更高的精度。
[供多重PCR的引物的设计方法]
在对扩增候选区域设定了设计引物的顺序即优先序位后,利用以下说明的供多重PCR的引物的设计方法设计用于对所期望的扩增候选区域进行PCR扩增的引物。
<供多重PCR的引物的设计方法(1)>
在本发明的供多重PCR的引物的设计方法(1)(以下,有时简称为“设计方法(1)”。)中,对扩增候选区域设定优先序位后,进行以下的工序。
(a)对象区域选择工序,从设定了优先序位的扩增候选区域中按优先序位的顺序选择对象区域。
(b)候选引物碱基序列制作工序,基于基因组DNA上的上述对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述对象区域进行PCR扩增的候选引物的碱基序列。
(c)局部比对工序,对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d)第一阶段选拔工序,基于上述局部比对评分,进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e)全局比对工序,对于所有从上述第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f)第二阶段选拔工序,基于上述全局比对评分,进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g)引物采用工序,采用在上述第一阶段选拔工序及上述第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述对象区域进行PCR扩增的引物的碱基序列。
其中,在上述(a)工序~上述(g)工序中,上述(c)工序及上述(d)工序两工序与上述(e)工序及上述(f)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c)工序及上述(d)工序后进行上述(e)工序及上述(f)工序,也可以在进行上述(e)工序及上述(f)工序后进行上述(c)工序及上述(d)工序,也可以同时进行上述(c)工序及上述(d)工序与上述(e)工序及上述(f)工序。
在进行上述(e)工序及上述(f)工序后进行上述(c)工序及上述(d)工序的情况下,优选上述(e)工序及上述(c)工序分别设为下述(e’)工序及下述(c’)工序。
(e’)全局比对工序,对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c’)局部比对工序,对于所有从上述第二阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c)工序及上述(d)工序与上述(e)工序及上述(f)工序的情况下,优选上述(e)工序设为下述(e’)工序。
(e’)全局比对工序,对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
<供多重PCR的引物的设计方法(2)>
在本发明的供多重PCR的引物的设计方法(2)(以下,有时简称为“设计方法(2)”。)中,对扩增候选区域设定优先序位后,进行以下的工序。
(a1)对象区域选择第1工序,从设定了优先序位的扩增候选区域中选择优先序位最高的扩增候选区域作为第1对象区域。
(b1)候选引物碱基序列制作第1工序,基于基因组DNA上的上述第1对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列。
(c1)局部比对第1工序,对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比对的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d1)第一阶段选拔第1工序,基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e1)全局比对第1工序,对于所有从上述第一阶段选拔第1工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的含有2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f1)第二阶段选拔第1工序,基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增候选引物的碱基序列的第二阶段的选拔。
(g1)引物采用第1工序,采用在上述第一阶段选拔第1工序及上述第二阶段选拔第1工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增的引物的碱基序列。
(a2)对象区域选择第2工序,从设定了优先序位的扩增候选区域中尚未选择的扩增候选区域中选择优先序位最高的扩增候选区域作为第2对象区域。
(b2)候选引物碱基序列制作第2工序,基于基因组DNA上的上述第2对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列。
(c2)局部比对第2工序,对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d2)第一阶段选拔第2工序,基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e2)全局比对第2工序,对于所有从上述第一阶段选拔第2工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f2)第二阶段选拔第2工序,基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g2)引物采用第2工序,采用在上述第一阶段选拔第2工序及上述第二阶段选拔第2工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
其中,在上述(a1)工序~上述(g1)工序中,上述(c1)工序及上述(d1)工序两工序与上述(e1)工序及上述(f1)工序两工序可以是任意顺序或同时进行。即,可以在进行上述(c1)工序及上述(d1)工序后进行上述(e1)工序及上述(f1)工序,也可以在进行上述(e1)工序及上述(f1)工序后进行上述(c1)工序及上述(d1)工序,也可以同时进行上述(c1)工序及上述(d1)工序与上述(e1)工序及上述(f1)工序。
在进行上述(e1)工序及上述(f1)工序后进行上述(c1)工序及上述(d1)工序的情况下,优选上述(e1)工序及上述(c1)工序分别设为下述(e1’)工序及下述(c1’)工序。
(e1’)全局比对第1工序,对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c1’)局部比对第1工序,对于所有从上述第二阶段选拔第1工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c1)工序及上述(d1)工序与上述(e1)工序及上述(f1)工序的情况下,优选上述(e1)工序设为下述(e1’)工序。
(e1’)全局比对第1工序,对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
其中,在上述(a2)工序~上述(g2)工序中,上述(c2)工序及上述(d2)工序两工序与上述(e2)工序及上述(f2)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c2)工序及上述(d2)工序后进行上述(e2)工序及上述(f2)工序,也可以在进行上述(e2)工序及上述(f2)工序后进行上述(c2)工序及上述(d2)工序,也可以同时进行上述(c2)工序及上述(d2)工序与上述(e2)工序及上述(f2)工序。
在进行上述(e2)工序及上述(f2)工序后进行上述(c2)工序及上述(d2)工序的情况下,优选上述(e2)工序及上述(c2)工序分别设为下述(e2’)工序及下述(c2’)工序。
(e2’)全局比对第2工序,对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c2’)局部比对第2工序,对于所有从上述第二阶段选拔第2工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c2)工序及上述(d2)工序与上述(e2)工序及上述(f2)工序的情况下,优选上述(e2)工序设为下述(e2’)工序。
(e2’)全局比对第2工序,对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
进而,在上述至少1个目标区域包含3个以上的目标区域的情况下,在采用用于对尚未从上述3个以上的目标区域中选择的第3以后的对象区域进行PCR扩增的引物的碱基序列时,对于上述第3以后的对象区域,重复上述(a2)工序~上述(g2)工序为止的各工序。
<供多重PCR的引物的设计方法(3)>
在本发明的供多重PCR的引物的设计方法(3)(以下,有时简称为“设计方法(3)”。)中,对扩增候选区域设定优先序位后,进行以下的工序,在其变形例中,在(b-0)多个候选引物碱基序列制作工序后,且在(c-1)第1局部比对工序之前,对扩增候选区域设定优先序位,进行(c-1)第1局部比对工序以后的工序。
(a-0)多个对象区域选择工序,从设定了优先序位的扩增候选区域中按照优先序位高的顺序选择多个对象区域。
(b-0)多个候选引物碱基序列制作工序,基于基因组DNA上的上述多个对象区域的各自的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述多个对象区域的各个区域进行PCR扩增的候选引物的碱基序列。
在(b-0)多个候选引物碱基序列制作工序后,设定对扩增候选区域设计引物的顺序即优先序位。设定后,进行(c-1)第1局部比对工序以后的工序。
此外,也可以取代(b-0)多个候选引物碱基序列制作工序后,在(a-0)多个对象区域选择工序之前设定优先序位。
(c-1)第1局部比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d-1)第1第一阶段选拔工序,基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e-1)第1全局比对工序,对于从上述第1第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的所有组合,针对上述组合所含的含有2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f-1)第1第二阶段选拔工序,基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g-1)第1引物采用工序,采用在上述第1第一阶段选拔工序及上述第1第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增的引物碱基序列。
(c-2)第2局部比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d-2)第2第一阶段选拔工序,基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e-2)第2全局比对工序,对于所有从上述第2第一阶段选拔工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f-2)第2第二阶段选拔工序,基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g-2)第2引物采用工序,采用在上述第2第一阶段选拔工序及上述第2第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
其中,在上述(c-1)工序~上述(g-1)工序中,上述(c-1)工序及上述(d-1)工序两工序与上述(e-1)工序及上述(f-1)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c-1)工序及上述(d-1)工序后进行上述(e-1)工序及上述(f-1)工序,也可以在进行上述(e-1)工序及上述(f-1)工序后进行上述(c-1)工序及上述(d-1)工序,也可以同时进行上述(c-1)工序及上述(d-1)工序与上述(e-1)工序及上述(f-1)工序。
在进行上述(e-1)工序及上述(f-1)工序后进行上述(c-1)工序及上述(d-1)工序的情况下,优选上述(e-1)工序及上述(c-1)工序分别设为下述(e’-1)工序及下述(c’-1)工序。
(e’-1)第1全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c’-1)第1局部比对工序,对于从上述第1第二阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的所有组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c-1)工序及上述(d-1)工序与上述(e-1)工序及上述(f-1)工序的情况下,优选上述(e-1)工序设为下述(e’-1)工序。
(e’-1)第1全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
其中,在上述(c-2)工序~上述(g-2)工序中,上述(c-2)工序及上述(d-2)工序两工序与上述(e-2)工序及上述(f-2)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c-2)工序及上述(d-2)工序后进行上述(e-2)工序以及上述(f-2)工序,也可以在进行上述(e-2)工序及上述(f-2)工序后进行上述(c-2)工序及上述(d-2)工序,也可以同时进行上述(c-1)工序及上述(d-1)工序与上述(e-1)工序及上述(f-1)工序。
在进行上述(e-2)工序及上述(f-2)工序后进行上述(c-2)工序及上述(d-2)工序的情况下,优选上述(e-2)工序及上述(c-2)工序分别设为下述(e’-2)工序及下述(c’-2)工序。
(e’-2)第2全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c’-2)第2局部比对工序,对于所有从上述第2第二阶段选拔工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c-2)工序及上述(d-2)工序与上述(e-2)工序及上述(f-2)工序的情况下,优选上述(e-2)工序设为下述(e’-2)工序。
(e’-2)第2全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
进而,在上述至少1个扩增候选区域包含3个以上的扩增候选区域,且在上述多个对象区域选择工序中选择3个以上的对象区域,并且上述多个候选引物碱基序列制作工序中制作用于对上述3个以上对象区域的各个对象区域进行PCR扩增的候选引物的碱基序列的情况下,在采用用于对优先序位3位以后的第3以后的对象区域进行PCR扩增的引物的碱基序列时,对于上述第3以后的对象区域,重复自上述第2局部比对工序至上述第2引物采用工序为止的各工序。
<各工序的说明>
对于本发明的供多重PCR的引物的设计方法(1)~(3),对各工序进行说明。
《优先序位的设定工序》
(设计方法(1):优先序位的设定工序S100)
在图13中,示为“优先序位的设定”。
按照本发明的优先序位的设定方法,设定扩增候选区域的优先序位。
(设计方法(2):优先序位的设定工序S200)
在图14中,示为“优先序位的设定”。
按照本发明的优先序位的设定方法,设定扩增候选区域的优先序位。
(设计方法(3):优先序位的设定工序S300)
在图15和图16中,示为“优先序位的设定”。
按照本发明的优先序位的设定方法,设定扩增候选区域的优先序位。
《对象区域选择工序》
在本说明书中,有时将对象区域选择工序S101(图13)、对象区域选择第1工序S201及对象区域选择第2工序S211(图14)、以及多个对象区域选择工序S301(图15和图16)进行统称,简称为“对象区域选择工序”。
(设计方法(1):对象区域选择工序S101)
在图13中,示为“对象区域选择”。
在设计方法(1)中,(a)对象区域选择工序是从设定了优先序位的扩增候选区域中按照优先序位的顺序选择对象区域的工序。
(设计方法(2):对象区域选择第1工序S201及对象区域选择第2工序S211)
在图14中,示为“对象区域选择第1”及“对象区域选择第2”。
在设计方法(2)中,(a1)对象区域选择第1工序是从设定了优先序位的扩增候选区域中选择优先序位最高的扩增候选区域作为第1对象区域的工序,(a2)对象区域选择第2工序是从设定了优先序位的扩增候选区域中尚未被选择的扩增候选区域中选择优先序位最高的扩增候选区域作为第2对象区域的工序。
在设计方法(2)中,按照优先序位的顺序一个一个地选择扩增候选区域。
(设计方法(3):多个对象区域选择工序S301)
在图15和图16中,示为“多个对象区域选择”。
在设计方法(3)及其变形例中,(a-0)多个对象区域选择工序是从设定了优先序位的扩增候选区域中按照优先序位高的顺序选择多个对象区域的工序。
在设计方法(3)及其变形例中,按照优先序位的顺序选择多个扩增候选区域。优选选择设定了优先序位的所有扩增候选区域。
《候选引物碱基序列制作工序》
在本说明书中,有时将候选引物碱基序列制作工序S102(图13)、候选引物碱基序列制作第1工序S202及候选引物碱基序列制作第2工序S212(图14)、以及多个候选引物碱基序列制作工序S302(图15和图16)进行统称,简称为“候选引物碱基序列制作”。
(设计方法(1):候选引物碱基序列制作工序S102)
在图13中,示为“候选引物碱基序列制作”。
在设计方法(1)中,(b)候选引物碱基序列制作工序是如下工序:基于基因组DNA上的上述对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对对象区域进行PCR扩增的候选引物的碱基序列。
(设计方法(2):候选引物碱基序列制作第1工序S202及候选引物碱基序列制作第2工序S212)
在图14中,示为“候选引物碱基序列制作第1”及“候选引物碱基序列制作第2”。
在设计方法(2)中,(b1)候选引物碱基序列制作第1工序是如下工序:基于基因组DNA上的上述第1的对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对第1对象区域进行PCR扩增的候选引物的碱基序列,(b2)候选引物碱基序列制作第2工序是如下工序:基于基因组DNA上中的上述第2对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对第2对象区域进行PCR扩增的候选引物的碱基序列。
在设计方法(2)中,对于1个对象区域进行候选引物的碱基序列的制作、候选引物的选拔、及引物的采用,对于其后的1个对象区域,重复相同的工序。
(设计方法(3):多个候选引物碱基序列制作工序S302)
在图15和图16中,示为“多个候选引物碱基序列制作”。
在设计方法(3)及其变形例中,(b-0)多个候选引物碱基序列制作工序是如下工序:基于基因组DNA上的上述多个对象区域的各自的两端的各附近区域的碱基序列,分别制作至少各一个用于对多个对象区域的各个对象区域进行PCR扩增的候选引物的碱基序列。
在设计方法(3)及其变形例中,对于多个对象区域的所有对象区域,制作候选引物的碱基序列,通过以后的工序重复进行选拔及采用。
(附近区域)
所谓对象区域的两端的各附近区域是指对自对象区域的5’端起的外侧的区域、及自对象区域的3’端起的外侧的区域进行统称。对象区域的内侧不包括在附近区域内。
对附近区域的长度没有特别限定,优选为能通过PCR扩展的长度以下,更优选为期望扩增的DNA片段长度的上限以下。特别优选为容易进行集中选择和/或序列读取的长度。可以根据PCR中使用的酶(DNA聚合酶)的种类等进行适当变更。具体的附近区域的长度优选为20~500个碱基左右、更优选为20~300个碱基左右、进一步优选为20~200个碱基左右、更进一步优选为50~200个碱基左右。
(引物的设计参数)
另外,制作候选引物的碱基序列时,与通常的引物设计方法中需要注意的事项相同,如引物的长度、GC含量(指所有核酸碱基中的鸟嘌呤(G)及胞嘧啶(C)的合计摩尔百分率。)、解链温度(指双链DNA的50%解离而成为单链DNA的温度。另外,有时也源于MeltingTemperature,称为“Tm值”。单位为“℃”。)、以及序列的偏移等。
●引物的长度
对引物的长度(核苷酸数)没有特别限定,优选为15mer~45mer、更优选为20mer~45mer、进一步优选为20mer~30mer。当引物的长度为该范围内时,易于设计特异性及扩增效率优异的引物。
●引物的GC含量
对引物的GC含量没有特别限定,优选为40摩尔%~60摩尔%、更优选为45摩尔%~55摩尔%。当GC含量为该范围内时,不易产生由高级结构引起的特异性及扩增效率下降的问题。
●引物的Tm值
对引物的Tm值没有特别限定,优选为50℃~65℃的范围内、更优选为55℃~65℃的范围内。
对于引物的Tm值之差,在引物对及引物组中,优选设为5℃以下、更优选设为3℃以下。
Tm值可用OLIGO Primer Analysis Software(Molecular Biology Insig hts公司制)或Primer3(http://www-genome.wi.mit.edu/ftp/distribution/software/)等软件进行计算。
另外,也可以根据引物的碱基序列中的A、T、G及C的数量(分别设为nA、nT、nG及nC),利用下述式通过计算来求得。
Tm值(℃)=2(nA+nT)+4(nC+nG)
Tm值的计算方法并不限定于此,可以利用现有公知的各种方法来计算Tm值。
●引物的碱基的偏移
候选引物的碱基序列优选设为整体上碱基无偏移的序列。例如,希望避免局部富含GC的序列及局部富含AT的序列。
另外,还希望避免T和/或C的连续(聚嘧啶)、以及A和/或G的连续(聚嘌呤)。
●引物的3’末端
进而,优选3’末端碱基序列避免富含GC的序列或富含AT的序列。3’末端碱基优选G或C,但并不限定于此。
《特异性检查工序》
基于在“候选引物碱基序列制作”中制作的各候选引物的碱基序列与染色体DNA的序列互补性,可以实施评价候选引物的碱基序列的特异性的特异性检查工序(未图示)。
特异性的检查进行染色体DNA的碱基序列与候选引物的碱基序列的局部比对,在局部比对评分小于预先设定的值的情况下,可评价为该候选引物的碱基序列与基因组DNA的互补性低、特异性高。在此,希望对染色体DNA的互补链也进行局部比对。这是因为相对于引物是单链DNA,染色体DNA是双链。另外,也可以使用与其互补的碱基序列取代候选引物的碱基序列。
另外,可以将候选引物的碱基序列作为查询序列,对基因组DNA碱基序列数据库进行同源性检索。作为同源性检索工具,例如,可举出:BLAST(Basic Local AlignmentSearch Tool:基于局部比对算法的搜索工具)(Altschul,S.A.,另外4名,“Basic LocalAlignment Search Tool”,Journal of Molecular Biology,1990年,10月,第215卷,p.403-410)及FASTA(Pearson,W.R.,另外1名,“Improved tools for biologicalsequence comparison”,美国科学院纪要,美国科学院,1988年,4月,第85卷,p.2444-2448)等。作为进行同源性检索而得到的结果,可获得局部比对。
评分及局部比对评分的阈值均没有特别限定,可根据候选引物的碱基序列的长度、和/或PCR条件等适当设定。在使用同源性检索工具的情况下,可以使用该同源性检索工具的默认值。
例如,作为评分,可考虑采用匹配(互补碱基)=+1、不匹配(非互补碱基)=-1、indel(插入和/或缺失)=-3,将阈值设定为+15等。
在候选引物的碱基序列与染色体DNA上非设想的位置的碱基序列具有互补性、且特异性低的情况下,使用该碱基序列的引物进行PCR时,有时不是对对象区域进行扩增而是对伪像(artifact)进行扩增,因此不包括这种情况。
《局部比对工序》
在本说明书中,有时将局部比对工序S103(图1)、局部比对第1工序S203及局部比对第2工序S213(图14)、以及第1局部比对工序S303及第2局部比对工序S313(图15和图16)进行统称,简称为“局部比对工序”。
(设计方法(1):局部比对工序S103)
在图13中,示为“局部比对”。
在设计方法(1)中,(c)局部比对工序是如下工序:对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(设计方法(2):局部比对第1工序S203及局部比对第2工序S213)
在图14中,示为“局部比对第1”及“局部比对第2”。
在设计方法(2)中,(c1)局部比对第1工序是如下工序:对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对,从而求出局部比对评分,(c2)局部比对第2工序是如下工序:对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(设计方法(3):第1局部比对工序S303及第2局部比对工序S313)
在图15和图16中,示为“第1局部比对”及“第2局部比对”。
在设计方法(3)及其变形例中,(c-1)第1局部比对工序是如下工序:对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对,从而求出局部比对评分,(c-2)第2局部比对工序是如下工序:对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(局部比对的方法)
进行局部比对的碱基序列的组合可以是允许重复而选择的组合,也可以是不允许重复而选择的组合,在尚未评价同一碱基序列的引物间的引物二聚体形成性的情况下,优选允许重复而选择的组合。
对于组合的总数,将进行局部比对的碱基序列的总数设为x个,在允许重复而选择的情况下,为“xH2=x+1C2=(x+1)!/2(x-1)!”,在不允许重复而选择的情况下,为“xC2=x(x-1)/2”。
局部比对是对部分序列进行的比对,可局部检查互补性高的部分。
其中,在本发明中,与通常对碱基序列进行的局部比对不同,在“进行比较的部分序列包含碱基序列的3’末端”的条件下进行局部比对,以使进行比较的部分序列包含双方的碱基序列的3’末端。
进而,在本发明中,优选方式是,在“进行比较的部分序列包含碱基序列的3’末端”的条件、即“仅考虑进行比较的部分序列自一方的序列的3’末端开始至另一方的序列的3’末端结束的比对”的条件下进行局部比对,以使进行比较的部分序列包含双方的碱基序列的3’末端。
此外,局部比对可以插入间隙。间隙是指碱基的插入和/或缺失(indel)。
另外,局部比对将碱基序列对间碱基互补的情况设定为一致(匹配),将不互补的情况设定为不一致(不匹配)。
以分别对匹配、不匹配及插入缺失评分、使总评分成为最大的方式进行比对。评分适当设定即可。例如,可以如下述表1那样设定评分。此外,表1中“-”表示间隙(插入和/或缺失(indel))。
[表1]
表1
例如,考虑对于以下表2所示的序列编号1及2的碱基序列进行局部比对。在此,评分设定如表1所示。
[表2]
表2
根据序列编号1及2的碱基序列制作表3所示的圆点阵列(点阵)。具体而言,将序列编号1的碱基序列按自5’至3’的方向从左向右排列,将序列编号2的碱基序列按自5’至3’的方向从下向上排列,对碱基为互补性的格子记入“●”,从而获得表3所示的点阵。
[表3]
表3
根据表3所示的点阵,获得以下表4所示的部分序列的比对(双序列比对)(参照表3的斜线部分)。此外,表4中,分别用“|”表示匹配,用“:”表示不匹配。
[表4]
表4
在该(双序列)比对中,有9处匹配,有8处不匹配,没有indel(间隙)。
因此,基于该(双序列)比对的局部比对评分成为(+1)×9+(-1)×8+(-1)×0=+1。
此外,比对(双序列比对)不仅可利用在此例示的点阵法来获得,而且可利用动态规划法、单词法、或其他各种方法来获得。
《第一阶段选拔工序》
在本说明书中,有时将第一阶段选拔工序S104(图13)、第一阶段选拔第1工序S204及第一阶段选拔第2工序S214(图14)、以及n第1第一阶段选拔工序S304及第2第一阶段选拔工序S314(图15和图16)进行统称,简称为“第一阶段选拔工序”。
(设计方法(1):第一阶段选拔工序S104)
在图13中,示为“第一阶段选拔”。
在设计方法(1)中,(d)第一阶段选拔工序是如下工序:基于上述局部比对评分进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(设计方法(2):第一阶段选拔第1工序S204及第一阶段选拔第2工序S214)
在图14中,示为“第一阶段选拔第1”及“第一阶段选拔第2”。
在设计方法(2)中,(d1)第一阶段选拔第1工序是如下工序:基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔,(d2)第一阶段选拔第2工序是如下工序:基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(设计方法(3):第1第一阶段选拔工序S304及第2第一阶段选拔工序S314)
在图15和图16中,示为“第1第一阶段选拔”及“第2第一阶段选拔”。
在设计方法(3)及其变形例中,(d-1)第1第一阶段选拔工序是如下工序:基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔,(d-2)第2第一阶段选拔工序是如下工序:基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(第1阶段选拔的方法)
预先设定好局部比对评分的阈值(也称为“第1阈值”。)。
如果局部比对评分小于第1阈值,则判断这些2个碱基序列的组合的二聚体形成性低,进行以后的工序。
另一方面,如果局部比对评分为第1阈值以上,则判断这些2个碱基序列的组合的引物二聚体形成性高,对于该组合而言不进行以后的工序。
对第1阈值没有特别限定,可以适当设定。例如,可以根据成为聚合酶链反应的模板的基因组DNA的量等PCR条件来设定第1阈值。
在此,考虑在上述“局部比对工序”所示的例子中将第1阈值设定为“+3”的情况。
在上面的例子中,由于局部比对评分为“+1”,小于作为第1阈值的“+3”,因此可判断序列编号1及2的碱基序列的组合的引物二聚体形成性低。
此外,针对在局部比对工序S103、局部比对第1工序S203、局部比对第2工序S213、第1局部比对工序S303、或者第2局部比对工序S313中计算出局部比对评分的所有组合进行本工序。
《全局比对工序》
在本说明书中,有时将全局比对工序S105(图13)、全局比对第1工序S205及全局比对第2工序S215(图14)、以及第1全局比对工序S305及第2全局比对工序S315(图15和图16)进行统称,简称为“全局比对工序”。
(设计方法(1):全局比对工序S105)
在图13中,示为“全局比对”。
在设计方法(1)中,(e)全局比对工序是如下工序:对于所有从上述第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(设计方法(2):全局比对第1工序S205及全局比对第2工序S215)
在图14中,示为“全局比对第1”及“全局比对第2”。
在设计方法(2)中,(e1)全局比对第1工序是如下工序:对于所有从上述第一阶段选拔第1工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对,从而求出全局比对评分,(e2)全局比对第2工序是如下工序:对于所有从上述第一阶段选拔第2工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(设计方法(3):第1全局比对工序S305及第2全局比对工序S315)
在图15和图16中,示为“第1全局比对”及“第2全局比对”。
在设计方法(3)及其变形例中,(e-1)第1全局比对工序是如下工序:对于从上述第1第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的所有组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对,从而求出全局比对评分,(e-2)第2全局比对工序是如下工序:对于所有从上述第2第一阶段选拔工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(全局比对的方法)
从由“候选引物碱基序列制作”制作的全部候选引物(在首先进行了“局部比对工序”及“第1阶段选拔工序”的情况下,存在局部比对评分小于第1阈值的候选引物的组合时,为该组合所含的全部候选引物。)及全部已经采用的引物(限于存在已经采用的引物的情况)组成的组中取出2个引物,针对包含3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
进行全局比对的碱基排列的组合可以是允许重复而选择的组合,也可以是不允许重复而选择的组合,但在尚未评价同一碱基序列的引物间的引物二聚体形成性的情况下,优选允许重复而选择的组合。
对于组合的总数,将进行全局比对的碱基序列的总数设为x个,在允许重复而选择的情况下,为“xH2=x+1C2=(x+1)!/2(x-1)!”,在不允许重复而选择的情况下,为“xC2=x(x-1)/2”。
全局比对是对“整个序列”进行的比对,可检查整个序列的互补性。
其中,在此,“整个序列”是包含候选引物的碱基序列的3’末端的预先设定的序列长度的整个碱基序列。
此外,全局比对可以插入间隙。间隙是指碱基的插入和/或缺失(indel)。
另外,全局比对将碱基序列对间碱基互补的情况设定为一致(匹配),将不互补的情况设定为不一致(不匹配)。
以分别对匹配、不匹配及indel评分、使总评分成为最大的方式进行比对。评分适当设定即可。例如,可以如上述表1那样设定评分。此外,表1中“-”表示间隙(插入和/或缺失(indel))。
例如,对于以下的表5所示的序列编号1及2的碱基序列,考虑对各自的3’末端的3碱基(大写字母处)进行全局比对。在此,评分设定如表1所示。
[表5]
表5
当以使评分成为最大的方式对于序列编号1的碱基序列的3’末端的3碱基(大写字母处)及序列编号2的3’末端的3碱基(大写字母处)的碱基序列进行全局比对时,可获得以下的表6所示的比对(双序列比对)。此外,表6中,用“:”表示不匹配。
[表6]
表6
该(双序列)比对中,有3处不匹配,匹配及插入缺失(间隙)均没有。
因此,基于该(双序列)比对的全局比对评分成为(+1)×0+(-1)×3+(-1)×0=-3。
此外,比对(双序列比对)可利用点阵法、动态规划法、单词法、或者其他各种方法来获得。
《第二阶段选拔工序》
在本说明书中,有时将第二阶段选拔工序S106(图13)、第二阶段选拔第1工序S206及第二阶段选拔第2工序S216(图14)、以及第1第二阶段选拔工序S306及第2第二阶段选拔工序S316(图15和图16)进行统称,简称为“第二阶段选拔工序”。
(设计方法(1):第二阶段选拔工序S106)
在图13中,示为“第二阶段选拔”。
在设计方法(1)中,(f)第二阶段选拔工序是如下工序:基于上述全局比对评分,进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(设计方法(2):第二阶段选拔第1工序S206及第二阶段选拔第2工序S216)
在图14中,示为“第二阶段选拔第1”及“第二阶段选拔第2”。
在设计方法(2)中,(f1)第二阶段选拔第1工序是如下工序:基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔,(f2)第二阶段选拔第2工序是如下工序:基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(设计方法(3):第1第二阶段选拔工序S306及第2第二阶段选拔工序S316)
在图15和图16中,示为“第1第二阶段选拔”及“第2第二阶段选拔”。
在设计方法(3)及其变形例中,(f-1)第1第二阶段选拔工序是如下工序:基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔,(f-2)第2第二阶段选拔工序是如下工序:基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(第二阶段选拔的方法)
预先设定好全局比对评分的阈值(也称为“第2阈值”。)。
如果全局比对评分小于第2阈值,则判断这些2个碱基序列的组合的二聚体形成性低,进行以后的工序。
另一方面,如果全局比对评分为第2阈值以上,则判断这些2个碱基序列的组合的二聚体形成性高,对于该组合而言不进行以后的工序。
对第2阈值没有特别限定,可以适当设定。例如,可以根据成为聚合酶链反应的模板的基因组DNA的量等PCR条件来设定第2阈值。
此外,通过将引物的自3’末端起的多个碱基的碱基序列设定为同一碱基序列,可将对包含各引物的碱基序列的3’末端的预先设定的碱基数量的碱基序列以双序列进行全局比对而求出的全局比对评分设定为小于第2阈值。
在此,在上述“全局比对工序”所示的例子中,考虑将第2阈值设定为“+3”的情况。
在上面的例子中,由于全局比对评分为“-3”,小于作为第2阈值的“+3”。因此可判断序列编号1及2的碱基序列的组合的引物二聚体形成性低。
此外,针对在全局比对工序S105、全局比对第1工序S205、全局比对第2工序S215、第1全局比对工序S305、或第2全局比对工序S315中计算了全局比对评分的所有组合进行本工序。
另外,为了减少计算量,优选预先实施“全局比对工序”及“第2阶段选拔工序”两工序,针对通过了“第2阶段选拔工序”的引物的碱基序列的组合,实施“局部比对工序”及“第1阶段选拔工序”两工序。特别是,对象区域数越增加,候选引物的碱基排列数越增加,减少计算量的效果越好,从而可实现整体处理的高速化。
这是因为,由于在“全局比对工序”中对“预先设定的序列长度”的较短长度的碱基序列进行全局比对,因此,计算量少于在包含3’末端的条件下从整个碱基序列中找出互补性高的部分序列的局部比对评分,从而可快速进行处理。此外,在通常所知的算法中,已知如果是针对相同长度的序列的比对,则全局比对的速度比局部比对快。
《扩增序列长度检查工序》
针对在“第1阶段选拔工序”及“第2阶段选拔工序”中判断为引物二聚体形成性低的候选引物的碱基序列的组合,可以实施扩增序列长度检查工序,即,计算在染色体DNA上的候选引物的碱基序列的端部之间的距离,判断该距离是否为预先设定的范围内(未图示)。
如果碱基序列的端部之间的距离为预先设定的范围内,则可判断该候选引物的碱基序列的组合可以对对象区域适当地进行扩增的可能性大。对候选引物的碱基序列的端部之间的距离没有特别限定,可根据酶(DNA聚合酶)的种类等PCR条件适当设定。例如,可设定为100~200个碱基(对)的范围内、120~180个碱基(对)的范围内、140~180个碱基(对)的范围内、140~160个碱基(对)的范围内、160~180个碱基(对)的范围内等各种范围。
《引物采用工序》
在本说明书中,有时将引物采用工序S107(图13)、引物采用第1工序S207及引物采用第2工序S217(图14)、以及第1引物采用工序S307及第2引物采用工序S317(图15和图16)进行统称,简称为“引物采用工序”。
(设计方法(1):引物采用工序S107)
在图13中,示为“引物采用”。
在设计方法(1)中,(g)引物采用工序是如下工序:采用上述第一阶段选拔工序及上述第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述对象区域进行PCR扩增的引物的碱基序列。
(设计方法(2):引物采用第1工序S207及引物采用第2工序S217)
在图14中,示为“引物采用第1”及“引物采用第2”。
在设计方法(2)中,(g1)引物采用第1工序是如下工序:采用上述第一阶段选拔第1工序及上述第二阶段选拔第1工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增的引物的碱基序列,(g2)引物采用第2工序是如下工序:采用上述第一阶段选拔第2工序及上述第二阶段选拔第2工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
(设计方法(3):第1引物采用工序S307及第2引物采用工序S317)
在图15和图16中,示为“第1引物采用”及“第2引物采用”。
在设计方法(3)及其变形例中,(g-1)第1引物采用工序是如下工序:采用上述第1第一阶段选拔工序及上述第1第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增引物的碱基序列,(g-2)第2引物采用工序是如下工序:采用上述第2第一阶段选拔工序及上述第2第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
(引物采用的方法)
在引物采用工序中,采用如下所述的候选引物的碱基序列作为用于对对象区域进行扩增的引物的碱基序列,即,对于各候选引物的碱基序列,在进行比较的部分序列包含该碱基序列的3’末端的条件下,以双序列进行局部比对而求出的局部比对评分小于第1阈值,并且,对于包含各候选引物的碱基序列的3’末端的预先设定的碱基数量的碱基序列,以双序列进行全局比对而求出的全局比对评分小于第2阈值。
例如,考虑采用表7所示的序列编号1及2的碱基序列作为对对象区域进行扩增的引物的碱基序列。
[表7]
表7
如上所述,由于局部比对评分为“+1”,因此小于作为第1阈值的“+3”,另外,由于全局比对评分为“-3”,因此小于作为第2阈值的“+3”。
因此,可采用序列编号1所示的候选引物的碱基序列及序列编号2所示的候选引物的碱基序列作为用于对对象区域进行扩增的引物的碱基序列。
《其他扩增候选区域的引物设计》
在针对1个扩增候选区域采用引物后,可以进一步对其次优先序位的扩增候选区域设计引物。
在设计方法(1)中,在候选引物碱基序列制作工序S102中,如果制作了针对其次优先序位的扩增候选区域的候选引物的碱基序列,则自局部比对工序S103起进行。如果没有制作针对其次优先序位的扩增候选区域的候选引物的碱基序列,则由于在对象区域选择工序S101中没有选择其次优先序位的扩增候选区域,因此,在对象区域选择工序S101中选择其次优先序位的扩增候选区域,在候选引物碱基序列制作工序S102中,制作针对该扩增候选区域的候选引物的碱基序列后,进行局部比对工序S103以后的工序。
在设计方法(2)中,自对象区域选择第2工序S211起重复。
在设计方法(3)及其变形例中,由于已经在多个候选引物碱基序列制作工序S302中制作了针对在多个对象区域选择工序S301中选择的扩增候选区域的候选引物的碱基序列,因此自第2局部比对工序S313起重复。
《引物等的设计中的特征点》
对扩增候选区域附加优先序位后的引物等的设计中的特征点在于,概括地说,选择多个特定的对象区域,检索邻近的碱基序列,确认与已提取各引物组的互补性,选择互补性少的碱基序列,由此获得扩增对象包括对象区域、且相互不形成互补的引物组。
引物的碱基序列的互补性的确认中的特征点在于,以使用局部比对而使整个序列的互补性变低、且对引物的碱基序列的端部使用全局比对而使互补性变低的方式来制作引物组。
下面,利用实施例更具体地说明本发明,但本发明并不限定于这些实施例。
[实施例]
[比较例1/实施例1/实施例2]
<扩增候选区域的选择>
作为扩增候选区域,从人13号染色体上的区域中选择包含SNV(SingleNucleotide Variant;单碱基变异)的17处区域X01~X17。
下面的表8中示出扩增候选区域存在的染色体及SNV坐标、和在比较例1、实施例1、及实施例2中附加的各扩增候选区域的优先序位。在此,SNV坐标为基于GRCh37.p13(GenomeResource Consortium,human genome assembly data,Release 37,Patch 13;GenBankAccession no.CM000675.1)的坐标。此外,后面叙述各扩增候选区域的优先序位的附加方法。
[表8]
表8
<比较例1>
《优先序位的设定》
对于X01~X17的各扩增候选区域,按SNV坐标小的顺序分别附加优先序位1位~17位。
表8的“优先序位”栏中示出各扩增候选区域的优先序位。
《引物及引物对的设计》
自优先序位高的扩增候选区域起依次设计用于通过多重PCR对该扩增候选区域进行扩增的引物及引物对。
其结果是,能够对优先序位第1至第10的扩增候选区域设计供多重PCR的引物。
表9的“引物”栏中示出构成各引物对的引物的名称、碱基序列及序列编号。
另外,图17中示出染色体DNA上的扩增候选区域的物理配置及各扩增候选区域的优先序位。其中,图中的各区域间的距离并非反映实际的染色体DNA上的距离。
[表9]
表9
<实施例1>
《优先序位的设定》
对X01~X17的扩增候选区域,如下附加优先序位。
表8的“优先序位”栏中示出各扩增候选区域的优先序位。
对SNV坐标最小的X01(SNV坐标:20,763,642)附加优先序位1位。
对SNV坐标最大的X17(SNV坐标:111,098,226)附加优先序位2位。
对最接近X01和X17的中点(坐标:65,930,934)的X12(SNV坐标:67,800,935)附加优先序位3位。
对最接近X01和X12的中点(坐标:44,282,288.5)的X09(SNV坐标:46,946,157)附加优先序位4位。
对最接近X12和X17的中点(坐标:89,449,580.5)的X13(SNV坐标:95,858,978)附加优先序位5位。
对最接近X09和X12的中点(坐标:57,373,546)的X11(SNV坐标:53,608,479)附加优先序位6位。
对最接近X13和X17的中点(坐标:103,478,602)的X16(SNV坐标:103,397,937)附加优先序位7位。
对最接近X09和X11的中点(坐标:50,277,318)的X10(SNV坐标:52,544,805)附加优先序位8位。
对最接近X13和X16的中点(坐标:99,628,457.5)的X14(SNV坐标:102,366,825)附加优先序位9位。
对最接近X14和X16的中点(坐标:102,882,381)的X15(SNV坐标:103,396,716)附加优先序位10位。
对最接近X01和X09的中点(坐标:33,854,899.5)的X05(SNV坐标:36,385,031)附加优先序位11位。
对最接近X01和X05的中点(坐标:28,574,336.5)的X04(SNV坐标:27,845,654)附加优先序位12位。
对最接近X05和X09的中点(坐标:41,665,594)的X08(SNV坐标:36,886,469)附加优先序位13位。
对最接近X01和X04的中点(坐标:44,282,288.5)的X02(SNV坐标:24,798,120)附加优先序位14位。
对最接近X05和X08的中点(坐标:36,635,750)的X06(SNV坐标:36,743,177)附加优先序位15位。
对最接近X02和X04的中点(坐标:26,321,887)的X03(SNV坐标:25,265,103)附加优先序位16位。
对最接近X06和X08的中点(坐标:36,814,823)的X07(SNV坐标:36,801,415)附加优先序位17位。
《引物及引物组的设计》
自优先序位高的扩增候选区域起依次设计用于通过多重PCR对该扩增候选区域进行扩增的引物及引物对。
其结果是,能够对优先序位第1至第10的扩增候选区域设计供多重PCR的引物。
表10的“引物”栏中示出构成各引物对的引物的名称、碱基序列及序列编号。
另外,图18中示出染色体DNA上的扩增候选区域的物理配置及各扩增候选区域的优先序位。其中,图中的各区域间的距离并非反映实际的染色体DNA上的距离。
[表10]
表10
<实施例2>
《优先序位的设定》
对X01~X17的扩增候选区域,如下附加优先序位。
表10的“优先序位”栏中示出各扩增候选区域的优先序位。
对X01(SNV坐标:20,763,642)附加优先序位1位。
对具有X01的SNV坐标加上5,000,000而成的25,763,642以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小的坐标值的X04(SNV坐标:27,845,654)附加优先序位2位。
对具有X04的SNV坐标加上5,000,000而成的32,845,654以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X05(SNV坐标:36,385,031)附加优先序位3位。
对具有X05的SNV坐标加上5,000,000而成的41,385,031以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X09(SNV坐标:46,946,157)附加优先序位4位。
对具有X09的SNV坐标加上5,000,000而成的51,946,157以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X10(SNV坐标:52,544,805)附加优先序位5位。
对具有X10的SNV坐标加上5,000,000而成的57,544,805以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X12(SNV坐标:67,800,935)附加优先序位6位。
对具有X12的SNV坐标加上5,000,000而成的72,800,935以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X13(SNV坐标:95,858,978)附加优先序位7位。
对具有X13的SNV坐标加上5,000,000而成的100,858,978以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X14(SNV坐标:102,366,825)附加优先序位8位。
对具有X14的SNV坐标加上5,000,000而成的107,366,825以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X17(SNV坐标:111,098,226)附加优先序位9位。
由于不存在具有X17的SNV坐标加上5,000,000而成的116,098,226以上的坐标、且不存在尚未被附加优先序位的扩增候选区域,因此对尚未被附加优先序位的扩增候选区域中具有最小坐标值的X02(SNV坐标:24,798,120)附加优先序位10位。
对具有X02的SNV坐标加上5,000,000而成的29,798,120以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X06(SNV坐标:36,743,177)附加优先序位11位。
对具有X06的SNV坐标加上5,000,000而成的41,743,177以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X11(SNV坐标:53,608,479)附加优先序位12位。
对具有X11的SNV坐标加上5,000,000而成的58,608,479以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X15(SNV坐标:103,396,716)附加优先序位13位。
由于不存在具有X15的SNV坐标加上5,000,000而成的108,396,716以上的坐标、且不存在尚未被附加优先序位的扩增候选区域,因此对尚未被附加优先序位的扩增候选区域中具有最小坐标值的X03(SNV坐标:25,265,103)附加优先序位14位。
对具有X03的SNV坐标加上5,000,000而成的30,265,103以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X07(SNV坐标:36,801,415)附加优先序位15位。
对具有X07的SNV坐标加上5,000,000而成的41,801,415以上的坐标、且在尚未被附加优先序位的扩增候选区域中具有最小坐标值的X16(SNV坐标:103,397,937)附加优先序位16位。
由于不存在具有X16的SNV坐标加上5,000,000而成的108,397,937以上的坐标、且不存在尚未被附加优先序位的扩增候选区域,因此对尚未被附加优先序位的扩增候选区域中具有最小坐标值的X08(SNV坐标:36,886,469)附加优先序位17位。
《引物及引物组的设计》
自优先序位高的扩增候选区域起依次设计用于通过多重PCR对该扩增候选区域进行扩增的引物及引物对。
其结果是,能够对优先序位第1至第10的扩增候选区域设计供多重PCR的引物。
表11的“引物”栏中示出构成各引物对的引物的名称、碱基序列及序列编号。
另外,图19中示出染色体DNA上的扩增候选区域的物理配置及各扩增候选区域的优先序位。其中,图中的各区域间的距离并非反映实际的染色体DNA上的距离。
[表11]
表11
<实施例1、2的效果>
在比较例1中,以对所有的17处扩增候选区域设计供多重PCR的引物及引物对为目的,但对引物的特异性及引物二聚体形成性等进行研究的结果是,只能对10处扩增候选区域设计引物及引物对。
同样,在实施例1及实施例2中,以对所有的17处扩增候选区域设计供多重PCR的引物及引物对为目的,但对引物的特异性及引物二聚体形成性等进行研究的结果是,只能对10处扩增候选区域设计引物及引物对。
在模板DNA缺损扩增候选区域X06~X08的情况下,由于不能对这些区域进行扩增,因此,在比较例1中,可获得SNV的碱基序列信息的区域数从能够设计引物及引物组的10处进一步减少到7处,相对于此,在实施例1及实施例2中,不受由X06~X08缺损产生的影响。
其结果是,在比较例1中,可能会因X06~X08有缺损而导致不能确保分析所需的区域数,相对于此,在实施例1及实施例2中,不会因X06~X08有缺损而导致不能确保分析所需的区域数。
[比较例2/实施例3]
作为扩增候选区域,从人13号染色体上的区域中选择包含SNP(SingleNucleotide Polymorphism;单碱基多态性)的99处的区域Y01~Y99。
在以下的表12、表13、及表14中,示出扩增候选区域存在的染色体、SNP坐标、变异频率(V.F.;Variant Frequency)、及变异频率差(ΔV.F.:与变异频率0.5之差的绝对值)、和在比较例2及实施例3中附加的各扩增候选区域的优先序位。在此,SNP坐标是基于GRCh37.p13(Genome Resource Consortium,human genome assembly data,Release 37,Patch 13;Gen Bank Accession no.CM000675.1)的坐标。此外,后面叙述各扩增候选区域的优先序位的附加方法。
[表12]
表12
[表13]
表13
[表14]
表14
<比较例2>
《优先序位的设定》
对于Y01~Y99的各扩增候选区域,按照SNP坐标小的顺序分别附加优先序位1位~99位。
表12、表13、及表14的“优先序位”栏中示出各扩增候选区域的优先序位。
《引物及引物对的设计》
自优先序位高的扩增候选区域起依次设计用于通过多重PCR对该扩增候选区域进行扩增的引物及引物对。
其结果是,能够对优先序位第1至第60的扩增候选区域设计供多重PCR的引物。
对于所设计的引物及引物对中的10对引物对,表14的“引物”栏中示出构成各引物对的引物的名称、碱基序列及序列编号。
[表15]
表15
<实施例3>
《优先序位的设定》
对于Y01~Y99的各扩增候选区域,按照各SNP的ΔV.F.小的顺序、即按照变异频率V.F.接近0.5的顺序分别附加优先序位1位~99位。
表12、表13、及表14的“优先序位”栏中示出各扩增候选区域的优先序位。
《引物及引物对的设计》
自优先序位高的扩增候选区域起依次设计用于通过多重PCR对该扩增候选区域进行扩增的引物及引物对。
其结果是,能够对优先序位第1至第60的扩增候选区域设计供多重PCR的引物。
对于设计的引物及引物对中的10对引物对,表16的“引物”栏中示出构成各引物对的引物的名称、碱基序列及序列编号。
[表16]
表16
<实施例3的效果>
使用从孕妇(母亲)口腔中采集的来自孕妇(母亲)的细胞和从孕妇(母亲)的血液中采集的来自胎儿(子)的有核红细胞,以表12~14所示的第13号染色体上的99处的SNP座位中、能够设计供多重PCR的引物的60处的SNP座位为对象进行基因分型,进行母子判定,求出其准确度。
在依照比较例2的方法设计引物及引物组的情况下、及依照实施例3的方法设计引物及引物组的情况下,母子关系均得到肯定,但在比较例2的情况下,母子判定的准确度约为13.2%,误差大且精度差,但在实施例3的情况下,母子判定的准确度约为4.5%,误差小且精度好。
此外,母子判定将使用母源可靠的细胞和子源被怀疑的分离的细胞、且使用变异频率为p1,p2,p3,…,pn的n个SNP座位进行SNP分析时的基因型不同的SNP座位的数量设为M,将其他人之间基因型不同的SNP座位的平均数量设为F,及将母子的基因型不同的SNP座位的平均数量设为G,
若为|M-F|>|M-G|,则判定子源被怀疑的分离的细胞源于子,
若为|M-F|<|M-G|,则判定子源被怀疑的分离的细胞源于被污染的其他人。
在此,F及G通过下述式来得到。其中,忽略等位基因脱扣及等位基因插入的影响。
[数学式1]
[数学式2]
在此,对于作为变异频率p(0≤p≤1)的SNP座位,陌生人之间具有不同基因型的概率f(p)及母子间具有不同基因型的概率g(p)用下述式表示。其中,q=1-p。
[数学式3]
f(p)=1-(p4+4p2q2+q4)
[数学式4]
g(p)=1-(p2+q2)
符号说明
11 运算装置(CPU)
12 存储装置(内存)
13 辅助存储装置(存储器)
14 输入装置(键盘)
15 辅助输入装置(鼠标)
16 显示装置(监视器)
17 输出装置(打印机)
Claims (6)
1.一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照所述优先序位设计用于对所述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加所述优先序位:
通过输入装置输入同一染色体DNA上的n处的扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的所述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;
运算装置从存储装置所存储的所述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置的第2优先序位设定工序;以及,
运算装置从存储装置所存储的所述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为i位、坐标值为ri、识别名为Ri的扩增候选区域及优先序位为j位、坐标值为rj、识别名为Rj的扩增候选区域,检索扩增候选区域Ri及扩增候选区域Rj,所述扩增候选区域Ri及所述扩增候选区域Rj满足如下条件:在所述扩增候选区域Ri及所述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域,接着,利用ri-j=(ri+rj)/2计算所述扩增候选区域Ri及所述扩增候选区域Rj的中点的坐标值ri-j,进而,检索具有最接近所述中点坐标值ri-j的坐标值的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并在存储装置中存储附加优先序位k位至检索的步骤,并存储于存储装置的第k优先序位设定工序,
自k=3至n重复所述附加优先序位k位的工序,
其中,n为满足3≤n的整数,k为满足3≤k≤n的整数,i及j为1≤i≤k-1、1≤j≤k-1,且i≠j,ri及rj为rmin≤ri≤rmax、rmin≤rj≤rmax,且ri≠rj,rmin及rmax分别为所述n个扩增候选区域的坐标值的最小值及最大值。
2.一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照所述优先序位设计用于对所述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加所述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的所述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;
运算装置从存储装置所存储的所述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置的第2优先序位设定工序;以及,
运算装置从存储装置所存储的所述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为i位、坐标值为ri、识别名为Ri的扩增候选区域及优先序位为j位、坐标值为rj、识别名为Rj的扩增候选区域,检索扩增候选区域Ri及扩增候选区域Rj,所述扩增候选区域Ri及所述扩增候选区域Rj满足如下条件:在所述扩增候选区域Ri及所述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域,接着,利用ri-j=(ri+rj)/2计算所述扩增候选区域Ri及所述扩增候选区域Rj的中点的坐标值ri-j,进而,检索具有最接近所述中点坐标值ri-j的坐标值的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并在存储装置中存储附加优先序位k位至检索的步骤,并存储于存储装置的第k优先序位设定工序,
自k=3至n重复所述第k优先序位设定工序,
其中,n为满足3≤n的整数,k为满足3≤k≤n的整数,i及j为1≤i≤k-1、1≤j≤k-1,且i≠j,ri及rj为rmin≤ri≤rmax、rmin≤rj≤rmax,且ri≠rj,rmin及rmax分别为所述n个扩增候选区域的坐标值的最小值及最大值。
3.一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照所述优先序位设计用于对所述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加所述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的所述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;以及,
运算装置从存储装置所存储的所述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为k-1位的扩增候选区域的识别名Rk-1及坐标值rk-1,计算T=rk-1+t,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rk-1+t以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果不存在满足该条件的扩增候选区域,则对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t>rmax时,对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位的扩增候选区域附加优先序位k位,并存储于存储装置的第k优先序位设定工序,
自k=2至n重复所述第k优先序位设定工序,
其中,n为满足3≤n的整数,k为满足2≤k≤n的整数,t为满足t>0的实数,rk-1≠rk,rmin及rmax分别为所述n个扩增候选区域的坐标值的最小值及最大值。
4.一种供多重PCR的引物的设计方法,其对同一染色体DNA上的扩增候选区域附加优先序位,按照所述优先序位设计用于对所述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加所述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置的工序;
运算装置从存储装置所存储的所述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置的第1优先序位设定工序;以及
运算装置从存储装置所存储的所述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为k-1位的扩增候选区域的识别名Rk-1及坐标值rk-1,计算T=rk-1+t,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rk-1+t以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果不存在满足该条件的扩增候选区域,则对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置,
当T=rk-1+t>rmax时,对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位的扩增候选区域附加优先序位k位,并存储于存储装置的第k优先序位设定工序,
自k=2至n重复所述第k优先序位设定工序,
其中,n为满足3≤n的整数,k为满足2≤k≤n的整数,t为满足t>0的实数,rk-1≠rk,rmin及rmax分别为所述n个扩增候选区域的坐标值的最小值及最大值。
5.一种供多重PCR的引物的设计方法,其对同一染色体上的扩增候选区域附加优先序位,按照所述优先序位设计用于对所述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对同一染色体DNA上的扩增候选区域附加优先序位的方法来附加所述优先序位:
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及候选引物数信息,并存储于存储装置的工序;以及,
运算装置从存储装置所存储的所述扩增候选区域的识别信息及候选引物数信息中检索候选引物数的数量第k少的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置的第k优先序位设定工序;
自k=1至n重复所述第k优先序位设定工序,
其中,n为满足n≥2的整数,k为满足1≤k≤n的整数。
6.一种供多重PCR的引物的设计方法,其对扩增候选区域附加优先序位,按照所述优先序位设计用于对所述扩增候选区域进行PCR扩增的引物,其中,
所述供多重PCR的引物的设计方法利用包括以下工序的对扩增候选区域附加优先序位的方法来附加所述优先序位:
通过输入装置输入染色体DNA上的n个扩增候选区域的识别信息及变异频率信息,并存储于存储装置的工序;以及,
运算装置根据存储装置所存储的所述扩增候选区域的识别信息及变异频率信息计算具有识别名Ri及变异频率VFi的扩增候选区域的变异频率差=|0.5-VFi|,检索变异频率差第k个小的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置的第k优先序位设定工序,
自k=1至n重复所述第k优先序位设定工序,
其中,n为满足n≥2的整数,k为满足1≤k≤n的整数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016192241 | 2016-09-29 | ||
JP2016-192241 | 2016-09-29 | ||
PCT/JP2017/032262 WO2018061695A1 (ja) | 2016-09-29 | 2017-09-07 | マルチプレックスpcrに供するプライマーの設計方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109790537A true CN109790537A (zh) | 2019-05-21 |
Family
ID=61763405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780060228.1A Pending CN109790537A (zh) | 2016-09-29 | 2017-09-07 | 供多重pcr的引物的设计方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20190221292A1 (zh) |
EP (1) | EP3521424A4 (zh) |
JP (1) | JP6768815B2 (zh) |
CN (1) | CN109790537A (zh) |
WO (1) | WO2018061695A1 (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
ES2663234T3 (es) | 2012-02-27 | 2018-04-11 | Cellular Research, Inc | Composiciones y kits para recuento molecular |
EP3842542A1 (en) | 2013-08-28 | 2021-06-30 | Becton, Dickinson and Company | Massively parallel single cell analysis |
WO2016138496A1 (en) | 2015-02-27 | 2016-09-01 | Cellular Research, Inc. | Spatially addressable molecular barcoding |
WO2016160844A2 (en) | 2015-03-30 | 2016-10-06 | Cellular Research, Inc. | Methods and compositions for combinatorial barcoding |
EP3286326A1 (en) * | 2015-04-23 | 2018-02-28 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
CN108026524A (zh) | 2015-09-11 | 2018-05-11 | 赛卢拉研究公司 | 用于核酸文库标准化的方法和组合物 |
EP3421608B1 (en) * | 2016-02-24 | 2022-03-09 | FUJIFILM Corporation | Chromosome number quantification method |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
SG11201901733PA (en) | 2016-09-26 | 2019-04-29 | Cellular Res Inc | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
WO2018061699A1 (ja) * | 2016-09-29 | 2018-04-05 | 富士フイルム株式会社 | マルチプレックスpcrに供するプライマーの設計方法 |
EP3577232A1 (en) | 2017-02-01 | 2019-12-11 | Cellular Research, Inc. | Selective amplification using blocking oligonucleotides |
US20180237853A1 (en) * | 2017-02-19 | 2018-08-23 | Yan Wang | Methods, Compositions and Kits for Detection of Mutant Variants of Target Genes |
ES2945191T3 (es) | 2018-05-03 | 2023-06-29 | Becton Dickinson Co | Análisis de muestras multiómicas de alto rendimiento |
US11365409B2 (en) | 2018-05-03 | 2022-06-21 | Becton, Dickinson And Company | Molecular barcoding on opposite transcript ends |
US11495325B2 (en) * | 2018-07-13 | 2022-11-08 | Illumina, Inc. | Systems and methods for multiplex PCR primer selection |
KR102200109B1 (ko) * | 2018-09-12 | 2021-01-08 | 한국과학기술정보연구원 | 표적 서열 증폭용 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법 |
CN112805389A (zh) | 2018-10-01 | 2021-05-14 | 贝克顿迪金森公司 | 确定5’转录物序列 |
WO2020097315A1 (en) | 2018-11-08 | 2020-05-14 | Cellular Research, Inc. | Whole transcriptome analysis of single cells using random priming |
WO2020123384A1 (en) | 2018-12-13 | 2020-06-18 | Cellular Research, Inc. | Selective extension in single cell whole transcriptome analysis |
EP3914728B1 (en) | 2019-01-23 | 2023-04-05 | Becton, Dickinson and Company | Oligonucleotides associated with antibodies |
EP4004231A1 (en) | 2019-07-22 | 2022-06-01 | Becton, Dickinson and Company | Single cell chromatin immunoprecipitation sequencing assay |
CN114729350A (zh) | 2019-11-08 | 2022-07-08 | 贝克顿迪金森公司 | 使用随机引发获得用于免疫组库测序的全长v(d)j信息 |
WO2021146207A1 (en) | 2020-01-13 | 2021-07-22 | Becton, Dickinson And Company | Methods and compositions for quantitation of proteins and rna |
CN115605614A (zh) | 2020-05-14 | 2023-01-13 | 贝克顿迪金森公司(Us) | 用于免疫组库谱分析的引物 |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
EP4247967A1 (en) | 2020-11-20 | 2023-09-27 | Becton, Dickinson and Company | Profiling of highly expressed and lowly expressed proteins |
WO2024047992A1 (ja) * | 2022-08-31 | 2024-03-07 | 富士フイルム株式会社 | アンプリコンメチル化シーケンス解析用のプライマーの設計方法、製造方法、設計装置、設計プログラムおよび記録媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101613698A (zh) * | 2009-04-13 | 2009-12-30 | 厦门艾德生物医药科技有限公司 | 一种扩增低含量基因突变dna的引物设计方法及其应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5079694B2 (ja) * | 2006-07-04 | 2012-11-21 | 株式会社島津製作所 | 核酸増幅用プライマー設計装置、プライマー設計プログラム、及びプライマー設計サーバ装置 |
JP6502477B2 (ja) * | 2015-03-31 | 2019-04-17 | 富士フイルム株式会社 | 胎児の遺伝子状態を判定する方法 |
CN107429298B (zh) * | 2015-03-31 | 2021-02-19 | 富士胶片株式会社 | 供聚合酶连锁反应的引物的设计方法及引物组合 |
-
2017
- 2017-09-07 CN CN201780060228.1A patent/CN109790537A/zh active Pending
- 2017-09-07 EP EP17855653.6A patent/EP3521424A4/en active Pending
- 2017-09-07 JP JP2018542323A patent/JP6768815B2/ja active Active
- 2017-09-07 WO PCT/JP2017/032262 patent/WO2018061695A1/ja unknown
-
2019
- 2019-03-28 US US16/368,488 patent/US20190221292A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101613698A (zh) * | 2009-04-13 | 2009-12-30 | 厦门艾德生物医药科技有限公司 | 一种扩增低含量基因突变dna的引物设计方法及其应用 |
Non-Patent Citations (3)
Title |
---|
LARS KADERALI等: "Primer-design for multiplexed genotyping", 《NUCLEIC ACIDS RES》 * |
M MITSUHASHI: "Technical report: Part 2. Basic requirements for designing optimal PCR primers", 《J CLIN LAB ANAL》 * |
ZHIYONG SHEN等: "MPprimer: a program for reliable multiplex PCR primer design", 《BMC BIOINFORMATICS》 * |
Also Published As
Publication number | Publication date |
---|---|
US20190221292A1 (en) | 2019-07-18 |
EP3521424A1 (en) | 2019-08-07 |
EP3521424A4 (en) | 2019-10-23 |
JPWO2018061695A1 (ja) | 2019-08-08 |
WO2018061695A1 (ja) | 2018-04-05 |
JP6768815B2 (ja) | 2020-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109790537A (zh) | 供多重pcr的引物的设计方法 | |
CN109804079A (zh) | 供多重pcr的引物的设计方法 | |
US10984887B2 (en) | Systems and methods for detecting structural variants | |
US10066259B2 (en) | Screening for structural variants | |
Wade et al. | The mosaic structure of variation in the laboratory mouse genome | |
US20170058320A1 (en) | Systems and methods for epigenetic analysis | |
US20140129201A1 (en) | Validation of genetic tests | |
WO2018061693A1 (ja) | マルチプレックスpcrに供するプライマーの設計方法 | |
WO2015042496A1 (en) | A framework for determining the relative effect of genetic variants | |
US20180032669A1 (en) | Method for designing primer used for polymerase chain reaction and primer set | |
JP2018536430A (ja) | シークエンシングで使用するための分子品質保証方法 | |
Ruark et al. | The ICR1000 UK exome series: a resource of gene variation in an outbred population | |
Yin et al. | Long-range haplotype analysis of the malaria parasite receptor gene ACKR1 in an East-African population | |
Yang et al. | Mutagenic primer design for mismatch PCR-RFLP SNP genotyping using a genetic algorithm | |
Liu et al. | GC heterogeneity reveals sequence-structures evolution of angiosperm ITS2 | |
US20160055293A1 (en) | Systems, Algorithms, and Software for Molecular Inversion Probe (MIP) Design | |
Easterling et al. | Identification of tandem repeat families from long-read sequences of Humulus lupulus | |
WO2018026576A1 (en) | Genomic analysis of cord blood | |
WO2018066317A1 (ja) | 必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法 | |
Yıldırım et al. | Joint action of purifying selection and trans-splicing factor preference on base composition evolution of the polypyrimidine tract | |
Bolognini | Unraveling tandem repeat variation in personal genomes with long reads | |
Canal-Alonso et al. | File formats used in next generation sequencing: A literature review | |
Li | Genetic epidemiology of markers of genomic ageing | |
KR20230109614A (ko) | 시퀀싱에 의한 유전자형화 | |
Jadamba et al. | A SNP Prioritization Method Using Linkage Disequilibrium Network for Disease Association Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |