CN109804079A - 供多重pcr的引物的设计方法 - Google Patents

供多重pcr的引物的设计方法 Download PDF

Info

Publication number
CN109804079A
CN109804079A CN201780060312.3A CN201780060312A CN109804079A CN 109804079 A CN109804079 A CN 109804079A CN 201780060312 A CN201780060312 A CN 201780060312A CN 109804079 A CN109804079 A CN 109804079A
Authority
CN
China
Prior art keywords
mentioned
primer
amplification
base sequence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780060312.3A
Other languages
English (en)
Inventor
辻本尧之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Publication of CN109804079A publication Critical patent/CN109804079A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种供多重PCR的引物的设计方法,在通过对扩增候选区域设定优先序位来设计引物的结果是能够设计引物的扩增候选区域数未达到所需数量的情况下,能够在维持先前设定的优先序位的全局特征的同时重新进行引物的设计。

Description

供多重PCR的引物的设计方法
技术领域
本发明涉及一种供多重PCR(Polymerase Chain Reaction;聚合酶链反应)的引物的设计方法。
背景技术
利用近年来开发的DNA(Deoxyribonucleic acid;脱氧核糖核酸)测序仪等可以容易地进行基因分析。然而,基因组的总碱基长度通常庞大,另一方面测序仪的读取能力是有限的。于是,作为通过仅PCR扩增所需的特定的基因区域、并限定于其碱基序列进行读取来有效且高精度地进行基因分析的技术,正在普及PCR法。特别将通过同时对某一个PCR反应系统供给多种类型的引物来选择性地PCR扩增多个基因区域的方法称为多重PCR。
由于多重PCR由少量的DNA高效地PCR扩增多个区域,因此是用于进行非侵入性产前诊断的实用技术。
发明内容
发明要解决的技术课题
然而,对于设计能够针对从单一细胞提取的基因组DNA这样的、数pg~数十pg以下的少量DNA样本可靠地直接进行多重PCR的引物组而言,由于互补性及特异性等引物设计的条件非常严格,因此难度较高,有时不能对所有的扩增候选区域设计用于进行PCR扩增的引物。
本发明人指出,在对扩增候选区域设定了优先序位的情况下,即在依照其优先序位设计用于对各扩增候选区域进行PCR扩增的引物时,与未对扩增候选区域设定优先序位的情况相比,有时能够对更多的扩增候选区域设计用于进行PCR扩增的引物。
然而,即使是对扩增候选区域设定了优先序位的情况,也存在如下情况:能够设计用于进行PCR扩增的引物的扩增候选区域数比原本基因分型或者染色体数定量等分析所需区域数少;或者即使能够设计用于进行PCR扩增的引物的扩增候选区域数为分析所需的区域数以上,进行多重PCR时得到PCR扩增产物的扩增对象区域数也比分析所需的区域数少。
此时,就要重新进行引物的设计,但存在如下情况:在先前设定的优先序位为基于某种意图的情况下,希望不变更其全局特征。
于是,本发明的课题在于,提供一种供多重PCR的引物的设计方法,在通过对扩增候选区域设定优先序位来设计引物的结果是能够设计引物的扩增候选区域数未达到所需数量的情况下,能够在维持先前设定的优先序位的全局特征的同时重新进行引物的设计。
用于解决技术课题的手段
本发明人为了解决上述课题反复进行了潜心研究,结果得知,在重新进行引物的设计时,通过变更扩增候选区域的优先序位来重新进行引物的设计,完成了本发明。
即,本发明为以下的[1]~[3]。
[1]一种供多重PCR的引物的设计方法,所述引物用于对基因组上的n个扩增候选区域中t个以上的扩增候选区域进行扩增,所述方法包括以下工序:
第1优先序位设定工序,对于基因组DNA上的n个扩增候选区域,附加作为第1个至第n个的顺序的第1优先序位;
第1引物设计工序,按照上述第1优先序位的顺序,自上述第1优先序位为第1个的扩增候选区域起,依次设计用于对该扩增候选区域进行PCR扩增的引物;
第1成功与否判断工序,将上述第1引物设计工序中能够设计引物的扩增候选区域数设为m个,当m≥t时,确定结束引物的设计,当m<t时,确定进入下一个工序;
第2优先序位设定工序,对于上述n个扩增候选区域,附加作为第1个至第n个的顺序的与第1优先序位的顺序不同的第2优先序位;以及
第2引物设计工序,按照上述第2优先序位的顺序,自上述第2优先序位为第1个的扩增候选区域起,依次设计用于对该扩增候选区域进行PCR扩增的引物,其中,
上述第2优先序位设定工序是如下工序:
通过输入装置输入上述n个扩增候选区域的识别信息及第1优先序位信息,并存储于存储装置;
运算装置制作按上述第1优先序位的顺序排列、且以上述n个扩增候选区域为要素的第1序列,并存储于存储装置;
运算装置将按上述第1优先序位的顺序排列的上述n个扩增候选区域分割为j个区段,以使第i个区段包括ki个扩增候选区域,并存储于存储装置;
运算装置在上述j个区段中至少1个区段的内部重新排列该至少1个区段所含的扩增候选区域,并存储于存储装置;以及
运算装置将第1个至第j个的区段依次结合,解除区段分割,制作第2序列,将上述第2序列所含的上述n个扩增候选区域的顺序设为上述n个扩增候选区域的第2优先序位,
其中,n为满足n≥4的整数,t为满足2≤t≤n的整数,m为满足0≤m≤n的整数,i为满足1≤i≤j的整数,j为满足2≤j≤n/2的整数,ki为满足2≤ki≤{n-2×(j-1)}的整数。
[2]如上述[1]所述的供多重PCR的引物的设计方法,其中,
在上述第2引物设计工序之后,进一步包括
第2成功与否判断工序,即,将在上述第2引物设计工序中能够设计引物的扩增候选区域数设为m’个,当m’≥t时,确定结束引物的设计,当m’<t时,确定返回上述第2优先序位设定工序。
[3]如权利要求1或2所述的供多重PCR的引物的设计方法,其中,在上述第2优先序位设定工序中,在上述至少1个区段内随机变更上述扩增候选区域的顺序。
发明效果
根据本发明,可提供一种供多重PCR的引物的设计方法,在通过对扩增候选区域设定优先序位来设计引物的结果是能够设计引物的扩增候选区域数未达到所需数量的情况下,能够在维持先前设定的优先序位的全局特征的同时重新进行引物的设计。
根据本发明的供多重PCR的引物的设计方法,与再设计前相比,有时可使能够设计用于PCR扩增的引物的扩增候选区域数增多,此时,可期待能够确保基因分型或染色体数定量等分析所需的区域数。
附图说明
图1是表示本发明中的优先序位设定工序中使用的硬件的概念图。
图2是说明本发明的供多重PCR的引物的设计方法的整体情况的流程图。
图3是通过具体例说明本发明的供多重PCR的引物的设计方法中的第2优先序位的设定方法的图。
图4是说明本发明的供多重PCR的引物的设计方法中的设定第1优先序位或第2优先序位后的引物设计方法的第1方式的流程图。
图5是说明本发明的供多重PCR的引物的设计方法中的设定第1优先序位或第2优先序位后的引物设计方法的第2方式的流程图。
图6是说明本发明的供多重PCR的引物的设计方法中的设定第1优先序位或第2优先序位后的引物设计方法的第3方式的流程图。
具体实施方式
在本发明中,用“~”所表示的范围是指该范围包括记载于“~”前后的两端的范围。例如,关于A和B,“A~B”表示包括A及B的范围。
另外,本发明中,扩增候选区域为基因组DNA上的区域,是指用于基因分型或者染色体数定量等目的而进行PCR扩增的候选的区域。
下面,适当地参照附图,对本发明的供多重PCR的引物的设计方法进行详细说明。
[硬件(执行装置)]
对于执行本发明中的优先序位的设定方法的装置(也称为“硬件”或“执行装置”。),参照图1进行说明。
本发明中,通过具备运算装置(CPU;Central Processing Unit,中央运算处理装置)11、存储装置(内存)12、辅助存储装置(存储器)13、输入装置(键盘)14及显示装置(监视器)16的硬件(装置)来进行优先序位的设定。该装置可以进一步具备辅助输入装置(鼠标)15及输出装置(打印机)17等。
对各个装置进行说明。
输入装置(键盘)14是对装置输入指示及数据等的装置。辅助输入装置(鼠标)15可代替输入装置(键盘)14或与其一起来使用。
运算装置(CPU)11是进行运算处理的装置。
存储装置(内存)12是存储运算装置(CPU)11的运算处理的结果或存储来自输入装置(键盘)14的输入的装置。
辅助存储装置(存储器)13是保存操作系统、用于确定所需基因座数量的程序等的存储器。还能够将辅助存储装置(存储器)13的一部分用于扩展存储装置(内存)12(虚拟内存)。
[供多重PCR的引物的设计方法]
本发明的供多重PCR的引物的设计方法包括以下工序。
(1)第1优先序位设定工序,对于基因组DNA上的n个扩增候选区域,附加作为第1个至第n个的顺序的第1优先序位(图2的“第1优先序位设定”)。其中,n为满足n≥4的整数。
(2)第1引物设计工序,按照上述第1优先序位的顺序,自上述第1优先序位为第1个的扩增候选区域起,依次设计用于对该扩增候选区域进行PCR扩增的引物(图2的“第1引物设计”)。
(3)第1成功与否判断工序,将上述第1引物设计工序中能够设计引物的扩增候选区域数设为m个,当m≥t时,确定结束引物的设计,当m<t时,确定进入下一个工序(图2的“能够设计引物的扩增候选区域数m”)。其中,t为满足2≤t≤n的整数,m为满足0≤m≤n的整数。
(4)第2优先序位设定工序,对于上述n个扩增候选区域,附加作为第1个至第n个的顺序的与第1优先序位的顺序不同的第2优先序位(图2的“第2优先序位设定”)。
(5)第2引物设计工序,按照上述第2优先序位的顺序,自上述第2优先序位为第1个的扩增候选区域起,依次设计用于对该扩增候选区域进行PCR扩增的引物(图2的“第2引物设计”)。
进而,根据需要,也可以包括以下工序。
(6)第2成功与否判断工序,将在上述第2引物设计工序中能够设计引物的扩增候选区域数设为m’个,当m’≥t时,确定结束引物的设计,当m’<t时,确定返回上述第2优先序位设定工序(图2的“能够设计引物的扩增候选区域数m’”)。
下面,对各工序进行说明。
<第1优先序位设定工序S11>
图2中,示为“第1优先序位设定工序”。
在第1优先序位设定工序S11中,对于n个扩增候选区域,分别不重复地附加第1个至第n个的顺序。该顺序成为设计引物时的顺序。
对该顺序的附加方法没有特别限定,例如有如下的方法。
《第1优先序位的设定方法的具体例(1)》
通过输入装置输入同一染色体DNA上的n处扩增候选区域的识别信息及坐标信息,并存储于存储装置12。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置12。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为i位、坐标值为ri、识别名为Ri的扩增候选区域及优先序位为j位、坐标值为rj、识别名为Rj的扩增候选区域,所述扩增候选区域Ri及所述扩增候选区域Rj满足如下条件:在上述扩增候选区域Ri及上述扩增候选区域Rj之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域,接着,利用ri-j=(ri+rj)/2计算上述扩增候选区域Ri及上述扩增候选区域Rj的中点的坐标值ri-j,进而,检索具有最接近上述中点坐标值ri-j的坐标值的扩增候选区域,对该扩增候选区域附加优先序位k位的优先序位信息,并存储于存储装置12。
自k=3至n重复附加上述优先序位k位的工序。
由此,能够设定第1优先序位。
也可以如下进行优先序位的设定。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位2位的优先序位信息,并存储于存储装置12。
其中,n为满足3≤n的整数,k为满足3≤k≤n的整数,i及j为1≤i≤k-1、1≤j≤k-1,且i≠j,ri及rj为rmin≤ri≤rmax、rmin≤rj≤rmax,且ri≠rj,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
上述优先序位的设定方法的具体例(1)可如下进行说明。
在上述n处扩增候选区域中,将具有最小坐标值rmin的扩增候选区域设为Rmin,将具有最大坐标值rmax的扩增候选区域设为Rmax
首先,对上述扩增候选区域Rmin及上述扩增候选区域Rmax这2个扩增候选区域中的一方附加优先序位1位。即,对扩增候选区域Rmin附加优先序位1位,或者对扩增候选区域Rmax附加优先序位1位。
接着,对上述扩增候选区域Rmin及上述扩增候选区域Rmax这2个扩增候选区域中的除了附加了上述优先序位1位的一方以外的另一方附加优先序位2位。即,在对扩增候选区域Rmin附加了优先序位1位时,对扩增候选区域Rmax附加优先序位2位,在对扩增候选区域Rmax附加了优先序位1位时,对扩增候选区域Rmin附加优先序位2位。
进而,对于第3个以后第h个扩增候选区域,设为已经附加了1位至(h-1)位的优先序位,对于具有最接近附加了优先序位p位的扩增候选区域Rp及附加了优先序位q位的扩增候选区域Rq的中点的坐标值(rp+rq)/2的坐标值的扩增候选区域,附加优先序位h位。在此,rp及rq分别为扩增候选区域Rp及扩增候选区域Rq的坐标值。
在扩增候选区域Rp及扩增候选区域Rq的组合存在2组以上的情况下,可任意选择1组,也可采用优先选择坐标值小的区域或优先选择坐标值大的区域等策略。
在具有最接近坐标值(rp+rq)/2的坐标值的扩增候选区域存在2处的情况下,可任意选择1处,也可采用优先选择坐标值小的区域或优先选择坐标值大的区域等策略。
此外,在上述扩增候选区域Rp及上述扩增候选区域Rq之间,不存在附加了优先序位的扩增候选区域,但存在至少1处尚未被附加优先序位的扩增候选区域。另外,R1为附加了优先序位1位的Rmin或Rmax,R2为附加了优先序位2位的Rmin或Rmax
h为满足3≤h≤n的整数。
p及q为1≤p≤h-1,1≤q≤h-1,且p≠q。
rp及rq为rmin≤rp≤rmax,rmin≤rq≤rmax,且rp≠rq
自h=3至h=n依次重复第h优先序位设定工序。
在没有能够附加优先序位的扩增候选区域时,结束优先序位的设定。
此外,以优先序位不发生重复的方式进行对扩增候选区域的优先序位的设定。
《第1优先序位的设定方法的具体例(2)》
通过输入装置输入同一染色体DNA上的n个扩增候选区域的识别信息及坐标信息,并存储于存储装置12。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最小的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息、坐标信息及优先序位信息中检索优先序位为k-1位的扩增候选区域的识别名Rk-1及坐标值rk-1,计算T=rk-1+t,当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rk-1+t以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置12,当T=rk-1+t≤rmax时,检索具有rk-1+t以上rmax以下的坐标值、且没有被附加优先序位信息的扩增候选区域,如果存在满足该条件的扩增候选区域,则对坐标值为rmin以上且具有最小坐标值的尚未被附加优先序位信息的扩增候选区域附加优先序位k位,并存储于存储装置12,当T=rk-1+t>rmax时,对坐标值为rmin以上且具有最坐标值的尚未被附加优先序位的扩增候选区域附加优先序位k位,并存储于存储装置12。
自k=2至n重复附加上述优先序位k位的工序。
由此,能够设定第1优先序位。
也可以如下进行优先序位的设定。
运算装置11从存储装置所存储的上述扩增候选区域的识别信息及坐标信息中检索坐标值最大的扩增候选区域,对该扩增候选区域附加优先序位1位的优先序位信息,并存储于存储装置12。
其中,n为满足3≤n的整数,k为满足2≤k≤n的整数,t为满足t>0的实数、rk-1≠rk,rmin及rmax分别为上述n个扩增候选区域的坐标值的最小值及最大值。
第1优先序位的设定方法的具体例(2)可如下进行说明。
在上述n处扩增候选区域中,将具有最小坐标值rmin的扩增候选区域设为Rmin,将具有最大坐标值rmax的扩增候选区域设为Rmax
首先,对存在于上述扩增候选区域Rmin及上述扩增候选区域Rmax这2个扩增候选区域之间、且具有满足rmin≤r1≤rmax的坐标值r1的扩增候选区域R1附加优先序位1位。即,可以对扩增候选区域Rmin附加优先序位1,也可以对扩增候选区域Rmax附加优先序位1位,还可以对与扩增候选区域Rmin及扩增候选区域Rmax中任一区域不同的扩增候选区域附加优先序位1位。
只要R1的坐标值r1满足rmin≤r1≤rmax即可,没有特别限定,优选为r1=rmin或r1=rmax,更优选为r1=rmin
进而,假定已经附加了1位至(h-1)位的优先序位,对满足规定条件的扩增候选区域附加优先序位h位。
如下操作来确定上述满足规定的条件的扩增候选区域。
将附加了优先序位(h-1)位的扩增候选区域Rh-1的坐标值设为rh-1,考虑对其加上阈值s的值“S=rh-1+s”。在此,s为满足s>0的实数,在本发明中有时称为“阈值”。
由于扩增候选区域的坐标值的最大值为rmax,因此划分为下面的(1)及(2)这2种情况。
(1)S=rh-1+s≤rmax的情况
(2)S=rh-1+s>rmax的情况
进而,对于上述(1)的情况,根据坐标值rh-1+s与rmax之间是否存在尚未被附加优先序位的扩增候选区域,划分为下面的(1)-1及(1)-2这2种情况。
(1)-1存在尚未被附加优先序位的扩增候选区域的情况
(1)-2不存在尚未被附加优先序位的扩增候选区域的情况
在相当于上述(1)-1的情况下,对坐标值为(rh-1+s)以上且具有最小坐标值的、尚未被附加优先序位的扩增候选区域附加优先序位h位。
在这种情况下,s表示优先序位((h-1)位的扩增候选区域Rh-1与优先序位h位的扩增候选区域Rh之间的距离。s越大,Rh-1与Rh之间的距离也变得越大,通常相互影响变小。
在相当于上述(1)-2或者上述(2)的情况下,对坐标值为rmin以上且具有最小坐标值的、尚未被附加优先序位的扩增候选区域附加优先序位h位。
h为满足2≤h≤n的整数。
s为满足s>0的实数,可根据染色体DNA尺寸、或扩增候选区域的坐标等适当设定,优选为100,000以上,更优选为1,000,000以上,进一步优选为5,000,000以上。
自h=2至h=n依次重复第h优先序位设定工序。
在没有能够附加优先序位的扩增候选区域时,结束优先序位的设定。
此外,以优先序位不发生重复的方式进行对扩增候选区域的优先序位的设定。
<第1引物设计工序S12/第2引物设计工序S22>
图2中,示为“第1引物设计工序”及“第2引物设计工序”。
在后述的“设定第1优先序位或第2优先序位后的引物设计方法”中进行说明。
此外,在第1引物设计工序中,可以在中途设定第1优先序位。例如,在后述的“设定第1优先序位或第2优先序位后的引物设计方法”中说明的第3方式中,可以在对所有的n个扩增候选区域设计候选引物的碱基序列后,设定第1优先序位,按该顺序依次从候选引物中进行引物的选拔。
<第1成功与否判断工序S13/第2成功与否判断工序S23>
图2中,示为“能够设计引物的扩增候选区域数m”及“能够设计引物的扩增候选区域数m’”。
在第1成功与否判断工序S13中,将第1引物设计工序S12中能够设计引物的扩增候选区域数设为m个,当m≥t时,确定结束引物的设计,当m<t时,确定进入下一个工序。
在第2成功与否判断工序S23中,将在第2引物设计工序S22中能够设计引物的扩增候选区域数设为m’个,当m’≥t时,确定结束引物的设计,当m’<t时,确定进入下一个工序。
t为满足2≤t≤n的整数。t的值为能够设计引物的扩增候选区域的目标值,可根据基因分型或染色体数定量等分析的目的适当设定。
m为满足0≤m≤n的整数,m’为满足0≤m’≤n的整数。m及m’的值为第1引物设计工序S12或第2引物设计工序S22中能够设计引物的扩增候选区域的实际值。在本发明中,在m<t的情况下,重新设计引物,以使m’≥t。
<第2优先序位设定工序S21>
图2中,示为“第2优先序位设定工序”。
第2优先序位设定工序S21包括以下工序:通过输入装置输入n个扩增候选区域的识别信息及第1优先序位信息,并存储于存储装置12的工序;运算装置11从由上述n个扩增候选区域组成的组中取出n个扩增候选区域并按上述第1优先序位的顺序排列,制作以上述n个扩增候选区域为要素的第1序列,并存储于存储装置12的工序;运算装置11将按上述第1优先序位的顺序排列的上述n个扩增候选区域分割为j个区段,以使第i个区段包括ki个扩增候选区域,并存储于存储装置12的工序;运算装置11在上述j个区段中至少1个区段的内部重新排列该至少1个区段所含的扩增候选区域,并存储于存储装置12的工序;以及运算装置11将第1个至第j个的区段依次结合,解除区段分割,并存储于存储装置12的工序;运算装置11制作以上述n个扩增候选区域为要素的第2序列,并存储于存储装置12的工序,该第2优先序位设定工序S21是将上述第2序列所含的上述n个扩增候选区域的顺序设为上述n个扩增候选区域的第2优先序位的工序。
其中,n为满足n≥4的整数,t为满足2≤t≤n的整数,m为满足0≤m≤n的整数,i为满足1≤i≤j的整数,j为满足2≤j≤n/2的整数,ki为满足2≤ki≤{n-2×(j-1)}的整数。
在第2优先序位设定工序S21中,对在上述至少1个区段内变更上述扩增候选区域的顺序的方法没有特别限定,优选通过随机洗牌或随机置乱等随机地进行变更。另外,由于1个区段所含的扩增候选区域数是有限的,因此,可利用由有限要素生成随机的序列的算法。作为这样的算法,例如,可举出洗牌算法(Fisher-Yates shuffle)。
另外,对于分割扩增候选区域的区段的数量,只要是2个以上就没有特别限定,优选为10个左右。
另外,对于1个区段所含的扩增候选区域数,只要是2个以上就没有特别限定,优选为扩增候选区域的总数的1/10左右。另外,各区段所含的扩增候选区域数之差优选为1~5个以内,更优选为1~3个以内。
《基于第2优先序位设定工序的具体例的说明》
下面,参照图3对第2优先序位设定工序S21更具体地进行说明。此外,并不限定于该具体例。
图3(a)中示出X1~X9的9个扩增候选区域。
首先,如图3(b)所示,依照第1优先序位排列X1~X9的9个扩增候选区域。在此,由于按坐标值小的顺序附加优先序位,因此按X1~X9的顺序排列。
接着,如图3(c)所示,将X1~X9的9个扩增候选区域分割为3个区段,以使1个区段包含3个扩增候选区域。在此,以分别使第1个区段包含X1~X3的3个扩增候选区域、第2个区段包含X4~X6的3个扩增候选区域、第3个区段包含X7~X9的3个扩增候选区域的方式进行分割。
接着,如图3(d)所示,在各区段内,变更扩增候选区域的顺序。
接着,如图3(e)所示,不变更各区段的顺序,解除区段分割,得到扩增候选区域的新的序列。该序列所示的序位为第2优先序位。
[设定第1优先序位或第2优先序位后的引物设计方法]
在本发明的供多重PCR的引物的设计方法中,设定第1优先序位或第2优先序位后的引物设计方法(以下,简称“优先序位设定后引物设计方法”)没有特别限定,优选从以下说明的3个方式中选择。在这种情况下,设定第1优先序位后的引物设计方法与设定第2优先序位后的引物设计方法可以是相同方式,也可以是不同方式。
<优先序位设定后引物设计方法的第1方式>
优先序位设定后引物设计方法的第1方式(有时简称为“第1方式”。)包括以下工序:(a)对象区域选择工序、(b)候选引物碱基序列制作工序、(c)局部比对工序、(d)第一阶段选拔工序、(e)全局比对工序、(f)第二阶段选拔工序、(g)引物采用工序。
(a)对象区域选择工序,从设定了优先序位的扩增候选区域中按优先序位的顺序选择对象区域。
(b)候选引物碱基序列制作工序,基于基因组DNA上的上述对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述对象区域进行PCR扩增的候选引物的碱基序列。
(c)局部比对工序,对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d)第一阶段选拔工序,基于上述局部比对评分,进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e)全局比对工序,对于所有从上述第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f)第二阶段选拔工序,基于上述全局比对评分,进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g)引物采用工序,采用在上述第一阶段选拔工序及上述第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述对象区域进行PCR扩增的引物的碱基序列。
其中,在上述(a)工序~上述(g)工序中,上述(c)工序及上述(d)工序两工序与上述(e)工序及上述(f)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c)工序及上述(d)工序后进行上述(e)工序及上述(f)工序,也可以在进行上述(e)工序及上述(f)工序后进行上述(c)工序及上述(d)工序,也可以同时进行上述(c)工序及上述(d)工序与上述(e)工序及上述(f)工序。
在进行上述(e)工序及上述(f)工序后进行上述(c)工序及上述(d)工序的情况下,优选上述(e)工序及上述(c)工序分别设为下述(e’)工序及下述(c’)工序。
(e’)全局比对工序,对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c’)局部比对工序,对于所有从上述第二阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c)工序及上述(d)工序与上述(e)工序及上述(f)工序的情况下,优选上述(e)工序设为下述(e’)工序。
(e’)全局比对工序,对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
<优先序位设定后引物设计方法的第2方式>
优先序位设定后引物设计方法的第2方式(有时简称为“第2方式”。)包括以下工序:(a1)对象区域选择第1工序、(b1)候选引物碱基序列制作第1工序、(c1)局部比对第1工序、(d1)第一阶段选拔第1工序、(e1)全局比对第1工序、(f1)第二阶段选拔第1工序、(g1)引物采用第1工序、(a2)对象区域选择第2工序、(b2)候选引物碱基序列制作第2工序、(c2)局部比对第2工序、(d2)第一阶段选拔第2工序、(e2)全局比对第2工序、(f2)第二阶段选拔第2工序、以及(g2)引物采用第2工序。
(a1)对象区域选择第1工序,从设定了优先序位的扩增候选区域中选择优先序位最高的扩增候选区域作为第1对象区域。
(b1)候选引物碱基序列制作第1工序,基于基因组DNA上的上述第1对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列。
(c1)局部比对第1工序,对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比对的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d1)第一阶段选拔第1工序,基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e1)全局比对第1工序,对于所有从上述第一阶段选拔第1工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的含有2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f1)第二阶段选拔第1工序,基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增候选引物的碱基序列的第二阶段的选拔。
(g1)引物采用第1工序,采用在上述第一阶段选拔第1工序及上述第二阶段选拔第1工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增的引物的碱基序列。
(a2)对象区域选择第2工序,从设定了优先序位的扩增候选区域中尚未选择的扩增候选区域中选择优先序位最高的扩增候选区域作为第2对象区域。
(b2)候选引物碱基序列制作第2工序,基于基因组DNA上的上述第2对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列。
(c2)局部比对第2工序,对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d2)第一阶段选拔第2工序,基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e2)全局比对第2工序,对于所有从上述第一阶段选拔第2工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f2)第二阶段选拔第2工序,基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g2)引物采用第2工序,采用在上述第一阶段选拔第2工序及上述第二阶段选拔第2工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
其中,在上述(a1)工序~上述(g1)工序中,上述(c1)工序及上述(d1)工序两工序与上述(e1)工序及上述(f1)工序两工序可以是任意顺序或同时进行。即,可以在进行上述(c1)工序及上述(d1)工序后进行上述(e1)工序及上述(f1)工序,也可以在进行上述(e1)工序及上述(f1)工序后进行上述(c1)工序及上述(d1)工序,也可以同时进行上述(c1)工序及上述(d1)工序与上述(e1)工序及上述(f1)工序。
在进行上述(e1)工序及上述(f1)工序后进行上述(c1)工序及上述(d1)工序的情况下,优选上述(e1)工序及上述(c1)工序分别设为下述(e1’)工序及下述(c1’)工序。
(e1’)全局比对第1工序,对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c1’)局部比对第1工序,对于所有从上述第二阶段选拔第1工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c1)工序及上述(d1)工序与上述(e1)工序及上述(f1)工序的情况下,优选上述(e1)工序设为下述(e1’)工序。
(e1’)全局比对第1工序,对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
其中,在上述(a2)工序~上述(g2)工序中,上述(c2)工序及上述(d2)工序两工序与上述(e2)工序及上述(f2)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c2)工序及上述(d2)工序后进行上述(e2)工序及上述(f2)工序,也可以在进行上述(e2)工序及上述(f2)工序后进行上述(c2)工序及上述(d2)工序,也可以同时进行上述(c2)工序及上述(d2)工序与上述(e2)工序及上述(f2)工序。
在进行上述(e2)工序及上述(f2)工序后进行上述(c2)工序及上述(d2)工序的情况下,优选上述(e2)工序及上述(c2)工序分别设为下述(e2’)工序及下述(c2’)工序。
(e2’)全局比对第2工序,对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c2’)局部比对第2工序,对于所有从上述第二阶段选拔第2工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c2)工序及上述(d2)工序与上述(e2)工序及上述(f2)工序的情况下,优选上述(e2)工序设为下述(e2’)工序。
(e2’)全局比对第2工序,对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
进而,在上述至少1个目标区域包含3个以上的目标区域的情况下,在采用用于对尚未从上述3个以上的目标区域中选择的第3以后的对象区域进行PCR扩增的引物的碱基序列时,对于上述第3以后的对象区域,重复上述(a2)工序~上述(g2)工序为止的各工序。
<优先序位设定后引物设计方法的第3方式>
优先序位设定后引物设计方法的第3方式(有时简称为“第3方式”。)包括以下工序:(a-0)多个对象区域选择工序、(b-0)多个候选引物碱基序列制作工序、(c-1)第1局部比对工序、(d-1)第1第一阶段选拔工序、(e-1)第1全局比对工序、(f-1)第1第二阶段选拔工序、(g-1)第1引物采用工序、(c-2)第2局部比对工序、(d-2)第2第一阶段选拔工序、(e-2)第2全局比对工序、(f-2)第2第二阶段选拔工序、以及(g-2)第2引物采用工序。
(a-0)多个对象区域选择工序,从设定了优先序位的扩增候选区域中按照优先序位高的顺序选择多个对象区域。
(b-0)多个候选引物碱基序列制作工序,基于基因组DNA上的上述多个对象区域的各自的两端的各附近区域的碱基序列,分别制作至少各一个用于对上述多个对象区域的各个区域进行PCR扩增的候选引物的碱基序列。
(c-1)第1局部比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d-1)第1第一阶段选拔工序,基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e-1)第1全局比对工序,对于从上述第1第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的所有组合,针对上述组合所含的含有2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f-1)第1第二阶段选拔工序,基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g-1)第1引物采用工序,采用在上述第1第一阶段选拔工序及上述第1第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增的引物碱基序列。
(c-2)第2局部比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(d-2)第2第一阶段选拔工序,基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(e-2)第2全局比对工序,对于所有从上述第2第一阶段选拔工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(f-2)第2第二阶段选拔工序,基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(g-2)第2引物采用工序,采用在上述第2第一阶段选拔工序及上述第2第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
其中,在上述(c-1)工序~上述(g-1)工序中,上述(c-1)工序及上述(d-1)工序两工序与上述(e-1)工序及上述(f-1)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c-1)工序及上述(d-1)工序后进行上述(e-1)工序及上述(f-1)工序,也可以在进行上述(e-1)工序及上述(f-1)工序后进行上述(c-1)工序及上述(d-1)工序,也可以同时进行上述(c-1)工序及上述(d-1)工序与上述(e-1)工序及上述(f-1)工序。
在进行上述(e-1)工序及上述(f-1)工序后进行上述(c-1)工序及上述(d-1)工序的情况下,优选上述(e-1)工序及上述(c-1)工序分别设为下述(e’-1)工序及下述(c’-1)工序。
(e’-1)第1全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c’-1)第1局部比对工序,对于从上述第1第二阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的所有组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c-1)工序及上述(d-1)工序与上述(e-1)工序及上述(f-1)工序的情况下,优选上述(e-1)工序设为下述(e’-1)工序。
(e’-1)第1全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
其中,在上述(c-2)工序~上述(g-2)工序中,上述(c-2)工序及上述(d-2)工序两工序与上述(e-2)工序及上述(f-2)工序两工序可以是任意的顺序或同时进行。即,可以在进行上述(c-2)工序及上述(d-2)工序后进行上述(e-2)工序以及上述(f-2)工序,也可以在进行上述(e-2)工序及上述(f-2)工序后进行上述(c-2)工序及上述(d-2)工序,也可以同时进行上述(c-1)工序及上述(d-1)工序与上述(e-1)工序及上述(f-1)工序。
在进行上述(e-2)工序及上述(f-2)工序后进行上述(c-2)工序及上述(d-2)工序的情况下,优选上述(e-2)工序及上述(c-2)工序分别设为下述(e’-2)工序及下述(c’-2)工序。
(e’-2)第2全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(c’-2)第2局部比对工序,对于所有从上述第2第二阶段选拔工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
另外,在同时进行上述(c-2)工序及上述(d-2)工序与上述(e-2)工序及上述(f-2)工序的情况下,优选上述(e-2)工序设为下述(e’-2)工序。
(e’-2)第2全局比对工序,对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
进而,在上述至少1个扩增候选区域包含3个以上的扩增候选区域,且在上述多个对象区域选择工序中选择3个以上的对象区域,并且上述多个候选引物碱基序列制作工序中制作用于对上述3个以上对象区域的各个对象区域进行PCR扩增的候选引物的碱基序列的情况下,在采用用于对优先序位3位以后的第3以后的对象区域进行PCR扩增的引物的碱基序列时,对于上述第3以后的对象区域,重复自上述第2局部比对工序至上述第2引物采用工序为止的各工序。
<各工序的说明>
对于优先序位设定后引物设计方法的第1至第3方式,适当地参照图4~图6对各工序进行说明。
《对象区域选择工序》
在本说明书中,有时将对象区域选择工序S101(图4)、对象区域选择第1工序S201及对象区域选择第2工序S211(图5)、以及多个对象区域选择工序S301(图6)进行统称,简称为“对象区域选择工序”。
(第1方式:对象区域选择工序S101)
在图4中,示为“对象区域选择”。
在第1方式中,(a)对象区域选择工序是从设定了优先序位的扩增候选区域中按照优先序位的顺序选择对象区域的工序。
(第2方式:对象区域选择第1工序S201及对象区域选择第2工序S211)
在图5中,示为“对象区域选择第1”及“对象区域选择第2”。
在第2方式中,(a1)对象区域选择第1工序是从设定了优先序位的扩增候选区域中选择优先序位最高的扩增候选区域作为第1对象区域的工序,(a2)对象区域选择第2工序是从设定了优先序位的扩增候选区域中尚未被选择的扩增候选区域中选择优先序位最高的扩增候选区域作为第2对象区域的工序。
在第2方式中,按照优先序位的顺序一个一个地选择扩增候选区域。
(第3方式:多个对象区域选择工序S301)
在图6中,示为“多个对象区域选择”。
在第3方式中,(a-0)多个对象区域选择工序是从设定了优先序位的扩增候选区域中按照优先序位高的顺序选择多个对象区域的工序。
在第3方式中,按照优先序位的顺序选择多个扩增候选区域。优选选择设定了优先序位的所有扩增候选区域。
《候选引物碱基序列制作工序》
有时将候选引物碱基序列制作工序S102(图4)、候选引物碱基序列制作第1工序S202及候选引物碱基序列制作第2工序S212(图5)、以及多个候选引物碱基序列制作工序S302(图6)进行统称,简称为“候选引物碱基序列制作工序”。
(第1方式:候选引物碱基序列制作工序S102)
在图4中,示为“候选引物碱基序列制作”。
在第1方式中,(b)候选引物碱基序列制作工序是如下工序:基于基因组DNA上的上述对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对对象区域进行PCR扩增的候选引物的碱基序列。
(第2方式:候选引物碱基序列制作第1工序S202及候选引物碱基序列制作第2工序S212)
在图5中,示为“候选引物碱基序列制作第1”及“候选引物碱基序列制作第2”。
在第2方式中,(b1)候选引物碱基序列制作第1工序是如下工序:基于基因组DNA上的上述第1的对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对第1对象区域进行PCR扩增的候选引物的碱基序列,(b2)候选引物碱基序列制作第2工序是如下工序:基于基因组DNA上中的上述第2对象区域的两端的各附近区域的碱基序列,分别制作至少各一个用于对第2对象区域进行PCR扩增的候选引物的碱基序列。
在第2方式中,对于1个对象区域进行候选引物的碱基序列的制作、候选引物的选拔、及引物的采用,对于其后的1个对象区域,重复相同的工序。
(第3方式:多个候选引物碱基序列制作工序S302)
在图6中,示为“多个候选引物碱基序列制作”。
在第3方式中,(b-0)多个候选引物碱基序列制作工序是如下工序:基于基因组DNA上的上述多个对象区域的各自的两端的各附近区域的碱基序列,分别制作至少各一个用于对多个对象区域的各个对象区域进行PCR扩增的候选引物的碱基序列。
在第3方式中,对于多个对象区域的所有对象区域,制作候选引物的碱基序列,通过以后的工序重复进行选拔及采用。
所谓对象区域的两端的各附近区域是指对自对象区域的5’端起的外侧的区域、及自对象区域的3’端起的外侧的区域进行统称。对象区域的内侧不包括在附近区域内。
对附近区域的长度没有特别限定,优选为能通过PCR扩展的长度以下,更优选为期望扩增的DNA片段长度的上限以下。特别优选为容易进行集中选择和/或序列读取的长度。可以根据PCR中使用的酶(DNA聚合酶)的种类等进行适当变更。具体的附近区域的长度优选为20~500个碱基左右、更优选为20~300个碱基左右、进一步优选为20~200个碱基左右、更进一步优选为50~200个碱基左右。
(引物的设计参数)
另外,制作候选引物的碱基序列时,与通常的引物设计方法中需要注意的事项相同,如引物的长度、GC含量(指所有核酸碱基中的鸟嘌呤(G)及胞嘧啶(C)的合计摩尔百分率。)、解链温度(指双链DNA的50%解离而成为单链DNA的温度。另外,有时也源于MeltingTemperature,称为“Tm值”。单位为“℃”。)、以及序列的偏移等。
·引物的长度
对引物的长度(核苷酸数)没有特别限定,优选为15mer~45mer、更优选为20mer~45mer、进一步优选为20mer~30mer。当引物的长度为该范围内时,易于设计特异性及扩增效率优异的引物。
·引物的GC含量
对引物的GC含量没有特别限定,优选为40摩尔%~60摩尔%、更优选为45摩尔%~55摩尔%。当GC含量为该范围内时,不易产生由高级结构引起的特异性及扩增效率下降的问题。。
·引物的Tm值
对引物的Tm值没有特别限定,优选为50℃~65℃的范围内、更优选为55℃~65℃的范围内。
对于引物的Tm值之差,在引物对及引物组中,优选设为5℃以下、更优选设为3℃以下。
Tm值可用OLIGO Primer Analysis Software(Molecular Biology Insights公司制)或Primer3(http://www-genome.wi.mit.edu/ftp/distribution/software/)等软件进行计算。
另外,也可以根据引物的碱基序列中的A、T、G及C的数量(分别设为nA、nT、nG及nC),利用下述式通过计算来求得。
Tm值(℃)=2(nA+nT)+4(nC+nG)
Tm值的计算方法并不限定于此,可以利用现有公知的各种方法来计算Tm值。
·引物的碱基的偏移
候选引物的碱基序列优选设为整体上碱基无偏移的序列。例如,希望避免局部富含GC的序列及局部富含AT的序列。
另外,还希望避免T和/或C的连续(聚嘧啶)、以及A和/或G的连续(聚嘌呤)。
·引物的3’末端
进而,优选3’末端碱基序列避免富含GC的序列或富含AT的序列。3’末端碱基优选G或C,但并不限定于此。
《特异性检查工序》
基于在“候选引物碱基序列制作工序”中制作的各候选引物的碱基序列与染色体DNA的序列互补性,可以实施评价候选引物的碱基序列的特异性的特异性检查工序(未图示)。
特异性的检查进行染色体DNA的碱基序列与候选引物的碱基序列的局部比对,在局部比对评分小于预先设定的值的情况下,可评价为该候选引物的碱基序列与基因组DNA的互补性低、特异性高。在此,希望对染色体DNA的互补链也进行局部比对。这是因为相对于引物是单链DNA,染色体DNA是双链。另外,也可以使用与其互补的碱基序列取代候选引物的碱基序列。
另外,可以将候选引物的碱基序列作为查询序列,对基因组DNA碱基序列数据库进行同源性检索。作为同源性检索工具,例如,可举出:BLAST(Basic Local AlignmentSearch Tool:基于局部比对算法的搜索工具)(Altschul,S.A.,另外4名,“Basic LocalAlignment Search Tool”,Journal of Molecular Biology,1990年,10月,第215卷,p.403-410)及FASTA(Pearson,W.R.,另外1名,“Improved tools for biologicalsequence comparison”,美国科学院纪要,美国科学院,1988年,4月,第85卷,p.2444-2448)等。作为进行同源性检索而得到的结果,可获得局部比对。
评分及局部比对评分的阈值均没有特别限定,可根据候选引物的碱基序列的长度、和/或PCR条件等适当设定。在使用同源性检索工具的情况下,可以使用该同源性检索工具的默认值。
例如,作为评分,可考虑采用匹配(互补碱基)=+1、不匹配(非互补碱基)=-1、indel(插入和/或缺失)=-3,将阈值设定为+15等。
在候选引物的碱基序列与染色体DNA上非设想的位置的碱基序列具有互补性、且特异性低的情况下,使用该碱基序列的引物进行PCR时,有时不是对对象区域进行扩增而是对伪像(artifact)进行扩增,因此不包括这种情况。
《局部比对工序》
在本说明书中,有时将局部比对工序S103(图4)、局部比对第1工序S203及局部比对第2工序S213(图5)、以及第1局部比对工序S303及第2局部比对工序S313(图6)进行统称,简称为“局部比对工序”。
(第1方式:局部比对工序S103)
在图4中,示为“局部比对”。
在第1方式中,(c)局部比对工序是如下工序:对于所有从上述候选引物碱基序列制作工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(第2方式:局部比对第1工序S203及局部比对第2工序S213)
在图5中,示为“局部比对第1”及“局部比对第2”。
在第2方式中,(c1)局部比对第1工序是如下工序:对于所有从上述候选引物碱基序列制作第1工序中所制作的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对,从而求出局部比对评分,(c2)局部比对第2工序是如下工序:对于所有从上述候选引物碱基序列制作第2工序中所制作的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(第3方式:第1局部比对工序S303及第2局部比对工序S313)
在图6中,示为“第1局部比对”及“第2局部比对”。
在第3方式中,(c-1)第1局部比对工序是如下工序:对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序位最高的第1对象区域进行PCR扩增的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对,从而求出局部比对评分,(c-2)第2局部比对工序是如下工序:对于所有从上述多个候选引物碱基序列制作工序中所制作的候选引物的碱基序列中、用于对优先序列2位的第2对象区域进行PCR扩增的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的2个碱基序列,在该进行比较的部分序列包含上述2个碱基序列的3’末端的条件下,以双序列进行局部比对而求出局部比对评分。
(局部比对的方法)
进行局部比对的碱基序列的组合可以是允许重复而选择的组合,也可以是不允许重复而选择的组合,在尚未评价同一碱基序列的引物间的引物二聚体形成性的情况下,优选允许重复而选择的组合。
对于组合的总数,将进行局部比对的碱基序列的总数设为p个,在允许重复而选择的情况下,为“pH2p+1C2=(p+1)!/2(p-1)!”,在不允许重复而选择的情况下,为“pC2=p(p-1)/2”。
局部比对是对部分序列进行的比对,可局部检查互补性高的部分。
其中,在本发明中,与通常对碱基序列进行的局部比对不同,在“进行比较的部分序列包含碱基序列的3’末端”的条件下进行局部比对,以使进行比较的部分序列包含双方的碱基序列的3’末端。
进而,在本发明中,优选方式是,在“进行比较的部分序列包含碱基序列的3’末端”的条件、即“仅考虑进行比较的部分序列自一方的序列的3’末端开始至另一方的序列的3’末端结束的比对”的条件下进行局部比对,以使进行比较的部分序列包含双方的碱基序列的3’末端。
此外,局部比对可以插入间隙。间隙是指碱基的插入和/或缺失(indel)。
另外,局部比对将碱基序列对间碱基互补的情况设定为一致(匹配),将不互补的情况设定为不一致(不匹配)。
以分别对匹配、不匹配及插入缺失评分、使总评分成为最大的方式进行比对。评分适当设定即可。例如,可以如下述表1那样设定评分。此外,表1中“-”表示间隙(插入和/或缺失(indel))。
[表1]
表1
例如,考虑对于以下表2所示的序列编号1及2的碱基序列进行局部比对。在此,评分设定如表1所示。
[表2]
表2
根据序列编号1及2的碱基序列制作表3所示的圆点阵列(点阵)。具体而言,将序列编号1的碱基序列按自5’至3’的方向从左向右排列,将序列编号2的碱基序列按自5’至3’的方向从下向上排列,对碱基为互补性的格子记入“●”,从而获得表3所示的点阵。
[表3]
表3
根据表3所示的点阵,获得以下表4所示的部分序列的比对(双序列比对)(参照表3的斜线部分)。此外,表4中,分别用“|”表示匹配,用“:”表示不匹配。
[表4]
表4
在该(双序列)比对中,有9处匹配,有8处不匹配,没有indel(间隙)。
因此,基于该(双序列)比对的局部比对评分成为(+1)×9+(-1)×8+(-1)×0=+1。
此外,比对(双序列比对)不仅可利用在此例示的点阵法来获得,而且可利用动态规划法、单词法、或其他各种方法来获得。
《第一阶段选拔工序》
在本说明书中,有时将第一阶段选拔工序S104(图4)、第一阶段选拔第1工序S204及第一阶段选拔第2工序S214(图5)、以及第1第一阶段选拔工序S304及第2第一阶段选拔工序S314(图6)进行统称,简称为“第一阶段选拔工序”。
(第1方式:第一阶段选拔工序S104)
在图4中,示为“第一阶段选拔”。
在第1方式中,(d)第一阶段选拔工序是如下工序:基于上述局部比对评分进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(第2方式:第一阶段选拔第1工序S204及第一阶段选拔第2工序S214)
在图5中,示为“第一阶段选拔第1”及“第一阶段选拔第2”。
在第2方式中,(d1)第一阶段选拔第1工序是如下工序:基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔,(d2)第一阶段选拔第2工序是如下工序:基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(第3方式:第1第一阶段选拔工序S304及第2第一阶段选拔工序S314)
在图6中,示为“第1第一阶段选拔”及“第2第一阶段选拔”。
在第3方式中,(d-1)第1第一阶段选拔工序是如下工序:基于上述局部比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔,(d-2)第2第一阶段选拔工序是如下工序:基于上述局部比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第一阶段的选拔。
(第1阶段选拔的方法)
预先设定好局部比对评分的阈值(也称为“第1阈值”。)。
如果局部比对评分小于第1阈值,则判断这些2个碱基序列的组合的二聚体形成性低,进行以后的工序。
另一方面,如果局部比对评分为第1阈值以上,则判断这些2个碱基序列的组合的引物二聚体形成性高,对于该组合而言不进行以后的工序。
对第1阈值没有特别限定,可以适当设定。例如,可以根据成为聚合酶链反应的模板的基因组DNA的量等PCR条件来设定第1阈值。
在此,考虑在上述“局部比对”所示的例子中将第1阈值设定为“+3”的情况。
在上面的例子中,由于局部比对评分为“+1”,小于作为第1阈值的“+3”,因此可判断序列编号1及2的碱基序列的组合的引物二聚体形成性低。
此外,针对在局部比对工序S103、局部比对第1工序S203、局部比对第2工序S213、第1局部比对工序S303、或者第2局部比对工序S313中计算出局部比对评分的所有组合进行本工序。
《全局比对工序》
在本说明书中,有时将全局比对工序S105(图4)、全局比对第1工序S205及全局比对第2工序S215(图5)、以及第1全局比对工序S305及第2全局比对工序S315(图6)进行统称,简称为“全局比对工序”。
(第1方式:全局比对工序S105)
在图4中,示为“全局比对”。
在第1方式中,(e)全局比对工序是如下工序:对于所有从上述第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(第2方式:全局比对第1工序S205及全局比对第2工序S215)
在图5中,示为“全局比对第1”及“全局比对第2”。
在第2方式中,(e1)全局比对第1工序是如下工序:对于所有从上述第一阶段选拔第1工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对,从而求出全局比对评分,(e2)全局比对第2工序是如下工序:对于所有从上述第一阶段选拔第2工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(第3方式:第1全局比对工序S305及第2全局比对工序S315)
在图6中,示为“第1全局比对”及“第2全局比对”。
在第3方式中,(e-1)第1全局比对工序是如下工序:对于从上述第1第一阶段选拔工序中所选拔出的候选引物的碱基序列中选择2个候选引物的碱基序列的所有组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对,从而求出全局比对评分,(e-2)第2全局比对工序是如下工序:对于所有从上述第2第一阶段选拔工序中所选拔出的候选引物的碱基序列及已经采用的引物的碱基序列中选择2个候选引物的碱基序列的组合、以及选择1个候选引物的碱基序列及1个已经采用的引物的碱基序列的组合,针对上述组合所含的包含2个碱基序列的3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
(全局比对的方法)
从由“候选引物碱基序列制作工序”制作的全部候选引物(在首先进行了“局部比对工序”及“第1阶段选拔工序”的情况下,存在局部比对评分小于第1阈值的候选引物的组合时,为该组合所含的全部候选引物。)及全部已经采用的引物(限于存在已经采用的引物的情况)组成的组中取出2个引物,针对包含3’末端的预先设定的序列长度的碱基序列,以双序列进行全局比对而求出全局比对评分。
进行全局比对的碱基排列的组合可以是允许重复而选择的组合,也可以是不允许重复而选择的组合,但在尚未评价同一碱基序列的引物间的引物二聚体形成性的情况下,优选允许重复而选择的组合。
对于组合的总数,将进行全局比对的碱基序列的总数设为x个,在允许重复而选择的情况下,为“xH2x+1C2=(x+1)!/2(x-1)!”,在不允许重复而选择的情况下,为“xC2=x(x-1)/2”。
全局比对是对“整个序列”进行的比对,可检查整个序列的互补性。
其中,在此,“整个序列”是包含候选引物的碱基序列的3’末端的预先设定的序列长度的整个碱基序列。
此外,全局比对可以插入间隙。间隙是指碱基的插入和/或缺失(indel)。
另外,全局比对将碱基序列对间碱基互补的情况设定为一致(匹配),将不互补的情况设定为不一致(不匹配)。
以分别对匹配、不匹配及indel评分、使总评分成为最大的方式进行比对。评分适当设定即可。例如,可以如上述表1那样设定评分。此外,表1中“-”表示间隙(插入和/或缺失(indel))。
例如,对于以下的表5所示的序列编号1及2的碱基序列,考虑对各自的3’末端的3碱基(大写字母处)进行全局比对。在此,评分设定如表1所示。
[表5]
表5
当以使评分成为最大的方式对于序列编号1的碱基序列的3’末端的3碱基(大写字母处)及序列编号2的3’末端的3碱基(大写字母处)的碱基序列进行全局比对时,可获得以下的表6所示的比对(双序列比对)。此外,表6中,用“:”表示不匹配。
[表6]
表6
该(双序列)比对中,有3处不匹配,匹配及插入缺失(间隙)均没有。
因此,基于该(双序列)比对的全局比对评分成为(+1)×0+(-1)×3+(-1)×0=-3。
此外,比对(双序列比对)可利用点阵法、动态规划法、单词法、或者其他各种方法来获得。
《第二阶段选拔工序》
在本说明书中,有时将第二阶段选拔工序S106(图4)、第二阶段选拔第1工序S206及第二阶段选拔第2工序S216(图5)、以及第1第二阶段选拔工序S306及第2第二阶段选拔工序S316(图6)进行统称,简称为“第二阶段选拔工序”。
(第1方式:第二阶段选拔工序S106)
在图4中,示为“第二阶段选拔”。
在第1方式中,(f)第二阶段选拔工序是如下工序:基于上述全局比对评分,进行用于对上述对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(第2方式:第二阶段选拔第1工序S206及第二阶段选拔第2工序S216)
在图5中,示为“第二阶段选拔第1”及“第二阶段选拔第2”。
在第2方式中,(f1)第二阶段选拔第1工序是如下工序:基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔,(f2)第二阶段选拔第2工序是如下工序:基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(第3方式:第1第二阶段选拔工序S306及第2第二阶段选拔工序S316)
在图6中,示为“第1第二阶段选拔”及“第2第二阶段选拔”。
在第3方式中,(f-1)第1第二阶段选拔工序是如下工序:基于上述全局比对评分,进行用于对上述第1对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔,(f-2)第2第二阶段选拔工序是如下工序:基于上述全局比对评分,进行用于对上述第2对象区域进行PCR扩增的候选引物的碱基序列的第二阶段的选拔。
(第二阶段选拔的方法)
预先设定好全局比对评分的阈值(也称为“第2阈值”。)。
如果全局比对评分小于第2阈值,则判断这些2个碱基序列的组合的二聚体形成性低,进行以后的工序。
另一方面,如果全局比对评分为第2阈值以上,则判断这些2个碱基序列的组合的二聚体形成性高,对于该组合而言不进行以后的工序。
对第2阈值没有特别限定,可以适当设定。例如,可以根据成为聚合酶链反应的模板的基因组DNA的量等PCR条件来设定第2阈值。
此外,通过将引物的自3’末端起的多个碱基的碱基序列设定为同一碱基序列,可将对包含各引物的碱基序列的3’末端的预先设定的碱基数量的碱基序列以双序列进行全局比对而求出的全局比对评分设定为小于第2阈值。
在此,在上述“全局比对工序”所示的例子中,考虑将第2阈值设定为“+3”的情况。
在上面的例子中,由于全局比对评分为“-3”,小于作为第2阈值的“+3”。因此可判断序列编号1及2的碱基序列的组合的引物二聚体形成性低。
此外,针对在全局比对工序S105、全局比对第1工序S205、全局比对第2工序S215、第1全局比对工序S305、或第2全局比对工序S315中计算了全局比对评分的所有组合进行本工序。
另外,为了减少计算量,优选预先实施“全局比对工序”及“第2阶段选拔工序”两工序,针对通过了“第2阶段选拔工序”的引物的碱基序列的组合,实施“局部比对工序”及“第1阶段选拔工序”两工序。特别是,对象区域数越增加,候选引物的碱基排列数越增加,减少计算量的效果越好,从而可实现整体处理的高速化。
这是因为,由于在“全局比对工序”中对“预先设定的序列长度”的较短长度的碱基序列进行全局比对,因此,计算量少于在包含3’末端的条件下从整个碱基序列中找出互补性高的部分序列的局部比对评分,从而可快速进行处理。此外,在通常所知的算法中,已知如果是针对相同长度的序列的比对,则全局比对的速度比局部比对快。
《扩增序列长度检查工序》
针对在“第1阶段选拔工序”及“第2阶段选拔工序”中判断为引物二聚体形成性低的候选引物的碱基序列的组合,可以实施扩增序列长度检查工序,即,计算在染色体DNA上的候选引物的碱基序列的端部之间的距离,判断该距离是否为预先设定的范围内(未图示)。
如果碱基序列的端部之间的距离为预先设定的范围内,则可判断该候选引物的碱基序列的组合可以对对象区域适当地进行扩增的可能性大。对候选引物的碱基序列的端部之间的距离没有特别限定,可根据酶(DNA聚合酶)的种类等PCR条件适当设定。例如,可设定为100~200个碱基(对)的范围内、120~180个碱基(对)的范围内、140~180个碱基(对)的范围内、140~160个碱基(对)的范围内、160~180个碱基(对)的范围内等各种范围。
《引物采用工序》
在本说明书中,有时将引物采用工序S107(图4)、引物采用第1工序S207及引物采用第2工序S217(图5)、以及第1引物采用工序S307及第2引物采用工序S317(图6)进行统称,简称为“引物采用工序”。
(第1方式:引物采用工序S107)
在图4中,示为“引物采用”。
在第1方式中,(g)引物采用工序是如下工序:采用上述第一阶段选拔工序及上述第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述对象区域进行PCR扩增的引物的碱基序列。
(第2方式:引物采用第1工序S207及引物采用第2工序S217)
在图5中,示为“引物采用第1”及“引物采用第2”。
在第2方式中,(g1)引物采用第1工序是如下工序:采用上述第一阶段选拔第1工序及上述第二阶段选拔第1工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增的引物的碱基序列,(g2)引物采用第2工序是如下工序:采用上述第一阶段选拔第2工序及上述第二阶段选拔第2工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
(第3方式:第1引物采用工序S307及第2引物采用工序S317)
在图6中,示为“第1引物采用”及“第2引物采用”。
在第3方式中,(g-1)第1引物采用工序是如下工序:采用上述第1第一阶段选拔工序及上述第1第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第1对象区域进行PCR扩增引物的碱基序列,(g-2)第2引物采用工序是如下工序:采用上述第2第一阶段选拔工序及上述第2第二阶段选拔工序的任一工序中所选拔出的候选引物的碱基序列,作为用于对上述第2对象区域进行PCR扩增的引物的碱基序列。
(引物采用的方法)
在引物采用工序中,采用如下所述的候选引物的碱基序列作为用于对对象区域进行扩增的引物的碱基序列,即,对于各候选引物的碱基序列,在进行比较的部分序列包含该碱基序列的3’末端的条件下,以双序列进行局部比对而求出的局部比对评分小于第1阈值,并且,对于包含各候选引物的碱基序列的3’末端的预先设定的碱基数量的碱基序列,以双序列进行全局比对而求出的全局比对评分小于第2阈值。
例如,考虑采用表7所示的序列编号1及2的碱基序列作为对对象区域进行扩增的引物的碱基序列。
[表7]
表7
如上所述,在序列编号1和序列编号2的组合中,由于局部比对评分为“+1”,因此小于作为第1阈值的“+3”,另外,由于全局比对评分为“-3”,因此小于作为第2阈值的“+3”。
因此,可采用序列编号1所示的候选引物的碱基序列及序列编号2所示的候选引物的碱基序列作为用于对对象区域进行扩增的引物的碱基序列。
《其他扩增候选区域的引物设计》
在针对1个扩增候选区域采用引物后,可以进一步对其次优先序位的扩增候选区域设计引物。
在第1方式中,在候选引物碱基序列制作工序S102中,如果制作了针对其次优先序位的扩增候选区域的候选引物的碱基序列,则自局部比对工序S103起进行。如果没有制作针对其次优先序位的扩增候选区域的候选引物的碱基序列,则由于在对象区域选择工序S101中没有选择其次优先序位的扩增候选区域,因此,在对象区域选择工序S101中选择其次优先序位的扩增候选区域,在候选引物碱基序列制作工序S102中,制作针对该扩增候选区域的候选引物的碱基序列后,进行局部比对工序S103以后的工序。
在第2方式中,自对象区域选择第2工序S211起重复。
在第3方式中,由于已经在多个候选引物碱基序列制作工序S302中制作了针对在多个对象区域选择工序S301中选择的扩增候选区域的候选引物的碱基序列,因此自第2局部比对工序S313起重复。
《引物等的设计中的特征点》
对扩增候选区域附加优先序位后的引物等的设计中的特征点在于,概括地说,选择多个特定的对象区域,检索邻近的碱基序列,确认与已提取各引物组的互补性,选择互补性少的碱基序列,由此获得扩增对象包括对象区域、且相互不形成互补的引物组。
引物的碱基序列的互补性的确认中的特征点在于,以使用局部比对而使整个序列的互补性变低、且对引物的碱基序列的端部使用全局比对而使互补性变低的方式来制作引物组。
[实施例]
[实施例1]
设计用于对表8所示的扩增候选区域进行PCR扩增的供多重PCR的引物。
本实施例的目的在于,对85处中、53处以上的扩增候选区域设计引物。
[表8]
表8
(第1优先序位的设定)
按照表8所示的扩增候选区域V1~V85的坐标值顺序设定了第1优先序位。
(第1优先序位设定后的引物设计)
依照第1优先序位,设计用于对各扩增候选区域进行PCR扩增的引物的结果是,能够对以下52处扩增候选区域设计引物。
[表9]
表9
(第2优先序位的设定)
将扩增候选区域V1~V85按坐标值顺序分割为包含20处扩增候选区域的4个区段和包含5处扩增候选区域的1个区段,即,包含V1~V20的区段1、包含V21~V40的区段2、包含V41~V60的区段3、包含V61~V80的区段4及包含V81~V85的区段5。
接着,在各区段内进行随机全排列,得到随机变更了区段内的各扩增候选区域的顺序的序列。
将区段1~5按该顺序结合,解除区段分割,得到重新排列了V1~V85的扩增候选区域的顺序的序列。
将该V1~V85的顺序设为第2优先序位。
(第2优先序位设定后的引物设计)
依照第2优先序位,设计用于对各扩增候选区域进行PCR扩增的引物的结果是,能够对以下54处扩增候选区域设计引物。
[表10]
表10
符号说明
11 运算装置(CPU)
12 存储装置(内存)
13 辅助存储装置(存储器)
14 输入装置(键盘)
15 辅助输入装置(鼠标)
16 显示装置(监视器)
17 输出装置(打印机)

Claims (3)

1.一种供多重PCR的引物的设计方法,所述引物用于对基因组上的n个扩增候选区域中t个以上的扩增候选区域进行扩增,所述方法包括以下工序:
第1优先序位设定工序,对于基因组DNA上的n个扩增候选区域,附加作为第1个至第n个的顺序的第1优先序位;
第1引物设计工序,按照所述第1优先序位的顺序,自所述第1优先序位为第1个的扩增候选区域起,依次设计用于对该扩增候选区域进行PCR扩增的引物;
第1成功与否判断工序,将所述第1引物设计工序中能够设计引物的扩增候选区域数设为m个,当m≥t时,确定结束引物的设计,当m<t时,确定进入下一个工序;
第2优先序位设定工序,对于所述n个扩增候选区域,附加作为第1个至第n个的顺序的与第1优先序位的顺序不同的第2优先序位;以及
第2引物设计工序,按照所述第2优先序位的顺序,自所述第2优先序位为第1个的扩增候选区域起,依次设计用于对该扩增候选区域进行PCR扩增的引物,其中,
所述第2优先序位设定工序是如下工序:
通过输入装置输入所述n个扩增候选区域的识别信息及第1优先序位信息,并存储于存储装置;
运算装置制作按所述第1优先序位的顺序排列、且以所述n个扩增候选区域为要素的第1序列,并存储于存储装置;
运算装置将按所述第1优先序位的顺序排列的所述n个扩增候选区域分割为j个区段,以使第i个区段包括ki个扩增候选区域,并存储于存储装置;
运算装置在所述j个区段中至少1个区段的内部重新排列该至少1个区段所含的扩增候选区域,并存储于存储装置;以及
运算装置将第1个至第j个的区段依次结合,解除区段分割,制作第2序列,将所述第2序列所含的所述n个扩增候选区域的顺序设为所述n个扩增候选区域的第2优先序位,
其中,n为满足n≥4的整数,t为满足2≤t≤n的整数,m为满足0≤m≤n的整数,i为满足1≤i≤j的整数,j为满足2≤j≤n/2的整数,ki为满足2≤ki≤{n-2×(j-1)}的整数。
2.如权利要求1所述的供多重PCR的引物的设计方法,其中,
在所述第2引物设计工序之后,
进一步包括第2成功与否判断工序,即,将在所述第2引物设计工序中能够设计引物的扩增候选区域数设为m’个,当m’≥t时,确定结束引物的设计,当m’<t时,确定返回所述第2优先序位设定工序;
其中,m’为满足0≤m’≤n的整数。
3.如权利要求1或2所述的供多重PCR的引物的设计方法,其中,在所述第2优先序位设定工序中,在所述至少1个区段内随机变更所述扩增候选区域的顺序。
CN201780060312.3A 2016-09-29 2017-09-07 供多重pcr的引物的设计方法 Pending CN109804079A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016-192158 2016-09-29
JP2016192158 2016-09-29
PCT/JP2017/032287 WO2018061699A1 (ja) 2016-09-29 2017-09-07 マルチプレックスpcrに供するプライマーの設計方法

Publications (1)

Publication Number Publication Date
CN109804079A true CN109804079A (zh) 2019-05-24

Family

ID=61760641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780060312.3A Pending CN109804079A (zh) 2016-09-29 2017-09-07 供多重pcr的引物的设计方法

Country Status (5)

Country Link
US (1) US20190221287A1 (zh)
EP (1) EP3521425A4 (zh)
JP (1) JPWO2018061699A1 (zh)
CN (1) CN109804079A (zh)
WO (1) WO2018061699A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2663234T3 (es) 2012-02-27 2018-04-11 Cellular Research, Inc Composiciones y kits para recuento molecular
AU2014312208B2 (en) 2013-08-28 2019-07-25 Becton, Dickinson And Company Massively parallel single cell analysis
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
CN107406888A (zh) 2015-03-30 2017-11-28 赛卢拉研究公司 用于组合条形编码的方法和组合物
CN107580632B (zh) * 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
JP6940484B2 (ja) 2015-09-11 2021-09-29 セルラー リサーチ, インコーポレイテッド ライブラリー正規化のための方法および組成物
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
KR102522023B1 (ko) 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
US20180237853A1 (en) * 2017-02-19 2018-08-23 Yan Wang Methods, Compositions and Kits for Detection of Mutant Variants of Target Genes
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
EP3788170A1 (en) 2018-05-03 2021-03-10 Becton, Dickinson and Company Molecular barcoding on opposite transcript ends
CN112805389A (zh) 2018-10-01 2021-05-14 贝克顿迪金森公司 确定5’转录物序列
CN112969789A (zh) 2018-11-08 2021-06-15 贝克顿迪金森公司 使用随机引发的单细胞全转录组分析
WO2020123384A1 (en) 2018-12-13 2020-06-18 Cellular Research, Inc. Selective extension in single cell whole transcriptome analysis
CN113574178A (zh) 2019-01-23 2021-10-29 贝克顿迪金森公司 与抗体关联的寡核苷酸
CN114051534A (zh) 2019-07-22 2022-02-15 贝克顿迪金森公司 单细胞染色质免疫沉淀测序测定
EP4055160B1 (en) 2019-11-08 2024-04-10 Becton Dickinson and Company Using random priming to obtain full-length v(d)j information for immune repertoire sequencing
EP4090763A1 (en) 2020-01-13 2022-11-23 Becton Dickinson and Company Methods and compositions for quantitation of proteins and rna
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
CN117280044A (zh) * 2021-10-29 2023-12-22 京东方科技集团股份有限公司 一种基于迭代的多重pcr引物设计方法及系统
WO2024047992A1 (ja) * 2022-08-31 2024-03-07 富士フイルム株式会社 アンプリコンメチル化シーケンス解析用のプライマーの設計方法、製造方法、設計装置、設計プログラムおよび記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004691A1 (fr) * 2006-07-04 2008-01-10 Shimadzu Corporation appareil pour concevoir des amorces d'amplification d'acides nucléiques, programme pour concevoir des amorces et appareil de serveur pour concevoir des amorces
WO2014055561A1 (en) * 2012-10-01 2014-04-10 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000308487A (ja) * 1999-03-30 2000-11-07 Japan Science & Technology Corp プライマー塩基配列の選定方法及びその装置
JP2015136314A (ja) * 2014-01-21 2015-07-30 株式会社ダナフォーム クローン開発製造販売の方法
EP3521446A4 (en) * 2016-09-29 2019-10-30 FUJIFILM Corporation METHOD FOR DESIGNING PRIMER FOR MULTIPLEX PCR
WO2018061695A1 (ja) * 2016-09-29 2018-04-05 富士フイルム株式会社 マルチプレックスpcrに供するプライマーの設計方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004691A1 (fr) * 2006-07-04 2008-01-10 Shimadzu Corporation appareil pour concevoir des amorces d'amplification d'acides nucléiques, programme pour concevoir des amorces et appareil de serveur pour concevoir des amorces
WO2014055561A1 (en) * 2012-10-01 2014-04-10 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
饶文波: "引物设计及其在EGFR基因分型中的应用", 《中国优秀硕士学位论文全文数据库 基础科学专辑》 *

Also Published As

Publication number Publication date
JPWO2018061699A1 (ja) 2019-06-24
WO2018061699A1 (ja) 2018-04-05
EP3521425A4 (en) 2019-10-23
US20190221287A1 (en) 2019-07-18
EP3521425A1 (en) 2019-08-07

Similar Documents

Publication Publication Date Title
CN109804079A (zh) 供多重pcr的引物的设计方法
CN109790537A (zh) 供多重pcr的引物的设计方法
Twyford et al. Next-generation hybridization and introgression
Hudson Sequencing breakthroughs for genomic ecology and evolutionary biology
CN109790569A (zh) 供多重pcr的引物的设计方法
EP3169806B1 (en) Systems and methods for detecting structural variants
WO2015050919A1 (en) Systems and methods for detecting structural variants
CN109643578B (zh) 用于设计基因组合的方法和系统
US20180032669A1 (en) Method for designing primer used for polymerase chain reaction and primer set
CN106282352B (zh) 目标区域捕获探针及其设计方法
US10504612B2 (en) Polynucleotide probe design
US7711491B2 (en) Computational method and system for modeling, analyzing, and optimizing DNA amplification and synthesis
Blow Genomics: catch me if you can
CN109097458A (zh) 基于ngs读段搜索实现序列延伸的虚拟pcr方法
US11566281B2 (en) Systems and methods for paired end sequencing
Kudella et al. Ligation of random oligomers leads to emergence of autocatalytic sequence network
Garbarine et al. An information theoretic method of microarray probe design for genome classification
Das et al. Package ‘GSAQ’
WO2020008968A1 (ja) 情報処理システム、変異検出システム、記憶媒体および情報処理方法
Lin et al. Primer design for multiplex PCR using a genetic algorithm
Kim et al. Bio-Soft Computational and Tabu Search Methods for Solving a Multi-Task Project Scheduling Problem.
WO2019171601A1 (ja) 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム
Smith Rna search acceleration with genetic algorithm generated decision trees
Goossens et al. Sequences used in this chapter
Sadatmousavi Optimum primer design to perform targeted genome sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190524