WO2018061699A1 - マルチプレックスpcrに供するプライマーの設計方法 - Google Patents

マルチプレックスpcrに供するプライマーの設計方法 Download PDF

Info

Publication number
WO2018061699A1
WO2018061699A1 PCT/JP2017/032287 JP2017032287W WO2018061699A1 WO 2018061699 A1 WO2018061699 A1 WO 2018061699A1 JP 2017032287 W JP2017032287 W JP 2017032287W WO 2018061699 A1 WO2018061699 A1 WO 2018061699A1
Authority
WO
WIPO (PCT)
Prior art keywords
primer
candidate
amplification
priority
candidate regions
Prior art date
Application number
PCT/JP2017/032287
Other languages
English (en)
French (fr)
Inventor
尭之 辻本
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2018542326A priority Critical patent/JPWO2018061699A1/ja
Priority to EP17855657.7A priority patent/EP3521425A4/en
Priority to CN201780060312.3A priority patent/CN109804079A/zh
Publication of WO2018061699A1 publication Critical patent/WO2018061699A1/ja
Priority to US16/370,434 priority patent/US20190221287A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Definitions

  • the present invention relates to a method for designing a primer for use in multiplex PCR (Polymerase Chain Reaction).
  • Gene analysis can be easily performed by a DNA (Deoxyribonucleic acid) sequencer that has been developed in recent years.
  • the total base length of the genome is generally enormous, while the read capability of the sequencer is limited. Therefore, the PCR method is widely used as a technique for performing gene analysis efficiently and accurately by performing PCR amplification only on a necessary specific gene region and performing reading only in the base sequence.
  • a method of selectively PCR-amplifying a plurality of gene regions by simultaneously supplying a plurality of types of primers to a certain PCR reaction system is referred to as multiplex PCR.
  • Multiplex PCR is a useful technique for noninvasive prenatal diagnosis because it efficiently amplifies multiple regions from a small amount of DNA.
  • primer sets that can reliably perform direct multiplex PCR on small DNA samples of several pg to tens of pg or less, such as genomic DNA extracted from a single cell, is complementary and Primer design conditions such as specificity are very strict, so the degree of difficulty is high and it may not be possible to design primers for PCR amplification for all amplification candidate regions.
  • the inventor has set priorities for the amplification candidate regions, and when designing primers for PCR amplification of the respective amplification candidate regions according to the priorities, the priorities are not set for the amplification candidate regions. It was shown that primers for PCR amplification can be designed for a larger number of candidate amplification regions than in the case of the above.
  • the number of amplification candidate regions for which PCR amplification primers can be designed is the region necessary for analysis such as genotyping or chromosome number quantification in the first place. Even if the number of amplification candidate regions for which PCR amplification is possible is less than the number of regions required for analysis, the PCR amplification product can be obtained when multiplex PCR is performed. In some cases, the number of amplification target regions obtained was smaller than the number of regions necessary for analysis.
  • the design of the primer will be redone, but it may be desirable not to change its global characteristics if the priorities previously set are based on the intention.
  • the present invention sets the priority order for the amplification candidate regions and, as a result of designing the primers, if the number of amplification candidate regions for which the primers could be designed does not reach the desired number, the priority set previously It is an object of the present invention to provide a primer design method for multiplex PCR that can redesign primers while maintaining the global characteristics of the order.
  • the present inventor has learned that, when redesigning a primer, the priority of the amplification candidate region is changed and the design of the primer is performed again. Completed.
  • the present invention includes the following [1] to [3].
  • the number of candidate amplification regions for which primers could be designed in the first primer design step is m, and when m ⁇ t, the primer design is finished, and when m ⁇ t, the next step
  • a first success / failure determination step that determines to proceed to Second priority setting for assigning a second priority to the n amplification candidate regions in the first to nth order, which is different from the first priority order.
  • the second priority order setting step includes: The identification information of the n amplification candidate regions and the first priority information are input via the input unit and stored in the storage unit, A computing means arranges in the order of the first priority, creates a first permutation having the n amplification candidate regions as elements, and stores them in the storage means;
  • the n amplification candidate areas arranged by the arithmetic means in the order of the first priority are divided into j blocks so that the i-th block includes k i amplification candidate areas, and stored.
  • the arithmetic means rearranges the amplification candidate regions included in the block within at least one of the j blocks, and stores the rearranged candidate areas in the storage means.
  • the arithmetic means sequentially joins the first to jth blocks, cancels the block division, creates a second permutation, and determines the order of the n amplification candidate regions included in the second permutation. It is a step of setting the second priority of the n amplification candidate regions, A method for designing a primer to be subjected to multiplex PCR for amplifying t or more amplification candidate regions among n amplification candidate regions on a genome.
  • n is an integer satisfying n ⁇ 4
  • t is an integer satisfying 2 ⁇ t ⁇ n
  • m is an integer satisfying 0 ⁇ m ⁇ n
  • i is an integer satisfying 1 ⁇ i ⁇ j
  • J is an integer that satisfies 2 ⁇ j ⁇ n / 2
  • k i is an integer that satisfies 2 ⁇ k i ⁇ ⁇ n ⁇ 2 ⁇ (j ⁇ 1) ⁇ .
  • the number of amplification candidate regions for which a primer could be designed is m ′, and when m ′ ⁇ t, the primer design is terminated, and when m ′ ⁇ t,
  • the priority when the priority is set to the amplification candidate regions and the primers are designed, when the number of amplification candidate regions for which the primers can be designed does not reach the desired number, the priority set previously is set. It is possible to provide a method for designing a primer for multiplex PCR, which can redesign the primer while maintaining the global characteristics of the ranking.
  • the number of candidate amplification regions for which primers used for PCR amplification can be designed may be increased compared to before the redesign. In some cases, it is expected that the number of regions necessary for analysis such as genotyping or chromosome number quantification can be secured.
  • FIG. 1 is a conceptual diagram showing hardware used in the priority order setting step in the present invention.
  • FIG. 2 is a flowchart for explaining an overall image of a primer designing method for use in the multiplex PCR of the present invention.
  • FIG. 3 is a diagram illustrating a second priority setting method in a primer designing method for use in multiplex PCR according to the present invention by way of a specific example.
  • FIG. 4 is a flowchart for explaining a first aspect of the primer designing method after setting the first priority or the second priority in the primer designing method for use in the multiplex PCR of the present invention.
  • FIG. 5 is a flowchart for explaining a second aspect of the primer design method after setting the first priority or the second priority in the primer design method used in the multiplex PCR of the present invention.
  • FIG. 6 is a flowchart for explaining a third aspect of the primer design method after setting the first priority or the second priority in the primer design method used for the multiplex PCR of the present invention.
  • a range represented by using “to” means a range including both ends described before and after “to” in the range.
  • “A to B” for A and B represents a range including A and B.
  • the amplification candidate region is a region on the genomic DNA, and refers to a candidate region that is PCR-amplified for purposes such as genotyping or chromosome number quantification.
  • the apparatus (also referred to as “hardware” or “execution apparatus”) that executes the priority setting method according to the present invention will be described with reference to FIG.
  • priorities are set by calculating means (CPU; Central Processing Unit) 11, storage means (memory) 12, auxiliary storage means (storage) 13, input means (keyboard) 14, and display.
  • hardware including means (monitor) 16.
  • the apparatus may further include auxiliary input means (mouse) 15 and output means (printer) 17.
  • the input means (keyboard) 14 is a means for inputting instructions and data to the apparatus.
  • the auxiliary input means (mouse) 15 is used in place of or together with the input means (keyboard) 14.
  • the calculation means (CPU) 11 is a means for performing calculation processing.
  • the storage means (memory) 12 is a means for storing the result of the arithmetic processing of the arithmetic means (CPU) 11 and storing the input from the input means (keyboard) 14.
  • the auxiliary storage means (storage) 13 is a storage for storing an operating system, a program for determining the required number of loci, and the like. A part of the auxiliary storage means (storage) 13 can be used to expand the storage means (memory) 12 (virtual memory).
  • the method for designing primers used for the multiplex PCR of the present invention includes the following steps. (1) A first priority setting step for assigning a first priority in the order from the first to the n-th to n amplification candidate regions on the genomic DNA ("first" in FIG. 1 priority setting "). However, n is an integer satisfying n ⁇ 4. (2) A first primer for designing a primer for PCR amplification of the amplification candidate regions in order from the first amplification candidate region according to the order of the first priority. Design process (“first primer design” in FIG. 2).
  • a first success / failure determination step (“number of amplification candidate regions for which primers can be designed m” in FIG. 2), which is determined to proceed to the next step.
  • t is an integer that satisfies 2 ⁇ t ⁇ n
  • m is an integer that satisfies 0 ⁇ m ⁇ n.
  • a second priority is assigned to the n amplification candidate regions in the order from the first to the nth, which is different from the order of the first priority.
  • Priority order setting step (“second priority order setting" in FIG.
  • FIG. 2 shows this as a “first priority setting step”.
  • the n-th amplification candidate regions are respectively assigned the first to n-th order without overlapping.
  • This order is the order for designing the primers.
  • the ordering method is not particularly limited, but for example, there is the following method.
  • Identification information and coordinate information of n amplification candidate regions on the same chromosomal DNA are input via the input means and stored in the storage means 12.
  • the calculation means 11 searches for the amplification candidate area having the smallest coordinate value from the identification information and the coordinate information of the amplification candidate area stored in the storage means, and attaches priority order information having the first priority to the amplification candidate area. And stored in the storage means 12.
  • the calculation means 11 searches the amplification candidate area having the maximum coordinate value from the identification information and coordinate information of the amplification candidate area stored in the storage means, and attaches priority order information of the second highest priority to the amplification candidate area. And stored in the storage means 12.
  • the identification information of the amplification candidate region stored in the storage unit from the coordinate information and the priority information, the coordinate values priority is i-position r i DN is R i amplified candidates
  • An amplification candidate region whose region and priority are jth, whose coordinate value is rj , and whose identification name is Rj , and between the amplification candidate region Ri and the amplification candidate region Rj , Is searched for an amplification candidate region R i and an amplification candidate region R j that satisfy the condition that there is at least one amplification candidate region that has not yet been prioritized.
  • the priority order may be set as follows.
  • the computing means 11 searches the amplification candidate area having the maximum coordinate value from the identification information and coordinate information of the amplification candidate area stored in the storage means, and attaches priority order information of the first priority to the amplification candidate area. And stored in the storage means 12.
  • the calculation means 11 searches for the amplification candidate area having the smallest coordinate value from the identification information and coordinate information of the amplification candidate area stored in the storage means, and attaches priority order information of the second highest priority to the amplification candidate area. And stored in the storage means 12.
  • n is an integer that satisfies 3 ⁇ n
  • k is an integer that satisfies 3 ⁇ k ⁇ n
  • i and j are 1 ⁇ i ⁇ k ⁇ 1, 1 ⁇ j ⁇ k ⁇ 1, and i R i and r j are r min ⁇ r i ⁇ r max , r min ⁇ r j ⁇ r max , and r i ⁇ r j , where r min and r max are It is the minimum value and the maximum value of the coordinate values of the amplification candidate regions.
  • a specific example (1) of the above priority setting method can be described as follows.
  • an amplification candidate region having the minimum coordinate value r min is defined as R min
  • an amplification candidate region having the maximum coordinate value r max is defined as R max .
  • one of the two candidate amplification regions, the amplification candidate region R min and the amplification candidate region R max is given the first priority. That is, the first priority is given to the amplification candidate region Rmin , or the first priority is given to the amplification candidate region Rmax .
  • the second priority ranking is given to the other except the one given the first priority ranking. That is, when the amplification candidate region R min is given the first priority, the amplification candidate region R max is given the second priority. When the amplification candidate region R max is given the first priority, the amplification candidate region R max is amplified. The candidate area Rmin is given the second priority.
  • the third to h-th amplification candidate regions are assumed to have already been given priorities from the first place to the (h ⁇ 1) -th place, and the amplification candidate regions R with the priority order p-position are assigned.
  • the amplification candidate region having the coordinate value closest to the coordinate value (r p + r q ) / 2 of the midpoint of the amplification candidate region R q to which p and the priority order q are attached is assigned the priority order h.
  • r p and r q are coordinate values of the amplification candidate region R p and the amplification candidate region R q , respectively.
  • two or more sets may select a set randomly, but priority towards coordinate value is smaller, or a larger coordinate value You may adopt a policy that gives priority to.
  • R 1 is R min or R max the first priority is assigned
  • R 2 is R min or R max of the second priority is assigned.
  • h is an integer satisfying 3 ⁇ h ⁇ n.
  • p and q are 1 ⁇ p ⁇ h ⁇ 1, 1 ⁇ q ⁇ h ⁇ 1, and p ⁇ q.
  • r p and r q are r min ⁇ r p ⁇ r max , r min ⁇ r q ⁇ r max , and r p ⁇ r q .
  • priority setting ends.
  • the priority order for the amplification candidate region is set so that the priority order does not overlap.
  • Identification information and coordinate information of n amplification candidate regions on the same chromosomal DNA are input via the input means and stored in the storage means 12.
  • the calculation means 11 searches for the amplification candidate area having the smallest coordinate value from the identification information and the coordinate information of the amplification candidate area stored in the storage means, and attaches priority order information having the first priority to the amplification candidate area. And stored in the storage means 12. Based on the identification information, coordinate information, and priority information of the amplification candidate area stored in the storage means, the calculating means 11 identifies the identification name R k-1 and coordinate value r of the amplification candidate area that has the k-1th priority.
  • the priority order may be set as follows.
  • the computing means 11 searches the amplification candidate area having the maximum coordinate value from the identification information and coordinate information of the amplification candidate area stored in the storage means, and attaches priority order information of the first priority to the amplification candidate area. And stored in the storage means 12.
  • n is an integer satisfying 3 ⁇ n
  • k is an integer satisfying 2 ⁇ k ⁇ n
  • t is a real number satisfying t>
  • r min and r max is the minimum value and the maximum value of the coordinate values of the n amplification candidate regions, respectively.
  • a specific example (2) of the first priority setting method can be described as follows.
  • an amplification candidate region having the minimum coordinate value r min is defined as R min
  • an amplification candidate region having the maximum coordinate value r max is defined as R max .
  • priority is given to the amplification candidate region R 1 that exists between the two amplification candidate regions of the amplification candidate region R min and the amplification candidate region R max and has the coordinate value r 1 that satisfies r min ⁇ r 1 ⁇ r max. Rank first. That is, the amplification candidate region R min may be given the first priority, the amplification candidate region R max may be given the first priority, or both of the amplification candidate region R min and the amplification candidate region R max . Different amplification candidate regions may be given the first priority.
  • the priority order h is assigned to the amplification candidate regions that satisfy a predetermined condition.
  • An amplification candidate region that satisfies the predetermined condition is determined as follows.
  • the coordinate values of priority (h-1) amplification candidate region-position attached R h-1 and r h-1, it consider the value "S r h-1 + s" obtained by adding the threshold s.
  • s is a real number satisfying s> 0, and may be referred to as a “threshold” in the present invention.
  • (1) -1 When there is an amplification candidate region that has not yet been prioritized
  • (1) -2 When there is no amplification candidate region that has not yet been prioritized
  • the priority order h is assigned to the amplification candidate region having the smallest coordinate value with the coordinate value equal to or greater than (r h-1 + s) and not yet prioritized.
  • s is the distance between the amplifying candidate region R h priority (h-1) position of amplification the candidate region R h-1 and priority h position. The larger s is, the larger the distance between R h-1 and R h is, and the influence on each other is usually smaller.
  • the priority order h is assigned to the amplification candidate region having the smallest coordinate value with the coordinate value equal to or greater than r min and which has not yet been prioritized.
  • h is an integer satisfying 2 ⁇ h ⁇ n.
  • s is a real number satisfying s> 0, and can be appropriately set according to the chromosomal DNA size or the coordinates of the amplification candidate region, but is preferably 100,000 or more, more preferably 1,000,000 or more, More preferably, it is 5,000,000 or more.
  • priority setting ends.
  • the priority order for the amplification candidate region is set so that the priority order does not overlap.
  • first primer design process and “second primer design process”. This will be described in “Primer design method after setting first priority or second priority” described later.
  • the first priority order may be set on the way.
  • the base sequences of primer candidates for all n amplification candidate regions After designing a first priority may be set, and primers may be selected from the primer candidates sequentially in that order.
  • the number of amplification candidate regions for which the primer could be designed in the second primer design step S22 is m ′, and when m ′ ⁇ t, the primer design is finished. , M ′ ⁇ t, it is determined to proceed to the next step.
  • t is an integer satisfying 2 ⁇ t ⁇ n.
  • the value of t is the target value of the amplification candidate region for which the primer can be designed, and can be appropriately set according to the purpose of analysis such as genotyping or chromosome number quantification.
  • m is an integer that satisfies 0 ⁇ m ⁇ n
  • m ′ is an integer that satisfies 0 ⁇ m ′ ⁇ n.
  • the values of m and m ′ are actual values of amplification candidate regions for which primers could be designed in the first primer design step S12 or the second primer design step S22.
  • the primer is redesigned so that m ′ ⁇ t.
  • FIG. 2 shows this as a “second priority setting step”.
  • the identification information of the n amplification candidate regions and the first priority order information are input via the input means and stored in the storage means 12, and the calculation means 11 includes the n N amplification candidate regions are taken out from a group of amplification candidate regions, arranged in the order of the first priority, and a first permutation having the n amplification candidate regions as elements is created and stored.
  • the process of storing in The calculating means 11 sequentially joins the first to jth blocks, cancels the block division, and stores them in the storage means 12, and the calculating means 11 includes a second element having the n amplification candidate regions as elements.
  • n is an integer satisfying n ⁇ 4
  • t is an integer satisfying 2 ⁇ t ⁇ n
  • m is an integer satisfying 0 ⁇ m ⁇ n
  • i is an integer satisfying 1 ⁇ i ⁇ j
  • J is an integer that satisfies 2 ⁇ j ⁇ n / 2
  • k i is an integer that satisfies 2 ⁇ k i ⁇ ⁇ n ⁇ 2 ⁇ (j ⁇ 1) ⁇ .
  • the method for changing the order of the amplification candidate regions in the block is not particularly limited, but it is preferable to change the order at random by random shuffling or random permutation.
  • an algorithm for generating a random permutation from a finite element can be used.
  • An example of such an algorithm is the Fisher-Yates shuffle.
  • the number of blocks that divide the amplification candidate region is not particularly limited as long as it is 2 or more, but is preferably about 10.
  • the number of amplification candidate regions included in one block is not particularly limited as long as it is two or more, but is preferably about 1/10 of the total number of amplification candidate regions. Further, the difference in the number of amplification candidate regions included in each block is preferably within 1 to 5, more preferably within 1 to 3.
  • FIG. 3A shows nine amplification candidate regions X 1 to X 9 .
  • FIG. 3B shows nine amplification candidate regions X 1 to X 9 are arranged according to the first priority.
  • the priorities are assigned in ascending order of coordinate values, they are arranged in the order of X 1 to X 9 .
  • FIG. 3C the nine amplification candidate regions X 1 to X 9 are divided into three blocks so that one block includes three amplification candidate regions.
  • the first block has three amplification candidate regions X 1 to X 3
  • the second block has three amplification candidate regions X 4 to X 6
  • the third block has X 7 to X 3.
  • Nine three amplification candidate regions are divided so as to include each.
  • the order of the amplification candidate regions is changed in each block.
  • the block division is canceled without changing the order of the blocks, and a new permutation of the amplification candidate regions is obtained.
  • the order shown in this permutation is the second priority order.
  • primer designing method after setting first priority or second priority is particularly Although not limited, it is preferable to select from the three modes described below. In this case, the primer design method after setting the first priority and the primer design method after setting the second priority may be the same or different.
  • the first mode of primer design method after priority setting includes the following (a) target region selection step, (b) primer candidate base sequence creation step, (C) a local alignment process, (d) a first stage selection process, (e) a global alignment process, (f) a second stage selection process, and (g) a primer adoption process.
  • B Primers for generating at least one base sequence of candidate primers for PCR amplification of the target region based on the base sequences of the neighboring regions at both ends of the target region on the genomic DNA.
  • Candidate base sequence creation process For all the combinations for selecting two candidate primer base sequences from the candidate primer base sequences created in the candidate primer base sequence creating step, the comparison is made with respect to the two base sequences included in the combination.
  • a local alignment step of obtaining a local alignment score by performing pairwise local alignment under the condition that the partial sequence to be included includes the 3 ′ end of the two base sequences.
  • E Preliminarily including the 3 ′ ends of the two base sequences included in the combination for all the combinations for selecting the base sequences of the two candidate primers from the base sequences of the candidate primers selected in the first stage selection step.
  • a global alignment process in which a global alignment score is obtained by performing pair-wise global alignment on a base sequence with a set sequence length.
  • G Primer adopting step in which the candidate primer base sequence selected in both the first step selecting step and the second step selecting step is adopted as a primer base sequence for PCR amplification of the target region. .
  • both the steps (c) and (d) and the steps (e) and (f) are optional. May be in the same order or simultaneously. That is, after performing the step (c) and the step (d), the step (e) and the step (f) may be performed, or the step (e) and the step (f) are performed. Thereafter, the step (c) and the step (d) may be performed. The step (c) and the step (d) may be performed in parallel with the step (e) and the step (f). You may go.
  • step (e) and the step (c) are respectively The step e ′) and the following step (c ′) are preferable.
  • step (E ′) The 3 ′ ends of the two base sequences included in the above combinations are selected for all combinations that select the base sequences of the two candidate primers from the base sequences of the candidate primers created in the primer candidate base sequence creating step.
  • the said (e) process is the following (e ') process. It is preferable that (E ′) The 3 ′ ends of the two base sequences included in the above combinations are selected for all combinations that select the base sequences of the two candidate primers from the base sequences of the candidate primers created in the primer candidate base sequence creating step.
  • the second mode of primer design method after priority setting includes the following (a 1 ) target region selection first step, and (b 1 ) primer candidate base sequence.
  • B 1 Base sequences of candidate primers for PCR amplification of the first target region are determined based on the base sequences of the neighboring regions at both ends of the first target region on the genomic DNA, respectively, First step of creating candidate primer sequences, one by one.
  • C 1 For all of the combinations for selecting two candidate primer sequences from the candidate primer sequences prepared in the first step of preparing the candidate primer sequences, the two candidate sequences included in the combination are selected.
  • the first step of local alignment in which a local alignment score is obtained by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
  • D 1 A first step selection first step of performing a first step selection of a base sequence of candidate primers for PCR amplification of the first target region based on the local alignment score.
  • (E 1 ) 3 ′ end of two base sequences included in the above combinations for selecting all the base sequences of two candidate primers from the base sequences of candidate primers selected in the first step selection first step A first step of global alignment, in which a global alignment score is obtained by performing global alignment in a pairwise manner on a base sequence having a predetermined sequence length including (F 1 ) A second step selection first step of performing a second step selection of a primer candidate base sequence for PCR amplification of the first target region based on the global alignment score. (G 1 ) The base sequence of the primer candidate selected in both the first step selection first step and the second step selection first step is the base sequence of the primer for PCR amplification of the first target region.
  • First step of primer adoption which is adopted as a sequence.
  • B 2 base sequences of candidate primers for PCR amplification of the second target region based on the base sequences of the neighboring regions at both ends of the second target region on the genomic DNA, respectively, Second step of creating candidate primer sequences, one by one.
  • the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination.
  • the second step of local alignment in which a local alignment score is obtained by performing pairwise local alignment under the above condition.
  • D 2 First step selection second step of selecting the first step of the base sequence of candidate primers for PCR amplification of the second target region based on the local alignment score.
  • (E 2 ) Combination of selecting the candidate primer base sequences from the primer candidate base sequences selected in the first step selection second step and the primer base sequences already employed and the base sequence of one primer candidate And for all combinations that select the base sequences of one already adopted primer, global alignment is performed in a pair-wise manner with respect to the base sequences having a preset sequence length including the 3 ′ ends of the two base sequences included in the combination.
  • the second step of global alignment in which a global alignment score is obtained.
  • (F 2 ) A second step selection second step of performing a second step selection of a primer candidate base sequence for PCR amplification of the second target region based on the global alignment score.
  • (G 2 ) The base sequence of the primer for PCR amplification of the second target region using the base sequence of the candidate primer selected in both the first step selection second step and the second step selection second step 2nd step of primer adoption which is adopted as a sequence.
  • both the steps (c 1 ) and (d 1 ) both the steps (c 1 ) and (d 1 )
  • the steps (e 1 ) and (f 1 ) Both steps may be in any order or simultaneously. That is, after performing the step (c 1 ) and the step (d 1 ), the step (e 1 ) and the step (f 1 ) may be performed, or the step (e 1 ) and the step (f 1 ) After performing step (c 1 ) and step (d 1 ), step (c 1 ), step (d 1 ), step (e 1 ) and step (c 1 ) The step (f 1 ) may be performed in parallel.
  • the (e 1) step and the (f 1) after step, when performing said (c 1) step and the (d 1) step, the (e 1) step and the (c 1) Step are preferably the following (e 1 ′) step and the following (c 1 ′) step, respectively.
  • (E 1 ′) For all combinations for selecting the base sequences of the two candidate primers from the base sequences of the candidate primers created in the first step of creating the candidate primer base sequence, 3 of the two base sequences included in the combination 'First step of global alignment in which a global alignment score is obtained by performing pairwise global alignment on a base sequence having a predetermined sequence length including the end.
  • All the combinations for selecting the base sequences of the two candidate primers from the base sequences of the candidate primers selected in the second step selection first step are compared with the two base sequences included in the combination.
  • the first step of local alignment in which a local alignment score is obtained by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
  • the a (c 1) step and the (d 1) step and the (e 1) step and the (f 1) step if performed in parallel, the above (e 1) step, following Preferably, the step (e 1 ′) is used.
  • (E 1 ′) For all combinations for selecting the base sequences of the two candidate primers from the base sequences of the candidate primers created in the first step of creating the candidate primer base sequence, 3 of the two base sequences included in the combination 'First step of global alignment in which a global alignment score is obtained by performing pairwise global alignment on a base sequence having a predetermined sequence length including the end.
  • both the steps (c 2 ) and (d 2 ) both the steps (c 2 ) and (d 2 )
  • the steps (e 2 ) and (f 2 ) Both steps may be in any order or simultaneously. That is, after performing the step (c 2 ) and the step (d 2 ), the step (e 2 ) and the step (f 2 ) may be performed, or the step (e 2 ) and the step (f) 2 ) After performing the step, the step (c 2 ) and the step (d 2 ) may be performed, the step (c 2 ) and the step (d 2 ), the step (e 2 ) and the step and the (f 2) step may be performed in parallel.
  • the (e 2 ) step and the (c 2 ) step are performed after the (e 2 ) step and the (f 2 ) step are performed.
  • the (e 2 ) step and the (c 2 ) step are performed.
  • (E 2 ′) A combination of selecting a primer candidate base sequence prepared from the primer candidate base sequence prepared in the second step of creating a primer candidate base sequence and a base sequence of two primer candidates from the already adopted primer base sequence and one primer candidate For all of the combinations for selecting the base sequence and the base sequence of one already adopted primer, pair-wise with respect to the base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination.
  • the second step of global alignment in which global alignment is performed to obtain a global alignment score.
  • the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination.
  • the second step of local alignment in which a local alignment score is obtained by performing pairwise local alignment under the above condition.
  • step (e 2) step and the (d 2) step and the (e 2) step and the (f 2) process, if carried out concurrently, the above (e 2) step, the following The step (e 2 ′) is preferable.
  • (E 2 ′) A combination of selecting a primer candidate base sequence prepared from the primer candidate base sequence prepared in the second step of creating a primer candidate base sequence and a base sequence of two primer candidates from the already adopted primer base sequence and one primer candidate For all of the combinations for selecting the base sequence and the base sequence of one already adopted primer, pair-wise with respect to the base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination The second step of global alignment, in which global alignment is performed to obtain a global alignment score.
  • the base of the primer for PCR amplification of the third and subsequent target regions not yet selected from the three or more target regions, wherein the at least one target region includes three or more target regions When the arrangement is adopted, the steps from the step (a 2 ) to the step (g 2 ) are repeated for the third and subsequent target regions.
  • the third aspect of the primer design method after priority setting includes the following (a-0) multiple target region selection steps and (b-0) candidate primer bases: (C-1) first local alignment step, (d-1) first first stage selection step, (e-1) first global alignment step, (f- 1) first second stage selection process, (g-1) first primer adoption process, (c-2) second local alignment process, and (d-2) second first stage selection process. (E-2) a second global alignment step, (f-2) a second second stage selection step, and (g-2) a second primer adoption step.
  • B-0 base sequences of candidate primers for PCR amplification of each of the plurality of target regions based on the base sequences of the neighboring regions at both ends of each of the plurality of target regions on genomic DNA, A step of creating a plurality of candidate primer sequences each creating at least one each.
  • (C-1) Two candidate primers from the candidate nucleotide sequences for PCR amplification of the first target region having the highest priority among the candidate primer sequences prepared in the step of preparing a plurality of candidate primer sequences
  • the pair-wise local comparison is performed on the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination.
  • a first local alignment step in which alignment is performed to determine a local alignment score
  • (D-1) A first first-stage selection step of selecting a first stage of a candidate nucleotide sequence for PCR amplification of the first target region based on the local alignment score.
  • (E-1) For all combinations for selecting the base sequences of two candidate primers from the base sequences of candidate primers selected in the first first stage selection step, 3 of the two base sequences included in the combination 'First global alignment step of obtaining a global alignment score by performing global alignment pairwise on a base sequence having a predetermined sequence length including the end.
  • (F-1) A first second-stage selection step of performing second-stage selection of nucleotide sequences of candidate primers for PCR amplification of the first target region based on the global alignment score.
  • (G-1) PCR amplification of the nucleotide sequence of the candidate primer selected in both the first first stage selection step and the first second stage selection step with the first target region 1st primer adoption process employ
  • (C-2) Primer candidate base sequences for PCR amplification of the second target region with the second highest priority among the candidate primer base sequences created in the step of creating a plurality of candidate primer base sequences and those already adopted
  • the combination of selecting two candidate primer sequences from the primer sequence and the combination of selecting one candidate primer sequence and one already adopted primer sequence are two combinations included in the combination.
  • a second local alignment step of performing local alignment pairwise and obtaining a local alignment score under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences. .
  • (D-2) A second first-stage selection step of selecting a first stage of a candidate nucleotide sequence for PCR amplification of the second target region based on the local alignment score.
  • (E-2) a combination of selecting a candidate primer base sequence from the primer candidate base sequence selected in the second first-stage selection step and the already adopted primer base sequence and one primer candidate For all of the combinations for selecting the base sequence and the base sequence of one already adopted primer, pair-wise with respect to the base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination
  • the second global alignment process where global alignment is performed to obtain a global alignment score.
  • (F-2) A second second-stage selection step of performing a second-stage selection of a base sequence of a candidate primer for PCR amplification of the second target region based on the global alignment score.
  • (G-2) PCR amplification of the second target region using the nucleotide sequences of candidate primers selected in both the second first stage selection step and the second second stage selection step Second primer adoption step that is adopted as the base sequence of the primer.
  • both the steps (c-1) and (d-1) the steps (e-1) and ( Both steps of step f-1) may be in any order or simultaneously. That is, after performing the step (c-1) and the step (d-1), the step (e-1) and the step (f-1) may be performed, or the step (e-1) The step (c-1) and the step (d-1) may be performed after the step and the step (f-1) are performed. Alternatively, the step (c-1) and the step (d-1) may be performed. The step, the step (e-1) and the step (f-1) may be performed in parallel.
  • the steps (e-1) and the step (d-1) are performed after the step (e-1) and the step (f-1) are performed
  • the steps (e-1) and The step (c-1) is preferably the following step (e′-1) and the following step (c′-1).
  • E′-1) Two primers from the candidate primer base sequences for PCR amplification of the first target region with the highest priority among the candidate primer base sequences created in the step of creating a plurality of candidate primer base sequences. For all of the combinations for selecting candidate base sequences, a global alignment score is obtained by performing a pair-wise global alignment on a base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination.
  • a first local alignment step of obtaining a local alignment score by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
  • the steps (e-1 Step) is preferably the following step (e′-1).
  • E′-1 Two primers from the candidate primer base sequences for PCR amplification of the first target region with the highest priority among the candidate primer base sequences created in the step of creating a plurality of candidate primer base sequences. For all of the combinations for selecting candidate base sequences, a global alignment score is obtained by performing a pair-wise global alignment on a base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination. The first global alignment process for
  • both the steps (c-2) and (d-2) both the steps (c-2) and (d-2), the steps (e-2) and ( Both steps of step f-2) may be in any order or simultaneously. That is, after performing the step (c-2) and the step (d-2), the step (e-2) and the step (f-2) may be performed, or the step (e-2) After performing step (f-2) and step (f-2), step (c-2) and step (d-2) may be performed, step (c-1) and step (d-1) The step, the step (e-1) and the step (f-1) may be performed in parallel.
  • the steps (e-2) and the step (d-2) are performed after the step (e-2) and the step (f-2) are performed
  • the steps (e-2) and The step (c-2) is preferably the following step (e′-2) and the following step (c′-2).
  • (E′-2) Among the candidate primer sequences generated in the above-mentioned candidate primer sequence multiple generation step, the candidate primer sequences for PCR amplification of the second target region with the second highest priority and already adopted All of the combinations for selecting the base sequences of two candidate primers from the base sequences of the primers and the combinations for selecting the base sequence of one candidate primer and the base sequence of one already adopted primer are included in the above combinations 2
  • C′-2 Combination of selecting candidate primer base sequences from the candidate primer base sequences selected in the second second stage selection step and the already adopted primer base sequences and one candidate primer And all the combinations for selecting one of the primer sequences already adopted, the two partial sequences included in the combination are compared with the 3 'end of the two base sequences.
  • a second local alignment step in which a local alignment score is obtained by performing pair-wise local alignment under the condition that
  • the steps (e-2) Step) is preferably the following step (e′-2).
  • step (E′-2) Among the candidate primer sequences generated in the above-mentioned candidate primer sequence multiple generation step, the candidate primer sequences for PCR amplification of the second target region with the second highest priority and already adopted All of the combinations for selecting the base sequences of two candidate primers from the base sequences of the primers and the combinations for selecting the base sequence of one candidate primer and the base sequence of one already adopted primer are included in the above combinations 2
  • the at least one amplification candidate region includes three or more amplification candidate regions, three or more target regions are selected in the target region multiple selection step, and the primer candidate base sequence multiple generation step includes the 3 Adopting the base sequence of the primer for PCR amplification of the 3rd and subsequent target regions after the 3rd priority in the case of creating the candidate primer sequences for PCR amplification of each of the two or more target regions
  • the steps from the second local alignment step to the second primer adoption step are repeated for the third and subsequent target regions.
  • target region selection step S101 (FIG. 4), the target region selection first step S201, the target region selection second step S211 (FIG. 5), and the target region multiple selection step S301 (FIG. 6) are collectively referred to. In some cases, it is simply referred to as “target region selection step”.
  • the target region selection step is a step of selecting the target region in order of priority from the amplification candidate regions for which the priority is set.
  • target region selection first step is a step of selecting, as a first target region, an amplification candidate region having the highest priority from the amplification candidate regions set with priority
  • target region selection second step is a step of selecting an amplification candidate region having the highest priority as the second target region from among the amplification candidate regions that have not been selected among the amplification candidate regions for which priority is set. is there.
  • amplification candidate regions are selected one by one in order of priority.
  • the (a-0) target region multiple selection step is a step of selecting a plurality of target regions in descending order of priority from the amplification candidate regions for which priority is set.
  • a plurality of amplification candidate regions are selected in order of priority.
  • all the amplification candidate regions for which priority is set are selected.
  • Primer candidate base sequence creation process >> Primer candidate base sequence creation step S102 (FIG. 4), primer candidate base sequence creation first step S202, primer candidate base sequence creation second step S212 (FIG. 5), and primer candidate base sequence multiple creation step S302 (FIG. 6). Collectively, it may be simply referred to as “primer candidate base sequence creation step”.
  • the candidate primer base sequence creating step converts the base sequence of the candidate primer for PCR amplification of the target region into the base sequence of each of the neighboring regions at both ends of the target region on the genomic DNA. This is a step of creating at least one each.
  • Primer candidate base sequence creation first step S202 and primer candidate base sequence creation second step S212 In FIG. 5, “primer candidate base sequence creation first” and “primer candidate base sequence creation second” are shown.
  • Primer candidate base sequence creation step 1 comprises the step of preparing a candidate primer base sequence for PCR amplification of the first target region at both ends of the first target region on the genomic DNA.
  • the second step of creating a primer candidate base sequence is a primer for PCR amplification of the second target region
  • at least one candidate base sequence is created based on the base sequences of the neighboring regions at both ends of the second target region on the genomic DNA.
  • the generation of a primer candidate base sequence, selection of a primer candidate, and adoption of a primer are performed for one target region, and the same process is repeated for the next one target region.
  • the step of preparing a plurality of candidate primer sequences includes a candidate primer sequence for PCR amplification of each of the plurality of target regions, and each of the plurality of target regions on the genomic DNA. At least one each is created based on the base sequences of the neighboring regions at both ends.
  • base sequences of candidate primers are created for all of the plurality of target regions, and selection and adoption are repeated in the subsequent steps.
  • the adjacent areas at both ends of the target area collectively refer to areas outside the 5 ′ end of the target area and areas outside the 3 ′ end of the target area.
  • the inside of the target area is not included in the neighboring area.
  • the length of the neighboring region is not particularly limited, but is preferably not more than a length that can be extended by PCR, and more preferably not more than the upper limit of the length of the DNA fragment desired to be amplified. In particular, it is preferable that the length is easy for concentration selection and / or sequence reading. You may change suitably according to the kind etc. of the enzyme (DNA polymerase) used in PCR.
  • the specific length of the neighboring region is preferably about 20 to 500 bases, more preferably about 20 to 300 bases, still more preferably about 20 to 200 bases, and still more preferably about 50 to 200 bases.
  • Primer design parameters When preparing the nucleotide sequence of candidate primers, the length of the primer, the GC content (refers to the total molar percentage of guanine (G) and cytosine (C) in all nucleobases), melting temperature (two This is the temperature at which 50% of the stranded DNA is dissociated to become single-stranded DNA, and is derived from the melting temperature, sometimes referred to as “Tm value.” The unit is “° C.”), and sequence bias The points to be noted in general primer designing methods are the same.
  • the primer length (number of nucleotides) is not particularly limited, but is preferably 15 mer to 45 mer, more preferably 20 mer to 45 mer, and still more preferably 20 mer to 30 mer. When the length of the primer is within this range, it is easy to design a primer excellent in specificity and amplification efficiency.
  • the GC content of the primer is not particularly limited, but is preferably 40 mol% to 60 mol%, more preferably 45 mol% to 55 mol%. When the GC content is within this range, problems of specificity and a decrease in amplification efficiency due to higher order structures are unlikely to occur.
  • the Tm value of the primer is not particularly limited, but is preferably in the range of 50 ° C to 65 ° C, more preferably in the range of 55 ° C to 65 ° C.
  • the difference in the Tm values of the primers is preferably 5 ° C. or less, more preferably 3 ° C. or less in the primer pair and primer set.
  • the Tm value is calculated using OLIGO Primer Analysis Software (Molecular Biology Insights) or Primer3 (http://www-genome.wi.mit.edu/ftp/distribut/software/etc.). be able to.
  • Tm value (° C.) 2 (nA + nT) +4 (nC + nG)
  • the method for calculating the Tm value is not limited to these, and the Tm value can be calculated by various conventionally known methods.
  • the base sequence of the candidate primer is a sequence with no base bias overall. For example, it may be desirable to avoid partially GC rich sequences and partially AT rich sequences. It is also desirable to avoid T and / or C continuity (polypyrimidine) and A and / or G continuation (polypurine).
  • 3' terminal base sequence avoids a GC rich sequence or an AT rich sequence.
  • the 3 ′ terminal base is preferably G or C, but is not limited thereto.
  • a specificity check step for evaluating the specificity of the primer candidate base sequence may be performed ( Not shown).
  • the specificity check is performed by performing local alignment between the base sequence of the chromosomal DNA and the base sequence of the primer candidate. If the local alignment score is less than a preset value, the base sequence of the primer candidate corresponds to the genomic DNA. It can be evaluated that the complementarity is low and the specificity is high.
  • it is desirable that the local alignment is also performed on a complementary strand of chromosomal DNA. This is because the primer is single-stranded DNA, whereas chromosomal DNA is double-stranded.
  • a complementary base sequence may be used instead of the primer candidate base sequence.
  • a homology search may be performed on the genomic DNA base sequence database using the candidate primer base sequences as query sequences.
  • a homology search tool for example, BLAST (Basic Local Alignment Search Tool: Blast) (Altschul, S. A., four others, “Basic Local Alignment Search Tool”, Journal of Molecular Biology, 1990, October, 215, pp. 403-410) and FASTA (Pearson, W. R., 1 other, “Improved tools for biological sequence comparison”, Bulletin of the National Academy of Sciences, National Academy of Sciences, 1988, 4 Month, Vol. 85, p.2444-2448).
  • BLAST Basic Local Alignment Search Tool: Blast
  • FASTA Pearson, W. R., 1 other, “Improved tools for biological sequence comparison”, Bulletin of the National Academy of Sciences, National Academy of Sciences, 1988, 4 Month, Vol. 85, p.2444-2448.
  • the threshold values of the score and the local alignment score are not particularly limited, and can be appropriately set depending on the length of the base sequence of the candidate primer and / or the PCR conditions.
  • nucleotide sequence of the candidate primer is complementary to the nucleotide sequence at an unexpected position on the chromosomal DNA and the specificity is low, when PCR is performed using the primer of the nucleotide sequence, Exclude artifacts because they may amplify artifacts.
  • the local alignment step S103 (FIG. 4), the first local alignment step S203 and the second local alignment step S213 (FIG. 5), and the first local alignment step S303 and the second local alignment step S313 (FIG. 5). 6) may be collectively referred to simply as “local alignment process”.
  • the local alignment step is included in the combination for all combinations of selecting the primer candidate base sequences from the primer candidate base sequences created in the primer candidate base sequence creating step. This is a step of obtaining a local alignment score by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
  • the first step of local alignment is for all combinations of selecting the candidate primer base sequences from the candidate primer base sequences created in the first candidate primer base sequence creation step.
  • the local alignment score is obtained by performing pairwise local alignment on the two base sequences included in the combination under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
  • the second step of local alignment is the base sequence of two candidate primers from the base sequence of the candidate primer created in the second step of creating the candidate primer base sequence and the base sequence of the primer already adopted A combination and a single candidate primer base
  • the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination. This is a step of obtaining a local alignment score by performing a pairwise local alignment under the above condition.
  • a local alignment score is obtained by performing pairwise local alignment under the condition that the 3 ′ end is included, and (c-2) the second local alignment step is a step of creating a plurality of candidate primer sequences in the above The second target region having the second highest priority among the prepared primer candidate base sequences Of candidate primers for PCR amplification and a combination of selecting two candidate primer sequences from the already adopted primer sequences, one candidate primer sequence and one already adopted primer base For all of the combinations for selecting sequences, pairwise local alignment is performed on the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination. This is a step of performing a local alignment score.
  • the combination of base sequences for performing local alignment may be a combination selected by allowing duplication or a combination selected without allowing duplication, but primer / dimer formation between primers of the same base sequence If sex has not yet been evaluated, a combination selected to allow duplication is preferred.
  • the local alignment is an alignment performed on a partial sequence, and a portion having high complementarity can be locally examined.
  • the local alignment is usually performed under the condition that “the partial sequence to be compared includes the 3 ′ end of the base sequence” unlike the local alignment performed on the base sequence.
  • the partial sequences to be compared include the 3 ′ ends of both base sequences.
  • the condition that “the partial sequence to be compared includes the 3 ′ end of the base sequence”, that is, “the partial sequence to be compared starts from the 3 ′ end of one sequence and 3 ′ of the other sequence”.
  • the local alignment under the condition of “considering only the alignment that ends at the end”, an embodiment in which the partial sequences to be compared include the 3 ′ ends of both base sequences is preferable.
  • the local alignment may insert a gap.
  • Gap means base insertion and / or deletion (indel).
  • a case where bases are complementary between base sequence pairs is regarded as a match (match), and a case where they are not complementary is regarded as a mismatch (mismatch).
  • the alignment is performed so that a score is given to each of the match, mismatch, and indel, and the total score is maximized. What is necessary is just to set a score suitably.
  • the score may be set as shown in Table 1 below. In Table 1, “-” represents a gap (insertion and / or deletion (indel)).
  • dot matrix shown in Table 3 from the base sequences of SEQ ID NOS: 1 and 2. Specifically, the base sequence of SEQ ID NO: 1 is arranged from left to right in the 5 ′ to 3 ′ direction, the base sequence of SEQ ID NO: 2 is arranged from the bottom to the top, in the direction of 5 ′ to 3 ′, and bases Is entered in a grid that is complementary to obtain a dot matrix shown in Table 3.
  • the alignment (pairwise alignment) can be obtained not only by the dot matrix method exemplified here but also by dynamic programming, word method, or other various methods.
  • first stage selection process S104 (FIG. 4), the first stage selection first process S204 and the first stage selection second process S214 (FIG. 5), and the first first stage selection process S304 and the first stage selection process S304.
  • the first stage selection process S314 (FIG. 6) may be simply referred to as “first stage selection process”.
  • first stage selection step S104 In FIG. 4, this is shown as “first stage selection”.
  • the first step selection step is a step of selecting the first step of the base sequence of candidate primers for PCR amplification of the target region based on the local alignment score. .
  • first step selection first step S204 and first step selection second step S214 In FIG. 5, “first stage selection first” and “first stage selection second” are shown.
  • the first step selection first step is based on the local alignment score and the first step of the nucleotide sequence of the candidate primer for PCR amplification of the first target region.
  • First step selection second step is a first step of a base sequence of candidate primers for PCR amplification of the second target region based on the local alignment score This is a process of selecting.
  • the first first-stage selection step includes a first candidate sequence of a primer candidate for PCR amplification of the first target region based on the local alignment score.
  • the second first step selection step is a step of selecting candidate nucleotide sequences for PCR amplification of the second target region based on the local alignment score. This is a process of performing the first stage selection.
  • a threshold value of the local alignment score (also referred to as “first threshold value”) is set in advance. If the local alignment score is less than the first threshold, it is determined that the combination of these two base sequences has low dimer formation, and the subsequent steps are performed. On the other hand, if the local alignment score is equal to or higher than the first threshold value, it is determined that the combination of these two base sequences has a high primer-dimer formation property, and the subsequent steps are not performed for the combination.
  • the first threshold is not particularly limited and can be set as appropriate.
  • the first threshold value may be set according to PCR conditions such as the amount of genomic DNA used as a template for the polymerase chain reaction.
  • the first threshold value is set to “+3” in the example shown in the “local alignment”.
  • the local alignment score is “+1” and less than the first threshold value “+3”
  • the global alignment step S105 (FIG. 4), the first global alignment step S205 and the second global alignment step S215 (FIG. 5), and the first global alignment step S305 and the second global alignment step S315 (FIG. 5). 6) may be simply referred to as “global alignment process”.
  • the global alignment step is included in the combination for all combinations of selecting the candidate primer base sequences from the candidate primer base sequences selected in the first stage selection step. This is a step of obtaining a global alignment score by performing global alignment in a pair-wise manner on a base sequence having a predetermined sequence length including the 3 ′ ends of two base sequences.
  • the first step of global alignment includes all the combinations for selecting two candidate primer base sequences from the candidate primer base sequences selected in the first step selection first step.
  • global alignment which is a step of performing global alignment in a pairwise manner on a base sequence having a predetermined sequence length including the 3 ′ end of two base sequences included in the combination to obtain a global alignment score.
  • the second step is a combination of selecting the base sequence of two candidate primers from the base sequence of the candidate primer selected in the first step selection second step and the base sequence of the primer already adopted and the base of one candidate primer Sequence and base sequence of one already adopted primer
  • a global alignment score is obtained by performing global alignment in a pair-wise manner on a base sequence having a predetermined sequence length including the 3 ′ end of two base sequences included in the combination for all the combinations to be selected. .
  • the first global alignment step includes selecting all the nucleotide sequences of the two candidate primers from the candidate primer sequences selected in the first first-stage selection step.
  • the second global alignment step includes a combination of selecting the candidate primer base sequences selected from the primer candidate base sequences selected in the second first stage selection step and the primer base sequences already employed, and One candidate primer base sequence and one already adopted primer
  • a global alignment score is obtained by performing a pair-wise global alignment on a base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination. It is a process to obtain.
  • the global alignment score is the first of the candidate primers created in the “primer candidate base sequence creation step” (the local alignment score is the first when the “local alignment step” and the “first stage selection step” are performed first). From the group consisting of all candidate primers included in the combination) and all the already employed primers (only if there are already employed primers). One primer is taken out, and a base sequence having a predetermined sequence length including the 3 ′ end is obtained by performing global alignment in a pairwise manner.
  • the combination of base sequences for performing global alignment may be a combination selected by allowing duplication, or a combination selected without allowing duplication, but primer / dimer formation between primers of the same base sequence If sex has not yet been evaluated, a combination selected to allow duplication is preferred.
  • the global alignment is an alignment performed on the “entire sequence”, and the complementarity of the entire sequence can be examined.
  • the “entire sequence” is the entire base sequence having a preset sequence length including the 3 ′ end of the base sequence of the candidate primer.
  • a gap may be inserted in the global alignment.
  • Gap means base insertion and / or deletion (indel).
  • a case where the bases are complementary between the base sequence pairs is regarded as a match (match), and a case where the bases are not complementary is regarded as a mismatch (mismatch).
  • the alignment is performed so that a score is given to each of the match, mismatch, and indel, and the total score is maximized. What is necessary is just to set a score suitably. For example, the score may be set as shown in Table 1 above. In Table 1, “-” represents a gap (insertion and / or deletion (indel)).
  • the alignment (pairwise alignment) can be obtained by a dot matrix method, a dynamic programming method, a word method, or other various methods.
  • the second stage selection process S106 (FIG. 4), the second stage selection first process S206 and the second stage selection second process S216 (FIG. 5), and the first second stage selection process S306 and the second stage selection process S306.
  • the second stage selection process S316 (FIG. 6) may be simply referred to as “second stage selection process”.
  • the second stage selection step is a step of performing the second step selection of the base sequence of candidate primers for PCR amplification of the target region based on the global alignment score. .
  • second step selection first step S206 and second step selection second step S216 In FIG. 5, “second stage selection first” and “second stage selection second” are shown.
  • the second step selection first step is based on the global alignment score, the second step of the nucleotide sequence of the candidate primer for PCR amplification of the first target region.
  • the second stage selection second step is a second stage of the base sequence of candidate primers for PCR amplification of the second target region based on the global alignment score. This is a process of selecting.
  • the first second-stage selection step includes the step of selecting a second candidate nucleotide sequence for PCR amplification of the first target region based on the global alignment score.
  • the second second stage selection step is a step of selecting candidate nucleotide sequences for PCR amplification of the second target region based on the global alignment score. This is a process of performing the second stage selection.
  • a global alignment score threshold (also referred to as “second threshold”) is set in advance. If the global alignment score is less than the second threshold, it is determined that the combination of these two base sequences has low dimer formation, and the subsequent steps are performed. On the other hand, if the global alignment score is greater than or equal to the second threshold value, it is determined that the combination of these two base sequences is highly dimer-forming, and the subsequent steps are not performed for that combination.
  • the second threshold value is not particularly limited and can be set as appropriate. For example, the second threshold value may be set according to PCR conditions such as the amount of genomic DNA used as a template for the polymerase chain reaction.
  • the base sequence of the preset base number including the 3 ′ end of the base sequence of each primer is pair-wise globally aligned.
  • the global alignment score obtained in this way can be made less than the second threshold.
  • the second threshold is set to “+3” in the example shown in the “global alignment step”.
  • the global alignment score is “ ⁇ 3”, which is less than the second threshold value “+3”. Therefore, the combination of the base sequences of SEQ ID NOS: 1 and 2 has low primer-dimer formation properties. Judgment can be made.
  • both the “global alignment process” and the “second stage selection process” are first performed, and the combination of the base sequences of the primers that have passed the “second stage selection process”
  • the greater the number of target regions and the greater the number of primer candidate base sequences the greater the effect of reducing the amount of calculation, and the overall processing speed can be increased.
  • ⁇ Amplification sequence length check process> For the combination of primer candidate base sequences determined to have low primer dimer formation in the “first stage selection process” and “second stage selection process”, the end of the primer candidate base sequence on the chromosomal DNA An amplification sequence length check step for calculating the distance between the parts and determining whether the distance is within a preset range may be performed (not shown). If the distance between the end portions of the base sequence is within a preset range, it can be determined that the combination of the base sequences of the candidate primers has a high possibility of appropriately amplifying the target region.
  • the distance between the ends of the primer candidate base sequences is not particularly limited, and can be appropriately set depending on the PCR conditions such as the type of the enzyme (DNA polymerase).
  • primer adoption step S107 (FIG. 4), primer adoption first step S207 and primer adoption second step S217 (FIG. 5), and first primer adoption step S307 and second primer adoption step S317 (FIG. 5). 6) may be collectively referred to simply as “primer adoption step”.
  • primer adoption step S107 In FIG. 4, this is indicated as “primer adoption”.
  • the primer adoption step is for PCR-amplifying the nucleotide sequence of the candidate primer selected in both the first step selection step and the second step selection step. This is a step employed as the base sequence of the primer.
  • primer adoption first step is the step of selecting the nucleotide sequence of the candidate primer selected in both the first step selection first step and the second step selection first step.
  • primer adoption second step is a step of the first step selection second step and the second step selection second step. In either case, the selected primer candidate base sequence is used as a primer base sequence for PCR amplification of the second target region.
  • first primer adoption and “second primer adoption” are shown.
  • the first primer adopting step is a base sequence of a candidate primer selected in both the first first stage selecting step and the first second stage selecting step. Is used as a base sequence of a primer for PCR amplification of the first target region.
  • the second primer adoption step comprises the second first-stage selection step and the first step In this step, the nucleotide sequence of the candidate primer selected in any of the second stage selection steps is used as a primer nucleotide sequence for PCR amplification of the second target region.
  • the local alignment score obtained by performing pairwise local alignment for each primer candidate base sequence under the condition that the partial sequence to be compared includes the 3 ′ end of the base sequence is the first.
  • the global alignment score obtained by performing global alignment on a pairwise basis for a base sequence having a preset number of bases including the 3 ′ end of each primer candidate base sequence is less than the second threshold value. Is used as a primer base sequence for amplifying the target region.
  • the base sequence of the candidate primer shown in SEQ ID NO: 1 and the base sequence of the candidate primer shown in SEQ ID NO: 2 can be adopted as the base sequence of the primer for amplifying the target region.
  • a primer may be designed for the amplification candidate region of the next priority.
  • the local alignment step S103 is performed. If the primer candidate base sequence for the amplification candidate region of the next priority is not created, the amplification candidate region of the next priority has not been selected in the target region selection step S101, so the next in the target region selection step S101. Are selected, and in the primer candidate base sequence creation step S102, a primer candidate base sequence for the amplification candidate region is created, and then the local alignment step S103 and subsequent steps are performed.
  • the process repeats from the target area selection second step S211.
  • the process repeats from the second local alignment step S313. .
  • the feature points in the design of the primers and the like after prioritizing the amplification candidate regions are selected by selecting a plurality of specific target regions, searching for neighboring base sequences, and each of the extracted primer sets.
  • the purpose is to obtain a primer group that includes the target region as an amplification target and does not become complementary to each other by confirming complementarity and selecting a base sequence with less complementarity.
  • the feature point in confirming the complementarity of the base sequence of the primer is that the complementarity of the entire sequence is lowered by using local alignment, and the end of the base sequence of the primer is complemented by using global alignment. The point is to create a primer group so as to be low.
  • the first priority order was set in the order of the coordinate values of the amplification candidate regions V1 to V85 shown in Table 8.
  • primers for PCR amplification of each amplification candidate region were designed according to the first priority, primers could be designed for the following 52 amplification candidate regions.
  • Amplification candidate regions V1 to V85 are divided into four blocks including 20 amplification candidate regions and one block including five amplification candidate regions, ie, block 1 including V1 to V20 and V21 to V40 in the order of coordinate values.
  • the block was divided into block 2, block 41 including V41 to V60, block 4 including V61 to V80, and block 5 including V81 to V85.
  • random permutation was performed in each block to obtain a permutation in which the order of each amplification candidate region in the block was randomly changed.
  • Blocks 1 to 5 were combined in this order, and the block division was canceled to obtain a permutation in which the order of the amplification candidate regions V1 to V85 was rearranged.
  • the order of V1 to V85 was set as the second priority.
  • primers for PCR amplification of each amplification candidate region were designed according to the second priority, primers could be designed for the following 54 candidate amplification regions.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

増幅候補領域に優先順位を設定してプライマーを設計した結果、プライマーを設計することができた増幅候補領域の数が所望数に達しなかった場合に、先に設定した優先順位の大局的特徴を維持しながら、プライマーの設計をやり直すことができるマルチプレックスPCRに供するプライマーの設計方法が提供される。

Description

マルチプレックスPCRに供するプライマーの設計方法
 本発明は、マルチプレックスPCR(Polymerase Chain Reaction;ポリメラーゼ連鎖反応)に供するプライマーの設計方法に関する。
 近年発達してきたDNA(Deoxyribonucleic acid;デオキシリボ核酸)シーケンサ等により遺伝子解析が手軽に行えるようになっている。しかし、ゲノムの総塩基長は一般に膨大であり、一方でシーケンサのリード能力には制約がある。そこで、必要な特定の遺伝子領域のみをPCR増幅し、その塩基配列に限定してリードを行うことで、効率的かつ精度よく遺伝子解析を行う技術としてPCR法が普及している。特に、ある1つのPCR反応系に複数種類のプライマーを同時に供給することで、複数の遺伝子領域を選択的にPCR増幅する手法をマルチプレックスPCRと称する。
 マルチプレックスPCRは少量のDNAから複数の領域を効率よくPCR増幅することから、非侵襲的な出生前診断を行うために有用な技術である。
 しかしながら、単一細胞から抽出したゲノムDNAのような、数pg~数十pg以下の少量DNAサンプルに対する直接的なマルチプレックスPCRを確実に行うことができるプライマーセットを設計することは、相補性および特異性などのプライマー設計の条件が非常に厳しいため、難易度が高く、すべての増幅候補領域に対して、PCR増幅するためのプライマーを設計することができない場合がある。
 本発明者は、増幅候補領域に優先順位を設定した場合であって、その優先順位に従って、各増幅候補領域をPCR増幅するためのプライマーを設計したときには、増幅候補領域に優先順位を設定しなかった場合に比べて、より多くの増幅候補領域に対してPCR増幅するためのプライマーを設計することができる場合があることを示した。
 ところが、増幅候補領域に優先順位を設定した場合であっても、PCR増幅するためのプライマーを設計することができた増幅候補領域の数がそもそもジェノタイピングまたは染色体数定量などの解析に必要な領域数に比べて少なかったり、PCR増幅するためのプライマーを設計することができた増幅候補領域の数が解析に必要な領域数以上であっても、マルチプレックスPCRを行った際にPCR増幅産物を得られた増幅対象領域の数が解析に必要な領域数に比べて少なかったりすることがあった。
 その際には、プライマーの設計をやり直すこととなるが、先に設定した優先順位がある意図に基づいたものである場合、その大局的特徴を変更しないことが望まれることがある。
 そこで、本発明は、増幅候補領域に優先順位を設定してプライマーを設計した結果、プライマーを設計することができた増幅候補領域の数が所望数に達しなかった場合に、先に設定した優先順位の大局的特徴を維持しながら、プライマーの設計をやり直すことができるマルチプレックスPCRに供するプライマーの設計方法を提供することを課題とする。
 本発明者は、上記課題を解決すべく鋭意検討を重ねた結果、プライマーの設計をやりなおす際に、増幅候補領域の優先順位を変更してプライマーの設計をやり直すことを知得し、本発明を完成させた。
 すなわち、本発明は次の[1]~[3]である。
 [1] ゲノムDNA上のn個の増幅候補領域に対して、第1番目から第n番目までの順序である第1の優先順位を付ける、第1の優先順位設定工程と、
 上記第1の優先順位の順序に従って、上記第1の優先順位が第1番目の増幅候補領域から、順次、その増幅候補領域をPCR増幅するためのプライマーを設計する、第1のプライマー設計工程と、
 上記第1のプライマー設計工程においてプライマーを設計することができた増幅候補領域の数をm個として、m≧tであるとき、プライマーの設計を終了し、m<tであるとき、次の工程に進む、と決定する、第1の成否判定工程と、
 上記n個の増幅候補領域に対して、第1番目から第n番目までの順序であって、第1の優先順位の順序とは異なる、第2の優先順位を付ける、第2の優先順位設定工程と、
 上記第2の優先順位の順序に従って、上記第2の優先順位が第1番目の増幅候補領域から、順次、その増幅候補領域をPCR増幅するためのプライマーを設計する、第2のプライマー設計工程と、
を含む、ゲノム上のn個の増幅候補領域のうちt個以上の増幅候補領域を増幅するためのマルチプレックスPCRに供するプライマーの設計方法であって、
 上記第2の優先順位設定工程は、
 上記n個の増幅候補領域の識別情報および第1の優先順位情報が入力手段を介して入力されて、記憶手段に記憶され、
 演算手段が上記第1の優先順位の順序で並べて、上記n個の増幅候補領域を要素とする第1の順列を作成して、記憶手段に記憶し、
 演算手段が上記第1の優先順位の順序で並べた上記n個の増幅候補領域を、i番目のブロックがk個の増幅候補領域を含むように、j個のブロックに分割して、記憶手段に記憶し、
 演算手段が上記j個のブロックのうち、少なくとも1つのブロックの内部で、そのブロックに含まれる増幅候補領域を並び替えて、記憶手段に記憶し、
 演算手段が1番目からj番目までのブロックを順に結合して、ブロック分割を解除して、第2の順列を作成し、上記第2の順列に含まれる上記n個の増幅候補領域の順序を上記n個の増幅候補領域の第2の優先順位とする工程である、
ゲノム上のn個の増幅候補領域のうちt個以上の増幅候補領域を増幅するためのマルチプレックスPCRに供するプライマーの設計方法。
 ただし、nはn≧4を満たす整数であり、tは2≦t≦nを満たす整数であり、mは0≦m≦nを満たす整数であり、iは1≦i≦jを満たす整数であり、jは2≦j≦n/2を満たす整数であり、kは2≦k≦{n-2×(j-1)}を満たす整数である。
 [2] 上記第2のプライマー設計工程の後に、さらに、
 上記第2のプライマー設計工程においてプライマーを設計することができた増幅候補領域の数をm’個として、m’≧tであるとき、プライマーの設計を終了し、m’<tであるとき、上記第2の優先順位設定工程に戻る、と決定する、第2の成否判定工程を
含む、上記[1]に記載のマルチプレックスPCRに供するプライマーの設計方法。
 [3] 上記第2の優先順位設定工程において、上記ブロック内で上記増幅候補領域の順序をランダムに変更する、請求項1または2に記載のマルチプレックスPCRに供するプライマーの設計方法。
 本発明によれば、増幅候補領域に優先順位を設定してプライマーを設計した結果、プライマーを設計することができた増幅候補領域の数が所望数に達しなかった場合に、先に設定した優先順位の大局的特徴を維持しながら、プライマーの設計をやり直すことができるマルチプレックスPCRに供するプライマーの設計方法を提供することができる。
 本発明のマルチプレックスPCRに供するプライマーの設計方法によれば、再設計前に比べて、PCR増幅に用いるプライマーを設計することができる増幅候補領域の数を多くすることができる場合があり、そのときには、ジェノタイピングまたは染色体数定量などの解析に必要な領域数を確保できることが期待される。
図1は、本発明における優先順位設定工程において用いるハードウェアを表す概念図である。 図2は、本発明のマルチプレックスPCRに供するプライマーの設計方法の全体像を説明するフロー図である。 図3は、本発明のマルチプレックスPCRに供するプライマーの設計方法における、第2の優先順位の設定方法を具体例によって説明する図である。 図4は、本発明のマルチプレックスPCRに供するプライマーの設計方法における、第1の優先順位または第2の優先順位を設定した後のプライマー設計方法の第1の態様を説明するフロー図である。 図5は、本発明のマルチプレックスPCRに供するプライマーの設計方法における、第1の優先順位または第2の優先順位を設定した後のプライマー設計方法の第2の態様を説明するフロー図である。 図6は、本発明のマルチプレックスPCRに供するプライマーの設計方法における、第1の優先順位または第2の優先順位を設定した後のプライマー設計方法の第3の態様を説明するフロー図である。
 本発明において、「~」を用いて表される範囲は、その範囲に「~」の前後に記載された両端を含む範囲を意味する。例えば、AおよびBについて「A~B」はAおよびBを含む範囲を表す。
 また、本発明において、増幅候補領域は、ゲノムDNA上の領域であって、ジェノタイピングまたは染色体数定量などの目的のためにPCR増幅する候補の領域をいうものとする。
 以下では、本発明のマルチプレックスPCRに供するプライマーの設計方法について、適宜図を参照しながら、詳細に説明する。
[ハードウェア(実行装置)]
 本発明における優先順位の設定方法を実行する装置(「ハードウェア」または「実行装置」ともいう。)について、図1を参照しながら説明する。
 本発明において、優先順位の設定は、演算手段(CPU;Central Processing Unit,中央演算処理装置)11、記憶手段(メモリ)12、補助記憶手段(ストレージ)13、入力手段(キーボード)14、および表示手段(モニタ)16を備えるハードウェア(装置)によって行われる。この装置は、さらに、補助入力手段(マウス)15、および出力手段(プリンタ)17等を備えていてもよい。
 それぞれの手段について説明する。
 入力手段(キーボード)14は、装置に指示およびデータ等を入力する手段である。補助入力手段(マウス)15は、入力手段(キーボード)14に代えて、またはそれとともに、用いられる。
 演算手段(CPU)11は、演算処理を行う手段である。
 記憶手段(メモリ)12は、演算手段(CPU)11の演算処理の結果を記憶したり、入力手段(キーボード)14からの入力を記憶したりする手段である。
 補助記憶手段(ストレージ)13は、オペレーティングシステム、必要ローカス数を決定するためのプログラムなどを保存するストレージである。補助記憶手段(ストレージ)13は、その一部を記憶手段(メモリ)12を拡張するために用いることもできる(仮想メモリ)。
[マルチプレックスPCRに供するプライマーの設計方法]
 本発明のマルチプレックスPCRに供するプライマーの設計方法は、以下の工程を含む。
(1) ゲノムDNA上のn個の増幅候補領域に対して、第1番目から第n番目までの順序である第1の優先順位を付ける、第1の優先順位設定工程(図2の「第1の優先順位設定」)。ただし、nはn≧4を満たす整数である。
(2) 上記第1の優先順位の順序に従って、上記第1の優先順位が第1番目の増幅候補領域から、順次、その増幅候補領域をPCR増幅するためのプライマーを設計する、第1のプライマー設計工程(図2の「第1のプライマー設計」)。
(3) 上記第1のプライマー設計工程においてプライマーを設計することができた増幅候補領域の数をm個として、m≧tであるとき、プライマーの設計を終了し、m<tであるとき、次の工程に進む、と決定する、第1の成否判定工程(図2の「プライマーを設計できた増幅候補領域の数m」)。ただし、tは2≦t≦nを満たす整数であり、mは0≦m≦nを満たす整数である。
(4) 上記n個の増幅候補領域に対して、第1番目から第n番目までの順序であって、第1の優先順位の順序とは異なる、第2の優先順位を付ける、第2の優先順位設定工程(図2の「第2の優先順位設定」)。
(5) 上記第2の優先順位の順序に従って、上記第2の優先順位が第1番目の増幅候補領域から、順次、その増幅候補領域をPCR増幅するためのプライマーを設計する、第2のプライマー設計工程(図2の「第2のプライマー設計」)。
 さらに、所望により、次の工程を含んでもよい。
(6) 上記第2のプライマー設計工程においてプライマーを設計することができた増幅候補領域の数をm’個として、m’≧tであるとき、プライマーの設計を終了し、m’<tであるとき、上記第2の優先順位設定工程に戻る、と決定する、第2の成否判定工程(図2の「プライマーを設計できた増幅候補領域の数m’」)。
 以下では、各工程について説明する。
〈第1の優先順位設定工程S11〉
 図2中に「第1の優先順位設定工程」として示す。
 第1の優先順位設定工程S11では、n個の増幅候補領域に対して、それぞれ、重複することなく、1番目からn番目までの順序を付ける。この順序は、プライマーを設計する際の順序となる。
 この順序の付け方は、特に限定されるものではないが、例えば、以下のような方法がある。
《第1の優先順位の設定方法の具体例(1)》
 同一染色体DNA上のn箇所の増幅候補領域の識別情報および座標情報が入力手段を介して入力され、記憶手段12に記憶される。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報および座標情報から、座標値が最小の増幅候補領域を検索し、その増幅候補領域に優先順位1位の優先順位情報を付け、記憶手段12に記憶する。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報および座標情報から、座標値が最大の増幅候補領域を検索し、その増幅候補領域に優先順位2位の優先順位情報を付け、記憶手段12に記憶する。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報、座標情報および優先順位情報から、優先順位がi位であり座標値がrであり識別名がRである増幅候補領域および優先順位がj位であり座標値がrであり識別名がRである増幅候補領域であって、上記増幅候補領域Rおよび上記増幅候補領域Rの間には、優先順位が付けられた増幅候補領域は存在しないが、少なくとも1箇所のまだ優先順位が付けられていない増幅候補領域が存在するという条件を満たす増幅候補領域Rおよび増幅候補領域Rを検索し、次いで、上記増幅候補領域Rおよび上記増幅候補領域Rの中点の座標値ri-jをri-j=(r+r)/2により算出し、さらに、上記中点の座標値ri-jに最も近い座標値を持つ増幅候補領域を検索し、その増幅候補領域に優先順位k位の優先順位情報を付け、記憶手段12に記憶する。
 上記優先順位k位を付ける工程を、k=3からnまで繰り返す。
 これにより、第1の優先順位を設定することができる。
 優先順位の設定は、次のとおりとしてもよい。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報および座標情報から、座標値が最大の増幅候補領域を検索し、その増幅候補領域に優先順位1位の優先順位情報を付け、記憶手段12に記憶する。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報および座標情報から、座標値が最小の増幅候補領域を検索し、その増幅候補領域に優先順位2位の優先順位情報を付け、記憶手段12に記憶する。
 ただし、nは3≦nを満たす整数であり、kは3≦k≦nを満たす整数であり、iおよびjは、1≦i≦k-1、1≦j≦k-1、かつ、i≠jであり、rおよびrはrmin≦r≦rmax、rmin≦r≦rmax、かつ、r≠rであり、rminおよびrmaxは、それぞれ、上記n個の増幅候補領域の座標値の最小値および最大値である。
 上記優先順位の設定方法の具体例(1)は以下のように説明できる。
 上記n箇所の増幅候補領域において、最小の座標値rminを持つ増幅候補領域をRminとし、最大の座標値rmaxを持つ増幅候補領域をRmaxとする。
 まず、上記増幅候補領域Rminおよび上記増幅候補領域Rmaxの2つの増幅候補領域のうち、一方に優先順位1位を付ける。すなわち、増幅候補領域Rminに優先順位1位をつけるか、または、増幅候補領域Rmaxに優先順位1位を付けることとなる。
 次に、上記増幅候補領域Rminおよび上記増幅候補領域Rmaxの2つの増幅候補領域のうち、上記優先順位1位を付けた一方を除く他方に優先順位2位を付ける。すなわち、増幅候補領域Rminに優先順位1位をつけたときは、増幅候補領域Rmaxに優先順位2位を付けることとなり、増幅候補領域Rmaxに優先順位1位を付けたときは、増幅候補領域Rminに優先順位2位を付けることとなる。
 さらに、3個目以降h個目の増幅候補領域については、既に1位から(h-1)位までの優先順位が付けられているものとして、優先順位p位が付けられた増幅候補領域Rおよび優先順位q位が付けられた増幅候補領域Rの中点の座標値(r+r)/2に最も近い座標値を持つ増幅候補領域に優先順位h位を付ける。ここで、rおよびrは、それぞれ、増幅候補領域Rおよび増幅候補領域Rの座標値である。
 増幅候補領域Rおよび増幅候補領域Rの組合せが2組以上存在する場合は、無作為に1組を選択してもよいが、座標値が小さい方を優先する、または座標値が大きい方を優先する等のポリシーを採用してもよい。
 座標値(r+r)/2に最も近い座標値を持つ増幅候補領域が2箇所存在する場合は、無作為に1箇所を選択してもよいが、座標値が小さい方を優先する、または座標値が大きい方を優先する等のポリシーを採用してもよい。
 なお、上記増幅候補領域Rおよび上記増幅候補領域Rの間には、優先順位が付けられた増幅候補領域は存在しないが、少なくとも1箇所のまだ優先順位が付けられていない増幅候補領域が存在する。また、Rは優先順位1位が付けられたRminまたはRmaxであり、Rは優先順位2位が付けられたRminまたはRmaxである。
 hは3≦h≦nを満たす整数である。
 pおよびqは、1≦p≦h-1、1≦q≦h-1、かつ、p≠qである。
 rおよびrはrmin≦r≦rmax、rmin≦r≦rmax、かつ、r≠rである。
 第hの優先順位設定工程は、h=3からh=nまで逐次繰り返す。
 優先順位を付けることができる増幅候補領域が無くなったところで、優先順位の設定を終了する。
 なお、増幅候補領域に対する優先順位の設定は、優先順位に重複が生じないように行う。
《第1の優先順位の設定方法の具体例(2)》
 同一染色体DNA上のn個の増幅候補領域の識別情報および座標情報が入力手段を介して入力され、記憶手段12に記憶される。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報および座標情報から、座標値が最小の増幅候補領域を検索し、その増幅候補領域に優先順位1位の優先順位情報を付け、記憶手段12に記憶する。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報、座標情報および優先順位情報から、優先順位がk-1位である増幅候補領域の識別名Rk-1および座標値rk-1を検索し、T=rk-1+tを算出し、T=rk-1+t≦rmaxであるとき、rk-1+t以上rmax以下の座標値を持ち、優先順位情報が付けられていない増幅候補領域を検索し、その条件を満たす増幅候補領域が存在すれば、座標値がrk-1+t以上で最も小さい座標値を持つ、まだ優先順位情報が付けられていない増幅候補領域に優先順位k位を付け、記憶手段12に記憶し、T=rk-1+t≦rmaxであるとき、rk-1+t以上rmax以下の座標値を持ち、優先順位情報が付けられていない増幅候補領域を検索し、その条件を満たす増幅候補領域が存在しなければ、座標値がrmin以上で最も小さい座標値を持つ、まだ優先順位情報が付けられていない増幅候補領域に優先順位k位を付け、記憶手段12に記憶し、T=rk-1+t>rmaxであるとき、座標値がrmin以上で最も小さい座標値を持つ、まだ優先順位が付けられていない増幅候補領域に優先順位k位を付け、記憶手段12に記憶する。
 上記優先順位k位を付ける工程を、k=2からnまで繰り返す。
 これにより、第1の優先順位を設定することができる。
 優先順位の設定は次のとおりとしてもよい。
 演算手段11が、記憶手段に記憶された上記増幅候補領域の識別情報および座標情報から、座標値が最大の増幅候補領域を検索し、その増幅候補領域に優先順位1位の優先順位情報を付け、記憶手段12に記憶する。
 ただし、nは3≦nを満たす整数であり、kは2≦k≦nを満たす整数であり、tはt>0を満たす実数であり、rk-1≠rであり、rminおよびrmaxは、それぞれ、上記n個の増幅候補領域の座標値の最小値および最大値である。
 第1の優先順位の設定方法の具体例(2)は以下のように説明できる。
 上記n箇所の増幅候補領域において、最小の座標値rminを持つ増幅候補領域をRminとし、最大の座標値rmaxを持つ増幅候補領域をRmaxとする。
 まず、上記増幅候補領域Rminおよび上記増幅候補領域Rmaxの2つの増幅候補領域の間に存在し、rmin≦r≦rmaxを満たす座標値rを持つ増幅候補領域Rに優先順位1位を付ける。すなわち、増幅候補領域Rminに優先順位1位をつけてもよいし、増幅候補領域Rmaxに優先順位1位を付けてもよいし、増幅候補領域Rminおよび増幅候補領域Rmaxのいずれとも異なる増幅候補領域に優先順位1位を付けてもよい。
 Rの座標値rは、rmin≦r≦rmaxを満たす限り、特に限定されないが、好ましくはr=rminまたはr=rmaxであり、より好ましくはr=rminである。
 さらに、既に1位から(h-1)位までの優先順位が付けられているものとして、所定の条件を満たす増幅候補領域に優先順位h位を付ける。
 上記所定の条件を満たす増幅候補領域は、以下のようにして決定される。
 優先順位(h-1)位が付けられた増幅候補領域Rh-1の座標値をrh-1とし、それに閾値sを足した値「S=rh-1+s」を考える。ここで、sはs>0を満たす実数であり、本発明において「閾値」という場合がある。
 増幅候補領域の座標値の最大値はrmaxであることから、次の(1)および(2)の2つの場合に分けられる。
(1)S=rh-1+s≦rmaxである場合
(2)S=rh-1+s>rmaxである場合
 さらに、上記(1)の場合は、座標値rh-1+sとrmaxの間にまだ優先順位が付けられていない増幅候補領域が存在するか否かにより、次の(1)-1および(1)-2の2つの場合に分けられる。
(1)-1 まだ優先順位が付けられていない増幅候補領域が存在する場合
(1)-2 まだ優先順位が付けられていない増幅候補領域が存在しない場合
 上記(1)-1に該当する場合は、座標値が(rh-1+s)以上で最も小さい座標値を持つ、まだ優先順位が付けられていない増幅候補領域に優先順位h位を付ける。
 この場合においては、sは優先順位(h-1)位の増幅候補領域Rh-1と優先順位h位の増幅候補領域Rとの間の距離を表す。sが大きいほど、Rh-1とRとの間の距離も大きくなり、通常、互いに及ぼす影響は小さくなる。
 上記(1)-2または上記(2)に該当する場合は、座標値がrmin以上で最も小さい座標値を持つ、まだ優先順位が付けられていない増幅候補領域に優先順位h位を付ける。
 hは2≦h≦nを満たす整数である。
 sはs>0を満たす実数であり、染色体DNAサイズ、または増幅候補領域の座標などに応じて適宜設定することができるが、好ましくは100,000以上、より好ましくは1,000,000以上、さらに好ましくは5,000,000以上である。
 第hの優先順位設定工程は、h=2からh=nまで逐次繰り返す。
 優先順位を付けることができる増幅候補領域が無くなったところで、優先順位の設定を終了する。
 なお、増幅候補領域に対する優先順位の設定は、優先順位に重複が生じないように行う。
〈第1のプライマー設計工程S12/第2のプライマー設計工程S22〉
 図2中に「第1のプライマー設計工程」および「第2のプライマー設計工程」として示す。
 後述する「第1の優先順位または第2の優先順位を設定した後のプライマー設計方法」において説明する。
 なお、第1のプライマー設計工程においては、途中で、第1の優先順位を設定してもよい。例えば、後述する「第1の優先順位または第2の優先順位を設定した後のプライマー設計方法」で説明する第3の態様では、n個の増幅候補領域のすべてに対してプライマー候補の塩基配列を設計した後、第1の優先順位を設定し、その順序で、逐次、プライマー候補からプライマーの選抜を行ってもよい。
〈第1の成否判定工程S13/第2の成否判定工程S23〉
 図2中に「プライマーを設計できた増幅候補領域の数m」および「プライマーを設計できた増幅候補領域の数m’」として示す。
 第1の成否判定工程S13では、第1のプライマー設計工程S12においてプライマーを設計することができた増幅候補領域の数をm個として、m≧tであるとき、プライマーの設計を終了し、m<tであるとき、次の工程に進む、と決定する。
 第2の成否判定工程S23では、第2のプライマー設計工程S22においてプライマーを設計することができた増幅候補領域の数をm’個として、m’≧tであるとき、プライマーの設計を終了し、m’<tであるとき、次の工程に進む、と決定する。
 tは2≦t≦nを満たす整数である。tの値は、プライマーを設計することができた増幅候補領域の目標値であり、ジェノタイピングまたは染色体数定量などの解析の目的に合わせて、適宜設定することができる。
 mは0≦m≦nを満たす整数であり、m’は0≦m’≦nを満たす整数である。mおよびm’の値は、第1のプライマー設計工程S12または第2のプライマー設計工程S22でプライマーを設計することができた増幅候補領域の実績値である。本発明では、m<tであった場合に、m’≧tとなるように、プライマーを設計しなおす。
〈第2の優先順位設定工程S21〉
 図2中に「第2の優先順位設定工程」として示す。
 第2の優先順位設定工程S21は、n個の増幅候補領域の識別情報および第1の優先順位情報を入力手段を介して入力し、記憶手段12に記憶する工程と、演算手段11が上記n個の増幅候補領域からなる群からn個の増幅候補領域を取り出して上記第1の優先順位の順序で並べて、上記n個の増幅候補領域を要素とする第1の順列を作成して、記憶手段12に記憶する工程と、演算手段11が上記第1の優先順位の順序で並べた上記n個の増幅候補領域を、i番目のブロックがk個の増幅候補領域を含むように、j個のブロックに分割し、記憶手段12に記憶する工程、演算手段11が上記j個のブロックのうち、少なくとも1つのブロックの内部で、そのブロックに含まれる増幅候補領域を並び替え、記憶手段12に記憶する工程と、演算手段11が1番目からj番目までのブロックを順に結合して、ブロック分割を解除し、記憶手段12に記憶する工程と、演算手段11が上記n個の増幅候補領域を要素とする第2の順列を作成し、記憶手段12に記憶する工程と、を含む、上記第2の順列に含まれる上記n個の増幅候補領域の順序を上記n個の増幅候補領域の第2の優先順位とする工程である。
 ただし、nはn≧4を満たす整数であり、tは2≦t≦nを満たす整数であり、mは0≦m≦nを満たす整数であり、iは1≦i≦jを満たす整数であり、jは2≦j≦n/2を満たす整数であり、kは2≦k≦{n-2×(j-1)}を満たす整数である。
 第2の優先順位設定工程S21においては、上記ブロック内で上記増幅候補領域の順序を変更する方法は特に限定されないが、ランダムシャッフリングまたはランダムパーミュテーションなどにより、ランダムに変更することが好ましい。また、1つのブロックに含まれる増幅候補領域の数は有限であるから、有限要素からランダムな順列を生成するアルゴリズムを利用することができる。このようなアルゴリズムとしては、例えば、フィッシャー-イェーツのシャッフルが挙げられる。
 また、増幅候補領域を分割するブロックの数は、2個以上であれば特に限定されないが、10個程度とすることが好ましい。
 また、1つのブロックに含まれる増幅候補領域の数は、2個以上であれば特に限定されないが、増幅候補領域の総数の1/10程度であることが好ましい。また、各ブロックに含まれる増幅候補領域の数の差は、1~5個以内であることが好ましく、1~3個以内であることがより好ましい。
《第2の優先順位設定工程の具体例に基づく説明》
 以下では、図3を参照しながら、第2の優先順位設定工程S21についてより具体的に説明する。なお、この具体例に限定されるものではない。
 図3(a)にX~Xの9個の増幅候補領域を示す。
 まず、図3(b)に示すように、第1の優先順位に従ってX~Xの9個の増幅候補領域を並べる。ここでは、優先順位が座標値が小さい順に付けられているため、X~Xの順序で並べられる。
 次に、図3(c)に示すように、X~Xの9個の増幅候補領域を、1つのブロックが3つの増幅候補領域を含むように、3つのブロックに分割する。ここでは、1番目のブロックがX~Xの3個の増幅候補領域を、2番目のブロックがX~Xの3個の増幅候補領域を、3番目のブロックがX~Xの3個の増幅候補領域を、それぞれ含むように分割する。
 次に、図3(d)に示すように、各ブロック内で、増幅候補領域の順序を変更する。
 次に、図3(e)に示すように、各ブロックの順序を変更することなく、ブロック分割を解除して、増幅候補領域の新しい順列を得る。この順列に示される順位が第2の優先順位である。
[第1の優先順位または第2の優先順位を設定した後のプライマー設計方法]
 本発明のマルチプレックスPCRに供するプライマーの設計方法において、第1の優先順位または第2の優先順位を設定した後のプライマー設計方法(以下、単に「優先順位設定後プライマー設計方法」)は、特に限定されるものではないが、以下に説明する3つの態様から選択することが好ましい。この場合、第1の優先順位を設定した後のプライマー設計方法と第2の優先順位を設定した後のプライマー設計方法とは、同じ態様であってもよいし、異なる態様であってもよい。
〈優先順位設定後プライマー設計方法の第1の態様〉
 優先順位設定後プライマー設計方法の第1の態様(単に「第1の態様」という場合がある。)は、以下の(a)対象領域選択工程と、(b)プライマー候補塩基配列作成工程と、(c)ローカルアラインメント工程と、(d)第一段階選抜工程と、(e)グローバルアラインメント工程と、(f)第二段階選抜工程と、(g)プライマー採用工程とを含む。
(a)優先順位が設定された増幅候補領域から優先順位の順に対象領域を選択する、対象領域選択工程。
(b)上記対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成工程。
(c)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント工程。
(d)上記ローカルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜工程。
(e)上記第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程。
(f)上記グローバルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜工程。
(g)上記第一段階選抜工程および上記第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用工程。
 ただし、上記(a)工程~上記(g)工程のうち、上記(c)工程および上記(d)工程の両工程と、上記(e)工程および上記(f)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c)工程および上記(d)工程を行った後、上記(e)工程および上記(f)工程を行ってもよいし、上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行ってもよいし、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行ってもよい。
 上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行う場合には、上記(e)工程および上記(c)工程は、それぞれ、下記(e’)工程および下記(c’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程。
(c’)上記第二段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント工程。
 また、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行う場合には、上記(e)工程は、下記(e’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程。
〈優先順位設定後プライマー設計方法の第2の態様〉
 優先順位設定後プライマー設計方法の第2の態様(単に「第2の態様」という場合がある。)は、以下の(a)対象領域選択第1工程と、(b)プライマー候補塩基配列作成第1工程と、(c)ローカルアラインメント第1工程と、(d)第一段階選抜第1工程と、(e)グローバルアラインメント第1工程と、(f)第二段階選抜第1工程と、(g)プライマー採用第1工程と、(a)対象領域選択第2工程と、(b)プライマー候補塩基配列作成第2工程と、(c)ローカルアラインメント第2工程と、(d)第一段階選抜第2工程と、(e)グローバルアラインメント第2工程と、(f)第二段階選抜第2工程と、(g)プライマー採用第2工程と、を含む。
(a)優先順位が設定された増幅候補領域から優先順位が最も高い増幅候補領域を第1の対象領域として選択する、対象領域選択第1工程。
(b)上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第1の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成第1工程。
(c)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第1工程。
(d)上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜第1工程。
(e)上記第一段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程。
(f)上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜第1工程。
(g)上記第一段階選抜第1工程および上記第二段階選抜第1工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用第1工程。
(a)優先順位が設定された増幅候補領域のうちまだ選択されていない増幅候補領域から優先順位が最も高い増幅候補領域を第2の対象領域として選択する、対象領域選択第2工程。
(b)上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第2の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成第2工程。
(c)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第2工程。
(d)上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜第2工程。
(e)上記第一段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程。
(f)上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜第2工程。
(g)上記第一段階選抜第2工程および上記第二段階選抜第2工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用第2工程。
 ただし、上記(a)工程~上記(g)工程のうち、上記(c)工程および上記(d)工程の両工程と、上記(e)工程および上記(f)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c)工程および上記(d)工程を行った後、上記(e)工程および上記(f)工程を行ってもよいし、上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行ってもよいし、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行ってもよい。
 上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行う場合には、上記(e)工程および上記(c)工程は、それぞれ、下記(e’)工程および下記(c’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程。
(c’)上記第二段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第1工程。
 また、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行う場合には、上記(e)工程は、下記(e’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程。
 ただし、上記(a)工程~上記(g)工程のうち、上記(c)工程および上記(d)工程の両工程と、上記(e)工程および上記(f)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c)工程および上記(d)工程を行った後、上記(e)工程および上記(f)工程を行ってもよいし、上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行ってもよいし、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行ってもよい。
 上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行う場合には、上記(e)工程および上記(c)工程は、それぞれ、下記(e’)工程および下記(c’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程。
(c’)上記第二段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第2工程。
 また、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行う場合には、上記(e)工程は、下記(e’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程。
 さらに、上記少なくとも1つの目的領域が3つ以上の目的領域を含む場合であって、上記3つ以上の目的領域からまだ選択されていない第3以降の対象領域をPCR増幅するためのプライマーの塩基配列を採用するときは、上記第3以降の対象領域について、上記(a)工程~上記(g)工程までの各工程を繰り返す。
〈優先順位設定後プライマー設計方法の第3の態様〉
 優先順位設定後プライマー設計方法の第3の態様(単に「第3の態様」という場合がある。)は、以下の(a-0)対象領域複数選択工程と、(b-0)プライマー候補塩基配列複数作成工程と、(c-1)第1のローカルアラインメント工程と、(d-1)第1の第一段階選抜工程と、(e-1)第1のグローバルアラインメント工程と、(f-1)第1の第二段階選抜工程と、(g-1)第1のプライマー採用工程と、(c-2)第2のローカルアラインメント工程と、(d-2)第2の第一段階選抜工程と、(e-2)第2のグローバルアラインメント工程と、(f-2)第2の第二段階選抜工程と、(g-2)第2のプライマー採用工程と、を含む。
(a-0)優先順位が設定された増幅候補領域から優先順位が高い順に複数の対象領域を選択する、対象領域複数選択工程。
(b-0)上記複数の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記複数の対象領域のそれぞれの両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成するプライマー候補塩基配列複数作成工程。
(c-1)上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位が最も高い第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、第1のローカルアラインメント工程。
(d-1)上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第1の第一段階選抜工程。
(e-1)上記第1の第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程。
(f-1)上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第1の第二段階選抜工程。
(g-1)上記第1の第一段階選抜工程および上記第1の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、第1のプライマー採用工程。
(c-2)上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位2位の第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める、第2のローカルアラインメント工程。
(d-2)上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第2の第一段階選抜工程。
(e-2)上記第2の第一段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程。
(f-2)上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第2の第二段階選抜工程。
(g-2)上記第2の第一段階選抜工程および上記第2の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、第2のプライマー採用工程。
 ただし、上記(c-1)工程~上記(g-1)工程のうち、上記(c-1)工程および上記(d-1)工程の両工程と、上記(e-1)工程および上記(f-1)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c-1)工程および上記(d-1)工程を行った後、上記(e-1)工程および上記(f-1)工程を行ってもよいし、上記(e-1)工程および上記(f-1)工程を行った後、上記(c-1)工程および上記(d-1)工程を行ってもよいし、上記(c-1)工程および上記(d-1)工程と、上記(e-1)工程および上記(f-1)工程とを、並行して行ってもよい。
 上記(e-1)工程および上記(f-1)工程を行った後、上記(c-1)工程および上記(d-1)工程を行う場合には、上記(e-1)工程および上記(c-1)工程は、それぞれ、下記(e’-1)工程および下記(c’-1)工程とすることが好ましい。
(e’-1)上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位が最も高い第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程。
(c’-1)上記第1の第二段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、第1のローカルアラインメント工程。
 また、上記(c-1)工程および上記(d-1)工程と、上記(e-1)工程および上記(f-1)工程とを、並行して行う場合には、上記(e-1)工程は、下記(e’-1)工程とすることが好ましい。
(e’-1)上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位が最も高い第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程。
 ただし、上記(c-2)工程~上記(g-2)工程のうち、上記(c-2)工程および上記(d-2)工程の両工程と、上記(e-2)工程および上記(f-2)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c-2)工程および上記(d-2)工程を行った後、上記(e-2)工程および上記(f-2)工程を行ってもよいし、上記(e-2)工程および上記(f-2)工程を行った後、上記(c-2)工程および上記(d-2)工程を行ってもよいし、上記(c-1)工程および上記(d-1)工程と、上記(e-1)工程および上記(f-1)工程とを、並行して行ってもよい。
 上記(e-2)工程および上記(f-2)工程を行った後、上記(c-2)工程および上記(d-2)工程を行う場合には、上記(e-2)工程および上記(c-2)工程は、それぞれ、下記(e’-2)工程および下記(c’-2)工程とすることが好ましい。
(e’-2)上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位2位の第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程。
(c’-2)上記第2の第二段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める、第2のローカルアラインメント工程。
 また、上記(c-2)工程および上記(d-2)工程と、上記(e-2)工程および上記(f-2)工程とを、並行して行う場合には、上記(e-2)工程は、下記(e’-2)工程とすることが好ましい。
(e’-2)上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位2位の第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程。
 さらに、上記少なくとも1つの増幅候補領域が3つ以上の増幅候補領域を含み、上記対象領域複数選択工程において3つ以上の対象領域を選択し、かつ、上記プライマー候補塩基配列複数作成工程において上記3つ以上の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を作成した場合であって、優先順位3位以降の第3以降の対象領域をPCR増幅するためのプライマーの塩基配列を採用するときは、上記第3以降の対象領域について、上記第2のローカルアラインメント工程から上記第2のプライマー採用工程までの各工程を繰り返す。
〈各工程の説明〉
 優先順位設定後プライマー設計方法の第1~第3の態様について、適宜、図4~図6を参照しながら、各工程を説明する。
《対象領域選択工程》
 本明細書において、対象領域選択工程S101(図4)、対象領域選択第1工程S201および対象領域選択第2工程S211(図5)、ならびに対象領域複数選択工程S301(図6)を総称して、単に「対象領域選択工程」という場合がある。
(第1の態様: 対象領域選択工程S101)
 図4において「対象領域選択」として示す。
 第1の態様において、(a)対象領域選択工程は、優先順位が設定された増幅候補領域から優先順位の順に対象領域を選択する工程である。
(第2の態様: 対象領域選択第1工程S201および対象領域選択第2工程S211)
 図5において、「対象領域選択第1」および「対象領域選択第2」として示す。
 第2の態様において、(a)対象領域選択第1工程は、優先順位が設定された増幅候補領域から優先順位が最も高い増幅候補領域を第1の対象領域として選択する工程であり、(a)対象領域選択第2工程は、優先順位が設定された増幅候補領域のうちまだ選択されていない増幅候補領域から優先順位が最も高い増幅候補領域を第2の対象領域として選択する工程である。
 第2の態様では、増幅候補領域を優先順位の順に1つずつ選択する。
(第3の態様: 対象領域複数選択工程S301)
 図6において、「対象領域複数選択」として示す。
 第3の態様において、(a-0)対象領域複数選択工程は、優先順位が設定された増幅候補領域から優先順位が高い順に複数の対象領域を選択する工程である。
 第3の態様では、増幅候補領域を優先順位の順に複数個選択する。好ましくは、優先順位が設定された全ての増幅候補領域を選択する。
《プライマー候補塩基配列作成工程》
 プライマー候補塩基配列作成工程S102(図4)、プライマー候補塩基配列作成第1工程S202およびプライマー候補塩基配列作成第2工程S212(図5)、ならびにプライマー候補塩基配列複数作成工程S302(図6)を総称して、単に「プライマー候補塩基配列作成工程」という場合がある。
(第1の態様: プライマー候補塩基配列作成工程S102)
 図4において「プライマー候補塩基配列作成」として示す。
 第1の態様において、(b)プライマー候補塩基配列作成工程は、対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程である。
(第2の態様: プライマー候補塩基配列作成第1工程S202およびプライマー候補塩基配列作成第2工程S212)
 図5において「プライマー候補塩基配列作成第1」および「プライマー候補塩基配列作成第2」として示す。
 第2の態様において、(b)プライマー候補塩基配列作成第1工程は、第1の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第1の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程であり、(b)プライマー候補塩基配列作成第2工程は、第2の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第2の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程である。
 第2の態様では1つの対象領域について、プライマー候補の塩基配列の作成、プライマー候補の選抜、およびプライマーの採用を行い、次の1つの対象領域について、同様の工程を繰り返す。
(第3の態様: プライマー候補塩基配列複数作成工程S302)
 図6において「プライマー候補塩基配列複数作成」として示す。
 第3の態様において、(b-0)プライマー候補塩基配列複数作成工程は、複数の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記複数の対象領域のそれぞれの両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する。
 第3の態様では、複数の対象領域のすべてについて、プライマー候補の塩基配列を作成し、以降の工程で選抜および採用を繰り返す。
(近傍領域)
 対象領域の両端のそれぞれの近傍領域とは、対象領域の5’端から外側の領域、および対象領域の3’端から外側の領域を総称していう。対象領域の内側は近傍領域には含まない。
 近傍領域の長さは特に限定されないが、PCRによって伸張可能な長さ以下であることが好ましく、増幅を所望するDNAフラグメント長の上限以下であることがより好ましい。特に、濃縮選択および/またはシーケンスリードがかかりやすい長さであることが好ましい。PCRにおいて用いる酵素(DNAポリメラーゼ)の種類等によって、適宜変更してもよい。具体的な近傍領域の長さは、好ましくは20~500塩基程度、より好ましくは20~300塩基程度、さらに好ましくは20~200塩基程度、いっそう好ましくは50~200塩基程度である。
(プライマーの設計パラメータ)
 また、プライマー候補の塩基配列を作成する際には、プライマーの長さ、GC含量(全核酸塩基中のグアニン(G)およびシトシン(C)の合計モル百分率をいう。)、融解温度(2本鎖DNAの50%が解離して1本鎖DNAになる温度をいう。また、Melting Temperatureに由来し、「Tm値」という場合もある。単位は「℃」である。)、および配列の偏りなど、一般的なプライマーの設計方法において留意する点は同じである。
・プライマーの長さ
 プライマーの長さ(ヌクレオチド数)は、特に限定されないが、好ましくは15mer~45mer、より好ましくは20mer~45mer、さらに好ましくは20mer~30merである。プライマーの長さがこの範囲内であると、特異性および増幅効率に優れるプライマーを設計しやすい。
・プライマーのGC含量
 プライマーのGC含量は、特に限定されないが、好ましくは40モル%~60モル%、より好ましくは45モル%~55モル%である。GC含量がこの範囲内であると、高次構造に起因する特異性および増幅効率の低下の問題が生じにくい。
・プライマーのTm値
 プライマーのTm値は、特に限定されないが、好ましくは50℃~65℃の範囲内、より好ましくは55℃~65℃の範囲内である。
 プライマーのTm値の差は、プライマーペアおよびプライマーセットにおいて、好ましくは5℃以下、より好ましくは3℃以下とする。
 Tm値は、OLIGO Primer Analysis Software(Molecular Biology Insights社製)、または、Primer3(http://www-genome.wi.mit.edu/ftp/distribution/software/)等のソフトウエアを用いて計算することができる。
 また、プライマーの塩基配列中のA、T、GおよびCの数(それぞれ、nA、nT、nGおよびnCとする)から、下記式によって計算により求めることもできる。
 Tm値(℃)=2(nA+nT)+4(nC+nG)
 Tm値の算出方法はこれらに限定されず、従来公知の種々の方法によってTm値を算出することができる。
・プライマーの塩基の偏り
 プライマー候補の塩基配列は、全体的に塩基の偏りがない配列にすることが好ましい。例えば、部分的にGCリッチな配列および部分的にATリッチな配列を避けることが望ましい。
 また、Tおよび/またはCの連続(ポリピリミジン)、ならびにAおよび/またはGの連続(ポリプリン)も避けることが望ましい。
・プライマーの3’末端
 さらに、3’末端塩基配列が、GCリッチな配列またはATリッチな配列を避けることが好ましい。3’末端塩基はGまたはCが好ましいが、これらに限定はされない。
《特異性チェック工程》
 「プライマー候補塩基配列作成工程」において作成した各プライマー候補の塩基配列の染色体DNAに対する配列相補性に基づいて、プライマー候補の塩基配列の特異性を評価する特異性チェック工程を実施してもよい(図示せず)。
 特異性のチェックは、染色体DNAの塩基配列とプライマー候補の塩基配列とのローカルアラインメントを行い、ローカルアラインメント・スコアが予め設定した値未満である場合には、そのプライマー候補の塩基配列はゲノムDNAに対する相補性が低く、特異性が高いと評価することができる。ここで、ローカルアラインメントは、染色体DNAの相補鎖についても行うことが望ましい。プライマーが1本鎖DNAであるのに対して、染色体DNAは2本鎖だからである。また、プライマー候補の塩基配列の代わりに、これと相補的な塩基配列を用いてもよい。
 また、プライマー候補の塩基配列をクエリー配列として、ゲノムDNA塩基配列データベースに対して相同性検索をしてもよい。相同性検索ツールとしては、例えば、BLAST(Basic Local Alignment Search Tool:ブラスト)(Altschul, S. A.、外4名、“Basic Local Alignment Search Tool”、Journal of Molecular Biology、1990年、10月、第215巻、p.403-410)およびFASTA(ファストエー)(Pearson, W. R.、外1名、“Improved tools for biological sequence comparison”、米国科学アカデミー紀要、米国科学アカデミー、1988年、4月、第85巻、p.2444-2448)等が挙げられる。相同性検索を行った結果として、ローカルアラインメントを得ることができる。
 スコア、およびローカルアラインメント・スコアの閾値は、いずれも、特に限定されず、プライマー候補の塩基配列の長さ、および/またはPCR条件等によって、適宜設定することができる。相同性検索ツールを使用する場合には、その相同性検索ツールの既定値を使ってもよい。
 例えば、スコアとして、マッチ(相補塩基)=+1、ミスマッチ(非相補塩基)=-1、インデル(挿入および/または欠失)=-3を採用し、閾値を+15に設定すること等が考えられる。
 プライマー候補の塩基配列が染色体DNA上の想定外の位置の塩基配列と相補性を有し、特異性が低い場合には、その塩基配列のプライマーを用いてPCRを行った際に、対象領域ではなくアーティファクトを増幅する場合があるため、除外する。
《ローカルアラインメント工程》
 本明細書において、ローカルアラインメント工程S103(図4)、ローカルアラインメント第1工程S203およびローカルアラインメント第2工程S213(図5)、ならびに第1のローカルアラインメント工程S303および第2のローカルアラインメント工程S313(図6)を総称して、単に「ローカルアラインメント工程」という場合がある。
(第1の態様: ローカルアラインメント工程S103)
 図4において「ローカルアラインメント」として示す。
 第1の態様において、(c)ローカルアラインメント工程は、上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程である。
(第2の態様: ローカルアラインメント第1工程S203およびローカルアラインメント第2工程S213)
 図5において「ローカルアラインメント第1」および「ローカルアラインメント第2」として示す。
 第2の態様において、(c)ローカルアラインメント第1工程は、上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程であり、(c)ローカルアラインメント第2工程は、上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程である。
(第3の態様: 第1のローカルアラインメント工程S303および第2のローカルアラインメント工程S313)
 図6において「第1のローカルアラインメント」および「第2のローカルアラインメント」として示す。
 第3の態様において、(c-1)第1のローカルアラインメント工程は、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位が最も高い第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程であり、(c-2)第2のローカルアラインメント工程は、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち優先順位2位の第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める工程である。
(ローカルアラインメントの方法)
 ローカルアラインメントを行う塩基配列の組合せは、重複を許して選択した組合せであってもよいし、重複を許さず選択した組合せであってもよいが、同一塩基配列のプライマー間でのプライマー・ダイマー形成性をまだ評価していない場合には、重複を許して選択した組合せが好ましい。
 組合せの総数は、ローカルアラインメントを行う塩基配列の総数をp個として、重複を許して選択した場合は、「p+1=(p+1)!/2(p-1)!」通りであり、重複を許さず選択した場合は、「=p(p-1)/2」通りである。
 ローカルアラインメントは、部分配列に対して行うアラインメントであり、相補性の高い部分を局所的に調べることができる。
 ただし、本発明においては、通常、塩基配列に対して行われているローカルアラインメントとは異なり、「比較する部分配列が塩基配列の3’末端を含む」という条件の下で、ローカルアラインメントを行うこととして、比較する部分配列が両方の塩基配列の3’末端を含むようにした。
 さらに、本発明においては、「比較する部分配列が、塩基配列の3’末端を含む」という条件、すなわち、「比較する部分配列が、一方の配列の3’末端から始まり他方の配列の3’末端で終わるアラインメントのみを考慮する」という条件、の下でローカルアラインメントを行うこととして、比較する部分配列が両方の塩基配列の3’末端を含むようにする態様が好ましい。
 なお、ローカルアラインメントは、ギャップを挿入してもよい。ギャップは塩基の挿入および/または欠失(インデル)を意味する。
 また、ローカルアラインメントは、塩基配列ペア間で塩基が相補的である場合を一致(マッチ)とし、相補的でない場合を不一致(ミスマッチ)とする。
 アラインメントは、マッチ、ミスマッチおよびインデルのそれぞれにスコアを与え、合計スコアが最大となるように行う。スコアは適宜設定すればよい。例えば、下記表1のようにスコアを設定してもよい。なお、表1中「-」はギャップ(挿入および/または欠失(インデル))を表す。
Figure JPOXMLDOC01-appb-T000001
 例えば、以下の表2に示す配列番号1および2の塩基配列について、ローカルアラインメントを行うことを考える。ここで、スコアは表1に示すとおりとする。
Figure JPOXMLDOC01-appb-T000002
 配列番号1および2の塩基配列から、表3に示すドット行列(ドットマトリクス)を作成する。具体的には、配列番号1の塩基配列を左から右へ、5’から3’の向きで並べ、配列番号2の塩基配列を下から上へ、5’から3’の向きで並べ、塩基が相補的であるグリッドに「・」を記入して、表3に示すドットマトリクスを得る。
Figure JPOXMLDOC01-appb-T000003
 表3に示すドットマトリクスから、以下の表4に示す、部分配列のアラインメント(ペアワイズアラインメント)を得る(表3の斜線部分参照)。なお、表4中、マッチを「|」で、ミスマッチを「:」で、それぞれ示す。
Figure JPOXMLDOC01-appb-T000004
 この(ペアワイズ)アラインメントには、マッチが9か所あり、ミスマッチが8か所あり、インデル(ギャップ)はない。
 したがって、この(ペアワイズ)アラインメントに基づくローカルアラインメント・スコアは、(+1)×9+(-1)×8+(-1)×0=+1となる。
 なお、アラインメント(ペアワイズアラインメント)は、ここに例示したドットマトリクス法のみならず、動的計画法、ワード法、またはその他種々の方法により得ることができる。
《第一段階選抜工程》
 本明細書において、第一段階選抜工程S104(図4)、第一段階選抜第1工程S204および第一段階選抜第2工程S214(図5)、ならびに第1の第一段階選抜工程S304および第2の第一段階選抜工程S314(図6)を総称して、単に「第一段階選抜工程」という場合がある。
(第1の態様: 第一段階選抜工程S104)
 図4において「第一段階選抜」として示す。
 第1の態様において、(d)第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
(第2の態様: 第一段階選抜第1工程S204および第一段階選抜第2工程S214)
 図5において「第一段階選抜第1」および「第一段階選抜第2」として示す。
 第2の態様において、(d)第一段階選抜第1工程は、上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程であり、(d)第一段階選抜第2工程は、上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
(第3の態様: 第1の第一段階選抜工程S304および第2の第一段階選抜工程S314)
 図6において「第1の第一段階選抜」および「第2の第一段階選抜」として示す。
 第3の態様において、(d-1)第1の第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程であり、(d-2)第2の第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
(第1段階選抜の方法)
 ローカルアラインメント・スコアの閾値(「第1の閾値」ともいう。)を予め設定しておく。
 ローカルアラインメント・スコアが第1の閾値未満であれば、これらの2つの塩基配列の組合せはダイマー形成性が低いと判断し、以降の工程を行う。
 一方、ローカルアラインメント・スコアが第1の閾値以上であれば、これらの2つの塩基配列の組合せはプライマー・ダイマー形成性が高いと判断し、その組合せについては以降の工程を行わない。
 第1の閾値は、特に限定されず、適宜設定することができる。例えば、ポリメラーゼ連鎖反応の鋳型となるゲノムDNAの量などのPCR条件によって、第1の閾値を設定してもよい。
 ここで、上記「ローカルアラインメント」に示した例において、第1の閾値を「+3」に設定した場合を考える。
 上の例では、ローカルアラインメント・スコアは「+1」であり、第1の閾値である「+3」未満であったから、配列番号1および2の塩基配列の組合せはプライマー・ダイマー形成性が低いと判断することができる。
 なお、本工程は、ローカルアラインメント工程S103、ローカルアラインメント第1工程S203、ローカルアラインメント第2工程S213、第1のローカルアラインメント工程S303、または第2のローカルアラインメント工程S313においてローカルアラインメント・スコアを算出したすべての組合せに対して行う。
《グローバルアラインメント工程》
 本明細書において、グローバルアラインメント工程S105(図4)、グローバルアラインメント第1工程S205およびグローバルアラインメント第2工程S215(図5)、ならびに第1のグローバルアラインメント工程S305および第2のグローバルアラインメント工程S315(図6)を総称して、単に「グローバルアラインメント工程」という場合がある。
(第1の態様: グローバルアラインメント工程S105)
 図4において「グローバルアラインメント」として示す。
 第1の態様において、(e)グローバルアラインメント工程は、上記第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程である。
(第2の態様: グローバルアラインメント第1工程S205およびグローバルアラインメント第2工程S215)
 図5において「グローバルアラインメント第1」および「グローバルアラインメント第2」として示す。
 第2の態様において、(e)グローバルアラインメント第1工程は、上記第一段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程であり、(e)グローバルアラインメント第2工程は、上記第一段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程である。
(第3の態様: 第1のグローバルアラインメント工程S305および第2のグローバルアラインメント工程S315)
 図6において「第1のグローバルアラインメント」および「第2のグローバルアラインメント」として示す。
 第3の態様において、(e-1)第1のグローバルアラインメント工程は、上記第1の第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程であり、(e-2)第2のグローバルアラインメント工程は、上記第2の第一段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める工程である。
(グローバルアラインメントの方法)
 グローバルアラインメント・スコアは、「プライマー候補塩基配列作成工程」で作成したプライマー候補の全部(「ローカルアラインメント工程」および「第1段階選抜工程」を先に行った場合において、ローカルアラインメント・スコアが第1の閾値未満であるプライマー候補の組合せがあるときは、その組合せに含まれるプライマー候補の全部。)および既に採用したプライマーの全部(既に採用したプライマーが存在する場合に限る。)からなる群から2つのプライマーを取り出して、3’末端を含む、予め設定した配列長の塩基配列について、ペアワイズにグローバルアラインメントを行って、求める。
 グローバルアラインメントを行う塩基配列の組合せは、重複を許して選択した組合せであってもよいし、重複を許さず選択した組合せであってもよいが、同一塩基配列のプライマー間でのプライマー・ダイマー形成性をまだ評価していない場合には、重複を許して選択した組合せが好ましい。
 組合せの総数は、グローバルアラインメントを行う塩基配列の総数をx個として、重複を許して選択した場合は、「x+1=(x+1)!/2(x-1)!」通りであり、重複を許さず選択した場合は、「=x(x-1)/2」通りである。
 グローバルアラインメントは、「配列全体」に対して行うアラインメントであり、配列全体の相補性を調べることができる。
 ただし、ここで、「配列全体」は、プライマー候補の塩基配列の3’末端を含む、予め設定した配列長の塩基配列の全体である。
 なお、グローバルアラインメントは、ギャップを挿入してもよい。ギャップは塩基の挿入および/または欠失(インデル)を意味する。
 また、グローバルアラインメントは、塩基配列ペア間で塩基が相補的である場合を一致(マッチ)とし、相補的でない場合を不一致(ミスマッチ)とする。
 アラインメントは、マッチ、ミスマッチおよびインデルのそれぞれにスコアを与え、合計スコアが最大となるように行う。スコアは適宜設定すればよい。例えば、上記表1のようにスコアを設定してもよい。なお、表1中「-」はギャップ(挿入および/または欠失(インデル))を表す。
 例えば、以下の表5に示す配列番号1および2の塩基配列について、それぞれの3’末端の3塩基(大文字箇所)についてグローバルアラインメントを行うことを考える。ここで、スコアは表1に示すとおりとする。
Figure JPOXMLDOC01-appb-T000005
 スコアが最大となるように、配列番号1の塩基配列の3’末端の3塩基(大文字箇所)および配列番号2の3’末端の3塩基(大文字箇所)の塩基配列についてグローバルアラインメントを行うと、以下の表6に示すアラインメント(ペアワイズアラインメント)を得ることができる。なお、表6中、ミスマッチを「:」で示す。
Figure JPOXMLDOC01-appb-T000006
 この(ペアワイズ)アラインメントには、ミスマッチが3か所あり、マッチおよびインデル(ギャップ)はいずれもない。
 したがって、この(ペアワイズ)アラインメントに基づくグローバルアラインメント・スコアは、(+1)×0+(-1)×3+(-1)×0=-3となる。
 なお、アラインメント(ペアワイズアラインメント)は、ドットマトリクス法、動的計画法、ワード法、またはその他種々の方法により得ることができる。
《第二段階選抜工程》
 本明細書において、第二段階選抜工程S106(図4)、第二段階選抜第1工程S206および第二段階選抜第2工程S216(図5)、ならびに第1の第二段階選抜工程S306および第2の第二段階選抜工程S316(図6)を総称して、単に「第二段階選抜工程」という場合がある。
(第1の態様: 第二段階選抜工程S106)
 図4において「第二段階選抜」として示す。
 第1の態様において、(f)第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
(第2の態様: 第二段階選抜第1工程S206および第二段階選抜第2工程S216)
 図5において「第二段階選抜第1」および「第二段階選抜第2」として示す。
 第2の態様において、(f)第二段階選抜第1工程は、上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程であり、(f)第二段階選抜第2工程は、上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
(第3の態様: 第1の第二段階選抜工程S306および第2の第二段階選抜工程S316)
 図6において「第1の第二段階選抜」および「第2の第二段階選抜」として示す。
 第3の態様において、(f-1)第1の第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程であり、(f-2)第2の第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
(第二段階選抜の方法)
 グローバルアラインメント・スコアの閾値(「第2の閾値」ともいう。)を予め設定しておく。
 グローバルアラインメント・スコアが第2の閾値未満であれば、これらの2つの塩基配列の組合せはダイマー形成性が低いと判断し、以降の工程を行う。
 一方、グローバルアラインメント・スコアが第2の閾値以上であれば、これらの2つの塩基配列の組合せはダイマー形成性が高いと判断し、その組合せについては以降の工程を行わない。
 第2の閾値は、特に限定されず、適宜設定することができる。例えば、ポリメラーゼ連鎖反応の鋳型となるゲノムDNAの量などのPCR条件によって、第2の閾値を設定してもよい。
 なお、プライマーの3’末端から数塩基の塩基配列を同一塩基配列とすることによって、それぞれのプライマーの塩基配列の3’末端を含む予め設定した塩基数の塩基配列について、ペアワイズにグローバルアラインメントを行って求めたグローバルアラインメント・スコアを第2の閾値未満とすることができる。
 ここで、上記「グローバルアラインメント工程」に示した例において、第2の閾値を「+3」に設定した場合を考える。
 上の例では、グローバルアラインメント・スコアは「-3」であり、第2の閾値である「+3」未満であったから、配列番号1および2の塩基配列の組合せはプライマー・ダイマー形成性が低いと判断することができる。
 なお、本工程は、グローバルアラインメント工程S105、グローバルアラインメント第1工程S205、グローバルアラインメント第2工程S215、第1のグローバルアラインメント工程S305、または第2のグローバルアラインメント工程S315においてグローバルアラインメント・スコアを算出したすべての組合せに対して行う。
 また、計算量を低減させるため、「グローバルアラインメント工程」および「第2段階選抜工程」の両工程を先に実施して、「第2段階選抜工程」を通過したプライマーの塩基配列の組合せに対して、「ローカルアラインメント工程」および「第1段階選抜工程」の両工程を実施することが好ましい。特に、対象領域の数が増加するほど、プライマー候補の塩基配列数が増加するほど、計算量を低減させる効果が大きく、全体の処理の高速化を図ることができる。
 これは、「グローバルアラインメント工程」では「予め設定した配列長」という短い長さの塩基配列についてグローバルアラインメントを行うので、3’末端を含むという条件下で塩基配列全体から相補性が高い部分配列を見つけるローカルアラインメント・スコアよりも計算量が少なく、高速に処理できるからである。なお、通常知られているアルゴリズムでは、同じ長さの配列に対するアラインメントであれば、ローカルアラインメントよりもグローバルアラインメントの方が高速であることが知られている。
《増幅配列長チェック工程》
 「第1段階選抜工程」および「第2段階選抜工程」においてプライマー・ダイマー形成性が低いと判断されたプライマー候補の塩基配列の組合せに対して、染色体DNA上でのプライマー候補の塩基配列の端部間の距離を計算し、その距離が予め設定した範囲内であるか否かを判断する増幅配列長チェック工程を実施してもよい(図示せず)。
 塩基配列の端部間の距離が予め設定した範囲内であれば、そのプライマー候補の塩基配列の組合せは、対象領域を適切に増幅できる可能性が高いと判断することができる。プライマー候補の塩基配列の端部間の距離は、特に限定されず、酵素(DNAポリメラーゼ)の種類等のPCR条件によって、適宜設定することができる。例えば、100~200塩基(対)の範囲内、120~180塩基(対)の範囲内、140~180塩基(対)の範囲内、140~160塩基(対)の範囲内、160~180塩基(対)の範囲内など、様々な範囲に設定することができる。
《プライマー採用工程》
 本明細書において、プライマー採用工程S107(図4)、プライマー採用第1工程S207およびプライマー採用第2工程S217(図5)、ならびに第1のプライマー採用工程S307および第2のプライマー採用工程S317(図6)を総称して、単に「プライマー採用工程」という場合がある。
(第1の態様: プライマー採用工程S107)
 図4において「プライマー採用」として示す。
 第1の態様において、(g)プライマー採用工程は、上記第一段階選抜工程および上記第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
(第2の態様: プライマー採用第1工程S207およびプライマー採用第2工程S217)
 図5において「プライマー採用第1」および「プライマー採用第2」として示す。
 第2の態様において、(g)プライマー採用第1工程は、上記第一段階選抜第1工程および上記第二段階選抜第1工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程であり、(g)プライマー採用第2工程は、上記第一段階選抜第2工程および上記第二段階選抜第2工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
(第3の態様: 第1のプライマー採用工程S307および第2のプライマー採用工程S317)
 図6において「第1のプライマー採用」および「第2のプライマー採用」として示す。
 第3の態様において、(g-1)第1のプライマー採用工程は、上記第1の第一段階選抜工程および上記第1の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程であり、(g-2)第2のプライマー採用工程は、上記第2の第一段階選抜工程および上記第2の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
(プライマー採用の方法)
 プライマー採用工程では、それぞれのプライマー候補の塩基配列について、比較する部分配列がその塩基配列の3’末端を含むという条件の下に、ペアワイズでローカルアラインメントを行って求めたローカルアラインメント・スコアが第1の閾値未満であり、かつ、それぞれのプライマー候補の塩基配列の3’末端を含む予め設定した塩基数の塩基配列について、ペアワイズでグローバルアラインメントを行って求めたグローバルアラインメント・スコアが第2の閾値未満であるプライマー候補の塩基配列を、対象領域を増幅するためのプライマーの塩基配列として採用する。
 例えば、表7に示す配列番号1および2の塩基配列について、対象領域を増幅するためのプライマーの塩基配列として採用することを考える。
Figure JPOXMLDOC01-appb-T000007
 既に記載したように、配列番号1と配列番号2の組合せにおいて、ローカルアラインメント・スコアは「+1」であるから、第1の閾値である「+3」未満であり、また、グローバルアラインメント・スコアは「-3」であるから、第2の閾値である「+3」未満である。
 したがって、配列番号1で示されるプライマー候補の塩基配列および配列番号2で示されるプライマー候補の塩基配列を、対象領域を増幅するためのプライマーの塩基配列として採用することができる。
《他の増幅候補領域のプライマー設計》
 1つの増幅候補領域に対してプライマーを採用した後、さらに次の優先順位の増幅候補領域に対してプライマーを設計してもよい。
 第1の態様においては、プライマー候補塩基配列作成工程S102において、次の優先順位の増幅候補領域に対するプライマー候補の塩基配列が作成されていれば、ローカルアラインメント工程S103から行う。次の優先順位の増幅候補領域に対するプライマー候補の塩基配列が作成されていなければ、対象領域選択工程S101において次の優先順位の増幅候補領域が選択されていなかったので、対象領域選択工程S101において次の優先順位の増幅候補領域を選択し、プライマー候補塩基配列作成工程S102において、その増幅候補領域に対するプライマー候補の塩基配列を作成した後、ローカルアラインメント工程S103以降を行う。
 第2の態様においては、対象領域選択第2工程S211から繰り返す。
 第3の態様において、既に対象領域複数選択工程S301において選択した増幅候補領域に対するプライマー候補の塩基配列がプライマー候補塩基配列複数作成工程S302において作成されているため、第2のローカルアラインメント工程S313から繰り返す。
《プライマー等の設計における特徴点》
 増幅候補領域に優先順位を付けた後のプライマー等の設計における特徴点は、概していえば、複数の特定の対象領域を選択し、近傍の塩基配列を検索し、抽出済プライマーセットの各々との相補性を確認し、相補性の少ない塩基配列を選択することによって、対象領域を増幅対象に含み、かつ互いに相補的にならないプライマー群を得ることにある。
 プライマーの塩基配列の相補性の確認における特徴点は、ローカルアラインメントを用いて配列全体の相補性が低くなるように、かつ、プライマーの塩基配列の端部に対して、グローバルアラインメントを用いて相補性が低くなるようにプライマー群を作成する点にある。
[実施例1]
 表8に示す増幅候補領域をPCR増幅するためのマルチプレックスPCRに供するプライマーを設計する。
 本実施例では、85箇所中、53箇所以上の増幅候補領域に対してプライマーを設計することを目的とする。
Figure JPOXMLDOC01-appb-T000008
(第1の優先順位の設定)
 表8に示す増幅候補領域V1~V85の座標値順に第1の優先順位を設定した。
(第1の優先順位設定後のプライマー設計)
 第1の優先順位に従って、各増幅候補領域をPCR増幅するためのプライマーを設計したところ、以下の52箇所の増幅候補領域に対してプライマーを設計することができた。
Figure JPOXMLDOC01-appb-T000009
(第2の優先順位の設定)
 増幅候補領域V1~V85を、座標値順に、20箇所の増幅候補領域を含むブロック4個と5個所の増幅候補領域を含むブロック1個、すなわち、V1~V20を含むブロック1、V21~V40を含むブロック2、V41~V60を含むブロック3、V61~V80を含むブロック4、およびV81~V85を含むブロック5に分割した。
 次に、各ブロック内でランダムパーミュテーションを行い、ブロック内の各増幅候補領域の順序をランダムに変更した順列を得た。
 ブロック1~5をこの順序で結合し、ブロック分割を解除して、V1~V85の増幅候補領域の順序を並び替えた順列を得た。
 このV1~V85の順序を第2の優先順位とした。
(第2の優先順位設定後のプライマー設計)
 第2の優先順位に従って、各増幅候補領域をPCR増幅するためのプライマーを設計したところ、以下の54箇所の増幅候補領域に対してプライマーを設計することができた。
Figure JPOXMLDOC01-appb-T000010
 11 演算手段(CPU)
 12 記憶手段(メモリ)
 13 補助記憶手段(ストレージ)
 14 入力手段(キーボード)
 15 補助入力手段(マウス)
 16 表示手段(モニタ)
 17 出力手段(プリンタ)

Claims (3)

  1.  ゲノムDNA上のn個の増幅候補領域に対して、第1番目から第n番目までの順序である第1の優先順位を付ける、第1の優先順位設定工程と、
     前記第1の優先順位の順序に従って、前記第1の優先順位が第1番目の増幅候補領域から、順次、その増幅候補領域をPCR増幅するためのプライマーを設計する、第1のプライマー設計工程と、
     前記第1のプライマー設計工程においてプライマーを設計することができた増幅候補領域の数をm個として、m≧tであるとき、プライマーの設計を終了し、m<tであるとき、次の工程に進む、と決定する、第1の成否判定工程と、
     前記n個の増幅候補領域に対して、第1番目から第n番目までの順序であって、第1の優先順位の順序とは異なる、第2の優先順位を付ける、第2の優先順位設定工程と、
     前記第2の優先順位の順序に従って、前記第2の優先順位が第1番目の増幅候補領域から、順次、その増幅候補領域をPCR増幅するためのプライマーを設計する、第2のプライマー設計工程と、
    を含む、ゲノム上のn個の増幅候補領域のうちt個以上の増幅候補領域を増幅するためのマルチプレックスPCRに供するプライマーの設計方法であって、
     前記第2の優先順位設定工程は、
     前記n個の増幅候補領域の識別情報および第1の優先順位情報が入力手段を介して入力されて、記憶手段に記憶され、
     演算手段が前記第1の優先順位の順序で並べて、前記n個の増幅候補領域を要素とする第1の順列を作成して、記憶手段に記憶し、
     演算手段が前記第1の優先順位の順序で並べた前記n個の増幅候補領域を、i番目のブロックがk個の増幅候補領域を含むように、j個のブロックに分割して、記憶手段に記憶し、
     演算手段が前記j個のブロックのうち、少なくとも1つのブロックの内部で、そのブロックに含まれる増幅候補領域を並び替えて、記憶手段に記憶し、
     演算手段が1番目からj番目までのブロックを順に結合して、ブロック分割を解除して、第2の順列を作成し、前記第2の順列に含まれる前記n個の増幅候補領域の順序を前記n個の増幅候補領域の第2の優先順位とする工程である、
    ゲノム上のn個の増幅候補領域のうちt個以上の増幅候補領域を増幅するためのマルチプレックスPCRに供するプライマーの設計方法。
     ただし、nはn≧4を満たす整数であり、tは2≦t≦nを満たす整数であり、mは0≦m≦nを満たす整数であり、iは1≦i≦jを満たす整数であり、jは2≦j≦n/2を満たす整数であり、kは2≦k≦{n-2×(j-1)}を満たす整数である。
  2.  前記第2のプライマー設計工程の後に、さらに、
     前記第2のプライマー設計工程においてプライマーを設計することができた増幅候補領域の数をm’個として、m’≧tであるとき、プライマーの設計を終了し、m’<tであるとき、前記第2の優先順位設定工程に戻る、と決定する、第2の成否判定工程
    を含む、請求項1に記載のマルチプレックスPCRに供するプライマーの設計方法。
     ただし、m’は0≦m’≦nを満たす整数である。
  3.  前記第2の優先順位設定工程において、前記ブロック内で前記増幅候補領域の順序をランダムに変更する、請求項1または2に記載のマルチプレックスPCRに供するプライマーの設計方法。
PCT/JP2017/032287 2016-09-29 2017-09-07 マルチプレックスpcrに供するプライマーの設計方法 WO2018061699A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018542326A JPWO2018061699A1 (ja) 2016-09-29 2017-09-07 マルチプレックスpcrに供するプライマーの設計方法
EP17855657.7A EP3521425A4 (en) 2016-09-29 2017-09-07 PROCESS FOR DESIGNING PRIMERS FOR MULTIPLEX PCR
CN201780060312.3A CN109804079A (zh) 2016-09-29 2017-09-07 供多重pcr的引物的设计方法
US16/370,434 US20190221287A1 (en) 2016-09-29 2019-03-29 Method for designing primers for multiplex pcr

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016192158 2016-09-29
JP2016-192158 2016-09-29

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/370,434 Continuation US20190221287A1 (en) 2016-09-29 2019-03-29 Method for designing primers for multiplex pcr

Publications (1)

Publication Number Publication Date
WO2018061699A1 true WO2018061699A1 (ja) 2018-04-05

Family

ID=61760641

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/032287 WO2018061699A1 (ja) 2016-09-29 2017-09-07 マルチプレックスpcrに供するプライマーの設計方法

Country Status (5)

Country Link
US (1) US20190221287A1 (ja)
EP (1) EP3521425A4 (ja)
JP (1) JPWO2018061699A1 (ja)
CN (1) CN109804079A (ja)
WO (1) WO2018061699A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024047992A1 (ja) * 2022-08-31 2024-03-07 富士フイルム株式会社 アンプリコンメチル化シーケンス解析用のプライマーの設計方法、製造方法、設計装置、設計プログラムおよび記録媒体

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP2820158B1 (en) 2012-02-27 2018-01-10 Cellular Research, Inc. Compositions and kits for molecular counting
GB2546833B (en) 2013-08-28 2018-04-18 Cellular Res Inc Microwell for single cell analysis comprising single cell and single bead oligonucleotide capture labels
CN107208158B (zh) 2015-02-27 2022-01-28 贝克顿迪金森公司 空间上可寻址的分子条形编码
JP7508191B2 (ja) 2015-03-30 2024-07-01 ベクトン・ディキンソン・アンド・カンパニー コンビナトリアルバーコーディングのための方法および組成物
WO2016172373A1 (en) * 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
EP3347465B1 (en) 2015-09-11 2019-06-26 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CA3034924A1 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
WO2018144240A1 (en) 2017-02-01 2018-08-09 Cellular Research, Inc. Selective amplification using blocking oligonucleotides
US20180237853A1 (en) * 2017-02-19 2018-08-23 Yan Wang Methods, Compositions and Kits for Detection of Mutant Variants of Target Genes
US10676779B2 (en) 2017-06-05 2020-06-09 Becton, Dickinson And Company Sample indexing for single cells
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
US11365409B2 (en) 2018-05-03 2022-06-21 Becton, Dickinson And Company Molecular barcoding on opposite transcript ends
EP3861134B1 (en) 2018-10-01 2024-09-04 Becton, Dickinson and Company Determining 5' transcript sequences
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
US11661631B2 (en) 2019-01-23 2023-05-30 Becton, Dickinson And Company Oligonucleotides associated with antibodies
CN113454234A (zh) 2019-02-14 2021-09-28 贝克顿迪金森公司 杂合体靶向和全转录物组扩增
WO2021016239A1 (en) 2019-07-22 2021-01-28 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
CN116635533A (zh) 2020-11-20 2023-08-22 贝克顿迪金森公司 高表达的蛋白和低表达的蛋白的谱分析
CN117280044A (zh) * 2021-10-29 2023-12-22 京东方科技集团股份有限公司 一种基于迭代的多重pcr引物设计方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000308487A (ja) * 1999-03-30 2000-11-07 Japan Science & Technology Corp プライマー塩基配列の選定方法及びその装置
WO2008004691A1 (fr) * 2006-07-04 2008-01-10 Shimadzu Corporation appareil pour concevoir des amorces d'amplification d'acides nucléiques, programme pour concevoir des amorces et appareil de serveur pour concevoir des amorces
JP2015136314A (ja) * 2014-01-21 2015-07-30 株式会社ダナフォーム クローン開発製造販売の方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2660027T3 (es) * 2012-10-01 2018-03-20 Adaptive Biotechnologies Corporation Evaluación de la inmunocompetencia por la diversidad de los receptores de inmunidad adaptativa y caracterización de la clonalidad
JP6768815B2 (ja) * 2016-09-29 2020-10-14 富士フイルム株式会社 マルチプレックスpcrに供するプライマーの設計方法
JPWO2018061693A1 (ja) * 2016-09-29 2019-07-04 富士フイルム株式会社 マルチプレックスpcrに供するプライマーの設計方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000308487A (ja) * 1999-03-30 2000-11-07 Japan Science & Technology Corp プライマー塩基配列の選定方法及びその装置
WO2008004691A1 (fr) * 2006-07-04 2008-01-10 Shimadzu Corporation appareil pour concevoir des amorces d'amplification d'acides nucléiques, programme pour concevoir des amorces et appareil de serveur pour concevoir des amorces
JP2015136314A (ja) * 2014-01-21 2015-07-30 株式会社ダナフォーム クローン開発製造販売の方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ALTSCHUL, S. A.: "Basic Local Alignment Search Tool", JOURNAL OF MOLECULAR BIOLOGY, vol. 215, October 1990 (1990-10-01), pages 403 - 410, XP002949123, DOI: doi:10.1006/jmbi.1990.9999
CHEN, Y. ET AL.: "Design of mutiplex PCR primers using heuristic algorithm for sequential deletion applications", COMPUTATIONAL BIOLOGY AND CHEMISTRY, vol. 33, 2009, pages 181 - 188, XP025987439, DOI: doi:10.1016/j.compbiolchem.2008.12.003 *
PEARSON, W. R.: "Proceedings of the National Academy of Sciences of the United States of America", vol. 85, April 1988, NATIONAL ACADEMY OF SCIENCES, article "Improved tools for biological sequence comparison", pages: 2444 - 2448
See also references of EP3521425A4

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024047992A1 (ja) * 2022-08-31 2024-03-07 富士フイルム株式会社 アンプリコンメチル化シーケンス解析用のプライマーの設計方法、製造方法、設計装置、設計プログラムおよび記録媒体

Also Published As

Publication number Publication date
US20190221287A1 (en) 2019-07-18
CN109804079A (zh) 2019-05-24
EP3521425A4 (en) 2019-10-23
EP3521425A1 (en) 2019-08-07
JPWO2018061699A1 (ja) 2019-06-24

Similar Documents

Publication Publication Date Title
WO2018061699A1 (ja) マルチプレックスpcrに供するプライマーの設計方法
JP6768815B2 (ja) マルチプレックスpcrに供するプライマーの設計方法
Ghiurcuta et al. Evaluating synteny for improved comparative studies
WO2018061693A1 (ja) マルチプレックスpcrに供するプライマーの設計方法
Bryant et al. QSRA–a quality-value guided de novo short read assembler
JP2022533801A (ja) 合成による高速フォワードシークエンシング
Hapke et al. GI b PS s: a toolkit for fast and accurate analyses of genotyping‐by‐sequencing data without a reference genome
US20180032669A1 (en) Method for designing primer used for polymerase chain reaction and primer set
US20200286589A1 (en) Methods of optimizing genome assembly parameters
US11495325B2 (en) Systems and methods for multiplex PCR primer selection
Schlebusch et al. Next generation shotgun sequencing and the challenges of de novo genome assembly
US20170132361A1 (en) Sequence assembly method
US11551784B2 (en) Ordinal position-specific and hash-based efficient comparison of sequencing results
US20160055293A1 (en) Systems, Algorithms, and Software for Molecular Inversion Probe (MIP) Design
Waldl et al. Modeling Kinetics of RNA RNA Interactions on Direct Paths
US11760993B2 (en) High efficient indexing method for genome assembly
JP7030312B2 (ja) 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム
WO2018066317A1 (ja) 必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法
Kumar et al. Genome Assembly: A Review
Yuryev PCR primer design using statistical modeling
US20220028491A1 (en) Biologically informed and accurate sequence alignment
Blassel From sequences to knowledge, improving and learning from sequence alignments
US20180082014A1 (en) Biomarker search device, biomarker search method, and non-transitory computer readable medium
Badr et al. BeamGA Median: A Hybrid Heuristic Search Approach
Olson New methods for assembly and validation of large genomes

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17855657

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018542326

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017855657

Country of ref document: EP

Effective date: 20190429