WO2018066317A1 - 必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法 - Google Patents
必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法 Download PDFInfo
- Publication number
- WO2018066317A1 WO2018066317A1 PCT/JP2017/032699 JP2017032699W WO2018066317A1 WO 2018066317 A1 WO2018066317 A1 WO 2018066317A1 JP 2017032699 W JP2017032699 W JP 2017032699W WO 2018066317 A1 WO2018066317 A1 WO 2018066317A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- target
- primer
- candidate
- locus
- snps
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
Definitions
- the present invention relates to a method for determining a required number of loci and a method for determining a required number of SNPs loci.
- PCR method is widely used as a technique for efficiently and accurately performing gene analysis by amplifying only a necessary specific gene region and performing reading only in the base sequence.
- a method of selectively amplifying a plurality of gene regions by simultaneously supplying a plurality of types of primers to a certain PCR reaction system is called multiplex PCR.
- Fetal nucleated red blood cells that circulate in maternal blood are rare cells that contain only about 1 of 10 6 to 10 7 cells in maternal blood, and fetal nucleated red blood cells suspected of being fetal nucleated red blood cells. When a plurality of cells are collected, the probability that all of them are fetal nucleated red blood cells is extremely low.
- the locus of interest is generally enriched by multiplex PCR or hybridization. there were.
- WGA has a problem that quantification of the number of chromosomes becomes difficult due to a large amplification bias
- a plurality of loci are PCR amplified, base sequence information is obtained using a next-generation sequencer, chromosome number quantification, genotyping or the like is performed.
- the number of loci to be amplified increases, the influence of one locus on the overall performance is reduced, and it becomes easier to achieve target performance such as accuracy. Therefore, it is preferable that the number of loci to be amplified is large. On the other hand, as the number of loci to be amplified increases, it becomes more difficult to design primers for all the loci to be amplified, and primer / dimer By being easy to form, the possibility that PCR amplification will fail increases.
- the number of loci required to achieve the target performance is determined. There is a need for a way to make decisions.
- an object of the present invention is to provide a method for determining the number of loci necessary for quantifying the number of chromosomes from a single cell.
- the present invention also relates to SNPs necessary for determining whether a single cell suspected to be derived from a fetus isolated from a pregnant woman is derived from a fetus or a mother who is a pregnant woman using SNPs genotyping. It is an object to provide a method for determining the number of sitting positions.
- the present inventor inputs an experimental result and a target performance, and calculates the necessary locus number or necessary SNPs locus number by calculating these values. It was learned that a method for determining the required number of loci or a method for determining the required number of SNPs loci can be provided, and the present invention has been completed.
- the present invention includes the following [1] to [9].
- [1] A method for determining the number of locus required for quantifying the number of chromosomes from a single cell, The result of the experiment obtained by a plurality of repeated trials, the number n of locus on the target chromosome and the variation coefficient x of the number of sequence reads of the target chromosome are input via the input means, and the experimental result input stored in the storage means Process, A target performance input step in which the variation coefficient y of the number of sequence reads of the target chromosome, which is the target performance, is input via the input means and stored in the storage means; The calculation means reads the locus number n, the variation coefficient x, and the variation coefficient y from the storage means, and the variation coefficient x is less than or equal to y from the locus number n and the variation coefficient x that are the experimental results and the variation coefficient y that is the target performance.
- a method for determining a required number of loci including a result display step in which the calculation means reads out the number N of loci required for quantifying the number of chromosomes from the storage means and displays it on the display means.
- the variation coefficient x ′ of the number of sequence reads per locus on the target chromosome is input and stored in the storage means.
- SQRT (n) represents the square root of n.
- the target performance conversion step When the sensitivity Se T is read out, assuming a cell group with chromosomal aneuploidy according to a normal distribution, the ratio of cells determined to have chromosomal aneuploidy in this cell group is sensitivity. Substituting the target sensitivity Se T and setting the coefficient of variation at that time as the target coefficient of variation y, When the specificity Sp T is read, assuming a cell group having no chromosomal aneuploidy according to a normal distribution, the proportion of cells determined to have no chromosomal aneuploidy in this cell group is the specificity. By substituting the target specificity Sp T for this, the coefficient of variation at that time is set as the target coefficient of variation y.
- the positive predictive value PPV T When the positive predictive value PPV T is read, the positive predictive value is converted into sensitivity and specificity using the prevalence given in advance and Equation 1 below, and the sensitivity Se T is read out. Depending on the case and the case where the specificity Sp T is read, the sensitivity and specificity are converted into the target coefficient of variation y, or When the negative predictive value NPV T is read out, the negative predictive value is converted into specificity and sensitivity using the prevalence given in advance and Equation 2 below, and the sensitivity Se T is read out. According to the case and the case where the specificity Sp T is read out, the specificity and sensitivity are converted into a target coefficient of variation y. The method according to [3] above.
- the calculation means reads the number m of SNPs loci, the mutation frequency ⁇ , the allele dropout rate ⁇ %, and the target accuracy ⁇ % from the storage means,
- the allele dropout rate is ⁇ %
- the allele dropout rate is ⁇ %
- ⁇ 100 ⁇ ( ⁇ ) m is incremented by 1, a minimum integer m satisfying ⁇ ⁇ ⁇ is calculated, and stored in the storage means as the necessary SNPs locus number M.
- the required number of SNPs loci M is calculated by:
- ceiling ( ⁇ ) represents the smallest integer greater than or equal to ⁇ with respect to the real number ⁇
- ⁇ is a predetermined coefficient of 1.0 to 1.5.
- ⁇ log (1- ⁇ ) / log (1- ⁇ )
- the present invention it is possible to provide a method for determining the number of loci required for quantifying the number of chromosomes from a single cell. More specifically, it is necessary to achieve the target performance in the method of quantifying the number of chromosomes by PCR amplification of multiple loci using genomic DNA extracted from a single cell by PCR amplification of multiple loci. It is possible to provide a method for determining the number of local locus. Further, according to the present invention, it is necessary when determining whether a single cell suspected to be derived from a fetus isolated from a pregnant woman is derived from a fetus or a mother who is a pregnant woman using SNPs genotyping. A method for determining the number of SNPs at a particular position can be provided. Furthermore, since the number of primers used for multiplex PCR is reduced, the cost can be reduced and the primer design can be facilitated.
- FIG. 1 is a conceptual diagram showing the configuration of an apparatus for determining the necessary number of loci used in the method for determining the number of loci necessary for quantifying the number of chromosomes from a single cell in the present invention.
- FIG. 2 is a flowchart for explaining a method for determining the number of locus required for quantifying the number of chromosomes from a single cell in the present invention.
- FIG. 3 is a diagram illustrating sensitivity, specificity, positive predictive value, and negative predictive value.
- FIG. 4 is necessary for determining whether a single cell suspected to be derived from a fetus isolated from a pregnant woman in the present invention is derived from a fetus or a mother who is a pregnant woman using SNPs genotyping.
- FIG. 5 is a diagram illustrating that when the true genotype is hetero, the apparent genotype becomes hetero and homo due to the allele dropout.
- FIG. 6 is a diagram for explaining a first aspect of a primer designing method for PCR amplification of a locus to be amplified.
- FIG. 7 is a diagram for explaining a second aspect of a primer designing method for PCR amplification of a locus to be amplified.
- FIG. 8 is a diagram for explaining a third aspect of a primer designing method for PCR amplification of a locus region to be amplified.
- FIG. 5 is a diagram illustrating that when the true genotype is hetero, the apparent genotype becomes hetero and homo due to the allele dropout.
- FIG. 6 is a diagram for explaining a first aspect of a primer designing method for PCR amplification of a locus to be amplified.
- FIG. 7 is a diagram for explaining a second aspect of a primer designing method for PCR amplification of a loc
- FIG. 9 is a graph showing a probability distribution obtained by comparing the true genotype of the mother and the genotype of the fetal cell when the ADO rate is 0% in Example 2.
- FIG. 10 is a graph showing a probability distribution obtained by comparing the true genotype of the mother and the genotype of the mother cell when the ADO rate is 0% in Example 2.
- FIG. 11 is a graph showing a probability distribution obtained by comparing the true genotype of the mother and the genotype of the fetal cell in Example 2 when the ADO rate is 50%.
- FIG. 12 is a graph showing a probability distribution obtained by comparing the true genotype of the mother and the genotype of the mother cell in Example 2 when the ADO rate is 50%.
- Example 13 shows that in Example 2, when the ADO rate is 50%, the true genotype of the mother and the genotype of the mother cell or the genotype of the fetal cell are homozygous at X SNPs loci in 20 A graph representing the probability of heterogeneity and mismatch.
- the probability that 0 out of 20 SNPs loci are homo-hetero and inconsistent is 1, and the mother's true genotype and fetal cell genotype
- the probability that 0 out of 20 SNPs loci are homo-hetero and non-coincident is about 0.07. Therefore, the accuracy of mother-child discrimination is about 93%.
- Example 14 shows that in Example 2, when the ADO rate is 50%, the mother's true genotype and the mother cell's genotype or fetal cell genotype are homozygous at X SNPs in 35 loci.
- the range when “ ⁇ ” is used to express a range that can specify the range, the range includes the left and right numerical values of “ ⁇ ”, and the like.
- the range when “a to b” is expressed for the numerical value a and the numerical value b (where a ⁇ b), the range includes a and b.
- k (Here, k is an integer that satisfies k ⁇ 3.) "A i ⁇ a j" for permutations a 1, a 2 consisting of pieces of the original, ..., in a k (where i and j are integers satisfying 1 ⁇ i ⁇ k, 1 ⁇ j ⁇ k, and i ⁇ j.)
- the range includes a i and a j .
- PCR Polymerase Chain Reaction (polymerase chain reaction)
- DNA Deoxyribonucleic acid (deoxyribonucleic acid)
- SNPs Single Nucleotide Polymorphisms (Single nucleotide polymorphism)
- CV coefficient of variation
- the “method for determining the required number of loci” of the present invention is a method for determining the number of loci necessary for quantifying the number of chromosomes from a single cell, comprising the following steps. This will be described with reference to FIGS. 1 and 2 as appropriate.
- ⁇ Experimental result input step S11> The number of locuses n on the target chromosome and the variation coefficient x of the number of sequence reads of the target chromosome, which are experimental results obtained by a plurality of repeated trials, are input via the input means (keyboard) 14 and stored in the storage means (memory). 12 (S11 in FIG. 2). In this step, the input auxiliary means 15 can be used as an input means for hardware.
- the target chromosome is a chromosome to be quantified.
- the target chromosome may be either an autosome or a sex chromosome, and examples include chromosome 21, chromosome 18, chromosome 13, X chromosome, and Y chromosome.
- Quantification of chromosome 21 is performed, for example, to detect trisomy of chromosome 21.
- the disease caused by trisomy of chromosome 21 includes Down's syndrome.
- Quantification of chromosome 18 is performed, for example, to detect trisomy of chromosome 18.
- a disease caused by trisomy of chromosome 18 includes Edwards syndrome.
- Quantification of chromosome 13 is performed, for example, to detect trisomy of chromosome 13. Examples of diseases caused by trisomy of chromosome 13 include Patou syndrome. Quantification of the X chromosome is performed, for example, to detect an excess of the X chromosome. Examples of diseases caused by excess of the X chromosome include Kleinfelter syndrome. Quantification of the Y chromosome is performed, for example, to detect an excess of the Y chromosome. Examples of diseases caused by excess of the Y chromosome include XYY syndrome.
- a locus is a gene locus or locus, and is not limited to a gene region, but includes a nucleotide sequence or a position of a genetic marker that does not correspond to a gene. Further, the number of loci, that is, the number of loci is not particularly limited, but is appropriately set in consideration of trials performed to provide an experimental result for determining the necessary number of loci.
- the number of sequence reads is the number of sequence reads per target chromosome obtained by amplifying the locus on the target chromosome by multiplex PCR and sequencing the amplified product with a next-generation sequencer. That is, it is the total number of sequence reads per locus obtained by sequencing a PCR product obtained by amplifying the locus on the target chromosome by multiplex PCR. As will be described later, instead of the total number of sequence reads per locus, the average number of sequence reads per locus may be used as the number of array reads.
- the number of iterations is not particularly limited, but is set in consideration of what is performed to obtain an experimental result for determining the required number of loci.
- the number of repetitions is preferably 3 or more and 100 or less, more preferably 5 or more and 50 or less, and still more preferably 10 or more and 30 or less.
- a trial per time for example, peripheral blood of a pregnant woman is collected, nucleated red blood cells are isolated from the collected peripheral blood, genomic DNA is extracted from the isolated nucleated red blood cells, and the extracted genomic DNA is extracted. Multiplex PCR is performed as the template DNA, and the number of sequence reads is obtained from the obtained PCR amplification product using a next-generation sequencer.
- the method for determining the required number of locus of the present invention may further include an experiment result conversion step.
- the calculation means reads out the number n of loci on the target chromosome and the variation coefficient x ′ of the number of sequence reads per locus on the target chromosome from the storage means, This is a step of calculating the variation coefficient x of the number of leads and storing it in the storage means (S13 in FIG. 2).
- x x ′ / SQRT (n)
- SQRT (n) represents the square root of n.
- the variation coefficient x ′ of the number of sequence reads per locus on the target chromosome is input and stored in the storage means (memory) 12. In this case, it is preferable to perform the experiment result conversion step after the experiment result input step and before the required locus number determination step.
- ⁇ Target performance input process S12> This is a step in which the variation coefficient y of the number of sequence reads of the target chromosome, which is the target performance, is input via the input means and stored in the storage means (S12 in FIG. 2).
- sensitivity Se T , specificity Sp T , positive predictive value PPV T , or negative predictive value NPV T may be input.
- the target performance conversion step of converting the sensitivity Se T , specificity Sp T , positive predictive value PPV T , or negative predictive value NPV T into the target coefficient of variation y is performed after the target performance input step, And it is performed before the required number of locus determination step. It is also possible to use auxiliary input means (mouse) 15 as input auxiliary means.
- the method for determining the required number of locus of the present invention may further include a target performance conversion step.
- the calculation means reads out the sensitivity Se T , specificity Sp T , positive predictive value PPV T , or negative predictive value NPV T from the storage means, and changes the number of target chromosome sequence reads. This is a step of converting into a coefficient y and storing it in the storage means (S14 in FIG. 2).
- the target performance conversion it is preferable to perform the process after the target performance input process and before the required locus number determining process.
- a specific method for converting the target performance will be described.
- sensitivity Se T Assuming a cell group having a chromosomal aneuploidy according to a normal distribution, the proportion of cells determined to have chromosomal aneuploidy in this cell group is sensitivity. The target sensitivity Se T is substituted for this, and the fluctuation coefficient at that time is set as the target fluctuation coefficient y.
- specificity Sp T Assuming a cell group having a chromosomal aneuploidy according to a normal distribution, the percentage of cells determined to have no chromosomal aneuploidy in this cell group is the specificity.
- the target specificity Sp T is substituted for this, and the coefficient of variation at that time is set as the target coefficient of variation y.
- the positive predictive value PPV T is read out Using the prevalence given in advance and the following formula 1, the positive predictive value is converted into sensitivity and specificity, and the sensitivity Se T is read out. And the sensitivity Sp T is converted into the target coefficient of variation y according to the case where the specificity Sp T is read.
- Positive predictive value sensitivity ⁇ prevalence / (sensitivity ⁇ prevalence + (1 ⁇ prevalence) (1 ⁇ specificity))
- negative predictive value NPV T is read out Using the prevalence given in advance and the following formula 2, the negative predictive value is converted into specificity and sensitivity, and the sensitivity Se T is read out.
- Negative predictive value specificity ⁇ (1 ⁇ prevalence) / (specificity ⁇ (1 ⁇ prevalence) + prevalence ⁇ (1 ⁇ sensitivity))
- normal cell group D1 having no chromosomal aneuploidy
- abnormal cell group D2 a cell group D2 having chromosomal aneuploidy
- N ( ⁇ 1 , ⁇ 1 2 ) is given as a probability distribution having the following probability density function f 1 (x).
- f 1 (x) 1 / sqrt (2 ⁇ 1 2 ) ⁇ epx ( ⁇ (x ⁇ 1 ) 2 / 2 ⁇ 1 2 ) N ( ⁇ 2 , ⁇ 2 2 ) is given as a probability distribution having the following probability density function f 2 (x).
- f 2 (x) 1 / sqrt (2 ⁇ 2 2 ) ⁇ epx ( ⁇ (x ⁇ 2 ) 2 / 2 ⁇ 2 2 )
- sqrt (z) represents the square root of z
- exp (z) denotes the e z.
- e is the base of the natural logarithm (Napier number).
- Sensitivity is the proportion of cells in which the test value X exceeds the threshold value c in the abnormal cell group D2, and is represented by the following formula.
- ⁇ 2 / ⁇ 2 obtained by substituting the target sensitivity Se T into the equation of sens (c) is the target variation coefficient y obtained by converting the target specificity Sp T.
- the specificity is the ratio of the cells whose test value X is the threshold value c or less in the normal cell group D1, and is represented by the following formula.
- Positive predictive value sensitivity x prevalence / (sensitivity x prevalence + (1-prevalence) (1-specificity)
- Negative predictive value specificity ⁇ (1 ⁇ prevalence) / (specificity ⁇ (1 ⁇ prevalence) + prevalence ⁇ (1 ⁇ sensitivity))
- Sensitivity is the proportion of cells in the abnormal cell group D2 at which the test value X is less than the threshold value c, and is represented by the following formula.
- ⁇ 2 / ⁇ 2 obtained by substituting the target sensitivity Se T into the equation of sens (c) is the target variation coefficient y obtained by converting the target specificity Sp T.
- the specificity is the ratio of the cells whose test value X is the threshold value c or less in the normal cell group D1, and is represented by the following formula.
- Positive predictive value sensitivity x prevalence / (sensitivity x prevalence + (1-prevalence) (1-specificity)
- Negative predictive value specificity ⁇ (1 ⁇ prevalence) / (specificity ⁇ (1 ⁇ prevalence) + prevalence ⁇ (1 ⁇ sensitivity))
- the computing means (CPU) 11 reads the locus number n, the variation coefficient x, and the variation coefficient y from the storage means (memory) 12, and the experiment result shows the locus number n, the variation coefficient y, and the target performance, the variation coefficient y. From this, it is a step of calculating the number of locus N necessary for the coefficient of variation to be y or less and storing it in the storage means (memory) 12 (S15 in FIG. 2).
- ceiling (z) represents the smallest integer greater than or equal to z with respect to the real number z
- k is a predetermined coefficient not less than 1.0 and not more than 1.5.
- the calculation means (CPU) 11 is a step of reading the locus number N necessary for chromosome number quantification from the storage means (memory) 12 and displaying it on the display means (monitor) 16 (S16 in FIG. 2). Further, it may be output from the output means (printer) 17 in response to a command from the input means (keyboard) 14 or the auxiliary input means (mouse) 15.
- the apparatus for executing the method for determining the required number of locus of the present invention includes a calculation means (CPU) 11, a storage means (memory) 12, an auxiliary storage means (storage) 13, an input means (keyboard) 14, and a display means ( Monitor) 16. Further, auxiliary input means (mouse) 15 and output means (printer) 17 may be provided. Each means will be described.
- the input means (keyboard) 14 is a means for inputting instructions, data, and the like to the apparatus, and is used for inputting experimental results and target performance.
- the auxiliary input means (mouse) 15 is used in place of or together with the input means (keyboard) 14.
- the calculation means (CPU) 11 is a means for performing calculation processing, and is used for calculating the necessary number of loci N in addition to processing such as control of each means, data writing, and reading.
- the storage means (memory) 12 is used for storing the result of the arithmetic processing of the arithmetic means (CPU) 11 and storing the input from the input means (keyboard) 14.
- the auxiliary storage means (storage) 13 is a storage for storing an operating system, a program for determining the required number of locuses, and the like. Part of it can also be used to expand the storage means.
- the display means (display) 16 is one of the interfaces with the user. It is used to display after calculating the required number of locus.
- the output means (printer) 17 is used to print information displayed on the display means (display) 16 in accordance with an instruction from the calculation means (CPU) 11.
- the “method for determining the number of necessary SNPs loci” of the present invention comprises the following steps, wherein a single cell suspected to be derived from a fetus isolated from a pregnant woman is derived from a fetus or from a mother who is a pregnant woman This is a method of determining the number of SNPs loci necessary for determining whether or not using SNPs genotyping.
- ⁇ Experimental result input step S21> The average mutation frequency ⁇ and the allele dropout rate ⁇ % of m SNPs obtained by a previous experiment for analyzing m SNPs loci, where m is an integer of 2 or more, are input via the input means (keyboard) 14. This is a step of being inputted and stored in the storage means (memory) 12 (S21 in FIG. 4). In this step, it is also possible to use input assist means (mouse) 15 as input means for hardware.
- the m is not particularly limited as long as it is an integer of 2 or more, but the number is set in consideration of the fact that it is performed as a prior experiment.
- the number of SNPs loci is preferably 10 or more, more preferably 15 or more, and still more preferably 20 or more.
- Mutation frequency ⁇ is 0 ⁇ ⁇ ⁇ 1.
- Mutation frequency ⁇ is 0 ⁇ ⁇ ⁇ 1.
- the allele dropout rate (hereinafter sometimes referred to as “ADO (allelic dropout rate)”) ⁇ % is usually 0% ⁇ ⁇ % ⁇ 100%. The lower the ADO rate, the better.
- ⁇ Target performance input step S22> This is a step in which the target accuracy ⁇ % is input via the input means (keyboard) 14 and stored in the storage means (memory) 12 (S22 in FIG. 4).
- the target accuracy ⁇ % is not particularly limited, but is preferably 95.0% or more, more preferably 99.0% or more, and further preferably 99.9% or more.
- ceiling ( ⁇ ) represents the smallest integer greater than or equal to ⁇ with respect to the real number ⁇
- ⁇ is a predetermined coefficient of 1.0 to 1.5.
- the calculation means (CPU) 11 determines whether a single cell suspected of being derived from a fetus isolated from a pregnant woman is derived from a fetus or a mother who is a pregnant woman. This is a step of reading out the number of SNPs loci necessary for the determination using and displaying it on the display means (monitor) (S26 in FIG. 4). Further, it may be output from the output means (printer) 17 in response to a command from the input means (keyboard) 14 or the auxiliary input means (mouse) 15.
- the random variable X follows a binomial distribution B ( ⁇ , p 14 ) of parameters ⁇ , p 14 .
- the random variable X follows a binomial distribution B ( ⁇ , p 24 ) of parameters ⁇ , p 24 .
- the allele dropout does not make the apparent genotype of the mother cell heterozygous, so the mother's true genotype and the mother cell's genotype are homo-hetero.
- An apparatus for executing the method for determining the necessary number of SNPs according to the present invention includes a calculation means (CPU) 11, a storage means (memory) 12, an auxiliary storage means (storage) 13, an input means (keyboard) 14, and a display means ( Monitor) 16. Further, auxiliary input means (mouse) 15 and output means (printer) 17 may be provided. Each means will be described.
- the input means (keyboard) 14 is a means for inputting instructions, data, and the like to the apparatus, and is used for inputting experimental results and target performance.
- the auxiliary input means (mouse) 15 is used in place of or together with the input means (keyboard) 14.
- the arithmetic means (CPU) 11 is a means for performing arithmetic processing, and is used for calculating necessary SNPs positions in addition to processing such as control of each means, data writing, and reading.
- the storage means (memory) 12 is used for storing the result of the arithmetic processing of the arithmetic means (CPU) 11 and storing the input from the input means (keyboard) 14.
- the auxiliary storage means (storage) 13 is a storage for storing an operating system, a program for determining a necessary number of SNPs loci, and the like. Part of it can also be used to expand the storage means.
- the display means (display) 16 is one of the interfaces with the user. It is used to display after calculating the necessary number of SNPs.
- the output means (printer) 17 is used to print information displayed on the display means (display) 16 in accordance with an instruction from the calculation means (CPU) 11.
- primers for multiplex PCR may be designed by the method described below. Hereinafter, the region is read as locus or SNPs locus.
- a first aspect of a method for designing a primer for PCR amplification of a target region includes the following steps.
- FIG. 6 will be referred to as appropriate.
- a target area selection step of selecting a target area from the target area (S101 in FIG. 6).
- Candidate base sequence creation step (S102 in FIG. 6).
- a local alignment step (S103 in FIG. 6), in which a local alignment score is obtained by performing pairwise local alignment under the condition that the partial sequence to be included includes the 3 ′ end of the two base sequences.
- a first-stage selection step (S104 in FIG. 6) that performs the first-stage selection of the base sequences of candidate primers for PCR amplification of the target region based on the local alignment score.
- E Preliminarily including the 3 ′ ends of the two base sequences included in the combination for all the combinations for selecting the base sequences of the two candidate primers from the base sequences of the candidate primers selected in the first stage selection step.
- a global alignment step of obtaining a global alignment score by performing global alignment in a pair-wise manner with respect to the base sequence having the set sequence length (S105 in FIG. 6).
- a second-stage selection step (S106 in FIG.
- both the steps (c) and (d) and the steps (e) and (f) are optional. May be in the same order or simultaneously. That is, after performing the step (c) and the step (d), the step (e) and the step (f) may be performed, or the step (e) and the step (f) are performed. Thereafter, the step (c) and the step (d) may be performed. The step (c) and the step (d) may be performed in parallel with the step (e) and the step (f). You may go.
- step (e) and the step (c) are respectively The step e ′) and the following step (c ′) are preferable.
- (E ′) The 3 ′ ends of the two base sequences included in the above combinations are selected for all combinations that select the base sequences of the two candidate primers from the base sequences of the candidate primers created in the primer candidate base sequence creating step.
- the said (e) process is the following (e ') process. It is preferable that
- (E ′) The 3 ′ ends of the two base sequences included in the above combinations are selected for all combinations that select the base sequences of the two candidate primers from the base sequences of the candidate primers created in the primer candidate base sequence creating step.
- the candidate primer base sequence creation step Primers are designed (S108, S109, and S110 in FIG. 6) from (S102 in FIG. 6) or (a) the target region selection step (S101 in FIG. 6).
- the second aspect of the primer designing method for PCR amplification of the target region includes the following steps.
- FIG. 7 will be referred to as appropriate.
- a 1 A first target area selection step for selecting a first target area from the target area (S201 in FIG. 7).
- B 1 Base sequences of candidate primers for PCR amplification of the first target region are determined based on the base sequences of the neighboring regions at both ends of the first target region on the genomic DNA, respectively, First step of creating candidate primer base sequences, which are created one by one (S202 in FIG. 7).
- C 1 For all of the combinations for selecting two candidate primer sequences from the candidate primer sequences prepared in the first step of preparing the candidate primer sequences, the two candidate sequences included in the combination are selected.
- the first step of local alignment S203 in FIG.
- a first step selection first step (of FIG. 7) is carried out, based on the local alignment score, to select the first step of the base sequence of candidate primers for PCR amplification of the first target region. S204).
- E 1 3 ′ end of two base sequences included in the above combinations for selecting all the base sequences of two candidate primers from the base sequences of candidate primers selected in the first step selection first step
- a first step of global alignment (S205 in FIG. 7) in which a global alignment score is obtained by performing global alignment in a pairwise manner on a base sequence having a predetermined sequence length including.
- a second step selection first step (of FIG. 7), which selects a second step of a base sequence of candidate primers for PCR amplification of the first target region based on the global alignment score. S206).
- G 1 The base sequence of the primer candidate selected in both the first step selection first step and the second step selection first step is the base sequence of the primer for PCR amplification of the first target region.
- First step of primer adoption (S207 in FIG. 7) adopted as a sequence.
- both the steps (c 1 ) and (d 1 ) both the steps (c 1 ) and (d 1 )
- the steps (e 1 ) and (f 1 ) Both steps may be in any order or simultaneously. That is, after performing the step (c 1 ) and the step (d 1 ), the step (e 1 ) and the step (f 1 ) may be performed, or the step (e 1 ) and the step (f 1 ) After performing step (c 1 ) and step (d 1 ), step (c 1 ), step (d 1 ), step (e 1 ) and step (c 1 ) The step (f 1 ) may be performed in parallel.
- the (e 1) step and the (f 1) after step, when performing said (c 1) step and the (d 1) step, the (e 1) step and the (c 1) Step are preferably the following (e 1 ′) step and the following (c 1 ′) step, respectively.
- All the combinations for selecting the base sequences of the two candidate primers from the base sequences of the candidate primers selected in the second step selection first step are compared with the two base sequences included in the combination.
- the first step of local alignment in which a local alignment score is obtained by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
- the a (c 1) step and the (d 1) step and the (e 1) step and the (f 1) step if performed in parallel, the above (e 1) step, following Preferably, the step (e 1 ′) is used.
- a second target area selection step (S211 in FIG. 7) for selecting a second target area different from the first target area from the target area.
- B 2 base sequences of candidate primers for PCR amplification of the second target region based on the base sequences of the neighboring regions at both ends of the second target region on the genomic DNA, respectively, Second step of creating a candidate primer base sequence, which is created one by one (S212 in FIG. 7).
- the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination.
- the second step of local alignment (S213 in FIG. 7) is to perform local alignment pairwise and obtain the local alignment score.
- D 2 A first stage selection second step (of FIG. 7) that performs the first stage selection of candidate nucleotide sequences for PCR amplification of the second target region based on the local alignment score. S214).
- both the steps (c 2 ) and (d 2 ) both the steps (c 2 ) and (d 2 )
- the steps (e 2 ) and (f 2 ) Both steps may be in any order or simultaneously. That is, after performing the step (c 2 ) and the step (d 2 ), the step (e 2 ) and the step (f 2 ) may be performed, or the step (e 2 ) and the step (f) 2 ) After performing the step, the step (c 2 ) and the step (d 2 ) may be performed, the step (c 2 ) and the step (d 2 ), the step (e 2 ) and the step and the (f 2) step may be performed in parallel.
- the (e 2 ) step and the (c 2 ) step are performed after the (e 2 ) step and the (f 2 ) step are performed.
- the (e 2 ) step and the (c 2 ) step are performed.
- (E 2 ′) A combination of selecting a primer candidate base sequence prepared from the primer candidate base sequence prepared in the second step of creating a primer candidate base sequence and a base sequence of two primer candidates from the already adopted primer base sequence and one primer candidate For all of the combinations for selecting the base sequence and the base sequence of one already adopted primer, pair-wise with respect to the base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination.
- the second step of global alignment in which global alignment is performed to obtain a global alignment score.
- the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination.
- the second step of local alignment in which a local alignment score is obtained by performing pairwise local alignment under the above condition.
- step and (c 2) step and the (d 2) step and the (e 2) step and the (f 2) process, if carried out concurrently, the above (e 2) step, the following The step (e 2 ′) is preferable.
- (E 2 ′) A combination of selecting a primer candidate base sequence prepared from the primer candidate base sequence prepared in the second step of creating a primer candidate base sequence and a base sequence of two primer candidates from the already adopted primer base sequence and one primer candidate For all of the combinations for selecting the base sequence and the base sequence of one already adopted primer, pair-wise with respect to the base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination.
- the second step of global alignment in which global alignment is performed to obtain a global alignment score.
- the target region selection second step (S 211 in FIG. 7) to (g 2 ) the primer adoption second step (S 217 in FIG. 7) are repeated (S 208 in FIG. 7). That is, when designing a primer for a third or subsequent target region that is not yet selected from the three or more target regions, and includes three or more target regions, the third and subsequent target regions are included. For the region, the respective steps from the step (a 2 ) to the step (g 2 ) are repeated.
- a third aspect of the method for designing a primer for PCR amplification of a target region includes the following steps. In the following description, FIG. 8 will be referred to as appropriate.
- a target area multiple selection step for selecting a plurality of target areas from the target area (S301 in FIG. 8).
- B-0 base sequences of candidate primers for PCR amplification of each of the plurality of target regions based on the base sequences of the neighboring regions at both ends of each of the plurality of target regions on genomic DNA,
- a plurality of primer candidate base sequence creation steps for creating at least one each (S302 in FIG. 8).
- One of a plurality of target regions selected in the target region multiple selection step is a first target region, and among the candidate primer base sequences created in the primer candidate base sequence multiple creation step, Parts to be compared with respect to the two base sequences included in the above combinations for selecting the base sequences of two candidate primers from the base sequences of candidate primers for PCR amplification of the first target region
- a first local alignment step of obtaining a local alignment score by performing pairwise local alignment under the condition that the sequence includes the 3 ′ ends of the two base sequences (S303 in FIG. 8).
- D-1) a first first-stage selection step ( Figure 1) for selecting a first-stage base sequence of candidate primers for PCR amplification of the first target region based on the local alignment score 8 S304).
- (E-1) For all combinations for selecting the base sequences of two candidate primers from the base sequences of candidate primers selected in the first first stage selection step, 3 of the two base sequences included in the combination 'A first global alignment step (S305 in FIG. 8), in which a global alignment score is obtained by performing pairwise global alignment on a base sequence having a predetermined sequence length including the terminal.
- (F-1) A first second-stage selection step ( Figure 1) for selecting the second stage of the nucleotide sequence of candidate primers for PCR amplification of the first target region based on the global alignment score 8 S306).
- both the steps (c-1) and (d-1) the steps (e-1) and ( Both steps of step f-1) may be in any order or simultaneously. That is, after performing the step (c-1) and the step (d-1), the step (e-1) and the step (f-1) may be performed, or the step (e-1) The step (c-1) and the step (d-1) may be performed after the step and the step (f-1) are performed. Alternatively, the step (c-1) and the step (d-1) may be performed. The step, the step (e-1) and the step (f-1) may be performed in parallel.
- the steps (e-1) and the step (d-1) are performed after the step (e-1) and the step (f-1) are performed
- the steps (e-1) and The step (c-1) is preferably the following step (e′-1) and the following step (c′-1).
- One of a plurality of target regions selected in the target region multiple selection step is a first target region, and among the candidate primer base sequences generated in the primer candidate base sequence multiple generation step All of the combinations for selecting the base sequences of two candidate primers from the base sequences of candidate primers for PCR amplification of the first target region are preliminarily including the 3 ′ ends of the two base sequences included in the combination.
- a first global alignment step in which a global alignment score is obtained by performing pairwise global alignment on a base sequence having a set sequence length.
- a first local alignment step of obtaining a local alignment score by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
- the steps (e-1 Step) is preferably the following step (e′-1).
- One of a plurality of target regions selected in the target region multiple selection step is a first target region, and among the candidate primer base sequences generated in the primer candidate base sequence multiple generation step All of the combinations for selecting the base sequences of two candidate primers from the base sequences of candidate primers for PCR amplification of the first target region are preliminarily including the 3 ′ ends of the two base sequences included in the combination.
- a first global alignment step in which a global alignment score is obtained by performing pairwise global alignment on a base sequence having a set sequence length.
- One of the plurality of target regions selected in the target region multiple selection step, excluding the first target region, is set as the second target region, and is generated in the primer candidate base sequence multiple generation step.
- the candidate primer sequences a combination of a candidate primer sequence for PCR amplification of the second target region and a combination of one candidate primer sequence selected from the already adopted primer sequence and one
- the partial sequence to be compared is 3 of the two base sequences compared to the two base sequences included in the combination. 'Perform local alignment pairwise under the condition that the end is included, and Second local alignment step for obtaining the core (S313 in FIG. 8).
- (D-2) a second first-stage selection step for selecting the first stage of the nucleotide sequence of candidate primers for PCR amplification of the second target region based on the local alignment score (FIG. 8 S314).
- (E-2) a combination of selecting a candidate primer base sequence from the primer candidate base sequence selected in the second first-stage selection step and the already adopted primer base sequence and one primer candidate For all of the combinations for selecting the base sequence and the base sequence of one already adopted primer, pair-wise with respect to the base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination
- a second global alignment step (S315 in FIG. 8) in which global alignment is performed to obtain a global alignment score.
- (F-2) a second second-stage selection step ( Figure 2), wherein the second-stage selection of the nucleotide sequence of the candidate primer for PCR amplification of the second target region is performed based on the global alignment score. 8 S316).
- (G-2) PCR amplification of the second target region using the nucleotide sequences of candidate primers selected in both the second first stage selection step and the second second stage selection step Second primer adoption step (S317 in FIG. 8) that is adopted as the base sequence of the primer.
- both the steps (c-2) and (d-2) both the steps (c-2) and (d-2), the steps (e-2) and ( Both steps of step f-2) may be in any order or simultaneously. That is, after performing the step (c-2) and the step (d-2), the step (e-2) and the step (f-2) may be performed, or the step (e-2) The step (c-2) and the step (d-2) may be performed after the step and the step (f-2) are performed. Alternatively, the step (c-2) and the step (d-2) may be performed. The step, the step (e-2) and the step (f-2) may be performed in parallel.
- the steps (e-2) and the step (d-2) are performed after the step (e-2) and the step (f-2) are performed
- the steps (e-2) and The step (c-2) is preferably the following step (e′-2) and the following step (c′-2).
- One of the plurality of target regions selected in the target region multiple selection step, excluding the first target region, is set as the second target region, and is generated in the primer candidate base sequence multiple generation step.
- the selected primer candidate base sequences a combination of selecting a primer candidate base sequence for PCR amplification of the second target region and two primer candidate base sequences from the already adopted primer base sequences and 1
- C′-2 Combination of selecting candidate primer base sequences from the candidate primer base sequences selected in the second second stage selection step and the already adopted primer base sequences and one candidate primer And all the combinations for selecting one of the primer sequences already adopted, the two partial sequences included in the combination are compared with the 3 'end of the two base sequences.
- a second local alignment step in which a local alignment score is obtained by performing pair-wise local alignment under the condition that
- the steps (e-2) Step) is preferably the following step (e′-2).
- One of the plurality of target regions selected in the target region multiple selection step, excluding the first target region, is set as the second target region, and is generated in the primer candidate base sequence multiple generation step.
- the selected primer candidate base sequences a combination of selecting a primer candidate base sequence for PCR amplification of the second target region and two primer candidate base sequences from the already adopted primer base sequences and 1
- the at least one target region includes three or more target regions, three or more target regions are selected in the target region multiple selection step, and the three or more target candidate base sequence multiple generation steps are selected.
- the second local alignment step is performed for the third and subsequent target regions. To the second primer adoption step is repeated.
- target region selection step S101 (FIG. 6), the target region selection first step S201, the target region selection second step S211 (FIG. 7), and the target region multiple selection step S301 (FIG. 8) are collectively referred to. In some cases, this is simply referred to as “target region selection step”.
- the target region selection step is a step of selecting a target region from the target region.
- the selection method is not particularly limited. For example, when a primer design priority is assigned to a target region, a target region for designing a primer is selected from the target region according to the order indicated by the priority.
- target area selection first is a step of selecting the first target region from the target region
- target region selection second is still selected as the target region. This is a step of selecting the second target region from the target region that has not been performed.
- the selection method is not particularly limited. For example, when a primer design priority is assigned to a target region, a target region for designing a primer is selected from the target region according to the order indicated by the priority.
- the (a-0) target region multiple selection step is a step of selecting a plurality of target regions from the target region.
- the selection method is not particularly limited. For example, when the priority order of primer design is given to the target region, a plurality of target regions for designing the primer are selected from the target region according to the order indicated by the priority order.
- primer candidate base sequence creation step S102 (FIG. 6), primer candidate base sequence creation first step S202, primer candidate base sequence creation second step S212 (FIG. 7), and primer candidate base sequence multiple creation step S302. (FIG. 8) may be collectively referred to simply as “primer candidate base sequence creation step”.
- Primer candidate base sequence creation step S102 (First Aspect: Primer candidate base sequence creation step S102) In FIG. 6, it is shown as “primer candidate base sequence creation” (S102).
- the candidate primer base sequence creating step converts the base sequence of the candidate primer for PCR amplification of the target region into the base sequence of each of the neighboring regions at both ends of the target region on the genomic DNA. This is a step of creating at least one each.
- Primer candidate base sequence creation first step S202 and primer candidate base sequence creation second step S212 In FIG. 7, “primer candidate base sequence creation first” (S202) and “primer candidate base sequence creation second” (S212) are shown.
- (b 1 ) Primer candidate base sequence creation step 1 comprises the step of preparing a candidate primer base sequence for PCR amplification of the first target region at both ends of the first target region on the genomic DNA.
- the second step of creating a primer candidate base sequence is a primer for PCR amplification of the second target region
- at least one candidate base sequence is created based on the base sequences of the neighboring regions at both ends of the second target region on the genomic DNA.
- the generation of a primer candidate base sequence, selection of a primer candidate, and adoption of a primer are performed for one target region, and the same process is repeated for the next one target region.
- the step of preparing a plurality of candidate primer sequences includes a candidate primer sequence for PCR amplification of each of the plurality of target regions, and each of the plurality of target regions on the genomic DNA. At least one each is created based on the base sequences of the neighboring regions at both ends.
- base sequences of candidate primers are created for all of the plurality of target regions, and selection and adoption are repeated in the subsequent steps.
- the adjacent areas at both ends of the target area collectively refer to areas outside the 5 ′ end of the target area and areas outside the 3 ′ end of the target area.
- the inside of the target area is not included in the neighboring area.
- the length of the neighboring region is not particularly limited, but is preferably not more than a length that can be extended by PCR, and more preferably not more than the upper limit of the length of the DNA fragment desired to be amplified. In particular, it is preferable that the length is easy for concentration selection and / or sequence reading. You may change suitably according to the kind etc. of the enzyme (DNA polymerase) used in PCR.
- the specific length of the neighboring region is preferably about 20 to 500 bases, more preferably about 20 to 300 bases, still more preferably about 20 to 200 bases, and still more preferably about 50 to 200 bases.
- Primer design parameters When preparing the nucleotide sequence of candidate primers, the length of the primer, the GC content (refers to the total molar percentage of guanine (G) and cytosine (C) in all nucleobases), melting temperature (two This is the temperature at which 50% of the stranded DNA is dissociated to become single-stranded DNA, and is derived from the melting temperature, sometimes referred to as “Tm value.” The unit is “° C.”), and sequence bias The points to be noted in general primer designing methods are the same.
- the primer length (number of nucleotides) is not particularly limited, but is preferably 15 mer to 45 mer, more preferably 20 mer to 45 mer, and still more preferably 20 mer to 30 mer. When the length of the primer is within this range, it is easy to design a primer excellent in specificity and amplification efficiency.
- the GC content of the primer is not particularly limited, but is preferably 40 mol% to 60 mol%, more preferably 45 mol% to 55 mol%. When the GC content is within this range, problems of specificity and a decrease in amplification efficiency due to higher order structures are unlikely to occur.
- the Tm value of the primer is not particularly limited, but is preferably in the range of 50 ° C to 65 ° C, more preferably in the range of 55 ° C to 65 ° C.
- the difference in the Tm values of the primers is preferably 5 ° C. or less, more preferably 3 ° C. or less in the primer pair and primer set.
- the Tm value is calculated using OLIGO Primer Analysis Software (Molecular Biology Insights) or Primer3 (http://www-genome.wi.mit.edu/ftp/distribut/software/etc.). be able to.
- Tm value (° C.) 2 (nA + nT) +4 (nC + nG)
- the method for calculating the Tm value is not limited to these, and the Tm value can be calculated by various conventionally known methods.
- the base sequence of the candidate primer is a sequence with no base bias overall. For example, it may be desirable to avoid partially GC rich sequences and partially AT rich sequences. It is also desirable to avoid T and / or C continuity (polypyrimidine) and A and / or G continuation (polypurine).
- 3' terminal base sequence avoids a GC rich sequence or an AT rich sequence.
- the 3 ′ terminal base is preferably G or C, but is not limited thereto.
- a specificity check step for evaluating the specificity of the primer candidate base sequence may be performed ( Not shown).
- the specificity check is performed by performing local alignment between the base sequence of the chromosomal DNA and the base sequence of the primer candidate. If the local alignment score is less than a preset value, the base sequence of the primer candidate corresponds to the genomic DNA. It can be evaluated that the complementarity is low and the specificity is high.
- it is desirable that the local alignment is also performed on a complementary strand of chromosomal DNA. This is because the primer is single-stranded DNA, whereas chromosomal DNA is double-stranded.
- a complementary base sequence may be used instead of the primer candidate base sequence.
- a homology search may be performed on the genomic DNA base sequence database using the candidate primer base sequences as query sequences.
- a homology search tool for example, BLAST (Basic Local Alignment Search Tool: Blast) (Altschul, S. A., four others, “Basic Local Alignment Search Tool”, Journal of Molecular Biology, 1990, October, 215, pp. 403-410) and FASTA (Pearson, W. R., 1 other, “Improved tools for biological sequence comparison”, Bulletin of the National Academy of Sciences, National Academy of Sciences, 1988, 4 Month, Vol. 85, p.2444-2448).
- BLAST Basic Local Alignment Search Tool: Blast
- FASTA Pearson, W. R., 1 other, “Improved tools for biological sequence comparison”, Bulletin of the National Academy of Sciences, National Academy of Sciences, 1988, 4 Month, Vol. 85, p.2444-2448.
- the threshold values of the score and the local alignment score are not particularly limited, and can be appropriately set depending on the length of the base sequence of the candidate primer and / or the PCR conditions.
- nucleotide sequence of the candidate primer is complementary to the nucleotide sequence at an unexpected position on the chromosomal DNA and the specificity is low, when PCR is performed using the primer of the nucleotide sequence, Exclude artifacts because they may amplify artifacts.
- the local alignment step S103 (FIG. 6), the first local alignment step S203 and the second local alignment step S213 (FIG. 7), and the first local alignment step S303 and the second local alignment step S313 (FIG. 6). 8) may be collectively referred to simply as “local alignment process”.
- the local alignment step is included in the combination for all combinations of selecting the primer candidate base sequences from the primer candidate base sequences created in the primer candidate base sequence creating step. This is a step of obtaining a local alignment score by performing pairwise local alignment under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
- the first step of local alignment is for all combinations of selecting the candidate primer base sequences from the candidate primer base sequences created in the first candidate primer base sequence creation step.
- the local alignment score is obtained by performing pairwise local alignment on the two base sequences included in the combination under the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences.
- the second step of local alignment is the base sequence of two candidate primers from the base sequence of the candidate primer created in the second step of creating the candidate primer base sequence and the base sequence of the primer already adopted A combination and a single candidate primer base
- the partial sequence to be compared includes the 3 ′ end of the two base sequences with respect to the two base sequences included in the combination. This is a step of obtaining a local alignment score by performing a pairwise local alignment under the above condition.
- the first local alignment step is for PCR amplification of the first target region of the primer candidate base sequences prepared in the primer candidate base sequence plural preparation step.
- the partial sequence to be compared with the two base sequences included in the combination is the 3 ′ end of the two nucleotide sequences.
- a local alignment score is obtained by performing pairwise local alignment under the condition of including, and (c-2) the second local alignment step is a primer created in the above-mentioned plurality of primer candidate base sequence creation steps A ply for PCR amplification of the second target region of the candidate base sequence A combination of selecting a candidate primer base sequence from a candidate primer base sequence and a base sequence of already adopted primers, and a combination of selecting a candidate primer base sequence and a base sequence of one already adopted primer. For all of the two base sequences included in the combination, pairwise local alignment is performed on the condition that the partial sequence to be compared includes the 3 ′ end of the two base sequences. This is a process for obtaining a score.
- the combination of base sequences for performing local alignment may be a combination selected by allowing duplication or a combination selected without allowing duplication, but primer / dimer formation between primers of the same base sequence If sex has not yet been evaluated, a combination selected to allow duplication is preferred.
- the local alignment is an alignment performed on a partial sequence, and a portion having high complementarity can be locally examined.
- the local alignment is usually performed under the condition that “the partial sequence to be compared includes the 3 ′ end of the base sequence” unlike the local alignment performed on the base sequence.
- the partial sequences to be compared include the 3 ′ ends of both base sequences.
- the condition that “the partial sequence to be compared includes the 3 ′ end of the base sequence”, that is, “the partial sequence to be compared starts from the 3 ′ end of one sequence and 3 ′ of the other sequence”.
- the local alignment under the condition of “considering only the alignment that ends at the end”, an embodiment in which the partial sequences to be compared include the 3 ′ ends of both base sequences is preferable.
- the local alignment may insert a gap.
- Gap means base insertion and / or deletion (indel).
- a case where bases are complementary between base sequence pairs is regarded as a match (match), and a case where they are not complementary is regarded as a mismatch (mismatch).
- the alignment is performed so that a score is given to each of the match, mismatch, and indel, and the total score is maximized. What is necessary is just to set a score suitably.
- the score may be set as shown in Table 1 below. In Table 1, “-” represents a gap (insertion and / or deletion (indel)).
- dot matrix shown in Table 3 from the base sequences of SEQ ID NOS: 1 and 2. Specifically, the base sequence of SEQ ID NO: 1 is arranged from left to right in the 5 ′ to 3 ′ direction, the base sequence of SEQ ID NO: 2 is arranged from the bottom to the top, in the direction of 5 ′ to 3 ′, and bases Is entered in a grid that is complementary to obtain a dot matrix shown in Table 3.
- the alignment can be obtained not only by the dot matrix method exemplified here but also by the dynamic programming method, the word method, or other various methods.
- first stage selection process S104 (FIG. 6), the first stage selection first process S204 and the first stage selection second process S214 (FIG. 7), and the first first stage selection process S304 and the first stage selection process S204.
- the first stage selection process S314 (FIG. 8) may be simply referred to as “first stage selection process”.
- first stage selection step S104 In FIG. 6, this is shown as “first stage selection” (S104).
- the first step selection step is a step of selecting the first step of the base sequence of candidate primers for PCR amplification of the target region based on the local alignment score. .
- first step selection first step S204 and first step selection second step S214 In FIG. 7, “first stage selection first” (S204) and “first stage selection second” (S214) are shown.
- the first step selection first step is based on the local alignment score and the first step of the nucleotide sequence of the candidate primer for PCR amplification of the first target region.
- First step selection second step is a first step of a base sequence of candidate primers for PCR amplification of the second target region based on the local alignment score This is a process of selecting.
- the first first-stage selection step includes a first candidate sequence of a primer candidate for PCR amplification of the first target region based on the local alignment score.
- the second first step selection step is a step of selecting candidate nucleotide sequences for PCR amplification of the second target region based on the local alignment score. This is a process of performing the first stage selection.
- a threshold value of the local alignment score (also referred to as “first threshold value”) is set in advance. If the local alignment score is less than the first threshold, it is determined that the combination of these two base sequences has low dimer formation, and the subsequent steps are performed. On the other hand, if the local alignment score is equal to or higher than the first threshold value, it is determined that the combination of these two base sequences has a high primer-dimer formation property, and the subsequent steps are not performed for the combination.
- the first threshold is not particularly limited and can be set as appropriate.
- the first threshold value may be set according to PCR conditions such as the amount of genomic DNA used as a template for the polymerase chain reaction.
- the first threshold is set to “+3” in the example shown in the “local alignment step”.
- the local alignment score is “+1” and less than the first threshold value “+3”
- the global alignment step S105 (FIG. 6), the first global alignment step S205 and the second global alignment step S215 (FIG. 7), and the first global alignment step S305 and the second global alignment step S315 (FIG. 6). 8) may be collectively referred to simply as “global alignment process”.
- the global alignment step is included in the combination for all combinations of selecting the candidate primer base sequences from the candidate primer base sequences selected in the first stage selection step. This is a step of obtaining a global alignment score by performing global alignment in a pair-wise manner on a base sequence having a predetermined sequence length including the 3 ′ ends of two base sequences.
- the first step of global alignment includes all the combinations for selecting two candidate primer base sequences from the candidate primer base sequences selected in the first step selection first step.
- global alignment which is a step of performing global alignment in a pairwise manner on a base sequence having a predetermined sequence length including the 3 ′ end of two base sequences included in the combination to obtain a global alignment score.
- the second step is a combination of selecting the base sequence of two candidate primers from the base sequence of the candidate primer selected in the first step selection second step and the base sequence of the primer already adopted and the base of one candidate primer Sequence and base sequence of one already adopted primer
- a global alignment score is obtained by performing global alignment in a pair-wise manner on a base sequence having a predetermined sequence length including the 3 ′ end of two base sequences included in the combination for all the combinations to be selected. .
- the first global alignment step includes selecting all the nucleotide sequences of the two candidate primers from the candidate primer sequences selected in the first first-stage selection step.
- the second global alignment step includes a combination of selecting the candidate primer base sequences selected from the primer candidate base sequences selected in the second first stage selection step and the primer base sequences already employed, and One candidate primer base sequence and one already adopted primer
- a global alignment score is obtained by performing a pair-wise global alignment on a base sequence having a predetermined sequence length including the 3 ′ end of the two base sequences included in the combination. It is a process to obtain.
- the global alignment score is the first of the candidate primers created in the “primer candidate base sequence creation step” (the local alignment score is the first when the “local alignment step” and the “first stage selection step” are performed first). From the group consisting of all candidate primers included in the combination) and all the already employed primers (only if there are already employed primers). One primer is taken out, and a base sequence having a predetermined sequence length including the 3 ′ end is obtained by performing global alignment in a pairwise manner.
- the combination of base sequences for performing global alignment may be a combination selected by allowing duplication, or a combination selected without allowing duplication, but primer / dimer formation between primers of the same base sequence If sex has not yet been evaluated, a combination selected to allow duplication is preferred.
- the global alignment is an alignment performed on the “entire sequence”, and the complementarity of the entire sequence can be examined.
- the “entire sequence” is the entire base sequence having a preset sequence length including the 3 ′ end of the base sequence of the candidate primer.
- a gap may be inserted in the global alignment.
- Gap means base insertion and / or deletion (indel).
- a case where the bases are complementary between the base sequence pairs is regarded as a match (match), and a case where the bases are not complementary is regarded as a mismatch (mismatch).
- the alignment is performed so that a score is given to each of the match, mismatch, and indel, and the total score is maximized. What is necessary is just to set a score suitably. For example, the score may be set as shown in Table 1 above. In Table 1, “-” represents a gap (insertion and / or deletion (indel)).
- alignment can be obtained by a dot matrix method, a dynamic programming method, a word method, or other various methods.
- the second stage selection process S106 (FIG. 6), the second stage selection first process S206 and the second stage selection second process S216 (FIG. 7), and the first second stage selection process S306 and the second stage selection process S306.
- the second stage selection process S316 (FIG. 8) may be simply referred to as “second stage selection process”.
- First aspect: second stage selection step S106 In FIG. 6, this is shown as “second stage selection” (S106).
- the second stage selection step is a step of performing the second step selection of the base sequence of candidate primers for PCR amplification of the target region based on the global alignment score. .
- second step selection first step S206 and second step selection second step S216 In FIG. 7, “second stage selection first” (S206) and “second stage selection second” (S216) are shown.
- the second step selection first step is based on the global alignment score, the second step of the nucleotide sequence of the candidate primer for PCR amplification of the first target region.
- the second stage selection second step is a second stage of the base sequence of candidate primers for PCR amplification of the second target region based on the global alignment score. This is a process of selecting.
- the first second-stage selection step includes the step of selecting a second candidate nucleotide sequence for PCR amplification of the first target region based on the global alignment score.
- the second second stage selection step is a step of selecting candidate nucleotide sequences for PCR amplification of the second target region based on the global alignment score. This is a process of performing the second stage selection.
- a global alignment score threshold (also referred to as “second threshold”) is set in advance. If the global alignment score is less than the second threshold, it is determined that the combination of these two base sequences has low dimer formation, and the subsequent steps are performed. On the other hand, if the global alignment score is greater than or equal to the second threshold value, it is determined that the combination of these two base sequences is highly dimer-forming, and the subsequent steps are not performed for that combination.
- the second threshold value is not particularly limited and can be set as appropriate. For example, the second threshold value may be set according to PCR conditions such as the amount of genomic DNA used as a template for the polymerase chain reaction.
- the base sequence of the preset base number including the 3 ′ end of the base sequence of each primer is pair-wise globally aligned.
- the global alignment score obtained in this way can be made less than the second threshold.
- the second threshold is set to “+3” in the example shown in the “global alignment step”.
- the global alignment score is “ ⁇ 3”, which is less than the second threshold value “+3”. Therefore, the combination of the base sequences of SEQ ID NOS: 1 and 2 has low primer-dimer formation properties. Judgment can be made.
- both the “global alignment process” and the “second stage selection process” are first performed, and the combination of the base sequences of the primers that have passed the “second stage selection process”
- the greater the number of target regions and the greater the number of primer candidate base sequences the greater the effect of reducing the amount of calculation, and the overall processing speed can be increased.
- ⁇ Amplification sequence length check process> For the combination of primer candidate base sequences determined to have low primer dimer formation in the “first stage selection process” and “second stage selection process”, the end of the primer candidate base sequence on the chromosomal DNA An amplification sequence length check step for calculating the distance between the parts and determining whether the distance is within a preset range may be performed (not shown). If the distance between the end portions of the base sequence is within a preset range, it can be determined that the combination of the base sequences of the candidate primers has a high possibility of appropriately amplifying the target region.
- the distance between the ends of the primer candidate base sequences is not particularly limited, and can be appropriately set depending on the PCR conditions such as the type of the enzyme (DNA polymerase).
- primer adoption step S107 (FIG. 6), primer adoption first step S207 and primer adoption second step S217 (FIG. 7), and first primer adoption step S307 and second primer adoption step S317 (FIG. 6). 8) may be collectively referred to simply as “primer adoption step”.
- primer adoption step S107 In FIG. 6, this is indicated as “primer adoption” (S107).
- the primer adoption step is for PCR-amplifying the nucleotide sequence of the candidate primer selected in both the first step selection step and the second step selection step. This is a step employed as the base sequence of the primer.
- primer adoption first step is the step of selecting the nucleotide sequence of the candidate primer selected in both the first step selection first step and the second step selection first step.
- primer adoption second step is a step of the first step selection second step and the second step selection second step. In either case, the selected primer candidate base sequence is used as a primer base sequence for PCR amplification of the second target region.
- first primer adoption S307
- second primer adoption S317
- the first primer adopting step is a base sequence of a candidate primer selected in both the first first stage selecting step and the first second stage selecting step. Is used as a base sequence of a primer for PCR amplification of the first target region.
- the second primer adoption step comprises the second first-stage selection step and the first step In this step, the nucleotide sequence of the candidate primer selected in any of the second stage selection steps is used as a primer nucleotide sequence for PCR amplification of the second target region.
- the local alignment score obtained by performing pairwise local alignment for each primer candidate base sequence under the condition that the partial sequence to be compared includes the 3 ′ end of the base sequence is the first.
- the global alignment score obtained by performing global alignment on a pairwise basis for a base sequence having a preset number of bases including the 3 ′ end of each primer candidate base sequence is less than the second threshold value. Is used as a primer base sequence for amplifying the target region.
- the base sequence of the candidate primer shown in SEQ ID NO: 1 and the base sequence of the candidate primer shown in SEQ ID NO: 2 can be adopted as the base sequence of the primer for amplifying the target region.
- a primer may be designed for another target region.
- the process is performed from the local alignment step S103. If the primer candidate base sequence for the other target region has not been created, the target region has not been selected in the target region selection step S101. Therefore, another target region is selected in the target region selection step S101, and the primer candidate base is selected.
- the sequence creation step S102 the base sequence of candidate primers for the target region is created, and then the local alignment step S103 and subsequent steps are performed.
- the process is repeated from the point of selecting a target area other than the first target area in the second target area selection step S211.
- the process repeats from the second local alignment step S313.
- the characteristic points in the primer designing method for PCR amplification of the target region are generally selected from a plurality of specific target regions, and the base sequences in the vicinity are selected.
- searching, confirming complementarity with each of the extracted primer sets, and selecting a base sequence with low complementarity a primer group including the target region as an amplification target and not complementary to each other is obtained.
- the feature point in confirming the complementarity of the base sequence of the primer is that the complementarity of the entire sequence is lowered by using local alignment, and the end of the base sequence of the primer is complemented by using global alignment. The point is to create a primer group so as to be low.
- PCR amplification of the target region can be performed more stably.
- Example 1 Performing tests for chromosome 13, chromosome 18 and chromosome 21 aneuploidy with a single cell in a definitive diagnostic level (sensitivity 99.9%, specificity 99.999%) think.
- amplification by multiplex PCR was performed on 30 loci, the amplification product was sequenced using a next-generation sequencer, and the number of sequence reads of the target chromosome was measured.
- the variation coefficient of the number of sequence reads was about 30%.
- the total amplification CV coefficient of variation in the number of sequence reads of the target chromosome needs to be about 6.5%.
- ceiling (z) represents the smallest integer equal to or greater than z with respect to the real number z
- Example 2 (Prerequisite) Consider determining with 99% accuracy whether cells isolated from pregnant peripheral blood are maternal or fetal.
- the mother's SNP type separately collects a large amount of cells from the oral cavity, etc., and can be determined without being affected by noise of single cell special characteristics such as ADO.
- the mother and father are not in close relationship.
- the mother's true genotype and the fetal cell genotype isolated from peripheral blood are homo-coincidence, hetero-coincidence, hetero-homo, -The probability of heterogeneity and the probability of homomismatch are 1-3p (1-p), p (1-p), p (1-p), where p is the average mutation frequency of SNPs. , P (1-p), and 0.
- the mother's true genotype and the maternal cell genotype isolated from peripheral blood have a homo-match probability, a hetero-match probability, Probability, homo-heterogeneity probability, and homo-mismatch probability are p 2 + (1 ⁇ p) 2 , 2p (1 ⁇ p), where p is the average mutation frequency of SNPs, respectively. 0, 0, and 0.
- the true genotype of the mother and the genotype of fetal cells are homozygous in 20 out of 20 SNPs by the binomial distribution
- the distribution of the number of heterogeneous matches, the number of hetero-homo mismatches, the number of mismatches in homo-hetero, and the number of mismatches in homo is as shown in FIG.
- the true genotype of the mother and the genotype of the mother cell are hetero-matched by the homozygous number out of 20 by the binomial distribution.
- the distribution of the number, the number of hetero-homo mismatch, the number of homo-hetero mismatch, and the number of homo mismatch is as shown in FIG.
- ADO allelic dropout rate
- the true genotype of the mother and the genotype of the fetal cell are homo-matched, hetero-matched, hetero-homo-mismatched, homo-hetero 11 and the distribution of the number of mismatches in homo are corrected as shown in FIG.
- the true genotype of the mother and the genotype of the mother cell are homo-matched, hetero-matched, hetero-homo-mismatched,
- the distribution of the number of heterogeneous mismatches and the number of homozygous mismatches are corrected as shown in FIG.
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法が提供される。
Description
本発明は、必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法に関する。
近年発達してきたDNAシーケンサ等により遺伝子解析が手軽に行えるようになっている。しかし、ゲノムの総塩基長は一般に膨大であり、一方でシーケンサのリード能力には制約がある。そこで、必要な特定の遺伝子領域のみを増幅し、その塩基配列に限定してリードを行うことで、効率的かつ精度よく遺伝子解析を行う技術としてPCR法が普及している。特に、ある1つのPCR反応系に複数種類のプライマーを同時に供給することで、複数の遺伝子領域を選択的に増幅する手法をマルチプレックスPCRと称する。
母体血中を循環する胎児有核赤血球細胞は、母体血中の細胞106~107個あたり1個程度しか含まれない希少な細胞であり、胎児有核赤血球細胞が疑われる有核赤血球細胞を複数個採取した場合、それらのすべてが胎児由来有核赤血球細胞である確率は極めて低い。
従来、単一の有核赤血球細胞からゲノムDNAを抽出し、WGA(全ゲノム増幅)を用いてゲノム全領域を増幅後に、マルチプレックスPCRやハイブリダイズによって関心ローカスをエンリッチメントすることが一般的であった。
しかし、WGAには、増幅バイアスが大きいため、染色体数の定量が困難になってしまうという問題があるため、最近では、単一の有核赤血球細胞から抽出したゲノムDNAをエンリッチメントすることなく、マルチプレックスPCRの鋳型DNAとして用いて、複数のローカスをPCR増幅し、次世代シークエンサーを用いて塩基配列情報を取得し、染色体数定量、またはジェノタイピング等を行っている。
その際、増幅対象のローカス数が増えるほど、1つのローカスが全体の性能に与える影響が小さくなり、精度などの目標性能を達成しやすくなる。
そのため、増幅対象のローカス数は多いことが好ましいが、一方で、増幅対象のローカス数が増えるほど、すべての増幅対象のローカスに対してプライマーを設計することが困難になるうえ、プライマー・ダイマーを形成しやすくなることにより、PCR増幅に失敗する可能性も高くなる。
そのため、増幅対象のローカス数は多いことが好ましいが、一方で、増幅対象のローカス数が増えるほど、すべての増幅対象のローカスに対してプライマーを設計することが困難になるうえ、プライマー・ダイマーを形成しやすくなることにより、PCR増幅に失敗する可能性も高くなる。
そのため、単一細胞から抽出したゲノムDNAをマルチプレックスPCRにより複数のローカスをPCR増幅して塩基配列情報を取得し、染色体数を定量する方法において、目標性能を達成するために必要なローカス数を決定する方法が求められている。
そこで、本発明は、単一細胞からの染色体数定量のために必要なローカス数を決定する方法を提供することを課題とする。
また、本発明は、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法を提供することを課題とする。
また、本発明は、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法を提供することを課題とする。
本発明者は、上記課題を解決すべく鋭意検討を重ねた結果、実験結果と、目標性能とを入力し、これらを演算処理して必要なローカス数または必要なSNPs座位数を決定することにより、必要なローカス数を決定する方法または必要なSNPs座位数を決定する方法を提供することができることを知得し、本発明を完成させた。
すなわち、本発明は、以下の[1]~[9]である。
[1] 単一細胞からの染色体数定量のために必要なローカス数を決定する方法であって、
複数回の反復試行により取得された実験結果である、対象染色体上のローカス数nおよび対象染色体の配列リード数の変動係数xが入力手段を介して入力され、記憶手段に記憶される実験結果入力工程と、
目標性能である、対象染色体の配列リード数の変動係数yが入力手段を介して入力され、記憶手段に記憶される目標性能入力工程と、
演算手段が、記憶手段から、ローカス数n、変動係数x、および変動係数yを読み出し、実験結果であるローカス数nおよび変動係数xならびに目標性能である変動係数yから、変動係数xがy以下となるために必要なローカス数Nを算出し、記憶手段に記憶する、必要ローカス数決定工程と、
演算手段が、記憶手段から、染色体数定量のために必要なローカス数Nを読み出し、表示手段に表示する、結果表示工程と
を含む、必要なローカス数を決定する方法。
[2] 上記実験結果入力工程において、上記対象染色体の配列リード数の変動係数xに代えて、上記対象染色体上のローカスあたりの配列リード数の変動係数x’が入力され、記憶手段に記憶された場合において、
上記実験結果入力工程の後、かつ、上記必要ローカス数決定工程の前に、さらに、
演算手段が、記憶手段から、上記対象染色体上のローカス数nおよび上記対象染色体上のローカスあたりの配列リード数の変動係数x’を読み出し、下記式
x=x’/SQRT(n)
によって、対象染色体の配列リード数の変動係数xを算出し、記憶手段に記憶する、実験結果換算工程を含む、上記[1]に記載の方法。
ただし、SQRT(n)は、nの平方根を表す。
[3] 上記目標性能入力工程において、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTが入力され、記憶手段に記憶された場合において、
上記目標性能入力工程の後、かつ、上記必要ローカス数決定工程の前に、さらに、
演算手段が、記憶手段から、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを読み出し、目標とする、対象染色体の配列リード数の変動係数yに換算し、記憶手段に記憶する、目標性能換算工程
を含む、上記[1]または[2]に記載の方法。
[4] 上記目標性能換算工程において、
感度SeTが読み出された場合、正規分布に従う、染色体異数性がある細胞群を仮定すると、この細胞群において染色体異数性ありと判定される細胞の割合が感度であるから、これに目標とする感度SeTを代入して、そのときの変動係数を目標とする変動係数yとする、
特異度SpTが読み出された場合、正規分布に従う、染色体異数性がない細胞群を仮定すると、この細胞群において染色体異数性なしと判定される細胞の割合が特異度であるから、これに目標とする特異度SpTを代入して、そのときの変動係数を目標とする変動係数yとする、
陽性適中率PPVTが読み出された場合、予め与えられた有病率および下記式1を用いて、陽性適中率を感度および特異度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、感度および特異度を、目標とする変動係数yに換算する、または、
陰性適中率NPVTが読み出された場合、予め与えられた有病率および下記式2を用いて、陰性適中率を特異度および感度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、特異度および感度を、目標とする変動係数yに換算する、
上記[3]に記載の方法。
式1: 陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
式2: 陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
[5] 上記必要ローカス数決定工程において、演算手段が、記憶手段から、ローカス数n、変動係数x、および変動係数yを読み出し、下記式
N=f(n,x,y)=ceiling(z)
z=k×n×(x/y)2
によって、必要なローカス数Nを算出する、上記[1]~[4]のいずれか1項に記載の方法。
ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた1.0以上1.5以下の係数である。
[6] z=n×(x/y)2
である、上記[5]に記載の方法。
[7] 妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法であって、
mを2以上の整数として、m個のSNPs座位を解析する先行実験により得られた、m個のSNPsの平均の変異頻度νおよびアレルドロップアウト率Θ%が入力手段を介して入力され、記憶手段に記憶される実験結果入力工程と、
目標精度Ψ%が入力手段を介して入力され、記憶手段に記憶される目標性能入力工程と、
演算手段が記憶手段から、SNPs座位の個数m、変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率τを求め、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率υ=1を求め、
Φ=100×(υ-τ)を計算し、
mを1ずつ増加して行き、Φ≧Ψとなる最小の整数mを算出し、必要なSNPs座位数Mとして記憶手段に記憶する、必要SNPs座位数決定工程と、
演算手段が、記憶手段から、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数Mを読み出し、表示手段に表示する、結果表示工程と
を含む、必要なSNPs座位数を決定する方法。
[8] 上記必要SNPs座位数決定工程において、演算手段が記憶手段から変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、下記式
M=h(ν,θ,ψ)=ceiling(χ)
χ=κlog(1-ψ)/log(1-ξ)
ξ=ν(1-ν)(1-θ)
ψ=Ψ/100
θ=Θ/100
によって、必要なSNPs座位数Mを算出する、上記[7]に記載の方法。
ただし、ceiling(χ)は実数χに対してχ以上の最小の整数を表し、κは予め定められた1.0以上1.5以下の係数である。
[9] χ=log(1-ψ)/log(1-ξ)
である、上記[8]に記載の方法。
[1] 単一細胞からの染色体数定量のために必要なローカス数を決定する方法であって、
複数回の反復試行により取得された実験結果である、対象染色体上のローカス数nおよび対象染色体の配列リード数の変動係数xが入力手段を介して入力され、記憶手段に記憶される実験結果入力工程と、
目標性能である、対象染色体の配列リード数の変動係数yが入力手段を介して入力され、記憶手段に記憶される目標性能入力工程と、
演算手段が、記憶手段から、ローカス数n、変動係数x、および変動係数yを読み出し、実験結果であるローカス数nおよび変動係数xならびに目標性能である変動係数yから、変動係数xがy以下となるために必要なローカス数Nを算出し、記憶手段に記憶する、必要ローカス数決定工程と、
演算手段が、記憶手段から、染色体数定量のために必要なローカス数Nを読み出し、表示手段に表示する、結果表示工程と
を含む、必要なローカス数を決定する方法。
[2] 上記実験結果入力工程において、上記対象染色体の配列リード数の変動係数xに代えて、上記対象染色体上のローカスあたりの配列リード数の変動係数x’が入力され、記憶手段に記憶された場合において、
上記実験結果入力工程の後、かつ、上記必要ローカス数決定工程の前に、さらに、
演算手段が、記憶手段から、上記対象染色体上のローカス数nおよび上記対象染色体上のローカスあたりの配列リード数の変動係数x’を読み出し、下記式
x=x’/SQRT(n)
によって、対象染色体の配列リード数の変動係数xを算出し、記憶手段に記憶する、実験結果換算工程を含む、上記[1]に記載の方法。
ただし、SQRT(n)は、nの平方根を表す。
[3] 上記目標性能入力工程において、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTが入力され、記憶手段に記憶された場合において、
上記目標性能入力工程の後、かつ、上記必要ローカス数決定工程の前に、さらに、
演算手段が、記憶手段から、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを読み出し、目標とする、対象染色体の配列リード数の変動係数yに換算し、記憶手段に記憶する、目標性能換算工程
を含む、上記[1]または[2]に記載の方法。
[4] 上記目標性能換算工程において、
感度SeTが読み出された場合、正規分布に従う、染色体異数性がある細胞群を仮定すると、この細胞群において染色体異数性ありと判定される細胞の割合が感度であるから、これに目標とする感度SeTを代入して、そのときの変動係数を目標とする変動係数yとする、
特異度SpTが読み出された場合、正規分布に従う、染色体異数性がない細胞群を仮定すると、この細胞群において染色体異数性なしと判定される細胞の割合が特異度であるから、これに目標とする特異度SpTを代入して、そのときの変動係数を目標とする変動係数yとする、
陽性適中率PPVTが読み出された場合、予め与えられた有病率および下記式1を用いて、陽性適中率を感度および特異度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、感度および特異度を、目標とする変動係数yに換算する、または、
陰性適中率NPVTが読み出された場合、予め与えられた有病率および下記式2を用いて、陰性適中率を特異度および感度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、特異度および感度を、目標とする変動係数yに換算する、
上記[3]に記載の方法。
式1: 陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
式2: 陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
[5] 上記必要ローカス数決定工程において、演算手段が、記憶手段から、ローカス数n、変動係数x、および変動係数yを読み出し、下記式
N=f(n,x,y)=ceiling(z)
z=k×n×(x/y)2
によって、必要なローカス数Nを算出する、上記[1]~[4]のいずれか1項に記載の方法。
ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた1.0以上1.5以下の係数である。
[6] z=n×(x/y)2
である、上記[5]に記載の方法。
[7] 妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法であって、
mを2以上の整数として、m個のSNPs座位を解析する先行実験により得られた、m個のSNPsの平均の変異頻度νおよびアレルドロップアウト率Θ%が入力手段を介して入力され、記憶手段に記憶される実験結果入力工程と、
目標精度Ψ%が入力手段を介して入力され、記憶手段に記憶される目標性能入力工程と、
演算手段が記憶手段から、SNPs座位の個数m、変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率τを求め、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率υ=1を求め、
Φ=100×(υ-τ)を計算し、
mを1ずつ増加して行き、Φ≧Ψとなる最小の整数mを算出し、必要なSNPs座位数Mとして記憶手段に記憶する、必要SNPs座位数決定工程と、
演算手段が、記憶手段から、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数Mを読み出し、表示手段に表示する、結果表示工程と
を含む、必要なSNPs座位数を決定する方法。
[8] 上記必要SNPs座位数決定工程において、演算手段が記憶手段から変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、下記式
M=h(ν,θ,ψ)=ceiling(χ)
χ=κlog(1-ψ)/log(1-ξ)
ξ=ν(1-ν)(1-θ)
ψ=Ψ/100
θ=Θ/100
によって、必要なSNPs座位数Mを算出する、上記[7]に記載の方法。
ただし、ceiling(χ)は実数χに対してχ以上の最小の整数を表し、κは予め定められた1.0以上1.5以下の係数である。
[9] χ=log(1-ψ)/log(1-ξ)
である、上記[8]に記載の方法。
本発明によれば、単一細胞からの染色体数定量のために必要なローカス数を決定する方法を提供することができる。より具体的には、単一細胞から抽出したゲノムDNAをマルチプレックスPCRにより複数のローカスをPCR増幅して塩基配列情報を取得し、染色体数を定量する方法において、目標性能を達成するために必要なローカス数を決定する方法を提供することができる。
また、本発明によれば、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法を提供することができる。
さらに、マルチプレックスPCRに供するプライマーが減少されることにより、コストの削減、およびプライマー設計の容易化を図ることができる。
また、本発明によれば、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法を提供することができる。
さらに、マルチプレックスPCRに供するプライマーが減少されることにより、コストの削減、およびプライマー設計の容易化を図ることができる。
本発明において、範囲を特定できる数値等について「~」を用いてその範囲を表した場合は、その範囲には「~」の左右の数値等を含む。例えば、数値aおよび数値b(ただし、a≠bとする。)について「a~b」と表した場合は、その範囲にはaおよびbを含む。また、例えば、k(ただし、kはk≧3を満たす整数とする。)個の元からなる順列a1,a2,・・・,akにについて「ai~aj」(ただし、iおよびjは、1≦i≦k、1≦j≦k、かつ、i≠jを満たす整数とする。)と表した場合は、その範囲にはaiおよびajを含む。
本発明において、以下の略語はそれぞれ以下の意味を表す。
PCR : Polymerase Chain Reaction(ポリメラーゼ連鎖反応)
DNA : Deoxyribonucleic acid(デオキシリボ核酸)
SNPs : Single Nucleotide Polymorphisms(一塩基多型)
CV : coefficient of variation(変動係数)
PCR : Polymerase Chain Reaction(ポリメラーゼ連鎖反応)
DNA : Deoxyribonucleic acid(デオキシリボ核酸)
SNPs : Single Nucleotide Polymorphisms(一塩基多型)
CV : coefficient of variation(変動係数)
また、本発明においては、00=1と定義する。
また、感度、特異度、陽性適中率および陰性適中率は以下の意味である。
感度 疾患あり(有病)のうち検査陽性となる割合をいう。図3に示すa/(a+c)である。
特異度 疾患なしのうち検査陰性となる割合をいう。図3に示すd/(b+d)である。
陽性適中率 検査陽性のうち疾患あり(有病)の割合をいう。図3に示すa/(a+b)である。また、感度および有病率が与えられれば、陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))として求めることもできる。
陰性適中率 検査陰性のうち疾患なしの割合をいう。図3に示すd/(c+d)である。また、特異度および有病率が与えられれば、陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))として求めることもできる。
感度 疾患あり(有病)のうち検査陽性となる割合をいう。図3に示すa/(a+c)である。
特異度 疾患なしのうち検査陰性となる割合をいう。図3に示すd/(b+d)である。
陽性適中率 検査陽性のうち疾患あり(有病)の割合をいう。図3に示すa/(a+b)である。また、感度および有病率が与えられれば、陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))として求めることもできる。
陰性適中率 検査陰性のうち疾患なしの割合をいう。図3に示すd/(c+d)である。また、特異度および有病率が与えられれば、陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))として求めることもできる。
[必要なローカス数を決定する方法]
本発明の「必要なローカス数を決定する方法」は、以下の工程を備える、単一細胞からの染色体数定量のために必要なローカス数を決定する方法である。図1および図2を適宜参照しながら説明する。
本発明の「必要なローカス数を決定する方法」は、以下の工程を備える、単一細胞からの染色体数定量のために必要なローカス数を決定する方法である。図1および図2を適宜参照しながら説明する。
〈実験結果入力工程S11〉
複数回の反復試行により取得された実験結果である、対象染色体上のローカス数nおよび対象染色体の配列リード数の変動係数xが入力手段(キーボード)14を介して入力され、記憶手段(メモリ)12に記憶される工程である(図2のS11)。
なお、本工程では、ハードウェアに対する入力手段として、入力補助手段15を用いることも可能である。
複数回の反復試行により取得された実験結果である、対象染色体上のローカス数nおよび対象染色体の配列リード数の変動係数xが入力手段(キーボード)14を介して入力され、記憶手段(メモリ)12に記憶される工程である(図2のS11)。
なお、本工程では、ハードウェアに対する入力手段として、入力補助手段15を用いることも可能である。
《対象染色体》
対象染色体は、染色体数を定量しようとする染色体である。対象染色体は、常染色体および性染色体のいずれであってもよいが、例えば、21番染色体、18番染色体、13番染色体、X染色体、およびY染色体などが挙げられる。
21番染色体の定量は、例えば、21番染色体のトリソミーを検出するために行われる。21番染色体のトリソミーが原因となる疾患としては、ダウン症候群が挙げられる。
18番染色体の定量は、例えば、18番染色体のトリソミーを検出するために行われる。18番染色体のトリソミーが原因となる疾患としては、エドワーズ症候群が挙げられる。
13番染色体の定量は、例えば、13番染色体のトリソミーを検出するために行われる。13番染色体のトリソミーが原因となる疾患としては、パトウ症候群が挙げられる。
X染色体の定量は、例えば、X染色体の過剰を検出するために行われる。X染色体の過剰が原因となる疾患としては、例えば、クラインフェルター症候群などが挙げられる。
Y染色体の定量は、例えば、Y染色体の過剰を検出するために行われる。Y染色体の過剰が原因となる疾患としては、例えば、XYY症候群などが挙げられる。
対象染色体は、染色体数を定量しようとする染色体である。対象染色体は、常染色体および性染色体のいずれであってもよいが、例えば、21番染色体、18番染色体、13番染色体、X染色体、およびY染色体などが挙げられる。
21番染色体の定量は、例えば、21番染色体のトリソミーを検出するために行われる。21番染色体のトリソミーが原因となる疾患としては、ダウン症候群が挙げられる。
18番染色体の定量は、例えば、18番染色体のトリソミーを検出するために行われる。18番染色体のトリソミーが原因となる疾患としては、エドワーズ症候群が挙げられる。
13番染色体の定量は、例えば、13番染色体のトリソミーを検出するために行われる。13番染色体のトリソミーが原因となる疾患としては、パトウ症候群が挙げられる。
X染色体の定量は、例えば、X染色体の過剰を検出するために行われる。X染色体の過剰が原因となる疾患としては、例えば、クラインフェルター症候群などが挙げられる。
Y染色体の定量は、例えば、Y染色体の過剰を検出するために行われる。Y染色体の過剰が原因となる疾患としては、例えば、XYY症候群などが挙げられる。
《ローカス》
ローカスは遺伝子座または座位であり、遺伝子領域に限定されず、遺伝子に該当しないような塩基配列または遺伝マーカーの位置も含む。
また、ローカスの数、すなわちローカス数は、特に限定されないが、必要ローカス数を決定するための実験結果を提供するために行う試行であることを考慮して適宜設定される。
ローカスは遺伝子座または座位であり、遺伝子領域に限定されず、遺伝子に該当しないような塩基配列または遺伝マーカーの位置も含む。
また、ローカスの数、すなわちローカス数は、特に限定されないが、必要ローカス数を決定するための実験結果を提供するために行う試行であることを考慮して適宜設定される。
《配列リード数》
配列リード数は、対象染色体上のローカスをマルチプレックスPCRにより増幅し、増幅産物を次世代シークエンサーによりシークエンシングして得られる、対象染色体あたりのシークエンスリードの数である。すなわち、対象染色体上のローカスをマルチプレックスPCRにより増幅して得られるPCR産物をシークエンシングして得られる、ローカスあたりのシークエンスリードの数の総和である。なお、後述するように、ローカスあたりのシークエンスリードの数の総和に代えて、ローカスあたりの平均的なシークエンスリードの数を配列リード数として用いてもよい。
配列リード数は、対象染色体上のローカスをマルチプレックスPCRにより増幅し、増幅産物を次世代シークエンサーによりシークエンシングして得られる、対象染色体あたりのシークエンスリードの数である。すなわち、対象染色体上のローカスをマルチプレックスPCRにより増幅して得られるPCR産物をシークエンシングして得られる、ローカスあたりのシークエンスリードの数の総和である。なお、後述するように、ローカスあたりのシークエンスリードの数の総和に代えて、ローカスあたりの平均的なシークエンスリードの数を配列リード数として用いてもよい。
《反復試行》
反復試行の回数は特に限定されるものではないが、必要ローカス数を決定するための実験結果を得るために行われるものであることを考慮して、その回数が設定される。例えば、反復回数としては、好ましくは3回以上100回以下であり、より好ましくは5回以上50回以下であり、さらに好ましくは10回以上30回以下である。
1回あたりの試行としては、例えば、妊婦の末梢血を採取し、採取した末梢血から有核赤血球細胞を単離し、単離した有核赤血球細胞からゲノムDNAを抽出し、抽出したゲノムDNAを鋳型DNAとして、マルチプレックスPCRを行って、得られたPCR増幅産物を次世代シークエンサーを用いて配列リード数を得る。
複数回の試行により得た対象染色体の配列リード数から、対象染色体の配列リード数の平均値μ、分散σ2、および変動係数CV=σ/μ等を求めることができる。
反復試行の回数は特に限定されるものではないが、必要ローカス数を決定するための実験結果を得るために行われるものであることを考慮して、その回数が設定される。例えば、反復回数としては、好ましくは3回以上100回以下であり、より好ましくは5回以上50回以下であり、さらに好ましくは10回以上30回以下である。
1回あたりの試行としては、例えば、妊婦の末梢血を採取し、採取した末梢血から有核赤血球細胞を単離し、単離した有核赤血球細胞からゲノムDNAを抽出し、抽出したゲノムDNAを鋳型DNAとして、マルチプレックスPCRを行って、得られたPCR増幅産物を次世代シークエンサーを用いて配列リード数を得る。
複数回の試行により得た対象染色体の配列リード数から、対象染色体の配列リード数の平均値μ、分散σ2、および変動係数CV=σ/μ等を求めることができる。
〈実験結果換算工程S13〉
本発明の必要なローカス数の決定方法は、さらに、実験結果換算工程を含んでもよい。
実験結果換算工程は、演算手段が、記憶手段から、上記対象染色体上のローカス数nおよび上記対象染色体上のローカスあたりの配列リード数の変動係数x’を読み出し、下記式によって、対象染色体の配列リード数の変動係数xを算出し、記憶手段に記憶する工程である(図2のS13)。
x=x’/SQRT(n)
ただし、SQRT(n)は、nの平方根を表す。
上記実験結果入力工程において、上記対象染色体の配列リード数の変動係数xに代えて、上記対象染色体上のローカスあたりの配列リード数の変動係数x’が入力され、記憶手段(メモリ)12に記憶された場合、実験結果換算工程を、上記実験結果入力工程の後、かつ、上記必要ローカス数決定工程の前に、行うことが好ましい。
本発明の必要なローカス数の決定方法は、さらに、実験結果換算工程を含んでもよい。
実験結果換算工程は、演算手段が、記憶手段から、上記対象染色体上のローカス数nおよび上記対象染色体上のローカスあたりの配列リード数の変動係数x’を読み出し、下記式によって、対象染色体の配列リード数の変動係数xを算出し、記憶手段に記憶する工程である(図2のS13)。
x=x’/SQRT(n)
ただし、SQRT(n)は、nの平方根を表す。
上記実験結果入力工程において、上記対象染色体の配列リード数の変動係数xに代えて、上記対象染色体上のローカスあたりの配列リード数の変動係数x’が入力され、記憶手段(メモリ)12に記憶された場合、実験結果換算工程を、上記実験結果入力工程の後、かつ、上記必要ローカス数決定工程の前に、行うことが好ましい。
〈目標性能入力工程S12〉
目標性能である、対象染色体の配列リード数の変動係数yが入力手段を介して入力され、記憶手段に記憶される工程である(図2のS12)。
なお、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを入力してもよい。その場合には、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを、目標とする変動係数yに換算する目標性能換算工程を、目標性能入力工程の後、かつ、必要ローカス数決定工程の前に行う。
なお、入力補助手段として補助入力手段(マウス)15を用いることも可能である。
目標性能である、対象染色体の配列リード数の変動係数yが入力手段を介して入力され、記憶手段に記憶される工程である(図2のS12)。
なお、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを入力してもよい。その場合には、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを、目標とする変動係数yに換算する目標性能換算工程を、目標性能入力工程の後、かつ、必要ローカス数決定工程の前に行う。
なお、入力補助手段として補助入力手段(マウス)15を用いることも可能である。
〈目標性能換算工程S14〉
本発明の必要なローカス数の決定方法は、さらに、目標性能換算工程を含んでもよい。
目標性能換算工程は、演算手段が、記憶手段から、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを読み出し、目標とする、対象染色体の配列リード数の変動係数yに換算し、記憶手段に記憶する工程である(図2のS14)。
上記目標性能入力工程において、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTが入力され、記憶手段に記憶された場合、目標性能換算工程を、上記目標性能入力工程の後、かつ、上記必要ローカス数決定工程の前に、行うことが好ましい。
本発明の必要なローカス数の決定方法は、さらに、目標性能換算工程を含んでもよい。
目標性能換算工程は、演算手段が、記憶手段から、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを読み出し、目標とする、対象染色体の配列リード数の変動係数yに換算し、記憶手段に記憶する工程である(図2のS14)。
上記目標性能入力工程において、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTが入力され、記憶手段に記憶された場合、目標性能換算工程を、上記目標性能入力工程の後、かつ、上記必要ローカス数決定工程の前に、行うことが好ましい。
目標性能換算の具体的な方法について説明する。
(1)感度SeTが読み出された場合
正規分布に従う、染色体異数性がある細胞群を仮定すると、この細胞群において染色体異数性ありと判定される細胞の割合が感度であるから、これに目標とする感度SeTを代入して、そのときの変動係数を目標とする変動係数yとする。
(2)特異度SpTが読み出された場合
正規分布に従う、染色体異数性がない細胞群を仮定すると、この細胞群において染色体異数性なしと判定される細胞の割合が特異度であるから、これに目標とする特異度SpTを代入して、そのときの変動係数を目標とする変動係数yとする。
(3)陽性適中率PPVTが読み出された場合
予め与えられた有病率および下記式1を用いて、陽性適中率を感度および特異度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、感度および特異度を、目標とする変動係数yに換算する。
式1: 陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
(4)陰性適中率NPVTが読み出された場合
予め与えられた有病率および下記式2を用いて、陰性適中率を特異度および感度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、特異度および感度を、目標とする変動係数yに換算する。
式2: 陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
(1)感度SeTが読み出された場合
正規分布に従う、染色体異数性がある細胞群を仮定すると、この細胞群において染色体異数性ありと判定される細胞の割合が感度であるから、これに目標とする感度SeTを代入して、そのときの変動係数を目標とする変動係数yとする。
(2)特異度SpTが読み出された場合
正規分布に従う、染色体異数性がない細胞群を仮定すると、この細胞群において染色体異数性なしと判定される細胞の割合が特異度であるから、これに目標とする特異度SpTを代入して、そのときの変動係数を目標とする変動係数yとする。
(3)陽性適中率PPVTが読み出された場合
予め与えられた有病率および下記式1を用いて、陽性適中率を感度および特異度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、感度および特異度を、目標とする変動係数yに換算する。
式1: 陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
(4)陰性適中率NPVTが読み出された場合
予め与えられた有病率および下記式2を用いて、陰性適中率を特異度および感度に変換し、さらに、上記感度SeTが読み出された場合および上記特異度SpTが読み出された場合に従って、特異度および感度を、目標とする変動係数yに換算する。
式2: 陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
より詳細には以下に説明するとおりである。
染色体異数性がない細胞群D1(以下「正常細胞群D1」という場合がある。)および染色体異数性がある細胞群D2(以下「異常細胞群D2」という場合がある。)を考える。
正常細胞群D1の検査値Xは正規分布N(μ1,σ1 2)に従い、異常細胞群D2の検査値Xは正規分布N(μ2,σ2 2)に従うものとする。
すると、N(μ1,σ1 2)は、以下の確率密度関数f1(x)を持つ確率分布として与えられる。
f1(x)=1/sqrt(2πσ1 2)・epx(-(x-μ1)2/2σ1 2)
また、N(μ2,σ2 2)は、以下の確率密度関数f2(x)を持つ確率分布として与えられる。
f2(x)=1/sqrt(2πσ2 2)・epx(-(x-μ2)2/2σ2 2)
ただし、sqrt(z)は、zの平方根を表し、exp(z)はezを表す。ここで、eは自然対数の底(ネイピア数)である。
染色体異数性がない細胞群D1(以下「正常細胞群D1」という場合がある。)および染色体異数性がある細胞群D2(以下「異常細胞群D2」という場合がある。)を考える。
正常細胞群D1の検査値Xは正規分布N(μ1,σ1 2)に従い、異常細胞群D2の検査値Xは正規分布N(μ2,σ2 2)に従うものとする。
すると、N(μ1,σ1 2)は、以下の確率密度関数f1(x)を持つ確率分布として与えられる。
f1(x)=1/sqrt(2πσ1 2)・epx(-(x-μ1)2/2σ1 2)
また、N(μ2,σ2 2)は、以下の確率密度関数f2(x)を持つ確率分布として与えられる。
f2(x)=1/sqrt(2πσ2 2)・epx(-(x-μ2)2/2σ2 2)
ただし、sqrt(z)は、zの平方根を表し、exp(z)はezを表す。ここで、eは自然対数の底(ネイピア数)である。
ここで、正常細胞群D1の変動係数CV1は、および異常細胞群D2の変動係数CV2は、それぞれ、
CV1=σ1/μ1
CV2=σ2/μ2
である。
CV1=σ1/μ1
CV2=σ2/μ2
である。
(検査値Xが閾値cを超えれば(X>cならば)染色体異数性あり、閾値c以下であれば(X≦cならば)染色体異数性なしと判定する場合)
感度は異常細胞群D2のうち、検査値Xが閾値cを超える細胞の割合であり、下記式で表される。
感度は異常細胞群D2のうち、検査値Xが閾値cを超える細胞の割合であり、下記式で表される。
したがって、目標とする感度SeTをsens(c)の式に代入して得られるσ2/μ2が、目標特異度SpTを換算して得られる目標とする変動係数yである。
また、特異度は正常細胞群D1のうち、検査値Xが閾値c以下の細胞の割合であり、下記式で表される。
したがって、目標とする感度SeTをspec(c)の式に代入して得られるσ1/μ1が、目標感度SeTを換算して得られる目標とする変動係数yである。
さらに、以下の式から、予め与えられた有病率を用いて、陽性適中率を感度に、陰性適中率を特異度に、それぞれ変換し、さらに変動係数に換算することにより、目標とする変動係数yを得ることができる。
陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
なお、閾値cとしては、例えば、f1(c)=f2(c)となるcを採用することができるが、これに限定されるものではない。
(検査値Xが閾値c未満であれば(X<cならば)染色体異数性あり、閾値c異常であれば(X≧cならば)染色体異数性なしと判定する場合)
感度は異常細胞群D2のうち、検査値Xが閾値c未満となる細胞の割合であり、下記式で表される。
感度は異常細胞群D2のうち、検査値Xが閾値c未満となる細胞の割合であり、下記式で表される。
したがって、目標とする感度SeTをsens(c)の式に代入して得られるσ2/μ2が、目標特異度SpTを換算して得られる目標とする変動係数yである。
また、特異度は正常細胞群D1のうち、検査値Xが閾値c以下の細胞の割合であり、下記式で表される。
したがって、目標とする感度SeTをspec(c)の式に代入して得られるσ1/μ1が、目標感度SeTを換算して得られる目標とする変動係数yである。
さらに、以下の式から、予め与えられた有病率を用いて、陽性適中率を感度に、陰性適中率を特異度に、それぞれ変換し、さらに変動係数に換算することにより、目標とする変動係数yを得ることができる。
陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度))
なお、閾値cとしては、例えば、f1(c)=f2(c)となるcを採用することができるが、これに限定されるものではない。
〈必要ローカス数決定工程S15〉
演算手段(CPU)11が、記憶手段(メモリ)12から、ローカス数n、変動係数x、および変動係数yを読み出し、実験結果であるローカス数nおよび変動係数yならびに目標性能である変動係数yから、変動係数がy以下となるために必要なローカス数Nを算出し、記憶手段(メモリ)12に記憶する工程である(図2のS15)。
演算手段(CPU)11が、記憶手段(メモリ)12から、ローカス数n、変動係数x、および変動係数yを読み出し、実験結果であるローカス数nおよび変動係数yならびに目標性能である変動係数yから、変動係数がy以下となるために必要なローカス数Nを算出し、記憶手段(メモリ)12に記憶する工程である(図2のS15)。
必要ローカス数決定工程において、演算手段11が、記憶手段12から、ローカス数n、変動係数x、および変動係数yを読み出し、下記式
N=f(n,x,y)=ceiling(z)
z=k×n×(x/y)2、好ましくはz=n×(x/y)2
によって、必要なローカス数Nを算出することが好ましい。
ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた1.0以上1.5以下の係数である。
N=f(n,x,y)=ceiling(z)
z=k×n×(x/y)2、好ましくはz=n×(x/y)2
によって、必要なローカス数Nを算出することが好ましい。
ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた1.0以上1.5以下の係数である。
〈結果表示工程S16〉
演算手段(CPU)11が、記憶手段(メモリ)12から、染色体数定量のために必要なローカス数Nを読み出し、表示手段(モニタ)16に表示する工程である(図2のS16)。
さらに、入力手段(キーボード)14または補助入力手段(マウス)15からの指令により、出力手段(プリンタ)17から出力してもよい。
演算手段(CPU)11が、記憶手段(メモリ)12から、染色体数定量のために必要なローカス数Nを読み出し、表示手段(モニタ)16に表示する工程である(図2のS16)。
さらに、入力手段(キーボード)14または補助入力手段(マウス)15からの指令により、出力手段(プリンタ)17から出力してもよい。
[必要なローカス数を決定する装置]
次に、本発明の必要なローカス数を決定する方法を実行する装置について、図1を参照しながら説明する。
本発明の必要なローカス数を決定する方法を実行する装置は、演算手段(CPU)11、記憶手段(メモリ)12、補助記憶手段(ストレージ)13、入力手段(キーボード)14、および表示手段(モニタ)16を備える。さらに、補助入力手段(マウス)15、および出力手段(プリンタ)17等を備えていてもよい。
それぞれの手段について説明する。
入力手段(キーボード)14は、装置に指示およびデータ等を入力する手段であり、実験結果および目標性能を入力するために用いられる。
補助入力手段(マウス)15は、入力手段(キーボード)14に代えて、またはそれとともに、用いられる。
演算手段(CPU)11は、演算処理を行う手段であり、各手段の制御、データの書込み、および読込み等の処理の他、必要なローカス数Nを算出するために用いられる。
記憶手段(メモリ)12は、演算手段(CPU)11の演算処理の結果を記憶したり、入力手段(キーボード)14からの入力を記憶したりするために用いられる。
補助記憶手段(ストレージ)13は、オペレーティングシステム、必要なローカス数を決定するためのプログラムなどを保存するストレージである。その一部を記憶手段を拡張するために用いることもできる。
表示手段(ディスプレイ)16は、ユーザーとのインターフェイスの一つである。必要なローカス数を算出した後、表示するために用いられる。
出力手段(プリンタ)17は、演算手段(CPU)11からの指示により、表示手段(ディスプレイ)16に表示した情報を印刷するために用いられる。
次に、本発明の必要なローカス数を決定する方法を実行する装置について、図1を参照しながら説明する。
本発明の必要なローカス数を決定する方法を実行する装置は、演算手段(CPU)11、記憶手段(メモリ)12、補助記憶手段(ストレージ)13、入力手段(キーボード)14、および表示手段(モニタ)16を備える。さらに、補助入力手段(マウス)15、および出力手段(プリンタ)17等を備えていてもよい。
それぞれの手段について説明する。
入力手段(キーボード)14は、装置に指示およびデータ等を入力する手段であり、実験結果および目標性能を入力するために用いられる。
補助入力手段(マウス)15は、入力手段(キーボード)14に代えて、またはそれとともに、用いられる。
演算手段(CPU)11は、演算処理を行う手段であり、各手段の制御、データの書込み、および読込み等の処理の他、必要なローカス数Nを算出するために用いられる。
記憶手段(メモリ)12は、演算手段(CPU)11の演算処理の結果を記憶したり、入力手段(キーボード)14からの入力を記憶したりするために用いられる。
補助記憶手段(ストレージ)13は、オペレーティングシステム、必要なローカス数を決定するためのプログラムなどを保存するストレージである。その一部を記憶手段を拡張するために用いることもできる。
表示手段(ディスプレイ)16は、ユーザーとのインターフェイスの一つである。必要なローカス数を算出した後、表示するために用いられる。
出力手段(プリンタ)17は、演算手段(CPU)11からの指示により、表示手段(ディスプレイ)16に表示した情報を印刷するために用いられる。
[必要なSNPs座位数を決定する方法]
本発明の「必要なSNPs座位数を決定する方法」は、以下の工程を備える、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法である。
本発明の「必要なSNPs座位数を決定する方法」は、以下の工程を備える、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法である。
〈実験結果入力工程S21〉
mを2以上の整数として、m個のSNPs座位を解析する先行実験により得られた、m個のSNPsの平均の変異頻度νおよびアレルドロップアウト率Θ%が入力手段(キーボード)14を介して入力され、記憶手段(メモリ)12に記憶される工程である(図4のS21)。
なお、本工程では、ハードウェアに対する入力手段として、入力補助手段(マウス)15を用いることも可能である。
mを2以上の整数として、m個のSNPs座位を解析する先行実験により得られた、m個のSNPsの平均の変異頻度νおよびアレルドロップアウト率Θ%が入力手段(キーボード)14を介して入力され、記憶手段(メモリ)12に記憶される工程である(図4のS21)。
なお、本工程では、ハードウェアに対する入力手段として、入力補助手段(マウス)15を用いることも可能である。
《SNPs座位の個数》
上記mは2以上の整数であれば特に限定されないが、先行実験として行われるものであることを考慮して、その個数が設定される。例えば、SNPs座位の個数としては、好ましくは10個以上であり、より好ましくは15個以上であり、さらに好ましくは20個以上である。
上記mは2以上の整数であれば特に限定されないが、先行実験として行われるものであることを考慮して、その個数が設定される。例えば、SNPs座位の個数としては、好ましくは10個以上であり、より好ましくは15個以上であり、さらに好ましくは20個以上である。
《変異頻度》
変異頻度νは0≦ν≦1である。本発明においては、好ましくは0.35<ν<0.65であり、より好ましくは0.40<ν<0.60であり、さらに好ましくは0.45<ν<0.55である。
変異頻度νは0≦ν≦1である。本発明においては、好ましくは0.35<ν<0.65であり、より好ましくは0.40<ν<0.60であり、さらに好ましくは0.45<ν<0.55である。
《アレルドロップアウト率》
アレルドロップアウト率(以下「ADO(allelic dropout)率」という場合がある。)Θ%は、通常、0%≦Θ%≦100%である。ADO率は低いほどよい。
アレルドロップアウト率(以下「ADO(allelic dropout)率」という場合がある。)Θ%は、通常、0%≦Θ%≦100%である。ADO率は低いほどよい。
〈目標性能入力工程S22〉
目標精度Ψ%が入力手段(キーボード)14を介して入力され、記憶手段(メモリ)12に記憶される工程である(図4のS22)。
目標精度Ψ%が入力手段(キーボード)14を介して入力され、記憶手段(メモリ)12に記憶される工程である(図4のS22)。
《目標精度》
目標精度Ψ%は特に限定されないが、好ましくは95.0%以上、より好ましくは99.0%以上、さらに好ましくは99.9%以上である。
目標精度Ψ%は特に限定されないが、好ましくは95.0%以上、より好ましくは99.0%以上、さらに好ましくは99.9%以上である。
〈必要SNPs座位数決定工程S25〉
演算手段(CPU)11が記憶手段(メモリ)12から、SNPs座位の個数m、変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率τを求め、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率υ=1を求め、
Φ=100×(υ-τ)を計算し、
mを1個ずつ増加してゆき、Φ≧Ψとなる最小のmを求め、必要なSNPs座位数Mとして記憶手段(メモリ)12に記憶する工程である(図4のS25)。
演算手段(CPU)11が記憶手段(メモリ)12から、SNPs座位の個数m、変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率τを求め、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率υ=1を求め、
Φ=100×(υ-τ)を計算し、
mを1個ずつ増加してゆき、Φ≧Ψとなる最小のmを求め、必要なSNPs座位数Mとして記憶手段(メモリ)12に記憶する工程である(図4のS25)。
必要SNPs座位数決定工程においては、演算手段が記憶手段から変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、下記式
M=h(ν,θ,ψ)=ceiling(χ)
χ=κlog(1-ψ)/log(1-ξ)
ξ=ν(1-ν)(1-θ)
ψ=Ψ/100
θ=Θ/100
によって、必要なSNPs座位数Mを算出することが好ましい。
ただし、ceiling(χ)は実数χに対してχ以上の最小の整数を表し、κは予め定められた1.0以上1.5以下の係数である。
M=h(ν,θ,ψ)=ceiling(χ)
χ=κlog(1-ψ)/log(1-ξ)
ξ=ν(1-ν)(1-θ)
ψ=Ψ/100
θ=Θ/100
によって、必要なSNPs座位数Mを算出することが好ましい。
ただし、ceiling(χ)は実数χに対してχ以上の最小の整数を表し、κは予め定められた1.0以上1.5以下の係数である。
〈結果表示工程S26〉
演算手段(CPU)11が、記憶手段(メモリ)12から、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を読み出し、表示手段(モニタ)に表示する工程である(図4のS26)。
さらに、入力手段(キーボード)14または補助入力手段(マウス)15からの指令により、出力手段(プリンタ)17から出力してもよい。
演算手段(CPU)11が、記憶手段(メモリ)12から、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を読み出し、表示手段(モニタ)に表示する工程である(図4のS26)。
さらに、入力手段(キーボード)14または補助入力手段(マウス)15からの指令により、出力手段(プリンタ)17から出力してもよい。
〈必要SNPs座位数決定工程における必要SNPs座位数の算出方法の詳細な説明〉
以下では、先行実験で解析を行ったSNPs座位数をm個(m≧20、mは整数)、そのm個のSNPsの変異頻度をν(0≦ν≦1)、アレルドロップアウト率(allelic dropout rate)をθ(0≦θ≦1)、および目標精度をψ(0<ψ≦1)とする。
以下では、先行実験で解析を行ったSNPs座位数をm個(m≧20、mは整数)、そのm個のSNPsの変異頻度をν(0≦ν≦1)、アレルドロップアウト率(allelic dropout rate)をθ(0≦θ≦1)、および目標精度をψ(0<ψ≦1)とする。
《母親の真のジェノタイプと胎児細胞のジェノタイプとの比較》
(アレルドロップアウト率0%である場合)
変異頻度νであるSNPs座位について、母親の真のジェノタイプと胎児細胞のジェノタイプが、
(1)ホモ-ホモで一致する確率 p11=1-3ν(1-ν);
(2)ヘテロ-ヘテロで一致する確率 p12=ν(1-ν);
(3)ヘテロ-ホモで不一致となる確率 p13=ν(1-ν);
(4)ホモ-ヘテロで不一致となる確率 p14=ν(1-ν);および
(5)ホモ-ホモで不一致となる確率 p15=0;
である。
(アレルドロップアウト率0%である場合)
変異頻度νであるSNPs座位について、母親の真のジェノタイプと胎児細胞のジェノタイプが、
(1)ホモ-ホモで一致する確率 p11=1-3ν(1-ν);
(2)ヘテロ-ヘテロで一致する確率 p12=ν(1-ν);
(3)ヘテロ-ホモで不一致となる確率 p13=ν(1-ν);
(4)ホモ-ヘテロで不一致となる確率 p14=ν(1-ν);および
(5)ホモ-ホモで不一致となる確率 p15=0;
である。
したがって、母親の真のジェノタイプと胎児細胞のジェノタイプとを比較した際に、χ個中k個のSNPs座位がホモ-ヘテロで不一致となる確率P14は、
P14=χCk・p14 k・(1-p14)χ-k
である。
SNPs座位の個数を確率変数Xで表すとき、確率変数Xはパラメータχ、p14の二項分布B(χ,p14)に従う。
P14=χCk・p14 k・(1-p14)χ-k
である。
SNPs座位の個数を確率変数Xで表すとき、確率変数Xはパラメータχ、p14の二項分布B(χ,p14)に従う。
(アレルドロップアウト率Θ%である場合)
アレルドロップアウト率がΘ%(Θ=100×θ)である場合、図5に示すように、真のジェノタイプがヘテロ(●○)である場合、みかけのジェノタイプは、(100-Θ)%がヘテロ(●○)となり、Θ%がホモ(●●および○○)となる。アレルドロップアウトに染色体に依存した偏りが無ければ、ホモ(●●)とホモ(○○)は、いずれもΘ/2%となる。
アレルドロップアウト率がΘ%(Θ=100×θ)である場合、図5に示すように、真のジェノタイプがヘテロ(●○)である場合、みかけのジェノタイプは、(100-Θ)%がヘテロ(●○)となり、Θ%がホモ(●●および○○)となる。アレルドロップアウトに染色体に依存した偏りが無ければ、ホモ(●●)とホモ(○○)は、いずれもΘ/2%となる。
したがって、アレルドロップアウト率Θ%を考慮に入れると、母親の真のジェノタイプと胎児細胞のジェノタイプが、ホモ-ヘテロで不一致となる確率q14は、
q14=ν(1-ν)(1-θ)
となる。ただし、θ=Θ/100である。
q14=ν(1-ν)(1-θ)
となる。ただし、θ=Θ/100である。
母親の真のジェノタイプと胎児細胞のジェノタイプとを比較した際に、χ個中k個のSNPs座位がホモ-ヘテロで不一致となる確率Q14は、
Q14=χCk・q14 k・(1-q14)χ-k
である。
Q14=χCk・q14 k・(1-q14)χ-k
である。
k=0、すなわち、χ個中0個のSNPs座位がホモ-ヘテロで不一致となる確率Q14|k=0は、
Q14|k=0=χC0・q14 0・(1-q14)χ=(1-q14)χ=(1-ξ)χ=τ(χ)
q14=ξ=ν(1-ν)(1-θ)
である。
Q14|k=0=χC0・q14 0・(1-q14)χ=(1-q14)χ=(1-ξ)χ=τ(χ)
q14=ξ=ν(1-ν)(1-θ)
である。
《母親の真のジェノタイプと母親細胞のジェノタイプとの比較》
(アレルドロップアウト率0%である場合)
変異頻度νであるSNPs座位について、母親の真のジェノタイプと胎児細胞のジェノタイプが、
(1)ホモ-ホモで一致する確率p21=ν2+(1-ν)2;
(2)ヘテロ-ヘテロで一致する確率p22=2ν(1-ν);
(3)ヘテロ-ホモで不一致となる確率p23=0;
(4)母親の真のジェノタイプと母親細胞のジェノタイプが、ホモ-ヘテロで不一致となる確率p24=0;および、
(5)母親の真のジェノタイプと母親細胞のジェノタイプが、ホモ-ホモで不一致となる確率p25=0
である。
(アレルドロップアウト率0%である場合)
変異頻度νであるSNPs座位について、母親の真のジェノタイプと胎児細胞のジェノタイプが、
(1)ホモ-ホモで一致する確率p21=ν2+(1-ν)2;
(2)ヘテロ-ヘテロで一致する確率p22=2ν(1-ν);
(3)ヘテロ-ホモで不一致となる確率p23=0;
(4)母親の真のジェノタイプと母親細胞のジェノタイプが、ホモ-ヘテロで不一致となる確率p24=0;および、
(5)母親の真のジェノタイプと母親細胞のジェノタイプが、ホモ-ホモで不一致となる確率p25=0
である。
したがって、母親の真のジェノタイプと母親細胞のジェノタイプとを比較した際に、χ個中k個のSNPs座位がホモ-ヘテロで一致する確率P24は、
P24=χCk・p24 k・(1-p24)χ-k
である。
SNPs座位の個数を確率変数Xで表すとき、確率変数Xはパラメータχ、p24の二項分布B(χ,p24)に従う。
P24=χCk・p24 k・(1-p24)χ-k
である。
SNPs座位の個数を確率変数Xで表すとき、確率変数Xはパラメータχ、p24の二項分布B(χ,p24)に従う。
なお、p24=0であるから、上記P24は、
P24=χCk・0k・1χ-k=χCk・0k
となる。
P24=χCk・0k・1χ-k=χCk・0k
となる。
(アレルドロップアウト率Θ%である場合)
アレルドロップアウト率がΘ%(Θ=100×θ)である場合、図5に示すように、真のジェノタイプがヘテロ(●○)である場合、みかけのジェノタイプは、(100-Θ)%がヘテロ(●○)となり、Θ%がホモ(●●および○○)となる。アレルドロップアウトに染色体に依存した偏りが無ければ、ホモ(●●)とホモ(○○)は、いずれもΘ/2%となる。
アレルドロップアウト率がΘ%(Θ=100×θ)である場合、図5に示すように、真のジェノタイプがヘテロ(●○)である場合、みかけのジェノタイプは、(100-Θ)%がヘテロ(●○)となり、Θ%がホモ(●●および○○)となる。アレルドロップアウトに染色体に依存した偏りが無ければ、ホモ(●●)とホモ(○○)は、いずれもΘ/2%となる。
母親の真のジェノタイプがホモである場合、アレルドロップアウトによって母親細胞のみかけのジェノタイプがヘテロとなることはないので、母親の真のジェノタイプと母親細胞のジェノタイプが、ホモ-ヘテロで不一致となる確率q24は、
q24=0
である。
q24=0
である。
母親の真のジェノタイプと母親細胞のジェノタイプとを比較した際に、χ個中k個のSNPs座位がホモ-ヘテロで不一致となる確率Q24は、
Q24=χCk・q14 k・(1-q24)χ-k
である。
Q24=χCk・q14 k・(1-q24)χ-k
である。
k=0、すなわち、χ個中0個のSNPs座位がホモ-ヘテロで不一致となる確率Q24|k=0は、
Q24|k=0=χC0・q24 0・(1-q24)χ=q24 0=00=1=υ(χ)
である。
∵00=1と定義した。
これより、母親の真のジェノタイプと母親細胞のジェノタイプが、m個中0個のSNPs座位でホモ-ヘテロで不一致となる確率は1となる。
Q24|k=0=χC0・q24 0・(1-q24)χ=q24 0=00=1=υ(χ)
である。
∵00=1と定義した。
これより、母親の真のジェノタイプと母親細胞のジェノタイプが、m個中0個のSNPs座位でホモ-ヘテロで不一致となる確率は1となる。
母子判別の精度Ψ(χ)は、
Ψ(χ)=100×(υ(χ)-τ(χ))=100×(1-τ(χ))=(1-(1-ξ)χ)
ξ=ν(1-ν)(1-θ)
である。
Ψ(χ)=100×(υ(χ)-τ(χ))=100×(1-τ(χ))=(1-(1-ξ)χ)
ξ=ν(1-ν)(1-θ)
である。
目標精度Ψ%(Ψ=100×ψ)として、目標精度を与えるSNPs座位数χは、上記式から、
ψ=1-(1-ξ)χ
であるから、
log(1-ξ)χ=log(1-ψ)より、
χ=log(1-ψ)/log(1-ξ)
となる。
なお、χには、係数κ(1.0≦κ≦1.5)を掛けてもよい。
必要なSNPs座位数Mは、
M=ceiling(χ)
によって求めることができる。
ψ=1-(1-ξ)χ
であるから、
log(1-ξ)χ=log(1-ψ)より、
χ=log(1-ψ)/log(1-ξ)
となる。
なお、χには、係数κ(1.0≦κ≦1.5)を掛けてもよい。
必要なSNPs座位数Mは、
M=ceiling(χ)
によって求めることができる。
[必要なSNPs数を決定する装置]
次に、本発明の必要なSNPs数を決定する方法を実行する装置について、図1を参照しながら説明する。
本発明の必要なSNPs数を決定する方法を実行する装置は、演算手段(CPU)11、記憶手段(メモリ)12、補助記憶手段(ストレージ)13、入力手段(キーボード)14、および表示手段(モニタ)16を備える。さらに、補助入力手段(マウス)15、および出力手段(プリンタ)17等を備えていてもよい。
それぞれの手段について説明する。
入力手段(キーボード)14は、装置に指示およびデータ等を入力する手段であり、実験結果および目標性能を入力するために用いられる。
補助入力手段(マウス)15は、入力手段(キーボード)14に代えて、またはそれとともに、用いられる。
演算手段(CPU)11は、演算処理を行う手段であり、各手段の制御、データの書込み、および読込み等の処理の他、必要なSNPs座位数を算出するために用いられる。
記憶手段(メモリ)12は、演算手段(CPU)11の演算処理の結果を記憶したり、入力手段(キーボード)14からの入力を記憶したりするために用いられる。
補助記憶手段(ストレージ)13は、オペレーティングシステム、必要なSNPs座位数を決定するためのプログラムなどを保存するストレージである。その一部を記憶手段を拡張するために用いることもできる。
表示手段(ディスプレイ)16は、ユーザーとのインターフェイスの一つである。必要なSNPs数を算出した後、表示するために用いられる。
出力手段(プリンタ)17は、演算手段(CPU)11からの指示により、表示手段(ディスプレイ)16に表示した情報を印刷するために用いられる。
次に、本発明の必要なSNPs数を決定する方法を実行する装置について、図1を参照しながら説明する。
本発明の必要なSNPs数を決定する方法を実行する装置は、演算手段(CPU)11、記憶手段(メモリ)12、補助記憶手段(ストレージ)13、入力手段(キーボード)14、および表示手段(モニタ)16を備える。さらに、補助入力手段(マウス)15、および出力手段(プリンタ)17等を備えていてもよい。
それぞれの手段について説明する。
入力手段(キーボード)14は、装置に指示およびデータ等を入力する手段であり、実験結果および目標性能を入力するために用いられる。
補助入力手段(マウス)15は、入力手段(キーボード)14に代えて、またはそれとともに、用いられる。
演算手段(CPU)11は、演算処理を行う手段であり、各手段の制御、データの書込み、および読込み等の処理の他、必要なSNPs座位数を算出するために用いられる。
記憶手段(メモリ)12は、演算手段(CPU)11の演算処理の結果を記憶したり、入力手段(キーボード)14からの入力を記憶したりするために用いられる。
補助記憶手段(ストレージ)13は、オペレーティングシステム、必要なSNPs座位数を決定するためのプログラムなどを保存するストレージである。その一部を記憶手段を拡張するために用いることもできる。
表示手段(ディスプレイ)16は、ユーザーとのインターフェイスの一つである。必要なSNPs数を算出した後、表示するために用いられる。
出力手段(プリンタ)17は、演算手段(CPU)11からの指示により、表示手段(ディスプレイ)16に表示した情報を印刷するために用いられる。
[マルチプレックスPCRに供するプライマーの設計]
必要ローカス数または必要SNPs座位数を決定した後、以下に説明する方法により、マルチプレックスPCRに供するプライマーを設計してもよい。なお、以下では、領域をローカスまたはSNPs座位と読み替える。
必要ローカス数または必要SNPs座位数を決定した後、以下に説明する方法により、マルチプレックスPCRに供するプライマーを設計してもよい。なお、以下では、領域をローカスまたはSNPs座位と読み替える。
〈目的領域をPCR増幅するためのプライマーの設計方法の第1の態様〉
本発明において、目的領域をPCR増幅するためのプライマーの設計方法の第1の態様は、以下の工程を含む。なお、以下の説明では、適宜図6を参照する。
本発明において、目的領域をPCR増幅するためのプライマーの設計方法の第1の態様は、以下の工程を含む。なお、以下の説明では、適宜図6を参照する。
(a)目的領域から対象領域を選択する、対象領域選択工程(図6のS101)。
(b)上記対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成工程(図6のS102)。
(c)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント工程(図6のS103)。
(d)上記ローカルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜工程(図6のS104)。
(e)上記第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程(図6のS105)。
(f)上記グローバルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜工程(図6のS106)。
(g)上記第一段階選抜工程および上記第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用工程(図6のS107)。
(b)上記対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成工程(図6のS102)。
(c)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント工程(図6のS103)。
(d)上記ローカルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜工程(図6のS104)。
(e)上記第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程(図6のS105)。
(f)上記グローバルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜工程(図6のS106)。
(g)上記第一段階選抜工程および上記第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用工程(図6のS107)。
ただし、上記(a)工程~上記(g)工程のうち、上記(c)工程および上記(d)工程の両工程と、上記(e)工程および上記(f)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c)工程および上記(d)工程を行った後、上記(e)工程および上記(f)工程を行ってもよいし、上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行ってもよいし、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行ってもよい。
上記(e)工程および上記(f)工程を行った後、上記(c)工程および上記(d)工程を行う場合には、上記(e)工程および上記(c)工程は、それぞれ、下記(e’)工程および下記(c’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程。
(c’)上記第二段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント工程。
また、上記(c)工程および上記(d)工程と、上記(e)工程および上記(f)工程とを、並行して行う場合には、上記(e)工程は、下記(e’)工程とすることが好ましい。
(e’)上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント工程。
さらにプライマーを設計する場合は、プライマー候補の塩基配列が作成されていれば、(c)ローカルアラインメント工程(図6のS103)から、作成されていなければ、(b)プライマー候補塩基配列作成工程(図6のS102)または(a)対象領域選択工程(図6のS101)から、プライマーを設計する(図6のS108、S109、およびS110)。
〈目的領域をPCR増幅するためのプライマーの設計方法の第2の態様〉
本発明において、目的領域をPCR増幅するためのプライマーの設計方法の第2の態様は、以下の工程を含む。なお、以下の説明では、適宜図7を参照する。
本発明において、目的領域をPCR増幅するためのプライマーの設計方法の第2の態様は、以下の工程を含む。なお、以下の説明では、適宜図7を参照する。
(a1)目的領域から第1の対象領域を選択する、対象領域選択第1工程(図7のS201)。
(b1)上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第1の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成第1工程(図7のS202)。
(c1)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第1工程(図7のS203)。
(d1)上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜第1工程(図7のS204)。
(e1)上記第一段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程(図7のS205)。
(f1)上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜第1工程(図7のS206)。
(g1)上記第一段階選抜第1工程および上記第二段階選抜第1工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用第1工程(図7のS207)。
(b1)上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第1の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成第1工程(図7のS202)。
(c1)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第1工程(図7のS203)。
(d1)上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜第1工程(図7のS204)。
(e1)上記第一段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程(図7のS205)。
(f1)上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜第1工程(図7のS206)。
(g1)上記第一段階選抜第1工程および上記第二段階選抜第1工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用第1工程(図7のS207)。
ただし、上記(a1)工程~上記(g1)工程のうち、上記(c1)工程および上記(d1)工程の両工程と、上記(e1)工程および上記(f1)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c1)工程および上記(d1)工程を行った後、上記(e1)工程および上記(f1)工程を行ってもよいし、上記(e1)工程および上記(f1)工程を行った後、上記(c1)工程および上記(d1)工程を行ってもよいし、上記(c1)工程および上記(d1)工程と、上記(e1)工程および上記(f1)工程とを、並行して行ってもよい。
上記(e1)工程および上記(f1)工程を行った後、上記(c1)工程および上記(d1)工程を行う場合には、上記(e1)工程および上記(c1)工程は、それぞれ、下記(e1’)工程および下記(c1’)工程とすることが好ましい。
(e1’)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程。
(c1’)上記第二段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第1工程。
また、上記(c1)工程および上記(d1)工程と、上記(e1)工程および上記(f1)工程とを、並行して行う場合には、上記(e1)工程は、下記(e1’)工程とすることが好ましい。
(e1’)上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第1工程。
(a2)目的領域から上記第1の対象領域とは異なる第2の対象領域を選択する、対象領域選択第2工程(図7のS211)。
(b2)上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第2の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成第2工程(図7のS212)。
(c2)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第2工程(図7のS213)。
(d2)上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜第2工程(図7のS214)。
(e2)上記第一段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程(図7のS215)。
(f2)上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜第2工程(図7のS216)。
(g2)上記第一段階選抜第2工程および上記第二段階選抜第2工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用第2工程(図7のS217)。
(b2)上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第2の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する、プライマー候補塩基配列作成第2工程(図7のS212)。
(c2)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第2工程(図7のS213)。
(d2)上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第一段階選抜第2工程(図7のS214)。
(e2)上記第一段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程(図7のS215)。
(f2)上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第二段階選抜第2工程(図7のS216)。
(g2)上記第一段階選抜第2工程および上記第二段階選抜第2工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、プライマー採用第2工程(図7のS217)。
ただし、上記(a2)工程~上記(g2)工程のうち、上記(c2)工程および上記(d2)工程の両工程と、上記(e2)工程および上記(f2)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c2)工程および上記(d2)工程を行った後、上記(e2)工程および上記(f2)工程を行ってもよいし、上記(e2)工程および上記(f2)工程を行った後、上記(c2)工程および上記(d2)工程を行ってもよいし、上記(c2)工程および上記(d2)工程と、上記(e2)工程および上記(f2)工程とを、並行して行ってもよい。
上記(e2)工程および上記(f2)工程を行った後、上記(c2)工程および上記(d2)工程を行う場合には、上記(e2)工程および上記(c2)工程は、それぞれ、下記(e2’)工程および下記(c2’)工程とすることが好ましい。
(e2’)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程。
(c2’)上記第二段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、ローカルアラインメント第2工程。
また、上記(c2)工程および上記(d2)工程と、上記(e2)工程および上記(f2)工程とを、並行して行う場合には、上記(e2)工程は、下記(e2’)工程とすることが好ましい。
(e2’)上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、グローバルアラインメント第2工程。
さらにプライマーを設計する場合は、(a2)対象領域選択第2工程(図7のS211)から(g2)プライマー採用第2工程(図7のS217)までを繰り返す(図7のS208)。すなわち、3つ以上の目的領域を含む場合であって、当該3つ以上の目的領域からまだ選択されていない第3以降の対象領域に対してプライマーを設計するときは、当該第3以降の対象領域について、上記(a2)工程~上記(g2)工程までの各工程を繰り返す。
〈目的領域をPCR増幅するためのプライマーの設計方法の第3の態様〉
目的領域をPCR増幅するためのプライマーの設計方法の第3の態様は、以下の工程を含む。なお、以下の説明では、適宜図8を参照する。
目的領域をPCR増幅するためのプライマーの設計方法の第3の態様は、以下の工程を含む。なお、以下の説明では、適宜図8を参照する。
(a-0)目的領域から複数の対象領域を選択する、対象領域複数選択工程(図8のS301)。
(b-0)上記複数の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記複数の対象領域のそれぞれの両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成するプライマー候補塩基配列複数作成工程(図8のS302)。
(b-0)上記複数の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記複数の対象領域のそれぞれの両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成するプライマー候補塩基配列複数作成工程(図8のS302)。
(c-1)上記対象領域複数選択工程において選択した複数の対象領域のうち1つを第1の対象領域とし、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、第1のローカルアラインメント工程(図8のS303)。
(d-1)上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第1の第一段階選抜工程(図8のS304)。
(e-1)上記第1の第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程(図8のS305)。
(f-1)上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第1の第二段階選抜工程(図8のS306)。
(g-1)上記第1の第一段階選抜工程および上記第1の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、第1のプライマー採用工程(図8のS307)。
(d-1)上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第1の第一段階選抜工程(図8のS304)。
(e-1)上記第1の第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程(図8のS305)。
(f-1)上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第1の第二段階選抜工程(図8のS306)。
(g-1)上記第1の第一段階選抜工程および上記第1の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、第1のプライマー採用工程(図8のS307)。
ただし、上記(c-1)工程~上記(g-1)工程のうち、上記(c-1)工程および上記(d-1)工程の両工程と、上記(e-1)工程および上記(f-1)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c-1)工程および上記(d-1)工程を行った後、上記(e-1)工程および上記(f-1)工程を行ってもよいし、上記(e-1)工程および上記(f-1)工程を行った後、上記(c-1)工程および上記(d-1)工程を行ってもよいし、上記(c-1)工程および上記(d-1)工程と、上記(e-1)工程および上記(f-1)工程とを、並行して行ってもよい。
上記(e-1)工程および上記(f-1)工程を行った後、上記(c-1)工程および上記(d-1)工程を行う場合には、上記(e-1)工程および上記(c-1)工程は、それぞれ、下記(e’-1)工程および下記(c’-1)工程とすることが好ましい。
(e’-1)上記対象領域複数選択工程において選択した複数の対象領域のうち1つを第1の対象領域とし、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程。
(c’-1)上記第1の第二段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める、第1のローカルアラインメント工程。
また、上記(c-1)工程および上記(d-1)工程と、上記(e-1)工程および上記(f-1)工程とを、並行して行う場合には、上記(e-1)工程は、下記(e’-1)工程とすることが好ましい。
(e’-1)上記対象領域複数選択工程において選択した複数の対象領域のうち1つを第1の対象領域とし、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める、第1のグローバルアラインメント工程。
(c-2)上記対象領域複数選択工程において選択した複数の対象領域のうち、上記第1の対象領域を除く1つを第2の対象領域とし、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める、第2のローカルアラインメント工程(図8のS313)。
(d-2)上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第2の第一段階選抜工程(図8のS314)。
(e-2)上記第2の第一段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程(図8のS315)。
(f-2)上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第2の第二段階選抜工程(図8のS316)。
(g-2)上記第2の第一段階選抜工程および上記第2の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、第2のプライマー採用工程(図8のS317)。
(d-2)上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う、第2の第一段階選抜工程(図8のS314)。
(e-2)上記第2の第一段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程(図8のS315)。
(f-2)上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う、第2の第二段階選抜工程(図8のS316)。
(g-2)上記第2の第一段階選抜工程および上記第2の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する、第2のプライマー採用工程(図8のS317)。
ただし、上記(c-2)工程~上記(g-2)工程のうち、上記(c-2)工程および上記(d-2)工程の両工程と、上記(e-2)工程および上記(f-2)工程の両工程とは、任意の順序または同時であってもよい。すなわち、上記(c-2)工程および上記(d-2)工程を行った後、上記(e-2)工程および上記(f-2)工程を行ってもよいし、上記(e-2)工程および上記(f-2)工程を行った後、上記(c-2)工程および上記(d-2)工程を行ってもよいし、上記(c-2)工程および上記(d-2)工程と、上記(e-2)工程および上記(f-2)工程とを、並行して行ってもよい。
上記(e-2)工程および上記(f-2)工程を行った後、上記(c-2)工程および上記(d-2)工程を行う場合には、上記(e-2)工程および上記(c-2)工程は、それぞれ、下記(e’-2)工程および下記(c’-2)工程とすることが好ましい。
(e’-2)上記対象領域複数選択工程において選択した複数の対象領域のうち、上記第1の対象領域を除く1つを第2の対象領域とし、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程。
(c’-2)上記第2の第二段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める、第2のローカルアラインメント工程。
また、上記(c-2)工程および上記(d-2)工程と、上記(e-2)工程および上記(f-2)工程とを、並行して行う場合には、上記(e-2)工程は、下記(e’-2)工程とすることが好ましい。
(e’-2)上記対象領域複数選択工程において選択した複数の対象領域のうち、上記第1の対象領域を除く1つを第2の対象領域とし、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める、第2のグローバルアラインメント工程。
さらに、上記少なくとも1つの目的領域が3つ以上の目的領域を含み、上記対象領域複数選択工程において3つ以上の対象領域を選択し、かつ、上記プライマー候補塩基配列複数作成工程において上記3つ以上の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を作成した場合であって、上記対象領域複数選択工程において選択した複数の対象領域のうち、上記第1および第2の対象領域を除く1つを第3の対象領域とし、上記第3以降の対象領域をPCR増幅するためのプライマーの塩基配列を採用するときは、上記第3以降の対象領域について、上記第2のローカルアラインメント工程から上記第2のプライマー採用工程までの各工程を繰り返す。
〈各工程の説明〉
目的領域をPCR増幅するためのプライマーの設計方法の第1~第3の態様について、適宜、図6~図8を参照しながら、各工程を説明する。
目的領域をPCR増幅するためのプライマーの設計方法の第1~第3の態様について、適宜、図6~図8を参照しながら、各工程を説明する。
《対象領域選択工程》
本明細書において、対象領域選択工程S101(図6)、対象領域選択第1工程S201および対象領域選択第2工程S211(図7)、ならびに対象領域複数選択工程S301(図8)を総称して、単に「対象領域選択工程」という場合がある。
本明細書において、対象領域選択工程S101(図6)、対象領域選択第1工程S201および対象領域選択第2工程S211(図7)、ならびに対象領域複数選択工程S301(図8)を総称して、単に「対象領域選択工程」という場合がある。
(第1の態様: 対象領域選択工程S101)
図6において「対象領域選択」(S101)として示す。
第1の態様において、(a)対象領域選択工程は、目的領域から対象領域を選択する工程である。選択の方法は特に限定されないが、例えば、目的領域にプライマー設計の優先順位が付けられている場合は、その優先順位が示す順序に従って、目的領域からプライマーを設計する対象領域を選択する。
図6において「対象領域選択」(S101)として示す。
第1の態様において、(a)対象領域選択工程は、目的領域から対象領域を選択する工程である。選択の方法は特に限定されないが、例えば、目的領域にプライマー設計の優先順位が付けられている場合は、その優先順位が示す順序に従って、目的領域からプライマーを設計する対象領域を選択する。
(第2の態様: 対象領域選択第1工程S201および対象領域選択第2工程S211)
図7において、「対象領域選択第1」(S201)および「対象領域選択第2」(S211)として示す。
第2の態様において、(a1)対象領域選択第1工程は、目的領域から第1の対象領域を選択する工程であり、(a2)対象領域選択第2工程は、まだ対象領域として選択されていない目的領域から第2の対象領域を選択する工程である。選択の方法は特に限定されないが、例えば、目的領域にプライマー設計の優先順位が付けられている場合は、その優先順位が示す順序に従って、目的領域からプライマーを設計する対象領域を選択する。
図7において、「対象領域選択第1」(S201)および「対象領域選択第2」(S211)として示す。
第2の態様において、(a1)対象領域選択第1工程は、目的領域から第1の対象領域を選択する工程であり、(a2)対象領域選択第2工程は、まだ対象領域として選択されていない目的領域から第2の対象領域を選択する工程である。選択の方法は特に限定されないが、例えば、目的領域にプライマー設計の優先順位が付けられている場合は、その優先順位が示す順序に従って、目的領域からプライマーを設計する対象領域を選択する。
(第3の態様: 対象領域複数選択工程S301)
図8において、「対象領域複数選択」(S301)として示す。
第3の態様において、(a-0)対象領域複数選択工程は、目的領域から複数の対象領域を選択する工程である。選択の方法は特に限定されないが、例えば、目的領域にプライマー設計の優先順位が付けられている場合は、その優先順位が示す順序に従って、目的領域からプライマーを設計する対象領域を複数選択する。
図8において、「対象領域複数選択」(S301)として示す。
第3の態様において、(a-0)対象領域複数選択工程は、目的領域から複数の対象領域を選択する工程である。選択の方法は特に限定されないが、例えば、目的領域にプライマー設計の優先順位が付けられている場合は、その優先順位が示す順序に従って、目的領域からプライマーを設計する対象領域を複数選択する。
《プライマー候補塩基配列作成工程》
本明細書において、プライマー候補塩基配列作成工程S102(図6)、プライマー候補塩基配列作成第1工程S202およびプライマー候補塩基配列作成第2工程S212(図7)、ならびにプライマー候補塩基配列複数作成工程S302(図8)を総称して、単に「プライマー候補塩基配列作成工程」という場合がある。
本明細書において、プライマー候補塩基配列作成工程S102(図6)、プライマー候補塩基配列作成第1工程S202およびプライマー候補塩基配列作成第2工程S212(図7)、ならびにプライマー候補塩基配列複数作成工程S302(図8)を総称して、単に「プライマー候補塩基配列作成工程」という場合がある。
(第1の態様: プライマー候補塩基配列作成工程S102)
図6において「プライマー候補塩基配列作成」(S102)として示す。
第1の態様において、(b)プライマー候補塩基配列作成工程は、対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程である。
図6において「プライマー候補塩基配列作成」(S102)として示す。
第1の態様において、(b)プライマー候補塩基配列作成工程は、対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程である。
(第2の態様: プライマー候補塩基配列作成第1工程S202およびプライマー候補塩基配列作成第2工程S212)
図7において「プライマー候補塩基配列作成第1」(S202)および「プライマー候補塩基配列作成第2」(S212)として示す。
第2の態様において、(b1)プライマー候補塩基配列作成第1工程は、第1の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第1の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程であり、(b2)プライマー候補塩基配列作成第2工程は、第2の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第2の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程である。
第2の態様では1つの対象領域について、プライマー候補の塩基配列の作成、プライマー候補の選抜、およびプライマーの採用を行い、次の1つの対象領域について、同様の工程を繰り返す。
図7において「プライマー候補塩基配列作成第1」(S202)および「プライマー候補塩基配列作成第2」(S212)として示す。
第2の態様において、(b1)プライマー候補塩基配列作成第1工程は、第1の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第1の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程であり、(b2)プライマー候補塩基配列作成第2工程は、第2の対象領域をPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記第2の対象領域の両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する工程である。
第2の態様では1つの対象領域について、プライマー候補の塩基配列の作成、プライマー候補の選抜、およびプライマーの採用を行い、次の1つの対象領域について、同様の工程を繰り返す。
(第3の態様: プライマー候補塩基配列複数作成工程S302)
図8において「プライマー候補塩基配列複数作成」(S302)として示す。
第3の態様において、(b-0)プライマー候補塩基配列複数作成工程は、複数の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記複数の対象領域のそれぞれの両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する。
第3の態様では、複数の対象領域のすべてについて、プライマー候補の塩基配列を作成し、以降の工程で選抜および採用を繰り返す。
図8において「プライマー候補塩基配列複数作成」(S302)として示す。
第3の態様において、(b-0)プライマー候補塩基配列複数作成工程は、複数の対象領域のそれぞれをPCR増幅するためのプライマー候補の塩基配列を、ゲノムDNA上における上記複数の対象領域のそれぞれの両端のそれぞれの近傍領域の塩基配列に基づいて、それぞれ、少なくとも1つずつ作成する。
第3の態様では、複数の対象領域のすべてについて、プライマー候補の塩基配列を作成し、以降の工程で選抜および採用を繰り返す。
(近傍領域)
対象領域の両端のそれぞれの近傍領域とは、対象領域の5’端から外側の領域、および対象領域の3’端から外側の領域を総称していう。対象領域の内側は近傍領域には含まない。
近傍領域の長さは特に限定されないが、PCRによって伸張可能な長さ以下であることが好ましく、増幅を所望するDNAフラグメント長の上限以下であることがより好ましい。特に、濃縮選択および/またはシーケンスリードがかかりやすい長さであることが好ましい。PCRにおいて用いる酵素(DNAポリメラーゼ)の種類等によって、適宜変更してもよい。具体的な近傍領域の長さは、好ましくは20~500塩基程度、より好ましくは20~300塩基程度、さらに好ましくは20~200塩基程度、いっそう好ましくは50~200塩基程度である。
対象領域の両端のそれぞれの近傍領域とは、対象領域の5’端から外側の領域、および対象領域の3’端から外側の領域を総称していう。対象領域の内側は近傍領域には含まない。
近傍領域の長さは特に限定されないが、PCRによって伸張可能な長さ以下であることが好ましく、増幅を所望するDNAフラグメント長の上限以下であることがより好ましい。特に、濃縮選択および/またはシーケンスリードがかかりやすい長さであることが好ましい。PCRにおいて用いる酵素(DNAポリメラーゼ)の種類等によって、適宜変更してもよい。具体的な近傍領域の長さは、好ましくは20~500塩基程度、より好ましくは20~300塩基程度、さらに好ましくは20~200塩基程度、いっそう好ましくは50~200塩基程度である。
(プライマーの設計パラメータ)
また、プライマー候補の塩基配列を作成する際には、プライマーの長さ、GC含量(全核酸塩基中のグアニン(G)およびシトシン(C)の合計モル百分率をいう。)、融解温度(2本鎖DNAの50%が解離して1本鎖DNAになる温度をいう。また、Melting Temperatureに由来し、「Tm値」という場合もある。単位は「℃」である。)、および配列の偏りなど、一般的なプライマーの設計方法において留意する点は同じである。
また、プライマー候補の塩基配列を作成する際には、プライマーの長さ、GC含量(全核酸塩基中のグアニン(G)およびシトシン(C)の合計モル百分率をいう。)、融解温度(2本鎖DNAの50%が解離して1本鎖DNAになる温度をいう。また、Melting Temperatureに由来し、「Tm値」という場合もある。単位は「℃」である。)、および配列の偏りなど、一般的なプライマーの設計方法において留意する点は同じである。
・プライマーの長さ
プライマーの長さ(ヌクレオチド数)は、特に限定されないが、好ましくは15mer~45mer、より好ましくは20mer~45mer、さらに好ましくは20mer~30merである。プライマーの長さがこの範囲内であると、特異性および増幅効率に優れるプライマーを設計しやすい。
プライマーの長さ(ヌクレオチド数)は、特に限定されないが、好ましくは15mer~45mer、より好ましくは20mer~45mer、さらに好ましくは20mer~30merである。プライマーの長さがこの範囲内であると、特異性および増幅効率に優れるプライマーを設計しやすい。
・プライマーのGC含量
プライマーのGC含量は、特に限定されないが、好ましくは40モル%~60モル%、より好ましくは45モル%~55モル%である。GC含量がこの範囲内であると、高次構造に起因する特異性および増幅効率の低下の問題が生じにくい。
プライマーのGC含量は、特に限定されないが、好ましくは40モル%~60モル%、より好ましくは45モル%~55モル%である。GC含量がこの範囲内であると、高次構造に起因する特異性および増幅効率の低下の問題が生じにくい。
・プライマーのTm値
プライマーのTm値は、特に限定されないが、好ましくは50℃~65℃の範囲内、より好ましくは55℃~65℃の範囲内である。
プライマーのTm値の差は、プライマーペアおよびプライマーセットにおいて、好ましくは5℃以下、より好ましくは3℃以下とする。
Tm値は、OLIGO Primer Analysis Software(Molecular Biology Insights社製)、または、Primer3(http://www-genome.wi.mit.edu/ftp/distribution/software/)等のソフトウエアを用いて計算することができる。
また、プライマーの塩基配列中のA、T、GおよびCの数(それぞれ、nA、nT、nGおよびnCとする)から、下記式によって計算により求めることもできる。
Tm値(℃)=2(nA+nT)+4(nC+nG)
Tm値の算出方法はこれらに限定されず、従来公知の種々の方法によってTm値を算出することができる。
プライマーのTm値は、特に限定されないが、好ましくは50℃~65℃の範囲内、より好ましくは55℃~65℃の範囲内である。
プライマーのTm値の差は、プライマーペアおよびプライマーセットにおいて、好ましくは5℃以下、より好ましくは3℃以下とする。
Tm値は、OLIGO Primer Analysis Software(Molecular Biology Insights社製)、または、Primer3(http://www-genome.wi.mit.edu/ftp/distribution/software/)等のソフトウエアを用いて計算することができる。
また、プライマーの塩基配列中のA、T、GおよびCの数(それぞれ、nA、nT、nGおよびnCとする)から、下記式によって計算により求めることもできる。
Tm値(℃)=2(nA+nT)+4(nC+nG)
Tm値の算出方法はこれらに限定されず、従来公知の種々の方法によってTm値を算出することができる。
・プライマーの塩基の偏り
プライマー候補の塩基配列は、全体的に塩基の偏りがない配列にすることが好ましい。例えば、部分的にGCリッチな配列および部分的にATリッチな配列を避けることが望ましい。
また、Tおよび/またはCの連続(ポリピリミジン)、ならびにAおよび/またはGの連続(ポリプリン)も避けることが望ましい。
プライマー候補の塩基配列は、全体的に塩基の偏りがない配列にすることが好ましい。例えば、部分的にGCリッチな配列および部分的にATリッチな配列を避けることが望ましい。
また、Tおよび/またはCの連続(ポリピリミジン)、ならびにAおよび/またはGの連続(ポリプリン)も避けることが望ましい。
・プライマーの3’末端
さらに、3’末端塩基配列が、GCリッチな配列またはATリッチな配列を避けることが好ましい。3’末端塩基はGまたはCが好ましいが、これらに限定はされない。
さらに、3’末端塩基配列が、GCリッチな配列またはATリッチな配列を避けることが好ましい。3’末端塩基はGまたはCが好ましいが、これらに限定はされない。
《特異性チェック工程》
「プライマー候補塩基配列作成工程」において作成した各プライマー候補の塩基配列の染色体DNAに対する配列相補性に基づいて、プライマー候補の塩基配列の特異性を評価する特異性チェック工程を実施してもよい(図示せず)。
特異性のチェックは、染色体DNAの塩基配列とプライマー候補の塩基配列とのローカルアラインメントを行い、ローカルアラインメント・スコアが予め設定した値未満である場合には、そのプライマー候補の塩基配列はゲノムDNAに対する相補性が低く、特異性が高いと評価することができる。ここで、ローカルアラインメントは、染色体DNAの相補鎖についても行うことが望ましい。プライマーが1本鎖DNAであるのに対して、染色体DNAは2本鎖だからである。また、プライマー候補の塩基配列の代わりに、これと相補的な塩基配列を用いてもよい。
「プライマー候補塩基配列作成工程」において作成した各プライマー候補の塩基配列の染色体DNAに対する配列相補性に基づいて、プライマー候補の塩基配列の特異性を評価する特異性チェック工程を実施してもよい(図示せず)。
特異性のチェックは、染色体DNAの塩基配列とプライマー候補の塩基配列とのローカルアラインメントを行い、ローカルアラインメント・スコアが予め設定した値未満である場合には、そのプライマー候補の塩基配列はゲノムDNAに対する相補性が低く、特異性が高いと評価することができる。ここで、ローカルアラインメントは、染色体DNAの相補鎖についても行うことが望ましい。プライマーが1本鎖DNAであるのに対して、染色体DNAは2本鎖だからである。また、プライマー候補の塩基配列の代わりに、これと相補的な塩基配列を用いてもよい。
また、プライマー候補の塩基配列をクエリー配列として、ゲノムDNA塩基配列データベースに対して相同性検索をしてもよい。相同性検索ツールとしては、例えば、BLAST(Basic Local Alignment Search Tool:ブラスト)(Altschul, S. A.、外4名、“Basic Local Alignment Search Tool”、Journal of Molecular Biology、1990年、10月、第215巻、p.403-410)およびFASTA(ファストエー)(Pearson, W. R.、外1名、“Improved tools for biological sequence comparison”、米国科学アカデミー紀要、米国科学アカデミー、1988年、4月、第85巻、p.2444-2448)等が挙げられる。相同性検索を行った結果として、ローカルアラインメントを得ることができる。
スコア、およびローカルアラインメント・スコアの閾値は、いずれも、特に限定されず、プライマー候補の塩基配列の長さ、および/またはPCR条件等によって、適宜設定することができる。相同性検索ツールを使用する場合には、その相同性検索ツールの既定値を使ってもよい。
例えば、スコアとして、マッチ(相補塩基)=+1、ミスマッチ(非相補塩基)=-1、インデル(挿入および/または欠失)=-3を採用し、閾値を+15に設定すること等が考えられる。
例えば、スコアとして、マッチ(相補塩基)=+1、ミスマッチ(非相補塩基)=-1、インデル(挿入および/または欠失)=-3を採用し、閾値を+15に設定すること等が考えられる。
プライマー候補の塩基配列が染色体DNA上の想定外の位置の塩基配列と相補性を有し、特異性が低い場合には、その塩基配列のプライマーを用いてPCRを行った際に、対象領域ではなくアーティファクトを増幅する場合があるため、除外する。
《ローカルアラインメント工程》
本明細書において、ローカルアラインメント工程S103(図6)、ローカルアラインメント第1工程S203およびローカルアラインメント第2工程S213(図7)、ならびに第1のローカルアラインメント工程S303および第2のローカルアラインメント工程S313(図8)を総称して、単に「ローカルアラインメント工程」という場合がある。
本明細書において、ローカルアラインメント工程S103(図6)、ローカルアラインメント第1工程S203およびローカルアラインメント第2工程S213(図7)、ならびに第1のローカルアラインメント工程S303および第2のローカルアラインメント工程S313(図8)を総称して、単に「ローカルアラインメント工程」という場合がある。
(第1の態様: ローカルアラインメント工程S103)
図6において「ローカルアラインメント」(S103)として示す。
第1の態様において、(c)ローカルアラインメント工程は、上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程である。
図6において「ローカルアラインメント」(S103)として示す。
第1の態様において、(c)ローカルアラインメント工程は、上記プライマー候補塩基配列作成工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程である。
(第2の態様: ローカルアラインメント第1工程S203およびローカルアラインメント第2工程S213)
図7において「ローカルアラインメント第1」(S203)および「ローカルアラインメント第2」(S213)として示す。
第2の態様において、(c1)ローカルアラインメント第1工程は、上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程であり、(c2)ローカルアラインメント第2工程は、上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程である。
図7において「ローカルアラインメント第1」(S203)および「ローカルアラインメント第2」(S213)として示す。
第2の態様において、(c1)ローカルアラインメント第1工程は、上記プライマー候補塩基配列作成第1工程において作成されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程であり、(c2)ローカルアラインメント第2工程は、上記プライマー候補塩基配列作成第2工程において作成されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程である。
(第3の態様: 第1のローカルアラインメント工程S303および第2のローカルアラインメント工程S313)
図8において「第1のローカルアラインメント」(S303)および「第2のローカルアラインメント」(S313)として示す。
第3の態様において、(c-1)第1のローカルアラインメント工程は、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程であり、(c-2)第2のローカルアラインメント工程は、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める工程である。
図8において「第1のローカルアラインメント」(S303)および「第2のローカルアラインメント」(S313)として示す。
第3の態様において、(c-1)第1のローカルアラインメント工程は、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、第1の対象領域をPCR増幅するためのプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行ってローカルアラインメント・スコアを求める工程であり、(c-2)第2のローカルアラインメント工程は、上記プライマー候補塩基配列複数作成工程において作成されたプライマー候補の塩基配列のうち、第2の対象領域をPCR増幅するためのプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列に対して、その比較する部分配列が上記2つの塩基配列の3’末端を含むという条件の下に、ペアワイズにローカルアラインメントを行って、ローカルアラインメント・スコアを求める工程である。
(ローカルアラインメントの方法)
ローカルアラインメントを行う塩基配列の組合せは、重複を許して選択した組合せであってもよいし、重複を許さず選択した組合せであってもよいが、同一塩基配列のプライマー間でのプライマー・ダイマー形成性をまだ評価していない場合には、重複を許して選択した組合せが好ましい。
組合せの総数は、ローカルアラインメントを行う塩基配列の総数をp個として、重複を許して選択した場合は、「pH2=p+1C2=(p+1)!/2(p-1)!」通りであり、重複を許さず選択した場合は、「pC2=p(p-1)/2」通りである。
ローカルアラインメントを行う塩基配列の組合せは、重複を許して選択した組合せであってもよいし、重複を許さず選択した組合せであってもよいが、同一塩基配列のプライマー間でのプライマー・ダイマー形成性をまだ評価していない場合には、重複を許して選択した組合せが好ましい。
組合せの総数は、ローカルアラインメントを行う塩基配列の総数をp個として、重複を許して選択した場合は、「pH2=p+1C2=(p+1)!/2(p-1)!」通りであり、重複を許さず選択した場合は、「pC2=p(p-1)/2」通りである。
ローカルアラインメントは、部分配列に対して行うアラインメントであり、相補性の高い部分を局所的に調べることができる。
ただし、本発明においては、通常、塩基配列に対して行われているローカルアラインメントとは異なり、「比較する部分配列が塩基配列の3’末端を含む」という条件の下で、ローカルアラインメントを行うこととして、比較する部分配列が両方の塩基配列の3’末端を含むようにした。
さらに、本発明においては、「比較する部分配列が、塩基配列の3’末端を含む」という条件、すなわち、「比較する部分配列が、一方の配列の3’末端から始まり他方の配列の3’末端で終わるアラインメントのみを考慮する」という条件、の下でローカルアラインメントを行うこととして、比較する部分配列が両方の塩基配列の3’末端を含むようにする態様が好ましい。
なお、ローカルアラインメントは、ギャップを挿入してもよい。ギャップは塩基の挿入および/または欠失(インデル)を意味する。
また、ローカルアラインメントは、塩基配列ペア間で塩基が相補的である場合を一致(マッチ)とし、相補的でない場合を不一致(ミスマッチ)とする。
アラインメントは、マッチ、ミスマッチおよびインデルのそれぞれにスコアを与え、合計スコアが最大となるように行う。スコアは適宜設定すればよい。例えば、下記表1のようにスコアを設定してもよい。なお、表1中「-」はギャップ(挿入および/または欠失(インデル))を表す。
ただし、本発明においては、通常、塩基配列に対して行われているローカルアラインメントとは異なり、「比較する部分配列が塩基配列の3’末端を含む」という条件の下で、ローカルアラインメントを行うこととして、比較する部分配列が両方の塩基配列の3’末端を含むようにした。
さらに、本発明においては、「比較する部分配列が、塩基配列の3’末端を含む」という条件、すなわち、「比較する部分配列が、一方の配列の3’末端から始まり他方の配列の3’末端で終わるアラインメントのみを考慮する」という条件、の下でローカルアラインメントを行うこととして、比較する部分配列が両方の塩基配列の3’末端を含むようにする態様が好ましい。
なお、ローカルアラインメントは、ギャップを挿入してもよい。ギャップは塩基の挿入および/または欠失(インデル)を意味する。
また、ローカルアラインメントは、塩基配列ペア間で塩基が相補的である場合を一致(マッチ)とし、相補的でない場合を不一致(ミスマッチ)とする。
アラインメントは、マッチ、ミスマッチおよびインデルのそれぞれにスコアを与え、合計スコアが最大となるように行う。スコアは適宜設定すればよい。例えば、下記表1のようにスコアを設定してもよい。なお、表1中「-」はギャップ(挿入および/または欠失(インデル))を表す。
例えば、以下の表2に示す配列番号1および2の塩基配列について、ローカルアラインメントを行うことを考える。ここで、スコアは表1に示すとおりとする。
配列番号1および2の塩基配列から、表3に示すドット行列(ドットマトリクス)を作成する。具体的には、配列番号1の塩基配列を左から右へ、5’から3’の向きで並べ、配列番号2の塩基配列を下から上へ、5’から3’の向きで並べ、塩基が相補的であるグリッドに「・」を記入して、表3に示すドットマトリクスを得る。
表3に示すドットマトリクスから、以下の表4に示す、部分配列のアラインメント(ペアワイズアラインメント)を得る(表3の斜線部分参照)。なお、表4中、マッチを「|」で、ミスマッチを「:」で、それぞれ示す。
この(ペアワイズ)アラインメントには、マッチが2か所あり、ミスマッチが4か所ある。インデル(ギャップ)はない。
したがって、この(ペアワイズ)アラインメントに基づくローカルアラインメント・スコアは、(+1)×9+(-1)×8+(-1)×0=+1となる。
したがって、この(ペアワイズ)アラインメントに基づくローカルアラインメント・スコアは、(+1)×9+(-1)×8+(-1)×0=+1となる。
なお、アラインメント(ペアワイズアラインメント)は、ここに例示したドットマトリクス法のみならず、動的計画法、ワード法、またはその他種々の方法により得ることができる。
《第一段階選抜工程》
本明細書において、第一段階選抜工程S104(図6)、第一段階選抜第1工程S204および第一段階選抜第2工程S214(図7)、ならびに第1の第一段階選抜工程S304および第2の第一段階選抜工程S314(図8)を総称して、単に「第一段階選抜工程」という場合がある。
本明細書において、第一段階選抜工程S104(図6)、第一段階選抜第1工程S204および第一段階選抜第2工程S214(図7)、ならびに第1の第一段階選抜工程S304および第2の第一段階選抜工程S314(図8)を総称して、単に「第一段階選抜工程」という場合がある。
(第1の態様: 第一段階選抜工程S104)
図6において「第一段階選抜」(S104)として示す。
第1の態様において、(d)第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
図6において「第一段階選抜」(S104)として示す。
第1の態様において、(d)第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
(第2の態様: 第一段階選抜第1工程S204および第一段階選抜第2工程S214)
図7において、「第一段階選抜第1」(S204)および「第一段階選抜第2」(S214)として示す。
第2の態様において、(d1)第一段階選抜第1工程は、上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程であり、(d2)第一段階選抜第2工程は、上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
図7において、「第一段階選抜第1」(S204)および「第一段階選抜第2」(S214)として示す。
第2の態様において、(d1)第一段階選抜第1工程は、上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程であり、(d2)第一段階選抜第2工程は、上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
(第3の態様: 第1の第一段階選抜工程S304および第2の第一段階選抜工程S314)
図8において、「第1の第一段階選抜」(S304)および「第2の第一段階選抜」(S314)として示す。
第3の態様において、(d-1)第1の第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程であり、(d-2)第2の第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
図8において、「第1の第一段階選抜」(S304)および「第2の第一段階選抜」(S314)として示す。
第3の態様において、(d-1)第1の第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程であり、(d-2)第2の第一段階選抜工程は、上記ローカルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第一段階の選抜を行う工程である。
(第1段階選抜の方法)
ローカルアラインメント・スコアの閾値(「第1の閾値」ともいう。)を予め設定しておく。
ローカルアラインメント・スコアが第1の閾値未満であれば、これらの2つの塩基配列の組合せはダイマー形成性が低いと判断し、以降の工程を行う。
一方、ローカルアラインメント・スコアが第1の閾値以上であれば、これらの2つの塩基配列の組合せはプライマー・ダイマー形成性が高いと判断し、その組合せについては以降の工程を行わない。
第1の閾値は、特に限定されず、適宜設定することができる。例えば、ポリメラーゼ連鎖反応の鋳型となるゲノムDNAの量などのPCR条件によって、第1の閾値を設定してもよい。
ローカルアラインメント・スコアの閾値(「第1の閾値」ともいう。)を予め設定しておく。
ローカルアラインメント・スコアが第1の閾値未満であれば、これらの2つの塩基配列の組合せはダイマー形成性が低いと判断し、以降の工程を行う。
一方、ローカルアラインメント・スコアが第1の閾値以上であれば、これらの2つの塩基配列の組合せはプライマー・ダイマー形成性が高いと判断し、その組合せについては以降の工程を行わない。
第1の閾値は、特に限定されず、適宜設定することができる。例えば、ポリメラーゼ連鎖反応の鋳型となるゲノムDNAの量などのPCR条件によって、第1の閾値を設定してもよい。
ここで、上記「ローカルアラインメント工程」に示した例において、第1の閾値を「+3」に設定した場合を考える。
上の例では、ローカルアラインメント・スコアは「+1」であり、第1の閾値である「+3」未満であったから、配列番号1および2の塩基配列の組合せはプライマー・ダイマー形成性が低いと判断することができる。
上の例では、ローカルアラインメント・スコアは「+1」であり、第1の閾値である「+3」未満であったから、配列番号1および2の塩基配列の組合せはプライマー・ダイマー形成性が低いと判断することができる。
なお、本工程は、ローカルアラインメント工程S103、ローカルアラインメント第1工程S203、ローカルアラインメント第2工程S213、第1のローカルアラインメント工程S303、または第2のローカルアラインメント工程S313においてローカルアラインメント・スコアを算出したすべての組合せに対して行う。
《グローバルアラインメント工程》
本明細書において、グローバルアラインメント工程S105(図6)、グローバルアラインメント第1工程S205およびグローバルアラインメント第2工程S215(図7)、ならびに第1のグローバルアラインメント工程S305および第2のグローバルアラインメント工程S315(図8)を総称して、単に「グローバルアラインメント工程」という場合がある。
本明細書において、グローバルアラインメント工程S105(図6)、グローバルアラインメント第1工程S205およびグローバルアラインメント第2工程S215(図7)、ならびに第1のグローバルアラインメント工程S305および第2のグローバルアラインメント工程S315(図8)を総称して、単に「グローバルアラインメント工程」という場合がある。
(第1の態様: グローバルアラインメント工程S105)
図6において「グローバルアラインメント」(S105)として示す。
第1の態様において、(e)グローバルアラインメント工程は、上記第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程である。
図6において「グローバルアラインメント」(S105)として示す。
第1の態様において、(e)グローバルアラインメント工程は、上記第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程である。
(第2の態様: グローバルアラインメント第1工程S205およびグローバルアラインメント第2工程S215)
図7において「グローバルアラインメント第1」(S205)および「グローバルアラインメント第2」(S215)として示す。
第2の態様において、(e1)グローバルアラインメント第1工程は、上記第一段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程であり、(e2)グローバルアラインメント第2工程は、上記第一段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程である。
図7において「グローバルアラインメント第1」(S205)および「グローバルアラインメント第2」(S215)として示す。
第2の態様において、(e1)グローバルアラインメント第1工程は、上記第一段階選抜第1工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程であり、(e2)グローバルアラインメント第2工程は、上記第一段階選抜第2工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程である。
(第3の態様: 第1のグローバルアラインメント工程S305および第2のグローバルアラインメント工程S315)
図8において「第1のグローバルアラインメント」(S305)および「第2のグローバルアラインメント」(S315)として示す。
第3の態様において、(e-1)第1のグローバルアラインメント工程は、上記第1の第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程であり、(e-2)第2のグローバルアラインメント工程は、上記第2の第一段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める工程である。
図8において「第1のグローバルアラインメント」(S305)および「第2のグローバルアラインメント」(S315)として示す。
第3の態様において、(e-1)第1のグローバルアラインメント工程は、上記第1の第一段階選抜工程において選抜されたプライマー候補の塩基配列から2つのプライマー候補の塩基配列を選択するすべての組合せについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行ってグローバルアラインメント・スコアを求める工程であり、(e-2)第2のグローバルアラインメント工程は、上記第2の第一段階選抜工程において選抜されたプライマー候補の塩基配列および既に採用されたプライマーの塩基配列から2つのプライマー候補の塩基配列を選択する組合せおよび1つのプライマー候補の塩基配列および1つの既に採用されたプライマーの塩基配列を選択する組合せのすべてについて、上記組合せに含まれる2つの塩基配列の3’末端を含む予め設定した配列長の塩基配列に対して、ペアワイズにグローバルアラインメントを行って、グローバルアラインメント・スコアを求める工程である。
(グローバルアラインメントの方法)
グローバルアラインメント・スコアは、「プライマー候補塩基配列作成工程」で作成したプライマー候補の全部(「ローカルアラインメント工程」および「第1段階選抜工程」を先に行った場合において、ローカルアラインメント・スコアが第1の閾値未満であるプライマー候補の組合せがあるときは、その組合せに含まれるプライマー候補の全部。)および既に採用したプライマーの全部(既に採用したプライマーが存在する場合に限る。)からなる群から2つのプライマーを取り出して、3’末端を含む、予め設定した配列長の塩基配列について、ペアワイズにグローバルアラインメントを行って、求める。
グローバルアラインメント・スコアは、「プライマー候補塩基配列作成工程」で作成したプライマー候補の全部(「ローカルアラインメント工程」および「第1段階選抜工程」を先に行った場合において、ローカルアラインメント・スコアが第1の閾値未満であるプライマー候補の組合せがあるときは、その組合せに含まれるプライマー候補の全部。)および既に採用したプライマーの全部(既に採用したプライマーが存在する場合に限る。)からなる群から2つのプライマーを取り出して、3’末端を含む、予め設定した配列長の塩基配列について、ペアワイズにグローバルアラインメントを行って、求める。
グローバルアラインメントを行う塩基配列の組合せは、重複を許して選択した組合せであってもよいし、重複を許さず選択した組合せであってもよいが、同一塩基配列のプライマー間でのプライマー・ダイマー形成性をまだ評価していない場合には、重複を許して選択した組合せが好ましい。
組合せの総数は、グローバルアラインメントを行う塩基配列の総数をx個として、重複を許して選択した場合は、「xH2=x+1C2=(x+1)!/2(x-1)!」通りであり、重複を許さず選択した場合は、「xC2=x(x-1)/2」通りである。
組合せの総数は、グローバルアラインメントを行う塩基配列の総数をx個として、重複を許して選択した場合は、「xH2=x+1C2=(x+1)!/2(x-1)!」通りであり、重複を許さず選択した場合は、「xC2=x(x-1)/2」通りである。
グローバルアラインメントは、「配列全体」に対して行うアラインメントであり、配列全体の相補性を調べることができる。
ただし、ここで、「配列全体」は、プライマー候補の塩基配列の3’末端を含む、予め設定した配列長の塩基配列の全体である。
なお、グローバルアラインメントは、ギャップを挿入してもよい。ギャップは塩基の挿入および/または欠失(インデル)を意味する。
また、グローバルアラインメントは、塩基配列ペア間で塩基が相補的である場合を一致(マッチ)とし、相補的でない場合を不一致(ミスマッチ)とする。
アラインメントは、マッチ、ミスマッチおよびインデルのそれぞれにスコアを与え、合計スコアが最大となるように行う。スコアは適宜設定すればよい。例えば、上記表1のようにスコアを設定してもよい。なお、表1中「-」はギャップ(挿入および/または欠失(インデル))を表す。
ただし、ここで、「配列全体」は、プライマー候補の塩基配列の3’末端を含む、予め設定した配列長の塩基配列の全体である。
なお、グローバルアラインメントは、ギャップを挿入してもよい。ギャップは塩基の挿入および/または欠失(インデル)を意味する。
また、グローバルアラインメントは、塩基配列ペア間で塩基が相補的である場合を一致(マッチ)とし、相補的でない場合を不一致(ミスマッチ)とする。
アラインメントは、マッチ、ミスマッチおよびインデルのそれぞれにスコアを与え、合計スコアが最大となるように行う。スコアは適宜設定すればよい。例えば、上記表1のようにスコアを設定してもよい。なお、表1中「-」はギャップ(挿入および/または欠失(インデル))を表す。
例えば、以下の表5に示す配列番号1および2の塩基配列について、それぞれの3’末端の3塩基(大文字部分。)についてグローバルアラインメントを行うことを考える。ここで、スコアは表1に示すとおりとする。
スコアが最大となるように、配列番号1の塩基配列の3’末端の3塩基(大文字箇所)および配列番号2の3’末端の3塩基(大文字箇所)の塩基配列についてグローバルアラインメントを行うと、以下の表6に示すアラインメント(ペアワイズアラインメント)を得ることができる。なお、表6中、ミスマッチを「:」で示す。
この(ペアワイズ)アラインメントには、ミスマッチが3か所あり、マッチおよびインデル(ギャップ)はいずれもない。
したがって、この(ペアワイズ)アラインメントに基づくグローバルアラインメント・スコアは、(+1)×0+(-1)×3+(-1)×0=-3となる。
したがって、この(ペアワイズ)アラインメントに基づくグローバルアラインメント・スコアは、(+1)×0+(-1)×3+(-1)×0=-3となる。
なお、アラインメント(ペアワイズアラインメント)は、ドットマトリクス法、動的計画法、ワード法、またはその他種々の方法により得ることができる。
《第二段階選抜工程》
本明細書において、第二段階選抜工程S106(図6)、第二段階選抜第1工程S206および第二段階選抜第2工程S216(図7)、ならびに第1の第二段階選抜工程S306および第2の第二段階選抜工程S316(図8)を総称して、単に「第二段階選抜工程」という場合がある。
(第1の態様: 第二段階選抜工程S106)
図6において「第二段階選抜」(S106)として示す。
第1の態様において、(f)第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
本明細書において、第二段階選抜工程S106(図6)、第二段階選抜第1工程S206および第二段階選抜第2工程S216(図7)、ならびに第1の第二段階選抜工程S306および第2の第二段階選抜工程S316(図8)を総称して、単に「第二段階選抜工程」という場合がある。
(第1の態様: 第二段階選抜工程S106)
図6において「第二段階選抜」(S106)として示す。
第1の態様において、(f)第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
(第2の態様: 第二段階選抜第1工程S206および第二段階選抜第2工程S216)
図7において「第二段階選抜第1」(S206)および「第二段階選抜第2」(S216)として示す。
第2の態様において、(f1)第二段階選抜第1工程は、上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程であり、(f2)第二段階選抜第2工程は、上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
図7において「第二段階選抜第1」(S206)および「第二段階選抜第2」(S216)として示す。
第2の態様において、(f1)第二段階選抜第1工程は、上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程であり、(f2)第二段階選抜第2工程は、上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
(第3の態様: 第1の第二段階選抜工程S306および第2の第二段階選抜工程S3136)
図8において「第1の第二段階選抜」(S306)および「第2の第二段階選抜」(S316)として示す。
第3の態様において、(f-1)第1の第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程であり、(f-2)第2の第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
図8において「第1の第二段階選抜」(S306)および「第2の第二段階選抜」(S316)として示す。
第3の態様において、(f-1)第1の第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記第1の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程であり、(f-2)第2の第二段階選抜工程は、上記グローバルアラインメント・スコアに基づいて、上記第2の対象領域をPCR増幅するためのプライマー候補の塩基配列の第二段階の選抜を行う工程である。
(第二段階選抜の方法)
グローバルアラインメント・スコアの閾値(「第2の閾値」ともいう。)を予め設定しておく。
グローバルアラインメント・スコアが第2の閾値未満であれば、これらの2つの塩基配列の組合せはダイマー形成性が低いと判断し、以降の工程を行う。
一方、グローバルアラインメント・スコアが第2の閾値以上であれば、これらの2つの塩基配列の組合せはダイマー形成性が高いと判断し、その組合せについては以降の工程を行わない。
第2の閾値は、特に限定されず、適宜設定することができる。例えば、ポリメラーゼ連鎖反応の鋳型となるゲノムDNAの量などのPCR条件によって、第2の閾値を設定してもよい。
グローバルアラインメント・スコアの閾値(「第2の閾値」ともいう。)を予め設定しておく。
グローバルアラインメント・スコアが第2の閾値未満であれば、これらの2つの塩基配列の組合せはダイマー形成性が低いと判断し、以降の工程を行う。
一方、グローバルアラインメント・スコアが第2の閾値以上であれば、これらの2つの塩基配列の組合せはダイマー形成性が高いと判断し、その組合せについては以降の工程を行わない。
第2の閾値は、特に限定されず、適宜設定することができる。例えば、ポリメラーゼ連鎖反応の鋳型となるゲノムDNAの量などのPCR条件によって、第2の閾値を設定してもよい。
なお、プライマーの3’末端から数塩基の塩基配列を同一塩基配列とすることによって、それぞれのプライマーの塩基配列の3’末端を含む予め設定した塩基数の塩基配列について、ペアワイズにグローバルアラインメントを行って求めたグローバルアラインメント・スコアを第2の閾値未満とすることができる。
ここで、上記「グローバルアラインメント工程」に示した例において、第2の閾値を「+3」に設定した場合を考える。
上の例では、グローバルアラインメント・スコアは「-3」であり、第2の閾値である「+3」未満であったから、配列番号1および2の塩基配列の組合せはプライマー・ダイマー形成性が低いと判断することができる。
上の例では、グローバルアラインメント・スコアは「-3」であり、第2の閾値である「+3」未満であったから、配列番号1および2の塩基配列の組合せはプライマー・ダイマー形成性が低いと判断することができる。
なお、本工程は、グローバルアラインメント工程S105、グローバルアラインメント第1工程S205、グローバルアラインメント第2工程S215、第1のグローバルアラインメント工程S305、または第2のグローバルアラインメント工程S315においてグローバルアラインメント・スコアを算出したすべての組合せに対して行う。
また、計算量を低減させるため、「グローバルアラインメント工程」および「第2段階選抜工程」の両工程を先に実施して、「第2段階選抜工程」を通過したプライマーの塩基配列の組合せに対して、「ローカルアラインメント工程」および「第1段階選抜工程」の両工程を実施することが好ましい。特に、対象領域の数が増加するほど、プライマー候補の塩基配列数が増加するほど、計算量を低減させる効果が大きく、全体の処理の高速化を図ることができる。
これは、「グローバルアラインメント工程」では「予め設定した配列長」という短い長さの塩基配列についてグローバルアラインメントを行うので、3’末端を含むという条件下で塩基配列全体から相補性が高い部分配列を見つけるローカルアラインメント・スコアよりも計算量が少なく、高速に処理できるからである。なお、通常知られているアルゴリズムでは、同じ長さの配列に対するアラインメントであれば、ローカルアラインメントよりもグローバルアラインメントの方が高速であることが知られている。
《増幅配列長チェック工程》
「第1段階選抜工程」および「第2段階選抜工程」においてプライマー・ダイマー形成性が低いと判断されたプライマー候補の塩基配列の組合せに対して、染色体DNA上でのプライマー候補の塩基配列の端部間の距離を計算し、その距離が予め設定した範囲内であるか否かを判断する増幅配列長チェック工程を実施してもよい(図示せず)。
塩基配列の端部間の距離が予め設定した範囲内であれば、そのプライマー候補の塩基配列の組合せは、対象領域を適切に増幅できる可能性が高いと判断することができる。プライマー候補の塩基配列の端部間の距離は、特に限定されず、酵素(DNAポリメラーゼ)の種類等のPCR条件によって、適宜設定することができる。例えば、100~200塩基(対)の範囲内、120~180塩基(対)の範囲内、140~180塩基(対)の範囲内、140~160塩基(対)の範囲内、160~180塩基(対)の範囲内など、様々な範囲に設定することができる。
「第1段階選抜工程」および「第2段階選抜工程」においてプライマー・ダイマー形成性が低いと判断されたプライマー候補の塩基配列の組合せに対して、染色体DNA上でのプライマー候補の塩基配列の端部間の距離を計算し、その距離が予め設定した範囲内であるか否かを判断する増幅配列長チェック工程を実施してもよい(図示せず)。
塩基配列の端部間の距離が予め設定した範囲内であれば、そのプライマー候補の塩基配列の組合せは、対象領域を適切に増幅できる可能性が高いと判断することができる。プライマー候補の塩基配列の端部間の距離は、特に限定されず、酵素(DNAポリメラーゼ)の種類等のPCR条件によって、適宜設定することができる。例えば、100~200塩基(対)の範囲内、120~180塩基(対)の範囲内、140~180塩基(対)の範囲内、140~160塩基(対)の範囲内、160~180塩基(対)の範囲内など、様々な範囲に設定することができる。
《プライマー採用工程》
本明細書において、プライマー採用工程S107(図6)、プライマー採用第1工程S207およびプライマー採用第2工程S217(図7)、ならびに第1のプライマー採用工程S307および第2のプライマー採用工程S317(図8)を総称して、単に「プライマー採用工程」という場合がある。
本明細書において、プライマー採用工程S107(図6)、プライマー採用第1工程S207およびプライマー採用第2工程S217(図7)、ならびに第1のプライマー採用工程S307および第2のプライマー採用工程S317(図8)を総称して、単に「プライマー採用工程」という場合がある。
(第1の態様: プライマー採用工程S107)
図6において「プライマー採用」(S107)として示す。
第1の態様において、(g)プライマー採用工程は、上記第一段階選抜工程および上記第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
図6において「プライマー採用」(S107)として示す。
第1の態様において、(g)プライマー採用工程は、上記第一段階選抜工程および上記第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
(第2の態様: プライマー採用第1工程S207およびプライマー採用第2工程S217)
図7において「プライマー採用第1」(S207)および「プライマー採用第2」(S217)として示す。
第2の態様において、(g1)プライマー採用第1工程は、上記第一段階選抜第1工程および上記第二段階選抜第1工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程であり、(g2)プライマー採用第2工程は、上記第一段階選抜第2工程および上記第二段階選抜第2工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
図7において「プライマー採用第1」(S207)および「プライマー採用第2」(S217)として示す。
第2の態様において、(g1)プライマー採用第1工程は、上記第一段階選抜第1工程および上記第二段階選抜第1工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程であり、(g2)プライマー採用第2工程は、上記第一段階選抜第2工程および上記第二段階選抜第2工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
(第3の態様: 第1のプライマー採用工程S307および第2のプライマー採用工程S317)
図8において「第1のプライマー採用」(S307)および「第2のプライマー採用」(S317)として示す。
第3の態様において、(g-1)第1のプライマー採用工程は、上記第1の第一段階選抜工程および上記第1の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程であり、(g-2)第2のプライマー採用工程は、上記第2の第一段階選抜工程および上記第2の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
図8において「第1のプライマー採用」(S307)および「第2のプライマー採用」(S317)として示す。
第3の態様において、(g-1)第1のプライマー採用工程は、上記第1の第一段階選抜工程および上記第1の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第1の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程であり、(g-2)第2のプライマー採用工程は、上記第2の第一段階選抜工程および上記第2の第二段階選抜工程のいずれにおいても選抜されたプライマー候補の塩基配列を、上記第2の対象領域をPCR増幅するためのプライマーの塩基配列として採用する工程である。
(プライマー採用の方法)
プライマー採用工程では、それぞれのプライマー候補の塩基配列について、比較する部分配列がその塩基配列の3’末端を含むという条件の下に、ペアワイズでローカルアラインメントを行って求めたローカルアラインメント・スコアが第1の閾値未満であり、かつ、それぞれのプライマー候補の塩基配列の3’末端を含む予め設定した塩基数の塩基配列について、ペアワイズでグローバルアラインメントを行って求めたグローバルアラインメント・スコアが第2の閾値未満であるプライマー候補の塩基配列を、対象領域を増幅するためのプライマーの塩基配列として採用する。
プライマー採用工程では、それぞれのプライマー候補の塩基配列について、比較する部分配列がその塩基配列の3’末端を含むという条件の下に、ペアワイズでローカルアラインメントを行って求めたローカルアラインメント・スコアが第1の閾値未満であり、かつ、それぞれのプライマー候補の塩基配列の3’末端を含む予め設定した塩基数の塩基配列について、ペアワイズでグローバルアラインメントを行って求めたグローバルアラインメント・スコアが第2の閾値未満であるプライマー候補の塩基配列を、対象領域を増幅するためのプライマーの塩基配列として採用する。
例えば、表7に示す配列番号1および2の塩基配列について、対象領域を増幅するためのプライマーの塩基配列として採用することを考える。
既に記載したように、ローカルアラインメント・スコアは「+1」であるから、第1の閾値である「+3」未満であり、また、グローバルアラインメント・スコアは「-3」であるから、第2の閾値である「+3」未満である。
したがって、配列番号1で示されるプライマー候補の塩基配列および配列番号2で示されるプライマー候補の塩基配列を、対象領域を増幅するためのプライマーの塩基配列として採用することができる。
したがって、配列番号1で示されるプライマー候補の塩基配列および配列番号2で示されるプライマー候補の塩基配列を、対象領域を増幅するためのプライマーの塩基配列として採用することができる。
《他の目的領域のプライマー設計》
1つの目的領域に対してプライマーを採用した後、さらに他の目的領域に対してプライマーを設計してもよい。
第1の態様においては、プライマー候補塩基配列作成工程S102において、他の目的領域に対するプライマー候補の塩基配列が作成されていれば、ローカルアラインメント工程S103から行う。他の目的領域に対するプライマー候補の塩基配列が作成されていなければ、対象領域選択工程S101において目的領域が選択されていなかったので、対象領域選択工程S101において他の目的領域を選択し、プライマー候補塩基配列作成工程S102において、その目的領域に対するプライマー候補の塩基配列を作成した後、ローカルアラインメント工程S103以降を行う。
第2の態様においては、対象領域選択第2工程S211において第1の目的領域以外の目的領域を選択するところからから繰り返す。
第3の態様において、既に対象領域複数選択工程S301において選択した目的領域に対するプライマー候補の塩基配列がプライマー候補塩基配列複数作成工程S302において作成されているため、第2のローカルアラインメント工程S313から繰り返す。
1つの目的領域に対してプライマーを採用した後、さらに他の目的領域に対してプライマーを設計してもよい。
第1の態様においては、プライマー候補塩基配列作成工程S102において、他の目的領域に対するプライマー候補の塩基配列が作成されていれば、ローカルアラインメント工程S103から行う。他の目的領域に対するプライマー候補の塩基配列が作成されていなければ、対象領域選択工程S101において目的領域が選択されていなかったので、対象領域選択工程S101において他の目的領域を選択し、プライマー候補塩基配列作成工程S102において、その目的領域に対するプライマー候補の塩基配列を作成した後、ローカルアラインメント工程S103以降を行う。
第2の態様においては、対象領域選択第2工程S211において第1の目的領域以外の目的領域を選択するところからから繰り返す。
第3の態様において、既に対象領域複数選択工程S301において選択した目的領域に対するプライマー候補の塩基配列がプライマー候補塩基配列複数作成工程S302において作成されているため、第2のローカルアラインメント工程S313から繰り返す。
《プライマー等の設計における特徴点》
本発明のマルチプレックスPCRに供するプライマーの設計方法における、目的領域をPCR増幅するためのプライマーの設計方法における特徴点は、概していえば、複数の特定の対象領域を選択し、近傍の塩基配列を検索し、抽出済プライマーセットの各々との相補性を確認し、相補性の少ない塩基配列を選択することによって、対象領域を増幅対象に含み、かつ互いに相補的にならないプライマー群を得ることにある。
プライマーの塩基配列の相補性の確認における特徴点は、ローカルアラインメントを用いて配列全体の相補性が低くなるように、かつ、プライマーの塩基配列の端部に対して、グローバルアラインメントを用いて相補性が低くなるようにプライマー群を作成する点にある。
さらに、プライマー候補の塩基配列を作成する際のTm値として、目標値および実績値から算出したTm値範囲を用いることによって、より安定した目的領域のPCR増幅が可能となる。
本発明のマルチプレックスPCRに供するプライマーの設計方法における、目的領域をPCR増幅するためのプライマーの設計方法における特徴点は、概していえば、複数の特定の対象領域を選択し、近傍の塩基配列を検索し、抽出済プライマーセットの各々との相補性を確認し、相補性の少ない塩基配列を選択することによって、対象領域を増幅対象に含み、かつ互いに相補的にならないプライマー群を得ることにある。
プライマーの塩基配列の相補性の確認における特徴点は、ローカルアラインメントを用いて配列全体の相補性が低くなるように、かつ、プライマーの塩基配列の端部に対して、グローバルアラインメントを用いて相補性が低くなるようにプライマー群を作成する点にある。
さらに、プライマー候補の塩基配列を作成する際のTm値として、目標値および実績値から算出したTm値範囲を用いることによって、より安定した目的領域のPCR増幅が可能となる。
以下に、実施例により本発明をより具体的に説明するが、本発明はこれらの実施例に限定されるものではない。
[実施例1]
単一細胞を用いて確定的診断レベル(感度99.9%、特異度99.999%程度)の精度で13番染色体、18番染色体、および21番染異数性の検査を実施することを考える。
先行実験として、30ローカスを対象にマルチプレックスPCRによる増幅を行い、増幅産物を次世代シークエンサーを用いてシークエンシングして、対象染色体の配列リード数を計測したところ、増幅の総合CV(対象染色体の配列リード数の変動係数)は約30%であった。
感度99.9%、特異度99.999%を達成するには、増幅の総合CV(対象染色体の配列リード数の変動係数)を、6.5%程度にする必要がある。
そのために必要なローカス数Nは、
N=k×ceiling(z)
z=先行実験でのローカス数×(先行実験での増幅の総合CV/目標CV)2
により得ることができる。ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた係数を表す。
すなわち、本実施例では、
先行実験でのローカス数=20
先行実験での総合CV=30%
目標CV=6.5%
ローカス数を増加したことによるローカスあたりの配列リード数の変動係数の劣化は生じないものとして、係数k=1.0であるから、
z=1.0×30×(30/6.5)2≒639.05
であり、
必要ローカス数N=ceiling(z)=640
となる。
必要ローカス数を上回る647ローカスを対象に、マルチプレックスPCRによる増幅を行い、PCR増幅産物をシークエンシングし、対象染色体の配列リード数を計測し、増幅の総合CVを算出したところ、6.5%以下となり、感度99.9%、特異度99.999%で度確定的診断が可能であることが示された。
本実施例ではローカス数を増加したことによる1ローカスあたりの配列リード数の変動係数の劣化は生じないものとして係数k=1.0としたが、1ローカスあたりの配列リード数の変動係数の劣化が生じる場合は、係数kを、例えば、k=1.1として、
z=1.1×30×(30/6.5)2≒702.96
必要ローカス数N=ceiling(z)=703
としてもよい。
単一細胞を用いて確定的診断レベル(感度99.9%、特異度99.999%程度)の精度で13番染色体、18番染色体、および21番染異数性の検査を実施することを考える。
先行実験として、30ローカスを対象にマルチプレックスPCRによる増幅を行い、増幅産物を次世代シークエンサーを用いてシークエンシングして、対象染色体の配列リード数を計測したところ、増幅の総合CV(対象染色体の配列リード数の変動係数)は約30%であった。
感度99.9%、特異度99.999%を達成するには、増幅の総合CV(対象染色体の配列リード数の変動係数)を、6.5%程度にする必要がある。
そのために必要なローカス数Nは、
N=k×ceiling(z)
z=先行実験でのローカス数×(先行実験での増幅の総合CV/目標CV)2
により得ることができる。ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた係数を表す。
すなわち、本実施例では、
先行実験でのローカス数=20
先行実験での総合CV=30%
目標CV=6.5%
ローカス数を増加したことによるローカスあたりの配列リード数の変動係数の劣化は生じないものとして、係数k=1.0であるから、
z=1.0×30×(30/6.5)2≒639.05
であり、
必要ローカス数N=ceiling(z)=640
となる。
必要ローカス数を上回る647ローカスを対象に、マルチプレックスPCRによる増幅を行い、PCR増幅産物をシークエンシングし、対象染色体の配列リード数を計測し、増幅の総合CVを算出したところ、6.5%以下となり、感度99.9%、特異度99.999%で度確定的診断が可能であることが示された。
本実施例ではローカス数を増加したことによる1ローカスあたりの配列リード数の変動係数の劣化は生じないものとして係数k=1.0としたが、1ローカスあたりの配列リード数の変動係数の劣化が生じる場合は、係数kを、例えば、k=1.1として、
z=1.1×30×(30/6.5)2≒702.96
必要ローカス数N=ceiling(z)=703
としてもよい。
[実施例2]
(前提条件)
妊婦末梢血から単離された細胞が、母親由来であるか胎児由来であるかを、99%の精度で判定することを考える。
母親のSNP型は別途口腔等から大量に細胞を採取し、ADO等の単一細胞特融のノイズの影響を受けずに確定させることができるものとする。
また、母親と父親は近親関係にないものとする。
(前提条件)
妊婦末梢血から単離された細胞が、母親由来であるか胎児由来であるかを、99%の精度で判定することを考える。
母親のSNP型は別途口腔等から大量に細胞を採取し、ADO等の単一細胞特融のノイズの影響を受けずに確定させることができるものとする。
また、母親と父親は近親関係にないものとする。
(先行実験)
先行実験として、SNPs20座位でのマルチプレックスPCRにより母子判別性を確認した。
上記SNPs20座位の平均的な変異頻度をpとする。ただし、0<p<1とする。
このとき、親子で異なるジェノタイプを有する確率は2pq(p2+pq+q2)となる。ここで、q=1-pである。
すなわち、この20座位の全てにおいて母子のSNP型が一致する確率は約0.8%となるため、99%以上の確率で母子を判別できるはずである。
先行実験として、SNPs20座位でのマルチプレックスPCRにより母子判別性を確認した。
上記SNPs20座位の平均的な変異頻度をpとする。ただし、0<p<1とする。
このとき、親子で異なるジェノタイプを有する確率は2pq(p2+pq+q2)となる。ここで、q=1-pである。
すなわち、この20座位の全てにおいて母子のSNP型が一致する確率は約0.8%となるため、99%以上の確率で母子を判別できるはずである。
アレルドロップアウト率が0%である場合、母親の真のジェノタイプと末梢血から単離された胎児細胞のジェノタイプが、ホモ一致する確率、ヘテロ一致する確率、ヘテロ-ホモとなる確率、ホモ-ヘテロとなる確率、およびホモ不一致となる確率は、SNPsの平均的な変異頻度をpとすると、それぞれ、1-3p(1-p)、p(1-p)、p(1-p)、p(1-p)、および0となる。
また、同様に、アレルドロップアウト率が0%である場合、母親の真のジェノタイプと末梢血から単離された母親細胞のジェノタイプが、ホモ一致する確率、ヘテロ一致する確率、へテロホモとなる確率、ホモ-へテロとなる確率、およびホモ不一致となる確率は、SNPsの平均的な変異頻度をpとすると、それぞれ、p2+(1-p)2、2p(1-p)、0、0、および0となる。
したがって、20座位のSNPsの平均変異頻度を0.4596とすると、二項分布により、母親の真のジェノタイプと胎児細胞のジェノタイプが、20個中k個のSNPsが、ホモ一致する個数、ヘテロ一致する個数、ヘテロ-ホモ不一致となる個数、ホモ-ヘテロで不一致となる個数、およびホモで不一致となる個数の分布は、それぞれ、図9に示すとおりとなる。
同様にして、20座位のSNPsの平均変異頻度を0.4596とすると、二項分布により、母親の真のジェノタイプと母親細胞のジェノタイプが、20個中、ホモ一致する個数、ヘテロ一致する個数、ヘテロ-ホモ不一致となる個数、ホモ-ヘテロで不一致となる個数、およびホモで不一致となる個数の分布は、それぞれ、図10に示すとおりとなる。
ところが、先行実験の結果、ADO率(allelic dropout rate)が50%であることが判明した。
ADO(allelic dropout)が50%の確率で生じるため、真のジェノタイプがヘテロである座位のジェノタイプが、50%の確率で、みかけ上ホモと判定されてしまうことになる。
ADO(allelic dropout)が50%の確率で生じるため、真のジェノタイプがヘテロである座位のジェノタイプが、50%の確率で、みかけ上ホモと判定されてしまうことになる。
したがって、ADO率が50%であるとき、母親の真のジェノタイプと胎児細胞のジェノタイプが、20個中、ホモ一致する個数、ヘテロ一致する個数、ヘテロ-ホモ不一致となる個数、ホモ-ヘテロで不一致となる個数、およびホモで不一致となる個数の分布は、図11に示すとおりに修正される。
同様に、ADO率が50%であるとき、母親の真のジェノタイプと母親細胞のジェノタイプが、20個中、ホモ一致する個数、ヘテロ一致する個数、ヘテロ-ホモ不一致となる個数、ホモ-ヘテロで不一致となる個数、およびホモで不一致となる個数の分布は、図12に示すとおりに修正される。
図11および図12からホモ-ヘテロとなる個数の分布を抜き出して重ねると、図13に示すとおりとなる。
母親細胞ではホモ-ヘテロとなることはないので、母子判別の精度は図13において、図11からのグラフと図12からのグラフとが交わる面積に等しく、この場合は、約93%で母子細胞を判別することができる。
母親細胞ではホモ-ヘテロとなることはないので、母子判別の精度は図13において、図11からのグラフと図12からのグラフとが交わる面積に等しく、この場合は、約93%で母子細胞を判別することができる。
SNPs数を増加させると、胎児細胞の分布はグラフの右側に移動していくため、母子判別の精度が向上する。
図14に示すとおり、SNPs座位数を35個としたときには、胎児細胞のグラフと母親細胞のグラフの重なりが0.01を下回り、判別精度が99%を超えるようになる。
なお、以下の式
Ψ(%)=100×{1-(1-ξ)χ}(%)
ξ=ν(1-ν)(100-Θ)/100
(ただし、χ=SNPs座位数、ν=変異頻度、Θ=ADO率(%)である。)
にあてはめてみると、
変異頻度0.4596、ADO率=50%、およびSNPs座位数20個であるときの精度は、
ξ=0.4596×(1-0.4596)×(100-50)÷100=0.1242
Ψ(%)=100×{1-(1-0.1242)20}≒93%
より、約93%となる。
また、変異頻度0.4596、ADO率=50%、およびSNPs座位数35個であるときの精度は、
Ψ(%)=100×{1-(1-0.1242)35}≒99%
より、約99%となる。
Ψ(%)=100×{1-(1-ξ)χ}(%)
ξ=ν(1-ν)(100-Θ)/100
(ただし、χ=SNPs座位数、ν=変異頻度、Θ=ADO率(%)である。)
にあてはめてみると、
変異頻度0.4596、ADO率=50%、およびSNPs座位数20個であるときの精度は、
ξ=0.4596×(1-0.4596)×(100-50)÷100=0.1242
Ψ(%)=100×{1-(1-0.1242)20}≒93%
より、約93%となる。
また、変異頻度0.4596、ADO率=50%、およびSNPs座位数35個であるときの精度は、
Ψ(%)=100×{1-(1-0.1242)35}≒99%
より、約99%となる。
11 演算手段(CPU)
12 記憶手段(メモリ)
13 補助記憶手段(ストレージ)
14 入力手段(キーボード)
15 補助入力手段(マウス)
16 表示手段(モニタ)
17 出力手段(プリンタ)
12 記憶手段(メモリ)
13 補助記憶手段(ストレージ)
14 入力手段(キーボード)
15 補助入力手段(マウス)
16 表示手段(モニタ)
17 出力手段(プリンタ)
Claims (9)
- 単一細胞からの染色体数定量のために必要なローカス数を決定する方法であって、
複数回の反復試行により取得された実験結果である、対象染色体上のローカス数nおよび対象染色体の配列リード数の変動係数xが入力手段を介して入力され、記憶手段に記憶される実験結果入力工程と、
目標性能である、対象染色体の配列リード数の変動係数yが入力手段を介して入力され、記憶手段に記憶される目標性能入力工程と、
演算手段が、記憶手段から、ローカス数n、変動係数x、および変動係数yを読み出し、実験結果であるローカス数nおよび変動係数xならびに目標性能である変動係数yから、変動係数xがy以下となるために必要なローカス数Nを算出し、記憶手段に記憶する、必要ローカス数決定工程と、
演算手段が、記憶手段から、染色体数定量のために必要なローカス数Nを読み出し、表示手段に表示する、結果表示工程と
を含む、必要なローカス数を決定する方法。 - 前記実験結果入力工程において、前記対象染色体の配列リード数の変動係数xに代えて、前記対象染色体上のローカスあたりの配列リード数の変動係数x’が入力され、記憶手段に記憶された場合において、
前記実験結果入力工程の後、かつ、前記必要ローカス数決定工程の前に、さらに、
演算手段が、記憶手段から、前記対象染色体上のローカス数nおよび前記対象染色体上のローカスあたりの配列リード数の変動係数x’を読み出し、下記式
x=x’/SQRT(n)
によって、対象染色体の配列リード数の変動係数xを算出し、記憶手段に記憶する、実験結果換算工程
を含む、請求項1に記載の方法。
ただし、SQRT(n)は、nの平方根を表す。 - 前記目標性能入力工程において、変動係数yに代えて、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTが入力され、記憶手段に記憶された場合において、
前記目標性能入力工程の後、かつ、前記必要ローカス数決定工程の前に、さらに、
演算手段が、記憶手段から、感度SeT、特異度SpT、陽性適中率PPVT、または陰性適中率NPVTを読み出し、目標とする、対象染色体の配列リード数の変動係数yに換算し、記憶手段に記憶する、目標性能換算工程
を含む、請求項1または2に記載の方法。 - 前記目標性能換算工程において、
感度SeTが読み出された場合、正規分布に従う、染色体異数性がある細胞群を仮定すると、この細胞群において染色体異数性ありと判定される細胞の割合が感度であるから、これに目標とする感度SeTを代入して、そのときの変動係数を目標とする変動係数yとする、
特異度SpTが読み出された場合、正規分布に従う、染色体異数性がない細胞群を仮定すると、この細胞群において染色体異数性なしと判定される細胞の割合が特異度であるから、これに目標とする特異度SpTを代入して、そのときの変動係数を目標とする変動係数yとする、
陽性適中率PPVTが読み出された場合、予め与えられた有病率および下記式1を用いて、陽性適中率を感度および特異度に変換し、さらに、前記感度SeTが読み出された場合および前記特異度SpTが読み出された場合に従って、感度および特異度を、目標とする変動係数yに換算する、または、
陰性適中率NPVTが読み出された場合、予め与えられた有病率および下記式2を用いて、陰性適中率を特異度および感度に変換し、さらに、前記感度SeTが読み出された場合および前記特異度SpTが読み出された場合に従って、特異度および感度を、目標とする変動係数yに換算する、
請求項3に記載の方法。
式1: 陽性適中率=感度×有病率/(感度×有病率+(1-有病率)(1-特異度))
式2: 陰性適中率=特異度×(1-有病率)/(特異度×(1-有病率)+有病率×(1-感度)) - 前記必要ローカス数決定工程において、演算手段が、記憶手段から、ローカス数n、変動係数x、および変動係数yを読み出し、下記式
N=f(n,x,y)=ceiling(z)
z=k×n×(x/y)2
によって、必要なローカス数Nを算出する、請求項1~4のいずれか1項に記載の方法。
ただし、ceiling(z)は実数zに対してz以上の最小の整数を表し、kは予め定められた1.0以上1.5以下の係数である。 - z=n×(x/y)2
である、請求項5に記載の方法。 - 妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数を決定する方法であって、
mを2以上の整数として、m個のSNPs座位を解析する先行実験により得られた、m個のSNPsの平均の変異頻度νおよびアレルドロップアウト率Θ%が入力手段を介して入力され、記憶手段に記憶される実験結果入力工程と、
目標精度Ψ%が入力手段を介して入力され、記憶手段に記憶される目標性能入力工程と、
演算手段が記憶手段から、SNPs座位の個数m、変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率τを求め、
アレルドロップアウト率Θ%である場合の、母親の真のジェノタイプと胎児細胞のジェノタイプがホモ-ヘテロで不一致となるSNPs座位の数がm個中0個である確率υ=1を求め、
Φ=100×(υ-τ)を計算し、
mを1ずつ増加して行き、Φ≧Ψとなる最小の整数mを算出し、必要なSNPs座位数Mとして記憶手段に記憶する、必要SNPs座位数決定工程と、
演算手段が、記憶手段から、妊婦から単離した胎児由来が疑われる単一細胞が胎児由来であるか、または妊婦である母親由来であるかを、SNPsジェノタイピングを用いて判定する際に必要なSNPs座位数Mを読み出し、表示手段に表示する、結果表示工程と
を含む、必要なSNPs座位数を決定する方法。 - 前記必要SNPs座位数決定工程において、演算手段が記憶手段から変異頻度ν、アレルドロップアウト率Θ%、および目標精度Ψ%を読み出し、下記式
M=h(ν,θ,ψ)=ceiling(χ)
χ=κlog(1-ψ)/log(1-ξ)
ξ=ν(1-ν)(1-θ)
ψ=Ψ/100
θ=Θ/100
によって、必要なSNPs座位数Mを算出する、請求項7に記載の方法。
ただし、ceiling(χ)は実数χに対してχ以上の最小の整数を表し、κは予め定められた1.0以上1.5以下の係数である。 - χ=log(1-ψ)/log(1-ξ)
である、請求項8に記載の方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17858156.7A EP3524687A4 (en) | 2016-10-05 | 2017-09-11 | METHOD FOR DETERMINING THE NUMBER OF LOCUS REQUIRED AND METHOD FOR DETERMINING THE NUMBER OF SNP LOCUS REQUIRED |
JP2018543804A JPWO2018066317A1 (ja) | 2016-10-05 | 2017-09-11 | 必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法 |
US16/375,250 US20190221285A1 (en) | 2016-10-05 | 2019-04-04 | Method for determining number of loci required, and method for determining number of snps loci required |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016-197562 | 2016-10-05 | ||
JP2016197562 | 2016-10-05 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US16/375,250 Continuation US20190221285A1 (en) | 2016-10-05 | 2019-04-04 | Method for determining number of loci required, and method for determining number of snps loci required |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018066317A1 true WO2018066317A1 (ja) | 2018-04-12 |
Family
ID=61832000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2017/032699 WO2018066317A1 (ja) | 2016-10-05 | 2017-09-11 | 必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20190221285A1 (ja) |
EP (1) | EP3524687A4 (ja) |
JP (1) | JPWO2018066317A1 (ja) |
WO (1) | WO2018066317A1 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008543311A (ja) * | 2005-06-15 | 2008-12-04 | ストラタジーン | 増幅反応に対する試料の正規化 |
JP2013501514A (ja) * | 2009-08-11 | 2013-01-17 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 染色体異数性の検出方法 |
JP2013530727A (ja) * | 2010-07-23 | 2013-08-01 | エソテリックス ジェネティック ラボラトリーズ, エルエルシー | 差次的に提示される胎児のゲノム領域もしくは母親のゲノム領域の同定およびそれらの使用 |
JP2016067268A (ja) * | 2014-09-29 | 2016-05-09 | 富士フイルム株式会社 | 胎児の染色体異数性の非侵襲的判別方法 |
WO2017056931A1 (ja) * | 2015-09-30 | 2017-04-06 | 富士フイルム株式会社 | プライマーの設計方法、プライマー、プライマーセット、dna増幅方法および解析方法 |
WO2017145738A1 (ja) * | 2016-02-24 | 2017-08-31 | 富士フイルム株式会社 | 染色体数定量方法 |
WO2017145739A1 (ja) * | 2016-02-24 | 2017-08-31 | 富士フイルム株式会社 | 染色体数定量方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2015015687A (es) * | 2013-05-16 | 2016-07-20 | Basetra Medical Technology Co Ltd | Diagnostico fetales que usa captura de celulas fetales de sangre materna. |
-
2017
- 2017-09-11 WO PCT/JP2017/032699 patent/WO2018066317A1/ja unknown
- 2017-09-11 EP EP17858156.7A patent/EP3524687A4/en not_active Withdrawn
- 2017-09-11 JP JP2018543804A patent/JPWO2018066317A1/ja active Pending
-
2019
- 2019-04-04 US US16/375,250 patent/US20190221285A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008543311A (ja) * | 2005-06-15 | 2008-12-04 | ストラタジーン | 増幅反応に対する試料の正規化 |
JP2013501514A (ja) * | 2009-08-11 | 2013-01-17 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 染色体異数性の検出方法 |
JP2013530727A (ja) * | 2010-07-23 | 2013-08-01 | エソテリックス ジェネティック ラボラトリーズ, エルエルシー | 差次的に提示される胎児のゲノム領域もしくは母親のゲノム領域の同定およびそれらの使用 |
JP2016067268A (ja) * | 2014-09-29 | 2016-05-09 | 富士フイルム株式会社 | 胎児の染色体異数性の非侵襲的判別方法 |
WO2017056931A1 (ja) * | 2015-09-30 | 2017-04-06 | 富士フイルム株式会社 | プライマーの設計方法、プライマー、プライマーセット、dna増幅方法および解析方法 |
WO2017145738A1 (ja) * | 2016-02-24 | 2017-08-31 | 富士フイルム株式会社 | 染色体数定量方法 |
WO2017145739A1 (ja) * | 2016-02-24 | 2017-08-31 | 富士フイルム株式会社 | 染色体数定量方法 |
Non-Patent Citations (4)
Title |
---|
ALTSCHUL, S. A. ET AL.: "Basic Local Alignment Search Tool", JOURNAL OF MOLECULAR BIOLOGY, vol. 215, October 1990 (1990-10-01), pages 403 - 410, XP002949123, DOI: doi:10.1006/jmbi.1990.9999 |
KOBAYASHI, MIWA ET AL.: "SNP-Specific Mismatched PCR for Embryonic DNA Detection Using Blood from Pregnant Mothers", RINSHO BYORI. THE JAPANESE JOURNAL OF CLINICAL PATHOLOGY., vol. 60, 2012, pages 19 - 26, XP009513897, ISSN: 0047-1860 * |
PEARSON, W. R. ET AL.: "Improved tools for biological sequence comparison", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, NATIONAL ACADEMY OF SCIENCES, vol. 85, April 1988 (1988-04-01), pages 2444 - 2448, XP002060460, DOI: doi:10.1073/pnas.85.8.2444 |
See also references of EP3524687A4 |
Also Published As
Publication number | Publication date |
---|---|
EP3524687A1 (en) | 2019-08-14 |
JPWO2018066317A1 (ja) | 2019-08-15 |
EP3524687A4 (en) | 2019-11-06 |
US20190221285A1 (en) | 2019-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7081829B2 (ja) | 無細胞試料中の腫瘍dnaの解析 | |
JP6768815B2 (ja) | マルチプレックスpcrに供するプライマーの設計方法 | |
KR102665592B1 (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
ES2886508T3 (es) | Métodos y procedimientos para la evaluación no invasiva de variaciones genéticas | |
JP6328934B2 (ja) | 非侵襲性出生前親子鑑定法 | |
US20180073080A1 (en) | Methods for non-invasive prenatal ploidy calling | |
US20140206552A1 (en) | Methods for preimplantation genetic diagnosis by sequencing | |
US20140129201A1 (en) | Validation of genetic tests | |
US20190066842A1 (en) | A novel algorithm for smn1 and smn2 copy number analysis using coverage depth data from next generation sequencing | |
JP2007523600A (ja) | 多重配列変異体解析を用いる遺伝子診断 | |
BR112013020220B1 (pt) | Método para determinar o estado de ploidia de um cromossomo em um feto em gestação | |
WO2013052557A2 (en) | Methods for preimplantation genetic diagnosis by sequencing | |
WO2018061693A1 (ja) | マルチプレックスpcrに供するプライマーの設計方法 | |
JP2020530261A (ja) | 未知の遺伝子型の寄与体からのdna混合物の正確な計算による分解のための方法 | |
Yin et al. | Identification of a de novo fetal variant in osteogenesis imperfecta by targeted sequencing-based noninvasive prenatal testing | |
Deleye et al. | Massively parallel sequencing of micro-manipulated cells targeting a comprehensive panel of disease-causing genes: A comparative evaluation of upstream whole-genome amplification methods | |
US20220020449A1 (en) | Vector-based haplotype identification | |
WO2018066317A1 (ja) | 必要なローカス数を決定する方法および必要なSNPs座位数を決定する方法 | |
Chan et al. | Applied human genetic epidemiology | |
US20240287593A1 (en) | Single-molecule strand-specific end modalities | |
Lysenko et al. | Genotyping and Statistical Analysis | |
Sood | Bioinformatic analysis of human Next Generation Sequencing data; extracting additional information, optimising mapping and variant calling, and application in a rare disease | |
AU2015271883B2 (en) | Determining a nucleic acid sequence imbalance using fractional fetal concentration | |
Jiang | Statistical Methods for Genomic and Transcriptomic Sequencing | |
JP2020178585A (ja) | 変形性膝関節症のリスクを判定する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17858156 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2018543804 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2017858156 Country of ref document: EP Effective date: 20190506 |