WO2018025521A1 - 落屑症候群又は落屑緑内障の発症リスクの判定方法 - Google Patents

落屑症候群又は落屑緑内障の発症リスクの判定方法 Download PDF

Info

Publication number
WO2018025521A1
WO2018025521A1 PCT/JP2017/022158 JP2017022158W WO2018025521A1 WO 2018025521 A1 WO2018025521 A1 WO 2018025521A1 JP 2017022158 W JP2017022158 W JP 2017022158W WO 2018025521 A1 WO2018025521 A1 WO 2018025521A1
Authority
WO
WIPO (PCT)
Prior art keywords
snp
risk
desquamation
group
snps
Prior art date
Application number
PCT/JP2017/022158
Other languages
English (en)
French (fr)
Inventor
啓 田代
茂 木下
和彦 森
陽子 池田
盛夫 上野
正和 中野
隆一 佐藤
史子 佐藤
健悟 吉井
Original Assignee
京都府公立大学法人
シスメックス株式会社
参天製薬株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 京都府公立大学法人, シスメックス株式会社, 参天製薬株式会社 filed Critical 京都府公立大学法人
Priority to JP2018531766A priority Critical patent/JP7064215B2/ja
Publication of WO2018025521A1 publication Critical patent/WO2018025521A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Definitions

  • the present invention relates to a method for determining the onset risk of exfoliation syndrome or exfoliation glaucoma, an onset risk determination apparatus for desquamation syndrome or desquamation glaucoma, and a computer program to be executed by the apparatus.
  • Glaucoma is a neurodegenerative disease in which retinal ganglion cells are damaged and progress irreversibly and lead to blindness.
  • Degradation glaucoma one of the types of glaucoma, is glaucoma that develops from desquamation syndrome in which detrimental substances are observed in the anterior chamber.
  • Non-Patent Document 1 discloses that specific SNPs are found in the LOXL1 gene in desquamation glaucoma or desquamation syndrome.
  • Non-patent document 2 discloses that SNPs associated with desquamation glaucoma or desquamation syndrome are also observed in TBC1D21 gene and PML gene, and non-patent document 3 in CACNA1A gene.
  • An object of the present invention is to provide a method for accurately determining the onset risk of desquamation syndrome or desquamation glaucoma, an onset risk determination device for desquamation syndrome or desquamation glaucoma for executing the method, and a computer program for causing the apparatus to execute the method. It is to be.
  • the present inventors have used a high-density chip using specimens of a large number of patients with desquamation syndrome or desquamation glaucoma and non-desquamation syndrome and healthy non-glaucoma individuals.
  • genome-wide association analysis gene-wide association
  • GWAS genome-wide association analysis
  • Onset of desquamation syndrome or desquamation glaucoma by measuring the total number of risk alleles in a sample for a SNP population that combines a specific SNP group that contributes to the SNP group selected from the remaining SNPs.
  • the present inventors have found that the risk can be determined with high accuracy and have completed the present invention.
  • the present invention relates to the following [1] to [3].
  • [1] Based on allele information of single nucleotide polymorphism (SNP) in a biological sample collected from a subject, selected from 12 core SNP groups listed in Table 1 and pooled SNP groups listed in Table 2
  • An allele measurement step for measuring alleles for at least 30 SNPs in combination with SNP (pool selection SNP group) Based on the measurement result of the allele, an information acquisition step of acquiring information on the risk of developing desquamation syndrome or desquamation glaucoma in the subject, and based on the information obtained above, the subject's desquamation syndrome or
  • a computer including a processor and a memory under the control of the processor, Based on the allele information of single nucleotide polymorphism (SNP) in the biological sample collected from the subject, the SNP selected from the 12 core SNP groups shown in Table 1 and the pool SNP group shown in Table 2 Allele measurement step for measuring alleles for at least 30 SNPs in combination with (selected SNP group), Based on the measurement result of the allele, an information acquisition step of acquiring information on the risk of developing desquamation syndrome or desquamation glaucoma in the subject, and based on the information obtained above, the subject's desquamation syndrome or An apparatus for detecting a subject having a risk of developing desquamation syndrome or desquamation glaucoma, in which a computer program for causing the computer to execute an information providing step for providing information for determining the risk of developing desquamation glaucoma is recorded.
  • SNP single nucleotide polymorphism
  • a computer including a processor and a memory under the control of the processor, Based on the allele information of single nucleotide polymorphism (SNP) in the biological sample collected from the subject, the SNP selected from the 12 core SNP groups shown in Table 1 and the pool SNP group shown in Table 2 Allele measurement step for measuring alleles for at least 30 SNPs in combination with (selected SNP group), Based on the measurement result of the allele, an information acquisition step of acquiring information on the risk of developing desquamation syndrome or desquamation glaucoma in the subject, and based on the information obtained above, the subject's desquamation syndrome or A computer program for executing an information providing process for providing information for determining the risk of developing desquamation glaucoma.
  • SNP single nucleotide polymorphism
  • the subject By analyzing the SNP group of the present invention present in the sample derived from the subject by the method of the present invention, it is determined whether or not there is a risk of developing desquamation syndrome or desquamation glaucoma in the subject. High and low can be predicted. Based on this risk, the subject can take preventive measures for desquamation syndrome or desquamation glaucoma or receive appropriate treatment.
  • FIG. 1 is a schematic view showing an example of a risk assessment device for desquamation syndrome or desquamation glaucoma in a subject.
  • FIG. 2 is a block diagram showing a hardware configuration of the determination apparatus shown in FIG.
  • FIG. 3 is a flowchart for determining the risk of developing desquamation syndrome or desquamation glaucoma using the determination device shown in FIG.
  • FIG. 4 is a diagram showing the results of determining the presence or absence of onset risk using a total of 30 SNPs listed in Table 1 and SNPs selected from Table 2.
  • FIG. 1 is a schematic view showing an example of a risk assessment device for desquamation syndrome or desquamation glaucoma in a subject.
  • FIG. 2 is a block diagram showing a hardware configuration of the determination apparatus shown in FIG.
  • FIG. 3 is a flowchart for determining the risk of developing desquamation syndrome or desquamation glaucoma using the determination device shown in FIG.
  • FIG. 5 shows an example of a graph used to determine the presence or absence of the onset risk when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 90, and the measurement step is 1 time. It is a figure.
  • Fig. 6 is a graph used to individually determine the risk of onset when the SNPs listed in Table 1 and SNPs selected from Table 2 are measured, the number of SNPs is 90, and the number of measurement steps is 3 It is the figure which showed an example.
  • FIG. 6 is a graph used to individually determine the risk of onset when the SNPs listed in Table 1 and SNPs selected from Table 2 are measured, the number of SNPs is 90, and the number of measurement steps is 3 It is the figure which showed an example.
  • FIG. 7 is a graph of a graph used to integrally determine whether there is an onset risk when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 90, and the number of measurement steps is 3 It is the figure which showed an example.
  • Figure 8 shows the results of using Bayes' theorem to determine the risk of onset when the SNPs listed in Table 1 and SNPs selected from Table 2 were measured, the number of SNPs was 90, and the number of measurement steps was 3 It is the figure which showed an example.
  • FIG. 9 shows an example of a graph used to determine whether or not there is an onset risk when the SNP shown in Table 1 and the SNP selected from Table 2 are measured, the number of SNPs is 120, and the measurement step is 1 time. It is a figure.
  • FIG. 10 is a graph used to individually determine the presence or absence of the onset risk when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 120, and the measurement step is 3 times. It is the figure which showed an example.
  • FIG. 11 is a graph used for integrated determination of the presence or absence of the onset risk when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 120, and the measurement step is 3 times.
  • FIG. 12 shows the results of using Bayes' theorem to determine the risk of onset when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 120, and the number of measurement steps is 3 It is the figure which showed an example.
  • FIG. 13 shows an example of a graph used to determine whether or not there is an onset risk when the SNPs listed in Table 1 and the SNP selected from Table 2 are measured, the number of SNPs is 150, and the measurement step is 1 time. It is a figure.
  • FIG. 14 is a graph used to individually determine whether there is an onset risk when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 150, and the number of measurement steps is 3 It is the figure which showed an example.
  • FIG. 15 is a graph used for integrated determination of the presence or absence of the onset risk when the SNPs listed in Table 1 and the SNPs selected from Table 2 are measured, the number of SNPs is 150, and the measurement step is 3 times. It is the figure which showed an example.
  • 16 shows the results of using Bayes' theorem to determine the risk of onset when SNPs listed in Table 1 and SNPs selected from Table 2 are measured, the number of SNPs is 150, and the number of measurement steps is 3 It is the figure which showed an example.
  • the present invention relates to a method for determining the risk of developing desquamation syndrome or desquamation glaucoma, comprising the step of detecting an allele in vitro for a specific single nucleotide polymorphism (hereinafter sometimes referred to as SNP).
  • SNP single nucleotide polymorphism
  • the present invention sets a measurement object including a specific SNP group that contributes to highly accurate risk determination as a constituent member, counts the total number of risk alleles detected there, and the total number of the risk alleles is a preset threshold. It has a great feature in that it can provide information that there is a risk of developing desquamation syndrome or desquamation glaucoma. Thereby, it becomes possible to assist the diagnosis of the onset risk of desquamation syndrome or desquamation glaucoma.
  • the method for assisting diagnosis of the onset risk of desquamation syndrome or desquamation glaucoma of the present invention is also a method for providing information on the onset risk of desquamation syndrome or desquamation glaucoma, and also the onset risk of desquamation syndrome or desquamation glaucoma. It is also a method of determination, evaluation, or inspection.
  • “polymorphism” or “variant” means that diversity is found in the base sequence and structure (insertion / deletion, inversion, copy number) at a specific position of the genome in a certain organism species.
  • a site where a polymorphism exists refers to a site on the genome where a variant such as a single nucleotide polymorphism (SNP) is observed.
  • SNP single nucleotide polymorphism
  • allele refers to each type having different bases that can be taken at a certain polymorphic site
  • risk allele refers to all of the alleles of SNP associated with desquamation syndrome or desquamation glaucoma An allele that is more frequent in a group of patients with desquamation syndrome or desquamation glaucoma than a group of healthy individuals who are not desquamation syndrome or desquamation glaucoma
  • non-risk allele refers to an allele that is not a risk allele.
  • the risk of developing desquamation syndrome or desquamation glaucoma is a risk related to desquamation syndrome or desquamation glaucoma of the subject, and refers to the possibility of future desquamation syndrome or desquamation glaucoma determined by disease sensitivity.
  • risk prediction refers to determining the presence or absence of the subject's future risk at the present time, or determining the magnitude of the subject's future risk at the present time.
  • a method for assisting diagnosis of the risk of developing desquamation syndrome or desquamation glaucoma of the present invention An allele measurement process for measuring alleles for a specific SNP, An information acquisition step of acquiring subject information based on the measurement result of the allele, and an information providing step of providing information for determining the onset risk of the subject based on the information.
  • the steps will be described step by step.
  • a method for identifying the SNP group related to the onset of desquamation syndrome or desquamation glaucoma which is a measurement target in the present invention, will be described.
  • the SNP group related to the onset of desquamation syndrome or desquamation glaucoma may be described as the SNP group of the present invention.
  • the SNP group related to the onset of desquamation syndrome or desquamation glaucoma is specifically diagnosed first as a patient diagnosed with desquamation syndrome or desquamation glaucoma, and not desquamation syndrome or desquamation glaucoma, and Genomic DNA is extracted from non-desquamation syndrome and non-glaucoma healthy individuals (sometimes simply referred to as non-patients or controls) determined to have no family history of glaucoma through interviews.
  • the SNP group used in the present invention, from among them, a specific SNP group (core SNP group) that gives a more accurate determination result and By setting the remaining SNP group (pooled SNP group) and using them in combination, it is possible to determine whether there is a risk of developing desquamation syndrome or desquamation glaucoma and to predict the magnitude of the risk of developing desquamation syndrome or desquamation glaucoma. Become. Although details will be described in the Examples section, the SNP group associated with desquamation syndrome or desquamation glaucoma disclosed in the present invention can be identified by the following method.
  • Genomic DNA is extracted from blood of each of a patient group and a non-patient group.
  • Genomic DNA in blood can be extracted by any known method. For example, DNA eluted by lysing cells is bound to the surface of magnetic beads coated with silica, and separated using magnetism. DNA can be extracted by recovering.
  • the means for identifying alleles in the SNP in the extracted DNA sample is not particularly limited, and may be appropriately selected from SNP detection methods and SNP typing methods known in the art.
  • GWAS genome-wide association analysis
  • a DNA microarray containing SNPs distributed in the entire genome region Affymetrix, Genome-Wide Human SNP Array 6.0
  • the SNP to be extracted may be selected by performing Quality control (hereinafter also referred to as “QC”).
  • a call rate that is a criterion for rejecting SNPs in Quality Control for example, it is desirable to employ SNPs that exhibit a call rate of preferably 85% or higher, more preferably 90% or higher, and even more preferably 95% or higher.
  • SNPs with minor allele frequency (MAF) of less than 0.01 and SNPs whose genotype distribution significantly deviates from Hardy-Weinberg equilibrium (HWE) (false (discovery rate is less than 0.001) are excluded from the candidates. It is desirable to exclude.
  • the P value is preferably 1 ⁇ 10 ⁇ 3 or less, more preferably 3 ⁇ 10 ⁇ 4 or less, and even more preferably 1 ⁇ 10 ⁇ 4.
  • a two-dimensional cluster plot analysis for excluding a genotyping defective SNP for example, visually observing a cluster plot image obtained from genotyping software (Affymetrix, GenotypingtypConsole)
  • genotyping software Affymetrix, GenotypingtypConsole
  • the SNP selected in this way can be found in the genome location where the SNP exists, sequence information, the gene where the SNP exists, or the vicinity by referring to a known sequence such as GenBank or dbSNP or a database of known SNPs.
  • a known sequence such as GenBank or dbSNP or a database of known SNPs.
  • information such as intron or exon distinction and its function, homologous gene in other species can be obtained.
  • genotype data is digitized and extracted for the marker candidate SNP group obtained above.
  • a numerical value 2 is used when the risk allele is homozygous, and a numerical value when the risk allele is heterogeneous. 1 is assigned, and when the non-risk allele is homo, the value 0 is assigned. Then, the obtained numerical values are normalized by the following formula using the average value of the appearance frequency of each allele and the observed frequency to create a numerical genotype data matrix in the selected SNP group .
  • the risk allele means an allele that appears frequently in a patient group.
  • the risk allele is defined based on the odds ratio.
  • the odds ratio is generally the ratio of the ratio of persons with risk factors to the ratio of persons without risk in the patient group, that is, the odds divided by the odds similarly determined in the non-patient group. Often used in case-control studies.
  • the odds ratio is obtained based on the allele frequency, and the ratio of the frequency of one allele to the other allele in the patient group is divided by the ratio of the frequencies obtained in the same manner in the non-patient group. it can.
  • the appearance frequency of each allele can be recalculated at any time as the data of the subject is acquired and the data is additionally updated.
  • cluster analysis is performed using the digitized genotype data matrix.
  • linkage disequilibrium linkage disequilibrium, LD
  • PCA principal component analysis
  • PCA principal component analysis
  • a known method can be used.
  • information contraction is performed on each of the whole genome or chromosome, and factor loadings (principal component and original component are analyzed).
  • factor loadings principal component and original component are analyzed.
  • the candidate region is determined based on that, and the SNP having the lowest P value in the region is selected as the candidate SNP. decide.
  • duplicate SNPs are excluded from calculations from whole genomes and calculations from each chromosome.
  • this SNP group is referred to as a core SNP group.
  • the core SNP group is selected from the marker SNP group obtained above in about 50 SNP groups in descending order of the P value, and a new SNP group is selected for the selected SNP group. This can be determined by performing a reproduction experiment with a group.
  • the pool SNP group is a group obtained by removing the core SNP group from the marker SNP group.
  • allele identification is performed using DNA collected from a group different from the patient group and the non-patient group used to identify the candidate SNP group of the marker.
  • the different group is a group that may be partially overlapped but is preferably completely non-identical.
  • mass spectrometry is preferable, and known MassARRAY can be used.
  • Quality control may be performed, and as the call rate at that time, for example, preferably, SNP showing a call rate of 85% or more, more preferably 90% or more, and further preferably 95% or more may be adopted. desirable.
  • SNPs with minor allele frequency (MAF) of less than 0.01 and SNPs whose genotype distribution significantly deviates from Hardy-Weinberg equilibrium (HWE) (false (discovery rate is less than 0.001) are excluded from the candidates. It is desirable to exclude.
  • the identified SNP is subjected to a two-dimensional cluster plot analysis in the same manner as described above to exclude genotyping failure SNPs.
  • the P value is preferably 1 ⁇ 10 ⁇ 3 or less, more preferably 3 ⁇ 10 ⁇ 4 or less, and still more preferably Select an SNP that satisfies 1 ⁇ 10 ⁇ 4 or less.
  • the SNP satisfying the P value of 3 ⁇ 10 ⁇ 3 or less by the analysis method is defined as the core SNP group (12 in total) in the present invention, and the remaining SNP groups not corresponding to the core SNP group (450 in total) are pooled SNP.
  • the probe sequences containing SNPs in the core SNP group are shown in Table 1, and the probe sequences containing SNPs in the pool SNP group are shown in Table 2 (Tables 2-1 to 2-23).
  • alleles (alleles) of each SNP are described in parentheses in the probe sequence, the sequence containing the risk allele is SEQ ID NO: A, and the sequence containing the non-risk allele is SEQ ID NO: B.
  • the following steps are performed on the sample derived from the subject.
  • the core SNP group (Table 1) is always measured, and the SNP selected from the pool SNP group (Table 2) (pool selected SNP group) is also measured.
  • the number of SNPs to be measured is not particularly limited as long as the total including the core SNP group is at least 30.For example, when the number of measurement targets is 30, it consists of 12 core SNPs and 18 pool-selected SNPs. The When there are 40 measurement objects, it consists of 12 core SNPs and 28 pool selection SNPs. When there are 50 measurement targets, it consists of 12 core SNPs and 38 pool selection SNPs. When measuring 90 objects, it consists of 12 core SNPs and 78 pool selection SNPs. When there are 120 measurement objects, it consists of 12 core SNPs and 108 pool selection SNPs. When the number of measurement objects is 150, it consists of 12 core SNPs and 138 pool selection SNPs.
  • the present invention may proceed to the next information acquisition step with one measurement result, but from the viewpoint of improving the determination accuracy, it has a plurality of results obtained by performing a plurality of measurement steps. It is possible to proceed to the information acquisition process.
  • the 12 core SNP groups can be used as measurement objects without overlapping in any measurement step.
  • the number of core SNP groups for each step may be the same or different.
  • the number of SNPs to be measured at each step may be the same or different, and there is no particular limitation as long as the total including the core SNP group at each step is at least 30.
  • a first measurement step for measuring a group At least 30 SNPs including one or more SNPs (second core SNP group) different from the first core SNP group and a plurality of SNPs selected from the pool SNP group (second pool selected SNP group)
  • the process including the 2nd measurement step which measures about the 2nd SNP group is illustrated, and here, the 1st pool selection SNP group and the 2nd pool selection SNP group are nonidentical.
  • the number of SNPs to be measured in each measurement step is exemplified.
  • the first core SNP group in the first SNP group is six
  • the first pool selection SNP group is 24 or more
  • the second core SNP group in the second SNP group examples are 6
  • the second pool selection SNP group is 24 or more.
  • “non-identical” means that they are not completely identical, for example, only one may be different, or all of the constituent SNPs of the pool-selected SNP group may be different. .
  • a first SNP that includes at least 30 SNPs including one or more SNPs selected from the core SNP group (first core SNP group) and a plurality of SNPs selected from the pool SNP group (first pool selected SNP group) A first measurement step for measuring a group; At least 30 SNPs including one or more SNPs (second core SNP group) different from the first core SNP group and a plurality of SNPs selected from the pool SNP group (second pool selected SNP group)
  • a second measurement step for measuring the second SNP group; At least one SNP (third core SNP group) different from the first core SNP group and the second core SNP group and a plurality of SNPs selected from the pool SNP group (third pool selected SNP group) are combined.
  • a process including a third measurement step of measuring a third SNP group including 30 SNPs is exemplified, wherein the first pool selection SNP group, the second pool selection SNP group, and the third pool selection SNP group are Both are non-identical.
  • the number of SNPs to be measured in each measurement step is exemplified.
  • the first core SNP group in the first SNP group is four
  • the first pool selection SNP group is 26 or more
  • the second core in the second SNP group examples include 4 SNP groups, 26 or more second pool selection SNP groups, 4 3rd core SNP groups in the 3rd SNP group, and 26 or more 3rd pool selection SNP groups.
  • the fourth and subsequent measurements can be performed if necessary.
  • the biological sample used in the present invention may be anything as long as it can extract genomic DNA.
  • whole blood, whole blood cells, leukocytes, lymphocytes, plasma, serum, lymph, tears, saliva, nasal discharge, cerebrospinal fluid, bone marrow fluid, semen, sweat, mucosal tissue, skin tissue, or hair root are used. Any known method can be adopted as a method for extracting DNA from such a biological sample.
  • the allele is determined according to a known method and the measurement result is obtained. Specifically, for example, hybridization is performed using probes (Tables 1 and 2) specific to each allele designed based on the sequence information of the SNP group of the present invention, and each signal is detected by detecting the signal. Alleles can be detected. Examples of the method of hybridizing using a probe include the Taqman method, the Invader (registered trademark) method, the light cycler method, the cyclin probe method, the MPSS method, the bead array method, the DNA chip method, and the microarray method. It is also possible to detect alleles without performing hybridization with a probe. For example, a PCR-RFLP method, an SSCP method, a mass spectrometry method, a next generation sequencing method, a direct sequencing method, or the like can be used. These methods can be performed according to known conditions.
  • the measurement result thus obtained is used for the next information acquisition process.
  • the allele information may be information about whether or not a variant exists, information about the type of allele that has been measured, or information obtained from the number of alleles. Moreover, it may be calculated as a value (such as a statistical value) correlated with SNP. In particular, in the present invention, from the viewpoint of improving the determination accuracy, it is preferable to determine whether the measured allele is a risk allele and to count the total number of risk alleles.
  • risk allele data acquired in advance it is determined whether or not the measured allele is a risk allele, and the total number of alleles determined as risk alleles in the entire SNP group to be measured (risk allele possession) Count).
  • risk allele possession Count
  • the number of positive and negative values in each measurement result is further certified as the quantitative value of the subject, and the following information It is preferable to proceed to the providing step.
  • Information provision process information for determining the onset risk of the subject based on the obtained information is provided to the subject.
  • Aspect 1 Aspect determination of presence / absence of onset risk based on numerical value of risk allele possession
  • Aspect 2 Aspect aspect of determining presence / absence risk when multiple risk allele possession is obtained
  • Aspect 3 Risk allele possession Of calculating the probability of having an onset risk on the basis of the risk aspect 4: Mode of calculating the probability of having the onset risk with a predetermined probability based on the number of risk alleles held
  • a result (number of risk alleles) related to a subject obtained in the information acquisition process is determined in advance by ROC (Receiver Operating Characteristic) analysis based on the SNP used in the allele measuring process.
  • ROC Receiveiver Operating Characteristic
  • the number of subjects possessing risk alleles is compared with a preset threshold value.
  • the threshold is an appropriate cut-off value for discriminating between patients and non-patients, and by comparing the threshold with a quantitative value, it can be determined whether or not there is a risk of developing desquamation syndrome or desquamation glaucoma.
  • Threshold value can be set as follows. For the same SNP group as the SNP group selected as the measurement target when obtaining the quantitative value of the subject, using a biological sample collected from the subject who has been diagnosed in advance as to whether it is desquamation syndrome or desquamation glaucoma, The number of risk alleles is measured as described above, and the correlation between both data is analyzed by statistically processing the “presence / absence risk of desquamation syndrome or desquamation glaucoma” and “number of risk alleles”. From the results of analysis, for example, focus on high true positive rate (high sensitivity), high true negative rate (high specificity), or true positive rate and true negative A threshold can be set according to the purpose such as how well the rate is balanced.
  • the true positive rate is the probability of correctly determining a person having the risk of developing desquamation syndrome or desquamation glaucoma as a person having the risk of developing desquamation syndrome or desquamation glaucoma
  • the true negative rate is the desquamation syndrome.
  • it is the probability of correctly determining a person who does not have the risk of developing desquamation glaucoma as a person who does not have the risk of developing desquamation syndrome or desquamation glaucoma.
  • a threshold value that is an appropriate cutoff value for discriminating between patients and non-patients
  • the same SNP group as the SNP group selected as the measurement target when obtaining the quantitative value of the subject A ROC curve created by taking the true positive rate (sensitivity) on the vertical axis and the true negative rate (1-specificity) on the horizontal axis (ROC analysis is performed).
  • the point at which the distance from the upper left corner of the graph is minimum may be set as the threshold, and the point farthest from the diagonal line where the area under the ROC curve (AUC) is 0.5 may be set as the threshold.
  • a point at which the specificity or sensitivity is obtained may be set as the threshold value.
  • a threshold value that gives a result with a sensitivity of 1 and (1 ⁇ specificity) closest to 0, for example, [(1 ⁇ sensitivity) 2 + (1 ⁇ specificity) 2 ] is minimized. Can be set as a threshold value.
  • the threshold value may be acquired separately when acquiring the quantitative value of the subject, or may be acquired in advance. Moreover, when comparing with the quantitative value of the subject, the analysis result obtained so far may be additionally updated as needed.
  • normalization or weighting may be performed from the viewpoint of improving the determination accuracy.
  • a normalization method a method of comparing with a normal distribution curve can be used.
  • weighting can be performed in consideration of the odds ratio of each SNP.
  • the results (number of possessed risk alleles) in each measurement step regarding the subject obtained by the information acquisition process are Providing information on the level of risk that the subject will develop desquamation syndrome or desquamation glaucoma, using as an index whether or not the cut-off value previously determined by ROC analysis is based on the SNP group used in A method is mentioned.
  • the presence or absence of the risk of onset is determined by comparing the number of risk alleles held by the subject with a preset threshold value for each measurement step.
  • the threshold value can be set in the same manner as in aspect 1.
  • the result of the presence or absence of the onset risk for every measurement step is integrated. Specifically, for example, when the measurement step is performed three times and “+” is displayed when there is a risk of onset, and “ ⁇ ” is displayed when there is no risk, the first determination result is “+” and the second determination The result is “+”, the third determination result is “+”, the integration result is “++++”, the first determination result is “+”, the second determination result is “+”, and the third determination result.
  • the integration result of “ ⁇ ” is “++ ⁇ ”, the first determination result is “+”, the second determination result is “ ⁇ ”, and the third determination result is “+”. -+ ". Therefore, even if the probability of being negative once in the three determinations is the same, “++ ⁇ ” and “++” fall under different classifications. Then, using the obtained integration results, the risk of developing desquamation syndrome or desquaic glaucoma based on the tendency to fall under the same classification on the graph of the group having the onset risk and the group not having the onset risk that has been known in advance Determine whether the value is high or low.
  • the graph of the group with the risk of onset and the group without the risk of onset can be created as follows. For example, whether or not there is a risk of developing desquamation syndrome or desquamation glaucoma for each pattern such as “++++”, “++-”, “++-”, etc. It can be created by accumulating the number of people.
  • the subject can obtain the information of the corresponding category from the integration result of the subject, so that the subject can develop the desquamation syndrome or desquamation glaucoma It can be determined whether there is a risk.
  • the probability of having the risk of developing desquamation syndrome or desquamation glaucoma may be calculated by applying the Bayes theorem described later.
  • a method of calculating a probability of having a risk of developing desquamation syndrome or desquamation glaucoma by applying Bayes' theorem to the result obtained in the information acquisition step can be mentioned.
  • the test subject has the risk of developing the disease, and the presence or absence of the risk of developing the disease is estimated from the test results.
  • PPV positive predictive value
  • NPV negative predictive value
  • the positive predictive value is the proportion of people who have a disease when the test result is positive
  • the negative predictive value is the proportion of those who have no risk of developing when the test result is negative. It is.
  • the result (number of risk alleles) obtained in the information acquisition process is compared with the threshold value in the same manner as in aspect 1, thereby causing the onset of desquamation syndrome or desquamation glaucoma.
  • the presence or absence of risk is judged, and the probability of developing risk is calculated by applying the Bayes' theorem method to the result.
  • the posterior probability positive predictive value, negative predictive value
  • the probability of the onset risk of desquamation syndrome or desquamation glaucoma is expressed as the posterior probability.
  • the probability of having an onset risk is the same as the prevalence, but if a positive result is obtained by the test using the Bayes' theorem method, the test This means that the probability of risk for a person can be expressed by a positive predictive value.
  • positive predictive value prevalence rate ⁇ sensitivity / [prevalence rate ⁇ sensitivity + (1 ⁇ prevalence rate) ⁇ (1 ⁇ specificity)]
  • negative predictive value specificity ⁇ (1 ⁇ Prevalence) / [specificity ⁇ (1 ⁇ prevalence) + prevalence ⁇ (1 ⁇ sensitivity)]
  • the prevalence 0.8% and the sensitivity of the test is 70 %
  • Specificity 70%
  • the positive predictive value is calculated as 1.8%
  • the negative predictive value is calculated as 99.7%. Therefore, since the risk of onset of a subject who gave a positive result is 1.8%, the prevalence is higher than the prevalence, and it can be advised to receive further examination.
  • the positive predictive value is calculated to be 9.3%, and the negative predictive value is calculated to be 99.9%.
  • the test subject who exceeded can determine with the onset risk of desquamation syndrome or desquamation glaucoma being higher.
  • a probability of having an onset risk based on the number of risk alleles is calculated
  • Examples include a method of calculating a probability of having a risk of developing desquamation syndrome or desquamation glaucoma with a probability of a preset percentage (%) or more.
  • the set percentage for example, an arbitrary numerical value such as 70%, 80%, 90%, or the like can be set. As the value is larger, the determination can be performed with higher accuracy.
  • desquamation syndrome or Calculate the probability density function with the risk of developing desquamation glaucoma For example, when calculating a probability of 70% or more, an area having a density in which the probability of having an onset risk that is a continuous random variable is 70 or more from the probability density function is the probability of having an onset risk.
  • the risk of developing desquamation syndrome or desquamation glaucoma in a subject is determined by comparing the total number of risk alleles with a threshold value to determine whether or not there is a risk of developing desquamation syndrome or desquamation glaucoma.
  • a threshold value determines whether or not there is a risk of developing desquamation syndrome or desquamation glaucoma.
  • the probability it is possible to provide more detailed information regarding the risk of developing the subject's desquamation syndrome or desquamation glaucoma.
  • the present invention also provides an apparatus for acquiring information related to the risk of developing desquamation syndrome or desquamation glaucoma.
  • the apparatus of the present invention includes a computer having a processor and a memory under the control of the processor, wherein the memory includes the following steps: Based on the allele information of single nucleotide polymorphism (SNP) in the biological sample collected from the subject, the SNP selected from the 12 core SNP groups shown in Table 1 and the pool SNP group shown in Table 2 Allele measurement step for measuring alleles for at least 30 SNPs in combination with (selected SNP group), Based on the measurement result of the allele, an information acquisition step of acquiring information on the risk of developing desquamation syndrome or desquamation glaucoma in the subject, and based on the information obtained above, the subject's desquamation syndrome or The computer program for making the said computer perform the information provision process which provides the information for determining the onset risk of desquamation glaucoma is recorded.
  • SNP single nucleotide polymorphism
  • the present invention also includes a computer program for causing a computer to determine the risk of developing desquamation syndrome or desquamation glaucoma in a subject.
  • a computer program for causing a computer to determine the risk of developing desquamation syndrome or desquamation glaucoma in a subject.
  • An example of such a computer program is as follows.
  • a computer program recorded on a computer readable medium comprising the following steps: Based on the allele information of single nucleotide polymorphism (SNP) in the biological sample collected from the subject, the SNP selected from the 12 core SNP groups shown in Table 1 and the pool SNP group shown in Table 2 Allele measurement step for measuring alleles for at least 30 SNPs in combination with (selected SNP group), Based on the measurement result of the allele, an information acquisition step of acquiring information on the risk of developing desquamation syndrome or desquamation glaucoma in the subject, and based on the information obtained above, the subject's desquamation syndrome or The information provision process which provides the information for determining the onset risk of desquamation glaucoma is performed, and the onset risk of desquamation syndrome or desquamation glaucoma in a subject is determined.
  • SNP single nucleotide polymorphism
  • the medium may be a medium in which the computer program is recorded temporarily and is readable by a computer.
  • FIG. 1 is a schematic diagram illustrating an example of a risk assessment device for desquamation syndrome or desquamation glaucoma in a subject.
  • the determination device 10 shown in FIG. 1 includes a measurement device 20 and a computer system 30 connected to the measurement device 20.
  • the measuring device 20 is a scanner or a mass spectrometer that detects a signal based on DNA bound to a probe on a microarray.
  • the signal is optical information such as a fluorescent signal or a mass spectrometry result.
  • the measurement apparatus 20 acquires optical information or mass spectrometry results based on nucleic acid derived from the biological sample of the subject that is bound to the probe on the microarray. Then, the obtained optical information or mass analysis result is transmitted to the computer system 30.
  • the scanner is not particularly limited as long as it can detect a signal based on DNA bound to the probe on the microarray. Since the signal varies depending on the labeling substance used for labeling the DNA derived from the biological sample of the subject, the scanner can be appropriately selected according to the type of the labeling substance. For example, when the labeling substance is a fluorescent substance, a microarray scanner capable of detecting fluorescence generated from the fluorescent substance is used as the measuring device 20.
  • the measuring device 20 may be a device including a DNA amplification device and a sequence analysis device.
  • a reaction solution containing a measurement sample, an enzyme for DNA amplification, a primer, and the like is set in the measurement device 20, and the DNA in the reaction solution is amplified by the DNA amplification method.
  • the measuring device 20 analyzes the base sequence of the amplification product to acquire sequence information, and transmits the obtained sequence information to the computer system 30.
  • the computer system 30 includes a computer main body 300, an input unit 301, and a display unit 302 that displays sample information and determination results.
  • the computer system 30 receives optical information, mass analysis results, or sequence information from the measuring device 20.
  • the processor of the computer system 30 executes a program for determining the risk of developing desquamation syndrome or desquamation glaucoma in the subject based on the optical information, the mass analysis result, or the sequence information.
  • the computer system 30 may be a device separate from the measuring device 20 as shown in FIG. 1 or may be a device that includes the measuring device 20. In the latter case, the computer system 30 may itself become the determination device 10.
  • the computer main body 300 includes a CPU (Central Processing Unit) 310, a ROM (Read Only Memory) 311, a RAM (Random Access Memory) 312, a hard disk 313, an input / output interface 314, A reading device 315, a communication interface 316, and an image output interface 317 are provided.
  • the CPU 310, ROM 311, RAM 312, hard disk 313, input / output interface 314, reading device 315, communication interface 316, and image output interface 317 are connected by a bus 318 so that data communication is possible.
  • the measuring device 20 is connected to the computer system 30 through a communication interface 316 so as to be communicable.
  • the CPU 310 can execute a program stored in the ROM 311 and a program loaded in the RAM 312.
  • the CPU 310 calculates the validity prediction value, reads the discriminant stored in the ROM 311, and determines the validity.
  • the CPU 310 outputs the determination result and causes the display unit 302 to display the determination result.
  • the ROM 311 is configured by a mask ROM, PROM, EPROM, EEPROM, or the like.
  • the ROM 311 records a program executed by the CPU 310 and data used for the program as described above.
  • the ROM 311 may record a preset threshold value or the like.
  • the RAM 312 is configured by SRAM, DRAM, or the like.
  • the RAM 312 is used for reading programs recorded in the ROM 311 and the hard disk 313.
  • the RAM 312 is also used as a work area for the CPU 310 when executing these programs.
  • the hard disk 313 is installed with an operating system to be executed by the CPU 310, a computer program such as an application program (a computer program for determining the risk of developing desquamation syndrome or desquamation glaucoma), and data used for executing the computer program. .
  • a preset threshold value or the like may be recorded on the hard disk 313.
  • the reading device 315 includes a flash memory, a flexible disk drive, a CD-ROM drive, a DVDROM drive, and the like.
  • the reading device 315 can read a program or data recorded on the portable recording medium 40. Sometimes referred to as a reader.
  • the input / output interface 314 includes, for example, a serial interface such as USB, IEEE 1394, RS-232C, a parallel interface such as SCSI, IDE, IEEE 1284, and an analog interface including a D / A converter, an A / D converter, and the like. It is configured.
  • An input unit 301 such as a keyboard and a mouse is connected to the input / output interface 314. The operator can input various commands to the computer main body 300 through the input unit 301.
  • the communication interface 316 is, for example, an Ethernet (registered trademark) interface.
  • the computer main body 300 can also transmit print data to a printer or the like via the communication interface 316.
  • the image output interface 317 is connected to a display unit 302 configured with an LCD, a CRT, or the like. Accordingly, the display unit 302 can output a video signal corresponding to the image data given from the CPU 310.
  • the display unit 302 displays an image (screen) according to the input video signal.
  • step S ⁇ b> 101 CPU 310 of determination apparatus 10 acquires fluorescence information from measurement apparatus 20.
  • step S ⁇ b> 102 the CPU 310 calculates fluorescence intensity from the acquired fluorescence information and stores it in the RAM 312.
  • step S ⁇ b> 103 the CPU 310 determines the presence / absence and type of each variant from the fluorescence intensity stored in the RAM 312, and calculates the risk allele total number according to the allele data stored in the ROM 311 or the hard disk 313.
  • step S104 the CPU 310 uses the calculated effectiveness prediction value and a preset threshold value stored in the ROM 311 or the hard disk 313 to increase or decrease the risk of developing the desquamation syndrome or desquamation glaucoma in the subject. Determine.
  • the process proceeds to step S105, and the CPU 310 displays a determination result indicating that the risk of developing desquamation syndrome or desquamation glaucoma in the subject is low.
  • step S106 when the total number of risk alleles is not lower than a preset threshold (that is, when the total number of risk alleles is equal to or greater than the cutoff value), the process proceeds to step S106, and CPU 310 causes desquamation syndrome in the subject. Or the determination result which shows that the onset risk of desquamation glaucoma is high is memorize
  • step S107 the CPU 310 outputs the determination result and displays it on the display unit 302 or causes the printer to print it.
  • the information which assists determination of whether the onset risk of desquamation syndrome or desquamation glaucoma in a subject is high can be provided to a doctor or the like.
  • Test Example 1 Selection of marker SNP (core SNP + pool SNP) 201 patients diagnosed with desquamation syndrome or desquamation glaucoma (patient group of desquamation syndrome or desquamation glaucoma) and diagnosed as not desquamation syndrome or desquamation glaucoma, and Genomic DNA was extracted from the blood of 697 non-patients who were judged not to have a family history of glaucoma by interview using a commercially available automatic nucleic acid extractor. Extraction of genomic DNA was performed according to the instruction manual of the equipment and kit. By this method, about 5 ⁇ g of genomic DNA was obtained from 350 ⁇ L of blood sample.
  • SNP analysis is performed using a commercially available microarray SNP analysis kit DNA microarray (Genome-Wide Human SNP Array 6.0) capable of analyzing about 1 million known SNPs on the human genome.
  • Genotype data of 906,600 SNPs The QC filter (Call Rate, ⁇ 0.95; MAF, ⁇ 0.01; HWE, ⁇ 0.001) was used to select 652,792 highly accurate SNP data.
  • 697 SNP marker candidate groups were extracted by the following process. (1) P ⁇ 0.001 was used as an extraction condition in genome-wide association analysis (chi 2 test with allele data).
  • the marker SNP was composed of 12 core SNPs and 450 pool SNPs.
  • Genotype data was encoded (numeric conversion) and normalized by the following procedure.
  • the combination of SNP marker candidate groups considering linkage disequilibrium (LD) was calculated by cluster analysis using principal component analysis (PCA).
  • a group obtained by removing the core SNP from the marker SNP was defined as a pool SNP.
  • Example 1 Blood was collected from 200 patient groups and 200 non-patient groups in the same manner as in Test Example 1, and genomic DNA was extracted. Allele data were obtained by hybridization using the probes shown in Example 1 (Table 3). And counted the total number of risk alleles.
  • the probes used in Example 1 are the 12 probes listed in Table 1 and 18 probes selected from Table 2.
  • the frequency distribution chart with the total number of risk alleles on the horizontal axis was created and the results of ROC analysis are shown in FIG. From FIG. 4, in Example 1, when the cut-off value with sensitivity of 72.5% and specificity of 80.0% is 31, the AUC is 0.846, and the frequency distribution chart also shows that there is no risk of onset and no group It can be seen that the distinction is made by group.
  • Example 2 Data acquisition was performed in the same manner as in Example 1 except that the probe used in Example 1 was different. Specifically, the probes shown in Table 4 below were used.
  • FIG. 5 shows the result of creating a frequency distribution diagram with the total number of risk alleles on the horizontal axis and performing ROC analysis.
  • Figure 5 shows that the AUC is 0.961 when the cutoff value is 67 with a sensitivity of 90.5% and a specificity of 85.5%, and the frequency distribution chart also distinguishes between the group with the risk of onset and the group without the risk of development. I can see that
  • the frequency distribution chart and ROC curve of the risk allele were obtained in the same manner as described above.
  • the results are shown in FIG. From Fig. 6, the first measurement result shows a cutoff value of 20 with a sensitivity of 79.0% and specificity of 77.0%, and the second measurement result shows a cutoff value of sensitivity of 81.5% and specificity of 73.0%. 22 were obtained, and the result of the third measurement was a sensitivity of 77.5%, and the cut-off value was 25 when the specificity was 72.5%, and it was found that the determination result in each measurement was obtained.
  • FIG. 7 shows the result of integrating the determination results of the three measurements. That is, the result of classifying the determination results of the three measurements is shown for each group having the onset risk and each group having no onset risk. From this, it can be seen that there is a distinction between the group with onset risk and the group without onset risk.
  • the analysis using the Bayes theorem was performed according to the following procedure.
  • the prior distribution ⁇ ( ⁇ ) is a uniform distribution (no information prior distribution). The prior distribution adopted the beta distribution.
  • Likelihood is chosen randomly from all specimens in patient and non-patient groups, selecting 200 patient groups and 200 non-patient groups, and the number of data (number of observations) and number of patients (positive) Number). The binomial distribution was adopted as the distribution.
  • the posterior distribution was calculated from Bayes' theorem (posterior distribution ⁇ ( ⁇
  • the average risk of onset (%), 95% confidence interval (%), and the probability of having the risk of onset (%) were calculated.
  • Example 3 Data acquisition was performed in the same manner as in Example 1 except that the probes used in Examples 1 and 2 were different. Specifically, the probes shown in Table 5 below were used.
  • FIG. 9 shows the frequency distribution chart of risk alleles and the results of ROC analysis performed in the same manner as in Example 1. From Fig. 9, AUC is 0.959 when the cut-off value is 93 with sensitivity of 92.5% and specificity of 84.5%, and the frequency distribution chart distinguishes between the group with risk of onset and the group without risk of onset. I can see that
  • the frequency distribution chart and ROC curve of the risk allele were obtained in the same manner as described above.
  • the results are shown in FIG. From Fig. 10, the first measurement result shows a cutoff value of 27 with sensitivity 76.5% and specificity 79.5%, and the second measurement result shows a cutoff value with sensitivity 70.0% and specificity 86.5%.
  • the result of the third measurement was a sensitivity of 73.0%, and the cut-off value at a specificity of 80.0% was 36. It was found that the determination result in each measurement was obtained.
  • FIG. 11 shows the result of integrating the determination results of the three measurements. That is, the result of classifying the determination results of the three measurements is shown for each group having the onset risk and each group having no onset risk. From this, it can be seen that there is a distinction between the group with onset risk and the group without onset risk.
  • Example 4 Data acquisition was performed in the same manner as in Example 1 except that the probes used in Examples 1 and 2 and 3 were different. Specifically, the probes shown in Table 6 below were used.
  • FIG. 13 shows the frequency distribution chart of risk alleles and the results of ROC analysis performed in the same manner as in Example 1. From FIG. 13, when the cut-off value with sensitivity of 90.0% and specificity of 91.5% is 120, AUC is 0.971, and the frequency distribution chart also shows the distinction between the group with onset risk and the group without onset risk. I can see that
  • the frequency distribution chart and ROC curve of the risk allele were obtained in the same manner as described above.
  • the results are shown in FIG. From Fig. 14, the result of the first measurement is 38 cut-off values when the sensitivity is 80.0% and the specificity is 80.5%, and the result of the second measurement is the cut-off value when the sensitivity is 78.5% and the specificity is 81.5%.
  • the result of the third measurement was a sensitivity of 76.5%, and the cut-off value at a specificity of 75.5% was 43. It was found that the determination result in each measurement was obtained.
  • FIG. 15 shows the result of integrating the determination results of the three measurements. That is, the result of classifying the determination results of the three measurements is shown for each group having the onset risk and each group having no onset risk. From this, it can be seen that there is a distinction between the group with onset risk and the group without onset risk.
  • Example 5 Marker SNP feedback improvement loop by Bayesian approach Data collection by obtaining follow-up and negative results of desquamation syndrome or desquamation glaucoma by follow-up study after judgment of Example 2 or Example 3 or Example 4 And update (additional learning).
  • Bayes prior distribution ⁇ ( ⁇ ) is updated using the classification result newly obtained by the follow-up study.
  • ⁇ Relevant analysis chi 2 test with allele data
  • genotype data newly obtained by follow-up studies added to conventional results will be performed, and the pool SNP will be replaced.
  • the cutoff value is reset by recalculating the ROC analysis of each measurement in the “information acquisition step”, the Bayesian pre-distribution in the “information provision step” is forgotten, and the uniform distribution Recalculate as (no information prior distribution).
  • the cutoff value is reset by recalculating the ROC analysis of each measurement in the “information acquisition step”
  • the Bayesian pre-distribution in the “information provision step” is forgotten, and the uniform distribution Recalculate as (no information prior distribution).
  • the SNP allele of the present invention By analyzing the SNP allele of the present invention on the DNA derived from the subject by the method of the present invention, it is possible to determine whether the subject has a risk of developing desquamation syndrome or desquamation glaucoma. Based on this risk, the subject can take preventive measures for desquamation syndrome or desquamation glaucoma or receive appropriate treatment including preemptive medicine.
  • the SNP of the present invention by selecting a person with a high risk of developing desquamation syndrome or desquamation glaucoma and conducting a clinical trial of a glaucoma therapeutic drug, it is useful because the period of the clinical trial of the glaucoma therapeutic drug can be shortened. It is.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Sustainable Development (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。本発明の方法により、被検者由来のサンプル中に存在する本発明のSNP群について分析することにより、被検者における落屑症候群又は落屑緑内障の発症リスクの有無を判定し、さらには、リスクの高低を予測することができる。

Description

落屑症候群又は落屑緑内障の発症リスクの判定方法
 本発明は、落屑症候群(exfoliation syndrome)又は落屑緑内障(exfoliation glaucoma)の発症リスクを判定する方法、落屑症候群又は落屑緑内障の発症リスク判定装置、及び該装置に実行させるためのコンピュータプログラムに関する。
 緑内障は、網膜神経節細胞が障害され、不可逆的に進行し失明に至る神経変性疾患である。緑内障の病型の一つである落屑緑内障は前房内に落屑物質が観察される落屑症候群から発症する緑内障である。
 非特許文献1では落屑緑内障あるいは落屑症候群において、LOXL1遺伝子に特定のSNPsが認められることが開示されている。また、非特許文献2ではTBC1D21遺伝子とPML遺伝子において、非特許文献3ではCACNA1A遺伝子においても、落屑緑内障あるいは落屑症候群に関連するSNPsが認められることが開示されている。
http://science.sciencemag.org/content/sci/317/5843/1397.full.pdf http://www.readcube.com/articles/10.1038/srep05340 http://www.nature.com/ng/journal/v47/n4/pdf/ng.3226.pdf
 本発明の課題は、落屑症候群又は落屑緑内障の発症リスクを高精度に判定する方法、当該方法を実行する落屑症候群又は落屑緑内障の発症リスク判定装置、及び当該装置に実行させるためのコンピュータプログラムを提供することである。
 本発明者らは、前記課題を解決せんと鋭意検討した結果、本発明者らが保有する多数の落屑症候群又は落屑緑内障患者と非落屑症候群かつ非緑内障健常人の検体を用いて高密度チップにより取得したジェノタイプデータ情報に基づくゲノムワイド関連解析(genome-wide association study, GWAS)を実施することで、落屑症候群又は落屑緑内障の発症リスクマーカーSNP群を同定し、その中でも、高精度な判定に寄与する特定のSNP群を見出し、当該SNP群と残りのSNPから選択されるSNP群とを組み合わせたSNP集団に関して、サンプル中のリスクアレルの総数を測定することにより、落屑症候群又は落屑緑内障の発症リスクを高精度に判定できることを見出し、本発明を完成するに至った。
 即ち、本発明は、下記〔1〕~〔3〕に関する。
〔1〕 被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。
〔2〕 プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータを備え、前記メモリには、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている、落屑症候群又は落屑緑内障の発症リスクを有する被検者の検出装置。
〔3〕 プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータであって、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させる、コンピュータプログラム。
 本発明の方法により、被検者由来のサンプル中に存在する本発明のSNP群について分析することにより、被検者における落屑症候群又は落屑緑内障の発症リスクの有無を判定し、さらには、リスクの高低を予測することができる。このリスクに基づき被検者は落屑症候群又は落屑緑内障の予防措置を講じ、又は適切な治療を受けることができる。
図1は、被検者における落屑症候群又は落屑緑内障の発症リスク判定装置の一例を示した概略図である。 図2は、図1に示される判定装置のハードウェア構成を示すブロック図である。 図3は、図1に示される判定装置を用いた落屑症候群又は落屑緑内障の発症リスクの判定のフローチャートである。 図4は、表1記載のSNPと表2から選択されたSNPの計30個を用いて発症リスクの有無の判定を行った結果を示した図である。 図5は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。 図6は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。 図7は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。 図8は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。 図9は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。 図10は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。 図11は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。 図12は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。 図13は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。 図14は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。 図15は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。 図16は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。
 本発明は、特定の一塩基多型(以下、SNPと記載することもある)についてアレルをin vitroで検出する工程を含む、落屑症候群又は落屑緑内障の発症リスクを判定する方法であって、被検者由来のサンプルにおいて前記したアレルを測定し、当該アレルがリスクアレルである場合に、その情報を用いて落屑症候群又は落屑緑内障の発症リスクがあると判定できる情報を提供する、落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法である。即ち、本発明は、高精度なリスク判定に寄与する特定のSNP群を構成メンバーとして含む測定対象を設定し、そこで検出したリスクアレルの総数を数え、当該リスクアレルの総数が予め設定された閾値を上回る場合に落屑症候群又は落屑緑内障の発症リスクがあるとする情報を提供できることに大きな特徴を有する。これにより、落屑症候群又は落屑緑内障の発症リスクの診断を補助することが可能となる。よって、本発明の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法とは、落屑症候群又は落屑緑内障の発症リスクに関する情報を提供する方法でもあり、また、落屑症候群又は落屑緑内障の発症リスクを判定、評価、又は検査する方法でもある。なお、本明細書において、「多型」または「バリアント」とは、ある生物種におけるゲノムの特定の位置の塩基配列や構造(挿入・欠失、逆位、コピー数)に多様性が認められることを言い、多型が存在する部位(以下、多型部位ともいう)とは一塩基多型(SNP)等のバリアントが認められるゲノム上の部位を言う。
 本発明において、「アレル」とは、ある多型部位において取りうる、互いに異なる塩基を有するそれぞれの型を言い、「リスクアレル」とは、落屑症候群又は落屑緑内障と関連するSNPの各アレルのうち、落屑症候群又は落屑緑内障ではない健常者群より、落屑症候群又は落屑緑内障の患者群において頻度が高いアレルを言い、「非リスクアレル」とは、リスクアレルではないアレルを言う。
 本発明において、「落屑症候群又は落屑緑内障の発症リスク」とは、被検者の落屑症候群又は落屑緑内障に関するリスクであり、疾患感受性によって決まる将来的な落屑症候群又は落屑緑内障の発症の可能性を言う。本発明において、リスクの予測とは、被検者の将来のリスクの有無を現時点で判定し、又は、被検者の将来のリスクの大小を現時点で決定することを言う。
 本発明の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法は、
特定のSNPについてアレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて被検者の情報を取得する情報取得工程、及び
前記情報に基づいて被検者の発症リスクを判定するための情報を提供する情報提供工程
を含む。以下に工程ごとに順を追って説明するが、先に、本発明において測定対象となる、落屑症候群又は落屑緑内障の発症に関連するSNP群を同定した方法を説明する。なお、落屑症候群又は落屑緑内障の発症に関連するSNP群のことを、本発明のSNP群と記載することもある。
(落屑症候群又は落屑緑内障の発症に関連するSNP群の同定)
 本発明において、落屑症候群又は落屑緑内障の発症に関連するSNP群は、具体的には、先ず、落屑症候群又は落屑緑内障と診断された患者、及び、落屑症候群又は落屑緑内障ではないと診断され、かつ、問診によって緑内障家族歴を有さないと判断された非落屑症候群かつ非緑内障健常者(単に、非患者又は対照者と記載することもある)からゲノムDNAをそれぞれ抽出する。そして、ヒトゲノム上の公知のSNP約20万~500万個を指標として、個々のSNPにおけるアレル頻度を患者群と非患者群において比較し種々解析することにより、頻度の差が統計学的有意であると認められるマーカー候補のSNP群を見出す。次いで、この候補群から更に解析を行うことで、本発明で用いるSNP群(マーカーSNP群)を決定し、その中から、より高精度な判定結果を与える特定のSNP群(コアSNP群)と残りのSNP群(プールSNP群)を設定し、これらを組み合わせて用いることにより、落屑症候群又は落屑緑内障の発症リスクの有無の判定、及び落屑症候群又は落屑緑内障の発症リスクの大小の予測が可能となる。なお、詳細は実施例の項にて説明するが、以下のような方法により、本発明で開示された落屑症候群又は落屑緑内障に関連するSNP群を同定することができる。
(1) マーカー候補のSNP群を見出す方法
 患者群と非患者群、それぞれの血液からゲノムDNAを抽出する。血液中のゲノムDNAは公知の任意の方法によって抽出することができるが、例えば細胞を溶解して溶出させたDNAを、シリカでコーティングした磁性ビーズの表面に結合させ、磁気を利用して分離、回収することによってDNAを抽出することができる。
 抽出したDNAサンプル中のSNPにおけるアレルの同定手段は特に限定されず、当該技術において公知のSNP検出方法及びSNPタイピング方法から適宜選択すればよい。
 ここでは、ゲノムワイド関連解析(GWAS)を用いる手法について説明する。具体的には、例えば、ゲノム全領域に分布するSNPを含むDNAマイクロアレイ(アフィメトリクス社、Genome-Wide Human SNP Array 6.0)を用いて行うことができる。その際に、Quality control(以下、「QC」ともいう)を行うことで、抽出するSNPを選択してもよい。
 Quality controlにおけるSNP採否の基準となるコールレートとしては、例えば、好ましくは85%以上、より好ましくは90%以上、更に好ましくは95%以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。
 Quality controlで選択されたSNPについては、更に絞り込みを行う。具体的には、例えば、統計ソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10-3以下、より好ましくは3×10-4以下、更に好ましくは1×10-4以下を満たすSNPを選択する。
 次に、前記抽出されたSNPについては、ジェノタイピング不良SNPを除外するための2次元クラスタープロット解析、例えば、ジェノタイピングソフトウェア(アフィメトリクス社、Genotyping Console)から得られるクラスタープロット画像を目視で観察することによって、ジェノタイピング不良のSNPを除外して、マーカー候補のSNP群を決定する。
 このようにして選択されたSNPは、GenBankやdbSNPのような公知配列や公知SNPのデータベースを参照することにより、そのSNPが存在するゲノム上の位置、配列情報、SNPが存在する遺伝子又は近傍に存在する遺伝子、遺伝子上に存在する場合にはイントロン又はエキソンの区別やその機能、他の生物種における相同遺伝子などの情報を得ることができる。
(2) マーカーSNP群を見出す方法
 次に、前記で得られたマーカー候補のSNP群について、ジェノタイプデータを数値化して抽出する。
 数値化においては、ジェノタイプデータ及びリスクアレルデータベースを参照して、例えばジェノタイプデータに含まれる所定のアレルにおいて、リスクアレルがホモの場合には数値2を、リスクアレルがヘテロの場合には数値1を、非リスクアレルがホモの場合には数値0を、それぞれ付与する。そして、得られた数値を、各アレルの出現頻度の平均値と観測される頻度を用いて以下の数式により正規化を行って、選択されたSNP群における数値化したジェノタイプデータ行列を作成する。
Figure JPOXMLDOC01-appb-M000001
 なお、リスクアレルとは、患者群に高頻度に出現するアレルをいう。本発明で、リスクアレルはオッズ比に基づいて規定される。オッズ比とは、一般に患者群における危険因子を持つ人の割合と持たない人の割合の比、即ちオッズを、非患者群において同様に求めたオッズで除したものであり、本発明のようなケース・コントロール研究において用いられることが多い。本発明においてオッズ比はアレル頻度に基づいて求められ、患者群における、あるアレルの頻度と他のアレルの比を、非患者群において同様にして得られる頻度の比で除して算出することができる。なお、各アレルの出現頻度は、例えば、被検者のデータを取得するに伴って、そのデータが追加更新されて随時再算出可能なものである。
 次いで、数値化したジェノタイプデータ行列を用いて、クラスター解析を行う。具体的には、例えば、SNP間の連鎖不平衡(linkage disequilibrium, LD)を考慮し、独立性が高いと思われるSNPを主成分分析(principal component analysis, PCA)により決定する。主成分分析の方法としては、公知の方法を用いることが出来るが、例えば、前記で選択されたSNPについて、全ゲノム又は染色体のそれぞれにおいて情報縮約を行って因子負荷量(主成分と元の変数との間の相関係数に相当)を算出し、それに基づいて候補領域を決定し、当該領域内でP値が最も低いSNPを候補SNPとして選択することで、本発明のマーカーSNP群を決定する。但し、全ゲノムからの計算と染色体のそれぞれからの計算から重複したSNPは除く。
 次に、本発明のマーカーSNP群から、高精度な判定に寄与する特定のSNP群を更に選定する方法について説明する。以降、かかるSNP群のことを、コアSNP群と記載する。
(3) コアSNP群とプールSNP群を見出す方法
 コアSNP群は、前記で得られたマーカーSNP群からP値が低い順に50個程度のSNP群を選択し、選択されたSNP群について新たな集団による再現実験を行うことで決定することができる。また、プールSNP群は、マーカーSNP群からコアSNP群を除いた群とする。
 より詳しくは、前記のようにして選択されたSNP群について、マーカー候補のSNP群を同定する際に用いた患者群と非患者群とは別の集団から、採取したDNAを用いてアレルの同定を行う。ここで、別集団とは、一部に重複が生じていてもよいが、完全非同一が好ましい集団である。解析方法としては、例えば、質量分析法が好ましく、公知のMassARRAYを用いることができる。なお、Quality controlを行ってもよく、その際のコールレートとしては、例えば、好ましくは85%以上、より好ましくは90%以上、更に好ましくは95%以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。
 次いで、前記同定されたSNPについて、前記と同様にして2次元クラスタープロット解析を行って、ジェノタイピング不良SNPを除外する。
 このようにして選択されたSNPについて、例えば、ジェノタイピングソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10-3以下、より好ましくは3×10-4以下、更に好ましくは1×10-4以下を満たすSNPを選択する。
 選択されたSNP群については、2回の解析結果を統合して判断することが好ましいことから、公知のメタ解析の手法、例えば、コクラン・マンテル・ヘンツェル法によって解析結果を統合して評価することができる。そして、当該解析手法によりP値が3×10-3以下を満たすSNPを本発明におけるコアSNP群(計12個)とし、コアSNP群に該当しない残りのSNP群(計450個)をプールSNP群とする。以下に、コアSNP群におけるSNPを含むプローブ配列を表1に、プールSNP群におけるSNPを含むプローブ配列を表2(表2-1~表2-23)にそれぞれ示す。表中、各SNPの対立遺伝子(アレル)はプローブ配列における括弧内に記載し、リスクアレルを含む配列を配列番号A、非リスクアレルを含む配列を配列番号Bとする。
Figure JPOXMLDOC01-appb-T000002
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000004
Figure JPOXMLDOC01-appb-T000005
Figure JPOXMLDOC01-appb-T000006
Figure JPOXMLDOC01-appb-T000007
Figure JPOXMLDOC01-appb-T000008
Figure JPOXMLDOC01-appb-T000009
Figure JPOXMLDOC01-appb-T000010
Figure JPOXMLDOC01-appb-T000011
Figure JPOXMLDOC01-appb-T000012
Figure JPOXMLDOC01-appb-T000013
Figure JPOXMLDOC01-appb-T000014
Figure JPOXMLDOC01-appb-T000015
Figure JPOXMLDOC01-appb-T000016
Figure JPOXMLDOC01-appb-T000017
Figure JPOXMLDOC01-appb-T000018
Figure JPOXMLDOC01-appb-T000019
Figure JPOXMLDOC01-appb-T000020
Figure JPOXMLDOC01-appb-T000021
Figure JPOXMLDOC01-appb-T000022
Figure JPOXMLDOC01-appb-T000023
Figure JPOXMLDOC01-appb-T000024
Figure JPOXMLDOC01-appb-T000025
 かくして選択された本発明のSNP群を用いて、被検者由来のサンプルに対して以下の各工程を行う。
〔アレル測定工程〕
 アレル測定工程では、前記コアSNP群(表1)について必ず測定を行い、かつ、プールSNP群(表2)から選ばれるSNP(プール選抜SNP群)についても測定を行う。測定対象のSNP数は、コアSNP群を含めた合計が少なくとも30個であれば特に限定はなく、例えば、測定対象が30個の場合は、コアSNP 12個とプール選抜SNP 18個で構成される。測定対象が40個の場合は、コアSNP 12個とプール選抜SNP 28個で構成される。測定対象が50個の場合は、コアSNP 12個とプール選抜SNP 38個で構成される。測定対象が90個の場合は、コアSNP 12個とプール選抜SNP 78個で構成される。測定対象が120個の場合は、コアSNP 12個とプール選抜SNP 108個で構成される。測定対象が150個の場合は、コアSNP 12個とプール選抜SNP 138個で構成される。
 また、本発明では、1回の測定結果を持って次の情報取得工程に進んでもよいが、判定精度を向上させる観点から、複数回の測定ステップを行って得られた複数の結果を持って情報取得工程に進むことができる。この場合、12個のコアSNP群についてはいずれかの測定ステップで、重複せずに、かつ、12個全てが測定対象として用いられ得る。ステップ毎のコアSNP群の数は同一であっても、異なっていてもよい。また、ステップ毎の測定対象SNP数も同一であっても、異なっていてもよく、各ステップにおいてコアSNP群を含めた合計が少なくとも30個であれば特に限定はない。
 具体的には、例えば、アレル測定工程が2回の測定ステップを含む場合は、
コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップ
を含む工程が例示され、ここで、前記第1プール選抜SNP群と第2プール選抜SNP群とは非同一である。各測定ステップにおける測定対象のSNP数を例示すると、例えば、第1SNP群における第1コアSNP群は6個、第1プール選抜SNP群が24個以上であり、第2SNP群における第2コアSNP群は6個、第2プール選抜SNP群が24個以上の例が挙げられる。なお、本明細書において「非同一」とは完全同一ではないことを意味し、例えば、1個のみ異なる場合であってもよく、プール選抜SNP群の構成SNPが全て異なる場合であってもよい。
 また、アレル測定工程が3回の測定ステップを含む場合は、
コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップと、
第1コアSNP群及び第2コアSNP群とは異なる1個以上のSNP(第3コアSNP群)と、プールSNP群から選ばれる複数のSNP(第3プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第3SNP群について測定を行う第3測定ステップ
を含む工程が例示され、ここで、前記第1プール選抜SNP群と第2プール選抜SNP群と第3プール選抜SNP群とはいずれも非同一である。また、各測定ステップにおける測定対象のSNP数を例示すると、例えば、第1SNP群における第1コアSNP群は4個、第1プール選抜SNP群が26個以上であり、第2SNP群における第2コアSNP群は4個、第2プール選抜SNP群が26個以上であり、第3SNP群における第3コアSNP群は4個、第3プール選抜SNP群が26個以上である例が挙げられる。
 なお、本発明においては、必要により、4回目以降の測定を行うこともできる。
 本発明で用いられる生体試料としては、ゲノム由来のDNAを抽出可能なものであれば何でも良い。例えば、全血、全血球、白血球、リンパ球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織、又は毛根等が用いられる。かかる生体試料からのDNA抽出方法としては、公知の任意の方法を採用することができる。
 測定対象のSNP群に関しては、公知の方法に従って、そのアレルを決定して測定結果を得る。具体的には、例えば、本発明のSNP群の配列情報に基づき設計した、各アレルに特異的なプローブ(表1~表2)を用いてハイブリダイズさせ、そのシグナルを検出することによりそれぞれのアレルを検出することができる。プローブを用いてハイブリダイズさせる方法の例としてはタックマン法、インベーダー(Invader(登録商標))法、ライトサイクラー法、サイクリンプローブ法、MPSS法、ビーズアレイ法、DNAチップ法、マイクロアレイ法などがある。また、プローブによるハイブリダイズを行わずにアレルを検出することも可能であり、例えば、PCR-RFLP法、SSCP法、質量分析法、次世代シークエンス法、ダイレクトシークエンス法などを用いることができる。これらの方法は公知の条件に従って行うことができる。
 かくして得られた測定結果を次の情報取得工程に供する。
〔情報取得工程〕
 情報取得工程では、測定対象のアレルに基づいて落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する。アレルの情報としては、バリアントが存在するか否かについての情報や測定されたアレルの種類についての情報であってもよく、その数を取得したものであってもよい。また、SNPと相関する値(統計値など)として算出されたものであってもよい。なかでも、本発明では、判定精度を向上する観点から、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントしたものであることが好ましい。即ち、予め取得したリスクアレルデータに基づいて、測定されたアレルがリスクアレルであるか否かの判別を行って、測定対象のSNP群全体においてリスクアレルと判定されたアレルの総数(リスクアレル保有数ともいう)を数える。また、複数回の測定ステップを行う場合には、各測定においてリスクアレルの総数があらかじめ設定した予め設定された閾値を超えるかどうかで、陽性か陰性かを判定し、それらの数をカウントする。このようにして得られたリスクアレルの総数と、複数回の測定ステップを行う場合には、更に、各測定結果の陽性、陰性の個数を被検者の定量値として認定して、次の情報提供工程に進むことが好ましい。
〔情報提供工程〕
 情報提供工程では、得られた情報に基づいて被検者の発症リスクを判定するための情報を被検者に提供する。
 発症リスクを判定する方法としては、例えば、前記工程により得られる情報がリスクアレル保有数である場合、具体的には、4つの態様が挙げられる。
態様1:リスクアレル保有数の数値によって発症リスクの有無を判定する態様
態様2:複数のリスクアレル保有数が得られる場合の発症リスクの有無を統合して判定する態様
態様3:リスクアレル保有数に基づいて発症リスクを有する確率を算出する態様
態様4:リスクアレル保有数に基づいて所定の確率で発症リスクを有する確率を算出する態様
 態様1の方法としては、例えば、情報取得工程により得られた被検者に関する結果(リスクアレル保有数)が、アレル測定工程で用いられたSNPに基づいて予めROC(Receiver Operating Characteristic)分析により定められたカットオフ値を、上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は当該リスクが低いとの情報を提供する方法が挙げられる。
 より詳しくは、先ず、被検者のリスクアレル保有数を予め設定された閾値と対比する。閾値とは患者と非患者とを識別する適切なカットオフ値のことであり、当該閾値と定量値を対比することにより、落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定できる。
 閾値は以下のようにして設定することができる。被検者の定量値を取得する際に測定対象として選定されたSNP群と同じSNP群に関して、予め落屑症候群又は落屑緑内障か否かを診断された被検者から採取した生体試料を用いて、上述のようにしてリスクアレル数を測定し、「落屑症候群又は落屑緑内障の発症リスクの有無」と「リスクアレル数」を統計的に処理することにより、両データ間の相関を解析する。解析された結果から、例えば、真陽性率の高さ(感度の高さ)を重視するか、真陰性率の高さ(特異度の高さ)を重視するか、又は真陽性率と真陰性率をどの程度でバランスさせるか等の目的に応じて、閾値を設定することができる。即ち、測定対象のSNP群が異なれば、そこに存在するリスクアレルも当然異なることから、測定対象のSNP群によって閾値は変動する。ここで、真陽性率とは、落屑症候群又は落屑緑内障の発症リスクを有する者を正しく落屑症候群又は落屑緑内障の発症リスクを有する者として判定する確率のことであり、真陰性率とは、落屑症候群又は落屑緑内障の発症リスクを有しない者を正しく落屑症候群又は落屑緑内障の発症リスクを有しない者として判定する確率のことである。
 患者と非患者とを識別する適切なカットオフ値である閾値の具体的な設定方法としては、先ず、被検者の定量値を取得する際に測定対象として選択されたSNP群と同じSNP群に関して、縦軸に真陽性率(感度)、横軸に真陰性率(1-特異度)をとって作成したROC曲線を作成する(ROC分析を実施する)。次に、グラフの左上隅からの距離が最小となる点を閾値としてもよく、ROC曲線下面積(Area Under the Curve, AUC)が0.5となる斜線から最も離れた点を閾値としてもよく、任意の特異度や感度になるような点を閾値として設定してもよい。本発明では、感度が1、(1-特異度)が0に最も近い結果を与える閾値を設定することが好ましく、例えば、〔(1-感度)2+(1-特異度)2〕が最少となる値を閾値と設定することができる。
 なお、閾値は、被検者の定量値を取得する際に別途同時に取得してもよく、事前に取得しておいたものであってもよい。また、被検者の定量値と比較する際に、それまでに得られた解析結果を随時追加更新して、取得されたものであってもよい。
 また、閾値の設定においては、判定精度の向上の観点から、正規化や重み付けを行ってもよい。具体的には、例えば、正規化の方法としては、正規分布曲線と比較する方法を用いることができる。また、重み付けの方法としては、各SNPのオッズ比を考慮して重み付けを行うことができる。
 こうして予め設定された閾値と被検者の定量値とを対比することで、被検者が落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定することができる。
 態様2の方法としては、例えば、アレル測定工程が複数の測定ステップを含む場合、情報取得工程により得られた被検者に関する各測定ステップでの結果(各リスクアレル保有数)が、各測定ステップで用いられたSNP群に基づいて予めROC分析により定められたカットオフ値を上回るか否かを指標として、前記被検者が落屑症候群又は落屑緑内障を発症するリスクの高低についての情報を提供する方法が挙げられる。
 より詳しくは、先ず、被検者のリスクアレル保有数を、測定ステップ毎に、予め設定された閾値と対比して発症リスクの有無を判定する。閾値は態様1と同様にして設定することができる。次に、測定ステップ毎の発症リスクの有無の結果を統合する。具体的には、例えば、測定ステップを3回行って、発症リスクがある場合を「+」、ない場合を「-」として表示する場合、1回目の判定結果が「+」、2回目の判定結果が「+」、3回目の判定結果が「+」の統合結果は「+++」であり、1回目の判定結果が「+」、2回目の判定結果が「+」、3回目の判定結果が「-」の統合結果は「++-」であり、1回目の判定結果が「+」、2回目の判定結果が「-」、3回目の判定結果が「+」の統合結果は「+-+」に分類される。よって、3回の判定において1回陰性であるという確率としては同じであっても、「++-」と「+-+」は異なる分類に該当することになる。そして、得られた統合結果を用いて、予め判明している発症リスクを有する群・発症リスクを有さない群のグラフ上において同じ分類に該当する傾向に基づいて落屑症候群又は落屑緑内障の発症リスクが高いか低いかを判定する。
 発症リスクを有する群・発症リスクを有さない群のグラフは以下のようにして作成することができる。例えば、予め診断された被検者について統合結果を得て、「+++」、「++-」、「+-+」等のパターン毎に、落屑症候群又は落屑緑内障の発症リスクを有するか否かの人数を集積することで作成することができる。
 こうして予め作成された発症リスクを有する群・発症リスクを有さない群のグラフにおいて、被検者の統合結果から該当する区分の情報を得ることで、被検者が落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定することができる。
 なお、態様2において、後述するベイズ定理を当てはめて、落屑症候群又は落屑緑内障の発症リスクを有する確率を算出してもよい。
 態様3の方法としては、例えば、情報取得工程で得られた結果にベイズ定理を当てはめて、落屑症候群又は落屑緑内障を発症するリスクを有する確率を算出する方法が挙げられる。一般に、臨床現場においては、検査対象者がその疾患の発症リスクを有するか否かは不明であり、検査結果から疾患の発症リスクの有無を推定することになるので、検査方法の陽性的中率(PPV)や陰性的中率(NPV)が高いことも望まれている。ここで、陽性的中率とは、検査結果が陽性の場合に疾患を有する者の割合であり、陰性的中率とは、検査結果が陰性の場合に発症リスクを有していない者の割合である。落屑症候群又は落屑緑内障の発症リスクを有する確率として提示することで当該確率が高いほど、落屑症候群又は落屑緑内障を発症するリスクの高い群に分類されることがより容易に理解されることになる。
 具体的な発症リスクを有する確率を算出する方法としては、情報取得工程で得られた結果(リスクアレル保有数)を態様1と同様にして閾値と対比することで、落屑症候群又は落屑緑内障の発症リスクの有無を判断し、その結果にベイズ定理の方法を当てはめて発症リスクを有する確率を算出する。ベイズ定理の方法においては、事前確率(有病率)に、前述した感度と特異度を組み合わせて事後確率(陽性的中率、陰性的中率)を求めることができることから、本発明においては、落屑症候群又は落屑緑内障の発症リスクの確率が事後確率として表される。言い換えると、ベイズ定理の方法を用いない場合は、発症リスクを有する確率は有病率と同じであるけれども、ベイズ定理の方法を用いることにより、検査により陽性結果が出た場合は、その被検者の発症リスクの確率は陽性的中率により表すことができることを意味する。具体的には、陽性的中率=有病率×感度/〔有病率×感度+(1-有病率)×(1-特異度)〕、陰性的中率=特異度×(1-有病率)/〔特異度×(1-有病率)+有病率×(1-感度)〕により求めることができ、例えば、有病率が0.8%であって、検査の感度が70%、特異度が70%の場合、陽性的中率は1.8%、陰性的中率は99.7%と算出される。よって、陽性結果が出た被検者の発症リスクは1.8%であることから、有病率よりも高く、更なる診察を受けるように助言することができる。また、前記検査を3回組み合わせて行った場合には、陽性的中率は9.3%、陰性的中率は99.9%と算出されることから、3回目の検査においてリスクアレル数がカットオフ値を超えた検査対象者は、落屑症候群又は落屑緑内障の発症リスクがより高いと判定することができる。
 こうして被検者の全体バックグラウンドとして、有病率の影響も含めた判定が行なえることで、被検者の落屑症候群又は落屑緑内障の発症リスクの確率として提示することが可能となる。
 態様4の方法としては、例えば、情報取得工程で得られた結果にベイズ定理を当てはめて、リスクアレル保有数に基づく発症リスクを有する確率(平均発症リスク、95%信用区間)を算出し、更に予め設定されたパーセント(%)以上の確率で落屑症候群又は落屑緑内障を発症するリスクを有する確率を算出する方法が挙げられる。ここで、設定されるパーセントとしては、例えば、70%、80%、90%等の任意の数値を設定することができ、値が大きい程、高精度で判定を行うことができる。
 より詳しくは、例えば、態様2で用いた予め診断された被検者から得られた統合結果「+++」、「++-」、「+-+」等のパターン毎に、ベイズ定理により落屑症候群又は落屑緑内障の発症リスクを有する確率密度関数を算出する。例えば70%以上の確率を算出する場合、確率密度関数から連続確率変数である発症リスクを有する確率が70以上となる密度を範囲とする面積が発症リスクを有する確率となる。
 かくして、本発明においては、被検者の落屑症候群又は落屑緑内障の発症リスクを、リスクアレル数の合計数を閾値と対比することで、落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定するだけでなく、その確率を算出することによって、被検者の落屑症候群又は落屑緑内障の発症リスクに関する情報をより詳細に提供することができる。
 本発明はまた、落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する装置を提供する。
 本発明の装置としては、プロセッサおよび前記プロセッサの制御下にあるメモリを備えたコンピュータを含み、前記メモリには、下記の工程:
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている。
 また、本発明には、被検者における落屑症候群又は落屑緑内障の発症リスクの判定をコンピュータに実行させるためのコンピュータプログラムも含まれる。そのようなコンピュータプログラムとしては、例えば、次のとおりである。
 コンピュータに読み取り可能な媒体に記録されているコンピュータプログラムであって、下記の工程:
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させて、被検者における落屑症候群又は落屑緑内障の発症リスクの判定を行わせる。
 上記の媒体は、上記のコンピュータプログラムが非一時的に記録され、且つコンピュータに読取可能な媒体であってもよい。
 以下に、本発明の方法を実施するのに好適な装置の一例を、図面を参照して説明する。しかし、本実施形態は、この例のみに限定されるものではない。図1は、被検者における落屑症候群又は落屑緑内障の発症リスクの判定装置の一例を示した概略図である。図1に示された判定装置10は、測定装置20と、該測定装置20と接続されたコンピュータシステム30とを含んでいる。
 本実施形態において、測定装置20は、マイクロアレイ上のプローブと結合したDNAに基づくシグナルを検出するスキャナーもしくは質量分析機器である。本実施形態において、シグナルは、蛍光シグナルなどの光学的情報もしくは質量分析結果である。測定用試料と接触させたマイクロアレイを測定装置20にセットすると、測定装置20は、マイクロアレイ上のプローブに結合した、被検者の生体試料由来の核酸に基づく光学的情報もしくは質量分析結果を取得し、得られた光学的情報もしくは質量分析結果をコンピュータシステム30に送信する。
 スキャナーは、マイクロアレイ上のプローブに結合したDNAに基づくシグナルの検出が可能であれば特に限定されない。シグナルは、被検者の生体試料由来のDNAの標識に用いられた標識物質によって異なることから、スキャナーは、標識物質の種類に応じて適宜選択することができる。例えば、標識物質が蛍光物質である場合、測定装置20として、当該蛍光物質から生じる蛍光を検出可能なマイクロアレイスキャナーが用いられる。
 なお、SNPを次世代シークエンス法やダイレクトシークエンス法により検出する場合、測定装置20は、DNA増幅装置及びシークエンス解析装置からなる装置であってもよい。この場合、測定用試料、DNA増幅用の酵素及びプライマーなどを含む反応液を測定装置20にセットし、DNA増幅法によって反応液中のDNAを増幅させる。そして、測定装置20は、増幅産物の塩基配列を解析して配列情報を取得し、得られた配列情報をコンピュータシステム30に送信する。
 コンピュータシステム30は、コンピュータ本体300と、入力部301と、検体情報や判定結果などを表示する表示部302とを含む。コンピュータシステム30は、測定装置20から光学的情報もしくは質量分析結果もしくは配列情報を受信する。そして、コンピュータシステム30のプロセッサは、光学的情報もしくは質量分析結果もしくは配列情報に基づいて、被検者における落屑症候群又は落屑緑内障の発症リスクを判定するプログラムを実行する。なお、コンピュータシステム30は、図1に示されるように測定装置20とは別個の機器であってもよいし、測定装置20を内包する機器であってもよい。後者の場合、コンピュータシステム30は、それ自体で判定装置10となってもよい。
 コンピュータ本体300は、図2に示されるように、CPU(Central Processing Unit)310と、ROM(Read Only Memory)311と、RAM(Random Access Memory)312と、ハードディスク313と、入出力インターフェイス314と、読出装置315と、通信インターフェイス316と、画像出力インターフェイス317とを備えている。CPU310、ROM311、RAM312、ハードディスク313、入出力インターフェイス314、読出装置315、通信インターフェイス316及び画像出力インターフェイス317は、バス318によってデータ通信可能に接続されている。また、測定装置20は、通信インターフェイス316により、コンピュータシステム30と通信可能に接続されている。
 CPU310は、ROM311に記憶されているプログラム及びRAM312にロードされたプログラムを実行することが可能である。CPU310は、有効性予測値を算出し、ROM311に格納されている判別式を読み出し、有効性を判定する。CPU310は、判定結果を出力して表示部302に表示させる。
 ROM311は、マスクROM、PROM、EPROM、EEPROMなどによって構成されている。ROM311には、前述のようにCPU310によって実行されるプログラム及びこれに用いるデータが記録されている。ROM311には、予め設定された閾値などが記録されていてもよい。
 RAM312は、SRAM、DRAMなどによって構成されている。RAM312は、ROM311及びハードディスク313に記録されているプログラムの読み出しに用いられる。RAM312はまた、これらのプログラムを実行するときに、CPU310の作業領域として利用される。
 ハードディスク313は、CPU310に実行させるためのオペレーティングシステム、アプリケーションプログラム(落屑症候群又は落屑緑内障の発症リスクの判定のためのコンピュータプログラム)などのコンピュータプログラム及び当該コンピュータプログラムの実行に用いるデータがインストールされている。ハードディスク313には、予め設定された閾値などが記録されていてもよい。
 読出装置315は、フラッシュメモリ、フレキシブルディスクドライブ、CD-ROMドライブ、DVDROMドライブなどによって構成されている。読出装置315は、可搬型記録媒体40に記録されたプログラム又はデータを読み出すことができる。読取装置と記載することもある。
 入出力インターフェイス314は、例えば、USB、IEEE1394、RS-232Cなどのシリアルインターフェイスと、SCSI、IDE、IEEE1284などのパラレルインターフェイスと、D/A変換器、A/D変換器などからなるアナログインターフェイスとから構成されている。入出力インターフェイス314には、キーボード、マウスなどの入力部301が接続されている。操作者は、当該入力部301により、コンピュータ本体300に各種の指令を入力することが可能である。
 通信インターフェイス316は、例えば、Ethernet(登録商標)インターフェイスなどである。コンピュータ本体300は、通信インターフェイス316により、プリンタなどへの印刷データの送信も可能である。
 画像出力インターフェイス317は、LCD、CRTなどで構成される表示部302に接続されている。これにより、表示部302は、CPU310から与えられた画像データに応じた映像信号を出力できる。表示部302は、入力された映像信号にしたがって画像(画面)を表示する。
 次に、判定装置10による、落屑症候群又は落屑緑内障の発症リスクの高低を判定する処理手順を説明する。ここでは、マイクロアレイ上のプローブに結合した、被検者の生体試料由来のDNAに基づく蛍光情報からリスクアレル情報を取得し、得られた測定値を用いて判定を行なう場合を例として説明する。しかし、本実施形態は、この例のみに限定されるものではない。
 図3を参照して、ステップS101において、判定装置10のCPU310は、測定装置20から蛍光情報を取得する。次に、ステップS102において、CPU310は、取得した蛍光情報から蛍光強度を算出し、RAM312に記憶する。そして、ステップS103において、CPU310は、RAM312に記憶された前記蛍光強度から各バリアントの有無及びその種類を決定し、ROM311又はハードディスク313に記憶されたアレルデータにしたがって、リスクアレル総数を算出する。
 その後、ステップS104において、CPU310は、算出された有効性予測値と、ROM311又はハードディスク313に記憶された予め設定された閾値とを用いて、被検者における落屑症候群又は落屑緑内障の発症リスクの高低を判定する。ここで、リスクアレル総数が予め設定された閾値よりも小さいとき、処理は、ステップS105に進行し、CPU310は、被検者における落屑症候群又は落屑緑内障の発症リスクが低いことを示す判定結果をRAM312に記憶する。一方、リスクアレル総数が予め設定された閾値よりも低くないとき(すなわち、リスクアレル総数がカットオフ値以上であるとき)、処理は、ステップS106に進行し、CPU310は、被検者における落屑症候群又は落屑緑内障の発症リスクが高いことを示す判定結果をRAM312に記憶する。
 そして、ステップS107において、CPU310は、判定結果を出力し、表示部302に表示させたり、プリンタに印刷させたりする。これにより、被検者における落屑症候群又は落屑緑内障の発症リスクが高いか否かの判定を補助する情報を医師などに提供することができる。
 以下、実施例を示して本発明を具体的に説明する。この実施例は、単なる本発明の例示であり、何ら限定を意味するものではない。なお、以下の実施例では、特に詳細な説明がない一般的に用いられる分子生物学的手法については、モレキュラークローニング (Joseph Sambrook et al., Molecular Cloning - A Laboratory Manual, 3rd Edition, Cold Spring Harbor Laboratory Press, 2001)などの成書に記載された方法及び条件が用いられる。
試験例1 マーカーSNP(コアSNP+プールSNP)の選択
 落屑症候群又は落屑緑内障と診断された患者(落屑症候群又は落屑緑内障の患者群)201例、及び、落屑症候群又は落屑緑内障ではないと診断され、かつ、問診によって緑内障家族歴を有さないと判断された非患者697例、それぞれの血液から、市販の自動核酸抽出機を使用して、ゲノムDNAを抽出した。ゲノムDNAの抽出は機器及びキットの取扱説明書に従い実施した。本方法により、血液検体350μLから約5μgのゲノムDNAを得た。
 SNPの分析は、ヒトゲノム上の公知のSNP約100万個の分析が可能な市販のマイクロアレイ型のSNP分析キットDNAマイクロアレイ(Genome-Wide Human SNP Array 6.0)を用いて906,600個のSNPのジェノタイプデータを取得し、QCフィルター (Call Rate, ≧0.95; MAF, ≧0.01; HWE, ≧0.001) を用いて652,792個の高精度なSNPデータを選択した。さらに、以下の過程により697個のSNPマーカー候補群を抽出した。
(1) ゲノムワイド関連解析(アレルデータによるχ2検定)でP<0.001を抽出条件とした。
(2) 抽出された全SNPについて、アフィメトリクス社のジェノタイピングソフトウェア (Genotyping Console) から得られる2Dクラスタープロット画像に基づき、3人の検者の目視による判定によってクラスター不良のSNPを除外した。
 マーカーSNPはSNPマーカー候補群から以下の手順により462個を選択した。なお、マーカーSNPはコアSNP 12個とプールSNP 450個から構成される。
(1) ジェノタイプデータを、以下の手順でコード化(数値変換)および正規化を行った。
  (a) Risk Allele Homo: 2、Risk Allele Hetero: 1、Other Allele Homo: 0とした。
  (b) 数値変換は落屑症候群又は落屑緑内障の患者群および非患者群の各群で、平均値および観測アレル頻度を用いて、前述の数式に従って数値の正規化を行った。
(2) 連鎖不平衡(linkage disequilibrium, LD)を考慮したSNPマーカー候補群の組合せを主成分分析(principle component analysis, PCA)を用いたクラスター解析により算出した。
  (a) SNPマーカー候補群を用いて、患者群および非患者群の全検体をPCAに供し、検体で情報縮約(Cluster SNP)することで得られる因子負荷量(主成分と元の変数との間の相関係数に相当)を算出した。次に、各SNPの最も高い因子負荷量の絶対値を示す主成分を基準とするクラスターにより候補領域を決定し、各候補領域内で最小のP値を得たSNPをマーカーSNPの候補とした。
  (b) 「各染色体」でのSNPマーカー候補群を用いて、(a) と同様に各染色体で候補領域を決定し、マーカーSNPの候補とした。
  (c) (a) と (b) のマーカーSNP候補を組み合わせて、重複を除いた。
コアSNPの取得
 マーカーSNPの上位67個を用いて、別集団の患者254例と非患者1,052例を用いてマスアレイによる再現実験を実施した。QCフィルター (Call Rate, ≧0.9; MAF, ≧0.01; HWE, ≧0.001)を通過したSNP群を用いて関連解析(アレルデータによるχ2検定)を実施した。ゲノムワイド関連解析とマスアレイによる再現実験の再現性について、コクラン・マンテル・ヘンツェル検定結果(P<0.0008)を基準とした12個のSNPをコアSNPとした。
プールSNPの取得
 マーカーSNPからコアSNPを除いた群をプールSNPとした。
実施例1
 患者群200例と非患者群200例について、試験例1と同様にして血液を採取してゲノムDNAを抽出し、実施例1(表3)についてそれぞれ示すプローブを用いて、ハイブリダイゼーションでアレルデータを取得し、リスクアレルの総数をカウントした。なお、実施例1で用いたプローブは、表1に記載の12個のプローブ及び表2から選択された18個のプローブである。
Figure JPOXMLDOC01-appb-T000026
 リスクアレルの総数を横軸にした度数分布図を作成し、ROC分析を行った結果を図4に示す。図4より、実施例1では感度72.5%、特異度80.0%であるカットオフ値が31個の場合にAUCが0.846であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
実施例2
 実施例1と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表4に示すプローブを用いた。
Figure JPOXMLDOC01-appb-T000027
(態様1)
 上記表4に示す90個のプローブ(コアSNP群12個、プールSNP群78個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。リスクアレルの総数を横軸にした度数分布図を作成し、ROC分析を行った結果を図5に示す。図5より、感度90.5%、特異度85.5%であるカットオフ値が67個の場合にAUCが0.961であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
(態様2)
 次に、前記態様1で用いたプローブを30個ずつに分けて、測定ステップを測定ステップ1、測定ステップ2、測定ステップ3の3グループに分けて行い、リスクアレルの総数をカウントした。
 得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を図6に示す。図6より、第1測定での結果が感度79.0%、特異度77.0%でのカットオフ値が20個であり、第2測定での結果が感度81.5%、特異度73.0%でのカットオフ値が22個であり、第3測定での結果が感度77.5%、特異度72.5%でのカットオフ値が25個であり、それぞれの測定における判定結果が得られることが分かった。
 また、図7に、前記3測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記3測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
(態様3及び4)
 態様2と同様にして、個々のグループでの判定結果を得た上で、ベイズ定理を用いてリスクアレル保有数に基づく発症リスクを有する数確率(平均発症リスク、95%信用区間)を算出した。また、ベイズ定理を用いた確率密度関数の発症リスクを有する確率が70以上となる密度を範囲とする面積を算出し、70%以上の確率で発症するリスクの確率を示した。結果を図8に示す。
 なお、ベイズ定理を用いた解析は、以下の手順に従って行った。
(a) 事前分布π(θ)は一様分布(無情報事前分布)とした。事前分布は、ベータ分布を採用した。
(b) 尤度は患者群および非患者群の全検体からランダムに、患者群200例と非患者群200例を選び、各リスクアレル保有数でのデータ数(観察数)と患者数(陽性数)から算出した。分布は二項分布を採用した。
(c) 事後分布は、ベイズの定理(事後分布π(θ|D)∝事前分布×尤度)より算出した。
(d) 事後分布から、平均発症リスク(%)、95%信用区間(%)、発症リスクを有する確率(%)を算出した。
実施例3
 実施例1及び2と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表5に示すプローブを用いた。
Figure JPOXMLDOC01-appb-T000028
Figure JPOXMLDOC01-appb-T000029
(態様1)
 上記表5に示す120個のプローブ(コアSNP群12個、プールSNP群108個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。実施例1と同様にして、リスクアレルの度数分布図とROC分析を行った結果を図9に示す。図9より、感度92.5%、特異度84.5%であるカットオフ値が93個の場合にAUCが0.959であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
(態様2)
 次に、前記態様1で用いたプローブを40個ずつに分けて、測定ステップを測定ステップ1、測定ステップ2、測定ステップ3の3グループに分けて行い、リスクアレルの総数をカウントした。
 得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を図10に示す。図10より、第1測定での結果が感度76.5%、特異度79.5%でのカットオフ値が27個であり、第2測定での結果が感度70.0%、特異度86.5%でのカットオフ値が34個であり、第3測定での結果が感度73.0%、特異度80.0%でのカットオフ値が36個であり、それぞれの測定における判定結果が得られることが分かった。
 また、図11に、前記3測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記3測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
(態様3及び4)
 態様2と同様にして、個々のグループでの判定結果を得た上で、実施例2と同様にして、平均発症リスク(%)、95%信用区間(%)、70%以上の確率で発症するリスクの確率(%)を算出した。結果を図12に示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
実施例4
 実施例1及び2及び3と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表6に示すプローブを用いた。
Figure JPOXMLDOC01-appb-T000030
Figure JPOXMLDOC01-appb-T000031
(態様1)
 上記表6に示す150個のプローブ(コアSNP群12個、プールSNP群138個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。実施例1と同様にして、リスクアレルの度数分布図とROC分析を行った結果を図13に示す。図13より、感度90.0%、特異度91.5%であるカットオフ値が120個の場合にAUCが0.971であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
(態様2)
 次に、前記態様1で用いたプローブを40個ずつに分けて、測定ステップを測定ステップ1、測定ステップ2、測定ステップ3の3グループに分けて行い、リスクアレルの総数をカウントした。
 得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を図14に示す。図14より、第1測定での結果が感度80.0%、特異度80.5%でのカットオフ値が38個であり、第2測定での結果が感度78.5%、特異度81.5%でのカットオフ値が40個であり、第3測定での結果が感度76.5%、特異度75.5%でのカットオフ値が43個であり、それぞれの測定における判定結果が得られることが分かった。
 また、図15に、前記3測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記3測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
(態様3及び4)
 態様2と同様にして、個々のグループでの判定結果を得た上で、実施例2と同様にして、平均発症リスク(%)、95%信用区間(%)、70%以上の確率で発症するリスクの確率(%)を算出した。結果を図16に示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
実施例5 ベイズ流アプローチによるマーカーSNPフィードバック改善ループ
 実施例2又は実施例3又は実施例4の判定後の追跡研究により、落屑症候群又は落屑緑内障の発症および陰性の結果を得ることで、データの蓄積と更新(追加学習)を行う。追加学習は、追跡研究によって新たに得られた分類結果を用いてベイズの事前分布π(θ)を更新する。
・追跡研究により新たに得られたジェノタイプデータを従来の結果に加えた関連解析(アレルデータによるχ2検定)を実施し、プールSNPの入れ替えを実施する。また、入れ替えを実施する場合は、「情報取得工程」の各測定のROC分析の再計算によるカットオフ値の再設定を行い、「情報提供工程」におけるベイズの事前分布を忘却し、一様分布(無情報事前分布)として再計算する。
・データの蓄積と更新により、ジェノタイプデータを用いてアレルデータによるχ2検定の結果が変化した場合、マーカー候補SNPの入れ替えを実施する。
 本発明の方法により、被検者由来のDNA上の本発明のSNPのアレルを分析することにより、被検者の落屑症候群又は落屑緑内障の発症リスクの高低を判定することができる。このリスクに基づき被検者は落屑症候群又は落屑緑内障の予防措置を講じ、又は先制医療を含む適切な治療を受けることができる。また、本発明のSNPを用いて、落屑症候群又は落屑緑内障の発症リスクが高い者を選択して緑内障治療薬の臨床試験を行うことにより、緑内障治療薬の臨床試験の期間を短縮できるため、有用である。
 10   判定装置
 20   測定装置
 30   コンピュータシステム
 40   記録媒体
 300  コンピュータ本体
 301  入力部
 302  表示部
 310  CPU
 311  ROM
 312  RAM
 313  ハードディスク
 314  入出力インターフェイス
 315  読出装置(読取装置)
 316  通信インターフェイス
 317  画像出力インターフェイス
 318  バス

Claims (11)

  1.  被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
    前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
    前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
    を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。
  2.  アレル測定工程が、
    コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
    第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップ
    を含む工程であり、
    ここで、前記第1プール選抜SNP群と第2プール選抜SNP群とは非同一である、請求項1記載の方法。
  3.  アレル測定工程が、
    コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
    第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップと、
    第1コアSNP群及び第2コアSNP群とは異なる1個以上のSNP(第3コアSNP群)と、プールSNP群から選ばれる複数のSNP(第3プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第3SNP群について測定を行う第3測定ステップ
    を含む工程であり、
    ここで、前記第1プール選抜SNP群と第2プール選抜SNP群と第3プール選抜SNP群とはいずれも非同一である、請求項1記載の方法。
  4.  情報取得工程が、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントするステップを含む工程である、請求項1~3いずれか記載の方法。
  5.  生体試料が、全血、全血球、白血球、リンパ球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織、又は毛根である、請求項1~4いずれか記載の方法。
  6.  情報提供工程が、前記情報取得工程により得られた被検者に関する結果が、アレル測定工程で用いられたSNPに基づいて予め設定された閾値を、上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが低いとの情報を提供するステップを含む工程である、請求項1~5いずれか記載の方法。
  7.  情報提供工程が、前記アレル測定工程が複数の測定ステップを含む場合、前記情報取得工程により得られた被検者に関する各測定ステップでの結果が、各測定ステップで用いられたSNP群に基づいて予め設定された閾値を上回るか否かを指標として、前記被検者が落屑症候群又は落屑緑内障を発症するリスクの高低についての情報を提供するステップを含む工程である、請求項2~5いずれか記載の方法。
  8.  情報提供工程が、前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者が落屑症候群又は落屑緑内障の発症リスクを有する確率を算出するステップを含む工程である、請求項1~5いずれか記載の方法。
  9.  情報提供工程が、前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者の落屑症候群又は落屑緑内障を予め設定されたパーセント(%)以上の確率で発症リスクを有する確率を算出するステップを含む工程である、請求項1~5いずれか記載の方法。
  10.  プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータを備え、前記メモリには、
    被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
    前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
    前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
    を前記コンピュータに実行させるためのコンピュータプログラムが記録されている、落屑症候群又は落屑緑内障の発症リスクを有する被検者の検出装置。
  11.  プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータであって、
    被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のコアSNP群と、表2に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
    前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
    前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
    を実行させる、コンピュータプログラム。
PCT/JP2017/022158 2016-08-05 2017-06-15 落屑症候群又は落屑緑内障の発症リスクの判定方法 WO2018025521A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018531766A JP7064215B2 (ja) 2016-08-05 2017-06-15 落屑症候群又は落屑緑内障の発症リスクの判定方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-154676 2016-08-05
JP2016154676 2016-08-05

Publications (1)

Publication Number Publication Date
WO2018025521A1 true WO2018025521A1 (ja) 2018-02-08

Family

ID=61073662

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/022158 WO2018025521A1 (ja) 2016-08-05 2017-06-15 落屑症候群又は落屑緑内障の発症リスクの判定方法

Country Status (2)

Country Link
JP (1) JP7064215B2 (ja)
WO (1) WO2018025521A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020178555A (ja) * 2019-04-23 2020-11-05 ジェネシスヘルスケア株式会社 緑内障のリスクを判定する方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008130009A1 (ja) * 2007-04-17 2008-10-30 Santen Pharmaceutical Co., Ltd. 緑内障進行リスクの判定方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008130009A1 (ja) * 2007-04-17 2008-10-30 Santen Pharmaceutical Co., Ltd. 緑内障進行リスクの判定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KEI TASHIRO ET AL.: "Genome-wide association study for exfoliation syndrome/exfoliation glaucoma", THE 87TH ANNUAL MEETING OF THE JAPANESE BIOCHEMICAL SOCIETY YOSHISHU, 2014, pages 2P-412 *
NAKANO MASAKAZU. ET AL.: "Novel common variants and susceptible haplotype for exfoliation glaucoma specific to asian population", SCIENTIFIC REPORTS, 18 June 2014 (2014-06-18), pages 1 - 6, XP055459766 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020178555A (ja) * 2019-04-23 2020-11-05 ジェネシスヘルスケア株式会社 緑内障のリスクを判定する方法
JP7140707B2 (ja) 2019-04-23 2022-09-21 ジェネシスヘルスケア株式会社 緑内障のリスクを判定する方法

Also Published As

Publication number Publication date
JP7064215B2 (ja) 2022-05-10
JPWO2018025521A1 (ja) 2019-05-30

Similar Documents

Publication Publication Date Title
KR101542529B1 (ko) 대립유전자의 바이오마커 발굴방법
CN108624650B (zh) 判断实体瘤是否适合免疫治疗的方法和检测试剂盒
TWI670495B (zh) 一種鑑定樣本中腫瘤負荷的方法和系統
EA017966B1 (ru) Диагностика фетальной хромосомной анэуплоидии с использованием геномного секвенирования
CN101679971A (zh) 青光眼恶化风险的判定方法
JP2017535763A (ja) マーカー群および該マーカー群の脳損傷における使用
Barton et al. Polymorphisms in the tumour necrosis factor gene are not associated with severity of inflammatory polyarthritis
CN114891876A (zh) 一种诊断高度近视的功能基因组区生物标志物组合
Chen et al. Underestimated disease prevalence and severe phenotypes in patients with biallelic variants: a cohort study of primary familial brain calcification from China
KR20150024232A (ko) 질병에 대한 약물 내성 유전체로부터 내성 원인 마커의 발굴 방법
JP2015089364A (ja) 体細胞多重変異によるがん診断方法、がん医薬開発方法及びがん診断装置
WO2010039526A1 (en) Genes and single nucleotide polymorphisms for genetic testing in bipolar disorder
US20220162710A1 (en) Composition for diagnosis or prognosis prediction of glioma, and method for providing information related thereto
WO2018025521A1 (ja) 落屑症候群又は落屑緑内障の発症リスクの判定方法
JP7072803B2 (ja) 広義原発開放隅角緑内障の発症リスクの判定方法
CN115148364A (zh) 基于外周血ctDNA水平预测DLBCL初治患者预后的装置及计算机可读存储介质
JP7140707B2 (ja) 緑内障のリスクを判定する方法
JP2023112692A (ja) 広義原発開放隅角緑内障の進行リスクに関する情報の取得方法
JP2020517304A (ja) Dna分析のためのオフターゲット配列の使用
JP2023038111A (ja) 広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法
WO2018186687A1 (ko) 생물학적 시료의 핵산 품질을 결정하는 방법
JP2015130852A (ja) 関節リウマチ患者におけるメトトレキサートによる副作用の発現リスクの判定を補助する方法
EP3055425B1 (en) Predicting increased risk for cancer
KR102018830B1 (ko) 섬유근통 진단용 바이오마커 및 이의 용도
US20150133333A1 (en) Compositions and methods for detecting complicated sarcoidosis

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17836628

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018531766

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17836628

Country of ref document: EP

Kind code of ref document: A1