WO2017119510A1 - 乳がんの診断のための検査方法、遺伝子マーカー、および検査薬 - Google Patents

乳がんの診断のための検査方法、遺伝子マーカー、および検査薬 Download PDF

Info

Publication number
WO2017119510A1
WO2017119510A1 PCT/JP2017/000340 JP2017000340W WO2017119510A1 WO 2017119510 A1 WO2017119510 A1 WO 2017119510A1 JP 2017000340 W JP2017000340 W JP 2017000340W WO 2017119510 A1 WO2017119510 A1 WO 2017119510A1
Authority
WO
WIPO (PCT)
Prior art keywords
region
seq
nucleotide sequence
cpg sites
sites present
Prior art date
Application number
PCT/JP2017/000340
Other languages
English (en)
French (fr)
Inventor
雅和 戸井
史顕 佐藤
重衡 佐治
奈津恵 富田
Original Assignee
国立大学法人京都大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人京都大学 filed Critical 国立大学法人京都大学
Publication of WO2017119510A1 publication Critical patent/WO2017119510A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer

Definitions

  • the present invention relates to a test method, genetic marker, and test drug for diagnosis (or determination) of breast cancer. More specifically, a test method capable of early detection in any subtype of breast cancer, that is, the methylation status of an epigenetic gene marker (methylation gene marker) for DNA collected from a subject, and the total amount of DNA
  • a test method capable of early detection in any subtype of breast cancer, that is, the methylation status of an epigenetic gene marker (methylation gene marker) for DNA collected from a subject, and the total amount of DNA
  • the present invention relates to a method for performing a breast cancer test by measuring the amount of DNA of an internal standard gene marker to be reflected, a genetic marker for the test, and a test drug.
  • Breast cancer is the most frequently developed cancer among women and is the leading cause of cancer death in women.
  • Breast cancer is a heterogeneous disease group that includes subtypes with different personalities, and is classified into five subtypes based on differences in hormone receptor (ER, PgR) and HER2 expression and proliferation ability (Ki67 labeling rate).
  • ER hormone receptor
  • PgR hormone receptor
  • HER2 HER2 expression and proliferation ability
  • Recent comprehensive gene expression analysis has shown that breast cancer can be classified into tumor biologically distinct endogenous subtypes, which are in good agreement with the clinicopathological classification.
  • exhaustive analysis of gene mutation, copy number variation, gene expression, and DNA methylation has revealed characteristics of genes and epigenetics in each endogenous subtype.
  • PAM50 which extracts 50 signature genes for each endogenous subtype from microarray data and is assayed by RT-PCR, is recognized as a standard method for classifying endogenous subtypes. It is difficult to apply to daily medical care because there are some areas that cannot be used. Therefore, subtype classification methods using immunostaining of estrogen receptor (ER), progesterone receptor (PgR), HER2, Ki67, EGFR, and cytokeratin5 / 6 are used instead of PAM50.
  • ER estrogen receptor
  • PgR progesterone receptor
  • HER2 HER2, Ki67, EGFR
  • cytokeratin5 / 6 are used instead of PAM50.
  • Luminal A breast cancer grows slowly, but may recur after more than 10 years of initial treatment. Since determination of the endogenous subtype of breast cancer serves as a guideline for selecting an appropriate treatment policy, many biomarkers have been searched and researched in addition to the above biomarkers. In particular, breast cancer biomarker research using blood has been actively conducted with the aim of applying it to diagnosis, monitoring of therapeutic effects, and prognosis prediction.
  • biomarkers of breast cancer using blood include serum proteins such as CA15-3 and CEA, circulating tumor cells (CTCs), and gene mutations in circulating tumor DNA (ctDNA).
  • serum protein is useful for detecting postoperative recurrence of breast cancer and monitoring its therapeutic effect, but has low sensitivity and specificity for breast cancer screening and is not used for breast cancer screening (Non-Patent Documents) 1).
  • CTC has been shown to correlate with the prognosis of the number of blood CTCs in breast cancer cases (Non-patent Document 2), and the Cell Search system has been approved by the FDA.
  • Non-patent Document 3 ctDNA gene mutation is considered to occur only in cancer tissues or precancerous lesions, and is highly specific as a method for detecting cancer tissues.
  • genes with high mutation frequency such as TP53 and PIK3CA have been identified, but the mutation sites are distributed over a wide range of genes.
  • biomarkers for breast cancer using blood include methylated ctDNA.
  • biomarkers of methylation of circulating tumor DNA in plasma and serum of breast cancer patients the positive rate of each marker is low even in advanced cases.
  • triple negative breast cancer has a tendency of hypomethylation in the whole genome, and it is expected that this case is difficult to detect even using an epigenetic marker.
  • biomarkers for detecting breast cancer that covers subtypes simply and quickly remain undiscovered.
  • the present invention finds genetic markers capable of comprehensively examining breast cancers of different subtypes, and uses any of the genetic markers to detect any subtype of breast cancer including triple negative type, which has been difficult to detect with high sensitivity. It is also an object of the present invention to provide a test method that can be detected with high sensitivity and high specificity. Furthermore, it is an object of the present invention to provide a test method capable of early diagnosis of breast cancer in a minimally invasive blood test, which is an alternative to a painful test for a subject such as a conventional mammography test, and a genetic marker and a test drug therefor. To do.
  • the present inventors focused on specific DNA methylation abnormalities in breast cancer.
  • Epigenetic analysis was performed to identify multiple genetic markers with different DNA methylation-positive patterns in breast and non-cancer groups, or in certain breast cancer subtypes and other groups. Specifically, as a result of analyzing the DNA methylation status of 450,000 sites on the human genome with a DNA methylation array, methylation is difficult to occur in the DNA of healthy individuals, and 1) DNA methylation is high in all breast cancers.
  • DMR Specific genomic DNA region
  • DMR DMR in JAK3 gene, RASGRF1 gene, CPXM1 gene, SHF gene
  • DMR with high rate of DNA methylation in luminal breast cancer DMR with high rate of DNA methylation in luminal breast cancer
  • DMR with high rate of DNA methylation in triple negative breast cancer ST3GAL6 gene, DACH1 gene, P2RX3 gene, cg23495581 (probe of Illumina DNA methylation array)
  • the intergenic region on chromosome 8 (hereinafter referred to as “cg23495581” and the DMR in the vicinity thereof) was identified as an epigenetic gene marker.
  • breast cancer especially triple negative breast cancer
  • these cases are assumed to be difficult to detect using only epigenetic markers.
  • the amount of free DNA in the blood (circulated DNA) has increased in cancer cases, and the circulating DNA in cancer cases has been affected by abnormal copy number of cancer lesions.
  • the present inventors have identified a genetic marker serving as an index (internal standard) that reflects the total amount of DNA (particularly circulating DNA) along with the detection of the epigenetic genetic marker, and the amount of DNA obtained by detecting the internal standard genetic marker. Attempted to combine measurements.
  • breast cancer cells have few DNA copy number abnormalities, and select multiple gene regions on different chromosomes as internal standard gene markers (CREM gene, GLYATL3 gene, ELMOD3 gene, and KLF9 gene), and measure the amount of DNA Minimized the effects of copy number abnormalities.
  • CREM gene GLYATL3 gene
  • ELMOD3 gene GLYATL3 gene
  • KLF9 gene KLF9 gene
  • the inventors have identified a plurality of identified epigenetic gene markers (JAK3 gene, RASGRF1 gene, CPXM1 gene, SHF gene, DNM3 gene, CAV2 gene, HOXA10 gene, B3GNT5 gene, ST3GAL6 gene, DACH1 gene, P2RX3 gene, cg23495581 ) And internal standard gene markers (CREM gene, GLYATL3 gene, ELMOD3 gene, and KLF9 gene) were combined to construct an epigenetic gene marker panel for identifying breast cancer patients.
  • epigenetic gene markers JNK3 gene, RASGRF1 gene, CPXM1 gene, SHF gene, DNM3 gene, CAV2 gene, HOXA10 gene, B3GNT5 gene, ST3GAL6 gene, DACH1 gene, P2RX3 gene, cg23495581
  • CREM gene CREM gene, GLYATL3 gene, ELMOD3 gene, and KLF9 gene
  • the present inventors use a plasma of a population (learning set) consisting of breast cancer patients and healthy individuals, and a JAK3 gene in which a plurality of predetermined CpG sites present in each DMR contained in circulating DNA are methylated.
  • RASGRF1 gene CPXM1 gene, SHF gene, DNM3 gene, CAV2 gene, HOXA10 gene, B3GNT5 gene, ST3GAL6 gene, DACH1 gene, P2RX3 gene and cg23495581 allele concentration and CREM gene, GLYATL3 gene, ELMOD3 gene and KLF9 gene
  • Each allele concentration was measured, and a test value calculation formula and a cut-off value that gave an optimal solution for determining whether or not it was breast cancer were determined.
  • this invention consists of the following.
  • (Claim 1) A test method for diagnosis of breast cancer, wherein the following (1) to (12) in a DNA-containing sample collected from a subject: (1) The methylation state of one or more predetermined CpG sites present in a region within the human JAK3 gene represented by the nucleotide sequence of SEQ ID NO: 1; (2) methylation state of one or more predetermined CpG sites present in a region within the human RASGRF1 gene represented by the nucleotide sequence of SEQ ID NO: 2; (3) methylation state of one or more predetermined CpG sites present in a region within the human CPXM1 gene represented by the nucleotide sequence of SEQ ID NO: 3; (4) methylation state of one or more predetermined CpG sites present in a region in the human SHF gene represented by the nucleotide sequence of SEQ ID NO: 4; (5) methylation status of one or more predetermined CpG sites present in a region within the human DNM3 gene
  • step A In step A, one or more methylation states selected from (1) to (4), one or more methylation states selected from (5) to (8), and (9) to (9) Item 12.
  • the method according to Item 1, wherein one or more methylation states selected from 12) are measured.
  • (Section 3) Item 3.
  • Step B a step of further measuring the amount of an internal standard gene that can be a factor that reflects the amount of the entire DNA, each of two or more genes existing on separate chromosomes. The method according to item.
  • the method according to Item 4, wherein the gene that can serve as the internal standard has a frequency of copy number variation of less than 5% in breast cancer cells.
  • the method according to Item 4, wherein the gene that can serve as the internal standard includes one or more genes selected from the group consisting of CREM gene, GLYATL3 gene, ELMOD3 gene, and KLF9 gene.
  • the method according to Item 4, wherein the genes that can serve as the internal standard are CREM gene, GLYATL3 gene, ELMOD3 gene, and KLF9 gene.
  • (Clause 12) A genetic marker for the diagnosis of breast cancer, The following (1) to (12): (1) the gene fragment comprising one or more CpG sites present in a region within the human JAK3 gene represented by the nucleotide sequence of SEQ ID NO: 1; (2) the gene fragment comprising one or more CpG sites present in a region within the human RASGRF1 gene represented by the nucleotide sequence of SEQ ID NO: 2; (3) the gene fragment comprising one or more CpG sites present in a region within the human CPXM1 gene represented by the nucleotide sequence of SEQ ID NO: 3; (4) Present in a region within the human SHF gene represented by the nucleotide sequence of SEQ ID NO: 4.
  • the gene fragments (1) to (12) are (1) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 16 to 534 in the nucleotide sequence of SEQ ID NO: 1; (2) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 59 to 345 in the nucleotide sequence of SEQ ID NO: 2; (3) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 41 to 400 in the nucleotide sequence of SEQ ID NO: 3; (4) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 150 to 460 in the nucleotide sequence of SEQ ID NO: 4; (5) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 118 to 590 in the nucleotide sequence of SEQ ID NO: 5; (6) the gene fragment comprising one or more Cp
  • the gene fragments (1) to (12) are (1) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 116 to 434 in the nucleotide sequence of SEQ ID NO: 1; (2) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 159 to 245 in the nucleotide sequence of SEQ ID NO: 2; (3) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 141 to 300 in the nucleotide sequence of SEQ ID NO: 3; (4) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 251 to 359 in the nucleotide sequence of SEQ ID NO: 4; (5) the gene fragment comprising one or more CpG sites present in the region represented by nucleotide numbers 218 to 490 in the nucleotide sequence of SEQ ID NO:
  • the gene marker according to Item 12 wherein (Section 15) A genetic marker that can be an internal standard for the concentration of the entire DNA, and includes at least one gene selected from the group consisting of CREM gene, GLYATL3 gene, ELMOD3 gene, and KLF9 gene, or a fragment thereof. (Section 16) Item 15. The gene marker according to any one of Items 12 to 14, wherein the gene marker is used in combination with the gene marker according to Item 15.
  • (Section 17) A test for the diagnosis of breast cancer, The following (1) to (12): (1) a region containing one or more CpG sites present in a region within the human JAK3 gene represented by the nucleotide sequence of SEQ ID NO: 1; (2) a region containing one or more CpG sites present in a region within the human RASGRF1 gene represented by the nucleotide sequence of SEQ ID NO: 2; (3) a region containing one or more CpG sites present in a region within the human CPXM1 gene represented by the nucleotide sequence of SEQ ID NO: 3; (4) a region containing one or more CpG sites present in a region in the human SHF gene represented by the nucleotide sequence of SEQ ID NO: 4; (5) a region containing one or more CpG sites present in a region within the human DNM3 gene represented by the nucleotide sequence of SEQ ID NO: 5; (6) a region containing one or more CpG sites present in
  • the areas (1) to (12) are (1) a region containing one or more CpG sites present in the region represented by nucleotide numbers 16 to 534 in the nucleotide sequence of SEQ ID NO: 1; (2) a region containing one or more CpG sites present in the region represented by nucleotide numbers 59 to 345 in the nucleotide sequence of SEQ ID NO: 2; (3) a region containing one or more CpG sites present in the region represented by nucleotide numbers 41 to 400 in the nucleotide sequence of SEQ ID NO: 3; (4) a region containing one or more CpG sites present in the region represented by nucleotide numbers 150 to 460 in the nucleotide sequence of SEQ ID NO: 4; (5) a region containing one or more CpG sites present in the region represented by nucleotide numbers 118 to 590 in the nucleotide sequence of SEQ ID NO: 5; (6) a region containing one or more CpG sites present
  • the test drug according to Item 17, which is (Section 19) are (1) a region containing one or more CpG sites present in the region represented by nucleotide numbers 116 to 434 in the nucleotide sequence of SEQ ID NO: 1; (2) a region containing one or more CpG sites present in the region represented by nucleotide numbers 159 to 245 in the nucleotide sequence of SEQ ID NO: 2; (3) a region containing one or more CpG sites present in the region represented by nucleotide numbers 141 to 300 in the nucleotide sequence of SEQ ID NO: 3; (4) a region containing one or more CpG sites present in the region represented by nucleotide numbers 251 to 359 in the nucleotide sequence of SEQ ID NO: 4; (5) a region containing one or more CpG sites present in the region represented by nucleotide numbers 218 to 490 in the nucleotide sequence of SEQ ID NO: 5;
  • the test agent according to Item 17, comprising one or more primer sets capable of detecting methylation of a predetermined CpG site in one or more regions selected from the above.
  • the areas (1A) to (12A) are (1A) In the nucleotide sequence of SEQ ID NO: 13, a region containing one or more CpG sites present in the region represented by nucleotide numbers 16 to 534, or in the nucleotide sequence of SEQ ID NO: 14, represented by nucleotide numbers 9 to 527 A region comprising one or more CpG sites present in the region; (2A) A region containing one or more CpG sites present in the region represented by nucleotide numbers 59 to 345 in the nucleotide sequence of SEQ ID NO: 15, or the nucleotide sequence of SEQ ID NO: 16 represented by nucleotide numbers 658 to 944 A region comprising one or more CpG sites present in the region; (3A) In the nucleotide sequence of SEQ ID NO: 17,
  • the test agent according to Item 21, which is (Item 23) The areas (1A) to (12A) are (1A) A region containing one or more CpG sites present in the region represented by nucleotide numbers 116 to 434 in the nucleotide sequence of SEQ ID NO: 13, or the nucleotide sequence of SEQ ID NO: 14 represented by nucleotide numbers 109 to 427 A region comprising one or more CpG sites present in the region; (2A) In the nucleotide sequence of SEQ ID NO: 15, a region containing one or more CpG sites present in the region represented by nucleotide numbers 159 to 245, or in the nucleotide sequence of SEQ ID NO: 16, represented by nucleotide numbers 758 to 844 A region comprising one or more CpG sites present in the region; (3A) A region containing one or more CpG sites present in the region represented by nucleotide numbers 141 to 300 in the nucleotide sequence of SEQ ID NO: 17, or the
  • (Claim 25) The following (13) to (16): (13) A primer set for specifically detecting the CREM gene or a fragment thereof; (14) a primer set for specifically detecting the GLYATL3 gene or a fragment thereof; (15) a primer set for specifically detecting the ELMOD3 gene or a fragment thereof; and (16) A primer set for specifically detecting the KLF9 gene or a fragment thereof; Item 25.
  • the test agent according to Item 25 comprising the primer set shown in the above (13) to (16).
  • breast cancers of different subtypes can be comprehensively examined, and any subtype breast cancer including triple negative type, which has been difficult to detect with high sensitivity, has high sensitivity and high specificity. Detection at a degree is possible.
  • the present invention can be carried out by a minimally invasive blood test, it can be an alternative technique to a conventional test method involving pain of a subject such as a mammography test.
  • FIGS. 1-1 and 1-2 are diagrams showing search results of methylation gene markers specific to breast cancer or a breast cancer subtype by an exhaustive methylation array.
  • FIG. 1-1 shows the results of plotting the average methylation degree in breast cancer cells (vertical axis) and the average methylation degree in non-cancer cells (horizontal axis) for 480,000 probes.
  • Figure 1-2 shows the average methylation degree in triple-negative breast cancer (vertical axis) and the average methylation degree in luminal breast cancer (horizontal axis) for 84117 probes with an average methylation degree of less than 5% in non-cancer cells. The plotted result is shown. It is a figure which shows the selection method of a methylation gene marker.
  • FIGS. 3-1 to 3-4 show how to determine the upper and lower cutoff values of the amplified signal value of digital PCR.
  • Fig. 3-1 is a plot of the signal intensity distribution of unamplified (negative) and amplified (positive) signal droplets using the MATLAB kernel smoothing function estimation ksdenstiy function (horizontal axis). Represents the signal intensity, the vertical axis represents the probability density (unit: 10 ⁇ 3 ), and x represents the peak) The upper limit of the band of the negative signal droplet peak was calculated for each reaction system, and the signal intensity values of all the droplets were converted to the signal intensity from the reference value.
  • the band upper limit of the non-amplified droplet is set to the reference point (0) of the temporary lower limit cutoff value.
  • Droplets whose amplification signal value is between the tentative lower limit cutoff value and upper limit cutoff value are regarded as positive droplets, and the number of positive droplets is counted in all cases in the learning set, from which positive alleles in 1 mL of plasma are counted.
  • the concentration was calculated and an ROC curve was generated for the logarithmic value. In this work, the provisional lower limit cutoff value was increased by 10 and the area under the ROC curve (AUC) for breast cancer / non-cancer discrimination was calculated for each.
  • FIG. 3-3 shows the determination method of the lower limit cutoff value of the amplification signal value of digital PCR.
  • the provisional lower limit cutoff value when AUC becomes maximum is adopted as the lower limit cutoff value.
  • the left vertical axis of each panel represents the arithmetic mean of logarithmic values of allele concentrations, and the right vertical axis represents AUC.
  • Each panel consists of JAK3, RASGRF1, CPXM1 and SHF in order from the left in the first stage, DNM3, CAV2, HOXA10 and B3GNT5 in order from the left in the second stage, ST3GAL6, DACH1, P2RX3 and cg23495581, in order from the left in the third stage
  • the results of CREM, GLYATL3, ELMOD3, and KLF9 are shown in order from the left.
  • the vertical axis indicates sensitivity (positive predictive value), the horizontal axis indicates false positive rate (1-specificity), and the circle indicates the cut-off point for bisection method, positive and negative.
  • HV Healthy Ken It is a figure which shows the test value for every subtype of breast cancer.
  • Lu Luminal type
  • TN Triple negative type
  • HER2 HER2 type
  • LH Luminal HER2 type It is a figure which shows the test value of each subtype for every stage of breast cancer.
  • LBC Luminal type
  • TNBC Triple negative type
  • HER2 BC HER2 type
  • LH Luminal HER2 type
  • Chrosome is a biological material responsible for the expression and transmission of genetic information, and specifically refers to a huge complex of genomic DNA and protein. Unless otherwise specified, the present specification is used synonymously with human chromosomes, and refers to all 22 pairs of autosomes and one pair of sex chromosomes, or all or part of individual chromosomes. “Genome” refers to the entire genetic information of a biological entity (cell, tissue, organ, system, organism), and includes DNA, RNA, or a modification or derivative thereof. Unless otherwise specified, the present specification is used synonymously with the human genome.
  • Genomic DNA includes both gene coding and non-coding sequences, and as used herein, DNA complexed with protein in the chromosome, DNA from which the protein in the chromosome has been removed by chemical treatment, or the like. , Part of it.
  • the human genome includes a nuclear genome and a mitochondrial genome, preferably a nuclear genome.
  • “Gene” refers to a factor that defines a genetic trait. Usually arranged in a certain order on the chromosome. In the present specification, it means a genomic DNA region including not only a structural gene region consisting of an exon that defines the primary structure of a protein and an intron that divides the exon, but also a transcriptional regulatory region such as a promoter, an enhancer, and a silencer.
  • genes are scattered on each chromosome, and the nuclear genome DNA is the one that includes the DNA contained in all the chromosomes.
  • An “allele” refers to an individual gene present at the same locus of a pair of homologous chromosomes. That is, if there is one copy of a gene at each locus, the entire genome will have two alleles. When multiple copies of a gene are present on one or both homologous chromosomes, each of those copies is an allele. Therefore, “allele concentration” means the amount of allele per unit capacity.
  • Epigenetic gene marker of the present invention (methylation gene marker)
  • the present invention relates to a genetic marker for diagnosis of breast cancer ("this book") consisting of a specific gene region (DMR) or a part thereof in which DNA methylation occurs selectively in breast cancer or a specific subtype of breast cancer.
  • DNA methylation means that a methyl group is added to the carbon at the 5-position of cytosine of a dinucleotide (also referred to as CpG) represented by 5′-CG-3 ′ in the nucleotide sequence.
  • “Selective DNA methylation occurs in a specific subtype of breast cancer or breast cancer” means that the methylation level of a CpG site present in a given gene region is higher in the breast cancer group than in the non-cancer group, or Means significantly higher in one particular breast cancer subtype group than the other (ie, non-cancer group and other breast cancer subtype groups), non-cancer group, or non-cancer group and In other breast cancer subtype groups, it does not exclude that DNA methylation within the gene region occurs at a low level.
  • breast cancer that can be diagnosed using the epigenetic gene marker of the present invention as an index was classified into any of the five subtypes (luminal type A, luminal type B, luminal HER2, HER2 and triple negative). May be.
  • Each subtype of breast cancer can be determined by immunostaining for estrogen receptor (ER), progesterone receptor (PgR), HER2 and Ki-67.
  • ER estrogen receptor
  • PgR progesterone receptor
  • HER2 HER2
  • Ki-67 Ki-67
  • luminal type A is defined as breast cancer with positive ER and PgR, negative with HER2, and Ki-67 labeling rate of 14% or less.
  • Luminal type B is defined as breast cancer with positive ER and PgR, negative HER2, and Ki-67 labeling rate higher than 14%.
  • Luminal HER2 is defined as breast cancer positive for at least one of ER and PR and positive for HER2.
  • HER2 is defined as breast cancer that is negative for both ER and PR and positive for HER2.
  • Triple negative forms are defined as breast cancer that is negative for ER, PR, and HER2.
  • Selection of the epigenetic gene marker of this invention is performed by selecting a probe based on the following selection criteria, for example using a DNA methylation array.
  • ⁇ value in DNA methylation array analysis continuously variable from 0 to 1 in array scan file
  • a certain ⁇ value indicates a low methylation state when close to 0, and a high methylation state when close to 1).
  • a methylation marker candidate is selected from probes having an average ⁇ value of less than 0.05 in a non-cancer specimen under the following conditions (see FIG. 1).
  • A) Breast cancer common marker probe with a large difference in ⁇ value in comparison between breast cancer and non-cancer
  • methylated gene markers obtained through the selection criteria as described above include the following 12 types of DMR or a part thereof including one or more CpG sites.
  • Genomic DNA region on human chromosome 8 (SEQ ID NO: 12) identified by cg23495581 (probe of Illumina comprehensive DNA methylation array)
  • Each of the above DMR sequences indicates the genomic DNA sequence of the normal chain of the reference sequence hg19 of the human genome registered in the NCBI (National Center for Biotechnology Information) database.
  • the site indicated by capital letters “CG” is the CpG site that is the target of methylation.
  • the numbers above each nucleotide sequence indicate the chromosome (chr) number and the number of bases from the p-arm telomere side to the q-arm telomere.
  • each of the above nucleotide sequences is representative to identify the location of DMR specific to breast cancer or breast cancer subtypes.
  • DMR is in the form of double-stranded DNA, and in this specification, it is represented by a normal genomic sequence, but a reverse strand sequence is also included in a methylated gene marker.
  • the first breast cancer-specific methylation gene marker of the present invention is a region containing one or more CpG sites present in DMR (JAK3-DMR) in the human JAK3 gene represented by the nucleotide sequence of SEQ ID NO: 1. .
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 16 to 534, more preferably nucleotide numbers 116 to 434 in the nucleotide sequence.
  • the second breast cancer-specific methylation gene marker of the present invention is a region containing one or more CpG sites present in DMR (RASGRF1-DMR) in the human RASGRF1 gene represented by the nucleotide sequence of SEQ ID NO: 2.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 59 to 345, more preferably nucleotide numbers 159 to 245 in the nucleotide sequence.
  • the third breast cancer-specific methylation gene marker of the present invention is a region containing one or more CpG sites present in DMR (CPXM1-DMR) in the human CPXM1 gene represented by the nucleotide sequence of SEQ ID NO: 3. .
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) shown by nucleotide numbers 41 to 400, more preferably nucleotide numbers 141 to 300 in the nucleotide sequence.
  • the fourth breast cancer-specific methylation gene marker of the present invention is a region containing one or more CpG sites present in DMR (SHF-DMR) in the human SHF gene represented by the nucleotide sequence of SEQ ID NO: 4. .
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) shown by nucleotide numbers 150 to 460, more preferably nucleotide numbers 251 to 359 in the nucleotide sequence.
  • the first luminal breast cancer-specific methylation gene marker of the present invention is a region comprising one or more CpG sites present in DMR (DNM3-DMR) in the human DNM3 gene represented by the nucleotide sequence of SEQ ID NO: 5. It is.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 118 to 590, more preferably nucleotide numbers 218 to 490 in the nucleotide sequence.
  • the second luminal breast cancer-specific methylation gene marker of the present invention is a region containing one or more CpG sites present in DMR (CAV2-DMR) in the human CAV2 gene represented by the nucleotide sequence of SEQ ID NO: 6 It is.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 115 to 566, more preferably nucleotide numbers 215 to 484 in the nucleotide sequence.
  • the third luminal breast cancer-specific methylation gene marker of the present invention is a region comprising one or more CpG sites present in the DMR (HOXA10-DMR) in the human HOXA10 gene represented by the nucleotide sequence of SEQ ID NO: 7. It is.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 641 to 1011, more preferably nucleotide numbers 741 to 911 in the nucleotide sequence.
  • the fourth luminal breast cancer-specific methylation gene marker of the present invention is a region comprising one or more CpG sites present in DMR (B3GNT5-DMR) in the human B3GNT5 gene represented by the nucleotide sequence of SEQ ID NO: 8 It is.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 1116 to 1595, and more preferably nucleotide numbers 1216 to 1495 in the nucleotide sequence.
  • the first triple negative breast cancer-specific methylation gene marker of the present invention comprises one or more CpG sites present in the DMR (ST3GAL6-DMR) in the human ST3GAL6 gene represented by the nucleotide sequence of SEQ ID NO: 9. It is an area.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 40 to 448, more preferably nucleotide numbers 140 to 440 in the nucleotide sequence.
  • the second triple negative breast cancer-specific methylation gene marker of the present invention comprises one or more CpG sites present in the DMR (DACH1-DMR) in the human DACH1 gene represented by the nucleotide sequence of SEQ ID NO: 10. It is an area.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 330 to 824, and more preferably, nucleotide numbers 430 to One or more CpG sites existing in the region indicated by 724 (region surrounded by a box).
  • the third triple negative breast cancer-specific methylation gene marker of the present invention comprises one or more CpG sites present in DMR (P2RX3-DMR) in the human P2RX3 gene represented by the nucleotide sequence of SEQ ID NO: 11. It is an area.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in a region (underlined) represented by nucleotide numbers 225 to 535, and more preferably, nucleotide numbers 326 to One or more CpG sites existing in the region indicated by 435 (region surrounded by a box).
  • the fourth triple negative breast cancer-specific methylation gene marker of the present invention is represented by the nucleotide sequence of SEQ ID NO: 12, and is contained in the genomic DNA region (cg23495581-DMR) on human chromosome 8 specified by cg23495581.
  • the CpG site is not particularly limited, but is preferably one or more CpG sites present in the region (underlined) represented by nucleotide numbers 164 to 822, and more preferably, nucleotide numbers 264 to An area indicated by 722 (area surrounded by a box).
  • these internal standard gene markers are the DNA in the subject-containing DNA-containing sample (specimen) that is produced when the subject suffers from breast cancer, such as an increase in the amount of circulating DNA in the above cancer cases.
  • the present invention also provides a gene that can be a factor that reflects the amount of two or more total DNAs present in different chromosomes, that is, an internal standard gene marker.
  • the internal standard gene marker of the present invention is not particularly limited as long as the blood DNA concentration reflects the amount of circulating DNA (the amount of circulating DNA can be known by quantifying the marker). Since the frequency of gene copy number abnormalities is increasing in cancer cases, the total amount of circulating DNA is not correctly reflected when gene regions with copy number variation are used as markers. Therefore, as an internal standard gene marker, a gene with a low copy number variation frequency in cancer cells is selected. As a selection index, for example, the frequency of copy number variation (CNV) in breast cancer cells is less than 5%.
  • CNV copy number variation
  • Such genes can be extracted using public genome databases such as the TCGA database and the databases listed in cBioPortal.
  • centromere a gene present in the vicinity of the centromere as the internal standard gene marker.
  • the vicinity of the centromere is preferably a gene within a distance of 20 million bases from the innermost centromere gene in each chromosome, more preferably a gene within a distance of 10 million bases, but is not limited thereto.
  • the internal standard gene marker of the present invention includes CREM gene, GLYATL3 gene, ELMOD3 gene and KLF9 gene.
  • Table 1 summarizes the distance between the location of these genes and the innermost gene, the relative position (%) from the inner side of the chromosome arm, and the like.
  • any two or more of these genes can be used as internal standard gene markers. More preferably, all the four genes can be used as internal standard gene markers.
  • Which region of each gene is used as a marker (detection target) is not particularly limited, and can be appropriately selected. For example, when detecting and quantifying an internal standard gene marker by methylation-specific PCR in combination with the above methylated gene marker, a region without a CpG sequence is set as a detection target, and the region can be amplified and detected. Primer / probe sets can be designed.
  • the present invention also provides DNA methylation in one or more gene markers selected from the 12 methylated gene markers of the present invention in a DNA-containing sample collected from a subject.
  • An examination method for diagnosis of breast cancer (hereinafter also referred to as the examination method of the present invention) is provided as an index.
  • test method of the present invention can be applied is not particularly limited, and examples thereof include humans who are uncertain whether or not they are affected by breast cancer.
  • the DNA-containing sample used in the test method of the present invention is not particularly limited as long as it is a sample containing DNA collected from a subject, and examples thereof include circulating DNA-containing samples such as blood, serum or plasma. Since blood or serum may be contaminated with fragmented genomic DNA derived from leukocytes, it is preferable to use plasma. Circulating DNA can be isolated from blood, serum and plasma by known means, for example, using commercially available products such as QIAmp Circulating Nucleic Acid Kit.
  • Circulating DNA refers to DNA released from cells into the blood, and cancer patients contain a large amount of circulating tumor DNA (ctDNA) released from tumor cells. Circulating DNA levels are known to be elevated in cancer patients, and are thought to be released into the blood by apoptosis or necrosis of cancer cells or secretion from cancer cells. It has been reported to reflect type, gene mutation, and methylation. Therefore, the gene contained in circulating DNA reflects breast cancer characteristics and is therefore suitable for breast cancer testing.
  • ctDNA circulating tumor DNA
  • the DNA-containing sample used in the test method of the present invention is not limited to a circulating DNA-containing sample.
  • a mammary gland cell that can be collected in the same manner as a fine needle aspiration cytology or a breast sample that is collected in the same manner as a needle biopsy.
  • Obtained tissue pieces, secretions from the nipple, blood free from tumor cells, other body fluids (urine, milk, etc.), etc. can also be used as DNA-containing samples. DNA contained in these samples can also be isolated by known means.
  • the inspection method of the present invention includes the following (1) to (12): (1) The methylation state of one or more predetermined CpG sites present in a region (JAK3-DMR) in the human JAK3 gene represented by the nucleotide sequence of SEQ ID NO: 1; (2) The methylation state of one or more predetermined CpG sites present in a region (RASGRF1-DMR) in the human RASGRF1 gene represented by the nucleotide sequence of SEQ ID NO: 2; (3) methylation state of one or more predetermined CpG sites present in a region (CPXM1-DMR) in the human CPXM1 gene represented by the nucleotide sequence of SEQ ID NO: 3; (4) The methylation state of one or more CpG sites present in a region (SHF-DMR) in the human SHF gene represented by the nucleotide sequence of SEQ ID NO: 4; (5) methylation state of one or more predetermined CpG sites present in a region (DNM3
  • the CpG site present in the nucleotide sequence of the DMR represented by each of the above SEQ ID NOs is indicated by a capital letter “CG”.
  • methylation of one or more CpG sites present in the underlined region can be detected in the nucleotide sequence represented by each SEQ ID NO.
  • methylation of one or more predetermined CpG sites present in the boxed region in the nucleotide sequence can be detected.
  • one or more CpG sites as detection targets for DNA methylation can be arbitrarily selected from the CpG sites present in each of the nucleotide sequences of SEQ ID NOs: 1 to 12.
  • MSP methylation-specific PCR
  • at least one of the primer sets to be used is annealed to one or more CpG sites.
  • both primer sets are designed to anneal to one or more CpG sites (more preferably 2 to 4 CpG sites).
  • an appropriate interval (for example, 15 to 300 nucleotides, preferably 20 to 200 nucleotides, more preferably 30 to 100 nucleotides) is included in each nucleotide sequence of SEQ ID NOs: 1 to 12 above.
  • the two adjacent 2-4 CpG sites present (4-8 in total) can be detection targets for DNA methylation.
  • one or more markers selected from the breast cancer-specific methylation gene markers (1) to (4), and the luminal breast cancer-specificity (5) to (8) DNA methylation can be detected at one or more markers selected from methylated gene markers and at least one marker selected from triple negative breast cancer-specific methylated gene markers (9) to (12).
  • a breast cancer-specific (common breast cancer) methylation gene marker and a luminal breast cancer-specific methylation gene marker are DNA methylation positive and a triple negative breast cancer-specific methylation gene marker is DNA methylation negative
  • the subject can be determined to have a probability of suffering from luminal breast cancer.
  • the breast cancer specific methylation gene marker and the triple negative breast cancer specific methylation gene marker are DNA methylation positive and the luminal breast cancer specific methylation gene marker is DNA methylation negative, the subject is triple negative. It can be determined that there is a probability of suffering from type breast cancer.
  • the subject is luminal. It can be determined that there is a probability of suffering from subtypes of breast cancer (eg, HER2 type) other than type 3 and triple negative types.
  • DNA methylation can be detected in all methylated gene markers (1) to (12) above.
  • DNA methylation can be detected by any known method, for example, methylation-specific PCR (MSP) method using bisulfite treatment, MethykLight method, COBRA method, bisulfite sequencing method, pyrosequencing method And the MassARRAY method, a method using a methylation-sensitive restriction enzyme, a MeDIP method using a protein that recognizes methylated DNA, a MIRA method, and the like.
  • MSP methylation-specific PCR
  • a method using bisulfite treatment is preferable, and an MSP method is more preferable. The following outlines typical detection methods, but is not limited to these methods.
  • “Methylation-sensitive restriction enzyme treatment” is a method of treating circulating DNA with a restriction enzyme that has the property that it cannot cleave DNA cleavage when cytosine of the recognition sequence is affected by methylation by CpG methylase ( 5m CG). . Therefore, if the cytosine of DNA is not methylated, it is not cleaved. If it is not methylated, it is cleaved, so that methylated DNA and unmethylated DNA can be distinguished.
  • a primer set is designed so as to sandwich a recognition sequence of a methylation-sensitive restriction enzyme, and the methylated DNA concentration can be measured by quantitative PCR.
  • the “MeDIP method” is a method for concentrating methylated DNA contained in circulating DNA by immunoprecipitation using an anti-methylated cytosine antibody, an anti-methylated cytidine antibody, or an antibody that specifically recognizes a methylated DNA-binding protein. It is. After this concentrated methylated DNA is amplified by PCR, the methylated DNA concentration can be measured using a microarray (MeDIP-chip method).
  • the “bisulfite treatment method” is a method in which a solution of bisulfite (bisulfite) such as sodium, potassium, calcium or magnesium salt of bisulfite is added to a DNA solution.
  • bisulfite such as sodium, potassium, calcium or magnesium salt of bisulfite
  • unmethylated cytosine (C) contained in the DNA is converted to uracil (U) by a deamination reaction.
  • bisulfite does not act on methylated cytosine, and base conversion as described above does not occur. Therefore, the presence or absence of cytosine methylation in DNA is converted into a difference in base sequence (C and U) by bisulfite treatment.
  • Quantitative PCR can be carried out using specific primer sets at sites with different nucleotide sequences between methylated DNA and unmethylated DNA, and the methylated DNA concentration can be measured (methylation specific PCR (methylation specific PCR (MSP))).
  • MSP methylation specific PCR
  • the methylated DNA concentration measurement method using the bisulfite treatment method includes COBRA (Combined Bisulfite Restriction Analysis) method, methylation-sensitive single nucleotide primer extension (Methylation-sensitive Single- Nucleotide Primer Extension) method, quantitative MSP method, pyrosequencing method and the like can also be used.
  • COBRA Combin Bisulfite Restriction Analysis
  • methylation-sensitive single nucleotide primer extension Methodhylation-sensitive Single- Nucleotide Primer Extension
  • quantitative MSP method quantitative MSP method
  • pyrosequencing method pyrosequencing method and the like
  • DNA methylation of a methylated gene marker is quantified as the concentration of an allele in which one or more CpG sites present in the marker are methylated.
  • the TaqMan PCR method is a method using PCR using a fluorescently labeled allele-specific oligonucleotide (TaqMan probe) and Taq DNA polymerase.
  • TaqMan probe an oligonucleotide having a continuous base sequence of about 8 to about 15 bases contained in a region in a methylated gene marker amplified by PCR is used.
  • the 5 ′ end of the probe is labeled with a fluorescent dye such as FAM, Alexa532, Cy3, or Cy5, and the 3 ′ end is labeled with a quencher such as TAMRA, BHQ1, BHQ2, or IBRQ.
  • the quencher absorbs the fluorescence energy, so fluorescence is not detected.
  • the 3 ′ end is phosphorylated so that a PCR extension reaction from the TaqMan probe does not occur.
  • the TaqMan probe hybridizes with the template DNA and simultaneously extends from the PCR primer.
  • the hybridized TaqMan probe is cleaved by the 5 ′ nuclease activity of Taq DNA polymerase, the fluorescent dye is released and is not affected by the quencher, and fluorescence is detected.
  • the fluorescence intensity increases exponentially by amplification of the template.
  • known systems and equipment can be used, but from the viewpoint of quantification, digital drop using a digital PCR equipment (QX100, BioRad). It is preferred to use a let PCR system.
  • a digital droplet PCR system two different methylated genes can be detected simultaneously in the same sample, so that two TaqMan probes used simultaneously in the same sample have different fluorescence wavelengths.
  • a fluorescent dye for example, FAM as a probe for detecting one gene and Alexa532 as the other).
  • a primer set can be appropriately designed by those skilled in the art according to the DNA methylation site to be detected in each of the above methylated gene markers.
  • the primer length is not particularly limited, and is about 15 bases or more, preferably about 18 to 50 bases, more preferably about 20 to 40 bases.
  • primer sets for detecting DNA methylation in each of the above methylated gene markers are the following (1) to (12): (1) A region containing one or more CpG sites present in DMR (JAK3-DMR) in the human JAK3 gene represented by the nucleotide sequence of SEQ ID NO: 1, preferably a region represented by nucleotide numbers 16 to 534 ( A region containing one or more CpG sites present in the underlined portion, more preferably a region containing one or more CpG sites present in the region indicated by nucleotide numbers 116 to 434 (region surrounded by a box); (2) a region containing one or more CpG sites present in DMR (RASGRF1-DMR) in the human RASGRF1 gene represented by the nucleotide sequence of SEQ ID NO: 2, preferably a region represented by nucleotide numbers 59 to 345 ( A region containing one or more CpG sites present in the underlined portion, more preferably a region containing one or more
  • primer sets for detecting DNA methylation in each of the above methylated gene markers are the following (1A) to (12A):
  • the bisulfite-treated sequence when all existing CpG sites are methylated (same for SEQ ID NOs: 14 to 36 below), a region containing one or more CpG sites, preferably the nucleotide In the region containing one or more CpG sites present in the region indicated by nucleotide numbers 16 to 534 (underlined part) in the sequence, more preferably in the region indicated by nucleotide numbers 116 to 434 (region surrounded by a box)
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 14 obtained by bisulfite treatment of the reverse strand of JAK3-DMR preferably a region represented by nucleotide numbers 9 to 527 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 16 obtained by bisulfite treatment of the reverse strand of RASGRF1-DMR preferably a region represented by nucleotide numbers 658 to 944 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 18 obtained by bisulfite treatment of the reverse strand of CPXM1-DMR preferably a region represented by nucleotide numbers 558 to 917 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 20 obtained by bisulfite treatment of the reverse strand of SHF-DMR preferably a region represented by nucleotide numbers 248 to 558 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 22 obtained by bisulfite treatment of the reverse strand of DNM3-DMR preferably a region represented by nucleotide numbers 280 to 752 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 24 obtained by bisulfite treatment of the reverse strand of CAV2-DMR preferably a region represented by nucleotide numbers 1 to 452 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 26 obtained by bisulfite treatment of the reverse strand of HOXA10-DMR preferably a region represented by nucleotide numbers 14 to 384 in the nucleotide sequence
  • a region containing one or more CpG sites present in (underlined portion) more preferably a region containing one or more CpG sites present in the region indicated by nucleotide numbers 114 to 284 (region surrounded by a box) ;
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 28 obtained by bisulfite treatment of the reverse strand of B3GNT5-DMR preferably a region represented by nucleotide numbers 199 to 678 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 30 obtained by bisulfite treatment of the reverse strand of ST3GAL6-DMR preferably a region represented by nucleotide numbers 193 to 601 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 32 obtained by bisulfite treatment of the reverse strand of DACH1-DMR preferably a region represented by nucleotide numbers 8 to 502 in the nucleotide sequence
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 34 obtained by bisulfite treatment of the reverse strand of P2RX3-DMR preferably a region represented by nucleotide numbers 192 to 502 in the nucleotide sequence
  • nucleotide sequence of SEQ ID NO: 35 obtained by bisulfite treatment of the normal chain of the genomic DNA region (cg23495581-DMR) on human chromosome 8 represented by the nucleotide sequence of SEQ ID NO: 12
  • a region containing the above CpG sites preferably a region containing one or more CpG sites present in the region (underlined) shown by nucleotide numbers 164 to 822 in the nucleotide sequence, more preferably nucleotide numbers 264 to 722.
  • a region containing one or more CpG sites present in the nucleotide sequence of SEQ ID NO: 36 obtained by bisulfite treatment of the reverse strand of cg23495581-DMR preferably a region represented by nucleotide numbers 100 to 758 in the nucleotide sequence
  • the test method of the present invention comprises the step of further measuring the DNA amount of two or more internal standard gene markers of the present invention present on separate chromosomes in addition to the above step A (step B).
  • the internal standard gene marker can be detected and quantified by a method known per se, for example, when the internal standard gene marker is detected and quantified by methylation-specific PCR in combination with the above methylated gene marker. A region having no CpG sequence is set as a detection target, and a primer / probe set capable of amplifying and detecting the region can be designed. When using digital PCR as shown in the examples described later, the DNA amount of the internal standard gene marker can be quantified as the allele concentration of the gene.
  • (IV) Diagnosis algorithm When it further comprises the methylation status of one or more CpG sites present in each DMR and the detection step B of an internal standard gene marker obtained in the above step A, it is obtained in that step. Further, based on the DNA amount of the internal standard gene marker, it can be determined whether or not the subject is highly likely to have breast cancer. For example, the methylation status of the methylated gene marker (and the amount of DNA of the internal standard gene marker) in the DNA-containing sample collected from the healthy subject and the subject or the DNA isolated from the sample is measured, respectively. Each measured value can be compared with a person.
  • a correlation diagram between the methylation state of the methylated gene marker (and the amount of DNA of the internal standard gene marker) and the presence or absence of breast cancer is prepared in advance (for example, setting of a cutoff value),
  • the measured value of the methylation state of the methylated gene marker (and the amount of DNA of the internal standard gene marker) in the subject can also be compared with the correlation diagram.
  • the measured value (detection signal) reflecting the methylation state of the methylated gene marker shows an abnormal value, it is necessary to exclude it from the assessment of the presence or absence of breast cancer. It is desirable to determine an upper limit value (positive cutoff value) and a lower limit value (signal cutoff value) of the detection signal.
  • the method described in the below-mentioned Example is mentioned, for example.
  • the methylation state of the methylated gene marker (and the amount of DNA of the internal standard gene marker) was higher than that in the healthy subject (or a preset cutoff value)
  • the subject can be judged to have a high probability of suffering from breast cancer.
  • the methylation status of the methylated gene marker (and the amount of DNA of the internal standard gene marker) in the DNA-containing sample is measured, and breast cancer is affected.
  • An inspection value calculation formula and a cut-off value for determining the presence / absence can be determined.
  • the allele concentration of each gene marker Logarithm (log 10 ), logarithmic value of the allele concentration of each methylated gene marker, arithmetic average of the logarithmic value, arithmetic average of the logarithmic value of the allele concentration of the internal standard gene marker, and further DNA methylation positive
  • Logarithm log 10
  • logarithmic value of the allele concentration of each methylated gene marker arithmetic average of the logarithmic value
  • arithmetic average of the logarithmic value of the allele concentration of the internal standard gene marker and further DNA methylation positive
  • factor data such as the number of methylated gene markers, and uses two types of algorithms, Linear Discriminant Analysis (LDA) and SVM (Support Vector Machine), and Cross-validation (Leave one out crossvalidation, LOOCV).
  • an ROC curve of the learning set can be created and an optimum cutoff value can be determined.
  • a predetermined coefficient A test value for determining breast cancer with high accuracy can be calculated using a calculation formula obtained by multiplying.
  • Test value 0.62449 x [RASGRF1] + 0.78110 x [CPXM1] + 0.12115 x [HOXA10] + 0.36760 x [DACH1] + 0.65288 x [Mean12] + 2.44704 x [IC]-6.98073
  • [RASGRF1], [CPXM1], [HOXA10], and [DACH1] represent the logarithmic value of the allele concentration of each methylated gene marker where DNA methylation occurred
  • [Mean12] represents DNA methylation
  • [IC] is the allele concentration of the above 4 internal standard gene markers (CREM, GLYATL3, ELMOD3 and KLF9 genes) Represents the arithmetic mean of logarithmic values of. ]
  • CREM CREM, GLYATL3, ELMOD3 and KLF9 genes
  • the present invention also includes a primer set for carrying out the above-described test method of the present invention, preferably a probe for detecting a fragment amplified by the primer set.
  • a test drug for the above also referred to as a test drug of the present invention is provided.
  • the diagnostic agent of the present invention is one or more breast cancers or breast cancer subtypes selected from the above (1) to (12) or the above (1A) to (12A) in “(III) Examination method for breast cancer diagnosis”. It comprises one or more primer sets capable of detecting methylation of a predetermined CpG site present in the region of DMR specific to the.
  • the test agent of the present invention is a primer set for detecting the internal standard gene marker, that is, the following (13) to (16): (13) A primer set for specifically detecting the CREM gene or a fragment thereof; (14) a primer set for specifically detecting the GLYATL3 gene or a fragment thereof; (15) a primer set for specifically detecting the ELMOD3 gene or a fragment thereof; and (16) a primer set for specifically detecting the KLF9 gene or a fragment thereof; It further includes one or more selected primer sets.
  • the test agent of the present invention can detect, with high sensitivity, preferably quantitatively, the methylated gene marker of the present invention and the fragment of the internal standard gene marker of the present invention, which are amplified using the above primer set. It is preferable to further include a nucleic acid probe having a nucleotide sequence complementary to the nucleotide sequence in the amplified fragment and labeled with a labeling substance for easy and sensitive detection.
  • a nucleic acid probe having a nucleotide sequence complementary to the nucleotide sequence in the amplified fragment and labeled with a labeling substance for easy and sensitive detection.
  • the Taqman probe described above in “(III) Test method for breast cancer diagnosis” can be used.
  • a primer / probe set that can be used to detect the methylated gene marker of the present invention in which DNA methylation has occurred
  • a primer that can be used to detect the internal standard gene marker of the present invention Table 2 shows the probe set.
  • the primer / probe set used in the test agent of the present invention uses a commercially available DNA / RNA automatic synthesizer or the like for a part or all of the base sequence and / or its complementary strand sequence based on known base sequence information. Can be obtained by chemical synthesis.
  • the reagent containing the primer / probe set can be provided as a solid in a dry state or in the form of an alcohol precipitate, or in a dissolved state in water or a suitable buffer (eg, TE buffer). You can also
  • the test agent of the present invention includes other substances necessary for the reaction for detecting the methylated gene marker of the present invention in which DNA methylation has occurred and the internal standard gene marker of the present invention.
  • a substance that does not adversely influence the reaction when stored in a coexisting state can be further contained.
  • the test agent of the present invention may be provided as a reagent kit containing the other substance as a reagent separate from the reagent containing the primer / probe set. Examples of such other substances include reaction buffers, dNTPs, and heat-resistant DNA polymerase.
  • FFPE specimens of invasive ductal carcinoma were also obtained through Biobank. The subtype of each case was determined by immunostaining for estrogen receptor (ER), progesterone receptor (PR), HER2 and Ki-67. The cut-off value for ER and PR negative positive was 1%. As for HER2 negative positivity, it was considered positive if it was 3+ or 2+ and the HER2 / CEP17 ratio was higher than 2.2 by the FISH / DISH method.
  • the FFPE specimen subtype is defined as luminal type A, and ER positive, PR positive, HER2 negative, Ki-67 If ⁇ 14%, the case subtype of the FFPE specimen was defined as luminal type B. Also, if at least one of ER and PR of FFPE specimen is positive and HER2 positive, the subtype of FFPE specimen is defined as luminal HER2, and both ER and PR are negative and HER2 positive.
  • the FFPE specimen case subtype was defined as HER2 type, and when ER, PR, and HER2 were all negative, the FFPE specimen case subtype was defined as the triple negative type.
  • FFPE specimens were sliced to a thickness of 10 ⁇ m, attached to Leica 2 or 4 ⁇ m foil slides, and immunostained with the anti-cytokeratin antibody cocktail AE1 / AE3 by the avidin-biotin complex method. Antigen activation was performed with Histo / Zyme (Diagnostic BioSystems), and normal goat serum and normal bovine serum were mixed to block nonspecific staining.
  • mice anti-human cytokeratin antibody cocktail AE1 / AE3 (Dako) as the primary antibody
  • equine-derived anti-mouse IgG biotinylated antibody as the secondary antibody
  • Vector VECTOR Red Alkaline Phosphatase Substrate Kit Staining was performed along. Thereafter, the cancer cell population was excised with a Leica LMD7000 microdissection instrument. In addition, cancer cell adjacent normal epithelial populations for 10 cases were cut out and collectively used as one specimen of normal epithelial cells. In addition, for a case of intraductal papilloma, the benign tumor portion was cut out with a microdissection and used as one specimen.
  • NucleoSpin FFPE DNA kit (Macherey Nagel) was used for DNA extraction of FFPE specimens.
  • the steps of enzyme treatment of the sample of the manufacturer protocol were changed as follows. After adding 10 ⁇ L of protease K solution to the enzyme treatment solution, the sample was reacted at 37 ° C. for 3 hours, and further 10 ⁇ L of protease K solution was added and reacted for 3 hours. In other steps, DNA was extracted according to the manufacturer's protocol. The amount of DNA was quantified using Infinium HD FFPE DNA sample QC Kit (Illumina).
  • Proteolytic reaction 100 ⁇ L of protease K solution, 800 ⁇ L of Buffer ACL, 100 ⁇ L of PBS and 900 ⁇ L of PBS, shake for 18 hours at 48 ° C., add 100 ⁇ L of protease K solution, vortex for 30 seconds, and then shake for an additional 6 hours Went. Thereafter, the DNA was purified according to the manufacturer's protocol, and the DNA was eluted with 23 ⁇ L of Buffer AVE to obtain about 20 ⁇ L of DNA solution.
  • the ⁇ value which is a continuous variable from 0 to 1 in the scan file of the array, indicates a low methylation state when close to 0, and a high methylation state when close to 1.
  • the Infinium Human Methylation 450K chip was equipped with two different probes, and their ⁇ distribution patterns were slightly different. The function NIMBL for MATLAB was used to correct the ⁇ value distribution between these probes. To compare the methylation status between cancer specimens and non-cancer specimens (FIG. 1-1) and between luminal and triple negative breast cancer (FIG. 1-2), the average ⁇ value was calculated. In FFPE specimens, luminal breast cancer was common, and in cell lines, the ratio of triple negative breast cancer was high.
  • the averages of the two means in FFPE specimens and cell lines were compared in each group of comparisons.
  • the inventors selected a candidate probe for a methylation marker from the probes having an average ⁇ value of less than 0.05 in a non-cancer specimen under the following conditions.
  • A) Common cancer markers 20 probes from probes with a large difference in ⁇ value between cancer and non-cancer
  • Taqman PCR is preferable so that non-specific amplification is not detected in MSP, but the Roche Universal Probe Library (UPL) was used in order to save the cost and time of synthesizing the double fluorescent probe.
  • UPL Roche Universal Probe Library
  • a set of Forward, Reverse primer and UPL was designed at a site as close as possible to the position on the genome.
  • a primer / probe set installed in a region not containing CpG upstream of the promoter region of the ⁇ -actin gene was used.
  • the MSP reaction was performed in a reaction system of 20 ⁇ L in total, including FastStart Universal Probe Master (ROX) (Roche): 10 ⁇ L, MSP primer Mix: 1 ⁇ L, UPL probe: 0.4 ⁇ L, H 2 O: 6.6 ⁇ L, DNA: 2 ⁇ L.
  • PCR was performed using a StepOnePlus real-time PCR system (Applied Bioscience) for 1 cycle at 95 ° C. for 10 minutes, and then 50 cycles at 95 ° C. for 15 seconds and 60 ° C. for 1 minute.
  • the amount of methylation in unknown samples was estimated from the data of serially diluted samples of total methylated DNA treated with SSS-I.
  • the selection conditions for methylated marker candidate probes are as follows: 1) Probes with PCR amplification efficiency of 70% or more and less than 110%, 2) 5 cases of normal blood DNA and 1 case of methylated DNA 3) Probes that detect 2 or more DNA methylations in 28 breast cancer cell lines, 4) Probes that do not detect methylation in DNA pool specimens of normal epithelial cells surrounding breast cancer tissue in FFPE specimens, 5 ) A probe whose gene expression increases upon treatment with a demethylating agent or histone deacetylation inhibitor. Under these conditions, candidate probes for methylation markers were narrowed down, and 4 types of common cancer markers, 4 types of luminal specific markers, and 4 types of triple negative markers were selected (FIG. 2).
  • Luminal breast cancer cell lines MCF7 and T47D were used as cell lines, and MDA-MB-231 and Hs578T were used as triple negative cell lines. Treatment of these cell lines with a demethylating agent (5'-Aza-2-deoxycytidine: 5'-Aza-dC, Sigma-Aldrich) and histone deacetylation inhibitor (trichostatin A: TSA, Sigma-Aldrich) Processed.
  • a demethylating agent 5'-Aza-2-deoxycytidine: 5'-Aza-dC, Sigma-Aldrich
  • histone deacetylation inhibitor trichostatin A: TSA, Sigma-Aldrich
  • RT-PCR primer / probe sets for each gene were designed to cross the exon-exon boundary at the site where the UPL probe can be set.
  • a primer probe for 18S rRNA (Applied BioSystem) was used as an internal standard for total RNA.
  • RT-PCR reaction is QuantiTect Probe RT-PCR Master Mix (QIAGEN): 10 ⁇ L, primer mix: 0.8 ⁇ L, UPL probe: 0.4 ⁇ L, RNA solution: 2 ⁇ L, H 2 O: 6.6 ⁇ L, total 20 ⁇ L reaction system I went there.
  • PCR was performed using a StepOnePlus real-time PCR system (Applied Bioscience) for 1 cycle at 95 ° C. for 10 minutes and then subjected to 45 cycles at 95 ° C. for 15 seconds and 60 ° C. for 1 minute.
  • the RNA expression level of an unknown sample was estimated by performing relative quantification from a serial dilution system of cell line RNA expressing the gene.
  • Duplex MSP used a UPL with FAM and a Taqman probe labeled with Alexa Fluor 532.
  • Custom Alexa Fluor 532 probes change slightly in length around a recognition site for each gene UPL used in candidate probe narrowing stage of methylation markers, labeled LNA TM (Locked a BHQ1 as a quencher It was synthesized as a nucleic acid probe containing Nucleic Acid (Gen Design).
  • ddPCR TM Supermix for Probes BioRad
  • primer Mix 1.1 ⁇ L ⁇ 2
  • UPL and Taqman probes 0.44 ⁇ L ⁇ 2
  • bisulfite treatment A total of 22 ⁇ L of a reaction solution was prepared with DNA: 2.2 ⁇ L and H 2 O: 5.72 ⁇ L.
  • Droplets were formed with QX100 Droplet Generator (BioRad) together with Droplet Generation Oil, and PCR reaction was performed with T100 TM Thermal Cycler (BioRad).
  • ddMSP data analysis A total of 278 plasma samples of 145 breast cancer cases and 133 healthy subjects were analyzed. Cases were divided into a learning set (167 cases) and a validation set (111 cases), and the stage ratios of breast cancer cases in both groups were adjusted to be the same.
  • the diagnostic algorithm was constructed only from the data of the sample analysis of the learning set cases, and later the diagnostic accuracy of the constructed diagnostic algorithm was verified using the data of the verification set cases. Since it was difficult to customize the cutoff value of the droplets with the software that came with the digital PCR instrument, it was independently analyzed with MATLAB software.
  • the droplet signal data was exported as a csv file from the attached software and imported into the MATLAB software. 1) It has a fluorescent signal with few signal negative droplets.
  • the signal intensity distribution of the negative signal droplet was plotted using the MATLAB kernel smoothing function estimation ksdenstiy function also used for mass spectrometry peak identification (FIG. 3-1).
  • the upper limit of the band of the peak was calculated for each reaction system, and the signal intensity values of all droplets were converted to the signal intensity from the reference value (referred to as amplified signal value).
  • the cutoff value of the amplification signal upper limit was determined from the amplification signal value data of the learning set.
  • the PCR plate In the measurement of digital PCR, the PCR plate always included a reaction for amplifying the total methylated DNA, which is a positive control sample, with the primer probe of each marker.
  • the signal lower limit cutoff value was determined as follows using the amplified signal value data of the learning set used in 2). First, the provisional lower limit cutoff value is set to 0, and the number of droplets between the amplification signal value and the upper limit cutoff value determined in 2) is counted as the number of positive droplets. Corrected by Poisson distribution from the total number of droplets (1 droplet is 1 nanoliter of PCR reaction solution) and the number of positive droplets (BJ Hindson, et al, High-Throughput Droplet Disital PCR System for Absolute Quantitation of DNA Copy Number. Analytical chemistry, Vol. 83, 8604-10, 2011), the number of positive alleles in 20 microliters of the reaction solution is calculated.
  • the allele concentration in 1 milliliter of patient plasma is calculated therefrom.
  • the logarithm (log10) allele concentration is calculated for all cases in the learning set, and the area under the ROC curve (AUC) for cancer-noncancer discrimination is calculated.
  • the provisional lower limit cut-off value was increased by 10 (FIG. 3-3), and the lower limit cut-off value when the AUC reached the maximum was adopted (FIG. 3-4).
  • Table 4 shows the cutoff values.
  • concentration was computed using the cutoff value of the same amplification signal upper limit and lower limit as the same procedure.
  • ROC curve analysis was performed for each of the 12 breast cancer diagnostic markers, and the cutoff value corresponding to the point on the ROC curve closest to the (0, 1) point was defined as the methylation positive cutoff value (Fig. 5- 1, Table 5), the number of positive markers among 12 markers was also calculated.
  • the mean log 10 density thereof, mean log 10 concentration of the internal standard markers, 15 factors of the number of positive markers were obtained. Which combination of these 15 factors is good? 2 15 -1 combinations of factors, using one-off cross-validation (LOOCV), linear discriminant analysis (LDA) and SVM ( The prediction value of each case was calculated by Support Vector Machine), and the diagnostic accuracy was evaluated by AUC.
  • LOCV linear discriminant analysis
  • SVM SVM
  • the set of factors and algorithms with the highest AUC were selected, with all coefficients for the factors used being positive.
  • the entire learning set 167 case data was fitted, the validation set data was introduced, the test values for each case were calculated, and the diagnostic accuracy in the validation set cohort was estimated.
  • MATLAB2015a basic set, Statistics and Machine Learning Toolbox, Bioinformatics Toolbox, Parallel Computing Toolbox
  • NIMBL as a third-party MATLAB function for ⁇ -value correction of methylated arrays
  • notBoxPlot as a composite of box plot and scatter plot Used to create.
  • R software was used to test for differences between subtypes of test values.
  • Cell lines include 28 breast cancer cell lines, 31 specimens, and 3 non-cancer cell line specimens (umbilical vascular endothelial cells, normal breast vascular endothelial cells, breast normal epithelial cells).
  • Breast cancer cell line subtypes are luminal type 4 Strains, luminal HER2 type 1 strain, HER2 type 4 strain, triple negative 18 strain, subtype unknown 1 strain.
  • Three breast cancer cell lines were analyzed in duplicate as a batch-to-batch control for array experiments. As shown in FIG. 2, the MSP primer / probe set is designed based on the methylated marker candidate probe, and the SSS-I-treated total methylated DNA is used, and the amplification efficiency in the real-time PCR machine is within an acceptable range. I checked that.
  • a sample of 5 healthy blood cells a sample of 28 breast cancer cells, a sample of 3 non-cancerous normal cells, and a microdissection sample of FFPE tissue of normal mammary epithelial cells, Narrowed down.
  • RT-PCR analysis was performed to confirm gene expression in breast cancer cell lines treated with demethylating agents and histone deacetylation inhibitors, and probes present on the genes whose expression was suppressed by methylation were preferentially selected. It is.
  • JAK3, RASGRF, SHF, and CPXM1 actually controlled gene expression. Eleven of the 13 luminal marker candidates were thought to epigenetically regulate gene expression.
  • the methylation profile was measured by the ddMSP assay method established above using plasma samples of 145 breast cancer cases and 133 healthy subjects, a total of 278 cases. Divide this case into a learning set (87 breast cancer cases, 80 healthy people) and a validation set (58 breast cancer cases, 53 healthy people), so that the ratio of clinical stage of breast cancer in both groups is equal Adjusted.
  • the clinical stage 0-I, IIA, IIB-III, and IV + metastatic breast cancer cases in breast cancer patients were 30, 19, 19, and 19 in the learning set and 21, 12, 12, and 13 in the validation set, respectively. .
  • the patient's clinicopathological background is shown in Table 7.
  • the ROC curves for each marker are shown in FIGS. 5-1 and 5-2.
  • the area under the ROC curve (AUC) of the 12 probes ranged from 0.56 to 0.71 (FIG. 5-1).
  • the AUC of the four internal standard markers was 0.8 or more (FIG. 5-1), and the average AUC of the four internal standard markers reached 0.89 (FIG. 5-2).
  • the average AUC of methylated allele concentrations of 12 probes and the AUC of the number of methylation positive probes were 0.77 and 0.82, respectively (FIG. 5-2).
  • the best diagnostic algorithm was searched with 15-factor data of the learning set using linear discriminant analysis and two algorithms of SVM and cross-validation method (LOOCV).
  • [RASGRF1], [CPXM1], [HOXA10], and [DACH1] represent the logarithmic value of the allele concentration of each methylated gene marker where DNA methylation occurred
  • [Mean12] represents DNA methylation
  • [IC] is the pair of allele concentrations of the 4 internal standard gene markers (CREM, GLYATL3, ELMOD3 and KLF9 genes) Represents the arithmetic mean of numbers.
  • the gene and the KLF9 gene can be used as a genetic marker for detecting breast cancer to test whether or not the subject has breast cancer.

Abstract

本発明は、被験者から採取したDNA含有試料中の、JAK3遺伝子、RASGRF1遺伝子、CPXM1遺伝子、SHF遺伝子、DNM3遺伝子、CAV2遺伝子、HOXA10遺伝子、B3GNT5遺伝子、ST3GAL6遺伝子、DACH1遺伝子、P2RX3遺伝子およびcg23495581ゲノム領域内の、乳がんもしくは乳がんサブタイプに特異的なDNAメチル化領域(DMR)より選択される一以上のDMR中に存在する一以上のCpG部位のメチル化の状態を測定すること含む、乳がんの診断のための検査方法を提供する。

Description

乳がんの診断のための検査方法、遺伝子マーカー、および検査薬
 本発明は乳がんの診断(又は判定)のための検査方法、遺伝子マーカー、および検査薬に関する。より詳しくは、いずれのサブタイプの乳がんにおいても早期の検出が可能な検査方法、すなわち、被験者から採取したDNAに対するエピジェネティック遺伝子マーカー(メチル化遺伝子マーカー)のメチル化状態、およびDNAの全体量を反映する内部標準遺伝子マーカーのDNA量を測定する事により乳がん検査を行う方法、そのための遺伝子マーカー、および検査薬に関する。
 乳がんは女性に発症するがんのうち最も発症頻度が高いがんであり、女性におけるがんによる死亡の第1位の原因である。乳がんは性格の異なるサブタイプが含まれる不均一な疾患群であり、ホルモン受容体(ER、PgR)およびHER2の発現と増殖能(Ki67標識率)の違いにより5種類のサブタイプに分類される。近年の網羅的な遺伝子発現解析から、乳がんは腫瘍生物学的に異なった内因性サブタイプに分類することができ、それが上記臨床病理学的分類とよく一致することが判明している。さらに、遺伝子変異、コピー数多型、遺伝子発現およびDNAメチル化の網羅的解析により、各内因性サブタイプにおける遺伝子やエピジェネティクスに関する特徴も明らかになっている。現在は、マイクロアレイデータから各内因性サブタイプに対するsignature遺伝子を50個抽出し、RT-PCRでアッセイするPAM50が、内因性サブタイプを分類する標準的な手法として認識されているが、費用の問題や利用できない地域があることなどから、日常診療に応用するのは難しい状況である。そこで、PAM50の代わりにエストロゲンレセプター(ER)やプロゲステロンレセプター(PgR)、HER2、Ki67、EGFR、cytokeratin5/6の免疫染色を利用したサブタイプ分類法が用いられている。
 乳がんの臨床経過は内因性サブタイプごとに大幅に異なる。例を挙げると、Basal-like乳がんは増殖が速く、内臓に転移する傾向がある。一方、Luminal A乳がんは増殖が遅いが、初期治療より10年以上経過しても再発する可能性がある。乳がんの内因性サブタイプの判定は適切な治療方針を選択するための指針となるため、上記のバイオマーカー以外にも多くのバイオマーカーの探索と研究が行われている。そのなかでも、血液を利用した乳がんのバイオマーカー研究は、診断や治療効果のモニタリング、予後予測などへの応用を目指して活発に行われている。
 血液を利用した乳がんのバイオマーカーとしては、CA15-3、CEA等の血清タンパク質、循環腫瘍細胞(circulating tumor cells:CTCs)、循環腫瘍DNA(ctDNA)の遺伝子変異等が挙げられる。しかし、上記のバイオマーカーを利用した検査方法は、臨床上用いることができない課題を抱えている。例えば、血清タンパク質は乳がんの術後再発の検出や、その治療効果のモニタリングには有用であるが、乳がんのスクリーニングには感度・特異度が低く、乳がん検診には利用されていない(非特許文献1)。CTCは、乳がん症例での血中CTC数が予後と相関していることが示されており(非特許文献2)、Cell SearchシステムはFDAの認可を得ている。しかし、感度に課題があり、早期乳がんではCTCの検出は困難であるため、乳がんのスクリーニングには不向きである。さらに、CTCの検出に上皮性細胞表面マーカーのEpiCAMを使用しているため、トリプルネガティブ型乳がんでの検出率が低いことがわかっている(非特許文献3)。また、ctDNAの遺伝子変異はがん組織または前がん病変にのみ起こっていると考えられており、がん組織の検出法として特異度は高い。乳がんではTP53やPIK3CAといった変異頻度の高い遺伝子が同定されているが、その変異部位は遺伝子の広範囲に分布している。その為、臨床でよく使用されているPCRによる検出を試みた場合、特定のHOT SPOTにのみ絞り込むとその陽性率が下がり、陽性率を上げる為にマーカー数を増やすと煩雑になる。また、遺伝子単位で網羅的にする為にtargeted sequencingも研究段階として始められているが、高速シーケンサーによるシーケンシングとそのデータ解析が臨床に普及するにはまだ時間がかかると考えられる。
 上記以外の血液を利用した乳がんのバイオマーカーとしては、メチル化されたctDNAが挙げられる。乳がん患者の血漿中や血清中の循環腫瘍DNAのメチル化をバイオマーカーとした研究報告はいくつかあるものの、各マーカーの陽性率は進行症例であっても低い。また、乳がんのうち、トリプルネガティブ型乳がんは、ゲノム全体的に低メチル化の傾向があり、本症例はエピジェネティックマーカーを用いても検出が困難であることが予想される。現在においても、簡便で迅速に、サブタイプを網羅した乳がんを検出するためのバイオマーカーは見出されていないままである。
Dawson S-J, Tsui DWY, Murtaza M, Biggs H, Rueda OM, Chin S-F, et al. Analysis of circulating tumor DNA to monitor metastatic breast cancer. N Engl J Med [Internet]. 2013 [cited 2014 Jul 9];368:1199-209 Hayes DF, Cristofanilli M, Budd GT, Ellis MJ, Stopeck A, Miller MC, et al. Circulating tumor cells at each follow-up time point during therapy of metastatic breast cancer patients predict progression-free and overall survival. Clin Cancer Res. 2006;12:4218-24 Sieuwerts AM, Kraan J, Bolt J, Van Der Spoel P, Elstrodt F, Schutte M, et al. Anti-epithelial cell adhesion molecule antibodies and the detection of circulating normal-like breast tumor cells. J Natl Cancer Inst. 2009;101:61-6
 本発明は、異なるサブタイプの乳がんを網羅的に検査し得る遺伝子マーカーを見出し、該遺伝子マーカーを用いて、従来高感度の検出が困難であったトリプルネガティブ型を含むいずれのサブタイプの乳がんについても高感度・高特異度で検出可能な検査方法を提供することを課題とする。
 さらに、従来のマンモグラフィー検査のような被験者の痛みを伴う検査に代わる、低侵襲な血液検査において、早期に乳がんの診断が可能な検査方法、そのための遺伝子マーカーおよび検査薬を提供することを課題とする。
 本発明者らは、従来の単一マーカーでは困難であった複数のサブタイプから構成される乳がんの診断の感度・特異度を上げるため、乳がんで特異的なDNAメチル化異常に着目して網羅的なエピジェネティック解析を行い、乳がん群と非がん群、もしくはある特定の乳がんサブタイプ群とそれ以外の群でDNAメチル化陽性パターンの異なる複数の遺伝子マーカーを同定した。具体的には、ヒトゲノム上の45万箇所のDNAメチル化状態をDNAメチル化アレイで解析した結果、健常者のDNAでメチル化が生じにくく、かつ1)乳がん全般でDNAメチル化が高率な特定のゲノムDNA領域(Differentially methylated region; DMR)(JAK3遺伝子、RASGRF1遺伝子、CPXM1遺伝子、SHF遺伝子内のDMR)、2)ルミナール型乳がんでDNAメチル化が高率なDMR(DNM3遺伝子、CAV2遺伝子、HOXA10遺伝子、B3GNT5遺伝子内のDMR)、および3)トリプルネガティブ型乳がんでDNAメチル化が高率なDMR(ST3GAL6遺伝子、DACH1遺伝子、P2RX3遺伝子、cg23495581(イルミナ社のDNAメチル化アレイのプローブ)で特定される第8番染色体上の遺伝子間領域(以下、「cg23495581」という)とその近傍のDMR)、をそれぞれエピジェネティック遺伝子マーカーとして同定した。
 また、乳がん、特にトリプルネガティブ型乳がんでは、ゲノム全体的に低メチル化傾向にあるサブタイプがあり、これらの症例はエピジェネティックマーカーのみを用いても検出が困難なことが想定され、また、一般的にがん症例では血中遊離DNA(循環DNA)量が上昇していることや、がん症例の循環DNAはがん病巣のコピー数異常の影響を受けていることがわかっているため、本発明者らは、上記エピジェネティック遺伝子マーカーの検出とともに、DNA(特に循環DNA)全体の量を反映する指標(内部標準)となる遺伝子マーカーを同定し、当該内部標準遺伝子マーカーの検出によるDNA量の測定を組み合わせることを試みた。具体的には、乳がん細胞でDNAコピー数異常が少なく、それぞれ異なる染色体上に存在する遺伝子領域を内部標準遺伝子マーカーとして複数選択し(CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子)、DNA量測定におけるコピー数異常の影響を最小限にした。
 本発明者らは、同定された複数のエピジェネティック遺伝子マーカー(JAK3遺伝子、RASGRF1遺伝子、CPXM1遺伝子、SHF遺伝子、DNM3遺伝子、CAV2遺伝子、HOXA10遺伝子、B3GNT5遺伝子、ST3GAL6遺伝子、DACH1遺伝子、P2RX3遺伝子、cg23495581)と、内部標準遺伝子マーカー(CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子)とを組み合わせて、乳がん患者を同定するエピジェネティック遺伝子マーカーパネルを構築した。本発明者らは、乳がん患者と健常者からなる集団(学習セット)の血漿を用いて、循環DNA中に含まれる、各DMR中に存在する所定の複数のCpG部位がメチル化されたJAK3遺伝子、RASGRF1遺伝子、CPXM1遺伝子、SHF遺伝子、DNM3遺伝子、CAV2遺伝子、HOXA10遺伝子、B3GNT5遺伝子、ST3GAL6遺伝子、DACH1遺伝子、P2RX3遺伝子およびcg23495581の各アレル濃度と、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子の各アレル濃度を測定し、乳がんであるか否かを判定する最適解を与える検査値計算式とカットオフ値を決定した。さらに、別の乳がん患者と健常者からなる集団(検証セット)でも同様に測定を行い、測定された各アレル濃度を前記検査値計算式に当てはめて検査値を算出し、前記カットオフ値と比較したところ、検証セットの乳がん患者を精度よく判定できることを確認した。
 本発明者らは、これらの知見に基づいてさらに検討を重ねた結果、本発明を完成させるに至った。
 すなわち、本発明は以下よりなる。
(項1)
 乳がんの診断のための検査方法であって、被験者から採取したDNA含有試料中の、以下の(1)~(12):
(1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
(12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域中に存在する所定の一以上のCpG部位のメチル化の状態;
より選択される一以上のメチル化の状態を測定する工程(工程A)を含む、方法。
(項2)
 工程Aにおいて、前記(1)~(4)より選択される一以上のメチル化の状態、前記(5)~(8)より選択される一以上のメチル化の状態および前記(9)~(12)より選択される一以上のメチル化の状態を測定することを特徴とする、項1に記載の方法。
(項3)
 工程Aにおいて、前記(1)~(12)に示すメチル化の状態を測定することを特徴とする、項1または2に記載の方法。
(項4)
 それぞれ別個の染色体に存在する2以上の遺伝子であって、DNA全体の量を反映する因子となり得る内部標準遺伝子の量をさらに測定する工程(工程B)を含む、項1~3のいずれか一項に記載の方法。
(項5)
 前記内部標準となり得る遺伝子が、乳がん細胞でのコピー数変異の頻度が5%未満である、項4に記載の方法。
(項6)
 前記内部標準となり得る遺伝子がCREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子からなる一群から選択される1以上の遺伝子を含むことを特徴とする、項4に記載の方法。
(項7)
 前記内部標準となり得る遺伝子がCREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子であることを特徴とする、項4に記載の方法。
(項8)
 前記被験者から採取したDNAが、血中循環DNAであることを特徴とする、項1~7のいずれか一項に記載の方法
(項9)
 前記工程Aにおいて、メチル化の状態の測定が、該所定の一以上のCpG部位がメチル化された各遺伝子のアレル濃度を測定することにより行われる、項1~8のいずれか一項に記載の方法。
(項10)
 前記工程Bにおいて、内部標準遺伝子の量が、該遺伝子のアレル濃度であることを特徴とする、項4~9のいずれか一項に記載の方法。
(項11)
 前記工程Aにおいて、前記(1)~(12)に示すメチル化の状態を測定し、前記工程Bにおいて、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子の量を測定することを含む、項9または10に記載の方法であって、
(C)前記工程Aにより得られたそれぞれのアレル濃度の対数、
   前記工程Aにより得られたそれぞれのアレル濃度の対数の相加平均、
   前記工程Bにより得られた前記内部標準となり得る遺伝子のアレル濃度の対数の相加平均に所定の係数を乗じた計算式を用いて、乳がんの判定のための検査値を算出する工程;
をさらに含む、方法。
(項12)
 乳がんの診断のための遺伝子マーカーであって、
以下の(1)~(12):
(1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域中に存在する
一以上のCpG部位を含む該遺伝子断片;
(5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域中に存在する一以上のCpG部位を含む該遺伝子断片;
より選択される一以上の遺伝子断片を含む、遺伝子マーカー。
(項13)
 前記(1)~(12)の遺伝子断片が、
(1)配列番号1のヌクレオチド配列中、ヌクレオチド番号16~534で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(2)配列番号2のヌクレオチド配列中、ヌクレオチド番号59~345で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(3)配列番号3のヌクレオチド配列中、ヌクレオチド番号41~400で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(4)配列番号4のヌクレオチド配列中、ヌクレオチド番号150~460で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(5)配列番号5のヌクレオチド配列中、ヌクレオチド番号118~590で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(6)配列番号6のヌクレオチド配列中、ヌクレオチド番号115~566で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(7)配列番号7のヌクレオチド配列中、ヌクレオチド番号641~1011で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1116~1595で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(9)配列番号9のヌクレオチド配列中、ヌクレオチド番号40~448で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(10)配列番号10のヌクレオチド配列中、ヌクレオチド番号330~824で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(11)配列番号11のヌクレオチド配列中、ヌクレオチド番号225~535で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(12)配列番号12のヌクレオチド配列中、ヌクレオチド番号164~822で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
である、項12に記載の遺伝子マーカー。
(項14)
 前記(1)~(12)の遺伝子断片が、
(1)配列番号1のヌクレオチド配列中、ヌクレオチド番号116~434で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(2)配列番号2のヌクレオチド配列中、ヌクレオチド番号159~245で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(3)配列番号3のヌクレオチド配列中、ヌクレオチド番号141~300で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(4)配列番号4のヌクレオチド配列中、ヌクレオチド番号251~359で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(5)配列番号5のヌクレオチド配列中、ヌクレオチド番号218~490で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(6)配列番号6のヌクレオチド配列中、ヌクレオチド番号215~484で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(7)配列番号7のヌクレオチド配列中、ヌクレオチド番号741~911で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(9)配列番号9のヌクレオチド配列中、ヌクレオチド番号140~348で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(10)配列番号10のヌクレオチド配列中、ヌクレオチド番号430~724で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(11)配列番号11のヌクレオチド配列中、ヌクレオチド番号326~435で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
(12)配列番号12のヌクレオチド配列中、ヌクレオチド番号264~722で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
である、項12に記載の遺伝子マーカー。
(項15)
 DNA全体の濃度に対する内部標準となり得る遺伝子マーカーであって、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子からなる群より選択される少なくとも1つの遺伝子またはその断片を含む、遺伝子マーカー。
(項16)
 項15記載の遺伝子マーカーと組み合わせて用いることを特徴とする、項12~14のいずれか一項に記載の遺伝子マーカー。
(項17)
 乳がんの診断のための検査薬であって、
以下の(1)~(12):
(1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域中に存在する一以上のCpG部位を領域;
(8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
(12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域中に存在する一以上のCpG部位を含む領域;
より選択される一以上の領域中の所定のCpG部位のメチル化を検出し得る、一以上のプライマーセットを含む、検査薬。
(項18)
 前記(1)~(12)の領域が、
(1)配列番号1のヌクレオチド配列中、ヌクレオチド番号16~534で示される領域中に存在する一以上のCpG部位を含む領域;
(2)配列番号2のヌクレオチド配列中、ヌクレオチド番号59~345で示される領域中に存在する一以上のCpG部位を含む領域;
(3)配列番号3のヌクレオチド配列中、ヌクレオチド番号41~400で示される領域中に存在する一以上のCpG部位を含む領域;
(4)配列番号4のヌクレオチド配列中、ヌクレオチド番号150~460で示される領域中に存在する一以上のCpG部位を含む領域;
(5)配列番号5のヌクレオチド配列中、ヌクレオチド番号118~590で示される領域中に存在する一以上のCpG部位を含む領域;
(6)配列番号6のヌクレオチド配列中、ヌクレオチド番号115~566で示される領域中に存在する一以上のCpG部位を含む領域;
(7)配列番号7のヌクレオチド配列中、ヌクレオチド番号641~1011で示される領域中に存在する一以上のCpG部位を含む領域;
(8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1116~1595で示される領域中に存在する一以上のCpG部位を含む領域;
(9)配列番号9のヌクレオチド配列中、ヌクレオチド番号40~448で示される領域中に存在する一以上のCpG部位を含む領域;
(10)配列番号10のヌクレオチド配列中、ヌクレオチド番号330~824で示される領域中に存在する一以上のCpG部位を含む領域;
(11)配列番号11のヌクレオチド配列中、ヌクレオチド番号225~535で示される領域中に存在する一以上のCpG部位を含む領域;
(12)配列番号12のヌクレオチド配列中、ヌクレオチド番号164~822で示される領域中に存在する一以上のCpG部位を含む領域;
である、項17に記載の検査薬。
(項19)
 前記(1)~(12)の領域が、
(1)配列番号1のヌクレオチド配列中、ヌクレオチド番号116~434で示される領域に存在する一以上のCpG部位を含む領域;
(2)配列番号2のヌクレオチド配列中、ヌクレオチド番号159~245で示される領域中に存在する一以上のCpG部位を含む領域;
(3)配列番号3のヌクレオチド配列中、ヌクレオチド番号141~300で示される領域中に存在する一以上のCpG部位を含む領域;
(4)配列番号4のヌクレオチド配列中、ヌクレオチド番号251~359で示される領域中に存在する一以上のCpG部位を含む領域;
(5)配列番号5のヌクレオチド配列中、ヌクレオチド番号218~490で示される領域中に存在する一以上のCpG部位を含む領域;
(6)配列番号6のヌクレオチド配列中、ヌクレオチド番号215~484で示される領域中に存在する一以上のCpG部位を含む領域;
(7)配列番号7のヌクレオチド配列中、ヌクレオチド番号741~911で示される領域中に存在する一以上のCpG部位を含む領域;
(8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域中に存在する一以上のCpG部位を含む領域;
(9)配列番号9のヌクレオチド配列中、ヌクレオチド番号140~348で示される領域中に存在する一以上のCpG部位を含む領域;
(10)配列番号10のヌクレオチド配列中、ヌクレオチド番号430~724で示される領域中に存在する一以上のCpG部位を含む領域;
(11)配列番号11のヌクレオチド配列中、ヌクレオチド番号326~435で示される領域中に存在する一以上のCpG部位を含む領域;
(12)配列番号12のヌクレオチド配列域中、ヌクレオチド番号264~722で示される領域中に存在する一以上のCpG部位を含む領域;
である、項17に記載の検査薬。
(項20)
 前記(1)~(12)に示す各領域中の所定のCpG部位のメチル化をそれぞれ検出し得るプライマーセットを含む、項19に記載の検査薬。
(項21)
 以下の(1A)~(12A):
(1A)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号13のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号14のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(2A)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号15のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号16のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(3A)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号17のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号18のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(4A)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号19のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号20のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(5A)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号21のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号22のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(6A)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号23のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号24のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(7A)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号25のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号26のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(8A)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号27のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号28のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(9A)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号29のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号30のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(10A)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号31のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号32のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(11A)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号33のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号34のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
(12A)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域の順鎖をバイサルファイト処理して得られる配列番号35のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号36のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
より選択される一以上の領域中の所定のCpG部位のメチル化を検出し得る、一以上のプライマーセットを含む、項17に記載の検査薬。
(項22)
 前記(1A)~(12A)の領域が、
(1A)配列番号13のヌクレオチド配列中、ヌクレオチド番号16~534で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号14のヌクレオチド配列中、ヌクレオチド番号9~527で示される領域中に存在する一以上のCpG部位を含む領域;
(2A)配列番号15のヌクレオチド配列中、ヌクレオチド番号59~345で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号16のヌクレオチド配列中、ヌクレオチド番号658~944で示される領域中に存在する一以上のCpG部位を含む領域;
(3A)配列番号17のヌクレオチド配列中、ヌクレオチド番号41~400で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号18のヌクレオチド配列中、ヌクレオチド番号558~917で示される領域中に存在する一以上のCpG部位を含む領域;
(4A)配列番号19のヌクレオチド配列中、ヌクレオチド番号150~460で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号20のヌクレオチド配列中、ヌクレオチド番号248~558で示される領域中に存在する一以上のCpG部位を含む領域;
(5A)配列番号21のヌクレオチド配列中、ヌクレオチド番号118~590で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号22のヌクレオチド配列中、ヌクレオチド番号280~752で示される領域中に存在する一以上のCpG部位を含む領域;
(6A)配列番号23のヌクレオチド配列中、ヌクレオチド番号115~566で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号24のヌクレオチド配列中、ヌクレオチド番号1~452で示される領域中に存在する一以上のCpG部位を含む領域;
(7A)配列番号25のヌクレオチド配列中、ヌクレオチド番号641~1011で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号26のヌクレオチド配列中、ヌクレオチド番号14~384で示される領域中に存在する一以上のCpG部位を含む領域;
(8A)配列番号27のヌクレオチド配列中、ヌクレオチド番号1116~1595で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号28のヌクレオチド配列中、ヌクレオチド番号199~678で示される領域中に存在する一以上のCpG部位を含む領域;
(9A)配列番号29のヌクレオチド配列中、ヌクレオチド番号40~448で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号30のヌクレオチド配列中、ヌクレオチド番号193~601で示される領域中に存在する一以上のCpG部位を含む領域;
(10A)配列番号31のヌクレオチド配列中、ヌクレオチド番号330~824で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号32のヌクレオチド配列中、ヌクレオチド番号8~502で示される領域中に存在する一以上のCpG部位を含む領域;
(11A)配列番号33のヌクレオチド配列中、ヌクレオチド番号225~535で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号34のヌクレオチド配列中、ヌクレオチド番号192~502で示される領域中に存在する一以上のCpG部位を含む領域;
(12A)配列番号35のヌクレオチド配列中、ヌクレオチド番号164~822で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号36のヌクレオチド配列中、ヌクレオチド番号100~758で示される領域中に存在する一以上のCpG部位を含む領域;
である、項21に記載の検査薬。
(項23)
 前記(1A)~(12A)の領域が、
(1A)配列番号13のヌクレオチド配列中、ヌクレオチド番号116~434で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号14のヌクレオチド配列中、ヌクレオチド番号109~427で示される領域中に存在する一以上のCpG部位を含む領域;
(2A)配列番号15のヌクレオチド配列中、ヌクレオチド番号159~245で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号16のヌクレオチド配列中、ヌクレオチド番号758~844で示される領域中に存在する一以上のCpG部位を含む領域;
(3A)配列番号17のヌクレオチド配列中、ヌクレオチド番号141~300で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号18のヌクレオチド配列中、ヌクレオチド番号658~817で示される領域中に存在する一以上のCpG部位を含む領域;
(4A)配列番号19のヌクレオチド配列中、ヌクレオチド番号251~359で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号20のヌクレオチド配列中、ヌクレオチド番号349~457で示される領域中に存在する一以上のCpG部位を含む領域;
(5A)配列番号21のヌクレオチド配列中、ヌクレオチド番号218~490で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号22のヌクレオチド配列中、ヌクレオチド番号380~652で示される領域中に存在する一以上のCpG部位を含む領域;
(6A)配列番号23のヌクレオチド配列中、ヌクレオチド番号215~484で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号24のヌクレオチド配列中、ヌクレオチド番号83~352で示される領域中に存在する一以上のCpG部位を含む領域;
(7A)配列番号25のヌクレオチド配列中、ヌクレオチド番号741~911で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号26のヌクレオチド配列中、ヌクレオチド番号114~284で示される領域中に存在する一以上のCpG部位を含む領域;
(8A)配列番号27のヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号28のヌクレオチド配列中、ヌクレオチド番号299~578で示される領域中に存在する一以上のCpG部位を含む領域;
(9A)配列番号29のヌクレオチド配列中、ヌクレオチド番号140~348で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号30のヌクレオチド配列中、ヌクレオチド番号293~501で示される領域中に存在する一以上のCpG部位を含む領域;
(10A)配列番号31のヌクレオチド配列中、ヌクレオチド番号430~724で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号32のヌクレオチド配列中、ヌクレオチド番号108~402で示される領域中に存在する一以上のCpG部位を含む領域;
(11A)配列番号33のヌクレオチド配列中、ヌクレオチド番号326~435で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号34のヌクレオチド配列中、ヌクレオチド番号292~401で示される領域中に存在する一以上のCpG部位を含む領域;
(12A)配列番号35のヌクレオチド配列中、ヌクレオチド番号264~722で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号36のヌクレオチド配列中、ヌクレオチド番号200~658で示される領域中に存在する一以上のCpG部位を含む領域;
である、項21に記載の検査薬。
(項24)
 前記(1A)~(12A)に示す各領域中に存在する所定のCpG部位のメチル化をそれぞれ検出し得るプライマーセットを含む、項21~23のいずれか一項に記載の検査薬。(項25)
 以下の(13)~(16):
(13)CREM遺伝子またはその断片を特異的に検出するためのプライマーセット;
(14)GLYATL3遺伝子またはその断片を特異的に検出するためのプライマーセット;
(15)ELMOD3遺伝子またはその断片を特異的に検出するためのプライマーセット;および
(16)KLF9遺伝子またはその断片を特異的に検出するためのプライマーセット;
より選択される一以上のプライマーセットをさらに含むことを特徴とする、項17~24のいずれか一項に記載の検査薬。
(項26)
 前記(13)~(16)に示すプライマーセットを含むことを特徴とする、項25に記載の検査薬。
(項27)
 前記いずれかのプライマーセットで増幅された、DNA断片を特異的に検出するためのプローブをさらに含むことを特徴とする、項17~26のいずれか一項に記載の検査薬。
(項28)
 項12~16のいずれか一項に記載の遺伝子マーカーを検出するための、項17~27のいずれか一項に記載の検査薬。
 本発明によれば、異なるサブタイプの乳がんを網羅的に検査することができ、従来高感度の検出が困難であったトリプルネガティブ型を含むいずれのサブタイプの乳がんについても、高感度・高特異度での検出が可能となる。また、本発明は低侵襲性の血液検査で実施できるため、マンモグラフィー検査のような被験者の痛みを伴う従来の検査方法の代替技術となり得る。
図1-1及び1-2は、網羅的メチル化アレイによる乳がんもしくは乳がんサブタイプに特異的なメチル化遺伝子マーカーの探索結果を示す図である。図1-1は、48万プローブについて、乳がん細胞における平均メチル化度(縦軸)と非がん細胞における平均メチル化度(横軸)をプロットした結果を示す。 図1-2は、非がん細胞における平均メチル化度5%未満の84117プローブについて、トリプルネガティブ型乳がんにおける平均メチル化度(縦軸)とルミナール型乳がんにおける平均メチル化度(横軸)をプロットした結果を示す。 メチル化遺伝子マーカーの選別方法を示す図である。BC: 乳癌、TN: トリプルネガティブ型、MSP: メチル化特異的PCR。 図3-1~3-4は、デジタルPCRの増幅シグナル値の上限及び下限カットオフ値の決定手法を示す。図3-1は、非増幅(陰性)シグナルドロップレット及び増幅(陽性)シグナルドロップレットのシグナル強度の分布を、MATLABのカーネル平滑化関数推定ksdenstiy関数を使用して描出したものである(横軸はシグナル強度を、縦軸は確率密度(単位:10-3)を示し、×はピークを示す)。陰性シグナルドロップレットのピークの帯域上限をそれぞれの反応系ごとに算出し、全てのドロップレットのシグナル強度の数値をその基準値からのシグナル強度に変換した。 デジタルPCRの増幅シグナル値の上限カットオフ値の決定手法を示す図である。陽性コントロールサンプル(左パネルの実線で囲んだ部分)よりはるかに高い増幅シグナル値を示す不良ドロップレット(左パネルの破線で囲んだ部分)を排除するために、陽性シグナルドロップレットのシグナル強度の分布をMATLABのksdenstiy関数描出し、各マーカーにおける陽性シグナルピークの帯域の上限を上限カットオフ値とした(右パネル;横軸はシグナル強度を、縦軸は確率密度(単位:10-4)を示し、×はピークを示す)。 デジタルPCRの増幅シグナル値の下限カットオフ値の決定手法を示す図である。図3-1のチャートにおいて、非増幅ドロップレットの帯域上限を仮の下限カットオフ値の基準点(0)に定めた。増幅シグナル値が仮の下限カットオフ値と上限カットオフ値との間にあるドロップレットを陽性ドロップレットとし、学習用セットの症例全てで陽性ドロップレット数を数え、そこから血漿1mL中の陽性アレル濃度を計算し、その対数値に関してROC曲線を作成した。この作業を仮の下限カットオフ値を10づつ増加させていき、それぞれについて乳がん-非がん判別のROC曲線下面積(AUC)を計算した。 デジタルPCRの増幅シグナル値の下限カットオフ値の決定手法を示す図である。図3-3で仮の下限カットオフ値を10づつ増加させていった際に、AUCが最大となったときの仮の下限カットオフ値を、下限カットオフ値として採用した。図はcg23495581(左パネル;最大AUC=0.67781)及びKLF9(右パネル;最大AUC=0.87156)の下限カットオフ値を示す。各パネルの左縦軸はアレル濃度の対数値の相加平均を、右縦軸はAUCをそれぞれ示す。 β-actinと新規内部標準遺伝子マーカーとの間の相関を示す図である。 各メチル化遺伝子マーカー及び各内部標準遺伝子のROC曲線を示す図である。各パネルにおいて、縦軸は感度(陽性的中率)を、横軸は偽陽性率(1-特異度)を示し、丸印は、二分法、陽性および陰性のための各マーカーのカットオフ地点を示す。各パネルは、一段目左から順に、JAK3、RASGRF1、CPXM1及びSHF、二段目左から順に、DNM3、CAV2、HOXA10及びB3GNT5、三段目左から順に、ST3GAL6、DACH1、P2RX3及びcg23495581、四段目左から順に、CREM、GLYATL3、ELMOD3及びKLF9の結果を示す。 12メチル化遺伝子マーカーのアレル濃度の対数値の相加平均(左上パネル;AUC=0.76925)、4内部標準遺伝子のアレル濃度の対数値の相加平均(右上パネル;AUC=0.89023)及び陽性メチル化遺伝子マーカー数(下パネル;AUC=0.82148)のROC曲線を示す図である。各パネルにおいて、縦軸は感度(陽性的中率)を、横軸は偽陽性率(1-特異度)を示し、丸印は、二分法、陽性および陰性のための各マーカーのカットオフ地点を示す。 健常者と乳がん患者を区別するための最もよいアルゴリズムのROC曲線(学習セット(167症例):AUC=0.9157;検証セット(111症例):AUC=0.8757)を示す図である。縦軸は感度(陽性的中率)を、横軸は偽陽性率(1-特異度)を示し、丸印は、二分法、陽性および陰性のためのカットオフ地点を示す。 健常者における年齢と検査値の相関を示す図である。 乳がんのステージごとの検査値を示す図である。HV: 健常者 乳がんのサブタイプごとの検査値を示す図である。Lu: ルミナール型、TN: トリプルネガティブ型、HER2: HER2型、LH: ルミナール HER2型 乳がんのステージごとの各サブタイプの検査値を示す図である。LBC: ルミナール型、TNBC: トリプルネガティブ型、HER2 BC: HER2型、LH: ルミナール HER2型
 本明細書において、下記の用語は、特にことわりのない限り、以下に定義されるとおりの意味で用いられる。
 「染色体」とは、遺伝情報の発現と伝達を担う生体物質であり、具体的にはゲノムDNAとタンパク質の巨大な複合体を指す。特にことわりのない限り、本明細書ではヒト染色体と同義で用いられ、22対の常染色体と1対の性染色体の全て、あるいは個々の染色体の全部、または一部を指す。
 「ゲノム」とは、生物学的実体(細胞、組織、臓器、系、生物)の遺伝子情報の全体を指し、DNA、RNA、またはこれらの修飾体、誘導体を含む。特にことわりのない限り、本明細書ではヒトゲノムと同義で用いられる。「ゲノムDNA」は、遺伝子コード配列と非コード配列との両方を含み、本明細書中においては、染色体中でタンパク質と複合化したDNA、化学処理などにより染色体中のタンパク質を除去したDNA、または、その一部を指す。ヒトゲノムには核ゲノムとミトコンドリアゲノムがあるが、好ましくは核ゲノムである。
 「遺伝子」とは、遺伝形質を規定する因子をいう。通常染色体上に一定の順序に配列している。本明細書では、タンパク質の一次構造を規定するエクソンとエクソンを分断するイントロンとからなる構造遺伝子領域のみならず、プロモーター、エンハンサー、サイレンサー等の転写調節領域をも含めたゲノムDNA領域を意味する。
 即ち、各染色体上に遺伝子が散在しており、全ての染色体に含まれるDNAを包括したものが核ゲノムDNAにあたる。
 「アレル」とは、一対の相同染色体の同じ遺伝子座に存在する個々の遺伝子を指す。即ち、各遺伝子座に1コピーずつ遺伝子が存在する場合、ゲノム全体では2つのアレルを有することになる。一方または両方の相同染色体上に複数コピーの遺伝子が存在する場合、それらの各コピーがアレルである。従って、「アレル濃度」とは、単位容量あたりのアレル量を意味する。
(I)本発明のエピジェネティック遺伝子マーカー(メチル化遺伝子マーカー)
 本発明は、乳がんもしくは乳がんの特定のサブタイプで選択的にDNAメチル化が生じる特定の遺伝子領域(Differentially methylated region; DMR)またはその一部からなる、乳がんの診断のための遺伝子マーカー(「本発明のエピジェネティック遺伝子マーカー」、「メチル化遺伝子マーカー」ともいう)を提供する。ここで「DNAメチル化」とは、ヌクレオチド配列中の5’-CG-3’で示されるジヌクレオチド(CpGとも記載する)のシトシンの5位の炭素にメチル基が付加されることをいう。「乳がんもしくは乳がんの特定のサブタイプで選択的にDNAメチル化が生じる」とは、所定の遺伝子領域内に存在するCpG部位のメチル化レベルが、非がん群に対して乳がん群で、もしくはある特定の乳がんサブタイプ群で、それ以外の群(即ち、非がん群及び他の乳がんサブタイプ群)に対して有意に高いことを意味し、非がん群、もしくは非がん群及び他の乳がんサブタイプ群においても、該遺伝子領域内でのDNAメチル化が低レベルで生じることを排除しない。
 本発明のエピジェネティック遺伝子マーカーを指標として診断可能な乳がんは、5種のサブタイプ(ルミナールA型、ルミナールB型、ルミナールHER2型、HER2型およびトリプルネガティブ型)のいずれに分類されるものであってもよい。乳がんの各サブタイプは、エストロゲン受容体(ER)、プロゲステロン受容体(PgR)、HER2とKi-67に対する免疫染色によって判定できる。本明細書においては、ルミナールA型はERおよびPgRが陽性、HER2が陰性で、Ki-67標識率が14%以下の乳がんと定義する。ルミナールB型はERおよびPgRが陽性、HER2が陰性、かつKi-67標識率が14%より高い乳がんと定義する。ルミナールHER2型はERおよびPRの少なくとも一方が陽性、かつHER2が陽性な乳がんと定義する。HER2型はERおよびPRがともに陰性、かつHER2が陽性の乳がんと定義する。トリプルネガティブ型は、ER、PRおよびHER2がいずれも陰性な乳がんと定義する。
 本発明のエピジェネティック遺伝子マーカーの選定は、例えば、DNAメチル化アレイを用いて、以下の選定基準に基づいてプローブを選定することにより行われる。
(1)乳がん標本で高度にメチル化されており、非がん患者でのメチル化率が低い遺伝子領域
 DNAメチル化アレイ解析でのβ値(アレイのスキャンファイルの0から1までの連続変数であるβ値は、0に近いと低メチル化状態であり、1に近いと高メチル化状態であることを表す)。
 非がん標本での平均β値が0.05未満のプローブの中から、以下の条件で、メチル化マーカーの候補を選択する(図1参照)。
 A)乳がん共通マーカー:乳がん、非がん間の比較でβ値の差が大きいプローブ
 B)乳がん共通マーカー:がん標本の平均β値が0.6を超えるプローブの中で、非がん標本の平均β値が低いプローブ
 C)ルミナール型特異的マーカー:ルミナール型乳がん標本とトリプルネガティブ型乳がん標本の平均β値がルミナール型で高く、その差が広いプローブ、
 D)トリプルネガティブ型特異的マーカー: ルミナール型乳がん標本とトリプルネガティブ型乳がん標本の平均β値がトリプルネガティブ型で高く、その差が広いプローブ
(2)PCR増幅効率が高い
 PCR増幅効率が70%以上110%未満であるプローブ
(3)非がん標本で陰性
 5症例の健常者血液DNAでメチル化DNAが1症例までしか検出されないプローブ
(4)乳がん標本で陽性率が高い
 乳がん細胞株28株でDNAメチル化が2株以上検出されるプローブ
(5)乳がん組織標本の腫瘍周囲正常細胞で陰性
 FFPE標本の乳がん組織周囲正常上皮細胞10症例分のDNAプール標本および正常乳管上皮細胞株1株、血管内皮細胞株2株でメチル化が検出されないプローブ
(6)遺伝子発現がエピジェネティックで制御されている
 脱メチル化剤、ヒストン脱アセチル化阻害薬処理で、遺伝子の発現が上昇するプローブ(遺伝子の発現が上昇するプローブが得られなかった場合は、(1)ないし(5)で得られる候補プローブの中から、ddMSPでの増幅が良好なプローブを選択する)
 これらの条件で、メチル化マーカーの候補プローブの絞り込みを行う。
 以上のような選定基準を経て得られたメチル化遺伝子マーカーとしては、以下の12種のDMRまたは一以上のCpG部位を含むその一部が挙げられる。
(A)乳がん特異的メチル化遺伝子マーカー:
(1)JAK3遺伝子内のDMR(配列番号1)
Figure JPOXMLDOC01-appb-C000001
(2)RASGRF1遺伝子内のDMR(配列番号2)
Figure JPOXMLDOC01-appb-C000002
(3)CPXM1遺伝子内のDMR(配列番号3)
Figure JPOXMLDOC01-appb-C000003
(4)SHF遺伝子内のDMR(配列番号4)
Figure JPOXMLDOC01-appb-C000004
(B)ルミナール型乳がん特異的メチル化遺伝子マーカー
(5)DNM3遺伝子内のDMR(配列番号5)
Figure JPOXMLDOC01-appb-C000005
(6)CAV2遺伝子内のDMR(配列番号6)
Figure JPOXMLDOC01-appb-C000006
(7)HOXA10遺伝子内のDMR(配列番号7)
Figure JPOXMLDOC01-appb-C000007
(8)B3GNT5遺伝子内のDMR(配列番号8)
Figure JPOXMLDOC01-appb-C000008
(C)トリプルネガティブ型乳がん特異的メチル化遺伝子マーカー:
(9)ST3GAL6遺伝子内のDMR(配列番号9)
Figure JPOXMLDOC01-appb-C000009
(10)DACH1遺伝子内のDMR(配列番号10)
Figure JPOXMLDOC01-appb-C000010
(11)P2RX3遺伝子内のDMR(配列番号11)
Figure JPOXMLDOC01-appb-C000011
(12)cg23495581(イルミナ社の網羅的DNAメチル化アレイのプローブ)で特定されるヒト第8番染色体上のゲノムDNA領域(配列番号12)
Figure JPOXMLDOC01-appb-C000012
 上記の各DMR配列は、NCBI (National Center for Biotechnology Information) データベースに登録されているヒトゲノムのreference配列hg19の順鎖のゲノムDNA配列を示す。配列中、大文字の「CG」で示した部位がメチル化の標的となるCpG部位である。各ヌクレオチド配列の上の数字は、染色体(chr)番号およびp腕のテロメア側からq腕のテロメアに向かっての塩基数を示す。尚、ゲノムDNA配列には個体差があり種々の変異や遺伝子多型が存在するので、上記の各ヌクレオチド配列は、乳がんもしくは乳がんサブタイプに特異的なDMRの位置を特定するために、代表的なゲノムDNA配列として記載したものであり、天然に存在するそれらのバリアント配列も本発明の範囲に包含されることは言うまでもない。また、DMRは二本鎖DNAの形態であり、本明細書では順鎖のゲノム配列で代表して表現するが、逆鎖配列もメチル化遺伝子マーカーに包含されるものである。
 本発明の第1の乳がん特異的メチル化遺伝子マーカーは、配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内のDMR(JAK3-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号16~534で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号116~434で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第2の乳がん特異的メチル化遺伝子マーカーは、配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内のDMR(RASGRF1-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号59~345で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号159~245で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第3の乳がん特異的メチル化遺伝子マーカーは、配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内のDMR(CPXM1-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号41~400で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号141~300で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第4の乳がん特異的メチル化遺伝子マーカーは、配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内のDMR(SHF-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号150~460で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号251~359で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第1のルミナール型乳がん特異的メチル化遺伝子マーカーは、配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内のDMR(DNM3-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号118~590で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号218~490で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第2のルミナール型乳がん特異的メチル化遺伝子マーカーは、配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内のDMR(CAV2-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号115~566で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号215~484で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第3のルミナール型乳がん特異的メチル化遺伝子マーカーは、配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内のDMR(HOXA10-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号641~1011で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号741~911で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第4のルミナール型乳がん特異的メチル化遺伝子マーカーは、配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内のDMR(B3GNT5-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくはヌクレオチド番号1116~1595で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第1のトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーは、配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内のDMR(ST3GAL6-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくは、ヌクレオチド番号40~448で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号140~348で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第2のトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーは、配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内のDMR(DACH1-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくは、ヌクレオチド番号330~824で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号430~724で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第3のトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーは、配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内のDMR(P2RX3-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくは、ヌクレオチド番号225~535で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号326~435で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位である。
 本発明の第4のトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーは、配列番号12のヌクレオチド配列で代表され、cg23495581で特定されるヒト第8番染色体上のゲノムDNA領域(cg23495581-DMR)中に存在する一以上のCpG部位を含む領域である。該CpG部位は特に制限されないが、好ましくは、ヌクレオチド番号164~822で示される領域(下線部)中に存在する一以上のCpG部位であり、より好ましくは、前記ヌクレオチド配列中、ヌクレオチド番号264~722で示される領域(ボックスで囲まれた領域)。
(II)内部標準遺伝子マーカー
 乳がん、特にトリプルネガティブ型乳がんでは、ゲノム全体的に低メチル化傾向にあるサブタイプがあり、これらの症例はエピジェネティック遺伝子マーカーのみを用いても検出が困難なことが想定される。また、一般的にがん症例では循環DNA量が上昇していることや、がん症例の循環DNAはがん病巣のコピー数異常の影響を受けていることがわかっている。
 そのため、上記エピジェネティック遺伝子マーカーの検出とともに、循環DNA量を反映する指標(即ち、循環DNA量に対する内部標準)となり得る遺伝子マーカー(単に「内部標準遺伝子マーカー」ともいう)を検出することにより循環DNAの量を知ることができれば、より高感度に乳がんを検出することができる。また、単一の遺伝子のみを内部標準遺伝子マーカーとして用いた場合に、仮に当該遺伝子にコピー数異常を生じていた場合は、検査の誤判定を生じる可能性がある。そこで、それぞれ異なる染色体に存在する2以上の遺伝子を内部標準遺伝子マーカーとして用いることで、より信頼性の高い循環DNA量を測定することができる。
 さらに、これらの内部標準遺伝子マーカーは、上記がん症例における循環DNA量の上昇のように、被験者が乳がんに罹患していることに伴って生じる、被験者由来のDNA含有試料(検体)中のDNA量の変動を検出するためだけでなく、検体のサンプリングにおけるヒューマンエラーや、均一な量のDNAを得ることが難しいソース(例えば、組織片など)から検体を調製した場合に生じる検体中のDNA量のばらつきを補正する目的でも使用することができる。
 従って、本発明はまた、それぞれ異なる染色体に存在する2以上のDNA全体の量を反映する因子となり得る遺伝子、即ち、内部標準遺伝子マーカーを提供する。
 本発明の内部標準遺伝子マーカーは、その血中DNA濃度が循環DNA量を反映する(該マーカーを定量することにより循環DNA量を知ることができる)ものであれば特に制限されない。がん症例では遺伝子のコピー数異常の頻度が上昇しているので、コピー数変異を生じている遺伝子領域をマーカーとして使用すると、循環DNAの全体量が正しく反映されない。そのため、内部標準遺伝子マーカーとしては、がん細胞でコピー数変異の頻度が少ない遺伝子が選定される。選定指標としては、例えば、乳がん細胞でコピー数変異(CNV)の頻度が5%未満であることが挙げられる。そのような遺伝子は、TCGAデータベースやcBioPortalに収載されているデータベース等の公共のゲノムデータベースを用いて抽出することができる。
 また、コピー数変異の頻度が少ないという観点から、内部標準遺伝子マーカーとしては、セントロメア近傍に存在する遺伝子を選択することが好ましい。セントロメア近傍とは、それぞれの染色体におけるセントロメア最内側遺伝子から2000万塩基分以内の距離にある遺伝子が好ましく、1000万塩基分以内の距離にある遺伝子がより好ましいが、これに限定されない。
 好ましい実施態様において、本発明の内部標準遺伝子マーカーとして、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子が挙げられる。表1にこれらの遺伝子の存在位置と最内側遺伝子との距離、染色体の腕の内側からの相対位置(%)等をまとめた。
Figure JPOXMLDOC01-appb-T000013
 上記の4遺伝子はいずれも互いに異なる染色体上に存在するので、これらの任意の2つ以上の遺伝子を内部標準遺伝子マーカーとして用いることができる。より好ましくは、上記4遺伝子すべてを内部標準遺伝子マーカーとして用いることができる。各遺伝子のどの領域をマーカー(検出標的)とするかは特に制限されず、適宜選択することができる。例えば、上記のメチル化遺伝子マーカーと組み合わせて、メチル化特異的PCRで内部標準遺伝子マーカーの検出・定量を行う場合、CpG配列がない領域を検出標的として設定し、当該領域を増幅・検出可能なプライマー・プローブセットを設計することができる。
(III)乳がん診断のための検査方法
 本発明はまた、被験者から採取したDNA含有試料中の、上記本発明の12種のメチル化遺伝子マーカーより選択される一以上の遺伝子マーカーにおけるDNAメチル化を指標とする、乳がんの診断のための検査方法(以下、本発明の検査方法ともいう)を提供する。
 本発明の検査方法を適用できる被験者は、特に制限されないが、例えば、乳がんに罹患しているか否か不明であるか、罹患していることが疑われるヒトが挙げられる。
 本発明の検査方法に用いられるDNA含有試料としては、被験者から採取した、DNAを含有する試料であれば特に制限はなく、例えば、血液、血清または血漿などの循環DNA含有試料が挙げられる。血液または血清には白血球由来の断片化したゲノムDNAが混入している可能性があるため、血漿を利用することが好ましい。循環DNAは、血液、血清および血漿から公知の手段で単離することができ、例えば、QIAmp Circulating Nucleic Acid Kitなどの市販品を用いて単離することができる。
 循環DNAとは、細胞から血中に遊離したDNAをいい、がん患者においては、腫瘍細胞から遊離される循環腫瘍DNA(ctDNA)を多く含む。循環DNAの濃度はがん患者で上昇していることが知られ、がん細胞のアポトーシスや壊死、またはがん細胞からの分泌によって血中に流出すると考えられており、原発巣のコピー数多型や遺伝子変異、メチル化を反映していることが報告されている。従って、循環DNAに含まれる遺伝子は、乳がんの特徴を反映するため、乳がんの検査に適している。
 しかしながら、本発明の検査方法に用いられるDNA含有試料は循環DNA含有試料に限定されず、例えば、穿刺吸引細胞診と同様にして採取され得る乳腺細胞や、針生検と同様にして乳房から採取され得る組織片、乳頭からの分泌物、腫瘍細胞が遊離した血液や他の体液(尿、乳など)等も、DNA含有試料として用いることができる。これらの試料中に含まれるDNAも、公知の手段で単離することができる。
 本発明の検査方法は、以下の(1)~(12):
(1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域(JAK3-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域(RASGRF1-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域(CPXM1-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域(SHF-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域(DNM3-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域(CAV2-DMR)中に存在する所定の一以上のCpG部位がのメチル化の状態;
(7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域(HOXA10-DMR)中に存在する所定の一以上のCpG部位がのメチル化の状態;
(8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域(B3GNT5-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域(ST3GAL6-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域(DACH1-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域(P2RX3-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
(12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域(cg23495581-DMR)中に存在する所定の一以上のCpG部位のメチル化の状態;
より選択される一以上ののメチル化の状態を測定する工程(工程A)を含む。
 上記した各配列番号で表わされるDMRのヌクレオチド配列中に存在するCpG部位は、大文字の「CG」で表記している。好ましい一実施態様においては、各配列番号で表わされるヌクレオチド配列において、下線を付した領域中に存在する所定の一以上のCpG部位のメチル化を検出することができる。また別の好ましい実施態様においては、当該ヌクレオチド配列中、ボックスで囲んだ領域中に存在する所定の一以上のCpG部位のメチル化を検出することができる。
 ここでDNAメチル化の検出標的となるCpG部位は、上記配列番号1~12の各ヌクレオチド配列中に存在するCpG部位から、任意で一以上を適宜選択することができる。例えば、DNAメチル化の検出を、バイサルファイト(bisulfite)処理を用いたメチル化特異的PCR(MSP)法にて行う場合、使用するプライマーセットの少なくとも一方が、一以上のCpG部位にアニーリングするように設計される。好ましくは、プライマーセットの両方が、一以上のCpG部位(より好ましくは2~4個のCpG部位)にアニーリングするように設計される。従って、好ましい一実施態様においては、上記配列番号1~12の各ヌクレオチド配列中に、適当な間隔(例えば、15~300ヌクレオチド、好ましくは20~200ヌクレオチド、より好ましくは30~100ヌクレオチド)をおいて存在する、2つの、近接する2~4個のCpG部位(計4~8個)が、DNAメチル化の検出標的となり得る。
 好ましくは、上記12種のメチル化遺伝子マーカーのうち、(1)~(4)の乳がん特異的メチル化遺伝子マーカーから選ばれる一以上のマーカー、(5)~(8)のルミナール型乳がん特異的メチル化遺伝子マーカーから選ばれる一以上のマーカー、並びに(9)~(12)のトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーから選ばれる一以上のマーカーにおけるDNAメチル化を検出することができる。例えば、乳がん特異的(乳がん共通)メチル化遺伝子マーカーとルミナール型乳がん特異的メチル化遺伝子マーカーがDNAメチル化陽性であり、トリプルネガティブ型乳がん特異的メチル化遺伝子マーカーがDNAメチル化陰性であれば、被験者はルミナール型乳がんに罹患している蓋然性があると判定することができる。一方、乳がん特異的メチル化遺伝子マーカーとトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーがDNAメチル化陽性であり、ルミナール型乳がん特異的メチル化遺伝子マーカーがDNAメチル化陰性であれば、被験者はトリプルネガティブ型乳がんに罹患している蓋然性があると判定することができる。あるいは、乳がん特異的メチル化遺伝子マーカーのみDNAメチル化陽性であり、ルミナール型乳がん特異的メチル化遺伝子マーカーとトリプルネガティブ型乳がん特異的メチル化遺伝子マーカーとがDNAメチル化陰性であれば、被験者はルミナール型およびトリプルネガティブ型以外のサブタイプの乳がん(例えば、HER2型)に罹患している蓋然性があると判定することができる。
 より好ましくは、上記(1)~(12)のすべてのメチル化遺伝子マーカーにおけるDNAメチル化を検出することができる。
 DNAメチル化の検出は、任意の自体公知の方法、例えば、バイサルファイト(bisulfite)処理を用いたメチル化特異的PCR(MSP)法、MethykLight法、COBRA法、バイサルファイトシークエンシング法、パイロシークエンス法およびMassARRAY法、メチル化感受性制限酵素を利用した方法、メチル化DNAを認識するタンパク質を用いたMeDIP法およびMIRA法などによって行うことができる。好ましくは、バイサルファイト処理を用いた方法、より好ましくはMSP法が挙げられる。以下に代表的な検出法について概説するが、これらの方法に限定されるわけではない。
 「メチル化感受性制限酵素処理」とは、CpG methylase(5mCG)によって認識配列のシトシンがメチル化の影響を受けるとDNA切断を切断できなくなる特性を有する制限酵素による循環DNAを処理する方法である。従って、DNAのシトシンがメチル化されていれば切断されず、メチル化されていなければ切断されるため、メチル化DNAと非メチル化DNAを区別することができる。メチル化感受性制限酵素の認識配列を挟むようにプライマーセットを設計し、定量的PCRによってメチル化されたDNA濃度を測定することができる。
 「MeDIP法」とは、抗メチル化シトシン抗体もしくは抗メチル化シチジン抗体、またはメチル化DNA結合タンパク質を特異的に認識する抗体を用いる免疫沈降により、循環DNAに含まれるメチル化DNAを濃縮する方法である。この濃縮したメチル化DNAをPCRにより増幅した後に、マイクロアレイを用いてメチル化されたDNA濃度を測定することができる(MeDIP-chip法)。
 「バイサルファイト処理法」とは、亜硫酸水素のナトリウム塩、カリウム塩、カルシウム塩、マグネシウム塩などの亜硫酸水素塩(バイサルファイト(bisulfite))を溶媒に溶解した溶液を、DNAの溶液に添加して、該DNAに含まれる非メチル化シトシン(C)を脱アミノ化反応によりウラシル(U)に変換する処理する方法である。一方、バイサルファイトはメチル化シトシンには作用せず、上記のような塩基の変換は起こらない。したがって、DNAのシトシンのメチル化の有無は、バイサルファイト処理によって塩基配列の違い(CおよびU)に変換される。メチル化DNAと非メチル化DNAで異なる塩基配列の部位について、特異的なプライマーセットを用いて定量的PCRを行い、メチル化されたDNA濃度を測定することができる(メチル化特異的PCR(methylation specific PCR (MSP)) )。また、上記の方法以外に、バイサルファイト処理法を利用したメチル化されたDNA濃度の測定方法としては、COBRA(Combined Bisulfite Restriction Analysis)法、メチル化感受性単一ヌクレオチドプライマー伸長(Methylation-sensitive Single-Nucleotide Primer Extention)法、定量的MSP法、パイロシークエンス法などを用いることもできる。
 なお、バイサルファイト処理法によってメチル化されたDNA濃度を測定する場合は、測定前に循環DNAを亜硫酸水素塩で処理する工程を含む。
 後述の実施例に示されるようなデジタルPCRを用いる場合には、メチル化遺伝子マーカーのDNAメチル化は、該マーカー内に存在する所定の一以上のCpG部位がメチル化されたアレルの濃度として定量化することができる。
 本発明の検査方法で使用される定量的PCRとしては、例えば、TaqMan PCRが挙げられる。TaqMan PCR法は、蛍光標識したアレル特異的オリゴヌクレオチド(TaqManプローブ)とTaq DNAポリメラーゼによるPCRを利用した方法である。TaqManプローブとしては、PCRにより増幅されるメチル化遺伝子マーカー内の領域中に含まれる約8~約15塩基の連続した塩基配列からなるオリゴヌクレオチドが用いられる。該プローブは、その5’末端がFAM、Alexa532、Cy3、Cy5などの蛍光色素で、3’末端がTAMRA、BHQ1、BHQ2、IBRQなどのクエンチャー(消光物質)でそれぞれ標識されており、そのままの状態ではクエンチャーが蛍光エネルギーを吸収するため蛍光は検出されない。また、TaqManプローブからのPCR伸長反応が起こらないように3’末端はリン酸化されている。TaqManプローブとハイブリダイズする領域を含むゲノムDNAの部分配列を増幅するように設計されたプライマーおよびTaq DNAポリメラーゼとともにPCRを行うと、TaqManプローブが鋳型DNAとハイブリダイズし、同時にPCRプライマーからの伸長反応が起こるが、伸長反応が進むとTaq DNAポリメラーゼの5’ヌクレア-ゼ活性によりハイブリダイズしたTaqManプローブが切断され、蛍光色素が遊離してクエンチャーの影響を受けなくなり、蛍光が検出される。鋳型の増幅により蛍光強度は指数関数的に増大する。
 また、定量的PCRを実施するためのシステムや機器としては、公知のシステム、機器を使用することができるが、定量性の観点から、デジタルPCR機器(QX100、BioRad社)を用いた、デジタルドロップレットPCRシステムを用いることが好ましい。デジタルドロップレットPCRシステムを用いる場合は、同一試料内で同時に異なる2つのメチル化された遺伝子を検出することができるため、同一試料内で同時に使用される2つのTaqManプローブは、互いに蛍光波長の異なる蛍光色素(例えば、一方の遺伝子を検出するためのプローブをFAM、他方をAlexa532)で標識することが好ましい。
 定量的PCRを行う場合、プライマーセットは、上記各メチル化遺伝子マーカー中の検出しようとするDNAメチル化部位に応じて当業者が適宜設計し得る。プライマー長は特に制限されず、約15塩基以上、好ましくは約18~50塩基、より好ましくは20~40塩基程度である。
 より具体的には、上記各メチル化遺伝子マーカーにおけるDNAメチル化を検出するためのプライマーセットは、以下の(1)~(12):
(1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内のDMR(JAK3-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号16~534で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号116~434で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内のDMR(RASGRF1-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号59~345で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号159~245で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内のDMR(CPXM1-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号41~400で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号141~300で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内のDMR(SHF-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号150~460で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号251~359で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内のDMR(DNM3-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号118~590で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号218~490で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内のDMR(CAV2-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号115~566で示される領域(下線部)を含む領域、ヌクレオチド番号215~484で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内のDMR(HOXA10-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号641~1011で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号741~911で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内のDMR(B3GNT5-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号1116~1595で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号1216~1495で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内のDMR(ST3GAL6-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号40~448で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号140~348で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内のDMR(DACH1-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号330~824で示される領域(下線部)を含む領域、より好ましくは、ヌクレオチド番号430~724で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内のDMR(P2RX3-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号225~535で示される領域(下線部)を含む領域、より好ましくは、ヌクレオチド番号326~435で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域(cg23495581-DMR)中に存在する一以上のCpG部位を含む領域、好ましくは、ヌクレオチド番号164~822で示される領域(下線部)を含む領域、より好ましくは、ヌクレオチド番号264~722で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
より選択される一以上の領域中の所定のCpG部位のメチル化を検出し得るプライマーセットである。
 好ましい実施態様において、上記各メチル化遺伝子マーカーにおけるDNAメチル化を検出するためのプライマーセットは、以下の(1A)~(12A):
(1A)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内のDMR(JAK3-DMR)の順鎖をバイサルファイト処理して得られる配列番号13のヌクレオチド配列(配列番号1のヌクレオチド配列中に存在するすべてのCpG部位がメチル化されている場合のバイサルファイト処理配列を示す。以下の配列番号14~36についても同様)中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号16~534で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号116~434で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号13)
Figure JPOXMLDOC01-appb-C000014
 またはJAK3-DMRの逆鎖をバイサルファイト処理して得られる配列番号14のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号9~527で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号109~427で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号14)
Figure JPOXMLDOC01-appb-C000015
(2A)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内のDMR(RASGRF1-DMR)の順鎖をバイサルファイト処理して得られる配列番号15のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号59~345で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号159~245で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号15)
Figure JPOXMLDOC01-appb-C000016
 またはRASGRF1-DMRの逆鎖をバイサルファイト処理して得られる配列番号16のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号658~944で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号758~844で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号16)
Figure JPOXMLDOC01-appb-C000017
(3A)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内のDMR(CPXM1-DMR)の順鎖をバイサルファイト処理して得られる配列番号17のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号41~400で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号141~300で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号17)
Figure JPOXMLDOC01-appb-C000018
 またはCPXM1-DMRの逆鎖をバイサルファイト処理して得られる配列番号18のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号558~917で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号658~817で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号18)
Figure JPOXMLDOC01-appb-C000019
(4A)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内のDMR(SHF-DMR)の順鎖をバイサルファイト処理して得られる配列番号19のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号150~460で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号251~359で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号19)
Figure JPOXMLDOC01-appb-C000020
 またはSHF-DMRの逆鎖をバイサルファイト処理して得られる配列番号20のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号248~558で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号349~457で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号20)
Figure JPOXMLDOC01-appb-C000021
(5A)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内のDMR(DNM3-DMR)の順鎖をバイサルファイト処理して得られる配列番号21のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号118~590で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号218~490で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号21)
Figure JPOXMLDOC01-appb-C000022
 またはDNM3-DMRの逆鎖をバイサルファイト処理して得られる配列番号22のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号280~752で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号380~652で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号22)
Figure JPOXMLDOC01-appb-C000023
(6A)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内のDMR(CAV2-DMR)の順鎖をバイサルファイト処理して得られる配列番号23のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号115~566で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号215~484で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号23)
 またはCAV2-DMRの逆鎖をバイサルファイト処理して得られる配列番号24のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号1~452で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号83~352で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号24)
Figure JPOXMLDOC01-appb-C000025
(7A)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内のDMR(HOXA10-DMR)の順鎖をバイサルファイト処理して得られる配列番号25のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号641~1011で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号741~911で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号25)
Figure JPOXMLDOC01-appb-C000026
 またはHOXA10-DMRの逆鎖をバイサルファイト処理して得られる配列番号26のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号14~384で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号114~284で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号26)
Figure JPOXMLDOC01-appb-C000027
(8A)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内のDMR(B3GNT5-DMR)の順鎖をバイサルファイト処理して得られる配列番号27のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号1116~1595で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号1216~1495で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号27)
Figure JPOXMLDOC01-appb-C000028
 またはB3GNT5-DMRの逆鎖をバイサルファイト処理して得られる配列番号28のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号199~678で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号299~578で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号28)
Figure JPOXMLDOC01-appb-C000029
(9A)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内のDMR(ST3GAL6-DMR)の順鎖をバイサルファイト処理して得られる配列番号29のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号40~448で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号140~348で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号29)
Figure JPOXMLDOC01-appb-C000030
 またはST3GAL6-DMRの逆鎖をバイサルファイト処理して得られる配列番号30のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号193~601で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号293~501で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号30)
Figure JPOXMLDOC01-appb-C000031
(10A)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内のDMR(DACH1-DMR)の順鎖をバイサルファイト処理して得られる配列番号31のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号330~824で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号430~724で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号31)
Figure JPOXMLDOC01-appb-C000032
 またはDACH1-DMRの逆鎖をバイサルファイト処理して得られる配列番号32のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号8~502で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号108~402で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を領域;
(配列番号32)
Figure JPOXMLDOC01-appb-C000033
(11A)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内のDMR(P2RX3-DMR)の順鎖をバイサルファイト処理して得られる配列番号33のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号225~535で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号326~435で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域、
(配列番号33)
Figure JPOXMLDOC01-appb-C000034
 またはP2RX3-DMRの逆鎖をバイサルファイト処理して得られる配列番号34のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号192~502で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号292~401で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号34)
Figure JPOXMLDOC01-appb-C000035
(12A)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域(cg23495581-DMR)の順鎖をバイサルファイト処理して得られる配列番号35のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号164~822で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号264~722で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号35)
Figure JPOXMLDOC01-appb-C000036
 またはcg23495581-DMRの逆鎖をバイサルファイト処理して得られる配列番号36のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、好ましくは、前記ヌクレオチド配列中ヌクレオチド番号100~758で示される領域(下線部)中に存在する一以上のCpG部位を含む領域、より好ましくは、ヌクレオチド番号200~658で示される領域(ボックスで囲まれた領域)中に存在する一以上のCpG部位を含む領域;
(配列番号36)
Figure JPOXMLDOC01-appb-C000037
より選択される一以上の領域中の所定のCpG部位のメチル化を検出し得るプライマーセットである。
 上記の本発明の内部標準遺伝子マーカーを検出して、検体中のDNA量を評価することにより、本発明の検査方法の確度をさらに向上させることができる。
 従って、好ましい実施態様において、本発明の検査方法は、上記工程Aに加え、それぞれ別個の染色体に存在する2以上の本発明の内部標準遺伝子マーカーのDNA量をさらに測定する工程(工程B)を含む。
 内部標準遺伝子マーカーの検出・定量は、自体公知の方法により行うことができるが、例えば、上記のメチル化遺伝子マーカーと組み合わせて、メチル化特異的PCRで内部標準遺伝子マーカーの検出・定量を行う場合、CpG配列がない領域を検出標的として設定し、当該領域を増幅・検出可能なプライマー・プローブセットを設計することができる。後述の実施例に示されるようなデジタルPCRを用いる場合には、内部標準遺伝子マーカーのDNA量は、該遺伝子のアレルの濃度として定量化することができる。
(IV)診断アルゴリズム
 前記工程Aで得られた、各DMR内に存在する一以上のCpG部位のメチル化の状態と、内部標準遺伝子マーカーの検出工程Bをさらに含む場合は、当該工程で得られた該内部標準遺伝子マーカーのDNA量とに基づいて、被験者が乳がんに罹患している蓋然性が高いか否かを判定することができる。
 例えば、健常者及び被験者から採取したDNA含有試料もしくは該試料から単離したDNA中の、メチル化遺伝子マーカーのメチル化の状態(および内部標準遺伝子マーカーのDNA量)をそれぞれ測定し、被験者と健常者との間で各測定値を比較することができる。あるいは、メチル化遺伝子マーカーのメチル化の状態(および内部標準遺伝子マーカーのDNA量)と、乳がんの罹患の有無との間の相関図を予め作成しておき(例えば、カットオフ値の設定)、被験者におけるメチル化遺伝子マーカーのメチル化の状態(および内部標準遺伝子マーカーのDNA量)の測定値をその相関図と比較することもできる。この際、メチル化遺伝子マーカーのメチル化の状態を反映する実測値(検出シグナル)が異常値を示す場合、乳がんの罹患の有無の評価から排除する必要があるので、予め評価に用いるか否かの検出シグナルの上限値(陽性カットオフ値)と下限値(シグナルカットオフ値)を決定しておくことが望ましい。決定手法としては、例えば、後述の実施例に記載される方法が挙げられる。
 比較の結果、被験者において、メチル化遺伝子マーカーのメチル化の状態(および内部標準遺伝子マーカーのDNA量)が、健常者におけるそれら(あるいは予め設定されたカットオフ値)に比べて高値であった場合、該被験者は乳がんに罹患している蓋然性が高いと判断することができる。
 あるいは、乳がん患者と健常者からなる集団(学習セット)を用いて、DNA含有試料中のメチル化遺伝子マーカーのメチル化の状態(および内部標準遺伝子マーカーのDNA量)を測定し、乳がんの罹患の有無を判定するための検査値の計算式およびカットオフ値を決定することができる。
 例えば、メチル化遺伝子マーカーのメチル化の状態をメチル化された該遺伝子マーカーのアレル濃度として測定し、内部標準遺伝子マーカーのDNA量を該遺伝子のアレル濃度として測定する場合、各遺伝子マーカーのアレル濃度を対数(log10)化し、各メチル化遺伝子マーカーのアレル濃度の対数値、該対数値の相加平均、内部標準遺伝子マーカーのアレル濃度の対数値の相加平均、さらにはDNAメチル化陽性のメチル化遺伝子マーカー数などの因子データを取得し、線形判別分析(Linear discriminant analysis, LDA)とSVM(Support Vector Machine)の2種のアルゴリズムと一個抜き交差検証法(Leave one out crossvalidation, LOOCV)を用いて、最適な検査値の計算式を探索することができる。得られた計算式に基づいて、学習セットのROC曲線を作成し、最適なカットオフ値を決定することができる。
 一実施態様において、
(i)前記工程Aにより得られた、DNAメチル化が生じた各メチル化遺伝子マーカーのアレル濃度の対数から選ばれる一以上の対数、
(ii)上記(i)の各対数値の相加平均、および
(iii)前記工程Bにより得られた、各内部標準遺伝子マーカーのアレル濃度の対数値の相加平均のそれぞれに、所定の係数を乗じた計算式を用いて、高確度な乳がんの判定のための検査値を算出することができる。
 好ましい一実施態様において、下記の検査値の計算式が与えられた。
 検査値= 0.62449×[RASGRF1] + 0.78110×[CPXM1] +0.12115×[HOXA10] + 0.36760×[DACH1] + 0.65288×[Mean12] + 2.44704×[IC] - 6.98073
[ここで、[RASGRF1]、[CPXM1]、[HOXA10]、および[DACH1]は、DNAメチル化が生じた各メチル化遺伝子マーカーのアレル濃度の対数値を表し、[Mean12]は、DNAメチル化が生じた上記12種のメチル化遺伝子マーカーの各アレル濃度の対数値の相加平均を表し、[IC]は上記4種の内部標準遺伝子マーカー(CREM、GLYATL3、ELMOD3およびKLF9遺伝子)のアレル濃度の対数値の相加平均を表す。]
 また、上記計算式を学習セットに当てはめて得られた検査値に基づいてROC曲線を作成した結果、最適なカットオフ値=-0.07923を得た。
(V)乳がん検査用試薬
 本発明はまた、上記本発明の検査方法を実施するためのプライマーセット、好ましくは、該プライマーセットによって増幅された断片を検出するためのプローブをさらに含む、乳がんの診断のための検査薬(本発明の検査薬ともいう)を提供する。
 本発明の検査薬は、「(III)乳がん診断のための検査方法」における前記(1)~(12)、あるいは前記(1A)~(12A)より選択される一以上の乳がんもしくは乳がんサブタイプに特異的なDMRの領域中に存在する所定のCpG部位のメチル化を検出し得る、一以上のプライマーセットを含むことを特徴とする。
 本発明の検査薬は、上記内部標準遺伝子マーカーを検出するためにプライマーセット、即ち、以下の(13)~(16):
(13)CREM遺伝子またはその断片を特異的に検出するためのプライマーセット;
(14)GLYATL3遺伝子またはその断片を特異的に検出するためのプライマーセット;
(15)ELMOD3遺伝子またはその断片を特異的に検出するためのプライマーセット;および
(16)KLF9遺伝子またはその断片を特異的に検出するためのプライマーセット;
より選択される一以上のプライマーセットをさらに含むことを特徴とする。
 本発明の検査薬は、上記プライマーセットを用いて増幅される、本発明のメチル化遺伝子マーカーおよび本発明の内部標準遺伝子マーカーの断片を、高感度で、好ましくは定量的に検出することができる、該増幅断片内のヌクレオチド配列に相補的なヌクレオチド配列を有し、検出を容易かつ鋭敏にするための標識物質で標識された核酸プローブを、さらに含むことが好ましい。例えば、「(III)乳がん診断のための検査方法」において上記したTaqmanプローブなどを用いることができる。例えば、具体的な例として、DNAメチル化が生じた本発明のメチル化遺伝子マーカーの検出に用いることができるプライマー・プローブセット、並びに、本発明の内部標準遺伝子マーカーの検出に用いることができるプライマー・プローブセットを表2に示す。
Figure JPOXMLDOC01-appb-T000038
 本発明の検査薬に用いられるプライマー・プローブセットは、公知の塩基配列情報に基づいて、該塩基配列および/またはその相補鎖配列の一部もしくは全部を市販のDNA/RNA自動合成機等を用いて化学的に合成することによって得ることができる。該プライマー・プローブセットを含む試薬は、乾燥した状態もしくはアルコール沈澱の状態で、固体として提供することもできるし、水もしくは適当な緩衝液(例:TE緩衝液等)中に溶解した状態で提供することもできる。
 本発明の検査薬は、上記のプライマー・プローブセットに加えて、DNAメチル化が生じた本発明のメチル化遺伝子マーカーや本発明の内部標準遺伝子マーカーの検出のための反応において必要な他の物質であって、共存状態で保存することにより反応に悪影響を及ぼさない物質をさらに含有することができる。あるいは、本発明の検査薬は、当該他の物質を、上記のプライマー・プローブセットを含む試薬とは別個の試薬として含む、試薬キットとして提供されてもよい。当該他の物質としては、例えば、反応緩衝液、dNTPs、耐熱性DNAポリメラーゼ等が挙げられる。
 以下に、実施例を示して本発明をさらに具体的に説明するが、本発明はこれらにより限定されるものではないことは明らかである。
 なお、本実施例は京都大学大学院医学研究科・医学部及び医学部附属病院 医の倫理委員会に承認を受けた。全ての標本は京都大学医学部乳腺外科で管理運営されているバイオバンクから払い出しを受けた。このバイオバンクのプロトコールはその全ての参加施設の倫理委員会で承認を受けており、書面によるインフォームドコンセントを全ての標本提供者から得た。
細胞培養
 本実施例で使用した細胞株を表3にまとめた。JIMT-1, HMC1-8とMRK-nu-1以外の乳がん細胞株は全て米国ATCC(American Type Culture Collection)から入手した。JIMT-1は独国DSMZ(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)から、HMC1-8とMRK-nu-1はJCRB細胞バンク(大阪、日本)から入手した。HUVEC, HMECとHMMECはScienCell Research Laboratories(米国カルフォルニア州)から入手した。全ての細胞は、入手先が推奨する培地を使用し、70‐80%の密度で継代し管理した。
Figure JPOXMLDOC01-appb-T000039
ホルマリン固定パラフィン包埋(FFPE)標本の収集
 浸潤性乳管がんのFFPE標本もバイオバンクを通じて入手した。各症例のサブタイプは、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、HER2およびKi-67に対する免疫染色によって判定した。ERとPRの陰性陽性のカットオフ値は1%とした。また、HER2の陰性陽性については、3+の場合、または2+かつFISH/DISH法でHER2/CEP17比が2.2より上昇している場合に陽性とした。FFPE標本がER陽性、PR陽性、HER2陰性、Ki-67が14%以下である場合、FFPE標本のサブタイプはルミナールA型であると定義し、ER陽性、PR陽性、HER2陰性、Ki-67が14%より高い場合、FFPE標本の症例のサブタイプはルミナールB型であると定義した。また、FFPE標本のER、PRの少なくとも一方が陽性、かつHER2陽性である場合、FFPE標本の症例のサブタイプはルミナールHER2型であると定義し、ER、PRがともに陰性、かつHER2陽性の場合、FFPE標本の症例のサブタイプはHER2型であると定義し、ER、PR、HER2がいずれも陰性の場合、FFPE標本の症例のサブタイプはトリプルネガティブ型であると定義した。
FFPE標本のマイクロダイセクションとDNA抽出
 より正確にがん細胞部分のみを切り出すために、がん細胞を含む上皮細胞のサイトケラチンを染色した。FFPE標本を10μmの厚さに薄切し、ライカ社の2または4μmのフォイル付きスライドに付着させ、抗サイトケラチン抗体カクテルAE1/AE3を用い、アビジン‐ビオチン複合体法にて免疫染色した。Histo/Zyme(Diagnostic BioSystems社)にて抗原賦活を行い、正常ヤギ血清と正常ウシ血清を混合したもので、非特異的染色をブロックした。一次抗体としてマウス抗ヒトサイトケラチン抗体カクテルAE1/AE3(Dako社)、二次抗体としてウマ由来抗マウスIgGビオチン化抗体を使用し、Vector社VECTOR Red Alkaline Phosphatase Substrate Kitを用いて、製造元のプロトコールに沿って染色を行った。その後、がん細胞集団をライカ社LMD7000マイクロダイセクション機器にて切り出した。また、10症例分のがん細胞近接正常上皮集団を切り出し、まとめて、正常上皮細胞の1標本とした。また、乳管内乳頭腫症例1例について、その良性腫瘍部分をマイクロダイセクションにて切り出し、1標本とした。FFPE標本のDNAの抽出には、NucleoSpin FFPE DNAキット(Macherey Nagel社)を用いた。DNA収量を上げるために、製造元プロトコールの標本の酵素処理のステップを次のように変更した。酵素処理溶液に10μLのプロテアーゼK液を加えた後、標本を37℃3時間反応させ、更に10μLのプロテアーゼK溶液を追加し3時間反応させた。その他のステップは製造元プロトコールに沿ってDNAを抽出した。DNA量はInfinium HD FFPE DNA sample QC Kit(イルミナ社)を用いて定量した。
血液標本の処理
 EDTA採血管に採血し、10分間、毎分3000回転の速さで遠心した。その遠心血液標本の上清を血漿標本として500μLずつ分注し、使用するときまで-80℃で保存した。残りの血液標本からキアーゲン社QIAmp DNA Blood Maxi Kitを用いて血球由来ゲノムDNAを抽出し、NanoDrop(ThermoScientific社)で定量した。
 血漿内循環DNAは、キアーゲン社QIAmp Circulating Nucleic Acid Kitを用いて抽出した。1mLの凍結血漿標本を室温で融解させ、4℃、16000gで10分間遠心分離し900μLの血漿を回収した。プロテアーゼK溶液100μL、Buffer ACL 800μL、PBS100μLと900μLの血漿を混合後、48℃で18時間振盪し、プロテアーゼK溶液100μLを追加し、30秒間のボルテックス後、更に6時間追加振盪し、タンパク分解反応を行った。その後、製造元プロトコールに従ってDNAを精製し、23μLのBuffer AVEでDNAを溶出し、約20μLのDNA溶液を得た。
イルミナ社Infinium Human Methylation 450Kチップによる網羅的DNAメチル化アレイ解析
 細胞株DNAと血球由来DNA標本に対しては、Infinium HD Assay Methylationプロトコールに沿った処理を行った。また、FFPE標本由来DNAに対しては、Infinium HD FFPE Restoreプロトコールに沿った処理を行った後、Infinium HD FFPE Methylation Assayプロトコールに沿った処理を行った。その際のbisulfite処理は、Zymo Research社製EZ DNA MethylationTMを用いて、製造元プロトコールに従って、細胞株DNAと血球由来DNAを処理する場合、DNA1μg、FFPE標本由来DNAの場合、DNA300ngに対して行った。
 アレイのスキャンファイルの0から1までの連続変数であるβ値は、0に近いと低メチル化状態であり、1に近いと高メチル化状態であることを表している。Infinium Human Methylation 450Kチップには2種類の異なるプローブが搭載されており、それらのβ値の分布パターンは若干異なった。これらのプローブ間のβ値分布を補正するために、MATLAB用の関数NIMBLを用いた。
 がん標本と非がん標本間(図1-1)とルミナール型乳がんとトリプルネガティブ型乳がん間(図1-2)のメチル化状態を比較するために、β値の平均を計算した。FFPE標本ではルミナール型乳がんが多く、細胞株ではトリプルネガティブ型乳がんの比率が高かった。FFPE標本と細胞株は標本タイプが異なり、その差が上記の結果に影響を与える可能性を排除するため、比較のそれぞれのグループでFFPE標本と細胞株での2つの平均の平均を比べた。
 本解析では、非がん標本での平均β値が0.05未満のプローブの中から、発明者らは以下の条件で、メチル化マーカーの候補プローブを選択した。A)がん共通マーカー:がん、非がん間の比較でβ値の差が大きいプローブから20プローブ、B)がん共通マーカー:がん標本の平均β値が0.6を超えるプローブの中で、非がん標本の平均β値が低いプローブから20プローブ、C)ルミナール型特異的マーカー:ルミナール型乳がん標本とトリプルネガティブ型乳がん標本の平均β値がルミナール型で高く、その差が広いプローブから50プローブ、D)トリプルネガティブ型特異的マーカー: ルミナール型乳がん標本とトリプルネガティブ型乳がん標本の平均β値がトリプルネガティブ型で高く、その差が広いプローブから50プローブ。
リアルタイム定量的MSP(メチル化特異的PCR)によるメチル化マーカーの候補プローブの絞込
 MSP用のポジティブコントロールDNAとして、健常者血球由来DNAをSSS-I(New England Biolab社)処理した総メチル化DNAを使用した。DNAのbisulfite処理には、Zymo Research社のEZ DNA Methylation-GoldTMKitを使用した。健常者血球由来DNAのbisulfite処理に関しては、以下の手順で処理した。20μgのDNAを200μLの0.3 M NaOH溶液と37℃で15分反応させることで変性させた。次に、4M sodium bisulfite溶液1070μL、10mM hydroquinone溶液70μL、5M NaOH溶液7.2μLと変性DNAを混合し、64℃で16時間反応させた。その後、6mLのM-Binding buffer(Zymo Research社)を追加し、Zymo Research社のDNA Clean and Concentrator-25カラムを用いて精製し、70μLのH2Oで溶出し、使用するときまで-20℃で保存した。MSP施行時には1ng/μLに希釈して使用した。
 MSPでは非特異的増幅を検出しないようにTaqman方式のPCRが望ましいが、2重蛍光Probeの合成のコストと時間の節約のためにRoche社製Universal Probe Library (UPL)を使用した。メチル化アレイ解析で選ばれたそれぞれの候補プローブに対して、そのゲノム上の位置に可及的に近い部位にForwardとReverseプライマーとUPLのセットを設計した。内部標準としては、β-actin遺伝子のプロモーター領域上流のCpGが含まれない領域に設置されたプライマー・プローブセットを使用した。MSP反応は、FastStart Universal Probe Master (ROX) (Roche社):10μL、MSPプライマーMix:1μL、UPLプローブ:0.4μL、H2O:6.6μL、DNA:2μLの合計20μLの反応系で行った。PCRは、StepOnePlusリアルタイムPCRシステム(Applied Bioscience社製)を用いて、95℃10分で1サイクル反応を行った後、95℃15秒・60℃1分で50サイクル反応を行った。未知の標本のメチル化量の定量は、SSS-I処理した総メチル化DNAの段階希釈標本のデータから見積もった。
 メチル化マーカーの候補プローブの絞込条件は、以下の通りである:1) PCR増幅効率が70%以上110%未満であるプローブ、2) 5症例の健常者血液DNAでメチル化DNAが1症例までしか検出されないプローブ、3)乳がん細胞株28株でDNAメチル化が2株以上検出されるプローブ、4)FFPE標本の乳がん組織周囲正常上皮細胞のDNAプール標本でメチル化が検出されないプローブ、5)脱メチル化剤、ヒストン脱アセチル化阻害薬処理で、遺伝子の発現が上昇するプローブ。この条件で、メチル化マーカーの候補プローブの絞込を行い、がん共通マーカー4種、ルミナール型特異的マーカー4種、トリプルネガティブ型マーカー4種を選択した(図2)。
遺伝子発現のエピジェネティック制御の解析
 上記の5)で、絞り込んだメチル化マーカーのプローブが存在する遺伝子が、実際にエピジェネティックにその発現が制御されているかを確認した。その方法は次の通りである。細胞株としてルミナール型乳がん細胞株MCF7とT47D、トリプルネガティブ型細胞株としてMDA-MB-231とHs578Tを使用した。これらの細胞株へ、脱メチル化剤(5’-Aza-2-deoxycytidine:5’-Aza-dC、Sigma-Aldrich社)処理とヒストン脱アセチル化阻害剤(trichostatin A:TSA、Sigma-Aldrich)処理を行った。それぞれの細胞に1μM 5’-Aza-dC投与後48時間で300nM TSAを追加し、更に24時間後に細胞を回収した。RNAをTrizol(Invitrogen)とPureLink RNA Micro Kit (Invitrogen)を用いて精製抽出し、使用するときまで-80℃で保存した。
 それぞれの遺伝子に対するRT-PCRプライマー・プローブセットを、UPLプローブを設定できる部位で、exon-exon境界をまたぐように設計した。総RNAの内部標準として18S rRNAへのプライマー・プローブ(Applied BioSystem社製)を使用した。RT-PCRの反応は、QuantiTect Probe RT-PCR Master Mix (キアーゲン社):10μL、プライマーミックス:0.8μL、UPLプローブ:0.4μL、RNA溶液:2μL、H2O:6.6μLで合計20μLの反応系で行った。PCRは、StepOnePlusリアルタイムPCRシステム(Applied Bioscience社製)を用いて、95℃10分で1サイクル反応させた後、95℃15秒・60℃1分で45サイクル反応を行った。未知の標本のRNA発現量は、その遺伝子を発現している細胞株RNAの段階希釈系から、相対定量をおこない見積もった。
血中循環DNA定量用の内部標準マーカー
 メチル化マーカーの候補プローブの絞込時のMSPでは、内部標準として以前より使用されているβ-actinのプロモーター領域上流を増幅するプライマー・プローブセットを使用した。しかし、このMSPの増幅効率は高くなく、また、1遺伝子では、がん細胞ゲノムのコピー数変異の影響を受けるという問題があった。そこで、デジタルMSPに用いるために、乳がんゲノムでコピー数変異の率が低い遺伝子を複数選んで、その増幅アレル数の平均を求めることで、安定した定量を行えるようにした。TCGAデータベースから、コピー数変異の率が5%未満で、異なる染色体のセントロメア近傍に位置する遺伝子を4種選択してきた(表1参照)。プライマー・プローブをCpGがない領域に設計することで、メチル化状態によらず全てのDNAアレルで増幅するようにした。
デジタルドロップレットPCR機器によるMSPアッセイ系の確立
 がん用のマーカー12種と、内部標準4種を合わせて16マーカーを、duplex MSPのために8ペアに組み分けた。Duplex MSPでは、FAMが使われているUPLと、Alexa Fluor 532でラベルされているTaqmanプローブを合わせて使った。カスタムAlexa Fluor 532プローブは、メチル化マーカーの候補プローブ絞込段階で使用したUPLの各遺伝子での認識部位を中心に若干長さを変更して、BHQ1をクエンチャーとしてラベルされたLNATM(Locked Nucleic Acid)を含む核酸プローブとして合成した(ジーンデザイン社)。
 デジタルPCR機器(QX100、BioRad社)でのduplex MSPの反応では、まずddPCRTM Supermix for Probes(BioRad社):11μL、プライマーMix:1.1μL×2、UPLおよびTaqmanプローブ:0.44μL×2、bisulfite処理DNA:2.2μL、H2O:5.72μL、計22μLの反応液を作成した。Droplet Generation Oilとともに、QX100 Droplet Generator(BioRad社)でDropletを形成し、T100TM Thermal Cycler(BioRad社)でPCR反応を行った。95℃10分で1サイクル反応を行った後、94℃30秒、60℃1分で50サイクル反応を行い、最後に98℃10分を1サイクル反応を行った後、スキャンまで4℃で保存した。それぞれのPCRランの際に、plateにはSSS-1処理した総メチル化DNAによる陽性コントロールとテンプレートを入れない陰性コントロールの反応を追加した。
ddMSPデータ解析
 乳がん症例145症例、健常者133例の合計278例の血漿標本を解析した。症例を学習セット(167症例)と検証セット(111症例)に分割し、かつ両群の乳がん症例の病期(stage)の比率が同一になるように調整した。診断アルゴリズムは学習セット症例の標本解析のデータのみで構築し、後に検証セット症例のデータを用いて、構築した診断アルゴリズムの診断精度を検証した。
 デジタルPCR機器付属のソフトウェアではドロップレットのカットオフ値をカスタマイズするのが困難なために、独自にMATLABソフトで解析した。ドロップレットのシグナルデータを付属ソフトウェアからcsvファイルとしてExportし、MATLABソフトへインポートした。
1)シグナル陰性ドロップレットも少ないながら蛍光シグナルを持つ。陰性シグナルドロップレットのシグナル強度の分布を、質量分析のピーク同定にも使用されるMATLABのカーネル平滑化関数推定ksdenstiy関数を使用し描出した(図3-1)。そのピークの帯域上限をそれぞれの反応系ごとに算出し、全てのドロップレットのシグナル強度の数値をその基準値からのシグナル強度に変換した(増幅シグナル値とする)。
2)まず学習セットの増幅シグナル値のデータから、増幅シグナル上限のカットオフ値を決めた。デジタルPCRの測定の際、PCRプレートには必ず陽性コントロールサンプルである総メチル化DNAを各マーカーのプライマープローブで増幅する反応を含めた。標本サンプルの増幅シグナルでは、その陽性コントロールで得られる増幅シグナル値よりも遥かに高いシグナルをもつドロップレットが出現することがある(図3-2)。このシグナルはドロップレットの形成不良によるものと考えられ、陽性ドロップレットの計測から外さないといけないが、デジタルPCR機器付属のソフトウェアでは、高すぎる不良ドロップレットを外す機能を持っていない。そこで学習セットでの全ての陽性コントロールDNA標本のデータを用いて、陽性シグナルドロップレットのシグナル強度の分布をMATLABのksdenstiy関数描出した。それぞれのマーカーに於いて陽性シグナルピークの帯域の上限を、上限カットオフ値とした(表4)。
Figure JPOXMLDOC01-appb-T000040
3)2)で用いた学習用セットの増幅シグナル値データを用いてシグナル下限カットオフ値は以下のように決めた。まず仮の下限カットオフ値を0に定め、増幅シグナル値が2)で決定した上限カットオフ値との間にあるドロップレットを陽性ドロップレット数として数える。全体のドロップレット数(1ドロップレットはPCR反応液1ナノリットル)と陽性ドロップレット数から、ポアソン分布による補正を行い(BJ Hindson, et al, High-Throughput Droplet Disital PCR System for Absolute Quantitation of DNA Copy Number. Analytical chemistry, Vol. 83, 8604-10, 2011)、反応液20マイクロリットル中の陽性アレル数を算出する。それは血漿125マイクロリットル中の濃度に当たるので、そこから患者血漿中1ミリリットル中のアレル濃度を計算する。これを学習用セットの症例全てで対数(log10)アレル濃度を算出し、がん‐非がん判別のROC曲線下面積(AUC)を計算させる。
 この作業を仮の下限カットオフ値を10づつ増加させていき(図3-3)、AUCが最大になった時の下限カットオフ値を採用することにした(図3-4)。表4にそのカットオフ値を示した。そして、検証セットの症例のデータに関しても、同様の手順と同じ増幅シグナル上限と下限のカットオフ値を使用して、対数アレル濃度を算出した。
 12種の各乳がん診断マーカー毎にROC曲線解析を行い、(0,1)の点より最も近いROC曲線上の点に相当するカットオフ値を、メチル化陽性カットオフ値と定め(図5-1, 表5)、12マーカー中の陽性マーカー数も算出した。
Figure JPOXMLDOC01-appb-T000041
 ここで、各標本ごとに、12マーカーのメチル化アレルlog10濃度と、その平均log10濃度、内部標準マーカーの平均log10濃度、陽性マーカー数の15因子が得られた。この15因子のどの組み合わせが良いか、215-1通りの因子の組み合わせで、一個抜き交差検証法(Leave one out crossvalidation, LOOCV)を用い、線形判別分析(Linear discriminant analysis, LDA)とSVM(Support Vector Machine)で各症例の予測値をだし、AUCにて診断精度を評価した。使用した因子に対する係数が全て正の数であったもので、最もAUCの高い因子のセットとアルゴリズムを選択した。その因子のセットと関数を使い、学習セット167症例データ全体でフィットさせ、検証セットのデータを導入し、各症例に対する検査値を算出し、検証セットコホートでの診断精度を見積もった。
使用した解析ソフトウェア
 MATLAB2015a(基本セット、Statistics and Machine Learning Toolbox、Bioinformatics Toolbox、Parallel Computing Toolbox)、サードパーティ製MATLAB関数としてNIMBLをメチル化アレイのβ値補正に、notBoxPlotをbox plotと散布図の合成図の作成に使用した。検査値のサブタイプ間の差異の検定にR softwareを使用した。
乳がんの網羅的DNAメチル化解析と、エピジェネティクスマーカーのスクリーニング
 乳がん54症例と乳がん近傍正常上皮10症例プールの1標本、乳管内乳頭腫(良性腫瘍)1例のFFPE標本、34種の培養細胞株、29例の健常者血球に由来する各DNAに対して、イルミナ社製Infinium Human Methylation 450 BeadChipを用いてゲノムワイドにDNAメチル化解析を行った。FFPE標本を使用した乳がん症例のサブタイプの内訳は、ルミナールA型27例、ルミナールB型11例、ルミナールHER2型4例、HER2型1例、トリプルネガティブ型11例であった。細胞株は、28乳がん細胞株31標本、非がん細胞株3標本(臍帯血管内皮細胞、正常乳腺血管内皮細胞、乳腺正常上皮細胞)が含まれ、乳がん細胞株のサブタイプは、ルミナール型4株、ルミナールHER2型1株、HER2型4株、トリプルネガティブ型18株、サブタイプ不明1株であった。乳がん細胞株3標本は、アレイ実験のバッチ間コントロールとして重複して解析した。
 図2に示すように、メチル化マーカーの候補プローブに基づいてMSPプライマー・プローブセットを設計し、SSS-I処理した総メチル化DNAを用いて、リアルタイムPCRマシンでの増幅効率が許容範囲に収まることをチェックした。その後、健常者の血球由来DNA5標本と乳がん細胞28株、非がん正常細胞3株のDNA標本、乳腺正常上皮細胞のFFPE組織からのマイクロダイセクション標本を用いて、メチル化マーカーの候補プローブの絞込を行った。また、脱メチル化剤とヒストン脱アセチル化阻害剤処理した乳がん細胞株の遺伝子発現をRT-PCR解析で確認し、メチル化によって発現が抑制されている遺伝子上に存在するプローブを優先して選んだ。乳がん共通マーカー候補9種のうち、JAK3、RASGRF、SHF、CPXM1が実際に遺伝子発現を制御していた。ルミナール型マーカー候補13種のうち11種がエピジェネティックに遺伝子発現を制御していると考えられた。そのうち、デジタルMSPでの増幅効率、バックグラウンドシグナル強度等の結果からddMSPへの移植が良好な4種を選択した。トリプルネガティブ型マーカーは、遺伝子発現をしている細胞株がなかったためエピジェネティクス解析が行えず、トリプルネガティブ型マーカー候補9種からddMSPでの増幅が良好な4種を選び(図2)、最終的に合計12種のプローブを選択した(表6)。
Figure JPOXMLDOC01-appb-T000042
内部標準マーカーの選択と評価
 発明者らはメチル化マーカーの候補プローブの絞り込みの際は、MSP研究の黎明期に報告されたβ-actinのプロモーター領域上流のCpGを含まない領域に設定されたプライマー・プローブセットを使用した。しかし、このプライマー・プローブセットの増幅効率が不十分である等の理由で新規の内部標準マーカーを探索し、前述したような条件を満たす内部標準マーカーを4種選択してきた。16正常個体と16乳がん患者の血中循環DNAを用い、ddMSPにおける新規の内部標準マーカー4種の平均値と、β-actinマーカーの値を比較した。両者の値は有意に相関したが、検出感度は新規の内部標準マーカー4種の平均値の方が良好であり(図4)、その後のddMSPアッセイには該内部標準マーカー4種の平均値を使用した。
血中循環DNAの解析
 乳がん症例145症例、健常者133例、合計278症例の血漿標本を用いて、上記で確立したddMSPアッセイ法で、メチル化プロファイルを測定した。この症例を学習セット(乳がん症例87例、健常者80例)と検証セット(乳がん症例58症例、健常者53例)に分割し、かつ両群の乳がんの臨床病期の比率が同等になるように調整した。乳がん患者の臨床病期0-I、IIA、IIB-III、IV+転移性乳がん症例はそれぞれ、学習セットで30、19、19、19症例で、検証セットでは21、12、12、13症例だった。患者の臨床病理学的背景は表7に示した。
Figure JPOXMLDOC01-appb-T000043
 各マーカーのROC曲線を図5-1及び5-2に示す。12種のプローブのROC曲線下面積(AUC)は0.56から0.71の範囲にあった(図5-1)。内部標準マーカー4種のAUCはいずれも0.8以上で(図5-1)、内部標準マーカー4種の平均値のAUCは0.89に達した(図5-2)。12種のプローブのメチル化アレル濃度の平均値のAUCとメチル化陽性プローブ数のAUCはそれぞれ、0.77と0.82であった(図5-2)。
 線形判別分析とSVMの2種のアルゴリズムと一個抜き交差検証法(LOOCV)を用いて学習セットの15因子データで最良の診断アルゴリズムを探索した。すると、RASGRF1、CPXM1、HOXA10、DACH1、12マーカーメチル化アレル平均濃度(Mean12)、内部標準4マーカー平均濃度(IC)の6因子を用いてSVMアルゴリズムを使用した際に、学習セットでAUC=0.9157を得た。そのアルゴリズムで検証セットを診断した時はAUC=0.8757であった。その学習セットと検証セットのROC曲線を図6に示した。
 その最適化したSVMでの式は
検査値= 0.62449×[RASGRF1] + 0.78110×[CPXM1] +0.12115×[HOXA10] + 0.36760×[DACH1] + 0.65288×[Mean12] + 2.44704×[IC] - 6.98073
[ここで、[RASGRF1]、[CPXM1]、[HOXA10]、および[DACH1]は、DNAメチル化が生じた各メチル化遺伝子マーカーのアレル濃度の対数値を表し、[Mean12]は、DNAメチル化が生じた12種のメチル化遺伝子マーカーの各アレル濃度の対数値の相加平均を表し、[IC]は4種の内部標準遺伝子マーカー(CREM、GLYATL3、ELMOD3およびKLF9遺伝子)のアレル濃度の対数値の相加平均を表す。]
であった。
 乳がん患者のこの検査値は、統計学的に有意に健常者よりも高かった(Tテスト p値<0.0001)。ROC曲線解析よりこの検査値の最適化カットオフ値は、-0.07923であった。全ての症例での、この検査値の感度は88.3%で特異度は81.2%であった。
 一般的に、年齢が高くなると組織で高度メチル化している遺伝子の割合が増えると言われている。本実施例の健常者の平均年齢が乳がん患者の平均年齢に比べて有意に低かったので、今回開発したがん診断アッセイ+アルゴリズムの診断精度が、年齢によってバイアスがかかっている可能性がある。そこで、年齢と検査値の分布を散布図で示した(図7)。ピアソンの相関解析によると、年齢と検査値には有意な相関は認められなかった(相関係数r=0.089, p値=0.3159)。
検査値と乳がんの臨床病理学的因子との相関
 検査値は、乳がん症例の病期が高いほど、統計学的に有意に高くなる傾向があった(Jonckheere-Terpstra test, p=0.012)(図8)。この乳がん症例群には非浸潤性乳管がん症例が4例あったがいずれも、がん陽性と診断されていた。乳がん症例を原発巣での臨床病理学的サブタイピングのルミナール型乳がん症例群、トリプルネガティブ型乳がん症例群に層別化しても同様の傾向が認められた(Jonckheere-Terpstra test, それぞれp=0.033、p=0.037)。しかし、HER2陽性症例では症例数が少ないためか、有意な傾向は見られなかった(図9)。
 また、トリプルネガティブ型乳がんとHER2陽性乳がんの症例は、病期Iの症例も含めて全てがん陽性と診断された。一方、ルミナール型乳がんでは19%の症例が、陰性を示した(図10)。
 被験者の循環DNA中に含まれる、メチル化されたJAK3遺伝子、メチル化されたRASGRF1遺伝子、メチル化されたCPXM1遺伝子、メチル化されたSHF遺伝子、メチル化されたDNM3遺伝子、メチル化されたCAV2遺伝子、メチル化されたHOXA10遺伝子、メチル化されたB3GNT5遺伝子、メチル化されたST3GAL6遺伝子、メチル化されたDACH1遺伝子、メチル化されたP2RX3遺伝子、メチル化されたcg23495581遺伝子、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子の各遺伝子を、乳がんを検出するための遺伝子マーカーとして、被験者が乳がんであるか否かの検査を行うことができる。
 本出願は、日本で出願された特願2016-003090(出願日:平成28年1月8日)を基礎としており、その内容はすべて本明細書に包含されるものとする。

Claims (28)

  1.  乳がんの診断のための検査方法であって、被験者から採取したDNA含有試料中の、以下の(1)~(12):
    (1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    (12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域中に存在する所定の一以上のCpG部位のメチル化の状態;
    より選択される一以上のメチル化の状態を測定する工程(工程A)を含む、方法。
  2.  工程Aにおいて、前記(1)~(4)より選択される一以上のメチル化の状態、前記(5)~(8)より選択される一以上のメチル化の状態および前記(9)~(12)より選択される一以上のメチル化の状態を測定することを特徴とする、請求項1に記載の方法。
  3.  工程Aにおいて、前記(1)~(12)に示すメチル化の状態を測定することを特徴とする、請求項1または2に記載の方法。
  4.  それぞれ別個の染色体に存在する2以上の遺伝子であって、DNA全体の量を反映する因子となり得る内部標準遺伝子の量をさらに測定する工程(工程B)を含む、請求項1~3のいずれか一項に記載の方法。
  5.  前記内部標準となり得る遺伝子が、乳がん細胞でのコピー数変異の頻度が5%未満である、請求項4に記載の方法。
  6.  前記内部標準となり得る遺伝子がCREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子からなる一群から選択される1以上の遺伝子を含むことを特徴とする、請求項4に記載の方法。
  7.  前記内部標準となり得る遺伝子がCREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子であることを特徴とする、請求項4に記載の方法。
  8.  前記被験者から採取したDNAが、血中循環DNAであることを特徴とする、請求項1~7のいずれか一項に記載の方法
  9.  前記工程Aにおいて、メチル化の状態の測定が、該所定の一以上のCpG部位がメチル化された各遺伝子のアレル濃度を測定することにより行われる、請求項1~8のいずれか一項に記載の方法。
  10.  前記工程Bにおいて、内部標準遺伝子の量が、該遺伝子のアレル濃度であることを特徴とする、請求項4~9のいずれか一項に記載の方法。
  11.  前記工程Aにおいて、前記(1)~(12)に示すメチル化の状態を測定し、前記工程Bにおいて、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子の量を測定することを含む、請求項9または10に記載の方法であって、
    (C)前記工程Aにより得られたそれぞれのアレル濃度の対数、
       前記工程Aにより得られたそれぞれのアレル濃度の対数の相加平均、
       前記工程Bにより得られた前記内部標準となり得る遺伝子のアレル濃度の対数の相加平均に所定の係数を乗じた計算式を用いて、乳がんの判定のための検査値を算出する工程;
    をさらに含む、方法。
  12.  乳がんの診断のための遺伝子マーカーであって、
    以下の(1)~(12):
    (1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    より選択される一以上の遺伝子断片を含む、遺伝子マーカー。
  13.  前記(1)~(12)の遺伝子断片が、
    (1)配列番号1のヌクレオチド配列中、ヌクレオチド番号16~534で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (2)配列番号2のヌクレオチド配列中、ヌクレオチド番号59~345で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (3)配列番号3のヌクレオチド配列中、ヌクレオチド番号41~400で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (4)配列番号4のヌクレオチド配列中、ヌクレオチド番号150~460で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (5)配列番号5のヌクレオチド配列中、ヌクレオチド番号118~590で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (6)配列番号6のヌクレオチド配列中、ヌクレオチド番号115~566で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (7)配列番号7のヌクレオチド配列中、ヌクレオチド番号641~1011で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1116~1595で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (9)配列番号9のヌクレオチド配列中、ヌクレオチド番号40~448で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (10)配列番号10のヌクレオチド配列中、ヌクレオチド番号330~824で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (11)配列番号11のヌクレオチド配列中、ヌクレオチド番号225~535で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (12)配列番号12のヌクレオチド配列中、ヌクレオチド番号164~822で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    である、請求項12に記載の遺伝子マーカー。
  14.  前記(1)~(12)の遺伝子断片が、
    (1)配列番号1のヌクレオチド配列中、ヌクレオチド番号116~434で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (2)配列番号2のヌクレオチド配列中、ヌクレオチド番号159~245で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (3)配列番号3のヌクレオチド配列中、ヌクレオチド番号141~300で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (4)配列番号4のヌクレオチド配列中、ヌクレオチド番号251~359で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (5)配列番号5のヌクレオチド配列中、ヌクレオチド番号218~490で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (6)配列番号6のヌクレオチド配列中、ヌクレオチド番号215~484で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (7)配列番号7のヌクレオチド配列中、ヌクレオチド番号741~911で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (9)配列番号9のヌクレオチド配列中、ヌクレオチド番号140~348で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (10)配列番号10のヌクレオチド配列中、ヌクレオチド番号430~724で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (11)配列番号11のヌクレオチド配列中、ヌクレオチド番号326~435で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    (12)配列番号12のヌクレオチド配列中、ヌクレオチド番号264~722で示される領域中に存在する一以上のCpG部位を含む該遺伝子断片;
    である、請求項12に記載の遺伝子マーカー。
  15.  DNA全体の濃度に対する内部標準となり得る遺伝子マーカーであって、CREM遺伝子、GLYATL3遺伝子、ELMOD3遺伝子およびKLF9遺伝子からなる群より選択される少なくとも1つの遺伝子またはその断片を含む、遺伝子マーカー。
  16.  請求項15記載の遺伝子マーカーと組み合わせて用いることを特徴とする、請求項12~14のいずれか一項に記載の遺伝子マーカー。
  17.  乳がんの診断のための検査薬であって、
    以下の(1)~(12):
    (1)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (2)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (3)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (4)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (5)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (6)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (7)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内の領域中に存在する一以上のCpG部位を領域;
    (8)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (9)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (10)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (11)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内の領域中に存在する一以上のCpG部位を含む領域;
    (12)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域中に存在する一以上のCpG部位を含む領域;
    より選択される一以上の領域中の所定のCpG部位のメチル化を検出し得る、一以上のプライマーセットを含む、検査薬。
  18.  前記(1)~(12)の領域が、
    (1)配列番号1のヌクレオチド配列中、ヌクレオチド番号16~534で示される領域中に存在する一以上のCpG部位を含む領域;
    (2)配列番号2のヌクレオチド配列中、ヌクレオチド番号59~345で示される領域中に存在する一以上のCpG部位を含む領域;
    (3)配列番号3のヌクレオチド配列中、ヌクレオチド番号41~400で示される領域中に存在する一以上のCpG部位を含む領域;
    (4)配列番号4のヌクレオチド配列中、ヌクレオチド番号150~460で示される領域中に存在する一以上のCpG部位を含む領域;
    (5)配列番号5のヌクレオチド配列中、ヌクレオチド番号118~590で示される領域中に存在する一以上のCpG部位を含む領域;
    (6)配列番号6のヌクレオチド配列中、ヌクレオチド番号115~566で示される領域中に存在する一以上のCpG部位を含む領域;
    (7)配列番号7のヌクレオチド配列中、ヌクレオチド番号641~1011で示される領域中に存在する一以上のCpG部位を含む領域;
    (8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1116~1595で示される領域中に存在する一以上のCpG部位を含む領域;
    (9)配列番号9のヌクレオチド配列中、ヌクレオチド番号40~448で示される領域中に存在する一以上のCpG部位を含む領域;
    (10)配列番号10のヌクレオチド配列中、ヌクレオチド番号330~824で示される領域中に存在する一以上のCpG部位を含む領域;
    (11)配列番号11のヌクレオチド配列中、ヌクレオチド番号225~535で示される領域中に存在する一以上のCpG部位を含む領域;
    (12)配列番号12のヌクレオチド配列中、ヌクレオチド番号164~822で示される領域中に存在する一以上のCpG部位を含む領域;
    である、請求項17に記載の検査薬。
  19.  前記(1)~(12)の領域が、
    (1)配列番号1のヌクレオチド配列中、ヌクレオチド番号116~434で示される領域に存在する一以上のCpG部位を含む領域;
    (2)配列番号2のヌクレオチド配列中、ヌクレオチド番号159~245で示される領域中に存在する一以上のCpG部位を含む領域;
    (3)配列番号3のヌクレオチド配列中、ヌクレオチド番号141~300で示される領域中に存在する一以上のCpG部位を含む領域;
    (4)配列番号4のヌクレオチド配列中、ヌクレオチド番号251~359で示される領域中に存在する一以上のCpG部位を含む領域;
    (5)配列番号5のヌクレオチド配列中、ヌクレオチド番号218~490で示される領域中に存在する一以上のCpG部位を含む領域;
    (6)配列番号6のヌクレオチド配列中、ヌクレオチド番号215~484で示される領域中に存在する一以上のCpG部位を含む領域;
    (7)配列番号7のヌクレオチド配列中、ヌクレオチド番号741~911で示される領域中に存在する一以上のCpG部位を含む領域;
    (8)配列番号8のヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域中に存在する一以上のCpG部位を含む領域;
    (9)配列番号9のヌクレオチド配列中、ヌクレオチド番号140~348で示される領域中に存在する一以上のCpG部位を含む領域;
    (10)配列番号10のヌクレオチド配列中、ヌクレオチド番号430~724で示される領域中に存在する一以上のCpG部位を含む領域;
    (11)配列番号11のヌクレオチド配列中、ヌクレオチド番号326~435で示される領域中に存在する一以上のCpG部位を含む領域;
    (12)配列番号12のヌクレオチド配列域中、ヌクレオチド番号264~722で示される領域中に存在する一以上のCpG部位を含む領域;
    である、請求項17に記載の検査薬。
  20.  前記(1)~(12)に示す各領域中の所定のCpG部位のメチル化をそれぞれ検出し得るプライマーセットを含む、請求項19に記載の検査薬。
  21. 以下の(1A)~(12A):
    (1A)配列番号1のヌクレオチド配列で代表されるヒトJAK3遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号13のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号14のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (2A)配列番号2のヌクレオチド配列で代表されるヒトRASGRF1遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号15のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号16のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (3A)配列番号3のヌクレオチド配列で代表されるヒトCPXM1遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号17のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号18のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (4A)配列番号4のヌクレオチド配列で代表されるヒトSHF遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号19のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号20のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (5A)配列番号5のヌクレオチド配列で代表されるヒトDNM3遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号21のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号22のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (6A)配列番号6のヌクレオチド配列で代表されるヒトCAV2遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号23のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号24のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (7A)配列番号7のヌクレオチド配列で代表されるヒトHOXA10遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号25のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号26のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (8A)配列番号8のヌクレオチド配列で代表されるヒトB3GNT5遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号27のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号28のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (9A)配列番号9のヌクレオチド配列で代表されるヒトST3GAL6遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号29のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号30のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (10A)配列番号10のヌクレオチド配列で代表されるヒトDACH1遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号31のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号32のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (11A)配列番号11のヌクレオチド配列で代表されるヒトP2RX3遺伝子内領域の順鎖をバイサルファイト処理して得られる配列番号33のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号34のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    (12A)配列番号12のヌクレオチド配列で代表されるヒト第8番染色体上のゲノムDNA領域の順鎖をバイサルファイト処理して得られる配列番号35のヌクレオチド配列中に存在する一以上のCpG部位を含む領域、または該遺伝子内領域の逆鎖をバイサルファイト処理して得られる配列番号36のヌクレオチド配列中に存在する一以上のCpG部位を含む領域;
    より選択される一以上の領域中の所定のCpG部位のメチル化を検出し得る、一以上のプライマーセットを含む、請求項17に記載の検査薬。
  22.  前記(1A)~(12A)の領域が、
    (1A)配列番号13のヌクレオチド配列中、ヌクレオチド番号16~534で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号14のヌクレオチド配列中、ヌクレオチド番号9~527で示される領域中に存在する一以上のCpG部位を含む領域;
    (2A)配列番号15のヌクレオチド配列中、ヌクレオチド番号59~345で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号16のヌクレオチド配列中、ヌクレオチド番号658~944で示される領域中に存在する一以上のCpG部位を含む領域;
    (3A)配列番号17のヌクレオチド配列中、ヌクレオチド番号41~400で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号18のヌクレオチド配列中、ヌクレオチド番号558~917で示される領域中に存在する一以上のCpG部位を含む領域;
    (4A)配列番号19のヌクレオチド配列中、ヌクレオチド番号150~460で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号20のヌクレオチド配列中、ヌクレオチド番号248~558で示される領域中に存在する一以上のCpG部位を含む領域;
    (5A)配列番号21のヌクレオチド配列中、ヌクレオチド番号118~590で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号22のヌクレオチド配列中、ヌクレオチド番号280~752で示される領域中に存在する一以上のCpG部位を含む領域;
    (6A)配列番号23のヌクレオチド配列中、ヌクレオチド番号115~566で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号24のヌクレオチド配列中、ヌクレオチド番号1~452で示される領域中に存在する一以上のCpG部位を含む領域;
    (7A)配列番号25のヌクレオチド配列中、ヌクレオチド番号641~1011で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号26のヌクレオチド配列中、ヌクレオチド番号14~384で示される領域中に存在する一以上のCpG部位を含む領域;
    (8A)配列番号27のヌクレオチド配列中、ヌクレオチド番号1116~1595で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号28のヌクレオチド配列中、ヌクレオチド番号199~678で示される領域中に存在する一以上のCpG部位を含む領域;
    (9A)配列番号29のヌクレオチド配列中、ヌクレオチド番号40~448で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号30のヌクレオチド配列中、ヌクレオチド番号193~601で示される領域中に存在する一以上のCpG部位を含む領域;
    (10A)配列番号31のヌクレオチド配列中、ヌクレオチド番号330~824で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号32のヌクレオチド配列中、ヌクレオチド番号8~502で示される領域中に存在する一以上のCpG部位を含む領域;
    (11A)配列番号33のヌクレオチド配列中、ヌクレオチド番号225~535で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号34のヌクレオチド配列中、ヌクレオチド番号192~502で示される領域中に存在する一以上のCpG部位を含む領域;
    (12A)配列番号35のヌクレオチド配列中、ヌクレオチド番号164~822で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号36のヌクレオチド配列中、ヌクレオチド番号100~758で示される領域中に存在する一以上のCpG部位を含む領域;
    である、請求項21に記載の検査薬。
  23.  前記(1A)~(12A)の領域が、
    (1A)配列番号13のヌクレオチド配列中、ヌクレオチド番号116~434で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号14のヌクレオチド配列中、ヌクレオチド番号109~427で示される領域中に存在する一以上のCpG部位を含む領域;
    (2A)配列番号15のヌクレオチド配列中、ヌクレオチド番号159~245で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号16のヌクレオチド配列中、ヌクレオチド番号758~844で示される領域中に存在する一以上のCpG部位を含む領域;
    (3A)配列番号17のヌクレオチド配列中、ヌクレオチド番号141~300で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号18のヌクレオチド配列中、ヌクレオチド番号658~817で示される領域中に存在する一以上のCpG部位を含む領域;
    (4A)配列番号19のヌクレオチド配列中、ヌクレオチド番号251~359で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号20のヌクレオチド配列中、ヌクレオチド番号349~457で示される領域中に存在する一以上のCpG部位を含む領域;
    (5A)配列番号21のヌクレオチド配列中、ヌクレオチド番号218~490で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号22のヌクレオチド配列中、ヌクレオチド番号380~652で示される領域中に存在する一以上のCpG部位を含む領域;
    (6A)配列番号23のヌクレオチド配列中、ヌクレオチド番号215~484で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号24のヌクレオチド配列中、ヌクレオチド番号83~352で示される領域中に存在する一以上のCpG部位を含む領域;
    (7A)配列番号25のヌクレオチド配列中、ヌクレオチド番号741~911で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号26のヌクレオチド配列中、ヌクレオチド番号114~284で示される領域中に存在する一以上のCpG部位を含む領域;
    (8A)配列番号27のヌクレオチド配列中、ヌクレオチド番号1216~1495で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号28のヌクレオチド配列中、ヌクレオチド番号299~578で示される領域中に存在する一以上のCpG部位を含む領域;
    (9A)配列番号29のヌクレオチド配列中、ヌクレオチド番号140~348で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号30のヌクレオチド配列中、ヌクレオチド番号293~501で示される領域中に存在する一以上のCpG部位を含む領域;
    (10A)配列番号31のヌクレオチド配列中、ヌクレオチド番号430~724で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号32のヌクレオチド配列中、ヌクレオチド番号108~402で示される領域中に存在する一以上のCpG部位を含む領域;
    (11A)配列番号33のヌクレオチド配列中、ヌクレオチド番号326~435で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号34のヌクレオチド配列中、ヌクレオチド番号292~401で示される領域中に存在する一以上のCpG部位を含む領域;
    (12A)配列番号35のヌクレオチド配列中、ヌクレオチド番号264~722で示される領域中に存在する一以上のCpG部位を含む領域、または配列番号36のヌクレオチド配列中、ヌクレオチド番号200~658で示される領域中に存在する一以上のCpG部位を含む領域;
    である、請求項21に記載の検査薬。
  24.  前記(1A)~(12A)に示す各領域中に存在する所定のCpG部位のメチル化をそれぞれ検出し得るプライマーセットを含む、請求項21~23のいずれか一項に記載の検査薬。
  25.  以下の(13)~(16):
    (13)CREM遺伝子またはその断片を特異的に検出するためのプライマーセット;
    (14)GLYATL3遺伝子またはその断片を特異的に検出するためのプライマーセット;
    (15)ELMOD3遺伝子またはその断片を特異的に検出するためのプライマーセット;および
    (16)KLF9遺伝子またはその断片を特異的に検出するためのプライマーセット;
    より選択される一以上のプライマーセットをさらに含むことを特徴とする、請求項17~24のいずれか一項に記載の検査薬。
  26.  前記(13)~(16)に示すプライマーセットを含むことを特徴とする、請求項25に記載の検査薬。
  27.  前記いずれかのプライマーセットで増幅された、DNA断片を特異的に検出するためのプローブをさらに含むことを特徴とする、請求項17~26のいずれか一項に記載の検査薬。
  28.  請求項12~16のいずれか一項に記載の遺伝子マーカーを検出するための、請求項17~27のいずれか一項に記載の検査薬。
PCT/JP2017/000340 2016-01-08 2017-01-06 乳がんの診断のための検査方法、遺伝子マーカー、および検査薬 WO2017119510A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016003090 2016-01-08
JP2016-003090 2016-01-08

Publications (1)

Publication Number Publication Date
WO2017119510A1 true WO2017119510A1 (ja) 2017-07-13

Family

ID=59273753

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/000340 WO2017119510A1 (ja) 2016-01-08 2017-01-06 乳がんの診断のための検査方法、遺伝子マーカー、および検査薬

Country Status (1)

Country Link
WO (1) WO2017119510A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021503943A (ja) * 2017-11-30 2021-02-15 マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチMayo Foundation for Medical Education and Research 乳癌の検出
JP2021522814A (ja) * 2018-05-08 2021-09-02 タイペイ・メディカル・ユニバーシティTaipei Medical University 乳癌の早期予測のため、処置応答、再発および予後のモニタリングのための方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6812339B1 (en) * 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
US20070092883A1 (en) * 2005-10-26 2007-04-26 De Luwe Hoek Octrooien B.V. Methylation specific multiplex ligation-dependent probe amplification (MS-MLPA)
WO2008073303A2 (en) * 2006-12-07 2008-06-19 Switchgear Genomics Transcriptional regulatory elements of biological pathways, tools, and methods
JP2010538638A (ja) * 2007-09-17 2010-12-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 乳癌疾患の解析方法
JP2012090555A (ja) * 2010-10-26 2012-05-17 Sapporo Medical Univ Rasgrf1の定量的メチル化測定を用いた発癌リスク予測
WO2012088298A2 (en) * 2010-12-21 2012-06-28 Sloan-Kettering Institute For Cancer Research Epigenomic markers of cancer metastasis
WO2012143481A2 (en) * 2011-04-19 2012-10-26 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Prostate cancer markers
JP2014505475A (ja) * 2011-01-20 2014-03-06 ユニヴェルシテ リブル ドゥ ブリュッセル ヒトの乳癌のエピジェネティックな肖像
WO2015116837A1 (en) * 2014-01-30 2015-08-06 The Regents Of The University Of California Methylation haplotyping for non-invasive diagnosis (monod)
WO2015128671A1 (en) * 2014-02-27 2015-09-03 Queen Mary University Of London Biomarkers for endometriosis
JP2016015963A (ja) * 2014-07-11 2016-02-01 シスメックス株式会社 複数種類の癌に関する情報を取得する方法、システムおよびプログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6812339B1 (en) * 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
US20070092883A1 (en) * 2005-10-26 2007-04-26 De Luwe Hoek Octrooien B.V. Methylation specific multiplex ligation-dependent probe amplification (MS-MLPA)
WO2008073303A2 (en) * 2006-12-07 2008-06-19 Switchgear Genomics Transcriptional regulatory elements of biological pathways, tools, and methods
JP2010538638A (ja) * 2007-09-17 2010-12-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 乳癌疾患の解析方法
JP2012090555A (ja) * 2010-10-26 2012-05-17 Sapporo Medical Univ Rasgrf1の定量的メチル化測定を用いた発癌リスク予測
WO2012088298A2 (en) * 2010-12-21 2012-06-28 Sloan-Kettering Institute For Cancer Research Epigenomic markers of cancer metastasis
JP2014505475A (ja) * 2011-01-20 2014-03-06 ユニヴェルシテ リブル ドゥ ブリュッセル ヒトの乳癌のエピジェネティックな肖像
WO2012143481A2 (en) * 2011-04-19 2012-10-26 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Prostate cancer markers
WO2015116837A1 (en) * 2014-01-30 2015-08-06 The Regents Of The University Of California Methylation haplotyping for non-invasive diagnosis (monod)
WO2015128671A1 (en) * 2014-02-27 2015-09-03 Queen Mary University Of London Biomarkers for endometriosis
JP2016015963A (ja) * 2014-07-11 2016-02-01 シスメックス株式会社 複数種類の癌に関する情報を取得する方法、システムおよびプログラム

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
BEDIAGA, NG. ET AL.: "DNA methylation epigenotypes in breast cancer molecular subtypes", BREAST CANCER RES., vol. 12, no. 5, 2010, pages R77, XP021085389, ISSN: 1465-5411, DOI: doi:10.1186/bcr2721 *
CHU, Q. ET AL.: "Abstract 1074 : Epigenetic silencing of DACH1 in triple negative breast cancer contributes to the tumorigenesis", CANCER RESEARCH, vol. 75, no. 15, 1074, August 2015 (2015-08-01), XP055598770, ISSN: 0008-5472, DOI: 10.1158/1538-7445.AM2015-1074 *
DATABASE NUCLEOTIDE [online] 23 March 2015 (2015-03-23), VENTER, JC. ET AL.: "Homo sapiens 211000035832507 genomic scaffold, whole genome shotgun sequence", XP055598774, retrieved from NCBI Database accession no. CH471089 *
KORSHUNOVA, Y . ET AL.: "Massively parallel bisulphite pyrosequencing reveals the molecular complexity of breast cancer-associated cytosine-methylation patterns obtained from tissue and serum DNA", GENOME RES., vol. 18, no. 1, 2008, pages 19 - 29, XP055396258, ISSN: 1088-9051, DOI: doi:10.1101/gr.6883307 *
PILATO, B. ET AL.: "HOX gene methylation status analysis in patients with hereditary breast cancer", J. HUM. GENET., vol. 58, no. 1, 11 October 2012 (2012-10-11) - January 2013 (2013-01-01), pages 51 - 53, XP055598766, ISSN: 1434-5161, DOI: 10.1038/jhg.2012.118 *
RHEE, JK. ET AL.: "Integrated analysis of genome-wide DNA methylation and gene expression profiles in molecular subtypes of breast cancer", NUCLEIC ACIDS RESEARCH, vol. 41, no. 18, 24 July 2013 (2013-07-24) - October 2013 (2013-10-01), pages 8464 - 8474, XP055598779, ISSN: 0305-1048, DOI: 10.1093/nar/gkt643 *
UEHIRO, N. ET AL.: "Circulating cell -free DNA-based epigenetic assay can detect early breast cancer", BREAST CANCER RES., vol. 18, no. 1, 129, December 2016 (2016-12-01), pages 1 - 14, XP055598797, ISSN: 1465-5411, DOI: 10.1186/s13058-016-0788-z *
UEHIRO, N. ET AL.: "Subtype specific DNA methylation in circulating DNA of metastatic breast cancer patients", THE BREAST, vol. 24, no. Suppl.1, P046, March 2015 (2015-03-01), pages S42, XP055598788, ISSN: 0960-9776, DOI: 10.1016/S0960-9776(15)70096-2 *
WALUK, DP. ET AL.: "Identification of glycine N-acyltransferase-like 2 (GLYATL2) as a transferase that produces N-acyl glycines in humans", FASEB J., vol. 24, no. 8, 2010, pages 2795 - 2803, XP002668782, ISSN: 0892-6638, DOI: doi:DOI:10.1096/FJ.09-148551 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021503943A (ja) * 2017-11-30 2021-02-15 マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチMayo Foundation for Medical Education and Research 乳癌の検出
JP7277460B2 (ja) 2017-11-30 2023-05-19 マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ 乳癌の検出
JP2021522814A (ja) * 2018-05-08 2021-09-02 タイペイ・メディカル・ユニバーシティTaipei Medical University 乳癌の早期予測のため、処置応答、再発および予後のモニタリングのための方法

Similar Documents

Publication Publication Date Title
US11473148B2 (en) Methods of diagnosing bladder cancer
EP2891720B1 (en) Method for screening cancer
US20110117551A1 (en) Detection and prognosis of lung cancer
JP2014036672A (ja) 新しい癌マーカー
US20230366034A1 (en) Compositions and methods for diagnosing lung cancers using gene expression profiles
US20150072947A1 (en) Gene biomarkers for prediction of susceptibility of ovarian neoplasms and/or prognosis or malignancy of ovarian cancers
WO2020063902A1 (zh) Hoxa7甲基化检测试剂
JP6395131B2 (ja) 肺癌に関する情報の取得方法、ならびに肺癌に関する情報を取得するためのマーカーおよびキット
JP2024020392A (ja) 特定の遺伝子のcpgメチル化変化を利用した肝癌診断用組成物およびその使用
WO2011036173A1 (en) Detection and prognosis of cervical cancer
TWI789551B (zh) Hoxa9甲基化檢測試劑在製備肺癌診斷試劑中的用途
US20220025466A1 (en) Differential methylation
WO2011112880A2 (en) Hypermethylation biomarkers for detection of head and neck squamous cell cancer
WO2014173905A2 (en) Methods and kits for prognosis of stage i nsclc by determining the methylation pattern of cpg dinucleotides
WO2016044142A1 (en) Bladder cancer detection and monitoring
JP2019135928A (ja) Mlh1メチル化群判定用マーカー及び判定方法
WO2017119510A1 (ja) 乳がんの診断のための検査方法、遺伝子マーカー、および検査薬
WO2020063898A1 (zh) Hoxa7甲基化检测试剂在制备肺癌诊断试剂中的用途
JP5602355B2 (ja) 癌患者の外科的手術後の治療選択方法及び予後診断
US20210079479A1 (en) Compostions and methods for diagnosing lung cancers using gene expression profiles
EP3368684A1 (en) Biomarker for breast cancer
TWI789550B (zh) Hoxa9甲基化檢測試劑
US20240093302A1 (en) Non-invasive cancer detection based on dna methylation changes
WO2024002165A1 (zh) 用于诊断胃癌的dna甲基化生物标记物、试剂盒及用途
US20220017967A1 (en) Molecular signature

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17736047

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17736047

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP