WO2022190752A1 - がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法 - Google Patents

がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法 Download PDF

Info

Publication number
WO2022190752A1
WO2022190752A1 PCT/JP2022/005142 JP2022005142W WO2022190752A1 WO 2022190752 A1 WO2022190752 A1 WO 2022190752A1 JP 2022005142 W JP2022005142 W JP 2022005142W WO 2022190752 A1 WO2022190752 A1 WO 2022190752A1
Authority
WO
WIPO (PCT)
Prior art keywords
cancer
types
cpg site
cpg
test reagent
Prior art date
Application number
PCT/JP2022/005142
Other languages
English (en)
French (fr)
Inventor
舞子 脇田
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2023505234A priority Critical patent/JPWO2022190752A1/ja
Priority to EP22766717.7A priority patent/EP4306656A1/en
Priority to CN202280019190.4A priority patent/CN116940693A/zh
Publication of WO2022190752A1 publication Critical patent/WO2022190752A1/ja
Priority to US18/457,634 priority patent/US20230399703A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Definitions

  • This disclosure relates to a cancer test reagent set, a cancer test reagent set manufacturing method, and a cancer test method.
  • Patent Literature 2 discloses a medical examination information management system that determines whether or not to perform a main medical examination based on the sensitivity and specificity of a preliminary medical examination.
  • DNA methylation analysis using DNA extracted from blood, urine or stool as a sample is attracting attention as a minimally invasive cancer test. It is known that DNA methylation or non-methylation occurs in association with the development of cancer, and that CpG sites where methylation or non-methylation occurs differ among cancer types. DNA methylation analysis is promising as a test method for specifying even the primary tumor of cancer. However, there are a huge number of CpG sites in the human genome, and there are CpG sites that are methylated or unmethylated in common in multiple types of cancers, making it difficult to distinguish between cancer types.
  • An object of the present disclosure is to provide a cancer test reagent set that increases the reliability of cancer tests, a method for manufacturing the cancer test reagent set, and a highly reliable cancer test method.
  • a cancer test reagent set containing the following primary test reagent and secondary test reagent containing the following primary test reagent and secondary test reagent.
  • Primary test reagent A reagent for analyzing the degree of methylation of CpG site set 1 selected for the purpose of testing n types of cancer. n is a natural number of 3 or more.
  • Secondary test reagents a set of 2 types of reagents for analyzing the degree of methylation of 2 types of CpG site sets 2 selected for the purpose of discriminating 2 types out of n types of cancer.
  • Secondary test reagents a set of 2 types of reagents for analyzing the degree of methylation of 2 types of CpG site sets 2 selected for the purpose of discriminating 2 types out of n types of cancer. However, in each of the two types of CpG site sets 2 , some or all of the CpG sites that make up the CpG site set 2 are CpG sites that are not included in the CpG site set 1 .
  • a method for manufacturing a cancer test reagent set containing a primary test reagent and a secondary test reagent the method for manufacturing a cancer test reagent set including the following (a) to (e).
  • n is a natural number of 3 or more.
  • a cancer test reagent set that increases the reliability of cancer tests, a method for manufacturing the cancer test reagent set, and a highly reliable cancer test method are provided.
  • process includes not only an independent process but also a process that cannot be clearly distinguished from other processes as long as the intended purpose of the process is achieved.
  • a numerical range indicated using “to” indicates a range including the numerical values before and after "to” as the minimum and maximum values, respectively.
  • the upper limit or lower limit of one numerical range may be replaced with the upper or lower limit of another numerical range described step by step.
  • the upper or lower limits of the numerical ranges may be replaced with the values shown in the examples.
  • sequencer is a term that includes first-generation sequencers (capillary sequencers), second-generation sequencers (next-generation sequencers), third-generation sequencers, fourth-generation sequencers, and sequencers to be developed in the future.
  • the sequencer may be a capillary sequencer, a next-generation sequencer, or any other sequencer.
  • a next-generation sequencer is preferable from the viewpoints of speed of analysis, a large number of samples that can be processed at one time, and the like.
  • a next generation sequencer refers to a sequencer classified as opposed to a capillary sequencer (called a first generation sequencer) using the Sanger method.
  • next-generation sequencers are sequencers based on the principle of determining base sequences by capturing fluorescence or luminescence associated with complementary strand synthesis by DNA polymerase or complementary strand binding by DNA ligase.
  • Specific examples include MiSeq (Illumina Inc., MiSeq is a registered trademark), HiSeq2000 (Illumina Inc., HiSeq is a registered trademark), Roche454 (Roche Inc.), and the like.
  • the cancer test reagent set of the present disclosure is a reagent set for analyzing the degree of methylation of DNA, and includes primary test reagents and secondary test reagents.
  • the primary test reagent is a reagent for analyzing the degree of methylation of CpG site set 1 selected for the purpose of testing n types of cancer.
  • n is a natural number of 3 or more.
  • the secondary test reagent is a set of 2 types of reagents for analyzing the degree of methylation of 2 types of CpG site set 2, each selected for the purpose of discriminating 2 types out of n types of cancer. is.
  • the cancer test reagent set of the present disclosure when the type of cancer cannot be identified by the primary test or when the reliability of the primary test is low, a secondary test is performed based on the results of the primary test. can identify the type of Therefore, according to the cancer test reagent set of the present disclosure, it is possible to increase the reliability of cancer tests.
  • the method of DNA methylation analysis adopted by the cancer test reagent set of the present disclosure includes all known methods.
  • Examples of embodiments of DNA methylation analysis include bisulfite sequencing, microarrays, methylation-specific PCR, and the like.
  • a summary of the bisulfite sequence is as follows. Treatment of DNA with a bisulfite reagent converts unmethylated cytosines to uracil, while methylated cytosines remain as cytosines. That is, bisulfite treatment converts the modification state of cytosine (unmethylated or methylated) into sequence information (uracil or cytosine) at that position. Next, DNA is amplified by PCR (polymerase chain reaction). Uracil is converted to thymine in this process. The sequence of the amplified product is then analyzed using a sequencer. Knowing the modification state (unmethylated or methylated) of cytosine at the target position in DNA by determining whether the base at the position to be analyzed is thymine or cytosine can be done.
  • the disadvantage of bisulfite sequencing is that it is difficult to design primers. This is because the base sequence of the CpG site after bisulfite treatment can be of two types, UG and CG. In addition, when many CpG sites are converted to uracil, the region composed of three bases other than cytosine becomes longer in the bisulfite-treated DNA, making it difficult to increase the specificity of the primer.
  • n is a natural number of 3 or more. Examples of embodiments of n include natural numbers from 3 to 16, more specifically 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 and 16. .
  • Cancers included in the n types of cancers may be cancers whose onset or progression is correlated with gene methylation or non-methylation.
  • a gene is a concept that also includes the transcriptional regulatory region of the gene.
  • Cancers included in the n types of cancer include, for example, colon cancer, pancreatic cancer, hepatocellular carcinoma, bile duct cancer, gallbladder cancer, ovarian cancer, breast cancer, lung cancer, esophageal cancer, gastric cancer, kidney cancer They are cell cancer, ureter cancer, bladder cancer, prostate cancer, cervical cancer, and endometrial cancer. From these groups, it is preferable to select n types of cancer. Combinations of cancers included in n types of cancers are not limited.
  • CpG site methylation degree A CpG site is a two-base sequence in which cytosine is followed by guanine. CpG sites are identified in this disclosure by the coordinates of GRCh37, the international reference sequence of the human genome (The Genome Reference Consortium Human Build 37).
  • the degree of methylation at a CpG site is a value calculated from a set of DNA fragments, and is calculated for each CpG site.
  • the degree of methylation at a certain CpG site is ⁇ the number of DNA fragments whose CpG site is methylated ⁇ (the number of DNA fragments whose CpG site is methylated + the number of DNA fragments whose CpG site is not methylated). ⁇ , expressed in percentage (%).
  • methylation of cytosine refers to addition of a methyl group to the 5-position carbon of the pyrimidine ring of cytosine.
  • CpG site set 1 is a CpG site set selected for the purpose of testing n types of cancer, and includes a plurality of CpG sites.
  • the number of CpG sites that make up CpG site set 1 is not limited. There is a tendency that the greater the number of CpG sites that constitute the CpG site set 1, the higher the accuracy in identifying the type of cancer.
  • the lower limit of the number of CpG sites constituting the CpG site set 1 is, for example, 30 or more, 40 or more, 50 or more, or 60 or more.
  • the upper limit of the number of CpG sites that make up the CpG site set 1 may be set from the viewpoint of the time or cost required for the primary inspection.
  • the upper limit of the number of CpG sites constituting the CpG site set 1 is, for example, 600 or less, 500 or less, 400 or less, 300 or less, 200 or less, or 100 or less.
  • the primary test reagent is a reagent designed to comprehensively analyze the degree of methylation of CpG site set 1.
  • An example of an embodiment of the primary test reagent includes primers specifically designed for all CpG sites that make up CpG site set 1 so that the CpG sites that make up CpG site set 1 can be amplified.
  • the primary test reagent should contain at least elements (eg, primers) specific to CpG site set 1 among the reagents necessary for DNA methylation analysis.
  • Primary test reagents may include all reagents required for DNA methylation analysis.
  • Primary test reagents may include instruments used for DNA methylation analysis.
  • the primary test reagent is, for example, a bisulfite sequencing reagent and contains a group of primers specific to CpG site set 1.
  • Primary test reagents may include all reagents required for all steps of bisulfite treatment, multiplex PCR and sequencing, one example embodiment includes bisulfite reagents, primers, probes, PCR reagents and sequencing reagents.
  • the bisulfite reagent, primers, probes, PCR reagents and sequencing reagents may each be commercially available or freshly prepared reagents.
  • CpG site set 2 is a CpG site set selected for each pair of n C 2 types extracted from n types of cancer. Therefore, the CpG site set 2 in the secondary test reagent is n C 2 types.
  • the two types of n C CpG site sets 2 are different from each other in at least some CpG sites.
  • the two types of n C CpG site sets 2 may or may not have the same number of CpG sites.
  • the morphology described below is a morphology common to two kinds of CpG site sets 2 of nC .
  • CpG site set 2 is a CpG site set selected for the purpose of discriminating two types of n types of cancer, and contains a plurality of CpG sites.
  • the number of CpG sites that make up CpG site set 2 is not limited. There is a tendency that the greater the number of CpG sites constituting the CpG site set 2, the higher the accuracy of specifying the type of cancer.
  • the lower limit of the number of CpG sites constituting the CpG site set 2 is, for example, 30 or more, 40 or more, 50 or more, or 60 or more.
  • the upper limit of the number of CpG sites that make up the CpG site set 2 may be set from the viewpoint of the time or cost required for the secondary inspection.
  • the upper limit of the number of CpG sites constituting the CpG site set 2 is, for example, 600 or less, 500 or less, 400 or less, 300 or less, 200 or less, or 100 or less.
  • the number of CpG sites that make up CpG site set 2 may be less or more than the number of CpG sites that make up CpG site set 1 .
  • At least part of the CpG sites that make up CpG site set 2 is preferably different from the CpG sites that make up CpG site set 1 . More preferably, all of the CpG sites that make up CpG site set 2 are different from the CpG sites that make up CpG site set 1 .
  • some or all of the CpG sites that make up the CpG site set 2 are CpG sites that are not included in the CpG site set 1 .
  • the secondary test reagent is a reagent designed to comprehensively analyze the degree of methylation of CpG site set 2.
  • a set of n C 2 reagents designed for each n C 2 CpG site set 2 is the secondary test reagent.
  • elements common to DNA methylation analysis regardless of the type of CpG site set may be shared between the two types of nC reagents.
  • elements common to DNA methylation analysis regardless of the type of CpG site set may be shared between primary and secondary test reagents.
  • An example of an embodiment of each of the two types of n C reagents that make up the secondary test reagents is a specific Includes strategically designed primers.
  • the secondary test reagent should contain at least elements (eg, primers) specific to CpG site set 2 among the reagents necessary for DNA methylation analysis.
  • Secondary test reagents may include all of the reagents required for DNA methylation analysis.
  • Secondary test reagents may include instruments used for DNA methylation analysis.
  • the secondary test reagent is, for example, a bisulfite sequencing reagent and contains a group of primers specific to CpG site set 2.
  • Secondary test reagents may include all reagents required for all steps of bisulfite treatment, multiplex PCR and sequencing, one example embodiment includes bisulfite reagents, primers, probes, PCR reagents and sequencing reagents.
  • the bisulfite reagent, primers, probes, PCR reagents and sequencing reagents may each be commercially available or freshly prepared reagents.
  • the method for manufacturing the cancer test reagent set of the present disclosure is suitable as a method for manufacturing the aforementioned cancer test reagent set.
  • a method for manufacturing a cancer test reagent set of the present disclosure manufactures a reagent set including a primary test reagent and a secondary test reagent.
  • the method for producing a cancer test reagent set of the present disclosure includes providing a primary test reagent with an element (for example, a primer) that specifically and comprehensively analyzes the degree of methylation of CpG site set 1;
  • an element for example, a primer
  • the following (a) to (e) are included for the purpose of providing the secondary test reagent with an element (eg, primer) that specifically and comprehensively analyzes the degree of methylation of .
  • step (a), (b), (c), (d) and (e) are referred to as step (a), step (b), step (c), step (d) and step (e), respectively.
  • the elements of the method for manufacturing the cancer test reagent set will be described in detail below.
  • Step (a) creates CpG site set P, which is the base of CpG site set 1 and CpG site set 2 .
  • the CpG site set P is a CpG site set consisting of CpG sites with a significant difference in the degree of methylation in at least one type of n types of cancer, and includes multiple CpG sites.
  • CpG site set P is created by, for example, comparing methylation degree data of n types of tumor tissue and normal tissue, and selecting CpG sites with a significant difference in methylation degree in at least one type of tumor tissue. do.
  • the CpG site set P is created, for example, by comparing the methylation degree data of n types of tumor tissue and normal tissue, and determining that at least one type of tumor tissue has a high methylation degree and normal tissue has a high degree of methylation. This is done by choosing low CpG sites.
  • a CpG site set P consisting of CpG sites highly methylated in at least one of the n cancers is created.
  • Methylation degree data of tumor tissue and normal tissue may be obtained by actually collecting tumor tissue from a cancer patient and performing DNA analysis, or may be obtained from a publicly available database. Open public databases include, for example, TCGA (The Cancer Genome Atlas).
  • the number of CpG sites that make up the CpG site set P is not limited. As the number of CpG sites constituting CpG site set P increases, the number of CpG sites constituting each of CpG site set 1 and CpG site set 2 increases, and the accuracy of identifying cancer types tends to increase. .
  • the lower limit of the number of CpG sites constituting the CpG site set P is, for example, 100 or more, 200 or more, 300 or more, 400 or more, or 500 or more.
  • the upper limit of the number of CpG sites that make up the CpG site set P may be set from the viewpoint of the time or cost required to select each of the CpG site set 1 and the CpG site set 2.
  • the upper limit of the number of CpG sites constituting the CpG site set P is, for example, 1000 or less, 900 or less, 800 or less, 700 or less, or 600 or less.
  • step (b) CpG sites included in CpG site set P are narrowed down to select CpG site set 1 .
  • CpG sites are narrowed down for selecting CpG site set 1, for example, by checking the following items. That is, it is possible to design primers, to amplify DNA by singleplex PCR using the designed primers, and to amplify DNA by multiplex PCR using the designed primers.
  • a known design program such as Primer Suite may be used, or an original design program may be used.
  • step (c) the CpG sites included in CpG site set P are narrowed down to select CpG site set 2 .
  • Selection of CpG site set 2 is performed for each pair of two types of n C extracted from n types of cancer.
  • the two types of n C CpG site sets 2 are different from each other in at least some CpG sites.
  • the two types of n C CpG site sets 2 may or may not have the same number of CpG sites.
  • the morphology described below is a morphology common to two kinds of CpG site sets 2 of nC .
  • CpG sites are narrowed down to select CpG site set 2, for example, by checking the following items. That is, there is a significant difference in the degree of methylation between the two types of cancer, it is possible to design primers, DNA is amplified by singleplex PCR using the designed primers, and the designed primers DNA is amplified in multiplex PCR using .
  • a known design program such as Primer Suite may be used, or an original design program may be used.
  • CpG site set 2 is selected from the CpG sites that constitute CpG site set P from the viewpoint of increasing the number of types of CpG sites that contribute to the identification of cancer types through primary and secondary tests. After excluding some or all of the CpG sites selected for the above, it is preferable to select CpG sites that constitute CpG site set 2 from the remaining CpG sites. As a result, CpG sites that are not targeted for analysis in the primary test are targeted for analysis in the secondary test, and the accuracy of cancer testing can be further improved.
  • steps (c-1) and (c-2), which are preferred forms of step (c), are listed.
  • Step (c-1) from the CpG sites that make up the CpG site set P exclude some or all of the CpG sites selected for the CpG site set 1, select some or all of the remaining CpG sites, n To generate n C 2 CpG site sets 2 for discriminating between 2 types of cancer, respectively.
  • Step (c-2) Selecting some or all of the CpG sites that constitute the CpG site set P and were not selected for the CpG site set 1, and discriminating two types among the n types of cancer To make n C two different CpG site sets 2, respectively.
  • step (d) a reagent for specifically and comprehensively analyzing the degree of methylation of CpG site set 1 is produced as a primary test reagent. Examples of embodiments of step (d) are given below.
  • Specific primers are prepared for every CpG site that makes up CpG site set 1.
  • the manufactured primers are contained in one container, and this is used as a primary test reagent.
  • the specific primer for each CpG site may be the primer designed in step (b) or a newly designed primer.
  • the step (d) may be a step of producing at least elements (eg, primers) specific to CpG site set 1 among reagents necessary for DNA methylation analysis.
  • Step (d) may be a step of manufacturing all reagents necessary for DNA methylation analysis.
  • step (e) a reagent for specifically and comprehensively analyzing the degree of methylation of CpG site set 2 is produced as a secondary test reagent.
  • Two nC reagents are prepared for each nC two CpG site set 2 , and the prepared two nC reagents are combined to form a secondary test reagent.
  • Specific primers are prepared for all CpG sites that make up CpG site set 2. At this time, primers are produced for each of the two types of nC CpG site set 2. The prepared primers are accommodated in one container for each of the n C 2 types of CpG site sets 2 , and the containers containing the n C 2 primers are collected and used as a secondary test reagent.
  • the primers specific for each CpG site may be the primers designed in step (c) or newly designed primers.
  • the step (e) may be a step of producing at least elements (eg, primers) specific to CpG site set 2 among reagents necessary for DNA methylation analysis.
  • Step (e) may be a step of manufacturing all reagents necessary for DNA methylation analysis.
  • the method of manufacturing the cancer test reagent set of the present disclosure includes forming a set of primary test reagents and secondary test reagents.
  • steps (a), (b) and (c) and the steps (d) and (e) there may be a large temporal or spatial gap compared to other steps.
  • steps (a), (b) and (c) are performed at a laboratory or research facility and steps (d) and (e) are performed at a manufacturing facility.
  • a subject for the cancer testing method of the present disclosure is a human.
  • the subject is, for example, a subject who voluntarily undergoes a health checkup, or a person who is suspected of having cancer at a medical institution.
  • the information obtained by the cancer examination method of the present disclosure is information that assists a doctor's diagnosis, the basis for the doctor or the subject to determine the necessity of a detailed examination (e.g., imaging test), the doctor's treatment method or therapeutic drug It is useful as a basis for selecting , motivation for subjects to improve their lifestyle habits, and the like.
  • the DNA which is the sample for the cancer testing method of the present disclosure, is obtained from the subject's biological sample.
  • the biological sample is preferably blood, urine, stool, saliva, cerebrospinal fluid, pericardial fluid, pleural fluid or ascites fluid, for example.
  • These biological samples are known to contain ctDNA (circulating tumor DNA) released from cancer cells or tumor cells, and are versatile biological samples for multiple types of cancers.
  • the biological sample is preferably blood, urine, stool, or saliva from the viewpoint of low invasiveness to the subject, and from the viewpoint that the concentration of ctDNA is relatively high and that it can contain ctDNA of many types of cancer, Blood is preferred.
  • blood refers to blood itself and blood diluted with physiological saline; stored blood obtained by adding additives such as glucose and anticoagulants to blood; fractions thereof (e.g., plasma and serum); and so on.
  • Extraction of DNA from a biological sample may be extraction of DNA from cells contained in the biological sample, or extraction of cell-free DNA (cfDNA) contained in the biological sample.
  • cfDNA cell-free DNA
  • the cancer test method of the present disclosure is a cancer test method using the cancer test reagent set of the present disclosure, and includes (1) to (3) below.
  • n is a natural number of 3 or more.
  • the cancer testing method of the present disclosure is a testing method that can test multiple types of cancer, and is a simple testing method that analyzes the degree of DNA methylation in both primary and secondary testing. According to the cancer examination method of the present disclosure, since the secondary examination is performed based on the examination result of the primary examination, highly reliable examination results can be obtained.
  • step (1), (2) and (3) are hereinafter referred to as step (1), step (2) and step (3), respectively.
  • step (3) The elements of the cancer screening method are described in detail below.
  • Step (1) is performed using primary test reagents on n types of cancers.
  • An embodiment example of the step (1) is given below, but the cancer examination method of the present disclosure is not limited to this.
  • cfDNA is extracted from the plasma.
  • a general DNA extraction reagent such as QIAamp Circulating Nucleic Acid (Qiagen) may be used. It is preferable to confirm by electrophoresis that the extracted cfDNA does not contain genomic DNA from leukocytes or the like.
  • the degree of methylation of CpG site set 1 is comprehensively analyzed using a primary test reagent.
  • a method for DNA methylation analysis is, for example, bisulfite sequencing. PCR of the bisulfite sequences is performed by multiplex PCR. NGS is preferably used for sequencing. Sequence information obtained by sequencing is analyzed using software capable of processing bisulfite converted sequences, such as Bismark.
  • a classifier that covers the degree of methylation of CpG site set 1 is prepared in advance, and the classifier and the subject This is achieved by matching with the examiner's methylation information. From the viewpoint of increasing the reliability of estimation, it is a preferable form to collate the subject's methylation information with multiple types of classifiers.
  • Inferring the type of cancer using a classifier can be implemented by machine learning.
  • machine learning include support vector machines, regression analysis using random forests, logistic regression analysis, neural networks, naive Bayes, and decision trees.
  • Classifiers are constructed, for example, from DNA methylation analysis data obtained from tumor tissues of multiple cancer patients, or from publicly available cancer DNA methylation information.
  • Step (2) is to determine whether or not a secondary test is necessary based on the results of the primary test, and if the secondary test is required, select two types of cancers detected in the primary test in descending order of accuracy. and selecting
  • step (2) An embodiment example of step (2) is given below, but the cancer examination method of the present disclosure is not limited to this.
  • a certainty threshold is set in advance for cancer type estimation by a classifier for primary examination. If the accuracy of cancer A is greater than or equal to the threshold and the accuracy of other cancers is less than the threshold, it is determined that the secondary examination is unnecessary and the subject is diagnosed with cancer A. . If the accuracy of cancer A is the highest but is above the threshold but is close to the threshold, and the accuracy of cancer B is the second highest and is below the threshold but is close to the threshold, it is determined that a secondary examination is necessary. Cancer A and cancer B are selected as inspection targets for the inspection. If the accuracies of all types of cancer are less than the threshold, it is determined that a secondary examination is necessary, and two types of cancer are selected in descending order of accuracy estimated by the classifier as examination targets for the secondary examination. If the accuracy of all types of cancer is less than the threshold and is far from the threshold, it is determined that a secondary test is unnecessary, and the subject is not affected by any of the n types of cancer I judge.
  • Step (3) is a secondary test for discriminating between two types of cancer, and is performed using a secondary test reagent.
  • a secondary test is a test to re-evaluate the two types of disease estimated to have the highest morbidity in the primary test.
  • the CpG site set 2 to be analyzed in the secondary examination is one of the two types of nC , and is the CpG site set 2 for discriminating the two types of cancer selected in step (2). Therefore, one type (reagent for CpG site set 2 to be analyzed) is selected from the two types of n C reagents included in the secondary test reagent and used for the secondary test.
  • step (3) An embodiment example of step (3) is given below, but the cancer examination method of the present disclosure is not limited to this.
  • a secondary test reagent is used to comprehensively analyze the methylation degree of one selected CpG site set 2.
  • the sample DNA may be DNA remaining in step (1) or DNA newly extracted from a biological sample of a subject.
  • a method for DNA methylation analysis is, for example, bisulfite sequencing.
  • PCR of the bisulfite sequences is performed by multiplex PCR.
  • NGS is preferably used for sequencing.
  • Sequence information obtained by sequencing is analyzed using software capable of processing bisulfite converted sequences, such as Bismark.
  • Estimating the type of cancer from the DNA methylation information of the subject is, for example, by preparing in advance a classifier covering the degree of methylation of the CpG site set 2 for each of the two types of CpG site set 2. This is achieved by matching the classifier with the subject's methylation information. From the viewpoint of increasing the reliability of estimation, it is a preferable form to collate the subject's methylation information with multiple types of classifiers.
  • the method of estimating the type of cancer using a classifier and the method of constructing a classifier are the same as in step (1).
  • a certainty threshold is set in advance for estimation of cancer type by a classifier for secondary examination. If the probability of cancer A is greater than or equal to the threshold and the probability of cancer B is less than the threshold, it is determined that the subject has cancer A. When the accuracy of cancer A is above the threshold but close to the threshold, and the accuracy of cancer B is below the threshold but close to the threshold, there is a possibility that the subject has cancer A and cancer B. Determine that there is. If the probabilities of both cancer A and cancer B are less than the threshold value and are far from the threshold value, it is determined that the subject does not have any of the n types of cancer.
  • Example 1 Manufacture of cancer test reagent set>
  • Step (a) Colorectal cancer, pancreatic cancer, hepatocellular carcinoma, bile duct cancer, and ovarian cancer were selected as examination targets. Extract the data of 937 samples from the public database of TCGA (The Cancer Genome Atlas), compare the methylation degree data of 5 types of cancer tumor tissue and normal tissue (including healthy cfDNA), at least 1 type Five hundred CpG sites with high methylation in tumor tissue and low methylation in normal tissue were selected. The 500 CpG sitesets selected are referred to as CpG siteset P-5.
  • Step (b) Primers were designed for all CpG sites that make up the CpG site set P-5.
  • Primer Suite which is software for designing primers for bisulfite multiplex PCR, was used for primer design.
  • the primers that could be designed the feasibility of DNA amplification in singleplex PCR was confirmed.
  • the primers that were able to amplify DNA in singleplex PCR whether or not DNA could be amplified in multiplex PCR in one tube was confirmed.
  • 61 CpG sites where DNA amplification could be confirmed by multiplex PCR were selected. The set of 61 CpG sites chosen is called CpG site sets 1-5.
  • CpG site sets 1-5 are shown in Table 1.
  • Table 1 The positions shown in Table 1 are the coordinates of GRCh37. If the CpG site is known to be contained in the transcription region or transcription regulatory region of a gene, the name of that gene is listed in the table.
  • Step (c) CpG site set 2 for discriminating two types of cancer among five types of cancer was selected for each combination of two types of cancer.
  • This CpG site set 2 is hereinafter referred to as CpG site set 2-5. Specifically, the following selection work was performed for each of the 10 types of CpG site sets 2-5.
  • CpG site sets 2-5 Exclude all CpG sites selected for CpG site set 1-5 from the CpG sites that constitute CpG site set P-5, use the remaining CpG sites as the population, and measure the degree of methylation between the two types of cancer CpG sites with significant differences and for which primer design was possible were selected. It was confirmed whether the CpG site primers were capable of DNA amplification in singleplex PCR. For the primers that were able to amplify DNA in singleplex PCR, whether or not DNA could be amplified in multiplex PCR in one tube was confirmed. CpG sites where DNA amplification was confirmed by multiplex PCR were selected as CpG site sets 2-5. CpG site sets 2-5 for each combination of two cancers are shown in Tables 2-11.
  • Tables 2 to 11 are positions on the coordinates of GRCh37. If the CpG site is known to be contained in the transcription region or transcription regulatory region of a gene, the name of that gene is listed in the table.
  • Step (d): Production of primer mix for primary inspection Each primer of 61 CpG sites constituting CpG site sets 1-5 was synthesized. Equal amounts of 100 ⁇ M of each primer were mixed in a single tube, and the mixture was diluted to 1 ⁇ M to give a primer mix. Each primer for each CpG site is the primer designed in step (b).
  • Example 2 Cancer test> [Creation of classifier for primary inspection] Random forest (RF) and support vector machine (SVM), which are machine learning models, were used to estimate the type of cancer. Read the data of 937 specimens used to extract the CpG site set P-5 as training data into the machine learning model, use the open source data mining software Orange (https://orangedatamining.com/), RF classification A classifier and an SVM classifier were created. The prepared classifiers were evaluated using Orange, and it was confirmed that all classifiers had a CA (Classification Accuracy) of 0.95 or higher.
  • CA Classification Accuracy
  • cfDNA extraction from plasma was performed using the QIAamp Circulating Nucleic Acid Kit (manufactured by QIAGEN) according to the standard protocol as follows. 200 ⁇ L of QIAGEN Proteinase K, 2 mL of plasma, and 1.6 mL of Buffer ACL were sequentially added to a 50 mL centrifugation tube, the lid was closed, and the mixture was pulse-vortexed for 30 seconds. It was then incubated at a temperature of 60°C for 30 minutes. Then, 3.6 mL of Buffer ACB was added, the lid was closed, and mixed by pulse vortexing for 15 to 30 seconds.
  • PCR was carried out for 40 cycles of 3 steps of 94° C./2 minutes for 1 cycle, 98° C./10 seconds, 58° C./30 seconds and 68° C./15 seconds.
  • the amplification reaction solution was purified using AMPure XP (manufactured by BECMAN COULTER), and the purified DNA was collected in 40 ⁇ L of Tris-EDTA buffer.
  • DNA was amplified by index-added PCR using the recovered DNA and general primers used for index-added PCR.
  • Index-added PCR was performed using Multiplex PCR Assay Kit (manufactured by Takara Bio Inc.). A reaction solution was prepared with 1 ⁇ L each of 1.25 ⁇ M primers, 0.125 ⁇ L of Multiplex PCR Mix1, 12.5 ⁇ L of Multiplex PCR Mix2, and water to a final volume of 25 ⁇ L.
  • PCR 1 cycle of 94°C/3 minutes, 5 cycles of 3 steps of 94°C/45 seconds, 50°C/60 seconds, 72°C/30 seconds, 94°C/45 seconds, 55°C/60 seconds, 72°C 11 cycles of 3 steps of /30 seconds were performed.
  • the resulting PCR product was purified using AMPure XP Kit (manufactured by BECMAN COULTER).
  • the DNA concentration after purification was quantified using BioAnalyzer (manufactured by Agilent Technologies), and more accurately quantified using KAPA Library Quantification Kit (manufactured by KAPA Biosystems).
  • the purified DNA was used as a sample and sequenced using Miseq Reagent Kit v2 300 Cycle (manufactured by Illumina). Information on the degree of methylation of 61 CpG sites was obtained by mapping the resulting FastQ file to the human genome sequence using Bismark.
  • the information on the degree of methylation for each of sample A and sample B was evaluated using the primary inspection RF classifier and SVM classifier. The results are shown in Table 12.
  • the numerical values in Table 12 are the contribution ratios (numerical values between 0 and 1) output by the data mining software Orange, and were taken as the accuracy. An accuracy of 0.5 was used as the threshold.
  • sample A- Colorectal cancer was estimated to be first in both the RF classifier and the SVM classifier, and the accuracy of the estimated first place in both the RF classifier and the SVM classifier was 0.5 or more.
  • sample A it was determined that the secondary examination was unnecessary, and it was determined to be colorectal cancer only by the primary examination.
  • Colorectal cancer was estimated to be first in both the RF classifier and the SVM classifier, and the accuracy of the estimated first place in both the RF classifier and the SVM classifier was 0.5 or higher.
  • Sample B was determined to be colon cancer.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

がん検査の信頼度を上げるがん検査試薬セット及びがん検査試薬セットの製造方法、並びに、信頼度の高いがん検査方法を提供する。がん検査試薬セットは、n種類のがんを検査するための一次検査試薬と、n種類のがんの中の2種類を判別するための二次検査試薬とを含む。がん検査試薬セットの製造方法は、n種類のがんを検査するためのCpGサイトセット1を選ぶことと、n種類のがんの中の2種類を判別するためのCpGサイトセット2を選ぶこととを含む。がん検査方法は、一次検査によって検出されたがんの中から確度の高い2種類のがんを選択し、二次検査によって2種類のがんを判別する。

Description

がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法
 本開示は、がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法に関する。
 特許文献1には、癌を有すると考えられる個体から得た試料に含まれる染色体分節の倍数性を決定する方法であって、個体の腫瘍細胞にコピー数多様性が存在するかを決定することを含む方法が開示されている。
 特許文献2には、予備検診の感度及び特異度に基づき本検診の実施の判定を行う検診情報管理システムが開示されている。
特開2020-096601号公報 特開2009-009396号公報
 がんの早期発見は予後を良好にする。しかし、早期発見は簡単ではない。早期発見の難しさはがんの種類によって異なり、例えば、膵がん又は肝細胞がんについては、侵襲性の低い既存のスクリーニング検査は未だ精度が低く、大腸がん又は肺がんについては、推奨される検査があるが、被検者の拘束時間、経済的負担又は身体的負荷が大きく、検査の受診率が低い。したがって、精度が高くしかも被検者の負担の小さいがん検査が待たれている。
 血液、尿又は便から抽出したDNAを試料にしたDNAメチル化解析が、低侵襲ながん検査として注目されている。がんの発生に関連してDNAのメチル化又は非メチル化が生じることと、メチル化又は非メチル化が生じるCpGサイトががん種間で異なることが知られている。DNAメチル化解析は、がんの原発巣まで特定する検査方法として有望である。ただし、ヒトゲノムには膨大な数のCpGサイトがあり、また、メチル化又は非メチル化が複数種類のがんに共通するCpGサイトがあり、がんの種類を判別することが難しいことがある。
 本開示は、上記状況のもとになされた。
 本開示は、がん検査の信頼度を上げるがん検査試薬セット及びがん検査試薬セットの製造方法、並びに、信頼度の高いがん検査方法を提供することを課題とする。
 上記の課題を解決するための具体的手段には、下記の態様が含まれる。
<1> 下記の一次検査試薬と二次検査試薬とを含むがん検査試薬セット。
 一次検査試薬:n種類のがんを検査する目的で選ばれたCpGサイトセット1のメチル化度を解析する試薬。nは3以上の自然数である。
 二次検査試薬:n種類のがんの中の2種類を判別する目的でそれぞれ選ばれた種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬のセット。<2> 二次検査試薬が下記の二次検査試薬である、<1>に記載のがん検査試薬セット。
 二次検査試薬:n種類のがんの中の2種類を判別する目的でそれぞれ選ばれた種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬のセット。ただし、種類のCpGサイトセット2それぞれにおいて、CpGサイトセット2を構成するCpGサイトの一部又は全部が、CpGサイトセット1に含まれないCpGサイトである。
<3> 一次検査試薬と二次検査試薬とを含むがん検査試薬セットの製造方法であって、下記の(a)~(e)を含むがん検査試薬セットの製造方法。
(a)n種類のがんの少なくとも1種類においてメチル化度に有意な差があるCpGサイトからなるCpGサイトセットPを作ること。nは3以上の自然数である。
(b)CpGサイトセットPを構成するCpGサイトの一部を選んでCpGサイトセット1を作ること。
(c)CpGサイトセットPを構成するCpGサイトの一部を選んで、n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
(d)CpGサイトセット1のメチル化度を解析する試薬を製造し、一次検査試薬を成すこと。
(e)種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬を製造し、二次検査試薬を成すこと。
<4> (c)が下記の(c-1)である、<3>に記載のがん検査試薬セットの製造方法。
(c-1)CpGサイトセットPを構成するCpGサイトから、CpGサイトセット1に選ばれたCpGサイトの一部又は全部を除外し、残りのCpGサイトの一部又は全部を選んで、n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
<5> <1>又は<2>に記載のがん検査試薬セットを用いるがん検査方法であって、下記の(1)~(3)を含むがん検査方法。
(1)一次検査試薬を用いてn種類のがんを検査する一次検査。nは3以上の自然数である。
(2)一次検査の結果に基づき二次検査の要否を判定すること、及び、二次検査を要する場合に一次検査において検出されたがんの中から確度の高い順に2種類のがんを選択すること。
(3)二次検査試薬を用いて2種類のがんを判別する二次検査。
 本開示によれば、がん検査の信頼度を上げるがん検査試薬セット及びがん検査試薬セットの製造方法、並びに、信頼度の高いがん検査方法が提供される。
 以下に、本開示の実施形態について説明する。以下の説明及び実施例は実施形態を例示するものであり、実施形態の範囲を制限するものではない。
 本開示において「工程」との語は、独立した工程だけでなく、他の工程と明確に区別できない場合であってもその工程の所期の目的が達成されれば、本用語に含まれる。
 本開示において「~」を用いて示された数値範囲は、「~」の前後に記載される数値をそれぞれ最小値及び最大値として含む範囲を示す。
 本開示中に段階的に記載されている数値範囲において、一つの数値範囲で記載された上限値又は下限値は、他の段階的な記載の数値範囲の上限値又は下限値に置き換えてもよい。また、本開示中に記載されている数値範囲において、その数値範囲の上限値又は下限値は、実施例に示されている値に置き換えてもよい。
 本開示において「シーケンサー」は、第一世代シーケンサー(キャピラリーシーケンサー)、第二世代シーケンサー(次世代シーケンサー)、第三世代シーケンサー、第四世代シーケンサー、及び今後開発されるシーケンサーを含む用語である。シーケンサーは、キャピラリーシーケンサーでもよく、次世代シーケンサーでもよく、その他のシーケンサーでもよい。シーケンサーとしては、解析の速さ、1度に処理可能な試料数の多さ等の観点から、次世代シーケンサーが好ましい。次世代シーケンサー(next generation sequencer,NGS)とは、サンガー法を利用したキャピラリーシーケンサー(第一世代シーケンサーと呼ばれる。)に対比して分類されるシーケンサーを指す。現時点で最も普及している次世代シーケンサーは、DNAポリメラーゼによる相補鎖合成又はDNAリガーゼによる相補鎖結合に連動した蛍光又は発光をとらえ塩基配列を決定する原理のシーケンサーである。具体的には、MiSeq(Illumina社、MiSeqは登録商標)、HiSeq2000(Illumina社、HiSeqは登録商標)、Roche454(Roche社)等が挙げられる。
<がん検査試薬セット>
 本開示のがん検査試薬セットは、DNAのメチル化度を解析する試薬セットであり、一次検査試薬と二次検査試薬とを含む。
 一次検査試薬は、n種類のがんを検査する目的で選ばれたCpGサイトセット1のメチル化度を解析する試薬である。nは3以上の自然数である。
 二次検査試薬は、n種類のがんの中の2種類を判別する目的でそれぞれ選ばれた種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬のセットである。
 本開示のがん検査試薬セットによれば、一次検査によってがんの種類を特定できなかったとき又は一次検査の信頼度が低いとき、一次検査の結果を基にして二次検査を行ってがんの種類を特定することができる。したがって、本開示のがん検査試薬セットによれば、がん検査の信頼度を上げることができる。
 本開示のがん検査試薬セットが採用するDNAメチル化解析の方法としては、公知のあらゆる方法が挙げられる。DNAメチル化解析の実施形態例として、バイサルファイトシーケンス、マイクロアレイ、メチル化特異的PCR等が挙げられる。
 バイサルファイトシーケンスの概要は下記のとおりである。
 DNAをバイサルファイト試薬で処理すると、非メチル化シトシンがウラシルへと変換される一方、メチル化シトシンはシトシンとして残存する。つまり、バイサルファイト処理により、シトシンの修飾状態(メチル化されていない、又は、メチル化されている)は、その位置の配列情報(ウラシル又はシトシン)に変換される。次いで、PCR(polymerase chain reaction)によってDNAの増幅を行う。この過程でウラシルはチミンへと変換される。次いで、増幅産物の配列をシーケンサーを用いて解析する。解析対象の位置の塩基がチミン又はシトシンのいずれであるかを決定することにより、DNA中の目的の位置のシトシンの修飾状態(メチル化されていない、又は、メチル化されている)を知ることができる。
 ただし、バイサルファイトシーケンスは、プライマーの設計が難しいことが難点である。なぜなら、バイサルファイト処理後のCpGサイトの塩基配列はUGとCGの2通りあり得る。また、数多くのCpGサイトがウラシルへ変換された場合はバイサルファイト処理後のDNAはシトシン以外の3塩基で構成される領域が長くなり、プライマーの特異度を上げることが難しい。
 したがって、バイサルファイトシーケンスは、プライマー設計の難しさから同時に計測可能な領域数に限りがあり、複数種類の候補の中から1種類のがんを特定する検査において、十分な信頼度を担保できない場合がありうる。
 これに対して、本開示のがん検査試薬セットによれば、バイサルファイトシーケンスを試薬セットのDNAメチル化解析方法に採用しても、一次検査の検査結果を基にして二次検査を行うゆえ、がん検査の信頼度を上げることができる。
 以下、がん検査試薬セットの要素を詳細に説明する。
[n種類のがん]
 nは3以上の自然数である。nの実施形態例として、3以上16以下の自然数、より具体的には、3、4、5、6、7、8、9、10、11、12、13、14、15及び16が挙げられる。
 n種類のがんに含まれるがんは、発症又は進行が遺伝子のメチル化又は非メチル化と相関するがんであればよい。本開示において遺伝子とは、その遺伝子の転写調節領域をも含む概念である。
 n種類のがんに含まれるがんは、例えば、大腸がん、膵がん、肝細胞がん、胆管がん、胆のうがん、卵巣がん、乳がん、肺がん、食道がん、胃がん、腎細胞がん、尿管がん、膀胱がん、前立腺がん、子宮頸がん、子宮体がんである。これらの群から、n種類のがんを選択することが好ましい。n種類のがんに含まれるがんの組合せは、制限されない。
[CpGサイトのメチル化度]
 CpGサイトとは、シトシンの次にグアニンが現れる2塩基配列である。
 本開示においてCpGサイトは、ヒトゲノムの国際参照配列であるGRCh37(The Genome Reference Consortium Human Build 37)の座標によって特定される。
 CpGサイトのメチル化度は、DNA断片の集合から算出される値であり、CpGサイトごとに算出される。あるCpGサイトのメチル化度は、{そのCpGサイトがメチル化されているDNA断片数÷(そのCpGサイトがメチル化されているDNA断片数+そのCpGサイトがメチル化されていないDNA断片数)}であり、百分率(%)で表す。
 本開示においてシトシンのメチル化とは、シトシンのピリミジン環5位の炭素にメチル基が付加することを指す。
[CpGサイトセット1]
 CpGサイトセット1は、n種類のがんを検査する目的で選ばれたCpGサイトセットであり、複数個のCpGサイトを含む。
 CpGサイトセット1を構成するCpGサイトの個数は制限されない。CpGサイトセット1を構成するCpGサイトの個数が多いほど、がんの種類を特定する精度が高くなる傾向がある。CpGサイトセット1を構成するCpGサイトの個数の下限は、例えば、30個以上、40個以上、50個以上、60個以上である。
 CpGサイトセット1を構成するCpGサイトの個数の上限は、一次検査に要する時間又は費用の観点から設定してよい。CpGサイトセット1を構成するCpGサイトの個数の上限は、例えば、600個以下、500個以下、400個以下、300個以下、200個以下、100個以下である。
[一次検査試薬]
 一次検査試薬は、CpGサイトセット1のメチル化度を網羅的に解析できるように設計された試薬である。
 一次検査試薬の実施形態の一例は、CpGサイトセット1を構成するCpGサイトを増幅できるように、CpGサイトセット1を構成するすべてのCpGサイトごとに特異的に設計されたプライマーを含む。
 一次検査試薬は、DNAメチル化解析に必要な試薬のうち少なくともCpGサイトセット1に特異的な要素(例えばプライマー)を含んでいればよい。一次検査試薬は、DNAメチル化解析に必要な試薬全部を含んでもよい。一次検査試薬は、DNAメチル化解析に用いられる器具を含んでもよい。
 一次検査試薬は、例えば、バイサルファイトシーケンス用試薬であり、CpGサイトセット1に特異的なプライマー群を含む。一次検査試薬は、バイサルファイト処理、マルチプレックスPCR及びシーケンスの全工程に必要な試薬全部を含んでもよく、実施形態の一例は、バイサルファイト試薬、プライマー、プローブ、PCR試薬及びシーケンス試薬を含む。バイサルファイト試薬、プライマー、プローブ、PCR試薬及びシーケンス試薬はそれぞれ、市販品でもよく、新たに調製した試薬でもよい。
[CpGサイトセット2]
 CpGサイトセット2は、n種類のがんから2種類取り出した種類の対ごとに選ばれたCpGサイトセットである。したがって、二次検査試薬におけるCpGサイトセット2は種類である。種類のCpGサイトセット2は互いに少なくとも一部のCpGサイトが異なる。種類のCpGサイトセット2は互いにCpGサイトの個数が同じでもよく異なっていてもよい。
 以下に説明する形態は、種類のCpGサイトセット2に共通する形態である。
 CpGサイトセット2は、n種類のがんの中の2種類を判別する目的で選ばれたCpGサイトセットであり、複数個のCpGサイトを含む。
 CpGサイトセット2を構成するCpGサイトの個数は制限されない。CpGサイトセット2を構成するCpGサイトの個数が多いほど、がんの種類を特定する精度が高くなる傾向がある。CpGサイトセット2を構成するCpGサイトの個数の下限は、例えば、30個以上、40個以上、50個以上、60個以上である。
 CpGサイトセット2を構成するCpGサイトの個数の上限は、二次検査に要する時間又は費用の観点から設定してよい。CpGサイトセット2を構成するCpGサイトの個数の上限は、例えば、600個以下、500個以下、400個以下、300個以下、200個以下、100個以下である。
 CpGサイトセット2を構成するCpGサイトの個数は、CpGサイトセット1を構成するCpGサイトの個数より少なくてもよく多くてもよい。
 CpGサイトセット2を構成するCpGサイトは、その少なくとも一部が、CpGサイトセット1を構成するCpGサイトと異なることが好ましい。
 CpGサイトセット2を構成するCpGサイトは、その全部が、CpGサイトセット1を構成するCpGサイトと異なることがより好ましい。
 上記の形態であると、一次検査及び二次検査を通じてがんの種類の特定に寄与するCpGサイトの種類数が多くなり、がんの種類を特定する精度を上げることができる。
 上記の観点から、二次検査試薬の好ましい形態を挙げる。
 n種類のがんの中の2種類を判別する目的でそれぞれ選ばれた種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬のセット。ただし、種類のCpGサイトセット2それぞれにおいて、CpGサイトセット2を構成するCpGサイトの一部又は全部が、CpGサイトセット1に含まれないCpGサイトである。
[二次検査試薬]
 二次検査試薬は、CpGサイトセット2のメチル化度を網羅的に解析できるように設計された試薬である。種類のCpGサイトセット2ごとに設計された種類の試薬のセットが二次検査試薬である。ただし、CpGサイトセットの種類によらずDNAメチル化解析に共通する要素は、種類の試薬の間で共有されてよい。また、CpGサイトセットの種類によらずDNAメチル化解析に共通する要素は、一次検査試薬と二次検査試薬との間で共有されてよい。
 二次検査試薬を構成する種類の試薬それぞれの実施形態の一例は、CpGサイトセット2を構成するCpGサイトを増幅できるように、CpGサイトセット2を構成するすべてのCpGサイトごとに特異的に設計されたプライマーを含む。
 二次検査試薬は、DNAメチル化解析に必要な試薬のうち少なくともCpGサイトセット2に特異的な要素(例えばプライマー)を含んでいればよい。二次検査試薬は、DNAメチル化解析に必要な試薬全部を含んでもよい。二次検査試薬は、DNAメチル化解析に用いられる器具を含んでもよい。
 二次検査試薬は、例えば、バイサルファイトシーケンス用試薬であり、CpGサイトセット2に特異的なプライマー群を含む。二次検査試薬は、バイサルファイト処理、マルチプレックスPCR及びシーケンスの全工程に必要な試薬全部を含んでもよく、実施形態の一例は、バイサルファイト試薬、プライマー、プローブ、PCR試薬及びシーケンス試薬を含む。バイサルファイト試薬、プライマー、プローブ、PCR試薬及びシーケンス試薬はそれぞれ、市販品でもよく、新たに調製した試薬でもよい。
<がん検査試薬セットの製造方法>
 本開示のがん検査試薬セットの製造方法は、先述のがん検査試薬セットを製造する方法として好適である。
 本開示のがん検査試薬セットの製造方法は、一次検査試薬と二次検査試薬とを含む試薬セットを製造する。
 本開示のがん検査試薬セットの製造方法は、CpGサイトセット1のメチル化度を特異的に且つ網羅的に解析する要素(例えばプライマー)を一次検査試薬に具備させることと、CpGサイトセット2のメチル化度を特異的に且つ網羅的に解析する要素(例えばプライマー)を二次検査試薬に具備させることとを目的に、下記の(a)~(e)を含む。
(a)n種類のがんの少なくとも1種類においてメチル化度に有意な差があるCpGサイトからなるCpGサイトセットPを作ること。nは3以上の自然数である。
(b)CpGサイトセットPを構成するCpGサイトの一部を選んでCpGサイトセット1を作ること。
(c)CpGサイトセットPを構成するCpGサイトの一部を選んで、n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
(d)CpGサイトセット1のメチル化度を解析する試薬を製造し、一次検査試薬を成すこと。
(e)種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬を製造し、二次検査試薬を成すこと。
 以下、(a)、(b)、(c)、(d)及び(e)をそれぞれ、工程(a)、工程(b)、工程(c)、工程(d)及び工程(e)という。以下、がん検査試薬セットの製造方法の要素を詳細に説明する。
[工程(a)]
 工程(a)は、CpGサイトセット1及びCpGサイトセット2の母体となるCpGサイトセットPを作成する。
 CpGサイトセットPは、n種類のがんの少なくとも1種類においてメチル化度に有意な差があるCpGサイトからなるCpGサイトセットであり、複数個のCpGサイトを含む。
 CpGサイトセットPの作成は、例えば、n種類の腫瘍組織及び正常組織のメチル化度データを比較し、少なくとも1種類の腫瘍組織においてメチル化度に有意な差があるCpGサイトを選ぶことで実施する。
 ほかに、CpGサイトセットPの作成は、例えば、n種類の腫瘍組織及び正常組織のメチル化度データを比較し、少なくとも1種類の腫瘍組織においてメチル化度が高く且つ正常組織においてメチル化度が低いCpGサイトを選ぶことで実施する。言い換えると、n種類のがんの少なくとも1種類においてメチル化度が高いCpGサイトからなるCpGサイトセットPを作る。
 腫瘍組織及び正常組織のメチル化度データは、現実にがん患者から腫瘍組織を採取してDNA解析をして得てもよく、公開されているデータベースから取得してもよい。公開されている公共データベースとしては、例えば、TCGA(The Cancer Genome Atlas)が挙げられる。
 CpGサイトセットPを構成するCpGサイトの個数は制限されない。CpGサイトセットPを構成するCpGサイトの個数が多いほど、CpGサイトセット1及びCpGサイトセット2それぞれを構成するCpGサイトの個数が多くなり、がんの種類を特定する精度が高くなる傾向がある。CpGサイトセットPを構成するCpGサイトの個数の下限は、例えば、100個以上、200個以上、300個以上、400個以上、500個以上である。
 CpGサイトセットPを構成するCpGサイトの個数の上限は、CpGサイトセット1及びCpGサイトセット2それぞれの選定に要する時間又は費用の観点から設定してよい。CpGサイトセットPを構成するCpGサイトの個数の上限は、例えば、1000個以下、900個以下、800個以下、700個以下、600個以下である。
[工程(b)]
 工程(b)は、CpGサイトセットPに含まれるCpGサイトを絞り込んでCpGサイトセット1を選定する。
 CpGサイトセット1を選定するためのCpGサイトの絞り込みは、例えば、下記の事項を確認することによって行われる。
 すなわち、プライマーの設計が可能であること、設計したプライマーを用いてシングルプレックスPCRでDNAが増幅されること、設計したプライマーを用いてマルチプレックスPCRでDNAが増幅されること、である。
 プライマーの設計には、Primer Suite等の公知の設計プログラムを用いてもよく、独自の設計プログラムを用いてもよい。
[工程(c)]
 工程(c)は、CpGサイトセットPに含まれるCpGサイトを絞り込んでCpGサイトセット2を選定する。CpGサイトセット2の選定は、n種類のがんから2種類取り出した種類の対ごとに行う。種類のCpGサイトセット2は互いに少なくとも一部のCpGサイトが異なる。種類のCpGサイトセット2は互いにCpGサイトの個数が同じでもよく異なっていてもよい。
 以下に説明する形態は、種類のCpGサイトセット2に共通する形態である。
 CpGサイトセット2を選定するためのCpGサイトの絞り込みは、例えば、下記の事項を確認することによって行われる。
 すなわち、2種類のがんの間でメチル化度に有意な差があること、プライマーの設計が可能であること、設計したプライマーを用いてシングルプレックスPCRでDNAが増幅されること、設計したプライマーを用いてマルチプレックスPCRでDNAが増幅されること、である。
 プライマーの設計には、Primer Suite等の公知の設計プログラムを用いてもよく、独自の設計プログラムを用いてもよい。
 CpGサイトセット2の選定は、一次検査及び二次検査を通じてがんの種類の特定に寄与するCpGサイトの種類数を多くする観点から、CpGサイトセットPを構成するCpGサイトから、CpGサイトセット1に選ばれたCpGサイトの一部又は全部を除外したのち、残りのCpGサイトから、CpGサイトセット2を構成するCpGサイトを選ぶことが好ましい。このことによって、一次検査における解析対象にならないCpGサイトが二次検査において解析対象となり、がん検査の精度をより上げることができる。
 上記の観点から工程(c)の好ましい形態である工程(c-1)及び工程(c-2)を挙げる。
工程(c-1)CpGサイトセットPを構成するCpGサイトから、CpGサイトセット1に選ばれたCpGサイトの一部又は全部を除外し、残りのCpGサイトの一部又は全部を選んで、n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
工程(c-2)CpGサイトセットPを構成するCpGサイトであってCpGサイトセット1に選ばれなかったCpGサイトの一部又は全部を選んで、n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
[工程(d)]
 工程(d)は、一次検査試薬として、CpGサイトセット1のメチル化度を特異的に且つ網羅的に解析する試薬を製造する。
 以下に、工程(d)の実施形態例を挙げる。
 CpGサイトセット1を構成するすべてのCpGサイトごとに特異的なプライマーを製造する。製造したプライマーを1つの容器に収容し、これを一次検査試薬とする。
 CpGサイトごとの特異的なプライマーは、工程(b)において設計したプライマーでもよく、新たに設計したプライマーでもよい。
 工程(d)は、DNAメチル化解析に必要な試薬のうち少なくともCpGサイトセット1に特異的な要素(例えばプライマー)を製造する工程であってよい。工程(d)は、DNAメチル化解析に必要な試薬全部を製造する工程であってもよい。
[工程(e)]
 工程(e)は、二次検査試薬として、CpGサイトセット2のメチル化度を特異的に且つ網羅的に解析する試薬を製造する。種類のCpGサイトセット2ごとの種類の試薬を製造し、製造した種類の試薬をセットにして二次検査試薬を成す。
 以下に、工程(e)の実施形態例を挙げる。
 CpGサイトセット2を構成するすべてのCpGサイトごとに特異的なプライマーを製造する。この際、種類のCpGサイトセット2ごとにプライマーを製造する。製造したプライマーを種類のCpGサイトセット2ごとに、それぞれ1つの容器に収容し、個のプライマー入り容器を集めて二次検査試薬とする。
 CpGサイトごとの特異的なプライマーは、工程(c)において設計したプライマーでもよく、新たに設計したプライマーでもよい。
 工程(e)は、DNAメチル化解析に必要な試薬のうち少なくともCpGサイトセット2に特異的な要素(例えばプライマー)を製造する工程であってよい。工程(e)は、DNAメチル化解析に必要な試薬全部を製造する工程であってもよい。
 本開示のがん検査試薬セットの製造方法は、一次検査試薬と二次検査試薬とをセット化することを含む。
 工程(a)、工程(b)及び工程(c)と、工程(d)及び工程(e)との間は、ほかの工程間に比べて、時間的な又は空間的な隔たりが大きい場合がある。その例として、工程(a)、工程(b)及び工程(c)を実験施設又は研究施設において行い、工程(d)及び工程(e)を製造施設において行う実施形態が挙げられる。
<がん検査方法>
 本開示のがん検査方法の被検者は、ヒトである。被検者は、例えば、自らの意思で行う健康診断の受診者、医療機関においてがんを疑われた者である。
 本開示のがん検査方法によって得られた情報は、医師の診断を補助する情報、医師又は被検者が精密検査(例えば画像検査)の要否を判断する根拠、医師が治療方法又は治療薬を選択する根拠、被検者が生活習慣を改善する動機付けなどとして有用である。
 本開示のがん検査方法の試料であるDNAは、被検者の生体試料から得る。生体試料は、例えば、血液、尿、便、唾液、脳脊髄液、心嚢水、胸水又は腹水が好ましい。これらの生体試料にはがん細胞又は腫瘍細胞から放出されたctDNA(circulating tumor DNA)が存在することが知られており、複数種類のがんに汎用性のある生体試料である。生体試料としては、被検者への侵襲性が低い観点から、血液、尿、便又は唾液が好ましく、ctDNAの濃度が比較的高い観点及び多種類のがんのctDNAを含み得るという観点から、血液が好ましい。
 本開示において血液は、血液そのもの、及び、生理食塩水で希釈した血液;血液にグルコース、抗血液凝固剤等の添加剤を加えた保存血液;これらの分画物(例えば、血漿、血清);などを含む。
 生体試料からDNAを抽出することは、生体試料に含まれる細胞からDNAを抽出することでもよく、生体試料に含まれるセルフリーDNA(cfDNA)を抽出することでもよい。
 本開示のがん検査方法は、本開示のがん検査試薬セットを用いるがん検査方法であり、下記の(1)~(3)を含む。
(1)一次検査試薬を用いてn種類のがんを検査する一次検査。nは3以上の自然数である。
(2)一次検査の結果に基づき二次検査の要否を判定すること、及び、二次検査を要する場合に一次検査において検出されたがんの中から確度の高い順に2種類のがんを選択すること。
(3)二次検査試薬を用いて2種類のがんを判別する二次検査。
 本開示のがん検査方法は、複数種類のがんを検査できる検査方法であり、また、一次検査及び二次検査ともにDNAのメチル化度を解析する簡便な検査方法である。本開示のがん検査方法によれば、一次検査の検査結果を基にして二次検査を行うゆえ、信頼度の高い検査結果を得ることができる。
 以下、(1)、(2)及び(3)をそれぞれ、工程(1)、工程(2)及び工程(3)という。以下、がん検査方法の要素を詳細に説明する。
[工程(1)]
 工程(1)は、n種類のがんを検査対象にし、一次検査試薬を用いて行う。
 以下に、工程(1)の実施形態例を挙げるが、本開示のがん検査方法はこれに限定されるものではない。
 被検者の血液を採取し、血漿を分離し、血漿からcfDNAを抽出する。cfDNAの抽出にはQIAamp Circulating Nucleic Acid(Qiagen社)等の一般的なDNA抽出試薬を用いてよい。抽出したcfDNAに白血球等からのゲノムDNAの混入がないことを、電気泳動法で確認することが好ましい。
 抽出したDNAを試料にして、一次検査試薬を用いて、CpGサイトセット1のメチル化度を網羅的に解析する。
 DNAメチル化解析の方法は、例えば、バイサルファイトシーケンスである。バイサルファイトシーケンスのPCRは、マルチプレックスPCRで行う。シーケンスには、NGSを用いることが好ましい。シーケンスにより得られた配列情報を、Bismark等のバイサルファイト変換配列を処理可能なソフトウェアを用いて解析する。
 被検者のDNAメチル化情報からがんの存否及びがんの種類を推定することは、例えば、CpGサイトセット1のメチル化度を網羅した分類器を予め用意しておき、分類器と被検者のメチル化情報とを照合することによって実現される。推定の信頼度を上げる観点から、被検者のメチル化情報を複数種類の分類器に照合することは、好ましい形態である。
 分類器によってがんの種類を推定することは、機械学習によって実施可能である。機械学習の例として、サポートベクターマシン、ランダムフォレストを用いた回帰分析、ロジスティック回帰分析、ニューラルネットワーク、単純ベイズ、決定木などが挙げられる。
 分類器は、例えば、複数人のがん患者の腫瘍組織から得たDNAのメチル化解析のデータから構築したり、公開されているがんのDNAメチル化情報から構築したりする。
[工程(2)]
 工程(2)は、一次検査の結果に基づき二次検査の要否を判定することと、二次検査を要する場合に一次検査において検出されたがんの中から確度の高い順に2種類のがんを選択することとを含む。
 以下に、工程(2)の実施形態例を挙げるが、本開示のがん検査方法はこれに限定されるものではない。
 一次検査用の分類器によるがんの種類の推定について、確度の閾値を予め設定しておく。
 がんAの確度が閾値以上であり、ほかのがんの確度が閾値未満である場合、二次検査が不要であると判定し、被検者ががんAに罹患していると判定する。
 がんAの確度が最も高く閾値以上ではあるが閾値に近く、がんBの確度が2番目に高く閾値未満ではあるが閾値に近い場合、二次検査が必要であると判定し、二次検査の検査対象としてがんAとがんBとを選ぶ。
 全種類のがんの確度が閾値未満である場合、二次検査が必要であると判定し、二次検査の検査対象として、分類器が推定した確度の高い順に2種類のがんを選ぶ。
 全種類のがんの確度が閾値未満であり且つ閾値から隔たった値である場合、二次検査が不要であると判定し、被検者がn種類のがんのいずれにも罹患していないと判定する。
[工程(3)]
 工程(3)は、2種類のがんを判別する二次検査であり、二次検査試薬を用いて行う。
二次検査は、一次検査において罹患の可能性が最も高いと推定された2種類について再評価する検査である。
 二次検査における解析対象のCpGサイトセット2は、種類の中の1種類であり、工程(2)において選択された2種類のがんを判別するためのCpGサイトセット2である。したがって、二次検査試薬が含む種類の試薬から1種類(解析対象のCpGサイトセット2用の試薬である。)を選んで二次検査に使用する。
 以下に、工程(3)の実施形態例を挙げるが、本開示のがん検査方法はこれに限定されるものではない。
 被検者のDNAを試料にして、二次検査試薬を用いて、選択した1種類のCpGサイトセット2のメチル化度を網羅的に解析する。試料のDNAは、工程(1)で残存したDNAでもよく、新たに被検者の生体試料から抽出したDNAでもよい。
 DNAメチル化解析の方法は、例えば、バイサルファイトシーケンスである。バイサルファイトシーケンスのPCRは、マルチプレックスPCRで行う。シーケンスには、NGSを用いることが好ましい。シーケンスにより得られた配列情報を、Bismark等のバイサルファイト変換配列を処理可能なソフトウェアを用いて解析する。
 被検者のDNAメチル化情報からがんの種類を推定することは、例えば、種類のCpGサイトセット2ごとにCpGサイトセット2のメチル化度を網羅した分類器を予め用意しておき、分類器と被検者のメチル化情報とを照合することによって実現される。推定の信頼度を上げる観点から、被検者のメチル化情報を複数種類の分類器に照合することは、好ましい形態である。
 分類器によってがんの種類を推定する方法、分類器を構築する方法は、工程(1)と同様である。
 以下に、二次検査の結果に基づく判定例を挙げるが、本開示のがん検査方法はこれに限定されるものではない。
 二次検査用の分類器によるがんの種類の推定について、確度の閾値を予め設定しておく。
 がんAの確度が閾値以上であり、がんBの確度が閾値未満である場合、被検者ががんAに罹患していると判定する。
 がんAの確度が閾値以上ではあるが閾値に近く、がんBの確度が閾値未満ではあるが閾値に近い場合、被検者ががんA及びがんBに罹患している可能性があると判定する。
 がんA及びがんBともに確度が閾値未満であり且つ閾値から隔たった値である場合、被検者がn種類のがんのいずれにも罹患していないと判定する。
 以下、実施例により発明の実施形態をさらに説明するが、発明の実施形態は、これら実施例に限定されるものではない。
<実施例1:がん検査試薬セットの製造>
[工程(a)]
 検査対象に、大腸がん、膵がん、肝細胞がん、胆管がん及び卵巣がんを選んだ。
 TCGA(The Cancer Genome Atlas)の公開データベースから937検体のデータを抽出し、5種類のがんの腫瘍組織と正常組織(健常cfDNAを含む。)のメチル化度データを比較し、少なくとも1種類の腫瘍組織においてメチル化度が高く且つ正常組織においてメチル化度が低いCpGサイトを500個選んだ。選ばれた500個のCpGサイトセットをCpGサイトセットP-5という。
[工程(b)]
 CpGサイトセットP-5を構成するすべてのCpGサイトごとにプライマーを設計した。プライマー設計には、バイサルファイトマルチプレックスPCRのプライマー設計を実施するソフトウェアであるPrimer Suiteを用いた。設計が可能であったプライマーについて、シングルプレックスPCRでのDNA増幅の可否を確認した。シングルプレックスPCRでDNA増幅が可能であったプライマーについて、1チューブ内のマルチプレックスPCRでのDNA増幅の可否を確認した。マルチプレックスPCRでDNA増幅が確認できた61個のCpGサイトを選んだ。選ばれた61個のCpGサイトのセットをCpGサイトセット1-5という。CpGサイトセット1-5を表1に示す。
 表1中に示す位置は、GRCh37の座標上の位置である。CpGサイトが遺伝子の転写領域又は転写調節領域に含まれることが知られている場合、その遺伝子の名称を表中に記載した。
Figure JPOXMLDOC01-appb-T000001
[工程(c)]
 5種類のがんの中で2種類を判別するためのCpGサイトセット2を、がん2種類の組合せごとに選定した。以下、このCpGサイトセット2をCpGサイトセット2-5という。具体的には、10種類のCpGサイトセット2-5ごとに、下記のとおり選定作業を行った。
 CpGサイトセットP-5を構成するCpGサイトからCpGサイトセット1-5に選ばれたCpGサイト全部を除外し、残りのCpGサイトを母集団とし、2種類のがんの間においてメチル化度に有意な差があり、且つ、プライマー設計が可能であったCpGサイトを選んだ。そのCpGサイトのプライマーについて、シングルプレックスPCRでのDNA増幅の可否を確認した。シングルプレックスPCRでDNA増幅が可能であったプライマーについて、1チューブ内のマルチプレックスPCRでのDNA増幅の可否を確認した。マルチプレックスPCRでDNA増幅が確認できたCpGサイトをCpGサイトセット2-5に選んだ。がん2種類の組合せそれぞれのCpGサイトセット2-5を表2~表11に示す。
 表2~表11中に示す位置は、GRCh37の座標上の位置である。CpGサイトが遺伝子の転写領域又は転写調節領域に含まれることが知られている場合、その遺伝子の名称を表中に記載した。
Figure JPOXMLDOC01-appb-T000002
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000004
Figure JPOXMLDOC01-appb-T000005
Figure JPOXMLDOC01-appb-T000006
Figure JPOXMLDOC01-appb-T000007
Figure JPOXMLDOC01-appb-T000008
Figure JPOXMLDOC01-appb-T000009
Figure JPOXMLDOC01-appb-T000010
Figure JPOXMLDOC01-appb-T000011
[工程(d):一次検査用プライマーミックスの製造]
 CpGサイトセット1-5を構成する61個のCpGサイトの各プライマーを合成した。各プライマー100μMを単一チューブに等量混合し、混合液を1μMに希釈し、プライマーミックスとした。CpGサイトごとの各プライマーは、工程(b)において設計したプライマーである。
[工程(e):二次検査用プライマーミックスの製造]
 10種類のCpGサイトセット2-5ごとに、CpGサイトセットを構成するCpGサイトの各プライマーを合成した。10種類のCpGサイトセット2-5ごとに、各プライマー100μMを単一チューブに等量混合し、混合液を1μMに希釈し、プライマーミックスとした。CpGサイトごとの各プライマーは、工程(c)において設計したプライマーである。
<実施例2:がん検査>
[一次検査用の分類器の作成]
 がんの種類を推定することは、機械学習モデルであるランダムフォレスト(RF)とサポートベクターマシン(SVM)で行うこととした。
 CpGサイトセットP-5の抽出に使用した937検体のデータを訓練データとして機械学習モデルに読み込み、オープンソースのデータマイニングソフトウェアであるOrange(https://orangedatamining.com/)を使用し、RF分類器及びSVM分類器を作成した。作成した分類器の評価をOrangeで行い、いずれの分類器もCA(Classification Accuracy,分類の精度)が0.95以上であることを確認した。
[二次検査用の分類器の作成]
 一次検査用の分類器の作成と同様にして、ただし、5種類のがんから選ばれる2種類の組合せごとに200検体以上のデータを訓練データとして使用し、がん2種類の組合せごとにRF分類器及びSVM分類器を作成した。作成した分類器の評価をOrangeで行い、いずれの分類器もCAが0.95以上であることを確認した。
[DNAの抽出]
 大腸がん患者2名から血漿を得た。それぞれを、サンプルA、サンプルBという。
 血漿からのcfDNA抽出を、QIAamp Circulating Nucleic Acid Kit(QIAGEN社製)を用い、標準プロトコルに従い下記のとおり行った。
 50mL遠心チューブに、QIAGEN Proteinase Kを200μL、血漿を2mL、Buffer ACLを1.6mL、順次添加し蓋を閉め、パルスボルテックスで30秒間混和した。次いで、温度60℃で30分間インキュベートした。次いで、Buffer ACBを3.6mL添加し蓋を閉め、15~30秒間パルスボルテックスして混和した。次いで、氷上で5分間インキュベートした。次いで、スピンカラムの吸引処理用マニフォールドQIAvac 24 Plus、コネクターVacConnector及びスピンカラムQIAamp Mini Columnを用いてDNAの洗浄を行い、20μLの溶出液(Buffer AVE社製)によりDNAを回収した。
[バイサルファイト処理]
 得られたDNAを、EZ DNA Methylation Gold Kit(Zymo research社製)を用いて、製品の標準プロトコルに従い処理した。
[一次検査]
 先述の一次検査用プライマーミックスを用い、マルチプレックスPCRにて、バイサルファイト処理後のDNAを増幅した。マルチプレックスPCRは、KOD -Multi & Epi-(東洋紡株式会社製)を用いて、この製品の説明書に従い行った。PCRチューブに、2X PCR Buffer for KOD -Multi & Epi-を25μL、KOD -Multi & Epi-を1μL、1μMプライマーミックスを15μL、バイサルファイト処理後のDNAを8.5μL、水を0.5μL分注した。PCRは、94℃/2分を1サイクル、98℃/10秒、58℃/30秒、68℃/15秒の3ステップを40サイクル行った。増幅反応液をAMPure XP(BECMAN COULTER社製)を用いて精製し、精製したDNAを40μLのTris-EDTA緩衝液に回収した。
 回収したDNAと、Index付加PCRに用いられる一般的なプライマーとを用いて、Index付加PCRにてDNAを増幅した。Index付加PCRは、Multiplex PCR Assay Kit(タカラバイオ社製)を用いて行った。1.25μMプライマーを各1μL、Multiplex PCR Mix1を0.125μL、Multiplex PCR Mix2を12.5μL、水にて最終液量25μLとなるよう反応液を調製した。PCRは、94℃/3分を1サイクル、94℃/45秒、50℃/60秒、72℃/30秒の3ステップを5サイクル、94℃/45秒、55℃/60秒、72℃/30秒の3ステップを11サイクル行った。
 得られたPCR産物を、AMPure XP Kit(BECMAN COULTER社製)を用いて精製した。精製後のDNA濃度を、BioAnalyzer(Agilent Technologies社製)を用いて定量し、さらに、KAPA Library Quantification Kit(KAPA Biosystems社製)を用いてより正確に定量した。精製後のDNAを試料にして、Miseq Reagent Kit v2 300 Cycle(イルミナ社製)を用いてシーケンシングした。得られたFastQファイルをBismarkにてヒトゲノム配列へマッピングを行うことで、61個のCpGサイトのメチル化度の情報を取得した。
[一次検査用分類器によるがんの種類の推定]
 一次検査用の分類器によるがんの種類の推定において、確度が最も高いがんを「推定1位」と出力し、確度が2番目に高いがんを「推定2位」と出力することとした。
 サンプルA及びサンプルBそれぞれのメチル化度の情報を、一次検査用のRF分類器及びSVM分類器にて評価した。その結果を表12に示す。表12中の数値は、データマイニングソフトウェアOrangeが出力した寄与率(0~1の間の数値を示す。)であり、これを確度とした。確度0.5を閾値とした。
Figure JPOXMLDOC01-appb-T000012
-サンプルA-
 RF分類器及びSVM分類器いずれも推定1位が大腸がんであり、RF分類器及びSVM分類器いずれも推定1位の確度が0.5以上であった。サンプルAについて、二次検査が不要であると判定し、一次検査のみで大腸がんと判定した。
-サンプルB-
 RF分類器による推定1位の確度が0.5未満であり、また、RF分類器による推定1位と推定2位との確度の差が小さかった。サンプルBについて大腸がんと肝細胞がんとを判別する二次検査が必要と判定した。
[二次検査]
 先述の二次検査用プライマーミックスのうち、大腸がんと肝細胞がんを判別するためのCpGサイトセット2-5(つまり表3に示すCpGサイトセット2-5)に対応するプライマーミックスを用いた。このプライマーミックスを用い、一次検査と同様にして、47個のCpGサイトのメチル化度の情報を取得した。
[二次検査用分類器によるがんの種類の推定]
 サンプルBのメチル化度の情報を、二次検査用の分類器であって、大腸がんと肝細胞がんを判別するための分類器にて評価した。その結果を表13に示す。表13中の数値は、データマイニングソフトウェアOrangeが出力した寄与率(0~1の間の数値を示す。)であり、これを確度とした。確度0.5を閾値とした。
Figure JPOXMLDOC01-appb-T000013
 RF分類器及びSVM分類器いずれも推定1位が大腸がんであり、RF分類器及びSVM分類器いずれも推定1位の確度が0.5以上であった。サンプルBについて大腸がんと判定した。
 サンプルBについての実施例は、1回目のDNAメチル化解析の信頼度が高くなかったが、1回目の解析結果を基にして2回目のDNAメチル化解析を行い、最終的に信頼度の高い判定をすることができた。

Claims (5)

  1.  下記の一次検査試薬と二次検査試薬とを含むがん検査試薬セット。
     一次検査試薬:n種類のがんを検査する目的で選ばれたCpGサイトセット1のメチル化度を解析する試薬。nは3以上の自然数である。
     二次検査試薬:前記n種類のがんの中の2種類を判別する目的でそれぞれ選ばれた種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬のセット。
  2.  前記二次検査試薬が下記の二次検査試薬である、請求項1に記載のがん検査試薬セット。
     二次検査試薬:前記n種類のがんの中の2種類を判別する目的でそれぞれ選ばれた種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬のセット。ただし、前記種類のCpGサイトセット2それぞれにおいて、前記CpGサイトセット2を構成するCpGサイトの一部又は全部が、前記CpGサイトセット1に含まれないCpGサイトである。
  3.  一次検査試薬と二次検査試薬とを含むがん検査試薬セットの製造方法であって、下記の(a)~(e)を含むがん検査試薬セットの製造方法。
    (a)n種類のがんの少なくとも1種類においてメチル化度に有意な差があるCpGサイトからなるCpGサイトセットPを作ること。nは3以上の自然数である。
    (b)前記CpGサイトセットPを構成するCpGサイトの一部を選んでCpGサイトセット1を作ること。
    (c)前記CpGサイトセットPを構成するCpGサイトの一部を選んで、前記n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
    (d)前記CpGサイトセット1のメチル化度を解析する試薬を製造し、前記一次検査試薬を成すこと。
    (e)前記種類のCpGサイトセット2のメチル化度をそれぞれ解析する種類の試薬を製造し、前記二次検査試薬を成すこと。
  4.  前記(c)が下記の(c-1)である、請求項3に記載のがん検査試薬セットの製造方法。
    (c-1)前記CpGサイトセットPを構成するCpGサイトから、前記CpGサイトセット1に選ばれたCpGサイトの一部又は全部を除外し、残りのCpGサイトの一部又は全部を選んで、前記n種類のがんの中の2種類を判別するための種類のCpGサイトセット2をそれぞれ作ること。
  5.  請求項1又は請求項2に記載のがん検査試薬セットを用いるがん検査方法であって、下記の(1)~(3)を含むがん検査方法。
    (1)前記一次検査試薬を用いてn種類のがんを検査する一次検査。nは3以上の自然数である。
    (2)前記一次検査の結果に基づき二次検査の要否を判定すること、及び、二次検査を要する場合に前記一次検査において検出されたがんの中から確度の高い順に2種類のがんを選択すること。
    (3)前記二次検査試薬を用いて前記2種類のがんを判別する二次検査。
PCT/JP2022/005142 2021-03-12 2022-02-09 がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法 WO2022190752A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2023505234A JPWO2022190752A1 (ja) 2021-03-12 2022-02-09
EP22766717.7A EP4306656A1 (en) 2021-03-12 2022-02-09 Cancer test reagent set, method for producing cancer test reagent set, and cancer test method
CN202280019190.4A CN116940693A (zh) 2021-03-12 2022-02-09 癌症检查试剂组、癌症检查试剂组的制造方法及癌症检查方法
US18/457,634 US20230399703A1 (en) 2021-03-12 2023-08-29 Cancer examination reagent set, production method for cancer examination reagent set, and cancer examination method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021040758 2021-03-12
JP2021-040758 2021-03-12

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/457,634 Continuation US20230399703A1 (en) 2021-03-12 2023-08-29 Cancer examination reagent set, production method for cancer examination reagent set, and cancer examination method

Publications (1)

Publication Number Publication Date
WO2022190752A1 true WO2022190752A1 (ja) 2022-09-15

Family

ID=83227560

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/005142 WO2022190752A1 (ja) 2021-03-12 2022-02-09 がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法

Country Status (5)

Country Link
US (1) US20230399703A1 (ja)
EP (1) EP4306656A1 (ja)
JP (1) JPWO2022190752A1 (ja)
CN (1) CN116940693A (ja)
WO (1) WO2022190752A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009009396A (ja) 2007-06-28 2009-01-15 Health Insurance Society For Photonics Group 検診情報管理システム及び管理方法
JP2016015963A (ja) * 2014-07-11 2016-02-01 シスメックス株式会社 複数種類の癌に関する情報を取得する方法、システムおよびプログラム
CN109680060A (zh) * 2017-10-17 2019-04-26 华东师范大学 甲基化标志物及其在肿瘤诊断、分类中的应用
JP2020096601A (ja) 2014-04-21 2020-06-25 ナテラ, インコーポレイテッド 変異の検出および染色体分節の倍数性
US20200255904A1 (en) * 2017-09-29 2020-08-13 Arizona Board Of Regents On Behalf Of The University Of Arizona Dna methylation biomarkers for cancer diagnosing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009009396A (ja) 2007-06-28 2009-01-15 Health Insurance Society For Photonics Group 検診情報管理システム及び管理方法
JP2020096601A (ja) 2014-04-21 2020-06-25 ナテラ, インコーポレイテッド 変異の検出および染色体分節の倍数性
JP2016015963A (ja) * 2014-07-11 2016-02-01 シスメックス株式会社 複数種類の癌に関する情報を取得する方法、システムおよびプログラム
US20200255904A1 (en) * 2017-09-29 2020-08-13 Arizona Board Of Regents On Behalf Of The University Of Arizona Dna methylation biomarkers for cancer diagnosing
CN109680060A (zh) * 2017-10-17 2019-04-26 华东师范大学 甲基化标志物及其在肿瘤诊断、分类中的应用

Also Published As

Publication number Publication date
US20230399703A1 (en) 2023-12-14
JPWO2022190752A1 (ja) 2022-09-15
CN116940693A (zh) 2023-10-24
EP4306656A1 (en) 2024-01-17

Similar Documents

Publication Publication Date Title
ES2882329T3 (es) Diagnóstico no invasivo por secuenciación de ADN fuera de las células 5-hidroximetilado
EP3658684B1 (en) Enhancement of cancer screening using cell-free viral nucleic acids
AU2020265027A1 (en) Microrna marker combination for diagnosing gastric cancer and diagnostic kit
EP3899956A2 (en) Systems and methods for using fragment lengths as a predictor of cancer
CN112941180A (zh) 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用
CN112176057B (zh) 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用
CN106399304B (zh) 一种与乳腺癌相关的snp标记
AU2019372440A1 (en) Methods to diagnose and treat cancer using non-human nucleic acids
CN115087745A (zh) 无细胞样品中的双末端dna片段类型及其用途
CN114277144B (zh) 外泌体arpc5、tbc1d23等在肺癌诊断中的应用
CN115820860A (zh) 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用
CN115896281A (zh) 甲基化生物标记物、试剂盒及用途
CN110195107A (zh) 外周血中癌症检测的核糖体dna甲基化标记物及其应用
WO2022190752A1 (ja) がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法
CN115851923A (zh) 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用
CN104962612B (zh) BRCA1基因g.41256139delT移码突变及其在制备乳腺癌辅助诊断试剂盒中的应用
CN104946751B (zh) BRCA1基因g.41244291delT突变及其在乳腺癌辅助诊断中的应用
WO2021192397A1 (ja) がん検査方法
CN106868130A (zh) 用于结肠直肠癌中使用的生物标志物
JP2020014415A (ja) がんの診断用バイオマーカー
WO2022181496A1 (ja) バイサルファイト試薬の評価方法及び遺伝子検査方法
CN106520957B (zh) Dhrs7易感snp位点检测试剂及其制备的试剂盒
CN118197425A (zh) 用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置
KR20230132785A (ko) 샘플을 임상적으로 관련된 범주로 분류하기 위한 방법
KR20230133287A (ko) 샘플을 임상적으로 관련된 범주로 분류하기 위한 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22766717

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023505234

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 202280019190.4

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2022766717

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022766717

Country of ref document: EP

Effective date: 20231012