WO2023080722A1 - 게놈 dna 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법 - Google Patents

게놈 dna 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법 Download PDF

Info

Publication number
WO2023080722A1
WO2023080722A1 PCT/KR2022/017269 KR2022017269W WO2023080722A1 WO 2023080722 A1 WO2023080722 A1 WO 2023080722A1 KR 2022017269 W KR2022017269 W KR 2022017269W WO 2023080722 A1 WO2023080722 A1 WO 2023080722A1
Authority
WO
WIPO (PCT)
Prior art keywords
cancer
methylation
cpg sites
genomic dna
disorder
Prior art date
Application number
PCT/KR2022/017269
Other languages
English (en)
French (fr)
Inventor
김선
이도훈
구본일
윤성수
고영일
Original Assignee
서울대학교병원
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교병원, 서울대학교산학협력단 filed Critical 서울대학교병원
Priority to EP22890453.8A priority Critical patent/EP4428250A1/en
Publication of WO2023080722A1 publication Critical patent/WO2023080722A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Definitions

  • the present invention relates to a method for predicting drug reactivity of an anticancer drug through analysis of genomic DNA methylation state, and more particularly, to a method for predicting reactivity to an anticancer drug by analyzing the methylation state of an adjacent CpG site in genomic DNA.
  • the World Health Organization reports that the number of new cancer patients is rapidly increasing, and the mortality rate due to cancer is also increasing every year.
  • numerous anticancer drugs have been developed for various cancers to date, only a small number of cancers can be cured with anticancer drugs alone. This is because individual genetic differences and epigenetic variability This is because drug reactivity to anti-cancer drugs varies greatly depending on factors such as , environmental influences, and the like.
  • DNA methylation which has been studied the most in epigenetic mutation, mainly occurs at cytosine of the CpG island of the promoter region of a specific gene, and as a result, the binding of transcription factors is hindered, resulting in the loss of specific genes.
  • Gene silencing is the main mechanism by which the function of the gene is lost even without a mutation in the coding sequence.
  • DNA methylation in non-translated regions such as enhancers and regulatory regions is also known to work together with chromosomal structural changes and histone modifications and to be a causative mechanism of various diseases.
  • Such abnormal methylation/demethylation of CpG sites has been reported in various diseases including cancer, and attempts to use it for diagnosis of various diseases by examining promoter methylation of disease-related genes are actively being made, as well as in specific genes. Attempts are being made to predict drug reactivity of anticancer drugs by analyzing methylation status.
  • genomic DNA methylation Since the state of genomic DNA methylation is very dynamically regulated, it shows various aspects depending on the cell type or development period, and through this, the expression of a set of genes suitable for each cell function is induced.
  • the low accuracy of preservation of genomic sequences causes inevitable errors to accumulate in DNA methylation status during cell division. Therefore, if the DNA methylation status of a random region of the genome is observed in a cell group formed through division, all cells will show the same status. It does not have a certain level of volatility. This is called the degree of disorder of DNA methylation.
  • DNA methyltransferases are known to carry out enzymatic actions while moving along the DNA strand. In other words, if an enzyme transfers a methyl group to one CpG site, it tends to move along the DNA strand to another locally adjacent CpG site to carry out its enzymatic action. Therefore, CpG sites located close to each other are likely to have the same DNA methylation status, which consequently has the effect of lowering the degree of DNA methylation disorder in local genomic regions.
  • the diversity of DNA methylation state at the level of a cell population can be an indicator of the diversity of cell state within a cell population.
  • the degree of methylation disorder in cancer can be considered as a measure of intratumor heterogeneity from an epigenetic point of view, and it is known that an increase in this value is associated with poor prognosis of patients in carcinomas such as chronic lymphocytic leukemia.
  • the diversity of gene expression of cancer cells constituting cancer with increased disorder is increased.
  • methylation disorder increases the degree of heterogeneity within epigenetic tumors, thereby increasing the adaptive potential of cancer, thereby facilitating the emergence of more aggressive cancer cells and increasing the risk of cancer.
  • the present inventors have conducted intensive research to develop a method for predicting drug reactivity to an anticancer drug by evaluating the methylation status of adjacent CpG sites in one or more regions in the genomic DNA of cancer patients.
  • the present invention was completed after discovering that the degree of methylation disorder of adjacent CpG sites in one or more regions of genomic DNA can be an important indicator for predicting drug reactivity to anticancer drugs.
  • an object of the present invention is to provide information necessary for predicting anticancer drug responsiveness of cancer patients, (a) isolating genomic DNA from a biological sample isolated from a subject; (b) measuring the methylation status of CpG sites in the isolated genomic DNA; and (c) assessing the degree of disorder of methylation of adjacent CpG sites in at least one region in genomic DNA.
  • the present invention provides information necessary for predicting anticancer drug responsiveness of cancer patients, (a) isolating genomic DNA from a biological sample isolated from a subject; (b) measuring the methylation status of CpG sites in the isolated genomic DNA; and (c) assessing the degree of disorder of methylation of contiguous CpG sites in at least one region in genomic DNA.
  • the present invention provides information necessary for predicting anticancer drug responsiveness of cancer patients, comprising: (a) isolating genomic DNA from a biological sample isolated from a subject; (b) measuring the methylation status of CpG sites in the isolated genomic DNA; and (c) assessing the degree of disorder of methylation of contiguous CpG sites in at least one region in genomic DNA.
  • the degree of disorder of methylation of adjacent CpG sites in one or more regions of genomic DNA of hematological cancer cells can be an important index for predicting drug reactivity to anticancer drugs.
  • the degree of disorder in CpG site methylation is independent of the methylation level of the CpG site, and is based on the assumption that adjacent CpG sites in genomic DNA will exhibit the same methylation status (i.e., methylation or demethylation). .
  • CpG refers to a dinucleotide sequence wherein cytosine nucleotides occur next to guanine nucleotides in a linear sequence of bases along its length.
  • a cytosine nucleotide is 5' to a guanine nucleotide and the two nucleotides are linked by a phosphate molecule.
  • Cytosines of CpG dinucleotides can be methylated to form 5-methylcytosines.
  • methylation of cytosines within genes or promoters can affect transcriptional regulation of genes. Enzymes that add methyl groups are called DNA methyltransferases.
  • methylation disorder can be used in the same sense as “discordant methylation”, and means the degree of mismatch in methylation status of CpG sites over a short genetic distance or within a specific region of genomic DNA. . Since DNA methylation generally varies for specific regions of genomic DNA (e.g., specific gene promoters or CpG islands) rather than for individual CpGs, the extent to which the methylation states of genetically located CpGs are concordant is highly variable under normal conditions. can be expected to be high. For example, it can be seen that CpG sites genetically positioned adjacent to each other at a distance of 2 to 100 bp are highly likely to be all methylated or all demethylated in a normal state.
  • the term may refer to whether or not methylation of CpG sites included in the same sequencing read is identical. If all CpGs in a sequencing read are methylated or all are unmethylated (i.e., all are demethylated), the sequencing read is classified as congruent methylation. Otherwise, it is classified as discordant methylation. In general, when genomic DNA is sequenced, sequencing reads may have a genetic distance of about 100 base pairs (bp) or less.
  • methylation means that a methyl group is added to the 5' carbon of a cytosine base in the deoxyribonucleic acid sequence of a CpG site in genomic DNA.
  • methylation state means the presence or absence of methylated cytosine bases at CpG sites.
  • the term "contiguous CpG sites” means (i) a set of CpG sites in a specific region of genomic DNA, (ii) a set of CpG sites in a sequencing read, or (iii) a set of CpG sites with a short genetic distance. .
  • genomic DNA means the entire genomic DNA, bivalent domain, promoter, enhancer, exon, intron, 5'-untranslated region (UTR), 3'-UTR, genome (Gene body), stem cell-related region, CpG island, CpG shore, LTR (long terminal repeat), LINE (long interspersed nuclear element), SINE (short interspersed nuclear element), CpG shelf ( shelf), methylation canyon, and intergenic region.
  • short genetic distance may be used in the same meaning, and 2 to 100 bp, specifically, 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp , 20 bp, 21 bp, 22 bp, 23 bp, 24 bp, 25 bp, 26 bp, 27 bp, 28 bp, 29 bp, 30 bp, 31 bp, 32 bp, 33 bp, 34 bp, 35 bp, 36 bp, 37 bp, 38 bp, 39 bp, 40 bp, 41 bp, 42 .
  • the term “drug responsiveness” refers to the degree of therapeutic effectiveness of a specific drug for a subject, preferably a cancer patient.
  • the terms “increased responsiveness”, “enhanced responsiveness”, “good responsiveness”, or “high responsiveness” when used in connection with the treatment of cancer patients, when measured using any method known in the art It can mean that an increase in the effectiveness of
  • a cancer patient's response to a drug can be characterized as a complete or partial response.
  • increased responsiveness of a cancer patient to a drug can be characterized as overall survival rate, disease-free survival, target response rate, time to tumor progression, progression-free survival, or time to treatment failure.
  • the "increased reactivity", “enhanced reactivity”, “good reactivity” or “high reactivity” may be compared to the patient who has taken the drug or the average of other patient groups who have taken the same drug.
  • the comparison target is the patient himself and the drug reactivity is increased based on any one point in a series of courses of administering a specific drug, it can be determined that the drug reactivity has improved based on the above point of time, and the comparison target
  • the average of other patient groups taking the same drug compared to the average value of drug responsiveness of a patient group of the same cancer type confirmed through a known database, if the drug responsiveness of a specific patient is higher, the drug responsiveness of the specific patient can be judged high.
  • cancer generally refers to a mammalian physiological condition characterized by uncontrolled cell proliferation.
  • examples of cancer include colorectal cancer, breast cancer, glioma, thyroid cancer, lung cancer, liver cancer, pancreatic cancer, head and neck cancer, stomach cancer, urothelial cancer, kidney cancer, prostate cancer, testicular cancer, cervical cancer, ovarian cancer, endometrial cancer, melanoma, and fallopian tube cancer.
  • the type of the anticancer agent is not particularly limited, but, for example, DNMT (DNA methyltransferase) inhibitors (decitabine, azacitidine, RG-108, etc.), platinum-based antineoplastic agents (antineoplastic agent) ⁇ including cisplatin, carboplatin, dicycloplatin, nedaplatin, oxaliplatin, picoplatin, and satraplatin ⁇ , nucleoside analogs and antimetabolites (including cytarabine, fludarabine, gemcitabine, 5FU), DNA intercalators (danoruby) danorubicin, doxorubicin, epirubicin and idarubicin, including camptothecin ⁇ , alkylating neoplastic agents ⁇ cyclophosphamide) , including melphalan, bendamustine, carmustine, lomustine, ifosfamide ⁇ , topoisomerase inhibitor ⁇ etopo
  • the subject refers to a vertebrate or invertebrate animal.
  • the subject is a vertebrate, eg a mammal, preferably a human.
  • the subject is a domestic animal or laboratory animal, including but not limited to household pets such as dogs, cats, pigs, rabbits, rats, mice, gerbils, hamsters, guinea pigs, and ferrets.
  • the subject is a livestock.
  • livestock animals may include alpacas, bison, camels, cows, deer, pigs, horses, llamas, mules, donkeys, sheep, goats, rabbits, caribou and yaks.
  • the biological sample includes, but is not limited to, cancer tissue, cancer tissue fragments, cancer cells, blood, plasma, blood cells, saliva, tears, feces, and urine isolated from the subject.
  • the biological sample may be separated from cancer tissue, cancer tissue fragments, cancer cells, blood, plasma, blood cells, saliva, tears, feces and urine.
  • the DNA may be DNA isolated from tissues, cells, etc., cell free DNA (cfDNA) floating in blood, plasma, body fluids, etc. or circulating tumor DNA (ctDNA) shed from tumor cells can be
  • Ms-SNuPE methylated DNA immunoprecipitation
  • MeDip methylated DNA immunoprecipitation
  • bisulfige sequencing next-generation sequencing after bisulfite treatment
  • microarray genome-wide microarray
  • PCR methylation specific PCR
  • real time methylation specific PCR MethyLight PCR
  • MehtyLight digital PCR MethyLight digital PCR
  • EpiTYPER PCR using methylated DNA-specific binding proteins
  • quantitative PCR DNA chips
  • molecular beacons next-generation sequencing panels (NGS panels), and methylation-sensitive Southern blotting
  • NGS panels next-generation sequencing panels
  • methylation-sensitive Southern blotting may be included.
  • the bisulfite sequencing may include whole genome bisulfite sequencing (WGBS) and reduced representation bisulfite sequencing (RRBS).
  • WGBS whole genome bisulfite sequencing
  • RRBS reduced representation bisulfite sequencing
  • CpG methylation in all or specific regions of genomic DNA can be detected by pyrosequencing after bisulfite treatment and optionally after amplifying the methylated sites.
  • Pyrosequencing technology is a synthesis-specific sequencing method that proceeds in real time. It is based on indirect bioluminescence analysis of PPi released from each deoxynucleotide (dNTP) upon DNA chain extension. This method presents a dNTP and DNA template-primer complex in the presence of exonuclease-deficient Klenow DNA polymerase. Four nucleotides are sequentially added to the reaction mixture in a predetermined order. When the nucleotide is complementary to the template base and incorporated, PPi is released.
  • dNTP deoxynucleotide
  • PPi and other reagents are used as substrates in luciferase reactions to produce visible light that is detected by luminometers or charge-coupled devices.
  • the generated light is proportional to the number of nucleotides added to the DNA primer and becomes a peak representing the number and type of nucleotides present in the form of a pyrogram.
  • the methylation status of CpGs can be detected in methylation analysis using next generation sequencing (NGS).
  • NGS next generation sequencing
  • DNA methylation can be detected by massively parallel sequencing via bisulfite conversion, such as whole genome bisulfite sequencing (WGBS) or reduced representation bisulfite sequencing (RRBS).
  • WGBS whole genome bisulfite sequencing
  • RRBS reduced representation bisulfite sequencing
  • DNA methylation can be detected by microarrays such as genome-wide microarrays. Microarrays and massively parallel sequencing enable investigation of cytosine methylation on a genome-wide scale.
  • One of the most comprehensive and most efficient methods for detecting DNA methylation may be whole genome bisulfite sequencing (WGBS). Specifically, to detect CpG methylation, the DNA to be analyzed is first converted so that unmethylated cytosine is converted to uracil.
  • chemical reagents that selectively modify CpG dinucleotide motifs in either methylated or demethylated form can be used. Suitable chemical reagents may include hydrazine and bisulfite, and the like.
  • the isolated DNA can be treated with bisulfite, which converts unmethylated cytosine to uracil while retaining methylated cytosine.
  • Cytosine reacts with bisulfite ions to form sulfonated cytosine reactive intermediates that are sensitive to deamination to yield sulfonated uracil. Sulfonated groups can be removed in alkaline conditions to form uracil. Nucleotide transformation alters the sequence of DNA. Uracil is recognized as thymine by DNA polymerase. Therefore, the product after PCR or sequencing contains cytosine only at the position where 5-methyl cytosine occurs in the starting template DNA. This allows discrimination between unmethylated and methylated cytosines.
  • the degree of disorder of methylation of the flanking CpG sites can be assessed according to a method comprising the following steps:
  • a sequencing read is first mapped to a reference sequence to determine which region of genomic DNA the corresponding sequencing read corresponds to. From this result, the degree of methylation disorder is calculated as follows.
  • sequencing in which all 2 to 20 CpG sites adjacent to each other among the CpG sites included in the sequencing read corresponding to (i.e. mapped to the corresponding site) are all methylated or all demethylated Calculate the number of reads (A) and the number of remaining sequencing reads (B). Next, the degree of methylation disorder is calculated as B/(A+B).
  • the chaos of methylation is calculated for whole genome DNA or specific in genomic DNA.
  • the degree of disorder of genome-wide or specific region-level methylation in the genome is the disorder of specific CpG site-level methylation in all CpG sites contained in one or more regions in the entire genome or in genomic DNA to be calculated. It is also defined as the average of the figures.
  • the CpG sites included in the average value calculation may preferably be CpG sites mapped to 11 or more reads including at least 4 or more CpG sites at the same time.
  • the degree of disorder of methylation of the adjacent CpG sites is epipolymorphism, methylation entropy, methylation haplotype load (MHL), Fraction of discordant read pair (FDRP) ) or quantitative FDRP (quantitative FDRP).
  • epigenetic alleles can also diversify. This is because all methylated or all demethylated epigenetic alleles will appear dominantly in regions with low disorder, and many other epigenetic alleles will appear in regions with high disorder. Based on this concept, epipolymorphism and methylation entropy are calculated by calculating the diversity of epigenetic alleles as follows, and the degree of disorder in methylation is calculated.
  • epipolymorphism is a calculation method borrowed from the calculation method of the Gini-Simpson index used to measure species diversity in ecology.
  • sequencing reads including all four CpG sites for which epipolymorphism is to be calculated are traversed, and the frequency of each of 16 possible epigenetic alleles produced by the four CpG sites is measured.
  • epipolymorphism is calculated as follows.
  • This value is the smallest at 0 when only one of the 16 epigenetic allele patterns appears, and the highest when the relative frequency of all 16 patterns is equal to 1/16. Therefore, it can be a scale for measuring the diversity of patterns, which means that the degree of disorder in methylation can be measured.
  • the methylation entropy value is different in that Shannon entropy is used instead of the Gini-Simpson index as a method of measuring the relative diversity of epigenetic alleles.
  • the methylation entropy value is calculated as follows.
  • This value also becomes the smallest (0) when only one of the 16 epigenetic allele types appears, and the maximum when the relative frequency of all 16 patterns is equal to 1/16.
  • methylation haplotype load is to detect locally highly correlated regions of methylation status.
  • the methylated haploid load is calculated by finding a fully-methylated substring contained in each sequencing read based on the methylation status of the CpG region included in each sequencing read. Formulaically, it can be expressed as follows.
  • P(MH_i) represents the ratio of substrings in which all CpG sites are methylated among substrings having i CpG sites
  • w_i is a weight given to the length of the substring.
  • Fraction of discordant read pair is a method to measure the degree of disorder of DNA methylation at the level of a single CpG site.
  • FDRP discordant read pair
  • the degree of disorder of methylation of the adjacent CpG sites can be evaluated according to a method comprising the following steps:
  • a sequencing lead may have a length of about 100 base pairs (bp), and in step (i), one or more regions in genomic DNA (eg, entire genomic DNA, bivalent domain (bivalent domain)) domain), promoter, enhancer, exon, intron, 5'-untranslated region (UTR), 3'-UTR, gene body, stem cell-related region, CpG island, CpG shore ), LTR (long terminal repeat), LINE (long interspersed nuclear element), SINE (short interspersed nuclear element), CpG shelf, methylation canyon, and intergenic region in the group consisting of 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp, 20 bp, 21
  • the methylation status of two adjacent CpG sites having any one genetic distance selected from the group consisting of 2 to 100 bp among the CpG sites included in the entire genomic DNA or a specific region in the genomic DNA is compared,
  • the number of all methylated or all demethylated sequencing reads (A) and the number of remaining sequencing reads (B) can be calculated for every two adjacent CpG sites with the corresponding genetic distance in the genomic DNA.
  • step (ii) the degree of disorder of methylation of adjacent CpG sites can be calculated for two adjacent CpG sites having a genetic distance selected from the group consisting of 2 to 100 bp according to the following equation:
  • a value of [disorder of methylation of adjacent CpG sites] is calculated in the entire genomic DNA or in a specific region in the genomic DNA, and independently of this, the genetic distance is After calculating the [disorder degree of adjacent CpG site methylation] values in the entire genomic DNA or a specific region in genomic DNA for two adjacent CpG sites of 3 bp, the average value of these values is calculated as the [disorder degree of adjacent CpG site methylation] of the subject ].
  • the [disorder degree of methylation of adjacent CpG sites] value of the subject can be calculated.
  • a subject having a high value of [disorder of methylation of adjacent CpG sites] in CpG sites included in the entire genomic DNA or a specific region in genomic DNA according to the above method has a higher responsiveness to anticancer drugs. it was confirmed as
  • anticancer drug reactivity can be accurately predicted through the degree of methylation disorder of CpG sites in genomic DNA, which can be very usefully used in drug selection for treatment of cancer patients.
  • FIG. 1 is a schematic diagram showing a method for calculating an LPMD value as an example of [the degree of disorder of methylation of adjacent CpG sites] in an embodiment of the present invention.
  • FIG. 2 is a diagram showing the correlation between [the degree of methylation disorder (LPMD) of adjacent CpG sites] in the entire DNA of an acute myeloid leukemia cancer cell line and the area under the drug response curve (AUDRC) of each indicated anticancer agent.
  • LPMD degree of methylation disorder
  • AUDRC drug response curve
  • 3 to 11 are diagrams showing the correlation between the [disorder degree of methylation of adjacent CpG sites] in a specific region of the DNA of an acute myeloid leukemia cancer cell line and the area under the drug response curve (AUDRC) of each indicated anticancer agent.
  • AUDRC drug response curve
  • the anticancer drug reactivity value of the corresponding cancer cell line was obtained from the Cancer Therapeutics Response Portal (CTRP) in the form of [area under the drug response curve] (AUDRC) and prepared.
  • CTRP Cancer Therapeutics Response Portal
  • AUDRC area under the drug response curve
  • the value of [disorder degree of methylation of adjacent CpG sites] in a specific region in DNA also showed a significant negative correlation with the AUDRC value for each drug, so that [methylation of adjacent CpG sites] It can be confirmed that the drug predictive power of ] can be exerted not only in the entire genomic DNA but also in a specific region within the genomic DNA.
  • Targeted bisulfite sequencing data were generated for blood samples from a total of 22 patients diagnosed with acute myeloid leukemia at Seoul National University Hospital who received a prescription for demethylating anticancer drugs (Decitabine or Azacitinde).
  • the sequencing was performed on 454 genomic regions identified as well representative of the DNA methylation disorder of each genome, mainly containing bivalent domains. According to demethylating agent responsiveness, patients were classified into two groups: those who survived for more than 9 months or achieved complete remission (good response) and those who did not (poor response).
  • LPMD an example of the disorder value of methylation of adjacent CpG sites
  • LPMD was calculated using CpG pairs ranging from distance 2 to 16. This is a result showing that the level of methylation disorder is associated with anticancer drug reactivity not only in cell lines but also in actual patient's blood samples, suggesting the possibility of clinical application of the present invention.
  • anticancer drug reactivity can be accurately predicted through the degree of methylation disorder of CpG sites in genomic DNA, so it can be used very usefully for drug selection for the treatment of cancer patients, so industrial applicability is very high.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 게놈 DNA 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법에 관한 것으로, 보다 상세하게는 게놈 DNA 내 인접 CpG 부위의 메틸화 상태를 분석함으로써 항암제에 대한 반응성을 예측하는 방법에 관한 것이다. 본 발명의 방법에 따르면, 게놈 DNA 내 CpG 부위의 메틸화 무질서도를 통해 항암제 약물 반응성을 정확하게 예측할 수 있어 암 환자의 치료를 위한 약물 선택에 매우 유용하게 활용될 수 있다.

Description

게놈 DNA 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법
본 출원은 2021년 11월 5일에 출원된 대한민국 특허출원 제10-2021-0151412호를 우선권으로 주장하고, 상기 명세서 전체는 본 출원의 참고문헌이다.
본 발명은 게놈 DNA 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법에 관한 것으로, 보다 상세하게는 게놈 DNA 내 인접 CpG 부위의 메틸화 상태를 분석함으로써 항암제에 대한 반응성을 예측하는 방법에 관한 것이다.
WHO(세계보건기구)에서는 신규 암 환자의 수가 급증하고 있고, 암에 의한 사망률 또한 매년 증가하는 추세를 보이고 있는 것으로 보고되고 있다. 현재까지 다양한 암에 대한 수많은 항암제가 개발되었음에도 불구하고, 항암제만으로 완치가 가능한 암은 소수암에 불과한데, 그 이유는 항암제를 이용한 암 치료 시 동일한 암종이라고 하더라도 개개인의 유전적 차이, 후성유전적 다양성, 환경적 영향 등에 따라 항암제에 대한 약물 반응성에 큰 차이를 나타내기 때문이다.
이중 후성적 변이에서 가장 많이 연구가 되어있는 DNA 메틸화는 주로 특정 유전자의 프로모터 부위의 CpG 섬(CpG island)의 사이토신(cytosine)에서 일어나고, 그로 인하여 전사인자의 결합이 방해를 받게 되어 특정 유전자의 발현이 차단(gene silencing)되는 것으로, 코딩서열(coding sequence)에 돌연변이가 없이도 그 유전자의 기능이 소실되는 주요 기전이다.
유전자의 프로모터 지역 이외에도 인핸서(enhancer), 조절 부위와 같은 비번역지역의 DNA 메틸화도 염색체의 구조변이, 히스톤 변형(modification)과 함께 작용하며 여러 질병의 원인 기전이 된다고 알려져 있다. 암을 포함한 다양한 질병들에서 CpG 부위의 이러한 비정상적인 메틸화/탈메틸화가 보고되었으며, 질병 관련 유전자의 프로모터 메틸화를 조사하여 각종 질환의 진단에 사용하려는 시도가 활발하게 이루어지고 있을 뿐 아니라, 특정 유전자에서의 메틸화 상태를 분석함으로써 항암제 약물 반응성을 예측하려는 시도가 이루어지고 있다.
하지만, 종래 시도되고 있는 대부분의 방법들은 특정 유전자 내 CpG 섬 등에서의 메틸화 수준(level)을 항암제의 약물 반응성의 예측 마커로 활용하고 있으나, 게놈 DNA 전반에 걸친 CpG의 메틸화 상태 변화를 통한 약물 반응성 예측 방법은 아직까지 보고된 바가 없다.
게놈 DNA 메틸화의 상태는 매우 동적으로 조절되기 때문에 세포 종류에 따라, 혹은 발생 시기에 따라 다양한 양상을 나타내고, 이를 통해 각 세포 기능에 알맞은 유전자 집합의 발현이 유도된다.
게놈 염기 서열의 보존의 낮은 정확도는 세포 분열 시 DNA 메틸화 상태에 필연적인 오류가 축적되게 하며, 따라서 분열을 통해 형성된 어떤 세포군에서 게놈 임의의 지역의 DNA 메틸화 상태를 관측한다면, 모든 세포가 같은 상태를 가지지 않고 일정 수준의 변동성을 보이게 된다. 이를 DNA 메틸화의 무질서도라 한다.
과도한 DNA 메틸화 무질서도는 조직 수준 기능의 유지를 불가능하게 하므로, 세포는 몇몇 기작들을 통해 DNA 메틸화의 무질서도를 적정 수준으로 유지한다. 그 중 한 예로, DNA 메틸전이효소 자체의 진행성(processivity)을 들 수 있다. DNA 메틸전이효소는 DNA 가닥을 따라 이동하며 효소 작용을 수행한다고 알려져 있다. 즉, 효소가 어떤 CpG 부위에 메틸기를 전달했다면 국소적으로 인접한 다른 CpG 부위까지 DNA 가닥을 따라 이동하여 효소 작용을 수행하는 경향이 있다는 것이다. 따라서 가까이에 존재하는 CpG 부위는 서로 같은 DNA 메틸화 상태를 가질 가능성이 높으며, 이는 결과적으로 국소적인 게놈 부위의 DNA 메틸화 무질서도를 낮추는 효과가 있다.
DNA 메틸화를 비롯한 후성적 요인들은 유전자 발현을 조절함으로써 세포의 상태를 결정하므로, 세포군 수준의 DNA 메틸화 상태의 다양성은 결국 세포군 내 세포 상태의 다양성을 나타내는 지표라 할 수 있다. 특히 암에서의 메틸화 무질서도는 후성유전적 관점의 종양 내 이질성도 척도로 생각해볼 수 있고, 이 값의 증가는 만성림프구성백혈병 등의 암종에서 환자의 나쁜 예후와 연관되어 있음이 알려져 있다. 또한 무질서도가 증가된 암을 구성하는 암세포들이 갖는 유전자 발현의 다양성이 증가되는 것이 보고된 바 있다. 이렇듯 메틸화 무질서도는 후성유전적 종양 내 이질성도를 증가시켜 암의 적응 잠재력(adaptive potential)을 증가시킴으로써, 보다 공격적인 암세포의 출현을 용이하게 만들어 암의 위험도를 증가시킨다고 받아들여지고 있다.
이에, 본 발명자는 암 환자의 게놈 DNA 내 하나 이상의 영역에서 인접 CpG 부위 메틸화 상태를 평가함으로써 항암제에 대한 약물 반응성을 예측할 수 있는 방법을 개발하고자 예의 연구를 거듭한 결과, CpG 부위의 메틸화 수준과 무관하게 게놈 DNA 내 하나 이상의 영역에서 인접 CpG 부위의 메틸화 무질서도가 항암제에 대한 약물 반응성을 예측하는 중요한 지표가 될 수 있음을 발견하고 본 발명을 완성하게 되었다.
따라서, 본 발명의 목적은 암 환자의 항암제 반응성 예측에 필요한 정보를 제공하기 위하여, (a) 대상체(subject)로부터 분리된 생물학적 시료에서 게놈 DNA를 분리하는 단계; (b) 상기 분리된 게놈 DNA에서 CpG 부위의 메틸화 상태를 측정하는 단계; 및 (c) 게놈 DNA 내 하나 이상의 영역에서의 인접 CpG 부위 메틸화의 무질서도를 평가하는 단계를 포함하는, 게놈 DNA 내 인접 CpG 부위의 메틸화 상태를 평가하는 방법을 제공하는 것이다.
전술한 본 발명의 목적을 달성하기 위하여, 본 발명은 암 환자의 항암제 반응성 예측에 필요한 정보를 제공하기 위하여, (a) 대상체(subject)로부터 분리된 생물학적 시료에서 게놈 DNA를 분리하는 단계; (b) 상기 분리된 게놈 DNA에서 CpG 부위의 메틸화 상태를 측정하는 단계; 및 (c) 게놈 DNA 내 하나 이상의 영역에서의 인접 CpG 부위 메틸화의 무질서도를 평가하는 단계를 포함하는, 게놈 DNA 내 인접 CpG 부위의 메틸화 상태를 평가하는 방법을 제공한다.
이하, 본 발명에 대해 상세히 설명한다.
본 발명은 암 환자의 항암제 반응성 예측에 필요한 정보를 제공하기 위하여, (a) 대상체(subject)로부터 분리된 생물학적 시료에서 게놈 DNA를 분리하는 단계; (b) 상기 분리된 게놈 DNA에서 CpG 부위의 메틸화 상태를 측정하는 단계; 및 (c) 게놈 DNA 내 하나 이상의 영역에서의 인접 CpG 부위 메틸화의 무질서도를 평가하는 단계를 포함하는, 게놈 DNA 내 인접 CpG 부위의 메틸화 상태를 평가하는 방법을 제공한다.
본 발명의 일실시예에 따르면, 혈액암 세포의 게놈 DNA 내 하나 이상의 영역에서, 인접 CpG 부위 메틸화의 무질서도는 항암제에 대한 약물 반응성을 예측할 수 있는 중요한 지표가 될 수 있다는 것이 확인되었다. 이와 같은 CpG 부위 메틸화의 무질서도는 CpG 부위의 메틸화 수준(level)과는 독립적인 것으로, 게놈 DNA 내에 존재하는 인접한 CpG 부위는 동일한 메틸화 상태(즉, 메틸화 또는 탈메틸화)를 나타낼 것이라는 가정에 근거한다.
본 발명에서 용어 "CpG"는 디뉴클레오타이드 서열을 지칭하는데, 여기서 시토신 뉴클레오타이드는 그 길이를 따라 염기의 선형 서열에서 구아닌 뉴클레오타이드 옆에 발생한다. CpG 서열에서 시토신 뉴클레오타이드는 구아닌 뉴클레오타이드에 대해 5 '이고 두 뉴클레오타이드는 인산염 분자로 연결된다. CpG 디뉴클레오타이드의 시토신은 메틸화되어 5-메틸시토신을 형성할 수 있다. 포유류에서 유전자 또는 프로모터 내의 시토신의 메틸화는 유전자의 전사 조절에 영향을 미칠 수 있다. 메틸기를 추가하는 효소를 DNA 메틸트랜스퍼라제(DNA methyltransferase)라고 한다.
본 발명에서 용어 "메틸화의 무질서도"는 "불일치한 메틸화"와 동일한 의미로 사용될 수 있는 것으로, 짧은 유전적 거리에 걸쳐 또는 게놈 DNA의 특정 영역 내에 존재하는 CpG 부위 메틸화 상태의 불일치 정도를 의미한다. 일반적으로 DNA 메틸화는 개별 CpG가 아닌 게놈 DNA의 특정 영역(예를 들어, 특정 유전자 프로모터 또는 CpG 섬)에 따라 변화하므로, 유전적으로 근거리에 위치하는 CpG의 메틸화 상태가 일치하는 정도는 정상적인 상태에서 매우 높을 것으로 예상할 수 있다. 예를 들어, 유전적으로 2 내지 100bp의 거리에 인접하게 위치한 CpG 부위는 정상적인 상태에서 모두 메틸화가 되어 있거나 또는 모두 탈메틸화 되어 있을 가능성이 매우 높다고 볼 수 있다. 상기 용어는 더 엄밀한 의미에서 동일한 시퀀싱 리드(sequencing read) 내에 포함된 CpG 부위의 메틸화 일치 여부를 의미하는 것일 수도 있다. 하나의 시퀀싱 리드에 포함된 모든 CpG가 메틸화되었거나 모두 메틸화되지 않은 경우(즉, 모두 탈메틸화된 경우), 해당 시퀀싱 리드는 일치하는 메틸화로 분류된다. 그 이외의 경우에는 불일치한 메틸화로 분류된다. 일반적으로, 게놈 DNA의 서열 분석시 시퀀싱 리드는 100 염기쌍 (bp) 내외의 유전적 거리를 갖을 수 있다.
본 발명에서 용어 "메틸화"는 게놈 DNA 내의 CpG 부위의 데옥시리보핵산 서열에서 시토신 염기의 5 '탄소에 메틸기가 추가된 것을 의미한다.
본 발명에서 용어 "메틸화 상태"는 CpG 부위에서 메틸화된 시토신 염기의 존재 또는 부재를 의미한다.
본 발명에서 용어 "인접 CpG 부위"는 (i) 게놈 DNA의 특정 영역 내 CpG 부위의 집합, (ii) 시퀀싱 리드 내 CpG 부위의 집합 또는 (iii) 유전적 거리가 짧은 CpG 부위의 집합을 의미한다.
본 발명에서 용어 "게놈 DNA의 특정 영역"이란, 게놈 DNA 전체, 이가성 도메인(bivalent domain), 프로모터, 인핸서, 엑손, 인트론, 5'- 비번역영역(UTR), 3'-UTR, 유전자체(Gene body), 줄기 세포 관련 영역, CpG 섬(CpG island), CpG 쇼어(CpG shore), LTR(long terminal repeat), LINE(long interspersed nuclear element), SINE(short interspersed nuclear element), CpG 쉘프(shelf), 메틸화 케니언(methylation canyon) 및 인터제닉 영역(intergenic region)으로 이루어진 군에서 선택될 수 있다.
본 발명에서 용어 "짧은 유전적 거리", "유전적으로 짧은 거리", "유전적 거리가 짧은", "유전적으로 근거리"는 동일한 의미로 사용될 수 있으며, 2 내지 100bp, 구체적으로는, 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp, 20 bp, 21 bp, 22 bp, 23 bp, 24 bp, 25 bp, 26 bp, 27 bp, 28 bp, 29 bp, 30 bp, 31 bp, 32 bp, 33 bp, 34 bp, 35 bp, 36 bp, 37 bp, 38 bp, 39 bp, 40 bp, 41 bp, 42 bp, 43 bp, 44 bp, 45 bp, 46 bp, 47 bp, 48 bp, 49 bp, 50 bp, 51 bp, 52 bp, 53 bp, 54 bp, 55 bp, 56 bp, 57 bp, 58 bp, 59 bp, 60 bp, 61 bp, 62 bp, 63 bp, 64 bp, 65 bp, 66 bp, 67 bp, 68 bp, 69 bp, 70 bp, 71 bp, 72 bp, 73 bp, 74 bp, 75 bp, 76 bp, 77 bp, 78 bp, 79 bp, 80 bp, 81 bp, 82 bp, 83 bp, 84 bp, 85 bp, 86 bp, 87 bp, 88 bp, 89 bp, 90 bp, 91 bp, 92 bp, 93 bp, 94 bp, 95 bp, 96 bp, 97 bp, 98 bp, 99 bp 또는 100 bp의 유전적 거리를 의미하는 것일 수 있다. 이와 같은 관점에서, 상기 "인접 CpG 부위"는 (i) 게놈 DNA의 특정 영역 내에서 유전적으로 짧은 거리에 위치한 CpG 부위의 집합 또는 (ii) 시퀀싱 리드 내에서 유전적으로 짧은 거리에 위치한 CpG 부위의 집합을 의미하는 것일 수 있다.
본 발명에서 용어 "약물 반응성"이란 대상체, 바람직하게는 암 환자에 대한 특정 약물의 치료 유효성의 정도를 지칭한다. 예를 들어, 암 환자의 치료에 관련하여 사용될 때 용어 "증가된 반응성", "향상된 반응성", "좋은 반응성" 또는 "높은 반응성"은 당해 분야에서 공지된 임의의 방법을 이용하여 측정된 경우 약물의 유효성에서 증가가 나타난 것을 의미할 수 있다. 또 다른 예로서, 약물에 대한 암 환자의 반응은 완전 또는 부분 반응으로 특성 규명될 수 있다. 또 다른 예로서, 약물에 대한 암 환자의 증가된 반응성은 전체 생존율, 무질환 생존, 목적 반응 속도, 종양 진행까지 시간, 무진행 생존 또는 치료 실패까지 시간으로 특성 규명될 수 있다. 상기 "증가된 반응성", "향상된 반응성", "좋은 반응성" 또는 "높은 반응성"의 기준이 되는 비교 대상은 약물을 투약한 환자 본인일 수도 있고 또는 동일한 약물을 투약한 다른 환자 집단의 평균일 수도 있다. 예를 들어, 비교 대상이 환자 본인인 경우 특정 약물을 투약하는 일련의 과정 중 어느 한 시점을 기준으로 약물 반응성이 증가된 경우, 상기 시점을 기준으로 약물 반응성이 향상되었다고 판단할 수 있으며, 비교 대상이 동일한 약물을 투약한 다른 환자 집단의 평균인 경우 공지된 데이터베이스를 통해서 확인 가능한 동일 암종의 환자 집단의 약물 반응성에 대한 평균값과 비교해 특정 환자의 약물 반응성이 더 높았던 경우, 상기 특정 환자의 약물 반응성이 높다고 판단할 수 있다.
본 발명에서 상기 "암"이란, 일반적으로 제어되어 있지 않은 세포 증식을 특징으로 하는 포유류의 생리학적 상태를 지칭한다. 암의 예로서는 대장암, 유방암, 신경교종, 갑상선암, 폐암, 간암, 췌장암, 두경부암, 위암, 요로상피암, 신장암, 전립선암, 고환암, 자궁경부암, 난소암, 자궁내막암, 흑색종양, 난관암, 자궁암, 혈액암, 골암, 피부암, 뇌암, 질암, 내분비암, 부갑상선암, 요관암, 요도암, 기관지암, 방광암, 골수암, 급성 골수성 백혈병, 급성 림프구성 또는 림프아구성 백혈병, 급성 또는 만성의 림포구성 백혈병, 급성 비림프구성 백혈병, 뇌종양, 경관암, 만성 골수성 백혈병, 장암, T-존 림프종, 식도암, 담즙 방광암, 유잉 육종 (Ewing's sarcoma), 설암, 홉킨스 림프종, 카포시스 육종, 중피종, 다발성 골수종, 신경아세포종, 비홉킨 림프종, 골육종, 신경아세포종, 유선암, 경관암, 페니스암, 레티노블라스토마, 피부암, 및 자궁암을 들 수 있으며, 보다 바람직하게는 급성 골수성 백혈병, 급성 림프구성 또는 림프아구성 백혈병, 급성 또는 만성의 림포구성 백혈병, 급성 비림프구성 백혈병, 급성 골수성 백혈병 또는 만성 골수성 백혈병일 수 있지만, 이에 제한되는 것은 아니다.
본 발명에서 상기 항암제는 그 종류가 특별히 제한되지 않으나, 예를 들어 DNMT(DNA methyltransferase) 저해제(데시타빈(decitabine), 아자시티딘(azacytidine), RG-108 등), 백금 기반 항신생물제(antineoplastic agent){시스플라틴(cisplatin), 카르보플라틴(carboplatin), 디사이클로플라틴(dicycloplatin), 네다플라틴(nedaplatin), 옥살리플라틴(oxaliplatin), 피코플라틴(picoplatin), 사트라플라틴(satraplatin) 포함}, 뉴클레오사이드 유사체(nucleoside analogs) 및 항대사물질(antimetabolite){사이타라빈(cytarabine), 플루다라빈(fludarabine), 젬시타빈(gemcitabine), 5FU 포함}, DNA 삽입제(intercalator){다노루비신(danorubicin), 독소루비신(doxorubicin), 에피루비신(epirubicin) 및 이다루비신(idarubicin), 캄프토테신(camptothecin) 포함}, 알킬화 신생물제(alkylating neoplastic agent){사이클로포스파미드(cyclophosphamide), 멜팔란(melphalan), 벤다무스틴(bendamustine), 카무스틴(carmustine), 로무스틴(lomustine), 이포스파미드(ifosfamide) 포함}, 토포이소머라아제 억제제(topoisomerase inhibitor){에토포시드(etoposide), 토포테칸(topotecan) 포함}, PARP 억제제{올라파립(olaparib), 니라파립(niraparib), 루카파립(rucaparib) 포함}, 미세소관 역학(microtubule dynamics)을 방해하는 물질{콤브레스타틴(combrestatin), 에리불린(eribulin), 도세탁셀(docetaxel), 탁산(taxane), 비노블라스틴(vinoblastine), 빈크리스틴(vincristine) 포함}, p53과 MDM2 또는 MDM4 사이의 상호작용을 차단하는 물질{뉴트린(nutlin), 이다사뉴트린(idasanutlin), HDM-201, DS3032b, AMG-232, ALRN-6924 포함}, 키나아제 억제제{BRAF 억제제 베무라페닙(vemurafenib), 다브라페닙(dabrafenib) 포함}, PI3K 및/또는 mTOR 억제제{LY294002, 닥톨리십(dactolisib), 라파마이신(rapamycin)과 라파마이신 유사체 템시롤리무스(temsirolimus), 에베로리무스(everolimus), 리다포롤리무스(ridaforolimus) 포함}, MRP1 억제제{인도메타신(indomethacin), 멜록시캄(meloxicam), 설린닥 설파이드(sulindac sulfide), GSK1904529A, MK571, 베라파밀(verapamil) 포함}, 저메틸화제(hypomethylation agent){아자시티딘(azacitidine), 데시타빈(decitabine) 포함}, 히스톤 탈아세틸화효소 억제제(histone deacetylase inhibitor){시르투인(cirtuin), 보리노스타트 포함 하이드록사메이트(hydroxamates including vorinostat), 벨리노스타트(belinostat), 다시노스타트(dacinostat), 파노비노스타트(panobinostat), 발프로산(valproic acid), 엔티노스타트 포함 벤즈아미드(benzamides including entinostat), 모세티노스타트(mocetinostat)를 포함함}, 프로테아좀 억제제(proteasome inhibitor){보르테조밉(bortezomib), 리토나비르(ritonavir), 카르필조밉(carfilzomib) 포함}, 항혈관 또는 항혈관형성제{2aG4, 베바시주맙(bevacizumab) 포함}, 티로신 키나아제 억제제{라파티닙(lapatinib) 포함}, EGFR 억제제{게피티닙(gefitinib) 포함}, CDK 억제제, PLK 억제제, MEK 억제제{피마세르팁(pimasertib) 포함}, 면역 체크포인트 억제제(immune checkpoint inhibitor){PD-1(니볼루맙(nivolumab), 펨브롤리주맙(pembrolizumab) 포함), PD-L1(아벨루맙(avelumab), 아테졸리주맙(atezolizumab)), PDL2, CTLA-4(이필리무맙(ipilimumab), 트레멜리무맙(tremelimumab) 포함), GITR, IL-40, CD-40, LAG3/CD-223(BMS-986016, REGN3767 포함), OX-40{포갈리주맙(pogalizumab), PF-04518600 포함}에 대한 항체를 포함함}, 항체 결합 단백질 티로신 키나아제 수용체, NFE2L2 억제제{ML385, 브루사톨(brusatol), 트리고넬린(trigonelline), 루테올린(luteolin), 아스코르브산, ATRA 포함}, 세포외 암 표적(extracellular cancer target){CD19, PSMA, 또는 메소텔린(mesothelin) 포함}을 인식하는 키메라 항원 수용체(chimeric antigen receptor, CAR)를 발현시키도록 유전적으로 조작된 자가 T 세포(autologous T cells), 글루코코르티코이드 수용체 작용제(glucocorticoid receptor agonist){덱사메타손(dexamethasone) 포함}, 부티오닌 설폭시민(buthionine sulfoximine), 엽산(folic acid), 메트포르민(metformin), 소라페닙(sorafenib), 설파살라진(sulfasalazine), 블레오마이신(bleomycin), 에를로티닙(erlotinib), 투니카마이신(tunicamycin), 보르트만닌(wortmannin), 피딜리주맙(pidilizumab), 더발루맙(durvalumab), GSK3174998, 타볼릭시주맙(tavolixizumab), 데아자네플라노신(deazaneplanocin) A 또는 피페를론구민(piperlongumine)이 포함될 수 있고, 바람직하게는 DNMT(DNA methyltransferase) 저해제(데시타빈(decitabine), 아자시티딘(azacytidine), RG-108 등) 또는 DNMT 저해제와 다른 항암 약물과의 병용요법일 수 있다.
본 발명에서, 상기 대상체는 척추 동물 또는 무척추 동물을 지칭한다. 일부 실시 양태에서, 대상체는 척추 동물, 예를 들어 포유 동물, 바람직하게는 인간이다. 일부 실시 양태에서, 상기 대상체는 개, 고양이, 돼지, 토끼, 쥐, 마우스, 저빌, 햄스터, 기니피그 및 흰 족제비와 같은 가정용 애완 동물을 포함하지만 이에 제한되지 않는 가축 또는 실험실 동물이다. 일부 구현예에서, 대상체는 가축이다. 가축 동물의 비제한적인 예로는 알파카, 들소, 낙타, 소, 사슴, 돼지, 말, 라마, 노새, 당나귀, 양, 염소, 토끼, 순록 및 야크가 포함될 수 있다.
상기 생물학적 시료는 상기 대상체에서 분리된 암 조직, 암 조직 단편, 암 세포, 혈액, 혈장, 혈구, 타액, 누액, 대변 및 소변 등을 포함하나 이에 제한되는 것은 아니다. 또는, 상기 생물학적 시료는 암 조직, 암 조직 단편, 암 세포, 혈액, 혈장, 혈구, 타액, 누액, 대변 및 소변 등에서 분리될 것일 수 있다. 또한, 상기 DNA는 조직, 세포 등에서 분리한 DNA일 수 있고, 혈액, 혈장, 체액 등에 부유하는 세포유리 DNA(cell free DNA, cfDNA) 또는 종양세포에서 흘러나온 순환 종양 DNA(circulating tumor DNA, ctDNA)일 수 있다.
게놈 DNA에서 CpG 부위의 메틸화 상태를 측정하는 방법은 당업계에 공지되어 있는 방법이 제한없이 사용될 수 있으며, 예를 들어 Ms-SNuPE, 메틸화 DNA 면역 침전(MeDip), 바이설파이트 시퀀싱(bisulfige sequencing), 바이설파이트 처리 후 차세대 염기서열 분석법, 마이크로어레이, 게놈-와이드 마이크로어레이(genome-wide microarray), PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 분자 비콘(molecular beacon), 차세대 염기서열분석 패널(NGS panel) 및 메틸화 민감성 서던 블롯팅이 포함될 수 있으며, 바람직하게는 바이설파이트 시퀀싱(bisulfige sequencing), 바이설파이트 처리 후 차세대 염기서열 분석법, 마이크로어레이 또는 게놈-와이드 마이크로어레이(genome-wide microarray) 일 수 있다.
본 발명에서 상기 바이설파이트 시퀀싱에는 WGBS(whole genome bisulfite sequencing) 및 RRBS(reduced representation bisulfite sequencing)이 포함될 수 있다.
일 양태에서, 게놈 DNA 전체 또는 이의 특정 영역에서의 CpG 메틸화는 바이설파이트 처리 후 및 선택적으로, 메틸화 부위를 증폭시킨 후 파이로시퀀싱을 통해 검출될 수 있다. 파이로시퀀싱 기술은 실시간으로 진행하는 합성별 시퀀싱 방법이다. 이는 DNA 사슬 연장시 각 데옥시뉴클레오타이드(dNTP)에서 방출되는 PPi의 간접 생체 발광 분석을 기반으로 한다. 이 방법은 exonuclease-deficient Klenow DNA polymerase의 존재하에 dNTP와 DNA template-primer complex를 제시한다. 4개의 뉴클레오티드가 미리 결정된 순서로 반응 혼합물에 순차적으로 추가된다. 뉴클레오타이드가 주형 염기에 대해 상보적이어서 통합되면 PPi가 방출된다. PPi 및 기타 시약은 루시퍼라제 반응에서 기질로 사용되어 발광계 또는 전하 결합 장치에 의해 감지되는 가시 광선을 생성한다. 생성된 빛은 DNA 프라이머에 추가된 뉴클레오타이드의 수에 비례하며 파이로그램 형태로 존재하는 뉴클레오타이드의 수와 유형을 나타내는 피크가 된다.
다른 일 양태에서, CpG의 메틸화 상태는 차세대 시퀀싱(NGS)을 이용하는 메틸화 분석에서 검출될 수 있다. 예를 들어, DNA 메틸화는 바이설파이트 전환을 통한 대규모 병렬 시퀀싱, 예를 들어 WGBS(whole genome bisulfite sequencing) 또는 RRBS(reduced representation bisulfite sequencint)에 의해 검출될 수 있다. 선택적으로, DNA 메틸화는 게놈 전체 마이크로 어레이와 같은 마이크로 어레이에 의해 검출될 수 있다. 마이크로 어레이 및 대규모 병렬 시퀀싱은 게놈 전체 규모에서 시토신 메틸화의 조사를 가능하게 한다.
DNA 메틸화를 검출하기 위한 가장 포괄적이고 가장 효율적인 방법 중 하나는 WGBS(whole genome bisulfite sequencing) 일 수 있다. 구체적으로, CpG 메틸화를 검출하기 위해, 먼저 분석할 DNA를 변환하여 메틸화되지 않은 시토신이 우라실로 변환되도록 한다. 한 실시양태에서, 메틸화 또는 탈메틸화 형태의 CpG 디뉴클레오티드 모티프를 선택적으로 변형시키는 화학 시약이 사용될 수 있다. 적합한 화학 시약에는 히드라진 및 바이설파이트 등이 포함될 수 있다. 바람직하게는, 분리된 DNA는 메틸화 시토신을 유지하면서 메틸화되지 않은 시토신을 우라실로 전환하는 바이설파이트로 처리될 수 있다. 시토신은 바이설파이트 이온과 반응하여 탈아미노화에 민감한 설폰화 시토신 반응 중간체를 형성하여 설폰화 우라실을 생성한다. 설폰화된 그룹은 알칼리 조건에서 제거되어 우라실을 형성할 수 있다. 뉴클레오타이드 변환은 DNA의 서열을 변경시킨다. 우라실은 DNA 중합 효소에 의해 티민으로 인식된다. 따라서 PCR 또는 시퀀싱 후 결과물은 출발 주형 DNA에서 5-메틸 시토신이 발생하는 위치에서만 시토신을 포함한다. 이것은 메틸화되지 않은 시토신과 메틸화된 시토신을 구별할 수 있게 한다.
본 발명의 일 양태에서, 상기 인접 CpG 부위 메틸화의 무질서도는 하기 단계를 포함하는 방법에 따라 평가될 수 있다:
(i) 게놈 DNA 내 하나 이상의 영역에서, 각각의 CpG 부위에 매핑된 시퀀싱 리드(sequencing read)에 포함된 CpG 부위가 모두 메틸화된 또는 모두 탈메틸화된 시퀀싱 리드의 수(A), 및 이를 제외한 나머지 시퀀싱 리드의 수(B)를 산출하는 단계;
(ii) 각각의 CpG 부위 메틸화의 무질서도 = B/(A+B) 값을 산출하는 단계; 및
(iii) 상기 게놈 DNA 내 하나 이상의 영역에 포함된 모든 CpG 부위에서 산출된 각각의 메틸화의 무질서도의 평균값을 산출하는 단계.
인접 CpG 부위 메틸화의 무질서도 산출을 위해서 가장 먼저 시퀀싱 리드를 참조 서열에 매핑하여 해당 시퀀싱 리드가 게놈 DNA의 어느 영역에 대응하는지 확인한다. 이 결과로부터 메틸화 무질서도는 다음과 같이 계산된다.
참조 서열 내 각각의 CpG 부위에 대해서, 해당 부위에 대응하는 (즉 해당 부위에 매핑된) 시퀀싱 리드가 포함하는 CpG 부위 중 서로 인접하는 2 내지 20개의 CpG 부위가 모두 메틸화된 또는 모두 탈메틸화된 시퀀싱 리드의 수 (A) 및 이를 제외한 나머지 시퀀싱 리드의 수 (B)를 계산한다. 그 다음으로 메틸화 무질서도는 B/(A+B)로 계산된다.
구체적으로,
(특정 CpG 부위-수준 메틸화의 무질서도 계산) 이를테면, 게놈 DNA 내 특정한 CpG 부위(x)에 매핑된 시퀀싱 리드가 총 100개이고, 해당 리드에 포함된, x를 포함한 모든 CpG 부위가 메틸화된 리드의 수가 35개, 그리고 리드에 포함된 x를 포함한 모든 CpG 부위가 탈메틸화된 리드의 수가 5개라 가정하면, 리드 내에 메틸화된 CpG 부위와 탈메틸화된 CpG 부위가 동시에 존재하는 리드의 수는 100-35-5=60개이므로, 상기 단계 (ii)에서 계산되는 메틸화의 무질서도는 60/100 = 0.6으로 계산된다.
(게놈 전체 또는 게놈 내 특정 영역-수준 메틸화의 무질서도 계산) 전술한 특정 CpG 부위-수준에서 메틸화의 무질서도를 기초로, 게놈 DNA 전체 또는 게놈 DNA 내 특정에 대해서 메틸화의 무질서도 계산이 수행된다. 이 경우, 게놈 전체 또는 게놈 내 특정 영역-수준에서 메틸화의 무질서도는 그 수치를 계산하고자 하는 게놈 DNA 전체 또는 게놈 DNA 내 하나 이상의 영역에 포함된 모든 CpG 부위에서의 특정 CpG 부위-수준 메틸화의 무질서도 수치의 평균으로 정의된다.
평균값 계산에 포함되는 CpG 부위는, 바람직하게는 적어도 4개 이상의 CpG 부위를 동시에 포함하는 11개 이상의 리드에 매핑되는 CpG 부위일 수 있다.
본 발명의 다른 일 양태에서, 상기 인접 CpG 부위 메틸화의 무질서도는 에피폴리몰피즘(epipolymorphism), 메틸화 엔트로피(methylation entropy), 메틸화 반수체 부하(Methylation haplotype load, MHL), Fraction of discordant read pair(FDRP) 또는 정량적 FDRP(quantitative FDRP)에 의해 산출될 수 있다.
에피폴리몰피즘과 메틸화 엔트로피 계산에 바탕이 되는 개념은 후성대립유전자(epiallele)이다. 아래 계산들에서 후성대립유전자는 연속된 4개 CpG 부위가 이루는 메틸화 상태의 조합 혹은 패턴으로 정의된다. 각 CpG 부위는 메틸화(1) 혹은 탈메틸화(0)의 두가지 상태를 가지므로, 하나의 후성대립유전자를 이루는 4개의 CpG 부위가 만들어내는 메틸화 상태의 패턴은 총 2*2*2*2=16개이다(모두 탈메틸화된 (0, 0, 0, 0) 패턴부터, 모두 메틸화된 (1, 1, 1, 1) 패턴까지). 따라서, 4개 CpG 부위에 해당하는 특정 게놈 영역에서 발생할 수 있는 후성대립유전자의 종류는 총 16개가 된다.
직관적으로, 메틸화의 무질서도가 증가하면 후성대립유전자의 종류 또한 다양해질 수 있다. 무질서도가 작은 지역은 모두 메틸화된, 혹은 모두 탈메틸화된 후성대립유전자가 지배적으로 나타날 것이고, 무질서도가 큰 지역은 그 이외의 후성대립유전자 또한 많이 등장할 것이기 때문이다. 이 개념에 근거하여 에피폴리몰피즘과 메틸화 엔트로피는 다음과 같이 후성대립유전자의 다양성을 계산함으로써 메틸화의 무질서도가 계산된다.
먼저 에피폴리몰피즘은 생태학에서 종 다양성을 측정하는데 사용되는 지니-심슨 지수(Gini-Simpson index)의 계산 방법을 차용하여 계산하는 방법이다. 먼저 에피폴리몰피즘을 계산하고자 하는 4개의 CpG 부위를 모두 포함하는 시퀀싱 리드를 순회하며, 4개의 CpG 부위가 만드는 16개의 가능한 후성대립유전자 각각의 빈도를 측정한다. 16개의 후성대립유전자 상대 빈도 값을 p_i (i=1, 2, 쪋 16)이라 할 때, 에피폴리몰피즘은 아래와 같이 계산된다.
Figure PCTKR2022017269-appb-img-000001
이 값은 16개의 후성대립유전자 패턴 중 단 하나의 패턴만이 나타날 때 0으로 가장 작아지고, 16개의 모든 패턴의 상대 빈도가 1/16으로 동일할 때 최대가 된다. 따라서 패턴의 다양성을 측정하는 척도가 될 수 있고, 이는 곧 메틸화의 무질서도를 측정할 수 있음을 의미한다.
메틸화 엔트로피 값은 에피폴리몰피즘과 유사하게 후성대립유전자의 상대적 다양성을 측정하는 방법으로서 지니-심슨 지수 대신 섀넌 엔트로피(Shannon entropy)를 사용한다는 점에서 차이가 있다. 메틸화 엔트로피 값은 아래와 같이 계산된다.
Figure PCTKR2022017269-appb-img-000002
이 값 역시 16개의 후성대립유전자 종류 중 단 하나만 나타날 때 0으로 가장 작아지고, 16개의 모든 패턴의 상대 빈도가 1/16으로 동일할 때 최대가 된다.
메틸화 반수체 부하(Methylation haplotype load, MHL)는 그 목적이 메틸화 상태의 상관성이 국소적으로 매우 높은 지역을 검출해내는 것이다. 메틸화 반수체 부하는 각 시퀀싱 리드가 포함하는 CpG 부위 메틸화 상태를 기준으로, 그 안에 포함된 완전메틸화 부분열(fully-methylated substring)을 찾아내는 방법으로 계산된다. 수식적으로는 아래와 같이 나타낼 수 있다.
Figure PCTKR2022017269-appb-img-000003
여기서 P(MH_i)는 i개의 CpG 부위를 갖는 부분열 중 모든 CpG 부위가 메틸화된 부분열의 비율을 나타내며, w_i는 부분열의 길이에 부여되는 가중치이다. 보통은 w_i = i, 즉 부분열의 길이 자체를 가중치로 사용하나, 길이가 긴 메틸화 반수체에 더 큰 가중치를 부여하기 위해서는 w_i = i^2 을 사용할 수도 있다.
예를 들어서, 어떤 시퀀싱 리드가 있고, 그 안에는 총 5개의 CpG 부위가 존재하고, 각각의 메틸화 상태는 0, 1, 1, 1, 0 이라 가정한다(0=탈메틸화, 1=메틸화). 다음으로, 모든 길이의 부분열을 생각한다. 먼저 길이 1의 부분열은 각각 0, 1, 1, 1, 0 이 있고, 그 중 완전메틸화 부분열은 1, 1, 1의 3개로 완전메틸화 부분열의 비율은 3/5 = 0.6 이다. 다음으로 길이 2의 부분열은 01, 11, 11, 10이 있고, 그 중 완전메틸화 부분열은 11, 11의 2개로 완전메틸화 부분열의 비율은 2/4 = 0.5 이다. 이 값에 가중치 2를 곱한다. 마찬가지로 길이 3의 부분열은 011, 111, 110 이 있고, 그 중 완전메틸화 부분열은 111로 그 비율은 1/3 이다. 이 값에 가중치 3을 곱한다. 길이 4의 부분열은 0111, 1110의 2개지만, 이 중에는 완전메틸화 부분열은 없다. 결과적으로 이 시퀀싱 리드의 메틸화 반수체 부하는 (3/5 * 1 + 2/4 * 2 + 1/3 * 3) / (1 + 2 + 3 + 4) = 0.26이 된다.
Fraction of discordant read pair(FDRP)는 단일 CpG 부위 수준으로 DNA 메틸화의 무질서도를 측정하는 방법이다. 가장 먼저 특정 CpG 부위 x의 FDRP 값을 계산하고자 할 때, x를 포함하는 시퀀싱 리드의 집합을 모두 고려하여 생각한다. 이 집합을 S라 하면, S 안의 모든 시퀀싱 리드 쌍 s_i, s_j 에 대해서 s_i와 s_j에 공통적으로 포함된 CpG 부위의 메틸화 상태가 적어도 하나의 CpG 부위에서 다르다면 s_i와 s_j는 불일치 리드 쌍(discordant read pair)으로 정의한다. FDRP는 불일치 리드 쌍의 개수를 S 안의 모든 시퀀싱 리드 쌍의 개수로 나눔으로써 구해진다.
예를 들어서, S에 포함된 두 시퀀싱 리드 s_i, s_j 가 4개의 CpG 부위 x, y, z, w를 공통으로 가진다고 가정하고, (x에 대한 FDRP를 계산 중이므로, 임의의 두 리드 쌍을 골라도 공통적인 CpG 부위들에는 항상 x가 포함되어 있음에 유의) s_i 상의 x, y, z, w의 메틸화 상태를 1, 1, 1, 1 (0=탈메틸화, 1=메틸화)이라 하고, s_j 상의 x, y, z, w의 메틸화 상시 1, 1, 0, 1 이라 한다면, 두 시퀀싱 리드 쌍은 CpG 부위 z의 메틸화 상태가 다르므로 불일치 리드 쌍이 되는 것이다. S 안의 리드 쌍들 중 위와 같은 불일치 리드 쌍의 비율을 측정한 것이 FDRP 값이 된다.
한편, quantitative FDRP (qFDRP)의 경우는 불일치의 기준을 이분법적으로 판단하는 것이 아니라, 해밍 거리(hamming distance)를 기준으로 soft하게 계산하는 방법이다. 다시 말해 특정 CpG 부위 x를 포함하는 모든 시퀀싱 리드의 집합 S가 있다고 할 때, S의 시퀀싱 리드 쌍 s_i, s_j 가 공통적으로 가지는 CpG 부위 중 서로 다른 메틸화 상태를 가지는 부위의 비율의 기댓값이다.
예를 들어서, CpG 부위 x를 포함하는 시퀀싱 리드의 집합 S={s_1, s_2, s_3}로 총 3개의 시퀀싱 리드가 있다고 가정하면, s_1과 s_2는 공통적으로 4개의 CpG 부위를 포함하며 그 중 1개의 CpG 부위가 서로 다르다고 하면 이 경우 두 리드의 해밍 거리는 1이 되고, 서로 다른 메틸화 상태를 가지는 부위의 비율은 1/4 = 0.25이다. 같은 방법으로 (s_2, s_3)쌍, (s_3, s_1)쌍에 대해서 이 값을 계산했을 때 각각 0.5, 0.2가 나왔다고 하면, 전체 qFDRP 값은 (0.25 + 0.5 + 0.2) / 3 = 0.316이 되는 것이다.
본 발명의 다른 일 양태에서, 상기 인접 CpG 부위 메틸화의 무질서도는 하기 단계를 포함하는 방법에 따라 평가될 수 있다:
(i) 게놈 DNA 내 하나 이상의 영역에 대응되는 시퀀싱 리드에서, 2 내지 100bp로 이루어진 군에서 선택된 어느 하나 이상의 거리에 인접하게 위치한 두 개의 CpG 부위가 모두 메틸화된 또는 모두 탈메틸화된 시퀀싱 리드의 수(A), 및 이를 제외한 나머지 시퀀싱 리드의 수(B)를 산출하는 단계; 및
(ii) 상기 각 거리에 인접하게 위치한 인접 CpG 부위 메틸화의 무질서도 = B/(A+B) 값을 산출하는 단계.
일반적으로 게놈 DNA의 서열 분석시 시퀀싱 리드는 100 염기쌍 (bp) 내외의 길이를 갖을 수 있으며, 상기 단계 (i)에서는 게놈 DNA 내 하나 이상의 영역(예를 들어, 게놈 DNA 전체, 이가성 도메인(bivalent domain), 프로모터, 인핸서, 엑손, 인트론, 5'- 비번역영역(UTR), 3'-UTR, 유전자체(Gene body), 줄기 세포 관련 영역, CpG 섬(CpG island), CpG 쇼어(CpG shore), LTR(long terminal repeat), LINE(long interspersed nuclear element), SINE(short interspersed nuclear element), CpG 쉘프(shelf), 메틸화 케니언(methylation canyon) 및 인터제닉 영역(intergenic region)으로 이루어진 군에서 선택된 영역)에 대응되는 시퀀싱 리드에 포함된 복수의 CpG 부위들 중에서 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp, 20 bp, 21 bp, 22 bp, 23 bp, 24 bp, 25 bp, 26 bp, 27 bp, 28 bp, 29 bp, 30 bp, 31 bp, 32 bp, 33 bp, 34 bp, 35 bp, 36 bp, 37 bp, 38 bp, 39 bp, 40 bp, 41 bp, 42 bp, 43 bp, 44 bp, 45 bp, 46 bp, 47 bp, 48 bp, 49 bp, 50 bp, 51 bp, 52 bp, 53 bp, 54 bp, 55 bp, 56 bp, 57 bp, 58 bp, 59 bp, 60 bp, 61 bp, 62 bp, 63 bp, 64 bp, 65 bp, 66 bp, 67 bp, 68 bp, 69 bp, 70 bp, 71 bp, 72 bp, 73 bp, 74 bp, 75 bp, 76 bp, 77 bp, 78 bp, 79 bp, 80 bp, 81 bp, 82 bp, 83 bp, 84 bp, 85 bp, 86 bp, 87 bp, 88 bp, 89 bp, 90 bp, 91 bp, 92 bp, 93 bp, 94 bp, 95 bp, 96 bp, 97 bp, 98 bp, 99 bp 또는 100 bp의 유전적 거리를 갖는 두 개의 CpG 부위의 메틸화 상태를 평가할 수 있다.
이와 같은 방식으로, 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에 포함된 CpG 부위들에 중에서 2 내지 100 bp로 이루어진 군에서 선택된 어느 하나의 유전적 거리를 갖는 인접한 두 개의 CpG 부위의 메틸화 상태를 비교하여 평가함으로써, 게놈 DNA 내에 해당 유전적 거리를 갖는 모든 두 개의 인접 CpG 부위마다, 모두 메틸화된 또는 모두 탈메틸화된 시퀀싱 리드의 수(A) 및 이를 제외한 나머지 시퀀싱 리드의 수(B)를 산출할 수 있다.
이후 상기 단계 (ii)에서는 상기 2 내지 100 bp로 이루어진 군에서 선택된 어느 하나의 유전적 거리를 갖는 인접한 두 개의 CpG 부위에 대해 하기 식에 따라 인접 CpG 부위 메틸화의 무질서도를 산출할 수 있다:
[인접 CpG 부위 메틸화의 무질서도 = B/(A+B)]
상기 식에 따라, 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에 포함된 CpG 부위들 중에서 해당 유전적 거리에 인접한 CpG 부위 메틸화의 무질서도가 모두 산출이 되면, 이의 평균값을 해당 유전적 거리에 대한 [인접 CpG 부위 메틸화의 무질서도] 값 및 상기 대상체의 [인접 CpG 부위 메틸화의 무질서도]로 할 수 있다.
본 발명의 일 양태에서는, 상기 단계 (i) 및 (ii)에서 2 이상의 유전적 거리를 갖는 각각의 인접한 두 개의 CpG 부위에 대한 [인접 CpG 부위 메틸화의 무질서도] 값을 산출한 후, 이들의 평균값을 산출할 수 있다. 예를 들어, 유전적 거리가 2 bp인 인접한 두 개의 CpG 부위에 대한 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에서의 [인접 CpG 부위 메틸화의 무질서도] 값을 산출하고, 이와 독립적으로 유전적 거리가 3 bp인 인접한 두 개의 CpG 부위에 대한 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에서의 [인접 CpG 부위 메틸화의 무질서도] 값을 산출한 후 이들의 평균값을 상기 대상체의 [인접 CpG 부위 메틸화의 무질서도]로 할 수 있다. 이와 같은 방식으로, 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에 포함된 CpG 부위들에 중에서 2 내지 100 bp로 이루어진 군에서 선택된 하나 이상의 유전적 거리를 갖는 인접한 두 개의 CpG 부위의 [인접 CpG 부위 메틸화의 무질서도] 값을 각각 독립적으로 산출한 후 이들의 평균값을 상기 대상체의 [인접 CpG 부위 메틸화의 무질서도]로 할 수 있다.
바람직하게는, 상기 단계 (i)에서 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에 포함된 CpG 부위들에 중에서 2 내지 50 bp, 보다 더 바람직하게는 2 내지 30 bp, 가장 바람직하게는 2 내지 25 bp로 이루어진 군에서 선택된 어느 하나 이상의 유전적 거리를 갖는 인접한 두 개의 CpG 부위의 메틸화 상태를 비교하여 평가함으로써, 상기 대상체의 [인접 CpG 부위 메틸화의 무질서도] 값을 산출할 수 있다.
본 발명의 일 실시예에 따르면, 상기 방식에 따라 게놈 DNA 전체 또는 게놈 DNA 내 특정 영역에 포함된 CpG 부위들에서의 [인접 CpG 부위 메틸화의 무질서도] 값이 높은 대상체일수록 항암제에 대한 반응성이 높은 것으로 확인이 되었다.
따라서, 인접 CpG 부위 메틸화의 무질서도가 높은 대상체일수록 항암제에 대한 반응성이 높을 것으로 예측하는 것이 본 발명의 특징일 수 있다.
특히, [인접 CpG 부위 메틸화의 무질서도]에 근거한 항암제 반응성의 예측은 메틸화 수준(level) 분석을 통해서는 항암제 반응성 예측이 어려운 항암제에서 특히 유용한 것으로 확인되었다.
본 발명의 방법에 따르면, 게놈 DNA 내 CpG 부위의 메틸화 무질서도를 통해 항암제 약물 반응성을 정확하게 예측할 수 있어 암 환자의 치료를 위한 약물 선택에 매우 유용하게 활용될 수 있다.
도 1은 본 발명의 실시예에서 [인접 CpG 부위 메틸화의 무질서도]의 한 예시로서 LPMD 값 산출 방법을 나타낸 모식도이다.
도 2는 급성골수성백혈병 암 세포주 DNA 전체에서의 [인접 CpG 부위 메틸화의 무질서도(LPMD)]와 표시된 각 항암제의 약물반응곡선 아래의 면적(AUDRC)의 상관관게를 나타낸 도면이다.
도 3 내지 도 11은 급성골수성백혈병 암 세포주 DNA 특정 영역에서의 [인접 CpG 부위 메틸화의 무질서도]와 표시된 각 항암제의 약물반응곡선 아래의 면적(AUDRC)의 상관관게를 나타낸 도면이다.
도 12는 급성골수성백혈병 진단 환자 중 탈메틸화제 항암제 (Decitabine 혹은 Azacitinde) 처방을 받은 총 22명의 환자의 혈액 샘플에서 이가성 도메인을 포함하는, 각 유전체의 DNA 메틸화 무질서도를 잘 대표하는 것으로 확인된 454개의 유전체 지역의 [인접 CpG 부위 메틸화의 무질서도(LPMD)]값과 환자의 약물 반응성의 상관관계를 나타낸 도면이다.
이하, 본 발명을 하기 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명이 이들에 의해 제한되는 것은 아니다.
실시예 1: In vitro 분석
[인접 CpG 부위 메틸화의 무질서도] 값과 항암제 반응성과의 상관관계를 확인하기 위하여 하기 실험을 실시하였다.
먼저 Cancer Cell Line Encyclopedia (CCLE)에 등재된 급성골수성백혈병 암세포주에 대한 RRBS 시퀀싱 결과를 이용하였다. 참조 서열에 맵핑된 시퀀싱 리드에서 유전적 거리가 2bp에 위치한 인접한 두 개의 CpG에 대한 메틸화 상태를 확인한 후, 두 개 모두 메틸화 되어 있거나 또는 두 개 모두 탈메틸화 되어 있는 시퀀싱 리드의 수 (A) 및 이를 제외한 시퀀싱 리드의 수(B)를 산출하고, B/(A+B) = [유전적 거리가 2bp인 인접 CpG 부위 메틸화의 무질서도] 값으로 하였다(도 1).
이와 동일한 방식으로, 참조 서열에 맵핑된 시퀀싱 리드에서 유전적 거리가 3bp, 4bp, 5bp, 6bp, 7bp, 8bp, 9bp, 10bp, 11bp, 12bp, 13bp, 14bp, 15bp, 16bp, 17bp, 18bp, 19bp, 20bp, 21bp, 22bp, 23bp 또는 24bp인 인접한 두 개의 CpG에 대한 각각의 [인접 CpG 부위 메틸화의 무질서도] 값을 산출한 후, 상기 유전적 거리가 2bp 내지 24bp인 각각의 인접 CpG 부위 메틸화의 무질서도 값을 평균냈다. 상기 평균값을 해당 암세포주의 [인접 CpG 부위 메틸화의 무질서도] 값으로 하고 이를 LPMD값이라 명명한다.
한편 해당 암세포주의 항암제 반응성 값을 [약물반응곡선 아래의 면적] (AUDRC)의 형태로 Cancer Therapeutics Response Portal (CTRP) 로부터 얻어 준비하였다. 본 실시예는 DNMT 저해제인 데시타빈 (데시타빈 단독, 데시타빈과 나비토클락스의 병용투여, 데시타빈과 카보플라틴의 병용투여), 그리고 RG-108에 대한 약물반응성에 대한 결과를 제시한다.
이에 대한 결과를 도 2에 나타내었다.
도 2에 나타낸 바와 같이, 상기 4개의 약물 처리군에 대하여 급성골수성백혈병 암세포주들의 DNA 전체에서의 [인접 CpG 부위 메틸화의 무질서도] 값과 각 약물에 대한 AUDRC 값이 유의미한 음의 상관관계를 보임을 확인할 수 있다. 이 때, AUDRC 값의 감소는 해당 암세포주의 좋은 약물반응성을 의미하므로, [인접 CpG 부위 메틸화의 무질서도] 값이 항암제 약물 반응성에 대한 예측력을 갖는다는 사실을 알 수 있다.
또한, 도 3 내지 도 11에 나타낸 바와 같이, DNA 내 특정 영역에서의 [인접 CpG 부위 메틸화의 무질서도] 값도 각 약물에 대한 AUDRC 값과 유의미한 음의 상관관계를 나타내는 것으로 보아 [인접 CpG 부위 메틸화의 무질서도]의 약물 예측력은 게놈 DNA 전체뿐만 아니라 게놈 DNA 내 특정 영역에서도 발휘될 수 있다는 것을 확인할 수 있다.
실시예 2: 임상 데이터 분석
서울대학교병원 내원 급성골수성백혈병 진단 환자 중 탈메틸화제 항암제 (Decitabine 혹은 Azacitinde) 처방을 받은 총 22명의 환자의 혈액 샘플에 대하여 targeted 바이설파이트 시퀀싱 데이터를 생산하였다. 시퀀싱을 수행한 지역은 주로 이가성 도메인을 포함하는, 각 유전체의 DNA 메틸화 무질서도를 잘 대표하는 것으로 확인된 454개의 유전체 지역이다. 탈메틸화제 반응성에 따라 환자를 9개월 이상 생존하였거나 완전관해가 일어난 환자군 (좋은 반응성, good response), 그리고 그렇지 않은 환자군 (poor response)의 두 군으로 분류하였다.
이에 대한 결과를 도 12에 나타내었다.
도 12에 나타낸 바와 같이, 좋은 반응성을 보이는 환자군에서 인접 CpG 부위 메틸화의 무질서도 값의 한 예인 LPMD 값이 유의미하게 감소되어 있는 것을 확인하였다 (Mann-Whitney U test p=0.017). 본 결과에서 LPMD는 거리 2 내지 16까지의 CpG 쌍들을 이용하여 계산되었다. 이는 단지 세포주에서 뿐 아니라 실제 환자의 혈액 샘플에서도 메틸화 무질서도의 수준이 항암제 반응성과 연관되어 있음을 보이는 결과로서, 본 발명의 임상적 활용 가능성을 제시한다.
본 발명의 방법에 따르면, 게놈 DNA 내 CpG 부위의 메틸화 무질서도를 통해 항암제 약물 반응성을 정확하게 예측할 수 있어 암 환자의 치료를 위한 약물 선택에 매우 유용하게 활용될 수 있어 산업상 이용가능성이 매우 높다.

Claims (14)

  1. 암 환자의 항암제 반응성 예측에 필요한 정보를 제공하기 위하여,
    (a) 대상체(subject)로부터 분리된 생물학적 시료에서 게놈 DNA를 분리하는 단계;
    (b) 상기 분리된 게놈 DNA에서 CpG 부위의 메틸화 상태를 측정하는 단계; 및
    (c) 게놈 DNA 내 하나 이상의 영역에서의 인접 CpG 부위 메틸화의 무질서도를 평가하는 단계를 포함하는, 게놈 DNA 내 인접 CpG 부위의 메틸화 상태를 평가하는 방법.
  2. 제1항에 있어서, 상기 암은 대장암, 유방암, 신경교종, 갑상선암, 폐암, 간암, 췌장암, 두경부암, 위암, 요로상피암, 신장암, 전립선암, 고환암, 자궁경부암, 난소암, 자궁내막암, 흑색종양, 난관암, 자궁암, 혈액암, 골암, 피부암, 뇌암, 질암, 내분비암, 부갑상선암, 요관암, 요도암, 기관지암, 방광암, 골수암, 급성 골수성 백혈병, 급성 림프구성 또는 림프아구성 백혈병, 급성 또는 만성의 림포구성 백혈병, 급성 비림프구성 백혈병, 뇌종양, 경관암, 만성 골수성 백혈병, 장암, T-존 림프종, 식도암, 담즙 방광암, 유잉 육종 (Ewing's sarcoma), 설암, 홉킨스 림프종, 카포시스 육종, 중피종, 다발성 골수종, 신경아세포종, 비홉킨 림프종, 골육종, 신경아세포종, 유선암, 경관암, 페니스암, 레티노블라스토마, 피부암, 및 자궁암으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 항암제는 DNMT(DNA methyltransferase) 저해제를 포함하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서, 상기 DNMT 저해제는 데시타빈(decitabine), 아자시티딘(azacytidine), RG-108 및 이의 염으로 이루어진 군에서 선택되는 1 이상인 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 생물학적 시료는 암 조직, 암 조직 단편, 암 세포, 혈액, 혈장, 혈구, 타액, 누액, 대변 및 소변으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
  6. 제1항에 있어서, 메틸화 상태를 측정하는 방법은 Ms-SNuPE, 메틸화 DNA 면역 침전(MeDip), 바이설파이트 시퀀싱(bisulfige sequencing), 바이설파이트 처리 후 차세대 염기서열 분석법, 마이크로어레이, 게놈-와이드 마이크로어레이(genome-wide microarray), PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 분자 비콘(molecular beacon), 차세대 염기서열분석 패널(NGS panel) 및 메틸화 민감성 서던 블롯팅으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
  7. 제6항에 있어서, 상기 바이설파이트 시퀀싱은 WGBS(whole genome bisulfite sequencing) 또는 RRBS(reduced representation bisulfite sequencing)인 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 상기 게놈 DNA 내 하나 이상의 영역은 게놈 DNA 전체, 이가성 도메인(bivalent domain), 프로모터, 인핸서, 엑손, 인트론, 5'- 비번역영역(UTR), 3'-UTR, 유전자체(Gene body), 줄기 세포 관련 영역, CpG 섬(CpG island), CpG 쇼어(CpG shore), LTR(long terminal repeat), LINE(long interspersed nuclear element), SINE(short interspersed nuclear element), CpG 쉘프(shelf), 메틸화 케니언(methylation canyon) 및 인터제닉 영역(intergenic region)으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
  9. 제1항에 있어서, 상기 인접 CpG 부위 메틸화의 무질서도는 하기 단계를 포함하는 방법에 따라 평가하는 것을 특징으로 하는 방법:
    (i) 게놈 DNA 내 하나 이상의 영역에서, 각각의 CpG 부위에 매핑된 시퀀싱 리드(sequencing read)에 포함된 CpG 부위가 모두 메틸화된 또는 모두 탈메틸화된 시퀀싱 리드의 수(A), 및 이를 제외한 나머지 시퀀싱 리드의 수(B)를 산출하는 단계;
    (ii) 각각의 CpG 부위 메틸화의 무질서도 = B/(A+B) 값을 산출하는 단계; 및
    (iii) 상기 게놈 DNA 내 하나 이상의 영역에 포함된 모든 CpG 부위에서 산출된 각각의 메틸화의 무질서도의 평균값을 산출하는 단계.
  10. 제1항에 있어서, 상기 인접 CpG 부위 메틸화의 무질서도는 하기 단계를 포함하는 방법에 따라 평가하는 것을 특징으로 하는 방법:
    (i) 게놈 DNA 내 하나 이상의 영역에 대응되는 시퀀싱 리드에서, 2 내지 100bp로 이루어진 군에서 선택된 어느 하나 이상의 거리에 인접하게 위치한 두 개의 CpG 부위가 모두 메틸화된 또는 모두 탈메틸화된 시퀀싱 리드의 수(A), 및 이를 제외한 나머지 시퀀싱 리드의 수(B)를 산출하는 단계; 및
    (ii) 상기 각 거리에 인접하게 위치한 인접 CpG 부위 메틸화의 무질서도 = B/(A+B) 값을 산출하는 단계.
  11. 제10항에 있어서, 상기 (ii) 단계 이후에 각 거리에 인접하게 위치한 인접 CpG 부위 메틸화의 무질서도 평균값을 산출하는 단계를 추가로 수행하는 것을 특징으로 하는 방법.
  12. 제1항에 있어서, 상기 인접 CpG 부위 메틸화의 무질서도는 에피폴리몰피즘(epipolymorphism), 메틸화 엔트로피(methylation entropy), 메틸화 반수체 부하(Methylation haplotype load, MHL), Fraction of discordant read pair(FDRP) 또는 정량적 FDRP(quantitative FDRP)에 의해 따라 평가하는 것을 특징으로 하는 방법.
  13. 제1항에 있어서, 인접 CpG 부위 메틸화의 무질서도가 높은 대상체일수록 항암제에 대한 반응성이 높을 것으로 예측하는 것을 특징으로 하는 방법.
  14. 제1항에 있어서, 상기 대상체는 척추 동물 또는 무척추 동물을 지칭하는 것을 특징으로 하는 방법.
PCT/KR2022/017269 2021-11-05 2022-11-04 게놈 dna 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법 WO2023080722A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP22890453.8A EP4428250A1 (en) 2021-11-05 2022-11-04 Method for predicting reactivity to anticancer drugs by analyzing genomic dna methylation status

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0151412 2021-11-05
KR1020210151412A KR20230065638A (ko) 2021-11-05 2021-11-05 게놈 dna 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법

Publications (1)

Publication Number Publication Date
WO2023080722A1 true WO2023080722A1 (ko) 2023-05-11

Family

ID=86241931

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/017269 WO2023080722A1 (ko) 2021-11-05 2022-11-04 게놈 dna 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법

Country Status (3)

Country Link
EP (1) EP4428250A1 (ko)
KR (1) KR20230065638A (ko)
WO (1) WO2023080722A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020520235A (ja) * 2017-05-12 2020-07-09 プレジデント アンド フェローズ オブ ハーバード カレッジ ユニバーサル早期がん診断
KR20210151412A (ko) 2020-06-05 2021-12-14 이상준 운송장치의 경보시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020520235A (ja) * 2017-05-12 2020-07-09 プレジデント アンド フェローズ オブ ハーバード カレッジ ユニバーサル早期がん診断
KR20210151412A (ko) 2020-06-05 2021-12-14 이상준 운송장치의 경보시스템

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FEINBERG ANDREW P., KOLDOBSKIY MICHAEL A., GÖNDÖR ANITA: "Epigenetic modulators, modifiers and mediators in cancer aetiology and progression", NATURE REVIEWS GENETICS, NATURE PUBLISHING GROUP, GB, vol. 17, no. 5, 1 May 2016 (2016-05-01), GB , pages 284 - 299, XP093063111, ISSN: 1471-0056, DOI: 10.1038/nrg.2016.13 *
KOLDOBSKIY MICHAEL A., ABANTE JORDI, JENKINSON GARRETT, PUJADAS ELISABET, TETENS ASHLEY, ZHAO FEIFEI, TRYGGVADOTTIR RAKEL, IDRIZI : "A Dysregulated DNA Methylation Landscape Linked to Gene Expression in MLL-Rearranged AML", EPIGENETICS, LANDES BIOSCIENCE, US, vol. 15, no. 8, 2 August 2020 (2020-08-02), US , pages 841 - 858, XP093063110, ISSN: 1559-2294, DOI: 10.1080/15592294.2020.1734149 *
SHI JIEJUN, XU JIANFENG, CHEN YILING ELAINE, LI JASON SHENG, CUI YA, SHEN LANLAN, LI JINGYI JESSICA, LI WEI: "The concurrence of DNA methylation and demethylation is associated with transcription regulation", NATURE COMMUNICATIONS, vol. 12, no. 1, 6 September 2021 (2021-09-06), pages 5285, XP093063112, DOI: 10.1038/s41467-021-25521-7 *
WENHUA LV, MENGYING ZHANG, JIANG ZHU, MIN ZHANG, CE CI, SHIPENG SHANG, YANJUN WEI, HUI LIU, XIN LI, YAN ZHANG: "Exploration of drug-response mechanism by integrating genetics and epigenetics across cancers", EPIGENOMICS, FUTURE MEDICINE LTD., UNITED KINGDOM, vol. 10, no. 7, 1 July 2018 (2018-07-01), United Kingdom , pages 993 - 1010, XP009546012, ISSN: 1750-1911, DOI: 10.2217/epi-2017-0162 *

Also Published As

Publication number Publication date
KR20230065638A (ko) 2023-05-12
EP4428250A1 (en) 2024-09-11

Similar Documents

Publication Publication Date Title
JP6578205B2 (ja) 癌におけるマイクロサテライト不安定性を検出しdna塩基除去修復経路の阻害による合成致死性を決定するための新規なマーカー
US20200255913A1 (en) Novel Markers for Detecting Microsatellite Instability in Cancer and Determining Synthetic Lethality with Inhibition of the DNA Base Excision Repair Pathway
Brenet et al. DNA methylation of the first exon is tightly linked to transcriptional silencing
US10294529B2 (en) Microsatellite instability markers in detection of cancer
Karimi et al. LUMA (LUminometric Methylation Assay)—a high throughput method to the analysis of genomic DNA methylation
EP2885427B1 (en) Colorectal cancer methylation marker
US11761041B2 (en) PARK2 as epigenetic marker for the identification of immune cells, in particular monocytes
WO2023080722A1 (ko) 게놈 dna 메틸화 상태 분석을 통한 항암제 약물 반응성 예측 방법
WO2016080750A1 (ko) 암 유전체 돌연변이 검출용 유전자 패널
Grzemski et al. and Genes are Not Promising Markers for Obesity in Labrador Retriever Dogs
WO2021054713A1 (ko) Dna 메틸화 변이를 이용한 면역항암치료 반응성 예측방법
Epplen et al. Indirect gene diagnoses for complex (multifactorial) diseases-a review
WO2017164436A1 (ko) 고형암 환자의 항암제 치료 반응성 예측용 마커
Diboun et al. Epigenetic DNA methylation signatures associated with the severity of paget’s disease of bone
Gil et al. Comprehensive detection of CRLF2 alterations in acute lymphoblastic leukemia: a rapid and accurate novel approach
WO2024029988A1 (ko) 세포유리 dna를 이용한 관상동맥 측부순환 예측용 바이오마커 조성물, 키트 및 정보제공방법
WO2020111809A1 (ko) 조혈모세포 이식 후 혈액암 예후 예측을 위한 정보 제공 방법
WO2023055128A1 (ko) Line-1의 dna 메틸화 변이를 이용한 면역항암치료 반응성 예측방법
KR102280575B1 (ko) Gfi1 또는 alox5ap 유전자의 메틸화 수준을 이용한 비만의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
WO2023211004A1 (ko) 간암 진단용 조성물
KR102252036B1 (ko) Cmip 유전자의 메틸화 수준을 이용한 비만의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
WO2023132626A1 (ko) 특정 유전자의 cpg 메틸화 변화를 이용한 전립선암 진단용 조성물 및 이의 용도
US11597975B2 (en) PDCD1 as epigenetic marker for the identification of immune cells, in particular PD1+ cells
Duran Ferrer Tracing the developmental history of B-cell tumors by DNA methylation
US20210230698A1 (en) Cxcr3 as epigenetic marker for the identification of inflammatory immune cells, in particular cd8+ memory t cells

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22890453

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022890453

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022890453

Country of ref document: EP

Effective date: 20240605