WO2023140713A1 - 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 snp 기반 모델 - Google Patents

면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 snp 기반 모델 Download PDF

Info

Publication number
WO2023140713A1
WO2023140713A1 PCT/KR2023/001078 KR2023001078W WO2023140713A1 WO 2023140713 A1 WO2023140713 A1 WO 2023140713A1 KR 2023001078 W KR2023001078 W KR 2023001078W WO 2023140713 A1 WO2023140713 A1 WO 2023140713A1
Authority
WO
WIPO (PCT)
Prior art keywords
immune
irae
snp
predicting
adverse reactions
Prior art date
Application number
PCT/KR2023/001078
Other languages
English (en)
French (fr)
Inventor
박숙련
최정균
Original Assignee
재단법인 아산사회복지재단
울산대학교 산학협력단
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020230008358A external-priority patent/KR20230112567A/ko
Application filed by 재단법인 아산사회복지재단, 울산대학교 산학협력단, 한국과학기술원 filed Critical 재단법인 아산사회복지재단
Publication of WO2023140713A1 publication Critical patent/WO2023140713A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer

Definitions

  • the present invention relates to a SNP-based model for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents.
  • Immune checkpoint blockade (ICB) therapy has become one of the leading treatments for various cancer types and has expanded its role from adjuvant therapy to neoadjuvant settings due to immune-related adverse events (irAE) following ICB treatment.
  • irAE immune-related adverse events
  • Most early-stage or low-grade irAEs can be managed with corticosteroids or immunosuppressants, but some irAEs can be fatal or leave permanent morbidity if not detected and treated promptly. Therefore, prediction of irAE occurrence before ICB treatment (pre-treatment, PRE) or early during treatment (EDT) is very important clinically, not only in terms of patient management, but also in terms of medical costs.
  • irAEs provide an opportunity to understand how autoimmunity develops in response to immune activators in general.
  • CBC-based biomarkers are easily influenced by factors independent of the tumor, such as the patient's clinical condition and medical history.
  • Cytokine profiles have also been suggested as predictors of irAE, for example, IL-6 suppresses the differentiation of regulatory T cells and B cells and contributes to hyperactivation of the adaptive immune system, and clonal expansion of CD8+ T cells in peripheral blood has been associated with severe irAE development in patients treated with ipilimumab.
  • tumor mutational burden has been proposed as an indicator of irAE incidence in an attempt to explain the relatively high incidence of irAE in lung cancer and melanoma.
  • mutational burden acts as a confounding factor that indirectly increases the risk of irAE by promoting a therapeutic response to ICB.
  • LCP1 and ADPGK were identified as predictive biomarkers of irAE through TCGA multi-omics data analysis, but verification of predictive power was performed with a limited number of lung cancer patients comparing 14 irAE samples and 14 control samples.
  • irAE genetic, molecular and cellular risk factors for irAE are elusive and require integrative analysis, and the diversity of irAE pathology implies the multifaceted complexity of the underlying mechanisms, requiring a much more comprehensive investigation.
  • drugs e.g. ipilimumab or atezolizumab
  • irAE symptoms e.g. cutaneous autoimmunity
  • cancer types e.g. lung cancer or melanoma
  • the present invention aims to provide a biomarker for predicting the onset of irAE induced by immuno-anticancer drug treatment such as ICB and a method for predicting the onset of irAE using the biomarker by performing a comprehensive analysis of irAE by integrating multidimensional data including genetic factors, molecular and cellular profiles of immune cells, laboratory data and clinical variables for hundreds of patients with various types of irAE before and after ICB treatment.
  • the present inventors analyzed genetic factors for the onset of irAE before and after ICB treatment, molecular and cellular profiles of immune cells, laboratory data and clinical variables, etc. As a result, a single nucleotide polymorphism (SNP) in the TMEM162 (FAM187B) gene and the correlation between irAE onset was confirmed. Based on this, the present invention was completed.
  • SNP single nucleotide polymorphism
  • an object of the present invention is to provide a composition and kit for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, including an agent for detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169.
  • SNP single nucleotide polymorphism
  • Another object of the present invention is to provide an information providing method for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, or an information-providing method for predicting responsiveness to immuno-anticancer agents, comprising the step of detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169 in a biological sample isolated from a subject.
  • SNP single nucleotide polymorphism
  • the present invention provides a composition for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, including an agent for detecting a single nucleotide polymorphism (SNP) of the dbSNP database rs541169.
  • SNP single nucleotide polymorphism
  • the present invention provides a kit for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, including the composition.
  • the present invention provides an information providing method for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, comprising the step of detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169 in a biological sample isolated from a subject.
  • SNP single nucleotide polymorphism
  • the present invention provides an information providing method for predicting reactivity to an immuno-anticancer agent, comprising detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169 in a biological sample isolated from a subject.
  • SNP single nucleotide polymorphism
  • the present invention provides a method for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, comprising detecting a single nucleotide polymorphism (SNP) in the dbSNP database rs541169 in a biological sample isolated from a subject.
  • SNP single nucleotide polymorphism
  • the present invention provides a method for predicting responsiveness to an immuno-anticancer agent, comprising the step of detecting a single nucleotide polymorphism (SNP) of the dbSNP database rs541169 in a biological sample isolated from a subject.
  • SNP single nucleotide polymorphism
  • the detection agent may be to detect a mutation in which the base is T in the dbSNP database rs541169, but is not limited thereto.
  • the SNP of rs541169 may cause cleavage of the TMEM162 protein, but is not limited thereto.
  • the detection agent may be a primer or probe capable of detecting rs541169 SNP, but is not limited thereto.
  • the immune-related adverse reaction may be at least one selected from the group consisting of skin adverse reactions, endocrine system adverse reactions, thyroid abnormal reactions, musculoskeletal system adverse reactions, gastrointestinal system adverse reactions, neurologic system adverse reactions, flu-like symptoms, and pneumonia caused by immunotherapeutic agents, but is not limited thereto.
  • the composition may further include one or more SNP detection agents among the SNPs of the dbSNP database listed in the table below, but is not limited thereto.
  • the method may further include, but is not limited to, predicting that the risk of immunotherapeutic agent-induced immune-related adverse reactions will be high when a mutation whose base is T in dbSNP database rs541169 is detected in a biological sample isolated from a subject, but is not limited thereto.
  • the method comprises measuring one or more activities selected from the group consisting of B cells, regulatory T cells, and exhausted T cells in a biological sample isolated from a subject; and
  • the biological sample may be one or more selected from the group consisting of tissue, cells, whole blood, serum, plasma, saliva, sputum, cerebrospinal fluid, urine, and feces isolated from a subject, but is not limited thereto.
  • the present invention provides a use of an agent for detecting a single nucleotide polymorphism (SNP) of the dbSNP database rs541169 or a composition containing the same for predicting the onset of an immune-related adverse reaction induced by an immuno-anticancer agent or predicting responsiveness to an immuno-anticancer agent.
  • SNP single nucleotide polymorphism
  • the present invention is a detection agent for a single nucleotide polymorphism (SNP) of the dbSNP database rs541169 or a composition containing the same for preparing a preparation for predicting the onset of an immune-related adverse reaction induced by an immuno-anticancer agent, or for predicting reactivity to an immuno-anticancer agent. It provides a use for the preparation of a preparation.
  • SNP single nucleotide polymorphism
  • dbSNP database rs541169 a single nucleotide polymorphism (SNP) site in the TMEM162 (FAM187B) gene, is closely related to the onset of immune-related adverse reactions. Accordingly, it is expected that the rs541169 can be usefully used as a biomarker for predicting the onset of immune-related adverse reactions or predicting responsiveness to immuno-anticancer agents.
  • 1A is a diagram illustrating a cohort data summary and data prediction modeling workflow according to an embodiment of the present invention.
  • Figure 1b is a diagram showing the occurrence of various types of irAE over time after ICB administration according to an embodiment of the present invention as a density plot.
  • 1c is a diagram illustrating network analysis for various types of irAEs according to an embodiment of the present invention.
  • Figure 1d is a diagram confirming cell type abundance in whole blood RNA-seq data according to an embodiment of the present invention by PCA analysis.
  • FIG. 2A is a diagram showing results of laboratory data related to the occurrence of different types of irAEs in patient samples before (PRE) and early (EDT) ICB treatment according to an embodiment of the present invention.
  • Figure 2b is a diagram confirming the correlation between the neutrophil cell fraction estimated based on the inference of RNA sequencing data and complete blood count (CBC) neutrophil values in PRE and EDT patient samples according to one embodiment of the present invention.
  • Figure 2c is a diagram comparing expression levels of neutrophil marker genes between irAE and a control group in PRE and EDT patient samples according to an embodiment of the present invention. *P ⁇ 0.05, **P ⁇ 0.01, ***P ⁇ 0.001.
  • 2d is a diagram confirming differentially expressed genes between irAE and control groups in PRE and EDT patient samples according to an embodiment of the present invention in a Volcano plot.
  • Figure 2e is a diagram showing the analysis results of pathway abundance for genes that are underexpressed in irAE in PRE and EDT patient samples according to an embodiment of the present invention.
  • 2f is a diagram confirming the degree of pathway enrichment for genes underexpressed in irAE for 12 irAE types in PRE and EDT patient samples according to an embodiment of the present invention.
  • Figure 3a is a diagram confirming differentially expressed genes between irAE and a control group according to an embodiment of the present invention with a volcano plot.
  • Figure 3b is a diagram confirming the expression of the ANKRD22 gene by immune cell type according to one embodiment of the present invention.
  • Figure 3c is a diagram showing the analysis results of pathway abundance related to neutrophil-related functions and cytokine-mediated signal regulation between irAE and control groups in EDT patient samples according to an embodiment of the present invention.
  • Figure 3d is a diagram showing the analysis results of pathway abundance for genes up-regulated in response to ICB only in irAE or control groups according to an embodiment of the present invention.
  • 3e is a diagram confirming expression changes of neutrophil activity-related genes CLEC4D and CAMP and NK cell activity-related genes CD160 and KLRC1 between irAE and a control group in PRE and EDT patient samples according to an embodiment of the present invention.
  • 4a is a diagram comparing the ratio of HLA-B exon 2 copy number mutation states in irAE and a control group according to an embodiment of the present invention.
  • 4B is a view showing the results of analyzing the cumulative incidence of irAE according to the copy number mutation state of HLA-B exon 2 according to an embodiment of the present invention.
  • 4C is a diagram confirming the copy number of HLA-B exon 2 in irAE and a control group according to an embodiment of the present invention.
  • Figure 4d is a diagram confirming the association between major HLA alleles and 12 irAE types according to an embodiment of the present invention by heat map analysis.
  • Figure 4e is a diagram confirming the ratio of alleles showing excellent association among major HLA alleles in irAE and control groups according to an embodiment of the present invention.
  • Figure 4f is a diagram showing the ratio of 12 irAE types according to HLA-B*35:01 allele retention according to one embodiment of the present invention.
  • 5A is a diagram showing a correlation matrix between 29 irAE types based on association with a common SNV according to an embodiment of the present invention.
  • 5B is a diagram confirming the correlation between 12 irAE types and various laboratory data, CNV, and SNV characteristics according to an embodiment of the present invention through heat map analysis.
  • 5C is a diagram confirming the performance of a predictive model for 12 irAE types according to an embodiment of the present invention based on average precision, accuracy, and AUC.
  • 5D is a diagram showing Manhattan plot results for SNVs and CNVs associated with all irAE types according to an embodiment of the present invention.
  • 6A is a diagram confirming the allele frequency of rs541169 according to population types in various countries according to an embodiment of the present invention.
  • 6B is a diagram showing the results of analyzing the cumulative incidence of irAE according to the possession of the rs541169 mutation according to an embodiment of the present invention.
  • Figure 6c is a diagram showing the ratio of 12 types of irAE according to the genotype of rs541169 according to one embodiment of the present invention.
  • Figure 6d is a diagram showing the ratio of 12 types of irAE according to the possession of the rs541169 mutation according to one embodiment of the present invention.
  • Figure 6e is a diagram showing the expression level of the TMEM162 gene confirmed in various tissues according to one embodiment of the present invention.
  • Figure 6f is a diagram showing the expression levels of TMEM162 and BTN2A1 genes in various tissues according to one embodiment of the present invention.
  • Figure 6g is a diagram confirming the fraction of immune cell types according to the rs541169 genotype in PRE and EDT patient samples according to an embodiment of the present invention.
  • 6h is a diagram confirming the fraction of regulatory T cells (Treg) according to the rs541169 genotype in PRE and EDT patient samples according to an embodiment of the present invention.
  • Figure 6i is a diagram confirming the fraction of depleted T cells (Tex) according to the rs541169 genotype in PRE and EDT patient samples according to an embodiment of the present invention.
  • 6j is a diagram confirming the immune signature score according to the rs541169 genotype in the immune cluster of the TCGA pan cancer sample according to an embodiment of the present invention.
  • 6K is a diagram showing HKA test results around rs541169 in 1,094 Korean whole genome sequences according to an embodiment of the present invention.
  • 6L is a diagram confirming HKA values for rs541169 according to population types in various countries according to an embodiment of the present invention.
  • the present invention provides a composition for predicting the occurrence of immune-related adverse reactions induced by immuno-anticancer agents, including an agent for detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169.
  • SNP single nucleotide polymorphism
  • polymorphism means the occurrence of two or more alternative sequences or alleles (or alleles) within a genetically determined population
  • single nucleotide polymorphism SNP
  • a single base (A, T, C, or G) in the genome refers to the diversity of DNA sequences occurring between members of a species or between paired chromosomes of an individual.
  • AAGT[A/A]AG, AAGT[A/G]AG, and AAGT[G/G]AG three DNA fragments from different individuals (e.g., AAGT[A/A]AG, AAGT[A/G]AG, and AAGT[G/G]AG) that contain differences at a single base are called two alleles (A or G), and in general, almost all SNPs have two alleles.
  • SNP is genetically closely related to a specific disease
  • WT normal or wild-type
  • single nucleotide variant refers to a mutation that shows a difference in a single base, compared to a normal or wild-type (WT) individual or allele. It means that a mutation has occurred in one base at a specific position.
  • the composition detects the SNP of the dbSNP database rs541169 as a diagnostic marker.
  • the SNP rs541169 may be a mutation of the 35228117th base on human chromosome 19 from C to G or T, and according to one embodiment or experimental example of the present invention, it may be a mutation from C to T (C>T), but is not limited thereto.
  • immuno-anticancer agent means a drug that enhances the resistance to cancer by strengthening the body's own immune system.
  • Immuno-anticancer drugs have fewer side effects in that they are treated by strengthening the patient's own immunity, and have the effect of improving the quality of life of cancer patients and significantly prolonging the survival period.
  • Immuno-anticancer drugs exhibit anticancer effects by enhancing specificity, memory, and adaptiveness of the immune system.
  • Immuno-cancer agents include, for example, agents for immune checkpoint blockade (ICB), immune cell therapy agents, therapeutic antibodies, or immune checkpoint enhancers, but are not limited thereto.
  • the agent for blocking the immune checkpoint that is, the immune checkpoint inhibitor, unlike conventional immunotherapeutic agents (cytokine therapeutics, anticancer vaccines, etc.), binds to the binding site of cancer cells and T cells to block immune evasion signals, thereby preventing the formation of immunological synapses and thus having a mechanism in which T cells that are not hindered by immune evasion destroy cancer cells, such as Nivolmab and Atezolizumab. ab), it may be one or more selected from the group consisting of Pembrolizumab, Duvalumab, Avelumab, Ipilimumab, and Tremelimumab, but is not limited thereto.
  • immune-related adverse event refers to various adverse reactions caused by immuno-anticancer treatment, including inflammatory reactions that occur in association with activation of the autoimmune system.
  • the immune-related adverse reaction may be at least one selected from the group consisting of skin adverse reactions, endocrine system adverse reactions, thyroid abnormal reactions, musculoskeletal system adverse reactions, gastrointestinal system adverse reactions, neurologic system adverse reactions, flu-like symptoms, and pneumonia caused by immunotherapy, but is not limited thereto.
  • the immune-related adverse reaction may appear together with two or more symptoms, and its severity may also be divided into three grades.
  • 'Multiple G> 1' when there are 3 or more immune-related adverse reaction types
  • 'Multiple G> 2' when there are 3 or more grade 2 or higher types
  • 'Critical' when there are any 3 or higher types and 2 or higher critical types
  • all cases belonging to the immune-related adverse reaction category can be displayed as 'Any'.
  • detection means both measuring and confirming the presence (expression) of a target substance, or measuring and confirming a change in the presence (expression level) of a target substance.
  • detecting the SNP of the dbSNP database rs541169 means measuring whether the SNP is expressed (i.e., measuring presence or absence) or measuring the level of qualitative or quantitative change of the SNP in the dbSNP database rs541169. The measurement can be performed without limitation including both qualitative methods (analysis) and quantitative methods. Types of qualitative and quantitative methods for determining the presence of SNPs are well known in the art, and the experimental methods described herein are included.
  • the detection agent may be to detect a mutation whose base is T in the dbSNP database rs541169, but is not limited thereto.
  • the rs541169 SNP may cause cleavage of the TMEM162 (FAM187B) protein, but is not limited thereto.
  • the detection agent may be a primer or probe capable of detecting rs541169 SNP, but is not limited thereto.
  • a “primer” is a short single-stranded oligonucleotide that serves as a starting point for DNA synthesis.
  • a primer specifically binds to a polynucleotide, which is a template, in an appropriate buffer and temperature conditions, and DNA is synthesized by DNA polymerase adding nucleoside triphosphate having a complementary base to the template DNA to the primer and linking them.
  • Primers generally consist of 15 to 30 nucleotide sequences, and the melting temperature (Tm) of binding to the template strand varies depending on the nucleotide composition and length.
  • the sequence of the primer does not have to have a sequence completely complementary to a part of the nucleotide sequence of the template, and it is sufficient to have a length and complementarity suitable for the purpose of measuring the amount of mRNA by amplifying a specific section of mRNA or cDNA through DNA synthesis. Therefore, in the present invention, primer pairs can be easily designed by referring to the nucleotide sequence of cDNA or genomic DNA of the gene or its mRNA.
  • the primers for the amplification reaction are composed of a set (pair) that complementarily binds to the template (or sense) and the opposite side (antisense) of both ends of a specific section of the mRNA to be amplified.
  • probe refers to a polynucleotide fragment such as RNA or DNA having a length of several to several hundred base pairs that can specifically bind to mRNA, cDNA (complementary DNA), DNA, etc. of a specific gene, and is labeled, so that the presence or absence of target mRNA or cDNA to be bound, the amount of expression, etc. can be confirmed.
  • Probe selection and hybridization conditions can be appropriately selected according to techniques known in the art.
  • the probe may be used in a diagnostic method for detecting an allele (or allele).
  • the diagnostic methods include detection methods based on hybridization of nucleic acids, such as Southern blotting, etc., and may be provided in a form pre-bound to a substrate of a DNA chip in a method using a DNA chip.
  • the primer or probe may be chemically synthesized using a phosphoramidite solid support synthesis method or other well-known methods.
  • primers or probes may be modified in various ways according to methods known in the art to the extent that hybridization with a target polynucleotide to be detected is not hindered.
  • modifications include methylation, capping, substitution of one or more homologs of the native nucleotide, and modifications between nucleotides, such as uncharged linkages (e.g., methyl phosphonate, phosphotriesters, phosphoroamidates, carbamates, etc.) or charged linkages (e.g., phosphorothioates, phosphorodithioates, etc.), and incorporation of fluorescent or enzymatic labeling materials.
  • uncharged linkages e.g., methyl phosphonate, phosphotriesters, phosphoroamidates, carbamates, etc.
  • charged linkages e.g., phosphorothioates, phosphorodithioates, etc.
  • the primer or probe is not limited to a specific sequence as long as it can detect the rs541169 SNP.
  • the present invention provides a kit for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, including the composition.
  • kit means a tool that can predict the onset of immune-related adverse reactions induced by immuno-anticancer drugs or predict the responsiveness of cancer patients to immuno-anticancer drugs by including an agent for detecting the rs541169 SNP.
  • the kit of the present invention may include other components, compositions, solutions, devices, etc. normally required for their measurement or detection method.
  • the substance for measuring the rs541169 SNP can be applied one or more times without limitation, and there is no limitation before and after applying each substance, and each substance may be applied simultaneously or microscopically.
  • the kit is a container; directions; And it may include an agent that measures the rs541169 SNP.
  • the container may serve to package the formulation, and may also serve to store and fix.
  • the material of the container may take the form of, for example, a bottle, tub, sachet, envelope, tube, ampoule, etc., which may be partially or wholly formed from plastic, glass, paper, foil, wax, and the like.
  • the container may be equipped with a fully or partially removable stopper that is initially part of the container or may be attached to the container by mechanical, adhesive, or other means, and may also be equipped with a stopper that allows access to the contents by a needle.
  • the kit may include an external package, and the external package may include instructions for use of the components.
  • the present invention provides a method for providing information for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, including detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169 in a biological sample isolated from a subject, or a method for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents.
  • SNP single nucleotide polymorphism
  • the present invention provides a method for providing information for predicting responsiveness to an immuno-anticancer agent or a method for predicting responsiveness to an immuno-anticancer agent, comprising detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169 in a biological sample isolated from a subject.
  • SNP single nucleotide polymorphism
  • a “subject” may include both a cancer patient who wants to receive immuno-anticancer treatment or a cancer patient who has received immuno-anticancer drug treatment, and in this case, the subject may include, but is not limited to, mammals such as humans or non-human primates, mice, rats, dogs, cats, horses, and cows.
  • the cancer may be at least one selected from the group consisting of lung cancer including non-small cell lung cancer and small cell lung cancer, esophageal cancer, hepatocellular carcinoma, gastric cancer, breast cancer, bladder cancer, kidney cancer, bile duct cancer, urethra cancer, head and neck cancer, melanoma, colon cancer, gallbladder cancer, pancreatic cancer, ampulla cancer, neuroendocrine carcinoma, paraganglioma, ovarian cancer, uterine cancer, prostate cancer, thymus cancer, and brain angiosarcoma. , but not limited thereto.
  • the biological sample may be one or more selected from the group consisting of tissue, cells, whole blood, serum, plasma, saliva, sputum, cerebrospinal fluid, urine, and feces isolated from a subject, and according to one embodiment or experimental example of the present invention, it may be whole blood, but is not limited thereto.
  • the method may further include a step of predicting that the risk of developing an immune-related adverse reaction induced by an immuno-anticancer agent is high when a mutation in which the base is T of dbSNP database rs541169 is detected in a biological sample isolated from a subject, but is not limited thereto.
  • the composition may further include one or more SNP detection agents among the SNPs of the dbSNP database listed in Table 8 of the present invention, preferably one or more SNP detection agents among the SNPs of the dbSNP database described in the following table, but is not limited thereto.
  • the method may further include the step of detecting one or more SNPs from among the SNPs of the dbSNP database listed in Table 8 of the present invention, in a biological sample isolated from the subject.
  • the method comprises the steps of measuring one or more activities selected from the group consisting of B cells, regulatory T cells, and depleted T cells in a biological sample isolated from a subject; and
  • the risk of developing immune-related adverse reactions induced by the immuno-anticancer agent is high or the reactivity to the immuno-anticancer agent is predicted to be low. It may further include, but is not limited thereto.
  • the present invention when a mutation in which the base of rs541169 is T is detected, and in addition, when the B cell activity is relatively high or the activity of regulatory T cells or depleted T cells is relatively low, it can be predicted that the risk of occurrence of immune-related adverse reactions by immuno-anticancer agents is higher or the reactivity to immuno-anticancer agents is lower, but is not limited thereto.
  • the step of detecting the dbSNP database rs541169 SNP can be performed using a conventional method known in the art, for example, sequencing, exome sequencing, next generation sequencing (NGS), pyrosequencing, microarray hybridization, allele specific PCR (allele specific PCR), dynamic It may be performed by one or more methods selected from the group consisting of dynamic allele-specific hybridization, PCR extension analysis, PCR-SSCP method, and Taqman method, but is not limited thereto.
  • NGS next generation sequencing
  • pyrosequencing microarray hybridization
  • allele specific PCR allele specific PCR
  • dynamic It may be performed by one or more methods selected from the group consisting of dynamic allele-specific hybridization, PCR extension analysis, PCR-SSCP method, and Taqman method, but is not limited thereto.
  • the present invention provides an information providing method for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents, comprising detecting at least one selected from the group consisting of neutrophil count, neutrophil-to-lymphocyte ratio (NLR), lymphocyte count, and platelet-to-lymphocyte ratio (PLR) in a biological sample isolated from a subject;
  • an information providing method for predicting reactivity to an immuno-anticancer agent is provided.
  • the neutrophil count, neutrophil-to-lymphocyte ratio, or platelet-to-lymphocyte ratio is relatively low;
  • the risk of developing immune-related adverse reactions induced by immuno-anticancer agents may be predicted to be high, or the reactivity to immuno-anticancer agents may be predicted to be low, but is not limited thereto.
  • the neutrophil count, NLR, lymphocyte count, or PLR may be used as a single model for predicting the onset of immuno-anticancer agent-induced immune-related adverse reactions or predicting responsiveness to immuno-anticancer agents, or may be used together with rs541169 SNP, but is not limited thereto.
  • the present invention is a detection agent of a single nucleotide polymorphism (SNP) of dbSNP database rs541169 or a composition comprising the same for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents; Or it provides a use for predicting responsiveness to an immuno-anticancer agent.
  • SNP single nucleotide polymorphism
  • the present invention is used for the preparation of an agent for detecting a single nucleotide polymorphism (SNP) of dbSNP database rs541169 or a composition containing the agent for predicting the onset of immune-related adverse reactions induced by immuno-anticancer agents; Or it provides a use for the preparation of an agent for predicting reactivity to an immuno-anticancer agent.
  • SNP single nucleotide polymorphism
  • the present invention measures the SNP of dbSNP database rs541169 in biological samples isolated from subjects suspected of having a high risk of developing immune-related adverse reactions after treatment with cancer patients or subjects suspected of having low reactivity to immuno-anticancer agents and controls, and then detects a mutation whose base is T in rs541169.
  • step of (doing) or “step of” used throughout the present invention does not mean “step for”.
  • IOB immune checkpoint blockade
  • the basic characteristics of the patient cohort including the patient's age, sex, cancer type, and type of ICB treatment received, are shown in Table 1 below.
  • irAE immune-related adverse events
  • NSCLC non-small cell lung cancer
  • HCC hepatocellular carcinoma
  • CCA cholangiocarcinoma
  • ICB immune checkpoint blockade
  • RT radiation therapy
  • CRT chemoradiotherapy
  • Clinical characteristics available for patients in our cohort include medication type, cancer type, ECOG performance status, history of autoimmune disease, and history of diabetes or hypertension.
  • Pretreatment laboratory tests included several combination values calculated from values such as complete blood count (CBC), chemistry, and neutrophil-to-lymphocyte ratio (NLR), and platelet-to-lymphocyte ratio (PLR) was also included as a candidate feature.
  • CBC complete blood count
  • NLR neutrophil-to-lymphocyte ratio
  • PLR platelet-to-lymphocyte ratio
  • the quality of raw WES FASTQ files was controlled using FastQC (v.0.11.9) and MultiQC (v.1.9).
  • Reads were aligned to the GRCh37 (hg19) build of the 1000 Genomes Project using BWA-MEM (v.0.7.17-r1188) with default parameters. Aligned reads were sorted with HTSlib (v.1.7-2) in SAMtools (v.1.7) and duplicates were marked with Picard (v.2.25.0-5-ga2f44ae-SNAPSHOT). Base quality score remeasurements were performed using ApplyBQSR from The Genome Analysis Toolkit (GATK) (v.4.1.6.0).
  • GATK Genome Analysis Toolkit
  • Reads were aligned to the GRCh37 (hg19) build provided by the 1000 Genomes Project and genes were assigned based on gencode.v37.annotation.gtf using STAR 2 pass mapping with the --sjdbOverhang 150 option. Aligned reads were sorted using SAMtools (v.1.7) and read numbers were counted by HTSeq (v.0.12.4). Lead counts were normalized by calculating TPM values using house codes.
  • the GATK best practice workflow was adopted for SNV detection using assay-ready bam files.
  • HaplotypeCaller was run in gVCF mode, followed by GenomicsDBImport, GEnotypeGVCFs, VariantRecalibrator and ApplyVQSR.
  • Variants satisfying the GQ > 80 and DP > 20 criteria were filtered using VCFtools (v.0.1.15) and BCFtools (v.1.7), and exon region spacing information was extracted with SureSelect Human All Exon V5 (Agilent).
  • VCF files of 608 patients were merged and annotated with ANNOVAR. Only non-synonymous variants with alterations in amino acids were used for further analysis, and a binary code representing the presence or absence of each variant in each patient was used for the p-value of the logistic regression for each irAE label calculated using age, sex, and drug type as covariates.
  • GATK germline CNV detection in cohort mode was performed with parameters recommended by best practices. Read counts were calculated using CollectReadCounts with the assay-ready BAM file as input for each sample. Then, with all intervals as input, we got a list of intervals that were processed using GATK PreprocessIntervals, AnnotateIntervals, and FilterIntervals. Copy number for each interval was calculated by DefineGermlineContigPloidy, GermlineCNVCaller and PostprocessGermlineCNVCalls. Then, each patient's CNV results were merged on an interval basis by the BCFtools merging function. The merged VCF covered 224,551 intervals with a length of about 500 base pairs.
  • HLA genotyping was performed using HLA-HD (v.1.3.0) with WES FASTQ files as input, and both class I (HLA-A, B, and C) and class II (DRB1, DQB1, and DPB1) were typed. Up to four digits (i.e., the second field) were used for further analysis, and binary coding was performed to ensure that each patient had an allele corresponding to the HLA allele pooled in all patients in our cohort.
  • Multivariate logistic regression using age, sex, and drug type as covariates was performed to find candidate features associated with each irAE type. Controls were defined as patients who did not experience any irAE. Regression was performed separately for binary codes of HLA type and germline SNV, and continuous values of CNV and peripheral blood markers using age, sex and drug type as covariates. Features with a regression p-value of 0.01 or less were subjected to a permutation test to determine final significant features.
  • Example 11 Generation of training input features of the unified model
  • tested germline variants were ranked based on multivariate logistic regression p-values. Among the variants with P ⁇ 0.01, up to 70 SNPs with the highest rank were used as training input features.
  • the optimal number of variances for training was determined by using the find_peaks() function of the Scipy package and the house code to find the peak of a plot of the average precision of the test set for each increase in the number of trained variances.
  • An integrated model was trained for each of the 12 main labels.
  • Features of the integrated model include significantly associated HLA types, CNVs, and peripheral blood markers found by multivariate logistic regression with significantly associated germline variants selected by multivariate logistic regression as described above.
  • a deep neural network (DNN) framework was implemented to train the unified model. The performance of the DNN was superior to that of the XGBoost classifier.
  • To train the model for each label patients with irAEs (true cases) and patients without irAEs (false cases) of that label were split 8:2 for the training and validation sets, respectively. All features of the training set were scaled in the range from -1 to 1 using MinMaxScaler, and a scaler fitting the training set was adopted for feature transformation of the validation set.
  • An integrated model was trained by adding gene expression features for 250 patients for which both WES data and RNA-seq data were available.
  • the performance of models trained with features derived from WES data, models trained with features derived from WES data and RNA-seq data was compared using the mean precision metric.
  • a deep neural network (DNN) framework was implemented using PyTorch. Three fully connected hidden layers and the Xavier uniform method were used for weight initialization. The first, second, and third hidden layers have 40, 80, and 20 hidden nodes, respectively, and tanh has an interlayer activation function and sigmoid has a final activation function.
  • the batch size was determined by dividing the entire sample into 5 batches, and the Adam optimizer was used for the optimization process, and the binary cross-entropy was applied as the loss function.
  • the learning rate, maximum epoch, and patience for early stopping of the optimization process were set to 0.001, 100, and 5, respectively. All hyperparameters were determined by iterative sweeps, and the model with the smallest test loss within 100 epochs was selected as the final model.
  • the SHAP value for interpreting the effect of each feature on the prediction result was calculated using the DeepExplainer function of the SHAP package.
  • the SHAP values of all samples for each variant were averaged to rank germline variants based on their SHAP values, and the highly ranked variants were used for further analysis.
  • a direct comparison between the SHAP values of variant features (binary codes) and those of CNV (-1,0,1) and peripheral blood markers (continuous values) was not possible because of their different scale ranges.
  • Cumulative incidence analysis was performed to investigate the correlation between time to onset of irAE and (1) the copy number of the gene HLA-B and (2) the genotype of the rs541169 mutation.
  • Patients with a copy number of 2 were classified as a normal ploidy group, a copy number greater than 2 was classified as a duplication group, and a copy number less than 2 was classified as a deletion group.
  • the period from the start of ICB treatment to the onset of irAE was defined as the follow-up period, and death or loss to follow-up was treated as censored data.
  • Statistical significance was calculated using Cox proportional hazards model.
  • HKA Hudson-Kreitman-Aguade
  • the HKA test compares the level of polymorphism (diversity within species) to the level of substitution (diversity between species).
  • the maximum likelihood HKA test (Wright and Charlesworth, 2004) was performed using the MLHKA software (http://wright.eeb.utoronto.ca/programs/).
  • the 1-kb region surrounding the rs541169 mutation was compared with 99 neutrally evolved regions selected as previously reported (Fumagalli et al., 2009; Gokcumen et al., 2013).
  • the number of segregating sites in each region and the pairwise number of differences between species were used as inputs, and chimpanzees were used as an outgroup in this analysis.
  • the program was run in a neutral model where the number of loci selected to test selection was zero, and then the program was run in a selection model considering the 1-kb region surrounding the focal SNP as the only selected locus.
  • Statistical significance was assessed by a likelihood ratio test in which the 2-fold log likelihood difference between the selection model and the neutral model approximately followed a x 2 distribution with 1 degree of freedom (the number of selected loci). A chain length of 100,000 was applied to ensure the robustness of the output.
  • a choice parameter k and P-value were obtained in likelihood ratio test.
  • the selection parameter k represents the k -fold rise in diversity relative to the neutral expectation at a given locus. Thus, k > 1 supports equilibrium selection.
  • AFR Africa; AMR, Americas; EAS, East Asia; EUR, Europe; SAS, South Asia; GWD, Gambians in Western Gambia; MSL, Mende, Sierra Leone; ASW, African ancestry in the American Southwest; ACB, African Caribbean, Barbados; YRI, Yoruba, Ibadan, Nigeria; LWK, Luhya of Webuye, Kenya; ESN, Esan of Nigeria; MXL, of Mexican ancestry, Los Angeles, CA; PUR, Puerto Spainn of Puerto Rico; CLM, Colombian of Medellin, Colombia; PEL, Peruvian from Lima, Peru; KHV, Khin people of Ho Chi Minh City, Vietnam; CDX, Chinese Dai of Xishuangbanna, China; CHB, Han Chinese in Beijing, China; KOR, Koreans in Korea; CHS, Southern Han Chinese; JPT, Japanese from Tokyo, Japan; GBR, British in England and Scotland; IBS, Iberian population in Spain; TSI
  • Types of irAEs Control irAEs of interest irAEs of non-interest Proportion Pruritus 300 124 248 0.18 Skin rash/dermatitis/urticaria 300 89 283 0.13 Myalgia 300 72 300 0.11 Hypothyroidism 300 69 303 0.10 Fatigue/asthenia 300 62 310 0.09 Subclinical hypothyroidism 300 48 324 0.07 Pneumonitis 300 43 329 0.06 Hyperthyroidism 300 25 347 0.04 Hepatitis 300 23 349 0.03 Enterocolitis/diarrhea 300 22 350 0.03 Fever 300 16 356 0.02 Headache 300 15 357 0.02 Polyneuropathy/peripheral seonsory neuropathy 300 14 358 0.02 Anorexia 300 13 359 0.02 Arthralgia 300 12 360 0.02 Dry mouth 300 11 361 0.02 Adrenal insufficiency 300 11 361 0.02 Asymptomatic lipase elevation 300 10 362 0.01 Asymptomatic amy
  • lung cancer was the most common cancer type, and most of the patients were treated with anti-PD-1. There were no significant differences in ECOG PS (eastern Cooperative Oncology Group performance status) and history of autoimmune disease between all irAE groups.
  • the ICB agents used in this cohort were 5 PD-1 antibodies (pembrolizumab: PEM, nivolumab: NIV, PDR001: PDR, INCMGA00012: INC, tislelizumab: TIS), 4 PD-L1 antibodies (atezolizumab: ATE, durvalumab: DUR, IMC-001: IMC, avelumab: AVE), PD- 1 or two CTLA-4 antibodies in combination with a PD-L1 antibody (ipilimumab: IPI, tremelimumab: TRE), PD-1 expressing T cells that preferentially target CTLA-4 (MEDI5752), a bispecific antibody to the STING agonist (MK1454) and an ILT4 antibody (MK4830).
  • 5 PD-1 antibodies pembrolizumab: PEM, nivolumab: NIV, PDR001: PDR, INCMGA00012: INC, tislelizumab:
  • Types of irAEs Control irAEs of interest irAEs of non-interest Proportion Any 300 372 0.55 Skin 300 156 229 0.23 Multiple (any grade) 300 155 230 0.23 Flu-like 300 148 237 0.22 Endocrine 300 130 255 0.19 Thyroid 300 96 289 0.14 Musculoskeletal 300 90 295 0.13 Critical 300 90 295 0.13 Gastrointestinal 300 78 307 0.12 Neurological 300 49 336 0.07 Multiple (grade ⁇ 2) 300 45 340 0.07 Pulmonary 300 43 342 0.06
  • RNA sequencing was performed on 263 matched whole blood samples before (PRE) and early (EDT) ICB treatment to investigate differential molecular activity and immune cell profiles between patients with and without irAE and between PRE and EDT.
  • Table 6 shows the number of available samples according to clinical factors, and CBC tests and biochemical analyzes were performed on both PRE and EDT samples to investigate baseline differences between the irAE and no-irAE groups as well as changes due to ICB treatment (see Fig. 1a).
  • WBC white blood cell
  • RBC red blood cell
  • ANKRD22 was one of the significantly up-regulated genes in the control EDT samples. Although its function is not well established, induction of the gene in peripheral blood has been observed in host defense against viral infection (Bin, L et al., J Immunol (2016) 196 (1_Supplement): 201.4.). In the present invention, as shown in Fig. 3b, it was found that ANKRD22 was specifically expressed in neutrophils.
  • Pathway enrichment analysis revealed mainly EDT upregulation for immune activation such as cytokine-mediated signaling and cellular response to tumor necrosis factor and IFN- ⁇ in both irAE and control groups, as shown in Figure 3c.
  • control EDT samples showed activation of neutrophil-related functions.
  • Pathway enrichment for genes exclusively activated in irAE or controls was further investigated and genes involved in cytokine-mediated signaling and cellular responses were excluded. As a result, as shown in FIG. 3D , it was confirmed that the NK cell-related gene expression program and the neutrophil-related gene expression program were specifically activated in the irAE and control groups, respectively.
  • genes related to neutrophil activity namely CLEC4D and CAMP, were activated upon treatment only in the control group.
  • some genes related to NK cell activity, such as CD160 and KLRC1 were upregulated in response to treatment, especially in irAE patients.
  • Multivariate logistic regression was performed using age, sex, and drug type as covariates to evaluate the association between copy number of 19,880 exon spacing units and incidence of 12 major types of irAE.
  • Significantly related exon spacing P ⁇ 0.01 is shown in Table 7 below.
  • copy number variation CNV of class I and II HLA genes was found to be significantly associated with several irAE types.
  • HLA-B*40:02 increased the risk of several irAE types, and HLA-B*54:01 reduced the incidence of irAE (see Figures 4d and 4e).
  • HLA-A duplication was particularly relevant to the nervous system.
  • ANAPC1 proteins belong to various biological pathways including cell cycle, mitosis, class I MHC mediated antigen processing and presentation.
  • this protein was defined as one of 10 predictive biomarkers of immune evasion and immunotherapy response (Bou-Dargham, M.J et al., BMC Cancer 20, 572.).
  • DOPEY2 is differentially expressed on CD8+ T cells of ICB responders (Chen, I.X et al., Proc Natl Acad Sci USA. 2020 Sep 22;117(38):23684-23694.)
  • MRPL23 is a component of a lncRNA-related signature that predicts prognosis after ICB treatment in bladder cancer (Wu, Y et al., Aging (Albany. NY. 12, 23306-23325.).
  • Some genes have been associated with autoimmune diseases.
  • MANBA has been reported to be associated with ulcerative colitis (Jostins, L et al., Nature 491, 119-124.), whereas PMFBP1 (Ibanez-Cabellos, J.S et al., Front. Genet. 10, 1104.) and TTC40 (Ham, S et al., Exp. Mol. Med. 51, 1-13.) are associated with rheumatoid arthritis. It was related. Another important gene, AFMID, has been reported to be involved in immunoregulatory circuitry (Proietti, E et al., Trends Immunol. 41, 1037-1050.).
  • TMEM162 also known as FAM187B or FLJ25660. Accordingly, in the present invention, the association between TMEM162 gene mutation and irAE was confirmed in the following experimental example.
  • the frequency spectrum of rs541169 genotypes differed significantly according to irAE status, with the fraction of irAE cases increasing with the copy number of alleles (i.e., C/C, C/T, and T/T) (lower bar graph), as shown in Figure 6c.
  • the results were similar to those when patients were classified into two groups, a mutation-bearing group and a non-bearing group, as shown in FIG. 6d.
  • TMEM162 FAM187B
  • BTN2A1 BTN2A1
  • FIGS. 6e and 6f it was found that TMEM162 was specifically expressed in the lymph node and spleen, and BTN2A1 was also highly expressed in the spleen.
  • the PRE-EDT comparison results showed a significant reduction during treatment of Treg cells only in the mutants, as shown in Fig. 6h, thus implying that the suppressed Treg activity may be responsible for the higher risk of irAE among the mutant-bearing groups.
  • Fig. 6i only the non-mutagenic group showed a significant increase in Tex cells. Therefore, it was confirmed that limited T cell depletion could be another factor causing irAE in the mutation-bearing group.
  • TMEM162 mutation reduced Treg infiltration and increased B cell infiltration. More specifically, the mutation showed significantly fewer Treg cells in C2 (IFN- ⁇ dominant) and C3 (inflammatory) tumors (see FIG. 6j ). This is consistent with the reduced Treg activity in the cohort observed only after ICB treatment (see Figure 6h). On the other hand, the mutation increased B cells in most immune clusters, but most significantly in C5 (immunosilencing) and C6 (TGF- ⁇ dominant) tumors (see Fig. 6j).
  • the rs541169 mutation was identified as one of the eight most prominent loss-of-function mutations in selection given the significant level of population differentiation (Rausell, A et al., Proc. Natl. Acad. Sci. 117 (24) 13626-13636), which was also observed in our data including the Korean population (see Fig. 6a).
  • HKA test Human, R.R et al., Genetics 116, 153-159. was performed over the chromosomal region surrounding rs541169 using 1,094 Korean whole genome sequences (Jeon, S et al., Sci. Adv. 6, eaaz7835.), and is shown in FIG. 6K.
  • the gray horizontal dashed line in Fig. 6K represents an HKA value of 1 as a threshold supporting balance selection.
  • the solid yellow vertical lines and green shading indicate the positions of rs541169 and TMEM162, respectively.
  • HKA k > 1 (P 0.0027) for the variance, indicating balanced selection operating in the Korean population.
  • rs541169 is expected to be usefully used as a biomarker for predicting the onset of immune-related adverse reactions or predicting responsiveness to immuno-anticancer agents, and thus has industrial applicability.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 SNP 기반 모델에 관한 것으로서, 본 발명에서는 면역항암제에 의해 유도되는 면역관련 이상반응의 발병과 관련된 여러 가지 요인을 분석한 결과, TMEM162(FAM187B) 유전자에서의 단일염기다형성(SNP) 부위인 dbSNP 데이터베이스 rs541169가 면역관련 이상반응의 발병과 밀접하게 연관되어 있는 것을 확인하였다. 이에, 상기 rs541169는 면역항암제 유도 면역관련 이상반응의 발병 예측 또는 면역항암제에 대한 반응성 예측을 위한 바이오마커로서 유용하게 이용될 수 있을 것으로 기대된다.

Description

면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 SNP 기반 모델
본 발명은 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 SNP 기반 모델에 관한 것이다.
본 출원은 2022년 01월 20일에 출원된 한국특허출원 제10-2022-0008320호 및 2023년 01월 19일에 출원된 한국특허출원 제10-2023-0008358호에 기초한 우선권을 주장하며, 해당 출원의 명세서 및 도면에 개시된 모든 내용은 본 출원에 원용된다.
면역 체크포인트 차단(immune checkpoint blockade, ICB) 요법은 다양한 암 유형에 대한 주요 치료법 중 하나가 되었으며, ICB 치료 후 면역관련 이상반응(immune-related adverse event, irAE)으로 인해 보조 요법에서 신보강 설정으로 그 역할을 확장하였다. 대부분의 초기 단계 또는 저등급 irAE는 코르티코스테로이드(corticosteroid) 또는 면역억제제로 관리할 수 있지만, 일부 irAE는 즉시 감지 및 치료하지 않으면 치명적인 상황을 초래하거나 영구적인 이환율을 남길 수 있다. 따라서, ICB 치료 전(pre-treatment, PRE) 또는 초기 치료 중(early during treatment, EDT) irAE 발생 예측은 환자 관리 측면뿐만 아니라 의료 비용 측면에서도 임상적으로 매우 중요하다. 또한, irAE는 일반적으로 면역 활성화제에 대한 반응으로 자가 면역이 어떻게 발달하는지 이해할 수 있는 기회를 제공한다.
이전의 irAE 연구는 주로 말초 혈액에서 측정된 임상적 또는 생화학적 특징에 초점을 맞췄다. 전체 혈구 수(CBC)가 광범위하게 연구되었지만 여러 연구에서 상충되는 결과가 나왔으며, 이러한 불일치는 CBC 기반 바이오마커가 환자의 임상 상태 및 병력과 같은 종양과 무관한 요인에 의해 쉽게 영향을 받는다는 것을 나타낸다. 사이토카인 프로파일도 irAE 예측인자로 제안되었는데, 예를 들어, IL-6은 조절 T 세포와 B 세포의 분화를 억제하고 적응 면역 체계의 과잉 활성화에 기여하며, 말초 혈액에서 CD8+ T 세포의 클론 확장은 이필리무맙으로 치료받은 환자에서 심각한 irAE 발생과 관련이 있었다.
말초 혈액 측정과는 별개로, 폐암 및 흑색종에서 상대적으로 높은 irAE 발생률을 설명하기 위한 시도에서 irAE 발생의 지표로 종양 돌연변이 부담이 제안되었다. 그러나 돌연변이 부담이 ICB에 대한 치료 반응을 촉진하여 간접적으로 irAE 위험을 증가시키는 교란 요인으로 작용할 가능성이 있다. 또한, TCGA 다중 오믹스 데이터 분석을 통해 LCP1과 ADPGK가 irAE의 예측 바이오마커로 식별되었으나, 예측력의 검증은 14개의 irAE 샘플과 14개의 대조군 샘플을 비교하는 제한된 수의 폐암 환자로 수행되었다. 이 두 연구는 FDA 부작용 보고 시스템(FAERS)의 데이터에 의존했으나, 이 데이터베이스는 ICB 관련 irAE를 연구하기 위해 특별히 설계되지 않았다. 생식계열 변이의 경우, 게놈 차원의 연관성 연구에서 얻은 다유전자성 위험 점수를 아테졸리주맙 유도 피부 또는 갑상선 관련 irAE에 적용하였다.
즉, irAE의 유전적, 분자적 및 세포성 위험 인자는 파악하기 어렵고 통합 분석이 필요하며, irAE 병리학의 다양성은 근본적인 메커니즘의 다면적인 복잡성을 의미하며 훨씬 더 포괄적인 조사가 요구된다. 그러나 이전 irAE 연구의 대부분은 특정 약물(예: 이필리무맙 또는 아테졸리주맙), irAE 증상(예: 피부의 자가면역) 및 암 유형(예: 폐암 또는 흑색종)에 국한되어 종종 제한된 수의 irAE 샘플을 이용한 연구였다.
이에, 본 발명에서는 다양한 유형의 irAE를 가진 수백명의 환자를 대상으로 ICB 치료 전후에 대해 유전적 요인, 면역 세포의 분자 및 세포 프로파일, 실험실 데이터 및 임상 변수를 포함한 다차원 데이터를 통합하여 irAE에 대한 포괄적인 분석을 수행함으로써, ICB와 같은 면역항암제 치료에 의해 유도된 irAE의 발병을 예측하기 위한 바이오마커 및 이를 이용한 irAE 발병 예측 방법을 제공하고자 하였다.
본 발명자들은 ICB 치료 전후 irAE 발병에 대한 유전적 요인, 면역 세포의 분자 및 세포 프로파일, 실험실 데이터 및 임상 변수 등을 분석한 결과, TMEM162(FAM187B) 유전자에서의 단일염기다형성(SNP)과 irAE 발병의 상관관계를 확인하였는 바, 이에 기초하여 본 발명을 완성하였다.
이에, 본 발명의 목적은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측용 조성물 및 키트를 제공하는 것이다.
본 발명의 다른 목적은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 정보제공방법 또는 면역항암제에 대한 반응성 예측을 위한 정보제공방법을 제공하는 것이다.
그러나, 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야의 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위해 본 발명은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제를 포함하는, 면역항암제 유도 면역관련 이상반응 발병 예측용 조성물을 제공한다.
또한, 본 발명은 상기 조성물을 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측용 키트를 제공한다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 정보제공방법을 제공한다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제에 대한 반응성 예측을 위한 정보제공방법을 제공한다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측 방법을 제공한다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제에 대한 반응성 예측 방법을 제공한다.
본 발명의 일 구현예로서, 상기 검출 제제는 dbSNP 데이터베이스 rs541169의 염기가 T인 변이를 검출하는 것일 수 있으나, 이에 제한되지 않는다.
본 발명의 다른 구현예로서, 상기 rs541169의 SNP는 TMEM162 단백질의 절단을 일으키는 것일 수 있으나, 이에 제한되지 않는다.
본 발명의 또 다른 구현예로서, 상기 검출 제제는 rs541169 SNP를 검출할 수 있는 프라이머 또는 프로브일 수 있으나, 이에 제한되지 않는다.
본 발명의 또 다른 구현예로서, 상기 면역관련 이상반응은 면역항암제에 의해 나타나는 피부(skin) 이상반응, 내분비계(endocrine system) 이상반응, 갑상선(thyroid gland) 이상반응, 근골격계(musculoskeletal system) 이상반응, 위장계(gastrointestinal system) 이상반응, 신경계(neurologic system) 이상반응, 독감 유사 증상(Flu-like), 및 폐렴(pulmonary)으로 이루어진 군으로부터 선택된 하나 이상일 수 있으나, 이에 제한되지 않는다.
본 발명의 또 다른 구현예로서, 상기 조성물은 하기 표에 기재된 dbSNP 데이터베이스의 SNP 중 하나 이상의 SNP 검출 제제를 추가로 포함할 수 있으나, 이에 제한되지 않는다.
Figure PCTKR2023001078-appb-img-000001
Figure PCTKR2023001078-appb-img-000002
Figure PCTKR2023001078-appb-img-000003
Figure PCTKR2023001078-appb-img-000004
Figure PCTKR2023001078-appb-img-000005
본 발명의 또 다른 구현예로서, 상기 방법은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 염기가 T인 변이가 검출될 경우, 면역항암제 유도 면역관련 이상반응의 발병 위험이 높을 것으로 예측하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
본 발명의 또 다른 구현예로서, 상기 방법은 피검체로부터 분리된 생물학적 시료에서 B세포, 조절 T 세포(regulatory T cell), 및 고갈된 T 세포(exhausted T cell)로 이루어진 군으로부터 선택된 하나 이상의 활성을 측정하는 단계; 및
상기 B 세포 활성이 상대적으로 높을 경우, 또는 조절 T 세포 또는 고갈된 T 세포 활성이 상대적으로 낮을 경우 면역항암제 유도 면역관련 이상반응의 발병 위험이 높을 것으로 예측하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
본 발명의 또 다른 구현예로서, 상기 생물학적 시료는 피검체로부터 분리된 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액, 소변, 및 대변으로 이루어진 군으로부터 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.
또한, 본 발명은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제 또는 이를 포함하는 조성물의 면역항암제 유도 면역관련 이상반응의 발병 예측 용도 또는 면역항암제에 대한 반응성 예측 용도를 제공한다.
또한, 본 발명은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제 또는 이를 포함하는 조성물의, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 제제의 제조를 위한 용도 또는 면역항암제에 대한 반응성 예측을 위한 제제의 제조를 위한 용도를 제공한다.
본 발명에서는 면역항암제에 의해 유도되는 면역관련 이상반응의 발병과 관련된 여러 가지 요인을 분석한 결과, TMEM162(FAM187B) 유전자에서의 단일염기다형성(SNP) 부위인 dbSNP 데이터베이스 rs541169가 면역관련 이상반응의 발병과 밀접하게 연관되어 있는 것을 확인하였다. 이에, 상기 rs541169는 면역항암제 유도 면역관련 이상반응의 발병 예측 또는 면역항암제에 대한 반응성 예측을 위한 바이오마커로서 유용하게 이용될 수 있을 것으로 기대된다.
도 1a는 본 발명의 일 구현예에 따른 코호트 데이터 요약 및 데이터 예측 모델링 워크플로를 나타낸 도면이다.
도 1b는 본 발명의 일 구현예에 따른 ICB 투여 후 시간에 따라 여러 유형의 irAE 발생을 밀도 플롯으로 나타낸 도면이다.
도 1c는 본 발명의 일 구현예에 따른 여러 유형의 irAE에 대한 네트워크 분석을 나타낸 도면이다.
도 1d는 본 발명의 일 구현예에 따른 전혈 RNA-seq 데이터에서 세포 유형 풍부도를 PCA 분석으로 확인한 도면이다.
도 2a는 본 발명의 일 구현예에 따른 ICB 치료 전(PRE) 및 치료 초기(EDT) 환자 샘플에서 여러 유형의 irAE 발생과 관련된 실험실 데이터 결과를 나타낸 도면이다.
도 2b는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 전혈구수(CBC) 호중구 값과 RNA 시퀀싱 데이터의 추론을 기반으로 추정된 호중구 세포 분율 간의 상관관계를 확인한 도면이다.
도 2c는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 irAE와 대조군 사이의 호중구 마커 유전자의 발현 수준을 비교한 도면이다. *P<0.05, **P<0.01, ***P<0.001.
도 2d는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 irAE와 대조군 사이에 차등적으로 발현되는 유전자를 볼케이노 플롯으로 확인한 도면이다.
도 2e는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 irAE에서 저발현된 유전자에 대한 경로 풍부도 분석 결과를 나타낸 도면이다.
도 2f는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 12개의 irAE 유형에 대하여 irAE에서 저발현된 유전자에 대한 경로 풍부도 정도를 확인한 도면이다.
도 3a는 본 발명의 일 구현예에 따른 irAE와 대조군 사이에서 차등적으로 발현된 유전자를 볼케이노 플롯으로 확인한 도면이다.
도 3b는 본 발명의 일 구현예에 따른 ANKRD22 유전자의 발현을 면역세포 종류별로 확인한 도면이다.
도 3c는 본 발명의 일 구현예에 따른 EDT 환자 샘플에서 irAE 및 대조군 사이의 호중구 관련 기능 및 사이토카인 매개 신호 조절과 관련된 경로 풍부도 분석 결과를 나타낸 도면이다.
도 3d는 본 발명의 일 구현예에 따른 irAE 또는 대조군에서만 ICB에 대한 반응으로 상향 조절된 유전자에 대한 경로 풍부도 분석 결과를 나타낸 도면이다.
도 3e는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 irAE 및 대조군 사이의 호중구 활성 관련 유전자 CLEC4D 및 CAMP의 발현 변화 및 NK 세포 활성 관련 유전자 CD160 및 KLRC1의 발현 변화를 확인한 도면이다.
도 4a는 본 발명의 일 구현예에 따른 irAE 및 대조군에서 HLA-B 엑손 2의 복제수 변이 상태의 비율을 비교한 도면이다.
도 4b는 본 발명의 일 구현예에 따른 HLA-B 엑손 2의 복제수 변이 상태에 따른 irAE 누적 발생률 분석 결과를 나타낸 도면이다.
도 4c는 본 발명의 일 구현예에 따른 irAE 및 대조군에서 HLA-B 엑손 2의 복제수 값을 확인한 도면이다.
도 4d는 본 발명의 일 구현예에 따른 주요 HLA 대립유전자와 12가지 irAE 유형 사이의 연관성을 히트맵 분석으로 확인한 도면이다.
도 4e는 본 발명의 일 구현예에 따른 주요 HLA 대립유전자 중 뛰어난 연관성을 보이는 대립유전자들에 대하여 irAE 및 대조군에서의 비율을 확인한 도면이다.
도 4f는 본 발명의 일 구현예에 따른 HLA-B*35:01 대립유전자 보유에 따른 12가지 irAE 유형의 비율을 나타낸 도면이다.
도 5a는 본 발명의 일 구현예에 따른 공통 SNV와의 연관성을 기반으로 29가지의 irAE 유형 간의 상관관계 매트릭스를 나타낸 도면이다.
도 5b는 본 발명의 일 구현예에 따른 12가지 irAE 유형과 여러 가지 실험실 데이터, CNV, 및 SNV 특징과의 연관성을 히트맵 분석으로 확인한 도면이다.
도 5c는 본 발명의 일 구현예에 따른 12가지 irAE 유형에 대한 예측 모델의 성능을 평균 정밀도, 정확도 및 AUC를 기반으로 확인한 도면이다.
도 5d는 본 발명의 일 구현예에 따른 모든 irAE 유형과 관련된 SNV 및 CNV에 대한 맨해튼 플롯 결과를 나타낸 도면이다.
도 6a는 본 발명의 일 구현예에 따른 rs541169의 대립유전자 빈도를 여러 나라의 인구 종별로 확인한 도면이다.
도 6b는 본 발명의 일 구현예에 따른 rs541169 돌연변이 보유에 따른 irAE 누적 발생률 분석 결과를 나타낸 도면이다.
도 6c는 본 발명의 일 구현예에 따른 rs541169의 유전자형에 따른 12가지 유형의 irAE의 비율을 나타낸 도면이다.
도 6d는 본 발명의 일 구현예에 따른 rs541169 돌연변이 보유에 따른 12가지 유형의 irAE의 비율을 나타낸 도면이다.
도 6e는 본 발명의 일 구현예에 따른 TMEM162 유전자의 발현량을 여러 조직에서 확인하여 나타낸 도면이다.
도 6f는 본 발명의 일 구현예에 따른 TMEM162 및 BTN2A1 유전자의 발현량을 여러 조직에서 확인하여 나타낸 도면이다.
도 6g는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 rs541169 유전자형에 따른 면역 세포 유형의 분율을 확인한 도면이다.
도 6h는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 rs541169 유전자형에 따른 조절 T 세포(Treg)의 분율을 확인한 도면이다.
도 6i는 본 발명의 일 구현예에 따른 PRE 및 EDT 환자 샘플에서 rs541169 유전자형에 따른 고갈된 T 세포(Tex)의 분율을 확인한 도면이다.
도 6j는 본 발명의 일 구현예에 따른 TCGA 팬암 샘플의 면역 클러스터에서 rs541169 유전자형에 따른 면역 시그니처 점수를 확인한 도면이다.
도 6k는 본 발명의 일 구현예에 따른 1,094개의 한국 전체 게놈 서열에서 rs541169 주변의 HKA 테스트 결과를 나타낸 도면이다.
도 6l은 본 발명의 일 구현예에 따른 rs541169에 대한 HKA 값을 여러 나라의 인구 종별로 확인한 도면이다.
본 발명은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제를 포함하는, 면역항암제 유도 면역관련 이상반응 발병 예측용 조성물을 제공한다.
본 발명에 있어서, “다형성(polymorphism)”이란 유전적으로 결정된 집단 내에서 2 이상의 대체적 서열 또는 대립형질(또는 대립유전자)의 발생을 의미하며, “단일염기다형성(single nucleotide polymorphism, SNP)”은 하나의 염기의 다형성을 의미한다. 구체적으로 유전체에서 단일염기(A, T, C 또는 G)가 종의 멤버들 간 또는 한 개체(individual)의 쌍 염색체 간에 발생하는 DNA 서열의 다양성을 의미한다. 예를 들어, 서로 다른 개체의 세 개의 DNA 단편들(예를 들어 AAGT[A/A]AG, AAGT[A/G]AG, AAGT[G/G]AG)처럼 단일염기에서 차이를 포함하는 경우, 두 개의 대립유전자(A 또는 G)라고 부르며, 일반적으로 거의 모든 SNP는 두 개의 대립 유전자를 가진다. 또한 SNP가 특정 질환과 유전적으로 밀접하게 연관되어 있는 경우에는, SNP는 확인된 정상인(normal) 또는 야생형(wild-type, WT) 개체 또는 대립유전자와 비교하여 특정 위치의 하나의 염기에 변이가 발생한 것을 의미하기도 한다. 본 발명에 있어서, “단일염기변이(single nucleotide variant, SNV)”는 단일 염기의 차이를 보이는 변이를 말하며, 정상인(normal) 또는 야생형(wild-type, WT) 개체 또는 대립유전자와 비교하여 특정 위치의 하나의 염기에 변이가 발생한 것을 의미한다.
본 발명에 있어서, 상기 조성물은 dbSNP 데이터베이스 rs541169의 SNP를 진단 마커로 검출한다.
본 발명에 있어서, 상기 SNP rs541169는 인간의 19번 염색체 상의 35228117번째 염기가 C에서 G 또는 T로 변이가 일어난 것일 수 있으며, 본 발명의 일 실시예 또는 실험예에 따르면 C에서 T로 변이가 일어난 것(C>T)일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, “면역항암제”는 인체가 가지고 있는 고유의 면역계를 강화시켜 암에 대항력을 높여 주는 약물을 의미한다. 면역항암제는 환자 스스로의 면역 강화를 통해 치료를 한다는 점에서 부작용이 적고 암 환자의 삶의 질을 높이고 생존기간도 대폭 연장되는 효과가 있다. 면역항암제는 면역체계의 특이성(specificity), 기억능력(memory), 적응력(adaptiveness)을 증강시킴으로써 항암효과를 나타낸다. 면역항암제는 예컨대 면역 체크포인트 차단(immune checkpoint blockade, ICB)을 위한 제제, 면역세포치료제, 치료용 항체, 또는 면역 체크포인트 인핸서(immune checkpoint inhancer) 등을 포함하며, 이의 종류에 제한되지 않는다. 본 발명에 있어서, 상기 면역 체크포인트 차단을 위한 제제, 즉 면역 체크포인트 억제제(immune checkpoint inhibitor)는 기존의 면역치료제(사이토카인 치료제, 항암백신 등)와는 달리 암세포와 T 세포의 결합 부위에 결합하여 면역회피 신호를 차단함으로써 면역학적 시냅스가 형성되지 못하게 하고 이에 따라 면역회피 방해를 받지 않는 T 세포가 암세포를 파괴하는 기전을 가지고 있으며, 예컨대 니볼루맙(Nivolmab), 아테졸리주맙(Atezolizumab), 펨브롤리주맙(Pembrolizumab), 두발루맙(Duvalumab), 아벨루맙(Avelumab), 이필리무맙(Ipilimumab), 및 트레멜리무맙(Tremelimumab)으로 이루어진 군으로부터 선택된 하나 이상일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, “면역관련 이상반응(immune-related adverse event, irAE)”은 자가면역체계 활성화와 관련되어 발생하는 염증 반응 등을 포함하여 면역항암제 치료에 의해 나타나는 여러 가지 이상반응을 의미한다.
본 발명에 있어서, 상기 면역관련 이상반응은 면역항암제에 의해 나타나는 피부(skin) 이상반응, 내분비계(endocrine system) 이상반응, 갑상선(thyroid gland) 이상반응, 근골격계(musculoskeletal system) 이상반응, 위장계(gastrointestinal system) 이상반응, 신경계(neurologic system) 이상반응, 독감 유사 증상(Flu-like), 및 폐렴(pulmonary)으로 이루어진 군으로부터 선택된 하나 이상일 수 있으나, 이에 제한되지 않는다. 본 발명의 일 실시예 또는 실험예에 따르면, 상기 면역관련 이상반응은 둘 이상의 증상이 함께 나타날 수 있으며, 이의 중증도도 3등급으로 나뉠 수 있다. 예컨대 본 발명에서 면역관련 이상반응의 중증도에 따라 3개 이상의 면역관련 이상반응 유형이 있는 경우 'Multiple G>=1', 3개 이상의 2등급 이상의 유형이 있는 경우는 'Multiple G>=2', 모든(any) 3등급 이상의 유형이 있는 경우 및 2등급 이상의 중요한(critical) 유형이 있는 경우 'Critical'로 표시되며, 면역관련 이상반응 카테고리에 속하는 모든 경우 'Any'로 표시될 수 있다.
본 발명에 있어서, “검출”은 목적하는 물질의 존재(발현) 여부를 측정 및 확인하는 것, 또는 목적하는 물질의 존재 수준(발현 수준)의 변화를 측정 및 확인하는 것을 모두 포함하는 의미이다. 같은 맥락에서, 본 발명에서 상기 dbSNP 데이터베이스 rs541169의 SNP를 검출하는 것은 SNP 발현 여부를 측정하는 것(즉, 존재 유무를 측정하는 것), 또는 상기 dbSNP 데이터베이스 rs541169의 SNP의 질적, 양적 변화 수준을 측정하는 것을 의미한다. 상기 측정은 정성적인 방법(분석)과 정량적인 방법을 모두 포함하여 제한 없이 수행될 수 있다. SNP 존재 여부 측정에 있어서 정성적 방법과 정량적 방법의 종류는 당업계에 잘 알려져 있으며, 본 명세서에서 기술한 실험법들이 이에 포함된다.
본 발명에 있어서, 상기 검출 제제는 dbSNP 데이터베이스 rs541169의 염기가 T인 변이를 검출하는 것일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 rs541169 SNP는 TMEM162(FAM187B) 단백질의 절단을 일으키는 것일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 검출 제제는 rs541169 SNP를 검출할 수 있는 프라이머 또는 프로브일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, “프라이머(primer)”는 DNA 합성의 개시점(starting point)으로 작용하는 짧은 단일가닥 올리고뉴클레오티드(single strand oligonucleotide)이다. 프라이머는 적합한 완충액(buffer)과 온도 조건에서 주형(template)인 폴리뉴클레오티드에 특이적으로 결합하고, DNA 중합효소가 프라이머에 주형 DNA에 상보적인 염기를 갖는 뉴클레오사이드 트리포스페이트를 추가하여 연결함으로써 DNA가 합성된다. 프라이머는 일반적으로 15 내지 30개의 염기서열로 이루어져 있으며, 염기 구성과 길이에 따라 주형 가닥에 결합하는 온도(melting temperature, Tm)가 달라진다. 프라이머의 서열은 주형의 일부 염기 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, DNA 합성을 통해 mRNA 또는 cDNA의 특정 구간을 증폭하여 mRNA의 양을 측정하려는 목적에 맞는 길이와 상보성을 갖는 것이면 충분하다. 따라서 본 발명에서 상기 유전자 또는 이의 mRNA의 cDNA 또는 genomic DNA의 염기서열을 참조하여 프라이머 쌍을 용이하게 디자인할 수 있다. 상기 증폭 반응을 위한 프라이머는 증폭하고자 하는 mRNA의 특정 구간의 양쪽 끝부분의 주형(또는 센스, sense)과 반대편(안티센스, antisense)에 각각 상보적으로 결합하는 한 세트(쌍)으로 구성된다.
본 발명에 있어서, “프로브(probe)”는 특정 유전자의 mRNA나 cDNA(complementary DNA), DNA 등에 특이적으로 결합할 수 있는 짧게는 수개 내지 길게는 수백 개의 염기(base pair) 길이의 RNA 또는 DNA 등 폴리뉴클레오티드의 단편을 의미하며, 표지(labeling)되어 있어서 결합하는 대상 mRNA나 cDNA의 존재 유무, 발현양 등을 확인할 수 있다. 프로브의 선택 및 혼성화 조건은 당업계에 공지된 기술에 따라 적절하게 선택할 수 있다. 상기 프로브는 대립형질(또는 대립유전자, allele)을 검출하기 위한 진단 방법 등에 사용될 수 있다. 상기 진단 방법에는 서던 블롯 등과 같은 핵산의 혼성화에 근거한 검출 방법들이 포함되며, DNA 칩을 이용한 방법에서 DNA 칩의 기판에 미리 결합된 형태로 제공될 수도 있다.
본 발명에서, 프라이머 또는 프로브는 포스포아미다이트(phosphoramidite) 고체지지체 합성법이나 기타 널리 공지된 방법을 이용하여 화학적으로 합성할 수 있다. 또한 프라이머 또는 프로브는 검출하고자 하는 표적이 되는 폴리뉴클레오티드와의 혼성화를 방해하지 않는 범위에서 당해 기술분야에 공지된 방법에 따라 다양하게 변형시킬 수 있다. 이러한 변형의 예로는 메틸화, 캡화, 천연 뉴클레오티드 하나 이상의 동족체로의 치환 및 뉴클레오티드 간의 변형, 예를 들면 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등), 그리고 형광 또는 효소를 이용한 표지물질(labeling material)의 결합 등이 있다.
본 발명에 있어서, 상기 프라이머 또는 프로브는 rs541169 SNP를 검출할 수 있는 것이라면 특정 서열로 한정되지 않는다.
또한, 본 발명은 상기 조성물을 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측용 키트를 제공한다.
본 발명에 있어서, “키트”는 상기 rs541169 SNP를 검출하는 제제를 포함함으로써, 면역항암제 유도 면역관련 이상반응의 발병을 예측하거나 암 환자의 면역항암제에 대한 반응성을 예측할 수 있도록 하는 도구를 의미한다. 본 발명의 키트에는 상기 제제 외에도 이들의 측정 또는 검출 방법에 통상적으로 필요한 다른 구성성분, 조성물, 용액, 장치 등이 포함될 수 있다. 이때, 상기 rs541169 SNP를 측정하는 물질은 1회 이상 횟수에 제한 없이 작용시킬 수 있으며, 각 물질을 적용하는 선후에는 제한이 없고, 각 물질의 적용은 동시에 진행될 수도 있고 미시에 진행될 수도 있다.
본 발명에 있어서, 상기 키트는 컨테이너; 지시서; 및 상기 rs541169 SNP를 측정하는 제제를 포함할 수 있다. 상기 컨테이너는 상기 제제를 포장하는 역할을 할 수 있고, 보관 및 고정하는 역할을 할 수도 있다. 상기 컨테이너의 재질은 예컨대, 병, 통(tub), 작은 봉지(sachet), 봉투(envelope), 튜브, 앰플(ampoule) 등과 같은 형태를 취할 수 있고, 이들은 부분적 또는 전체적으로 플라스틱, 유리, 종이, 호일, 왁스 등으로부터 형성될 수 있다. 상기 용기는 처음에는 용기의 일부이거나 또는 기계적, 접착성, 또는 기타 수단에 의해 용기에 부착될 수 있는, 완전히 또는 부분적으로 분리가 가능한 마개를 장착할 수 있으며, 또한 주사바늘에 의해 내용물에 접근할 수 있는 스토퍼가 장착될 수 있다. 상기 키트는 외부 패키지를 포함할 수 있으며, 외부 패키지는 구성 요소들의 사용에 관한 지시서를 포함할 수 있다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 정보제공방법 또는 면역항암제 유도 면역관련 이상반응의 발병 예측 방법을 제공한다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제에 대한 반응성 예측을 위한 정보제공방법 또는 면역항암제에 대한 반응성 예측 방법을 제공한다.
본 발명에 있어서, “피검체”는 면역항암제 치료를 받고자 하는 암 환자 또는 면역항암제 치료를 받은 암 환자 모두를 포함할 수 있으며, 이때 상기 피검체는 인간 또는 비-인간인 영장류, 생쥐 (mouse), 쥐 (rat), 개, 고양이, 말, 및 소 등의 포유류를 포함할 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 암은 비소세포성 폐암 및 소세포성 폐암을 포함하는 폐암, 식도암, 간세포성 암종, 위암, 유방암, 방광암, 신장암, 담관암, 요도암, 두경부암, 흑색종, 대장암, 담낭암, 췌장암, 바터팽대부암, 신경내분비암종, 부신경절종, 난소암, 자궁암, 전립선암, 흉선암, 및 뇌 혈관육종으로 이루어진 군으로부터 선택된 하나 이상일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 생물학적 시료는 피검체로부터 분리된 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액, 소변, 및 대변으로 이루어진 군으로부터 선택되는 하나 이상일 수 있으며, 본 발명의 일 실시예 또는 실험예에 따르면 전혈일 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 방법은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 염기가 T인 변이가 검출될 경우, 면역항암제 유도 면역관련 이상반응의 발병 위험이 높을 것으로 예측하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 조성물은 본 발명의 표 8에 기재된 dbSNP 데이터베이스의 SNP 중 하나 이상의 SNP 검출 제제를 추가로 포함할 수 있으며, 바람직하게는 하기 표에 기재된 dbSNP 데이터베이스의 SNP 중 하나 이상의 SNP 검출 제제를 추가로 포함할 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 방법은 피검체에서 분리된 생물학적 시료에서, 본 발명의 표 8에 기재된 dbSNP 데이터베이스의 SNP 중 하나 이상의 SNP를 검출하는 단계를 더 포함할 수 있으며, 바람직하게는 하기 표에 기재된 dbSNP 데이터베이스의 SNP 중 하나 이상의 SNP를 검출하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
Figure PCTKR2023001078-appb-img-000006
Figure PCTKR2023001078-appb-img-000007
Figure PCTKR2023001078-appb-img-000008
Figure PCTKR2023001078-appb-img-000009
Figure PCTKR2023001078-appb-img-000010
본 발명에 있어서, 상기 방법은 피검체로부터 분리된 생물학적 시료에서 B세포, 조절 T 세포(regulatory T cell), 및 고갈된 T 세포(exhausted T cell)로 이루어진 군으로부터 선택된 하나 이상의 활성을 측정하는 단계; 및
상기 B 세포 활성이 상대적으로 높을 경우, 또는 조절 T 세포 또는 고갈된 T 세포 활성이 상대적으로 낮을 경우 면역항암제 유도 면역관련 이상반응의 발병 위험이 높거나 면역항암제에 대한 반응성이 낮을 것으로 예측하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
즉, 본 발명에 있어서, 상기 rs541169의 염기가 T인 변이가 검출되고, 이에 더하여 상기 B 세포 활성이 상대적으로 높거나 조절 T 세포 또는 고갈된 T 세포 활성이 상대적으로 낮을 경우 면역항암제에 의한 면역관련 이상반응의 발병 위험이 더 높거나 면역항암제에 대한 반응성이 더 낮을 것으로 예측할 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, dbSNP 데이터베이스 rs541169 SNP를 검출하는 단계는 당업계에 알려진 통상적인 방법을 사용하여 수행할 수 있으며, 예컨대, 시퀀싱(sequencing), 엑솜 시퀀싱(exome sequencing), NGS(next generation sequencing), 파이로시퀀싱(pyrosequencing), 마이크로어레이에 의한 혼성화(microarray hybridization), 대립유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립유전자 혼성화 기법(dynamic allele-specific hybridization), PCR 연장 분석, PCR-SSCP 방법, 및 Taqman 기법으로 이루어진 군으로부터 선택된 하나 이상의 방법으로 수행될 수 있으나, 이에 제한되지 않는다.
또한, 본 발명은 피검체에서 분리된 생물학적 시료에서, 호중구 수, 호중구 대 림프구 비율(NLR), 림프구 수, 및 혈소판 대 림프구 비율(PLR)로 이루어진 군으로부터 선택된 하나 이상을 검출하는 단계를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 정보제공방법; 또는 면역항암제에 대한 반응성 예측을 위한 정보제공방법을 제공한다.
본 발명에 있어서, 상기 호중구 수, 호중구 대 림프구 비율, 또는 혈소판 대 림프구 비율이 상대적으로 낮을 경우; 또는 림프구 수가 상대적으로 높을 경우 면역항암제 유도 면역관련 이상반응의 발병 위험이 높을 것으로 예측하거나, 면역항암제에 대한 반응성이 낮을 것으로 예측할 수 있으나, 이에 제한되지 않는다.
본 발명에 있어서, 상기 호중구 수, NLR, 림프구 수, 또는 PLR은 면역항암제 유도 면역관련 이상반응의 발병 예측 또는 면역항암제에 대한 반응성 예측에 대한 단독 모델로 사용될 수도 있고, rs541169 SNP와 함께 사용될 수도 있으나, 이에 제한되지 않는다.
또한, 본 발명은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제 또는 이를 포함하는 조성물의 면역항암제 유도 면역관련 이상반응의 발병 예측 용도; 또는 면역항암제에 대한 반응성 예측 용도를 제공한다.
또한, 본 발명은 dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제 또는 이를 포함하는 조성물의, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 제제의 제조를 위한 용도; 또는 면역항암제에 대한 반응성 예측을 위한 제제의 제조를 위한 용도를 제공한다.
또한, 본 발명은 암 환자의 면역항암제 치료 후 면역관련 이상반응의 발병 위험도가 높을 것으로 의심되는 피검체 또는 면역항암제에 대한 반응성이 낮을 것으로 의심되는 피검체와 대조군에서 분리된 생물학적 시료에서 dbSNP 데이터베이스 rs541169의 SNP를 측정한 후, 상기 rs541169의 염기가 T인 변이가 검출될 경우 면역항암제 치료 후 면역관련 이상반응의 발병 위험도가 높은 피검체 또는 면역항암제에 대한 반응성이 낮은 피검체임을 가리키는 것으로 보는, 면역항암제 유도 면역관련 이상반응의 발병 예측 또는 면역항암제에 대한 반응성 예측에 대한 감수성이 높은 피검체인지 결정/분석하기 위한 정보를 제공하는 방법을 제공한다.
본 발명에 있어서, “포함하는” 이라는 용어가 사용될 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 본 발명 전체에서 사용되는 정도의 용어 “~(하는) 단계” 또는 “~의 단계”는 “~ 를 위한 단계”를 의미하지 않는다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예 및 실험예를 제시한다. 그러나 하기의 실시예 및 실험예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예 및 실험예에 의해 본 발명의 내용이 한정되는 것은 아니다.
[실시예]
실시예 1. 면역관련 이상반응(irAE) 환자 다기관 전향적 코호트
서울아산병원에 등록된 면역 체크포인트 차단(ICB) 요법을 받은 irAE 환자군 372명 및 non-irAE 환자군 300명으로 이루어진 총 672명의 환자를 모집하여 연구를 수행하였다.
환자의 연령, 성별, 암 유형, 및 투여받은 ICB 치료제의 종류 등을 포함하여 환자 코호트의 기본 특징을 하기 표 1에 나타내었다.
  Total (N=672) irAE group (N=372) non-irAE group (N=300)
Age
Median, years (range) 63 (24-89) 62 (24-87) 64 (26-89)
>=65 298 (44.3%) 153 (41.1%) 145 (48.3%)
<65 374 (55.7%) 219 (58.9%) 155 (51.7%)
Sex
Male 490 (72.9%) 275 (73.9%) 215 (71.7%)
Female 182 (27.1%) 97 (26.1%) 85 (28.3%)
Cancer type
NSCLC 257 (38.2%) 134 (36.0%) 123 (41.0%)
Esophageal cancer 71 (10.6%) 52 (14.0%) 19 (6.3%)
HCC or comibined HCC-CCA 65 (9.7%) 37 (9.9%) 28 (9.3%)
Gastric cancer 62 (9.2%) 37 (9.9%) 25 (8.3%)
Breast cancer 34 (5.1%) 29 (7.8%) 5 (1.7%)
Bladder cancer 33 (4.9%) 13 (3.5%) 20 (6.7%)
Renal cancer 27 (4.0%) 15 (4.0%) 12 (4.0%)
Billiary cancer 23 (3.4%) 10 (2.7%) 13 (4.3%)
Ureter cancer 22 (3.3%) 10 (2.7%) 12 (4.0%)
Head and neck cancer 20 (3.0%) 8 (2.2%) 12 (4.0%)
Melanoma 16 (2.4%) 5 (1.3%) 11 (3.7%)
Small cell lung cancer 13 (1.9%) 4 (1.1%) 9 (3.0%)
Colorectal cancer 11 (1.6%) 11 (3.0%) 0 (0.0%)
Gall bladder cancer 5 (0.7%) 2 (0.5%) 3 (1.0%)
Pancreas cancer 2 (0.3%) 1 (0.3%) 1 (0.3%)
Ampulla of vater cancer 2 (0.3%) 1 (0.3%) 1 (0.3%)
Cancer of unknown primary site 2 (0.3%) 1 (0.3%) 1 (0.3%)
Neuroendocrine carcinoma 1 (0.1%) 0 (0.0%) 1 (0.3%)
Paraganglioma 1 (0.1%) 1 (0.3%) 0 (0.0%)
Ovarian cancer 1 (0.1%) 0 (0.0%) 1 (0.3%)
Uterine cancer 1 (0.1%) 0 (0.0%) 1 (0.3%)
Prostate cancer 1 (0.1%) 0 (0.0%) 1 (0.3%)
Thymic carcinoma 1 (0.1%) 1 (0.3%) 0 (0.0%)
Angiosarcoma of brain 1 (0.1%) 0 (0.0%) 1 (0.3%)
ICB type*
Nivolumab 217 (32.3%) 131 (35.2%) 86 (28.7%)
Atezolizumab 193 (28.7%) 92 (24.7%) 101 (33.7%)
Pembrlizumab 151 (22.5%) 81 (21.8%) 70 (23.3%)
Duvalumab 36 (5.4%) 23 (6.2%) 13 (4.3%)
Avelumab 3 (0.4%) 2 (0.5%) 1 (0.3%)
Nivolumab + Ipilimumab 12 (1.8%) 8 (2.2%) 4 (1.3%)
Duvalumab + Tremelimumab 1 (0.1%) 1 (0.3%) 0 (0.0%)
Investigational Immune checkpoint treatment 72 (10.7%) 47 (12.6%) 25 (8.3%)
ICB treatment regimen*
ICB monotherapy 573 (85.3%) 310 (83.3%) 263 (87.7%)
ICB + ICB 15 (2.2%) 9 (2.4%) 6 (2.0%)
ICB + cytotoxic chemotherapy 65 (9.7%) 43 (11.6%) 22 (7.3%)
ICB + molecular targeted therapy 12 (1.8%) 5 (1.3%) 7 ( 2.3%)
ICB+ cytotoxic chemotherapy + molecular targeted therapy 12 (1.8%) 10 (2.7%) 2 (0.7%)
ICB use*
Practice 483 (71.9%) 261 (70.2%)
Clinical trial 161 (24.0%) 107 (28.8%)
Unknown 41 (6.1%) 17 (4.6%)
Treatment setting*
Palliative 557 (82.9%) 296 79.6%) 261 (87.0%)
Neoadjuvant 43 (6.4%) 27 (7.3%) 16 (5.3%)
Maintenance after definitive CRT 32 (4.8%) 19 (5.1%) 13 (4.3%)
Adjuvant 22 (3.3%) 13 (3.5%) 9 (3.0%)
Neoadjuvant + adjuvant 21 (3.1%) 20 (5.4%) 1 (0.3%)
Prior treatment**
Cytotoxic chemotherapy 466 (69.3%) 252 (67.7%) 214 (71.3%)
Molecular targeted agent 129 (19.2%) 72 (19.4%) 57 (19.0%)
RT 163 (24.3%) 73 (19.6%) 90 (30.0%)
CRT 73 (10.9%) 51 (13.7%) 22 (7.3%)
Number of prior systemic therapy in the palliative setting*
0 70 (10.4%) 34 (9.9%) 36 (12.0%)
1 265 (39.4%) 138 (37.1%) 127 (42.3%)
2 113 (16.8%) 75 (20.2%) 38 (12.7%)
>=3 87 (12.9%) 45 (12.1%) 42 (14.0%)
(*13명의 환자가 두 가지 ICB 요법을 받았고, 이에 해당하는 경우 각각 계산되었다(1차 및 2차 ICB 요법의 기본 특징이 다른 경우).
**보조제 또는 신보강 요법과 같은 일시적인 처방 및 비-일시적 처방 설정 포함
irAE, 면역 관련 이상반응; NSCLC, 비소세포 폐암; HCC, 간세포 암종; CCA, 담관암; ICB, 면역 체크포인트 차단; RT, 방사선 요법; CRT, 화학 방사선 요법)
실시예 2. irAE 환자의 분류
통합 모델의 추가 분석 및 트레이닝을 위해 84개 유형의 irAE(단일 라벨)를 12개의 주요 라벨('Any' 라벨 포함)로 분류하였다. 12개의 주요 라벨 각각으로 구성된 단일 라벨 목록은 하기 실험예 1의 표 3에 나타내었으며, 12개의 주요 라벨 각각에 대한 환자 수는 하기 실험예 1의 표 4에 나타내었다.
실시예 3. 임상적 특징
본 발명의 코호트의 환자에 대해 이용 가능한 임상적 특징에는 약물 유형, 암 유형, ECOG 수행 상태, 자가면역 질환의 병력, 및 당뇨 또는 고혈압의 병력이 포함된다. 전처리 실험실 테스트에는 전혈구수(CBC), 화학적 성질, 및 호중구 대 림프구 비율(NLR)과 같은 값으로부터 계산된 여러 조합 값이 포함되고, 혈소판 대 림프구 비율(PLR) 또한 후보 특징으로 포함되었다.
실시예 4. 전체 엑소좀 시퀀싱(WES) 및 데이터 처리
SureSelect Human All Exon V5 키트(Agilent Technologies, Santa Clara, CA)를 사용하여 라이브러리를 준비하고, HiSeq 2500(Illumina, San Diego, CA)에서 TruSeq Rapid SBS Kit-200 Cycle을 사용하여 표준 제조업체의 지침에 따라 클러스터 생성 및 시퀀싱을 다음과 같이 수행하였다.
raw WES FASTQ 파일의 품질은 FastQC(v.0.11.9) 및 MultiQC(v.1.9)를 사용하여 컨트롤되었다. 리드는 기본 매개변수와 함께 BWA-MEM(v.0.7.17-r1188)을 사용하여 1000 게놈 프로젝트의 GRCh37(hg19) 빌드에 정렬되었다. 정렬된 리드는 SAMtools(v.1.7)에서 HTSlib(v.1.7-2)로 분류되었고 중복은 Picard(v.2.25.0-5-ga2f44ae-SNAPSHOT)로 표시되었다. GATK(The Genome Analysis Toolkit)(v.4.1.6.0)의 ApplyBQSR을 사용하여 기본 품질 점수 재측정을 수행하였다.
실시예 5. RNA 시퀀싱 및 데이터 처리
전혈 샘플에서 생성된 라이브러리는 Illumina 플랫폼에서 150개 염기 페어드-엔드(paired-end) 리드로 시퀀싱되었다. raw FASTQ 파일의 품질은 FastQC(v.0.11.9), MultiQC(v.1.9), 및 Trimmomatic(v.0.39)(어댑터 시퀀싱 트리밍을 위한 TruSeq3-PE-2.fa:2:30:10:2:keepBothReads LEADING:3 TRAILING:3 MINLEN:36)을 사용하여 컨트롤 되었으며, SortMeRNA(v.2.1b)(silva-euk-18s-id95.fasta, silva-euk-28s-id98.fasta)는 rRNA 필터링에 사용되었다.
리드는 1000 Genomes Project에서 제공하는 GRCh37(hg19) 빌드에 정렬되었으며 유전자는 --sjdbOverhang 150 옵션이 있는 STAR 2 패스 매핑을 사용하여 gencode.v37.annotation.gtf를 기반으로 할당되었다. 정렬된 리드는 SAMtools(v.1.7)를 사용하여 분류되었으며 리드 수는 HTSeq(v.0.12.4)에 의해 계산되었다. 리드 수는 하우스 코드를 사용하여 TPM 값을 계산함으로써 정규화 되었다.
실시예 6. 생식계열 단일 염기 변이(SNV) 검출
분석 준비 bam 파일을 사용하여 GATK 모범 사례 워크플로를 SNV 검출에 채택하였다. gVCF 모드에서 HaplotypeCaller를 실행한 다음 GenomicsDBImport, GEnotypeGVCFs, VariantRecalibrator 및 ApplyVQSR을 실행하였다. GQ > 80, DP > 20 기준을 만족하는 변이는 VCFtools(v.0.1.15) 및 BCFtools(v.1.7)를 사용하여 필터링 되었으며, 엑손 영역 간격의 정보는 SureSelect Human All Exon V5(Agilent)로 추출되었다.
실시예 7. 병합된 VCF(Variant Call Format) 파일의 후처리
608명의 환자의 VCF 파일을 병합하고 ANNOVAR로 주석을 달았다. 아미노산의 변이가 일어나는 non-synonymous 변이만 추가 분석에 사용하였으며, 각 환자에서 각 변이의 존재 또는 부재를 나타내는 이진법 코드를 연령, 성별 및 약물 유형을 공변량으로 사용하여 계산된 각 irAE 라벨에 대한 로지스틱 회귀의 p-값에 사용하였다. 연관 불균형의 변이에 대해 clumping window = 250 kb, r2 = 0.8, P-값 임계값 = 0.05, 및 동아시아 인구와 같은 매개변수와 함께 R 패키지 ieugwasr를 사용하여 clumping을 수행하였다.
실시예 8. 생식계열 복제수 변이(CNV) 검출
코호트 모드에서 검출하는 GATK 생식계열 CNV는 모범 사례에 의해 권장되는 매개변수로 수행하였다. 각 샘플에 대한 분석 준비 BAM 파일을 입력으로 CollectReadCounts를 사용하여 리드 수를 계산하였다. 그런 다음 모든 간격을 입력으로 하여, GATK PreprocessIntervals, AnnotateIntervals 및 FilterIntervals를 사용하여 처리된 간격 목록을 얻었다. 각 간격에 대한 복제수는 DefineGermlineContigPloidy, GermlineCNVCaller 및 PostprocessGermlineCNVCalls에 의해 계산되었다. 그리고 나서 각 환자의 CNV 결과는 BCFtools 병합 기능에 의해 간격 단위로 병합되었다. 병합된 VCF는 약 500개의 염기쌍 길이로 224,551개의 간격을 커버했다. 엑손 영역의 간격(204,364 간격)을 추출하기 위해 ANNOVAR를 사용하여 기능적 유전자 주석을 수행하였으며, 통합 모델 트레이닝에 포함되지 않은 샘플의 경우, CASE 모드에서 GATK 생식계열 CNV 검출을 수행하였다. 모든 엑손 간격은 한계값 복제수 2를 기준으로 결실, 중립, 및 중복으로 분류되었다.
실시예 9. HLA-타이핑
HLA 유전자형 분석은 WES FASTQ 파일을 입력으로 한 HLA-HD(v.1.3.0)를 사용하여 수행하였으며, 클래스 I(HLA-A, B, 및 C) 및 클래스 II(DRB1, DQB1, 및 DPB1)를 모두 타이핑하였다. 최대 4자리(즉, 두 번째 필드)까지 추가 분석에 사용하였고, 이진법 코딩을 수행하여 본 발명의 코호트의 전체 환자에서 풀링된 HLA 대립 유전자에 상응하는 대립 유전자를 각 환자가 가지고 있는지 확인하였다.
실시예 10. 다변량 로지스틱 회귀
연령, 성별 및 약물 유형을 공변량으로 사용한 다변량 로지스틱 회귀를 수행하여 각 irAE 유형과 관련된 특징 후보를 발견하였다. 대조군은 어떠한 irAE도 겪지 않은 환자로 정의하였다. 회귀는 HLA 유형 및 생식계열 SNV의 이진법 코드, 및 연령, 성별 및 약물 유형을 공변량으로 사용한 CNV 및 말초 혈액 마커의 연속 값에 대해 별도로 수행하였다. 회귀 p-값이 0.01 이하인 특징은 순열 테스트를 거쳐 최종 유의한 특징을 결정하였다.
실시예 11. 통합 모델의 트레이닝 입력 특징 생성
12개의 주요 irAE 라벨 각각에 대해, 테스트된 생식계열 변이는 다변량 로지스틱 회귀 p-값을 기준으로 순위를 매겼다. P<0.01인 변이 중에서, 가장 높은 순위에서 최대 70개의 SNP를 트레이닝 입력 특징으로 사용하였다. 트레이닝을 위한 최적의 변이 수는 Scipy 패키지의 find_peaks() 함수, 및 하우스 코드를 사용하여 각각의 트레이닝된 변이의 수 증가에 대한 테스트 세트의 평균 정밀도에 대한 플롯의 정점을 찾아 결정하였다. 또한, xgboost를 사용하여 최적의 트레이닝된 변이 수를 결정하려고 시도했으며 다변량 로지스틱 회귀로 결정된 변이 수를 사용할 때 평균 정밀도가 더 높다는 것을 발견하였다. 트레이닝된 변이의 수를 제한하는 것은 모델의 과적합을 방지하기 위한 것이었다.
실시예 12. 통합 모델의 트레이닝 및 예측
통합 모델은 12개의 주요 라벨 각각에 대해 트레이닝 하였다. 통합 모델의 특징에는 상기에서 기재한 바와 같이 다변량 로지스틱 회귀에 의해 선택된 유의하게 연관된 생식계열 변이와 함께 다변량 로지스틱 회귀에 의해 발견된 유의하게 연관된 HLA 유형, CNV, 및 말초 혈액 마커가 포함된다. 통합 모델을 트레이닝하기 위해 심층 신경망(DNN) 프레임워크를 구현하였다. DNN의 성능은 XGBoost 분류기보다 우수했다. 각 라벨에 대한 모델을 트레이닝 하기 위해, 해당 라벨의 irAE가 있는 환자(true case) 및 irAE가 없는 환자(false case)를 트레이닝(training) 및 검증(validation) 세트에 대해 각각 8:2로 나누었다. 트레이닝 세트의 모든 특징은 MinMaxScaler를 사용하여 -1에서 1 사이의 범위로 조정되었으며 트레이닝 세트에 맞는 스케일러(scaler)는 검증 세트의 특징 변환에 채택되었다. irAE 발생의 예측이 주요 목표이기 때문에 평균 정밀도 값을 기반으로 최적의 모델을 선택하였으며, 모델을 검증하기 위해 모델 트레이닝 또는 검증에 사용되지 않은 검증 세트 및 샘플, 즉. 주어진 모델 라벨에 해당하지 않는 irAE 환자를 모두 대상으로 사용하였다.
WES 데이터 및 RNA-seq 데이터를 모두 사용할 수 있는 250명의 환자를 대상으로 유전자 발현 특징을 추가하여 통합 모델을 트레이닝 하였다. WES 데이터에서 유래된 특징으로 트레이닝된 모델, WES 데이터 및 RNA-seq 데이터에서 유래된 특징으로 트레이닝된 모델의 성능을 평균 정밀도 미터법을 사용하여 비교하였다.
실시예 13. 심층 신경망 모델링
PyTorch를 사용하여 심층 신경망(DNN) 프레임워크를 구현하였다. 가중치 초기화를 위해 완전히 연결된 3개의 히든 레이어와 Xavier 균일 방법을 사용하였다. 1번째, 2번째, 3번째 히든 레이어는 각각 40, 80, 20개의 히든 노드를 가지며, tanh는 층간 활성화 함수, sigmoid는 최종 활성화 함수를 갖는다. 전체 샘플을 5개의 배치(batch)로 나누어 배치 크기를 결정하였으며, 최적화 과정은 Adam 옵티마이저를, 손실함수는 이진법 cross-entropy를 적용하였다. 학습률, 최대 epoch, 최적화 과정의 조기 중단을 위한 patience는 각각 0.001, 100, 5로 설정했다. 모든 하이퍼 파라미터는 반복 스윕(sweep)으로 결정되었으며, 100 epoch 내에서 테스트 손실이 가장 적은 모델이 최종 모델로 선정되었다.
실시예 14. 특징 중요도 평가
각 특징이 예측 결과에 미치는 영향을 해석하기 위한 SHAP 값은 SHAP 패키지의 DeepExplainer 기능을 사용하여 계산하였다. 각 변이에 대한 모든 샘플의 SHAP 값을 평균화하여 SHAP 값을 기준으로 생식계열 변이의 순위를 매겼고 순위가 높은 변이를 추가 분석에 사용하였다. 변이 특징(이진법 코드)의 SHAP 값과 CNV(-1,0,1) 및 말초 혈액 마커(연속 값)의 SHAP 값 간의 직접적인 비교는 이들의 스케일(scale) 범위가 다르기 때문에 가능하지 않았다.
실시예 15. 누적 발생률 분석
irAE 발생까지의 시간과 (1) 유전자 HLA-B의 복제수 및 (2) rs541169 변이의 유전자형 사이의 상관관계를 조사하기 위해 누적 발생률 분석을 수행하였다. 복제수가 2인 환자는 정상 배수성군, 2 초과는 중복군, 2 미만은 결실군으로 분류하였다. 환자는 rs541169에 대한 유전자형에 따라 동형접합 참조 대립 유전자(HomoRef), 이형접합 대체(HetAlt), 및 동형접합 대체(HomoAlt)의 세 그룹으로 분류하였다. ICB 치료 시작부터 irAE 발생까지의 기간을 추적 기간으로 정의하고 사망 또는 추적 손실은 검열된 데이터로 처리하였다. Cox 비례 위험 모델을 사용하여 통계적 유의성을 계산하였다.
실시예 16. RNA-seq 데이터에서 세포 유형 풍부도의 디컨볼루션(deconcolution)
ImmuCellAI를 사용하여 전혈 RNA-seq 데이터로부터 총 21개의 면역 세포 분율을 계산하였다(Miao, Y et al., Adv. Sci. 7, 1902880.). 서로 다른 시퀀싱 배치에서 시퀀싱 데이터 간에 가능한 편향을 최소화하기 위해 PCA 분석을 수행하였으며(도 1d 참조), PCA 플롯은 서로 다른 시퀀싱 배치에서 샘플이 조화된 혼합물을 형성함을 보여주었다.
실시예 17. 균형 시그니처 검출을 위한 통계 분석
균형 선택의 시그니처를 확인하기 위해 1000개의 게놈 프로젝트로부터 26개의 하위 모집단에 대해 HKA(Hudson-Kreitman-Aguade) 테스트를 수행하였다. HKA 테스트는 다형성 수준(종 내 다양성)을 대체 수준(종 간 다양성)과 비교한다. MLHKA 소프트웨어(http://wright.eeb.utoronto.ca/programs/)를 사용하여 최대 가능성 HKA 테스트(Wright and Charlesworth, 2004)를 수행하였다. rs541169 돌연변이의 주변 1-kb 영역을 이전에 보고된 바와 같이 선택된 99개의 중립적으로 진화된 영역과 비교하였다(Fumagalli et al., 2009; Gokcumen et al., 2013). 각 영역에서 분리 사이트(segregating site) 수와 종간 차이의 쌍별 수를 입력으로 사용하였으며, 침팬지는 이 분석에서 외집단으로 사용하였다. 선택을 테스트하기 위해 선택된 유전자좌의 수가 0인 중립 모델에서 프로그램을 실행한 다음, 초점 SNP의 주변 1-kb 영역을 유일한 선택된 유전자좌로 간주하는 선택 모델에서 프로그램을 실행하였다. 통계적 유의성은 선택 모델과 중립 모델 사이의 로그(log) 가능성 차이의 2배가 자유도 1(선택된 유전자좌의 수)을 갖는 x2 분포를 대략적으로 따르는 가능성 비율 테스트에 의해 평가되었다. 출력의 견고성을 보장하기 위해 체인 길이를 100,000으로 적용하였다. 각 테스트 사이트에 대해, 가능성 비율 테스트에서 선택 매개변수 k 및 P-값을 얻었다. 선택 매개변수 k는 주어진 유전자좌에서 중립적 기대치에 대한 다양성에 대한 k배 상승을 나타낸다. 따라서 k > 1은 균형 선택을 뒷받침한다.
하위 인구에 대한 약어: AFR, 아프리카; AMR, 미주; EAS, 동아시아; EUR, 유럽; SAS, 남아시아; GWD, 감비아 서부 지역의 감비아인; MSL, 시에라리온의 Mende; ASW, 미국 남서부의 아프리카 조상; ACB, 바베이도스의 아프리카 카리브해; YRI, 나이지리아 이바단의 요루바; LWK, 케냐 Webuye의 Luhya; ESN, 나이지리아의 Esan; MXL, 캘리포니아주 로스앤젤레스의 멕시코계 조상; PUR, 푸에르토리코의 푸에르토리코인; CLM, 콜롬비아 메델린의 콜롬비아인; PEL, 페루 리마의 페루인; KHV, 베트남 호치민시의 킨족; CDX, 중국 시솽반나의 중국인 다이족; CHB, 중국 북경의 한족; KOR, 한국의 한국인; CHS, 한족 남부; JPT, 일본 도쿄의 일본인; GBR, 영국과 스코틀랜드의 영국인; IBS, 스페인의 이베리아 인구; TSI, 이탈리아의 토스카니; CEU, 북유럽 및 서유럽 혈통을 가진 유타 거주자(CEPH); FIN, 핀란드의 핀란드인; STU, 영국의 스리랑카 타밀인; PJL, 파키스탄 라호르의 펀잡인; GIH, 텍사스주 휴스턴의 구자라트 인디언; BEB, 방글라데시의 벵골어; ITU, 영국의 인도인 텔루구인.
[실험예]
실험예 1. irAE의 다기관 전체 암(pan-cancer) 전향적 코호트
ICB 치료된 672명의 환자 중 372명에서 84가지 유형의 irAE를 확인하였다(하기 표 2 참조). 피부(skin), 내분비계(endocrine system), 갑상선(thyroid gland), 근골격계(musculoskeletal system), 위장계(gastrointestinal system) 및 신경계(neurologic system)와 같은 영향을 받는 장기 시스템을 기반으로 각 irAE에 라벨을 지정하였다. irAE의 중증도에 따라 3개 이상의 irAE 유형이 있는 환자는 Multiple G>=1, 3개 이상의 2등급 이상의 irAE 유형이 있는 환자는 Multiple G>=2, 모든(any) 3등급 이상의 irAE 유형이 있는 환자 및 2등급 이상의 중요한(critical) irAE 유형이 있는 환자를 Critical로 추가 라벨링하였다. 다른 라벨에는 Flu-like(독감 유사 증상) 및 Pulmonary(ICB 치료로 인한 폐렴)가 포함되며, 모든 irAE 카테고리 하의 환자들은 Any로 표시하였다(하기 표 3 및 4 참조).
Type of irAE Control irAE of interest irAE of non-interest Proportion
Pruritus 300 124 248 0.18
Skin rash/dermatitis/urticaria 300 89 283 0.13
Myalgia 300 72 300 0.11
Hypothyroidism 300 69 303 0.10
Fatigue/asthenia 300 62 310 0.09
Subclinical hypothyroidism 300 48 324 0.07
Pneumonitis 300 43 329 0.06
Hyperthyroidism 300 25 347 0.04
Hepatitis 300 23 349 0.03
Enterocolitis/diarrhea 300 22 350 0.03
Fever 300 16 356 0.02
Headache 300 15 357 0.02
Polyneuropathy/peripheral seonsory neuropathy 300 14 358 0.02
Anorexia 300 13 359 0.02
Arthralgia 300 12 360 0.02
Dry mouth 300 11 361 0.02
Adrenal insufficiency 300 11 361 0.02
Asymptomatic lipase elevation 300 10 362 0.01
Asymptomatic amylase elevation 300 10 362 0.01
Dizziness 300 10 362 0.01
Infusion-related reaction 300 10 362 0.01
Subclinical hyperthyroidism 300 9 363 0.01
Stomatitis 300 8 364 0.01
Nausea 300 8 364 0.01
Sweating 300 7 365 0.01
Muscle weakness 300 7 365 0.01
Creatine phosphokinase elevation 300 6 366 0.01
Hoarseness 300 6 366 0.01
Vomiting 300 5 367 0.01
Dysesthesia 300 5 367 0.01
Type I diabetes mellitus 300 5 367 0.01
Serum creatinine elevation 300 4 368 0.01
Skin hypopigmentation 300 3 369 0.00
Proteinuria 300 3 369 0.00
Lichen planus 300 3 369 0.00
Gastritis 300 3 369 0.00
Limb edema 300 3 369 0.00
Abdominal pain 300 3 369 0.00
Panhypopituitarism/hypophysitis 300 2 370 0.00
Uveitis 300 2 370 0.00
Sore throat 300 2 370 0.00
Pericarditis 300 2 370 0.00
Pancreatitis 300 2 370 0.00
Nephritis 300 2 370 0.00
Myositis 300 2 370 0.00
Insomnia 300 2 370 0.00
Hypertension 300 2 370 0.00
Facial edema 300 2 370 0.00
Dry eye 300 2 370 0.00
Conjunctivitis 300 2 370 0.00
Retinopathy 300 1 371 0.00
Blurred vision 300 1 371 0.00
Eye pain 300 1 371 0.00
Epiphora 300 1 371 0.00
Meningoencephalitis 300 1 370 0.00
Meningitis 300 1 370 0.00
Leukoencephalopathy 300 1 371 0.00
Cognitive dysfunction 300 1 371 0.00
Delirium 300 1 371 0.00
Trigeminal neuralgia 300 1 371 0.00
Myasthenia gravis 300 1 371 0.00
Myopathy 300 1 371 0.00
Myocarditis 300 1 371 0.00
Renal thrombotic microangiopathy 300 1 371 0.00
Hemolytic uremic syndrome 300 1 371 0.00
Pulmonary embolism 300 1 371 0.00
Hematuria 300 1 371 0.00
Tympanitis 300 1 371 0.00
Tinnitus 300 1 371 0.00
Tongue pain 300 1 371 0.00
Hyposmia 300 1 371 0.00
Bullous pemphigoid 300 1 371 0.00
Dry skin 300 1 371 0.00
Skin hyperpigmentation 300 1 371 0.00
Paronychia 300 1 371 0.00
Herpes zoster 300 1 371 0.00
Hand foot syndrome 300 1 371 0.00
Constipation 300 1 371 0.00
Interstitial fibrosis 300 1 371 0.00
Exacerbation of COPD 300 1 371 0.00
Thrombocytopenia 300 1 371 0.00
Neutropenia 300 1 371 0.00
Exacerbation of rheumatoid arthritis 300 1 371 0.00
Allergic rhinitis 300 1 371 0.00
Figure PCTKR2023001078-appb-img-000011
Figure PCTKR2023001078-appb-img-000012
Figure PCTKR2023001078-appb-img-000013
12개의 라벨링된 irAE 환자 그룹(irAE 그룹) 및 irAE가 없는 환자 그룹(대조군) 각각의 임상적 특성은 하기 표 4에 나타나있다.
out of 672 patients Type of irAE Ctrl
Any Critical Skin Thyroid
Number of patients (%) 372 (100%) 90 (23%) 156 (41%) 96 (25%) 300
Age, median (years) 63 62 62 60 64
Male (%) 275 (74%) 66 (73%) 120 (77%) 59 (61%) 215 (72%)
ECOG Performance status  
0-1 328 (89%) 75 (87%) 133 (86%) 85 (89%) 259 (87%)
≥2 41 (11%) 11 (13%) 21 (14%) 10 (11%) 40 (13%)
NSCLC (%) 134 (36%) 43 (48%) 54 (35%) 27 (28%) 123 (41%)
Prior treatment  
Cytotoxic chemotherapy 252 (68%) 49 (54%) 98 (63%) 45 (47%) 214 (71%)
Molecular targeted agent 72 (19%) 16 (18%) 28 (18%) 14 (15%) 57 (19%)
RT 73 (20%) 18 (20%) 28 (18%) 18 (19%) 90 (30%)
CRT 51 (13%) 9 (10%) 22 (14%) 10 (10%) 22 (7%)
Median of prior systemic therapy in the palliative setting (range) 1 (0-7) 1 (0-5) 1 (0-7) 1 (0-3) 1 (0-6)
Comorbidity  
HTN 125 (34%) 28 (31%) 57 (37%) 28 (29%) 101 (34%)
DM 63 (17%) 20 (22%) 28 (18%) 19 (20%) 51 (17%)
History of autoimmune disease 33 (9%) 9 (10%) 11 (7%) 13 (14%) 20 (7%)
anti-PD-1 ICB (%) 233 (61%) 58 (64%) 99 (63%) 57 (59%) 167 (56%)
out of 672 patients Type of irAE Ctrl
Endocrine Musculoskeletal Neurologic Pulmonary
Number of patients (%) 130 (34%) 90 (23%) 49 (13%) 43 (11%) 300
Age, median (years) 61 61 61 63 64
Male (%) 87 (67%) 65 (72%) 39 (80%) 33 (77%) 215 (72%)
ECOG Performance status  
0-1 118 (91%) 76 (84%) 43 (88%) 38 (93%) 259 (87%)
≥2 11 (9%) 14 (16%) 6 (12%) 3 (7%) 40 (13%)
NSCLC (%) 37 (28%) 34 (38%) 17 (35%) 27 (63%) 123 (41%)
Prior treatment  
Cytotoxic chemotherapy 69 (53%) 60 (67%) 29 (59%) 25 (58%) 214 (71%)
Molecular targeted agent 17 (13%) 15 (17%) 10 (20%) 6 (14%) 57 (19%)
RT 22 (17%) 10 (11%) 4 (8%) 10 (23%) 90 (30%)
CRT 16 (12%) 17 (19%) 9 (18%) 8 (19%) 22 (7%)
Median of prior systemic therapy in the palliative setting (range) 1 (0-3) 1 (0-5) 1 (0-4) 1 (0-5) 1 (0-6)
Comorbidity  
HTN 43 (33%) 34 (38%) 19 (39%) 13 (30%) 101 (34%)
DM 28 (22%) 11 (12%) 8 (16%) 9 (21%) 51 (17%)
History of autoimmune disease 16 (12%) 8 (9%) 4 (8%) 4 (9%) 20 (7%)
anti-PD-1 ICB (%) 76 (58%) 54 (60%) 30 (61%) 29 (67%) 167 (56%)
out of 672 patients Type of irAE Ctrl
Gastrointestinal Flu-like Multiple (any grade) Multiple (grade ≥2)
Number of patients (%) 78 (20%) 148 (38%) 155 (40%) 45 (12%) 300
Age, median (years) 63 62 62 62 64
Male (%) 61 (78%) 105 (71%) 117 (75%) 37 (82%) 215 (72%)
ECOG Performance status  
0-1 43 (88%) 132 (89%) 136 (89%) 35 (81%) 259 (87%)
≥2 6 (12%) 16 (11%) 16 (11%) 8 (19%) 40 (13%)
NSCLC (%) 27 (35%) 54 (36%) 52 (34%) 14 (31%) 123 (41%)
Prior treatment  
Cytotoxic chemotherapy 44 (56%) 95 (64%) 90 (58%) 24 (53%) 214 (71%)
Molecular targeted agent 13 (17%) 24 (16%) 28 (18%) 8 (18%) 57 (19%)
RT 11 (14%) 22 (15%) 21 (14%) 5 (11%) 90 (30%)
CRT 9 (12%) 20 (14%) 18 (12%) 6 (13%) 22 (7%)
Median of prior systemic therapy in the palliative setting (range) 1 (0-4) 1 (0-6) 1 (0-4) 1 (0-4) 1 (0-6)
Comorbidity  
HTN 28 (36%) 54 (36%) 57 (37%) 15 (33%) 101 (34%)
DM 14 (18%) 22 (15%) 32 (21%) 11 (24%) 51 (17%)
History of autoimmune disease 6 (8%) 12 (8%) 12 (8%) 2 (4%) 20 (7%)
anti-PD-1 ICB (%) 44 (56%) 86 (58%) 97 (63%) 28 (62%) 167 (56%)
상기 표 4에 따르면, 폐암은 가장 흔한 암 유형이었고, 환자들은 대부분 항 PD-1으로 치료받았다. 모든 irAE 그룹 간에 ECOG PS(eastern Cooperative Oncology Group performance status) 및 자가면역 질환 이력에는 유의한 차이가 없었다. 이 코호트에서 사용된 ICB 제제는 5종의 PD-1 항체(pembrolizumab: PEM, nivolumab: NIV, PDR001: PDR, INCMGA00012: INC, tislelizumab: TIS), 4종의 PD-L1 항체(atezolizumab: ATE, durvalumab: DUR, IMC-001: IMC, avelumab: AVE), PD-1 또는 PD-L1 항체와 병용하는 2종의 CTLA-4 항체(ipilimumab: IPI, tremelimumab: TRE), CTLA-4를 우선적으로 표적하는 PD-1 발현 T 세포(MEDI5752), STING 작용제(MK1454) 및 ILT4 항체(MK4830)에 대한 이중특이성 항체를 포함하였다.
하기 표 5에 따르면, 모든 사례의 55 %가 Any로 라벨링된 반면, 피부는 가장 빈번한 irAE 유형(23 %)이었고, 다중(모든 등급)(23 %) 및 독감 유사(22 %)가 그 뒤를 이었다(도 1a 참조).
Type of irAE Control irAE of interest irAE of non-interest Proportion
Any 300 372 0.55
Skin 300 156 229 0.23
Multiple (any grade) 300 155 230 0.23
Flu-like 300 148 237 0.22
Endocrine 300 130 255 0.19
Thyroid 300 96 289 0.14
Musculoskeletal 300 90 295 0.13
Critical 300 90 295 0.13
Gastrointestinal 300 78 307 0.12
Neurologic 300 49 336 0.07
Multiple (grade ≥2) 300 45 340 0.07
Pulmonary 300 43 342 0.06
또한, 도 1b에 나타난 바와 같이, 독감 유사 사례는 가장 빠른 발병(중간값=12일)을 보인 반면, 폐렴은 가장 늦은 발병(중간값=117일)을 보였고, 갑상선(중간값=91일)이 그 뒤를 이었다. 도 1b에서 각각의 수직 점선 및 숫자는 각 irAE 유형의 발병일 중앙값을 나타낸다. 네트워크 분석은 도 1c에 나타낸 바와 같이 갑상선과 내분비 사이, 피부, 독감 유사, 및 근골격 사이에 강한 동시 발생을 보여주었다.
이에 더하여, 유전, 분자, 및 세포의 irAE 위험 인자를 식별하기 위해 이 코호트에 대해 다차원 시퀀싱을 수행하였다. ICB 치료 전(PRE) 608명의 환자로부터 얻은 기준 전혈 샘플의 전체 엑솜 시퀀싱을 기반으로 생식계열 변이를 스크리닝 하였으며, 단일 염기 변이(SNV), 복제수 변이(CNV) 및 HLA 타이핑을 분석에 포함하였다. ICB 치료 전(PRE)과 치료 초기(EDT)에 263개의 일치하는 전혈 샘플에 대해 RNA 시퀀싱을 수행하여 irAE가 있거나 없는 환자 간 및 PRE와 EDT 간의 차별적인 분자 활성 및 면역 세포 프로파일을 조사하였다. 하기 표 6에는 임상적 인자에 따른 이용가능한 샘플 수를 나타내었으며, PRE 및 EDT 샘플 모두에 대해 CBC 테스트 및 생화학 분석을 수행하여 irAE 그룹과 no-irAE 그룹 간의 기준선 차이뿐만 아니라 ICB 처리에 의한 변화도 조사하였다(도 1a 참조).
Sex 672
Age 672
Cancer type 672
AID 672
HTN 672
DM 672
ECOG 668
cytotoxic agent 626
molecular target agent 625
RT 635
CCRT 635
PRE WBC 672 EDT WBC 631
PRE RBC 669 EDT RBC 630
PRE Hemoglobin 672 EDT Hemoglobin 629
PRE Hematocrit 672 EDT Hematocrit 631
PRE Platelet 672 EDT Platelet 631
PRE Lymphocyte 669 EDT Lymphocyte 630
PRE Neutrophil 669 EDT Neutrophil 630
PRE Monocyte 669 EDT Monocyte 630
PRE Eosinophil 660 EDT Eosinophil 630
PRE Basophil 665 EDT Basophil 630
PRE ANC 670 EDT ANC 612
PRE Abs Neutrophil 669 EDT Abs Neutrophil 629
PRE Abs Lymphocyte 669 EDT Abs Lymphocyte 629
PRE NLR 669 EDT NLR 629
PRE PLR 669 EDT PLR 629
PRE Calcium 655 EDT Calcium 620
PRE Phosphorus 424 EDT Phosphorus 411
PRE Glucose 644 EDT Glucose 613
PRE BUN 491 EDT BUN 466
PRE UA 595 EDT UA 571
PRE Cholesterol 346 EDT Cholesterol 315
PRE Protein 656 EDT Protein 611
PRE Albumin 665 EDT Albumin 625
PRE AST 671 EDT AST 630
PRE ALT 669 EDT ALT 628
PRE ALP 652 EDT ALP 616
PRE gGT 142 EDT gGT 123
PRE LDH 345 EDT LDH 331
PRE Bilirubin 668 EDT Bilirubin 629
PRE Amylase 148 EDT Amylase 189
PRE Lipase 134 EDT Lipase 176
PRE CRP 259 EDT CRP 246
PRE Sodium 540 EDT Sodium 529
PRE Potassium 541 EDT Potassium 530
PRE Chloride 538 EDT Chloride 528
PRE Creatinine 668 EDT Creatinine 630
실험예 2. PRE 및 EDT irAE 샘플 모두에서 호중구 기능 감소 확인
연령과 성별을 공변량으로 포함하는 일반화된 선형 모델을 사용하여 irAE 발생과 CBC 또는 생화학적 측정 사이의 연관성을 조사하였다. 그 결과, 도 2a에 나타낸 바와 같이 PRE 및 EDT 샘플 모두의 호중구 수, 림프구 수 및 호중구 대 림프구 비율(NLR)은 모두 Critical을 제외한 대부분의 irAE 라벨에서 irAE 발생과 연관이 있었다.
구체적으로, 모든 irAE 위험은 유의적으로 낮은 호중구 수(PRE: 오즈비(odds ratio), 95 % CI=0.69(0.63-0.75), P=7.7e-06; EDT: 오즈비, 95 % CI=0.73(0.67-0.80), P=0.0002) 및 NLR(PRE: 오즈비, 95 % CI=0.65(0.59-0.72), P=2.36e-05, EDT: 오즈비, 95 % CI=0.70(0.62-0.80), P=0.004) 뿐만 아니라 더 높은 림프구 수(PRE: 오즈비, 95 % CI=1.52(1.40-1.65), P=4e-07, EDT: 오즈비, 95 % CI=1.40(1.29-1.53), P=6.37e-05)와 관련이 있었다. irAE의 낮은 기준선 NLR은 이전 보고와 일치한다(Matsukane, R et al., Sci. Rep. 11, 1324.; Michailidou, D et al., Sci. Rep. 11, 9029; Pavan, A et al., Oncologist 24, 1128-1136).
또한, PRE 및 EDT 샘플 모두의 백혈구(WBC) 및 적혈구(RBC) 수치도 많은 irAE 라벨과 관련이 있었다. 그러나, irAE의 발생은 오직 PRE 샘플의 혈소판 수, PLR, 단백질 수준, 알부민 수준, 및 ALP(alkaline phosphatase) 농도와 관련이 있었다. 대조적으로, 칼슘 수준 및 ALT(alanine aminotransferase) 농도와 irAE의 연관성은 EDT 샘플에서만 관찰되었다.
RNA 시퀀싱 데이터의 추론을 기반으로 호중구 세포 분율을 측정한 결과, 도 2b에 나타낸 바와 같이 CBC 호중구 값과 추정된 호중구 분율 사이에는 강한 상관관계가 있었다. 마찬가지로, 호중구 마커 유전자의 발현 수준은 도 2c에 나타낸 바와 같이 PRE 및 EDT 샘플 모두에서 대조군보다 irAE 그룹에서 유의하게 낮았다.
그런 다음 세포 수를 넘어 분자 수준에서 irAE 관련 수차를 특성화하였다. 이를 위해 irAE 샘플에서 더 높거나 더 낮은 발현을 가진 유전자를 확인하였다. 그 결과, 도 2d에 나타낸 바와 같이 특히 차등 유전자 발현은 대부분 irAE 그룹에서 저발현이 특징으로 나타났으며, 이는 PRE 샘플보다 EDT 샘플에서 더 잘 나타났다. 경로 풍부도 분석은 도 2e에 나타낸 바와 같이 irAE 관련 유전자 억제가 PRE 및 EDT 샘플 모두에서 호중구 매개 면역뿐만 아니라 호중구 활성화 및 탈과립에서 발생했음을 보여주었다. 그러나, 경로 풍부도 정도는 EDT 샘플에서 확인된 유전자의 경우 훨씬 더 컸다. 12개의 irAE 그룹 각각에 대하여 확인했을 때, 도 2f에 나타낸 바와 같이 12개의 irAE 그룹 각각과 대조군 사이의 비교로부터 저발현된 유전자가 확인되었을 때 유사한 패턴이 관찰되었다.
실험예 3. irAE가 있는 환자와 irAE가 없는 환자 간의 차등적 치료 유전자 활성화 확인
일치하는 PRE 및 EDT 샘플을 비교하여 유전자 발현 프로그램이 irAE와 대조군 사이에서 ICB 치료에 어떻게 다르게 반응하는지 이해하고자 하였다. irAE가 있는 환자의 경우, ICB 치료 시 유의미하게 상향 조절된 유전자에는 세포용해 활동(IFNG, GZMH, GZMA) 및 NK 세포 활성화(CD160, NKG7)를 담당하는 유전자가 포함되었다(Chen, I.X et al., Proc Natl Acad Sci USA. 2020 Sep 22;117(38):23684-23694.). 또한 조절 T 림프구의 기능을 촉진할 수 있는 IDO1과 같은 면역억제 유전자도 포함되었다(Hornyak, L et al., Front. Immunol. 9, 151.). 이는 ICB 치료 후 항종양 면역 활성화에 의해 작용하는 항상성 제어 메커니즘을 반영할 수 있다.
도 3a에 나타낸 바와 같이 ANKRD22는 대조군의 EDT 샘플에서 유의적으로 상향 조절된 유전자 중 하나였다. 그 기능이 잘 확립되어 있지는 않지만, 말초 혈액에서 유전자의 유도가 바이러스 감염에 대한 숙주 방어에서 관찰되었다(Bin, L et al., J Immunol (2016) 196 (1_Supplement): 201.4.). 본 발명에서는 도 3b에 나타낸 바와 같이 ANKRD22가 호중구에서 특이적으로 발현된다는 것을 발견하였다.
경로 풍부도 분석은 도 3c에 나타낸 바와 같이 irAE 및 대조군 모두에서 사이토카인 매개 신호 및 종양 괴사 인자 및 IFN-γ에 대한 세포 반응과 같은 면역 활성화를 위해 주로 EDT 상향 조절을 나타내었다. 이러한 경로 외에도 대조군의 EDT 샘플은 호중구 관련 기능의 활성화를 보여주었다. irAE 또는 대조군에서만 독점적으로 활성화되는 유전자에 대한 경로 풍부도를 추가로 조사하였으며 사이토카인 매개 신호 및 세포 반응에 관여하는 유전자는 제외하였다. 그 결과, 도 3d에 나타낸 바와 같이 irAE와 대조군에서 각각 NK 세포 관련 유전자 발현 프로그램과 호중구 관련 유전자 발현 프로그램이 특이적으로 활성화됨을 확인하였다. 예를 들어, 도 3e에 나타낸 바와 같이 호중구 활성과 관련된 유전자, 즉 CLEC4D 및 CAMP는 대조군에서만 치료 시 활성화되었다. 반대로, CD160 및 KLRC1과 같은 NK 세포 활성과 관련된 일부 유전자는 특히 irAE 환자에서 치료에 대한 반응으로 상향 조절되었다.
실험예 4. 전체 irAE 위험과 관련된 HLA-B 대립유전자 및 복제수 변이 확인
연령, 성별, 및 약물 유형을 공변량으로 사용하여 다변량 로지스틱 회귀를 수행하여 19,880 엑손 간격 단위의 복제수와 12가지 주요 유형의 irAE 발생 사이의 연관성을 평가하였다. 유의하게 관련된 엑손 간격(P < 0.01)을 하기 표 7에 나타내었다. 특히, 클래스 I 및 II HLA 유전자의 복제수 변이(CNV)는 여러 irAE 유형과 유의미하게 연관되는 것으로 밝혀졌다.
Type of irAE CNV ID P-value gene
Any chr6:31324462-31324741 0.001 HLA-B wholegene
HLA-B exon2
Any chr7:100634945-100635138 0.002 MUC12 exon2
Any chr2:87420635-87420975 0.002 ANAPC1 exon8
Any chr8:54793570-54793940 0.003 RGS20 wholegene
Any chr1:152586094-152586493 0.004 LCE3B wholegene
Any chr22:40081915-40082662 0.005 CACNA1I exon36
CACNA1I exon37
Any chr1:35370310-35370516 0.007 DLGAP3 exon1
Any chr17:77812551-77812932 0.007 CBX4 exon2
Any chr4:69342831-69343615 0.008 TMPRSS11E exon8
Any chr1:152573024-152573644 0.008 LCE3C wholegene
Any chr4:15005553-15006221 0.01 CPEB2 exon1
Any chr6:27834340-27834967 0.01 HIST1H1B exon1
Critical chr15:22413530-22413968 0 OR4N3P wholegene
Critical chr15:22382207-22382691 0 OR4N4 wholegene
LOC727924 wholegene
Critical chr15:22368319-22368667 0.001 OR4M2 wholegene
Critical chr2:87420635-87420975 0.002 ANAPC1 exon8
Critical chr22:25436575-25437791 0.005 KIAA1671 exon3
Critical chr1:151337334-151337904 0.006 SELENBP1 exon10
SELENBP1 exon8
SELENBP1 exon9
Critical chr1:151371721-151372092 0.006 PSMB4 wholegene
Critical chr1:151377013-151377600 0.006 POGZ exon13
POGZ exon17
POGZ exon19
POGZ exon18
Critical chr6:32489367-32489781 0.007 HLA-DRB5 exon2
Endocrine chr5:177168045-177168772 0.001 FAM153A exon6
FAM153A exon8
Endocrine chr1:151337334-151337904 0.006 SELENBP1 exon10
SELENBP1 exon8
SELENBP1 exon9
Endocrine chr1:151371721-151372092 0.006 PSMB4 wholegene
Endocrine chr1:151377013-151377600 0.006 POGZ exon13
POGZ exon17
POGZ exon19
POGZ exon18
Endocrine chr1:152586094-152586493 0.006 LCE3B wholegene
Endocrine chr7:72430225-72430632 0.006 NSUN5P2 exon4
TRIM74 exon4
Endocrine chr1:152573024-152573644 0.009 LCE3C wholegene
Flu-like chr6:31324250-31324461 0.004 HLA-B exon1
Flu-like chr7:5942016-5942639 0.007 CCZ1 exon6
Flu-like chr2:87420635-87420975 0.009 ANAPC1 exon8
Flu-like chr2:98161877-98162528 0.01 ANKRD36B exon23
Flu-like chr3:195390807-195391406 0.01 SDHAP2 wholegene
Gastrointestinal chr7:100634945-100635138 0.001 MUC12 exon2
Gastrointestinal chr19:52149405-52149816 0.008 SIGLEC14 exon2
Gastrointestinal chr1:17087460-17087845 0.008 MST1L exon2
Gastrointestinal chr5:96248068-96248741 0.01 ERAP2 exon16
ERAP2 exon15
Musculoskeletal chr21:15013512-15014139 0.002 POTED exon11
Musculoskeletal chr2:87420635-87420975 0.005 ANAPC1 exon8
Musculoskeletal chr7:144015382-144015845 0.006 OR2A1 exon1
Musculoskeletal chr17:66265434-66265784 0.007 SLC16A6 exon7
SLC16A6 exon6
Musculoskeletal chr17:58078320-58078802 0.009 TBC1D3P1-DHX40P1 exon6
Multiple (grade ≥2) chr5:70307899-70309043 0.006 NAIP wholegene
Multiple (grade ≥2) chr14:74003851-74004198 0.006 ACOT1 wholegene
Multiple (grade ≥2) chr14:106207878-106208450 0.007 IGHG1 exon4
Multiple (grade ≥2) chr19:54804071-54804408 0.01 LILRA3 wholegene
LILRA6 wholegene
Neurologic chr7:100635139-100635510 0.001 MUC12 exon2
Neurologic chr6:29910896-29911491 0.001 HLA-A wholegene
Neurologic chr6:29910586-29910895 0.001 AK309533 exon1
HLA-A exon2
HLA-A exon1
Neurologic chr19:44932636-44933058 0.002 ZNF229 exon6
Neurologic chr7:6825302-6825643 0.003 RSPH10B2 exon16
Neurologic chr7:6825302-6825643 0.003 RSPH10B2 exon15
Neurologic chr7:6825302-6825643 0.003 RSPH10B2 exon9
Neurologic chr21:15013512-15014139 0.003 POTED exon11
Neurologic chr14:45599029-45599398 0.004 FKBP3 exon3
Thyroid chr1:151337334-151337904 0.002 SELENBP1 exon10
SELENBP1 exon8
SELENBP1 exon9
Thyroid chr1:151371721-151372092 0.002 PSMB4 wholegene
Thyroid chr1:151377013-151377600 0.002 POGZ exon13
POGZ exon17
POGZ exon19
POGZ exon18
Thyroid chr5:177168045-177168772 0.003 FAM153A exon6
FAM153A exon8
Thyroid chr1:152586494-152586889 0.006 LCE3B exon1
Thyroid chr16:55853240-55853860 0.006 CES1 exon7
Thyroid chr7:72430225-72430632 0.007 NSUN5P2 exon4
TRIM74 exon4
Thyroid chr2:87423360-87423997 0.008 ANAPC1 exon9
Thyroid chr10:47416560-47417156 0.008 FAM35DP exon5
Multiple (any grade) chr6:31324462-31324741 0.004 HLA-B wholegene
HLA-B exon1
Multiple (any grade) chr6:32634035-32634738 0.006 HLA-DQB1 wholegene
Multiple (any grade) chr7:100634945-100635138 0.006 MUC12 exon2
Multiple (any grade) chr6:32628984-32629519 0.008 HLA-DQB1 exon3
HLA-DQB1 exon4
Multiple (any grade) chr6:32005948-32006709 0.008 CYP21A2 wholegene
Multiple (any grade) chr2:87420635-87420975 0.01 ANAPC1 exon8
Multiple (any grade) chr9:135946828-135947422 0.01 CEL exon11
Skin chr1:40240339-40240976 0.003 BMP8B exon2
Skin chr7:144015382-144015845 0.006 OR2A1 exon1
Skin chr7:6012757-6013101 0.008 PMS2 exon12
PMS2 exon14
PMS2 exon15
PMS2 exon11
Skin chr4:69341748-69342476 0.009 TMPRSS11E exon7
Pulmonary chr8:7320000-7320652 0.006 SPAG11B exon2
항원 결합 특이성을 결정하는 α1-도메인을 암호화하는 HLA-B 엑손 2(chr6:31324462-31324741)의 CNV에 대해 Any(오즈비, 95 % CI=0.72(0.59-0.87), P=0.001)와의 가장 유의한 연관성이 나타났다. irAE 위험과의 연관성을 평가하기 위해 모든 샘플을 CNV 상태(즉, 결실, 정상 배수성 및 복제)에 따라 세 그룹으로 나누었으며, 도 4a에 나타난 바와 같이 세 그룹은 irAE와 대조군 사이에 차등적으로 분포되었다. 특히, 도 4b에 나타난 바와 같이 HLA-B 엑손 2 결실 환자는 irAE 발생까지의 시간이 유의적으로 짧았다(P=0.002, Cox 비례 위험 모델). 또한, 도 4c에 나타난 바와 같이 평균 복제수는 irAE가 없는 환자보다 irAE가 있는 환자에서 유의하게 낮았다(P=0.01).
한편, 이전 연구에서는 다양한 자가면역 질환이 특정 HLA 대립유전자와 관련이 있음을 보여주었다(Ahn, S et al., Immune Netw. 2011 Dec; 11(6): 324-335.). 따라서, 클래스 I 및 II HLA 타이핑을 수행하여 다변량 로지스틱 회귀를 사용하여 HLA 대립 유전자 및 12개의 irAE 라벨 사이의 연관성을 평가하였으며, 코호트 내에서 대립 유전자 빈도가 3 %보다 높은 HLA 대립 유전자를 후속 분석에 사용하였다.
연관성 평가 결과, HLA-B의 특정 대립 유전자와 특정 HLA 클래스 II 유전자가 다양한 irAE의 병인과 연관되어 있음을 발견하였다. 특히, 도 4d 및 4e에 나타난 바와 같이 HLA-B*35:01은 신경계(P=0.27) 및 피부(P=0.25)를 제외한 대부분의 irAE 라벨에 대해 유의한 연관성(다변량 로지스틱 회귀 P < 0.05)을 보여주었다.
도 4f에 나타난 바와 같이 HLA-B*35:01은 모든 irAE 유형의 발생률을 증가시킨 반면, Critical(카이 제곱 테스트 P=0.0002, non-carrier: 21 % vs. carrier: 50 %) 및 Multiple G>=2(카이 제곱 테스트 P=0.0006, non-carrier: 12 % vs. carrier: 37 %)에서 가장 현저한 증가가 나타났다. HLA-B*35:01 외에도 HLA-B*40:02는 여러 irAE 유형의 위험을 증가시켰고, HLA-B*54:01은 irAE 발생률을 감소시켰다(도 4d 및 4e 참조).
HLA-B의 대립유전자 또는 복제수 변이가 전반적인 irAE 위험과 관련이 있는 반면, 다른 변이는 특정 irAE 라벨과 특이적 상관관계를 나타내었다. 예를 들어, HLA-A 중복은 특히 신경계와 관련이 있었다. 클래스 II HLA 유전자의 경우 HLA-DQB1 결손은 Multiple G>=1과 관련이 있는 반면, HLA-DRB5 중복은 Critical의 위험을 증가시키는 것으로 나타났다. HLA 유전자 외에, ANAPC1의 CNV는 여러 라벨(Any, Critical, Flu-like, Musculoskeletal, Thyroid 및 Multiple G>=1)과의 연관성을 보여주었다(표 7 참조). ANAPC1 단백질은 세포 주기, 유사분열, 클래스 I MHC 매개 항원 처리 및 제시를 포함한 다양한 생물학적 경로에 속한다. 또한, 이 단백질은 면역 회피 및 면역 요법 반응의 10가지 예측 바이오마커 중 하나로 정의되었다(Bou-Dargham, M.J et al., BMC Cancer 20, 572.). Any, 내분비계, 및 갑상선 유형 irAE의 위험을 증가시키는 것으로 밝혀진 LCE3B 및 LCE3C의 결실은 이전에 건선과 관련이 있는 것으로 보고되었으며(Coto, E et al., BMC Med. Genet. 11, 45.), CYP21A2 복제수의 변이는 Multiple G>=1의 발생과 상당한 연관성을 보여주었다. 자가면역 질환 감수성과 관련하여 유전자의 복제수 및 유전형 변이가 보고되었다(Chen, I.X et al., Proc Natl Acad Sci USA. 2020 Sep 22;117(38):23684-23694.).
실험예 5. irAE 유형별 예측을 위한 생식계열 SNV의 통합 모델링
면역 세포 분율 및 HLA-B 변이와 같은 일반적인 위험 인자와 함께 irAE의 병리학적 다양성을 형성하는 데 있어 SNV의 보다 상세한 역할을 가정하였다. 다양한 irAE에 대한 유전적 소인을 찾기 위해, 주요 irAE 라벨 및 관련 증상에 대한 예측인자로서 연령, 성별 및 약물 유형과 함께 119,688개의 non-synonymous SNV를 사용하여 다변량 로지스틱 회귀를 수행하였다. 그런 다음, 12,934개의 공통 SNV와의 연관성을 기반으로 29개의 irAE 변수에 대해 k 값이 4인 K-평균 클러스터링을 수행하여 유사한 유전적 구성 요소를 공유하는 서로 다른 irAE의 관계를 관찰하여 도 5a에 나타내었다. 주요 irAE 라벨과 관련된 항목은 굵게 강조 표시되었으며, 셀의 색상 척도는 Pearson의 상관 계수에 비례한다.
다음으로, 실험실 데이터(도 2a 참조), CNV(표 7 참조), 및 HLA 유형(도 4d 참조)과 함께 SNV를 입력 기능으로 사용하여 각 12개의 주요 irAE 라벨에 대한 통합 예측 모델을 트레이닝하는 딥 러닝 프레임워크를 구성하였다. 총 859개의 특징을 사용하여 12개의 irAE 예측 모델을 트레이닝 하였다. 이러한 859개의 특징을 기반으로 다양한 irAE 유형 간의 관계를 조사하였다(표 8 참조).
Figure PCTKR2023001078-appb-img-000014
Figure PCTKR2023001078-appb-img-000015
Figure PCTKR2023001078-appb-img-000016
Figure PCTKR2023001078-appb-img-000017
Figure PCTKR2023001078-appb-img-000018
Figure PCTKR2023001078-appb-img-000019
Figure PCTKR2023001078-appb-img-000020
Figure PCTKR2023001078-appb-img-000021
Figure PCTKR2023001078-appb-img-000022
Figure PCTKR2023001078-appb-img-000023
Figure PCTKR2023001078-appb-img-000024
Figure PCTKR2023001078-appb-img-000025
Figure PCTKR2023001078-appb-img-000026
Figure PCTKR2023001078-appb-img-000027
Figure PCTKR2023001078-appb-img-000028
그 결과, 도 5b에 나타낸 바와 같이 대부분의 SNV 기능은 실험실 데이터(예: NLR) 및 HLA-B 변이(예: HLA-B*35:01 및 chr6:31324462-31324741 CNV)와 달리 특정 irAE 유형과 특히 관련이 있었다. 각 유형의 irAE 사례 수가 대조군 샘플보다 상당히 적었기 때문에, 모델 성능을 평가하기 위해 도 5c와 같이 평균 정밀도(즉, irAE 발생의 정확한 예측률)를 사용하였다. 모델 트레이닝에 포함되지 않은 샘플을 사용한 검증을 위해, 비-관심 irAE를 거짓 세트로 사용하여 관심 irAE 예측을 수행하였다. 검증 성능은 수신기 작동 특성 분석의 정확도 및 곡선 아래 영역(AUC)으로 측정되었다.
각 irAE 유형에 영향을 미치는 중요한 SNV를 식별하기 위해, Shapley 값(Shapley, 1951)을 사용하여 모델 예측에 대한 각 기능의 평균 효과를 계산하고 각 모델에 대해 가장 중요한 10개의 SNV를 하기 표 9에 나열하였으며 Any에 대한 SNV 및 CNV의 Shapley 값을 도 5d에 나타내었다. 도 5d에서 빨간색과 파란색 가로 점선은 각각 0.005와 0.05의 P 값을 나타내고, 주황색과 파란색 점은 각각 P<0.005인 SNV와 CNV를 나타낸다. 빨간색 점은 예측 모델에서 Shapley 값이 가장 높은 상위 10개 SNP를 나타낸다. P 값은 연령과 성별을 공변량으로 사용하여 다변량 로지스틱 회귀 분석으로 계산되었다.
Figure PCTKR2023001078-appb-img-000029
Figure PCTKR2023001078-appb-img-000030
Figure PCTKR2023001078-appb-img-000031
Figure PCTKR2023001078-appb-img-000032
Figure PCTKR2023001078-appb-img-000033
특히, 이 목록은 면역계와 관련된 유전자에 의해 많이 기술되었다. 예를 들어, DOPEY2는 ICB 반응자의 CD8+ T 세포에서 차별적으로 발현되며(Chen, I.X et al., Proc Natl Acad Sci USA. 2020 Sep 22;117(38):23684-23694.), MRPL23은 방광암에서 ICB 치료 후 예후를 예측하는 lncRNA 관련 시그니처의 구성 요소이다(Wu, Y et al., Aging (Albany. NY). 12, 23306-23325.). 일부 유전자는 자가면역질환과 관련이 있었다. 예를 들어, MANBA는 궤양성 대장염과 관련이 있는 것으로 보고(Jostins, L et al., Nature 491, 119-124.)된 반면 PMFBP1(Ibanez-Cabellos, J.S et al., Front. Genet. 10, 1104.) 및 TTC40(Ham, S et al., Exp. Mol. Med. 51, 1-13.)은 류마티스 관절염과 관련이 있었다. 또 다른 중요한 유전자인 AFMID는 면역조절 회로에 포함되는 것으로 보고되었다(Proietti, E et al., Trends Immunol. 41, 1037-1050.).
마지막으로 Any의 가장 중요한 특징은 TMEM162(FAM187B 또는 FLJ25660이라고도 함)에 있다. 이에, 본 발명에서는 TMEM162 유전자의 변이와 irAE의 연관성을 다음 실험예에서 확인하였다.
실험예 6. irAE의 위험 인자로서 TMEM162의 넌센스 돌연변이 확인
대립 유전자 T로 변이가 일어나 TMEM162 단백질의 절단을 일으키는 rs541169(chr19:35719020 C>T)에 중점을 두고 실험을 진행하였다. 이 돌연변이는 irAE가 있는 환자 및 Any 예측 모델에 대해 가장 큰 Shapley 특징 값을 가진 상위 10개 변이 중 하나에서 가장 유의적으로 나타났다(도 5d 참조). 도 6a에 나타낸 바와 같이 본 발명의 코호트 내에서 나타난 대립 유전자 빈도(DAF)는 0.14로, 1,094개의 한국인 게놈에서 얻은 DAF 0.17과 유사하였다. 또한, ICB 투여 후 추적 기간을 사용한 연속 발생률 분석 결과, 도 6b에 나타낸 바와 같이 돌연변이를 보유한 환자의 경우 irAE 발생까지의 시간이 유의적으로 더 짧다는 것을 보여주었다. rs541169 유전자형의 빈도 스펙트럼은 도 6c에 나타낸 바와 같이 irAE 상태에 따라 대립 유전자(즉, C/C, C/T 및 T/T)의 복제수에 따라 증가하는 irAE 사례의 분율(아래 막대그래프)과 함께 유의적으로 차이가 있었다. 상기 결과는 도 6d에 나타낸 바와 같이 환자를 돌연변이 보유군과 비-보유군의 두 그룹으로 분류했을 때와 유사하게 나타났다.
이 면역글로불린 수퍼패밀리 단백질의 기능이 잘 확립되지는 않았지만, 최근의 조직적인 세포 표면 상호작용 스크린이 TMEM162(FAM187B)와 BTN2A1의 상호작용을 결정하고 추가로 검증하였다(Verschueren, E et al., Cell 182, 329-344.e19.). 부티로필린(butyrophilin, BTN) 단백질 계열은 림프구 활성화를 담당하며 여러 연구는 자가면역 질환에서 일부 BTN 계열 구성원의 역할을 제안한다(Afrache, H et al., Immunogenetics 64, 781-794.). 면역 체크포인트로서의 BTN2A1의 역할은 최근에 발견되었다. 본 발명에서는 도 6e 및 6f에 나타낸 바와 같이 TMEM162가 림프절과 비장에서 특이적으로 발현되고 BTN2A1도 비장에서 높게 발현됨을 발견하였다.
이러한 결과를 바탕으로, rs541169의 넌센스 변이가 면역 세포 조성에 영향을 미칠 수 있는지 여부를 조사하였다. CBC 데이터는 제한된 세포 유형을 서포트하기 때문에 24가지 면역 세포 유형에 대한 전혈 RNA 시퀀싱 데이터에서 세포 분율 추론을 수행하였다. 면역 세포 유형 점수는 돌연변이(넌센스 변이 보유) 및 야생형(비-보유) 그룹 간에 비교되었다. 그 결과, 도 6g에 나타낸 바와 같이 B 림프구 점수가 PRE 및 EDT 샘플 모두에 대해 돌연변이 그룹에서 유의하게 더 높다는 것을 발견하였다. 또한 고갈된 T(Tex) 세포 및 조절 T(Treg) 세포에 대한 점수는 돌연변이 중에서 EDT 샘플에서만 유의하게 낮았고, PRE 샘플에서는 그렇지 않았으며, 이는 ICB 요법에 대한 반응에서 차등 T 세포 조절을 암시한다. 실제로, PRE-EDT 비교 결과 도 6h에 나타낸 바와 같이 돌연변이에서만 Treg 세포의 현저한 치료 중 감소를 나타냈으며, 따라서 억제된 Treg 활성이 변이 보유군 중에서 더 높은 irAE 위험의 원인이 될 수 있음을 암시한다. 반대로, 도 6i에 나타낸 바와 같이 변이 비-보유군만이 Tex 세포에서 현저한 증가를 보였다. 따라서, 제한된 T 세포 고갈은 돌연변이 보유군에서 irAE를 발생시키는 또 다른 인자가 될 수 있음을 확인하였다.
변이가 종양 면역 환경에 미치는 영향을 조사하기 위해, 다양한 면역 시그니처 점수를 사용하여 TCGA 팬암 샘플에 대해 유사한 분석을 수행하여 도 6j에 나타내었다(Thorsson, V et al., Immunity 48, 812-830.e14.). 구체적으로, 면역 시그니처 점수는 면역 클러스터로 그룹화된 돌연변이 샘플과 야생형 샘플 사이에서 비교되어 Mann-Whitney U 테스트에서 P 값을 얻었다. 도 6j에서 빨간색 및 파란색은 P<0.05를 표시하는 *와 함께 각각 야생형 샘플보다 돌연변이체에서 더 높고 더 낮은 면역 시그니처를 나타낸다. 하나 이상의 면역 클러스터에서 P<0.05인 면역 시그니처를 왼쪽에 확대하여 표시하였다. C1 내지 C6은 각각 다음을 의미한다: C1, 상처 치유; C2, IFN-γ 우성; C3, 염증성; C4, 고갈된 림프구; C5, 면역학적 침묵; C6, TGF-β 우성.
그 결과, 도 6j에 나타낸 바와 같이 돌연변이 샘플과 야생형 샘플을 가장 잘 구별하는 Treg 및 B 세포에서 유사한 패턴이 관찰되었다. 코호트 분석에 따라, TMEM162 돌연변이는 Treg 침투를 감소시키고 B 세포 침투를 증가시켰다. 보다 구체적으로, 돌연변이는 C2(IFN-γ 우성) 및 C3(염증성) 종양에서 유의적으로 적은 Treg 세포를 나타내었다(도 6j 참조). 이는 ICB 치료 후에만 관찰되는 코호트에서 감소된 Treg 활성과 일치한다(도 6h 참조). 한편, 돌연변이는 대부분의 면역 클러스터에서 B 세포를 증가시켰지만 C5(면역 침묵형) 및 C6(TGF-β 우성) 종양에서 가장 현저하게 증가하였다(도 6j 참조).
non-synonymous 변이에 기초한 크론병에 대한 게놈 차원의 연관성 연구는 rs541169를 확인하였다(Hampe, J et al., Nat. Genet. 39, 207-211.). 증가하는 증거는 자가면역 질환 변이가 감염에 대한 보호에 기여한 덕분에 자연 선택의 대상이 된다는 것을 보여준다(Ramos, P.S et al., J. Hum. Genet. 60, 657.). 예를 들어, 박테리아 방어 및 자가면역 제어에서 반대 대립 유전자의 균형 기능을 반영하는 균형 선택 시그니처가 염증성 장 질환 유전자좌에서 검출되었다(Jostins, L et al., Nature 491, 119-124.). rs541169 변이는 상당한 수준의 인구 분화를 고려할 때 선택에서 가장 두드러진 기능 상실 변이 8개 중 하나로 확인되었으며(Rausell, A et al., Proc. Natl. Acad. Sci. 117 (24) 13626-13636), 이는 한국 인구를 포함한 본 발명의 데이터에서도 관찰되었다(도 6a 참조).
1,094개의 한국 전체 게놈 서열(Jeon, S et al., Sci. Adv. 6, eaaz7835.)을 사용하여 rs541169를 둘러싼 염색체 영역에 걸쳐 HKA 테스트(Hudson, R.R et al., Genetics 116, 153-159.)를 수행하여 도 6k에 나타내었다. 도 6k에서 회색 수평 파선은 균형 선택을 서포트하는 임계값으로 HKA 값 1을 나타낸다. 노란색 세로 실선과 녹색 음영은 각각 rs541169와 TMEM162의 위치를 표시한 것이다. HKA 테스트 결과, 도 6k에 나타낸 바와 같이 변이에 대해 HKA k>1(P=0.0027)을 얻었으며, 이는 한국인 인구에서 작용하는 균형 선택을 나타낸다. 다양한 인구에 대해 반복될 때 HKA 테스트 결과, 도 6l에 나타낸 바와 같이 모든 조사된 인구에서 HKA k>1이었으며, 이는 이 유전자좌가 널리 퍼진 균형 선택 하에 있음을 시사한다. 도 6l에서 파란색 가로 점선은 균형 선택을 서포트하는 임계값인 HKA 값 1을 나타낸다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야 한다.
본 발명에 따른 rs541169는 면역항암제 유도 면역관련 이상반응의 발병 예측 또는 면역항암제에 대한 반응성 예측을 위한 바이오마커로서 유용하게 이용될 수 있을 것으로 기대되는 바, 산업상 이용가능성이 있다.

Claims (14)

  1. dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제를 포함하는, 면역항암제 유도 면역관련 이상반응 발병 예측용 조성물.
  2. 제1항에 있어서,
    상기 검출 제제는 dbSNP 데이터베이스 rs541169의 염기가 T인 변이를 검출하는 것을 특징으로 하는, 조성물.
  3. 제1항에 있어서,
    상기 rs541169의 SNP는 TMEM162 단백질의 절단을 일으키는 것을 특징으로 하는, 조성물.
  4. 제1항에 있어서,
    상기 검출 제제는 rs541169 SNP를 검출할 수 있는 프라이머 또는 프로브인 것을 특징으로 하는, 조성물.
  5. 제1항에 있어서,
    상기 면역관련 이상반응은 면역항암제에 의해 나타나는 피부(skin) 이상반응, 내분비계(endocrine system) 이상반응, 갑상선(thyroid gland) 이상반응, 근골격계(musculoskeletal system) 이상반응, 위장계(gastrointestinal system) 이상반응, 신경계(neurologic system) 이상반응, 독감 유사 증상(Flu-like), 및 폐렴(pulmonary)으로 이루어진 군으로부터 선택된 하나 이상인 것을 특징으로 하는, 조성물.
  6. 제1항에 있어서,
    상기 조성물은 하기 표에 기재된 dbSNP 데이터베이스의 SNP 중 하나 이상의 SNP 검출 제제를 추가로 포함하는 것을 특징으로 하는, 조성물.
    Figure PCTKR2023001078-appb-img-000034
    Figure PCTKR2023001078-appb-img-000035
    Figure PCTKR2023001078-appb-img-000036
    Figure PCTKR2023001078-appb-img-000037
    Figure PCTKR2023001078-appb-img-000038
  7. 제1항 내지 제6항 중 어느 한 항의 조성물을 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측용 키트.
  8. 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 정보제공방법.
  9. 제8항에 있어서,
    상기 방법은 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 염기가 T인 변이가 검출될 경우, 면역항암제 유도 면역관련 이상반응의 발병 위험이 높을 것으로 예측하는 단계를 더 포함하는 것을 특징으로 하는, 정보제공방법.
  10. 제8항에 있어서,
    상기 방법은 피검체로부터 분리된 생물학적 시료에서 B세포, 조절 T 세포(regulatory T cell), 및 고갈된 T 세포(exhausted T cell)로 이루어진 군으로부터 선택된 하나 이상의 활성을 측정하는 단계; 및
    상기 B 세포 활성이 상대적으로 높을 경우, 또는 조절 T 세포 또는 고갈된 T 세포 활성이 상대적으로 낮을 경우 면역항암제 유도 면역관련 이상반응의 발병 위험이 높을 것으로 예측하는 단계를 더 포함하는 것을 특징으로 하는, 정보제공방법.
  11. 제8항에 있어서,
    상기 생물학적 시료는 피검체로부터 분리된 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액, 소변, 및 대변으로 이루어진 군으로부터 선택되는 하나 이상인 것을 특징으로 하는, 정보제공방법.
  12. 피검체에서 분리된 생물학적 시료에서, dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)을 검출하는 단계를 포함하는, 면역항암제에 대한 반응성 예측을 위한 정보제공방법.
  13. dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제 또는 이를 포함하는 조성물의, 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 제제의 제조를 위한 용도.
  14. dbSNP 데이터베이스 rs541169의 단일염기다형성(SNP)의 검출 제제 또는 이를 포함하는 조성물의, 면역항암제에 대한 반응성 예측을 위한 제제의 제조를 위한 용도.
PCT/KR2023/001078 2022-01-20 2023-01-20 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 snp 기반 모델 WO2023140713A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20220008320 2022-01-20
KR10-2022-0008320 2022-01-20
KR10-2023-0008358 2023-01-19
KR1020230008358A KR20230112567A (ko) 2022-01-20 2023-01-19 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 snp 기반 모델

Publications (1)

Publication Number Publication Date
WO2023140713A1 true WO2023140713A1 (ko) 2023-07-27

Family

ID=87348557

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/001078 WO2023140713A1 (ko) 2022-01-20 2023-01-20 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 snp 기반 모델

Country Status (1)

Country Link
WO (1) WO2023140713A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190202915A1 (en) * 2016-07-01 2019-07-04 Tohoku University Method of predicting immune-related adverse event in use of immune checkpoint inhibitor
KR20210055922A (ko) * 2019-11-08 2021-05-18 한국과학기술원 암의 면역 치료 후 예후 예측용 바이오 마커

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190202915A1 (en) * 2016-07-01 2019-07-04 Tohoku University Method of predicting immune-related adverse event in use of immune checkpoint inhibitor
KR20210055922A (ko) * 2019-11-08 2021-05-18 한국과학기술원 암의 면역 치료 후 예후 예측용 바이오 마커

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BARRAL SANDRA, VARDARAJAN BADRI N., REYES-DUMEYER DOLLY, FABER KELLEY M., BIRD THOMAS D., TSUANG DEBBY, BENNETT DAVID A., ROSENBER: "Genetic variants associated with susceptibility to psychosis in late-onset Alzheimer’s disease families", NEUROBIOLOGY OF AGING, TARRYTOWN, NY, US, vol. 36, no. 11, 1 November 2015 (2015-11-01), US , pages 3116.e9 - 3116.e16, XP093078408, ISSN: 0197-4580, DOI: 10.1016/j.neurobiolaging.2015.08.006 *
HOMMES JOSEFIEN W., VERHEIJDEN RIK J., SUIJKERBUIJK KARIJN P. M., HAMANN DÖRTE: "Biomarkers of Checkpoint Inhibitor Induced Immune-Related Adverse Events—A Comprehensive Review", FRONTIERS IN ONCOLOGY, vol. 10, 11 February 2021 (2021-02-11), pages 585311, XP093078401, DOI: 10.3389/fonc.2020.585311 *
MARSCHNER DOMINIK, FALK MARTINA, JAVORNICZKY NORA REBEKA, HANKE-MÜLLER KATHRIN, RAWLUK JUSTYNA, SCHMITT-GRAEFF ANNETTE, SIMONETTA : "MicroRNA-146a regulates immune-related adverse events caused by immune checkpoint inhibitors", JCI INSIGHT, vol. 5, no. 6, 26 March 2020 (2020-03-26), pages e132334, XP093078396, DOI: 10.1172/jci.insight.132334 *

Similar Documents

Publication Publication Date Title
Shiina et al. The HLA genomic loci map: expression, interaction, diversity and disease
Larsen et al. Diagnostic approach for FSHD revisited: SMCHD1 mutations cause FSHD2 and act as modifiers of disease severity in FSHD1
Dong et al. Programmed cell death-1 polymorphisms decrease the cancer risk: a meta-analysis involving twelve case-control studies
Zeggini et al. Linkage and association studies of single‐nucleotide polymorphism–tagged tumor necrosis factor haplotypes in juvenile oligoarthritis
AU2013205891A1 (en) Method and apparatus for correlating levels of biomarker products with disease
Simmonds et al. The search for the genetic contribution to autoimmune thyroid disease: the never ending story?
Refae et al. Germinal Immunogenetics predict treatment outcome for PD-1/PD-L1 checkpoint inhibitors
Rotunno et al. Whole exome sequencing in families at high risk for Hodgkin lymphoma: identification of a predisposing mutation in the KDR gene
Campbell et al. Whole-genome sequencing of individuals from a founder population identifies candidate genes for asthma
Almlöf et al. Powerful identification of cis-regulatory SNPs in human primary monocytes using allele-specific gene expression
Nischwitz et al. More CLEC16A gene variants associated with multiple sclerosis
Rahbari et al. Understanding the genomic structure of copy‐number variation of the low‐affinity Fcγ receptor region allows confirmation of the association of FCGR3B deletion with rheumatoid arthritis
WO2022098086A1 (ko) 비기능성 전사체를 이용한 parp 저해제 또는 dna 손상 약물 감수성 판정방법
Apessos et al. Comprehensive BRCA mutation analysis in the Greek population. Experience from a single clinical diagnostic center
Li et al. Evaluation of the association of heterozygous germline variants in NTHL1 with breast cancer predisposition: an international multi-center study of 47,180 subjects
WO2022097844A1 (ko) 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법
Wonkam et al. Exome sequencing of families from Ghana reveals known and candidate hearing impairment genes
WO2023140713A1 (ko) 면역항암제 유도 면역관련 이상반응의 발병 예측을 위한 snp 기반 모델
WO2023140712A1 (ko) Hla 타입 기반 면역항암제 유도 면역관련 이상반응의 발병 예측 방법
Zhifu et al. SNP–SNP interactions of immunity related genes involved in the CD28/B7 pathway with susceptibility to invasive ductal carcinoma of the breast
Zhang et al. TAP1 and TAP2 gene polymorphism in rheumatoid arthritis in a population in eastern France
da Silva Francisco Junior et al. Pervasive inter-individual variation in allele-specific expression in monozygotic twins
Bakshi et al. MassARRAY-based single nucleotide polymorphism analysis in breast cancer of north Indian population
Chen et al. A transmembrane polymorphism in FcγRIIb (FCGR2B) is associated with the production of anti-cyclic citrullinated peptide autoantibodies in Taiwanese RA
Manco et al. Next-generation sequencing of 12 obesity genes in a Portuguese cohort of patients with overweight and obesity

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23743556

Country of ref document: EP

Kind code of ref document: A1