WO2023090901A1 - 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법 - Google Patents

기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법 Download PDF

Info

Publication number
WO2023090901A1
WO2023090901A1 PCT/KR2022/018220 KR2022018220W WO2023090901A1 WO 2023090901 A1 WO2023090901 A1 WO 2023090901A1 KR 2022018220 W KR2022018220 W KR 2022018220W WO 2023090901 A1 WO2023090901 A1 WO 2023090901A1
Authority
WO
WIPO (PCT)
Prior art keywords
genes
expression
senescence
group
activity level
Prior art date
Application number
PCT/KR2022/018220
Other languages
English (en)
French (fr)
Inventor
황소현
신동준
백광현
민요석
Original Assignee
의료법인 성광의료재단
차의과학대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 의료법인 성광의료재단, 차의과학대학교 산학협력단 filed Critical 의료법인 성광의료재단
Publication of WO2023090901A1 publication Critical patent/WO2023090901A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7042Aging, e.g. cellular aging

Definitions

  • It relates to a method for selecting a marker of cellular senescence using machine learning, a biomarker for cellular senescence, and a method for screening a senolytic agent using the same.
  • Cellular senescence refers to the permanent cell cycle arrest of cells caused by internal/external stimuli.
  • Cells in which cellular senescence has occurred are known to secrete Senescence Associated Secretory phenotype (SASP) to cause various inflammatory responses and, as a result, regulate age-related diseases including cancer.
  • SASP Senescence Associated Secretory phenotype
  • a senolysis technique to treat various diseases through the selective removal of these senescent cells has recently been in the limelight. For example, senescent cell target research was designated as one of the top 10 technologies selected by MIT in 2020.
  • mice treated with senolytic drugs increased and age-related diseases decreased.
  • senolytic drugs due to the heterogeneous characteristics of senescent cells, there is a shortage of markers capable of specifically selecting senescent cells, and senescent cell markers to date are expressed in cells other than senescent cells.
  • drugs including senolytic drugs developed at the Mayo Clinic in the United States, have been clinically conducted, but most of them do not show clear effects or have side effects, so there is no progress.
  • Cellular senescence is caused by various derivatives, such as replicative senescence caused by telomere reduction, oncogene-induced senescence induced by expression of oncogenes, and therapy-induced senescence caused by drugs or irradiation during disease treatment. According to previous studies, it is known that cellular senescence has stronger characteristics that are differentiated according to the type of cell than the type of inducer type. There are reports that are different, and in the case of existing cell senescence expression-related studies, there are disadvantages of not being able to select relatively significant genes due to the limitation of the number of samples per experiment.
  • acquiring a plurality of different experimental data including RNA sequencing data of a plurality of senescent cell populations of different causes and control cells; Obtain batch-corrected data by reducing the batch effect derived from different experiments by quantifying the acquired transcripts of the plurality of different experimental data through an analysis pipeline doing; selecting differentially expressed genes compared to control cells for each of a plurality of senescent cell groups of different causes in a training set among the batch-corrected data; selecting genes commonly present in a plurality of senescent cell populations of different causes from among the selected genes; and selecting markers of cellular senescence from among the selected genes using a regression model capable of supervised learning using the expression value of the selected gene as an independent variable.
  • a method for selecting a marker of cellular senescence using the present invention is provided.
  • Another aspect provides a computer-readable recording medium recording a program for executing the method on a computer.
  • Another aspect provides a device for detecting markers of cellular senescence performing the method.
  • Another aspect provides markers of cellular senescence derived by the method.
  • Another aspect provides a cellular senescence prediction model generated using the cellular senescence markers derived by the above method.
  • Another aspect is the expression of any one or more genes or proteins selected from the group consisting of RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and PXMP2, or A composition for detecting cellular senescence comprising an agent capable of measuring the level of activity is provided.
  • compositions for detecting cellular senescence comprising an agent capable of measuring expression or activity levels.
  • compositions for detecting cellular senescence comprising an agent capable of measuring the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76.
  • Another aspect provides a kit for detecting cellular senescence comprising the composition.
  • Another aspect provides a method for detecting cellular senescence comprising measuring the expression or activity level of the gene or protein from an isolated biological sample.
  • Another aspect includes contacting the gene or protein with a test substance; and selecting, as a senolytic drug, a test substance that changes the expression or activity level of the gene or protein compared to an untreated control group.
  • One aspect is to provide a method for selecting markers of cellular senescence.
  • cell is meant to include individual cells, as well as the specific tissue or organ from which it originates.
  • These cells include endothelial cells, smooth muscle cells, macrophages, fibroblasts, retinal pigment epithelial cells, other epithelial cells (eg lung epithelial cells or renal epithelial cells), immune cells (eg macrophages), chondrocytes. , or stem cells (eg, mesenchymal stem cells), or nerve cells (eg, neurons).
  • Cellular senescence refers to epigenetic markers that emerge from the cell cycle, are consistent with senescence, or refer to senescent cell markers (e.g., senescence-associated beta-galactosidase, or inflammatory cytokines). It may mean a cell expressing. Cellular senescence can be partial or complete.
  • epigenome or “epigenetics” refers to modifications and structural changes within a cell that control the expression of nucleic acids (eg, engineered nucleic acids) or genomic information in a cell. Changes to the epigenome occur and drive during the course of embryonic development, disease progression, and aging.
  • the age estimator can refer to an age estimator or an innate biological process.
  • the age estimator is an epigenetic age estimator.
  • an epigenetic age estimator can be a collection of CpG dinucleotides that can be used to estimate the age of a DNA source, including a cell, organ or tissue, when used in combination with a mathematical algorithm.
  • the age estimator is a DNA methylation-based (DNAm) age estimator.
  • a DNAm age estimator can be calculated as an age correlation using the Pearson correlation coefficient r between DNA methylation-based (DNAm) age (also known as estimated age) and chronological age.
  • a DNA methylation-based (DNAm) age estimator may be a single-tissue DNA methylation-based age estimator. In some embodiments, the DNA methylation-based age estimator may be a multi-tissue DNA methylation-based age estimator.
  • a senescent cell may exhibit any one or more of the following seven characteristics.
  • Senescent growth arrest is permanent in nature and cannot be reversed by known physiological stimuli.
  • senescent cells increase in size and are enlarged more than 2-fold compared to the size of their non-senescent counterparts.
  • Senescent cells express senescence-associated ⁇ -galactosidase (SA- ⁇ ), which in part reflects an increase in lysosomal mass.
  • SA- ⁇ senescence-associated ⁇ -galactosidase
  • Most senescent cells express p16INK4a, which is not universally It is not expressed by resting or terminally differentiated cells
  • Senescent cells following continuous DDR signaling express DNA segments with chromatin alterations reinforcing senescence (DNA-SCARS).
  • DNA-SCARS is a dysfunctional telomere or telomere dysfunction inducible focus (TIF: telomere foci).
  • senescent cells can express and secrete senescence-associated molecules, which in certain cases are observed in the presence of constitutive DDR signaling and in certain instances constitutive for their expression.
  • the nucleus of senescent cells lacks structural proteins such as Lamin B1 or chromatin binding proteins such as histones and HMGB1. See, e.g., Freund et al. Mol. Biol. Cell 23:2066-75 (2012)] [Davalos et al., J. Cell Biol.
  • Senescent cells and senescent cell-associated molecules can be detected by techniques and methods described in the art. For example, the presence of senescent cells in a tissue can be analyzed by histochemistry or immunohistochemistry to detect the senescence marker, SA-beta galactosidase (SA- ⁇ ; see, e.g., Dimri et al. ., Proc. Natl. Acad. Sci. USA 92: 9363-9367 (1995)]
  • SA- ⁇ SA-beta galactosidase
  • the presence of the senescent cell-associated polypeptide p16 can be determined by any of a number of immunochemical methods practiced in the art, such as immunoblotting.
  • p16 mRNA in cell can be measured by various techniques practiced in the art, including quantitative PCR.Presence and level of senescent cell-associated polypeptide (e.g., polypeptide of SASP) can be measured using automated and high-throughput assays, such as automated Luminex array assays described in the art (e.g., Coppe et al., PLoS Biol 6: 2853-68 (2008)). ] reference).
  • automated Luminex array assays described in the art (e.g., Coppe et al., PLoS Biol 6: 2853-68 (2008)).
  • the term "marker” is a substance that can distinguish between normal cell population and senescent cell population, and is a polypeptide, protein or nucleic acid, gene, lipid, glycolipid, sugar that is increased or decreased in the senescent cell population of the present invention. It includes all organic biomolecules such as proteins or sugars.
  • the method includes acquiring a plurality of different experimental data including RNA sequencing data of senescent cell populations having a plurality of different senescence-inducing causes and control cells (S10);
  • the plurality of different experimental data may include a senescent cell group and a control cell group (proliferating cell group).
  • the senescent cell group may be a plurality of senescent cell groups having at least two or more different causes of aging.
  • the cause of senescence may be any one selected from the group consisting of replicative senescence, oncogene induced senescence, and therapy induced senescence.
  • the experimental data may include a replicating senescent cell group, an oncogene-induced senescent cell group, and a control cell group.
  • the experimental data may include a replicating senescent cell group, an oncogene-induced senescent cell group, a treatment-induced senescent cell group, and a control cell group.
  • Each cell population in the experimental data may be derived from the same laboratory or from different laboratories.
  • the experimental data may include data experimentally measured from biological samples, obtained from known literature, or stored in a database (DB).
  • the database may include National Center for Biotechnology Information (NCBI), Gene Expression Omnibus (GEO), European Bioinformatics Institute databases, or European Nucleotide Archive.
  • NCBI National Center for Biotechnology Information
  • GEO Gene Expression Omnibus
  • European Bioinformatics Institute databases or European Nucleotide Archive.
  • the RNA sequencing data may be configured in the form of FASTQ format.
  • the method may further include classifying the obtained plurality of different experimental data into a training set and a test set.
  • the classifying step may be performed after obtaining the experimental data, or may be performed after acquiring batch-corrected data.
  • the experimental data of the training set and the test set are in a predetermined ratio (e.g., about 90:10, about 80:20, about 75:25, about 60:40, about 50:50, about 40:60, about 25 :75, about 20:80, or about 10:90).
  • the training set and the test set may include both the senescent cell population having the plurality of different senescence-inducing causes and the control group, respectively.
  • the training set or assay set may include a replicative senescent cell group, an oncogene-induced senescent cell group, and a control cell group.
  • the training set or test set may include a replicative senescent cell group, an oncogene-induced senescent cell group, a treatment-induced senescent cell group, and a control cell group.
  • Each cell population within the training set or test set may be from the same laboratory or from different laboratories.
  • the step of acquiring the batch-corrected data comprises configuring the RNA sequencing data as Fastq data and inputting the Fastq data; obtaining clean reads by quality control and pre-processing of the input Fastq data; aligning the clean lead to a corresponding genome or transcript; and/or assembling a transcript of a genome or transcript corresponding to the clean read; It may include quantifying the assembled transcript.
  • the quality control may be performed using a FASTQ program, an NGSQC program, or an RNA-SeQC program.
  • the preprocessing to obtain a clean lead may be performed using Trimmomatic, PRINSEQ, or Soapnuke.
  • the aligning step may be performed using Salmon, Ensemble, Tophat2, HISAT2, STAR, BWA, or Bowtie.
  • the step of assembling the transcript is Tximeta, Cufflinks, StringTie, Trinity, SOAPdenovoTrans, or Trans -It may be performed using AByS.
  • the quantifying step may be performed using limma FeatureCount, HTSeq-Count, Cufflinks, eXpress, RSEM, DEXSeq, Kallisto, Sailfish, or Salmon.
  • the method may further include removing genes whose expression levels are significantly low in all cell groups for the training set among the batch-corrected data from the senescence marker candidate genes. Removal of the gene with significantly low expression level may be performed through the edgeR package.
  • a significant probability p value (probability value) among genes whose expression level is changed compared to the control group in the senescent cell group is 0.05 or less, or Selecting a gene whose variation is about 2-fold or more or about 1/2-fold or less; Alternatively, it may further include verifying by performing gene ontology (GO) analysis on the differentially expressed genes.
  • the analysis of the differentially expressed genes was conducted through the R package edgeR (v3.10) and may be performed by constructing an analysis design according to aging status information and batch information of the sample after TMM normalization.
  • the regression model may include a machine learning model, for example, a supervised learning model.
  • the regression model may include a LASSO model, a linear regression model, and/or other supervised-learning models.
  • the independent variable (feature point) of the regression model may be the expression value of the selected gene (TMM normalized Log 2 CPM (count per million)), and the dependent variable is 0 when the state of the data is a proliferating control, and aging In the case of a senescent status, it may be assigned as 1.
  • the regression model may include leave one out cross validation (LOOCV).
  • LOOCV creates a total of N (as many as the number of samples) models, excludes only one sample when creating each model, calculates the performance of the test set with the excluded samples, and calculates the performance of the test set for N performances It may include an averaging method.
  • the method may further include assaying a marker of the selected senescent cells.
  • the assaying step (i) using at least some of the plurality of different experimental data as a test set, checking whether the markers of the senescent cells selected in the same way as in the training set are expressed in the test set doing; and/or (ii) generating a senescence prediction model by applying the selected markers of cellular senescence to a training set, and performing a test on a test set using the senescence prediction model.
  • the step (ii) generates an aging prediction model by applying the obtained plurality of different experimental data and markers of cellular aging obtained through a different path to the training set, and using this to generate an additional
  • the method may include performing an assay on the assay set and comparing the assay result with the assay result of step (ii).
  • the aging prediction model may include a machine learning model, for example, a supervised learning model. In one embodiment, the aging prediction model may be generated through a support vector machine.
  • the aging prediction model is any one or more selected from the group consisting of the selected genes RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and PXMP2
  • the gene may be generated through a machine learning model, for example, a support vector machine.
  • the aging prediction model is selected from the group consisting of EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, and H2AC6.
  • One or more genes may be generated through a machine learning model, for example, a support vector machine.
  • the aging prediction model may be one or more genes selected from the group consisting of selected genes, GAS2L3, AMOT, and WDR76, generated through a machine learning model, for example, a support vector machine.
  • Another aspect of the present specification is to provide the generated cellular senescence prediction model.
  • the method may further include a step of verifying while selecting a gene at each step. Verification of the selected gene may be performed through gene ontology (GO) analysis, principal component analysis, or clustering.
  • GO gene ontology
  • Another aspect is to provide a computer-readable recording medium recording a program for executing the method on a computer.
  • Another aspect is to provide a device for detecting markers of cellular senescence.
  • the apparatus includes: an acquisition unit that acquires a plurality of different experimental data including RNA sequencing data of senescent cell populations having a plurality of different senescence-inducing causes and control cells;
  • Batch-corrected data acquisition unit by reducing the batch effect derived from different experiments by quantifying the acquired transcripts of the plurality of different experimental data through an analysis pipeline ;
  • a first screening unit that selects differentially expressed genes compared to control cells for each of the senescent cell groups having a plurality of different causes of senescence in a training set among the batch-corrected data
  • a second selection unit for selecting genes commonly present in the senescent cell population having a plurality of different senescence-inducing causes among the selected genes
  • a third selection unit for selecting markers of cellular senescence for the selected genes using a regression model capable of supervised learning may be included.
  • Another aspect is providing a composition for detecting cellular senescence.
  • the composition may include an agent capable of measuring the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76.
  • measuring the expression level of the gene may include measuring the amount of mRNA in a process of confirming the presence or absence of mRNA and the expression level of genes in a biological sample. Analysis methods for this include reverse transcription polymerase reaction (RT-PCR), competitive reverse transcription polymerase reaction (Competitive RT-PCR), real-time reverse transcription polymerase reaction (Real-time RT-PCR), RNase protection assay (RPA; RNase protection assay), Northern blotting, DNA chip, and the like.
  • RT-PCR reverse transcription polymerase reaction
  • Competitive RT-PCR competitive reverse transcription polymerase reaction
  • Real-time RT-PCR real-time reverse transcription polymerase reaction
  • RNase protection assay RNase protection assay
  • Northern blotting DNA chip, and the like.
  • Agents capable of measuring the expression level of the gene may include primers, probes, or antisense oligonucleotides. Since the nucleic acid information of the genes is known in GeneBank or the like, those skilled in the art can design primers or probes that specifically amplify specific regions of these genes based on the sequences.
  • primer includes all combinations of primer pairs consisting of forward and reverse primers recognizing a target gene sequence, and specifically, a primer pair that provides analysis results having specificity and sensitivity.
  • probe means a substance capable of specifically binding to a target substance to be detected in a sample, and means a substance capable of specifically confirming the presence of a target substance in a sample through the binding. do.
  • the type of probe molecule is not limited as a material commonly used in the art, but preferably may be peptide nucleic acid (PNA), locked nucleic acid (LNA), peptide, polypeptide, protein, RNA, or DNA. More specifically, the probe is a biomaterial, including one derived from or similar to a living organism or produced in vitro, for example, enzymes, proteins, antibodies, microorganisms, animal and plant cells and organs, nerve cells, DNA, and RNA.
  • PNA peptide nucleic acid
  • LNA locked nucleic acid
  • the probe is a biomaterial, including one derived from or similar to a living organism or produced in vitro, for example, enzymes, proteins, antibodies, microorganisms, animal and plant cells and organs, nerve cells, DNA, and RNA.
  • DNA includes cDNA, genomic DNA, and oligonucleotides
  • RNA includes genomic RNA, mRNA, and oligonucleotides
  • proteins may include antibodies, antigens, enzymes, peptides, and the like.
  • antisense oligonucleotide refers to DNA or RNA or derivatives thereof containing a nucleic acid sequence complementary to a sequence of a specific gene (eg, mRNA of a specific gene), which binds to a complementary sequence in mRNA. It acts to inhibit the translation of mRNA into protein.
  • An antisense oligonucleotide sequence refers to a DNA or RNA sequence that is complementary to the mRNA of the genes and capable of binding to the mRNA. This can inhibit translation of the gene mRNA, translocation into the cytoplasm, maturation or any other vital activity for overall biological function.
  • the length of the antisense oligonucleotide may be 6 to 100 bases, preferably 8 to 60 bases, more preferably 10 to 40 bases.
  • measuring the expression or activity level of the protein may include a process of confirming the presence and expression (or activity) level of the protein in a biological sample.
  • Analysis methods for this include protein chip analysis, immunoassay, ligand binding assay, MALDI-TOF (Matrix Desorption/Ionization Time of Flight Mass Spectrometry) analysis, SELDI-TOF (Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry) Assay, radioimmunoassay, radioimmuno-diffusion method, Oukteroni immunodiffusion method, rocket immunoelectrophoresis, tissue immunostaining, complement fixation assay, two-dimensional electrophoretic assay, liquid chromatography-Mass Spectrometry (LC) -MS), liquid chromatography-Mass Spectrometry/Mass Spectrometry (LC-MS/MS), Western blot, and enzyme linked immunosorbent assay (ELISA).
  • LC liquid chromatography-Mass Spectrometry
  • Agents capable of measuring the activity level of the protein may include antibodies, aptamers, avidity multimers, or peptidomimerics.
  • an antibody can refer to a specific protein molecule directed against an antigenic site.
  • an antibody refers to an antibody that specifically binds to the estrogen receptor, MUCIN5AC, or aromatase protein, and includes polyclonal antibodies, monoclonal antibodies, and recombinant antibodies. Generating antibodies can be readily prepared using techniques well known in the art.
  • the antibodies of the present specification include functional fragments of antibody molecules as well as complete forms having two full-length light chains and two full-length heavy chains.
  • a functional fragment of an antibody molecule means a fragment having at least an antigen-binding function, and includes Fab, F(ab'), F(ab') 2 and Fv.
  • RRM2B Another aspect is RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and Expression of one or more genes or proteins selected from the group consisting of PXMP2 Or to provide a kit for detecting cellular senescence comprising an agent capable of measuring the activity level.
  • any one or more genes or proteins selected from the group consisting of EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, and H2AC6 To provide a kit for detecting cellular senescence comprising an agent capable of measuring the expression or activity level of.
  • kits for detecting cellular senescence comprising an agent capable of measuring the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76.
  • the kit is a reverse transcription polymerase chain reaction (RT-PCR) kit, a DNA chip kit, a microarray kit, an enzyme-linked immunosorbent assay (ELISA) kit, a protein chip kit, a rapid kit, or an MRM kit. (Multiple reaction monitoring) kit.
  • RT-PCR reverse transcription polymerase chain reaction
  • DNA chip kit a DNA chip kit
  • microarray kit an enzyme-linked immunosorbent assay
  • ELISA enzyme-linked immunosorbent assay
  • protein chip kit a protein chip kit
  • rapid kit a rapid kit
  • MRM kit Multiple reaction monitoring
  • the kit may further comprise one or more other component compositions, solutions or devices suitable for the assay method.
  • the kit may be a kit including essential elements required to perform a reverse transcription polymerase reaction.
  • the reverse transcription polymerase reaction kit includes each pair of primers specific for a marker gene.
  • the primer is a nucleotide having a sequence specific to the nucleic acid sequence of each gene, and is about 7 bp to 50 bp in length, more preferably about 10 bp to 30 bp in length.
  • a primer specific for the nucleic acid sequence of the control gene may be included.
  • reverse transcription polymerase reaction kits include test tubes or other suitable containers, reaction buffer (with varying pH and magnesium concentrations), deoxynucleotides (dNTPs), enzymes such as Taq-polymerase and reverse transcriptase, DNAse, RNAse inhibitor DEPC- Water (DEPC-water), sterilized water, etc. may be included.
  • the DNA chip kit may include a substrate to which cDNA or an oligonucleotide corresponding to a gene or a fragment thereof is attached, and reagents, reagents, enzymes, and the like for preparing a fluorescently labeled probe.
  • the substrate may include a cDNA or oligonucleotide corresponding to a control gene or a fragment thereof.
  • the kit may be a diagnostic kit including essential elements required to perform LISA.
  • ELISA kits contain antibodies specific for the protein.
  • An antibody is an antibody that has high specificity and affinity for each marker protein and little cross-reactivity to other proteins, and is a monoclonal antibody, polyclonal antibody, or recombinant antibody.
  • ELISA kits may also include antibodies specific for a control protein.
  • Other ELISA kits include reagents capable of detecting bound antibodies, such as labeled secondary antibodies, chromophores, enzymes (eg, conjugated with antibodies) and substrates thereof or those capable of binding the antibody.
  • the kit may contain other substances and the like.
  • the kit may be a rapid kit including essential elements required to perform a rapid test in which the analysis result can be known.
  • Rapid kits contain antibodies specific for the protein.
  • An antibody is an antibody that has high specificity and affinity for each marker protein and little cross-reactivity to other proteins, and is a monoclonal antibody, polyclonal antibody, or recombinant antibody.
  • Rapid kits may also include antibodies specific for a control protein.
  • Other rapid kits include reagents capable of detecting the bound antibody, for example, a nitrocellulose membrane on which a specific antibody and a secondary antibody are immobilized, a membrane bound to antibody-coupled beads, an absorbent pad and a sample pad, etc. materials and the like.
  • the kit may be a multiple reaction monitoring (MRM) kit in MS/MS mode that includes essential elements necessary for performing mass spectrometry.
  • MRM multiple reaction monitoring
  • SIM Select Ion Monitoring
  • MRM selects a specific ion from among the once-broken ions one more time to continuously connect another source of MS. It is a method of using the ions obtained from these after passing through them once more to collide with them.
  • MRM multiple reaction monitoring
  • Another aspect is any one or more genes selected from the group consisting of RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and PXMP2 from an isolated biological sample Or to provide a method for detecting cellular senescence comprising measuring the expression or activity level of the protein.
  • the method is characterized in that the expression or activity level of any one or more genes or proteins selected from the group consisting of RRM2B, DUSP6, GSAP, AKAP6, C2orf92, and AC008012.1 is the expression of a gene or protein in a normal control sample or if higher than the activity level, judging as cellular senescence; Or the expression or activity level of any one or more genes or proteins selected from the group consisting of LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and PXMP2 is lower than the expression or activity level of the gene or protein of the normal control sample. In this case, it may include the step of determining as cellular senescence.
  • Another aspect is any one selected from the group consisting of EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, and H2AC6 from the separated biological sample. It is to provide a method for detecting cellular senescence comprising measuring the expression or activity level of the above gene or protein.
  • the method is such that the expression or activity level of any one or more genes or proteins selected from the group consisting of H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, and H2AC6 is a gene in a normal control sample. Or if higher than the expression or activity level of the protein, determining that the cell is senescent; Or, the expression or activity level of any one or more genes or proteins selected from the group consisting of EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, and WDR76 is lower than the expression or activity level of a gene or protein in a normal control sample. It may include the step of judging by cellular senescence.
  • Another aspect is to provide a method for detecting cellular senescence comprising measuring the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76 from an isolated biological sample.
  • the method when the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT, and WDR76 is lower than the expression or activity level of a gene or protein in a normal control sample, the method causes cellular senescence. It may include a step of judging.
  • the method for measuring the expression level of the gene may include reverse transcription polymerase reaction, competitive reverse transcription polymerase reaction, real-time reverse transcription polymerase reaction, RNase protection assay, northern blotting, or DNA chip.
  • the method for measuring the activity level of the protein is Western blotting, ELISA, radiation immunoassay, radiation immunodiffusion method, Ouchterlony immunodiffusion method, rocket immunoelectrophoresis, immunohistochemical staining , immunoprecipitation assay, complement fixation assay, FACS or protein chip.
  • RRM2B Another aspect is RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and any one or more genes or proteins selected from the group consisting of PXMP2 and a test substance contacting; and
  • It is to provide a method for screening a senolytic drug comprising the step of selecting, as a senolytic drug, a test substance that changes the expression or activity level of the gene or protein compared to an untreated control group.
  • the method is a test substance in which the expression or activity level of any one or more genes or proteins selected from the group consisting of RRM2B, DUSP6, GSAP, AKAP6, C2orf92, and AC008012.1 is reduced compared to the untreated control group selecting as a senolytic drug; Or a test substance that increases the expression or activity level of any one or more genes or proteins selected from the group consisting of LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, and PXMP2 compared to the untreated control group as a senolytic drug It may include the step of selecting as.
  • Another aspect is any one or more genes or proteins selected from the group consisting of EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, and H2AC6 contacting the test substance; and
  • It is to provide a method for screening a senolytic drug comprising the step of selecting, as a senolytic drug, a test substance that changes the expression or activity level of the gene or protein compared to an untreated control group.
  • the method is a test in which the expression or activity level of any one or more genes or proteins selected from the group consisting of EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, and WDR76 is reduced compared to the untreated control group selecting the substance as a senolytic drug;
  • a test substance that increases the expression or activity level of any one or more genes or proteins selected from the group consisting of H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, and H2AC6 compared to the untreated control group is a senolytic drug It may include the step of selecting as.
  • Another aspect comprises contacting a test substance with any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76; and
  • It is to provide a method for screening a senolytic drug comprising the step of selecting, as a senolytic drug, a test substance that changes the expression or activity level of the gene or protein compared to an untreated control group.
  • the method comprises the steps of selecting, as a senolytic drug, a test substance that increases the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76 compared to the untreated control group.
  • a test substance that increases the expression or activity level of any one or more genes or proteins selected from the group consisting of GAS2L3, AMOT and WDR76 compared to the untreated control group.
  • test substance for example, a drug candidate, test compound or test composition
  • a drug candidate, test compound or test composition may be a small molecule compound, antibody, antisense nucleotide, short interfering RNA, short hairpin RNA, nucleic acid, protein, peptide, Other extracts or natural products may be included.
  • the contact may be performed in vitro.
  • a step of treating the transformed cell with a drug candidate may be included.
  • the senolytic drug may refer to an agent that can be used to selectively (preferentially or to a greater extent) kill or destroy senescent cells in a clinically significant or biologically significant manner.
  • the senolytic agent may be used in senescent cells (e.g., senescent progenitor cells, senescent endothelial cells, senescent fibroblasts, senescent neurons, senescent epithelial cells, senescent mesenchymal cells, senescent smooth muscle cells, senescent macrophages, or senescent chondrocytes). It may contain agents capable of selectively killing one or more types.
  • an analysis pipeline for performing a meta-analysis on RNA-seq data of senescent cells is established to secure a sufficient number of samples to generate statistically more significant genes. can be selected, and there is an effect of finding a candidate group of markers characteristic of senescent cells among various variables through a machine learning methodology.
  • the cell senescence marker derived by the above method is a more significant gene signature that can specify cell senescence in various types of cells than in previous studies, and can be usefully used to specify or detect senescent cells. , there is an effect that can be usefully used to select a senolytic agent.
  • FIG. 1 is a flowchart illustrating a method of detecting markers of cellular senescence according to one embodiment.
  • FIG. 2 is a schematic diagram for selecting biomarkers of cellular senescence according to an embodiment.
  • 3 is a diagram showing the results of PCA analysis of about 14,000 genes remaining after removing genes with low expression levels in the entire sample.
  • FIG. 4 is a diagram showing the results of clustering analysis for about 14,000 genes remaining after removing genes with low expression levels in the entire sample.
  • 5 is a Venn diagram showing the number of genes commonly present across all inducers among differentially expressed genes for each inducer type; a: Genes with increased expression, b: Genes with decreased expression.
  • Figure 6 is a diagram showing the GO analysis results of selected co-expressed genes; a: Genes with increased expression, b: Genes with decreased expression.
  • FIG. 7 is a diagram showing the PCA analysis results for 363 selected co-expressed genes.
  • 8 is a diagram showing the results of clustering analysis for 363 selected commonly expressed genes.
  • 9 is a diagram showing each coefficient value of 15 genes selected by LASSO in Barplot.
  • 10 is a diagram showing the PCA analysis results for 15 genes selected by LASSO.
  • 11 is a diagram showing the clustering analysis results for 15 genes selected by LASSO.
  • FIG. 13 is a graph showing ROC curve results for performance evaluation of two cellular senescence classification models; a: assay data of one embodiment, b: additional various senescent cell data.
  • 15 is a Venn diagram showing the number of genes commonly present across all inducers among differentially expressed genes for each inducer type; a: Genes with increased expression, b: Genes with decreased expression.
  • 16 is a diagram showing the GO analysis results of selected co-expressed genes; a: Genes with increased expression, b: Genes with decreased expression.
  • 17 is a diagram showing each coefficient value of 17 genes selected by LASSO in Barplot.
  • 18 is a diagram showing the PCA analysis results for 17 genes selected by LASSO.
  • 19 is a diagram showing the clustering analysis results for 17 genes selected by LASSO.
  • 21 is a graph showing ROC curve results for performance evaluation of five cellular senescence classification models; a: assay data of one embodiment, b: additional various senescent cell data.
  • FIG. 2 shows a schematic diagram for selecting biomarkers of cellular senescence according to an embodiment.
  • RNA-seq data from ENA European Nucleotide Archive
  • ENA European Nucleotide Archive
  • http://www.ebi.ac.uk/ena/browser/home was used to identify senescent cell-related markers.
  • the data consisted of a total of 165 samples, 73 in the control group and 92 in the experimental group, and the characteristics of each data were organized by derivative (Replicative senescence, Oncogene induced senescence (OIS), Therapy induced senescence (TIS)) of senescent cells.
  • OIS Oncogene induced senescence
  • TIS Therapy induced senescence
  • a training set and a test set were assigned to each GSE. Referring to data-related papers, training data and test data for model validation were allocated at a ratio of about 5:5.
  • Each data consists of Fastq data generated by the Illumina Hiseq platform, and data characteristic information is shown in Table 1 below.
  • partition information of the training set and the test set is shown in Table 2 below.
  • the ratio of the training set and the test set was divided at 50:50, and certain derivative data were kept in an approximately constant ratio so as not to be biased and distributed in the training set and validation set.
  • the Fastq files of Example 1.1 were quantified through the same pipeline, and a SALMON pipeline was created and analyzed to minimize the batch effect derived from different experiments.
  • the SALMON pipeline includes QC (fastQC, v0.11.9), Trimming (Trimmomatics, v0.39), Mapping (SALMON, v1.10), Raw count quantification (tximeta, v1.4.5), Batch It consists of a correction (limma, v3.42.2) step (Tximeta and limma were analyzed within R program v3.6.3).
  • 3 is a diagram showing the results of PCA analysis of about 14,000 genes remaining after removing genes with low expression levels in the entire sample.
  • FIG. 4 is a diagram showing the results of clustering analysis for about 14,000 genes remaining after removing genes with low expression levels in the entire sample.
  • differential expression gene analysis was performed to select genes with increased or decreased expression levels in the senescent cell group compared to the normal cell group.
  • the analysis was conducted through the R package edgeR (v3.10), and after TMM normalization, the analysis design was constructed according to the aging state information and batch information of the sample. In order to solve the multiple comparison problem that occurs during hypothesis testing several times, adjusted p-values were calculated. Only genes whose fold change was more than twice (up-regulated) or less than half (down-regulated) were selected.
  • a total of 1,444 genes up-regulated genes: 877, down-regulated genes: 567) in RS and a total of 1,647 genes (up-regulated genes: 602, down-regulated genes in OIS) genes: 1,045), and a total of 1,405 genes (up-regulated genes: 802, down-regulated genes: 603) in TIS were selected as differentially expressed genes, which are shown in Table 3 below.
  • the DEG results for each inducer are divided into up-regulated genes and down-regulated genes, and then a Venn diagram is drawn. , respectively, the intersection of genes was selected.
  • the Venn diagram is shown in FIG. 5 .
  • 5 is a Venn diagram showing the number of genes commonly present across all inducers among differentially expressed genes for each inducer type; a: Genes with increased expression, b: Genes with decreased expression.
  • GO gene ontology analysis was performed using gProfiler (https://biit.cs.ut.ee/gprofiler/) to confirm that the selected co-expressed genes are gene sets reflecting cellular senescence characteristics.
  • the biological pathways related to 363 genes were searched.
  • GO analysis was performed according to the direction of expression increase and decrease of genes, and only the results with an adjusted p-value of 0.05 or less were selected for the GO results, and the results are shown in FIG. 6 .
  • Figure 6 is a diagram showing the GO analysis results of selected co-expressed genes; a: Genes with increased expression, b: Genes with decreased expression.
  • the 85 genes whose expression is commonly increased in senescent cells are DNA-damage response, SASP (Senescence associated secretory phenotype), Inhibition of DNA recombination at telomere, Immune response and various cellular senescence known features. It was confirmed that the characteristics related to the senescence pathway appeared significantly. In addition, in the case of 278 genes whose expression is commonly reduced in senescent cells, they are also related to biological pathways related to cell cycle, DNA replication, DNA repair, telomere maintenance, chromosome organization, and segregation, which are known characteristics of cellular aging. confirmed. Through this, it was confirmed that the entire set of 363 crossover genes well reflected the characteristics of cellular aging.
  • FIG. 7 is a diagram showing the PCA analysis results for 363 selected co-expressed genes.
  • 8 is a diagram showing the results of clustering analysis for 363 selected commonly expressed genes.
  • the clustering results of 363 selected co-expressed genes are compared to the clustering results of about 14,000 genes in FIG. I found that I could't tell them apart.
  • a variable selection process for genes was performed through LASSO regression in order to select the minimum gene that best represents the characteristics of cellular senescence.
  • the corresponding genes are ENSG00000048392 (RRM2B), ENSG00000139318 (DUSP6), ENSG00000186088 (GSAP), ENSG00000151320 (AKAP6), ENSG00000228486 (C2orf92), ENSG00000285901 (AC 008012.1), ENSG00000013297 (CLDN11), ENSG00000198830 (HMGN2), ENSG00000159259 (CHAF1B), ENSG00000003096 (KLHL13), ENSG00000213347 (MXD3), ENSG00000158321 (AUTS2), ENSG00000166833 (NAV2), ENSG00000010292 (NCAPD2), ENSG00000176894 (PXMP2) , and the expression direction of the corresponding gene in cellular aging through the coefficient of each gene ( +/-) and influence.
  • RRM2B ENSG00000139318
  • DUSP6
  • RRM2B A total of 6 genes (RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1) have positive coefficients, so their expression increased in senescent cells, and the remaining 9 genes (CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2) , NAV2, NCAPD2, PXMP2) had negative coefficients, indicating that their expression in senescent cells decreased.
  • 9 is a diagram showing each coefficient value of 15 genes selected by LASSO in Barplot.
  • 10 is a diagram showing the PCA analysis results for 15 genes selected by LASSO.
  • 11 is a diagram showing the clustering analysis results for 15 genes selected by LASSO.
  • the clustering results of the 15 genes selected by LASSO show that the expression patterns of the genes are clearly distinguished between senescent cells and the control group compared to the clustering results of FIGS. 4 and 8, and senescent cells and control data. was found to be clearly distinguished.
  • the first model was produced through the RBF kernel of a support vector machine, and R package e1071 (version 1.7-3) was used.
  • the expression values of 15 genes for the 81 training data used for the learning were used as the data used for learning the model, and the optimal classification model was selected and produced through LOOCV (leave one out cross-validation).
  • an SVM model was created in the same manner as the first model by applying the expression values of 55 cellular senescence genes selected from other cellular senescence-related research literature (Hernandez-Segura et al. 2017) to the training data set.
  • a second model was created to compare the first model and senescent cell sorting performance.
  • Classification assay was performed on 84 senescent fibroblast assay data (36 controls, 48 senescent cells) using the two models prepared in 2.2 above, and the results are shown in FIG. 13A.
  • 42 different senescent cell data control group: 18, senescent cell: 24, 42 different types other than fibroblasts (HUVEC, HAEC, MSC, LS8817, Ovcar3) using the two models created in 2.2.
  • the classification test was performed, and the results are shown in FIG. 13B.
  • Log 2 CPM values of the test data were tested after scaling based on the mean and standard deviation of the expression values of the training data.
  • FIG. 13 is a graph showing ROC curve results for performance evaluation of two cellular senescence classification models; a: assay data of one embodiment, b: additional various senescent cell data.
  • Example 2 it was confirmed that the expression pattern of the 15 genes selected according to one embodiment showed a significant difference between the normal and senescent cell groups, the same as the coefficient sign pattern of LASSO. In addition, it was confirmed that the senescent cell classification model constructed with 15 genes better represented the characteristics of cellular senescence than the senescent cell classification model constructed with 55 cellular senescence-related genes known in previous studies. In addition, an existing study (Hernandez-Segura et al. 2017) presenting characteristic genes in consideration of various cells, including senescent fibroblasts, was conducted, and the method according to one embodiment selected genes using only senescent fibroblasts as training data. Nevertheless, it was confirmed that the classification performance was better than that of previous studies for various types of cells.
  • the method according to one embodiment can select statistically more significant markers in various types of cells, including fibroblasts, and the 15 genes derived by the method according to one embodiment are senescent cells. It means that it can be usefully used to specify or detect.
  • Example 2 Using the same method as in Example 1 (Fig. 2), but after removing 18 samples with different aging characteristics among the samples specified in Table 1 of 1.1 Data Set Preparation and Analysis, 17 genes whose expression changes in senescent cells Further selection was performed to obtain more sophisticated genes.
  • Example 2 Of the 165 fibroblast samples of Example 1, 18 samples were additionally removed to obtain a total of 147 fibroblast samples. Information on the removed samples is as follows.
  • partition information of the training set and the test set is shown in Table 6 below.
  • PCA Principal component analysis
  • FIG. 14 is a diagram showing the results of PCA analysis of about 14,000 genes remaining after removing genes with low expression levels in all re-selected samples.
  • Differentially expressed genes for each inducer type were selected in the same manner as in Example 1.4 Differentially expressed gene analysis process. Looking at each inducer type, a total of 1,463 genes (up-regulated genes: 881, down-regulated genes: 582) in RS and a total of 2,039 genes (up-regulated genes: 791, down-regulated genes in OIS) genes: 1,248), and a total of 1,903 genes (up-regulated genes: 1,238, down-regulated genes: 665) in TIS were selected as differentially expressed genes, which are shown in Table 7 below.
  • the DEG results for each inducer are divided into up-regulated genes and down-regulated genes, and then a Venn diagram is drawn. , respectively, the intersection of genes was selected.
  • the Venn diagram is shown in FIG. 15 .
  • 15 is a Venn diagram showing the number of genes commonly present across all inducers among differentially expressed genes for each inducer type; a: Genes with increased expression, b: Genes with decreased expression.
  • GO gene ontology analysis was performed using gProfiler (https://biit.cs.ut.ee/gprofiler/) to confirm that the selected co-expressed genes are gene sets reflecting cellular senescence characteristics.
  • the biological pathways related to 465 genes were searched.
  • GO analysis was performed according to the direction of expression increase and decrease of genes, and only the results with an adjusted p-value of 0.05 or less were selected for the GO results, and the results are shown in FIG. 16 .
  • 16 is a diagram showing the GO analysis results of selected co-expressed genes; a: Genes with increased expression, b: Genes with decreased expression.
  • the 181 genes whose expression was commonly increased in senescent cells showed significant signs of known characteristics of cellular senescence such as SASP (Senescence associated secretory phenotype), chromatin organization, immune response, and various cellular senescence pathway related characteristics. I was able to confirm.
  • SASP Signal associated secretory phenotype
  • chromatin organization chromatin organization
  • immune response various cellular senescence pathway related characteristics.
  • 284 genes whose expression was commonly reduced in senescent cells it was confirmed that they were related to biological pathways related to cell cycle, DNA replication, DNA repair, telomere maintenance and organization, which are also known characteristics of cellular aging. . Through this, it was confirmed that the entire set of 465 crossover genes well reflected the characteristics of cellular aging.
  • Example 1.5 the same method as the variable selection process using LASSO (least absolute shrinkage and selection operator) in Example 1.5 was used to select the minimum gene that best represents the characteristics of cellular senescence.
  • the corresponding genes are ENSG00000106462 (EZH2), ENSG00000120802 (TMPO), ENSG00000126016 (AMOT), ENSG00000139354 (GAS2L3), ENSG00000054654 (SYNE2), ENSG00000164104 (HM GB2), ENSG00000164649 (CDCA7L), ENSG00000092470 (WDR76), ENSG00000273802 (H2BC8), ENSG00000102996 ( MMP15), ENSG00000197142 (ACSL5), ENSG00000135218 (CD36), ENSG00000075651 (PLD1), ENSG00000003137 (CYP26B1), ENSG00000186088 (GSAP), ENSG00000197903 (H2BC12), ENSG00000180573 (H2AC6), and cell aging through the coefficient of each gene Indicates the expression direction (+/-) and influence of the corresponding gene in
  • H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, H2AC6) have positive coefficients, so their expression increased in senescent cells, and the remaining 8 genes (EZH2, TMPO, AMOT, GAS2L3 , SYNE2, HMGB2, CDCA7L, WDR76) had negative coefficients, indicating that their expression in senescent cells decreased.
  • 17 is a diagram showing each coefficient value of 17 genes selected by LASSO in Barplot.
  • 18 is a diagram showing the PCA analysis results for 17 genes selected by LASSO.
  • 19 is a diagram showing the clustering analysis results for 17 genes selected by LASSO.
  • the clustering results of the 17 genes selected by LASSO showed that the expression patterns of the genes were clearly distinguished between senescent cells and control data, and clearly distinguished senescent cells and control data.
  • the first model was produced through the RBF kernel of a support vector machine, and R package e1071 (version 1.7-3) was used.
  • RBF kernel of a support vector machine As the data used for learning the model, the expression values of 17 genes for the 79 training data used for the learning were used, and an optimal classification model was selected and produced through LOOCV (leave one out cross-validation).
  • the 2nd, 3rd, 4th, and 5th models are other cell senescence-related studies [Hernandez-Segura et al. 2017, Kiss et al. 2020, Park et al. 2021, Casella et al. 2019] was applied to the training data set to create an SVM model in the same way as the first model. Models 2, 3, 4, and 5 were constructed to compare performance of senescent cell sorting with the first model.
  • Classification assay was performed on 68 senescent fibroblast assay data (32 controls, 36 senescent cells) using the five models prepared in 4.2 above, and the results are shown in FIG. 21A.
  • 33 various senescent cell data control group: 15, senescent cell: 18, 33 different types other than fibroblasts (HUVEC, HAEC, MSC, LS8817, Ovcar3) using the two models created in 4.2.
  • the classification test was performed, and the results are shown in FIG. 21B.
  • Log 2 CPM values of the test data were tested after scaling based on the mean and standard deviation of the expression values of the training data.
  • 21 is a graph showing ROC curve results for performance evaluation of five cellular senescence classification models; a: assay data of one embodiment, b: additional various senescent cell data.
  • LASSO 17 gene model AUC: 100% Casella et al, model AUC: 100% > Hernandez et al, model AUC: 99.7% > Kiss et al, model AUC: 99.5% > Park et al, model AUC: 98%
  • Example 4 it was confirmed that the expression pattern of the 17 genes selected according to one embodiment showed a significant difference between the normal and senescent cell groups, the same as the coefficient sign pattern of LASSO. In addition, it was confirmed that the senescent cell classification model constructed with 17 genes showed the characteristics of cellular senescence better than the senescent cell classification model constructed with various cellular senescence-related genes known in previous studies.
  • the method according to one embodiment can select statistically more significant markers in various types of cells, including fibroblasts, and the 17 genes derived by the method according to one embodiment are senescent cells. It means that it can be usefully used to specify or detect.
  • Example 3 it was investigated whether the actual expression levels of the GAS2L3, AMOT, and WDR76 genes were changed in the senescence-induced cells.
  • Human umbilical vein endothelial cells Human Umbilical Vein Endothelial Cell, HUVEC cell, LONZA, HUVEC, C2519A
  • EGM2 LONZA, EGM-2 Endothelial Cell Growth Medium-2 BulletKit, CC-3162
  • Senescence was induced by varying the number of passages of cells. After culturing passage 3 (P3) and passage 7 (P7) HUVEC cells, SA ⁇ -Gal (senescence-associated beta-galactosidase, Cell Signaling, Senesence ⁇ -Galactosidase Staining Kit) was used to determine the degree of senescence of these cells according to passage. , #9860) staining was performed. The staining results are shown in FIG. 22 .
  • qPCR was performed using the cDNA obtained above to quantitatively compare the expression level. Specifically, the primers in Table 9 were used, and qPCR (quantitative PCR) reagents using SYBR green (Applied Biosystems, SYBR Green PCR Master Mix, 2109533) were used for qPCR, and real time PCR (Applied Biosystems, StepOne Real -time PCR System, 4376357) was used. The results of qPCR are shown in FIG. 24 .
  • the bands corresponding to GAS2L3, AMOT, and WDR76 appeared darker at P3 than at P7, indicating that the aged P7 cells showed lower expression of GAS2L3, AMOT, and WDR76 than P3 cells.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)

Abstract

기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법에 관한 것으로, 일 양상에 따른 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법에 의하면, 노화 세포 RNA-seq 데이터에 대한 메타분석을 진행하는 분석 파이프라인을 구축하여 충분한 샘플 수를 확보함으로써 통계적으로 보다 유의한 유전자들을 선별할 수 있고, 기계학습적 방법론을 통해 다양한 변수들 중에서 노화 세포 특징적 마커의 후보군을 찾아낼 수 있는 효과가 있다. 또한, 상기 방법에 의해 도출된 세포 노화의 마커는, 기존의 연구보다 다양한 종류의 세포들에도 세포 노화를 특정할 수 있는 더 유의한 유전자 시그니처로서, 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있을 뿐만 아니라, 세놀리틱 제제를 선별하는데 유용하게 사용될 수 있는 효과가 있다.

Description

기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법
기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법에 관한 것이다.
세포 노화(Cellular senescence)는 내/외부 자극에 의해 일어나는 세포의 영구적인 세포주기 정지를 의미한다. 세포 노화가 일어난 세포들은 노화 관련 분비표현형(SASP: Senescence Associated Secretory phenotype)을 분비하여 다양한 염증 반응을 일으키고, 그 결과 암을 포함한 나이와 연관된 질병들을 조절하는 것으로 알려져 있다. 이러한 노화 세포의 선택적 제거를 통해 다양한 질병들을 치료하려는 senolysis 기법이 최근 각광을 받고 있다. 실예로, 2020년 MIT가 선정한 10대 기술에 노화 세포 타겟 연구가 지정 되었다.
기존의 다양한 연구에서, 세놀리틱 약물을 처리한 마우스의 수명이 증가하고 나이와 연관된 질병들이 감소함이 확인되었다. 그러나 노화 세포의 이질적 특성으로 인해 노화 세포를 특이적으로 선별할 수 있는 마커가 부족한 상황이며 현재까지의 노화 세포 마커들은 노화 세포가 아닌 세포에서도 발현된다. 최근 미국 Mayo clinic에서 개발된 세놀리틱 약물을 포함한 소수의 약물들이 임상을 진행하였으나 대부분 또렷한 효과를 보이지 않거나 부작용이 나타나 진척이 없는 상황이다.
한편, 세포 노화는 노화가 일어나는 세포의 종류 및 노화를 유도하는 유도체의 종류에 따라 그 특성이 매우 다양하다고 알려져 있다. 그러나 이에 대한 개별적인 연구는 많이 진행되지 않은 상황이다. 따라서 노화 세포의 종류에 따른 분자적 특성을 파악하여 마커를 발굴하는 접근이 필요한 실정이다.
세포 노화는 텔로미어 감소에 의해 일어나는 replicative senescence, 종양유전자의 발현에 의해 유도되는 oncogene induced senescence, 질병의 치료 과정에서 drug 혹은 irradiation에 의해 일어나는 Therapy induced senescence 등 다양한 유도체에 의해 일어난다. 기존 연구들에 따르면 세포 노화는 유도체(inducer type)의 종류보다 세포의 종류에 따라 구별되는 특성이 더 강한 것으로 알려져 있으나, 세포 노화가 유도되는 유도체의 종류에 따라 노화 세포가 분비하는 물질의 상위 경로가 다르다는 보고가 존재하고, 기존 세포 노화 발현 연관 연구들의 경우 실험 당 샘플 수의 제한으로 인해 상대적으로 유의미한 유전자를 선별하지 못하는 단점들을 안고 있기 때문에 이러한 문제들을 보완하여 분석하는 방법이 필요한 실정이다.
일 양상은, 복수의 서로 다른 원인의 노화 세포군 및 대조군 세포의 RNA 시퀀싱 데이터를 포함하는 복수의 서로 다른 실험데이터를 획득하는 단계; 상기 획득된 복수의 서로 다른 실험데이터의 전사체(trasncriptome)를 분석 파이프라인을 통해 정량화하여 서로 다른 실험에서 파생되는 배치 효과(batch effect)를 감소시켜 배치-수정된(batch-corrected) 데이터를 획득하는 단계; 상기 배치-수정된 데이터 중 훈련 셋(training set) 내의 복수의 서로 다른 원인의 노화 세포군 각각에 대해 대조군 세포 대비 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 단계; 상기 선별된 유전자 중 복수의 서로 다른 원인의 노화 세포군에서 공통적으로 존재하는 유전자들 선별하는 단계; 및 상기 선별된 유전자의 발현 값을 독립변수로 하는 지도 학습(supervised learning)이 가능한 회귀 모델(regression model)을 이용하여 상기 선별된 유전자 중 세포 노화의 마커를 선별하는 단계를 포함하는 기계적 학습 방법을 이용한 세포 노화의 마커를 선별하는 방법을 제공한다.
다른 양상은 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
또 다른 양상은 상기 방법을 수행하는 세포 노화의 마커를 검출하는 장치를 제공한다.
또 다른 양상은 상기 방법에 의해 도출된 세포 노화의 마커를 제공한다.
또 다른 양상은 상기 방법에 의해 도출된 세포 노화의 마커를 이용하여 생성된 세포 노화 예측 모델을 제공한다.
또 다른 양상은 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물을 제공한다.
또 다른 양상은 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물을 제공한다.
또 다른 양상은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물을 제공한다.
또 다른 양상을 상기 조성물을 포함하는 세포 노화를 검출하기 위한 키트를 제공한다.
또 다른 양상은 분리된 생물학적 시료로부터 상기 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공한다.
또 다른 양상은 상기 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및 무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법을 제공한다.
일 양상은 세포 노화의 마커를 선별하는 방법을 제공하는 것이다.
본원에서 사용된 용어 "세포"는 개별 세포를 포함함을 의미할 뿐만 아니라, 그가 기원하는 특정한 조직 또는 기관을 의미할 수 있다.
상기 세포는 내피 세포, 평활근 세포, 대식 세포, 섬유아세포, 망막 색소 상피 세포, 다른 상피 세포(예를 들면, 폐 상피 세포 또는 신장 상피 세포), 면역 세포(예를 들면, 대식세포), 연골 세포, 또는 줄기세포(예를 들면, 중간엽줄기세포), 또는 신경 세포 (예를 들면, 뉴런)를 포함할 수 있다.
용어 "세포 노화(Cellular senescence)"는 세포 주기에서 나왔거나, 노화와 일치하는 후성유전적 마커를 나타내거나, 또는 노화 세포 마커 (예를 들어 노화-연관된 베타-갈락토시다제, 또는 염증성 시토카인)를 발현하는 세포를 의미할 수 있다. 세포 노화는 부분적인 또는 완전한 것일 수 있다.
용어 "후성유전체" 또는 "후성유전학"은 세포에서 핵산 (예를 들어, 조작된 핵산)의 발현 또는 게놈 정보를 제어하는 세포 내에서의 변형 및 구조적 변화를 지칭한다. 후성유전체에 대한 변화는 배아 발달, 질환 진행, 및 노화의 과정 동안에 발생하고 이를 유도한다.
용어 "후성유전적 시계"는 나이 추정기 또는 선천적인 생물학적 과정을 의미할 수 있다. 일부 실시양태에서, 나이 추정기는 후성유전적 나이 추정기이다. 예를 들어, 후성유전적 나이 추정기는 수학적 알고리즘과 조합하여 사용될 때 세포, 기관 또는 조직을 비롯한 DNA 공급원의 나이를 추정하기 위해 사용될 수 있는 CpG 디뉴클레오티드의 집합일 수 있다. 일부 실시양태에서, 나이 추정기는 DNA 메틸화-기반 (DNAm) 나이 추정기이다. 일부 실시양태에서, DNAm 나이 추정기는 DNA 메틸화-기반 (DNAm) 나이 (추정된 나이로도 공지됨)와 생활 나이 사이의 피어슨(Pearson) 상관 계수 r을 이용하여 나이 상관관계로서 계산될 수 있다. 일부 실시양태에서, DNA 메틸화-기반 (DNAm) 나이 추정기는 단일-조직 DNA 메틸화-기반 나이 추정기일 수 있다. 일부 실시양태에서, DNA 메틸화-기반 나이 추정기는 다중-조직 DNA 메틸화-기반 나이 추정기일 수 있다.
노화 세포는 하기의 7가지 특징들 중 임의의 하나 이상의 것을 나타낼 수 있다. (1) 노화 성장 정지는 본질적으로 영구적이고, 공지된 생리학적 자극에 의해 역전될 수 없다. (2) 노화 세포는 크기가 증가하고, 비노화 대응물의 크기와 비교하여 2배 초과로 확대되어 있다. (3) 노화 세포는 노화 관련 β갈락토시다제(SA-β를 발현하는데, 이는 부분적으로는 리소좀 질량의 증가를 반영한다. (4) 대부분의 노화 세포는 p16INK4a를 발현하는데, 이는 보편적으로는 휴지 또는 최종적으로 분화된 세포에 의해서는 발현되지 않는다. (5) 지속적인 DDR 신호전달에 따라 노화되는 세포는 노화를 강화시키는 크로마틴 변경이 있는 DNA 세그먼트(DNA-SCARS: DNA segments with chromatin alterations reinforcing senescence)로 명명되는, 지속적인 핵 포커스를 보유한다. 상기 포커스는 활성화된 DDR 단백질을 포함하고, 일시적인 손상 포커스와는 구별가능하다. DNA-SCARS는 기능장애 텔로미어 또는 텔로미어 기능장애 유도성 포커스(TIF: telomere dysfunction-induced foci)를 포함한다. (6) 노화 세포는 노화와 관련된 분자를 발현하고, 분비할 수 있으며, 이는 특정 경우에는 지속적인 DDR 신호전달의 존재하에서 관찰되고, 특정 경우에는 그의 발현을 위해 지속적인 DDR 신호전달에 의존할 수 있다. (7) 노화 세포의 핵은 구조 단백질, 예컨대, 라민(Lamin) B1 또는 크로마틴 결합 단백질, 예컨대, 히스톤 및 HMGB1이 없다. 예컨대, 문헌 [Freund et al., Mol. Biol. Cell 23:2066-75 (2012)]; [Davalos et al., J. Cell Biol. 201:613-29 (2013)]; [Ivanov et al., J. Cell Biol. DOI: 10.1083/jcb.201212110, page 1-15](2013년 7월 1일 온라인상에 공개); [Funayama et al., J. Cell Biol. 175:869-80 (2006)]을 참조할 수 있다.
노화 세포 및 노화 세포 관련 분자는 당업계에 기술된 기법 및 방법에 의해 검출될 수 있다. 예를 들어, 조직 중 노화 세포의 존재는 노화 마커, SA-베타 갈락토시다제(SA-β를 검출하는 조직화학법 또는 면역조직화학법에 의해 분석될 수 있다(예컨대, 문헌 [Dimri et al., Proc. Natl. Acad. Sci. USA 92: 9363-9367 (1995)] 참조). 노화 세포 관련 폴리펩티드 p16의 존재는 당업계에서 실시되는 다수의 면역화학 방법들 중 어느 하나, 예컨대, 면역블롯팅 분석에 의해 측정될 수 있다. 세포에서 p16 mRNA의 발현은 정량적 PCR을 비롯한, 당업계에서 실시되는 다양한 기법에 의해 측정될 수 있다. 노화 세포 관련 폴리펩티드(예컨대, SASP의 폴리펩티드)의 존재 및 수준은 자동 및 고처리량 검정법, 예컨대, 당업계에 기술되어 있는 자동 루미넥스(Luminex) 어레이 검정법을 사용하여 측정될 수 있다(예컨대, 문헌 [Coppe et al., PLoS Biol 6: 2853-68 (2008)] 참조).
본 명세서에서 용어 "마커(marker)"란 정상 세포군과 노화 세포군을 구분하여 특정할 수 있는 물질로, 본 발명의 노화 세포군에서 증가 또는 감소를 보이는 폴리펩티드, 단백질 또는 핵산, 유전자, 지질, 당지질, 당단백질 또는 당 등과 같은 유기 생체 분자들을 모두 포함한다.
도 1을 참조하여 설명하면, 상기 방법은 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 및 대조군 세포의 RNA 시퀀싱 데이터를 포함하는 복수의 서로 다른 실험데이터를 획득하는 단계(S10);
상기 획득된 복수의 서로 다른 실험데이터의 전사체(trasncriptome)를 분석 파이프라인을 통해 정량화하여 서로 다른 실험에서 파생되는 배치 효과(batch effect)를 감소시켜 배치-수정된(batch-corrected) 데이터를 획득하는 단계(S20);
상기 배치-수정된 데이터 중 훈련 셋(training set) 내의 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 각각에 대해 대조군 세포 대비 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 단계(S30);
상기 선별된 유전자 중 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군에서 공통적으로 존재하는 유전자들 선별하는 단계(S40); 및
상기 선별된 유전자의 발현 값을 독립변수로 하는 지도 학습(supervised learning)이 가능한 회귀 모델(regression model)을 이용하여 상기 선별된 유전자 중 세포 노화의 마커를 선별하는 단계(S50)를 포함할 수 있다.
일 구체예에 있어서, 상기 복수의 서로 다른 실험데이터는 노화 세포군 및 대조군 세포군(증식 세포군)을 포함하는 것일 수 있다. 상기 노화 세포군은 적어도 2개 이상의 서로 다른 노화 원인을 갖는 복수의 노화 세포군일 수 있다. 상기 노화 원인은 복제 노화(Replicative senescence), 종양유전자 유도 노화(Oncogene induced senescence) 및 치료 유도 노화(Therapy induced senescence)로 이루어진 군으로부터 선택된 어느 하나인 것일 수 있다. 예를 들면, 상기 실험데이터는 복제 노화 세포군, 종양유전자 유도 노화 세포군, 및 대조군 세포군을 포함할 수 있다. 또한, 상기 실험데이터는 복제 노화 세포군, 종양유전자 유도 노화 세포군, 치료 유도 노화 세포군 및 대조군 세포군을 포함할 수 있다. 상기 실험데이터 내의 각각의 세포군은 동일한 실험실 또는 서로 상이한 실험실로부터 유래된 것일 수 있다.
일 구체예에 있어서, 상기 실험데이터는 생물학적 샘플로부터 실험적으로 측정되거나, 공지된 문헌으로부터 획득하거나, 또는 데이터베이스(DB)에 저장된 데이터를 포함할 수 있다. 상기 데이터베이스는 NCBI(National Center for Biotechnology Information), Gene Expression Omnibus (GEO), European Bioinformatics Institute databases, 또는 European Nucleotide Archive를 포함할 수 있다. 상기 RNA 시퀀싱 데이터는 FASTQ 포맷의 형태로 구성된 것일 수 있다.
일 구체예에 있어서, 상기 획득된 복수의 서로 다른 실험데이터를 훈련 셋과 검정 셋으로 분류하는 단계를 더 포함할 수 있다. 상기 분류하는 단계는 상기 실험데이터를 획득하고 수행되거나, 배치-수정된 데이터를 획득하고 수행될 수 있다. 상기 훈련 셋과 검정 셋의 실험데이터는 소정의 비율(예를 들면, 약 90:10, 약 80:20, 약 75:25, 약 60:40, 약 50:50, 약 40:60, 약 25:75, 약 20:80, 또는 약 10:90)로 분류될 수 있다. 또한, 상기 훈련 셋과 검정 셋은 상기 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군과 대조군 각각을 모두 포함하는 것일 수 있다. 예를 들면, 상기 훈련 셋 또는 검정 셋은 복제 노화 세포군, 종양유전자 유도 노화 세포군, 및 대조군 세포군을 포함할 수 있다. 또한, 상기 훈련 셋 또는 검정 셋은 복제 노화 세포군, 종양유전자 유도 노화 세포군, 치료 유도 노화 세포군 및 대조군 세포군을 포함할 수 있다. 상기 훈련 셋 또는 검정 셋 내의 각각의 세포군은 동일한 실험실 또는 서로 상이한 실험실로부터 유래된 것일 수 있다.
일 구체예에 있어서, 상기 배치-수정된(batch-corrected) 데이터를 획득하는 단계는, 상기 RNA 시퀀싱 데이터를 Fastq 데이터로 구성하고, 상기 Fastq 데이터를 입력하는 단계; 상기 입력된 Fastq 데이터를 품질 관리(Quality control)하고 전처리(pre-processing)하여 클린 리드(clean reads)를 획득하는 단계; 상기 클린 리드를 대응되는 유전체 또는 전사체에 대해 정렬(alignment)시키는 단계; 및/또는 상기 클린 리드에 대응되는 유전체 또는 전사체의 전사물(transcript)을 조립(assembly)하는 단계; 상기 조립된 전사물을 정량화하는 단계를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 품질 관리는 FASTQ 프로그램, NGSQC 프로그램, 또는 RNA-SeQC 프로그램을 이용하여 수행되는 것일 수 있다. 상기 전처리하여 클린 리드를 획득하는 단계는 Trimmomatic, PRINSEQ, 또는 Soapnuke를 이용하여 수행되는 것일 수 있다. 상기 정렬시키는 단계는, Salmon, Ensemble, Tophat2, HISAT2, STAR, BWA, 또는 Bowtie를 이용하여 수행되는 것일 수 있다, 상기 전사물을 조립하는 단계는, Tximeta, Cufflinks, StringTie, Trinity, SOAPdenovoTrans, 또는 Trans-AByS를 이용하여 수행되는 것일 수 있다, 상기 정량화하는 단계는, limma FeatureCount, HTSeq-Count, Cufflinks, eXpress, RSEM, DEXSeq, Kallisto, Sailfish, 또는 Salmon을 이용하여 수행되는 것일 수 있다.
일 구체예에 있어서, 상기 배치-수정된 데이터 중 훈련 셋에 대해 모든 세포군에서 발현량이 유의적으로 낮은 유전자는 노화 마커 후보 유전자에서 제거하는 단계를 더 포함할 수 있다. 상기 발현량이 유의적으로 낮은 유전자의 제거는 edgeR 패키지를 통해 제거하는 것일 수 있다.
일 구체예에 있어서, 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 단계는 노화 세포군에서 대조군 대비 유전자의 발현량이 변화된 유전자들 중 유의 확률 p 값(probability value)이 0.05 이하이거나, 발현량의 변화량이 약 2배 이상 또는 약 1/2배 이하인 유전자를 선별하는 단계; 또는 상기 차별적으로 발현하는 유전자에 대해 GO(gene ontology) 분석을 수행하여 검증하는 단계를 더 포함하는 것일 수 있다. 상기 차별적으로 발현하는 유전자의 분석은 분석은 R package edgeR (v3.10)을 통해 진행되었으며 TMM 정상화 이후 샘플의 노화 상태 정보와 배치 정보에 따라 분석 디자인을 구축함으로써 수행되는 것일 수 있다.
일 구체예에 있어서, 상기 회귀 모델은 기계 학습 모델, 예를 들면, 지도-학습 모델을 포함하는 것일 수 있다. 일 실시예에 있어서, 상기 회귀 모델은 LASSO 모델, 선형 회귀 모델, 및/또는 다른 지도-학습 모델을 포함할 수 있다. 상기 회귀 모델의 독립변수(특징점)는 상기 선별된 유전자의 발현 값(TMM normalized Log2CPM (count per million))일 수 있고, 종속변수는 데이터의 상태가 대조군(proliferating control)인 경우 0, 노화군(senescent status)인 경우 1로 할당된 것일 수 있다.
또한, 상기 회귀 모델은 LOOCV(Leave one out cross validation)을 포함하는 것일 수 있다. 상기 LOOCV는 총 N(샘플 수 만큼)번의 모델을 만들고, 각 모델을 만들 때에 하나의 샘플만 제외하면서 그 제외한 샘플로 검정 셋의 퍼포먼스(test set performance)를 계산하여 N개의 퍼포먼스(performance)에 대해서 평균을 내는 방법을 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 방법은 상기 선별된 노화세포의 마커를 검정하는 단계를 더 포함하는 것일 수 있다.
상기 검정하는 단계는, (i) 상기 복수의 서로 다른 실험데이터의 적어도 일부를 검정 셋(test set)으로 하여 상기 검정 셋에서 훈련 셋과 동일한 방법으로 선별된 노화세포의 마커가 발현되는지 여부를 확인하는 단계; 및/또는 (ii) 상기 선별된 세포 노화의 마커를 훈련 셋에 적용하여 노화 예측 모델을 생성하고, 이를 이용하여 검정 셋에 대한 검정을 수행하는 단계를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 (ii) 단계는, 상기 획득한 복수의 서로 다른 실험데이터와 다른 경로로 획득된 세포 노화의 마커를 상기 훈련 셋에 적용하여 노화 예측 모델을 생성하고, 이를 이용하여 추가적인 검정 셋에 대한 검정을 수행하며, 상기 검정 결과를 상기 (ii) 단계의 검정 결과와 비교하는 단계를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 노화 예측 모델은 기계 학습 모델, 예를 들면, 지도-학습 모델을 포함하는 것일 수 있다. 일 실시예에 있어서, 상기 노화 예측모델은 서포트 벡터 머신을 통해 생성된 것일 수 있다.
상기 노화 예측 모델은, 선별된 유전자인 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자를 기계 학습 모델, 예를 들면, 서포트 벡터 머신을 통해 생성된 것일 수 있다.
상기 노화 예측 모델은, 선별된 유전자인 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자를 기계 학습 모델, 예를 들면, 서포트 벡터 머신을 통해 생성된 것일 수 있다.
상기 노화 예측 모델은, 선별된 유전자인 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자를 기계 학습 모델, 예를 들면, 서포트 벡터 머신을 통해 생성된 것일 수 있다.
본 명세서의 또 다른 양상은 상기 생성된 세포 노화 예측 모델을 제공하는 것이다.
다른 구체예에 있어서, 상기 방법은 각 단계에서 유전자를 선별하면서 검증하는 단계를 더 포함할 수 있다. 상기 선별된 유전자의 검증은 GO(Gene ontology) 분석, 주성분 분석 또는 클러스터링을 통해 수행되는 것일 수 있다.
또 다른 양상은, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
또 다른 양상은, 세포 노화의 마커를 검출하기 위한 장치를 제공하는 것이다.
상기 장치는, 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 및 대조군 세포의 RNA 시퀀싱 데이터를 포함하는 복수의 서로 다른 실험데이터를 획득하는 획득부;
상기 획득된 복수의 서로 다른 실험데이터의 전사체(trasncriptome)를 분석 파이프라인을 통해 정량화하여 서로 다른 실험에서 파생되는 배치 효과(batch effect)를 감소시켜 배치-수정된(batch-corrected) 데이터 획득부;
상기 배치-수정된 데이터 중 훈련 셋(training set) 내의 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 각각에 대해 대조군 세포 대비 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 제1 선별부;
상기 선별된 유전자 중 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군에서 공통적으로 존재하는 유전자들 선별하는 제2 선별부; 및
지도 학습(supervised learning)이 가능한 회귀 모델(regression model)을 이용하여 상기 선별된 유전자에 대해 세포 노화의 마커를 선별하는 제3 선별부를 포함할 수 있다.
또 다른 양상은, 세포 노화를 검출하기 위한 조성물을 제공하는 것이다.
상기 조성물은 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 것일 수 있다.
상기 조성물은 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 것일 수 있다.
상기 조성물은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 유전자의 발현 수준 측정은 생물학적 시료에서 유전자들의 mRNA 존재 여부와 발현 정도를 확인하는 과정으로 mRNA의 양을 측정하는 것을 포함할 수 있다. 이를 위한 분석 방법으로는 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR), 실시간 역전사 중합효소반응(Real-time RT-PCR), RNase 보호 분석법(RPA; RNase protection assay), 노던 블랏팅(Northern blotting), DNA 칩 등을 포함할 수 있다.
상기 유전자의 발현 수준을 측정할 수 있는 제제는 프라이머, 프로브 또는 안티센스 올리고뉴클레오티드를 포함할 수 있다. 상기 유전자들의 핵산 정보가 GeneBank 등에 알려져 있으므로 당업자는 상기 서열을 바탕으로 이들 유전자의 특정 영역을 특이적으로 증폭하는 프라이머 또는 프로브를 디자인할 수 있다.
본 명세서에서 사용된 용어 "프라이머"는 표적 유전자 서열을 인지하는 정방향 및 역방향의 프라이머로 이루어진 모든 조합의 프라이머쌍을 포함하고, 상세하게는 특이성 및 민감성을 가지는 분석 결과를 제공하는 프라이머 쌍이다.
본 명세서에서 사용된 용어 "프로브"란 시료 내의 검출하고자 하는 표적 물질과 특이적으로 결합할 수 있는 물질을 의미하며, 상기 결합을 통하여 특이적으로 시료 내의 표적 물질의 존재를 확인할 수 있는 물질을 의미한다. 프로브 분자의 종류는 당업계에서 통상적으로 사용되는 물질로서 제한은 없으나, 바람직하게는 PNA (peptide nucleic acid), LNA (locked nucleic acid), 펩타이드, 폴리펩타이드, 단백질, RNA 또는 DNA 일 수 있다. 보다 구체적으로, 상기 프로브는 바이오 물질로서 생물에서 유래되거나 이와 유사한 것 또는 생체외에서 제조된 것을 포함하는 것으로 예를 들어, 효소, 단백질, 항체, 미생물, 동식물 세포 및 기관, 신경세포, DNA, 및 RNA일 수 있으며, DNA는 cDNA, 게놈 DNA, 올리고뉴클레오타이드를 포함하며, RNA는 게놈 RNA, mRNA, 올리고뉴클레오타이드를 포함하며, 단백질의 예로는 항체, 항원, 효소, 펩타이드 등을 포함할 수 있다.
본 명세서에서 용어, "안티센스 올리고뉴클레오티드"는 특정 유전자(예를 들면, 특정 유전자의 mRNA)의 서열에 상보적인 핵산 서열을 함유하고 있는 DNA 또는 RNA 또는 이들의 유도체로서, mRNA 내의 상보적인 서열에 결합하여 mRNA의 단백질로의 번역을 저해하는 작용을 한다. 안티센스 올리고뉴클레오티드 서열은 상기 유전자들의 mRNA에 상보적이고 상기 mRNA에 결합할 수 있는 DNA 또는 RNA 서열을 의미한다. 이는 상기 유전자 mRNA의 번역, 세포질 내로의 전위(translocation), 성숙(maturation) 또는 다른 모든 전체적인 생물학적 기능에 대한 필수적인 활성을 저해할 수 있다. 안티센스 올리고뉴클레오티드의 길이는 6 내지 100 염기, 바람직하게는 8 내지 60 염기, 보다 바람직하게는 10 내지 40 염기일 수 있다.
일 구체예에 있어서, 상기 단백질의 발현 또는 활성 수준 측정은 생물학적 시료에서 상기 단백질의 존재 여부와 발현(또는 활성) 정도를 확인하는 과정을 포함할 수 있다. 이를 위한 분석 방법으로는 단백질 칩 분석, 면역측정법, 리간드 바인딩 어세이, MALDI-TOF(Matrix Desorption/Ionization Time of Flight Mass Spectrometry)분석, SELDI-TOF(Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry)분석, 방사선 면역분석, 방사 면역 확산법, 오우크테로니 면역 확산법, 로케트 면역전기영동, 조직면역 염색, 보체 고정 분석법, 2차원 전기영동 분석, 액상 크로마토그래피-질량분석(liquid chromatography-Mass Spectrometry, LC-MS), LC-MS/MS(liquid chromatography-Mass Spectrometry/ Mass Spectrometry), 웨스턴 블랏, 및 ELISA(enzyme linked immunosorbentassay) 등을 포함할 수 있다.
상기 단백질의 활성 수준을 측정할 수 있는 제제는 항체, 앱타머, 아비머(avidity multimer) 또는 페티도모방체(peptidomimerics)를 포함하는 것일 수 있다.
본 명세서에서 사용된 용어 "항체"는 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미할 수 있다. 본 발명의 목적상, 항체는 상기 에스트로겐 수용체, MUCIN5AC, 또는 아로마타제 단백질에 대해 특이적으로 결합하는 항체를 의미하며, 다클론 항체, 단클론 항체 및 재조합 항체를 모두 포함한다. 항체를 생성하는 것은 당업계에 널리 공지된 기술을 이용하여 용이하게 제조할 수 있다. 또한 본 명세서의 항체는 2개의 전체 길이의 경쇄 및 2개의 전체 길이의 중쇄를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체분자의 기능적인 단편이란 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab') 2 및 Fv 등이 있다.
또 다른 양상은, RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 키트를 제공하는 것이다.
또 다른 양상은, EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 키트를 제공하는 것이다.
또 다른 양상은, GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 키트를 제공하는 것이다.
일 구체예에 있어서, 상기 키트는 RT-PCR(Reverse transcription polymerase chain reaction) 키트, DNA 칩 키트, 마이크로어레이 키트, ELISA(Enzyme-linked immunosorbent assay) 키트, 단백질 칩 키트, 래피드(rapid) 키트 또는 MRM(Multiple reaction monitoring) 키트일 수 있다.
또한, 상기 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치를 더 포함하여 구성될 수 있다. 예를 들면, 상기 키트는 역전사 중합효소반응을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. 역전사 중합효소반응 키트는 마커 유전자에 대한 특이적인 각각의 프라이머 쌍을 포함한다. 프라이머는 상기 각 유전자의 핵산서열에 특이적인 서열을 가지는 뉴클레오타이드로서, 약 7 bp 내지 50 bp의 길이, 보다 바람직하게는 약 10 bp 내지 30 bp 의 길이이다. 또한 대조군 유전자의 핵산 서열에 특이적인 프라이머를 포함할 수 있다. 그외 역전사 중합효소반응 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNAse, RNAse 억제제 DEPC-수(DEPC-water), 멸균수등을 포함할 수 있다. 또한, 예를 들면, DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드(oligonucleotide)가 부착되어 있는 기판, 및 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한 기판은 대조군 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드를 포함할 수 있다. 또한, 예를 들면, 상기 키트는 LISA를 수행하기 위해 필요한 필수 요소를 포함하는 진단 키트일 수 있다. ELISA 키트는 상기 단백질에 대한 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다. 또한 ELISA 키트는 대조군 단백질에 특이적인 항체를 포함할 수 있다. 그 외 ELISA 키트는 결합된 항체를 검출할 수 있는 시약, 예를 들면, 표지된 2차 항체, 발색단(chromophores), 효소(예: 항체와 컨주게이트됨) 및 그의 기질 또는 항체와 결합할 수 있는 다른 물질 등을 포함할 수 있다. 또한, 예를 들면, 상기 키트는 분석결과를 알 수 있는 신속한 테스트를 수행하기 위해 필요한 필수 요소를 포함하는 래피드(rapid) 키트 일 수 있다. 래피드 키트는 단백질에 대한 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다. 또한 래피드 키트는 대조군 단백질에 특이적인 항체를 포함할 수 있다. 그 외 래피드 키트는 결합된 항체를 검출할 수 있는 시약, 예를 들면, 특이항체와 2차 항체가 고정된 나이트로 셀룰로오스 멤브레인, 항체가 결합된 비드에 결합된 멤브레인, 흡수패드와 샘플 패드 등 다른 물질 등을 포함할 수 있다. 또한, 예를 들면, 상기 키트는 질량 분석을 수행하기 위해 필요한 필수 요소를 포함하는 MS/MS 모드인 MRM(Multiple reaction monitoring) 키트일 수 있다. SIM(Selected Ion Monitoring)이 질량분석기의 소스 부분에서 한 번 충돌하여 생긴 이온을 이용하는 방법인 반면, MRM은 상기 한 번 깨진 이온 중에서 특정 이온을 한 번 더 선택하여 연속적으로 연결된 또 다른 MS의 소스를 한 번 더 통과시켜 충돌시킨 후 이 중에서 얻은 이온들을 이용하는 방법이다. 상기 MRM(Multiple reaction monitoring) 분석 방법들을 통하여, 정상 대조군의 단백질 발현 수준과 노화 세포군의 단백질 발현 수준을 비교할 수 있고, 또한, 마커 유전자에서 단백질로의 유의한 발현량 증감여부를 판단하여, 노화 세포군 여부를 판단할 수 있다.
또 다른 양상은 분리된 생물학적 시료로부터 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2,및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공하는 것이다.
일 구체예에 있어서, 상기 방법은 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 것일 수 있다.
또 다른 양상은 분리된 생물학적 시료로부터 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공하는 것이다.
일 구체예에 있어서, 상기 방법은 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 것일 수 있다.
또 다른 양상은 분리된 생물학적 시료로부터 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공하는 것이다.
일 구체예에 있어서, 상기 방법은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 유전자의 발현 수준을 측정하는 방법은 역전사 중합효소반응, 경쟁적 역전사 중합효소반응, 실시간 역전사 중합효소반응, RNase 보호 분석법, 노던 블랏팅 또는 DNA 칩을 포함할 수 있다.
일 구체예에 있어서, 상기 단백질의 활성 수준을 측정하는 방법은 웨스턴 블랏팅, ELISA, 방사선 면역분석법, 방사선 면역확 산법, 오우크테로니 (Ouchterlony) 면역확산법, 로케트 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고 정분석, FACS 또는 단백질 칩을 포함할 수 있다.
또 다른 양상은 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및
무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법을 제공하는 것이다.
일 구체예에 있어서, 상기 방법은 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 것일 수 있다.
또 다른 양상은 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및
무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법을 제공하는 것이다.
일 구체예에 있어서, 상기 방법은 상기 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 것일 수 있다.
또 다른 양상은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및
무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법을 제공하는 것이다.
일 구체예에 있어서, 상기 방법은 상기 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 것일 수 있다.
상기 피검 물질, 예를 들면, 약물 후보 물질, 피검 화합물 또는 피검 조성물은 저분자 화합물, 항체, 안티센스 뉴클레오티드, 작은 간섭 RNA(short interfering RNA), 짧은 헤어핀 RNA(short hairpin RNA), 핵산, 단백질, 펩티드, 기타 추출물 또는 천연물을 포함할 수 있다.
상기 접촉은 시험관 내(in vitro)에서 수행되는 것일 수 있다. 예를 들면, 상기 유전자 또는 단백질들을 발현하는 또는 낙아웃된 벡터를 세포에 형질전환 하는 단계; 상기 형질전환된 세포에 약물 후보물질을 처리하는 단계를 포함할 수 있다.
상기 세놀리틱 약물은 임상적으로 유의적이거나, 또는 생물학적으로 유의적인 방식으로 노화 세포를 선택적으로(우선적으로 또는 더욱 큰 정도로) 사멸 또는 파괴시키는 데 사용될 수 있는 제제를 의미할 수 있다. 상기 세놀리틱 제제는 노화 세포(예컨대, 노화 지방 전구 세포, 노화 내피 세포, 노화 섬유아세포, 노화 뉴런, 노화 상피 세포, 노화 중간엽 세포, 노화 평활근 세포, 노화 대식세포, 또는 노화 연골 세포) 중 하나 이상의 유형을 선택적으로 사멸시킬 수 있는 제제를 포함할 수 있다.
일 양상에 따른 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법에 의하면, 노화 세포 RNA-seq 데이터에 대한 메타분석을 진행하는 분석 파이프라인을 구축하여 충분한 샘플 수를 확보함으로써 통계적으로 보다 유의한 유전자들을 선별할 수 있고, 기계학습적 방법론을 통해 다양한 변수들 중에서 노화 세포 특징적 마커의 후보군을 찾아낼 수 있는 효과가 있다.
상기 방법에 의해 도출된 세포 노화의 마커는, 기존의 연구보다 다양한 종류의 세포들에도 세포 노화를 특정할 수 있는 더 유의한 유전자 시그니처로서, 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있을 뿐만 아니라, 세놀리틱 제제를 선별하는데 유용하게 사용될 수 있는 효과가 있다.
도 1은 일 구체예에 따른 세포 노화의 마커를 검출하는 방법을 나타낸 흐름도이다.
도 2에 일 실시예에 따른 세포 노화의 바이오 마커를 선별하기 위한 모식도이다.
도 3은 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.
도 4는 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 5는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 6은 선별된 공통 발현 유전자의 GO 분석 결과를 나타낸 도면이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 7은 선별된 공통 발현 유전자 363개에 대한 PCA 분석 결과를 나타낸 도면이다.
도 8은 선별된 공통 발현 유전자 363개에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 9는 LASSO에 의해 선별된 15개 유전자의 각 계수(Coefficient) 값을 Barplot으로 나타낸 도면이다.
도 10은 LASSO에 의해 선별된 유전자 15개에 대한 PCA 분석 결과를 나타낸 도면이다.
도 11은 LASSO에 의해 선별된 유전자 15개에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 12는 검정 셋 데이터(n=84)에서의 LASSO 선별 15개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 6개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.
도 13은 두 개의 세포 노화 분류 모델의 성능 평가를 위한 ROC 커브 결과를 나타낸 그래프이다; a: 일 구체예의 검정 데이터, b: 추가적인 다양한 노화 세포 데이터.
도 14는 재선별된 샘플 전체(n=147)에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.
도 15는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 16은 선별된 공통 발현 유전자의 GO 분석 결과를 나타낸 도면이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 17은 LASSO에 의해 선별된 17개 유전자의 각 계수(Coefficient) 값을 Barplot으로 나타낸 도면이다.
도 18은 LASSO에 의해 선별된 유전자 17개에 대한 PCA 분석 결과를 나타낸 도면이다.
도 19는 LASSO에 의해 선별된 유전자 17개에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 20은 검정 셋 데이터(n=68)에서의 LASSO 선별 17개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 8개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.
도 21은 다섯 개의 세포 노화 분류 모델의 성능 평가를 위한 ROC 커브 결과를 나타낸 그래프이다; a: 일 구체예의 검정 데이터, b: 추가적인 다양한 노화 세포 데이터.
도 22는 HUVEC 세포를 계대배양하여 노화시킨 후, 노화여부를 SA β-Gal 염색을 통해 확인한 결과이다.
도 23는 노화 유도 세포에서 GAS2L3, AMOT 및 WDR76의 발현량 감소를 RT-PCR 및 전기영동을 통해 확인한 결과이다.
도 24는 노화 유도 세포에서 GAS2L3, AMOT 및 WDR76의 발현량 감소를 qPCR을 통해 정량적으로 확인한 결과이다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1. 세포 노화의 바이오마커 규명
도 2에 일 실시예에 따른 세포 노화의 바이오 마커를 선별하기 위한 모식도를 나타내었다.
구체적으로 하기와 같다.
1.1 데이터 셋 준비 및 분석
노화 세포 관련 마커를 규명하기 위해 ENA (European Nucleotide Archive) 공공 데이터베이스 (http://www.ebi.ac.uk/ena/browser/home) 에서 RNA-seq 데이터를 이용하였다.
노화 세포의 RNA-seq 발현 데이터 셋을 포함하는 13개의 서로 다른 실험 데이터 (GSE63577, GSE72407, GSE113060, GSE70668, GSE132370, GSE130727, GSE98440, GSE109700, GSE130306, GSE94395, GSE168994, GSE72404, GSE75643)를 선정하고, 다양한 유도체(inducer type)에 의해 일어난 섬유아세포 (BJ, HFF, IMR-90, WI-38, LF1, TIG3) 데이터 및 이에 해당하는 대조군 데이터들을 Fastq 포맷으로 다운로드 하였다. 데이터는 대조군 73개, 실험군 92개의 총 165개 샘플로 구성하였으며, 각 데이터들의 특성을 노화 세포가 유도된 유도체(Replicative senescence, Oncogene induced senescence(OIS), Therapy induced senescence(TIS))별로 정리하였다. 또한, 추후 분석을 통해 최종적으로 선별된 유전자들을 검증하기 위해, 각 GSE별로 훈련 셋과 검정 셋을 할당하였다. 데이터 관련 논문들을 참고하여 훈련 데이터 및 모델 검정을 위한 검정 데이터를 약 5:5의 비율로 할당하였다. 각 데이터들은 모두 Illumina Hiseq 플랫폼으로 생성된 Fastq 데이터들로 구성되어 있으며, 데이터 특성 정보를 하기 표 1에 나타내었다.
샘플 정보
GSE number 샘플의 수
(대조군 : 노화 세포군)
세포노화 종류
(Inducer types)
세포의 기원 카테고리
(Tr(훈련 셋)/Te(검정 셋)
GSE63577 23 (12 : 11) Replicative BJ, HFF, IMR90, WI38 Tr
GSE72407 22 (8 : 14) OIS, TIS IMR90 Tr
GSE113060 10 (5 : 5) OIS IMR90 Tr
GSE70668 6 (3 : 3) OIS IMR90 Tr
GSE132370 6 (3 : 3) TIS IMR90 Tr
GSE130727 26 (12 : 14) Replicative, TIS, OIS IMR90, WI38 Tr/Te
GSE98440 8 (4 : 4) Replicative IMR90 Te
GSE109700 9 (3 : 6) Replicative LF1 Te
GSE130306 6 (3 : 3) Replicative WI38 Te
GSE94395 6 (3 : 3) TIS IMR90 Te
GSE168994 4 (2 : 2) TIS IMR90 Te
GSE72404 24 (6 : 18) OIS IMR90 Te
GSE75643 15 (9 : 6) OIS TIG3 Te
Total 165 (73 : 92) - -  
아울러, 훈련 셋 및 검정 셋의 분할 정보는 하기 표 2에 나타내었다.
샘플 카테고리 대조군 RS OIS TIS Total
훈련 셋 37 13 17 14 81
검정 셋 36 15 24 9 84
Total 73 28 41 23 165
훈련 셋과 검정 셋의 비율은 50:50으로 분할하였으며, 훈련 셋과 검증 셋 내에 특정 유도체 데이터가 편향되어 분포하지 않도록 대략적으로 일정한 비율로 존재하도록 하였다.
1.2 데이터 전처리 및 메타분석
실시예 1.1의 Fastq 파일들을 동일한 파이프라인을 통해 정량화하여, 서로 다른 실험에서 파생되는 배치효과 (Batch effect)를 최소화하고자 SALMON 파이프라인을 제작하여 분석하였다. SALMON 파이프라인은 도 2에 개시된 바와 같이, QC (fastQC, v0.11.9), Trimming (Trimmomatics, v0.39), Mapping (SALMON, v1.10), Raw count quantification (tximeta, v1.4.5), Batch correction (limma, v3.42.2) 단계로 구성되어 있다 (Tximeta 및 limma는 R program v3.6.3 내에서 분석되었음).
1.3 탐색적 자료분석 (Exploratory data analysis)
각각의 GSE별 발현 데이터에 대해 TMM normalization & Log2CPM (count per million) 정규화 이후 limma (v3.42.2)의 removeBatchEffect function을 이용하여 배치 효과를 확인하였다. 이후에, Batch-corrected, TMM normalized log2CPM 값을 이용하여 발현 데이터를 분석하였고, 샘플 전체에 걸쳐 발현량이 낮은 유전자들을 edgeR 패키지를 통해 제거하고, 약 14,000개의 유전자만을 사용하여 분석하였다. 상기 약 14,000개의 유전자에 대해 PCA (Principal component analysis) 분석을 진행하였고, Spearman correlation을 통해 PCA 및 클러스터링 결과를 각각 도 3 및 도 4에 나타내었다.
도 3은 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.
도 4는 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 클러스터링 분석 결과를 나타낸 도면이다.
1.4 차별발현 유전자 분석 (Differentially expressed genes analysis, DEG analysis)
훈련 데이터 중 유도체별로 분류된 샘플 그룹 각각에 대해, 정상 세포 그룹 대비 노화 세포 그룹에서 발현량이 증가 혹은 감소한 유전자들을 선별하기 위해 차별발현 유전자 분석을 진행하였다. 분석은 R package edgeR (v3.10)을 통해 진행되었으며 TMM normalization 이후 샘플의 노화 상태 정보와 배치 정보에 따라 분석 디자인을 구축하였다. 여러 번 가설 검정시 발생하는 multiple comparison 문제를 해결하기 위해 조정된 p값(adjusted p-values)을 계산하였고, 발현량이 변화된 유전자들 중 조정된 p값이 0.05 이하인 기준을 만족하면서, 동시에 발현값의 변화량(fold change)이 2배 이상(up-regulated) 혹은 1/2배 이하(down-regulated)인 유전자들만을 선별하였다. 각각의 유도체(inducer type)별로 살펴보면, RS에서 총 1,444개의 유전자(up-regulated genes : 877, down-regulated genes : 567)가, OIS에서 총 1,647개의 유전자(up-regulated genes : 602, down-regulated genes : 1,045), TIS에서 총 1,405개의 유전자(up-regulated genes : 802, down-regulated genes : 603)가 차별발현 유전자로 선별되었고, 이를 하기 표 3에 나타내었다.
차별발현 유전자 분석 정보
Inducer type Comparison
(Control : Senescent)
Up-regulated genes Down-regulated genes Total DEGs
RS 13 : 13 877 567 1,444
OIS 16 : 17 602 1,045 1,647
TIS 14 : 14 802 603 1,405
유도체(inducer type)별 차별발현유전자(DEG) 중 유도체의 종류와 무관하게 발현되는 세포 노화의 특징적 유전자를 선별하기 위해 유도체별 DEG 결과를 up-regulated gene과 down-regulated gene으로 나눈 후, 벤다이어그램으로 각각 나타내어 유전자의 교집합을 선별하였다. 상기 벤다이어그램은 도 5에 나타내었다. 도 5는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 5에 나타낸 바와 같이, 총 85개의 up-regulated gene과 278개의 down-regulated gene의 총 363개의 유전자가 선별되었고, 이 유전자들은 유도체의 종류와 무관하게 노화 세포에서 발현되고 있음을 의미한다.
이후에, 선별된 공통 발현 유전자들이 세포 노화적 특성을 반영하는 유전자 세트인지 확인하기 위해, gProfiler (https://biit.cs.ut.ee/gprofiler/)를 활용하여 GO(gene ontology) 분석을 시행하여 363개의 유전자와 관련있는 생물학적 경로들을 탐색하였다. 유전자들의 발현 증감 방향성에 따라 각각 GO 분석을 진행하였고, GO 결과는 조정된 p-value 값이 0.05 이하인 결과만을 선별하였으며, 그 결과를 도 6에 나타내었다.
도 6은 선별된 공통 발현 유전자의 GO 분석 결과를 나타낸 도면이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 6에 나타낸 바와 같이, 노화 세포에서 발현이 공통적으로 증가한 85개의 유전자는 세포 노화의 알려진 특징인 DNA-damage response, SASP(Senescence associated secretory phenotype), Inhibition of DNA recombination at telomere, Immune response 및 여러가지 Cellular senescence pathway 관련 특성들이 유의미하게 나타남을 확인할 수 있었다. 또한, 노화 세포에서 발현이 공통적으로 감소한 278개 유전자의 경우 마찬가지로 이미 알려진 세포 노화의 특성에 해당하는 cell cycle 과 관련된 생물학적 경로들 및 DNA replication, DNA repair, telomere maintenance, chromosome organization 및 segregation 과 연관이 있음을 확인하였다. 이를 통해 전체 363개의 교집합 유전자 세트가 세포 노화의 특성을 잘 반영함을 확인할 수 있었다.
다음으로, 상기 선별된 공통 발현 유전자 363개를 이용하여 1.3.과 동일하게 PCA 분석 및 클러스터링 분석을 진행하였고, 그 결과를 각각 도 7 및 도 8에 나타내었다.
도 7은 선별된 공통 발현 유전자 363개에 대한 PCA 분석 결과를 나타낸 도면이다.
도 8은 선별된 공통 발현 유전자 363개에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 7에 나타낸 바와 같이, 선별된 공통 발현 유전자 363개의 PCA 결과는 도 3의 약 14,000개의 유전자의 PCA 결과에 비해 PC1에 의한 데이터의 분류가 더 잘 설명되나, 노화 세포와 대조군 데이터를 명확하게 구분하지 못함을 알 수 있었다.
도 8에 나타낸 바와 같이, 선별된 공통 발현 유전자 363개의 클러스터링 결과는 도 4의 약 14,000개의 유전자의 클러스터링 결과와 비교하여 유전자들의 발현 패턴이 노화 세포와 대조군 사이에서 구별되지만 노화 세포와 대조군 데이터를 명확하게 구분하지는 못함을 알 수 있었다.
1.5 LASSO (least absolute shrinkage and selection operator)를 이용한 변수 선택
선별된 363개의 유전자 중 세포 노화의 특성을 가장 잘 나타내는 최소한의 유전자를 선별하고자 LASSO 회귀를 통해 유전자에 대한 변수 선택 과정을 진행하였다.
구체적으로, LASSO 회귀는 R package glmnet 4.0-2를 통해 진행되었고, 훈련 데이터 총 81개 데이터 셋의 TMM normalized Log2CPM (count per million) 값을 사용하여 샘플의 상태에 따라 Control(=0) 혹은 Senescent(=1) 값을 할당한 후 binary classification 모델에 대한 파라미터 조정을 진행하여 선별된 결과값이다. Leave-one-out-cross-validation을 통해 최적의 lambda (λ값 0.006)을 설정한 후 모델을 적합하여 최종적으로 15개의 유전자를 선별하였다. 해당 유전자는 ENSG00000048392(RRM2B), ENSG00000139318(DUSP6), ENSG00000186088(GSAP), ENSG00000151320(AKAP6), ENSG00000228486(C2orf92), ENSG00000285901(AC008012.1), ENSG00000013297(CLDN11), ENSG00000198830(HMGN2), ENSG00000159259 (CHAF1B), ENSG00000003096(KLHL13), ENSG00000213347(MXD3), ENSG00000158321(AUTS2), ENSG00000166833(NAV2), ENSG00000010292(NCAPD2), ENSG00000176894(PXMP2) 이며, 각 유전자들의 계수(coefficient)를 통해 세포 노화에서의 해당 유전자의 발현 방향성(+/-) 및 영향력을 나타낸다. 총 6개의 유전자 (RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1)는 양의 계수를 지니므로 노화 세포에서 발현이 증가한 것이고, 나머지 9개의 유전자 (CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, PXMP2)는 음의 계수를 지니므로 노화 세포에서의 발현이 감소한 것이다.
상기 LASSO 회귀를 통해 유전자에 대한 변수 선택 과정을 진행한 결과는 하기 표 4 및 도 9에 나타내었다.
LASSO 회귀를 통해 선별된 세포 노화 특징 유전자
Ensembl gene id SYMBOL Coefficient Description
ENSG00000048392 RRM2B 1.85 Ribonucleotide Reductase Regulatory TP53 Inducible Subunit M2B
ENSG00000139318 DUSP6 0.45 Dual Specificity Phosphatase 6
ENSG00000186088 GSAP 0.45 Gamma-Secretase Activating Protein
ENSG00000151320 AKAP6 0.28 A-Kinase Anchoring Protein 6
ENSG00000228486 C2orf92 0.16 Chromosome 2 Open Reading Frame 92
ENSG00000285901 AC008012.1 0.13 Novel Transcript
ENSG00000013297 CLDN11 -0.02 Claudin 11
ENSG00000198830 HMGN2 -0.03 High Mobility Group Nucleosomal Binding Domain 2
ENSG00000159259 CHAF1B -0.14 Chromatin Assembly Factor 1 Subunit B
ENSG00000003096 KLHL13 -0.26 Kelch Like Family Member 13
ENSG00000213347 MXD3 -0.32 MAX Dimerization Protein 3
ENSG00000158321 AUTS2 -0.41 Activator Of Transcription And Developmental Regulator AUTS2
ENSG00000166833 NAV2 -0.51 Neuron Navigator 2
ENSG00000010292 NCAPD2 -0.94 Non-SMC Condensin I Complex Subunit D2
ENSG00000176894 PXMP2 -1.19 Peroxisomal Membrane Protein 2
도 9는 LASSO에 의해 선별된 15개 유전자의 각 계수(Coefficient) 값을 Barplot으로 나타낸 도면이다.
이후에, 81개의 훈련 셋 데이터에 대해 LASSO에 의해 선별된 15개의 유전자를 이용하여 상기 1.3.과 동일하게 PCA 및 클러스터링 분석을 진행하였고, 그 결과를 각각 도 10 및 도 11에 나타내었다.
도 10은 LASSO에 의해 선별된 유전자 15개에 대한 PCA 분석 결과를 나타낸 도면이다.
도 11은 LASSO에 의해 선별된 유전자 15개에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 10에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 15개의 PCA 결과는 도 3 및 도 7의 PCA 결과와 비교하여, PC1에 의해 노화 세포와 대조군 데이터가 명확하게 구분되는 것을 확인 할 수 있으며 PC1의 데이터 구분에 대한 설명도 증가하였음을 알 수 있었다.
도 11에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 15개의 클러스터링 결과는 도 4 및 도 8의 클러스터링 결과와 비교하여 유전자들의 발현 패턴이 노화 세포와 대조군 사이에서 명확하게 구별되며, 노화 세포와 대조군 데이터를 명확하게 구분함을 알 수 있었다.
이상의 결과는 LASSO에 의해 선별된 15개의 유전자는 훈련 셋 데이터 내에서 노화 세포의 특성을 잘 반영함을 나타냄을 의미한다.
실시예 2. 선별된 노화 세포 마커 후보 유전자들의 검정
2.1 검정 데이터에서의 대조군 그룹 및 세포 노화 그룹간 유전자 발현 차이 확인
실시예 1에서 선정된 15개의 노화 세포 마커 후보 유전자들의 발현 패턴이 15개 유전자의 선별 과정에 관여하지 않은 84개의 검정 데이터 내에서도 유의미한 발현 차이를 보이는지 확인하였다.
구체적으로, 84개의 검정 데이터에 대해 훈련 데이터와 동일한 과정으로 TMM 정규화 및 limma removeBatchEffect function을 통해 배치 효과를 제거한 후 Log2CPM 변환 값을 이용하여 대조군 그룹(n = 36)과 노화세포 그룹(n = 48) 사이에서 15개 유전자의 발현에 유의미한 차이가 존재하는지 확인하였고, 그 결과를 도 12에 나타내었다.
도 12는 검정 셋 데이터(n=84)에서의 LASSO 선별 15개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 6개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.
2.2 세포 노화 예측 모델 제작
15개의 선별된 유전자들을 훈련 데이터 셋에 적용하여 노화 세포의 상태를 예측하는 2 개의 모델을 제작하여 선별된 유전자들의 유효성을 검증하였다.
구체적으로, 제1 모델은 서포트 벡터 머신(Support vector machine)의 RBF kernel을 통해 제작하였으며, R package e1071 (version 1.7-3)이 사용되었다. 모델의 학습에 사용된 데이터는 상기 학습에 사용된 81개의 훈련 데이터에 대한 15개 유전자의 발현값이 사용되었으며, LOOCV (leave one out cross-validation)을 통해 최적의 분류 모델을 선택하여 제작하였다. 제2 모델은 타 세포 노화 관련 연구 문헌 (Hernandez-Segura et al. 2017) 에서 선정된 55개의 세포 노화 유전자의 발현 값을 훈련 데이터 셋에 적용하여 제1 모델과 동일한 방식으로 SVM 모델을 제작하였다. 제2 모델은 제1 모델과 노화 세포 분류 성능을 비교하기 위해 제작하였다.
2.3 세포 노화 예측 모델 성능 평가
상기 2.2에서 제작한 두 개의 모델을 이용하여 84개의 노화 섬유아세포 검정 데이터 (대조군 36개, 노화 세포 48개)에 대해 분류 검정을 진행하였고, 그 결과를 도 13A에 나타내었다. 추가로 상기 2.2.에서 제작한 두 개의 모델을 이용하여 42개의 다양한 노화 세포 데이터 (대조군 : 18, 노화 세포 : 24, 섬유아세포가 아닌 42개의 서로 다른 종류 (HUVEC, HAEC, MSC, LS8817, Ovcar3))에 대해 분류 검정을 진행하였고, 그 결과를 도 13B에 나타내었다. 검정 데이터의 Log2CPM 값들은 훈련 데이터의 발현 값의 평균 및 표준편차를 기준으로 스케일링 후 검정 하였다.
도 13은 두 개의 세포 노화 분류 모델의 성능 평가를 위한 ROC 커브 결과를 나타낸 그래프이다; a: 일 구체예의 검정 데이터, b: 추가적인 다양한 노화 세포 데이터.
도 13에 나타낸 바와 같이, 두 결과 모두에서 LASSO에 의해 선정된 15개의 유전자 모델이 더 좋은 성능을 보이는 것을 확인 할 수 있었다.
a: LASSO 15 gene model AUC: 98.9% > Hernandez et al, 55 genes model AUC: 97.6%
b: LASSO 15 gene model AUC: 86.6% > Hernandez et al, 55 genes model AUC: 75.9%
따라서 실시예 2의 결과들을 토대로, 일 구체예에 따라 선별된 15개의 유전자의 발현 양상이 LASSO의 계수 부호 양상과 동일하게, 정상 세포와 노화 세포 그룹간 유의미한 차이를 보이는 것을 확인할 수 있었다. 또한, 15개의 유전자로 구축한 노화 세포 분류 모델이 기존에 연구에서 알려진 55개의 세포 노화 관련 유전자로 구축한 노화 세포 분류 모델보다 세포 노화의 특성을 더 잘 나타냄을 확인 할 수 있었다. 또한, 노화 섬유아세포를 포함한 다양한 세포들을 고려하여 특징 유전자를 제시한 기존 연구 (Hernandez-Segura et al. 2017)하였고, 일 구체예에 따른 방법은 노화 섬유아세포만을 훈련 데이터에 사용하여 유전자를 선별하였음에도 불구하고, 다양한 종류의 세포들에 대해서도 기존 연구보다 더 좋은 분류 성능을 보임을 확인할 수 있었다.
이상의 결과는 일 구체예에 따른 방법은 섬유아세포를 포함한 다양한 종류의 세포들에서 통계적으로 더 유의한 마커를 선별할 수 있음을 의미하고, 일 구체예에 따른 방법으로 도출된 15개의 유전자는 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있음을 의미한다.
실시예 3. 추가적인 세포 노화의 바이오마커
상기 실시예 1과 동일한 방법 (도 2)을 이용하되, 1.1 데이터 셋 준비 및 분석의 표 1에 명시된 샘플들 중 노화 특성이 상이한 18개의 샘플들을 제거한 뒤 노화 세포에서 발현이 변화하는 17개 유전자를 추가로 선별하여 보다 정교한 유전자들을 획득하였다.
3.1 데이터 셋 준비 및 분석
상기 실시예 1의 165개 섬유아세포 샘플들 중 18개 샘플을 추가로 제거하여 총 147개의 섬유아세포 샘플들을 획득하였다. 제거된 샘플들의 정보는 다음과 같다.
GSE72404에서는 기존에 활용된 24개 샘플 중 12개의 notch-induced senescence 샘플을 제거하였다. 이는 notch-induced senescence가 primary senescence (RS, OIS 및 TIS) 와 상이한 특성을 보임이 알려져 있기 때문이다. GSE1307272에서는 기존의 26개 샘플에서 4개의 대조군과 2개의 OIS 샘플을 제거하였다. 해당 샘플들은 PCA 결과 이상치로 판단될 수 있어 제거하였다. 데이터 특성 정보를 하기 표 5에 나타내었다.
재선별된 샘플 정보
GSE number 샘플의 수
(대조군 : 노화 세포군)
세포노화 종류
(Inducer types)
세포의 기원 카테고리
(Tr(훈련 셋)/Te(검정 셋)
GSE63577 23 (12 : 11) Replicative BJ, HFF, IMR90, WI38 Tr
GSE72407 22 (8 : 14) OIS, TIS IMR90 Tr
GSE113060 10 (5 : 5) OIS IMR90 Tr
GSE70668 6 (3 : 3) OIS IMR90 Tr
GSE132370 6 (3 : 3) TIS IMR90 Tr
GSE130727 20 (8 : 12) Replicative, TIS, OIS IMR90, WI38 Tr/Te
GSE98440 8 (4 : 4) Replicative IMR90 Te
GSE109700 9 (3 : 6) Replicative LF1 Te
GSE130306 6 (3 : 3) Replicative WI38 Te
GSE94395 6 (3 : 3) TIS IMR90 Te
GSE168994 4 (2 : 2) TIS IMR90 Te
GSE72404 12 (6 : 6) OIS IMR90 Te
GSE75643 15 (9 : 6) OIS TIG3 Te
Total 147 (69 : 78) - -  
아울러, 훈련 셋 및 검정 셋의 분할 정보는 하기 표 6에 나타내었다.
훈련 셋 및 검정 셋의 분할 정보
샘플 카테고리 세포 유형 대조군 RS OIS TIS Total
훈련 셋 Fibroblasts 37 13 15 14 79
검정 셋 1 Fibroblasts 32 15 12 9 68
검정 셋 2 Other cell types 15 7 - 11 33
Total - 84 35 27 34 180
3.2 데이터 전처리 및 메타분석
상기 실시예 1.2 데이터 전처리 및 메타분석 내용과 동일한 방법으로 수행하였다.
3.3 탐색적 자료분석 (Exploratory data analysis)
상기 실시예 1.3 탐색적 자료분석 내용과 동일한 방법으로 수행하였다. 약 14,000개의 유전자에 대해 PCA (Principal component analysis) 분석을 진행하였고, Spearman correlation을 통해 PCA 결과를 도 14에 나타내었다.
도 14는 재선별된 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.
3.4 차별발현 유전자 분석 (Differentially expressed genes analysis, DEG analysis)
상기 실시예 1.4 차별발현 유전자 분석 과정과 동일한 방법으로 각각의 유도체(inducer type)별 차별발현 유전자를 선별하였다. 각각의 유도체(inducer type)별로 살펴보면, RS에서 총 1,463개의 유전자(up-regulated genes : 881, down-regulated genes : 582)가, OIS에서 총 2,039개의 유전자(up-regulated genes : 791, down-regulated genes : 1,248), TIS에서 총 1,903개의 유전자(up-regulated genes : 1,238, down-regulated genes : 665)가 차별발현 유전자로 선별되었고, 이를 하기 표 7에 나타내었다.
차별발현 유전자 분석 정보
Inducer type Comparison
(Control : Senescent)
Up-regulated genes Down-regulated genes Total DEGs
RS 13 : 13 881 582 1,463
OIS 14 : 15 791 1,248 2,039
TIS 14 : 14 1,238 665 1,903
유도체(inducer type)별 차별발현유전자(DEG) 중 유도체의 종류와 무관하게 발현되는 세포 노화의 특징적 유전자를 선별하기 위해 유도체별 DEG 결과를 up-regulated gene과 down-regulated gene으로 나눈 후, 벤다이어그램으로 각각 나타내어 유전자의 교집합을 선별하였다. 상기 벤다이어그램은 도 15에 나타내었다.
도 15는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 15에 나타낸 바와 같이, 총 181개의 up-regulated gene과 284개의 down-regulated gene의 총 465개의 유전자가 선별되었고, 이 유전자들은 유도체의 종류와 무관하게 노화 세포에서 발현되고 있음을 의미한다.
이후에, 선별된 공통 발현 유전자들이 세포 노화적 특성을 반영하는 유전자 세트인지 확인하기 위해, gProfiler (https://biit.cs.ut.ee/gprofiler/)를 활용하여 GO(gene ontology) 분석을 시행하여 465개의 유전자와 관련있는 생물학적 경로들을 탐색하였다. 유전자들의 발현 증감 방향성에 따라 각각 GO 분석을 진행하였고, GO 결과는 조정된 p-value 값이 0.05 이하인 결과만을 선별하였으며, 그 결과를 도 16에 나타내었다.
도 16은 선별된 공통 발현 유전자의 GO 분석 결과를 나타낸 도면이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.
도 16에 나타낸 바와 같이, 노화 세포에서 발현이 공통적으로 증가한 181개의 유전자는 세포 노화의 알려진 특징인 SASP(Senescence associated secretory phenotype), Chromatin organization, Immune response 및 여러가지 Cellular senescence pathway 관련 특성들이 유의미하게 나타남을 확인할 수 있었다. 또한, 노화 세포에서 발현이 공통적으로 감소한 284개 유전자의 경우 마찬가지로 이미 알려진 세포 노화의 특성에 해당하는 cell cycle 과 관련된 생물학적 경로들 및 DNA replication, DNA repair, telomere maintenance 및 organization 과 연관이 있음을 확인하였다. 이를 통해 전체 465개의 교집합 유전자 세트가 세포 노화의 특성을 잘 반영함을 확인할 수 있었다.
3.5 LASSO (least absolute shrinkage and selection operator)를 이용한 변수 선택
선별된 465개의 유전자 중 세포 노화의 특성을 가장 잘 나타내는 최소한의 유전자를 선별하고자 상기 실시예 1.5 LASSO (least absolute shrinkage and selection operator)를 이용한 변수 선택 과정과 동일한 방법을 이용하였다.
구체적으로, LASSO 회귀는 R package glmnet 4.0-2를 통해 진행되었고, 훈련 데이터 총 79개 데이터 셋의 TMM normalized Log2CPM (count per million) 값을 사용하여 샘플의 상태에 따라 Control(=0) 혹은 Senescent(=1) 값을 할당한 후 binary classification 모델에 대한 파라미터 조정을 진행하여 선별된 결과값이다. Leave-one-out-cross-validation을 통해 최적의 lambda (λ)를 설정한 후 모델을 적합하여 최종적으로 17개의 유전자를 선별하였다. 해당 유전자는 ENSG00000106462 (EZH2), ENSG00000120802 (TMPO), ENSG00000126016 (AMOT), ENSG00000139354 (GAS2L3), ENSG00000054654 (SYNE2), ENSG00000164104 (HMGB2), ENSG00000164649 (CDCA7L), ENSG00000092470 (WDR76), ENSG00000273802 (H2BC8), ENSG00000102996 (MMP15), ENSG00000197142 (ACSL5), ENSG00000135218 (CD36), ENSG00000075651 (PLD1), ENSG00000003137 (CYP26B1), ENSG00000186088 (GSAP), ENSG00000197903 (H2BC12), ENSG00000180573 (H2AC6) 이며, 각 유전자들의 계수(coefficient)를 통해 세포 노화에서의 해당 유전자의 발현 방향성(+/-) 및 영향력을 나타낸다. 총 9개의 유전자 (H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, H2AC6) 는 양의 계수를 지니므로 노화 세포에서 발현이 증가한 것이고, 나머지 8개의 유전자 (EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76) 는 음의 계수를 지니므로 노화 세포에서의 발현이 감소한 것이다.
상기 LASSO 회귀를 통해 유전자에 대한 변수 선택 과정을 진행한 결과는 하기 표 8 및 도 17에 나타내었다.
LASSO 회귀를 통해 선별된 세포 노화 특징 유전자
Ensembl gene id
SYMBOL Coefficient Description
ENSG00000106462 EZH2 -0.26 Enhancer Of Zeste 2 Polycomb Repressive Complex 2 Subunit
ENSG00000120802 TMPO -0.26 Thymopoietin
ENSG00000126016 AMOT -0.17 Angiomotin
ENSG00000139354 GAS2L3 -0.09 Growth Arrest Specific 2 Like 3
ENSG00000054654 SYNE2 -0.09 Spectrin Repeat Containing Nuclear Envelope Protein 2
ENSG00000164104 HMGB2 -0.08 High Mobility Group Box 2
ENSG00000164649 CDCA7L -0.05 Cell Division Cycle Associated 7 Like
ENSG00000092470 WDR76 -0.001 WD Repeat Domain 76
ENSG00000273802 H2BC8 0.005 H2B Clustered Histone 8
ENSG00000102996 MMP15 0.04 Matrix Metallopeptidase 15
ENSG00000197142 ACSL5 0.06 Acyl-CoA Synthetase Long Chain Family Member 5
ENSG00000135218 CD36 0.09 CD36 Molecule
ENSG00000075651 PLD1 0.11 Phospholipase D1
ENSG00000003137 CYP26B1 0.14 Cytochrome P450 Family 26 Subfamily B Member 1
ENSG00000186088 GSAP 0.22 Gamma-Secretase Activating Protein
ENSG00000197903 H2BC12 0.24 H2B Clustered Histone 12
ENSG00000180573 H2AC6 0.78 H2A Clustered Histone 6
도 17은 LASSO에 의해 선별된 17개 유전자의 각 계수(Coefficient) 값을 Barplot으로 나타낸 도면이다.
이후에, 79개의 훈련 셋 데이터에 대해 LASSO에 의해 선별된 17개의 유전자를 이용하여 상기 3.3.과 동일하게 PCA 분석을 진행하고 클러스터링 결과를 확인한 뒤 각각 도 18 및 도 19에 나타내었다.
도 18은 LASSO에 의해 선별된 유전자 17개에 대한 PCA 분석 결과를 나타낸 도면이다.
도 19는 LASSO에 의해 선별된 유전자 17개에 대한 클러스터링 분석 결과를 나타낸 도면이다.
도 18에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 17개의 PCA 결과는 도 14의 PCA 결과와 비교하여, PC1에 의해 노화 세포와 대조군 데이터가 명확하게 구분되는 것을 확인 할 수 있으며 PC1의 데이터 구분에 대한 설명도 증가하였음을 알 수 있었다.
도 19에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 17개의 클러스터링 결과는 유전자들의 발현 패턴이 노화 세포와 대조군 사이에서 명확하게 구별되며, 노화 세포와 대조군 데이터를 명확하게 구분함을 알 수 있었다.
이상의 결과는 LASSO에 의해 선별된 17개의 유전자는 훈련 셋 데이터 내에서 노화 세포의 특성을 잘 반영함을 나타냄을 의미한다.
실시예 4. 선별된 노화 세포 마커 후보 유전자들의 검정
4.1 검정 데이터에서의 대조군 그룹 및 세포 노화 그룹간 유전자 발현 차이 확인
실시예 3에서 선정된 17개의 노화 세포 마커 후보 유전자들의 발현 패턴이 17개 유전자의 선별 과정에 관여하지 않은 68개의 검정 데이터 내에서도 유의미한 발현 차이를 보이는지 확인하였다.
구체적으로, 68개의 검정 데이터에 대해 훈련 데이터와 동일한 과정으로 TMM 정규화 및 limma removeBatchEffect function을 통해 배치 효과를 제거한 후 Log2CPM 변환 값을 이용하여 대조군 그룹(n = 32)과 노화세포 그룹(n = 36) 사이에서 17개 유전자의 발현에 유의미한 차이가 존재하는지 확인하였고, 그 결과를 도 20에 나타내었다.
도 20는 검정 셋 데이터(n= 68)에서의 LASSO 선별 17개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 8개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.
4.2 세포 노화 예측 모델 제작
17개의 선별된 유전자들을 훈련 데이터 셋에 적용하여 노화 세포의 상태를 예측하는 5 개의 모델을 제작하여 선별된 유전자들의 유효성을 검증하였다.
구체적으로, 제1 모델은 서포트 벡터 머신(Support vector machine)의 RBF kernel을 통해 제작하였으며, R package e1071 (version 1.7-3)이 사용되었다. 모델의 학습에 사용된 데이터는 상기 학습에 사용된 79개의 훈련 데이터에 대한 17개 유전자의 발현값이 사용되었으며, LOOCV (leave one out cross-validation)을 통해 최적의 분류 모델을 선택하여 제작하였다. 제2, 제3, 제4, 제5 모델은 타 세포 노화 관련 연구 문헌 [Hernandez-Segura et al. 2017, Kiss et al. 2020, Park et al. 2021, Casella et al. 2019]에서 선정된 다양한 세포 노화 유전자의 발현 값을 훈련 데이터 셋에 적용하여 제1 모델과 동일한 방식으로 SVM 모델을 제작하였다. 제2, 제3, 제4, 제5 모델은 제1 모델과 노화 세포 분류 성능을 비교하기 위해 제작하였다.
4.3 세포 노화 예측 모델 성능 평가
상기 4.2에서 제작한 다섯 개의 모델을 이용하여 68개의 노화 섬유아세포 검정 데이터 (대조군 32개, 노화 세포 36개)에 대해 분류 검정을 진행하였고, 그 결과를 도 21a에 나타내었다. 추가로 상기 4.2.에서 제작한 두 개의 모델을 이용하여 33개의 다양한 노화 세포 데이터 (대조군 : 15, 노화 세포 : 18, 섬유아세포가 아닌 33개의 서로 다른 종류 (HUVEC, HAEC, MSC, LS8817, Ovcar3))에 대해 분류 검정을 진행하였고, 그 결과를 도 21b에 나타내었다. 검정 데이터의 Log2CPM 값들은 훈련 데이터의 발현 값의 평균 및 표준편차를 기준으로 스케일링 후 검정 하였다.
도 21은 다섯 개의 세포 노화 분류 모델의 성능 평가를 위한 ROC 커브 결과를 나타낸 그래프이다; a: 일 구체예의 검정 데이터, b: 추가적인 다양한 노화 세포 데이터.
도 21에 나타낸 바와 같이, 두 결과 모두에서 LASSO에 의해 선정된 17개의 유전자 모델이 더 좋은 성능을 보이는 것을 확인 할 수 있었다.
a: LASSO 17 gene model AUC: 100% = Casella et al, model AUC: 100% > Hernandez et al, model AUC: 99.7% > Kiss et al, model AUC: 99.5% > Park et al, model AUC : 98%
b: LASSO 17 gene model AUC: 98.9% > Casella et al, model AUC: 98.1% > Kiss et al, model AUC: 86.3% > Hernandez et al, model AUC: 82.6% > Park et al, model AUC : 70.7%.
따라서 실시예 4의 결과들을 토대로, 일 구체예에 따라 선별된 17개의 유전자의 발현 양상이 LASSO의 계수 부호 양상과 동일하게, 정상 세포와 노화 세포 그룹간 유의미한 차이를 보이는 것을 확인할 수 있었다. 또한, 17개의 유전자로 구축한 노화 세포 분류 모델이 기존에 연구에서 알려진 다양한 세포 노화 관련 유전자로 구축한 노화 세포 분류 모델보다 세포 노화의 특성을 더 잘 나타냄을 확인 할 수 있었다.
일 구체예에 따른 방법은 노화 섬유아세포만을 훈련 데이터에 사용하여 유전자를 선별하였음에도 불구하고, 다양한 종류의 세포들에 대해서도 기존 연구보다 더 좋은 분류 성능을 보임을 확인할 수 있었다.
이상의 결과는 일 구체예에 따른 방법은 섬유아세포를 포함한 다양한 종류의 세포들에서 통계적으로 더 유의한 마커를 선별할 수 있음을 의미하고, 일 구체예에 따른 방법으로 도출된 17개의 유전자는 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있음을 의미한다.
실시예 5. 노화 유도 세포에서의 선별한 바이오마커의 발현 변화 확인
상기 실시예 3에서 선별한 17개의 유전자 중, GAS2L3, AMOT 및 WDR76 유전자가 노화를 유도한 세포에서 실제 발현량에 변화가 나타나는 지 알아보았다.
5.1 세포 노화 유도 및 확인
인간 제대 정맥 내피세포 (Human Umbilical Vein Endothelial Cell, HUVEC cell, LONZA, HUVEC, C2519A)를 사용하였고 EGM2 (LONZA, EGM-2 Endothelial Cell Growth Medium-2 BulletKit, CC-3162) 배지에서 배양하였다. 세포의 계대 배양 횟수에 차이를 두어 노화를 유도 하였다. Passage 3 (P3) 과 passage 7 (P7) 의 HUVEC 세포를 배양 후 이 세포가 passage에 따른 노화정도를 파악하기 위해 SA β-Gal (senescence-associated beta-galactosidase, Cell Signaling, Senesence β-Galactosidase Staining Kit, #9860) 염색을 진행하였다. 염색 결과를 도 22에 나타내었다.
도 22에 나타낸 바와 같이, P7의 세포가 P3의 세포 보다 세포 내 진하고 많은 파란색을 띄고 있어 더 많은 노화가 진행된 것을 알 수 있었다.
5.2 GAS2L3, AMOT 및 WDR76의 발현 변화 확인
Trizol (Invitrogen, TRIzol Reagent, 15596018)을 사용하여 P3 및 P7 세포들의 RNA을 추출하여였고, cDNA synthesis kit (LaboPass, cDNA synthesis kit, SMRTK002)을 사용하여 cDNA (complenentary DeoxyriboNucleic Acid)을 합성하였다. 이후 하기의 표 9의 프라이머와 PCR premixture (SolGent, Solg 2X Multiplex PCR Smart mix, SMP01-M25P)을 이용하여 GAS2L3, AMOT 및 WDR76 유전자들만 특이적으로 증폭시켰고 GAPDH을 세포의 cDNA의 정량을 위해 사용하였다. 해당과정에서 PCR 기기 (Aplied Biosystems, MiniAmp Plus Thermal Cycler, A37835)를 사용하였다.
PCR 수행 후, 전기영동을 통해 GAS2L3, AMOT 및 WDR76의 발현량을 확인하였고, 그 결과를 도 23에 나타내었다.
또한, 정량적으로 발현량을 비교하기 위하여 상기에서 수득한 cDNA를 이용하여 qPCR을 수행하였다. 구체적으로, 하기 표 9의 프라이머를 이용하였고, qPCR을 위해 SYBR green (Applied Biosystems, SYBR Green PCR Master Mix, 2109533)을 이용한 qPCR (quantitative PCR)시약을 사용 하였고, real time PCR (Applied Biosystems, StepOne Real-time PCR System, 4376357)을 이용하여 진행하였다. qPCR의 결과를 도 24에 나타내었다.
유전자 프라이머 방향 5'to 3' 서열번호
AMOT Forward AAA CGT GAG CAG CTA GAG CAC 서열번호 1
Reverse TGT GTC CCT CTG AGC AGC CA 서열번호 2
GAS2L3 Forward ATC TGG GCT CTA TGT CAG TCC G 서열번호 3
Reverse TTG GCA AAA GTG TGG ACT CGG 서열번호 4
WDR76 Forward CTG CTG CAA GAC TCC GTG AA 서열번호 5
Reverse GCC CAG GAG GTA ACA AAG GAG 서열번호 6
GAPDH Forward ATC CCA TCA CCA TCT TCC 서열번호 7
Reverse CCA TCA CGC CAC GAT TTC 서열번호 8
도 23에 나타낸 바와 같이, GAS2L3, AMOT 및 WDR76에 해당하는 밴드가 P7 보다 P3에서 보다 진하게 나타나 노화가 진행된 P7의 세포들에서 P3의 세포 보다 낮은 GAS2L3, AMOT 및 WDR76의 발현을 나타내는 것을 확인하였다.
또한, 도 24에 나타낸 바와 같이, qPCR 결과 역시 GAS2L3, AMOT 및 WDR76 유전자 발현양이 P7 세포들에서 감소하는 것을 확인하였다.
상기 결과로부터, 실제 노화된 세포에서 GAS2L3, AMOT 및 WDR76의 발현이 감소하는 것을 알 수 있었고, GAS2L3, AMOT 및 WDR76 유전자가 노화 세포의 바이오마커로 활용될 수 있음을 알 수 있었다.

Claims (16)

  1. 분리된 생물학적 시료로부터 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법.
  2. 청구항 1에 있어서, 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 세포 노화를 검출하는 방법.
  3. EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및
    무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
  4. 청구항 3에 있어서, 상기 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
  5. EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물.
  6. 청구항 5에 있어서, 상기 노화는 복제 노화(Replicative senescence), 종양유전자 유도 노화(Oncogene induced senescence) 및 치료 유도 노화(Therapy induced senescence)로 이루어진 군으로부터 선택된 어느 하나인 것인, 세포 노화를 검출하기 위한 조성물.
  7. RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물.
  8. 청구항 7에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 프라이머, 프로브 또는 안티센스 올리고뉴클레오티드인 것인, 세포 노화를 검출하기 위한 조성물.
  9. 청구항 7에 있어서, 상기 단백질의 활성 수준을 측정할 수 있는 제제는 항체, 앱타머, 아비머(avidity multimer) 또는 페티도모방체(peptidomimerics)인 것인, 세포 노화를 검출하기 위한 조성물.
  10. 청구항 7에 있어서, 상기 노화는 복제 노화(Replicative senescence), 종양유전자 유도 노화(Oncogene induced senescence) 및 치료 유도 노화(Therapy induced senescence)로 이루어진 군으로부터 선택된 어느 하나인 것인, 세포 노화를 검출하기 위한 조성물.
  11. 분리된 생물학적 시료로부터 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법.
  12. 청구항 11에 있어서, 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 세포 노화를 검출하는 방법.
  13. 청구항 11에 있어서, 상기 유전자의 발현 수준을 측정하는 방법은 역전사 중합효소반응, 경쟁적 역전사 중합효소반응, 실시간 역전사 중합효소반응, RNase 보호 분석법, 노던 블랏팅 또는 DNA 칩인 것인, 세포 노화를 검출하는 방법.
  14. 청구항 11에 있어서, 상기 단백질의 활성 수준을 측정하는 방법은 웨스턴 블랏팅, ELISA, 방사선 면역분석법, 방사선 면역확 산법, 오우크테로니 (Ouchterlony) 면역확산법, 로케트 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고 정분석, FACS 또는 단백질 칩인 것인, 세포 노화를 검출하는 방법.
  15. RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및
    무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
  16. 청구항 15에 있어서, 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
PCT/KR2022/018220 2021-11-18 2022-11-17 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법 WO2023090901A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0159264 2021-11-18
KR20210159264 2021-11-18

Publications (1)

Publication Number Publication Date
WO2023090901A1 true WO2023090901A1 (ko) 2023-05-25

Family

ID=86397434

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/018220 WO2023090901A1 (ko) 2021-11-18 2022-11-17 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법

Country Status (2)

Country Link
KR (32) KR102657188B1 (ko)
WO (1) WO2023090901A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190111845A (ko) * 2018-03-23 2019-10-02 의료법인 성광의료재단 줄기세포의 노화 예측 또는 진단용 바이오 마커
US20210109111A1 (en) * 2016-11-25 2021-04-15 Université Grenoble Alpes New biomarkers of human skin aging
KR20210100603A (ko) * 2018-10-25 2021-08-17 우니베르지태트 퓌르 보덴쿨투르 빈 노화 세포의 제거를 위한 조성물

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100734429B1 (ko) * 2004-12-06 2007-07-03 재단법인서울대학교산학협력재단 노화에 관여하는 신호 및 분자종
US20060217305A1 (en) * 2005-01-28 2006-09-28 Ordway Research Institute, Inc. Induction of tumor cell senescence by retinoid receptor agonists and antagonists
US7908090B2 (en) * 2005-11-30 2011-03-15 The Board Of Trustees Of The Leland Stanford Junior University Signatures for human aging
WO2012059223A1 (en) * 2010-11-02 2012-05-10 Helmholtz-Zentrum für Infektionsforschung GmbH Methods and vectors for cell immortalisation
JP2014513791A (ja) 2011-02-22 2014-06-05 ザ プロクター アンド ギャンブル カンパニー スキンケア組成物用の化粧剤を同定するための方法
US10087486B2 (en) * 2012-11-09 2018-10-02 The Regents Of The University Of California Methods for predicting age and identifying agents that induce or inhibit premature aging
WO2015157247A1 (en) * 2014-04-07 2015-10-15 Health Research, Inc. Compositions and methods related to dormant senescence-prone cells (dspc)
WO2016118859A1 (en) 2015-01-22 2016-07-28 Board Of Trustees Of The University Of Arkansas Compositions and methods for selectively depleting senescent cells comprising flip
MX2017015145A (es) * 2015-05-28 2018-08-01 Celularity Inc Celulas madre derivadas de placenta para restaurar el motor regenerativo, corregir defectos proteomicos y extender la esperanza de vida.
US20200286625A1 (en) * 2017-07-25 2020-09-10 Insilico Medicine Ip Limited Biological data signatures of aging and methods of determining a biological aging clock
US10665326B2 (en) * 2017-07-25 2020-05-26 Insilico Medicine Ip Limited Deep proteome markers of human biological aging and methods of determining a biological aging clock
US11795148B2 (en) * 2017-12-12 2023-10-24 Queen's University At Kingston Compounds and methods for inhibiting CYP26 enzymes
GB201721738D0 (en) * 2017-12-22 2018-02-07 King S College London Method
US11730762B2 (en) 2018-08-30 2023-08-22 HCW Biologics, Inc. Methods for stimulating proliferation or differentiation of an immune cell with a multi-chain chimeric polypeptide
SG11202103293UA (en) * 2018-10-02 2021-04-29 Lunella Biotech Inc Azithromycin and roxithromycin derivatives as senolytic drugs

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210109111A1 (en) * 2016-11-25 2021-04-15 Université Grenoble Alpes New biomarkers of human skin aging
KR20190111845A (ko) * 2018-03-23 2019-10-02 의료법인 성광의료재단 줄기세포의 노화 예측 또는 진단용 바이오 마커
KR20210100603A (ko) * 2018-10-25 2021-08-17 우니베르지태트 퓌르 보덴쿨투르 빈 노화 세포의 제거를 위한 조성물

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ITO TAKAHIRO, TEO YEE VOAN, EVANS SHANE A., NERETTI NICOLA, SEDIVY JOHN M.: "Regulation of Cellular Senescence by Polycomb Chromatin Modifiers through Distinct DNA Damage- and Histone Methylation-Dependent Pathways", CELL REPORTS, ELSEVIER INC, US, vol. 22, no. 13, 1 March 2018 (2018-03-01), US , pages 3480 - 3492, XP093067996, ISSN: 2211-1247, DOI: 10.1016/j.celrep.2018.03.002 *
KUO MEI-LING, SY ALEXANDER J., XUE LIJUN, CHI MARTIN, -C. LEE MICHELLE T., YEN TERENCE, CHIANG MEI-IOK, CHANG LUFEN, CHU PEIGUO, Y: "RRM2B Suppresses Activation of the Oxidative Stress Pathway and is Up-regulated by P53 During Senescence", SCIENTIFIC REPORTS, vol. 2, no. 1, XP093068003, DOI: 10.1038/srep00822 *

Also Published As

Publication number Publication date
KR20230074040A (ko) 2023-05-26
KR102640975B1 (ko) 2024-02-28
KR20230074039A (ko) 2023-05-26
KR102614664B1 (ko) 2023-12-20
KR20230074048A (ko) 2023-05-26
KR102639824B1 (ko) 2024-02-26
KR102639822B1 (ko) 2024-02-26
KR20230074042A (ko) 2023-05-26
KR20230074027A (ko) 2023-05-26
KR20230074025A (ko) 2023-05-26
KR20230074044A (ko) 2023-05-26
KR102639823B1 (ko) 2024-02-26
KR20230074049A (ko) 2023-05-26
KR102640977B1 (ko) 2024-02-28
KR20230074033A (ko) 2023-05-26
KR102657187B1 (ko) 2024-04-16
KR102614667B1 (ko) 2023-12-20
KR20230074045A (ko) 2023-05-26
KR102639828B1 (ko) 2024-02-26
KR102639825B1 (ko) 2024-02-26
KR102639826B1 (ko) 2024-02-26
KR102639817B1 (ko) 2024-02-26
KR20230074019A (ko) 2023-05-26
KR20230074018A (ko) 2023-05-26
KR20230074032A (ko) 2023-05-26
KR20230074047A (ko) 2023-05-26
KR102640974B1 (ko) 2024-02-28
KR20230074023A (ko) 2023-05-26
KR102639827B1 (ko) 2024-02-26
KR102613066B1 (ko) 2023-12-19
KR102657185B1 (ko) 2024-04-16
KR102639819B1 (ko) 2024-02-26
KR20230074031A (ko) 2023-05-26
KR20230074024A (ko) 2023-05-26
KR20230074022A (ko) 2023-05-26
KR20230074029A (ko) 2023-05-26
KR102614666B1 (ko) 2023-12-20
KR102639818B1 (ko) 2024-02-26
KR20230074021A (ko) 2023-05-26
KR102657188B1 (ko) 2024-04-16
KR20230074026A (ko) 2023-05-26
KR102613065B1 (ko) 2023-12-19
KR102657184B1 (ko) 2024-04-16
KR20230074041A (ko) 2023-05-26
KR20230074046A (ko) 2023-05-26
KR20230074043A (ko) 2023-05-26
KR20230074050A (ko) 2023-05-26
KR102640976B1 (ko) 2024-02-28
KR102657186B1 (ko) 2024-04-16
KR102657189B1 (ko) 2024-04-16
KR20230074037A (ko) 2023-05-26
KR20230074036A (ko) 2023-05-26
KR20230074020A (ko) 2023-05-26
KR102613067B1 (ko) 2023-12-19
KR102639820B1 (ko) 2024-02-26
KR20230074030A (ko) 2023-05-26
KR102639821B1 (ko) 2024-02-26
KR102614665B1 (ko) 2023-12-20
KR20230074035A (ko) 2023-05-26
KR20230074028A (ko) 2023-05-26
KR20230074038A (ko) 2023-05-26
KR102657190B1 (ko) 2024-04-16
KR102613068B1 (ko) 2023-12-19

Similar Documents

Publication Publication Date Title
WO2023090901A1 (ko) 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법
WO2023191543A1 (ko) 암의 진단용 조성물

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22896099

Country of ref document: EP

Kind code of ref document: A1