WO2023090901A1

WO2023090901A1 - 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법

Info

Publication number: WO2023090901A1
Application number: PCT/KR2022/018220
Authority: WO
Inventors: 황소현; 신동준; 백광현; 민요석
Original assignee: 의료법인 성광의료재단; 차의과학대학교 산학협력단
Priority date: 2021-11-18
Filing date: 2022-11-17
Publication date: 2023-05-25
Also published as: KR20230074040A; KR102640975B1; KR20230074039A; KR102614664B1; KR20230074048A; KR102639824B1; KR102639822B1; KR20230074042A; KR20230074027A; KR20230074025A; KR20230074044A; KR102639823B1; KR20230074049A; KR102640977B1; KR20230074033A; KR102657187B1; KR102614667B1; KR20230074045A; KR102639828B1; KR102639825B1

Abstract

기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법에 관한 것으로, 일 양상에 따른 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법에 의하면, 노화 세포 RNA-seq 데이터에 대한 메타분석을 진행하는 분석 파이프라인을 구축하여 충분한 샘플 수를 확보함으로써 통계적으로 보다 유의한 유전자들을 선별할 수 있고, 기계학습적 방법론을 통해 다양한 변수들 중에서 노화 세포 특징적 마커의 후보군을 찾아낼 수 있는 효과가 있다. 또한, 상기 방법에 의해 도출된 세포 노화의 마커는, 기존의 연구보다 다양한 종류의 세포들에도 세포 노화를 특정할 수 있는 더 유의한 유전자 시그니처로서, 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있을 뿐만 아니라, 세놀리틱 제제를 선별하는데 유용하게 사용될 수 있는 효과가 있다.

Description

기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법

기계 학습을 이용한 세포 노화의 마커를 선별하는 방법, 세포 노화 바이오 마커, 및 이를 이용한 세놀리틱 제제를 스크리닝 하는 방법에 관한 것이다.

세포 노화(Cellular senescence)는 내/외부 자극에 의해 일어나는 세포의 영구적인 세포주기 정지를 의미한다. 세포 노화가 일어난 세포들은 노화 관련 분비표현형(SASP: Senescence Associated Secretory phenotype)을 분비하여 다양한 염증 반응을 일으키고, 그 결과 암을 포함한 나이와 연관된 질병들을 조절하는 것으로 알려져 있다. 이러한 노화 세포의 선택적 제거를 통해 다양한 질병들을 치료하려는 senolysis 기법이 최근 각광을 받고 있다. 실예로, 2020년 MIT가 선정한 10대 기술에 노화 세포 타겟 연구가 지정 되었다.

기존의 다양한 연구에서, 세놀리틱 약물을 처리한 마우스의 수명이 증가하고 나이와 연관된 질병들이 감소함이 확인되었다. 그러나 노화 세포의 이질적 특성으로 인해 노화 세포를 특이적으로 선별할 수 있는 마커가 부족한 상황이며 현재까지의 노화 세포 마커들은 노화 세포가 아닌 세포에서도 발현된다. 최근 미국 Mayo clinic에서 개발된 세놀리틱 약물을 포함한 소수의 약물들이 임상을 진행하였으나 대부분 또렷한 효과를 보이지 않거나 부작용이 나타나 진척이 없는 상황이다.

한편, 세포 노화는 노화가 일어나는 세포의 종류 및 노화를 유도하는 유도체의 종류에 따라 그 특성이 매우 다양하다고 알려져 있다. 그러나 이에 대한 개별적인 연구는 많이 진행되지 않은 상황이다. 따라서 노화 세포의 종류에 따른 분자적 특성을 파악하여 마커를 발굴하는 접근이 필요한 실정이다.

세포 노화는 텔로미어 감소에 의해 일어나는 replicative senescence, 종양유전자의 발현에 의해 유도되는 oncogene induced senescence, 질병의 치료 과정에서 drug 혹은 irradiation에 의해 일어나는 Therapy induced senescence 등 다양한 유도체에 의해 일어난다. 기존 연구들에 따르면 세포 노화는 유도체(inducer type)의 종류보다 세포의 종류에 따라 구별되는 특성이 더 강한 것으로 알려져 있으나, 세포 노화가 유도되는 유도체의 종류에 따라 노화 세포가 분비하는 물질의 상위 경로가 다르다는 보고가 존재하고, 기존 세포 노화 발현 연관 연구들의 경우 실험 당 샘플 수의 제한으로 인해 상대적으로 유의미한 유전자를 선별하지 못하는 단점들을 안고 있기 때문에 이러한 문제들을 보완하여 분석하는 방법이 필요한 실정이다.

일 양상은, 복수의 서로 다른 원인의 노화 세포군 및 대조군 세포의 RNA 시퀀싱 데이터를 포함하는 복수의 서로 다른 실험데이터를 획득하는 단계; 상기 획득된 복수의 서로 다른 실험데이터의 전사체(trasncriptome)를 분석 파이프라인을 통해 정량화하여 서로 다른 실험에서 파생되는 배치 효과(batch effect)를 감소시켜 배치-수정된(batch-corrected) 데이터를 획득하는 단계; 상기 배치-수정된 데이터 중 훈련 셋(training set) 내의 복수의 서로 다른 원인의 노화 세포군 각각에 대해 대조군 세포 대비 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 단계; 상기 선별된 유전자 중 복수의 서로 다른 원인의 노화 세포군에서 공통적으로 존재하는 유전자들 선별하는 단계; 및 상기 선별된 유전자의 발현 값을 독립변수로 하는 지도 학습(supervised learning)이 가능한 회귀 모델(regression model)을 이용하여 상기 선별된 유전자 중 세포 노화의 마커를 선별하는 단계를 포함하는 기계적 학습 방법을 이용한 세포 노화의 마커를 선별하는 방법을 제공한다.

다른 양상은 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

또 다른 양상은 상기 방법을 수행하는 세포 노화의 마커를 검출하는 장치를 제공한다.

또 다른 양상은 상기 방법에 의해 도출된 세포 노화의 마커를 제공한다.

또 다른 양상은 상기 방법에 의해 도출된 세포 노화의 마커를 이용하여 생성된 세포 노화 예측 모델을 제공한다.

또 다른 양상은 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물을 제공한다.

또 다른 양상은 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물을 제공한다.

또 다른 양상은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물을 제공한다.

또 다른 양상을 상기 조성물을 포함하는 세포 노화를 검출하기 위한 키트를 제공한다.

또 다른 양상은 분리된 생물학적 시료로부터 상기 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공한다.

또 다른 양상은 상기 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및 무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법을 제공한다.

일 양상은 세포 노화의 마커를 선별하는 방법을 제공하는 것이다.

본원에서 사용된 용어 "세포"는 개별 세포를 포함함을 의미할 뿐만 아니라, 그가 기원하는 특정한 조직 또는 기관을 의미할 수 있다.

상기 세포는 내피 세포, 평활근 세포, 대식 세포, 섬유아세포, 망막 색소 상피 세포, 다른 상피 세포(예를 들면, 폐 상피 세포 또는 신장 상피 세포), 면역 세포(예를 들면, 대식세포), 연골 세포, 또는 줄기세포(예를 들면, 중간엽줄기세포), 또는 신경 세포 (예를 들면, 뉴런)를 포함할 수 있다.

용어 "세포 노화(Cellular senescence)"는 세포 주기에서 나왔거나, 노화와 일치하는 후성유전적 마커를 나타내거나, 또는 노화 세포 마커 (예를 들어 노화-연관된 베타-갈락토시다제, 또는 염증성 시토카인)를 발현하는 세포를 의미할 수 있다. 세포 노화는 부분적인 또는 완전한 것일 수 있다.

용어 "후성유전체" 또는 "후성유전학"은 세포에서 핵산 (예를 들어, 조작된 핵산)의 발현 또는 게놈 정보를 제어하는 세포 내에서의 변형 및 구조적 변화를 지칭한다. 후성유전체에 대한 변화는 배아 발달, 질환 진행, 및 노화의 과정 동안에 발생하고 이를 유도한다.

용어 "후성유전적 시계"는 나이 추정기 또는 선천적인 생물학적 과정을 의미할 수 있다. 일부 실시양태에서, 나이 추정기는 후성유전적 나이 추정기이다. 예를 들어, 후성유전적 나이 추정기는 수학적 알고리즘과 조합하여 사용될 때 세포, 기관 또는 조직을 비롯한 DNA 공급원의 나이를 추정하기 위해 사용될 수 있는 CpG 디뉴클레오티드의 집합일 수 있다. 일부 실시양태에서, 나이 추정기는 DNA 메틸화-기반 (DNAm) 나이 추정기이다. 일부 실시양태에서, DNAm 나이 추정기는 DNA 메틸화-기반 (DNAm) 나이 (추정된 나이로도 공지됨)와 생활 나이 사이의 피어슨(Pearson) 상관 계수 r을 이용하여 나이 상관관계로서 계산될 수 있다. 일부 실시양태에서, DNA 메틸화-기반 (DNAm) 나이 추정기는 단일-조직 DNA 메틸화-기반 나이 추정기일 수 있다. 일부 실시양태에서, DNA 메틸화-기반 나이 추정기는 다중-조직 DNA 메틸화-기반 나이 추정기일 수 있다.

노화 세포는 하기의 7가지 특징들 중 임의의 하나 이상의 것을 나타낼 수 있다. (1) 노화 성장 정지는 본질적으로 영구적이고, 공지된 생리학적 자극에 의해 역전될 수 없다. (2) 노화 세포는 크기가 증가하고, 비노화 대응물의 크기와 비교하여 2배 초과로 확대되어 있다. (3) 노화 세포는 노화 관련 β갈락토시다제(SA-β를 발현하는데, 이는 부분적으로는 리소좀 질량의 증가를 반영한다. (4) 대부분의 노화 세포는 p16INK4a를 발현하는데, 이는 보편적으로는 휴지 또는 최종적으로 분화된 세포에 의해서는 발현되지 않는다. (5) 지속적인 DDR 신호전달에 따라 노화되는 세포는 노화를 강화시키는 크로마틴 변경이 있는 DNA 세그먼트(DNA-SCARS: DNA segments with chromatin alterations reinforcing senescence)로 명명되는, 지속적인 핵 포커스를 보유한다. 상기 포커스는 활성화된 DDR 단백질을 포함하고, 일시적인 손상 포커스와는 구별가능하다. DNA-SCARS는 기능장애 텔로미어 또는 텔로미어 기능장애 유도성 포커스(TIF: telomere dysfunction-induced foci)를 포함한다. (6) 노화 세포는 노화와 관련된 분자를 발현하고, 분비할 수 있으며, 이는 특정 경우에는 지속적인 DDR 신호전달의 존재하에서 관찰되고, 특정 경우에는 그의 발현을 위해 지속적인 DDR 신호전달에 의존할 수 있다. (7) 노화 세포의 핵은 구조 단백질, 예컨대, 라민(Lamin) B1 또는 크로마틴 결합 단백질, 예컨대, 히스톤 및 HMGB1이 없다. 예컨대, 문헌 [Freund et al., Mol. Biol. Cell 23:2066-75 (2012)]; [Davalos et al., J. Cell Biol. 201:613-29 (2013)]; [Ivanov et al., J. Cell Biol. DOI: 10.1083/jcb.201212110, page 1-15](2013년 7월 1일 온라인상에 공개); [Funayama et al., J. Cell Biol. 175:869-80 (2006)]을 참조할 수 있다.

노화 세포 및 노화 세포 관련 분자는 당업계에 기술된 기법 및 방법에 의해 검출될 수 있다. 예를 들어, 조직 중 노화 세포의 존재는 노화 마커, SA-베타 갈락토시다제(SA-β를 검출하는 조직화학법 또는 면역조직화학법에 의해 분석될 수 있다(예컨대, 문헌 [Dimri et al., Proc. Natl. Acad. Sci. USA 92: 9363-9367 (1995)] 참조). 노화 세포 관련 폴리펩티드 p16의 존재는 당업계에서 실시되는 다수의 면역화학 방법들 중 어느 하나, 예컨대, 면역블롯팅 분석에 의해 측정될 수 있다. 세포에서 p16 mRNA의 발현은 정량적 PCR을 비롯한, 당업계에서 실시되는 다양한 기법에 의해 측정될 수 있다. 노화 세포 관련 폴리펩티드(예컨대, SASP의 폴리펩티드)의 존재 및 수준은 자동 및 고처리량 검정법, 예컨대, 당업계에 기술되어 있는 자동 루미넥스(Luminex) 어레이 검정법을 사용하여 측정될 수 있다(예컨대, 문헌 [Coppe et al., PLoS Biol 6: 2853-68 (2008)] 참조).

본 명세서에서 용어 "마커(marker)"란 정상 세포군과 노화 세포군을 구분하여 특정할 수 있는 물질로, 본 발명의 노화 세포군에서 증가 또는 감소를 보이는 폴리펩티드, 단백질 또는 핵산, 유전자, 지질, 당지질, 당단백질 또는 당 등과 같은 유기 생체 분자들을 모두 포함한다.

도 1을 참조하여 설명하면, 상기 방법은 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 및 대조군 세포의 RNA 시퀀싱 데이터를 포함하는 복수의 서로 다른 실험데이터를 획득하는 단계(S10);

상기 획득된 복수의 서로 다른 실험데이터의 전사체(trasncriptome)를 분석 파이프라인을 통해 정량화하여 서로 다른 실험에서 파생되는 배치 효과(batch effect)를 감소시켜 배치-수정된(batch-corrected) 데이터를 획득하는 단계(S20);

상기 배치-수정된 데이터 중 훈련 셋(training set) 내의 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 각각에 대해 대조군 세포 대비 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 단계(S30);

상기 선별된 유전자 중 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군에서 공통적으로 존재하는 유전자들 선별하는 단계(S40); 및

상기 선별된 유전자의 발현 값을 독립변수로 하는 지도 학습(supervised learning)이 가능한 회귀 모델(regression model)을 이용하여 상기 선별된 유전자 중 세포 노화의 마커를 선별하는 단계(S50)를 포함할 수 있다.

일 구체예에 있어서, 상기 복수의 서로 다른 실험데이터는 노화 세포군 및 대조군 세포군(증식 세포군)을 포함하는 것일 수 있다. 상기 노화 세포군은 적어도 2개 이상의 서로 다른 노화 원인을 갖는 복수의 노화 세포군일 수 있다. 상기 노화 원인은 복제 노화(Replicative senescence), 종양유전자 유도 노화(Oncogene induced senescence) 및 치료 유도 노화(Therapy induced senescence)로 이루어진 군으로부터 선택된 어느 하나인 것일 수 있다. 예를 들면, 상기 실험데이터는 복제 노화 세포군, 종양유전자 유도 노화 세포군, 및 대조군 세포군을 포함할 수 있다. 또한, 상기 실험데이터는 복제 노화 세포군, 종양유전자 유도 노화 세포군, 치료 유도 노화 세포군 및 대조군 세포군을 포함할 수 있다. 상기 실험데이터 내의 각각의 세포군은 동일한 실험실 또는 서로 상이한 실험실로부터 유래된 것일 수 있다.

일 구체예에 있어서, 상기 실험데이터는 생물학적 샘플로부터 실험적으로 측정되거나, 공지된 문헌으로부터 획득하거나, 또는 데이터베이스(DB)에 저장된 데이터를 포함할 수 있다. 상기 데이터베이스는 NCBI(National Center for Biotechnology Information), Gene　Expression Omnibus (GEO), European Bioinformatics Institute databases, 또는 European Nucleotide Archive를 포함할 수 있다. 상기 RNA 시퀀싱 데이터는 FASTQ 포맷의 형태로 구성된 것일 수 있다.

일 구체예에 있어서, 상기 획득된 복수의 서로 다른 실험데이터를 훈련 셋과 검정 셋으로 분류하는 단계를 더 포함할 수 있다. 상기 분류하는 단계는 상기 실험데이터를 획득하고 수행되거나, 배치-수정된 데이터를 획득하고 수행될 수 있다. 상기 훈련 셋과 검정 셋의 실험데이터는 소정의 비율(예를 들면, 약 90:10, 약 80:20, 약 75:25, 약 60:40, 약 50:50, 약 40:60, 약 25:75, 약 20:80, 또는 약 10:90)로 분류될 수 있다. 또한, 상기 훈련 셋과 검정 셋은 상기 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군과 대조군 각각을 모두 포함하는 것일 수 있다. 예를 들면, 상기 훈련 셋 또는 검정 셋은 복제 노화 세포군, 종양유전자 유도 노화 세포군, 및 대조군 세포군을 포함할 수 있다. 또한, 상기 훈련 셋 또는 검정 셋은 복제 노화 세포군, 종양유전자 유도 노화 세포군, 치료 유도 노화 세포군 및 대조군 세포군을 포함할 수 있다. 상기 훈련 셋 또는 검정 셋 내의 각각의 세포군은 동일한 실험실 또는 서로 상이한 실험실로부터 유래된 것일 수 있다.

일 구체예에 있어서, 상기 배치-수정된(batch-corrected) 데이터를 획득하는 단계는, 상기 RNA 시퀀싱 데이터를 Fastq 데이터로 구성하고, 상기 Fastq 데이터를 입력하는 단계; 상기 입력된 Fastq 데이터를 품질 관리(Quality control)하고 전처리(pre-processing)하여 클린 리드(clean reads)를 획득하는 단계; 상기 클린 리드를 대응되는 유전체 또는 전사체에 대해 정렬(alignment)시키는 단계; 및/또는 상기 클린 리드에 대응되는 유전체 또는 전사체의 전사물(transcript)을 조립(assembly)하는 단계; 상기 조립된 전사물을 정량화하는 단계를 포함하는 것일 수 있다.

일 구체예에 있어서, 상기 품질 관리는 FASTQ 프로그램, NGSQC 프로그램, 또는 RNA-SeQC 프로그램을 이용하여 수행되는 것일 수 있다. 상기 전처리하여 클린 리드를 획득하는 단계는 Trimmomatic, PRINSEQ, 또는 Soapnuke를 이용하여 수행되는 것일 수 있다. 상기 정렬시키는 단계는, Salmon, Ensemble, Tophat2, HISAT2, STAR, BWA, 또는 Bowtie를 이용하여 수행되는 것일 수 있다, 상기 전사물을 조립하는 단계는, Tximeta, Cufflinks, StringTie, Trinity, SOAPdenovoTrans, 또는 Trans-AByS를 이용하여 수행되는 것일 수 있다, 상기 정량화하는 단계는, limma FeatureCount, HTSeq-Count, Cufflinks, eXpress, RSEM, DEXSeq, Kallisto, Sailfish, 또는 Salmon을 이용하여 수행되는 것일 수 있다.

일 구체예에 있어서, 상기 배치-수정된 데이터 중 훈련 셋에 대해 모든 세포군에서 발현량이 유의적으로 낮은 유전자는 노화 마커 후보 유전자에서 제거하는 단계를 더 포함할 수 있다. 상기 발현량이 유의적으로 낮은 유전자의 제거는 edgeR 패키지를 통해 제거하는 것일 수 있다.

일 구체예에 있어서, 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 단계는 노화 세포군에서 대조군 대비 유전자의 발현량이 변화된 유전자들 중 유의 확률 p 값(probability value)이 0.05 이하이거나, 발현량의 변화량이 약 2배 이상 또는 약 1/2배 이하인 유전자를 선별하는 단계; 또는 상기 차별적으로 발현하는 유전자에 대해 GO(gene ontology) 분석을 수행하여 검증하는 단계를 더 포함하는 것일 수 있다. 상기 차별적으로 발현하는 유전자의 분석은 분석은 R package edgeR (v3.10)을 통해 진행되었으며 TMM 정상화 이후 샘플의 노화 상태 정보와 배치 정보에 따라 분석 디자인을 구축함으로써 수행되는 것일 수 있다.

일 구체예에 있어서, 상기 회귀 모델은 기계 학습 모델, 예를 들면, 지도-학습 모델을 포함하는 것일 수 있다. 일 실시예에 있어서, 상기 회귀 모델은 LASSO 모델, 선형 회귀 모델, 및/또는 다른 지도-학습 모델을 포함할 수 있다. 상기 회귀 모델의 독립변수(특징점)는 상기 선별된 유전자의 발현 값(TMM normalized Log₂CPM (count per million))일 수 있고, 종속변수는 데이터의 상태가 대조군(proliferating control)인 경우 0, 노화군(senescent status)인 경우 1로 할당된 것일 수 있다.

또한, 상기 회귀 모델은 LOOCV(Leave one out cross validation)을 포함하는 것일 수 있다. 상기 LOOCV는 총 N(샘플 수 만큼)번의 모델을 만들고, 각 모델을 만들 때에 하나의 샘플만 제외하면서 그 제외한 샘플로 검정 셋의 퍼포먼스(test set performance)를 계산하여 N개의 퍼포먼스(performance)에 대해서 평균을 내는 방법을 포함하는 것일 수 있다.

일 구체예에 있어서, 상기 방법은 상기 선별된 노화세포의 마커를 검정하는 단계를 더 포함하는 것일 수 있다.

상기 검정하는 단계는, (i) 상기 복수의 서로 다른 실험데이터의 적어도 일부를 검정 셋(test set)으로 하여 상기 검정 셋에서 훈련 셋과 동일한 방법으로 선별된 노화세포의 마커가 발현되는지 여부를 확인하는 단계; 및/또는 (ii) 상기 선별된 세포 노화의 마커를 훈련 셋에 적용하여 노화 예측 모델을 생성하고, 이를 이용하여 검정 셋에 대한 검정을 수행하는 단계를 포함하는 것일 수 있다.

일 구체예에 있어서, 상기 (ii) 단계는, 상기 획득한 복수의 서로 다른 실험데이터와 다른 경로로 획득된 세포 노화의 마커를 상기 훈련 셋에 적용하여 노화 예측 모델을 생성하고, 이를 이용하여 추가적인 검정 셋에 대한 검정을 수행하며, 상기 검정 결과를 상기 (ii) 단계의 검정 결과와 비교하는 단계를 포함하는 것일 수 있다.

일 구체예에 있어서, 상기 노화 예측 모델은 기계 학습 모델, 예를 들면, 지도-학습 모델을 포함하는 것일 수 있다. 일 실시예에 있어서, 상기 노화 예측모델은 서포트 벡터 머신을 통해 생성된 것일 수 있다.

상기 노화 예측 모델은, 선별된 유전자인 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자를 기계 학습 모델, 예를 들면, 서포트 벡터 머신을 통해 생성된 것일 수 있다.

상기 노화 예측 모델은, 선별된 유전자인 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자를 기계 학습 모델, 예를 들면, 서포트 벡터 머신을 통해 생성된 것일 수 있다.

상기 노화 예측 모델은, 선별된 유전자인 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자를 기계 학습 모델, 예를 들면, 서포트 벡터 머신을 통해 생성된 것일 수 있다.

본 명세서의 또 다른 양상은 상기 생성된 세포 노화 예측 모델을 제공하는 것이다.

다른 구체예에 있어서, 상기 방법은 각 단계에서 유전자를 선별하면서 검증하는 단계를 더 포함할 수 있다. 상기 선별된 유전자의 검증은 GO(Gene ontology) 분석, 주성분 분석 또는 클러스터링을 통해 수행되는 것일 수 있다.

또 다른 양상은, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.

또 다른 양상은, 세포 노화의 마커를 검출하기 위한 장치를 제공하는 것이다.

상기 장치는, 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 및 대조군 세포의 RNA 시퀀싱 데이터를 포함하는 복수의 서로 다른 실험데이터를 획득하는 획득부;

상기 획득된 복수의 서로 다른 실험데이터의 전사체(trasncriptome)를 분석 파이프라인을 통해 정량화하여 서로 다른 실험에서 파생되는 배치 효과(batch effect)를 감소시켜 배치-수정된(batch-corrected) 데이터 획득부;

상기 배치-수정된 데이터 중 훈련 셋(training set) 내의 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군 각각에 대해 대조군 세포 대비 차별적으로 발현하는 유전자(differentially expressed genes)를 선별하는 제1 선별부;

상기 선별된 유전자 중 복수의 서로 다른 노화 유도 원인을 갖는 노화 세포군에서 공통적으로 존재하는 유전자들 선별하는 제2 선별부; 및

지도 학습(supervised learning)이 가능한 회귀 모델(regression model)을 이용하여 상기 선별된 유전자에 대해 세포 노화의 마커를 선별하는 제3 선별부를 포함할 수 있다.

또 다른 양상은, 세포 노화를 검출하기 위한 조성물을 제공하는 것이다.

상기 조성물은 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 것일 수 있다.

상기 조성물은 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 것일 수 있다.

상기 조성물은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 것일 수 있다.

일 구체예에 있어서, 상기 유전자의 발현 수준 측정은 생물학적 시료에서 유전자들의 mRNA 존재 여부와 발현 정도를 확인하는 과정으로 mRNA의 양을 측정하는 것을 포함할 수 있다. 이를 위한 분석 방법으로는 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR), 실시간 역전사 중합효소반응(Real-time RT-PCR), RNase 보호 분석법(RPA; RNase protection assay), 노던 블랏팅(Northern blotting), DNA 칩 등을 포함할 수 있다.

상기 유전자의 발현 수준을 측정할 수 있는 제제는 프라이머, 프로브 또는 안티센스 올리고뉴클레오티드를 포함할 수 있다. 상기 유전자들의 핵산 정보가 GeneBank 등에 알려져 있으므로 당업자는 상기 서열을 바탕으로 이들 유전자의 특정 영역을 특이적으로 증폭하는 프라이머 또는 프로브를 디자인할 수 있다.

본 명세서에서 사용된 용어 "프라이머"는 표적 유전자 서열을 인지하는 정방향 및 역방향의 프라이머로 이루어진 모든 조합의 프라이머쌍을 포함하고, 상세하게는 특이성 및 민감성을 가지는 분석 결과를 제공하는 프라이머 쌍이다.

본 명세서에서 사용된 용어 "프로브"란 시료 내의 검출하고자 하는 표적 물질과 특이적으로 결합할 수 있는 물질을 의미하며, 상기 결합을 통하여 특이적으로 시료 내의 표적 물질의 존재를 확인할 수 있는 물질을 의미한다. 프로브 분자의 종류는 당업계에서 통상적으로 사용되는 물질로서 제한은 없으나, 바람직하게는 PNA (peptide nucleic acid), LNA (locked nucleic acid), 펩타이드, 폴리펩타이드, 단백질, RNA 또는 DNA 일 수 있다. 보다 구체적으로, 상기 프로브는 바이오 물질로서 생물에서 유래되거나 이와 유사한 것 또는 생체외에서 제조된 것을 포함하는 것으로 예를 들어, 효소, 단백질, 항체, 미생물, 동식물 세포 및 기관, 신경세포, DNA, 및 RNA일 수 있으며, DNA는 cDNA, 게놈 DNA, 올리고뉴클레오타이드를 포함하며, RNA는 게놈 RNA, mRNA, 올리고뉴클레오타이드를 포함하며, 단백질의 예로는 항체, 항원, 효소, 펩타이드 등을 포함할 수 있다.

본 명세서에서 용어, "안티센스 올리고뉴클레오티드"는 특정 유전자(예를 들면, 특정 유전자의 mRNA)의 서열에 상보적인 핵산 서열을 함유하고 있는 DNA 또는 RNA 또는 이들의 유도체로서, mRNA 내의 상보적인 서열에 결합하여 mRNA의 단백질로의 번역을 저해하는 작용을 한다. 안티센스 올리고뉴클레오티드 서열은 상기 유전자들의 mRNA에 상보적이고 상기 mRNA에 결합할 수 있는 DNA 또는 RNA 서열을 의미한다. 이는 상기 유전자 mRNA의 번역, 세포질 내로의 전위(translocation), 성숙(maturation) 또는 다른 모든 전체적인 생물학적 기능에 대한 필수적인 활성을 저해할 수 있다. 안티센스 올리고뉴클레오티드의 길이는 6 내지 100 염기, 바람직하게는 8 내지 60 염기, 보다 바람직하게는 10 내지 40 염기일 수 있다.

일 구체예에 있어서, 상기 단백질의 발현 또는 활성 수준 측정은 생물학적 시료에서 상기 단백질의 존재 여부와 발현(또는 활성) 정도를 확인하는 과정을 포함할 수 있다. 이를 위한 분석 방법으로는 단백질 칩 분석, 면역측정법, 리간드 바인딩 어세이, MALDI-TOF(Matrix Desorption/Ionization Time of Flight Mass Spectrometry)분석, SELDI-TOF(Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry)분석, 방사선 면역분석, 방사 면역 확산법, 오우크테로니 면역 확산법, 로케트 면역전기영동, 조직면역 염색, 보체 고정 분석법, 2차원 전기영동 분석, 액상 크로마토그래피-질량분석(liquid chromatography-Mass Spectrometry, LC-MS), LC-MS/MS(liquid chromatography-Mass Spectrometry/ Mass Spectrometry), 웨스턴 블랏, 및 ELISA(enzyme linked immunosorbentassay) 등을 포함할 수 있다.

상기 단백질의 활성 수준을 측정할 수 있는 제제는 항체, 앱타머, 아비머(avidity multimer) 또는 페티도모방체(peptidomimerics)를 포함하는 것일 수 있다.

본 명세서에서 사용된 용어 "항체"는 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미할 수 있다. 본 발명의 목적상, 항체는 상기 에스트로겐 수용체, MUCIN5AC, 또는 아로마타제 단백질에 대해 특이적으로 결합하는 항체를 의미하며, 다클론 항체, 단클론 항체 및 재조합 항체를 모두 포함한다. 항체를 생성하는 것은 당업계에 널리 공지된 기술을 이용하여 용이하게 제조할 수 있다. 또한 본 명세서의 항체는 2개의 전체 길이의 경쇄 및 2개의 전체 길이의 중쇄를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체분자의 기능적인 단편이란 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab') 2 및 Fv 등이 있다.

또 다른 양상은, RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 키트를 제공하는 것이다.

또 다른 양상은, EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 키트를 제공하는 것이다.

또 다른 양상은, GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 키트를 제공하는 것이다.

일 구체예에 있어서, 상기 키트는 RT-PCR(Reverse transcription polymerase chain reaction) 키트, DNA 칩 키트, 마이크로어레이 키트, ELISA(Enzyme-linked immunosorbent assay) 키트, 단백질 칩 키트, 래피드(rapid) 키트 또는 MRM(Multiple reaction monitoring) 키트일 수 있다.

또한, 상기 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치를 더 포함하여 구성될 수 있다. 예를 들면, 상기 키트는 역전사 중합효소반응을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. 역전사 중합효소반응 키트는 마커 유전자에 대한 특이적인 각각의 프라이머 쌍을 포함한다. 프라이머는 상기 각 유전자의 핵산서열에 특이적인 서열을 가지는 뉴클레오타이드로서, 약 7 bp 내지 50 bp의 길이, 보다 바람직하게는 약 10 bp 내지 30 bp 의 길이이다. 또한 대조군 유전자의 핵산 서열에 특이적인 프라이머를 포함할 수 있다. 그외 역전사 중합효소반응 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNAse, RNAse 억제제 DEPC-수(DEPC-water), 멸균수등을 포함할 수 있다. 또한, 예를 들면, DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드(oligonucleotide)가 부착되어 있는 기판, 및 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한 기판은 대조군 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드를 포함할 수 있다. 또한, 예를 들면, 상기 키트는 LISA를 수행하기 위해 필요한 필수 요소를 포함하는 진단 키트일 수 있다. ELISA 키트는 상기 단백질에 대한 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다. 또한 ELISA 키트는 대조군 단백질에 특이적인 항체를 포함할 수 있다. 그 외 ELISA 키트는 결합된 항체를 검출할 수 있는 시약, 예를 들면, 표지된 2차 항체, 발색단(chromophores), 효소(예: 항체와 컨주게이트됨) 및 그의 기질 또는 항체와 결합할 수 있는 다른 물질 등을 포함할 수 있다. 또한, 예를 들면, 상기 키트는 분석결과를 알 수 있는 신속한 테스트를 수행하기 위해 필요한 필수 요소를 포함하는 래피드(rapid) 키트 일 수 있다. 래피드 키트는 단백질에 대한 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다. 또한 래피드 키트는 대조군 단백질에 특이적인 항체를 포함할 수 있다. 그 외 래피드 키트는 결합된 항체를 검출할 수 있는 시약, 예를 들면, 특이항체와 2차 항체가 고정된 나이트로 셀룰로오스 멤브레인, 항체가 결합된 비드에 결합된 멤브레인, 흡수패드와 샘플 패드 등 다른 물질 등을 포함할 수 있다. 또한, 예를 들면, 상기 키트는 질량 분석을 수행하기 위해 필요한 필수 요소를 포함하는 MS/MS 모드인 MRM(Multiple reaction monitoring) 키트일 수 있다. SIM(Selected Ion Monitoring)이 질량분석기의 소스 부분에서 한 번 충돌하여 생긴 이온을 이용하는 방법인 반면, MRM은 상기 한 번 깨진 이온 중에서 특정 이온을 한 번 더 선택하여 연속적으로 연결된 또 다른 MS의 소스를 한 번 더 통과시켜 충돌시킨 후 이 중에서 얻은 이온들을 이용하는 방법이다. 상기 MRM(Multiple reaction monitoring) 분석 방법들을 통하여, 정상 대조군의 단백질 발현 수준과 노화 세포군의 단백질 발현 수준을 비교할 수 있고, 또한, 마커 유전자에서 단백질로의 유의한 발현량 증감여부를 판단하여, 노화 세포군 여부를 판단할 수 있다.

또 다른 양상은 분리된 생물학적 시료로부터 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2,및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공하는 것이다.

일 구체예에 있어서, 상기 방법은 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 것일 수 있다.

또 다른 양상은 분리된 생물학적 시료로부터 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공하는 것이다.

일 구체예에 있어서, 상기 방법은 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 것일 수 있다.

또 다른 양상은 분리된 생물학적 시료로부터 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법을 제공하는 것이다.

일 구체예에 있어서, 상기 방법은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 것일 수 있다.

일 구체예에 있어서, 상기 유전자의 발현 수준을 측정하는 방법은 역전사 중합효소반응, 경쟁적 역전사 중합효소반응, 실시간 역전사 중합효소반응, RNase 보호 분석법, 노던 블랏팅 또는 DNA 칩을 포함할 수 있다.

일 구체예에 있어서, 상기 단백질의 활성 수준을 측정하는 방법은 웨스턴 블랏팅, ELISA, 방사선 면역분석법, 방사선 면역확 산법, 오우크테로니 (Ouchterlony) 면역확산법, 로케트 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고 정분석, FACS 또는 단백질 칩을 포함할 수 있다.

또 다른 양상은 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및

무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법을 제공하는 것이다.

일 구체예에 있어서, 상기 방법은 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 것일 수 있다.

또 다른 양상은 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및

일 구체예에 있어서, 상기 방법은 상기 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 것일 수 있다.

또 다른 양상은 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및

일 구체예에 있어서, 상기 방법은 상기 GAS2L3, AMOT 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 것일 수 있다.

상기 피검 물질, 예를 들면, 약물 후보 물질, 피검 화합물 또는 피검 조성물은 저분자 화합물, 항체, 안티센스 뉴클레오티드, 작은 간섭 RNA(short interfering RNA), 짧은 헤어핀 RNA(short hairpin RNA), 핵산, 단백질, 펩티드, 기타 추출물 또는 천연물을 포함할 수 있다.

상기 접촉은 시험관 내(in vitro)에서 수행되는 것일 수 있다. 예를 들면, 상기 유전자 또는 단백질들을 발현하는 또는 낙아웃된 벡터를 세포에 형질전환 하는 단계; 상기 형질전환된 세포에 약물 후보물질을 처리하는 단계를 포함할 수 있다.

상기 세놀리틱 약물은 임상적으로 유의적이거나, 또는 생물학적으로 유의적인 방식으로 노화 세포를 선택적으로(우선적으로 또는 더욱 큰 정도로) 사멸 또는 파괴시키는 데 사용될 수 있는 제제를 의미할 수 있다. 상기 세놀리틱 제제는 노화 세포(예컨대, 노화 지방 전구 세포, 노화 내피 세포, 노화 섬유아세포, 노화 뉴런, 노화 상피 세포, 노화 중간엽 세포, 노화 평활근 세포, 노화 대식세포, 또는 노화 연골 세포) 중 하나 이상의 유형을 선택적으로 사멸시킬 수 있는 제제를 포함할 수 있다.

일 양상에 따른 기계 학습을 이용한 세포 노화의 마커를 선별하는 방법에 의하면, 노화 세포 RNA-seq 데이터에 대한 메타분석을 진행하는 분석 파이프라인을 구축하여 충분한 샘플 수를 확보함으로써 통계적으로 보다 유의한 유전자들을 선별할 수 있고, 기계학습적 방법론을 통해 다양한 변수들 중에서 노화 세포 특징적 마커의 후보군을 찾아낼 수 있는 효과가 있다.

상기 방법에 의해 도출된 세포 노화의 마커는, 기존의 연구보다 다양한 종류의 세포들에도 세포 노화를 특정할 수 있는 더 유의한 유전자 시그니처로서, 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있을 뿐만 아니라, 세놀리틱 제제를 선별하는데 유용하게 사용될 수 있는 효과가 있다.

도 1은 일 구체예에 따른 세포 노화의 마커를 검출하는 방법을 나타낸 흐름도이다.

도 2에 일 실시예에 따른 세포 노화의 바이오 마커를 선별하기 위한 모식도이다.

도 3은 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.

도 4는 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 클러스터링 분석 결과를 나타낸 도면이다.

도 5는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.

도 6은 선별된 공통 발현 유전자의 GO 분석 결과를 나타낸 도면이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.

도 7은 선별된 공통 발현 유전자 363개에 대한 PCA 분석 결과를 나타낸 도면이다.

도 8은 선별된 공통 발현 유전자 363개에 대한 클러스터링 분석 결과를 나타낸 도면이다.

도 9는 LASSO에 의해 선별된 15개 유전자의 각 계수(Coefficient) 값을 Barplot으로 나타낸 도면이다.

도 10은 LASSO에 의해 선별된 유전자 15개에 대한 PCA 분석 결과를 나타낸 도면이다.

도 11은 LASSO에 의해 선별된 유전자 15개에 대한 클러스터링 분석 결과를 나타낸 도면이다.

도 12는 검정 셋 데이터(n=84)에서의 LASSO 선별 15개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 6개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.

도 13은 두 개의 세포 노화 분류 모델의 성능 평가를 위한 ROC 커브 결과를 나타낸 그래프이다; a: 일 구체예의 검정 데이터, b: 추가적인 다양한 노화 세포 데이터.

도 14는 재선별된 샘플 전체(n=147)에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.

도 15는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.

도 16은 선별된 공통 발현 유전자의 GO 분석 결과를 나타낸 도면이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.

도 17은 LASSO에 의해 선별된 17개 유전자의 각 계수(Coefficient) 값을 Barplot으로 나타낸 도면이다.

도 18은 LASSO에 의해 선별된 유전자 17개에 대한 PCA 분석 결과를 나타낸 도면이다.

도 19는 LASSO에 의해 선별된 유전자 17개에 대한 클러스터링 분석 결과를 나타낸 도면이다.

도 20은 검정 셋 데이터(n=68)에서의 LASSO 선별 17개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 8개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.

도 21은 다섯 개의 세포 노화 분류 모델의 성능 평가를 위한 ROC 커브 결과를 나타낸 그래프이다; a: 일 구체예의 검정 데이터, b: 추가적인 다양한 노화 세포 데이터.

도 22는 HUVEC 세포를 계대배양하여 노화시킨 후, 노화여부를 SA β-Gal 염색을 통해 확인한 결과이다.

도 23는 노화 유도 세포에서 GAS2L3, AMOT 및 WDR76의 발현량 감소를 RT-PCR 및 전기영동을 통해 확인한 결과이다.

도 24는 노화 유도 세포에서 GAS2L3, AMOT 및 WDR76의 발현량 감소를 qPCR을 통해 정량적으로 확인한 결과이다.

이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.

실시예 1. 세포 노화의 바이오마커 규명

도 2에 일 실시예에 따른 세포 노화의 바이오 마커를 선별하기 위한 모식도를 나타내었다.

구체적으로 하기와 같다.

1.1 데이터 셋 준비 및 분석

노화 세포 관련 마커를 규명하기 위해 ENA (European Nucleotide Archive) 공공 데이터베이스 (http://www.ebi.ac.uk/ena/browser/home)　에서 RNA-seq 데이터를 이용하였다.

노화 세포의 RNA-seq 발현 데이터 셋을 포함하는 13개의 서로 다른 실험 데이터 (GSE63577, GSE72407, GSE113060, GSE70668, GSE132370, GSE130727, GSE98440, GSE109700, GSE130306, GSE94395, GSE168994, GSE72404, GSE75643)를 선정하고, 다양한 유도체(inducer type)에 의해 일어난 섬유아세포 (BJ, HFF, IMR-90, WI-38, LF1, TIG3) 데이터 및 이에 해당하는 대조군 데이터들을 Fastq 포맷으로 다운로드 하였다. 데이터는 대조군 73개, 실험군 92개의 총 165개 샘플로 구성하였으며, 각 데이터들의 특성을 노화 세포가 유도된 유도체(Replicative senescence, Oncogene induced senescence(OIS), Therapy induced senescence(TIS))별로 정리하였다. 또한, 추후 분석을 통해 최종적으로 선별된 유전자들을 검증하기 위해, 각 GSE별로 훈련 셋과 검정 셋을 할당하였다. 데이터 관련 논문들을 참고하여 훈련 데이터 및 모델 검정을 위한 검정 데이터를 약 5:5의 비율로 할당하였다. 각 데이터들은 모두 Illumina Hiseq 플랫폼으로 생성된 Fastq 데이터들로 구성되어 있으며, 데이터 특성 정보를 하기 표 1에 나타내었다.

샘플 정보

GSE number	샘플의 수 (대조군 : 노화 세포군)	세포노화 종류 (Inducer types)	세포의 기원	카테고리 (Tr(훈련 셋)/Te(검정 셋)
GSE63577	23 (12 : 11)	Replicative	BJ, HFF, IMR90, WI38	Tr
GSE72407	22 (8 : 14)	OIS, TIS	IMR90	Tr
GSE113060	10 (5　: 5)	OIS	IMR90	Tr
GSE70668	6 (3 : 3)	OIS	IMR90	Tr
GSE132370	6 (3 : 3)	TIS	IMR90	Tr
GSE130727	26 (12 : 14)	Replicative, TIS, OIS	IMR90, WI38	Tr/Te
GSE98440	8 (4 : 4)	Replicative	IMR90	Te
GSE109700	9 (3 : 6)	Replicative	LF1	Te
GSE130306	6 (3 : 3)	Replicative	WI38	Te
GSE94395	6 (3 : 3)	TIS	IMR90	Te
GSE168994	4 (2 : 2)	TIS	IMR90	Te
GSE72404	24 (6 : 18)	OIS	IMR90	Te
GSE75643	15 (9 : 6)	OIS	TIG3	Te
Total	165 (73 : 92)	-	-

아울러, 훈련 셋 및 검정 셋의 분할 정보는 하기 표 2에 나타내었다.

샘플 카테고리	대조군	RS	OIS	TIS	Total
훈련 셋	37	13	17	14	81
검정 셋	36	15	24	9	84
Total	73	28	41	23	165

훈련 셋과 검정 셋의 비율은 50:50으로 분할하였으며, 훈련 셋과 검증 셋 내에 특정 유도체 데이터가 편향되어 분포하지 않도록 대략적으로 일정한 비율로 존재하도록 하였다.

1.2 데이터 전처리 및 메타분석

실시예 1.1의 Fastq 파일들을 동일한 파이프라인을 통해 정량화하여, 서로 다른 실험에서 파생되는 배치효과 (Batch effect)를 최소화하고자 SALMON 파이프라인을 제작하여 분석하였다. SALMON 파이프라인은 도 2에 개시된 바와 같이, QC (fastQC, v0.11.9), Trimming (Trimmomatics, v0.39), Mapping (SALMON, v1.10), Raw count quantification (tximeta, v1.4.5), Batch correction (limma, v3.42.2) 단계로 구성되어 있다 (Tximeta 및 limma는 R program v3.6.3 내에서 분석되었음).

1.3 탐색적 자료분석 (Exploratory data analysis)

각각의 GSE별 발현 데이터에 대해 TMM normalization & Log₂CPM (count per million) 정규화 이후 limma (v3.42.2)의 removeBatchEffect function을 이용하여 배치 효과를 확인하였다. 이후에, Batch-corrected, TMM normalized log₂CPM 값을 이용하여 발현 데이터를 분석하였고, 샘플 전체에 걸쳐 발현량이 낮은 유전자들을 edgeR 패키지를 통해 제거하고, 약 14,000개의 유전자만을 사용하여 분석하였다. 상기 약 14,000개의 유전자에 대해 PCA (Principal component analysis) 분석을 진행하였고, Spearman correlation을 통해 PCA 및 클러스터링 결과를 각각 도 3 및 도 4에 나타내었다.

1.4 차별발현 유전자 분석 (Differentially expressed genes analysis, DEG analysis)

훈련 데이터 중 유도체별로 분류된 샘플 그룹 각각에 대해, 정상 세포 그룹 대비 노화 세포 그룹에서 발현량이 증가 혹은 감소한 유전자들을 선별하기 위해 차별발현 유전자 분석을 진행하였다. 분석은 R package edgeR (v3.10)을 통해 진행되었으며 TMM normalization 이후 샘플의 노화 상태 정보와 배치 정보에 따라 분석 디자인을 구축하였다. 여러 번 가설 검정시 발생하는 multiple comparison 문제를 해결하기 위해 조정된 p값(adjusted p-values)을 계산하였고, 발현량이 변화된 유전자들 중 조정된 p값이 0.05 이하인 기준을 만족하면서, 동시에 발현값의 변화량(fold change)이 2배 이상(up-regulated) 혹은 1/2배 이하(down-regulated)인 유전자들만을 선별하였다. 각각의 유도체(inducer type)별로 살펴보면, RS에서 총 1,444개의 유전자(up-regulated genes : 877, down-regulated genes : 567)가, OIS에서 총 1,647개의 유전자(up-regulated genes : 602, down-regulated genes : 1,045), TIS에서 총 1,405개의 유전자(up-regulated genes : 802, down-regulated genes : 603)가 차별발현 유전자로 선별되었고, 이를 하기 표 3에 나타내었다.

차별발현 유전자 분석 정보

Inducer type	Comparison (Control : Senescent)	Up-regulated genes	Down-regulated genes	Total DEGs
RS	13 : 13	877	567	1,444
OIS	16 : 17	602	1,045	1,647
TIS	14 : 14	802	603	1,405

유도체(inducer type)별 차별발현유전자(DEG) 중 유도체의 종류와 무관하게 발현되는 세포 노화의 특징적 유전자를 선별하기 위해 유도체별 DEG 결과를 up-regulated gene과 down-regulated gene으로 나눈 후, 벤다이어그램으로 각각 나타내어 유전자의 교집합을 선별하였다. 상기 벤다이어그램은 도 5에 나타내었다. 도 5는 각 유도체(inducer type)별 차별 발현 유전자들 중 전체 유도체에 걸쳐 공통적으로 존재하는 유전자의 수를 나타낸 벤다이어그램이다; a: 발현이 증가한 유전자, b: 발현이 감소한 유전자.

도 5에 나타낸 바와 같이, 총 85개의 up-regulated gene과 278개의 down-regulated gene의 총 363개의 유전자가 선별되었고, 이 유전자들은 유도체의 종류와 무관하게 노화 세포에서 발현되고 있음을 의미한다.

이후에, 선별된 공통 발현 유전자들이 세포 노화적 특성을 반영하는 유전자 세트인지 확인하기 위해, gProfiler (https://biit.cs.ut.ee/gprofiler/)를 활용하여 GO(gene ontology) 분석을 시행하여 363개의 유전자와 관련있는 생물학적 경로들을 탐색하였다. 유전자들의 발현 증감 방향성에 따라 각각 GO 분석을 진행하였고, GO 결과는 조정된 p-value 값이 0.05 이하인 결과만을 선별하였으며, 그 결과를 도 6에 나타내었다.

도 6에 나타낸 바와 같이, 노화 세포에서 발현이 공통적으로 증가한 85개의 유전자는 세포 노화의 알려진 특징인 DNA-damage response, SASP(Senescence associated secretory phenotype), Inhibition of DNA recombination at telomere, Immune response 및 여러가지 Cellular senescence pathway 관련 특성들이 유의미하게 나타남을 확인할 수 있었다. 또한, 노화 세포에서 발현이 공통적으로 감소한 278개 유전자의 경우 마찬가지로 이미 알려진 세포 노화의 특성에 해당하는 cell cycle 과 관련된 생물학적 경로들 및 DNA replication, DNA repair, telomere maintenance, chromosome organization 및 segregation 과 연관이 있음을 확인하였다. 이를 통해 전체 363개의 교집합 유전자 세트가 세포 노화의 특성을 잘 반영함을 확인할 수 있었다.

다음으로, 상기 선별된 공통 발현 유전자 363개를 이용하여 1.3.과 동일하게 PCA 분석 및 클러스터링 분석을 진행하였고, 그 결과를 각각 도 7 및 도 8에 나타내었다.

도 7에 나타낸 바와 같이, 선별된 공통 발현 유전자 363개의 PCA 결과는 도 3의 약 14,000개의 유전자의 PCA 결과에 비해 PC1에 의한 데이터의 분류가 더 잘 설명되나, 노화 세포와 대조군 데이터를 명확하게 구분하지 못함을 알 수 있었다.

도 8에 나타낸 바와 같이, 선별된 공통 발현 유전자 363개의 클러스터링 결과는 도 4의 약 14,000개의 유전자의 클러스터링 결과와 비교하여 유전자들의 발현 패턴이 노화 세포와 대조군 사이에서 구별되지만 노화 세포와 대조군 데이터를 명확하게 구분하지는 못함을 알 수 있었다.

1.5 LASSO (least absolute shrinkage and selection operator)를 이용한 변수 선택

선별된 363개의 유전자 중 세포 노화의 특성을 가장 잘 나타내는 최소한의 유전자를 선별하고자 LASSO 회귀를 통해 유전자에 대한 변수 선택 과정을 진행하였다.

구체적으로, LASSO 회귀는 R package glmnet 4.0-2를 통해 진행되었고, 훈련 데이터 총 81개 데이터 셋의 TMM normalized Log₂CPM (count per million) 값을 사용하여 샘플의 상태에 따라 Control(=0) 혹은 Senescent(=1) 값을 할당한 후 binary classification 모델에 대한 파라미터 조정을 진행하여 선별된 결과값이다. Leave-one-out-cross-validation을 통해 최적의 lambda (λ값 0.006)을 설정한 후 모델을 적합하여 최종적으로 15개의 유전자를 선별하였다. 해당 유전자는 ENSG00000048392(RRM2B), ENSG00000139318(DUSP6), ENSG00000186088(GSAP), ENSG00000151320(AKAP6), ENSG00000228486(C2orf92), ENSG00000285901(AC008012.1), ENSG00000013297(CLDN11), ENSG00000198830(HMGN2), ENSG00000159259 (CHAF1B), ENSG00000003096(KLHL13), ENSG00000213347(MXD3), ENSG00000158321(AUTS2), ENSG00000166833(NAV2), ENSG00000010292(NCAPD2), ENSG00000176894(PXMP2) 이며, 각 유전자들의 계수(coefficient)를 통해 세포 노화에서의 해당 유전자의 발현 방향성(+/-) 및 영향력을 나타낸다. 총 6개의 유전자 (RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1)는 양의 계수를 지니므로 노화 세포에서 발현이 증가한 것이고, 나머지 9개의 유전자 (CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, PXMP2)는 음의 계수를 지니므로 노화 세포에서의 발현이 감소한 것이다.

상기 LASSO 회귀를 통해 유전자에 대한 변수 선택 과정을 진행한 결과는 하기 표 4 및 도 9에 나타내었다.

LASSO 회귀를 통해 선별된 세포 노화 특징 유전자

Ensembl gene id	SYMBOL	Coefficient	Description
ENSG00000048392	RRM2B	1.85	Ribonucleotide Reductase Regulatory TP53 Inducible Subunit M2B
ENSG00000139318	DUSP6	0.45	Dual Specificity Phosphatase 6
ENSG00000186088	GSAP	0.45	Gamma-Secretase Activating Protein
ENSG00000151320	AKAP6	0.28	A-Kinase Anchoring Protein 6
ENSG00000228486	C2orf92	0.16	Chromosome 2 Open Reading Frame 92
ENSG00000285901	AC008012.1	0.13	Novel Transcript
ENSG00000013297	CLDN11	-0.02	Claudin 11
ENSG00000198830	HMGN2	-0.03	High Mobility Group Nucleosomal Binding Domain 2
ENSG00000159259	CHAF1B	-0.14	Chromatin Assembly Factor 1 Subunit B
ENSG00000003096	KLHL13	-0.26	Kelch Like Family Member 13
ENSG00000213347	MXD3	-0.32	MAX Dimerization Protein 3
ENSG00000158321	AUTS2	-0.41	Activator Of Transcription And Developmental Regulator AUTS2
ENSG00000166833	NAV2	-0.51	Neuron Navigator 2
ENSG00000010292	NCAPD2	-0.94	Non-SMC Condensin I Complex Subunit D2
ENSG00000176894	PXMP2	-1.19	Peroxisomal Membrane Protein 2

이후에, 81개의 훈련 셋 데이터에 대해 LASSO에 의해 선별된 15개의 유전자를 이용하여 상기 1.3.과 동일하게 PCA 및 클러스터링 분석을 진행하였고, 그 결과를 각각 도 10 및 도 11에 나타내었다.

도 10에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 15개의 PCA 결과는 도 3 및 도 7의 PCA 결과와 비교하여, PC1에 의해 노화 세포와 대조군 데이터가 명확하게 구분되는 것을 확인 할 수 있으며 PC1의 데이터 구분에 대한 설명도 증가하였음을 알 수 있었다.

도 11에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 15개의 클러스터링 결과는 도 4 및 도 8의 클러스터링 결과와 비교하여 유전자들의 발현 패턴이 노화 세포와 대조군 사이에서 명확하게 구별되며, 노화 세포와 대조군 데이터를 명확하게 구분함을 알 수 있었다.

이상의 결과는 LASSO에 의해 선별된 15개의 유전자는 훈련 셋 데이터 내에서 노화 세포의 특성을 잘 반영함을 나타냄을 의미한다.

실시예 2. 선별된 노화 세포 마커 후보 유전자들의 검정

2.1 검정 데이터에서의 대조군 그룹 및 세포 노화 그룹간 유전자 발현 차이 확인

실시예 1에서 선정된 15개의 노화 세포 마커 후보 유전자들의 발현 패턴이 15개 유전자의 선별 과정에 관여하지 않은 84개의 검정 데이터 내에서도 유의미한 발현 차이를 보이는지 확인하였다.

구체적으로, 84개의 검정 데이터에 대해 훈련 데이터와 동일한 과정으로 TMM 정규화 및 limma removeBatchEffect function을 통해 배치 효과를 제거한 후 Log₂CPM 변환 값을 이용하여 대조군 그룹(n = 36)과 노화세포 그룹(n = 48) 사이에서 15개 유전자의 발현에 유의미한 차이가 존재하는지 확인하였고, 그 결과를 도 12에 나타내었다.

2.2 세포 노화 예측 모델 제작

15개의 선별된 유전자들을 훈련 데이터 셋에 적용하여 노화 세포의 상태를 예측하는 2 개의 모델을 제작하여 선별된 유전자들의 유효성을 검증하였다.

구체적으로, 제1 모델은 서포트 벡터 머신(Support vector machine)의 RBF kernel을 통해 제작하였으며, R package e1071 (version 1.7-3)이 사용되었다. 모델의 학습에 사용된 데이터는 상기 학습에 사용된 81개의 훈련 데이터에 대한 15개 유전자의 발현값이 사용되었으며, LOOCV (leave one out cross-validation)을 통해 최적의 분류 모델을 선택하여 제작하였다. 제2 모델은 타 세포 노화 관련 연구 문헌 (Hernandez-Segura et al. 2017) 에서 선정된 55개의 세포 노화 유전자의 발현 값을 훈련 데이터 셋에 적용하여 제1 모델과 동일한 방식으로 SVM 모델을 제작하였다. 제2 모델은 제1 모델과 노화 세포 분류 성능을 비교하기 위해 제작하였다.

2.3 세포 노화 예측 모델 성능 평가

상기 2.2에서 제작한 두 개의 모델을 이용하여 84개의 노화 섬유아세포 검정 데이터 (대조군 36개, 노화 세포 48개)에 대해 분류 검정을 진행하였고, 그 결과를 도 13A에 나타내었다. 추가로 상기 2.2.에서 제작한 두 개의 모델을 이용하여 42개의 다양한 노화 세포 데이터 (대조군 : 18, 노화 세포 : 24, 섬유아세포가 아닌 42개의 서로 다른 종류 (HUVEC, HAEC, MSC, LS8817, Ovcar3))에 대해 분류 검정을 진행하였고, 그 결과를 도 13B에 나타내었다. 검정 데이터의 Log₂CPM 값들은 훈련 데이터의 발현 값의 평균 및 표준편차를 기준으로 스케일링 후 검정 하였다.

도 13에 나타낸 바와 같이, 두 결과 모두에서 LASSO에 의해 선정된 15개의 유전자 모델이 더 좋은 성능을 보이는 것을 확인 할 수 있었다.

a: LASSO 15 gene model AUC: 98.9% > Hernandez et al, 55 genes model AUC: 97.6%

b: LASSO 15 gene model AUC: 86.6% > Hernandez et al, 55 genes model AUC: 75.9%

따라서 실시예 2의 결과들을 토대로, 일 구체예에 따라 선별된 15개의 유전자의 발현 양상이 LASSO의 계수 부호 양상과 동일하게, 정상 세포와 노화 세포 그룹간 유의미한 차이를 보이는 것을 확인할 수 있었다. 또한, 15개의 유전자로 구축한 노화 세포 분류 모델이 기존에 연구에서 알려진 55개의 세포 노화 관련 유전자로 구축한 노화 세포 분류 모델보다 세포 노화의 특성을 더 잘 나타냄을 확인 할 수 있었다. 또한, 노화 섬유아세포를 포함한 다양한 세포들을 고려하여 특징 유전자를 제시한 기존 연구 (Hernandez-Segura et al. 2017)하였고, 일 구체예에 따른 방법은 노화 섬유아세포만을 훈련 데이터에 사용하여 유전자를 선별하였음에도 불구하고, 다양한 종류의 세포들에 대해서도 기존 연구보다 더 좋은 분류 성능을 보임을 확인할 수 있었다.

이상의 결과는 일 구체예에 따른 방법은 섬유아세포를 포함한 다양한 종류의 세포들에서 통계적으로 더 유의한 마커를 선별할 수 있음을 의미하고, 일 구체예에 따른 방법으로 도출된 15개의 유전자는 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있음을 의미한다.

실시예 3. 추가적인 세포 노화의 바이오마커

상기 실시예 1과 동일한 방법 (도 2)을 이용하되, 1.1 데이터 셋 준비 및 분석의 표 1에 명시된 샘플들 중 노화 특성이 상이한 18개의 샘플들을 제거한 뒤 노화 세포에서 발현이 변화하는 17개 유전자를 추가로 선별하여 보다 정교한 유전자들을 획득하였다.

3.1 데이터 셋 준비 및 분석

상기 실시예 1의 165개 섬유아세포 샘플들 중 18개 샘플을 추가로 제거하여 총 147개의 섬유아세포 샘플들을 획득하였다. 제거된 샘플들의 정보는 다음과 같다.

GSE72404에서는 기존에 활용된 24개 샘플 중 12개의 notch-induced senescence 샘플을 제거하였다. 이는 notch-induced senescence가 primary senescence (RS, OIS 및 TIS) 와 상이한 특성을 보임이 알려져 있기 때문이다. GSE1307272에서는 기존의 26개 샘플에서 4개의 대조군과 2개의 OIS 샘플을 제거하였다. 해당 샘플들은 PCA 결과 이상치로 판단될 수 있어 제거하였다. 데이터 특성 정보를 하기 표 5에 나타내었다.

재선별된 샘플 정보

GSE number	샘플의 수 (대조군 : 노화 세포군)	세포노화 종류 (Inducer types)	세포의 기원	카테고리 (Tr(훈련 셋)/Te(검정 셋)
GSE63577	23 (12 : 11)	Replicative	BJ, HFF, IMR90, WI38	Tr
GSE72407	22 (8 : 14)	OIS, TIS	IMR90	Tr
GSE113060	10 (5　: 5)	OIS	IMR90	Tr
GSE70668	6 (3 : 3)	OIS	IMR90	Tr
GSE132370	6 (3 : 3)	TIS	IMR90	Tr
GSE130727	20 (8 : 12)	Replicative, TIS, OIS	IMR90, WI38	Tr/Te
GSE98440	8 (4 : 4)	Replicative	IMR90	Te
GSE109700	9 (3 : 6)	Replicative	LF1	Te
GSE130306	6 (3 : 3)	Replicative	WI38	Te
GSE94395	6 (3 : 3)	TIS	IMR90	Te
GSE168994	4 (2 : 2)	TIS	IMR90	Te
GSE72404	12 (6 : 6)	OIS	IMR90	Te
GSE75643	15 (9 : 6)	OIS	TIG3	Te
Total	147 (69 : 78)	-	-

아울러, 훈련 셋 및 검정 셋의 분할 정보는 하기 표 6에 나타내었다.

훈련 셋 및 검정 셋의 분할 정보

샘플 카테고리	세포 유형	대조군	RS	OIS	TIS	Total
훈련 셋	Fibroblasts	37	13	15	14	79
검정 셋 1	Fibroblasts	32	15	12	9	68
검정 셋 2	Other cell types	15	7	-	11	33
Total	-	84	35	27	34	180

3.2 데이터 전처리 및 메타분석

상기 실시예 1.2 데이터 전처리 및 메타분석 내용과 동일한 방법으로 수행하였다.

3.3 탐색적 자료분석 (Exploratory data analysis)

상기 실시예 1.3 탐색적 자료분석 내용과 동일한 방법으로 수행하였다. 약 14,000개의 유전자에 대해 PCA (Principal component analysis) 분석을 진행하였고, Spearman correlation을 통해 PCA 결과를 도 14에 나타내었다.

도 14는 재선별된 샘플 전체에 대해 발현량이 낮은 유전자를 제거하고 남은 약 14,000개의 유전자에 대한 PCA 분석 결과를 나타낸 도면이다.

3.4 차별발현 유전자 분석 (Differentially expressed genes analysis, DEG analysis)

상기 실시예 1.4 차별발현 유전자 분석 과정과 동일한 방법으로 각각의 유도체(inducer type)별 차별발현 유전자를 선별하였다. 각각의 유도체(inducer type)별로 살펴보면, RS에서 총 1,463개의 유전자(up-regulated genes : 881, down-regulated genes : 582)가, OIS에서 총 2,039개의 유전자(up-regulated genes : 791, down-regulated genes : 1,248), TIS에서 총 1,903개의 유전자(up-regulated genes : 1,238, down-regulated genes : 665)가 차별발현 유전자로 선별되었고, 이를 하기 표 7에 나타내었다.

차별발현 유전자 분석 정보

Inducer type	Comparison (Control : Senescent)	Up-regulated genes	Down-regulated genes	Total DEGs
RS	13 : 13	881	582	1,463
OIS	14 : 15	791	1,248	2,039
TIS	14 : 14	1,238	665	1,903

유도체(inducer type)별 차별발현유전자(DEG) 중 유도체의 종류와 무관하게 발현되는 세포 노화의 특징적 유전자를 선별하기 위해 유도체별 DEG 결과를 up-regulated gene과 down-regulated gene으로 나눈 후, 벤다이어그램으로 각각 나타내어 유전자의 교집합을 선별하였다. 상기 벤다이어그램은 도 15에 나타내었다.

도 15에 나타낸 바와 같이, 총 181개의 up-regulated gene과 284개의 down-regulated gene의 총 465개의 유전자가 선별되었고, 이 유전자들은 유도체의 종류와 무관하게 노화 세포에서 발현되고 있음을 의미한다.

이후에, 선별된 공통 발현 유전자들이 세포 노화적 특성을 반영하는 유전자 세트인지 확인하기 위해, gProfiler (https://biit.cs.ut.ee/gprofiler/)를 활용하여 GO(gene ontology) 분석을 시행하여 465개의 유전자와 관련있는 생물학적 경로들을 탐색하였다. 유전자들의 발현 증감 방향성에 따라 각각 GO 분석을 진행하였고, GO 결과는 조정된 p-value 값이 0.05 이하인 결과만을 선별하였으며, 그 결과를 도 16에 나타내었다.

도 16에 나타낸 바와 같이, 노화 세포에서 발현이 공통적으로 증가한 181개의 유전자는 세포 노화의 알려진 특징인 SASP(Senescence associated secretory phenotype), Chromatin organization, Immune response 및 여러가지 Cellular senescence pathway 관련 특성들이 유의미하게 나타남을 확인할 수 있었다. 또한, 노화 세포에서 발현이 공통적으로 감소한 284개 유전자의 경우 마찬가지로 이미 알려진 세포 노화의 특성에 해당하는 cell cycle 과 관련된 생물학적 경로들 및 DNA replication, DNA repair, telomere maintenance 및 organization 과 연관이 있음을 확인하였다. 이를 통해 전체 465개의 교집합 유전자 세트가 세포 노화의 특성을 잘 반영함을 확인할 수 있었다.

3.5 LASSO (least absolute shrinkage and selection operator)를 이용한 변수 선택

선별된 465개의 유전자 중 세포 노화의 특성을 가장 잘 나타내는 최소한의 유전자를 선별하고자 상기 실시예 1.5 LASSO (least absolute shrinkage and selection operator)를 이용한 변수 선택 과정과 동일한 방법을 이용하였다.

구체적으로, LASSO 회귀는 R package glmnet 4.0-2를 통해 진행되었고, 훈련 데이터 총 79개 데이터 셋의 TMM normalized Log₂CPM (count per million) 값을 사용하여 샘플의 상태에 따라 Control(=0) 혹은 Senescent(=1) 값을 할당한 후 binary classification 모델에 대한 파라미터 조정을 진행하여 선별된 결과값이다. Leave-one-out-cross-validation을 통해 최적의 lambda (λ)를 설정한 후 모델을 적합하여 최종적으로 17개의 유전자를 선별하였다. 해당 유전자는 ENSG00000106462 (EZH2), ENSG00000120802 (TMPO), ENSG00000126016 (AMOT), ENSG00000139354 (GAS2L3), ENSG00000054654 (SYNE2), ENSG00000164104 (HMGB2), ENSG00000164649 (CDCA7L), ENSG00000092470 (WDR76), ENSG00000273802 (H2BC8), ENSG00000102996 (MMP15), ENSG00000197142 (ACSL5), ENSG00000135218 (CD36), ENSG00000075651 (PLD1), ENSG00000003137 (CYP26B1), ENSG00000186088 (GSAP), ENSG00000197903 (H2BC12), ENSG00000180573 (H2AC6) 이며, 각 유전자들의 계수(coefficient)를 통해 세포 노화에서의 해당 유전자의 발현 방향성(+/-) 및 영향력을 나타낸다. 총 9개의 유전자 (H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, H2AC6) 는 양의 계수를 지니므로 노화 세포에서 발현이 증가한 것이고, 나머지 8개의 유전자 (EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76) 는 음의 계수를 지니므로 노화 세포에서의 발현이 감소한 것이다.

상기 LASSO 회귀를 통해 유전자에 대한 변수 선택 과정을 진행한 결과는 하기 표 8 및 도 17에 나타내었다.

LASSO 회귀를 통해 선별된 세포 노화 특징 유전자

Ensembl gene id	SYMBOL	Coefficient	Description
ENSG00000106462	EZH2	-0.26	Enhancer Of Zeste 2 Polycomb Repressive Complex 2 Subunit
ENSG00000120802	TMPO	-0.26	Thymopoietin
ENSG00000126016	AMOT	-0.17	Angiomotin
ENSG00000139354	GAS2L3	-0.09	Growth Arrest Specific 2 Like 3
ENSG00000054654	SYNE2	-0.09	Spectrin Repeat Containing Nuclear Envelope Protein 2
ENSG00000164104	HMGB2	-0.08	High Mobility Group Box 2
ENSG00000164649	CDCA7L	-0.05	Cell Division Cycle Associated 7 Like
ENSG00000092470	WDR76	-0.001	WD Repeat Domain 76
ENSG00000273802	H2BC8	0.005	H2B Clustered Histone 8
ENSG00000102996	MMP15	0.04	Matrix Metallopeptidase 15
ENSG00000197142	ACSL5	0.06	Acyl-CoA Synthetase Long Chain Family Member 5
ENSG00000135218	CD36	0.09	CD36 Molecule
ENSG00000075651	PLD1	0.11	Phospholipase D1
ENSG00000003137	CYP26B1	0.14	Cytochrome P450 Family 26 Subfamily B Member 1
ENSG00000186088	GSAP	0.22	Gamma-Secretase Activating Protein
ENSG00000197903	H2BC12	0.24	H2B Clustered Histone 12
ENSG00000180573	H2AC6	0.78	H2A Clustered Histone 6

이후에, 79개의 훈련 셋 데이터에 대해 LASSO에 의해 선별된 17개의 유전자를 이용하여 상기 3.3.과 동일하게 PCA 분석을 진행하고 클러스터링 결과를 확인한 뒤 각각 도 18 및 도 19에 나타내었다.

도 18에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 17개의 PCA 결과는 도 14의 PCA 결과와 비교하여, PC1에 의해 노화 세포와 대조군 데이터가 명확하게 구분되는 것을 확인 할 수 있으며 PC1의 데이터 구분에 대한 설명도 증가하였음을 알 수 있었다.

도 19에 나타낸 바와 같이, LASSO에 의해 선별된 유전자 17개의 클러스터링 결과는 유전자들의 발현 패턴이 노화 세포와 대조군 사이에서 명확하게 구별되며, 노화 세포와 대조군 데이터를 명확하게 구분함을 알 수 있었다.

이상의 결과는 LASSO에 의해 선별된 17개의 유전자는 훈련 셋 데이터 내에서 노화 세포의 특성을 잘 반영함을 나타냄을 의미한다.

실시예 4. 선별된 노화 세포 마커 후보 유전자들의 검정

4.1 검정 데이터에서의 대조군 그룹 및 세포 노화 그룹간 유전자 발현 차이 확인

실시예 3에서 선정된 17개의 노화 세포 마커 후보 유전자들의 발현 패턴이 17개 유전자의 선별 과정에 관여하지 않은 68개의 검정 데이터 내에서도 유의미한 발현 차이를 보이는지 확인하였다.

구체적으로, 68개의 검정 데이터에 대해 훈련 데이터와 동일한 과정으로 TMM 정규화 및 limma removeBatchEffect function을 통해 배치 효과를 제거한 후 Log₂CPM 변환 값을 이용하여 대조군 그룹(n = 32)과 노화세포 그룹(n = 36) 사이에서 17개 유전자의 발현에 유의미한 차이가 존재하는지 확인하였고, 그 결과를 도 20에 나타내었다.

도 20는 검정 셋 데이터(n= 68)에서의 LASSO 선별 17개 유전자의 발현 박스플롯(boxplot)을 나타낸 도면이다; a: 양의 계수를 갖는 8개 유전자의 검정 셋 내에서의 분포, b: 음의 계수를 갖는 9개 유전자의 검정 셋 내에서의 분포.

4.2 세포 노화 예측 모델 제작

17개의 선별된 유전자들을 훈련 데이터 셋에 적용하여 노화 세포의 상태를 예측하는 5 개의 모델을 제작하여 선별된 유전자들의 유효성을 검증하였다.

구체적으로, 제1 모델은 서포트 벡터 머신(Support vector machine)의 RBF kernel을 통해 제작하였으며, R package e1071 (version 1.7-3)이 사용되었다. 모델의 학습에 사용된 데이터는 상기 학습에 사용된 79개의 훈련 데이터에 대한 17개 유전자의 발현값이 사용되었으며, LOOCV (leave one out cross-validation)을 통해 최적의 분류 모델을 선택하여 제작하였다. 제2, 제3, 제4, 제5 모델은 타 세포 노화 관련 연구 문헌 [Hernandez-Segura et al. 2017, Kiss et al. 2020, Park et al. 2021, Casella et al. 2019]에서 선정된 다양한 세포 노화 유전자의 발현 값을 훈련 데이터 셋에 적용하여 제1 모델과 동일한 방식으로 SVM 모델을 제작하였다. 제2, 제3, 제4, 제5 모델은 제1 모델과 노화 세포 분류 성능을 비교하기 위해 제작하였다.

4.3 세포 노화 예측 모델 성능 평가

상기 4.2에서 제작한 다섯 개의 모델을 이용하여 68개의 노화 섬유아세포 검정 데이터 (대조군 32개, 노화 세포 36개)에 대해 분류 검정을 진행하였고, 그 결과를 도 21a에 나타내었다. 추가로 상기 4.2.에서 제작한 두 개의 모델을 이용하여 33개의 다양한 노화 세포 데이터 (대조군 : 15, 노화 세포 : 18, 섬유아세포가 아닌 33개의 서로 다른 종류 (HUVEC, HAEC, MSC, LS8817, Ovcar3))에 대해 분류 검정을 진행하였고, 그 결과를 도 21b에 나타내었다. 검정 데이터의 Log₂CPM 값들은 훈련 데이터의 발현 값의 평균 및 표준편차를 기준으로 스케일링 후 검정 하였다.

도 21에 나타낸 바와 같이, 두 결과 모두에서 LASSO에 의해 선정된 17개의 유전자 모델이 더 좋은 성능을 보이는 것을 확인 할 수 있었다.

a: LASSO 17 gene model AUC: 100% = Casella et al, model AUC: 100% > Hernandez et al, model AUC: 99.7% > Kiss et al, model AUC: 99.5% > Park et al, model AUC : 98%

b: LASSO 17 gene model AUC: 98.9% > Casella et al, model AUC: 98.1% > Kiss et al, model AUC: 86.3% > Hernandez et al, model AUC: 82.6% > Park et al, model AUC : 70.7%.

따라서 실시예 4의 결과들을 토대로, 일 구체예에 따라 선별된 17개의 유전자의 발현 양상이 LASSO의 계수 부호 양상과 동일하게, 정상 세포와 노화 세포 그룹간 유의미한 차이를 보이는 것을 확인할 수 있었다. 또한, 17개의 유전자로 구축한 노화 세포 분류 모델이 기존에 연구에서 알려진 다양한 세포 노화 관련 유전자로 구축한 노화 세포 분류 모델보다 세포 노화의 특성을 더 잘 나타냄을 확인 할 수 있었다.

일 구체예에 따른 방법은 노화 섬유아세포만을 훈련 데이터에 사용하여 유전자를 선별하였음에도 불구하고, 다양한 종류의 세포들에 대해서도 기존 연구보다 더 좋은 분류 성능을 보임을 확인할 수 있었다.

이상의 결과는 일 구체예에 따른 방법은 섬유아세포를 포함한 다양한 종류의 세포들에서 통계적으로 더 유의한 마커를 선별할 수 있음을 의미하고, 일 구체예에 따른 방법으로 도출된 17개의 유전자는 노화 세포를 특정 또는 검출하는데 유용하게 사용될 수 있음을 의미한다.

실시예 5. 노화 유도 세포에서의 선별한 바이오마커의 발현 변화 확인

상기 실시예 3에서 선별한 17개의 유전자 중, GAS2L3, AMOT 및 WDR76 유전자가 노화를 유도한 세포에서 실제 발현량에 변화가 나타나는 지 알아보았다.

5.1 세포 노화 유도 및 확인

인간 제대 정맥 내피세포 (Human Umbilical Vein Endothelial Cell, HUVEC cell, LONZA, HUVEC, C2519A)를 사용하였고 EGM2 (LONZA, EGM-2 Endothelial Cell Growth Medium-2 BulletKit, CC-3162) 배지에서 배양하였다. 세포의 계대 배양 횟수에 차이를 두어 노화를 유도 하였다. Passage 3 (P3) 과 passage 7 (P7) 의 HUVEC 세포를 배양 후 이 세포가 passage에 따른 노화정도를 파악하기 위해 SA β-Gal (senescence-associated beta-galactosidase, Cell Signaling, Senesence β-Galactosidase Staining Kit, #9860) 염색을 진행하였다. 염색 결과를 도 22에 나타내었다.

도 22에 나타낸 바와 같이, P7의 세포가 P3의 세포 보다 세포 내 진하고 많은 파란색을 띄고 있어 더 많은 노화가 진행된 것을 알 수 있었다.

5.2 GAS2L3, AMOT 및 WDR76의 발현 변화 확인

Trizol (Invitrogen, TRIzol Reagent, 15596018)을 사용하여 P3 및 P7 세포들의 RNA을 추출하여였고, cDNA synthesis kit (LaboPass, cDNA synthesis kit, SMRTK002)을 사용하여 cDNA (complenentary DeoxyriboNucleic Acid)을 합성하였다. 이후 하기의 표 9의 프라이머와 PCR premixture (SolGent, Solg 2X Multiplex PCR Smart mix, SMP01-M25P)을 이용하여 GAS2L3, AMOT 및 WDR76 유전자들만 특이적으로 증폭시켰고 GAPDH을 세포의 cDNA의 정량을 위해 사용하였다. 해당과정에서 PCR 기기 (Aplied Biosystems, MiniAmp Plus Thermal Cycler, A37835)를 사용하였다.

PCR 수행 후, 전기영동을 통해 GAS2L3, AMOT 및 WDR76의 발현량을 확인하였고, 그 결과를 도 23에 나타내었다.

또한, 정량적으로 발현량을 비교하기 위하여 상기에서 수득한 cDNA를 이용하여 qPCR을 수행하였다. 구체적으로, 하기 표 9의 프라이머를 이용하였고, qPCR을 위해 SYBR green (Applied Biosystems, SYBR Green PCR Master Mix, 2109533)을 이용한 qPCR (quantitative PCR)시약을 사용 하였고, real time PCR (Applied Biosystems, StepOne Real-time PCR System, 4376357)을 이용하여 진행하였다. qPCR의 결과를 도 24에 나타내었다.

유전자	프라이머 방향	5'to 3'	서열번호
AMOT	Forward	AAA CGT GAG CAG CTA GAG CAC	서열번호 1
AMOT	Reverse	TGT GTC CCT CTG AGC AGC CA	서열번호 2
GAS2L3	Forward	ATC TGG GCT CTA TGT CAG TCC G	서열번호 3
GAS2L3	Reverse	TTG GCA AAA GTG TGG ACT CGG	서열번호 4
WDR76	Forward	CTG CTG CAA GAC TCC GTG AA	서열번호 5
WDR76	Reverse	GCC CAG GAG GTA ACA AAG GAG	서열번호 6
GAPDH	Forward	ATC CCA TCA CCA TCT TCC	서열번호 7
GAPDH	Reverse	CCA TCA CGC CAC GAT TTC	서열번호 8

도 23에 나타낸 바와 같이, GAS2L3, AMOT 및 WDR76에 해당하는 밴드가 P7 보다 P3에서 보다 진하게 나타나 노화가 진행된 P7의 세포들에서 P3의 세포 보다 낮은 GAS2L3, AMOT 및 WDR76의 발현을 나타내는 것을 확인하였다.

또한, 도 24에 나타낸 바와 같이, qPCR 결과 역시 GAS2L3, AMOT 및 WDR76 유전자 발현양이 P7 세포들에서 감소하는 것을 확인하였다.

상기 결과로부터, 실제 노화된 세포에서 GAS2L3, AMOT 및 WDR76의 발현이 감소하는 것을 알 수 있었고, GAS2L3, AMOT 및 WDR76 유전자가 노화 세포의 바이오마커로 활용될 수 있음을 알 수 있었다.

Claims

분리된 생물학적 시료로부터 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법.
청구항 1에 있어서, 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 세포 노화를 검출하는 방법.
EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및

무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
청구항 3에 있어서, 상기 EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, 및 WDR76로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
EZH2, TMPO, AMOT, GAS2L3, SYNE2, HMGB2, CDCA7L, WDR76, H2BC8, MMP15, ACSL5, CD36, PLD1, CYP26B1, GSAP, H2BC12, 및 H2AC6로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물.
청구항 5에 있어서, 상기 노화는 복제 노화(Replicative senescence), 종양유전자 유도 노화(Oncogene induced senescence) 및 치료 유도 노화(Therapy induced senescence)로 이루어진 군으로부터 선택된 어느 하나인 것인, 세포 노화를 검출하기 위한 조성물.
RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정할 수 있는 제제를 포함하는 세포 노화를 검출하기 위한 조성물.
청구항 7에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 프라이머, 프로브 또는 안티센스 올리고뉴클레오티드인 것인, 세포 노화를 검출하기 위한 조성물.
청구항 7에 있어서, 상기 단백질의 활성 수준을 측정할 수 있는 제제는 항체, 앱타머, 아비머(avidity multimer) 또는 페티도모방체(peptidomimerics)인 것인, 세포 노화를 검출하기 위한 조성물.
청구항 7에 있어서, 상기 노화는 복제 노화(Replicative senescence), 종양유전자 유도 노화(Oncogene induced senescence) 및 치료 유도 노화(Therapy induced senescence)로 이루어진 군으로부터 선택된 어느 하나인 것인, 세포 노화를 검출하기 위한 조성물.
분리된 생물학적 시료로부터 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 측정하는 단계를 포함하는 세포 노화를 검출하는 방법.
청구항 11에 있어서, 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 높은 경우, 세포 노화로 판단하는 단계; 또는 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준이 정상 대조군 시료의 유전자 또는 단백질의 발현 또는 활성 수준보다 낮은 경우, 세포 노화로 판단하는 단계를 포함하는 세포 노화를 검출하는 방법.
청구항 11에 있어서, 상기 유전자의 발현 수준을 측정하는 방법은 역전사 중합효소반응, 경쟁적 역전사 중합효소반응, 실시간 역전사 중합효소반응, RNase 보호 분석법, 노던 블랏팅 또는 DNA 칩인 것인, 세포 노화를 검출하는 방법.
청구항 11에 있어서, 상기 단백질의 활성 수준을 측정하는 방법은 웨스턴 블랏팅, ELISA, 방사선 면역분석법, 방사선 면역확 산법, 오우크테로니 (Ouchterlony) 면역확산법, 로케트 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고 정분석, FACS 또는 단백질 칩인 것인, 세포 노화를 검출하는 방법.
RRM2B, DUSP6, GSAP, AKAP6, C2orf92, AC008012.1, CLDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질과 피검 물질을 접촉시키는 단계; 및

무처리 대조군에 비하여 상기 유전자 또는 단백질의 발현 또는 활성 수준을 변화시킨 피검 물질을 세놀리틱(senolytic) 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.
청구항 15에 있어서, 상기 RRM2B, DUSP6, GSAP, AKAP6, C2orf92, 및 AC008012.1로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 감소시킨 피검 물질을 세놀리틱 약물로 선별하는 단계; 또는 상기 LDN11, HMGN2, CHAF1B, KLHL13, MXD3, AUTS2, NAV2, NCAPD2, 및 PXMP2로 이루어진 군으로부터 선택된 어느 하나 이상의 유전자 또는 단백질의 발현 또는 활성 수준을 무처리 대조군 대비 증가시킨 피검 물질을 세놀리틱 약물로 선별하는 단계를 포함하는 세놀리틱 약물을 스크리닝 하는 방법.