KR102325356B1 - 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용 - Google Patents

유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용 Download PDF

Info

Publication number
KR102325356B1
KR102325356B1 KR1020200012227A KR20200012227A KR102325356B1 KR 102325356 B1 KR102325356 B1 KR 102325356B1 KR 1020200012227 A KR1020200012227 A KR 1020200012227A KR 20200012227 A KR20200012227 A KR 20200012227A KR 102325356 B1 KR102325356 B1 KR 102325356B1
Authority
KR
South Korea
Prior art keywords
pseudogene
hgnc
glioma
grade
group
Prior art date
Application number
KR1020200012227A
Other languages
English (en)
Other versions
KR20210098262A (ko
Inventor
곽규범
임재준
안주원
박영준
심정민
Original Assignee
차의과학대학교 산학협력단
의료법인 성광의료재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 차의과학대학교 산학협력단, 의료법인 성광의료재단 filed Critical 차의과학대학교 산학협력단
Priority to KR1020200012227A priority Critical patent/KR102325356B1/ko
Priority to PCT/KR2021/001271 priority patent/WO2021154056A2/ko
Publication of KR20210098262A publication Critical patent/KR20210098262A/ko
Application granted granted Critical
Publication of KR102325356B1 publication Critical patent/KR102325356B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 신경교종의 등급 진단 및 위험도 예측용 유사유전자 바이오마커, 상기 마커를 검출하는 제제를 포함하는 조성물 및 상기 조성물을 포함하는 신경교종의 등급 진단 및 위험도 예측용 키트를 제공한다.
본 발명이 제공하는 유사유전자 바이오마커는 신경교종의 등급을 2등급 내지 4등급으로 명확하게 진단할 수 있으며, 발현량 차이에 따른 예후 예측이 가능하여 신경교종의 정확한 진단 및 예후 예측이 가능하다.

Description

유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용 {Composition for diagnosis of malignancy of glioma using pseudogenes and use thereof}
본 발명은 신경 교종의 진단 및 예후 예측용 유사유전자 바이오마커 및 상기 바이오마커 검출용 조성물에 관한 것으로서, 상기 조성물을 포함하는 신경교종의 진단 및 예후 예측용 키트, 상기 조성물을 이용하여 신경교종의 진단 및 예후 예측에 필요한 정보를 제공하는 방법에 관한 것이다.
뇌종양은 종양의 발생 위치 및 발견 시점의 종양 크기 등에 따라 그 예후가 크게 달라지므로, 정확한 진단이 매우 중요하다. 그러나 뇌종양의 증상은 두통, 구토, 언어장애, 기억력 감퇴, 시력 저하 등으로 매우 다양하여 환자가 조기에 발병을 인지하기 어려워 조기 진단에 어려움이 있다.
현재 뇌종양의 발병 및 악성도를 진단하는 방법으로는 생검에 의한 조직학적 검사와 자기공명영상(MRI) 및/또는 컴퓨터 단층촬영 (CT)을 통한 형태학적 검사방법이 존재하지만 방사선 치료와 화학요법에 대한 임상 반응 및 예후, 암의 진행에 따른 악성도와 관련한 요인들을 정확히 평가하고 반영하기 위해서는 여전히 추가적인 연구 및 방법이 요구된다.
신경교종(Glioma)은 원발성 악성 뇌종양 중 발생 빈도가 가장 높으며 전체의 약 60%를 차지하는 난치성 악성 종양이다. 신경교종은 WHO 기준에 따른 미분화성 정도와 역형성 정도에 따라 악성도가 가장 낮은 grade I부터 악성도가 가장 심한 grade IV까지의 단계로 구분된다. 낮은 등급 신경교종 환자의 평균수명은 10년 안팎이지만 grade IV로 분류되는 교모세포종(glioblastoma multiforme) 환자는 수술 및 항암제, 방사선 치료법을 사용함에도 불구하고 진단 후 평균 기대 생존기간이 1년에 불과하여 신경교종의 진단 및 진행과 관련한 연구는 신경교종 환자의 치료 및 생존기간 연장에 있어 매우 중요하다.
현재 IDH1, ATRX, EGFR, CIC 돌연변이 등 신경교종의 예후에 대한 체세포 변이(somatic mutation)에 관련된 연구는 활발하게 이루어지고 있다. 그러나 이러한 돌연변이의 유무는 단순한 예후 예측용 지표로 사용될 수 있을 뿐, 신경교종의 진행 정도에 대한 진단 및 잠재적인 치료 표적으로서는 적절하지 않은 측면이 있다. 따라서 유전자의 발현과 관련하여, 이러한 돌연변이와 변별력 있게 발현하는 유전자를 선별하는 것이 중요하다.
한편, 암 유전체 지도 작성 계획(The Cancer Genome Atlas, TCGA)은 암유전체 분석과 생물정보학을 사용하여 암의 분석, 진단 및 치료를 목적으로 시작된 대규모 프로젝트로서, 미국 국립 암 연구소(National Cancer Institute; NCI)와 미국 국립 인간 게놈 연구소(National Human Genome Research Institute; NHGRI)에서 운영하고 있다. TCGA 프로젝트에서는 33가지 이상의 암 종에 대하여 유전자 발현 프로파일링(Gene expression profiling), 체세포 돌연변이(SNP genotyping), 복제 수 변이(CNV), DNA 메틸화(DNA methylation) 및 마이크로 RNA 발현(microRNA profiling) 등의 다양한 암 유전체 데이터와 이에 해당하는 환자들의 임상 정보를 수집 및 표준화하여 통합 관리하고 있다.
Chinese Glioma Genome Atlas (CGGA)는 분자학적 분류 및 유전자 발현 양상을 활용한 임상 의료를 목적으로 시작된 중국 최대의 신경교종 암유전체 프로젝트이다. 수백 건의 신경교종 유전변이, 유전자 발현 및 마이크로 RNA 발현 데이터와 임상 정보를 제공하고 있다.
상기 TCGA와 CGGA 데이터 세트를 분석한 연구는 신경교종 환자의 유전체 변화를 대표할 수 있는 좋은 표본이며 생물정보학을 기반으로 한 암 유전체 분석을 위한 데이터의 확보 및 분석 가능한 플랫폼을 제공한다.
유사유전자(pseudogene)는 일반적으로 알려진 유전자와 유사한 DNA 서열의 상동성을 가지고 있지만 유전자 발현이나 최종 산물인 단백질 코딩능력에서 기능을 상실한 것을 특징으로 한다. 유사유전자는 한때 정크 DNA로 분류되었으나 2011년 암 억제 유전자(tumor suppressor gene)인 PTEN의 유사유전자인 PTENP1의 3'UTR 부위가 miRNA와의 상보적인 결합을 통해 PTEN의 발현을 조절한다는 내용이 보고된 이후로 유사유전자가 ceRNA 형태로 전사체 수준에서 유전자의 발현 조절을 돕는 역할을 하는 것으로 알려졌다. 2017년 연구에서는 PTENP1이 일종의 transcript sponge 역할을 통해 miR-19b로부터 PTEN의 발현억제를 보호하며 이를 통해 암세포에서의 세포증식, 전이, 침입을 억제하고 세포사멸을 촉진한다는 내용이 보고되며 종양 연구에 있어 새로운 관점 및 기존 해석을 확장할 수 있는 기반을 제시한 바 있다.
그러나 유사유전자와 암의 발달 간의 관련성이 다수 연구 결과에 의해 보고되고 있음에도, 아직 신경교종에서의 연구는 부족한 실정이다.
본 발명은 신경교종의 등급 진단 및/또는 예후 예측용 조성물 및 상기 조성물을 이용한 신경교종의 등급 진단 및 예후 예측에 필요한 정보를 제공하는 방법을 제공한다.
본 발명은 또한 신경교종의 등급 진단 및/또는 예후 예측용 조성물을 포함하는 신경교종의 등급 진단 및/또는 예후 예측용 키트를 제공한다.
본 발명은 또한 신경 교종 치료제의 스크리닝 방법을 제공한다.
본 발명자들은 TCGA(The Cancer Genome Atlas)와 CGGA(Chinese Glioma Genome Atlas)의 신경교종 데이터를 분석하여 신경교종의 악성도에 따라 저등급의 신경 교종(lower grade glioma, grade II, III)과 교모세포종(glioblastoma, grade IV)에서 차별적으로 발현하는 유사유전자(Pseudogenes)들을 발굴하였으며 이러한 유사유전자들의 검출을 통해 신경교종의 진단 및 악성도에 따른 신경교종의 진행 수준을 진단 및 예측할 수 있는 분자 진단 마커로 사용될 수 있다.
본 발명은 신경교종의 등급 진단 및/또는 예후 예측용 조성물 및 상기 조성물을 이용한 신경교종의 등급 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법을 제공한다.
본 발명은 또한 신경교종의 등급 진단 및/또는 예후 예측용 조성물을 포함하는 신경교종의 등급 진단 및/또는 예후 예측용 키트 및 신경교종의 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법을 제공한다.
본 발명은 또한 신경교종 치료제의 스크리닝 방법을 제공한다.
이하 본 발명을 보다 상세히 설명한다.
본 발명에 있어서 "신경교종"이란, 신경교세포에서 발생하는 종양을 의미하며, 1등급(Grade I, G1)의 모양성 성상세포종(pilocytic astrocytoma), 또는 뇌실막밑거대성상세포종(subependymal giant ell astrocytoma), 2등급(Grade II, G2)의 미만성성상세포종 (diffuse astrocytoma), 3등급(Grade III, G3)의 역형성 성상세포종(anaplastic astrocytoma) 및 4등급(Grade IV, G4)의 교모세포종(glioblastoma)를 모두 포함한다.
1등급의 신경교종의 경우 양성 종양으로서 비침윤성 경향을 보이고, 예후가 좋은 특징이 있으며, 2등급 내지 4등급의 신경교종은 악성 종양에 해당한다. 본 명세서에서 신경교종은 1등급 내지 4등급의 광의의 신경교종을 의미하며, 바람직하게는 2등급 내지 4등급의 악성 종양 형태의 협의의 신경교종일 수 있다.
본 발명의 명세서에서, 신경 교종의 등급은 '등급', 'Grade' 또는 'G로 표시되었다.
상기 신경교종은 또한, 원발성 신경교종 및 재발성 신경교종을 모두 포함한다. 상기 원발성 신경교종은 신경교세포 자체에서 발생하는 종양으로, 처음부터 두개강 내에 형성되며, 상기 재발성 신경교종은 뇌 이외의 장기나 기관에서 발생하여 뇌의 신경교세포로 이동하여 종양을 형성한 경우를 의미한다.
본 명세서에서, 신경 교종의 "위험도"는 "위험비"와 혼용될 수 있다. 본 명세서에서 위험도 및/또는 위험비의 증가는 생존율의 감소 및/또는 종양의 크기 및/또는 수의 증가를 의미할 수 있다.
본 발명의 일 예는 신경교종의 등급 진단 및/또는 예후 예측용 조성물 및 상기 조성물을 이용한 신경교종의 등급 진단 및 예후 예측에 필요한 정보를 제공하는 방법에 관한 것이다.
본 발명이 제공하는 신경교종의 등급 진단 및/또는 예후 예측용 조성물은 신경교종의 등급에 따라 차등적으로 발현되는 유사유전자(pseudogene) 마커를 검출하는 제제를 포함한다.
유사유전자(pseudogene)는 일반적으로 알려진 유전자와 유사한 DNA 서열의 상동성을 가지고 있지만 유전자 발현이나 최종 산물인 단백질 코딩능력에서 기능을 상실한 것을 특징으로 한다. 유사유전자는 한때 정크 DNA로 분류되었으나 2011년 암 억제 유전자(tumor suppressor gene)인 PTEN의 유사유전자인 PTENP1의 3'UTR 부위가 miRNA와의 상보적인 결합을 통해 PTEN의 발현을 조절한다는 내용이 보고된 이후로 유사유전자가 ceRNA 형태로 전사체 수준에서 유전자의 발현 조절을 돕는 역할을 하는 것으로 알려졌다.
상기 조성물은 유사유전자 마커를 검출함으로써 기존의 체세포 돌연변이를 검출하는 방법에 비해 단순한 예후 예측에서 벗어나 신경교종의 진행 정도에 대한 진단이 가능하고 잠재적인 치료 표적을 제공할 수 있는 장점을 가진다.
보다 구체적으로, 기존의 체세포 돌연변이(Somatic mutation)는 질병의 유무에 따른 단순한 진단 보조 지표로 활용되거나, 질병의 예후에 대해 긍정 혹은 부정 수준의 단순하고 일회적인 예측만이 가능한, 돌연변이 발생 이후의 추가적인 진단과 예측이 어려운 한계가 있었다. 또한 특정 유전자가 높은 수준의 돌연변이 발생 빈도 (Mutation frequency)를 갖는 경우는 매우 드물고, 각 특정 유전자는 특정 질병의 특정 하위 그룹을 대표하는 경우가 많아 진단 및 예후 예측에 활용하기 매우 제한적인 단점이 있었다. 그러나 본 발명이 제공하는 유사유전자 마커의 발현량은 정량적이고 연속적인 요소로서, 신경교종의 진단 및 예후 예측에 있어서 다양하고 지속적으로 추적 및/또는 확인이 가능한 장점이 있다.
상기 신경교종의 등급에 따라 차등적으로 발현되는 유사유전자 마커는, (1) HGNC:18611 유사유전자(GenBank Accession No. NR_001587.1), HGNC:13229 유사유전자(GenBank Accession No. NR_027795.1), HGNC:5240 유사유전자(GenBank Accession No. NR_024151.1), HGNC:7404 유사유전자(GenBank Accession No. NR_001447.2), HGNC:32523 유사유전자(GenBank Accession No. NR_003187.3), HGNC:30222 유사유전자(GenBank Accession No. NR_037144.1), HGNC:30080 유사유전자(GenBank Accession No. NR_003714.1), HGNC:16797 유사유전자(GenBank Accession No. NR_024045.1), HGNC:30518 유사유전자(GenBank Accession No. NR_026676.1), HGNC:33993 유사유전자(GenBank Accession No. NR_026749.2), HGNC:11987 유사유전자(GenBank Accession No. NR_002719.2), 및 HGNC:30806 유사유전자(GenBank Accession No. NR_027256.1)로 이루어지는 군에서 선택되는 1종 이상의 유사유전자; 및 (2) HGNC:30486 유사유전자(GenBank Accession No. NR_027062.1), HGNC:24976 유사유전자(GenBank Accession No. NR_002307.1), HGNC:30886 유사유전자(GenBank Accession No. NR_027141.2), 및 HGNC:35196 유사유전자(GenBank Accession No. NR_026730.1)로 이루어지는 군에서 선택되는 하나 이상의 유사유전자;로 이루어진 군에서 선택되는 하나 이상의 유사유전자 마커일 수 있다.
일 예에서, 상기 유사유전자 마커는 신경교종의 위험비가 증가함에 따라 발현량이 증가하는 유사유전자 마커로서, HGNC:5240 유사유전자(GenBank Accession No. NR_024151.1), HGNC:32523 유사유전자(GenBank Accession No. NR_003187.3), HGNC:30222 유사유전자(GenBank Accession No. NR_037144.1), 및 HGNC:30518 유사유전자(GenBank Accession No. NR_026676.1)로 이루어진 군에서 선택되는 1종 이상의 유사유전자일 수 있으며, HGNC:18611 유사유전자(GenBank Accession No. NR_001587.1), HGNC:13229 유사유전자(GenBank Accession No. NR_027795.1), HGNC:7404 유사유전자(GenBank Accession No. NR_001447.2), HGNC:30080 유사유전자(GenBank Accession No. NR_003714.1), HGNC:16797 유사유전자(GenBank Accession No. NR_024045.1), HGNC:33993 유사유전자(GenBank Accession No. NR_026749.2), HGNC:11987 유사유전자(GenBank Accession No. NR_002719.2), 및 HGNC:30806 유사유전자(GenBank Accession No. NR_027256.1)로 이루어진 군에서 선택되는 1종 이상의 유사유전자를 추가로 포함하는 것일 수 있다.
상기 신경교종의 위험비가 증가함에 따라 발현량이 증가하는 유사유전자 마커(고발현-고위험군 유사유전자 마커)는, 원발성 신경교종 환자에서 등급이 Grade II에서 Grade III 및 Grade IV로 발전함에 따라 발현량이 증가한다.
또 다른 일 예에서, 상기 유사유전자 마커는 신경교종의 위험비가 감소함에 따라 발현량이 증가하는 유사유전자 마커로서, HGNC:30486 유사유전자, 및/또는 HGNC:35196 유사유전자일 수 있으며, HGNC:30886 유사유전자(GenBank Accession No. NR_027141.2), 및/또는 HGNC:24976 유사유전자를 추가로 포함하는 것일 수 있다.
상기 신경교종의 위험도가 감소함에 따라 발현량이 증가하는 유사유전자 마커(고발현-저위험군 유사유전자 마커)는, 원발성 또는 재발성 신경교종 환자에서 등급이 Grade II에서 Grade III 및 Grade IV로 발전함에 따라 발현량이 감소한다.
본 발명의 일 실시예에서, 신경교종 환자의 유전자 발현 데이터 세트로 TCGA와 CGGA 데이터 세트를 분석 대상으로 하여 신경교종의 등급에 따라 통계적 유의성을 가지고 발현량 차이를 나타내는 유사 유전자를 선별하였다. Grade II, III, 및 IV의 세 가지 악성도 수준에서 모두 통계적으로 유의한 발현량 차이를 보인 유사유전자는 TCGA 데이터 세트에서 102개, CGGA 데이터 세트에서 51개로 나타났으며 (도 1 및 도 2), TCGA 데이터세트와 CGGA 데이터 세트에서 모두 확인된 공통적인 유사유전자는 총 22개였다 (도 3). 상기 22개의 유전자 중 기존에 알려져 있는 5개의 유사유전자를 제외한 17개의 유사유전자를 1차 선별하였다.
상기 1차 선별된 17개의 유사유전자에 대하여 원발성 및 재발성 신경교종 환자군에 대한 상대적 위험비를 계산하여 임상적 유의성을 가지는 유사유전자 마커를 2차 선별하였다.
상기 상대적 위험비는 1차 선별된 17개 유사유전자의 상대적인 발현도를 정규화하여 0에서 1 사이의 값으로 변환한 후, 표준화하고, 상기 표준화된 발현량에 따른 콕스 비례위험모형 분석을 수행하여 계산될 수 있다. 상기 분석은 당업계에 알려진 통계 프로그램을 제한없이 이용하여 수행될 수 있다.
상기 상대적 발현 정도는 정규성 검정 및/또는 등분산성 검정을 수행하여 계산될 수 있으며, 상기 정규성 검정 및/또는 등분산성 검정의 결과에 따라 일원배치 분산분석, Tukey 방식의 사후 분석, Welch's ANOVA, GAMES_HOWELL 방식의 사후 분석, Kruskal-Wallis test 및 Tukey and Kramer(Nemenyi) test로 이루어지는 군에서 선택되는 하나 이상, 또는 둘 이상의 분석 방법을 수행하여 상기 상대적 발현 정도가 계산될 수 있다.
일 예에서, 상기 정규성 검정 및 등분산성 검정을 모두 통과하면 일원배치 분산분석(One-way ANOVA)' 및/또는 'Tukey 방식의 사후 분석'을 진행할 수 있으나, 상기 분석 방법에 제한되는 것은 아니다.
일 예에서, 상기 정규성 검정은 통과하였으나 등분산성 검정을 통과하지 못하면 Welch's ANOVA' 및/또는 'GAMES-HOWELL 방식의 사후 분석'을 진행할 수 있으나, 상기 분석 방법에 제한되는 것은 아니다.
일 예에서, 정규성 검정을 통과하지 못하면 비모수 방식인 'Kruskal-Wallis test' 및/또는 'Tukey and Kramer (Nemenyi) test'를 시행할 수 있으나, 상기 분석 방법에 제한되는 것은 아니다.
본 발명의 일 실시예에서 원발성 신경교종에 대해, 위험비가 증가할수록 발현이 증가하는 유사유전자 마커 12종이 최종 선별되었다. 상기 12종 유사유전자 마커는 HGNC:18611 유사유전자, HGNC:13229 유사유전자, HGNC:5240 유사유전자, HGNC:7404 유사유전자, HGNC:32523 유사유전자, HGNC:30222 유사유전자, HGNC:30080 유사유전자, HGNC:16797 유사유전자, HGNC:30518 유사유전자, HGNC:33993 유사유전자, HGNC:11987 유사유전자, 및 HGNC:30806 유사유전자이다.
본 발명의 일 실시예에서 원발성 신경교종에 대해, 위험비가 감소할수록 발현이 증가하는 유사유전자 마커 4종이 최종 선별되었다. 상기 4종의 유사유전자 마커는 HGNC:30486 유사유전자, HGNC:24976 유사유전자, HGNC:30886 유사유전자, 및 HGNC:35196 유사유전자이다.
본 발명의 일 실시예에서 재발성 신경교종에 대해, 위험비가 증가할수록 발현이 증가하는 유사유전자 마커 4종을 최종 선별하였다. 상기 4종의 유사유전자 마커는 HGNC:5240 유사유전자, HGNC:32523 유사유전자, HGNC:30222 유사유전자, 및 HGNC:30518 유사유전자이다.
본 발명의 일 실시예에서 재발성 신경교종에 대해, 위험비가 감소할수록 발현이 증가하는 유사유전자 마커 2종을 최종 선별하였다. 상기 2종의 유사유전자 마커는 HGNC:30486 유사유전자, 및 HGNC:35196 유사유전자이다.
본 발명의 재발성 신경교종에 대한 유사유전자 마커는 모두 원발성 신경교종에 대한 유사유전자 마커로 이용될 수 있다.
일 예에서, 유사유전자의 발현량은 유사유전자의 전사 수준을 의미하며, 목적하는 유사유전자의 전사 수준을 측정하기 위한 목적 범위에서 통상의 기술자가 당업계의 기술상식에 의해 적절한 방법을 이용하여 측정할 수 있다. 예를 들어, 정량적 RNA 시퀀싱, 정량적 중합효소 연쇄반응(qPCR), 마이크로어레이, 및 노던 블로팅방법을 이용할 수 있다.
상기 신경교종의 등급에 따라 차등적으로 발현하는 유전자 마커를 검출하는 제제는, 유사유전자의 발현 수준을 검출하기 위한 목적 범위에서 제한 없이 이용될 수 있다. 예를 들어 유사유전자 마커에 상보적인 프라이머 세트, 프로브, 압타머, 또는 안티센스 핵산일 수 있으나, 이에 제한되지 않는다.
상기 '상보적'의 의미는, 소정의 혼성화 또는 어닐링 조건, 바람직하게는 생리학적 조건 하에서 안티센스 핵산이 BRAF 돌연변이 유전자 타겟에 선택적으로 혼성화 할 정도로 충분히 상보적인 것을 의미하며, 실질적으로 상보적(substantially complementary) 및 완전히 상보적 (perfectly complementary)인 것을 모두 포함하는 의미를 가지며, 바람직하게는 완전히 상보적인 것을 의미한다.
상기 '안티센스 핵산'은 타겟으로 하는 유사유전자에 대한 상보적인 서열을 가지고 있어, 유사유전자 마커와 이합체를 형성할 수 있는 핵산 기반의 분자를 의미하며, 본원의 유사유전자 마커를 검출하는 데 사용될 수 있다.
용어 "프라이머"란, 짧은 자유 3말단 수산화기(free 3' hydroxyl group)를 가지는 핵산 서열로 상보적인 템플레이트(template)와 염기쌍(base pair)을 형성할 수 있고 템플레이트 가닥 복사를 위한 시작 지점으로 기능을 하는 7개 내지 50개의 핵산서열을 의미한다. 프라이머는 보통 합성하지만 자연적으로 생성된 핵산에서 이용할 수도 있다. 프라이머의 서열은 반드시 주형의 서열과 정확히 같을 필요는 없으며, 충분히 상보적이어서 주형과 혼성화될 수 있으면 된다.
용어, "프로브"란 mRNA와 특이적 결합을 이룰 수 있는 짧게는 수 염기 내지 길게는 수백 염기에 해당하는 RNA 또는 DNA 등의 핵산 단편을 의미하며 라벨링(labeling) 되어 있어서 특정 mRNA의 존재 유무를 확인할 수 있다. 프로브는 올리고뉴클로타이드(oligonucleotide) 프로브, 단쇄 DNA(single stranded DNA) 프로브, 이중쇄 DNA(double stranded DNA) 프로브, RNA 프로브 등의 형태로 제작될 수 있다.
본 발명의 또 다른 일 예는 상기 신경교종의 등급 진단 및/또는 예후 예측용 조성물을 포함하는 신경교종의 등급 진단 및/또는 예후 예측용 키트에 관한 것이다.
본 명세서에서 "키트"란 상술된 신경교종의 등급 진단 및/또는 예후 예측용 유사유전자 바이오 마커를 포함하고 있어, 신경교종의 등급 진단 및/또는 예후 예측에 관한 정보를 제공하는 검진용 기기를 의미하며, 생물학적 시료로부터 상기 유사유전자 바이오마커를 확인할 수 있는 형태라면 제한 없이 사용될 수 있다.
본 발명의 키트는 신경교종의 등급 진단 및/또는 예후 예측용 유사유전자 바이오마커를 검출할 수 있다. 본 발명의 키트에는 상기 유사유전자 바이오마커 검출용 조성물에 추가로 분석 방법에 적합한 1 종류 또는 그 이상의 다른 구성성분 조성물, 용액, 또는 장치를 포함할 수 있다.
본 발명의 또 다른 일 예는 신경교종의 등급 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법을 제공한다.
본 명세서에서 "진단"이란, 병리 상태의 존재 또는 특징을 확인하는 것을 의미한다. 본 발명의 목적상, 진단은 신경교종의 발병 여부, 발병한 신경교종의 등급을 확인하는 것이다.
본 명세서에서 신경교종의 예후는 신경교종의 진행과 관련된 모든 증상 및/또는 상태를 의미하는 것으로, 예컨대 항 신경교종 치료에 따른 신경교종 증상 변화 (개선, 완화, 치료(제거), 또는 악화 등), 신경교종의 재발 여부 등을 의미할 수 있으며, 예후가 좋다고 함은 신경교종 증상이 개선, 완화, 또는 치료(제거)되거나, 및/또는 신경교종의 재발 가능성이 낮은 것을 의미하고, 예후가 나쁘다 함은 신경교종 증상이 악화되거나, 신경교종의 재발 가능성이 높은 것을 의미할 수 있다. 상기 신경교종의 재발은 원발 위치에서의 재발, 전이성 재발 등을 포함할 수 있다. 통상적으로, 신경교종의 재발 가능성은 신경교종 치료 (일 예에서 외과적 수술을 포함할 수 있음) 후 대략 5년 또는 6년을 기준으로 판단할 수 있으나, 이에 제한되는 것은 아니다.
본 발명이 제공하는 신경교종의 등급 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법은, 환자로부터 분리된 생물학적 시료에서 유사유전자 마커의 발현 수준을 확인 및/또는 측정하는 단계를 포함할 수 있다. 상기 발현 수준의 측정은 단수 또는 복수 회 수행될 수 있으며, 복수 회 측정이 수행되는 경우, 측정 회차 사이에 시간 간격을 두고 측정이 수행될 수 있다. 사기 측정 회차 사이의 시간 간격은 1일 내지 1년, 1일 내지 6개월, 1일 내지 3개월, 1일 내지 1개월, 1일 내지 15일, 1일 내지 1주일, 1주일 내지 1년, 1주일 내지 6개월 1주일 내지 3개월, 1주일 내지 1개월, 또는 1주일 내지 15일일 수 있으나, 이에 제한되는 것은 아니며, 필요에 따라 당업자가 적절한 시간 간격을 선택하여 측정할 수 있다.
상기 유사유전자 마커는, 상술한 신경교종의 등급에 따라 차등적으로 발현되는 유사유전자(pseudogene) 마커에서 상술한 바와 같다.
일 구체예에서, 본 발명이 제공하는 신경교종의 등급 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법은, 환자로부터 분리된 생물학적 시료에서 (1) HGNC:18611 유사유전자, HGNC:13229 유사유전자, HGNC:5240 유사유전자, HGNC:7404 유사유전자, HGNC:32523 유사유전자, HGNC:30222 유사유전자, HGNC:30080 유사유전자, HGNC:16797 유사유전자, HGNC:30518 유사유전자, HGNC:33993 유사유전자, HGNC:11987 유사유전자, 및 HGNC:30806 유사유전자로 이루어지는 군에서 선택되는 1종 이상의 유사유전자 및/또는 (2) HGNC:30486 유사유전자, HGNC:24976 유사유전자, HGNC:30886 유사유전자,및 HGNC:35196 유사유전자로 이루어지는 군에서 선택되는 하나 이상의 유사유전자 마커의 발현 수준을 확인 및/또는 측정하는 단계를 포함할 수 있다.
일 예에서, 상기 유사유전자 마커의 발현 수준의 측정이 복수 회 이루어지는 경우, 최초 측정일 및/또는 전회(당 측정일 기준 이전 측정일의 전부 또는 일부) 측정일의 유사유전자 마커 발현 수준을 기준(기준치)으로 상대적인 유사유전자 발현 수준을 계산할 수 있으며, 일 구체예에서, 상기 상대적인 유사유전자 마커 발현 수준은 상기 기준치에 대한 비율(당 측정일의 유사유전자 마커 발현 수준/기준치)로 나타내어 질 수 있다. 또 다른 일 구체예에서, 상기 측정이 재발성 신경교종 환자에 대해 이루어지는 경우, 상기 기준치는 재발 전 원발암 확인시의 시료 및/또는 재발암에서의 grade I 및/또는 grade II 단계의 저등급 신경교종 단계에서 측정된 유사유전자 마커의 발현 수준일 수 있다.
일 예에서, 상기 기준치는 비환자(또는 정상인), 상기 환자(시료 제공 환자)의 저등급 신경교종 단계에서의 측정치(유사유전자 발현량), 및/또는 상기 시료를 제공한 환자가 재발암 환자인 경우, 상기 재발암 환자로부터 분리된 원발암 시료에서의 측정치일 수 있으나, 이에 제한되지 않으며, 고발현군과 저발현군의 판단을 위한 목적 범위에서 적절히 선택될 수 있다. 상기 재발암 환자로부터 분리된 원발암 시료는 재발 전 및/또는 재발 후 분리된 시료일 수 있다.
일 예에서, 상기 유사유전자 마커의 발현 수준의 측정이 1회 이루어지는 경우, 측정 대상(환자)의 유사유전자 마커의 발현 수준과 비환자(또는 정상인)로 확인된 대조군에서의 유사유전자 마커의 발현 수준을 비교하여, 대조군에서의 유사유전자 마커 발현량 대비 측정 대상 환자의 유사유전자 마커의 발현 수준(환자의 유사유전자 발현 수준/대조군의 유사유전자 발현 수준)을 상대적인 유사유전자 마커 발현 수준으로 정할 수 있다. 또는, 상기 환자의 유사유전자 발현 수준이 대조군(비환자군)의 유사유전자 발현 수준보다 높은 경우 "고발현군"으로 결정 및/또는 상기 환자의 유사유전자 발현 수준이 대조군(비환자군)의 유사유전자 발현 수준보다 낮은 경우 "저발현군"으로 결정할 수 있다.
일 예에서, 상기 유사유전자 마커의 발현 수준의 측정이 복수 회 이루어지는 경우, "고발현군"은 상기 상대적인 유사유전자 마커 발현 수준(측정일의 유사유전자 마커 발현 수준/기준치)이 1 이상인 경우를 의미하는 것일 수 있다. 또 다른 일 예에서, 특정 유사유전자에 대한 "고발현군"은 신경교종 환자 데이터베이스의 해당 유사유전자 발현량과 비교하여 상기 데이터베이스 내 해당 유사유전자 발현량의 평균값보다 높은 발현량, 상기 데이터베이스 내 해당 유사유전자 발현량의 중간값보다 높은 발현량, 상기 데이터베이스 내 해당 유사유전자 발현량 정규분포에서 상위 45% 이내, 상위 30% 이내, 상위 15% 이내 또는 상위 10% 이내의 유사유전자 발현량을 가지는 경우를 의미할 수 있다. 상기 신경교종 환자 데이터베이스는 본 발명이 속하는 기술분야에 종사하는 통상의 기술자가 접근할 수 있는 데이터베이스라면 종류를 가리지 않고 활용될 수 있다.
일 예에서, 상기 유사유전자 마커의 발현 수준의 측정이 복수 회 이루어지는 경우, "저발현군"은 상기 상대적인 유사유전자 마커 발현 수준(측정일의 유사유전자 마커 발현 수준/기준치)이 1 이하인 경우를 의미하는 것일 수 있다. 또 다른 일 예에서, 특정 유사유전자에 대한 "저발현군"은 신경교종 환자 데이터베이스의 해당 유사유전자의 발현량과 비교하여 상기 데이터베이스 내 해당 유사유전자 발현량의 평균값보다 낮은 발현량, 상기 데이터베이스 내 해당 유사유전자 발현량의 중간값보다 낮은 발현량, 상기 데이터베이스 내 해당 유사유전자 발현량 정규분포에서 하위 45% 이내, 하위 30% 이내, 하위 15% 이내 또는 하위 10% 이내의 유사유전자 발현량을 가지는 경우를 의미할 수 있다.
본 발명이 제공하는 신경교종의 등급 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법에 있어서, (1) HGNC:18611 유사유전자, HGNC:13229 유사유전자, HGNC:5240 유사유전자, HGNC:7404 유사유전자, HGNC:32523 유사유전자, HGNC:30222 유사유전자, HGNC:30080 유사유전자, HGNC:16797 유사유전자, HGNC:30518 유사유전자, HGNC:33993 유사유전자, HGNC:11987 유사유전자, 및 HGNC:30806 유사유전자로 이루어지는 군에서 선택되는 1종 이상의 유사유전자의 발현 수준을 고발현군 또는 저발현군으로 구분하는 단계를 포함할 수 있으며, 상기 발현 수준이 고발현군에 속하는 경우, 신경교종의 위험도가 높은 것으로 결정할 수 있다.
본 발명이 제공하는 신경교종의 등급 진단 및/또는 예후 예측에 필요한 정보를 제공하는 방법에 있어서, (2) HGNC:30486 유사유전자, HGNC:24976 유사유전자, HGNC:30886 유사유전자, 및 HGNC:35196 유사유전자로 이루어지는 군에서 선택되는 하나 이상의 유사유전자의 발현 수준을 고발현군 또는 저발현군으로 구분하는 단계를 포함할 수 있으며, 상기 발현 수준이 저발현군에 속하는 경우, 신경교종의 위험도가 낮은 것으로 결정할 수 있다.
본 발명의 또 다른 일 예는 신경교종 치료제의 스크리닝 방법에 관한 것이다.
본 발명이 제공하는 신경교종 치료제의 스크리닝 방법은, (i) 후보 물질을 신경교종 시료와 접촉시키는 단계 및 (ii) 상기 후보물질 처리군 신경교종 시료 및 미처리 대조군 시료 내 유사유전자 마커의 발현량을 분석하는 단계를 포함한다.
상기 유사유전자 마커는 상술한 바와 같다. 상기 신경교종 시료는 신경교종 환자로부터 분리한 시료, 신경교종을 유도한 동물 또는 상기 동물로부터 분리된 시료일 수 있다. 상기 시료는 모든 동물, 예컨대, 인간 등의 영장류, 마우스 등의 설치류를 포함하는 포유류로부터 얻어진 (분리된) 세포, 조직, 체액, 또는 이들의 배양물을 포함하는 것일 수 있으며, 일 예에서 신경교종 세포를 포함하는 암세포 또는 종양 조직을 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 후보 물질은 각종 화합물, 에컨대 단백질, 폴리펩타이드, 올리고펩타이드, 폴리뉴클레오타이드, 올리고뉴클레오타이드, 이외의 각종 소분자 화합물, 천연물, 및 천연물의 추출물 등으로 이루어진 군에서 선택된 것일 수 있으나, 이에 제한되는 것은 아니다.
본 발명이 제공하는 신경교종 치료제의 스크리닝 방법에 있어서, 상기 (1) HGNC:18611 유사유전자, HGNC:13229 유사유전자, HGNC:5240 유사유전자, HGNC:7404 유사유전자, HGNC:32523 유사유전자, HGNC:30222 유사유전자, HGNC:30080 유사유전자, HGNC:16797 유사유전자, HGNC:30518 유사유전자, HGNC:33993 유사유전자, HGNC:11987 유사유전자, 및 HGNC:30806 유사유전자로 이루어지는 군에서 선택되는 1종 이상의 유사유전자 마커의 발현량이 상기 후보물질 미처리 대조군 시료에 비해 감소한 경우, 상기 후보물질을 신경교종 치료제로 결정할 수 있다.
본 발명이 제공하는 신경교종 치료제의 스크리닝 방법에 있어서, 상기 (2) HGNC:30486 유사유전자, HGNC:24976 유사유전자, HGNC:30886 유사유전자, 및 HGNC:35196 유사유전자로 이루어지는 군에서 선택되는 하나 이상의 유사유전자 마커의 발현량이 상기 후보물질 미처리 대조군 시료에 비해 증가한 경우, 상기 후보물질을 신경교종 치료제로 결정할 수 있다.
본 발명이 제공하는 신경교종 치료제의 스크리닝 방법은 상기 신경교종 시료의 신경교종의 원발성 또는 재발성 여부를 확인하는 단계를 추가로 포함할 수 있다.
본 발명은 신경 교종의 악성도 진단 및 예후 예측용 유사유전자 마커 및 상기 마커를 검출하기 위한 신경교종의 악성도 진단 및 예후 예측용 조성물 및 이의 이용에 관한 것으로서, 기존 신경교종 진단에서 이루어지는 형태학적 진단방법의 단점을 보완할 수 있다. 보다 구체적으로, 유사유전자 마커의 발현량 분석을 통해 신경교종의 악성도를 정확하게 예측하고, 환자의 생존율을 예측하여 환자의 상태에 따른 적절한 진료를 제공할 수 있도록 한다.
또한 기존의 암패널을 이용한 신경교종의 유전자 변이를 이용한 진단 방식과 함께 유사유전자 발현 패턴을 확인함으로써 신경교종의 진행 수준의 진단 및 예측을 보다 정확하게 할 수 있다.
도 1은 TCGA 데이터 세트에서 신경교종의 악성 등급간 유의미한 발현량 차이를 나타내는 유사유전자의 분포를 나타낸 벤 다이어그램이다. G2: Grade II, G3: Grade III, 및 G4: Grade IV를 의미하며, 각 붉은색 글씨는 벤 다이어그램의 영역 구분 기호이다.
도 2는 CGGA 데이터 세트에서 신경교종의 악성 등급간 유의미한 발현량 차이를 나타내는 유사유전자의 분포를 나타낸 벤 다이어그램이다. G2: Grade II, G3: Grade III, 및 G4: Grade IV를 의미하며, 각 붉은색 글씨는 벤 다이어그램의 영역 구분 기호이다.
도 3은 TCGA 데이터세트와 CGGA 데이터세트에서 신경교종의 악성도 전체 등급에서 공통적으로 유의미한 발현 차이를 보인 유사유전자의 분포를 나타낸 벤 다이어그램이다. 각 붉은색 글씨는 벤 다이어그램의 영역 구분 기호이다.
도 4a 내지 4l은 원발성 신경교종(Primary Tumor) 환자군에서, 발현량이 높을수록 위험비가 증가하는 것으로 확인된 유사유전자 마커의 발현 수준에 따른 생존 분석 그래프(survival plot)이다. 각 도면에서 좌측 그래프는 TCGA 데이터세트 분석 결과, 우측 그래프는 CGGA 데이터 세트 분석 결과이며, 청록색은 각 유사유전자의 저발현 환자군(LOW), 적색은 유사유전자 고발현 환자군(HIGH)을 의미한다.
도 5a 내지 5d는 원발성 신경교종(Primary Tumor) 환자군에서, 발현량이 높을수록 위험비가 감소하는 것으로 확인된 유사유전자 마커의 발현 수준에 따른 생존 분석 그래프(survival plot)이다. 좌측 그래프는 TCGA 데이터세트 분석 결과, 우측 그래프는 CGGA 데이터 세트 분석 결과이며, 청록색은 각 유사유전자의 저발현 환자군(LOW), 적색은 유사유전자 고발현 환자군(HIGH)을 의미한다.
도 6a 내지 6d는 재발성 신경교종(Recurrent Tumor) 환자군에서, 발현량이 높을수록 위험비가 증가하는 것으로 확인된 유사유전자 마커의 발현 수준에 따른 생존 분석 그래프이다. 좌측 그래프는 TCGA 데이터세트 분석 결과, 우측 그래프는 CGGA 데이터 세트 분석 결과이며, 청록색은 각 유사유전자의 저발현 환자군(LOW), 적색은 유사유전자 고발현 환자군(HIGH)을 의미한다.
도 7a 내지 7b는 재발성 신경교종(Recurrent Tumor) 환자군에서, 발현량이 높을수록 위험비가 감소하는 것으로 확인된 유사유전자 마커의 발현 수준에 따른 생존 분석 그래프이다. 좌측 그래프는 TCGA 데이터세트 분석 결과, 우측 그래프는 CGGA 데이터 세트 분석 결과이며, 청록색은 각 유사유전자의 저발현 환자군(LOW), 적색은 유사유전자 고발현 환자군(HIGH)을 의미한다.
도 8a 내지 8l은 원발성 신경교종 환자군에서, 발현량이 높을수록 위험비가 증가하는 것으로 확인된 유사유전자들의 발현 패턴 및 분포 밀도를 나타낸 바이올린 그래프(Violin plot)이다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
도 9a 내지 9d는 원발성 신경교종 환자군에서, 발현량이 높을수록 위험비가 감소하는 것으로 확인된 유사유전자들의 발현 패턴 및 분포 밀도를 나타낸 바이올린 그래프(Violin plot)이다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
도 10a 내지 10d는 재발성 신경교종 환자군에서, 발현량이 높을수록 위험비가 증가하는 것으로 확인된 유사유전자들의 발현 패턴 및 분포 밀도를 나타낸 바이올린 그래프(Violin plot)이다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
도 11a 내지 11b는 재발성 신경교종 환자군에서, 발현량이 높을수록 위험비가 감소하는 것으로 확인된 유사유전자들의 발현 패턴 및 분포 밀도를 나타낸 바이올린 그래프(Violin plot)이다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
이하 본 발명을 실시예에 의해 구체적으로 설명한다. 그러나 하기 실시예에 의해 본 발명의 권리범위가 제한되는 것은 아니다.
실시예 1. 신경교종의 악성도와 관련된 유사유전자의 바이오마커 규명
1-1. 데이터 세트 준비
신경교종의 유전자 발현 데이터 세트로서, TCGA와 CGGA 데이터베이스를 이용하였다.
TCGA의 신경교종 데이터 세트인 TCGA 저등급 신경교종 및 교모세포종 (TCGA lower grade glioma and glioblastoma, TCGA-GBMLGG)의 유전자 발현 RNAseq 데이터 세트(version; 2017-09-08)는 UCSC XENA (https://xena.ucsc.edu/)에서 다운로드 하였다. 상기 TCGA-GBMLGG 데이터 세트는 Illumina HiSeq 2000 플랫폼으로 생성된 RNAseq 유전자 발현 데이터로, 모든 데이터 값은 RSEM(RNA-seq by expectation Maximization) 정규화 및 log2 transform 된 상태이다. 상기의 TCGA-GMBLGG 데이터 세트에서 'HiSeqV2'는 702명의 신경교종 환자에 대하여 20,531개 유전자의 발현량 값이 tab으로 구분되어 있는 파일이고, 'GBMLGG_clinicalMatrix'는 'HiSeqV2'의 신경교종 환자를 포함한 1,148명의 다양한 임상 정보(clinical information)가 포함되어 있는 파일이다.
CGGA의 신경교종 환자의 RNA-Seq 데이터 세트는 GLIOMASdb (http://cgga.org.cn:9091/gliomasdb/download.jsp)에서 다운로드하였다. CGGA 데이터 세트 역시 Illumina HiSeq 2000 플랫폼으로 생성된 RNAseq 유전자 발현 데이터이며, RSEM 및 TMM 정규화 되어 있다. CGGA 데이트 세트에서 'CGGA_Gene_Expression_Profile_FPKM'는 325명의 신경교종 환자에 대하여 17,527개 유전자의 발현량 값이 tab으로 구분되어 있는 파일이며, 'Patient_Characteristics.txt'는 'CGGA_Gene_Expression_Profile_FPKM'의 신경교종 환자와 일치하는 325명의 임상 정보가 포함되어 있는 파일이다.
1.2 데이터 전처리
실시예 1.1의 데이터 세트 중 TCGA-GBMLGG의 임상 정보가 담긴 'GBMLGG_clinicalMatrix'파일은 필요한 정보만 추출하여 'sampleID', 'neoplasm_histologic_grade', 'primary_disease', 및 'sample_type'으로 칼럼을 재구성하였고 CGGA의 임상 정보가 담긴 'Patient_Characteristics.txt'에서는 별도의 재처리 과정을 수행하지 않았다. 본 발명에서 모든 데이터는 R(version; 3.5.2, The R Foundation, https://www.r-project.org/)을 이용해 작성된 스크립트를 이용하여 데이터를 처리하였다. 구체적인 데이터 처리 과정은 후술하는 바와 같다.
첫 번째, 추출된 TCGA의 임상정보 데이터의 'neoplasm_histologic_grade' 칼럼에서 각각 grade II의 악성도와 grade III의 악성도를 의미하는 'G2'및 'G3'의 값을 갖는 환자의 Sample ID를 각각 분류하였다. 두 번째, 'primary_disease'컬럼에서 'glioblastoma multiforme'의 값을 갖는 Sample ID를 grade IV의 악성도를 의미하는 'G4'로 분류하였고'neoplasm_histologic_grade'와 'primary_disease'에서 악성도가 분류된 Sample ID를 'Grade' 컬럼으로 통합하였다. 세 번째, 'sample_type' 컬럼에서는 'Primary Tumor'와 'Recurrent Tumor'의 값을 갖는 환자의 Sample ID를 각각 분류하였으며 'sample_type'과 악성도가 분류되지 않는 Sample ID는 제외하였다.
상기와 같이 신경교종 환자의 다양한 임상 정보를 기반으로 Sample ID를 범주에 따라 각각 분류한 뒤, Sample ID에 해당하는 20,530개 유전자의 발현량 값을 추출하였다.
CGGA의 임상정보 데이터에서는 'Histology' 칼럼에서 'Recurrent Tumor'를 의미하는 'r'이 표기된 'rA', 'rAA', 'rAO', 'rOA', 'rAOA', 및 'rGBM'을 'Recurrent Tumor'로 분류하였고 나머지를 'Primary tumor'로 분류하였다. 이후 악성도를 의미하는 'Grade' 컬럼의 데이터를 사용하여 상기 TCGA 데이터와 실질적으로 동일한 방법으로 Grade II 내지 IV의 범주에 따라 분류한 뒤, 각 Sample ID에 해당하는 17,527개의 유전자 발현량 값을 추출 후 log2 transformation하여 이후 분석을 진행하였다.
전처리를 마친 TCGA-GBMLGG 데이터 세트와 CGGA 데이터 세트에서, 신경교종 환자의 임상 병리학적 특성을 표 1에 나타내었다.
데이터 세트 분류기준 환자수 비율 (%)
TCGA_GBMLGG 전체 환자 695 100
병기(Grade) Grade II 258 37
Grade III 270 39
Grade IV 167 24
종양 종류 원발성 종양 668 96
재발성 종양 27 4
CGGA 전체 환자 325 100
병기 (Grade) Grade II 109 34
Grade III 72 22
Grade IV 144 44
종양 종류 원발성 종양 264 81
재발성 종양 61 19
TCGA 데이터 파일에 포함된 1,142명의 환자는 원발성 종양(Primary Tumor)과 재발 종양(Recurrent Tumor) 환자군으로 분류될 수 있으며, 이 중에서 유전자 발현 데이터를 보유한 695명의 데이터를 선별하였다. 695개 데이터 중 원발성 종양으로 분류되는 환자는 668명으로 TCGA 분석 대상 데이터의 약 96%를 차지하고, 재발 종양으로 분류되는 환자는 27명으로 약 4%에 해당하였다. 상기 695명의 데이터를 악성도에 따라 분류한 결과, Grade II(G2) 값을 갖는 샘플은 258명, Grade III (G3) 및 Grade IV (G4)에 해당하는 샘플은 각각 270명 및 167명으로 분류되었다.
CGGA 데이터 세트에서는 임상정보 파일에 나타난 325명 환자 전원의 유전자 발현 데이터가 제공되어 상기 TCGA 데이터 파일에서와 같은 선별 작업은 거치지 않았다. 종양 등급에 따라 분류한 결과, Grade II (G2)에 해당하는 샘플 ID는 총 109명, G3 및 G4에 해당하는 Sample ID는 각각 72명 및 144명으로 분류되었다. 상기 325명 전체 환자 중 원발성 종양(Primary Tumor)에 해당하는 환자는 264명으로 전체 CGGA 분석 데이터의 81%, 재발 종양(Recurrent Tumor)에 해당하는 환자는 총 61명으로 약 19%에 해당하였다.
1.3. 유사유전자 세트의 준비
인간 유전자 명명 국제 기관인 HUGO Gene Nomenclature Committee (HGNC)로부터 12,963 개의 유사유전자 목록을 제공받아 분석용 유전자 세트로 이용하였다. HGNC로부터 제공받은 유사유전자 목록은 (i) 각 유전자에 상응하는 HGNC ID (HGNC.ID), (ii) 현재 승인되어 사용중인 유전자명(Approved.symbol) (iii) 동일 유전자의 이명 (Synonyms), 및 (iv) 이전에 사용되었던 유전자명 (Previous.symbols) 등으로 범주가 분리되어 있으며, 이로부터 순수한 유사유전자 세트만을 분리하기 위해 추가 필터링 과정을 수행하였다.
구체적으로, 추가 필터링 과정은 상기 HGNC로부터 제공받은 '단백질 발현 유전자와 중복되는 유전자명'을 이용하여, 상기 12,963개 유사유전자 목록에서 '단백질 발현 유전자와 중복되는 유전자명'과 일치하는 유전자를 모두 제외하여 수행하였다.
TCGA 데이터 세트와 CGGA 데이터 세트에서의 유전자명을 통일하기 위해, 각 데이터 세트에 'HGNC.ID' 컬럼을 추가하여 해당 각 유전자명에 상응하는 HGNC.ID를 추가하였다. 이후 각 데이터 세트에서 유사 유전자만을 분류하였다. 하기 표 2에 TCGA 데이터세트와 CGGA 데이터세트 내 전체 유전자 및 유사유전자의 정량 분석 결과를 나타내었다.
Figure 112020010731244-pat00001
상기 표2에 나타낸 바와 같이, HGNC로부터 제공받은 전체 유사유전자는 12,963개이고, TCGA 데이터 세트의 전체 유전자는 20,531개 이며, 이 중 유사유전자는 450개로 전체 유전자의 약 2.19%에 해당하였다. CGGA 데이터 세트에서는 전체 17,527개 유전자 중 약 2.53%에 해당하는 444개의 유사유전자가 확인되었다.
1-4. 통계 분석
상기 TCGA 및 CGGA의 유사유전자 세트에 대하여 신경교종의 악성도에 따라 분류한 grade II, grade III 및 grade IV 그룹 간의 유사 유전자 발현량의 차이를 비교하기 위하여 상기 실시예 1-2에서 준비한 데이터에 대하여 분산 분석(ANOVA 분석)과 사후 분석(post hoc)를 시행하였다.
구체적으로, Shapiro-Wilk test와 Bartlett test를 통해 정규성 검정과 등분산성 검정을 시행하였고, (i) 정규성 검정 및 등분산성 검정을 모두 통과하면 '일원배치 분산분석(One-way ANOVA)' 및 'Tukey 방식의 사후 분석'을 진행하였다. (ii) 정규성 검정은 통과하였으나 등분산성 검정을 통과하지 못하면 'Welch's ANOVA' 및 'GAMES-HOWELL 방식의 사후 분석'을 진행하였고 (iii) 정규성 검정을 통과하지 못한 그룹에서는 비모수 방식인 'Kruskal-Wallis test' 및 'Tukey and Kramer (Nemenyi) test'를 시행하였다.
통계적 유의성의 기준으로는 분산분석의 p-value가 0.05 미만일 때, Benjamini & Hochberg을 통과하여 하나 이상의 악성도에서 특이적으로 발현하는 유사유전자들을 1차적으로 선별하였고 사후분석을 진행하여 모든 악성도 그룹 간의 사후분석의 p-value가 0.05 미만으로 모든 악성도 간 발현량의 차이가 통계적으로 유의한 유사유전자들을 2차적으로 선별하였다. 모든 수학적 계산 및 통계 분석은 R 스크립트를 작성하여 처리하였다.
1-5. 벤 다이어그램 분석
상기 실시예 1-4로부터 얻은 통계적 유의성을 만족하는 유사 유전자의 데이터 세트별 분포를 확인하고, TCGA 및 CGGA 데이터세트에서 악성도(등급)에 따라 공통적으로 통계적이 유의성을 만족하는 유사 유전자를 확인하기 위하여 벤 다이어그램 분석을 수행하였다. 벤 다이어그램 분석은 웹 사이트툴인 Venny (version 2.1.0; BioinfoGP Service, CNB-CSIC, http://bioinfogp.cnb.csic.es/tools/venny/)를 이용하여 수행되었다.
도 1에는 TCGA 데이터 세트에서 신경교종의 악성도에 따라 'Grade II-Grade III', 'Grade II-Grade IV' 및 'Grade III-Grade IV'에서 유의미한 발현량 차이를 나타내는 유사유전자의 분포를 나타낸 벤 다이어그램을 나타내었다.
도 2에는 CGGA 데이터세트에서 신경교종의 악성도에 따라 'Grade II-Grade III', 'Grade II-Grade IV' 및 'Grade III-Grade IV'에서 유의미한 발현량 차이를 나타내는 유사유전자의 분포를 나타낸 벤 다이어그램을 나타내었다.
도 3에는 상기 TCGA 데이터 세트와 CGGA 데이터 세트에서 신경교종의 악성도 전체 등급에서 공통적으로 유의미한 발현차이를 보인 유사유전자(도 1의 s5 및 도 2의 s12)의 분포를 나타낸 벤 다이어그램을 나타내었다.
하기 표 3에 도 1 내지 도 3의 벤 다이어그램 각 구역의 의미를 나타내었다.
구역 설명
s1 TCGA 데이터베이스에서 “Grade II - Grade III"만 포함하는 구역
s2 TCGA 데이터베이스에서 "Grade II - Grade III"와 “Grade II - Grade IV"의 공통 구역
s3 TCGA 데이터베이스에서 “Grade II - Grade IV"만 포함하는 구역
s4 TCGA 데이터베이스에서 "Grade II - Grade III" 와 “Grade III - Grade IV"의 공통 구역
s5 TCGA 데이터베이스에서 "Grade II - Grade III", “Grade III - Grade IV" 및 “Grade II - Grade IV"의 공통 구역
s6 TCGA 데이터베이스에서 "Grade III - Grade IV" 와 “Grade II - Grade IV"의 공통 구역
s7 TCGA 데이터베이스에서 “Grade III - Grade IV"만 포함하는 구역
s8 CGGA 데이터베이스에서 “Grade II - Grade III"만 포함하는 구역
s9 CGGA 데이터베이스에서 "Grade II - Grade III"와 “Grade II - Grade IV"의 공통 구역
s10 CGGA 데이터베이스에서 “Grade II - Grade IV"만 포함하는 구역
s11 CGGA 데이터베이스에서 "Grade II - Grade III" 와 “Grade III - Grade IV"의 공통 구역
s12 CGGA 데이터베이스에서 "Grade II - Grade III", “Grade III - Grade IV" 및 “Grade II - Grade IV"의 공통 구역
s13 CGGA 데이터베이스에서 "Grade III - Grade IV" 와 “Grade II - Grade IV"의 공통 구역
s14 CGGA 데이터베이스에서 “Grade III - Grade IV"만 포함하는 구역
s15 TCGA 데이터베이스에서만 "Grade II - Grade III" , “Grade III - Grade IV" 및 “Grade II - Grade IV"의 공통 구역
s16 TCGA 데이터베이스와 CGGA 데이터베이스에서 "Grade II - Grade III" , “Grade III - Grade IV" 및 “Grade II - Grade IV"의 공통으로 포함하는 구역
s17 TCGA 데이터베이스에서만 "Grade II - Grade III" , “Grade III - Grade IV" 및 “Grade II - Grade IV"의 공통 구역
도 1에서 확인 가능한 바와 같이, TCGA 데이터 세트의 유사유전자 중 하나 이상의 신경교종 악성도(Grade, G)에서 통계적으로 유의미한 발현량 차이를 나타내 분산 분석을 통과한 유전자는 총 338개였다. 이 중 Grade II 내지 IV의 악성도 모두에서 유의미한 발현량 차이를 보인 유사유전자는 102개로 나타났다 (도 1의 s5구역).
도 2에서 확인된 CGGA 데이터 세트에서 통계적으로 유의미한 발현량 차이를 보여 분산 분석을 통과한 유전자는 총 255개였으며, Grade II 내지 IV의 모든 악성도에서 유의미한 발현량 차이를 보인 유사유전자는 총 51개였다 (도 2의 s12 구역).
상기 도 1의 s5 구역 및 도 2의 s12 구역에 해당하는 유사유전자를 분석한 결과, 도 3에서 확인할 수 있는 바와 같이, 두 가지 데이터 세트 모두에서 공통적으로 모든 신경교종 악성도에 대해 발현량 차이를 나타낸 유사유전자는 총 22개가 확인되었다 (도 3의 s16 구역). 총 22개의 유전자 중 기존에 알려져 있는 5개의 유사유전자를 제외한 17개 유사유전자의 사후 검정 결과를 하기 표 4 및 5에 나타내었다. 표 4는 TCGA 데이터 세트의 결과를, 표 5는CGGA 데이터세트에서의 결과이다. 하기 표 4 및 5에서 Mean Difference는 사후 분석으로 계산된 사후검정 대상의 발현량의 평균 차이를 의미한다.
구체적으로 상기 사후검정의 대상은 Grade II와 Grade III, Grade II와 Grade IV, Grade III와 Grade IV이며 검정 방법으로는 상기의 TCGA와 동일한 방법을 사용하였다. Shapiro-Wilk test와 Bartlett test를 통해 정규성 검정과 등분산성 검정을 시행하였고, (i) 정규성 검정 및 등분산성 검정을 모두 통과하면 '일원배치 분산분석(One-way ANOVA)' 및 'Tukey 방식의 사후 분석'을 진행하였다. (ii) 정규성 검정은 통과하였으나 등분산성 검정을 통과하지 못하면 'Welch's ANOVA' 및 'GAMES-HOWELL 방식의 사후 분석'을 진행하였고 (iii) 정규성 검정을 통과하지 못한 그룹에서는 비모수 방식인 'Kruskal-Wallis test' 및 'Tukey and Kramer (Nemenyi) test'를 시행하였다.
Figure 112020010731244-pat00002
Figure 112020010731244-pat00003
실시예 2. 임상적 유의성에 의한 유사유전자 마커의 2차 선정
실시예 1에서 선정된 17개의 유사유전자에 대하여, 신경교종 환자의 생존과 관련하여 임상적으로 유의미한 유사유전자를 선정하기 위하여, 원발성 신경교종 (Primary tumor) 환자군과 재발성 신경교종 (Recurrent Tumor) 환자군의 각 유사유전자에 대하여 콕스 위험비례모델 분석을 시행하여 상대적 위험도를 비교하였다.
구체적으로, TCGA 및 CGGA 데이터 세트에서 각각 원발성 및 재발성 신경교종 환자군을 분류하고, 각 환자군에서 상기 실시예 1에서 선별된 17개 유사유전자의 상대적인 발현 정도를 정규화(Normalization)하여 0에서 1 사이의 값으로 변환한 후, 표준화(Standardization)를 시행하였다. 이후 정규화와 표준화를 마친 발현량에 따른 콕스 비례위험모형 분석을 수행하여 각 유사유전자의 발현량에 따른 상대적인 위험비를 계산하였다. 하기 표 6에 TCGA 데이터세트의 원발성 환자에 대한 위험 비례표, 표 7에 CGGA 데이터세트의 원발성 환자에 대한 위험 비례표를, 표 8에 TCGA 데이터세트의 재발성 환자에 대한 위험 비례표, 표 9에 CGGA 재발성 환자에 대한 위험 비례표를 나타내었다. 각 분석에서 모든 P-value는 Benjamini-Hochberg 방식으로 보정하였으며, 보정된 P-value가 0.05 미만으로 통계적으로 유의미한 유사유전자를 선별하였다. 모든 수학적 계산 및 통계 분석은 R 스크립트를 작성하여 수행하였다.
Figure 112020010731244-pat00004
Figure 112020010731244-pat00005
Figure 112020010731244-pat00006
Figure 112020010731244-pat00007
상기 표 6, 7, 8 및 9에서, 위험비 (위험도, Hazard Ratio)의 값이 1 초과인 경우, 상대적 발현도가 높을수록 신경교종 위험도가 높아짐을 의미하고, 위험비 값이 1 미만인 경우 해당 유사유전자의 상대적 발현도가 높을수록 신경교종 위험도가 낮음을 의미한다.
상기 표 6에서 확인할 수 있는 바와 같이, 원발성 신경교종의 비례위험 분석 결과, 실시예 1에서는 17개의 유사유전자 모두 TCGA 및 CGGA 데이터베이스에서 통계적으로 유의미하게 발현량에 따른 위험비 변동을 보였다. 그러나 위험비의 경향이 상이하게 나타난 1개의 유사유전자 ADAM6의 경우, TCGA에서의 위험비는 1.4320, CGGA에서 위험비는 0.2695로 각 데이터베이스에서 상이한 결과가 나왔으며 이는 두 데이터베이스의 사용하는 인종이 TCGA(미국), CGGA(중국)으로 인종간의 차이성 혹은 추가적인 연구가 필요하다고 판단되어 제외하여, 최종 16개의 유사유전자를 선정하였다.
재발성 신경교종의 경우에는 실시예 1에서 선정된 16개의 유사유전자 중 위험도가 유의하게 변동된 6개의 유사유전자를 선정하였다. 원발성 및 재발성 신경교종에 대해 선정된 유사유전자 마커는 모두 TCGA 데이터 세트 및 CGGA 데이터세트 모두에서 유사한 위험비 값을 보였다.
최종 선별된 원발성 신경교종의 유사유전자 마커 16종은, 상대적 발현량이 높을수록 위험도가 높은 12개 유사유전자 (원발암성 고발현-고위험군, HGNC:18611, HGNC:13229, HGNC: 5240, HGNC:7404, HGNC:32523, HGNC:30222, HGNC:30080, HGNC:16797, HGNC:30518, HGNC:33993, HGNC:11987, HGNC:30806)와 상대적 발현량이 높을수록 위험도가 낮은 4개의 유사유전자 (원발암성 고발현-저위험군, HGNC:30486, HGNC:24976, HGNC:30886, HGNC:35196) 선정되었다.
최종 선별된 재발성 신경교종의 유사유전자 마커 6종은 상대적 발현량이 높을수록 위험도가 높은 4개 유사유전자 (재발암성 고발현-고위험군, HGNC:5240, HGNC:32523, HGNC:30222, HGNC:30518) 및 상대적 발현량이 높을수록 위험도가 낮은 2개 유사유전자 (재발암성 고발현-저위험군, HGNC:30486, HGNC:35196)가 선정되었다.
실시예 3. 유사유전자 바이오마커를 이용한 신경교종 환자의 악성도 예측
3-1. 유사유전자 발현 수준에 따른 생존율 분석
상기 실시예 2에서 최종 선정된 유사유전자들의 발현 수준에 따른 TCGA 및 CGGA 데이터 세트의 원발성 및 재발성 신경교종 환자군에서 실제 생존율의 차이를 확인하였다.
구체적으로, 각 환자군(원발암군, 재발암군)에서 각 유사유전자들의 발현값을 발현 크기대로 정렬하였을 때 갖는 중간값(중간 발현수준)을 산출하였다. 상기 유사유전자의 중간 발현수준보다 해당 유사유전자의 발현 수준이 높은 환자군을 고발현군(High Expression)으로, 발현 수준이 낮은 환자군을 저발현군(Low Expression)으로 분류하여 각 유사유전자의 발현 수준에 따른 Kaplan-Meier 생존분석을 시행하였다. 도 4a 내지 4l에는 발현량이 높을수록 위험도가 증가하는 각 유사유전자 마커 발현 수준에 따른 원발성 신경교종(Primary Tumor) 환자군(원발암성 고발현-고위험군)의 생존 분석 그래프(Survival plot)를 나타내었다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트의 환자군, 우측 그래프는 CGGA 데이터 세트의 환자군에 대한 생존 분석 그래프이다.
원발암성 고발현-고위험군 환자군에서는, HIGH로 나타낸 고발현군 환자군(적색 라인)에서의 생존율 감소가 LOW로 표시된 저발현군 환자군(청록색 라인)에 비해 더 빠르게 나타났다.
도 5a 내지 5d에는 발현량이 높을수록 위험도가 낮은 각 유사유전자 마커의 발현 수준에 따른 원발성 신경교종 환자군(원발암성 고발현-저위험군)의 생존 분석 그래프를 나타내었다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트의 환자군, 우측 그래프는 CGGA 데이터 세트의 환자군에 대한 생존 분석 그래프이다.
원발성 고발현 저위험군 환자군에서, 도 5a 내지 5d의 생존 분석 그래프는 모두 공통적으로 HIGH로 나타낸 고발현군 환자군(적색 라인)에서의 생존율 감소가 LOW로 표시된 저발현군 환자군(청록색 라인)에 비해 늦게 나타났다.
도 6a 내지 6l에는 발현량이 높을수록 위험도가 증가하는 각 유사유전자 마커 발현 수준에 따른 재발성 신경교종 (Recurrent Tumor) 환자군(재발암성 고발현-고위험군)의 생존 분석 그래프를 나타내었다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트의 환자군, 우측 그래프는 CGGA 데이터 세트의 환자군에 대한 생존 분석 그래프이다. 재발암성 고발현-고위험 환자군에서, HIGH로 나타낸 고발현군 환자군(적색 라인)에서의 생존율 감소가 LOW로 표시된 저발현군 환자군(청록색 라인)에 비해 더 빠르게 나타났다.
도 7a 내지 7d에는 발현량이 높을수록 위험도가 감소하는 각 유사유전자 마커 발현 수준에 따른 재발성 신경교종 환자군(재발암성 고발현-저위험군)의 생존분석 그래프를 나타내었다. 각 도면에서 좌측 그래프는 TCGA 데이터 세트의 환자군, 우측 그래프는 CGGA 데이터 세트의 환자군에 대한 생존 분석 그래프이다. HIGH로 나타낸 고발현군 환자군(적색 라인)에서의 생존율 감소가 LOW로 표시된 저발현군 환자군(청록색 라인)에 비해 더 천천히 나타났다.
따라서, 생존 분석율 분석 결과 각 유사유전자의 상대적인 발현량에 따라 데이터 세트 또는 신경교종 환자의 원발성 또는 재발성 여부에 관계없이 생존율 변화가 크게 나타나는 것을 확인하여, 해당 유사 유전자 마커의 발현량 차이에 의해 위험도 변화를 예측할 수 있음을 확인하였다.
3-2. 위험도에 따른 유사 유전자 마커의 발현 패턴 분석
또한 신경교종의 악성도(Grade II 내지 IV)로 구분한 환자군 그룹에서 상기 실시예 2에서 최종 선정된 유사유전자 마커의 발현패턴 및 분포밀도를 비교하기 위하여 실시예 2와 실질적으로 동일한 방법으로 정규화 및 표준화 된 상대적인 발현데이터를 사용하여 발현량 수준을 바이올린 그래프(Violin plot)로 확인하였다.
구체적으로, TCGA 및 CGGA 데이터세트의 원발성 및 재발성 환자군을 다시 악성도에 따라 Grade II(G2) 내지 Grade IV(G4)로 세분화하고, 이에 따른 각 유사유전자 마커의 발현 패턴을 바이올린 그래프로 나타내었다.
도 8a 내지 8l에 원발성 신경교종 환자군에서 실시예 2에서 판단된 12종의 발현량이 증가함에 따라 위험비가 증가하는 유사유전자들(원발암성 고발현-고위험 유사유전자군)의 발현 패턴 및 분포 밀도를 나타낸 바이올린 그래프(Violin plot)을 나타내었다. 모든 그래프의 좌측은 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과 그래프이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
모든 원발암성 고발현-고위험 유사유전자 마커에서 신경교종의 등급이 증가함에 따라 정규화된 발현량의 정규화 수치 또한 함께 증가하였으며, 밀도는 중앙값 부근에서 가장 높은 밀도를 나타내었다.
도 9a 내지 9d에 원발성 신경교종 환자군에서 실시예 2에서 판단된 4종의 발현량이 증가함에 따라 위험비가 감소하는 유사유전자(원발암성 고발현-저위험 유사유전자군)들의 발현 패턴 및 분포 밀도 바이올린 그래프를 나타내었다. 모든 그래프의 좌측은 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과 그래프이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
4종의 원발암성 고발현-저위험 유사유전자 마커에서 모두 신경교종 등급 증가에 따라 정규화된 유사유전자 발현량이 감소하는 추세를 보여, 각 바이오마커가 모두 발현량 증가에 따라 신경교종의 위험도가 감소함을 확인하였다.
도 10a 내지 10d에 재발성 신경교종 환자군에서 실시예 2에서 판단된 4종의 발현량이 증가함에 따라 위험비가 증가하는 유사유전자들(재발암성 고발현-고위험 유사유전자군)의 발현 패턴 및 분포 밀도 바이올린 그래프를 나타내었다. 모든 그래프의 좌측은 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과 그래프이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
재발암성 고발현-고위험 유사유전자군에 해당하는 HGNC:5240 유사유전자와 HGNC32523 유사유전자의 경우 G2에서 G3으로 진행함에 따라 발현량이 감소하였다가 다시 G4로 진행하면서 발현량이 G2에서보다 급증하는 양상을 보였으며, HGNC:30222 유사유전자는 신경교종 등급 증가에 따라 발현량이 함께 증가하였다. HGNC:30518 유사유전자의 경우, 신경교종의 등급 증가(병기의 진행)에 따라 전체적인 발현량이 증가하는 패턴을 보였다.
도 11a 내지 11b에 재발성 신경교종 환자군에서 실시예 2에서 판단된 2종의 발현량이 증가함에 따라 위험비가 감소하는 유사유전자들(재발암성 고발현-저위험 유사유전자군)의 발현 패턴 및 분포 밀도 바이올린 그래프를 나타내었다. 모든 그래프의 좌측은 TCGA 데이터 세트, 우측은 CGGA 데이터 세트의 분석 결과 그래프이며, 2등급 (Grade II, G2)은 회색, 3등급(Grade III, G3)은 청색 및 4등급 (Grade IV, G4)의 신경교종은 황색으로 표시하였다.
재발암성 고발현-저위험 유사유전자군에 해당하는 2가지 바이오마커 모두 등급이 Grade II에서 Grade IV로 진행됨에 따라 발현량이 감소하는 추세를 보여, 바이오마커로서 적절함을 확인하였다.

Claims (15)

  1. 다음을 포함하는 유사유전자 군의 각 유사유전자를 검출하는 제제를 포함하는, 신경교종의 등급 진단 또는 위험도 예측용 조성물:
    (1) HGNC:5240 유사유전자, HGNC:32523 유사유전자, HGNC:30518 유사유전자 및 HGNC:30222 유사유전자로 이루어진 유사유전자 군; 및
    (2) HGNC:30486 유사유전자 및 HGNC:35196 유사유전자로 이루어진 유사유전자 군.
  2. 제1항에 있어서, 상기 (1) 유사유전자 군은 HGNC:18611 유사유전자, HGNC:13229 유사유전자, HGNC:7404 유사유전자, HGNC:30080 유사유전자, HGNC:16797 유사유전자, HGNC:33993 유사유전자, HGNC:11987 유사유전자 및 HGNC:30806 유사유전자로 이루어지는 군에서 선택되는 1종 이상의 유사유전자를 추가로 포함하는, 조성물.
  3. 제1항에 있어서, 상기 (2) 유사유전자 군은 HGNC:24976 유사유전자 및 HGNC:30886 유사유전자로 이루어진 군에서 선택되는 1종 이상의 유사유전자를 추가로 포함하는, 조성물.
  4. 제1항에 있어서, 상기 신경교종은 원발성 신경교종 또는 재발성 신경교종인 것인, 조성물.
  5. 제1항에 있어서, 상기 신경교종은 2등급 내지 4등급인 것인, 조성물.
  6. 제1항에 있어서, 상기 유사유전자를 검출하는 제제는, 상기 각각의 유사유전자에 상보적인 프라이머 세트, 프로브, 압타머, 또는 안티센스 핵산인 것인, 조성물.
  7. 제1항 내지 제6항 중 어느 한 항의 조성물을 포함하는, 신경교종의 등급 진단 또는 위험도 예측용 키트.
  8. 제1항 내지 제6항 중 어느 한 항의 조성물을 이용하여 환자로부터 분리된 생물학적 시료에서 상기 유사유전자의 발현수준을 측정하는 단계를 포함하는, 신경교종의 위험도 예측에 관한 정보를 제공하는 방법.
  9. 제8항에 있어서,
    상기 HGNC:5240 유사유전자, HGNC:32523 유사유전자, HGNC:30518 유사유전자 및 HGNC:30222 유사유전자로 이루어진 (1) 유사유전자 군에서 선택되는 1종 이상의 유사유전자의 발현량이 고발현군에 속하는 경우, 신경교종의 위험도가 높은 것으로 결정하는 단계를 포함하며,
    상기 환자로부터 분리된 생물학적 시료에서 측정된 상기 유사유전자의 발현량이 기준치보다 높은 경우 상기 고발현군으로 결정하는 것이고,
    상기 기준치는 비환자의 유사유전자의 발현량, 상기 환자의 저등급 신경교종 단계에서의 유사유전자 발현량 또는 상기 환자가 재발암 환자인 경우, 재발 전 원발암 시료에서의 유사유전자 발현량을 의미하는 것인, 방법.
  10. 제8항에 있어서,
    상기 (2) HGNC:30486 유사유전자 및 HGNC:35196 유사유전자로 이루어진 유사유전자 군에서 선택되는 하나 이상의 유사유전자의 발현량이 고발현군에 속하는 경우, 신경교종의 위험도가 낮은 것으로 결정하는 단계를 포함하며,
    상기 환자로부터 분리된 생물학적 시료에서 측정된 상기 유사유전자의 발현량이 기준치보다 높은 경우 상기 고발현군으로 결정하는 것이고,
    상기 기준치는 비환자의 유사유전자의 발현량, 상기 환자의 저등급 신경교종 단계에서의 유사유전자 발현량 또는 상기 환자가 재발암 환자인 경우, 재발 전 원발암 시료에서의 유사유전자 발현량을 의미하는 것인, 방법.
  11. 후보 물질을 환자로부터 분리된 신경교종 시료에 접촉시키는 단계; 및
    상기 후보물질 처리군 신경교종 시료 및 미처리 대조군 시료 내 유사유전자 마커의 발현량을 측정하여 비교하는 단계를 포함하는, 신경교종 치료제의 스크리닝 방법으로서,
    상기 유사유전자 마커는,
    (1) HGNC:5240 유사유전자, HGNC:32523 유사유전자, HGNC:30518 유사유전자 및 HGNC:30222 유사유전자로 이루어진 유사유전자 군; 및
    (2) HGNC:30486 유사유전자 및 HGNC:35196 유사유전자로 이루어진 유사유전자 군으로 이루어지는 유사유전자 군의 유사유전자 마커를 포함하는, 신경교종 치료제의 스크리닝 방법.
  12. 제11항에 있어서, 상기 (1) 유사유전자 군은 HGNC:18611 유사유전자, HGNC:13229 유사유전자, HGNC:7404 유사유전자, HGNC:30080 유사유전자, HGNC:16797 유사유전자, HGNC:33993 유사유전자, HGNC:11987 유사유전자 및 HGNC:30806 유사유전자로 이루어지는 군에서 선택되는 1종 이상의 유사유전자를 추가로 포함하는, 스크리닝 방법.
  13. 제11항에 있어서, 상기 (2) 유사유전자 군은 HGNC:24976 유사유전자 및 HGNC:30886 유사유전자로 이루어진 군에서 선택되는 1종 이상의 유사유전자를 추가로 포함하는, 스크리닝 방법.
  14. 제11항 또는 제12항 중 어느 한 항에 있어서, 상기 (1) 유사유전자 군에서 선택되는 1종 이상의 유사유전자 마커의 발현량이 상기 후보물질 미처리 대조군 시료에 비해 감소한 경우, 상기 후보물질을 신경교종 치료제로 결정하기 위한 정보를 제공하는 것인, 스크리닝 방법.
  15. 제11항 또는 제13항 중 어느 한 항에 있어서, 상기 (2) 유사유전자 군에서 선택되는 하나 이상의 유사유전자 마커의 발현량이 상기 후보물질 미처리 대조군 시료에 비해 증가한 경우, 상기 후보물질을 신경교종 치료제로 결정하기 위한 정보를 제공하는 것인, 스크리닝 방법.
KR1020200012227A 2020-01-31 2020-01-31 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용 KR102325356B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200012227A KR102325356B1 (ko) 2020-01-31 2020-01-31 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용
PCT/KR2021/001271 WO2021154056A2 (ko) 2020-01-31 2021-02-01 유사유전자의 신경교종의 악성도 진단을 위한 용도

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200012227A KR102325356B1 (ko) 2020-01-31 2020-01-31 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용

Publications (2)

Publication Number Publication Date
KR20210098262A KR20210098262A (ko) 2021-08-10
KR102325356B1 true KR102325356B1 (ko) 2021-11-11

Family

ID=77079772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200012227A KR102325356B1 (ko) 2020-01-31 2020-01-31 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용

Country Status (2)

Country Link
KR (1) KR102325356B1 (ko)
WO (1) WO2021154056A2 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8092995B2 (en) * 2009-01-02 2012-01-10 The Board Of Trustees Of The University Of Illinois Expressed pseudogene regulates gene expression
EP3122341A1 (en) * 2014-03-28 2017-02-01 Erasmus University Medical Center Rotterdam Method for diagnosing and treating multiple myeloma.

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Journal of Experimental & Clinical Cancer Research (2015) vol.34, No.23, pp1-7. 1부.*

Also Published As

Publication number Publication date
KR20210098262A (ko) 2021-08-10
WO2021154056A2 (ko) 2021-08-05
WO2021154056A3 (ko) 2021-09-23

Similar Documents

Publication Publication Date Title
JP2020503850A (ja) 腫瘍抑制foxo活性を酸化ストレスから区別する方法
KR20210045953A (ko) 암의 평가 및/또는 치료를 위한 무 세포 dna
KR20150082228A (ko) 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
CN113785076A (zh) 预测癌症预后的方法及其组合物
CN107532208B (zh) 用于测定子宫内膜癌预后的组合物和方法
WO2014080381A1 (en) Colorectal cancer classification with differential prognosis and personalized therapeutic responses
US20090192045A1 (en) Molecular staging of stage ii and iii colon cancer and prognosis
US20150299796A1 (en) Prediction of treatment response to jak/stat inhibitor
CN108949992B (zh) 一种与食管鳞癌及其分级相关的生物标志物
EP3950960A1 (en) Dna methylation marker for predicting recurrence of liver cancer, and use thereof
KR101860238B1 (ko) 신장암 예후 진단 마커로서 zfp28, fam155a 및 dpp6의 용도
EP2780476B1 (en) Methods for diagnosis and/or prognosis of gynecological cancer
CN105722998A (zh) 预测乳腺癌复发
CN108277283A (zh) lncRNA组合在制备预测肾透明细胞癌预后及分子靶向药物治疗敏感性的产品中的应用
KR20140121524A (ko) 위암에 대한 예후 예측 모형의 제조방법
US20110009284A1 (en) Gene relating to estimation of postoperative prognosis for breast cancer
CN110004229A (zh) 多基因作为egfr单克隆抗体类药物耐药标志物的应用
EP3954784A1 (en) Composition for diagnosis or prognosis prediction of glioma, and method for providing information related thereto
KR102325356B1 (ko) 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용
US20230220483A1 (en) Biomarkers for predicting a patient's response to bcg therapy, methods and uses based thereon
CN111566229A (zh) 乳腺癌分子分型及远处转移风险基因群及诊断产品和应用
EP3394290B1 (en) Differential diagnosis in glioblastoma multiforme
US20240150849A1 (en) MicroRNAs AS BIOMAKERS FOR THE IN VITRO DIAGNOSIS OF GLIOMA
US20130237444A1 (en) Gbm molecular contexts associated with patient survival
KR102152893B1 (ko) 간세포암종 특이 mlh1 유전자에 대한 순환 종양 dna 변이 검출 용도

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right