KR102404750B1 - 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 - Google Patents

세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 Download PDF

Info

Publication number
KR102404750B1
KR102404750B1 KR1020210136287A KR20210136287A KR102404750B1 KR 102404750 B1 KR102404750 B1 KR 102404750B1 KR 1020210136287 A KR1020210136287 A KR 1020210136287A KR 20210136287 A KR20210136287 A KR 20210136287A KR 102404750 B1 KR102404750 B1 KR 102404750B1
Authority
KR
South Korea
Prior art keywords
nxph1
dab1
gene
methylation
composition
Prior art date
Application number
KR1020210136287A
Other languages
English (en)
Inventor
허혜진
문서윤
김윤경
이선미
문재우
김원섭
Original Assignee
주식회사 엔도믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엔도믹스 filed Critical 주식회사 엔도믹스
Priority to KR1020210136287A priority Critical patent/KR102404750B1/ko
Application granted granted Critical
Publication of KR102404750B1 publication Critical patent/KR102404750B1/ko
Priority to PCT/KR2022/012598 priority patent/WO2023063562A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Databases & Information Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Evolutionary Biology (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도에 관한 것이다. 종래의 분변기반 검사에 비해 검사 순응도가 높은 혈액을 이용함으로써 검사자의 편의성을 증대시키고자 하였다. 본 발명에 따르면, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 메틸화 마커 유전자가 발굴되었다. 따라서, 본 발명의 메틸화 마커 유전자는 대장암의 진단에 유용하게 사용될 수 있다.

Description

세포 유리 DNA를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도{METHYLATION MARKER GENES FOR COLORECTAL DIAGNOSIS USING CELL-FREE DNA AND USE THEREOF}
본 발명은 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도에 관한 것이다.
대장암은 위암에 이어 국내 암 발병률 2위를 차지하는 질환으로, 조기 발견 시 5년 생존율이 94.5%에 달할 정도로 예후가 좋은 암이다. 최근, 암 조기 진단을 위해, 침습적인 진단 및 검사 방법의 대안으로 액체 생체 검사를 이용한 분자진단법이 주목받고 있다.
DNA 메틸화(methylation)는 유전자 발현 조절에 중추적인 역할을 하는 후성유전적 변형으로서, 사이토신(cytosine)의 5번 탄소에 메틸기(-CH3)가 붙어 5-메틸사이토신 형태로 변형되는 것이다. DNA 메틸화는 주로 CpG 디뉴클레오티드의 사이토신 기에서 발생하며, CpG 섬(island)이라고 불리는 CpG 가 집중적으로 몰려있는 DNA 영역에서 많이 나타난다. 특히, DNA 메틸화는 대장암을 비롯한 각종 고형암의 발암 과정에서 중요한 역할을 하는 것으로 인식되고 있다. 암이 진행되는 과정 동안 게놈 전반적으로는 DNA 저메틸화가 나타나고, CpG 섬의 일부 영역에서 국소적인 과메틸화가 빈번하게 일어나는 것으로 알려져 있다. 또한, DNA 메틸화는 조직 특이적인 패턴을 보이는 것이 확인되었는데, 이러한 이유로 DNA 메틸화 패턴은 각종 암의 진단에 있어 임상적으로 의미있는 정보라는 사실이 일반적으로 받아들여 지고 있다. 예를 들어, 암세포에서는 암 억제 유전자(tumor suppressor gene)의 프로모터 영역의 CpG 부위가 비정상적으로 과메틸화(hypermethylation)되면 이 유전자의 발현이 억제되어 암을 일으킬 수 있다.
현재 상용화된 대장암 조기 진단 기술들은 주로 real-time PCR 기법을 이용하며 검체 처리가 용이한 장점이 있지만, 단일 유전자 마커(예를 들어, SEPTIN9 유전자 영역의 메틸화)에 기반하므로 민감도 및 특이도에 한계가 있다. 해외에서 상용화된 다중 마커 기반 조기 진단 방법(예를 들어, ExactScience 사의 Cologuard 서비스)은 여러 종류의 마커(분자 마커, 메틸화 마커 및 단백질 마커)를 보다 정교한 방법으로 조합하여 대장암 여부를 결정하지만, 검사 비용이 고가라는 단점이 있다. 또한, 이러한 방법은 분변 검체를 사용함으로써 검사자의 편의성 면에서 개선이 필요한 상황이다.
차세대 염기서열 분석(Next-Generation Sequencing, NGS)이라 불리는 기술은 긴 서열을 짧은 단편으로 잘라서 대규모로 병렬 서열분석을 행함으로써 뛰어난 처리량, 확장성 및 속도를 바탕으로 이전에는 불가능했던 수준의 다양한 연구를 가능하게 만들었다. NGS 기술은 현재 게놈 전체 프로파일링을 통해 단일 뉴클레오티드 혹은 단일 세포 수준에서의 메틸화 마커의 식별을 가능하게 한다. 이는 PCR 기반의 종래 검사 방법에 비해 높은 해상도, 정량화 성능 및 마커의 확장성(여러 마커를 유연하게 적용하는 것이 가능함)을 제공함으로써, 질환 관련 마커 발굴, 진단 예후 및 치료에 대한 반응 예측, 환자 맞춤형 치료의 새로운 타겟 발굴을 위한 후성유전학 프로파일링에 널리 이용되고 있다.
한국 등록특허공보 제10-2046668호
본 발명은 상술한 종래 기술의 문제점을 모두 해결하는 것을 그 목적으로 한다.
본 발명은 대장암 진단을 위한 메틸화 마커 유전자를 제공하는 것을 다른 목적으로 한다.
본 발명은 대장암 진단을 위한 정보를 제공하는 방법을 제공하는 것을 또 다른 목적으로 한다.
본 발명은 대장암 진단을 위한 조성물, 키트 또는 유전자 패널을 제공하는 것을 또 다른 목적으로 한다.
본 발명자들은 대장암 진단을 위한 혈액 기반 메틸화 마커 유전자를 확보하기 위해 연구한 결과, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 특정 유전자 또는 유전자 조합을 발굴함으로써, 본 발명을 완성하였다.
상기 목적을 달성하기 위하여, 본 발명의 일 측면은 NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 포함하는 대장암 진단을 위한 유전자 마커를 제공한다.
본 발명의 다른 측면은, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 포함하고, ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 추가로 포함하는 대장암 진단을 위한 유전자 마커를 제공한다.
본 발명의 또 다른 측면은, 하기 조합의 유전자 또는 이의 CpG 영역을 포함하는 대장암 진단을 위한 유전자 마커를 제공한다: i) HTR1A, NXPH1 및 DAB1; (ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1; (iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1; (iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1; (v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1; (vi) NXPH1 및 DAB1; 또는 (vii) NXPH1 및 SLC12A5.
본 발명의 또 다른 측면은, 개체의 생물학적 시료로부터 분리된 핵산에서, 상기 유전자 마커의 메틸화 상태를 측정하는 단계를 포함하는, 대장암 진단을 위한 정보를 제공하는 방법을 제공한다.
본 발명의 또 다른 측면은, 상기 유전자 마커를 특이적으로 증폭하는 제제를 포함하는, 생물학적 시료로부터 분리된 핵산을 이용한 대장암 진단을 위한 조성물을 제공한다.
본 발명의 또 다른 측면은, 상기 조성물을 포함하는 개체의 생물학적 시료로부터 분리된 핵산을 이용한 대장암 진단용 키트 또는 유전자 패널을 제공한다.
본 발명의 또 다른 측면은, 혈액 시료를 기반으로 한 상기 방법, 조성물, 키트 또는 유전자 패널을 제공한다.
본 발명에 따르면, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 새로운 메틸화 유전자가 발굴되었다. 상기 메틸화 유전자는 상기 유전자 마커를 사용하면 우수한 민감도, 특이도 및/또는 정확도로 대장암을 진단할 수 있다. 특히, 상기 메틸화 유전자는 혈액에 기반한 생물학적 시료를 이용하여 대장암 진단이 가능하다는 점에서 유용하다.
도 1은 본 발명의 일 구체예에 따른 대장암 식별 모델을 수립하기 위한 과정을 나타낸다.
도 2는 본 발명에서 발굴된 메틸화 마커 유전자의 DMR에서 대장암 환자군(26례) 및 정상 대조군(28례) 샘플 간의 메틸화 수준 차이를 컬러로 표시한 차트를 나타낸다.
도 3은 본 발명에서 발굴된 메틸화 마커 유전자 중 HTR1A, NXPH1 및 DAB1의 조합을 기반으로 환자군(26례) 및 정상 대조군(28례) 샘플에 대해 leave-one-out 테스트를 수행하여 얻은 민감도 수치를 암 기수별로 정리한 결과를 나타낸다.
이하, 본 발명을 보다 상세하게 설명한다.
본 발명의 일 측면은, 대장암 진단을 위한 메틸화 유전자 마커 NXPH1(Neurexophilin 1), ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177), ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), SLC32A1(Solute Carrier Family 32 Member 1), 또는 이들의 조합을 제공한다.
상기 유전자 NXPH1은 뉴렉소필린(neurexophilin) 패밀리의 구성원으로, 가변 N-말단 도메인, 고도로 보존된 N-글리코실화된 중심 도메인, 짧은 링커 영역, 및 시스테인-풍부 C-말단 도메인을 갖는 분비 단백질을 암호화한다. 이 단백질은 수상돌기와 축색돌기 사이의 부착을 촉진하는 단백질 그룹인 알파 뉴렉신(neurexin)과 매우 단단한 복합체를 형성한다.
상기 유전자 ZNF559-ZNF177은 전사 조절에 관여할 수 있으며, 크루펠(krueppel) C2H2형 징크 핑거 단백질 패밀리에 속한다.
상기 유전자 ANKMY1은 ZMYND13로도 알려져 있으며, 이와 관련된 질병에는 정맥 혈관종 및 수면병이 포함된다.
상기 유전자 AVPR1A에 의해 암호화된 단백질은 아르기닌 바소프레신에 대한 수용체로 작용한다. 이 수용체는 세포 수축과 증식, 혈소판 응집, 응고 인자의 방출 및 글리코겐 분해를 매개한다.
상기 유전자 CAPS2는 단백질 코딩 유전자로 관련된 Gene Ontology에는 칼슘 이온 결합이 포함된다.
상기 유전자 DAB1은 릴린(Reelin) 신호전달의 핵심 조절인자를 암호화한다. 릴린은 발달 중인 뇌의 뉴런, 특히 Cajal-Retzius 세포에서 분비되는 거대 당단백질이다. DAB1은 발달 중인 뇌에서 및 성인 신경발생 동안 세포 위치설정을 제어하는 신호전달 경로에서 릴린의 다운스트림에서 기능한다.
상기 유전자 HTR1A은 인간에서 세로토닌 1A 수용체를 암호화한다. HTR1A와 관련된 질병에는 주기적 발열(월경주기-의존성) 및 범불안 장애가 포함된다.
상기 유전자 PCDH8은 cadherin 슈퍼패밀리의 서브패밀리인 protocadherin 유전자 패밀리에 속한다. 이 유전자는 CNS-특이적으로 세포 부착에서 기능하는 것으로 생각되는 통합 막 단백질을 인코딩한다.
상기 유전자 PENK는 여러 단백질 생성을 위해 단백분해 처리되는 전전구단백질(preproprotein)을 인코딩한다. 이러한 생성물에는 펜타펩티드 오피오이드인 Met-enkephalin 및 Leu-enkephalin이 포함되며, 이들은 시냅스 소포에 저장된 후 시냅스로 방출되어 뮤 및 델타-오피오이드 수용체에 결합하여 통증 인식을 조절한다.
상기 유전자 SLC12A5에 의해 암호화된 단백질은 칼륨과 염화물의 화학적 농도 구배에 따라 순 유출 또는 유입 경로에서 기능할 수 있는 통합 막 K-Cl 공동수송체이다. 암호화된 단백질은 동종다량체로서 또는 다른 K-Cl 공동수송체와 함께 이종다량체로서 작용하여 뉴런에서 염화물 항상성을 유지할 수 있도록 한다.
상기 유전자 SLC32A1은 VGAT 또는 VIAAT로도 알려져 있으며, 인간에서 수포 억제성 아미노산 수송체(vesicular inhibitory amino acid transporter)를 암호화한다
상기 메틸화 유전자 마커는 개체로부터 분리된 생물학적 시료, 예컨대 액체 시료에 기반하여 우수한 민감도, 특이도 및/또는 정확도로 대장암 진단에 관한 정보를 제공할 수 있다. 상기 메틸화 유전자 마커는 혈액, 혈장, 혈청과 같은 액체 시료를 이용한 경우, 우수한 진단 정확도를 나타낸다는 점에서 비침습적 진단을 가능하게 한다.
본원에서 사용되는 바와 같이, "메틸화"라 함은 DNA를 구성하는 염기에 메틸기가 부착되는 것을 의미한다. 일 구현예에서, 메틸화 상태는 특정 유전자의 특정 CpG 영역의 사이토신에서 일어나는 메틸화 여부 또는 메틸화 정도를 의미할 수 있다. 메틸화가 일어난 경우 그로 인하여 전사인자의 결합이 방해를 받아 해당 유전자의 발현이 억제될 수 있다. 발현 억제는 메틸화 정도에 따라 상대적으로 일어날 수 있다. 이러한 이유로 DNA 메틸화는 유전자 발현 조절에 중추적인 역할을 하는 후성유전적 변형으로서, 사이토신의 5번 탄소에 메틸기(-CH3)가 붙어 5-메틸사이토신 형태로 변형된다. DNA 메틸화는 주로 CpG 디뉴클레오티드의 사이토신 기에서 발생하며, CpG 섬 또는 CpG 영역이라고 불리는 CpG가 집중적으로 몰려 있는 DNA 영역에서 많이 나타난다.
본원에서 사용되는 바와 같이, "CpG 영역"이라 함은 CpG 섬이라고 불리는 CpG 가 집중적으로 몰려있는 DNA 영역 또는 그의 일부를 지칭한다. 암이 진행되는 과정 동안 게놈 전반적으로는 DNA 저메틸화가 나타나고, CpG 섬의 일부 영역에서 국소적인 과메틸화가 빈번하게 일어나는 것으로 알려져 있다. 예를 들어, 암세포에서는 암 억제 유전자의 프로모터 영역의 CpG 부위가 비정상적으로 과메틸화되면 이 유전자의 발현이 억제되어 암을 일으킬 수 있다. CpG 부위의 메틸화는 암 발생의 초기에 일어나기 때문에 암의 조기 진단에 유용하다.
일 구현예에서, 상기 마커 유전자 NXPH1, ZNF559-ZNF177, ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5, 또는 SLC32A1의 CpG 영역은 상기 유전자의 DNA 상에 존재하는 CpG 영역을 의미한다. 예컨대, 상기 CpG 영역은 프로모터 영역 등 전사 조절 영역, 단백질 코딩 영역(open reading frame, ORF) 또는 터미네이터 영역 등에 존재할 수 있다.
일 구현예에서, 상기 유전자의 CpG 부위는 C와 G가 포스페이트로 연결된 서열이 200bp 이상 연속된 부분일 수 있고, 0.4kb에서 10kb 정도의 범위에서 임의의 크기를 가질 수 있다.
다른 구현예에서, 상기 유전자의 CpG 부위는 유전자의 전사 시작 부위(transcription start site, TSS)로부터 +/- 2000 염기(2kb) 사이에 위치할 수 있다.
본 발명의 일 실시예에서, 상기 유전자의 CpG 부위는 하기 표 1에 기재된 유전자의 CpG 부위 또는 그에 포함된 일부의 사이토신의 메틸화 상태일 수 있다. 하기 표 1에서 CpG 부위는 DMR(Differentially Methylated Region)이라고 표시한다.
유전자 명칭 염색체 번호 DMR 위치 (GRCh37) DMR 크기
시작
ANKMY1 chr2 241,458.915 241,459,750 835
AVPR1A chr12 63,543,442 63,544,839 1,397
CAPS2 chr12 75,784,889 75,785,496 407
DAB1 chr1 57,470,779 57,475,926 5,148
HTR1A chr5 63,256,482 63,257,699 1,217
NXPH1 chr7 8,473,845 8,483,010 9,166
PCDH8 chr13 53,421,876 53,422,991 1,115
PENK chr8 57,358,026 57,360,893 2,867
SLC12A5 chr20 44,685,680 44,686,309 629
SLC32A1 chr20 37,356,005 37,357,473 1,468
ZNF559-ZNF177 Chr19 9,473,590 9,474,099 509
본 발명에서 인간 게놈 염색체 부위의 염기서열은 The February 2009 Human reference sequence(GRCh37)에 따라 표현하였지만, 상기 인간 게놈 염색체 부위의 구체적 서열은 게놈 서열 연구 결과가 업데이트됨에 따라서 그 표현이 다소 변경될 수 있으며, 이러한 변경에 따라 본 발명의 상기 인간 게놈 염색체 부위의 표현이 상이해질 수 있다. 따라서, 본 발명의 The February 2009 Human reference sequence(GRCh37)에 따라 표현된 인간 게놈 염색체 부위는 본 발명의 출원일 이후 인간 표준 염기서열(human reference sequence)이 업데이트되어 상기 인간 게놈 염색체 부위의 표현이 지금과 다르게 변경된다고 하여도, 본 발명의 범위가 상기 변경된 인간 게놈 염색체 부위에 미치게 됨은 자명하다고 할 것이다. 이러한 변경 내용은 본 발명이 속하는 기술분야의 통상의 지식을 가진 자라면 누구라도 용이하게 알 수 있는 사항이다.
본 발명의 다른 측면은, 대장암 진단을 위한 정보를 제공하는 방법으로서, 개체의 생물학적 시료로부터 분리된 핵산에서, NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계를 포함하는 방법을 제공한다.
일 구현예에서, 상기 하나 이상의 유전자는 NXPH1을 포함할 수 있다.
다른 구현예에서, 상기 하나 이상의 유전자가 ZNF559-ZNF177을 포함할 수 있다.
또 다른 구현예에서, 상기 하나 이상의 유전자는 NXPH1 및 ZNF559-ZNF177을 포함할 수 있다.
또 다른 구현예에서, 상기 방법은, 상기 핵산에서, ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1 로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계를 추가로 포함할 수 있다. 이때, ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1으로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계는, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계와 동시에 수행되거나, 임의의 순서로 순차적으로 수행될 수 있다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는 하기 유전자 조합 또는 각 유전자의 CpG 영역의 메틸화 상태를 측정하는 것일 수 있다:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5.
또 다른 구현예에서, 상기 생물학적 시료는 혈액, 혈장 또는 혈청일 수 있지만 이에 제한되지 않는다.
또 다른 구현예에서, 상기 생물학적 시료로부터 분리된 핵산은 cfDNA일 수 있다. "cfDNA"는 세포 유리(cell free) DNA를 지칭한다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는, i) 상기 유전자 또는 이의 CpG 영역의 메틸화 상태를 검출하는 제제 및 ii) 상기 하나 이상의 유전자를 특이적으로 증폭하는 프라이머로 상기 DNA를 처리하는 단계를 포함할 수 있다. 상기 메틸화 상태를 측정하는 제제는 사이토신 염기를 변형시키는 화합물 또는 메틸화 민감성 제한 효소일 수 있다. 상기 사이토신 염기를 변형시키는 화합물은 비메틸화 사이토신 또는 메틸화 사이토신을 변형시키는 화합물일 수 있다. 구체적으로, 바이설파이트, 하이드로젠 설파이트, 다이설파이트, 이들의 염, 및 이들의 조합으로 이루어진 군에서 선택되는 어느 하나일 수 있다. 또한, 메틸화 사이토신을 변형시키는 TET 단백질일 수 있으나 이에 제한되지 않는다. 사이토신 염기를 변형시켜 CpG 영역의 메틸화 여부를 검출하는 방법은 당 업계에 널리 공지되어 있다.
또한, 상기 메틸화 민감성 제한효소는 CpG 영역의 메틸화를 특이적으로 검출할 수 있는 제한효소로서 제한효소의 인식부위로 CG를 함유하는 제한효소일 수 있다. 예를 들면, SmaI, SacII, EagI, HpaII, MspI, BssII, BstUI, NotI 등이 있으며 이에 제한되지 않는다. 상기 제한효소 인식부위의 C에서의 메틸화 또는 비메틸화에 따라 제한효소에 의한 절단 여부가 달라지고 이를 PCR 또는 서던블롯(Southern Blot) 분석을 통해 검출할 수 있게 된다. 상기 제한효소 이외의 다른 메틸화 민감성 제한효소는 당 업계에 잘 알려져 있다.
상기 프라이머는 상기 하나 이상의 유전자의 메틸화된 대립형질 서열에 특이적인 프라이머 및/또는 비메틸화된 대립형질 서열에 특이적인 프라이머를 포함할 수 있다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는 메틸화 특이적 중합효소 연쇄 반응(methylation-specific polymerase chain reaction), 실시간 메틸화 특이적 중합효소 연쇄 반응(real time methylation-specific polymerase chain reaction), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, 파이로시퀀싱, 또는 바이설파이트 시퀀싱에 의해 수행될 수 있지만 이에 제한되지 않는다. 상기에 나열된 PCR 또는 시퀀싱의 다른 예로는 MethyLight PCR, MehtyLight 디지털 PCR, EpiTYPER, CpG 섬 마이크로어레이 등이 포함된다. 또한, TET 단백질(ten-eleven translocation protein)을 이용한 검출법을 이용하여 측정할 수 있다. 상기 TET 단백질은 DNA에 작용하는 효소로 염기의 화학적 변화에 관여하며, 바이설파이트를 처리할 경우 메틸화된 C를 제외한 모든 C가 T 염기로 바뀌는 것과 달리 TET 단백질은 메틸화된 C만이 T로 바뀌어 효율적인 검출이 가능하다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는 대조군 시료의 해당 마커의 상응하는 메틸화 측정 결과로부터 생성된 대조 메틸화 프로파일과 비교하는 단계를 추가로 포함할 수 있다.
또 다른 구현예에서, 상기 대조 메틸화 프로파일은, 상기 획득된 하나 이상의 유전자의 메틸화 패턴을 기계학습시킴으로써 구축된 모델을 구성하며, 정상 대조군과 상이한 대장암 환자군 특이적 메틸화 패턴을 식별하기 위한 것일 수 있다.
또 다른 구현예에서, 상기 기계학습은 랜덤 포레스트, 로지스틱 회귀 분석, 서포트 벡터 머신, 의사결정나무, 연관성 규칙 마이닝, 신경망 네트워트 및 딥러닝으로 이루어진 군에서 선택되는 하나 이상의 알고리즘에 의해 수행될 수 있다.
또 다른 구현예에서, 상기 대조군 시료는 정상 개체의 시료일 수 있다. 또한, 상기 대조군 시료는 대장암 환자의 시료일 수 있으며, 상기 대장암 환자는 다양한 대장암 병기를 갖는 환자일 수 있다.
또 다른 구현예에서, 상기 대장암은 조기 대장암, 전이성 대장암, 또는 재발성 또는 난치성 대장암일 수 있다. 이때, 각각의 대장암은 다양한 병기를 가질 수 있다.
본 발명의 또 다른 측면은, 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화(hybridization)할 수 있는 제제를 포함하는 조성물을 제공한다.
일 구현예에서, 상기 조성물은 ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1 로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화할 수 있는 제제를 추가로 포함할 수 있다.
다른 구현예에서, 상기 조성물은 하기 조합의 유전자 각각 또는 이의 CpG 영역을 증폭하는 제제를 포함할 수 있다:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5.
또 다른 구현예에서, 상기 생물학적 시료는 혈액, 혈장 또는 혈청일 수 있지만 이에 제한되지 않는다.
또 다른 구현예에서, 상기 생물학적 시료로부터 분리된 핵산은 cfDNA일 수 있다.
또 다른 구현예에서, 상기 제제는 상기 유전자에 상보적으로 결합하는 프라이머, 프로브 또는 안티센스 뉴클레오티드를 포함할 수 있다.
본 명세서에서 사용되는 용어, "프라이머"란 시료 내의 유전자의 상보적인 주형(template)과 염기쌍(base pair)을 형성할 수 있고, 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 핵산 서열을 의미한다. 프라이머의 서열은 반드시 주형의 서열과 정확히 같을 필요는 없으며, 충분히 상보적이어서 주형과 혼성화될 수 있으면 된다. 프라이머는 적절한 완충용액 및 온도에서 중합반응을 위한 제제 및 상이한 4가지 뉴클레오사이드 3인산(nucleoside triphosphate)의 존재하에 DNA 합성을 개시할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당 업계에 공지된 것을 기초로 변형할 수 있다.
본 명세서에서 사용되는 용어, "프로브"란 시료 내의 검출하고자 하는 유전자와 특이적으로 결합할 수 있는 물질로서, 상기 결합을 통하여 특이적으로 시료 내의 유전자의 존재를 확인할 수 있는 물질을 의미한다. 프로브는 올리고뉴클레오티드 프로브, 단쇄 DNA 프로브, 이중쇄 DNA 프로브, RNA 프로브 등의 형태로 제작될 수 있다. 적당한 프로브의 선택 및 혼성화 조건은 당 업계에 공지된 것을 기초로 변형할 수 있다.
본 명세서에서 사용되는 용어, "안티센스 뉴클레오티드"는 타겟으로 하는 유전자에 대한 상보적인 서열을 가지고 있어 타겟 유전자와 이합체를 형성할 수 있는 핵산 기반의 분자를 의미하며, 타겟 유전자를 검출하는 데 사용될 수 있다. 상기 안티센스 뉴클레오티드는 검출 특이성을 증가시키기 위하여 적절한 길이를 선택할 수 있다.
본 발명에서, 프라이머, 프로브 또는 안티센스 뉴클레오티드는 메틸화 상태를 분석하는 대상이 되는 특정 CpG 영역의 서열에 따라 당 업계에 알려진 공지된 지식 및 기술을 사용하여 바람직하게 디자인될 수 있다.
또 다른 구현예에서, 상기 조성물은 상기 유전자의 CpG 영역의 메틸화 상태를 검출하기 위한 제제를 추가로 포함할 수 있다. 상기 메틸화 상태를 검출하기 위한 제제는 앞서 설명한 바를 참조한다. 예컨대, 상기 제제는 바이설파이트, 하이드로겐 설파이트, 다이설파이트, 이들의 염, 또는 이들의 조합일 수 있다. 그러나, 상기 제제는 이로 한정되지 않는다. 바이설파이트, 하이드로겐 설파이트, 다이설파이트와 같은 비메틸화 사이토신 염기를 변형시키는 화합물 및 이를 이용하여 비메틸화 사이토신 잔기를 변형시켜 유전자의 메틸화 여부를 검출하는 방법은 당 업계에 잘 알려져 있다(WO 01/26536; US 2003/0148326 A1).
또한, 타겟 유전자 부위의 염기서열의 변환된 정도로 확인하여 메틸화 여부 및 정도를 알아보기 위해 NGS가 이용될 수 있다. NGS에 의한 서열 분석은 Illumina사의 MiSeq, NextSeq500, NextSeq550, Hiseq 2500, Hiseq 4000, Hiseq X Ten, NovaSeq 6000, Thermo Fisher Scientific사의 Ion PGM, Ion Proton, Ion S5, BGI 사의 BGI-500, MGISEQ-2000, MGISEQ-T7 등을 이용하여 수행될 수 있지만 이에 제한되지 않는다.
본 발명의 또 다른 측면은, 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함하는 조성물을 제공한다.
일 구현예에서, 상기 조성물은 ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1 로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 제제를 추가로 포함할 수 있다.
다른 구현예에서, 상기 조성물은 하기 조합의 유전자 각각 또는 이의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함할 수 있다:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5.
상기 구현예에서, 생물학적 시료, 핵산, 유전자, CpG 영역, 메틸화 상태를 측정하는 제제는 상술한 바를 참조한다.
본 발명의 또 다른 측면은 상기 조성물을 포함하는, 개체의 생물학적 시료로부터 분리된 핵산을 이용하여 대장암 진단을 위한 키트를 제공한다.
구체적으로, 상기 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치로 구성된다. 예를 들어, 상기 키트는 RT-PCR(Reverse transcription polymerase chain reaction) 키트, DNA 칩 키트, ELISA(Enzyme-linked immunosorbent assay) 키트, 단백질 칩 키트 또는 래피드(rapid) 키트일 수 있다.
일 구현예에서, 상기 키트에 포함된 상기 조성물은 패널(panel) 형태일 수 있지만 이에 제한되지 않는다.
일 구현예에서, 상기 키트는 유전자 패널일 수 있다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예 1. 임상 연구 개요
2020년 3월부터 12월까지 강북삼성병원 예방건진센터에서 국민건강보험공단 일반검진과 암검진을 받은 수검자들 중 대장내시경 검사를 받은 수검자들의 기존 혈액 검사 이후 남은 검체를 제공받았다. 이때, 수검자들의 개인 정보는 일체 수집되지 않았다.
실제 대장내시경 결과를 참조하여 상기 검체를 대장암 환자군(대장암 또는 전암성 선종으로 진단됨)과 정상 대조군으로 분류하였다. 대장암 환자군의 경우, 대장암은 소화기 전문의에 의해 TNM 병기 체계 및 AJCC(American Joint Committee on Cancer, 미국암연합회) 병기 분류법에 따라 0기부터 4기까지 분류되었고, 정상 대조군은 대장내시경 수검자들 중 검사결과 정상으로 판정된 군이었다.
이렇게 분류된 검체를 이용하여 도 1에 제시된 과정을 수행하였다. 그 결과, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 11종의 메틸화 마커 유전자 ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, NXPH1, PCDH8, PENK, SLC12A5, SLC32A1, 및 ZNF559-ZNF177을 발굴하였다. 또한, 이렇게 발굴된 11종의 메틸화 마커 유전자와 관련된 정보에 기반하여 기계학습 알고리즘에 의해 대장암 식별 모델을 수립하고, 이러한 모델을 검증하였다.
이하의 실시예에서는 이러한 과정을 상세히 설명한다.
실시예 2. 무세포 DNA 추출
차세대 염기서열 분석을 위한 준비 과정으로서, 각 검체를 3000 rpm에서 15분간 원심분리하여 혈장을 분리하였다. 분리된 혈장으로부터 무세포 DNA의 추출은 MagMAXTM Cell-Free DNA Isolation Kit(Thermo fisher scientific)를 이용하여 수행하였다. 추출 방법은 제조사의 매뉴얼에 따라 진행하였다. 추출된 무세포 DNA는 형광 강도 측정기(Fluorometer)(Qubit Flex, Invitrogen)를 이용하여 정량하였으며, DNA 상태는 자동화된 전기영동 장비(4150 Tapestation system, Agilent)를 이용하여 DNA degradation 여부 및 크기를 확인하였다.
실시예 3. 라이브러리 제작 및 정도관리(QC)
실시예 2에서 추출된 무세포 DNA에 EZ DNA methylation-LightningTM kit(Zymo Research, USA)를 이용하여 바이설파이트를 처리하였다.
무세포 DNA에 바이설파이트를 처리하면, 비메틸화된 사이토신은 우라실로 변형되고, 메틸화된 사이토신은 변화없이 남게 된다. 상기 바이설파이트가 처리된 DNA를 멸균 증류수 20㎕로 용출시켜 차세대 염기서열 분석을 위한 라이브러리를 제작하였다.
라이브러리 제작용 준비 제제로서 Accel-NGS® Methyl-Seq DNA Library Kit(Swift Biosciences, USA)을 사용하였다. 이 과정은 메틸화 어댑터 라이게이션, 라이브러리의 인덱싱, AMPure XP 비드를 이용한 라이게이션된 DNA의 순수 분리 과정을 포함한다.
바이설파이트-라이브러리는 제작된 패널을 사용하는 단일 혼합 반응으로 설계하였고, SureSelectXT Human Methyl Seq Kit(Agilent, USA)를 이용하여 라이브러리를 완성하였다. 이 과정은 라이브러리 하이브리드화, 스트렙트아비딘 비드를 이용한 하이브리드 캡쳐, 라이브러리 증폭, AMPure XP 비드를 이용한 순수 분리 과정을 포함한다.
제작된 라이브러리가 염기서열 분석에 적합한지 확인하기 위하여, Agilent Bioanalyzer 2200(Agilent, USA) 기기 및 High Sensitivity chip을 이용하여 라이브러리의 길이와 양을 측정하였고, 제조사가 제시하는 정도 관리(QC) 조건에 만족하는 라이브러리를 서열분석에 사용하였다.
실시예 4. 차세대 염기서열 분석 수행
실시예 3에서 제작된 라이브러리에 대해 차세대 염기서열 분석 장비(NovaSeq 6000, Illumina)를 이용하여 바이설파이트 염기서열 분석을 수행하였다. 서열분석 장비로 부터 생산된 염기량, 퀄리티 스코어(Q30), 온-타겟(on-target) 비율, 타겟 영역별 분석에 필요한 평균 리드 갯수, 고유한 분자 식별자(Unique Molecular Identifier, UMI) 중복 비율, 매핑된 데이터량 등을 확인하여 생성된 데이터의 퀄리티를 평가하였다. 이후, 무세포 DNA의 8,400만개 염기 가운데 총 370만개 CpG 부위를 타겟하여 그 메틸화 수준을 분석하였다.
실시예 5. DNA 메틸화 분석 및 메틸화 마커 유전자 발굴
실시예 4에서 캡쳐된 타겟 영역인 총 370만개 CpG 좌위에 대하여 DNA 메틸화 정도를 측정하였다.
DNA 메틸화 정도는 실시예 4에서 수행된 차세대 염기서열 분석 결과에 기반하여 측정하였다. 각각의 CpG 좌위에서 메틸화된 염기서열 단편(리드(read))과 메틸화되지 않은 리드를 각각 카운트하고 그 값을 아래의 식에 대입하여 계산하였다:
Figure 112021117499288-pat00001
상기 식에서,
Figure 112021117499288-pat00002
는 메틸화 정도를 나타내고,
Figure 112021117499288-pat00003
는 메틸화된 리드의 수를 나타내고,
Figure 112021117499288-pat00004
는 메틸화되지 않은 리드의 수를 나타낸다.
계산된 메틸화 정도는 0 내지 1 범위의 값으로 표시되며, 값 0은 해당 CpG 좌위가 완전히 메틸화되지 않은 것을 의미하며, 1은 해당 CpG 좌위가 완전히 메틸화된 것을 의미한다.
대장암 환자군과 정상 대조군에서 차별적으로 메틸화되어 있는 유전자 영역(Differentially methylated region, DMR)을 발굴하기 위하여 우선 개개의 CpG 좌위에 대해 t-test, wald test, z-score 방법을 사용하여 유의성을 평가하였다. 이후, 개개의 CpG 좌위에서 유의하게 나타난(p 값<0.05) 영역들에 대해 다양한 인자의 여러 값에 대해 평가한 후에 최적의 조합을 선정하였다. 최적화 테스트에 포함된 상기 다양한 인자의 예로는 최소 CpG 수, DMR 구간의 최소 길이, p 값 한계치, 윈도우(window) 크기 등이 있다.
평가는 유전자와 DMR 단위로 진행하였고, 여러 기계학습 알고리즘을 사용하여 leave-one-out 테스트로 진행하였다. 이때, 기계학습 알고리즘으로는 서포트 벡터 머신(Support Vector Machine), 랜덤 포레스트(Random Forest), 신경망 네트워크(Neural Network), 딥러닝(Deep Learning)을 사용하였다.
그 결과, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 11종의 유전자 및 각 유전자에 포함된 DMR을 선별하였다(표 2). 표 2에는 또한 각 유전자의 메틸화 상태가 표시되어 있다.
유전자 명칭 염색체 번호 DMR 위치 (GRCh37) DMR 크기 메틸화 상태
+:과메틸화
-:저메틸화
시작
ANKMY1 chr2 241,458.915 241,459,750 835 +
AVPR1A chr12 63,543,442 63,544,839 1,397 +
CAPS2 chr12 75,784,889 75,785,496 407 -
DAB1 chr1 57,470,779 57,475,926 5,148 -
HTR1A chr5 63,256,482 63,257,699 1,217 +
NXPH1 chr7 8,473,845 8,483,010 9,166 +
PCDH8 chr13 53,421,876 53,422,991 1,115 +
PENK chr8 57,358,026 57,360,893 2,867 +
SLC12A5 chr20 44,685,680 44,686,309 629 +
SLC32A1 chr20 37,356,005 37,357,473 1,468 +
ZNF559-ZNF177 Chr19 9,473,590 9,474,099 509 +
상기 11종의 유전자의 DMR에서 대장암 환자군 26례와 정상 대조군 28례의 샘플을 이용한 메틸화 수준을 타겟 영역 기반 바이설파이트 시퀀싱을 통해 분석하였고, 그 결과를 도 2에 도시하였다.
실시예 6. 기계학습 모델 수립 및 평가
실시예 5에서 발굴된 마커 유전자 내에 존재하는 DMR 영역에서의 메틸화 수치를 기반으로 기계학습 알고리즘을 이용하여 대장암 식별 모델을 수립하였다.
일반적인 모델링 프로그램은 초기 입력값에 어떤 조건이 만족되면 최종 결과를 내보내도록 개발자가 미리 프로그래밍하는 명시적 프로그래밍에 의해 만들어진다. 반면, 기계학습에서는 초기 입력값이 들어왔을 때 결과가 특정 값이 되는 조건을 찾도록 컴퓨터를 학습시킨다. 이러한 학습 과정은 입력값에 대해 결과값이 제대로 도출되도록 최적의 매개변수를 찾는 과정이며, 학습의 결과물은 최적의 매개변수 혹은 가중치 값이다.
딥러닝 혹은 신경망 네트워크와 같은 기계학습 알고리즘을 이용하여 수립된 모델은 다수의 정상 대조군과 대장암 환자군 샘플에서 얻은 마커 유전자 영역의 메틸화 패턴을 학습시킴으로써 정상 대조군과 상이한 대장암 환자군 특이적 메틸화 패턴을 식별할 수 있도록 만들어진 수식 모델이라고 할 수 있다. 이렇게 만들어진 모델을 활용하면 새로운 패턴의 데이터에 대해 추론하고 예측할 수 있게 된다. 따라서, 상기 수립된 모델은 주어진 테스트 샘플이 대장암 환자군 샘플에서 나타나는 메틸화 패턴을 보이는지 여부를 평가하여, 그러한 테스트 샘플이 유래된 대상체가 정상인지 대장암이 있는지에 대한 판정 결과를 도출해 낸다.
이렇게 11종의 마커 유전자를 기반으로 수립된 모델을 평가하기 위한 일례로, 딥러닝 알고리즘을 이용하여 leave-one-out 테스트를 실시하였다. 딥러닝 알고리즘은 여러 층의 인공신경망(Artificial Neural Network)을 이용하여 학습을 수행하는 기계학습의 한 종류이다. 기존 기계학습 알고리즘의 경우 데이터 분석자가 학습 데이터에서 어떤 특징을 추출해야 하는지 직접 관여해야 하는 반면, 딥러닝의 경우 컴퓨터가 자동으로 학습 데이터에서 특징을 추출하여 자가 학습을 한다. 이러한 딥러닝 테스트 결과를 표 3에 나타낸다.
표 3에는, 본 발명에서 발굴된 11종 마커 유전자 중 3종 내지 7종을 기반으로 수립된 모델에 대해 계산된 민감도, 특이도 및 정확도 수치와 함께, 이들 유전자를 단일 마커로 적용시 계산된 해당 수치가 함께 제시되어 있다.
유전자 타겟 조합/단일 마커 민감도 (%) 특이도 (%) 정확도 (%)
HTR1A, NXPH1, DAB1 92.31 92.86 92.59
AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK, DAB1 92.31 92.86 92.59
AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK, DAB1 92.31 92.86 92.59
ANKMY1, ZNF559-ZNF177, SLC32A1, DAB1 88.46 92.86 90.74
HTR1A, NXPH1, ZNF559-ZNF177, DAB1 92.31 89.29 90.74
NXPH1, DAB1 80.77 85.71 83.33
NXPH1, SLC12A5 76.92 89.29 83.33
ANKMY1 57.69 64.29 61.11
AVPR1A 61.54 71.43 66.67
CAPS2 73.08 75.00 74.07
DAB1 19.23 78.57 50.00
HTR1A 88.46 85.71 87.04
NXPH1 76.92 85.71 81.48
PCDH8 73.08 71.43 72.22
PENK 76.92 82.14 79.63
SLC12A5 69.23 75.00 72.22
SLC32A1 69.23 82.14 75.93
ZNF559-ZNF177 76.92 78.57 77.78
본 발명에 포함된 11종의 유전자를 기반으로 수립된 모델을 평가하기 위한 또 다른 예로, 표 4에는 본 발명에서 발굴된 11종의 마커 유전자 중 3종을 기반으로 수립된 모델에 대해 계산된 민감도 및 특이도 수치와 함께, 기존에 보고된 단일 마커 및 마커 조합에 대해 계산된 해당 수치가 함께 제시되어 있다.
유전자 타겟 민감도(%) 특이도(%) 참고문헌
HTR1A, NXPH1, DAB1 92.31 92.86 일 구현예
ALX4 83.30 70.00 [1]
ALX4 23.00 100.00 [2]
APC 57.00 86.00 [3]
APC, HLTF, MLH1 57.00 90.00 [4]
APC, MGMT, RASSF2, WIF1 86.50 92.10 [5]
C9orf50, KCNQ5, CLIP4 85.00 99.00 [6]
CDKN2A 70.00 100.00 [7]
HLTF 32.70 92.70 [4]
IKZF1,BCAT1 66.00 94.00 [8]
MLH1 42.90 97.60 [4]
NEUROG1 61.00 91.00 [9]
NGFR 51.00 84.00 [10]
RUNX3 60.00 82.50 [11]
RUNX3, SFRP1, CEA 89.40 84.70 [11]
SDC2 71.20 95.60 [12]
SEPTIN9 73.00 95.60 [12]
SEPTIN9, ALX4 71.00 95.00 [13]
SEPTIN9, SDC2 86.50 92.10 [14]
SFRP1 77.70 70.00 [11]
TMEFF2 65.00 69.00 [10]
VIM 59.00 93.00 [15]
[1] https://pubmed.ncbi.nlm.nih.gov/17101318/
[2] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4099003/pdf/pone.0099233.pdf
[3] https://pubmed.ncbi.nlm.nih.gov/22990173/
[4] https://pubmed.ncbi.nlm.nih.gov/16181380/
[5] https://pubmed.ncbi.nlm.nih.gov/19773381/
[6] https://doi.org/10.1186/s13148-019-0757-3
[7] https://clincancerres.aacrjournals.org/content/8/1/188.long
[4] https://pubmed.ncbi.nlm.nih.gov/16181380/
[8] https://bmccancer.biomedcentral.com/articles/10.1186/s12885-015-1674-2
[9] https://pubmed.ncbi.nlm.nih.gov/21326223/
[10] https://pubmed.ncbi.nlm.nih.gov/18089654/
[11] https://pubmed.ncbi.nlm.nih.gov/31524773/
[12] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2582436/
[13] https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0009061
[14] https://downloads.hindawi.com/journals/dm/2019/5232780.pdf
[15] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2847606/
또한, 상기 메틸화 유전자 마커 HTR1A, NXPH1 및 DAB1의 조합 모델에 대해 대장암 환자군 26례와 정상 대조군 28례의 샘플을 이용하여 leave-one-out 테스트를 수행하여 얻은 민감도 수치를 대장암 기수별로 정리한 결과를 도 3에 도시하였다. 도 3으로부터 알 수 있는 바와 같이, 상기 모델은 0기의 경우에는 67%, 1기의 경우에는 88%, 그리고 2기 내지 4기의 경우에는 100%의 민감도를 나타내었다.

Claims (29)

  1. 대장암 진단을 위한 정보를 제공하는 방법으로서,
    개체의 생물학적 시료로부터 분리된 핵산에서, NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 단계를 포함하는
    방법.
  2. 제1항에 있어서,
    상기 하나 이상의 유전자가 NXPH1을 포함하는
    방법.
  3. 제1항에 있어서,
    상기 하나 이상의 유전자가 ZNF559-ZNF177을 포함하는
    방법.
  4. 제1항에 있어서,
    상기 핵산에서, ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 단계를 추가로 포함하는
    방법.
  5. 제1항에 있어서,
    상기 메틸화 상태를 측정하는 단계는 하기 (i), (ii), (iii), (iv), (v), (vi) 또는 (vii)의 유전자의 CpG 영역의 메틸화 상태를 측정하는 것을 포함하는
    방법:
    (i) HTR1A, NXPH1 및 DAB1;
    (ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
    (iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
    (iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
    (v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
    (vi) NXPH1 및 DAB1; 또는
    (vii) NXPH1 및 SLC12A5.
  6. 제4항에 있어서,
    상기 유전자의 CpG 영역은 다음의 특징을 갖는
    방법:
    Figure 112021117499288-pat00005
  7. 제1항에 있어서,
    상기 생물학적 시료는 혈액, 혈장 또는 혈청인
    방법.
  8. 제7항에 있어서,
    상기 생물학적 시료로부터 분리된 핵산은 cfDNA인
    방법.
  9. 제1항에 있어서,
    상기 메틸화 상태를 측정하는 단계는, i) 상기 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 검출하는 제제 및 ii) 상기 하나 이상의 유전자를 특이적으로 증폭하는 프라이머로 상기 유전자를 처리하는 단계를 포함하는
    방법.
  10. 제1항에 있어서,
    상기 메틸화 상태를 측정하는 단계는 메틸화 특이적 중합효소 연쇄 반응(methylation-specific polymerase chain reaction), 실시간 메틸화 특이적 중합효소 연쇄 반응(real time methylation-specific polymerase chain reaction), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, 파이로시퀀싱, 또는 바이설파이트 시퀀싱에 의해 수행되는
    방법.
  11. 제1항에 있어서,
    상기 메틸화 상태를 측정하는 단계는 대조군 시료의 해당 유전자의 상응하는 메틸화 측정 결과로부터 생성된 대조 메틸화 프로파일과 비교하는 단계를 추가로 포함하는
    방법.
  12. 제11항에 있어서,
    상기 대조 메틸화 프로파일은, 상기 획득된 하나 이상의 유전자의 메틸화 패턴을 기계학습시킴으로써 구축된 모델을 구성하며, 정상 대조군과 상이한 대장암 환자군 특이적 메틸화 패턴을 식별하기 위한 것인
    방법.
  13. 제12항에 있어서,
    상기 기계학습은 랜덤 포레스트, 로지스틱 회귀 분석, 서포트 벡터 머신, 의사결정나무, 연관성 규칙 마이닝, 신경망 네트워트 및 딥러닝으로 이루어진 군에서 선택되는 하나 이상의 알고리즘에 의해 수행되는
    방법.
  14. 제11항에 있어서,
    상기 대조군 시료는 정상 개체의 시료인
    방법.
  15. 제1항에 있어서,
    상기 대장암은 조기 대장암, 전이성 대장암, 또는 재발성 또는 난치성 대장암인
    방법.
  16. 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서,
    NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화할 수 있는 제제를 포함하는
    조성물.
  17. 제16항에 있어서,
    상기 조성물은 ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화할 수 있는 제제를 추가로 포함하는
    조성물.
  18. 제16항에 있어서,
    상기 조성물은 하기 (i), (ii), (iii), (iv), (v), (vi) 또는 (vii)의 유전자의 CpG 영역을 증폭하거나 이와 혼성화할 수 있는 제제를 포함하는
    조성물:
    (i) HTR1A, NXPH1 및 DAB1;
    (ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
    (iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
    (iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
    (v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
    (vi) NXPH1 및 DAB1; 또는
    (vii) NXPH1 및 SLC12A5.
  19. 제17항에 있어서,
    상기 유전자의 CpG 영역은 다음의 특징을 갖는
    조성물:
    Figure 112021117499288-pat00006
  20. 제16항에 있어서,
    상기 생물학적 시료는 혈액, 혈장 또는 혈청인
    조성물.
  21. 제20항에 있어서,
    상기 생물학적 시료로부터 분리된 핵산은 cfDNA인
    조성물.
  22. 제16항에 있어서,
    상기 제제는 상기 유전자에 상보적으로 결합하는 프라이머, 프로브 또는 안티센스 뉴클레오티드를 포함하는
    조성물.
  23. 제16항에 있어서,
    상기 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 검출하기 위한 제제를 추가로 포함하는
    조성물.
  24. 제23항에 있어서,
    상기 제제는 바이설파이트, 하이드로겐 설파이트, 다이설파이트, 이들의 염, 또는 이들의 조합인
    조성물.
  25. 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서,
    NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함하는
    조성물.
  26. 제25항에 있어서,
    상기 조성물은 ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 제제를 추가로 포함하는
    조성물.
  27. 제25항에 있어서,
    상기 조성물은 하기 (i), (ii), (iii), (iv), (v), (vi) 또는 (vii)의 유전자의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함하는
    조성물:
    (i) HTR1A, NXPH1 및 DAB1;
    (ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
    (iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
    (iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
    (v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
    (vi) NXPH1 및 DAB1; 또는
    (vii) NXPH1 및 SLC12A5.
  28. 제16항 내지 제27항 중 어느 한 항에 따른 조성물을 포함하는 키트로서,
    개체의 생물학적 시료로부터 분리된 핵산을 이용하는 대장암 진단을 위한
    키트.
  29. 삭제
KR1020210136287A 2021-10-14 2021-10-14 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 KR102404750B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210136287A KR102404750B1 (ko) 2021-10-14 2021-10-14 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도
PCT/KR2022/012598 WO2023063562A1 (ko) 2021-10-14 2022-08-23 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210136287A KR102404750B1 (ko) 2021-10-14 2021-10-14 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도

Publications (1)

Publication Number Publication Date
KR102404750B1 true KR102404750B1 (ko) 2022-06-07

Family

ID=81986975

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210136287A KR102404750B1 (ko) 2021-10-14 2021-10-14 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도

Country Status (2)

Country Link
KR (1) KR102404750B1 (ko)
WO (1) WO2023063562A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023063562A1 (ko) * 2021-10-14 2023-04-20 주식회사 엔도믹스 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2233590A1 (en) * 2009-01-28 2010-09-29 AIT Austrian Institute of Technology GmbH Methylation assay
KR102046668B1 (ko) 2011-07-08 2019-11-19 에피제노믹스 아게 암 대상자의 예후를 결정하기 위한 방법 및 핵산

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2967165B1 (fr) * 2010-11-04 2014-10-10 Assist Publ Hopitaux De Paris Methode de depistage du cancer colorectal
KR101478826B1 (ko) * 2011-10-28 2015-01-08 전남대학교산학협력단 신규한 대장암 진단용 마커 및 이를 이용한 대장암 진단 키트
KR102404750B1 (ko) * 2021-10-14 2022-06-07 주식회사 엔도믹스 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2233590A1 (en) * 2009-01-28 2010-09-29 AIT Austrian Institute of Technology GmbH Methylation assay
KR102046668B1 (ko) 2011-07-08 2019-11-19 에피제노믹스 아게 암 대상자의 예후를 결정하기 위한 방법 및 핵산

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023063562A1 (ko) * 2021-10-14 2023-04-20 주식회사 엔도믹스 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도

Also Published As

Publication number Publication date
WO2023063562A1 (ko) 2023-04-20

Similar Documents

Publication Publication Date Title
JP7035156B2 (ja) 結腸直腸がんのエピジェネティックマーカー及び該マーカーを使用する診断法
US10344334B2 (en) Method of diagnosing neoplasms
KR102587176B1 (ko) 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
JP6883179B2 (ja) 細胞増殖性異常検出用または疾患程度等級付け用の遺伝子組成物およびその用途
CN107847515B (zh) 实体瘤甲基化标志物及其用途
EP2885427B1 (en) Colorectal cancer methylation marker
CN104745681B (zh) 多元基因组合物及其用途
CN112159844B (zh) 结直肠癌dna甲基化的检测方法及试剂
KR102549013B1 (ko) 췌장암 진단을 위한 메틸화 마커 유전자 및 이의 용도
MX2014013684A (es) Papel de marcador de gen de diagnostico para cancer colorrectal.
KR102404750B1 (ko) 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도
WO2012030983A2 (en) Variability single nucleotide polymorphisms linking stochastic epigenetic variation and common disease
AU2021291586B2 (en) Multimodal analysis of circulating tumor nucleic acid molecules
KR102281644B1 (ko) 지연성 허혈 진단을 위한 insr 유전자 과메틸화 마커
KR102281657B1 (ko) 지연성 허혈 진단을 위한 cdhr5 유전자 과메틸화 마커
KR102158726B1 (ko) Itpr3 유전자 업스트림의 유전자간 영역을 포함하는 지연성 허혈 진단용 dna 메틸화 마커 조성물
KR20230037111A (ko) 대사증후군 특이적 후성유전 메틸화 마커 및 이의 용도
AU2024203201A1 (en) Multimodal analysis of circulating tumor nucleic acid molecules
US20110281270A1 (en) Efficient detection of double mutants of the cebpa gene in acute myeloid leukemia
CN117004720A (zh) 用于检测甲状腺癌的组合物及其用途
CN116798606A (zh) 用于检测甲状腺癌的系统
CN114008219A (zh) 检测sdc2基因甲基化的方法
Kwan Epigenetic Study of Plasma Circulating DNA in Prostate Cancer

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant