KR102404750B1 - 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 - Google Patents
세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 Download PDFInfo
- Publication number
- KR102404750B1 KR102404750B1 KR1020210136287A KR20210136287A KR102404750B1 KR 102404750 B1 KR102404750 B1 KR 102404750B1 KR 1020210136287 A KR1020210136287 A KR 1020210136287A KR 20210136287 A KR20210136287 A KR 20210136287A KR 102404750 B1 KR102404750 B1 KR 102404750B1
- Authority
- KR
- South Korea
- Prior art keywords
- nxph1
- dab1
- gene
- methylation
- composition
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Databases & Information Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Hospice & Palliative Care (AREA)
- Evolutionary Biology (AREA)
- Oncology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도에 관한 것이다. 종래의 분변기반 검사에 비해 검사 순응도가 높은 혈액을 이용함으로써 검사자의 편의성을 증대시키고자 하였다. 본 발명에 따르면, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 메틸화 마커 유전자가 발굴되었다. 따라서, 본 발명의 메틸화 마커 유전자는 대장암의 진단에 유용하게 사용될 수 있다.
Description
본 발명은 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도에 관한 것이다.
대장암은 위암에 이어 국내 암 발병률 2위를 차지하는 질환으로, 조기 발견 시 5년 생존율이 94.5%에 달할 정도로 예후가 좋은 암이다. 최근, 암 조기 진단을 위해, 침습적인 진단 및 검사 방법의 대안으로 액체 생체 검사를 이용한 분자진단법이 주목받고 있다.
DNA 메틸화(methylation)는 유전자 발현 조절에 중추적인 역할을 하는 후성유전적 변형으로서, 사이토신(cytosine)의 5번 탄소에 메틸기(-CH3)가 붙어 5-메틸사이토신 형태로 변형되는 것이다. DNA 메틸화는 주로 CpG 디뉴클레오티드의 사이토신 기에서 발생하며, CpG 섬(island)이라고 불리는 CpG 가 집중적으로 몰려있는 DNA 영역에서 많이 나타난다. 특히, DNA 메틸화는 대장암을 비롯한 각종 고형암의 발암 과정에서 중요한 역할을 하는 것으로 인식되고 있다. 암이 진행되는 과정 동안 게놈 전반적으로는 DNA 저메틸화가 나타나고, CpG 섬의 일부 영역에서 국소적인 과메틸화가 빈번하게 일어나는 것으로 알려져 있다. 또한, DNA 메틸화는 조직 특이적인 패턴을 보이는 것이 확인되었는데, 이러한 이유로 DNA 메틸화 패턴은 각종 암의 진단에 있어 임상적으로 의미있는 정보라는 사실이 일반적으로 받아들여 지고 있다. 예를 들어, 암세포에서는 암 억제 유전자(tumor suppressor gene)의 프로모터 영역의 CpG 부위가 비정상적으로 과메틸화(hypermethylation)되면 이 유전자의 발현이 억제되어 암을 일으킬 수 있다.
현재 상용화된 대장암 조기 진단 기술들은 주로 real-time PCR 기법을 이용하며 검체 처리가 용이한 장점이 있지만, 단일 유전자 마커(예를 들어, SEPTIN9 유전자 영역의 메틸화)에 기반하므로 민감도 및 특이도에 한계가 있다. 해외에서 상용화된 다중 마커 기반 조기 진단 방법(예를 들어, ExactScience 사의 Cologuard 서비스)은 여러 종류의 마커(분자 마커, 메틸화 마커 및 단백질 마커)를 보다 정교한 방법으로 조합하여 대장암 여부를 결정하지만, 검사 비용이 고가라는 단점이 있다. 또한, 이러한 방법은 분변 검체를 사용함으로써 검사자의 편의성 면에서 개선이 필요한 상황이다.
차세대 염기서열 분석(Next-Generation Sequencing, NGS)이라 불리는 기술은 긴 서열을 짧은 단편으로 잘라서 대규모로 병렬 서열분석을 행함으로써 뛰어난 처리량, 확장성 및 속도를 바탕으로 이전에는 불가능했던 수준의 다양한 연구를 가능하게 만들었다. NGS 기술은 현재 게놈 전체 프로파일링을 통해 단일 뉴클레오티드 혹은 단일 세포 수준에서의 메틸화 마커의 식별을 가능하게 한다. 이는 PCR 기반의 종래 검사 방법에 비해 높은 해상도, 정량화 성능 및 마커의 확장성(여러 마커를 유연하게 적용하는 것이 가능함)을 제공함으로써, 질환 관련 마커 발굴, 진단 예후 및 치료에 대한 반응 예측, 환자 맞춤형 치료의 새로운 타겟 발굴을 위한 후성유전학 프로파일링에 널리 이용되고 있다.
본 발명은 상술한 종래 기술의 문제점을 모두 해결하는 것을 그 목적으로 한다.
본 발명은 대장암 진단을 위한 메틸화 마커 유전자를 제공하는 것을 다른 목적으로 한다.
본 발명은 대장암 진단을 위한 정보를 제공하는 방법을 제공하는 것을 또 다른 목적으로 한다.
본 발명은 대장암 진단을 위한 조성물, 키트 또는 유전자 패널을 제공하는 것을 또 다른 목적으로 한다.
본 발명자들은 대장암 진단을 위한 혈액 기반 메틸화 마커 유전자를 확보하기 위해 연구한 결과, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 특정 유전자 또는 유전자 조합을 발굴함으로써, 본 발명을 완성하였다.
상기 목적을 달성하기 위하여, 본 발명의 일 측면은 NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 포함하는 대장암 진단을 위한 유전자 마커를 제공한다.
본 발명의 다른 측면은, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 포함하고, ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 추가로 포함하는 대장암 진단을 위한 유전자 마커를 제공한다.
본 발명의 또 다른 측면은, 하기 조합의 유전자 또는 이의 CpG 영역을 포함하는 대장암 진단을 위한 유전자 마커를 제공한다: i) HTR1A, NXPH1 및 DAB1; (ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1; (iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1; (iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1; (v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1; (vi) NXPH1 및 DAB1; 또는 (vii) NXPH1 및 SLC12A5.
본 발명의 또 다른 측면은, 개체의 생물학적 시료로부터 분리된 핵산에서, 상기 유전자 마커의 메틸화 상태를 측정하는 단계를 포함하는, 대장암 진단을 위한 정보를 제공하는 방법을 제공한다.
본 발명의 또 다른 측면은, 상기 유전자 마커를 특이적으로 증폭하는 제제를 포함하는, 생물학적 시료로부터 분리된 핵산을 이용한 대장암 진단을 위한 조성물을 제공한다.
본 발명의 또 다른 측면은, 상기 조성물을 포함하는 개체의 생물학적 시료로부터 분리된 핵산을 이용한 대장암 진단용 키트 또는 유전자 패널을 제공한다.
본 발명의 또 다른 측면은, 혈액 시료를 기반으로 한 상기 방법, 조성물, 키트 또는 유전자 패널을 제공한다.
본 발명에 따르면, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 새로운 메틸화 유전자가 발굴되었다. 상기 메틸화 유전자는 상기 유전자 마커를 사용하면 우수한 민감도, 특이도 및/또는 정확도로 대장암을 진단할 수 있다. 특히, 상기 메틸화 유전자는 혈액에 기반한 생물학적 시료를 이용하여 대장암 진단이 가능하다는 점에서 유용하다.
도 1은 본 발명의 일 구체예에 따른 대장암 식별 모델을 수립하기 위한 과정을 나타낸다.
도 2는 본 발명에서 발굴된 메틸화 마커 유전자의 DMR에서 대장암 환자군(26례) 및 정상 대조군(28례) 샘플 간의 메틸화 수준 차이를 컬러로 표시한 차트를 나타낸다.
도 3은 본 발명에서 발굴된 메틸화 마커 유전자 중 HTR1A, NXPH1 및 DAB1의 조합을 기반으로 환자군(26례) 및 정상 대조군(28례) 샘플에 대해 leave-one-out 테스트를 수행하여 얻은 민감도 수치를 암 기수별로 정리한 결과를 나타낸다.
도 2는 본 발명에서 발굴된 메틸화 마커 유전자의 DMR에서 대장암 환자군(26례) 및 정상 대조군(28례) 샘플 간의 메틸화 수준 차이를 컬러로 표시한 차트를 나타낸다.
도 3은 본 발명에서 발굴된 메틸화 마커 유전자 중 HTR1A, NXPH1 및 DAB1의 조합을 기반으로 환자군(26례) 및 정상 대조군(28례) 샘플에 대해 leave-one-out 테스트를 수행하여 얻은 민감도 수치를 암 기수별로 정리한 결과를 나타낸다.
이하, 본 발명을 보다 상세하게 설명한다.
본 발명의 일 측면은, 대장암 진단을 위한 메틸화 유전자 마커 NXPH1(Neurexophilin 1), ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177), ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), SLC32A1(Solute Carrier Family 32 Member 1), 또는 이들의 조합을 제공한다.
상기 유전자 NXPH1은 뉴렉소필린(neurexophilin) 패밀리의 구성원으로, 가변 N-말단 도메인, 고도로 보존된 N-글리코실화된 중심 도메인, 짧은 링커 영역, 및 시스테인-풍부 C-말단 도메인을 갖는 분비 단백질을 암호화한다. 이 단백질은 수상돌기와 축색돌기 사이의 부착을 촉진하는 단백질 그룹인 알파 뉴렉신(neurexin)과 매우 단단한 복합체를 형성한다.
상기 유전자 ZNF559-ZNF177은 전사 조절에 관여할 수 있으며, 크루펠(krueppel) C2H2형 징크 핑거 단백질 패밀리에 속한다.
상기 유전자 ANKMY1은 ZMYND13로도 알려져 있으며, 이와 관련된 질병에는 정맥 혈관종 및 수면병이 포함된다.
상기 유전자 AVPR1A에 의해 암호화된 단백질은 아르기닌 바소프레신에 대한 수용체로 작용한다. 이 수용체는 세포 수축과 증식, 혈소판 응집, 응고 인자의 방출 및 글리코겐 분해를 매개한다.
상기 유전자 CAPS2는 단백질 코딩 유전자로 관련된 Gene Ontology에는 칼슘 이온 결합이 포함된다.
상기 유전자 DAB1은 릴린(Reelin) 신호전달의 핵심 조절인자를 암호화한다. 릴린은 발달 중인 뇌의 뉴런, 특히 Cajal-Retzius 세포에서 분비되는 거대 당단백질이다. DAB1은 발달 중인 뇌에서 및 성인 신경발생 동안 세포 위치설정을 제어하는 신호전달 경로에서 릴린의 다운스트림에서 기능한다.
상기 유전자 HTR1A은 인간에서 세로토닌 1A 수용체를 암호화한다. HTR1A와 관련된 질병에는 주기적 발열(월경주기-의존성) 및 범불안 장애가 포함된다.
상기 유전자 PCDH8은 cadherin 슈퍼패밀리의 서브패밀리인 protocadherin 유전자 패밀리에 속한다. 이 유전자는 CNS-특이적으로 세포 부착에서 기능하는 것으로 생각되는 통합 막 단백질을 인코딩한다.
상기 유전자 PENK는 여러 단백질 생성을 위해 단백분해 처리되는 전전구단백질(preproprotein)을 인코딩한다. 이러한 생성물에는 펜타펩티드 오피오이드인 Met-enkephalin 및 Leu-enkephalin이 포함되며, 이들은 시냅스 소포에 저장된 후 시냅스로 방출되어 뮤 및 델타-오피오이드 수용체에 결합하여 통증 인식을 조절한다.
상기 유전자 SLC12A5에 의해 암호화된 단백질은 칼륨과 염화물의 화학적 농도 구배에 따라 순 유출 또는 유입 경로에서 기능할 수 있는 통합 막 K-Cl 공동수송체이다. 암호화된 단백질은 동종다량체로서 또는 다른 K-Cl 공동수송체와 함께 이종다량체로서 작용하여 뉴런에서 염화물 항상성을 유지할 수 있도록 한다.
상기 유전자 SLC32A1은 VGAT 또는 VIAAT로도 알려져 있으며, 인간에서 수포 억제성 아미노산 수송체(vesicular inhibitory amino acid transporter)를 암호화한다
상기 메틸화 유전자 마커는 개체로부터 분리된 생물학적 시료, 예컨대 액체 시료에 기반하여 우수한 민감도, 특이도 및/또는 정확도로 대장암 진단에 관한 정보를 제공할 수 있다. 상기 메틸화 유전자 마커는 혈액, 혈장, 혈청과 같은 액체 시료를 이용한 경우, 우수한 진단 정확도를 나타낸다는 점에서 비침습적 진단을 가능하게 한다.
본원에서 사용되는 바와 같이, "메틸화"라 함은 DNA를 구성하는 염기에 메틸기가 부착되는 것을 의미한다. 일 구현예에서, 메틸화 상태는 특정 유전자의 특정 CpG 영역의 사이토신에서 일어나는 메틸화 여부 또는 메틸화 정도를 의미할 수 있다. 메틸화가 일어난 경우 그로 인하여 전사인자의 결합이 방해를 받아 해당 유전자의 발현이 억제될 수 있다. 발현 억제는 메틸화 정도에 따라 상대적으로 일어날 수 있다. 이러한 이유로 DNA 메틸화는 유전자 발현 조절에 중추적인 역할을 하는 후성유전적 변형으로서, 사이토신의 5번 탄소에 메틸기(-CH3)가 붙어 5-메틸사이토신 형태로 변형된다. DNA 메틸화는 주로 CpG 디뉴클레오티드의 사이토신 기에서 발생하며, CpG 섬 또는 CpG 영역이라고 불리는 CpG가 집중적으로 몰려 있는 DNA 영역에서 많이 나타난다.
본원에서 사용되는 바와 같이, "CpG 영역"이라 함은 CpG 섬이라고 불리는 CpG 가 집중적으로 몰려있는 DNA 영역 또는 그의 일부를 지칭한다. 암이 진행되는 과정 동안 게놈 전반적으로는 DNA 저메틸화가 나타나고, CpG 섬의 일부 영역에서 국소적인 과메틸화가 빈번하게 일어나는 것으로 알려져 있다. 예를 들어, 암세포에서는 암 억제 유전자의 프로모터 영역의 CpG 부위가 비정상적으로 과메틸화되면 이 유전자의 발현이 억제되어 암을 일으킬 수 있다. CpG 부위의 메틸화는 암 발생의 초기에 일어나기 때문에 암의 조기 진단에 유용하다.
일 구현예에서, 상기 마커 유전자 NXPH1, ZNF559-ZNF177, ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5, 또는 SLC32A1의 CpG 영역은 상기 유전자의 DNA 상에 존재하는 CpG 영역을 의미한다. 예컨대, 상기 CpG 영역은 프로모터 영역 등 전사 조절 영역, 단백질 코딩 영역(open reading frame, ORF) 또는 터미네이터 영역 등에 존재할 수 있다.
일 구현예에서, 상기 유전자의 CpG 부위는 C와 G가 포스페이트로 연결된 서열이 200bp 이상 연속된 부분일 수 있고, 0.4kb에서 10kb 정도의 범위에서 임의의 크기를 가질 수 있다.
다른 구현예에서, 상기 유전자의 CpG 부위는 유전자의 전사 시작 부위(transcription start site, TSS)로부터 +/- 2000 염기(2kb) 사이에 위치할 수 있다.
본 발명의 일 실시예에서, 상기 유전자의 CpG 부위는 하기 표 1에 기재된 유전자의 CpG 부위 또는 그에 포함된 일부의 사이토신의 메틸화 상태일 수 있다. 하기 표 1에서 CpG 부위는 DMR(Differentially Methylated Region)이라고 표시한다.
유전자 명칭 | 염색체 번호 | DMR 위치 (GRCh37) | DMR 크기 | |
시작 | 끝 | |||
ANKMY1 | chr2 | 241,458.915 | 241,459,750 | 835 |
AVPR1A | chr12 | 63,543,442 | 63,544,839 | 1,397 |
CAPS2 | chr12 | 75,784,889 | 75,785,496 | 407 |
DAB1 | chr1 | 57,470,779 | 57,475,926 | 5,148 |
HTR1A | chr5 | 63,256,482 | 63,257,699 | 1,217 |
NXPH1 | chr7 | 8,473,845 | 8,483,010 | 9,166 |
PCDH8 | chr13 | 53,421,876 | 53,422,991 | 1,115 |
PENK | chr8 | 57,358,026 | 57,360,893 | 2,867 |
SLC12A5 | chr20 | 44,685,680 | 44,686,309 | 629 |
SLC32A1 | chr20 | 37,356,005 | 37,357,473 | 1,468 |
ZNF559-ZNF177 | Chr19 | 9,473,590 | 9,474,099 | 509 |
본 발명에서 인간 게놈 염색체 부위의 염기서열은 The February 2009 Human reference sequence(GRCh37)에 따라 표현하였지만, 상기 인간 게놈 염색체 부위의 구체적 서열은 게놈 서열 연구 결과가 업데이트됨에 따라서 그 표현이 다소 변경될 수 있으며, 이러한 변경에 따라 본 발명의 상기 인간 게놈 염색체 부위의 표현이 상이해질 수 있다. 따라서, 본 발명의 The February 2009 Human reference sequence(GRCh37)에 따라 표현된 인간 게놈 염색체 부위는 본 발명의 출원일 이후 인간 표준 염기서열(human reference sequence)이 업데이트되어 상기 인간 게놈 염색체 부위의 표현이 지금과 다르게 변경된다고 하여도, 본 발명의 범위가 상기 변경된 인간 게놈 염색체 부위에 미치게 됨은 자명하다고 할 것이다. 이러한 변경 내용은 본 발명이 속하는 기술분야의 통상의 지식을 가진 자라면 누구라도 용이하게 알 수 있는 사항이다.
본 발명의 다른 측면은, 대장암 진단을 위한 정보를 제공하는 방법으로서, 개체의 생물학적 시료로부터 분리된 핵산에서, NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계를 포함하는 방법을 제공한다.
일 구현예에서, 상기 하나 이상의 유전자는 NXPH1을 포함할 수 있다.
다른 구현예에서, 상기 하나 이상의 유전자가 ZNF559-ZNF177을 포함할 수 있다.
또 다른 구현예에서, 상기 하나 이상의 유전자는 NXPH1 및 ZNF559-ZNF177을 포함할 수 있다.
또 다른 구현예에서, 상기 방법은, 상기 핵산에서, ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1 로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계를 추가로 포함할 수 있다. 이때, ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1으로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계는, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 단계와 동시에 수행되거나, 임의의 순서로 순차적으로 수행될 수 있다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는 하기 유전자 조합 또는 각 유전자의 CpG 영역의 메틸화 상태를 측정하는 것일 수 있다:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5.
또 다른 구현예에서, 상기 생물학적 시료는 혈액, 혈장 또는 혈청일 수 있지만 이에 제한되지 않는다.
또 다른 구현예에서, 상기 생물학적 시료로부터 분리된 핵산은 cfDNA일 수 있다. "cfDNA"는 세포 유리(cell free) DNA를 지칭한다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는, i) 상기 유전자 또는 이의 CpG 영역의 메틸화 상태를 검출하는 제제 및 ii) 상기 하나 이상의 유전자를 특이적으로 증폭하는 프라이머로 상기 DNA를 처리하는 단계를 포함할 수 있다. 상기 메틸화 상태를 측정하는 제제는 사이토신 염기를 변형시키는 화합물 또는 메틸화 민감성 제한 효소일 수 있다. 상기 사이토신 염기를 변형시키는 화합물은 비메틸화 사이토신 또는 메틸화 사이토신을 변형시키는 화합물일 수 있다. 구체적으로, 바이설파이트, 하이드로젠 설파이트, 다이설파이트, 이들의 염, 및 이들의 조합으로 이루어진 군에서 선택되는 어느 하나일 수 있다. 또한, 메틸화 사이토신을 변형시키는 TET 단백질일 수 있으나 이에 제한되지 않는다. 사이토신 염기를 변형시켜 CpG 영역의 메틸화 여부를 검출하는 방법은 당 업계에 널리 공지되어 있다.
또한, 상기 메틸화 민감성 제한효소는 CpG 영역의 메틸화를 특이적으로 검출할 수 있는 제한효소로서 제한효소의 인식부위로 CG를 함유하는 제한효소일 수 있다. 예를 들면, SmaI, SacII, EagI, HpaII, MspI, BssII, BstUI, NotI 등이 있으며 이에 제한되지 않는다. 상기 제한효소 인식부위의 C에서의 메틸화 또는 비메틸화에 따라 제한효소에 의한 절단 여부가 달라지고 이를 PCR 또는 서던블롯(Southern Blot) 분석을 통해 검출할 수 있게 된다. 상기 제한효소 이외의 다른 메틸화 민감성 제한효소는 당 업계에 잘 알려져 있다.
상기 프라이머는 상기 하나 이상의 유전자의 메틸화된 대립형질 서열에 특이적인 프라이머 및/또는 비메틸화된 대립형질 서열에 특이적인 프라이머를 포함할 수 있다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는 메틸화 특이적 중합효소 연쇄 반응(methylation-specific polymerase chain reaction), 실시간 메틸화 특이적 중합효소 연쇄 반응(real time methylation-specific polymerase chain reaction), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, 파이로시퀀싱, 또는 바이설파이트 시퀀싱에 의해 수행될 수 있지만 이에 제한되지 않는다. 상기에 나열된 PCR 또는 시퀀싱의 다른 예로는 MethyLight PCR, MehtyLight 디지털 PCR, EpiTYPER, CpG 섬 마이크로어레이 등이 포함된다. 또한, TET 단백질(ten-eleven translocation protein)을 이용한 검출법을 이용하여 측정할 수 있다. 상기 TET 단백질은 DNA에 작용하는 효소로 염기의 화학적 변화에 관여하며, 바이설파이트를 처리할 경우 메틸화된 C를 제외한 모든 C가 T 염기로 바뀌는 것과 달리 TET 단백질은 메틸화된 C만이 T로 바뀌어 효율적인 검출이 가능하다.
또 다른 구현예에서, 상기 메틸화 상태를 측정하는 단계는 대조군 시료의 해당 마커의 상응하는 메틸화 측정 결과로부터 생성된 대조 메틸화 프로파일과 비교하는 단계를 추가로 포함할 수 있다.
또 다른 구현예에서, 상기 대조 메틸화 프로파일은, 상기 획득된 하나 이상의 유전자의 메틸화 패턴을 기계학습시킴으로써 구축된 모델을 구성하며, 정상 대조군과 상이한 대장암 환자군 특이적 메틸화 패턴을 식별하기 위한 것일 수 있다.
또 다른 구현예에서, 상기 기계학습은 랜덤 포레스트, 로지스틱 회귀 분석, 서포트 벡터 머신, 의사결정나무, 연관성 규칙 마이닝, 신경망 네트워트 및 딥러닝으로 이루어진 군에서 선택되는 하나 이상의 알고리즘에 의해 수행될 수 있다.
또 다른 구현예에서, 상기 대조군 시료는 정상 개체의 시료일 수 있다. 또한, 상기 대조군 시료는 대장암 환자의 시료일 수 있으며, 상기 대장암 환자는 다양한 대장암 병기를 갖는 환자일 수 있다.
또 다른 구현예에서, 상기 대장암은 조기 대장암, 전이성 대장암, 또는 재발성 또는 난치성 대장암일 수 있다. 이때, 각각의 대장암은 다양한 병기를 가질 수 있다.
본 발명의 또 다른 측면은, 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화(hybridization)할 수 있는 제제를 포함하는 조성물을 제공한다.
일 구현예에서, 상기 조성물은 ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1 로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화할 수 있는 제제를 추가로 포함할 수 있다.
다른 구현예에서, 상기 조성물은 하기 조합의 유전자 각각 또는 이의 CpG 영역을 증폭하는 제제를 포함할 수 있다:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5.
또 다른 구현예에서, 상기 생물학적 시료는 혈액, 혈장 또는 혈청일 수 있지만 이에 제한되지 않는다.
또 다른 구현예에서, 상기 생물학적 시료로부터 분리된 핵산은 cfDNA일 수 있다.
또 다른 구현예에서, 상기 제제는 상기 유전자에 상보적으로 결합하는 프라이머, 프로브 또는 안티센스 뉴클레오티드를 포함할 수 있다.
본 명세서에서 사용되는 용어, "프라이머"란 시료 내의 유전자의 상보적인 주형(template)과 염기쌍(base pair)을 형성할 수 있고, 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 핵산 서열을 의미한다. 프라이머의 서열은 반드시 주형의 서열과 정확히 같을 필요는 없으며, 충분히 상보적이어서 주형과 혼성화될 수 있으면 된다. 프라이머는 적절한 완충용액 및 온도에서 중합반응을 위한 제제 및 상이한 4가지 뉴클레오사이드 3인산(nucleoside triphosphate)의 존재하에 DNA 합성을 개시할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당 업계에 공지된 것을 기초로 변형할 수 있다.
본 명세서에서 사용되는 용어, "프로브"란 시료 내의 검출하고자 하는 유전자와 특이적으로 결합할 수 있는 물질로서, 상기 결합을 통하여 특이적으로 시료 내의 유전자의 존재를 확인할 수 있는 물질을 의미한다. 프로브는 올리고뉴클레오티드 프로브, 단쇄 DNA 프로브, 이중쇄 DNA 프로브, RNA 프로브 등의 형태로 제작될 수 있다. 적당한 프로브의 선택 및 혼성화 조건은 당 업계에 공지된 것을 기초로 변형할 수 있다.
본 명세서에서 사용되는 용어, "안티센스 뉴클레오티드"는 타겟으로 하는 유전자에 대한 상보적인 서열을 가지고 있어 타겟 유전자와 이합체를 형성할 수 있는 핵산 기반의 분자를 의미하며, 타겟 유전자를 검출하는 데 사용될 수 있다. 상기 안티센스 뉴클레오티드는 검출 특이성을 증가시키기 위하여 적절한 길이를 선택할 수 있다.
본 발명에서, 프라이머, 프로브 또는 안티센스 뉴클레오티드는 메틸화 상태를 분석하는 대상이 되는 특정 CpG 영역의 서열에 따라 당 업계에 알려진 공지된 지식 및 기술을 사용하여 바람직하게 디자인될 수 있다.
또 다른 구현예에서, 상기 조성물은 상기 유전자의 CpG 영역의 메틸화 상태를 검출하기 위한 제제를 추가로 포함할 수 있다. 상기 메틸화 상태를 검출하기 위한 제제는 앞서 설명한 바를 참조한다. 예컨대, 상기 제제는 바이설파이트, 하이드로겐 설파이트, 다이설파이트, 이들의 염, 또는 이들의 조합일 수 있다. 그러나, 상기 제제는 이로 한정되지 않는다. 바이설파이트, 하이드로겐 설파이트, 다이설파이트와 같은 비메틸화 사이토신 염기를 변형시키는 화합물 및 이를 이용하여 비메틸화 사이토신 잔기를 변형시켜 유전자의 메틸화 여부를 검출하는 방법은 당 업계에 잘 알려져 있다(WO 01/26536; US 2003/0148326 A1).
또한, 타겟 유전자 부위의 염기서열의 변환된 정도로 확인하여 메틸화 여부 및 정도를 알아보기 위해 NGS가 이용될 수 있다. NGS에 의한 서열 분석은 Illumina사의 MiSeq, NextSeq500, NextSeq550, Hiseq 2500, Hiseq 4000, Hiseq X Ten, NovaSeq 6000, Thermo Fisher Scientific사의 Ion PGM, Ion Proton, Ion S5, BGI 사의 BGI-500, MGISEQ-2000, MGISEQ-T7 등을 이용하여 수행될 수 있지만 이에 제한되지 않는다.
본 발명의 또 다른 측면은, 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서, NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함하는 조성물을 제공한다.
일 구현예에서, 상기 조성물은 ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, PCDH8, PENK, SLC12A5 및 SLC32A1 로 이루어진 군에서 선택된 하나 이상의 유전자 또는 이의 CpG 영역의 메틸화 상태를 측정하는 제제를 추가로 포함할 수 있다.
다른 구현예에서, 상기 조성물은 하기 조합의 유전자 각각 또는 이의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함할 수 있다:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5.
상기 구현예에서, 생물학적 시료, 핵산, 유전자, CpG 영역, 메틸화 상태를 측정하는 제제는 상술한 바를 참조한다.
본 발명의 또 다른 측면은 상기 조성물을 포함하는, 개체의 생물학적 시료로부터 분리된 핵산을 이용하여 대장암 진단을 위한 키트를 제공한다.
구체적으로, 상기 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치로 구성된다. 예를 들어, 상기 키트는 RT-PCR(Reverse transcription polymerase chain reaction) 키트, DNA 칩 키트, ELISA(Enzyme-linked immunosorbent assay) 키트, 단백질 칩 키트 또는 래피드(rapid) 키트일 수 있다.
일 구현예에서, 상기 키트에 포함된 상기 조성물은 패널(panel) 형태일 수 있지만 이에 제한되지 않는다.
일 구현예에서, 상기 키트는 유전자 패널일 수 있다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예 1. 임상 연구 개요
2020년 3월부터 12월까지 강북삼성병원 예방건진센터에서 국민건강보험공단 일반검진과 암검진을 받은 수검자들 중 대장내시경 검사를 받은 수검자들의 기존 혈액 검사 이후 남은 검체를 제공받았다. 이때, 수검자들의 개인 정보는 일체 수집되지 않았다.
실제 대장내시경 결과를 참조하여 상기 검체를 대장암 환자군(대장암 또는 전암성 선종으로 진단됨)과 정상 대조군으로 분류하였다. 대장암 환자군의 경우, 대장암은 소화기 전문의에 의해 TNM 병기 체계 및 AJCC(American Joint Committee on Cancer, 미국암연합회) 병기 분류법에 따라 0기부터 4기까지 분류되었고, 정상 대조군은 대장내시경 수검자들 중 검사결과 정상으로 판정된 군이었다.
이렇게 분류된 검체를 이용하여 도 1에 제시된 과정을 수행하였다. 그 결과, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 11종의 메틸화 마커 유전자 ANKMY1, AVPR1A, CAPS2, DAB1, HTR1A, NXPH1, PCDH8, PENK, SLC12A5, SLC32A1, 및 ZNF559-ZNF177을 발굴하였다. 또한, 이렇게 발굴된 11종의 메틸화 마커 유전자와 관련된 정보에 기반하여 기계학습 알고리즘에 의해 대장암 식별 모델을 수립하고, 이러한 모델을 검증하였다.
이하의 실시예에서는 이러한 과정을 상세히 설명한다.
실시예 2. 무세포 DNA 추출
차세대 염기서열 분석을 위한 준비 과정으로서, 각 검체를 3000 rpm에서 15분간 원심분리하여 혈장을 분리하였다. 분리된 혈장으로부터 무세포 DNA의 추출은 MagMAXTM Cell-Free DNA Isolation Kit(Thermo fisher scientific)를 이용하여 수행하였다. 추출 방법은 제조사의 매뉴얼에 따라 진행하였다. 추출된 무세포 DNA는 형광 강도 측정기(Fluorometer)(Qubit Flex, Invitrogen)를 이용하여 정량하였으며, DNA 상태는 자동화된 전기영동 장비(4150 Tapestation system, Agilent)를 이용하여 DNA degradation 여부 및 크기를 확인하였다.
실시예 3. 라이브러리 제작 및 정도관리(QC)
실시예 2에서 추출된 무세포 DNA에 EZ DNA methylation-LightningTM kit(Zymo Research, USA)를 이용하여 바이설파이트를 처리하였다.
무세포 DNA에 바이설파이트를 처리하면, 비메틸화된 사이토신은 우라실로 변형되고, 메틸화된 사이토신은 변화없이 남게 된다. 상기 바이설파이트가 처리된 DNA를 멸균 증류수 20㎕로 용출시켜 차세대 염기서열 분석을 위한 라이브러리를 제작하였다.
라이브러리 제작용 준비 제제로서 Accel-NGS® Methyl-Seq DNA Library Kit(Swift Biosciences, USA)을 사용하였다. 이 과정은 메틸화 어댑터 라이게이션, 라이브러리의 인덱싱, AMPure XP 비드를 이용한 라이게이션된 DNA의 순수 분리 과정을 포함한다.
바이설파이트-라이브러리는 제작된 패널을 사용하는 단일 혼합 반응으로 설계하였고, SureSelectXT Human Methyl Seq Kit(Agilent, USA)를 이용하여 라이브러리를 완성하였다. 이 과정은 라이브러리 하이브리드화, 스트렙트아비딘 비드를 이용한 하이브리드 캡쳐, 라이브러리 증폭, AMPure XP 비드를 이용한 순수 분리 과정을 포함한다.
제작된 라이브러리가 염기서열 분석에 적합한지 확인하기 위하여, Agilent Bioanalyzer 2200(Agilent, USA) 기기 및 High Sensitivity chip을 이용하여 라이브러리의 길이와 양을 측정하였고, 제조사가 제시하는 정도 관리(QC) 조건에 만족하는 라이브러리를 서열분석에 사용하였다.
실시예 4. 차세대 염기서열 분석 수행
실시예 3에서 제작된 라이브러리에 대해 차세대 염기서열 분석 장비(NovaSeq 6000, Illumina)를 이용하여 바이설파이트 염기서열 분석을 수행하였다. 서열분석 장비로 부터 생산된 염기량, 퀄리티 스코어(Q30), 온-타겟(on-target) 비율, 타겟 영역별 분석에 필요한 평균 리드 갯수, 고유한 분자 식별자(Unique Molecular Identifier, UMI) 중복 비율, 매핑된 데이터량 등을 확인하여 생성된 데이터의 퀄리티를 평가하였다. 이후, 무세포 DNA의 8,400만개 염기 가운데 총 370만개 CpG 부위를 타겟하여 그 메틸화 수준을 분석하였다.
실시예 5. DNA 메틸화 분석 및 메틸화 마커 유전자 발굴
실시예 4에서 캡쳐된 타겟 영역인 총 370만개 CpG 좌위에 대하여 DNA 메틸화 정도를 측정하였다.
DNA 메틸화 정도는 실시예 4에서 수행된 차세대 염기서열 분석 결과에 기반하여 측정하였다. 각각의 CpG 좌위에서 메틸화된 염기서열 단편(리드(read))과 메틸화되지 않은 리드를 각각 카운트하고 그 값을 아래의 식에 대입하여 계산하였다:
상기 식에서,
계산된 메틸화 정도는 0 내지 1 범위의 값으로 표시되며, 값 0은 해당 CpG 좌위가 완전히 메틸화되지 않은 것을 의미하며, 1은 해당 CpG 좌위가 완전히 메틸화된 것을 의미한다.
대장암 환자군과 정상 대조군에서 차별적으로 메틸화되어 있는 유전자 영역(Differentially methylated region, DMR)을 발굴하기 위하여 우선 개개의 CpG 좌위에 대해 t-test, wald test, z-score 방법을 사용하여 유의성을 평가하였다. 이후, 개개의 CpG 좌위에서 유의하게 나타난(p 값<0.05) 영역들에 대해 다양한 인자의 여러 값에 대해 평가한 후에 최적의 조합을 선정하였다. 최적화 테스트에 포함된 상기 다양한 인자의 예로는 최소 CpG 수, DMR 구간의 최소 길이, p 값 한계치, 윈도우(window) 크기 등이 있다.
평가는 유전자와 DMR 단위로 진행하였고, 여러 기계학습 알고리즘을 사용하여 leave-one-out 테스트로 진행하였다. 이때, 기계학습 알고리즘으로는 서포트 벡터 머신(Support Vector Machine), 랜덤 포레스트(Random Forest), 신경망 네트워크(Neural Network), 딥러닝(Deep Learning)을 사용하였다.
그 결과, 대장암 환자군에서 차별적으로 메틸화 수준이 변화되어 있는 11종의 유전자 및 각 유전자에 포함된 DMR을 선별하였다(표 2). 표 2에는 또한 각 유전자의 메틸화 상태가 표시되어 있다.
유전자 명칭 | 염색체 번호 | DMR 위치 (GRCh37) | DMR 크기 | 메틸화 상태 +:과메틸화 -:저메틸화 |
|
시작 | 끝 | ||||
ANKMY1 | chr2 | 241,458.915 | 241,459,750 | 835 | + |
AVPR1A | chr12 | 63,543,442 | 63,544,839 | 1,397 | + |
CAPS2 | chr12 | 75,784,889 | 75,785,496 | 407 | - |
DAB1 | chr1 | 57,470,779 | 57,475,926 | 5,148 | - |
HTR1A | chr5 | 63,256,482 | 63,257,699 | 1,217 | + |
NXPH1 | chr7 | 8,473,845 | 8,483,010 | 9,166 | + |
PCDH8 | chr13 | 53,421,876 | 53,422,991 | 1,115 | + |
PENK | chr8 | 57,358,026 | 57,360,893 | 2,867 | + |
SLC12A5 | chr20 | 44,685,680 | 44,686,309 | 629 | + |
SLC32A1 | chr20 | 37,356,005 | 37,357,473 | 1,468 | + |
ZNF559-ZNF177 | Chr19 | 9,473,590 | 9,474,099 | 509 | + |
상기 11종의 유전자의 DMR에서 대장암 환자군 26례와 정상 대조군 28례의 샘플을 이용한 메틸화 수준을 타겟 영역 기반 바이설파이트 시퀀싱을 통해 분석하였고, 그 결과를 도 2에 도시하였다.
실시예 6. 기계학습 모델 수립 및 평가
실시예 5에서 발굴된 마커 유전자 내에 존재하는 DMR 영역에서의 메틸화 수치를 기반으로 기계학습 알고리즘을 이용하여 대장암 식별 모델을 수립하였다.
일반적인 모델링 프로그램은 초기 입력값에 어떤 조건이 만족되면 최종 결과를 내보내도록 개발자가 미리 프로그래밍하는 명시적 프로그래밍에 의해 만들어진다. 반면, 기계학습에서는 초기 입력값이 들어왔을 때 결과가 특정 값이 되는 조건을 찾도록 컴퓨터를 학습시킨다. 이러한 학습 과정은 입력값에 대해 결과값이 제대로 도출되도록 최적의 매개변수를 찾는 과정이며, 학습의 결과물은 최적의 매개변수 혹은 가중치 값이다.
딥러닝 혹은 신경망 네트워크와 같은 기계학습 알고리즘을 이용하여 수립된 모델은 다수의 정상 대조군과 대장암 환자군 샘플에서 얻은 마커 유전자 영역의 메틸화 패턴을 학습시킴으로써 정상 대조군과 상이한 대장암 환자군 특이적 메틸화 패턴을 식별할 수 있도록 만들어진 수식 모델이라고 할 수 있다. 이렇게 만들어진 모델을 활용하면 새로운 패턴의 데이터에 대해 추론하고 예측할 수 있게 된다. 따라서, 상기 수립된 모델은 주어진 테스트 샘플이 대장암 환자군 샘플에서 나타나는 메틸화 패턴을 보이는지 여부를 평가하여, 그러한 테스트 샘플이 유래된 대상체가 정상인지 대장암이 있는지에 대한 판정 결과를 도출해 낸다.
이렇게 11종의 마커 유전자를 기반으로 수립된 모델을 평가하기 위한 일례로, 딥러닝 알고리즘을 이용하여 leave-one-out 테스트를 실시하였다. 딥러닝 알고리즘은 여러 층의 인공신경망(Artificial Neural Network)을 이용하여 학습을 수행하는 기계학습의 한 종류이다. 기존 기계학습 알고리즘의 경우 데이터 분석자가 학습 데이터에서 어떤 특징을 추출해야 하는지 직접 관여해야 하는 반면, 딥러닝의 경우 컴퓨터가 자동으로 학습 데이터에서 특징을 추출하여 자가 학습을 한다. 이러한 딥러닝 테스트 결과를 표 3에 나타낸다.
표 3에는, 본 발명에서 발굴된 11종 마커 유전자 중 3종 내지 7종을 기반으로 수립된 모델에 대해 계산된 민감도, 특이도 및 정확도 수치와 함께, 이들 유전자를 단일 마커로 적용시 계산된 해당 수치가 함께 제시되어 있다.
유전자 타겟 조합/단일 마커 | 민감도 (%) | 특이도 (%) | 정확도 (%) |
HTR1A, NXPH1, DAB1 | 92.31 | 92.86 | 92.59 |
AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK, DAB1 | 92.31 | 92.86 | 92.59 |
AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK, DAB1 | 92.31 | 92.86 | 92.59 |
ANKMY1, ZNF559-ZNF177, SLC32A1, DAB1 | 88.46 | 92.86 | 90.74 |
HTR1A, NXPH1, ZNF559-ZNF177, DAB1 | 92.31 | 89.29 | 90.74 |
NXPH1, DAB1 | 80.77 | 85.71 | 83.33 |
NXPH1, SLC12A5 | 76.92 | 89.29 | 83.33 |
ANKMY1 | 57.69 | 64.29 | 61.11 |
AVPR1A | 61.54 | 71.43 | 66.67 |
CAPS2 | 73.08 | 75.00 | 74.07 |
DAB1 | 19.23 | 78.57 | 50.00 |
HTR1A | 88.46 | 85.71 | 87.04 |
NXPH1 | 76.92 | 85.71 | 81.48 |
PCDH8 | 73.08 | 71.43 | 72.22 |
PENK | 76.92 | 82.14 | 79.63 |
SLC12A5 | 69.23 | 75.00 | 72.22 |
SLC32A1 | 69.23 | 82.14 | 75.93 |
ZNF559-ZNF177 | 76.92 | 78.57 | 77.78 |
본 발명에 포함된 11종의 유전자를 기반으로 수립된 모델을 평가하기 위한 또 다른 예로, 표 4에는 본 발명에서 발굴된 11종의 마커 유전자 중 3종을 기반으로 수립된 모델에 대해 계산된 민감도 및 특이도 수치와 함께, 기존에 보고된 단일 마커 및 마커 조합에 대해 계산된 해당 수치가 함께 제시되어 있다.
유전자 타겟 | 민감도(%) | 특이도(%) | 참고문헌 |
HTR1A, NXPH1, DAB1 | 92.31 | 92.86 | 일 구현예 |
ALX4 | 83.30 | 70.00 | [1] |
ALX4 | 23.00 | 100.00 | [2] |
APC | 57.00 | 86.00 | [3] |
APC, HLTF, MLH1 | 57.00 | 90.00 | [4] |
APC, MGMT, RASSF2, WIF1 | 86.50 | 92.10 | [5] |
C9orf50, KCNQ5, CLIP4 | 85.00 | 99.00 | [6] |
CDKN2A | 70.00 | 100.00 | [7] |
HLTF | 32.70 | 92.70 | [4] |
IKZF1,BCAT1 | 66.00 | 94.00 | [8] |
MLH1 | 42.90 | 97.60 | [4] |
NEUROG1 | 61.00 | 91.00 | [9] |
NGFR | 51.00 | 84.00 | [10] |
RUNX3 | 60.00 | 82.50 | [11] |
RUNX3, SFRP1, CEA | 89.40 | 84.70 | [11] |
SDC2 | 71.20 | 95.60 | [12] |
SEPTIN9 | 73.00 | 95.60 | [12] |
SEPTIN9, ALX4 | 71.00 | 95.00 | [13] |
SEPTIN9, SDC2 | 86.50 | 92.10 | [14] |
SFRP1 | 77.70 | 70.00 | [11] |
TMEFF2 | 65.00 | 69.00 | [10] |
VIM | 59.00 | 93.00 | [15] |
[1] https://pubmed.ncbi.nlm.nih.gov/17101318/ [2] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4099003/pdf/pone.0099233.pdf [3] https://pubmed.ncbi.nlm.nih.gov/22990173/ [4] https://pubmed.ncbi.nlm.nih.gov/16181380/ [5] https://pubmed.ncbi.nlm.nih.gov/19773381/ [6] https://doi.org/10.1186/s13148-019-0757-3 [7] https://clincancerres.aacrjournals.org/content/8/1/188.long [4] https://pubmed.ncbi.nlm.nih.gov/16181380/ [8] https://bmccancer.biomedcentral.com/articles/10.1186/s12885-015-1674-2 [9] https://pubmed.ncbi.nlm.nih.gov/21326223/ [10] https://pubmed.ncbi.nlm.nih.gov/18089654/ [11] https://pubmed.ncbi.nlm.nih.gov/31524773/ [12] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2582436/ [13] https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0009061 [14] https://downloads.hindawi.com/journals/dm/2019/5232780.pdf [15] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2847606/ |
또한, 상기 메틸화 유전자 마커 HTR1A, NXPH1 및 DAB1의 조합 모델에 대해 대장암 환자군 26례와 정상 대조군 28례의 샘플을 이용하여 leave-one-out 테스트를 수행하여 얻은 민감도 수치를 대장암 기수별로 정리한 결과를 도 3에 도시하였다. 도 3으로부터 알 수 있는 바와 같이, 상기 모델은 0기의 경우에는 67%, 1기의 경우에는 88%, 그리고 2기 내지 4기의 경우에는 100%의 민감도를 나타내었다.
Claims (29)
- 대장암 진단을 위한 정보를 제공하는 방법으로서,
개체의 생물학적 시료로부터 분리된 핵산에서, NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 단계를 포함하는
방법. - 제1항에 있어서,
상기 하나 이상의 유전자가 NXPH1을 포함하는
방법. - 제1항에 있어서,
상기 하나 이상의 유전자가 ZNF559-ZNF177을 포함하는
방법. - 제1항에 있어서,
상기 핵산에서, ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 단계를 추가로 포함하는
방법. - 제1항에 있어서,
상기 메틸화 상태를 측정하는 단계는 하기 (i), (ii), (iii), (iv), (v), (vi) 또는 (vii)의 유전자의 CpG 영역의 메틸화 상태를 측정하는 것을 포함하는
방법:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5. - 제1항에 있어서,
상기 생물학적 시료는 혈액, 혈장 또는 혈청인
방법. - 제7항에 있어서,
상기 생물학적 시료로부터 분리된 핵산은 cfDNA인
방법. - 제1항에 있어서,
상기 메틸화 상태를 측정하는 단계는, i) 상기 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 검출하는 제제 및 ii) 상기 하나 이상의 유전자를 특이적으로 증폭하는 프라이머로 상기 유전자를 처리하는 단계를 포함하는
방법. - 제1항에 있어서,
상기 메틸화 상태를 측정하는 단계는 메틸화 특이적 중합효소 연쇄 반응(methylation-specific polymerase chain reaction), 실시간 메틸화 특이적 중합효소 연쇄 반응(real time methylation-specific polymerase chain reaction), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, 파이로시퀀싱, 또는 바이설파이트 시퀀싱에 의해 수행되는
방법. - 제1항에 있어서,
상기 메틸화 상태를 측정하는 단계는 대조군 시료의 해당 유전자의 상응하는 메틸화 측정 결과로부터 생성된 대조 메틸화 프로파일과 비교하는 단계를 추가로 포함하는
방법. - 제11항에 있어서,
상기 대조 메틸화 프로파일은, 상기 획득된 하나 이상의 유전자의 메틸화 패턴을 기계학습시킴으로써 구축된 모델을 구성하며, 정상 대조군과 상이한 대장암 환자군 특이적 메틸화 패턴을 식별하기 위한 것인
방법. - 제12항에 있어서,
상기 기계학습은 랜덤 포레스트, 로지스틱 회귀 분석, 서포트 벡터 머신, 의사결정나무, 연관성 규칙 마이닝, 신경망 네트워트 및 딥러닝으로 이루어진 군에서 선택되는 하나 이상의 알고리즘에 의해 수행되는
방법. - 제11항에 있어서,
상기 대조군 시료는 정상 개체의 시료인
방법. - 제1항에 있어서,
상기 대장암은 조기 대장암, 전이성 대장암, 또는 재발성 또는 난치성 대장암인
방법. - 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서,
NXPH1(Neurexophilin 1) 유전자 및 ZNF559-ZNF177(Zinc Finger Protein 559-Zinc Finger Protein 177) 유전자로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화할 수 있는 제제를 포함하는
조성물. - 제16항에 있어서,
상기 조성물은 ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역을 특이적으로 증폭하거나 이와 혼성화할 수 있는 제제를 추가로 포함하는
조성물. - 제16항에 있어서,
상기 조성물은 하기 (i), (ii), (iii), (iv), (v), (vi) 또는 (vii)의 유전자의 CpG 영역을 증폭하거나 이와 혼성화할 수 있는 제제를 포함하는
조성물:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5. - 제16항에 있어서,
상기 생물학적 시료는 혈액, 혈장 또는 혈청인
조성물. - 제20항에 있어서,
상기 생물학적 시료로부터 분리된 핵산은 cfDNA인
조성물. - 제16항에 있어서,
상기 제제는 상기 유전자에 상보적으로 결합하는 프라이머, 프로브 또는 안티센스 뉴클레오티드를 포함하는
조성물. - 제16항에 있어서,
상기 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 검출하기 위한 제제를 추가로 포함하는
조성물. - 제23항에 있어서,
상기 제제는 바이설파이트, 하이드로겐 설파이트, 다이설파이트, 이들의 염, 또는 이들의 조합인
조성물. - 생물학적 시료에서 분리된 핵산을 이용하는 대장암 진단을 위한 조성물로서,
NXPH1 유전자 및 ZNF559-ZNF177 유전자로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함하는
조성물. - 제25항에 있어서,
상기 조성물은 ANKMY1(Ankyrin Repeat And MYND Domain Containing 1), AVPR1A(Arginine Vasopressin Receptor 1A), CAPS2(Calcyphosine 2), DAB1(DAB Adaptor Protein 1), HTR1A(5-Hydroxytryptamine Receptor 1A), PCDH8(Protocadherin 8), PENK(Proenkephalin), SLC12A5(Solute Carrier Family 12 Member 5), 및 SLC32A1(Solute Carrier Family 32 Member 1)로 이루어진 군에서 선택된 하나 이상의 유전자의 CpG 영역의 메틸화 상태를 측정하는 제제를 추가로 포함하는
조성물. - 제25항에 있어서,
상기 조성물은 하기 (i), (ii), (iii), (iv), (v), (vi) 또는 (vii)의 유전자의 CpG 영역의 메틸화 상태를 측정하는 제제를 포함하는
조성물:
(i) HTR1A, NXPH1 및 DAB1;
(ii) AVPR1A, ANKMY1, CAPS2, HTR1A, NXPH1, PENK 및 DAB1;
(iii) AVPR1A, PCDH8, ANKMY1, CAPS2, NXPH1, PENK 및 DAB1;
(iv) ANKMY1, ZNF559-ZNF177, SLC32A1 및 DAB1;
(v) HTR1A, NXPH1, ZNF559-ZNF177 및 DAB1;
(vi) NXPH1 및 DAB1; 또는
(vii) NXPH1 및 SLC12A5. - 제16항 내지 제27항 중 어느 한 항에 따른 조성물을 포함하는 키트로서,
개체의 생물학적 시료로부터 분리된 핵산을 이용하는 대장암 진단을 위한
키트. - 삭제
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210136287A KR102404750B1 (ko) | 2021-10-14 | 2021-10-14 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
PCT/KR2022/012598 WO2023063562A1 (ko) | 2021-10-14 | 2022-08-23 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210136287A KR102404750B1 (ko) | 2021-10-14 | 2021-10-14 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102404750B1 true KR102404750B1 (ko) | 2022-06-07 |
Family
ID=81986975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210136287A KR102404750B1 (ko) | 2021-10-14 | 2021-10-14 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102404750B1 (ko) |
WO (1) | WO2023063562A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023063562A1 (ko) * | 2021-10-14 | 2023-04-20 | 주식회사 엔도믹스 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2233590A1 (en) * | 2009-01-28 | 2010-09-29 | AIT Austrian Institute of Technology GmbH | Methylation assay |
KR102046668B1 (ko) | 2011-07-08 | 2019-11-19 | 에피제노믹스 아게 | 암 대상자의 예후를 결정하기 위한 방법 및 핵산 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2967165B1 (fr) * | 2010-11-04 | 2014-10-10 | Assist Publ Hopitaux De Paris | Methode de depistage du cancer colorectal |
KR101478826B1 (ko) * | 2011-10-28 | 2015-01-08 | 전남대학교산학협력단 | 신규한 대장암 진단용 마커 및 이를 이용한 대장암 진단 키트 |
KR102404750B1 (ko) * | 2021-10-14 | 2022-06-07 | 주식회사 엔도믹스 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
-
2021
- 2021-10-14 KR KR1020210136287A patent/KR102404750B1/ko active IP Right Grant
-
2022
- 2022-08-23 WO PCT/KR2022/012598 patent/WO2023063562A1/ko unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2233590A1 (en) * | 2009-01-28 | 2010-09-29 | AIT Austrian Institute of Technology GmbH | Methylation assay |
KR102046668B1 (ko) | 2011-07-08 | 2019-11-19 | 에피제노믹스 아게 | 암 대상자의 예후를 결정하기 위한 방법 및 핵산 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023063562A1 (ko) * | 2021-10-14 | 2023-04-20 | 주식회사 엔도믹스 | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 |
Also Published As
Publication number | Publication date |
---|---|
WO2023063562A1 (ko) | 2023-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7035156B2 (ja) | 結腸直腸がんのエピジェネティックマーカー及び該マーカーを使用する診断法 | |
US10344334B2 (en) | Method of diagnosing neoplasms | |
KR102587176B1 (ko) | 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정 | |
JP6883179B2 (ja) | 細胞増殖性異常検出用または疾患程度等級付け用の遺伝子組成物およびその用途 | |
CN107847515B (zh) | 实体瘤甲基化标志物及其用途 | |
EP2885427B1 (en) | Colorectal cancer methylation marker | |
CN104745681B (zh) | 多元基因组合物及其用途 | |
CN112159844B (zh) | 结直肠癌dna甲基化的检测方法及试剂 | |
KR102549013B1 (ko) | 췌장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 | |
MX2014013684A (es) | Papel de marcador de gen de diagnostico para cancer colorrectal. | |
KR102404750B1 (ko) | 세포 유리 dna를 이용한 대장암 진단을 위한 메틸화 마커 유전자 및 이의 용도 | |
WO2012030983A2 (en) | Variability single nucleotide polymorphisms linking stochastic epigenetic variation and common disease | |
AU2021291586B2 (en) | Multimodal analysis of circulating tumor nucleic acid molecules | |
KR102281644B1 (ko) | 지연성 허혈 진단을 위한 insr 유전자 과메틸화 마커 | |
KR102281657B1 (ko) | 지연성 허혈 진단을 위한 cdhr5 유전자 과메틸화 마커 | |
KR102158726B1 (ko) | Itpr3 유전자 업스트림의 유전자간 영역을 포함하는 지연성 허혈 진단용 dna 메틸화 마커 조성물 | |
KR20230037111A (ko) | 대사증후군 특이적 후성유전 메틸화 마커 및 이의 용도 | |
AU2024203201A1 (en) | Multimodal analysis of circulating tumor nucleic acid molecules | |
US20110281270A1 (en) | Efficient detection of double mutants of the cebpa gene in acute myeloid leukemia | |
CN117004720A (zh) | 用于检测甲状腺癌的组合物及其用途 | |
CN116798606A (zh) | 用于检测甲状腺癌的系统 | |
CN114008219A (zh) | 检测sdc2基因甲基化的方法 | |
Kwan | Epigenetic Study of Plasma Circulating DNA in Prostate Cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |