KR20240051739A - cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 - Google Patents

cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 Download PDF

Info

Publication number
KR20240051739A
KR20240051739A KR1020220131806A KR20220131806A KR20240051739A KR 20240051739 A KR20240051739 A KR 20240051739A KR 1020220131806 A KR1020220131806 A KR 1020220131806A KR 20220131806 A KR20220131806 A KR 20220131806A KR 20240051739 A KR20240051739 A KR 20240051739A
Authority
KR
South Korea
Prior art keywords
cancer
cfdna
wgs
structural
patient
Prior art date
Application number
KR1020220131806A
Other languages
English (en)
Inventor
신현태
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020220131806A priority Critical patent/KR20240051739A/ko
Priority to PCT/KR2023/008217 priority patent/WO2024080481A1/ko
Publication of KR20240051739A publication Critical patent/KR20240051739A/ko

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Analytical Chemistry (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 암 환자 유래 cfDNA 시료를 이용하여 높은 민감도로 구조 변이 서열을 검출하고, 검출된 구조 변이 데이터를 이용하여 암 환자의 미세잔존질환 진단에 사용하기 위한 새로운 WGS (whole genome sequence) 분석 시스템 및 방법에 관한 것이다. 본 발명에서는 암 세포주와 NA12878을 1:12,800 비율로 섞은 경우에도 구조 변이 서열을 검출하였으며, 전이성 폐암환자의 cfDNA 에서도 구조 변이 서열을 민감하게 확인하였다. 따라서 본 발명에 따른 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법을 이용하면, 암 유래 cfDNA 가 낮은 순도로 혈액 등의 존재하더라도, 높은 민감도로 환자 특이적 구조 변이 서열을 검출할 수 있고, 암 치료 후 환자에 남아있는 암 세포를 적은 시료로도 검출할 수 있어, 암 종과 상관없이 범용적으로 미세 잔존 질환 진단에 활용할 수 있다.

Description

cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 {Method for diagnosis of minimal residual disease by detecting structural variation sequence in cfDNA}
본 발명은 암 환자 유래 cfDNA (Cell-free DNA) 시료에서 높은 민감도로 구조 변이 서열을 검출하고, 이를 이용하여 암 환자의 미세잔존질환(Minimal Residual Disease; MRD)을 진단하기 위한 새로운 전장 유전체 서열 분석 (Whole-Genome Sequencing, WGS) 시스템 및 방법에 관한 것이다.
차세대 염기서열 분석(Next Generation Sequencing)은 유전체를 무수히 많은 조각으로 나눠서 읽고, 얻어진 염기서열 조각을 정렬하여 유전체의 서열을 분석하는 유전체 고속 분석 방법이다. 차세대 염기서열 분석 기술을 통한 전장 유전체 서열 분석(Whole-Genome Sequencing, WGS)은 거의 모든 유형의 체세포 돌연변이(somatic variant) 검출에 유용하고, 이러한 유용성 덕분에 여러분야에서 광범위하게 사용되고 있으며, 특히 암 유전체학에서 매우 중요한 역할을 하고 있다.
전 세계적으로는 유전체 분석 사업은 빠르게 발전하고 있으며, 이러한 차세대 염기서열 분석 기법은 임상유전체(clinical genomics), 약물유전체학(pharmaco - genomics) 및 중개 임상 (translational medicine) 분야에서도 활발히 활용되고 있다.
구조 변이(Structural Variants, SV)는 암 발생 과정에 중요한 역할을 하므로, 암 유전체에서 체세포 구조변이를 검출하기 위해 많은 생물 정보학 알고리즘과 툴이 개발되었다. 유전체의 특정 위치가 잘려서 서로 결합하여 발생되는 구조 변이는 결합 부위에 융합(fusion) DNA 서열을 생성하게 되고 이는 정상 조직에서는 확인되지 않는 특이적인 고유 서열이다. 암 세포에서는 apoptosis 로 인해 혈중으로 cfDNA 가 유입되는 것으로 알려져 있고, cfDNA에서 원발암의 특이적인 구조 변이에 의한 융합 DNA 서열이 검출된다면, 이를 이용하여 암 치료 후 체내에 남아있는 미세잔존질환(Minimal Residual Disease; MRD)을 진단하는데 사용할 수 있을 것으로 기대된다.
cfDNA에서 돌연변이를 찾기 위한 방법으로 targeted high-depth 시퀀싱이 널리 이용되고 있다. 상기 방법은 돌연변이를 민감하게 찾을 수 있다는 장점이 있으나, high-depth를 구현하기 위해 개별 암 종에 적합한 표적화된 패널을 준비해야 하고, 노이즈를 줄이기 위한 실험적인 전처리 공정이 필요하다.
따라서 암 미세잔존질환을 진단하기 위해 범용적으로 활용할 수 있는, cfDNA 시료의 WGS을 이용하여 개별 암 특이적인 구조 변이 서열을 효과적으로 검출할 수 있는 새로운 방법에 대한 필요성이 있다.
본 발명자들은 cfDNA 시료에서 구조 변이 서열을 민감하게 검출하기 위해서, 원발암의 WGS를 활용하여 구조 변이를 찾고, 이 구조 변이의 서열을 cfDNA의 WGS에서 매칭하는 방법을 통해 적은 수의 구조 변이 서열 정보를 가지고 있는 리드들을 cfDNA에서 검출할 수 있고, 이를 환자의 미세잔존질환 진단에 활용할 수 있음을 확인하고 본 발명을 완성하였다.
상기 목적을 달성하기 위하여, 본 발명은 1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법을 제공한다.
또한 본 발명은 1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법을 제공한다.
본 발명에서는 암 세포주와 NA12878을 1:12,800 비율로 섞은 경우에도 구조 변이 서열을 검출하였으며, 전이성 폐암환자의 cfDNA 에서도 구조 변이 서열을 민감하게 확인하였다. 따라서 본 발명에 따른 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법을 이용하면, 암 유래 cfDNA 가 낮은 순도로 혈액 등의 존재하더라도, 높은 민감도로 환자 특이적 구조 변이 서열을 검출할 수 있고, 암 치료 후 환자에 남아있는 암 세포를 적은 시료로도 검출할 수 있어, 암 종과 상관없이 범용적으로 미세 잔존 질환 진단에 활용할 수 있다.
도 1은 본 발명의 cfDNA 내 구조 변이 서열 검출 방법의 흐름도를 나타낸 도이다.
도 2는 본 발명 검출 방법 중 2단계에서 수행되는 대응 참조 서열과 각 지지 리드를 비교하는 구조 변이 서열 확인 공정의 모식도이다.
도 3은 세포주 혼합 실험을 이용한 분석 검증 결과를 요약하여 나타낸 도이다.
도 4 및 도 5는 임상 검증 실험 중 case 1환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서 동일하게 확인되고 normal control에서는 관찰되지 않음을 보여주는 결과이다.
도 6은 case 1 환자의 원발암 조직에서 KRAS 변이가 검출 (36%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 19%, 6% 검출되는 결과를 확인한 도이다.
도 7 및 도 8은 임상 검증 실험 중 case 2환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 동일하게 확인되고 normal control에서는 관찰되지 않음을 보여주는 결과이다.
도 9은 case 2 환자의 원발암 조직에서 TP53 변이가 검출 (45%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 2%, 0% 검출되는 결과를 확인한 도이다.
도 10은 case 2 환자의 원발암 조직에서 SMARCA4 변이가 검출 (27%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 5%, 2% 검출되는 결과를 확인한 도이다.
본 발명은 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법 및 이를 이용한 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법에 관한 것이다.
본 발명에 따르면, 암 환자의 원발암 조직에서 미리 확인된 구조 변이를 이용하여 치료 후 암 환자의 cfDNA에 존재하는 구조 변이 서열을 높은 민감도로 빠르게 비교 분석할 수 있어, 치료 후 환자에 잔존하는 암 세포를 모니터링하고 암 치료 경과 및 예후, 재발 가능성 등에 대한 정보를 제공할 수 있다.
이하, 본 발명에 대하여 상세히 설명한다.
본 발명은 1) 환자 유래 암 조직의 WGS를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법에 관한 것이다.
본 발명의 1) 단계는 원발암 시료의 공통 (consensus) 구조 변이 데이터를 얻는 단계이며, 환자 유래 암 조직의 WGS 및 정상 대조군의 WGS를 2가지 이상의 구조 변이 분석 데이터로 분석한다.
상기 단계에서는 보다 정확한 환자의 구조 변이 데이터를 얻기 위하여 2가지 이상의 구조 변이 분석 소프트웨어를 이용하는 것을 특징으로 한다. 해당 단계에서는 암 환자에서 수득된 암 조직, 즉 원발암 시료 및 정상 대조군을 이용하여 WGS 및 정렬 (alignment)을 수행하고, 이를 통해 시퀀싱 리드들이 어떤 염색체의 어느 위치에 있는 DNA 인지 표준 유전체 (reference genome) 상에서 위치를 확인하는 매핑 (Mapping) 이 수행된다. 매핑을 완료하면 각 시퀀싱 리드에 대하여 표준 유전체 상의 염색체 번호 및 위치 정보가 제공되며, 이를 포함하는 정렬된 염기 조각인 BAM(binary alignment map) 포맷을 얻을 수 있다. 제1 구조 변이 분석 소프트웨어를 이용하여, 수득된 종양 조직 유래 '종양 BAM' 파일과 '대조군 BAM' 파일에서 각 시퀀싱 리드를 비교 분석하여 특정 위치에 표준 유전체 서열과 다른 구조 변이가 일어난 변이체의 존재를 확인하기 위한 '구조 변이 호출 (Structural variant call, SV call)' 이 수행되며, 이를 통해 '제 1 구조 변이 위치 데이터'를 수득할 수 있다.
이어서 본 발명의 '공통 (consensus) 구조 변이 위치 데이터'를 수득하기 위하여, 제 2 구조변이 분석 소프트웨어를 이용하여 구조 변이 호출을 수행한다. 이때 공통 구조변이를 빠르게 확인하기 위해, 제1 구조 변이 분석 소프트웨어를 이용하여 수득된 '제1 구조 변이 위치 데이터'를 제2 구조 변이 분석 소프트웨어에 입력하여 구조 변이 호출을 수행할 수 있다.
즉, 본 발명에 있어서, '공통(consensus) 구조 변이 위치 데이터'란 복수 개의 구조 변이 분석 소프트웨어를 통한 SV call 에서 공통적으로 존재하는 것으로 확인된 구조 변이 위치에 대한 정보를 의미한다.
상기 1) 단계는 암환자의 원발암 시료에 존재하는 구조 변이에 대한 DB 를 구축하기 위한 목적으로 이용되는 것일 수 있으며, 이와 같이 한번 획득된 공통 구조 변이 위치 데이터는 향후 다양한 시점에서 획득한 동일 암 환자의 cfDNA 구조 변이와의 비교 분석에 모니터링 목적으로 반복 활용될 수 있다.
본 발명에 사용되는 구조 변이 분석 소프트웨어는 당 분야에서 전장 유전체 분석을 통해 체세포 구조 변이를 검출할 수 있는 것으로 알려진 다양한 종류의 소프트웨어를 제한없이 사용할 수 있으며, 예컨대 DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra, CNVnator 및 JuLI 로 이루어진 군에서 선택되는 2종 이상을 사용할 수 있다. 상기 2종 이상의 분석 소프트웨어는 순차적으로 사용될 수 있고, 제1 WGS 분석 소프트웨어는 SV call 을 통해 각 시퀀싱 리드를 분석하여 특정 위치에 표준 유전체 서열과 다른 구조 변이가 일어난 변이체의 존재를 확인하고, '제1 구조 변이 위치 데이터'를 제공한다. 이후 제2 WGS 분석 소프트웨어에 제1 WGS 분석 소프트웨어에서 수득된 제1 구조 변이 위치 데이터를 VCF, BED format 등 으로 입력하고, 분석 대상인 종양 BAM 파일을 입력하면, 미리 확인된 제1 구조 변이 위치 데이터를 기반으로 신속하게 2종의 WGS 분석 소프트웨어에서 공통적으로 존재하는 '공통 구조 변이 위치 데이터'를 수득할 수 있다. WGS 분석 소프트웨어의 선택은 이에 제한되는 것은 아니나, 제1 WGS 분석 소프트웨어는 많은 정보량을 신속하게 처리할 수 있는 소프트웨어를 선택하는 것이 바람직하고, 본 발명에서는 바람직한 일 예로 DELLY (Version: 0.8.7, https://github.com/dellytools/delly)를 이용하였다. 또한 DELLY 에서 제공된 제 1 구조 변이 위치 데이터를 기반으로 신속하게 공통 구조 변이를 탐색하는 제2 WGS 분석 소프트웨어로 공개 소프트웨어인 JuLI(https://github.com/sgilab/JuLI, J Mol Diagn. 2020 Mar;22(3):304-318) 를 이용하였다.
따라서 본 발명의 상기 1) 단계는 1-1) DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra 및 CNVnator 로 이루어진 군에서 선택된 1종의 분석 소프트웨어로 원발암 시료의 제 1 구조 변이 위치 데이터를 얻는 단계; 및 1-2) 상기 1-1) 단계에서 수득된 제 1 구조 변이 위치 데이터를 JuLI 에 입력하여 공통적으로 확인되는 원발암 시료의 공통(consensus) 구조 변이 위치 데이터를 얻는 단계; 를 순차적으로 수행하는 것을 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이를 검출하는 방법일 수 있다.
또한 본 발명은 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계;를 포함한다.
본 발명은 암종에 상관없이 범용적으로 cfDNA 시료에 존재하는 적은 수의 구조 변이를 높은 민감도로 검출할 수 있음을 특징으로 한다. 본 발명에서 상기 cfDNA는 암 환자의 뇌척수액, 흉수, 심낭액, 복수, 소변, 전혈, 혈장 또는 혈청 유래의 cfDNA 일 수 있으나, 이에 제한되지 않는다.
본 발명은 통상적인 변이 검출 방법들과 마찬가지로, 검출 민감도는 sequencing depth에 따라 조절할 수 있다.
한편 상기 2) 단계의 분석 대상이 되는 암 환자의 cfDNA 는 암 치료 중 또는 암 치료 후의 환자에서 수득되는 것일 수 있다. 본 발명에서는 상기 1) 단계에서 암 환자의 원발암 조직 내 존재하는 공통 구조 변이 위치에 대한 DB를 구축하고, 이후 환자가 암 치료를 받는 중 또는 받은 후, 환자의 cfDNA 내 구조 변이 위치 서열과 비교함으로써, 치료 후 환자에 남아있는 미세한 수준의 잔존 암 세포에 대한 정보를 제공할 수 있다.
보다 구체적으로 상기 2) 단계는 다음과 같다: 먼저 암 환자의 cfDNA (Cell-free DNA) 를 WGS 및 정렬하여 수득된 각 시퀀싱 리드에 대하여 표준 유전체 상의 염색체 번호 및 위치 정보가 기록된 cfDNA BAM(binary alignment map) 포맷, 즉 cfDNA 매핑(mapping) 데이터를 얻는다. 이후 수득된 cfDNA 매핑 데이터인 cfDNA BAM 파일을 1) 단계에서 수득된 공통 구조 변이 위치 데이터와 함께 구조 변이 분석 소프트웨어에 입력하고, 지지 리드 콜 (supporting read call) 을 수행하여, 1) 단계에서 확인된 공통 구조 변이 위치에서 대응 참조 서열(counter reference sequence) 과 함께 상기 지지 리드들을 정렬함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계이다.
상기 대응 참조 서열은 표준 유전체 데이터와 동일한 의미로 사용될 수 있으며, hg19 또는 hg38 등 일 수 있다.
본 발명의 방법은 암 종과 상관없이 모든 암에 범용적으로 사용할 수 있으며, 기존 영상이나 혈액 검사, 표적화 고속 시퀀싱 (targeted high-depth sequencing) 방법과 달리, 암 종류에 따라 검사 항목이나 사전 디자인을 해야 하는 별도의 공정을 수반하지 않는다. 따라서 본 발명의 대상이 되는 암은 당 분야에 공지된 암 종을 제한없이 포함할 수 있고, 예컨대 위암, 폐암, 비소세포성 폐암, 유방암, 난소암, 간암, 기관지암, 비인두암, 후두암, 췌장암, 방광암, 대장암, 결장암, 자궁경부암, 골암, 비소세포성 골암, 혈액암, 피부암(흑색종 등), 두부 또는 경부 암, 자궁암, 직장암, 항문 부근암, 결장암, 나팔관암, 자궁내막암, 질암, 음문암, 호지킨병(Hodgkin's disease), 식도암, 소장암, 내분비선암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 전립선암, 만성 또는 급성 백혈병, 림프구 림프종, 신장 또는 수뇨관암, 신장세포 암종, 신장골반암종, 배수성암(polyploid carcinoma), 침샘암, 육종암, 가성점액종, 간모세포종, 고환암, 교모세포종, 구순암, 난소생식세포종양, 기저세포암, 다발성골수종, 담낭암, 맥락막흑색종, 바터팽대부암, 복막암, 부신암, 설암, 소세포암, 소아림프종, 신경모세포종, 십이지장암, 요관암, 성상세포종, 수막종, 신우암, 외음부암, 흉선암, 중추신경계(central nervous system, CNS) 종양, 1차 중추신경계 림프종, 척수종양, 뇌간 신경교종 또는 뇌하수체 선종일 수 있다.
본 발명에 있어서, 검출 대상이 되는 구조 변이는 체세포 구조 변이일 수 있고, 유전자의 복제, 결실, 전좌 및 삽입으로 이루어진 군에서 선택된 1종 이상일 수 있으며, 비교 대상인 대응 참조 서열과 비교하여 서열상 특이적인 차이를 보이는 것을 말한다. 대부분의 암은 암 발생 초기에 수십개에서 수백개의 구조 변이가 발생하며, 암이 진행되는 동안 이러한 구조 변이가 유지된다. 암 세포에서는 세포자멸사에 의하여 혈중에 cfDNA 가 흘러나오게 되며, 혈중에 존재하는 cfDNA에서 암 세포에서 발견된 구조 변이 서열이 확인된다면, 환자의 몸 속에 암이 잔존하고 있고, 미세잔존질환을 유발할 가능성이 있음을 진단할 수 있다. 따라서, 본 발명의 검출 대상이 되는 구조 변이 서열은, 환자의 암세포에 존재하는 것으로 확인된 구조 변이 중 cfDNA에 존재하는 구조 변이의 서열이다.
본 발명의 또다른 양태로, 본 발명은 1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법을 제공한다.
본 발명에 있어, 미세잔존질환이란, 최소 잔류 질병이라고도 하며 치료 중이나 치료를 완료한 환자에 남아있는 소수의 악성 세포가 분자적으로 검출되는 상태를 의미한다. 미세잔존질환은 다양한 혈액암과 고형암의 추적 관찰 대상이 되며, 미세잔존질환을 확인하여 환자의 치료에 대한 반응성을 확인하고 재발의 위험을 예측할 수 있다. 따라서 본 발명의 미세잔존질환에 대한 정보는 치료 중 또는 치료 후에 잔존하는 암세포 유무, 암 재발 가능성 또는 암 치료 예후에 대한 정보일 수 있다. 만약 본 발명의 방법을 수행하여, 환자의 cfDNA 시료에서 원발암 시료에서 확인된 구조 변이 서열이 확인되는 경우, 이 환자는 암 세포가 잔존하거나, 치료에 대한 반응성이 낮거나, 재발의 위험이 높거나, 또는 암 치료 후 예후가 나쁠 것으로 예측할 수 있다.
본 발명에서 암 환자의 치료는 방사선 요법, 면역요법, 호르몬 요법, 화학요법 치료 또는 외과적 절제 치료 등 당 분야에 공지된 치료법을 모두 제한없이 포함한다.
또한 본 발명은 환자 자신의 원발암 공통 구조 변이와 치료 이후 cfDNA 구조 변이 서열를 비교하여 미세잔존질환에 대한 정보를 제공하므로, 환자 맞춤형 정보 제공 방법으로 활용될 수 있다.
본 발명을 이용하면, 매우 낮은 순도의 cfDNA를 포함하는 치료 후 환자의 혈액, 혈장 또는 혈청 유래 시료에서도 높은 민감도로 구조 변이 서열을 검출할 수 있다. 본 발명의 일 구현예에서는 1:12,800까지 희석된 시료에서도 충분한 수의 지지 리드를 확인할 수 있고 이를 통해 환자 cfDNA 시료의 구조 변이 서열을 확인하여 미세잔존질환에 대한 정보를 제공할 수 있음을 확인하였다.
본 발명의 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법 및 미세잔존질환에 대한 정보를 제공하는 방법은 모두 컴퓨터 시스템에 의해 in silico 로 수행되는 것인 방법일 수 있다. 따라서 염기서열 변이 정보는 컴퓨터 시스템을 통하여 접수/수득될 수 있으며, 이런 측면에서 본 발명의 방법은 유전자 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함할 수 있다.
상술한 본 발명의 내용은 상호 모순되지 않는 한, 서로 동일하게 적용되며, 당해 기술분야의 통상의 기술자가 적절한 변경을 가해 실시하는 것 또한 본 발명의 범주에 포함된다.
이하 본 발명을 실시예를 통해 상세하게 설명하나 본 발명의 범위가 하기 실시예로만 한정되는 것은 아니다.
실시예 1. 혈장 cfDNA 내 구조 변이 특이 서열 검출 방법 구축
암환자의 혈장 cfDNA 내 구조 변이 특이 서열을 확인하기 위하여, 다음의 2 단계로 이루어진 프로세스를 구축하였다:
1. 환자의 공통 (consensus) 구조 변이 확인 단계
환자가 가진 공통 (consensus) 구조 변이를 찾기 위하여, 2가지 종류의 분석툴을 이용하였다. 환자 유래의 암 조직과 대조군 시료를 이용하여 WGS을 수행한 후 BWA 의 default setting으로 정렬(alignment)을 수행하였다. 분석툴로는 DNA 체세포 변이, DNA 융합을 검출할 수 있는 구조 변이 검출 소프트웨어인 JuLI(https://github.com/sgilab/JuLI)와 다른 구조변이 검출 소프트웨어인 DELLY (DELLY Version: 0.8.7, https://github.com/dellytools/delly) 를 활용하였다. 1차적으로 DELLY를 통해 종양 BAM 및 대조군 BAM 파일을 이용한 구조 변이 호출을 수행하여 환자의 원발암 시료에 존재하는 구조 변이 위치(제 1구조 변이 위치 데이터)를 확인하였다. 확인된 환자 구조 변이 위치 결과를 BED 포맷으로 JuLI 에 입력하고, 종양 BAM 파일을 입력한 후 구조 변이 호출를 수행하여 DELLY 와 JuLI 에서 공통적으로 구조 변이가 의심되는 위치를 확인하여 공통 (consensus) 구조 변이 위치 데이터를 얻었다. 확인된 공통 구조 변이 위치 데이터를 이후 2단계의 JuLI output 포맷 형태로 활용하였다.
2. 지지 리드 검출을 통한 cfDNA 구조 변이 서열 검출 단계
암 발생 이후 환자에서 혈장 시료를 수득한 후, 해당 시료에서 DNA를 추출하여 WGS 분석을 수행한 후 BWA 의 default setting으로 정렬(alignment)을 수행하여 cfDNA BAM 파일을 수득하였다. 상기 1 단계를 통해 확보한 공통 구조 변이 위치와 동일한 위치에 구조 변이 특이 서열을 의미하는 지지 리드(supporting read) 가 있는지 cfDNA BAM 파일에서 확인하기 위하여 JuLI 프로그램의 'callread' 함수를 적용하였다. 'callread' 함수를 이용하면, 공통(consensus) 구조 변이 위치에서 hg19 또는 hg38과 같은 대응 참조 서열(counter reference sequence)과 각 지지 리드의 비교를 통해 구조 변이에 의해 발생한 특이 서열을 매칭할 수 있다. 이때, JuLI 파라미터 중 splitratio의 default 값을 조정하면 특이도를 조절할 수 있으며 0.95 로 설정하여 특이도를 높였다.
이러한 방법을 이용하면, 적은 수의 리드 존재만으로도 확인하고자 하는 fusion site 에서 공통 구조 변이를 서포팅하는 특이 서열을 가진 cfDNA 구조 변이 지지 리드가 있는지 높은 민감도로 검출할 수 있다.
상기 2단계로 이루어진 본 발명의 혈장 cfDNA 내 구조 변이 서열 검출 방법의 흐름도를 도 1에 나타내었고, 2 단계의 대응 참조서열과 지지 리드의 비교를 도 2에 모식화하여 나타내었다.
실험예 1. 분석 검증
이하에서는 실제 환자의 시료와 세포주를 이용한 분석 검증 결과를 설명한다.
1.1 분석 시료의 준비
cfDNA 에 존재하는 DNA 구조 변이를 확인하기 위하여, 다음과 같은 시료를 준비하였다. 분석 검증 실험을 위하여 암세포 및 표준 물질을 시료로 이용하였다. 변이 정의를 수행함에 있어, 표준 물질로 NA12878를 지정하였고, 이를 기반으로 구조 변이를 비교 검출하였다. NA 12878는 Coriell institute에서 구매하여 사용하였다. 5개의 암세포 주 (WM2664, A375, SNU16, HCC1954, HCC95)는 한국 세포주은행에서 구입하여 사용하였다.
NA12878의 DNA와 5개의 암세포 주 (WM2664, A375, SNU16, HCC1954, HCC95)에서 채취한 DNA를 일반적인 cfDNA 절편 사이즈로 알려져 있는 150 내지 170bp 로 sharing 하였다. 5종 암세포주를 각각 10ng/ul 로 희석하고 동일 부피 50 ul로 혼합하여 최종 10ng/ul, 250ul 의 혼합 시료를 준비하여 초기 시료로 준비하였다. NA 12878 의 초기 시료량은 50 ng/ul 이다. 이후 이들 5종의 암세포 혼합 시료와 NA 12878 혼합 비율을 cell line: NA12878 = 1:100, 1:200, 1:400, 1:800, 1:1600, 1:3200, 1:6400 및 1:12800 로 달리하여 제조하고 본 발명의 민감도를 확인하기 위한 실험에 이용하였고, 모든 실험은 3회 반복 수행하였다.
환자의 임상 시료는 인하대병원에 내원한 전이성 폐암 환자로부터 각각 FFPE (Formalin Fixed Paraffin Embedded) 암 조직, 혈액 buffy coat (control tissue) 를 얻었으며, 다른 시점에서 채취한 혈장 샘플을 준비하여 cfDNA 를 채취하였다.
1.2 세포주 혼합 실험을 이용한 분석 검증 (Analytical validation)
실시예 1의 방법을 이용한 분석 검증을 수행하였다. 먼저 NA 12878 와 5개의 암세포 주 (WM2664, A375, SNU16, HCC1954, HCC95), 및 이들의 혼합 시료를, cell line: NA12878 = 1:100, 1:200, 1:400, 1:800, 1:1600, 1:3200, 1:6400 및 1:12800 로 혼합 비율을 달리하여 3회 반복 분석한 결과를 표 1 내지 표 8에 나타내었다. 각 표는 5종의 암 세포주에서 구조 변이 검출을 3회 반복한 값을 나타내며, 동일한 Sample ID 는 하나의 BAM 파일을 의미한다. CD_21_16908 내지 CD_21_16912는 다음과 같이 각 암 세포주에 대응되는 데이터이다: CD_21_16908 (A375SM), CD_21_16909 (HCC95), CD_21_16910 (HCC1954), CD_21_16911 (SNU16), CD_21_16912 (WM2664). 암 세포주는 평균 22X 로 데이터가 생산되었고, 혼합 시료는 평균 70X로 데이터를 생산하였다. 각 세포주의 변이가 레퍼런스로만 된 WGS에서 검출되는지 확인한 데이터는 표 9에 나타내었다.
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:100 CD_21_17603_CL_D_SRG_1 WGS_60X - 1st 171 89 162
CD_21_16909 1:100 CD_21_17603_CL_D_SRG_1 WGS_60X - 1st 292 130 239
CD_21_16910 1:100 CD_21_17603_CL_D_SRG_1 WGS_60X - 1st 475 277 847
CD_21_16911 1:100 CD_21_17603_CL_D_SRG_1 WGS_60X - 1st 194 115 689
CD_21_16912 1:100 CD_21_17603_CL_D_SRG_1 WGS_60X - 1st 247 131 251
CD_21_16908 1:100 CD_22_06205_CL_D_SRG_1 WGS_60X - 2nd 171 51 87
CD_21_16909 1:100 CD_22_06205_CL_D_SRG_1 WGS_60X - 2nd 292 84 158
CD_21_16910 1:100 CD_22_06205_CL_D_SRG_1 WGS_60X - 2nd 475 181 407
CD_21_16911 1:100 CD_22_06205_CL_D_SRG_1 WGS_60X - 2nd 194 80 382
CD_21_16912 1:100 CD_22_06205_CL_D_SRG_1 WGS_60X - 2nd 247 79 118
CD_21_16908 1:100 CD_22_10086_CL_D_SRG_1 WGS_60X - 3rd 171 64 110
CD_21_16909 1:100 CD_22_10086_CL_D_SRG_1 WGS_60X - 3rd 292 83 137
CD_21_16910 1:100 CD_22_10086_CL_D_SRG_1 WGS_60X - 3rd 475 170 442
CD_21_16911 1:100 CD_22_10086_CL_D_SRG_1 WGS_60X - 3rd 194 76 396
CD_21_16912 1:100 CD_22_10086_CL_D_SRG_1 WGS_60X - 3rd 247 79 109
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:200 CD_21_17605_CL_D_SRG_1 WGS_60X - 1st 171 18 23
CD_21_16909 1:200 CD_21_17605_CL_D_SRG_1 WGS_60X - 1st 292 49 71
CD_21_16910 1:200 CD_21_17605_CL_D_SRG_1 WGS_60X - 1st 475 100 197
CD_21_16911 1:200 CD_21_17605_CL_D_SRG_1 WGS_60X - 1st 194 45 194
CD_21_16912 1:200 CD_21_17605_CL_D_SRG_1 WGS_60X - 1st 247 46 71
CD_21_16908 1:200 CD_22_06207_CL_D_SRG_1 WGS_60X - 2nd 171 23 38
CD_21_16909 1:200 CD_22_06207_CL_D_SRG_1 WGS_60X - 2nd 292 45 60
CD_21_16910 1:200 CD_22_06207_CL_D_SRG_1 WGS_60X - 2nd 475 94 192
CD_21_16911 1:200 CD_22_06207_CL_D_SRG_1 WGS_60X - 2nd 194 44 182
CD_21_16912 1:200 CD_22_06207_CL_D_SRG_1 WGS_60X - 2nd 247 38 56
CD_21_16908 1:200 CD_22_10087_CL_D_SRG_1 WGS_60X - 3rd 171 42 64
CD_21_16909 1:200 CD_22_10087_CL_D_SRG_1 WGS_60X - 3rd 292 60 86
CD_21_16910 1:200 CD_22_10087_CL_D_SRG_1 WGS_60X - 3rd 475 139 290
CD_21_16911 1:200 CD_22_10087_CL_D_SRG_1 WGS_60X - 3rd 194 67 299
CD_21_16912 1:200 CD_22_10087_CL_D_SRG_1 WGS_60X - 3rd 247 69 108
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:400 CD_21_17606_CL_D_SRG_1 WGS_60X - 1st 171 7 11
CD_21_16909 1:400 CD_21_17606_CL_D_SRG_1 WGS_60X - 1st 292 34 41
CD_21_16910 1:400 CD_21_17606_CL_D_SRG_1 WGS_60X - 1st 475 60 108
CD_21_16911 1:400 CD_21_17606_CL_D_SRG_1 WGS_60X - 1st 194 30 92
CD_21_16912 1:400 CD_21_17606_CL_D_SRG_1 WGS_60X - 1st 247 25 32
CD_21_16908 1:400 CD_22_06208_CL_D_SRG_1 WGS_60X - 2nd 171 14 18
CD_21_16909 1:400 CD_22_06208_CL_D_SRG_1 WGS_60X - 2nd 292 24 27
CD_21_16910 1:400 CD_22_06208_CL_D_SRG_1 WGS_60X - 2nd 475 68 113
CD_21_16911 1:400 CD_22_06208_CL_D_SRG_1 WGS_60X - 2nd 194 30 91
CD_21_16912 1:400 CD_22_06208_CL_D_SRG_1 WGS_60X - 2nd 247 25 35
CD_21_16908 1:400 CD_22_10088_CL_D_SRG_1 WGS_60X - 3rd 171 16 23
CD_21_16909 1:400 CD_22_10088_CL_D_SRG_1 WGS_60X - 3rd 292 26 36
CD_21_16910 1:400 CD_22_10088_CL_D_SRG_1 WGS_60X - 3rd 475 70 130
CD_21_16911 1:400 CD_22_10088_CL_D_SRG_1 WGS_60X - 3rd 194 26 114
CD_21_16912 1:400 CD_22_10088_CL_D_SRG_1 WGS_60X - 3rd 247 28 38
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:800 CD_21_17607_CL_D_SRG_1 WGS_60X - 1st 171 5 11
CD_21_16909 1:800 CD_21_17607_CL_D_SRG_1 WGS_60X - 1st 292 7 9
CD_21_16910 1:800 CD_21_17607_CL_D_SRG_1 WGS_60X - 1st 475 20 35
CD_21_16911 1:800 CD_21_17607_CL_D_SRG_1 WGS_60X - 1st 194 11 33
CD_21_16912 1:800 CD_21_17607_CL_D_SRG_1 WGS_60X - 1st 247 9 10
CD_21_16908 1:800 CD_22_06209_CL_D_SRG_1 WGS_60X - 2nd 171 6 8
CD_21_16909 1:800 CD_22_06209_CL_D_SRG_1 WGS_60X - 2nd 292 13 18
CD_21_16910 1:800 CD_22_06209_CL_D_SRG_1 WGS_60X - 2nd 475 27 49
CD_21_16911 1:800 CD_22_06209_CL_D_SRG_1 WGS_60X - 2nd 194 21 68
CD_21_16912 1:800 CD_22_06209_CL_D_SRG_1 WGS_60X - 2nd 247 12 15
CD_21_16908 1:800 CD_22_10089_CL_D_SRG_1 WGS_60X - 3rd 171 5 9
CD_21_16909 1:800 CD_22_10089_CL_D_SRG_1 WGS_60X - 3rd 292 11 17
CD_21_16910 1:800 CD_22_10089_CL_D_SRG_1 WGS_60X - 3rd 475 27 49
CD_21_16911 1:800 CD_22_10089_CL_D_SRG_1 WGS_60X - 3rd 194 21 65
CD_21_16912 1:800 CD_22_10089_CL_D_SRG_1 WGS_60X - 3rd 247 9 9
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:1600 CD_21_17604_CL_D_SRG_1 WGS_60X - 1st 171 4 4
CD_21_16909 1:1600 CD_21_17604_CL_D_SRG_1 WGS_60X - 1st 292 8 10
CD_21_16910 1:1600 CD_21_17604_CL_D_SRG_1 WGS_60X - 1st 475 11 23
CD_21_16911 1:1600 CD_21_17604_CL_D_SRG_1 WGS_60X - 1st 194 8 29
CD_21_16912 1:1600 CD_21_17604_CL_D_SRG_1 WGS_60X - 1st 247 6 9
CD_21_16908 1:1600 CD_22_06206_CL_D_SRG_1 WGS_60X - 2nd 171 5 5
CD_21_16909 1:1600 CD_22_06206_CL_D_SRG_1 WGS_60X - 2nd 292 2 2
CD_21_16910 1:1600 CD_22_06206_CL_D_SRG_1 WGS_60X - 2nd 475 15 23
CD_21_16911 1:1600 CD_22_06206_CL_D_SRG_1 WGS_60X - 2nd 194 12 31
CD_21_16912 1:1600 CD_22_06206_CL_D_SRG_1 WGS_60X - 2nd 247 10 11
CD_21_16908 1:1600 CD_22_10090_CL_D_SRG_1 WGS_60X - 3rd 171 3 3
CD_21_16909 1:1600 CD_22_10090_CL_D_SRG_1 WGS_60X - 3rd 292 5 6
CD_21_16910 1:1600 CD_22_10090_CL_D_SRG_1 WGS_60X - 3rd 475 17 26
CD_21_16911 1:1600 CD_22_10090_CL_D_SRG_1 WGS_60X - 3rd 194 12 27
CD_21_16912 1:1600 CD_22_10090_CL_D_SRG_1 WGS_60X - 3rd 247 10 11
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:3200 CD_22_10091_CL_D_SRG_1 WGS_60_high dilution - 1st 171 5 5
CD_21_16909 1:3200 CD_22_10091_CL_D_SRG_1 WGS_60_high dilution - 1st 292 2 2
CD_21_16910 1:3200 CD_22_10091_CL_D_SRG_1 WGS_60_high dilution - 1st 475 9 12
CD_21_16911 1:3200 CD_22_10091_CL_D_SRG_1 WGS_60_high dilution - 1st 194 10 14
CD_21_16912 1:3200 CD_22_10091_CL_D_SRG_1 WGS_60_high dilution - 1st 247 3 5
CD_21_16908 1:3200 CD_22_10094_CL_D_SRG_1 WGS_60_high dilution - 2nd 171 2 3
CD_21_16909 1:3200 CD_22_10094_CL_D_SRG_1 WGS_60_high dilution - 2nd 292 7 9
CD_21_16910 1:3200 CD_22_10094_CL_D_SRG_1 WGS_60_high dilution - 2nd 475 14 19
CD_21_16911 1:3200 CD_22_10094_CL_D_SRG_1 WGS_60_high dilution - 2nd 194 11 19
CD_21_16912 1:3200 CD_22_10094_CL_D_SRG_1 WGS_60_high dilution - 2nd 247 4 5
CD_21_16908 1:3200 CD_22_10097_CL_D_SRG_1 WGS_60_high dilution - 3rd 171 1 1
CD_21_16909 1:3200 CD_22_10097_CL_D_SRG_1 WGS_60_high dilution - 3rd 292 2 2
CD_21_16910 1:3200 CD_22_10097_CL_D_SRG_1 WGS_60_high dilution - 3rd 475 13 17
CD_21_16911 1:3200 CD_22_10097_CL_D_SRG_1 WGS_60_high dilution - 3rd 194 5 7
CD_21_16912 1:3200 CD_22_10097_CL_D_SRG_1 WGS_60_high dilution - 3rd 247 1 1
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:6400 CD_22_10092_CL_D_SRG_1 WGS_60_high dilution - 1st 171 2 2
CD_21_16909 1:6400 CD_22_10092_CL_D_SRG_1 WGS_60_high dilution - 1st 292 0 0
CD_21_16910 1:6400 CD_22_10092_CL_D_SRG_1 WGS_60_high dilution - 1st 475 3 4
CD_21_16911 1:6400 CD_22_10092_CL_D_SRG_1 WGS_60_high dilution - 1st 194 9 12
CD_21_16912 1:6400 CD_22_10092_CL_D_SRG_1 WGS_60_high dilution - 1st 247 1 1
CD_21_16908 1:6400 CD_22_10095_CL_D_SRG_1 WGS_60_high dilution - 2nd 171 1 2
CD_21_16909 1:6400 CD_22_10095_CL_D_SRG_1 WGS_60_high dilution - 2nd 292 2 2
CD_21_16910 1:6400 CD_22_10095_CL_D_SRG_1 WGS_60_high dilution - 2nd 475 8 13
CD_21_16911 1:6400 CD_22_10095_CL_D_SRG_1 WGS_60_high dilution - 2nd 194 2 2
CD_21_16912 1:6400 CD_22_10095_CL_D_SRG_1 WGS_60_high dilution - 2nd 247 1 1
CD_21_16908 1:6400 CD_22_10098_CL_D_SRG_1 WGS_60_high dilution - 3rd 171 2 3
CD_21_16909 1:6400 CD_22_10098_CL_D_SRG_1 WGS_60_high dilution - 3rd 292 4 5
CD_21_16910 1:6400 CD_22_10098_CL_D_SRG_1 WGS_60_high dilution - 3rd 475 4 8
CD_21_16911 1:6400 CD_22_10098_CL_D_SRG_1 WGS_60_high dilution - 3rd 194 5 12
CD_21_16912 1:6400 CD_22_10098_CL_D_SRG_1 WGS_60_high dilution - 3rd 247 4 4
Cell-line 5MIX+NA12878 혼합비율 Sample ID Remark Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 1:12800 CD_22_10093_CL_D_SRG_1 WGS_60_high dilution - 1st 171 2 2
CD_21_16909 1:12800 CD_22_10093_CL_D_SRG_1 WGS_60_high dilution - 1st 292 0 0
CD_21_16910 1:12800 CD_22_10093_CL_D_SRG_1 WGS_60_high dilution - 1st 475 5 8
CD_21_16911 1:12800 CD_22_10093_CL_D_SRG_1 WGS_60_high dilution - 1st 194 3 3
CD_21_16912 1:12800 CD_22_10093_CL_D_SRG_1 WGS_60_high dilution - 1st 247 0 0
CD_21_16908 1:12800 CD_22_10096_CL_D_SRG_1 WGS_60_high dilution - 2nd 171 2 2
CD_21_16909 1:12800 CD_22_10096_CL_D_SRG_1 WGS_60_high dilution - 2nd 292 1 1
CD_21_16910 1:12800 CD_22_10096_CL_D_SRG_1 WGS_60_high dilution - 2nd 475 1 2
CD_21_16911 1:12800 CD_22_10096_CL_D_SRG_1 WGS_60_high dilution - 2nd 194 3 4
CD_21_16912 1:12800 CD_22_10096_CL_D_SRG_1 WGS_60_high dilution - 2nd 247 1 1
CD_21_16908 1:12800 CD_22_10099_CL_D_SRG_1 WGS_60_high dilution - 3rd 171 0 0
CD_21_16909 1:12800 CD_22_10099_CL_D_SRG_1 WGS_60_high dilution - 3rd 292 1 2
CD_21_16910 1:12800 CD_22_10099_CL_D_SRG_1 WGS_60_high dilution - 3rd 475 5 5
CD_21_16911 1:12800 CD_22_10099_CL_D_SRG_1 WGS_60_high dilution - 3rd 194 0 0
CD_21_16912 1:12800 CD_22_10099_CL_D_SRG_1 WGS_60_high dilution - 3rd 247 1 1
Cell-line reference Sample ID Total fusion number of each cell-line cfDNA Fusion Number Reads Count
CD_21_16908 NA12878 CD_22_06210_ET_D_SRG_1 171 0 0
CD_21_16909 NA12878 CD_22_06210_ET_D_SRG_1 292 0 0
CD_21_16910 NA12878 CD_22_06210_ET_D_SRG_1 475 0 0
CD_21_16911 NA12878 CD_22_06210_ET_D_SRG_1 194 0 0
CD_21_16912 NA12878 CD_22_06210_ET_D_SRG_1 247 0 0
암 세포주에 존재하는 구조 변이수를 의미하는 'Total fusion number of each cell-line (실시예 1의 원발암 시료 구조 변이에 대응)'은 각 암종에서 다른 세포주에 중복으로 존재하는 germline구조 변이를 제거한 후 각각 171, 292, 475, 194, 247 개였으며, 표 1 내지 표 8에 나타낸 바와 같이, 각 암세포주에 존재하는 구조 변이가 cfDNA BAM파일에서도 검출(cfDNA Fusion Number)되고, 이를 서포팅하는 지지 리드가 확인되었다 (reads count). 또한, 세포주가 섞이지 않은 레퍼런스 WGS에서는 각 세포주의 구조 변이 서열이 검출되지 않음을 확인하였다 (표9).
세포주를 이용한 실험의 민감도와 특이도를 정리한 결과를 표 10 및 도 3에 나타내었다.
Cancer cell purity Detected/Total Sensitivity
NA12878 + 5 cancer cell lines (1:100): 3 replicates 1.0000% 15/15 100.0%
NA12878 + 5 cancer cell lines (1:200): 3 replicates 0.5000% 15/15 100.0%
NA12878 + 5 cancer cell lines (1:400): 3 replicates 0.2500% 15/15 100.0%
NA12878 + 5 cancer cell lines (1:800): 3 replicates 0.1250% 15/15 100.0%
NA12878 + 5 cancer cell lines (1:1600): 3 replicates 0.0625% 15/15 100.0%
NA12878 + 5 cancer cell lines (1:3200): 3 replicates 0.0313% 15/15 100.0%
NA12878 + 5 cancer cell lines (1:6400): 3 replicates 0.0156% 14/15 93.3%
NA12878 + 5 cancer cell lines (1:12800): 3 replicates 0.0078% 11/15 73.3%
Cancer cell purity Not detected/Total Specificity
NA12878 0.0000% 5/5 100.0%
표 10에 정리된 바와 같이, 희석 배율을 높일수록 지지 리드의 수는 점차 감소하는 경향을 나타냈지만, 1:12,800까지 희석하더라도 구조 변이 서열을 확인할 수 있는 서포트 서열이 확인되고 약 73.3%의 높은 민감도로 검출할 수 있음을 확인하였다. 특히, 구조변이가 475개를 가지고 있는HCC1954의 경우 1:12,800으로 희석해도 100% 검출 할 수 있었다. 이는 본 발명의 방법을 이용하면 cfDNA 시료에 존재하는 구조 변이 서열을 매우 효과적으로 검출하여 암 환자의 미세잔존질환에 대한 정보를 제공할 수 있음을 의미한다.
1.3 임상 시료를 이용한 임상 검증 (Clinical validation)
본 발명의 방법을 이용하여 실제 환자의 혈액, cfDNA 에서도 변이를 효과적으로 검출가능한지 임상 검증 실험을 수행하였다.
시료를 환자의 원발암 조직, 혈액, 2가지 이상의 다른 시점에서 수득한 cfDNA1, cfDNA2 로 하여 실시예 1과 같은 분석 방법을 이용하였다.
각 암환자는 전이성 폐암환자이며, 각각 case1, case 2,로 기재하였다. 환자로부터 수득한 FFPE 암조직을 이용하여 약30X로 WGS 데이터가 생성되었고, 나머지 cfDNA 시료들로부터 평균 48X 정도의 WGS 데이터가 생성되었다.
구체적으로 환자의 FFPE 암조직을 시료로 하여 DELLY를 이용한 WGS 분석을 수행하고 BWA 의 default setting으로 alignment 하였으며, JuLI를 이용하여 2가지 분석툴에서 공통적으로 확인되는 환자의 공통 (consensus) 구조 변이를 확인하였다. 이를 JuLI output 포맷으로 활용하였다. 이후 서로 다른 시점에서 수득한 혈장 cfDNA샘플의 WGS에 의해 수득된BAM 파일과 상기에서 확인된 공통 (consensus) 구조 변이 데이터를 대응 참조 서열(counter reference sequence)과 비교하는 2단계 supporting read call 을 통해 cfDNA 구조 변이 서열을 확인하였다. 이를 통해 서로 다른 시점에서 수득한 환자의 혈장 내 존재하는 cfDNA 구조 변이를 보다 민감하게 검출할 수 있으므로, 환자에 남아있는 암 미세잔존질환에 대한 진단이 가능하다.
환자 Case 1
도 4 및 도 5는 Case 1의 분석결과이며, 각기 다른 시점인 2006.11.07, 2007.04.12 시점에 수득한cfDNA를 시료로 하여 구조 변이 서열을 확인한 결과를 각각 나타낸다. 도 4 및 도 5에서는 환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 동일하게 확인되는 것을 확인하였다.
본 발명의 효과를 검증하기 위하여 환자의 원발암을 패널 시퀀싱을 수행하여 암 돌연변이를 확인하고, 이를 cfDNA에서 확인하였다. 패널 시퀀싱을 통해 case 1 환자가 KRAS 변이를 약 30% 나타내는 환자임을 확인하였고, 동일 변이가 원발암, cfDNA-1 및cfDNA-2 의 WGS에서도 실제로 확인되었다. WGS에서 KRAS 변이 위치를 확인한 결과는 도6 에 나타내었다.
도 6에서는 원발암 조직에서 패널 시퀀싱과 비슷한 정도의 KRAS 변이가 검출 (36%)되는 것을 확인하였고, cfDNA-1, cfDNA-2 시료에서도 KRAS 변이가 19%, 6% 검출되어, 본 발명의 방법을 이용하면, cfDNA 시료의 구조 변이 서열 분석을 통해 미세잔존암을 확인할 수 있음을 검증하였다. 해당 환자에서 검출된 Read count 수는 하기 표 11과 같다.
cfDNA samples Tumor Fusion Number cfDNA Fusion Number ReadsCount
cfDNA-1 131 115 4122
cfDNA-2 131 112 1926
표 11에 따르면, case1 환자는 원발암 시료에서 분석한 결과 총 131개의 구조 변이 서열인 융합(fusion) 서열을 가지고 있는 환자로, 본 발명의 방법을 통해 cfDNA 에서도 구조 변이가 115 또는 112개 확인되며, 19% KRAS변이를 나타낸 cfDNA-1 시료에서 4122 개의 지지 리드, 6% KRAS 변이를 나타낸 cfDNA-2 시료에서 1926 개의 지지 리드가 확인되었다.
이는 혈장 cfDNA를 WGS 로 분석하는 종래 방법이 5% 이하의 변이는 검출하기 어려운 낮은 민감도를 나타내는 것과 비교하여, 본 발명은 6% 정도의 변이에서도 1900 개 이상의 리드를 나타내므로, 훨씬 우수한 검출능이 있음을 보여주는 결과이다.
환자 Case 2
도 7 및 도 8 는 Case 2의 분석결과이며, 각기 다른 시점인 2010.10.29, 2011.01.04 시점에 수득한cfDNA 를 시료로 하여 구조 변이 서열을 확인한 결과를 나타낸다. 도 7 및 도 8에서는 환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 확인됨을 나타낸다.
패널 시퀀싱을 통해 case 2 환자가 가지고 있는 돌연변이들을 원발암, cfDNA-1 및cfDNA-2 의 WGS에서도 실제로 확인하였고 이는 도9 및 도10에 나타내었다.
도 9에서 cfDNA-1, cfDNA-2에서 TP53변이가 각각2%, 0%, 도 10에는 SMARCA4 변이가 각각 5%, 2% 변이가 확인되었으나, 표 12에 나타낸 바와 같이, 2-5% 변이를 나타낸 cfDNA-1에서 128 개의 리드, 0-2% 변이에서 118 개의 리드가 확인되어, 2 내지 5% 이하의 낮은 대립유전자 빈도를 나타내는 시료에서도 구조 변이 존재를 나타내는 지지 리드가 충분히 검출됨을 확인하였다.
cfDNA samples Tumor Fusion Number cfDNA Fusion Number Reads Count
cfDNA-1 62 23 128
cfDNA-2 62 22 118

Claims (11)

1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및
2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 방법은 WGS의 시퀀싱 심도(depth)를 조절하여 검출 민감도를 조절하는 것을 특징으로 하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 WGS 분석 소프트웨어는 DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra, CNVnator 및 JuLI 로 이루어진 군에서 선택되는 2종 이상인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서,
상기 1) 단계는
1-1) DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra 및 CNVnator 로 이루어진 군에서 선택된 1종의 구조 변이 분석 소프트웨어로 원발암 시료의 제 1 구조 변이 위치 데이터를 얻는 단계; 및
1-2) 상기 1-1) 단계에서 수득된 제 1 구조 변이 위치 데이터를 JuLI 에 입력하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 를 순차적으로 수행하는 것을 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 cfDNA는 암 환자의 뇌척수액, 흉수, 심낭액, 복수, 소변, 전혈, 혈장 또는 혈청 유래인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 2) 단계의 암 환자의 cfDNA 는 암 치료 중 또는 암 치료 후의 환자에서 수득되는 것인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항의 구조 변이는 유전자의 복제, 결실, 전좌 및 삽입으로 이루어진 군에서 선택된 1종 이상인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 암은 위암, 폐암, 비소세포성 폐암, 유방암, 난소암, 간암, 기관지암, 비인두암, 후두암, 췌장암, 방광암, 대장암, 결장암, 자궁경부암, 골암, 비소세포성 골암, 혈액암, 피부암(흑색종 등), 두부 또는 경부 암, 자궁암, 직장암, 항문 부근암, 결장암, 나팔관암, 자궁내막암, 질암, 음문암, 호지킨병(Hodgkin's disease), 식도암, 소장암, 내분비선암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 전립선암, 만성 또는 급성 백혈병, 림프구 림프종, 신장 또는 수뇨관암, 신장세포 암종, 신장골반암종, 배수성암(polyploid carcinoma), 침샘암, 육종암, 가성점액종, 간모세포종, 고환암, 교모세포종, 구순암, 난소생식세포종양, 기저세포암, 다발성골수종, 담낭암, 맥락막흑색종, 바터팽대부암, 복막암, 부신암, 설암, 소세포암, 소아림프종, 신경모세포종, 십이지장암, 요관암, 성상세포종, 수막종, 신우암, 외음부암, 흉선암, 중추신경계(central nervous system, CNS) 종양, 1차 중추신경계 림프종, 척수종양, 뇌간 신경교종 또는 뇌하수체 선종인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및
2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법.
제9항에 있어서, 상기 미세잔존질환에 대한 정보는 치료 중 또는 치료 후에 잔존하는 암세포 유무, 암 재발 가능성 또는 암 치료 예후에 대한 정보인, 방법.
제9항에 있어서, 상기 2) 단계의 치료는 방사선 요법, 면역요법, 호르몬 요법, 화학요법 치료 또는 외과적 절제 치료인, 방법.
KR1020220131806A 2022-10-13 2022-10-13 cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 KR20240051739A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220131806A KR20240051739A (ko) 2022-10-13 2022-10-13 cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법
PCT/KR2023/008217 WO2024080481A1 (ko) 2022-10-13 2023-06-14 Cfdna의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220131806A KR20240051739A (ko) 2022-10-13 2022-10-13 cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법

Publications (1)

Publication Number Publication Date
KR20240051739A true KR20240051739A (ko) 2024-04-22

Family

ID=90669400

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220131806A KR20240051739A (ko) 2022-10-13 2022-10-13 cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법

Country Status (2)

Country Link
KR (1) KR20240051739A (ko)
WO (1) WO2024080481A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
CA3100345A1 (en) * 2018-05-18 2019-11-21 The Johns Hopkins University Cell-free dna for assessing and/or treating cancer
AU2020210912A1 (en) * 2019-01-24 2021-01-21 Illumina, Inc. Methods and systems for monitoring organ health and disease
US20230002831A1 (en) * 2019-11-25 2023-01-05 The Johns Hopkins University Methods and compositions for analyses of cancer

Also Published As

Publication number Publication date
WO2024080481A1 (ko) 2024-04-18

Similar Documents

Publication Publication Date Title
Heitzer et al. Recommendations for a practical implementation of circulating tumor DNA mutation testing in metastatic non-small-cell lung cancer
De Luca et al. Mutational analysis of single circulating tumor cells by next generation sequencing in metastatic breast cancer
Kamel et al. Exploitation of gene expression and cancer biomarkers in paving the path to era of personalized medicine
Osumi et al. Clinical relevance of circulating tumor DNA assessed through deep sequencing in patients with metastatic colorectal cancer
Spratt et al. Transcriptomic heterogeneity of androgen receptor activity defines a de novo low AR-active subclass in treatment naive primary prostate cancer
Zehir et al. Mutational landscape of metastatic cancer revealed from prospective clinical sequencing of 10,000 patients
Wang et al. Genomic consequences of aberrant DNA repair mechanisms stratify ovarian cancer histotypes
Pirker et al. Consensus for EGFR mutation testing in non-small cell lung cancer: results from a European workshop
Przybyl et al. Combination approach for detecting different types of alterations in circulating tumor DNA in leiomyosarcoma
Haley et al. Performance characteristics of next-generation sequencing in clinical mutation detection of colorectal cancers
Mayo-de-Las-Casas et al. An update on liquid biopsy analysis for diagnostic and monitoring applications in non-small cell lung cancer
Lih et al. Analytical validation and application of a targeted next-generation sequencing mutation-detection assay for use in treatment assignment in the NCI-MPACT trial
D’Haene et al. Clinical application of targeted next-generation sequencing for colorectal cancer patients: a multicentric Belgian experience
Ballester et al. Molecular classification of adult diffuse gliomas: conflicting IDH1/IDH2, ATRX, and 1p/19q results
Kamalakaran et al. Translating next generation sequencing to practice: opportunities and necessary steps
Kumar et al. Biomarkers of diseases in medicine
Bruzek et al. Electronic DNA analysis of CSF cell-free tumor DNA to quantify multi-gene molecular response in pediatric high-grade glioma
Gupta et al. Discordant and heterogeneous clinically relevant genomic alterations in circulating tumor cells vs plasma DNA from men with metastatic castration resistant prostate cancer
Moorcraft et al. Investigating the feasibility of tumour molecular profiling in gastrointestinal malignancies in routine clinical practice
Kerachian et al. Cell free circulating tumor nucleic acids, a revolution in personalized cancer medicine
Orzan et al. Liquid biopsy of cerebrospinal fluid enables selective profiling of glioma molecular subtypes at first clinical presentation
Lee et al. Clinical utility of a fully automated microsatellite instability test with minimal hands-on time
Hondelink et al. The sensitivity of pan-TRK immunohistochemistry in solid tumours: a meta-analysis
Antoniotti et al. Tumour mutational burden, microsatellite instability, and actionable alterations in metastatic colorectal cancer: Next-generation sequencing results of TRIBE2 study
Fu et al. Improving the performance of somatic mutation identification by recovering circulating tumor DNA mutations