KR20240051739A - cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 - Google Patents
cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 Download PDFInfo
- Publication number
- KR20240051739A KR20240051739A KR1020220131806A KR20220131806A KR20240051739A KR 20240051739 A KR20240051739 A KR 20240051739A KR 1020220131806 A KR1020220131806 A KR 1020220131806A KR 20220131806 A KR20220131806 A KR 20220131806A KR 20240051739 A KR20240051739 A KR 20240051739A
- Authority
- KR
- South Korea
- Prior art keywords
- cancer
- cfdna
- wgs
- structural
- patient
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 208000007660 Residual Neoplasm Diseases 0.000 title claims description 22
- 238000003745 diagnosis Methods 0.000 title 1
- 201000011510 cancer Diseases 0.000 claims abstract description 149
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 129
- 238000011282 treatment Methods 0.000 claims abstract description 32
- 230000035945 sensitivity Effects 0.000 claims abstract description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 13
- 201000010099 disease Diseases 0.000 claims abstract description 12
- 210000004369 blood Anatomy 0.000 claims abstract description 10
- 239000008280 blood Substances 0.000 claims abstract description 10
- 230000035772 mutation Effects 0.000 claims description 131
- 210000004027 cell Anatomy 0.000 claims description 45
- 210000001519 tissue Anatomy 0.000 claims description 26
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 11
- 210000002381 plasma Anatomy 0.000 claims description 11
- 206010009944 Colon cancer Diseases 0.000 claims description 6
- 208000029742 colonic neoplasm Diseases 0.000 claims description 6
- 206010005949 Bone cancer Diseases 0.000 claims description 4
- 208000018084 Bone neoplasm Diseases 0.000 claims description 4
- 229910001369 Brass Inorganic materials 0.000 claims description 4
- 201000009030 Carcinoma Diseases 0.000 claims description 4
- 241000243251 Hydra Species 0.000 claims description 4
- 206010039491 Sarcoma Diseases 0.000 claims description 4
- 208000023915 Ureteral Neoplasms Diseases 0.000 claims description 4
- 206010046392 Ureteric cancer Diseases 0.000 claims description 4
- 208000004354 Vulvar Neoplasms Diseases 0.000 claims description 4
- 201000005188 adrenal gland cancer Diseases 0.000 claims description 4
- 208000024447 adrenal gland neoplasm Diseases 0.000 claims description 4
- 239000010951 brass Substances 0.000 claims description 4
- 210000003169 central nervous system Anatomy 0.000 claims description 4
- 208000014829 head and neck neoplasm Diseases 0.000 claims description 4
- QRXWMOHMRWLFEY-UHFFFAOYSA-N isoniazide Chemical compound NNC(=O)C1=CC=NC=C1 QRXWMOHMRWLFEY-UHFFFAOYSA-N 0.000 claims description 4
- 201000001441 melanoma Diseases 0.000 claims description 4
- 238000004393 prognosis Methods 0.000 claims description 4
- 201000005102 vulva cancer Diseases 0.000 claims description 4
- 206010047741 Vulval cancer Diseases 0.000 claims description 3
- 201000005787 hematologic cancer Diseases 0.000 claims description 3
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 claims description 3
- 210000002966 serum Anatomy 0.000 claims description 3
- 208000000649 small cell carcinoma Diseases 0.000 claims description 3
- 206010000830 Acute leukaemia Diseases 0.000 claims description 2
- 206010061424 Anal cancer Diseases 0.000 claims description 2
- 208000007860 Anus Neoplasms Diseases 0.000 claims description 2
- 206010003445 Ascites Diseases 0.000 claims description 2
- 206010003571 Astrocytoma Diseases 0.000 claims description 2
- 206010004146 Basal cell carcinoma Diseases 0.000 claims description 2
- 206010005003 Bladder cancer Diseases 0.000 claims description 2
- 206010006143 Brain stem glioma Diseases 0.000 claims description 2
- 206010006187 Breast cancer Diseases 0.000 claims description 2
- 208000026310 Breast neoplasm Diseases 0.000 claims description 2
- 206010007953 Central nervous system lymphoma Diseases 0.000 claims description 2
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 2
- 206010061825 Duodenal neoplasm Diseases 0.000 claims description 2
- 208000001976 Endocrine Gland Neoplasms Diseases 0.000 claims description 2
- 206010014733 Endometrial cancer Diseases 0.000 claims description 2
- 206010014759 Endometrial neoplasm Diseases 0.000 claims description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 2
- 201000001342 Fallopian tube cancer Diseases 0.000 claims description 2
- 208000013452 Fallopian tube neoplasm Diseases 0.000 claims description 2
- 208000022072 Gallbladder Neoplasms Diseases 0.000 claims description 2
- 208000017604 Hodgkin disease Diseases 0.000 claims description 2
- 208000010747 Hodgkins lymphoma Diseases 0.000 claims description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 2
- 206010023825 Laryngeal cancer Diseases 0.000 claims description 2
- 206010062038 Lip neoplasm Diseases 0.000 claims description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 2
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 claims description 2
- 206010052178 Lymphocytic lymphoma Diseases 0.000 claims description 2
- 208000032271 Malignant tumor of penis Diseases 0.000 claims description 2
- 208000034578 Multiple myelomas Diseases 0.000 claims description 2
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 claims description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 claims description 2
- 206010029260 Neuroblastoma Diseases 0.000 claims description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 2
- 206010033128 Ovarian cancer Diseases 0.000 claims description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 2
- 208000000821 Parathyroid Neoplasms Diseases 0.000 claims description 2
- 208000002471 Penile Neoplasms Diseases 0.000 claims description 2
- 206010034299 Penile cancer Diseases 0.000 claims description 2
- 208000005228 Pericardial Effusion Diseases 0.000 claims description 2
- 208000007913 Pituitary Neoplasms Diseases 0.000 claims description 2
- 201000005746 Pituitary adenoma Diseases 0.000 claims description 2
- 206010061538 Pituitary tumour benign Diseases 0.000 claims description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 claims description 2
- 208000020584 Polyploidy Diseases 0.000 claims description 2
- 206010060862 Prostate cancer Diseases 0.000 claims description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 2
- 208000015634 Rectal Neoplasms Diseases 0.000 claims description 2
- 206010038389 Renal cancer Diseases 0.000 claims description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 claims description 2
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 claims description 2
- 206010061934 Salivary gland cancer Diseases 0.000 claims description 2
- 208000000453 Skin Neoplasms Diseases 0.000 claims description 2
- 206010054184 Small intestine carcinoma Diseases 0.000 claims description 2
- 208000021712 Soft tissue sarcoma Diseases 0.000 claims description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 2
- 208000024313 Testicular Neoplasms Diseases 0.000 claims description 2
- 206010057644 Testis cancer Diseases 0.000 claims description 2
- 208000000728 Thymus Neoplasms Diseases 0.000 claims description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 claims description 2
- 206010062129 Tongue neoplasm Diseases 0.000 claims description 2
- 206010046431 Urethral cancer Diseases 0.000 claims description 2
- 206010046458 Urethral neoplasms Diseases 0.000 claims description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 2
- 208000002495 Uterine Neoplasms Diseases 0.000 claims description 2
- 201000000315 ampulla of Vater cancer Diseases 0.000 claims description 2
- 201000011165 anus cancer Diseases 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- 201000010881 cervical cancer Diseases 0.000 claims description 2
- 238000002512 chemotherapy Methods 0.000 claims description 2
- 230000001684 chronic effect Effects 0.000 claims description 2
- 208000024207 chronic leukemia Diseases 0.000 claims description 2
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 201000000312 duodenum cancer Diseases 0.000 claims description 2
- 201000004101 esophageal cancer Diseases 0.000 claims description 2
- 201000010175 gallbladder cancer Diseases 0.000 claims description 2
- 206010017758 gastric cancer Diseases 0.000 claims description 2
- 230000004545 gene duplication Effects 0.000 claims description 2
- 208000005017 glioblastoma Diseases 0.000 claims description 2
- 208000006359 hepatoblastoma Diseases 0.000 claims description 2
- 238000001794 hormone therapy Methods 0.000 claims description 2
- 238000009169 immunotherapy Methods 0.000 claims description 2
- 238000003780 insertion Methods 0.000 claims description 2
- 230000037431 insertion Effects 0.000 claims description 2
- 210000003734 kidney Anatomy 0.000 claims description 2
- 201000010982 kidney cancer Diseases 0.000 claims description 2
- 206010023841 laryngeal neoplasm Diseases 0.000 claims description 2
- 201000006721 lip cancer Diseases 0.000 claims description 2
- 201000007270 liver cancer Diseases 0.000 claims description 2
- 208000014018 liver neoplasm Diseases 0.000 claims description 2
- 201000005202 lung cancer Diseases 0.000 claims description 2
- 208000020816 lung neoplasm Diseases 0.000 claims description 2
- 208000029559 malignant endocrine neoplasm Diseases 0.000 claims description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 2
- 208000020984 malignant renal pelvis neoplasm Diseases 0.000 claims description 2
- 208000026037 malignant tumor of neck Diseases 0.000 claims description 2
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 claims description 2
- 206010027191 meningioma Diseases 0.000 claims description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims description 2
- 208000021284 ovarian germ cell tumor Diseases 0.000 claims description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 2
- 201000009612 pediatric lymphoma Diseases 0.000 claims description 2
- 210000004912 pericardial fluid Anatomy 0.000 claims description 2
- 201000002628 peritoneum cancer Diseases 0.000 claims description 2
- 208000021310 pituitary gland adenoma Diseases 0.000 claims description 2
- 210000004910 pleural fluid Anatomy 0.000 claims description 2
- 208000016800 primary central nervous system lymphoma Diseases 0.000 claims description 2
- 238000001959 radiotherapy Methods 0.000 claims description 2
- 206010038038 rectal cancer Diseases 0.000 claims description 2
- 201000001275 rectum cancer Diseases 0.000 claims description 2
- 201000007444 renal pelvis carcinoma Diseases 0.000 claims description 2
- 238000002271 resection Methods 0.000 claims description 2
- 201000000849 skin cancer Diseases 0.000 claims description 2
- 201000002314 small intestine cancer Diseases 0.000 claims description 2
- 201000011549 stomach cancer Diseases 0.000 claims description 2
- 201000003120 testicular cancer Diseases 0.000 claims description 2
- 201000002510 thyroid cancer Diseases 0.000 claims description 2
- 201000006134 tongue cancer Diseases 0.000 claims description 2
- 230000005945 translocation Effects 0.000 claims description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 claims description 2
- 201000005112 urinary bladder cancer Diseases 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 206010046766 uterine cancer Diseases 0.000 claims description 2
- 206010046885 vaginal cancer Diseases 0.000 claims description 2
- 208000013139 vaginal neoplasm Diseases 0.000 claims description 2
- 208000005440 Basal Cell Neoplasms Diseases 0.000 claims 1
- 208000037959 spinal tumor Diseases 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 21
- 206010050017 Lung cancer metastatic Diseases 0.000 abstract description 4
- 238000010790 dilution Methods 0.000 description 46
- 239000012895 dilution Substances 0.000 description 46
- 238000012070 whole genome sequencing analysis Methods 0.000 description 40
- 239000000523 sample Substances 0.000 description 34
- 230000004927 fusion Effects 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 8
- 206010069755 K-ras gene mutation Diseases 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 101100331535 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DIB1 gene Proteins 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 206010069754 Acquired gene mutation Diseases 0.000 description 2
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 101000702545 Homo sapiens Transcription activator BRG1 Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 102100031027 Transcription activator BRG1 Human genes 0.000 description 2
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000037439 somatic mutation Effects 0.000 description 2
- 239000010421 standard material Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 210000001754 blood buffy coat Anatomy 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 206010062261 spinal cord neoplasm Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Databases & Information Systems (AREA)
- Analytical Chemistry (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 암 환자 유래 cfDNA 시료를 이용하여 높은 민감도로 구조 변이 서열을 검출하고, 검출된 구조 변이 데이터를 이용하여 암 환자의 미세잔존질환 진단에 사용하기 위한 새로운 WGS (whole genome sequence) 분석 시스템 및 방법에 관한 것이다. 본 발명에서는 암 세포주와 NA12878을 1:12,800 비율로 섞은 경우에도 구조 변이 서열을 검출하였으며, 전이성 폐암환자의 cfDNA 에서도 구조 변이 서열을 민감하게 확인하였다. 따라서 본 발명에 따른 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법을 이용하면, 암 유래 cfDNA 가 낮은 순도로 혈액 등의 존재하더라도, 높은 민감도로 환자 특이적 구조 변이 서열을 검출할 수 있고, 암 치료 후 환자에 남아있는 암 세포를 적은 시료로도 검출할 수 있어, 암 종과 상관없이 범용적으로 미세 잔존 질환 진단에 활용할 수 있다.
Description
본 발명은 암 환자 유래 cfDNA (Cell-free DNA) 시료에서 높은 민감도로 구조 변이 서열을 검출하고, 이를 이용하여 암 환자의 미세잔존질환(Minimal Residual Disease; MRD)을 진단하기 위한 새로운 전장 유전체 서열 분석 (Whole-Genome Sequencing, WGS) 시스템 및 방법에 관한 것이다.
차세대 염기서열 분석(Next Generation Sequencing)은 유전체를 무수히 많은 조각으로 나눠서 읽고, 얻어진 염기서열 조각을 정렬하여 유전체의 서열을 분석하는 유전체 고속 분석 방법이다. 차세대 염기서열 분석 기술을 통한 전장 유전체 서열 분석(Whole-Genome Sequencing, WGS)은 거의 모든 유형의 체세포 돌연변이(somatic variant) 검출에 유용하고, 이러한 유용성 덕분에 여러분야에서 광범위하게 사용되고 있으며, 특히 암 유전체학에서 매우 중요한 역할을 하고 있다.
전 세계적으로는 유전체 분석 사업은 빠르게 발전하고 있으며, 이러한 차세대 염기서열 분석 기법은 임상유전체(clinical genomics), 약물유전체학(pharmaco - genomics) 및 중개 임상 (translational medicine) 분야에서도 활발히 활용되고 있다.
구조 변이(Structural Variants, SV)는 암 발생 과정에 중요한 역할을 하므로, 암 유전체에서 체세포 구조변이를 검출하기 위해 많은 생물 정보학 알고리즘과 툴이 개발되었다. 유전체의 특정 위치가 잘려서 서로 결합하여 발생되는 구조 변이는 결합 부위에 융합(fusion) DNA 서열을 생성하게 되고 이는 정상 조직에서는 확인되지 않는 특이적인 고유 서열이다. 암 세포에서는 apoptosis 로 인해 혈중으로 cfDNA 가 유입되는 것으로 알려져 있고, cfDNA에서 원발암의 특이적인 구조 변이에 의한 융합 DNA 서열이 검출된다면, 이를 이용하여 암 치료 후 체내에 남아있는 미세잔존질환(Minimal Residual Disease; MRD)을 진단하는데 사용할 수 있을 것으로 기대된다.
cfDNA에서 돌연변이를 찾기 위한 방법으로 targeted high-depth 시퀀싱이 널리 이용되고 있다. 상기 방법은 돌연변이를 민감하게 찾을 수 있다는 장점이 있으나, high-depth를 구현하기 위해 개별 암 종에 적합한 표적화된 패널을 준비해야 하고, 노이즈를 줄이기 위한 실험적인 전처리 공정이 필요하다.
따라서 암 미세잔존질환을 진단하기 위해 범용적으로 활용할 수 있는, cfDNA 시료의 WGS을 이용하여 개별 암 특이적인 구조 변이 서열을 효과적으로 검출할 수 있는 새로운 방법에 대한 필요성이 있다.
본 발명자들은 cfDNA 시료에서 구조 변이 서열을 민감하게 검출하기 위해서, 원발암의 WGS를 활용하여 구조 변이를 찾고, 이 구조 변이의 서열을 cfDNA의 WGS에서 매칭하는 방법을 통해 적은 수의 구조 변이 서열 정보를 가지고 있는 리드들을 cfDNA에서 검출할 수 있고, 이를 환자의 미세잔존질환 진단에 활용할 수 있음을 확인하고 본 발명을 완성하였다.
상기 목적을 달성하기 위하여, 본 발명은 1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법을 제공한다.
또한 본 발명은 1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법을 제공한다.
본 발명에서는 암 세포주와 NA12878을 1:12,800 비율로 섞은 경우에도 구조 변이 서열을 검출하였으며, 전이성 폐암환자의 cfDNA 에서도 구조 변이 서열을 민감하게 확인하였다. 따라서 본 발명에 따른 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법을 이용하면, 암 유래 cfDNA 가 낮은 순도로 혈액 등의 존재하더라도, 높은 민감도로 환자 특이적 구조 변이 서열을 검출할 수 있고, 암 치료 후 환자에 남아있는 암 세포를 적은 시료로도 검출할 수 있어, 암 종과 상관없이 범용적으로 미세 잔존 질환 진단에 활용할 수 있다.
도 1은 본 발명의 cfDNA 내 구조 변이 서열 검출 방법의 흐름도를 나타낸 도이다.
도 2는 본 발명 검출 방법 중 2단계에서 수행되는 대응 참조 서열과 각 지지 리드를 비교하는 구조 변이 서열 확인 공정의 모식도이다.
도 3은 세포주 혼합 실험을 이용한 분석 검증 결과를 요약하여 나타낸 도이다.
도 4 및 도 5는 임상 검증 실험 중 case 1환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서 동일하게 확인되고 normal control에서는 관찰되지 않음을 보여주는 결과이다.
도 6은 case 1 환자의 원발암 조직에서 KRAS 변이가 검출 (36%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 19%, 6% 검출되는 결과를 확인한 도이다.
도 7 및 도 8은 임상 검증 실험 중 case 2환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 동일하게 확인되고 normal control에서는 관찰되지 않음을 보여주는 결과이다.
도 9은 case 2 환자의 원발암 조직에서 TP53 변이가 검출 (45%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 2%, 0% 검출되는 결과를 확인한 도이다.
도 10은 case 2 환자의 원발암 조직에서 SMARCA4 변이가 검출 (27%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 5%, 2% 검출되는 결과를 확인한 도이다.
도 2는 본 발명 검출 방법 중 2단계에서 수행되는 대응 참조 서열과 각 지지 리드를 비교하는 구조 변이 서열 확인 공정의 모식도이다.
도 3은 세포주 혼합 실험을 이용한 분석 검증 결과를 요약하여 나타낸 도이다.
도 4 및 도 5는 임상 검증 실험 중 case 1환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서 동일하게 확인되고 normal control에서는 관찰되지 않음을 보여주는 결과이다.
도 6은 case 1 환자의 원발암 조직에서 KRAS 변이가 검출 (36%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 19%, 6% 검출되는 결과를 확인한 도이다.
도 7 및 도 8은 임상 검증 실험 중 case 2환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 동일하게 확인되고 normal control에서는 관찰되지 않음을 보여주는 결과이다.
도 9은 case 2 환자의 원발암 조직에서 TP53 변이가 검출 (45%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 2%, 0% 검출되는 결과를 확인한 도이다.
도 10은 case 2 환자의 원발암 조직에서 SMARCA4 변이가 검출 (27%)되고, cfDNA-1, cfDNA-2 시료에서도 같은 변이가 5%, 2% 검출되는 결과를 확인한 도이다.
본 발명은 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법 및 이를 이용한 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법에 관한 것이다.
본 발명에 따르면, 암 환자의 원발암 조직에서 미리 확인된 구조 변이를 이용하여 치료 후 암 환자의 cfDNA에 존재하는 구조 변이 서열을 높은 민감도로 빠르게 비교 분석할 수 있어, 치료 후 환자에 잔존하는 암 세포를 모니터링하고 암 치료 경과 및 예후, 재발 가능성 등에 대한 정보를 제공할 수 있다.
이하, 본 발명에 대하여 상세히 설명한다.
본 발명은 1) 환자 유래 암 조직의 WGS를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법에 관한 것이다.
본 발명의 1) 단계는 원발암 시료의 공통 (consensus) 구조 변이 데이터를 얻는 단계이며, 환자 유래 암 조직의 WGS 및 정상 대조군의 WGS를 2가지 이상의 구조 변이 분석 데이터로 분석한다.
상기 단계에서는 보다 정확한 환자의 구조 변이 데이터를 얻기 위하여 2가지 이상의 구조 변이 분석 소프트웨어를 이용하는 것을 특징으로 한다. 해당 단계에서는 암 환자에서 수득된 암 조직, 즉 원발암 시료 및 정상 대조군을 이용하여 WGS 및 정렬 (alignment)을 수행하고, 이를 통해 시퀀싱 리드들이 어떤 염색체의 어느 위치에 있는 DNA 인지 표준 유전체 (reference genome) 상에서 위치를 확인하는 매핑 (Mapping) 이 수행된다. 매핑을 완료하면 각 시퀀싱 리드에 대하여 표준 유전체 상의 염색체 번호 및 위치 정보가 제공되며, 이를 포함하는 정렬된 염기 조각인 BAM(binary alignment map) 포맷을 얻을 수 있다. 제1 구조 변이 분석 소프트웨어를 이용하여, 수득된 종양 조직 유래 '종양 BAM' 파일과 '대조군 BAM' 파일에서 각 시퀀싱 리드를 비교 분석하여 특정 위치에 표준 유전체 서열과 다른 구조 변이가 일어난 변이체의 존재를 확인하기 위한 '구조 변이 호출 (Structural variant call, SV call)' 이 수행되며, 이를 통해 '제 1 구조 변이 위치 데이터'를 수득할 수 있다.
이어서 본 발명의 '공통 (consensus) 구조 변이 위치 데이터'를 수득하기 위하여, 제 2 구조변이 분석 소프트웨어를 이용하여 구조 변이 호출을 수행한다. 이때 공통 구조변이를 빠르게 확인하기 위해, 제1 구조 변이 분석 소프트웨어를 이용하여 수득된 '제1 구조 변이 위치 데이터'를 제2 구조 변이 분석 소프트웨어에 입력하여 구조 변이 호출을 수행할 수 있다.
즉, 본 발명에 있어서, '공통(consensus) 구조 변이 위치 데이터'란 복수 개의 구조 변이 분석 소프트웨어를 통한 SV call 에서 공통적으로 존재하는 것으로 확인된 구조 변이 위치에 대한 정보를 의미한다.
상기 1) 단계는 암환자의 원발암 시료에 존재하는 구조 변이에 대한 DB 를 구축하기 위한 목적으로 이용되는 것일 수 있으며, 이와 같이 한번 획득된 공통 구조 변이 위치 데이터는 향후 다양한 시점에서 획득한 동일 암 환자의 cfDNA 구조 변이와의 비교 분석에 모니터링 목적으로 반복 활용될 수 있다.
본 발명에 사용되는 구조 변이 분석 소프트웨어는 당 분야에서 전장 유전체 분석을 통해 체세포 구조 변이를 검출할 수 있는 것으로 알려진 다양한 종류의 소프트웨어를 제한없이 사용할 수 있으며, 예컨대 DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra, CNVnator 및 JuLI 로 이루어진 군에서 선택되는 2종 이상을 사용할 수 있다. 상기 2종 이상의 분석 소프트웨어는 순차적으로 사용될 수 있고, 제1 WGS 분석 소프트웨어는 SV call 을 통해 각 시퀀싱 리드를 분석하여 특정 위치에 표준 유전체 서열과 다른 구조 변이가 일어난 변이체의 존재를 확인하고, '제1 구조 변이 위치 데이터'를 제공한다. 이후 제2 WGS 분석 소프트웨어에 제1 WGS 분석 소프트웨어에서 수득된 제1 구조 변이 위치 데이터를 VCF, BED format 등 으로 입력하고, 분석 대상인 종양 BAM 파일을 입력하면, 미리 확인된 제1 구조 변이 위치 데이터를 기반으로 신속하게 2종의 WGS 분석 소프트웨어에서 공통적으로 존재하는 '공통 구조 변이 위치 데이터'를 수득할 수 있다. WGS 분석 소프트웨어의 선택은 이에 제한되는 것은 아니나, 제1 WGS 분석 소프트웨어는 많은 정보량을 신속하게 처리할 수 있는 소프트웨어를 선택하는 것이 바람직하고, 본 발명에서는 바람직한 일 예로 DELLY (Version: 0.8.7, https://github.com/dellytools/delly)를 이용하였다. 또한 DELLY 에서 제공된 제 1 구조 변이 위치 데이터를 기반으로 신속하게 공통 구조 변이를 탐색하는 제2 WGS 분석 소프트웨어로 공개 소프트웨어인 JuLI(https://github.com/sgilab/JuLI, J Mol Diagn. 2020 Mar;22(3):304-318) 를 이용하였다.
따라서 본 발명의 상기 1) 단계는 1-1) DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra 및 CNVnator 로 이루어진 군에서 선택된 1종의 분석 소프트웨어로 원발암 시료의 제 1 구조 변이 위치 데이터를 얻는 단계; 및 1-2) 상기 1-1) 단계에서 수득된 제 1 구조 변이 위치 데이터를 JuLI 에 입력하여 공통적으로 확인되는 원발암 시료의 공통(consensus) 구조 변이 위치 데이터를 얻는 단계; 를 순차적으로 수행하는 것을 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이를 검출하는 방법일 수 있다.
또한 본 발명은 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계;를 포함한다.
본 발명은 암종에 상관없이 범용적으로 cfDNA 시료에 존재하는 적은 수의 구조 변이를 높은 민감도로 검출할 수 있음을 특징으로 한다. 본 발명에서 상기 cfDNA는 암 환자의 뇌척수액, 흉수, 심낭액, 복수, 소변, 전혈, 혈장 또는 혈청 유래의 cfDNA 일 수 있으나, 이에 제한되지 않는다.
본 발명은 통상적인 변이 검출 방법들과 마찬가지로, 검출 민감도는 sequencing depth에 따라 조절할 수 있다.
한편 상기 2) 단계의 분석 대상이 되는 암 환자의 cfDNA 는 암 치료 중 또는 암 치료 후의 환자에서 수득되는 것일 수 있다. 본 발명에서는 상기 1) 단계에서 암 환자의 원발암 조직 내 존재하는 공통 구조 변이 위치에 대한 DB를 구축하고, 이후 환자가 암 치료를 받는 중 또는 받은 후, 환자의 cfDNA 내 구조 변이 위치 서열과 비교함으로써, 치료 후 환자에 남아있는 미세한 수준의 잔존 암 세포에 대한 정보를 제공할 수 있다.
보다 구체적으로 상기 2) 단계는 다음과 같다: 먼저 암 환자의 cfDNA (Cell-free DNA) 를 WGS 및 정렬하여 수득된 각 시퀀싱 리드에 대하여 표준 유전체 상의 염색체 번호 및 위치 정보가 기록된 cfDNA BAM(binary alignment map) 포맷, 즉 cfDNA 매핑(mapping) 데이터를 얻는다. 이후 수득된 cfDNA 매핑 데이터인 cfDNA BAM 파일을 1) 단계에서 수득된 공통 구조 변이 위치 데이터와 함께 구조 변이 분석 소프트웨어에 입력하고, 지지 리드 콜 (supporting read call) 을 수행하여, 1) 단계에서 확인된 공통 구조 변이 위치에서 대응 참조 서열(counter reference sequence) 과 함께 상기 지지 리드들을 정렬함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계이다.
상기 대응 참조 서열은 표준 유전체 데이터와 동일한 의미로 사용될 수 있으며, hg19 또는 hg38 등 일 수 있다.
본 발명의 방법은 암 종과 상관없이 모든 암에 범용적으로 사용할 수 있으며, 기존 영상이나 혈액 검사, 표적화 고속 시퀀싱 (targeted high-depth sequencing) 방법과 달리, 암 종류에 따라 검사 항목이나 사전 디자인을 해야 하는 별도의 공정을 수반하지 않는다. 따라서 본 발명의 대상이 되는 암은 당 분야에 공지된 암 종을 제한없이 포함할 수 있고, 예컨대 위암, 폐암, 비소세포성 폐암, 유방암, 난소암, 간암, 기관지암, 비인두암, 후두암, 췌장암, 방광암, 대장암, 결장암, 자궁경부암, 골암, 비소세포성 골암, 혈액암, 피부암(흑색종 등), 두부 또는 경부 암, 자궁암, 직장암, 항문 부근암, 결장암, 나팔관암, 자궁내막암, 질암, 음문암, 호지킨병(Hodgkin's disease), 식도암, 소장암, 내분비선암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 전립선암, 만성 또는 급성 백혈병, 림프구 림프종, 신장 또는 수뇨관암, 신장세포 암종, 신장골반암종, 배수성암(polyploid carcinoma), 침샘암, 육종암, 가성점액종, 간모세포종, 고환암, 교모세포종, 구순암, 난소생식세포종양, 기저세포암, 다발성골수종, 담낭암, 맥락막흑색종, 바터팽대부암, 복막암, 부신암, 설암, 소세포암, 소아림프종, 신경모세포종, 십이지장암, 요관암, 성상세포종, 수막종, 신우암, 외음부암, 흉선암, 중추신경계(central nervous system, CNS) 종양, 1차 중추신경계 림프종, 척수종양, 뇌간 신경교종 또는 뇌하수체 선종일 수 있다.
본 발명에 있어서, 검출 대상이 되는 구조 변이는 체세포 구조 변이일 수 있고, 유전자의 복제, 결실, 전좌 및 삽입으로 이루어진 군에서 선택된 1종 이상일 수 있으며, 비교 대상인 대응 참조 서열과 비교하여 서열상 특이적인 차이를 보이는 것을 말한다. 대부분의 암은 암 발생 초기에 수십개에서 수백개의 구조 변이가 발생하며, 암이 진행되는 동안 이러한 구조 변이가 유지된다. 암 세포에서는 세포자멸사에 의하여 혈중에 cfDNA 가 흘러나오게 되며, 혈중에 존재하는 cfDNA에서 암 세포에서 발견된 구조 변이 서열이 확인된다면, 환자의 몸 속에 암이 잔존하고 있고, 미세잔존질환을 유발할 가능성이 있음을 진단할 수 있다. 따라서, 본 발명의 검출 대상이 되는 구조 변이 서열은, 환자의 암세포에 존재하는 것으로 확인된 구조 변이 중 cfDNA에 존재하는 구조 변이의 서열이다.
본 발명의 또다른 양태로, 본 발명은 1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및 2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법을 제공한다.
본 발명에 있어, 미세잔존질환이란, 최소 잔류 질병이라고도 하며 치료 중이나 치료를 완료한 환자에 남아있는 소수의 악성 세포가 분자적으로 검출되는 상태를 의미한다. 미세잔존질환은 다양한 혈액암과 고형암의 추적 관찰 대상이 되며, 미세잔존질환을 확인하여 환자의 치료에 대한 반응성을 확인하고 재발의 위험을 예측할 수 있다. 따라서 본 발명의 미세잔존질환에 대한 정보는 치료 중 또는 치료 후에 잔존하는 암세포 유무, 암 재발 가능성 또는 암 치료 예후에 대한 정보일 수 있다. 만약 본 발명의 방법을 수행하여, 환자의 cfDNA 시료에서 원발암 시료에서 확인된 구조 변이 서열이 확인되는 경우, 이 환자는 암 세포가 잔존하거나, 치료에 대한 반응성이 낮거나, 재발의 위험이 높거나, 또는 암 치료 후 예후가 나쁠 것으로 예측할 수 있다.
본 발명에서 암 환자의 치료는 방사선 요법, 면역요법, 호르몬 요법, 화학요법 치료 또는 외과적 절제 치료 등 당 분야에 공지된 치료법을 모두 제한없이 포함한다.
또한 본 발명은 환자 자신의 원발암 공통 구조 변이와 치료 이후 cfDNA 구조 변이 서열를 비교하여 미세잔존질환에 대한 정보를 제공하므로, 환자 맞춤형 정보 제공 방법으로 활용될 수 있다.
본 발명을 이용하면, 매우 낮은 순도의 cfDNA를 포함하는 치료 후 환자의 혈액, 혈장 또는 혈청 유래 시료에서도 높은 민감도로 구조 변이 서열을 검출할 수 있다. 본 발명의 일 구현예에서는 1:12,800까지 희석된 시료에서도 충분한 수의 지지 리드를 확인할 수 있고 이를 통해 환자 cfDNA 시료의 구조 변이 서열을 확인하여 미세잔존질환에 대한 정보를 제공할 수 있음을 확인하였다.
본 발명의 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법 및 미세잔존질환에 대한 정보를 제공하는 방법은 모두 컴퓨터 시스템에 의해 in silico 로 수행되는 것인 방법일 수 있다. 따라서 염기서열 변이 정보는 컴퓨터 시스템을 통하여 접수/수득될 수 있으며, 이런 측면에서 본 발명의 방법은 유전자 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함할 수 있다.
상술한 본 발명의 내용은 상호 모순되지 않는 한, 서로 동일하게 적용되며, 당해 기술분야의 통상의 기술자가 적절한 변경을 가해 실시하는 것 또한 본 발명의 범주에 포함된다.
이하 본 발명을 실시예를 통해 상세하게 설명하나 본 발명의 범위가 하기 실시예로만 한정되는 것은 아니다.
실시예 1. 혈장 cfDNA 내 구조 변이 특이 서열 검출 방법 구축
암환자의 혈장 cfDNA 내 구조 변이 특이 서열을 확인하기 위하여, 다음의 2 단계로 이루어진 프로세스를 구축하였다:
1. 환자의 공통 (consensus) 구조 변이 확인 단계
환자가 가진 공통 (consensus) 구조 변이를 찾기 위하여, 2가지 종류의 분석툴을 이용하였다. 환자 유래의 암 조직과 대조군 시료를 이용하여 WGS을 수행한 후 BWA 의 default setting으로 정렬(alignment)을 수행하였다. 분석툴로는 DNA 체세포 변이, DNA 융합을 검출할 수 있는 구조 변이 검출 소프트웨어인 JuLI(https://github.com/sgilab/JuLI)와 다른 구조변이 검출 소프트웨어인 DELLY (DELLY Version: 0.8.7, https://github.com/dellytools/delly) 를 활용하였다. 1차적으로 DELLY를 통해 종양 BAM 및 대조군 BAM 파일을 이용한 구조 변이 호출을 수행하여 환자의 원발암 시료에 존재하는 구조 변이 위치(제 1구조 변이 위치 데이터)를 확인하였다. 확인된 환자 구조 변이 위치 결과를 BED 포맷으로 JuLI 에 입력하고, 종양 BAM 파일을 입력한 후 구조 변이 호출를 수행하여 DELLY 와 JuLI 에서 공통적으로 구조 변이가 의심되는 위치를 확인하여 공통 (consensus) 구조 변이 위치 데이터를 얻었다. 확인된 공통 구조 변이 위치 데이터를 이후 2단계의 JuLI output 포맷 형태로 활용하였다.
2. 지지 리드 검출을 통한 cfDNA 구조 변이 서열 검출 단계
암 발생 이후 환자에서 혈장 시료를 수득한 후, 해당 시료에서 DNA를 추출하여 WGS 분석을 수행한 후 BWA 의 default setting으로 정렬(alignment)을 수행하여 cfDNA BAM 파일을 수득하였다. 상기 1 단계를 통해 확보한 공통 구조 변이 위치와 동일한 위치에 구조 변이 특이 서열을 의미하는 지지 리드(supporting read) 가 있는지 cfDNA BAM 파일에서 확인하기 위하여 JuLI 프로그램의 'callread' 함수를 적용하였다. 'callread' 함수를 이용하면, 공통(consensus) 구조 변이 위치에서 hg19 또는 hg38과 같은 대응 참조 서열(counter reference sequence)과 각 지지 리드의 비교를 통해 구조 변이에 의해 발생한 특이 서열을 매칭할 수 있다. 이때, JuLI 파라미터 중 splitratio의 default 값을 조정하면 특이도를 조절할 수 있으며 0.95 로 설정하여 특이도를 높였다.
이러한 방법을 이용하면, 적은 수의 리드 존재만으로도 확인하고자 하는 fusion site 에서 공통 구조 변이를 서포팅하는 특이 서열을 가진 cfDNA 구조 변이 지지 리드가 있는지 높은 민감도로 검출할 수 있다.
상기 2단계로 이루어진 본 발명의 혈장 cfDNA 내 구조 변이 서열 검출 방법의 흐름도를 도 1에 나타내었고, 2 단계의 대응 참조서열과 지지 리드의 비교를 도 2에 모식화하여 나타내었다.
실험예 1. 분석 검증
이하에서는 실제 환자의 시료와 세포주를 이용한 분석 검증 결과를 설명한다.
1.1 분석 시료의 준비
cfDNA 에 존재하는 DNA 구조 변이를 확인하기 위하여, 다음과 같은 시료를 준비하였다. 분석 검증 실험을 위하여 암세포 및 표준 물질을 시료로 이용하였다. 변이 정의를 수행함에 있어, 표준 물질로 NA12878를 지정하였고, 이를 기반으로 구조 변이를 비교 검출하였다. NA 12878는 Coriell institute에서 구매하여 사용하였다. 5개의 암세포 주 (WM2664, A375, SNU16, HCC1954, HCC95)는 한국 세포주은행에서 구입하여 사용하였다.
NA12878의 DNA와 5개의 암세포 주 (WM2664, A375, SNU16, HCC1954, HCC95)에서 채취한 DNA를 일반적인 cfDNA 절편 사이즈로 알려져 있는 150 내지 170bp 로 sharing 하였다. 5종 암세포주를 각각 10ng/ul 로 희석하고 동일 부피 50 ul로 혼합하여 최종 10ng/ul, 250ul 의 혼합 시료를 준비하여 초기 시료로 준비하였다. NA 12878 의 초기 시료량은 50 ng/ul 이다. 이후 이들 5종의 암세포 혼합 시료와 NA 12878 혼합 비율을 cell line: NA12878 = 1:100, 1:200, 1:400, 1:800, 1:1600, 1:3200, 1:6400 및 1:12800 로 달리하여 제조하고 본 발명의 민감도를 확인하기 위한 실험에 이용하였고, 모든 실험은 3회 반복 수행하였다.
환자의 임상 시료는 인하대병원에 내원한 전이성 폐암 환자로부터 각각 FFPE (Formalin Fixed Paraffin Embedded) 암 조직, 혈액 buffy coat (control tissue) 를 얻었으며, 다른 시점에서 채취한 혈장 샘플을 준비하여 cfDNA 를 채취하였다.
1.2 세포주 혼합 실험을 이용한 분석 검증 (Analytical validation)
실시예 1의 방법을 이용한 분석 검증을 수행하였다. 먼저 NA 12878 와 5개의 암세포 주 (WM2664, A375, SNU16, HCC1954, HCC95), 및 이들의 혼합 시료를, cell line: NA12878 = 1:100, 1:200, 1:400, 1:800, 1:1600, 1:3200, 1:6400 및 1:12800 로 혼합 비율을 달리하여 3회 반복 분석한 결과를 표 1 내지 표 8에 나타내었다. 각 표는 5종의 암 세포주에서 구조 변이 검출을 3회 반복한 값을 나타내며, 동일한 Sample ID 는 하나의 BAM 파일을 의미한다. CD_21_16908 내지 CD_21_16912는 다음과 같이 각 암 세포주에 대응되는 데이터이다: CD_21_16908 (A375SM), CD_21_16909 (HCC95), CD_21_16910 (HCC1954), CD_21_16911 (SNU16), CD_21_16912 (WM2664). 암 세포주는 평균 22X 로 데이터가 생산되었고, 혼합 시료는 평균 70X로 데이터를 생산하였다. 각 세포주의 변이가 레퍼런스로만 된 WGS에서 검출되는지 확인한 데이터는 표 9에 나타내었다.
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:100 | CD_21_17603_CL_D_SRG_1 | WGS_60X - 1st | 171 | 89 | 162 |
CD_21_16909 | 1:100 | CD_21_17603_CL_D_SRG_1 | WGS_60X - 1st | 292 | 130 | 239 |
CD_21_16910 | 1:100 | CD_21_17603_CL_D_SRG_1 | WGS_60X - 1st | 475 | 277 | 847 |
CD_21_16911 | 1:100 | CD_21_17603_CL_D_SRG_1 | WGS_60X - 1st | 194 | 115 | 689 |
CD_21_16912 | 1:100 | CD_21_17603_CL_D_SRG_1 | WGS_60X - 1st | 247 | 131 | 251 |
CD_21_16908 | 1:100 | CD_22_06205_CL_D_SRG_1 | WGS_60X - 2nd | 171 | 51 | 87 |
CD_21_16909 | 1:100 | CD_22_06205_CL_D_SRG_1 | WGS_60X - 2nd | 292 | 84 | 158 |
CD_21_16910 | 1:100 | CD_22_06205_CL_D_SRG_1 | WGS_60X - 2nd | 475 | 181 | 407 |
CD_21_16911 | 1:100 | CD_22_06205_CL_D_SRG_1 | WGS_60X - 2nd | 194 | 80 | 382 |
CD_21_16912 | 1:100 | CD_22_06205_CL_D_SRG_1 | WGS_60X - 2nd | 247 | 79 | 118 |
CD_21_16908 | 1:100 | CD_22_10086_CL_D_SRG_1 | WGS_60X - 3rd | 171 | 64 | 110 |
CD_21_16909 | 1:100 | CD_22_10086_CL_D_SRG_1 | WGS_60X - 3rd | 292 | 83 | 137 |
CD_21_16910 | 1:100 | CD_22_10086_CL_D_SRG_1 | WGS_60X - 3rd | 475 | 170 | 442 |
CD_21_16911 | 1:100 | CD_22_10086_CL_D_SRG_1 | WGS_60X - 3rd | 194 | 76 | 396 |
CD_21_16912 | 1:100 | CD_22_10086_CL_D_SRG_1 | WGS_60X - 3rd | 247 | 79 | 109 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:200 | CD_21_17605_CL_D_SRG_1 | WGS_60X - 1st | 171 | 18 | 23 |
CD_21_16909 | 1:200 | CD_21_17605_CL_D_SRG_1 | WGS_60X - 1st | 292 | 49 | 71 |
CD_21_16910 | 1:200 | CD_21_17605_CL_D_SRG_1 | WGS_60X - 1st | 475 | 100 | 197 |
CD_21_16911 | 1:200 | CD_21_17605_CL_D_SRG_1 | WGS_60X - 1st | 194 | 45 | 194 |
CD_21_16912 | 1:200 | CD_21_17605_CL_D_SRG_1 | WGS_60X - 1st | 247 | 46 | 71 |
CD_21_16908 | 1:200 | CD_22_06207_CL_D_SRG_1 | WGS_60X - 2nd | 171 | 23 | 38 |
CD_21_16909 | 1:200 | CD_22_06207_CL_D_SRG_1 | WGS_60X - 2nd | 292 | 45 | 60 |
CD_21_16910 | 1:200 | CD_22_06207_CL_D_SRG_1 | WGS_60X - 2nd | 475 | 94 | 192 |
CD_21_16911 | 1:200 | CD_22_06207_CL_D_SRG_1 | WGS_60X - 2nd | 194 | 44 | 182 |
CD_21_16912 | 1:200 | CD_22_06207_CL_D_SRG_1 | WGS_60X - 2nd | 247 | 38 | 56 |
CD_21_16908 | 1:200 | CD_22_10087_CL_D_SRG_1 | WGS_60X - 3rd | 171 | 42 | 64 |
CD_21_16909 | 1:200 | CD_22_10087_CL_D_SRG_1 | WGS_60X - 3rd | 292 | 60 | 86 |
CD_21_16910 | 1:200 | CD_22_10087_CL_D_SRG_1 | WGS_60X - 3rd | 475 | 139 | 290 |
CD_21_16911 | 1:200 | CD_22_10087_CL_D_SRG_1 | WGS_60X - 3rd | 194 | 67 | 299 |
CD_21_16912 | 1:200 | CD_22_10087_CL_D_SRG_1 | WGS_60X - 3rd | 247 | 69 | 108 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:400 | CD_21_17606_CL_D_SRG_1 | WGS_60X - 1st | 171 | 7 | 11 |
CD_21_16909 | 1:400 | CD_21_17606_CL_D_SRG_1 | WGS_60X - 1st | 292 | 34 | 41 |
CD_21_16910 | 1:400 | CD_21_17606_CL_D_SRG_1 | WGS_60X - 1st | 475 | 60 | 108 |
CD_21_16911 | 1:400 | CD_21_17606_CL_D_SRG_1 | WGS_60X - 1st | 194 | 30 | 92 |
CD_21_16912 | 1:400 | CD_21_17606_CL_D_SRG_1 | WGS_60X - 1st | 247 | 25 | 32 |
CD_21_16908 | 1:400 | CD_22_06208_CL_D_SRG_1 | WGS_60X - 2nd | 171 | 14 | 18 |
CD_21_16909 | 1:400 | CD_22_06208_CL_D_SRG_1 | WGS_60X - 2nd | 292 | 24 | 27 |
CD_21_16910 | 1:400 | CD_22_06208_CL_D_SRG_1 | WGS_60X - 2nd | 475 | 68 | 113 |
CD_21_16911 | 1:400 | CD_22_06208_CL_D_SRG_1 | WGS_60X - 2nd | 194 | 30 | 91 |
CD_21_16912 | 1:400 | CD_22_06208_CL_D_SRG_1 | WGS_60X - 2nd | 247 | 25 | 35 |
CD_21_16908 | 1:400 | CD_22_10088_CL_D_SRG_1 | WGS_60X - 3rd | 171 | 16 | 23 |
CD_21_16909 | 1:400 | CD_22_10088_CL_D_SRG_1 | WGS_60X - 3rd | 292 | 26 | 36 |
CD_21_16910 | 1:400 | CD_22_10088_CL_D_SRG_1 | WGS_60X - 3rd | 475 | 70 | 130 |
CD_21_16911 | 1:400 | CD_22_10088_CL_D_SRG_1 | WGS_60X - 3rd | 194 | 26 | 114 |
CD_21_16912 | 1:400 | CD_22_10088_CL_D_SRG_1 | WGS_60X - 3rd | 247 | 28 | 38 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:800 | CD_21_17607_CL_D_SRG_1 | WGS_60X - 1st | 171 | 5 | 11 |
CD_21_16909 | 1:800 | CD_21_17607_CL_D_SRG_1 | WGS_60X - 1st | 292 | 7 | 9 |
CD_21_16910 | 1:800 | CD_21_17607_CL_D_SRG_1 | WGS_60X - 1st | 475 | 20 | 35 |
CD_21_16911 | 1:800 | CD_21_17607_CL_D_SRG_1 | WGS_60X - 1st | 194 | 11 | 33 |
CD_21_16912 | 1:800 | CD_21_17607_CL_D_SRG_1 | WGS_60X - 1st | 247 | 9 | 10 |
CD_21_16908 | 1:800 | CD_22_06209_CL_D_SRG_1 | WGS_60X - 2nd | 171 | 6 | 8 |
CD_21_16909 | 1:800 | CD_22_06209_CL_D_SRG_1 | WGS_60X - 2nd | 292 | 13 | 18 |
CD_21_16910 | 1:800 | CD_22_06209_CL_D_SRG_1 | WGS_60X - 2nd | 475 | 27 | 49 |
CD_21_16911 | 1:800 | CD_22_06209_CL_D_SRG_1 | WGS_60X - 2nd | 194 | 21 | 68 |
CD_21_16912 | 1:800 | CD_22_06209_CL_D_SRG_1 | WGS_60X - 2nd | 247 | 12 | 15 |
CD_21_16908 | 1:800 | CD_22_10089_CL_D_SRG_1 | WGS_60X - 3rd | 171 | 5 | 9 |
CD_21_16909 | 1:800 | CD_22_10089_CL_D_SRG_1 | WGS_60X - 3rd | 292 | 11 | 17 |
CD_21_16910 | 1:800 | CD_22_10089_CL_D_SRG_1 | WGS_60X - 3rd | 475 | 27 | 49 |
CD_21_16911 | 1:800 | CD_22_10089_CL_D_SRG_1 | WGS_60X - 3rd | 194 | 21 | 65 |
CD_21_16912 | 1:800 | CD_22_10089_CL_D_SRG_1 | WGS_60X - 3rd | 247 | 9 | 9 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:1600 | CD_21_17604_CL_D_SRG_1 | WGS_60X - 1st | 171 | 4 | 4 |
CD_21_16909 | 1:1600 | CD_21_17604_CL_D_SRG_1 | WGS_60X - 1st | 292 | 8 | 10 |
CD_21_16910 | 1:1600 | CD_21_17604_CL_D_SRG_1 | WGS_60X - 1st | 475 | 11 | 23 |
CD_21_16911 | 1:1600 | CD_21_17604_CL_D_SRG_1 | WGS_60X - 1st | 194 | 8 | 29 |
CD_21_16912 | 1:1600 | CD_21_17604_CL_D_SRG_1 | WGS_60X - 1st | 247 | 6 | 9 |
CD_21_16908 | 1:1600 | CD_22_06206_CL_D_SRG_1 | WGS_60X - 2nd | 171 | 5 | 5 |
CD_21_16909 | 1:1600 | CD_22_06206_CL_D_SRG_1 | WGS_60X - 2nd | 292 | 2 | 2 |
CD_21_16910 | 1:1600 | CD_22_06206_CL_D_SRG_1 | WGS_60X - 2nd | 475 | 15 | 23 |
CD_21_16911 | 1:1600 | CD_22_06206_CL_D_SRG_1 | WGS_60X - 2nd | 194 | 12 | 31 |
CD_21_16912 | 1:1600 | CD_22_06206_CL_D_SRG_1 | WGS_60X - 2nd | 247 | 10 | 11 |
CD_21_16908 | 1:1600 | CD_22_10090_CL_D_SRG_1 | WGS_60X - 3rd | 171 | 3 | 3 |
CD_21_16909 | 1:1600 | CD_22_10090_CL_D_SRG_1 | WGS_60X - 3rd | 292 | 5 | 6 |
CD_21_16910 | 1:1600 | CD_22_10090_CL_D_SRG_1 | WGS_60X - 3rd | 475 | 17 | 26 |
CD_21_16911 | 1:1600 | CD_22_10090_CL_D_SRG_1 | WGS_60X - 3rd | 194 | 12 | 27 |
CD_21_16912 | 1:1600 | CD_22_10090_CL_D_SRG_1 | WGS_60X - 3rd | 247 | 10 | 11 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:3200 | CD_22_10091_CL_D_SRG_1 | WGS_60_high dilution - 1st | 171 | 5 | 5 |
CD_21_16909 | 1:3200 | CD_22_10091_CL_D_SRG_1 | WGS_60_high dilution - 1st | 292 | 2 | 2 |
CD_21_16910 | 1:3200 | CD_22_10091_CL_D_SRG_1 | WGS_60_high dilution - 1st | 475 | 9 | 12 |
CD_21_16911 | 1:3200 | CD_22_10091_CL_D_SRG_1 | WGS_60_high dilution - 1st | 194 | 10 | 14 |
CD_21_16912 | 1:3200 | CD_22_10091_CL_D_SRG_1 | WGS_60_high dilution - 1st | 247 | 3 | 5 |
CD_21_16908 | 1:3200 | CD_22_10094_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 171 | 2 | 3 |
CD_21_16909 | 1:3200 | CD_22_10094_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 292 | 7 | 9 |
CD_21_16910 | 1:3200 | CD_22_10094_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 475 | 14 | 19 |
CD_21_16911 | 1:3200 | CD_22_10094_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 194 | 11 | 19 |
CD_21_16912 | 1:3200 | CD_22_10094_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 247 | 4 | 5 |
CD_21_16908 | 1:3200 | CD_22_10097_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 171 | 1 | 1 |
CD_21_16909 | 1:3200 | CD_22_10097_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 292 | 2 | 2 |
CD_21_16910 | 1:3200 | CD_22_10097_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 475 | 13 | 17 |
CD_21_16911 | 1:3200 | CD_22_10097_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 194 | 5 | 7 |
CD_21_16912 | 1:3200 | CD_22_10097_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 247 | 1 | 1 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:6400 | CD_22_10092_CL_D_SRG_1 | WGS_60_high dilution - 1st | 171 | 2 | 2 |
CD_21_16909 | 1:6400 | CD_22_10092_CL_D_SRG_1 | WGS_60_high dilution - 1st | 292 | 0 | 0 |
CD_21_16910 | 1:6400 | CD_22_10092_CL_D_SRG_1 | WGS_60_high dilution - 1st | 475 | 3 | 4 |
CD_21_16911 | 1:6400 | CD_22_10092_CL_D_SRG_1 | WGS_60_high dilution - 1st | 194 | 9 | 12 |
CD_21_16912 | 1:6400 | CD_22_10092_CL_D_SRG_1 | WGS_60_high dilution - 1st | 247 | 1 | 1 |
CD_21_16908 | 1:6400 | CD_22_10095_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 171 | 1 | 2 |
CD_21_16909 | 1:6400 | CD_22_10095_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 292 | 2 | 2 |
CD_21_16910 | 1:6400 | CD_22_10095_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 475 | 8 | 13 |
CD_21_16911 | 1:6400 | CD_22_10095_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 194 | 2 | 2 |
CD_21_16912 | 1:6400 | CD_22_10095_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 247 | 1 | 1 |
CD_21_16908 | 1:6400 | CD_22_10098_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 171 | 2 | 3 |
CD_21_16909 | 1:6400 | CD_22_10098_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 292 | 4 | 5 |
CD_21_16910 | 1:6400 | CD_22_10098_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 475 | 4 | 8 |
CD_21_16911 | 1:6400 | CD_22_10098_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 194 | 5 | 12 |
CD_21_16912 | 1:6400 | CD_22_10098_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 247 | 4 | 4 |
Cell-line | 5MIX+NA12878 혼합비율 | Sample ID | Remark | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | 1:12800 | CD_22_10093_CL_D_SRG_1 | WGS_60_high dilution - 1st | 171 | 2 | 2 |
CD_21_16909 | 1:12800 | CD_22_10093_CL_D_SRG_1 | WGS_60_high dilution - 1st | 292 | 0 | 0 |
CD_21_16910 | 1:12800 | CD_22_10093_CL_D_SRG_1 | WGS_60_high dilution - 1st | 475 | 5 | 8 |
CD_21_16911 | 1:12800 | CD_22_10093_CL_D_SRG_1 | WGS_60_high dilution - 1st | 194 | 3 | 3 |
CD_21_16912 | 1:12800 | CD_22_10093_CL_D_SRG_1 | WGS_60_high dilution - 1st | 247 | 0 | 0 |
CD_21_16908 | 1:12800 | CD_22_10096_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 171 | 2 | 2 |
CD_21_16909 | 1:12800 | CD_22_10096_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 292 | 1 | 1 |
CD_21_16910 | 1:12800 | CD_22_10096_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 475 | 1 | 2 |
CD_21_16911 | 1:12800 | CD_22_10096_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 194 | 3 | 4 |
CD_21_16912 | 1:12800 | CD_22_10096_CL_D_SRG_1 | WGS_60_high dilution - 2nd | 247 | 1 | 1 |
CD_21_16908 | 1:12800 | CD_22_10099_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 171 | 0 | 0 |
CD_21_16909 | 1:12800 | CD_22_10099_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 292 | 1 | 2 |
CD_21_16910 | 1:12800 | CD_22_10099_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 475 | 5 | 5 |
CD_21_16911 | 1:12800 | CD_22_10099_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 194 | 0 | 0 |
CD_21_16912 | 1:12800 | CD_22_10099_CL_D_SRG_1 | WGS_60_high dilution - 3rd | 247 | 1 | 1 |
Cell-line | reference | Sample ID | Total fusion number of each cell-line | cfDNA Fusion Number | Reads Count |
CD_21_16908 | NA12878 | CD_22_06210_ET_D_SRG_1 | 171 | 0 | 0 |
CD_21_16909 | NA12878 | CD_22_06210_ET_D_SRG_1 | 292 | 0 | 0 |
CD_21_16910 | NA12878 | CD_22_06210_ET_D_SRG_1 | 475 | 0 | 0 |
CD_21_16911 | NA12878 | CD_22_06210_ET_D_SRG_1 | 194 | 0 | 0 |
CD_21_16912 | NA12878 | CD_22_06210_ET_D_SRG_1 | 247 | 0 | 0 |
암 세포주에 존재하는 구조 변이수를 의미하는 'Total fusion number of each cell-line (실시예 1의 원발암 시료 구조 변이에 대응)'은 각 암종에서 다른 세포주에 중복으로 존재하는 germline구조 변이를 제거한 후 각각 171, 292, 475, 194, 247 개였으며, 표 1 내지 표 8에 나타낸 바와 같이, 각 암세포주에 존재하는 구조 변이가 cfDNA BAM파일에서도 검출(cfDNA Fusion Number)되고, 이를 서포팅하는 지지 리드가 확인되었다 (reads count). 또한, 세포주가 섞이지 않은 레퍼런스 WGS에서는 각 세포주의 구조 변이 서열이 검출되지 않음을 확인하였다 (표9).
세포주를 이용한 실험의 민감도와 특이도를 정리한 결과를 표 10 및 도 3에 나타내었다.
Cancer cell purity | Detected/Total | Sensitivity | |
NA12878 + 5 cancer cell lines (1:100): 3 replicates | 1.0000% | 15/15 | 100.0% |
NA12878 + 5 cancer cell lines (1:200): 3 replicates | 0.5000% | 15/15 | 100.0% |
NA12878 + 5 cancer cell lines (1:400): 3 replicates | 0.2500% | 15/15 | 100.0% |
NA12878 + 5 cancer cell lines (1:800): 3 replicates | 0.1250% | 15/15 | 100.0% |
NA12878 + 5 cancer cell lines (1:1600): 3 replicates | 0.0625% | 15/15 | 100.0% |
NA12878 + 5 cancer cell lines (1:3200): 3 replicates | 0.0313% | 15/15 | 100.0% |
NA12878 + 5 cancer cell lines (1:6400): 3 replicates | 0.0156% | 14/15 | 93.3% |
NA12878 + 5 cancer cell lines (1:12800): 3 replicates | 0.0078% | 11/15 | 73.3% |
Cancer cell purity | Not detected/Total | Specificity | |
NA12878 | 0.0000% | 5/5 | 100.0% |
표 10에 정리된 바와 같이, 희석 배율을 높일수록 지지 리드의 수는 점차 감소하는 경향을 나타냈지만, 1:12,800까지 희석하더라도 구조 변이 서열을 확인할 수 있는 서포트 서열이 확인되고 약 73.3%의 높은 민감도로 검출할 수 있음을 확인하였다. 특히, 구조변이가 475개를 가지고 있는HCC1954의 경우 1:12,800으로 희석해도 100% 검출 할 수 있었다. 이는 본 발명의 방법을 이용하면 cfDNA 시료에 존재하는 구조 변이 서열을 매우 효과적으로 검출하여 암 환자의 미세잔존질환에 대한 정보를 제공할 수 있음을 의미한다.
1.3 임상 시료를 이용한 임상 검증 (Clinical validation)
본 발명의 방법을 이용하여 실제 환자의 혈액, cfDNA 에서도 변이를 효과적으로 검출가능한지 임상 검증 실험을 수행하였다.
시료를 환자의 원발암 조직, 혈액, 2가지 이상의 다른 시점에서 수득한 cfDNA1, cfDNA2 로 하여 실시예 1과 같은 분석 방법을 이용하였다.
각 암환자는 전이성 폐암환자이며, 각각 case1, case 2,로 기재하였다. 환자로부터 수득한 FFPE 암조직을 이용하여 약30X로 WGS 데이터가 생성되었고, 나머지 cfDNA 시료들로부터 평균 48X 정도의 WGS 데이터가 생성되었다.
구체적으로 환자의 FFPE 암조직을 시료로 하여 DELLY를 이용한 WGS 분석을 수행하고 BWA 의 default setting으로 alignment 하였으며, JuLI를 이용하여 2가지 분석툴에서 공통적으로 확인되는 환자의 공통 (consensus) 구조 변이를 확인하였다. 이를 JuLI output 포맷으로 활용하였다. 이후 서로 다른 시점에서 수득한 혈장 cfDNA샘플의 WGS에 의해 수득된BAM 파일과 상기에서 확인된 공통 (consensus) 구조 변이 데이터를 대응 참조 서열(counter reference sequence)과 비교하는 2단계 supporting read call 을 통해 cfDNA 구조 변이 서열을 확인하였다. 이를 통해 서로 다른 시점에서 수득한 환자의 혈장 내 존재하는 cfDNA 구조 변이를 보다 민감하게 검출할 수 있으므로, 환자에 남아있는 암 미세잔존질환에 대한 진단이 가능하다.
환자 Case 1
도 4 및 도 5는 Case 1의 분석결과이며, 각기 다른 시점인 2006.11.07, 2007.04.12 시점에 수득한cfDNA를 시료로 하여 구조 변이 서열을 확인한 결과를 각각 나타낸다. 도 4 및 도 5에서는 환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 동일하게 확인되는 것을 확인하였다.
본 발명의 효과를 검증하기 위하여 환자의 원발암을 패널 시퀀싱을 수행하여 암 돌연변이를 확인하고, 이를 cfDNA에서 확인하였다. 패널 시퀀싱을 통해 case 1 환자가 KRAS 변이를 약 30% 나타내는 환자임을 확인하였고, 동일 변이가 원발암, cfDNA-1 및cfDNA-2 의 WGS에서도 실제로 확인되었다. WGS에서 KRAS 변이 위치를 확인한 결과는 도6 에 나타내었다.
도 6에서는 원발암 조직에서 패널 시퀀싱과 비슷한 정도의 KRAS 변이가 검출 (36%)되는 것을 확인하였고, cfDNA-1, cfDNA-2 시료에서도 KRAS 변이가 19%, 6% 검출되어, 본 발명의 방법을 이용하면, cfDNA 시료의 구조 변이 서열 분석을 통해 미세잔존암을 확인할 수 있음을 검증하였다. 해당 환자에서 검출된 Read count 수는 하기 표 11과 같다.
cfDNA samples | Tumor Fusion Number | cfDNA Fusion Number | ReadsCount |
cfDNA-1 | 131 | 115 | 4122 |
cfDNA-2 | 131 | 112 | 1926 |
표 11에 따르면, case1 환자는 원발암 시료에서 분석한 결과 총 131개의 구조 변이 서열인 융합(fusion) 서열을 가지고 있는 환자로, 본 발명의 방법을 통해 cfDNA 에서도 구조 변이가 115 또는 112개 확인되며, 19% KRAS변이를 나타낸 cfDNA-1 시료에서 4122 개의 지지 리드, 6% KRAS 변이를 나타낸 cfDNA-2 시료에서 1926 개의 지지 리드가 확인되었다.
이는 혈장 cfDNA를 WGS 로 분석하는 종래 방법이 5% 이하의 변이는 검출하기 어려운 낮은 민감도를 나타내는 것과 비교하여, 본 발명은 6% 정도의 변이에서도 1900 개 이상의 리드를 나타내므로, 훨씬 우수한 검출능이 있음을 보여주는 결과이다.
환자 Case 2
도 7 및 도 8 는 Case 2의 분석결과이며, 각기 다른 시점인 2010.10.29, 2011.01.04 시점에 수득한cfDNA 를 시료로 하여 구조 변이 서열을 확인한 결과를 나타낸다. 도 7 및 도 8에서는 환자 유래 원발암 조직에서 확인된 구조 변이가 cfDNA-1 및 cfDNA-2 시료상에서도 확인됨을 나타낸다.
패널 시퀀싱을 통해 case 2 환자가 가지고 있는 돌연변이들을 원발암, cfDNA-1 및cfDNA-2 의 WGS에서도 실제로 확인하였고 이는 도9 및 도10에 나타내었다.
도 9에서 cfDNA-1, cfDNA-2에서 TP53변이가 각각2%, 0%, 도 10에는 SMARCA4 변이가 각각 5%, 2% 변이가 확인되었으나, 표 12에 나타낸 바와 같이, 2-5% 변이를 나타낸 cfDNA-1에서 128 개의 리드, 0-2% 변이에서 118 개의 리드가 확인되어, 2 내지 5% 이하의 낮은 대립유전자 빈도를 나타내는 시료에서도 구조 변이 존재를 나타내는 지지 리드가 충분히 검출됨을 확인하였다.
cfDNA samples | Tumor Fusion Number | cfDNA Fusion Number | Reads Count |
cfDNA-1 | 62 | 23 | 128 |
cfDNA-2 | 62 | 22 | 118 |
Claims (11)
1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및
2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자의 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 방법은 WGS의 시퀀싱 심도(depth)를 조절하여 검출 민감도를 조절하는 것을 특징으로 하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 WGS 분석 소프트웨어는 DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra, CNVnator 및 JuLI 로 이루어진 군에서 선택되는 2종 이상인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서,
상기 1) 단계는
1-1) DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra 및 CNVnator 로 이루어진 군에서 선택된 1종의 구조 변이 분석 소프트웨어로 원발암 시료의 제 1 구조 변이 위치 데이터를 얻는 단계; 및
1-2) 상기 1-1) 단계에서 수득된 제 1 구조 변이 위치 데이터를 JuLI 에 입력하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 를 순차적으로 수행하는 것을 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
상기 1) 단계는
1-1) DELLY, BRASS, SvABA, dRanger, Pindell, BreakDancer, GASV, Hydra 및 CNVnator 로 이루어진 군에서 선택된 1종의 구조 변이 분석 소프트웨어로 원발암 시료의 제 1 구조 변이 위치 데이터를 얻는 단계; 및
1-2) 상기 1-1) 단계에서 수득된 제 1 구조 변이 위치 데이터를 JuLI 에 입력하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 를 순차적으로 수행하는 것을 포함하는, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 cfDNA는 암 환자의 뇌척수액, 흉수, 심낭액, 복수, 소변, 전혈, 혈장 또는 혈청 유래인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 2) 단계의 암 환자의 cfDNA 는 암 치료 중 또는 암 치료 후의 환자에서 수득되는 것인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항의 구조 변이는 유전자의 복제, 결실, 전좌 및 삽입으로 이루어진 군에서 선택된 1종 이상인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
제1항에 있어서, 상기 암은 위암, 폐암, 비소세포성 폐암, 유방암, 난소암, 간암, 기관지암, 비인두암, 후두암, 췌장암, 방광암, 대장암, 결장암, 자궁경부암, 골암, 비소세포성 골암, 혈액암, 피부암(흑색종 등), 두부 또는 경부 암, 자궁암, 직장암, 항문 부근암, 결장암, 나팔관암, 자궁내막암, 질암, 음문암, 호지킨병(Hodgkin's disease), 식도암, 소장암, 내분비선암, 갑상선암, 부갑상선암, 부신암, 연조직 육종, 요도암, 음경암, 전립선암, 만성 또는 급성 백혈병, 림프구 림프종, 신장 또는 수뇨관암, 신장세포 암종, 신장골반암종, 배수성암(polyploid carcinoma), 침샘암, 육종암, 가성점액종, 간모세포종, 고환암, 교모세포종, 구순암, 난소생식세포종양, 기저세포암, 다발성골수종, 담낭암, 맥락막흑색종, 바터팽대부암, 복막암, 부신암, 설암, 소세포암, 소아림프종, 신경모세포종, 십이지장암, 요관암, 성상세포종, 수막종, 신우암, 외음부암, 흉선암, 중추신경계(central nervous system, CNS) 종양, 1차 중추신경계 림프종, 척수종양, 뇌간 신경교종 또는 뇌하수체 선종인, 암 환자 유래 cfDNA 시료에서 구조 변이 서열을 검출하는 방법.
1) 환자 유래 암 조직의 WGS (whole genome sequence)를 2가지 이상의 구조 변이 분석 소프트웨어로 분석하여 공통적으로 확인되는 원발암 시료의 공통 (consensus) 구조 변이 위치 데이터를 얻는 단계; 및
2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법.
2) 상기 1) 단계에서 획득한 구조 변이 위치의 참조 서열(reference sequence)과 해당 환자에서 암 치료 후 수득된 cfDNA WGS를 매칭하여, 공통 구조 변이 위치에 존재하는 구조 변이 서열 지지 리드 (supporting read)를 획득함으로써, cfDNA 시료 내 존재하는 구조 변이에 의해 발생한 특이 서열을 매칭하는 단계; 를 포함하는, 미세잔존질환(Minimal Residual Disease; MRD)에 대한 정보를 제공하는 방법.
제9항에 있어서, 상기 미세잔존질환에 대한 정보는 치료 중 또는 치료 후에 잔존하는 암세포 유무, 암 재발 가능성 또는 암 치료 예후에 대한 정보인, 방법.
제9항에 있어서, 상기 2) 단계의 치료는 방사선 요법, 면역요법, 호르몬 요법, 화학요법 치료 또는 외과적 절제 치료인, 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220131806A KR20240051739A (ko) | 2022-10-13 | 2022-10-13 | cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 |
PCT/KR2023/008217 WO2024080481A1 (ko) | 2022-10-13 | 2023-06-14 | Cfdna의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220131806A KR20240051739A (ko) | 2022-10-13 | 2022-10-13 | cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240051739A true KR20240051739A (ko) | 2024-04-22 |
Family
ID=90669400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220131806A KR20240051739A (ko) | 2022-10-13 | 2022-10-13 | cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20240051739A (ko) |
WO (1) | WO2024080481A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11261494B2 (en) * | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
CA3100345A1 (en) * | 2018-05-18 | 2019-11-21 | The Johns Hopkins University | Cell-free dna for assessing and/or treating cancer |
AU2020210912A1 (en) * | 2019-01-24 | 2021-01-21 | Illumina, Inc. | Methods and systems for monitoring organ health and disease |
US20230002831A1 (en) * | 2019-11-25 | 2023-01-05 | The Johns Hopkins University | Methods and compositions for analyses of cancer |
-
2022
- 2022-10-13 KR KR1020220131806A patent/KR20240051739A/ko unknown
-
2023
- 2023-06-14 WO PCT/KR2023/008217 patent/WO2024080481A1/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024080481A1 (ko) | 2024-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Heitzer et al. | Recommendations for a practical implementation of circulating tumor DNA mutation testing in metastatic non-small-cell lung cancer | |
De Luca et al. | Mutational analysis of single circulating tumor cells by next generation sequencing in metastatic breast cancer | |
Kamel et al. | Exploitation of gene expression and cancer biomarkers in paving the path to era of personalized medicine | |
Osumi et al. | Clinical relevance of circulating tumor DNA assessed through deep sequencing in patients with metastatic colorectal cancer | |
Spratt et al. | Transcriptomic heterogeneity of androgen receptor activity defines a de novo low AR-active subclass in treatment naive primary prostate cancer | |
Zehir et al. | Mutational landscape of metastatic cancer revealed from prospective clinical sequencing of 10,000 patients | |
Wang et al. | Genomic consequences of aberrant DNA repair mechanisms stratify ovarian cancer histotypes | |
Pirker et al. | Consensus for EGFR mutation testing in non-small cell lung cancer: results from a European workshop | |
Przybyl et al. | Combination approach for detecting different types of alterations in circulating tumor DNA in leiomyosarcoma | |
Haley et al. | Performance characteristics of next-generation sequencing in clinical mutation detection of colorectal cancers | |
Mayo-de-Las-Casas et al. | An update on liquid biopsy analysis for diagnostic and monitoring applications in non-small cell lung cancer | |
Lih et al. | Analytical validation and application of a targeted next-generation sequencing mutation-detection assay for use in treatment assignment in the NCI-MPACT trial | |
D’Haene et al. | Clinical application of targeted next-generation sequencing for colorectal cancer patients: a multicentric Belgian experience | |
Ballester et al. | Molecular classification of adult diffuse gliomas: conflicting IDH1/IDH2, ATRX, and 1p/19q results | |
Kamalakaran et al. | Translating next generation sequencing to practice: opportunities and necessary steps | |
Kumar et al. | Biomarkers of diseases in medicine | |
Bruzek et al. | Electronic DNA analysis of CSF cell-free tumor DNA to quantify multi-gene molecular response in pediatric high-grade glioma | |
Gupta et al. | Discordant and heterogeneous clinically relevant genomic alterations in circulating tumor cells vs plasma DNA from men with metastatic castration resistant prostate cancer | |
Moorcraft et al. | Investigating the feasibility of tumour molecular profiling in gastrointestinal malignancies in routine clinical practice | |
Kerachian et al. | Cell free circulating tumor nucleic acids, a revolution in personalized cancer medicine | |
Orzan et al. | Liquid biopsy of cerebrospinal fluid enables selective profiling of glioma molecular subtypes at first clinical presentation | |
Lee et al. | Clinical utility of a fully automated microsatellite instability test with minimal hands-on time | |
Hondelink et al. | The sensitivity of pan-TRK immunohistochemistry in solid tumours: a meta-analysis | |
Antoniotti et al. | Tumour mutational burden, microsatellite instability, and actionable alterations in metastatic colorectal cancer: Next-generation sequencing results of TRIBE2 study | |
Fu et al. | Improving the performance of somatic mutation identification by recovering circulating tumor DNA mutations |