KR20230025895A - 순환 종양 핵산 분자의 다중모드 분석 - Google Patents

순환 종양 핵산 분자의 다중모드 분석 Download PDF

Info

Publication number
KR20230025895A
KR20230025895A KR1020237002210A KR20237002210A KR20230025895A KR 20230025895 A KR20230025895 A KR 20230025895A KR 1020237002210 A KR1020237002210 A KR 1020237002210A KR 20237002210 A KR20237002210 A KR 20237002210A KR 20230025895 A KR20230025895 A KR 20230025895A
Authority
KR
South Korea
Prior art keywords
cancer
cell
dna
nucleic acid
free
Prior art date
Application number
KR1020237002210A
Other languages
English (en)
Inventor
스콧 빅터 브래트만
저스틴 매튜 버제너
드 카르발호 다니엘 디니즈
Original Assignee
유니버시티 헬스 네트워크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유니버시티 헬스 네트워크 filed Critical 유니버시티 헬스 네트워크
Publication of KR20230025895A publication Critical patent/KR20230025895A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)

Abstract

한 측면에서, 대상체에서 암세포로부터의 ctDNA의 존재를 검출하는 방법으로서, (a) 대상체로부터 무세포 DNA의 샘플을 제공하는 단계; (b) 무세포 메틸화된 DNA의 후속 시퀀싱을 허용하기 위해 샘플에 대해 라이브러리 제조를 수행하는 단계; (c) 임의로 제1양의 필러(filler) DNA를 상기 샘플에 첨가한 후, 임의로 상기 샘플을 더 변성시키는 단계로서, 상기 필러 DNA의 적어도 일부가 메틸화된 것인 단계; (d) 메틸화된 폴리뉴클레오타이드에 대해 선택적인 결합제를 사용하여 무세포 메틸화된 DNA를 포획하는 단계; (e) 포획된 무세포 메틸화된 DNA를 시퀀싱하는 단계; (f) 포획된 무세포 메틸화된 DNA의 서열을 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열과 비교하는 단계; (g) 포획된 무세포 메틸화된 DNA의 하나 이상의 서열과 암 개체로부터의 무세포 메틸화된 DNA 서열 사이에 통계적으로 유의미한 유사성이 있는 경우 암세포로부터의 DNA의 존재를 확인하는 단계를 포함하는 방법을 제공하는 것으로, 여기서 포획 단계, 비교 단계 또는 확인 단계 중 적어도 하나에서 대상체 무세포 메틸화된 DNA는 단편 길이 메트릭(metric)에 따라 하위집단으로 제한된다.

Description

순환 종양 핵산 분자의 다중모드 분석
교차참조
본원은 전체적으로 본원에 참고로 포함되는, 2020년 6월 19일에 출원된 미국 가특허출원 제63/041,151호의 이익을 주장한다.
배경기술
순환 종양 DNA(ctDNA)는 일상적인 임상 사용을 위한 비-침습적 종양 특이적 바이오마커로서 점점 더 잠재력을 입증하고 있다. ctDNA는 주로 세포 사멸을 겪고 있는 종양 세포로부터 유래하고 혈액을 비롯한 다양한 체액의 순환계로 방출된다. 대다수의 암 환자들에서, 대다수의 혈액 유래 무세포 DNA는 말초 혈액 백혈구(PBL)로부터 유래하므로; 종양 유래 유전적 및 후성적 변경의 확인이 ctDNA 검출 및 정량을 위해 요구된다. 또한, 관찰된 ctDNA의 분율은 종양의 원발성 부위 및 질환 부담을 비롯한 여러 요인에 따라 진단 시 총 무세포 DNA의 0.1% 미만 내지 90%일 수 있다. ctDNA는 종양의 분자 환경과 질환 부담(burden)에의 비-침습적 접근을 제공하고 있다. 특히 ctDNA의 존재량(abundance)이 낮은 대상체에서 증가된 민감도로 ctDNA를 검출하는 방법이 필요하다.
참고에 의한 포함
본 명세서에서 언급된 모든 간행물, 특허 및 특허출원은 각각의 개별 간행물, 특허 또는 특허출원이 구체적 및 개별적으로 참고로 포함되는 것으로 표시된 것처럼 동일한 정도로 본원에 참고로 포함된다.
한 측면에서, 대상체에서 암세포로부터의 ctDNA의 존재를 검출하는 방법으로서,
(a) 대상체로부터 무세포 DNA의 샘플을 제공하는 단계;
(b) 무세포 메틸화된 DNA의 후속 시퀀싱을 허용하기 위해 샘플에 대해 라이브러리 제조를 수행하는 단계;
(c) 임의로 제1양의 필러 DNA를 상기 샘플에 첨가한 후, 임의로 샘플을 추가로 변성시키는 단계로서, 여기서 상기 필러 DNA의 적어도 일부가 메틸화된 것인 단계;
(d) 메틸화된 폴리뉴클레오타이드에 대해 선택적인 결합제를 사용하여 무세포 메틸화된 DNA를 포획하는 단계;
(e) 포획된 무세포 메틸화된 DNA를 시퀀싱하는 단계;
(f) 포획된 무세포 메틸화된 DNA의 서열을 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열과 비교하는 단계;
(g) 포획된 무세포 메틸화된 DNA의 하나 이상의 서열과 암 개체로부터의 무세포 메틸화된 DNA 서열 사이에 통계적으로 유의미한 유사성이 있는 경우 암세포로부터의 DNA의 존재를 확인하는 단계
를 포함하는 방법을 제공하는 것으로, 여기서 포획 단계, 비교 단계 또는 확인 단계 중 적어도 하나에서 대상체 무세포 메틸화된 DNA는 단편 길이 메트릭(metric)에 따라 하위집단으로 제한된다.
한 측면에서, 본 개시내용은 대상체가 질환을 갖거나 가질 위험이 있는지를 확인하는 방법을 제공한다. 이 방법은 상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여, (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일로 구성된 군으로부터 선택된 적어도 하나의 프로파일을 생성하는 단계; 및 상기 적어도 하나의 프로파일을 프로세싱하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 적어도 80%의 민감도 또는 적어도 약 90%의 특이성으로 확인하는 단계를 포함하고, 여기서 상기 무세포 핵산 샘플은 30 나노그램(ng)/밀리리터(㎖) 미만의 상기 복수의 핵산 분자를 포함한다.
일부 실시양태에서, 무세포 핵산 샘플은 10 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함한다. 일부 실시양태에서, 무세포 핵산 샘플은 5 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함한다. 일부 실시양태에서, 무세포 핵산 샘플은 1 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함한다. 일부 실시양태에서, (a)의 시퀀싱은 (i), (ii) 및 (iii)으로 구성된 군으로부터 선택된 적어도 2개의 프로파일을 생성한다. 일부 실시양태에서, 적어도 2개의 프로파일은 상기 메틸화 프로파일 및 상기 단편 길이 프로파일을 포함한다.
일부 실시양태에서, 적어도 2개의 프로파일은 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 포함한다. 일부 실시양태에서, 적어도 2개의 프로파일은 상기 메틸화 프로파일 및 상기 돌연변이 프로파일을 포함한다. 일부 실시양태에서, (a)의 시퀀싱은 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 생성한다.
또 다른 측면에서, 본 개시내용은 대상체의 무세포 핵산 샘플을 프로세싱하여, 상기 대상체가 질환을 갖거나 가질 위험이 있는지를 확인하는 방법을 제공한다. 이 방법은 복수의 핵산 분자를 포함하는 상기 무세포 핵산 샘플을 제공하는 단계; 상기 복수의 핵산 분자 또는 이의 유도체를 시퀀싱하여 복수의 시퀀싱 리드(read)를 생성하는 단계; 상기 복수의 시퀀싱 리드를 컴퓨터 프로세싱하여, 상기 복수의 핵산 분자에 대해 (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일을 확인하는 단계; 및 적어도 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 사용하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 확인하는 단계를 포함한다.
일부 실시양태에서, 질환은 암을 포함한다. 일부 실시양태에서, 암은 부신암, 항문암, 담도암, 방광암, 골암, 뇌/cns 종양, 유방암, 캐슬맨병(castleman disease), 자궁경부암, 결장/직장암, 자궁내막암, 식도암, 유잉(ewing) 계열의 종양, 안암, 담낭암, 위장 카르시노이드 종양, 위장 기질 종양(gist), 임신성 영양막 질환, 호지킨병, 카포시 육종, 신장암, 후두 및 하인두암, 백혈병(급성 림프구성, 급성 골수성, 만성 림프구성, 만성 골수성, 만성 골수단핵구성), 간암, 폐암(비-소세포, 소세포, 폐 카르시노이드 종양), 림프종, 피부의 림프종, 악성 중피종, 다발성 골수종, 골수이형성 증후군, 비강 및 부비동암, 비인두암, 신경모세포종, 비-호지킨 림프종, 구강 및 구인두암, 골육종, 난소암, 음경암, 뇌하수체 종양, 전립선암, 망막모세포종, 횡문근육종, 침샘암, 육종 - 성인 연조직암, 피부암(기저 및 편평 세포, 흑색종, 메르켈 세포), 소장암, 위암, 고환암, 흉선암, 갑상선암, 자궁 육종, 질암, 외음부암, 발덴스트롬 마크로글로불린혈증, 윌름스 종양, 편평 세포 암종, 및 두경부 편평 세포 암종으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 암은 편평 세포 암종이다. 일부 실시양태에서, 암은 두경부 편평 세포 암종이다.
일부 실시양태에서, 복수의 무세포 핵산 분자는 순환 종양 핵산 분자를 포함한다. 일부 실시양태에서, 순환 종양 핵산은 순환 종양 DNA를 포함한다. 일부 실시양태에서, 순환 종양 핵산은 순환 종양 RNA를 포함한다. 일부 실시양태에서, 메틸화 프로파일은 복수의 차등적으로 메틸화된 영역(Differentially Methylated Region; DMR)을 포함한다. 일부 실시양태에서, 복수의 DMR은 ctDNA로부터 유래한다. 일부 실시양태에서, 말초 혈액 백혈구로부터 유래한 복수의 DMR은 상기 메틸화 프로파일로부터 제거된다. 일부 실시양태에서, 복수의 DMR은 정상적인 건강한 대상체로부터의 상응하는 게놈 영역에 비해 과소메틸화 수준을 가진 적어도 약 56개의 게놈 영역을 포함한다. 일부 실시양태에서, 복수의 DMR은 정상적인 건강한 대상체로부터의 상응하는 게놈 영역에 비해 과다메틸화 수준을 가진 적어도 약 941개의 게놈 영역을 포함한다. 일부 실시양태에서, DMR은 적어도 약 300 bp의 크기를 포함한다. 일부 실시양태에서, DMR은 적어도 약 100 bp 내지 적어도 약 200 bp의 크기를 포함한다. 일부 실시양태에서, DMR은 적어도 약 100 bp 내지 적어도 약 150 bp의 크기를 포함한다. 일부 실시양태에서, DMR은 적어도 8개의 CpG 게놈 아일랜드(island)를 포함한다. 일부 실시양태에서, 정상적인 건강한 대상체는 상기 대상체와 동일한 세트의 위험 요인을 포함한다.
일부 실시양태에서, 돌연변이 프로파일은 미스센스 변이체, 넌센스 변이체, 결실 변이체, 삽입 변이체, 중복 변이체, 역위 변이체, 프레임쉬프트 변이체 또는 반복부 확장 변이체를 포함한다. 일부 실시양태에서, 복수의 말초 혈액 백혈구로부터 수득된 게놈 DNA 샘플에 존재하는 임의의 변이체는 돌연변이 프로파일로부터 제거되고, 여기서 상기 복수의 말초 혈액 백혈구는 상기 대상체로부터 수득된다. 일부 실시양태에서, 클론 조혈로부터 유래한 임의의 변이체는 상기 돌연변이 프로파일로부터 제거된다. 일부 실시양태에서, 돌연변이 프로파일은 유전자 DNMT3A, TET2 또는 ASXL1의 변이체를 포함하지 않는다. 일부 실시양태에서, 돌연변이 프로파일은 정규 암 유발제 유전자를 포함하지 않는다. 일부 실시양태에서, 돌연변이 프로파일은 비-정규 암 유발제 유전자를 포함하고, 여기서 상기 비-정규 유전자는 GRIN3A 또는 MYC이다.
일부 실시양태에서, 단편 길이 프로파일은 약 적어도 80 bp 내지 170 bp의 단편 길이 범위를 기준으로 무세포 핵산 분자를 선택하는 것을 포함한다. 일부 실시양태에서, 단편 길이 프로파일은 약 적어도 100 bp 내지 150 bp의 단편 길이 범위를 기준으로 무세포 핵산 분자를 선택하는 것을 포함한다. 일부 실시양태에서, 순환 종양 핵산 분자는 농후화된다.
일부 실시양태에서, 상기 방법은 상기 무세포 핵산 샘플을 필러 DNA 분자와 혼합하여 DNA 혼합물을 제공하는 단계를 추가로 포함한다. 일부 실시양태에서, 필러 DNA 분자는 약 50 bp 내지 800 bp의 길이를 포함한다. 일부 실시양태에서, 필러 DNA 분자는 약 100 bp 내지 600 bp의 길이를 포함한다. 일부 실시양태에서, 필러 DNA 분자는 적어도 약 5%의 메틸화된 필러 DNA 분자를 포함한다. 일부 실시양태에서, 필러 DNA 분자는 적어도 약 20%의 메틸화된 필러 DNA를 포함한다. 일부 실시양태에서, 필러 DNA 분자는 적어도 약 30%의 메틸화된 필러 DNA를 포함한다. 일부 실시양태에서, 필러 DNA 분자는 적어도 약 50%의 메틸화된 필러 DNA를 포함한다.
일부 실시양태에서, 상기 방법은 상기 DNA 혼합물을 메틸화된 뉴클레오타이드에 결합하도록 구성된 결합제와 함께 인큐베이션하여 농후화된 샘플을 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 결합제는 메틸-CpG 결합 도메인을 포함하는 단백질을 포함한다. 일부 실시양태에서, 이 단백질은 MBD2 단백질이다. 일부 실시양태에서, 결합제는 항체를 포함한다. 일부 실시양태에서, 항체는 5-MeC 항체이다. 일부 실시양태에서, 항체는 5-하이드록시메틸 사이토신 항체이다. 일부 실시양태에서, 시퀀싱은 중아황산염 시퀀싱을 포함하지 않는다. 일부 실시양태에서, 무세포 핵산 샘플은 혈액 샘플을 포함한다. 일부 실시양태에서, 혈액 샘플은 혈장 샘플을 포함한다. 일부 실시양태에서, 상기 방법은 암 조직의 기원을 검출하는 단계를 추가로 포함한다.
일부 실시양태에서, 상기 방법은 상기 대상체의 생존율의 예후를 포함하는 보고서를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 상기 방법은 상기 대상체에게 치료를 제공하는 단계를 추가로 포함한다. 일부 실시양태에서, 상기 질환의 치료 후, 상기 방법은 상기 치료가 효과적인지를 표시하는 제2 보고서를 제공하는 단계도 포함한다.
또 다른 측면에서, 본 개시내용은 대상체가 병태를 갖거나 가질 위험이 있는지를 확인하는 방법으로서, 상기 대상체로부터의 샘플의 적어도 일부로부터 무세포 핵산 분자를 어세이하는 단계; 표 5에 나열된 차등적으로 메틸화된 영역(DMR)에 포함된 상기 무세포 핵산 분자의 적어도 일부의 메틸화 수준을 검출하는 단계; 및 적어도 하나의 컴퓨터 프로세서를 이용하여, (b)에서 검출된 상기 메틸화 수준을 표 5에 나열된 상기 DMR에 포함된 상기 무세포 핵산 분자의 상응하는 부분(들)의 메틸화 수준과 비교하는 단계를 포함하는 방법을 제공한다.
일부 실시양태에서, 무세포 핵산 분자는 ctDNA를 포함한다. 일부 실시양태에서, 상기 방법은 서열 분석을 수행하는 단계를 포함하고, 여기서 상기 시퀀싱 분석은 무세포 메틸화된 DNA 면역침전(cfMeDIP) 시퀀싱을 포함한다. 일부 실시양태에서, 검출은 표 5에 나열된 6개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 40개 이상, 50개 이상, 60개 이상, 70개 이상, 80개 이상, 90개 이상 또는 100개 이상의 DMR에 포함된 상기 핵산 분자의 적어도 일부의 메틸화 수준을 측정하는 단계를 포함한다.
또 다른 측면에서, 본 개시내용은 대상체가 질환에 대한 치료를 받은 후 더 높은 생존율을 갖는지를 확인하는 방법으로서, 상기 대상체로부터의 샘플의 적어도 일부로부터 무세포 핵산 분자를 어세이하는 단계; 표 6에 나열된 차등적으로 메틸화된 영역(DMR)에 포함된 상기 무세포 핵산 분자의 적어도 일부의 메틸화 수준을 검출하는 단계; 및 적어도 하나의 컴퓨터 프로세서를 이용하여, (b)에서 검출된 상기 메틸화 수준을 표 6에 나열된 상기 DMR에 포함된 상기 무세포 핵산 분자의 상응하는 부분(들)의 메틸화 수준으로 프로세싱하는 단계를 포함하는 방법을 제공한다.
일부 실시양태에서, 무세포 핵산 분자는 ctDNA를 포함한다. 일부 실시양태에서, 검출은 복합 메틸화 점수(CMS)를 제공하는 것을 포함한다. 일부 실시양태에서, CMS는 표 6에 나열된 DMR의 베타-값의 합계를 포함한다. 일부 실시양태에서, 더 높은 CMS는 상기 대상체에 대한 더 낮은 생존을 표시한다. 일부 실시양태에서, CMS는 ctDNA의 존재량에 의존하지 않는다. 일부 실시양태에서, 질환은 편평 세포 암종이다. 일부 실시양태에서, 암은 두경부 편평 세포 암종이다.
또 다른 측면에서, 본 개시내용은 대상체가 질환을 갖거나 가질 위험이 있는지를 확인하는 시스템으로서, 상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여, (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일 중 적어도 하나의 프로파일을 생성하는 단계; 및 상기 적어도 하나의 프로파일을 프로세싱하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 적어도 80%의 민감도 또는 적어도 약 90%의 특이성으로 확인하는 단계를 포함하는 프로세스를 구현하도록 개별적으로 또는 집합적으로 프로그래밍된 하나 이상의 컴퓨터 프로세서를 포함하는 시스템을 제공하는 것으로, 여기서 상기 무세포 핵산 샘플은 30 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함한다.
또 다른 측면에서, 본 개시내용은 대상체의 무세포 핵산 샘플을 프로세싱하여, 상기 대상체가 질환을 갖거나 가질 위험이 있는지를 확인하는 시스템으로서, 복수의 핵산 분자를 포함하는 상기 무세포 핵산 샘플을 제공하는 단계; 상기 복수의 핵산 분자 또는 이의 유도체를 시퀀싱하여 복수의 시퀀싱 리드를 생성하는 단계; 상기 복수의 시퀀싱 리드를 컴퓨터 프로세싱하여, 상기 복수의 핵산 분자에 대해 (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일을 확인하는 단계; 및 적어도 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 사용하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 확인하는 단계를 포함하는 프로세스를 구현하도록 개별적으로 또는 집합적으로 프로그래밍된 하나 이상의 컴퓨터 프로세서를 포함하는 시스템을 제공한다.
본 발명의 바람직한 실시양태의 이들 및 다른 특징은 첨부된 도면을 참조하는 하기 상세한 설명에서 더 명백해질 것이다:
도 1. CAPP-Seq에 의한 ctDNA 검출을 위한 PBL 여과의 활용. A) 일치된 환자 혈장 및/또는 PBL에서 확인된 후보 SNV의 돌연변이체 대립유전자 분율. 일치된 환자 혈장과 PBL 둘 다에서 엄격하게 발견된 SNV에 대해 피어슨(Pearson) 상관관계를 수행하였다. 환자 혈장에서만 발견된 후보 SNV는 적색 파선 상자 내에 표시되어 있다. B) 일치된 환자 혈장과 PBL 둘 다에서 확인된 후보 SNV의 온코프린트(Oncoprint). 상단 히스토그램은 환자당 SNV의 수를 나타내는 반면, 오른쪽 히스토그램은 돌연변이된 특정 유전자를 가진 환자의 수를 나타낸다. C) PBL 관련 SNV 제거의 전 및 후 HNSCC 환자 cfDNA(적색 원) 및 PBL(청색 원) 전체에 걸쳐 후보 SNV의 평균 MAF. PBL 여과 후 SNV가 없는 환자는 ctDNA의 거짓 양성 검출을 표시한다. E) 32명의 HNSCC 환자들 중 20명의 환자들에서 확인된 선택된 PBL-여과된 SNV의 온코프린트. 상단 및 오른쪽 히스토그램은 앞서 (B)에 기재된 것을 나타낸다. F) 모든 HNSCC 환자들 전체에 걸쳐 PBL-여과된 SNV의 평균 돌연변이체 대립유전자 백분율. 환자당 각각의 SNV에 대해, SNV 염기쌍 위치와 중첩되는 천연 서열을 함유하는 리드에 비해 관심 있는 SNV를 함유하는 리드의 분율로 돌연변이체 대립유전자 백분율을 계산하였다.
도 2. CAPP-Seq에 의한 ctDNA 검출을 위한 PBL 여과 활용. B) 일치된 환자 혈장 및/또는 PBL에서 확인된 후보 SNV의 돌연변이체 대립유전자 분율. 일치된 환자 혈장과 PBL 둘 다에서 엄격하게 발견된 SNV에 대해 피어슨 상관관계를 수행하였다. 환자 혈장에서만 발견된 후보 SNV는 적색 파선 상자 내에 표시되어 있다. C) 일치된 환자 혈장과 PBL 둘 다에서 확인된 후보 SNV의 온코프린트. 상단 히스토그램은 환자당 SNV의 수를 나타내는 반면, 오른쪽 히스토그램은 돌연변이된 특정 유전자를 가진 환자의 수를 나타낸다. D) PBL 관련 SNV 제거의 전 및 후 HNSCC 환자 cfDNA(적색 원) 및 PBL(청색 원) 전체에 걸쳐 후보 SNV의 평균 MAF. PBL 여과 후 SNV가 없는 환자는 ctDNA의 거짓 양성 검출을 표시한다. E) 32명의 HNSCC 환자들 중 20명의 환자들에서 확인된 선택된 PBL-여과된 SNV의 온코프린트. 상단 및 오른쪽 히스토그램은 앞서 (B)에 기재된 것을 나타낸다. F) 모든 HNSCC 환자들 전체에 걸쳐 PBL-여과된 SNV의 평균 돌연변이체 대립유전자 백분율. 환자당 각각의 SNV에 대해, SNV 염기쌍 위치와 중첩되는 천연 서열을 함유하는 리드에 비해 관심 있는 SNV를 함유하는 리드의 분율로 돌연변이체 대립유전자 백분율을 계산하였다.
도 3. cfMeDIP-seq에 의한 ctDNA 검출을 위한 정보제공 영역의 확인. B) FaDu 게놈 DNA(gDNA)[1 x 1 x 52 비교], 일치되지 않은 PBL gDNA[1 x 51 x 52 비교] 및 일치된 PBL gDNA[1 x 1 x 52 비교] MeDIP-seq 프로파일에 비해 환자 및 건강한 기증자 cfDNA cfMeDIP-seq 프로파일(n = 52)로부터 8개 이상의 CpG를 가진 300 bp 비-중첩 윈도우(window)의 피어슨 상관관계. C) 건강한 기증자(오른쪽) 및 HNSCC(왼쪽) PBL MeDIP-seq 프로파일에서 인-실리코(in-silico) PBL 고갈의 수행. MeDEStrand(방법)를 통해 MeDIP-seq 카운트로부터 절대 메틸화 점수를 계산하였다. PBL 고갈 전 300 bp 비-중첩 윈도우(청색)는 8개 이상의 CpG를 가진, 1번 염색체 내지 22번 염색체로부터의 모든 윈도우에 상응한다(n = 702,488). PBL 고갈 후 300 bp 비-중첩 윈도우(적색)는 건강한 기증자 PBL 전체에 걸쳐 중간 절대 메틸화가 0.1 미만인 경우 추가 필터를 포함한다(n = 99,997). D) HNSCC 및 건강한 기증자 cfMeDIP-seq 프로파일의 차등 메틸화 분석에 의한 ctDNA 검출의 워크플로우. CAPP-Seq에 의해 검출 가능한 SNV를 가진 HNSCC 환자(즉, CAPP-Seq 양성, n = 20)로부터의 cfMeDIP-seq 프로파일을 PBL-고갈된 윈도우 내에서 건강한 기증자(n = 20)와 비교하여 HNSCC 관련 cfDNA 메틸화를 확인하였다. 과다메틸화된 영역과 과소메틸화된 영역은 10% 미만의 FDR에서 건강한 기증자에 비해 HNSCC 코호트에서 더 높거나 더 낮은 메틸화를 가진 영역으로서 표시된다. E) CpG 부위로 해석된 과다메틸화된 영역의 순열 분석(n = 총 10,000개 순열). 유의미한 농후화/고갈은 0.05 미만의 p-값을 가진 관찰된 z-점수로서 표시된다. F) TCGA로부터의 종양 특이적 메틸화된 사이토신 내의 과다메틸화된 영역의 순열 분석(n = 총 1000개 순열). 유의미한 농후화/고갈은 0.05 미만의 p-값을 가진 관찰된 z-점수로서 표시된다.
도 4. CAPP-Seq 프로파일과 cfMeDIP-seq 프로파일 사이의 ctDNA 검출 및 존재량의 일치. A) CAPP-seq에 의해 HNSCC 환자 전체에서 검출된 SNV의 중간 단편 길이. 각각의 환자에 대해, 각각의 SNV 및 일치된 기준 대립유전자의 중간 단편 길이를 측정하였다. 각각의 돌연변이 또는 일치된 기준 대립유전자에 대한 중간 단편 길이의 분포는 환자별로 표시되어 있다. 상자와 중심선의 극단은 각각 상위 및 하위 사분위수와 중앙값을 정의한다. 단일 SNV가 있는 경우, 유색 선은 각각 SNV 또는 일치된 기준 대립유전자를 함유하는 단편의 중간 길이를 나타낸다. B) cfMeDIP-seq에 의한 HNSCC 과다메틸화된 영역 내의 단편 길이 분포. 건강한 기증자로부터의 단편 길이를 분석 전에 풀링하였는데, 여기서 각각의 후속 상자는 개별 HNSCC cfMeDIP-seq 프로파일을 표시한다. 상자와 중심선의 극단은 각각 상위 및 하위 사분위수와 중앙값을 정의한다. 과다메틸화된 영역 내의 증가하는 평균 메틸화(RPKM)를 기준으로 개별 HNSCC 샘플의 순서를 정한다. 청색 파선은 모든 건강한 기증자들 전체에 걸쳐 중간 단편 길이를 정의한다. C) 100 내지 220 bp의 단편에 의한 과다-DMR 영역에 대한 농후화에 비해 100 내지 150 bp의 단편에 의한 과다-DMR 영역에 대한 농후화의 비. 비는 용이한 해석을 위해 퍼센트 증가/감소로 전환되었다. D) 100 내지 220 bp의 단편에 의한 과다-DMR 영역에 대한 농후화에 비해 100 내지 150 bp의 단편에 의한 과다-DMR 영역에 대한 농후화의 비. + 기호는 CAPP-Seq에 의해 검출 가능한 ctDNA를 가진 HNSCC 환자(CAPP-Seq 양성)를 나타낸다. E) HNSCC 과다메틸화된 영역 전체에 걸쳐 로그 변환된 RPKM 값에 의해 100 내지 150 bp로 제한된 cfMeDIP-seq 프로파일의 지도 계층 분류(supervised hierarchal classification). 각각의 cfMeDIP-seq 프로파일에 대한 RPKM 값을 유클리드(Euclidean) 변환 전에 log2 변환하고 와드(Ward)의 방법을 이용하여 클러스터링하였다. 메틸화 클러스터는 k = 4의 역치에서 정의되었다. F) 각각 CAPP-seq 및 cfMeDIP-seq(100 내지 150 bp로 제한됨)에 의해 확인된 SNV 및 과다메틸화된 영역으로부터의 평균 돌연변이체 대립유전자 빈도와 평균 RPKM의 관계. 점은 HNSCC 또는 건강한 기증자 혈장으로부터의 개별 샘플을 표시한다. 적색 실선 및 회색 음영 영역은 각각 피팅된 선형 회귀 모델 및 관련 95% 신뢰구간을 표시한다. G) HNSCC를 건강한 기증자 cfMeDIP-seq 프로파일과 비교하는, HNSCC 과다메틸화된 영역 내의 메틸화 값(100 내지 150 bp로 제한됨)에 기반한 AUROC 분석. ctDNA의 검출은 평균 메틸화가 건강한 기증자에 대한 최대값보다 더 높은 경우로서 정의되었다. H) 메틸화 클러스터 4에 비해 메틸화 클러스터 1 + 2 + 3 내에서 환자의 전체 생존에 대한 카플란-마이어(Kaplan-Meier) 곡선 분석. I + J) CAPP-Seq 및 cfMeDIP-seq 프로파일로부터의 중간 단편 길이의 비교(I), 및 CAPP-Seq로부터의 중간 단편 길이 및 cfMeDIP-seq 프로파일로부터의 100 내지 150:151 내지 220 bp 비(J). 점은 메틸화 클러스터 1과 2 내의 개별 HNSCC 샘플을 정의하였다. 적색 실선 및 회색 음영 영역은 각각 피팅된 선형 회귀 모델 및 95% 신뢰구간을 나타낸다.
도 5. cfMeDIP-seq에 의해 검출된 ctDNA 내의 특정 메틸화된 영역의 예후 유용성. A) 각각 CAPP-seq 및 cfMeDIP-seq(100 내지 150 bp로 제한됨)에 의해 확인된 돌연변이 및 과다메틸화된 영역으로부터의 평균 돌연변이체 대립유전자 분율과 평균 RPKM의 관계. 점은 HNSCC 또는 건강한 대조군 혈장으로부터의 개별 샘플을 나타낸다. 적색 실선: 피팅된 선형 회귀 모델. 회색 경계: 95% 신뢰구간. B) CAPP-Seq 및 cfMeDIP-seq 둘 다에 의해 검출될 수 있는 ctDNA를 가진 환자의 전체 생존을 도시하는 카플란-마이어 분석(과다-DMR 내에서 건강한 대조군보다 더 높은 평균 메틸화). C) TCGA에 의해 제공된 HNSCC 원발성 종양(n = 520) 전체에 대한 다변량 Cox 비례 위험 회귀 분석에 의한 질환 특이적 생존에 기반한 예후 영역의 확인. 영역은 이전에 기재된 바와 같이 300 bp 윈도우로서 정의되었다. 인간 메틸화 450K 데이터를 TCGA로부터 수득하였고, 각각의 영역과 중첩되는 프로브 ID로부터의 베타-값의 평균을 산출하였다. 고형 인접 정상 조직(n = 50)에 비해 원발성 종양(n = 520) 전체에 걸쳐 상승된 메틸화를 기준으로 예후 분석용 후보 영역을 선택하였다(윌콕손(Wilcoxon) 검정, 조절된 p 값 < 0.05, log2FC > 1). G 및 H) 특정 300 bp 영역(상자)의 메틸화와 특정 전사체의 RNA 발현 사이의 스피어만(Spearman) 상관관계. 절대 R 값이 0.3 이상인 영역(회색 파선으로 표시됨)은 유의미한 연관성으로서 표지되었다. TCGA에 의해 제공된 HNSCC 환자(n = 520)의 질환 특이적 생존에 대한 예후 영역인 메틸화된 영역은 적색 윤곽선으로 표시된다. RNA 발현과 더 연관된 예후 영역은 적색 실선으로 표시된다. RNA 발현과 연관된 예후 메틸화된 영역의 예; (G) OSR1, (H) LINC01391이 제공된다. E) 각각 ZNF323/ZSCAN1, LINC01391, GATA-AS1, OSR1 및 STK3/MST2의 발현에 영향을 미치는 5개의 영역 전체에 걸쳐 총 메틸화에 기반한, HNSCC-TCGA 환자에 대한 전체 생존의 카플란-마이어 곡선. 모든 원발성 종양 전체에 걸쳐 (D)에서 이미 확인된 5개의 영역의 중간 총 메틸화보다 더 낮은지(Blw 중앙값, 청색) 아니면 더 높은지(Abv 중앙값, 적색)를 기준으로 환자를 계층화하였다. F) CAPP-Seq에 의해 검출 가능한 ctDNA를 가진 HNSCC 혈장 코호트에 대한, (E)에 기재된 전체 생존의 카플란-마이어 곡선. 예후 연관성이 있는 5개의 유전자 전체에 걸쳐 총 메틸화를 계산하기 위해, 생존 분석 전에 먼저 확인된 모든 과다-DMR 영역 전체에 걸쳐 RPKM 값을 상응하게 크기 조정하였다.
도 6. 종적(longitudinal) 모니터링을 위한 cfMeDIP-seq에 의한 ctDNA 검출의 임상 유용성. A) 치료 전반에 걸쳐 환자 전체에서 전형적으로 관찰된 ctDNA 동역학. 완전한 제거는 ctDNA 존재량이 진단 시 검출된 ctDNA부터, 치료 도중/후 첫 번째 이용 가능한 시점에서 검출 역치(즉, 0.2%) 미만의 수준까지 감소한 변화로서 정의되었다. 부분적 제거는 ctDNA 존재량이 진단 시 검출된 ctDNA부터, 치료 도중/후 첫 번째 이용 가능한 시점에서 검출 역치 초과의 수준까지 감소한(90% 이상) 변화로서 정의되었다. 제거 없음은 진단 시에 비해 치료 도중/후 샘플에서 ctDNA 존재량의 증가로서 정의되었다. lastFU = 마지막 추적검사에서 샘플 채취, RT = 방사선요법. B) HNSCC 환자 전체(n = 30)에 걸쳐 진단 시부터 치료 도중/후 첫 번째 이용 가능한 시점까지 ctDNA 존재량의 변화. 적색 선은 제거 없음의 동역학을 나타낸 환자를 표시하는 반면, 회색 선은 제거/부분적 제거의 동역학을 가진 환자를 표시한다. C) 무재발 생존의 카플란-마이어 곡선. 제거의 동역학을 기준으로 환자를 계층화하였다(즉, 제거 없음 대 제거/부분적 제거).
도 7. 모든 단편 또는 ctDNA 농후화된 단편에 대해 수행된 cfMeDIP-seq 분석의 비교. ctDNA 농후화된 단편은 길이가 100 내지 150 bp인 단편으로서 정의된다. A) 모든 단편(왼쪽) 또는 ctDNA 농후화된 단편(오른쪽)을 함유하는 cfMeDIP-seq 프로파일에서 CAPP-Seq에 의해 확인된 돌연변이의 돌연변이체 대립유전자 빈도 대 이전에 확인된 HNSCC 과다-DMR의 평균 RPKM 값. B) HNSCC cfMeDIP-seq 프로파일(CAPP-Seq 양성만: 적색, CAPP-Seq 양성 및 음성: 청색) 대 건강한 기증자에서 ctDNA 검출을 위한 곡선하면적 분석(AUROC). CAPP-Seq 양성 환자를 이용한 교차검증 분석의 결과도 표시되어 있다(재현실험 = 50). 모든 단편(왼쪽) 또는 ctDNA 농후화된 단편(오른쪽)을 사용한 cfMeDIP-seq 프로파일에 대한 분석이 표시되어 있다. C) 모든 단편(왼쪽) 또는 ctDNA 농후화된 단편을 사용한 종적 cfMeDIP-seq 프로파일링에 기반한, 무재발 생존에 대한 카플란-마이어 분석. 환자가 이전에 확인된 과다-DMR 내에서 0.2% ctDNA보다 더 큰 메틸화 존재량을 보인 경우, 이 환자는 치료 후 ctDNA에 대해 양성을 나타내는 것으로서 분류되었다.
도 8. 본원에서 제공된 방법을 구현하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템을 보여준다.
도 9. HNSCC 및 건강한 기증자로부터 단리된 무세포 DNA의 샘플 특성. A) 혈액 단리의 시점을 규정하는 도식. B) 시점 전체에서 HNSCC 환자 및 건강한 기증자(즉, "정상")에 대한 cfDNA 수율(혈장 ㎖당으로 정규화됨).
도 10. HNSC TCGA 코호트 내의 모든 364명의 환자들 중에서 평가되었거나(청색 다이아몬드) 또는 리브-원-아웃(leave-one-out) 교차검증을 사용함으로써 평가된(LOOCV; 적색 사각형) CAPP-Seq 선택제에 의해 커버된 HNSCC 환자당 SNV 수의 분석.
도 11. 32명의 HNSCC 환자들 중 20명의 환자들에서 확인된 모든 PBL-여과된 SNV의 온코프린트(도 2E와 관련됨).
도 12. 정보제공 영역의 확인을 위한 관련 도면(도 3B 및 3C와 관련됨). A) n개 이상의 CpG에 기반한, 게놈 전체(1번 염색체 1 내지 22번 염색체) 300 bp 비-중첩 구간(bin)의 중간 RPKM 값. B) 도 2B 및 방법 단락에 기재된 바와 같이 PBL 고갈 윈도우 내에서 HNSCC PBL과 건강한 기증자 PBL 사이의 차등 메틸화 분석. 과소메틸화된 영역(즉, 건강한 기증자 PBL에서 메틸화가 상승된 영역)은 청색으로 표시되어 있다.
도 13. PBL 고갈 윈도우 내에서 HNSCC cfDNA 샘플과 건강한 기증자 cfDNA 샘플 사이의 차등 메틸화 분석 결과에 대한 관련 도면(도 2D). A) DMR은 초기 분석에 사용된 원래의 300 bp 비-중첩 윈도우를 기반으로 정의되었다. 서로 바로 인접한 DMR은 그들 각각의 너비로 구간화되었다(즉, 2개의 300 bp 윈도우는 600 bp의 길이를 가진 것으로서 각각 독립적으로 정의됨). B) 과소메틸화된 영역에 기반한, 도 2E에 정의된 CpG 특징의 순열 분석.
도 14. 암 특이적 차등적으로 메틸화된 사이토신의 확인에 기반한, TCGA 원발성 종양의 지도 계층 클러스터링. 암_유형(열)은 각각의 원발성 종양 또는 PBL 샘플의 분류를 의미하는 반면, 암_DMCs(행)는 각각의 암 유형(PBL 제외)에 대해 확인된 암 특이적 차등적으로 메틸화된 사이토신을 의미한다.
도 15. 도 4에 대한 도면. A) 평균 돌연변이체 대립유전자 분율에 비해 환자당 CAPP-Seq에 의해 확인된 SNVS의 중간 단편 길이. B) 과다-DMR의 평균 RPKM에 비해 환자당 cfMeDIP-seq에 의한 과다-DMRS 내의 중간 단편 길이.
도 16. CAPP-Seq 및 cfMeDIP-seq 일치 분석에 대한 관련 도면(도 4E). A) CAPP-Seq 양성 HNSCC cfDNA 샘플과 건강한 기증자 사이에 차등적으로 메틸화된 영역 판정의 교차검증 분석(n = 50)으로부터 수득된 곡선하면적 값. B) CAPP-Seq에 의한 ctDNA 검출에 기반한, HNSCC 환자의 전체 생존에 대한 카플란-마이어 분석. C)D) 메틸화 클러스터를 기준으로 계층화된 HNSCC 환자 샘플의 평균 RPKM 및 평균 돌연변이체 대립유전자 분율(도 4의 D).
도 17. 잠재적 임상 유용성 영역의 확인(도 6과 관련됨). A) 본 발명자들의 HNSCC 코호트로부터의 혈장 유래 과다-DMR뿐만 아니라 TCGA 내의 HNSCC 원발성 종양과도 중첩되는, 시판되는 액체 생검 검사에서 현재 사용되는 유전자의 게놈 추적. 화살표가 있는 하단 짙은 청색 막대는 특정된 유전자에 대한 전사의 방향을 표시한다. 적색 막대는 TCGA로부터의 원발성 종양뿐만 아니라 본 발명자들의 HNSCC 코호트의 혈장으로부터의 과다-DMR과도 중첩되는 300 bp 윈도우의 위치를 표시한다. B 내지 D) 특정 300 bp 영역(상자)의 메틸화와 특정 전사체의 RNA 발현 사이의 스피어만 상관관계. 절대 R 값이 0.3 이상인 영역(회색 파선으로 표시됨)은 유의미한 연관성으로서 표지되었다. TCGA에 의해 제공된 HNSCC 환자(n = 520)의 질환 특이적 생존에 대한 예후 영역인 메틸화된 영역은 적색 윤곽선으로 표시되어 있다. RNA 발현과도 관련된 예후 영역은 적색 실선으로 표시되어 있다. RNA 발현과 관련된 예후 메틸화된 영역을 함유하는 5개의 유전자 모두에 대한 도면을 작성하였다; (B) GATA2-AS1, (C) ZNF323, (D) STK3.
도 18. 모든 HNSCC 환자들(n = 32)에 대한 치료 전반에 걸쳐 cfMeDIP-seq에 의한 ctDNA 존재량의 변화를 표시하는, 도 6A의 확장.
하기 설명에서, 본 발명의 완전한 이해를 제공하기 위해 다수의 구체적인 세부사항이 기재되어 있다. 그러나, 본 발명은 이들 특정 세부사항 없이 실시될 수 있음을 이해해야 한다.
본 개시내용은 대상체가 암을 가질 가능성을 높은 민감도 및/또는 높은 특이성으로 확인하는 데 있어서 ctDNA를 다중모드로 분석하는 방법, 시스템 및 키트를 제공한다. 또한, 본 개시내용은 암 치료 후 최소 잔존 질환(MRD)을 검출하고 이러한 암 치료가 치료적으로 효과적인지를 평가하는 방법, 시스템 및 키트를 제공한다.
치료 전 ctDNA로부터 특정 분자 특징을 확인하는 것은 치료에 대한 예후 및/또는 예측 반응을 알려줄 수 있는 반면, 치료 후 ctDNA의 검출은 MRD의 확인에 도움이 될 수 있고 재발 및/또는 사망 위험이 높은 환자를 확인하는 데 도움이 될 수 있다. 강력한 민감도를 달성하기 위해, 대다수의 임상 연구는 소수의 영역을 조사하는 ctDNA 검출 방법, 일치된 종양 프로파일링 및/또는 높은 ctDNA 존재량의 사례를 활용한다. 그러나, 환자 전체에 걸쳐 낮은 수준의 ctDNA를 보유하거나 공통/알려진 변형을 결여하는 암의 경우, 유사한 정도의 민감도를 달성하기 위해 추가 전략을 활용할 수 있다. 게놈 전체 프로파일링 기법은 훨씬 더 많은 영역을 커버함으로써 민감도를 개선하는 데 도움이 될 수 있으나; 1% 분율 미만의 검출을 달성하는 데 필요한 무세포 DNA의 양 및 시퀀싱 깊이는 엄청난 비용이 든다.
고도로 민감한 ctDNA 검출을 할 수 있는 두 가지 맞춤형 게놈 전체 프로파일링 기법이 기재되어 있다. 첫 번째 기법인 딥 시퀀싱에 의한 암 맞춤형 프로파일링(CAncer Personalized Profiling by deep Sequencing(CAPP-Seq))은 100개 이상의 유전자를 표적화하는 광범위한 하이브리드 포획 프로브 패널을 이용하여 낮은 대립유전자 빈도 돌연변이를 확인한다. 두 번째 기법인 무세포 메틸화된 DNA 면역침전 시퀀싱(cell-free Methylated DNA ImmunoPrecipitation sequencing(cfMeDIP-seq))은 항-5-메틸사이토신(항-5mC) 항체를 사용하여 메틸화된 cfDNA 단편을 농후화한다. 이들 각각의 방법에 의한 돌연변이 또는 과다메틸화 사건의 확인은 그들 각각의 이점을 가진다. 적절한 오류 억제 수단을 사용하고 클론 조혈로부터의 돌연변이의 임의의 기여를 고려하는 한, 돌연변이는 그의 비가역적 배치로 인해 ctDNA를 무세포 DNA의 건강한 공급원과 구별할 수 있다. DNA 과다메틸화 사건은 잠재적으로 암에서 더 많은 수의 재발성 게놈 영역에 영향을 미쳐, 무세포 DNA 분석을 통해 종양의 기원을 알려주는 그의 능력에 기여한다. 더욱이, 암 유발제 유전자 근처에서의 과다메틸화 사건은 이 유전자의 발현에 영향을 미침으로써, 잠재적으로 암 행동을 반영할 수 있고 예후 값을 제공할 수 있다. 지금까지 어떤 연구도 국소화된 암에서 ctDNA의 개선된 종양 나이브(naive) 검출 및 특징규명을 위해 돌연변이 기반 방법과 메틸화 기반 방법의 조합을 이용하지 않았다.
예후, 위험 계층화 및 질환 지도를 위한 유체 기반 바이오마커의 활용은 침습적 종양 샘플링을 필요로 하지 않으면서 치료 결정을 안내함으로써 환자 결과를 개선할 수 있다. 특히 순환 종양(ct)DNA가 액체 생검 도구로서 유망한 것으로 밝혀졌지만, 질환 부담이 낮은 환자, 예컨대, 국소화된 비-전이성 암을 가진 환자에서 페어링된 종양 프로파일링이 종종 요구된다. 본 발명자들은 혈장 무세포 DNA로부터의 유전적 및 후성적 특징의 다중모드 분석이 종양 나이브 ctDNA 프로파일링의 광범위한 적용을 가능하게 할 수 있다는 가설을 세웠다. 돌연변이 및 메틸화 기반 프로파일링은 국소화된 두경부암 환자의 65%에서 ctDNA를 확인하였다. 두 방식으로부터의 결과는 정량적이며 강한 상관관계를 갖고, 이들의 조합된 분석은 종양 유래 DNA 단편의 공통 특징을 보여주었다. 또한, ctDNA 메틸롬(methylome)은 종양 조직학, 추정되는 예후 바이오마커 및 치료 반응의 동적 패턴을 보여주었다. 이 발견은 향후 비-침습적 바이오마커 발견 노력을 도울 것이고 국소화된 암에 대한 ctDNA의 임상 구현을 알려줄 것이다.
무세포 메틸화된 DNA를 포획하는 특정 방법은 둘 다 참고로 포함되는, 본 출원인의 국제 특허출원 공개 제WO 2017/190215호 및 제WO 2019/010564호에 기재되어 있다.
구체적으로, 본 발명자들은 CAPP-Seq 및 cfMeDIP-seq 둘 다를 이용하여 국소화된 두경부 편평 세포 암종(HNSCC) 환자의 코호트 내에서 종양 나이브 ctDNA 검출을 수행한다. HNSCC는 최종 치료 후 자주 재발하는 임상적으로 불균질한 질환이고 치료 결정 및 질환 관리에 대한 더 좋은 정보를 제공하는 ctDNA 검출로부터 큰 이익을 얻을 수 있다33. 본 발명자들은 일치된 PBL 프로파일링뿐만 아니라 두 가지 방법을 동시에 이용하여 높은 신뢰도의 종양 나이브 ctDNA 검출을 달성할 수 있음을 입증한다. 나아가, 본 발명자들은 조합된 분석이 종양 유래 DNA 단편의 공통 분자 특징을 드러낸다는 것을 보여준다. 마지막으로, 본 발명자들은 ctDNA 메틸롬이 종양 조직학, 추정되는 예후 바이오마커 및 치료 반응의 동적 패턴을 밝혀, 다른 질환 환경에서 향후 바이오마커 연구를 위한 청사진을 제공한다는 것을 보여준다.
한 측면에서, 대상체에서 암세포로부터의 ctDNA의 존재를 검출하는 방법으로서, (a) 대상체로부터 무세포 DNA의 샘플을 제공하는 단계;
(b) 무세포 메틸화된 DNA의 후속 시퀀싱을 허용하기 위해 샘플에 대해 라이브러리 제조를 수행하는 단계;
(c) 임의로 제1양의 필러 DNA를 상기 샘플에 첨가한 후, 임의로 샘플을 추가로 변성시키는 단계로서, 여기서 상기 필러 DNA의 적어도 일부가 메틸화된 것인 단계;
(d) 메틸화된 폴리뉴클레오타이드에 대해 선택적인 결합제를 사용하여 무세포 메틸화된 DNA를 포획하는 단계;
(e) 포획된 무세포 메틸화된 DNA를 시퀀싱하는 단계;
(f) 포획된 무세포 메틸화된 DNA의 서열을 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열과 비교하는 단계;
(g) 포획된 무세포 메틸화된 DNA의 하나 이상의 서열과 암 개체로부터의 무세포 메틸화된 DNA 서열 사이에 통계적으로 유의미한 유사성이 있는 경우 암세포로부터의 DNA의 존재를 확인하는 단계
를 포함하는 방법을 제공하는 것으로, 여기서 포획 단계, 비교 단계 또는 확인 단계 중 적어도 하나에서 대상체 무세포 메틸화된 DNA는 단편 길이 메트릭에 따라 하위집단으로 제한된다.
중합효소 연쇄 반응(PCR)에 이은 생거(Sanger) 시퀀싱과 같은 다양한 시퀀싱 기법은 당분야에서 숙련된 자에게 공지되어 있다. 일루미나(Illumina)(Solexa) 시퀀싱, 로슈(Roche) 454 시퀀싱, 이온 토렌트(Ion torrent): 양성자/PGM 시퀀싱, SOLiD 시퀀싱, 긴 리드 시퀀싱(Oxford Nanopore 및 Pactbio)을 비롯한 다양한 시퀀싱 기술을 포함하는, 고효율 시퀀싱으로서도 알려진 차세대 시퀀싱(NGS) 기법도 이용될 수 있다. NGS는 이전에 이용된 생거 시퀀싱보다 훨씬 더 빠르고 저렴하게 DNA와 RNA의 시퀀싱을 허용한다. 일부 실시양태에서, 상기 시퀀싱은 짧은 리드 시퀀싱을 위해 최적화된다.
본원에서 사용된 용어 "대상체"는 동물계의 임의의 구성원을 지칭한다. 따라서, 본원에 기재된 방법은 인간 및 수의과 질환과 동물 모델 둘 다에 적용될 수 있다. 바람직한 대상체는 "환자", 즉 질환 또는 병태에 대한 치료 또는 의학적 관리가 필요한지를 결정하기 위해 검사받고 있거나, 질환 또는 병태(예를 들어, 암)에 대한 의학적 관리를 받고 있는 살아있는 인간이다.
본원에서 사용된 용어 "게놈"은 일반적으로 예를 들어, 대상체의 유전 정보의 적어도 일부 또는 전체일 수 있는, 대상체로부터의 게놈 정보를 지칭한다. 게놈은 DNA 또는 RNA로 코딩될 수 있다. 게놈은 코딩 영역(예를 들어, 단백질을 코딩하는 영역)뿐만 아니라 비-코딩 영역도 포함할 수 있다. 게놈은 유기체에서 모든 염색체의 서열을 함께 포함할 수 있다. 예를 들어, 인간 게놈은 통상적으로 총 46개의 염색체를 가진다. 이들 모두의 서열은 함께 인간 게놈을 구성할 수 있다.
본원에서 사용된 용어 "핵산"은 2개 이상의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드, 즉 데옥시리보뉴클레오타이드(dNTP) 또는 리보뉴클레오타이드(rNTP), 또는 이들의 유사체인 뉴클레오타이드의 임의의 길이의 중합체 형태를 의미한다. 핵산의 비제한적 예는 데옥시리보핵산(DNA), 리보핵산(RNA), 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연관 분석으로부터 정의된 유전자좌(locus), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA, 리보좀 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로 RNA(miRNA), 리보자임, cDNA, 재조합 핵산, 분지된 핵산, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브 및 프라이머를 포함한다. 핵산은 하나 이상의 변형된 뉴클레오타이드, 예컨대, 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체를 포함할 수 있다. 존재하는 경우, 핵산의 어셈블리 전 또는 후에 뉴클레오타이드 구조를 변형시킬 수 있다. 핵산의 뉴클레오타이드의 서열은 비-뉴클레오타이드 성분에 의해 불연속될 수 있다. 핵산은 예컨대, 리포터 작용제와의 접합 또는 결합에 의해 중합 후 추가로 변형될 수 있다. "변이체" 핵산은 적어도 하나의 뉴클레오타이드가 변형되었다는 점, 예를 들어, 각각 결실되었거나, 삽입되었거나 대체되었다는 점을 제외하고 그의 원래 핵산의 뉴클레오타이드 서열과 동일한 뉴클레오타이드 서열을 가진 폴리뉴클레오타이드이다. 변이체는 원래 핵산의 뉴클레오타이드 서열과 적어도 약 80%, 90%, 95% 또는 99% 동일한 뉴클레오타이드 서열을 가질 수 있다.
무세포 메틸화된 DNA는 혈류에서 자유롭게 순환하며 DNA의 다양한 영역에서 메틸화된 DNA이다. 샘플, 예를 들어, 혈장 샘플을 채취하여 무세포 메틸화된 DNA를 분석할 수 있다. 연구는 혈액에서 순환 핵산의 대부분이 괴사 또는 아폽토시스 세포로부터 발생되고 아폽토시스로부터 크게 상승된 핵산 수준이 암과 같은 질환에서 관찰됨을 보여준다. 특히 순환 DNA가 발암유전자의 돌연변이, 마이크로세틀라이트(microsatellite) 변형 및 특정 암의 경우 바이러스 게놈 서열을 비롯한 질환의 특징적인 징후를 갖는 암의 경우, 혈장의 DNA 또는 RNA는 질환에 대한 잠재적 바이오마커로서 점점 더 연구되고 있다. 예를 들어, 총 순환 DNA에서 낮은 수준의 순환 종양 DNA에 대한 정량적 어세이는 임상에서 사용되는 표준 바이오마커인 암배아 항원에 비해 대장암의 재발을 검출하는 더 우수한 마커로서의 역할을 할 수 있다. 순환 cfDNA는 순환 종양 DNA(ctDNA)를 포함할 수 있다.
본원에서 사용된 바와 같이, "라이브러리 제조"는 목록 말단-복구, A-테일링(tailing), 어댑터 라이게이션, 또는 DNA의 후속 시퀀싱을 허용하기 위해 무세포 DNA에 대해 수행되는 임의의 다른 제조를 포함한다.
본원에서 사용된 바와 같이, "필러 DNA"는 비-코딩 DNA일 수 있거나 앰플리콘으로 구성될 수 있다.
일부 실시양태에서, 단편 길이 메트릭은 단편 길이이다. 일부 바람직한 실시양태에서, 대상체 무세포 메틸화된 DNA는 170 bp 미만, 165 bp 미만, 160 bp 미만, 155 bp 미만, 150 bp 미만, 145 bp 미만, 140 bp 미만, 135 bp 미만, 130 bp 미만, 125 bp 미만, 120 bp 미만, 115 bp 미만, 110 bp 미만, 105 bp 미만 또는 100 bp 미만의 길이를 가진 단편으로 제한된다. 다른 바람직한 실시양태에서, 대상체 무세포 메틸화 DNA는 약 100 내지 약 150 bp, 110 내지 140 bp, 또는 120 내지 130 bp의 길이를 가진 단편으로 제한된다.
일부 실시양태에서, 단편 길이 메트릭은 대상체 무세포 메틸화된 DNA의 단편 길이 분포이다. 일부 바람직한 실시양태에서, 대상체 무세포 메틸화된 DNA는 길이를 기준으로 하위 50번째, 45번째, 40번째, 35번째, 30번째, 25번째, 20번째, 15번째 또는 10번째 백분위수 내의 단편으로 제한된다.
일부 실시양태에서, 대상체 무세포 메틸화된 DNA는 차등적으로 메틸화된 영역(DMR) 내의 단편으로 더 제한된다.
일부 실시양태에서, 대상체 무세포 메틸화된 DNA의 제한은 포획 단계 동안 일어난다.
일부 실시양태에서, 대상체 무세포 메틸화된 DNA의 제한은 비교 단계 동안 일어난다.
일부 실시양태에서, 대상체 무세포 메틸화된 DNA의 제한은 확인 단계 동안 일어난다.
일부 실시양태에서, 비교 단계는 통계적 분류기를 이용한 피팅에 기반한다. DNA 메틸화 데이터를 사용하는 통계적 분류기는 샘플을 암 유형 또는 하위유형과 같은 특정 질환 상태에 배정하는 데 이용될 수 있다. 암 유형 또는 하위유형 분류를 위해, 분류기는 통계적 모델 내의 하나 이상의 DNA 메틸화 변수(즉, 특징)로 구성될 것이고, 통계적 모델의 결과물은 상이한 질환 상태를 구별하기 위해 하나 이상의 역치 값을 가질 것이다. 통계적 분류기에 사용되는 특정 특징(들) 및 역치 값(들)은 암 유형 또는 하위유형의 사전지식, 가장 많은 정보를 제공할 가능성이 있는 특징의 사전지식, 기계 학습, 또는 이 방식들 중 둘 이상의 조합으로부터 유래할 수 있다.
일부 실시양태에서, 분류기는 기계 학습으로부터 유래한다. 바람직하게는, 분류기는 엘라스틱 네트(elastic net) 분류기, 라소(lasso), 서포트 벡터 머신(support vector machine), 랜덤 포레스트(random forest) 또는 신경 네트워크(neural network)이다.
분석되는 게놈 공간은 게놈 전체이거나, 바람직하게는 조절 영역(즉, FANTOM5 인핸서, CpG 아일랜드(Islands), CpG 쇼어(shores) 및 CpG 쉘프(Shelves))로 제한될 수 있다.
바람직하게는, 회수된 스파이크-인(spike-in) 메틸화된 DNA의 백분율은 풀다운(pulldown) 효율 변동을 제어하기 위한 공변량으로서 포함된다.
다수의 암 유형(또는 하위유형)을 서로 구별할 수 있는 분류기의 경우, 분류기는 바람직하게는 관심 있는 각각의 유형(또는 하위유형)의 쌍별 비교로부터 차등적으로 메틸화된 영역으로 구성될 것이다.
일부 실시양태에서, 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열은 건강한 개체와 암 개체 사이에 차등적으로 메틸화된 영역(DMR)의 데이터베이스에 포함된다.
일부 실시양태에서, 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열은 체액, 예컨대, 혈액 혈청, 뇌척수액, 소변 대변, 가래, 흉막액, 복수, 눈물, 땀, 팝도말액, 내시경 브러싱액 등, 바람직하게는 혈액 혈장으로부터의 무세포 DNA로부터 유래한 DNA에서 건강한 개체와 암 개체 사이에 차등적으로 메틸화되어 있는 대조군 무세포 메틸화된 DNA 서열로 제한된다.
샘플
샘플은 대상체로부터 단리된 임의의 생물학적 샘플일 수 있다. 예를 들어, 샘플은 체액, 전혈, 혈소판, 혈청, 혈장, 대변, 적혈 세포, 백혈 세포 또는 백혈구, 내피 세포, 조직 생검, 활액, 림프액, 복수, 간질액 또는 세포외액, 치은 열구액을 비롯한, 세포 사이의 공간에 있는 유체, 골수, 뇌척수액, 타액, 점액, 가래, 정액, 땀, 소변, 비강 브러싱액, 팝도말액, 또는 임의의 다른 체액을 제한 없이 포함할 수 있다. 체액은 타액, 혈액 또는 혈청을 포함할 수 있다. 샘플은 정맥천자, 배설, 사정, 마사지, 생검, 바늘 흡인, 세척, 긁기, 외과적 절개 또는 시술 또는 다른 방식을 포함하나 이들로 제한되지 않는 다양한 방식에 의해 대상체로부터 수득될 수 있는 종양 샘플일 수도 있다. 샘플은 무세포 샘플(예를 들어, 세포를 실질적으로 갖지 않음)일 수 있다. DNA 샘플은 예를 들어, 충분한 열의 사용을 통해 변성될 수 있다.
일부 실시양태에서, 본 개시내용은 하나 이상의 생물학적 샘플을 포함하거나 사용하는 시스템, 방법 또는 키트를 제공한다. 본원에서 사용된 하나 이상의 샘플은 핵산을 함유하거나 함유하는 것으로 추정되는 임의의 물질을 포함할 수 있다. 샘플은 대상체로부터 수득된 생물학적 샘플을 포함할 수 있다. 일부 실시양태에서, 생물학적 샘플은 액체 샘플이다.
일부 실시양태에서, 샘플은 약 100 ng, 90 ng, 80 ng, 75 ng, 70 ng, 60 ng, 50 ng, 40 ng, 30 ng, 20 ng, 10 ng, 5 ng, 1 ng 또는 이 숫자들 사이의 임의의 양 미만의 무세포 핵산 분자를 포함한다. 또한, 일부 실시양태에서, 샘플은 약 1 pg 미만, 약 5 pg 미만, 약 10 pg 미만, 약 20 pg 미만, 약 30 pg 미만, 약 40 pg 미만, 약 50 pg 미만, 약 100 pg 미만, 약 200 pg 미만, 약 500 pg 미만, 약 1 ng 미만, 약 5 ng 미만, 약 10 ng 미만, 약 20 ng 미만, 약 30 ng 미만, 약 40 ng 미만, 약 50 ng 미만, 약 100 ng 미만, 약 200 ng 미만, 약 500 ng 미만, 약 1000 ng 미만, 또는 이 숫자들 사이의 임의의 양의 무세포 핵산 분자를 포함한다.
일부 실시양태에서, 본 개시내용은 소정량의 필러 DNA로 샘플을 채워 혼합물 샘플을 생성하는 방법 및 시스템을 포함하고, 여기서 상기 혼합물 샘플은 적어도 약 50 ng, 55 ng, 60 ng, 65 ng, 70 ng, 75 ng, 80 ng, 85 ng, 90 ng, 95 ng, 100 ng, 120 ng, 140 ng, 160 ng, 180 ng, 200 ng 또는 이 숫자들 사이의 임의의 양의 총량으로 핵산 혼합물을 포함한다. 일부 실시양태에서, 필러 DNA는 적어도 약 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%의 메틸화된 필러 DNA, 바람직하게는 5% 내지 50%, 10% 내지 40%, 또는 15% 내지 30%의 메틸화된 필러 DNA를 포함하고, 여기서 나머지는 메틸화되지 않은 필러 DNA이다. 일부 실시양태에서, 혼합물 샘플은 20 ng 내지 100 ng, 바람직하게는 30 ng 내지 100 ng, 보다 바람직하게는 50 ng 내지 100 ng의 양으로 필러 DNA를 포함한다. 일부 실시양태에서, 샘플로부터의 무세포 DNA 및 제1양의 필러 DNA는 함께, 총 DNA의 적어도 50 ng, 바람직하게는 총 DNA의 적어도 100 ng을 포함한다.
일부 실시양태에서, 필러 DNA는 50 bp 내지 800 bp 길이, 바람직하게는 100 bp 내지 600 bp 길이, 보다 바람직하게는 200 bp 내지 600 bp 길이이다. 일부 실시양태에서, 필러 DNA는 이중 가닥이다. 필러 DNA는 이중 가닥이다. 예를 들어, 필러 DNA는 정크(junk) DNA일 수 있다. 필러 DNA는 또한 내생성 또는 외생성 DNA일 수 있다. 예를 들어, 필러 DNA는 비-인간 DNA이고, 바람직한 실시양태에서 λ DNA이다. 본원에서 사용된 바와 같이, "λ DNA"는 엔테로박테리아 파지(Enterobacteria phage) λ DNA를 지칭한다. 일부 실시양태에서, 필러 DNA는 인간 DNA와 정렬되지 않는다.
일부 실시양태에서, 샘플은 질환 또는 장애를 가진 대상체의 치료 전 및/또는 후에 채취될 수 있다. 샘플은 치료 또는 치료법 동안 대상체로부터 수득될 수 있다. 시간 경과에 따른 치료 효과를 모니터링하기 위해 대상체로부터 다수의 샘플을 수득할 수 있다. 샘플은 임상 시험을 통해 확정적인 양성 또는 음성 진단을 이용할 수 없는 질환 또는 장애를 갖는 것으로 알려졌거나 의심되는 대상체로부터 채취될 수 있다. 샘플은 질환 또는 장애를 갖는 것으로 의심되는 대상체로부터 채취될 수 있다. 샘플은 설명되지 않는 증상, 예컨대, 피로, 구역, 체중 감소, 아픔과 통증, 쇠약 또는 출혈을 경험하는 대상체로부터 채취될 수 있다. 샘플은 설명된 증상을 가진 대상체로부터 채취될 수 있다. 샘플은 가족력, 연령, 고혈압 또는 고혈압 전단계, 당뇨병 또는 당뇨병 전단계, 과체중 또는 비만, 환경 노출, 생활방식 위험 요인(예를 들어, 흡연, 음주 또는 약물 사용) 또는 다른 위험 요인의 존재와 같은 요인으로 인해 질환 또는 장애를 발생시킬 위험에 있는 대상체로부터 채취될 수 있다.
일부 실시양태에서, 첫 번째 시점에서 샘플을 채취하고 시퀀싱한 다음, 후속 시점에서 또 다른 샘플을 채취하고 시퀀싱할 수 있다. 이러한 방법은 예를 들어, 질환의 발생 또는 진행을 추적하기 위한 종적 모니터링 목적에 사용될 수 있다. 일부 실시양태에서, 질환의 진행은 치료 효과를 확인하기 위해 치료 전, 치료 후 또는 치료 과정 동안 추적될 수 있다. 예를 들어, 본원에 기재된 방법은 의학적 치료에 대한 반응으로 질환의 진행 또는 퇴행을 측정하기 위해 의학적 치료 전 및 후에 대상체에 대해 수행될 수 있다.
대상체로부터 샘플을 수득한 후, 샘플을 프로세싱하여 대상체의 질환 또는 장애를 표시하는 데이터세트를 생성할 수 있다. 예를 들어, 암 관련 게놈 유전자좌 또는 마이크로바이옴(microbiome) 관련 유전자좌의 패널에서 샘플의 무세포 핵산 분자(예를 들어, ctDNA 분자)의 존재, 부재 또는 정량적 평가는 대상체의 암을 표시할 수 있다. 대상체로부터 수득된 샘플의 프로세싱은 (i) 샘플을, 복수의 무세포 핵산 분자를 단리하거나, 농후화하거나 추출하기에 충분한 조건에 노출시키는 단계, 및 (ii) 복수의 무세포 핵산 분자를 어세이하여 데이터세트(예를 들어, 핵산 서열)를 생성하는 단계를 포함할 수 있다. 일부 실시양태에서, 복수의 무세포 핵산 분자를 샘플로부터 추출하고 시퀀싱하여 복수의 시퀀싱 리드를 생성한다.
일부 실시양태에서, 무세포 핵산 분자는 무세포 리보핵산(cfRNA) 또는 무세포 데옥시리보핵산(cfDNA)을 포함할 수 있다. 무세포 핵산 분자(예를 들어, cfRNA 또는 cfDNA)는 다양한 방법에 의해 샘플로부터 추출될 수 있다. 무세포 핵산 분자는 암 관련 게놈 유전자좌의 패널에 상응하는 핵산(예를 들어, RNA 또는 DNA) 분자를 농후화하도록 구성된 복수의 프로브에 의해 농후화될 수 있다. 프로브는 암 관련 게놈 유전자좌의 패널 중 하나 이상의 패널로부터의 핵산 서열과 서열 상보성을 가질 수 있다. 암 관련 게놈 유전자좌의 패널은 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 약 25개, 적어도 약 30개, 적어도 약 35개, 적어도 약 40개, 적어도 약 45개, 적어도 약 50개, 적어도 약 55개, 적어도 약 60개, 적어도 약 65개, 적어도 약 70개, 적어도 약 75개, 적어도 약 80개, 적어도 약 85개, 적어도 약 90개, 적어도 약 95개, 적어도 약 100개, 또는 더 많은 상이한 암 관련 게놈 유전자좌를 포함할 수 있다. 프로브는 하나 이상의 게놈 유전자좌(예를 들어, 암 관련 게놈 유전자좌)의 핵산 서열(예를 들어, RNA 또는 DNA)과 서열 상보성을 가진 핵산 분자(예를 들어, RNA 또는 DNA)일 수 있다. 이 핵산 분자는 프라이머 또는 농후화 서열일 수 있다. 하나 이상의 게놈 유전자좌(예를 들어, 암 관련 게놈 유전자좌 또는 마이크로바이옴 관련 유전자좌)에 대해 선택적인 프로브를 사용한 샘플의 어세이는 어레이 하이브리드화, 중합효소 연쇄 반응(PCR) 또는 핵산 시퀀싱(예를 들어, RNA 시퀀싱 또는 DNA 시퀀싱)의 이용을 포함할 수 있다.
핵산 분자 시퀀싱
본 개시내용은 하나 이상의 폴리뉴클레오타이드에서 뉴클레오타이드 염기의 서열을 확인하는 방법 및 기술을 제공한다. 폴리뉴클레오타이드는 예를 들어, 데옥시리보핵산(DNA) 또는 리보핵산(RNA)과 같은 핵산 분자일 수 있고, 이의 변이체 또는 유도체(예를 들어, 단일 가닥 DNA)를 포함한다. 시퀀싱은 현재 이용 가능한 다양한 시스템, 예컨대, 제한 없이, Illumina®, 파시픽 바이오사이언시스(Pacific Biosciences)(PacBio®), Oxford Nanopore® 또는 라이프 테크놀로지스(Life Technologies)(Ion Torrent®)의 시퀀싱 시스템에 의해 수행될 수 있다. 또한, 단편 길이를 제공하는 임의의 시퀀싱 방법, 예컨대, 쌍-말단 시퀀싱을 이용할 수 있다. 대안적으로 또는 추가로, 핵산 증폭, 중합효소 연쇄 반응(PCR)(예를 들어, 디지털 PCR, 정량 PCR 또는 실시간 PCR) 또는 등온 증폭을 이용하여 시퀀싱을 수행할 수 있다. 이러한 시스템은 대상체에 의해 제공된 샘플로부터 시스템에 의해 생성된, 대상체(예를 들어, 인간)의 유전 정보에 상응하는 복수의 미처리 유전 데이터를 제공할 수 있다. 일부 예에서, 이러한 시스템은 시퀀싱 리드(본원에서 "리드"로서도 지칭됨)를 제공한다. 리드는 시퀀싱된 핵산 분자의 서열에 상응하는 일련의 핵산 염기를 포함할 수 있다. 일부 상황에서, 본원에서 제공된 시스템 및 방법은 단백질체학 정보와 함께 사용될 수 있다.
일부 실시양태에서, 시퀀싱 리드는 차세대 시퀀싱 방법 또는 차차세대 시퀀싱 방법을 통해 수득된다. 일부 실시양태에서, 시퀀싱 방법은 암에서 순환 DNA(ctDNA)를 정량하는 데 이용되는 차세대 시퀀싱 기반 방법인 딥 시퀀싱에 의한 암 맞춤형 프로파일링(CAPP-Seq)을 포함한다. 이 방법은 재발성 돌연변이를 갖는 것으로 알려진 임의의 암 유형에 대해 일반화될 수 있으며 10,000개의 건강한 DNA 분자에서 하나의 돌연변이체 DNA 분자를 검출할 수 있다. 일부 실시양태에서, 시퀀싱 방법은 전체적으로 본원에 참고로 포함되는 문헌[Shen et al., sensitive tumor detection and classification using plasma cell-free DNA methylomes, (2018) Nature]에 기재된 cfMeDIP 시퀀싱을 포함한다. 일부 실시양태에서, 시퀀싱은 중아황산염 시퀀싱을 포함한다.
일부 실시양태에서, 시퀀싱은 예를 들어, 바코드, 고유 분자 식별자(UMI) 또는 또 다른 태그를 핵산 분자 또는 이의 단편에 라이게이션시킴으로써 핵산 분자 또는 이의 단편을 변형시키는 것을 포함한다. 바코드, UMI 또는 태그를 핵산 분자 또는 이의 단편의 한 말단에 라이게이션시키는 것은 시퀀싱 후 핵산 분자 또는 이의 단편의 분석을 용이하게 할 수 있다. 일부 실시양태에서, 바코드는 고유 바코드(예를 들어, UMI)이다. 일부 실시양태에서, 바코드는 고유하지 않으며, 바코드 서열은 표적 핵산의 시작 및 정지 서열과 같은 내생성 서열 정보와 함께 사용될 수 있다(예를 들어, 표적 핵산은 바코드에 의해 플랭킹되고, 바코드 서열은 표적 핵산의 시작과 말단에 있는 서열과 함께 고유 태그부착된 분자를 생성한다). 바코드, UMI 또는 태그는 폴리뉴클레오타이드 또는 이의 단편을 입력 또는 표적 핵산 분자 또는 이의 단편과 연결하는 데 사용되는 공지된 서열일 수 있다. 바코드, UMI 또는 태그는 천연 뉴클레오타이드 또는 비-천연(예를 들어, 변형된) 뉴클레오타이드(예를 들어, 본원에 기재된 바와 같음)를 포함할 수 있다. 바코드 서열은 바코드 서열이 시퀀싱 리드 내에 함유될 수 있도록 어댑터 서열 내에 함유될 수 있다. 바코드 서열은 길이에서 적어도 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개 또는 더 많은 뉴클레오타이드를 포함할 수 있다. 일부 경우, 바코드 서열은 충분한 길이를 가질 수 있고 연결되어 있는 바코드 서열을 기반으로 샘플을 확인할 수 있게 하도록 또 다른 바코드 서열과 충분히 상이할 수 있다. 바코드 서열 또는 바코드 서열의 조합은 "원래" 핵산 분자 또는 이의 단편(예를 들어, 대상체로부터의 샘플에 존재하는 핵산 분자 또는 이의 단편)을 태그부착한 후 확인하는 데 사용될 수 있다. 일부 경우, 바코드 서열 또는 바코드 서열의 조합은 원래 핵산 분자 또는 이의 단편을 확인하는 데 내생성 서열 정보와 함께 사용된다. 예를 들어, 바코드 서열 또는 바코드 서열의 조합은 바코드, UMI 또는 태그에 인접한 내생성 서열(예를 들어, 내생성 서열의 시작 및 말단)과 함께 사용될 수 있다.
핵산 분자 또는 이의 단편의 프로세싱은 핵산 증폭을 수행하는 것을 포함할 수 있다. 예를 들어, 임의의 유형의 핵산 증폭 반응을 이용하여 표적 핵산 분자 또는 이의 단편을 증폭하고 증폭된 생성물을 생성할 수 있다. 핵산 증폭 방법의 비제한적 예는 역전사, 프라이머 연장, 중합효소 연쇄 반응(PCR), 리가제 연쇄 반응, 비대칭 증폭, 롤링 서클 증폭 및 다중 치환 증폭(MDA)을 포함한다. PCR의 예는 정량 PCR, 실시간 PCR, 디지털 PCR, 에멀젼 PCR, 핫 스타트(hot start) PCR, 다중체 PCR, 비대칭 PCR, 네스티드(nested) PCR 및 어셈블리 PCR을 포함하나, 이들로 제한되지 않는다. 핵산 증폭은 하나 이상의 프라이머, 프로브, 중합효소, 완충제, 효소 및 데옥시리보뉴클레오타이드와 같은 하나 이상의 시약을 사용할 수 있다. 핵산 증폭은 등온 핵산 증폭일 수 있거나 열 순환 및/또는 내생성 서열의 길이의 이용을 포함할 수 있다.
메틸화 프로파일
본 개시내용은 질환/병태를 갖거나 이러한 질환/병태를 갖는 것으로 의심되는 대상체의 메틸화 프로파일을 생성하는 방법, 시스템 및 키트를 제공하는 것으로, 여기서 메틸화 프로파일은 대상체가 질환/병태를 갖거나 가질 위험에 있는지를 확인하는 데 사용될 수 있다. cfMeDIP-seq를 이용하기 전, 본원에 개시된 샘플에 대해 라이브러리 제조를 수행한다. 요약하건대, 말단-복구 및 A-테일링 후, 샘플을 핵산 어댑터에 라이게이션시키고 효소를 사용하여 분해한다. 상기 샘플 단락에서 설명된 바와 같이, 제조된 라이브러리를 필러 핵산(예를 들어, 필러 λ DNA)과 조합하여 제조된 라이브러리에서 낮은 존재량 ctDNA의 영향을 최소화하고 혼합된 샘플을 생성할 수 있다. 일부 실시양태에서, 질환/병태가 국소국부(비-전이성) 암일 때, ctDNA의 양은 낮고 쉽고 정확하게 측정될 수 없고 정량될 수 없다. 혼합된 샘플을 적어도 약 50 ng, 80 ng, 100 ng, 120 ng, 150 ng 또는 200 ng으로 만들고 더 농후화한다.
본원에 기재된 방법, 시스템 및 키트는 부신암, 항문암, 담도암, 방광암, 골암, 뇌/cns 종양, 유방암, 캐슬맨병, 자궁경부암, 결장/직장암, 자궁내막암, 식도암, 유잉 계열의 종양, 안암, 담낭암, 위장 카르시노이드 종양, 위장 기질 종양(gist), 임신성 영양막 질환, 호지킨병, 카포시 육종, 신장암, 후두 및 하인두암, 백혈병(급성 림프구성, 급성 골수성, 만성 림프구성, 만성 골수성, 만성 골수단핵구성), 간암, 폐암(비-소세포, 소세포, 폐 카르시노이드 종양), 림프종, 피부의 림프종, 악성 중피종, 다발성 골수종, 골수이형성 증후군, 비강 및 부비동암, 비인두암, 신경모세포종, 비-호지킨 림프종, 구강 및 구인두암, 골육종, 난소암, 음경암, 뇌하수체 종양, 전립선암, 망막모세포종, 횡문근육종, 침샘암, 육종 - 성인 연조직암, 피부암(기저 및 편평 세포, 흑색종, 메르켈 세포), 소장암, 위암, 고환암, 흉선암, 갑상선암, 자궁 육종, 질암, 외음부암, 발덴스트롬 마크로글로불린혈증, 윌름스 종양을 포함하나 이들로 제한되지 않는 매우 다양한 암에 적용될 수 있다. 한 실시양태에서, 암은 두경부 편평 세포 암종이다.
결합제는 혼합된 샘플을 농후화하는 데 사용될 수 있다. 일부 실시양태에서, 결합제는 메틸-CpG 결합 도메인을 포함하는 단백질이다. 하나의 이러한 예시적인 단백질은 MBD2 단백질이다. 본원에서 사용된 바와 같이, "메틸-CpG 결합 도메인(MBD)"은 대략 70개 잔기의 길이를 갖고 하나 이상의 대칭적으로 메틸화된 CpG를 함유하는 DNA에 결합하는 단백질 및 효소의 특정 도메인을 지칭한다. MeCP2, MBD1, MBD2, MBD4 및 BAZ2의 MBD는 DNA와의 결합을 매개하고, MeCP2, MBD1 및 MBD2의 경우, 주로 메틸화된 CpG와의 결합을 매개한다. 인간 단백질 MECP2, MBD1, MBD2, MBD3 및 MBD4는 각각 메틸-CpG 결합 도메인(MBD)의 존재에 의해 관련된 핵 단백질 계열을 포함한다. MBD3을 제외한 이들 단백질 각각은 메틸화된 DNA에 특이적으로 결합할 수 있다.
다른 실시양태에서, 결합제는 항체이고 무세포 메틸화된 DNA의 포획은 항체를 사용하여 무세포 메틸화된 DNA를 면역침전시키는 것을 포함한다. 본원에서 사용된 바와 같이, "면역침전"은 특정 항원에 특이적으로 결합하는 항체를 사용하여 그 항원(예컨대, 폴리펩타이드 및 뉴클레오타이드)을 용액으로부터 침전시키는 기법을 의미한다. 이 과정은 샘플로부터 특정 단백질 또는 DNA를 단리하고 농축하는 데 이용될 수 있고 절차의 일부 시점에서 항체가 고체 기판에 커플링될 것을 요구한다. 고체 기판은 예를 들어, 자기 비드와 같은 비드를 포함한다. 다른 유형의 비드 및 고체 기판을 사용할 수 있다.
한 예시적인 항체는 5-MeC 항체이다. 면역침전 절차를 위해, 일부 실시양태에서 적어도 0.05 ㎍의 항체가 샘플에 첨가되고; 보다 바람직한 실시양태에서 적어도 0.16 ㎍의 항체가 샘플에 첨가된다. 면역침전 반응을 확인하기 위해, 일부 실시양태에서 본원에 기재된 방법은 제2양의 대조군 DNA를 샘플에 첨가하는 단계를 추가로 포함한다.
농후화된 샘플을 더 증폭하고 정제하고 시퀀싱하여 복수의 서열 리드를 생성한다. 복수의 서열 리드를 분석하여 복수의 차등적으로 메틸화된 영역(DMR)을 확인한다. 일부 실시양태에서, 복수의 DMR은 말초 혈액 백혈구(PBL)로부터 유래한 무세포 핵산 분자로부터 유래한 DMR을 포함한다. 일부 실시양태에서, 복수의 DMR은 적어도 약 750,000개의 비-중첩 약 300 bp 핵산 단편 윈도우를 포함한다. 이들 단편은 8개 이상의 CpG 아일랜드를 포함한다. 일부 실시양태에서, DMR은 질환/병태를 가진 환자로부터 수득된 샘플로부터 생성된 서열 리드를 건강한 대조군으로부터 수득된 샘플로부터 생성된 서열 리드와 비교함으로써 확인된다. 일부 실시양태에서, 건강한 대조군은 질환/병태를 발생시키는 동일한 세트의 위험 요인을 포함한다. 일부 실시양태에서, 복수의 DMR은 적어도 약 997개의 DMR을 포함한다: HNSCC에서 약 941개는 과다메틸화되어 있고 HNSCC에서 56개는 과소메틸화되어 있다(표 5). 본원에 개시된 동일한 방식을 이용하여, 상이한 암(예를 들어, 폐암, 췌장암, 대장암)에 대해 과다메틸화된 DMR을 검출할 수 있고 상이한 암에 대해 과소메틸화된 DMR을 검출할 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
게놈 돌연변이 프로파일
본 개시내용은 질환/병태를 갖거나 이러한 질환/병태를 갖는 것으로 의심되는 대상체의 돌연변이 프로파일을 생성하는 방법, 시스템 및 키트를 제공하는 것으로, 여기서 메틸화 프로파일은 대상체가 질환/병태를 갖는지 아니면 질환/병태를 가질 위험에 있는지를 확인하는 데 사용될 수 있다. 본원에 개시된 샘플에 대해 라이브러리 제조 및 차세대 딥 시퀀싱(예를 들어, CAPP-Seq)을 수행한다. 복수의 시퀀싱 리드를 생성하고 분석한다. 일부 실시양태에서, 딥 시퀀싱은 질환/병태와 관련된 게놈 돌연변이의 확인을 최대화하도록 구성될 수 있다. 예를 들어, 제한하려는 의도는 아니지만, 두경부 편평 세포 암종(HNSCC)의 경우, 정규 HNSCC 유발제 유전자의 패널이 CAPP-seq용 선택제에 포함될 수 있다. 또한, 폐암의 경우, 폐암 유발제 유전자의 패널이 CAPP-seq용 선택제에 포함될 수 있다. 또한, 췌장암의 경우, 췌장암 유발제 유전자의 패널이 CAPP-seq용 선택제에 포함될 수 있다. 일부 실시양태에서, 특정 암 유형에서 알려진 유발제 효과가 없는 유전자를 CAPP-seq용 선택제에 포함시키는 것은 ctDNA 검출의 민감도를 증가시킬 수 있다.
일부 실시양태에서, ctDNA 존재량의 상대적인 척도는 평균 돌연변이체 대립유전자 분율(MAF)로부터 계산된다. 일부 실시양태에서, 대상체에서 확인되고 그의/그녀의 돌연변이 프로파일에 포함된 돌연변이의 평균 MAF는 적어도 약 0.01% 내지 적어도 약 10%이다. 본원에 개시된 샘플의 ctDNA 분율은 약 적어도 0.01%, 0.02%, 0.03%, 0.04%, 0.05%, 0.06%, 0.07%, 0.08%, 0.09%, 0.1%, 0.15%, 0.2%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 10% 또는 이들 사이의 임의의 백분율이다.
일부 실시양태에서, 대상체의 생성된 돌연변이 프로파일은 PBL로부터 유래한 무세포 핵산 분자로부터 유래한 돌연변이 변이체를 포함하지 않는다. 일부 실시양태에서, 돌연변이 프로파일은 유전적 다형성, 예컨대, 미스센스 변이체, 넌센스 변이체, 결실 변이체, 삽입 변이체, 중복 변이체, 역위 변이체, 프레임쉬프트 변이체 또는 반복부 확장 변이체를 포함한다. 일부 실시양태에서, 돌연변이 프로파일은 특정 크기 범위의 매우 적은 무세포 핵산 분자로부터 유래한 돌연변이 변이체를 포함할 수 있다.
단편 길이 프로파일
일부 실시양태에서, ctDNA 단편의 길이는 건강한 대상체로부터 유래한 무세포 핵산 분자보다 더 짧다. 일부 실시양태에서, 적어도 하나의 돌연변이를 포함하는 ctDNA의 길이는 상응하는 기준 대립유전자를 함유하는 무세포 핵산 분자의 길이보다 더 짧다. 일부 실시양태에서, 적어도 하나의 DMR을 함유하는 ctDNA 단편의 길이는 상응하는 게놈 영역을 함유하는 무세포 핵산 분자 단편보다 더 짧다.
일부 실시양태에서, 시퀀싱은 ctDNA 단편의 분해를 야기하고 ctDNA의 길이 분포의 보존을 방해하기 때문에 중아황산염 서열을 이용하지 않는다. 일부 실시양태에서, ctDNA의 단편 길이는 적어도 60 내지 500 bp, 80 내지 300 bp, 90 내지 250 bp, 80 내지 170 bp, 또는 100 내지 150 bp이다. 일부 실시양태에서, 본 개시내용은 특정 크기의 무세포 분자의 선택에 기반한 무세포 핵산 샘플의 농후화를 제공한다. 일부 실시양태에서, 다중모드 분석은 복수의 핵산 분자를, 이들의 단편 길이를 기준으로 돌연변이 프로파일에 선택적으로 포함시킴으로써 본원에 기재된 돌연변이 프로파일 및 단편 길이 프로파일을 이용하는 단계를 포함한다. 일부 실시양태에서, 다중모드 분석은 복수의 핵산 분자를, 이들의 단편 길이를 기준으로 메틸화 프로파일에 선택적으로 포함시킴으로써 본원에 기재된 메틸화 프로파일 및 단편 길이 프로파일을 이용하는 단계를 포함한다. 일부 실시양태에서, 다중모드 분석은 복수의 핵산 분자를, 이들의 단편 길이를 기준으로 돌연변이 프로파일에 선택적으로 포함시키고 복수의 핵산 분자를, 이들의 단편 길이를 기준으로 메틸화 프로파일에 선택적으로 포함시킴으로써 돌연변이 프로파일, 메틸화 프로파일 및 단편 길이 프로파일을 함께 이용하는 단계를 포함한다.
암을 검출하고, 종양에 대해 기원 조직을 확인하고, 예후를 제공하는 방법 및 시스템
본 개시내용은 대상체가 질환을 갖거나 가질 위험이 있는지를 확인하는 방법 및 시스템을 제공하는 것으로, 여기서 이 방법 및 시스템은 상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여 (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일 중 적어도 하나의 프로파일을 생성하는 단계; 및 상기 적어도 하나의 프로파일을 프로세싱하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 적어도 80%의 민감도 또는 적어도 약 90%의 특이성으로 확인하는 단계를 포함하고, 여기서 상기 무세포 핵산 샘플은 30 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함한다. 일부 실시양태에서, 민감도는 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 이 숫자들 사이의 임의의 백분율이다. 일부 실시양태에서, 특이성은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 이 숫자들 사이의 임의의 백분율이다.
일부 실시양태에서, 상기 방법 및 시스템은 상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여, (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일 중 적어도 2개의 프로파일을 생성하는 단계를 포함한다. 상기 방법은 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 이 숫자들 사이의 임의의 백분율의 민감도를 제공한다. 일부 실시양태에서, 2개의 프로파일을 사용할 때 민감도는 하나의 프로파일을 사용할 때 민감도에 비해 적어도 약 0.5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 또는 이 숫자들 중 임의의 숫자 사이의 백분율만큼 증가된다. 일부 실시양태에서, 3개의 프로파일을 사용할 때 민감도는 2개의 프로파일을 사용할 때 민감도에 비해 적어도 약 0.5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 또는 이 숫자들 중 임의의 숫자 사이의 백분율만큼 증가된다.
추가로, 상기 방법은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 이 숫자들 사이의 임의의 백분율의 특이성을 제공한다. 일부 실시양태에서, 2개의 프로파일을 사용할 때 특이성은 하나의 프로파일을 사용할 때 특이성에 비해 적어도 약 0.5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 또는 이 숫자들 중 임의의 숫자 사이의 백분율만큼 증가된다. 일부 실시양태에서, 3개의 프로파일을 사용할 때 특이성은 2개의 프로파일을 사용할 때 특이성에 비해 적어도 약 0.5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 또는 이 숫자들 중 임의의 숫자 사이의 백분율만큼 증가된다.
본 개시내용은 대상체의 무세포 핵산 샘플을 프로세싱하여 상기 대상체가 질환을 갖거나 가질 위험이 있는지를 확인하는 방법 및 시스템을 제공하는 것으로, 상기 방법 및 시스템은 복수의 핵산 분자를 포함하는 상기 무세포 핵산 샘플을 제공하는 단계; 상기 복수의 핵산 분자 또는 이의 유도체를 시퀀싱하여 복수의 시퀀싱 리드를 생성하는 단계; 상기 복수의 시퀀싱 리드를 컴퓨터 프로세싱하여, 상기 복수의 핵산 분자에 대해 (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일을 확인하는 단계; 및 적어도 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 사용하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 확인하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 이 숫자들 사이의 임의의 백분율의 민감도를 제공한다. 상기 방법은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 이 숫자들 사이의 임의의 백분율의 특이성을 제공한다.
본 개시내용은 복수의 차등적으로 메틸화된 영역(DMR)을 확인하는 단계를 포함하는, 종양의 조직 기원을 확인하는 방법 및 시스템을 제공하는 것으로, 여기서 복수의 DMR은 특정 암(예를 들어, 유방암, 결장암, 전립선암, HSNCC)에 대해 특이적이고 매우 적은 무세포 핵산 분자로부터 유래한다. 일부 실시양태에서, 매우 적은 무세포 핵산 분자는 ctDNA로부터 유래한다. 일부 실시양태에서, 상기 방법은 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 이 숫자들 사이의 임의의 백분율의 민감도를 제공한다. 상기 방법은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 이 숫자들 사이의 임의의 백분율의 특이성을 제공한다.
본 개시내용은 질환/병태에 대한 치료를 받은 후 대상체에게 예후를 제공하는 방법 및 시스템을 기술한다. 예를 들어, 치료는 종양의 외과적 제거, 특정 유형의 암을 위해 디자인된 화학요법, 방사선요법 또는 면역요법(예를 들어, TCR, CAR 등)을 포함한다. 일부 실시양태에서, 상기 방법 또는 시스템은 상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여, (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일 중 적어도 하나의 프로파일을 생성하는 단계; 및 적어도 하나의 프로파일을 기반으로 최소 잔존 질환(MRD)을 모니터링하거나 검출하는 단계를 포함한다.
본 개시내용은 대상체로부터의 샘플의 적어도 일부로부터 무세포 핵산 분자를 어세이하고; 표 5에 나열된 차등적으로 메틸화된 영역(DMR)에 포함된 상기 무세포 핵산 분자의 적어도 일부의 메틸화 수준을 검출하고; 적어도 하나의 컴퓨터 프로세서를 이용하여 (b)에서 검출된 상기 메틸화 수준을 표 5에 나열된 상기 DMR에 포함된 상기 무세포 핵산 분자의 상응하는 부분(들)의 메틸화 수준과 비교함으로써, 대상체가 질환/병태를 갖는지를 확인하는 방법 및 시스템을 제공한다. 일부 실시양태에서, 표 5에 나열된 적어도 약 6개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 40개 이상, 50개 이상, 60개 이상, 70개 이상, 80개 이상, 90개 이상, 또는 100개 이상, 200개 이상, 300개 이상, 400개 이상, 500개 이상, 600개 이상 또는 700개 이상의 DMR의 메틸화 수준을 측정하고 본원에서 논의된 바와 같이 건강한 대상체 내의 상응하는 DMR의 메틸화 수준과 비교한다.
일단 대상체가 정확히 진단되고 암을 치료하는 치료, 예컨대, 수술적 제거, 화학요법, 방사선요법 등을 받으면, 치료의 효과를 모니터링하고 환자의 생존율을 예측하는 것이 중요하다. 또한, 암세포의 최소 잔존 질환을 검출하는 것이 중요하다. 본 개시내용은 대상체가 질환에 대한 치료를 받은 후 더 높은 생존율을 갖는지를 확인하는 방법 및 시스템을 제공하는 것으로, 여기서 상기 방법 및 시스템은 상기 대상체로부터의 샘플의 적어도 일부로부터 무세포 핵산 분자를 어세이하는 단계; 표 6에 나열된 차등적으로 메틸화된 영역(DMR)에 포함된 상기 무세포 핵산 분자의 적어도 일부의 메틸화 수준을 검출하는 단계; 및 적어도 하나의 컴퓨터 프로세서를 사용하여 (b)에서 검출된 상기 메틸화 수준을 표 6에 나열된 상기 DMR에 포함된 상기 무세포 핵산 분자의 상응하는 부분(들)의 메틸화 수준과 비교하는 단계를 포함한다. 일부 실시양태에서, 표 6에 나열된 DMR은 유전자 ZSCAN31, LINC01391, GATA2-AS1, STK3 및 OSR1과 관련된 영역을 나타낸다.
Figure pct00035
일부 실시양태에서, 상기 방법은 면역침전 반응을 확인하기 위해 제2양의 대조군 DNA를 샘플에 첨가하는 단계를 추가로 포함한다.
본원에서 사용된 바와 같이, "대조군"은 양성 및 음성 대조군 둘 다, 또는 적어도 양성 대조군을 포함할 수 있다.
일부 실시양태에서, 상기 방법은 무세포 메틸화된 DNA의 포획을 확인하기 위해 제2양의 대조군 DNA를 샘플에 첨가하는 단계를 추가로 포함한다.
일부 실시양태에서, 암세포로부터의 DNA의 존재를 확인하는 것은 기원의 암세포 조직을 확인하는 것도 포함한다.
일부 경우, 종양 조직 샘플링은 어려울 수 있거나 상당한 위험을 수반할 수 있고, 이 경우 종양 조직 샘플링을 필요로 하지 않으면서 암을 진단하고/하거나 하위유형화하는 것이 바람직할 수 있다. 예를 들어, 폐 종양 조직 샘플링은 종격동경 검사, 개흉술 또는 경피 바늘 생검과 같은 침습적 절차를 요구할 수 있고; 이 절차는 입원, 흉관, 기계 호흡, 항생제 또는 다른 의학적 시술을 필요로 할 수 있다. 일부 개체는 의학적 동반질환 때문에 또는 선호도로 인해 종양 조직 샘플링에 필요한 침습적 절차를 겪지 않을 수 있다. 일부 경우, 종양 조직 조달을 위한 실제 절차는 의심되는 암 하위유형에 의해 좌우될 수 있다. 다른 경우, 암 하위유형은 동일한 개체 내에서 시간 경과에 따라 진화할 수 있고; 침습적 종양 조직 샘플링 절차를 이용한 일련의 평가는 종종 비실용적이며 환자가 잘 견디지 못한다. 따라서, 혈액 검사를 통한 비-침습적 암 하위유형화는 임상 종양학의 실시에 있어서 많은 유리한 적용을 가질 수 있다.
따라서, 일부 실시양태에서, 기원의 암세포 조직을 확인하는 것은 암 하위유형을 확인하는 것을 추가로 포함한다. 바람직하게는, 암 하위유형은 병기(예를 들어, 수술로 치료된 초기 폐암 대 화학요법으로 치료된 말기 폐암), 조직학(예를 들어, 폐암에서 소세포 암종 대 선암종 대 편평 세포 암종), 유전자 발현 패턴 또는 전사 인자 활성(예를 들어, 유방암에서 ER 상태), 카피 수 이상(예를 들어, 유방암에서 HER2 상태), 특정 재배열(예를 들어, AML에서 FLT3), 특정 유전자 점 돌연변이 상태(예를 들어, IDH 유전자 점 돌연변이) 및 DNA 메틸화 패턴(예를 들어, 뇌암에서 MGMT 유전자 프로모터 메틸화)을 기준으로 암을 구별한다.
일부 실시양태에서, 단계 (f)에서의 비교는 게놈 전체에서 수행된다.
다른 실시양태에서, 단계 (f)에서의 비교는 게놈 전체부터 특정 조절 영역, 예컨대, FANTOM5 인핸서, CpG 아일랜드, CpG 쇼어, CpG 쉘프 또는 이들의 임의의 조합(이들로 제한되지 않음)까지 제한된다.
일부 실시양태에서, 본원의 방법은 암의 검출에 사용하기 위한 것이다.
일부 실시양태에서, 본원의 방법은 암의 요법을 모니터링하는 데 사용하기 위한 것이다.
데이터 분석 시스템 및 방법
본원에 개시된 방법 및 시스템은 알고리즘 또는 이의 사용을 포함할 수 있다. 하나 이상의 알고리즘은 1명 이상의 대상체로부터의 하나 이상의 샘플을 분류하는 데 사용될 수 있다. 하나 이상의 알고리즘은 하나 이상의 샘플로부터의 데이터에 적용될 수 있다. 데이터는 바이오마커 발현 데이터를 포함할 수 있다. 본원에 개시된 방법은 1명 이상의 대상체로부터의 하나 이상의 샘플에 분류를 배정하는 단계를 포함할 수 있다. 샘플에 분류를 배정하는 것은 알고리즘을 메틸화 프로파일, 돌연변이 프로파일 및 단편 길이 프로파일에 적용하는 것을 포함할 수 있다. 일부 경우, 적어도 하나의 프로파일은 질환 또는 경미한 손상을 가진 대상체로부터 수득된 샘플을 분류하기 위한 훈련된 알고리즘을 포함하는 데이터 분석 시스템에 입력된다.
데이터 분석 시스템은 훈련된 알고리즘일 수 있다. 알고리즘은 선형 분류기를 포함할 수 있다. 일부 경우, 선형 분류기는 선형 판별 분석, 피셔(Fisher)의 선형 판별, 나이브 베이즈(Naive Bayes) 분류기, 로지스틱 회귀, 퍼셉트론(Perceptron), 서포트 벡터 머신 또는 이들의 조합 중 하나 이상을 포함한다. 선형 분류기는 서포트 벡터 머신(SVM) 알고리즘일 수 있다. 알고리즘은 양방향 분류기를 포함할 수 있다. 양방향 분류기는 하나 이상의 결정 트리, 랜덤 포레스트, 베이지안(Bayesian) 네트워크, 서포트 벡터 머신, 신경 네트워크 또는 로지스틱 회귀 알고리즘을 포함할 수 있다.
알고리즘은 하나 이상의 선형 판별 분석(LDA), 기본 퍼셉트론, 엘라스틱 네트, 로지스틱 회귀, (커넬) 서포트 벡터 머신(SVM), 대각 선형 판별 분석(DLDA), 골룹(Golub) 분류기, 파르젠(Parzen) 기반, (커넬) 피셔 판별 분류기, k-최근접 이웃, 반복 RELIEF, 분류 트리, 최대 우도 분류기, 랜덤 포레스트, 최근접 중심(Nearest Centroid), 마이크로어레이의 예측 분석(PAM), k-중앙값 클러스터링, 퍼지(Fuzzy) C-평균 클러스터링, 가우시안(Gaussian) 혼합 모델, 등급화된 반응(GR), 그래디언트 부스팅 방법(GBM), 엘라스틱 네트 로지스틱 회귀, 로지스틱 회귀 또는 이들의 조합을 포함할 수 있다. 알고리즘은 대각 선형 판별 분석(DLDA) 알고리즘을 포함할 수 있다. 알고리즘은 최근접 중심 알고리즘을 포함할 수 있다. 알고리즘은 랜덤 포레스트 알고리즘을 포함할 수 있다. 일부 실시양태에서, 자간전증과 비-자간전증의 구별에 있어서, 로지스틱 회귀, 랜덤 포레스트 및 그래디언트 부스팅 방법(GBM)의 성능은 선형 판별 분석(LDA), 신경 네트워크 및 서포트 벡터 머신(SVM)의 성능보다 더 우수하다.
키트
본 개시내용은 대상체의 질환 또는 장애(예를 들어, 암)를 확인하거나 모니터링하는 키트를 제공한다. 키트는 대상체의 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)를 확인하는 프로브를 포함할 수 있다. 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)는 대상체의 질환 또는 장애(예를 들어, 암)를 표시할 수 있다. 프로브는 샘플에서 암 관련 게놈 유전자좌의 패널에서 서열(예를 들어, 표 3, 5 및 6에 나열된 DMR)에 대해 선택적일 수 있다. 키트는 샘플을 프로세싱하여, 대상체의 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)를 표시하는 데이터세트를 생성하기 위한 프로브의 사용에 대한 설명서를 포함할 수 있다.
키트의 프로브는 샘플에서 암 관련 게놈 유전자좌의 패널에서 서열에 대해 선택적일 수 있다. 키트의 프로브는 암 관련 게놈 유전자좌의 패널에 상응하는 핵산(예를 들어, RNA 또는 DNA) 분자를 선택적으로 농후화하도록 구성될 수 있다. 키트의 프로브는 핵산 프라이머일 수 있다. 키트의 프로브는 암 관련 게놈 유전자좌 또는 게놈 영역의 패널 중 하나 이상의 패널로부터의 핵산 서열과 서열 상보성을 가질 수 있다. 암 관련 게놈 유전자좌 또는 마이크로바이옴 관련 게놈 유전자좌 또는 게놈 영역의 패널은 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 또는 더 많은 상이한 암 관련 게놈 유전자좌 또는 게놈 영역의 패널을 포함할 수 있다.
키트의 설명서는 무세포 생물학적 샘플에서 암 관련 게놈 유전자좌의 패널에서 서열에 대해 선택적인 프로브를 사용하여 샘플을 어세이하기 위한 설명서를 포함할 수 있다. 이 프로브는 복수의 암 관련 게놈 유전자좌의 패널 중 하나 이상의 패널로부터의 핵산 서열(예를 들어, RNA 또는 DNA)과 서열 상보성을 가진 핵산 분자(예를 들어, RNA 또는 DNA)일 수 있다. 이 핵산 분자는 프라이머 또는 농후화 서열일 수 있다. 무세포 생물학적 샘플을 어세이하기 위한 설명서는 샘플을 프로세싱하여 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)를 표시하는 데이터세트를 생성하기 위해 어레이 하이브리드화, 중합효소 연쇄 반응(PCR) 또는 핵산 시퀀싱(예를 들어, DNA 시퀀싱 또는 RNA 시퀀싱)을 수행하기 위한 설명서를 포함할 수 있다. 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)는 질환 또는 장애(예를 들어, 암)를 표시할 수 있다.
키트의 설명서는 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)를 표시하는 데이터세트를 생성하기 위해 암 관련 게놈 유전자좌의 패널 중 하나 이상의 패널에서 정량될 수 있는 어세이 판독값을 측정하고 해석하기 위한 설명서를 포함할 수 있다. 예를 들어, 암 관련 게놈 유전자좌의 패널에 상응하는 어레이 하이브리드화 또는 중합효소 연쇄 반응(PCR)의 정량은 샘플에서 암 관련 게놈 유전자좌의 패널 각각에서 서열의 정량적 척도(예를 들어, 존재, 부재 또는 상대적인 양을 표시함)를 표시하는 데이터세트를 생성할 수 있다. 어세이 판독값은 정량 PCR(qPCR) 값, 디지털 PCR(dPCR) 값, 디지털 액적 PCR(ddPCR) 값, 형광 값 등 또는 이들의 정규화된 값을 포함할 수 있다.
컴퓨터 시스템
일부 실시양태에서, 특정 단계는 컴퓨터 프로세서에 의해 수행된다. 본 시스템 및 방법은 다양한 실시양태로 실시될 수 있다. 적절하게 구성된 컴퓨터 장치 및 관련 통신 네트워크, 장치, 소프트웨어 및 펌웨어는 전술된 하나 이상의 실시양태를 가능하게 하는 플랫폼을 제공할 수 있다. 예를 들어, 도 8은 저장 유닛(104) 및 랜덤 액세스 메모리(106)에 연결된 중앙 프로세싱 장치("CPU")(102)를 포함할 수 있는 일반 컴퓨터 장치(100)를 보여준다. CPU(102)는 운영 시스템(101), 응용 프로그램(103) 및 데이터(123)를 프로세싱할 수 있다. 운영 시스템(101), 응용 프로그램(103) 및 데이터(123)는 필요에 따라 저장 유닛(104)에 저장될 수 있고 메모리(106)에 로딩될 수 있다. 컴퓨터 장치(100)는 CPU(102) 및 메모리(106)에 작동 가능하게 연결되어 CPU(102)로부터 집약적인 영상 프로세싱 계산을 오프로딩하고CPU(102)와 함께 이러한 계산을 실행하는 그래픽 프로세싱 유닛(GPU)(122)을 추가로 포함할 수 있다. 연산자(107)는 비디오 인터페이스(105)에 의해 연결된 비디오 디스플레이(108), 및 I/O 인터페이스(109)에 의해 연결된 다양한 입력/출력 장치, 예컨대, 키보드(115), 마우스(112) 및 디스크 드라이브 또는 고체 상태 드라이브(114)를 사용하여 컴퓨터 장치(100)와 상호작용할 수 있다. 마우스(112)는 비디오 디스플레이(108)에서 커서의 이동을 제어하고 마우스 버튼으로 비디오 디스플레이(108)에 나타나는 다양한 그래픽 사용자 인터페이스(GUI) 제어를 작동하도록 구성될 수 있다. 디스크 드라이브 또는 고체 상태 드라이브(114)는 컴퓨터 판독 가능한 매체(116)를 수용하도록 구성될 수 있다. 컴퓨터 장치(100)는 네트워크 인터페이스(111)를 통해 네트워크의 일부를 형성하여, 컴퓨터 장치(100)가 다른 적절하게 구성된 데이터 프로세싱 시스템(나타내지 않음)과 통신할 수 있게 한다. 하나 이상의 상이한 유형의 센서(135)는 다양한 공급원으로부터 입력을 수신하는 데 사용될 수 있다.
본 시스템 및 방법은 데스크탑(desktop) 컴퓨터, 랩탑(laptop) 컴퓨터, 태블릿 컴퓨터 또는 무선 핸드헬드(handheld)를 포함하는 사실상 임의의 방식의 컴퓨터 장치에서 실시될 수 있다. 본 시스템 및 방법은 하나 이상의 컴퓨터 장치가 본 발명에 따른 방법에서 다양한 프로세스 단계 각각을 구현할 수 있도록 컴퓨터 프로그램 코드를 포함하는 컴퓨터 판독 가능한/사용 가능한 매체로서 구현될 수도 있다. 전체 작업을 수행하는 여러 컴퓨터 장치가 있는 경우, 컴퓨터 장치는 작업의 다양한 단계를 분산시키도록 네트워크로 연결된다. 컴퓨터 판독 가능한 매체 또는 컴퓨터 사용 가능한 매체라는 용어는 프로그램 코드의 임의의 유형의 물리적 실시양태 중 하나 이상의 물리적 실시양태를 포함하는 것으로 이해된다. 구체적으로, 컴퓨터 판독 가능한/사용 가능한 매체는 하나 이상의 휴대용 저장 제품(예를 들어, 광 디스크, 자기 디스크, 테이프 등), 또는 컴퓨팅 장치의 하나 이상의 데이터 저장 부분, 예컨대, 컴퓨터 및/또는 저장 시스템과 연결된 메모리에 내장된 프로그램 코드를 포함할 수 있다.
본원에서 사용된 바와 같이, "프로세서"는 임의의 유형의 프로세서, 예를 들어, 임의의 유형의 범용 마이크로프로세서 또는 마이크로제어기(예를 들어, IntelTM x86, PowerPCTM, ARMTM 프로세서 등), 디지털 신호 프로세싱(DSP) 프로세서, 집적 회로, 필드 프로그래밍 게이트 어레이(FPGA) 또는 이들의 임의의 조합일 수 있다.
본원에서 사용된 바와 같이, "메모리"는 내부 또는 외부에 위치된 임의의 유형의 컴퓨터 메모리, 예를 들어, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 압축 디스크 판독 전용 메모리(CDROM), 전기 광학 메모리, 자기 광학 메모리, 삭제 가능한 프로그래밍 판독 전용 메모리(EPROM) 및 전기적으로 삭제 가능한 프로그래밍 판독 전용 메모리(EEPROM) 등의 적합한 조합을 포함할 수 있다. 메모리(102)의 일부는 종래의 파일시스템을 사용함으로써 체계화될 수 있고, 장치의 전체 작업을 통제하는 운영 시스템에 의해 제어되고 관리될 수 있다.
본원에서 사용된 바와 같이, "컴퓨터 판독 가능한 저장 매체"(기계 판독 가능한 매체, 프로세서 판독 가능한 매체, 또는 컴퓨터 판독 가능한 프로그램 코드가 내장된 컴퓨터 사용 가능한 매체로서도 지칭됨)는 컴퓨터 또는 기계에 의해 판독될 수 있는 형식으로 데이터를 저장할 수 있는 매체이다. 기계 판독 가능한 매체는 디스켓, 압축 디스크 판독 전용 메모리(CD-ROM), 메모리 장치(휘발성 또는 비-휘발성), 또는 유사한 저장 메커니즘을 포함하는 자기적, 광학적 또는 전기적 저장 매체를 비롯한 임의의 적합한 유형의 비-일시적 매체일 수 있다. 컴퓨터 판독 가능한 저장 매체는 실행될 때 프로세서로 하여금 본 개시내용의 실시양태에 따른 방법의 단계를 수행하게 하는 다양한 명령어, 코드 순서, 구성 정보 또는 다른 데이터 세트를 함유할 수 있다. 당분야에서 통상의 기술을 가진 자는 설명된 구현물을 구현하는 데 필요한 다른 명령어 및 작업이 컴퓨터 판독 가능한 저장 매체에 저장될 수도 있음을 인식할 것이다. 컴퓨터 판독 가능한 저장 매체에 저장된 명령어는 프로세서 또는 다른 적합한 프로세싱 장치에 의해 실행될 수 있으며 설명된 작업을 수행하기 위해 회로와 접속할 수 있다.
본원에서 사용된 바와 같이, "데이터 구조"는 데이터가 효율적으로 사용될 수 있도록 컴퓨터에서 데이터를 체계화하는 특정 방식이다. 데이터 구조는 데이터 구조에 대해 수행될 수 있는 작업과 이 작업의 계산 복잡성을 특정하는 하나 이상의 특정 추상 데이터 유형(ADT)을 구현할 수 있다. 비교하건대, 데이터 구조는 ADT에 의해 제공된 사양의 구체적인 구현이다.
본 발명의 이점은 하기 실시예에 의해 추가로 예증된다. 본원에 기재된 실시예 및 이의 구체적인 세부사항은 단지 예시를 위해 제공되며 본 발명의 청구범위를 제한하는 것으로 해석되어서는 안 된다.
실시예
재료 & 방법
HNSCC 및 건강한 기증자 말초 혈액 백혈구(PBL) 및 혈장 획득
2014년과 2016년 사이에 HNSCC로 진단된 환자를 전향적 임상 결과 문집(Wong K. et al. 2010)으로부터 확인하였다. 모든 연구는 유니버시티 헬쓰 네트워크(University Health Network)의 연구 윤리위원회에 의해 승인되었다. 하기 기준을 기반으로 프린세스 마가렛 암 센터의 HNC 중개 연구 프로그램(Princess Margaret Cancer Centre's HNC Translational Research program)으로부터 HNSCC 환자 샘플을 수득하였다: 1) 진단 시 국소화된 질환의 제시, 2) 진단 시 및 치료 후 적어도 하나의 시점에서 혈액의 채취, 3) 진단 후 최소 2년의 추적검사 기간. 모든 환자들은 보조 방사선요법을 사용하거나 사용하지 않고 수술로 구성된 치유 목적 치료를 받았다. 연령, 성별 및 현재 흡연 상태별로 일치된 건강한 기증자를 전향적 폐암 스크리닝 프로그램으로부터 확인하였다. 5 내지 10 ㎖의 혈액을 에틸렌-디아민-테트라아세트산(EDTA) 튜브에 채취하였다. HNSCC 환자의 경우, 진단 시(기준점, BL) 및 1차 수술 후 3개월(3M)에서 혈액을 채취하였다. 적용 가능한 경우, 보조 방사선요법 전(PreRT), 보조 방사선요법 동안(MidRT) 및/또는 1차 수술로부터 12개월 후(12M) 추가 혈액을 채취하였다. 채취 후 1시간 이내에 혈액으로부터 혈장을 단리하고 추가 프로세싱까지 -80℃에서 저장하였다. 진단 시 HNSCC 환자 또는 건강한 기증자에 대한 동일한 혈액 채취로부터 말초 혈액 백혈구도 단리하였다.
세포 배양
HPV 음성 HNSCC 세포주인 FaDu를 브래들리 바우터스 박사(Dr. Bradly Wouters)(프린세스 마가렛 암 센터)로부터 친절하게 제공받고 10% 태아 소 혈청 및 1% 페니실린/스트렙토마이신으로 보충된 DMEM(Gibco)에서 배양하였다. FaDu 세포 배양물을 37℃에서 5% CO2를 함유하는 가습 대기에서 인큐베이션하였다. FaDu 세포의 정체성을 STR 프로파일링으로 확인하였다. 사용 전에 세포에 대해 마이코플라스마 시험(e-MycoTMVALiD 마이코플라스마 PCR 검출 키트, Intron Bio)을 수행하였다.
무세포 DNA(cfDNA) 및 PBL 게놈 DNA(gDNA)의 단리
제조사의 설명서에 따라 QIAamp 순환 핵산 키트(Qiagen)를 사용하여 총 혈장으로부터 cfDNA를 단리하였다. 게놈 DNA를 PBL로부터 단리하고 코바리스(Covaris) M220 초점-초음파처리기(Focused-ultrasonicator)를 이용하여 150개 내지 200개 염기쌍으로 전단하고 AMPure XP 자기 비드(Beckman Coulter)로 크기 선택하여 300개 초과의 염기쌍을 가진 단편을 제거하였다. 단리된 cfDNA 및 전단된 PBL 게놈 DNA를 라이브러리 생성 전에 큐비트(Qubit)로 정량하였다(도 9A 및 9B).
시퀀싱 라이브러리 제조
5 내지 10 또는 10 내지 20 ng의 DNA를 각각 cfMeDIP-seq 또는 CAPP-seq를 위한 입력물로서 사용하였다. 약간 변형된 KAPA HyperPrep 키트(KAPA Biosystems)를 사용하여 라이브러리 생성을 위해 입력 DNA를 준비하였다. 무작위 2 bp 서열에 이어, 라이게이션 시 입력 DNA의 가닥 둘 다에 5' 인접한 불변 1 bp T 서열을 포함하는 라이브러리 어댑터를 사용하였다. 라이게이션 동안 어댑터 이량체화를 최소화하기 위해, 라이브러리 어댑터를 100:1 어댑터:DNA 몰 비(cfDNA 10 ng당 약 0.07 μM)로 첨가하고 4℃에서 17시간 동안 밤새 인큐베이션하였다. 라이게이션 후 클립업 후, 입력 DNA를 라이브러리 생성 전에 40 ㎕의 용출 완충제(EB, 10 mM Tris-HCl, pH 8.0 내지 8.5)로 용출하였다.
CAPP-seq 라이브러리의 생성
약간 변형시킨 문헌[Newman et al. 2014]의 설명에 따라 CAPP-seq 라이브러리의 생성을 수행하였다. 라이브러리를 10 주기로 PCR 증폭하였고, 최대 12개의 인덱싱 증폭된 라이브러리를 500 내지 1000 ng에서 함께 풀링하였다. COT DNA 및 차단 올리고를 첨가한 후, 풀링된 라이브러리를 SpeedVac 처리하여 모든 액체를 증발시키고 13 ㎕ 재현탁 혼합물(8.5 ㎕ 2X 하이브리드화 완충제, 3.4 ㎕ 하이브리드화 성분 A, 1.1 ㎕ 뉴클레아제 무함유 물)에 재현탁하였다. 4 ㎕의 하이브리드화 프로브(즉, HNSCC 선택제)를 재현탁 혼합물에 첨가하여, 하이브리드화 전에 총 17 ㎕가 되게 하였다. 하이브리드화 및 PCR 증폭/클린업 후, 라이브러리를 30 ㎕의 IDTE(pH 8.0)(1x TE 용액)로 용출하였다. 다중화된 라이브러리를 각각 일루미나 NextSeq/NovaSeq/HiSeq4000에서 2 x 75/100/125 페어링된 실행으로 시퀀싱하였다. HNSCC 선택제의 디자인은 HPV-16 게놈의 E6 및 E7 영역뿐만 아니라 COSMIC 데이터베이스로부터의 HNSCC에서 자주 재발되는 게놈 변경도 포함하였다(도 11).
CAPP-seq 라이브러리의 정렬 및 품질 관리
포함된 무작위 분자 바코드에 상응하는, 정렬되지 않은 페어링된 리드의 각각의 5' 말단에 있는 처음 2개의 염기쌍을 추출하고 조합하여 4 bp 분자 식별자(UMI)를 생성하였다. 세 번째 T 염기쌍 스페이서도 정렬 전에 제거하였다. 페어링된 리드를 BWA-mem으로 인간 게놈(게놈 어셈블리 GRCh37/hg19)에 정렬시키고 SAMtools(v 1.3.1)로 분류하고 인덱싱하고, 가장 우수한 실례(참고문헌)에 따라 게놈 분석 툴키트(GATK) 염기재보정자(BaseRecalibrator)(v 3.8)를 이용하여 염기 품질 점수에 대해 재보정하였다. BAM 파일로부터의 중복된 서열을 그의 UMI를 기반으로 축소하고 컨센서스크런처(ConsensusCruncher)44로 싱글톤(Singleton), 단일 가닥 컨센서스 서열(SSCS) 또는 이중체 컨센서스 서열(DCS)로서 표지하였다. 포획 효율(CollectHsMetrics, Picard 2.10.9), 커버리지의 깊이(DepthOfCoverage, GATK 3.8) 및 염기쌍 위치 오류율(ides-bgreport.pl, Newman et al. 2016)을 수득하기 위해 각각의 라이브러리의 품질 관리를 FastQC(Babraham Bioinformatics)로부터 수득된 다양한 메트릭 및 다양한 스크립트로 평가하였다.
체세포 뉴클레오타이드 변이체(SNV)의 검출 및 ctDNA의 정량
잠재적 시퀀싱 오류의 제거를 문헌[Newman et al. 2016]에 기재된 통합 디지털 오류 억제(iDES)로 수행하였다. 본 발명자들의 20개의 건강한 기증자 cfDNA 샘플을 훈련 코호트로서 사용하여 배경 폴리싱(polishing)을 수행하였다(도 12). 다운스트림 분석에 대한 이상치(outlier)의 영향을 방지하기 위해, HNSCC cfDNA 또는 PBL gDNA 샘플 전체에 걸쳐 시퀀싱 깊이의 하위 15번째 또는 상위 85번째(1500x 이하, 5000x 이상) 백분위수 내에 있는 후보 SNV뿐만 아니라 500x 이하의 평균 시퀀싱 깊이를 가진 유전자도 분석으로부터 배제시켰다. 클론 조혈을 설명하기 위해, 비-생식세포계열 돌연변이를 혈장에서 10% 미만의 돌연변이체 대립유전자 분율을 갖는 것으로서 정의하였다. 일치된 PBL gDNA 샘플에서 기준, 즉 이중체 지지를 가진 3개 이상의 지지 리드 및 완전한 부재를 기반으로 HNSCC cfDNA 샘플에서 후보 SNV를 확인하였다. 대안적 대립유전자에 상응하는 리드의 수를 대안적 대립유전자 및 기준 대립유전자에 상응하는 리드의 합계로 나눔으로써, 확인된 SNV의 돌연변이체 대립유전자 분율(MAF)을 계산하였다. 확인 가능한 SNV를 가진 각각의 HNSCC cfDNA 샘플에 대해, SNV 전체에 걸쳐 평균 MAF를 계산하였고 ctDNA 존재량의 척도로서 사용하였다. 오로지 하나의 확인 가능한 SNV를 가진 cfDNA 샘플에서, 계산된 MAF를 사용하였다. 검출 가능한 암 유래 돌연변이 중 대다수는 동형접합이 아닐 수 있고 종양 내에서 클론이 아닐 수 있으며, 이러한 이유로 평균 MAF는 무세포 DNA 내의 진정한 ctDNA 존재량의 과소평가치일 수 있다.
cfMeDIP-seq 라이브러리의 생성
"시퀀싱 라이브러리 제조"에 기재된 라이브러리 제조 단계를 변형시켜 문헌[Shen et al. 2019]에 기재된 바와 같이 cfMeDIP-seq 프로토콜을 수행하였다. 다중체화된 라이브러리를 각각 일루미나 NextSeq/NovaSeq/HiSeq4000에서 2 x 75/100/125 페어링된 실행으로 시퀀싱하였다. 일반화를 위해, cfMeDIP-seq 라이브러리는 공급원(즉, cfDNA, gDNA)과 관계없이 5 내지 10 ng의 입력 DNA를 사용하는 임의의 MeDIP-seq 제조 방법으로서 기재된다.
cfMeDIP-seq 라이브러리의 정렬 및 품질 관리
정렬되지 않은 페어링된 리드를 "CAPP-seq 라이브러리의 정렬 및 품질 관리"에 이미 기재된 바와 같이 프로세싱하고 정렬하고 분류하고 인덱싱하였다. BAM 파일로부터의 중복된 서열을 SAMtools로 축소시켰다. FastQC(Babraham Bioinformatics)로부터 수득된 다양한 메트릭, 및 CpG 커버리지(MEDIPS.seqCoverage) 및 농후화(MEDIPS.CpGenrich)를 포함하는 R 팩키지 MEDIPS(참고문헌)로부터 수득된 다양한 메트릭으로 각각의 라이브러리의 품질 관리를 평가하였다.
cfMeDIP-seq 프로파일에서 정보제공 영역의 선택
cfMeDIP-seq 라이브러리의 페어링된 리드로부터 생성된 단편을 MEDIPS(MEDIPS.createSet)로 비-중첩 300개 염기쌍 윈도우 내에서 카운팅하고 백만당 킬로염기당 리드(Reads Per Kilobase per Million; RPKM)로 크기 조정하고 WIG 형식(MEDIPS.exportWIG)으로서 이출하였다. 각각의 샘플로부터의 WIG 파일을 R로 이입하고 매트릭스로서 모았다. 분석은 비-질환 환경 내에서 적용할 수 있도록 본 발명자들의 20개의 건강한 기증자 샘플로부터의 cfDNA 및 PBL 샘플로 제한되었다. 정보제공 영역은 기준인 CpG 밀도 및 cfDNA와 일치된 PBL 사이의 RPKM 값의 상관관계에 기반하였다. CpG 밀도(n개 이상의 CpG)에 기반한 슬라이딩 윈도우를 사용하여, 8개 이상의 CpG의 최소 역치를 선택하였다.
cfMeDIP-seq 라이브러리로부터 절대 메틸화의 계산
cfMeDIP-seq 라이브러리의 페어링된 리드로부터의 단편을 "cfMeDIP-seq 프로파일에서 정보제공 영역의 선택"에 전술된 바와 같이 카운팅하고 MeDEStrand R 팩키지로 절대 메틸화 수준까지 크기 조정하였다. 카운트로부터 절대 메틸화를 계산하기 위해, 로지스틱 회귀 모델을 사용하여 CpG 밀도(즉, CpG 밀도 편향)(MeDEStrand.calibrationCurve)를 기반으로 DNA 풀다운의 편향을 추정하였다. 추정된 CpG 밀도 편향을 기반으로, 각각의 윈도우 내의 메틸화를 양성 및 음성 DNA 가닥으로부터의 단편에 대해 보정하였다. 보정된 단편이 있는 윈도우를 로그 변환하고 절대 메틸화를 기술하기 위해 0 내지 1의 값으로 크기 조정하였다(MeDEStrand.binMethyl). 각각의 cfMeDIP-seq 샘플로부터의 절대 메틸화 수준을 WIG 유사 파일(즉, 트랙라인이 없는 WIG 파일 형식)로서 이출하였다.
인-실리코 PBL 고갈의 디자인 및 성능의 평가
질환 환경 내에서 윈도우에 대해 농후화하기 위해, "인-실리코 PBL 고갈"로서 지칭되는 과정으로 PBL로부터 메틸화를 제거하였다. 비-암 특정 환경 내에서의 적용을 가능하게 하기 위해 분석을 본 발명자들의 20명의 건강한 기증자 샘플의 코호트로부터의 PBL 샘플로 제한하였다. 인-실리코 PBL 고갈을 위한 본 발명자들의 전략을 다음과 같이 수행하였다:
1. "cfMeDIP-seq 프로파일에서 정보제공 영역의 선택"에 기재된 바와 같이 각각의 정보제공 윈도우에 대해, 건강한 기증자 PBL 샘플 전체에 걸쳐 중간 절대 메틸화 값을 계산한다.
2. 기준인 0.1 미만의 중간 절대 메틸화 값을 기반으로 PBL 고갈 윈도우를 정의한다.
3. PBL 고갈 윈도우 내에서 cfDNA 샘플의 분석을 제한한다.
훈련 세트로서 사용된 건강한 기증자 코호트로부터의 고갈 전 및 후 PBL 샘플의 절대 메틸화 분포를 검증 세트로서 사용된 HNSCC 코호트와 비교하여 인-실리코 PBL 고갈 전략의 성능을 평가하였다.
차등 메틸화 분석
HNSCC와 관련된 차등적으로 메틸화된 영역(DMR)의 강력한 검출을 가능하게 하기 위해, 분석을 CAPP-seq에 의해 혈장에서 검출 가능한 SNV를 가진 HNSCC 환자(n = 20/32)로 제한하였다. 차등 메틸화 분석을 인-실리코 PBL 고갈 후 정보제공 영역으로 제한하였다. "cfMeDIP-seq 프로파일에서 정보제공 영역의 선택"에 전술된 바와 같이 생성된, HNSCC 및 건강한 기증자 cfDNA 샘플로부터의 구간화된 단편 카운트의 모아진 매트릭스를 DESeq2 R 팩키지에 의한 DMR의 확인에 사용하였다. 모든 cfDNA 샘플에 걸쳐 10 미만의 카운트를 가진 영역을 제거하여 사전여과를 수행하였다. 조건(HNSCC 대 건강한 기증자)으로서 정의된 단일 요인을 차등 메틸화 분석 동안 대조에 사용하였다. 간단히 말해서, 크기 요인 및 분산 추정치를 기반으로 샘플을 크기 조정한 후 음이항 일반 선형 모델을 피팅하여 차등 메틸화 분석을 수행하였다. 각각의 윈도우에 대해, 왈드(Wald) 검정으로 HNSCC 조건과 건강한 기증자 조건 사이의 P-값을 계산하였다. 디폴트 쿡(Cook) 거리 컷오프보다 더 높은 영역 내의 P-값은 조절된 P-값 계산(Benjamini-Hochberg)으로부터 배제되었다. HNSCC cfDNA 샘플에서 유의미한 과다메틸화된 또는 과소메틸화된 영역(과다/과소-DMR)은 0.1 미만의 조절된 P-값을 가진 윈도우로서 정의된다.
HNSCC cfDNA 과다메틸화된 영역 내의 CpG 특징의 농후화
CpG 특징, 예컨대, 아일랜드, 쇼어, 쉘프 및 오픈 시(open sea)(interCGI)를 AnnotationHub R 팩키지(참고문헌)(hg19_cpgs 주석)에 따라 정의한다. "annotatr" 및 "GenomicRanges" R 팩키지를 사용하는 사내 R 팩키지를 사용하여, PBL 고갈 영역 내의 각각의 과다메틸화된 윈도우(즉, "chr.start.end")의 ID 좌표를 중첩 CpG 특징으로 표지하였다(도 13).
특징의 관찰된 중첩 대 널(null) 분포에 대한 농후화 확률을 측정하기 위해, 1000회의 무작위 샘플링을 수행하였다. 각각의 샘플링에 대해, CpG의 동일한 분포를 유지하면서 과다메틸화된 윈도우의 수를 기준으로 동일한 수의 구간을 선택하였다. 샘플링 전체에 걸쳐 각각의 CpG 특징에 대한 관찰된 중첩 수를 사용하여 그들 각각의 널 분포를 생성한 후, z-점수 스케일로 변환하였다. 각각의 CpG 특징에 대한 관찰된 과다메틸화된 영역의 중첩도 z-점수 변환하여, 널 분포로부터 요약 통계자료를 도출하였다. 과다메틸화된 윈도우로부터 관찰된 중첩의 추정된 P-값을, 널 분포의 관찰된 중첩과 동일하거나 더 큰/더 적은 중첩을 가진 무작위 샘플링의 수로서 계산하였다.
종양 암 게놈 아틀라스(TCGA)로부터 암 특이적 과다메틸화된 사이토신을 가진 HNSCC cfDNA 과다메틸화된 영역의 농후화
유방(BRCA), 대장(COAD), 두경부(HNSC), 전립선(PRAD), 췌장(PAAD), 폐 선(LUAD) 및 폐 편평(LUSC)으로부터의 모든 원발성 종양의 공개적으로 이용 가능한 hm450k 프로파일로부터의 파일 정보를 TCGA로부터 다운로딩하였다. 본 발명자들의 HNSCC 코호트의 대다수가 구강 종양을 보이기 때문에, HNSC 군으로부터의 파일은 "입바닥"에서 원발성 부위를 가진 환자(n = 55)로 제한되었다. 동등한 수의 hm450k 파일을, 건강한 PBL의 별도 데이터베이스(GEO 시리즈 GSE67393)뿐만 아니라 나머지 암 유형 각각으로부터 무작위로 선택하였다. 다운로딩된 파일의 목록은 도 14에 제공된다.
"종양 특이적" 과다메틸화된 사이토신을 생성하기 위해, PBL(즉, 대조)뿐만 아니라 서로 다른 암 유형에 대해서도 개별적으로 비교하면서 각각의 암 유형에 대해 림마(limma)에 의한 차등 메틸화 분석을 수행하였다. 주어진 대조에 대해, 잔존 분산 및 샘플 베타-값을 혼입하여 각각의 프로빙된 사이토신에 대해 선형 모델을 피팅한 후, 대조 사이의 관찰된 차이의 P-값을 경험적 베이즈 스무딩(empirical Bayes smoothing)으로 계산한다. 개별 비교에 비해 주어진 암 유형에서 상승된 메틸화를 가진 과다메틸화된 사이토신은 0.25 이상의 로그 배수변화 및 0.01 미만의 조절된 P-값(Benjamini-Hochberg)에 의해 정의되었다. 개별 암 유형에 고유한 과다메틸화된 사이토신은 "종양 특이적"으로서 표기되었다. LUSC, LUAD 및 PAAD의 경우, 종양 특이적 과다메틸화된 사이토신이 없거나 매우 적은 것으로 확인되었으므로(0, 15, 18) 후속 분석으로부터 배제되었다. cfMeDIP-seq 라이브러리와 비교하기 위해, "인-실리코 PBL 고갈의 디자인 및 성능의 평가"에 기재된 바와 같이 종양 특이적 과다메틸화된 사이토신의 염기쌍 위치는 인-실리코 PBL 고갈 후 정보제공 윈도우와 중첩되었다.
"HNSCC cfDNA 과다메틸화된 영역 내의 CpG 특징의 농후화"에 기재된 방법과 동일한 방법을 이용하여, HNSCC cfDNA 과다메틸화된 영역과 TCGA로부터의 종양 특이적 영역에 대한 중첩의 농후화를 10,000회의 무작위 샘플링으로 평가하였다.
cfMeDIP-seq에 의한 ctDNA 검출의 민감도 및 특이성
본 발명자들의 32개의 HNSCC 및 20개의 건강한 기증자 cfDNA 샘플의 코호트로부터의 cfMeDIP-seq 라이브러리의 경우, 개별 HNSCC cfDNA 샘플 내의 HNSCC cfDNA 과다메틸화된 영역 전체에 대한 평균 RPKM 값이 건강한 기증자 cfDNA 샘플 전체에 대한 최대 평균 RPKM 값보다 더 크다는 관찰결과를 기반으로 ctDNA 검출을 정의하였다. 이 정의에 기반한 ctDNA 검출의 민감도와 특이성을 수신자 작동 특성(Receiver Operating Characteristic; ROC) 곡선 분석으로 평가하였다. 환자들 중 일부에서 ctDNA 방출의 잠재적 결여로 인한 임의의 혼란스러운 결과를 최소화하기 위해, CAPP-seq에 의해 검출 가능한 ctDNA를 가진 32개의 HNSCC cfDNA 샘플 중 20개의 샘플에서만 ROC 곡선 분석도 수행하였다. DMR 분석에 의한 ctDNA 검출의 정확도를 평가하기 위한 교차검증을 수행하였다. 요약하건대, 두 세트 사이에 유사한 ctDNA 존재량(CAPP-Seq에 의해 측정됨)을 유지하면서 CAPP-Seq 양성 환자와 건강한 기증자를 훈련 세트(60%, n = 24)와 검증 세트(40%, n = 16)로 무작위 배정하였다. 과다-DMR을 훈련 세트 내의 HNSCC 샘플과 건강한 기증자 샘플 사이의 차등 메틸화 분석으로 확인하였다. 이 과다-DMR 내에서의 ctDNA 검출의 민감도를 검증 세트 내에서 전술된 바와 같이(도 2C) 평가하여 AUROC 값을 수득하였다. 총 50회의 무작위 샘플링을 수행하였다.
CAPP-seq 및 cfMeDIP-seq에 의해 검출된 ctDNA의 단편 길이 분석
각각의 HNSCC cfDNA CAPP-seq 라이브러리에 대해, 특정된 SNV(즉, 싱글톤, SCS, DCS)의 모든 지지 페어링된 리드 및 기준 대립유전자를 함유하는 페어링된 리드로부터 중간 단편 길이를 측정하였다. 1 초과의 SNV를 가진 환자에 대해 중간 단편 길이가 보고된 경우, 각각의 SNV로부터의 중간 단편 길이에 걸쳐 중앙값을 계산하였다. 각각의 HNSCC cfDNA cfMeDIP-seq 라이브러리에 대해, 이전에 확인된 HNSCC cfDNA 과다메틸화된 영역에 맵핑되는 모든 단편으로부터 중간 단편 길이를 계산하였다. 본 발명자들의 20명의 건강한 기증자의 코호트 내에서 상대적으로 메틸화가 없기 때문에, 각각의 건강한 기증자 cfMeDIP-seq 라이브러리의 단편 길이를 임의의 계산 전에 모았다. 두 유형의 라이브러리에서, 단편 길이 분석은 첫 번째 피크(즉, 220 염기쌍 미만) 내의 cfDNA로 제한되었다.
과다-DMR 내의 단편(100 내지 150 bp 또는 100 내지 220 bp)의 농후화를 다음과 같이 계산하였다. 총 30회의 샘플링으로부터, 동일한 수 및 CpG 밀도 분포에서 본 발명자들의 앞서 디자인된 PBL 고갈 윈도우 내의 무작위 300 bp 구간으로부터 예상 카운트의 널 분포를 생성하였다. 과다-DMR 전체에 대한 리드 카운트를 기반으로 각각의 샘플에 대한 관찰 카운트를 결정하였다. 각각의 샘플에 대해, 평균 관찰 카운트를 평균 예상 카운트로 나눈 값을 기반으로 농후화를 계산하였다.
지도 계층 클러스터링
클러스터링 전, log2 변환을 가능하게 하기 위해 0.1의 슈도카운트를 cfMeDIP-seq 라이브러리의 모든 RPKM 값에 더하였다. 값을 유클리드 변환으로 크기 조정하고 와드(Ward)의 방법으로 클러스터링하였다. 3개의 상이한 클러스터 중 임의의 수를 선택하고(k = 3) 메틸화 클러스터 1 내지 3으로서 표기하고 후속 분석에 사용하였다.
HNSCC 환자 임상 결과에 대한 ctDNA 검출 및 정량의 메트릭
ctDNA 검출의 잠재적 임상 유용성을 3개의 메트릭으로 평가하였다: 1) CAPP-seq에 의한 SNV 검출, 2) cfMeDIP-seq에 의한 과다메틸화된 영역에서의 증가된 평균 RPKM의 검출. 비교 분석을 위해, 하기 기준을 기반으로 환자를 계층화하였다: 1) SNV의 존재 또는 부재, 2) 메틸화 클러스터 1 대 메틸화 클러스터 2 + 3. 환자 특성은 표 1에 기재되어 있다.
Figure pct00036
Figure pct00037
cfMeDIP-seq 분석에 의한 ctDNA 유래 메틸화의 교차검증
ctDNA 유래 메틸화를 확인하는 데 있어서 cfMeDIP-seq의 견고성을 평가하기 위해, 수신자 작동 특성(ROC) 곡선 분석을 수행하였다. 낮은/부재하는 ctDNA로 인한 혼란스러운 결과를 최소화하기 위해, 분석을 CAPP-seq에 의해 검출 가능한 ctDNA를 가진 HNSCC 환자로 제한하였다. 환자 및 건강한 대조군 cfMeDIP-seq 프로파일을 훈련 세트(HNSCC: n = 12/20; 건강한 대조군: n = 12/20)와 검정 세트(HNSCC: n = 8/20; 건강한 대조군: n = 8/20)로 분할하였다. 훈련 세트 및 검정 세트는 CAPP-Seq 분석에 의해 측정된 ctDNA 존재량에 대해 균형을 이루었다. 반복할 때마다 수행된 ROC 곡선 분석으로 총 50회의 분할을 수행하였다.
TCGA 분석에 의한 HNSCC에서의 예후 영역의 확인
일치된 레거시(legacy) hm450k 및 RNA 발현 데이터를 이용하여 TCGA로부터 모든 이용 가능한 HNSCC 사례를 선택하였다(n = 520). 생존 데이터를 문헌[Jianfang et al]으로부터 수득하였다. hm450k 데이터와 관련하여, 특정 영역 내에서 프로브 ID 사이의 평균 베타-값을 계산함으로써 앞서 기재된 바와 같이 메틸화를 300 bp 영역으로 요약하였다. 인접 정상 조직에 비해 HNSCC 원발성 종양에서 과다메틸화된 영역을 확인하기 위해, 각각의 영역에 대해 독립적인 윌콕손 검정을 수행하였다. 인접 정상 조직에 비해 원발성 종양에서 0.05 미만의 조절된 p-값(Holms 방법) 및 1 이상의 로그 배수 변화를 가진 영역을, 후속 분석을 위해 선택하였다. 예후와 관련된 과다메틸화된 영역을 확인하기 위해, 연령, 성별 및 임상 병기를 고려하고 0.05 미만의 p-값을 가진 영역을 선택함으로써 다변량 Cox 회귀를 수행하였다. HNSCC cfDNA 코호트 내에서 관찰된 것을 반영하여, 생존 분석을 진단 후 5년의 최대 추적검사 기간으로 제한하였다. 유전자 발현의 변화와 관련된 예후 영역을 추가로 확인하기 위해, 각각의 영역에 대한 hm450k 원발성 종양 프로파일과, 2 Kb 윈도우 내의 전사체에 대한 일치된 RNA 발현 프로파일 사이의 스피어만 상관관계를 계산하였다. 0.3 초과의 절대 Rho 값 및 0.05 미만의 거짓 발견률을 가진 영역을 선택하여, ZNF323/ZSCAN31, LINC01395, GATA2-AS1, OSR1 및 STK3/MST2 발현과 관련된 5개의 예후 영역을 최종 확인하였다. TCGA 환자 프로파일의 경우, 모든 5개의 예후 영역 전체에 걸쳐 베타-값의 합계를 계산함으로써 복합 메틸화 점수(CMS)를 수득하였다. cfMeDIP-seq 프로파일의 경우, 모든 943개의 과다-DMR 전체에 걸쳐 RPKM 값을 총 합계 1로 크기 조정하였고, 모든 5개의 예후 영역 전체에 걸쳐 이 크기 조정된 RPKM 값의 합계를 계산함으로써 CMS를 수득하였다.
cfMeDIP-seq에 의한 치료 후 혈장 샘플의 종적 모니터링
32명의 환자들 중 30명의 환자들에 대한 cfMeDIP-seq 라이브러리를 성공적으로 생성하였다(도 17A 내지 17D). 나머지 2명의 환자의 경우, 불충분한 물질이 혈장으로부터 단리되었고/되었거나 품질 메트릭을 통과하지 못하였다. 확인된 과다메틸화된 영역 전체에 걸쳐 평균 RPKM 값을 차등 메틸화 분석으로 계산함으로써, 치료 후 cfMeDIP-seq 라이브러리의 ctDNA 정량을 전술된 바와 같이 수행하였다. 용이한 해석을 위해, 일치된 CAPP-Seq 프로파일에 의해 계산된 평균 MAF에 대한 선형 회귀를 기반으로 치료 전 및 치료 후 cfMeDIP-seq 라이브러리를 퍼센트 DNA 값으로 전환하였다. 잔존 질환의 높은 신뢰도 검출을 달성하기 위해, 치료 후 샘플에서 모든 건강한 대조군들 전체에 걸쳐 관찰된 평균 RPKM 값의 최대치에 상응하는 0.2%의 최소 ctDNA 분율이 요구되었다.
결과 & 논의
국소화된 HNSCC에서 무세포 DNA의 다중모드 프로파일링
국소화된 암의 환경에서 ctDNA를 특징규명하는 다중모드 프로파일링의 능력을 조사하기 위해, 본 발명자들은 말초 혈액 샘플을 일련의 시점에서 채취하는 전향적 관찰 연구에서 32명의 HNSCC 환자를 모집하였다(도 9A; 표 1). 모든 환자들은 수술로 치료를 받았고, 이들 중 일부는 보조 방사선요법(n=14) 또는 화학방사선요법(n=11)을 받았다. 평균 43.2개월의 추적검사 시, 32명의 환자들 중 9명의 환자들(28%)이 재발을 발생시켰다(보험통계 2년 무재발 생존율: 88%).
대다수의 환자들이 체세포 조직의 게놈/후성적 환경을 변경하고 악성 전단계 병변에 기여하는 것으로 잘 설명되어 있는 과도한 흡연 이력을 나타내었기 때문에, 본 발명자들은 폐암 스크리닝 프로그램에 이미 등록된 20명의 위험 일치된 건강한 기증자의 혈액 샘플도 분석하였다34-37. 혈장의 무세포 DNA뿐만 아니라 PBL의 게놈 DNA(gDNA)도 혈액으로부터 함께 단리하여 정량하고 분석하였다(보충 도 1A). 건강한 대조군에 비해 전이성 질환에서 총 혈장 무세포 DNA의 유의미하게 상승된 수준을 입증한 다른 연구38-41와 대조적으로, 본 발명자들의 HNSCC 코호트와 건강한 기증자 사이에는 유의미한 차이가 관찰되지 않았다(보충 도 1B).
환자 및 건강한 대조군의 무세포 DNA 및 PBL gDNA의 다중모드 프로파일링을 수행하였다(도 1). 본 발명자들은 동일한 샘플에 대해 돌연변이 및 메틸롬 프로파일링 둘 다를 수행함으로써, 이들이 ctDNA의 종양 나이브 검출 및 특징규명에 기여하는 정도를 평가할 수 있었다. 딥 시퀀싱에 의한 암 맞춤형 프로파일링(CAPP-Seq) 및 무세포 메틸화된 DNA 면역침전과 고처리량 시퀀싱(cfMeDIP-seq)을 이용하여 각각 돌연변이 및 메틸화를 독립적으로 프로파일링하였다. 또한, 시퀀싱된 무세포 DNA 단편의 길이를 수득하기 위해 페어링된 말단 시퀀싱을 두 가지 방법에 사용하였다.
치료 전 혈장으로부터 돌연변이 기반 ctDNA의 종양 나이브 검출
본 발명자들은 먼저 일치된 종양 샘플 내에서 확인 없이 본 발명자들의 돌연변이 기반 ctDNA 검출의 신뢰도를 개선하는 방식을 평가하였다. 최근 연구는 ctDNA 검출을 위해 자주 표적화되는 유전자, 예컨대, TP53이 클론 확장된 PBL로부터 유래한 돌연변이를 보유할 수 있음을 예증하였다. 추가로, ctDNA는 종양의 유전적 특징 및 후성적 특징 둘 다를 함유하기 때문에, 본 발명자들은 환자 무세포 DNA에서 상기 두 가지 특징의 오르토고날 분석이 ctDNA 검출의 증가된 신뢰도를 제공할 수 있다고 추론하였다. 따라서, 높은 신뢰도로 낮은 존재량 ctDNA의 종양 나이브 검출을 달성하기 위해, cfDNA 및 일치된 PBL 둘 다에 대해 돌연변이 및 메틸화를 각각 CAPP-Seq 및 cfMeDIP-seq로 독립적으로 프로파일링하였다.
종양으로부터의 사전지식 없이 HPV 음성 HNSCC에서 ctDNA 검출의 민감도를 평가하기 위해, 본 발명자들은 먼저 기준점 혈장 샘플에서 돌연변이의 존재량을 측정하였다(도 2A). HNSCC 관련 돌연변이의 수를 최대화하도록 디자인된 시퀀싱 패널로 CAPP-Seq를 수행하였다(표 3 및 도 10). 본 발명자들은 또한 확립된 오류 억제 방법을 이용하여 배경 염기 치환 오류를 제거하였다.
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
10 내지 30 ng의 입력 DNA를 사용하여 진단 시 HNSCC 환자 및 건강한 기증자의 혈장 및 PBL 샘플을 CAPP-Seq로 프로파일링하였다. 낮은 존재량에서 ctDNA의 민감한 검출을 달성하기 위해, 본 발명자들은 HNSCC에서 검출된 돌연변이의 수를 최대화하도록 최적화된 CAPP-Seq 선택제를 적용하였다(표 2 및 도 10). 본 발명자들은 주문제작 분자 바코드를 혼입하고 건강한 기증자 혈장 샘플 내에서 확인된 배경 염기 치환 오류를 제거하는 통합 디지털 오류 억제(iDES)를 통해 본 발명자들의 분석 민감도를 더 개선하였다(방법).
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
혈장 프로파일링 및 가능성 있는 생식세포계열 돌연변이의 제거를 기반으로 후보 체세포 단일 뉴클레오타이드 변이체(SNV)를 선택한 후, 본 발명자들은 일치된 PBL 프로파일과 비교함으로써 클론 조혈(CH)로 인한 잠재적 거짓 양성을 특징규명하였다. 확인 가능한 후보 SNV를 가진 24명의 환자들 중 10명의 환자들은 높은 상관관계가 있는 돌연변이체 대립유전자 분율(MAF)을 가진 그들의 일치된 PBL 프로파일 내에서 동일한 SNV를 나타내었다(R = 0.94, p = 1.392e-07, 도 2B). PIK3CA를 제외하고, 이 SNV를 가진 유전자는 환자마다 고유하였다(도 2C). 일반적으로 CH에 의해 영향을 받는 유전자, 예컨대, DNMT3A, TET2 및 ASXL1이 CAPP-Seq 선택제에 포함되지 않았기 때문에, 본 발명자들이 일치된 cfDNA 및 PBL 샘플 내에서의 환자 고유의 SNV를 발견하였다는 것은 유전자 수준 여과에 비해 이 방식의 이익을 더 강조한다. 4명의 환자의 혈장 샘플은 CH로부터 유래한 SNV에 대해 엄격히 양성이었는데(도 2D), 이는 일치된 PBL 프로파일링이 낮은 존재량에서 ctDNA의 거짓 양성 검출을 크게 최소화할 수 있음을 암시한다.
잠재적으로 CH를 반영하는 후보 SNV를 제거한 후, 20명의 환자의 혈장 내에서 ctDNA를 검출하였다(중앙값[범위]: 환자당 3[1 내지 10]개의 SNV). 이 SNV의 타당성을 평가하기 위해, 본 발명자들은 본 발명자들의 결과를, 암 게놈 아틀라스(TCGA)45에 의해 공개된 279개의 HNSCC 종양으로부터의 전체 엑솜 시퀀싱 데이터와 비교하여, TP53(65% 대 72%), PIK3CA(20% 대 21%), FAT1(15% 대 23%) 및 NOTCH1(10% 대 19%)을 비롯한 자주 돌연변이되는 유전자에서 유사성을 관찰하였다(도 2E). 흥미롭게도, 2명의 환자들은 이 유전자들 내에서 발견되지 않는 단일 SNV를 나타냄으로써(GRIN3AMYC, 도 11), ctDNA의 검출 민감도를 증가시키는 데 있어서 알려지지 않은/비-유발제 효과를 가진 프로파일링 유전자의 추가된 유용성을 입증한다.
SNV의 평균 MAF를 기반으로 ctDNA 존재량을 계산하였을 때, ctDNA 수준은 0.14% 내지 4.83%이었다(도 2F). 이 검출 하한은 약 0.14%로 추정되는, 종양 나이브 CAPP-Seq 분석을 이용하는 다른 연구진에 의해 이전에 기재된 검출 한계와 유사하다. 검출될 수 없는 ctDNA를 가진 환자를 포함시켰을 때, 본 발명자들의 HNSCC 코호트 전체에 대한 중간 ctDNA 존재량은 CAPP-Seq에 의해 국소화된 NSCLC에서 관찰된 존재량과 유사한 0.49%이었다.
기준점 혈장으로부터 메틸화 기반 ctDNA의 종양 나이브 검출
다음으로, 본 발명자들은 HNSCC 및 건강한 대조군 샘플에서 ctDNA 관련 메틸화 패턴을 정의하고자 하였다. CAPP-Seq 결과가 PBL로부터 발생된 거짓 양성 돌연변이의 영향을 예증하였기 때문에, 본 발명자들은 거짓 양성 ctDNA 관련 메틸화의 감소가 PBL 유래 DNA 메틸화 신호의 제거에 의해 달성될 수 있다고 추론하였다. 따라서, 본 발명자들은 HNSCC 및 건강한 대조군 샘플로부터의 일치된 PBL MeDIP-seq 프로파일을 사용하여, 무세포 DNA 메틸화 신호에의 이들의 기여를 억제하였고(도 3A), 본 발명자들은 일치된 PBL 분석이 메틸화 기반 ctDNA 검출도 가능하게 하는지를 평가하였다(도 3A). 5 내지 10 ng의 입력 DNA를 사용하여, 치료 전 HNSCC 및 건강한 기증자 혈장뿐만 아니라 PBL도 cfMeDIP-seq로 프로파일링하였다. 앞서 기재된 바와 같이, 백만당 킬로염기당 리드(RPKM)로 정규화된 리드 카운트를 사용하여 1번 염색체부터 22번 염색체까지 비-중첩 300 bp 윈도우(n = 9,603,454개의 윈도우) 내에서 메틸화 존재량을 정의하였다(방법).
메틸화 풀다운에 사용되는 항-5mC 항체가 CpG 아일랜드를 포함하는, CpG 밀도가 증가된 DNA 단편에 우선적으로 결합하기 때문에, 본 발명자들은 먼저 이 상호작용을 특징규명하여 cfMeDIP-seq 데이터 내에서 높게 표시될 가능성이 높은 영역을 확인하였다. 본 발명자들은 또한 MeDIP-seq를 HNSCC 세포주 FaDu에 적용하여 암 유래 메틸화된 DNA 단편의 우선적 결합을 평가하였다. 본 발명자들은 다양한 수의 CpG를 가진 윈도우 전체에 걸쳐 DNA 단편 풀다운 존재량(중간 RPKM)을 비교함으로써, PBL 및 FaDu 둘 다에 대해 8개 이상의 CpG까지 증가하는 농후화를 관찰하였다(도 12A 및 12B). FaDu는 300 bp 윈도우당 8개 이상의 CpG에서 PBL에 비해 더 큰 농후화를 나타내었다. 이 결과는 FaDu를 비롯한 암세포에서 CpG 아일랜드 과다메틸화라는 확립된 현상과 일치한다. 이러한 관찰을 기반으로, 본 발명자들은 8개 이상의 CpG를 가진 윈도우(n = 702,488)가 ctDNA 검출을 위한 많은 정보를 제공할 수 있으므로 모든 후속 분석에 사용하기로 결정하였다.
국소화된 암을 가진 환자의 경우, 혈장 무세포 DNA의 대부분이 PBL로부터 유래한다. 따라서, 본 발명자들은 PBL MeDIP-seq 프로파일을 활용하여 무세포 DNA 신호에의 이 기여를 생물정보학적으로 억제하고자 하였다. 본 발명자들은 HNSCC 및 건강한 기증자 cfDNA로부터 생성된 cfMeDIP-seq 프로파일 내의 각각의 윈도우에 대한 RPKM 값을, FaDu(1-대-1 비교), 페어링되지 않은 PBL(1-대-51 비교) 또는 페어링된 PBL(1-대-1 비교)로부터 생성된 MeDIP-seq 프로파일과 비교하였다. PBL이 혈장 무세포 DNA의 주요 기여자라는 것과 일치하여, 게놈 전체 메틸화 프로파일은 혈장 무세포 DNA와 페어링된 PBL 또는 페어링되지 않은 PBL 사이에 높은 상관관계를 가졌다(각각 모달 R=0.92 및 R=0.91). 이 상관관계의 강도는 PBL이 혈장 cfDNA에 지나치게 크게 기여한다는 알려진 사실을 반영할 가능성이 높다. 대조적으로, 혈장 무세포 DNA와 FaDu 사이의 상관관계는 더 약하였다(모달 R=0.78)(도 3B).
우선적 풀다운을 고려하면서 PBL 전체에 걸쳐 감소된 메틸화의 역치를 선택하기 위해, 본 발명자들은 MeDEStrand R 팩키지를 통해 로지스틱 회귀 모델링을 기반으로 PBL cfMeDIP-seq 프로파일을 크기 조정하고 절대 메틸화 수준(0 내지 1)으로 정규화하였다(방법). 본 발명자들은 건강한 기증자 PBL 전체에 걸쳐 0.1 미만의 중간 절대 메틸화 값을 나타내는 99,997개의 윈도우들을 선택하였다. 이 윈도우들을 제외된 HNSCC PBL에 적용하였을 때, 본 발명자들은 사용된 건강한 기증자 PBL의 절대 메틸화 분포와 유사한 절대 메틸화 분포를 관찰함으로써(도 3B), 이 방식의 일반화 가능성을 입증하였다. 마찬가지로, 이 윈도우들 중 어느 것도 건강한 기증자 PBL에 비해 HNSCC PBL 전체에서 유의미하게 더 높은 메틸화를 개별적으로 보이지 않았는데(도 3C 및 도 12B), 이는 ctDNA 검출을 혼동시킬 수 있는 HNSCC 특이적 PBL 메틸화의 임의의 공급원을 제한한다. 다시 말해, 이 결과는 대조군 및 국소국부적으로 한정된 HPV 음성 HNSCC 혈장 둘 다에서 cfDNA 메틸화의 주요 공급원이 PBL로부터 유래하고 PBL 유래 메틸화의 생물정보학적 제거가 ctDNA 정량을 혼동시키는 신호를 제한할 수 있음을 확인시켜준다.
치료 전 메틸화 기반 ctDNA의 종양 나이브 검출
본 발명자들의 HNSCC 코호트 내에서 공통된 ctDNA 유래 과다메틸화된 영역을 확인하기 위해, 본 발명자들은 CAPP-Seq에 의해 검출 가능한 ctDNA를 가진 HNSCC 환자(n = 20)를 건강한 기증자와 비교하는 차등 메틸화 분석을 수행하였다. 본 발명자들은 PBL에서 메틸화에 대해 고갈된 99,994개의 300 bp 윈도우를 사용하여, CAPP-Seq에 의해 검출 가능한 ctDNA를 가진 20명의 HNSCC 환자를 20명의 건강한 대조군과 비교함으로써 ctDNA로부터 유래한 차등적으로 메틸화된 영역(DMR)을 확인하였다. 전체적으로, 본 발명자들은 HNSCC 샘플 전체에 걸쳐 997개의 차등적으로 메틸화된 영역(DMR)(과다메틸화: 941, 과소메틸화: 56)을 확인하였다(도 3C). 과다메틸화된 영역(과다-DMR)의 대략 절반은 서로 바로 인접한 것으로 밝혀졌으며, 여기서 과다메틸화의 블록은 길이가 1800개 염기쌍까지 확장되었다(도 13A). 이 데이터는 확인된 과다-DMR 내에 CpG 아일랜드가 존재함을 암시한다. 대조적으로, 인접 과소메틸화된 영역(과소-DMR)은 관찰되지 않았다. 300 bp 과다-DMR들 중 47.5%는 길이가 1800 bp까지 확장되는 과다메틸화 신호의 연속 블록에 존재하였는데(도 13A), 이는 전형적으로 길이가 300 내지 3000 bp에 이르는 CpG 아일랜드를 시사한다. 실제로, CpG 아일랜드는 과다-DMR에 대해 유의미하게 농후화되었다(도 3E). 대조적으로, CpG 아일랜드는 과소-DMR에 대해 유의미하게 고갈되었다(도 13B).
그 다음, 실제로 이 과다-DMR이 CpG 아일랜드에 대해 농후화되었는지를 확인하기 위해, 본 발명자들은 순열 분석을 통해 CpG 아일랜드, 쇼어, 쉘프 및 오픈 시에 대해 과다-DMR의 농후화를 평가하였다(방법). 예상대로, CpG 아일랜드의 유의미한 농후화뿐만 아니라 쇼어와 오픈 시의 유의미한 고갈도 과다-DMR 내에서 관찰되었다(도 3E). 대조적으로, 과소-DMR은 암에서 자주 관찰되는 CpG-희소 영역의 과소메틸화와 부합되게, 오픈 시에 대해 유의미하게 농후화되고 CpG 아일랜드에 대해 고갈되었다(보충 도 5B).
마지막으로, cfMeDIP-seq를 이용하여 전술된 바와 같이 특정 영역의 메틸화가 기원 조직을 구별할 수 있기 때문에, 본 발명자들은 과다-DMR이 HNSCC 또는 다른 암에 특이적인 영역을 함유하는지도 조사하였다. 종양 특이적 메틸화된 영역을 확인하기 위해, TCGA에 의해 제공된 원발성 종양으로부터 생성된 인간 메틸화 450K(hm450k) 데이터를 이용하였다(방법). 본 발명자들은 유방 침습성 암종(BRCA), 결장 선암종(COAD), 폐 편평 세포 암종(LUSC), 전립선 선암종(PRAD), HNSCC, 췌장 선암종(PAAD) 및 PBL로부터의 원발성 종양을 비교함으로써, BRCA, COAD, PRAD 및 HNSCC에 특이적인 충분한 과다메틸화된 CpG(50개 이상)를 확인하였다(방법)(도 14). 예상된 바와 같이, 본 발명자들은 HNSC 특이적 과다메틸화된 CpG와 중첩되는 혈장 유래 DMR의 유의미한 농후화뿐만 아니라, BRCA, COAD 및 PRAD 특이적 과다메틸화된 CpG 전체에 걸쳐 중첩의 유의미한 고갈도 관찰하였는데(도 3F), 이는 과다-DMR이 다양한 다른 암 유형과 비교될 때 HNSCC 기원에 특이적인 영역을 함유함을 암시한다.
돌연변이 기반 및 메틸화 기반 ctDNA 검출은 매우 일치한다.
점점 더 많은 연구는 ctDNA가 건강한 혈장 무세포 DNA 공급원에 비해 감소된 단편 길이와 관련되어 있는 것으로 기술함으로써, 강력한 종양 나이브 검출을 위한 추가 메트릭을 제공한다. 표적화 시퀀싱이 감소된 단편 길이에서 ctDNA를 검출하는 것으로 이미 밝혀졌기 때문에, 본 발명자들은 먼저 본 발명자들의 CAPP-Seq 프로파일을 사용하여, 본 발명자들이 HNSCC 환자 내에서 유사한 경향을 관찰할 수 있는지를 확인하였다. 환자당 확인된 각각의 SNV(도 2E)에 대해, 본 발명자들은 SNV 대립유전자뿐만 아니라 중첩 기준 대립유전자도 함유하는 단편의 중간 길이를 측정하였다. 다수의 SNV가 환자 샘플 내에서 확인된 경우, 모든 SNV 및 이들의 기준 대립유전자 전체에 대한 중앙값을 사용하였다. 이전 발견과 일치하게, 본 발명자들은 환자 전체에서 건강한 무세포 DNA에 비해 ctDNA 단편 크기의 일관된 감소를 관찰하였다(중앙값[범위] Δ = -17.5[1 내지 58] bp)(도 4A). 이 돌연변이의 평균 MAF와 단편 길이 사이에는 유의미한 연관성이 없었다(도 15A).
중아황산염 기반 DNA 메틸화 방식과 달리, cfMeDIP-seq는 DNA 분해를 야기하지 않으므로 원래 단편 크기 분포를 보존한다. 이것은 DNA 메틸화와 단편 길이를 동시에 맵핑할 새로운 기회를 제공한다. 각각의 환자에 대해 앞서 확인된 혈장 유래 과다-DMR 내에서의 단편 길이의 분포를 평가하였다. 본 발명자들의 건강한 기증자 전체에 걸쳐 낮은 메틸화를 가진 이 영역의 성질로 인해, 비교를 위해 기증자 전체에 걸쳐 DNA 단편을 조합하였다. 돌연변이 기반 분석과 유사하게, 본 발명자들은 분류된 건강한 대조군에 비해 20명의 CAPP-Seq 양성 환자들 중 19명의 환자들로부터 단편 길이의 감소를 관찰하였다(중앙값[범위] Δ = -7[1 내지 21] bp)(도 4B). 이것은 아마도 과다-DMR 내의 무세포 DNA 단편의 건강한 조직에 의한 부분적인 기여로 인해 돌연변이 기반 분석에 비해 단편 길이의 더 작은 감소를 나타내었다. 이 개념을 뒷받침하는 것으로, 가장 짧은 과다-DMR 단편을 가진 샘플은 더 높은 메틸화된 ctDNA 존재량을 표시하였다(피어슨 r = -0.64, p = 0.002)(도 15B). ctDNA에 대해 농후화하기 위해 작은(100 내지 150 bp) 단편 대 큰(151 내지 220 bp) 단편의 비를 앞서 설명된 방식으로 본 발명자들의 과다-DMR에 사용하였을 때, 본 발명자들은 CAPP-Seq 양성 HNSCC 샘플의 대다수에서 유사한 ctDNA 농후화 경향을 관찰하였다(중앙값[범위] = 28[-8 내지 63]%)(도 4C).
본 발명자들의 HNSCC 코호트에서 확인된 혈장 무세포 DNA 과다-DMR이 이 작은 단편(100 내지 150 bp) 내에서 개체에 따라 어떻게 다를 수 있는지를 평가하기 위해, 본 발명자들은 먼저 계층 클러스터링을 수행하였다. 컨센서스클러스터플러스(ConsensusClusterPlus) R 팩키지를 사용할 때 4개의 우세한 클러스터가 나타났으며, 이들 각각은 과다-DMR 전체에 걸쳐 상이한 수준의 메틸화를 가졌다(도 4E 및 도 16C). 마찬가지로, 3개의 클러스터는 CAPP-Seq에 의해 측정된 상이한 ctDNA 존재량에 의해 정의되었고(도 16D), 이는 평균 과다-DMR 메틸화와 돌연변이 기반 ctDNA 존재량 사이의 잠재적 관계를 암시한다.
그 다음, 본 발명자들은 CAPP-Seq 및 cfMeDIP-seq 둘 다에 의해 확인된 ctDNA 분자들 사이에 단편 길이가 일치하는지를 조사하여, 본 발명자들의 다중모드 방식에 대한 추가 검증 단계를 잠재적으로 제공하였다. cfMeDIP-seq 프로파일 내에서 ctDNA의 계산된 단편 길이를 혼동시키는 배경 DNA 단편의 가능성을 최소화하기 위해, 본 발명자들은 과다-DMR 전체에 대한 중간 메틸화 수준보다 더 높은 메틸화 수준을 가진 환자(n = 10 HNSCC 환자)로 분석을 제한하였다. 놀랍게도, ctDNA 단편 길이는 각각의 환자에 대한 페어링된 CAPP-Seq 프로파일과 cfMeDIP-seq 프로파일 사이에 매우 일치하였지만(피어슨 r = 0.86, p = 0.0016)(도 4C), 이들 두 가지 프로파일링 방식에 의해 전체적으로 상이한 게놈 영역이 나타났다(CAPP-Seq: 43개의 상이한 돌연변이, cfMeDIP-seq: 941개의 과다-DMR).
과다-DMR 메틸화 수준과 돌연변이 기반 ctDNA 존재량 사이의 관계를 더 특징규명하기 위해, 본 발명자들은 941개의 과다-DMR 전체에 걸친 평균 RPKM 값을, 각각의 환자에 대해 CAPP-Seq에 의해 측정된 평균 MAF 값과 비교하였다. 본 발명자들이 메틸화 클러스터 사이에서 관찰한 경향과 유사하게, 본 발명자들은 유의미한 양의 상관관계를 관찰하였다(피어슨 상관관계, R = 0.85, p = 5e-10)(도 4F). 이 과다-DMR 내에서 cfMeDIP-seq에 의한 ctDNA 검출의 민감도를 평가하기 위해, 본 발명자들은 본 발명자들의 HNSCC 코호트와 건강한 기증자 사이에 평균 RPKM 값을 비교하였다. CAPP-Seq 양성 환자(n = 20)의 경우, ctDNA 검출은 CAPP-Seq 음성 환자(n = 12)(AUC = 0.944)의 포함 시 약간의 성능 감소를 가지면서 매우 일치하였다(AUC = 0.998)(도 4G). CAPP-Seq 양성 환자 및 건강한 기증자 전체에 걸친 교차검증(n = 50 샘플링)은 0.984의 중간 AUC 값을 제공함으로써(도 16A), 본원에 개시된 방식의 견고성을 입증한다.
이 관찰결과를 기반으로, 본 발명자들은 본 발명자들이 분석을 감소된 길이의 무세포 DNA 단편으로 제한함으로써 cfMeDIP-seq 프로파일 내에서 ctDNA를 농후화할 수 있는지를 평가하였다. 유사한 방법이 비-메틸화 기반 방식을 이용하여 ctDNA에 대해 농후화하는 것으로 기재되어 있기 때문에, 본 발명자들은 작은(100 내지 150 bp) 단편으로 구성된 과다-DMR 내의 무세포 DNA 단편의 비율을 평가하였다. 실제로, 이것은 대다수의 CAPP-Seq 양성 HNSCC 샘플 전체에서 ctDNA 농후화를 야기하였으나(중앙값[범위] = 28[-8 내지 63]%), 임의의 건강한 대조군에서는 그렇지 않았다(도 4D). 따라서, 무세포 DNA 단편의 인-실리코 크기 선택은 cfMeDIP-seq 라이브러리 내에서 ctDNA에 대해 농후화하고 종양 나이브 다중모드 ctDNA 분석에 기여할 수 있다.
국소화된 비-전이성 암을 가진 환자에서, 진단 시 CAPP-Seq에 의한 ctDNA의 검출은 좋지 않은 예후와 관련되어 있는 것으로 이미 기재되어 있다. 마찬가지로, SHOX2SEPT9의 메틸화에 의해 평가된 ctDNA 수준은 HNSCC의 좋지 않은 예후와 관련되어 있다. 따라서, 본 발명자들은 진단 시 CAPP-Seq 및 cfMeDIP-seq에 의한 ctDNA의 검출 또는 정량이 본 발명자들의 HNSCC 코호트 내에서의 임상 결과와 관련되어 있는지를 조사하였다. 실제로, CAPP-Seq에 의한 ctDNA의 검출(즉, CAPP-Seq 양성 대 CAPP-Seq 음성)(위험 비[HR]=7.6, 로그 순위 p=0.026; 보충 도 8D)뿐만 아니라 앞서 확인된 본 발명자들의 과다-DMR 내에서의 증가된 메틸화(즉, 메틸화 클러스터 1 + 2 + 3 대 메틸화 클러스터 4)(HR=4.51, p=0.038; 도 4G)도 더 짧은 생존 시간과 상관관계를 가졌다. 이 발견과 일치하게, 과다-DMR 전체에 대한 평균 RPKM은 암 병기와 상관관계를 가졌다(보충 도 8E).
다음으로, 본 발명자들은 돌연변이 또는 메틸화 기반 프로파일링에 의해 확인된 ctDNA의 중간 단편 길이를 비교하였다. cfMeDIP-seq 프로파일 내에서 ctDNA의 계산된 단편 길이를 혼동시키는 배경 DNA 단편의 가능성을 최소화하기 위해, 본 발명자들은 계층 클러스터링에 의해 정의될 때 높은 ctDNA 존재량을 가진 환자를 선택하였다(즉, 메틸화 클러스터 1 및 2, 도 4D, 보충 도 8A 및 8B). 이 방식을 이용할 때, ctDNA 단편 길이는 각각의 환자에 대한 페어링된 CAPP-Seq 프로파일과 cfMeDIP-seq 프로파일 사이에 매우 일치하였지만(R = 0.83, p = 0.0016)(도 4H), 이 두 가지 프로파일링 방식에 의해 전체적으로 상이한 게놈 영역이 나타났다. 또한, 모든 길이의 단편을 사용한 본 발명자들의 분석과 유사하게, 본 발명자들은 CAPP-Seq에 의한 작은 단편 비와 ctDNA 단편 길이 사이에 동일한 관계를 관찰하였다(R = -0.79, p = 0.0038)(도 4I).
이 결과는 CAPP-Seq 및 cfMeDIP-seq에 의해 검출된 ctDNA로부터 관찰된 단편 길이의 유사한 감소가 게놈 영역보다는 오히려 종양의 내재적 성질의 결과일 수 있으며 더 짧은 단편 길이의 이용이 ctDNA의 더 많은 특이적 확인에 기여할 수 있음을 암시한다.
예후를 위한 다중모드 ctDNA 검출의 적용
종양 나이브 다중모드 ctDNA 분석의 잠재적 임상 적용을 평가하기 위해, 본 발명자들은 HNSCC 코호트에서 ctDNA를 임상 결과와 비교하였다. 단편 길이 정보를 제공하는 cfMeDIP-seq 프로파일은 일치된 CAPP-Seq 프로파일에서 MAF와 강하게 연관되어 있었는데(피어슨 r = 0.85, p = 3 x 10-9), 이는 941개의 과다-DMR 내의 메틸화 강도가 실제로 ctDNA 존재량을 반영함을 암시한다(도 5C). 중요하게도, 교차검증 분석은 ctDNA를 검출하는 데 있어서 이 과다-DMR의 견고성을 확인시켜주었다(도 16C). 돌연변이 및 메틸화 기반 방법 둘 다에 의해 기준점 혈장에서 검출된 ctDNA를 가진 환자(n = 19)는 검출 가능한 ctDNA를 갖지 않은 환자(n = 8/13)와 비교될 때 진행된 질환(즉, 병기 III 내지 IVA)(n = 18/19)을 가질 가능성이 유의미하게 더 높았고(피셔의 정확 검정 p =0.028) 및 현저히 악화된 전체 생존율을 나타내었다(위험 비[HR] = 7.55, 95% 신뢰구간[CI] = [0.95 내지 59.94], 로그 순위 p = 0.025)(도 5G). 비교하건대, 병기만으로는 전체 생존율이 더 악화된 환자를 예측할 수 없었는데(HR = 2.59, 95% CI = [0.32 내지 20.46], 로그 순위 p = 0.35)(도 16D), 이는 다중모드 ctDNA 프로파일링의 잠재적 임상 유용성을 더 입증한다.
유전자 발현에 대한 DNA 메틸화의 알려진 효과와 그에 따른 암 유발제의 기능적 활성으로 인해, 본 발명자들은 특정 유전자좌에서의 ctDNA 메틸화 패턴이 ctDNA 존재량과 관계없이 예후 유의성을 가질 것이라고 추론하였다. 본 발명자들의 앞서 확인된 과다-DMR이 ctDNA 존재량과 관계없이 예후와 관련된 특정 영역을 함유하는지를 평가하기 위해, 본 발명자들은 모든 이용 가능한 HNSCC 환자(n = 520)에 대해 TCGA에 의해 제공된 DNA 메틸화, RNA 발현 및 임상 결과 데이터를 조사하였다(도 5C). 먼저, 본 발명자들은 TCGA hm450k 메틸화 어레이 데이터로부터 상이한 300 bp 윈도우 내에 함유된 모든 CpG에 걸쳐 평균 β-값을 계산하였다. 본 발명자들은 분석을 본 발명자들의 혈장 유래 과다-DMR과 중첩되는 프로빙된 hm450k 영역(n = 764/941)으로 제한함으로써, 인접 정상 조직(n = 50)에 비해 원발성 종양(n = 520)에서 483개의 과다메틸화된 영역을 확인하였다(윌콕손 검정, FDR < 0.05, log2FC > 1). 본 발명자들은 이 과다메틸화된 영역들 중 몇몇이 HNSCC에서 이전에 평가된 SEPT9SHOX2뿐만 아니라 TWIST1ONECUT2도 포함하는, 시판되는 메틸화 기반 ctDNA 진단 검사에 의해 프로파일링된 유전자 내에서 CpG와 중첩되어 있거나 CpG 근처에 위치함을 관찰하였다(도 17A). 이 결과는 본 발명자들의 혈장 유래 과다-DMR의 잠재적 임상 관련성을 뒷받침하는 추가 증거를 제공한다.
본 발명자들의 HNSCC 코호트와 TCGA HNSC hm450k 프로파일에 의해 공유되는 이 과다메틸화된 영역의 잠재적 임상 유용성을 더 조사하기 위해, 본 발명자들은 이용 가능한 hm450k 프로파일 및 질환 특이적 생존(DSS) 결과(n = 493/520)를 사용하여 모든 TCGA HNSCC 환자들 전체에 대한 단변량 Cox 비례 위험 회귀를 수행하였다. 본 발명자들은 DSS와 유의미하게 관련된 33개의 영역을 확인하였다(p < 0.05). 종양생성에서 기능적 역할을 할 가능성이 높은 예후 영역을 추가로 선택하기 위해, 본 발명자들은 각각의 영역(n=33)의 메틸화 수준을 2 kb 내의 주변 유전자 전사체의 발현과 비교하였다. 다음으로, 본 발명자들은 TCGA HNSCC 코호트를 사용하여, (1) 다변량 Cox 회귀에서의 예후 및 (2) 인접 유전자 전사체의 발현과 관련된 483개의 DMR의 서브세트를 확인하였다. 5개의 영역이 각각 ZNF323/ZSCAN31, LINC01391 및 GATA2-AS1의 더 높은 발현(도 5G, 도 17A 내지 17C)뿐만 아니라 STK3/MST2 및 OSR1의 더 낮은 발현(도 5H)(도 5D)도 야기하는 각각의 영역의 증가된 메틸화로 두 기준을 충족시키는 것으로 확인되었다. 메틸화의 결과로서 발현 감소 및 증가와 관련된 영역은 각각 프로모터 또는 첫 번째 엑손/인트론 및 유전자 본체 내에 존재하는 것으로 발견되었다. 본 발명자들은 이 5개의 영역들로부터 복합 메틸화 점수(CMS)를 구축하였고(표 6) 이 점수에 따라 TCGA HNSCC 코호트를 계층화하였다(도 5E). 더 높은 CMS는 더 좋지 않은 생존 결과와 유의미하게 관련되어 있었다(HR=1.67, 95% CI=[1.25, 2.21], 로그 순위 p = 3.4 x 10-4).
마지막으로, 본 발명자들은 CMS도 ctDNA에 적용될 때 유사한 예후 정보를 제공할 수 있는지를 평가하였다. ctDNA에 대해 농후화하기 위해, cfMeDIP-seq 라이브러리의 분석을 전술된 바와 같이 길이 100 내지 150 bp의 단편으로 제한하였다(도 4E). 5개의 추정되는 예후 마커에 의해 제공된 ctDNA 메틸화 수준의 상대적인 기여를 설명하기 위해, 본 발명자들은 이 영역들의 cfMeDIP-seq RPKM 값을 전체 941개의 과다-DMR로 정규화하였다. 이것은 더 높은 CMS가 더 나쁜 생존과 약간 관련되어 있는 유사한 경향을 생성하였는데(로그 순위 p = 0.1; HR = 3.06)(도 5F), 이것은 TCGA로부터 확인된 이 추정되는 예후 영역의 증가된 메틸화도 cfMeDIP-seq 프로파일 내에서 정보를 제공할 수 있음을 암시한다. 또한, 이 결과는 혈장 무세포 DNA 메틸롬 프로파일링이 바이오마커 발견에 있어서 기존 다중체학(multiomic) 암 데이터베이스와 함께 어떻게 활용될 수 있는지를 강조한다.
cfMeDIP-seq에 의한 최종 치료 후 질환 감시
cfMeDIP-seq가 HNSCC 환자에서 민감하고 정량적인 ctDNA 검출을 달성하였기 때문에, 본 발명자들은 CAPP-seq와 마찬가지로 cfMeDIP-seq도 ctDNA 존재량의 치료 관련 변화를 모니터링할 수 있다고 추론하였다. 치료 후 cfMeDIP-seq 프로파일 내에서 퍼센트 ctDNA를 정량하기 위해, 본 발명자들은 이전에 확인된 혈장 유래 과다-DMR(n = 941) 전체에 걸쳐 평균 RPKM의 선형 변환을 적용함으로써, 단편 크기를 100 내지 150 bp로 제한하여 ctDNA를 더 농후화하였다. 본 발명자들은 모든 건강한 대조군 전체에 걸쳐 관찰된 평균 RPKM 값의 최대치를 기반으로 0.2% ctDNA의 검출 역치를 계산하였다. 하나 이상의 이용 가능한 치료 후 샘플을 가진 CAPP-Seq 양성 HNSCC 환자(n = 20)의 경우, 10 ng의 입력 cfDNA를 사용하여 cfMeDIP-seq를 수행하였다.
본 발명자들은 치료 전반에 걸쳐 ctDNA 존재량의 변화를 측정함으로써, 완전한 제거(CC), 부분적인 제거(PC; 90% 초과 감소) 또는 제거 없음(NC)을 표시하는 다양한 동역학을 관찰하였다(도 6A, 보충 도 10). 18명의 적격 환자들 중 5명(28%)은 제거 없음을 나타내었다(도 6B). 제거 없음 환자는 완전한 또는 부분적인 제거를 가진 환자에 비해 질환 재발을 겪을 가능성이 더 높았다(HR = 8.73, 95% CI = [1.5, 50.92], 로그 순위 p = 0.0046)(도 6C). 흥미롭게도, 진단 시에 비해 마지막 샘플 채취 시 더 큰 ctDNA 존재량을 가진 모든 환자들은 질환 재발을 나타내었다. 또한, 이 군 내에서 문서로 기록된 질환 재발을 갖지 않은 유일한 환자는 추적검사로부터 제외되었으나, 알 수 없는 원인으로 치료 후 1년 이내에 사망하였다. cfMeDIP-seq에 의해 치료 후 ctDNA가 검출될 수 없는 13명의 환자의 경우, 9명은 중앙값 44.4개월(최소 = 12.2, 최대 = 58.7)의 추적검사 시 무질환 상태를 유지하였다. 다른 4명의 환자 중 1명은 국부 림프절 내에서 지속적인 질환을 가졌고, 나머지 환자는 마지막 채취 후 3.5개월 내지 7.7개월(중앙값 7.4개월)에 재발을 경험하였다. 주목할 점은 치료 후 ctDNA가 검출될 수 없는 환자의 이러한 재발은 마지막 채취 후 검출 가능한 치료 후 ctDNA를 가진 환자의 4회 재발(중앙값[범위]: 3.0[1.7 내지 5.2]개월)에 비해 상당히 더 지연되었다는 점이다. 종합하건대, 이 결과는 cfMeDIP-seq에 의한 혈장 무세포 DNA 메틸롬 프로파일링이 최종 치료에 대한 반응을 평가하고 빠른 재발 위험이 높은 환자를 확인하는 데 사용될 수 있음을 입증한다.
논의
임상 환경에서 ctDNA의 광범위한 구현은 종양 물질의 부재 하에 환자 전체에 적용될 수 있는 방법에 의해 가속화될 수 있다. 설명된 작업에서, 본 발명자들은 낮은 ctDNA HNSCC 환자의 탐색적 코호트 내에서 ctDNA의 종양 나이브 검출을 위한 다중모드 게놈 전체 무세포 DNA 프로파일링 기법의 능력을 평가하였다. 본 발명자들은 일치된 PBL의 포함이 돌연변이(즉, CAPP-Seq) 및 DNA 메틸화(즉, cfMeDIP-seq) 둘 다를 이용하는 ctDNA 검출을 개선한다는 것을 보여준다. 나아가, 본 발명자들은 CAPP-Seq를 이용하여 검출 가능한 ctDNA를 가진 환자와 검출 불가능한 ctDNA를 가진 환자를 계층화함으로써, ctDNA로부터 유래한 메틸화 패턴의 확실한 확인을 달성하였다. 본 발명자들은 종양 기원(즉, 감소된 단편 길이)을 반영하는 혈장 무세포 DNA의 생물물리학적 성질이 분자 변형 및 검출 플랫폼 전체에 걸쳐 보존됨을 처음으로 보여주었다. 종양 나이브 ctDNA 검출 및 정량은 다양하게 임상적으로 사용되고, ctDNA 존재량과 메틸화 패턴의 예후 연관성은 조사된다.
종양 나이브 ctDNA 검출은 현재 낮은 ctDNA 존재량으로 인해 몇 가지 제한에 직면한다. 최근 연구는 페어링된 PBL 및/또는 건강한 대조군 혈장을 프로파일링하여, ctDNA의 거짓 양성 검출의 주요 기여자인 클론 조혈로부터 유래한 돌연변이를 확인하였으나; 오르토고날 메트릭의 포함은 정확도와 임상 적용 가능성을 더 개선할 수 있다. 여기서, 본 발명자들은 ctDNA 존재량이 낮은 HNSCC 환자의 코호트 내에서의 종양 나이브 ctDNA 검출을 위한 다중모드 게놈 전체 무세포 DNA 프로파일링 기법의 능력을 평가하였다. 본 발명자들은 돌연변이 기반 프로파일링 방법 및 메틸화 기반 프로파일링 방법에 의해 검출된 ctDNA 메트릭(존재량 및 단편 길이) 사이의 고도의 일치를 입증하였다. 또한, 본 발명자들은 종양 나이브 다중모드 ctDNA 프로파일링이 ctDNA 존재량과 관계없이 추정되는 예후 바이오마커를 확인하고 일련의 샘플에서 ctDNA 존재량을 모니터링함으로써 값을 제공할 수 있음을 보여주었다.
ctDNA의 종양 나이브 검출은 연구 및 임상 환경 둘 다에서 많은 실용적인 이점을 가진다. 최근 연구는 민감도를 개선하기 위해 초기 단계 질환에서 낮은 존재량으로 확인된 ctDNA 유래 영역의 검증을 위해 일치된 종양 프로파일링을 이용하였다. 그러나, 이 방식의 한 가지 한계는 이전에 샘플링되지 않은 하위클론으로부터 유래한 치료 후 ctDNA에 적용될 때 더 악화될 수 있는, 종양의 샘플링 불균질성으로 인해 손실된 정보제공 영역의 수이다. 또한, 이 종양 정보제공 검출 방법의 임상 이점은 비-침습적 액체 생검의 주요 강점 중 하나를 우회함으로써, 생검에 의해 쉽게 접근될 수 있는 암으로 제한된다. 본 발명자들은 종양 나이브 다중모드 프로파일링 전략을 이용함으로써, 종양 정보제공 방법의 단점 없이 초기 단계 암에서 유사한 결과를 달성하였다.
이것은 국소화된 암 환자의 코호트로부터 ctDNA를 포괄적으로 검출하기 위해 돌연변이 및 메틸화 프로파일링을 이용하는 첫 번째 작업이다. 이 다중모드 프로파일링 방식을 다른 암 유형 및 질환 환경으로 확장하는 것은 액체 생검의 계속된 개발에 중요할 것이다. 추가로, HNSCC의 수많은 ctDNA 연구가 돌연변이, 메틸화 또는 HPV 프로파일링에 기반한 검출 방법을 이용하는 것으로 기재되어 있지만, 본 발명자들은 덜 조사되었거나/조사되지 않은 표적 이외에 이미 알려진 표적(즉, TP53 돌연변이 또는 SEPT9/SHOX2 메틸화)을 확인하는 게놈 전체 돌연변이/메틸화 프로파일링 방법의 첫 번째 적용을 본 명세서에서 설명하였다.
ctDNA의 종양 나이브 검출은 연구 및 임상 환경 둘 다에서 많은 실용적인 이점을 가진다. 종양 돌연변이 프로파일링이 낮은 존재량에서 ctDNA 검출을 위한 환자 특이적 마커를 확인할 수 있지만, 이러한 맞춤형 방식은 충분한 돌연변이 부하를 가진 암 유형으로부터의 고순도 종양 샘플에 의존한다. 맞춤형 어세이 디자인을 위한 돌연변이 프로파일링은 비용과 시간이 많이 소요될 수 있으며, 원발성 종양 내에서 또는 전이성 클론 전체에서 게놈 불균질성을 거의 설명하지 않는다. 또한, 종양 조직에의 접근에 의존하는 ctDNA 검출 방법은 비-침습적 액체 생검의 핵심 이점을 감소시킨다. 본 발명자들은 독립적인 무세포 DNA 성질을 통합함으로써, 종양 정보제공 방법의 단점 없이 초기 단계 암에서 민감한 ctDNA 검출을 달성하였다.
본 발명자들의 분석에서, 본 발명자들은 cfMeDIP-seq를 이용하여 ctDNA 유래 메틸화 패턴을 확인하기 위해 CAPP-Seq에 의해 검출 가능한 ctDNA를 가진 환자를 선택하였다. 이 방식은 본 발명자들의 코호트에서 혈장 무세포 DNA의 종양 유래 성질의 추가 검증을 제공하였다. ctDNA 메틸화 패턴은 ctDNA 돌연변이와 유사한 방식으로 ctDNA 존재량을 정량할 수 있었다. 또한, 메틸화 패턴은 종양 기원을 밝히고 추정되는 예후 바이오마커 및 동적 바이오마커를 확인하였다. CAPP-Seq와 cfMeDIP-seq의 조합은 낮은 존재량 ctDNA의 심층적인 분자 특징규명을 가능하게 하였다. 돌연변이 기반 ctDNA 정량은 혈장에서 HNSCC 특이적 과다-DMR들의 발견에 기여하였고, 이들 중 일부는 ctDNA 존재량에 대해 조절한 후에도 예후 능력을 가진 것으로 확인되었다. 따라서, 돌연변이와 메틸화의 동시적인 프로파일링은 정량적, 조직 특이적 및 예후적 ctDNA 바이오마커를 밝혀줌으로써 서로를 보완할 수 있다. 더욱이, 메틸롬 프로파일링은 재발성 또는 클론 돌연변이가 거의 없는 암 유형에 특히 유용할 수 있다.
이전 연구와 유사하게, 본 발명자들은 돌연변이 기반 방식 및 메틸화 기반 방식 둘 다를 이용하여 건강한 기증자 무세포 DNA에 비해 감소된 ctDNA 단편 길이도 관찰하였다. 일관되게 평균 약 166 내지 167 bp인 건강한 무세포 DNA와 달리, 환자들 사이에 ctDNA의 길이는 매우 가변적일 수 있다. ctDNA 단편 길이에 영향을 미치는 요인은 위치 의존적 단편화49, 전이성 대 비-전이성 질환73, 및 건강한 무세포 DNA 단편화를 담당하는 다양한 세포내/외 DNase의 이상조절된 동력학74을 포함할 수 있다. 흥미롭게도, 본 발명자들은 적격 환자에 대해 CAPP-Seq 및 cfMeDIP-seq에 의해 확인된 ctDNA의 단편 길이 사이에 높은 일치도를 관찰하였지만, 이 두 기법들은 상이한 영역 및 종양 유래 변형을 프로빙한다. 이 설득력 있는 데이터는 암 환자에서 혈장 무세포 DNA 단편화의 관련성과 재현성에 관한 추가 증거를 제공한다.
본 발명자들은 CAPP-Seq에 의해 검출 가능한 ctDNA 또는 cfMeDIP-seq에 의해 향상된 ctDNA 존재량이 본 발명자들의 HNSCC 코호트 내에서 좋지 않은 예후와 관련되어 있음을 관찰하였다. 이 결과는 메틸화56에 의한 ctDNA의 검출뿐만 아니라 카피 수 이상75 또는 HPV 검출76에 의한 증가된 존재량도 고위험 환자를 확인하는 이전의 HNSCC ctDNA 연구와 일치한다. 종양 단계와의 불완전한 연관성이 있었는데, 이는 종양 생물학의 다른 측정되지 않은 특징이 ctDNA 존재량에 기여할 수 있음을 암시한다.
본 발명자들이 아는 한, 아마도 부분적으로 일반적으로 이용되는 ctDNA 검출 방법의 한계로 인해, ctDNA 검출/존재량과 관계없이 HNSCC 무세포 DNA에서 예후 영역을 확인한 연구는 이전에 없다. 본 발명자들은 무세포 DNA 메틸롬 프로파일이 TCGA 데이터와 함께 HNSCC에서 신규 예후 메틸화 바이오마커를 확인하는 발견 수단으로서 역할을 할 수 있음을 입증하였다. 5개의 DMR로 구성된 복합 메틸화 점수는 메틸화 검출 플랫폼(hm450k 및 cfMeDIP-seq)과 생체표본 유형(종양 조직 및 혈장 무세포 DNA) 전체에 걸쳐 일관된 예후 연관성을 입증하였다. 향후 더 큰 코호트가 본 발명자들의 발견을 검증하는 데 필요하지만, 이 연구는 cfMeDIP-seq에 의한 메틸화된 영역의 게놈 전체 확인이 신규 예후 바이오마커의 발견을 가능하게 할 수 있음을 시사한다.
cfMeDIP-seq의 성능을 질환 예후와 관련하여 평가하였다. 본 발명자들은 검출 가능한 질환으로서 치료 후 약 0.2% ctDNA보다 더 큰 엄격한 역치를 적용함으로써, 9명의 환자들 중 4명의 환자들에 대해 질환 재발을 예측할 수 있었다. 치료 후 검출 가능한 ctDNA를 갖지 못한, 재발(n = 4) 또는 지속적인 질환(n = 1)을 가진 나머지 5명의 환자들에 대해, 본 발명자들은 전형적으로 재발까지 더 긴 시간을 관찰하였는데, 이는 그 시점에서 ctDNA의 분율이 cfMeDIP-seq의 검출 하한보다 더 낮았을 수 있음을 암시한다. 종양 나이브 질환 감시를 위해 cfMeDIP-seq를 이용하는 후속 연구에서, 치료 후 더 빈번한 혈장 채취는 이 한계를 해결하는 데 도움이 될 수 있다.
본 발명자들이 국소화된 질환 및 HNSCC 내에서 다중모드 프로파일링의 잠재적 임상 유용성을 입증하였기 때문에, 이 방법은 향후 바이오마커 발견과 궁극적으로 다양한 암 유형을 가진 환자에 대한 임상 유용성에 기여한다. 이 연구는 여러 가지 주목할 만한 기여를 한다. 이것은 무세포 DNA 돌연변이, 메틸화 및 단편 길이의 분석을 조합한 최초이다. 나아가, 본 발명자들은 HNSCC 환자 및 위험 일치된 건강한 대조군 둘 다로부터 혈장 샘플 및 페어링된 PBL을 체계적으로 프로파일링하였다. 이 분석은 ctDNA 검출 및 특징규명을 위한 다중모드 프로파일링의 최적 처리에 관한 핵심 통찰력을 보여주었다. 예를 들어, 백혈구로부터 기여 메틸화 신호를 제거하고 단편 길이 특성을 이용하여 종양 유래 메틸화에 대해 농후화하는 본 발명자들의 독특한 방식은 향후 연구에 유용할 것이다.
결론적으로, 본 발명자들은 ctDNA의 종양 나이브 CAPP-Seq 프로파일링이 cfMeDIP-seq에 의한 ctDNA 유래 메틸화의 높은 신뢰도 확인을 가능하게 함을 입증한다. 본 발명자들은 cfMeDIP-seq에 의한 후성적 프로파일링의 강점을 이용하여, 이 ctDNA 유래 메틸화된 영역이 종양 기원, 예후 및 치료 반응의 마커로서의 잠재력을 나타낸다는 것도 보여준다. 본 발명자들이 HNSCC에서 cfMeDIP-seq에 의한 ctDNA 검출의 민감도를 개선하는 것으로 설명한 몇몇 방식, 예컨대, PBL 고갈 윈도우 및 짧은 단편으로의 분석의 제한을 포함시키는 것은 임상 이익을 위해 다양한 다른 국소화된 암에도 적용될 수 있다. 개시된 프레임워크는 종양 조직 이용 가능성이 제한될 수 있는 다른 임상 환경에 광범위하게 적용될 수 있다.
본 발명의 바람직한 실시양태가 본원에 설명되어 있지만, 당분야에서 숙련된 자는 본 발명의 사상 또는 첨부된 청구범위를 벗어나지 않으면서 변경시킬 수 있음을 이해할 것이다. 하기 참고문헌 목록에 있는 문헌을 비롯한, 본원에 개시된 모든 문헌은 참고로 포함된다.

Claims (116)

  1. 대상체에서 암세포로부터의 순환 종양 데옥시리보핵산(ctDNA)의 존재를 검출하는 방법으로서,
    (a) 상기 대상체로부터 무세포 데옥시리보핵산(DNA)의 샘플을 제공하는 단계;
    (b) 무세포 메틸화된 DNA의 후속 시퀀싱을 허용하기 위해 샘플에 대해 라이브러리 제조를 수행하는 단계;
    (c) 메틸화된 폴리뉴클레오타이드에 대해 선택적인 결합제를 사용하여 무세포 메틸화된 DNA를 포획하는 단계;
    (d) 포획된 무세포 메틸화된 DNA를 시퀀싱하는 단계;
    (e) 포획된 무세포 메틸화된 DNA의 서열을 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열과 함께 컴퓨터 프로세싱하는 단계; 및
    (f) 포획된 무세포 메틸화된 DNA의 하나 이상의 서열과 암 개체로부터의 무세포 메틸화된 DNA 서열 사이에 통계적으로 유의미한 유사성이 있는 경우 암세포로부터의 DNA의 존재를 확인하는 단계
    를 포함하고, 여기서 (d), (f) 및 (g) 중 적어도 하나에서, 대상체 무세포 메틸화된 DNA가 단편 길이 메트릭(metric)에 따라 하위집단으로 제한되는 것인 방법.
  2. 제1항에 있어서, 제1양의 필러 DNA를 샘플에 첨가한 후, 추가로 임의로 샘플을 변성시키는 단계를 더 포함하고, 여기서 필러 DNA의 적어도 일부가 메틸화된 것인 방법.
  3. 제1항에 있어서, 단편 길이 메트릭이 단편 길이인 방법.
  4. 제2항에 있어서, 대상체 무세포 메틸화된 DNA가 170 염기쌍(bp) 미만, 165 bp 미만, 160 bp 미만, 155 bp 미만, 150 bp 미만, 145 bp 미만, 140 bp 미만, 135 bp 미만, 130 bp 미만, 125 bp 미만, 120 bp 미만, 115 bp 미만, 110 bp 미만, 105 bp 미만 또는 100 bp 미만의 길이를 가진 단편으로 제한되는 것인 방법.
  5. 제2항에 있어서, 대상체 무세포 메틸화된 DNA가 약 100 내지 약 150 bp, 110 내지 140 bp, 또는 120 내지 130 bp의 길이를 가진 단편으로 제한되는 것인 방법.
  6. 제1항에 있어서, 단편 길이 메트릭이 대상체 무세포 메틸화된 DNA의 단편 길이 분포인 방법.
  7. 제5항에 있어서, 대상체 무세포 메틸화된 DNA가 길이를 기준으로 하위 50번째, 45번째, 40번째, 35번째, 30번째, 25번째, 20번째, 15번째 또는 10번째 백분위수 내의 단편으로 제한되는 것인 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서, 대상체 무세포 메틸화된 DNA가 차등적으로 메틸화된 영역(Differentially Methylated Region, DMR) 내의 단편으로 더 제한되는 것인 방법.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, 대상체 무세포 메틸화된 DNA가 상기 포획 동안 더 제한되는 것인 방법.
  10. 제1항 내지 제7항 중 어느 한 항에 있어서, 대상체 무세포 메틸화된 DNA가 상기 비교 동안 더 제한되는 것인 방법.
  11. 제1항 내지 제7항 중 어느 한 항에 있어서, 제한이 상기 확인 동안 수행되는 것인 방법.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 샘플이 대상체의 혈액 또는 혈장으로부터 유래한 것인 방법.
  13. 제1항 내지 제11항 중 어느 한 항에 있어서, (f)가 통계적 분류기의 이용을 포함하는 것인 방법.
  14. 제12항에 있어서, 분류기가 기계 학습으로부터 유래한 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열이 건강한 개체와 암 개체 사이에 차등적으로 메틸화된 영역(DMR)의 데이터베이스에 포함되는 것인 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 건강한 개체 및 암 개체로부터의 대조군 무세포 메틸화된 DNA 서열이, 무세포 DNA로부터 유래한 DNA에서 건강한 개체와 암 개체 사이에 차등적으로 메틸화된 대조군 무세포 메틸화된 DNA 서열로 제한되는 것인 방법.
  17. 제16항에 있어서, 대조군 무세포 메틸화된 DNA 서열이 혈액 혈장으로부터 유래한 DNA에서 건강한 개체와 암 개체 사이에 차등적으로 메틸화된 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 샘플이 100 ng, 75 ng 또는 50 ng 미만의 무세포 DNA를 가진 것인 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 제1양의 필러 DNA가 약 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 메틸화된 필러 DNA, 바람직하게는 5% 내지 50%, 10% 내지 40%, 또는 15% 내지 30% 메틸화된 필러 DNA를 포함하고, 여기서 나머지가 메틸화되지 않은 필러 DNA인 방법.
  20. 제1항 내지 제18항 중 어느 한 항에 있어서, 필러 DNA의 제1양이 20 ng 내지 100 ng, 바람직하게는 30 ng 내지 100 ng, 보다 바람직하게는 50 ng 내지 100 ng인 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 샘플로부터의 무세포 DNA 및 제1양의 필러 DNA가 함께, 총 DNA의 적어도 50 ng, 바람직하게는 총 DNA의 적어도 100 ng을 포함하는 것인 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 필러 DNA가 50 bp 내지 800 bp의 길이, 바람직하게는 100 bp 내지 600 bp의 길이, 보다 바람직하게는 200 bp 내지 600 bp의 길이인 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 필러 DNA가 이중 가닥인 방법.
  24. 제1항 내지 제11항 중 어느 한 항에 있어서, 필러 DNA가 정크(junk) DNA인 방법.
  25. 제1항 내지 제12항 중 어느 한 항에 있어서, 필러 DNA가 내생성 또는 외생성 DNA인 방법.
  26. 제25항에 있어서, 필러 DNA가 비-인간 DNA, 바람직하게는 λ DNA인 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 필러 DNA가 인간 DNA와 정렬되지 않는 것인 방법.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 결합제가 메틸-CpG 결합 도메인을 포함하는 단백질인 방법.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 단백질이 MBD2 단백질인 방법.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, (d)가 항체를 사용하여 무세포 메틸화된 DNA를 면역침전시키는 것을 포함하는 것인 방법.
  31. 제30항에 있어서, 면역침전을 위해 적어도 0.05 ㎍, 바람직하게는 적어도 0.16 ㎍의 항체를 샘플에 첨가하는 단계를 포함하는 방법.
  32. 제30항에 있어서, 항체가 5-MeC 항체인 방법.
  33. 제30항에 있어서, 면역침전 반응을 확인하기 위해 (c) 후에 제2양의 대조군 DNA를 샘플에 첨가하는 단계를 추가로 포함하는 방법.
  34. 제1항 내지 제32항 중 어느 한 항에 있어서, 무세포 메틸화된 DNA의 포획을 확인하기 위해 (c) 후에 제2양의 대조군 DNA를 샘플에 첨가하는 단계를 추가로 포함하는 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 암세포로부터의 DNA의 존재를 확인하는 단계가 기원의 암세포 조직을 확인하는 단계를 추가로 포함하는 것인 방법.
  36. 제35항에 있어서, 기원의 암세포 조직을 확인하는 단계가 암 하위유형을 확인하는 단계를 추가로 포함하는 것인 방법.
  37. 제36항에 있어서, 암 하위유형이 병기, 조직학, 유전자 발현 패턴, 카피 수 이상, 재배열 또는 점 돌연변이 상태를 기준으로 암을 구별하는 것인 방법.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, (f)를 게놈 전체에 대해 수행하는 것인 방법.
  39. 제1항 내지 제37항 중 어느 한 항에 있어서, (f)가 게놈 전체로부터 특정 조절 영역으로 제한되는 것인 방법.
  40. 제39항에 있어서, 조절 영역이 FANTOM5 인핸서, CpG 아일랜드(Islands), CpG 쇼어(shores), CpG 쉘프(Shelves), 또는 이들의 임의의 조합인 방법.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, 단계 (f) 및 (g)를 컴퓨터 프로세서로 수행하는 것인 방법.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 암이 부신암, 항문암, 담도암, 방광암, 골암, 뇌/cns 종양, 유방암, 캐슬맨병(castleman disease), 자궁경부암, 결장/직장암, 자궁내막암, 식도암, 유잉(ewing) 계열의 종양, 안암, 담낭암, 위장 카르시노이드 종양, 위장 기질 종양(gist), 임신성 영양막 질환, 호지킨병, 카포시 육종, 신장암, 후두 및 하인두암, 백혈병(급성 림프구성, 급성 골수성, 만성 림프구성, 만성 골수성, 만성 골수단핵구성), 간암, 폐암(비-소세포, 소세포, 폐 카르시노이드 종양), 림프종, 피부의 림프종, 악성 중피종, 다발성 골수종, 골수이형성 증후군, 비강 및 부비동암, 비인두암, 신경모세포종, 비-호지킨 림프종, 구강 및 구인두암, 골육종, 난소암, 음경암, 뇌하수체 종양, 전립선암, 망막모세포종, 횡문근육종, 침샘암, 육종 - 성인 연조직암, 피부암(기저 및 편평 세포, 흑색종, 메르켈 세포), 소장암, 위암, 고환암, 흉선암, 갑상선암, 자궁 육종, 질암, 외음부암, 발덴스트롬 마크로글로불린혈증, 윌름스 종양으로 구성된 군으로부터 선택된 것인 방법.
  43. 제1항 내지 제41항 중 어느 한 항에 있어서, 암이 두경부 편평 세포 암종인 방법.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 암의 검출에 사용되는 방법.
  45. 제1항 내지 제43항 중 어느 한 항에 있어서, 암의 요법을 모니터링하는 데 사용되는 방법.
  46. 대상체가 질환을 갖거나 가질 위험이 있는지를 결정하는 방법으로서,
    (a) 상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여, (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일로 구성된 군으로부터 선택된 적어도 하나의 프로파일을 생성하는 단계; 및
    (b) 상기 적어도 하나의 프로파일을 프로세싱하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 적어도 80%의 민감도 또는 적어도 약 90%의 특이성으로 결정하는 단계
    를 포함하고, 여기서 상기 무세포 핵산 샘플이 30 나노그램(ng)/밀리리터(㎖) 미만의 상기 복수의 핵산 분자를 포함하는 것인 방법.
  47. 제46항에 있어서, 상기 무세포 핵산 샘플이 10 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함하는 것인 방법.
  48. 제46항에 있어서, 상기 무세포 핵산 샘플이 5 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함하는 것인 방법.
  49. 제46항에 있어서, 상기 무세포 핵산 샘플이 1 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함하는 것인 방법.
  50. 제46항에 있어서, 상기 (a)의 시퀀싱이 (i), (ii) 및 (iii)으로 구성된 군으로부터 선택된 적어도 2개의 프로파일을 생성하는 것인 방법.
  51. 제50항에 있어서, 상기 적어도 2개의 프로파일이 상기 메틸화 프로파일 및 상기 단편 길이 프로파일을 포함하는 것인 방법.
  52. 제50항에 있어서, 상기 적어도 2개의 프로파일이 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 포함하는 것인 방법.
  53. 제50항에 있어서, 상기 적어도 2개의 프로파일이 상기 메틸화 프로파일 및 상기 돌연변이 프로파일을 포함하는 것인 방법.
  54. 제46항에 있어서, 상기 (a)의 시퀀싱이 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 생성하는 것인 방법.
  55. 대상체의 무세포 핵산 샘플을 프로세싱하여, 상기 대상체가 질환을 갖거나 가질 위험이 있는지를 결정하는 방법으로서,
    (a) 복수의 핵산 분자를 포함하는 상기 무세포 핵산 샘플을 제공하는 단계;
    (b) 상기 복수의 핵산 분자 또는 이의 유도체를 시퀀싱하여 복수의 시퀀싱 리드(read)를 생성하는 단계;
    (c) 상기 복수의 시퀀싱 리드를 컴퓨터 프로세싱하여, 상기 복수의 핵산 분자에 대해 (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일을 확인하는 단계; 및
    (d) 적어도 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 사용하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 결정하는 단계
    를 포함하는 방법.
  56. 제46항 내지 제55항 중 어느 한 항에 있어서, 질환이 암을 포함하는 것인 방법.
  57. 제56항에 있어서, 암이 부신암, 항문암, 담도암, 방광암, 골암, 뇌/cns 종양, 유방암, 캐슬맨병, 자궁경부암, 결장/직장암, 자궁내막암, 식도암, 유잉 계열의 종양, 안암, 담낭암, 위장 카르시노이드 종양, 위장 기질 종양(gist), 임신성 영양막 질환, 호지킨병, 카포시 육종, 신장암, 후두 및 하인두암, 백혈병(급성 림프구성, 급성 골수성, 만성 림프구성, 만성 골수성, 만성 골수단핵구성), 간암, 폐암(비-소세포, 소세포, 폐 카르시노이드 종양), 림프종, 피부의 림프종, 악성 중피종, 다발성 골수종, 골수이형성 증후군, 비강 및 부비동암, 비인두암, 신경모세포종, 비-호지킨 림프종, 구강 및 구인두암, 골육종, 난소암, 음경암, 뇌하수체 종양, 전립선암, 망막모세포종, 횡문근육종, 침샘암, 육종 - 성인 연조직암, 피부암(기저 및 편평 세포, 흑색종, 메르켈 세포), 소장암, 위암, 고환암, 흉선암, 갑상선암, 자궁 육종, 질암, 외음부암, 발덴스트롬 마크로글로불린혈증, 윌름스 종양, 편평 세포 암종, 및 두경부 편평 세포 암종으로 구성된 군으로부터 선택된 것인 방법.
  58. 제57항에 있어서, 암이 편평 세포 암종인 방법.
  59. 제58항에 있어서, 암이 두경부 편평 세포 암종인 방법.
  60. 제46항 내지 제56항 중 어느 한 항에 있어서, 상기 복수의 무세포 핵산 분자가 순환 종양 핵산 분자를 포함하는 것인 방법.
  61. 제60항에 있어서, 순환 종양 핵산이 순환 종양 DNA를 포함하는 것인 방법.
  62. 제60항에 있어서, 순환 종양 핵산이 순환 종양 RNA를 포함하는 것인 방법.
  63. 제46항 내지 제62항 중 어느 한 항에 있어서, 상기 메틸화 프로파일이 복수의 차등적으로 메틸화된 영역(DMR)을 포함하는 것인 방법.
  64. 제63항에 있어서, 상기 복수의 DMR이 ctDNA로부터 유래한 것인 방법.
  65. 제63항에 있어서, 말초 혈액 백혈구로부터 유래한 복수의 DMR이 상기 메틸화 프로파일로부터 제거되는 것인 방법.
  66. 제63항에 있어서, 상기 복수의 DMR이 정상적인 건강한 대상체로부터의 상응하는 게놈 영역에 비해 과소메틸화 수준을 가진 적어도 약 56개의 게놈 영역을 포함하는 것인 방법.
  67. 제54항에 있어서, 상기 복수의 DMR이 정상적인 건강한 대상체로부터의 상응하는 게놈 영역에 비해 과다메틸화 수준을 가진 적어도 약 941개의 게놈 영역을 포함하는 것인 방법.
  68. 제63항에 있어서, DMR이 적어도 약 300 bp의 크기를 포함하는 것인 방법.
  69. 제68항에 있어서, DMR이 적어도 약 100 bp 내지 적어도 약 200 bp의 크기를 포함하는 것인 방법.
  70. 제68항에 있어서, DMR이 적어도 약 100 bp 내지 적어도 약 150 bp의 크기를 포함하는 것인 방법.
  71. 제63항에 있어서, DMR이 적어도 8개의 CpG 게놈 아일랜드를 포함하는 것인 방법.
  72. 제66항 또는 제67항에 있어서, 상기 정상적인 건강한 대상체가 상기 대상체와 동일한 세트의 위험 요인을 포함하는 것인 방법.
  73. 제45항 내지 제72항 중 어느 한 항에 있어서, 상기 돌연변이 프로파일이 미스센스 변이체, 넌센스 변이체, 결실 변이체, 삽입 변이체, 중복 변이체, 역위 변이체, 프레임쉬프트 변이체, 또는 반복부 확장 변이체를 포함하는 것인 방법.
  74. 제45항 내지 제72항 중 어느 한 항에 있어서, 복수의 말초 혈액 백혈구로부터 수득된 게놈 DNA 샘플에 존재하는 임의의 변이체가 돌연변이 프로파일로부터 제거되고, 상기 복수의 말초 혈액 백혈구가 상기 대상체로부터 수득되는 것인 방법.
  75. 제45항 내지 제72항 중 어느 한 항에 있어서, 클론 조혈로부터 유래한 임의의 변이체가 상기 돌연변이 프로파일로부터 제거되는 것인 방법.
  76. 제75항에 있어서, 상기 돌연변이 프로파일이 유전자 DNMT3A, TET2 또는 ASXL1의 변이체를 포함하지 않는 것인 방법.
  77. 제75항에 있어서, 상기 돌연변이 프로파일이 정규 암 유발제 유전자를 포함하지 않는 것인 방법.
  78. 제75항에 있어서, 상기 돌연변이 프로파일이 비-정규 암 유발제 유전자를 포함하고, 여기서 상기 비-정규 유전자가 GRIN3A 또는 MYC인 방법.
  79. 제46항 내지 제78항 중 어느 한 항에 있어서, 상기 단편 길이 프로파일이 약 적어도 80 bp 내지 170 bp의 단편 길이 범위를 기준으로 무세포 핵산 분자를 선택하는 것을 포함하는 것인 방법.
  80. 제46항 내지 제78항 중 어느 한 항에 있어서, 상기 단편 길이 프로파일이 약 적어도 100 bp 내지 150 bp의 단편 길이 범위를 기준으로 무세포 핵산 분자를 선택하는 것을 포함하는 것인 방법.
  81. 제79항 또는 제80항에 있어서, 상기 순환 종양 핵산 분자가 농후화된 것인 방법.
  82. 제46항 내지 제81항 중 어느 한 항에 있어서, 상기 무세포 핵산 샘플을 필러 DNA 분자와 혼합하여 DNA 혼합물을 생성하는 단계를 추가로 포함하는 방법.
  83. 제82항에 있어서, 상기 필러 DNA 분자가 약 50 bp 내지 800 bp의 길이를 포함하는 것인 방법.
  84. 제82항에 있어서, 상기 필러 DNA 분자가 약 100 bp 내지 600 bp의 길이를 포함하는 것인 방법.
  85. 제82항에 있어서, 상기 필러 DNA 분자가 적어도 약 5%의 메틸화된 필러 DNA 분자를 포함하는 것인 방법.
  86. 제82항에 있어서, 상기 필러 DNA 분자가 적어도 약 20%의 메틸화된 필러 DNA를 포함하는 것인 방법.
  87. 제82항에 있어서, 상기 필러 DNA 분자가 적어도 약 30%의 메틸화된 필러 DNA를 포함하는 것인 방법.
  88. 제82항에 있어서, 상기 필러 DNA 분자가 적어도 약 50%의 메틸화된 필러 DNA를 포함하는 것인 방법.
  89. 제46항 내지 제88항 중 어느 한 항에 있어서, 상기 DNA 혼합물을 메틸화된 뉴클레오타이드에 결합하도록 구성된 결합제와 함께 인큐베이션하여 농후화된 샘플을 생성하는 단계를 추가로 포함하는 방법.
  90. 제89항에 있어서, 상기 결합제가 메틸-CpG 결합 도메인을 포함하는 단백질을 포함하는 것인 방법.
  91. 제89항에 있어서, 상기 단백질이 MBD2 단백질인 방법.
  92. 제89항에 있어서, 상기 결합제가 항체를 포함하는 것인 방법.
  93. 제89항에 있어서, 항체가 5-MeC 항체인 방법.
  94. 제89항에 있어서, 항체가 5-하이드록시메틸 사이토신 항체인 방법.
  95. 제46항 내지 제94항 중 어느 한 항에 있어서, 상기 시퀀싱이 중아황산염 시퀀싱을 포함하지 않는 것인 방법.
  96. 제46항 내지 제94항 중 어느 한 항에 있어서, 상기 무세포 핵산 샘플이 혈액 샘플을 포함하는 것인 방법.
  97. 제96항에 있어서, 상기 혈액 샘플이 혈장 샘플을 포함하는 것인 방법.
  98. 제46항 내지 제97항 중 어느 한 항에 있어서, 암 조직의 기원을 검출하는 단계를 추가로 포함하는 방법.
  99. 제46항 내지 제97항 중 어느 한 항에 있어서, 상기 대상체의 생존율의 예후를 포함하는 보고서를 생성하는 단계를 추가로 포함하는 방법.
  100. 제46항 내지 제97항 중 어느 한 항에 있어서, 상기 대상체에게 치료를 제공하는 단계를 추가로 포함하는 방법.
  101. 제46항 내지 제97항 중 어느 한 항에 있어서, 상기 질환의 치료 후, 상기 치료가 효과적인지를 표시하는 제2 보고서를 제공하는 단계를 추가로 포함하는 방법.
  102. 대상체가 병태를 갖거나 가질 위험이 있는지를 결정하는 방법으로서,
    (a) 상기 대상체로부터의 샘플의 적어도 일부로부터 무세포 핵산 분자를 어세이하는 단계;
    (b) 표 5에 나열된 차등적으로 메틸화된 영역(DMR)에 포함된 상기 무세포 핵산 분자의 적어도 일부의 메틸화 수준을 검출하는 단계; 및
    (c) 적어도 하나의 컴퓨터 프로세서를 사용하여, (b)에서 검출된 상기 메틸화 수준을 표 5에 나열된 상기 DMR에 포함된 상기 무세포 핵산 분자의 상응하는 부분(들)의 메틸화 수준과 비교하는 단계
    를 포함하는 방법.
  103. 제102항에 있어서, 상기 무세포 핵산 분자가 ctDNA를 포함하는 것인 방법.
  104. 제102항에 있어서, 서열 분석을 수행하는 단계를 포함하고, 상기 시퀀싱 분석이 무세포 메틸화된 DNA 면역침전(cfMeDIP) 시퀀싱을 포함하는 것인 방법.
  105. 제102항에 있어서, 상기 검출이 표 5에 나열된 6개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 40개 이상, 50개 이상, 60개 이상, 70개 이상, 80개 이상, 90개 이상 또는 100개 이상의 DMR에 포함된 상기 핵산 분자의 적어도 일부의 메틸화 수준을 측정하는 단계를 포함하는 것인 방법.
  106. 대상체가 질환에 대한 치료를 받은 후 더 높은 생존율을 갖는지를 결정하는 방법으로서,
    (a) 상기 대상체로부터의 샘플의 적어도 일부로부터 무세포 핵산 분자를 어세이하는 단계;
    (b) 표 6에 나열된 차등적으로 메틸화된 영역(DMR)에 포함된 상기 무세포 핵산 분자의 적어도 일부의 메틸화 수준을 검출하는 단계; 및
    (c) 적어도 하나의 컴퓨터 프로세서를 사용하여, (b)에서 검출된 상기 메틸화 수준을 표 6에 나열된 상기 DMR에 포함된 상기 무세포 핵산 분자의 상응하는 부분(들)의 메틸화 수준으로 프로세싱하는 단계
    를 포함하는 방법.
  107. 제106항에 있어서, 상기 무세포 핵산 분자가 ctDNA를 포함하는 것인 방법.
  108. 제106항에 있어서, 상기 검출이 복합 메틸화 점수(CMS)를 제공하는 것을 포함하는 것인 방법.
  109. 제107항에 있어서, 상기 CMS가 표 6에 나열된 DMR의 베타-값의 합계를 포함하는 것인 방법.
  110. 제107항에 있어서, 더 높은 CMS가 상기 대상체에 대한 더 좋지 않은 생존을 표시하는 것인 방법.
  111. 제107항에 있어서, 상기 CMS가 ctDNA의 존재량(abundance)에 의존하지 않는 것인 방법.
  112. 제102항 내지 제111항 중 어느 한 항에 있어서, 상기 질환이 편평 세포 암종인 방법.
  113. 제112항에 있어서, 암이 두경부 편평 세포 암종인 방법.
  114. 제102항 내지 제113항 중 어느 한 항에 있어서, 약 적어도 80 bp 내지 170 bp의 단편 길이 범위를 기준으로 무세포 핵산 분자를 선택하는 단계를 추가로 포함하는 방법.
  115. 대상체가 질환을 갖거나 가질 위험이 있는지를 결정하는 시스템으로서,
    상기 대상체로부터 수득된 무세포 핵산 샘플로부터 유래한 복수의 핵산 분자를 시퀀싱하여, (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일 중 적어도 하나의 프로파일을 생성하는 단계; 및
    상기 적어도 하나의 프로파일을 프로세싱하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 적어도 80%의 민감도 또는 적어도 약 90%의 특이성으로 결정하는 단계
    를 포함하는 프로세스를 구현하도록 개별적으로 또는 집합적으로 프로그래밍된 하나 이상의 컴퓨터 프로세서를 포함하고, 여기서 상기 무세포 핵산 샘플이 30 ng/㎖ 미만의 상기 복수의 핵산 분자를 포함하는 것인 시스템.
  116. 대상체의 무세포 핵산 샘플을 프로세싱하여, 상기 대상체가 질환을 갖거나 가질 위험이 있는지를 결정하는 시스템으로서,
    (a) 복수의 핵산 분자를 포함하는 상기 무세포 핵산 샘플을 제공하는 단계;
    (b) 상기 복수의 핵산 분자 또는 이의 유도체를 시퀀싱하여 복수의 시퀀싱 리드를 생성하는 단계;
    (c) 상기 복수의 시퀀싱 리드를 컴퓨터 프로세싱하여, 상기 복수의 핵산 분자에 대해 (i) 메틸화 프로파일, (ii) 돌연변이 프로파일 및 (iii) 단편 길이 프로파일을 확인하는 단계; 및
    (d) 적어도 상기 메틸화 프로파일, 상기 돌연변이 프로파일 및 상기 단편 길이 프로파일을 사용하여, 상기 대상체가 상기 질환을 갖거나 가질 위험이 있는지를 결정하는 단계
    를 포함하는 프로세스를 구현하도록 개별적으로 또는 집합적으로 프로그래밍된 하나 이상의 컴퓨터 프로세서를 포함하는 시스템.
KR1020237002210A 2020-06-19 2021-06-18 순환 종양 핵산 분자의 다중모드 분석 KR20230025895A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063041151P 2020-06-19 2020-06-19
US63/041,151 2020-06-19
PCT/CA2021/050842 WO2021253138A1 (en) 2020-06-19 2021-06-18 Multimodal analysis of circulating tumor nucleic acid molecules

Publications (1)

Publication Number Publication Date
KR20230025895A true KR20230025895A (ko) 2023-02-23

Family

ID=79268880

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237002210A KR20230025895A (ko) 2020-06-19 2021-06-18 순환 종양 핵산 분자의 다중모드 분석

Country Status (9)

Country Link
US (1) US20230212690A1 (ko)
EP (1) EP4168574A4 (ko)
JP (1) JP2023528533A (ko)
KR (1) KR20230025895A (ko)
CN (1) CN116157539A (ko)
AU (1) AU2021291586B2 (ko)
CA (1) CA3182321A1 (ko)
IL (1) IL299157A (ko)
WO (1) WO2021253138A1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3069754A1 (en) * 2017-07-12 2019-01-17 University Health Network Cancer detection and classification using methylome analysis
EP3704267A4 (en) * 2017-11-03 2021-08-04 University Health Network DETECTION, CLASSIFICATION, PROGNOSIS, THERAPY PREDICTION AND MONITORING OF CANCER THERAPY USING METHYLOMA TEST

Also Published As

Publication number Publication date
AU2021291586A1 (en) 2023-02-02
JP2023528533A (ja) 2023-07-04
EP4168574A4 (en) 2024-02-28
AU2021291586B2 (en) 2024-02-15
WO2021253138A1 (en) 2021-12-23
CN116157539A (zh) 2023-05-23
EP4168574A1 (en) 2023-04-26
IL299157A (en) 2023-02-01
US20230212690A1 (en) 2023-07-06
CA3182321A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
Stewart et al. Circulating cell-free DNA for non-invasive cancer management
JP7128853B2 (ja) ヘテロ接合性の消失(loss of heterozygosity)を評価するための方法および材料
CN110603329B (zh) 用于诊断肝细胞癌和肺癌的甲基化标志物
CN108064314B (zh) 判定癌症状态之系统
CN111742062B (zh) 用于诊断癌症的甲基化标志物
US20170233821A1 (en) Method of determining pik3ca mutational status in a sample
JP2020537487A (ja) メチローム解析を用いる癌の検出及び分類
Pass et al. Biomarkers and molecular testing for early detection, diagnosis, and therapeutic prediction of lung cancer
US20150072947A1 (en) Gene biomarkers for prediction of susceptibility of ovarian neoplasms and/or prognosis or malignancy of ovarian cancers
WO2019064063A1 (en) BIOMARKERS FOR DETECTION OF COLORECTAL CANCER
Parasramka et al. Validation of gene expression signatures to identify low-risk clear-cell renal cell carcinoma patients at higher risk for disease-related death
AU2021291586B2 (en) Multimodal analysis of circulating tumor nucleic acid molecules
EP4234720A1 (en) Epigenetic biomarkers for the diagnosis of thyroid cancer
WO2022262831A1 (zh) 用于评估肿瘤的物质及其方法
US20220298565A1 (en) Method Of Determining PIK3CA Mutational Status In A Sample
Michel et al. Non-invasive multi-cancer diagnosis using DNA hypomethylation of LINE-1 retrotransposons
WO2023230289A1 (en) Methods and systems for cell-free nucleic acid processing
Burgener Multimodal Profiling of Cell-Free DNA for Detection and Characterization of Circulating Tumour DNA in Low Tumour Burden Settings
JP2024519082A (ja) 肝細胞がんのdnaメチル化バイオマーカー
WO2023107709A1 (en) Methods and systems for generating sequencing libraries
WO2024047250A1 (en) Sensitive and specific determination of dna methylation profiles
EP4294938A1 (en) Cell-free dna methylation test
JP2023554505A (ja) サンプルを臨床関連カテゴリーに分類する方法

Legal Events

Date Code Title Description
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
E902 Notification of reason for refusal