KR20230156364A - 분자 반응을 분석하기 위한 방법 및 관련 측면 - Google Patents

분자 반응을 분석하기 위한 방법 및 관련 측면 Download PDF

Info

Publication number
KR20230156364A
KR20230156364A KR1020237033549A KR20237033549A KR20230156364A KR 20230156364 A KR20230156364 A KR 20230156364A KR 1020237033549 A KR1020237033549 A KR 1020237033549A KR 20237033549 A KR20237033549 A KR 20237033549A KR 20230156364 A KR20230156364 A KR 20230156364A
Authority
KR
South Korea
Prior art keywords
maf
variants
variant
sequence reads
subject
Prior art date
Application number
KR1020237033549A
Other languages
English (en)
Inventor
케이티 줄리아 퀸
앨리시아 제이드 막
엘레나 헬만
팅팅 지앙
저스틴 아이. 외데고르
다리야 슈도바
카일 릭 밍 창
한-유 창
다니엘 가일
Original Assignee
가던트 헬쓰, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가던트 헬쓰, 인크. filed Critical 가던트 헬쓰, 인크.
Publication of KR20230156364A publication Critical patent/KR20230156364A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

분자 반응 점수를 결정하는 방법이 본원에서 제공된다. 분자 반응 점수는 대상체에 대한 치료의 투여를 모니터링하고 가이드하는데 사용될 수 있다.

Description

분자 반응을 분석하기 위한 방법 및 관련 측면
관련 출원에 대한 상호 참조
본 출원은 2021년 3월 5일에 출원된 미국 가특허 출원 번호 63/157,592, 및 2021년 4월 9일에 출원된 미국 가특허 출원 번호 63/173,193의 우선권을 주장하며, 이들 각각은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
분자 반응은 상이한 시점에서 대상체로부터 수집된 샘플에서 관찰되는 순환 종양 DNA (ctDNA) 수준의 변화의 계산이다. 특정 경우에, 계산은 샘플 내의 총 무세포 DNA (cfDNA) 내의 체세포 변이체의 분율에 기초한다. 다른 경우에, 계산은 샘플 내의 ctDNA의 농도에 기초한다 (즉, 샘플 내의 cfDNA 농도당 정규화된다). 이들 접근법과 연관된 공통적인 문제는 이러한 상대적으로 간단한 분자 반응의 계산이 부정확하거나 비정밀한 분자 반응 점수를 빈번히 생성한다는 것이다. 따라서, 암을 갖는 대상체에 대한 분자 반응 점수를 정확하게 결정하는 방법에 대한 필요가 남아 있다.
간단한 요약
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고, 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 돌연변이체 대립유전자 분율 (MAF) 및 제2 MAF에 기초하여, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균을 결정하고, 대상체에 대해, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비를 결정하고, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비에 기초하여, 신뢰 구간을 결정하고, 분자 반응 점수로서, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간을 산출하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고, 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 돌연변이체 대립유전자 분율 (MAF) 및 제2 MAF에 기초하여, MAF 비를 결정하고, 대상체에 대해, MAF 비의 가중 평균을 결정하고, MAF 비의 가중 평균에 기초하여, MAF 비의 가중 평균과 연관된 신뢰 구간을 결정하고, 분자 반응 점수로서, MAF 비의 가중 평균 및 신뢰 구간을 산출하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고, 제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고, 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율을 결정하고, 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 돌연변이체 대립유전자 분율을 결정하고, 제1 돌연변이체 대립유전자 분율 및 제2 돌연변이체 대립유전자 분율에 기초하여, 분자 반응 점수를 결정하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고, 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈(Clonal Hematopoiesis of Indeterminate Potential) (CHIP) 변이체로서 결정하고, 복수의 변이체로부터, 적어도 하나의 CHIP 변이체를 제거하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율을 결정하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 돌연변이체 대립유전자 분율을 결정하고, 제1 돌연변이체 대립유전자 분율 및 제2 돌연변이체 대립유전자 분율에 기초하여, 분자 반응 점수를 결정하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고, 제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고, 복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고, 복수의 변이체로부터, 적어도 하나의 CHIP 변이체를 제거하고, 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율을 결정하고, 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 돌연변이체 대립유전자 분율을 결정하고, 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 돌연변이체 대립유전자 분율 및 제2 돌연변이체 대립유전자 분율에 기초하여, MAF 비를 결정하고, 대상체에 대해, MAF 비의 가중 평균을 결정하고, MAF 비의 가중 평균에 기초하여, MAF 비의 가중 평균과 연관된 신뢰 구간을 결정하고, 분자 반응 점수로서, MAF 비의 가중 평균 및 신뢰 구간을 산출하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고, 제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고, 복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고, 복수의 변이체로부터, 적어도 하나의 CHIP 변이체를 제거하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 MAF를 결정하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 MAF 및 제2 MAF에 기초하여, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균을 결정하고, 대상체에 대해, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비를 결정하고, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비에 기초하여, 신뢰 구간을 결정하고, 분자 반응 점수로서, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간을 산출하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전의 제1 시점에서 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후의 제2 시점에서 결정되고, 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고, 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 시점에서의 제1 돌연변이체 대립유전자 분율 (MAF) 및 제2 시점에서의 제2 MAF에 기초하여, 제1 MAF의 제1 중심 경향성 척도 및 제2 MAF의 제2 중심 경향성 척도를 결정하고, 제1 시점에서의 제1 중심 경향성 척도 대 제2 시점에서의 제2 중심 경향성 척도의 비를 결정하고, 분자 반응 점수로서, 제1 시점에서의 제1 중심 경향성 척도 대 제2 시점에서의 제2 중심 경향성 척도의 비를 산출하는 것을 포함한다.
한 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 방법을 제공한다. 방법은 (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 각각의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하는 것을 포함한다. 방법은 (b) 컴퓨터에 의해, 복수의 변이체 내의 각각의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 각각의 MAF 비에 대한 상응하는 표준 편차를 생성하는 것을 또한 포함한다. 또한, 방법은 (c) 컴퓨터에 의해, MAF 비의 가중 평균 및 신뢰 구간을 계산함으로써, 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 또한 포함한다.
또 다른 측면에서, 본 개시내용은 대상체에서 암을 치료하는 방법을 제공한다. 방법은 (a) 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 각각의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하는 것을 포함한다. 방법은 (b) 복수의 변이체 내의 각각의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 각각의 MAF 비에 대한 상응하는 표준 편차를 생성하는 것을 또한 포함한다. 방법은 (c) MAF 비의 가중 평균 및 신뢰 구간을 계산하여 대상체에 대한 분자 반응 점수를 결정하는 것을 또한 포함한다. 또한, 방법은 (d) 적어도 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여함으로써, 대상체에서 암을 치료하는 것을 또한 포함한다.
또 다른 측면에서, 본 개시내용은 대상체에서 암을 치료하는 방법을 제공한다. 방법은 적어도 대상체에 대한 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여하는 것을 포함한다. 분자 반응 점수는 (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 각각의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하고; (b) 컴퓨터에 의해, 복수의 변이체 내의 각각의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 각각의 MAF 비에 대한 상응하는 표준 편차를 생성하고; (c) 컴퓨터에 의해, MAF 비의 가중 평균 및 신뢰 구간을 계산하여 대상체에 대한 분자 반응 점수를 결정하는 것에 의해 생성된다.
또 다른 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 방법을 제공한다. 방법은 (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 각각의 복수의 변이체에 대한 종양 분율 변화에 대한 종양 부하 변화 (R) P(R)을 결정하여 종양 부하 변화의 세트를 생성하는 것을 포함한다. 방법은 (b) 컴퓨터에 의해, 종양 부하 변화의 세트로부터 하나 이상의 클론성 조혈 변이체에 상응하는 하나 이상의 저항성 시그니쳐를 확인함으로써, 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 것을 또한 포함한다.
또 다른 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 방법을 제공한다. 방법은 (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 각각의 복수의 변이체에 대한 종양 분율 변화에 대한 확률 밀도 함수 P(R)을 계산하는 것을 포함한다. 방법은 (b) 컴퓨터에 의해, 변이체의 하나 이상을 P(R)에 의해 하나 이상의 클론으로 그룹화하고, (c) 컴퓨터에 의해, 각각의 클론에 대한 갱신된 P(R)을 생성하는 것을 또한 포함한다. 또한, 방법은 (d) 컴퓨터에 의해, 미리 결정된 임계치 값 이상의 제1 및 제2 시점 사이의 분율 변화를 갖는 하나 이상의 클론을 확인함으로써, 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 것을 또한 포함한다. 일부 이러한 실시양태에서, 방법은 주어진 변이체의 쌍이 동일한 분율 변화를 나타낼 가능도를 결정하고, 가장 가능성 있는 변이체의 쌍을 하나의 클론으로 병합하고, 하나의 클론에 대한 P(R)을 갱신하는 것을 포함한다.
또 다른 측면에서, 본 개시내용은 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에서 배선 변이체를 확인하는 방법을 제공한다. 방법은 (a) 컴퓨터에 의해, 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 주어진 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하는 것을 포함한다. 방법은 (b) 컴퓨터에 의해, 주어진 변이체의 MAF가 샘플의 최대 MAF를 증가시키는 경우 (샘플은 최대 배수체 유전자의 분율 (max frac_diploid)을 포함함) 및/또는 주어진 변이체의 MAF가 대상체로부터 수득된 샘플로부터 결정된 하나 이상의 다른 MAF보다 적어도 약 2배 더 크거나, 3배 더 크거나, 4배 더 크거나, 5배 더 크거나, 6배 더 크거나, 7배 더 크거나, 8배 더 크거나, 9배 더 크거나, 또는 그 초과인 경우, 주어진 변이체가 배선 변이체인 것을 확인함으로써, 암을 갖는 대상체에서 배선 변이체를 확인하는 것을 또한 포함한다.
일부 실시양태에서, 본원에 개시된 방법은 암을 갖는 대상체에 대한 분자 반응 점수를 미리 결정된 컷오프 포인트와 비교하여, 분자 반응 점수가 미리 결정된 컷오프 포인트 미만인 경우 대상체가 암에 대한 하나 이상의 요법에 대한 가능성 있는 반응자인 것 또는 분자 반응 점수가 미리 결정된 컷오프 포인트 이상인 경우 대상체가 암에 대한 하나 이상의 요법에 대한 가능성 있는 비-반응자인 것을 확인하는 것을 포함한다. 일부 실시양태에서, 하나 이상의 요법은 하나 이상의 면역요법을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 중단하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 하나 이상의 요법을 권장하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 하나 이상의 요법을 중단할 것을 권장하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 분자 반응 점수를 대상체에 대한 예후적 바이오마커 및/또는 예측적 바이오마커로서 사용하는 것을 포함한다.
일부 실시양태에서, 본원에 개시된 방법은 분자 카운트를 사용하여 MAF 비의 세트 내의 각각의 MAF 비에 대한 표준 편차를 계산하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 MAF 비의 세트 내의 각각의 MAF 비를 통해 분산을 전파하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하는 경우 하나 이상의 배선 및/또는 클론성 조혈 변이체를 배제하는 것을 포함한다. 일부 실시양태에서, 복수의 변이체는 체세포 핵산 변이체를 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 제1 및 제2 시점 양쪽 모두에서 약 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 미만인 MAF를 갖는 하나 이상의 체세포 변이체를 배제하는 것을 포함한다. 일부 실시양태에서, 제1 시점은 치료전 시점을 포함하고, 여기서 제2 시점은 치료중 또는 치료후 시점을 포함한다.
일부 실시양태에서, 본원에 개시된 방법은 샘플 내의 하나 이상의 조직 또는 세포로부터 수득된 핵산 분자로부터 서열 정보를 생성하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 대상체로부터 수득된 샘플 내의 무세포 핵산 (cfNA)으로부터 서열 정보를 생성하는 것을 포함한다. 일부 실시양태에서, cfNA는 순환 종양 DNA (ctDNA)를 포함한다.
일부 실시양태에서, 비는 복수의 변이체 내의 각각의 변이체에 대한 제2 MAF 대 제1 MAF를 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 하기 식을 사용하여 MAF 비의 가중 평균을 계산하는 것을 포함한다:
합계[중량 * 비]/합계[중량]
여기서 중량은 복수의 변이체 내의 주어진 변이체에 대한 1/범위2이고, 여기서 범위는 복수의 변이체 내의 주어진 변이체에 대한 제1 및 제2 MAF의 값 사이의 차이이고, 비는 MAF 비의 세트 내의 주어진 MAF 비이다. 일부 실시양태에서, 본원에 개시된 방법은 하기 식을 사용하여 신뢰 구간을 계산하는 것을 포함한다:
MAF 비의 가중 평균 +/- sqrt[비 분산],
여기서 비 분산은 1/합계[중량]이다.
일부 실시양태에서, 변이체는 하나 이상의 단일-뉴클레오티드 변이체 (SNV), 삽입/결실 돌연변이 (인델), 유전자 증폭, 및/또는 유전자 융합을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 하나 이상의 추가의 게놈 데이터 공급원을 사용하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 포함한다. 일부 실시양태에서, 추가의 게놈 데이터 공급원은 커버리지, 오프-타겟 커버리지, 후성유전학적 시그니쳐, 및/또는 미세부수체 불안정성 점수 중 하나 이상을 포함한다. 일부 실시양태에서, 후성유전학적 시그니쳐는 cfNA 단편 길이, 위치, 및/또는 종점 밀도 분포를 포함한다. 일부 실시양태에서, 후성유전학적 시그니쳐는 주어진 표적화된 게놈 영역 내의 하나 이상의 후성유전학적 유전자좌에 의해 나타내어지는 후성유전학적 상태 또는 상황을 포함한다. 일부 실시양태에서, 후성유전학적 상태 또는 상황은 메틸화, 히드록시메틸화, 아세틸화, 유비퀴틸화, 인산화, 수모일화, 리보실화, 시트룰린화, 및/또는 히스톤 번역후 변형 또는 다른 히스톤 변이의 존재 또는 부재를 포함한다.
본 출원은 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는데 유용한 방법, 컴퓨터 판독가능 매체, 및 시스템을 개시한다. 클론성 조혈 및/또는 배선 변이체를 확인하는 관련 방법이 또한 개시된다. 개시된 방법, 시스템, 및/또는 조성물의 추가의 이점은 부분적으로 이어지는 설명에 제시될 것이고, 부분적으로 설명으로부터 이해될 것이거나, 또는 개시된 방법 및 조성물의 실시에 의해 학습될 수 있다. 개시된 방법 및 조성물의 이점은 첨부된 청구범위에 특히 지적된 요소 및 조합에 의해 실현되고 달성될 것이다. 상기 일반적 설명 및 하기 상세한 설명 양쪽 모두는 단지 예시적이고 설명적이며, 청구된 바와 같은 본 발명을 제한하지 않음을 이해하여야 한다.
본 명세서에 포함되고 그의 일부를 구성하는 첨부된 도면은 개시된 방법 및 조성물의 몇몇 실시양태를 예시하며, 설명과 함께, 개시된 방법 및 조성물의 원리를 설명하는 역할을 한다.
도 1은 예시 방법을 제시한다.
도 2는 예시 방법을 제시한다.
도 3은 예시 방법을 제시한다.
도 4는 예시 방법을 제시한다.
도 5는 예시 방법을 제시한다.
도 6A는 예시 방법을 제시한다.
도 6B는 예시 방법을 제시한다.
도 7은 예시 방법을 제시한다.
도 8은 예시 방법을 제시한다.
도 9는 예시 방법을 제시한다.
도 10은 예시 방법을 제시한다.
도 11은 예시 방법을 제시한다.
도 12A는 예시 방법을 제시한다.
도 12B는 예시 방법을 제시한다.
도 13은 예시 방법을 제시한다.
도 14는 예시 방법을 제시한다.
도 15는 예시 방법을 제시한다.
도 16은 예시 방법을 제시한다.
도 17은 예시 방법을 제시한다.
도 18은 예시 방법을 제시한다.
도 19는 예시 방법을 제시한다.
도 20은 예시 방법을 제시한다.
도 21은 예시 시스템을 제시한다.
도 22는 패널 공간 내의 샘플당 검출된 체세포 변이체의 수를 제시한다.
도 23은 MR 결과를 왜곡시킬 수 있는 체세포 분류 불일치의 예를 제시한다.
도 24A 내지 24F는 돌연변이체 분자 카운트 (MMC = VAF * 분자 커버리지)에 의해 결정된 변이체 정밀도의 예를 제시한다. (A) 변이체는 샘플 투입 및 패널 디자인에 따라, 다양한 분자 커버리지를 갖는다. 변이체 검출의 확률 (B) 및 VAF 정밀도 (C)는 VAF 및 분자 커버리지 (색상, (A)에 맵핑) 양쪽 모두에 좌우된다. MMC (D)는, 그것이 변이체 검출의 확률 (E)을 결정하기 때문에, 변이체 정밀도에 대한 보다 좋은 계량이다. VAF 정밀도 (F).
도 25A 내지 25C는 비의 평균, m(rVAF), 또는 최대값의 비, R(maxVAF)를 사용하는 경우 소수의 변이체가 종양 신호를 능가할 수 있음을 제시한다. (A) MR 점수는 증가, 감소 또는 정밀도 한계 내 ("거의 0% 변화")로서 카테고리화된다. (B)는 방법에 의한 환자 분자 반응 점수를 제시한다. (C) R(mVAF) 단지 기준선 평가가능한 변이체 (Y-축) 대 R(mVAF) 모든 평가가능한 변이체의 그래프. 어두운 원은 평가가능하고; 보다 밝은 원 (x-축에 걸쳐 라인으로 보여짐)은 평가가능하지 않다.
도 26A 내지 26C는 분자 반응 점수의 확실성이 변이체의 수 (A), 분자 커버리지 (B), 및 최대 VAF (C)가 증가함에 따라 증가하는 예를 제시한다.
도 27A 및 27B는 변이체 궤적의 이론적 예를 갖는, 임상적 샘플 (A) 및 기술적 반복실험 (널(null) 분포) (B)에 대한 분자 반응 점수의 히스토그램을 제시한다.
도 28은 분자 반응 점수의 예시 결정을 제시한다.
개시된 방법 및 조성물은 하기 특정한 실시양태의 상세한 설명 및 본원에 포함된 실시예 및 도면 및 그들의 이전 및 이후 설명을 참고로 보다 용이하게 이해될 수 있다.
달리 특정되지 않는 한, 개시된 방법 및 조성물은 구체적인 합성 방법, 구체적인 분석 기술, 또는 특정한 시약에 제한되지 않으며, 따라서, 다양할 수 있음을 이해하여야 한다.
I. 정의
본원에 사용된 용어는 단지 특정한 실시양태를 설명하기 위한 목적을 위한 것이며, 제한적인 것으로 의도되지 않음을 또한 이해하여야 한다. 또한, 달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시내용이 관련되는 관련 기술 분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 방법, 컴퓨터 판독가능 매체, 및 시스템을 설명하고 청구하는데 있어서, 하기 용어 및 그의 문법적 파생어는 하기 제시된 정의에 따라 사용될 것이다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수형 형태는 맥락적으로 명백하게 달리 지시되지 않는 한 복수의 지시대상을 포함한다. 따라서, 예를 들어, "방법"에 대한 언급은 본원에 기술되고/거나 본 개시내용의 판독 시 관련 기술 분야의 통상의 기술자에게 명백해질 유형의 하나 이상의 방법 및/또는 단계 등을 포함한다. 본 개시내용에서 논의된 온도, 농도, 시간, 염기 또는 염기 쌍의 수, 커버리지 등 앞에는, 약간의 및 비실질적인 등가물이 본 개시내용의 범위 내에 있도록, "약"이 암시됨이 또한 인정될 것이다. 본 출원에서, 단수의 사용은 구체적으로 달리 언급되지 않는 한, 복수를 포함한다. 또한, "포함하다(comprise)", "포함하다(comprises)", "포함하는(comprising)", "함유하다(contain)", "함유하다(contains)", "함유하는(containing)", "포함하다(include)", "포함하다(includes)", 및 "포함하는(including)"의 사용은 제한적인 것으로 의도되지 않는다.
약: 본원에서 사용된 바와 같이, 하나 이상의 관심 값 또는 요소에 적용된 바와 같은 "약" 또는 "대략적으로"는 언급된 기준 값 또는 요소와 유사한 값 또는 요소를 지칭한다. 특정 실시양태에서, 용어 "약" 또는 "대략적으로"는 달리 언급되거나 또는 맥락으로부터 달리 명백하지 않는 한 언급된 기준 값 또는 요소의 어느 한 쪽 방향 (초과 또는 미만)으로의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 이하에 속하는 범위의 값 또는 요소를 지칭한다 (이같은 숫자가 가능한 값 또는 요소의 100%를 초과할 경우는 제외함).
어댑터: 본원에서 사용된 바와 같이, "어댑터"는 전형적으로 적어도 부분적으로 이중-가닥이고, 주어진 샘플 핵산 분자의 한쪽 또는 양쪽 단부에 연결되도록 사용되는 짧은 핵산 (예를 들어, 약 500개 미만, 약 100개 미만 또는 약 50개 미만의 뉴클레오티드의 길이)을 지칭한다. 어댑터는 양쪽 단부에 어댑터가 플랭킹된 핵산 분자의 증폭을 허용하는 핵산 프라이머 결합 부위, 및/또는 시퀀싱 용도, 예컨대 다양한 차세대 시퀀싱 (NGS) 용도를 위한 프라이머 결합 부위를 포함하는 시퀀싱 프라이머 결합 부위를 포함할 수 있다. 어댑터는 포획 프로브, 예컨대 유동 셀 지지체 등에 부착된 올리고뉴클레오티드에 대한 결합 부위를 또한 포함할 수 있다. 어댑터는 본원에 기술된 바와 같은 핵산 태그를 또한 포함할 수 있다. 핵산 태그가 주어진 핵산 분자의 앰플리콘 및 시퀀싱 판독물 내에 포함되도록, 핵산 태그는 전형적으로 증폭 프라이머 및 시퀀싱 프라이머 결합 부위에 대해 상대적으로 위치한다. 핵산 분자의 각각의 단부에 동일하거나 상이한 어댑터가 연결될 수 있다. 특정 실시양태에서, 핵산 태그가 상이한 것을 제외하고는 핵산 분자의 각각의 단부에 동일한 어댑터가 연결된다. 일부 실시양태에서, 어댑터는 1개의 단부가 핵산 분자 (또한 평활 단부이거나 하나 이상의 상보적인 뉴클레오티드 꼬리가 있음)에 연결하기 위해 본원에 기술된 바와 같이 평활 단부이거나 또는 꼬리가 있는 Y형 어댑터이다. 또 다른 예시적인 실시양태에서, 어댑터는 분석될 핵산 분자에 연결하기 위한 평활 또는 꼬리 단부를 포함하는 벨 형상의 어댑터이다. 다른 예시적인 어댑터는 T-꼬리 및 C-꼬리 어댑터를 포함한다.
투여하다: 본원에서 사용된 바와 같이, 치료제 (예를 들어, 면역 치료제)를 대상체에게 "투여하다" 또는 "투여함"은 조성물을 대상체에게 제공하거나, 적용하거나 또는 그와 접촉시키는 것을 의미한다. 투여는 예를 들어, 국소, 경구, 피하, 근육내, 복강내, 정맥내, 경막내 및 진피내를 포함하는 임의의 다수의 경로에 의해 달성될 수 있다.
대립유전자: 본원에서 사용된 바와 같이, "대립유전자" 또는 "대립유전자 변이체"는 정의된 게놈 위치 또는 유전자좌에서 특이적인 유전자 변이체를 지칭한다. 대립유전자 변이체는, 대립유전자가 이형접합성인지 동형접합성인지 여부에 따라, 50% (0.5) 또는 100%의 빈도에서 통상적으로 제시된다. 예를 들어, 배선 변이체는 유전되고, 0.5 또는 1의 빈도를 통상적으로 갖는다. 그러나, 체세포 변이체는 획득된 변이체이고, < 0.5의 빈도를 통상적으로 갖는다. 유전자의 유전자좌의 주요 및 부수 대립유전자는 유전자좌가 각각 기준 서열의 뉴클레오티드, 및 기준 서열과는 상이한 변이체 뉴클레오티드에 의해 점유된 유전자좌를 보유하는 핵산을 지칭한다. 유전자좌에서의 측정은 대립유전자가 샘플에서 관찰되는 빈도를 측정하는 대립유전자 분율 (AF)의 형태를 취할 수 있다.
증폭시키다: 본원에서 사용된 바와 같이, 핵산의 맥락에서의 "증폭시키다" 또는 "증폭"은 전형적으로 소량의 폴리뉴클레오티드 (예를 들어, 단일 폴리뉴클레오티드 분자)에서 시작되는, 폴리뉴클레오티드 또는 폴리뉴클레오티드의 부분의 다중 카피의 생산을 지칭하고, 여기서 증폭 생성물 또는 앰플리콘은 일반적으로 검출가능하다. 폴리뉴클레오티드의 증폭은 다양한 화학적 및 효소적 프로세스를 포함한다.
바코드: 본원에서 사용된 바와 같이, 핵산의 맥락에서의 "바코드"는 분자 식별자로서의 역할을 할 수 있는 서열을 포함하는 핵산 분자를 지칭한다. 예를 들어, 최종 데이터 분석 전에 각각의 판독물이 확인 및 분류될 수 있도록 개별적인 "바코드" 서열이 차세대 시퀀싱 (NGS) 라이브러리 제조 동안 각각의 DNA 단편에 전형적으로 부가된다.
암 유형: 본원에서 사용된 바와 같이, "암", "암 유형" 또는 "종양 유형"은 예를 들어, 조직병리학에 의해 정의되는 암의 유형 또는 하위유형을 지칭한다. 암 유형은 임의의 통상적인 기준에 의해, 예컨대 주어진 조직에서의 발생 (예를 들어, 혈액암, 중추신경계 (CNS), 뇌암, 폐암 (소세포 및 비-소세포), 피부암, 비암, 인후암, 간암, 골암, 림프종, 췌장암, 장암, 직장암, 갑상선암, 방광암, 신장암, 구강암, 위암, 유방암, 전립선암, 난소암, 폐암, 장암, 연질조직암, 신경내분비암, 위식도암, 두경부암, 부인과 암, 결장직장암, 요로상피암, 고형 상태 암, 이질성 암, 동질성 암), 미지의 원발성 기원 등, 및/또는 동일한 세포 계통 (예를 들어, 암종, 육종, 림프종, 담관암종, 백혈병, 중피종, 흑색종, 또는 교모세포종) 및/또는 암 마커, 예컨대 Her2, CA15-3, CA19-9, CA-125, CEA, AFP, PSA, HCG, 호르몬 수용체 및 NMP-22를 나타내는 암에 기초하여 정의될 수 있다. 암은 병기 (예를 들어, 1기, 2기, 3기 또는 4기) 및 원발성인지 또는 속발성인지 여부에 의해서 분류될 수도 있다.
무세포 핵산: 본원에서 사용된 바와 같이, "무세포 핵산"은 세포 내에 함유되거나 또는 다른 방식으로 세포에 결합되지 않은 핵산을 지칭하거나, 또는 일부 실시양태에서는 무손상 세포의 제거 후에 샘플 내에 남아 있는 핵산을 지칭한다. 무세포 핵산은, 예를 들어, 출처가 대상체로부터의 체액 (예를 들어, 혈액, 혈장, 혈청, 소변, 뇌척수액 (CSF) 등)인 모든 비-캡슐화 핵산을 포함할 수 있다. 무세포 핵산은 게놈 DNA, 미토콘드리아 DNA, 순환 DNA, siRNA, miRNA, 순환 RNA (cRNA), tRNA, rRNA, 소형 핵소체 RNA (snoRNA), 피위(Piwi)-상호작용 RNA (piRNA), 긴 비-코딩 RNA (긴 ncRNA), 및/또는 이들 중 임의의 것의 단편을 포함하여, DNA (cfDNA), RNA (cfRNA), 및 이의 하이브리드를 포함한다. 무세포 핵산은 이중-가닥, 단일-가닥, 또는 이의 하이브리드일 수 있다. 무세포 핵산은 분비 또는 세포 사망 프로세스, 예를 들어, 세포 괴사, 아팝토시스 등을 통해 체액 내로 방출될 수 있다. 무세포 핵산은 에페로좀 또는 엑소좀에서 발견될 수 있다. 일부 무세포 핵산, 예를 들어, 순환 종양 DNA (ctDNA)는 암 세포로부터 체액 내로 방출된다. 다른 것들은 건강한 세포로부터 방출된다. ctDNA는 캡슐화되지 않은, 종양에서 유래된 단편화 DNA일 수 있다. 무세포 핵산의 또 다른 예는 무세포 태아 DNA (cffDNA)로도 지칭되는, 모체 혈류에서 자유롭게 순환하는 태아 DNA이다. 무세포 핵산은 하나 이상의 후성유전학적 변형이 있을 수 있고, 예를 들어, 무세포 핵산은 아세틸화, 5-메틸화, 유비퀴틸화, 인산화, 수모일화, 리보실화 및/또는 시트룰린화될 수 있다.
분류자: 본원에서 사용된 바와 같이, "분류자"는 입력으로서, 시험 데이터를 수신하고, 출력으로서, 입력 데이터의 분류를 하나 또는 또 다른 부류 (예를 들어, 종양 DNA 또는 비-종양 DNA)에 속하는 것으로서 생성하는 알고리즘 컴퓨터 코드를 일반적으로 지칭한다.
클론성: 본원에서 사용된 바와 같이, 핵산의 맥락에서의 "클론성"은 적어도 주어진 관심 유전자좌 (예를 들어, 표적 변이체)에서 서로 실질적으로 또는 완전히 동일한 뉴클레오티드 서열을 포함하는 핵산의 집단을 지칭한다.
잠재성 불명 클론성 조혈: 본원에서 사용된 바와 같이, "잠재성 불명 클론성 조혈", "클론성 조혈 변이체", 또는 "CHIP"는 하나 이상의 체세포 돌연변이 (예를 들어, 혈액암-연관 돌연변이 및/또는 비-암-연관 돌연변이)를 포함하지만, 다른 방식으로 혈액 악성종양에 대한 진단 기준, 예컨대 형성이상의 확정적 형태학적 증거를 결여하는 조혈 줄기 세포의 확장을 수반하는 개체에서의 조혈을 지칭한다. CHIP는 조혈 줄기 세포가 혈액 세포의 유전적으로 특유의 하위집단의 형성에 기여하는 통상적인 연령-관련 현상이다.
신뢰 구간: 본원에서 사용된 바와 같이, "신뢰 구간" 또는 "신뢰의 수준"은 주어진 파라미터의 값이 그 값의 범위 내에 있는 특정된 확률이 있는 그렇게 정의된 값의 범위를 의미한다.
카피 수 변이체: 본원에서 사용된 바와 같이, "카피 수 변이체", "CNV", 또는 "카피 수 변이"는 게놈의 섹션이 반복되고, 게놈 내의 반복부의 수가 고려 하의 집단 내의 개체 사이에 다양한 현상을 지칭한다.
커버리지: 본원에서 사용된 바와 같이, "커버리지"는 특정한 염기 위치를 나타내는 핵산 분자의 수를 지칭한다.
데옥시리보핵산 또는 리보핵산: 본원에서 사용된 바와 같이, "데옥시리보핵산" 또는 "DNA"는 당 모이어티의 2'-위치에 수소 기를 갖는 천연 또는 변형 뉴클레오티드를 지칭한다. 전형적으로 DNA는 4가지 유형의 뉴클레오티드 염기를 포함하는 뉴클레오티드 쇄를 포함한다; 아데닌 (A), 티민 (T), 시토신 (C), 및 구아닌 (G). 본원에서 사용된 바와 같이, "리보핵산" 또는 "RNA"는 당 모이어티의 2'-위치에 히드록실 기를 갖는 천연 또는 변형 뉴클레오티드를 지칭한다. 전형적으로 RNA는 4가지 유형의 뉴클레오티드 염기를 포함하는 뉴클레오티드 쇄를 포함한다; A, 우라실 (U), G, 및 C. 본원에서 사용된 바와 같이, 용어 "뉴클레오티드"는 천연 뉴클레오티드 또는 변형 뉴클레오티드를 지칭한다. 특정한 뉴클레오티드 쌍은 상보적인 방식으로 서로 특이적으로 결합한다 (상보적 염기 쌍 형성으로 지칭됨). DNA에서는, 아데닌 (A)이 티민 (T)과 쌍을 형성하고, 시토신 (C)이 구아닌 (G)과 쌍을 형성한다. RNA에서, 아데닌 (A)이 우라실 (U)과 쌍을 형성하고, 시토신 (C)이 구아닌 (G)과 쌍을 형성한다. 제1 핵산 가닥이 제1 가닥 내의 것과 상보적인 뉴클레오티드로 구성된 제2 핵산 가닥에 결합하는 경우, 2개의 가닥이 결합하여 이중 가닥을 형성한다. 본원에서 사용된 바와 같이, "핵산 시퀀싱 데이터", "핵산 시퀀싱 정보", "서열 정보", "핵산 서열", "뉴클레오티드 서열", "게놈 서열", "유전자 서열", 또는 "단편 서열", 또는 "핵산 시퀀싱 판독물"은 핵산, 예컨대 DNA 또는 RNA의 분자 (예를 들어, 전체 게놈, 전체 트랜스크립톰, 엑솜, 올리고뉴클레오티드, 폴리뉴클레오티드, 또는 단편) 내의 뉴클레오티드 염기 (예를 들어, 아데닌, 구아닌, 시토신, 및 티민 또는 우라실)의 순서 및 신원을 지시하는 임의의 정보 또는 데이터를 나타낸다. 본 교시내용이 모세관 전기영동, 마이크로어레이, 라이게이션-기반 시스템, 중합효소-기반 시스템, 혼성화-기반 시스템, 직접적 또는 간접적 뉴클레오티드 확인 시스템, 파이로시퀀싱, 이온- 또는 pH-기반 검출 시스템, 및 전자 서명-기반 시스템을 포함하지만 이에 제한되지 않는, 모든 이용가능한 종류의 기법, 플랫폼 또는 기술을 사용하여 수득된 서열 정보를 구상한다는 것을 이해하여야 한다.
검출하다: 본원에서 사용된 바와 같이, "검출하다", "검출함", 또는 "검출"은 샘플 내의 하나 이상의 표적 핵산 (예를 들어, 표적화된 돌연변이 또는 다른 마커를 갖는 핵산)의 존재(existence) 또는 존재(presence)를 결정하는 활동을 지칭한다.
풍부화된 샘플: 본원에서 사용된 바와 같이, "풍부화된 샘플"은 특이적인 관심 영역에 대해 풍부화된 샘플을 지칭한다. 샘플은 관심 영역을 증폭시킴으로써 또는 관심 핵산 분자에 혼성화할 수 있는 단일-가닥 DNA/RNA 프로브 또는 이중 가닥 DNA 프로브 (예를 들어, 슈어셀렉트(SureSelect)® 프로브, 애질런트 테크놀로지스(Agilent Technologies))를 사용함으로써 풍부화될 수 있다. 일부 실시양태에서, 풍부화된 샘플은 풍부화된 프로세싱된 샘플의 하위세트 또는 부분을 지칭하고, 여기서 풍부화된 프로세싱된 샘플의 하위세트 또는 부분은 무세포 폴리뉴클레오티드 또는 폴리뉴클레오티드의 샘플로부터의 핵산 분자를 함유한다.
후성유전학적 정보: 본원에서 사용된 바와 같이, DNA 중합체의 맥락에서의 "후성유전학적 정보"는 그 중합체에서 나타내어지는 하나 이상의 후성유전학적 패턴 또는 시그니쳐를 의미한다.
후성유전학적 유전자좌: 본원에서 사용된 바와 같이, "후성유전학적 유전자좌" 또는 "후성유전학적 부위"는 뉴클레오티드 서열의 변화 또는 변경을 수반하지 않는 상이한 상태 또는 상황을 나타내는 염색체 상의 고정된 위치를 의미한다. 의심을 피하기 위해, 주어진 후성유전학적 유전자좌는 유전자 또는 서열 변이 (예를 들어, 돌연변이)를 또한 나타내는 주어진 뉴클레오티드 위치 또는 게놈 영역과 일치할 수 있다. 예를 들어, 주어진 후성유전학적 유전자좌는 아세틸화, 메틸화 (예를 들어, 5-메틸시토신 (5mC)으로 변형 및/또는 5-히드록시메틸시토신 (5hmC)으로 변형 등), 유비퀴틸화, 인산화, 수모일화, 리보실화, 시트룰린화되거나, 히스톤 번역후 변형 또는 다른 히스톤 변이 등을 가질 수 있거나 그렇지 않을 수 있다.
후성유전학적 시그니쳐: 본원에서 사용된 바와 같이, "후성유전학적 시그니쳐"는 주어진 DNA 분자에서 하나 이상의 후성유전학적 유전자좌에 의해 나타내어지는 후성유전학적 상태 또는 상황을 의미한다. 예를 들어, 주어진 게놈 영역 또는 유전자좌 (예를 들어, CTCF 결합 영역 등)를 포함하는 DNA 분자 또는 cfDNA 단편은 그러한 DNA 분자의 일부가 메틸화된 특정 수의 후성유전학적 유전자좌를 포함하는 반면, 다른 경우에 동일한 게놈 영역을 포함하는 다른 DNA 분자 또는 cfDNA 단편 내의 상응하는 후성유전학적 유전자좌는 비메틸화되는 후성유전학적 패턴을 또한 나타낼 수 있다.
배선 돌연변이: 본원에서 사용된 바와 같이, "배선 돌연변이"는 수정 전에 존재하는 배 세포 내의 핵산 내의 돌연변이를 의미한다.
면역요법: 본원에서 사용된 바와 같이, "면역요법"은 암 세포를 죽이거나 또는 적어도 암 세포의 성장을 억제하고, 바람직하게는 암의 추가 성장을 감소시키고/거나, 암의 크기를 감소시키고/거나 암을 제거하도록 면역계를 자극하는 작용을 하는 하나 이상의 작용제로의 치료를 지칭한다. 일부 이같은 작용제는 암 세포 상에 존재하는 표적에 결합하고; 일부는 면역 세포 상에 존재하고 암 세포 상에는 존재하지 않는 표적에 결합하며; 일부는 암 세포 및 면역 세포 양쪽 모두에 존재하는 표적에 결합한다. 이같은 작용제는 체크포인트 억제제 및/또는 항체를 포함하지만, 이에 제한되지 않는다. 체크포인트 억제제는 자가-내성을 유지하고 말초 조직에서의 생리학적 면역 반응의 기간 및 진폭을 조정하여 부차적인 조직 손상을 최소화하는 면역계 경로의 억제제이다 (예를 들어, 문헌 [Pardoll, Nature Reviews Cancer 12, 252-264 (2012)]을 참조한다). 예시적인 작용제는 PD-1, PD-2, PD-L1, PD-L2, CTLA-4, OX40, B7.1, B7He, LAG3, CD137, KIR, CCR5, CD27, CD40 또는 CD47 중 임의의 것에 대한 항체를 포함한다. 다른 예시적인 작용제는 염증유발성 시토카인, 예컨대 IL-1β, IL-6, 및 TNF-α를 포함한다. 다른 예시적인 작용제는 종양에 대해 활성화된 T-세포, 예컨대 T-세포가 인식하는 종양 항원을 표적화하는 키메라 항원을 발현하는 것에 의해 활성화된 T-세포이다.
인델: 본원에서 사용된 바와 같이, "인델"은 대상체의 게놈 내의 뉴클레오티드 위치의 삽입 또는 결실을 수반하는 돌연변이를 지칭한다.
최대 돌연변이체 대립유전자 빈도: 본원에서 사용된 바와 같이, "최대 돌연변이체 대립유전자 빈도", "최대 변이체 대립유전자 빈도", "최대 MAF", "MAX MAF", "최대 VAF", "max-MAF" 또는 "MAX VAF"는 주어진 샘플에 존재하거나 그에서 관찰된 모든 체세포 변이체의 최대 또는 가장 큰 MAF를 지칭한다.
돌연변이체 대립유전자 빈도: 본원에서 사용된 바와 같이, "돌연변이체 대립유전자 빈도", "변이체 대립유전자 빈도", "돌연변이체 대립유전자 분율", "변이체 대립유전자 분율", "MAF", 또는 "VAF"는 주어진 핵산의 집단, 예컨대 대상체로부터 수득된 샘플에서 돌연변이체 대립유전자가 발생하는 빈도를 지칭한다. MAF는 분율 또는 백분율로서 일반적으로 표현된다.
분자 반응: 본원에서 사용된 바와 같이, "분자 반응"은 상이한 시점에서 주어진 대상체로부터 취한 샘플 사이에서 관찰된 하나 이상의 순환 종양 DNA (ctDNA) 변이체 대립유전자 빈도, 수준, 또는 양의 변화를 지칭한다.
분자 반응자: 본원에서 사용된 바와 같이, "분자 반응자" 또는 "반응자"는 상이한 시점에서 대상체로부터 취한 샘플 사이에서 관찰되는 하나 이상의 순환 종양 DNA (ctDNA) 변이체 대립유전자 빈도, 수준, 또는 양의 감소를 지시하는 분자 반응 점수를 갖는 대상체를 지칭한다.
분자 비-반응자: 본원에서 사용된 바와 같이, "분자 비-반응자" 또는 "비-반응자"는 상이한 시점에서 대상체로부터 취한 샘플 사이에서 관찰되는 하나 이상의 순환 종양 DNA (ctDNA) 변이체 대립유전자 빈도, 수준, 또는 양의 증가, 또는 변화 없음을 지시하는 분자 반응 점수를 갖는 대상체를 지칭한다. 감소 (또는 증가)의 수준을 특정하는 임계치는 대상체가 분자 반응자인지 분자 비-반응자인지 여부를 결정하는데 이용될 수 있다. 예를 들어, 분자 반응자는 VAF의 특정 백분율 변화 초과의 감소와 연관된 대상체일 수 있고, 비-반응자는 VAF의 특정 백분율 변화 미만만큼의 증가, 또는 변화 없음, 또는 감소와 연관된 대상체일 수 있다.
돌연변이: 본원에서 사용된 바와 같이, "돌연변이", "핵산 변이체", "변이체", 또는 "유전자 이상"은 공지된 기준 서열로부터의 변이를 지칭하고, 예를 들어, 단일 뉴클레오티드 변이체 (SNV), 카피 수 변이체 또는 변이 (CNV)/이상, 삽입 또는 결실 (인델), 말단절단, 유전자 융합, 전환, 전위, 프레임 이동, 중복, 반복 확장, 및 후성유전학적 변이체와 같은 돌연변이를 포함한다. 돌연변이는 배선 또는 체세포 돌연변이일 수 있다. 일부 실시양태에서, 비교 목적을 위한 기준 서열은 시험 샘플을 제공하는 대상체의 종의 야생형 게놈 서열, 전형적으로 인간 게놈이다. 특정 경우에, 돌연변이 또는 변이체는 종양발생을 유발하거나 적어도 그에 기여하는 "종양-관련 유전자 변이체"이다.
차세대 시퀀싱: 본원에서 사용된 바와 같이, "차세대 시퀀싱" 또는 "NGS"는, 예를 들어, 한번에 수백개 내지 수천개의 비교적 작은 서열 판독물을 생성하는 능력이 있는, 전통적인 생어- 및 모세관 전기영동-기반 접근법에 비교하여 처리량이 증가된 시퀀싱 기술을 지칭한다. 차세대 시퀀싱 기법의 일부 예는 합성에 의한 시퀀싱, 라이게이션에 의한 시퀀싱, 및 혼성화에 의한 시퀀싱을 포함하지만, 이에 제한되지 않는다.
핵산 태그: 본원에서 사용된 바와 같이, "핵산 태그"는 상이한 유형이거나 또는 상이한 프로세싱이 진행된, 상이한 샘플들로부터의 핵산 (예를 들어, 샘플 색인을 나타냄), 또는 동일한 샘플 내의 상이한 핵산 분자들 (예를 들어, 분자 태그를 나타냄)을 구별하기 위해 핵산 분자를 표지하는데 사용되는 짧은 핵산 (예를 들어, 약 500개, 약 100개, 약 50개 또는 약 10개 미만의 뉴클레오티드의 길이)을 지칭한다. 핵산 태그는 단일 가닥이거나, 이중 가닥이거나, 또는 적어도 부분적으로 이중 가닥일 수 있다. 핵산 태그는 임의적으로 동일한 길이 또는 다양한 길이를 갖는다. 또한 핵산 태그는 하나 이상의 평활-단부를 갖는 이중-가닥 분자를 포함할 수 있고/거나, 5' 또는 3' 단일-가닥 영역 (예를 들어, 오버행)을 포함할 수 있고/거나, 주어진 분자 내의 다른 위치에 하나 이상의 다른 단일-가닥 영역을 포함할 수 있다. 핵산 태그는 다른 핵산 (예를 들어, 증폭 및/또는 시퀀싱될 샘플 핵산)의 한쪽 단부 또는 양쪽 단부에 부착될 수 있다. 핵산 태그를 판독하여, 주어진 핵산의 기원, 형태 또는 프로세싱의 샘플과 같은 정보를 밝힐 수 있다. 핵산 태그는 상이한 핵산 태그 및/또는 샘플 색인을 보유하는 핵산을 포함하는 다중 샘플의 풀링 및/또는 병렬 프로세싱을 가능하게 하는데 사용될 수도 있고, 여기서 핵산 태그를 판독하는 것에 의해 핵산이 후속적으로 디컨볼루션된다. 핵산 태그는 분자 식별자 또는 태그, 샘플 식별자, 색인 태그, 및/또는 바코드로도 지칭될 수 있다. 추가적으로 또는 대안적으로, 핵산 태그는 동일한 샘플 내의 상이한 분자를 구별하는데 사용될 수 있다. 이는 예를 들어, 주어진 샘플 내의 각각의 상이한 핵산 분자를 고유하게 태그부착하는 것, 또는 이같은 분자를 고유하지 않게 태그부착하는 것을 포함한다. 고유하지 않은 태그부착 적용의 경우에, 예를 들어, 이들이 적어도 하나의 핵산 태그와 조합으로 선택된 기준 게놈에 맵핑하는 출발/정지 위치에 기초하여 상이한 분자가 구별될 수 있도록, 제한된 수의 태그를 사용하여 각각의 핵산 분자를 태그부착할 수 있다. 전형적으로, 임의의 2개의 분자가 동일한 출발/정지 위치를 갖고 또한 동일한 핵산 태그를 가질 확률이 낮도록 (예를 들어, 약 10% 미만, 약 5% 미만, 약 1% 미만, 또는 약 0.1% 미만의 확률), 충분한 수의 상이한 핵산 태그가 사용된다. 일부 핵산 태그는 샘플을 표지하는 다중 분자 식별자, 샘플 내의 핵산 분자의 형태, 및 동일한 출발 및 정지 위치를 갖는 형태 내의 핵산 분자를 포함한다. 이같은 핵산 태그는 예시적인 형태 "A1i"를 사용하여 언급될 수 있으며, 여기서 대문자는 샘플 유형을 지시하고, 아라비아 숫자는 샘플 내의 분자의 형태를 지시하고, 소문자 로마자 숫자는 형태 내의 분자를 지시한다.
폴리뉴클레오티드: 본원에서 사용된 바와 같이, "폴리뉴클레오티드", "핵산", "핵산 분자", 또는 "올리고뉴클레오티드"는 뉴클레오시드간 연결에 의해 연결된 뉴클레오시드 (데옥시리보뉴클레오시드, 리보뉴클레오시드 또는 그의 유사체를 포함함)의 선형 중합체를 지칭한다. 전형적으로, 폴리뉴클레오티드는 적어도 3개의 뉴클레오시드를 포함한다. 올리고뉴클레오티드는 종종 크기 면에서 수개의 단량체 단위, 예를 들어, 3 내지 4개 내지 수백개의 단량체 단위의 범위이다. 폴리뉴클레오티드가 문자 서열, 예컨대 "ATGCCTG"로 표현되면, 뉴클레오티드가 왼쪽에서 오른쪽으로 5' → 3' 순서이고, DNA의 경우에, 달리 언급되지 않는 한, "A"는 데옥시아데노신을 표시하고, "C"는 데옥시시티딘을 표시하고, "G"는 데옥시구아노신을 표시하고, "T"는 데옥시티미딘을 표시한다는 것이 이해될 것이다. 관련 기술 분야에서 표준인 바와 같이, 문자 A, C, G, 및 T는 염기 자체, 뉴클레오시드, 또는 염기를 포함하는 뉴클레오티드를 지칭하는 데 사용될 수 있다.
기준 샘플: 본원에서 사용된 바와 같이, "기준 샘플" 또는 "기준 cfNA 샘플"은 분석 절차의 정확성을 평가하고/거나, 시험 샘플을 분류하는 등을 위해 시험 샘플과 함께 또는 그에 비해 분석되는 공지된 조성의 및/또는 특이적 특성 (예를 들어, 공지된 핵산 변이체(들), 공지된 세포 기원, 공지된 종양 분율, 공지된 커버리지 등)을 갖는 또는 갖거나 결여하는 것으로 공지된 샘플을 지칭한다. 기준 샘플 데이터세트는 전형적으로 적어도 약 25개 내지 적어도 약 30,000개 또는 그 초과의 기준 샘플을 포함한다. 일부 실시양태에서, 기준 샘플 데이터세트는 약 50, 75, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1,000, 2,500, 5,000, 7,500, 10,000, 15,000, 20,000, 25,000, 50,000, 100,000, 1,000,000개, 또는 그 초과의 기준 샘플을 포함한다.
기준 서열: 본원에서 사용된 바와 같이, "기준 서열" 또는 "기준 게놈"은 실험적으로 결정된 서열과 비교하기 위한 목적에 사용되는 공지된 서열을 지칭한다. 예를 들어, 공지된 서열은 전체 게놈, 염색체, 또는 그의 임의의 분절일 수 있다. 기준 서열은 전형적으로 적어도 약 20개, 적어도 약 50개, 적어도 약 100개, 적어도 약 200개, 적어도 약 250개, 적어도 약 300개, 적어도 약 350개, 적어도 약 400개, 적어도 약 450개, 적어도 약 500개, 적어도 약 1000개, 또는 그 초과의 뉴클레오티드를 포함한다. 기준 서열은 게놈 또는 염색체의 단일한 연속 서열과 정렬될 수 있거나, 또는 게놈 또는 염색체의 상이한 영역들과 정렬되는 비-연속 분절을 포함할 수 있다. 예시적인 기준 서열은, 예를 들어, 인간 게놈, 예컨대 hG19 및 hG38을 포함한다.
샘플: 본원에서 사용된 바와 같이, "샘플"은 본원에 개시된 방법 및/또는 시스템에 의해 분석될 수 있는 임의의 생물학적 샘플을 의미한다. 본 개시내용의 특정 측면에서, 샘플은 무세포 (순환, 세포 내에 함유되거나 다른 방식으로 그에 결합되지 않음) 핵산이 공급되는 다른 체액 유형 중에서도, 체액 샘플, 예를 들어, 전혈 또는 그의 분획, 림프액, 소변, 및/또는 뇌척수액이다. 특정 실행에서, 체액 샘플은 세포, 예컨대 적혈구 및 백혈구를 제외한 전혈의 유체 부분인 혈장 샘플이다. 일부 실행에서, 체액 샘플은 혈청 샘플, 즉, 피브리노겐을 결여한 혈장이다. 본 개시내용의 일부 측면에서, 샘플은 "비-체액 샘플" 또는 "비-혈장 샘플", 즉, "체액 샘플" 이외의 생물학적 샘플, 예컨대, 무세포 핵산 이외의 핵산이 공급되는 세포 및/또는 조직 샘플이다.
감도: 본원에서 사용된 바와 같이, 주어진 검정 또는 방법의 맥락에서의 "감도"는 표적화된 (예를 들어, 종양 세포로부터 기원하는 cfDNA 단편) 및 비-표적화된 (예를 들어, 비-종양 세포로부터 기원하는 cfDNA 단편) 분석물 사이에서 검출하고 구별하는 검정 또는 방법의 능력을 지칭한다.
시퀀싱: 본원에서 사용된 바와 같이, "시퀀싱"은 생체분자, 예를 들어, 핵산, 예컨대 DNA 또는 RNA의 서열 (예를 들어, 단량체 단위의 신원 및 순서)을 결정하는데 사용되는 다수의 기술 중 임의의 것을 지칭한다. 예시적인 시퀀싱 방법은 표적화된 시퀀싱, 단일 분자 실시간 시퀀싱, 엑손 또는 엑솜 시퀀싱, 인트론 시퀀싱, 전자 현미경-기반 시퀀싱, 패널 시퀀싱, 트랜지스터-매개 시퀀싱, 직접 시퀀싱, 무작위 샷건 시퀀싱, 생어 디데옥시 종결 시퀀싱, 전체-게놈 시퀀싱, 혼성화에 의한 시퀀싱, 파이로시퀀싱, 모세관 전기영동, 겔 전기영동, 듀플렉스 시퀀싱, 사이클 시퀀싱, 단일-염기 확장 시퀀싱, 고체-상 시퀀싱, 고-처리량 시퀀싱, 대규모 병렬 시그니쳐 시퀀싱, 에멀션 PCR, 더 낮은 변성 온도에서의 공동-증폭-PCR (COLD-PCR), 멀티플렉스 PCR, 가역적인 염료 종결인자에 의한 시퀀싱, 쌍을 이룬 단부 시퀀싱, 단기 시퀀싱, 엑소뉴클레아제 시퀀싱, 라이게이션에 의한 시퀀싱, 짧은 판독물 시퀀싱, 단일-분자 시퀀싱, 합성에 의한 시퀀싱, 실시간 시퀀싱, 역-종결인자 시퀀싱, 나노포어 시퀀싱, 454 시퀀싱, 솔렉사 게놈 애널라이저(Solexa Genome Analyzer) 시퀀싱, SOLiD™ 시퀀싱, MS-PET 시퀀싱, 및 이들의 조합을 포함하지만, 이에 제한되지 않는다. 일부 실시양태에서, 시퀀싱은 유전자 분석기, 예를 들어, 많은 것들 중에서도, 일루미나, 인크.(Illumina, Inc.), 퍼시픽 바이오사이언시즈, 인크.(Pacific Biosciences, Inc.), 또는 어플라이드 바이오시스템즈/써모 피셔 사이언티픽(Applied Biosystems/Thermo Fisher Scientific)으로부터 시판되는 유전자 분석기에 의해 수행될 수 있다.
단일 뉴클레오티드 변이체: 본원에서 사용된 바와 같이, "단일 뉴클레오티드 변이체" 또는 "SNV"는 게놈 내의 특이적 위치에서 발생하는 단일 뉴클레오티드 내의 돌연변이 또는 변이를 의미한다.
체세포 돌연변이: 본원에서 사용된 바와 같이, "체세포 돌연변이"는 수정 후에 발생하는 게놈 내의 돌연변이를 의미한다. 체세포 돌연변이는 생식 세포를 제외한 신체의 임의의 세포에서 발생할 수 있고, 따라서, 자손에게 계대되지 않는다.
특이성: 본원에서 사용된 바와 같이, 진단 분석 또는 검정의 맥락에서의 "특이성"은 분석 또는 검정이 의도된 표적 분석물을 주어진 샘플의 다른 성분의 배제까지 검출하는 정도를 지칭한다.
서브-클론성: 본원에서 사용된 바와 같이, 핵산의 맥락에서의 "서브-클론성"은 적어도 주어진 관심 유전자좌 (예를 들어, 표적 변이체)에서 서로 실질적으로 또는 완전히 동일한 뉴클레오티드 서열을 포함하는 핵산의 하위-집단 (즉, 핵산의 집단의 하위세트)을 지칭한다. 예를 들어, 서브-클론성은 암 세포의 하위세트를 지칭할 수 있다.
대상체: 본원에서 사용된 바와 같이, "대상체"는 동물, 예컨대 포유동물 종 (예를 들어, 인간) 또는 조류 (예를 들어, 새) 종, 또는 기타 유기체, 예컨대 식물을 지칭한다. 보다 구체적으로, 대상체는 척추동물, 예를 들어, 포유동물, 예컨대 마우스, 영장류, 유인원 또는 인간일 수 있다. 동물은 농장 동물 (예를 들어, 육우, 젖소, 가금류, 말, 돼지 등), 스포츠 동물, 및 반려 동물 (예를 들어, 애완동물 또는 지원 동물)을 포함한다. 대상체는 건강한 개체, 질환 또는 질환 소인이 있거나 질환 또는 질환 소인이 있는 것으로 추정되는 개체, 또는 요법을 필요로 하거나 요법을 필요로 하는 것으로 추정되는 개체일 수 있다. 용어 "개체" 또는 "환자"는 "대상체"와 상호교환가능하도록 의도된다.
예를 들어, 대상체는 암에 걸린 것으로 진단되었고/거나, 암 요법을 받을 예정이고/거나, 적어도 하나의 암 요법을 받은 개체일 수 있다. 대상체는 암이 완화 중일 수 있다. 또 다른 예로서, 대상체는 자가면역 질환에 걸린 것으로 진단된 개체일 수 있다. 또 다른 예에서, 대상체는 질환, 예를 들어, 암, 자가면역 질환에 걸린 것으로 진단되었을 수 있거나 이에 걸렸을 것으로 추정될 수 있는, 임신 중이거나 또는 임신 계획이 있는 여성 개체일 수 있다.
임계치 값: 본원에서 사용된 바와 같이, "임계치 값"은 실험적으로 결정된 값을 특성화하거나 또는 분류하는데 사용되는 별개로 결정된 값을 지칭한다.
종양 분율: 본원에서 사용된 바와 같이, "종양 분율"은 주어진 샘플 내의 종양으로부터 유래된 핵산 분자의 분율의 추정값을 지칭한다. 예를 들어, 샘플의 종양 분율은 샘플의 최대 체세포 돌연변이체 대립유전자 빈도 (max MAF) 또는 샘플의 커버리지, 또는 샘플 내의 cfNA 단편의 길이, 후성유전학적 상태, 또는 다른 특성 또는 샘플의 임의의 다른 선택된 특색으로부터 유래되는 척도일 수 있다. 일부 실시양태에서, 샘플의 종양 분율은 샘플의 max MAF와 동일하다.
값: 본원에서 사용된 바와 같이, "값"은 값이 지칭하는 특색을 특성화하는 임의의 것일 수 있는 데이터세트 내의 엔트리를 일반적으로 지칭한다. 이는 제한 없이, 수, 단어 또는 어구, 기호 (예를 들어, + 또는 -) 또는 정도를 포함한다.
본원에 기술된 것들과 유사하거나 등가의 임의의 방법 및 물질이 본 방법 및 조성물의 실시 또는 시험에 사용될 수 있지만, 특히 유용한 방법, 장치, 및 물질은 기술된 바와 같다. 본원에 인용된 간행물 및 이들이 인용된 자료는 구체적으로 본원에 참조로 포함된다. 본원에서 어느 것도 본 발명이 종래 발명에 의해 이같은 개시내용을 앞서는 것으로 자격부여되지 않음을 인정하는 것으로 해석되지 않아야 한다. 임의의 참고문헌이 종래 기술을 구성한다는 인정은 이루어지지 않는다. 참고문헌의 논의는 그들의 저자들이 주장하는 것을 진술하며, 출원인은 인용된 문서의 정확성 및 적절성에 이의를 제기할 권리를 남겨 둔다. 다수의 간행물이 본원에 언급되지만, 이같은 참고문헌은 임의의 이들 문서가 관련 기술 분야의 통상적인 일반적 지식의 일부를 형성한다는 인정을 구성하지 않음이 명백하게 이해될 것이다.
본 명세서의 설명 및 청구범위 전반에 걸쳐, 단어 "포함하다(comprise)" 및 상기 단어의 파생어, 예컨대 "포함하는" 및 "포함하다(comprises)"는 "포함하지만 이에 제한되지 않음"을 의미하고, 예를 들어, 다른 첨가제, 성분, 정수 또는 단계를 배제하는 것으로 의도되지 않는다. 특히, 하나 이상의 단계 또는 작동을 포함하는 것으로 진술된 방법에서, 각각의 단계가 열거된 것을 포함함 (단계가 제한적 용어, 예컨대 "이루어진"을 포함하지 않는 한)이 구체적으로 구상되며, 이는 각각의 단계가 예를 들어, 단계에 열거되지 않은 다른 첨가제, 성분, 정수 또는 단계를 배제하는 것으로 의도되지 않음을 의미한다.
본 발명이 다중 순차적 단계를 수반하는 프로세스를 제공하는 경우, 본 발명은 이러한 상이한 단계가 매우 상이한 시간에 상이한 사람에 의해 상이한 장소에서 (예를 들어 상이한 국가에서) 수행될 수 있는 프로세스를 또한 제공할 수 있다.
II. 분자 반응 점수화
도 1에 제시된 한 실시양태에서, 분자 반응 (MR) 점수를 결정하는 방법 (100)이 개시된다. 본 개시내용의 방법은 무세포 핵산의 조작, 제조, 확인, 정량화, 및/또는 분석에서 폭넓게 다양한 용도를 가질 수 있다. 분자 반응은 치료전 기준선과 비교하여 치료중 (통상적으로 3 내지 10주)의 순환 종양 DNA (ctDNA) 부하의 변화의 평가이다. 분자 반응은 요법에 대한 환자 반응 및 고형 종양 및 요법 유형에 걸친 장기 결과와 연관된다. 분자 반응은 방사선촬영 및/또는 RECIST 반응보다 더 빨리 임상적 반응을 예측하는데 또한 사용될 수 있다. 다중 방법은 분자 반응을 계산하는데 사용되었으며, 어느 방법이 가장 좋은지에 관한 합의는 없다.
분자 반응 (MR) 점수를 사용하여 치료에 대한 반응을 평가하기 위한 방법 및 시스템이 기술된다. 한 실시양태에서, 기준선 (치료전) 유전자 발현 데이터는 치료 전에 복수의 환자에 대해 수득될 수 있고, 치료중 유전자 발현 데이터는 치료 동안 복수의 환자에 대해 수득될 수 있다. 한 실시양태에서, 기준선 유전자 발현 데이터 (예를 들어, 변이체 데이터) 및/또는 치료중 유전자 발현 데이터를 분석하여 분자 반응 (MR) 점수를 결정할 수 있다. MR 점수는 환자가 치료에 대해 반응자 또는 비-반응자임을 지시할 수 있다. 한 실시양태에서, 돌연변이체 대립유전자 분율 (MAF)은 MR 점수의 일부로서 결정될 수 있다. 한 실시양태에서, 각각의 MAF의 분산은 분자 반응 점수의 결정에 포함될 수 있다. 이는 분자 반응 점수가, 분자 반응 점수로부터 정확한 결론을 내리는데 있어서 유의한 개선을 제공하는 정확한 분산을 포함하는 것을 보장한다. 개선은 분자 반응 점수가 비인 경우 훨씬 더 현저한데, 이는 비가 분모 내의 분산에 민감하기 때문이다. 분산은 분자 반응 분산을 수학적으로 유도하는 것을 통해 또는 분자 반응 분산을 결정하기 위한 각각의 변이체의 분산 분포로부터의 시뮬레이션 또는 샘플링을 통해 분자 반응 점수에 포함될 수 있다.
a. cfDNA 단리 및 추출
도 1에 제시된 바와 같이, 제1 시간 T0에서, 기준선 cfDNA는 단계 (101)에서 치료 전에 하나 이상의 대상체로부터 수득된 하나 이상의 기준선 샘플로부터 수득될 수 있고, 제2 시간 T1에서, 치료중 cfDNA는 단계 (102)에서 치료 후에 하나 이상의 대상체로부터 수득된 하나 이상의 치료중 샘플로부터 수득될 수 있다. 치료는 시간 T0에 후속하는 임의의 시간에 발생할/있을 수 있다. 예를 들어, 치료는 시간 T0 후 수 분, 수 시간, 수 일 등에 발생할 수 있다. 추가의 예로서, 치료는 시간 T0 후 30분, 시간 T0 후 1시간 내지 2시간, 시간 T0 후 1일 내지 2일, 시간 T0 후 1주 내지 2주, 시간 T0 후 1개월 내지 2개월, 시간 T0 후 6개월 내지 1년, 시간 T0 후 1년 내지 2년 등에 발생할 수 있다. 시간 T1은 시간 T0 후 임의의 양의 시간, 예를 들어, 1 내지 24시간, 1 내지 180일, 1 내지 12주, 6 내지 12개월 등 사이의 및 이를 포함하는 임의의 시간일 수 있다.
본원에 기술된 바와 같이, 폴리뉴클레오티드는 임의의 유형의 핵산, 예컨대 DNA 및/또는 RNA를 포함할 수 있다. 예를 들어, 폴리뉴클레오티드가 DNA인 경우, 이는 게놈 DNA, 상보적 DNA (cDNA), 또는 임의의 다른 데옥시리보핵산일 수 있다. 폴리뉴클레오티드는 또한 무세포 핵산, 예컨대 무세포 DNA (cfDNA)일 수 있다. 예를 들어, 폴리뉴클레오티드는 순환 cfDNA일 수 있다. 순환 cfDNA는 아팝토시스 또는 괴사를 통해 신체 세포로부터 쉐딩된 DNA를 포함할 수 있다. 아팝토시스 또는 괴사를 통해 쉐딩된 cfDNA는 정상 (예를 들어 건강한) 신체 세포로부터 기원할 수 있다. 비정상적 조직 성장이 있는 경우, 예컨대 암에 대해, 종양 DNA는 쉐딩될 수 있다. 순환 cfDNA는 순환 종양 DNA (ctDNA)를 포함할 수 있다.
i. 샘플
무세포 폴리뉴클레오티드의 단리 및 추출은 다양한 기법을 사용한 샘플의 수집을 통해 수행될 수 있다. 샘플은 대상체로부터 단리된 임의의 생물학적 샘플일 수 있다. 샘플은 신체 조직, 전혈, 혈소판, 혈청, 혈장, 대변, 적혈구, 백혈구, 내피 세포, 조직 생검 (예를 들어, 공지되어 있거나 추정되는 고형 종양으로부터의 생검), 뇌척수액, 윤활액, 림프액, 복수액, 간질 또는 세포외 체액 (예를 들어, 세포간 공간으로부터의 체액), 치은액, 열구액, 골수, 흉막 삼출액, 뇌척수액, 타액, 점액, 객담, 정액, 땀, 소변을 포함할 수 있다. 샘플은 바람직하게는 체액, 특히 혈액 및 이의 분획, 및 소변이다. 이같은 샘플은 종양으로부터 쉐딩된 핵산을 포함한다. 핵산은 DNA 및 RNA를 포함할 수 있고, 이중 및 단일-가닥 형태일 수 있다. 샘플은 대상체로부터 최초로 단리된 형태일 수 있거나, 또는 성분, 예컨대 세포를 제거하거나 부가하도록, 한 성분을 또 다른 성분에 비해 풍부화하도록, 또는 핵산의 한 형태를 또 다른 형태로, 예컨대 RNA를 DNA로 또는 단일-가닥 핵산을 이중-가닥으로 전환시키도록 추가 프로세싱에 적용되었을 수 있다. 따라서, 예를 들어, 분석용 체액 샘플은 무세포 핵산, 예를 들어, 무세포 DNA (cfDNA)를 함유하는 혈장 또는 혈청이다.
일부 실시양태에서, 대상체로부터 취한 체액의 샘플 부피는 시퀀싱 영역의 원하는 판독 깊이에 좌우된다. 예시적인 부피는 약 0.4 내지 40 ml, 약 5 내지 20 ml, 약 10 내지 20 ml이다. 예를 들어, 부피는 약 0.5 ml, 약 1 ml, 약 5 ml, 약 10 ml, 약 20 ml, 약 30 ml, 약 40 ml, 또는 이를 초과하는 밀리리터일 수 있다. 샘플링된 혈액의 부피는 전형적으로 약 5 ml 내지 약 20 ml이다.
샘플은 다양한 양의 핵산을 포함할 수 있다. 전형적으로, 주어진 샘플 내의 핵산의 양은 다중 게놈 등가물과 동일시된다. 예를 들어, 약 30 ng DNA의 샘플은 약 10,000 (104)개의 일배체 인간 게놈 등가물을 함유할 수 있고, cfDNA의 경우에는, 약 2000억 (2×1011)개의 개별적인 폴리뉴클레오티드 분자를 함유할 수 있다. 유사하게, 약 100 ng의 DNA의 샘플은 약 30,000개의 일배체 인간 게놈 등가물을 함유할 수 있고, cfDNA의 경우에는, 약 6000억개의 개별적인 분자를 함유할 수 있다.
일부 실시양태에서, 샘플은 상이한 공급원들, 예를 들어, 세포 및 무세포 공급원 (예를 들어, 혈액 샘플 등)으로부터의 핵산을 포함한다. 전형적으로, 샘플은 돌연변이를 보유하는 핵산을 포함한다. 예를 들어, 샘플은 배선 돌연변이 및/또는 체세포 돌연변이를 보유하는 DNA를 임의적으로 포함한다. 전형적으로, 샘플은 암-연관 돌연변이 (예를 들어, 암-연관 체세포 돌연변이)를 보유하는 DNA를 포함한다. 본 개시내용의 일부 실시양태에서, 대상체 내의 무세포 핵산은 종양으로부터 유래할 수 있다. 예를 들어 대상체로부터 단리된 무세포 DNA는 ctDNA를 포함할 수 있다.
증폭 전의 샘플 내의 무세포 핵산의 예시적인 양은 전형적으로 약 1 펨토그램 (fg) 내지 약 1 마이크로그램 (μg), 예를 들어, 약 1 피코그램 (pg) 내지 약 200 나노그램 (ng), 약 1 ng 내지 약 100 ng, 약 10 ng 내지 약 1000 ng의 범위이다. 일부 실시양태에서, 샘플은 최대 약 600 ng, 최대 약 500 ng, 최대 약 400 ng, 최대 약 300 ng, 최대 약 200 ng, 최대 약 100 ng, 최대 약 50 ng, 또는 최대 약 20 ng의 무세포 핵산 분자를 포함한다. 임의적으로, 양은 적어도 약 1 fg, 적어도 약 10 fg, 적어도 약 100 fg, 적어도 약 1 pg, 적어도 약 10 pg, 적어도 약 100 pg, 적어도 약 1 ng, 적어도 약 10 ng, 적어도 약 100 ng, 적어도 약 150 ng, 또는 적어도 약 200 ng의 무세포 핵산 분자이다. 특정 실시양태에서, 양은 최대 약 1 fg, 약 10 fg, 약 100 fg, 약 1 pg, 약 10 pg, 약 100 pg, 약 1 ng, 약 10 ng, 약 100 ng, 약 150 ng, 또는 약 200 ng의 무세포 핵산 분자이다. 일부 실시양태에서, 방법은 샘플로부터 약 1 fg 내지 약 200 ng 무세포 핵산 분자를 수득하는 것을 포함한다.
무세포 핵산은 전형적으로 약 100개의 뉴클레오티드의 길이 내지 약 500개의 뉴클레오티드의 길이의 크기 분포를 갖고, 약 110개의 뉴클레오티드의 길이 내지 약 230개의 뉴클레오티드의 길이의 분자가 샘플 내의 분자의 약 90%를 나타내며, 약 168개의 뉴클레오티드의 길이가 최빈값이고, 약 240개 내지 약 440개 범위의 뉴클레오티드의 길이에 제2 마이너 피크가 있다. 특정 실시양태에서, 무세포 핵산은 약 160개 내지 약 180개의 뉴클레오티드의 길이, 또는 약 320개 내지 약 360개의 뉴클레오티드의 길이, 또는 약 440개 내지 약 480개의 뉴클레오티드의 길이이다.
일부 실시양태에서, 무세포 핵산은 용액에서 발견된 바와 같은 무세포 핵산이 체액의 무손상 세포 및 다른 비-가용성 성분으로부터 분리되는 분할 단계를 통해 체액으로부터 단리된다. 일부 이러한 실시양태에서, 분할은 원심분리 또는 여과와 같은 기법을 포함한다. 대안적으로, 체액 내의 세포가 용해되고, 무세포 및 세포 핵산이 함께 프로세싱된다. 일반적으로, 완충제 첨가 및 세척 단계 후, 예를 들어 알콜로 무세포 핵산이 침전된다. 특정 실시양태에서, 추가적인 정화 단계, 예컨대 오염물 또는 염을 제거하기 위한 실리카-기반 칼럼이 사용된다. 예를 들어, 비-특이적 벌크 담체 핵산이 예시적인 절차의 특정 측면, 예컨대 수율을 최적화하기 위해 반응 전반에 걸쳐 임의적으로 첨가된다. 이같은 프로세싱 후, 샘플은 이중-가닥 DNA, 단일-가닥 DNA 및/또는 단일-가닥 RNA를 포함하는 다양한 형태의 핵산을 전형적으로 포함한다. 임의적으로, 단일 가닥 DNA 및/또는 단일 가닥 RNA는 후속 프로세싱 및 분석 단계에 포함되도록 이중 가닥 형태로 전환된다. 본원에 개시된 방법을 수행하는데 사용하기 위해 임의적으로 적응되는 후성유전학적 변형의 cfDNA 분할 및 관련 분석에 관한 추가의 상세사항은 예를 들어, 참조로 포함되는 2017년 12월 22일에 출원된 WO 2018/119452에 기술되어 있다.
ii. 핵산 태그
특정 실시양태에서, 분자 식별자 또는 바코드를 제공하는 태그는 다른 방법 중에서도, 화학적 합성, 라이게이션, 또는 중첩 확장 PCR에 의해 어댑터 내로 혼입되거나 다른 방식으로 그에 연결된다. 일부 실시양태에서, 반응에서 고유한 또는 고유하지 않은 식별자, 또는 분자 바코드의 할당은 예를 들어, 각각 참조로 포함되는 미국 특허 출원 20010053519, 20030152490, 20110160078, 및 미국 특허 번호 6,582,908, 7,537,898, 및 9,598,731에 기술된 방법을 따르고 시스템을 이용한다.
태그는 샘플 핵산에 무작위로 또는 비-무작위로 연결된다 (예를 들어, 라이게이션된다). 일부 실시양태에서, 태그는 식별자 (예를 들어, 고유한 및/또는 고유하지 않은 바코드의 조합) 대 마이크로웰의 예상된 비로 도입된다. 예를 들어, 식별자는 게놈 샘플당 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50,000, 100,000, 500,000, 1,000,000, 10,000,000, 50,000,000 또는 1,000,000,000개 초과의 식별자가 로딩되도록 로딩될 수 있다. 일부 실시양태에서, 식별자는 게놈 샘플당 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50,000, 100,000, 500,000, 1,000,000, 10,000,000, 50,000,000 또는 1,000,000,000개 미만의 식별자가 로딩되도록 로딩된다. 특정 실시양태에서, 샘플 게놈당 로딩되는 식별자의 평균 수는 게놈 샘플당 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50,000, 100,000, 500,000, 1,000,000, 10,000,000, 50,000,000 또는 1,000,000,000개 미만 또는 초과의 식별자이다. 식별자는 일반적으로 고유하거나 또는 고유하지 않다.
한 예시적인 형식은 표적 핵산 분자의 양쪽 단부에 라이게이션된 약 2개 내지 약 1,000,000개의 상이한 태그, 또는 약 5개 내지 약 150개의 상이한 태그, 또는 약 20개 내지 약 50개의 상이한 태그를 사용한다. 20 내지 50 x 20 내지 50개의 태그에 대해, 총 400 내지 2500개의 태그가 생성된다. 이같은 수의 태그는 동일한 출발 및 정지 지점을 갖는 상이한 분자가 태그의 상이한 조합을 수용할 확률이 높기 위해 (예를 들어, 적어도 94%, 99.5%, 99.99%, 99.999%) 전형적으로 충분하다.
일부 실시양태에서, 식별자는 미리 결정된, 무작위, 또는 반-무작위 서열 올리고뉴클레오티드이다. 다른 실시양태에서, 바코드가 복수 내의 서로에 대해 반드시 고유하지는 않도록 복수의 바코드가 사용될 수 있다. 이들 실시양태에서, 바코드 및 서열의 조합이 부착되어 개별적으로 추적될 수 있는 고유한 서열을 생성하도록 바코드는 일반적으로 개별적인 분자에 부착된다 (예를 들어, 라이게이션 또는 PCR 증폭에 의해). 본원에 기술된 바와 같이, 서열 판독물의 시작 (출발) 및 종료 (정지) 부분의 서열 데이터와 조합으로 고유하지 않게 태그부착된 바코드의 검출은 특정한 분자에의 고유한 신원의 할당을 전형적으로 허용한다. 개별적인 서열 판독물의 길이, 또는 염기 쌍의 수는 주어진 분자에 고유한 신원을 할당하기 위해 또한 임의적으로 사용된다. 본원에 기술된 바와 같이, 고유한 신원이 할당된 핵산의 단일 가닥으로부터의 단편은 그에 의해 모 가닥, 및/또는 상보적 가닥으로부터의 단편의 후속적 확인을 허용할 수 있다.
iii. 핵산 증폭
어댑터가 플랭킹된 샘플 핵산이 전형적으로 증폭될 DNA 분자에 플랭킹된 어댑터 내의 프라이머 결합 부위에 결합하는 핵산 프라이머를 사용하여 PCR 및 다른 증폭 방법에 의해 증폭된다. 일부 실시양태에서, 증폭 방법은 써모사이클링으로부터 초래되는 확장, 변성 및 어닐링의 사이클을 수반하거나, 또는 예를 들어 전사 매개 증폭에서와 같이, 등온성일 수 있다. 임의적으로 이용되는 다른 예시적인 증폭 방법은 다른 접근법들 중에서도 리가제 연쇄 반응, 가닥 교체 증폭, 핵산 서열-기반 증폭, 및 자가-지속 서열-기반 복제를 포함한다.
통상적인 핵산 증폭 방법을 사용하여 샘플 색인/태그를 핵산 분자에 도입하기 위해 1회 이상의 라운드의 증폭 사이클이 일반적으로 적용된다. 증폭은 전형적으로 1개 이상의 반응 혼합물에서 수행된다. 일부 실시양태에서, 분자 태그 및 샘플 색인/태그는 서열 포획 단계가 수행되기 전에 및/또는 후에 도입된다. 일부 실시양태에서, 분자 태그만 프로브 포획 전에 도입되고, 샘플 색인/태그는 서열 포획 단계가 수행된 후에 도입된다. 특정 실시양태에서, 분자 태그 및 샘플 색인/태그 양쪽 모두가 프로브-기반 포획 단계를 수행하기 전에 도입된다. 일부 실시양태에서, 샘플 색인/태그는 서열 포획 단계 (즉, 핵산의 풍부화)가 수행된 후에 도입된다. 전형적으로, 서열 포획 프로토콜은 표적화된 핵산 서열, 예를 들어, 게놈 영역의 코딩 서열에 대해 상보적인 단일-가닥 핵산 분자를 도입하는 것을 수반하고, 이같은 영역의 돌연변이가 암 유형과 연관된다. 전형적으로, 증폭 반응은 약 200개의 뉴클레오티드 (nt) 내지 약 700개의 nt, 250개의 nt 내지 약 350개의 nt, 또는 약 320개의 nt 내지 약 550개의 nt 범위의 크기의 분자 태그 및 샘플 색인/태그가 있는 복수의 고유하지 않게 또는 고유하게 태그부착된 핵산 앰플리콘을 생성한다. 일부 실시양태에서, 앰플리콘은 크기가 약 300개의 nt이다. 일부 실시양태에서, 앰플리콘은 크기가 약 500개의 nt이다.
iv. 핵산 풍부화
일부 실시양태에서, 서열은 핵산을 시퀀싱하기 전에 풍부화된다. 풍부화는 임의적으로 특이적 표적 영역에 대해 또는 비특이적으로 ("표적 서열") 수행된다. 예로서, 풍부화는 서열 특이적이지 않지만 오히려 서열 단편 크기 특이적인 크기 선택 방법에 기초하여 비특이적으로 수행될 수 있다. 일부 실시양태에서, 표적화된 관심 영역이 차등 타일링 및 포획 체계를 사용하여 하나 이상의 미끼 세트 패널에 대해 선택된 핵산 포획 프로브 ("미끼")로 풍부화될 수 있다. 차등 타일링 및 포획 체계는 일반적으로 제약 세트 (예를 들어, 서열분석기 제약, 예컨대 시퀀싱 로드, 각각의 미끼의 유용성 등)에 적용된, 미끼와 연관된 게놈 섹션에 걸쳐 (예를 들어, 상이한 "해상도"에서) 차등적으로 타일링하기 위한 상이한 상대 농도의 미끼 세트를 사용하고, 하류 시퀀싱을 위해 원하는 수준에서 표적화된 핵산을 포획한다. 이러한 표적화된 관심 게놈 섹션은 임의적으로 핵산 구축물의 천연 또는 합성 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 하나 이상의 관심 섹션에 대한 프로브가 있는 비오틴-표지 비드를 사용하여 표적 서열을 포획한 후, 임의적으로 이러한 섹션을 증폭시켜, 관심 영역에 대해 풍부화할 수 있다.
서열 포획은 전형적으로 표적 핵산 서열에 혼성화하는 올리고뉴클레오티드 프로브를 사용하는 것을 수반한다. 특정 실시양태에서, 프로브 세트 전략은 관심 섹션에 걸쳐 프로브를 타일링하는 것을 수반한다. 이같은 프로브는, 예를 들어, 약 60개 내지 약 120개의 뉴클레오티드의 길이일 수 있다. 세트는 약 2×, 3×, 4×, 5×, 6×, 8×, 9×, 10×, 15×, 20×, 50× 또는 그 초과의 깊이를 가질 수 있다. 일반적으로 서열 포획의 유효성은, 부분적으로, 프로브의 서열에 대해 상보적인 (또는 거의 상보적인) 표적 분자 내의 서열의 길이에 좌우된다.
b. 핵산 시퀀싱
도 1에 제시된 바와 같이, 단계 (101 및 102)에서의 샘플로부터의 cfDNA의 추출 및 단리 후, cfDNA는 단계 (103 및 104)에서 시퀀싱될 수 있다. 임의적으로 어댑터가 플랭킹된 샘플 핵산은, 사전 증폭의 존재 또는 부재 하에, 일반적으로 시퀀싱에 적용된다. 임의적으로 이용되는 시퀀싱 방법 또는 상업적으로 이용가능한 형식은, 예를 들어, 생어 시퀀싱, 고-처리량 시퀀싱, 비술파이트 시퀀싱, 파이로시퀀싱, 합성에 의한 시퀀싱, 단일-분자 시퀀싱, 나노포어-기반 시퀀싱, 반도체 시퀀싱, 라이게이션에 의한 시퀀싱, 혼성화에 의한 시퀀싱, RNA-Seq (일루미나(Illumina)), 디지털 유전자 발현 (헬리코스(Helicos)), 차세대 시퀀싱 (NGS), 합성에 의한 단일 분자 시퀀싱 (SMSS) (헬리코스), 대규모-병렬 시퀀싱, 클론형 단일 분자 어레이 (솔렉사(Solexa)), 샷건 시퀀싱, 이온 토렌트(Ion Torrent), 옥스포드 나노포어(Oxford Nanopore), 로슈 제니아(Roche Genia), 프라이머 워킹, PacBio, SOLiD, 이온 토렌트, 또는 나노포어 플랫폼을 사용하는 시퀀싱을 포함한다. 시퀀싱 반응은 다양한 샘플 프로세싱 유닛에서 수행될 수 있고, 이는 다중 레인, 다중 채널, 다중 웰, 또는 실질적으로 동시에 다중 샘플 세트를 프로세싱하는 다른 수단을 포함할 수 있다. 샘플 프로세싱 유닛은 다중 실행의 프로세싱을 동시에 가능하게 하도록 다중 샘플 챔버를 또한 포함할 수 있다.
시퀀싱 반응은 암의 또는 다른 질환의 마커를 함유하는 것으로 공지된 하나 이상의 핵산 단편 유형 또는 섹션에 대해 수행될 수 있다. 시퀀싱 반응은 샘플 내에 존재하는 임의의 핵산 단편에 대해 또한 수행될 수 있다. 서열 반응은 게놈의 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 99.9% 또는 100%의 게놈의 서열 커버리지를 제공할 수 있다. 다른 경우에, 게놈의 서열 커버리지는 게놈의 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 99.9% 또는 100% 미만일 수 있다.
동시 시퀀싱 반응이 멀티플렉스 시퀀싱 기법을 사용하여 수행될 수 있다. 일부 실시양태에서, 무세포 폴리뉴클레오티드가 적어도 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 또는 100,000회의 시퀀싱 반응으로 시퀀싱된다. 다른 실시양태에서, 무세포 폴리뉴클레오티드가 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 또는 100,000회 미만의 시퀀싱 반응으로 시퀀싱된다. 시퀀싱 반응은 전형적으로 순차적으로 또는 동시에 수행된다. 후속 데이터 분석이 시퀀싱 반응 전부 또는 일부에 대해 일반적으로 수행된다. 일부 실시양태에서, 데이터 분석이 적어도 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 또는 100,000회의 시퀀싱 반응에 대해 수행된다. 다른 실시양태에서, 데이터 분석이 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 또는 100,000회 미만의 시퀀싱 반응에 대해 수행될 수 있다. 예시적인 판독 깊이는 유전자좌 (염기 위치) 당 약 1000개 내지 약 50000개의 판독물이다.
일부 실시양태에서, 한쪽 또는 양쪽 단부에 단일-가닥 오버행이 있는 이중-가닥 핵산 상에 효소에 의해 평활-단부를 형성시키는 것에 의해 시퀀싱용으로 핵산 집단이 제조된다. 이러한 실시양태에서, 집단은 전형적으로 뉴클레오티드 (예를 들어, A, C, G 및 T 또는 U)의 존재 하에 5'-3' DNA 중합효소 활성 및 3'-5' 엑소뉴클레아제 활성을 갖는 효소로 처리된다. 임의적으로 사용되는 예시적인 효소 또는 그의 촉매적 단편은 클레나우(Klenow) 대형 단편 및 T4 중합효소를 포함한다. 5' 오버행에서, 전형적으로 효소는 반대쪽 가닥 상의 오목한 3' 단부를 이것이 5' 단부와 가지런해질 때까지 연장하여, 평활 단부를 생산한다. 3' 오버행에서, 일반적으로 효소는 3' 단부를 반대쪽 가닥의 5' 단부까지, 때로는 이를 넘어서 소화시킨다. 이러한 소화가 반대쪽 가닥의 5' 단부를 넘어서 진행되면, 5' 오버행에 사용된 것과 동일한 중합효소 활성을 갖는 효소에 의해 갭이 채워질 수 있다. 이중-가닥 핵산 상에서의 평활-단부의 형성은, 예를 들어, 어댑터 부착 및 후속 증폭을 용이하게 한다.
일부 실시양태에서, 핵산 집단은 추가적인 프로세싱, 예컨대 단일-가닥 핵산의 이중-가닥으로의 전환 및/또는 RNA의 DNA로의 전환에 적용된다. 이러한 형태의 핵산은 또한 임의적으로 어댑터에 연결되고, 증폭된다.
사전 증폭의 존재 또는 부재 하에, 상기 기술된 평활-단부를 형성시키는 프로세스에 적용된 핵산, 및 임의적으로 샘플 내의 다른 핵산을 시퀀싱하여, 시퀀싱된 핵산이 생산될 수 있다. 시퀀싱된 핵산은 핵산의 서열 (즉, 서열 정보) 또는 서열이 결정된 핵산을 지칭할 수 있다. 샘플 내의 개별적인 핵산 분자의 증폭 생성물의 컨센서스 서열로부터 직접적으로 또는 간접적으로 샘플 내의 개별적인 핵산 분자의 서열 데이터를 제공하도록 시퀀싱이 수행될 수 있다.
일부 실시양태에서, 평활-단부 형성 후의 샘플 내의 단일-가닥 오버행이 있는 이중-가닥 핵산이 바코드를 포함하는 어댑터에 양쪽 단부에서 연결되고, 시퀀싱이 핵산 서열, 뿐만 아니라 어댑터에 의해 도입된 인-라인 바코드를 결정한다. 평활-단부 DNA 분자는 임의적으로 적어도 부분적으로 이중-가닥인 어댑터 (예를 들어, Y형 또는 벨-형상 어댑터)의 평활 단부에 라이게이션된다. 대안적으로, 샘플 핵산의 평활 단부 및 어댑터에 상보적인 뉴클레오티드가 꼬리붙어서, 라이게이션을 용이하게 할 수 있다 (예를 들어, 점착성 단부 라이게이션).
동일한 핵산의 임의의 2개의 카피가 양쪽 단부에 연결된 어댑터로부터 동일한 조합의 어댑터 바코드를 수신할 확률이 낮도록 (예를 들어, < 1 또는 0.1 %), 핵산 샘플은 전형적으로 충분한 수의 어댑터와 접촉된다. 이러한 방식으로 어댑터를 사용하는 것은 기준 핵산 상의 동일한 출발 및 정지 지점을 갖고 동일한 조합의 바코드에 연결된 핵산 서열의 패밀리의 확인을 허용한다. 이같은 패밀리는 증폭 전의 샘플 내의 주형/모 핵산의 증폭 생성물의 서열을 나타낸다. 패밀리 구성원의 서열을 컴파일링하여, 평활 단부 형성 및 어댑터 부착에 의해 변형된 바와 같은 원래의 샘플 내의 핵산 분자에 대한 컨센서스 뉴클레오티드(들) 또는 완전한 컨센서스 서열을 유도할 수 있다. 달리 말하면, 샘플 내의 핵산의 특정 위치를 차지하는 뉴클레오티드가 패밀리 구성원 서열에서 이같은 상응하는 위치를 차지하는 뉴클레오티드의 컨센서스인 것으로 결정된다. 패밀리는 이중-가닥 핵산의 한쪽 또는 양쪽 가닥의 서열을 포함할 수 있다. 패밀리의 구성원이 이중-가닥 핵산으로부터의 양쪽 가닥의 서열을 포함하는 경우, 모든 서열을 컴파일링하여 컨센서스 뉴클레오티드(들) 또는 서열을 유도하기 위한 목적으로 한쪽 가닥의 서열이 그의 상보물로 전환된다. 일부 패밀리는 단일 구성원 서열만 포함한다. 이러한 경우, 이러한 서열을 증폭 전의 샘플 내의 핵산의 서열로서 취할 수 있다. 대안적으로, 단일 구성원 서열만 있는 패밀리를 후속 분석에서 제거할 수 있다.
시퀀싱된 핵산에서의 뉴클레오티드 변이를 시퀀싱된 핵산과 기준 서열을 비교하는 것에 의해 결정할 수 있다. 기준 서열은 종종 공지된 서열, 예를 들어, 대상체로부터의 공지된 전체 또는 부분적 게놈 서열 (예를 들어, 인간 대상체의 전체 게놈 서열)이다. 기준 서열은, 예를 들어, hG19 또는 hG38일 수 있다. 시퀀싱된 핵산은, 상기 기술된 바와 같이, 샘플 내의 핵산에 대해 직접적으로 결정된 서열, 또는 이같은 핵산의 증폭 생성물의 서열의 컨센서스를 나타낼 수 있다. 비교는 기준 서열 상의 하나 이상의 지정된 위치에서 수행될 수 있다. 각각의 서열이 최대로 정렬되었을 때 기준 서열의 지정된 위치에 상응하는 위치를 포함하여, 시퀀싱된 핵산의 하위세트가 확인될 수 있다. 이같은 하위세트 내에서, 존재하는 경우, 어느 시퀀싱된 핵산이 지정된 위치에서 뉴클레오티드 변이를 포함하는지, 어디에서 그의 종점 (즉, 그의 5' 및 3' 말단 뉴클레오티드)이 기준 서열에 맵핑하는지에 기초하여 주어진 cfDNA 단편의 길이, cfDNA 단편 내의 게놈 영역의 중간점으로부터의 주어진 cfDNA 단편의 중간점의 오프세트, 및 임의적으로 존재하는 경우, 어느 기준 뉴클레오티드 (즉, 기준 서열에서와 동일함)를 포함하는지가 결정될 수 있다. 뉴클레오티드 변이체를 포함하는 하위세트 내의 시퀀싱된 핵산의 수가 선택된 임계치를 초과하면, 변이체 뉴클레오티드가 지정된 위치에서 콜링될 수 있다. 임계치는 단순한 숫자, 예컨대 뉴클레오티드 변이체를 포함하는 하위세트 내의 적어도 1, 2, 3, 4, 5, 6, 7, 9, 또는 10개의 시퀀싱된 핵산일 수 있거나, 또는 비, 예컨대 다른 가능성 중에서도 뉴클레오티드 변이체를 포함하는 하위세트 내의 시퀀싱된 핵산 중 적어도 0.5, 1, 2, 3, 4, 5, 10, 15, 또는 20일 수 있다. 기준 서열 내의 임의의 지정된 관심 위치에 대해 비교가 반복될 수 있다. 때때로, 비교는 기준 서열 상의 적어도 약 20, 100, 200, 또는 300개의 인접 위치, 예를 들어, 약 20 내지 500개, 또는 약 50 내지 300개의 인접 위치를 차지하는 지정된 위치에 대해 수행될 수 있다.
본원에 기술된 형식 및 용도를 포함하여, 핵산 시퀀싱에 관한 추가적인 세부사항이, 예를 들어, 문헌 [Levy et al., Annual Review of Genomics and Human Genetics, 17: 95-115 (2016)], [Liu et al., J. of Biomedicine and Biotechnology, Volume 2012, Article ID 251364:1-11 (2012)], [Voelkerding et al., Clinical Chem., 55: 641-658 (2009)], [MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)], [Astier et al., J Am Chem Soc., 128(5):1705-10 (2006)], 미국 특허 번호 6,210,891, 미국 특허 번호 6,258,568, 미국 특허 번호 6,833,246, 미국 특허 번호 7,115,400, 미국 특허 번호 6,969,488, 미국 특허 번호 5,912,148, 미국 특허 번호 6,130,073, 미국 특허 번호 7,169,560, 미국 특허 번호 7,282,337, 미국 특허 번호 7,482,120, 미국 특허 번호 7,501,245, 미국 특허 번호 6,818,395, 미국 특허 번호 6,911,345, 미국 특허 번호 7,501,245, 미국 특허 번호 7,329,492, 미국 특허 번호 7,170,050, 미국 특허 번호 7,302,146, 미국 특허 번호 7,313,308, 및 미국 특허 번호 7,476,503에서 또한 제공되고, 이들은 각각 그 전문이 참조로 포함된다.
i. 시퀀싱 패널
관심 게놈 영역 및 임의적으로, 돌연변이를 지시하는 종양을 검출할 가능성을 개선시키기 위해, 시퀀싱된 DNA의 섹션은 공지된 게놈 영역을 포함하는 유전자 또는 게놈 섹션의 패널을 포함할 수 있다. 시퀀싱을 위한 제한된 섹션 (예를 들어, 제한된 패널)의 선택은 필요한 총 시퀀싱 (예를 들어, 시퀀싱된 뉴클레오티드의 총량)을 감소시킬 수 있다. 시퀀싱 패널은 복수의 상이한 유전자 또는 영역을 표적화하여, 예를 들어, 단일 암, 암의 세트, 또는 모든 암을 검출할 수 있다. 대안적으로, DNA는 시퀀싱 패널을 사용하지 않고 전체 게놈 시퀀싱 (WGS) 또는 다른 비편향된 시퀀싱 방법에 의해 시퀀싱될 수 있다. 적합한 패널 및 패널에 사용하기 위한 표적의 예는 그 전문이 참조로 포함되는 2019년 1월 31일에 출원된 미국 가특허 출원 62/799,637에 기술된 후성유전학적 표적에서 발견될 수 있다.
일부 측면에서, 복수의 상이한 유전자 또는 게놈 영역 (예를 들어, 전사 인자 결합 영역, 원위 조절 요소 (DRE), 반복 요소, 인트론-엑손 연접부, 전사 시작 부위 (TSS) 등)을 표적화하는 패널은 암을 갖는 대상체의 결정된 비율이 패널 내의 하나 이상의 상이한 유전자 내의 유전자 변이체 또는 종양 마커를 나타내도록 선택된다. 패널은 시퀀싱하기 위한 영역을 고정된 수의 염기 쌍에 제한하도록 선택될 수 있다. 패널은 원하는 양의 DNA를 시퀀싱하도록 선택될 수 있다. 패널은 원하는 서열 판독 깊이를 달성하도록 추가로 선택될 수 있다. 패널은 시퀀싱된 염기 쌍의 양에 대한 원하는 서열 판독 깊이 또는 서열 판독물 커버리지를 달성하도록 선택될 수 있다. 패널은 샘플 내의 하나 이상의 유전자 변이체를 검출하기 위한 이론적 감도, 이론적 특이성, 및/또는 이론적 정확도를 달성하도록 선택될 수 있다.
영역의 패널을 검출하기 위한 프로브는 관심 게놈 영역 (핫스팟 영역) 뿐만 아니라 뉴클레오솜-인식 프로브 (예를 들어, KRAS 코돈 12 및 13)를 검출하기 위한 것들을 포함할 수 있고, 뉴클레오솜 결합 패턴 및 GC 서열 조성에 의해 영향을 받는 cfDNA 커버리지 및 단편 크기 변이의 분석에 기초하여 포획을 최적화하도록 디자인될 수 있다. 본원에 사용된 영역은 뉴클레오솜 위치 및 GC 모델에 기초하여 최적화된 비-핫스팟 영역을 또한 포함할 수 있다. 패널은 기원의 조직 (예를 들어, 조직에 걸쳐 가장 다양한 전사 프로파일을 갖는 유전자 (반드시 프로모터는 아님)를 나타내는 50 내지 100개의 미끼를 정의하는 공개된 문헌의 사용), 전체 게놈 스캐폴드 (예를 들어, 초-보존적 게놈 함량을 확인하고, 카피 수 염기 라이닝 목적을 위한 소수의 프로브를 갖는 염색체에 걸쳐 성기게 타일링하기 위한), 전사 시작 부위 (TSS)/CpG 섬 (예를 들어, 예를 들어 종양 억제자 유전자 (예를 들어, 결장직장암 내의 SEPT9/VIM)의 프로모터 내의 차등 메틸화된 영역 (예를 들어, 차등적으로 메틸화된 영역 (DMR)을 포획하기 위한)을 확인하기 위한 하위패널을 포함하는 복수의 하위패널을 포함할 수 있다. 일부 실시양태에서, 기원의 조직에 대한 마커는 조직-특이적 후성유전학적 마커이다.
관심 게놈 위치의 목록의 일부 예는 표 1 및 표 2에서 발견할 수 있다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 유전자의 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 또는 97개의 적어도 일부를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 모든 유전자를 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 SNV의 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 또는 70개를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 모든 SNV를 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 CNV의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 또는 18개를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 모든 CNV를 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 융합의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 또는 6개를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 모든 융합을 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 인델의 적어도 1개, 적어도 2개, 또는 3개의 적어도 일부를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 모든 인델을 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1의 모든 유전자, SNV, CNV, 융합, 및 인델을 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 유전자의 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 또는 115개의 적어도 일부를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 모든 유전자를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1 및 표 2의 모든 유전자를 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 SNV의 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 또는 73개를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 모든 SNV를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1 및 표 2의 모든 SNV를 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 CNV의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 또는 18개를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 모든 CNV를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1 및 표 2의 모든 CNV를 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 융합의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 또는 6개를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 모든 융합을 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1 및 표 2의 모든 융합을 포함한다. 일부 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 인델의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 또는 18개의 적어도 일부를 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 모든 인델을 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1 및 표 2의 모든 인델을 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 2의 모든 유전자, SNV, CNV, 융합, 및 인델을 포함한다. 한 실시양태에서, 본 개시내용의 방법에 사용된 게놈 위치는 표 1 및 표 2의 모든 유전자, SNV, CNV, 융합, 및 인델을 포함한다. 각각의 이러한 관심 게놈 위치는 주어진 미끼 세트 패널에 대한 백본 영역 또는 핫-스팟 영역으로서 확인될 수 있다.
표 1
Figure pct00001
표 2
Figure pct00002
Figure pct00003
일부 실시양태에서, 패널 내의 하나 이상의 영역은 수술 후의 잔류 암을 검출하기 위한 하나 또는 복수의 유전자로부터의 하나 이상의 유전자좌를 포함한다. 이러한 검출은 기존의 암 검출 방법에 대해 가능한 것보다 더 빠를 수 있다. 일부 실시양태에서, 패널 내의 하나 이상의 게놈 위치는 고-위험 환자 집단에서 암을 검출하기 위한 하나 또는 복수의 유전자로부터의 하나 이상의 유전자좌를 포함한다. 예를 들어, 흡연자는 일반적인 집단보다 훨씬 더 높은 폐암의 비율을 갖는다. 더욱이, 흡연자는 암 검출을 보다 곤란하게 만드는 다른 폐 상태, 예컨대 폐 내의 불규칙한 혹의 발달을 발달시킬 수 있다. 일부 실시양태에서, 본원에 기술된 방법은 기존의 암 검출 방법에 대해 가능한 것보다 더 빨리 암 요법에 대한 환자의 반응을 검출한다 (특히 고위험 환자에서).
게놈 위치는 그 유전자 또는 영역 내에 종양 마커를 갖는 암을 갖는 대상체의 수에 기초하여 시퀀싱 패널에 포함시키기 위해 선택될 수 있다. 게놈 위치는 그 유전자에 존재하는 암 및 종양 마커를 갖는 대상체의 유병률에 기초하여 시퀀싱 패널에 포함시키기 위해 선택될 수 있다. 영역 내의 종양 마커의 존재는 암을 갖는 대상체를 지시할 수 있다.
일부 경우에, 패널은 하나 이상의 데이터베이스로부터의 정보를 사용하여 선택될 수 있다. 암에 관한 정보는 암 종양 생검 또는 cfDNA 검정으로부터 유래될 수 있다. 데이터베이스는 시퀀싱된 종양 샘플의 집단을 기술하는 정보를 포함할 수 있다. 데이터베이스는 종양 샘플 내의 mRNA 발현에 관한 정보를 포함할 수 있다. 데이터베이스는 종양 샘플 내의 조절 요소 또는 게놈 영역에 관한 정보를 포함할 수 있다. 시퀀싱된 종양 샘플에 관한 정보는 다양한 유전자 변이체의 빈도를 포함하고, 유전자 변이체가 발생하는 유전자 또는 영역을 기술할 수 있다. 유전자 변이체는 종양 마커일 수 있다. 이같은 데이터베이스의 비-제한적인 예는 COSMIC이다. COSMIC는 다양한 암에서 발견되는 체세포 돌연변이의 카탈로그이다. 특정한 암에 대해, COSMIC는 돌연변이의 빈도에 기초하여 유전자를 순위화한다. 유전자는 주어진 유전자 내에 높은 빈도의 돌연변이를 갖는 것에 의해 패널에 포함시키기 위해 선택될 수 있다. 예를 들어, COSMIC는 시퀀싱된 유방암 샘플의 집단의 33%가 TP53에 돌연변이를 갖고, 샘플링된 유방암의 집단의 22%가 KRAS에 돌연변이를 가짐을 지시한다. APC를 포함하는 다른 순위화된 유전자는 시퀀싱된 유방암 샘플의 집단의 약 4%에서만 발견되는 돌연변이를 갖는다. TP53 및 KRAS는 샘플링된 유방암 중에서 상대적으로 높은 빈도를 갖는 것 (예를 들어, 약 4%의 빈도로 발생하는 APC에 비해)에 기초하여 시퀀싱 패널에 포함될 수 있다. COSMIC는 비-제한적인 예로서 제공되지만, 유전자 또는 유전자 영역에 위치한 종양 마커와 암을 연관시키는 임의의 데이터베이스 또는 정보의 세트가 사용될 수 있다. 또 다른 예에서, 1156개의 담도암 샘플의 COSMIC에 의해 제공된 바와 같이, 380개의 샘플 (33%)이 TP53에 돌연변이를 보유하였다. 몇몇 다른 유전자, 예컨대 APC는 모든 샘플의 4 내지 8%에서 돌연변이를 갖는다. 따라서, TP53은 담도암 샘플의 집단 내의 상대적으로 높은 빈도에 기초하여 패널에 포함시키기 위해 선택될 수 있다.
유전자 또는 게놈 섹션은 종양 마커의 빈도가 주어진 배경 집단에서 발견되는 것보다 샘플링된 종양 조직 또는 순환 종양 DNA에서 유의하게 더 큰 패널에 대해 선택될 수 있다. 게놈 위치의 조합은 암을 갖는 적어도 대다수의 대상체가 패널 내의 게놈 위치 또는 유전자의 적어도 하나에 존재하는 종양 마커 또는 게놈 영역을 가질 수 있도록 패널에 포함시키기 위해 선택될 수 있다. 게놈 위치의 조합은 특정한 암 또는 암의 세트에 대해, 대다수의 대상체가 선택된 영역 중 하나 이상에 하나 이상의 종양 마커를 가짐을 지시하는 데이터에 기초하여 선택될 수 있다. 예를 들어, 암 1을 검출하기 위해, 영역 A, B, C, 및/또는 D를 포함하는 패널은 암 1을 갖는 대상체의 90%가 패널의 영역 A, B, C, 및/또는 D에 종양 마커를 가짐을 지시하는 데이터에 기초하여 선택될 수 있다. 교대로, 종양 마커는 2개 이상의 영역 내의 조합된 종양 마커가 암을 갖는 대상체의 집단의 대다수에 존재하도록, 암을 갖는 대상체 내의 2개 이상의 영역에서 독립적으로 발생하는 것으로 제시될 수 있다. 예를 들어, 암 2를 검출하기 위해, 영역 X, Y, 및 Z를 포함하는 패널은 대상체의 90%가 하나 이상의 영역에 종양 마커를 갖고, 이같은 대상체의 30%에서 종양 마커가 영역 X에서만 검출됨을 지시하는 데이터에 기초하여 선택될 수 있는 반면, 종양 마커는 종양 마커가 검출된 대상체의 나머지에 대해 영역 Y 및/또는 Z에서만 검출된다. 하나 이상의 암과 연관되는 것으로 이전에 제시된 하나 이상의 게놈 위치에 존재하는 종양 마커는 종양 마커가 시간의 50% 이상의 그러한 영역 중 하나 이상에서 검출되는 경우 암을 갖는 대상체를 지시하거나 예측할 수 있다. 컴퓨터적 접근법, 예컨대 하나 이상의 영역 내에 종양 마커의 세트에 대한 암 빈도를 고려하여 암을 검출할 조건부 확률을 채용하는 모델은, 어느 영역이 단독으로 또는 조합으로 암을 예측할 수 있는지 예측하는데 사용될 수 있다. 패널 선택을 위한 다른 접근법은 대형 패널 및/또는 전체 게놈 시퀀싱 (WGS, RNA-seq, Chip-seq, 비술페이트 시퀀싱, ATAC-seq, 및 기타)을 갖는 종양의 포괄적 게놈 프로파일링을 채용하는 연구로부터의 정보를 기술하는 데이터베이스의 사용을 수반한다. 문헌으로부터 얻어진 정보는 특정 암에서 통상적으로 영향을 받고 돌연변이된 경로를 또한 기술할 수 있다. 패널 선택은 유전적 정보를 기술하는 온톨로지의 사용에 의해 추가로 알 수 있다.
시퀀싱을 위한 패널에 포함되는 유전자는 완전히 전사된 영역, 프로모터 영역, 인핸서 영역, 조절 요소, 및/또는 하류 서열을 포함할 수 있다. 돌연변이를 지시하는 종양을 검출할 가능성을 추가로 증가시키기 위해, 엑손만이 패널에 포함될 수 있다. 패널은 선택된 유전자의 모든 엑손, 또는 선택된 유전자의 엑손 중 하나 이상만을 포함할 수 있다. 패널은 각각의 복수의 상이한 유전자로부터의 엑손을 포함할 수 있다. 패널은 각각의 복수의 상이한 유전자로부터의 적어도 하나의 엑손을 포함할 수 있다.
일부 측면에서, 각각의 복수의 상이한 유전자로부터의 엑손의 패널은 암을 갖는 대상체의 결정된 비율이 엑손의 패널 내의 적어도 하나의 엑손에서 유전자 변이체를 나타내도록 선택된다.
유전자의 패널 내의 각각의 상이한 유전자로부터의 적어도 하나의 완전한 엑손이 시퀀싱될 수 있다. 시퀀싱된 패널은 복수의 유전자로부터의 엑손을 포함할 수 있다. 패널은 2 내지 100개의 상이한 유전자, 2 내지 70개의 유전자, 2 내지 50개의 유전자, 2 내지 30개의 유전자, 2 내지 15개의 유전자, 또는 2 내지 10개의 유전자로부터의 엑손을 포함할 수 있다.
선택된 패널은 다양한 수의 엑손을 포함할 수 있다. 패널은 2 내지 3000개의 엑손을 포함할 수 있다. 패널은 2 내지 1000개의 엑손을 포함할 수 있다. 패널은 2 내지 500개의 엑손을 포함할 수 있다. 패널은 2 내지 100개의 엑손을 포함할 수 있다. 패널은 2 내지 50개의 엑손을 포함할 수 있다. 패널은 300개 이하의 엑손을 포함할 수 있다. 패널은 200개 이하의 엑손을 포함할 수 있다. 패널은 100개 이하의 엑손을 포함할 수 있다. 패널은 50개 이하의 엑손을 포함할 수 있다. 패널은 40개 이하의 엑손을 포함할 수 있다. 패널은 30개 이하의 엑손을 포함할 수 있다. 패널은 25개 이하의 엑손을 포함할 수 있다. 패널은 20개 이하의 엑손을 포함할 수 있다. 패널은 15개 이하의 엑손을 포함할 수 있다. 패널은 10개 이하의 엑손을 포함할 수 있다. 패널은 9개 이하의 엑손을 포함할 수 있다. 패널은 8개 이하의 엑손을 포함할 수 있다. 패널은 7개 이하의 엑손을 포함할 수 있다.
패널은 복수의 상이한 유전자로부터의 하나 이상의 엑손을 포함할 수 있다. 패널은 각각의 비율의 복수의 상이한 유전자로부터의 하나 이상의 엑손을 포함할 수 있다. 패널은 상이한 유전자의 적어도 25%, 50%, 75% 또는 90%의 각각으로부터의 적어도 2개의 엑손을 포함할 수 있다. 패널은 상이한 유전자의 적어도 25%, 50%, 75% 또는 90%의 각각으로부터의 적어도 3개의 엑손을 포함할 수 있다. 패널은 상이한 유전자의 적어도 25%, 50%, 75% 또는 90%의 각각으로부터의 적어도 4개의 엑손을 포함할 수 있다.
시퀀싱 패널의 크기는 다양할 수 있다. 시퀀싱 패널은 예를 들어, 패널 내의 특정한 영역에 대한 시퀀싱된 뉴클레오티드의 총량 또는 시퀀싱된 고유한 분자의 수를 포함하는 몇몇 인자에 따라 더 크게 또는 더 작게 (뉴클레오티드 크기의 관점에서) 만들어질 수 있다. 시퀀싱 패널은 5 kb 내지 50 kb의 크기일 수 있다. 시퀀싱 패널은 10 kb 내지 30 kb의 크기일 수 있다. 시퀀싱 패널은 12 kb 내지 20 kb의 크기일 수 있다. 시퀀싱 패널은 12 kb 내지 60 kb의 크기일 수 있다. 시퀀싱 패널은 적어도 10kb, 12 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 45 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, 또는 150 kb의 크기일 수 있다. 시퀀싱 패널은 100 kb, 90 kb, 80 kb, 70 kb, 60 kb, 또는 50 kb 미만의 크기일 수 있다.
시퀀싱을 위해 선택된 패널은 적어도 1, 5, 10, 15, 20, 25, 30, 40, 50, 60, 80, 또는 100개의 게놈 위치 (예를 들어, 각각 관심 게놈 영역을 포함함)를 포함할 수 있다. 일부 경우에, 위치의 크기가 상대적으로 작은 패널 내의 게놈 위치가 선택된다. 일부 경우에, 패널 내의 영역은 약 10 kb 이하, 약 8 kb 이하, 약 6 kb 이하, 약 5 kb 이하, 약 4 kb 이하, 약 3 kb 이하, 약 2.5 kb 이하, 약 2 kb 이하, 약 1.5 kb 이하, 또는 약 1 kb 이하 또는 그 미만의 크기를 갖는다. 일부 경우에, 패널 내의 게놈 위치는 약 0.5 kb 내지 약 10 kb, 약 0.5 kb 내지 약 6 kb, 약 1 kb 내지 약 11 kb, 약 1 kb 내지 약 15 kb, 약 1 kb 내지 약 20 kb, 약 0.1 kb 내지 약 10 kb, 또는 약 0.2 kb 내지 약 1 kb의 크기를 갖는다. 예를 들어, 패널 내의 영역은 약 0.1 kb 내지 약 5 kb의 크기를 가질 수 있다.
본원에서 선택된 패널은 (예를 들어, 샘플로부터 수득된 무세포 핵산 분자 내의) 저-빈도 유전자 변이체를 검출하는데 충분한 딥 시퀀싱을 허용할 수 있다. 샘플 내의 유전자 변이체의 양은 주어진 유전자 변이체에 대한 돌연변이체 대립유전자 빈도의 관점에서 언급될 수 있다. 돌연변이체 대립유전자 빈도는 돌연변이체 대립유전자 (예를 들어, 가장 통상적인 대립유전자가 아님)가 주어진 핵산의 집단, 예컨대 샘플에서 발생하는 빈도를 지칭할 수 있다. 낮은 돌연변이체 대립유전자 빈도의 유전자 변이체는 샘플 내에 상대적으로 낮은 존재의 빈도를 가질 수 있다. 일부 경우에, 패널은 적어도 0.0001%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 또는 0.5%의 돌연변이체 대립유전자 빈도로 유전자 변이체의 검출을 허용한다. 패널은 0.001% 이상의 돌연변이체 대립유전자 빈도로 유전자 변이체의 검출을 허용할 수 있다. 패널은 0.01% 이상의 돌연변이체 대립유전자 빈도로 유전자 변이체의 검출을 허용할 수 있다. 패널은 0.0001%, 0.001%, 0.005%, 0.01%, 0.025%, 0.05%, 0.075%, 0.1%, 0.25%, 0.5%, 0.75%, 또는 1.0%만큼 낮은 빈도로 샘플에 존재하는 유전자 변이체의 검출을 허용할 수 있다. 패널은 적어도 0.0001%, 0.001%, 0.005%, 0.01%, 0.025%, 0.05%, 0.075%, 0.1%, 0.25%, 0.5%, 0.75%, 또는 1.0%의 빈도로 샘플에 존재하는 종양 마커의 검출을 허용할 수 있다. 패널은 1.0%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.75%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.5%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.25%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.1%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.075%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.05%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.025%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.01%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.005%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.001%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 0.0001%만큼 낮은 샘플 내의 빈도로 종양 마커의 검출을 허용할 수 있다. 패널은 1.0% 내지 0.0001%만큼 낮은 샘플 내의 빈도로 시퀀싱된 cfDNA 내의 종양 마커의 검출을 허용할 수 있다. 패널은 0.01% 내지 0.0001%만큼 낮은 샘플 내의 빈도로 시퀀싱된 cfDNA 내의 종양 마커의 검출을 허용할 수 있다.
유전자 변이체는 질환 (예를 들어, 암)을 갖는 대상체의 집단의 백분율로 나타내어질 수 있다. 일부 경우에, 암을 갖는 집단의 적어도 1%, 2%, 3%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99%는 패널 내의 영역 중 적어도 하나에서 하나 이상의 유전자 변이체를 나타낸다. 예를 들어, 암을 갖는 집단의 적어도 80%는 패널 내의 게놈 위치 중 적어도 하나에서 하나 이상의 유전자 변이체를 나타낼 수 있다.
패널은 하나 이상의 유전자 각각으로부터의 관심 게놈 영역을 포함하는 하나 이상의 위치를 포함할 수 있다. 일부 경우에, 패널은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 또는 80개의 유전자 각각으로부터의 관심 게놈 영역을 포함하는 하나 이상의 위치를 포함할 수 있다. 일부 경우에, 패널은 많아야 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 또는 80개의 유전자 각각으로부터의 관심 게놈 영역을 포함하는 하나 이상의 위치를 포함할 수 있다. 일부 경우에, 패널은 약 1개 내지 약 80개, 1개 내지 약 50개, 약 3개 내지 약 40개, 5개 내지 약 30개, 10개 내지 약 20개의 상이한 유전자 각각으로부터의 관심 게놈 영역을 포함하는 하나 이상의 위치를 포함할 수 있다.
패널 내의 게놈 영역을 포함하는 위치는 하나 이상의 후성유전학적으로 변형된 영역이 검출되도록 선택될 수 있다. 하나 이상의 후성유전학적으로 변형된 영역은 아세틸화, 메틸화, 유비퀴틸화, 인산화, 수모일화, 리보실화, 및/또는 시트룰린화될 수 있다. 예를 들어, 패널 내의 영역은 하나 이상의 메틸화된 영역이 검출되도록 선택될 수 있다.
패널 내의 영역은 이들이 하나 이상의 조직에 걸쳐 차등적으로 전사된 서열을 포함하도록 선택될 수 있다. 일부 경우에, 게놈 영역을 포함하는 위치는 다른 조직에 비해 더 높은 수준으로 특정 조직에서 전사된 서열을 포함할 수 있다. 예를 들어, 게놈 영역을 포함하는 위치는 특정 조직에서 전사되지만 다른 조직에서는 전사되지 않는 서열을 포함할 수 있다.
패널 내의 게놈 위치는 코딩 및/또는 비-코딩 서열을 포함할 수 있다. 예를 들어, 패널 내의 게놈 위치는 엑손, 인트론, 프로모터, 3' 비번역된 영역, 5' 비번역된 영역, 조절 요소, 전사 시작 부위, 및/또는 스플라이스 부위에 하나 이상의 서열을 포함할 수 있다. 일부 경우에, 패널 내의 영역은 위유전자, 반복 서열, 트랜스포존, 바이러스 요소, 및 텔로미어를 포함하는 다른 비-코딩 서열을 포함할 수 있다. 일부 경우에, 패널 내의 게놈 위치는 비-코딩 RNA, 예를 들어, 리보솜 RNA, 운반 RNA, 피위-상호작용 RNA, 및 마이크로RNA에 서열을 포함할 수 있다.
패널 내의 게놈 위치는 원하는 수준의 감도로 암을 검출하도록 (진단하도록) (예를 들어, 하나 이상의 유전자 변이체의 검출을 통해) 선택될 수 있다. 예를 들어, 패널 내의 영역은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 감도로 암을 검출하도록 (예를 들어, 하나 이상의 유전자 변이체의 검출을 통해) 선택될 수 있다. 패널 내의 게놈 위치는 100%의 감도로 암을 검출하도록 선택될 수 있다.
패널 내의 게놈 위치는 원하는 수준의 특이성으로 암을 검출하도록 (진단하도록) (예를 들어, 하나 이상의 유전자 변이체의 검출을 통해) 선택될 수 있다. 예를 들어, 패널 내의 게놈 위치는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 특이성으로 암을 검출하도록 (예를 들어, 하나 이상의 유전자 변이체의 검출을 통해) 선택될 수 있다. 패널 내의 게놈 위치는 100%의 특이성으로 하나 이상의 유전자 변이체를 검출하도록 선택될 수 있다.
패널 내의 게놈 위치는 원하는 양성 예측적 값으로 암을 검출하도록 (진단하도록) 선택될 수 있다. 양성 예측적 값은 감도 (예를 들어, 검출되는 실제 양성의 확률) 및/또는 특이성 (예를 들어, 실제 음성을 양성으로 오인하지 않을 확률)을 증가시킴으로써 증가될 수 있다. 비-제한적인 예로서, 패널 내의 게놈 위치는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 양성 예측적 값으로 하나 이상의 유전자 변이체를 검출하도록 선택될 수 있다. 패널 내의 영역은 100%의 양성 예측적 값으로 하나 이상의 유전자 변이체를 검출하도록 선택될 수 있다.
패널 내의 게놈 위치는 원하는 정확도로 암을 검출하도록 (진단하도록) 선택될 수 있다. 본원에서 사용된 바와 같이, 용어 "정확도"는 질환 상태 (예를 들어, 암) 및 건강한 상태 사이를 식별하는 시험의 능력을 지칭할 수 있다. 정확도는 감도 및 특이성, 예측적 값, 가능도 비, ROC 곡선하 면적, 유덴 지수 및/또는 진단 오즈 비와 같은 척도를 사용하여 정량화될 수 있다.
정확도는 정확한 결과를 제공하는 시험의 수 및 수행된 시험의 총 수 사이의 비를 지칭하는 백분율로서 제시될 수 있다. 패널 내의 영역은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 정확도로 암을 검출하도록 선택될 수 있다. 패널 내의 게놈 위치는 100%의 정확도로 암을 검출하도록 선택될 수 있다.
패널은 고도로 민감성이고 낮은 빈도 유전자 변이체를 검출하도록 선택될 수 있다. 예를 들어, 패널은 0.01%, 0.05%, 또는 0.001%만큼 낮은 빈도로 샘플에 존재하는 유전자 변이체 또는 종양 마커가 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 감도로 검출될 수 있도록 선택될 수 있다. 패널 내의 게놈 위치는 샘플에 1% 이하의 빈도로 존재하는 종양 마커를 70% 이상의 감도로 검출하도록 선택될 수 있다. 패널은 0.1%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 감도로 검출하도록 선택될 수 있다. 패널은 0.01%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 감도로 검출하도록 선택될 수 있다. 패널은 0.001%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 감도로 검출하도록 선택될 수 있다.
패널은 고도로 특이적이고 낮은 빈도 유전자 변이체를 검출하도록 선택될 수 있다. 예를 들어, 패널은 0.01%, 0.05%, 또는 0.001%만큼 낮은 빈도로 샘플에 존재하는 유전자 변이체 또는 종양 마커가 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 특이성으로 검출될 수 있도록 선택될 수 있다. 패널 내의 게놈 위치는 샘플에 1% 이하의 빈도로 존재하는 종양 마커를 70% 이상의 특이성으로 검출하도록 선택될 수 있다. 패널은 0.1%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 특이성으로 검출하도록 선택될 수 있다. 패널은 0.01%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 특이성으로 검출하도록 선택될 수 있다. 패널은 0.001%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 특이성으로 검출하도록 선택될 수 있다.
패널은 고도로 정확하고 낮은 빈도 유전자 변이체를 검출하도록 선택될 수 있다. 패널은 0.01%, 0.05%, 또는 0.001%만큼 낮은 빈도로 샘플에 존재하는 유전자 변이체 또는 종양 마커가 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 정확도로 검출될 수 있도록 선택될 수 있다. 패널 내의 게놈 위치는 샘플에 1% 이하의 빈도로 존재하는 종양 마커를 70% 이상의 정확도로 검출하도록 선택될 수 있다. 패널은 0.1%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 정확도로 검출하도록 선택될 수 있다. 패널은 0.01%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 정확도로 검출하도록 선택될 수 있다. 패널은 0.001%만큼 낮은 샘플 내의 빈도로 종양 마커를 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 정확도로 검출하도록 선택될 수 있다.
패널은 고도로 예측적이고 낮은 빈도 유전자 변이체를 검출하도록 선택될 수 있다. 패널은 0.01%, 0.05%, 또는 0.001%만큼 낮은 빈도로 샘플에 존재하는 유전자 변이체 또는 종양 마커가 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9%의 양성 예측적 값을 가질 수 있도록 선택될 수 있다.
패널에 사용되는 프로브 또는 미끼의 농도는 샘플 내의 보다 많은 핵산 분자를 포획하도록 증가될 수 있다 (2 내지 6 ng/μL). 패널에 사용되는 프로브 또는 미끼의 농도는 적어도 2 ng/μL, 3 ng/ μL, 4 ng/ μL, 5 ng/μL, 6 ng/μL, 또는 그 초과일 수 있다. 프로브의 농도는 약 2 ng/μL 내지 약 3 ng/μL, 약 2 ng/μL 내지 약 4 ng/μL, 약 2 ng/μL 내지 약 5 ng/μL, 약 2 ng/μL 내지 약 6 ng/μL일 수 있다. 패널에 사용되는 프로브 또는 미끼의 농도는 2 ng/μL 이상 내지 6 ng/μL 이하일 수 있다. 일부 경우에 이는 분석될 생물학적 내의 보다 많은 분자를 허용함으로써, 보다 낮은 빈도 대립유전자가 검출되는 것을 가능하게 할 수 있다.
한 실시양태에서, 시퀀싱 후, 서열 판독물은 품질 점수가 할당될 수 있다. 품질 점수는 그러한 서열 판독물이 임계치에 기초하여 후속 분석에 유용할 수 있는지 여부를 지시하는 서열 판독물의 묘사일 수 있다. 일부 경우에, 일부 서열 판독물은 후속 맵핑 단계를 수행하기 위한 충분한 품질 또는 길이의 것이 아니다. 적어도 90%, 95%, 99%, 99.9%, 99.99% 또는 99.999%의 품질 점수를 갖는 서열 판독물은 서열 판독물의 데이터 세트로부터 필터링될 수 있다. 다른 경우에, 적어도 90%, 95%, 99%, 99.9%, 99.99% 또는 99.999%로 점수화된 품질이 할당된 서열 판독물은 데이터 세트로부터 필터링될 수 있다. 특정 품질 점수 임계치를 충족시키는 서열 판독물은 기준 게놈에 맵핑될 수 있다. 맵핑 정렬 후, 서열 판독물은 맵핑 점수가 할당될 수 있다. 맵핑 점수는 각각의 위치가 고유하게 맵핑가능한지 아닌지 여부를 지시하는 기준 서열에 다시 맵핑되는 서열 판독물의 묘사일 수 있다. 적어도 90%, 95%, 99%, 99.9%, 99.99% 또는 99.999%의 맵핑 점수를 갖는 서열 판독물은 데이터 세트로부터 필터링될 수 있다. 다른 경우에, 90%, 95%, 99%, 99.9%, 99.99% 또는 99.999% 미만으로 점수화된 맵핑이 할당된 시퀀싱 판독물은 데이터 세트로부터 필터링될 수 있다.
c. MAF 결정
도 1에 제시된 바와 같이, 단계 (103 및/또는 104)에서의 샘플의 cfDNA 시퀀싱 후, 단계 (105 및/또는 106)에서 하나 이상의 돌연변이체 대립유전자 분율 (MAF)이 결정될 수 있다. 일부 또는 모든 MAF 결정은 변이체 분류 (107/108) 전에, 변이체 분류 (107/108) 후에, 변이체 분류 (107/108) 동안, 변이체 필터링 (109) 전에, 변이체 필터링 (109) 후에, 변이체 필터링 (109) 동안, 또는 이들의 조합에 발생할 수 있다. 단계 (103) 전에, cfDNA는 말단 복구되고, 분자 바코드를 포함하는 어댑터로 라이게이션되고, 증폭되고, 풍부화될 수 있다. 증폭은 샘플 색인을 혼입할 수 있다. 한 실시양태에서, MAF 값은 모든 변이체 또는 모든 체세포 변이체에 대해 결정될 수 있다. 한 실시양태에서, MAF 값은 모든 변이체 미만 또는 모든 체세포 변이체 미만에 대해 결정될 수 있다. 변이체 대립유전자 분율 (VAF)은 본원에서 MAF와 상호교환가능하게 사용된다. 돌연변이체 대립유전자 분율 (MAF)은 돌연변이체 분자의 수를 특이적 게놈 위치에서의 분자의 총 수 (예를 들어, 분자 커버리지)로 나눈 것을 나타낸다:
Figure pct00004
최대 MAF는 주어진 샘플에 존재하거나 그에서 관찰되는 모든 체세포 변이체의 최대 또는 가장 큰 MAF로서 결정될 수 있다. 일부 실시양태에서, 최대 MAF는 주어진 샘플의 종양 분율로 간주될 수 있다.
최대 배수체 유전자의 분율 ("max frac_diploid") (최소 대립유전자 불균형)이 결정될 수 있다. 배수체 유전자의 분율 ("frac_diploid)은 카피 수에 의해 결정된 바와 같은 샘플에 걸친 대립유전자 불균형의 수준의 척도이다. 높은 수준의 대립유전자 불균형을 갖는 샘플은 배선/체세포 오분류될 경향이 있다. 따라서, 낮은 수준의 대립유전자 불균형 (또는 높은 frac_diploid)은 체세포 분류 콜링의 신뢰성의 지시이다.
한 실시양태에서, 총 커버리지 프로파일을 사용하여 개별적인 유전자라기 보다는 배수 변화 및 따라서 종양 분율을 포획할 수 있다.
d. 변이체 분류
단계 (103 및 104)에서의 시퀀싱은 복수의 서열 판독물을 생성한다. 단계 (107 및/또는 108)에서 복수의 서열 판독물을 분석하여 하나 이상의 변이체를 결정하고, 하나 이상의 변이체를 분류할 수 있다. 한 실시양태에서, 일부 또는 모든 변이체 분류는 MAF 결정 (105/106) 전에, MAF 결정 (105/106) 후에, MAF 결정 (105/106) 동안, 또는 이들의 조합에 결정될 수 있다. 변이체는 예를 들어, 단일 뉴클레오티드 변이체 (SNV), 인델, 융합, 및 카피 수 변이를 포함할 수 있다. 변이체 콜링을 위한 임의의 공지된 기법이 사용될 수 있다. 한 실시양태에서, 샘플로부터의 복수의 서열 판독물은 어셈블리되고/거나 맵핑되고, 기준 게놈에 비해 게놈 위치에 대해 정렬될 수 있다. 일부 실시양태에서, 복수의 서열 판독물 (어셈블리된 또는 다른 방식으로)을 이어서 기준 게놈과 비교하여 대상체의 복수의 서열 판독물이 기준 게놈의 그것과 얼마나 다른지 결정할 수 있다. 이같은 프로세스는 복수의 서열 판독물 내의 하나 이상의 변이체의 존재를 결정할 수 있다. 일부 실시양태에서, 복수의 서열 판독물로부터 수득된 핵산 분자의 분자 바코드 및/또는 출발 및 정지 게놈 위치를 사용하여 분자에 속하는 서열 판독물이 기준 게놈과 상이한 돌연변이체 분자를 확인할 수 있다. 이같은 프로세스는 복수의 서열 판독물 내의 하나 이상의 변이체의 존재를 결정할 수 있다.
한 실시양태에서, 통상적인 이형접합성 SNP를 사용하여 국소 배선 대립유전자 카운트 거동을 모델링하고, 이들이 관찰된 배선 돌연변이체 대립유전자 분율로부터 유의하게 벗어나면 변이체를 체세포로 콜링할 수 있다. 베타이항 모델은 그것이 통상적인 SNP에서 돌연변이체 대립유전자 카운트의 평균 및 분산 양쪽 모두를 모델링하기 때문에 사용될 수 있다. 예를 들어, 그 전문이 본원에 참조로 포함되는 PCT/US2018/052087에 기술된 베타이항 모델이 사용될 수 있다. 이는 고정된 MAF 컷오프 또는 포이즌(Poisson) 모델과 같은 보다 간단한 방법에 비해 개선된 것인데, 이는 이들이 분자 카운트 내의 분산을 적절하게 나타내지 않을 수 있기 때문이다.
e. 변이체 필터링
한 실시양태에서, 도 1에 제시된 바와 같이, 하나 이상의 필터링 프로세스를 단계 (109)에서 서열 판독물에 적용하여 서열 판독물을 추가의 분석으로부터 배제할 수 있다. 한 실시양태에서, 일부 또는 모든 필터링은 MAF 결정 (105/106) 전에, MAF 결정 (105/106) 후에, MAF 결정 (105/106) 동안, 변이체 분류 (107/108) 전에, 변이체 분류 (107/108) 후에, 변이체 분류 (107/108) 동안, 또는 이들의 조합에 적용될 수 있다.
일부 실시양태에서, 제1 및/또는 제2 시점에서 약 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 미만인 MAF를 갖는 하나 이상의 체세포 변이체는 추가의 분석으로부터 배제될 수 있다. 일부 실시양태에서, 제1 및/또는 제2 시점에서 5, 10, 15, 20, 25 또는 30 미만의 돌연변이체 분자 카운트를 갖는 하나 이상의 체세포 변이체는 추가의 분석으로부터 배제될 수 있다. 일부 실시양태에서, 제1 및/또는 제2 시점에서 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 미만의 커버리지를 갖는 하나 이상의 체세포 변이체는 추가의 분석으로부터 배제될 수 있다.
한 실시양태에서, 카피 수 변이체를 사용하여 서열 판독물을 추가의 분석으로부터 배제할 수 있다. 카피 수 증폭은 관련 기술 분야에 공지된 바와 같이 결정될 수 있다. 단계 (109)에서, 방법 (100)은 불충분한 프로브 커버리지 또는 불충분한 카피 수 (예를 들어 95% 검출의 한계 미만)를 갖는 유전자 내의 카피 수 증폭을 필터링할 수 있다.
예로서, CNV는 서열 판독물을 분석하여 커버리지의 염색체 영역을 생성함으로써 결정될 수 있다. 염색체 영역은 가변적인 길이 윈도우 또는 빈으로 나누어질 수 있다. 판독물 커버리지는 각각의 윈도우/빈 영역에 대해 결정될 수 있다. 한 실시양태에서, 시퀀싱 판독물 커버리지에 관한 정량적 척도는 유전자의 유전자좌 (예를 들어, 기준 게놈으로부터 특정한 위치, 염기, 영역, 유전자 또는 염색체)에 상응하는 DNA 분자로부터 유래된 판독물의 수를 지시하는 척도이다. 판독물을 유전자의 유전자좌에 연관시키기 위해, 판독물은 기준물에 맵핑되거나 정렬될 수 있다. 맵핑 또는 정렬을 수행하는 소프트웨어 (예를 들어, 보타이(Bowtie), BWA, mrsFAST, BLAST, BLAT)는 시퀀싱 판독물을 유전자의 유전자좌와 연관시킬 수 있다. 서열 판독물 커버리지가 결정된 후, 추계적 모델링 알고리즘을 적용하여 각각의 윈도우/빈 영역에 대한 정규화된 핵산 서열 판독물 커버리지를 별개의 카피 수 상태로 전환시킬 수 있다. 일부 경우에, 이 알고리즘은 하기 중 하나 이상을 포함할 수 있다: 히든 마르코브(Hidden Markov) 모델, 동적 프로그래밍, 지지 벡터 기계, 베이시안(Bayesian) 네트워크, 트렐리스 디코딩, 비테르비(Viterbi) 디코딩, 예상 최대화, 칼만(Kalman) 필터링 방법론 및 신경 네트워크. 각각의 윈도우 영역의 별개의 카피 수 상태를 이용하여 염색체 영역 내의 카피 수 변이를 확인할 수 있다. 일부 경우에, 동일한 카피 수를 갖는 모든 인접한 윈도우/빈 영역을 분절로 병합하여 카피 수 변이 상태의 존재 또는 부재를 보고할 수 있다. 일부 경우에, 다양한 윈도우/빈은 이들이 다른 분절과 병합되기 전에 필터링될 수 있다. 카피 수 변이를 사용하여 얼마나 많은 질환 물질 (또는 카피 수 변이를 갖는 핵산)이 무세포 폴리뉴클레오티드 샘플에 존재하는지 지시하는 백분율 점수를 보고할 수 있다.
한 실시양태에서, 하나 이상의 유전자 내의 CNV의 존재를 사용하여 변이체를 추가의 분석으로부터 배제할 수 있다. 예로서, T0 또는 T1 샘플 중 어느 하나에서 카피 수를 갖는 LDT-보고가능한 유전자의 임계치 수를 갖는 변이체 >= 유전자-특이적 95% 검출의 한계 (LoD). 임계치는 약 10 내지 약 30일 수 있다. 임계치는 예를 들어, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 등일 수 있다. 한 실시양태에서, 임계치는 19일 수 있다.
카피 수 변이는 주어진 변이체에 대한 배수 변화를 지시할 수 있다. 가우스 모델을 사용하여 분자 반응 점수의 추정값으로서 사용될 수 있는 시간 T0 및 시간 T1 사이의 배수 변화의 비를 결정할 수 있다.
한 실시양태에서, 대상체가 체세포 변이체를 갖지 않거나, 또는 변이체 필터링 프로세스의 기준을 충족시키는 변이체를 갖지 않는 경우, 대상체는 비-평가가능한 것으로서 분류될 수 있다. 한 실시양태에서, 비-평가가능한 것으로서 분류된 대상체는 분자 반응자로서 추가로 분류될 수 있다. 한 실시양태에서, 시간 T0 및 시간 T1 양쪽 모두에서 낮은 ctDNA를 갖는 대상체는 비-평가가능한 것으로서 분류되고, 분자 반응자로서 추가로 분류될 수 있다. 한 실시양태에서, 시간 T0 및 시간 T1 양쪽 모두에서 낮은 MAF를 갖는 대상체는 비-평가가능한 것으로서 분류되고, 분자 반응자로서 추가로 분류될 수 있다. 한 실시양태에서, 시간 T0 및 시간 T1 양쪽 모두에서 낮은 종양 분율을 갖는 대상체는 비-평가가능한 것으로서 분류되고, 분자 반응자로서 추가로 분류될 수 있다. 낮은 MAF 또는 낮은 종양 분율은 검출의 한계 미만 (예를 들어 95% 검출의 한계 미만), 또는 정량화의 한계 미만의 MAF 또는 종양 분율을 지칭할 수 있다. 무엇이 낮은 것을 구성하는지는 패널 디자인에 좌우될 수 있지만, 예를 들어, MAF f 0.1, 0.2, 또는 0.3%는 낮은 것으로 간주될 수 있다.
i. 배선 필터
도 2에 제시된 한 실시양태에서, 배선 필터 (200)는 서열 판독물에 적용될 수 있다. 도 2에 제시된 일부 (예를 들어, 전부 미만) 또는 모든 단계는 임의의 조합으로 및 임의의 순서로 수행될 수 있다. 대상체의 치료의 과정에 걸쳐 수집된 샘플 (예를 들어, 시간 T0에서 및 시간 T1에서 수집된 샘플)은 상이한 수준의 종양 쉐딩 및 대립유전자 불균형을 가질 수 있으며, 이는 단계 (107/108)에서의 변이체 분류가 동일한 대상체 내의 동일한 변이체에 대해 상이한 체세포 분류를 할당하는 경향이 있을 수 있음을 의미한다. 분자 반응의 목표는 치료의 과정에 걸쳐 체세포 변이체를 추적하는 것이기 때문에, 분류 불일치는 자동적으로 해결되어 변이체를 재분류함으로써 배선 변이체를 고려로부터 적절하게 제거할 수 있다. 예를 들어, 변이체는 시간 T0에서 체세포 및 시간 T1에서 배선으로서 분류될 수 있다. 예를 들어, 변이체는 시간 T0에서 배선 및 시간 T1에서 체세포로서 분류될 수 있다. 예를 들어, 변이체는 시간 T0에서 배선으로서 분류되고, 시간 T1에서 분류되지 않을 수 있다. 예를 들어, 변이체는 시간 T0에서 체세포로서 분류되고, 시간 T1에서 분류되지 않을 수 있다. 배선 필터 (200)는 이같은 불일치를 해결하고 변이체 분류를 재할당하도록 구성된다.
도 2에 제시된 바와 같이, 단계 (201)에서, 변이체가 종양 억제 유전자 (TSG)에서 유해한 변이체 (예를 들어, 프레임 이동 또는 넌센스 돌연변이)인지 여부에 관해 서열 판독물 내의 적어도 하나의 변이체에 대해 결정이 이루어질 수 있다. 예를 들어, 변이체를 공지된 TSG의 데이터베이스와 비교할 수 있다. 변이체가 TSG에서 유해한 변이체인 경우, 변이체는 단계 (107/108)에서의 분류 결과와 무관하게 체세포로서 분류될 수 있다 (예를 들어, 분류는 배선에서 체세포로 변경될 것이다).
변이체가 TSG에서 유해한 변이체가 아닌 경우, 배선 필터 (200)는 단계 (202)에서 샘플에 존재하는 변이체의 최대 MAF 및 샘플 내의 적어도 하나의 변이체에 대한 최대 배수체 유전자의 분율을 결정할 수 있다. 단계 (203)에서, (적어도 2개의 시점 중 하나에서의) 변이체에 대한 최대 배수체 유전자의 분율이 변이체가 체세포이고, (적어도 2개의 시점 중 하나에서의) 변이체에 대한 MAF가 최대 MAF를 증가시키지 않음을 지시하는 경우, 변이체는 단계 (107/108)에서의 분류 결과와 무관하게 체세포로서 분류될 수 있다 (예를 들어, 분류는 배선에서 체세포로 변경될 것이다). 단계 (203)에서, (적어도 2개의 시점 중 하나에서의) 변이체에 대한 최대 배수체 유전자의 분율이 변이체가 배선이고, (적어도 2개의 시점 중 하나에서의) 변이체에 대한 MAF가 최대 MAF를 증가시킬 것을 지시하는 경우, 변이체는 단계 (107/108)에서의 분류 결과와 무관하게 배선으로서 분류될 수 있다 (예를 들어, 분류는 체세포에서 배선으로 변경될 것이다).
단계 (203)에서, 변이체에 대한 최대 배수체 유전자의 분율이 변이체가 체세포이고, 변이체에 대한 MAF가 최대 MAF를 증가시킬 것을 지시하거나 -또는- 변이체에 대한 최대 배수체 유전자의 분율이 변이체가 배선이고, 변이체에 대한 MAF가 최대 MAF를 증가시키지 않을 것을 지시하는 경우, 배선 필터 (200)는 단계 (204)에서 변이체가 (적어도 2개의 시점 중 하나에서) 임계치 백분율 미만에서 또 다른 환자 샘플에서 체세포로서 분류되는지 결정할 수 있다. 임계치 백분율은 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 또는 9%일 수 있다. 변이체가 임계치 백분율 미만에서 또 다른 환자 샘플에서 체세포로서 분류되는 경우, 변이체는 단계 (107/108)에서의 분류 결과와 무관하게 체세포로서 분류될 수 있다 (예를 들어, 분류는 배선에서 체세포로 변경될 것이다).
단계 (204)에서, 변이체가 <5%에서 또 다른 환자 샘플에서 체세포로서 분류되지 않는 경우, 배선 필터 (200)는 단계 (205)에서 (적어도 2개의 시점 중 하나에서의) 변이체에 대한 MAF가 샘플 내의 또 다른 MAF보다 더 큰지 결정할 수 있다. 예를 들어, 배선 필터 (200)는 변이체에 대한 MAF가 동일한 샘플 내의 하나 이상의 다른 MAF보다 적어도 약 2배 더 크거나, 3배 더 크거나, 4배 더 크거나, 5배 더 크거나, 6배 더 크거나, 7배 더 크거나, 8배 더 크거나, 9배 더 크거나, 또는 적어도 10배 더 큰지 결정할 수 있다. 샘플 내의 하나 이상의 다른 MAF는 예를 들어, 샘플 내의 max MAF에 대한 다음 가장 높은 체세포 MAF일 수 있다. 변이체에 대한 MAF가 샘플 내의 또 다른 MAF보다 더 큰 경우, 변이체는 단계 (107/108)에서의 분류 결과와 무관하게 배선으로서 분류될 수 있다 (예를 들어, 분류는 체세포에서 배선으로 변경될 것이다).
배선 필터 (200)는 단계 (205)에서 (적어도 2개의 시점 중 하나에서의) 변이체에 대한 MAF가 또 다른 샘플 내의 또 다른 MAF보다 더 큰지 결정할 수 있다. 예를 들어, 배선 필터 (200)는 변이체에 대한 MAF가 또 다른 샘플 내의 하나 이상의 다른 MAF보다 적어도 약 2배 더 크거나, 3배 더 크거나, 4배 더 크거나, 5배 더 크거나, 6배 더 크거나, 7배 더 크거나, 8배 더 크거나, 9배 더 크거나, 또는 적어도 10배 더 큰지 결정할 수 있다. 또 다른 샘플 내의 하나 이상의 다른 MAF는 예를 들어, 다른 샘플의 max MAF일 수 있다. 변이체에 대한 MAF가 또 다른 샘플 내의 또 다른 MAF보다 더 큰 경우, 변이체는 단계 (107/108)에서의 분류 결과와 무관하게 배선으로서 분류될 수 있다 (예를 들어, 분류는 체세포에서 배선으로 변경될 것이다).
단계 (205)에서, 변이체에 대한 MAF가 샘플 내의 또 다른 MAF보다 더 크지 않고, 또 다른 샘플 내의 또 다른 MAF보다 더 크지 않은 경우, 배선 필터 (200)는 단계 (107/108)에서의 분류 결과와 무관하게 변이체를 배선으로서 분류할 수 있다 (예를 들어, 분류는 체세포에서 배선으로 변경될 것이다).
배선으로서 분류된 그러한 변이체는 예를 들어, MAF 결정 및/또는 MR 점수화를 포함하는 추가의 분석으로부터 배제될 수 있다. 일부 실시양태에서, 변이체는 그러한 변이체가 적어도 하나의 환자 샘플에서 CHIP로서 분류되는 경우 CHIP 변이체로서 분류된다.
ii. CHIP 필터
cfDNA는 종양, 혈액 세포 등을 포함하는 임의의 세포 유형으로부터의 cfDNA의 집합을 포함할 수 있다. 잠재성 불명 클론성 조혈 돌연변이 (CHIP)는 심지어 cfDNA에 존재할 수 있다. CHIP 필터링을 위한 통상적인 접근법은 대형 공중 또는 내부 코호트 연구에 의해 엄선된 반복성 CHIP 유전자 또는 핫스팟을 레버리징한다. 그러나, 이러한 접근법은 혈장 단독 접근법에서 무작위 CHIP 돌연변이를 확인하는데 있어서의 난제를 다루지 않는다. 잔류 비필터링된 CHIP 변이체는 분율 변화를 1을 향해 편향시키고 (변경되지 않음), 따라서 부정확한 후속 분자 반응 예측을 생성할 것이다. 비공개 CHIP 변이체 (예를 들어, CHIP이지만 공지된 CHIP 변이체의 이전의 데이터베이스에서 한번도 또는 자주 문서화되지 않은 변이체)를 필터링하기 위해, 2개의 시점 사이의 돌연변이 측정을 사용하여 유사한 분율 변화의 변이체를 클러스터링할 수 있다. 환자가 치료를 받는 경우, 진행 또는 반응은 분율적 체세포 돌연변이를 발생시킬 것인 반면, CHIP 변이체는 안정하게 남아 있을 것이다. 돌연변이를 클론으로 클러스터링함으로써, 무작위 CHIP 변이체는 공지된 CHIP 목록의 풍부화를 갖는 클론에서 또는 안정한 분율적 차이를 갖는 클론에서 발견될 수 있다.
따라서, 2개의 시점 (T0 및 T1) 사이의 관찰을 레버리징하여 상이한 분율 변화를 갖는 클론에서 게놈 돌연변이를 클러스터링하는 CHIP 필터링의 개선이 본원에서 제공된다. CHIP 필터링은 사건을 클론으로 그룹화/클러스터링하여 % 클론 로드 변화를 추정할 수 있다. 클러스터링 절차는 각각의 단일 사건으로 출발하고, 이어서 신규한 클러스터링 발견법을 이용하여 병합될 수 있다. % 클론 로드 변화가 모든 사건을 사용하여 결정되면, 각각의 클론을 변이체의 조성 및 % 클론 로드 변화에 기초하여 점검하여 변이체가 CHIP 클론인지 결정할 수 있다.
한 실시양태에서, 게놈 돌연변이/변이체는 신규한 병합적 계층적 클러스터링 발견법을 이용하여 클러스터링된다. 발견법은 맞춤 차이점 계량을 통해 돌연변이/변이체 및 클러스터 사이의 통계적 차이점을 정량화한다. 최소 (또는 최대, 계량에 따라) 허용가능한 차이점 임계치가 충족될 때까지 병합을 계속하는 조정가능한 정지 규칙이 이용된다. 한 실시양태에서, 맞춤 차이점 계량은 클러스터링 발견법의 주어진 단계에서 병합될 고려 하인 돌연변이/변이체 및/또는 클러스터의 스케일링된 가능도의 곱 (제곱근으로 적용되지 않음)에 관하여 수치적 통합이 수행되도록 하는 바타차야(Bhattacharyya) 거리의 변형이다. 가능도는 통합의 지지에 비해 수치적으로 1로 통합되도록 스케일링된다. SNV 및 인델에 대해, 가능도는 클러스터링되는 변이체에 대한 MAF 결정을 알리는 관찰된 카운트 데이터의 베타-이항 모델 근사에 관하여 계산된다. 베타-이항 모델의 분산은 조정가능한 파라미터를 통해 설정된다. CNV에 대해, 가능도는 관심 돌연변이의 관찰된 배수 변화 추정값의 가우스 모델 근사에 관하여 계산되며, 가우스 모델의 가변성은 또한 조정가능한 파라미터를 통해 설정된다. 돌연변이의 병합은 일부 경우에, 클러스터링이 구간 접근법을 통해 수행되도록 신규한 방식으로 수행되고, 여기서 돌연변이의 제1 세트는 정지 규칙이 충족될 때까지 클러스터링되고, 이어서 돌연변이의 제2 세트가 도입되고, 추가의 병합적 단계는 가능하게는 동일한 차이점 계량 및 정지 규칙에 따라 수행된다. 일부 상황에서, 돌연변이의 제3 세트는 돌연변이의 제2 세트에 대한 클러스터링 발견법의 적용 후 유사한 방식으로 도입된다.
도 3에 제시된 한 실시양태에서, CHIP 필터 (300)는 단계 (301)에서 샘플 내의 각각의 돌연변이/변이체에 대한 스케일링된 가능도 함수 Pi(Ri)를 추정할 수 있고, 여기서 i=1,..., Imv는 총 Imv 자격 돌연변이/변이체가 관찰됨을 가정하여, 주어진 샘플에 대한 2개의 시점에 걸쳐 관찰된 각각의 고유한 자격 돌연변이/변이체에 대한 지수이다. 제시의 용이성을 위해, 본 발명자들은 제i 돌연변이/변이체에 대한 시점 1에서의 관찰된 돌연변이/변이체 카운트의 수를 로서 표시하고, 게놈 위치에서의 및 시점 1에서의 카운트의 총 수를 로서 표시한다. 시점 2를 제외하고는 를 유사하게 정의한다. 를 각각 시점 1 및 2로서 진정한 돌연변이/변이체 대립유전자 분율로서 정의한다. 발견법은 를 추정하고, 이어서 타당하게 동일한 것으로 간주될 수 있는 R i 값을 갖는 돌연변이/변이체를 함께 클러스터링하도록 디자인된다. 발견법의 한 실시양태는 하기와 같다:
Figure pct00012
Pi(Ri)는 하기와 같이 결정될 수 있다:
Figure pct00013
ci는 후보 ri 값의 지지에 걸쳐 Pi(Ri = ri)의 수치적 통합이 1과 같도록 계산된다. 이러한 예시 실시양태는 데이터가 이항 모델에 관하여 과-분산되지 않고, 베타-이항 모델의 보다 일반적인 부류의 특수한 경우에 상응함을 가정한다.
대략적 신뢰 구간은 Pi(Ri = ri)에 대한 스케일링된 가능도가 Ri 값에 대한 부적절한 사전 분포를 가정하여 Ri의 대략적 후방 밀도 추정값인 것으로 간주되는 접근법과 같은 가장 높은 밀도 구간을 통해서를 포함하는 다양한 방식으로 Ri에 대해 계산될 수 있다.
단계 (302)에서, 돌연변이/변이체의 세트는 P i (R i )에 따라 쌍별로 병합될 수 있다. 모든 가능한 쌍 {i', i*:i'i*; i',i* = 1,2,..., I mv }에 대해, P i' (R i' ), 및 P i* (R i* ) 사이의 차이점 척도 D(i',i*)는 변형된 바타차야 거리를 사용하여 계산된다. D(i',i*)의 보다 큰 값은 돌연변이 쌍 {i',i*}이 동일한 기저 분율 변화 분포로부터의 실현일 가능성이 보다 많음을 지시한다. 따라서, D(·,·)의 가장 큰 값을 갖는 돌연변이/변이체의 쌍은 단일 클론으로 병합될 수 있고, 그 클론에 대한 P i (R i )는 갱신될 수 있다. 쌍별 병합은 정지 기준이 충족되거나 모든 돌연변이/변이체가 단일 클론으로 병합될 때까지 계속될 수 있다. 임계치는 약 0.0005 내지 0.005의 범위의 값이고/거나 이를 포함할 수 있다.
단계 (303)에서, 클론의 수 및 시점 사이의 연관된 분율 변화는 신뢰 구간과 함께 보고될 수 있다. 미리 결정된 임계치 값 이상의 제1 및 제2 시점 사이의 분율 변화를 갖는 클론이 확인될 수 있다. 다중 클론이 확인되는 경우, 1에 가까운 분율 변화를 갖는 클론 및/또는 특이적인 공지된 CHIP 변이체를 갖는 클론은 잠재적 CHIP 변이체로서 분류될 수 있다. CHIP 변이체는 추가의 분석으로부터 배제될 수 있다. 일부 실시양태에서, 변이체는 그러한 변이체가 적어도 하나의 환자 샘플에서 CHIP로서 분류되는 경우 CHIP 변이체로서 분류될 수 있다.
도 4는 CHIP 필터 (300)의 예시 적용을 제시한다. 도 4는 병합 절차의 예에 상응한다. 예에서, 3개의 자격화된 돌연변이체가 확인된다. 도 4의 가장 좌측 패널은 R의 지지 (x-축)에 걸쳐 각각의 돌연변이체 (y-축)에 대한 스케일링된 가능도 함수를 나타낸다. 각각의 돌연변이체에 대한 스케일링된 가능도 함수의 제1 가능도 (라인 (403))에 상응하는 돌연변이체가 공지된 CHIP 돌연변이라고 가정한다. 가장 유사성을 갖는 좌측 패널 내의 돌연변이체는 별표로 표시된다. 중간 패널은 좌측 패널 내의 클론에 대한 스케일링된 가능도 함수의 제1 가능도 (라인 (403)) 및 제2 가능도 (라인 (401))의 병합으로부터의 생성된 병합된 가능도를 나타낸다. 좌측 패널로부터의 각각의 클론에 대한 스케일링된 가능도 함수의 제3 가능도 (라인 (402))는 병합에 의해 변경되지 않는 가능도 함수를 갖는다. 우측 패널은 최종 클론성을 나타낸다. 제2 가능도 (라인 (401)) 클론의 조성은 50% CHIP이기 때문에, 제2 가능도 (라인 (401)) 클론은 추정적으로 CHIP로서 확인될 수 있다. 이는 제3 가능도 (라인 (402)) 클론에 의해서만 정의되는 R의 최종 값을 초래할 것이다.
한 실시양태에서, 일부 실시양태에 따른 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 예시적인 방법 단계를 개략적으로 도시하는 흐름도가 도 5에 제시된다. 제시된 바와 같이, 방법 (500)은 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 각각의 복수의 변이체에 대한 종양 분율 변화에 대한 종양 부하 변화 (R) P(R)을 결정하여 종양 부하 변화의 세트를 생성하는 것을 포함한다 (단계 (501)). 또한, 방법 (500)은 종양 부하 변화의 세트로부터 하나 이상의 클론성 조혈 변이체에 상응하는 하나 이상의 저항성 시그니쳐를 확인하는 것을 또한 포함한다 (단계 (502)).
f. MR 점수
도 1로 돌아가서, 방법 (100)은 단계 (110)에서 MR 점수를 결정하는 것으로 진행할 수 있다. 한 실시양태에서, MR 점수는 단계 (109)에서의 변이체 필터링 후에 남아 있는 체세포 변이체와 연관된 MAF 값을 사용하여 결정될 수 있다. 한 실시양태에서, 모든 체세포 변이체의 MAF 값이 사용될 수 있다. 한 실시양태에서, 모든 체세포 변이체 미만의 MAF 값이 사용될 수 있다. 단계 (105/106)에서 기술된 바와 같이, T0 (예를 들어, 치료전) 및 T1 (예를 들어, 치료중)에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 판독물로부터의 복수의 체세포 변이체에 대해 MAF를 결정하여 복수의 체세포 변이체 내의 체세포 변이체에 대한 제1 및 제2 MAF의 세트를 생성할 수 있다. MR 점수는 분율로서 또는 백분율로서 표현될 수 있다. 도 6A에 제시된 바와 같이, MR 점수는 방법 (600)에 따라 결정될 수 있다. 방법 (600)은 단계 (601)에서 복수의 체세포 변이체 내의 체세포 변이체에 대한 제1 MAF 및 제2 MAF의 비를 결정하여 MAF 비의 세트 및 MAF 비의 세트 내의 MAF 비에 대한 상응하는 표준 편차를 생성하는 것을 포함할 수 있다. 일부 실시양태에서, 표준 편차는 MR 점수를 보고하기 위한 기준으로서 이용될 수 있다. 예를 들어, 적어도 하나의 변이체의 개별적인 표준 편차에 기초하여, MR 점수의 표준 편차를 사용하여 신뢰 구간 및 샘플 평가성을 위한 후속 컷오프를 결정할 수 있다. 일부 실시양태에서, 컷오프는 적어도 0.1, 0.15, 0.2, 0.3, 0.4 또는 0.5일 수 있다. 단계 (602)에서, 대상체에 대해, MAF 비의 가중 평균은 하기 식을 사용하여 결정될 수 있다:
Figure pct00014
여기서 중량은 복수의 체세포 변이체 내의 주어진 체세포 변이체에 대한 1/범위^2이고, 여기서 범위는 복수의 체세포 변이체 내의 주어진 체세포 변이체에 대한 제1 및 제2 MAF의 값 사이의 차이이고, 비는 MAF 비의 세트 내의 주어진 MAF 비이다. 신뢰 구간은 하기 식을 사용하여 결정될 수 있다:
MAF 비의 가중 평균 +/- ,
여기서 비 분산은
Figure pct00016
이다.
한 실시양태에서, MR 점수로서 MAF 비의 가중 평균에 추가적으로, 또는 그에 대한 대안으로서, MAF 비에 기초하여 변이체를 클러스터링하고, 클러스터에 대한 합계 MAF 비를 계산하고, 이어서 MR 점수로서 단일 선택된 클러스터 비 또는 클러스터 비의 가중 평균 중 한쪽을 사용하는 방법이 개시된다. 클러스터링은 중첩하는 MAF 비 분포를 갖는 변이체의 쌍을 조합하는 것, 또는 다른 클러스터링 방법에 의해 수행될 수 있다. 단일 선택된 클러스터는 공지된 암 유도자 변이체, 또는 공지된 클론성 조혈 변이체의 부재를 함유하는 것일 수 있다. 클러스터 중량은 클러스터 내의 공지된 암 유도자 변이체의 존재 또는 변이체의 최대 VAF 또는 수에 또한 좌우될 수 있다.
도 6B에 제시된 바와 같이, MR 점수는 방법 (610)에 따라 결정될 수 있다. 방법 (610)은 단계 (601)에서 복수의 체세포 변이체 내의 체세포 변이체에 대한 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균 및 가중 MAF 비에 대한 상응하는 표준 편차를 결정하는 것을 포함할 수 있다. 일부 실시양태에서, 표준 편차는 MR 점수를 보고하기 위한 기준으로서 이용될 수 있다. 예를 들어, 적어도 하나의 변이체의 개별적인 표준 편차에 기초하여, MR 점수의 표준 편차를 사용하여 신뢰 구간 및 샘플 평가성을 위한 후속 컷오프를 결정할 수 있다. 일부 실시양태에서, 컷오프는 적어도 0.1, 0.15, 0.2, 0.3, 0.4 또는 0.5일 수 있다. 단계 (612)에서, 대상체에 대해, MAF의 가중 평균의 비가 결정될 수 있다. 비의 분산으로서 신뢰 구간. 예를 들어, 신뢰 구간은 하기 식을 사용하여 결정될 수 있다:
R = A/B: var(R) ~= var(B)/A^2 + var(A)*B^2/A^4
여기서 A 및 B는 각각 시점 1 및 시점 2에서의 가중 평균 MAF이다.
클러스터는 증거의 강도에 기초하여 가중화될 수 있다. 예를 들어, max-VAF는 어느 것이 1차 클론인지 지시할 수 있고, 비-CHIP 변이체의 수는 보다 강한 신호를 갖는 클러스터를 가중화할 수 있고; 유도자 중량은 중량을 증가시키거나 또는 그 특정한 암 유형 또는 분자 하위유형에 대한 유도자를 함유하는 클러스터를 선택할 수 있다. 적용된 가중화는 예를 들어, 특이적 암 유형 또는 분자 하위유형 내의 유도자인 것으로 공지된 변이체에 보다 큰 중량을 적용하고 있을 수 있다. 한 실시양태에서, 중량은 max-VAF (한쪽 샘플), 비-CHIP 변이체의 수, 및/또는 유도자 중량 (종양-유형-특이적; 배치 파일에서 정의됨)에 기초할 수 있다. 또 다른 실시양태에서, 적용된 가중화는 예를 들어, 체세포 변이체를 동등하게 가중화하는 것일 수 있다.
한 실시양태에서, 분자 반응자 또는 분자 비-반응자로서의 분류는 변이체 VAF 및 변이체 중량에 좌우될 수 있다. 예를 들어, MR 점수가 평균 VAF의 비인 경우, 보다 높은 VAF (즉, 보다 많은 클론성 변이체)가 우세할 가능성이 있다. MR 점수가 변이체 중량을 사용하는 경우, 보다 높은 중량을 갖는 변이체 (예를 들어, 유도자 변이체)가 우세할 수 있다.
도 6A에 기술된 바와 같은 생성된 MAF 비의 가중 평균 또는 도 6B에 기술된 바와 같은 MAF의 가중 평균의 비는 대상체에 대한 MR 점수이다. 이같은 MR 점수는 MAF의 분산을 분자 반응 계산 내로 혼입한다. 이는 분자 반응 점수가 분자 반응으로부터 정확한 결론을 도출하는데 기여하는 정확한 분산을 포함하는 것을 보장한다. MR 점수는 MAF 내의 정밀도에 기초하여 MAF의 변화를 적절하게 가중화하고, MAF가 검출의 한계 (LOD) 부근에서 변동하고 있는 경우 과신뢰적이고 부정확한 결과를 허용하지 않은 평균 MAF의 "수치적으로 안정한" 비로서 검토될 수 있다. MR 점수를 임계치와 비교하여 대상체가 치료에 반응하고 있는지 또는 치료에 반응하고 있지 않는지 결정할 수 있다. 임계치는 예를 들어, 약 25% 내지 약 75%이고/거나 이를 포함할 수 있다. 일부 실시양태에서, 가중화는 VAF 정밀도 (예를 들어 위치, 핫스팟 영역, 커버리지 깊이 등) 또는 종양에 대한 그 변이체의 중요성의 사전 지식 (예를 들어 공지된 유도자 또는 저항성 돌연변이, 또는 불확실한 (또는 미지의) 유의성의 변이체)에 기초할 수 있다.
본원에 제시된 MR 점수화 방법이 다루는 문제의 측면을 예시하는 간단한 예를 제공하기 위해, 기준선 (T0)에서 0.3%의 MAF, 및 치료중 (T1)에 MAF 0.1%, 및 3000개의 분자의 그 변이체 위치에서의 커버리지를 갖는 검출되는 하나의 변이체를 갖는 대상체를 고려한다. 기존의 방법을 사용하면, 분자 반응 점수는 일 것이다. 50%의 "분자 반응자" 대 "분자 비-반응자"를 정의하기 위한 컷오프에 대해, 이 대상체는 "분자 반응자"일 것이다. 그러나, 본원에 기술된 방법에 따라 분산을 전파하는 것은 ~30 내지 40%의 예상된 값을 갖는 분자 반응 점수, 그러나 0 내지 120%의 95% 신뢰 구간을 초래한다. 따라서, 이 대상체에 대해, 분자 반응은, MR 점수가 진정하게 50% 컷오프 미만 또는 초과인지 여부가 확신 있게 평가될 수 없기 때문에, 평가가능하지 않은 것으로 간주되어야 한다.
본원에 제시된 MR 점수화 방법이 다루는 문제의 측면을 예시하는 간단한 예를 제공하기 위해, 기준선 (T0)에서 a = 0.1% 및 b = 8.0%의 MAF, 및 치료중 (T1)에 a = 0.3% 및 b = 2.0%의 MAF를 갖는 2개의 변이체 (a 및 b)가 검출된 대상체를 고려한다. 비의 평균을 취하는 기존의 방법을 사용하면, 분자 반응 점수는
Figure pct00018
일 것이다. 50%의 "분자 반응자" 대 "분자 비-반응자"를 정의하기 위한 컷오프에 대해, 이 대상체는 "분자 비-반응자"일 것이다. 그러나, 본원에 기술된 방법에 따른 평균의 비를 사용하면, 분자 반응 점수는
Figure pct00019
일 것이다. 따라서, 이 대상체에 대해, 분자 반응은 "분자 반응자"로 간주되어야 한다.
본원에 제시된 MR 점수화 방법이 다루는 문제의 측면을 예시하는 간단한 예를 제공하기 위해, 기준선 (T0)에서 a = 0.3% 및 b = 0.0%의 MAF, 및 치료중 (T1)에 a = 0.0% 및 b = 0.3%의 MAF를 갖는 2개의 변이체 (a 및 b)가 검출된 대상체를 고려한다. 단지 기준선에서 0.3% 초과의 변이체만을 평가하는 기존의 방법을 사용하면, 분자 반응 점수는
Figure pct00020
일 것이다. 50%의 "분자 반응자" 대 "분자 비-반응자"를 정의하기 위한 컷오프에 대해, 이 대상체는 "분자 반응자"일 것이다. 그러나, 치료중에 발생하는 변이체를 포함하면, 분자 반응 점수는
Figure pct00021
일 것이다. 따라서, 이 대상체에 대해, 분자 반응은 "분자 비-반응자"로 간주되어야 한다.
방법 (100)은 적어도 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여하는 것을 포함할 수 있다. 예시적인 요법은 본원에 추가로 개시된다. 일부 실시양태에서, 방법 (100)은 암을 갖는 대상체에 대한 분자 반응 점수를 미리 결정된 컷오프 포인트와 비교하여, 분자 반응 점수가 미리 결정된 컷오프 포인트 미만인 경우 대상체가 암에 대한 하나 이상의 요법 (예를 들어, 면역요법 등)에 대한 가능성 있는 반응자인 것 또는 분자 반응 점수가 미리 결정된 컷오프 포인트 이상인 경우 대상체가 암에 대한 하나 이상의 요법에 대한 가능성 있는 비-반응자인 것을 확인하는 것을 포함한다. 일부 실시양태에서, 방법 (100)은 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 포함한다. 일부 실시양태에서, 방법 (100)은 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 중단하는 것을 포함한다. 일부 실시양태에서, 방법 (100)은 분자 반응 점수를 대상체에 대한 예후적 바이오마커 및/또는 예측적 바이오마커로서 사용하는 것을 포함한다.
다른 예시적인 실시양태에서, 분산을 적어도 하나의 변이체의 분산 분포로부터의 시뮬레이션 또는 샘플링을 통해 분자 반응 계산 내로 혼입하여 분자 반응 분산을 계산한다. 본원에 추가로 개시된 바와 같이, 일부 적용은 종양 또는 종양의 가능성 대 클론성 조혈에 있어서의 그들의 중요성에 기초하여 변이체를 가중화하는 것을 포함한다. 일부 실시양태는 다중 게놈 데이터 공급원을 통합하여 다른 게놈 데이터 공급원 중에서도 종양 분율 (단지 변이체 (예를 들어, SNV, 인델 및 융합) VAF에 의존하는 대신), 커버리지 (예를 들어, 카피 수), 오프-타겟 커버리지, 및/또는 메틸화를 추정하는 것을 수반한다.
일부 실시양태에서, 방법은 하나 이상의 추가의 게놈 데이터 공급원을 사용하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 포함한다. 일부 실시양태에서, 추가의 게놈 데이터 공급원은 커버리지, 오프-타겟 커버리지, 후성유전학적 시그니쳐, 종양 돌연변이 부담 및/또는 미세부수체 불안정성 점수 중 하나 이상을 포함한다. 데이터 공급원에 대해, 그 데이터 공급원에 기초하여 종양 분율의 계산이 있을 수 있고, 계산된 종양 분율은 데이터 공급원에 걸쳐 조합될 수 있고 (예를 들어 가중 평균을 사용하여, 그 특정한 샘플에 대한 종양 분율 내의 데이터 공급원의 신뢰성을 혼입함), 이어서 샘플 내의 전체 종양 분율 추정값을 조합하여 전체 분자 반응을 계산할 수 있다. 일부 실시양태에서, 후성유전학적 시그니쳐는 cfNA 단편 길이, 위치, 및/또는 종점 밀도 분포를 포함한다. 일부 실시양태에서, 후성유전학적 시그니쳐는 주어진 표적화된 게놈 영역 내의 하나 이상의 후성유전학적 유전자좌에 의해 나타내어지는 후성유전학적 상태 또는 상황을 포함한다. 일부 실시양태에서, 후성유전학적 상태 또는 상황은 메틸화, 히드록시메틸화, 아세틸화, 유비퀴틸화, 인산화, 수모일화, 리보실화, 시트룰린화, 및/또는 히스톤 번역후 변형 또는 다른 히스톤 변이의 존재 또는 부재를 포함한다.
본 방법은 도 1 및 제1 시간 T0 및 제2 시간 T1의 맥락에서 기술되지만, 예를 들어 종적 모니터링을 위해, 2개 초과의 시점이 구상됨을 이해하여야 한다. 도 7에 제시된 바와 같이, 제1 시간 T0에서, 기준선 cfDNA는 치료 전에 하나 이상의 대상체로부터 수득된 하나 이상의 기준선 샘플로부터 수득될 수 있고, 제2 시간 T1, 또는 임의의 후속 시간 Tn에서, 치료중 cfDNA는 치료 후에 하나 이상의 대상체로부터 수득된 하나 이상의 치료중 샘플로부터 수득될 수 있다. 시간 T1은 시간 T0 후 임의의 양의 시간, 예를 들어, 1 내지 24시간, 1 내지 180일, 1 내지 12주, 1 내지 25주, 1 내지 30주 등 사이의 및 이를 포함하는 임의의 시간일 수 있다. 더욱이, 방법 (100)은 시간 T0, T1, ..., Tn의 임의의 조합에 적용될 수 있다. 예를 들어, 샘플은 시간 T1에서 및 시간 T2에서 수득될 수 있고, 여기서 양쪽 모두의 시간에서 취한 샘플은 치료중 샘플이다. 또 다른 예에서, 샘플은 시간 T1에서 및 시간 T2에서 수득될 수 있고, 여기서 시간 T1에서 취한 샘플은 치료중 샘플을 나타내고, 시간 T2에서 취한 샘플은 치료가 끝난 샘플을 나타낸다.
한 실시양태에서, 대상체에게 투여되는 요법의 투여량은 분자 반응 점수에 기초하여 조정될 수 있다. 예를 들어, 분자 반응 점수는 대상체가 제1 치료에 반응하고 있지 않음을 지시할 수 있고, 제1 치료의 투여량은 반응에서 증가될 수 있다. 한 실시양태에서, 대안적 요법은 분자 반응 점수에 기초하여 확인될 수 있다. 예를 들어, 분자 반응 점수는 대상체가 제1 치료에 대해 반응하고 있지 않음을 지시할 수 있고, 대상체는 이어서 제1 치료 대신, 또는 그에 추가로 제2 치료에 처해질 수 있다. 한 실시양태에서, 분자 반응 점수는 임상 시험에서 대상체에 대해 결정될 수 있고, 여기서 분자 반응 점수는 위약을 받는 대상체에 대해 및 치료를 받는 대상체에 대해 결정될 수 있다. 대상체의 2개의 카테고리의 분자 반응 점수를 비교하여 치료를 평가할 수 있다.
또 다른 예에서, 위약 및 치료는 약물의 상이한 조합을 비교하는 임상 시험의 2개의 부문으로 일반화될 수 있다. 임계치 또는 컷오프는 사용 사례에 특이적일 수 있다: 사용 사례는 청소 (MR=0)를 요구할 수 있거나, 또는 사용 사례는 ctDNA 수준의 감소 또는 증가의 특정 수준을 요구할 수 있다.
도 8은 환자 계층화를 위한 분자 반응 점수의 예시 실제적 적용을 제시한다. 진행성 암 환자는 치료 전에 시간 T0에서 결정된 기준선 MAF를 가질 수 있다. 4 내지 10주의 치료 후, 진행성 암 환자는 시간 T1에서 결정된 치료중 MAF를 가질 수 있다. 생성된 분자 반응 점수는 환자 내의 ctDNA가 감소하고 있음을 지시할 수 있으며, 이 경우 환자는 1차 시험 약물로 치료되기를 계속해야 한다. 생성된 분자 반응 점수는 환자 내의 ctDNA가 증가하고 있음을 지시할 수 있으며, 이 경우 환자는 환자가 대조군 그룹에 있는 경우 1차 시험 약물로 (또는 위약으로) 치료되기를 계속해야 한다. 다른 방식으로, 환자 내의 ctDNA가 증가하고 있는 경우, 환자는 그들의 치료 요법에 부가되는 하나 이상의 요법, 변경된 요법, 또는 변경된 1차 시험 약물의 용량을 가져야 한다.
도 9는 임상 시험 풍부화를 위한 분자 반응 점수의 예시 실제적 적용을 제시한다. 치료의 표준 (SOC) 치료에 대해 적격인 진행성 암 환자는 SOC 치료 전에 시간 T0에서 결정된 기준선 MAF를 가질 수 있다. 4 내지 10주의 SOC 치료 후, 진행성 암 환자는 시간 T1에서 결정된 치료중 MAF를 가질 수 있다. 생성된 분자 반응 점수는 환자 내의 ctDNA가 감소하고 있음을 지시할 수 있으며, 이 경우 환자는 SOC 치료로 치료되기를 계속해야 한다. 생성된 분자 반응 점수는 환자 내의 ctDNA가 증가하고 있음을 지시할 수 있으며, 이 경우 환자는 임상 시험 약물로의 치료에 적격인 것으로 결정될 수 있다.
도 10EGFR-양성 비-소세포 폐암 (NSCLC)을 갖는 환자에서 오시메르티닙 +/- 화학요법의 MSKCC 시험을 위한 전향적 환자 계층화 및 증량에 대한 분자 반응 점수의 예시 실제적 적용을 제시한다. EGFR-양성 NSCLC를 갖는 새롭게 진단된 환자는 오시메르티닙 전에 시간 T0에서 결정된 기준선 MAF를 가질 수 있다. 1 사이클의 오시메르티닙 후, 환자는 오시메르티닙의 사이클 2의 제1일에 결정된 치료중 MAF를 가질 수 있다. 단지 EGFR 유도자에 기초하여, 생성된 분자 반응 점수는 EGFR 유도자가 검출되지 않음을 지시할 수 있으며, 이 경우 환자는 단지 오시메르티닙으로 치료되기를 계속해야 한다. 단지 EGFR 유도자에 기초하여, 생성된 분자 반응 점수는 EGFR 유도자가 검출됨을 지시할 수 있으며, 이 경우 환자는 오시메르티닙, 카르보플라틴, 및 페메트렉시드로 치료되기를 계속해야 한다.
이러한 방법의 측면은 도 11에 추가로 예시된다. 제시된 바와 같이, 방법 (1100)은 제1 (예를 들어, 치료전) 및 제2 (예를 들어, 치료중) 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하는 것을 포함한다 (단계 (1101)). 방법 (1100)은 복수의 변이체 내의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 MAF 비에 대한 상응하는 표준 편차를 생성하는 것을 또한 포함한다 (단계 (1102)). 또한, 방법 (1100)은 MAF 비의 가중 평균 (단계 (1103)) 및 신뢰 구간을 계산하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 또한 포함한다.
일부 실시양태에서, 방법 (1100)은 암을 갖는 대상체에 대한 분자 반응 점수를 미리 결정된 컷오프 포인트와 비교하여, 분자 반응 점수가 미리 결정된 컷오프 포인트 미만인 경우 대상체가 암에 대한 하나 이상의 요법 (예를 들어, 면역요법 등)에 대한 가능성 있는 반응자인 것 또는 분자 반응 점수가 미리 결정된 컷오프 포인트 이상인 경우 대상체가 암에 대한 하나 이상의 요법에 대한 가능성 있는 비-반응자인 것을 확인하는 것을 포함한다. 일부 실시양태에서, 방법 (1100)은 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 포함한다. 일부 실시양태에서, 방법 (1100)은 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 중단하는 것을 포함한다. 일부 실시양태에서, 방법 (1100)은 분자 반응 점수를 대상체에 대한 예후적 바이오마커 및/또는 예측적 바이오마커로서 사용하는 것을 포함한다.
일부 실시양태에서, 방법 (1100)은 분자 카운트를 사용하여 MAF 비의 세트 내의 MAF 비에 대한 표준 편차를 계산하는 것을 포함한다. 일부 실시양태에서, 방법 (1100)은 MAF 비의 세트 내의 MAF 비를 통해 분산을 전파하는 것을 포함한다. 일부 실시양태에서, 방법 (1100)은 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하는 경우 하나 이상의 배선 및/또는 클론성 조혈 변이체를 배제하는 것을 포함한다. 배선 및 CHIP 변이체를 배제하는 방법의 예는 본원에 추가로 기술된다. 일부 실시양태에서, 방법 (1100)은 제1 및/또는 제2 시점에서 약 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 미만인 MAF를 갖는 하나 이상의 체세포 변이체를 배제하는 것을 포함한다. 일부 실시양태에서, 방법은 제1 및/또는 제2 시점에서 5, 10, 15, 20, 25 또는 30 돌연변이체 분자 카운트 미만의 하나 이상의 체세포 변이체를 배제하는 것을 포함한다. 일부 실시양태에서, 방법은 제1 및/또는 제2 시점에서 300, 400, 500, 600, 700, 800, 900 또는 1000 미만의 커버리지를 갖는 하나 이상의 체세포 변이체를 배제하는 것을 포함한다. 일부 이러한 실시양태에서, 제1 시점은 치료전 시점을 포함하고, 여기서 제2 시점은 치료중 또는 치료후 시점을 포함한다.
일부 실시양태에서, 본원에 개시된 방법은 샘플 내의 하나 이상의 조직 또는 세포로부터 수득된 핵산 분자로부터 서열 정보를 생성하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법은 대상체로부터 수득된 샘플 내의 무세포 핵산 (cfNA)으로부터 서열 정보를 생성하는 것을 포함한다. 일부 실시양태에서, cfNA는 순환 종양 DNA (ctDNA)를 포함한다.
일부 실시양태에서, 비는 복수의 변이체 내의 변이체에 대한 제2 MAF 대 제1 MAF를 포함한다. 일부 실시양태에서, 방법 (1100)은 하기 식을 사용하여 MAF 비의 가중 평균을 계산하는 것을 포함한다:
합계[중량 * 비]/합계[중량]
여기서 중량은 복수의 변이체 내의 주어진 변이체에 대한 1/범위2이고, 여기서 범위는 복수의 변이체 내의 주어진 변이체에 대한 제1 및 제2 MAF의 값 사이의 차이이고, 비는 MAF 비의 세트 내의 주어진 MAF 비이다. 일부 실시양태에서, 방법 (1100)은 하기 식을 사용하여 신뢰 구간을 계산하는 것을 포함한다:
MAF 비의 가중 평균 +/- sqrt[비 분산]
여기서 비 분산은 1/합계[중량]이다.
일부 실시양태에서, 변이체는 하나 이상의 단일-뉴클레오티드 변이체 (SNV), 삽입/결실 돌연변이 (인델), 유전자 증폭, 및/또는 유전자 융합을 포함한다. 일부 실시양태에서, 방법 (1100)은 하나 이상의 추가의 게놈 데이터 공급원을 사용하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 포함한다. 일부 실시양태에서, 추가의 게놈 데이터 공급원은 커버리지, 오프-타겟 커버리지, 후성유전학적 시그니쳐, 및/또는 미세부수체 불안정성 점수 중 하나 이상을 포함한다. 일부 실시양태에서, 후성유전학적 시그니쳐는 cfNA 단편 길이, 위치, 및/또는 종점 밀도 분포를 포함한다. 일부 실시양태에서, 후성유전학적 시그니쳐는 주어진 표적화된 게놈 영역 내의 하나 이상의 후성유전학적 유전자좌에 의해 나타내어지는 후성유전학적 상태 또는 상황을 포함한다. 일부 실시양태에서, 후성유전학적 상태 또는 상황은 메틸화, 히드록시메틸화, 아세틸화, 유비퀴틸화, 인산화, 수모일화, 리보실화, 시트룰린화, 및/또는 히스톤 번역후 변형 또는 다른 히스톤 변이의 존재 또는 부재를 포함한다.
추가로 예시하기 위해, 도 12A는 예시 방법 (1200)을 개략적으로 도시하는 흐름도이다. 제시된 바와 같이, 방법 (1200)은 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하는 것을 포함한다 (단계 (1201)). 방법 (1200)은 복수의 변이체 내의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 MAF 비에 대한 상응하는 표준 편차를 생성하고 (단계 (1202)), MAF 비의 가중 평균 및 신뢰 구간을 계산하여 대상체에 대한 분자 반응 점수를 결정하는 것 (단계 (1203))을 또한 포함한다. 일부 실시양태에서, 표준 편차는 신뢰 구간의 추정값으로서 이용될 수 있다. 일부 실시양태에서, 표준 편차는 분자 반응 점수를 보고하기 위한 기준으로서 이용될 수 있다. 또한, 방법 (1200)은 적어도 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여하는 것을 또한 포함한다 (단계 (1204)). 예시적인 요법은 본원에 추가로 개시된다.
도 12B는 예시 방법 (1210)을 개략적으로 도시하는 흐름도이다. 제시된 바와 같이, 방법 (1210)은 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하는 것을 포함한다 (단계 (1211)). 방법 (1210)은 단계 (1212)에서 시점 (즉, 제1 시점 및 제2 시점)에 대해 고려된 체세포 변이체의 MAF로부터 수득된 중심 경향성 척도를 결정하는 것을 포함한다. 중심 경향성 척도는 평균, 중위값, 또는 최빈값 중 하나일 수 있지만, 이에 제한되지 않음이 이해된다. 방법 (1210)은 단계 (1213)에서 제1 시점에서의 중심 경향성 척도 대 제2 시점에서의 중심 경향성 척도의 비를 결정하는 것을 포함한다. 방법 (1210)은 고려된 MAF의 표준 편차를 사용하여 중심 경향성 비의 표준 편차를 계산하는 것을 포함할 수 있다. 일부 실시양태에서, 중심 경향성 척도는 평균 또는 중위값일 수 있다. 일부 실시양태에서, 중심 경향성 척도는 평균일 수 있다. 일부 실시양태에서, 중심 경향성 척도는 중위값일 수 있다. 일부 실시양태에서, 방법 (1210)은 단계 (1212)에서 각각의 시점 (즉, 제1 시점 및 제2 시점)에 대해 고려된 체세포 변이체의 MAF의 평균을 결정하고; 단계 (1213)에서 제1 시점에서 수득된 평균 대 제2 시점에서 수득된 평균의 비를 계산하고, 고려된 각각의 MAF의 표준 편차를 사용하여 평균 비의 표준 편차를 계산하는 것을 포함한다. 일부 실시양태에서, 분자 반응 점수는 제1 시점에서 수득된 평균 대 제2 시점에서 수득된 평균의 비로부터 계산될 수 있다. 일부 실시양태에서, 방법 (1210)은 단계 (1212)에서 각각의 시점 (즉, 제1 시점 및 제2 시점)에 대해 고려된 체세포 변이체의 MAF의 중위값을 결정하고; 단계 (1213)에서 제1 시점에서 수득된 중위값 대 제2 시점에서 수득된 중위값의 비를 계산하고, 고려된 각각의 MAF의 표준 편차를 사용하여 중위값 비의 표준 편차를 계산하는 것을 포함한다. 일부 실시양태에서, 분자 반응 점수는 제1 시점에서 수득된 중위값 대 제2 시점에서 수득된 중위값의 비로부터 계산될 수 있다. 일부 실시양태에서, 표준 편차는 신뢰 구간의 추정값으로서 이용될 수 있다. 일부 실시양태에서, 표준 편차는 분자 반응 점수를 보고하기 위한 기준으로서 이용될 수 있다. 또한, 방법 (1210)은 적어도 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여하는 것을 또한 포함한다 (단계 (1214)). 예시적인 요법은 본원에 추가로 개시된다.
전형적으로, 분자 반응 점수를 결정하는 방법은 CHIP 변이체를 필터링하는 것을 포함한다. 예를 들어, 분자 반응은 종양 분율 변화를 나타내는 게놈 교번 (예를 들어, 2개의 시점 사이의 작은 변이체)의 대립유전자 빈도에 의해 전형적으로 측정된다. cfDNA 신호는 종양, 혈액 세포 등을 포함하는 본질적으로 임의의 세포 유형으로부터의 신호의 합계임을 고려하여, 다수의 연구는 cfDNA 샘플 내의 잠재성 불명 클론성 조혈 (CHIP) 변이체의 존재를 제시하였다. CHIP 필터링을 위한 통상적인 접근법은 다양한 데이터 공급원에 의해 엄선된 반복성 CHIP 유전자 또는 핫스팟을 빈번히 레버리징한다. 그러나, 혈장 단독 접근법으로 무작위 CHIP 돌연변이를 확인하는 것은 아직 난제이다. 잔류 비필터링된 CHIP 변이체는 전형적으로 분율 변화를 1을 향해 편향시키고 (변경되지 않음), 따라서 부정확한 분자 반응 예측 또는 점수를 생성한다. 따라서, 일부 실시양태에서, 본원에 개시된 방법은 별개의 분율 변화를 갖는 클론 내의 게놈 돌연변이를 클러스터링하기 위해 2개의 시점 사이의 관찰을 레버리징하는 모델을 사용한다. 돌연변이를 그룹화하기 위해, 이들 접근법은 2개의 시점으로부터의 변이체에 대한 변이체 대립유전자 카운트 및 총 카운트를 전형적으로 레버리징하고, 종양 분율 변화 R에 대한 확률 밀도 함수를 P(R)로서 수립한다.
추가의 예시로서, 도 13은 일부 실시양태에 따른 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 예시적인 방법 단계를 개략적으로 도시하는 흐름도이다. 제시된 바와 같이, 방법 (1300)은 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체의 변이체에 대한 종양 분율 변화에 대한 확률 밀도 함수 P(R)을 계산하는 것을 포함한다 (단계 (1301)). 추가적으로 제시된 바와 같이, 방법 (1300)은 변이체의 하나 이상을 P(R)에 의해 하나 이상의 클론으로 그룹화하고 (단계 (1302)), 클론들의 클론에 대한 갱신된 P(R)을 생성하고 (단계 (1303)), 미리 결정된 임계치 값 이상의 제1 및 제2 시점 사이의 분율 변화를 갖는 하나 이상의 클론을 확인하는 것 (단계 (1304))을 포함한다.
다른 측면에서, 본 개시내용은 배선 변이체를 확인하고 배제하거나, 또는 다른 방식으로 분자 반응 점수를 결정하는 경우 체세포 분류 불일치를 해결하는 방법을 제공한다. 예를 들어, 하나의 문제는 환자의 치료 과정의 과정에 걸쳐 수집된 샘플이 상이한 수준의 종양 쉐딩 및 대립유전자 불균형을 전형적으로 갖는다는 것이며, 이는 주어진 생물정보학 파이프라인의 체세포 변이체 콜러가 때때로 동일한 환자에서 동일한 변이체에 대한 상이한 체세포 분류에 도달할 것임을 의미한다. 분자 반응 결정의 목표는 치료의 과정에 걸쳐 체세포 변이체를 추적하는 것이기 때문에, 임의의 분류 불일치를 해결하여 배선 변이체를 고려로부터 적절하게 제거해야 한다.
예시하기 위해, 도 14는 일부 실시양태에 따른 암을 갖는 대상체에서 변이체를 확인하는 예시적인 방법 단계를 개략적으로 도시하는 흐름도이다. 제시된 바와 같이, 방법 (1400)은 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 주어진 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하는 것을 포함한다 (단계 (1401)). 방법 (1400)은 주어진 변이체에 대한 결정된 MAF를 이용하여 주어진 변이체를 배선 또는 체세포 변이체로서 확인할 수 있다. 일부 실시양태에서, 방법 (1400)은 주어진 변이체에 대한 기준선 MAF 및 후속 치료중 MAF를 이용하여 주어진 변이체를 배선 또는 체세포 변이체로서 분류하거나, 또는 주어진 변이체의 이전의 분류를 변경할 수 있다. 방법 (1400)은 주어진 변이체의 MAF가 최대 배수체 유전자의 분율 (max frac_diploid) (즉, 최소 대립유전자 불균형)을 포함하는 (적어도 2개의 시점 중 하나에서의) 샘플의 max MAF를 증가시키는 경우 및/또는 주어진 변이체의 MAF가 대상체로부터 수득된 샘플 또는 또 다른 환자 샘플로부터 결정된 하나 이상의 다른 MAF (예를 들어, 샘플 내의 max MAF)보다 적어도 약 2배 더 크거나, 3배 더 크거나, 4배 더 크거나, 5배 더 크거나, 6배 더 크거나, 7배 더 크거나, 8배 더 크거나, 9배 더 크거나, 또는 적어도 10배 더 큰 경우 주어진 변이체가 배선 변이체인 것을 확인하는 것을 또한 포함할 수 있다. 일부 실시양태에서, 주어진 변이체는 그것이 max frac_diploid를 갖는 적어도 2개의 시점 중 하나에서 샘플의 max MAF를 (예를 들어, 또 다른 MAF에 비해) 상승시키지 않는 경우 체세포로서 분류된다. 일부 실시양태에서, 주어진 변이체는 그것이 max MAF를 상승시키고, max frac_diploid를 갖는 샘플이 배선인 경우 배선으로서 분류된다. 일부 실시양태에서, 방법 (1400)은 주어진 변이체를 그 변이체가 종양 억제자 유전자 (TSG) 내의 유해한 변이체 (예를 들어, 프레임 이동 또는 넌센스 돌연변이)인 것으로 결정되는 경우 체세포로서 분류하는 것을 포함한다. 일부 실시양태에서, 주어진 변이체는 그것이 임의의 주어진 샘플에서 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 또는 9% 미만으로 보이는 경우 체세포로서 분류된다. 일부 실시양태에서, 주어진 변이체는 관련된 불일치가 방법 (1400)에 의해 해결되지 않는 경우 배선으로서 분류된다. 이러한 실시양태에서, 변이체는 주어진 분자 반응 점수를 결정하는 경우 추가의 고려로부터 전형적으로 제거된다. 일부 실시양태에서, 변이체는 그러한 변이체가 적어도 하나의 환자 샘플에서 CHIP로서 분류되는 경우 CHIP 변이체로서 분류된다.
도 15는 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하는 것 (단계 (1501))을 포함하는 방법 (1500)을 개략적으로 도시하는 흐름도이다. 추가적으로 제시된 바와 같이, 방법 (1500)은 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1502)), MAF 비를 결정하고 (단계 (1503)), MAF 비의 가중 평균을 결정하고 (단계 (1504)), MAF 비의 가중 평균과 연관된 신뢰 구간을 결정하고 (단계 (1505)), MAF 비의 가중 평균 및 신뢰 구간을 산출하는 것 (단계 (1506))을 또한 포함한다. 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정될 수 있고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정될 수 있음이 이해된다. 단계 (1502)에서 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하는 것은 본원에 기술된 바와 같이, 예를 들어 도 2에 관하여 기술된 바와 같이 수행될 수 있다. 한 실시양태에서, 복수의 변이체의 적어도 2개의 변이체는 체세포로서 분류된다. MAF 비의 결정 (단계 (1503))은 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 MAF 및 제2 MAF에 기초하여 결정될 수 있음이 또한 이해된다. 제1 MAF는 치료 전의 시간에서 제1 복수의 서열 판독물 내의 변이체를 사용하여 결정될 수 있고, 제2 MAF는 치료 후의 시간에서 제2 복수의 서열 판독물 내의 동일한 변이체를 사용하여 결정될 수 있다. 제1 MAF 및 제2 MAF는 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 양쪽 모두 내의 동일한 변이체에 대해 결정될 수 있다. MAF 비의 가중 평균의 결정 (단계 (1504))은 대상체에 대해서일 수 있음이 추가로 이해된다. 추가적으로, MAF 비의 가중 평균과 연관된 신뢰 구간의 결정 (단계 (1505))은 MAF 비의 가중 평균에 기초할 수 있음이 이해된다. 마지막으로, MAF 비의 가중 평균 및 신뢰 구간은 분자 반응 점수로서 산출될 수 있음이 이해된다.
도 16은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하는 것 (단계 (1601))을 포함하는 방법 (1600)을 개략적으로 도시하는 흐름도이다. 추가적으로 제시된 바와 같이, 방법 (1600)은 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1602)), 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균을 결정하고 (단계 (1603)), 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비를 결정하고 (단계 (1604)), 신뢰 구간을 결정하고 (단계 (1605)), 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간을 산출하는 것 (단계 (1606))을 포함한다. 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정될 수 있고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정될 수 있음이 이해된다. 단계 (1602)에서 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하는 것은 본원에 기술된 바와 같이, 예를 들어 도 2에 관하여 기술된 바와 같이 수행될 수 있다. 한 실시양태에서, 복수의 변이체의 적어도 2개의 변이체는 체세포로서 분류된다. 제1 MAF는 치료 전의 시간에서 제1 복수의 서열 판독물 내의 변이체를 사용하여 결정될 수 있고, 제2 MAF는 치료 후의 시간에서 제2 복수의 서열 판독물 내의 동일한 변이체를 사용하여 결정될 수 있다. 제1 MAF 및 제2 MAF는 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 양쪽 모두 내의 동일한 변이체에 대해 결정될 수 있다. 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 결정 (단계 (1603))은 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 MAF 및 제2 MAF에 기초하여 결정될 수 있음이 또한 이해된다. 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비의 결정 (단계 (1604))은 대상체에 대해서일 수 있음이 추가로 이해된다. 추가적으로, 신뢰 구간의 결정 (단계 (1605))은 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비에 기초할 수 있음이 이해된다. 마지막으로, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간은 분자 반응 점수로서 산출될 수 있음이 이해된다.
도 17은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하는 것 (단계 (1701))을 포함하는 방법 (1700)을 개략적으로 도시하는 흐름도이다. 추가적으로 제시된 바와 같이, 방법 (1700)은 제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1702)), 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1703)), 복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고 (단계 (1704)), 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고 (단계 (1705)), 제2 MAF를 결정하고 (단계 (1706)), 분자 반응 점수를 결정하는 것 (1707)을 또한 포함한다. 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정될 수 있고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정될 수 있음이 이해된다. 단계 (1703)에서 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하는 것은 본원에 기술된 바와 같이, 예를 들어 도 2에 관하여 기술된 바와 같이 수행될 수 있다. 제1 MAF는 치료 전의 시간에서 제1 복수의 서열 판독물 내의 변이체를 사용하여 결정될 수 있고, 제2 MAF는 치료 후의 시간에서 제2 복수의 서열 판독물 내의 동일한 변이체를 사용하여 결정될 수 있다. 제1 MAF 및 제2 MAF는 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 양쪽 모두 내의 동일한 변이체에 대해 결정될 수 있다. 한 실시양태에서, 복수의 변이체의 적어도 2개의 변이체는 체세포로서 분류된다. 제1 MAF의 결정 (단계 (1705))은 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 또한 이해된다. 제2 MAF의 결정 (단계 (1706))은 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제2 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 추가로 이해된다. 마지막으로, 분자 반응은 제1 MAF 및 제2 MAF에 기초하여 결정될 수 있음이 이해된다.
도 18은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하는 것 (단계 (1801))을 포함하는 방법 (1800)을 개략적으로 도시하는 흐름도이다. 추가적으로 제시된 바와 같이, 방법 (1800)은 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1802)), 복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고 (단계 (1803)), 적어도 하나의 CHIP 변이체를 제거하고 (단계 (1804)), 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고 (단계 (1805)), 제2 MAF를 결정하고 (단계 (1806)), 분자 반응 점수를 결정하는 것 (단계 (1807))을 또한 포함한다. 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정될 수 있고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정될 수 있음이 이해된다. 단계 (1802)에서 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하는 것은 본원에 기술된 바와 같이, 예를 들어 도 2에 관하여 기술된 바와 같이 수행될 수 있다. 한 실시양태에서, 복수의 변이체의 적어도 2개의 변이체는 체세포로서 분류된다. 제1 MAF는 치료 전의 시간에서 제1 복수의 서열 판독물 내의 변이체를 사용하여 결정될 수 있고, 제2 MAF는 치료 후의 시간에서 제2 복수의 서열 판독물 내의 동일한 변이체를 사용하여 결정될 수 있다. 제1 MAF 및 제2 MAF는 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 양쪽 모두 내의 동일한 변이체에 대해 결정될 수 있다. 적어도 하나의 CHIP 변이체의 제거 (단계 (1804))는 복수의 변이체로부터일 수 있음이 또한 이해된다. 제1 MAF의 결정 (단계 (1805))은 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 추가로 이해된다. 추가적으로, 제2 MAF의 결정 (단계 (1806))은 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제2 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 이해된다. 마지막으로, 분자 반응 점수의 결정 (단계 (1807))은 제1 MAF 및 제2 MAF에 기초할 수 있음이 이해된다.
도 19는 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하는 것 (단계 (1901))을 포함하는 방법 (1900)을 개략적으로 도시하는 흐름도이다. 추가적으로 제시된 바와 같이, 방법 (1900)은 제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1902)), 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (1903)), 복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고 (단계 (1904)), 복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고 (단계 (1905)), 적어도 하나의 CHIP 변이체를 제거하고 (단계 (1906)), 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고 (단계 (1907)), 제2 MAF를 결정하고 (단계 (1908)), MAF 비를 결정하고 (단계 (1909)), MAF 비의 가중 평균을 결정하고 (단계 (1910)), MAF 비의 가중 평균과 연관된 신뢰 구간을 결정하고 (단계 (1911)), MAF 비의 가중 평균 및 신뢰 구간을 산출하는 것 (단계 (1912))을 또한 포함한다. 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정될 수 있고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정될 수 있음이 이해된다. 단계 (1902)에서 제1 복수의 서열 판독물 내의 복수의 변이체를 분류하고, 단계 (1903)에서 제2 복수의 서열 판독물을 체세포 또는 배선으로서 분류하는 것은 본원에 기술된 바와 같이, 예를 들어 도 2에 관하여 기술된 바와 같이 수행될 수 있다. 한 실시양태에서, 복수의 변이체의 적어도 2개의 변이체는 체세포로서 분류된다. 적어도 하나의 CHIP 변이체의 제거 (단계 (1906))는 복수의 변이체로부터일 수 있음이 또한 이해된다. 제1 MAF는 치료 전의 시간에서 제1 복수의 서열 판독물 내의 변이체를 사용하여 결정될 수 있고, 제2 MAF는 치료 후의 시간에서 제2 복수의 서열 판독물 내의 동일한 변이체를 사용하여 결정될 수 있다. 제1 MAF 및 제2 MAF는 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 양쪽 모두 내의 동일한 변이체에 대해 결정될 수 있다. 분류 불일치는 제1 복수의 서열 판독물에서 체세포로서 및 제2 복수의 서열 판독물에서 배선으로서 분류된 변이체일 수 있다. 분류 불일치는 제1 복수의 서열 판독물에서 배선으로서 및 제2 복수의 서열 판독에서 체세포로서 분류된 변이체일 수 있다. 제1 MAF의 결정 (단계 (1907))은 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 추가로 이해된다. 추가적으로, 제2 MAF의 결정 (1908)은 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제2 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 이해된다. MAF 비의 결정 (1909)은 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 돌연변이체 대립유전자 분율 및 제2 돌연변이체 대립유전자 분율에 기초할 수 있음이 또한 이해된다. MAF 비의 결정 (단계 (1910))은 대상체에 대해서일 수 있음이 추가로 이해된다. 추가적으로, MAF 비의 가중 평균과 연관된 신뢰 구간의 결정 (단계 (1911))은 MAF 비의 가중 평균에 기초할 수 있음이 이해된다. 마지막으로, MAF 비의 가중 평균 및 신뢰 구간은 분자 반응 점수로서 산출될 수 있음이 이해된다.
도 20은 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하는 것 (단계 (2001))을 포함하는 방법 (2000)을 개략적으로 도시하는 흐름도이다. 추가적으로 제시된 바와 같이, 방법 (2000)은 제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (2002)), 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고 (단계 (2003)), 복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고 (단계 (2004)), 복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고 (단계 (2005)), 적어도 하나의 CHIP 변이체를 제거하고 (단계 (2006)), 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고 (단계 (2007)), 제2 MAF를 결정하고 (단계 (2008)), 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균을 결정하고 (단계 (2009)), 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비를 결정하고 (단계 (2010)), 신뢰 구간을 결정하고 (2011), 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간을 산출하는 것 (단계 (2012))을 또한 포함한다. 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정됨이 이해된다. 단계 (2002)에서 제1 복수의 서열 판독물 내의 복수의 변이체를 분류하고, 단계 (2003)에서 제2 복수의 서열 판독물을 체세포 또는 배선으로서 분류하는 것은 본원에 기술된 바와 같이, 예를 들어 도 2에 관하여 기술된 바와 같이 수행될 수 있다. 한 실시양태에서, 복수의 변이체의 적어도 2개의 변이체는 체세포로서 분류된다. 적어도 하나의 CHIP 변이체의 제거 (단계 (2006))는 복수의 변이체로부터일 수 있음이 또한 이해된다. 제1 MAF는 치료 전의 시간에서 제1 복수의 서열 판독물 내의 변이체를 사용하여 결정될 수 있고, 제2 MAF는 치료 후의 시간에서 제2 복수의 서열 판독물 내의 동일한 변이체를 사용하여 결정될 수 있다. 제1 MAF 및 제2 MAF는 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 양쪽 모두 내의 동일한 변이체에 대해 결정될 수 있다. 제1 MAF의 결정 (단계 (2007))은 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 추가로 이해된다. 추가적으로, 제2 MAF의 결정 (단계 (2008))은 체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제2 복수의 서열 판독물의 적어도 일부에 기초할 수 있음이 이해된다. 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 결정 (단계 (2009))은 체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해서이고, 제1 MAF 및 제2 MAF에 기초할 수 있음이 또한 이해된다. 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비의 결정 (단계 (2010))은 대상체에 대해서일 수 있음이 추가로 이해된다. 추가적으로, 신뢰 구간의 결정 (단계 (2011))은 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비에 기초할 수 있음이 이해된다. 마지막으로, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간은 분자 반응 점수로서 산출될 수 있음이 이해된다.
III. 암 및 다른 질환
특정 실시양태에서, 본원에 개시된 방법 및 측면은 주어진 질환, 장애 또는 상태를 갖는 환자의 종적 모니터링에 사용된다. 개시된 방법을 사용하여 하나 이상의 치료에 대한 환자의 반응을 시간 경과에 따라 추적할 수 있다. 전형적으로, 고려 하의 질환은 암의 유형이다. 이같은 암의 비-제한적인 예는 담도암, 방광암, 이행세포 암종, 요로상피 암종, 뇌암, 신경교종, 성상세포종, 유방 암종, 화생 암종, 자궁경부암, 자궁경부 편평세포 암종, 직장암, 결장직장 암종, 결장암, 유전성 비폴립증 결장직장암, 결장직장 선암종, 위장 기질 종양 (GIST), 자궁내막 암종, 자궁내막 기질 육종, 식도암, 식도 편평세포 암종, 식도 선암종, 안구 흑색종, 포도막 흑색종, 담낭 암종, 담낭 선암종, 신세포 암종, 투명세포 신세포 암종, 이행세포 암종, 요로상피 암종, 윌름스 종양, 백혈병, 급성 림프구성 백혈병 (ALL), 급성 골수성 백혈병 (AML), 만성 림프구성 (CLL), 만성 골수성 (CML), 만성 골수단핵구성 (CMML), 간암, 간 암종, 간세포암, 간세포성 암종, 담관암종, 간모세포종, 폐암, 비-소세포 폐암 (NSCLC), 중피종, B-세포 림프종, 비-호지킨 림프종, 미만성 거대 B-세포 림프종, 외투세포 림프종, T 세포 림프종, 비-호지킨 림프종, 전구체 T-림프모구성 림프종/백혈병, 말초 T 세포 림프종, 다발성 골수종, 비인두 암종 (NPC), 신경모세포종, 구인두암, 구강 편평세포 암종, 골육종, 난소 암종, 췌장암, 췌장관 선암종, 가유두상 신생물, 샘꽈리세포 암종, 전립선암, 전립선 선암종, 피부암, 흑색종, 악성 흑색종, 피부 흑색종, 소장 암종, 위암, 위 암종, 위장 기질 종양 (GIST), 자궁암, 또는 자궁 육종을 포함한다.
본원에 개시된 방법 및 시스템을 사용하여 임의적으로 평가되는 다른 유전적-기반 질환, 장애, 또는 상태의 비-제한적인 예는 연골무형성증, 알파-1 항트립신 결핍증, 항인지질 증후군, 자폐증, 상염색체 우성 다낭성 신장 질환, 샤르코-마리-투스병 (CMT), 묘성증, 크론병, 낭성 섬유증, 더컴병, 다운 증후군, 듀안 증후군, 듀시엔느 근이영양증, 인자 V 라이덴 혈전성향증, 가족성 고콜레스테롤혈증, 가족성 지중해열, 취약 X 증후군, 고쉐병, 혈색소침착증, 혈우병, 완전전뇌증, 헌팅톤병, 클라인펠터 증후군, 마르팡 증후군, 근긴장성 이영양증, 신경섬유종증, 누난 증후군, 불완전 골생성증, 파킨슨병, 페닐케톤뇨증, 폴란드 기형, 포르피린증, 조로증, 색소성 망막염, 중증 복합 면역결핍증 (scid), 겸상 적혈구 질환, 척수 근위축증, 테이-삭스병, 지중해빈혈증, 트리메틸아민뇨증, 터너 증후군, 구개심장안면 증후군, WAGR 증후군, 윌슨병 등을 포함한다.
IV. 맞춤 요법 및 관련 투여
일부 실시양태에서, 본원에 개시된 방법은 주어진 질환, 장애 또는 상태를 갖는 환자를 확인하고 환자에게 요법을 투여하는 것에 관한 것이다. 본질적으로 임의의 암 요법 (예를 들어, 외과적 요법, 방사선 요법, 화학요법 등)은 이러한 방법의 일부로서 포함된다. 특정 실시양태에서, 대상체에게 투여되는 요법은 적어도 하나의 화학요법 약물을 포함할 수 있다. 일부 실시양태에서, 화학요법 약물은 알킬화제 (예를 들어, 클로람부실, 시클로포스파미드, 시스플라틴 및 카르보플라틴, 그러나 이에 제한되지 않음), 니트로소우레아 (예를 들어, 카르무스틴 및 로무스틴, 그러나 이에 제한되지 않음), 항-대사물 (예를 들어, 플루오로우라실, 메토트렉세이트 및 플루다라빈, 그러나 이에 제한되지 않음), 식물 알칼로이드 및 천연 생성물 (예를 들어, 빈크리스틴, 파클리탁셀 및 토포테칸, 그러나 이에 제한되지 않음), 항-종양 항생제 (예를 들어, 블레오마이신, 독소루비신 및 미톡산트론, 그러나 이에 제한되지 않음), 호르몬 작용제 (예를 들어, 프레드니손, 덱사메타손, 타목시펜 및 류프롤리드, 그러나 이에 제한되지 않음) 및 생물학적 반응 변형제 (예를 들어, 헤르셉틴 및 아바스틴, 에르비툭스 및 리툭산, 그러나 이에 제한되지 않음)를 포함할 수 있다. 일부 실시양태에서, 대상체에게 투여되는 화학요법은 FOLFOX 또는 FOLFIRI를 포함할 수 있다. 특정 실시양태에서, 적어도 하나의 PARP 억제제를 포함하는 요법은 대상체에게 투여될 수 있다. 특정 실시양태에서, PARP 억제제는 다른 것들 중에서도 올라파립(OLAPARIB), 탈라조파립(TALAZOPARIB), 루카파립(RUCAPARIB), 니라파립(NIRAPARIB) (상표명 제줄라(ZEJULA))을 포함할 수 있다. 전형적으로, 요법은 적어도 하나의 면역요법 (또는 면역치료제)을 포함한다. 면역요법은 주어진 암 유형에 대한 면역 반응을 강화하는 방법을 일반적으로 지칭한다. 특정 실시양태에서, 면역요법은 종양 또는 암에 대한 T 세포 반응을 강화하는 방법을 지칭한다.
일부 실시양태에서, 면역요법 또는 면역치료제는 면역 체크포인트 분자를 표적화한다. 특정 종양은 면역 체크포인트 경로를 선출하는 것에 의해 면역계를 피할 수 있다. 따라서, 면역 체크포인트를 표적화하는 것이 종양이 면역계를 피하는 능력에 대항하고 특정 암에 대한 항-종양 면역을 활성화하기 위한 효과적인 접근법으로 부상하였다. 문헌 [Pardoll, Nature Reviews Cancer, 2012, 12:252-264].
특정 실시양태에서, 면역 체크포인트 분자는 항원에 대한 T 세포 반응에서 수반되는 신호를 감소시키는 억제 분자이다. 예를 들어, CTLA4는 T 세포 상에서 발현되고, 항원 제시 세포 상의 CD80 (일명 B7.1) 또는 CD86 (일명 B7.2)에 결합하는 것에 의해 T 세포 활성화를 하향조절하는 역할을 한다. PD-1은 T 세포 상에서 발현되는 또 다른 억제성 체크포인트 분자이다. PD-1은 염증성 반응 동안 말초 조직 내의 T 세포의 활성을 제한한다. 또한, PD-1에 대한 리간드 (PD-L1 또는 PD-L2)가 통상적으로 다수의 상이한 종양의 표면 상에서 상향조절되어, 종양 미세환경에서 항-종양 면역 반응의 하향조절을 초래한다. 특정 실시양태에서, 억제성 면역 체크포인트 분자는 CTLA4 또는 PD-1이다. 다른 실시양태에서, 억제성 면역 체크포인트 분자는 PD-1에 대한 리간드, 예컨대 PD-L1 또는 PD-L2이다. 다른 실시양태에서, 억제성 면역 체크포인트 분자는 CTLA4에 대한 리간드, 예컨대 CD80 또는 CD86이다. 다른 실시양태에서, 억제성 면역 체크포인트 분자는 림프구 활성화 유전자 3 (LAG3), 킬러 세포 면역글로불린 유사 수용체 (KIR), T 세포 막 단백질 3 (TIM3), 갈렉틴 9 (GAL9), 또는 아데노신 A2a 수용체 (A2aR)이다.
이러한 면역 체크포인트 분자를 표적화하는 길항제가 특정 암에 대한 항원-특이적 T 세포 반응을 강화하는데 사용될 수 있다. 따라서, 특정 실시양태에서, 면역요법 또는 면역치료제는 억제성 면역 체크포인트 분자의 길항제이다. 특정 실시양태에서, 억제성 면역 체크포인트 분자는 PD-1이다. 특정 실시양태에서, 억제성 면역 체크포인트 분자는 PD-L1이다. 특정 실시양태에서, 억제성 면역 체크포인트 분자의 길항제는 항체 (예를 들어, 모노클로날 항체)이다. 특정 실시양태에서, 항체 또는 모노클로날 항체는 항-CTLA4, 항-PD-1, 항-PD-L1, 또는 항-PD-L2 항체이다. 특정 실시양태에서, 항체는 모노클로날 항-PD-1 항체이다. 일부 실시양태에서, 항체는 모노클로날 항-PD-L1 항체이다. 특정 실시양태에서, 모노클로날 항체는 항-CTLA4 항체 및 항-PD-1 항체, 항-CTLA4 항체 및 항-PD-L1 항체, 또는 항-PD-L1 항체 및 항-PD-1 항체의 조합물이다. 특정 실시양태에서, 항-PD-1 항체는 펨브롤리주맙 (키트루다(Keytruda)®) 또는 니볼루맙 (옵디보(Opdivo)®) 중 하나 이상이다. 특정 실시양태에서, 항-CTLA4 항체는 이필리무맙 (예르보이(Yervoy)®)이다. 특정 실시양태에서, 항-PD-L1 항체는 아테졸리주맙 (테센트리크(Tecentriq)®), 아벨루맙 (바벤시오(Bavencio)®), 또는 두르발루맙 (임핀지(Imfinzi)®) 중 하나 이상이다.
특정 실시양태에서, 면역요법 또는 면역치료제는 CD80, CD86, LAG3, KIR, TIM3, GAL9, 또는 A2aR에 대한 길항제 (예를 들어 항체)이다. 다른 실시양태에서, 길항제는 억제성 면역 체크포인트 분자의 가용성 버전, 예컨대 억제성 면역 체크포인트 분자의 세포외 도메인 및 항체의 Fc 도메인을 포함하는 가용성 융합 단백질이다. 특정 실시양태에서, 가용성 융합 단백질은 CTLA4, PD-1, PD-L1, 또는 PD-L2의 세포외 도메인을 포함한다. 일부 실시양태에서, 가용성 융합 단백질은 CD80, CD86, LAG3, KIR, TIM3, GAL9, 또는 A2aR의 세포외 도메인을 포함한다. 한 실시양태에서, 가용성 융합 단백질은 PD-L2 또는 LAG3의 세포외 도메인을 포함한다.
특정 실시양태에서, 면역 체크포인트 분자는 항원에 대한 T 세포 반응에서 수반되는 신호를 증폭시키는 공동-자극 분자이다. 예를 들어, CD28은 T 세포 상에서 발현되는 공동-자극 수용체이다. T 세포가 항원에 이의 T 세포 수용체를 통해 결합할 때, CD28이 항원-제시 세포 상의 CD80 (일명 B7.1) 또는 CD86 (일명 B7.2)에 결합하여 T 세포 수용체 신호전달을 증폭시키고 T 세포 활성화를 촉진시킨다. CD28은 CTLA4와 동일한 리간드 (CD80 및 CD86)에 결합하기 때문에, CTLA4는 CD28에 의해 매개되는 공동-자극 신호전달에 대항하거나 또는 이를 조절할 수 있다. 특정 실시양태에서, 면역 체크포인트 분자는 CD28, 유도성 T 세포 공동-자극인자 (ICOS), CD137, OX40, 또는 CD27로부터 선택되는 공동-자극 분자이다. 다른 실시양태에서, 면역 체크포인트 분자는, 예를 들어, CD80, CD86, B7RP1, B7-H3, B7-H4, CD137L, OX40L, 또는 CD70을 포함하는, 공동-자극 분자의 리간드이다.
이러한 공동-자극 체크포인트 분자를 표적화하는 효능제가 특정 암에 대한 항원-특이적 T 세포 반응을 강화하는데 사용될 수 있다. 따라서, 특정 실시양태에서, 면역요법 또는 면역치료제는 공동-자극 체크포인트 분자의 효능제이다. 특정 실시양태에서, 공동-자극 체크포인트 분자의 효능제는 효능제 항체이고, 바람직하게는 모노클로날 항체이다. 특정 실시양태에서, 효능제 항체 또는 모노클로날 항체는 항-CD28 항체이다. 다른 실시양태에서, 효능제 항체 또는 모노클로날 항체는 항-ICOS, 항-CD137, 항-OX40, 또는 항-CD27 항체이다. 다른 실시양태에서, 효능제 항체 또는 모노클로날 항체는 항-CD80, 항-CD86, 항-B7RP1, 항-B7-H3, 항-B7-H4, 항-CD137L, 항-OX40L, 또는 항-CD70 항체이다.
암 이외의 특이적 유전적-기반 질환, 장애, 또는 상태를 치료하기 위한 치료적 선택안은 일반적으로 관련 기술 분야의 통상의 기술자에게 널리 공지되어 있으며, 특정한 질환, 장애, 또는 상태를 고려하여 명백할 것이다.
특정 실시양태에서, 본원에 기술된 맞춤 요법은 전형적으로 비경구로 (예를 들어, 정맥내로 또는 피하로) 투여된다. 면역치료제를 함유하는 제약 조성물은 전형적으로 정맥내로 투여된다. 특정 치료제는 경구로 투여된다. 그러나, 맞춤 요법 (예를 들어, 면역치료제 등)은, 예를 들어, 협측, 설하, 직장, 질, 요도내, 국소, 안내, 비강내 및/또는 심방내를 포함하는, 관련 기술 분야에 공지되어 있는 임의의 방법으로 또한 투여될 수 있고, 이러한 투여는 정제, 캡슐, 과립, 수성 현탁액, 겔, 스프레이, 좌약, 고약, 연고 등을 포함할 수 있다.
V. 시스템 및 컴퓨터 판독가능 매체
본 개시내용은 다양한 시스템 및 컴퓨터 프로그램 제품 또는 기계 판독가능 매체를 또한 제공한다. 일부 실시양태에서, 예를 들어, 본원에 기술된 방법은 적어도 부분적으로 시스템, 분산 컴퓨팅 하드웨어 및 어플리케이션 (예를 들어, 클라우드 컴퓨팅 서비스), 전자 통신 네트워크, 통신 인터페이스, 컴퓨터 프로그램 제품, 기계 판독가능 매체, 전자 저장 매체, 소프트웨어 (예를 들어, 기계-실행가능 코드 또는 논리 명령) 등을 사용하여 임의적으로 수행되거나 또는 수월해진다. 예시하기 위해, 도 21은 적어도 본 출원에 개시된 방법의 측면들을 실행하는데 사용하기에 적절한 예시적인 시스템의 개략도를 제공한다. 제시된 바와 같이, 시스템 (2100)은 프로세서 (2104) 및 메모리, 저장 장치, 또는 메모리 성분 (1506)을 포함하는 적어도 1개의 컨트롤러 또는 컴퓨터, 예를 들어, 서버 (2102) (예를 들어, 검색 엔진 서버), 및 원격 서버 (2102)에 원격으로 위치하고 전자 통신 네트워크 (2112), 예컨대 인터넷 또는 다른 인터네트워크를 통해 이와 통신하는 하나 이상의 다른 통신 장치 (2114 및 2116) (예를 들어, 클라이언트 측의 컴퓨터 단말기, 전화, 태블릿, 랩탑, 기타 모바일 장치 등)를 포함한다. 통신 장치 (2114 및 2116)는 네트워크 (2112) 상에서 예를 들어 서버 (2102) 컴퓨터와 통신하는 전자 디스플레이 (예를 들어, 인터넷이 가능한 컴퓨터 등)를 전형적으로 포함하고, 여기서 전자 디스플레이는 본원에 기술된 방법을 실행할 때의 결과를 디스플레이하기 위한 사용자 인터페이스 (예를 들어, 그래픽 사용자 인터페이스 (GUI), 웹-기반 사용자 인터페이스 등)를 포함한다. 특정 실시양태에서, 통신 네트워크는, 예를 들어, 하드 드라이브, 썸 드라이브, 또는 기타 데이터 저장 메커니즘을 사용하여, 한 위치에서 또 다른 위치로 데이터를 물리적으로 전송하는 것을 또한 포함한다. 예를 들어, 가이드 검색 어플리케이션 또는 하나 이상의 다른 통신 장치, 예컨대 2114 (개략적으로 데스크탑 또는 개인용 컴퓨터로 제시됨) 및 2116 (개략적으로 태블릿 컴퓨터로 제시됨)에 의해 실행가능한 것을 용이하게 하기 위해, 시스템 (2100)은 서버 (2102)에 의해 판독가능한, 컴퓨터 또는 기계 판독가능 매체, 예를 들어, 다양한 유형의 메모리 중 하나 이상, 예컨대 서버 (2102)의 메모리 (2106)에 저장된 프로그램 제품 (2108)을 또한 포함한다. 일부 실시양태에서, 시스템 (2100)은 적어도 1개의 데이터베이스 서버, 예를 들어, 직접적으로 또는 검색 엔진 서버 (2102)를 통해 검색될 수 있는 데이터 (예를 들어, 분류자 점수, 대조군 샘플 또는 비교물 결과 데이터, 색인된 맞춤 요법 등)가 저장되어 있는 온라인 웹사이트와 연관된 서버 (2110)를 임의적으로 또한 포함한다. 시스템 (2100)은 서버 (2102)와 원격으로 위치하는 하나 이상의 다른 서버를 또한 임의적으로 포함하고, 이들 각각은 원격으로 위치하거나 또는 다른 서버 각각에 대해 로컬에 위치하는 하나 이상의 데이터베이스 서버 (2110)와 임의적으로 연관된다. 다른 서버는 이롭게 지리적으로 원격인 사용자에게 서비스를 제공할 수 있고, 지리적으로 분산된 작업을 강화할 수 있다.
관련 기술 분야의 통상의 기술자가 이해하는 바와 같이, 서버 (2102)의 메모리 (2106)는 휘발성 및/또는 비휘발성 메모리를 임의적으로 포함하고, 이는 그 중에서도, 예를 들어, RAM, ROM, 및 자기 또는 광학 디스크를 포함한다. 관련 기술 분야의 통상의 기술자는 단일 서버로 예시되었지만, 서버 (2102)의 예시된 구성은 예로서만 제공되고, 다양한 다른 방법론 또는 아키텍처에 따라 구성된 다른 유형의 서버 또는 컴퓨터 또한 사용될 수 있다는 것을 또한 이해한다. 도 21에서 개략적으로 제시된 서버 (2102)는 서버 또는 서버 클러스터 또는 서버 팜을 나타내고, 임의의 개별적인 물리적 서버에 제한되지 않는다. 서버 사이트는 서버 호스팅 공급자가 관리하는 서버 팜 또는 서버 클러스터로서 전개될 수 있다. 시스템 (2100)에 대한 용법, 요구 및 용량 요건에 기초하여 서버의 수 및 이들의 아키텍처 및 구성이 증가될 수 있다. 관련 기술 분야의 통상의 기술자가 또한 이해할 바와 같이, 이러한 실시양태 내의 다른 사용자 통신 장치 (2114 및 2116)는, 예를 들어, 랩탑, 데스크탑, 태블릿, 개인용 디지털 보조장치 (PDA), 휴대폰, 서버, 또는 다른 유형의 컴퓨터일 수 있다. 관련 기술 분야의 통상의 기술자에게 공지되어 있고 이들이 이해할 바와 같이, 네트워크 (2112)는 인터넷, 인트라넷, 원격통신 네트워크, 엑스트라넷, 또는 통신 네트워크를 통해 하나 이상의 다른 컴퓨터와 통신하는 복수의 컴퓨터/서버의 월드와이드웹, 및/또는 로컬 또는 기타 영역 네트워크의 일부분을 포함할 수 있다.
관련 기술 분야의 통상의 기술자가 추가로 이해할 바와 같이, 예시적인 프로그램 제품 또는 기계 판독가능 매체 (2108)는, 임의적으로, 하드웨어의 기능화를 제어하고 이의 작업을 지시하는 순서화된 작업의 하나 이상의 세트를 제공하는 마이크로코드, 프로그램, 클라우드 컴퓨팅 포맷, 루틴, 및/또는 기호 언어의 형태이다. 예시적인 실시양태에 따른 프로그램 제품 (2108)은 또한 전체적으로 휘발성 메모리 내에 존재할 필요는 없지만, 관련 기술 분야의 통상의 기술자에게 공지되어 있고 이들이 이해하는 바와 같은 다양한 방법론에 따라, 필요하다면, 선택적으로 로딩될 수 있다.
관련 기술 분야의 통상의 기술자가 추가로 이해할 바와 같이, 용어 "컴퓨터-판독가능 매체" 또는 "기계-판독가능 매체"는 실행을 위해 프로세서에 명령을 제공하는 것에 참여하는 임의의 매체를 지칭한다. 예시하기 위해, 용어 "컴퓨터-판독가능 매체" 또는 "기계-판독가능 매체"는, 예를 들어, 컴퓨터에 의한 판독을 위한, 본 개시내용의 다양한 실시양태의 기능성 또는 프로세스를 실행하는 프로그램 제품 (2108)을 저장할 수 있는 배포 매체, 클라우드 컴퓨팅 포맷, 중간 저장 매체, 컴퓨터의 실행 메모리, 및 임의의 다른 매체 또는 장치를 포함한다. "컴퓨터-판독가능 매체" 또는 "기계-판독가능 매체"는 비-휘발성 매체, 휘발성 매체, 및 전송 매체를 포함하지만 이에 제한되지 않는 다수의 형태를 취할 수 있다. 비-휘발성 매체는, 예를 들어, 광학 또는 자기 디스크를 포함한다. 휘발성 매체는 동적 메모리, 예컨대 주어진 시스템의 메인 메모리를 포함한다. 전송 매체는 버스를 이루는 와이어를 포함하여, 동축 케이블, 구리 와이어 및 광섬유를 포함한다. 전송 매체는, 그 중에서도, 음파 또는 광파, 예컨대 전파 및 적외선 데이터 통신 동안 생성되는 것들의 형태를 취할 수도 있다. 컴퓨터-판독가능 매체의 예시적인 형태는 플로피 디스크, 플렉서블 디스크, 하드 디스크, 자기 테이프, 플래시 드라이브, 또는 임의의 다른 자기 매체, CD-ROM, 임의의 다른 광학 매체, 펀치 카드, 종이 테이프, 홀 패턴이 있는 임의의 다른 물리적 매체, RAM, PROM, 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 반송파, 또는 컴퓨터가 판독할 수 있는 임의의 다른 매체를 포함한다.
프로그램 제품 (2108)은 임의적으로 컴퓨터-판독가능 매체로부터 하드 디스크 또는 유사한 중간 저장 매체로 복사된다. 프로그램 제품 (2108), 또는 이의 부분이 실행될 때, 이는 임의적으로 이의 배포 매체, 이의 중간 저장 매체 등으로부터 하나 이상의 컴퓨터의 실행 메모리 내로 로딩되어, 컴퓨터(들)를 다양한 실시양태의 기능성 또는 방법에 따라 작동하도록 구성시킨다. 모든 이같은 작업은 관련 기술 분야, 예를 들어, 컴퓨터 시스템의 통상의 기술자에게 널리 공지되어 있다.
추가로 예시하기 위해, 특정 실시양태에서, 본 출원은 하나 이상의 프로세서, 및 프로세서와 통신하는 하나 이상의 메모리 성분을 포함하는 시스템을 제공한다. 메모리 성분은 실행되는 경우, 프로세서가 서열 정보, 후성유전학적 정보, 분류자 점수, cfDNA 특성 데이터, cfDNA 단편 분포 세트 데이터, 시험 결과, 대조군 또는 비교물 결과, 맞춤 요법 등이 제시되는 것을 유발하는 정보를 제공하고/거나 (예를 들어, 통신 장치 (2114, 2116) 등을 통해), 다른 시스템 성분으로부터 및/또는 시스텀 사용자로부터 정보를 수신하는 (예를 들어, 통신 장치 (2114, 2116) 등을 통해) 것을 유발하는 하나 이상의 명령을 전형적으로 포함한다.
일부 실시양태에서, 프로그램 제품 (2108)은 전자 프로세서 (2104)에 의해 실행되는 경우 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하고, 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 MAF 비에 대한 상응하는 표준 편차를 생성하고, MAF 비의 가중 평균 및 신뢰 구간을 계산하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 적어도 수행하는 비-일시적 컴퓨터-실행가능 명령을 포함한다. 추가의 컴퓨터 판독가능 매체 실시양태는 본원에 기술된다.
시스템 (2100)은 본원에 기술된 방법의 다양한 측면을 수행하도록 구성된 추가의 시스템 성분을 또한 전형적으로 포함한다. 일부 이러한 실시양태에서, 이러한 추가의 시스템 성분 중 하나 이상은 원격 서버 (2102)로부터 원격에 위치하고, 전자 통신 네트워크 (2112)를 통해 이와 통신하는 반면, 다른 실시양태에서는, 이러한 추가의 시스템 성분 중 하나 이상이 로컬로 위치하고, 서버 (2102)와 통신하거나 (즉, 전자 통신 네트워크 (2112)의 부재 하에), 또는 직접적으로 예를 들어 데스크탑 컴퓨터 (2114)와 통신한다.
일부 실시양태에서, 예를 들어, 추가의 시스템 성분은 컨트롤러 (2102)에 (직접적으로 또는 간접적으로 (예를 들어, 전자 통신 네트워크 (2112)를 통해)) 작동가능하게 연결된 샘플 제조 성분 (2118)을 포함한다. 샘플 제조 성분 (2118)은 핵산 증폭 성분 (예를 들어, 열 사이클러 등) 및/또는 핵산 서열분석기에 의해 증폭 및/또는 시퀀싱될 샘플 내의 핵산을 제조하도록 (예를 들어, 핵산의 라이브러리를 제조하도록) 구성된다. 특정한 이러한 실시양태에서, 샘플 제조 성분 (2118)은 샘플 내의 다른 성분으로부터 핵산을 단리하고, 본원에 기술된 바와 같이 핵산에 바코드를 포함하는 하나 이상의 어댑터를 부착시키고, 시퀀싱 전에 게놈 또는 트랜스크립톰으로부터 하나 이상의 영역을 선택적으로 풍부화하는 것 등을 위해 구성된다.
특정 실시양태에서, 시스템 (2100)은 컨트롤러 (2102)에 (직접적으로 또는 간접적으로 (예를 들어, 전자 통신 네트워크 (2112)를 통해)) 작동가능하게 연결된 핵산 증폭 성분 (2120) (예를 들어, 열 사이클러 등)을 또한 포함한다. 핵산 증폭 성분 (2120)은 대상체로부터의 샘플 내의 핵산을 증폭시키도록 구성된다. 예를 들어, 핵산 증폭 성분 (2120)은, 임의적으로, 본원에 기술된 바와 같이 샘플 내의 게놈 또는 트랜스크립톰으로부터의 선택적으로 풍부화된 영역을 증폭시키도록 구성된다.
시스템 (2100)은 컨트롤러 (2102)에 (직접적으로 또는 간접적으로 (예를 들어, 전자 통신 네트워크 (2112)를 통해)) 작동가능하게 연결된 적어도 1개의 핵산 서열분석기 (2122)를 또한 전형적으로 포함한다. 핵산 서열분석기 (2122)는 대상체로부터의 샘플 내의 핵산 (예를 들어, 증폭된 핵산)으로부터의 서열 정보를 제공하도록 구성된다. 본질적으로 임의의 유형의 핵산 서열분석기가 이러한 시스템에서 사용하기 위해 개조될 수 있다. 예를 들어, 핵산 서열분석기 (2122)는, 임의적으로, 핵산에서 비술파이트 시퀀싱, 파이로시퀀싱, 단일-분자 시퀀싱, 나노포어 시퀀싱, 반도체 시퀀싱, 라이게이션에 의한 시퀀싱, 혼성화에 의한 시퀀싱, 또는 기타 기법을 수행하여 시퀀싱 판독물을 생성하도록 구성된다. 임의적으로, 핵산 서열분석기 (2122)는 서열 판독물을 서열 판독물 패밀리로 그룹화하도록 구성되고, 각각의 패밀리는 주어진 샘플 내의 핵산으로부터 생성된 서열 판독물을 포함한다. 일부 실시양태에서, 핵산 서열분석기 (2122)는 시퀀싱 라이브러리로부터 유래된 클론성 단일 분자 어레이를 사용하여 시퀀싱 판독물을 생성한다. 특정 실시양태에서, 핵산 서열분석기 (2122)는 시퀀싱 판독물이 생성되도록 시퀀싱 라이브러리를 시퀀싱하기 위한 마이크로웰의 어레이가 있는 적어도 1개의 칩을 포함한다.
완전한 또는 부분적인 시스템 자동화를 용이하게 하기 위해, 시스템 (2100)은 컨트롤러 (2102)에 (직접적으로 또는 간접적으로 (예를 들어, 전자 통신 네트워크 (2112)를 통해)) 작동가능하게 연결된 물질 전달 성분 (2124)을 전형적으로 또한 포함한다. 물질 전달 성분 (2124)은 하나 이상의 물질 (예를 들어, 핵산 샘플, 앰플리콘, 시약 등)을 핵산 서열분석기 (2122), 샘플 제조 성분 (2118), 및 핵산 증폭 성분 (2120)으로 및/또는 이들로부터 전달하도록 구성된다.
컴퓨터 시스템 및 네트워크, 데이터베이스, 및 컴퓨터 프로그램 제품에 관한 추가의 세부사항이, 예를 들어, 문헌 [Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011)], [Kurose, Computer Networking: A Top-Down Approach, Pearson, 7th Ed. (2016)], [Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010)], [Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11th Ed. (2014)], [Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)], 및 [Rhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press (2011)]에서 또한 제공되고, 이들은 각각 그 전문이 참조로 포함된다.
VI. 실시예
A. 실시예 1: 환자 결과의 예측을 위한 분자 반응 계산의 비교
1. 배경
초기 치료중 샘플 (통상적으로 치료 시작 후 2 내지 9주) 및 치료전 기준선 사이의 순환 종양 (ctDNA) 부하의 변화로서 추정된 분자 반응 (MR)은 많은 소급적 연구에서 고형 종양 및 요법 유형에 걸쳐 환자 반응 및 결과를 예측하는 것으로 제시되었다. 그러나, 분자 반응을 평가하는 가장 좋은 방법에 관한 합의는 없다. 따라서, 본 발명자들은 몇몇 분자 반응 계산을 평가하고, 개별적인 진행성 암 환자에서 결과를 예측하는 최적 방법을 결정하는 것을 목표로 하였다.
2. 방법
>4,000개의 환자 샘플 쌍 (3 내지 10주 떨어짐), >1000개의 환자 샘플 기술적 반복실험, >100개의 고안된 샘플 희석물, 및 인 실리코 시뮬레이션의 합계 결과를 cfDNA NGS 검정 임상 플랫폼 (가던트 헬스, 인크.(Guardant Health, Inc.), 미국 캘리포니아주 레드우드 시티)을 사용하여 분석하였다. 기준선 및 치료중 쌍을 이룬 환자 샘플을 폐, 결장, 및 유방을 포함하는 12개 초과의 종양 유형을 갖는 진행성 암 환자로부터 수집하였다. MR 계산은 체세포 SNV, 인델 및 융합의 변이체 대립유전자 분율 (VAF)을 포함하였다. 최대 VAF의 비 (RmaxVAF), 평균 VAF의 비 (RmVAF), 및 VAF 비의 평균 (mVAF)을 포함하는 방법을 비교하였다. 분석 정확도, 재현가능성 및 검출의 한계 (LoD)를 평가하였다.
3. 결과
>1500개의 샘플 쌍에 대한 ctDNA 부하의 순 변화를 계산하는 방법의 비교는 높은 상관관계 (0.93 내지 0.98의 범위의 ρ) 및 중위값에 의해 분할된 카테고리적 일치 (93%)를 나타내었다. 따라서 결과 예측에 기초하여 최적 방법을 선택하는 것은 엄두도 못 낼 정도로 큰 환자 코호트를 요구할 것이다. 분석적 평가 및 인 실리코 시뮬레이션은 각각의 방법의 거동을 예측할 수 있다. 실제 치료전 샘플의 종양 분율의 변화의 시뮬레이션은 RmVAF 또는 RmaxVAF가 낮은 VAF 비에 의해 왜곡될 수 있는 mVAFR보다 더 정확함을 밝혀내었다. 거의 25%의 샘플 쌍은 maxVAF가 아닌 종양 유도자 또는 저항성 돌연변이를 가지며, 이는 종양 역학이 maxVAF보다 mVAF에 의해 더 잘 포획됨을 시사한다. 새롭게 검출된 치료중 변이체는 대략 2%의 샘플 쌍에서 MR에 영향을 미치는 ctDNA 수준을 상승시키는 중요한 신호일 수 있다.
중요하게는, 추계적 검출 및 낮은 VAF에서의 변이체의 보다 높은 CV 양쪽 모두로 인해, maxVAF가 변이체 LoD에 접근하거나 하회함에 따라 모든 방법에 대한 MR 정확도는 감소한다. 따라서 검정 변이체 LoD는 MR 평가를 받을 수 있는 환자의 분율의 핵심적인 결정자이다. 기술적 반복실험은 종양 분율의 50% 변화가 기술적 변이로부터 유의하게 상이한 변이체 기준을 확인하였으며, 분석적 보고 한계를 정의할 수 있다.
4. 결론
큰 환자 샘플의 세트에서의 MR 방법의 비교 및 시뮬레이션은 새롭게 검출된 돌연변이의 포함을 갖는 RmVAF를 지지한다.
B. 실시예 2
1. 도입
분자 반응 (MR)은 치료전 기준선과 비교하여 초기 치료중 (통상적으로 3 내지 10주)의 순환 종양 (ctDNA) 부하의 변화의 평가이다. 많은 소급적 연구에서, 분자 반응은 고형 종양 및 요법 유형에 걸쳐 요법에 대한 환자 반응 및 장기 결과와 연관되었다.
분자 반응은 방사선촬영 및/또는 RECIST 반응보다 더 빨리 임상적 반응을 예측하는 것으로 또한 제시되었다. 분자 반응을 계산하는데 다중 방법이 사용되었으며, 어느 방법이 가장 좋은지에 관한 합의는 없다.
이 실시예에서, 몇몇 분자 반응 계산을 평가하고, 개별적인 진행성 암 환자에서 결과를 예측하는 최적 방법을 결정하였다.
2. 방법
3 내지 10주 떨어져 이격된 >1,500개의 환자 혈장 샘플로부터의 쌍을 이룬 샘플을 20,000x 판독 깊이로 시퀀싱된 ~4600개의 분자의 중위값 고유한 커버리지를 갖는 cfDNA NGS 검정 임상 플랫폼 (가던트 헬스, 인크., 미국 캘리포니아주 레드우드 시티)을 사용하여 프로세싱하였다. 체세포 및 배선 SNV, 작은 인델, 및 융합은 분자 반응의 임상적 적용을 모방하는 74- 암 연관 유전자 패널 공간에 대해 하위세트처리하였다. >140개의 환자 샘플 기술적 반복실험을 어느 하나의 패널 상에서 프로세싱하고, 74-유전자 패널 공간에 대해 하위세트처리하였다. 3가지 이전에 공개된 분자 반응 방법을 평가하였다 (표 3을 참조한다).
표 3
Figure pct00022
3. 결과
i. 분자 반응 계산은 SNV, 인델, 및 융합의 ctDNA VAF의 변화를 포획한다
도 22는 74- 암 연관 유전자 패널 공간 내의 샘플당 검출된 체세포 변이체의 수를 제시한다. 체세포 SNV, 인델, 및 융합물의 수는 이 연구에서 상위 3가지 암 유형에 대한 샘플당 분자 반응 계산에 포함되었다. 중위값 돌연변이 변이체 카운트는 유방, CRC, 및 NSCLC에 대해 각각 4, 5, 및 3이다.
ii. 쌍을 이룬 샘플을 갖는 체세포 분류의 해결은 종양 신호를 개선시킨다
도 23은 MR 결과를 왜곡시킬 수 있는 체세포 분류 불일치의 예를 제시한다. 희귀한 체세포 상황 분류 불일치 (변이체의 <0.8%)는 높은 종양 분율 및 대립유전자 불균형과 함께 발생할 수 있다. 비해결된, ALK는 보편적으로 감소하는 VAF에 대한 MR 점수를 왜곡시킬 것이다.
표 4는 환자 샘플 사이의 체세포 분류 불일치의 해결의 예가 변이체 정확도를 개선시킴을 제시한다. 환자 샘플 쌍 내의 체세포 분류 불일치는 변이체 특징에 기초한 알고리즘에 의해 해결되었다. 정확도를 주제 전문가에 의한 수동 해결에 대해 평가하였다.
표 4
Figure pct00023
iii. 변이체는 검출 및 VAF 정밀도에 기초한 분자 반응 계산에 포함된다
도 24는 변이체 정밀도의 예가 돌연변이체 분자 카운트 (MMC = VAF * 분자 커버리지)에 의해 결정됨을 제시한다. (도 24A) 변이체는 샘플 투입 및 패널 디자인에 따라 다양한 분자 커버리지를 갖는다. 변이체 검출의 확률 (도 24B) 및 VAF 정밀도 (도 24C)는 VAF 및 분자 커버리지 (색상, (도 24A)에 맵핑됨) 양쪽 모두에 좌우된다. MMC (도 24D)는, 그것이 변이체 검출의 확률 (도 24E) 및 VAF 정밀도 (도 24F)를 결정하기 때문에, 변이체 정밀도에 대한 보다 좋은 계량이다. 양쪽 시점에서 낮은 MMC를 갖는 변이체는 신호를 잡음으로부터 보다 잘 분명히 하기 위해 분자 반응으로부터 배제되어야 한다.
iv. 분자 반응은 방법 사이에 크게 일치하지만, R(mVAF)는 환자에 걸쳐 보다 확고하다
도 25는 비의 평균, m(rVAF), 또는 최대값의 비, R(maxVAF)를 사용하는 경우 소수의 변이체가 종양 신호를 능가할 수 있음을 제시한다. (도 25A) MR 점수는 증가, 감소 또는 정밀도 한계 내 ("거의 0% 변화")로서 카테고리화된다. 단지 8%의 환자만이 임의의 방법에서 증가 및 감소 사이에 변화하며, 이는 높은 카테고리적 상관관계를 나타낸다 (X2 p < 0.001). MR 상관관계는 ρ = 0.42 내지 0.86의 범위이다 (p < 0.001). (도 25B) m(rVAF)는 일부 VAF가 낮은 경우 MR을 과대평가하는 경향이 있다 (적색). R(maxVAF)는 대다수로부터 벗어나는 단일 최대 변이체 (자주색)에 의해 왜곡될 수 있다. 20%의 샘플 쌍은 maxVAF가 아닌 종양 유도자 또는 저항성 돌연변이를 가지며, 이는 종양 역학이 mVAF에 의해 더 잘 포획됨을 시사한다. (C) 새로운 치료중 변이체를 배제하는 것은 보다 낮은 MR 평가가능한 비율을 초래할 것이고, 새로 생겨난 변이체의 신호를 배제한다.
v. ctDNA 수준 변화의 낮은 신호를 갖는 환자는 분자 반응에 대해 평가가능하지 않은 것으로서 확인된다
도 26은 분자 반응 점수의 확실성이 변이체의 수 (도 26A), 분자 커버리지 (도 26B), 및 최대 VAF (도 26C)가 증가함에 따라 증가하는 예를 제시한다.
체세포 변이체가 없거나 (대략 7%의 환자), 또는 포함 기준을 충족시키는 체세포 변이체가 없는 경우 (16%), 샘플 쌍은 분자 반응에 대해 VAF-기반 방법을 사용하여 평가가능하지 않다. 또한, 분자 반응 점수의 확실성은 이론적으로 VAF 정밀도의 통계적 모델을 사용하여 계산된다. 허용가능한 불확실성의 한계를 초과하는 샘플 쌍 (검은색 라인)은 MR에 대해 평가가능하지 않다 (3%). 이는 MR에 대해 평가가능한 대략 74%의 샘플 쌍을 초래한다.
vi. 임상적 환자 샘플 내의 분자 반응 점수의 범위는 강한 생물학적 신호를 반영한다
임상적 환자 샘플 쌍에서, 분자 반응 분포는 100% 감소 내지 >100% 증가의 다양한 점수를 나타낸다 (도 27A).
기술적 반복실험은 0% 변화에서 피크를 갖는 널 분자 반응 분포를 제공한다 (도 27B).
4. 결론
배선 및 저-정밀도 변이체 필터링, 전체 제형, 및 평가가능한 기준을 포함하는 분자 반응 계산의 각각의 성분은 MR의 정확한 평가에 중요하다. 큰 환자 샘플의 세트에서의 분자 반응 방법의 비교 및 시뮬레이션은 새롭게 검출된 돌연변이의 포함을 갖는 평균 VAF의 비를 지지한다.
C. 실시예 3
도 28은 MR 계산을 위한 샘플 쌍의 예를 제시한다. 어느 하나의 샘플에서 검출된 모든 SNV, 인델, 융합으로 시작하여, 통상적인 배선 변이체를 제거한다. 다음으로, 변이체 체세포/배선 분류 불일치를 해결하여 단일 분류를 제공한다. (이 실시예에서, 불일치는 없었다). 다음으로, 배선 변이체를 필터링하고, 이어서 CHIP 변이체를 필터링한다 (이 실시예에서, ATM.R3008H는 제거되는 CHIP 변이체이다). 다음으로, MMC- 또는 커버리지- 기반 포함 임계치를 충족시키지 않는 변이체를 제거한다. 이 실시예에서, 이러한 필터링 단계 후, 3개의 체세포 변이체 (PDGFRA, RET 및 TP53)가 남는다. 마지막으로, MR 점수를 이러한 남아 있는 변이체로부터 계산한다. 이 실시예에서, 기준선 평균 VAF는 22.2%이고, 치료중 평균 VAF는 2.7%이며, 이는 88%의 ctDNA 감소인 12%의 MR 점수를 제공한다.
본원에서 인용된 모든 특허, 특허 출원, 웹사이트, 기타 간행물 또는 문서, 수탁 번호 등은 각각의 개별적인 항목이 참조로 포함된 것으로 구체적 및 개별적으로 지시된 것과 동일한 정도로 모든 목적을 위해 그 전문이 참조로 포함된다. 상이한 서열 버전들이 상이한 시간의 수탁 번호와 연관되는 경우, 본 출원의 유효 출원일의 수탁 번호와 연관된 버전을 의미한다. 유효 출원일은 실제 출원일 또는 수탁 번호를 언급하는 우선권 출원의 출원일 (적용가능한 경우) 중 더 앞서는 것을 의미한다. 마찬가지로, 간행물, 웹사이트 등의 상이한 버전들이 상이한 시간에 공개된 경우, 달리 명시되지 않는 한, 본 출원의 유효 출원일에 가장 최근에 공개된 버전을 의미한다.
관련 기술 분야의 통상의 기술자는 통상적인 실험 이하를 사용하여, 본원에 기술된 방법 및 조성물의 구체적인 실시양태에 대한 많은 등가물을 인식하거나, 또는 확인할 수 있을 것이다. 이러한 등가물은 하기 청구범위에 의해 포함되는 것으로 의도된다.

Claims (46)

  1. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고;
    제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 돌연변이체 대립유전자 분율 (MAF) 및 제2 MAF에 기초하여, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균을 결정하고;
    대상체에 대해, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비를 결정하고;
    제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비에 기초하여, 신뢰 구간을 결정하고;
    분자 반응 점수로서, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간을 산출하는 것
    을 포함하는 방법.
  2. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고;
    제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 돌연변이체 대립유전자 분율 (MAF) 및 제2 MAF에 기초하여, MAF 비를 결정하고;
    대상체에 대해, MAF 비의 가중 평균을 결정하고;
    MAF 비의 가중 평균에 기초하여, MAF 비의 가중 평균과 연관된 신뢰 구간을 결정하고;
    분자 반응 점수로서, MAF 비의 가중 평균 및 신뢰 구간을 산출하는 것
    을 포함하는 방법.
  3. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고;
    제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고;
    체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고;
    체세포로서 분류되거나 재분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 MAF를 결정하고;
    제1 MAF 및 제2 MAF에 기초하여, 분자 반응 점수를 결정하는 것
    을 포함하는 방법.
  4. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고;
    제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈(Clonal Hematopoiesis of Indeterminate Potential) (CHIP) 변이체로서 결정하고;
    복수의 변이체로부터, 적어도 하나의 CHIP 변이체를 제거하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 MAF를 결정하고;
    제1 MAF 및 제2 MAF에 기초하여, 분자 반응 점수를 결정하는 것
    을 포함하는 방법.
  5. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고;
    제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고;
    복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고;
    복수의 변이체로부터, 적어도 하나의 CHIP 변이체를 제거하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 MAF를 결정하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 MAF 및 제2 MAF에 기초하여 MAF 비를 결정하고;
    대상체에 대해, MAF 비의 가중 평균을 결정하고;
    MAF 비의 가중 평균에 기초하여, MAF 비의 가중 평균과 연관된 신뢰 구간을 결정하고;
    분자 반응 점수로서, MAF 비의 가중 평균 및 신뢰 구간을 산출하는 것
    을 포함하는 방법.
  6. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전에 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후에 결정되고;
    제1 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    복수의 변이체의 적어도 하나의 변이체를 재분류하여 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 사이의 분류 불일치를 해결하고;
    복수의 변이체의 적어도 하나의 변이체를 잠재성 불명 클론성 조혈 (CHIP) 변이체로서 결정하고;
    복수의 변이체로부터, 적어도 하나의 CHIP 변이체를 제거하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 복수의 서열 판독물의 적어도 일부에 기초하여, 제1 돌연변이체 대립유전자 분율 (MAF)을 결정하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제2 복수의 서열 판독물의 적어도 일부에 기초하여, 제2 MAF를 결정하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 MAF 및 제2 MAF에 기초하여, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균을 결정하고;
    대상체에 대해, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비를 결정하고;
    제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비에 기초하여, 신뢰 구간을 결정하고;
    분자 반응 점수로서, 제1 MAF의 가중 평균 및 제2 MAF의 가중 평균의 비 및 신뢰 구간을 산출하는 것
    을 포함하는 방법.
  7. 대상체와 연관된 제1 복수의 서열 판독물 및 제2 복수의 서열 판독물을 결정하고, 여기서 제1 복수의 서열 판독물은 요법을 투여하기 전의 제1 시점에서 결정되고, 제2 복수의 서열 판독물은 요법을 투여한 후의 제2 시점에서 결정되고;
    제1 복수의 서열 판독물 및 제2 복수의 서열 판독물 내의 복수의 변이체를 체세포 또는 배선으로서 분류하고;
    체세포로서 분류된 복수의 변이체의 적어도 하나의 변이체에 대해, 제1 시점에서의 제1 돌연변이체 대립유전자 분율 (MAF) 및 제2 시점에서의 제2 MAF에 기초하여, 제1 MAF의 제1 중심 경향성 척도 및 제2 MAF의 제2 중심 경향성 척도를 결정하고;
    제1 시점에서의 제1 중심 경향성 척도 대 제2 시점에서의 제2 중심 경향성 척도의 비를 결정하고;
    분자 반응 점수로서, 제1 시점에서의 제1 중심 경향성 척도 대 제2 시점에서의 제2 중심 경향성 척도의 비를 산출하는 것
    을 포함하는 방법.
  8. 제7항에 있어서, 중심 경향성 척도가 평균, 중위값, 또는 최빈값 중 하나 이상인 방법.
  9. 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 방법으로서:
    (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하고;
    (b) 컴퓨터에 의해, 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 각각의 MAF 비에 대한 상응하는 표준 편차를 생성하고;
    (c) 컴퓨터에 의해, MAF 비의 가중 평균 및 신뢰 구간을 계산함으로써, 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것
    을 포함하는 방법.
  10. 대상체에서 암을 치료하는 방법으로서:
    (a) 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하고;
    (b) 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 각각의 MAF 비에 대한 상응하는 표준 편차를 생성하고;
    (c) MAF 비의 가중 평균 및 신뢰 구간을 계산하여 대상체에 대한 분자 반응 점수를 결정하고;
    (d) 적어도 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여함으로써, 대상체에서 암을 치료하는 것
    을 포함하는 방법.
  11. 대상체에서 암을 치료하는 방법으로서, 적어도 대상체에 대한 분자 반응 점수에 기초하여 하나 이상의 요법을 대상체에게 투여하는 것을 포함하고, 여기서 분자 반응 점수는
    (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하여 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 세트를 생성하고;
    (b) 컴퓨터에 의해, 복수의 변이체 내의 적어도 하나의 변이체에 대한 제1 및 제2 MAF의 비를 계산하여 MAF 비의 세트 및 MAF 비의 세트 내의 각각의 MAF 비에 대한 상응하는 표준 편차를 생성하고;
    (c) 컴퓨터에 의해, MAF 비의 가중 평균 및 신뢰 구간을 계산하여 대상체에 대한 분자 반응 점수를 결정하는 것
    에 의해 생성되는 것인 방법.
  12. 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 방법으로서:
    (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 각각의 복수의 변이체에 대한 종양 분율 변화에 대한 종양 부하 변화 (R) P(R)을 결정하여 종양 부하 변화의 세트를 생성하고;
    (b) 컴퓨터에 의해, 종양 부하 변화의 세트로부터 하나 이상의 클론성 조혈 변이체에 상응하는 하나 이상의 저항성 시그니쳐를 확인함으로써, 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 것
    을 포함하는 방법.
  13. 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 방법으로서:
    (a) 컴퓨터에 의해, 제1 및 제2 시점에서 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 각각의 복수의 변이체에 대한 종양 분율 변화에 대한 확률 밀도 함수 P(R)을 계산하고;
    (b) 컴퓨터에 의해, 변이체의 하나 이상을 P(R)에 의해 하나 이상의 클론으로 그룹화하고;
    (c) 컴퓨터에 의해, 각각의 클론에 대한 갱신된 P(R)을 생성하고;
    (d) 컴퓨터에 의해, 미리 결정된 임계치 값 이상의 제1 및 제2 시점 사이의 분율 변화를 갖는 하나 이상의 클론을 확인함으로써, 암을 갖는 대상체에서 클론성 조혈 변이체를 확인하는 것
    을 포함하는 방법.
  14. 제13항에 있어서, 주어진 변이체의 쌍이 동일한 분율 변화를 나타낼 가능도를 결정하고, 가장 가능성 있는 변이체의 쌍을 하나의 클론으로 병합하고, 하나의 클론에 대한 P(R)을 갱신하는 것을 포함하는 방법.
  15. 적어도 부분적으로 컴퓨터를 사용하여 암을 갖는 대상체에서 배선 변이체를 확인하는 방법으로서:
    (a) 컴퓨터에 의해, 대상체로부터 수득된 샘플 내의 하나 이상의 암 유형과 연관된 표적화된 핵산으로부터 생성된 서열 정보로부터 주어진 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하고;
    (b) 컴퓨터에 의해, 주어진 변이체의 MAF가 샘플의 최대 MAF를 증가시키는 경우 (샘플은 최대 배수체 유전자의 분율 (max frac_diploid)을 포함함) 및/또는 주어진 변이체의 MAF가 대상체로부터 수득된 샘플로부터 결정된 하나 이상의 다른 MAF보다 적어도 약 2배 더 크거나, 3배 더 크거나, 4배 더 크거나, 5배 더 크거나, 6배 더 크거나, 7배 더 크거나, 8배 더 크거나, 9배 더 크거나, 또는 그 초과인 경우, 주어진 변이체가 배선 변이체인 것을 확인함으로써, 암을 갖는 대상체에서 배선 변이체를 확인하는 것
    을 포함하는 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 암을 갖는 대상체에 대한 분자 반응 점수를 미리 결정된 컷오프 포인트와 비교하여, 분자 반응 점수가 미리 결정된 컷오프 포인트 미만인 경우 대상체가 암에 대한 하나 이상의 요법에 대한 가능성 있는 반응자인 것 또는 분자 반응 점수가 미리 결정된 컷오프 포인트 이상인 경우 대상체가 암에 대한 하나 이상의 요법에 대한 가능성 있는 비-반응자인 것을 확인하는 것을 추가로 포함하는 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 하나 이상의 요법이 하나 이상의 면역요법을 포함하는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 추가로 포함하는 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 분자 반응 점수를 고려하여 암에 대한 하나 이상의 요법을 대상체에게 투여하는 것을 중단하는 것을 추가로 포함하는 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 분자 반응 점수를 대상체에 대한 예후적 바이오마커 및/또는 예측적 바이오마커로서 사용하는 것을 포함하는 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 분자 카운트를 사용하여 MAF 비의 세트 내의 각각의 MAF 비에 대한 표준 편차를 계산하는 것을 포함하는 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, MAF 비의 세트 내의 각각의 MAF 비를 통해 분산을 전파하는 것을 포함하는 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 복수의 변이체에 대한 돌연변이체 대립유전자 빈도 (MAF)를 결정하는 경우 하나 이상의 배선 및/또는 클론성 조혈 변이체를 배제하는 것을 추가로 포함하는 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 복수의 변이체가 체세포 핵산 변이체를 포함하는 것인 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 제1 및 제2 시점 양쪽 모두에서 약 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 미만인 MAF를 갖는 하나 이상의 체세포 변이체를 배제하는 것을 추가로 포함하는 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 제1 시점이 치료전 시점을 포함하고, 제2 시점이 치료중 또는 치료후 시점을 포함하는 것인 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 샘플 내의 하나 이상의 조직 또는 세포로부터 수득된 핵산 분자로부터 서열 정보를 생성하는 것을 포함하는 방법.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 대상체로부터 수득된 샘플 내의 무세포 핵산 (cfNA)으로부터 서열 정보를 생성하는 것을 포함하는 방법.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, cfNA가 순환 종양 DNA (ctDNA)를 포함하는 것인 방법.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 비가 복수의 변이체 내의 적어도 하나의 변이체에 대한 제2 MAF 대 제1 MAF를 포함하는 것인 방법.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, 하기 식을 사용하여 MAF 비의 가중 평균을 계산하는 것을 포함하고:
    합계[중량 * 비]/합계[중량]
    여기서 중량은 복수의 변이체 내의 주어진 변이체에 대한 1/범위2이고, 여기서 범위는 복수의 변이체 내의 주어진 변이체에 대한 제1 및 제2 MAF의 값 사이의 차이이고, 비는 MAF 비의 세트 내의 주어진 MAF 비인 방법.
  32. 제1항 내지 제31항 중 어느 한 항에 있어서, 하기 식을 사용하여 신뢰 구간을 계산하는 것을 포함하고:
    MAF 비의 가중 평균 +/- sqrt[비 분산]
    여기서 비 분산은 1/합계[중량]인 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 하기 식을 사용하여 MAF의 가중 평균의 비를 계산하는 것을 포함하고:
    (시점 2에서의 MAF 비의 가중 평균)/(시점 1에서의 MAF 비의 가중 평균)
    여기서 시점에서 비검출된 변이체의 MAF는 0으로 설정되는 것인 방법.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 변이체가 하나 이상의 단일-뉴클레오티드 변이체 (SNV), 삽입/결실 돌연변이 (인델), 유전자 증폭, 및/또는 유전자 융합을 포함하는 것인 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 하나 이상의 추가의 게놈 데이터 공급원을 사용하여 암을 갖는 대상체에 대한 분자 반응 점수를 결정하는 것을 추가로 포함하는 방법.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 추가의 게놈 데이터 공급원이 커버리지, 오프-타겟 커버리지, 후성유전학적 시그니쳐, 및/또는 미세부수체 불안정성 점수 중 하나 이상을 포함하는 것인 방법.
  37. 제1항 내지 제36항 중 어느 한 항에 있어서, 후성유전학적 시그니쳐가 cfNA 단편 길이, 위치, 및/또는 종점 밀도 분포를 포함하는 것인 방법.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 후성유전학적 시그니쳐가 주어진 표적화된 게놈 영역 내의 하나 이상의 후성유전학적 유전자좌에 의해 나타내어지는 후성유전학적 상태 또는 상황을 포함하는 것인 방법.
  39. 제1항 내지 제38항 중 어느 한 항에 있어서, 후성유전학적 상태 또는 상황이 메틸화, 히드록시메틸화, 아세틸화, 유비퀴틸화, 인산화, 수모일화, 리보실화, 시트룰린화, 및/또는 히스톤 번역후 변형 또는 다른 히스톤 변이의 존재 또는 부재를 포함하는 것인 방법.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 요법을 투여하기 전의 하나 이상의 카피 수 변이체 및 요법을 투여한 후의 하나 이상의 카피 수 변이체를 결정하고, 복수의 변이체로부터, 임계치를 초과하는 하나 이상의 카피 수 변이체의 수에 기초하여 하나 이상의 카피 수 변이체를 제거하는 것을 추가로 포함하는 방법.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서,
    제1 시점에서 체세포 변이체의 MAF로부터 수득된 제1 중심 경향성 척도 및 제2 시점에서 체세포 변이체의 MAF로부터 수득된 제2 중심 경향성 척도를 결정하고;
    제1 시점에서의 중심 경향성 척도 대 제2 시점에서의 중심 경향성 척도의 비를 계산하고;
    제1 시점에서의 중심 경향성 척도 대 제2 시점에서의 중심 경향성 척도의 비의 표준 편차를 계산하고;
    또 다른 분자 반응 점수로서, 제1 시점에서의 중심 경향성 척도 대 제2 시점에서의 중심 경향성 척도의 비를 산출하는 것
    을 추가로 포함하는 방법.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서,
    각각의 복수의 시점에서 복수의 서열 판독물을 수득하고;
    복수의 시점의 임의의 2개의 시점 사이의 MAF 비를 결정하는 것
    을 추가로 포함하는 방법.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, 하나 이상의 요법을 권장하는 것을 추가로 포함하는 방법.
  44. 제1항 내지 제43항 중 어느 한 항의 방법을 수행하도록 구성된 장치.
  45. 적어도 하나의 전자 프로세서에 의해 실행되는 경우, 제1항 내지 제43항 중 어느 한 항의 방법을 수행하는 비-일시적 컴퓨터 실행가능 명령을 포함하는 컴퓨터 판독가능 매체.
  46. 제1항 내지 제43항 중 어느 한 항의 방법을 수행하도록 구성된 시스템.
KR1020237033549A 2021-03-05 2022-03-04 분자 반응을 분석하기 위한 방법 및 관련 측면 KR20230156364A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163157592P 2021-03-05 2021-03-05
US63/157,592 2021-03-05
US202163173193P 2021-04-09 2021-04-09
US63/173,193 2021-04-09
PCT/US2022/070984 WO2022187862A1 (en) 2021-03-05 2022-03-04 Methods and related aspects for analyzing molecular response

Publications (1)

Publication Number Publication Date
KR20230156364A true KR20230156364A (ko) 2023-11-14

Family

ID=80952359

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237033549A KR20230156364A (ko) 2021-03-05 2022-03-04 분자 반응을 분석하기 위한 방법 및 관련 측면

Country Status (7)

Country Link
US (1) US20220411876A1 (ko)
EP (1) EP4302301A1 (ko)
JP (1) JP2024513668A (ko)
KR (1) KR20230156364A (ko)
AU (1) AU2022231055A1 (ko)
CA (1) CA3210101A1 (ko)
WO (1) WO2022187862A1 (ko)

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
ATE226983T1 (de) 1994-08-19 2002-11-15 Pe Corp Ny Gekoppeltes ampflikation- und ligationverfahren
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
EP1975251A3 (en) 2000-07-07 2009-03-25 Visigen Biotechnologies, Inc. Real-time sequence determination
US7208271B2 (en) 2001-11-28 2007-04-24 Applera Corporation Compositions and methods of selective nucleic acid isolation
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
CA2579150C (en) 2004-09-17 2014-11-25 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
KR102028375B1 (ko) 2012-09-04 2019-10-04 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
BR112019012958A2 (pt) 2016-12-22 2019-11-26 Guardant Health Inc métodos e sistemas para análise de moléculas de ácido nucleico
CN112020563A (zh) * 2018-03-06 2020-12-01 癌症研究技术有限公司 变体检测的改进

Also Published As

Publication number Publication date
AU2022231055A1 (en) 2023-09-14
US20220411876A1 (en) 2022-12-29
WO2022187862A1 (en) 2022-09-09
CA3210101A1 (en) 2022-09-09
EP4302301A1 (en) 2024-01-10
JP2024513668A (ja) 2024-03-27

Similar Documents

Publication Publication Date Title
JP7466519B2 (ja) 腫瘍遺伝子変異量を腫瘍割合およびカバレッジによって調整するための方法およびシステム
US11773451B2 (en) Microsatellite instability detection in cell-free DNA
JP7421474B2 (ja) 腫瘍遺伝子変異量の正規化
US20190385700A1 (en) METHODS AND SYSTEMS FOR DETERMINING The CELLULAR ORIGIN OF CELL-FREE NUCLEIC ACIDS
JP2022110013A (ja) 無細胞dnaについての体細胞起源または生殖系列起源の識別
CN114026646A (zh) 用于评估肿瘤分数的系统和方法
KR20200057024A (ko) 체세포 및 생식세포계열 변이체를 구별하기 위한 방법 및 시스템
US20220025468A1 (en) Homologous recombination repair deficiency detection
JP2023517029A (ja) 無細胞核酸において検出された遺伝的突然変異を、腫瘍起源または非腫瘍起源として分類するための方法
US20220028494A1 (en) Methods and systems for determining the cellular origin of cell-free dna
KR20230156364A (ko) 분자 반응을 분석하기 위한 방법 및 관련 측면
CN115428087A (zh) 克隆水平缺乏靶变体的显著性建模
CN117063239A (zh) 用于分析分子响应的方法和相关方面
US20220344004A1 (en) Detecting the presence of a tumor based on off-target polynucleotide sequencing data
WO2023168300A1 (en) Methods for analyzing cytosine methylation and hydroxymethylation