KR20210089240A - 체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도 - Google Patents

체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도 Download PDF

Info

Publication number
KR20210089240A
KR20210089240A KR1020217017932A KR20217017932A KR20210089240A KR 20210089240 A KR20210089240 A KR 20210089240A KR 1020217017932 A KR1020217017932 A KR 1020217017932A KR 20217017932 A KR20217017932 A KR 20217017932A KR 20210089240 A KR20210089240 A KR 20210089240A
Authority
KR
South Korea
Prior art keywords
allele
snp
somatic
variant
cancer
Prior art date
Application number
KR1020217017932A
Other languages
English (en)
Inventor
안드레이 자르키크
커스틴 팀스
마이클 페리
알렉산더 구틴
Original Assignee
미리어드 제네틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미리어드 제네틱스, 인크. filed Critical 미리어드 제네틱스, 인크.
Publication of KR20210089240A publication Critical patent/KR20210089240A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Hospice & Palliative Care (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Oncology (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 암 세포에서 체세포 돌연변이를 검출하기 위한 방법 및 조성물을 제공한다. 이 방법은 종양 돌연변이 부담을 측정하는 데 사용될 수 있다. 면역 관문 저해제와 같은 항암제 치료로부터 혜택을 받는 대상체를 식별하고 치료하는 방법, 대상체의 암을 치료하는 방법, 및 암에 걸린 대상체를 모니터링하고 예후하는 방법이 제공된다.

Description

체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도
본 발명은 핵산 시퀀싱에 의해 암 세포의 체세포 돌연변이를 검출하기 위한 방법, 조성물, 키트 및 시스템에 관한 것이다. 보다 구체적으로, 본 개시내용은 종양 돌연변이 부담(burden)을 측정하고, 면역 관문 저해제(immune checkpoint inhibitor)와 같은 항암제 치료로부터 혜택을 받는 대상체를 식별 및 치료하고, 대상체의 암을 치료하고, 암이 있는 대상체를 모니터링 및 예후하는 방법을 제공한다.
세포에서 암의 특징 중 하나는 게놈 중 체세포 변이체의 존재이다. 예를 들어, 문헌[Theodor Boveri, J. Cell Sci.(2008) 121: 1-84] 참조. 체세포 변이체는 특히 변이체의 빈도를 정확하게 검출하고 기록할 수 있는 경우 암에 대한 바이오마커(biomarker)로서 사용될 수 있다. 그러나, 체세포 변이체를 정량적으로 검출하는 것은 어렵다.
암세포에서 체세포 변이체의 빈도는 Mb당 0.1개 미만에서부터 수백개까지의 범위일 수 있다. 체세포 변이체를 검출하는 방법의 단점으로는 변이체의 낮은 출현 빈도로 인한 낮은 감도를 포함한다. 낮은 빈도의 체세포 변이체를 식별하고 카운트(count)하는 시도들은 고속 대량(high throughput)의 핵산 시퀀싱 방법론에서 노이즈(noise)의 수준을 극복하지 못할 수 없다.
또한, 표준 게놈(reference genome)을 필요로 하는 핵산 시퀀싱 방법론에서, 표준 게놈에 다양한 대립유전자의 불충분한 표현(representation)은 그룹 또는 민족 성향으로 인해 부정확성을 초래할 수 있다.
일부 종래 시퀀싱 방법론의 중요한 결점은 암 샘플에서 검출된 변이체로부터 생식계열 변이체를 구별하기 위해 사용되는 비-암(non-cancer) 생식계열 비교(comparator) 샘플이 필요하다는 것이다. 비-암 생식계열 비교 샘플은 암세포에서 검출된 체세포 변이체로부터 공제되어야 하는 기준선(baseline)을 제공할 수 있다. 사실, 많은 경우 이러한 비교 샘플은 심지어 입수가 용이하지 않을 수도 있다.
필요한 것은, 체세포 변이체를 고감도로 검출하기 위한 방법, 조성물 및 시스템이다. 또한, 체세포 변이체를 정확하게 검출하고 카운트하는 시퀀싱 방법론을 개선시키는 것도 바람직하다.
암을 치료하고 치료로부터 혜택을 받는 대상체를 식별하기 위한 방법이 절실히 요구된다. 필요한 것은 암에 걸린 대상체의 종양 또는 조직 샘플과 함께 비-암의 비교 샘플을 필요로 하지 않는 방법 및 시스템이다.
오류를 감소시키기 위해 변이체의 직접 검출을 포함하는 방법에 의해 이러한 목표를 달성할 필요성은 오랫동안 있었다.
본 발명은 암 세포에서 체세포 돌연변이의 검출, 면역 관문 저해제와 같은 항암제 치료로부터 혜택을 받는 대상체의 식별 및 치료, 종양 돌연변이 부담 측정, 대상체의 암 치료, 암이 있는 대상체의 모니터링 및 예후를 위한 방법, 조성물, 키트 및 시스템을 제공한다.
체세포 돌연변이의 측정은 암에 대한 치료, 진단 및 예후 방법을 제공할 수 있다.
일부 양상에서, 본 발명은 항암제를 사용한 암 치료와 같은 치료로부터 혜택을 받는 대상체를 선택 및 식별하는 방법을 제공한다. 이러한 대상체의 경우, 암 치료를 위한 치료 양식이 선택될 수 있다.
추가의 양상에서, 본 발명은 암 세포에서 종양 돌연변이 빈도를 측정하고 채점(scoring)하는 방법을 제공한다. 점수(score)는 대상체로부터의 샘플에 대한 종양 돌연변이 부담(burden)을 계산하는 데 사용될 수 있다. 종양 돌연변이 부담은 암과 같은 질병에 대한 바이오마커로서 역할을 할 수 있다.
체세포 변이체는 특정 약제를 사용한 치료에 대한 대상체의 반응과 연관될 수 있다. 예를 들어, 높은 종양 돌연변이 부담값은 면역 관문 저해제 약물의 투여에 대한 암이 있는 대상체의 유리한 반응과 연관될 수 있다.
본 발명의 구현예는 다음을 포함한다:
체세포 변이체를 검출하는 방법으로서, 하기를 포함하는, 방법:
(a) 샘플의 세포를 시퀀싱하는 단계;
(b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치 세트를 식별하는 단계;
(c) SNP 위치 및 SNP 위치 부근의 위치에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링(pairing)을 검출하는 단계로서, 여기서 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 것인 단계; 및
(d) (iii) 대립유전자 B 및 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계. 대립유전자 페어링은 SNP 위치 중 하나를 함유하는 인접 핵산 서열에서 각각 검출될 수 있어, 변이체 위치는 SNP 위치의 하나의 검출 길이 내에 있다. 인접 핵산 서열은 약 100 내지 5000개 염기의 판독 길이일 수 있다. 검출 길이는 SNP 위치의 각 측접부(flank)에 있는 200 내지 1000개의 인접 염기 위치일 수 있다. 이 방법은 별도의 생식계열 비교 샘플을 활용하지 않는다. 샘플은 암 조직 샘플, 종양 세포 샘플 또는 종양 샘플일 수 있다. 샘플 내 비종양 세포의 양은 최소화될 수 있다. 샘플은 비종양 세포를 함유할 수 있다. 대립유전자 페어링은 대량 병렬 시퀀싱, 혼성화 또는 증폭에 의해 검출될 수 있다. 이형접합 SNP 위치 세트는 적어도 500개의 SNP 위치, 또는 적어도 1000개 SNP 위치, 또는 적어도 5000개 SNP 위치일 수 있다. 이 방법은 Mb당 0.1개, Mb당 0.3개 또는 Mb당 0.7개의 최소 수준으로 체세포 변이체를 검출할 수 있다. 검출은 표적화된 SNP 패널에 의해 수득될 수 있다. 검출은 인간 표준 게놈을 사용하는 단편화 시퀀싱에 의해 수득될 수 있다.
체세포 변이체를 검출하는 방법으로서, 하기를 포함하는, 방법:
(a) 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플의 서열 리드(sequence read)을 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 것인, 단계;
(c) 서열 리드를 표준 게놈에 매핑(mapping)하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬(somatic variant count matrix)을 조립(assemble)하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서와 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는 것인, 단계; 및
(e) 제3 요소에 대한 체세포 돌연변이 유의성 점수(S)를 계산하는 단계. 이 방법은 별도의 생식계열 비교 샘플을 활용하지 않는다. 샘플은 암 조직 샘플, 종양 세포 샘플 또는 종양 샘플일 수 있다. 이 방법은 체세포 변이체를 Mb당 0.1개, Mb당 0.3개 또는 Mb당 0.7개의 최소 수준으로 검출할 수 있다. 서열 리드는 표적화된 SNP 패널을 이용하여 수득할 수 있다. 판독 길이는 100 내지 5000개 또는 200 내지 1000개의 인접 염기 위치일 수 있다. 평균 판독 깊이는 커버되는 표준 게놈 부위에 대해 적어도 50x 또는 100x일 수 있다. 표준 게놈은 인간 게놈일 수 있다. 서열 리드는 오류 필터링 및 위치 필터링될 수 있다.
체세포 돌연변이 유의성 점수(S)는 하기 식 I에 의해 제공된다:
S = (C(Z,P)2/(C(Z,P)+C(X,P)) + (C(Z,P)-E)2/E)/2 * 10 (식 I)
식 중, C(Z,P)는 제3 요소의 카운트이고, C(X,P)는 제1 요소의 카운트이며, E는 모든 SNP 영역에서 가장 높은 3개의 수를 제외한, 행렬에 있는 다른 모든 카운트의 평균으로부터 계산된 오류율이다.
치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법으로서, 하기를 포함하는, 방법:
(a) 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치 세트를 식별하는 단계;
(c) SNP 위치 및 SNP 위치 부근의 위치에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 여기서 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 것인 단계;
(d) (iii) 대립유전자 B 및 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 여기서 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는 것인, 단계;
(f) 대립유전자 페어링으로부터 검출된 체세포 변이체로부터 종양 돌연변이 부담에 대한 값을 계산하는 단계; 및
(g) 참조 수준(reference level)보다 더 큰 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 단계.
치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법으로서, 하기를 포함하는, 방법:
(a) 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 것인, 단계;
(c) 서열 리드를 표준 게놈에 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑되는 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는 것인, 단계;
(e) 하기 단계에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 제3 요소에 대한 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계; 및
(f) 체세포 돌연변이의 참조 수준보다 큰 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 단계. 표준 게놈에서 이형접합-SNP의 수는 표준 게놈에 있는 약 100개 내지 이형접합-SNP의 총 수까지일 수 있다. 체세포 돌연변이의 참조 수준은 대상체가 치료로부터 혜택을 볼 수준일 수 있다. 체세포 돌연변이의 참조 수준은 표준 게놈의 평균 종양 돌연변이 부담일 수 있다. 체세포 돌연변이의 참조 수준은 대상체와 동일한 종류의 암을 갖는 참조 집단의 평균 종양 돌연변이 부담일 수 있다. 체세포 돌연변이의 참조 수준은 암에 걸리지 않은 참조 집단의 평균 종양 돌연변이 부담일 수 있다. 체세포 돌연변이의 참조 수준은 치료로부터 혜택을 받지 않은 참조 집단의 평균 종양 돌연변이 부담일 수 있다. 체세포 돌연변이의 참조 수준은 대상체로부터 상이한 샘플에 의해 수득될 수 있다. 종양 돌연변이 부담 역치는 15, 20, 30 또는 40일 수 있으며, 종양 돌연변이 부담은 하기 식 II에 의해 제공된다.
TMB = N(S > 역치)/(N(HomHet) + N(HetHet)) * 1000000 (식 II)
식 중, N은 이형접합-SNP 영역에 있는 위치의 총 수(N(HomHet) + N(HetHet))에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수이다.
필요로 하는 대상체의 암을 치료하는 방법으로서, 하기 단계를 포함하는, 방법:
(a) 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치의 세트를 식별하는 단계;
(c) SNP 위치 및 SNP 위치 부근에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 여기서 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B와 제1 변이체 대립유전자, 및 (ii) 대립유전자 A와 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 것인 단계; 및
(d) (iii) 대립유전자 B와 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 여기서 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는 것인, 단계;
(e) 검출된 체세포 변이체로부터 종양 돌연변이 부담값을 계산하는 단계;
(f) 참조 수준보다 큰 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 단계; 및
(g) 암에 대한 치료를 투여하는 단계.
필요로 하는 대상체의 암을 치료하는 방법으로서, 하기 단계를 포함하는, 방법:
(a) 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 것인, 단계;
(c) 서열 판독을 표준 게놈에 대해 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 판독의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서와 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는 것인, 단계;
(e) 하기 단계들에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계;
(f) 체세포 돌연변이의 참조 수준보다 큰 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 볼 암에 걸린 대상체를 식별하는 단계; 및
(g) 암에 대한 치료를 투여하는 단계. 암 치료는 면역 관문 저해제 약물을 투여하는 것을 포함할 수 있다.
필요로 하는 대상체의 암을 치료하는 방법으로서, 하기를 포함하는, 방법:
(a) 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 것인, 단계;
(c) 서열 리드를 표준 게놈에 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는 것인, 단계;
(e) 하기 단계에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치를 초과하는 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계;
(f) 체세포 돌연변이의 참조 수준보다 큰 종양 돌연변이 부담을 갖는 치료로부터 혜택을 볼 암에 걸린 대상체를 식별하는 단계;
(g) 일정 기간 동안 암의 징후 및 증상에 대해 대상체를 모니터링하는 단계; 및
(h) 암에 대한 치료를 투여하는 단계. 치료는 면역 관문 저해제를 투여하는 것일 수 있다.
치료에 대한 암에 걸린 대상체의 반응을 모니터링하는 방법으로서, 하기를 포함하는, 방법:
(a) 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치의 세트를 식별하는 단계;
(c) SNP 위치 및 SNP 위치 부근에 있는 위치의 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 여기서 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B와 제1 변이체 대립유전자, 및 (ii) 대립유전자 A와 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 것인 단계; 및
(d) (iii) 대립유전자 B와 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 여기서 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는 것인, 단계;
(e) 검출된 체세포 변이체로부터 종양 돌연변이 부담값을 계산하는 단계.
암에 걸린 대상체의 치료에 대한 반응을 모니터링하는 방법으로서, 하기 단계를 포함하는, 방법:
(a) 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 것인, 단계;
(c) 서열 리드를 표준 게놈에 대해 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는 단계;
(e) 하기 단계들에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계.
암에 걸린 대상체를 예후하는 방법으로서, 하기를 포함하는, 방법:
(a) 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 각 SNP가 대립유전자 B 및 A를 갖는, 이형접합 SNP 위치의 세트를 식별하는 단계;
(c) SPN 위치 및 SNP 위치 부근의 위치에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 여기서 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B와 제1 변이체 대립유전자, 및 (ii) 대립유전자 A와 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 것인 단계; 및
(d) (iii) 대립유전자 B와 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 여기서 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는 것인, 단계;
(e) 검출된 체세포 변이체로부터 종양 돌연변이 부담값을 계산하는 단계; 및
(f) TMB 참조 수준보다 큰 종양 돌연변이 부담을 갖는 대상체를 좋지 않은 예후를 갖는 것으로서 예후하는 단계.
암에 걸린 대상체를 예후하는 방법으로서, 하기를 포함하는, 방법:
(a) 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 단계;
(c) 서열 리드를 표준 게놈에 대해 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는 것인, 단계;
(e) 하기 단계들에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계;
(f) TMB 참조 수준보다 큰 종양 돌연변이 부담을 갖는 대상체를 좋지 않은 예후를 갖는 것으로서 예후하는 단계; 및
(g) 암에 대한 치료를 투여하는 단계.
치료로부터 혜택을 받는 암에 걸린 대상체를 식별하기 위한 키트로서, 하기를 포함하는 키트:
(a) 대상체의 샘플로부터 서열 리드를 수득하기 위한 시약으로서, 서열 리드는 샘플의 종양 돌연변이 부담에 대한 값을 수득하는 데 사용될 수 있는 시약; 및
(b) 서열 리드를 수득하기 위한 시약 및 대상체를 식별하기 위한 종양 돌연변이 부담값을 사용하는 지침서.
체세포 변이체를 검출하기 위한 시스템으로서, 하기를 포함하는 시스템:
암세포 및 비-암세포를 함유하는 샘플로부터 핵산을 받아서 농축시키고 증폭시키기 위한 수단;
핵산으로부터 라이브러리를 합성하기 위한 수단;
라이브러리를 시퀀싱 칩과 접촉시키기 위한 수단;
라이브러리의 서열을 검출하고 서열 데이터를 프로세서로 전송하기 위한 수단;
하기 단계를 수행하기 위한 하나 이상의 프로세서:
(a) 암세포 및 비-암세포를 함유하는 샘플을 제공하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드은 판독 길이를 갖는 것인, 단계;
(c) 서열 리드를 표준 게놈에 대해 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는 것인, 단계;
(e) 하기 단계들에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계; 및
서열 정보를 표시, 도표화 및 기록하기 위한 디스플레이.
프로세서가 체세포 변이체를 검출하는 방법의 단계들을 수행하도록 하는, 프로세서에 의한 실행 명령이 저장되어 있는 비-일시적 기계판독성 저장 매체로서, 상기 방법이 하기를 포함하는 저장 매체:
(a) 암세포 및 비-암세포를 함유하는 샘플을 제공하는 단계;
(b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 여기서 서열 리드는 판독 길이를 갖는 것인, 단계;
(c) 서열 리드를 표준 게놈에 매핑하는 단계;
(d) 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 여기서 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 여기서 카운트 행렬은 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는 단계;
(e) 하기 단계에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계:
(i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
(ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계; 및
(f) 샘플로부터 서열 정보를 표시, 도표화 및 기록하는 단계.
도 1: 핵산 시퀀싱에 의해 종양 돌연변이 부담을 검출 및 평가하기 위한 방법 및 단계의 예시.
도 2. 생식계열 대립유전자 및 생식계열 변이체의 예시. (상부) 이형접합 SNP B/A 부근에 위치한 이형접합 변이체 V/W에 대한 생식계열 대립유전자. 각 SNP 대립유전자는 단 하나의 변이체 대립유전자와 연관되며, SNP 및 VAR 위치 둘 모두를 커버하는 리드에 대해 단 2개의 고유한 서열 리드 BV 및 AW만이 예상된다. (하부) 이형접합 SNP B/A 부근에 위치한 동형접합 변이체 W/W에 대한 생식계열 대립유전자. 각 SNP 대립유전자는 단 하나의 변이체 대립유전자와 연관되며, SNP 및 VAR 위치 둘 모두를 커버하는 리드에 대해 단 2개의 고유한 서열 리드 BW 및 AW만이 예상된다.
도 3. 체세포 대립유전자 및 체세포 변이체의 예시. (상부) 이형접합 SNP B/A 부근에 위치한 이형접합 변이체 V/W에 대해 관찰된 대립유전자. SNP 및 VAR 위치를 모두 커버하는 리드에 있어서, 2개의 고유한 서열 리드는 2개의 정상 대립유전자 쌍 BV 및 AW에서 예상된다. 그러나, SNP 대립유전자 B는 BV 및 BW인 2개의 변이체 대립유전자와 연관된다. 따라서, BW는 신규(de novo) 돌연변이를 나타낸다. 이러한 리드의 행렬은 BV 및 AW에 대해 큰(L) 카운트를, BW에 대해서는 더 작을 수 있는 카운트(s)를 나타낸다. (하부) 이형접합 SNP B/A 부근에 위치한 동형접합 변이체 W/W에 대해 관찰된 대립유전자. SNP 및 VAR 위치를 모두 커버하는 리드에 있어서, 2개의 고유한 서열 리드는 2개의 정상 대립유전자 쌍 BW 및 AW에서 예상된다. 그러나, SNP 대립유전자 B는 BV 및 BW인 2개의 변이체 대립유전자와 연관된다. 따라서, BV는 신규(de novo) 돌연변이를 나타낸다. 이러한 리드의 행렬은 BW 및 AW에 대해 큰(L) 카운트를, BV에 대해서는 더 작을 수 있는 카운트(s)를 나타낸다.
도 4. 핵산 시퀀싱에 의해 종양 돌연변이 부담을 검출 및 평가하기 위한 방법의 실시형태의 예. 이형접합 SNP(Hom/Het) 부근에 위치한 동형접합 체세포 변이체의 경우, 제시된 바와 같은 표준 게놈(WT)에 대해 서열 판독 스택을 매핑하였다. 대립유전자 쌍 GA(55회), AA(32회) 및 AG(23회)의 검출을 보여주는 카운트 행렬이 조립되었다. 세 번째 최대 횟수 AG(23회)의 출현은 일부 암세포의 체세포 돌연변이로부터 발생했다.
도 5. 핵산 시퀀싱에 의해 종양 돌연변이 부담을 검출 및 평가하기 위한 방법의 실시형태의 예. 이형접합 SNP(Het/Het) 부근에 위치한 이형접합 체세포 변이체의 경우, 대립유전자 CG(39회), GT(34회) 및 GG(7회)의 검출을 보여주는 카운트 행렬이 조립되었다. 세 번째 최대 횟수 GG(7회)의 출현은 일부 암세포의 체세포 돌연변이로부터 발생했다.
도 6. 결장암 샘플의 시퀀싱 데이터 예시. 각 곡선은 변이체 위치의 수(y축)를 대립유전자 비율%(x축)에 의해 나타낸 것이다. 하나의 샘플은 높은 TMB 샘플을 나타내는 큰 피크를 보여주었다. 10% 미만의 매우 낮은 대립유전자 비율 값에서 좌측의 큰 피크는 무시되는 시퀀싱 오류를 반영한다. TMB 값을 카운트하는데 있어서, TMB 값은 30보다 큰 점수(y축)를 위해 약 15% 내지 약 65%의 대립유전자 비율의 범위에서 곡선 아래 면적으로서 계산될 수 있다.
도 7. 생식계열 비교 샘플의 데이터를 공제하거나 생식계열 필터링을 수반하는 종래의 방법과 비교한, 핵산 시퀀싱에 의해 결장 및 유방암 샘플의 종양 돌연변이 부담을 검출 및 평가하기 위한 본 발명의 SNP 기반 방법의 데이터 플롯. 제2의 생식계열 비교 샘플 없이, 종양 샘플만을 가지고 본 발명의 직접 SNP 분석 방법(검정색 원)을 사용한 경우, 종래의 방법보다 놀라울 정도로 우수한 종양 돌연변이 부담의 평가가 수득되었다. 본 발명의 SNP 기반 방법(검정색 원)의 감도는 종래의 방법에 비해 놀라울 정도로 증가했다. 보다 구체적으로, 본 발명의 SNP 기반 방법(검정색 원)은 알려진 생식계열 변이체의 데이터베이스를 사용하고 생식계열 배경(흰색 원)을 제거하기 위한 시도로 공통 변이체를 필터링하여 종양 돌연변이 부담을 평가하는 핵산 시퀀싱 방법보다 놀라울 정도로 더욱 정확했다.
본 발명은 암 세포에서 체세포 돌연변이를 검출하기 위한 방법, 조성물, 키트 및 시스템을 제공한다. 체세포 돌연변이의 측정은 암에 대한 치료, 진단 및 예후 방법을 제공할 수 있다.
일부 양상에서, 본 발명은 항암제를 사용한 암 치료와 같은 치료로부터 혜택을 받는 대상체를 선택하고 식별하는 방법을 제공한다. 이러한 대상체에 대해, 치료 양식은 암 치료를 위한 것으로 선택될 수 있다.
추가의 양상에서, 본 발명은 암 세포의 종양 돌연변이 빈도를 측정하고 채점하는 방법을 제공한다. 점수는 대상체로부터의 샘플에 대한 종양 돌연변이 부담을 계산하는 데 사용될 수 있다. 종양 돌연변이 부담은 암과 같은 질병에 대한 바이오마커로서 작용할 수 있다.
체세포 변이체는 특정 약제를 사용하는 치료에 대한 대상체의 반응과 연관이 있을 수 있다. 예를 들어, 높은 종양 돌연변이 부담값은 면역 관문 저해제 약물의 투여에 대한 암에 걸린 대상체의 유리한 반응과 연관이 있을 수 있다.
본 명세서에 사용된 바와 같이, 체세포 변이체의 빈도와 관련된 양은 "종양 돌연변이 부담"(tumor mutation burden: TMB)으로서 정의될 수 있다. TMB는 체세포 변이체의 카운트를 결정하는 데 있어서 검정된 게놈 위치의 총 수로 정규화된 암 샘플에 있는 체세포 변이체의 카운트로서 계산될 수 있다. TMB는 DNA 메가염기당 돌연변이의 수로서 표현될 수 있다.
TMB는 또한 RNA로부터 측정될 수 있고 RNA의 메가염기당 돌연변이의 수로서 표현될 수 있다.
TMB의 척도(measure)는 게놈 위치 세트에 있는 체세포 변이체의 척도로서 수득될 수 있다. 게놈 위치의 세트는 게놈의 SNP 영역의 세트일 수 있다.
일부 실시형태에서, 이형접합 SNP 위치의 세트는 시퀀싱 데이터 또는 시퀀싱 리드를 사용하여 식별할 수 있다.
일부 실시형태에서, 이형접합 SNP 위치의 세트는 공지된 인간 SNP 위치를 사용하여 식별할 수 있다.
본 발명의 TMB의 척도는 게놈의 체세포 돌연변이 부하량(load)에 대한 대체값일 수 있다. 본 발명의 TMB의 척도는 게놈의 체세포 돌연변이의 수를 직접 반영하는 수치 수준을 제공할 수 있다. 본 발명의 TMB의 척도는 게놈의 총 돌연변이 부하량의 유효한 추정치일 수 있는 수치 수준을 제공할 수 있다. 본 발명의 TMB의 척도는 다른 문헌에서 "TMB"로 표지된 양과 상이할 수 있다.
일부 양상에서, 본 발명은 체세포 돌연변이를 검출하고 돌연변이 수준을 결정하기 위한 방법 및 시스템을 제공한다. 돌연변이 부하량은 게놈에 있는 체세포 돌연변이의 검출을 포괄하는 고유한 알고리즘으로부터 수득될 수 있고, 여기서 체세포 돌연변이는 게놈 내의 SNP 위치들의 어레이에서 SNP 위치 부근에 각각 위치한다.
특정 양상에서, 본 발명의 TMB의 척도는 체세포 돌연변이가 게놈의 SNP 위치들의 어레이에서 SNP 위치 부근에 각각 위치하는, 게놈 내 체세포 돌연변이의 부분의 검출을 포괄하는 고유한 알고리즘으로부터 수득될 수 있다.
추가의 양상에서, 본 발명의 TMB의 척도는 돌연변이가 게놈 내의 위치의 함수에 영향을 미칠 수 있는 게놈의 체세포 돌연변이의 수를 직접 반영하는 수치 수준을 제공할 수 있다.
추가의 양상에서, TMB를 측정하기 위한 본 발명의 방법은 관심 유전자좌의 복수의 독립적인 리드를 제공하는 임의의 시퀀싱 기술에 의해 수득되는 데이터를 활용할 수 있다. 다양한 실시형태에서, 생어(Sanger) 서열법이 활용될 수 있다.
추가의 양상에서, TMB를 측정하기 위한 본 발명의 방법은 SNP가 시퀀싱될 수 있는 임의의 SNP 패널, 전체 엑솜/게놈 시퀀싱, 및 유전자 패널과 함께 활용될 수 있다.
일부 실시형태에서, 게놈 전체로부터의 SNP를 또한 샘플링하는 혼성화 포획 기반의 유전자 패널인 HRD(Myriad Genetics, Inc.) 시퀀싱이 사용될 수 있다. HRD 검정은 HRD 점수가 유래될 수 있는 종양-CN/LOH 프로파일을 재구성하기 위해 SNP를 활용할 수 있다. HRD 검정은 다수의 SNP 유전자좌를 시퀀싱하는데 사용될 수 있다.
특정 실시형태에서, 양측면 상에 측접 영역을 포함하는, 충분한 수의 SNP를 갖는 임의의 시퀀싱 데이터가 사용될 수 있다.
추가의 양상에서, 임의의 서열 기반의 NGS 검정은 TMB를 측정하기 위한 본 발명의 방법에 사용될 수 있다.
추가의 양상에서, 본 발명의 실시형태는 암에 걸린 대상체를 치료하는 방법을 제공한다. 암에 걸린 대상체는 대상체로부터의 샘플에서 종양 돌연변이 부담을 평가함으로써 선택되고 식별될 수 있다. 대상체는 유효량의 면역 관문 저해제와 같은 항암제에 의해 치료될 수 있다.
본 발명의 양상은 본 발명의 TMB 척도를 포함한, 유리하게 우수한 감도에 의해 샘플 중의 체세포 변이체를 검출하기 위한 방법, 조성물 및 시스템을 포함한다.
본 발명은 샘플의 핵산을 시퀀싱하기 위한 개선된 방법을 추가로 제공할 수 있다. 본 발명의 개선된 시퀀싱 방법론은 체세포 변이체를 정확하게 검출하고 카운트하는데 사용될 수 있다.
본 개시내용에 기재된 실시형태는 암을 치료하는 방법뿐만 아니라 치료로부터 혜택을 받는 대상체를 식별하는 방법을 포함한다. 본 발명의 고유 방법은 암이 아닌 비교 샘플 없이 대상체의 단일 샘플에 의해 수행될 수 있다. 본 개시내용의 방법은 체세포 변이체 점수 및 종양 돌연변이 부담값을 결정하는데 사용될 수 있는 체세포 변이체의 직접적인 척도를 제공한다. 암에 걸린 대상체 유래의 종양 또는 조직 샘플과 같은 대상체 유래의 샘플에서 체세포 돌연변이의 직접적인 측정 및 종양 돌연변이 부담의 평가는 질병에 대한 정확한 바이오마커를 제공할 수 있다.
본 발명의 또 다른 양상은 민족 성향으로 인한 오류를 감소시킬 수 있는 체세포 변이체를 직접 검출하기 위한 방법을 포함한다. 본 개시내용의 방법은 오로지 암세포에 기인할 수 있는 서열 리드를 카운트함으로써 단일 시험 샘플로부터 체세포 변이체를 검출할 수 있다. 이러한 방법에서, 그룹 또는 민족 성향에 의한 영향을 덜 받으면서 개체에게 관련이 있는 종양 돌연변이 부담이 결정될 수 있다.
본 발명의 방법에 의해 결정된 종양 돌연변이 부담은 특정 암에서 특히 예측될 수 있다. 종양 돌연변이 부담은 암의 검출 및 진단뿐만 아니라 예후를 결정하는 데에도 사용될 수 있다.
암의 예는 전립선 암, 흑색종, 방광암, 유방암, 혈액암, 중피종, 폐암 및 고형 종양을 포함한다.
일부 실시형태에서, 본 발명은 비정상 상태가 좋지 않은 예후를 나타낼 수 있는 종양 돌연변이 부담을 평가하는 방법을 제공한다.
추가 실시형태에서, 종양 돌연변이 부담을 평가하기 위한 방법은 암 진단 및/또는 예후에 사용되는 하나 이상의 임상 파라미터와 조합될 수 있다.
임상 파라미터의 예는 예를 들어 임상 노모그램(nomogram)을 포함한다.
특정 실시형태에서, 높은 수준의 종양 돌연변이 부담은 암의 존재를 나타낼 수 있다.
추가 실시형태에서, 종양 돌연변이 부담의 높은 수준은 임상 노모그램 점수가 재발 또는 진행의 비교적 낮은 위험을 나타내는 대상체에서 암 재발 또는 진행의 증가된 위험을 나타낼 수 있다.
예를 들어, 종양 돌연변이 부담의 높은 수준은 종양 등급 또는 단계와 무관하게 또는 노모그램 점수와 무관하게 암 재발 또는 진행의 증가된 위험을 나타낼 수 있다. 따라서, 종양 돌연변이 부담의 높은 수준은 임상 파라미터만으로는 검출되지 않는 증가된 위험을 검출할 수 있다.
일부 양상에서, 본 개시내용은 암 환자에 대한 적어도 하나의 임상 파라미터를 결정하고 환자로부터 수득한 샘플에서 종양 돌연변이 부담을 결정하는 것을 포함하는 시험관내 진단 방법을 제공한다.
일부 실시형태에서, 종양 돌연변이 부담의 비정상 상태는 암의 재발 또는 진행의 증가된 가능성을 나타낼 수 있다.
특정 실시형태에서, 종양 돌연변이 부담의 평가와 하나 이상의 임상 파라미터의 조합은 암에 대한 예측 능력을 개선시킬 수 있다. 일부 실시형태에서, 하나보다 많은 임상 파라미터가 평가되어 종양 돌연변이 부담의 평가와 조합될 수 있다.
추가의 양상에서, 본 발명은 환자에 대한 적어도 하나의 임상 파라미터 또는 노모그램 점수를 결정하고 환자의 종양 돌연변이 부담을 평가하는 것을 포함하는 시험관내 진단 방법을 포함한다.
본 발명의 양상은 대상체 유래의 조직 또는 세포 샘플, 특히 종양 샘플에서 종양 돌연변이 부담을 평가하여 암을 분류하는 방법을 포함한다.
본 개시내용의 종양 샘플은 암 세포 및 비-암인 정상 세포의 혼합물을 함유할 수 있다. 본 개시내용의 종양 샘플은 이 샘플 중 비-암 또는 비-종양 함량이 최소화되도록 수득될 수 있다. 예를 들어, 샘플 중 비-종양 함량은 생검 중 종양 조직만을 절제하거나, 또는 정상 조직 경계(margin)가 없거나 최소인 병변만을 제거하여 최소화할 수 있다.
특정 실시형태에서, 측정된 체세포 돌연변이가 종양 돌연변이 부담에 대한 양과 관련될 수 있도록 샘플 중 비-종양 함량을 최소화하는 것이 바람직하다. 종양 돌연변이 부담 양은 종양 중 신규(de novo) 돌연변이 또는 체세포 돌연변이의 수준을 특성화하는 데 사용될 수 있다.
추가 실시형태에서, 특히 샘플이 일부 비-종양 함량을 함유하는 경우라도, 측정된 체세포 돌연변이는 종양 돌연변이 부담의 양과 관련될 수 있다. 종양 돌연변이 부담 양은 대상체의 임상 상태를 분석하기 위한 종양 샘플의 신규 또는 체세포 돌연변이의 수준을 특성화하는 데 사용될 수 있다.
본 발명의 실시형태는 생식계열 공제(subtraction) 없이 체세포 돌연변이를 검출하기 위한 방법에서 암 및 비-암 세포를 함유하는 샘플을 유리하게 활용할 수 있다. 생식계열 공제 없이 체세포 돌연변이를 검출하기 위한 본 발명의 방법은 특히 암 세포와 비-암인 정상 세포의 혼합물을 함유하는 샘플에서도 종양에만 존재하는 돌연변이의 수를 카운트할 수 있다. 생식계열 공제 없이 체세포 돌연변이를 검출하기 위한 본 발명의 방법은 돌연변이가 정상 세포에 존재하는지, 및 종양 세포에 존재하는 돌연변이를 식별하고 종양에 존재하는 돌연변이만을 카운트할 수 있다.
일부 실시형태에서, 본 개시내용의 종양 샘플은 증가된 정확도 및/또는 정밀도로 체세포 돌연변이가 검출될 수 있도록 샘플 내의 비-암 함량을 최소화하도록 수득될 수 있다.
특정 실시형태에서, 본 발명의 방법은 특히 암 세포 및 비-암 세포를 함유하는 샘플에서도 생식계열 공제 없이 암 세포 중의 체세포 돌연변이를 유리하게 검출할 수 있다.
종양 돌연변이 부담에 대한 참조 값은 임상 및 추적 데이터가 이용 가능하고 질병 결과, 예를 들어 재발 또는 예후에 의해 환자를 정의하고 분류하기에 충분한 유사한 결과를 갖는 복수의 훈련 환자, 예를 들어 암 환자의 평균 TMB 수준을 나타낼 수 있다.
TMB에 대한 참조 값은 항암제로 치료를 받은 적이 있는 암에 걸린 대상체의 집단에 존재하는 TMB 수준일 수 있다. 일부 실시형태에서, 집단은 특정 항암제로 치료를 받은 적이 있는 대상체 그룹 및 상이한 항암제로 치료를 받은 적이 있는 대상체의 상이한 그룹을 포함할 수 있다.
TMB에 대한 참조 값은 항암제 치료에 반응하지 않는 암에 걸린 대상체 집단의 TMB 수준일 수 있다.
일부 실시형태에서, TMB 값은 항암제 치료에 대해 상이한 반응성을 갖는 대상체를 구별할 수 있다. 특정 실시형태에서, TMB 값은 항암제 치료 후 전체 생존율, 또는 무진행 생존율이 증가한 대상체를 생존율이 증가하지 않은 대상체로부터 구별할 수 있다. 추가 실시형태에서, TMB 값은 치료요법적 치료로부터 혜택을 받거나 반응하는 집단의 대상체를 식별할 수 있다.
"양호한 예후 값"은 "양호한 결과"를 갖는 것으로서 특징지어진 복수의 훈련된 암 환자, 예를 들어 초기 치료 후 5년 또는 10년 또는 그 이상과 같이 일정 기간 동안 암이 재발하지 않거나, 또는 초기 진단 후 5년, 10년 또는 그 이상 동안 암이 진행되지 않은 환자로부터 생성될 수 있다.
"좋지 않은 예후 값"은 "좋지 않은 결과"를 갖는 것으로서 정의된 복수의 훈련된 암 환자, 예를 들어 초기 치료 후 5년, 또는 10년, 또는 그 이상 동안 암이 재발되거나, 초기 진단 후 5년, 또는 10년, 또는 그 이상 동안 암이 진행된 환자로부터 생성될 수 있다.
따라서, 양호한 예후 값은 "양호한 결과"를 갖는 환자의 평균 TMB 수준을 나타낼 수 있는 반면, 좋지 않은 예후 값은 "좋지 않은 결과"를 갖는 환자의 평균 TMB 수준을 나타낼 수 있다.
일부 실시형태에서, TMB 값이 증가하는 경우, 대상체는 좋지 않은 예후를 가질 수 있다.
특정 실시형태에서, TMB 값은 정상 값 또는 역치 양보다 증가될 수 있다.
다양한 실시형태에서, TMB 값은 양호한 예후 값보다 좋지 않은 예후 값에 더 가까울 수 있고, 이것은 대상체에 대한 좋지 않은 예후를 나타낼 수 있다.
다른 실시형태에서, TMB 값은 좋지 않은 예후 값보다 양호한 예후 값에 더 가까울 수 있고, 이것은 대상체에 대한 양호한 예후를 나타낼 수 있다.
추가 실시형태에서, TMB 값은 환자를 위험 군으로 지정함으로써 결정될 수 있고, 역치 값은 TMB 평균에 대해 설정될 수 있다.
역치 값은 감도 대 {1 - 특이성}을 플로팅한, 수신기 작동 특성(receiver operating curve, ROC) 곡선을 기반으로 하여 선택할 수 있다.
일부 실시형태에서, TMB 참조 수준은 Mb당 약 1개 내지 약 30개, 또는 약 2개 내지 약 30개, 또는 약 3개 내지 약 30개, 또는 약 4개 내지 약 30개, 또는 약 5개 내지 약 30개, 또는 약 6개 내지 약 30개, 또는 약 7개 내지 약 30개, 또는 약 8개 내지 약 30개, 또는 약 9개 내지 약 30개, 또는 약 10개 내지 약 30개, 또는 약 10개 내지 약 20개의 돌연변이일 수 있다.
일부 실시형태에서, TMB 참조 수준은 Mb당 약 5개 내지 약 300개, 또는 약 10개 내지 약 300개, 또는 약 30개 내지 약 300개, 또는 약 50개 내지 약 300개의 돌연변이일 수 있다.
일부 실시형태에서, TMB 참조 수준은 Mb당 약 1개, 또는 약 2개, 또는 약 3개, 또는 약 4개, 또는 약 5개, 또는 약 6개, 또는 약 7개 또는 약 8개, 또는 약 9개, 또는 약 10개, 또는 약 20개의 돌연변이일 수 있다.
일부 실시형태에서, TMB 참조 값은 Mb당 약 30개, 또는 약 50개 돌연변이일 수 있다.
일반적으로, 암은 암의 하나 이상의 임상적으로 관련된 특징을 결정하고 및/또는 암에 걸린 환자의 특정 예후를 결정함으로써 분류될 수 있다. 따라서, "암을 분류하는"은 다음을 포함할 수 있다: (i) 전이 가능성, 특정 기관으로 전이할 가능성, 재발 위험 및/또는 종양의 진행 과정을 평가하는 것; (ii) 종양 단계를 평가하는 것; (iii) 암 치료없이 환자의 예후를 결정하는 것; (iv) 치료(예컨대, 화학요법, 방사선 요법, 종양 절제 수술 등)에 대한 환자 반응(예컨대, 종양 수축 또는 무진행 생존)의 예후를 결정하는 것; (v) 현행 치료 및/또는 과거 치료에 대한 실제 환자 반응을 진단하는 것; (vi) 환자에 대한 바람직한 치료 과정을 결정하는 것; (vii) 치료(일반적인 치료 또는 일부 특정 치료) 후 환자 재발에 대한 예후; (viii) 환자 기대 수명의 예후(예컨대, 전체 생존율에 대한 예후).
"음성 분류"는 암의 불리한 임상 특징(예컨대, 좋지 않은 예후)을 의미한다. 예로는 (i) 증가된 전이 가능성, 특정 기관으로의 전이 가능성 및/또는 재발 위험; (ii) 진행된 종양 단계; (iii) 암 치료의 부재 하에 좋지 않은 환자 예후; (iv) 특정 치료(예컨대, 화학요법, 방사선 요법, 종양 절제 수술 등)에 대한 환자 반응(예컨대, 종양 수축 또는 무진행 생존)의 좋지 않은 예후; (v) 치료(일반적인 치료 또는 일부 특정 치료) 후 환자 재발에 대한 좋지 않은 예후; (vi) 환자 기대 수명의 좋지 않은 예후(예컨대, 전체 생존율에 대한 예후).
일부 실시형태에서, 재발 관련 임상 파라미터(또는 높은 노모그램 점수) 및 증가된 TMB는 암의 음성 분류(예를 들어, 재발 또는 진행의 증가된 가능성)를 나타낼 수 있다.
일반적으로, TMB의 상승된 값은 빠르게 증식하는 암 세포를 동반할 수 있으며, 이는 보다 공격적인 암을 나타낼 수 있다. TMB의 상승된 값을 갖는 대상체는 치료 후 증가된 재발 가능성을 가질 수 있다. TMB의 상승된 값을 갖는 대상체는 증가된 암 진행 가능성을 갖거나, 더욱 빠른 진행을 가질 수 있고, 여기서 빠르게 증식하는 세포는 종양이 빠르게 성장하게 하고, 독성이 생기게 하고, 및/또는 전이되도록 할 수 있다. TMB의 상승된 값을 갖는 대상체는 상대적으로 더욱 공격적인 치료를 필요로 할 수 있다.
일부 실시형태에서, 본 발명은 종양 돌연변이 부담을 평가하여 암을 분류하는 방법을 제공하며, 여기서 비정상적인 상태는 재발 또는 진행의 증가된 가능성을 나타낸다.
추가 실시형태에서, 본 발명은 종양 돌연변이 부담을 평가함으로써 대상체에서 암의 예후를 결정하는 방법을 제공하며, 여기서 상승된 TMB는 암의 재발 또는 진행 가능성의 증가를 나타낼 수 있다.
추가 실시형태에서, 평가는 암 수술 전에, 예를 들어 생검 샘플을 사용하여 이루어질 수 있다. 다른 실시형태에서, 평가는 암 수술 후, 예를 들어 절제된 암 샘플을 사용하여 이루어질 수 있다.
특정 실시형태에서, 하나 이상의 세포의 샘플은 치료 전, 치료 동안 또는 치료 후에 암 환자로부터 수득할 수 있다.
암 치료의 예는 병에 걸린 기관의 외과적 제거, 방사선요법, 호르몬 요법(예를 들어, GnRH 길항제, GnRH 작용제, 항안드로겐제의 사용), 화학요법 및 고강도 집속 초음파를 포함한다.
암 대상체의 능동 감시는 침습적 치료없이 관찰 및 정기적인 모니터링을 포함한다. 능동 치료는 증상이 발생하거나, 또는 암 성장이 진행 중이거나 가속화되고 있다는 징후가 있다면, 감시 중에 또는 후에 시작될 수 있다.
능동 감시는 암 전이의 위험 증가를 수반할 수 있다. 감시는 1개월 이상 또는 1년 이상, 또는 더 장기간 지속할 수 있다.
본 발명은 암 환자를 치료하는 방법 또는 환자의 치료를 선택하기 위한 지침을 제공하기 위한 방법을 제공할 수 있다. 이 방법에서, TMB 및 하나 이상의 재발 관련 임상 파라미터의 평가가 결정될 수 있다. 능동 치료는 환자의 샘플이 상승된 TMB를 갖고 환자가 하나 이상의 재발 관련 임상 파라미터를 갖고 있다면, 권장, 시작 또는 계속할 수 있다. 능동 감시는 환자가 상승된 TMB도 또는 재발 관련 임상 파라미터도 갖고 있지 않다면 권장, 시작, 또는 계속될 수 있다. 특정 실시형태에서, TMB, 또는 TMB와 하나 이상의 임상 파라미터는 능동 치료가 권장됨을, 또는 특정 능동 치료가 권장됨을, 또는 공격적 치료가 권장됨을 나타낼 수 있다.
일반적으로, 보조 요법(예컨대, 전립선 절제술 또는 방사선 요법 후 화학요법, 방사선요법, HIFU, 호르몬 요법 등)이 공격적인 질병에 대해 권장될 수 있다.
체세포 돌연변이를 검출하기 위한 방법
도 1을 참조하면 본 개시내용은 핵산 시퀀싱에 의해 체세포 돌연변이를 검출하고 게놈의 종양 돌연변이 부담을 평가하기 위한 방법을 포함한다.
체세포 변이체를 검출하기 위한 방법에 있어서, 단계 S101에서 서열 리드는 대량 병렬 핵산 시퀀싱 공정을 사용하여 암 세포 및 비-암 세포를 함유하는 샘플로부터 수득될 수 있다. 서열 리드는 약 50개 내지 최대 약 5000개 뉴클레오타이드 범위의 판독 길이를 가질 수 있다. 서열 리드는 표준 게놈에 대해 매핑될 수 있다. 서열 리드는 단계 S103에서 오류 필터링될 수 있다. 뉴클레오타이드의 염기 호출(base call)은 단계 S105에서 카운트될 수 있고 위치 필터링은 단계 S107에서 수행될 수 있다. 체세포 변이체-SNP 서열 판독 염기 호출 카운트 행렬은 단계 S109에서 조립될 수 있다. 카운트 행렬은 표준 게놈의 이형접합-SNP 영역의 세트를 사용할 수 있다. 각 이형접합-SNP 위치에 대해, 카운트 행렬은 이형접합-SNP 위치의 하나의 판독 길이 내에 위치한 적어도 제1 변이체를 갖는 판독 서열만을 카운트하는 제1 및 제2 요소, 및 이형접합-SNP 위치의 하나의 판독 길이 내에 위치한 적어도 체세포 제2 변이체를 갖는 암 세포로부터의 판독 서열만을 카운트하는 제3 요소를 갖는다. 단계 S111에서, 체세포 돌연변이 유의성 점수(S)는 이형접합-SNP 위치의 하나의 판독 길이 내에 위치한 각 체세포 변이체에 대한 제3 요소에 대해 계산될 수 있다. 단계 S113에서, 종양 돌연변이 부담은 체세포 유의성 점수를 기반으로 하여 샘플에 대해 계산될 수 있다.
이형접합-SNP 영역의 세트는 환자와 관련이 없는 개체의 그룹을 기반으로 하여 적격화(qualify)될 수 있다.
특정 실시형태에서, 다형성 위치를 제거하기 위해 위치들의 철저한 필터링이 수행될 수 있다. 하나보다 많은 샘플에서 변이체를 갖는 위치는 다형성으로 간주될 수 있다. 관련 있는 개체의 존재는 변이를 중복시킬 수 있고 거짓 다형성 위치를 만들 수 있다. 따라서, 다형성을 식별하기 전에 관련 없는 개체의 세트가 사용될 수 있다.
SNP 위치 세트는 사전결정될 수 있다. 위치는 반복적이지 않고 다형성이 없고 높은 오류율이 발생하기 쉽지 않다면, 적격화될 수 있다. 이것은, 예를 들어, 사전에 분석된 약 100명 이상의 관련 없는 개체, 약 50명 이상의 관련 없는 개체, 약 20명 이상의 관련 없는 개체, 또는 약 10명 이상의 관련 없는 개체를 기반으로 한 통계로부터 추정할 수 있다.
특정 실시형태에서, TMB 계산에 사용된 적격화된 위치의 수는 1000개 이상, 5000개 이상, 100,000개 이상, 300,000개 이상, 500,000개 이상, 1,000,000개 이상, 또는 1,500,000개 또는 이상, 1,700,000개 이상, 1,900,000개 이상, 또는 2,000,000개 이상일 수 있다.
일부 실시형태에서, TMB를 계산하는데 사용된 적격화된 위치의 수는 적어도 1000개, 적어도 5000개, 또는 적어도 100,000개, 또는 적어도 300,000개, 또는 적어도 500,000개, 또는 적어도 1,000,000개, 또는 적어도 1,500,000개, 또는 적어도 1,700,000개, 또는 적어도 1,900,000개 또는 적어도 2,000,000개일 수 있다.
일부 실시형태에서, TMB를 계산하는데 사용되는 적격화된 위치의 수는 1000개 내지 3,000,000개, 또는 5000개 내지 2,500,000개, 100,000개 내지 2,500,000개, 또는 500,000개 내지 2,500,000개일 수 있다.
일부 실시형태에서, 평균 판독 깊이는 커버된 표준 게놈의 부분에 대해 적어도 50x 또는 100x일 수 있다.
샘플은 암 세포 및 비-암 세포를 함유할 수 있다. 샘플 중 암 세포 및 비-암 세포의 존재는 본 발명의 방법이 체세포 돌연변이를 검출할 수 있게 할 뿐만 아니라 생식계열 비교 샘플과 같은 비교 샘플을 사용하지 않고도 생식계열 돌연변이로부터 체세포 돌연변이를 구별할 수 있게 한다.
일반적으로, 샘플이 암에 걸린 대상체로부터 채취될 수 있고, 샘플이 암 부위에서 채취한 조직이나 세포를 함유할 수 있기 때문에 암 세포는 존재할 수 있다. 일부 실시형태에서, 샘플은 종양에서 제거된 조직 또는 세포일 수 있다. 특정 실시형태에서, 샘플은 악성 종양으로부터 제거된 조직 또는 세포일 수 있다. 추가 실시형태에서, 샘플은 비-종양 조직 또는 세포의 경계를 포함하는, 종양으로부터 제거된 조직 또는 세포일 수 있다.
본 발명의 실시형태는 비교 샘플로부터 수득한 생식계열 양을 공제하는 단계없이, 대상체로부터의 단일 샘플만을 사용하여 체세포 돌연변이를 직접 검출하고 종양 돌연변이 부담을 평가하는 방법에 사용되는 고유한 알고리즘을 포함한다.
도 2는 생식계열 대립유전자 및 생식계열 변이체의 예시를 보여준다. 도 2에서 상부는 대립유전자 B 및 A를 갖는 이형접합 SNP 부근에 위치한 대립유전자 V 및 W를 갖는 이형접합 변이체 위치에 대한 생식계열 세포의 핵산 서열을 나타낸다. 각 SNP 대립유전자는 단 하나의 변이체 대립유전자와 연관되고, 즉, BV 및 AW이다. 이러한 대립유전자 쌍을 검출하는 데 있어서, BV 및 AW라는 단 2개의 고유한 서열 검출만이 예상된다. 단편화에 의한 시퀀싱에 있어서, SNP 및 VAR 위치 둘 모두를 커버하는 판독 길이의 경우 BV 및 AW라는 단 2개의 고유 서열 리드만이 예상된다.
B와 연관된 변이체 대립유전자 V 및 W를 모두 가질 확률은 매우 작거나 0임을 도 2의 상부에서 확인할 수 있다.
도 2에서 하부는 대립유전자 B 및 A를 갖는 이형접합 SNP 부근에 위치한 대립유전자 W 및 W를 갖는 동형접합 변이체 위치에 대한 생식계열 세포의 핵산 서열을 나타낸다. 각 SNP 대립유전자는 동일한 변이체 대립유전자와 연관되며, 즉, BW 및 AW이다. 이러한 대립유전자 쌍을 검출하는데 있어서, 단 2개의 고유 서열, 즉, BW 및 AW만의 검출이 예상된다. 단편화에 의한 시퀀싱에서 SNP 및 VAR 위치를 모두 커버하는 판독 길이의 경우, 2개의 고유 서열 리드, BW 및 AW만이 예상된다.
도 3은 체세포 대립유전자 및 체세포 변이체의 예시를 나타낸다.
도 3에서 상부는 대립유전자 B 및 A를 갖는 이형접합 SNP 부근에 위치한 대립유전자 V 및 W를 갖는 이형접합 변이체 위치에 대한 샘플 세포의 핵산 서열을 나타낸다. 체세포 돌연변이 변이체가 없는 세포에서, 각 SNP 대립유전자는 단 하나의 변이체 대립유전자와만 연관될 것이다, 예컨대 BV 및 AW. 이러한 대립유전자 쌍을 검출하는데 있어서, 단 2개의 고유 서열, BV 및 AW만의 검출이 예상된다. 단편화에 의한 시퀀싱에서 SNP 및 VAR 위치를 모두 커버하는 판독 길이의 경우, 단 2개의 고유 서열 리드, BV 및 AW만이 예상된다. 따라서, 2개의 정상적으로 예상된 대립유전자 쌍 BV 및 AW에 대해 비교적 큰 판독 카운트 L1 및 L2이 있을 것이다. 체세포 돌연변이 변이체를 갖는 암 세포에서, SNP 대립유전자는 제2 변이체 대립유전자, 예를 들어 BW와 연관될 것이다. 즉, 새로운 대립유전자 쌍 BW에 대해서는 비교적 작은 판독 카운트 s가 있을 것이다. s에 대한 0이 아닌 카운트의 존재는 SNP 대립유전자 B가 2개의 상이한 변이체 대립유전자 V 및 W와 함께 발견되거나 연관이 있음을 나타낸다. 즉, V 또는 W는 신규 돌연변이, 더욱 특히 체세포 돌연변이로서 간주될 수 있다. s에 대한 0이 아닌 카운트는 BW가 체세포 돌연변이에 의해 암 세포로부터 발생한다는 것을 나타낸다.
도 3에서, 상부는 대립유전자 B 및 A를 갖는 이형접합 SNP 부근에 위치한, 대립유전자 V 및 W를 갖는 이형접합 변이체 위치에 대한 Het-Het 카운트 행렬을 나타낸다. 암 세포의 부재, 또는 체세포 돌연변이의 부재 하에, s는 0이고, 도 3의 상부는 도 2의 상부와 동등해진다.
본 발명의 실시형태는 체세포 돌연변이에 대한 대립유전자 비율(Allele Ratio)인 특징을 고려한다. 대립유전자 비율은 비-야생형 염기의 비율로서 정의될 수 있으며, 0에서 100%까지 다양할 수 있다.
일반적으로, 대립유전자 비율은 WT 참조 대립유전자에 상대적인 변이체 대립유전자의 분율을 나타내며, 0에서 100%까지 다양할 수 있다.
일반적으로, 체세포 돌연변이를 함유하는 암 세포가 존재하지 않는 경우, 0의 대립유전자 비율이 발견될 수 있다. 일반적으로, 100%의 대립유전자 비율은 체세포 돌연변이가 높은 수준으로 존재한다는 것을 나타낼 것이다.
도 3에서 하부는 대립유전자 B 및 A를 갖는 이형접합 SNP 부근에 위치한 대립유전자 W 및 W를 갖는 동형접합 변이체 위치에 대한 샘플 세포의 핵산 서열을 나타낸다. 체세포 돌연변이 변이체가 없는 세포에서, 각 SNP 대립유전자는 하나의 변이체 대립유전자와만 연관될 수 있으며, 예컨대, BW 및 AW이다. 이러한 대립유전자 쌍을 검출하는데 있어서, 단 2개의 고유 서열, BW 및 AW의 검출만이 예상된다. 단편화에 의한 시퀀싱에서 SNP 및 VAR 위치를 모두 커버하는 판독 길이의 경우, 단 2개의 고유 서열 리드, BW 및 AW만이 예상된다. 따라서, 2개의 정상적으로 예상된 대립유전자 쌍 BW 및 AW에 대해 비교적 큰 판독 카운트 L1 및 L2이 있을 것이다. 체세포 돌연변이 변이체를 갖는 암 세포에서, SNP 대립유전자는 제2 변이체 대립유전자, 예를 들어 BV와 연관될 것이다. 즉, 새로운 대립유전자 쌍 BV에 대해서는 비교적 작은 판독 카운트 s가 있을 것이다. s에 대한 0이 아닌 카운트의 존재는 SNP 대립유전자 B가 2개의 상이한 변이체 대립유전자 V 및 W와 함께 발견되거나 연관된다는 것을 나타낸다. 즉, V 또는 W는 신규 돌연변이, 더욱 특히 체세포 돌연변이로서 간주될 수 있다. s에 대한 0이 아닌 카운트는 BV가 체세포 돌연변이에 의해 암 세포로부터 발생한다는 것을 나타낸다.
도 3에서, 하부는 대립유전자 B 및 A를 갖는 이형접합 SNP 부근에 위치한, 대립유전자 W 및 W를 갖는 동형접합 변이체 위치에 대한 Hom-Het 카운트 행렬을 나타낸다. 암 세포의 부재, 또는 체세포 돌연변이의 부재 하에, s는 0이고, 도 3의 하부는 도 2의 하부와 동등해진다.
0이 아닌 s의 존재는 SNP 대립유전자 B가 2개의 상이한 변이체 대립유전자, V 및 W와 함께 발견되거나 연관된다는 것을 나타내고, 따라서 신규 돌연변이가 존재한다는 식별해준다.
일부 실시형태에서, 이형접합 SNP 부근에 위치한 변이체에 대해, 노이즈(noise) 수준 초과로 검출가능한 제3의 0이 아닌 판독 카운트는 암세포의 체세포 돌연변이로부터만 발생할 수 있다. 제3의 유의적인 판독 카운트는 비-암 세포의 존재하에, 제2의 생식계열 비교 샘플로부터 수득되는 임의의 생식계열 양의 공제 없이 수득될 수 있다. 사실, 제2의 생식계열 비교 샘플은 이러한 고유한 알고리즘에서 필요로 되지 않는다.
종양 돌연변이 부담
임의의 특정 이론에 제한하려는 것은 아니지만, 체세포 돌연변이 점수 및 종양 돌연변이 부담(TMB)을 평가하는 방법이 아래에 설명된다.
본 발명에 따른 TMB 값은 생식계열 공제를 필요로 하지 않는 본 발명의 고유한 알고리즘을 사용하여 대상체의 단일 샘플로부터 수득한 시퀀싱 데이터를 사용하여 계산할 수 있다. 시퀀싱 데이터는 마이크로전기영동 방법, 혼성화에 의한 시퀀싱, 단일 분자의 실시간 관찰 및 순환-어레이 시퀀싱을 포함하는 본 기술분야에 공지된 다양한 방법에 의해 수득될 수 있다.
TMB 값은 생식계열 공제를 필요로 하지 않는 본 발명의 고유한 알고리즘을 사용하여 대상체의 단일 샘플로부터 수득한 단편화 시퀀싱 데이터를 사용하여 계산할 수 있다. 변이체 및 SNP 위치 모두에 걸친 길이를 갖는 서열 리드만이 카운트 행렬의 조립체(assembly)에 포함될 수 있다. 일반적으로, 판독은 SNP 및 카운트되어야 하는 위치를 커버해야 한다. 비교 샘플을 사용한 생식계열 공제는 필요하지 않다. SNP 위치의 세트는 시퀀싱 데이터를 수득하는데 사용될 수 있다. SNP의 대립유전자 빈도는 변이체와 비교되어, 변이체가 생식계열인지 체세포인지를 결정할 수 있다.
약 하나의 판독 길이의 SNP 영역은 SNP 위치 부근의 변이체를 검출하는데 사용될 수 있다. 판독 길이는 SNP 위치와 변이체 위치를 모두 커버하기에 충분한 것일 수 있다. SNP 영역의 세트는 체세포 변이체를 검출하고 샘플에 대한 TMB 값을 정량하는 데 필요한 시퀀싱 데이터를 제공할 수 있다.
본 명세서에 사용된 바와 같이, 변이체는 SNP 위치의 약 하나의 시퀀싱 판독 길이 내에 변이체가 있을 때, SNP 위치 "부근"에 있을 수 있다. SNP 영역은 SNP 위치에 대해 ±1 판독 길이일 수 있다.
본 기술분야에 공지된 인간 SNP 위치 세트의 예는 SNP 어레이 6.0(Affymetrix)을 포함한다.
변이체 위치를 포함하는 SNP 영역에 대해 카운트 행렬이 계산될 수 있으며, 여기서 카운트 행렬 C(X1, X2)의 각 요소는 비-SNP 호출 X1 = (T, C, G 또는 A) 및 SNP 호출 X2 = (T, C, G 또는 A)인 매핑된 리드의 수일 수 있다.
X,Y 및 P,Q 양은 각각 도 2 및 도 3에서의 예 V,W 및 B,A에 상응한다.
이 행렬에서 2개의 가장 큰 카운트, C(X,P) ≥ C(Y,Q)는 4개의 위치 대립유전자 조건 중 하나의 결과일 수 있다:
HomHom: C(Y,Q) ≤ 3은 단 하나의 유의미한 카운트 C(X,P)만 남기고, 이는 비-SNP 및 SNP 위치 둘 모두가 동형접합임을 나타낸다;
HetHom: X ≠ Y 및 P = Q, 이것은 비-SNP 위치가 이형접합이고 SNP 위치가 동형접합임을 나타낸다;
HomHet: X = Y 및 P ≠ Q, 이것은 비-SNP 위치가 동형접합이고 SNP 위치가 이형접합임을 나타낸다;
HetHet: X ≠ Y 및 P ≠ Q, 이것은 비-SNP 및 SNP 위치가 모두 이형접합임을 나타낸다.
이형접합 SNP 위치를 갖는 HomHet 및 HetHet 조건은 체세포 돌연변이의 결과인 판독 카운트를 정상적인 생식계열 대립유전자 쌍의 결과인 것과 구별하는데 사용될 수 있다. 암에 걸린 대상체의 샘플의 경우 체세포 돌연변이는 암세포의 존재에 기인할 수 있다. 이것은 별도의 샘플에서 생식계열 비교 데이터를 별도로 수득하지 않고도 수행될 수 있다.
전술한 카운트 행렬의 경우, 행렬 내의 세 번째 최대 카운트 C(Z,P) 또는 C(Z,Q)의 존재는 암 세포의 체세포 돌연변이에 기인할 수 있다.
세 번째 최대 카운트는 이 카운트가 배경 시퀀싱 오류율보다 훨씬 높은 경우 체세포 돌연변이를 검출하는 데 사용될 수 있다. 평균 오류율 E는 가장 높은 3개의 카운트를 제외한 다른 모든 카운트로부터 계산될 수 있다. 특정 실시형태에서, 평균 오류율 E는 가장 높은 3개의 카운트를 제외한 행렬의 모든 다른 카운트의 평균으로부터 계산될 수 있다.
자유도가 1인 카이 제곱 확률인 체세포 돌연변이에 대한 Phred-유사 유의성 점수(Phred-like significance score)는 다음 식 I로 계산할 수 있다:
S = (C(Z,P)2/(C(Z,P)+C(X,P)) + (C(Z,P)-E)2/E)/2 * 10 (식 I)
식 중, C(Z,P)는 제3 요소의 카운트이고, C(X,P)는 제1 요소의 카운트이며, E는 모든 SNP 영역에 대해 가장 높은 3개의 카운트를 제외하고 행렬에 있는 다른 모든 카운트의 평균으로부터 계산된 오류율이다.
오류율 E의 값은 모든 위치 전체에 대한 평균으로서 계산될 수 있으며, 일반적으로 약 1 이하이다.
TMB 수준은 하기 식 II에 제시된 바와 같이 Mbase인, 이형접합 SNP 영역 내의 총 위치 수, {N(HomHet) + N(HetHet)}에 의해 정규화된, S > 30을 갖는 위치의 수로서 취해질 수 있다:
TMB = N(S > 30)/(N(HomHet) + N(HetHet)) * 1000000 (식 II)
임의의 특정 이론에 제한하려는 것은 아니지만, 상기 설명에 기초하여 종양 돌연변이 부담(TMB) 값을 결정하기 위한 방법은 이하에 설명된다.
TMB 값은 생식계열 공제를 필요로 함이 없는 본 발명의 고유한 알고리즘을 사용하여 대상체의 단일 샘플로부터 수득되는 단편화 시퀀싱 데이터를 사용하여 계산할 수 있다. 비교 샘플을 사용한 생식계열 공제는 불필요하다. SNP 위치의 세트가 사용될 수 있다.
SNP 영역의 세트로부터의 시퀀싱 데이터는 변이체 위치의 수(y축)를 대립유전자 비율(x축)에 대하여 나타내도록 플로팅될 수 있다. 곡선 아래의 면적은 체세포 변이체 존재의 추정값일 수 있다. 이러한 시퀀싱 데이터 배열을 사용하여 곡선 아래 영역을 통합함으로써, 체세포 변이체로서 식별되는 변이체의 총 수에 대한 값이 수득될 수 있다. 체세포 변이체로서 식별되는 변이체의 총 수에 대한 값은 TMB의 척도일 수 있다. 따라서, TMB의 측정값은 약 15%의 대립유전자 비율 내지 최대 약 85%의 대립유전자 비율까지 또는 최대 약 65%의 대립유전자 비율까지의 곡선 아래 면적으로서 수득할 수 있고, 여기서 곡선은 SNP 영역의 세트에 있는 변이체 위치의 수(y축)를 변이체의 대립유전자 비율(x축)에 대하여 플로팅한 것이다.
일부 실시형태에서, TMB의 척도는 약 15%의 대립유전자 비율로부터 약 50%의 대립유전자 비율까지, 또는 약 15%의 대립유전자 비율로부터 약 55%의 대립유전자 비율까지, 또는 약 15%의 대립유전자 비율로부터 약 60%까지의 대립유전자 비율까지, 또는 약 15%의 대립유전자 비율로부터 약 65%의 대립유전자 비율까지, 또는 약 15%의 대립유전자 비율로부터 약 75%의 대립유전자 비율까지, 또는 약 15%의 대립유전자 비율로부터 약 85%의 대립유전자 비율까지의 변이체 카운트(y축) 대립유전자 비율(x축) 곡선 아래의 면적으로서 수득될 수 있다.
일반적으로, 야생형이 아닌 염기를 가진 위치에서 체세포 돌연변이 발생은 드물 수 있고, 이에 따라 높은 대립유전자 비율 값에 대한 오류는 신뢰가 떨어질 수 있다. 따라서, 오류를 줄이기 위해, 변이체 카운트(y축) 대립유전자 비율(x축) 곡선 아래의 면적은 바람직하게는 약 15%의 대립유전자 비율부터 약 65%의 대립유전자 비율까지에서 취할 수 있다.
일부 실시형태에서, 평균 오류율 E의 척도는 약 10 내지 15%의 대립유전자 비율에서 변이체 카운트(y축) 대립유전자 비율(x축) 곡선의 값으로서 수득될 수 있다.
시스템
본 발명의 시스템에서, 샘플 분석의 결과는 의사, 간병인, 유전자 상담사, 환자 및 다른 사람에게 전달 또는 전송될 수 있는 전송가능한 형태로 상기 임의의 당사자에게 전달될 수 있다. 이러한 형식은 다양할 수 있으며 유형 또는 무형일 수 있다. 결과는 설명적 진술, 다이어그램, 사진, 차트, 이미지 또는 임의의 다른 표시가능한 형식으로 구현될 수 있다. 진술 및 시각적 형식은 종이, 플로피 디스크, 컴팩트 디스크 등과 같은 컴퓨터 판독가능 매체와 같은 유형의 매체 또는 무형 매체, 예컨대, 이메일 형식의 전자 매체 또는 인터넷 또는 인트라넷 상의 웹 사이트에 기록될 수 있다. 또한, 결과는 음성 형식으로 기록될 수 있으며 전화, 팩스, 무선 이동 전화, 인터넷 전화 등을 통해 아날로그 또는 디지털 케이블 라인, 광섬유 케이블 등과 같은 임의의 적절한 매체를 통해 전송될 수도 있다.
본 발명의 시스템에서, 시험 결과의 정보 및 데이터는 어디에서나 생성될 수 있고 다른 위치로 전송될 수 있다. 본 발명은 적어도 하나의 환자 샘플에 대한 시험 정보의 전송가능한 형태를 생성하는 방법을 추가로 포함한다.
컴퓨터 기반 분석 기능은 임의의 적절한 언어 및/또는 브라우저에서 구현될 수 있다. 예를 들어, C 언어로 구현될 수 있으며, 바람직하게는 Visual Basic, SmallTalk, C++ 등과 같은 객체 지향 고급 프로그래밍 언어를 사용하여 구현할 수 있다. 이 응용 프로그램은 WindowsTM 98, WindowsTM 2000, WindowsTM NT 등을 포함한 Microsoft WindowsTM 환경과 같은 환경에 맞게 작성할 수 있다. 또한, 응용 프로그램은 MacIntoshTM, SUNTM, UNIX 또는 LINUX 환경용으로 작성될 수도 있다. 또한, 기능적 단계는 범용 또는 플랫폼 독립적 프로그래밍 언어를 사용하여 구현할 수도 있다. 이러한 다중 플랫폼 프로그래밍 언어의 예로는 HTML(Hypertext Markup Language), JAVATM, JavaScriptTM, Flash 프로그래밍 언어, 공통 게이트웨이 인터페이스/구조화 질의어(CGI/SQL), 펄(practical extraction report language, PERL), AppleScriptTM 및 다른 시스템 스크립트 언어, 프로그래밍 언어/구조화 질의어(PL/SQL) 등을 포함하지만, 이에 제한되지는 않는다. HotJavaTM, MicrosoftTM ExplorerTM 또는 NetscapeTM과 같은 JavaTM 또는 JavaScriptTM 지원 브라우저를 사용할 수 있다. 액티브 콘텐츠 웹 페이지가 사용되는 경우, JavaTM 애플릿, ActiveXTM 컨트롤 또는 기타 액티브 콘텐츠 기술을 포함할 수 있다.
분석 기능은 또한 컴퓨터 프로그램 제품에서 구현될 수 있으며, 전술한 시스템이나 다른 컴퓨터 또는 인터넷 기반 시스템에서 사용될 수 있다. 따라서, 본 발명의 다른 양상은 프로세서가 체세포 돌연변이 점수 및/또는 TMB 분석을 수행할 수 있도록 구현된 컴퓨터 판독가능한 프로그램 코드 또는 명령을 갖는 컴퓨터 사용가능 매체를 포함하는 컴퓨터 프로그램 제품에 관한 것이다. 이러한 컴퓨터 프로그램 명령은 컴퓨터 또는 다른 프로그램가능한 장치에 로딩되어, 컴퓨터 또는 다른 프로그램가능한 장치에서 실행되는 명령이 전술한 기능 또는 단계를 구현하기 위한 수단을 만들도록 할 수 있다. 이러한 컴퓨터 프로그램 명령은 또한 컴퓨터 또는 다른 프로그램가능 장치가 특정 방식으로 기능하도록 지시할 수 있는 컴퓨터 판독가능 메모리 또는 매체에 저장될 수 있어, 컴퓨터 판독가능 메모리 또는 매체에 저장된 명령은 분석을 구현하는 명령 수단을 포함하는 제조 물품을 생성한다. 컴퓨터 프로그램 명령은 또한 컴퓨터 또는 다른 프로그램가능한 장치에 로딩되어 일련의 작동 단계가 컴퓨터 또는 다른 프로그램가능한 장치에서 실행되도록 하여, 컴퓨터 또는 다른 프로그램가능 장치에서 실행되는 명령이 전술한 기능 또는 단계를 구현하기 위한 단계를 제공하도록 컴퓨터 구현 공정을 생성할 수 있다.
본 발명의 구현예는 프로세서로 하여금 TMB를 결정하고 계산하는 방법의 단계를 수행하게 하는 프로세서에 의한 실행에 대한 명령이 내부에 저장된 비-일시적 기계-판독가능 저장 매체를 제공할 수 있다.
비-휘발성, 비-일시적 기계-판독가능 저장 매체의 예로는 다양한 종류의 ROM(Read Only Memory), 하드 드라이브, 솔리드 스테이트 메모리 장치, 플래시 드라이브, CD-ROM(Compact Disc Read Only Memory), DVD, 광 디스크, 자기 디스크 또는 컴퓨터 실행 명령 또는 데이터 구조를 갖는 프로그램 코드를 운반하거나 저장하는 데 사용될 수 있는 임의의 다른 저장 매체를 포함한다. 매체는 프로세서와 같은 범용 또는 특수 목적 컴퓨터에 의해 액세스될 수 있다.
본 발명의 구현예는 하나 이상의 프로세서, 하나 이상의 메모리 장치, 파일 시스템, 통신 모듈, 운영 체제 및/또는 사용자 인터페이스를 가질 수 있는 컴퓨팅 시스템을 제공할 수 있으며, 이들 각각은 통신 가능하게 연결될 수 있다.
컴퓨팅 시스템은 다양한 하드웨어 및 소프트웨어 자원을 활용하도록 배열될 수 있는 운영 체제를 가질 수 있다. 시스템의 다른 구성요소에 대한 명령을 수신하고 실행하도록 운영 체제가 배열될 수 있다.
컴퓨팅 시스템의 예에는 랩톱 컴퓨터, 데스크톱 컴퓨터, 서버 컴퓨터, 휴대폰 또는 스마트폰, 태블릿 및 기타 휴대용 컴퓨팅 시스템이 포함된다.
컴퓨팅 시스템의 예는 프로세서, 특수 목적 또는 범용 컴퓨터를 포함한다.
프로세서는 기계 판독가능 저장 매체에 저장된 명령을 실행하도록 배열될 수 있다. 프로세서는 하나 이상의 마이크로프로세서, 다양한 컨트롤러, 디지털 신호 프로세서 또는 응용 프로그램 특정 집적 회로를 포함할 수 있으며, 데이터를 수신 및/또는 전송할 수 있을 뿐만 아니라 저장된 명령을 실행하여 데이터를 변환할 수 있다. 일부 구현예에서, 프로세서는 프로그램 코드 또는 다양한 매체로부터 명령을 수신, 해석 및 실행할 수 있다. 프로세서는 데이터를 수신 및 변환할 수 있을 뿐만 아니라 메모리 또는 파일에 데이터를 저장할 수 있다. 특정 구현예에서, 프로세서는 메모리 또는 파일로부터 명령을 인출하고 메모리로 명령을 수신할 수 있다.
기계 판독가능 저장 매체는 비휘발성일 수 있다. 메모리 또는 매체는 명령 또는 데이터 파일을 파일 시스템에 저장할 수 있으며 기계 판독가능 저장 매체를 포함할 수 있다. 기계 판독가능 저장 매체는 비일시적일 수 있다. 기계 판독가능 저장 매체는 프로세서에 의해 실행될 수 있는 명령이 저장되어 있을 수 있다.
통신 장치는 데이터를 전송 및/또는 수신할 수 있는 임의의 장치, 시스템 또는 구성요소의 조합일 수 있다. 데이터는 네트워크 또는 통신 라인을 통해 전송 및/또는 수신될 수 있다. 통신 장치는 다른 구성요소와 통신 가능하게 연결될 수 있다.
통신 장치의 예로는 네트워크 카드, 모뎀, 안테나, 적외선 또는 가시 통신 구성요소, Bluetooth 구성요소, 통신 칩셋, 광역 네트워크, WiFi 구성요소, 802.6 또는 그 이상의 장치 및 셀룰러 통신 장치를 포함한다. 통신 장치는 회선, 유선 또는 네트워크를 통해 다른 구성요소, 장치 또는 시스템과 데이터를 교환할 수 있다.
본 개시내용의 시스템은 하나 이상의 프로세서, 하나 이상의 비일시적 기계 판독가능 저장 매체, 하나 이상의 파일 시스템, 하나 이상의 메모리 장치, 운영 체제, 하나 이상의 통신 모듈, 및 하나 이상의 사용자 인터페이스를 포함할 수 있고, 각각은 통신 가능하게 연결될 수 있다.
일부 컴퓨터 생물학 방법은, 예를 들어, 문헌[Setubal et al., Introduction To Computational Biology Methods(1997); Salzberg et al., Computational Methods In Molecular Biology(1998); Rashidi & Buehler, Bioinformatics Basics: Application In Biological Science and Medicine(2000); Ouelette & Bzevanis, Bioinformatics: A Practical Guide For Analysis Of Gene and Proteins(2001)]에 기술되어 있다.
항암제
면역 관문 저해제 약물은 T 세포를 방출하여 대상체의 암 세포를 사멸시킬 수 있다. 이 약물은 암세포가 면역 체계를 회피하게 할 수 있는 단백질을 차단하고 생존율을 개선시킬 수 있다.
면역 관문 저해제는 면역 세포 및/또는 면역 반응이 꺼지거나, 사멸시키고자 하는 바로 암세포에 의해 하향 조절 또는 저해되는 것을 방지 또는 저해할 수 있는 치료제이다.
일반적으로, 면역 관문 저해제 약물은 암에 걸린 대상체의 13% 미만에 효과적이다. 따라서, 이러한 약물 치료로 혜택을 받는 대상체를 선택하고 식별할 수 있는 것이 유용하다.
면역 관문 저해제의 예는 PD1 저해제, 이필리무맙(예를 들어, 문헌[Gulley & Dahut, Nat. Clin. Practice Oncol.(2007)4: 136-137] 참조), 트레멜리무맙(예를 들어, 문헌[Ribas et al., Oncologist(2007) 12:873-883] 참조), 및 표 1에 나열된 약제를 포함한다.
Figure pct00001
추가 정의
다음 용어 또는 정의는 오로지 본 개시내용의 이해를 돕기 위해서 제공된다.
본 명세서에서 구체적으로 정의되지 않는 한, 본 명세서에 사용된 모든 용어는 본 개시내용의 기술분야의 기술자에게 동일한 의미를 갖는다.
일부 방법은 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Press, Plainview, N.Y. (1989); 및 Ausubel et al., Current Protocols in Molecular Biology (Supplement 47), John Wiley & Sons, New York (1999)]에 제공된다.
본 명세서에서 달리 명시적으로 정의되지 않는 한, 본 명세서에 사용되는 용어는 본 기술분야의 기술자가 이해하는 범위보다 작은 범위를 갖는 것으로 해석되지 않아야 한다.
본 명세서에 사용된 "단일 뉴클레오타이드 다형성"(SNP) 또는 "SNP 유전자좌"는 단일 염기가 상이한 대립유전자를 갖는 유전자좌이며, 더 희귀한 대립유전자는 집단에서 적어도 1%의 빈도를 갖는 것이다.
본 명세서에 사용된 바와 같이, 유전자좌에서 "대립유전자"는 집단의 해당 유전자좌에서 발생하는 모든 유전자 변이체의 세트이며, 각 변이체는 단일 "대립유전자"이다. 예를 들어, SNP 유전자좌에는 일반적으로 2개의 대립유전자만이 있다.
본 명세서에 사용된 "변이체"는 시험 유전자 서열과 참조 유전자 서열 간의 차이이다. 변이체는 단일 염기가 상이할 수 있거나, 또는 변이체는 하나보다 많은 염기가 상이할 수 있다. 변형체는 또한 삽입 및 결실도 포함한다.
본 명세서에 사용된 바와 같이, 제1 및 제2 변이체가 동일한 염색체(모계 또는 부계) DNA 가닥에 둘 모두가 위치하는 경우, 제1 변이체는 제2 변이체에 "연결된(linked)" 것이다. "연결(linkage)"은 2 이상의 변이체가 연결되어 있는 상태를 지칭한다.
"위치 대립유전자 모델"은 시험 유전자좌의 대립유전자와 SNP 유전자좌의 대립유전자 간의 연결을 나타내는 모델이다. 생식계열에서, 위치 대립유전자 모델은 전형적으로 시험 유전자좌의 부계(paternal) 대립유전자와 SNP 유전자좌의 부계 대립유전자 간의 연결뿐만 아니라, 시험 유전자좌의 모계 대립유전자와 SNP 유전자좌의 모계 대립유전자 간의 연결을 설명할 것이다. 체세포 변이체가 시험 유전자좌에 존재하는 경우(즉, 시험 유전자좌에 있는 제3의 가능한 대립유전자), 위치 대립유전자 모델은 시험 유전자좌에 있는 이 제3의 대립유전자와 SNP 유전자좌에 있는 모계 또는 부계 대립유전자 중 어느 하나 간의 연결을 추가로 설명할 것이다.
본 명세서에서 사용된 "돌연변이"는 이하에 상세히 설명되지만, 일반적으로 대상체의 생식계열과 비교하여 체세포 조직에서 획득된 뉴클레오타이드 변화를 지칭한다. "돌연변이 부하량(mutation load)"은 이하에 상세히 설명되지만, 일반적으로 "높은 돌연변이 부하량" 또는 "HML(high mutation load)"이 일반적으로 일부 기준 또는 역치를 초과하는 수 또는 비율 또는 그로부터 유래되는 점수를 지칭하는 돌연변이를 수용하는 분석된 유전자좌의 수 또는 비율을 지칭한다.
본 명세서에 사용된 "차세대 시퀀싱" 또는 "NGS(next generation sequencing)"는 시퀀싱 공정을 병렬화하여 한 번에 수천 또는 수백만 개의 서열을 생성하는 다양한 고 처리량 시퀀싱 공정 및 기술을 지칭한다. NGS는 일반적으로 다음과 같은 단계로 수행된다: 첫째, 시험관내 PCR에 의한 클론 증폭에 의해 DNA 시퀀싱 라이브러리를 생성한다. 둘째, DNA 서열이 Sanger 시퀀싱의 전형적인 사슬 종결 화학을 통하기 보다는 상보성 가닥에 뉴클레오타이드를 첨가하여 DNA 서열이 결정되도록, 합성에 의해 DNA를 시퀀싱한다; 셋째, 전형적으로 물리적 분리 단계에 대한 요구없이 대량 병렬 공정에서 공간적으로 분리되고 증폭된 DNA 주형을 동시에 시퀀싱한다. 시퀀싱 반응의 NGS 병렬화(parallelization)는 단일 기기 실행에서 수백 메가염기 내지 기가염기의 뉴클레오타이드 서열 리드를 생성할 수 있다. 전형적으로, 분자 집합체 수집물의 평균 유전자형을 보고하는 Sanger 시퀀싱과 같은 종래의 시퀀싱 기술과 달리, NGS 기술은 전형적으로 수많은 개별 DNA 단편의 서열(이하에서 자세히 논의되는 서열 리드)을 디지털 방식으로 표로 만들어, 낮은 빈도의 변이체(예를 들어, 핵산 분자의 이종 집단에서 약 10%, 5% 또는 1% 미만의 빈도로 존재하는 변이체)를 검출할 수 있다. 용어 "대량 병렬"은 또한 NGS에 의한 많은 상이한 주형 분자로부터 서열 정보의 동시 생성을 지칭하는 데에도 사용될 수 있다.
NGS 전략은 다음을 포함하지만 이에 제한되지 않는 여러 방법론을 포함할 수 있다: (i) 마이크로전기영동 방법; (ii) 혼성화에 의한 시퀀싱; (iii) 단일 분자의 실시간 관찰 및 (iv) 순환-어레이 배열 시퀀싱. 순환-어레이 시퀀싱(cyclic-array sequencing)은 주형 확장의 반복 순환 및 이미징 기반 데이터 수집에 의해 고밀도 어레이의 DNA 서열이 수득되는 기술을 지칭한다. 상업적으로 이용 가능한 순환-어레이 시퀀싱 기술은, 예를 들어, 454 Genome Sequencer(Roche Applied Science; 바젤 소재)에서 사용되는 454 시퀀싱, 예를 들어 Illumina Genome Analyzer, Illumina HiSeq, MiSeq, 및 NextSeq(캘리포니아주 샌디에고)에 사용되는 Solexa 기술, SOLiD 플랫폼(Applied Biosystems; 캘리포니아주 포스터 시티), Polonator (Dover/Harvard) 및 HeliScope Single Molecule Sequencer 기술(Helicos; 매사추세츠주 캠브리지)를 포함하나, 이에 제한되지는 않는다. 다른 NGS 방법은 단일 분자 실시간 시퀀싱(예컨대, Pacific Bio) 및 이온 반도체 시퀀싱(예컨대, Ion Torrent 시퀀싱)을 포함한다. 예를 들어, NGS 시퀀싱 기술에 대한 더 자세한 설명은 문헌[Shendure & Ji, Next Generation DNA Sequencing, NAT. BIOTECH.(2008) 26:1135-1145]을 참조한다.
본 명세서에 사용된 "환자" 또는 "개체" 또는 "대상체"는 인간을 지칭한다. 환자, 개인 또는 대상체는 남성 또는 여성일 수 있다. 환자, 개체 또는 대상체는 질병에 대한 치료적 개입을 이미 받았거나 받고 있는 사람일 수 있다. 환자, 개체 또는 대상체는 이전에 질병 진단을 받은 적이 없는 사람일 수도 있다.
본 명세서에 사용된 "샘플" 또는 "생물학적 샘플"은 생검 또는 조직 샘플, 냉동 샘플, 혈액 및 혈액 분획 또는 생성물(예컨대, 혈청, 혈소판, 적혈구 등), 종양 샘플, 객담, 기관지 폐포 세척, 배양된 세포, 예컨대, 일차 배양물, 외식편 및 형질전환된 세포, 대변, 소변 등과 같은 샘플을 지칭한다.
"생검"은 진단 또는 예후 평가를 위해 조직 샘플을 제거하는 과정 및 조직 표본 자체를 지칭한다. 다양한 생검 기술이 본 개시내용의 방법에 적용될 수 있다. 적용되는 생검 기술은 다른 요인들 중에서 평가할 조직 유형(예컨대, 폐 등), 종양의 크기 및 유형에 따라 달라질 것이다. 대표적인 생검 기술은 절제 생검, 절개 생검, 바늘 생검, 외과 생검 및 골수 생검을 포함하지만, 이에 제한되지는 않는다. "절제 생검"은 주변의 정상 조직의 작은 경계가 있는 전체 종양 덩어리의 제거를 지칭한다. "절개 생검"은 종양의 단면 직경을 포함하는 조직 웨지(wedge)의 제거를 지칭한다. 내시경 또는 형광투시에 의한 진단은 일반적으로 표적 조직 내에서 세포 현탁액을 수득하는 "코어-바늘 생검" 또는 "세침 흡인 생검"을 필요로 할 수 있다.
"체액"은, 예를 들어, 혈액, 혈장, 소변, 림프, 위액, 담즙, 혈청, 타액, 땀, 척수액 및 뇌액을 포함할 수 있는, 가공처리된(예컨대, 혈청) 또는 가공처리되지 않은, 포유동물 신체로부터 수득한 모든 유체를 포함한다. 생물학적 샘플은 전형적으로 대상체로부터 수득된다.
본 명세서에 사용된, "암 세포 샘플" 또는 "종양 샘플"은 적어도 하나의 암 세포 또는 그로부터 유래된 생체분자를 포함하는 표본을 의미한다. 암의 예는 폐암[예컨대, 비소세포 폐암(NSCLC)], 난소암, 결장직장암, 유방암, 자궁내막암 및 전립선암을 포함한다. 이러한 생체분자의 비제한적인 예는 핵산 및 단백질을 포함한다. 암세포 샘플에서 "유래된" 생체분자는 샘플 내에 위치하거나 샘플에서 추출된 분자뿐만 아니라 이러한 생체분자의 인공적으로 합성된 카피(copy) 또는 버전(version)을 포함한다. 이러한 인공적으로 합성된 분자의 하나의 예시적이고 비제한적인 예는 샘플의 핵산이 PCR 주형으로서 역할을 하는 PCR 증폭 생성물을 포함한다. 암세포 샘플의 "핵산"은 암세포에 위치한 핵산 또는 암세포에서 유래한 생체분자를 포함한다.
본 명세서에 사용된, "점수(score)"는 대상체의 상태의 변수 또는 특성의 정량적 척도 또는 샘플 중 돌연변이 부하량 정도를 제공하고/하거나 돌연변이 부하량을 구별, 구분 또는 다른 방식으로 특성화하기 위해 선택된 값 또는 값의 세트를 의미한다. 점수를 포함하는 값(들)은, 예를 들어, 대상체로부터 수득한 하나 이상의 샘플 구성요소(constituent)의 측정량을 초래하는 정량적인 데이터를 기반으로 할 수 있다. 특정 실시형태에서, 점수는 단일 구성요소, 파라미터 또는 평가로부터 유래될 수 있는 반면, 다른 실시형태에서 점수는 다중 구성요소, 파라미터 및/또는 평가로부터 유래된다. 점수는 해석 기능, 예를 들어, 임의의 다양한 통계 알고리즘을 사용하여 특정 예측 모델에서 유래된 해석 기능을 기반으로 하거나 그로부터 유래될 수 있다. "점수의 변화"는 점수의 절대적인 변화, 예를 들어, 한 시점에서 다음 시점까지, 또는 점수의 백분율 변화, 또는 단위 시간당 점수의 변화(즉, 점수 변화의 속도)를 지칭할 수 있다.
본 명세서에 사용된 "시험 유전자좌"는 서열 또는 유전자형이 본 개시내용에 따라 평가되는 게놈 유전자좌(예를 들어, 염색체 내의 특정 위치에 있는 단일 뉴클레오타이드)이며, 여기서 이러한 유전자좌에서의 돌연변이(예컨대, 참조 유전자형 또는 서열과 비교하여)는 돌연변이 부하량 측정에서 잠재적으로 계수된다.
본 명세서에 사용된 용어 "치료" 또는 "치료법" 또는 "치료 요법"은 대상체의 모든 임상적 관리 및 대상체의 상태를 지속, 개선, 향상, 또는 달리 변경시키기 위해 의도된, 생물학적, 화학적, 물리적, 또는 이의 조합 여부에 상관 없는 중재를 포함한다. 이러한 용어는 본 명세서에서 동의어로 사용될 수 있다. 치료는 예방제 또는 치료 화합물(소분자 및 생물학적 약물 포함)의 투여, 운동 요법, 물리 치료, 식이 변경 및/또는 보충, 비만 수술 중재, 치료 화합물(처방 또는 일반의약품)의 투여 및 HML을 특징으로 하는 질병의 예방, 발병 지연 또는 개선에 효과적인 기타 치료를 포함하나, 이에 제한되지는 않는다. "치료에 대한 반응"은 생물학적, 화학적, 물리적 또는 전술한 것의 조합 여부에 관계없이 전술한 임의의 치료에 대한 대상체의 반응을 포함한다. "치료 과정"은 특정 치료 또는 치료 요법의 투여량, 기간, 정도 등에 관한 것이다. 본 명세서에 사용된 초기 치료 요법은 치료의 제일선이다.
본 개시내용의 추가의 양상
본 개시내용의 양상은 다음을 포함한다:
샘플의 시험 유전자좌에서 체세포 변이체의 존재를 검출하는 방법으로서, 샘플로부터의 핵산의 제1 인접 가닥에서 단일 뉴클레오타이드 다형성("SNP") 유전자좌의 제1 대립유전자, 및 시험 유전자좌의 제2 대립유전자를 검출하는 단계; 샘플로부터의 핵산의 제2 인접 가닥에서 SNP 유전자좌의 제3 대립유전자 및 시험 유전자좌의 제4 대립유전자를 검출하는 단계; 및 샘플로부터의 핵산의 제3 인접 가닥에서, SNP 유전자좌의 제3 대립유전자 및 시험 유전자좌의 제5 대립유전자를 검출하는 단계를 포함하고, 여기서 제1 대립유전자 및 제3 대립유전자는 상이한 대립유전자이고, 제4 대립유전자 및 제5 대립유전자는 상이한 대립유전자인, 방법.
일부 실시형태에서, 제2 대립유전자 및 제4 대립유전자는 동일하거나 상이한 대립유전자이다. 핵산은 데옥시리보핵산(DNA)일 수 있다. 하나 이상의 대립유전자는 시퀀싱에 의해 검출될 수 있다. 하나 이상의 대립유전자는 혼성화에 의해 검출될 수 있다. 하나 이상의 대립유전자는 중합효소 연쇄 반응(PCR) 증폭에 의해 검출될 수 있다. 샘플은 시험 유전자좌에 체세포 변이체가 있는 세포 및 시험 유전자좌에 체세포 변이체가 없는 세포를 포함할 수 있다. 샘플은 조직 샘플일 수 있다. 샘플은 종양 샘플일 수 있다.
샘플에서 체세포 변이체를 검출하는 방법으로서, 개체가 이형접합성인 SNP 유전자좌를 검출하는 단계; SNP 유전자좌를 둘러싸는 인접 영역 내의 시험 위치에서 SNP 유전자좌의 제1 SNP 대립유전자에 연결된 제1 시험 대립유전자를 검출하는 단계; 및 SNP 유전자좌를 둘러싸는 인접 영역 내의 시험 위치에서 SNP 유전자좌의 제1 SNP 대립유전자에 연결된 제2 시험 대립유전자를 검출하는 단계를 포함하고, 여기서 제1 시험 대립유전자 및 제2 시험 대립유전자는 상이한 대립유전자인, 방법. 일부 실시형태에서, SNP 유전자좌를 둘러싸는 인접 영역 내의 시험 위치에서 SNP 유전자좌의 제2 SNP 대립유전자에 연결된 제3 시험 대립유전자를 식별하는 단계를 추가로 포함하며, 여기서 제1 SNP 대립유전자 및 제2 SNP 대립유전자는 상이한 대립유전자인, 방법. 제1 시험 대립유전자 및 제3 시험 대립유전자는 동일한 대립유전자일 수 있다. 제1 시험 대립유전자 및 제3 시험 대립유전자는 상이한 대립유전자일 수 있다. 하나 이상의 대립유전자는 시퀀싱, 혼성화 또는 중합효소 연쇄 반응 증폭에 의해 검출될 수 있다. 샘플은 시험 유전자좌에 체세포 변이체가 있는 세포 및 시험 유전자좌에 체세포 변이체가 없는 세포를 포함할 수 있다. 샘플은 조직 샘플일 수 있다. 샘플은 종양 샘플일 수 있다.
샘플에서 체세포 변이체의 빈도를 측정하는 방법으로서, 샘플이 이형접합성인 복수의 SNP 유전자좌를 검출하는 단계; 파트 a에서 식별된 각 SNP 유전자좌를 둘러싸는 인접 영역 내에서, 복수의 시험 유전자좌 각각에 대해 각 SNP 대립유전자에 연결된 다수의 시험 대립유전자를 검출하기 위해 복수의 시험 유전자좌를 검정하는 단계; 및 SNP 대립유전자에 연결된 시험 대립유전자의 검출된 수가 1보다 큰 시험 유전자좌의 수를 포함하고 검정된 시험 유전자좌의 총 수에 대해 정규화된 변이체 빈도를 결정하는 단계를 포함하는, 방법. 하나 이상의 대립유전자는 시퀀싱, 혼성화 또는 중합효소 연쇄 반응 증폭에 의해 검출될 수 있다. 샘플은 시험 유전자좌에 체세포 변이체가 있는 세포, 및 시험 유전자좌에 체세포 변이체가 없는 세포를 포함할 수 있다. 샘플은 조직 샘플 또는 종양 샘플일 수 있다.
SNP의 사전결정된 세트 각각을 둘러싸는 영역에서 각 위치에 대한 위치 대립유전자 모델 수를 측정하기 위한 복수의 센서를 포함하는 체세포 돌연변이 검출용 시스템.
면역 관문 저해제로 개체를 치료하는 방법으로서, 개체가 이형접합성인 복수의 SNP 유전자좌를 검출하는 단계; 파트 a에서 식별된 각 SNP 유전자좌를 둘러싸는 인접 영역 내에서, 복수의 시험 유전자좌 각각에 대해 각 SNP 대립유전자에 연결된 다수의 시험 대립유전자를 검출하기 위해 복수의 시험 유전자좌를 검정하는 단계; SNP 대립유전자에 연결된 시험 대립유전자의 검출된 수가 1보다 큰 시험 유전자좌의 수를 포함하고, 검정된 시험 유전자좌의 총 수에 대해 정규화된 변이체 빈도를 결정하는 단계; 및 변이체 빈도가 사전결정된 역치를 초과하는 경우 치료적 유효량의 면역 관문 저해제를 개체에게 투여하는 단계를 포함하는, 방법. 하나 이상의 대립유전자는 시퀀싱, 혼성화 또는 중합효소 연쇄 반응 증폭에 의해 검출될 수 있다. 샘플은 시험 유전자좌에 체세포 변이체가 있는 세포, 및 시험 유전자좌에 체세포 변이체가 없는 세포를 포함할 수 있다. 샘플은 조직 샘플 또는 종양 샘플일 수 있다.
본 명세서에서 구체적으로 언급된 모든 간행물, 특허 및 문헌은 모든 목적을 위해 그 전체가 본 명세서에 참고로 포함된다.
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야에서 통상의 기술을 가진 자가 일반적으로 이해하고 있는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 또한, 본 명세서의 물질, 방법 및 예는 예시일 뿐이며 제한하려는 의도가 아니다.
전술한 개시내용이 이해의 명료함을 위해 예시 및 실시예를 통해 약간 상세하게 설명되었지만, 본 기술분야의 기술자는 다양한 변경 및 수정이 본 발명 및 첨부된 청구항의 범위 내에서 실시될 수 있음을 이해할 것이다.
실시예
실시예 1: 도 4는 핵산 시퀀싱에 의한 종양 돌연변이 부담을 검출하고 평가하는 방법의 결과를 나타낸다. 이형접합 SNP(Hom/Het) 부근에 위치한 동형접합 체세포 변이체를 포함하는 모델을 위해, 제시된 바와 같은 표준 게놈(WT)에 서열 판독 스택을 매핑하였다. 대립유전자 쌍 GA(55), AA(32) 및 AG(23)의 검출을 보여주는 카운트 행렬이 조립되었다. 제3의 최대 카운트 AG(23)의 출현은 암세포의 체세포 돌연변이로부터 발생했다.
대립유전자 비율은 VAR 위치에서 상이한 대립유전자의 비율로서 계산되었다. 이 Hom-Het 예에서, 대립유전자 비율 = (23+1)/(32+55+23+1) * 100 = 21.6%이다.
SNP는 대립유전자 비율(32+23)/{(32+23)+(55+1)} x 100 = 49.5%(A/G 55:56)로 이형접합성이었다.
도 4에 도시된 바와 같이 오류율 E는 약 1.0이었다. 따라서, S의 값은 약 S=((23x23/(23+55)) + (23-E)(23-E)/E)/2 x 10 = 2679였다. E 값은 모든 위치에 대한 평균으로서 계산했으며, 전형적으로 약 1.0 이하였다.
이 실시예 위치에 대해, 샘플은 도 6에서 306926으로, 높은 TMB를 가졌다.
실시예 2: 도 5는 핵산 시퀀싱에 의해 종양 돌연변이 부담을 검출하고 평가하는 방법의 결과를 나타낸다.
이 특정 실시예에서, 판독 길이는 100bp였고 총 SNP 윈도우는 100*2-1 = 199bp였다. 이 실시예 위치에 대해, 샘플은 도 6에서 306926으로, 높은 TMB를 가졌다.
이형접합 SNP(Het/Het) 부근에 위치한 이형접합 체세포 변이체를 포함하는 모델에서, 대립유전자 CG(39), GT(34) 및 GG(7)의 검출을 나타내는 카운트 행렬이 조립되었다. 세 번째 최대 카운트 GG(7)의 출현은 암세포에 있는 체세포 돌연변이로부터 발생했다.
대립유전자 비율은 VAR 위치에 있는 상이한 대립유전자의 비율로서 계산했다. 이 Het-Het 실시예에서, 대립유전자 비율 = 39/(34+7+39) * 100 = 48.8%이다.
SNP는 T/G로서 이형접합성이었다.
실시예 3: 도 6은 결장암 샘플로부터의 시퀀싱 데이터를 보여준다. 각 곡선은 변이체 위치의 수(y축)를 대립유전자 비율 %(x축)에 의해 나타낸다. 하나의 샘플은 높은 TMB 샘플을 나타내는 큰 피크를 보여주었다. 10% 미만인 매우 낮은 대립유전자 비율 값에서 왼쪽의 높은 피크는 무시되는 시퀀싱 오류를 반영한다. TMB 점수를 계수하기 위해 TMB 카운트는 15%에서 65%까지의 대립유전자 비율 범위에서의 곡선 아래 면적으로 취했다. 도 6의 데이터는 표 2에 제시된다. 표 2의 마지막 두 열은 적격화된 위치의 총 수 및 절대값 및 1Mb당 정규화된 TMB 값을 나타낸다. 샘플 306926의 TMB는 Mb당 417이고, 샘플 306932의 TMB는 Mb당 32.7이다.
Figure pct00002
일반적으로, Mb당 10개의 돌연변이를 갖는 TMB가 비교적 높고 전체 게놈에 외삽된 경우, 총 32,000개 초과의 체세포 돌연변이에 상응한다.
도 6을 참조하면, TMB는 돌연변이 점수가 30 이상인 위치로부터 계산되었고 15-65% 범위의 대립유전자 비율이 카운트되고 Mb인 적격화된 위치의 총 수로 정규화되었다. 도 6을 참조하면, 데이터 곡선은 필요한 점수를 갖는 변이체 위치의 수(y축)를 보여 주었다.
실시예 4: 도 7은 생식계열 비교 샘플 유래의 데이터를 공제하거나 생식계열 필터링을 포함하는 종래 방법과 비교한 것으로서, 핵산 시퀀싱에 의한 결장 및 유방암 샘플 중의 종양 돌연변이 부담을 검출 및 평가하기 위한 본 발명의 SNP 기반 방법을 사용하여 수득한 데이터의 플롯을 보여준다. 도 7의 데이터는 표 3에 요약된다.
결장암에 대한 샘플은 결장 현미부수체(Colon Micro-Satellite)였다. 유방암에 대한 샘플은 백금 민감성 유방 종양인 44개 환자 샘플의 세트였다.
Figure pct00003
Figure pct00004
종양 샘플만을 갖고, 제2 생식계열 비교 샘플 없이 본 발명의 직접 SNP 기반 방법(도 7, 검정색 원)을 사용하여, 종래 방법보다 놀랍도록 우수한 종양 돌연변이 부담 평가가 수득되었다. 본 발명의 SNP 기반 방법(도 7, 검정색 원)의 감도는 종래의 방법에 비해 놀라울 정도로 증가했다.
도 7에서, 동일한 x-축 위치에 있는 흰색 원 및 검정색 원은 생식계열 필터링(도 7, 흰색 원)과 비교된, 본 발명의 방법(도 7, 검정색 원)에 의한 동일한 환자 샘플에 대한 측정을 나타낸다.
도 7에서, x축은 각 환자에 대한 혈액 기반 생식계열 참조 샘플을 사용하여 생식계열 변이체를 공제한 전체 엑솜 시퀀싱에 의해 평가된 TMB 값을 나타낸다. 본 발명의 방법(도 7, 검정색 원) 및 생식계열 필터링 방법(도 7, 흰색 원)에 관해서, 전체 엑솜 시퀀싱을 위해 동일한 샘플을 사용하였다. 이 방법은 혈액 기반 공제가 생식계열 변이체를 제거하는 종래의 "금본위(gold standard)"로 간주된다.
도 7에서, y축은 본 발명의 방법 (도 7, 검정색 원) 및 생식계열 필터링 방법(도 7, 흰색 원)이 종래의 "금본위" 접근법과 어떻게 비교되는지를 보여준다. y축 값은 HRD 검정을 사용하여 수득한 데이터로부터 결정했다.
보다 구체적으로, 본 발명의 SNP 기반 방법(도 7, 검정색 원)은 공지된 생식계열 변이체의 데이터베이스를 사용하고 생식계열 배경을 제거하기 위한 시도로 공통 변이체를 필터링하여 종양 돌연변이 부담을 평가하기 위한 핵산 시퀀싱 방법(도 7, 흰색 원)보다 놀라울 정도로 더 정확했다. 공지된 생식계열 변이체의 데이터베이스를 사용하고 생식계열 배경을 제거하기 위한 시도로 공통 변이체를 필터링하는 핵산 시퀀싱에 의해 종양 돌연변이 부담을 검출 및 평가하기 위한 상기 종래의 방법(도 7, 흰색 원)은 부정확한 종양 돌연변이 부담 수준을 제공했다. 따라서, 본 발명의 고유하고 직접적인 SNP 기반 방법(도 7, 검정색 원)의 정확도 및 감도는 생식계열 양을 공제하려고 시도하는 방법(도 7, 흰색 원)에 비해 놀라울 정도로 증가했고 예기치 않게 유리했다.
또한, 본 발명의 직접 SNP 기반 방법은 Mb당 0.1개 돌연변이부터 Mb당 최대 100개 돌연변이(1000배 증가)까지의 광범위한 돌연변이 빈도에 걸쳐 생식계열 공제와 함께 수행된 종래의 전체 엑솜 시퀀싱보다 놀라울 정도로 우수했는데, 그 이유는 본 발명의 직접 SNP 기반 방법이 생식계열 공제 샘플을 필요로 하지 않았고 감도가 향상되었기 때문이다. 보다 구체적으로, 본 발명의 SNP 기반 방법(도 7, 검정색 원)은 생식계열 양을 공제하기 위해 쌍을 이룬 종양 및 생식계열 비교 샘플을 필요로 하지 않았다. 본 발명의 SNP 기반 방법(도 7, 검정색 원)은 종양 샘플만을 사용했다. 본 발명의 SNP 기반 방법은 종양 샘플만을 사용하여 생식계열 양으로부터 체세포 돌연변이를 놀라울 정도로 검출, 식별 및 분리했다.
보다 구체적으로, 도 7은 본 발명의 SNP 기반 방법(도 7, 검정색 원)이 생식계열 필터링(도 7, 흰색 원)보다 전체 엑솜 시퀀싱(Whole Exome Sequencing)(x축으로 표시됨)에 더 일치하는 결과를 제공했음을 보여준다. 도 7에 도시된 바와 같이, 생식계열 필터링 방법(도 7, 흰색 원)은 메가염기당 약 10개 TMB 또는 메가염기당 약 20개에서 부정확했다(라인에서 벗어남). 따라서, 생식계열 필터링은 메가염기당 약 10개 미만 또는 심지어 메가염기당 약 20개 미만의 TMB 값을 정확하게 평가할 수 없다.
실시예 5: 생식계열 양을 공제하는 단계 없이 암에 걸린 대상체의 첫 번째 단일 샘플만을 사용하여 체세포 돌연변이를 직접 검출하고 종양 돌연변이 부담을 평가하기 위한 고유한 알고리즘을 사용하는 본 발명의 방법을, 생식계열 양을 공제하기 위해 쌍을 이룬 종양 및 생식계열 비교 샘플을 사용하는 전체 엑솜 시퀀싱(WES) 방법과 비교했다. 본 발명의 방법은 생식계열 비교 샘플을 공제하는 MYCHOICE HRD-PLUS 방법과 추가로 비교했다.
각각의 WES 및 MYCHOICE HRD-PLUS 방법은 44개의 유방 및 12개의 결장 종양으로부터의 매칭된 종양 및 정상 DNA에 대해 수행하였다. MYCHOICE HRD-PLUS 검정은 상동성 재조합 결핍 분석과 108개 유전자의 재배열 및 MSI 분석을 조합한다.
하나의 비교를 위해, 쌍을 이룬 샘플의 모든 변이체를 식별하고 생식계열 변이체를 공제하여 WES로부터 TMB 척도를 계산했다.
상이한 비교를 위해, MYCHOICE HRD-PLUS를 사용했다. 이 검정은 게놈을 따라 분포된 약 27,000개의 SNP를 표적으로 한다. 약 100 bp의 시퀀스 리드는 각 SNP 주변에 ±400-염기 윈도우가 있고 최대 7개의 불일치가 있는 SNP 분절의 세트에 매핑하였다.
돌연변이 호출에서 잠재적 모호성을 줄이기 위해 매핑된 서열에 여러 오류 필터를 적용했다:
복수의 맵 위치를 갖는 리드는 무시했다;
리드 말단은 시퀀싱 오류가 발생하기 쉬우므로, 각 리드 중 염기 1-10 및 >86는 무시했다;
동일한 삽입체의 정방향(F) 및 역방향(R) 리드가 모두 매핑된 경우, 이들의 맵 위치는 50 내지 500bp의 삽입체 크기에 상응해야 한다;
F 또는 R 리드는 SNP 위치에 중복되어야 한다;
F 및 R 리드가 중복되는 경우, 이들의 호출은 조합되었으며, 이 경우 SNP 호출은 동일해야 한다;
상이한 염기 호출을 가진 중복 위치는 무시한다(식별가능한 시퀀싱 오류).
TMB 값은 MYCHOICE HRD-PLUS 데이터를 사용하여 2가지 방식으로 계산했다. 첫째, 생식계열 양의 공제. 이 방법에서는 각 SNP에 인접한 400bp 서열이 관찰되었다. 이들 서열 영역 내에서 변이체가 식별되었고, 그 다음 쌍을 이룬 샘플을 사용하여 생식계열 공제를 수행했다.
두 번째 실험에서는, 암에 걸린 대상체로부터의 첫 번째 단일 샘플만을 사용하고 생식계열 공제를 필요로 하지 않는 본 발명의 고유한 알고리즘만을 사용하여 MYCHOICE HRD-PLUS 데이터에 대한 TMB 값을 계산했다.
두 번째 실험에서, 변이체 및 SNP 모두에 걸친 서열 리드만이 카운트 행렬의 조립에 포함되었다. SNP의 대립유전자 빈도는 변이체와 비교하여 변이체가 생식계열인지 체세포성인지를 결정했다. 생식계열 공제는 사용하지 않았다.
이 두 번째 실험에서 나머지 모든 위치에 대해 카운트 행렬이 계산되었고, 여기서 각 요소 C(X1, X2)는 비-SNP 호출 X1=(T, C, G 또는 A ) 및 SNP 호출 X2=(T, C, G 또는 A)를 갖는 매핑된 리드의 수였다. 이 행렬에서 가장 큰 두 개의 카운트인 C(X,P) ≥ C(Y,Q)는 4개의 위치 대립유전자 조건 중 하나의 결과로 보였다:
HomHom: C(Y,Q) ≤ 3은 단 하나의 유의미한 카운트인 C(X,P)만을 남기며, 이는 비-SNP 및 SNP 위치가 모두 동형접합성임을 의미한다;
HetHom: X ≠ Y 및 P = Q, 즉, 비-SNP 위치는 이형접합성이었고 SNP 위치는 동형접합성이었다;
HomHet: X = Y 및 P ≠ Q, 즉, 비-SNP 위치는 동형접합성이었고 SNP 위치는 이형접합성이었다;
HetHet: X ≠ Y 및 P ≠ Q, 즉, 비-SNP 및 SNP 위치 모두 이형접합성이었다.
이형접합 SNP 위치를 갖는 HomHet 및 HetHet 조건을 사용하여 암 및 비-암 세포로부터의 판독 카운트를 구별하였다. 이러한 조건에서 행렬의 세 번째 최대 카운트인 C(Z,P) 또는 C(Z,Q)는 암 세포의 체세포 돌연변이의 결과일 수 있다.
세 번째 최대 카운트는 이 카운트가 배경 시퀀싱 오류율보다 훨씬 높은 경우, 체세포 돌연변이를 검출하는 데 사용될 수 있다. 평균 오류율 E는 가장 높은 3개의 카운트를 제외하고 다른 모든 카운트로부터 계산되었다.
자유도가 1인 카이 제곱 확률인 체세포 돌연변이에 대한 Phred-유사 유의성 점수(Phred-like significance score)는 다음 식 I로 계산했다:
S = (C(Z,P)2/(C(Z,P)+C(X,P)) + (C(Z,P)-E)2/E)/2 * 10 (식 I)
TMB 수준은 하기 식 II에 제시된 바와 같이 Mbase인, 이형접합 SNP 영역 내의 총 위치 수, {N(HomHet) + N(HetHet)}에 의해 정규화된, S > 30을 갖는 위치의 수이다:
TMB = N(S > 30)/(N(HomHet) + N(HetHet)) * 1000000 (식 II)
TMB를 계산하기 위해 사용된 중간 서열 길이는 WES의 경우 9.7Mb, 생식계열 공제가 있는 MYCHOICE HRD-PLUS의 경우 4.6Mb, 생식계열 공제를 필요로 하지 않는 본 발명의 고유한 알고리즘의 경우 1.9Mb였다.
결과는 TMB를 결정하기 위한 3가지 상이한 방법에 대해 비교되었다. 비교는 생식계열 공제를 필요로 하지 않는 본 발명의 고유한 알고리즘이 놀라울 정도로 정확한 TMB 값을 제공함을 보여주었다. TMB 결과의 비교는 표 4에 제시된다.
Figure pct00005
표 4의 상관관계 계수는 생식계열 공제를 필요로 하지 않는 고유한 알고리즘을 사용한 본 발명의 방법이 생식계열 공제가 있는 MYCHOICE HRD-PLUS뿐만 아니라 생식계열 공제가 있는 WES 기반의 종래 방법과 비교하여 놀라울 정도로 정확한 TMB 값을 제공했음을 보여준다.
따라서, 생식계열 공제를 필요로 하지 않는 고유한 알고리즘을 사용한 본 발명의 방법은 생식계열 비교 샘플을 필요로 하지 않고 암 및 비-암 세포를 함유하는 임의의 샘플에서 수행될 수 있기 때문에 예기치 않게 유리하다.
생식계열 공제를 필요로 하지 않는 고유한 알고리즘을 사용하는 본 발명의 방법은 평가될 각 질병 또는 집단에 대해 TMB 수준에 대한 역치 또는 참조가 결정될 수 있기 때문에 강력한 도구이다.

Claims (58)

  1. 체세포 변이체를 검출하는 방법으로서,
    (a) 샘플의 세포를 시퀀싱하는 단계;
    (b) 각 SNP가 대립유전자 B 및 A를 갖는, 이형접합성 SNP 위치 세트를 식별하는 단계;
    (c) SNP 위치 및 상기 SNP 위치 부근의 위치에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링(pairing)을 검출하는 단계로서, 상기 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 상기 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인, 상기 2개의 생식계열 대립유전자 페어링을 검출하는 단계; 및
    (d) (iii) 대립유전자 B 및 상기 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계
    를 포함하는, 체세포 변이체를 검출하는 방법.
  2. 제1항에 있어서, 상기 대립유전자 페어링은 상기 SNP 위치 중 하나를 함유하는 인접 핵산 서열에서 각각 검출되어, 상기 변이체 위치가 상기 SNP 위치의 하나의 검출 길이 내에 있는, 체세포 변이체를 검출하는 방법.
  3. 제2항에 있어서, 상기 인접 핵산 서열은 약 100 내지 5000개 염기의 판독 길이인, 체세포 변이체를 검출하는 방법.
  4. 제2항에 있어서, 상기 검출 길이는 상기 SNP 위치의 각 측접부(flank)에 있는 200 내지 1000개의 인접 염기 위치인, 체세포 변이체를 검출하는 방법.
  5. 제1항에 있어서, 상기 방법은 별도의 생식계열 비교 샘플을 활용하지 않는, 체세포 변이체를 검출하는 방법.
  6. 제1항에 있어서, 상기 샘플은 암 조직 샘플, 종양 세포 샘플 또는 종양 샘플인, 체세포 변이체를 검출하는 방법.
  7. 제1항에 있어서, 상기 샘플 내 비종양 세포의 양이 최소화되는, 체세포 변이체를 검출하는 방법.
  8. 제1항에 있어서, 상기 종양 샘플이 비종양 세포를 함유하는, 체세포 변이체를 검출하는 방법.
  9. 제1항에 있어서, 상기 대립유전자 페어링이 대량 병렬 시퀀싱(massively parallel sequencing), 혼성화 또는 증폭에 의해 검출되는, 체세포 변이체를 검출하는 방법.
  10. 제1항에 있어서, 상기 이형접합 SNP 위치 세트는 적어도 5000개 SNP 위치, 또는 적어도 100,000 SNP 위치, 또는 적어도 500,000 SNP 위치, 또는 적어도 1,000,000개 SNP 위치, 또는 적어도 2,000,000개 SNP 위치인, 체세포 변이체를 검출하는 방법.
  11. 제1항에 있어서, 상기 방법은 Mb당 0.1개, Mb당 0.3개 또는 Mb당 0.7개의 최소 수준으로 체세포 변이체를 검출하는, 체세포 변이체를 검출하는 방법.
  12. 제1항에 있어서, 상기 검출은 표적화된 SNP 패널에 의해 수득되는, 체세포 변이체를 검출하는 방법.
  13. 제1항에 있어서, 상기 검출은 인간 표준 게놈을 사용하는 단편화 시퀀싱에 의해 수득되는, 체세포 변이체를 검출하는 방법.
  14. 체세포 변이체를 검출하는 방법으로서,
    (a) 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플의 서열 리드(sequence read)를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬(somatic variant count matrix)을 조립(assemble)하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계; 및
    (e) 상기 제3 요소에 대한 체세포 돌연변이 유의성 점수(S)를 계산하는 단계
    를 포함하는, 체세포 변이체를 검출하는 방법.
  15. 제14항에 있어서, 별도의 생식계열 비교 샘플을 활용하지 않는, 체세포 변이체를 검출하는 방법.
  16. 제14항에 있어서, 상기 샘플은 암 조직 샘플, 종양 세포 샘플 또는 종양 샘플인, 체세포 변이체를 검출하는 방법.
  17. 제14항에 있어서, 체세포 변이체를 Mb당 0.1개, Mb당 0.3개, 또는 Mb당 0.7개의 최소 수준으로 검출하는, 체세포 변이체를 검출하는 방법.
  18. 제14항에 있어서, 상기 서열 리드는 표적화된 SNP 패널에 의해 수득되는, 체세포 변이체를 검출하는 방법.
  19. 제14항에 있어서, 상기 판독 길이는 100 내지 5000개 또는 200 내지 1000개의 인접 염기 위치인, 체세포 변이체를 검출하는 방법.
  20. 제14항에 있어서, 상기 평균 판독 깊이는 커버된 표준 게놈 부위에 대해 적어도 50x인, 체세포 변이체를 검출하는 방법.
  21. 제14항에 있어서, 상기 표준 게놈은 인간 게놈인, 체세포 변이체를 검출하는 방법.
  22. 제14항에 있어서, 상기 서열 리드는 하기 단계 중 하나 이상에 의해 오류 필터링되는, 체세포 변이체를 검출하는 방법:
    복수의 맵 위치를 갖는 리드를 무시하는 단계;
    100개 염기 길이의 각 리드에서 번호 1 내지 10 및 86번 초과의 염기를 무시하는 단계;
    동일한 삽입체의 정방향 및 역방향 리드에 대해 삽입체 크기에 맵 위치 크기를 일치시키는 단계;
    정방향 또는 역방향 리드가 SNP 위치와 중복되지 않는 리드를 무시하는 단계; 및
    SNP 호출이 동일한 경우 중복되는 정방향 및 역방향 리드에 대한 염기 호출을 조합하고, 상이한 염기 호출을 가진 중복 위치는 무시하는 단계.
  23. 제14항에 있어서, 상기 서열 리드가,
    모호한 야생형 서열을 가진 위치를 무시하는 단계;
    공지된 SNP 다형성을 갖는 위치를 무시하는 단계;
    판독 깊이가 50 미만인 위치를 무시하는 단계;
    관련 없는 게놈 분절이 상기 서열에 일치되는 반복 위치를 무시하는 단계; 및
    관련 없는 샘플의 대표적인 샘플에서 식별된 미지의 SNP 다형성을 가진 위치를 무시하는 단계
    중 하나 이상에 의해 위치 필터링되는, 체세포 변이체를 검출하는 방법.
  24. 제14항에 있어서, 상기 체세포 돌연변이 유의성 점수(S)는 하기 식 I에 의해 제공되는, 체세포 변이체를 검출하는 방법:
    S = (C(Z,P)2/(C(Z,P)+C(X,P)) + (C(Z,P)-E)2/E)/2 * 10 (식 I)
    식 중, C(Z,P)는 제3 요소 카운트이고, C(X,P)는 제1 요소 카운트이며, E는 모든 SNP 영역에서 가장 높은 3개의 카운트를 제외한, 상기 행렬에 있는 다른 모든 카운트의 평균으로부터 계산된 오류율임.
  25. 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법으로서,
    (a) 상기 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치 세트를 식별하는 단계;
    (c) SNP 위치 및 상기 SNP 위치 부근의 위치에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 상기 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 상기 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 단계;
    (d) (iii) 대립유전자 B 및 상기 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 상기 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는, 상기 제3 대립유전자 페어링을 검출하는 단계;
    (f) 상기 대립유전자 페어링으로부터 검출된 상기 체세포 변이체로부터 종양 돌연변이 부담에 대한 값을 계산하는 단계;
    (g) 참조 수준보다 더 큰 상기 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 받는 암에 걸린 상기 대상체를 식별하는 단계
    를 포함하는, 체세포 변이체를 검출하는 방법.
  26. 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법으로서,
    (a) 상기 대상체로부터 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드가 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑되는 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 상기 제3 요소에 대한 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 상기 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계
    에 의해 상기 샘플의 종양 돌연변이 부담값을 계산하는 단계; 및
    (f) 체세포 돌연변이의 참조 수준보다 큰 상기 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 단계
    를 포함하는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  27. 제26항에 있어서, 상기 표준 게놈에서 상기 이형접합-SNP의 수는 상기 표준 게놈에 있는 약 100개 내지 이형접합-SNP의 총 수까지인, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  28. 제25항 또는 제26항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 대상체가 상기 치료로부터 혜택을 볼 수준인, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  29. 제25항 또는 제26항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 표준 게놈의 평균 종양 돌연변이 부담인, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  30. 제25항 또는 제26항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 대상체와 동일한 종류의 암을 갖는 참조 집단의 평균 종양 돌연변이 부담인, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  31. 제25항 또는 제26항에 있어서, 상기 체세포 돌연변이의 참조 수준은 암에 걸리지 않은 참조 집단의 평균 종양 돌연변이 부담인, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  32. 제25항 또는 제26항에 있어서, 상기 체세포 돌연변이의 참조 수준은 치료로부터 혜택을 받지 않는 참조 집단의 평균 종양 돌연변이 부담인, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  33. 제25항 또는 제26항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 대상체로부터의 상이한 샘플에 의해 수득되는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법.
  34. 제26항에 있어서, 상기 체세포 돌연변이 유의성 점수(S)는 15, 20, 30 또는 40 초과이며, 하기 식 I에 의해 제공되는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법:
    S = (C(Z,P)2/(C(Z,P)+C(X,P)) + (C(Z,P)-E)2/E)/2 * 10 (식 I)
    식 중, C(Z,P)는 제3 요소의 카운트이고, C(X,P)는 제1 요소의 카운트이며, E는 모든 SNP 영역에 대해 가장 높은 3개의 카운트를 제외하고 행렬에 있는 다른 모든 카운트의 평균으로부터 계산된 오류율임.
  35. 제26항에 있어서, 상기 종양 돌연변이 부담 역치는 15, 또는 20, 또는 30, 또는 40이고, 상기 종양 돌연변이 부담은 하기 식 II에 의해 제공되는, 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하는 방법:
    TMB = N(S > 역치)/(N(HomHet) + N(HetHet)) * 1000000 (식 II)
    식 중, N은 이형접합-SNP 영역에 있는 위치의 총 수[N(HomHet) + N(HetHet)]에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수임.
  36. 암의 치료를 필요로 하는 대상체에서 암을 치료하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치의 세트를 식별하는 단계;
    (c) SNP 위치 및 상기 SNP 위치 부근에 있는 위치의 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 상기 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 상기 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인, 상기 2개의 생식계열 대립유전자 페어링을 검출하는 단계; 및
    (d) (iii) 대립유전자 B 및 상기 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 상기 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는, 상기 제3 대립유전자 페어링을 검출하는 단계;
    (e) 검출된 상기 체세포 변이체로부터 종양 돌연변이 부담값을 계산하는 단계;
    (f) 참조 수준보다 큰 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 받는 암에 걸린 상기 대상체를 식별하는 단계; 및
    (g) 암에 대한 치료를 투여하는 단계
    를 포함하는, 암을 치료하는 방법.
  37. 암의 치료를 필요로 하는 대상체에서 암을 치료하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 대해 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 각 체세포 변이체에 대한 상기 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 상기 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 상기 종양 돌연변이 부담값을 계산하는 단계
    에 의해 상기 샘플의 종양 돌연변이 부담값을 계산하는 단계;
    (f) 체세포 돌연변이의 참조 수준보다 큰 종양 돌연변이 부담을 갖는 치료로부터 혜택을 볼 암에 걸린 상기 대상체를 식별하는 단계; 및
    (g) 암에 대한 치료를 투여하는 단계
    를 포함하는, 암을 치료하는 방법.
  38. 제37항에 있어서, 상기 암에 대한 치료가 면역 관문 저해제 약물을 투여하는 것을 포함하는, 암을 치료하는 방법.
  39. 제36항 또는 제37항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 치료로부터 혜택을 볼 대상체의 수준인, 암을 치료하는 방법.
  40. 제36항 또는 제37항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 표준 게놈의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  41. 제36항 또는 제37항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 대상체와 동일한 종류의 암을 갖는 참조 집단의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  42. 제36항 또는 제37항에 있어서, 상기 체세포 돌연변이의 참조 수준은 암에 걸리지 않은 참조 집단의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  43. 제36항 또는 제37항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 치료로부터 혜택을 받지 않는 참조 집단의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  44. 암의 치료를 필요로 하는 대상체에서 암을 치료하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 각 체세포 변이체의 상기 제3 요소에 대한 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 상기 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치를 초과하는 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계
    에 의해 상기 샘플의 종양 돌연변이 부담값을 계산하는 단계;
    (f) 상기 체세포 돌연변이의 참조 수준보다 큰 종양 돌연변이 부담을 갖는, 치료로부터 혜택을 볼 암에 걸린 대상체를 식별하는 단계;
    (g) 일정 기간 동안 암의 징후 및 증상에 대해 상기 대상체를 모니터링하는 단계; 및
    (h) 암에 대한 치료를 투여하는 단계
    를 포함하는, 암을 치료하는 방법.
  45. 제44항에 있어서, 상기 치료는 면역 관문 저해제를 투여하는 것인, 암을 치료하는 방법.
  46. 제44항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 치료로부터 혜택을 볼 대상체의 수준인, 암을 치료하는 방법.
  47. 제44항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 표준 게놈의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  48. 제44항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 대상체와 동일한 종류의 암을 갖는 참조 집단의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  49. 제44항에 있어서, 상기 체세포 돌연변이의 참조 수준은 암에 걸리지 않은 참조 집단의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  50. 제44항에 있어서, 상기 체세포 돌연변이의 참조 수준은 상기 치료로부터 혜택을 받지 않는 참조 집단의 평균 종양 돌연변이 부담인, 암을 치료하는 방법.
  51. 암에 걸린 대상체의 치료에 대한 반응을 모니터링하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 각 SNP가 대립유전자 B 및 A를 갖는 이형접합 SNP 위치의 세트를 식별하는 단계;
    (c) SNP 위치 및 상기 SNP 위치 부근의 위치에 있는 변이체에 대한 2개의 생식계열 대립유전자 페어링을 검출하는 단계로서, 상기 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 상기 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인 단계; 및
    (d) (iii) 대립유전자 B 및 상기 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 상기 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는, 상기 제3 대립유전자 페어링을 검출하는 단계;
    (e) 상기 검출된 체세포 변이체로부터 종양 돌연변이 부담값을 계산하는 단계
    를 포함하는, 암에 걸린 대상체의 치료에 대한 반응을 모니터링하는 방법.
  52. 암에 걸린 대상체의 치료에 대한 반응을 모니터링하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 대해 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 각 체세포 변이체에 대한 상기 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 상기 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 상기 종양 돌연변이 부담값을 계산하는 단계
    에 의해 상기 샘플의 종양 돌연변이 부담값을 계산하는 단계
    를 포함하는, 암에 걸린 대상체의 치료에 대한 반응을 모니터링하는 방법.
  53. 암에 걸린 대상체를 예후하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 각 SNP가 대립유전자 B 및 A를 갖는, 이형접합 SNP 위치의 세트를 식별하는 단계;
    (c) SPN 위치 및 상기 SNP 위치 부근의 위치에 있는 변이체에 대한 로서, 상기 2개의 생식계열 대립유전자 페어링은 (i) 대립유전자 B 및 제1 변이체 대립유전자, 및 (ii) 대립유전자 A 및 상기 제1 변이체 대립유전자와 동일하거나 상이할 수 있는 제2 변이체 대립유전자인, 상기 2개의 생식계열 대립유전자 페어링을 검출하는 단계; 및
    (d) (iii) 대립유전자 B 및 상기 제1 변이체 대립유전자와 상이한 제3 변이체 대립유전자인 제3 대립유전자 페어링을 검출하는 단계로서, 상기 제3 대립유전자 페어링은 체세포 변이체로부터 발생하는, 상기 제3 대립유전자 페어링을 검출하는 단계;
    (e) 검출된 상기 체세포 변이체로부터 종양 돌연변이 부담값을 계산하는 단계; 및
    (f) TMB 참조 수준보다 큰 상기 종양 돌연변이 부담을 갖는 대상체를 좋지 않은 예후를 갖는 것으로서 예후하는 단계
    를 포함하는, 암에 걸린 대상체를 예후하는 방법.
  54. 암에 걸린 대상체를 예후하는 방법으로서,
    (a) 상기 대상체로부터의 종양 샘플의 세포를 시퀀싱하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 대해 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 각 체세포 변이체에 대한 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 상기 종양 돌연변이 부담값을 계산하는 단계
    에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계;
    (f) TMB 참조 수준보다 큰 상기 종양 돌연변이 부담을 갖는 대상체를 좋지 않은 예후를 갖는 것으로서 예후하는 단계; 및
    (g) 암 치료를 투여하는 단계
    를 포함하는, 암에 걸린 대상체를 예후하는 방법.
  55. 제54항에 있어서, 상기 치료가 면역 관문 저해제를 투여하는 것인, 암에 걸린 대상체를 예후하는 방법.
  56. 치료로부터 혜택을 받는 암에 걸린 대상체를 식별하기 위한 키트로서,
    (a) 상기 대상체 유래의 샘플로부터 서열 리드를 수득하기 위한 시약으로서, 상기 서열 리드는 샘플의 종양 돌연변이 부담에 대한 값을 수득하는 데 사용될 수 있는 것인 시약; 및
    (b) 상기 서열 리드를 수득하기 위한 시약 및 상기 대상체를 식별하기 위한 종양 돌연변이 부담값의 사용에 대한 지침서
    를 포함하는, 키트.
  57. 체세포 변이체를 검출하기 위한 시스템으로서,
    암세포 및 비-암세포를 함유하는 샘플로부터 핵산을 받아서 농축시키고 증폭시키기 위한 수단;
    상기 핵산으로부터 라이브러리를 합성하기 위한 수단;
    상기 라이브러리를 시퀀싱 칩과 접촉시키기 위한 수단;
    상기 라이브러리의 서열을 검출하고 서열 데이터를 프로세서로 전송하기 위한 수단;
    하기 단계를 수행하기 위한 하나 이상의 프로세서:
    (a) 암세포 및 비-암세포를 함유하는 샘플을 제공하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 대해 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자에 쌍을 이룬 SNP 대립유전자 B의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 각 체세포 변이체에 대한 상기 제3 요소의 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 상기 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치 초과의 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 종양 돌연변이 부담값을 계산하는 단계
    에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계; 및
    서열 정보를 표시, 도표화 및 기록하기 위한 디스플레이
    를 포함하는, 체세포 변이체를 검출하기 위한 시스템.
  58. 프로세서가 체세포 변이체를 검출하는 방법의 단계들을 수행하도록 하는, 상기 프로세서에 의한 실행 명령이 저장되어 있는 비일시적 기계 판독가능 저장 매체로서,
    (a) 암세포 및 비-암세포를 함유하는 샘플을 제공하는 단계;
    (b) 대량 병렬 핵산 시퀀싱 공정을 사용하여 상기 샘플로부터 서열 리드를 수득하는 단계로서, 상기 서열 리드는 판독 길이를 갖는, 상기 서열 리드를 수득하는 단계;
    (c) 상기 서열 리드를 표준 게놈에 매핑하는 단계;
    (d) 상기 표준 게놈의 이형접합-SNP 위치에 매핑된 서열 리드의 체세포 변이체 카운트 행렬을 조립하는 단계로서, 상기 카운트 행렬은 변이체 대립유전자에 대한 SNP 대립유전자 B 및 A 각각의 대립유전자 페어링을 카운트하는 제1 및 제2 요소를 갖고, 상기 카운트 행렬은 상기 제1 요소에서보다 상이한 변이체 대립유전자와 쌍을 이룬 SNP 대립유전자 B로부터의 판독 서열을 카운트하는 제3 요소를 갖는, 상기 체세포 변이체 카운트 행렬을 조립하는 단계;
    (e) (i) 각 체세포 변이체의 상기 제3 요소에 대한 체세포 돌연변이 유의성 점수(S)를 계산하는 단계; 및
    (ii) 상기 이형접합-SNP 영역에 있는 위치의 총 수에 의해 정규화된, 역치를 초과하는 체세포 돌연변이 유의성 점수를 갖는 체세포 변이체의 수로부터 상기 종양 돌연변이 부담값을 계산하는 단계
    에 의해 샘플의 종양 돌연변이 부담값을 계산하는 단계; 및
    (f) 상기 샘플로부터 서열 정보를 표시, 도표화 및 기록하는 단계
    를 포함하는, 비일시적 기계 판독가능 저장 매체.
KR1020217017932A 2018-11-13 2019-11-12 체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도 KR20210089240A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862760743P 2018-11-13 2018-11-13
US62/760,743 2018-11-13
US201962929554P 2019-11-01 2019-11-01
US62/929,554 2019-11-01
PCT/US2019/061036 WO2020102261A1 (en) 2018-11-13 2019-11-12 Methods and systems for somatic mutations and uses thereof

Publications (1)

Publication Number Publication Date
KR20210089240A true KR20210089240A (ko) 2021-07-15

Family

ID=70732169

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217017932A KR20210089240A (ko) 2018-11-13 2019-11-12 체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도

Country Status (6)

Country Link
US (1) US20210262016A1 (ko)
EP (1) EP3881323A4 (ko)
JP (1) JP2022513003A (ko)
KR (1) KR20210089240A (ko)
CN (1) CN113168885A (ko)
WO (1) WO2020102261A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102427600B1 (ko) * 2021-12-14 2022-08-01 주식회사 테라젠바이오 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112029861B (zh) * 2020-09-07 2021-09-21 臻悦生物科技江苏有限公司 基于捕获测序技术的肿瘤突变负荷检测装置及方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
CN104662171B (zh) * 2012-07-12 2018-07-13 普瑟姆尼股份有限公司 个性化癌症疫苗和过继免疫细胞治疗
WO2014058987A1 (en) * 2012-10-09 2014-04-17 Five3 Genomics, Llc Systems and methods for tumor clonality analysis
US20150292033A1 (en) * 2014-04-10 2015-10-15 Dana-Farber Cancer Institute, Inc. Method of determining cancer prognosis
CN113930507A (zh) * 2014-12-31 2022-01-14 夸登特健康公司 疾病的检测和治疗以及用于传送测试结果的系统和方法
WO2016127944A1 (en) * 2015-02-10 2016-08-18 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
US10689710B2 (en) * 2015-05-27 2020-06-23 Quest Diagnostics Investments Incorporated Methods for screening solid tumors for mutations
WO2017106365A1 (en) * 2015-12-14 2017-06-22 Myriad Genetics, Inc. Methods for measuring mutation load
JP2019509018A (ja) * 2016-01-22 2019-04-04 グレイル, インコーポレイテッドGrail, Inc. 変異に基づく病気の診断および追跡
KR102358206B1 (ko) * 2016-02-29 2022-02-04 파운데이션 메디신 인코포레이티드 종양 돌연변이 부담을 평가하기 위한 방법 및 시스템
WO2017210102A1 (en) * 2016-06-01 2017-12-07 Institute For Systems Biology Methods and system for generating and comparing reduced genome data sets
MX2019003934A (es) * 2016-10-06 2019-07-10 Genentech Inc Métodos terapéuticos y de diagnóstico para el cáncer.
CN108473975A (zh) * 2016-11-17 2018-08-31 领星生物科技(上海)有限公司 检测肿瘤发展的系统和方法
CN110383385B (zh) * 2016-12-08 2023-07-25 生命科技股份有限公司 从肿瘤样品中检测突变负荷的方法
CN107287285A (zh) * 2017-03-28 2017-10-24 上海至本生物科技有限公司 一种预测同源重组缺失机制及患者对癌症治疗响应的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102427600B1 (ko) * 2021-12-14 2022-08-01 주식회사 테라젠바이오 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Also Published As

Publication number Publication date
JP2022513003A (ja) 2022-02-07
EP3881323A1 (en) 2021-09-22
CN113168885A (zh) 2021-07-23
WO2020102261A1 (en) 2020-05-22
US20210262016A1 (en) 2021-08-26
EP3881323A4 (en) 2022-11-16

Similar Documents

Publication Publication Date Title
US11984195B2 (en) Methylation pattern analysis of tissues in a DNA mixture
AU2016370835B2 (en) Distinguishing methylation levels in complex biological samples
US20200270707A1 (en) Methylation pattern analysis of haplotypes in tissues in a dna mixture
TWI636255B (zh) 癌症檢測之血漿dna突變分析
US11581062B2 (en) Systems and methods for classifying patients with respect to multiple cancer classes
Kim et al. Prognostic role of methylation status of the MGMT promoter determined quantitatively by pyrosequencing in glioblastoma patients
US20210262016A1 (en) Methods and systems for somatic mutations and uses thereof
US20220228221A1 (en) Diagnostics and Treatments Based Upon Molecular Characterization of Colorectal Cancer
JP2023109998A (ja) マイクロサテライト不安定性の検出
JP2022516092A (ja) クローン性造血由来の無細胞dna変異の断片サイズ特性評価
CN111968702B (zh) 一种基于循环肿瘤dna的恶性肿瘤早期筛查系统
EP3954784A1 (en) Composition for diagnosis or prognosis prediction of glioma, and method for providing information related thereto
CA3227495A1 (en) Somatic variant cooccurrence with abnormally methylated fragments
US20190352704A1 (en) Benign thyroid nodule-specific gene
WO2017106365A1 (en) Methods for measuring mutation load
WO2021225527A1 (en) Methods for identifying a medical condition in a human subject
KR20180125911A (ko) 차세대서열분석 스크리닝을 통해 발굴한 단일염기다형성에 의한 염증성 장질환의 예측 또는 진단에 관한 정보 제공 방법
US20230416841A1 (en) Inferring transcription factor activity from dna methylation and its application as a biomarker
WO2013031853A1 (ja) 前立腺癌の予後の予測方法
Seo et al. Germline Functional Variants Contribute to Somatic Mutation and Outcomes in Neuroblastoma
US20210222251A1 (en) Method of cancer prognosis by assessing tumor variant diversity
WO2024124207A2 (en) Systems and methods for cell-free nucleic acids methylation assessment
KR20230060494A (ko) 말초 t세포 림프종 예후 예측용 신규 바이오마커 및 이의 용도
KR20240063745A (ko) Cell-free DNA 를 이용한 건강 및 질병관리 시스템 및 방법
CN113785076A (zh) 预测癌症预后的方法及其组合物

Legal Events

Date Code Title Description
A201 Request for examination