KR20210035167A - 게놈 변경을 평가하기 위한 조성물 및 방법 - Google Patents

게놈 변경을 평가하기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20210035167A
KR20210035167A KR1020217000609A KR20217000609A KR20210035167A KR 20210035167 A KR20210035167 A KR 20210035167A KR 1020217000609 A KR1020217000609 A KR 1020217000609A KR 20217000609 A KR20217000609 A KR 20217000609A KR 20210035167 A KR20210035167 A KR 20210035167A
Authority
KR
South Korea
Prior art keywords
sample
binding pair
functional
target capture
substrate
Prior art date
Application number
KR1020217000609A
Other languages
English (en)
Inventor
제프리 앨런 오토
트래비스 클라크
도론 립슨
대니얼 리버
데이비드 파브리치오
Original Assignee
파운데이션 메디신 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파운데이션 메디신 인코포레이티드 filed Critical 파운데이션 메디신 인코포레이티드
Publication of KR20210035167A publication Critical patent/KR20210035167A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/543Detection characterised by immobilisation to a surface characterised by the use of two or more capture oligonucleotide primers in concert, e.g. bridge amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

표적 포획 및 시퀀싱을 이용하여 cfDNA 또는 ctDNA 환자 샘플 중의 게놈 변경을 평가하는 조성물 및 방법이 개시된다.

Description

게놈 변경을 평가하기 위한 조성물 및 방법
관련 출원에 대한 상호 참조
본 출원은 2018년 6월 11일에 출원된 미국 가출원 번호 62/683,469를 우선권 주장한다. 전술한 출원의 내용은 그 전체 내용이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출되었고 그 전체 내용이 본원에 참조로 포함되는 서열 목록을 함유한다. 2019년 6월 6일에 창출된, 상기 ASCII 카피는 F2036-7072WO_SL.txt로 명명되고 그 크기가 840 바이트이다.
발명의 분야
본 발명은 게놈 변경을 평가하기 위한 조성물 및 방법에 관한 것이다.
암 세포는 암 발생 및 진행 동안 돌연변이를 축적한다. 이러한 돌연변이는 DNA 복구, 복제 또는 변형의 내재적 오작동 또는 외부 돌연변이 유발원에 대한 노출의 결과일 수 있다. 특정 돌연변이는 암 세포에 성장 이점을 부여하였고, 암이 발생하는 조직의 미세환경에서 긍정적으로 선택된다. 유리한 돌연변이의 선택이 종양 형성에 기여하지만, 종양 신생 항원을 생성하고 후속 면역 인식의 가능성도 돌연변이가 발생함에 따라 증가할 수 있다 (Gubin and Schreiber. Science 350:158-9, 2015). 따라서, 전체 엑솜 시퀀싱 (WES)에 의해 측정된 바와 같은, 총 돌연변이 부담은, 예를 들어, 암 면역 요법에 대한 지속적인 반응을 예측하기 위해 환자 치료 결정을 안내하는데 사용될 수 있다. 그러나, 게놈 연구를 일상적인 임상 실습으로 변환하는 것은 여전히 문제가 있는데, 이는 전체 엑솜 시퀀싱이 널리 이용가능하지 않고 비용이 많이 들며, 시간이 많이 걸리며 기술적으로 까다롭기 때문이다.
따라서, 환자 샘플로부터의 게놈 또는 엑솜의 서브세트를 표적으로 하는 게놈 프로파일링을 포함한 새로운 접근법에 대한 필요성이 여전히 존재한다.
한 측면에서, 본 발명은 제1 표적 포획 시약 (R1) 및 제2 표적 포획 시약 (R2)을 포함하는 복수 개의 표적 포획 시약을 특징으로 하며,
여기서:
R1은 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R1, 및 임의로, 결합 쌍의 기능적 제1 구성원이 결여된 R1을 포함하고;
R2는 결합 쌍의 기능적 제1 구성원을 포함하는 R2 및 결합 쌍의 기능적 제1 구성원이 결여된 R2를 포함하며;
여기서 결합 쌍의 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있고,
여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 크다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
복수 개의 표적 포획 시약의 일부 실시양태에서, R1 각각은 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체를 형성할 수 있고, R2 각각은 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 형성할 수 있으며, 여기서 F1, F2, 또는 둘 다는 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함한다.
일부 실시양태에서, F1은 높은 시퀀싱 깊이 이벤트를 포함한다.
일부 실시양태에서, F2는 낮은 시퀀싱 깊이 이벤트를 포함한다. 다른 실시양태에서, 낮은 시퀀싱 깊이 이벤트의 수준은 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있다.
일부 실시양태에서, 복수 개의 표적 포획 시약은 제3 표적 포획 시약 (R3)을 추가로 포함하며,
여기서 R3은 결합 쌍의 기능적 제1 구성원을 포함하는 R3 및 결합 쌍의 기능적 제1 구성원이 결여된 R3을 포함하고;
여기서 결합 쌍의 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으며,
여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 (예를 들어, 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배) 더 크다.
복수 개의 표적 포획 시약의 일부 실시양태에서, R3 각각은 제3 단편/제1 표적 포획 시약 (F3/R3) 혼성체를 형성할 수 있고, F3은 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함한다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R1 대 결합 쌍의 기능적 제1 구성원이 결여된 R1의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R1 대 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R2 대 결합 쌍의 기능적 제1 구성원이 결여된 R2의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R2 대 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R3 대 결합 쌍의 기능적 제1 구성원이 결여된 R3의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R3 대 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 한 실시양태에서, A 대 B의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이며, 여기서:
A는 R1 (예를 들어, 결합 쌍의 기능적 제1 구성원을 포함함), 및 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R2를 포함하고;
B는 R1 (예를 들어, 결합 쌍의 기능적 제1 구성원을 포함함), 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2를 포함한다.
복수 개의 표적 포획 시약의 한 실시양태에서, A 대 B의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이며, 여기서:
A는 결합 쌍의 기능적 제1 구성원을 포함하는 R1; 및 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R2를 포함하고;
B는 결합 쌍의 기능적 제1 구성원을 포함하는 R1 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2를 포함한다.
한 실시양태에서, 복수 개의 표적 포획 시약의 비율은 실시예 1에 기재된 검정에 의해 결정된다. 한 실시양태에서, 비율은, 예를 들어, 본원에 기재된 바와 같은, 제1 시퀀싱 깊이, 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 제2 시퀀싱 깊이, 예를 들어, 상이한 서브게놈 구간, 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은, 예를 들어, 본원에 기재된 바와 같은, 제1 시퀀싱 깊이, 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이; 및 제2 시퀀싱 깊이, 예를 들어, 상이한 서브게놈 구간, 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 제1 단편 (F1), 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 F1의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 제2 단편 (F2), 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 F2의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 F1, 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 F1의 시퀀싱 깊이; 및 F2, 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 F2의 시퀀싱 깊이에 기반하여 결정된다.
한 실시양태에서, 비율은 하나 이상의 유전자, 예를 들어, 미리 선택된 유전자의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 하나 이상의 유전자 또는 서브게놈 구간, 예를 들어, 미리 선택된 유전자 또는 미리 선택된 서브게놈 구간의 시퀀싱 깊이를 결정함으로써 선택된다. 한 실시양태에서, 비율은 하나 이상의 유전자, 예를 들어, 미리 선택된 유전자 또는 미리 선택된 서브게놈 구간의 시퀀싱 깊이에 기반하여 변경, 예를 들어, 증가 또는 감소된다. 한 실시양태에서, 비율은 하나 이상의 유전자 또는 서브게놈 구간의 미리 선택된 시퀀싱 깊이를 수득하도록 변경, 예를 들어, 증가 또는 감소된다.
한 실시양태에서, 복수 개의 표적 포획 시약은 제1 시퀀싱 깊이를 허용하는, 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약 대 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약의 비율을 갖는다. 한 실시양태에서, 복수 개의 표적 포획 시약은 제2 시퀀싱 깊이를 허용하는, 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약 대 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약의 비율을 갖는다. 한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이가 아니다. 한 실시양태에서, 제1 시퀀싱 깊이는 제2 시퀀싱 깊이보다 크며, 예를 들어, 제2 시퀀싱 깊이보다 적어도 1.1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10배 더 크다. 한 실시양태에서, 제1 시퀀싱 깊이는 제2 시퀀싱 깊이보다 약 1.1 내지 10배, 약 1.1 내지 9배, 약 1.1 내지 8배, 약 1.1 내지 7배, 약 1.1 내지 6배, 약 1.1 내지 5배, 약 1.1 내지 4배, 약 1.1 내지 3배, 약 1.1 내지 2배, 약 2 내지 10배, 약 3 내지 10배, 약 4 내지 10배, 약 5 내지 10배, 약 6 내지 10배, 약 7 내지 10배, 약 8 내지 10배, 또는 약 9 내지 10배 더 크다. 한 실시양태에서, 제1 시퀀싱 깊이는 제2 시퀀싱 깊이보다 약 1.1배, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배 더 크다.
한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이보다 더 크며, 예를 들어, 제1 시퀀싱 깊이보다 적어도 1.1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10배 더 크다. 한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이보다 약 1.1 내지 10배, 약 1.1 내지 9배, 약 1.1 내지 8배, 약 1.1 내지 7배, 약 1.1 내지 6배, 약 1.1 내지 5배, 약 1.1 내지 4배, 약 1.1 내지 3배, 약 1.1 내지 2배, 약 2 내지 10배, 약 3 내지 10배, 약 4 내지 10배, 약 5 내지 10배, 약 6 내지 10배, 약 7 내지 10배, 약 8 내지 10배, 또는 약 9 내지 10배 더 크다. 한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이보다 약 1.1배, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배 더 크다.
한 실시양태에서, 제1 시퀀싱 깊이, 예를 들어, F1 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 좁고 높은 시퀀싱 깊이이다.
한 실시양태에서, 제2 시퀀싱 깊이, 예를 들어, F2 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 넓고 중간 정도의 시퀀싱 깊이이다.
한 실시양태에서, 제1 시퀀싱 깊이, 예를 들어, F2 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 좁고 높은 시퀀싱 깊이이다.
한 실시양태에서, 제2 시퀀싱 깊이, 예를 들어, F1 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 넓고 중간 정도의 시퀀싱 깊이이다.
한 실시양태에서, F1은 높은 시퀀싱 깊이 이벤트를 포함한다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 실행가능한 이벤트, 예를 들어, 본원에 기재된 실행가능한 이벤트를 포함한다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 높은 시퀀싱 깊이, 예를 들어, 낮은 시퀀싱 깊이 이벤트보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되는 서열 (예를 들어, 서브게놈 구간 서열)을 포함한다.
한 실시양태에서, F1은 낮은 시퀀싱 깊이 이벤트를 포함하지 않는다.
한 실시양태에서, F2는 낮은 시퀀싱 깊이 이벤트를 포함한다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 특정 이벤트를 포함한다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트의 수준은 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 미세부수체 불안정성 (MSI), 또는 둘 다의 결정과 연관이 있다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 실행가능한 이벤트, 예를 들어, 본원에 기재된 실행가능한 이벤트를 포함한다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 실행가능한 이벤트, 예를 들어, 본원에 기재된 실행가능한 이벤트를 포함하지 않는다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 낮은 시퀀싱 깊이, 예를 들어, 높은 시퀀싱 깊이 이벤트보다 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 미만 더 낮은 깊이로 시퀀싱되는 서열 (예를 들어, 서브게놈 구간 서열)을 포함한다.
한 실시양태에서, F2는 높은 시퀀싱 깊이 이벤트를 포함하지 않는다.
한 실시양태에서, 복수 개의 표적 포획 시약, 예를 들어, R1, R2 및/또는 R3은 제한되지 않으며, 예를 들어, 약 100-2000X 과잉, 예를 들어, 몰 과잉이다. 한 실시양태에서, 복수 개의 표적 포획 시약은 약 100X, 200X, 300X, 400X, 500X, 600X, 700X, 800X, 900X, 1000X, 1100X, 1200X, 1300X 1400X, 1500X, 1600X, 1700X, 1800X, 1900X, 또는 2000X 과잉, 예를 들어, 몰 과잉이다. 한 실시양태에서, 복수 개의 표적 포획 시약은 약 100-1900X, 100-1800X, 100-1700X, 100-1600X, 100-1500X, 100-1400X, 100-1300X, 100-1200X, 100-1100X, 100-1000X, 100-900X, 100-800X, 100-700X, 100-600X, 100-500X, 100-400X, 100-300X, 100-200X, 200-2000X, 300-2000X, 400-2000X, 500-2000X, 600-2000X, 700-2000X, 800-2000X, 900-2000X, 1000-2000X, 1100-2000X, 1200-2000X, 1300-2000X, 1400-2000X, 1500-2000X, 1600-2000X, 1700-2000X, 1800-2000X, 또는 1900-2000X 과잉, 예를 들어, 몰 과잉이다.
복수 개의 표적 포획 시약의 한 실시양태에서, (i) 제1 구성원을 포함하는 R2의 농도; (ii) 제1 구성원을 포함하지 않는 R2의 농도; 및 (iii) F2의 농도는, 제1 구성원을 포함하는 R2에 대한 제1 구성원을 포함하지 않는 R2의 분율이 제1 구성원을 포함하는 F2-R2의 복합체의 수에 영향을 미치도록 하는 것이다.
복수 개의 표적 포획 시약의 한 실시양태에서, (i) 제1 구성원을 포함하는 R1의 농도; (ii) 제1 구성원을 포함하지 않는 R1의 농도; 및 (iii) F1의 농도는, 제1 구성원을 포함하는 R1에 대한 제1 구성원을 포함하지 않는 R1의 분율이 제1 구성원을 포함하는 F1-R1의 복합체의 수에 영향을 미치도록 하는 것이다.
또 다른 측면에서, 본원에는 하기 단계를 포함하는, 샘플을 분석하는 방법이 개시된다:
복수 개의 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하는 단계; 및
복수 개의 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하며,
여기서 기질과 결합하는 F1/R1 혼성체의 분율이 기질과 결합하는 F2/R2 혼성체의 분율보다 더 크며,
이에 의해 샘플을 분석하는 단계.
일부 실시양태에서, R1의 일부분 및 R2의 일부분은 결합 쌍의 기능적 제1 구성원을 포함한다. 일부 실시양태에서, 결합 쌍의 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있다.
일부 실시양태에서, R1의 일부분, R2의 일부분, 또는 둘 다가, 결합 쌍의 기능적 제1 구성원, 예를 들어, 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 없거나 또는 이러한 제2 구성원에 대한 감소된 결합 친화도를 갖는 변경되거나 또는 차단된 제1 구성원이 결여된다.
일부 실시양태에서, R1은 결합 쌍의 기능적 제1 구성원을 포함하는 R1 및 결합 쌍의 기능적 제1 구성원이 결여된 R1을 포함하고; R2는 결합 쌍의 기능적 제1 구성원을 포함하는 R2 및 결합 쌍의 기능적 제1 구성원이 결여된 R2를 포함한다.
일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 크다.
일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
일부 실시양태에서, F1은 높은 시퀀싱 깊이 이벤트를 포함한다.
일부 실시양태에서, F2는 낮은 시퀀싱 깊이 이벤트를 포함한다. 다른 실시양태에서, 낮은 시퀀싱 깊이 이벤트의 수준은 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있다.
일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율은, F1/R1 혼성체/기질 복합체 및 F2/R2 혼성체/기질 복합체의 형성 시, F1/R1 혼성체/기질 복합체 중의 F1의 수 및 F2/R2 혼성체/기질 복합체 중의 F2의 수가 하기 관계 중 하나 또는 둘 다를 갖도록 하는 것이다:
(i) F1의 수가 F2의 수보다 더 크거나, 또는 이와 실질적으로 동일함; 및/또는
(ii) 제1 대상 구간에서의 변경을 포함하는 F1의 수가 제2 대상 구간에서의 변경을 포함하는 F2의 수보다 더 크거나, 또는 이와 실질적으로 동일함.
일부 실시양태에서, F1의 수는 F2의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
일부 실시양태에서, 제1 대상 구간에서의 변경을 포함하는 F1의 수는 제2 대상 구간에서의 변경을 포함하는 F2의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
일부 실시양태에서, 제1 대상 구간, 제2 대상 구간, 또는 둘 다는 표 1A-5A에 기재된 유전자로부터의 것이다.
일부 실시양태에서, 제1 대상 구간에서의 변경은 샘플 중에 약 0.01-20%, 예를 들어, 약 0.02-19%, 0.03-18%, 0.04-17%, 0.05-16%, 0.06-15%, 0.07-14%, 0.08-13%, 0.09-12%, 0.1-10%, 0.2-9%, 0.3-8%, 0.4-7%, 0.5-6%, 0.6-5%, 0.7-4%, 0.8-3%, 0.9-2%, 1-1.9%, 1.1-1.8%, 1.2-1.7%, 1.3-1.6%, 또는 1.4-1.5%의 돌연변이체 대립유전자 빈도 (MAF)로 존재한다. 일부 실시양태에서, 제1 대상 구간은 샘플 중에 약 0.1% 이상 (예를 들어, 약 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 이상, 예를 들어, 약 0.1% 내지 0.9%, 0.2% 내지 0.8%, 0.3% 내지 0.7%, 또는 0.4% 내지 0.6%)의 돌연변이체 대립유전자 빈도 (MAF)로 존재한다. 일부 실시양태에서, 제1 대상 구간은 샘플 중에 약 1% 이상 (예를 들어, 약 2%, 3%, 4%, 5%, 6%, 7%, 8%, 또는 9% 이상, 예를 들어, 약 1% 내지 9%, 2% 내지 8%, 3% 내지 7%, 또는 4% 내지 6%)의 돌연변이체 대립유전자 빈도 (MAF)로 존재한다.
일부 실시양태에서, F1, F2, 또는 둘 다는 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함한다.
일부 실시양태에서, F1에서의 대상 구간은 제1 깊이로 시퀀싱되고, F2에서의 대상 구간은 제2 깊이로 시퀀싱되며, 여기서 제1 깊이는 제2 깊이보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10배 더 크다.
일부 실시양태에서, F1은 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 여기서 대상 구간은 변경, 예를 들어, 체세포 변경, 예를 들어, 암에 있어서의 기능적 변경을 포함한다.
일부 실시양태에서, 대상 구간은 적어도 약 5,000X 깊이로 시퀀싱된다.
일부 실시양태에서, F2는 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하며, 여기서 대상 구간은 변경, 예를 들어, 체세포 변경을 포함하고, 여기서 이러한 변경의 결정은 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 예를 들어, 혈액 종양 돌연변이 부담 (bTMB)을 평가하기 위해 사용된다.
일부 실시양태에서, 대상 구간은, 예를 들어, 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 예를 들어, 혈액 종양 돌연변이 부담 (bTMB)을 평가하기 위하여, 적어도 약 800X 내지 약 5,000X 미만으로 시퀀싱된다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 복수 개의 제3 단편/제3 표적 포획 시약 (F3/R3) 혼성체를 기질과 접촉시켜 F3/R3 혼성체/기질 복합체를 형성하는 것을 추가로 포함한다.
일부 실시양태에서, R3은 결합 쌍의 기능적 제1 구성원을 포함하는 R3 및 결합 쌍의 기능적 제1 구성원이 결여된 R3을 포함한다.
일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 더 크다.
일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R1 대 결합 쌍의 기능적 제1 구성원이 결여된 R1의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R1 대 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R2 대 결합 쌍의 기능적 제1 구성원이 결여된 R2의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R2 대 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원을 포함하는 R3 대 결합 쌍의 기능적 제1 구성원이 결여된 R3의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 일부 실시양태에서, 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R3 대 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이다.
복수 개의 표적 포획 시약의 한 실시양태에서, A 대 B의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이며, 여기서:
A는 R1 (예를 들어, 결합 쌍의 기능적 제1 구성원을 포함함), 및 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R2를 포함하고;
B는 R1 (예를 들어, 결합 쌍의 기능적 제1 구성원을 포함함), 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2를 포함한다.
복수 개의 표적 포획 시약의 한 실시양태에서, A 대 B의 비율은 약 2% 내지 약 50%, 예를 들어, 약 3% 내지 약 40%, 약 4% 내지 약 30%, 약 5% 내지 약 25%, 약 8% 내지 약 20%, 약 10% 내지 약 15%, 예를 들어, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 또는 약 50%이며, 여기서:
A는 결합 쌍의 기능적 제1 구성원을 포함하는 R1; 및 결합 쌍 (예를 들어, 본원에 기재된 결합 쌍)의 기능적 제1 구성원이 결여된 R2를 포함하고;
B는 결합 쌍의 기능적 제1 구성원을 포함하는 R1 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2를 포함한다.
한 실시양태에서, 복수 개의 표적 포획 시약의 비율은 실시예 1에 기재된 검정에 의해 결정된다. 한 실시양태에서, 비율은, 예를 들어, 본원에 기재된 바와 같은, 제1 시퀀싱 깊이, 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 제2 시퀀싱 깊이, 예를 들어, 상이한 서브게놈 구간, 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은, 예를 들어, 본원에 기재된 바와 같은, 제1 시퀀싱 깊이, 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이; 및 제2 시퀀싱 깊이, 예를 들어, 상이한 서브게놈 구간, 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 하나 이상의 서브게놈 구간의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 제1 단편 (F1), 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 F1의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 제2 단편 (F2), 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 F2의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 F1, 예를 들어, 높은 시퀀싱 깊이 이벤트를 포함하는 F1의 시퀀싱 깊이; 및 F2, 예를 들어, 낮은 시퀀싱 깊이 이벤트를 포함하는 F2의 시퀀싱 깊이에 기반하여 결정된다.
한 실시양태에서, 비율은 하나 이상의 유전자, 예를 들어, 미리 선택된 유전자의 시퀀싱 깊이에 기반하여 결정된다. 한 실시양태에서, 비율은 하나 이상의 유전자 또는 서브게놈 구간, 예를 들어, 미리 선택된 유전자 또는 미리 선택된 서브게놈 구간의 시퀀싱 깊이를 결정함으로써 선택된다. 한 실시양태에서, 비율은 하나 이상의 유전자, 예를 들어, 미리 선택된 유전자 또는 미리 선택된 서브게놈 구간의 시퀀싱 깊이에 기반하여 변경, 예를 들어, 증가 또는 감소된다. 한 실시양태에서, 비율은 하나 이상의 유전자 또는 서브게놈 구간의 미리 선택된 시퀀싱 깊이를 수득하도록 변경, 예를 들어, 증가 또는 감소된다.
한 실시양태에서, 복수 개의 표적 포획 시약은 제1 시퀀싱 깊이를 허용하는, 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약 대 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약의 비율을 갖는다. 한 실시양태에서, 복수 개의 표적 포획 시약은 제2 시퀀싱 깊이를 허용하는, 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약 대 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약의 비율을 갖는다. 한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이가 아니다. 한 실시양태에서, 제1 시퀀싱 깊이는 제2 시퀀싱 깊이보다 더 크며, 예를 들어, 제2 시퀀싱 깊이보다 적어도 1.1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10배 더 크다. 한 실시양태에서, 제1 시퀀싱 깊이는 제2 시퀀싱 깊이보다 약 1.1 내지 10배, 약 1.1 내지 9배, 약 1.1 내지 8배, 약 1.1 내지 7배, 약 1.1 내지 6배, 약 1.1 내지 5배, 약 1.1 내지 4배, 약 1.1 내지 3배, 약 1.1 내지 2배, 약 2 내지 10배, 약 3 내지 10배, 약 4 내지 10배, 약 5 내지 10배, 약 6 내지 10배, 약 7 내지 10배, 약 8 내지 10배, 또는 약 9 내지 10배 더 크다. 한 실시양태에서, 제1 시퀀싱 깊이는 제2 시퀀싱 깊이보다 약 1.1배, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배 더 크다.
한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이보다 더 크며, 예를 들어, 제1 시퀀싱 깊이보다 적어도 1.1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10배 더 크다. 한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이보다 약 1.1 내지 10배, 약 1.1 내지 9배, 약 1.1 내지 8배, 약 1.1 내지 7배, 약 1.1 내지 6배, 약 1.1 내지 5배, 약 1.1 내지 4배, 약 1.1 내지 3배, 약 1.1 내지 2배, 약 2 내지 10배, 약 3 내지 10배, 약 4 내지 10배, 약 5 내지 10배, 약 6 내지 10배, 약 7 내지 10배, 약 8 내지 10배, 또는 약 9 내지 10배 더 크다. 한 실시양태에서, 제2 시퀀싱 깊이는 제1 시퀀싱 깊이보다 약 1.1배, 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배 더 크다.
한 실시양태에서, 제1 시퀀싱 깊이, 예를 들어, F1 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 좁고 높은 시퀀싱 깊이이다.
한 실시양태에서, 제2 시퀀싱 깊이, 예를 들어, F2 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 넓고 중간 정도의 시퀀싱 깊이이다.
한 실시양태에서, 제1 시퀀싱 깊이, 예를 들어, F2 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 좁고 높은 시퀀싱 깊이이다.
한 실시양태에서, 제2 시퀀싱 깊이, 예를 들어, F1 시퀀싱 깊이는, 예를 들어, 실시예 1에 기재된 바와 같은, 넓고 중간 정도의 시퀀싱 깊이이다.
한 실시양태에서, 복수 개의 표적 포획 시약, 예를 들어, R1, R2 및/또는 R3은 제한되지 않으며, 예를 들어, 약 100-2000X 과잉, 예를 들어, 몰 과잉이다. 한 실시양태에서, 복수 개의 표적 포획 시약은 약 100X, 200X, 300X, 400X, 500X, 600X, 700X, 800X, 900X, 1000X, 1100X, 1200X, 1300X 1400X, 1500X, 1600X, 1700X, 1800X, 1900X, 또는 2000X 과잉, 예를 들어, 몰 과잉이다. 한 실시양태에서, 복수 개의 표적 포획 시약은 약 100-1900X, 100-1800X, 100-1700X, 100-1600X, 100-1500X, 100-1400X, 100-1300X, 100-1200X, 100-1100X, 100-1000X, 100-900X, 100-800X, 100-700X, 100-600X, 100-500X, 100-400X, 100-300X, 100-200X, 200-2000X, 300-2000X, 400-2000X, 500-2000X, 600-2000X, 700-2000X, 800-2000X, 900-2000X, 1000-2000X, 1100-2000X, 1200-2000X, 1300-2000X, 1400-2000X, 1500-2000X, 1600-2000X, 1700-2000X, 1800-2000X, 또는 1900-2000X 과잉, 예를 들어, 몰 과잉이다.
복수 개의 표적 포획 시약의 한 실시양태에서, (i) 제1 구성원을 포함하는 R2의 농도; (ii) 제1 구성원을 포함하지 않는 R2의 농도; 및 (iii) F2의 농도는, 제1 구성원을 포함하는 R2에 대한 제1 구성원을 포함하지 않는 R2의 분율이 제1 구성원을 포함하는 F2-R2의 복합체의 수에 영향을 미치도록 하는 것이다.
복수 개의 표적 포획 시약의 한 실시양태에서, (i) 제1 구성원을 포함하는 R1의 농도; (ii) 제1 구성원을 포함하지 않는 R1의 농도; 및 (iii) F1의 농도는, 제1 구성원을 포함하는 R1에 대한 제1 구성원을 포함하지 않는 R1의 분율이 제1 구성원을 포함하는 F1-R1의 복합체의 수에 영향을 미치도록 하는 것이다.
일부 실시양태에서, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율 및 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율은, F2/R2 혼성체/기질 복합체 및 F3/R3 혼성체/기질 복합체의 형성 시, F2/R2 혼성체/기질 복합체 중의 F2의 수 및 F3/R3 혼성체/기질 복합체 중의 F3의 수가 하기 관계 중 하나 또는 둘 다를 갖도록 하는 것이다:
(i) F2의 수가 F3의 수보다 더 큼; 및/또는
(ii) 제2 대상 구간에서의 변경을 포함하는 F2의 수가 제3 대상 구간에서의 변경을 포함하는 F3의 수보다 더 큼.
일부 실시양태에서, F2의 수는 F3의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
일부 실시양태에서, 제2 대상 구간에서의 변경을 포함하는 F2의 수는 제3 대상 구간에서의 변경을 포함하는 F3의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 크다.
일부 실시양태에서, 제2 대상 구간, 제3 대상 구간, 또는 둘 다는 표 1A-5A에 기재된 유전자로부터의 것이다.
일부 실시양태에서, F1, F2, 또는 F3 중 하나, 둘 또는 모두가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함한다.
일부 실시양태에서, F2에서의 대상 구간은 제2 깊이로 시퀀싱되고, F3에서의 대상 구간은 제3 깊이로 시퀀싱되며, 여기서 제2 깊이는 제3 깊이보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10배 더 크다.
일부 실시양태에서, F3은 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하며, 여기서 대상 구간은 배선 변경, 예를 들어, 배선 단일 뉴클레오티드 다형성 (SNP)을 포함한다.
일부 실시양태에서, 대상 구간은 적어도 약 100X 깊이 내지 약 800X 미만의 깊이로 시퀀싱된다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 대상체로부터 샘플을 제공하는 것을 추가로 포함한다. 일부 실시양태에서, 샘플은 DNA, 예를 들어, 게놈 DNA, 예를 들어, 무세포 DNA (cfDNA) 또는 순환 종양 DNA (ctDNA)를 포함한다. 일부 실시양태에서, 샘플은 RNA, 예를 들어, mRNA를 포함한다. 일부 실시양태에서, 상기 방법은 RNA로부터 cDNA를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플로부터 핵산을 수득하는 것, 예를 들어, 단리하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플 중의 핵산을 단편화하여 F1 및 F2를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 F1을 증폭시켜 복수 개의 F1을 제공하는 것, 및 F2를 증폭시켜 복수 개의 F2를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 어댑터 서열을 F1 및 F2에 부착시켜 어댑터화된 F1 (AF1) 및 어댑터화된 F2 (AF2)를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 AF1을 증폭시켜 복수 개의 AF1을 제공하는 것, 및 AF2를 증폭시켜 복수 개의 AF2를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 복수 개의 F1을 R1과 접촉시켜 복수 개의 F1/R1 혼성체를 제공하는 것, 및 복수 개의 F2를 R2와 접촉시켜 복수 개의 F2/R2 혼성체를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 복수 개의 AF1을 R1과 접촉시켜 복수 개의 AF1/R1 혼성체를 제공하는 것, 및 복수 개의 AF2를 R2와 접촉시켜 복수 개의 AF2/R2 혼성체를 제공하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법은 복수 개의 AF1/R1 혼성체를 기질과 접촉시켜 AF1/R1 혼성체/기질 복합체를 형성하는 것을 포함하는, 복수 개의 F1/R1 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하는 것; 및 복수 개의 AF2/R2 혼성체를 기질과 접촉시켜 AF2/R2 혼성체/기질 복합체를 형성하는 것을 포함하는, 복수 개의 F2/R2 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하는 것을 포함한다.
일부 실시양태에서, 접촉하는 것은 용액 중에서 또는 고체 표면 상에서 발생한다.
본원에 개시된 방법 중 임의의 것의 일부 실시양태에서, 결합 쌍의 제1 구성원은 비오틴 모이어티를 포함하고, 결합 쌍의 제2 구성원은 스트렙타비딘 또는 아비딘 (또는 변형된 버전, 예를 들어, 뉴트라비딘 또는 캡타비딘) 모이어티를 포함한다.
본원에 개시된 방법 중 임의의 것의 일부 실시양태에서, 결합 쌍의 제1 구성원은 디곡시게닌 모이어티를 포함하고, 결합 쌍의 제2 구성원은 항-디곡시게닌 항체 모이어티를 포함한다.
본원에 개시된 방법 중 임의의 것의 일부 실시양태에서, 결합 쌍의 제1 구성원은 FITC 모이어티를 포함하고, 결합 쌍의 제2 구성원은 항-FITC 항체 모이어티를 포함한다.
본원에 개시된 방법 중 임의의 것의 일부 실시양태에서, R1 내의 결합 쌍의 제1 구성원은 링커를 통해 F1을 포획하는 (예를 들어, F1과 혼성화되는) R1 내의 모이어티 (예를 들어, 뉴클레오티드 서열)에 커플링된다. 일부 실시양태에서, R2 내의 결합 쌍의 제1 구성원은 링커를 통해 F2를 포획하는 (예를 들어, F2와 혼성화되는) R2 내의 모이어티 (예를 들어, 뉴클레오티드 서열)에 커플링된다. 일부 실시양태에서, 링커는 절단가능한 링커이다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 복수 개의 F1/R1 혼성체/기질 복합체로부터 F1을 시퀀싱하는 것, 및 복수 개의 F2/R2 혼성체/기질 복합체로부터 F2를 시퀀싱하는 것을 추가로 포함한다. 일부 실시양태에서, F1은 F2보다 더 큰 깊이, 예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱된다.
또한 또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 샘플을 분석하는 방법을 제공한다:
a) 복수 개의 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체 및 복수 개의 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 제공하며,
여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 크고,
여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있는 것인 단계;
b) 복수 개의 F1/R1 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하고, 복수 개의 F2/R2 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하며,
여기서 기질과 결합하는 F1/R1 혼성체의 분율이 기질과 결합하는 F2/R2 혼성체의 분율보다 더 큰 것인 단계; 및
c) 복수 개의 F1/R1 혼성체/기질 복합체로부터 F1을 시퀀싱하고, 복수 개의 F2/R2 혼성체/기질 복합체로부터 F2를 시퀀싱하며,
여기서 F1이 F2보다 더 큰 깊이로 시퀀싱되며,
이에 의해 샘플을 분석하는 단계.
한 측면에서, 본원에는 하기 단계를 포함하는, 샘플을 분석하는 방법이 개시된다:
1) 대상체로부터 샘플, 예를 들어, 게놈 DNA, 예를 들어, 무세포 DNA (cfDNA) 또는 순환 종양 DNA (ctDNA)를 포함하는 샘플을 제공하는 단계;
2) 샘플로부터 핵산을 수득하는, 예를 들어, 단리하는 단계;
3) 핵산을 단편화하여 복수 개의 단편 (F)을 제공하는 단계;
4) 어댑터 서열을 복수 개의 단편 (F)에 부착시켜 복수 개의 어댑터화된 단편 (AF)을 제공하는 단계;
5) 제1 AF (AF1)를 증폭시켜 복수 개의 AF1을 제공하고, 제2 AF (AF2)를 증폭시켜 복수 개의 AF2를 제공하는 단계;
6) 복수 개의 AF1을, AF1과 혼성화되는 뉴클레오티드 서열을 각각 포함하는 제1 표적 포획 시약 (R1)과 접촉시켜 복수 개의 AF1/R1 혼성체를 제공하고, 복수 개의 AF2를, AF2와 혼성화되는 뉴클레오티드 서열을 각각 포함하는 제2 표적 포획 시약 (R2)과 접촉시켜 복수 개의 AF2/R2 혼성체를 제공하며,
여기서 R1의 일부분 및 R2의 일부분이 결합 쌍의 기능적 제1 구성원을 포함하고, 여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으며,
여기서 R1의 일부분, R2의 일부분, 또는 둘 다가, 결합 쌍의 기능적 제1 구성원이 결여된 것인 단계;
7) 복수 개의 AF1/R1 혼성체를 기질과 접촉시켜 AF1/R1 혼성체/기질 복합체를 형성하고, 복수 개의 AF2/R2 혼성체를 기질과 접촉시켜 AF2/R2 혼성체/기질 복합체를 형성하며,
여기서 기질과 결합하는 AF1/R1 혼성체의 분율이, 기질과 결합하는 AF2/R2 혼성체의 분율보다 더 큰 것인 단계; 및
8) 복수 개의 AF1/R1 혼성체/기질 복합체로부터 AF1을 시퀀싱하고, 복수 개의 AF2/R2 혼성체/기질 복합체로부터 AF2를 시퀀싱하며,
임의로, 여기서 AF1이 AF2보다 더 큰 깊이, 예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되며;
이에 의해 샘플을 분석하는 단계.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플로부터 복수 개의 핵산 분자를 포함하는 라이브러리를 획득하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 상기 라이브러리를 표적 포획 시약과 접촉시켜 선택된 핵산 분자를 제공하며, 여기서 상기 표적 포획 시약이 핵산 분자와 혼성화되며, 이에 의해 라이브러리 캐치를 제공하는 것을 추가로 포함한다. 일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 상기 라이브러리 또는 라이브러리 캐치로부터, 핵산 분자로부터의 변경 (예를 들어, 체세포 변경)을 포함하는 대상 구간에 대한 리드를 획득하며, 이에 의해, 예를 들어, 차세대 시퀀싱 방법에 의해 대상 구간에 대한 리드를 획득하는 것을 추가로 포함한다.
일부 실시양태에서, 상기 방법은 복수 개의 유전자에서의 대상 구간에 대한 리드를 획득하는 것을 포함한다.
일부 실시양태에서, 복수 개의 유전자는 돌연변이체 형태의 유전자를 포함하며, 예를 들어, 돌연변이체 유전자는 세포 분열, 성장 또는 생존에 대한 효과와 연관이 있거나, 또는 암과 연관이 있다. 일부 실시양태에서, 복수 개의 유전자는 전체 엑손 시퀀싱 (WES)을 위한 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 약 350개 이상, 약 400개 이상, 약 450개 이상, 약 500개 이상 유전자, 또는 약 1,000개 이상 유전자, 또는 모든 유전자를 포함한다.
일부 실시양태에서, 복수 개의 유전자는 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두를 포함한다.
일부 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두로부터 대상 구간을 시퀀싱하는 것을 포함한다.
일부 실시양태에서, 대상 구간은 약 100X 초과, 약 250X 초과, 약 500X 초과, 약 800X 초과, 약 1,000X 초과, 약 2,000X 초과, 약 3,000X 초과, 약 4,000X 초과, 또는 약 5,000X 초과의 평균 깊이로 시퀀싱된다.
일부 실시양태에서, 대상 구간은 시퀀싱되는 유전자 (예를 들어, 엑손)의 약 95% 초과, 약 97% 초과, 또는 약 99% 초과에서, 약 100X 초과, 약 250X 초과, 약 500X 초과, 약 800X 초과, 약 1,000X 초과, 약 2,000X 초과, 약 3,000X 초과, 약 4,000X 초과, 또는 약 5,000X 초과의 평균 깊이로 시퀀싱된다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 상기 리드를 정렬 방법에 의해 정렬하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 뉴클레오티드 위치에 대한 상기 리드로부터 뉴클레오티드 값을 배정하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플 중의 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 예를 들어, 혈액 TMB (bTMB)를 평가하는 것을 추가로 포함한다.
일부 실시양태에서, 샘플은 혈액 샘플이고 bTMB가 평가된다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플 중의 변경을 체세포 또는 배선 변경으로서 특징규명하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플 중의 변경의 접합성을 결정하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플 분석에 대응하여 샘플 또는 이러한 샘플이 수득된 대상체를 분류하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에 개시된 방법 중 임의의 것은 샘플이 수득된 대상체 또는 또 다른 사람 또는 실체, 간병인, 의사, 종양전문의, 병원, 클리닉, 제3자 지불인, 보험 회사 또는 관공서에게 보고서, 예를 들어, 전자, 웹-기반 또는 종이 보고서를 제공하는 것을 추가로 포함한다.
본원에 개시된 조성물 및 방법 중 임의의 것이 하기 실시양태 중 하나 이상과 조합될 수 있다.
다중유전자 분석
본원에 기재된 방법 및 조성물은, 예를 들어, 본원에 기재된 유전자 또는 유전자 산물 세트로부터 대상 구간 세트를 평가하기 위해 사용될 수 있다.
특정 실시양태에서, 유전자 세트는 돌연변이체 형태에서, 세포 분열, 성장 또는 생존에 대한 효과와 연관되거나, 또는 암, 예를 들어, 본원에 기재된 암과 연관되는 복수 개의 유전자를 포함한다.
특정 실시양태에서, 유전자 세트는, 예를 들어, 본원에 기재된 바와 같은, 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 약 350개 이상, 약 400개 이상, 약 450개 이상, 약 500개 이상, 약 550개 이상, 약 600개 이상, 약 650개 이상, 약 700개 이상, 약 750개 이상, 또는 약 800개 이상 유전자를 포함한다. 일부 실시양태에서, 유전자 세트는 표 1A-5A에 기재된 선택된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두를 포함한다.
특정 실시양태에서, 상기 방법은 샘플로부터 복수 개의 종양 핵산 분자를 포함하는 라이브러리를 획득하는 것을 포함한다. 특정 실시양태에서, 상기 방법은 라이브러리를 표적 포획 시약과 접촉시켜 선택된 종양 핵산 분자를 제공하며, 여기서 상기 표적 포획 시약이 상기 라이브러리로부터의 종양 핵산 분자와 혼성화되며, 이에 의해 라이브러리 캐치를 제공하는 것을 추가로 포함한다. 특정 실시양태에서, 상기 방법은 라이브러리 또는 라이브러리 캐치로부터 종양 핵산 분자로부터의 변경 (예를 들어, 체세포 변경)을 포함하는 대상 구간에 대한 리드를 획득하며, 이에 의해, 예를 들어, 차세대 시퀀싱 방법에 의해 대상 구간에 대한 리드를 획득하는 것을 추가로 포함한다. 특정 실시양태에서, 상기 방법은 정렬 방법, 예를 들어, 본원에 기재된 정렬 방법에 의해 대상 구간에 대한 리드를 정렬하는 것을 추가로 포함한다. 특정 실시양태에서, 상기 방법은, 예를 들어, 본원에 기재된 돌연변이 호출 방법에 의해, 대상 구간에 대한 리드로부터 뉴클레오티드 위치에 대해 뉴클레오티드 값을 배정하는 것을 추가로 포함한다.
특정 실시양태에서, 상기 방법은 하기 중 1가지, 2가지, 3가지, 4가지 또는 모두를 포함한다:
(a) 샘플로부터 복수 개의 종양 핵산 분자를 포함하는 라이브러리를 획득하는 것;
(b) 라이브러리를 복수 개의 표적 포획 시약과 접촉시켜 선택된 종양 핵산 분자를 제공하며, 여기서 상기 복수 개의 표적 포획 시약이 종양 핵산 분자와 혼성화되며, 이에 의해 라이브러리 캐치를 제공하는 것;
(c) 상기 라이브러리 캐치로부터 종양 핵산 분자로부터의 변경 (예를 들어, 체세포 변경)을 포함하는 대상 구간에 대한 리드를 획득하며, 이에 의해, 예를 들어, 차세대 시퀀싱 방법에 의해 대상 구간에 대한 리드를 획득하는 것;
(d) 정렬 방법, 예를 들어, 본원에 기재된 정렬 방법에 의해 상기 리드를 정렬하는 것; 또는
(e) 예를 들어, 본원에 기재된 돌연변이 호출 방법에 의해, 뉴클레오티드 위치에 대해 상기 리드로부터의 뉴클레오티드 값을 배정하는 것.
특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 약 350개 이상, 약 400개 이상, 약 450개 이상, 약 500개 이상, 약 550개 이상, 약 600개 이상, 약 650개 이상, 약 700개 이상, 약 750개 이상, 또는 약 800개 이상 유전자로부터 대상 구간을 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두로부터 대상 구간을 시퀀싱하는 것을 포함한다.
특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 100X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 250X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 800X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 1,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 1,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 2,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 2,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 3,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 3,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 4,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 4,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 5,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 5,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 약 6,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다.
특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 99% 초과에서 약 100X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 99% 초과에서 약 250X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 95% 초과에서 약 500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 95% 초과에서 약 800X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 1,000X 초과 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 2,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 3,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 3,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 4,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 4,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 5,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 5,500X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 다른 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 90% 초과에서 약 6,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다. 특정 실시양태에서, 대상 구간에 대한 리드를 획득하는 것은 시퀀싱된 유전자 (예를 들어, 엑손) 중 약 99% 초과에서 약 100X 이상, 약 250X 이상, 약 500X 이상, 약 1,000X 이상, 약 1,500X 이상, 약 2,000X 이상, 약 2,500X 이상, 약 3,000X 이상, 약 3,500X 이상, 약 4,000X 이상, 약 4,500X 이상, 약 5,000X 이상, 약 5,500X 이상, 또는 약 6,000X 이상 평균 깊이로 시퀀싱하는 것을 포함한다.
특정 실시양태에서, 본원에 기재된 대상 구간 (예를 들어, 코딩 대상 구간) 세트의 서열, 예를 들어, 뉴클레오티드 서열이 본원에 기재된 방법에 의해 제공된다. 특정 실시양태에서, 상기 서열은 매칭된 정상 대조군 (예를 들어, 야생형 대조군), 매칭된 종양 대조군 (예를 들어, 원발성 대 전이성), 또는 둘 다를 포함하는 방법을 사용하지 않고 제공된다.
샘플
본원에 기재된 방법 및 조성물은 수많은 상이한 공급원으로부터의 다양한 유형의 샘플 중의 대상 구간을 평가하기 위해 사용될 수 있다.
일부 실시양태에서, 샘플은 핵산, 예를 들어, DNA, RNA, 또는 둘 다를 포함한다. 특정 실시양태에서, 샘플은 종양으로부터의 하나 이상의 핵산을 포함한다. 특정 실시양태에서, 샘플은 종양으로부터의 하나 이상의 비-핵산 성분, 예를 들어, 세포, 단백질, 탄수화물 또는 지질을 추가로 포함한다. 특정 실시양태에서, 샘플은 비-종양 세포 또는 조직으로부터의 하나 이상의 핵산을 추가로 포함한다. 특정 실시양태에서, 샘플은 고형 종양, 혈액 암, 또는 그의 전이성 형태로부터 획득된다. 특정 실시양태에서, 샘플은 본원에 기재된 바와 같은, 암이 있는 대상체, 또는 암을 치료하기 위한 요법을 받지 않은 대상체, 암을 치료하기 위한 요법을 받고 있거나 또는 암을 치료하기 위한 요법을 받은 적이 있는 대상체로부터 수득된 것이다.
일부 실시양태에서, 샘플은 하기 중 하나 이상을 포함한다: 전악성 또는 악성 세포; 고형 종양, 연부 조직 종양 또는 전이성 병변으로부터의 세포; 수술 절제면으로부터의 조직 또는 세포; 조직학적으로 정상적인 조직; 하나 이상의 순환 종양 세포 (CTC); 정상 인접 조직 (NAT); 혈액 샘플; 또는 포름알데히드 또는 파라포름알데히드 고정 파라핀 포매 (FFPE) 샘플. 특정 실시양태에서, 샘플은 혈액 샘플이다. 특정 실시양태에서, 샘플은 혈장 샘플이다. 특정 실시양태에서, 샘플을 무세포 DNA (cfDNA)를 포함한다. 특정 실시양태에서, 샘플은 순환 종양 DNA (ctDNA)를 포함한다. 특정 실시양태에서, 샘플은 뇌 척수액 (CSF)을 포함한다. 특정 실시양태에서, 샘플은 소변을 포함한다. 특정 실시양태에서, 샘플은 흉막 삼출을 포함한다. 특정 실시양태에서, 샘플은 복수를 포함한다. 특정 실시양태에서, 샘플은 FFPE 샘플이다. 특정 실시양태에서, 샘플은 절제, 바늘 생검, 미세 바늘 흡인물, 또는 세포학 도말표본을 포함한다.
표적 포획 시약
본원에 기재된 조성물 및 방법은 시퀀싱될 표적 핵산 분자의 선택을 위하여, 표적 포획 시약, 예를 들어, 용액 혼성화에 사용하기 위한 표적 포획 시약의 적절한 선택에 의해 하나 이상의 대상체로부터의 샘플, 예를 들어, 본원에 기재된 암으로부터의 다수의 유전자 및 유전자 산물의 최적화된 시퀀싱을 제공한다. 표적 포획 시약에 의해 포획된 표적 핵산 분자는 전형적으로 기질에 의해 회수된다. 일부 실시양태에서, 표적 포획 시약에 의해 포획된 표적 핵산 분자는 기질에 의해 회수되며, 예를 들어, 기질과 결합된다. 일부 실시양태에서, 상이한 표적 핵산 분자를 각각 포획하는 2개 이상 복수 개의 표적 포획 시약이 사용된다.
일부 실시양태에서, 회수 효율은 기질에 의해 회수되는 (예를 들어, 기질과 결합되는) 표적 포획 시약에 의해 포획된 표적 핵산 분자 대 총 표적 핵산 분자의 비율이다. 일부 실시양태에서, 적어도 2개 복수 개의 표적 포획 시약은 상이한 회수 효율을 갖는다. 일부 실시양태에서, 회수 효율은 표적 대상 구간에 따라 조정될 때 시퀀싱 깊이와 상관관계가 있다. 일부 실시양태에서, 회수 효율은 표적 대상 구간에 대한 시퀀싱 깊이와 상관관계가 있다. 일부 실시양태에서, 표적 포획 시약의 회수 효율은 기능적 결합 쌍을 포함하는 표적 포획 시약의 분율과 상관관계가 있다.
따라서, 일부 실시양태에서, 본원에 기재된 방법은 라이브러리를 상이한 회수 효율을 갖는 2개, 3개 또는 그 초과 복수 개의 표적 포획 시약과 접촉시켜 선택된 핵산 분자 (예를 들어, 라이브러리 캐치)를 확인 또는 단리하는 것을 포함한다. 일부 실시양태에서, 라이브러리는 본질적으로 동시에 및/또는 동일한 샘플 용기 (예를 들어, 튜브)에서 상이한 회수 효율을 갖는 2개, 3개 또는 그 초과 복수 개의 표적 포획 시약과 접촉된다. 일부 실시양태에서, 표적 핵산 분자는 본질적으로 동시에 및/또는 동일한 샘플 용기 (예를 들어, 튜브)에서 상이한 회수 효율을 갖는 2개, 3개 또는 그 초과 복수 개의 표적 포획 시약에 의해 포획된다. 일부 실시양태에서, 상이한 회수 효율을 갖는 2개, 3개 또는 그 초과 복수 개의 표적 포획 시약에 의해 포획된 표적 핵산 분자는 본질적으로 동시에 및/또는 동일한 샘플 용기 (예를 들어, 튜브)에서 기질에 의해 회수된다.
일부 실시양태에서, 제1 복수 개의 표적 포획 시약은 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약 및 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약을 포함하고, 제2 복수 개의 표적 포획 시약은 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약 및 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약을 포함하며, 여기서 결합 쌍의 기능적 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있다. 일부 실시양태에서, 제1 복수 개에서 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약의 분율은 제2 복수 개에서 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약의 분율보다 더 크므로, 제1 복수 개의 표적 포획 시약에 대한 회수 효율이 제2 복수 개의 표적 포획 시약에 대한 회수 효율보다 더 크다.
2개, 3개, 4개, 5개 또는 그 초과 복수 개의 표적 포획 시약의 임의의 조합, 예를 들어, 제1 및 제2 복수 개의 표적 포획 시약; 제1 및 제3 복수 개의 표적 포획 시약; 제1 및 제4 복수 개의 표적 포획 시약; 제1 및 제5 복수 개의 표적 포획 시약; 제2 및 제3 복수 개의 표적 포획 시약; 제2 및 제4 복수 개의 표적 포획 시약; 제2 및 제5 복수 개의 표적 포획 시약; 제3 및 제4 복수 개의 표적 포획 시약; 제3 및 제5 복수 개의 표적 포획 시약; 제4 및 제5 복수 개의 표적 포획 시약; 제1, 제2 및 제3 복수 개의 표적 포획 시약; 제1, 제2 및 제4 복수 개의 표적 포획 시약; 제1, 제2 및 제5 복수 개의 표적 포획 시약; 제1, 제2, 제3, 및 제4 복수 개의 표적 포획 시약; 제1, 제2, 제3, 제4 및 제5 복수 개의 표적 포획 시약 등의 조합이 사용될 수 있다.
일부 실시양태에서, 상기 방법은 하기를 포함한다:
(a) 샘플로부터의 복수 개의 핵산 분자 (예를 들어, 표적 핵산 분자), 예를 들어, 샘플, 예를 들어, 본원에 기재된 샘플로부터의 복수 개의 종양 핵산 분자를 포함하는 라이브러리를 획득하는 것;
(b) 라이브러리를 2개, 3개 또는 그 초과 복수 개의 표적 포획 시약과 접촉시켜 선택된 핵산 분자 (예를 들어, 라이브러리 캐치)를 제공하는 것;
(c) 예를 들어, 시퀀싱을 포함하는 방법에 의해, 예를 들어, 차세대 시퀀싱 방법을 사용하여, 상기 라이브러리 또는 라이브러리 캐치로부터 핵산 분자, 예를 들어, 종양 핵산 분자로부터 대상 구간에 대한 리드를 획득하는 것;
(d) 정렬 방법, 예를 들어, 본원에 기재된 정렬 방법에 의해 상기 리드를 정렬하는 것; 및
(e) 뉴클레오티드 위치에 대하여 상기 리드로부터의 뉴클레오티드 값을 배정하는 것 (예를 들어, 베이지안(Bayesian) 방법 또는 본원에 기재된 방법을 사용하여, 예를 들어, 돌연변이를 호출하는 것).
일부 실시양태에서, 상기 방법은 라이브러리를 적어도 2개 또는 3개 복수 개의 표적 포획 시약과 접촉시키는 것을 포함하며, 여기서 각각의 복수 개는 (복수 개 내의 다른 표적 포획 시약과는 대조적으로) 독특한 회수 효율을 갖는다. 예를 들어, 각각의 독특한 복수 개의 표적 포획 시약은 독특한 깊이의 시퀀싱을 초래하거나 또는 이와 상관관계가 있다.
한 실시양태에서, 상기 방법은 그로부터 서브게놈 구간에 상응하는 핵산 분자 및 발현된 서브게놈 구간에 상응하는 핵산 분자가 각각 수득되는 라이브러리를 획득하는 것을 포함한다. 한 실시양태에서, 상기 방법은 그로부터 서브게놈 구간에 상응하는 핵산 분자가 수득되는 제1 라이브러리를 획득하는 것, 및 그로부터 발현된 서브게놈 구간에 상응하는 핵산 분자가 수득되는 제2 라이브러리를 획득하는 것을 포함한다. 한 실시양태에서, 표적 포획 시약은 서브게놈 구간과 발현된 서브게놈 구간 둘 다를 포함하는 핵산 분자 또는 라이브러리 캐치를 제공하기 위해 사용된다. 한 실시양태에서, 제1 표적 포획 시약은 서브게놈 구간을 포함하는 핵산 분자 또는 라이브러리 캐치를 제공하기 위해 사용되고, 제2 표적 포획 시약은 발현된 서브게놈 구간을 포함하는 핵산 분자 또는 라이브러리 캐치를 제공하기 위해 사용된다.
한 실시양태에서, 제1 복수 개의 표적 포획 시약의 회수 효율은 제2 복수 개의 표적 포획 시약의 회수 효율과 적어도 2, 5, 10, 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배만큼 상이하다. 한 실시양태에서, 제1 및 제2 복수 개의 표적 포획 시약은 적어도 2, 5, 10, 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배만큼 상이한 시퀀싱의 깊이를 제공한다.
일부 실시양태에서, 본원에 사용된 바와 같은 시퀀싱 깊이의 수준 (예를 들어, 시퀀싱 깊이의 X배 수준)은 중복 리드, 예를 들어, PCR 중복 리드의 검출 및 제거 후, 리드 (예를 들어, 독특한 리드)의 수를 지칭한다. 다른 실시양태에서, 중복 리드는, 예를 들어, 카피 수 변경 (CNA)의 검출을 지원하기 위해 평가된다.
한 실시양태에서, 표적 포획 시약은 하나 이상의 재배열을 함유하는 대상 구간, 예를 들어, 게놈 재배열을 함유하는 인트론을 선택한다. 이러한 실시양태에서, 표적 포획 시약은 선택 효율을 증가시키기 위해 반복적인 서열이 마스킹되도록 설계된다. 재배열이 공지된 연접 서열을 갖는 실시양태에서, 상보적 표적 포획 시약은 선택 효율을 증가시키기 위해 연접 서열에 대해 설계될 수 있다.
일부 실시양태에서, 상기 방법은 각각의 범주가 상이한 설계 전략을 갖는, 2개 이상의 상이한 표적 범주를 포획하도록 설계된 표적 포획 시약을 사용하는 것을 포함한다. 일부 실시양태에서, 본원에 개시된 방법 (예를 들어, 혼성체 포획 방법) 및 조성물은 표적 서열 (예를 들어, 표적 핵산 분자)의 서브세트를 포획하고, 그러한 서브세트 외부의 커버리지를 최소화하면서 표적 서열의 동질적 커버리지를 제공한다. 한 실시양태에서, 표적 서열은 게놈 DNA로부터의 전체 엑솜 또는 그의 선택된 서브세트를 포함한다. 또 다른 실시양태에서, 표적 서열은 큰 염색체 영역, 예를 들어, 전체 염색체 아암을 포함한다. 본원에 개시된 방법 및 조성물은 복합 표적 핵산 서열 (예를 들어, 핵산 라이브러리)에 대한 상이한 시퀀싱 깊이 및 커버리지 패턴을 달성하기 위한 상이한 표적 포획 시약을 제공한다.
한 실시양태에서, 상기 방법은 1개 또는 복수 개의 핵산 라이브러리의 선택된 핵산 분자 (예를 들어, 라이브러리 캐치)를 제공하는 것을 포함한다. 예를 들어, 상기 방법은 하기를 포함한다:
복수 개의 핵산 분자, 예를 들어, 표적 핵산 분자 (예를 들어, 복수 개의 종양 핵산 분자 및/또는 참조 핵산 분자 포함)를 포함하는 1개 또는 복수 개의 라이브러리 (예를 들어, 1개 또는 복수 개의 핵산 라이브러리)를 제공하는 것;
예를 들어, 용액-기반 반응에서의 1개 또는 복수 개의 라이브러리를 2개, 3개 또는 그 초과 복수 개의 표적 포획 시약 (예를 들어, 올리고뉴클레오티드 표적 포획 시약)과 접촉시켜 복수 개의 표적 포획 시약/핵산 분자 혼성체를 포함하는 혼성화 혼합물을 형성하는 것;
예를 들어, 상기 혼성화 혼합물을, 복수 개의 표적 포획 시약/핵산 분자 혼성체를 혼성화 혼합물로부터 분리시키는 것을 허용하는 결합 실체와 접촉시킴으로써, 상기 복수 개의 표적 포획 시약/핵산 분자 혼성체를 상기 혼성화 혼합물로부터 분리시키는 것,
이에 의해 라이브러리 캐치 (예를 들어, 1개 또는 복수 개의 라이브러리로부터의 핵산 분자의 선택된 또는 강화된 하위 군)를 제공하는 것.
한 실시양태에서, 제1, 제2, 또는 제3 복수 개의 표적 포획 시약 각각은 독특한 회수 효율을 갖는다. 일부 실시양태에서, 적어도 2개, 또는 3개 모든 복수 개의 표적 포획 시약은 상이한 회수 효율 값을 갖는다. 예를 들어, 회수 효율에 대한 값은 하기 중 하나 이상으로부터 선택된다:
(i) 제1 회수 효율은 적어도 약 5,000X 이상의 시퀀싱 깊이인 값을 가지며, 예를 들어, 제2 또는 제3 회수 효율에 대한 값보다 더 큰 회수 효율에 대한 값을 갖거나 (예를 들어, 제2 회수 효율에 대한 값보다 약 5-10배 (예를 들어, 6-7배) 더 크거나; 또는 제3 회수 효율에 대한 값보다 약 40-60배 (예를 들어, 45-50배) 더 큼);
(ii) 제2 회수 효율은 적어도 약 800X 이상의 시퀀싱 깊이인 값을 가지며, 예를 들어, 제3 회수 효율에 대한 값보다 더 큰 회수 효율에 대한 값을 갖거나 (예를 들어, 제3 회수 효율에 대한 값보다 약 5-10배 (예를 들어, 7-9배) 더 큼); 또는
(iii) 제3 회수 효율은 적어도 약 100X 이상의 시퀀싱 깊이인 값을 갖는다.
특정 실시양태에서, 회수 효율에 대한 값은 하기 중 하나 이상에 의해 변형된다: 상이한 표적 포획 시약의 차등 표현, 표적 포획 시약 서브세트의 차등 중첩, 차등 표적 포획 시약 파라미터, 상이한 표적 포획 시약을 혼합하는 것 및/또는 상이한 유형의 표적 포획 시약을 사용하는 것. 예를 들어, 회수 효율에 있어서의 변이 (예를 들어, 각각의 표적 포획 시약/표적 범주의 상대적 서열 커버리지)는, 예를 들어, 하기 중 하나 이상을 변경시킴으로써, 복수 개의 표적 포획 시약 내에서 및/또는 상이한 복수 개의 표적 포획 시약 중에서 조정될 수 있다:
(i) 상이한 표적 포획 시약의 차등 표현 - 주어진 표적 (예를 들어, 표적 핵산 분자)을 포획하기 위한 표적 포획 시약 설계는 상대적 표적 시퀀싱 깊이를 증강/감소시키기 위해 더 많거나 더 적은 수의 카피에 포함될 수 있고;
(ii) 표적 포획 시약 서브세트의 차등 중첩 - 주어진 표적 (예를 들어, 표적 핵산 분자)을 포획하기 위한 표적 포획 시약 설계는 상대적 표적 시퀀싱 깊이를 증강/감소시키기 위해 이웃한 표적 포획 시약 간의 더 길거나 더 짧은 중첩을 포함할 수 있으며;
(iii) 차등 표적 포획 시약 파라미터 - 주어진 표적 (예를 들어, 표적 핵산 분자)을 포획하기 위한 표적 포획 시약 설계는 포획 효율을 감소시키고 상대적 표적 시퀀싱 깊이를 저하시키기 위해 서열 변형/더 짧은 길이를 포함할 수 있고;
(iv) 상이한 표적 포획 시약을 혼합하는 것 - 상이한 표적 세트를 포획하도록 설계되는 표적 포획 시약은 상대적 표적 시퀀싱 깊이를 증강/감소시키기 위해 상이한 몰 비로 혼합될 수 있으며;
(v) 상이하게 변형된 표적 포획 시약을 혼합하는 것 - 상이한 기질 결합 특성을 가지도록 변형된 표적 포획 시약은 상대적 표적 시퀀싱 깊이를 증강/감소시키기 위해 상이한 몰 비로 혼합될 수 있고;
(vi) 상이한 유형의 올리고뉴클레오티드 표적 포획 시약을 사용하는 것 - 특정 실시양태에서, 표적 포획 시약은 하기를 포함할 수 있다:
(a) 하나 이상의 화학적으로 (예를 들어, 비-효소적으로) 합성된 (예를 들어, 개별적으로 합성된) 표적 포획 시약,
(b) 어레이에서 합성된 하나 이상의 표적 포획 시약,
(c) 하나 이상의 효소적으로 제조된, 예를 들어, 시험관내 전사된 표적 포획 시약;
(d) (a), (b) 및/또는 (c)의 임의의 조합,
(e) 하나 이상의 DNA 올리고뉴클레오티드 (예를 들어, 자연적으로 또는 비-자연적으로 발생하는 DNA 올리고뉴클레오티드),
(f) 하나 이상의 RNA 올리고뉴클레오티드 (예를 들어, 자연적으로 또는 비-자연적으로 발생하는 RNA 올리고뉴클레오티드),
(g) (e)와 (f)의 조합, 또는
(h) 상기 중 임의의 것의 조합.
상이한 올리고뉴클레오티드 조합물은 상이한 비율, 예를 들어, 1:1, 1:2, 1:3, 1:4, 1:5, 1:10, 1:20, 1:50; 1:100, 1:1000 등으로부터 선택된 비율로 혼합될 수 있다. 한 실시양태에서, 화학적으로 합성된 표적 포획 시약 대 어레이 생성된 표적 포획 시약의 비율은 1:5, 1:10, 또는 1:20으로부터 선택된다. DNA 또는 RNA 올리고뉴클레오티드는 자연적으로 또는 비-자연적으로 발생할 수 있다. 특정 실시양태에서, 표적 포획 시약은, 예를 들어, 융점을 증가시키기 위해 하나 이상의 비-자연적으로 발생하는 뉴클레오티드를 포함한다. 예시적인 비-자연적으로 발생하는 올리고뉴클레오티드는 변형된 DNA 또는 RNA 뉴클레오티드를 포함한다. 예시적인 변형된 뉴클레오티드 (예를 들어, 변형된 RNA 또는 DNA 뉴클레오티드)는 잠금 핵산 (LNA) 뉴클레오티드의 리보스 모이어티가 2' 산소와 4' 탄소를 연결하는 여분의 브릿지로 변형되는 LNA; 펩티드 핵산 (PNA), 예를 들어, 펩티드 결합에 의해 연결된 반복하는 N-(2-아미노에틸)-글리신 단위로 구성된 PNA; 낮은 GC 영역을 포획하도록 변형된 DNA 또는 RNA 올리고뉴클레오티드; 바이사이클릭 핵산 (BNA); 가교 결합된 올리고뉴클레오티드; 변형된 5-메틸 데옥시시티딘; 및 2,6-디아미노퓨린을 포함하나, 이에 제한되지는 않는다. 다른 변형된 DNA 및 RNA 뉴클레오티드는 관련 기술분야에 공지되어 있다.
특정 실시양태에서, 표적 서열 (예를 들어, 표적 핵산 분자)의 실질적으로 균일하거나 또는 동질적인 커버리지가 수득된다. 예를 들어, 각각의 표적 포획 시약/표적 범주 내에서, 커버리지의 균일성은, 예를 들어, 하기 중 하나 이상에 의해, 표적 포획 시약 파라미터를 변형시킴으로써 최적화될 수 있다:
(i) 표적 포획 시약 표현 또는 중첩을 증가/감소시키는 것은, 동일한 범주의 다른 표적에 비해 과소/과다 커버되는 표적 (예를 들어, 표적 핵산 분자)의 커버리지를 증강/감소시키기 위해 사용될 수 있거나;
(ii) 표적 서열 (예를 들어, 높은 GC 함량 서열)을 포획하기 어려운 낮은 커버리지의 경우, 표적 포획 시약으로 표적화되는 영역을 확장하여, 예를 들어, 인접 서열 (예들 들어, GC가 덜 풍부한 인접 서열)을 커버하거나;
(iii) 표적 포획 시약 서열을 변형시키는 것은 표적 포획 시약의 2차 구조를 감소시키고 그의 회수 효율을 증강시키기 위해 사용될 수 있거나;
(iv) 표적 포획 시약 길이를 변형시키는 것은 동일한 범주 내에서 상이한 표적 포획 시약의 용융 혼성화 역학을 동등하게 하기 위해 사용될 수 있다. 표적 포획 시약 길이는 (다양한 길이를 갖는 표적 포획 시약을 생산함으로써) 직접적으로 변형될 수 있거나 또는 (일관된 길이의 표적 포획 시약을 생산하고 표적 포획 시약 단부를 임의의 서열로 대체함으로써) 간접적으로 변형될 수 있거나;
(v) 동일한 표적 영역에 대해 상이한 배향 (즉, 정방향 및 역방향 가닥)의 표적 포획 시약을 변형하는 것은 상이한 결합 효율을 가질 수 있다. 각각의 표적에 대해 최적의 커버리지를 제공하는 배향 중 하나를 가진 표적 포획 시약을 선택할 수 있거나;
(vi) 각각의 표적 포획 시약에 존재하는 결합 실체, 예를 들어, 포획 태그 (예를 들어, 비오틴)의 양을 변형시키는 것이 그의 결합 효율에 영향을 미칠 수 있다. 특이적 표적을 표적으로 하는 표적 포획 시약의 태그 수준을 증가/감소시키는 것은 상대적 표적 커버리지를 증강/감소시키기 위해 사용될 수 있거나;
(vii) 상이한 표적 포획 시약에 사용되는 뉴클레오티드 유형을 변형시키는 것은 표적에 대한 결합 친화도에 영향을 미치고 상대적 표적 커버리지를 증강/감소시키기 위해 사용될 수 있거나; 또는
(viii) 예를 들어, 보다 안정적인 염기 쌍형성을 갖는 변형된 올리고뉴클레오티드 표적 포획 시약을 사용하여, 높은 GC 함량에 비해 낮거나 또는 정상적인 GC 함량 영역 간의 용융 혼성화 역학을 균등하게 할 수 있다.
다른 실시양태에서, 회수 효율은 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약과 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약의 상대 존재도를 조정함으로써 조정된다. 일부 실시양태에서, 결합 쌍의 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으므로, 결합 쌍의 제1 구성원을 포함하는 표적 포획 시약에 의해 포획된 표적 핵산 분자가 결합 쌍의 제2 구성원을 포함하는 기질에 의해 회수된다.
한 실시양태에서, 상기 방법은 종양 핵산 분자, 예를 들어, 종양 세포로부터의 대상 구간을 포함하는 핵산 분자를 선택하는 표적 포획 시약을 포함하는 복수 개의 표적 포획 시약을 사용하는 것을 포함한다. 종양 핵산 분자는 종양 세포에 존재하는 임의의 뉴클레오티드 서열, 예를 들어, 종양 또는 암 세포에 존재하는, 본원에 기재된 바와 같은 돌연변이된, 야생형, 참조 또는 인트론 뉴클레오티드 서열일 수 있다. 한 실시양태에서, 종양 핵산 분자는 낮은 빈도로 나타나는 변경 (예를 들어, 하나 이상의 돌연변이)을 포함하며, 예를 들어, 샘플로부터의 세포의 약 5% 이하가 자신의 게놈에 변경을 정착시킨다. 다른 실시양태에서, 종양 핵산 분자는 샘플로부터의 세포의 약 10%의 빈도로 나타나는 변경 (예를 들어, 하나 이상의 돌연변이)을 포함한다. 다른 실시양태에서, 종양 핵산 분자는 종양 세포에 존재하는 참조 서열인 인트론 서열, 예를 들어, 본원에 기재된 바와 같은 인트론 서열로부터의 서브게놈 구간을 포함한다.
다른 실시양태에서, 상기 방법은 라이브러리 캐치를 증폭시키는 것을 포함한다 (예를 들어, PCR에 의함). 다른 실시양태에서, 라이브러리 캐치는 증폭되지 않는다.
또 다른 측면에서, 본 발명은 본원에 기재된 표적 포획 시약 및 본원에 기재된 개별 복수 개의 표적 포획 시약의 조합을 특징으로 한다. 표적 포획 시약은 지침서, 표준 물질, 완충액 또는 효소 또는 다른 시약을 임의로 포함할 수 있는 키트의 부분일 수 있다.
정렬
본원에 개시된 방법은 시퀀싱 방법, 특히 다수의 다양한 유전자에서 다수의 다양한 유전적 이벤트의 대량 병렬 시퀀싱에 의존하는 방법, 예를 들어, 본원에 기재된 암으로부터의 샘플을 분석하는 방법에서 성능을 최적화하기 위해 개별적으로 조정된 다수의 정렬 방법 또는 알고리즘의 사용을 통합할 수 있다.
일부 실시양태에서, 리드를 분석하는데 사용되는 정렬 방법은 상이한 유전자 내의 다수의 변이체 각각으로 개별적으로 맞춤화되지 않거나 또는 조정되지 않는다. 일부 실시양태에서, 상이한 유전자 내의 다수의 변이체의 적어도 서브세트로 개별적으로 맞춤화되거나 또는 조정되는 다수의 정렬 방법이 리드를 분석하는데 사용된다. 일부 실시양태에서, 상이한 유전자 내의 다수의 변이체 각각으로 개별적으로 맞춤화되거나 또는 조정되는 다수의 정렬 방법이 리드를 분석하는데 사용된다. 일부 실시양태에서, 조정하는 것은 시퀀싱되는 유전자 (또는 다른 대상 구간), 샘플 중의 종양 유형, 시퀀싱되는 변이체, 또는 샘플 또는 대상체의 특징 중 하나 이상의 함수일 수 있다. 시퀀싱될 다수의 대상 구간으로 개별적으로 조정되는 정렬 조건을 선택하거나 사용하면, 속도, 감도 및 특이성을 최적화할 수 있다. 상기 방법은 비교적 많은 수의 다양한 대상 구간에 대한 리드의 정렬이 최적화된 경우에 특히 유효하다.
일부 실시양태에서, X개의 독특한 대상 구간 각각으로부터의 리드는 독특한 정렬 방법으로 정렬되며, 여기서 독특한 대상 구간 (예를 들어, 대상 구간 또는 발현된 대상 구간)은 다른 X-1개의 대상 구간과 상이한 것을 의미하고, 독특한 정렬 방법은 다른 X-1개의 정렬 방법과 상이하다는 것을 의미하고, X는 적어도 2이다.
한 실시양태에서, 적어도 X개의 유전자, 예를 들어 표 1A-5A로부터의 적어도 X개의 유전자로부터의 대상 구간은 독특한 정렬 방법으로 정렬되고, X는 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 또는 그 초과이다.
한 실시양태에서, 방법은 리드를 분석, 예를 들어, 정렬하기 위한 정렬 방법을 선택하거나 또는 사용하는 것을 포함하며, 여기서 상기 정렬 방법은 하기 중 하나 이상 또는 모두의 함수이거나, 이에 대응하여 선택되거나, 또는 이에 대해 최적화된다:
(i) 종양 유형, 예를 들어, 상기 샘플 중의 종양 유형;
(ii) 시퀀싱되는 상기 대상 구간 (예를 들어, 대상 구간 또는 발현된 대상 구간)이 위치하는 유전자, 또는 유전자 유형, 예를 들어, 변이체 또는 변이체 유형, 예를 들어, 돌연변이, 또는 특정 빈도의 돌연변이를 특징으로 하는 유전자 또는 유전자 유형;
(iii) 분석되는 위치 (예를 들어, 뉴클레오티드 위치);
(iv) 평가되는 대상 구간 (예를 들어, 대상 구간 또는 발현된 대상 구간) 내의 변이체 유형, 예를 들어, 치환;
(v) 샘플, 예를 들어, 본원에 기재된 샘플의 유형; 및
(vi) 평가되는 상기 대상 구간 내 또는 근처의 서열, 예를 들어, 상기 대상 구간 (예를 들어, 대상 구간 또는 발현된 대상 구간)에 대한 정렬 오류에 대해 예상되는 성향, 예를 들어, 상기 대상 구간 (예를 들어, 대상 구간 또는 발현된 대상 구간) 내 또는 근처에서 반복되는 서열의 존재.
본원의 다른 곳에서 언급되는 바와 같이, 일부 실시양태에서, 방법은 비교적 많은 수의 대상 구간에 대한 리드의 정렬이 최적화될 때 특히 유효하다. 따라서, 한 실시양태에서, 적어도 X개의 독특한 정렬 방법이 적어도 X개의 독특한 대상 구간에 대한 리드를 분석하는데 사용되며, 여기서 독특하다는 것은 다른 X-1과 상이하다는 것을 의미하고, X는 2, 3, 4, 5, 10, 15, 20, 30, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1,000, 또는 그 초과이다.
한 실시양태에서, 표 1A-5A로부터의 적어도 X개 유전자로부터의 대상 구간이 분석되며, X는 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 또는 그 초과이다.
한 실시양태에서, 독특한 정렬 방법은 적어도 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 또는 500개의 상이한 유전자 각각에서 대상 구간에 적용된다.
한 실시양태에서, 적어도 20, 30, 40, 60, 80, 100, 120, 140, 160 또는 180, 200, 300, 400, 또는 500개의 유전자, 예를 들어, 표 1A-5A로부터의 유전자 내의 뉴클레오티드 위치가 뉴클레오티드 값을 배정한다. 한 실시양태에서, 독특한 정렬 방법은 분석된 상기 유전자의 적어도 10%, 20%, 30%, 40%, 또는 50% 각각에서 대상 구간에 적용된다.
본원에 개시된 방법은 다루기 힘든 리드, 예를 들어, 재배열을 갖는 리드의 빠르고 효율적인 정렬을 허용한다. 따라서, 대상 구간 (예를 들어, 대상 구간 또는 발현된 대상 구간)에 대한 리드가 재배열, 예를 들어, 전위를 갖는 뉴클레오티드 위치를 포함하는 실시양태에서, 상기 방법은 적절하게 조정되고 하기를 포함하는 정렬 방법을 사용하는 것을 포함할 수 있다:
리드와의 정렬을 위한 재배열 참조 서열을 선택하며, 여기서 상기 재배열 참조 서열이 재배열과 정렬되는 것 (일부 실시양태에서, 참조 서열은 게놈 재배열과 동일하지 않음); 및
리드를 상기 재배열 참조 서열과 비교하는 것, 예를 들어, 그와 정렬하는 것.
일부 실시양태에서, 다루기 힘든 리드를 정렬하기 위해 상이한 방법, 예를 들어, 또 다른 방법이 사용된다. 이러한 방법은 비교적 많은 수의 다양한 대상 구간에 대한 리드의 정렬이 최적화될 때 특히 유효하다. 예로서, 샘플을 분석하는 방법은 하기를 포함할 수 있다:
제1 세트의 파라미터 (예를 들어, 제1 맵핑 알고리즘 또는 제1 참조 서열을 이용함) 하에서 리드의 비교, 예를 들어, 정렬 비교를 수행하는 것, 및
상기 리드가 제1 정렬 기준을 충족하는지 (예를 들어, 리드가 상기 제1 참조 서열과 정렬될 수 있는지, 예를 들어, 미스매치 수 미만으로 정렬될 수 있는지)를 결정하는 것;
상기 리드가 제1 정렬 기준을 충족하지 못하는 경우, 제2 세트의 파라미터 (예를 들어, 제2 맵핑 알고리즘 또는 제2 참조 서열을 이용함) 하에서 제2 정렬 비교를 수행하는 것; 및
임의로, 상기 리드가 상기 제2 기준을 충족하는지 (예를 들어, 리드가 상기 제2 참조 서열과 미리 정의된 미스매치 수 미만으로 정렬될 수 있는지)를 결정하는 것으로서,
여기서 상기 제2 세트의 파라미터는 일정 세트의 파라미터, 예를 들어, 상기 제2 참조 서열의 사용을 포함하며, 이는 상기 제1 세트의 파라미터와 비교해서, 변이체, 예를 들어, 재배열, 예를 들어, 삽입, 결실, 또는 전위에 대한 리드와의 정렬을 초래할 가능성이 더 크다.
이들 및 다른 정렬 방법은 본원의 다른 곳에서, 예를 들어, 발명을 실시하기 위한 구체적인 내용에서 "정렬"이라는 제목의 섹션에 더 상세히 논의된다. 그러한 모듈의 요소는 종양을 분석하는 방법에 포함될 수 있다. 실시양태에서, (발명의 내용 및/또는 발명을 실시하기 위한 구체적인 내용에서) "정렬"이라는 제목의 섹션으로부터의 정렬 방법은 (발명의 내용 및/또는 발명을 실시하기 위한 구체적인 내용에서) "돌연변이 호출"이란 제목의 섹션으로부터의 돌연변이 호출 방법 및/또는 (발명의 내용에서) "표적 포획 시약"이란 제목의 섹션 및/또는 (발명을 실시하기 위한 구체적인 내용에서) "표적 포획 시약의 설계 및 구축" 및 "표적 포획 시약의 경쟁"이란 제목의 섹션으로부터의 표적 포획 시약과 조합된다. 상기 방법은 (발명의 내용 및/또는 발명을 실시하기 위한 구체적인 내용에서) "유전자 선택"이라는 제목의 섹션으로부터의 대상 구간 세트에 적용할 수 있다.
돌연변이 호출
본원에 개시된 방법은 시퀀싱 방법, 특히, 예를 들어, 샘플로부터, 예를 들어, 본원에 기재된 암으로부터의 많은 수의 다양한 유전자에서 많은 수의 다양한 유전적 이벤트의 대량 병렬 시퀀싱에 의존하는 방법에서 성능을 최적화하기 위해 맞춤화되거나 또는 조정된 돌연변이 호출 파라미터의 사용을 통합할 수 있다.
이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서 돌연변이 호출은 관찰되는 비-참조 변경, 예를 들어, 본원에 기재된 변경에 대한 예상 확률을 결정하는 것으로 여겨진다. 돌연변이 호출은 전형적으로, 호출된 변경이 시퀀싱 또는 분석 프로세스의 노이즈 또는 다른 인공물의 결과가 아니라 실제라는 충분한 확신을 제공하기 위해 확립된 임계 값을 기반으로 한다.
일부 실시양태에서, 다수의 대상 구간 각각에 대한 돌연변이 호출은 개별적으로 맞춤화되지 않거나 또는 미세-조정되지 않는다. 일부 실시양태에서, 다수의 대상 구간의 적어도 서브세트에 대한 돌연변이 호출은 개별적으로 맞춤화되거나 또는 미세-조정된다. 일부 실시양태에서, 다수의 대상 구간 각각에 대한 돌연변이 호출은 개별적으로 맞춤화되거나 또는 미세-조정된다. 맞춤화 또는 조정은 본원에 기재된 인자, 예를 들어, 샘플 중의 암의 유형, 시퀀싱될 대상 구간이 위치하는 유전자, 또는 시퀀싱될 변이체 중 하나 이상에 기반할 수 있다. 이러한 정렬 조건의 선택 또는 사용은 시퀀싱될 다수의 대상 구간으로 미세-조정되어 속도, 감도 및 특이성을 최적화할 수 있다. 상기 방법은 비교적 많은 수의 다양한 대상 구간에 대한 리드의 정렬이 최적화될 때 특히 유효하다.
일부 실시양태에서, 뉴클레오티드 값은 독특한 호출 방법에 의해 X개의 독특한 대상 구간 각각에서의 뉴클레오티드 위치에 배정되며, 여기서 독특한 대상 구간은 다른 X-1개의 대상 구간 (예를 들어, 서브게놈 구간, 발현된 서브게놈 구간, 또는 둘 다)과 상이하다는 것을 의미하고, 독특한 호출 방법은 다른 X-1개의 호출 방법과 상이하다는 것을 의미하며, X는 적어도 2이다. 호출 방법은 상이할 수 있으며, 이에 의해, 예를 들어, 상이한 베이지안 이전의 값에 의존함으로써 독특할 수 있다.
한 실시양태에서, 상기 뉴클레오티드 값을 배정하는 것은 특정 종양 유형 내의 상기 뉴클레오티드 위치에서, 변이체, 예를 들어, 돌연변이를 제시하는 리드를 관찰하는 이전의 (예를 들어, 문헌) 예상치이거나 또는 이를 나타내는 값의 함수이다.
한 실시양태에서, 상기 방법은 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개 뉴클레오티드 위치에 대해 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)을 포함하며, 여기서 각각의 배정은 특정 종양 유형 내의 상기 뉴클레오티드 위치에서, 변이체, 예를 들어, 돌연변이를 제시하는 리드를 관찰하는 이전의 (예를 들어, 문헌) 예상치이거나 또는 이를 나타내는 (다른 배정에 대한 값과는 대조적으로) 독특한 값의 함수이다.
한 실시양태에서, 상기 뉴클레오티드 값을 배정하는 것은 변이체가 샘플에 특정 빈도 (예를 들어, 1%, 5%, 10% 등)로 존재하는 경우 및/또는 변이체가 부재하는 경우 (예를 들어, 염기 호출 오류 단독으로 인해 리드에서 관찰됨) 상기 뉴클레오티드 위치에서 상기 변이체를 제시하는 리드를 관찰할 확률을 나타내는 값 세트의 함수이다.
한 실시양태에서, 본원에 기재된 돌연변이 호출 방법은 하기를 포함할 수 있다:
상기 X개 대상 구간 각각에서의 뉴클레오티드 위치에 대해, 하기를 획득하는 것:
(i) 특정 종양 유형 내의 X개의 상기 뉴클레오티드 위치에서, 변이체, 예를 들어, 돌연변이를 제시하는 리드를 관찰하는 이전의 (예를 들어, 문헌) 예상치이거나 또는 이를 나타내는 제1 값; 및
(ii) 변이체가 샘플에 특정 빈도 (예를 들어, 1%, 5%, 10% 등)로 존재하는 경우 및/또는 변이체가 부재하는 경우 (예를 들어, 염기 호출 오류 단독으로 인해 리드에서 관찰됨) 상기 뉴클레오티드 위치에서 상기 변이체를 제시하는 리드를 관찰할 확률을 나타내는 제2 세트의 값;
상기 값에 대응하여, 예를 들어, 본원에 기재된 베이지안 방법에 의해, 제1 값을 사용하여 제2 세트 내의 값들의 비교를 칭량 (예를 들어, 돌연변이의 존재의 사후 확률을 계산함)함으로써 상기 뉴클레오티드 위치 각각에 대한 상기 리드로부터 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것), 이에 의해 상기 샘플을 분석하는 것.
한 실시양태에서, 상기 방법은 하기 중 하나 이상 또는 모두를 포함한다:
(i) 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개 뉴클레오티드 위치에 대해 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 여기서 각각의 배정은 (다른 배정과는 대조적으로) 독특한 제1 및/또는 제2 값에 기반하고;
(ii) (i)의 방법의 배정으로서, 여기서 배정의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 또는 500개가, 예를 들어, 종양 유형의 세포 중 5%, 10%, 또는 20% 미만에 존재하는 변이체의 확률의 함수인 제1 값을 이용하여 만들어지며;
(iii) 각각 특정 유형의 종양, 예를 들어, 상기 샘플의 종양 유형에 존재하는 (다른 X-1개 배정과는 대조적으로) 독특한 확률을 갖는 변이체와 연합되는, 적어도 X개 뉴클레오티드 위치에 대해 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 여기서 임의로, 상기 X개 배정 각각은 (다른 X-1개 배정과는 대조적으로) 독특한 제1 및/또는 제2 값에 기반하며 (여기서 X=2, 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 또는 500임);
(iv) 제1 및 제2 뉴클레오티드 위치에서 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 여기서 종양 유형 (예를 들어, 상기 샘플의 종양 유형)에 존재하는 상기 제1 뉴클레오티드 위치에서의 제1 변이체의 가능성이, 존재하는 상기 제2 뉴클레오티드 위치에서의 제2 변이체의 가능성보다 적어도 2, 5, 10, 20, 30, 또는 40배 더 크고, 임의로, 각각의 배정이 (다른 배정과는 대조적으로) 독특한 제1 및/또는 제2 값에 기반하며;
(v) 뉴클레오티드 값을 복수 개의 뉴클레오티드 위치에 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 여기서 상기 복수 개가 하기 확률 백분율 범위 중 하나 이상, 예를 들어, 적어도 3, 4, 5, 6, 7개, 또는 모두에 속하는 변이체에 대한 배정을 포함하고: 0.01% 이하; 0.01% 초과 0.02% 이하; 0.02% 초과 0.03% 이하; 0.03% 초과 0.04%이하; 0.04% 초과 0.05% 이하; 0.05% 초과 0.1% 이하; 0.1% 초과 0.2% 이하; 0.2% 초과 0.5% 이하; 0.5% 초과 1.0% 이하; 1.0% 초과 2.0% 이하; 2.0% 초과 5.0% 이하; 5.0% 초과 10.0% 이하; 10.0% 초과 20.0% 이하; 20.0% 초과 50.0% 이하; 및 50% 초과 100.0% 이하,
여기서 확률 범위는 뉴클레오티드 위치에서의 변이체가 종양 유형 (예를 들어, 상기 샘플의 종양 유형)에 존재할 확률의 범위이거나, 또는 뉴클레오티드 위치에서의 변이체가, 미리 선택된 유형 (예를 들어, 상기 샘플의 종양 유형)에 대하여, 샘플, 샘플로부터의 라이브러리 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 세포의 나열된 백분율 (%)로 존재할 확률이며,
여기서 임의로, 각각의 배정은 독특한 제1 및/또는 제2 값 (예를 들어, 나열된 확률 범위에서의 다른 배정과는 대조적으로 독특하거나 또는 다른 열거된 확률 범위 중 하나 이상 또는 모두에 대한 제1 및/또는 제2 값과는 대조적으로 독특함)에 기반하며;
(vi) 각각 독립적으로, 상기 샘플 중의 DNA의 50%, 40%, 25%, 20%, 15%, 10%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.4%, 0.3%, 0.2%, 또는 0.1% 미만에 존재하는 변이체를 갖는, 적어도 1, 2, 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개 뉴클레오티드 위치에 대해 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 여기서 임의로, 각각의 배정은 (다른 배정과는 대조적으로) 독특한 제1 및/또는 제2 값에 기반하고;
(vii) 제1 및 제2 뉴클레오티드 위치에서 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 여기서 상기 샘플의 DNA 내의 제1 위치에서의 변이체의 가능성은 상기 샘플의 DNA 내의 상기 제2 뉴클레오티드 위치에서의 변이체의 가능성보다 적어도 2, 5, 10, 20, 30, 또는 40배 더 크고, 여기서 임의로, 각각의 배정은 (다른 배정과는 대조적으로) 독특한 제1 및/또는 제2 값에 기반하며;
(viii) 하기 중 하나 이상 또는 모두에서 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것):
(1) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 1% 미만에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(2) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 1 내지 2%에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(3) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 2% 초과 3% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(4) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 3% 초과 4% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(5) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 4% 초과 5% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(6) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 5% 초과 10% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(7) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 10% 초과 20% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(8) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 20% 초과 40% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
(9) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 40% 초과 50% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치; 또는
(10) 상기 샘플 중의 세포, 상기 샘플로부터의 라이브러리 중의 핵산, 또는 그러한 라이브러리로부터의 라이브러리 캐치 중의 핵산의 50% 초과 100% 이하에 존재하는 변이체를 갖는 적어도 1, 2, 3, 4 또는 5개 뉴클레오티드 위치;
여기서 임의로, 각각의 배정은 독특한 제1 및/또는 제2 값 (예를 들어, 나열된 범위 (예를 들어, 1% 미만의 (1)에서의 범위)에서의 다른 배정과는 대조적으로 독특하거나 또는 다른 열거된 범위 중 하나 이상 또는 모두에서의 결정을 위한 제1 및/또는 제2 값과는 대조적으로 독특함)에 기반하거나; 또는
(ix) X개 뉴클레오티드 위치 각각에서 뉴클레오티드 값을 배정하는 것 (예를 들어, 돌연변이를 호출하는 것)으로서, 각각의 뉴클레오티드 위치는 독립적으로, 다른 X-1개 뉴클레오티드 위치에서의 변이체에 대한 가능성과 비교 시 독특한 (상기 샘플의 DNA에 존재하는 변이체의) 가능성을 가지며, 여기서 X는 1, 2, 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000 이상이고, 각각의 배정은 (다른 배정과는 대조적으로) 독특한 제1 및/또는 제2 값에 기반한다.
일부 실시양태에서, "임계 값"은 리드를 평가하고, 이러한 리드로부터 뉴클레오티드 위치에 대한 값을 선택하며, 예를 들어, 유전자 내의 특이적 위치에서의 돌연변이를 호출한다. 일부 실시양태에서, 다수의 대상 구간 각각에 대한 임계 값은 맞춤화되거나 또는 미세-조정된다. 맞춤화 또는 조정은 본원에 기재된 인자, 예를 들어, 샘플 중의 암의 유형, 시퀀싱될 대상 구간 (서브게놈 구간 또는 발현된 서브게놈 구간)이 위치하는 유전자, 또는 시퀀싱될 변이체 중 하나 이상에 기반할 수 있다. 이것은 시퀀싱될 다수의 대상 구간 각각에 미세하게 조정되는 호출을 제공한다. 일부 실시양태에서, 상기 방법은 비교적 많은 수의 다양한 서브게놈 구간이 분석될 때 특히 유효하다.
따라서, 또 다른 실시양태에서, 상기 방법은 하기 돌연변이 호출 방법을 포함한다:
상기 X개 대상 구간 각각에 대하여, 임계 값을 획득하는 것으로서, 여기서 상기 획득된 X개 임계 값 각각은 다른 X-1개 임계 값과 비교 시 독특하며, 이에 의해 X개의 독특한 임계 값을 제공하는 것;
상기 X개 대상 구간 각각에 대하여, 뉴클레오티드 위치에서의 뉴클레오티드 값을 갖는 리드의 수의 함수인 관찰된 값을, 그의 독특한 임계 값과 비교하며, 이에 의해 상기 X개 대상 구간 각각에 그의 독특한 임계 값을 적용하는 것; 및
임의로, 상기 비교 결과에 대응하여, 뉴클레오티드 값을 뉴클레오티드 위치에 배정하는 것으로서,
여기서 X는 2 이상이다.
한 실시양태에서, 상기 방법은 뉴클레오티드 값을 적어도 2, 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개 뉴클레오티드 위치에 배정하는 것을 포함하며, 각각은 독립적으로, 0.5, 0.4, 0.25, 0.15, 0.10, 0.05, 0.04, 0.03, 0.02, 또는 0.01 미만인 확률의 함수인 제1 값을 갖는다.
한 실시양태에서, 상기 방법은 뉴클레오티드 값을 적어도 X개 뉴클레오티드 위치 각각에 배정하는 것을 포함하며, 각각은 독립적으로, 다른 X-1개 제1 값과 비교 시 독특한 제1 값을 가지며, 여기서 상기 X개 제1 값 각각은 0.5, 0.4, 0.25, 0.15, 0.10, 0.05, 0.04, 0.03, 0.02, 또는 0.01 미만인 확률의 함수이고, 여기서 X는 1, 2, 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000 이상이다.
한 실시양태에서, 적어도 20, 30, 40, 60, 80, 100, 120, 140, 160 또는 180, 200, 300, 400, 또는 500개 유전자, 예를 들어, 표 1A-5A로부터의 유전자 내의 뉴클레오티드 위치가 뉴클레오티드 값을 배정한다. 한 실시양태에서, 독특한 제1 및/또는 제2 값은 분석된 상기 유전자의 적어도 10%, 20%, 30%, 40%, 또는 50% 각각에서 대상 구간에 적용된다.
예를 들어, 하기 실시양태로부터 알 수 있는 바와 같이, 비교적 많은 수의 대상 구간에 대한 임계 값이 최적화되는 상기 방법의 실시양태가 적용될 수 있다.
한 실시양태에서, 독특한 임계 값은 적어도 3, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개의 상이한 유전자 각각에서, 대상 구간, 예를 들어, 서브게놈 구간 또는 발현된 서브게놈 구간에 적용된다.
한 실시양태에서, 적어도 20, 30, 40, 60, 80, 100, 120, 140, 160 또는 180, 200, 300, 400, 또는 500개의 유전자, 예를 들어, 표 1A-5A로부터의 유전자 내의 뉴클레오티드 위치가 뉴클레오티드 값을 배정한다. 한 실시양태에서, 독특한 임계 값은 분석된 상기 유전자의 적어도 10%, 20%, 30%, 40%, 또는 50% 각각에서 서브게놈 구간에 적용된다.
한 실시양태에서, 표 1A-5A로부터의 적어도 5, 10, 20, 30, 또는 40개의 유전자 내의 뉴클레오티드 위치가 뉴클레오티드 값을 배정한다. 한 실시양태에서, 독특한 임계 값은 분석된 상기 유전자의 적어도 10%, 20%, 30%, 40%, 또는 50% 각각에서 대상 구간 (예를 들어, 서브게놈 구간 또는 발현된 서브게놈 구간)에 적용된다.
이들 및 다른 돌연변이 호출 방법은 본원의 다른 곳, 예를 들어, "돌연변이 호출"이란 제목의 섹션에서 보다 상세히 논의된다. 그 모듈의 요소는 종양을 분석하는 방법에 포함될 수 있다. 실시양태에서, "돌연변이 호출"이란 제목의 섹션으로부터의 정렬 방법은 (발명의 내용 및/또는 발명을 실시하기 위한 구체적인 내용에서) "정렬"이라는 제목의 섹션으로부터의 정렬 방법 및/또는 (발명의 내용에서) "표적 포획 시약"이란 제목의 섹션 및/또는 (발명을 실시하기 위한 구체적인 내용에서) "표적 포획 시약의 설계 및 구축" 및 "표적 포획 시약의 경쟁"이란 제목의 섹션으로부터의 표적 포획 시약과 조합된다. 상기 방법은 (발명의 내용 및/또는 발명을 실시하기 위한 구체적인 내용에서) "유전자 선택"이라는 제목의 섹션으로부터 대상 구간 세트에 적용할 수 있다.
SGZ 분석
특정 실시양태에서, 본원에 기재된 방법에 따라서 평가된 변경은 배선 변경이다. 특정 실시양태에서, 배선 변경은 SGZ 알고리즘 (예를 들어, 문헌 [Sun et al. PLoS Comput Biol. 2018; 14(2):e1005965] 및 미국 특허 번호 9,792,403에 기재된 바와 같음)에 의해 확인된다. 예를 들어, 종양 돌연변이 부담이 평가될 때, 배선 변경은 SGZ 알고리즘의 사용을 포함하는 방법 또는 시스템에 의해 제외될 수 있다.
특정 실시양태에서, 상기 방법은 대상체로부터의 샘플 중의 변이체를 체세포 또는 배선 이벤트인 것으로서 특징규명하는 것을 추가로 포함하며, 상기 방법은 하기를 포함한다:
a) 복수 개의 선택된 대상 구간 각각, 복수 개의 선택된 배선 SNP 각각, 및 변이체를 시퀀싱하는 것;
b) 하기를 획득하는 것:
i) 복수 개의 선택된 대상 구간 각각에 대해, 선택된 대상 구간에서 정규화된 서열 커버리지에 대한 값을 포함하는 서열 커버리지 입력 (SCI)으로서, 여기서 SCI는 대상 구간에 대한 리드의 수와 프로세스 매칭된 대조군에 대한 리드의 수를 비교하는 것을 포함하는 것;
ii) 복수 개의 선택된 배선 SNP 각각에 대해, 샘플 중의 소수 대립유전자 빈도에 대한 값을 포함하는 SNP 대립유전자 빈도 입력 (SAFI); 및
iii) 특징규명되는 상기 변이체의 경우, 샘플 중의 상기 변이체에 대한 대립유전자 빈도를 포함하는 변이체 대립유전자 빈도 입력 (VAFI);
c) 하기에 대한 값을 SCI 및 SAFI의 함수로서 획득하는 것으로서:
복수 개의 게놈 세그먼트 각각에 대한 게놈 세그먼트 총 카피 수 (C);
복수 개의 게놈 세그먼트 각각에 대한 게놈 세그먼트 소수 대립유전자 카피 수 (M); 및
샘플 순도 (p),
여기서 SCI, SAFI, C, M, 및 p는, SCI 및 SAFI가 각각 r ij f ik 로서 각각 표기될 때 하기에 의해 서로 관련이 있으며:
Figure pct00001
여기서 r ij 는 게놈 세그먼트 (S i ) 내에서 대상 구간 j의 로그 비율 (LR)이고, C i S i 의 총 카피 수 (C)이며, l i S i 의 길이이고, f ik S i 내의 SNP k의 소수 대립유전자 빈도이며, M i S i 에서 소수 대립유전자 (M)의 카피 수이고 σ ri σ fi 는 노이즈 파라미터인 것; 및
d) 돌연변이 유형 g에 대한 값을 획득하는 것으로서, 이는 변이체, 체세포, 서브클로날 체세포 변이체, 배선 또는 구별가능하지 않다는 것을 표시하며, 여기서 g, VAFI, p, C 및 M은 하기에 의해 서로 관련된다;
Figure pct00002
일부 실시양태에서, 0 또는 0에 가까운 g 값은 변이체가 체세포 변이체라는 것을 나타내고; 1 또는 1에 가까운 g 값은 변이체가 배선 변이체라는 것을 나타내며; 1보다 작지만 0보다 큰 g 값은 구별할 수 없는 결과를 나타내고; 0보다 상당히 작은 g 값은 변이체가 서브클로날 체세포 변이체라는 것을 나타낸다.
일부 실시양태에서, 샘플 순도 (p)는 포괄적인 순도 값이다.
일부 실시양태에서, 0과 같고 C와 같지 않은 M 값은 변이체의 부재를 나타내고; C와 동일한 M의 비-제로 값은 변이체의 동형접합성을 나타내며; 0 및 C와 동일한 M 값은 변이체의 동형접합성 결실을 나타내고; C와 같지 않은 M의 비-제로 값은 변이체의 이형접합성을 나타낸다.
일부 실시양태에서, 복수 개의 선택된 대상 구간은 엑손을 포함한다. 일부 실시양태에서, 변이체는 대상체에 존재하는 종양의 유형과 긍정적으로 연관이 있다. 일부 실시양태에서, 상기 방법은 샘플 중의 변이체의 접합성의 지표를 획득하는 것을 추가로 포함한다. 일부 실시양태에서, 돌연변이 유형 g에 대한 값은 대상체 매칭된 정상 대조군의 사용 없이 획득된다. 일부 실시양태에서, 정규화 이전의 평균 시퀀싱 깊이는 적어도 약 100X, 250X, 500X, 800X, 1,000X, 1,500X, 2,000X, 2,500X, 3,000X, 3,500X, 4,000X, 4.500X, 5,000X, 5,500X, 6,000X, 6,500X, 7,000X, 7,500X, 또는 8,000X이다.
종양 돌연변이 부담
본원에 기재된 방법 및 조성물은 종양 돌연변이 부담을 평가하기 위해 사용될 수 있다.
특정 실시양태에서, 상기 방법은 샘플 (예를 들어, 본원에 기재된 샘플)로부터 서브게놈 구간 세트의 서열을 제공하는 것; 및 돌연변이 부담에 대한 값을 결정하는 것으로서, 여기서 이러한 값이 서브게놈 구간 세트에서의 변경 횟수의 함수인 것을 포함한다. 특정 실시양태에서, 서브게놈 구간 세트는 유전자 세트, 예를 들어, 전체 게놈 또는 엑솜을 포함하지 않는 유전자 세트로부터의 것이다. 특정 실시양태에서, 서브게놈 구간 세트는 코딩 서브게놈 구간 세트이다. 다른 실시양태에서, 서브게놈 구간 세트는 하나 이상의 코딩 서브게놈 구간 및 하나 이상의 비-코딩 서브게놈 구간을 함유한다. 특정 실시양태에서, 돌연변이 부담에 대한 값은 서브게놈 구간 세트 내의 변경 (예를 들어, 체세포 변경) 횟수의 함수이다. 특정 실시양태에서, 변경 횟수는 기능적 변경, 배선 변경, 또는 둘 다의 횟수를 제외한다.
본원에 기재된 방법은 또한, 예를 들어, 하기 중 하나 이상을 포함할 수 있다: 샘플로부터 복수 개의 종양 핵산 분자를 포함하는 라이브러리를 획득하는 것; 라이브러리를 표적 포획 시약과 접촉시켜 혼성화에 의해 선택된 종양 핵산 분자를 제공하며, 이에 의해 라이브러리 캐치를 제공하는 것; 라이브러리 캐치로부터 종양 핵산 분자로부터의 변경을 포함하는 서브게놈 구간에 대한 리드를 획득하는 것; 리드를 정렬 방법에 의해 정렬하는 것; 뉴클레오티드 위치에 대해 리드로부터 뉴클레오티드 값을 배정하는 것; 및 배정된 뉴클레오티드 위치 세트로부터 서브게놈 구간 세트를 선택하는 것으로서, 여기서 서브게놈 구간 세트는 유전자 세트로부터의 것이다.
특정 실시양태에서, 돌연변이 부담은 대상체, 예를 들어, 본원에 기재된 대상체로부터의 샘플에서 측정된다. 특정 실시양태에서, 돌연변이 부담은, 예를 들어, 참조 집단으로부터의 샘플에서의 돌연변이 부담 중에서 백분위 수로서 표현된다. 특정 실시양태에서, 참조 집단은 대상체와 동일한 유형의 암을 갖는 환자를 포함한다. 다른 실시양태에서, 참조 집단은 대상체와 동일한 유형의 요법을 받고 있거나 또는 받은 적이 있는 환자를 포함한다. 특정 실시양태에서, 예를 들어, 표 1A-5A에 제시된 유전자 세트에서의 변경 (예를 들어, 체세포 변경) 수준을 평가함으로써, 본원에 기재된 방법에 의해 수득된 돌연변이 부담은 전체 게놈 또는 엑솜 돌연변이 부담과 상관관계가 있다.
변경의 유형
다양한 유형의 변경 (예를 들어, 체세포 변경)이 본원에 기재된 바와 같은 방법 또는 시스템에서 게놈 변경의 분석을 위해 평가되고 사용될 수 있다. 예를 들어, 암 및/또는 종양 돌연변이 부담과 연관된 게놈 변경을 분석할 수 있다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서 본원에 기재된 방법은 낮은 종양 함량 및/또는 적은 양의 종양 핵산을 갖는 샘플을 분석하는데 유용하다고 여겨진다.
체세포 변경
특정 실시양태에서, 본원에 기재된 방법에 따라서 평가되는 변경은 체세포 변경이다.
특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 코딩 짧은 변이체, 예를 들어, 염기 치환 또는 indel (삽입 또는 결실)이다. 특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 점 돌연변이이다. 다른 실시양태에서, 변경 (예를 들어, 체세포 변경)은 재배열이 아니며, 예를 들어, 전위가 아니다. 특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 스플라이스 변이체이다.
특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 침묵 돌연변이, 예를 들어, 동의어 변경이다. 다른 실시양태에서, 변경 (예를 들어, 체세포 변경)은 비-동의어 단일 뉴클레오티드 변이체 (SNV)이다. 다른 실시양태에서, 변경 (예를 들어, 체세포 변경)은 패신저 돌연변이, 예를 들어, 세포 클론의 적합성에 대하여 검출가능한 영향을 미치지 않는 변경이다. 특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 공지되지 않은 유의성의 변이체 (VUS), 예를 들어, 병원성이 확증될 수 않거나 제외될 수 없는 변경이다. 특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 암 표현형과 연관되는 것으로서 확인된 적이 없다.
특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 세포 분열, 성장 또는 생존에 대한 효과와 연관이 없거나, 또는 이와 연관이 있는 것으로 공지되어 있지 않다. 다른 실시양태에서, 변경 (예를 들어, 체세포 변경)은 세포 분열, 성장 또는 생존에 대한 효과와 연관된다.
특정 실시양태에서, 증가된 수준의 체세포 변경은 하나 이상의 클래스 또는 유형의 체세포 변경 (예를 들어, 재배열, 점 돌연변이, indel, 또는 그의 임의의 조합)의 증가된 수준이다. 특정 실시양태에서, 증가된 수준의 체세포 변경은 하나의 클래스 또는 유형의 체세포 변경 (예를 들어, 재배열 단독, 점 돌연변이 단독 또는 indel 단독)의 증가된 수준이다. 특정 실시양태에서, 증가된 수준의 체세포 변경은 위치 (예를 들어, 뉴클레오티드 위치, 예를 들어, 하나 이상의 뉴클레오티드 위치) 또는 영역 (예를 들어, 뉴클레오티드 영역, 예를 들어, 하나 이상의 뉴클레오티드 영역)에서의 증가된 수준의 체세포 변경이다. 특정 실시양태에서, 증가된 수준의 체세포 변경은 증가된 수준의 체세포 변경 (예를 들어, 본원에 기재된 체세포 변경)이다.
기능적 변경
특정 실시양태에서, 변경 (예를 들어, 체세포 변경)은 서브게놈 구간에 있어서의 기능적 변경이다. 다른 실시양태에서, 변경 (예를 들어, 체세포 변경)은 서브게놈 구간에 있어서의 공지된 기능적 변경이 아니다. 예를 들어, 종양 돌연변이 부담이 평가될 때, 변경 (예를 들어, 체세포 변경) 횟수는 하나 이상의 기능적 변경을 제외할 수 있다.
일부 실시양태에서, 기능적 변경은 참조 서열, 예를 들어, 야생형 또는 돌연변이되지 않은 서열과 비교해서, 세포 분열, 성장 또는 생존에 대한 효과를 가지고 있는, 예를 들어, 세포 분열, 성장 또는 생존을 촉진시키는 변경이다. 특정 실시양태에서, 기능적 변경은 기능적 변경의 데이터베이스, 예를 들어 COSMIC 데이터베이스 (cancer.sanger.ac.uk/cosmic; 문헌 [Forbes et al. Nucl. Acids Res. 2015; 43 (D1): D805-D811])에 포함시킴으로써 그 자체로 확인된다. 다른 실시양태에서, 기능적 변경은, 예를 들어, COSMIC 데이터베이스에서 공지된 체세포 변경으로서 발생하는 공지된 기능적 상태를 갖는 변경이다. 특정 실시양태에서, 기능적 변경은 가능한 기능적 상태를 갖는 변경, 예를 들어, 종양 억제 유전자에서의 말단절단이다. 특정 실시양태에서, 기능적 변경은 드라이버 돌연변이, 예를 들어, 세포 생존 또는 생식을 증가시킴으로써 그의 미세환경에서 클론에 선택적 이점을 제공하는 변경이다. 다른 실시양태에서, 기능적 변경은 클론 확장을 유발할 수 있는 변경이다. 특정 실시양태에서, 기능적 변경은 하기 중 1가지, 2가지, 3가지, 4가지, 5가지 또는 모두를 유발할 수 있는 변경이다: (a) 성장 시그널에 있어서의 자급 자족; (b) 성장 억제 시그널에 대한 감소, 예를 들어, 무감각; (c) 감소된 아폽토시스; (d) 증가된 복제 잠재력; (e) 지속적인 혈관 형성; 또는 (f) 조직 침범 또는 전이.
특정 실시양태에서, 기능적 변경은 패신저 돌연변이가 아니며, 예를 들어, 세포 클론의 적합성에 대하여 검출가능한 영향을 미치지 않는 변경이다. 특정 실시양태에서, 기능적 변경은 공지되지 않은 유의성의 변이체 (VUS)가 아니며, 예를 들어, 그의 병원성이 확증될 수 않거나 제외될 수 없는 변경이 아니다.
특정 실시양태에서, 표 1A-5A에 기재된 유전자에서의 복수 개 (예를 들어, 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 그 초과)의 기능적 변경은 제외된다. 특정 실시양태에서, 표 1A-5A에 기재된 유전자에서의 모든 기능적 변경이 제외된다. 특정 실시양태에서, 표 1A-5A에 기재된 복수 개의 유전자에서의 복수 개의 기능적 변경이 제외된다. 특정 실시양태에서, 표 1A-5A에 기재된 모든 유전자에서의 모든 기능적 변경이 제외된다.
배선 변경
특정 실시양태에서, 변경은 배선 변경이다. 다른 실시양태에서, 변경은 배선 변경이 아니다. 특정 실시양태에서, 변경은 배선 변경과 동일하거나 유사하지 않으며, 예를 들어, 배선 변경과 구별가능하다. 예를 들어, 종양 돌연변이 부담을 평가할 때, 변경 횟수는 배선 변경 횟수를 제외할 수 있다.
특정 실시양태에서, 배선 변경은 단일 뉴클레오티드 다형성 (SNP), 염기 치환, indel (예를 들어, 삽입 또는 결실), 또는 침묵 변경 (예를 들어, 동의어 변경)이다.
특정 실시양태에서, 배선 변경은 매칭되는 정상 서열과의 비교를 사용하지 않는 방법을 사용하여 확인된다. 다른 실시양태에서, 배선 변경은 SGZ 알고리즘의 사용을 포함하는 방법에 의해 확인된다. 특정 실시양태에서, 배선 변경은 배선 변경의 데이터베이스, 예를 들어 dbSNP 데이터베이스 (www.ncbi.nlm.nih.gov/SNP/index.html; 문헌 [Sherry et al. Nucleic Acids Res. 2001; 29(1): 308-311])에 포함시킴으로써 그 자체로 확인된다. 다른 실시양태에서, 배선 변경은 ExAC 데이터베이스 (exac.broadinstitute.org; 문헌 [Exome Aggregation Consortium et al. "Analysis of protein-coding genetic variation in 60,706 humans," bioRxiv preprint. October 30, 2015])의 2개 이상의 카운트에 포함시킴으로써 그 자체로 확인된다. 일부 실시양태에서, 배선 변경은 1000 게놈 프로젝트 데이터베이스 (www.1000genomes.org; 문헌 [McVean et al. Nature. 2012; 491, 56-65])에 포함시킴으로써 그 자체로 확인된다. 일부 실시양태에서, 배선 변경은 ESP 데이터베이스 (Exome Variant Server, NHLBI GO Exome Sequencing Project (ESP), Seattle, WA (evs.gs.washington.edu/EVS/)에 포함시킴으로써 그 자체로 확인된다.
유전자 선택
예를 들어, 유전자 및 다른 영역 세트 또는 군에 대한 서브게놈 구간 군 또는 세트를 분석하기 위한, 대상 구간, 예를 들어, 서브게놈 구간, 발현된 서브게놈 구간, 또는 둘 다가 본원에 기재된다.
일부 실시양태에서, 상기 방법은 획득된 핵산 샘플로부터의 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 유전자 또는 유전자 산물로부터의 대상 구간을, 예를 들어, 차세대 시퀀싱 방법에 의해 시퀀싱하는 것을 포함하며, 여기서 유전자는 표 1A-5A로부터 선택된다.
일부 실시양태에서, 상기 방법은 샘플로부터의 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 유전자 또는 유전자 산물로부터의 대상 구간을, 예를 들어, 차세대 시퀀싱 방법에 의해 시퀀싱하는 것을 포함하며, 여기서 유전자는 표 1A-5A로부터 선택된다.
또 다른 실시양태에서, 하기 세트 또는 군 중 하나의 대상 구간이 분석된다. 예를 들어, 종양 또는 암 유전자 또는 유전자 산물 및 참조 (예를 들어, 야생형) 유전자 또는 유전자 산물과 연관된 대상 구간은 샘플로부터의 서브게놈 구간 군 또는 세트를 제공할 수 있다.
한 실시양태에서, 상기 방법은 샘플로부터 대상 구간 세트에 대한 리드, 예를 들어, 서열을 획득하며, 여기서 대상 구간은 하기 중 적어도 1, 2, 3, 4, 5, 6, 7가지 또는 모두로부터 선택된다:
A) 표 1A-5A에 따른 돌연변이된 또는 야생형 유전자로부터의 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 대상 구간, 예를 들어, 서브게놈 구간, 또는 발현된 서브게놈 구간, 또는 둘 다;
B) 종양 또는 암과 연관되는 유전자 또는 유전자 산물 (예를 들어, 종양 또는 암에 대한 양성 또는 음성 치료 반응 예측 인자이거나, 양성 또는 음성 예후 인자이거나, 또는 종양 또는 암의 감별 진단을 가능하게 하는 것, 예를 들어, 표 1A-5A에 따른 유전자임)로부터의 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 대상 구간;
C) 표 1A-5A로부터 선택된 유전자에 존재하는 서브게놈 구간의 돌연변이된 또는 야생형 유전자 또는 유전자 산물 (예를 들어, 단일 뉴클레오티드 다형성 (SNP))로부터의 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 대상 구간;
D) (i) 약물로 치료된 암 환자의 더 나은 생존 (예를 들어, 파클리탁셀로 치료된 유방암 환자의 더 나은 생존); (ii) 파클리탁셀 대사; (iii) 약물에 대한 독성; 또는 (iv) 약물에 대한 부작용 중 하나 이상과 연관된 표 1A-5A로부터 선택된 유전자에 존재하는 대상 구간의 돌연변이된 또는 야생형 유전자 (예를 들어, 단일 뉴클레오티드 다형성 (SNP))로부터의 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 대상 구간;
E) 표 1A-5A에 따른 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개, 또는 그 초과의 유전자 또는 유전자 산물을 수반하는 복수 개의 전위 변경;
F) 표 1A-5A로부터 선택된 적어도 5개의 유전자로서, 여기서 예를 들어, 특정 위치에서의 대립유전자 변이는 종양의 유형과 연관되고, 여기서 상기 대립유전자 변이는 상기 종양 유형의 세포의 5% 미만에 존재하는 것;
G) 표 1A-5A로부터 선택된 적어도 5개의 유전자로서, 이는 GC가 풍부한 영역에 포매되는 것; 또는
H) 암 발병을 위한 유전적 (예를 들어, 배선 위험) 인자를 나타내는 적어도 5개의 유전자 (예를 들어, 유전자 또는 유전자 산물은 표 1A-5A로부터 선택됨).
또한 또 다른 실시양태에서, 상기 방법은 샘플로부터 대상 구간 세트에 대한 리드, 예를 들어, 서열을 획득하며, 여기서 대상 구간은 표 1A-1C에 기재된 유전자 중 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400개, 또는 모두로부터 선택된다.
또한 또 다른 실시양태에서, 상기 방법은 샘플로부터 대상 구간 세트에 대한 리드, 예를 들어, 서열을 획득하며, 여기서 대상 구간은 표 2A-2B에 기재된 유전자 중 5, 6, 7, 8, 9, 10, 15, 20, 25, 30개, 또는 모두로부터 선택된다.
또한 또 다른 실시양태에서, 상기 방법은 샘플로부터 대상 구간 세트에 대한 리드, 예를 들어, 서열을 획득하며, 여기서 대상 구간은 표 3A-3C에 기재된 유전자 중 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300개, 또는 모두로부터 선택된다.
또한 또 다른 실시양태에서, 상기 방법은 샘플로부터 대상 구간 세트에 대한 리드, 예를 들어, 서열을 획득하며, 여기서 대상 구간은 표 4A-4B에 기재된 유전자 중 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80개, 또는 모두로부터 선택된다.
서브게놈 구간의 이들 및 다른 세트 및 군은 본원의 다른 곳에서, 예를 들어, (발명의 내용 및/또는 발명을 실시하기 위한 구체적인 내용에서) "유전자 선택"이란 제목의 섹션에서 더 상세히 논의된다.
적용
본원에 개시된 방법은, 예를 들어, 게놈의 암 관련 세그먼트에 적용된 바와 같이, 최적화된 표적 포획 시약 (예를 들어, 미끼)-기반 선택, 최적화된 정렬 및 최적화된 돌연변이 호출을 포함한 다수의 최적화된 요소의 통합을 허용한다. 본원에 기재된 방법은 암별, 유전자별 및 부위별로 최적화될 수 있는 종양의 NGS-기반 분석을 제공한다. 이는, 예를 들어, 본원에 기재된 유전자/부위 및 종양 유형에 적용될 수 있다. 상기 방법은 주어진 시퀀싱 기술로 돌연변이 검출을 위한 감도와 특이성의 수준을 최적화한다. 암별, 유전자별 및 부위별 최적화는 임상 산물에 필수적인 매우 높은 수준의 감도/특이성 (예를 들어, 둘 다에 대해 >99%)을 제공한다.
이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, 본원에 기재된 방법은 선택된 게놈 영역의 검출에서 증가된 감도로부터 혜택을 누릴 수 있는 일반적인 시퀀싱 적용에 적용될 수 있다고 여겨진다. 예를 들어, 이러한 적용은 유병률에 따라 증가된 커버리지를 수반한 유전성 암 패널, 특이적 질환 경로를 표적으로 하는 다른 전체 엑솜 시퀀싱 (WES) 시험, 및 후보 실행가능한 병소 이벤트에 대한 강화를 이용한 산전 시험을 포함하나, 이에 제한되지는 않는다.
일부 실시양태에서, 본원에 기재된 방법 및 조성물은, 예를 들어, 변경의 유형 또는 분석의 목적에 기반하여, 하나 이상의 서브게놈 구간에 대한 시퀀싱 깊이를 조정 (예를 들어, 조정 또는 최적화)하기 위해 사용될 수 있다. 예를 들어, 고 감도 체세포 돌연변이 호출에는 높은 시퀀싱 깊이가 필요할 수 있으며 종양 돌연변이 부담 (TMB)의 평가에는 중간 정도의 시퀀싱 깊이가 필요할 수 있다. 일부 실시양태에서, 적은 수의 서브게놈 구간이 더 높은 시퀀싱 깊이로 시퀀싱되고 (예를 들어, 체세포 돌연변이를 분석하기 위함), 많은 수의 서브게놈 구간이 더 낮은 시퀀싱 깊이로 시퀀싱된다 (예를 들어, TMB를 평가하기 위함).
일부 실시양태에서, 본원에 기재된 방법 및 조성물은 조합된 배선 및 체세포 돌연변이 호출에 사용될 수 있다. 예를 들어, 높은 시퀀싱 깊이는 체세포 돌연변이를 호출하는데 필요할 수 있지만 (예를 들어, 호출의 감도를 증가시키기 위함), 배선 돌연변이를 호출하는데에는 필요하지 않다. 일부 실시양태에서, 본원에 기재된 표적 포획 시약 (예를 들어, 미끼)은, 예를 들어, 동시에 또는 단일 포획 단계에서, 체세포 돌연변이와 연관된 대상 구간의 회수를 증가시키고 배선 돌연변이와 연관된 대상 구간의 회수를 저하시키도록 조정될 수 있다. 일부 실시양태에서, 표적 포획 시약 (예를 들어, 미끼)을 조정하는 것은 표적 포획 시약 (예를 들어, 미끼) 중 하나 이상 (예를 들어, 모두)의 비율을 변경하는 것을 포함한다. 본원에 기재된 방법 및 조성물은, 예를 들어, 임상적 중요성을 갖는 배선 돌연변이 (예를 들어, BRCA1/2)를 분석하는데 유용할 수 있다. 본원에 기재된 방법 및 조성물은 또한, 예를 들어, 체세포 돌연변이 호출을 인간 백혈구 항원 (HLA) 형별 검사와 조합하는데, 예를 들어, 배경 돌연변이율 (pCV)을 결정하는데 유용할 수 있다.
일부 실시양태에서, 본원에 기재된 방법 및 조성물은 대규모 동적 범위 유전자 발현 프로파일링의 최적화에 사용될 수 있다. 예를 들어, 높은 시퀀싱 깊이가 고 발현 유전자를 분석하는데 필요할 수 있지만, 저 발현 유전자를 분석하는데에는 그렇지 않을 수 있다. 일부 실시양태에서, 높은 시퀀싱 깊이가 저 발현 유전자를 분석하는데 필요할 수 있다. 일부 실시양태에서, 높은 시퀀싱 깊이가 저 발현 유전자를 분석하는데 필요할 수 있지만, 고 발현 유전자를 분석하는데에는 그렇지 않을 수 있다. 일부 실시양태에서, 본원에 기재된 표적 포획 시약 (예를 들어, 미끼)은, 예를 들어, 동시에 또는 단일 포획 단계에서, 고 발현 유전자와 연관된 대상 구간의 회수를 저하시키고 저 발현 유전자와 연관된 대상 구간의 회수를 증가시키도록 조정될 수 있다.
일부 실시양태에서, 본원에 기재된 방법 및 조성물은 조합된 카피 수 변경 (CNA) 호출 및 체세포 돌연변이 호출에 사용될 수 있다. 예를 들어, 높은 시퀀싱 깊이가 체세포 돌연변이를 호출하는데 필요할 수 있지만 (예를 들어, 호출의 감도를 증가시키기 위함), CNA를 호출하는데에는 그렇지 않을 수 있다. 일부 실시양태에서, 본원에 기재된 표적 포획 시약 (예를 들어, 미끼)은, 예를 들어, 동시에 또는 단일 포획 단계에서, 체세포 돌연변이와 연관된 대상 구간의 회수를 증가시키고 증폭시킨 대상 구간의 회수를 저하시키도록 조정될 수 있다.
일부 실시양태에서, 상기 방법은 게놈 변경, 예를 들어, 체세포 변경의 평가에 대응하여 치료를 선택하는 것을 추가로 포함한다. 일부 실시양태에서, 상기 방법은 돌연변이 부담, 예를 들어, 증가되거나 또는 감소된 수준의 돌연변이 부담의 평가에 대응하여 치료를 선택하는 것을 추가로 포함할 수 있다. 일부 실시양태에서, 상기 방법은 게놈 변경의 평가에 대응하여 치료를 투여하는 것을 추가로 포함한다. 일부 실시양태에서, 상기 방법은 게놈 변경의 평가에 대응하여 샘플 또는 샘플이 유래된 대상체를 분류하는 것을 추가로 포함한다. 일부 실시양태에서, 상기 방법은 샘플이 수득되는 대상체에 대한 임상 시험 적격성을 결정하는 것을 추가로 포함한다. 일부 실시양태에서, 상기 방법은 보고서, 예를 들어, 전자, 웹-기반 또는 종이 보고서를 생성하고, 이를 환자 또는 또 다른 사람 또는 실체, 간병인, 의사, 종양전문의, 병원, 클리닉, 제3자 지불인, 보험 회사 또는 관공서에게 전달하는 것을 추가로 포함한다. 일부 실시양태에서, 상기 보고서는 본원에 기재된 방법으로부터의 출력을 포함한다.
본원에 기재된 방법은 최적의 치료 및 질환 관리 결정을 알리기 위해 일상적인 실세계 샘플로부터의 차세대 시퀀싱 기술을 사용하여 그럴듯하게 실행가능한 유전자의 포괄적 세트 (이는 전형적으로 50 내지 500개 유전자의 범위일 수 있음)에 대한 게놈 이상에 대한 임상 및 규제 등급의 포괄적인 분석 및 해석을 제공한다.
본원에 기재된 방법은 최적의 치료 및 질환 관리 결정을 알리기 위해, 종양전문의/병리학자가 샘플을 보내고 종양의 게놈 및 종양에 대한 다른 분자상 변화의 포괄적인 분석 및 설명을 받을 수 있는 원-스톱-쇼핑을 제공한다.
본원에 기재된 방법은 이용가능한 표준 샘플을 채취하는 강력한 실세계 임상 종양학 진단 도구를 제공하며, 한 시험에서 포괄적인 게놈 및 다른 분자상 이상 분석을 제공하여, 종양을 구동할 수 있는 이상이 무엇인지에 대한 포괄적인 설명을 종양전문의에게 제공하고 종양전문의 치료 결정을 알리는데 유용할 수 있다.
본원에 기재된 방법은, 예를 들어, 임상 등급 품질로 차세대 시퀀싱 (NGS)에 의한 환자의 암 게놈의 포괄적인 분석을 제공한다. 상기 방법은 가장 관련성이 높은 유전자 및 잠재적 변경을 포함하고 돌연변이 (예를 들어, indel 또는 염기 치환), 카피 수, 재배열, 예를 들어, 전위, 발현 및 후성적 마커의 분석 중 하나 이상을 포함한다. 유전적 분석의 출력은 실행가능한 결과에 대한 설명적인 보고와 맥락지을 수 있다. 상기 방법은 관련 과학 및 의학 지식의 최신 세트와 그 사용을 연결한다.
일부 실시양태에서, 상기 방법은 임의의 질환 (예를 들어, 암)의 진단, 예방 또는 치료, 또는 인간의 건강의 손상 또는 평가를 위한 정보를 제공할 목적으로 인체로부터 유래된 샘플을 분석한다. 일부 실시양태에서, 상기 방법은 임상 실험실 개선 개정 (CLIA) 및/또는 미국 병리학자 대학 (CAP)에 의해 제공하는 지침에 따라 수행된다. 일부 실시양태에서, 상기 방법은 CLIA 및/또는 CAP 인증 시설에서 수행된다. 일부 실시양태에서, 상기 방법은 식품 의약국 (FDA), 유럽 의약청 (EMA), 품질 시스템 규정 (QSR), 유럽 위원회 (CE), 예를 들어, CE 시험관내 진단 (CE-IVD), 중국 식품 의약국 (CFDA) 또는 다른 규제 기관에 의해 제공하는 지침에 따라 수행된다. 일부 실시양태에서, 상기 방법은 FDA, QSR, CE 또는 CFDA 인증 시설에서 수행된다. 일부 실시양태에서, 상기 방법은 QSR 인증 시설에서 수행된다. 일부 실시양태에서, 상기 방법은 임상 등급 샘플, 예를 들어, 임상 실습, 시험 또는 환자 치료 관리에 적합한 샘플을 분석한다. 일부 실시양태에서, 샘플은 후향적 샘플 및/또는 예상 샘플을 포함한다. 일부 실시양태에서, 후향적 샘플은 치료제가 투여되기 전 또는 후에 분석된 샘플을 포함하거나, 또는 연구 샘플이다. 일부 실시양태에서, 예상 샘플은 치료제로 치료받지 않은 대상체로부터의 샘플을 포함한다. 일부 실시양태에서, 예상 샘플을 분석하기 위한 본원에 기재된 방법의 사용은 샘플이 수득되는, 예를 들어, 유래되는 대상체에 대한 요법 결과의 예측을 초래할 수 있다.
일부 실시양태에서, 상기 방법은, 예를 들어, 본원에 기재된 바와 같이 진단으로서 사용된다. 일부 실시양태에서, 상기 방법은 동반 진단에서 또는 동반 진단과 함께 사용된다. 일부 실시양태에서, 상기 방법은 상보적 진단으로서 사용된다.
일부 실시양태에서, 상기 방법의 유효성은 정확도, 정밀도, 감도, 특이성, 보고가능한 범위 또는 참조 구간 중 하나 이상 (예들 들어, 2, 3, 4, 5가지 또는 모두)을 결정함으로써 (예를 들어, CLIA 규정에 따라) 확립된다. 특정 실시양태에서, 정확도는, 예를 들어, 표적화된 영역에서의 공지된 변이체 (예를 들어, SNP, indel)에 대한 커버리지 및 품질 (예를 들어, 프레드(Phred) 점수)에 의해 결정된다. 특정 실시양태에서, 정밀도는, 예를 들어, 공지된 변이체에 대해 상이한 연산자와 기기 간의 서열 복제 및 커버리지 분포에 의해 결정된다. 특정 실시양태에서, 특이성은, 예를 들어, 널리 특징규명된 표적을 갖는 여러 샘플에서, 특이적 커버리지 임계치에서 거짓 변이체가 확인되는 정도인 거짓 양성 비율에 의해 결정된다. 특정 실시양태에서, 감도는, 예를 들어, 널리 특징규명된 표적을 갖는 여러 샘플에서, 공지된 변이체를 검출하는 가능성 시험에 의해 결정된다. 특정 실시양태에서, 보고가능한 범위는, 예를 들어, 반복 영역, indel 또는 대립유전자 탈락을 갖는 하나 이상의 유전자의 인트론 완충제 및 엑손 영역에 의해 결정된다. 특정 실시양태에서, 참조 구간은, 예를 들어, 영향을 받지 않은 집단에서, 서열 변이 배경 측정에 의해 결정된다.
일부 실시양태에서, 상기 방법은 검증된 샘플 추출, 라이브러리 제조, 바코딩, 풀링, 표적 강화 또는 생물 정보학 (예를 들어, 정확하고 감수성 변이체가 호출되는 방식) 중 하나 이상 (예를 들어, 2, 3, 4, 5가지 또는 모두)에 대한 고려를 포함하는 환경에서 (예를 들어, CAP 규정 하에) 수행된다.
본원에 기재된 방법은 환자 치료의 질과 효율 둘 다를 증가시킬 수 있다. 이는 종양이 희귀하거나 제대로 연구되지 않은 유형이어서, 표준 진료가 없거나 환자가 확립된 요법 라인에 불응하고 추가 요법의 선택을 위한 또는 임상 시험 참여를 위한 합리적인 근거가 유용할 수 있는 적용을 포함한다. 예를 들어, 상기 방법은 요법의 어느 시점에서든, 종양전문의가 의사 결정에 정보를 제공하는데 이용가능한 전체 "분자 영상" 및/또는 "분자상 하위-진단"을 통해 혜택을 받을 수 있는 선택을 허용한다. 그 결과는 환자가 임상 시험에 등록할 수 있는 자격이 있는지를 결정하는데 사용될 수 있다.
본원에 기재된 방법은, 예를 들어, 전자, 웹-기반 또는 종이 형태의 보고서를 환자 또는 또 다른 사람 또는 실체, 예를 들어, 간병인, 예를 들어, 의사, 예를 들어, 종양전문의, 병원, 클리닉, 제3자 지불인, 보험 회사 또는 관공서에 제공하는 것을 포함할 수 있다. 보고서는, 예를 들어, 샘플의 종양 유형과 연관된 대상 구간에 대한, 상기 방법으로부터의 출력, 예를 들어, 뉴클레오티드 값의 확인, 변경, 돌연변이 또는 야생형 서열의 존재 또는 부재의 표시를 포함할 수 있다. 보고서는 또한 종양 돌연변이 부담 수준에 대한 정보를 포함할 수 있다. 보고서는 또한, 하나 이상의 다른 게놈 시그니처, 예를 들어, 연속/복합 바이오마커, 예를 들어, 미세부수체 불안정성의 수준, 또는 이형접합성의 존재 또는 부재 (LOH)에 대한 정보를 포함할 수 있다. 보고서는 또한, 질환에 있어서의 서열, 예를 들어, 변경, 돌연변이, 또는 야생형 서열의 역할에 대한 정보를 포함할 수 있다. 이러한 정보는 예후, 저항성 또는 잠재적 또는 제안된 치료 옵션에 대한 정보를 포함할 수 있다. 보고서는 치료 옵션의 가능한 유효성, 치료 옵션의 허용가능성, 또는 환자, 예를 들어, 시험에서 확인된 서열 변경, 및 실시양태에서, 보고서에서 확인된 서열 변경을 갖는 환자에게 치료 옵션을 적용하는 것의 타당성에 대한 정보를 포함할 수 있다. 예를 들어, 보고서는 약물 투여, 예를 들어, 투여량 또는 치료 레지멘에서, 예를 들어, 다른 약물과 조합하여 환자에게 투여하는 것에 대한 정보 또는 권장사항을 포함할 수 있다. 한 실시양태에서, 상기 방법에서 확인된 모든 돌연변이가 보고서에서 확인되는 것은 아니다. 예를 들어, 보고서는 암의 발생, 예후, 병기, 또는 예를 들어, 치료 옵션을 이용한 치료에 대한 암의 감수성과의 상관관계 수준을 갖는 유전자에서의 돌연변이로 제한될 수 있다. 본원에 특별히 포함된 방법은 이러한 방법을 실시하는 실체가 샘플을 수령한 날로부터 7, 14 또는 21일 이내에, 보고서를, 예를 들어, 본원에 기재된 실체에 전달할 수 있도록 한다. 따라서, 본 발명에 특별히 포함된 방법은, 예를 들어, 샘플 수령 후 7, 14 또는 21일 이내에 빠른 처리 시간을 허용한다.
본원에 기재된 방법은 또한, 조직학적으로 정상적인 샘플, 예를 들어, 수술 절제면으로부터의 샘플을 평가하기 위해 사용될 수 있다. 본원에 기재된 바와 같은 하나 이상의 변경이 검출되면, 조직은, 예를 들어, 악성 또는 전악성으로서 재분류될 수 있고/있거나 치료 과정이 변형될 수 있다.
일부 실시양태에서, 본원에 기재된 방법은 비-암 적용, 예를 들어, 법의학 적용 (예를 들어, 치과 기록의 사용에 대한 대안으로서 또는 이에 덧붙여 확인하는 것), 친자 확인 검사, 및 예를 들어, 감염성 질환, 자가면역 장애, 낭포성 섬유증, 헌팅턴병, 알츠하이머병 등에 대한 질환 진단 및 예후에 유용하다. 예를 들어, 본원에 기재된 방법에 의한 유전적 변경의 확인은 특별한 장애가 발생하는 개체의 존재 또는 위험을 표시할 수 있다.
시스템
또 다른 측면에서, 본 발명은 샘플 중의 게놈 변경을 평가하기 위한 시스템을 특징으로 한다. 시스템은 메모리에 작동가능하게 연결된 적어도 하나의 프로세서를 포함하며, 실행 시 적어도 하나의 프로세서는 본원에 기재된 바와 같이 샘플을 분석하는 방법을 수행하도록 설정된다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야에서 통상의 기술자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 물질이 하기에 기재된다. 본원에 언급된 모든 간행물, 특허 출원, 특허 및 다른 참고문헌은 그 전체 내용이 참조로 포함된다. 또한, 물질, 방법 및 예는 단지 예시적이며 제한하려는 의도가 아니다.
본 발명의 다른 특징 및 이점은 발명을 실시하기 위한 구체적인 내용, 도면 및 청구범위로부터 명백해질 것이다.
도 1은 차단제 없이 3개의 유전자 (EGFR, NF1 및 TP53)와 비교한 ATM 및 APC의 표적 커버리지를 제시하는 플롯이다. y 축은 log 2 비율을 나타내고 x 축은 유전자 표적을 나타낸다.
도 2는 다른 모든 NHC 표적 영역과 비교해서 APC 표적 영역의 관찰치 대 예상치 중앙값 커버리지를 도시하는 그래프이다.
도 3은 차단된 감소된 커버리지 비-NHC 표적으로부터 좁고 높은 커버리지 (NHC) 표적의 분리를 예시하는 평균 컨센서스 표적 커버리지를 제시하는 히스토그램이다. y 축은 카운트를 나타내고 x 축은 표적 시퀀싱 깊이를 나타낸다.
본원에 기재된 방법은 적어도 부분적으로, 상이한 표적에 대한 표적 포획 시약 상의 변형 (예를 들어, 비오티닐화) 수준을 최적화함으로써 제어된 방식으로 표적의 차등 시퀀싱 깊이가 달성될 수 있다는 관찰에 기반한다. 특정 실시양태에서, 상기 방법은 서브클로날 돌연변이를 함유할 가능성이 있거나 또는 임상적으로 더 중요한 특이적 게놈 영역, 엑손 또는 RNA 전사체에 대해 더 높은 감수성을 제공한다. 다른 실시양태에서, 상기 방법은 배선 SNP 대립유전자 균형을 평가하는데 사용되는 것과 비교해서 체세포 돌연변이가 평가되는 표적에 대해 더 높은 시퀀싱 깊이를 제공한다.
이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, 본원에 기재된 방법은 보다 저렴한 비용으로 게놈 변경을 평가하기 위한 유사한 성능을 달성할 수 있다고 여겨진다.
본원에 기재된 방법은 더 작은 유전자 세트에서의 높은 시퀀싱 깊이에서 조직, 혈액, CTC, cfDNA 또는 ctDNA로부터의 체세포 돌연변이를 측정할 수 있고, 동시에 더 낮은 시퀀싱 깊이에서 더 큰 게놈 영역에 대한 게놈 시그니처, 예를 들어, 연속/복합 바이오마커 (예를 들어, 종양 돌연변이 부담, 예를 들어, 혈액 종양 돌연변이 부담)를 측정할 수 있는 표적 포획 시약을 제공하는 것을 허용한다. 특정 실시양태에서, 본원에 기재된 방법은 높은 시퀀싱 깊이에서 체세포 변경을 측정하고 낮은 시퀀싱 깊이에서 배선 변경 호출을 측정하는 것을 허용한다. 특정 실시양태에서, 본원에 기재된 방법은 높은 시퀀싱 깊이에서 체세포 변경을 측정하고 낮은 시퀀싱 깊이에서 카피 수 또는 구조적 변이체 (예를 들어, 약 1 Kb 내지 3 Mb 길이)를 측정하는 것을 허용한다. 다른 실시양태에서, 상기 방법은 RNA-시퀀싱 또는 cDNA-시퀀싱 적용에서 또는 상이한 유전자 또는 서열의 존재도가 공급원 샘플에서 차등적인 다른 적용에서 특이적 유전자의 시퀀싱 깊이를 제어하는데 사용될 수 있다. 이러한 상황에서 더 낮은 존재도 유전자를 측정하는데 있어서의 효율을 개선시키기 위해 높은 존재도 유전자의 서열 커버리지를 감소시키는 이점이 있을 수 있다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, 본원에 기재된 방법은 상이한 표적 전체에 걸쳐 시퀀싱 커버리지를 정규화하는데 사용될 수 있으며, 여기서 일부 표적은 표적 포획 시약에 의해 더 효율적이고/이거나 특이적으로 포획되는 반면, 다른 표적은 표적 포획 시약에 의해 덜 효율적이고/이거나 특이적으로 포획되는 것으로 여겨진다 (예를 들어, 표적 중의 높거나 낮은 GC 함량 또는 2개의 상이한 표적 간의 유사성에 기인함). 본원에 기재된 방법의 다른 유용성은 유전자 발현 프로파일링, SNP의 확인 및 카피 수 변경 (CNA)의 결정을 포함하나, 이에 제한되지는 않는다.
혼성체 포획 접근법을 사용하여 차등 시퀀싱 깊이를 수득하는데 있어서의 문제 중 하나는 표적 포획 시약이 전형적으로 표적 DNA에 대해 높은 몰 과잉에 있다는 것인데, 이는 효율적인 포획에 필요하고 (예를 들어, 표적 포획의 포화를 보장하기 위함), 표적 DNA의 카피 수를 정량적으로 측정할 수 있도록 하는데 필요하다 (예를 들어, 표적 DNA의 대부분이 포획된 경우, 그 깊이는 표적의 카피 수에 거의 선형적으로 비례할 것임). 이러한 상황에서, 특이적 표적 포획 시약의 상대적 양을 증가시키거나 감소시키는 것은 수득된 시퀀싱 깊이에 비교적 작은 영향을 미친다.
본원에 기재된 방법은, 예를 들어, 상이한 표적에 대한 표적 포획 시약 상의 변형 (예를 들어, 비오티닐화) 수준을 제어함으로써 차등 시퀀싱 깊이를 제공한다. (표적 포획 시약이 과잉으로 존재하기 때문에) 표적 DNA의 대부분이 포획된다고 가정하면, 변형되는 (예를 들어, 비오티닐화되는) 특이적 표적에 대한 표적 포획 시약의 상대적 양은 혼성체 포획 반응에 의해 유지되는 특이적 표적 DNA의 양에 직접적인 영향을 미칠 수 있다. 예를 들어, 표적 A에 대한 표적 포획 시약이 25% 비오티닐화되고 표적 B에 대한 표적 포획 시약이 50% 비오티닐화되는 경우, 표적 A DNA의 상대적 양 대 표적 B DNA의 양은 대략 1:2인 것으로 예상될 것이다. 비-변형된 (예를 들어, 비-비오티닐화된) 표적 포획 시약에서 주어진 분율로 혼합함으로써 특이적 유형의 표적 포획 시약의 변형 (예를 들어, 비오티닐화) 수준을 감소시키는 것이 용이하고 시퀀싱에 의한 상이한 표적의 출력 시퀀싱 깊이 비율을 결정하는 것이 용이하기 때문에, 특이적 표적의 특이적 차등 시퀀싱 깊이를 달성하기 위해 반응을 적정하는 것이 바람직할 것이다.
일부 실시양태에서, 특이적 유형의 표적 포획 시약 상의 변형 (예를 들어, 비오티닐화) 수준을 증가시키는 것은 상이한 변형, 정제 방법 또는 포획을 위한 기질 (예를 들어, 용액 내 대 표면 상)에 의해 달성될 수 있다. 다른 실시양태에서, 상이한 표적의 시퀀싱 깊이의 균일성은 더 나은 성능의 표적 포획 시약에 대한 변형 (예를 들어, 비오티닐화) 수준을 감소시키고/시키거나 더 낮은 성능의 표적 포획 시약의 변형 (예를 들어, 비오티닐화) 수준을 증가시켜 측정된 표적 시퀀싱 깊이의 분포 범위를 좁힘으로써 증가된다.
정의
특정 용어가 먼저 정의된다. 부가의 용어는 본 명세서 전반에 걸쳐 정의된다.
본원에 사용된 바와 같은, 단수 형태는 그의 문법적 대상 중 하나 또는 둘 이상 (예를 들어, 적어도 하나)을 지칭한다.
"약" 및 "대략"은 일반적으로, 측정의 성질 또는 정밀도를 고려하여 측정된 양에 대해 허용가능한 오류 정도를 의미할 것이다. 예시적인 오류 정도는 주어진 값 또는 값의 범위 내에서, 20 퍼센트 (%) 이내, 전형적으로 10% 이내, 보다 전형적으로 5% 이내이다.
본원에 사용되는 바와 같은 용어 "높은 시퀀싱 깊이 이벤트"는 높은 시퀀싱 깊이, 예를 들어, 적어도 2000X, 2500X, 3000X, 3500X, 4000X, 4500X, 5000X, 5500X, 6000X, 6500X, 7000X, 7500X, 8000X, 8500X, 9000X, 9500X, 10000X, 또는 그 초과로 시퀀싱되는 서열 (예를 들어, 서브게놈 구간 서열)을 지칭한다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 표현형 (예를 들어, 세포 분열, 성장 또는 생존에 대한 효과인 암 표현형)과 상관관계가 있다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 결과 (예를 들어, 치료 결과, 진단 또는 예후)와 상관관계가 있다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 원하지 않는 표현형, 장애 또는 요법에 대한 반응 가능성과 상관관계 (예를 들어, 양의 상관관계 또는 음의 상관관계)가 있는 유전적 이벤트이다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 종양 형성을 초래하거나 이를 구동시키거나, 또는 치료 양식에 대한 반응성 또는 비-반응성과 상관관계가 있는 변경, 예를 들어, 돌연변이를 포함한다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 표 1A-5A 중 어느 하나에 기재된 유전자에서의 유전적 이벤트를 포함한다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 표 3C, 3D, 3E 또는 5A에 기재된 유전자에서의 유전적 이벤트를 포함한다. 한 실시양태에서, 제1 단편 (F1)은 높은 시퀀싱 깊이 이벤트와 연관된다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 F1에 또는 F1 내에 존재한다. 한 실시양태에서, F1은 높은 시퀀싱 깊이 이벤트를 포함한다. 한 실시양태에서, 제2 단편 (F2)은 높은 시퀀싱 깊이 이벤트와 연관되지 않는다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 F2에 또는 F2 내에 존재하지 않는다. 한 실시양태에서, F2는 높은 시퀀싱 깊이 이벤트를 포함하지 않는다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 미세부수체 불안정성 (MSI), 또는 둘 다의 결정과 연관되는 이벤트가 아니다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 실행가능한 이벤트, 예를 들어, 본원에 기재된 실행가능한 이벤트를 포함한다. 한 실시양태에서, 높은 시퀀싱 깊이 이벤트는 높은 시퀀싱 깊이, 예를 들어, 낮은 시퀀싱 깊이 이벤트보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되는 서열 (예를 들어, 서브게놈 구간 서열)을 포함한다.
본원에 사용된 바와 같은 용어 "낮은 시퀀싱 깊이 이벤트"는 낮은 시퀀싱 깊이, 예를 들어, 2000X, 1500X, 1000X, 900X, 800X, 700X, 600X, 500X, 400X, 300X, 200X 미만으로 시퀀싱되는 서열 (예를 들어, 서브게놈 구간 서열)을 지칭한다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 표현형 (예를 들어, 세포 분열, 성장 또는 생존에 대한 효과인 암 표현형)과 연관되지 않는다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 결과 (예를 들어, 치료 결과, 진단 또는 예후)와 상관관계가 있거나 없다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 원하지 않는 표현형, 장애 또는 요법에 대한 반응 가능성과 상관관계 (예를 들어, 양의 상관관계 또는 음의 상관관계)가 있거나 없는 유전적 이벤트이다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 표현형이 없는 변경, 예를 들어, 침묵 돌연변이 또는 SNP이다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 표 1A-5A 중 어느 하나에 기재된 유전자에서의 유전적 이벤트이다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 표 3C, 3D, 3E 또는 5A에 기재된 유전자에서의 유전적 이벤트가 아니다. 한 실시양태에서, 제2 단편 (F2)은 낮은 시퀀싱 깊이 이벤트와 연관된다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 F2에 또는 F2 내에 존재한다. 한 실시양태에서, F2는 낮은 시퀀싱 깊이 이벤트를 포함한다. 한 실시양태에서, 제1 단편 (F1)은 낮은 시퀀싱 깊이 이벤트와 연관되지 않는다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 F1에 또는 F1 내에 존재하지 않는다. 한 실시양태에서, F1은 낮은 시퀀싱 깊이 이벤트를 포함하지 않는다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 미세부수체 불안정성 (MSI), 또는 둘 다의 결정과 연관되는 이벤트를 포함한다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 실행가능한 이벤트, 예를 들어, 본원에 기재된 실행가능한 이벤트를 포함한다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 실행가능한 이벤트를 포함하지 않으며, 예를 들어, 본원에 기재된 실행가능한 이벤트를 포함하지 않는다. 한 실시양태에서, 낮은 시퀀싱 깊이 이벤트는 낮은 시퀀싱 깊이, 예를 들어, 높은 시퀀싱 깊이 이벤트보다 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 미만으로 더 낮은 깊이로 시퀀싱되는 서열 (예를 들어, 서브게놈 구간 서열)을 포함한다.
본원에 사용된 바와 같은 용어 "실행가능한 이벤트" 또는 "실행가능성"은 표현형 (예를 들어, 세포 분열, 성장 또는 생존에 대한 효과인 암 표현형)과 연관되는 서열 (예를 들어, 서브게놈 구간 서열)을 지칭한다. 한 실시양태에서, 실행가능한 이벤트는 결과 (예를 들어, 치료 결과, 진단 또는 예후)와 상관관계가 있다. 한 실시양태에서, 실행가능한 이벤트는 원하지 않는 표현형, 장애 또는 요법에 대한 반응 가능성과 상관관계 (예를 들어, 양의 상관관계 또는 음의 상관관계)가 있는 유전적 이벤트이다. 한 실시양태에서, 실행가능한 이벤트는 종양 형성을 초래하거나 이를 구동시키거나, 또는 치료 양식에 대한 반응성 또는 비-반응성과 상관관계가 있는 변경, 예를 들어, 돌연변이이다. 한 실시양태에서, 실행가능한 이벤트는 표 1A-5A 중 어느 하나에 기재된 유전자에서의 유전적 이벤트이다. 한 실시양태에서, TMB 또는 MSI의 수준은 실행가능한 이벤트와 연관될 수 있지만 TMB 또는 MSI의 수준을 결정할 때 확인된 하나 이상의 변경은 실행가능할 수도 있고 실행 불가능할 수도 있다.
한 실시양태에서, 실행가능한 이벤트는 문헌 [Hedley et al., (2016) Nature Reviews 16(5) 319-29] (그의 전체 내용이 본원에 참조로 포함됨)에 기재된 방법을 기반으로 결정될 수 있다. 한 실시양태에서, 실행가능한 이벤트는 널리 특징규명된 반복되는 돌연변이를 포함한다. 한 실시양태에서, 실행가능한 이벤트는 세포 검정에서 형질 전환을 초래할 수 있는 돌연변이를 포함한다. 한 실시양태에서, 실행가능한 이벤트는 화합물에 대한 세포의 감수성을 변경, 예를 들어, 증강시킬 수 있는 돌연변이를 포함한다. 한 실시양태에서, 실행가능한 이벤트는 병원성인 돌연변이를 포함한다.
본원에 사용된 바와 같은 용어 "획득" 또는 "획득하는 것"은 물리적 실체 또는 값을 "직접적으로 획득" 또는 "간접적으로 획득"함으로써 물리적 실체 또는 값, 예를 들어 수치의 보유를 수득하는 것을 지칭한다. "직접적으로 획득하는 것"은 물리적 실체 또는 값을 수득하기 위한 프로세스를 수행하는 것 (예를 들어, 합성 또는 분석 방법을 수행하는 것)을 의미한다. "간접적으로 획득하는 것"은 또 다른 당사자 또는 공급처 (예를 들어, 물리적 실체 또는 값을 직접적으로 취득한 제3자 실험실)로부터 물리적 실체 또는 값을 받는 것을 지칭한다. 물리적 실체를 직접적으로 획득하는 것은 물리적 물질, 예를 들어, 출발 물질에 있어서의 물리적 변화를 포함하는 프로세스를 수행하는 것을 포함한다. 예시적인 변화는 2개 이상의 출발 물질로부터 물리적 실체를 만드는 것, 물질을 전단시키거나 단편화하는 것, 물질을 분리 또는 정제하는 것, 2개 이상의 별도의 실체를 합하여 혼합물로 만드는 것, 공유 또는 비-공유 결합을 파괴 또는 형성하는 것을 포함하는 화학적 반응을 수행하는 것을 포함한다. 특정 값을 직접적으로 획득하는 것은 샘플 또는 또 다른 물질에 있어서의 물리적 변화를 포함하는 프로세스를 수행하는 것, 예를 들어, 물질, 예를 들어, 샘플, 분석물 또는 시약에 있어서의 물리적 변화를 포함하는 분석 프로세스를 수행하는 것 (본원에서 종종 "물리적 분석"으로서 지칭되기도 함), 예를 들어, 분석 방법, 예를 들어, 하기 중 하나 이상을 포함하는 방법을 수행하는 것을 포함한다: 특정 물질, 예를 들어, 분석물, 또는 그의 단편 또는 다른 유도체를 또 다른 물질로부터 분리 또는 정제하는 것; 분석물, 또는 그의 단편 또는 다른 유도체를 또 다른 물질, 예를 들어, 완충제, 용매 또는 반응물과 조합하는 것; 또는 예를 들어, 분석물의 제1 원자와 제2 원자 간의 공유 또는 비-공유 결합을 파괴 또는 형성함으로써 분석물, 또는 그의 단편 또는 다른 유도체의 구조를 변화시키는 것; 또는 예를 들어, 시약의 제1 원자와 제2 원자 간의 공유 또는 비-공유 결합을 파괴 또는 형성함으로써 시약, 또는 그의 단편 또는 다른 유도체의 구조를 변화시키는 것.
본원에 사용된 바와 같은 용어 "서열을 획득하는 것" 또는 "리드를 획득하는 것"은 그러한 서열 또는 리드를 "직접적으로 획득" 또는 "간접적으로 획득"함으로써, 뉴클레오티드 서열 또는 아미노산 서열의 보유를 수득하는 것을 지칭한다. 서열 또는 리드를 "직접적으로 획득하는 것"은 그러한 서열을 수득하기 위한 프로세스를 수행하는 것 (예를 들어, 합성 또는 분석 방법을 수행하는 것), 예컨대 시퀀싱 방법 (예를 들어, 차세대 시퀀싱 (NGS) 방법)을 수행하는 것을 의미한다. 서열 또는 리드를 "간접적으로 획득하는 것"은 또 다른 당사자 또는 공급처 (예를 들어, 서열을 직접적으로 획득한 제3자 실험실)로부터 서열에 대한 정보 또는 지식을 받거나 또는 상기 서열을 받는 것을 지칭한다. 획득된 서열 또는 리드는 전체 서열일 필요는 없으며, 예를 들어, 적어도 하나의 뉴클레오티드의 시퀀싱, 또는 본원에 개시된 변경 중 하나 이상이 대상체에 존재하는 것으로서 확인시켜 주는 정보 또는 지식을 수득하는 것이 서열을 획득하는 것을 구성한다.
서열 또는 리드를 직접적으로 획득하는 것은 물리적 물질, 예를 들어, 출발 물질, 예컨대 본원에 기재된 샘플에 있어서의 물리적 변화를 포함하는 프로세스를 수행하는 것을 포함한다. 예시적인 변화는 2개 이상의 출발 물질로부터 물리적 실체를 만드는 것, 물질, 예컨대 게놈 DNA 단편을 전단시키거나 단편화하는 것; 물질을 분리 또는 정제하는 것 (예를 들어, 조직으로부터 핵산 샘플을 단리하는 것); 2개 이상의 별도의 실체를 합하여 혼합물로 만드는 것, 공유 또는 비-공유 결합을 파괴 또는 형성하는 것을 포함하는 화학적 반응을 수행하는 것을 포함한다. 특정 값을 직접적으로 획득하는 것은 상기 기재된 바와 같은 샘플 또는 또 다른 물질에 있어서의 물리적 변화를 포함하는 프로세스를 수행하는 것을 포함한다. 단편의 크기 (예를 들어, 단편의 평균 크기)는 2500 bp 이하, 2000 bp 이하, 1500 bp 이하, 1000 bp 이하, 800 bp 이하, 600 bp 이하, 400 bp 이하, 또는 200 bp 이하일 수 있다. 일부 실시양태에서, 단편 (예를 들어, cfDNA)의 크기는 약 150 bp 내지 약 200 bp (예를 들어, 약 160 bp 내지 약 170 bp)이다. 일부 실시양태에서, 단편 (예를 들어, FFPE 샘플로부터의 DNA 단편)의 크기는 약 150 bp 내지 약 250 bp이다. 일부 실시양태에서, 단편 (예를 들어, FFPE 샘플 중의 RNA로부터 수득된 cDNA 단편)의 크기는 약 100 bp 내지 약 150 bp이다.
본원에 사용된 바와 같은 용어 "샘플을 획득하는 것"은 샘플을 "직접적으로 획득하는 것" 또는 "간접적으로 획득하는 것"에 의해 샘플, 예를 들어, 본원에 기재된 샘플의 보유를 수득하는 것을 지칭한다. "샘플을 직접적으로 획득하는 것"은 샘플을 수득하기 위한 프로세스를 수행하는 것 (예를 들어, 물리적 방법, 예컨대 수술 또는 추출을 수행하는 것)을 의미한다. "샘플을 간접적으로 획득하는 것"은 또 다른 당사자 또는 공급처 (예를 들어, 샘플을 직접적으로 획득한 제3자 실험실)로부터 샘플을 받는 것을 지칭한다. 샘플을 직접적으로 획득하는 것은 물리적 물질, 예를 들어, 출발 물질, 예컨대 조직, 예를 들어, 인간 환자에서의 조직 또는 환자로부터 이전에 단리시킨 조직에 있어서의 물리적 변화를 포함하는 프로세스를 수행하는 것을 포함한다. 예시적인 변화는 출발 물질로부터 물리적 실체를 만드는 것, 조직을 해부 또는 스크래핑하는 것; 물질 (예를 들어, 샘플 조직 또는 핵산 샘플)을 분리 또는 정제하는 것; 2개 이상의 별도의 실체를 합하여 혼합물로 만드는 것; 공유 또는 비-공유 결합을 파괴 또는 형성하는 것을 포함하는 화학적 반응을 수행하는 것을 포함한다. 샘플을 직접적으로 획득하는 것은, 예를 들어, 상기 기재된 바와 같은 샘플 또는 또 다른 물질에 있어서의 물리적 변화를 포함하는 프로세스를 수행하는 것을 포함한다.
본원에 사용된 바와 같은, 유전자 또는 유전자 산물 (예를 들어, 마커 유전자 또는 유전자 산물)의 "변경" 또는 "변경된 구조"는 유전자 또는 유전자 산물 내에서의 돌연변이(들), 예를 들어, 정상 또는 야생형 유전자와 비교 시 유전자 또는 유전자 산물의 무결성, 서열, 구조, 양 또는 활성에 영향을 주는 돌연변이의 존재를 지칭한다. 변경은 정상 또는 건강한 조직 또는 세포 (예를 들어, 대조군)에서의 양, 구조, 및/또는 활성과 비교 시, 암 조직 또는 암 세포에서의 양, 구조, 및/또는 활성에 있어서의 것일 수 있고, 질환 상태, 예컨대 암과 연관이 있다. 예를 들어, 암과 연관되거나 또는 항암 치료제에 대한 반응성의 예측과 연관되는 변경은 정상의 건강한 조직 또는 세포과 비교 시, 암 조직 또는 암 세포에서의 변경된 뉴클레오티드 서열 (예를 들어, 돌연변이), 아미노산 서열, 염색체 전위, 염색체 내 역위, 카피 수, 발현 수준, 단백질 수준, 단백질 활성, 후성적 변형 (예를 들어, 메틸화 또는 아세틸화 상태), 또는 번역 후 변형을 가질 수 있다. 예시적인 돌연변이는 점 돌연변이 (예를 들어, 침묵, 미스센스, 또는 넌센스), 결실, 삽입, 역위, 복제, 증폭, 전위, 염색체 간 및 염색체 내 재배열을 포함하나, 이에 제한되지는 않는다. 돌연변이는 유전자의 코딩 또는 비-코딩 영역에 존재할 수 있다. 특정 실시양태에서, 변경(들)은 재배열, 예를 들어, 하나 이상의 인트론 또는 그의 단편을 포함하는 게놈 재배열 (예를 들어, 5'- 및/또는 3'-UTR에서의 하나 이상의 재배열)로서 검출된다. 특정 실시양태에서, 변경은 표현형, 예를 들어, 암성 표현형 (예를 들어, 암 위험, 암 진행, 암 치료 또는 암 치료에 대한 저항성 중 하나 이상)과 연관되거나 연관되지 않는다. 한 실시양태에서, 변경 (또는 종양 돌연변이 부담)은 하기 중 하나 이상과 연관된다: 암에 대한 유전적 위험 인자, 양성 치료 반응 예측 인자, 음성 치료 반응 예측 인자, 양성 예후 인자, 음성 예후 인자 또는 진단 인자.
본원에 사용된 바와 같은, 용어 "indel"은 세포의 핵산에서의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 둘 다를 지칭한다. 특정 실시양태에서, indel은 하나 이상의 뉴클레오티드의 삽입과 결실 둘 다를 포함하며, 삽입과 결실 둘 다는 핵산 근처에 있다. 특정 실시양태에서, indel은 뉴클레오티드 총 수에 있어서의 순 변화를 초래한다. 특정 실시양태에서, indel은 약 1개 내지 약 50개의 뉴클레오티드의 순 변화를 초래한다.
본원에 사용된 바와 같은 용어 "클로날 프로파일"은 대상 구간 (또는 이를 포함하는 세포)의 하나 이상의 서열, 예를 들어, 대립유전자 또는 시그니처의 발생, 정체, 가변성, 분포, 발현 (서브게놈 시그니처의 전사된 카피의 발생 또는 수준), 또는 존재도, 예를 들어, 상대 존재도를 지칭한다. 한 실시양태에서, 클로날 프로파일은 특정 대상 구간에 대한 복수 개의 서열, 대립유전자, 또는 시그니처가 샘플에 존재할 때, 그러한 대상 구간 (또는 이를 포함하는 세포)에 대한 하나의 서열, 대립유전자, 또는 시그니처에 대한 상대 존재도에 대한 값이다. 예를 들어, 한 실시양태에서, 클로날 프로파일은 대상 구간에 대한 복수 개의 VDJ 또는 VJ 조합 중 하나 이상의 상대 존재도에 대한 값을 포함한다. 한 실시양태에서, 클로날 프로파일은 대상 구간에 대한 선택된 V 세그먼트의 상대 존재도에 대한 값을 포함한다. 한 실시양태에서, 클로날 프로파일은, 예를 들어, 대상 구간의 서열 내에서 체세포 과돌연변이로부터 발생하는 바와 같은 다양성에 대한 값을 포함한다. 한 실시양태에서, 클로날 프로파일은, 예를 들어, 서열, 대립유전자 또는 시그니처를 포함하는 발현된 서브게놈 구간의 발생 또는 수준에 의해 입증된 바와 같이, 상기 서열, 대립유전자 또는 시그니처의 발현 발생 또는 수준에 대한 값을 포함한다.
본원에 사용되는 바와 같은 용어 "발현된 서브게놈 구간"은 서브게놈 구간의 전사된 서열을 지칭한다. 한 실시양태에서, 발현된 서브게놈 구간의 서열은 그것이 전사되는 서브게놈 구간과 상이할 것이며, 이는 예를 들어, 일부 서열이 전사되지 않을 수 있기 때문이다.
본원에 사용되는 바와 같은 용어 "돌연변이체 대립유전자 빈도" (MAF)는, 예를 들어, 샘플 중의 특별한 로커스에서의 돌연변이체 대립유전자의 상대적 빈도를 지칭한다. 일부 실시양태에서, 돌연변이체 대립유전자 빈도는 분획 또는 백분율로서 표현된다.
본원에 사용되는 바와 같은 용어 "시그니처"는 대상 구간의 서열을 지칭한다. 시그니처는 대상 구간에서 복수 개의 가능성 중 하나의 발생을 진단할 수 있으며, 예를 들어, 시그니처는 하기를 진단할 수 있다: 재배열된 중쇄 또는 경쇄 가변 영역 유전자에서 선택된 V 세그먼트의 발생; 선택된 VJ 연접부의 발생, 예를 들어, 재배열된 중쇄 가변 영역 유전자에서 선택된 V 및 선택된 J 세그먼트의 발생. 한 실시양태에서, 시그니처는 복수 개의 특이적 핵산 서열을 포함한다. 따라서, 시그니처는 특이적 핵산 서열에 제한되지 않고, 오히려 대상 구간에서 서열 또는 가능성의 제1 군과 대상 구간에서 가능성의 제2 군을 구별할 수 있을 정도로 충분히 독특하며, 예를 들어, 제1 V 세그먼트와 제2 V 세그먼트를 구별하여, 예를 들어, 다양한 V 세그먼트의 활용을 평가할 수 있다. 용어 시그니처는 특이적 핵산 서열인, 용어 특이적 시그니처를 포함한다. 한 실시양태에서, 시그니처는 특이적 이벤트, 예를 들어, 재배열 이벤트를 표시하거나, 또는 그의 산물이다.
본원에 사용되는 바와 같은 용어 "서브게놈 구간"은 게놈 서열의 일부분을 지칭한다. 한 실시양태에서, 서브게놈 구간은 단일 뉴클레오티드 위치일 수 있으며, 예를 들어, 그 위치에서의 변이체는 종양 표현형과 (양성적으로 또는 음성적으로) 연관된다. 한 실시양태에서, 서브게놈 구간은 2개 이상의 뉴클레오티드 위치를 포함한다. 이러한 실시양태는 적어도 2, 5, 10, 50, 100, 150 또는 250개의 뉴클레오티드 위치 길이의 서열을 포함한다. 서브게놈 구간은 전체 유전자 또는 그의 일부분, 예를 들어, 코딩 영역 (또는 그의 일부분), 인트론 (또는 그의 일부분) 또는 엑손 (또는 그의 일부분)을 포함할 수 있다. 서브게놈 구간은 자연적으로 발생하는, 예를 들어, 게놈 DNA 핵산의 단편의 전부 또는 일부를 포함할 수 있다. 예를 들어, 서브게놈 구간은 시퀀싱 반응이 적용되는 게놈 DNA의 단편에 상응할 수 있다. 실시양태에서, 서브게놈 구간은 게놈 공급원으로부터의 연속 서열이다. 실시양태에서, 서브게놈 구간은 게놈 내의 인접하지 않은 서열을 포함하고, 예를 들어, cDNA 내의 서브게놈 구간은 스플라이싱의 결과로서 형성된 엑손-엑손 연접부를 포함할 수 있다.
한 실시양태에서, 서브게놈 구간은 재배열된 서열, 예를 들어, V 세그먼트를 D 세그먼트에 연결하거나, D 세그먼트를 J 세그먼트에 연결하거나, V 세그먼트를 J 세그먼트에 연결하거나, 또는 J 세그먼트를 클래스 세그먼트에 연결하는 것의 결과로서 발생하는 B 또는 T 세포에서의 서열에 상응한다.
한 실시양태에서, 서브게놈 구간은 하나의 서열로써 나타낸다. 한 실시양태에서, 서브게놈 구간은 2개 이상의 서열로써 나타내며, 예를 들어, VD 서열을 커버하는 서브게놈 구간은 2개 이상의 시그니처로써 나타낼 수 있다.
한 실시양태에서, 서브게놈 구간은 하기를 포함하거나 또는 이로 이루어진다: 단일 뉴클레오티드 위치; 유전자 내 영역 또는 유전자 간 영역; 엑손 또는 인트론, 또는 그의 단편 , 전형적으로 엑손 서열 또는 그의 단편; 코딩 영역 또는 비-코딩 영역, 예를 들어, 프로모터, 인핸서, 5' 비번역 영역 (5' UTR), 또는 3' 비번역 영역 (3' UTR), 또는 그의 단편; cDNA 또는 그의 단편; SNP; 체세포 돌연변이, 배선 돌연변이 또는 둘 다; 변경, 예를 들어, 점 또는 단일 돌연변이; 결실 돌연변이 (예를 들어, 인-프레임 결실, 유전자 내 결실, 전체 유전자 결실); 삽입 돌연변이 (예를 들어, 유전자 내 삽입); 역위 돌연변이 (예를 들어, 염색체 내 역위); 역위 복제 돌연변이; 탠덤 복제 (예를 들어, 염색체 내 탠덤 복제); 전위 (예를 들어, 염색체 전위, 비-상호 전위); 재배열 (예를 들어, 게놈 재배열 (예를 들어, 하나 이상의 인트론의 재배열, 하나 이상의 엑손의 재배열, 또는 그의 조합 및/또는 단편; 재배열된 인트론은 5'- 및/또는 3'- UTR을 포함할 수 있음)); 유전자 카피 수에 있어서의 변화; 유전자 발현에 있어서의 변화; RNA 수준에 있어서의 변화; 또는 그의 조합. "유전자의 카피 수"는 특별한 유전자 산물을 코딩하는 세포에서의 DNA 서열 수를 지칭한다. 일반적으로, 주어진 유전자에 대해, 포유 동물은 각각의 유전자의 2개 카피를 가지고 있다. 카피 수는, 예를 들어, 유전자 증폭 또는 복제에 의해 증가되거나, 또는 결실에 의해 감소될 수 있다.
본원에 사용되는 바와 같은 용어 "대상 구간"은 서브게놈 구간 또는 발현된 서브게놈 구간을 지칭한다. 한 실시양태에서, 서브게놈 구간과 발현된 서브게놈 구간은 상응한데, 이는 발현된 서브게놈 구간이 상응하는 서브게놈 구간으로부터 발현된 서열을 포함한다는 것을 의미한다. 한 실시양태에서, 서브게놈 구간과 발현된 서브게놈 구간은 상응하지 않은데, 이는 발현된 서브게놈 구간이, 상응하지 않은 서브게놈 구간으로부터 발현된 서열을 포함하지 않고, 오히려 상이한 서브게놈 구간에 상응한다는 것을 의미한다. 한 실시양태에서, 서브게놈 구간과 발현된 서브게놈 구간이 부분적으로 상응한데, 이는 발현된 서브게놈 구간이 상응하는 서브게놈 구간으로부터 발현된 서열 및 상이한 상응하는 서브게놈 구간으로부터 발현된 서열을 포함한다는 것을 의미한다.
본원에 사용된 바와 같은, 용어 "라이브러리"는 핵산 분자의 수집물을 지칭한다. 한 실시양태에서, 라이브러리는 핵산 분자의 수집물, 예를 들어, 전체 게놈, 서브게놈 단편, cDNA, cDNA 단편, RNA, 예를 들어, mRNA, RNA 단편, 또는 그의 조합의 수집물을 포함한다. 전형적으로, 핵산 분자는 DNA 분자, 예를 들어, 게놈 DNA 또는 cDNA이다. 핵산 분자는 단편화될 수 있으며, 예를 들어, 전단되거나 효소적으로 제조된 게놈 DNA이다. 핵산 분자는 대상체로부터의 서열을 포함하고 대상체로부터 유래되지 않은 서열, 예를 들어, 어댑터 서열, 프라이머 서열, 또는 확인을 허용하는 다른 서열, 예를 들어 "바코드" 서열을 또한 포함할 수 있다. 한 실시양태에서, 라이브러리 핵산 분자의 일부분 또는 전부는 어댑터 서열을 포함한다. 어댑터 서열은 한쪽 또는 양쪽 단부에 위치할 수 있다. 어댑터 서열은, 예를 들어, 시퀀싱 방법 (예를 들어, NGS 방법), 증폭, 역전사 또는 벡터로의 클로닝에 유용할 수 있다. 라이브러리는 핵산 분자, 예를 들어, 표적 핵산 분자 (예를 들어, 종양 핵산 분자, 참조 핵산 분자 또는 그의 조합)의 수집물을 포함할 수 있다. 라이브러리의 핵산 분자는 단일 개체로부터의 것일 수 있다. 실시양태에서, 라이브러리는 2명 이상의 대상체 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30명 또는 그 초과의 대상체)로부터의 핵산 분자를 포함할 수 있으며, 예를 들어, 상이한 대상체로부터의 2개 이상의 라이브러리를 조합하여, 2명 이상의 대상체로부터의 핵산 분자를 포함하는 라이브러리를 형성할 수 있다. 한 실시양태에서, 대상체는 암 또는 종양이 있거나 또는 암 또는 종양이 발생할 위험이 있는 인간이다.
"라이브러리 캐치"는 라이브러리의 서브세트, 예를 들어, 대상 구간에 대해 강화된 서브세트, 예를 들어, 표적 포획 시약과의 혼성화에 의해 포획된 산물을 지칭한다.
본원에 사용된 바와 같은, "표적 포획 시약"은 표적을 포획할 수 있는 분자를 지칭한다. 표적 포획 시약 (예를 들어, 미끼 또는 표적 포획 올리고뉴클레오티드)은 핵산 분자, 예를 들어, DNA 또는 RNA 분자를 포함할 수 있으며, 이는 이와 혼성화될 수 있으며 (예를 들어, 이에 상보적일 수 있으며), 이에 의해 표적 핵산의 포획을 허용한다. 한 실시양태에서, 표적 포획 시약은 DNA 분자 (예를 들어, 자연적으로 발생하거나 또는 변형된 DNA 분자), RNA 분자 (예를 들어, 자연적으로 발생하거나 또는 변형된 RNA 분자), 또는 그의 조합을 포함한다. 일부 실시양태에서, 표적 포획 시약은, 예를 들어, 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있는 결합 쌍의 기능적 제1 구성원을 추가로 포함한다. 다른 실시양태에서, 표적 포획 시약은 결합 쌍의 기능적 제1 구성원이 결여되며, 예를 들어, 결합 쌍의 제1 구성원은, 결합 쌍의 제1 구성원과 제2 구성원 간의 친화성이 감소 또는 제거되도록 변경되거나 차단된다. 한 실시양태에서, 표적 포획 시약은 용액 상 혼성화에 적합하다. 결합 쌍의 기능적 제1 구성원을 포함하는 표적 포획 시약은 결합 쌍의 기능적 제1 구성원이 결여된 표적 포획 시약과, 예를 들어, 상이한 비율로 혼합하여, 기질에 의한 상이한 회수 효율을 달성할 수 있으며, 이는 상이한 시퀀싱 깊이와 상관관계가 있을 수 있다. 일부 실시양태에서, 표적 포획 시약은, 예를 들어, 결합 쌍의 제1 구성원, 예를 들어, 결합 쌍의 기능적 제1 구성원을 포함시킴으로써 변형된다. 일부 실시양태에서, 표적 포획 시약은 비변형되는데, 예를 들어, 결합 쌍의 기능적 제1 구성원을 포함하지 않거나, 또는 결합 쌍의 제1 구성원이 변경 또는 차단된다.
결합 쌍의 제1 구성원은 기능적인 경우, 기질과 특이적으로 결합할 수 있는 표적 포획 시약에 직접 또는 간접적으로 부착될 수 있는 임의의 분자 태그일 수 있다. 결합 쌍의 제1 구성원은 표적 포획 시약 서열 상의 친화성 태그일 수 있다. 특정 실시양태에서, 결합 쌍의 제1 구성원은 결합 쌍의 제2 구성원, 예컨대 아비딘 분자, 또는 합텐 또는 그의 항원 결합 단편과 결합하는 항체와 결합함으로써 혼성화 혼합물로부터 표적 포획 시약/핵산 분자 혼성체의 분리를 허용한다. 결합 쌍의 예시적인 제1 구성원은 비오틴 분자, 합텐, 항체, 항체 결합 단편, 펩티드 및 단백질을 포함하나, 이에 제한되지는 않는다. 일부 실시양태에서, 기질은 비드를 포함한다.
"상보적"은 두 핵산 가닥의 영역 간의 또는 동일한 핵산 가닥의 두 영역 간의 서열 상보성을 지칭한다. 제1 핵산 영역의 아데닌 잔기는, 잔기가 티민 또는 우라실인 경우 제1 영역에 역평행한 제2 핵산 영역의 잔기와 특이적 수소 결합을 형성 ("염기 쌍형성")할 수 있는 것으로 공지되어 있다. 유사하게, 제1 핵산 가닥의 시토신 잔기는, 잔기가 구아닌인 경우 제1 가닥에 역평행한 제2 핵산 가닥의 잔기와 염기 쌍형성할 수 있는 것으로 공지되어 있다. 핵산의 제1 영역은, 두 영역이 역평행 방식으로 배열될 때, 제1 영역의 적어도 하나의 뉴클레오티드 잔기가 제2 영역의 잔기와 염기 쌍형성할 수 있는 경우, 동일하거나 상이한 핵산의 제2 영역에 상보적이다. 특정 실시양태에서, 제1 영역은 제1 부분을 포함하고 제2 영역은 제2 부분을 포함하며, 이로써 제1 부분 및 제2 부분이 역평형 방식으로 배열될 때, 제1 부분의 뉴클레오티드 잔기의 적어도 약 50%, 적어도 약 75%, 적어도 약 90%, 또는 적어도 약 95%가 제2 부분 내의 뉴클레오티드 잔기와 염기 쌍형성할 수 있다. 다른 실시양태에서, 제1 부분의 모든 뉴클레오티드 잔기가 제2 부분 내의 뉴클레오티드 잔기와 염기 쌍형성할 수 있다.
용어 "암" 및 "종양"은 본원에서 상호교환적으로 사용된다. 이들 용어는 암 유발 세포의 전형적인 특징, 예컨대 비제어된 증식, 불멸, 전이 잠재력, 급속한 성장 및 증식 속도, 및 특정의 특징적인 형태적 특징을 보유하는 세포의 존재를 지칭한다. 암 세포는 종종, 종양의 형태로 존재하지만, 그러한 세포는 동물 내에 단독으로 존재할 수 있거나, 또는 비-종양원성 암 세포, 예컨대 백혈병 세포일 수 있다. 이들 용어는 고형 종양, 연부 조직 종양 또는 전이성 병변을 포함한다. 본원에 사용된 바와 같은, 용어 "암"은 전악성 뿐만 아니라 악성 암을 포함한다.
본원에 사용된 바와 같은, "가능성이 있는" 또는 "증가된 가능성"는 항목, 물건, 사물 또는 사람이 발생할 확률이 증가하는 것을 지칭한다. 따라서, 한 예에서, 치료에 반응할 가능성이 있는 대상체는 참조 대상체 또는 대상체 군에 비해 치료에 반응할 확률이 증가한다.
"가능성이 없는" 것은 참조와 비교하여 이벤트, 항목, 물건, 사물 또는 사람이 발생할 확률이 감소하는 것을 지칭한다. 따라서, 치료에 반응할 가능성이 없는 대상체는 참조 대상체 또는 대상체 군에 비해 치료에 반응할 확률이 감소한다.
"대조군 핵산 분자"는 비-종양 세포로부터의 서열을 갖는 핵산 분자를 지칭한다.
본원에 사용된 바와 같은 "차세대 시퀀싱" 또는 "NGS" 또는 "NG 시퀀싱"은 개별 핵산 분자 (예를 들어, 단일 분자 시퀀싱에서) 또는 높은 처리량 방식 (예를 들어, 103개, 104개, 105개 또는 그 초과의 분자가 동시에 시퀀싱됨)에서 개별 핵산 분자에 대한 클로날 확장된 프록시의 뉴클레오티드 서열을 결정하는 임의의 시퀀싱 방법을 지칭한다. 한 실시양태에서, 라이브러리에 있는 핵산 종의 상대 존재도는 시퀀싱 실험에 의해 생성된 데이터에서 동족 서열의 상대적 발생 수를 카운팅함으로써 추정될 수 있다. 차세대 시퀀싱 방법은 관련 기술분야에 공지되어 있으며, 예를 들어, 문헌 [Metzker, M. (2010) Nature Biotechnology Reviews 11:31-46] (본원에 참조로 포함됨)에 기재되어 있다. 차세대 시퀀싱은 샘플 중의 핵산의 5% 미만 또는 1% 미만에 존재하는 변이체를 검출할 수 있다.
본원에 언급된 바와 같은 "뉴클레오티드 값"은 뉴클레오티드 위치를 차지하거나 이에 배정된 뉴클레오티드(들)의 정체를 나타낸다. 전형적인 뉴클레오티드 값은 하기를 포함한다: 누락 (예를 들어, 결실됨); 부가 (예를 들어, 하나 이상의 뉴클레오티드의 삽입, 그의 정체가 포함될 수 있거나 포함되지 않을 수 있음); 또는 존재 (점유됨); A; T; C; 또는 G. 다른 값은, 예를 들어, Y (여기서 Y는 A, T, G, 또는 C임)가 아닐 수 있으며; A 또는 X (여기서 X는 T, G, 또는 C 중 1개 또는 2개임); T 또는 X (여기서 X는 A, G, 또는 C 중 1개 또는 2개임); G 또는 X (여기서 X는 T, A, 또는 C 중 1개 또는 2개임); C 또는 X (여기서 X는 T, G, 또는 A 중 1개 또는 2개임); 피리미딘 뉴클레오티드; 또는 퓨린 뉴클레오티드일 수 있다. 뉴클레오티드 값은 뉴클레오티드 위치에서 1개 이상, 예를 들어, 2, 3 또는 4개의 염기 (또는 본원에 기재된 다른 값, 예를 들어, 누락 또는 부가)에 대한 빈도일 수 있다. 예를 들어, 뉴클레오티드 값은 뉴클레오티드 위치에서 A에 대한 빈도 및 G에 대한 빈도를 포함할 수 있다.
"또는"은 문맥상 달리 명확하게 표시하지 않는 한, 용어 "및/또는"을 의미하기 위해 본원에 사용되고, 상기 용어와 상호교환적으로 사용된다. 본원의 일부 장소에서 용어 "및/또는"의 사용은 문맥상 달리 명확하게 표시하지 않는 한 용어 "또는"의 사용이 용어 "및/또는"과 상호교환될 수 없다는 것을 의미하지 않는다.
"1차 대조군"은 샘플 중의 정상 인접 조직 (NAT)이 아닌 비-종양 조직을 지칭한다. 혈액은 전형적인 1차 대조군이다.
본원에 사용된 바와 같은 "샘플"은 본원에 기재된 바와 같이, 관심 공급원으로부터 수득되거나 유래된 생물학적 샘플을 지칭한다. 일부 실시양태에서, 관심 공급원은 유기체, 예컨대 동물 또는 인간을 포함한다. 샘플의 공급원는 신선한, 동결된 및/또는 보존된 기관, 조직 샘플, 생검, 절제, 도말 또는 흡인물으로부터 수득된 것과 같은 고형 조직; 혈액 또는 임의의 혈액 구성분; 체액, 예컨대 뇌 척수액, 양수, 복막 액 또는 간질 액; 또는 대상체의 임신 또는 발달 중 임의의 시간으로부터의 세포일 수 있다. 일부 실시양태에서, 샘플의 공급원은 혈액 또는 혈액 구성분이다.
일부 실시양태에서, 샘플은 생물학적 조직 또는 체액이거나 또는 이를 포함한다. 샘플은 자연에 있는 조직과 자연적으로 혼합되지 않는 화합물, 예컨대 보존제, 항응고제, 완충제, 고정제, 영양소, 항생제 등을 함유할 수 있다. 한 실시양태에서, 샘플은 동결된 샘플로서 보존되거나 또는 포름알데히드 또는 파라포름알데히드 고정 파라핀 포매 (FFPE) 조직 제제로서 보존된다. 예를 들어, 샘플은 매트릭스, 예를 들어, FFPE 블록 또는 동결된 샘플에 포매될 수 있다. 또 다른 실시양태에서, 샘플은 혈액 또는 혈액 구성분 샘플이다. 또한 또 다른 실시양태에서, 샘플은 골수 흡인물 샘플이다. 또 다른 실시양태에서, 샘플은 무세포 DNA (cfDNA)를 포함한다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서 cfDNA는 아폽토시스 또는 괴사성 세포로부터의 DNA인 것으로 여겨진다. 전형적으로, cfDNA는 단백질 (예를 들어, 히스톤)에 의해 결합되고 뉴클레아제에 의해 보호된다. cfDNA는 비-침습적 산전 검사 (NIPT), 장기 이식, 심근병증, 마이크로바이옴 및 암에 대한 바이오마커로서 사용될 수 있다. 또 다른 실시양태에서, 샘플은 순환 종양 DNA (ctDNA)를 포함한다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, ctDNA는 종양 세포 대 비-종양 세포로부터 유래되는 것을 구별할 수 있는 유전적 또는 후성적 변경 (예를 들어, 체세포 변경 또는 메틸화 시그니처)를 갖는 cfDNA인 것으로 여겨진다. 또 다른 실시양태에서, 샘플은 순환 종양 세포 (CTC)를 포함한다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, CTC는 원발성 또는 전이성 종양으로부터 순환계로 배출되는 세포인 것으로 여겨진다. 일부 실시양태에서, CTC는 아폽토시스하고 혈액/림프 내의 ctDNA의 공급원이다.
일부 실시양태에서, 생물학적 샘플은 골수; 혈액; 혈액 세포; 복수; 조직 또는 미세 바늘 생검 샘플; 세포 함유 체액; 자유 부동 핵산; 담; 타액; 소변; 뇌 척수액, 복막 액; 흉막 액; 대변; 림프; 부인과 체액; 피부 면봉; 질 면봉; 구강 면봉; 비강 면봉; 세정액 또는 세척액, 예컨대 관 세척액 또는 기관지 폐포 세척액; 흡인물; 스크래핑; 골수 표본; 조직 생검 표본; 수술 표본; 대변, 다른 체액, 분비물 및/또는 배설물; 및/또는 그로부터의 세포 등일 수 있거나 또는 이를 포함한다. 일부 실시양태에서, 생물학적 샘플은 개체로부터 수득된 세포이거나 또는 이를 포함한다. 일부 실시양태에서, 수득된 세포는 그로부터 샘플을 수득한 개체로부터의 세포이거나 또는 이를 포함한다.
일부 실시양태에서, 샘플은 임의의 적절한 수단에 의해 관심 공급원으로부터 직접적으로 수득된 "1차 샘플"이다. 예를 들어, 일부 실시양태에서, 1차 생물학적 샘플은 생검 (예를 들어, 미세 바늘 흡인물 또는 조직 생검), 수술, 체액 (예를 들어, 혈액, 림프 또는 대변) 수집 등으로부터 선택된 방법에 의해 수득된다. 일부 실시양태에서, 문맥상 명백한 바와 같이, 용어 "샘플"은 1차 샘플을 프로세싱하는 것 (예를 들어, 하나 이상의 성분을 제거하고/하거나 하나 이상의 작용제를 부가하는 것), 예를 들어, 반투과성 막을 사용하여 여과하는 것에 의해 수득되는 제제를 지칭한다. 이러한 "프로세싱된 샘플"은, 예를 들어, 샘플로부터 추출되거나, 또는 1차 샘플에 mRNA의 증폭 또는 역전사, 특정 성분의 단리 및/또는 정제 등과 같은 기술을 적용함으로써 수득된 핵산 또는 단백질을 포함할 수 있다.
한 실시양태에서, 샘플은 종양과 연관된 세포, 예를 들어, 종양 세포 또는 종양 침윤 림프구 (TIL)이다. 한 실시양태에서, 샘플은 하나 이상의 전악성 또는 악성 세포를 포함한다. 한 실시양태에서, 샘플은 혈액 악성 종양 (또는 전악성 종양), 예를 들어, 본원에 기재된 혈액 악성 종양 (또는 전악성 종양)으로부터 획득된다. 특정 실시양태에서, 샘플은 고형 종양, 연부 조직 종양 또는 전이성 병변으로부터 획득된다. 다른 실시양태에서, 샘플은 수술 절제면으로부터의 조직 또는 세포를 포함한다. 또 다른 실시양태에서, 샘플은 하나 이상의 순환 종양 세포 (CTC) (예를 들어, 혈액 샘플로부터 획득된 CTC)를 포함한다. 한 실시양태에서, 샘플은 종양과 연관되지 않은 세포, 예를 들어, 비-종양 세포 또는 말초 혈액 림프구이다.
본원에 사용된 바와 같은, "감도"는 이질적 서열 집단에서 서열 변이체를 검출할 수 있는 방법의 능력의 측정 기준이다. 서열 변이체가 샘플 중의 서열의 적어도 F%로서 존재하는 샘플을 고려하여, 방법이 C%의 신뢰도, 횟수의 S%에서 서열을 검출할 수 있는 경우, 이러한 방법은 F%의 변이체에 대해 S%의 감도를 갖는다. 예로서, 변이체 서열이 샘플 중의 서열의 적어도 5%로서 존재하는 샘플을 고려하여, 방법이 99%의 신뢰도, 10회 중 9회에서 서열을 검출할 수 있는 경우, 이러한 방법은 5%의 변이체에 대해 90%의 감도를 갖는다 (F=5%; C=99%; S=90%). 예시적인 감도는 C=90%, 95%, 99%, 및 99.9%의 신뢰도 수준에서 F=1%, 5%, 10%, 20%, 50%, 100%에서 서열 변이체에 대한 S=90%, 95%, 99%의 것을 포함한다.
본원에 사용된 바와 같은, "특이성"은 실제로 발생하는 서열 변이체를 시퀀싱 인공물 또는 다른 밀접하게 관련된 서열과 구별할 수 있는 방법의 능력의 측정 기준이다. 이는 거짓 양성 검출을 피할 수 있는 능력이다. 거짓 양성 검출은 샘플 제조 동안 관심 서열 내로 도입된 오류, 시퀀싱 오류, 또는 밀접하게 관련된 서열, 예컨대 유전자 패밀리의 위 유전자 또는 핵산 분자의 우발적 시퀀싱으로 인해 발생할 수 있다. Xtrue 서열이 실제 변이체이고 XNot true가 실제가 아닌 변이체인 NTotal 서열의 샘플 세트에 적용될 때, 방법이 실제가 아닌 변이체의 적어도 X%를 변이체가 아닌 것으로서 선택하는 경우에, 그 방법은 X%의 특이성을 갖는다. 예를 들어, 500개 서열이 실제 변이체이고 500개가 실제가 아닌 변이체인 1,000개 서열의 샘플 세트에 적용될 때, 방법이 500개의 실제가 아닌 변이체 서열의 90%를 변이체가 아닌 것으로서 선택하는 경우에, 그 방법은 90%의 특이성을 갖는다. 예시적인 특이성은 90, 95, 98, 및 99%를 포함한다.
본원에 사용된 바와 같은 "종양 핵산"은 종양 또는 암으로부터의 핵산 분자를 지칭한다. 전형적으로, 이는 종양 또는 암 샘플로부터의 DNA, 예를 들어, 게놈 DNA, 또는 RNA로부터 유래된 cDNA이다. 특정 실시양태에서, 종양 핵산 샘플은 정제되거나 단리된다 (예를 들어, 그의 자연 상태로부터 제거됨). 일부 실시양태에서, 종양 핵산은 cfDNA이다. 일부 실시양태에서, 종양 핵산은 ctDNA이다. 일부 실시양태에서, 종양 핵산은 CTC로부터의 DNA이다.
본원에 사용된 바와 같은, "대조군 핵산" 또는 "참조 핵산"은 대조군 또는 참조 샘플로부터의 핵산 분자를 지칭한다. 전형적으로, 이는 유전자 또는 유전자 산물에서의 변경 또는 변이를 함유하지 않는 DNA, 예를 들어, 게놈 DNA, 또는 RNA로부터 유래된 cDNA이다. 특정 실시양태에서, 참조 또는 대조군 핵산 샘플은 야생형 또는 비-돌연변이된 서열이다. 특정 실시양태에서, 참조 핵산 샘플은 정제되거나 단리된다 (예를 들어, 그의 자연 상태로부터 제거됨). 다른 실시양태에서, 참조 핵산 샘플은 동일하거나 상이한 대상체로부터의 혈액 대조군, 정상 인접 조직 (NAT), 또는 임의의 다른 비-암성 샘플로부터의 것이다. 일부 실시양태에서, 참조 핵산 샘플은 정상 DNA 혼합물을 포함한다. 일부 실시양태에서, 정상 DNA 혼합물은 프로세스 매칭된 대조군이다. 일부 실시양태에서, 참조 핵산 샘플은 배선 변이체를 갖는다. 일부 실시양태에서, 참조 핵산 샘플은 체세포 변경을 갖지 않으며, 예를 들어, 음성 대조군으로서 제공된다.
핵산 분자를 "시퀀싱"하려면 분자 (예를 들어, DNA 분자, RNA 분자 또는 RNA 분자로부터 유래된 cDNA 분자)에서 적어도 1개의 뉴클레오티드의 정체를 결정해야한다. 실시양태에서 분자 내의 뉴클레오티드의 모두보다 적은 것의 정체가 결정된다. 다른 실시양태에서, 분자 내의 뉴클레오티드의 대다수 또는 모두의 정체가 결정된다.
본원에 사용된 바와 같은, "임계 값"은 뉴클레오티드 값을 대상 구간 (예를 들어, 서브게놈 구간 또는 발현된 서브게놈 구간)에 배정하기 위해 존재해야 하는 리드의 수의 함수인 값이다. 예를 들어, 이는 특이적 뉴클레오티드 값, 예를 들어, 뉴클레오티드 위치에서 "A"를 갖는 리드의 수의 함수이며, 그 뉴클레오티드 값을 서브게놈 구간에서 그 뉴클레오티드 위치에 배정하는데 필요하다. 임계 값은, 예를 들어, 리드의 수, 예를 들어, 정수로서, 또는 그 값을 갖는 리드의 분율로서 (또는 그의 함수로서) 표현될 수 있다. 예로서, 임계 값이 X이고 "A"의 뉴클레오티드 값을 갖는 X+1 리드가 존재하는 경우, "A"의 값은 대상 구간 (예를 들어, 서브게놈 구간 또는 발현된 서브게놈 구간) 내의 그 위치에 배정된다. 임계 값은 또한 돌연변이 또는 변이체 예상치, 돌연변이 빈도 또는 베이지안 이전의 함수로서 표현될 수 있다. 한 실시양태에서, 돌연변이 빈도는 특정 뉴클레오티드 값을 호출하기 위해 특정 위치에 그 뉴클레오티드 값, 예를 들어, A 또는 G를 갖는 리드의 수 또는 분율을 필요로 할 것이다. 실시양태에서 임계 값은 돌연변이 예상치, 예를 들어, 돌연변이 빈도 및 종양 유형의 함수일 수 있다. 예를 들어, 환자가 제1 종양 유형을 갖는 경우에는 뉴클레오티드 위치에서의 변이체가 제1 임계 값을 가질 수 있었고, 환자가 제2 종양 유형을 갖는 경우에는 제2 임계 값을 가질 수 있었다.
본원에 사용된 바와 같은, "표적 핵산 분자"은 핵산 라이브러리로부터 단리하고자 하는 핵산 분자를 지칭한다. 한 실시양태에서, 표적 핵산 분자는 본원에 기재된 바와 같은, 종양 핵산 분자, 참조 핵산 분자 또는 대조군 핵산 분자일 수 있다.
본원에 사용된 바와 같은, "종양 핵산 분자" 또는 다른 유사한 용어 (예를 들어, "종양 또는 암 관련 핵산 분자")는 종양 세포로부터의 서열을 갖는 핵산 분자를 지칭한다. 한 실시양태에서, 종양 핵산 분자는 암성 표현형과 연관된 변경 (예를 들어, 돌연변이)을 갖는 서열 (예를 들어, 뉴클레오티드 서열)을 갖는 대상 구간을 포함한다. 다른 실시양태에서, 종양 핵산 분자는 야생형 서열 (예를 들어, 야생형 뉴클레오티드 서열)을 갖는 대상 구간을 포함한다. 예를 들어, 이형접합성 또는 동형접합성 야생형 대립유전자로부터의 대상 구간이 암 세포에 존재한다. 종양 핵산 분자는 참조 핵산 분자를 포함할 수 있다.
본원에 사용된 바와 같은, "참조 핵산 분자," 또는 다른 유사한 용어 (예를 들어, "대조군 핵산 분자")는 암성 표현형과 연관되지 않은 서열 (예를 들어, 뉴클레오티드 서열)을 갖는 대상 구간을 포함하는 핵산 분자를 지칭한다. 한 실시양태에서, 참조 핵산 분자는 돌연변이될 때 암성 표현형과 연관되는 유전자 또는 유전자 산물의 야생형 또는 비-돌연변이된 뉴클레오티드 서열을 포함한다. 참조 핵산 분자는 암 세포 또는 비-암 세포에 존재할 수 있다.
본원에 사용된 바와 같은, "변이체"는 2개 이상의 구조, 예를 들어, 다형성 로커스에서 대립유전자를 가질 수 있는 서브게놈 구간에 존재할 수 있는 구조를 지칭한다.
"단리된" 핵산 분자는 핵산 분자의 자연 공급원에 존재하는 다른 핵산 분자로부터 분리되는 것이다. 특정 실시양태에서, "단리된" 핵산 분자는 그로부터 핵산이 유래되는 유기체의 게놈 DNA 내의 핵산 (즉, 핵산의 5' 및 3' 단부에 위치한 서열)을 자연적으로 플랭킹하는 서열 (예컨대 단백질 코딩 서열)이 없다. 예를 들어, 다양한 실시양태에서, 단리된 핵산 분자는 그로부터 핵산이 유래되는 세포의 게놈 DNA 내의 핵산 분자를 자연적으로 플랭킹하는 뉴클레오티드 서열 약 5 kB 미만, 약 4 kB 미만, 약 3 kB 미만, 약 2 kB 미만, 약 1 kB 미만, 약 0.5 kB 미만 또는 약 0.1 kB 미만을 함유할 수 있다. 더욱이, "단리된" 핵산 분자, 예컨대 RNA 분자 또는 cDNA 분자는, 예를 들어, 재조합 기술에 의해 생산될 때 다른 세포성 물질 또는 배양 배지가 실질적으로 없을 수 있거나, 또는 예를 들어, 화학적으로 합성될 때 화학적 전구체 또는 다른 화학 물질이 실질적으로 없을 수 있다.
"다른 세포성 물질 또는 배양 배지가 실질적으로 없다"는 것은 분자가 그로부터 단리되거나 재조합적으로 생산되는 세포의 세포성 성분으로부터 분리되는 핵산 분자의 제제를 포함한다. 따라서, 세포성 물질이 실질적으로 없는 핵산 분자는 다른 세포성 물질 또는 배양 배지를 약 30% 미만, 약 20% 미만, 약 10% 미만, 또는 약 5% 미만 (건조 중량 기준) 갖는 핵산 분자의 제제를 포함한다.
본원에 사용된 바와 같은, "X는 Y의 함수이다"는, 예를 들어, 하나의 변수 X가 또 다른 변수 Y와 연관되어 있음을 의미한다. 한 실시양태에서, X가 Y의 함수이면, X와 Y 간의 인과 관계가 암시될 수 있지만, 반드시 존재하지는 않는다.
예를 들어, (a), (b), (i) 등의 제목은 본 명세서 및 청구범위를 쉽게 판독하기 위해서만 제시된다. 본 명세서 또는 청구범위에서의 제목의 사용은 알파벳순 또는 숫자 순 또는 제시된 순서로 수행되는 단계 또는 요소를 요구하지 않는다. 본 명세서 또는 청구범위에서의 제목의 사용은 또한, 단계 또는 요소 모두의 수행을 요구하지 않는다.
표적 포획 시약의 경쟁
혼성체 포획 (예를 들어, 용액 또는 고체 상에서)는 전체 게놈 또는 전사체 라이브러리로부터의 관심 유전자를 강화시키기 위해 사용될 수 있다. 예를 들어, 혼성화 반응은 5' 비오티닐화된 표적 포획 시약 (예를 들어, 단일 가닥 DNA (ssDNA) 또는 이중 가닥 DNA (dsRNA))을 사용하여 표적 영역과 혼성화되고, 후속 적으로 스트렙타비딘 코팅된 상자성 비드에 대한 dsDNA 포획 복합체의 친화성 포획, 표적을 벗어난 서열을 제거하기 위한 완충액으로의 엄격한 세척 및 표적 분자를 증폭시키기 위한 강화 후 PCR을 사용할 수 있다. 일부 실시양태에서, 목표는 표적 영역 전체에 걸쳐 균일한 커버리지를 갖는 것이지만, 표적 포획 시약 세트에서 표적 전체에 걸친 커버리지에 있어서의 변이는 표적 서열 특이적일 수 있으며, 높은 GC 또는 AT 함량 및 반복적 서열은 포획 효율을 초과 또는 미달시킬 수 있다. 입력 전체 게놈 라이브러리에서의 독특한 표적의 효율적인 포획을 구동시키기 위해, 표적 포획 시약 (예를 들어, 미끼)을 과잉 중복 (예를 들어, >50X) 타일링하는 것이 전형적으로 포획 반응에 사용된다. 과잉 표적 포획 시약과 표적 전체에 걸친포획 효율 상의 차이를 이용하여, 표적당 커버리지는 일반적으로 샘플 유형 전체에 걸쳐 예측가능하고 재현가능하지만, 단순히 표적 포획 시약의 양을 조정하는 것만으로는 높거나 낮은 커버리지로 조정할 수 없다.
특정 적용 (예를 들어, 액체 생검 검정)에서는 낮은 빈도로 게놈 라이브러리에 존재할 수 있는 관심 변경을 갖는 영역에 대해 높은 독특한 커버리지을 갖는 것이 필요하다. 다른 정보 영역 (예를 들어, 성별 SNP, 샘플 확인 SNP, 염색체 카피 수 호출을 위한 일배체형 형성 SNP, 또는 종양 돌연변이 부담 또는 다른 게놈 시그니처, 예를 들어, 연속/복합 바이오마커)은 높은 커버리지가 필요하지 않을 수 있으며, 종종 표적 포획 시약 세트에서 특정 성분으로서 포획되고, 별도의 반응에서 과다 시퀀싱 또는 시퀀싱되고 더 낮은 깊이에서 시퀀싱된다. 특정 실시양태에서, 동일한 샘플 라이브러리의 다수의 반응을 프로세싱하는 것은 제한된 라이브러리 물질을 사용하는데 있어서 비효율적이며, 검정 워크플로우에 복잡성을 부가하고 시퀀싱 비용을 증가시킬 수 있다.
본원에 기재된 방법은, 예를 들어, 비변형된 표적 포획 시약과 변형된 (예를 들어, 5' 비오티닐화된) 표적 포획 시약의 조합을 사용하여, 특이적 표적당 기준으로 표적 커버리지를 조정한다. 특정 실시양태에서, 표적 포획 시약 상의 변형 (예를 들어, 5' 비오틴)은 게놈 라이브러리에서 비-표적으로부터 표적에 적중한 것을 분리하는데에만 사용되며, 비-변형된 표적 포획 시약을 사용함으로써, 동일한 반응 조건이 진행될 수 있지만, 게놈 라이브러리로부터 추출되고 또한 후속적으로 시퀀싱된 표적의 양은, 변형된 표적 포획 시약 대 비변형된 표적 포획 시약의 비율에 의한 것일 수 있다. 본원에 기재된 방법은 단일 표적 포획 시약 반응의 사용을 허용하고 낮은, 높은 및 중간 정도의 표적 커버리지를 나타내는 단일 포획 라이브러리를 갖는다.
샘플
다양한 조직이 본 방법에 사용되는 샘플의 공급원이 될 수 있다. 게놈 또는 서브게놈 핵산 (예를 들어, DNA 또는 RNA)은 대상체의 샘플 (예를 들어, 종양 세포를 포함하는 샘플, 혈액 샘플, 혈액 구성분 샘플, 무세포 DNA (cfDNA)를 포함하는 샘플, 순환 종양 DNA (ctDNA)를 포함하는 샘플, 순환 종양 세포 (CTC)를 포함하는 샘플, 또는 임의의 정상 대조군 (예를 들어, 정상 인접 조직 (NAT)))로부터 단리될 수 있다.
일부 실시양태에서, 샘플은, 예를 들어, 종양으로부터의 핵산, 예를 들어, DNA, RNA, 또는 둘 다를 포함한다. 핵산은 DNA 또는 RNA일 수 있다. 특정 실시양태에서, 샘플은, 예를 들어, 종양으로부터의 비-핵산 성분, 예를 들어, 세포, 단백질, 탄수화물, 또는 지질을 포함한다. 특정 실시양태에서, 샘플은 정상 세포 또는 조직으로부터의 핵산을 추가로 포함한다.
특정 실시양태에서, 샘플은 동결된 샘플로서 보존되거나 또는 포름알데히드 또는 파라포름알데히드 고정 파라핀 포매 (FFPE) 조직 제제로서 보존된다. 예를 들어, 샘플은 매트릭스, 예를 들어, FFPE 블록 또는 동결된 샘플에 포매될 수 있다. 특정 실시양태에서, 샘플은 혈액 샘플이다. 특정 실시양태에서, 조직 샘플은 혈액 구성분 샘플이다. 특정 실시양태에서, 샘플은 혈장 샘플이다. 특정 실시양태에서, 샘플은 혈청 샘플이다. 특정 실시양태에서, 샘플은 cfDNA 샘플이다. 특정 실시양태에서, 샘플은 ctDNA 샘플이다. 특정 실시양태에서, 샘플은 CTC 샘플이다. 다른 실시양태에서, 조직 샘플은 골수 흡인물 (BMA) 샘플이다. 특정 실시양태에서, 샘플은 소변 샘플이다. 단리 단계는 개별 염색체를 유동 분류하는 것; 및/또는 대상체의 샘플 (예를 들어, 본원에 기재된 샘플)을 미세해부하는 것을 포함할 수 있다.
다른 실시양태에서, 샘플은 하나 이상의 전악성 또는 악성 세포를 포함한다. 특정 실시양태에서, 샘플은 고형 종양, 연부 조직 종양 또는 전이성 병변으로부터 획득된다. 특정 실시양태에서, 샘플은 혈액 악성 종양 또는 전악성 종양으로부터 획득된다. 다른 실시양태에서, 샘플은 수술 절제면으로부터의 조직 또는 세포를 포함한다. 특정 실시양태에서, 샘플은 종양 침윤 림프구를 포함한다. 샘플은 조직학적으로 정상적인 조직일 수 있다. 한 실시양태에서, 샘플은 하나 이상의 비-악성 세포를 포함한다.
특정 실시양태에서, FFPE 샘플은 하기 특성 중 1가지, 2가지 또는 모두를 갖는다: (a) 약 10 mm2 이상, 약 25 mm2 이상, 또는 약 50 mm2 이상의 표면적을 갖고/갖거나; (b) 약 0.1 mm3 이상, 약 0.2 mm3 이상, 약 0.3 mm3 이상, 약 0.4 mm3 이상, 약 0.5 mm3 이상, 약 0.6 mm3 이상, 약 0.7 mm3 이상, 약 0.8 mm3 이상, 약 0.9 mm3 이상, 약 1 mm3 이상, 약 2 mm3 이상, 약 3 mm3 이상, 약 4 mm3 이상, 또는 약 5 mm3 이상의 샘플 용적을 갖고/갖거나; (c) 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 또는 약 90% 이상의 세포성을 갖고/갖거나; (d) 약 10,000개 이상 세포, 약 20,000개 이상 세포, 약 30,000개 이상 세포, 약 40,000개 이상 세포, 또는 약 50,000개 이상 세포의 유핵 세포의 카운트를 갖는다.
한 실시양태에서, 상기 방법은 샘플, 예를 들어, 본원에 기재된 샘플을 획득하는 것을 추가로 포함한다. 샘플은 직접적으로 또는 간접적으로 획득할 수 있다. 한 실시양태에서, 샘플은 cfDNA를 포함하는 샘플로부터, 예를 들어, 단리 또는 정제에 의해 획득된다. 한 실시양태에서, 샘플은 ctDNA를 포함하는 샘플로부터, 예를 들어, 단리 또는 정제에 의해 획득된다. 한 실시양태에서, 샘플은 악성 세포와 비-악성 세포 (예를 들어, 종양 침윤 림프구) 둘 다를 포함하는 샘플로부터, 예를 들어, 단리 또는 정제에 의해 획득된다. 한 실시양태에서, 샘플은 CTC를 포함하는 샘플로부터, 예를 들어, 단리 또는 정제에 의해 획득된다.
다른 실시양태에서, 상기 방법은 본원에 기재된 방법을 사용하여, 예를 들어, 수술 절제면으로부터의 샘플, 예를 들어, 조직학적으로 정상적인 샘플을 평가하는 것을 포함한다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, 조직학적으로 정상적인 조직 (예를 들어, 그렇지 않으면 조직학적으로 정상적인 조직 절제면)으로부터 수득된 샘플은 본원에 기재된 바와 같은 변경을 여전히 가질 수 있다고 여겨진다. 따라서, 상기 방법은 검출된 변경의 존재에 기반하여 샘플을 재분류하는 것을 추가로 포함할 수 있다. 한 실시양태에서, 예를 들어, 상이한 대상체로부터의 다수의 샘플이 동시에 프로세싱된다.
한 실시양태에서, 상기 방법은 단리된 핵산 샘플을 제공하기 위해 샘플로부터 핵산을 단리하는 것을 포함한다. 한 실시양태에서, 상기 방법은 단리된 대조군 핵산 샘플을 제공하기 위해 대조군으로부터 핵산을 단리하는 것을 포함한다. 한 실시양태에서, 방법은 검출가능한 핵산이 없는 샘플을 거부하는 것을 추가로 포함합니다.
한 실시양태에서, 상기 방법은 1차 대조군이 이용가능한지를 결정하는 것, 및 그렇다면 상기 1차 대조군으로부터 대조군 핵산 (예를 들어, DNA)을 단리하는 것을 추가로 포함한다. 한 실시양태에서, 상기 방법은 (예를 들어, 1차 대조군 샘플을 이용가능하지 않은 경우) NAT가 상기 샘플에 존재하는지를 결정하는 것을 추가로 포함한다. 한 실시양태에서, 방법은, 예를 들어, 1차 대조군을 동반하지 않은 샘플 중의 상기 NAT로부터 비-종양 조직을 거시 해부함으로써 비-종양 세포에 대해 강화된 하위 샘플을 획득하는 것을 추가로 포함한다. 한 실시양태에서, 방법은 1차 대조군이 이용가능하지 않고 NAT가 이용가능하지 않다는 것을 결정하는 것, 및 매칭된 대조군 없이 분석하기 위해 상기 샘플을 표시하는 것을 추가로 포함한다.
한 실시양태에서, 방법은 상기 샘플 중의 핵산 수율에 대한 값을 획득하는 것, 및 이와 같이 획득된 값을 참조 기준과 비교하는 것으로서, 예를 들어, 여기서 상기 획득된 값이 상기 참조 기준보다 작은 경우, 라이브러리 구축 이전에 핵산을 증폭하는 것을 추가로 포함한다. 한 실시양태에서, 방법은 상기 샘플에서 핵산 단편의 크기에 대한 값을 획득하는 것, 및 이와 같이 획득된 값을 참조 기준, 예를 들어, 적어도 300, 600, 또는 900 bp의 크기, 예를 들어, 평균 크기와 비교하는 것을 추가로 포함한다. 본원에 기재된 파라미터는 이러한 결정에 대응하여 조정되거나 선택될 수 있다.
특정 실시양태에서, 상기 방법은 오래된 샘플, 예를 들어, 오래된 FFPE 샘플로부터 핵산을 단리하는 것을 포함한다. 오래된 샘플은, 예를 들어, 1년, 2년, 3년, 4년, 5년, 10년, 15년, 20년, 25년, 50년, 75년 또는 100년 이상된 것일 수 있다.
핵산은 다양한 크기의 샘플로부터 수득될 수 있다. 예를 들어, 핵산은 5 내지 200 μm, 또는 그 초과의 샘플로부터 단리될 수 있다. 예를 들어, 샘플은 5 μm, 10 μm, 20 μm, 30 μm, 40 μm, 50 μm, 70 μm, 100 μm, 110 μm, 120 μm, 150 μm 또는 200 μm 또는 그 초과를 측정할 수 있다.
샘플로부터 DNA 단리를 위한 프로토콜은, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426의 실시예 1에 제공된 바와 같이, 관련 기술분야에 공지되어 있다. 포름알데히드 또는 파라포름알데히드 고정 파라핀 포매 (FFPE) 조직으로부터 핵산 (예를 들어, DNA)을 단리하는 부가의 방법은, 예를 들어, 문헌 [Cronin M. et al., (2004) Am J Pathol. 164(1):35-42; Masuda N. et al., (1999) Nucleic Acids Res. 27(22):4436-4443; Specht K. et al., (2001) Am J Pathol. 158(2):419-429], 암비온 리커버올(Ambion RecoverAll™) 전체 핵산 단리 프로토콜 (암비온, Cat. No. AM1975; 2008년 9월), 맥스웰(Maxwell®) 16 FFPE 플러스 LEV DNA 정제 키트 기술 매뉴얼 (프로메가(Promega) 문헌 #TM349; 2011년 2월), E.Z.N.A.® FFPE DNA 키트 핸드북 (오메가 바이오-텍(OMEGA bio-tek; 미국 조지아주 노크로스), 제품 번호 D3399-00, D3399-01, 및 D3399-02; 2009년 6월), 및 QIAamp® DNA FFPE 조직 핸드북 (퀴아젠(Qiagen), Cat. No. 37625; 2007년 10월)에 개시된다. 리커버올™ 전체 핵산 단리 키트는 고온에서 크실렌을 사용하여 파라핀 포매 샘플을 가용화시키고 유리 섬유 필터를 사용하여 핵산을 포획한다. 맥스웰® 16 FFPE 플러스 LEV DNA 정제 키트는 맥스웰® 16 기기와 함께 FFPE 조직의 1 내지 10 μm 절편의 게놈 DNA를 정제하는데 사용된다. DNA는 실리카 클래드 상자성 입자 (PMP)를 사용하여 정제되고 낮은 용출 용적으로 용출된다. E.Z.N.A.® FFPE DNA 키트는 게놈 DNA의 단리를 위해 스핀 컬럼 및 완충제 시스템을 사용한다. QIAamp® DNA FFPE 조직 키트는 QIAamp® DNA 마이크로 기술을 사용하여 게놈 및 미토콘드리아 DNA를 정제한다. 혈액으로부터 DNA 단리를 위한 프로토콜은, 예를 들어, 맥스웰® 16 LEV 혈액 DNA 키트 및 맥스웰 16 구강 면봉 LEV DNA 정제 키트 기술 매뉴얼 (프로메가 문헌 #TM333; 2011년 1월 1일)에 개시된다.
RNA 단리를 위한 프로토콜은, 예를 들어, 맥스웰® 16 전체 RNA 정제 키트 기술 회보 (프로메가 문헌 #TB351; 2009년 8월)에 개시된다.
단리된 핵산 (예를 들어, 게놈 DNA)은 일상적인 기술을 실시함으로써 단편화되거나 전단될 수 있다. 예를 들어, 게놈 DNA는 물리적 전단 방법, 효소적 절단 방법, 화학적 절단 방법 및 관련 기술분야의 통상의 기술자에게 널리 공지된 다른 방법에 의해 단편화될 수 있다. 핵산 라이브러리는 게놈의 복잡성을 모두 또는 실질적으로 모두 함유할 수 있다. 이러한 맥락에서 용어 "실질적으로 모두"는 절차의 초기 단계 동안 실제로 원치 않는 게놈 복잡성의 일부 손실이 발생할 수 있는 가능성을 지칭한다. 본원에 기재된 방법은 또한, 핵산 라이브러리가 게놈의 일부분인 경우, 예를 들어, 게놈의 복잡성이 설계에 의해 감소되는 경우에 유용하다. 일부 실시양태에서, 게놈의 임의의 선택된 부분은 본원에 기재된 방법과 함께 사용될 수 있다. 특정 실시양태에서, 전체 엑솜 또는 그의 서브세트가 단리된다.
특정 실시양태에서, 상기 방법은 라이브러리 (예를 들어, 본원에 기재된 바와 같은 핵산 라이브러리)를 제공하기 위해 샘플로부터 핵산을 단리하는 것을 추가로 포함한다. 특정 실시양태에서, 샘플은 전체 게놈, 서브게놈 단편 또는 둘 다를 포함한다. 단리된 핵산은 핵산 라이브러리를 제조하기 위해 사용될 수 있다. 전체 게놈 또는 서브게놈 단편으로부터 라이브러리를 단리하고 제조하기 위한 프로토콜은 관련 기술분야에 공지되어 있다 (예를 들어, 일루미나(Illumina)의 게놈 DNA 샘플 제조 키트). 특정 실시양태에서, 게놈 또는 서브게놈 DNA 단편은 대상체의 샘플 (예를 들어, 본원에 기재된 샘플)로부터 단리된다. 한 실시양태에서, 샘플은, 예를 들어, 매트릭스, 예를 들어, FFPE 블록 또는 동결된 샘플에 포매된 보존된 표본이다. 특정 실시양태에서, 단리 단계는 개별 염색체를 유동 분류하는 것; 및/또는 샘플을 미세해부하는 것을 포함한다. 특정 실시양태에서, 핵산 라이브러리를 생성하기 위해 사용되는 핵산의 양은 5 마이크로그램 미만, 1 마이크로그램 미만, 또는 500 ng 미만, 200 ng 미만, 100 ng 미만, 50 ng 미만, 10 ng 미만, 5 ng 미만, 또는 1 ng 미만이다.
또한 다른 실시양태에서, 라이브러리를 생성하기 위해 사용되는 핵산은 RNA 또는 RNA로부터 유래된 cDNA를 포함한다. 일부 실시양태에서, RNA는 전체 세포 RNA를 포함한다. 다른 실시양태에서, 특정의 풍부한 RNA 서열 (예를 들어, 리보솜 RNA)이 고갈되었다. 일부 실시양태에서, 전체 RNA 제제 중 폴리(A)-꼬리 mRNA 분획이 강화되었다. 일부 실시양태에서, cDNA는 무작위 프라이밍된 cDNA 합성 방법에 의해 생산된다. 다른 실시양태에서, cDNA 합성은 올리고(dT) 함유 올리고뉴클레오티드에 의해 프라이밍함으로써 성숙한 mRNA의 폴리(A) 꼬리에서 개시된다. 고갈, 폴리(A) 강화, 및 cDNA 합성을 위한 방법은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다.
다른 실시양태에서, 핵산은 물리적 또는 효소적 방법에 의해 단편화되거나 전단되고, 임의로 합성 어댑터에 라이게이션되며, 크기가 선택되고 (예를 들어, 제조용 겔 전기 영동에 의함), 증폭된다 (예를 들어, PCR에 의함). DNA 전단을 위한 대안적인 방법은, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426의 실시예 4에 기재된 바와 같이 관련 기술분야에 공지되어 있다. 예를 들어, 대안적인 DNA 전단 방법은 더 자동화가능하고/하거나 더 효율적일 수 있다 (예를 들어 분해된 FFPE 샘플 사용). DNA 전단 방법에 대한 대안을 또한 사용하여 라이브러리 제조 동안 라이게이션 단계를 피할 수 있다.
다른 실시양태에서, 단리된 DNA (예를 들어, 게놈 DNA)는 단편화되거나 전단된다. 일부 실시양태에서, 라이브러리는 50% 미만의 게놈 DNA, 예컨대 예를 들어, 다른 수단에 의해 소분획화된 게놈의 규정된 일부분 또는 감소된 표현인 게놈 DNA의 소분획을 포함한다. 다른 실시양태에서, 라이브러리는 모든 또는 실질적으로 모든 게놈 DNA를 포함한다.
다른 실시양태에서, 단편화되고 어댑터 라이게이션된 핵산 군은 혼성체 선택 전에 명시적인 크기 선택 또는 증폭 없이 사용된다. 일부 실시양태에서, 핵산은 관련 기술분야의 통상의 기술자에게 널리 공지된 특이적 또는 비-특이적 핵산 증폭 방법에 의해 증폭된다. 일부 실시양태에서, 핵산은, 예를 들어, 전체 게놈 증폭 방법, 예컨대 무작위 프라이밍된 가닥 변위 증폭에 의해 증폭된다.
본원에 기재된 방법은 (예를 들어, 전체 게놈 증폭 후에도), 예를 들어, 공급원 DNA 또는 RNA의 양이 제한될 때 소량의 핵산을 사용하여 수행될 수 있다. 한 실시양태에서, 핵산은 약 5 μg, 4 μg, 3 μg, 2 μg, 1 μg, 0.8 μg, 0.7 μg, 0.6 μg, 0.5 μg, 또는 400 ng, 300 ng, 200 ng, 100 ng, 50 ng, 10 ng, 5 ng, 1 ng, 또는 그 미만의 핵산 샘플을 포함한다. 예를 들어, 전형적으로 50 내지 100 ng의 게놈 DNA로 시작할 수 있다. 그러나, 혼성화 단계, 예를 들어, 용액 혼성화 전에 게놈 DNA를 증폭시키는 경우 (예를 들어, PCR을 사용함), 더 적은 양으로 시작할 수 있다. 따라서, 혼성화, 예를 들어, 용액 혼성화 전에 게놈 DNA를 증폭시키는 것이 가능하지만, 필수적인 것은 아니다.
한 실시양태에서, 샘플은 비-암 세포 또는 비-악성 세포, 예를 들어, 종양 침윤 림프구로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA), 또는 둘 다를 포함한다. 한 실시양태에서, 샘플은 비-암 세포 또는 비-악성 세포, 예를 들어, 종양 침윤 림프구로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA), 또는 둘 다를 포함하고, 암 세포 또는 악성 세포로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA), 또는 둘 다를 포함하지 않거나, 또는 이들이 본질적으로 없다.
한 실시양태에서, 샘플은 암 세포 또는 악성 세포로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA)를 포함한다. 한 실시양태에서, 샘플은 암 세포 또는 악성 세포로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA)를 포함하고, 비-암 세포 또는 비-악성 세포, 예를 들어, 종양 침윤 림프구로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA), 또는 둘 다를 포함하지 않거나, 또는 이들이 본질적으로 없다.
한 실시양태에서, 샘플은 비-암 세포 또는 비-악성 세포, 예를 들어, 종양 침윤 림프구로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA), 또는 둘 다, 및 암 세포 또는 악성 세포로부터의 DNA, RNA (또는 RNA로부터 유래된 cDNA), 또는 둘 다를 포함한다.
특정 실시양태에서, 샘플은 암이 있는 대상체로부터 획득된다. 예시적인 암은 B 세포 암, 예를 들어, 다발성 골수종, 흑색종, 유방암, 폐암 (예컨대 비소세포 폐 암종 또는 NSCLC), 기관지 암, 결장직장암, 전립선암, 췌장암, 위암, 난소암, 방광암, 뇌 또는 중추 신경계 암, 말초 신경계 암, 식도암, 자궁 경부암, 자궁암 또는 자궁 내막 암, 구강암 또는 인두암, 간암, 신장암, 고환암, 담도암, 소장 또는 충수 암, 침샘 암, 갑상선암, 부신암, 골육종, 연골 육종, 혈액 조직 암, 선암종, 염증성 근섬유 모세포 종양, 위장 간질 종양 (GIST), 결장암, 다발성 골수종 (MM), 골수 이형성 증후군 (MDS), 골수 증식성 장애 (MPD), 급성 림프구성 백혈병 (ALL), 급성 골수성 백혈병 (AML), 만성 골수성 백혈병 (CML), 만성 림프구성 백혈병 (CLL), 진성 적혈구 증가증, 호지킨 림프종, 비호지킨 림프종 (NHL), 연부 조직 육종, 섬유 육종, 점액 육종, 지방 육종, 골육종, 척색종, 혈관 육종, 내피 육종, 림프관 육종, 림프관 내피 육종, 활막종, 중피종, 유잉 종양, 평활근 육종, 횡문근 육종, 편평 세포 암종, 기저 세포 암종, 선암종, 한선 암종, 피지선 암종, 유두 암종, 유두 선암종, 수질 암종, 기관지 암종, 신세포 암종, 간세포암, 담관 암종, 융모막암종, 정액종, 배아 암종, 윌름스 종양, 방광 암종, 상피 암종, 신경교종, 성상세포종, 수모세포종, 두개인두종, 상피종, 송과선종, 혈관모세포종, 청신경종, 희돌기교종, 수막종, 신경 모세포종, 망막 모세포종, 여포성 림프종, 미만성 거대 B 세포 림프종, 외투 세포 림프종, 간세포 암종, 갑상선암, 위암, 두경부암, 소세포 암, 본태성 혈소판 증가증, 무신성 골수성 화생, 과호산구성 증후군, 전신 비만 세포증, 가족성 과호산구 증가증, 만성 호산구성 백혈병, 신경 내분비 암, 카르시노이드 종양 등을 포함하나, 이에 제한되지는 않는다.
한 실시양태에서, 암은 혈액 악성 종양 (또는 전악성 종양)이다. 본원에 사용된 바와 같은, 혈액 악성 종양은 조혈 또는 림프 조직의 종양, 예를 들어 혈액, 골수 또는 림프절에 영향을 미치는 종양을 지칭한다. 예시적인 혈액 악성 종양은 백혈병 (예를 들어, 급성 림프모구성 백혈병 (ALL), 급성 골수성 백혈병 (AML), 만성 림프구성 백혈병 (CLL), 만성 골수성 백혈병 (CML), 모발 세포 백혈병, 급성 단핵구성 백혈병 (AMoL), 만성 골수 단핵구성 백혈병 (CMML), 유년기 골수 단핵구성 백혈병 (JMML) 또는 거대 과립성 림프구성 백혈병), 림프종 (예를 들어, AIDS 관련 림프종, 피부 T 세포 림프종, 호지킨 림프종 (예를 들어, 고전적 호지킨 림프종 또는 결절성 림프구 우세 호지킨 림프종), 균상 식육종, 비호지킨 림프종 (예를 들어, B 세포 비호지킨 림프종 (예를 들어, 버킷 림프종, 작은 림프구성 림프종 (CLL/SLL), 미만성 거대 B 세포 림프종, 여포성 림프종, 면역 모세포 대세포 림프종, 전구체 B 림프모구성 림프종 또는 외투 세포 림프종) 또는 T 세포 비호지킨 림프종 (균상 식육종, 역형성 대세포 림프종 또는 전구체 T 림프모구성 림프종)), 원발성 중추 신경계 림프종, 세자리 증후군, 발덴스트롬 거대 글로불린혈증), 만성 골수 증식성 신생물, 랑게르한스 세포 조직구증, 다발성 골수종/혈장 세포 신생물, 골수이형성 증후군 또는 골수이형성/골수 증식성 신생물을 포함하나, 이에 제한되지는 않는다. 본원에 사용된 바와 같은, 전악성 종양은 아직 악성은 아니지만 악성이 될 수 있는 조직을 지칭한다.
일부 실시양태에서, 본원에 기재된 샘플은 표본으로서 지칭되기도 한다.
일부 실시양태에서, 샘플은 조직 샘플, 혈액 샘플 또는 골수 샘플이다. 일부 실시양태에서, 혈액 샘플은 무세포 DNA (cfDNA)를 포함한다. 일부 실시양태에서, cfDNA는 건강한 조직, 예를 들어, 질환에 걸리지 않은 세포, 또는 종양 조직, 예를 들어, 종양 세포로부터의 DNA이다. 일부 실시양태에서 종양 조직으로부터의 cfDNA는 순환 종양 DNA (ctDNA)를 포함한다. 일부 실시양태에서, ctDNA 샘플은 고형 종양, 예를 들어, 폐암, 유방암 또는 결장암이 있는 환자로부터 수득, 예를 들어, 수집된다.
일부 실시양태에서, 샘플, 예를 들어, 표본은 포르말린 고정 파라핀 포매 (FFPE) 표본이다. 일부 실시양태에서, FPPE 표본은 코어 바늘 생검, 미세 바늘 흡 인물, 또는 삼출 세포학으로부터 선택된 표본을 포함하나, 이에 제한되지는 않는다. 일부 실시양태에서, 샘플은 FPPE 블록 및 하나의 원래 헤마톡실린 및 에오신 (H&E) 염색된 슬라이드를 포함한다. 일부 실시양태에서, 샘플은 염색되지 않은 슬라이드 (예를 들어, 양전하로 하전된, 비베이킹된 및 4 내지 5 마이크로미터 두께, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 이러한 슬라이드) 및 하나 이상의 H&E 염색된 슬라이드를 포함한다.
일부 실시양태에서, 샘플은 FPPE 블록 또는 염색되지 않은 슬라이드, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16개 또는 그 초과의 염색되지 않은 슬라이드 및 하나 이상의 H&E 슬라이드를 포함한다. 일부 실시양태에서, 샘플은, 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표준 고정 방법을 사용하여 포르말린 고정되고 파라핀 블록에 포매되는 조직을 포함한다.
일부 실시양태에서, 샘플은 적어도 1-30 mm2, 예를 들어, 약 5-25 mm2의 표면적을 포함한다. 일부 실시양태에서, 샘플은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 mm2, 예를 들어, 5 mm2의 표면적을 포함한다. 일부 실시양태에서, 샘플은 적어도 5 mm2의 표면적을 포함한다. 일부 실시양태에서, 샘플은 약 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30 mm2, 예를 들어, 25 mm2의 표면적을 포함한다. 일부 실시양태에서, 샘플은 25 mm2의 표면적을 포함한다.
일부 실시양태에서, 샘플은 적어도 1-5 mm3, 예를 들어, 약 2 mm3의 표면 용적을 포함한다. 일부 실시양태에서, 약 2 mm3의 표면 용적은 약 80 마이크로미터, 예를 들어, 적어도 또는 80 마이크로미터 초과의 깊이에서 약 25 mm2의 표면적을 갖는 샘플을 포함한다.
일부 실시양태에서, 샘플은, 예를 들어, 종양 핵을 포함하는 종양 함량을 포함한다. 일부 실시양태에서, 샘플은 적어도 5-50%, 10-40%, 15-25%, 또는 20-30% 종양 핵을 갖는 종양 함량을 포함한다. 일부 실시양태에서, 샘플은 적어도 20% 종양 핵의 종양 함량을 포함한다. 일부 실시양태에서, 샘플은 약 30% 종양 핵의 종양 함량을 포함한다. 일부 실시양태에서, 퍼센트 종양 핵은 종양 세포의 수를 핵이 있는 모든 세포의 총 수로 나눔으로써 결정, 예를 들어, 계산된다. 일부 실시양태에서, 샘플이, 예를 들어, 간세포를 포함하는 간 샘플인 경우, 더 높은 종양 함량이 필요할 수 있다. 일부 실시양태에서, 간세포는 다른, 예를 들어, 비-간세포, 체세포 핵의 DNA 함량의 2배, 예를 들어, 더블인 핵을 갖는다. 일부 실시양태에서, 예를 들어, 본원에 기재된 바와 같은 변경의 검출 감도는 샘플의 종양 함량에 좌우되며, 예를 들어, 더 낮은 종양 함량은 검출 감도를 저하시킬 수 있다.
일부 실시양태에서, DNA는 샘플로부터의 유핵 세포로부터 추출된다. 일부 실시양태에서, 예를 들어, 샘플이 주로 적혈구, 과도한 세포질을 함유하는 병변 세포, 또는 섬유증이 있는 조직으로 구성되는 경우, 샘플은 낮은 유핵 세포성을 갖는다. 일부 실시양태에서, 낮은 유핵 세포성을 가진 샘플은 DNA 추출을 위해 더 많은, 예를 들어, 더 큰 조직 용적, 예를 들어, 2 mm3 초과를 필요로 할 수 있다.
일부 실시양태에서, FPPE 샘플, 예를 들어, 표본은 핵산 무결성을 보존하기 위해 표준 고정 방법을 사용하여 제조된다. 일부 실시양태에서, 표준 고정 방법은, 예를 들어, 6-72시간 동안 10% 중성 완충 포르말린을 사용하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 고정제, 예컨대 부인스(Bouins), B5, AZF, 홀랜드스(Holland's)를 포함하지 않는다. 일부 실시양태에서, 상기 방법은 석회질 제거를 포함하지 않는다. 일부 실시양태에서, 상기 방법은 석회질 제거를 포함한다. 실시양태에서, 석회질 제거는 EDTA로 수행된다. 일부 실시양태에서, 강산, 예를 들어, 염산, 황산 또는 피크르산은 석회질 제거에 사용되지 않는다.
일부 실시양태에서, 샘플은 FPPE 블록 또는 염색되지 않은 슬라이드, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16개 또는 그 초과의 염색되지 않은 슬라이드 및 하나 이상의 H&E 슬라이드를 포함한다. 일부 실시양태에서, 샘플은, 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표준 고정 방법을 사용하여, 포름알데히드 고정되고 파라핀 블록 내로 포매되는 조직을 포함한다.
일부 실시양태에서, 샘플은 말초 전혈 또는 골수 흡인물을 포함한다. 일부 실시양태에서, 샘플, 예를 들어, 병변 조직은 적어도 20% 유핵 요소를 포함한다. 일부 실시양태에서, 말초 전혈 샘플 또는 골수 흡인물 샘플은 약 2.5 ml의 용적으로 수집된다. 일부 실시양태에서, 혈액 샘플은 수집과 같은 날에, 예를 들어, 주위 온도, 예를 들어, 43-99℉ 또는 6-37℃ 하에 배송된다. 일부 실시양태에서, 혈액 샘플은 동결 또는 냉장되지 않는다.
일부 실시양태에서, 샘플은 단리된, 예를 들어, 추출된 핵산, 예를 들어 DNA 또는 RNA를 포함한다. 일부 실시양태에서, 단리된 핵산은, 예를 들어, 뉴클레아 제가 없는 물에서의 DNA 또는 RNA를 포함한다.
일부 실시양태에서, 샘플은 혈액 샘플, 예를 들어, 말초 전혈 샘플을 포함한다. 일부 실시양태에서, 말초 전혈 샘플은, 예를 들어, 튜브당 약 8.5 ml 혈액을 갖는, 예를 들어, 2개의 튜브에 수집된다. 일부 실시양태에서, 말초 전혈 샘플은, 예를 들어, CLSI H3-A6에 따라 정맥 천자에 의해 수집된다. 일부 실시양태에서, 혈액은, 예를 들어, 약 8 내지 10회 동안, 예를 들어, 완만한 역위에 의해 즉시 혼합된다. 일부 실시양태에서, 역위는, 예를 들어, 손목의 완전한, 예를 들어, 완전한 180°회전에 의해 수행된다. 일부 실시양태에서, 혈액 샘플은 수집과 같은 날에, 예를 들어, 주위 온도, 예를 들어, 43-99℉ 또는 6-37℃ 하에 배송된다. 일부 실시양태에서, 혈액 샘플은 동결 또는 냉장되지 않는다. 일부 실시양태에서, 수집된 혈액 샘플은 43-99℉ 또는 6-37℃ 하에 유지, 예를 들어, 저장된다.
대상체 선택
일부 실시양태에서, 샘플은, 예를 들어, 병태 또는 질환, 예를 들어, 과증식성 질환 (예를 들어, 본원에 기재된 바와 같음) 또는 비-암 징후가 있는 대상체, 예를 들어, 환자로부터 수득, 예를 들어, 수집된다. 일부 실시양태에서, 질환은 과증식성 질환이다. 일부 실시양태에서, 과증식성 질환은 암, 예를 들어, 고형 종양 또는 혈액 암이다. 일부 실시양태에서, 암은 고형 종양이다. 일부 실시양태에서, 암은 혈액 암, 예를 들어 백혈병 또는 림프종이다.
일부 실시양태에서, 환자는 이전에 표적화 요법, 예를 들어, 하나 이상의 표적화 요법으로 치료받은 적이 있다. 일부 실시양태에서, 이전에 표적화 요법으로 치료받은 적이 있는 환자의 경우, 표적화 요법 후 샘플, 예를 들어, 표본이 수득, 예를 들어, 수집된다. 일부 실시양태에서, 표적화 요법 후 샘플은 표적화 요법의 완료 후에 수득된, 예를 들어, 수집된 샘플이다.
일부 실시양태에서, 환자는 이전에 표적화 요법으로 치료받은 적이 없다. 일부 실시양태에서, 이전에 표적화 요법으로 치료받은 적이 없는 환자의 경우, 샘플은 절제, 예를 들어, 원래 절제, 또는 재발, 예를 들어 요법 후, 예를 들어 비-표적화 요법 후 질환 재발을 포함한다. 일부 실시양태에서, 샘플은 원발성 종양 또는 전이, 예를 들어, 전이 생검이거나 또는 그의 일부이다. 일부 실시양태에서, 샘플은 인접 부위, 예를 들어 종양 세포가 있는 인접 부위와 비교 시, 종양, 예를 들어, 종양 세포의 퍼센트가 가장 높은 부위, 예를 들어, 종양 부위로부터 수득된다. 일부 실시양태에서, 샘플은 인접 부위, 예를 들어 종양 세포가 있는 인접 부위와 비교 시, 가장 큰 종양 병소를 갖는 부위, 예를 들어, 종양 부위로부터 수득된다.
일부 실시양태에서, 질환은 비소세포 폐암 (NSCLC), 흑색종, 유방암, 결장직장암 (CRC) 또는 난소암으로부터 선택된다. 일부 실시양태에서, 본원에 기재된 NSCLC는, 예를 들어, EGFR 변경 (예를 들어, 엑손 19 결실 또는 엑손 21 L858R 변경), ALK 재배열, 또는 BRAF V600E를 갖는 NSCLC를 포함한다. 일부 실시양태에서, 본원에 기재된 흑색종은 BRAF 변경, 예를 들어, V600E 및/또는 V600K를 갖는 흑색종를 포함한다. 일부 실시양태에서, 본원에 기재된 유방암은 ERBB2 (HER2) 증폭을 갖는 유방암을 포함한다. 일부 실시양태에서, 본원에 기재된 결장직장암은 야생형 KRAS, 예를 들어, 코돈 12 및/또는 13에서의 돌연변이의 부재, 또는 코돈 2, 3 및/또는 4에서의 돌연변이의 부재를 갖는 결장직장암을 포함한다. 일부 실시양태에서, 본원에 기재된 결장직장암은 야생형 NRAS, 예를 들어, 코돈 2, 3 및/또는 4에서의 돌연변이의 부재를 갖는 결장직장암을 포함한다. 일부 실시양태에서, 본원에 기재된 결장직장암은, 예를 들어, 본원에 기재된 바와 같은 야생형 KRAS, 및 예를 들어, 본원에 기재된 바와 같은 야생형 NRAS를 갖는 결장직장암을 포함한다. 일부 실시양태에서, 본원에 기재된 난소암은 BRCA1 및/또는 BRCA2 변경을 갖는 난소암을 포함한다.
표적 포획 시약의 설계 및 구축
일부 실시양태에서, 표적 포획 시약는 표적 분자와 결합하고 이에 의해 표적 분자의 포획을 허용할 수 있는 분자이다. 예를 들어, 표적 포획 시약은 표적 핵산과 혼성화될 수 있고 (예를 들어, 이에 상보적일 수 있고), 이에 의해 표적 핵산의 포획을 허용할 수 있는 미끼, 예를 들어, 핵산 분자, 예를 들어, DNA 또는 RNA 분자이다. 일부 실시양태에서, 표적 포획 시약, 예를 들어, 미끼는 포획 올리고뉴클레오티드이다. 특정 실시양태에서, 표적 핵산은 게놈 DNA 분자이다. 다른 실시양태에서, 표적 핵산은 RNA 분자 또는 RNA 분자로부터 유래된 cDNA 분자이다. 한 실시양태에서, 표적 포획 시약은 DNA 분자이다. 한 실시양태에서, 표적 포획 시약은 RNA 분자이다. 다른 실시양태에서, 표적 포획 시약은 이러한 표적 포획 시약과 혼성화된 핵산 분자와 표적 포획 시약에 의해 형성된 혼성체의 결합 및 분리를 허용하는 결합 쌍의 제1 구성원을 포함한다. 한 실시양태에서, 표적 포획 시약은 용액 상 혼성화에 적합하다. 한 실시양태에서, 표적 포획 시약은 고체 상 혼성화에 적합하다. 한 실시양태에서, 표적 포획 시약은 용액 상 혼성화와 고체 상 혼성화 둘 다에 적합하다.
전형적으로, DNA 분자는 표적 포획 시약 서열로서 사용되지만, RNA 분자가 사용될 수도 있다. 일부 실시양태에서, DNA 분자 표적 포획 시약은 단일 가닥 DNA (ssDNA) 또는 이중 가닥 DNA (dsDNA)일 수 있다.
일부 실시양태에서, RNA-DNA 이중체는 DNA-DNA 이중체보다 더 안정적이므로, 잠재적으로 더 나은 핵산 포획을 제공한다. RNA 표적 포획 시약은 DNA 의존성 RNA 폴리머라제를 사용한 DNA 분자의 새로운 화학적 합성 및 전사를 포함하나 이에 제한되지는 않는, 관련 기술분야에 공지된 방법을 사용하여 본원의 다른 곳에 기재된 바와 같이 제조될 수 있다. 한 실시양태에서, 표적 포획 시약 서열은, 예를 들어, 주형으로서 인간 DNA 또는 풀링된 DNA 샘플을 사용한 공지된 핵산 증폭 방법, 예컨대 PCR을 사용하여 생산된다. 이어서, 올리고뉴클레오티드가 RNA 표적 포획 시약으로 전환될 수 있다. 한 실시양태에서, 예를 들어, 올리고뉴클레오티드의 한쪽 단부에 RNA 폴리머라제 프로모터 서열을 부가하는 것에 기반하여 시험관내 전사가 사용된다. 한 실시양태에서, RNA 폴리머라제 프로모터 서열은, 예를 들어, PCR 또는 또 다른 핵산 증폭 방법을 사용하여 표적 포획 시약 서열을 증폭 또는 재증폭함으로써, 예를 들어, 각각의 표적-특이적 프라이머 쌍의 하나의 프라이머를 RNA 프로모터 서열로 테일링함으로써 표적 포획 시약의 단부에 부가된다. 한 실시양태에서, RNA 폴리머라제는 T7 폴리머라제, SP6 폴리머라제, 또는 T3 폴리머라제이다. 한 실시양태에서, RNA 표적 포획 시약은 태그, 예를 들어, 친화성 태그로 표지된다. 한 실시양태에서, RNA 표적 포획 시약은, 예를 들어, 비오티닐화된 UTP를 사용하여 시험관내 전사에 의해 만들어진다. 또 다른 실시양태에서, RNA 표적 포획 시약은 비오틴 없이 생산된 다음, 비오틴은 관련 기술분야에 널리 공지된 방법, 예컨대 소랄렌 가교 결합을 사용하여 RNA 분자와 가교 결합된다. 한 실시양태에서, RNA 표적 포획 시약은 RNase-저항성 RNA 분자이며, 이는 예를 들어, 전사 동안 변형된 뉴클레오티드를 사용하여 RNase 분해에 저항하는 RNA 분자를 생산함으로써 만들어질 수 있다. 한 실시양태에서, RNA 표적 포획 시약은 이중 가닥 DNA 표적의 단 하나의 가닥에 상응한다. 전형적으로, 이러한 RNA 표적 포획 시약은 자기 상보적이지 않으며 혼성화 드라이버로서 더 유효하다.
표적 포획 시약은 이러한 표적 포획 시약이 참조 서열의 표적을 선택하는데 최적이 되도록 참조 서열로부터 설계될 수 있다. 일부 실시양태에서, 표적 포획 시약 서열은 혼합 염기 (예를 들어, 축퇴성)를 사용하여 설계된다. 예를 들어, 혼합 염기(들)는 표적 포획 시약 서열을 최적화하여 두 대립유전자 (예를 들어, SNP와 비-SNP; 돌연변이체와 비-돌연변이체)를 캐치하기 위해, 공통 SNP 또는 돌연변이의 위치(들)에서 표적 포획 시약 서열에 포함될 수 있다. 일부 실시양태에서, 모든 공지된 서열 변이 (또는 그의 서브세트)는 혼합된 축퇴성 올리고뉴클레오티드를 사용하는 것보다는 다수의 올리고뉴클레오티드 표적 포획 시약으로 표적화될 수 있다.
특정 실시양태에서, 표적 포획 시약은 약 100개 뉴클레오티드 내지 300개 뉴클레오티드 길이의 올리고뉴클레오티드 (또는 복수 개의 올리고뉴클레오티드)를 포함한다. 전형적으로, 표적 포획 시약은 약 130개 뉴클레오티드 내지 230개 뉴클레오티드, 또는 약 150개 내지 200개 뉴클레오티드 길이의 올리고뉴클레오티드 (또는 복수 개의 올리고뉴클레오티드)를 포함한다. 다른 실시양태에서, 표적 포획 시약은 약 300개 뉴클레오티드 내지 1000개 뉴클레오티드 길이의 올리고뉴클레오티드 (또는 복수 개의 올리고뉴클레오티드)를 포함한다.
일부 실시양태에서, 올리고뉴클레오티드 내의 표적 핵산 분자-특이적 서열은 약 40개 내지 1000개 뉴클레오티드, 약 70개 내지 300개 뉴클레오티드, 약 100개 내지 200개 뉴클레오티드 길이, 전형적으로 약 120개 내지 170개 뉴클레오티드 길이이다.
일부 실시양태에서, 표적 포획 시약은 결합 쌍의 제1 구성원을 포함한다. 결합 쌍의 제1 구성원은 표적 포획 시약 상의 친화성 태그일 수 있다. 일부 실시양태에서, 친화성 태그는 비오틴 분자 또는 합텐이다. 특정 실시양태에서, 결합 쌍의 제1 구성원은 결합 쌍의 제2 구성원, 예컨대 아비딘 분자, 또는 합텐과 결합하는 항체 또는 그의 항원 결합 단편과 결합함으로써 혼성화 혼합물로부터 표적 포획 시약/핵산 분자 혼성체의 분리를 허용한다.
다른 실시양태에서, 표적 포획 시약 중의 올리고뉴클레오티드는 동일한 표적 핵산 분자 서열에 대한 정방향 및 역방향 보체 서열을 함유하며, 이로써 역방향 보완된 핵산 분자-특이적 서열을 갖는 올리고뉴클레오티드는 또한, 역방향 보체 범용 꼬리를 수반한다. 이것은 동일한 가닥, 즉 서로 상보적이지 않은 RNA 전사체를 초래할 수 있다.
다른 실시양태에서, 표적 포획 시약은 하나 이상의 위치에서 축퇴성 또는 혼합 염기를 함유하는 올리고뉴클레오티드를 포함한다. 또 다른 실시양태에서, 표적 포획 시약은 단일 종의 집단 또는 유기체 군집에 존재하는 다수의 또는 실질적으로 모든 공지된 서열 변이체를 포함한다. 한 실시양태에서, 표적 포획 시약은 인간 집단에 존재하는 다수의 또는 실질적으로 모든 공지된 서열 변이체를 포함한다.
다른 실시양태에서, 표적 포획 시약은 cDNA 서열을 포함하거나 또는 cDNA 서열로부터 유래된다. 다른 실시양태에서, 표적 포획 시약은 게놈 DNA, cDNA 또는 클로닝된 DNA로부터 증폭되는 증폭 산물 (예를 들어, PCR 산물)을 포함한다.
다른 실시양태에서, 표적 포획 시약은 RNA 분자를 포함한다. 일부 실시양태에서, 세트는 더 안정적이고 RNase에 대해 저항성인 것을 포함하나 이에 제한되지는 않는, 화학적으로, 효소적으로 변형되거나, 또는 시험관내 전사된 RNA 분자를 포함한다.
또한 다른 실시양태에서, 표적 포획 시약은 US 2010/0029498 및 문헌 [Gnirke, A. et al. (2009) Nat Biotechnol. 27(2):182-189] (본원에 참조로 포함됨)에 기재된 방법에 의해 생산된다. 예를 들어, 비오티닐화된 RNA 표적 포획 시약은 원래 마이크로어레이 상에서 합성된 합성 긴 올리고뉴클레오티드의 풀을 수득하고, 올리고뉴클레오티드를 증폭시켜 표적 포획 시약 서열을 생산함으로써 생산될 수 있다. 일부 실시양태에서, 표적 포획 시약은 표적 포획 시약 서열의 한쪽 단부에 RNA 폴리머라제 프로모터 서열을 부가하고, RNA 폴리머라제를 사용하여 RNA 서열을 합성함으로써 생산된다. 한 실시양태에서, 합성 올리고데옥시뉴클레오티드의 라이브러리는 상업적 공급업체, 예컨대 애질런트 테크놀로지스, 인크.(Agilent Technologies, Inc.)로부터 수득될 수 있으며, 공지된 핵산 증폭 방법을 사용하여 증폭시킬 수 있다.
따라서, 전술한 표적 포획 시약의 제조 방법이 제공된다. 이러한 방법은, 예를 들어, 하나 이상의 표적 포획 시약, 예를 들어, 표적-특이적 미끼 올리고뉴클레오티드 서열을 선택하는 단계 (예를 들어, 본원에 기재된 바와 같은 참조 또는 대조군 올리고뉴클레오티드 서열의 하나 이상의 돌연변이를 포획하는 단계); 표적 포획 시약, 예를 들어, 표적-특이적 미끼 올리고뉴클레오티드 서열의 풀을 수득하는 단계 (예를 들어, 마이크로어레이 합성에 의해, 예를 들어, 표적-특이적 미끼 올리고뉴클레오티드 서열의 풀을 합성하는 단계); 및 임의로, 표적 포획 시약, 예를 들어, 표적-특이적 미끼 올리고뉴클레오티드 서열을 증폭시키는 단계를 포함한다.
다른 실시양태에서, 상기 방법은 하나 이상의 비오티닐화된 프라이머를 사용하여 올리고뉴클레오티드를 증폭 (예를 들어, PCR에 의함)하는 것을 추가로 포함한다. 일부 실시양태에서, 올리고뉴클레오티드는 마이크로어레이에 부착된 각각의 올리고뉴클레오티드의 단부에 범용 서열을 포함한다. 상기 방법은 올리고뉴클레오티드로부터 범용 서열을 제거하는 것을 추가로 포함할 수 있다. 이러한 방법은 또한, 올리고뉴클레오티드의 상보적 가닥을 제거하는 것, 올리고뉴클레오티드를 어닐링하는 것, 및 올리고뉴클레오티드를 연장하는 것을 포함할 수 있다. 이들 실시양태 중 일부에서, 올리고뉴클레오티드를 증폭하는 방법 (예를 들어, PCR에 의함)은 하나 이상의 비오티닐화된 프라이머를 사용한다. 일부 실시양태에서, 상기 방법은 증폭된 올리고뉴클레오티드의 크기를 선택하는 것을 추가로 포함한다.
한 실시양태에서, RNA 표적 포획 시약이 만들어진다. 방법은 본원에 기재된 방법에 따라 표적 포획 시약 서열 세트를 생성하는 단계, 표적 포획 시약 서열의 한쪽 단부에 RNA 폴리머라제 프로모터 서열을 부가하는 단계, 및 RNA 폴리머라제를 사용하여 RNA 서열을 합성하는 단계를 포함한다. RNA 폴리머라제는 T7 RNA 폴리머라제, SP6 RNA 폴리머라제, 또는 T3 RNA 폴리머라제로부터 선택될 수 있다. 다른 실시양태에서, RNA 폴리머라제 프로모터 서열은 표적 포획 시약 서열을 증폭시킴으로써 (예를 들어, PCR에 의함) 표적 포획 시약 서열의 단부에 부가된다. 표적 포획 시약 서열이 게놈 DNA 또는 cDNA로부터의 특이적 프라이머 쌍을 사용하여 PCR에 의해 증폭되는 실시양태에서, RNA 프로모터 서열을 각각의 쌍에서의 2개 특이적 프라이머 중 하나의 5' 단부에 부가하는 것이 PCR 산물을 초래할 것인데, 이는 표준 방법을 사용하여 RNA 표적 포획 시약으로 전사될 수 있다.
다른 실시양태에서, 표적 포획 시약은 인간 DNA 또는 풀링된 인간 DNA 샘플을 주형으로서 사용하여 생산될 수 있다. 이러한 실시양태에서, 올리고뉴클레오티드는 폴리머라제 연쇄 반응 (PCR)에 의해 증폭된다. 다른 실시양태에서, 증폭된 올리고뉴클레오티드는 롤링 서클 증폭 또는 과분지형 롤링 서클 증폭에 의해 재증폭된다. 인간 DNA 또는 풀링된 인간 DNA 샘플을 주형으로서 사용하여 표적 포획 시약 서열을 생산하기 위해 동일한 방법이 또한 사용될 수 있다. 제한 소화, 펄스-필드 겔 전기 영동, 유동 분류, CsCl 밀도 구배 원심 분리, 선택적 역학 재연합, 염색체 제제의 미세해부 및 관련 기술분야의 통상의 기술자에게 공지된 다른 분획화 방법을 포함하나 이에 제한되지는 않는 다른 방법에 의해 수득된 게놈의 소분획을 사용하여 표적 포획 시약 서열을 생산하기 위해 동일한 방법이 또한 사용될 수 있다.
특정 실시양태에서, 복수 개의 표적 포획 시약에서 표적 포획 시약 (예를 들어, 미끼)의 수는 1,000개 미만이다. 다른 실시양태에서, 복수 개의 표적 포획 시약에서 표적 포획 시약 (예를 들어, 미끼)의 수는 1,000개 초과, 5,000개 초과, 10,000개 초과, 20,000개 초과, 50,000개 초과, 100,000개 초과, 또는 500,000 초과이다.
표적 포획 시약 서열의 길이는 약 70개 뉴클레오티드 내지 1000개 뉴클레오티드일 수 있다. 한 실시양태에서, 표적 포획 시약 길이는 약 100개 내지 300개 뉴클레오티드, 110개 내지 200개 뉴클레오티드, 또는 120개 내지 170개 뉴클레오티드 길이이다. 상기 언급된 것 외에도, 약 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 400, 500, 600, 700, 800, 및 900개 뉴클레오티드 길이의 중간 올리고뉴클레오티드 길이가 본원에 기재된 방법에 사용될 수 있다. 일부 실시양태에서, 약 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 또는 230개 염기의 올리고뉴클레오티드가 사용될 수 있다.
각각의 표적 포획 시약 서열은 하나 또는 둘 다의 단부 상에 표적-특이적 (예를 들어, 핵산 분자-특이적) 표적 포획 시약 서열 및 범용 꼬리를 포함할 수 있다. 본원에 사용된 바와 같은, 용어 "표적 포획 시약 서열"은 표적-특이적 표적 포획 시약 서열, 또는 표적-특이적 "표적 포획 시약 서열"과 올리고뉴클레오티드의 다른 뉴클레오티드를 포함한 전체 올리고뉴클레오티드를 지칭할 수 있다. 표적 포획 시약 중의 표적-특이적 서열은 약 40개 뉴클레오티드 내지 1000개 뉴클레오티드 길이이다. 한 실시양태에서, 표적-특이적 서열은 약 70개 뉴클레오티드 내지 300개 뉴클레오티드 길이이다. 또 다른 실시양태에서, 표적-특이적 서열은 약 100개 뉴클레오티드 내지 200개 뉴클레오티드 길이이다. 또한 또 다른 실시양태에서, 표적-특이적 서열은 약 120개 뉴클레오티드 내지 170개 뉴클레오티드 길이, 전형적으로 120개 뉴클레오티드 길이이다. 상기 언급된 것 이외의 중간 길이, 예컨대 약 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 400, 500, 600, 700, 800, 및 900개 뉴클레오티드 길이의 표적-특이적 서열 뿐만 아니라 상기 언급된 길이 사이의 길이의 표적-특이적 서열이 또한 본원에 기재된 방법에 사용될 수 있다.
한 실시양태에서, 표적 포획 시약은 약 50개 내지 200개 뉴클레오티드 길이 (예를 들어, 약 50, 60, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 190, 또는 200개 뉴클레오티드 길이)의 올리고머 (예를 들어, RNA 올리고머, DNA 올리고머, 또는 그의 조합으로 구성됨)이다. 한 실시양태에서, 각각의 표적 포획 시약 올리고머는 약 120개 내지 170개, 또는 전형적으로, 약 120개 뉴클레오티드를 포함하며, 이는 표적-특이적 표적 포획 시약 서열이다. 표적 포획 시약은 하나 또는 둘 다의 단부에 부가의 비-표적-특이적 뉴클레오티드 서열을 포함할 수 있다. 부가의 뉴클레오티드 서열은, 예를 들어, PCR 증폭을 위해 또는 표적 포획 시약 식별자로서 사용될 수 있다. 특정 실시양태에서, 표적 포획 시약은 부가적으로, 본원에 기재된 바와 같은 결합 쌍의 제1 구성원 (예를 들어, 친화성 태그, 예컨대 비오틴 분자)을 포함한다. 결합 쌍의 제1 구성원, 예를 들어, 비오틴 분자는, 예를 들어, 표적 포획 시약의 5'-말단, 3'-말단, 또는 중간에 (예를 들어, 비오티닐화된 뉴클레오티드를 혼입함으로써) 표적 포획 시약에 부착될 수 있다. 한 실시양태에서, 비오틴 분자는 표적 포획 시약의 5'-말단에 부착된다.
하나의 예시적인 실시양태에서, 표적 포획 시약은 약 150개 뉴클레오티드 길이의 올리고뉴클레오티드이며, 이 중 120개 뉴클레오티드가 표적-특이적 "표적 포획 시약 서열"이다. 다른 30개 뉴클레오티드 (예를 들어, 각각의 단부 상의 15개 뉴클레오티드)는 PCR 증폭을 위해 사용되는 범용 임의 꼬리이다. 이러한 꼬리는 사용자에 의해 선택된 임의의 서열일 수 있다. 예를 들어, 합성 올리고뉴클레오티드의 풀은 5'-ATCGCACCAGCGTGTN120CACTGCGGCTCCTCA-3' (서열식별번호(SEQ ID NO): 1)의 서열의 올리고뉴클레오티드를 포함할 수 있으며, N120은 표적-특이적 표적 포획 시약 서열을 나타낸다.
본원에 기재된 표적 포획 시약 서열은 엑손 및 짧은 표적 서열의 선택을 위해 사용될 수 있다. 한 실시양태에서, 표적 포획 시약은 약 100개 뉴클레오티드 내지 300개 뉴클레오티드 길이이다. 또 다른 실시양태에서, 표적 포획 시약은 약 130개 뉴클레오티드 내지 230개 뉴클레오티드 길이이다. 또한 또 다른 실시양태에서, 표적 포획 시약은 약 150개 뉴클레오티드 내지 200개 뉴클레오티드 길이이다. 예를 들어, 엑손 및 짧은 표적 서열의 선택을 위한, 표적 포획 시약 중의 표적-특이적 서열은 약 40개 뉴클레오티드 내지 1000개 뉴클레오티드 길이이다. 한 실시양태에서, 표적-특이적 서열은 약 70개 뉴클레오티드 내지 300개 뉴클레오티드 길이이다. 또 다른 실시양태에서, 표적-특이적 서열은 약 100개 뉴클레오티드 내지 200개 뉴클레오티드 길이이다. 또한 또 다른 실시양태에서, 표적-특이적 서열은 약 120개 뉴클레오티드 내지 170개 뉴클레오티드 길이이다.
일부 실시양태에서, 긴 올리고뉴클레오티드는 표적 서열을 포획하는데 필요한 올리고뉴클레오티드의 수를 최소화할 수 있다. 예를 들어, 엑손당 하나의 올리고뉴클레오티드를 사용할 수 있다. 인간 게놈에서 단백질 코딩 엑손의 평균 및 중앙값 길이는 각각 약 164개 염기 쌍 및 120개 염기 쌍이라는 것이 관련 기술분야에 공지되어 있다. 더 긴 표적 포획 시약 서열은 더 짧은 서열보다 더 특이적이고 더 잘 포획될 수 있다. 그 결과, 올리고뉴클레오티드 표적 포획 시약 서열당 성공률은 짧은 올리고뉴클레오티드의 경우보다 더 높다. 한 실시양태에서, 최소 표적 포획 시약 포괄 서열은, 예를 들어, 엑손 크기 표적을 포획하기 위한 하나의 표적 포획 시약의 크기 (예를 들어, 120 내지 170개 염기)이다. 표적 포획 시약 서열의 길이를 결정하는데 있어서, 불필요하게 긴 표적 포획 시약이 표적에 직접 인접한 더 많은 원치 않는 DNA를 캐치하는 것을 고려할 수도 있다. 더 긴 올리고뉴클레오티드 표적 포획 시약은 짧은 것보다 DNA 샘플에서 표적화된 영역에서의 다형성에 더 내성이 있을 수 있다. 전형적으로, 표적 포획 시약 서열은 참조 게놈 서열로부터 유래된다. 실제 DNA 샘플 중의 표적 서열이 참조 서열로부터 벗어나는 경우, 예를 들어 단일 뉴클레오티드 다형성 (SNP)을 함유하는 경우, 이는 표적 포획 시약과 덜 효율적으로 혼성화될 수 있으므로, 표적 포획 시약 서열과 혼성화된 서열에 과소 표현되거나 완전히 부재할 수 있다. SNP로 인한 대립유전자 탈락은 더 긴 합성 표적 포획 시약 분자를 사용할 경우 가능성이 적을 수 있는데, 이는 예를 들어, 120개 내지 170개 염기에서의 단일 미스매치가, 다중체 증폭 및 마이크로어레이 포획 각각에서 전형적인 표적 포획 시약 또는 프라이머 길이인 20개 또는 70개 염기에서의 단일 미스매치보다 혼성체 안정성에 덜 영향을 미칠 수 있기 때문이다.
표적 포획 시약의 길이와 비교해서 긴 표적, 예컨대 게놈 영역을 선택하는 경우, 표적 포획 시약 서열 길이는 전형적으로, 상기 언급된 짧은 표적에 대한 표적 포획 시약과 동일한 크기 범위 내에 있으며, 단 인접한 서열의 표적화를 최소화할 목적으로 표적 포획 시약 서열의 최대 크기를 제한할 필요는 없다. 대안적으로, 올리고뉴클레오티드는 훨씬 더 넓은 창 (전형적으로 600개 염기) 전체에 걸쳐 타일링될 수 있다. 이러한 방법은 전형적인 엑손보다 훨씬 더 큰 (예를 들어, 약 500개 염기) DNA 단편을 포획하기 위해 사용될 수 있다. 그 결과, 훨씬 더 많은 원치 않는 플랭킹 비-표적 서열이 선택된다.
표적 포획 시약의 합성
표적 포획 시약은, 예를 들어, 임의의 유형의 올리고뉴클레오티드, 예를 들어, DNA 또는 RNA일 수 있다. DNA 또는 RNA 표적 포획 시약 ("올리고 표적 포획 시약")은 개별적으로 합성될 수 있거나, 또는 어레이에서 DNA 또는 RNA 표적 포획 시약 (예를 들어, "어레이 미끼")으로서 합성될 수 있다. 올리고 표적 포획 시약은 어레이 포맷으로 제공되든지 아니면 단리된 올리고로서 제공되든지 간에, 전형적으로 단일 가닥이다. 표적 포획 시약은 부가적으로, 본원에 기재된 바와 같은 결합 쌍의 제1 구성원 (예를 들어, 친화성 태그, 예컨대 비오틴 분자)을 포함할 수 있다. 결합 쌍의 제1 구성원, 예를 들어, 비오틴 분자는, 예를 들어, 표적 포획 시약의 5' 또는 3'-말단에서, 전형적으로 표적 포획 시약의 5'-말단에서 표적 포획 시약에 부착될 수 있다. 표적 포획 시약은, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426, 또는 국제 특허 출원 공개 번호 WO 2015/021080 (그의 전체 내용이 본원에 참조로 포함됨)에 기재된 바와 같이, 관련 기술분야에 기재된 방법에 의해 합성될 수 있다.
혼성화 조건
본 발명에 특별히 포함된 방법은 라이브러리 (예를 들어, 핵산 라이브러리)를 복수 개의 표적 포획 시약과 접촉시켜 선택된 라이브러리 캐치를 제공하는 단계를 포함한다. 접촉 단계는 용액 혼성화에서 수행될 수 있다. 특정 실시양태에서, 상기 방법은 하나 이상의 부가 라운드의 용액 혼성화에 의해 혼성화 단계를 반복하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 라이브러리 캐치가 표적 포획 시약의 동일하거나 상이한 수집물과의 하나 이상의 부가 라운드의 용액 혼성화에 적용되는 것을 추가로 포함한다. 본원의 방법에 사용하기 위해 채택될 수 있는 혼성화 방법은, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426에 기재된 바와 같이 관련 기술분야에 기재되어 있다.
본 발명의 부가의 실시양태 또는 특징은 하기와 같다:
특정 실시양태에서, 상기 방법은, 예를 들어, 샘플 중의 암성 표현형과 양성적으로 또는 음성적으로 연관되는 변경 (예를 들어, 본원에 기재된 유전자 또는 유전자 산물에 있어서의 적어도 10, 20, 30, 50개 또는 그 초과의 변경)의 존재 또는 부재를 결정하는 것을 포함한다. 다른 실시양태에서, 상기 방법은 게놈 시그니처, 예를 들어, 연속/복합 바이오마커 (예를 들어, 종양 돌연변이 부담의 수준)를 결정하는 것을 포함한다. 다른 실시양태에서, 상기 방법은 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커, 예를 들어, 미세부수체 불안정성의 수준, 또는 이형접합성의 존재 또는 부재 (LOH)를 결정하는 것을 포함한다. 상기 방법은 라이브러리 캐치를 수득하기 위해 본원에 기재된 표적 포획 시약 및 방법 중 임의의 것에 따라 용액-기반 반응에서 샘플 중의 핵산을 접촉시키는 것; 및 라이브러리 캐치의 전부 또는 서브세트를 시퀀싱하며 (예를 들어, 차세대 시퀀싱에 의함), 이에 의해 본원에 기재된 유전자 또는 유전자 산물에 있어서의 변경의 존재 또는 부재를 결정하는 것을 포함한다.
특정 실시양태에서, 표적 포획 시약은 약 100개 뉴클레오티드 내지 300개 뉴클레오티드 길이의 올리고뉴클레오티드 (또는 복수 개의 올리고뉴클레오티드)를 포함한다. 전형적으로, 표적 포획 시약은 약 130개 뉴클레오티드 내지 230개 뉴클레오티드, 또는 약 150개 내지 200개 뉴클레오티드 길이의 올리고뉴클레오티드 (또는 복수 개의 올리고뉴클레오티드)를 포함한다. 다른 실시양태에서, 표적 포획 시약은 약 300개 뉴클레오티드 내지 1000개 뉴클레오티드 길이의 올리고뉴클레오티드 (또는 복수 개의 올리고뉴클레오티드)를 포함한다.
다른 실시양태에서, 표적 포획 시약은 cDNA 서열을 포함하거나 또는 cDNA 서열로부터 유래된다. 한 실시양태에서, cDNA는 RNA 서열, 예를 들어, 종양 유래 또는 암 세포 유래 RNA, 예를 들어, 종양-FFPE 샘플, 혈액 샘플, 또는 골수 흡인물 샘플로부터 수득된 RNA로부터 제조된다. 다른 실시양태에서, 표적 포획 시약은 게놈 DNA, cDNA 또는 클로닝된 DNA로부터 증폭되는 증폭 산물 (예를 들어, PCR 산물)을 포함한다.
특정 실시양태에서, 라이브러리 (예를 들어, 핵산 라이브러리)는 핵산 분자의 수집물을 포함한다. 본원에 기재된 바와 같이, 라이브러리의 핵산 분자는 표적 핵산 분자 (예를 들어, 종양 핵산 분자, 참조 핵산 분자 및/또는 대조군 핵산 분자; 제1, 제2 및/또는 제3 핵산 분자로서 각각 본원에 지칭되기도 함)를 포함할 수 있다. 라이브러리의 핵산 분자는 단일 개체로부터의 것일 수 있다. 일부 실시양태에서, 라이브러리는 2명 이상의 대상체 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30명 또는 그 초과의 대상체)로부터의 핵산 분자를 포함할 수 있으며, 예를 들어, 상이한 대상체로부터의 2개 이상의 라이브러리를 조합하여 2명 이상의 대상체로부터의 핵산 분자를 갖는 라이브러리를 형성할 수 있다. 한 실시양태에서, 대상체는 암 또는 종양이 있거나, 또는 암 또는 종양이 발생할 위험이 있는 인간이다.
일부 실시양태에서, 상기 방법은 1개 또는 복수 개의 라이브러리 (예를 들어, 1개 또는 복수 개의 핵산 라이브러리)를 복수 개의 표적 포획 시약과 접촉시켜 선택된 핵산 하위 군, 예를 들어, 라이브러리 캐치를 제공하는 단계를 포함한다. 한 실시양태에서, 접촉 단계는 고체 지지체, 예를 들어, 어레이에서 수행된다. 혼성화에 적합한 고체 지지체는, 예를 들어, 문헌 [Albert, T.J. et al. (2007) Nat. Methods 4(11):903-5; Hodges, E. et al. (2007) Nat. Genet. 39(12):1522-7; and Okou, D.T. et al. (2007) Nat. Methods 4(11):907-9] (그의 내용이 본원에 참조로 포함됨)에 기재되어 있다. 다른 실시양태에서, 접촉 단계는 용액 혼성화에서 수행된다. 특정 실시양태에서, 상기 방법은 하나 이상의 부가 라운드의 혼성화에 의해 혼성화 단계를 반복하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 라이브러리 캐치가 표적 포획 시약의 동일하거나 상이한 수집물과의 하나 이상의 부가 라운드의 혼성화에 적용되는 것을 추가로 포함한다.
또한 다른 실시양태에서, 상기 방법은 라이브러리 캐치를 유전자형 분석하며, 이에 의해 선택된 핵산의 유전자형을 확인하는 단계를 추가로 포함한다.
특정 실시양태에서, 상기 방법은 하기 중 하나 이상을 추가로 포함한다:
i) 샘플을 핑거프린팅하는 것;
ii) 샘플 중의 유전자 또는 유전자 산물 (예를 들어, 본원에 기재된 바와 같은 유전자 또는 유전자 산물)의 존재도를 정량화하는 것 (예를 들어, 샘플 중의 전사체의 상대 존재도를 정량화하는 것);
iii) 특별한 대상체 (예를 들어, 정상 대조군 또는 암 환자)에 속하는 것으로서 샘플을 확인하는 것;
iv) 샘플 중의 유전적 형질 (예를 들어, 하나 이상의 대상체의 유전적 구성 (예를 들어, 민족, 인종, 가족 형질))을 확인하는 것;
v) 핵산 샘플 중의 배수성을 결정하는 것; 샘플 중의 이형접합성 상실을 결정하는 것;
vi) 샘플 중의 본원에 기재된 변경, 예를 들어, 뉴클레오티드 치환, 카피 수 변경, indel, 또는 재배열의 존재 또는 부재를 결정하는 것;
vii) 샘플 중의 종양 돌연변이 부담 및/또는 미세부수체 불안정성 (및/또는 다른 복합 바이오마커)의 수준을 결정하는 것; 또는
viii) 샘플 중의 종양/정상 세포 혼합물의 수준을 결정하는 것.
상이한 올리고뉴클레오티드 조합은 상이한 비율, 예를 들어, 1:1, 1:2, 1:3, 1:4, 1:5, 1:10, 1:20, 1:50; 1:100, 1:1000 등으로부터 선택된 비율로 혼합될 수 있다. 한 실시양태에서, 화학적으로 합성된 표적 포획 시약 (예를 들어, 미끼) 대 어레이 생성된 표적 포획 시약 (예를 들어, 미끼)의 비율은 1:5, 1:10, 또는 1:20으로부터 선택된다. DNA 또는 RNA 올리고뉴클레오티드는 자연적으로 또는 비-자연적으로 발생할 수 있다. 특정 실시양태에서, 표적 포획 시약 (예를 들어, 미끼)은, 예를 들어, 융점을 증가시키기 위해 하나 이상의 비-자연적으로 발생하는 뉴클레오티드를 포함한다. 예시적인 비-자연적으로 발생하는 올리고뉴클레오티드는 변형된 DNA 또는 RNA 뉴클레오티드를 포함한다. 예시적인 변형된 RNA 뉴클레오티드는 잠금 핵산 (LNA)이며, 여기서 LNA 뉴클레오티드의 리보스 모이어티는 2' 산소와 4' 탄소를 연결하는 여분의 브릿지로 변형된다 (Kaur, H; Arora, A; Wengel, J; Maiti, S; Arora, A.; Wengel, J.; Maiti, S. (2006). "Thermodynamic, Counterion, and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes". Biochemistry 45 (23): 7347-55). 다른 변형된 예시적인 DNA 및 RNA 뉴클레오티드는 펩티드 결합에 의해 연결된 반복 N-(2-아미노에틸)-글리신 단위로 구성된 펩티드 핵산 (PNA) (문헌 [Egholm, M. et al. (1993) Nature 365 (6446): 566-8]); 낮은 GC 영역을 포획하도록 변형된 DNA 또는 RNA 올리고뉴클레오티드; 바이사이클릭 핵산 (BNA) 또는 가교 결합된 올리고뉴클레오티드; 변형된 5-메틸 데옥시시티딘; 및 2,6-디아미노퓨린을 포함하나, 이에 제한되지는 않는다. 다른 변형된 DNA 및 RNA 뉴클레오티드가 관련 기술분야에 공지되어 있다.
한 실시양태에서, 방법은 라이브러리를 획득하는 것을 추가로 포함하며, 여기서 라이브러리 내의 상기 핵산 단편의 크기는 참조 값 이하이고, 상기 라이브러리는 DNA 단리와 라이브러리 생성 사이의 단편화 단계 없이 만들어진다.
한 실시양태에서, 방법은 핵산 단편을 획득하는 것을 추가로 포함하고, 상기 핵산 단편의 크기가 참조 값 이상이고 단편화되는 경우, 이러한 핵산 단편은 라이브러리로 만들어진다.
한 실시양태에서, 방법은, 예를 들어, 식별가능한 별개의 핵산 서열 (바코드)을 복수 개의 핵산 분자 각각에 부가함으로써, 복수 개의 라이브러리 핵산 분자 각각을 표지하는 것을 추가로 포함한다.
한 실시양태에서, 방법은 프라이머를 복수 개의 라이브러리 핵산 분자 각각에 부착하는 것을 추가로 포함한다.
한 실시양태에서, 방법은 복수 개의 표적 포획 시약을 제공하는 것 및 복수 개의 표적 포획 시약을 선택하는 것을 추가로 포함하며, 상기 선택은 하기에 반응한다: 1) 환자 특징, 예를 들어, 연령, 종양 병기, 이전 치료 또는 저항성; 2) 종양 유형; 3) 샘플의 특징; 4) 대조군 샘플의 특징; 5) 대조군의 존재 또는 유형; 6) 단리된 종양 (또는 대조군) 핵산 샘플의 특징; 7) 라이브러리 특징; 8) 샘플 중의 종양 유형과 연관된 것으로 공지된 돌연변이; 9) 샘플 중의 종양 유형과 연관된 것으로 공지되지 않은 돌연변이; 10) 서열을 시퀀싱 (또는 혼성화 또는 회수)할 수 있거나 또는 돌연변이, 예를 들어, 높은 GC 영역 또는 재배열을 갖는 서열과 연관된 장애를 확인할 수 있는 능력; 또는 11) 시퀀싱되는 유전자.
한 실시양태에서, 방법은, 예를 들어, 상기 샘플 중의 적은 수의 종양 세포의 결정에 대응하여, 표적 포획 시약 또는 복수 개의 표적 포획 시약을 선택함으로써, 제2 유전자의 핵산 분자와 비교 시 제1 유전자의 핵산 분자의 비교적 고도로 효율적인 포획을 제공하는 것을 추가로 포함하며, 예를 들어, 여기서 제1 유전자에서의 돌연변이는 샘플의 종양 유형에 대한 종양 표현형과 연관되고, 임의로 제2 유전자에서의 돌연변이는 샘플의 종양 유형에 대한 종양 표현형과 연관되지 않는다.
한 실시양태에서, 상기 방법은 라이브러리 캐치 특징, 예를 들어, 핵산 농도에 대한 값을 획득하는 것, 및 이와 같이 획득된 값을 상기 특징에 대한 참조 기준과 비교하는 것을 추가로 포함한다.
한 실시양태에서, 방법은 라이브러리 정량화에 대한 참조 기준을 충족하는 라이브러리 특징에 대한 값을 가진 라이브러리를 선택하는 것을 추가로 포함한다.
시퀀싱
본 발명은 또한, 핵산을 시퀀싱하는 방법을 포함한다. 이러한 방법에서, 라이브러리로부터의 핵산 분자는 본원에 기재된 방법을 사용하여, 예를 들어, 용액 혼성화를 사용함으로써 단리되며, 이에 의해 라이브러리 캐치를 제공한다. 라이브러리 캐치 또는 그의 하위 군이 시퀀싱될 수 있다. 따라서, 본 발명에서 특별히 포함된 방법은 라이브러리 캐치를 분석하는 것을 추가로 포함한다. 한 실시양태에서, 라이브러리 캐치는 시퀀싱 방법, 예를 들어, 본원에 기재된 바와 같은 차세대 시퀀싱 방법에 의해 분석된다. 상기 방법은 용액 혼성화에 의해 라이브러리 캐치를 단리하는 것, 및 핵산 시퀀싱에 의해 라이브러리 캐치를 처리하는 것을 포함한다. 특정 실시양태에서, 라이브러리 캐치는 재시퀀싱될 수 있다.
관련 기술분야에 공지된 임의의 시퀀싱 방법이 사용될 수 있다. 선택 방법에 의해 단리된 핵산의 시퀀싱은 전형적으로, 차세대 시퀀싱 (NGS)을 사용하여 수행된다. 본원에 사용하기 적합한 시퀀싱 방법은, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426에 기재된 바와 같이 관련 기술분야에 기재되어 있다.
한 실시양태에서, 획득되거나 분석된 리드의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%가 본원에 기재된 유전자, 예를 들어, 표 1A-5A로부터의 유전자로부터의 대상 구간에 대한 것이다. 한 실시양태에서, 적어도 0.01, 0.02, 0.03, 0.04, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 2.0, 5.0, 10, 15, 또는 30개의 메가염기, 예를 들어, 게놈 염기가 시퀀싱된다. 한 실시양태에서, 상기 방법은 본원에 기재된 샘플로부터 수득된 뉴클레오티드 서열 리드를 획득하는 것을 포함한다. 한 실시양태에서, 리드는 NGS 시퀀싱 방법에 의해 제공된다.
본원에 개시된 방법은 대상체의 게놈, 전체 엑솜 또는 전사체에 존재하는 변경을 검출하기 위해 사용될 수 있고, DNA 및 RNA 시퀀싱, 예를 들어, 표적화 DNA 및/또는 RNA 시퀀싱에 적용될 수 있다. 일부 실시양태에서, 본원에 기재된 유전자의 전사체가 시퀀싱된다. 다른 실시양태에서, 상기 방법은 유전자 또는 유전자 산물의 수준에 있어서의 변화 (예를 들어, 증가 또는 감소), 예를 들어, 본원에 기재된 유전자 또는 유전자 산물의 발현에 있어서의 변화의 검출을 포함한다. 상기 방법은 임의로, 표적 RNA에 대한 샘플을 강화하는 단계를 포함할 수 있다. 다른 실시양태에서, 상기 방법은 특정의 높은 존재도 RNA, 예를 들어, 리보솜 또는 글로빈 RNA의 샘플을 고갈시키는 단계를 포함한다. RNA 시퀀싱 방법은 단독으로 또는 본원에 기재된 DNA 시퀀싱 방법과 조합하여 사용될 수 있다. 한 실시양태에서, 상기 방법은 DNA 시퀀싱 단계 및 RNA 시퀀싱 단계를 수행하는 것을 포함한다. 상기 방법은 임의의 순서로 수행될 수 있다. 예를 들어, 상기 방법은 본원에 기재된 변경의 발현을 RNA 시퀀싱에 의해 확증하는 것, 예를 들어, 본 발명의 DNA 시퀀싱 방법에 의해 검출된 돌연변이 또는 융합의 발현을 확증하는 것을 포함할 수 있다. 다른 실시양태에서, 상기 방법은 RNA 시퀀싱 단계에 이어 DNA 시퀀싱 단계를 수행하는 것을 포함한다.
정렬
정렬은 리드를 위치, 예를 들어, 게놈 위치와 매칭시키는 프로세스이다. 정렬 오류 (예를 들어, 게놈 내의 잘못된 위치에 대한 짧은 리드로부터의 염기-쌍의 배치), 예를 들어, 실제 암 돌연변이 주변의 리드의 서열 컨텍스트 (예를 들어, 반복적 서열의 존재)로 인한 정렬 오류는 돌연변이 검출의 감도를 감소시킬 수 있는데, 이는 대체 대립유전자의 리드가 대체 대립유전자 리드의 주요 누적에서 이동될 수 있기 때문이다. 실제 돌연변이가 존재하지 않는 곳에서 문제가 있는 서열 컨텍스트가 발생하는 경우, 잘못된 위치 상에 참조 게놈 염기의 실제 리드를 배치함으로써 정렬 오류는 "돌연변이된" 대립유전자의 인공적 리드를 도입할 수 있다. 증가된 다중유전자 분석을 위한 돌연변이 호출 알고리즘은 심지어 낮은 존재도의 돌연변이에도 감수성이어야 하기 때문에, 이러한 정렬 오류는 거짓 양성 발견률을 증가시키고 특이성을 감소시킬 수 있다.
본원에서 논의된 바와 같이, 실제 돌연변이에 대한 감소된 감도는 분석되는 유전자에서 예상되는 돌연변이 부위 주변의 정렬 품질을 (수동으로 또는 자동화 방식으로) 평가함으로써 해결될 수 있다. 평가할 부위는 암 돌연변이 데이터베이스 (예를 들어, COSMIC)로부터 수득될 수 있다. 문제가 있는 것으로 확인되는 영역은, 예를 들어, 더 느리지만 보다 정확한 정렬 알고리즘, 예컨대 스미스-워터맨(Smith-Waterman) 정렬을 사용하는 정렬 최적화 (또는 재정렬)에 의해 관련 시퀀스 컨텍스트에서 더 나은 성능을 제공하도록 선택된 알고리즘을 사용하여 해결될 수 있다. 일반적인 정렬 알고리즘이 그 문제를 해결할 수 없는 경우, 예를 들어, 치환을 함유할 가능성이 높은 유전자에 대한 최대 차이 미스매치 페널티 파라미터의 조정; 특정 종양 유형에서 공통적인 특이적 돌연변이 유형 (예를 들어, 흑색종에서 C→T)을 기반으로 특이적 미스매치 페널티 파라미터를 조정하는 것; 또는 특정 샘플 유형에서 공통적인 특이적 돌연변이 유형 (예를 들어, FFPE에 공통적인 치환)을 기반으로 특이적 미스매치 페널티 파라미터를 조정하는 것에 의해 맞춤화된 정렬 접근법이 창출될 수 있다.
정렬 오류로 인해 평가된 유전자 영역에서 감소된 특이성 (증가된 거짓 양성률)은 시퀀싱된 샘플 중의 모든 돌연변이 호출을 수동 또는 자동으로 검사함으로써 평가될 수 있다. 정렬 오류로 인해 가짜 돌연변이 호출이 발생하기 쉬운 것으로 밝혀진 영역은 상기와 동일한 정렬 해결책를 받을 수 있다. 알고리즘적 해결책이 불가능한 경우, 문제 영역으로부터의 "돌연변이"를 분류하거나 또는 시험 패널로부터 스크리닝할 수 있다.
본원에 개시된 방법은 특히, 예를 들어, 샘플로부터 많은 수의 다양한 유전자에서의 많은 수의 다양한 유전적 이벤트의 대규모 병렬 시퀀싱에 의존하는 방법에서, 재배열, 예를 들어, indel과 연관된 대상 구간의 시퀀싱에서의 성능을 최적화하기 위해 개별적으로 조정된 다수의 정렬 방법 또는 알고리즘의 사용을 허용한다. 일부 실시양태에서, 상이한 유전자에서의 다수의 재배열 각각에 개별적으로 맞춤화되거나 조정되는 다수의 정렬 방법이 리드를 분석하는데 사용된다. 실시양태에서, 조정하는 것은 시퀀싱되는 유전자 (또는 다른 대상 구간), 샘플 중의 종양 유형, 시퀀싱되는 변이체, 또는 샘플 또는 대상체의 특징 중 (하나 이상의) 함수일 수 있다. 이러한 정렬 조건의 선택 또는 사용은 시퀀싱될 다수의 대상 구간으로 미세-조정되어 속도, 감도 및 특이성을 최적화할 수 있다. 상기 방법은 비교적 많은 수의 다양한 대상 구간에 대한 리드의 정렬이 최적화될 때 특히 유효하다. 실시양태에서, 상기 방법은 재배열에 최적화된 정렬 방법 및 재배열과 연관되지 않은 대상 구간에 최적화된 다른 방법의 사용을 포함한다.
일부 실시양태에서, 정렬 선택자가 사용된다. 본원에 사용된 바와 같은, "정렬 선택자"는 대상 구간의 시퀀싱을 최적화할 수 있는 정렬 방법, 예를 들어, 정렬 알고리즘 또는 파라미터의 선택을 허용하거나 지시하는 파라미터를 지칭한다. 정렬 선택자는, 예를 들어, 하기 중 하나 이상에 특이적이거나 또는 그의 함수로서 선택될 수 있다:
1. 서열 컨텍스트, 예를 들어, 특정 대상 구간에 대한 리드의 정렬 오류에 대한 성향과 연관되는 상기 대상 구간 (예를 들어, 평가될 뉴클레오티드 위치)의 서열 컨텍스트. 예를 들어, 게놈 내의 다른 곳에서 반복되는 평가될 대상 구간 내 또는 그 근처에 서열 요소의 존재는 정렬 오류를 유발하고 이에 의해 성능을 저하시킬 수 있다. 정렬 오류를 최소화하는 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 이러한 경우 정렬 선택자에 대한 값은 서열 컨텍스트, 예를 들어, 게놈 (또는 분석되는 게놈의 일부분)에서 적어도 여러 번 반복되는 길이의 서열의 존재 또는 부재의 함수일 수 있다.
2. 분석되는 종양 유형. 예를 들어, 특이적 종양 유형은 증가된 결실률을 특징으로 할 수 있다. 따라서, indel에 더 감수성인 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 이러한 경우 정렬 선택자에 대한 값은 종양 유형의 함수, 예를 들어, 종양 유형에 대한 식별자일 수 있다. 한 실시양태에서, 상기 값은 종양 유형의 정체, 예를 들어, 고형 종양 또는 혈액 악성 종양 (또는 전악성 종양)이다.
3. 분석되는 유전자 또는 유전자 유형, 예를 들어, 유전자 또는 유전자 유형)이 분석될 수 있다. 종양 유전자는 예로서, 종종 치환 또는 인-프레임 indel을 특징으로 한다. 따라서, 이들 변이체에 특히 감수성이고 다른 것에 대항하여 특이적인 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 종양 억제인자는 종종 프레임-시프트 indel을 특징으로 한다. 따라서, 이들 변이체에 특히 감수성인 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 따라서, 대상 구간과 매칭되는 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 이러한 경우 정렬 선택자에 대한 값은 유전자 또는 유전자 유형의 함수, 예를 들어 유전자 또는 유전자 유형에 대한 식별자일 수 있다. 한 실시양태에서, 상기 값은 유전자의 정체이다.
4. 분석되는 부위 (예를 들어, 뉴클레오티드 위치). 이러한 경우 정렬 선택자에 대한 값은 부위 또는 부위 유형의 함수, 예를 들어, 부위 또는 부위 유형에 대한 식별자일 수 있다. 한 실시양태에서 그 값은 부위의 정체이다. 예를 들어, 부위를 함유하는 유전자가 또 다른 유전자와 고도로 상동인 경우, 정상적/신속한 짧은 리드 정렬 알고리즘 (예를 들어, BWA)은 두 유전자 간을 구별하는데 어려움을 겪을 수 있으며, 잠재적으로 보다 집중적인 정렬 방법 (스미스-워터맨) 또는 심지어 어셈블리 (ARACHNE)가 필요할 수 있다. 유사하게, 유전자 서열이 낮은 복잡도 영역 (예를 들어, AAAAAA)을 함유하는 경우, 보다 집중적인 정렬 방법이 필요할 수 있다.
5. 평가되는 대상 구간과 연관된 변이체, 또는 변이체 유형. 예를 들어, 치환, 삽입, 결실, 전위 또는 다른 재배열. 따라서, 특이적 변이체 유형에 더 감수성인 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 이러한 경우 정렬 선택자에 대한 값은 변이체 유형의 함수, 예를 들어, 변이체 유형에 대한 식별자일 수 있다. 한 실시양태에서 그 값은 변이체 유형의 정체, 예를 들어, 치환이다.
6. 샘플, 예를 들어, 본원에 기재된 샘플의 유형. 샘플 유형/품질은 오류 (비-참조 서열의 잘못된 관찰) 율에 영향을 미칠 수 있다. 따라서, 샘플에서의 실제 오류율을 정확하게 모델링하는 알고리즘 또는 알고리즘 파라미터를 선택함으로써 성능을 증강시킬 수 있다. 이러한 경우 정렬 선택자에 대한 값은 샘플 유형의 함수, 예를 들어, 샘플 유형에 대한 식별자일 수 있다. 한 실시양태에서, 그 값은 샘플 유형의 정체이다.
일반적으로, indel 돌연변이의 정확한 검출은 정렬 운동인데, 이는 본원에서 비활성화된 시퀀싱 플랫폼 상의 잘못된 indel 비율이 상대적으로 낮기 때문이다 (따라서, 올바르게 정렬된 indel에 대한 소수의 관찰조차도 돌연변이의 강력한 증거가 될 수 있음). 그러나 indel의 존재에서는 정확한 정렬이 어려울 수 있다 (특히 indel 길이가 증가하기 때문임). 정렬과 연관된 일반적인 문제, 예를 들어, 치환 외에도, indel 자체가 정렬과 연관된 문제를 유발시킬 수 있다. (예를 들어, 디뉴클레오티드 반복부의 2 bp의 결실은 쉽게 결정적으로 배치될 수 없음.) 더 짧은 (<15 bp) 명백한 indel-함유 리드를 잘못 배치하면 감도와 특이성 둘 다가 감소될 수 있다. 더 큰 indel (크기 면에서 개별 리드, 예를 들어, 36 bp의 리드의 길이에 더 가까워짐)은 리드를 전혀 정렬하지 못하게 하여, 정렬된 리드의 표준 세트에서 indel의 검출을 불가능하게 한다.
암 돌연변이 데이터베이스를 사용하여 이러한 문제를 해결하고 성능을 개선시킬 수 있다. 거짓 양성 indel 회수를 감소시키기 위해 (특이성을 개선시키기 위해), 흔히 예상되는 indel 주변 영역을, 서열 컨텍스트로 인해 문제가 있는 정렬에 대해 검사하고 상기 치환과 유사하게 해결할 수 있다. indel 검출의 감도를 개선시키기 위해, 암에서 예상되는 indel에 대한 정보를 사용하는 여러 상이한 접근법을 사용할 수 있다. 예를 들어, 예상된 indel이 함유된 짧은 리드를 시뮬레이션하고 정렬을 시도할 수 있다. 정렬을 연구할 수 있고 문제가 있는 indel 영역은, 예를 들어, 갭 오픈/확장 페널티를 감소시킴으로써 또는 부분 리드 (예를 들어, 리드의 제1 또는 제2 절반)를 정렬함으로써 조정된 정렬 파라미터를 가질 수 있다.
대안적으로, 초기 정렬은 정상적인 참조 게놈 뿐만 아니라 공지되거나 또는 가능성이 있는 암 indel 돌연변이 각각을 함유하는 게놈의 대체 버전으로도 시도될 수 있다. 이러한 접근법에서는, 초기에는 정렬하지 못했거나 잘못 정렬된 indel의 리드가 게놈의 대체 (돌연변이된) 버전에 성공적으로 배치된다.
이러한 방식으로, indel 정렬 (및 이에 따른 호출)은 예상되는 암 유전자/부위에 대해 최적화될 수 있다. 본원에 사용된 바와 같이, 서열 정렬 알고리즘은 리드 서열과 참조 서열 간의 유사성을 평가함으로써, 리드 서열 (예를 들어, 차세대 시퀀싱로부터의, 예를 들어, 짧은 리드 서열)이 유래될 가능성이 가장 높은 게놈 내의 위치를 확인하기 위해 사용되는 계산 방법 또는 접근법을 구현한다. 다양한 알고리즘이 서열 정렬 문제에 적용될 수 있다. 일부 알고리즘은 비교적 느리지만 비교적 높은 특이성을 허용한다. 이들은, 예를 들어, 동적 프로그래밍-기반 알고리즘을 포함한다. 동적 프로그래밍은 복잡한 문제를 더 간단한 단계로 나누어 해결하는 방법이다. 다른 접근법은 비교적 더 효율적이지만 전형적으로 철저하지 않다. 이들은, 예를 들어, 대규모 데이터베이스 검색을 위해 설계된 휴리스틱 알고리즘 및 확률적 방법을 포함한다.
정렬 파라미터는 정렬 알고리즘에서 알고리즘의 성능을 조정하기 위해, 예를 들어, 리드 서열과 참조 서열 간의 최적의 포괄적 또는 국소 정렬을 야기시키기 위해 사용된다. 정렬 파라미터는 매치, 미스매치, 및 indel에 대한 가중치를 제공할 수 있다. 예를 들어, 가중치가 낮을수록 더 많은 미스매치 및 indel이 있는 정렬이 허용된다.
서열 컨텍스트, 예를 들어, 반복적 서열 (예를 들어, 탠덤 반복부, 산재된 반복부), 낮은 복잡도 영역, indel, 유사 유전자 또는 파라로그의 존재는 정렬 특이성에 영향을 미칠 수 있다 (예를 들어, 정렬 오류를 유발시킴). 본원에 사용된 바와 같은, 정렬 오류는 게놈 내의 잘못된 위치에 대한 짧은 리드로부터의 염기-쌍의 배치를 지칭한다.
종양 유형, 예를 들어, 특별한 돌연변이 또는 돌연변이 유형을 갖는 경향이 있는 종양 유형에 기초하여 정렬 알고리즘이 선택되거나 또는 정렬 파라미터가 조정될 때, 정렬의 감도가 증가될 수 있다.
특별한 유전자 유형 (예를 들어, 종양 유전자, 종양 억제 유전자)에 기초하여 정렬 알고리즘이 선택되거나 또는 정렬 파라미터가 조정될 때, 정렬의 감도가 증가될 수 있다. 상이한 유형의 암 관련 유전자에서의 돌연변이는 암 표현형에 상이한 영향을 미칠 수 있다. 예를 들어, 돌연변이체 종양 유전자 대립유전자가 전형적으로 우성이다. 돌연변이체 종양 억제 대립유전자는 전형적으로 열성이며, 이는 대부분의 경우 종양 억제 유전자의 두 대립유전자가, 효과가 나타나기 전에 영향을 받아야만 한다는 것을 의미한다.
돌연변이 유형 (예를 들어, 단일 뉴클레오티드 다형성, indel (삽입 또는 결실), 역위, 전위, 탠덤 반복부)에 기초하여 정렬 알고리즘이 선택되거나 또는 정렬 파라미터가 조정될 때, 정렬의 감도가 조정 (예를 들어, 증가)될 수 있다.
돌연변이 부위 (예를 들어, 돌연변이 핫스팟)에 기초하여 정렬 알고리즘이 선택되거나 또는 정렬 파라미터가 조정될 때, 정렬의 감도가 조정 (예를 들어, 증가)될 수 있다. 돌연변이 핫스팟은 정상적인 돌연변이 속도보다 100배 이하 더 자주 돌연변이가 발생하는 게놈 내의 부위를 지칭한다.
샘플 유형 (예를 들어, cfDNA 샘플, ctDNA 샘플, FFPE 샘플, 또는 CTC 샘플)에 기초하여 정렬 알고리즘이 선택되거나 또는 정렬 파라미터가 조정될 때, 정렬의 감도/특이성이 조정 (예를 들어, 증가)될 수 있다.
일부 실시양태에서, NGS 리드는 공지된 참조 서열에 정렬되거나 또는 새롭게 어셈블리될 수 있다. 예를 들어, NGS 리드는 참조 서열 (예를 들어, 야생형 서열)에 정렬될 수 있다. NGS을 위한 서열 정렬 방법은, 예를 들어, 문헌 [Trapnell C. and Salzberg S.L. Nature Biotech., 2009, 27:455-457]에 기재되어 있다. 새로운 어셈블리의 예는, 예를 들어, 문헌 [Warren R. et al., Bioinformatics, 2007, 23:500-501; Butler J. et al., Genome Res., 2008, 18:810-820; and Zerbino D.R. and Birney E., Genome Res., 2008, 18:821-829]에 기재되어 있다. 서열 정렬 또는 어셈블리는 하나 이상의 NGS 플랫폼으로부터의 리드 데이터를 사용하여, 예를 들어, 로슈(Roche)/454 및 일루미나/솔렉사(Solexa) 리드 데이터를 혼합하여 수행될 수 있다.
정렬의 최적화는, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426에 제시된 바와 같이 관련 기술분야에 기재되어 있다.
돌연변이 호출
염기 호출은 시퀀싱 장치의 원시 출력을 지칭한다. 돌연변이 호출은 시퀀싱되는 뉴클레오티드 위치에 대한 뉴클레오티드 값, 예를 들어, A, G, T 또는 C를 선택하는 프로세스를 지칭한다. 전형적으로, 특정 위치에 대한 시퀀싱 리드 (또는 염기 호출)는 둘 이상의 값을 제공할 것이며, 예를 들어, 일부 리드는 T를 제공하고 일부는 G를 제공할 것이다. 돌연변이 호출은 뉴클레오티드 값, 예를 들어, 이들 값 중 하나를 서열에 배정하는 프로세스이다. "돌연변이" 호출로서 지칭되긴 하지만, 이는 뉴클레오티드 값을 임의의 뉴클레오티드 위치, 예를 들어, 돌연변이체 대립유전자, 야생형 대립유전자, 돌연변이체 또는 야생형으로서 특징규명되지 않은 대립유전자에 상응하는 위치, 또는 가변성을 특징으로 하지 않는 위치에 배정하기 위해 적용될 수 있다. 돌연변이 호출을 위한 방법은 하기 중 하나 이상을 포함할 수 있다: 참조 서열 내의 각각의 위치에서의 정보를 기반으로 독립적인 호출를 만드는 것 (예를 들어, 서열 리드를 검사하는 것; 염기 호출 및 품질 점수를 검사하는 것; 잠재적 유전자형을 고려하여 관찰된 염기의 확률 및 및 품질 점수를 계산하는 것; 및 유전자형을 배정하는 것 (예를 들어, 베이스(Bayes)의 규칙을 사용하는 것)); 거짓 양성을 제거하는 것 (예를 들어, 예상보다 훨씬 낮거나 높은 리드 깊이가 있는 SNP를 거부하기 위해 깊이 임계 값을 사용하는 것; 작은 indel로 인한 거짓 양성을 제거하기 위해 국소 재정렬을 사용하는 것); 및 연쇄 불균형 (LD)/귀책 기반 분석을 수행하여 호출을 개선하는 것.
특이적 유전자형 및 위치와 연관된 유전자형 가능성을 계산하는 방정식은, 예를 들어, 문헌 [Li H. and Durbin R. Bioinformatics, 2010; 26(5): 589-95]에 기재되어 있다. 특정 암 유형의 특별한 돌연변이에 대한 이전의 예상치는 그러한 암 유형으로부터의 샘플을 평가할 때 사용될 수 있다. 이러한 가능성은 암 돌연변이의 공개 데이터베이스, 예를 들어, 암에서의 체세포 돌연변이의 카탈로그 (COSMIC), HGMD (인간 유전자 돌연변이 데이터베이스), SNP 협회, 유방암 돌연변이 데이터 베이스 (BIC), 및 유방암 유전자 데이터베이스 (BCGD)로부터 유래될 수 있다.
LD/귀책 기반 분석의 예는, 예를 들어, 문헌 [Browning B.L. and Yu Z. Am. J. Hum. Genet. 2009, 85(6):847-61]에 기재되어 있다. 낮은 커버리지 SNP 호출 방법의 예가, 예를 들어, 문헌 [Li Y. et al., Annu. Rev. Genomics Hum. Genet. 2009, 10:387-406]에 기재되어 있다.
정렬 후, 호출 방법, 예를 들어, 베이지안 돌연변이 호출 방법을 사용하여 치환의 검출을 수행할 수 있으며; 이는 각각의 대상 구간, 예를 들어, 대체 대립유전자의 존재가 관찰되는 평가될 유전자의 엑손에서 각각의 염기에 적용된다. 이러한 방법은 돌연변이의 존재 시 리드 데이터를 관찰할 확률과, 염기 호출 오류 단독의 존재 시 리드 데이터를 관찰할 확률을 비교할 것이다. 이러한 비교가 돌연변이의 존재를 충분히 강력하게 뒷받침하는 경우에 돌연변이가 호출될 수 있다.
암 DNA의 분석을 위해 50% 또는 100%의 빈도로부터 제한된 편차를 해결하는 방법이 개발되었다 (예를 들어, SNVMix - Bioinformatics. 2010 March 15; 26(6): 730-736). 그러나 본원에 개시된 방법은 샘플 DNA의 1% 내지 100%, 특히 50% 미만의 수준에서 돌연변이체 대립유전자의 존재 가능성을 고려할 수 있다. 이러한 접근법은 자연 (다중-클로날) 종양 DNA의 저 순도 FFPE 샘플에서의 돌연변이의 검출에 특히 중요하다.
베이지안 돌연변이 검출 접근법의 장점은 돌연변이의 존재 확률과 염기 호출 오류 단독의 확률을 비교하는 것이, 그 부위에서 돌연변이의 존재에 대한 이전의 예상치 의해 가중될 수 있다는 것이다. 주어진 암 유형에 대해 빈번하게 돌연변이된 부위에서 대체 대립유전자의 일부 리드가 관찰되는 경우에는, 돌연변이 증거의 양이 통상적인 임계 값을 충족하지 않더라도 돌연변이의 존재를 자신있게 호출할 수 있다. 그런 다음, 이러한 유연성을 사용하여 심지어 더 희귀한 돌연변이/더 낮은 순도 샘플에 대한 검출 감도를 증가시킬 수 있거나 또는 리드 커버리지를 감소시키기 위한 더 강력한 시험을 만들 수 있다. 게놈 내의 무작위 염기-쌍이 암에서 돌연변이될 가능성은 ~1e-6이다. 전형적인 다중유전자 암 게놈 패널 내의 많은 부위에서 특이적 돌연변이의 가능성은 수십배 더 높을 수 있다. 이러한 가능성은 암 돌연변이의 공개 데이터베이스 (예를 들어, COSMIC)로부터 유래될 수 있다. indel 호출은 전형적으로 관련 신뢰 점수 또는 통계적 증거 메트릭을 포함한, 삽입 또는 결실만큼 참조 서열과 상이한 시퀀싱 데이터에서 염기를 찾는 프로세스이다.
indel 호출 방법은 후보 indel을 확인하는 단계, 국소 재정렬을 통한 유전자형 가능성을 계산하는 단계, 및 LD-기반 유전자형 추론 및 호출을 수행하는 단계를 포함할 수 있다. 전형적으로, 베이지안 접근법을 사용하여 잠재적 indel 후보를 수득한 다음, 이러한 후보를 베이지안 프레임워크에서 참조 서열과 함께 시험한다.
후보 indel을 생성하는 알고리즘이, 예를 들어, 문헌 [McKenna A. et al., Genome Res. 2010; 20(9):1297-303; Ye K. et al., Bioinformatics, 2009; 25(21):2865-71; Lunter G. and Goodson M. Genome Res. 2011; 21(6):936-9; and Li H. et al., Bioinformatics 2009, Bioinformatics 25(16):2078-9]에 기재되어 있다.
indel 호출 및 개별 수준의 유전자형 가능성을 생성하는 방법은, 예를 들어, Dindel 알고리즘을 포함한다 (Albers C.A. et al., Genome Res. 2011;21(6):961-73). 예를 들어, 베이지안 EM 알고리즘을 사용하여 리드를 분석하고, 초기 indel 호출을 수행하고, 각각의 후보 indel에 대한 유전자형 가능성을 생성한 다음, 예를 들어, QCALL을 사용하여 유전자형의 귀책을 수행할 수 있다 (Le S.Q. and Durbin R. Genome Res. 2011;21(6):952-60). 파라미터, 예컨대 indel 관찰에 대한 이전의 예상치는 indel의 크기 또는 위치에 기초하여 조정 (예를 들어, 증가 또는 감소)될 수 있다.
한 실시양태에서, 상기 방법에서 이루어진 돌연변이 호출의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%는 본원에 기재된 유전자 또는 유전자 산물, 예를 들어, 표 1A-5A로부터의 유전자 또는 유전자 산물로부터의 대상 구간에 대한 것이다. 한 실시양태에서, 본원에 기재된 독특한 임계 값의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%는 본원에 기재된 유전자 또는 유전자 산물, 예를 들어, 표 1A-5A로부터의 유전자 또는 유전자 산물로부터의 대상 구간에 대한 것이다. 한 실시양태에서, 주석이 달리거나 또는 제3자에게 보고된 돌연변이 호출의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%는 본원에 기재된 유전자 또는 유전자 산물, 예를 들어, 표 1A-5A로부터의 유전자 또는 유전자 산물로부터의 대상 구간에 대한 것이다.
한 실시양태에서, 특정 뉴클레오티드 위치에 대해 배정된 값은 임의로 설명 주석과 함께 제3자에게 전송된다. 한 실시양태에서, 뉴클레오티드 위치에 대해 배정된 값은 제3자에게 전송되지 않는다. 한 실시양태에서, 복수 개의 뉴클레오티드 위치에 대해 배정된 값은 임의로 설명 주석과 함께 제3자에게 전송되고, 제2의 복수 개의 뉴클레오티드 위치에 대해 배정된 값은 제3자에게 전송되지 않는다.
한 실시양태에서, 상기 방법은, 예를 들어, 바코드 디컨볼루션에 의해 하나 이상의 리드를 대상체에 배정하는 것을 포함한다. 한 실시양태에서, 상기 방법은, 예를 들어, 바코드 디컨볼루션에 의해 하나 이상의 리드를 종양 리드 또는 대조군 리드로서 배정하는 것을 포함한다. 한 실시양태에서, 상기 방법은, 예를 들어, 참조 서열과의 정렬에 의해, 상기 하나 이상의 리드 각각을 맵핑하는 것을 포함한다. 한 실시양태에서, 상기 방법은 호출된 돌연변이를 기억시키는 것을 포함한다.
한 실시양태에서, 상기 방법은 호출된 돌연변이에 주석을 다는 것, 예를 들어, 돌연변이 구조, 예를 들어, 미스센스 돌연변이, 또는 기능, 예를 들어, 질환 표현형의 표시와 함께 호출된 돌연변이에 주석을 다는 것을 포함한다. 한 실시양태에서, 상기 방법은 종양 및 대조군 핵산에 대한 뉴클레오티드 서열 리드를 획득하는 것을 포함한다. 한 실시양태에서, 상기 방법은, 예를 들어, 베이지안 호출 방법 또는 비-베이지안 호출 방법을 사용하여 대상 구간 (예를 들어, 서브게놈 구간, 발현된 서브게놈 구간, 또는 둘 다) 각각에 대한 뉴클레오티드 값, 예를 들어, 변이체, 예를 들어, 돌연변이를 호출하는 것을 포함한다. 한 실시양태에서, 상기 방법은 적어도 하나의 SNP를 포함하는 복수 개의 리드를 평가하는 것을 포함한다. 한 실시양태에서, 상기 방법은 샘플 및/또는 대조군 리드에서 SNP 대립유전자 비율을 결정하는 것을 포함한다.
일부 실시양태에서, 상기 방법은 표적화된 서브게놈 영역에 대한 시퀀싱/정렬 인공물의 데이터베이스를 구축하는 것을 추가로 포함한다. 한 실시양태에서, 데이터베이스는 잘못된 돌연변이 호출을 필터링하고 특이성을 개선하는데 사용될 수 있다. 한 실시양태에서 데이터베이스는 무관한 샘플 또는 세포주를 시퀀싱하는 것 및 이들 정상 샘플 중 1개 이상에서 무작위 시퀀싱 오류 단독로 인해 예상보다 더 자주 나타나는 비-참조 대립유전자 이벤트를 기록하는 것에 의해 구축된다. 이러한 접근법은 배선 변이를 인공물로 분류할 수 있지만, 체세포 돌연변이와 관련된 방법에서는 허용 가능하다. 배선 변이를 인공물로 잘못 분류하는 것은 원하는 경우, 공지된 배선 변이에 대한 이러한 데이터베이스를 필터링하는 것 (공통 변이체를 제거하는 것) 및 단 1명의 개체에만 나타나는 인공물에 대한 데이터베이스를 필터링하는 것 (더 희귀한 변이를 제거하는 것)에 의해 완화될 수 있다.
돌연변이 호출의 최적화는, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426에 제시된 바와 같이, 관련 기술분야에 기재되어 있다.
SGZ 알고리즘
다양한 유형의 변경, 예를 들어, 체세포 변경 및 배선 돌연변이가 본원에 기재된 방법 (예를 들어, 시퀀싱, 정렬, 또는 돌연변이 호출 방법)에 의해 검출될 수 있다. 특정 실시양태에서, 배선 돌연변이는 SGZ (체세포-배선-접합성) 알고리즘을 사용하는 방법에 의해 추가로 확인된다.
임상 실습에서는, 매칭된 정상 대조군이 통상적으로 수득되지 않는다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, 널리 특징규명된 게놈 변경은 해석을 위해 정상 조직을 필요로 하지 않지만, 적어도 일부 변경은 매칭된 정상 대조군의 부재 시, 그들이 배선인지 아니면 체세포인지의 여부에 있어서 공지되어 있지 않을 것이다. SGZ는 암 표본의 차세대 시퀀싱으로부터 확인된 변이체의 체세포 대 배선 기원 및 동형접합성 대 이형접합성 또는 서브클로날 상태를 예측하는 계산 방법이다.
SGZ 방법은 매칭된 정상 대조군을 필요로 하지 않으므로, 임상 환경에서 광범위하게 적용할 수 있다. SGZ는 종양 함량, 종양 배수성 및 국소 카피 수를 고려하여 변경의 대립유전자 빈도 (AF)를 모델링함으로써 확인된 각각의 변경의 체세포 대 배선 상태를 예측한다. 예측의 정확성은 시퀀싱의 깊이와 카피 수 모델 적합도에 따라 달라지며, 이는 암 관련 유전자와 게놈 전반에서의 단일 뉴클레오티드 다형성 (SNP)을 포괄하는 높은 깊이로 시퀀싱함으로써 달성될 수 있다. SNP AF의 리드 깊이 및 국소 가변성을 기반으로 한 통계를 사용하여 호출이 이루어진다.
일부 실시양태에서, 상기 방법은 하기 단계를 포함하는, 대상체, 예를 들어, 인간, 예를 들어, 암 환자로부터의 조직 (예를 들어, 종양) 또는 샘플 중에서의 변이체, 예를 들어, 돌연변이의 특징을 규명하는 것을 추가로 포함한다:
a) 하기를 획득하는 단계:
i) 복수 개의 선택된 대상 구간, 예를 들어, 엑손 각각에 대해, 이러한 선택된 대상 구간에서 정규화된 서열 커버리지에 대한 값을 포함하는 서열 커버리지 입력 (SCI);
ii) 복수 개의 선택된 배선 SNP 각각에 대해, 종양 또는 샘플 중의 대립유전자 빈도에 대한 값을 포함하는 SNP 대립유전자 빈도 입력 (SAFI);
iii) 종양 또는 샘플 중의 변이체, 예를 들어, 돌연변이에 대한 대립유전자 빈도를 포함하는 변이체 대립유전자 빈도 입력 (VAFI);
b) SCI 및 SAFI의 함수로서, 하기에 대한 값을 획득하는 단계:
복수 개의 게놈 세그먼트 각각에 대한 C (여기서 C는 게놈 세그먼트 총 카피 수임);
복수 개의 게놈 세그먼트 각각에 대한 M (여기서 M은 게놈 세그먼트 소수 대립유전자 카피 수임); 및
p (여기서 p는 샘플 순도임); 및
c) 하기 중 하나 또는 둘 다를 C 및 M의 함수로서 획득하는 단계:
i) 변이체 유형, 예를 들어 돌연변이 유형, 예를 들어, g에 대한 값으로서, 이는 체세포인 변이체, 예를 들어, 돌연변이, 서브클로날 체세포 변이체, 배선, 또는 구별가능하지 않은 것을 나타내고, VAFI, p, C, 및 M의 함수인 것;
ii) 종양 또는 샘플 중의 변이체, 예를 들어, 돌연변이의 접합성의 지표.
한 실시양태에서, 대상체로부터의 비-종양 조직을 분석할 필요 없이 분석을 수행할 수 있다. 한 실시양태에서, 분석은 대상체로부터의 비-종양 조직을 분석하지 않고 수행되며, 예를 들어, 동일한 대상체로부터의 비-종양 조직은 시퀀싱되지 않는다.
한 실시양태에서, SCI는, 예를 들어, 샘플로부터의 대상 구간에 대한 리드의 수, 및 대조군, 예를 들어, 프로세스 매칭된 대조군에 대한 리드의 수의 함수, 예를 들어, 비율의 로그인 값을 포함한다. 한 실시양태에서, SCI는 적어도 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 1,000, 2,000, 3,000, 4,000, 5,000, 6,000, 7,000, 8,000, 9,000, 또는 10,000개의 대상 구간, 예를 들어, 엑손에 대한 값, 예를 들어, log r 값을 포함한다. 한 실시양태에서, SCI는 적어도 100개 대상 구간, 예를 들어, 엑손에 대한 값, 예를 들어, log r 값을 포함한다. 한 실시양태에서, SCI는 1,000 내지 10,000, 2,000 내지 9,000, 3,000 내지 8,000, 3,000 내지 7,000, 3,000 내지 6,000, 또는 4,000 내지 5,000개 대상 구간, 예를 들어, 엑손에 대한 값, 예를 들어, log r 값을 포함한다. 한 실시양태에서, SCI는 적어도 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 1,000, 2,000, 3,000, 또는 4,000개 유전자로부터의 대상 구간, 예를 들어, 엑손에 대한 값, 예를 들어, log r 값을 포함한다.
한 실시양태에서, SCI에 포함된 적어도 하나, 복수 개 또는 실질적으로 모든 값은 GC 함량과의 상관관계에 대해 보정된다.
한 실시양태에서, 샘플로부터의 대상 구간, 예를 들어, 엑손은 적어도 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1,000개의 리드를 갖는다. 한 실시양태에서, 샘플로부터의 복수 개, 예를 들어, 적어도 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 1,000, 2,000, 3,000, 4,000, 5,000, 6,000, 7,000, 8,000, 9,000, 또는 10,000개의 대상 구간, 예를 들어, 엑손이 다수의 리드를 갖는다. 한 실시양태에서, 리드의 수는 적어도 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1,000개이다. 한 실시양태에서, 복수 개의 배선 SNP는 적어도 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 1,000, 2,000, 3,000, 4,000, 5000, 6000, 7000, 8000, 9000, 10,000, 또는 15,000개의 배선 SNP를 포함한다.
한 실시양태에서, 복수 개의 배선 SNP는 적어도 100개의 배선 SNP를 포함한다. 한 실시양태에서, 복수 개의 배선 SNP는 500 내지 5,000, 1,000 내지 4,000, 또는 2,000 내지 3,000개의 배선 SNP를 포함한다. 한 실시양태에서, 대립유전자 빈도는 소수 대립유전자 빈도이다. 한 실시양태에서, 대립유전자 빈도는 대체 대립유전자, 예를 들어, 인간 게놈 참조 데이터베이스 내의 표준 대립유전자 이외의 대립유전자이다.
한 실시양태에서, 상기 방법은 샘플 중의 복수 개의 변이체, 예를 들어, 돌연변이체의 특징을 규명하는 것을 포함한다. 한 실시양태에서, 상기 방법은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 또는 500개의 변이체, 예를 들어, 돌연변이체의 특징을 규명하는 것을 포함한다. 한 실시양태에서, 상기 방법은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 또는 500개의 상이한 유전자에서의 변이체, 예를 들어, 돌연변이체의 특징을 규명하는 것을 포함한다.
한 실시양태에서, 상기 방법은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 또는 500개의 변이체, 예를 들어, 돌연변이체에 대한 VAFI를 획득하는 것을 포함한다. 한 실시양태에서, 상기 방법은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 또는 500개의 변이체, 예를 들어, 돌연변이체에 대한 단계 a), b), 및 c) 중 하나, 둘 또는 모두를 수행하는 것을 포함한다. 한 실시양태에서, C, M 및 p의 값은 게놈 전반에서의 카피 수 모델을 SCI 및 SAFI 중 하나 또는 둘 다에 피팅한 것이거나, 피팅한 것을 갖거나, 또는 피팅함으로써 수득될 수 있다. 한 실시양태에서, C, M 및 p의 값은 SCI 및 SAFI의 복수 개의 게놈 전반에서의 카피 수 모델 입력에 적합하다. 한 실시양태에서, 게놈 세그먼트는 복수 개의 대상 구간, 예를 들어, 엑손, 예를 들어, SCI 값이 배정된 대상 구간을 포함한다.
한 실시양태에서, 게놈 세그먼트는 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 225, 250, 275, 300, 400, 또는 500개의 대상 구간, 예를 들어, 엑손을 포함한다. 한 실시양태에서, 게놈 세그먼트는 10 내지 1,000, 20 내지 900, 30 내지 700, 40 내지 600, 50 내지 500, 60 내지 400, 70 내지 300, 80 내지 200, 80 내지 150, 또는 80 내지 120, 90 내지 110, 또는 약 100개의 대상 구간, 예를 들어, 엑손을 포함한다. 한 실시양태에서, 게놈 세그먼트는 100 내지 10,000, 100 내지 5,000, 100 내지 4,000, 100 내지 3,000, 100 내지 2,000, 또는 100 내지 1,000개의 대상 구간, 예를 들어, 엑손을 포함한다. 한 실시양태에서, 게놈 세그먼트는 SAFI 값을 배정한 10 내지 1,000, 20 내지 900, 30 내지 700, 40 내지 600, 50 내지 500, 60 내지 400, 70 내지 300, 80 내지 200, 80 내지 150, 또는 80 내지 120, 90 내지 110, 또는 약 100개의 게놈 SNP를 포함한다. 한 실시양태에서, 게놈 세그먼트는 SAFI 값을 배정한 100 내지 10,000, 100 내지 5,000, 100 내지 4,000, 100 내지 3,000, 100 내지 2,000, 또는 100 내지 1,000개의 게놈 SNP를 포함한다.
한 실시양태에서, 복수 개의 게놈 세그먼트 각각은 하기 중 하나 또는 둘 다를 갖는 것을 특징으로 한다:
미리 선택된 양 이하만큼 상이한 정규화된 서열 커버리지의 측정 기준, 예를 들어, log r로, 예를 들어, 게놈 세그먼트의 경계 내에서 대상 구간, 예를 들어, 엑손에 대한 log2 r에 대한 값은 참조 값 이하만큼 상이하거나, 또는 실질적으로 일정한 것; 및
미리 선택된 양 이하만큼 상이한 배선 SNP에 대한 SNP 대립유전자 빈도로, 예를 들어, 게놈 세그먼트의 경계 내에서 대상 구간, 예를 들어, 엑손에 대한 배선 SNP 대립유전자 빈도에 대한 값은 참조 값 이하만큼 상이하거나, 또는 실질적으로 일정한 것.
한 실시양태에서, 게놈 세그먼트 내에 함유되거나 또는 조합되어 게놈 세그먼트를 형성하는 대상 구간, 예를 들어, 엑손의 수는 게놈 세그먼트 수의 적어도 2, 5, 10, 15, 20, 50 또는 100배이다. 한 실시양태에서, 대상 구간, 예를 들어, 엑손의 수는 게놈 세그먼트 수의 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15배이다.
한 실시양태에서, 게놈 세그먼트에 대한 경계가 제공된다. 한 실시양태에서, 상기 방법은 대상 구간, 예를 들어, 엑손에 대한 서열을 유전적 세그먼트로 어셈블리하는 것을 포함한다.
한 실시양태에서, 상기 방법은 본원에 기재된 방법, 예를 들어, 원형 이진 세그멘테이션 (CBS), HMM 기반 방법, 웨이블릿(Wavelet) 기반 방법, 또는 염색체를 따른 클러스터 방법을 포함하는 방법을 사용하여 대상 구간에 대한 서열을 어셈블리하는 것을 포함한다.
한 실시양태에서, 게놈 전반에서의 카피 수 모델을 SCI에 피팅하는 것은 하기 방정식을 사용하는 것을 포함한다:
Figure pct00003
여기서 ψ는 종양 배수성이다.
한 실시양태에서, ψ = (Σ i l i C i )/ Σ i l i , l i 는 게놈 세그먼트의 길이이다.
한 실시양태에서, 게놈 전반에서의 카피 수 모델을 SAFI에 피팅하는 것은 하기 방정식을 사용하는 것을 포함한다:
Figure pct00004
여기서 AF는 대립유전자 빈도이다.
한 실시양태에서, 피팅은 깁스(Gibbs) 샘플링을 사용하는 것을 포함한다. 한 실시양태에서, 피팅은, 예를 들어, 마르코프 체인 몬테 카를로 (MCMC) 알고리즘, 예를 들어, ASCAT (종양의 대립유전자-특이적 카피 수 분석), OncoSNP 또는 PICNIC (암에서 적분 카피 수를 예측하는 것)를 사용하는 것을 포함한다. 한 실시양태에서, 피팅은 메트로폴리스-해스팅스(Metropolis-Hastings) MCMC를 사용하는 것을 포함한다. 한 실시양태에서, 피팅은 비-베이지안 접근법, 예를 들어, 빈도주의자 접근법을 사용하는 것, 예를 들어 최소 제곱 피팅을 사용하는 것을 포함한다.
한 실시양태에서, g는 VAFI, p, C 및 M에 대한 값이 체세포/배선 상태에 대한 모델에 맞는지 결정함으로써 결정된다. 한 실시양태에서, 상기 방법은 상기 변이체, 예를 들어, 돌연변이에 대한 이형접합성의 표시를 획득하는 것을 포함한다. 한 실시양태에서, 샘플 순도 (p)는 포괄적인 순도이고, 예를 들어, 모든 게놈 세그먼트에 대해 동일하다.
한 실시양태에서, g의 값은 하기에 의해 획득된다:
Figure pct00005
여기서 AF는 대립유전자 빈도이다.
한 실시양태에서, 0에 가까운, 예를 들어, 0과 유의미하게 상이하지 않는 g의 값은, 변이체가 체세포 변이체라는 것을 나타낸다. 한 실시양태에서, 0이거나 또는 0에 가까운, 예를 들어, 0으로부터의 일정 거리 내에 있는 g의 값, 예를 들어, 0.4 미만의 g의 값은 변이체가 체세포 변이체라는 것을 나타낸다. 한 실시양태에서, 1에 가까운, 예를 들어, 1과 유의미하게 상이하지 않는 g의 값은, 변이체가 배선 변이체라는 것을 나타낸다. 한 실시양태에서, 1이거나 또는 1에 가까운, 예를 들어, 1로부터의 일정 거리 내에 있는 g의 값, 예를 들어, 0.6 초과의 g의 값은 변이체가 배선 변이체라는 것을 나타낸다. 한 실시양태에서, g의 값이 1보다 작지만 0보다 큰 경우, 예를 들어, 양이 1보다 적고 양이 0보다 크면, 예를 들어, g가 0.4 내지 0.6이면, 이는 구별할 수 없는 결과를 나타낸다.
한 실시양태에서, 0보다 상당히 작은 g의 값은 서브클로날 체세포 변이체를 나타낸다.
한 실시양태에서, g의 값은 하기에 의해 획득된다:
Figure pct00006
여기서 AF는 대립유전자 빈도이고, M' = C - M (예를 들어, M이 비-소수 대립유전자 빈도인 경우), 예를 들어, g가 1인 경우 변이체는 배선 다형성이고, g가 0인 경우 변이체는 체세포 돌연변이이다.
한 실시양태에서, 예를 들어, 샘플 순도가 약 40% 미만, 예를 들어, 약 10% 내지 30%, 예를 들어, 약 10% 내지 20%, 또는 약 20% 내지 30%일 때, 체세포/배선 상태가 결정된다.
한 실시양태에서, 0과 동일하고 C와 동일하지 않은 M의 값은 변이체, 예를 들어, 돌연변이의 부재, 예를 들어, 종양에 존재하지 않는다는 것을 나타내고; C와 동일한 M의 비-제로 값은, 예를 들어, 이형접합성 상실 (LOH)을 수반한, 변이체, 예를 들어, 돌연변이의 동형접합성을 나타내며; 0과 동일하고 C와 동일한 M의 값은 변이체, 예를 들어, 돌연변이의 동형접합성 결실, 예를 들어, 종양에 존재하지 않는 것을 나타내고; C와 동일하지 않은 M의 비-제로 값은 변이체, 예를 들어, 돌연변이의 이형접합성을 나타낸다.
한 실시양태에서, 상기 방법은 상기 변이체, 예를 들어 돌연변이에 대한 접합성의 표시를 획득하는 것을 포함한다. 한 실시양태에서, 돌연변이 상태는 M = C ≠ 0인 경우에 동형접합성 (예를 들어, LOH)으로서 결정된다. 한 실시양태에서, 돌연변이 상태는 M = C = 0인 경우에 동형접합성 결실로서 결정된다. 한 실시양태에서, 돌연변이 상태는 0 < M < C인 경우에 이형접합성으로서 결정된다. 한 실시양태에서, M = 0이고 C ≠ 0인 경우에 돌연변이는 종양으로부터 부재한다. 한 실시양태에서, 접합성은, 예를 들어, 샘플 순도가 약 80% 초과, 예를 들어 약 90% 내지 100%, 예를 들어, 약 90% 내지 95%, 또는 약 95% 내지 100%일 때 결정된다.
한 실시양태에서, 대조군은 샘플이 유래되는 대상체 이외의 대상체로부터의 정배수체 (예를 들어, 2배체) 조직의 샘플, 또는 샘플이 유래되는 대상체 이외의 1명 이상의 (예를 들어, 적어도 2, 3, 4, 또는 5명) 대상체로부터의 혼합된 정배수체 (예를 들어, 2배체) 조직의 샘플이다. 한 실시양태에서, 상기 방법은, 예를 들어, 차세대 시퀀싱 (NGS)에 의해, 선택된 대상 구간 각각 및 선택된 배선 SNP 각각을 시퀀싱하는 것을 포함한다. 한 실시양태에서, 정규화 이전의 서열 커버리지는 시퀀싱의 깊이의 적어도 약 10X, 20X, 30X, 50X, 100X, 250X, 500X, 750X, 800X, 900X, 1,000X, 1,500X, 2,000X, 2,500X, 3,000X, 3,500X, 4,000X, 4,500X, 5,000X, 5,500X, 6,000X, 6,500X, 7,000X, 7,500X, 8,000X, 8,500X, 9,000X, 9,500X, 또는 10,000X이다.
한 실시양태에서, 대상체는 항암 요법을 받은 적이 있다. 한 실시양태에서 대상체는 항암 요법을 받은 적이 있으며, 그러한 요법에 저항성이 있거나 질환 진행을 나타낸다. 한 실시양태에서 대상체는 FDA, EMA 또는 다른 규제 기관에 의해 승인된 치료제; 또는 FDA, EMA 또는 다른 규제 기관에 의해 승인되지 않은 치료제로부터 선택되는 항암 요법을 받은 적이 있다. 한 실시양태에서 대상체는 임상 시험 과정에서, 예를 들어, I 상, II 상, 또는 III 상 임상 시험 (또는 이러한 시험의 전 미국 등가 시험)에서 항암 요법을 받은 적이 있다. 한 실시양태에서, 변이체는 대상체에 존재하는 종양의 유형, 예를 들어, 치료의 발생 또는 치료에 대한 저항성과 긍정적으로 연관된다. 한 실시양태에서 변이체는 대상체에 존재하는 종양의 유형과 긍정적으로 연관되지 않는다. 한 실시양태에서 변이체는 대상체에 존재하는 종양의 유형 이외의 종양과 긍정적으로 연관된다. 한 실시양태에서 변이체는 대상체에 존재하는 종양의 유형과 긍정적으로 연관되지 않은 변이체이다.
한 실시양태에서, 상기 방법은, 예를 들어, 데이터베이스, 예를 들어, 기계 판독가능 데이터베이스에 기억시키고, 하기 중 하나 이상에 대한 설명자를 함유하는 보고서를 제공하거나 또는 이를 전송할 수 있다: 종양 내의 다른 돌연변이, 예를 들어, 샘플 내의 종양 유형과 연관된 다른 돌연변이, 샘플 내의 종양 유형과 연관되지 않은 다른 돌연변이, 또는 샘플 내의 종양 유형 이외의 종양과 연관된 다른 돌연변이의 존재, 부재 또는 빈도; 변이체의 특징규명; 대립유전자 또는 유전자; 또는 종양이 원발성이든 속발성이든지 간에, 종양 유형, 예를 들어 종양 유형의 명칭; 대상체 특징; 또는 치료 대안, 권장사항, 또는 선택 사항.
한 실시양태에서, 변이체의 특징규명과 관련된 설명자는 접합성 또는 배선 대 체세포 상태에 대한 설명자를 포함한다. 한 실시양태에서, 대상체 특징과 관련된 설명자는 하기 중 하나 이상에 대한 설명자를 포함한다: 대상체의 정제; 대상체의 연령, 성별, 체중 또는 다른 유사한 특징, 직업 중 하나 이상; 대상체의 병력, 예를 들어, 종양 또는 다른 장애의 발생; 대상체의 가족 병력, 예를 들어, 변이체를 공유하거나 공유하지 않는 친척; 또는 대상체의 이전 치료 이력, 예를 들어, 받은 치료, 이전에 투여된 항암 요법에 대한 반응, 예를 들어, 질환 저항성, 반응성 또는 진행.
SGZ 알고리즘은 또한, 문헌 [Sun et al. PLoS Comput Biol. 2018; 14(2):e1005965; Sun et al. Cancer Research 2014; 74(19S):1893-1893]; 국제 출원 공개 번호 WO2014/183078, 미국 특허 번호 9,792,403, 및 미국 출원 공개 번호 2014/0336996 (이들 내용은 그 전체 내용이 본원에 참조로 포함됨)에 기재되어 있다.
종양 돌연변이 부담
본원에 기재된 방법 및 조성물은 종양 돌연변이 부담 (TMB)을 평가하기 위해 사용될 수 있다.
용어 "돌연변이 부담", "돌연변이 부담", "돌연변이 부하" 및 "돌연변이 부하"는 본원에 상호교환가능하게 사용된다. 종양과 관련하여, 돌연변이 부하는 본원에서 "종양 돌연변이 부담", "종양 돌연변이 부담" 또는 "TMB"로서 지칭되기도 한다. 이론에 얽매이고자 한 것은 아니지만, 일부 실시양태에서, TMB는 특정 유형의 게놈 시그니처, 예를 들어 연속/복합 바이오마커로서 간주될 수 있다고 여겨진다.
본원에 사용된 바와 같은, 용어 "돌연변이 부담" 또는 "돌연변이 부담"은 유전자 세트 (예를 들어, 유전자 세트의 코딩 영역)에서 미리 정의된 단위당 (예를 들어, 메가염기당) 변경 (예를 들어, 하나 이상의 변경, 예를 들어, 하나 이상의 체세포 변경)의 수준, 예를 들어, 횟수를 지칭한다. 돌연변이 부담은, 예를 들어, 전체 게놈 또는 엑솜을 기준으로 하여, 또는 게놈 또는 엑솜의 서브세트를 기준으로 하여 측정될 수 있다. 특정 실시양태에서, 게놈 또는 엑솜의 서브세트를 기준으로 하여 측정된 돌연변이 부담은 전체 게놈 또는 엑솜 돌연변이 부담을 결정하기 위해 외삽될 수 있다.
한 실시양태에서, 상기 방법은 하기 단계를 포함한다:
a) 샘플로부터 대상 구간 (예를 들어, 코딩 대상 구간) 세트의 서열, 예를 들어, 뉴클레오티드 서열을 제공하며, 여기서 대상 구간 세트는 유전자 세트로부터 유래된 것인 단계; 및
b) 돌연변이 부담에 대한 값을 결정하며, 여기서 이러한 값은 대상 구간 세트에서, 변경 (예를 들어, 하나 이상의 변경), 예를 들어, 체세포 변경 (예를 들어, 하나 이상의 체세포 변경) 횟수의 함수인 단계.
특정 실시양태에서, 변경 횟수는 대상 구간에서의 기능적 변경을 제외한다. 다른 실시양태에서, 변경 횟수는 대상 구간에서의 배선 변경을 제외한다. 특정 실시양태에서, 변경 횟수는 대상 구간에서의 기능적 변경 및 대상 구간에서의 배선 변경을 제외한다.
특정 실시양태에서, 대상 구간 세트는 코딩 대상 구간을 포함한다. 다른 실시양태에서, 대상 구간 세트는 비-코딩 대상 구간을 포함한다. 특정 실시양태에서, 대상 구간 세트는 코딩 대상 구간을 포함한다. 다른 실시양태에서, 대상 구간 세트는 하나 이상의 코딩 대상 구간 및 하나 이상의 비-코딩 대상 구간을 포함한다. 특정 실시양태에서, 대상 구간 세트 내의 대상 구간의 약 5% 이상, 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 또는 약 95% 이상이 코딩 대상 구간이다. 다른 실시양태에서, 대상 구간 세트 내의 대상 구간의 약 90% 이하, 약 80% 이하, 약 70% 이하, 약 60% 이하, 약 50% 이하, 약 40% 이하, 약 30% 이하, 약 20% 이하, 약 10% 이하, 또는 약 5% 이하가 비-코딩 대상 구간이다.
다른 실시양태에서, 대상 구간 세트는 전체 게놈 또는 전체 엑솜을 포함하지 않는다. 다른 실시양태에서, 코딩 대상 구간 세트는 전체 엑솜을 포함하지 않는다.
특정 실시양태에서, 유전자 세트는 전체 게놈 또는 전체 엑솜을 포함하지 않는다. 다른 실시양태에서, 유전자 세트는 표 1A-5A에 제시된 하나 이상의 유전자를 포함하거나 또는 이로 이루어진다.
특정 실시양태에서, 상기 값은 유전자 세트의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 유전자 세트의 코딩 영역의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 유전자 세트의 비-코딩 영역의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 유전자 세트의 엑손의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 유전자 세트의 인트론의 함수로서 표현된다.
특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 코딩 영역의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 비-코딩 영역의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 엑손의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 인트론의 함수로서 표현된다.
특정 실시양태에서, 상기 값은 유전자 세트의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 유전자 세트의 코딩 영역의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 유전자 세트의 비-코딩 영역의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 유전자 세트의 엑손의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 유전자 세트의 인트론의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다.
특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 코딩 영역의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 비-코딩 영역의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 엑손의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 인트론의 다수의 위치에서의 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다.
특정 실시양태에서, 상기 값은 단위당 변경 (예를 들어, 체세포 변경) 횟수의 함수, 예를 들어, 메가염기당 체세포 변경 횟수의 함수로서 표현된다.
특정 실시양태에서, 상기 값은 유전자 세트에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 유전자 세트의 코딩 영역에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 유전자 세트의 비-코딩 영역에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 유전자 세트의 엑손에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 유전자 세트의 인트론에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다.
특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 코딩 영역에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 비-코딩 영역에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 특정 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 엑손에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다. 다른 실시양태에서, 상기 값은 시퀀싱된 유전자 세트의 인트론에서 메가염기당 변경 (예를 들어, 체세포 변경) 횟수의 함수로서 표현된다.
특정 실시양태에서, 돌연변이 부담은 게놈의 더 큰 부분, 예를 들어, 엑솜 또는 전체 게놈으로 외삽되어, 예를 들어, 총 돌연변이 부담을 수득한다. 다른 실시양태에서, 돌연변이 부담은 엑솜의 더 큰 부분, 예를 들어, 전체 엑솜으로 외삽된다.
특정 실시양태에서, 샘플은 대상체로부터의 것이다. 특정 실시양태에서, 대상체는 장애, 예를 들어, 암이 있다. 다른 실시양태에서, 대상체는 요법, 예를 들어, 면역 요법을 받고 있거나 또는 받은 적이 있다.
특정 실시양태에서, 돌연변이 부담은, 예를 들어, 참조 집단으로부터의 샘플에서의 돌연변이 부담 중에서 백분위 수로서 표현된다. 특정 실시양태에서, 참조 집단은 대상체와 동일한 유형의 암이 있는 환자를 포함한다. 다른 실시양태에서, 참조 집단은 대상체와 동일한 유형의 요법을 받고 있거나 또는 받은 적이 있는 환자를 포함한다.
특정 실시양태에서, 상기 방법은 하기 단계를 포함한다:
(i) 샘플로부터의 복수 개의 종양 핵산 분자를 포함하는 라이브러리를 획득하는 단계;
(ii) 라이브러리를 표적 포획 시약과 접촉시켜 선택된 종양 핵산 분자를 제공하며, 여기서 상기 표적 포획 시약은 종양 핵산 분자와 혼성화되며, 이에 의해 라이브러리 캐치를 제공하는 것인 단계;
(iii) 예를 들어, 차세대 시퀀싱 방법에 의해, 상기 라이브러리 캐치로부터 종양 핵산 분자로부터의 변경 (예를 들어, 체세포 변경)을 포함하는 대상 구간에 대한 리드를 획득하는 단계;
(iv) 정렬 방법에 의해 상기 리드를 정렬하는 단계;
(v) 뉴클레오티드 위치에 대해 상기 리드로부터의 뉴클레오티드 값을 배정하는 단계;
(vi) 배정된 뉴클레오티드 위치 세트로부터 대상 구간 (예를 들어, 코딩 대상 구간) 세트를 선택하며, 여기서 대상 구간 세트는 유전자 세트로부터 유래된 것인 단계; 및
(vii) 돌연변이 부담에 대한 값을 결정하며, 여기서 이러한 값은 대상 구간 세트에서 변경 (예를 들어, 하나 이상의 변경), 예를 들어, 체세포 변경 (예를 들어, 하나 이상의 체세포 변경) 횟수의 함수인 단계.
특정 실시양태에서, 변경 (예를 들어, 체세포 변경) 횟수는 대상 구간에서의 기능적 변경을 제외한다. 다른 실시양태에서, 변경 횟수는 대상 구간에서의 배선 변경을 제외한다. 특정 실시양태에서, 변경 (예를 들어, 체세포 변경) 횟수는 대상 구간에서의 기능적 변경 및 대상 구간에서의 배선 변경을 제외한다.
종양 돌연변이 부담을 평가하기 위한 다른 방법은 국제 출원 공개 번호 WO2017/151524 (그의 내용은 그 전체 내용이 참조로 포함됨)에 기재되어 있다.
유전자 선택
선택된 유전자 또는 유전자 산물 (본원에서 "표적 유전자 또는 유전자 산물"로서 지칭되기도 함)은 유전자 내 영역 또는 유전자 간 영역을 포함하는 대상 구간을 포함할 수 있다. 예를 들어, 대상 구간은 엑손 또는 인트론, 또는 그의 단편, 전형적으로 엑손 서열 또는 그의 단편을 포함할 수 있다. 대상 구간은 코딩 영역 또는 비-코딩 영역, 예를 들어, 프로모터, 인핸서, 5' 비번역 영역 (5' UTR), 또는 3' 비번역 영역 (3' UTR), 또는 그의 단편을 포함할 수 있다. 다른 실시양태에서, 대상 구간은 cDNA 또는 그의 단편을 포함한다. 다른 실시양태에서, 대상 구간은, 예를 들어, 본원에 기재된 바와 같은 SNP를 포함한다.
다른 실시양태에서, 대상 구간, 예를 들어, 본원에 기재된 바와 같은 대상 구간 중 하나 이상은 게놈 내의 실질적으로 모든 엑손 (예를 들어, 선택된 관심 유전자 또는 유전자 산물 (예를 들어, 본원에 기재된 바와 같은 암성 표현형과 연관된 유전자 또는 유전자 산물)로부터의 엑손)을 포함한다. 한 실시양태에서, 대상 구간은 체세포 돌연변이, 배선 돌연변이 또는 둘 다를 포함한다. 한 실시양태에서, 대상 구간은 변경, 예를 들어, 점 또는 단일 돌연변이, 결실 돌연변이 (예를 들어, 인-프레임 결실, 유전자 내 결실, 완전한 유전자 결실), 삽입 돌연변이 (예를 들어, 유전자 내 삽입), 역위 돌연변이 (예를 들어, 염색체 내 역위), 연결 돌연변이, 연결된 삽입 돌연변이, 역위 복제 돌연변이, 탠덤 복제 (예를 들어, 염색체 내 탠덤 복제), 전위 (예를 들어, 염색체 전위, 비-상호 전위), 재배열, 유전자 카피 수에 있어서의 변화, 또는 그의 조합을 포함한다. 특정 실시양태에서, 대상 구간은 샘플 중의 종양 세포의 게놈의 코딩 영역의 5%, 1%, 0.5%, 0.1%, 0.05%, 0.01%, 0.005%, 또는 0.001% 미만을 구성한다. 다른 실시양태에서, 대상 구간은 질환에 관여하지 않으며, 예를 들어, 본원에 기재된 바와 같은 암성 표현형과 연관되지 않는다.
한 실시양태에서, 표적 유전자 또는 유전자 산물은 바이오마커이다. 본원에 사용된 바와 같은, "바이오마커" 또는 "마커"는 변경될 수 있는 유전자, mRNA, 또는 단백질이며, 여기서 상기 변경은 암과 연관된다. 정상 또는 건강한 조직 또는 세포 (예를 들어, 대조군)에서의 양, 구조, 및/또는 활성과 비교 시, 암 조직 또는 암 세포에서의 양, 구조, 및/또는 활성에 있어서의 변경이 이루어질 수 있고, 이는 질환 상태, 예컨대 암과 연관된다. 예를 들어, 암과 연관되거나, 또는 항암 치료제에 대한 반응성을 예측하는 마커는 정상의 건강한 조직 또는 세포와 비교 시 암 조직 또는 암 세포에 있어서의 변경된 뉴클레오티드 서열, 아미노산 서열, 염색체 전위, 염색체 내 역위, 카피 수, 발현 수준, 단백질 수준, 단백질 활성, 후성적 변형 (예를 들어, 메틸화 또는 아세틸화 상태), 또는 번역 후 변형을 가질 수 있다. 더욱이, "마커"는 그의 구조가 변경되는, 예를 들어, 돌연변이되는 (돌연변이를 함유함), 예를 들어, 질환 상태, 예컨대 암과 연관된 조직 또는 세포에 존재할 때, 예를 들어, 치환, 결실, 또는 삽입에 의해 뉴클레오티드 또는 아미노산 수준에서 야생형 서열과 상이한 분자를 포함한다.
한 실시양태에서, 표적 유전자 또는 유전자 산물은 단일 뉴클레오티드 다형성 (SNP)을 포함한다. 또 다른 실시양태에서, 유전자 또는 유전자 산물은 작은 결실, 예를 들어, 작은 유전자 내 결실 (예를 들어, 인-프레임 또는 프레임-시프트 결실)을 갖는다. 또한 또 다른 실시양태에서, 표적 서열은 전체 유전자의 결실로부터 비롯된다. 또한 또 다른 실시양태에서, 표적 서열은 작은 삽입, 예를 들어, 작은 유전자 내 삽입을 갖는다. 한 실시양태에서, 표적 서열은 역위, 예를 들어, 염색체 내 역위로부터 비롯된다. 또 다른 실시양태에서, 표적 서열은 염색체 간 전위로부터 비롯된다. 또한 또 다른 실시양태에서, 표적 서열은 탠덤 복제를 갖는다. 한 실시양태에서, 표적 서열은 바람직하지 못한 특징 (예를 들어, 높은 GC 함량 또는 반복부 요소)을 갖는다. 또 다른 실시양태에서, 표적 서열은, 예를 들어, 그의 반복적 성질 때문에 그 자체가 성공적으로 표적화될 수 없는 뉴클레오티드 서열의 일부분을 갖는다. 한 실시양태에서, 표적 서열은 교대 스플라이싱으로부터 비롯된다. 또 다른 실시양태에서, 표적 서열은 표 1A-5A에 따른 유전자 또는 유전자 산물, 또는 그의 단편으로부터 선택된다.
한 실시양태에서, 표적 유전자 또는 유전자 산물, 또는 그의 단편은 항체 유전자 또는 유전자 산물, 이뮤노글로불린 슈퍼패밀리 수용체 (예를 들어, B-세포 수용체 (BCR) 또는 T-세포 수용체 (TCR)) 유전자 또는 유전자 산물, 또는 그의 단편이다.
인간 항체 분자 (및 B 세포 수용체)는 적어도 하기 3가지 로커스 상의 유전자에 의해 코딩되는 불변 (C) 영역과 가변 (V) 영역 둘 다를 갖는 중쇄 및 경쇄로 구성된다.
1. 이뮤노글로불린 중쇄에 대한 유전자 세그먼트를 함유하는, 염색체 14 상의 이뮤노글로불린 중쇄 로커스 (IGH@);
2. 이뮤노글로불린 경쇄에 대한 유전자 세그먼트를 함유하는, 염색체 2 상의 이뮤노글로불린 카파 (κ) 로커스 (IGK@);
3. 이뮤노글로불린 경쇄에 대한 유전자 세그먼트를 함유하는, 염색체 22 상의 이뮤노글로불린 람다 (λ) 로커스 (IGL@).
각각의 중쇄 및 경쇄 유전자는 항체 단백질의 가변 영역에 대한 3가지 상이한 유형의 유전자 세그먼트의 다수의 카피를 함유한다. 예를 들어, 이뮤노글로불린 중쇄 영역은 5개의 상이한 클래스 γ, δ, α, μ 및 ε, 44개의 가변 (V) 유전자 세그먼트, 27개의 다양성 (D) 유전자 세그먼트, 및 6개의 연결 (J) 유전자 세그먼트 중 하나를 함유할 수 있다. 경쇄는 또한 수많은 V 및 J 유전자 세그먼트를 보유할 수 있지만, D 유전자 세그먼트는 갖지 않는다. 람다 경쇄는 7개의 가능한 C 영역을 갖고 카파 경쇄는 1개를 갖는다.
이뮤노글로불린 중쇄 로커스 (IGH@)는 인간 항체 (또는 이뮤노글로불린)의 중쇄에 대한 유전자를 함유하는 인간 염색체 14 상의 영역이다. 예를 들어, IGH 로커스는 IGHV (가변), IGHD (다양성), IGHJ (연결), 및 IGHC (불변) 유전자를 포함한다. 이뮤노글로불린 중쇄를 코딩하는 예시적인 유전자는 IGHV1-2, IGHV1-3, IGHV1-8, IGHV1-12, IGHV1-14, IGHV1-17, IGHV1-18, IGHV1-24, IGHV1-45, IGHV1-46, IGHV1-58, IGHV1-67, IGHV1-68, IGHV1-69, IGHV1-38-4, IGHV1-69-2, IGHV2-5, IGHV2-10, IGHV2-26, IGHV2-70, IGHV3-6, IGHV3-7, IGHV3-9, IGHV3-11, IGHV3-13, IGHV3-15, IGHV3-16, IGHV3-19, IGHV3-20, IGHV3-21, IGHV3-22, IGHV3-23, IGHV3-25, IGHV3-29, IGHV3-30, IGHV3-30-2, IGHV3-30-3, IGHV3-30-5, IGHV3-32, IGHV3-33, IGHV3-33-2, IGHV3-35, IGHV3-36, IGHV3-37, IGHV3-38, IGHV3-41, IGHV3-42, IGHV3-43, IGHV3-47, IGHV3-48, IGHV3-49, IGHV3-50, IGHV3-52, IGHV3-53, IGHV3-54, IGHV3-57, IGHV3-60, IGHV3-62, IGHV3-63, IGHV3-64, IGHV3-65, IGHV3-66, IGHV3-71, IGHV3-72, IGHV3-73, IGHV3-74, IGHV3-75, IGHV3-76, IGHV3-79, IGHV3-38-3, IGHV3-69-1, IGHV4-4, IGHV4-28, IGHV4-30-1, IGHV4-30-2, IGHV4-30-4, IGHV4-31, IGHV4-34, IGHV4-39, IGHV4-55, IGHV4-59, IGHV4-61, IGHV4-80, IGHV4-38-2, IGHV5-51, IGHV5-78, IGHV5-10-1, IGHV6-1, IGHV7-4-1, IGHV7-27, IGHV7-34-1, IGHV7-40, IGHV7-56, IGHV7-81, IGHVII-1-1, IGHVII-15-1, IGHVII-20-1, IGHVII-22-1, IGHVII-26-2, IGHVII-28-1, IGHVII-30-1, IGHVII-31-1, IGHVII-33-1, IGHVII-40-1, IGHVII-43-1, IGHVII-44-2, IGHVII-46-1, IGHVII-49-1, IGHVII-51-2, IGHVII-53-1, IGHVII-60-1, IGHVII-62-1, IGHVII-65-1, IGHVII-67-1, IGHVII-74-1, IGHVII-78-1, IGHVIII-2-1, IGHVIII-5-1, IGHVIII-5-2, IGHVIII-11-1, IGHVIII-13-1, IGHVIII-16-1, IGHVIII-22-2, IGHVIII-25-1, IGHVIII-26-1, IGHVIII-38-1, IGHVIII-44, IGHVIII-47-1, IGHVIII-51-1, IGHVIII-67-2, IGHVIII-67-3, IGHVIII-67-4, IGHVIII-76-1, IGHVIII-82, IGHVIV-44-1, IGHD1-1, IGHD1-7, IGHD1-14, IGHD1-20, IGHD1-26, IGHD2-2, IGHD2-8, IGHD2-15, IGHD2-21, IGHD3-3, IGHD3-9, IGHD3-10, IGHD3-16, IGHD3-22, IGHD4-4, IGHD4-11, IGHD4-17, IGHD4-23, IGHD5-5, IGHD5-12, IGHD5-18, IGHD5-24, IGHD6-6, IGHD6-13, IGHD6-19, IGHD6-25, IGHD7-27, IGHJ1, IGHJ1P, IGHJ2, IGHJ2P, IGHJ3, IGHJ3P, IGHJ4, IGHJ5, IGHJ6, IGHA1, IGHA2, IGHG1, IGHG2, IGHG3, IGHG4, IGHGP, IGHD, IGHE, IGHEP1, IGHM, 및 IGHV1-69D를 포함하나, 이에 제한되지는 않는다.
이뮤노글로불린 카파 로커스 (IGK@)는 항체 (또는 이뮤노글로불린)의 카파 (κ) 경쇄에 대한 유전자를 함유하는 인간 염색체 2 상의 영역이다. 예를 들어, IGK 로커스는 IGKV (가변), IGKJ (연결), 및 IGKC (불변) 유전자를 포함한다. 이뮤노글로불린 카파 경쇄를 코딩하는 예시적인 유전자는 IGKV1-5, IGKV1-6, IGKV1-8, IGKV1-9, IGKV1-12, IGKV1-13, IGKV1-16, IGKV1-17, IGKV1-22, IGKV1-27, IGKV1-32, IGKV1-33, IGKV1-35, IGKV1-37, IGKV1-39, IGKV1D-8, IGKV1D-12, IGKV1D-13, IGKV1D-16 IGKV1D-17, IGKV1D-22, IGKV1D-27, IGKV1D-32, IGKV1D-33, IGKV1D-35, IGKV1D-37, IGKV1D-39, IGKV1D-42, IGKV1D-43, IGKV2-4, IGKV2-10, IGKV2-14, IGKV2-18, IGKV2-19, IGKV2-23, IGKV2-24, IGKV2-26, IGKV2-28, IGKV2-29, IGKV2-30, IGKV2-36, IGKV2-38, IGKV2-40, IGKV2D-10, IGKV2D-14, IGKV2D-18, IGKV2D-19, IGKV2D-23, IGKV2D-24, IGKV2D-26, IGKV2D-28, IGKV2D-29, IGKV2D-30, IGKV2D-36, IGKV2D-38, IGKV2D-40, IGKV3-7, IGKV3-11, IGKV3-15, IGKV3-20, IGKV3-25, IGKV3-31, IGKV3-34, IGKV3D-7, IGKV3D-11, IGKV3D-15, IGKV3D-20, IGKV3D-25, IGKV3D-31, IGKV3D-34, IGKV4-1, IGKV5-2, IGKV6-21, IGKV6D-21, IGKV6D-41, IGKV7-3, IGKJ1, IGKJ2, IGKJ3, IGKJ4, IGKJ5, 및 IGKC를 포함하나, 이에 제한되지는 않는다.
이뮤노글로불린 람다 로커스 (IGL@)는 항체 (또는 이뮤노글로불린)의 람다 경쇄에 대한 유전자를 함유하는 인간 염색체 22 상의 영역이다. 예를 들어, IGL 로커스는 IGLV (가변), IGLJ (연결), 및 IGLC (불변) 유전자를 포함한다. 이뮤노글로불린 람다 경쇄를 코딩하는 예시적인 유전자는 IGLV1-36, IGLV1-40, IGLV1-41, IGLV1-44, IGLV1-47, IGLV1-50, IGLV1-51, IGLV1-62, IGLV2-5, IGLV2-8, IGLV2-11, IGLV2-14, IGLV2-18, IGLV2-23, IGLV2-28, IGLV2-33, IGLV2-34, IGLV3-1, IGLV3-2, IGLV3-4, IGLV3-6, IGLV3-7, IGLV3-9, IGLV3-10, IGLV3-12, IGLV3-13, IGLV3-15, IGLV3-16, IGLV3-17, IGLV3-19, IGLV3-21, IGLV3-22, IGLV3-24, IGLV3-25, IGLV3-26, IGLV3-27, IGLV3-29, IGLV3-30, IGLV3-31, IGLV3-32, IGLV4-3, IGLV4-60, IGLV4-69, IGLV5-37, IGLV5-39, IGLV5-45, IGLV5-48, IGLV5-52, IGLV6-57, IGLV7-35, IGLV7-43, IGLV7-46, IGLV8-61, IGLV9-49, IGLV10-54, IGLV10-67, IGLV11-55, IGLVI-20, IGLVI-38, IGLVI-42, IGLVI-56, IGLVI-63, IGLVI-68, IGLVI-70, IGLVIV-53, IGLVIV-59, IGLVIV-64, IGLVIV-65, IGLVIV-66-1, IGLVV-58, IGLVV-66, IGLVVI-22-1, IGLVVI-25-1, IGLVVII-41-1, IGLJ1, IGLJ2, IGLJ3, IGLJ4, IGLJ5, IGLJ6, IGLJ7, IGLC1, IGLC2, IGLC3, IGLC4, IGLC5, IGLC6, 및 IGLC7을 포함하나, 이에 제한되지는 않는다.
B-세포 수용체 (BCR)는 두 부분으로 구성된다: i) 하나의 이소형 (예를 들어, IgD 또는 IgM)의 막 결합된 이뮤노글로불린 분자 (통합 막 도메인의 존재를 제외하고, 이들은 분비된 형태와 동일할 수 있음) 및 ii) 시그널 변환 모이어티: 디술피드 브릿지에 의해 함께 결합된, Ig-α/Ig-β (CD79)로 불리우는 이종이량체. 이량체의 각각의 핵산 분자는 혈장 막에 걸쳐 있으며, 면역 수용체 티로신-기반 활성화 모티프 (ITAM)를 보유하는 세포질 꼬리를 갖는다.
T-세포 수용체 (TCR)는 2개의 상이한 단백질 쇄 (즉, 이종이량체)로 구성된다. T 세포의 95%에서, 이것은 알파 (α) 및 베타 (β) 쇄로 이루어지는 반면, T 세포의 5%에서 이것은 감마 (γ) 및 델타 (δ) 쇄로 이루어진다. 이러한 비율은 개체 발생 동안 및 질환 상태에서 변할 수 있다. T 세포 수용체 유전자는 독특한 항원 수용체를 각각의 세포에 제공하기 위해 림프구의 발생 동안 재배열되는 베타 및 델타 쇄에 다수의 V, D 및 J 유전자 세그먼트 (및 알파 및 감마 쇄에 V 및 J 유전자 세그먼트)를 함유하고 있다는 점에서 이뮤노글로불린 유전자와 유사하다.
T-세포 수용체 알파 로커스 (TRA)는 TCR 알파 쇄에 대한 유전자를 함유하는 인간 염색체 14 상의 영역이다. 예를 들어, TRA 로커스는, 예를 들어, TRAV (가변), TRAJ (연결), 및 TRAC (불변) 유전자를 포함한다. T-세포 수용체 알파 쇄를 코딩하는 예시적인 유전자는 TRAV1-1, TRAV1-2, TRAV2, TRAV3, TRAV4, TRAV5, TRAV6, TRAV7, TRAV8-1, TRAV8-2, TRAV8-3, TRAV8-4, TRAV8-5, TRAV8-6, TRAV8-7, TRAV9-1, TRAV9-2, TRAV10, TRAV11, TRAV12-1, TRAV12-2, TRAV12-3, TRAV13-1, TRAV13-2, TRAV14DV4, TRAV15, TRAV16, TRAV17, TRAV18, TRAV19, TRAV20, TRAV21, TRAV22, TRAV23DV6, TRAV24, TRAV25, TRAV26-1, TRAV26-2, TRAV27, TRAV28, TRAV29DV5, TRAV30, TRAV31, TRAV32, TRAV33, TRAV34, TRAV35, TRAV36DV7, TRAV37, TRAV38-1, TRAV38-2DV8, TRAV39, TRAV40, TRAV41, TRAJ1, TRAJ2, TRAJ3, TRAJ4, TRAJ5, TRAJ6, TRAJ7, TRAJ8, TRAJ9, TRAJ10, TRAJ11, TRAJ12, TRAJ13, TRAJ14, TRAJ15, TRAJ16, TRAJ17, TRAJ18, TRAJ19, TRAJ20, TRAJ21, TRAJ22, TRAJ23, TRAJ24, TRAJ25, TRAJ26, TRAJ27, TRAJ28, TRAJ29, TRAJ30, TRAJ31, TRAJ32, TRAJ33, TRAJ34, TRAJ35, TRAJ36, TRAJ37, TRAJ38, TRAJ39, TRAJ40, TRAJ41, TRAJ42, TRAJ43, TRAJ44, TRAJ45, TRAJ46, TRAJ47, TRAJ48, TRAJ49, TRAJ50, TRAJ51, TRAJ52, TRAJ53, TRAJ54, TRAJ55, TRAJ56, TRAJ57, TRAJ58, TRAJ59, TRAJ60, TRAJ61, 및 TRAC를 포함하나, 이에 제한되지는 않는다.
T-세포 수용체 베타 로커스 (TRB)는 TCR 베타 쇄에 대한 유전자를 함유하는 인간 염색체 7 상의 영역이다. 예를 들어, TRB 로커스는, 예를 들어, TRBV (가변), TRBD (다양성), TRBJ (연결), 및 TRBC (불변) 유전자를 포함한다. T-세포 수용체 베타 쇄를 코딩하는 예시적인 유전자는 TRBV1, TRBV2, TRBV3-1, TRBV3-2, TRBV4-1, TRBV4-2, TRBV4-3, TRBV5-1, TRBV5-2, TRBV5-3, TRBV5-4, TRBV5-5, TRBV5-6, TRBV5-7, TRBV6-2, TRBV6-3, TRBV6-4, TRBV6-5, TRBV6-6, TRBV6-7, TRBV6-8, TRBV6-9, TRBV7-1, TRBV7-2, TRBV7-3, TRBV7-4, TRBV7-5, TRBV7-6, TRBV7-7, TRBV7-8, TRBV7-9, TRBV8-1, TRBV8-2, TRBV9, TRBV10-1, TRBV10-2, TRBV10-3, TRBV11-1, TRBV11-2, TRBV11-3, TRBV12-1, TRBV12-2, TRBV12-3, TRBV12-4, TRBV12-5, TRBV13, TRBV14, TRBV15, TRBV16, TRBV17, TRBV18, TRBV19, TRBV20-1, TRBV21-1, TRBV22-1, TRBV23-1, TRBV24-1, TRBV25-1, TRBV26, TRBV27, TRBV28, TRBV29-1, TRBV30, TRBVA, TRBVB, TRBV5-8, TRBV6-1, TRBD1, TRBD2, TRBJ1-1, TRBJ1-2, TRBJ1-3, TRBJ1-4, TRBJ1-5, TRBJ1-6, TRBJ2-1, TRBJ2-2, TRBJ2-2P, TRBJ2-3, TRBJ2-4, TRBJ2-5, TRBJ2-6, TRBJ2-7, TRBC1, 및 TRBC2를 포함하나, 이에 제한되지는 않는다.
T-세포 수용체 델타 로커스 (TRD)는 TCR 델타 쇄에 대한 유전자를 함유하는 인간 염색체 14 상의 영역이다. 예를 들어, TRD 로커스는, 예를 들어, TRDV (가변), TRDJ (연결), 및 TRDC (불변) 유전자를 포함한다. T-세포 수용체 델타 쇄를 코딩하는 예시적인 유전자는 TRDV1, TRDV2, TRDV3, TRDD1, TRDD2, TRDD3, TRDJ1, TRDJ2, TRDJ3, TRDJ4, 및 TRDC를 포함하나, 이에 제한되지는 않는다.
T-세포 수용체 감마 로커스 (TRG)는 TCR 감마 쇄에 대한 유전자를 함유하는 인간 염색체 7 상의 영역이다. 예를 들어, TRG 로커스는, 예를 들어, TRGV (가변), TRGJ (연결), 및 TRGC (불변) 유전자를 포함한다. T-세포 수용체 감마 쇄를 코딩하는 예시적인 유전자는 TRGV1, TRGV2, TRGV3, TRGV4, TRGV5, TRGV5P, TRGV6, TRGV7, TRGV8, TRGV9, TRGV10, TRGV11, TRGVA, TRGVB, TRGJ1, TRGJ2, TRGJP, TRGJP1, TRGJP2, TRGC1, 및 TRGC2를 포함하나, 이에 제한되지는 않는다.
한 실시양태에서, 표적 유전자 또는 유전자 산물, 또는 그의 단편은 표 1A-5A에 기재된 유전자 또는 유전자 산물 중 임의의 것으로부터 선택된다.
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
부가의 예시적인 유전자는, 예를 들어, 국제 출원 공개 번호 WO2012/092426 (그의 전체 내용이 참조로 포함됨)의 표 1-11에 기재되어 있다.
전술한 방법의 적용은 의료 표본에서 시퀀싱하기 위해 특별한 유전자(들)의 모든 공지된 서열 변이체 (또는 그의 서브세트)를 함유하는 올리고뉴클레오티드의 라이브러리를 사용하는 것을 포함하나, 이에 제한되지는 않는다.
다른 실시양태
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은 (a)-(h) 중 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7개, 또는 모두)을 추가로 포함한다:
(a) 예를 들어, 본원에 기재된 복수 개의 표적 포획 시약을 사용하여, 샘플 (예를 들어, 혈액 샘플)로부터 핵산 분자 (예를 들어, cfDNA)를 제공하는 단계;
(b) 복수 개의 상이한 바코드 서열을 포함하는 바코드를 포함하는 어댑터를 핵산 분자에 부착시키며, 이에 의해 태그부착된 모 핵산 분자를 생성하는 단계;
(c) 이러한 태그부착된 모 핵산 분자를 증폭시켜 증폭된 태그부착된 자손 핵산 분자를 생산하는 단계;
(d) 증폭된 태그부착된 자손 핵산 분자를 시퀀싱하여, 태그부착된 모 핵산 분자 각각으로부터 복수 개의 서열 리드를 생산하며, 여기서 복수 개의 서열 리드의 각각의 서열 리드가 바코드 서열 및 핵산 분자로부터 유래된 서열을 포함하는 것인 단계;
(e) 복수 개의 서열 리드의 서열 리드를 하나 이상의 참조 서열에 맵핑하는 단계;
(f) e)에서 맵핑된 서열 리드를, 적어도 이러한 서열 리드의 바코드 서열을 기반으로 하여 패밀리로 분류하며, 각각의 패밀리는 동일한 바코드 서열을 포함하는 서열 리드를 포함하며, 이로써 각각의 패밀리는 동일한 태그부착된 모 핵산 분자로부터 증폭된 서열 리드를 포함하는 것인 단계;
(g) 하나 이상의 참조 서열 내의 복수 개의 대상 구간 각각에서, 각각의 패밀리에서의 서열 리드를 붕괴시켜 대상 구간에서 각각의 패밀리에 대한 돌연변이 호출을 산출하는 단계; 또는
(h) 하나 이상의 대상 구간에서, 하나 이상의 게놈 이상, 예를 들어, indel, 카피 수 변이, 염기전환, 전위, 역위, 결실, 이수성, 부분 이수성, 배수성, 염색체 불안정성, 염색체 구조 변경, 유전자 융합, 염색체 융합, 유전자 말단절단, 유전자 증폭, 유전자 복제, 염색체 병변, DNA 병변, 핵산 화학적 변형에 있어서의 비정상적인 변화, 후성적 패턴에 있어서의 비정상적인 변화, 핵산 메틸화에 있어서의 비정상적인 변화, 또는 그의 조합을 검출하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은, 예를 들어, 게놈 변경 (예를 들어, 단일 뉴클레오티드 변이체)을 정량화하기 위해, (a)-(i) 중 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8개, 또는 모두)을 추가로 포함한다:
(a) 예를 들어, 본원에 기재된 복수 개의 표적 포획 시약을 사용하여, 샘플 (예를 들어, 혈액 샘플)로부터 핵산 분자 (예를 들어, cfDNA)를 제공하는 단계;
(b) 별개의 바코드 서열을 포함하는 바코드를 포함하는 어댑터를 상기 핵산 분자에 부착시켜, 태그부착된 모 핵산 분자를 생성하는 단계;
(c) 이러한 태그부착된 모 핵산 분자를 증폭시켜 증폭된 태그부착된 자손 핵산 분자를 생산하는 단계;
(d) 증폭된 태그부착된 자손 핵산 분자를 시퀀싱하여, 각각의 모 핵산 분자로부터 복수 개의 서열 리드를 생산하며, 여기서 각각의 서열 리드가 바코드 서열 및 핵산 분자로부터 유래된 서열을 포함하는 것인 단계;
(e) 각각의 태그부착된 모 핵산 분자로부터 생산된 복수 개의 서열 리드를, (i) 바코드 서열 및 (ii) 핵산으로부터 유래된 서열의 시작 부분에 있는 서열 정보, 핵산으로부터 유래된 서열의 단부에 있는 서열 정보, 또는 서열 리드의 길이 중 하나 이상을 기반으로 하여 패밀리로 분류하며, 여기서 각각의 패밀리는 태그부착된 모 핵산 분자 중에서 독특한 핵산 분자로부터 증폭된 태그부착된 자손 핵산 분자의 서열 리드를 포함하는 것인 단계;
(f) 각각의 패밀리 내에서 분류된 서열 리드를 서로 비교하여, 각각의 패밀리에 대한 컨센서스 서열을 결정하며, 여기서 각각의 컨센서스 서열이, 태그부착된 모 핵산 분자 중에서 독특한 핵산 분자에 상응하는 것인 단계;
(g) 하나 이상의 대상 구간을 포함하는 하나 이상의 참조 서열을 제공하는 단계;
(h) 상기 하나 이상의 대상 구간 중 주어진 대상 구간에 맵핑되는 컨센서스 서열을 확인하는 단계; 또는
(i) 게놈 변경을 포함하는 주어진 대상 구간에 맵핑되는 컨센서스 서열의 수를 계산하며, 이에 의해 샘플에서의 게놈 변경을 정량화하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은 (a)-(h) 중 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7개, 또는 모두)을 추가로 포함한다:
(a) 예를 들어, 본원에 기재된 복수 개의 표적 포획 시약을 사용하여, 샘플 (예를 들어, 혈액 샘플)로부터 핵산 분자 (예를 들어, cfDNA)를 제공하는 단계;
(b) 복수 개의 핵산 분자를 복수 개의 태그부착된 모 핵산 분자로 전환시키며, 여기서 태그부착된 모 핵산 분자 각각은 (i) 복수 개의 핵산 분자의 핵산 분자로부터의 서열, 및 (ii) 하나 이상의 바코드를 포함하는 식별자 서열을 포함하는 것인 단계;
(c) 복수 개의 태그부착된 모 핵산 분자를 증폭시켜 상응하는 복수 개의 증폭된 자손 핵산 분자를 생산하는 단계;
(d) 복수 개의 증폭된 자손 핵산 분자를 시퀀싱하여 서열 리드의 세트를 생산하는 단계;
(e) 상기 서열 리드의 세트 중 서열 리드를 하나 이상의 참조 서열에 맵핑하는 단계;
(f) 서열 리드를 패밀리로 분류하며, 각각의 패밀리는 동일한 식별자 서열을 포함하고 동일한 시작 및 정지 위치를 갖는 서열 리드를 포함하며, 여기서 각각의 패밀리는 동일한 태그부착된 모 핵산 분자로부터 증폭된 서열 리드를 포함하는 것인 단계;
(g) 하나 이상의 참조 서열에서의 복수 개의 대상 구간 중 각각의 대상 구간에서, 각각의 패밀리에서의 서열 리드를 붕괴시켜 대상 구간에서 각각의 패밀리에 대한 돌연변이 호출을 산출하는 단계; 또는
(h) 상기 패밀리로부터의 대상 구간에서 호출된 하나 이상의 돌연변이의 빈도를 결정하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은, 예를 들어, 카피 수 변이를 검출하기 위해, (a)-(f) 중 하나 이상 (예를 들어, 2, 3, 4, 5개, 또는 모두)을 추가로 포함한다:
(a) 예를 들어, 본원에 기재된 복수 개의 표적 포획 시약을 사용하여, 샘플 (예를 들어, 혈액 샘플)로부터 핵산 분자 (예를 들어, cfDNA)를 제공하는 단계;
(b) 핵산 분자를 시퀀싱하며, 여기서 핵산 분자 각각이 복수 개의 서열 리드를 생성하는 것인 단계;
(c) 설정된 정확도, 품질 점수 또는 맵핑 점수 임계 값을 충족하지 못하는 리드를 필터링하는 단계;
(d) 복수 개의 서열 리드를 참조 서열에 맵핑하는 단계;
(e) 참조 서열의 복수 개의 영역에서의 맵핑된 리드 또는 독특한 서열 리드를 정량화하는 단계; 및
(f) i) 복수 개의 영역에서의 리드의 수를 서로 정규화하거나, 또는 복수 개의 영역에서의 독특한 서열 리드의 수를 서로 정규화하고/하거나; ii) 복수 개의 영역에서의 리드의 수, 또는 복수 개의 영역에서의 독특한 서열 리드의 수를, 대조군 샘플로부터 수득된 수로 프로세싱함으로써, 복수 개의 미리 정의된 영역 중 하나 이상에서의 카피 수 변이를 결정하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은, 예를 들어, 카피 수 변이를 검출하기 위해, (a)-(h) 중 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7개, 또는 모두)을 추가로 포함한다:
(a) 예를 들어, 본원에 기재된 복수 개의 표적 포획 시약을 사용하여, 샘플 (예를 들어, 혈액 샘플)로부터 핵산 분자 (예를 들어, cfDNA)를 제공하는 단계;
(b) 핵산 분자를 시퀀싱하며, 여기서 핵산 분자 각각이 복수 개의 서열 리드를 생성하는 것인 단계;
(c) 설정된 정확도, 품질 점수 또는 맵핑 점수 임계 값을 충족하지 못하는 리드를 필터링하는 단계;
(d) 상기 시퀀싱으로부터 유래된 서열 리드를 참조 서열에 맵핑하는 단계;
(e) 서열 리드로부터 핵산 분자에 상응하는 독특한 서열 리드를 결정하는 단계;
(f) 각각의 맵핑가능한 염기 위치에서 참조 서열과 비교 시 변이체를 포함하는 맵핑된 독특한 서열 리드의 서브세트를 확인하는 단계;
(g) 각각의 맵핑가능한 염기 위치에 대해, (a) 참조 서열과 비교 시 변이체를 포함하는 맵핑된 독특한 서열 리드의 수 대 (b) 각각의 맵핑가능한 염기 위치에 대한 총 독특한 서열 리드의 수의 비율을 계산하는 단계; 및
(h) 상기 비율을, 참조 샘플로부터 유사하게 유래된 수로 프로세싱하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은 (a)-(h) 중 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7개, 또는 모두)을 추가로 포함한다:
(a) 이중 나선 태그 세트를 사용하여 대상체로부터의 샘플 (예를 들어, 혈액 샘플) 중의 이중 가닥 DNA 분자 (예를 들어 cfDNA)에 태그부착하며, 여기서 이중 나선 태그 세트는 복수 개의 상이한 분자 바코드를 포함하며, 여기서 이중 나선 태그 세트의 각각의 이중 나선 태그는 샘플 중의 이중 가닥 DNA 분자의 이중 가닥 DNA 분자의 상보적 가닥에 차등적으로 태그부착하여 태그부착된 가닥을 제공하고, 여기서 태그부착하는 것이 이중 가닥 DNA 분자와 비교 시 적어도 10X 과잉의 이중 나선 태그로 수행되며, 과잉의 이중 나선 태그는 대상체로부터의 샘플 중의 이중 가닥 DNA 분자의 적어도 20%에 태그를 부착시키기에 충분한 것인 단계;
(b) 참조 게놈에서의 하나 이상의 유전자 로커스 세트 내의 각각의 유전적 로커스에 대해, 예를 들어, 본원에 기재된 복수 개의 표적 포획 시약을 사용하여, 유전적 로커스에 맵핑되는 태그부착된 가닥의 서브세트에 대해 태그부착된 가닥을 선택적으로 강화시켜, 강화된 태그부착된 가닥을 제공하는 단계;
(c) 상기 강화된 태그부착된 가닥의 적어도 일부분을 시퀀싱하여, 대상체로부터의 샘플로부터 복수 개의 원시 서열 리드를 생성하는 단계;
(d) 복수 개의 원시 서열 리드를 복수 개의 패밀리로 분류하며, 각각의 패밀리는 동일한 모 폴리뉴클레오티드로부터 생성된 원시 서열 리드를 포함하며, 분류는 (i) 모 폴리뉴클레오티드와 연관된 분자 바코드 및 (ii) 모 폴리뉴클레오티드의 원시 서열의 시작 및/또는 끝 부분으로부터의 정보에 기반하는 것인 단계;
(e) 복수 개의 패밀리로 분류된 복수 개의 원시 서열 리드를 복수 개의 컨센서스 서열 리드로 붕괴시키며, 복수 개의 컨센서스 서열 리드의 각각의 컨센서스 서열 리드는 (i) 하나 이상의 유전적 로커스 세트에서 각각의 유전적 로커스에 대한 복수 개의 컨센서스 염기를 포함하고, (ii) 이중 가닥 DNA 분자의 단일 가닥을 대표하는 것인 단계;
(f) 하나 이상의 유전적 로커스 세트 내의 각각의 유전적 로커스에 대해, 복수 개의 컨센서스 서열 리드에서 상보적 가닥이 검출되는 유전적 로커스에 맵핑되는 강화된 태그부착된 가닥의 제1 정량적 측정 기준을 계산하는 단계;
(g) 하나 이상의 유전적 로커스 세트 내의 각각의 유전적 로커스에 대해, 복수 개의 컨센서스 서열 리드에서 상보적 가닥 중 단 하나의 가닥이 검출되는 유전적 로커스에 맵핑되는 강화된 태그부착된 가닥의 제2 정량적 측정 기준을 계산하는 단계; 또는
(h) 하나 이상의 유전적 로커스 세트 내의 각각의 유전적 로커스에 대해, 복수 개의 컨센서스 서열 리드에서 상보적 가닥이 검출되지 않는 유전적 로커스에 맵핑되는 강화된 태그부착된 가닥의 제3 정량적 측정 기준을 계산하며, 여기서 제3 정량적 측정 기준은 제1 및 제2 정량적 측정 기준에 적어도 부분적으로 기반하여 계산되며, 이에 의해 대상체로부터의 샘플 중의 이중 가닥 DNA 분자를 검출하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은, 예를 들어, 다수의 게놈 영역을 강화시키기 위하여, (a)-(b) 중 하나 또는 둘 다를 추가로 포함한다:
(a) 샘플로부터의 미리 결정된 양의 핵산을, 하기를 포함하는 본원에 기재된 복수 개의 표적 포획 시약과 접촉시키는 단계:
(i) 샘플로부터의 핵산의 게놈 영역의 제1 세트와 선택적으로 혼성화되는 제1 복수 개의 표적 포획 시약으로서, 이러한 제1 복수 개의 표적 포획 시약은 제1 복수 개의 표적 포획 시약의 포화점보다 낮은 제1 농도에서 제공되는 것인 시약, 및
(ii) 샘플로부터의 핵산의 게놈 영역의 제2 세트와 선택적으로 혼성화되는 제2 복수 개의 표적 포획 시약으로서, 이러한 제2 복수 개의 표적 포획 시약은 제2 복수 개의 표적 포획 시약의 포화점 이상인 제2 농도에서 제공되는 것인 시약; 및
(b) 게놈 영역의 제1 세트 및 게놈 영역의 제2 세트에 대해 상기 샘플로부터의 핵산을 강화시키며, 이에 의해 강화된 핵산을 생산하는 단계.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은 (a)-(e) 중 하나 이상 (예를 들어, 2, 3, 4개, 또는 모두)을 추가로 포함한다:
(a) 복수 개의 표적 포획 시약 혼합물을 제공하며, 여기서 복수 개의 표적 포획 시약 혼합물 각각은 게놈 영역의 제1 세트와 선택적으로 혼성화되는 제1 복수 개의 표적 포획 시약 및 게놈 영역의 제2 세트와 선택적으로 혼성화되는 제2 복수 개의 표적 포획 시약을 포함하고,
여기서 제1 복수 개의 표적 포획 시약은 복수 개의 표적 포획 시약 혼합물 전체에 걸쳐 상이한 농도 하에 있고, 제2 복수 개의 표적 포획 시약은 복수 개의 표적 포획 시약 혼합물 전체에 걸쳐 동일한 농도 하에 있는 것인 단계;
(b) 복수 개의 표적 포획 시약 혼합물 각각을 샘플 (예를 들어, 혈액 샘플)과 접촉시켜 샘플로부터의 핵산을 제1 복수 개의 표적 포획 시약 및 제2 복수 개의 표적 포획 시약으로 포획하며, 여기서 각각의 표적 포획 시약 혼합물 중의 제2 복수 개의 표적 포획 시약이, 제2 복수 개의 표적 포획 시약의 포화점 이상인 제1 농도 하에 제공되고, 샘플로부터의 핵산이 제1 복수 개의 표적 포획 시약 및 제2 복수 개의 표적 포획 시약에 의해 포획되는 것인 단계;
(c) 각각의 표적 포획 시약 혼합물로 포획된 핵산의 일부분을 시퀀싱하여, 할당된 수의 서열 리드 내에서 서열 리드 세트를 생산하는 단계;
(d) 각각의 표적 포획 시약 혼합물에 대한 제1 복수 개의 표적 포획 시약 및 제2 복수 개의 표적 포획 시약에 대한 서열 리드의 리드 깊이를 결정하는 단계; 또는
(e) 게놈 영역의 제2 세트에 대한 리드 깊이를 제공하는 적어도 하나의 표적 포획 시약 혼합물을 확인하며,
여기서 게놈 영역의 제2 세트에 대한 리드 깊이가, 적어도 0.0001% 소수 대립유전자 빈도 (MAF)의 유전적 변이체의 검출 감도를 제공하는 것.
대안적으로, 또는 본원에 기재된 방법과 조합하여, 일부 실시양태에서, 상기 방법은 (a)-(c) 중 하나 이상 (예를 들어, 2개, 또는 모두)을 추가로 포함한다:
(a) 대상체로부터의 신체 샘플로부터 수득된 세포외 폴리뉴클레오티드 집단에 비-독특하게 태그부착하여, 비-독특하게 태그부착된 세포외 폴리뉴클레오티드 집단을 생산하는 단계;
(b) 비-독특하게 태그부착된 세포외 폴리뉴클레오티드 집단을 시퀀싱하여, 비-독특하게 태그부착된 세포외 폴리뉴클레오티드 내의 맵핑가능한 위치에서 염기 호출을 초래하는 단계; 및
(c) 맵핑가능한 위치에서의 염기 호출에 대해, 염기 호출을 갖는 독특한 분자의 총 수와 관련하여 염기 호출을 함유하는 독특한 분자의 빈도를 측정하며,
여기서 복수 개의 참조 서열로부터의 설정된 편차 측정 기준을 초과하는 맵핑가능한 위치에서 염기 호출을 함유하는 독특한 분자의 빈도가, 맵핑가능한 위치에서의 희귀한 돌연변이를 나타내는 것.
다른 실시양태는 미국 특허 번호 US 9,598,731, US 9,834,822, US 9,840,743, US 9,902,992, US 9,920,366, US 9,850,523, 및 US 10,041,127 (이들 각각의 내용은 그 전체 내용이 본원에 참조로 포함됨)에 기재되어 있다.
본원에 기재된 방법의 실시양태에서, 이러한 방법에서의 단계 또는 파라미터는 상기 방법에서의 하류 단계 또는 파라미터를 변형시키기 위해 사용된다.
한 실시양태에서, 샘플의 특징은 하기 중 하나 이상 또는 모두에서 하류 단계 또는 파라미터를 변형시키기 위해 사용된다: 상기 샘플로부터 핵산의 단리; 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 혼성화 조건; 시퀀싱; 리드 맵핑; 돌연변이 호출 방법의 선택; 돌연변이 호출; 또는 돌연변이 주석달기.
한 실시양태에서, 단리된 종양, 또는 대조군 핵산의 특징은 하기 중 하나 이상 또는 모두에서 하류 단계 또는 파라미터를 변형시키기 위해 사용된다: 상기 샘플로부터 핵산의 단리; 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 혼성화 조건; 시퀀싱; 리드 맵핑; 돌연변이 호출 방법의 선택; 돌연변이 호출; 또는 돌연변이 주석달기.
한 실시양태에서, 라이브러리의 특징은 하기 중 하나 이상 또는 모두에서 하류 단계 또는 파라미터를 변형시키기 위해 사용된다: 상기 샘플로부터 핵산의 재단리; 후속 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 혼성화 조건; 시퀀싱; 리드 맵핑; 돌연변이 호출 방법의 선택; 돌연변이 호출; 또는 돌연변이 주석달기.
한 실시양태에서, 라이브러리 캐치의 특징은 하기 중 하나 이상 또는 모두에서 하류 단계 또는 파라미터를 변형시키기 위해 사용된다: 상기 샘플로부터 핵산의 재단리; 후속 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 혼성화 조건; 시퀀싱; 리드 맵핑; 돌연변이 호출 방법의 선택; 돌연변이 호출; 또는 돌연변이 주석달기.
한 실시양태에서, 시퀀싱 방법의 특징은 하기 중 하나 이상 또는 모두에서 하류 단계 또는 파라미터를 변형시키기 위해 사용된다: 상기 샘플로부터 핵산의 재단리; 후속 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 혼성화 조건 후속 시퀀싱의 후속 결정; 리드 맵핑; 돌연변이 호출 방법의 선택; 돌연변이 호출; 또는 돌연변이 주석달기.
한 실시양태에서, 맵핑된 리드의 수집물의 특징은 하기 중 하나 이상 또는 모두에서 하류 단계 또는 파라미터를 변형시키기 위해 사용된다: 상기 샘플로부터 핵산의 재단리; 후속 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 혼성화 조건 후속 시퀀싱의 후속 결정; 후속 리드 맵핑; 돌연변이 호출 방법의 선택; 돌연변이 호출; 또는 돌연변이 주석달기.
한 실시양태에서, 상기 방법은 샘플 특징에 대한 값을 획득하는 것, 예를 들어, 상기 샘플 중에서의 종양 세포의 분율에 대한 값; 상기 샘플의 세포성에 대한 값; 또는 샘플의 영상으로부터의 값을 획득하는 것을 포함한다. 실시양태에서, 상기 방법은 샘플 특징에 대한 상기 획득된 값에 대응하여, 샘플로부터 핵산의 단리, 라이브러리 구축; 표적 포획 시약 (예를 들어, 미끼)의 설계 또는 선택; 표적 포획 시약 (예를 들어, 미끼)/라이브러리 핵산 분자 혼성화; 시퀀싱; 또는 돌연변이 호출에 대한 파라미터를 선택하는 것을 포함한다.
한 실시양태에서, 상기 방법은 상기 샘플에 존재하는 종양 조직의 양에 대한 값을 획득하는 것, 상기 획득된 값을 참조 기준과 비교하는 것, 및 상기 참조 기준이 충족되는 경우에는 상기 샘플을 허용하는 것, 예를 들어, 상기 샘플이 30%, 40% 또는 50% 초과의 종양 세포를 함유하는 경우에는 상기 샘플을 허용하는 것을 추가로 포함한다. 한 실시양태에서, 방법은, 예를 들어, 상기 샘플로부터 종양 조직을 미세해부함으로써, 참조 기준을 충족하지 못한 샘플로부터, 종양 세포에 대해 강화된 서브 샘플을 획득하는 것을 추가로 포함한다.
한 실시양태에서, 상기 방법은 상기 샘플에 존재하는 종양 핵산 (예를 들어, DNA)의 양에 대한 값을 획득하는 것, 상기 획득된 값을 참조 기준과 비교하는 것, 및 상기 참조 기준이 충족되는 경우에는 상기 샘플을 허용하는 것을 추가로 포함한다. 한 실시양태에서, 상기 방법은, 예를 들어, 상기 샘플로부터 종양 조직을 미세해부함으로써, 참조 기준을 충족하지 못한 샘플로부터, 종양 핵산에 대해 강화된 서브 샘플을 획득하는 것을 추가로 포함한다.
한 실시양태에서, 방법은 특정 대상체에 대한 종양 유형, 유전자, 및 유전적 변경 (TGA)의 연관성을 제공하는 것을 추가로 포함한다. 한 실시양태에서, 방법은 복수 개의 요소를 갖는 데이터베이스를 제공하는 것을 추가로 포함하며, 여기서 각각의 요소는 TGA를 포함한다.
한 실시양태에서, 방법은 대상체의 TGA가 데이터베이스, 예를 들어, 검증된 TGA의 데이터베이스에 존재하는 지를 결정하는 것; 상기 데이터베이스로부터의 TGA에 대한 정보를, 상기 대상체로부터의 상기 TGA와 연관짓는 것 (주석을 다는 것); 및 임의로, 상기 대상체에 대한 제2 또는 후속 TGA가 상기 데이터베이스에 존재하는 지를 결정하는 것, 및 만약 그렇다면, 상기 데이터베이스로부터의 제2 또는 후속 TGA에 대한 정보를, 상기 환자에 존재하는 상기 제2 TGA와 연관짓는 것을 포함하는, 상기 대상체의 TGA의 특징을 규명하는 것을 추가로 포함한다. 한 실시양태에서, 상기 방법은 대상체의 TGA 및 임의로 연관된 주석의 존재 또는 부재를 기억시키기 위해 보고서를 형성하는 것을 추가로 포함한다. 한 실시양태에서, 방법은 수신 당사자에게 상기 보고서를 전송하는 것을 추가로 포함한다.
한 실시양태에서, 방법은 특정 대상체의 TGA가 데이터베이스, 예를 들어, 검증된 TGA의 데이터베이스에 존재하는 지를 결정하는 것; 또는 상기 데이터베이스에 존재하지 않는 TGA가 공지된 임상적으로 관련된 유전자 또는 변경을 갖는지를 결정하는 것, 및 만약 그렇다면, 상기 데이터베이스에서 상기 TGA에 대한 진입을 제공하는 것을 포함하는, 상기 대상체의 TGA의 특징을 규명하는 것을 추가로 포함한다. 한 실시양태에서, 상기 방법은 대상체로부터의 샘플의 DNA에서 발견된 돌연변이의 존재 또는 부재를 기억시키기 위해 보고서를 형성하는 것을 추가로 포함한다.
본 개시내용은, 예를 들어, 하기 넘버링된 실시양태 중 임의의 것에서 정의될 수 있다.
1. 제1 표적 포획 시약 (R1) 및 제2 표적 포획 시약 (R2)을 포함하는 복수 개의 표적 포획 시약으로서,
여기서:
R1은 결합 쌍의 기능적 제1 구성원을 포함하는 R1, 및 임의로, 결합 쌍의 기능적 제1 구성원이 결여된 R1을 포함하고;
R2는 결합 쌍의 기능적 제1 구성원을 포함하는 R2 및 결합 쌍의 기능적 제1 구성원이 결여된 R2를 포함하며;
여기서 결합 쌍의 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있고,
여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 큰 것인
복수 개의 표적 포획 시약.
2. 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 1의 복수 개의 표적 포획 시약.
3. R1 각각이 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체를 형성할 수 있고, R2 각각이 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 형성할 수 있으며,
F1, F2, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인
실시양태 1 또는 2의 복수 개의 표적 포획 시약.
4. F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인
실시양태 3의 복수 개의 표적 포획 시약.
5. 제3 표적 포획 시약 (R3)을 추가로 포함하며,
여기서 R3이 결합 쌍의 기능적 제1 구성원을 포함하는 R3 및 결합 쌍의 기능적 제1 구성원이 결여된 R3을 포함하고;
여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으며,
여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 더 큰 것인
전술한 실시양태 중 임의의 것의 복수 개의 표적 포획 시약.
6. R3 각각이 제3 단편/제1 표적 포획 시약 (F3/R3) 혼성체를 형성할 수 있고,
F3이 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인
전술한 실시양태 중 임의의 것의 복수 개의 표적 포획 시약.
7. 하기 단계를 포함하는, 샘플을 분석하는 방법:
복수 개의 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하는 단계; 및
복수 개의 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하며,
여기서 기질과 결합하는 F1/R1 혼성체의 분율이 기질과 결합하는 F2/R2 혼성체의 분율보다 더 크며,
이에 의해 샘플을 분석하는 단계.
8. F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인
실시양태 7의 방법.
9. R1의 일부분 및 R2의 일부분이 결합 쌍의 기능적 제1 구성원을 포함하고, 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있는 것인 실시양태 7 또는 8의 방법.
10. R1의 일부분, R2의 일부분, 또는 둘 다가, 결합 쌍의 기능적 제1 구성원, 예를 들어, 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 없거나 또는 이러한 제2 구성원에 대한 감소된 결합 친화도를 갖는 변경되거나 또는 차단된 제1 구성원이 결여된 것인, 실시양태 7 내지 9 중 임의의 것의 방법.
11. R1이 결합 쌍의 기능적 제1 구성원을 포함하는 R1 및 결합 쌍의 기능적 제1 구성원이 결여된 R1을 포함하고;
R2가 결합 쌍의 기능적 제1 구성원을 포함하는 R2 및 결합 쌍의 기능적 제1 구성원이 결여된 R2를 포함하는 것인
실시양태 7 내지 10 중 임의의 것의 방법.
12. 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 큰 것인 실시양태 7 내지 11 중 임의의 것의 방법.
13. 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 11의 방법.
14. 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이, F1/R1 혼성체/기질 복합체 및 F2/R2 혼성체/기질 복합체의 형성 시, F1/R1 혼성체/기질 복합체 중의 F1의 수 및 F2/R2 혼성체/기질 복합체 중의 F2의 수가 하기 관계 중 하나 또는 둘 다를 갖도록 하는 것인 실시양태 7 내지 13 중 임의의 것의 방법:
(i) F1의 수가 F2의 수보다 더 크거나, 또는 이와 실질적으로 동일함; 및/또는
(ii) 제1 대상 구간에서의 변경을 포함하는 F1의 수가 제2 대상 구간에서의 변경을 포함하는 F2의 수보다 더 크거나, 또는 이와 실질적으로 동일함.
15. F1의 수가 F2의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 14의 방법.
16. 제1 대상 구간에서의 변경을 포함하는 F1의 수가 제2 대상 구간에서의 변경을 포함하는 F2의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 14 또는 15의 방법.
17. 제1 대상 구간, 제2 대상 구간, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 것인 실시양태 14 내지 16 중 임의의 것의 방법.
18. 제1 대상 구간에서의 변경이 샘플 중에 약 0.1% 이상 (예를 들어, 약 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 이상, 예를 들어, 약 0.1% 내지 0.9%, 0.2% 내지 0.8%, 0.3% 내지 0.7%, 또는 0.4% 내지 0.6%)의 돌연변이체 대립유전자 빈도로 존재하는 것인 실시양태 14 내지 17 중 임의의 것의 방법.
19. 제2 대상 구간에서의 변경이 샘플 중에 약 1% 이상 (예를 들어, 약 2%, 3%, 4%, 5%, 6%, 7%, 8%, 또는 9% 이상, 예를 들어, 약 1% 내지 9%, 2% 내지 8%, 3% 내지 7%, 또는 4% 내지 6%)의 돌연변이체 대립유전자 빈도로 존재하는 것인 실시양태 14 내지 18 중 임의의 것의 방법.
20. F1, F2, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인 실시양태 7 내지 19 중 임의의 것의 방법.
21. F1에서의 대상 구간이 제1 깊이로 시퀀싱되고, F2에서의 대상 구간이 제2 깊이로 시퀀싱되며, 여기서 제1 깊이가 제2 깊이보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 것인 실시양태 20의 방법.
22. F1이 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 대상 구간이 변경, 예를 들어, 체세포 변경, 예를 들어, 암에 있어서의 기능적 변경을 포함하는 것인 실시양태 14 내지 21 중 임의의 것의 방법.
23. 대상 구간이 적어도 약 5,000X 깊이로 시퀀싱되는 것인 실시양태 17의 방법.
24. F2가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 대상 구간이 변경, 예를 들어, 체세포 변경을 포함하며, 여기서 이러한 변경의 결정이 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커를 평가하기 위해 사용되는 것인 실시양태 7 내지 23 중 임의의 것의 방법.
25. 대상 구간이, 예를 들어, 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커를 평가하기 위하여, 적어도 약 800X 내지 약 5,000X 미만으로 시퀀싱되는 것인 실시양태 24의 방법.
26. 복수 개의 제3 단편/제3 표적 포획 시약 (F3/R3) 혼성체를 기질과 접촉시켜 F3/R3 혼성체/기질 복합체를 형성하는 것을 추가로 포함하는, 실시양태 7 내지 25 중 임의의 것의 방법.
27. R3이 결합 쌍의 기능적 제1 구성원을 포함하는 R3 및 결합 쌍의 기능적 제1 구성원이 결여된 R3을 포함하는 것인 실시양태 25 또는 26의 방법.
28. 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 더 큰 것인 실시양태 26 내지 27 중 임의의 것의 방법.
29. 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 26 내지 28 중 임의의 것의 방법.
30. 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율 및 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율이, F2/R2 혼성체/기질 복합체 및 F3/R3 혼성체/기질 복합체의 형성 시, F2/R2 혼성체/기질 복합체 중의 F2의 수 및 F3/R3 혼성체/기질 복합체 중의 F3의 수가 하기 관계 중 하나 또는 둘 다를 갖도록 하는 것인 실시양태 26 내지 29 중 임의의 것의 방법:
(i) F2의 수가 F3의 수보다 더 큼; 및/또는
(ii) 제2 대상 구간에서의 변경을 포함하는 F2의 수가 제3 대상 구간에서의 변경을 포함하는 F3의 수보다 더 큼.
31. F2의 수가 F3의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 30의 방법.
32. 제2 대상 구간에서의 변경을 포함하는 F2의 수가 제3 대상 구간에서의 변경을 포함하는 F3의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 실시양태 30 또는 31의 방법.
33. 제2 대상 구간, 제3 대상 구간, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 것인 실시양태 30 내지 32 중 임의의 것의 방법.
34. F1, F2, 또는 F3 중 하나, 둘 또는 모두가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인 실시양태 26 내지 33 중 임의의 것의 방법.
35. F2에서의 대상 구간이 제2 깊이로 시퀀싱되고, F3에서의 대상 구간이 제3 깊이로 시퀀싱되며, 여기서 제2 깊이가 제3 깊이보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 것인 실시양태 34의 방법.
36. F3이 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 대상 구간이 배선 변경, 예를 들어, 배선 SNP를 포함하는 것인 실시양태 26 내지 35 중 임의의 것의 방법.
37. 대상 구간이 적어도 약 100X 깊이 내지 약 800X 미만의 깊이로 시퀀싱되는 것인 실시양태 36의 방법.
38. 대상체로부터 샘플을 제공하는 것을 추가로 포함하는, 실시양태 7 내지 37 중 임의의 것의 방법.
39. 샘플이 DNA, 예를 들어, 게놈 DNA, 예를 들어, 무세포 DNA (cfDNA) 또는 순환 종양 DNA (ctDNA)를 포함하는 것인 실시양태 7 내지 38 중 임의의 것의 방법.
40. 샘플이 RNA, 예를 들어, mRNA를 포함하는 것인 실시양태 7 내지 39 중 임의의 것의 방법.
41. RNA로부터 cDNA를 제공하는 것을 추가로 포함하는, 실시양태 40의 방법.
42. 샘플로부터 핵산을 수득하는 것, 예를 들어, 단리하는 것을 추가로 포함하는, 실시양태 7 내지 41 중 임의의 것의 방법.
43. 샘플 중의 핵산을 단편화하여 F1 및 F2를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 42 중 임의의 것의 방법.
44. F1을 증폭시켜 복수 개의 F1을 제공하는 것, 및 F2를 증폭시켜 복수 개의 F2를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 43 중 임의의 것의 방법.
45. 어댑터 서열을 F1 및 F2에 부착시켜 어댑터화된 F1 (AF1) 및 어댑터화된 F2 (AF2)를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 44 중 임의의 것의 방법.
46. AF1을 증폭시켜 복수 개의 AF1을 제공하는 것, 및 AF2를 증폭시켜 복수 개의 AF2를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 45 중 임의의 것의 방법.
47. 복수 개의 F1을 R1과 접촉시켜 복수 개의 F1/R1 혼성체를 제공하는 것, 및 복수 개의 F2를 R2와 접촉시켜 복수 개의 F2/R2 혼성체를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 46 중 임의의 것의 방법.
48. 복수 개의 AF1을 R1과 접촉시켜 복수 개의 AF1/R1 혼성체를 제공하는 것, 및 복수 개의 AF2를 R2와 접촉시켜 복수 개의 AF2/R2 혼성체를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 47 중 임의의 것의 방법.
49. 복수 개의 F1/R1 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하는 것이 복수 개의 AF1/R1 혼성체를 기질과 접촉시켜 AF1/R1 혼성체/기질 복합체를 형성하는 것을 포함하고;
복수 개의 F2/R2 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하는 것이 복수 개의 AF2/R2 혼성체를 기질과 접촉시켜 AF2/R2 혼성체/기질 복합체를 형성하는 것을 포함하는 것인,
실시양태 7 내지 48 중 임의의 것의 방법.
50. 접촉하는 것이 용액 중에서 발생하는 것인 실시양태 47 내지 49 중 임의의 것의 방법.
51. 접촉하는 것이 고체 표면 상에서 발생하는 것인 실시양태 47 내지 49 중 임의의 것의 방법.
52. 결합 쌍의 제1 구성원이 비오틴 모이어티를 포함하고, 결합 쌍의 제2 구성원이 스트렙타비딘 또는 아비딘 (또는 변형된 버전, 예를 들어, 뉴트라비딘 또는 캡타비딘) 모이어티를 포함하는 것인 실시양태 8 내지 51 중 임의의 것의 방법.
53. 결합 쌍의 제1 구성원이 디곡시게닌 모이어티를 포함하고, 결합 쌍의 제2 구성원이 항-디곡시게닌 항체 모이어티를 포함하는 것인 실시양태 8 내지 51 중 임의의 것의 방법.
54. 결합 쌍의 제1 구성원이 FITC 모이어티를 포함하고, 결합 쌍의 제2 구성원이 항-FITC 항체 모이어티를 포함하는 것인 실시양태 8 내지 51 중 임의의 것의 방법.
55. R1 내의 결합 쌍의 제1 구성원이, 링커를 통해 F1을 포획하는 (예를 들어, F1과 혼성화되는) R1 내의 모이어티 (예를 들어, 뉴클레오티드 서열)에 커플링되고, R2 내의 결합 쌍의 제1 구성원이, 링커를 통해 F2를 포획하는 (예를 들어, F2와 혼성화되는) R2 내의 모이어티 (예를 들어, 뉴클레오티드 서열)에 커플링되며,
임의로, 여기서 링커가 절단가능한 링커인,
실시양태 8 내지 51 중 임의의 것의 방법.
56. 복수 개의 F1/R1 혼성체/기질 복합체로부터 F1을 시퀀싱하는 것 및 복수 개의 F2/R2 혼성체/기질 복합체로부터 F2를 시퀀싱하는 것을 추가로 포함하는, 실시양태 7 내지 55 중 임의의 것의 방법.
57. F1이 F2보다 더 큰 깊이, 예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되는 것인 실시양태 56의 방법.
58. 하기 단계를 포함하는, 샘플을 분석하는 방법:
a) 복수 개의 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체 및 복수 개의 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 제공하며,
여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 크고,
여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있는 것인 단계;
b) 복수 개의 F1/R1 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하고, 복수 개의 F2/R2 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하며,
여기서 기질과 결합하는 F1/R1 혼성체의 분율이 기질과 결합하는 F2/R2 혼성체의 분율보다 더 큰 것인 단계; 및
c) 복수 개의 F1/R1 혼성체/기질 복합체로부터 F1을 시퀀싱하고, 복수 개의 F2/R2 혼성체/기질 복합체로부터 F2를 시퀀싱하며,
여기서 F1이 F2보다 더 큰 깊이로 시퀀싱되며,
이에 의해 샘플을 분석하는 단계.
59. F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인,
실시양태 58의 방법.
60. 하기 단계를 포함하는, 샘플을 분석하는 방법:
1) 대상체로부터 샘플, 예를 들어, 게놈 DNA, 예를 들어, 무세포 DNA (cfDNA) 또는 순환 종양 DNA (ctDNA)를 포함하는 샘플을 제공하는 단계;
2) 샘플로부터 핵산을 수득하는, 예를 들어, 단리하는 단계;
3) 핵산을 단편화하여 복수 개의 단편 (F)을 제공하는 단계;
4) 어댑터 서열을 복수 개의 단편 (F)에 부착시켜 복수 개의 어댑터화된 단편 (AF)을 제공하는 단계;
5) 제1 AF (AF1)를 증폭시켜 복수 개의 AF1을 제공하고, 제2 AF (AF2)를 증폭시켜 복수 개의 AF2를 제공하는 단계;
6) 복수 개의 AF1을, AF1과 혼성화되는 뉴클레오티드 서열을 각각 포함하는 제1 표적 포획 시약 (R1)과 접촉시켜 복수 개의 AF1/R1 혼성체를 제공하고, 복수 개의 AF2를, AF2와 혼성화되는 뉴클레오티드 서열을 각각 포함하는 제2 표적 포획 시약 (R2)과 접촉시켜 복수 개의 AF2/R2 혼성체를 제공하며,
여기서 R1의 일부분 및 R2의 일부분이 결합 쌍의 기능적 제1 구성원을 포함하고, 여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으며,
여기서 R1의 일부분, R2의 일부분, 또는 둘 다가, 결합 쌍의 기능적 제1 구성원이 결여된 것인 단계;
7) 복수 개의 AF1/R1 혼성체를 기질과 접촉시켜 AF1/R1 혼성체/기질 복합체를 형성하고, 복수 개의 AF2/R2 혼성체를 기질과 접촉시켜 AF2/R2 혼성체/기질 복합체를 형성하며,
여기서 기질과 결합하는 AF1/R1 혼성체의 분율이, 기질과 결합하는 AF2/R2 혼성체의 분율보다 더 큰 것인 단계; 및
8) 복수 개의 AF1/R1 혼성체/기질 복합체로부터 AF1을 시퀀싱하고, 복수 개의 AF2/R2 혼성체/기질 복합체로부터 AF2를 시퀀싱하며,
임의로, 여기서 AF1이 AF2보다 더 큰 깊이, 예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되며;
이에 의해 샘플을 분석하는 단계.
61. AF1이 높은 시퀀싱 깊이 이벤트를 포함하고;
AF2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인,
실시양태 60의 방법.
62. 샘플로부터 복수 개의 핵산 분자를 포함하는 라이브러리를 획득하는 것을 추가로 포함하는, 실시양태 7 내지 61 중 임의의 것의 방법.
63. 라이브러리를 표적 포획 시약과 접촉시켜 선택된 핵산 분자를 제공하며, 여기서 상기 표적 포획 시약이 핵산 분자와 혼성화되며, 이에 의해 라이브러리 캐치를 제공하는 것을 추가로 포함하는, 실시양태 62의 방법.
64. 상기 라이브러리 또는 라이브러리 캐치로부터, 핵산 분자로부터의 변경 (예를 들어, 체세포 변경)을 포함하는 대상 구간에 대한 리드를 획득하며, 이에 의해, 예를 들어, 차세대 시퀀싱 방법에 의해 대상 구간에 대한 리드를 획득하는 것을 추가로 포함하는, 실시양태 63의 방법.
65. 복수 개의 유전자에서의 대상 구간에 대한 리드를 획득하는 것을 포함하는, 실시양태 64의 방법.
66. 복수 개의 유전자가 돌연변이체 형태의 유전자를 포함하며, 예를 들어, 돌연변이체 유전자가 세포 분열, 성장 또는 생존에 대한 효과와 연관이 있거나, 또는 암과 연관이 있는 것인 실시양태 65의 방법.
67. 복수 개의 유전자가 전체 엑손 시퀀싱 (WES)을 위한 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 약 350개 이상, 약 400개 이상, 약 450개 이상, 약 500개 이상 유전자, 또는 약 1,000개 이상 유전자, 또는 모든 유전자를 포함하는 것인 실시양태 65 또는 66의 방법.
68. 복수 개의 유전자가 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두를 포함하는 것인 실시양태 64 내지 67 중 임의의 것의 방법.
69. 대상 구간에 대한 리드를 획득하는 것이 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두로부터 대상 구간을 시퀀싱하는 것을 포함하는 것인 실시양태 64 내지 68 중 임의의 것의 방법.
70. 대상 구간이 약 100X 초과, 약 250X 초과, 약 500X 초과, 약 800X 초과, 약 1,000X 초과, 약 2,000X 초과, 약 3,000X 초과, 약 4,000X 초과, 또는 약 5,000X 초과의 평균 깊이로 시퀀싱되는 것인 실시양태 64 내지 69 중 임의의 것의 방법.
71. 대상 구간이, 시퀀싱되는 유전자 (예를 들어, 엑손)의 약 95% 초과, 약 97% 초과, 또는 약 99% 초과에서, 약 100X 초과, 약 250X 초과, 약 500X 초과, 약 800X 초과, 약 1,000X 초과, 약 2,000X 초과, 약 3,000X 초과, 약 4,000X 초과, 또는 약 5,000X 초과의 평균 깊이로 시퀀싱되는 것인 실시양태 64 내지 70 중 임의의 것의 방법.
72. 상기 리드를 정렬 방법에 의해 정렬하는 것을 추가로 포함하는, 실시양태 64 내지 71 중 임의의 것의 방법.
73. 뉴클레오티드 위치에 대한 상기 리드로부터 뉴클레오티드 값을 배정하는 것을 추가로 포함하는, 실시양태 72의 방법.
74. 샘플 중의 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커를 평가하는 것을 추가로 포함하는, 실시양태 7 내지 73 중 임의의 것의 방법.
75. 샘플이 혈액 샘플인 실시양태 74의 방법.
76. 샘플 중의 변경을 체세포 또는 배선 변경으로서 특징규명하는 것을 추가로 포함하는, 실시양태 7 내지 75 중 임의의 것의 방법.
77. 샘플 중의 변경의 접합성을 결정하는 것을 추가로 포함하는, 실시양태 7 내지 76 중 임의의 것의 방법.
78. 샘플 분석에 대응하여 샘플 또는 이러한 샘플이 수득된 대상체를 분류하는 것을 추가로 포함하는, 실시양태 7 내지 77 중 임의의 것의 방법.
79. 샘플이 수득된 대상체 또는 또 다른 사람 또는 실체, 간병인, 의사, 종양전문의, 병원, 클리닉, 제3자 지불인, 보험 회사 또는 관공서에게 보고서, 예를 들어, 전자, 웹-기반 또는 종이 보고서를 제공하는 것을 추가로 포함하는, 실시양태 7 내지 78 중 임의의 것의 방법.
실시예
본 발명은 하기 실시예에 의해 추가로 예시되며, 이로써 제한하는 것으로 해석되서는 안된다. 본 출원 전반에 걸쳐 인용된 모든 참고문헌, 도면, 서열 목록, 특허 및 공개된 특허 출원의 내용은 본원에 참조로 포함된다.
실시예 1: 무세포 DNA에서의 변경의 검출
도입
본 실시예에 기재된 무세포 DNA (cfDNA) 검정은, 예를 들어, 약 60개 이상의 유전자에서, 예를 들어, 치환, 삽입 및 결실 변경 (indel), 암 환자의 항응고 말초 전혈로부터 유래된 혈장으로부터 단리된 순환 없는 DNA (cfDNA)를 사용하는 선택 카피 수 변경 (CNA) 및 선택 유전자 재배열의 검출을 위한 차세대 시퀀싱 기반 검정이다. 무세포 DNA의 순환 종양 DNA (ctDNA) 분획의 양이 적기 때문에, 표적 포획 함량은 높은 감도와 특이성을 위해 표적 영역의 좁고 높은 시퀀싱 깊이를 달성하도록 제한된다. 본 실시예에 기재된 cfDNA 검정은 또한 표적 포획 영역 전체에 걸쳐 넓고 중간 정도의 커버리지를 달성하기 위해 더 큰 유전자 패널 (>300개 유전자)의 사용을 통해 게놈 시그니처에 사용될 수 있다. 대부분의 경우 좁은 표적 포획 영역은 합리적 시퀀싱 비용으로 높은 감도와 특이성을 달성하기 위해 총 표적 크기가 0.1 내지 0.3 Mb로 제한되는 반면, 게놈 시그니처는 0.8 내지 1.0 Mb의 최소 총 표적 포획 영역을 필요로 한다. 현재, 표준 cfDNA 검정에 게놈 시그니처 분석을 부가하는 것은, 각각 두 개의 혈액 수집 튜브로부터 출발하여 단일 검정의 2배의 시퀀싱 데이터 생성이 필요한 병렬 워크플로우를 활용한다.
본 실시예에 기재된 연구는 높은 감도와 특이성에서 호출되는 관련 게놈 변경을 게놈 시그니처의 검출과 조합하고 시험 중인 환자당 총 2개의 혈액 튜브 만을 필요로 하기 위해 현재 cfDNA 검정 워크플로우를 최적화하는 목표로 설계되었다. 개요 서술된 실험은 <200M 리드 쌍의 시퀀싱 데이터 표적 내에서 좁고 높은 시퀀싱 깊이와 넓고 중간 정도의 시퀀싱 깊이 둘 다를 달성할 수 있는 조합된 검정에 대한 여러 옵션을 평가하도록 설계되었다. 조합된 검정에 대한 워크플로우 최적화를 평가하여 cfDNA 검정의 요구 사항을 충족하기 위해 각각의 옵션을 활용하는 타당성을 평가하였다.
본 실시예에 기재된 연구는 조합된 검정 설계 요구 사항을 달성하기 위한 여러 옵션을 평가하였다. 제1 옵션은 동일한 라이브러리 구축 ("LC") 재료로부터의 이중 (병렬) 혼성체 포획 ("HC") 접근법을 평가하는 것이었는데, 이는 창출될 수 있는 PCR 후 LC 출력 재료의 양을 증가시키기 위한 개발 작업이 포함되어, 다른 고려 사항 중에서도 과잉 증폭에 의해 라이브러리의 복잡성을 현저히 감소시키지 않으면서 이중 혼성체 포획 반응을 지원하기에 충분한 최소량에 도달하였다 (이러한 제1 옵션과 관련된 활동은 하기, 집합적으로 "경로 1"에 보다 상세히 명시되어 있음). 제2 옵션은 게놈 변경과 게놈 시그니처 둘 다를 호출하기 위해 넓고 높은 시퀀싱 깊이에서 게놈 시그니처 표적 포획 시약을 활용하여 평가하는 것이었는데, 이는 게놈 변경 및 게놈 시그니처 호출의 성능을 유지하기 위해 서열 부하 밀도를 최적화하는 것을 평가한다 (이러한 제2 옵션과 관련된 활동은 하기, 집합적으로 "경로 2"에 보다 상세히 명시되어 있음).
제3 옵션은 5' 비오티닐화된 프로브와 비변형된 프로브 (종종 항-표적 포획 시약 또는 차단 표적 포획 시약으로서 지칭됨)의 조합을 사용하여 특이적인 표적별 기준에 대한 표적 시퀀싱 깊이를 조정하는 복합 표적 포획 시약 전략을 평가하는 것이었다. 예를 들어, 비오티닐화된 프로브 (예를 들어, 5' 비오티닐화된 프로브)는 결합 쌍의 기능적 제1 구성원 (예를 들어, 본원에 기재된 바와 같음)을 포함하는 표적 포획 시약이다. 또 다른 예로서, 비변형된 프로브 (예를 들어, 항-표적 포획 시약, 차단 프로브, 비오티닐화되지 않은 프로브)는 결합 쌍의 기능적 제1 구성원 (예를 들어, 본원에 기재된 바와 같음)이 결여된 표적 포획 시약이다. 이러한 전략은 명시된 표적의 좁고 높은 시퀀싱 깊이와 게놈 시그니처에 대한 나머지 표적 영역 전체에 걸친 넓고 중간 정도의 시퀀싱 깊이를 허용한다. 본 실험은 단일 혼성화 반응의 능력을 평가하기 위해 설계되었으며, 여기서 게놈 라이브러리로부터 추출되고 후속적으로 시퀀싱된 표적의 양은 변형된 프로브와 비변형된 프로브의 비율에 의해 미리 결정될 수 있다. 이를 통해, 경로 2에 개요 서술된 바와 같이 단일 HC 반응을 사용할 수 있지만, 경로 1에서 달성한 낮은, 높은 및 중간 정도의 표적 시퀀싱 깊이를 가질 수 있는 능력도 갖게 된다 (이러한 제3 옵션과 관련된 활동은 하기, 집합적으로 "경로 2B"에 보다 상세히 명시되어 있음).
결과:
경로 1
단일 라이브러리 구축으로부터의 이중 혼성체 포획
라이브러리 구축 프로토콜 최적화는 20 ng 내지 100 ng의 LC 입력 범위를 나타내는 192개의 DNA 샘플이, 좁고 높은 시퀀싱 깊이 (NHSD, 0.3 Mb)에 대한 표적 포획 시약 및 넓고 중간 정도의 시퀀싱 깊이 (WMSD, 2 Mb)에 대한 표적 포획 시약의 동등한 표현으로 포획된, 3개의 별도의 LC 플레이트에 걸쳐 실행된 프로세스 자격에서 입증된 바와 같이 LC 출력의 효율과 균일성을 더 높였다. 이전의 개발 작업은 자동화된 액체 처리 워크스테이션에 설치된 자동화 cfDNA 검정 라이브러리 구축 프로토콜이, 상기 프로세스를 통해 실행되는 모범 샘플의 QC 기준 평가를 통해 예상 임상 성능을 충족하거나 이를 초과하였다는 것을 검증하였다. 낮은 입력 (≥20-50 ng) 및 높은 입력 (>50-100 ng)에서 100% 샘플의 라이브러리 구축 수율은 모두 >2 μg LC 수율을 달성했으며, NHSD 표적 포획 시약으로 포획된 100% 샘플은 ≥5000X 중앙값 독특한 시퀀싱 깊이를 가졌고, WMSD 표적 포획 시약으로 포획된 100% 샘플은 ≥800X 중앙값 독특한 시퀀싱 깊이를 가졌다. 프로토콜 최적화는 병렬 혼성체 포획 반응에 충분한 LC 출력을 제공하는데 필요한 결과를 달성하였다. 전개 후 모든 입력 농도에 대해 동등한 LC 수율 분포를 보여주었다. 대조적으로, 최적화 이전의 프로토콜은 LC 입력을 사용한 LC 수율 스케일링에서 cfDNA 검정에 사용되는 광범위한 LC 입력에 대해 2가지 혼성체 포획 반응을 갖는 것이 어려울 것이라고 예시하였다.
효소적으로 단편화된 정상 인간 DNA는 cfDNA 검정 라이브러리 구축을 거쳤으며, 6개의 복제물은 각각 2개의 HC 반응으로 분할되었다. 하나의 HC 반응은 NHSD 표적 포획 시약으로 수행되었고, 다른 하나는 WMSD 표적 포획 시약으로 수행되었다. 샘플당 표적 100M 리드 쌍에 대한 HiSeq 4000 플로우 셀 상에 샘플을 부하하였다. 표 6에 개요 서술된 바와 같이, 150M 초과 리드 쌍이 있는 각각의 샘플은 NHSD 표적 포획과 WMSD 표적 포획 둘 다에 대한 표적 원시, 독특한 및 중복 시퀀싱 깊이 사양을 달성하여, 단일 LC 경로로부터의 이중 HC가 커버리지 목표를 달성하였다는 것을 입증하였다.
표 6. 단일 라이브러리로부터 이중 HC로부터의 커버리지 결과 (n=6 복제물). NHSD = 좁고 높은 시퀀싱 깊이, WMSD = 넓고 중간 정도의 시퀀싱 깊이
Figure pct00018
1LC>2HC의 변이체 수준 성능 평가
변이체 수준 일치에서 단일 LC로부터의 이중 HC를 추가로 평가하기 위해, 43개의 모범 샘플에서 짧은 뉴클레오티드 변이체, 삽입/결실, 유전자 재배열에 대한 NHSD 표적 포획 및 게놈 시그니처에 대한 WMSD 표적 포획을 수행하였다.
1. ALK 인트론 19 재배열 (N=5)
2. EGFR 엑손19 결실 (N=5)
3. EGFR L858R (N=5)
4. RET 재배열 (N=5)
5. 게놈 시그니처 0.88 내지 27.2 mut/mb (N=23)
단일 라이브러리로부터의 이중 HC에 대한 변이체 수준에서의 실험 결과는 경로 1이 실현가능성을 달성하였다는 것을 보여준다. 두 표적 포획 시약 세트에 대한 표적 커버리지 프로파일이 달성되었고, 변이체 수준 일치가 달성되었다.
경로 2
단일 라이브러리 구축으로부터의 단일 혼성체 포획
효소적으로 단편화된 정상 인간 DNA는 cfDNA 검점 라이브러리 구축을 거쳤으며, 6개의 복제물은 WMSD 표적 포획 시약 세트로 수행된 단일 HC 반응을 거쳤다. 이러한 실험은 단일 표적 포획을 이용한 병렬 검정으로부터 200M 리드 예산을 시퀀싱함으로써 넓고 높은 시퀀싱 깊이 (WHSD)를 달성할 수 있었는지를 결정하는데 사용되었다. 샘플당 표적 <200M 리드 쌍에 대한 HiSeq 4000 플로우 셀 상으로 샘플을 부하하였다. 표 7에 개요 서술된 바와 같이, 각각의 샘플은 WMSD 표적 포획에 대해서만 표적 원시, 독특한 및 중복 시퀀싱 깊이 사양을 달성하였지만, NHSD 표적 포획에 대해서는 그렇지 못하였는데, 이는 단일 LC 경로로부터의 이중 HC가 샘플 예산당 200M 리드 쌍에서 그 목표를 달성하지 못하였다는 것을 보여준다. NHSD 표적 영역에 대한 중복 커버리지는 조합된 검정 성능 요구 사항에 필요한 데이터를 달성하기에 충분히 높지 않았다. cfDNA 검정을 위한 충분한 중복 시퀀싱 깊이를 달성하려면 ~700M 리드가 필요할 것으로 추정되며 (~700M = ~30,000x / ~7500x * ~170M), 이는 샘플당 200M 초과 리드 쌍을 시퀀싱하지 않아야 하는 요구 사항보다 훨씬 높다. 이러한 경로에 대한 추가 데이터가 수집되지 않았다.
표 7. 단일 라이브러리로부터 단일 HC로부터의 시퀀싱 깊이 결과 (n=6 복제물). NHSD = 좁고 높은 시퀀싱 깊이, WMSD = 넓고 중간 정도의 시퀀싱 깊이
Figure pct00019
경로 2B
커버리지 조정을 위한 복합 표적 포획 시약 전략
실험 1: NHSD 표적 포획 시약으로 적정된 APC 및 ATM을 위한 차단 표적 포획 시약의 부가
특이적 표적의 포획 성능에 영향을 미칠 수 있는 비변형된 표적 포획 시약의 능력에 대한 제1 개념 증명 평가로서, NHSD 표적 포획 시약으로의 비오티닐화된 표적 포획 시약 1X 내지 2X의 적정에서 두 유전자 APC 및 ATM의 과잉 비변형된 표적 포획 시약이 부가되었다. 표 8도 1은 이러한 실험의 결과를 제시하며, 이는 비변형된 차단제 또는 항-표적 포획 시약을 부가하면 특이적 표적의 커버리지가 저하될 수 있지만, 과잉 차단제를 과잉 표적 포획 시약에 넣는 효과는, 총 표적 포획 시약의 양이 일정하게 유지되고 차단제 대 표적 포획 시약의 비율이 조정된 경우에 그럴 수 있는 것과 같이 두드러지지 않았다는 것을 나타낸다.
표 8. 비변형된 APC 및 ATM 표적 포획 시약의 부가는 표적 커버리지를 저하시켰다
Figure pct00020
실험 2: NHSD 표적 포획 시약으로 적정된 APC 및 ATM을 위한 차단 표적 포획 시약의 부가
실험 2에서는, 최종 풀에서 0.032 pM의 총 표적 포획 시약 양을 일정하게 유지하고 단일 유전자 표적 APC에 대한 항-표적 포획 시약 전략을 예시하기 위해 비오티닐화된 표적 포획 시약 대 비-비오티닐화된 표적 포획 시약의 비율을 적정하였다. 유전자 APC에 대한 표적 포획 시약 (164개 표적 포획 시약)은 NHSD 표적 포획 시약에 부가된 완전한 유전자 서브풀이었으며, 이를 통해 APC 유전자에 대한 표적 시약 없이 NHSD 표적 포획 시약을 갖는 표적 포획 시약 세트 백본을 창출할 수 있었다. 100% 비오티닐화된 APC 내지 99% 비-비오티닐화되거나 또는 1% 비오티닐화된 APC의 범위를 평가하여, 도 2표 9에 제시된 바와 같이 광범위한 관찰된 시퀀싱 깊이 대 예상된 시퀀싱 깊이를 나타내었다. 100% 비오티닐화된 APC를 갖는 NHSD 표적 포획 시약을 100% APC와 비교하여, 표적 포획 시약에 APC를 다시 부가하는 것이 APC 시퀀싱 깊이에 악영향을 미치지 않았다는 것을 보여주었다. 표적 포획 시약의 양을 일정하게 유지함으로써, 항-표적 포획 시약 방법이 성공적이고 더 큰 규모의 시험이 다음 실험이 될 수 있다는 것을 보여주는 예측가능한 시퀀싱 깊이 억제 반응이 있었다.
표 9. APC의 관찰치 대 예상치 중앙값 커버리지/모든 표적의 중앙값 시퀀싱 깊이
Figure pct00021
실험 3: NHSD 표적 이외의 표적에 대한 차단 표적 포획 시약의 부가
실험 3의 목표는 복합 표적 포획 시약 전략을 계속하여 NHSD 영역 상의 높은 깊이를 수득하고 비-NHSD (본원에서 WMSD 표적으로서 지칭되기도 함) 영역 상의 더 낮은 깊이를 표적으로 하여, 단일 혼성체 포획 반응에 의해 수득된 좁고 높은 시퀀싱 깊이 (NHSD) 및 넓고 중간 정도의 시퀀싱 깊이 (WMSD)를 갖는 것이다.
표적 포획 시약 세트는 표적 포획 시약의 3가지 서브풀을 활용함으로써 완전한 프로토타입으로서 제형화되었다. NHSD 표적 포획 시약 (3780개 표적 포획 시약, 0.3 Mb)을 NHSD/비-NHSD 표적 비율 (14% NHSD: 86% 비-NHSD)에서 비변형된 표적 포획 시약 (총 표적에서 NHSD 표적을 뺀 것, 비오틴 없음, 22563개 표적 포획 시약, 1.7 Mb)과 조합하였다. 이어서, 이러한 혼합물을 전체 표적 포획 세트 (2.0 Mb, 26343)로 적정하여 비오틴의 존재 및 부재 하에 비-NHSD 영역의 비율을 변경시켰다. (NHSD-비오틴/비오틴 없음):비-NHSD 비오틴의 적정 시리즈는 먼저 100, 50, 30, 20, 10, 5, 1, 0%에서 수행되어, 각각의 성분의 표적 시퀀싱 깊이 프로파일을 달성하는데 필요한 표적 포획 시약의 비율을 결정하였다.
표 1011에 제시된 적정의 결과는 비-NHSD를 감소시킬 수 있고 필요한 NHSD를 유지할 수 있는 능력을 나타낸다. 10% 제형 (90% 비오틴 없음 내지 10% 비오틴)이 모범 샘플에 사용하기 위한 제형으로서 선택되었다. 적정에 대한 시퀀싱 깊이 결과가 표 1011에 제시된다. 도 3은 히스토그램 형태의, 10% 제형에 대한 실험 3의 결과를 제시한다. 도 3에 제시된 바와 같이, NHSD (좁고 높은 시퀀싱 깊이) 표적은 그래프 왼쪽에 뚜렷한 군을 형성하는 비-NHSD 표적으로부터, 그래프 오른쪽에 별도의 클러스터로 분리된다. NHSD 표적은 비-NHSD 표적 (본원에서 WMSD 표적으로서 지칭되기도 함)과 비교해서 더 높은 시퀀싱 깊이를 갖는다. 이러한 실험은 또한 임상 샘플로 수행되었으며 유사한 결과가 수득되었다.
표 10. 항-표적 포획 시약 적정에서 좁고 높은 시퀀싱 깊이 (NHSD) 영역에 대한 결과
Figure pct00022
1 % 비-NHSD 항-표적 포획 시약은 % WMSD 항-표적 포획 시약을 지칭한다
표 11. 항-표적 포획 시약 적정에서 넓고 중간 정도의 시퀀싱 깊이 (WMSD) 표적 영역에 대한 결과
Figure pct00023
1 % 비-NHSD 항-표적 포획 시약은 % WMSD 항-표적 포획 시약을 지칭한다
요약
본 실시예에는, 단일 검정에서 게놈 시그니처 호출과 높은 감도 및 특이성에서의 게놈 변경 호출의 조합에 대한 3가지 상이한 경로에 대한 결과가 기재되고 요약된다. 이러한 분석은 (a) 단일 라이브러리 구축 후 병렬 혼성체 포획이 시퀀싱 깊이 사양을 달성하고 특이적 게놈 시그니처, 및 단일 뉴클레오티드 변이체 (SNV), indel 및 재배열에 대한 변이체 수준 일치를 유지하며, (b) 200M 리드 쌍이, 높은 감도와 특이성에 필요한 넓고 높은 시퀀싱 깊이를 달성하기에 충분한 시퀀싱이 아니며, (c) 항-표적 포획 시약 접근법을 활용하는 예비 데이터는 항-표적 포획 시약 전략을 사용하여, 규정된 표적에 대해 요구되는 높고 좁은 시퀀싱 깊이와 특이적 게놈 시그니처 영역에 대해 요구되는 넓고 중간 정도의 시퀀싱 깊이를 달성할 수 있다는 것을 시사하여, 실현가능한 시퀀싱 깊이 내에서 성능 사양을 달성하는 조합된 검정의 목표를 달성하기 위한 단일 혼성체 포획 반응을 허용한다는 것을 입증하였다.
본원에 기재된 방법 및 시스템과 관련된 부가의 예는, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/092426 및 WO 2016/090273에 기재되어 있으며, 상기 공보의 내용 및 예는 그 전체 내용이 참조로 포함된다.
참조로 포함됨
본원에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 그 전체 내용이 본원에 참조로 포함된다. 상충되는 경우, 본원의 임의의 정의를 포함한 본 출원이 우선할 것이다.
또한 공개 데이터베이스의 항목과 상관관계가 있는 수탁 번호를 참조하는 임의의 폴리뉴클레오티드 및 폴리펩티드 서열, 예컨대 tigr.org의 월드 와이드 웹에서 게놈 조사 연구소 (TIGR) 및/또는 ncbi.nlm.nih.gov의 월드 와이드 웹에서 국립 생명 공학 정보 센터 (NCBI)에 의해 유지 관리되는 것들이 또한, 그 전체 내용이 참조로 포함된다.
등가물
관련 기술분야의 통상의 기술자는 단지 일상적인 실험을 사용하여 본원에 기재된 본 발명의 구체적 실시양태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 하기 청구범위에 포괄되도록 의도된다.
SEQUENCE LISTING <110> OTTO, GEOFFREY ALAN CLARK, TRAVIS LIPSON, DORON LIEBER, DANIEL FABRIZIO, DAVID <120> COMPOSITIONS AND METHODS FOR EVALUATING GENOMIC ALTERATIONS <130> F2036-7072WO <140> <141> <150> 62/683,469 <151> 2018-06-11 <160> 1 <170> PatentIn version 3.5 <210> 1 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (16)..(135) <223> a, c, t, g, unknown or other <400> 1 atcgcaccag cgtgtnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnncactg cggctcctca 150

Claims (79)

  1. 제1 표적 포획 시약 (R1) 및 제2 표적 포획 시약 (R2)을 포함하는 복수 개의 표적 포획 시약으로서,
    여기서:
    R1은 결합 쌍의 기능적 제1 구성원을 포함하는 R1, 및 임의로, 결합 쌍의 기능적 제1 구성원이 결여된 R1을 포함하고;
    R2는 결합 쌍의 기능적 제1 구성원을 포함하는 R2 및 결합 쌍의 기능적 제1 구성원이 결여된 R2를 포함하며;
    여기서 결합 쌍의 제1 구성원은 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있고,
    여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율은 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 큰 것인
    복수 개의 표적 포획 시약.
  2. 제1항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 복수 개의 표적 포획 시약.
  3. 제1항 또는 제2항에 있어서, R1 각각이 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체를 형성할 수 있고, R2 각각이 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 형성할 수 있으며,
    F1, F2, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인
    복수 개의 표적 포획 시약.
  4. 제3항에 있어서,
    F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
    F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인
    복수 개의 표적 포획 시약.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 제3 표적 포획 시약 (R3)을 추가로 포함하며,
    여기서 R3이 결합 쌍의 기능적 제1 구성원을 포함하는 R3 및 결합 쌍의 기능적 제1 구성원이 결여된 R3을 포함하고;
    여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으며,
    여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 더 큰 것인
    복수 개의 표적 포획 시약.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, R3 각각이 제3 단편/제1 표적 포획 시약 (F3/R3) 혼성체를 형성할 수 있고,
    F3이 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인
    복수 개의 표적 포획 시약.
  7. 하기 단계를 포함하는, 샘플을 분석하는 방법:
    복수 개의 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하는 단계; 및
    복수 개의 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하며,
    여기서 기질과 결합하는 F1/R1 혼성체의 분율이 기질과 결합하는 F2/R2 혼성체의 분율보다 더 크며,
    이에 의해 샘플을 분석하는 단계.
  8. 제7항에 있어서,
    F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
    F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인
    방법.
  9. 제7항 또는 제8항에 있어서, R1의 일부분 및 R2의 일부분이 결합 쌍의 기능적 제1 구성원을 포함하고, 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있는 것인 방법.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, R1의 일부분, R2의 일부분, 또는 둘 다가, 결합 쌍의 기능적 제1 구성원, 예를 들어, 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 없거나 또는 이러한 제2 구성원에 대한 감소된 결합 친화도를 갖는 변경되거나 또는 차단된 제1 구성원이 결여된 것인 방법.
  11. 제7항 내지 제10항 중 어느 한 항에 있어서,
    R1이 결합 쌍의 기능적 제1 구성원을 포함하는 R1 및 결합 쌍의 기능적 제1 구성원이 결여된 R1을 포함하고;
    R2가 결합 쌍의 기능적 제1 구성원을 포함하는 R2 및 결합 쌍의 기능적 제1 구성원이 결여된 R2를 포함하는 것인
    방법.
  12. 제7항 내지 제11항 중 어느 한 항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 큰 것인 방법.
  13. 제11항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 방법.
  14. 제7항 내지 제13항 중 어느 한 항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율 및 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이, F1/R1 혼성체/기질 복합체 및 F2/R2 혼성체/기질 복합체의 형성 시, F1/R1 혼성체/기질 복합체 중의 F1의 수 및 F2/R2 혼성체/기질 복합체 중의 F2의 수가 하기 관계 중 하나 또는 둘 다를 갖도록 하는 것인 방법:
    (i) F1의 수가 F2의 수보다 더 크거나, 또는 이와 실질적으로 동일함; 및/또는
    (ii) 제1 대상 구간에서의 변경을 포함하는 F1의 수가 제2 대상 구간에서의 변경을 포함하는 F2의 수보다 더 크거나, 또는 이와 실질적으로 동일함.
  15. 제14항에 있어서, F1의 수가 F2의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 방법.
  16. 제14항 또는 제15항에 있어서, 제1 대상 구간에서의 변경을 포함하는 F1의 수가 제2 대상 구간에서의 변경을 포함하는 F2의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 방법.
  17. 제14항 내지 제16항 중 어느 한 항에 있어서, 제1 대상 구간, 제2 대상 구간, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 것인 방법.
  18. 제14항 내지 제17항 중 어느 한 항에 있어서, 제1 대상 구간에서의 변경이 샘플 중에 약 0.1% 이상 (예를 들어, 약 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 또는 0.9% 이상, 예를 들어, 약 0.1% 내지 0.9%, 0.2% 내지 0.8%, 0.3% 내지 0.7%, 또는 0.4% 내지 0.6%)의 돌연변이체 대립유전자 빈도로 존재하는 것인 방법.
  19. 제14항 내지 제18항 중 어느 한 항에 있어서, 제2 대상 구간에서의 변경이 샘플 중에 약 1% 이상 (예를 들어, 약 2%, 3%, 4%, 5%, 6%, 7%, 8%, 또는 9% 이상, 예를 들어, 약 1% 내지 9%, 2% 내지 8%, 3% 내지 7%, 또는 4% 내지 6%)의 돌연변이체 대립유전자 빈도로 존재하는 것인 방법.
  20. 제7항 내지 제19항 중 어느 한 항에 있어서, F1, F2, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인 방법.
  21. 제20항에 있어서, F1에서의 대상 구간이 제1 깊이로 시퀀싱되고, F2에서의 대상 구간이 제2 깊이로 시퀀싱되며, 여기서 제1 깊이가 제2 깊이보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 것인 방법.
  22. 제14항 내지 제21항 중 어느 한 항에 있어서, F1이 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 대상 구간이 변경, 예를 들어, 체세포 변경, 예를 들어, 암에 있어서의 기능적 변경을 포함하는 것인 방법.
  23. 제17항에 있어서, 대상 구간이 적어도 약 5,000X 깊이로 시퀀싱되는 것인 방법.
  24. 제7항 내지 제23항 중 어느 한 항에 있어서, F2가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 대상 구간이 변경, 예를 들어, 체세포 변경을 포함하며, 여기서 이러한 변경의 결정이 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커를 평가하기 위해 사용되는 것인 방법.
  25. 제24항에 있어서, 대상 구간이, 예를 들어, 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커를 평가하기 위하여, 적어도 약 800X 내지 약 5,000X 미만으로 시퀀싱되는 것인 방법.
  26. 제7항 내지 제25항 중 어느 한 항에 있어서, 복수 개의 제3 단편/제3 표적 포획 시약 (F3/R3) 혼성체를 기질과 접촉시켜 F3/R3 혼성체/기질 복합체를 형성하는 것을 추가로 포함하는 방법.
  27. 제25항 또는 제26항에 있어서, R3이 결합 쌍의 기능적 제1 구성원을 포함하는 R3 및 결합 쌍의 기능적 제1 구성원이 결여된 R3을 포함하는 것인 방법.
  28. 제26항 또는 제27항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 더 큰 것인 방법.
  29. 제26항 내지 제28항 중 어느 한 항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율이 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 방법.
  30. 제26항 내지 제29항 중 어느 한 항에 있어서, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율 및 결합 쌍의 기능적 제1 구성원을 포함하는 R3의 분율이, F2/R2 혼성체/기질 복합체 및 F3/R3 혼성체/기질 복합체의 형성 시, F2/R2 혼성체/기질 복합체 중의 F2의 수 및 F3/R3 혼성체/기질 복합체 중의 F3의 수가 하기 관계 중 하나 또는 둘 다를 갖도록 하는 것인 방법:
    (i) F2의 수가 F3의 수보다 더 큼; 및/또는
    (ii) 제2 대상 구간에서의 변경을 포함하는 F2의 수가 제3 대상 구간에서의 변경을 포함하는 F3의 수보다 더 큼.
  31. 제30항에 있어서, F2의 수가 F3의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 방법.
  32. 제30항 또는 제31항에 있어서, 제2 대상 구간에서의 변경을 포함하는 F2의 수가 제3 대상 구간에서의 변경을 포함하는 F3의 수보다 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000배 더 큰 것인 방법.
  33. 제30항 내지 제32항 중 어느 한 항에 있어서, 제2 대상 구간, 제3 대상 구간, 또는 둘 다가 표 1A-5A에 기재된 유전자로부터의 것인 방법.
  34. 제26항 내지 제33항 중 어느 한 항에 있어서, F1, F2, 또는 F3 중 하나, 둘 또는 모두가 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하는 것인 방법.
  35. 제34항에 있어서, F2에서의 대상 구간이 제2 깊이로 시퀀싱되고, F3에서의 대상 구간이 제3 깊이로 시퀀싱되며, 여기서 제2 깊이가 제3 깊이보다 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 것인 방법.
  36. 제26항 내지 제35항 중 어느 한 항에 있어서, F3이 표 1A-5A에 기재된 유전자로부터의 대상 구간을 포함하고, 대상 구간이 배선 변경, 예를 들어, 배선 SNP를 포함하는 것인 방법.
  37. 제36항에 있어서, 대상 구간이 적어도 약 100X 깊이 내지 약 800X 미만의 깊이로 시퀀싱되는 것인 방법.
  38. 제7항 내지 제37항 중 어느 한 항에 있어서, 대상체로부터 샘플을 제공하는 것을 추가로 포함하는 방법.
  39. 제7항 내지 제38항 중 어느 한 항에 있어서, 샘플이 DNA, 예를 들어, 게놈 DNA, 예를 들어, 무세포 DNA (cfDNA) 또는 순환 종양 DNA (ctDNA)를 포함하는 것인 방법.
  40. 제7항 내지 제39항 중 어느 한 항에 있어서, 샘플이 RNA, 예를 들어, mRNA를 포함하는 것인 방법.
  41. 제40항에 있어서, RNA로부터 cDNA를 제공하는 것을 추가로 포함하는 방법.
  42. 제7항 내지 제41항 중 어느 한 항에 있어서, 샘플로부터 핵산을 수득하는 것, 예를 들어, 단리하는 것을 추가로 포함하는 방법.
  43. 제7항 내지 제42항 중 어느 한 항에 있어서, 샘플 중의 핵산을 단편화하여 F1 및 F2를 제공하는 것을 추가로 포함하는 방법.
  44. 제7항 내지 제43항 중 어느 한 항에 있어서, F1을 증폭시켜 복수 개의 F1을 제공하는 것, 및 F2를 증폭시켜 복수 개의 F2를 제공하는 것을 추가로 포함하는 방법.
  45. 제7항 내지 제44항 중 어느 한 항에 있어서, 어댑터 서열을 F1 및 F2에 부착시켜 어댑터화된 F1 (AF1) 및 어댑터화된 F2 (AF2)를 제공하는 것을 추가로 포함하는 방법.
  46. 제7항 내지 제45항 중 어느 한 항에 있어서, AF1을 증폭시켜 복수 개의 AF1을 제공하는 것, 및 AF2를 증폭시켜 복수 개의 AF2를 제공하는 것을 추가로 포함하는 방법.
  47. 제7항 내지 제46항 중 어느 한 항에 있어서, 복수 개의 F1을 R1과 접촉시켜 복수 개의 F1/R1 혼성체를 제공하는 것, 및 복수 개의 F2를 R2와 접촉시켜 복수 개의 F2/R2 혼성체를 제공하는 것을 추가로 포함하는 방법.
  48. 제7항 내지 제47항 중 어느 한 항에 있어서, 복수 개의 AF1을 R1과 접촉시켜 복수 개의 AF1/R1 혼성체를 제공하는 것, 및 복수 개의 AF2를 R2와 접촉시켜 복수 개의 AF2/R2 혼성체를 제공하는 것을 추가로 포함하는 방법.
  49. 제7항 내지 제48항 중 어느 한 항에 있어서,
    복수 개의 F1/R1 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하는 것이 복수 개의 AF1/R1 혼성체를 기질과 접촉시켜 AF1/R1 혼성체/기질 복합체를 형성하는 것을 포함하고;
    복수 개의 F2/R2 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하는 것이 복수 개의 AF2/R2 혼성체를 기질과 접촉시켜 AF2/R2 혼성체/기질 복합체를 형성하는 것을 포함하는 것인
    방법.
  50. 제47항 내지 제49항 중 어느 한 항에 있어서, 접촉하는 것이 용액 중에서 발생하는 것인 방법.
  51. 제47항 내지 제49항 중 어느 한 항에 있어서, 접촉하는 것이 고체 표면 상에서 발생하는 것인 방법.
  52. 제8항 내지 제51항 중 어느 한 항에 있어서, 결합 쌍의 제1 구성원이 비오틴 모이어티를 포함하고, 결합 쌍의 제2 구성원이 스트렙타비딘 또는 아비딘 (또는 변형된 버전, 예를 들어, 뉴트라비딘 또는 캡타비딘) 모이어티를 포함하는 것인 방법.
  53. 제8항 내지 제51항 중 어느 한 항에 있어서, 결합 쌍의 제1 구성원이 디곡시게닌 모이어티를 포함하고, 결합 쌍의 제2 구성원이 항-디곡시게닌 항체 모이어티를 포함하는 것인 방법.
  54. 제8항 내지 제51항 중 어느 한 항에 있어서, 결합 쌍의 제1 구성원이 FITC 모이어티를 포함하고, 결합 쌍의 제2 구성원이 항-FITC 항체 모이어티를 포함하는 것인 방법.
  55. 제8항 내지 제51항 중 어느 한 항에 있어서, R1 내의 결합 쌍의 제1 구성원이, 링커를 통해 F1을 포획하는 (예를 들어, F1과 혼성화되는) R1 내의 모이어티 (예를 들어, 뉴클레오티드 서열)에 커플링되고, R2 내의 결합 쌍의 제1 구성원이, 링커를 통해 F2를 포획하는 (예를 들어, F2와 혼성화되는) R2 내의 모이어티 (예를 들어, 뉴클레오티드 서열)에 커플링되며,
    임의로, 여기서 링커가 절단가능한 링커인
    방법.
  56. 제7항 내지 제55항 중 어느 한 항에 있어서, 복수 개의 F1/R1 혼성체/기질 복합체로부터 F1을 시퀀싱하는 것 및 복수 개의 F2/R2 혼성체/기질 복합체로부터 F2를 시퀀싱하는 것을 추가로 포함하는 방법.
  57. 제56항에 있어서, F1이 F2보다 더 큰 깊이, 예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되는 것인 방법.
  58. 하기 단계를 포함하는, 샘플을 분석하는 방법:
    a) 복수 개의 제1 단편/제1 표적 포획 시약 (F1/R1) 혼성체 및 복수 개의 제2 단편/제2 표적 포획 시약 (F2/R2) 혼성체를 제공하며,
    여기서 결합 쌍의 기능적 제1 구성원을 포함하는 R1의 분율이, 결합 쌍의 기능적 제1 구성원을 포함하는 R2의 분율보다 더 크고,
    여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있는 것인 단계;
    b) 복수 개의 F1/R1 혼성체를 기질과 접촉시켜 F1/R1 혼성체/기질 복합체를 형성하고, 복수 개의 F2/R2 혼성체를 기질과 접촉시켜 F2/R2 혼성체/기질 복합체를 형성하며,
    여기서 기질과 결합하는 F1/R1 혼성체의 분율이 기질과 결합하는 F2/R2 혼성체의 분율보다 더 큰 것인 단계; 및
    c) 복수 개의 F1/R1 혼성체/기질 복합체로부터 F1을 시퀀싱하고, 복수 개의 F2/R2 혼성체/기질 복합체로부터 F2를 시퀀싱하며,
    여기서 F1이 F2보다 더 큰 깊이로 시퀀싱되며,
    이에 의해 샘플을 분석하는 단계.
  59. 제58항에 있어서,
    F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
    F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인
    방법.
  60. 하기 단계를 포함하는, 샘플을 분석하는 방법:
    1) 대상체로부터 샘플, 예를 들어, 게놈 DNA, 예를 들어, 무세포 DNA (cfDNA) 또는 순환 종양 DNA (ctDNA)를 포함하는 샘플을 제공하는 단계;
    2) 샘플로부터 핵산을 수득하는, 예를 들어, 단리하는 단계;
    3) 핵산을 단편화하여 복수 개의 단편 (F)을 제공하는 단계;
    4) 어댑터 서열을 복수 개의 단편 (F)에 부착시켜 복수 개의 어댑터화된 단편 (AF)을 제공하는 단계;
    5) 제1 AF (AF1)를 증폭시켜 복수 개의 AF1을 제공하고, 제2 AF (AF2)를 증폭시켜 복수 개의 AF2를 제공하는 단계;
    6) 복수 개의 AF1을, AF1과 혼성화되는 뉴클레오티드 서열을 각각 포함하는 제1 표적 포획 시약 (R1)과 접촉시켜 복수 개의 AF1/R1 혼성체를 제공하고, 복수 개의 AF2를, AF2와 혼성화되는 뉴클레오티드 서열을 각각 포함하는 제2 표적 포획 시약 (R2)과 접촉시켜 복수 개의 AF2/R2 혼성체를 제공하며,
    여기서 R1의 일부분 및 R2의 일부분이 결합 쌍의 기능적 제1 구성원을 포함하고, 여기서 결합 쌍의 제1 구성원이 기질 상에 배치된 결합 쌍의 제2 구성원과 결합할 수 있으며,
    여기서 R1의 일부분, R2의 일부분, 또는 둘 다가, 결합 쌍의 기능적 제1 구성원이 결여된 것인 단계;
    7) 복수 개의 AF1/R1 혼성체를 기질과 접촉시켜 AF1/R1 혼성체/기질 복합체를 형성하고, 복수 개의 AF2/R2 혼성체를 기질과 접촉시켜 AF2/R2 혼성체/기질 복합체를 형성하며,
    여기서 기질과 결합하는 AF1/R1 혼성체의 분율이, 기질과 결합하는 AF2/R2 혼성체의 분율보다 더 큰 것인 단계; 및
    8) 복수 개의 AF1/R1 혼성체/기질 복합체로부터 AF1을 시퀀싱하고, 복수 개의 AF2/R2 혼성체/기질 복합체로부터 AF2를 시퀀싱하며,
    임의로, 여기서 AF1이 AF2보다 더 큰 깊이, 예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 큰 깊이로 시퀀싱되며;
    이에 의해 샘플을 분석하는 단계.
  61. 제60항에 있어서,
    F1이 높은 시퀀싱 깊이 이벤트를 포함하고;
    F2가 낮은 시퀀싱 깊이 이벤트를 포함하며, 예를 들어, 그의 수준이 하나 이상의 바이오마커, 예를 들어, 종양 돌연변이 부담 (TMB), 또는 미세부수체 불안정성 (MSI)의 결정과 연관이 있는 것인
    방법.
  62. 제7항 내지 제61항 중 어느 한 항에 있어서, 샘플로부터 복수 개의 핵산 분자를 포함하는 라이브러리를 획득하는 것을 추가로 포함하는 방법.
  63. 제62항에 있어서, 라이브러리를 표적 포획 시약과 접촉시켜 선택된 핵산 분자를 제공하며, 여기서 상기 표적 포획 시약이 핵산 분자와 혼성화되며, 이에 의해 라이브러리 캐치를 제공하는 것을 추가로 포함하는 방법.
  64. 제63항에 있어서, 상기 라이브러리 또는 라이브러리 캐치로부터, 핵산 분자로부터의 변경 (예를 들어, 체세포 변경)을 포함하는 대상 구간에 대한 리드를 획득하며, 이에 의해, 예를 들어, 차세대 시퀀싱 방법에 의해 대상 구간에 대한 리드를 획득하는 것을 추가로 포함하는 방법.
  65. 제64항에 있어서, 복수 개의 유전자에서의 대상 구간에 대한 리드를 획득하는 것을 포함하는 방법.
  66. 제65항에 있어서, 복수 개의 유전자가 돌연변이체 형태의 유전자를 포함하며, 예를 들어, 돌연변이체 유전자가 세포 분열, 성장 또는 생존에 대한 효과와 연관이 있거나, 또는 암과 연관이 있는 것인 방법.
  67. 제65항 또는 제66항에 있어서, 복수 개의 유전자가 전체 엑손 시퀀싱 (WES)을 위한 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 약 350개 이상, 약 400개 이상, 약 450개 이상, 약 500개 이상 유전자, 또는 약 1,000개 이상 유전자, 또는 모든 유전자를 포함하는 것인 방법.
  68. 제64항 내지 제67항 중 어느 한 항에 있어서, 복수 개의 유전자가 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두를 포함하는 것인 방법.
  69. 제64항 내지 제68항 중 어느 한 항에 있어서, 대상 구간에 대한 리드를 획득하는 것이 표 1A-5A에 기재된 유전자 중 적어도 약 50개 이상, 약 100개 이상, 약 150개 이상, 약 200개 이상, 약 250개 이상, 약 300개 이상, 또는 모두로부터 대상 구간을 시퀀싱하는 것을 포함하는 것인 방법.
  70. 제64항 내지 제69항 중 어느 한 항에 있어서, 대상 구간이 약 100X 초과, 약 250X 초과, 약 500X 초과, 약 800X 초과, 약 1,000X 초과, 약 2,000X 초과, 약 3,000X 초과, 약 4,000X 초과, 또는 약 5,000X 초과의 평균 깊이로 시퀀싱되는 것인 방법.
  71. 제64항 내지 제70항 중 어느 한 항에 있어서, 대상 구간이, 시퀀싱되는 유전자 (예를 들어, 엑손)의 약 95% 초과, 약 97% 초과, 또는 약 99% 초과에서, 약 100X 초과, 약 250X 초과, 약 500X 초과, 약 800X 초과, 약 1,000X 초과, 약 2,000X 초과, 약 3,000X 초과, 약 4,000X 초과, 또는 약 5,000X 초과의 평균 깊이로 시퀀싱되는 것인 방법.
  72. 제64항 내지 제71항 중 어느 한 항에 있어서, 상기 리드를 정렬 방법에 의해 정렬하는 것을 추가로 포함하는 방법.
  73. 제72항에 있어서, 뉴클레오티드 위치에 대한 상기 리드로부터 뉴클레오티드 값을 배정하는 것을 추가로 포함하는 방법.
  74. 제7항 내지 제73항 중 어느 한 항에 있어서, 샘플 중의 하나 이상의 게놈 시그니처, 예를 들어, 연속/복합 바이오마커를 평가하는 것을 추가로 포함하는 방법.
  75. 제74항에 있어서, 샘플이 혈액 샘플인 방법.
  76. 제7항 내지 제75항 중 어느 한 항에 있어서, 샘플 중의 변경을 체세포 또는 배선 변경으로서 특징규명하는 것을 추가로 포함하는 방법.
  77. 제7항 내지 제76항 중 어느 한 항에 있어서, 샘플 중의 변경의 접합성을 결정하는 것을 추가로 포함하는 방법.
  78. 제7항 내지 제77항 중 어느 한 항에 있어서, 샘플 분석에 대응하여 샘플 또는 이러한 샘플이 수득된 대상체를 분류하는 것을 추가로 포함하는 방법.
  79. 제7항 내지 제78항 중 어느 한 항에 있어서, 샘플이 수득된 대상체 또는 또 다른 사람 또는 실체, 간병인, 의사, 종양전문의, 병원, 클리닉, 제3자 지불인, 보험 회사 또는 관공서에게 보고서, 예를 들어, 전자, 웹-기반 또는 종이 보고서를 제공하는 것을 추가로 포함하는 방법.
KR1020217000609A 2018-06-11 2019-06-11 게놈 변경을 평가하기 위한 조성물 및 방법 KR20210035167A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862683469P 2018-06-11 2018-06-11
US62/683,469 2018-06-11
PCT/US2019/036555 WO2019241250A1 (en) 2018-06-11 2019-06-11 Compositions and methods for evaluating genomic alterations

Publications (1)

Publication Number Publication Date
KR20210035167A true KR20210035167A (ko) 2021-03-31

Family

ID=68843118

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217000609A KR20210035167A (ko) 2018-06-11 2019-06-11 게놈 변경을 평가하기 위한 조성물 및 방법

Country Status (11)

Country Link
US (1) US20200149097A1 (ko)
EP (1) EP3802923A4 (ko)
JP (1) JP2021526825A (ko)
KR (1) KR20210035167A (ko)
CN (1) CN112567081A (ko)
AU (1) AU2019286402A1 (ko)
BR (1) BR112020024727A2 (ko)
CA (1) CA3102460A1 (ko)
IL (1) IL279255A (ko)
SG (1) SG11202011696TA (ko)
WO (1) WO2019241250A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3225697A3 (en) 2010-12-30 2017-11-22 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
EP3227464B1 (en) 2014-12-05 2022-04-20 Foundation Medicine, Inc. Multigene analysis of tumor samples
AU2020216438A1 (en) 2019-01-31 2021-07-29 Guardant Health, Inc. Compositions and methods for isolating cell-free DNA
EP4097724A1 (en) * 2020-01-31 2022-12-07 Guardant Health, Inc. Significance modeling of clonal-level absence of target variants
CN111621568A (zh) * 2020-06-23 2020-09-04 暨南大学 Brd4-pd-1和/或brd4-pd-l1在制备预测aml预后试剂盒中的应用
US20240003888A1 (en) 2022-05-17 2024-01-04 Guardant Health, Inc. Methods for identifying druggable targets and treating cancer
WO2024030342A1 (en) * 2022-07-30 2024-02-08 Chapter Diagnostics, Inc. Methods and compositions for nucleic acid analysis

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5249581B2 (ja) * 2004-08-09 2013-07-31 ジェネレイション バイオテック リミテッド ライアビリティ カンパニー 核酸の単離および増幅方法
JP2009505106A (ja) * 2005-08-19 2009-02-05 ナノスフェアー インコーポレイテッド Dna及び抗体を含むハイブリッド基板を調製するための方法及びその使用
WO2009099602A1 (en) * 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
EP3225697A3 (en) * 2010-12-30 2017-11-22 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
ES2831148T3 (es) * 2013-03-15 2021-06-07 Univ Leland Stanford Junior Identificación y uso de marcadores tumorales de ácido nucleico circulante
CN114807307A (zh) * 2014-10-29 2022-07-29 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
EP3227464B1 (en) * 2014-12-05 2022-04-20 Foundation Medicine, Inc. Multigene analysis of tumor samples
MX2018010362A (es) * 2016-02-29 2019-03-28 Found Medicine Inc Metodos y sistemas para evaluar carga mutacional de tumores.
CN106834275A (zh) * 2017-02-22 2017-06-13 天津诺禾医学检验所有限公司 ctDNA超低频突变检测文库的构建方法、试剂盒及文库检测数据的分析方法

Also Published As

Publication number Publication date
SG11202011696TA (en) 2020-12-30
CN112567081A (zh) 2021-03-26
EP3802923A4 (en) 2022-03-16
CA3102460A1 (en) 2019-12-19
AU2019286402A1 (en) 2020-12-24
JP2021526825A (ja) 2021-10-11
US20200149097A1 (en) 2020-05-14
IL279255A (en) 2021-01-31
WO2019241250A1 (en) 2019-12-19
BR112020024727A2 (pt) 2021-03-23
EP3802923A1 (en) 2021-04-14

Similar Documents

Publication Publication Date Title
CN109196359B (zh) 用于评估肿瘤突变负荷的方法和系统
KR20210035167A (ko) 게놈 변경을 평가하기 위한 조성물 및 방법
JP6905934B2 (ja) 腫瘍試料の多重遺伝子分析
AU2011316807C1 (en) Varietal counting of nucleic acids for obtaining genomic copy number information
JP6054303B2 (ja) 腫瘍試料の多重遺伝子分析の最適化
EP3899030A2 (en) Methods for analysis of circulating cells
KR20220011140A (ko) 종양 분획 평가를 위한 시스템 및 방법
JP2021535489A (ja) 無細胞dnaにおけるマイクロサテライト不安定性の検出
EP3802878A1 (en) Methods and systems for determining the cellular origin of cell-free nucleic acids
JP2014519319A (ja) エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物
CN112771174A (zh) 用于循环微米粒子分析的方法
WO2022182878A1 (en) Methods for detection of donor-derived cell-free dna in transplant recipients of multiple organs
WO2022271159A1 (en) Systems and methods for evaluating tumor fraction
WO2016057852A1 (en) Markers for hematological cancers
US20220282305A1 (en) Methods of nucleic acid sample preparation
WO2021072374A1 (en) Use of simultaneous marker detection for assessing difuse glioma and responsiveness to treatment
RU2811503C2 (ru) Способы выявления и мониторинга рака путем персонализированного выявления циркулирующей опухолевой днк
WO2021127267A1 (en) Method for determining if a tumor has a mutation in a microsatellite
Taylor Biomarkers of Lung Cancer Risk and Progression