KR20230006852A - 무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱 - Google Patents

무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱 Download PDF

Info

Publication number
KR20230006852A
KR20230006852A KR1020227040315A KR20227040315A KR20230006852A KR 20230006852 A KR20230006852 A KR 20230006852A KR 1020227040315 A KR1020227040315 A KR 1020227040315A KR 20227040315 A KR20227040315 A KR 20227040315A KR 20230006852 A KR20230006852 A KR 20230006852A
Authority
KR
South Korea
Prior art keywords
region
bda
oligonucleotide
dna
sequence
Prior art date
Application number
KR1020227040315A
Other languages
English (en)
Inventor
데이비드 장
루오지아 우
펭 다이
시 첸
Original Assignee
윌리엄 마쉬 라이스 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윌리엄 마쉬 라이스 유니버시티 filed Critical 윌리엄 마쉬 라이스 유니버시티
Publication of KR20230006852A publication Critical patent/KR20230006852A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/137Reactions characterised by the reaction format or use of a specific feature the purpose or use of a displacement step
    • C12Q2537/1373Displacement by a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/163Reactions characterised by the reaction format or use of a specific feature the purpose or use of blocking probe
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

올리고뉴클레오티드 바코드 서열로 입력 DNA를 표지하고, 변이체 정량화를 위해 표적화된 영역에 걸쳐 DNA 서열 변이체의 선택적 PCR 증폭을 위한 방법이 본원에 제공된다.

Description

무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(QBDA) 시퀀싱
관련 출원에 대한 참조
본 출원은 2020년 5월 1일자로 출원된 미국 가출원 번호 제63/018,922호의 우선권 이익을 주장하며, 이의 그 전체 내용이 본원에 참조로 포함된다.
연방 정부 지원 연구에 관한 진술
본 발명은 국립 보건원에 의해 수여된 승인 번호 R01CA203964 하에 정부 지원으로 이루어졌다. 정부는 본 발명에서 특정 권리를 갖는다.
서열 목록에 대한 참조
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며, 이는 그 전체가 본원에 참조로 통합된다. 2021년 4월 28일에 생성된, 상기 ASCII 사본의 명칭은 RICEP0075WO_ST25.txt이며 크기는 27.8 킬로바이트이다.
배경
본 개시의 개발은 승인 번호 RP180147 하에 텍사스주의 암 예방 및 연구 기관(CPRIT)에 의해 부분적으로 자금을 지원받았다.
1. 분야
본 발명은 일반적으로 분자 생물학 분야에 관한 것이다. 보다 구체적으로, 저심도(low-depth) 차세대 시퀀싱을 사용하여 희귀 돌연변이 정량화 및 프로파일링을 위한 조성물 및 방법에 관한 것이다.
2. 관련 기술의 설명
낮은 대립유전자 빈도를 갖는 DNA 변이체, 예컨대 암 돌연변이 및 병원체 약물 내성 돌연변이는 중요한 임상 및 생물학적 정보를 보유하지만, 다중화되고 저렴한 방식으로 프로파일링하기 어렵다. 블로커 변위 증폭(BDA)1,2 및 다중 BDA (mBDA)3는 단일 반응에서 수백 개의 잠재적으로 희귀 돌연변이(≤0.1% 변이체 대립유전자 빈도)를 농축(enrich)시키는 PCR- 및 가닥 변위-기반 방법을 제공한다. 그러나, BDA에서 정확한 변이체 대립유전자 빈도 정량화를 위해서는 번거로운 보정 곡선이 요구된다. 다중화를 위한 PCR-기반 방법 및 낮은 검출 한계치를 갖는 무보정(calibration-free) 정량화가 필요하다.
요약
이와 같이, 각각의 원래 분자에 고유한 분자 식별자(UMI)를 추가하고 다중화를 특징으로 하는 정량적 블로커 변위 증폭(QBDA)을 허용하는 PCR-기반 방법 및 낮은 검출 한계치를 갖는 무보정 정량화가 본원에 제공된다. 본원에 제공된 임의의 방법은 다중화 사용을 위해 구체적으로 구상된다.
일 구현예에서, 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 1 내지 10,000개의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법이 본원에 제공되며, 상기 방법은: (a) 각각의 표적 게놈 영역에 대해, 1 내지 10,000개의 표적 게놈 영역을 포함하는 DNA 샘플에 하기를 도입하는 단계: (i) 5'에서 3' 말단으로, (A) 제1 영역, (B) 0 내지 50개의 뉴클레오티드 길이를 갖는 제2 영역, 및 (C) 제1 특정 게놈 영역을 표적화하는 제3 영역을 포함하는, 제1 올리고뉴클레오티드; 및 (ii) 5'에서 3' 말단으로, (A) 제4 영역, (B) 0 내지 50개의 뉴클레오티드 길이를 갖는 제5 영역, (C) 적어도 4개의 축퇴성 뉴클레오티드를 포함하는 고유한 분자 식별자(UMI)를 포함하는 제6 영역, 및 (D) 제2 특정 게놈 영역을 표적화하는 제7 영역을 포함하는, 제2 올리고뉴클레오티드; (b) 적어도 2회 주기의 PCR 증폭을 수행하여 제1 PCR 증폭 산물을 생성하는 단계; (c) 제1 PCR 증폭 산물에 하기를 도입하는 단계: (i) 제1 영역을 포함하는 제3 올리고뉴클레오티드; 및 (ii) 제4 영역을 포함하는 제4 올리고뉴클레오티드; (d) 적어도 2회 주기의 PCR 증폭을 수행하여, 제2 PCR 증폭 산물을 생성하는 단계; (e) 제2 PCR 증폭 산물에 하기를 도입하는 단계: (i) 각각의 표적 게놈 영역에 대한 제5 올리고뉴클레오티드(블로커 변위 증폭 (BDA) 정방향 프라이머)로서, 상기 BDA 정방향 프라이머는 특정 게놈 영역을 표적화하는 제8 영역을 포함하고, 상기 제8 영역에 의해 표적화된 게놈 영역은 제3 영역에 의해 표적화된 게놈 영역과 비교하여 제7 영역에 더 가까운 1 내지 20개의 뉴클레오티드인, 제5 올리고뉴클레오티드, (ii) 각각의 표적 게놈 영역에 대한 제6 올리고뉴클레오티드(BDA 블로커)로서, 상기 BDA 정방향 프라이머 서열의 3' 말단에서 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하고; 상기 BDA 블로커는 DNA 중합효소(polymerase)에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하고, 상기 BDA 블로커의 농도는 BDA 정방향 프라이머 농도의 적어도 2배인, 제6 올리고뉴클레오티드, 및 (iii) 제4 영역을 포함하는, 제7 올리고뉴클레오티드; 및 (f) 적어도 2회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 생성하는 단계를 포함한다.
일 구현예에서, 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 적어도 하나의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법이 본원에 제공되며, 상기 방법은: (a) 고유한 분자 식별자(UMI)를 적어도 하나의 표적 게놈 영역에 추가하는 단계; (b) 범용 정방향 프라이머 및 범용 역방향 프라이머를 사용하여 단계 (a)로부터의 적어도 하나의 표적 게놈 영역을 증폭시켜 제1 PCR 증폭 산물을 생성하는 단계로서, 상기 적어도 하나의 표적 게놈 영역은 UMI를 포함하는 것인, 단계; 및 (c) 블로커 변위 증폭(BDA) 정방향 프라이머, BDA 블로커 및 범용 역방향 프라이머를 사용하여 제1 PCR 증폭 산물을 증폭시켜 제2 PCR 증폭 산물을 생성하는 단계를 포함한다.
일 구현예에서, 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 적어도 하나의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법이 본원에 제공되며, 상기 방법은: (a) 적어도 하나의 표적 게놈 영역을 포함하는 DNA 샘플에 하기를 도입하는 단계: (i) 제1 특정 게놈 영역을 표적화하는 제3 영역을 포함하는, 제1 올리고뉴클레오티드; 및 (ii) 적어도 4개의 축퇴성 뉴클레오티드를 포함하는 고유한 분자 식별자(UMI)를 포함하는 영역, 및 제2 특정 게놈 영역을 표적화하는 영역을 포함하는, 제2 올리고뉴클레오티드; (b) 적어도 2회 주기의 PCR 증폭을 수행하여 제1 PCR 증폭 산물을 생성하는 단계; (c) 제1 PCR 증폭 산물에 하기를 도입하는 단계: (i) 범용 정방향 프라이머; 및 (ii) 범용 역방향 프라이머; (d) 적어도 2회 주기의 PCR 증폭을 수행하여, 제2 PCR 증폭 산물을 생성하는 단계; (e) 제2 PCR 증폭 산물에 하기를 도입하는 단계: (i) 특정 게놈 영역을 표적화하는 블로커 변위 증폭(BDA) 정방향 프라이머로서, 상기 제8 영역에 의해 표적화된 게놈 영역은 제3 영역에 의해 표적화된 게놈 영역과 비교하여 제7 영역에 더 가까운 1 내지 20개의 뉴클레오티드인, 블로커 변위 증폭(BDA) 정방향 프라이머, (ii) 표적 게놈 영역에 대한 BDA 블로커로서, 상기 BDA 정방향 프라이머 서열의 3' 말단에서 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하고; 상기 BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하는 것인, BDA 블로커; 및 (iii) 범용 역방향 프라이머; 및 (f) 적어도 2회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 수득하는 단계;를 포함한다. 일부 구현예에서, 상기 방법은 제2 PCR 증폭 산물이 단계 (d)와 단계 (e) 사이에서 정제되는 것인, 정제하는 단계를 더 포함한다. 일부 구현예에서, 상기 방법은 BDA 블로커의 농도가 BDA 정방향 프라이머의 농도의 적어도 2배인 것을 추가로 포함한다.
일 구현예에서, 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 1 내지 10,000개의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법이 본원에 제공되며, 상기 방법은: (a) 표적 게놈 영역을 포함하는 DNA 샘플을 수득하는 단계: (b) 각각의 표적 게놈 영역에 대해, DNA 샘플에 하기를 도입하는 단계, (i) 5'에서 3' 말단으로, 제1 영역, 0 내지 50개의 뉴클레오티드 길이를 갖는 제2 영역, 및 특정 게놈 영역을 표적화하는 제3 영역을 포함하는, 제1 올리고뉴클레오티드; 및 (ii) 5'에서 3' 말단으로, 제4 영역, 0 내지 50개의 뉴클레오티드 길이를 갖는 제5 영역, 적어도 4개의 축퇴성 뉴클레오티드를 포함하는 고유한 분자 식별자(UMI)를 포함하는 제6 영역, 및 특정 게놈 영역을 표적화하는 제7 영역을 포함하는, 제2 올리고뉴클레오티드; (c) 적어도 2회 주기의 PCR 증폭을 수행하여 제1 PCR 증폭 산물을 생성하는 단계; (d) 제1 PCR 증폭 산물에 하기를 도입하는 단계, (i) 제1 영역을 포함하는 제3 올리고뉴클레오티드; 및 (ii) 제4 영역을 포함하는 제4 올리고뉴클레오티드; (e) 적어도 2회 주기의 PCR 증폭을 수행하는 단계로서, 상기 어닐링 온도는 제2 PCR 증폭 산물을 생성하기 위해 단계 (c)에서 사용된 어닐링 온도보다 0.01℃ 내지 10℃ 더 높은 것인, 단계; (f) 제2 PCR 증폭 산물을 정제하여 단일-가닥 프라이머를 제거하는 단계; (g) 단계 (f)에서 수득된 정제된 제2 PCR 증폭 산물에 하기를 도입하는 단계, (i) 특정 게놈 영역을 표적화하는 제8 영역을 포함하는, 각각의 표적 게놈 영역에 대한 제5 올리고뉴클레오티드(블로커 변위 증폭 (BDA) 정방향 프라이머)로서, 상기 제8 영역에 의해 표적화된 게놈 영역은 제3 영역에 의해 표적화된 게놈 영역과 비교하여 제7 영역에 더 가까운 1 내지 20개의 염기인, 제5 올리고뉴클레오티드, (ii) 각각의 표적 게놈 영역에 대한 제6 올리고뉴클레오티드(BDA 블로커)로서, 상기 BDA 정방향 프라이머 서열의 3' 말단에서 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하고; 상기 BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하고, 상기 BDA 블로커의 농도는 BDA 정방향 프라이머의 농도의 적어도 2x인, 제6 올리고뉴클레오티드, 및 (iii) 제4 영역을 포함하는, 제7 올리고뉴클레오티드; 및 (h) 적어도 2회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 생성하는 단계를 포함한다.
일부 측면에서, 상기 단계 (b)에서 제1 올리고뉴클레오티드의 제1 영역 및 단계 (b)에서 제2 올리고뉴클레오티드의 제4 영역은 단계 (d)에서 수행되는 범용 증폭을 위한 결합 부위를 생성한다. 일부 측면에서, 상기 제2 올리고뉴클레오티드의 제4 영역은 차세대 시퀀싱(NGS) 어댑터 서열의 적어도 일부를 포함한다. 일부 측면에서, 상기 제1 및 제4 영역의 용융 온도는 제3 및 제7 영역의 용융 온도보다 0.01℃ 내지 10℃ 더 높다. 일부 측면에서, 상기 제6 영역의 축퇴성 뉴클레오티드는 각각 독립적으로 A, T 또는 C 중 하나이다. 일부 측면에서, 상기 단계 (f)에서의 정제는 SPRI 정제, 컬럼 정제 또는 효소 분해를 포함한다. 일부 측면에서, 상기 단계 (b)는 5'에서 3' 말단으로, 위유전자(pseudogene) 또는 다른 목적하지 않은 게놈 영역을 표적화하는 서열 및 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하는 블로커 올리고뉴클레오티드를 DNA 샘플에 도입하는 단계를 추가로 포함한다.
일부 측면에서, 상기 방법은 (i) 단계 (h)에서 수득된 PCR 증폭 산물에 하기를 도입하는 단계, (i) 5'에서 3' 말단으로, 제9 영역 및 제8 영역을 포함하는, 제8 올리고뉴클레오티드로서, 상기 제9 영역은 차세대 시퀀싱(NGS) 어댑터 서열의 적어도 일부를 포함하는 것인, 제8 올리고뉴클레오티드, 및 선택적으로 (ii) 제4 영역을 포함하는, 제9 올리고뉴클레오티드; 및 (j) 적어도 1회 주기의 PCR 증폭을 수행하는 단계를 추가로 포함한다.
일부 측면에서, 상기 방법은 (i) 단계 (h)에서 수득된 PCR 증폭 산물에 NGS 어댑터 서열을 결찰 반응에 의해 추가하는 단계를 추가로 포함한다.
일부 측면에서, 상기 방법은 PCR에 의해 NGS 인덱스를 추가하고 PCR 증폭 산물을 정제하는 단계를 추가로 포함한다. 일부 측면에서, 상기 정제는 SPRI 정제, 컬럼 정제, 또는 효소 분해를 포함한다.
일부 측면에서, 상기 방법은 고처리량(high-throughput) DNA 시퀀싱을 수행하는 단계를 더 포함한다. 일부 측면에서, 상기 고처리량 DNA 시퀀싱은 차세대 시퀀싱이다.
일 구현예에서, 1 내지 10,000개의 표적 게놈 영역에서 변이체 서열의 변이체 대립유전자 빈도(VAF)를 정량화하기 위한 방법이 본원에 제공되며, 상기 방법은: (a) 표적 게놈 영역에 대한 올리고뉴클레오티드 및 블로커의 패널을 설계하는 단계; (b) 본 구현예 중 임의의 하나의 방법에 따라 표적화된 게놈 영역의 각각의 가닥을 표지화하고 증폭하는 단계; 및 (c) 고처리량 시퀀싱 데이터 및 DNA 샘플의 입력량을 기반으로 변이체 서열의 변이체 대립유전자 빈도(VAF)를 결정하는 단계;를 포함한다.
일부 측면에서, 상기 단계 (a)는 (i) 선택된 각각의 게놈 영역에 대한 프라이머 세트를 설계하는 단계로서; 제1, 제2, 제5, 제6 및 제8 올리고뉴클레오티드를 포함하는 각각의 프라이머 세트는 본 구현예 중 임의의 것에 기재된 바와 같은 것인, 단계; (ii) 선택된 모든 게놈 영역의 범용 증폭에 사용될 제3 및 제4 올리고뉴클레오티드를 설계하는 단계; 및 (iii) 프라이머가 비-표적 영역의 비특이적 증폭을 잘 일으키지 않도록 전체 게놈에서 프라이머 세트의 특이성을 확인하는 단계를 포함한다.
일부 측면에서, 상기 단계 (c)는 (i) NGS 리드를 표적화된 앰플리콘 영역에 정렬하고, NGS 리드를 이들이 정렬된 영역에 따라 영역-특정 하위그룹으로 그룹화하는 단계; (ii) 각각의 유전자좌에서, NGS 리드를 UMI 서열에 따라 나누는 단계로서, 상기 UMI 서열을 수반하는 모든 NGS 리드는 하나의 UMI 패밀리로 그룹화되는 것인, 단계; (iii) PCR 또는 NGS 오류의 결과일 가능성이 있는 UMI 패밀리를 제거하는 단계; (iv) 각각의 남은 UMI 패밀리에 대한 유전자형을 결정하는 단계; (v) 원래 가닥의 수를 나타내는, 각각의 표적화된 유전자 영역에서 각각의 변이체 서열에 대한 고유한 UMI 수 N (하나의 유전자좌에서 상이한 UMI 서열의 총 개수)을 계수하는 단계; 및 (vi) VAF = N var /(N 입력 *수율)로 변이체 서열에 대한 VAF를 계산하는 단계로서, 상기 N var는 변이체 서열에 대한 고유한 UMI 수이고, N 입력 은 QBDA에 대한 DNA 입력의 가닥 수이고, 수율은 QBDA 반응에 대한 전체 전환 수율인 것인, 단계:를 포함한다.
일부 측면에서, 상기 UMI 패밀리는 UMI 서열이 UMI 축퇴성 기반 설계 패턴을 충족하지 않거나 UMI 패밀리가 UMI 패밀리 크기 <F min 을 갖는 경우, PCR 또는 NGS 오류의 결과일 가능성이 있는 것으로 간주되며, 상기 F min 은 2 내지 20이다. 일부 측면에서, 상기 단계 (iv)는 동일한 UMI 패밀리에서 리드의 적어도 70%에 의해 지원되는 유전자형을 결정하는 것을 포함한다. 일부 측면에서, 상기 단계 (iv)는 WT 리드가 UMI 패밀리의 P WT 리드 초과에 의해 지원되는 경우, 유전자형을 야생형(WT)으로 결정하는 것을 포함하고, 상기 P WT는 0.01% 내지 50%이다. 일부 측면에서, 상기 단계 (v)는 더 큰 패밀리 크기를 갖는 다른 UMI와 1개 또는 2개의 염기만 상이한 UMI 서열을 제거하는 단계를 추가로 포함한다.
일 구현예에서, 본 개시는 중합효소 연쇄 반응에 의해 올리고뉴클레오티드 바코드 서열로 적어도 1개의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 키트를 제공하며, 상기 키트는: (a) DNA 중합효소; (b) dNTP; (c) 적어도 하나의 블로커 변위 증폭(BDA) 정방향 프라이머; (d) 적어도 하나의 BDA 블로커; (e) 적어도 하나의 범용 정방향 프라이머; (f) 적어도 하나의 범용 역방향 프라이머; 및 (g) 고유한 분자 식별자를 포함하는 적어도 하나의 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 상기 키트는 DNA 중합효소 버퍼, 뉴클레아제-무함유(nuclease-free) 물, 또는 둘 다를 추가로 포함한다.
본 발명의 다른 목적, 특징 및 이점은 하기 상세한 설명으로부터 명백해질 것이다. 그러나, 당업계의 숙련자에게는 본 발명의 사상 및 범위 내에서 다양한 변경 및 변형이 이 상세한 설명으로부터 명백해질 것이기 때문에, 상세한 설명 및 특정 실시예가 본 발명의 바람직한 구현예를 나타내긴 하지만, 단지 예시로서 제공됨이 이해되어야 한다.
하기 도면은 본 명세서의 일부를 형성하고 본 발명의 특정 측면을 추가로 설명하기 위해 포함된다. 본 발명은 본원에 제시된 특정 구현예의 상세한 설명과 함께 이들 도면 중 하나 이상을 참조함으로써 더 잘 이해될 수 있다.
도 1. 정량적 블로커 변위 증폭(QBDA)의 일 구현을 위한 실험 워크플로우.
도 2a-2b. (도 2a) QBDA 이후에 차세대 시퀀싱을 위한 데이터 분석 워크플로우. 더 큰 패밀리 크기를 갖는 다른 UMI와 유사한 UMI 서열이 있는 패밀리를 제거하는 것은 선택적이다. 이 단계는 UMI 서열에서 중합효소 오류로 인해 발생하는 잘못된 UMI 패밀리의 수를 감소시키는 것을 목표로 한다. (도 2b) 블로커가 프로토콜에 추가될 때 UMI 패밀리 유전자형을 판정하기 위해 WT 거부를 사용하는 이유. 초기 주기에서 중합효소 오류에 의해 생성된 무작위 돌연변이는 WT 분자로부터 유래된 패밀리가 대다수 리드를 변이체 서열로 가질 수 있도록, BDA 동안 농축될 것이다. 이러한 문제를 해결하기 위해, 패밀리에서 WT 리드가 백분율 임계값(Pwt) 초과인 경우, 패밀리는 WT로 판정된다. Pwt는 0.01% - 50%의 범위이다.
도 3. 위유전자의 비-특이적 증폭을 감소시키기 위해 비-특이적 표적(들)에 대한 블로커(들)을 사용한 QBDA를 위한 실험 워크플로우.
본 개시는 올리고뉴클레오티드 바코드 서열로 원래 DNA 샘플의 표적화된 게놈 영역의 각각의 가닥을 표지화하기 위한 정량적 블로커 변위 증폭 (QBDA) 시퀀싱 및 정량화를 위해 표적화된 영역에 걸쳐 DNA 서열 변이체의 선택적 PCR 증폭 방법을 제공한다. 증폭된 DNA는 차세대 시퀀싱으로 분석할 수 있다. 본 방법은 저심도 NGS를 사용하여 희귀 돌연변이 정량화 및 프로파일링을 허용한다. 이전에 개시된 블로커 변위 증폭 (BDA) 방법은 정량화를 위해서는 번거로운 보정 곡선이 요구되지만, QBDA에서는 분자 바코드를 사용하여 무보정 정량화가 달성된다.
본 기술은 저심도 차세대 시퀀싱(NGS)를 사용하여 희귀 돌연변이 정량화 및 프로파일링을 허용한다. 비제한적인 SNP 패널은 상기 기술을 검증하기 위해 설계되었다. 이외에, 또한 비제한적인 예로서, QBDA 패널은 흑색종 핫스팟 돌연변이 부위를 적용하도록 설계되었으며, 정량화 정확성 및 임상적 유용성을 입증하였다.
달리 정의되지 않는 한, 사용되는 모든 기술적 및 과학적 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 용어가 단수형으로 제공되는 경우, 본 발명자들은 그 용어의 복수형으로 기술된 개시의 측면을 또한 고려한다. 참조로 포함된 참고문헌에서 사용되는 용어 및 정의에 불일치가 있는 경우, 본 출원에서 사용된 용어는 본원에 주어진 정의를 가질 것이다. 사용된 다른 기술 용어는 다양한 분야-특정 사전, 예를 들어, "The American Heritage® Science Dictionary"(미국 헤르티지 사전 편집자, 2011, Houghton Mifflin Harcourt, 보스턴 및 뉴욕), "McGraw-Hill Dictionary of Scientific and Technical Terms"(6판, 2002, McGraw-Hill, 뉴욕), 또는 "Oxford Dictionary of Biology"(6판, 2008, Oxford University Press, 옥스포드 및 뉴욕)에 예시된 바와 같이, 이들이 사용되는 기술 분야에서 이들의 일반적인 의미를 갖는다.
예를 들어, 모든 특허, 공개된 특허 출원 및 비특허 간행물을 포함하여, 본원에 인용된 임의의 참고문헌은 그 전체가 참조로 본원에 포함된다.
본원에 제공된 임의의 조성물은 본원에 제공된 임의의 적용가능한 방법과 함께 사용하기 위해 구체적으로 구상된다.
대안의 그룹화가 제시될 때, 대안의 그룹화를 구성하는 구성원 중 임의의 것과 모든 조합이 구체적으로 구상된다. 예를 들어, 항목이 A, B, C 및 D로 이루어진 군으로부터 선택되는 경우, 본 발명자들은 개별적으로 각각의 대안(예를 들어, A 단독, B 단독 등), 뿐만 아니라 A, B 및 D; A 및 C; B 및 C 등과 같은 조합을 구체적으로 구상한다.
수의 범위가 본원에 제공되는 경우, 범위는 범위의 맨 끝 뿐만 아니라 범위의 정의된 맨끝 사이의 임의의 수를 포함하는 것으로 이해된다. 예를 들어, "1 내지 10"은 1과 10, 뿐만 아니라 수 1과 수 10 사이의 임의의 수를 포함한다.
I. 정의
본원에 사용된 바와 같이, "증폭"은 뉴클레오티드 서열 또는 서열들의 카피(copy) 수를 증가시키기 위한 임의의 시험관내 과정을 지칭한다. 핵산 증폭은 뉴클레오티드를 DNA 또는 RNA로 혼입하는 결과로 이어진다. 본원에 사용된 바와 같이, 하나의 증폭 반응은 여러 차례의 DNA 복제로 구성될 수 있다. 예를 들어, 하나의 PCR 반응은 변성 및 복제의 30-100회의 "주기"로 구성될 수 있다.
"중합 효소 연쇄 반응" 또는 "PCR"은 DNA의 상보적인 가닥의 동시 프라이머 연장에 의한 특정 DNA 서열의 시험관내 증폭을 위한 반응을 의미한다. 다시 말해서, PCR은 프라이머 결합 부위에 의해 플랭킹된(flanked) 표적 핵산의 다중 카피 또는 복제물을 만들기 위한 반응이며, 이러한 반응은 하기의 단계의 하나 이상의 반복을 포함한다: (i) 표적 핵산을 변성시키는 단계, (ii) 프라이머 결합 부위에 프라이머를 어닐링하는 단계, (iii) 뉴클레오시드 트리포스페이트의 존재 하에서 핵산 중합효소에 의해 프라이머를 연장하는 단계. 일반적으로, 상기 반응은 열 순환기 기기의 각각의 단계에 최적화된 상이한 온도를 통해 순환된다. 특정 온도, 각각의 단계에서의 지속시간, 및 단계 간의 변화율은 예를 들어, 참고문헌에 예시된 바와 같이 당업계의 숙련자에게 잘 알려진 많은 요인에 따라 달라진다: McPherson 등, 편집자, PCR: A Practical Approach and PCR2: A Practical Approach (각각, IRL Press, Oxford, 1991 및 1995).
"프라이머"는 폴리뉴클레오티드 주형으로 이중체를 형성할 때, 핵산 합성의 개시점으로 작용할 수 있고 상기 주형을 따라 이의 3' 말단으로부터 연장되어 연장된 이중체가 형성될 수 있는 천연 또는 합성 올리고뉴클레오티드를 의미한다. 연장 과정 중에 추가되는 뉴클레오티의 서열은 주형 폴리뉴클레오티드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 중합효소에 의해 연장된다. 프라이머는 일반적으로 프라이머 연장 산물의 합성에 있어서 이의 사용과 호환가능한 길이이며, 일반적으로 8 내지 100개의 뉴클레오티드 길이 범위, 예컨대 10 내지 75개, 15 내지 60개, 15 내지 40개, 18 내지 30개, 20 내지 40개, 21 내지 50개, 22 내지 45개, 25 내지 40개 등, 보다 전형적으로 18 내지 40개, 20 내지 35개, 21 내지 30개의 뉴클레오티드 길이 범위, 및 명시된 범위 사이의 임의의 길이이다. 전형적인 프라이머는 15 내지 45개, 18 내지 40개, 20 내지 30개, 21 내지 25개 등과 같은 10 내지 50개의 뉴클레오티드 길이 범위 및 명시된 범위 사이의 임의의 길이일 수 있다. 일부 구현예들에서, 상기 프라이머는 일반적으로 약 10개, 12개, 15개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개 또는 70개 이하의 뉴클레오티드 길이이다.
본원에 사용된 바와 같이, "혼입하는"은 핵산 중합체의 일부가 되는 것을 의미한다.
본원에 사용된 바와 같이, 용어 "외인성 조작의 부재 하에"는 핵산 분자가 변형되는 용액을 변경하지 않고 핵산 분자의 변형이 있음을 지칭한다. 특정 구현예에서, 이는 사람 손 사용의 부재 하에 또는 버퍼 조건으로도 지칭될 수 있는 용액 조건을 변경하는 기계의 부재 하에 발생한다. 그러나, 온도 변화는 변형 중에 발생할 수 있다.
"뉴클레오시드"는 염기-당 조합, 즉, 포스페이트가 결여된 뉴클레오티드이다. 용어 뉴클레오시드 및 뉴클레오티드의 사용에 있어서 특정 상호교환성(inter-changeability)이 있음이 당업계에서 인식된다. 예를 들어, 뉴클레오티드 데옥시우리딘 트리포스페이트, dUTP는 데옥시리보뉴클레오시드 트리포스페이트이다. DNA에 혼입 후, 이는 공식적으로 데옥시우리딜레이트, 즉, dUMP 또는 데옥시우리딘 모노포스페이트인 DNA 단량체의 역할을 한다. 결과로서 생성된 DNA에 dUTP 모이어티가 없더라도 dUTP를 DNA에 혼입한다고 말할 수 있다. 유사하게, 비록 기질 분자의 일부일지라도 데옥시우리딘을 DNA에 혼입한다고 말할 수 있다.
본원에서 사용된 "뉴클레오티드"는 염기-당-포스페이트 조합을 지칭하는 기술 용어이다. 뉴클레오티드는 핵산 중합체, 즉 DNA 및 RNA의 단량체 단위이다. 상기 용어는 리보뉴클레오티드 트리포스페이트, 예컨대 rATP, rCTP, rGTP 또는 rUTP, 및 데옥시리보뉴클레오티드 트리포스페이트, 예컨대 dATP, dCTP, dUTP, dGTP 또는 dTTP를 포함한다.
용어 "핵산" 또는 "폴리뉴클레오티드"는 일반적으로 예를 들어 DNA(예를 들어, 아데닌 "A", 구아닌 "G", 티민 "T" 및 시토신 "C") 또는 RNA(예를 들어, A, G, 우라실 "U" 및 C)에서 발견되는 천연 발생 퓨린 또는 피리미딘 염기와 같은 적어도 하나의 핵염기를 포함하는 DNA, RNA, DNA-RNA 키메라 또는 이의 유도체 또는 유사체의 적어도 하나의 분자 또는 가닥을 지칭할 것이다. 용어 "핵산"은 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"를 포함한다. 본원에 사용된 바와 같이, "올리고뉴클레오티드"는 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"라는 두 가지 기술 용어를 집합적으로 그리고 상호교환적으로 언급한다. 올리고뉴클레오티드 및 폴리뉴클레오티드는 별개의 기술 용어이지만, 두 용어 사이에 정확한 경계선이 없으며 이들은 본원에서 상호교환적으로 사용된다는 점에 유의한다. 용어 "어댑터"는 또한 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"와 상호교환적으로 사용될 수 있다. 또한, 용어 "어댑터"는 선형 어댑터(단일 가닥 또는 이중 가닥) 또는 스템-루프(stem-loop) 어댑터를 나타낼 수 있다. 이러한 정의는 일반적으로 적어도 하나의 단일 가닥 분자를 지칭하지만, 특정 구현예에서는 또한 적어도 하나의 단일 가닥 분자에 부분적으로, 실질적으로 또는 완전히 상보적인 적어도 하나의 추가 가닥을 포함할 것이다. 따라서, 핵산은 분자의 가닥을 포함하는 특정 서열의 하나 이상의 상보적인 가닥(들) 또는 "상보체(들)"를 포함하는 적어도 하나의 이중 가닥 분자 또는 적어도 하나의 삼중 가닥 분자를 포함할 수 있다. 본원에 사용된 바와 같이, 단일 가닥 핵산은 접두사 "ss"로, 이중 가닥 핵산은 접두사 "ds"로, 그리고 삼중 가닥 핵산은 접두사 "ts"로 표시될 수 있다.
"핵산 분자" 또는 "핵산 표적 분자"는 표준 정규 염기, 과변형(hypermodified) 염기, 비-천연 염기, 또는 이의 임의의 염기의 조합을 포함하는 임의의 단일 가닥 또는 이중 가닥 핵산 분자를 지칭한다. 예를 들어 그리고 제한 없이, 핵산 분자는 4개의 정규 DNA 염기 - 아데닌, 시토신, 구아닌 및 티민, 및/또는 4개의 정규 RNA 염기 - 아데닌, 시토신, 구아닌 및 우라실을 함유한다. 우라실은 뉴클레오시드가 2'-데옥시리보스 기를 함유할 때 티민으로 대체될 수 있다. 핵산 분자는 RNA에서 DNA로, 그리고 DNA에서 RNA로 변형될 수 있다. 예를 들어, 그리고 제한 없이, mRNA는 역전사효소를 사용하여 상보적인 DNA(cDNA)로 생성될 수 있고, DNA는 RNA 중합효소를 사용하여 RNA로 생성될 수 있다. 핵산 분자는 생물학적 또는 합성 기원일 수 있다. 핵산 분자의 예는 게놈 DNA, cDNA, RNA, DNA/RNA 하이브리드, 증폭된 DNA, 기존 핵산 라이브러리 등을 포함한다. 핵산은 인간 샘플, 예컨대 혈액, 혈청, 혈장, 뇌척수액, 뺨 찰과상, 생검, 정액, 소변, 대변, 타액, 땀 등으로부터 수득될 수 있다. 핵산 분자는 다양한 처리, 예컨대 수복 처리 및 단편화 처리를 실시할 수 있다. 단편화 처리는 기계적, 음파 및 유체역학적 전단을 포함한다. 수복 처리는 연장 및/또는 결찰을 통한 흠집 수복, 무딘 말단을 생성하기 위한 연마, 손상된 염기의 제거, 예컨대 탈아미노화, 유도체화, 염기성 또는 가교된 뉴클레오티드 등을 포함한다. 관심 핵산 분자는 또한 화학적 변형(예를 들어, 중아황산염 전환, 메틸화/탈메틸화), 연장, 증폭(예를 들어, PCR, 등온 등) 등이 실시될 수 있다.
"상보적인" 또는 "상보체(들)"인 핵산(들)은 표준 왓슨-크릭(Watson-Crick), 후그스틴(Hoogsteen) 또는 역 후그스틴 결합 상보성 규칙에 따라 염기쌍이 가능할 수 있는 것들이다. 본원에서 사용된 용어 "상보적인" 또는 "상보체(들)"은 상기 기재된 동일한 뉴클레오티드 비교에 의해 평가될 수 있는 바와 같이, 실질적으로 상보적인 핵산(들)을 지칭할 수 있다. 용어 "실질적으로 상보적인"은 연속적인 핵염기, 또는 하나 이상의 핵염기 모이어티가 분자에 존재하지 않는 경우 반연속적인 핵염기의 적어도 하나의 서열을 포함하는 핵산을 지칭할 수 있으며, 전체보다 적은 핵염기가 대응하는 핵염기와 염기쌍을 이루지 않더라도 적어도 하나의 핵산 가닥 또는 이중체에 혼성화될 수 있다. 특정 구현예에서, "실질적으로 상보적인" 핵산은 핵염기 서열의 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 77%, 약 78%, 약 79%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 약 100%까지, 및 그 안에서 임의의 범위가 혼성화 동안 적어도 하나의 단일 또는 이중 가닥 핵산 분자와 염기쌍을 형성할 수 있는 적어도 하나의 서열을 함유한다. 특정 구현예에서, 용어 "실질적으로 상보적인"은 엄격한 조건에서 적어도 하나의 핵산 가닥 또는 이중체에 혼성화될 수 있는 적어도 하나의 핵산을 지칭한다. 특정 구현예에서, "부분적으로 상보적인" 핵산은 낮은 엄격성 조건에서 적어도 하나의 단일 또는 이중 가닥 핵산에 혼성화될 수 있는 적어도 하나의 서열을 포함하거나, 약 70% 미만의 핵염기 서열이 혼성화 동안 적어도 하나의 단일 또는 이중 가닥 핵산 분자와 염기쌍을 형성할 수 있는 적어도 하나의 서열을 함유한다. 특정 구현예에서, "상보적인" 핵산은 핵염기 서열의 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%까지, 및 그 안에서 임의의 범위가 혼성화 동안 적어도 하나의 단일 또는 이중 가닥 핵산 분자와 염기쌍을 형성할 수 있는 적어도 하나의 서열을 함유한다.
용어 "비-상보적인"은 특정 수소 결합을 통해 적어도 하나의 왓슨-크릭 염기쌍을 형성하는 능력이 결여된 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "축퇴성"은 정의된 서열과는 대조적으로, 동일성이 다양한 선택의 뉴클레오티드로부터 선택될 수 있는 뉴클레오티드 또는 일련의 뉴클레오티드를 지칭한다. 특정 구현예에서, 2개 이상의 상이한 뉴클레오티드로부터 선택될 수 있다. 추가적인 특정 구현예에서, 하나의 특정 위치에서 뉴클레오티드의 선택은 퓨린 단독, 피리미딘 단독, 또는 쌍을 이루지 않는 퓨린 및 피리미딘으로부터의 선택을 포함한다.
본원에 사용된 바와 같이, 용어 "블로커 올리고뉴클레오티드"는 약 12 내지 약 100개의 뉴클레오티드 길이의 적어도 하나의 연속적인 가닥을 지칭하며, 본원에 그렇게 명시되어 있는 경우, 증폭 과정 예컨대 중합효소 연쇄 반응 동안 효소 연장을 방지하는 작용기 또는 뉴클레오티드 서열을 3' 말단에 추가로 포함할 수 있다.
본원에 사용된 바와 같이, 용어 "프라이머 올리고뉴클레오티드"는 약 12개 내지 약 100개의 뉴클레오티드 길이의 적어도 하나의 연속적인 가닥을 포함하고, 증폭 과정 예컨대 중합효소 연쇄 반응 동안 효소적 연장을 허용하기에 충분한 분자를 지칭한다.
본원에 사용된 바와 같이, 용어 "표적-중립적 부분서열"은 표적 핵산 및 변이체 핵산 둘 다의 서열에 상보적인 뉴클레오티드의 서열을 지칭한다. 예를 들어, 증폭을 위해 표적화되는 목적한 핵산 서열(표적 핵산)은 변이성 영역(변이체 핵산)을 제외하고 표적 핵산과 대부분 상동성 서열을 갖는 핵산 분자를 포함하는 샘플에 존재할 수 있으며, 일부 경우에 이러한 변이성 영역은 표적 핵산과 단일 뉴클레오티드의 차이만이 존재한다. 이러한 예에 있어서, 표적-중립적 부분서열은 2개의 핵산 간에 공유되는 상동성 서열의 적어도 일부에 상보적이지만, 변이성 영역은 아니다. 따라서, 본원에 사용된 바와 같이, 용어 "블로커 변이성 부분서열"은 변이체 핵산의 변이성 영역에 상보적인 블로커 올리고뉴클레오티드의 뉴클레오티드 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "중첩 부분서열"은 본원에 기술된 바와 같은 조성물에 사용된 블로커 올리고뉴클레오티드 서열의 일부와 상동인 프라이머 올리고뉴클레오티드의 적어도 5개의 뉴클레오티드의 뉴클레오티드 서열을 지칭한다. 프라이머 올리고뉴클레오티드의 중첩 부분서열은 블로커 변이성 부분서열의 5' 또는 3'에 상관없이 블로커 올리고뉴클레오티드의 표적-중립적 부분서열의 임의의 부분과 상동성일 수 있다. 따라서, 용어 "비중첩 부분서열"은 중첩 부분서열이 아닌 프라이머 올리고뉴클레오티드의 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "표적 서열" 또는 "표적 게놈 영역"은 증폭되거나, 식별되거나, 또는 이외에 단리되는 단일 뉴클레오티드 다형성과 같은 목적한 대립유전자를 포함하는 핵산의 뉴클레오티드 서열을 지칭한다. 본원에 사용된 바와 같이, 용어 "변이체 서열"는 목적한 대립유전자를 포함하지 않는 핵산의 뉴클레오티드 서열을 지칭한다. 예를 들어, 일부 경우에, 변이체 서열은 야생형 대립유전자를 포함하는 반면 표적 서열은 돌연변이 대립유전자를 포함한다. 따라서, 일부 경우에, 변이체 서열 및 표적 서열은 목적한 대립유전자, 뉴클레오티드 또는 그룹 또는 그 둘 사이에서 변이되는 뉴클레오티드를 포함하는 영역을 제외하고 각각의 서열이 실질적으로 상동일 수 있도록 게놈의 공통 유전자좌로부터 유래된다. 한 측면에서, 변이체 서열은 야생형 서열 또는 대립유전자와 비교하여 단일 뉴클레오티드 다형성(SNP)을 포함한다. 한 측면에서, 변이체 서열은 야생형 서열 또는 대립유전자와 비교하여 적어도 하나의 뉴클레오티드의 삽입을 포함한다. 한 측면에서, 변이체 서열은 야생형 서열 또는 대립유전자와 비교하여 적어도 하나의 뉴클레오티드의 결실을 포함한다. 한 측면에서, 변이체 서열은 야생형 서열 또는 대립유전자와 비교하여 적어도 2개의 뉴클레오티드의 역전을 포함한다.
일부 구현예에서, 본원에 제공된 방법은 1 내지 25,000개, 1 내지 20,000개, 1 내지 15,000개, 1 내지 10,000개, 1 내지 7500개, 1 내지 5000개, 1 내지 2500개, 1 내지 1000개, 1 내지 750개, 1 내지 500개, 1 내지 250개, 1 내지 100개, 1 내지 75개, 1 내지 50개, 1 내지 25개, 10 내지 100개, 10 내지 75개, 10 내지 50개, 50 내지 100개, 100 내지 10,000개, 또는 1000 내지 10,000개의 표적 게놈 영역의 각각의 가닥을 표지(label)하고 증폭한다. 일부 구현예에서, 본원에 제공된 방법은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 250개, 500개, 750개, 1000개, 2500개, 5000개, 7500개, 10,000개, 또는 15,000개의 표적 게놈 영역의 각각의 가닥을 표지하고 증폭한다.
인간 게놈으로부터의 표적 서열의 비제한적인 예는 AKT1, ALK, APC, AR, ATM, BRAF, CCND1, CDK4, CDKN2A, CHEK2, CTNNB1, DDR2, EGFR, ERBB2, ERBB3, ERBB4, ESR1, EZH2, FBXW7, FGFR1, FGFR2, FGFR3, FGFR4, FLT3, FOXL2, GNA11, GNAQ, GNAS, HRAS, IDH1, JAK1, JAK2, JAK3, KIT, KRAS, MAP2K1, MAP2K2, MET, MLH1, MPL, MTOR, MYC, MYCN, MYD88, NPM1, NRAS, PDGFRA, PIK3CA, PTEN, PTPN11, RAF1, RB1, RET, ROS1, SF3B1, SMAD4, SMARCB1, SMO, STK11, 및 TP53을 포함한다. 한 측면에서, 표적 서열은 AKT1, ALK, APC, AR, ATM, BRAF, CCND1, CDK4, CDKN2A, CHEK2, CTNNB1, DDR2, EGFR, ERBB2, ERBB3, ERBB4, ESR1, EZH2, FBXW7, FGFR1, FGFR2, FGFR3, FGFR4, FLT3, FOXL2, GNA11, GNAQ, GNAS, HRAS, IDH1, JAK1, JAK2, JAK3, KIT, KRAS, MAP2K1, MAP2K2, MET, MLH1, MPL, MTOR, MYC, MYCN, MYD88, NPM1, NRAS, PDGFRA, PIK3CA, PTEN, PTPN11, RAF1, RB1, RET, ROS1, SF3B1, SMAD4, SMARCB1, SMO, STK11, 및 TP53으로 이루어진 군으로부터 선택된다.
"샘플"은 관심 핵산을 포함하는 신선하거나 보존된 생물학적 샘플 또는 합성적으로 생성된 공급원으로부터 수득되거나 분리된 물질을 의미한다. 샘플은 관심 면역 핵산을 함유하는 것으로 의심되는 적어도 하나의 세포, 태아 세포, 세포 배양물, 조직 표본, 혈액, 혈청, 혈장, 타액, 소변, 눈물, 질 분비물, 땀, 림프액, 뇌척수액, 점막 분비물, 복막액, 복수액, 분변물, 신체 삼출물, 제대혈, 융모막 융모, 양수, 배아 조직, 다세포 배아, 용해물, 추출물, 용액 또는 반응 혼합물을 포함할 수 있다. 한 측면에서, 샘플은 인간으로부터 수득된다. 한 측면에서, 샘플은 동물로부터 수득된다. 한 측면에서, 샘플은 식물로부터 수득된다. 한 측면에서, 샘플은 진균으로부터 수득된다. 한 측면에서, 샘플은 원생동물로부터 수득된다. 한 측면에서, 샘플은 박테리아로부터 수득된다. 한 측면에서, 샘플은 바이러스로부터 수득된다. 한 측면에서, 동물은 포유동물, 어류, 조류, 도마뱀류, 양서류, 및 무척추동물로 이루어진 군으로부터 선택된다. 한 측면에서, 포유동물은 비-인간 영장류, 설치류, 유대류, 토끼목, 고양이과, 개과 및 유제류로 이루어진 군으로부터 선택된다.
한 측면에서, 샘플은 게놈 DNA(gDNA)를 포함한다. 한 측면에서, 샘플은 포르말린-고정된 파라핀-포매 DNA(FFPE DNA)를 포함한다. 한 측면에서, 샘플은 순환 유리 DNA(cfDNA)를 포함한다. DNA를 포함하는 샘플은 "DNA 샘플"로 지칭될 수 있다.
한 측면에서, 샘플은 적어도 10 ng, 15 ng, 20 ng, 25 ng, 30 ng, 40 ng, 50 ng, 60 ng, 70 ng, 80 ng, 90 ng, 또는 100 ng의 핵산을 포함한다. 한 측면에서, 샘플은 적어도 10 ng, 15 ng, 20 ng, 25 ng, 30 ng, 40 ng, 50 ng, 60 ng, 70 ng, 80 ng, 90 ng, 또는 100 ng의 DNA를 포함한다. 한 측면에서, 샘플은 적어도 10 ng, 15 ng, 20 ng, 25 ng, 30 ng, 40 ng, 50 ng, 60 ng, 70 ng, 80 ng, 90 ng, 또는 100 ng의 gDNA를 포함한다. 한 측면에서, 샘플은 적어도 10 ng, 15 ng, 20 ng, 25 ng, 30 ng, 40 ng, 50 ng, 60 ng, 70 ng, 80 ng, 90 ng, 또는 100 ng의 FFPE DNA를 포함한다. 한 측면에서, 샘플은 적어도 10 ng, 15 ng, 20 ng, 25 ng, 30 ng, 40 ng, 50 ng, 60 ng, 70 ng, 80 ng, 90 ng, 또는 100 ng의 cfDNA를 포함한다.
한 측면에서, 샘플은 5 ng 내지 100 ng, 5 ng 내지 75 ng, 5 ng 내지 50 ng, 5 ng 내지 40 ng, 5 ng 내지 30 ng, 5 ng 내지 20 ng, 또는 5 ng 내지 10 ng의 핵산을 포함한다. 한 측면에서, 샘플은 5 ng 내지 100 ng, 5 ng 내지 75 ng, 5 ng 내지 50 ng, 5 ng 내지 40 ng, 5 ng 내지 30 ng, 5 ng 내지 20 ng, 또는 5 ng 내지 10 ng의 DNA를 포함한다. 한 측면에서, 샘플은 5 ng 내지 100 ng, 5 ng 내지 75 ng, 5 ng 내지 50 ng, 5 ng 내지 40 ng, 5 ng 내지 30 ng, 5 ng 내지 20 ng, 또는 5 ng 내지 10 ng의 gDNA를 포함한다. 한 측면에서, 샘플은 5 ng 내지 100 ng, 5 ng 내지 75 ng, 5 ng 내지 50 ng, 5 ng 내지 40 ng, 5 ng 내지 30 ng, 5 ng 내지 20 ng, 또는 5 ng 내지 10 ng의 FFPE DNA를 포함한다. 한 측면에서, 샘플은 5 ng 내지 100 ng, 5 ng 내지 75 ng, 5 ng 내지 50 ng, 5 ng 내지 40 ng, 5 ng 내지 30 ng, 5 ng 내지 20 ng, 또는 5 ng 내지 10 ng의 cfDNA를 포함한다.
뉴클레오티드 서열과 관련하여 본원에 사용된 바와 같이 "실질적으로 알려진"은 증폭을 포함하여, 핵산 분자의 제조를 허용하기 위해 충분한 서열 정보를 갖는 것을 지칭한다. 이는 일부 구현예에서 어댑터 서열의 일부 부분이 무작위적이거나 축퇴되더라도, 전형적으로 약 100%일 것이다. 따라서, 특정 구현예에서, 실질적으로 알려진은 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 약 97% 내지 약 100%, 약 98% 내지 약 100%, 또는 약 99% 내지 약 100%를 지칭한다.
본원에 사용된 바와 같이, 특정 성분의 관점에서 "본질적으로 없는"은 특정 성분 중 그 어느 것도 조성물로 의도적으로 제형화되지 않았고/않았거나 단지 오염물질로서 또는 미량으로 존재한다는 것을 의미하는 것으로 본원에 사용된다. 따라서, 조성물의 임의의 의도하지 않은 오염으로 인한 특정 성분의 총량은 0.05% 보다 훨씬 낮고, 바람직하게는 0.01% 미만이다. 상기 특정 성분의 양이 표준 분석 방법으로 검출될 수 없는 조성물이 가장 바람직하다.
본 명세서에 사용된 바와 같이, "한(a)" 또는 "하나의(an)"는 하나 이상을 의미할 수 있다. 본원의 청구범위(들)에서 사용된 바와 같이, 단어 "포함하는"과 함께 사용되는 경우, 단어 "한(a)" 또는 "하나의(an)"는 하나 또는 하나 초과를 의미할 수 있다.
비록 본 개시가 단지 대안 및 "및/또는"을 지칭하는 정의를 지원하더라도, 청구범위에서 용어 "또는"의 사용은 대안만을 지칭하거나 대안이 상호배타적임을 명시적으로 나타내지 않는 한, "및/또는"을 의미하는 데 사용된다. 본원에 사용된 바와 같이 "또 다른"은 적어도 두 번째 또는 그 이후의 것들을 의미할 수 있다.
본 출원 전반에 걸쳐, 용어 "약"은 값이 장치, 상기 값을 결정하는 데 사용되는 방법에 대한 고유한 오류의 변동, 연구 대상체 중에 존재하는 변동, 또는 명시된 값의 10% 이내인 값을 포함함을 나타내기 위해 사용된다.
II. 정량적 블로커 변위 증폭(QBDA) 라이브러리 제조 워크플로우
QASeq NGS 라이브러리 제조 워크플로우의 개략도를 도 1에 나타낸다. DNA 샘플은 Qubit 또는 qPCR에 의해 정량화하여 입력량을 결정한다. 인간 게놈 DNA의 경우, 1 ng DNA는 약 290개의 반수체 게놈 등가물 (또는 580개 가닥)로 간주된다.
각각의 증폭 단계에 대해, 모든 유형의 DNA 중합효소 및 PCR 슈퍼 혼합물이 사용될 수 있으며, 바람직하게는 달리 언급되지 않는 한, 사용된 특정 중합효소에 대한 표준 어닐링, 연장 및 변성 온도를 사용한다.
A. UMI 추가
첫째, UMI 추가 단계가 수행된다. DNA 샘플은 특이적 정방향 프라이머 (SfP), 특이적 역방향 프라이머 (SrP), DNA 중합효소, dNTP 및 PCR 버퍼와 혼합된다. 긴 연장 시간(약 30분)을 이용한 2회의 PCR 주기가 모든 표적 영역에 UMI의 추가를 위해 수행되며; 하나의 DNA 분자의 각각의 가닥은 상이한 UMI를 수반할 것이다. 긴 연장 시간은 약 10분(분), 11분, 12분, 13분, 14분, 15분, 16분, 17분, 18분, 19분, 20분, 21분, 22분, 23분, 24분, 25분, 26분, 27분, 28분, 29분, 30분, 31분, 32분, 33분, 34분, 35분, 36분, 37분, 38분, 39분, 40분, 41분, 42분, 43분, 44분, 또는 45분일 수 있으며, 바람직하게는 약 30분일 수 있다. 긴 연장 시간은 약 10분 내지 약 45분, 약 10분 내지 약 40분, 약 10분 내지 약 35분, 약 10분 내지 약 30분, 약 15분 내지 약 45분, 약 15분 내지 약 40분, 약 15분 내지 약 35분, 약 15분 분 내지 약 30분, 약 15분 내지 약 25분, 약 20분 내지 약 45분, 약 20분 내지 약 40분, 약 20분 내지 약 35분, 약 20분 내지 약 30분, 약 25분 내지 약 30분 약 45분, 약 25분 내지 약 40분, 약 25분 내지 약 35분의 범위 내, 또는 그 안에서 추론할 수 있는 임의의 범위 또는 값일 수 있다.
특이적 정방향 프라이머(SfP)는 5'에서 3'으로, 영역 1, 2 및 3을 포함한다. 영역 3은 주형-결합 영역이고; 영역 2는 상이한 유전자좌의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(전형적으로 0 내지 15개의 뉴클레오티드(nt))이고; 영역 1은 범용 프라이머 결합 부위이다. SrP는 5'에서 3'으로, 영역 4, 5, 6 및 7을 포함한다. 영역 7은 주형-결합 영역이고; 영역 6은 상이한 유전자좌의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(전형적으로 0 내지 15개의 nt)이고; 영역 5는 UMI 영역이고; 영역 4는 범용 프라이머 결합 부위이다. 전체 인간 게놈 뉴클레오티드 서열은 프라이머가 비-표적 영역의 비특이적 증폭을 잘 일으키지 않도록 검색될 수 있다.
UMI의 개념은 각각의 NGS 리드의 기원을 바코드 서열에 기초하여 추적할 수 있도록, 모든 원래 DNA 분자에 상이한 DNA 서열을 "바코드"로서 부여하는 것이다. 충분한 NGS 리드가 부여되면, NGS 출력에서 발견되는 고유한 UMI의 수는 원래 DNA 분자의 수를 반영할 수 있다. 각각의 원래 분자를 고유하게 표지화하는 것은 다수의 상이한 UMI 서열을 사용하여 달성되며; 예를 들어, 100,000개의 원래 분자에 대해 109개의 상이한 UMI 서열을 사용하면 반복된 UMI를 수반하는 <0.006% 분자를 생성할 것이다.
한 측면에서, UMI 서열은 적어도 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 35개, 40개, 45개, 또는 50개의 뉴클레오티드를 포함한다. 한 측면에서, UMI는 7 내지 30개, 5 내지 40개, 15 내지 25개, 또는 10 내지 20개의 뉴클레오티드를 포함한다.
축퇴성 염기를 함유하는 DNA 서열, 예컨대 폴리(N)(즉, 각각의 위치에서 A, T, C 또는 G의 혼합)은 종종 UMI 서열로 사용된다. QASeq에서, 폴리(H)(즉, 각각의 위치에서 A, T 또는 C의 혼합으로서)는 폴리(N) 또는 S(C 또는 G) 및 W(A 또는 T) 염기의 혼합과 비교하여 교차-결합 에너지가 약하기 때문에 UMI로 사용된다. (H)20은 입력으로서 100,000개의 분자에 충분한, 3.5 × 109개의 상이한 서열을 포함하고; (H)15는 입력으로서 6,000개의 분자에 충분한, 1.4 × 107개의 상이한 서열을 포함한다.
한 측면에서, UMI 서열은 하나 이상의 축퇴성 뉴클레오티드 (또는 염기)를 포함한다. 축퇴성 뉴클레오티드의 비제한적인 예는 C, G, 또는 T 뉴클레오티드 (B); A, G, 또는 T 뉴클레오티드 (D); A, C, 또는 T 뉴클레오티드 (H); G 또는 T 뉴클레오티드 (K); A 또는 C 뉴클레오티드 (M); 임의의 뉴클레오티드 (N); A 또는 G 뉴클레오티드 (R); G 또는 C 뉴클레오티드 (S); A, C, 또는 G 뉴클레오티드 (V); A 또는 T 뉴클레오티드 (W), 및 C 또는 T 뉴클레오티드 (Y)를 포함한다. 한 측면에서, UMI 서열의 각각의 축퇴성 뉴클레오티드는 N, B, D, H, V, S, W, Y, R, M 및 K로 이루어진 군으로부터 선택된다. 한 측면에서, UMI 서열의 모든 축퇴성 뉴클레오티드는 H이다.
일부 경우에, 유사하지만 원치 않는 서열, 예컨대 위유전자 서열에 UMI의 추가를 방지하기 위해 UMI 추가 동안 역방향 블로커를 포함하는 것이 바람직할 수 있다. 이 경우에, 역방향 블로커는 블로커 변위 증폭 단계를 위한 BDA 블로커 설계와 관련하여 제공된 설계 기준에 따라 설계되고 사용될 수 있다.
B. 범용 증폭
둘째, 범용 증폭 단계가 수행된다. 분자를 증폭하고, 정제 중 샘플 손실을 피하면서 동일한 원래 분자에 다수의 UMI 추가를 방지하기 위해, 어닐링 온도를 약 0.01℃, 약 0.1℃, 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 또는 약 10℃로 상승시키고, 짧은 연장 시간과 더불어 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 사용하여 약 2회 주기, 약 3회 주기, 약 4회 주기, 약 5회 주기, 약 6회 주기, 약 7회 주기, 약 8회 주기, 약 9회 주기, 또는 약 10회 주기를 수행한다. 바람직하게는, 어닐링 온도를 약 8℃ 상승시킨다. 바람직하게는, 약 7회 주기를 수행한다. 짧은 연장 시간은 약 10초(초), 11초, 12초, 13초, 14초, 15초, 16초, 17초, 18초, 19초, 20초, 21초, 22초, 23초, 24초, 25초, 26초, 27초, 28초, 29초, 30초, 31초, 32초, 33초, 34초, 35초, 36초, 37초, 38초, 39초, 40초, 41초, 42초, 43초, 44초, 또는 45초일 수 있으며, 바람직하게는 약 30초일 수 있다. 짧은 연장 시간은 약 10초 내지 약 45초, 약 10초 내지 약 40초, 약 10초 내지 약 35초, 약 10초 내지 약 30초, 약 15초 내지 약 45초, 약 15초 내지 약 40초, 약 15초 내지 약 35초, 약 15초 내지 약 30초, 약 15초 내지 약 25초, 약 20초 내지 약 45초, 약 20초 내지 약 40초, 약 20초 내지 약 35초, 약 20초 내지 약 30초, 약 25초 내지 약 45초, 약 25초 내지 약 40초, 약 25초 내지 약 35초의 범위 내, 또는 그 안에서 추론할 수 있는 임의의 범위 또는 값일 수 있다.
한 측면에서, 어닐링 온도는 본원에 제공된 방법에서 연속적인 PCR 증폭 사이에 0.01℃ 내지 15℃, 0.01℃ 내지 10℃, 0.01℃ 내지 8℃, 0.01℃ 내지 5℃, 0.01℃ 내지 2℃ 또는 0.01℃ 내지 1℃로 상승시킨다. 한 측면에서, 어닐링 온도는 본원에 제공된 방법에서 연속적인 PCR 증폭 사이에 동일하다(예를 들어, 변경되지 않음). 한 측면에서, 용융 온도는 본원에 제공된 방법에서 연속적인 PCR 증폭 사이에 0.01℃ 내지 15℃, 0.01℃ 내지 10℃, 0.01℃ 내지 8℃, 0.01℃ 내지 5℃, 0.01℃ 내지 2℃ 또는 0.01℃ 내지 1℃로 상승시킨다. 한 측면에서, 용융 온도는 본원에 제공된 방법에서 연속적인 PCR 증폭 사이에 동일하다(예를 들어, 변경되지 않음).
반응에 UfP 및 UrP의 추가는 열순환기 상의 개방형-튜브 단계이다. 각각의 QBDA 패널은 하나의 범용 정방향 프라이머(UfP) 및 하나의 범용 역방향 프라이머(UrP)만을 필요로 한다. UfP는 영역 1을 포함하고, UrP는 영역 4를 포함하며; UfP 또는 UrP에서 영역 1 또는 영역 4의 5'-말단에 추가 염기가 있을 수 있다. 일부 구현예에서, UfP의 영역 1의 5'-말단은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 20개, 또는 25개의 추가 염기를 포함할 수 있다. 일부 구현예에서, UfP의 영역 1의 5'-말단은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 20개, 또는 25개의 추가 염기를 포함할 수 있다. 일부 구현예에서, UfP의 영역 4의 5'-말단은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 20개, 또는 25개의 추가 염기를 포함할 수 있다. 일부 구현예에서, UrP의 영역 4의 5'-말단은 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 20개, 또는 25개의 추가 염기를 포함할 수 있다.
범용 증폭 단계 후, 정제를 수행하여 SfP, SrP, UfP 및 UrP를 포함하는 단일 가닥 프라이머를 제거한다. 일부 구현예에서, 정제는 SPRI 자기 비드, 컬럼, 또는 효소 분해를 사용하는 것으로 이루어진 군으로부터 선택된 방법을 수반한다.
C. 블로커 변위 증폭(BDA)
셋째, 블로커 변위 증폭(BDA)을 수행한다. BDA 정방향 프라이머, BDA 블로커, DNA 중합효소, dNTP, 및 PCR 버퍼는 BDA 증폭을 위해 정제된 PCR 산물과 혼합한다. BDA 정방향 프라이머는 SrP에 결합하는 영역보다 SfP에 결합하는 영역에 더 가까운 게놈 영역에 어닐링한다. 일부 구현예에서, 핵산 증폭을 달성하기에 충분한 조건 하에서 BDA 증폭의 적어도 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회, 10회, 11회, 12회, 13회, 14회, 15회, 16회, 17회, 18회, 19회, 20회, 21회, 22회, 23회, 24회, 25회, 26회, 27회, 28회, 29회, 30회, 또는 35회 주기를 수행한 후, PCR 증폭 산물을 SPRI 자기 비드 또는 컬럼으로 정제한다. 일부 구현예에서, 핵산 증폭을 달성하기에 충분한 조건 하에서 2 내지 30회, 2 내지 25회, 2 내지 23회, 2 내지 20회, 2 내지 15회, 4 내지 30회, 4 내지 25회, 4 내지 23회, 4 내지 20회, 4 내지 15회, 6 내지 30회, 6 내지 25회, 6 내지 23회, 6 내지 20회, 6 내지 15회, 8 내지 30회, 8 내지 25회, 8 내지 23회, 8 내지 20회, 8 내지 15회, 10 내지 30회, 10 내지 25회, 10 내지 23회, 10 내지 20회, 10 내지 15회, 또는 2 내지 40회 주기의 BDA 증폭을 수행한다. 일부 구현예에서, PCR 증폭 산물은 SPRI 자기 비드 또는 컬럼으로 정제한다. 바람직하게는, 핵산 증폭을 달성하기에 충분한 조건 하에서 10 내지 23회 주기의 BDA 증폭을 수행한 후, PCR 반응 혼합물을 SPRI 자기 비드 또는 컬럼으로 정제한다.
BDA 블로커는 표적-중립적 부분서열 및 블로커 변이성 부분서열을 갖는 제1 서열을 포함할 수 있다. 일부 측면에서, 변이성 부분서열은 적어도 1개의 뉴클레오티드, 적어도 2개의 뉴클레오티드, 적어도 3개의 뉴클레오티드, 적어도 4개의 뉴클레오티드, 또는 적어도 5개의 뉴클레오티드를 포함한다. 그러나, 일부의 경우에, BDA 블로커는 검출되어야 하는 표적 핵산이 삽입 검출을 위한 것이라면 블로커 변이성 부분서열을 포함하지 않을 수 있다. BDA 블로커 변이성 부분서열은 표적-중립적 부분서열에 의해 이의 3' 및 5' 말단에 플랭킹되고, 표적-중립적 부분서열과 연속적이다. BDA 블로커는 오류-정정 DNA 중합효소에 의한 효소적 연장 및/또는 3'->5' 엑소뉴클레아제 활성을 방지하는, 3' 말단에 또는 그 근처에 작용기 또는 비-상보적 서열 영역을 포함할 수 있다. 일례로, 블로커 올리고뉴클레오티드의 작용기는 3-탄소 스페이서 또는 디데옥시뉴클레오티드로 이루어지는 군으로부터 선택되나, 이에 제한되지는 않는다.
BDA 정방향 프라이머는 BDA 블로커에 의해 결합되지 않은 주형 핵산의 효소적 연장을 유도하기에 충분하다. BDA 정방향 프라이머의 3' 말단은 BDA 블로커의 5' 말단과 중첩되는 서열을 포함한다. BDA 정방향 프라이머의 3' 말단과 중첩되는 BDA 블로커의 일부는 표적-중립적 부분서열로만 이루어지며, 따라서 BDA 정방향 프라이머는 블로커 변이성 부분서열과 상동성인 임의의 서열을 포함하지 않을 수 있다.
BDA 정방향 프라이머 및 BDA 블로커의 서열은 표적 핵산 서열(예를 들어, 증폭 또는 검출이 요망되는 서열, 예를 들어, SNP, 삽입, 결실 또는 임의의 다른 돌연변이) 및 변이체 핵산 서열(예를 들어, 증폭이 억제되어야 하는 서열, 예를 들어 야생형 서열)에 대한 이들의 혼성화의 열역학에 기초하여 합리적으로 설계될 수 있다. 일부 구현예에서, BDA 블로커는 BDA 정방향 프라이머보다 현저하게 더 높은 농도로 존재하여, 프라이머에 결합하기 전에 수적으로 우세한 표적 및 변이체 핵산 서열이 BDA 블로커에 결합한다. BDA 정방향 프라이머는 BDA 블로커-표적 또는 BDA 블로커-변이체 분자에 일시적으로 결합하고, 표적 또는 변이체에 결합할 때 BDA 블로커를 대체할 가능성을 지닌다. BDA 블로커 서열은 변이체 표적에 특이적이기 때문에, 이의 변이체로부터의 변위는 이의 표적으로부터의 변위보다 열역학적으로 덜 유리하다. 따라서, 비-대립유전자-특이적 BDA 정방향 프라이머는 변이체 서열을 증폭시키는 것보다 더 높은 수율/효율로 표적 서열을 증폭시킨다. BDA 정방향 프라이머의 비-대립유전자-특이적 특성은 후속 증폭 주기도 표적에 유리한 증폭 편향(bias)을 나타내도록, 거짓 증폭된 변이체 서열이 표적 대립유전자보다는 변이체 대립유전자를 갖는다는 것을 의미한다.
일부 측면에서, BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 함유한다. 한 측면에서, 변형은 종결자이다. 한 측면에서, 종결자는 3-탄소(C3) 스페이서 및 DXXDM으로 이루어진 군으로부터 선택되며, 상기 D는 블로커 서열 및 주형 핵산 분자 서열 간의 일치이고, X는 블로커 서열 및 주형 핵산 분자 서열간의 불일치이고, M은 C3 스페이서이다. 당업계에 공지된 추가의 종결자는 또한 사용하기에 적합하다. 추가 종결자의 비제한적인 예는 디데옥시뉴클레오티드이다.
일부 측면에서, BDA 블로커 및 BDA 정방향 프라이머는 각각의 올리고뉴클레오티드의 결합이 혼성화 조건의 특정 표준 자유 에너지를 충족하도록 설계될 수 있다. 예를 들어, BDA 정방향 프라이머를 주형 핵산에 혼성화하는 표준 자유 에너지(ΔG°PT) 및 BDA 블로커를 표적 서열을 갖는 주형 핵산에 혼성화하는 표준 자유 에너지(ΔG°BT)는 하기 조건을 충족한다:
Figure pct00001
일부 측면에서, BDA 블로커 및 BDA 정방향 프라이머는 ΔG°PT - ΔG°BT가 약 +3 kcal/mol 내지 약 -10 kcal/mol, 약 +3 kcal/mol 내지 약 -9 kcal/mol, 약 +3 kcal/mol 내지 약 -8 kcal/mol, 약 +3 kcal/mol 내지 약 -7 kcal/mol, 약 +3 kcal/mol 내지 약 -6 kcal/mol, 약 +3 kcal/mol 내지 약 -5 kcal/mol, 약 +3 kcal/mol 내지 약 -4 kcal/mol, 약 +3 kcal/mol 내지 약 -3 kcal/mol, 약 +3 kcal/mol 내지 약 -2 kcal/mol, 약 +3 kcal/mol 내지 약 -1 kcal/mol, 약 +3 kcal/mol 내지 약 0 kcal/mol, 약 +3 kcal/mol 내지 약 +1 kcal/mol, 약 +2 kcal/mol 내지 약 -10 kcal/mol, 약 +2 kcal/mol 내지 약 -9 kcal/mol, 약 +2 kcal/mol 내지 약 -8 kcal/mol, 약 +2 kcal/mol 내지 약 -7 kcal/mol, 약 +2 kcal/mol 내지 약 -6 kcal/mol, 약 +2 kcal/mol 내지 약 -5 kcal/mol, 약 +2 kcal/mol 내지 약 -4 kcal/mol, 약 +2 kcal/mol 내지 약 -3 kcal/mol, 약 +2 kcal/mol 내지 약 -2 kcal/mol, 약 +2 kcal/mol 내지 약 -1 kcal/mol, 약 +2 kcal/mol 내지 약 0 kcal/mol, 약 +1 kcal/mole 내지 약 -10 kcal/mol, 약 +1 kcal/mol 내지 약 -9 kcal/mol, 약 +1 kcal/mol 내지 약 -8 kcal/mol, 약 +1 kcal/mol 내지 약 -7 kcal/mol, 약 +1 kcal/mol 내지 약 -6 kcal/mol, 약 +1 kcal/mol 내지 약 -5 kcal/mol, 약 +1 kcal/mol 내지 약 -4 kcal/mol, 약 +1 kcal/mol 내지 약 -3 kcal/mol, 약 +1 kcal/mol 내지 약 -2 kcal/mol, 약 +1 kcal/mol 내지 약 -1 kcal/mol, 약 0 kcal/mole 내지 약 -10 kcal/mol, 약 0 kcal/mol 내지 약 -9 kcal/mol, 약 0 kcal/mol 내지 약 -8 kcal/mol, 약 0 kcal/mol 내지 약 -7 kcal/mol, 약 0 kcal/mol 내지 약 -6 kcal/mol, 약 0 kcal/mol 내지 약 -5 kcal/mol, 약 0 kcal/mol 내지 약 -4 kcal/mol, 약 0 kcal/mol 내지 약 -3 kcal/mol, 약 0 kcal/mol 내지 약 -2 kcal/mol, 약 -1 kcal/mole 내지 약 -10 kcal/mol, 약 -1 kcal/mol 내지 약 -9 kcal/mol, 약 -1 kcal/mol 내지 약 -8 kcal/mol, 약 -1 kcal/mol 내지 약 -7 kcal/mol, 약 -1 kcal/mol 내지 약 -6 kcal/mol, 약 -1 kcal/mol 내지 약 -5 kcal/mol, 약 -1 kcal/mol 내지 약 -4 kcal/mol, 약 -1 kcal/mol 내지 약 -3 kcal/mol, 약 -2 kcal/mole 내지 약 -10 kcal/mol, 약 -2 kcal/mol 내지 약 -9 kcal/mol, 약 -2 kcal/mol 내지 약 -8 kcal/mol, 약 -2 kcal/mol 내지 약 -7 kcal/mol, 약 -2 kcal/mol 내지 약 -6 kcal/mol, 약 -2 kcal/mol 내지 약 -5 kcal/mol, 약 -2 kcal/mol 내지 약 -4 kcal/mol, 또는 약 -2 kcal/mol 내지 약 -3 kcal/mol이 되도록 설계될 수 있다. 일부 측면에서, BDA 블로커 및 BDA 정방향 프라이머는 PCR에 적합한 버퍼에서 ΔG°PT - ΔG°BT가 바람직하게는 대략 50℃, 대략 55℃, 대략 60℃, 대략 65℃, 또는 대략 70℃에서 약 -1 kcal/mol 내지 약 -4 kcal/mol이 되도록 설계될 수 있다.
일부 측면에서, BDA 정방향 프라이머는 BDA 블로커 결합 부위와 혼성화되는 프라이머의 부분이 약 -4 kcal/mol 내지 약 -12 kcal/mol, 약 -4 kcal/mol 내지 약 -11 kcal/mol, 약 -4 kcal/mol 내지 약 -10 kcal/mol, 약 -4 kcal/mol 내지 약 -9 kcal/mol, 약 -4 kcal/mol 내지 약 -8 kcal/mol, 약 -4 kcal/mol 내지 약 -7 kcal/mol, 약 -4 kcal/mol 내지 약 -6 kcal/mol, 약 -5 kcal/mol 내지 약 -12 kcal/mol, 약 -5 kcal/mol 내지 약 -11 kcal/mol, 약 -5 kcal/mol 내지 약 -10 kcal/mol, 약 -5 kcal/mol 내지 약 -9 kcal/mol, 약 -5 kcal/mol 내지 약 -8 kcal/mol, 약 -5 kcal/mol 내지 약 -7 kcal/mol, 약 -6 kcal/mol 내지 약 -12 kcal/mol, 약 -6 kcal/mol 내지 약 -11 kcal/mol, 약 -6 kcal/mol 내지 약 -10 kcal/mol, 약 -6 kcal/mol 내지 약 -9 kcal/mol, 약 -6 kcal/mol 내지 약 -8 kcal/mol, 약 -7 kcal/mol 내지 약 -12 kcal/mol, 약 -7 kcal/mol 내지 약 -11 kcal/mol, 약 -7 kcal/mol 내지 약 -10 kcal/mol, 약 -7 kcal/mol 내지 약 -9 kcal/mol, 약 -8 kcal/mol 내지 약 -12 kcal/mol, 약 -8 kcal/mol 내지 약 -11 kcal/mol, 약 -8 kcal/mol 내지 약 -10 kcal/mol, 약 -9 kcal/mol 내지 약 -12 kcal/mol, 약 -9 kcal/mol 내지 약 -11 kcal/mol, 또는 약 -10 kcal/mol 내지 약 -12 kcal/mol인 혼성화의 표준 자유 에너지(ΔG°3)를 갖도록 설계될 수 있다.
서열로부터 ΔG°값의 계산을 위한 방법은 당업계에 공지되어 있다. 상이한 영역 상호작용의 ΔG°를 계산하기 위한 상이한 규칙이 존재한다. 그 전체가 참조로 본원에 포함된 WO2015/179339호는 가장 가까운 인접 모델을 기반으로 한 예시적인 에너지 계산을 제공한다. 프라이머 서열, 블로커 서열, 표적 서열, 변이체 서열, 작동 온도 및 작동 버퍼 조건으로부터 ΔG°PT, ΔG°PV, ΔG°BT 및 ΔG°BV의 계산은 당업계의 숙련자에게 알려져 있다. 작동 온도는 약 20℃, 약 25℃, 약 30℃, 약 35℃, 약 40℃, 약 45℃, 약 50℃, 약 55℃, 약 60℃, 약 65℃ 또는 약 70℃일 수 있다. 작동 버퍼 조건은 PCR에 적합한 버퍼 조건일 수 있다. 특별히 달리 기술되지 않는 한, 혼성화의 표준 자유 에너지는 60℃의 어닐링 온도, 이중 가닥 DNA 및 0.18 M의 Na+ 농도를 기반으로 계산된다.
일부 측면에서, BDA 정방향 프라이머 및 BDA 블로커는 각각, 개별적으로, 약 12 내지 100개, 약 12 내지 90개, 약 12 내지 80개, 약 12 내지 70개, 약 12 내지 60개, 약 12 내지 50개, 약 12 내지 40개, 약 12 내지 30개, 약 15 내지 100개, 약 15 내지 90개, 약 15 내지 80개, 약 15 내지 70개, 약 15 내지 60개, 약 15 내지 50개, 약 15 내지 40개, 약 15 내지 30개, 약 20 내지 100개, 약 20 내지 90개, 약 20 내지 80개, 약 20 내지 70개, 약 20 내지 60개, 약 20 내지 50개, 약 20 내지 40개, 또는 약 20 내지 30개의 뉴클레오티드 길이일 수 있다. 일부 측면에서, BDA 정방향 프라이머 및 BDA 블로커는 각각, 개별적으로, 적어도 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 또는 60개의 뉴클레오티드 길이일 수 있다.
일부 측면에서, BDA 블로커 결합 부위에 혼성화되는 BDA 정방향 프라이머의 부분은 약 5 내지 40개의 뉴클레오티드, 약 7 내지 40개, 약 9 내지 40개, 약 11 내지 40개, 약 13 내지 40개, 약 15 내지 40개, 약 20 내지 40개, 약 25 내지 40개, 약 30 내지 40개, 약 35 내지 40개, 약 5 내지 35개, 약 7 내지 35개, 약 9 내지 35개, 약 11 내지 35개, 약 13 내지 35개, 약 15 내지 35개, 약 20 내지 35개, 약 25 내지 35개, 약 30 내지 35개, 약 5 내지 30개, 약 7 내지 30개, 약 9 내지 30개, 약 11 내지 30개, 약 13 내지 30개, 약 15 내지 30개, 약 20 내지 30개, 약 25 내지 30개, 약 5 내지 25개, 약 7 내지 25개, 약 9 내지 25개, 약 11 내지 25개, 약 13 내지 25개, 약 15 내지 25개, 약 20 내지 25개, 약 5 내지 20개, 약 7 내지 20개, 약 9 내지 20개, 약 11 내지 20개, 약 13 내지 20개, 또는 약 15 내지 20개의 뉴클레오티드이다. 일부 측면에서, BDA 블로커 결합 부위에 혼성화되는 BDA 정방향 프라이머의 부분은 적어도 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 또는 40개의 뉴클레오티드이다.
일부 측면에서, BDA 블로커의 농도는 BDA 정방향 프라이머의 농도보다 약 2 내지 10,000배, 약 2 내지 9,000배, 약 2 내지 8,000배, 약 2 내지 7,000배, 약 2 내지 6,000배, 약 2 내지 5,000배, 약 2 내지 4,000배, 약 2 내지 3,000배, 약 2 내지 2,000배, 약 2 내지 1,000배, 약 2 내지 900배, 약 2 내지 800배, 약 2 내지 700배, 약 2 내지 600배, 약 2 내지 500배, 약 2 내지 400배, 약 2 내지 300배, 약 2 내지 200배, 약 2 내지 150배, 약 2 내지 100배, 약 2 내지 90배, 약 2 내지 80배, 약 2 내지 70배, 약 2 내지 60배, 약 2 내지 50배, 약 2 내지 40배, 약 2 내지 30배, 약 2 내지 20배, 약 2 내지 10배, 약 4 내지 10,000배, 약 4 내지 9,000배, 약 4 내지 8,000배, 약 4 내지 7,000배, 약 4 내지 6,000배, 약 4 내지 5,000배, 약 4 내지 4,000배, 약 4 내지 3,000배, 약 4 내지 2,000배, 약 4 내지 1,000배, 약 4 내지 900배, 약 4 내지 800배, 약 4 내지 700배, 약 4 내지 600배, 약 4 내지 500배, 약 4 내지 400배, 약 4 내지 300배, 약 4 내지 200배, 약 4 내지 150배, 약 4 내지 100배, 약 4 내지 90배, 약 4 내지 80배, 약 4 내지 70배, 약 4 내지 60배, 약 4 내지 50배, 약 4 내지 40배, 약 4 내지 30배, 약 4 내지 20배, 약 4 내지 10배, 약 6 내지 10,000배, 약 6 내지 9,000배, 약 6 내지 8,000배, 약 6 내지 7,000배, 약 6 내지 6,000배, 약 6 내지 5,000배, 약 6 내지 4,000배, 약 6 내지 3,000배, 약 6 내지 2,000배, 약 6 내지 1,000배, 약 6 내지 900배, 약 6 내지 800배, 약 6 내지 700배, 약 6 내지 600배, 약 6 내지 500배, 약 6 내지 400배, 약 6 내지 300배, 약 6 내지 200배, 약 6 내지 150배, 약 6 내지 100배, 약 6 내지 90배, 약 6 내지 80배, 약 6 내지 70배, 약 6 내지 60배, 약 6 내지 50배, 약 6 내지 40배, 약 6 내지 30배, 약 6 내지 20배, 약 6 내지 10배, 약 10 내지 10,000배, 약 10 내지 9,000배, 약 10 내지 8,000배, 약 10 내지 7,000배, 약 10 내지 6,000배, 약 10 내지 5,000배, 약 10 내지 4,000배, 약 10 내지 3,000배, 약 10 내지 2,000배, 약 10 내지 1,000배, 약 10 내지 900배, 약 10 내지 800배, 약 10 내지 700배, 약 10 내지 600배, 약 10 내지 500배, 약 10 내지 400배, 약 10 내지 300배, 약 10 내지 200배, 약 10 내지 150배, 약 10 내지 100배, 약 10 내지 90배, 약 10 내지 80배, 약 10 내지 70배, 약 10 내지 60배, 약 10 내지 50배, 약 10 내지 40배, 약 10 내지 30배, 약 10 내지 20배, 약 20 내지 10,000배, 약 20 내지 9,000배, 약 20 내지 8,000배, 약 20 내지 7,000배, 약 20 내지 6,000배, 약 20 내지 5,000배, 약 20 내지 4,000배, 약 20 내지 3,000배, 약 20 내지 2,000배, 약 20 내지 1,000배, 약 20 내지 900배, 약 20 내지 800배, 약 20 내지 700배, 약 20 내지 600배, 약 20 내지 500배, 약 20 내지 400배, 약 20 내지 300배, 약 20 내지 200배, 약 20 내지 150배, 약 20 내지 100배, 약 20 내지 90배, 약 20 내지 80배, 약 20 내지 70배, 약 20 내지 60배, 약 20 내지 50배, 약 20 내지 40배, 약 20 내지 30배, 약 40 내지 10,000배, 약 40 내지 9,000배, 약 40 내지 8,000배, 약 40 내지 7,000배, 약 40 내지 6,000배, 약 40 내지 5,000배, 약 40 내지 4,000배, 약 40 내지 3,000배, 약 40 내지 2,000배, 약 40 내지 1,000배, 약 40 내지 900배, 약 40 내지 800배, 약 40 내지 700배, 약 40 내지 600배, 약 40 내지 500배, 약 40 내지 400배, 약 40 내지 300배, 약 40 내지 200배, 약 40 내지 150배, 약 40 내지 100배, 약 40 내지 90배, 약 40 내지 80배, 약 40 내지 70배, 약 40 내지 60배, 또는 약 40 내지 50배 더 크다. 일부 측면에서, BDA 블로커의 농도는 BDA 정방향 프라이머의 농도보다 적어도 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배, 250배, 500배, 1000배, 2500배, 5000배, 7500배, 또는 10,000배 더 크다.
다중 BDA(mBDA)가 많은 유전자좌의 그룹에서 잠재적인 표적 서열을 동시에 농축하기 위해, 상이한 BDA 정방향 프라이머 및 BDA 블로커가 각각의 유전자좌에 대해 사용된다. 이들은 모두 샘플, DNA 중합효소, dNTP 및 PCR에 처리가능한 버퍼와 동시에 용액에서 조합된다. DNA-기반 PCR의 억제를 방지하기 위해, 모든 올리고 종의 총 농도는 50 마이크로몰 미만으로 유지될 수 있다. PCR 반응의 어닐링/연장 단계의 길이는 BDA 정방향 프라이머 종의 가장 낮은 농도에 반비례한다. 과도하게 긴 프로토콜을 방지하기 위해, 모든 BDA 정방향 프라이머 농도가 적어도 100 피코몰인 것이 권장된다. 각각의 BDA 블로커 종의 농도는 이의 상응하는 BDA 정방향 프라이머 종의 농도의 적어도 2x이어야 한다.
전술한 단일-플렉스 BDA의 표준 설계 원리에 더하여, 다중 BDA(mBDA)에 대한 올리고 설계는 목적하지 않은 "프라이머 이량체" 종을 방지하기 위해 추가 고려사항을 필요로 한다. mBDA 서열 설계를 위한 알고리즘은 후보 서열 세트가 비선택적 결합 상호작용을 나타낼 것으로 예측되는 경우 불이익을 부여하여야 한다. 예를 들어, WO 2019/164885호를 참조하며, 이는 그 전체가 본원에 참조로 포함된다.
D. 어댑터 추가
다음으로, BDA 어댑터가 추가된다. (예를 들어, 일루미나(Illumina) 어댑터 서열 및 BDA 정방향 프라이머 서열을 포함하는) BDA 어댑터 프라이머 및 UrP를 정제된 PCR 반응 혼합물과 혼합하고, 적어도 1회 주기 동안 증폭시켰다. 증폭은 적어도 1회, 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회, 10회, 11회, 12회, 13회, 14회, 15회, 16회, 17회, 18회, 19회 또는 20회 주기 동안일 수 있다. 어댑터는 효소 결찰 반응에 의해 추가될 수도 있다. 어댑터 결찰을 사용하여 추가 서열을 추가하는 방법은 예를 들어, 미국 특허 제7,803,550호에 기술되어 있으며, 이는 그 전체가 본원에 참조로 포함된다.
E. 인덱스 PCR
마지막으로, (예를 들어, 제한 없이, SPRI 자기 비드 또는 컬럼을 사용한) 또 다른 정제 후, 표준 NGS 인덱스 PCR을 수행하고; 라이브러리가 정규화되며 일루미나 서열분석기(Illumina sequencer) 상에 로딩된다. NGS 라이브러리는 일루미나 서열분석기(단일-리드 및 쌍-말단 모두) 또는 다른 차세대 서열분석기 예컨대 이온 토렌트(Ion Torrent)에 의해 시퀀싱될 수 있다.
III. 정량적 블로커 변위 증폭(QBDA) 데이터 분석 워크플로우
QBDA 차세대 시퀀싱을 위한 데이터 분석 워크플로우의 개략도를 도 2a에 나타낸다. 첫째, 원시 NGS 리드가 앰플리콘 영역에 정렬되고; 정렬 전에 선택적 어댑터 트리밍을 수행할 수 있다. 정렬되지 않은 리드는 폐기되고, 정렬된 리드는 이들이 정렬된 게놈 영역에 따라 그룹화된다.
둘째, 동일한 유전자좌에 정렬된 모든 리드는 UMI 서열에 의해 분류되고: 동일한 UMI를 수반하는 리드는 하나의 UMI 패밀리로 그룹화된다. UMI 패밀리 크기는 동일한 UMI를 수반하는 리드의 수이고, 고유한 UMI 수는 하나의 유전자좌에서 상이한 UMI 서열의 총 개수이다.
셋째, PCR 중합효소 오류 또는 NGS 시퀀싱 오류의 결과일 가능성이 있는 모든 UMI 패밀리를 제거한다. 설계된 UMI 패턴과 일치하지 않는 UMI 서열(예를 들어, 폴리(H) UMI 서열에서 발견되는 G 염기)는 오류이며, 제거되어야 한다.
패밀리 크기가 <F min인 UMI 패밀리가 또한 제거되며; F min 은 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1일 수 있다. 대부분의 경우 F min = 4가 바람직하다. 선택적으로, F min은 UMI 패밀리 크기의 분포에 따라 결정된다. 예를 들어, F min은 상위 3개의 가장 큰 패밀리 크기의 평균을 20으로 나눈 것일 수 있거나; F min은 패밀리 크기의 중앙값을 10으로 나눈 것일 수 있다. 선택적으로, 두 UMI 서열이 약 1-2 염기만 상이한 경우, 더 작은 UMI 패밀리 크기를 갖는 것이 다른 것과 돌연변이될 가능성이 있고, 따라서 제거될 수 있다.
각각의 UMI 패밀리에 대한 유전자형은 이후 결정된다. 서열이 UMI 패밀리에서 리드의 50% 초과, 55% 초과, 60% 초과, 70% 초과, 75% 초과, 80% 초과, 85% 초과, 또는 90% 초과, 바람직하게는 70%로 지원되는 경우, 서열은 해당 패밀리에 대한 유전자형일 것이다. 서열이 리드의 50% 초과, 55% 초과, 60% 초과, 70% 초과, 75% 초과, 80% 초과, 85% 초과, 또는 90% 초과, 바람직하게는 70%로 지원되지 않는 경우, UMI 패밀리는 폐기된다. 또한, 블로커가 프로토콜에 추가될 때 UMI 패밀리 유전자형을 판정하기 위해 WT 거부가 적용된다(도 2b). BDA 농축 영역의 무작위 돌연변이는 초기 주기에서 중합효소 오류에 의해 생성될 수 있으며, BDA 동안 농축될 것이다. 이 경우, WT 분자로부터 유래된 패밀리가 대다수 리드를 변이체 서열로 가질 수 있다. 이러한 문제를 해결하기 위해, BDA 블로커가 추가되고 패밀리에서 WT 리드가 백분율 임계값(Pwt) 초과인 경우, 패밀리는 WT로 판정된다. Pwt는 0.01% 내지 50%, 0.01% 내지 45%, 0.01% 내지 40%, 0.01% 내지 35%, 0.01% 내지 30%, 0.01% 내지 25%, 0.01%, 내지 20%, 0.01% 내지 15%, 0.01% 내지 10%, 0.01% 내지 5%, 0.1% 내지 50%, 0.1% 내지 45%, 0.1% 내지 40%, 0.1% 내지 35%, 0.1% 내지 30%, 0.1% 내지 25%, 0.1%, 내지 20%, 0.1% 내지 15%, 0.1% 내지 10%, 0.1% 내지 5%, 0.5% 내지 50%, 0.1% 내지 45%, 0.5% 내지 40%, 0.5% 내지 35%, 0.5% 내지 30%, 0.5% 내지 25%, 0.5%, 내지 20%, 0.5% 내지 15%, 0.5% 내지 10%, 0.5% 내지 5%, 1% 내지 50%, 1% 내지 45%, 1% 내지 40%, 1% 내지 35%, 1% 내지 30%, 1% 내지 25%, 1%, 내지 20%, 1% 내지 15%, 1% 내지 10%, 또는 1% 내지 5%의 범위이다. Pwt는 약 0.01%, 약 0.05%, 약 0.1%, 약 0.15%, 약 0.2%, 약 0.25%, 약 0.3%, 약 0.35%, 약 0.4%, 약 0.45%, 약 0.5%, 약 0.55%, 약 0.6%, 약 0.65%, 약 0.7%, 약 0.75%, 약 0.8%, 약 0.85%, 약 0.9%, 약 0.95%일 수 있다. 일부 구현예에서, Pwt는 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 적어도 50%이다.
각각의 돌연변이에 대한 고유한 UMI 수 (N)는 VAF의 계산에 사용될 것이다. 변이체에 대한 VAF는 VAF = N var /(N 입력 *수율)로 계산될 것이며, 상기 N var는 변이체 서열에 대한 고유한 UMI 수이고, N 입력 은 QBDA에 대한 DNA 입력의 가닥 수이고, 수율은 QBDA 반응에 대한 전체 전환 수율이다. 전환 수율은 BDA 블로커 없이 QBDA 실험을 수행함으로써 보정된다. 예를 들어, 입력 분자 N 입력 = 6,000 이고, 블로커가 추가되지 않을 때 관찰된 고유한 UMI 수가 4,000인 경우, 전환 수율 = 4,000/6,000 = 66.7%이다. DNA 입력은 Qubit 또는 qPCR에 의해 결정될 수 있다. 인간 게놈 DNA의 경우, 1 ng DNA는 약 290개의 반수체 게놈 등가물 (또는 580개 가닥)로 간주된다. 따라서, 10 ng 인간 gDNA가 입력으로 사용되는 경우, N 입력 = 10*580 = 5,800이다. 필요한 경우, (예를 들어, FFPE 샘플에 대해) qPCR 실험을 수행하여 증폭 가능한 DNA 분자의 수를 정확하게 정량화할 수 있다.
IV. 표적 핵산의 추가 처리
A. DNA의 증폭
주어진 주형 샘플에 존재하는 핵산을 증폭하기 위해 다수의 주형-의존적 과정이 이용가능하다. 가장 잘 알려진 증폭 방법 중 하나는 중합효소 연쇄 반응(PCRTM으로 지칭됨)으로, 이는 미국 특허 제4,683,195호, 제4,683,202호, 및 제4,800,159호 및 Innis 등, 1990에 자세히 기술되어 있으며, 이들 각각은 그 전체가 본원에 참조로 포함된다. 간략하게, 증폭될 주형 DNA의 두 영역(각각의 가닥에 대해 하나씩)에 상보적인 2개의 합성 올리고뉴클레오티드 프라이머는 과량의 데옥시뉴클레오티드(dNTP) 및 예를 들어, Taq(더무스 아쿠아티쿠스(Thermus aquaticus)) DNA 중합효소와 같은 열안정성 중합효소의 존재 하에서 주형 DNA(순수할 필요는 없음)에 추가된다. 일련의 온도 주기(전형적으로 30회 내지 35회)에서, 표적 DNA는 반복적으로 변성되고(약 90℃), 프라이머(전형적으로 50 내지 60℃) 및 프라이머(72℃)로부터 연장된 딸 가닥(daughter strand)에 어닐링된다. 딸 가닥이 생성됨에 따라, 후속 주기에서 주형으로서 역할을 한다. 따라서, 두 프라이머 사이의 주형 영역은 선형적이라기보다 지수적으로 증폭된다.
B. DNA의 시퀀싱
어댑터-연결 단편의 라이브러리의 시퀀싱을 위한 방법이 또한 제공된다. 당업계의 숙련자에게 공지된 핵산 시퀀싱을 위한 임의의 기술이 본 개시의 방법에 사용될 수 있다. DNA 시퀀싱 기술은 표지된 종결자 또는 프라이머를 사용한 고전적인 디데옥시 시퀀싱 반응(생어(Sanger) 방법) 및 슬래브 또는 모세관에서의 겔 분리, 가역적으로 종결된 표지된 뉴클레오티드를 사용한 합성에 의한 시퀀싱(sequencing-by-synthesis), 파이로시퀀싱(pyrosequencing), 454 시퀀싱, 표지된 올리고뉴클레오티드 프로브의 라이브러리에 대한 대립유전자 특이적 혼성화, 결찰이 뒤따르는 표지된 클론의 라이브러리에 대한 대립유전자 특이적 혼성화를 사용한 합성에 의한 시퀀싱, 중합 단계 중에 표지된 뉴클레오티드 혼입의 실시간 모니터링, 및 SOLiD 시퀀싱을 포함한다.
핵산 라이브러리는 일루미나 시퀀싱, 예컨대 NexteraTM DNA 샘플 제조 키트와 호환가능한 접근법으로 생성될 수 있고, 일루미나 차세대 시퀀싱 라이브러리 제조를 생성하기 위한 추가적인 접근법은, 예를 들어, Oyola 등 (2012)에 기술된다. 다른 구현예에서, 핵산 라이브러리는 SOLiDTM 또는 이온 토렌트 시퀀싱 방법(예를 들어, SOLiD® 단편 라이브러리 구축 키트, SOLiD® 메이트-페어드(Mate-Paired) 라이브러리 구축 키트, SOLiD® ChIP-Seq 키트, SOLiD® 토탈 RNA-Seq 키트, SOLiD® SAGE™ 키트, Ambion® RNA-Seq 라이브러리 구축 키트 등)과 호환가능한 방법으로 생성된다. 본 발명의 구현예와 함께 사용될 수 있는 다양한 라이브러리 구축 방법을 포함하는, 차세대 시퀀싱 방법을 위한 추가 방법은, 예를 들어, Pareek(2011) 및 Thudi(2012)에 기술되어 있다.
특정 측면에서, 본 개시의 방법에 사용되는 시퀀싱 기술은 HiSeq™ 시스템(예를 들어, HiSeq™ 2000 및 HiSeq™ 1000), NextSeq™ 500, 및 일루미나 사(Illumina, Inc.)의 MiSeq™ 시스템을 포함한다. 상기 HiSeq™ 시스템은 무작위로 단편화된 게놈 DNA를 평면의 광학적으로 투명한 표면에 부착하고 고체상 증폭을 사용하여 수백만 개의 단편에 대한 대규모 병렬 시퀀싱을 기초로 하여 각각 평방 cm 당 약 1,000개의 주형 카피를 포함하는 수백만 개의 클러스터로 고밀도 시퀀싱 흐름 세포를 생성한다. 상기 주형은 합성에 의한 4색(four-color) DNA 시퀀싱 기술을 사용하여 시퀀싱된다. 상기 MiSeq™ 시스템은 일루미나의 가역적 종결자 기반의 합성에 의한 시퀀싱인 TruSeq™를 사용한다.
본 개시의 방법에 사용될 수 있는 DNA 시퀀싱 기술의 다른 예는 454 시퀀싱(Roche)(Margulies 등, 2005)이다. 454 시퀀싱은 두 단계를 수반한다. 제1 단계에서, DNA는 대략 300 내지 800개의 염기쌍의 단편으로 절단되고, 상기 단편은 무딘 말단이다. 이후, 올리고뉴클레오티드 어댑터는 단편의 말단에 결찰된다. 상기 어댑터는 단편의 증폭 및 시퀀싱을 위한 프라이머로서 역할을 한다. 상기 단편은 예를 들어, 5'-비오틴 태그를 포함하는 어댑터 B를 사용하여 DNA 포획 비드, 예컨대 스트렙트아비딘-코팅된 비드에 부착될 수 있다. 상기 비드에 부착된 단편은 오일-물 에멀젼의 액적 내에서 PCR 증폭된다. 그 결과는 각각의 비드 상에 클론 증폭된 DNA 단편의 다수의 카피이다. 제2 단계에서, 상기 비드는 웰(피코-리터 크기)에 포획된다. 파이로시퀀싱은 각각의 DNA 단편 상에 병렬로 수행된다. 하나 이상의 뉴클레오티드의 추가는 시퀀싱 기기의 CCD 카메라에 의해 기록되는 광 신호가 생성된다. 신호 강도는 혼입된 뉴클레오티드의 수에 비례한다.
본 개시의 방법에 사용될 수 있는 DNA 시퀀싱 기술의 다른 예는 SOLiD 기술 (Life Technologies, Inc.)이다. SOLiD 시퀀싱에서, 게놈 DNA는 단편으로 절단되고, 어댑터는 단편의 5' 및 3' 말단에 부착되어 단편 라이브러리를 생성한다. 대안적으로, 내부 어댑터는 단편의 5' 및 3' 말단에 어댑터를 결찰하고, 단편을 원형화하고, 원형화된 단편을 분해하여 내부 어댑터를 생성하고, 생성된 단편의 5' 및 3' 말단에 어댑터를 부착하여 메이트-페어드 라이브러리를 생성함으로써 도입될 수 있다. 다음으로, 클론 비드 집단은 비드, 프라이머, 주형 및 PCR 구성 요소를 포함하는 마이크로반응기에서 제조된다. PCR 후, 상기 주형이 변성되고 비드가 농축되어 연장된 주형으로 상기 비드를 분리한다. 선택한 비드 상의 주형은 유리 슬라이드에 결합을 허용하는 3' 변형이 실시된다.
본 개시의 방법에 사용될 수 있는 DNA 시퀀싱 기술의 다른 예는 이온 토렌트 시스템(Life Technologies, Inc.)이다. 이온 토렌트는 고밀도 배열의 미세-가공 웰을 사용하여 상기 생화학적 과정을 대규모 병렬 방식으로 수행한다. 각각의 웰은 상이한 DNA 주형을 유지한다. 웰 아래에는 이온-민감성 층이 그리고 그 아래에는 독점 이온 센서가 있다. 뉴클레오티드, 예를 들어, C가 DNA 주형에 추가된 다음, DNA 가닥에 혼입되는 경우, 수소 이온이 방출될 것이다. 상기 이온으로부터의 전하는 독점 이온 센서로 검출할 수 있는 용액의 pH를 변화시킬 것이다. 서열분석기는 화학 정보로부터 디지털 정보로 직접 이동하여 염기를 판정할 것이다. 이후, 이온 퍼스널 게놈 머신(Personal Genome Machine, PGM™) 서열분석기는 하나의 뉴클레오티드를 갖는 칩을 차례로 순차적으로 침지(floods)시킨다. 그 다음 칩에 침지시킨 뉴클레오티드가 일치하지 않는 경우, 전압 변화가 기록되지 않을 것이며, 염기가 판정되지 않을 것이다. DNA 가닥 상에 2개의 동일한 염기가 있는 경우, 전압은 두 배가 될 것이며, 칩은 판정된 2개의 동일한 염기를 기록할 것이다. 이는 스캐닝 없이, 카메라 없이, 조명 없이 직접 검출하기 때문에, 각각의 뉴클레오티드 혼입이 몇 초 이내에 기록된다.
본 개시의 방법에 사용될 수 있는 시퀀싱 기술의 또 다른 예는 퍼시픽 바이오사이언스(Pacific Biosciences)의 단일 분자, 실시간(single molecule, real-time, SMRT™) 기술을 포함한다. SMRT™에서, 4개의 DNA 염기 각각은 4개의 상이한 형광 염료 중 하나에 부착된다. 이들 염료는 인산 결합되어 있다. 단일 DNA 중합효소는 제로-모드 도파관(ZMW, zero-mode waveguide)의 바닥에 있는 주형 단일 가닥 DNA의 단일 분자로 고정된다. ZMW는 (마이크로초 내에) ZMW 안팎으로 빠르게 확산되는 형광 뉴클레오티드의 백그라운드에 대해 DNA 중합효소에 의한 단일 뉴클레오티드의 혼입을 관찰할 수 있는 가둠 구조(confinement structure)이다. 뉴클레오티드를 성장하는 가닥에 혼입하는 데 몇 밀리초가 걸린다. 상기 시간 동안, 형광 표지는 여기되어 형광 신호를 생성하고, 형광 태그는 절단된다. 염료의 상응하는 형광 검출은 어떤 염기가 혼입되었는지 나타낸다. 상기 과정이 반복된다.
추가적인 시퀀싱 플랫폼은 CGA 플랫폼(Complete Genomics)을 포함한다. CGA 기술은 원형 DNA 라이브러리의 제조 및 회전환증폭(rolling circle amplification, RCA)을 기초로 하여 고체 지지체 상에 배열된 DNA 나노볼을 생성한다(Drmanac 등, 2009). Complete genomics사의 CGA 플랫폼은 시퀀싱을 위해 조합적 프로브 앵커 결찰(combinatorial probe anchor ligation, cPAL)이라는 신규 전략을 사용한다. 상기 과정은 앵커 분자 및 고유한 어댑터 중 하나 간의 혼성화로 시작된다. 4개의 축퇴성 9-mer 올리고뉴클레오티드는 프로브의 제1 위치에 있는 특정 뉴클레오티드(A, C, G 또는 T)에 상응하는 특정 형광단으로 표지된다. 서열 결정은 정확한 매칭 프로브가 주형에 혼성화되고 T4 DNA 리가아제를 사용하여 앵커에 결찰되는 반응에서 발생한다. 결찰된 산물의 이미징 후, 결찰된 앵커-프로브 분자가 변성된다. n + 1, n + 2, n + 3 및 n + 4 위치에 공지된 염기를 포함하는 형광 표지된 9-mer 프로브의 새로운 세트를 사용하여 혼성화, 결찰, 이미징 및 변성 과정을 5회 반복한다.
V. 키트
본원의 기술된 기술은 DNA 샘플에서 변이체 대립유전자 빈도를 정량적으로 분석하기 위한 키트를 포함한다. "키트"는 물리적 요소의 조합을 지칭한다. 예를 들어, 키트는, 예를 들어 하나 이상의 구성요소, 예컨대 핵산 프라이머, 핵산 블로커, 효소, 반응 버퍼, 지침 시트, 및 본원에 기술된 기술을 실시하는 데 유용한 기타 요소를 포함할 수 있다. 상기 물리적 요소는 본 발명을 수행하기에 적합한 임의의 방식으로 배열될 수 있다.
한 측면에서, 본원에 제공된 키트는 DNA 중합효소를 포함한다. 한 측면에서, 본원에 제공된 키트는 DNA 중합효소 버퍼를 포함한다. 한 측면에서, 본원에 제공된 키트는 dNTP를 포함한다. 한 측면에서, 본원에 제공된 키트는 뉴클레아제-무함유 물을 포함한다. 한 측면에서, 본원에 제공된 키트는 범용 정방향 프라이머, 범용 역방향 프라이머, 또는 둘 다를 포함한다. 한 측면에서, 본원에 제공된 키트는 적어도 하나의 BDA 정방향 프라이머를 포함한다. 한 측면에서, 본원에 제공된 키트는 적어도 하나의 BDA 블로커를 포함한다. 한 측면에서, 본원에 제공된 키트는 UMI를 포함하는 적어도 하나의 올리고뉴클레오티드를 포함한다. 한 측면에서, 본원에 제공된 키트는 양성 대조군으로서 역할을 하는 핵산 분자를 포함한다. 한 측면에서, 본원에 제공된 키트는 음성 대조군으로서 역할을 하는 핵산 분자를 포함한다.
키트의 구성요소는 수성 매질 또는 동결건조된 형태로 패키징될 수 있다. 키트의 용기 수단은 일반적으로 적어도 하나의 바이알, 시험관, 플라스크, 병, 주사기 또는 기타 용기 수단을 포함할 것이며, 그 안에 구성요소가 배치될 수 있고, 바람직하게는 적절하게 분취될 수 있다(예를 들어, 미세역가 플레이트의 웰에 분취됨). 키트에 하나 이상의 구성요소가 있는 경우, 키트는 또한 일반적으로 추가 구성요소가 별도로 배치될 수 있는 제2, 제3 또는 기타 추가 용기를 포함할 것이다. 그러나, 구성요소의 다양한 조합이 단일 바이알에 포함될 수 있다. 본 발명의 키트는 또한 전형적으로 핵산을 함유하기 위한 수단, 및 상업적 판매를 위해 밀폐된 임의의 다른 시약 용기를 포함할 것이다. 이러한 용기는 목적한 바이알이 유지되는 사출 또는 블로우 성형 플라스틱 용기를 포함할 수 있다. 키트는 또한 키트 구성요소를 사용하는 지침 뿐만 아니라 키트에 포함되지 않은 임의의 다른 시약의 사용에 대한 지침도 포함된다. 지침에는 구현할 수 있는 변형이 포함될 수 있다.
VI. 실시예
하기의 실시예는 본 발명의 바람직한 구현예를 입증하기 위해 포함된다. 하기 실시예에 개시된 기술은 본 발명의 실시에서 잘 기능하기 위해 본 발명자에 의해 발견된 기술을 나타내며, 따라서 본 실시를 위한 바람직한 모드를 구성하는 것으로 간주될 수 있음을 당업계의 숙련자에 의해 인식되어야 한다. 그러나, 당업계의 숙련자는 본 개시에 비추어, 개시된 특정 구현예에 많은 변화가 이루어질 수 있고, 본 발명의 사상 및 범주를 벗어나지 않으면서 여전히 비슷하거나 유사한 결과를 수득할 수 있음을 인식해야 한다.
실시예 1 - QBDA SNP 패널
QBDA의 성능을 검증하기 위해 SNP 패널을 구축하였다. 이후, NA18562 및 NA18537에서 상이한 SNP 유전자좌를 선택하였다(표 1). BDA는 이러한 10개의 SNP 유전자좌에서 잘 수행되는 것으로 나타났다. QBDA 패널은 이전의 일반 BDA 설계를 기반으로 설계하였다. SfP, SrP, UfP, UrP, BDA fp, BDA 블로커 및 Adp_fp의 서열은 표 2에 제공된다. 게놈 DNA NA18562를 NA18537과 혼합하여 1.0% 및 0.1%의 NA18562 스파이크-인(spike-in) 비율을 갖는 혼합물 샘플을 얻었다. 30 ng의 1.0% 및 0.1% 스파이크-인 gDNA 혼합물을 QBDA 입력으로 사용하였다. NGS 라이브러리 제조 및 데이터 분석은 전술한 바와 같이 수행하였다.
스파이크-인 샘플이 대량으로 만들어지기 때문에, 10개 SNP 유전자좌 각각에 대한 실제 VAF 값은 1% 또는 0.1%이다. 30 ng의 gDNA는 약 8,700개의 반수체 카피 및 17,400개의 가닥에 상응한다. 따라서, 1% 및 0.1% 스파이크-인에 대해 예측된 분자 수는 각각 174 및 17이어야 한다. VAF는 관찰된 변이체 분자 수/(17,400*수율)로 계산된다. 표 3에 요약된 정량화 결과에 나타난 바와 같이, 계산된 VAF는 10개의 표적 모두에 대해 예측되는 참 값에 가깝다. 1% 스파이크-인의 경우, 계산된 VAF는 0.5% 내지 1.7%의 범위이며, 1.2%의 평균을 갖는다. 0.1% 스파이크-인의 경우, 계산된 VAF는 0.04% 내지 0.21% 범위이며, 0.09%의 평균을 갖는다. 0.1% 스파이크-인 비율을 갖는 30 ng의 gDNA 내에 9개의 반수체 카피의 변이체만이 존재하며; 따라서 포아송 표본 오류가 0.1% 스파이크-인에 대한 정량화를 덜 정확하게 만든다.
표 1. 10-플렉스 SNP 패널에 적용된 SNP에 대한 정보
Figure pct00002
표 2. SNP 패널에 사용된 올리고뉴클레오티드 서열
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
표 3. 10-플렉스 SNP 패널의 정량화 검증
Figure pct00007
계산된 VAF = 관찰된 변이체 분자 수/(17,400*수율)
실시예 2 - QBDA 흑색종 돌연변이 핫스팟 패널
흑색종의 핫스팟 돌연변이를 적용하는 15-플렉스 QBDA 패널을 구축하고 검증하였다. 패널은 15개의 앰플리콘으로 구성되며, 8개의 유전자(MAP2K1, MAP2K2, AKT1, AKT3, NRAS, KRAS, PIK3CA, BRAF) 및 22개의 핫스팟 아미노산 돌연변이 부위를 적용한다. 22개의 돌연변이 부위에서 COSMIC에 보고된 370개의 상이한 돌연변이가 존재한다. 패널 적용범위 정보는 표 4에 요약되어 있다. 흑색종 패널에 사용된 올리고뉴클레오티드 서열은 표 5에 제공된다. 표적 13 앰플리콘(PIK3CA)에 매우 유사한 서열을 갖는 위유전자의 존재로 인해, 역방향 블로커를 SfP 및 SrP와 함께 첨가하여 위유전자에서 비-특이적 증폭을 감소시키도록 실험 워크플로우를 조정하였다(도 3). 위유전자에 상응하는 서열은 또한 데이터 분석 중에 제거되었다.
IDT로부터의 gBlock(서열-검증된, 이중 가닥 DNA 분자)을 NA18562 gDNA에 추가하여 패널 검증을 위한 스파이크-인 샘플을 제조하였다. 15개의 농축 영역 각각에 대해, COSMIC에서 보고된 하나의 병원성 돌연변이를 선택하고, 선택된 돌연변이에 상응하는 gBlock을 추가하였다. gBlock 정보는 표 6에 요약되어 있다. 선택된 15개의 gBlock을 희석하고, qPCR로 정량화한 후 NA18562에 추가하여 대략 1% 스파이크-인을 얻었다. 11,447개 가닥의 NA18562 gDNA 및 약 1% 스파이크-인 gBlock을 포함하는 혼합물 샘플을 QBDA 흑색종 패널에 대한 입력으로 사용하였다. VAF는 관찰된 변이체 분자 수/11,447로 계산되었다. 표 6에 요약된 정량화 결과에 나타난 바와 같이, 계산된 VAF는 1%에 가까웠고, 블로커가 없고 UMI를 고려하지 않은 다른 시퀀싱 실험으로부터 수득된 변이체 리드 빈도(Variant read frequency, VRF)에 가까웠다.
흑색종 환자 또는 건강한 사람으로부터의 임상 조직 샘플을 또한 테스트하였다. 샘플은 상업적 공급업체에서 구입하였다. 20 ng의 신선 동결(Fresh Frozen, FF) 또는 40 ng의 포르말린-고정된, 파라핀-포매된(FFPE) 조직 샘플을 입력으로 사용하였다. FF 샘플의 경우, 추출된 20 ng의 gDNA는 11,600개 가닥에 상응하고, 따라서 VAF는 관찰된 변이체 분자 수/(11,600*수율)로 계산되었다. FFPE로부터 추출된 DNA는 단편화되어 있기 때문에, FFPE DNA 샘플에 대해 qPCR 실험을 수행하여 증폭 가능한 DNA 분자의 수를 정확하게 정량화한다. 표 7에 나타난 바와 같이, QBDA로부터의 정량화 결과는 동일한 샘플을 사용하여 블로커가 없고 UMI를 고려하지 않은 독립적인 시퀀싱 실험으로부터 수득된 VRF에 매우 가까웠다. 4명의 건강한 지원자 gDNA 샘플(입력으로 20 ng)에서, VAF > 0.1%인 변이체는 관찰되지 않았다.
표 4. 흑색종 QBDA 패널의 적용범위
Figure pct00008
표 5. 흑색종 패널에 사용된 올리고뉴클레오티드 서열
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
표 6. gBlock 스파이크-인을 사용한 흑색종 QBDA 패널 검증
Figure pct00014
표 7. 임상 샘플(신선 동결 및 FFPE)을 사용한 QBDA 흑색종 패널 테스트
Figure pct00015
* * *
본원에 개시되고 청구되는 모든 방법은 본 개시에 비추어 과도한 실험 없이 이루어지고 실행될 수 있다. 본 발명의 조성물 및 방법이 바람직한 구현예의 관점에서 기술되었지만, 본 발명의 개념, 사상 및 범위를 벗어나지 않고 본원에 기술된 방법 및 방법의 단계 또는 일련의 단계에 변형이 적용될 수 있음이 당업계의 숙련자에게 명백할 것이다. 보다 구체적으로, 화학적 및 생리학적으로 관련된 특정 제제는 동일하거나 유사한 결과가 달성되는 동안 본원에 기술된 제제로 대체될 수 있음이 명백할 것이다. 당업계의 숙련자에게 명백한 이러한 모든 유사한 대체물 및 변형은 첨부된 청구 범위에 의해 정의된 본 발명의 사상, 범위 및 개념 내에 있는 것으로 간주된다.
참고문헌
하기 참고문헌은, 본원에 제시된 것들에 예시적인 절차 또는 기타 상세한 보충을 제공하는 정도로 본원에 참조로 구체적으로 포함된다.
1. Wu, L. R., Chen, S. X., Wu, Y., Patel, A. A., & Zhang, D. Y. (2017). Multiplexed enrichment of rare DNA variants via sequence-selective and temperature-robust amplification. Nature biomedical engineering, 1(9), 714.
2. 2017년 3월 9일자 US-2017-0067090호로 공개된, 미국특허 출원번호 제15/355,235호.
3. 2021년 1월 28일자 US-2021-0024989호로 공개된, 미국특허 출원번호 제16/971,411호.
4. 2020년 7월 9일자 WO 2020/142631호로 공개된, 국제특허 출원번호 PCT/US2020/012089호.
SEQUENCE LISTING <110> William Marsh Rice University <120> QUANTITATIVE BLOCKER DISPLACEMENT AMPLIFICATION (QBDA) SEQUENCING FOR CALIBRATION-FREE AND MULTIPLEXED VARIANT ALLELE FREQUENCY QUANTITATION <130> RICE.P0075WO <140> not yet known <141> 2021-04-30 <150> US 63/018,922 <151> 2020-05-01 <160> 130 <170> PatentIn version 3.5 <210> 1 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 1 ggatattcct ttctactctt tgacatcatc tatcatgttt tcatggcaaa ccctaacatc 60 <210> 2 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 2 ggatattcct ttctactctt tgacatcatc tatcacaaag tactggcctt tgctgctta 59 <210> 3 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 3 ggatattcct ttctactctt tgacatcatc tatcacatga gagggctcta aataatctcc 60 ttc 63 <210> 4 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 4 ggatattcct ttctactctt tgacatcatc tatcaccaac aggtattgat tcttgaggac 60 tta 63 <210> 5 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 5 ggatattcct ttctactctt tgacatcatc tatcacagtg ttttctttat ttttatgtcc 60 aggtca 66 <210> 6 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 6 ggatattcct ttctactctt tgacatcatc tatcaatttt tcatattttt tttccagagg 60 gaaacag 67 <210> 7 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 7 ggatattcct ttctactctt tgacatcatc tatcatctgc accatgttcc tccaactat 59 <210> 8 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 8 ggatattcct ttctactctt tgacatcatc tatcatgtgc tactctgacc aagacagaa 59 <210> 9 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 9 ggatattcct ttctactctt tgacatcatc tatcactgtg cagacataat ggcagga 57 <210> 10 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 10 ggatattcct ttctactctt tgacatcatc tatcacggaa cggtcgaggc gaa 53 <210> 11 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 11 cctatggtag ttaaatgtac attggatatt cctttctact ctttgacatc atct 54 <210> 12 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 12 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh gtgcaagctg gaggcact 58 <210> 13 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 13 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh acaggaaaag aaactaaaat 60 tgtaccctt 69 <210> 14 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 14 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh gaagccagat ctcaaagtgt 60 cct 63 <210> 15 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 15 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh gttattggga atgctatgaa 60 agagaca 67 <210> 16 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 16 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ggctgcgatg agacaggaa 59 <210> 17 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 17 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh tgaaagatag caatagatac 60 ataaaacacc a 71 <210> 18 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 18 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh caatttccaa gacagaagca 60 ctcc 64 <210> 19 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 19 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh gggggaaaat ggtttcttag 60 gatga 65 <210> 20 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 20 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh agcatgccgc ccttgg 56 <210> 21 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 21 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh tcacaggtca aaattatgag 60 ttcttcg 67 <210> 22 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 22 gactggagtt cagacgtgtg ctcttccgat ct 32 <210> 23 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 23 acacgacgct cttccgatct acttctgcca acattcaaat tcagg 45 <210> 24 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 24 acacgacgct cttccgatct ggatgggact ccaatgcaaa act 43 <210> 25 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 25 acacgacgct cttccgatct catcttgctc ttcatagata gcttcaga 48 <210> 26 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 26 acacgacgct cttccgatct cctgaatgtc agttttgtta gagcaac 47 <210> 27 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 27 acacgacgct cttccgatct ctccttggaa tcaccaacaa acat 44 <210> 28 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 28 acacgacgct cttccgatct ttcctgcttc cagacatgaa tca 43 <210> 29 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 29 acacgacgct cttccgatct ctctctagag tgcagattgg tagaa 45 <210> 30 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 30 acacgacgct cttccgatct acatgtccaa agagagaagt cgtag 45 <210> 31 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 31 acacgacgct cttccgatct gccccaaagg ttaccccatg 40 <210> 32 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 32 acacgacgct cttccgatct gtagccgctt ctctgtgagt t 41 <210> 33 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 33 acttctgcca acattcaaat tcagg 25 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 34 ggatgggact ccaatgcaaa act 23 <210> 35 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 35 catcttgctc ttcatagata gcttcaga 28 <210> 36 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 36 cctgaatgtc agttttgtta gagcaac 27 <210> 37 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 37 ctccttggaa tcaccaacaa acat 24 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 38 ttcctgcttc cagacatgaa tca 23 <210> 39 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 39 ctctctagag tgcagattgg tagaa 25 <210> 40 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 40 acatgtccaa agagagaagt cgtag 25 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 41 gccccaaagg ttaccccatg 20 <210> 42 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 42 gtagccgctt ctctgtgagt t 21 <210> 43 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 43 tcaaattcag gtaccttaga gggacagcta aact 34 <210> 44 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 44 aatgcaaaac tcaatgtatc agtgtgagga tgtat 35 <210> 45 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 45 tagcttcaga aacattccag tgtatgtgca gga 33 <210> 46 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 46 gttagagcaa ctttccttga ttcccagagt agct 34 <210> 47 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 47 caacaaacat gccttctcct tctcctgaaa 30 <210> 48 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 48 acatgaatca tgtcactatt caatgggatg ctt 33 <210> 49 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 49 gattggtaga agacactgat tgcatcttca agt 33 <210> 50 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 50 gaagtcgtag ctattcggca aaggaaatgt t 31 <210> 51 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 51 taccccatgt gtatcaaatg gtcagcaagt t 31 <210> 52 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 52 ctgtgagttg ggagcaaagg agcaat 26 <210> 53 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 53 ggatattcct ttctactctt tgacatcatc tatcaaagcg ccttgaggcc ttt 53 <210> 54 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 54 ggatattcct ttctactctt tgacatcatc tatcaaaggg agctgcaggt tctg 54 <210> 55 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 55 ggatattcct ttctactctt tgacatcatc tatcactgcc cgctgacccc 50 <210> 56 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 56 ggatattcct ttctactctt tgacatcatc tatcattgag ttcgccgacc ttgg 54 <210> 57 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 57 ggatattcct ttctactctt tgacatcatc tatcacgcga gctgcaggtc c 51 <210> 58 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 58 ggatattcct ttctactctt tgacatcatc tatcatccaa catcctcgtg aactctag 58 <210> 59 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 59 ggatattcct ttctactctt tgacatcatc tatcaggccc aacaccttca tcatc 55 <210> 60 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 60 ggatattcct ttctactctt tgacatcatc tatcatgtct tcaaaaggaa gtatcttggc 60 <210> 61 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 61 ggatattcct ttctactctt tgacatcatc tatcaattgt cagtgcgctt ttccc 55 <210> 62 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 62 ggatattcct ttctactctt tgacatcatc tatcactgtt tgttggacat actggataca 60 <210> 63 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 63 ggatattcct ttctactctt tgacatcatc tatcagtatc gtcaaggcac tcttgc 56 <210> 64 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 64 ggatattcct ttctactctt tgacatcatc tatcactgtc tcttggatat tctcgacac 59 <210> 65 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 65 ggatattcct ttctactctt tgacatcatc tatcatcaaa gcaatttcta cacgagatcc 60 <210> 66 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 66 ggatattcct ttctactctt tgacatcatc tatcaaggct ttggagtatt tcatgaaaca 60 a 61 <210> 67 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 67 ggatattcct ttctactctt tgacatcatc tatcaactga tgggacccac tccat 55 <210> 68 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 68 cctatggtag ttaaatgtac attggatatt cctttctact ctttgacatc atct 54 <210> 69 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 69 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ggcttgtggg agaccttga 59 <210> 70 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 70 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh agccacccaa ctcttaaggc 60 <210> 71 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 71 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh agttccctcc ttttctattt 60 tctcttc 67 <210> 72 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 72 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh agtctcccta ggtagctaac 60 cc 62 <210> 73 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 73 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ggacgcactc accatgtgt 59 <210> 74 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 74 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh gggactcaca gccatgtagg 60 <210> 75 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 75 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ccatccccgt gtccctc 57 <210> 76 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 76 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ccagtgttgt aggacatata 60 ttgtacc 67 <210> 77 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 77 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh gctttaaagt actgtagatg 60 tggctc 66 <210> 78 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 78 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ggttaatatc cgcaaatgac 60 ttgc 64 <210> 79 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 79 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh tgtattaacc ttatgtgtga 60 catgttctaa 70 <210> 80 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 80 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ttatattcaa tttaaaccca 60 cctataatgg tg 72 <210> 81 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 81 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ggtatggtaa aaacatgctg 60 agatca 66 <210> 82 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 82 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh cagtgcagtg tggaatccag 60 <210> 83 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 83 agacgtgtgc tcttccgatc tatcahhhhh hhhhhhhhhh ttacttacta cacctcagat 60 atatttcttc atg 73 <210> 84 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 84 gactggagtt cagacgtgtg ctcttccgat ct 32 <210> 85 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 85 acacgacgct cttccgatct ccttgaggcc tttcttaccc a 41 <210> 86 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 86 acacgacgct cttccgatct agctgcaggt tctgcatga 39 <210> 87 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 87 acacgacgct cttccgatct cgctgacccc aaagtcaca 39 <210> 88 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 88 acacgacgct cttccgatct ttcgccgacc ttggct 36 <210> 89 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 89 acacgacgct cttccgatct gctgcaggtc ctgcacg 37 <210> 90 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 90 acacgacgct cttccgatct catcctcgtg aactctagag g 41 <210> 91 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 91 acacgacgct cttccgatct aacaccttca tcatccgctg c 41 <210> 92 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 92 acacgacgct cttccgatct tcaaaaggaa gtatcttggc ctcc 44 <210> 93 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 93 acacgacgct cttccgatct cagtgcgctt ttcccaaca 39 <210> 94 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 94 acacgacgct cttccgatct tgttggacat actggataca gct 43 <210> 95 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 95 acacgacgct cttccgatct gtcaaggcac tcttgcctac 40 <210> 96 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 96 acacgacgct cttccgatct tcttggatat tctcgacaca gca 43 <210> 97 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 97 acacgacgct cttccgatct gcaatttcta cacgagatcc tctc 44 <210> 98 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 98 acacgacgct cttccgatct ttggagtatt tcatgaaaca aatgaatgat 50 <210> 99 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 99 acacgacgct cttccgatct tgggacccac tccatcgaga t 41 <210> 100 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 100 ccttgaggcc tttcttaccc a 21 <210> 101 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 101 agctgcaggt tctgcatga 19 <210> 102 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 102 cgctgacccc aaagtcaca 19 <210> 103 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 103 ttcgccgacc ttggct 16 <210> 104 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 104 gctgcaggtc ctgcacg 17 <210> 105 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 105 catcctcgtg aactctagag g 21 <210> 106 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 106 aacaccttca tcatccgctg c 21 <210> 107 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 107 tcaaaaggaa gtatcttggc ctcc 24 <210> 108 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 108 cagtgcgctt ttcccaaca 19 <210> 109 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 109 tgttggacat actggataca gct 23 <210> 110 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 110 gtcaaggcac tcttgcctac 20 <210> 111 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 111 tcttggatat tctcgacaca gca 23 <210> 112 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 112 gcaatttcta cacgagatcc tctc 24 <210> 113 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 113 ttggagtatt tcatgaaaca aatgaatgat 30 <210> 114 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 114 tgggacccac tccatcgaga t 21 <210> 115 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 115 tcttacccag aagcagaagg tgggaaa 27 <210> 116 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 116 ctgcatgagt gcaactctcc gtacagc 27 <210> 117 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 117 aaagtcacag agcttgatct ccccacgc 28 <210> 118 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 118 ttggctttct gggtgagaaa ggcttac 27 <210> 119 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 119 ctgcacgaat gcaactcgcc gtata 25 <210> 120 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 120 tctagagggg agatcaagct gtgtgaaa 28 <210> 121 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 121 cgctgcctgc agtggaccac tcc 23 <210> 122 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 122 gcctccagtt ttttatatat tctcctacat gaggaa 36 <210> 123 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 123 cccaacacca cctgctccaa ccct 24 <210> 124 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 124 gatacagctg gacaagaaga gtacagtgac 30 <210> 125 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 125 tgcctacgcc accagctcca tt 22 <210> 126 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 126 cacagcaggt caagaggagt acagtgac 28 <210> 127 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 127 atcctctctc tgaaatcact gagcaggac 29 <210> 128 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 128 caaatgaatg atgcacatca tggtggcgt 29 <210> 129 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 129 ccatcgagat ttcactgtag ctagaccaaa aaa 33 <210> 130 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic oligonucleotide <400> 130 ctgagatcag ccaaagtcag ttattttttc tgac 34

Claims (36)

  1. 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 1 내지 10,000개의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법으로서, 상기 방법은:
    (a) 각각의 표적 게놈 영역에 대해, 1 내지 10,000개의 표적 게놈 영역을 포함하는 DNA 샘플에 하기를 도입하는 단계:
    (i) 5'에서 3' 말단으로, (A) 제1 영역, (B) 0 내지 50개의 뉴클레오티드 길이를 갖는 제2 영역, 및 (C) 제1 특정 게놈 영역을 표적화하는 제3 영역을 포함하는, 제1 올리고뉴클레오티드; 및
    (ii) 5'에서 3' 말단으로, (A) 제4 영역, (B) 0 내지 50개의 뉴클레오티드 길이를 갖는 제5 영역, (C) 적어도 4개의 축퇴성 뉴클레오티드를 포함하는 고유한 분자 식별자(UMI)를 포함하는 제6 영역, 및 (D) 제2 특정 게놈 영역을 표적화하는 제7 영역을 포함하는, 제2 올리고뉴클레오티드;
    (b) 적어도 2회 주기의 PCR 증폭을 수행하여 제1 PCR 증폭 산물을 생성하는 단계;
    (c) 제1 PCR 증폭 산물에 하기를 도입하는 단계:
    (i) 제1 영역을 포함하는 제3 올리고뉴클레오티드; 및
    (ii) 제4 영역을 포함하는 제4 올리고뉴클레오티드;
    (d) 적어도 2회 주기의 PCR 증폭을 수행하여, 제2 PCR 증폭 산물을 생성하는 단계;
    (e) 제2 PCR 증폭 산물에 하기를 도입하는 단계:
    (i) 각각의 표적 게놈 영역에 대한 제5 올리고뉴클레오티드(블로커 변위 증폭 (BDA) 정방향 프라이머)로서, 상기 BDA 정방향 프라이머는 특정 게놈 영역을 표적화하는 제8 영역을 포함하고, 상기 제8 영역에 의해 표적화된 게놈 영역은 제3 영역에 의해 표적화된 게놈 영역과 비교하여 제7 영역에 더 가까운 1 내지 20개의 뉴클레오티드인, 제5 올리고뉴클레오티드,
    (ii) 각각의 표적 게놈 영역에 대한 제6 올리고뉴클레오티드(BDA 블로커)로서, 상기 BDA 정방향 프라이머 서열의 3' 말단에서 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하고;
    상기 BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 함유하고, 상기 BDA 블로커의 농도는 BDA 정방향 프라이머 농도의 적어도 2배인, 제6 올리고뉴클레오티드, 및
    (iii) 제4 영역을 포함하는, 제7 올리고뉴클레오티드; 및
    (f) 적어도 2회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 생성하는 단계;
    를 포함하는, 방법.
  2. 제1항에 있어서, 상기 단계 (a)에서 제1 올리고뉴클레오티드의 제1 영역 및 단계 (a)에서 제2 올리고뉴클레오티드의 제4 영역은 단계 (c)에서 수행되는 범용 증폭을 위한 결합 부위를 생성하는 것인, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 제2 올리고뉴클레오티드의 제4 영역은 차세대 시퀀싱(NGS) 어댑터 서열의 적어도 일부를 포함하는 것인, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 및 제4 영역의 용융 온도는 제3 및 제7 영역의 용융 온도보다 0.01℃ 내지 10℃ 더 높은 것인, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제6 영역의 축퇴성 뉴클레오티드는 각각 독립적으로 A, T 또는 C 중 하나인 것인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 단계 (d)로부터의 제1 PCR 증폭 산물은 단계 (e) 이전에 SPRI 정제, 컬럼 정제 및 효소 분해로 이루어진 군으로부터 선택되는 방법을 사용하여 정제되는 것인, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 단계 (a)는 5'에서 3' 말단으로, 위유전자 또는 다른 목적하지 않은 게놈 영역을 표적화하는 서열 및 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하는 블로커 올리고뉴클레오티드를 DNA 샘플에 도입하는 단계를 추가로 포함하는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    (g) 단계 (f)에서 수득된 PCR 증폭 산물에 하기를 도입하는 단계, (i) 5'에서 3' 말단으로, 제9 영역 및 제8 영역을 포함하는, 제8 올리고뉴클레오티드로서, 상기 제9 영역은 차세대 시퀀싱(NGS) 어댑터 서열의 적어도 일부를 포함하는 것인, 제8 올리고뉴클레오티드, 및 선택적으로 (ii) 제4 영역을 포함하는, 제9 올리고뉴클레오티드; 및
    (h) 적어도 1회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 수득하는 단계:
    를 추가로 포함하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    (i) 단계 (f)에서 수득된 PCR 증폭 산물에 NGS 어댑터 서열을 결찰 반응에 의해 추가하는 단계:
    를 추가로 포함하는, 방법.
  10. 제8항 또는 제9항에 있어서, PCR에 의해 NGS 인덱스를 추가하고 제3 PCR 증폭 산물을 정제하는 단계를 추가로 포함하는, 방법.
  11. 제10항에 있어서, 상기 정제는 SPRI 정제, 컬럼 정제, 또는 효소 분해를 포함하는, 방법.
  12. 제10항 또는 제11항에 있어서, 고처리량 DNA 시퀀싱을 수행하는 단계를 추가로 포함하는, 방법.
  13. 제12항에 있어서, 상기 고처리량 DNA 시퀀싱은 차세대 시퀀싱인 것인, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 단계 (d)에서 사용된 어닐링 온도는 단계 (b)에서 사용된 어닐링 온도보다 0.01℃ 내지 10℃ 더 높은 것인, 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 1 내지 10,000개의 표적 게놈 영역 중 적어도 하나는 AKT1, ALK, APC, AR, ATM, BRAF, CCND1, CDK4, CDKN2A, CHEK2, CTNNB1, DDR2, EGFR, ERBB2, ERBB3, ERBB4, ESR1, EZH2, FBXW7, FGFR1, FGFR2, FGFR3, FGFR4, FLT3, FOXL2, GNA11, GNAQ, GNAS, HRAS, IDH1, JAK1, JAK2, JAK3, KIT, KRAS, MAP2K1, MAP2K2, MET, MLH1, MPL, MTOR, MYC, MYCN, MYD88, NPM1, NRAS, PDGFRA, PIK3CA, PTEN, PTPN11, RAF1, RB1, RET, ROS1, SF3B1, SMAD4, SMARCB1, SMO, STK11, 및 TP53으로 이루어진 군으로부터 선택되는 것인, 방법.
  16. 1 내지 10,000개의 표적 게놈 영역에서 변이체 서열의 변이체 대립유전자 빈도(VAF)를 정량화하기 위한 방법으로서, 상기 방법은:
    (a) 표적 게놈 영역에 대한 올리고뉴클레오티드 및 블로커의 패널을 설계하는 단계;
    (b) 제1항 내지 제15항 중 어느 한 항의 방법에 따라 표적화된 게놈 영역의 각각의 가닥을 표지화하고 증폭하는 단계; 및
    (c) 고처리량 시퀀싱 데이터 및 DNA 샘플의 입력량을 기반으로 변이체 서열의 VAF를 결정하는 단계;
    를 포함하는, 방법.
  17. 제16항에 있어서, 상기 단계 (a)는
    (i) 선택된 각각의 게놈 영역에 대한 프라이머 세트를 설계하는 단계로서; 제1, 제2, 제5, 제6 및 제8 올리고뉴클레오티드를 함유하는 각각의 프라이머 세트는 제1항 내지 제15항에 기재된 바와 같은 것인, 단계;
    (ii) 선택된 모든 게놈 영역의 범용 증폭에 사용될 제3 및 제4 올리고뉴클레오티드를 설계하는 단계; 및
    (iii) 프라이머가 비-표적 영역의 비특이적 증폭을 잘 일으키지 않도록 전체 게놈에서 프라이머 세트의 특이성을 확인하는 단계:
    를 포함하는, 방법.
  18. 제16항 또는 제17항에 있어서, 상기 단계 (c)는
    (i) NGS 리드를 표적화된 앰플리콘 영역에 정렬하고, NGS 리드를 이들이 정렬된 영역에 따라 영역-특정 하위그룹으로 그룹화하는 단계;
    (ii) 각각의 유전자좌에서, NGS 리드를 UMI 서열에 따라 나누는 단계로서, 상기 UMI 서열을 수반하는 모든 NGS 리드는 하나의 UMI 패밀리로 그룹화되는 것인, 단계;
    (iii) PCR 또는 NGS 오류의 결과일 가능성이 있는 UMI 패밀리를 제거하는 단계;
    (iv) 각각의 남은 UMI 패밀리에 대한 유전자형을 결정하는 단계;
    (v) 원래 가닥의 수를 나타내는, 각각의 표적화된 유전자 영역에서 각각의 변이체 서열에 대한 고유한 UMI 수 N (하나의 유전자좌에서 상이한 UMI 서열의 총 개수)을 계수하는 단계; 및
    (vi) VAF = N var /(N 입력 *수율)로 변이체 서열에 대한 VAF를 계산하는 단계로서, 상기 N var는 변이체 서열에 대한 고유한 UMI 수이고, N 입력 은 QBDA에 대한 DNA 입력의 가닥 수이고, 수율은 QBDA 반응에 대한 전체 전환 수율인 것인, 단계:
    를 포함하는, 방법.
  19. 제18항에 있어서, 상기 UMI 패밀리는 UMI 서열이 UMI 축퇴성 기반 설계 패턴을 충족하지 않거나 UMI 패밀리가 UMI 패밀리 크기 <F min 을 갖는 경우, PCR 또는 NGS 오류의 결과일 가능성이 있는 것으로 간주되며, 상기 F min 은 2 내지 20인 것인, 방법.
  20. 제18항 또는 제19항에 있어서, 상기 단계 (iv)는 동일한 UMI 패밀리에서 리드의 적어도 70%에 의해 지원되는 유전자형을 결정하는 것을 포함하는, 방법.
  21. 제18항 또는 제19항에 있어서, 상기 단계 (iv)는 WT 리드가 UMI 패밀리의 P WT 리드 초과에 의해 지원되는 경우, 유전자형을 야생형(WT)으로 결정하는 것을 포함하고, 상기 P WT는 0.01% 내지 50%인 것인, 방법.
  22. 제18항 내지 제21항 중 어느 한 항에 있어서, 상기 단계 (v)는 더 큰 패밀리 크기를 갖는 다른 UMI와 1개 또는 2개의 염기만 상이한 UMI 서열을 제거하는 단계를 추가로 포함하는, 방법.
  23. 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 적어도 하나의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법으로서, 상기 방법은:
    (a) 고유한 분자 식별자(UMI)를 적어도 하나의 표적 게놈 영역에 추가하는 단계;
    (b) 범용 정방향 프라이머 및 범용 역방향 프라이머를 사용하여 단계 (a)로부터의 적어도 하나의 표적 게놈 영역을 증폭시켜 제1 PCR 증폭 산물을 생성하는 단계로서, 상기 적어도 하나의 표적 게놈 영역은 UMI를 포함하는 것인, 단계; 및
    (c) 블로커 변위 증폭(BDA) 정방향 프라이머, BDA 블로커 및 범용 역방향 프라이머를 사용하여 제1 PCR 증폭 산물을 증폭시켜 제2 PCR 증폭 산물을 생성하는 단계;
    를 포함하는, 방법.
  24. 제23항에 있어서, 상기 단계 (a)는 적어도 2회 주기의 PCR 증폭을 포함하는 것인, 방법.
  25. 제23항 또는 제24항에 있어서, 상기 단계 (b)는 적어도 2회 주기의 PCR 증폭을 포함하는 것인, 방법.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, 상기 단계 (c)는 적어도 2회 주기의 PCR을 포함하는 것인, 방법.
  27. 제23항 내지 제26항 중 어느 한 항에 있어서, 상기 BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하는 것인, 방법.
  28. 제23항 내지 제27항 중 어느 한 항에 있어서, BDA 정방향 프라이머 서열의 3' 말단에 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하는 것인, 방법.
  29. 제23항 내지 제28항 중 어느 한 항에 있어서, 상기 BDA 블로커의 농도는 BDA 정방향 프라이머의 농도의 적어도 2배인, 방법.
  30. 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 적어도 하나의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법으로서, 상기 방법은:
    (a) 적어도 하나의 표적 게놈 영역을 포함하는 DNA 샘플에 하기를 도입하는 단계:
    (i) 제1 특정 게놈 영역을 표적화하는 제3 영역을 포함하는, 제1 올리고뉴클레오티드; 및
    (ii) 적어도 4개의 축퇴성 뉴클레오티드를 포함하는 고유한 분자 식별자(UMI)를 포함하는 영역, 및 제2 특정 게놈 영역을 표적화하는 영역을 포함하는, 제2 올리고뉴클레오티드;
    (b) 적어도 2회 주기의 PCR 증폭을 수행하여 제1 PCR 증폭 산물을 생성하는 단계;
    (c) 제1 PCR 증폭 산물에 하기를 도입하는 단계:
    (i) 범용 정방향 프라이머; 및
    (ii) 범용 역방향 프라이머;
    (d) 적어도 2회 주기의 PCR 증폭을 수행하여, 제2 PCR 증폭 산물을 생성하는 단계;
    (e) 제2 PCR 증폭 산물에 하기를 도입하는 단계:
    (i) 특정 게놈 영역을 표적화하는 블로커 변위 증폭(BDA) 정방향 프라이머로서, 상기 제8 영역에 의해 표적화된 게놈 영역은 제3 영역에 의해 표적화된 게놈 영역과 비교하여 제7 영역에 더 가까운 1 내지 20개의 뉴클레오티드인, 블로커 변위 증폭(BDA) 정방향 프라이머,
    (ii) 표적 게놈 영역에 대한 BDA 블로커로서, 상기 BDA 정방향 프라이머 서열의 3' 말단에서 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하고; 상기 BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 함유하는 것인, BDA 블로커; 및
    (iii) 범용 역방향 프라이머; 및
    (f) 적어도 2회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 수득하는 단계;
    를 포함하는, 방법.
  31. 제30항에 있어서, 상기 제2 PCR 증폭 산물은 단계 (d)와 단계 (e) 사이에서 정제되는 것인, 방법.
  32. 제30항 또는 제31항에 있어서, 상기 BDA 블로커의 농도는 BDA 정방향 프라이머의 농도의 적어도 2배인, 방법.
  33. 중합효소 연쇄 반응(PCR)에 의해 올리고뉴클레오티드 바코드 서열로 1 내지 10,000개의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 방법으로서, 상기 방법은:
    (a) 각각의 표적 게놈 영역에 대해, 1 내지 10,000개의 표적 게놈 영역을 포함하는 DNA 샘플에 하기를 도입하는 단계:
    (i) 5'에서 3' 말단으로, (A) 제1 영역, (B) 0 내지 50개의 뉴클레오티드 길이를 갖는 제2 영역, 및 (C) 제1 특정 게놈 영역을 표적화하는 제3 영역을 포함하는, 제1 올리고뉴클레오티드; 및
    (ii) 5'에서 3' 말단으로, (A) 제4 영역, (B) 0 내지 50개의 뉴클레오티드 길이를 갖는 제5 영역, (C) 적어도 4개의 축퇴성 뉴클레오티드를 포함하는 고유한 분자 식별자(UMI)를 포함하는 제6 영역, 및 (D) 제2 특정 게놈 영역을 표적화하는 제7 영역을 포함하는, 제2 올리고뉴클레오티드;
    (b) 적어도 2회 주기의 PCR 증폭을 수행하여 제1 PCR 증폭 산물을 생성하는 단계;
    (c) 제1 PCR 증폭 산물에 하기를 도입하는 단계:
    (i) 제1 영역을 포함하는 제3 올리고뉴클레오티드; 및
    (ii) 제4 영역을 포함하는 제4 올리고뉴클레오티드;
    (d) 적어도 2회 주기의 PCR 증폭을 수행하는 단계로서, 상기 어닐링 온도는 제2 PCR 증폭 산물을 생성하기 위해 단계 (b)에서 사용된 어닐링 온도보다 0.01℃ 내지 10℃ 더 높은 것인, 단계;
    (e) 제2 PCR 증폭 산물을 정제하여 단일-가닥 프라이머를 제거하는 단계:
    (f) 단계 (e)에서 정제된 제2 PCR 증폭 산물에 하기를 도입하는 단계:
    (i) 각각의 표적 게놈 영역에 대한 제5 올리고뉴클레오티드(블로커 변위 증폭 (BDA) 정방향 프라이머)로서, 상기 BDA 정방향 프라이머는 특정 게놈 영역을 표적화하는 제8 영역을 포함하고, 상기 제8 영역에 의해 표적화된 게놈 영역은 제3 영역에 의해 표적화된 게놈 영역과 비교하여 제7 영역에 더 가까운 1 내지 20개의 뉴클레오티드인, 제5 올리고뉴클레오티드,
    (ii) 각각의 표적 게놈 영역에 대한 제6 올리고뉴클레오티드(BDA 블로커)로서, 상기 BDA 정방향 프라이머 서열의 3' 말단에서 4개 이상의 뉴클레오티드가 또한 BDA 블로커 서열의 5' 말단에 또는 그 근처에 존재하고; 상기 BDA 블로커는 DNA 중합효소에 의한 연장을 방지하는 3' 서열 또는 변형을 포함하고, 상기 BDA 블로커의 농도는 BDA 정방향 프라이머의 농도의 적어도 2배인, 제6 올리고뉴클레오티드, 및
    (iii) 제4 영역을 포함하는, 제7 올리고뉴클레오티드; 및
    (g) 적어도 2회 주기의 PCR 증폭을 수행하여 제3 PCR 증폭 산물을 생성하는 단계;
    를 포함하는, 방법.
  34. 중합효소 연쇄 반응에 의해 올리고뉴클레오티드 바코드 서열로 적어도 1개의 표적 게놈 영역의 각각의 가닥을 표지화하고 증폭하기 위한 키트로서, 상기 키트는:
    (a) DNA 중합효소;
    (b) dNTP;
    (c) 적어도 하나의 블로커 변위 증폭(BDA) 정방향 프라이머;
    (d) 적어도 하나의 BDA 블로커;
    (e) 적어도 하나의 범용 정방향 프라이머;
    (f) 적어도 하나의 범용 역방향 프라이머; 및
    (g) 고유한 분자 식별자를 포함하는 적어도 하나의 올리고뉴클레오티드;
    를 포함하는, 키트.
  35. 제34항에 있어서, 상기 키트는 (h) DNA 중합효소 버퍼를 추가로 포함하는, 키트.
  36. 제34항 또는 제35항에 있어서, 상기 키트는 (i) 뉴클레아제-무함유 물을 추가로 포함하는, 키트.
KR1020227040315A 2020-05-01 2021-04-30 무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱 KR20230006852A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063018922P 2020-05-01 2020-05-01
US63/018,922 2020-05-01
PCT/US2021/030249 WO2021222798A1 (en) 2020-05-01 2021-04-30 Quantitative blocker displacement amplification (qbda) sequencing for calibration-free and multiplexed variant allele frequency quantitation

Publications (1)

Publication Number Publication Date
KR20230006852A true KR20230006852A (ko) 2023-01-11

Family

ID=78374023

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227040315A KR20230006852A (ko) 2020-05-01 2021-04-30 무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱

Country Status (7)

Country Link
US (1) US20230220456A1 (ko)
EP (1) EP4146663A4 (ko)
KR (1) KR20230006852A (ko)
CN (1) CN115996938A (ko)
AU (1) AU2021263433A1 (ko)
CA (1) CA3176980A1 (ko)
WO (1) WO2021222798A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115927593A (zh) * 2022-11-12 2023-04-07 复旦大学附属妇产科医院 一种检测低比例嵌合变异的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019164885A1 (en) * 2018-02-20 2019-08-29 William Marsh Rice University Systems and methods for allele enrichment using multiplexed blocker displacement amplification
WO2020041702A1 (en) * 2018-08-24 2020-02-27 Swift Biosciences, Inc. Asymmetric targeted amplification methods
US20220098642A1 (en) * 2019-01-04 2022-03-31 William Marsh Rice University Quantitative amplicon sequencing for multiplexed copy number variation detection and allele ratio quantitation

Also Published As

Publication number Publication date
EP4146663A1 (en) 2023-03-15
AU2021263433A1 (en) 2022-12-01
CN115996938A (zh) 2023-04-21
US20230220456A1 (en) 2023-07-13
CA3176980A1 (en) 2021-11-04
EP4146663A4 (en) 2024-05-29
WO2021222798A1 (en) 2021-11-04

Similar Documents

Publication Publication Date Title
US11214798B2 (en) Methods and compositions for rapid nucleic acid library preparation
JP6998404B2 (ja) 標的ヌクレオチド配列の富化及び決定方法
JP7220200B2 (ja) ライブラリー構築および配列解析のための組成物および方法
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
AU2012304520B2 (en) Circularized templates for sequencing
CN117778527A (zh) 用于识别核酸分子的组合物和方法
US20110212846A1 (en) Methods and compositions for universal detection of nucleic acids
JP2016513461A (ja) 出生前遺伝子分析システム及び方法
US20220098642A1 (en) Quantitative amplicon sequencing for multiplexed copy number variation detection and allele ratio quantitation
US20220267848A1 (en) Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion
CN110869515A (zh) 用于基因组重排检测的测序方法
KR20230006852A (ko) 무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱
US11174511B2 (en) Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture
US20230250470A1 (en) Amplicon comprehensive enrichment
JP2024099616A (ja) ゲノム再編成検出のための配列決定方法

Legal Events

Date Code Title Description
A201 Request for examination