KR20240032631A - 변이체 핵산의 정확한 병렬 정량을 위한 고감도 방법 - Google Patents

변이체 핵산의 정확한 병렬 정량을 위한 고감도 방법 Download PDF

Info

Publication number
KR20240032631A
KR20240032631A KR1020230107264A KR20230107264A KR20240032631A KR 20240032631 A KR20240032631 A KR 20240032631A KR 1020230107264 A KR1020230107264 A KR 1020230107264A KR 20230107264 A KR20230107264 A KR 20230107264A KR 20240032631 A KR20240032631 A KR 20240032631A
Authority
KR
South Korea
Prior art keywords
probe
sequence
oligo
cross
target
Prior art date
Application number
KR1020230107264A
Other languages
English (en)
Inventor
유하-페카 푸르시헤이모
타투 히르보넨
안토니 코르키아코스키
마누 탐미넨
Original Assignee
게노밀 헬스 오와이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 게노밀 헬스 오와이 filed Critical 게노밀 헬스 오와이
Publication of KR20240032631A publication Critical patent/KR20240032631A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/125Rolling circle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/543Detection characterised by immobilisation to a surface characterised by the use of two or more capture oligonucleotide primers in concert, e.g. bridge amplification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명의 개시는 차세대 DNA 시퀀싱 방법, 및 하나 이상의 핵산 표적의 정확한 대량 병렬 정량화를 위한 용도, 예를 들어 대량의 미정제 샘플 물질에서의 정량화를 위한 용도에 관한 것이다. 보다 구체적으로, 본 발명은 복잡한 샘플에서 유전적 표적을 검출하고 정량화하기 위한 프로브를 포함하는 방법 및 키트에 관한 것이다. 본 발명은 유전적 표적당 하나 이상의 표적 특이적 핵산 프로브(제1 프로브, 제2 프로브 및 표적 특이적 프로브) 및 가교 올리고 또는 가교 올리고 복합체를 포함한다.

Description

변이체 핵산의 정확한 병렬 정량을 위한 고감도 방법{Highly sensitive methods for accurate parallel quantification of variant nucleic acids}
본 발명의 개시는 하나 이상의 핵산 표적의 정확한 대량 병렬 정량화(massively parallel quantification)를 위한 개선된 차세대 DNA 시퀀싱 방법에 관한 것이다. 보다 구체적으로, 본 개시는 유전적 표적 및 변이체 검출에 주로 사용되는 복합 DNA 풀에서 유전적 표적을 검출하고 정량화하기 위한 프로브를 포함하는 방법 및 키트에 관한 것이다.
유전적 변이(genetic variation)를 연구하는 기술의 발전으로, 식물 및 동물에서 유전적 변이를 검출하는 것은 복잡하지 않다. 그러나, 특히 약한 신호를 갖는 샘플에서 돌연변이와 같은 유전적 변이를 검출하고 정확하게 정량화하는 것은 감소된 시퀀싱 비용에도 불구하고, 현재 여전히 번거롭고, 어렵고, 비용이 많이 든다. 컨센서스 백그라운드(consensus background)에 대해 유전적 신호를 검출하기 위한 특이도, 약한 유전적 신호를 검출하기 위한 민감도, 검출된 신호의 정확한 정량화를 위한 정확도, 분석당 표적화된 유전자 표적의 처리량(throughput number), 분석당 비용, 복수의 샘플을 병렬로 분석할 때 분석 비용 규모를 결정하는 확장성(scaling), 및 샘플링에서 결과까지 걸리는 시간을 결정하는 전환율(turnover)과 같은 다양한 문제가 보다 정확하게 표현될 수 있다.
현재, 액체 생검 및 개념적으로 유사한 분석(예를 들면, 항생제 내성 유전자 검출)에 대한 일반적인 정량화 방법은 정량적 PCR(qPCR), 어레이 qPCR, 디지털 PCR, MLPA(multiplex ligation-dependent probe amplification) 또는 차세대 DNA 시퀀싱 데이터로부터의 정량화를 포함한다. 정량화 방법은 강건하고(robust), 잘 확립된 방법이지만, 각각의 방법은 하기에서 보다 상세하게 검토되는 특정 문제와 연관된다:
정량적 PCR: 정량적 PCR(qPCR)은 PCR 동안, 즉, 실시간으로, 표적 DNA 분자의 증폭을 포함하는 기술이다. 실시간 PCR은 정량적으로(정량적 실시간 PCR), 및 반-정량적으로, 즉, DNA 분자의 일정량 초과/미만(반정량적 실시간 PCR)으로 사용될 수 있다. 정량적 PCR(qPCR)은 유전적 표적 정량화의 최고 기준(gold standard)이다. 현재 qPCR 반응의 실험실 비용은 약 $2이다. 그러나, 반응 설정을 위한 상당한 수작업 시간(인건비), 각 정량화된 표적에 대한 재현 반복물과 함께, 표준 곡선의 필요성을 고려하면 실제 비용은 실제로 훨씬 더 높다. 각각의 유전적 표적에 대해 별도의 정량화 실험이 필요하기 때문에 실습 시간(hands-on time)의 양은 샘플 수가 증가함에 따라 급격히 증가한다.
어레이 PCR: PCR 어레이는 관련 경로- 또는 질병-집중(pathway- or disease-focused) 유전자 패널의 발현을 분석하기 위한 가장 신뢰할 수 있는 도구이다. 각각의 96-웰 플레이트, 384-웰 플레이트 또는 100-웰 디스크 PCR 어레이는 철저하게 연구된 집중 유전자 패널에 대한 SYBR Green-최적화 프라이머 분석을 포함한다. qPCR 기술의 새로운 버전(iteration)은 개별 qPCR 반응을 소형화하는 어레이 qPCR이다. 어레이 PCR은 개별 qPCR 반응의 비용을 낮추고 복수의 표적 및 샘플에 대한 방법의 확장성(scalability)을 개선한다. 그러나, 이 방법은 현재 칩당 수천 달러의 비용과 판독 인프라(read-out infrastructure)의 큰 자본 비용으로 12개 샘플에서 384개 표적(또는 반대로 384개 샘플에서 12개 표적)을 프로파일링하는 것으로 제한된다. 따라서, 전술된 설정을 이용하여 수천 개의 샘플을 프로파일링하는 것은 여전히 엄청나게 비싸다.
디지털 PCR: 디지털 중합효소 연쇄 반응(디지털 PCR, DigitalPCR, dPCR 또는 dePCR)은 액적-미세유체(droplet-microfluidics) 및 형광 검출을 통해 표적의 절대 정량화를 제공하는 방법이다. 이 방법론은 상대적으로 비용 효율적이지만(샘플당 하나의 표적 비용은 약 $3), 각 샘플의 각 표적에 대한 개별 실험을 준비, 설정 및 수행하는 실습 시간은 수천 개의 샘플까지 잘 확장되지 않는다.
MLPA(Multiplex Ligation-dependent Probe Amplification)는 개별 샘플에서 복수의 유전적 표적의 검출을 단순화하는 접근 방식을 제공한다. 그러나, MLPA는 표적의 상대적 정량화만 제공하며, 각 샘플에 대해 별도의 검출 실험이 필요하다. 보다 최근에는, MLPA의 변형이 DNA 바코딩(barcoding)으로부터의 개념을 도입한다. 이 개념은 전통적인 MLPA 워크플로(workflow)보다 더 우수한 정량적 분해능과 샘플 멀티플렉싱을 허용한다.
차세대 시퀀싱-기반 접근법: 차세대 시퀀싱(NGS)은 서열 기반 유전자 발현 분석을 아날로그 기술에 대한 "디지털" 대안으로 만드는 고-처리량 시퀀싱(high-throughput sequencing: HTS)으로도 알려져 있다. 차세대 DNA 시퀀싱 데이터의 표적 카운팅(counting)은 DNA 시퀀싱 비용이 계속 감소함에 따라 점점 더 매력적이 되고 있으며, 예를 들면, 비침습적 산전 검사 스크리닝에서 현재 사용되고 있다. 그러나, 현재의 접근 방식은 높은 시퀀싱 라이브러리 제조 비용 및 관련 없는 유전자 표적 시퀀싱에 낭비되는 시퀀싱 노력으로 인해 어려움을 겪고 있다. 예를 들어, 암 관련 액체 생검에서, 비-표적화(non-targeted) 접근법은 종양학적으로 관련 없는 유전자좌에 대한 시퀀싱 노력의 낭비를 초래한다. 태아 진단에서, 유전자좌의 비-표적화 샘플링은 데이터 해석을 위한 통계적 옵션을 상당히 제한한다. Guardant Health Inc는 RNA 포획 프로브(capture probe)의 어레이가 차세대 DNA 시퀀싱을 위한 표적을 풍부하게 하는 것인 보다 표적화된 시퀀싱 접근 방식을 제공한다.
Akhraset al. (2007) PLoS ONE 2(2):e223은 바코딩된 표적-특이적 프로브, 표적 환형화(circularization) 및 시퀀싱을 포함하는 다중 병원체 검출 분석을 개시한다. 표적-특이적 프로브를 라이게이션하기 위한 가교 올리고뉴클레오티드(bridging oligonucleotide)의 용도도 개시된다.
WO2018109206은 패드락 프로브(padlock probe) 및 롤링 서클 증폭(rolling circule amplification: RCA)을 이용하여 샘플에서 분석물을 검출하는 방법을 기술한다. 가교 올리고의 용도는 기술하지 않는다.
WO2019038372(참조로 포함됨)는 목적 표적 서열이 T7 폴리머라제에 대한 프로모터를 포함하는 라이게이션 복합체로부터의 인 비트로 전사에 의해 선택적으로 증폭되고, cDNA 합성 및 시퀀싱이 이어지는 것인 차세대 시퀀싱 접근법을 기술한다. 이 방법은 샘플 중 다수의 표적 서열의 정확한 병렬 검출 및 정량화를 가능하게 하나, 보다 복잡하고, 부피가 크고, 희석되고, 및/또는 불순한 샘플은 여전히 도전 과제이다.
따라서, 전술된 논의에 비추어, 핵산 표적의 정확한 대량 병렬 정량화를 통해 특이도, 민감도, 정확도, 처리량, 비용, 확장성, 및 전환율과 같은, 그러나 이에 한정되지 않는 전술된 단점을 극복해야 하는 요구가 존재한다.
본 발명은 대량 샘플(최대 수십 밀리리터) 및/또는 희석 및/또는 미정제 샘플 물질로부터 매우 민감하고 확장 가능하며 정확한 표적 정량화를 위해 차세대 시퀀싱을 사용하는 방법을 제공한다. 또한, WO2019038372에 기재된 된 것과 같은 RNA 증폭 단계를 피하여, 방법을 더 간단하게 만든다. 또한, 본 발명의 방법은 표적 서열 증폭 단계를 포함하고, 상기 단계에서, 추가적인 표적 특이적 프로브 또는 다수의 추가적인 표적 특이적 프로브가 특정 서열, 예를 들어, 드문(rare) 서열을 특이적으로 증폭하고, 따라서 특이적으로 농축하기 위해 사용된다. 이는 과량의 관련되나, 동일하지 않은 서열을 포함하는 샘플에서 이러한 드문 서열의 검출을 가능하게 한다. 예를 들어, 이 방법은 과량의 기타 대립 유전자를 포함하는 샘플에서 유전자의 드문 대립 유전자를 검출하기 위해 이용될 수 있다.
제1 주요 양태에서, 본 발명은 샘플에서 하나 이상의 표적 뉴클레오티드 서열을 검출하는 방법에 관한 것이고, 상기 방법은:
(i) 상기 샘플의 각 표적 뉴클레오티드 서열에 대해, 제1 프로브, 제2 프로브 및 가교 올리고(bridge oligo) 또는 서로 어닐링하여 가교 올리고 복합체(bridge oligo complex)를 형성할 수 있는 복수의 올리고뉴클레오티드를 제공하는 단계로서,
상기 제1 프로브는 분자의 5' 말단에서 시작하여, 제1 가교 올리고-특이적 서열, 선택적으로, 제1 서열 바코드, 및 제1 프로브의 3' 말단에 있는 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 분자의 5' 말단에서 시작하여, 제2 표적 특이적 부분, 선택적으로, 제2 서열 바코드, 및 제2 프로브의 3' 말단에 있는 제2 가교 올리고-특이적 서열을 포함하고;
상기 가교 올리고 또는 가교 올리고 복합체는 각각 상기 제1 프로브 및 상기 제2 프로브의 제1 가교 올리고-특이적 서열 및 제2 가교 올리고-특이적 서열에 상보적인 서열, 및 선택적으로, 제3 바코드를 포함하고;
상기 제1 서열 바코드 또는 상기 제2 서열 바코드 또는 상기 제3 바코드 중 하나 이상은 각각 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체에 존재하고; 및
선택적으로, 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체 중 하나 이상은 엔도뉴클레아제에 대한 인식 서열을 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 상기 제2 프로브를 상기 가교 올리고, 또는 서로 어닐링하여 가교 올리고 복합체를 형성하고, 복수의 라이게이션 복합체로의 자가-어닐링(self-annealing)을 가능하게 하는 복수의 올리고뉴클레오티드와 접촉시키는 단계;
(iii) 표적 뉴클레오티드 서열에 대해 테스트될 상기 샘플에 존재하는 핵산을 상기 라이게이션 복합체와 접촉시키는 단계;
(iv) 각각의 제1 프로브 및 제2 프로브의 상기 제1 표적 특이적 부분 및 상기 제2 표적 특이적 부분이 표적 서열 상의 필수적으로 인접한 섹션(essentially adjacent section)에 혼성화될 수 있게 하여, 혼성화 복합체를 형성하는 단계;
(v) 상기 혼성화 복합체에서 프로브를 라이게이션시켜, 라이게이션된 라이게이션 복합체를 제공하는 단계;
(vi) 상기 라이게이션된 라이게이션 복합체가 표적 뉴클레오티드 서열로부터 분리되게 하는 단계;
(vii) 상기 표적 뉴클레오티드 서열에 상응하는 서열을 포함하는 표적-특이적 프로브로서, 상기 라이게이션된 라이게이션 복합체와 어닐링할 수 있는 것인 표적-특이적 프로브를 첨가하고, 상기 표적 특이적 프로브가 상기 라이게이션된 라이게이션 복합체에 어닐링할 수 있게 하여, 증폭 주형을 형성하는 단계;
(viii) 가닥-치환 폴리머라아제(strand-displacing polymerase)에 의한 롤링 서클 증폭(RCA)을 이용하여, 상기 증폭 주형으로부터 핵산을 증폭시켜, 단일 가닥 콘카테머(concatemeric) 서열을 수득하는 단계;
(ix) 선택적으로, 단계 (i)에서 특정된 인식 서열이 존재하는 경우:
(a) 단계 (viii)에서 수득된 단일 가닥 콘카테머 서열을 절단하거나, 또는
(b) 단계 (viii)에서 수득된 증폭된 하나 이상의 단일 가닥 콘카테머 서열을 엔도뉴클레아제에 대한 인식 서열을 포함하는 특이적 올리고뉴클레오티드와의 어닐링에 적용하여, 상기 올리고뉴클레오티드는 단계 (i)에서 특정된 인식 서열과 어닐링하여 상기 엔도뉴클레아제에 대한 인식 부위가 수득되고, 어닐링된 복합체를 상기 엔도뉴클레아제로 절단하는 단계,
(x) 단계 (viii)에서 수득된 콘카테머 서열 또는 단계 (ix)에서 수득된 핵산 단편에 시퀀싱 기술을 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 상기 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 상기 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부를 결정하여 상기 샘플 중 상기 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계를 포함한다.
정의:
표적 뉴클레오티드 서열(target nucleotide sequence): 용어 표적 뉴클레오티드 서열은 검출이 필요한 목적 뉴클레오티드 서열일 수 있다. 주어진 용어는 연속한 뉴클레오티드의 서열 및 상보적인 서열을 가진 핵산 분자를 의미하는 것으로 이해될 것이다. 일부 구체예에서, 표적 서열은 다형성을 나타내거나 그와 관련된 뉴클레오티드 서열이다.
다형성(Polymorphism): 용어 다형성은 모집단에서 2개 이상의 유전적으로 결정된 대안적 서열(alternative sequence) 또는 대립유전자(allele)의 발생을 의미한다. 다형성 마커 또는 부위는 서열 분기(sequence divergence)가 발생하는 위치이다. 다형성 유전자좌(polymorphic locus)는 1 bp(base pair)만큼 작을 수 있다.
샘플(sample): 용어 샘플은 본원에서 2개 이상의 표적 서열을 포함하는 2개 이상의 샘플에 대해 사용된다. 본 발명에 따른 방법에서 제공되는 샘플은 적어도 표적 핵산을 추출하고 본 발명에서 사용되는 프로브에 접근할 수 있도록 준비되었을 수 있다. 특히, 일부 구체예에서, 샘플은 각각 적어도 2개의 상이한 표적 서열, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 250개, 보다 바람직하게는 적어도 500개, 가장 바람직하게는 적어도 2000개 이상의 상이한 표적 서열을 포함한다. 용어 샘플은 소변, 생검, 타액 및 기타 분비물, 호기 수분 추출물(exhaled moisture extract), 조직, 혈장(액체 생검)을 포함한, 인간/동물 신체로부터 수득된 2개 이상의 샘플, 또는 물, 폐수, 토양, 식물을 포함한, 환경으로부터 수득된 2개 이상의 샘플, 또는 바이러스 또는 박테리아 등을 포함하는 2개 이상의 샘플을 의미할 수 있으나, 이에 한정되지 않는다. 일 구체예에서, 복수의 샘플은 혈액 샘플, 타액 샘플, 소변 샘플 또는 대변 샘플, 다른 체액의 샘플 또는 신체 물질, 예를 들어, 모발 또는 피부 박편으로부터의 추출물을 포함한다.
프로브(probe): 용어 프로브는 가변적 길이(일반적으로 50-1000개의 염기 길이, 바람직하게는 50-200개의 염기 길이)의 DNA 또는 RNA의 단편으로, 프로브의 뉴클레오티드 서열에 상보적인 뉴클레오티드 서열(DNA 또는 RNA 표적)의 존재를 검출하기 위해 DNA 또는 RNA 샘플에서 사용될 수 있다. 표적 서열에 상보적인 올리고뉴클레오티드 프로브의 섹션은 샘플의 각 표적 서열에 대해 제1 프로브와 제2 프로브의 쌍이 제공되고, 그에 의해 프로브 각각은 그들의 극단(extreme end)에 표적 서열의 일부에 상보적인 섹션을 포함한다. 또한, 본 개시는 제1 프로브와 제2 프로브를 연결하기 위해 사용되는 가교 올리고(bridge oligo) 또는 가교 올리고 복합체(bridge oligo complex)를 기술한다. 또한, 표적 서열의 일부에 해당하는 서열을 포함하는 추가적인 표적 특이적 프로브 또는 부스팅(boosting) 프로브가 사용된다.
범용(universal): 증폭 절차를 기술하기 위해 사용될 때, 용어 범용은 복수의 증폭 반응에 대해 단일 프라이머 또는 프라이머 세트를 사용할 수 있게 하는 서열을 의미한다. 그러한 프라이머의 사용은 다수의 선택된 핵산 서열을 증폭하기 위해 단지 2개의 프라이머가 필요하다는 점에서 다중화(multiplexing)를 크게 단순화시킨다. 프라이밍 부위를 설명하기 위해 사용될 때, 용어 범용은 범용 프라이머(universal primer)가 혼성화할 부위이다. 범용 프라이밍 서열/프라이머의 "세트"가 사용될 수 있다는 점도 주목해야 한다.
혼성화(hybridization): 용어 혼성화(또는 혼성화(hybridisation))는 DNA 또는 RNA 분자가 상보적인 DNA 또는 RNA에 어닐링하는 과정을 기술한다. DNA 또는 RNA 복제 및 DNA의 RNA로의 전사는 모두 뉴클레오티드 혼성화에 의존한다.
라이게이션(ligation): 용어 라이게이션은 효소의 작용을 통해 두 개의 핵산 단편을 연결하는 것이다. DNA 리가아제는 상보적 가닥의 인접 부위에 결합된 두 개의 폴리뉴클레오티드 가닥(의 말단) 사이에 포스포디에스테르 결합의 형성을 촉매할 수 있는 효소이다. 일 구체예에서, 라이게이션은 특히 폴리뉴클레오티드의 인접한 양 말단이 변형되어 화학적 라이게이션을 가능하게 하는 경우, 화학적으로 수행될 수도 있다.
증폭(amplification): 본원에서 사용되는 용어 증폭은 뉴클레오티드 서열의 혼합물 내에서 특정 뉴클레오티드 서열의 농도를 증가시키기 위한 DNA 폴리머라아제의 사용을 의미한다 "PCR" 또는 "중합효소 연쇄 반응"은 특정 DNA/RNA 세그먼트의 인 비트로 효소 증폭을 위한 신속한 절차이다. 증폭될 DNA/RNA는 샘플을 가열하는 것에 의해 변성될 수 있다. 용어 프라이머(primer)는 DNA 합성의 출발점 역할을 하는 RNA 또는 DNA 가닥(일반적으로 약 18-22 개의 염기)이다. 이 과정을 촉매하는 효소인 DNA 폴리머라아제는 기존 DNA 가닥에 새로운 뉴클레오티드를 첨가만 할 수 있기 때문에, 프라이머가 DNA 복제를 위해 요구된다.
폴리머라아제(polymerase): 폴리머라아제는 핵산의 긴 사슬 또는 중합체를 합성하는 효소이다. DNA 폴리머라아제와 RNA 폴리머라아제는 각각 염기쌍 형성 상호작용을 이용하여 DNA 또는 RNA 주형 가닥을 카피하는 것에 의해 DNA 분자 및 RNA 분자를 조립하기 위해 사용된다.
고 처리량(high throughput): 용어 고 처리량은 많은 수의 DNA 샘플을 동시에 처리하고 스크리닝하고, 단일 DNA 샘플 내에서 많은 수의 상이한 유전자좌(locus)를 동시에 스크리닝하는 능력을 의미한다. HTS로 약칭되는 고-처리량 시퀀싱 또는 스크리닝(high-throughput sequencing or screening)은 특히, 다량의 샘플을 동시에 효과적으로 스크리닝하는 데 관련된 과학 실험 방법이다.
엔도뉴클레아제(endonuclease): 엔도뉴클레아제는 무작위 또는 특정된 위치에서 DNA 이중 가닥 또는 단일 가닥을 절단하는 효소이다.
바코드(barcode): 본 발명에서 사용되는 프로브 및 올리고는 뉴클레오티드 서열로 구성된 하나 이상의 바코드를 포함할 수 있다. 바코드 서열은 표적 계수(target enumeration)를 위한 표적 뉴클레오티드 서열 식별자(identifier) 서열, 샘플 식별자 서열 및/또는 분자 바코드(고유 분자 식별자(Unique Molecular Identifier)로도 지칭됨)를 포함할 수 있다. 바코드 서열은 랜덤 서열(random sequence)을 포함할 수 있다.
전술한 바와 같이, 본 개시는 라이게이션-의존 분석을 활용함으로써 매우 많은 수의 샘플에서 표적 뉴클레오티드 서열 검출의 고-처리량 검출 방법에 관한 것이다. 본 개시는 차세대 시퀀싱에 의해 허용되는 기술을 사용하여 복잡한 핵산 풀에서 유전적 표적의 서열을 결정하는 방법을 제공한다. 본 개시는 또한 라이게이션-의존 분석을 활용함으로써 다수의 샘플, 바람직하게는 매우 많은 샘플에서 다수의 유전적 표적을 프로파일링하는 방법을 제공한다. 본 개시는 복수의 샘플에서 상이한 표적 핵산을 쿼리(query)할 수 있는 다중 라이게이션-의존 프로브 증폭(multiplex ligation-dependent probe amplification)을 위한 방법을 제공한다. 본 발명의 방법은 상이한 표적 핵산에 대한 복수의 상이한 프로브 세트를 제공하여, 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 시퀀싱을 가능하게 한다. 시퀀싱 데이터를 처리할 때, 샘플 풀에서 유전적 표적의 식별 및 개별적인 샘플의 절대적 정량화를 위해 고유 서열 식별자(unique sequence identifier)가 사용된다.
제1 주요 양태에서, 본 발명은 샘플에서 하나 이상의 표적 뉴클레오티드 서열을 검출하는 방법에 관한 것이며, 상기 방법은:
(i) 상기 샘플의 각 표적 뉴클레오티드 서열에 대해, 제1 프로브, 제2 프로브 및 가교 올리고(bridge oligo) 또는 서로 어닐링하여 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 제공하는 단계로서,
상기 제1 프로브는 분자의 5' 말단에서 시작하여, 제1 가교 올리고-특이적 서열, 선택적으로, 제1 서열 바코드, 및 상기 제1 프로브의 3' 말단에 있는 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 분자의 5' 말단에서 시작하여, 제2 표적 특이적 부분, 선택적으로, 제2 서열 바코드, 및 상기 제2 프로브의 3' 말단에 있는 제2 가교 올리고-특이적 서열을 포함하며;
상기 가교 올리고 또는 가교 올리고 복합체는 각각 상기 제1 프로브 및 상기 제2 프로브의 제1 가교 올리고-특이적 서열 및 제2 가교 올리고-특이적 서열에 상보적인 서열, 및 선택적으로, 제3 바코드를 포함하고;
상기 제1 서열 바코드 또는 상기 제2 서열 바코드 또는 상기 제3 바코드 중 하나 이상은 각각 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체에 존재하고; 및
선택적으로, 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체 중 하나 이상은 엔도뉴클레아제에 대한 인식 서열을 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 상기 제2 프로브를 상기 가교 올리고, 또는 서로 어닐링하여 가교 올리고 복합체를 형성하고, 자가-어닐링하여 복수의 라이게이션 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키는 단계;
(iii) 상기 표적 뉴클레오티드 서열에 대해 테스트될 상기 샘플에 존재하는 핵산을 상기 라이게이션 복합체와 접촉시키는 단계;
(iv) 각각의 제1 프로브 및 제2 프로브의 상기 제1 표적 특이적 부분 및 상기 제2 표적 특이적 부분이 표적 서열 상의 필수적으로 인접한 섹션(essentially adjacent section)에 혼성화될 수 있게 하여, 혼성화 복합체를 형성하는 단계;
(v) 상기 혼성화 복합체에서 프로브를 라이게이션시켜, 라이게이션된 라이게이션 복합체를 제공하는 단계;
(vi) 상기 라이게이션된 라이게이션 복합체가 표적 뉴클레오티드 서열로부터 분리되게 하는 단계;
(vii) 상기 표적 뉴클레오티드 서열에 상응하는 서열을 포함하고, 상기 라이게이션된 라이게이션 복합체와 어닐링할 수 있는 것인 표적-특이적 프로브를 첨가하고, 상기 표적 특이적 프로브가 상기 라이게이션된 라이게이션 복합체에 어닐링할 수 있게 하여, 증폭 주형을 형성하는 단계;
(viii) 가닥-치환 폴리머라아제에 의한 롤링 서클 증폭(RCA)을 이용하여, 상기 증폭 주형으로부터 핵산을 증폭시켜, 단일 가닥 콘카테머(concatemeric) 서열을 수득하는 단계;
(ix) 선택적으로, 단계 (i)에서 특정된 인식 서열이 존재하는 경우:
(a) 단계 (viii)에서 수득된 단일 가닥 콘카테머 서열을 절단하거나, 또는
(b) 단계 (viii)에서 수득된 증폭된 하나 이상의 단일 가닥 콘카테머 서열을 엔도뉴클레아제에 대한 인식 서열을 포함하는 특이적 올리고뉴클레오티드와의 어닐링에 적용하여, 상기 올리고뉴클레오티드가 단계 (i)에서 특정된 인식 서열과 어닐링하여 상기 엔도뉴클레아제에 대한 인식 부위가 수득되고, 상기 엔도뉴클레아제로 상기 어닐링된 복합체를 절단하는 것에 의해 핵산 단편을 수득하는 단계를 수행하는 단계,
(x) 단계 (viii)에서 수득된 콘카테머 서열 또는 단계 (ix)에서 수득된 핵산 단편에 시퀀싱 기술을 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 상기 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 상기 제2 바코드, 및/또는 상기 제3 바코드의 적어도 일부를 결정하여 상기 샘플 중 상기 표적 뉴클레오티드 서열의 존재 및/또는 갯수를 확인하는 단계를 포함한다.
일 구체예에서, 상기 방법은 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고-처리량 검출을 위한 것이며, 복수의 샘플이 제공되고, 바람직하게는, 단계 (ii)는 각각의 샘플에 대해 별개의 튜브에서 수행된다.
일 구체예에서, 복수의 샘플이 단계 (viii) 전에 풀링된다(pooled).
도 1은 본 발명의 방법의 구체예의 비-한정적 예시를 제공한다.
본 발명의 방법은 4개 이상의 핵산 분자를 이용하며, 그 중 3개의 표적 특이적 핵산 프로브(제1 프로브, 제2 프로브 및 표적 특이적 프로브)는 유전적 표적에 특이적이며 하나 이상의 핵산 프로브는 일반적으로 범용(universal)이다(가교 올리고 또는 가교 올리고 복합체). 제1 프로브 및 제2 프로브는 가교 프로브 또는 가교 올리고 복합체에 혼성화하여 라이게이션 복합체를 형성한다. 샘플 DNA 또는 RNA 상에 있는 표적 식별 부위를 갖는 라이게이션 복합체(하나 이상의 바코드 서열 포함)는 쿼리 샘플의 상보적 표적 서열에 대해 혼성화할 수 있다. 혼성화 후, 제1 및 제2 프로브는 화학적으로 또는 DNA 리가아제에 의해 효소적으로 라이게이션되어 라이게이션된 라이게이션 복합체를 형성한다. 본 발명에서, 분석될 복수의 샘플에서 샘플 분석 동안, 복수의 이러한 라이게이션된 라이게이션 복합체가 형성될 것이다.
"복수의 샘플(plurality of samples)"은 생검, 타액 및 기타 분비물, 호기 수분 추출물, 조직, 혈장(액체 생검)을 포함한, 인간 또는 동물 신체로부터 수득된 2개 이상의 샘플, 물, 폐수, 토양, 식물을 포함한, 환경으로부터 수득된 2개 이상의 샘플, 또는 바이러스 또는 박테리아 등을 포함하는 2개 이상의 샘플을 의미하나, 이에 한정되지 않는다. 일 구체예에서, 샘플은 핵산의 사전 정제 또는 농축 없이 사용된다. 또 다른 구체예에서, 샘플은 전처리될 수 있고, 예를 들어, 세포를 용해하여 핵산을 노출시킬 수 있다.
표적 서열은 검출이 요구되는 임의의 목적 뉴클레오티드 서열을 포함할 수 있다. 본 개시의 표적 뉴클레오티드 서열은 환자 혈액의 DNA 분획 또는 모체 혈액의 DNA 분획으로부터 수득될 수 있으나, 이에 한정되지 않는다. 환자의 혈액 중 DNA 분획은 예를 들어, 아폽토시스/괴사성 암 세포로부터 수득되거나, 또는 태아 및/또는 모체 기원의 모체 혈액 내 DNA 분획에서 수득될 수 있다. 또한, 분석 결과는 예를 들어 주어진 유형의 암에 대한 개인의 위험을 평가하고, 주어진 암에 대한 주어진 치료의 효능, 종양에서 약물-내성-관련 돌연변이의 발생, 또는 일반적인 삼염색체성 다운(Down), 파타우(Patau) 및 에드워즈(Edwards) 증후군과 같은 유전적 장애를 가질 태아의 위험을 결정하기 위해 이용될 수 있다. 특정 구체예에서, 방법은 각각의 표적 뉴클레오티드 서열에 대해, 복수의 상이한 프로브 세트를 제공하는 것을 포함한다.
본원에서 사용되는, 용어 프로브 세트(probe set)는 제1 프로브, 제2 프로브 및 하나 이상의 가교 올리고를 포함한다.
특정 구체예에서, 상기 제1 프로브는 분자의 5' 말단으로부터 시작하여, 선택적으로 5' 포스페이트, 제1 가교 올리고-특이적 서열, 선택적으로 제1 범용 서열, 선택적으로 제1 서열 바코드, 및 그의 3' 말단에 제1 표적 특이적 서열을 포함한다.
특정 구체예에서, 상기 제2 프로브는 분자의 5' 말단으로부터 시작하여, 선택적으로 5' 포스페이트, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 선택적으로 제2 범용 서열, 및 그의 3' 말단에 제2 가교 올리고-특이적 서열을 포함한다.
일부 구체예에서, 상기 제1 프로브 또는 상기 제2 프로브는 제1 서열 바코드 또는 제2 서열 바코드 중 하나 이상을 포함한다. 상기 제1 서열 바코드 또는 제2 서열 바코드, 또는 둘 모두는 무작위(random) 서열일 수 있거나 표적 계수(target enumeration)를 위한 표적 뉴클레오티드 서열 식별자 서열, 샘플 식별자 서열 및/또는 분자 바코드를 포함할 수 있다.
상기 가교 올리고 또는 복수의 가교 올리고는 각각 제1 프로브 및 제2 프로브에서 제1 가교 올리고-특이적 서열 및 제2 가교 올리고-특이적 서열에 상보적인 서열, 선택적으로 범용 서열을 포함하고 및/또는 무작위 서열일 수 있는 제3 바코드를 포함할 수 있거나, 또는 샘플 또는 서열 식별자 서열을 포함할 수 있다. 이와 관련하여, 제3 바코드가 반드시 제1 및 제2 바코드가 이미 존재한다는 것을 의미하는 것은 아니다. 앞서 기술된 바와 같이, 적어도 하나의 바코드가 라이게이션된 라이게이션 복합체에 존재해야 하며, 이는 테스트되는 모든 샘플의 모든 라이게이션 복합체 내에서 복합체를 고유하게 정의할 수 있게 한다.
선택적으로, 제1 프로브, 제2 프로브, 하나 이상의 가교 올리고 또는 표적 특이적 프로브 중 적어도 하나는 엔도뉴클레아제에 대한 인식 서열을 포함한다. 엔도뉴클레아제 인식 서열은 콘카테머 서열의 절단을 가능하게 한다. 일 구체예에서, 상기 인식 서열은 EcoRI와 같은 제한 엔도뉴클레아제에 대한 인식 서열이다. 또 다른 구현예에서, 상기 인식 서열은 I-CeuI와 같은 호밍 엔도뉴클레아제(homing endonuclease)에 대한 인식 서열이다. 또 다른 구체예에서, 상기 인식 서열은 가이드되는(guided) DNAaseI 또는 CRISPR-Cas-유사 절단 시스템에 대한 인식 서열이다. 또 다른 구체예에서, 상기 인식 서열은 닉킹(nicking) 엔도뉴클레아제에 대한 인식 서열이다.
선택적으로, 제1 프로브 또는 제2 프로브 또는 하나 이상의 가교 올리고 중 적어도 하나는 제1 캡처 모이어티를 포함한다. 본원에서 사용될 때, 제1 캡처 모이어티는 프로브, 라이게이션 복합체 또는 혼성화 복합체가 고체 지지체에 연결된 제2 캡처 모이어티에 의해 포획, 즉 결합될 수 있게 하는, 화학 기(chemical group)와 같은 모이어티를 의미한다. 당해 분야에 공지된 임의의 적합한 캡처 모이어티가 이러한 목적을 위해 사용될 수 있다. 잘 알려진 적합한 예는 스트렙타비딘-코팅 자기 비드를 사용하여 비오티닐화된 분자를 포획하는 것이다. 따라서, 일 구체예에서, 상기 제1 캡처 모이어티는 자성 비드와 같은 고체 지지체에 연결된 스트렙타비딘 또는 아비딘 모이어티(제2 캡처 모이어티)와 상호작용할 수 있는 비오틴 모이어티이다. 기타 옵션은 스트렙타비딘/아비딘과의 접합에 사용할 수 있는, 이중 비오틴(dual-biotin), 데스티오비오틴 또는 광절단성(photocleavable) 비오틴과 같은 비오틴 유도체을 포함한다. 추가 옵션은 아크리다이트(acrydite)/아크릴아미드 접합을 위한 티올 및 아크리다이트 기, 클릭 화학(click chemistry)을 위한 알킨 및 아지드 기, 및 항-디곡시제닌(digoxigenin) 항체 접합을 위한 디곡시제닌의 사용을 포함한다. 접합 파트너는 비드(자석 또는 기타) 또는 고체 지지체와 같은 임의의 고체 표면에 제공될 수 있다. 따라서, 본 발명의 방법의 일 구체예에서, 상기 제1 프로브, 상기 제2 프로브, 상기 바코드 루프 올리고(barcode loop oligo), 또는 상기 하나 이상의 가교 올리고 중 하나 이상은 제1 캡처 모이어티를 포함하고, 단계 (iv)와 (v) 사이에, 상기 혼성화 복합체를 제2 캡처 모이어티를 포함하는 고체 지지체와 접촉시켜, 상기 제1 캡처 모이어티와 상기 제2 캡처 모이어티가 상호작용하여 상기 혼성화 복합체가 상기 고체 지지체에 연결될 수 있게 하고, 고체 지지체에 연결된 혼성화 복합체를 상기 고체 지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계를 포함하는 것인 중간 단계 (iv)(a)가 수행된다.
제1 표적 특이적 부분, 제2 표적 특이적 부분, 제1 가교 올리고-특이적 서열 및/또는 제2 가교 올리고-특이적 서열은 바람직하게는, 프로브 결합을 증가시키기 위해 서로 독립적으로 적어도 하나의 화학적으로 변형된 뉴클레오티드를 함유한다. 프로브 결합을 증가시키는 화학적 변형은 리보핵산, 펩티드 핵산 및 LNA(locked nucleic acid)(예를 들어, 본원에 참조로 포함된 WO2019038372의 도 3에 예시된 바와 같은 것)를 포함하나, 이에 한정되지 않는다. 일 구체예에서, 제1 프로브 또는 제2 프로브, 또는 둘 다의 가교 부분(bridging portion)은 가교 올리고 또는 가교 올리고 복합체에 대한 개선된 결합을 허용하도록 화학적으로 변형된 염기를 포함한다. 또 다른 구체에서, 제1 표적 특이적 부분, 제2 표적 특이적 부분, 제1 가교 올리고-특이적 서열 및/또는 제2 가교 올리고-특이적 서열은 서로 독립적으로 하나 이상의 화학적으로 변형된 뉴클레오티드를 포함한다. 특정 구체예에서, 화학적 변형은 인접한 프로브의 화학적 라이게이션을 가능하게 한다.
전술된 프로브는 인접한 유전자좌, 즉 표적 뉴클레오티드 서열의 인접한 섹션에 결합한다. 그러나, 상기 섹션은 완전히 인접하지는 않지만, 적어도 15개 염기쌍, 예를 들어 적어도 20개, 적어도 25개 또는 적어도 30개 염기쌍 떨어져 있다. 바람직한 구체예에서, 인접한 섹션은 500개 이하의 염기쌍, 예를 들어 200개 이하의 염기쌍, 예를 들어 100개 이하 또는 50개 이하의 염기쌍만큼 떨어져 있다.
일부 구체예에서, 제1 프로브, 제2 프로브, 하나 이상의 가교 올리고 또는 표적-특이적 프로브는 Illumina MiSeq, NextSeq 또는 NovaSeq와 같은(그러나 이에 한정되지 않음) DNA 시퀀싱 플랫폼을 위한 어댑터 서열을 포함할 수 있다. 이러한 어댑터 서열은 결과적으로 수득되는 시퀀싱 라이브러리가 Illumina 플로우 셀(flow cell)과 같은 시퀀싱 장치의 검출 부분에 결합할 수 있게 한다.
또한, 일부 구체예에서, 가교 올리고 또는 가교 올리고 복합체를 형성하는 복수의 가교 올리고뉴클레오티드는 다음을 포함한다:
(i) 1개 내지 5개의 3' 돌출 염기(즉, 제2 프로브와 이중 나선을 형성하지 않는 추가적인 염기), 및/또는
(ii) 3' 포스페이트, 및/또는
(iii) 3' 말단으로부터 3개의 위치 내의 하나 이상의 포스포로티오에이트 변형.
본 발명의 방법의 일 구체예에서, 상기 방법은 가교 올리고 복합체를 형성하기 위해 서로 어닐링할 수 있는 복수의 올리고뉴클레오티드의 사용을 포함하고, 상기 복수의 올리고뉴클레오티드는 바코드 루프 올리고를 포함하고,
상기 바코드 루프 올리고는 분자의 5' 말단으로부터 시작하여, 제3 가교 올리고-특이적 서열, 바코드된(barcoded) 루프 서열 및 제4 가교 올리고-특이적 서열을 포함하며, 및
하나 이상의 다른 가교 올리고는 상기 바코드 루프 올리고 중 제3 가교 올리고-특이적 서열 및 제4 가교 올리고-특이적 서열에 상보적인 서열을 포함한다.
따라서, 바코드 루프 올리고는 하나 이상의 가교 올리고와 혼성화하여 가교 올리고 복합체를 형성할 수 있는 2개의 섹션에 의해 플랭킹된(flanked) 루프 섹션을 포함한다. 루프 섹션은 하나 이상의 가교 올리고 또는 가교 올리고 복합체와 혼성화하지 않으며 바코드를 포함한다. 일 구체예에서, 바코드된 루프 서열은 제3 바코드를 포함한다.
프로브를 표적 서열을 포함하는 샘플과 접촉시키기 전에, 제1 프로브 및 제2 프로브를 바람직하게는 별도의 튜브에서 각각의 샘플에 대해, 가교 올리고 또는 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키고, 및 라이게이션 복합체로의 자가-어닐링이 가능하게 한다(단계 (ii)). 가교가 하나의 올리고가 아니라 서로 어닐링하여 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드, 예를 들어 3개 또는 5개의 올리고뉴클레오티드인 것인 구체예에서(본원의 도 2b에 예시됨), 복수의 올리고뉴클레오티드는 제1 및 제2 프로브와 어닐링하기 전에 사전 어닐링시킬 수 있거나, 또는 모든 어닐링 단계를 동시에 수행할 수 있다.
바람직하게는, 각각의 라이게이션 복합체는 제1 표적 특이적 서열, 제2 표적 특이적 서열 및 하나 이상의 바코드 서열의 조합에 대해 고유하다. 이는 증폭 후 표적 서열의 계수 및 결과의 분석을 가능하게 한다.
그 후, 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열을 복수의 라이게이션 복합체와 접촉시킨다(단계 (iii)). 각각의 제1 프로브 및 제2 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분은 표적 서열 상의 본질적으로 인접한(essentially adjacent) 섹션에 혼성화하여, 혼성화 복합체를 형성한다(단계 (iv)). 전술된 바와 같이, 표적 서열의 인접한 섹션은 일반적으로 15 내지 500 bp(base pairs) 떨어져 있다.
일부 구체예에서, 샘플은 100 마이크로리터 초과, 예를 들어 1 ml 초과의 부피를 갖는다. 추가 구체예에서, 샘플은 5 pmol 미만, 예를 들면, 1 pmol 미만, 예를 들면, 200 fmol 미만의 핵산 농도를 갖는다. 일 구체예에서, 복수의 샘플은 하나 이상의 혈액 샘플, 하나 이상의 타액 샘플, 하나 이상의 소변 샘플 또는 하나 이상의 대변 샘플을 포함한다.
뒤이어, 일부 구체예에서, 제1 프로브 또는 제2 프로브 또는 가교 올리고 또는 가교 올리고 복합체를 형성하는 올리고뉴클레오티드 중 적어도 하나가 제1 캡처 모이어티를 포함하는 경우, 혼성화 복합체(들)가 제2 캡처 모이어티를 포함하는 고체 지지체와 접촉하게 되고, 상기 제1 캡처 모이어티와 상기 제2 캡처 모이어티가 상호작용할 수 있게 되어, 혼성화 복합체(들)가 고체 지지체에 결합된다(선택적 단계 (iv)(a)). 그 후, 상기 고체 지지체에 결합된 혼성화 복합체는 고체 지지체에 결합되지 않은 샘플의 성분으로부터 분리된다. 고체 지지체가 자성 비드인 경우, 자석을 사용하여 비드를 고정하고, 남은 액체 샘플을 제거할 수 있다. 선택적으로, 진행하기 전에 세척 단계를 수행한다.
단계 (iv)(a)는 핵산에 대한 정제 및 농축(enrichment)을 초래하여, 특히 매우 불순한 샘플에 대해 개선된 결과를 가능하게 한다. 일 구체예에서, 본 발명의 방법은 단계 (iv)(a) 전에 핵산을 농축하는 단계를 포함하지 않는다. 따라서, 일 구체예에서, 상기 방법은 단계 (v) 전에 원래 샘플의 핵산이 2배 이상, 10배 이상 또는 100배 이상 농축되는 단계를 포함하지 않다. 또 다른 구체예에서, 본 발명의 방법은 단계 (vi)에서 라이게이션 후의 정제 단계를 포함하지 않는다.
뒤이어, 형성된 혼성화 복합체에서 프로브의 라이게이션을 효소적 또는 화학적으로 수행하여 라이게이션된 라이게이션 복합체를 제공한다(단계 (v)). 선택적으로, 단계 (v)의 일부로서, 존재하는 경우, 제1 프로브와 제2 프로브 사이의 갭을 폴리머라아제 및 하나 이상의 뉴클레오티드를 도입하여 채울 수 있다. 폴리머라아제는 (a) 가교 올리고 서열에 상보적인 뉴클레오티드 및/또는 (b) 바코드 서열에 상보적인 뉴클레오티드를 첨가하여, 제1 프로브와 제2 프로브 사이의 2개의 갭을 채워서 제1 프로브와 제2 프로브를 라이게이션시키고, 범용 서열 및/또는 제3 바코드 서열을 가교 상보적 가닥(bridge complementary sequence) 내에 포함시킨다. 가교 올리고 또는 가교 올리고 복합체는 라이게이션된 프로브에 상보적인 5' 부위 또는 3' 부위로부터 신장되어 제1 프로브 또는 제2 프로브에 존재하는 표적 서열 식별자 서열이 가교 올리고 또는 가교 올리고 복합체에 통합된다. 바람직하게는, 제1 프로브 및 제2 프로브가 모두 표적 서열에 어닐링될 때, 제1 프로브의 제2 프로브로의 라이게이션을 방해하지 않도록, 이중 가닥 DNA를 분해하지 않는 폴리머라아제, 예를 들어 Taq 폴리머라아제가 사용된다. 일 구체예에서, 가교 올리고, 또는 복수의 가교 올리고뉴클레오티드 중 하나 이상의 올리고뉴클레오티드는 제1 프로브 또는 제2 프로브에 상보적이지 않은 영역에 표적 계수를 위한 분자 바코드로서 사용하기에 적합한 무작위 서열의 통합(incorporation)을 허용하는 복수의 범용 염기 유사체를 포함한다. 따라서 이러한 무작위 서열이 제3 바코드가 될 수 있다. 그러한 구체예에서, 단계 (v)의 일부로서, 이러한 무작위 서열을 생성하기 위해, 폴리머라아제 및 뉴클레오티드를 사용하여 갭 필링(gap filling) 단계가 수행된다. 구체예에서, 복수의 범용 염기 유사체는 복수의 5-니트로인돌 또는 데옥시이노신이다.
단계 (v) 전 또는 후에, 라이게이션된 라이게이션 복합체는 선택적으로 하나 이상의 표적 샘플로부터 풀링된다.
이어서, 라이게이션된 라이게이션 복합체를 표적 뉴클레오티드 서열로부터 해리시키고(단계 (vi)) 표적-특이적 프로브를 첨가하고 라이게이션된 라이게이션 복합체에 어닐링시켜 증폭 주형을 형성시킨다(단계 (vii)). 표적 특이적 프로브는 표적 뉴클레오티드 서열에 상응하는 서열을 포함하고 따라서 그 서열과 일치하는 라이게이션된 라이게이션 복합체에 특이적으로 어닐링한다. 표적 특이적 프로브는 선택적으로, 표적에 대한 결합을 증진시키거나 엑소뉴클레아제 활성으로부터 그를 보호하는 비오틴 및/또는 뉴클레오티드 변형(포스포로티오에이트, LNA 및 PNA 변형을 포함하나, 이에 한정되지 않음)과 같은 캡처 모이어티(capture moiety)를 포함한다. 단계 (vi) 및 (vii)의 포함은 샘플에서 변이체 서열, 예를 들면, 드문 돌연변이의 선택적 증폭을 가능하게 한다. 도 3에 도시된 바와 같이, 표적-특이적 프로브 서열이 검출될 변이체 서열(예를 들면, 드문 돌연변이)과 일치하나, 비-변이체 서열(예를 들면, 벌크 게놈 야생형 서열)과는 일치하지 않도록 선택되는 경우, 이후 단계에서 변이체 서열의 선택적 증폭을 촉진하여 후속 검출을 용이하게 한다. 전형적으로, 단계 (vii)에서, 표적 서열과 라이게이션된 라이게이션 복합체의 재어닐링보다 증폭 주형의 형성이 선호되도록 표적 서열의 양에 비해 큰 과량의 표적 특이적 프로브가 첨가된다.
그 후, 증폭 주형으로부터 핵산을 증폭시킨다(단계 (viii)). 도 3에 예시된 바와 같이, 증폭은 가교 올리고 및/또는 표적 특정 프로브로부터 시작될 수 있다. 어닐링된 표적-특이적 프로브로부터의 증폭은 표적-특이적 프로브 서열을 포함하지 않는 비-변이체 표적 서열("불일치(mismatch)")에 비해 표적-특이적 프로브 서열을 포함하는 변이체 표적 서열("일치(match)")의 선택적 증폭을 초래한다. 증폭은 phi29 폴리머라아제(UniProtKB - P03680; DPOL_BPPH2) 또는 Bst 폴리머라아제(P52026; DPO1_GEOSE)와 같은 가닥 치환 폴리머라제를 사용한 롤링 서클 증폭을 이용하여 수행된다.
단일 가닥 콘카테머 서열이 단계 (viii)의 결과로 수득된다.
선택적으로, 단계 (i)에 특정된 바와 같은 인식 서열이 존재하는 경우, 단계 (ix)이:
(a) 단계 (viii)에서 수득된 단일 가닥 콘카테머 서열을 절단하거나, 또는
(b) 단계 (viii)에서 수득된, 증폭된 하나 이상의 단일 가닥 콘카테머 서열을 엔도뉴클레아제에 대한 인식 서열을 포함하는 특정 올리고뉴클레오티드와의 어닐링에 적용하여, 상기 올리고뉴클레오티드가 단계 (i)에서 특정된 인식 서열과 어닐링하여 엔도뉴클레아제에 대한 인식 부위를 수득하고, 상기 엔도뉴클레아제로 어닐링된 복합체를 절단하여, 핵산 단편을 수득하기 위해 수행된다.
선택적으로, 증폭 후, 존재하는 경우, 고체 지지체를 제거하고, 상층액을 후속 처리에 사용한다. 예를 들어, 고체 지지체가 자성 입자인 경우, 자석을 사용하여 이를 제거할 수 있다. 본 발명의 방법의 일부 다른 구체예에서, 제1 캡처 모이어티와 제2 캡처 모이어티 간의 상호작용은 단계 (v) 직후, 단계 (vi) 직후, 또는 단계 (vii) 직후에 중단된다. 예를 들어, 제1 캡처 모이어티가 비오틴이고 제2 캡처 모이어티가 스트렙타비딘인 경우, 과량의 가용성 비오틴을 첨가하여 상호 작용을 중단시킬 수 있다. 스트렙타비딘이 자성 입자에 결합된 경우, 후속적으로 자석을 사용하여 제거할 수 있다.
다음으로, 단계 (x)에서, 단계 (viii)에서 수득된 콘카테머 서열, 또는 단계 (ix)가 수행된 경우, 단계 (ix)에서 수득된 핵산 단편을 바코드를 결정하기 위해 고-처리량 시퀀싱 기술에 적용한다.
선택적으로, PCR 증폭은 제1 프로브 및 제2 프로브의 범용 부분에 결합하는 프라이머를 사용하여 단계 (x) 직전에 수행되며, 상기 프라이머는 선택적으로 단계 (x)의 후속 시퀀싱을 위한 어댑터 서열을 포함한다.
또 다른 구체예에서, 단계 (x)의 시퀀싱은 나노포어 시퀀싱을 이용하여 수행되고, 여기서 선택적으로 단계 (viii)에서 얻은 콘카테머 서열이 전위 복합체(transposition complex)를 이용하여 단편화된다. 나노포어 시퀀싱에 적합한 기술은 Wang et al. (2021 Nat Biotechnol 39(11):1348에서 리뷰되었다.
복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 갯수의 확인은 제1 및/또는 제2 표적 특이적 부분의 적어도 일부, 제1 및/또는 제2 바코드의 적어도 일부, 및/또는 제3 바코드의 적어도 일부를 고-처리량 시퀀싱 기술에 의해(단계 (x) 및 (xi)에서), 예를 들어 Illumina iSeq, MiSeq, HiSeq, NextSeq 또는 NovaSeq을 포함하나, 이에 한정되지 않는 차세대 시퀀싱 플랫폼을 이용하여 결정하는 것에 의해 수행될 수 있다. 바람직하게는, 유전적 표적 계수는 표적당 및 샘플당 분자 바코드의 갯수를 계수하는 것에 의해 이루어질 수 있다. 샘플을 서열 데이터로부터 분리(디컨볼루션)하고, DNA 시퀀싱으로부터 서열 표적을 인 실리코로 정량한다.
본 발명의 이점은 전통적인 핵산 시퀀싱 기술과 비교하여 낮은 비용, 높은 단순성, 높은 특이도, 높은 민감도, 높은 정확도, 높은 처리량, 높은 확장성 및 높은 전환율을 갖는 정량화 분석을 포함하나, 이에 한정되지 않는다. 본 발명의 또 다른 양태는 본 발명의 방법이 인간 및 동물 집단을 포함하고 대량의 정제되지 않은 샘플 물질을 포함하는 다수의 샘플에서 복수의 핵산 표적의 정확한 대량 병렬 정량화를 가능하게 한다는 것이다. 언급한 바와 같이, 바람직한 구체예에서, 소변 샘플과 같은 샘플은 핵산의 사전 정제 또는 농축 없이 사용된다. 또 다른 구체예에서, 샘플은 전처리될 수 있고, 예를 들어, 세포를 용해하여 핵산을 노출시킬 수 있다. 본 발명의 한 가지 특별한 이점은 고유한 프로브 디자인, 즉 프로브 3원체(triplet)를 이용하여 목적 표적 서열의 검출 및 증폭을 가능하게 한다는 것이다. 프로브는 어닐링 및 결합 효율을 향상시키는 특별히 위치한 변형된 뉴클레오티드를 갖도록 설계된다. 결합 특성의 개선은 더 높은 분석 특이도, 민감도 및 정확도를 가져온다. 본 발명의 방법은 유전적 변이체를 연구하는 데 마찬가지로 적용 가능하고, 하나 이상의 서열 및/또는 SNP와 같은 다형성 및/또는 indel, 암 진단, 또는 모체 혈액의 태아 염색체 장애에 대한 샘플(들)의 유전자형 분석을 포함하나 이에 한정되지 않는 진단 및 예후에 적용을 갖는다. 바람직한 구체예에서, 2개 이상의 샘플 또는 2개 이상의 유전자좌/대립유전자 조합에 대해, 바코드 서열이 하나 이상의 서열 및/또는 다형성, 예를 들면, SNP 및/또는 indel에 대해 샘플의 유전자형을 결정하기 위해 사용된다.
또 다른 양태에서, 복수의 용기를 포함하는 키트(kit of parts)로서, 하나 이상의 용기는 제1 프로브 및 제2 프로브의 하나 이상의 세트를 포함하고, 하나 이상의 용기는 하나 이상의 가교 올리고 또는 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 포함하고,
상기 제1 프로브는 분자의 5' 말단에서 시작하여, 제1 가교 올리고-특이적 서열, 선택적으로, 제1 서열 바코드, 및 제1 프로브의 3' 말단에 있는 제1 표적 특이적 부분을 포함하며;
상기 제2 프로브는 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로, 제2 서열 바코드, 및 제2 프로브의 3' 말단에 있는 제2 가교 올리고-특이적 서열을 포함하고;
상기 가교 올리고 또는 가교 올리고 복합체는 각각 제1 프로브 및 제2 프로브의 제1 가교 올리고-특이적 서열, 및 제2 가교 올리고-특이적 서열에 상보적인 서열, 및 선택적으로, 제3 바코드를 포함하며;
상기 제1 서열 바코드 또는 상기 제2 서열 바코드 또는 상기 제3 바코드 중 하나 이상은 각각 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체에 존재하고;
상기 키트는 표적 뉴클레오티드 서열에 상응하는 서열을 포함하는 표적 특이적 프로브를 더 포함하고, 상기 표적 특이적 프로브는 라이게이션된 라이게이션 복합체와 어닐링할 수 있고;
선택적으로, 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체 중 하나 이상은 엔도뉴클레아제에 대한 인식 서열을 포함하며;
선택적으로, 상기 키트는 상기 인식 서열과 어닐링할 수 있는 올리고뉴클레오티드를 더 포함하여, 상기 엔도뉴클레아제에 대한 인식 부위가 수득될 수 있게 한다.
바람직하게는, 제1 프로브의 3' 말단 또는 제2 프로브의 5' 말단, 또는 둘 모두가 변형되어 제1 프로브의 제2 프로브로의 화학적 라이게이션을 가능하게 한다.
바람직하게는, 가교 올리고 또는 복수의 가교 올리고뉴클레오티드의 올리고뉴클레오티드는 제1 프로브의 서열에 상보적인 서열, 또는 제2 프로브의 서열에 상보적인 서열, 또는 둘 모두에 하나 이상의 화학적으로 변형된 뉴클레오티드를 포함한다.
바람직하게는, 제1 프로브의 3' 말단 또는 제2 프로브의 5' 말단, 또는 둘 모두가 변형되어 제1 프로브의 제2 프로브로의 화학적 라이게이션을 가능하게 한다.
바람직하게는, 제1 프로브 또는 제2 프로브, 또는 둘 모두의 가교 부분, 또는 가교 올리고, 또는 복수의 가교 올리고뉴클레오티드의 올리고뉴클레오티드는 가교 올리고 또는 가교 올리고 복합체에 대한 개선된 결합을 허용하도록 화학적으로 변형된 염기를 포함한다.
하나의 특정 구체예에서, 제1 및 제2 프로브의 세트를 포함하는 적어도 하나의 용기 및 가교 올리고 또는 서로 어닐링하여 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 포함하는 적어도 하나의 용기는 하나의 동일한 용기이다. 이러한 경우, 프로브는 사전에 어닐링되어 라이게이션된 복합체를 형성할 수 있다.
본 발명의 하나의 특별한 이점은 독특한 프로브 설계를 이용하여 목적 표적 서열의 검출 및 증폭을 가능하게 한다는 것이다. 프로브는 향상된 결합 특성으로 설계되어 더 높은 분석 특이도, 민감도 및 정확도를 제공한다. 본 발명은 분자 생물학, 진화 생물학, 메타게놈학, 유전자형 분석, 보다 구체적으로, 그러나, 한정없이, 하나 이상의 서열 및/또는 다형성, 예를 들면, SNP 및/또는 indel에 대한 샘플의 유전형 분석을 포함하나, 이에 한정되지 않는, 암 진단 또는 태아 염색체 장애의 분야에서 응용된다.
하나의 특정한 바람직한 구현예에서, 가교 올리고 또는 가교 올리고 복합체는 샘플을 식별하기 위한 정보를 포함하고, 고유 바코드를 포함한다. 이 경우, 제1 프로브 및 제2 프로브는 모든 샘플에 범용적으로 적용할 수 있다(표적을 식별하기 위한 정보만 포함한다). 따라서, 하나의 바람직한 구체예에서, 가교 올리고 또는 가교 올리고 복합체가 각 샘플의 표적 서열의 계수를 가능하게 하는 고유한 서열을 포함하는 바코드를 포함하는 것인 본 발명에 따른 방법 또는 키트가 제공된다.
도 1은 본 발명의 구체예에 따른 MLA(Multiplexed Ligation Assay)의 흐름도를 예시한다.
도 2a, 2b, 2c 및 2d는 본 발명의 구체예에 따른 프로브의 원리 조합을 예시한다.
도 3은 희귀 돌연변이를 검출하기 위한 본 발명의 구체예에 따른 표적 특이적 프로브의 사용을 예시한다.
도 4는 2개의 상이한 표적 농도를 갖는 2개의 부스팅된 시퀀싱 라이브러리를 예시한다.
도 5는 12개의 유전자 융합체 표적(gene fusion target)의 패널에 대한 부스팅의 효과를 예시한다.
방법
1. 프로브 복합체의 형성
프로브 복합체는 게놈 표적화, 샘플 인덱싱 및 Illumina 시퀀싱 라이브러리 구축에 필요한 서열을 포함한다.
하기를 포함하는, 3-부분 프로브 복합체(three-part probe complex)가 형성될 수 있다(도 2 참조):
(a) 분자의 5' 말단에서 시작하여, 제1 가교 올리고-특이적 서열, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 갖는 제1 프로브;
(b) 분자의 5' 말단에서 시작하여, 제2 표적 특이적 부분, 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 가교 올리고-특이적 서열을 갖는 제2 프로브; 및
(c) 각각 제1 프로브 및 제2 프로브의 제1 가교 올리고-특이적 서열 및 제2 가교 올리고-특이적 서열에 상보적인 서열을 갖는 가교 올리고,
어닐링 반응에서 등몰량으로 모든 3개의 부분(가교, 제1 암(first arm) 및 제2 암)을 조합하는 것에 의해 프로브 복합체를 구축한다. 반응은 열 순환기(thermo cycler)에서 수행된다(표 1의 어닐링 프로그램).
단계 온도 시간
1 +95℃ 5분
2 +95℃ 1분
-1℃/1분, go to 2 40x
3 +55℃ 10분
4 +55℃ 1분
-1℃/1분, go to 4 35x
5 +4℃ 유지(hold)
2. 표적 캡처(target capture)
목적 돌연변이를 포함하는 특정 게놈 영역이 표적이 된다. 정제된 DNA(예를 들면, 조직, 혈장, 소변 또는 타액으로부터 정제된 DNA)를 샘플로 사용할 수 있거나 샘플은 비-정제(un-purified)이나, 단지 전처리될 수 있고, 예를 들어, 가열 및/또는 원심분리에 의해 전처리만 된 것일 수 있다.
프로브 복합체는 염기 서열 상보적 상호작용을 통해 표적 영역에 혼성화된다. 표적 캡처를 개시하기 위해, 반응 프로브와 표적 DNA를 혼합하고 열 순환기에서 인큐베이션한다(표 2의 표적 캡처 및 GapFill 프로그램).
단계 온도 시간 프로세스
1 +85℃ 4분 변성
2 +75℃ 2.5분
3 +65℃ 2.5분
4 +55℃ 120분 표적 캡처
5 +50℃ 10분 GapFill
6 +45℃ 45분
7 +4℃ 유지  
3. GapFill 반응
표적 포획(캡처) 후, Phusion DNA 폴리머라제, 뉴클레오티드 및 Ampligase DNA 리가제의 조합을 첨가하고, +45℃에서 45분 동안 인큐베이션하여, 프로브 복합체를 신장하고 라이게이션시킨다.
4. 엑소뉴클레아제 처리
GapFill 후에, Thermolabile Exonuclease 1(NEB, #M0568L) 1 ㎕와 RecJF Exonuclease(NEB, #M0264L) 1 ㎕를 첨가하고, +37℃에서 30분간 인큐베이션하여 선형 분자를 제거한다. 엑소뉴클레아제는 +92℃에서 12분 동안 인큐베이션하여 불활성화시킨다.
5. 롤링 서클 증폭(Rolling Circle Amplification)
신장 및 라이게이션 후, 환형 프로브 분자를 표적 특이적 프로브와 정렬하고, RCA(Rolling Circle Amplification)를 수행한다. RCA 반응을 위해, 표적 캡처 반응물을 부스트 올리고(boost oligo)와 혼합하고, 잠시동안 변성시킨다. 이어서 반응물을 EquipPhi29(Thermo Scientific) 폴리머라아제를 포함하는 RCA 반응 혼합물과 혼합한다. 반응물을 +42℃에서 30분 - 2시간 동안 인큐베이션한다. RCA 반응 후, Qubit 형광계로 단일 가닥 DNA(ssDNA)의 농도를 측정하여 반응 효율을 분석한다.
6. 효소 분해(Enzymatic digestion)
RCA 반응은 표적 라이브러리의 복수 카피를 갖는 긴 콘카테머 ssDNA 분자를 생성한다. 각각의 완전한 표적 라이브러리가 EcoRI 제한 효소 인식 서열에 의해 분리된다. 이 서열은 EcoRI 제한 효소 인식 서열을 포함하는 특이적 올리고뉴클레오티드와의 어닐링을 통한 긴 콘카테머의 서열-특이적 절단 및 준비된 표적 라이브러리의 방출을 가능하게 한다. 이러한 라이브러리는 간단한 정제 단계 후에 추가 분석을 위해 준비된다. RCA 산물을 +37℃에서 1시간 동안 EcoRI로 분해한다.
7. 라이브러리 PCR
올바른 프로브에 존재하는 절단된 시퀀싱 어댑터가 플로우-셀 적합(flow-cell compatible) 전장 시퀀싱 어댑터로 신장되는 것인 PCR 반응으로, 분해된(digested) RCA 산물을 시퀀싱 라이브러리로 신장시킨다.
8. 라이브러리 정제
라이브러리 PCR 후, 라이브러리 분자를 전기영동 후 아가로스 겔에서 추출하거나, 또는 크기 선택 비드(예를 들면, Macherey Nagel NucleoMag)를 사용하여 정제한다.
9. 시퀀싱
정제된 MiSeq- 또는 iSeq100-적합 라이브러리를 최신 시퀀싱 기기를 사용한 서열 분석에 적용한다. 중요한 것은, 간단한 올리고뉴클레오티드 변형에 의해 라이브러리를 사용 가능한 모든 시퀀싱 플랫폼에 맞도록 전환시킬 수 있다는 것이다. 시퀀싱 데이터는 Unix 명령행(command line) 도구 및 Python 및 R 프로그래밍 언어의 조합을 이용하여 처리된다. 요약하면, 서열 처리의 근거는 각 리드(read) 내에서 프로브 서열을 식별하고, 그들 사이의 게놈 영역을 시퀀싱하고, 각 유전자 표적과 관련된 분자 바코드의 갯수를 세는 것이다.
실험 1.
첫 번째 실험에서, 프로브 혼합은 4개의 반복된(replicate) 반응을 초래하는, 4개의 차등적으로 인덱싱된 프로브(differentially indexed probe)의 집합이었다. 그들은 도 5에 나열된 12개의 유전자 융합체을 표적으로 하였다. 표적 올리고뉴클레오티드는 각각의 표적을 식별할 수 있는 고유한 인식 서열을 가졌다.
샘플로서, 12개의 유전자 융합체(gene fusion) 각각에 대해 2종의 합성 표적 올리고뉴클레오티드를 동일한 농도로 혼합하였다. 표적 캡처, 신장, 및 라이게이션 반응, 롤링 서클 증폭 및 EcoRI에 의한 후속 분해를 전술된 바와 같이 수행했다. 결과적으로 수득된 시퀀싱 라이브러리의 예가 도 4에 도시된다.
준비된 라이브러리를 iSeq100 기기로 시퀀싱하고, 각 리드 내의 프로브 서열을 매칭(match)하고, 프로브 서열 사이의 게놈 서열 영역을 확인하고, 분자 바코드를 계수하여 서열 데이터 내에서 표적 영역을 검출했다. 카운트 데이터는 각각의 유전자 융합체 표적의 부스팅 상태(boosting status)를 정확하게 반영했다(도 5). 도 5에서, 비-부스팅(non-boosted)와 관련된 데이터는 그래프에서 문자 "N"으로 표시된다. 표시가 없는 막대는 부스팅과 관련된다.
도 1, 2 및 3의 상세한 설명
도 1은 기술된 발명의 일 구체예의 작업 흐름을 도시한다. 단계 1에서, 샘플(102) 내의 핵산(DNA 또는 RNA)이 일련의 라이게이션 복합체(104)와 접촉하게 된다. 라이게이션 복합체가 표적 핵산에 어닐링한다(106). 단계 2에서, 샘플 물질로부터 표적에 결합된 라이게이션 복합체가 선택적으로 포획되어, 샘플 불순물(103)을 남긴다. 단계 3에서, 어닐링된 라이게이션 복합체를 라이게이션하여 라이게이션된 라이게이션 복합체를 형성한다. 단계 4에서, 다수의 샘플(110)로부터의 라이게이션된 라이게이션 복합체가 함께 풀링된다(112). 단계 5에서, 라이게이션된 라이게이션 복합체가 표적 뉴클레오티드 서열로부터 분리될 수 있게 하고, 표적 뉴클레오티드 서열에 상응하는 서열을 포함하는 표적-특이적 프로브가 첨가되고, 표적 특이적 프로브는 라이게이션된 라이게이션 복합체에 어닐링된다. 표적 특이적 프로브은 선택된 드문 돌연변이(rare mutation of choice)에 특이적으로 어닐링되고(114), 선택적으로, 그들의 표적으로의 결합을 강화하거나 엑소뉴클레아제 활성으로부터 그들을 보호하는 변형(포스포로티오에이트 변형을 포함하나 이에 한정되지 않음)을 포함한다. 단계 6에서, 프로브 서열은 phi29 폴리머라아제 또는 다른 가닥 치환 폴리머라아제를 사용한 롤링 서클 증폭에 의해 증폭되어, 프로브의 긴 콘카테머 카피를 생성한다. 드문 돌연변이의 증폭이 추가적인 효율성으로 증폭된다(116). 단계 7에서, 콘카테머 프로브 카피는 선택적으로 EcoRI와 같은 제한 엔도뉴클레아제 또는 I-CeuI와 같은 호밍 뉴클레아제를 사용하여 단량체 단위로 절단되고, 선택적으로 PCR 또는 에멀젼 PCR을 이용하여 추가로 증폭된다(117). 단계 8에서, 증폭된 DNA는 차세대 DNA 시퀀싱을 사용하여 시퀀싱된다. 단계 9에서, DNA 시퀀싱 결과는 바이오인포매틱 파이프라인(bioinformatic pipeline)을 이용하여 표적 카운트(target count)로 변환된다.
도 2a는 본원의 일 구체예에 따른 제1 프로브와 제2 프로브 사이의 갭 필링(gap filling)을 예시한다. 여기서, 가교 올리고는 가교 서열 1(228)과 가교 서열 2(224) 사이에 갭 1(Gap1)을 포함한다. 갭 2(Gap2)는 프로브 1 및 2의 표적 결합 부분(208 및 216) 사이에 형성된다. 이러한 갭은 폴리머라아제와 하나 이상의 뉴클레오티드를 도입하여 채워진다. 이 과정을 위해, Stoffel 단편, Taq 폴리머라아제, 또는 Phusion 폴리머라아제와 Ampligase와 같은 DNA 리가아제의 혼합물을 사용할 수 있다. 폴리머라아제는 (a) 범용 가교 올리고 서열에 상보적인 뉴클레오티드 및 (b) 표적 서열에 상보적인 뉴클레오티드를 첨가하고, 두 개의 갭, 즉 갭 1 및 제1 프로브와 제2 프로브 사이의 갭 2를 채우고, DNA 리가아제의 후속 작용이 가교 올리고 및 표적 서열에 상보적인 제1 프로브 및 제2 프로브를 환형 복합체로 라이게이션시킨다.
도 2b는 본원의 일 구체예에 따른 복수의 프로브 엔터티(probe entity)를 갖는 프로브 5원체(quintet)의 원리 구조(principle structure)를 도시한다. 복수의 프로브 엔터티는 제1 프로브, 제2 프로브 및 3개의 올리고로 구성된 가교를 포함한다. 여기서 프로브 복합체는 제1 프로브와 제2 가교(228 및 236) 사이, 제2 가교와 제2 프로브(240 및 222) 사이, 제1 가교 올리고와 제3 가교 올리고(238 및 242) 사이 및 제1 프로브와 제2 프로브 (208 및 216) 사이의 갭을 포함한다. 이러한 갭은 폴리머라아제와 하나 이상의 뉴클레오티드를 도입하여 채워진다. 이 과정을 위해, Stoffel 단편, Taq 폴리머라아제 또는 Phusion 폴리머라아제와 DNA 리가아제, 예를 들면, Ampligase의 혼합물을 사용할 수 있다. 폴리머라아제가 이러한 갭을 채우고 DNA 리가아제의 후속 작용이 프로브와 가교 올리고의 환형 복합체로의 라이게이션을 가져온다.
제1 프로브의 15-25개 염기는 가교 결합 서열 1(228)을 포함하며, 이는 선택적으로 가교 서열 1로 지칭되는 효율적인 가교 올리고 결합을 위한 화학적으로 변형된 염기를 포함한다. 제1 프로브는 선택적으로, 5' 말단으로부터 다음 10-20개 염기에, 라이브러리 인덱싱에 사용되는 범용 서열(204)을 추가로 포함한다. 제1 프로브는 5' 말단으로부터 그 다음 10-20개 염기에 바코드 1로 지칭되는 분자-특이적 바코드 또는 샘플-특이적 바코드를 형성하는 무작위 뉴클레오티드(206)의 세그먼트를 포함한다. 제1 프로브는 5' 말단으로부터 그 다음 15-30개의 염기(208)를 추가로 포함하고, 유전적 표적에 결합한다. 228의 일부 또는 모든 뉴클레오티드는 표적 또는 가교(226)에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다. 제1 프로브의 마지막 염기는 변형 1(210)로 지칭되는 인접 프로브의 5' 말단으로의 효소적 라이게이션을 위한 포스페이트 모이어티 또는 화학적 라이게이션을 허용하는 변형을 선택적으로 포함한다.
제2 프로브의 제1 염기는 변형 2(214)로 지칭되는 인접 프로브의 5' 말단으로의 효소적 라이게이션을 위한 포스페이트 모이어티 또는 화학적 라이게이션을 허용하는 변형을 선택적으로 포함한다. 제2 프로브의 5' 말단으로부터 15-30개의 염기는 유전적 표적에 결합하는 제2 프로브의 일부(216)를 포함한다. 제2 프로브의 5' 말단으로부터 그 다음 10-20개의 염기는 선택적으로, 바코드 2(218)로 지칭되는 분자 특이적 바코드 또는 샘플 특이적 바코드를 형성하는 무작위 뉴클레오티드 세그먼트를 포함한다. 제2 프로브의 5' 말단으로부터 그 다음 10-20개의 염기는 선택적으로 범용 서열(220)을 포함한다. 가교 서열 8(222)로 지칭되는, 제2 프로브의 마지막 15-25개 염기는 제3 가교 올리고의 가교 서열 7(224)에 대해 역상보적이다. 208, 216, 222 또는 228의 일부 또는 모든 뉴클레오티드는 표적 또는 가교 올리고에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다.
가교 서열 3(226)으로 지칭되는, 제1 가교 올리고의 5' 말단으로부터의 최초 15-25개 염기는 제1 프로브의 가교 서열 1(228)에 대해 역상보적이며, 선택적으로 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 가교 서열 2(238)로 지칭되는, 제1 가교 올리고의 마지막 15-25개 염기는 제2 가교 올리고의 가교 서열 4(236) 서열에 대해 역상보적이며, 선택적으로 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 제1 가교 올리고의 5' 말단은 선택적으로 라이게이션 복합체를 포획하기 위해 사용되는 캡처 모이어티(230)를 포함한다.
가교 서열 5(240)로 지칭되는, 제2 가교 올리고의 5' 말단으로부터의 최초 15-25개 염기는 제3 가교 올리고의 가교 서열 6(242)에 대해 역상보적이며, 선택적으로, 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 가교 서열 4(236)로 지칭되는, 제2 가교 올리고의 마지막 15-25개 염기는 제1 가교 올리고의 가교 서열 2(238) 서열에 대해 역상보적이며, 선택적으로 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다.
가교 서열 6(242)으로 지칭되는, 5' 말단으로부터의 제3 가교 올리고의 최초 15-25개 염기는 제2 가교 올리고의 가교 서열 5(240) 서열에 역상보적이며, 선택적으로 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 가교 서열 7(224)로 지칭되는, 제1 가교 올리고의 마지막 15-25개 염기는 제2 프로브의 가교 서열 8(222) 서열에 대해 역상보적이며, 선택적으로 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 제3 가교 올리고의 3' 말단은 선택적으로, 갭 필링(gal fill) 동안 신장을 방지하기 위해 포스페이트(또는 기타 절단 가능한) 모이어티(234)를 포함한다.
도 2c는 바코드 루프 올리고의 사용을 포함하는 구체예를 예시한다. 여기서, 복수의 프로브 엔터티는 제1 프로브(202), 제2 프로브(201), 가교 올리고(200) 및 바코드 루프 올리고(217)를 포함한다. 여기서, 프로브 복합체는 제1 프로브와 바코드 루프 올리고(210 및 213) 사이, 제2 프로브와 바코드 루프 올리고(207 및 215) 사이 및 제1 프로브와 제2 프로브(203 및 204) 사이에 갭을 포함한다. 이러한 갭은 폴리머라아제와 하나 이상의 뉴클레오티드를 도입하여 채워진다. 이 과정을 위해, Stoffel 단편, Taq 폴리머라아제 또는 Phusion 폴리머라아제와 DNA 리가아제, 예를 들면, Ampligase의 혼합물을 사용할 수 있다. 폴리머라아제가 이러한 갭을 채우고 DNA 리가아제의 후속 작용이 프로브, 가교, 및 바코드 루프 올리고의 환형 복합체로의 라이게이션을 가져온다.
제1 프로브의 15-25개 염기는 가교 결합 서열(210)을 포함하며, 이는 효율적인 가교 올리고 결합을 위해 화학적으로 변형된 염기를 선택적으로 포함한다. 제1 프로브는 5' 말단으로부터 그 다음 15-30개의 염기를 추가로 포함하고, 유전적 표적에 결합한다(203). 210의 뉴클레오티드 중 일부 또는 전부는 표적 또는 가교(209)에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다. 제1 프로브의 마지막 염기(205)는 선택적으로, 인접 프로브의 5' 말단에 대한 화학적 라이게이션을 허용하는 변형 또는 효소적 라이게이션을 위한 포스페이트 모이어티를 포함한다.
제2 프로브의 제1 염기는 선택적으로, 인접 프로브의 5' 말단에 대한 화학적 라이게이션을 허용하는 변형 또는 효소적 라이게이션을 위한 포스페이트 모이어티(206)를 포함한다. 제2 프로브의 5' 말단으로부터 15-30개의 염기는 유전적 표적에 결합하는 제2 프로브의 일부(204)를 포함한다. 제2 프로브의 마지막 15-25개 염기(207)는 가교 올리고(208)에 대해 역상보적이다. 203, 204, 207 또는 210의 일부 또는 모든 뉴클레오티드는 표적 또는 가교 올리고에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다.
가교 올리고의 5' 말단으로부터 최초 15-25개의 염기(209)는 제1 프로브의 가교-올리고 특이적 서열(210)에 대해 역상보적이며, 선택적으로, 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 가교 올리고의 마지막 15-25개 염기(208)는 제2 프로브의 서열(207)에 대해 역상보적이며, 선택적으로, 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 가교 올리고의 5' 말단은 라이게이션 복합체를 포획하기 위해 사용되는 캡처 모이어티(211)를 선택적으로 포함한다. 또한, 가교 올리고는 바코드 루프 올리고의 서열(213 및 215)에 상보적인 서열(214 및 216)을 포함한다. 가교 올리고의 3' 말단은 선택적으로, 갭 필링 동안 신장을 방지하기 위해 포스페이트(또는 기타 절단 가능한) 모이어티(212)를 포함한다.
바코드 루프 올리고의 5' 말단으로부터 최초 15-25개의 염기(215)는 가교 올리고 서열(216)에 대해 역상보적이다. 바코드 루프 올리고는 바코드(218)를 포함하는 루프 영역을 포함한다. 바코드 루프 올리고의 마지막 15-25개 염기(213)는 가교 올리고 서열(214)에 대해 역상보적이다.
도 2d는 본원의 구체예에 따른 프로브 4원체(quadruplet)의 원리 구조를 예시한다. 복수의 프로브 엔터티는 제1 프로브(202), 제2 프로브(201), 가교 올리고(200) 및 바코드 루프 올리고(217)를 포함한다. 여기서, 프로브 복합체는 제1 프로브와 바코드 루프 올리고(210 및 213) 사이, 제2 프로브와 바코드 루프 올리고(207 및 215) 사이 및 제1 프로브와 제2 프로브(203 및 204) 사이에 갭을 포함한다. 이러한 갭은 폴리머라아제와 하나 이상의 뉴클레오티드를 도입하여 채워진다. 이 과정을 위해, Stoffel 단편, Taq 폴리머라아제 또는 Phusion 폴리머라아제와 DNA 리가아제, 예를 들면, Ampligase의 혼합물을 사용할 수 있다. 폴리머라아제가 이러한 갭을 채우고 DNA 리가아제의 후속 작용이 프로브, 가교, 및 바코드 루프 올리고의 환형 복합체로의 라이게이션을 가져온다.
제1 프로브의 15-25개 염기는 가교 결합 서열(210)을 포함하며, 이는 효율적인 가교 올리고 결합을 위해 화학적으로 변형된 염기를 선택적으로 포함한다. 제1 프로브는 증폭 프라이머의 결합 부위(221) 및 바코드 서열(222)을 포함하고, 및 5' 말단으로부터 그 다음 15-30개 염기, 유전자 표적에 결합하는 서열(203)을 더 포함한다. 210의 뉴클레오티드 중 일부 또는 전부는 표적 또는 가교(209)에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다. 제1 프로브의 마지막 염기는 인접 프로브의 5' 말단으로의 효소적 라이게이션을 위한 포스페이트 모이어티 또는 화학적 라이게이션을 허용하는 변형(205)을 선택적으로 포함한다.
제2 프로브의 제1 염기는 인접 프로브의 5' 말단으로의 효소적 라이게이션을 위한 포스페이트 모이어티 또는 화학적 라이게이션을 허용하는 변형(206)을 선택적으로 포함한다. 제2 프로브의 5' 말단으로부터 15-30개의 염기는 유전적 표적에 결합하는 제2 프로브의 일부(204)를 포함한다. 제2 프로브는 증폭 프라이머에 대한 결합 부위(223), 시퀀싱 어댑터 서열(224), EcoRI와 같은 제한 엔도뉴클레아제에 대한 인식 부위(225) 및 또 다른 시퀀싱 어댑터 서열(207)을 추가로 포함한다. 제2 프로브의 마지막 15-25개 염기(207)는 가교 올리고(208)에 대해 역상보적이다. 203, 204, 207 또는 210의 일부 또는 모든 뉴클레오티드는 표적 또는 가교 올리고에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다.
가교 올리고의 5' 말단으로부터 최초 15-25개의 염기(209)는 제1 프로브의 가교-올리고 특이적 서열(210)에 대해 역상보적이며, 선택적으로 증가된 결합을 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 가교 올리고의 마지막 15-25개 염기(208)는 제2 프로브의 서열(207)에 대해 역상보적이며, 선택적으로, 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 바코드 루프 올리고의 어느 말단에도 역상보적이지 않은 가교 올리고의 부분(220)은 선택적으로 제한 엔도뉴클레아제에 대한 인식 부위를 포함한다. 가교 올리고의 5' 말단은 라이게이션 복합체를 포획하기 위해 사용되는 캡처 모이어티(211)를 선택적으로 포함한다. 또한, 가교 올리고는 바코드 루프 올리고의 서열(213 및 215)에 상보적인 서열(214 및 216)을 포함한다. 가교 올리고의 3' 말단은 선택적으로, 갭 필링 동안 신장을 방지하기 위해 포스페이트(또는 기타 절단 가능한) 모이어티(212)를 포함한다.
바코드 루프 올리고의 5' 말단으로부터 최초 15-25개 염기(215)는 가교 올리고 서열(216)에 대해 역상보적이다. 바코드 루프 올리고는 바코드(218)를 포함하는 루프 영역을 포함한다. 바코드 루프 올리고의 마지막 15-25개 염기(213)는 가교 올리고 서열(214)에 대해 역상보적이다.
도 3은 기술된 발명의 일 구체예의 작업 흐름이 어떻게 돌연변이를 포함하지 않는 벌크 게놈을 포함하는 샘플에서 드문 돌연변이의 검출을 증진시키는지를 예시한다. 단계 1에서, 표적에 결합된 라이게이션 복합체가 갭 필링 및 라이게이션에 적용된다. 단계 2에서, 라이게이션된 라이게이션 복합체는 표적 뉴클레오티드 서열로부터 해리되도록 허용되고, 표적 뉴클레오티드 서열에 상응하는 서열을 포함하는 표적-특이적 프로브가 첨가되고, 표적-특이적 프로브가 라이게이션된 라이게이션 복합체에 어닐링된다. 단계 3 및 4에서, 프로브 서열은 phi29 폴리머라아제 또는 기타 가닥 치환 폴리머라아제를 이용한 롤링 서클 증폭에 의해 증폭되어, 프로브의 긴 콘카테머 카피를 초래한다. 표적 특이적 프로브로부터 시작되는 증폭은 표적 특이적 프로브가 표적 서열과 일치하는 경우에만 일어난다. 불일치가 있는 경우, 가교 올리고부터 시작되는 증폭만 있을 것이다.
102, 110: 샘플 103: 샘플 불순물
104: 라이게이션 복합체 106: 표적 핵산에 어닐링된 라이게이션 복합체
110: 라이게이션된 라이게이션 복합체
112: 풀링된 라이게이션 복합체
114: 드문 돌연변이에 어닐링된 표적 특이적 프로브
116: 콘카테머 117: PCR 산물
200, 220: 가교 올리고 201, 202: 프로브
203, 204: 유전적 표적에 결합하는 서열
205, 206, 209, 212: 포스페이트 모이어티 또는 변형
207: 제2 프로브의 마지막 15-25개 염기, 시퀀싱 어댑터 서열
208: 가교 올리고의 마지막 15-25개 염기
206, 210, 212, 214, 234: 변형, 가교 결합 서열
213, 217: 바코드 루프 올리고
214: 가교 올리고 서열
211, 223: 캡처 모이어티, 증폭 프라이머의 결합 부위
203, 216: 유전적 표적에 결합하는 서열
213, 215, 217: 바코드 루프 올리고의 서열
218: 바코드 228: 제1 프로브의 가교 결합 서열 1, 가교서열 1
219: 복수의 범용 염기 유사체를 포함하는 서열
222, 224, 226, 228, 236, 238, 240, 242: 가교서열, 시퀀싱 어댑터 서열
225: 엔도뉴클레아제 인식 부위
230: 캡처 모이어티

Claims (23)

  1. 샘플에서 하나 이상의 표적 뉴클레오티드 서열을 검출하는 방법으로서, 상기 방법은:
    (i) 상기 샘플의 각 표적 뉴클레오티드 서열에 대해, 제1 프로브, 제2 프로브 및 가교 올리고(bridge oligo) 또는 서로 어닐링하여 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 제공하는 단계로서,
    상기 제1 프로브는 분자의 5' 말단에서 시작하여, 제1 가교 올리고-특이적 서열, 제1 서열 바코드, 및 제1 프로브의 3' 말단에 있는 제1 표적 특이적 부분을 포함하고;
    상기 제2 프로브는 분자의 5' 말단에서 시작하여, 제2 표적 특이적 부분, 제2 서열 바코드, 및 제2 프로브의 3' 말단에 있는 제2 가교 올리고-특이적 서열을 포함하며;
    상기 가교 올리고 또는 가교 올리고 복합체는 각각 상기 제1 프로브 및 상기 제2 프로브의 제1 가교 올리고-특이적 서열 및 제2 가교 올리고-특이적 서열에 상보적인 서열을 포함하고;
    상기 제1 서열 바코드 및 제2 서열 바코드 중 하나 이상은 각각 상기 제1 프로브 또는 상기 제2 프로브에 존재하고; 및
    상기 제1 프로브, 상기 제2 프로브, 및 상기 가교 올리고 또는 가교 올리고 복합체 중 하나 이상은 엔도뉴클레아제에 대한 인식 서열을 포함하는 것인 단계;
    (ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 상기 제2 프로브를 상기 가교 올리고, 또는 서로 어닐링하여 가교 올리고 복합체를 형성하고, 자가-어닐링하여 복수의 라이게이션 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키는 단계;
    (iii) 상기 표적 뉴클레오티드 서열에 대해 테스트될 샘플에 존재하는 핵산을 상기 라이게이션 복합체와 접촉시키는 단계;
    (iv) 각각의 제1 프로브 및 제2 프로브의 상기 제1 표적 특이적 부분 및 상기 제2 표적 특이적 부분이 표적 서열 상의 인접한 섹션에 혼성화될 수 있게 하여, 혼성화 복합체를 형성하는 단계;
    (v) 상기 혼성화 복합체에서 프로브를 라이게이션시켜, 라이게이션된 라이게이션 복합체(ligated ligation complex)를 제공하는 단계;
    (vi) 상기 라이게이션된 라이게이션 복합체가 상기 표적 뉴클레오티드 서열로부터 분리되게 하는 단계;
    (vii) 상기 표적 뉴클레오티드 서열에 상응하는 서열을 포함하는 표적-특이적 프로브로서, 상기 라이게이션된 라이게이션 복합체와 어닐링할 수 있는 것인 표적-특이적 프로브를 첨가하고, 상기 표적 특이적 프로브가 상기 라이게이션된 라이게이션 복합체에 어닐링할 수 있게 하여, 증폭 주형을 형성하는 단계;
    (viii) 가닥-치환 폴리머라아제에 의한 롤링 서클 증폭(RCA)을 이용하여, 상기 증폭 주형으로부터 핵산을 증폭시켜, 단일 가닥 콘카테머(concatemeric) 서열을 수득하는 단계;
    (ix) (a) 단계 (viii)에서 수득된 단일 가닥 콘카테머 서열을 절단하거나, 또는 (b) 단계 (viii)에서 수득된 증폭된 하나 이상의 단일 가닥 콘카테머 서열을 엔도뉴클레아제에 대한 인식 서열을 포함하는 특이적 올리고뉴클레오티드와의 어닐링에 적용하여, 상기 올리고뉴클레오티드를 단계 (i)에서 특정된 인식 서열과 어닐링시켜 상기 엔도뉴클레아제에 대한 인식 부위를 수득되고, 상기 엔도뉴클레아제로 어닐링된 복합체를 절단하는 것에 의해 핵산 단편을 수득하는 단계를 수행하는 단계,
    (x) 단계 (viii)에서 수득된 콘카테머 서열 또는 단계 (ix)에서 수득된 핵산 단편에 시퀀싱 기술을 적용하여 바코드 서열(들)을 결정하는 단계; 및
    (xi) 상기 제1 표적 특이적 부분의 적어도 일부, 상기 제2 표적 특이적 부분의 적어도 일부, 상기 제1 바코드의 적어도 일부 및 상기 제2 바코드의 적어도 일부 중 하나 이상을 결정하여 상기 샘플 중 상기 표적 뉴클레오티드 서열의 존재, 상기 표적 뉴클레오티드 서열의 갯수, 또는 상기 표적 뉴클레오티드 서열의 존재 및 갯수를 확인하는 단계를 포함하는 것인 방법.
  2. 청구항 1에 있어서, 상기 가교 올리고 또는 가교 올리고 복합체는 제3 바코드를 더 포함하고, 상기 제3 바코드는 상기 가교 올리고 또는 가교 올리고 복합체에 존재하는 것인 방법.
  3. 청구항 1에 있어서, 상기 방법은 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고-처리량 검출을 위한 것이며, 복수의 샘플이 제공되고, 단계 (ii)는 각각의 샘플에 대해 별개의 튜브에서 수행되는 것인 방법.
  4. 청구항 1에 있어서, 복수의 샘플이 단계 (viii) 이전에 풀링되는 것인 방법.
  5. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 제1 프로브, 상기 제2 프로브, 상기 가교 올리고, 또는 상기 복수의 가교 올리고뉴클레오티드의 올리고뉴클레오티드 중 적어도 하나는 제1 캡처 모이어티를 포함하고, 단계 (iv)와 (v) 사이에, 상기 혼성화 복합체를 제2 캡처 모이어티를 포함하는 고체 지지체와 접촉시켜, 상기 제1 캡처 모이어티와 상기 제2 캡처 모이어티가 상호작용하여 상기 혼성화 복합체가 상기 고체 지지체에 결합될 수 있게 하고, 고체 지지체에 결합된 혼성화 복합체를 상기 고체 지지체에 결합되지 않은 샘플의 성분들로부터 분리하는 단계를 포함하는 것인 중간 단계 (iv)(a)가 수행되는 것인 방법.
  6. 청구항 5에 있어서, 상기 방법은 단계 (iv)(a) 전에 핵산을 농축하는 단계를 포함하지 않는 것인 방법.
  7. 청구항 5에 있어서, 상기 제1 캡처 모이어티는 비오틴 모이어티이고, 상기 제2 캡처 모이어티는 스트렙타비딘 모이어티 또는 아비딘 모이어티인 것인 방법.
  8. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 샘플 또는 상기 복수의 샘플은 혈액 샘플, 타액 샘플, 소변 샘플 또는 대변 샘플을 포함하는 것인 방법.
  9. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 가교 올리고, 또는 상기 복수의 가교 올리고뉴클레오티드 중 하나 이상의 올리고뉴클레오티드는 상기 제1 프로브 또는 상기 제2 프로브에 상보적이지 않은 영역에 표적 계수(enumeration)를 위한 분자 바코드로 사용하기에 적합한 무작위 서열의 통합을 허용하는 복수의 범용 염기 유사체(universal base analogue)를 포함하고,
    단계 (v) 전에, 상기 무작위 서열을 생성하기 위해 폴리머라아제 및 뉴클레오티드를 사용하여 갭 필링(gap filling) 단계가 수행되는 것인 방법.
  10. 청구항 9에 있어서, 상기 복수의 범용 염기 유사체는 복수의 5-니트로인돌인 것인 방법.
  11. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 방법은 서로 어닐링하여 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드의 사용을 포함하고, 상기 복수의 올리고뉴클레오티드는 바코드 루프 올리고(barcode loop oligo)를 포함하고,
    상기 바코드 루프 올리고는 분자의 5' 말단으로부터 시작하여, 제3 가교 올리고-특이적 서열, 제3 바코드를 포함할 수 있는 바코드된 루프 서열(barcoded loop sequence), 및 제4 가교 올리고-특이적 서열을 포함하며,
    상기 하나 이상의 가교 올리고의 나머지는 상기 바코드 루프 올리고의 제3 가교 올리고-특이적 서열 및 제4 가교 올리고-특이적 서열에 상보적인 서열을 포함하는 것인 방법.
  12. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 가교 올리고 또는 가교 올리고 복합체는:
    (i) 1개 내지 5개의 3' 돌출 염기,
    (ii) 3' 포스페이트, 및
    (iii) 3' 말단으로부터 3개의 위치 내의 하나 이상의 포스포로티오에이트 변형 중 하나 이상을 포함하는 것인 방법.
  13. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 제1 프로브의 3' 말단 또는 상기 제2 프로브의 5' 말단, 또는 둘 모두가 상기 제1 프로브의 제2 프로브로의 화학적 라이게이션을 허용하도록 변형되는 것인 방법.
  14. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 제1 프로브 또는 상기 제2 프로브, 또는 둘 모두의 가교 부분(bridging portion), 또는 상기 가교 올리고, 또는 상기 복수의 가교 올리고뉴클레오티드의 올리고뉴클레오티드는 상기 가교 올리고 또는 가교 올리고 복합체로의 개선된 결합을 허용하도록 화학적으로 변형된 염기를 포함하는 것인 방법.
  15. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 제1 표적 특이적 부분, 상기 제2 표적 특이적 부분, 상기 제1 가교 올리고 특이적 서열, 및 상기 제2 가교 올리고 특이적 서열 중 하나 이상은 서로 독립적으로, 하나 이상의 화학적으로 변형된 뉴클레오티드를 포함하는 것인 방법.
  16. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 가교 올리고, 또는 상기 복수의 가교 올리고뉴클레오티드의 올리고뉴클레오티드는 하나 이상의 화학적으로 변형된 뉴클레오티드를 포함하는 것인 방법.
  17. 청구항 1 내지 4 중 어느 한 항에 있어서, 단계 (viii)은 phi29 폴리머라아제 또는 Bst 폴리머라아제를 사용하여 수행되는 것인 방법.
  18. 청구항 1 내지 4 중 어느 한 항에 있어서, 단계 (x) 직전에 상기 제1 프로브 및 상기 제2 프로브의 범용 부분(universal part)에 결합하는 프라이머를 사용하여 PCR 증폭이 수행되고, 상기 프라이머는 단계 (x)에서 후속 시퀀싱을 위한 어댑터를 포함하는 것인 방법.
  19. 청구항 1 내지 4 중 어느 한 항에 있어서, 단계 (x)에서의 시퀀싱은 나노포어 시퀀싱을 이용하여 수행되고, 단계 (viii)에서 수득된 콘카테머 서열은 전위 복합체(transposition complex)를 사용하여 단편화되는 것인 방법.
  20. 청구항 1 내지 4 중 어느 한 항에 있어서, 유전적 표적 계수는 표적당 및 샘플당 분자 바코드의 갯수를 세는 것에 의해 허용되는 것인 방법.
  21. 청구항 1 내지 4 중 어느 한 항에 있어서, 2개 이상의 샘플 또는 2개 이상의 유전자좌/대립유전자 조합에 대해, 바코드 서열을 사용하여 서열, 다형성 및 인델(indel) 중 하나 이상에 대해 샘플(들)의 유전자형을 결정하는 것인 방법.
  22. 복수의 용기를 포함하는 키트(kit of parts)로서, 하나 이상의 용기는 제1 프로브 및 제2 프로브의 하나 이상의 세트를 포함하고, 하나 이상의 용기는 하나 이상의 가교 올리고 또는 가교 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 포함하고,
    상기 제1 프로브는 분자의 5' 말단에서 시작하여, 제1 가교 올리고-특이적 서열, 제1 서열 바코드, 및 제1 프로브의 3' 말단에 있는 제1 표적 특이적 부분을 포함하며;
    상기 제2 프로브는 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 제2 서열 바코드, 및 제2 프로브의 3' 말단에 있는 제2 가교 올리고-특이적 서열을 포함하고;
    상기 가교 올리고 또는 가교 올리고 복합체는 각각 상기 제1 프로브 및 상기 제2 프로브의 제1 가교 올리고-특이적 서열 및 제2 가교 올리고-특이적 서열에 상보적인 서열을 포함하며;
    상기 제1 서열 바코드 또는 상기 제2 서열 바코드 또는 상기 제3 바코드 중 하나 이상은 각각 상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체에 존재하고;
    상기 키트는 표적 뉴클레오티드 서열에 상응하는 서열을 포함하는 표적 특이적 프로브를 더 포함하고, 상기 표적 특이적 프로브는 라이게이션된 라이게이션 복합체와 어닐링할 수 있고;
    상기 제1 프로브 또는 상기 제2 프로브 또는 상기 가교 올리고 또는 가교 올리고 복합체 중 하나 이상은 엔도뉴클레아제에 대한 인식 서열을 포함하며;
    상기 키트는 상기 엔도뉴클레아제에 대한 인식 부위가 수득되도록 상기 인식 서열과 어닐링할 수 있는 올리고뉴클레오티드를 포함하는 것인 키트.
  23. 청구항 22에 있어서, 상기 가교 올리고 또는 가교 올리고 복합체는 제3 바코드를 더 포함하는 것인 키트.
KR1020230107264A 2022-08-31 2023-08-16 변이체 핵산의 정확한 병렬 정량을 위한 고감도 방법 KR20240032631A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/900,109 2022-08-31
US17/900,109 US20240068010A1 (en) 2022-08-31 2022-08-31 Highly sensitive methods for accurate parallel quantification of variant nucleic acids

Publications (1)

Publication Number Publication Date
KR20240032631A true KR20240032631A (ko) 2024-03-12

Family

ID=87845851

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230107264A KR20240032631A (ko) 2022-08-31 2023-08-16 변이체 핵산의 정확한 병렬 정량을 위한 고감도 방법

Country Status (6)

Country Link
US (1) US20240068010A1 (ko)
EP (1) EP4332235A1 (ko)
JP (1) JP2024035110A (ko)
KR (1) KR20240032631A (ko)
CN (1) CN117625763A (ko)
CA (1) CA3208896A1 (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201320145D0 (en) * 2013-11-14 2014-01-01 Olink Ab Localised RCA-based amplification method using a padlock-probe
GB201621514D0 (en) 2016-12-16 2017-02-01 Q-Linea Ab Padlock probe detection method
EP3447152A1 (en) 2017-08-25 2019-02-27 Eawag, Swiss Federal Institute of Aquatic Science and Technology Accurate and massively parallel quantification of nucleic acid
WO2019165318A1 (en) * 2018-02-22 2019-08-29 10X Genomics, Inc. Ligation mediated analysis of nucleic acids
WO2020056381A1 (en) * 2018-09-14 2020-03-19 Cold Spring Harbor Laboratory PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
PT4060050T (pt) * 2021-03-18 2023-05-02 Genomill Health Oy Métodos altamente sensíveis para quantificação paralela e precisa de ácidos nucleicos
ES2960777T3 (es) * 2021-03-18 2024-03-06 Genomill Health Oy Métodos para la cuantificación paralela precisa de ácidos nucleicos en muestras diluidas o no purificadas

Also Published As

Publication number Publication date
US20240068010A1 (en) 2024-02-29
JP2024035110A (ja) 2024-03-13
EP4332235A1 (en) 2024-03-06
CA3208896A1 (en) 2024-02-29
CN117625763A (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
JP6571895B1 (ja) 核酸プローブ及びゲノム断片検出方法
US20190024141A1 (en) Direct Capture, Amplification and Sequencing of Target DNA Using Immobilized Primers
CN111032881B (zh) 核酸的精确和大规模平行定量
US8975019B2 (en) Deducing exon connectivity by RNA-templated DNA ligation/sequencing
JP7232643B2 (ja) 腫瘍のディープシークエンシングプロファイリング
US11486003B2 (en) Highly sensitive methods for accurate parallel quantification of nucleic acids
US11898202B2 (en) Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples
EP4332235A1 (en) Highly sensitive methods for accurate parallel quantification of variant nucleic acids
US11970736B2 (en) Methods for accurate parallel detection and quantification of nucleic acids
EP4215619A1 (en) Methods for sensitive and accurate parallel quantification of nucleic acids
TW202411431A (zh) 準確地平行定量變體核酸的高靈敏度方法
TW202411430A (zh) 準確地平行檢測和定量核酸的方法