KR20220130591A - 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법 - Google Patents

희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법 Download PDF

Info

Publication number
KR20220130591A
KR20220130591A KR1020220030312A KR20220030312A KR20220130591A KR 20220130591 A KR20220130591 A KR 20220130591A KR 1020220030312 A KR1020220030312 A KR 1020220030312A KR 20220030312 A KR20220030312 A KR 20220030312A KR 20220130591 A KR20220130591 A KR 20220130591A
Authority
KR
South Korea
Prior art keywords
probe
sequence
target
bridge oligo
barcode
Prior art date
Application number
KR1020220030312A
Other languages
English (en)
Inventor
유하-페카 푸르시헤이모
타투 히르보넨
마누 탐미넨
안토니 코르키아코스키
Original Assignee
게노밀 헬스 오와이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 게노밀 헬스 오와이 filed Critical 게노밀 헬스 오와이
Publication of KR20220130591A publication Critical patent/KR20220130591A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6865Promoter-based amplification, e.g. nucleic acid sequence amplification [NASBA], self-sustained sequence replication [3SR] or transcription-based amplification system [TAS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 예를 들어 대량의 비정제된 샘플 물질에서, 하나 이상의 핵산 표적의 정확한 대량 병렬 정량분석을 위한 차세대 DNA 시퀀싱 방법 및 용도에 관한 것이다. 더 구체적으로, 본 발명은 복합 샘플에서 유전자 표적을 검출 및 정량분석하기 위한 프로브를 포함하는 키트 및 방법에 관한 것이다. 본 발명은 유전자 표적당 하나 이상의 표적-특이적 핵산 프로브 및 브릿지 올리고 또는 브릿지 올리고 복합체를 포함한다.

Description

희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법{METHODS FOR ACCURATE PARALLEL QUANTIFICATION OF NUCLEIC ACIDS IN DILUTE OR NON-PURIFIED SAMPLES}
본 발명의 개시내용은 하나 이상의 핵산 표적의 정확한 대량 병렬 정량분석을 위한 개선된 차세대 DNA 시퀀싱 방법에 관한 것이다. 더 구체적으로, 본 개시내용은 유전자 표적 및 변이체 검출에 주로 사용되는 복합 DNA 풀에서 유전자 표적을 검출 및 정량분석하기 위한 프로브를 포함하는 키트 및 방법에 관한 것이다. 본 발명은 소변, 생검, 타액 및 기타 분비물, 호기된 수분 추출물, 조직, 혈장 (액체 생검) 또는 유사물을 포함하지만 이에 한정되지 않는 인간 또는 동물의 신체로부터 수득된 샘플과 같이, 고도로 불순한 샘플에서 질병-유발 유전자 변경의 검출 분야에의 특별한 적용을 발견하였다. 본 발명은 유전자 표적당 하나 이상의 표적-특이적 핵산 프로브 (좌측 프로브 및 우측 프로브) 및 브릿지 올리고 (bridge oligo) 또는 브릿지 올리고 복합체를 사용한다.
유전자 변이를 연구하는 기술의 발전으로, 식물 및 동물에서 유전자 변이를 검출하는 것은 번거롭지 않다. 그러나, 특히 약한 신호를 가진 샘플에서 돌연변이와 같은 유전자 변이를 검출하고 정확하게 정량분석하는 것은 시퀀싱 비용이 감소되었음에도 불구하고 현재 여전히 번거롭고 힘들며 비용이 많이 든다. 컨센서스 배경에 대해 유전자 신호를 검출하기 위한 특이성 (specificity), 약한 유전자 신호를 검출하기 위한 민감도 (sensitivity), 검출된 신호의 정확한 정량분석을 위한 정확도 (accuracy), 분석당 표적화된 유전자 표적의 처리량 수 (throughput number), 분석 당 비용 (cost), 다수의 샘플을 병렬로 분석하는 경우 분석 비용 규모를 결정하기 위한 스케일링 (scaling) 및 샘플링으로부터 결과까지 걸리는 시간을 결정하기 위한 회전율 (turn-over)로, 다양한 문제를 보다 정확하게 표시할 수 있다.
현재, 액체 생검에 대한 전형적인 정량분석 방법 및 개념적으로 유사한 분석 (예: 항생제 내성 유전자 검출)에는 정량적 PCR (qPCR), 어레이 qPCR, 디지털 PCR, 다중 결찰-의존성 프로브 증폭 (MLPA) 또는 차세대 DNA 시퀀싱 데이터로부터의 정량분석을 포함한다. 상기 정량분석 방법은 강력하고 잘-확립된 방법이지만, 각 방법은 하기에서 자세히 논의되는 특정 문제점과 관련이 있다:
정량적 PCR (Quantitative PCR): 정량적 PCR (qPCR)은 PCR 중에, 즉 실시간으로 표적 DNA 분자의 증폭을 포함하는 기술이다. 실시간 PCR은 정량적 (quantitative real-time PCR), 준정량적, 즉 DNA 분자의 소정량 이상/미만 (semi quantitative real-time PCR)으로 사용될 수 있다. 정량적 PCR (qPCR)은 유전자 표적 정량분석의 최적 표준 (gold standard)이다. 현재, qPCR 반응의 실험실 비용은 약 $2이다. 그러나, 반응을 설정하는데 드는 상당한 시간 (인건비), 표준 곡선의 필요성과, 정량분석된 각 표적에 대한 복제를 함께 고려하면, 실제 비용은 사실상 훨씬 더 높다. 각 유전자 표적에 대해 별도의 정량분석 실험이 필요하기 때문에 시간에 대한 인건비의 양은 샘플 수가 증가함에 따라 가파르게 확장된다.
어레이 PCR (Array PCR): PCR 어레이는 유전자의 관련 경로- 또는 질병-중심 패널의 발현을 분석하기 위한 가장 신뢰할 수 있는 도구이다. 각 96-웰 플레이트, 384-웰 플레이트 또는 100-웰 디스크 PCR 어레이에는 중점 유전자 패널의 철저하게 연구된 패널에 대한 SYBR Green-최적화 프라이머 분석 (SYBR Green-optimized primer assays)을 포함한다. 상기 qPCR 기술의 더 새로운 반복은 개별 qPCR 반응들을 소형화하는 어레이 qPCR이다. 어레이 PCR은 개별 qPCR 반응의 비용을 낮추고, 다수의 표적 및 샘플에 대한 방법의 확장성을 개선하였다. 그러나, 이러한 방법은 현재 칩당 수천 달러의 비용과 판독 인프라의 막대한 자본 비용으로 12개의 샘플로부터 384개의 표적 (또는 반대로 384개의 샘플로부터 12개의 표적)을 프로파일링하는 것으로 제한된다. 그러므로, 전술한 설정을 사용하여 수천 개의 샘플을 프로파일링하는 것은 엄청난 비용이 든다.
디지털 PCR (Digital PCR): 디지털 중합효소 연쇄 반응 (digital PCR, DigitalPCR, dPCR, 또는 dePCR)은 형광 검출 및 액적-미세유체 공학을 통한 표적의 절대 정량분석을 제공하는 방법이다. 상기 방법은 상대적으로 비용-효율적이지만 (샘플당 하나의 표적은 약 $3의 비용이 듦), 각 샘플에서 각 표적에 대한 개별 실험을 준비, 설정 및 실행하는 시간당 비용은 수천 개의 샘플로 확대하기에는 좋지 않다.
MLPA (Multiplex Ligation-dependent Probe Amplification)는 개별 샘플에서 다수의 유전자 표적의 검출을 단순화하는 접근 방식을 제공한다. 그러나, MLPA는 표적의 상대적 정량분석 만을 제공하며, 각 샘플에 대해 별도의 검출 실험을 필요로 한다. 더 최근에는 MLPA의 변형은 DNA 바코딩 (DNA barcoding)의 개념을 도입하였다. 이러한 개념은 전통적인 MLPA 워크플로우보다 더 나은 정량적 분해능 및 샘플 다중화를 허용한다.
차세대 시퀀싱-기반 접근 방식 (Next generation sequencing-based approaches): NGS (Next-generation sequencing)는 서열-기반 유전자 발현 분석을 아날로그 기술에 대한 대안으로 "디지털"로 만드는, 고-처리량 시퀀싱 (high-throughput sequencing)으로도 알려져 있다. 차세대 DNA 시퀀싱 데이터의 표적 계수는 DNA 시퀀싱 비용을 감소시키기 때문에 점점 더 매력적이 되었고, 현재 예를 들어 NIPT 스크리닝에 사용된다. 그러나, 현재 접근 방식은 높은 시퀀싱 라이브러리 제조 비용과 비-관련 유전자 표적을 시퀀싱하는데 낭비되는 시퀀싱 노력으로 어려움을 겪는다. 예를 들어, 암-관련 액체 생검에서, 비-표적 접근 방식은 종양학적으로 비-관련 유전자좌에 대한 시퀀싱 노력의 낭비를 초래한다. 태아 진단에서, 유전자좌의 비-표적 샘플링은 데이터 해석을 위한 통계학적 옵션을 상당히 제한한다. Guardant Health Inc는 RNA 포획 프로브 어레이가 차세대 DNA 시퀀싱을 위한 표적을 농축하는, 보다 표적화된 시퀀싱 접근 방식을 제공한다.
Akhras et al. (2007) PLoS ONE 2(2):e223은 바코드된 표적-특이적 프로브, 표적 원형화 및 시퀀싱을 포함하는 다중 병원체 검출 분석을 개시하였다. 표적-특이적 프로브를 결찰하기 위한 브릿지 올리고뉴클레오티드의 사용이 또한 개시되어 있다.
WO2019038372는 관심 표적 서열이 선택적으로 증폭되고 시퀀싱되는 차세대 시퀀싱 접근 방식을 기재하였다. 이러한 방법을 사용하면 샘플에서 많은 표적 서열을 정확하게 병렬로 검출하고 정량분석할 수 있지만, 더 복잡하고 부피가 크고 및/또는 불순한 샘플은 여전히 어렵다.
그러므로, 전술한 논의에 비추어, 핵산 표적의 정확한 대규모 병렬 정량분석을 통해 특이성, 민감도, 정확도, 처리량, 비용, 스케일링 및 회전율을 포함하지만 이에 한정되지 않는 전술한 단점을 극복할 필요가 있다.
발명의 요약
본 발명은 예를 들어 대용량 샘플 (최대 수십 밀리리터) 및/또는 희석 및/또는 비-정제된 샘플 물질로부터 고도로 확장 가능하고 정확한 표적 정량분석을 위해 차세대 시퀀싱을 사용하는 방법을 제공한다.
제1 주요 양상에서, 본 발명은 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법 (method for the high-throughput detection)에 관한 것으로서, 상기 방법은 하기 단계를 포함하고:
(i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
제1 프로브, 제2 프로브, 및 브릿지 올리고 또는 서로 어닐링하여 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 제공하는 단계로서,
상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
상기 브릿지 올리고 또는 브릿지 올리고 복합체는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 브릿지 올리고-특이적 서열 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 함유하고;
상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 각각에 존재하며;
상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 제1 포획 모이어티 (capture moiety)를 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 제2 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키고, 자가-어닐링으로 복수의 결찰 복합체 (ligation complexes)가 형성되도록 하는 단계;
(iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 각 샘플 내에 존재하는 핵산을 상기 결찰 복합체와 접촉시키는 단계;
(iv) 각각의 제1 프로브 및 제2 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체 (hybridization complex)가 형성되도록 하는 단계;
(v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
(vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
(vii) 상기 혼성화 복합체에서 프로브들을 결찰하여 결찰된 결찰 복합체 (ligated ligation complexes)를 제공하는 단계;
(viii) 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링 (pooling)하는 단계;
(ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
(x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술에 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계;
여기서 상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있다.
제2 주요 양상에서, 본 발명은 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함하고:
(i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
Figure pat00001
단일 프로브로서, 그 분자의 5' 말단으로부터 시작하여, 제1 표적 특이적 부분, 바코드를 포함하는 스페이서 부분, 및 제2 프로브의 3' 말단에 제2 표적 특이적 부분을 포함하는 단일 프로브, 및
Figure pat00002
브릿지 올리고로서, 그 브릿지 올리고는 상기 단일 프로브의 스페이서 부분 또는 스페이서 부분의 일부에 상보적인 서열을 함유하는 브릿지 올리고를 제공하는 단계로서,
상기 단일 프로브 또는 상기 브릿지 올리고는 제1 포획 모이어티를 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 단일 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고와 접촉시키고, 자가-어닐링하는 단계;
(iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 복수의 샘플 내에 존재하는 핵산을 상기 단일 프로브와 접촉시키고, 상기 브릿지 올리고에 어닐링하는 단계;
(iv) 상기 단일 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체가 형성되도록 하는 단계;
(v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
(vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
(vii) 상기 단일 프로브의 5' 말단 및 3' 말단을 결찰하여 결찰된 결찰 복합체를 제공하는 단계;
(viii) 선택적으로, 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링하는 단계;
(ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
(x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술에 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계;
여기서 상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있다.
도 1은 본원의 일 구체예에 따른 MLA (Multiplexed Ligation Assay)의 흐름도를 도시한다.
도 2a는 본원의 일 구체예에 따른 복수의 프로브 엔티티 (probe entities)를 갖는 프로브 삼중항 (probes triplet)의 원리 구조를 도시한다.
도 2b는 본원의 일 구체예에 따른 제1 프로브 및 제2 프로브 사이의 갭 필링 (gap filling)을 도시한다.
도 2c는 본원의 일 구체예에 따른 제1 프로브 및 제2 프로브 및 브릿지 복합체 사이의 갭 필링을 도시한다.
도 3 실시예에 기재된 워크플로우 (레인 6-7), 및 상기 프로브에 대해 정확하지 않은 올리고뉴클레오티드 표적이 제공되는 2개의 음성 대조군 실험 (레인 8-9)을 사용하여 제조된 2개의 DNA 시퀀싱 라이브러리의 겔 전기영동.
도 4 검출된 분자 계수는 스파이크-인 (spiked-in) 합성 올리고뉴클레오티드 표적의 양을 정확하게 반영한다. 각 행은 명시된 돌연변이의 3가지 스파이크-인 농도를 나타낸다. 응답 (response)은 4차수에 걸쳐 선형이다.
도 5 검출된 신호는 프로브 및 이들의 올리고뉴클레오티드 표적의 존재/부재에 대해 고도로 특이적이다. PIK3CA의 경우, 2가지 상이한 종양원성 변이체를 테스트하였다.
정의:
표적 뉴클레오티드 서열 (Target Nucleotide Sequence): 용어 표적 뉴클레오티드 서열은 검출이 필요한 관심 있는 임의의 뉴클레오티드 서열일 수 있다. 해당 용어는 인접 뉴클레오티드의 서열 뿐만 아니라 상보적 서열을 갖는 핵산 분자를 지칭하는 것으로 이해될 것이다. 일부 구체예에서 표적 서열은 다형 (polymorphism)을 나타내거나 또는 이와 관련된 뉴클레오티드 서열이다.
다형 (Polymorphism): 용어 다형은 모집단에서 2개 이상의 유전자 결정된 대체 서열 또는 대립유전자의 발생을 지칭한다. 다형 마커 또는 부위는 서열 분기가 발생하는 유전자좌이다. 다형 유전자좌는 하나의 염기쌍 만큼 작을 수 있다.
샘플 (Samples): 용어 샘플은 2개 이상의 표적 서열을 함유하는 2개 이상의 샘플에 대해 본원에서 사용된다. 본 발명에 따른 방법에 제공되는 샘플은 적어도 표적 핵산을 추출하고 본 발명에서 사용되는 프로브에 접근 가능하도록 준비되었을 수 있다. 구체적으로, 일부 구체예에서, 샘플 각각은 적어도 2개의 상이한 표적 서열, 바람직하게는 적어도 100개, 더 바람직하게는 적어도 250개, 더 바람직하게는 적어도 500개, 가장 바람직하게는 적어도 2000개, 또는 초과를 포함한다. 용어 샘플은 소변, 생검, 타액 및 기타 분비물, 호기 수분 추출물, 조직, 혈장 (액체 생검)을 포함하는 인간/동물 신체로부터 수득된 2개 이상의 샘플, 또는 물, 폐수, 토양, 식물을 포함하는 환경으로부터 수득된 2개 이상의 샘플, 바이러스 또는 박테리아 또는 유사물을 함유하는 샘플을 지칭할 수 있지만 이에 한정되지 않는다. 일 구체예에서, 복수의 샘플은 혈액 샘플, 타액 샘플, 소변 샘플 또는 대변 샘플, 다른 체액 샘플 또는 신체 물질로부터의 추출물, 예를 들어 모발 또는 피부 플레이크를 포함한다.
프로브 (Probe): 용어 프로브는 DNA 또는 RNA 샘플에서 프로브의 서열에 상보적인 뉴클레오티드 서열 (DNA 또는 RNA 표적)의 존재를 검출하는데 사용될 수 있는 가변 길이 (통상 50-1000개의 염기 길이, 바람직하게는 50 - 200개의 염기 길이)의 DNA 또는 RNA의 단편이다. 표적 서열에 상보적인 올리고뉴클레오티드 프로브의 섹션은 샘플의 각 표적 서열에 대해, 좌측 및 우측 프로브 쌍이 제공되고, 이에 의해 프로브 각각은 이들의 극말단에 상기 표적 서열의 일부에 상보적인 섹션을 함유하도록 디자인된다. 대안으로서, 스페이서 섹션에 의해 분리되는, 표적 서열의 일부에 상보적인 2개의 섹션을 함유하는 단일 프로브가 제공된다. 또한, 본 개시내용은 좌측 프로브 및 우측 프로브를 연결하거나, 또는 단일 프로브의 스페이서 섹션과 혼성화하기 위해 사용되는 브릿지 올리고 또는 브릿지 올리고 복합체를 개시하였다.
범용 (Universal): 용어 범용이 증폭 절차를 설명하는데 사용되는 경우, 복수의 증폭 반응에 단일 프라이머 또는 프라이머 세트의 사용을 가능하게 하는 서열을 지칭한다. 이러한 프라이머의 사용은 복수의 선택된 핵산 서열을 증폭시키는데 2개의 프라이머 만이 필요하다는 점에서 다중화를 크게 단순화한다. 용어 범용이 프라이밍 부위를 설명하는데 사용되는 경우, 범용 프라이머가 혼성화될 부위이다. 또한 범용 프라이밍 서열/프라이머의 "세트"가 사용될 수 있다는 점에 유의해야 한다.
혼성화 (Hybridization): 용어 혼성화 (또는 hybridisation)는 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA) 분자가 상보적 DNA 또는 RNA에 어닐링되는 과정을 서술한다. DNA 또는 RNA 복제, 및 DNA의 RNA로의 전사는 모두 뉴클레오티드 혼성화에 의존한다.
결찰 (Ligation): 용어 결찰은 효소 작용을 통해 2개의 핵산 단편들을 연결하는 것이다. DNA 리가제는 상보적 가닥의 인접 부위에서 결합된 2개의 폴리뉴클레오티드 가닥들(의 말단들) 사이의 포스포디에스테르 결합의 형성을 촉매할 수 있는 효소이다. 일 구체예에서, 구체적으로 폴리뉴클레오티드의 인접한 양쪽 말단이 화학적 결찰되도록 변형되는 경우, 결찰은 또한 화학적으로 수행될 수 있다.
증폭 (Amplification): 본원에서 사용된 용어 증폭은 뉴클레오티드 서열들의 혼합물내 특정 뉴클레오티드 서열의 농도를 증가시키기 위한 폴리머라제-기반 반응의 사용을 나타낸다. "PCR" 또는 "중합효소 연쇄 반응"은 특정 DNA/RNA 세그먼트의 인 비트로 효소 증폭을 위한 신속한 절차이다. 증폭시킬 DNA/RNA는 샘플을 가열하여 변성될 수 있다. 용어 프라이머는 DNA 합성의 출발점 역할을 하는 RNA 또는 DNA의 짧은 가닥 (일반적으로 약 18-22개의 염기)이다. 이러한 과정을 촉매하는 효소인 DNA 폴리머라제는 기존 DNA 가닥에 새로운 뉴클레오티드를 부가할 수 있기 때문에 DNA 복제를 필요로 한다. T7 RNA 폴리머라제는 단일 DNA 분자를 전사하고 RNA의 다수의 카피로 증폭시킬 수 있으며, 이는 다시 cDNA로 전환될 수 있다.
폴리머라제 (Polymerase): 폴리머라제는 핵산의 긴 사슬 또는 폴리머를 합성하는 효소이다. DNA 폴리머라제 및 RNA 폴리머라제는 염기쌍 상호작용을 이용하여 DNA 또는 RNA 주형 가닥을 카피하여, DNA 및 RNA 분자 각각을 조립하는데 사용된다. 본원에서 사용된 특정 폴리머라제인 T7 RNA 폴리머라제는 5'→3' 방향으로 RNA의 형성을 촉매하는 T7 박테리오파지로부터의 RNA 폴리머라제이다. 상기 T7 RNA 폴리머라제는 RNA 합성을 위한 보조인자로서 Mg2+ 이온 및 부분적으로 이중 가닥 DNA 주형을 필요로 한다. T7 RNA 폴리머라제는 단일 DNA 분자를 전사하고 RNA의 다수의 카피로 증폭시킬 수 있다. 본원에서 사용된 다른 특정 폴리머라제인 phi29 폴리머라제는 박테리오파지 phi29 유래의 가닥-치환 DNA 폴리머라제이다. Phi29 폴리머라제는 고도로 진행성 (highly processive)이므로, 긴 연쇄체 서열을 생성하기 위해 원형 DNA 주형의 롤링 서클 증폭에 이상적인 폴리머라제이다.
고처리량 (High throughput): 용어 고처리량은 다수의 DNA 샘플을 동시에 처리하고 스크리닝할 수 있고; 뿐만 아니라 단일 DNA 샘플내 다수의 상이한 유전자좌를 동시에 스크리닝할 수 있는 능력을 지칭한다. 고처리량 시퀀싱 또는 스크리닝은 종종 HTS로 약칭되고, 특히 다량의 샘플을 동시에 효과적으로 스크리닝하는 것과 관련된 과학적 실험 방법이다.
USER (Uracil Specific Excision Reagent): 데옥시우리딘 뉴클레오티드가 존재하는 위치에서 절단에 의해 원형 DNA 분자를 선형화하는 시약.
상기 기재된 바와 같이, 본 개시내용은 결찰-의존성 분석들을 레버리징 (leveraging)함으로써 매우 많은 수의 샘플에서 표적 뉴클레오티드 서열 검출의 고처리량 검출 방법에 관한 것이다. 본 개시내용은 차세대 시퀀싱에 의해 허용되는 기술을 사용하여 복합 핵산 풀에서 유전자 표적의 서열을 결정하는 방법을 제공한다. 본 개시내용은 또한 결찰-의존성 분석들을 레버리징함으로써, 다수의 샘플, 바람직하게는 매우 많은 수의 샘플에서 다수의 유전자 표적을 프로파일링하는 방법을 제공한다. 본 개시내용은 복수의 샘플에서 상이한 표적 핵산을 쿼리할 수 있게 하는 다중 결찰-의존성 프로브 증폭을 위한 방법을 추가로 제공한다. 본 발명의 방법은 상이한 표적 핵산들에 대한 복수의 상이한 프로브 세트를 제공하는, 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 시퀀싱을 허용한다. 시퀀싱 데이터를 처리하는 경우 샘플 풀에서 개별 샘플의 절대 정량분석 및 유전자 표적의 식별을 위해 고유한 서열 식별인자가 사용된다.
제1 주요 양상에서, 본 발명은 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함하고:
(i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
제1 프로브, 제2 프로브 및 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 제공하는 단계로서,
상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
상기 브릿지 올리고 또는 브릿지 올리고 복합체는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 브릿지 올리고-특이적 서열 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 함유하고;
상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 각각에 존재하며;
상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 제1 포획 모이어티를 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 제2 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키고, 자가-어닐링으로 복수의 결찰 복합체가 형성되도록 하는 단계;
(iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 각 샘플 내에 존재하는 핵산을 상기 결찰 복합체와 접촉시키는 단계;
(iv) 각각의 제1 프로브 및 제2 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체가 형성되도록 하는 단계;
(v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
(vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
(vii) 상기 혼성화 복합체에서 프로브들을 결찰하여 결찰된 결찰 복합체를 제공하는 단계;
(viii) 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링하는 단계;
(ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
(x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술에 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계;
여기서 상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있다.
도 1은 본 발명의 방법의 일 구체예의 비-제한적인 구체예의 도해를 제공한다.
본 발명의 방법은 3개 이상의 핵산 프로브를 활용하며, 그 중 2개의 표적-특이적 핵산 프로브 (좌측 프로브 및 우측 프로브)는 유전적 표적에 대해 특이적이고, 하나의 핵산 프로브 또는 복합체는 전형적으로 범용이다 (브릿지 올리고 또는 브릿지 올리고 복합체). 상기 좌측 및 우측 프로브는 브릿지 프로브 또는 브릿지 올리고 복합체에 혼성화되어, 결찰 복합체를 형성한다. 샘플 DNA 또는 RNA 상의 표적 식별 부위를 갖는 결찰 복합체 (하나 이상의 바코드 서열 함유)는 쿼리 샘플의 상보적 표적 서열에 대해 혼성화될 수 있다. 혼성화 후에, 상기 좌측 및 우측 프로브는 DNA 리가제에 의해 화학적 또는 효소적으로 결찰되어 결찰된 결찰 복합체를 형성한다. 본 발명에서, 복수의 이러한 결찰된 결찰 복합체는 분석할 복수의 샘플에서 샘플 분석 중에 형성될 것이다.
일 구체예에서, "복수의 샘플 (plurality of samples)"은 생검, 타액 및 기타 분비물, 호기 수분 추출물, 조직, 혈장 (액체 생검)을 포함하는 인간 또는 동물 신체로부터 수득된 2개 이상의 샘플, 물, 폐수, 토양, 식물을 포함하는 환경으로부터 수득된 2개 이상의 샘플, 바이러스 또는 박테리아 또는 유사물을 함유하는 샘플을 지칭할 수 있지만 이에 한정되지 않는다.
바람직한 일 구체예에서, 상기 샘플은 핵산의 사전 정제 또는 농축 없이 사용된다. 다른 구체예에서, 상기 샘플은 예를 들어 핵산을 노출시키기 위해 세포를 용해시키는, 사전-처리될 수 있다.
상기 표적 서열은 검출이 필요한 관심 있는 임의의 뉴클레오티드 서열을 포함할 수 있다. 본 개시내용의 표적 뉴클레오티드 서열은 환자 혈액내 DNA의 단편 또는 모체 혈액내 DNA의 단편으로부터 수득될 수 있지만 이에 한정되지 않는다. 환자 혈액내 DNA의 단편은 아폽토시스/괴사성 암 세포로부터 수득될 수 있거나, 또는 모체 혈액내 DNA의 단편은 태아 및/또는 모체 기원으로부터 수득될 수 있다. 또한, 분석 결과는 예를 들어 해당 유형의 암에 대한 개인의 위험을 평가하고, 해당 암에 대한 주어진 치료의 효능, 종양에서 약물-저항성-관련 돌연변이의 발생, 또는 통상의 삼염색체증 (trisomies)인 다운 (Down), 파타우 (Patau) 및 에드워드 (Edwards) 증후군과 같은 유전자 장애를 가진 태아의 위험을 결정하는데 사용된다. 소정의 구체예에서, 상기 방법은 각 표적 뉴클레오티드 서열에 대해 복수의 상이한 프로브 세트를 제공하는 단계를 포함한다.
본원에서 사용된, 용어 프로브 세트 (probe sets)는 제1 프로브, 제2 프로브 및 브릿지 올리고 (또는 브릿지 올리고 복합체), 또는; 단일 프로브 및 브릿지 올리고 (또는 브릿지 올리고 복합체)를 포함한다.
소정의 구체예에서, 상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 선택적으로 5' 포스페이트, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 범용 서열, 선택적으로 제1 서열 바코드, 및 이의 3' 말단에 제1 표적 특이적 부분을 포함한다. 소정의 구체예에서, 상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 선택적으로 5' 포스페이트, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 선택적으로 제2 범용 서열, 및 이의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함한다.
바람직한 일 구체예에서, 상기 제1 프로브 또는 상기 제2 프로브는 제1 서열 바코드 또는 제2 서열 바코드 중 적어도 하나를 함유한다. 상기 제1 서열 바코드 또는 상기 제2 서열 바코드, 또는 이들 모두는 무작위 서열일 수 있거나, 또는 표적 계수를 위한 표적 뉴클레오티드 서열 식별인자 서열, 샘플 식별인자 서열 및/또는 분자 바코드를 함유할 수 있다.
바람직한 구체예에서, 상기 브릿지 올리고 또는 브릿지 올리고 복합체는 제1 및 제2 프로브 각각에서의 제1 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 선택적으로 범용 서열을 함유하고, 및/또는 무작위 서열일 수 있거나 또는 샘플 또는 서열 식별인자 서열을 함유할 수 있는 제3 바코드를 함유할 수 있다. 이와 관련하여, 제3 바코드는 제1 및 제2 바코드가 이미 존재한다는 것을 반드시 의미하지는 않는다. 앞서 설명한 바와 같이, 테스트된 모든 샘플에서 모든 결찰 복합체내에 복합체를 고유하게 정의할 수 있는, 적어도 하나의 바코드가 상기 결찰된 결찰 복합체내에 존재해야 한다.
또한, 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 제1 포획 모이어티를 포함한다. 제1 포획 모이어티가 본원에서 사용되는 경우, 상기 프로브, 결찰 복합체 또는 혼성화 복합체가 고체 지지체에 연결된 제2 포획 모이어티에 의해 포획, 즉 이에 결합되도록 하는 모이어티 예컨대 화학기를 지칭한다. 당해 분야에 알려져 있는 임의의 적절한 포획 모이어티가 이러한 목적을 위해 사용될 수 있다. 잘 알려진 적절한 예는 스트렙타비딘-코팅된 자기 비드를 사용하여 바이오틴화된 분자를 포획하는 것이다. 따라서, 일 구체예에서, 상기 제1 포획 모이어티는 바이오틴 모이어티이며, 이는 자기 비드와 같은 고체 지지체에 연결된 스트렙타비딘 또는 아비딘 모이어티 (제2 포획 모이어티)와 상호작용할 수 있다. 다른 옵션으로는 스트렙타비딘/아비딘과의 접합에 사용될 수 있는, 바이오틴 유도체 예컨대 이중-바이오틴 (dual-biotin), 데스티오바이오틴 (desthiobiotin) 또는 광절단성 바이오틴 (photocleavable biotin)을 포함한다. 추가 옵션으로는 아크리다이트/아크릴아미드 접합을 위한 티올 및 아크리다이트 기, 클릭 화학을 위한 알킨 및 아지드 기 및 항-디곡시게닌 항체 접합을 위한 디곡시게닌의 사용을 포함한다. 접합 파트너는 임의의 고체 표면 예컨대 비드 (자기 또는 기타) 또는 고체 지지체에 제공될 수 있다.
일부 구체예에서, 상기 제1, 제2 또는 브릿지 프로브 또는 브릿지 올리고 복합체는 T7 RNA 폴리머라제에 대한 프로모터 서열을 함유한다. 상기 프로모터 서열은 단계 (ix)에서 T7 RNA 폴리머라제를 사용하여 결찰된 결찰 복합체의 증폭을 허용한다. 상기 T7 RNA 폴리머라제의 프로모터 서열이 브릿지 올리고 또는 브릿지 올리고 복합체에 존재하는 것이 바람직하지만, 프로모터가 브릿지 올리고 또는 브릿지 올리고 복합체에 존재하는 대신에, 이는 또한 제1 또는 제2 프로브에 존재할 수 있다. 그러나 이러한 경우에, 상기 프로브 및 올리고는 T7 RNA 폴리머라제가 샘플 및 표적의 식별, 및 표적 서열의 계수에 필요한 모든 서열을 전사할 수 있도록 디자인되어야 한다.
상기 제1 표적 특이적 부분, 제2 표적 특이적 부분, 제1 브릿지 올리고-특이적 서열, 및/또는 제2 브릿지 올리고-특이적 서열은 바람직하게는 프로브 결합을 증가시키기 위해 서로 독립적으로 적어도 하나의 화학적으로 변형된 뉴클레오티드를 함유한다. 프로브 결합을 증가시키는 화학적 변형은 리보핵산, 펩티드 핵산 및 잠금 핵산 (locked nucleic acids)을 포함하지만 이에 한정되지 않는다 (예: WO2019038372의 도 3에 예시된 바와 같으며, 본원에 참조로 통합됨). 일 구체예에서, 상기 제1 프로브 또는 제2 프로브, 또는 이들 모두의 가교 부분 (bridging portion)은 브릿지 올리고 또는 브릿지 올리고 복합체에 대한 결합을 개선하도록 하는 화학적으로 변형된 염기(들)를 포함한다. 다른 구체예에서, 상기 제1 표적 특이적 부분, 제2 표적 특이적 부분, 제1 브릿지 올리고-특이적 서열, 및/또는 제2 브릿지 올리고-특이적 서열은 서로 독립적으로 하나 이상의 화학적으로 변형된 뉴클레오티드를 함유한다. 소정의 구체예에서, 화학적 변형은 인접한 프로브의 화학적 결찰을 허용한다. 일부 구체예에서, 전술한 프로브는 완전히 인접한 유전자좌에 또는 최대 500개의 염기쌍으로 이격된, 예를 들어 최대 200개의 염기쌍으로 이격, 예컨대 최대 50개의 염기쌍으로 이격, 바람직하게는 최대 40개의 염기쌍으로 이격, 더 바람직하게는 최대 30개의 염기쌍으로 이격, 더 바람직하게는 최대 20개의 염기쌍으로 이격, 더 바람직하게는 최대 10개의 염기쌍으로 이격, 가장 바람직하게는 최대 5개의 염기쌍으로 이격되어 결합한다.
프로브를 표적 서열을 포함하는 샘플과 접촉시키기 전에, 상기 제1 프로브 및 제2 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키고, 결찰 복합체로의 자가-어닐링이 허용된다 (단계 (ii)). 브릿지가 1개의 올리고가 아니라 서로 어닐링하여 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드 예컨대 3개 또는 5개의 올리고뉴클레오티드인 일 구체예에서 (본원의 도 2c에 도시됨), 상기 복수의 올리고뉴클레오티드는 제1 및 제2 프로브로 어닐링하기 전에 사전-어닐링될 수 있거나, 또는 모든 어닐링 단계는 한 번에 수행될 수 있다.
바람직하게는 각 결찰 복합체는 제1 표적 특이적 서열, 제2 표적 특이적 서열 및 하나 이상의 바코드 서열의 조합에 대해 고유하다. 이는 증폭 및 결과의 분석 후에 표적 서열의 계수를 가능하게 한다.
그 후, 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열을 복수의 결찰 복합체와 접촉시킨다 (단계 (iii)). 각각의 제1 프로브 및 제2 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분은 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되어, 이에 의해 혼성화 복합체를 형성한다 (단계 (iv)). 일부 구체예에서, 상기 샘플은 100 마이크로리터 (microliters) 초과, 예컨대 1 ml 초과의 부피를 갖는다. 추가의 일 구체예에서, 상기 샘플은 5 pmol 이하, 예컨대 1 pmol 이하, 예를 들어 200 fmol 이하의 핵산 농도를 갖는다.
후속하여, 상기 혼성화 복합체(들)는 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 제1 포획 모이어티 및 제2 포획 모이어티는 혼성화 복합체(들)가 상기 고체 지지체(들)에 연결되도록 상호작용되도록 한다 (단계 (v)). 그 후에, 상기 고체-지지체-연결된 혼성화 복합체는 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리된다 (단계 (vi)). 상기 고체 지지체가 자기 비드인 경우, 상기 비드는 자석을 사용하여 비드를 고정화될 수 있고, 나머지 액체 샘플을 제거할 수 있다. 선택적으로, 세척 단계는 단계 (vii)로 진행하기 전에 수행된다.
단계 (v) 및 (vi)는 핵산에 대한 정제 및 농축을 유도하여, 특히 고도로 불순한 샘플에 대해 결과를 향상시킨다. 일 구체예에서, 본 발명의 방법은 단계 (vi) 이전에 핵산을 농축하는 단계를 포함하지 않는다. 따라서, 일 구체예에서, 상기 방법은 단계 (vi) 이전에 원래 샘플내 핵산이 2배 초과, 10배 초과 또는 100배 초과로 농축되는 단계를 포함하지 않는다. 다른 구체예에서, 본 발명의 방법은 단계 (vii)에서 결찰에 후속하는 정제 단계를 포함하지 않는다.
후속하여, 형성된 혼성화 복합체에서 프로브들의 결찰은 결찰된 결찰 복합체를 제공하기 위해 효소적으로 또는 화학적으로 수행된다 (단계 (vii)). 선택적으로, 단계 (vii)의 일부로서, 제1 프로브 및 제2 프로브 사이에 갭이 존재하는 경우, 폴리머라제 및 하나 이상의 뉴클레오티드를 도입함으로써 필링 (filling)될 수 있다. 상기 폴리머라제는 (a) 범용 브릿지 올리고 서열 또는 브릿지 올리고 복합체에 상보적이고 및/또는 (b) 바코드 서열에 상보적인 뉴클레오티드를 부가하고, 이에 의해 상기 제1 프로브 및 제2 프로브 사이의 2개의 갭을 필링하여 좌측 및 우측 프로브를 결찰시키고, 범용 서열 및/또는 제3 바코드 서열을 브릿지 상보적 가닥으로 포함시킨다. 상기 브릿지 올리고는 상기 제1 프로브 또는 제2 프로브에 존재하는 표적 서열 식별인자 서열이 상기 브릿지 올리고로 통합되도록 상기 결찰된 프로브에 상보적인 5' 부위 또는 3' 부위로부터 연장된다. 바람직하게는, 이중가닥 DNA를 분해하지 않는 폴리머라제, 가령 예를 들어 Taq 폴리머라제가 사용되어, 제1 프로브 및 제2 프로브가 표적 서열에 어닐링되는 경우에 상기 제1 프로브가 제2 프로브로 결찰되는 것을 방해하지 않는다.
그 다음에 상기 결찰된 결찰 복합체는 하나 이상의 표적 샘플들로부터 풀링된다 (단계 (viii)). 단계 (vii) 및 (viii)는 명시된 순서로 또는 대안으로서 역순서로 수행될 수 있다.
다음, 핵산은 하나 이상의 결찰된 결찰 복합체로부터 증폭된다 (단계 (ix)).
일 구체예에서, 단계 (ix)에서의 증폭 단계는 제1 및 제2 프로브의 범용 부분에 결합하는 프라이머를 사용하여 PCR에 의해 수행된다.
다른 구체예에서, 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 엔도뉴클레아제에 대한 인식 서열을 포함하고, 단계 (ix)는 하기 단계에 의해 수행된다:
(a) 가닥-치환 폴리머라제 (strand-displacing polymerase)로 롤링 서클 증폭 (rolling circle amplification)을 사용하여 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계,
(b) 선택적으로, 수득된 증폭된 하나 이상의 단일-가닥 연쇄체 서열 (concatemeric sequence)을 상기 인식 서열을 함유하는 특정 올리고뉴클레오티드와 어닐링하는 단계로서, 상기 특정 올리고뉴클레오티드는 인식 서열로 어닐링하여 상기 엔도뉴클레아제에 대한 인식 부위가 수득되는 것인 단계, 및
(c) 선택적으로, 수득된 단일-가닥 연쇄체 서열 또는 수득된 어닐링된 복합체를 상기 엔도뉴클레아제로 절단하는 단계. 적합한 가닥-치환 폴리머라제는 phi29 폴리머라제 또는 Bst 폴리머라제를 포함한다. 상기 인식 서열을 함유하는 특정 올리고뉴클레오티드는 절단에 안정한 이중-나선을 형성하도록 하기 위해 전형적으로 상기 인식 서열 주위에 일부 추가의 특정 서열을 함유할 것이다.
일부 구체예에서, 절단이 수행되지 않고, 후속하는 고처리량 시퀀싱 단계 (x)가 연쇄체 서열에 대해 수행된다.
다른 구체예에서, 단계 (ix)에서의 증폭은 상기 결찰된 결찰 복합체의 올리고 서열 상의 이중가닥 T7 RNA 폴리머라제 프로모터 부위에 결합하고 RNA를 다운스트림으로 전사하는 T7 RNA 폴리머라제를 사용하여 수행된다. 하나 이상의 결찰된 결찰 복합체로부터 합성된 RNA의 증폭은 예를 들어 에멀젼 역전사효소 (RT)-PCR 또는 T7 RNA 폴리머라제를 사용하여 수행될 수 있다. 유리 샘플 (Free sample) 및 프로브 핵산 제거는 T7 RNA 폴리머라제에 의한 RNA 합성 후에, 그러나 cDNA 합성 또는 RT-PCR 이전에, 풀링된 증폭 반응에 DNA-특이적 엑소뉴클레아제 및 엔도뉴클레아제를 부가하여 수행될 수 있다. 일 구체예에서, 상기 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 어느 하나는 우라실-특이적 절제 시약 (USER)을 사용한 절단에 의한 선형화되는 데옥시우리딘 모이어티를 함유한다. 이를 통해 브릿지 올리고 또는 브릿지 올리고 복합체 또는 제1 또는 제2 프로브에 내장된 T7 RNA 폴리머라제 프로모터로부터 RNA 합성을 개시하는 T7 RNA 폴리머라제를 사용하여 선형화된 결찰된 결찰 복합체로부터 RNA를 전사할 수 있다. 상기 T7 RNA 폴리머라제 프로모터 서열 및 데옥시우리딘 모이어티는 상기 T7 RNA 폴리머라제가 다른 샘플에서 상이한 표적의 계수에 필요한 모든 정보를 전사할 수 있도록 위치되어야 한다. T7 RNA 폴리머라제 및 데옥시우리딘 모이어티 사이에, 하기 서열이 발생해야 한다: 표적을 식별할 수 있는 적어도 하나의 서열, 샘플을 식별할 수 있는 적어도 하나의 서열 및 샘플내 표적 서열의 카피 수를 결정할 수 있는 적어도 하나의 고유 바코드 서열. 선택적으로, 상기 cDNA는 범용 부위에 역-상보적인 DNA-올리고뉴클레오티드 분자를 사용하여 RNA 분자로부터 제조된다. 상기 RNA 분자는 선택적으로 cDNA로 전환되고, 선택적으로 프로브의 범용 부분에 결합하는 프라이머를 사용하여 PCR 또는 에멀젼 PCR에 의해 증폭된다. 대안으로서, RT-PCR 또는 에멀젼 RT-PCR을 사용할 수 있다.
선택적으로, 증폭 후에, 상기 고체 지지체를 제거하고, 상등액을 후속 처리에 사용한다. 예를 들어, 상기 고체 지지체가 자기 입자인 경우, 자석을 사용하여 제거할 수 있다.
본 발명의 방법의 다른 구체예에서, 상기 제1 포획 모이어티 및 제2 포획 모이어티 사이의 상호작용은 단계 (vi) 직후, 단계 (vii) 이후, 또는 단계 (viii) 이후에 중단된다. 예를 들어, 상기 제1 포획 모이어티가 바이오틴이고, 제2 포획 모이어티가 스트렙타비딘인 경우, 과량의 가용성 바이오틴을 부가하여 상호작용을 중단시킬 수 있다. 상기 스트렙타비딘이 자기 입자에 결합된 경우, 이는 이후에 자석을 사용하여 제거할 수 있다.
단계 (ix)의 증폭 방법에 관계없이, 일부 구체예에서, 상기 뉴클레오티드 분자 (RNA 분자, DNA 분자 또는 cDNA 분자)는 제1 프라이머 및 제2 프라이머로 (추가로) 증폭되어 증폭 산물을 제공한다. 바람직하게는 결찰된 복합체에 존재하는 제1 또는 제2 범용 서열에 역상보적인 범용 제1 프라이머 및 범용 제2 프라이머가 사용된다.
복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수의 확인은 제1 및/또는 제2 표적 특이적 부분의 적어도 일부, 제1 및/또는 제2 바코드의 적어도 일부, 및/또는 제3 바코드의 적어도 일부를 고처리량 시퀀싱 기술 (단계 (x) 및 (xi))에 의해, 예를 들어 Illumina iSeq, MiSeq, HiSeq, NextSeq 또는 NovaSeq를 포함하지만 이에 한정되지 않는 차세대 시퀀싱 플랫폼을 사용하여 결정함으로써 수행될 수 있다. 바람직하게는, 상기 유전자 표적 계수는 표적당 (per target) 및 샘플당 (per sample) 분자 바코드의 수를 계수함으로써 허용된다. 상기 샘플은 서열 데이터로부터 분리 (de-convoluted)되고, 상기 서열 표적은 DNA 시퀀싱 후에 in silico 정량분석되었다.
상기 기재된 바와 같이, 제2 주요 양상에서, 본 발명은 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함하고:
(i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
Figure pat00003
단일 프로브로서, 그 분자의 5' 말단으로부터 시작하여, 제1 표적 특이적 부분, 바코드를 포함하는 스페이서 부분, 및 제2 프로브의 3' 말단에 제2 표적 특이적 부분을 포함하는 단일 프로브, 및
Figure pat00004
브릿지 올리고로서, 그 브릿지 올리고는 상기 단일 프로브의 스페이서 부분 또는 스페이서 부분의 일부에 상보적인 서열을 함유하는 브릿지 올리고를 제공하는 단계로서,
상기 단일 프로브 또는 상기 브릿지 올리고는 제1 포획 모이어티를 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 단일 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고와 접촉시키고, 자가-어닐링하는 단계;
(iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 복수의 샘플 내에 존재하는 핵산을 상기 단일 프로브와 접촉시키고, 상기 브릿지 올리고에 어닐링하는 단계;
(iv) 상기 단일 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체가 형성되도록 하는 단계;
(v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
(vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
(vii) 상기 단일 프로브의 5' 말단 및 3' 말단을 결찰하여 결찰된 결찰 복합체를 제공하는 단계;
(viii) 선택적으로, 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링하는 단계;
(ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
(x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술에 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계;
여기서 상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있다.
본 발명의 제1 양상에 대한 전술한 구체예는 본 발명의 이러한 제2 양상에 준용된다.
일 구체예에서, 상기 단일 프로브는 화학적으로 연결된 2개 이상의 올리고뉴클레오티드를 포함한다.
일 구체예에서, 상기 스페이서 부분은 25개 초과의 염기, 예컨대 50개 초과의 염기, 예를 들어 75개 초과 또는 100개 초과의 염기, 예를 들어 20 내지 1000개의 염기, 예컨대 50 내지 1000개의 염기를 포함한다.
본 발명의 양상들 모두의 이점은 전통적인 핵산 시퀀싱 기술과 비교하여, 저비용, 고단순성, 고특이성, 고민감도, 고정확도, 고처리량, 고확장성 및 고전환율을 갖는 정량 분석을 포함하지만 이에 한정되지 않는다. 본 발명의 다른 양상은 본 발명의 방법이 인간 및 동물 집단을 포함하고 대량의 비-정제된 샘플 물질을 포함하는 다수의 샘플에서 복수의 핵산 표적의 정확한 대규모 병렬 정량분석을 가능하게 한다는 점이다. 언급된 바와 같이, 바람직한 일 구체예에서, 소변 샘플과 같은 샘플은 핵산의 사전 정제 또는 농축 없이 사용된다. 다른 구체예에서, 상기 샘플은 예를 들어 핵산을 노출시키기 위해 세포를 용해시키는 사전-처리될 수 있다. 본 발명의 1가지 특정한 이점은 독특한 프로브 디자인, 즉 프로브 삼중항을 사용하여 관심 표적 서열의 검출 및 증폭을 가능하게 하는 것이다. 상기 프로브는 어닐링 및 결합 효율을 향상시키는 변형된 뉴클레오티드가 특별히 위치하도록 디자인되었다. 결합 특성의 개선은 더 높은 분석 특이성, 민감도 및 정확도로 이어진다. 본 발명의 방법은 마찬가지로 유전자 변이체를 연구하는데 적용 가능하며, 진단 및 예후에서의 적용을 발견하였고, 이는 하나 이상의 서열 및/또는 다형 예컨대 SNPs 및/또는 indels, 암 진단 또는 모체 혈액으로부터 태아 염색체 장애에 대해 샘플(들)의 유전자형 분석을 포함하지만 이에 한정되지 않는다. 바람직한 일 구체예에서, 2개 이상의 샘플 또는 2개 이상의 유전자좌/대립유전자 조합의 경우, 바코드 서열은 하나 이상의 서열 및/또는 다형 예컨대 SNPs 및/또는 indels에 대해 샘플의 유전자형을 분석하는데 사용된다.
다른 양상에서, 본 발명은 본 발명의 방법에 사용하기 위한 키트를 제공한다. 일 구체예에서, 부재들의 키트 (kit of parts)는 복수의 용기를 포함하고, 상기 적어도 하나의 용기는 제1 프로브 및 제2 프로브의 하나 이상의 세트를 포함하고, 적어도 하나의 용기는 하나 이상의 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 포함하며,
상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
상기 브릿지 올리고 또는 브릿지 올리고 복합체는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 포함하고;
상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 각각에 존재하며;
상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 제1 포획 모이어티를 포함하고, 이는 고체 지지체에 연결된 제2 포획 모이어티에 연결될 수 있다.
바람직하게는, 제1 프로브의 3' 말단 또는 제2 프로브의 5' 말단, 또는 이들 모두는 제1 프로브의 제2 프로브에 대한 화학적 결찰을 허용하도록 변형된다.
바람직하게는, 상기 브릿지 올리고 또는 브릿지 올리고 복합체는 제1 프로브의 서열에 상보적인 서열 또는 제2 프로브의 서열에 상보적인 서열, 또는 이들 모두에 하나 이상의 화학적으로 변형된 뉴클레오티드를 포함한다.
선택적으로, 제1 프로브, 제2 프로브, 또는 브릿지 올리고 또는 브릿지 올리고 복합체는 우라실-특이적 절제 시약을 사용한 절단에 의한 선형화되는 데옥시우리딘 모이어티를 포함한다.
바람직하게는, 제1 프로브의 3' 말단 또는 제2 프로브의 5' 말단, 또는 이들 모두는 제1 프로브의 제2 프로브에 대한 화학적 결찰을 허용하도록 변형된다.
바람직하게는, 제1 프로브 또는 제2 프로브, 또는 이들 모두의 가교 부분은 브릿지 올리고 또는 브릿지 올리고 복합체에 대한 결합을 향상시키도록 화학적으로 변형된 염기(들)를 포함한다.
특정한 일 구체예에서, 제1 및 제2 프로브의 세트를 포함하는 적어도 하나의 용기, 및 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 포함하는 적어도 하나의 용기는 하나의 동일한 용기이다. 이러한 경우에, 3개 이상의 프로브가 사전-어닐링되어 결찰된 복합체를 형성할 수 있다.
본 발명의 한가지 특정한 이점은 독특한 프로브 디자인, 즉 프로브 삼중항을 사용하여 관심 표적 서열의 검출 및 증폭을 가능하게 하는 것이다. 결합 특성이 향상된 프로브를 디자인하여 더 높은 분석 특이성, 민감도 및 정확도를 유도한다. 본 발명은 분자 생물학, 진화 생물학, 메타유전체학, 유전자형 분석 분야에의 적용, 보다 구체적으로 하나 이상의 서열 및/또는 다형 예컨대 SNPs 및/또는 indels에 대해 샘플(들)의 유전자형을 분석하는 것을 포함하지만 이에 한정되지 않는, 암 진단 또는 태아 염색체 장애에 한정되지 않는 적용을 발견하였다.
특정한 바람직한 일 구체예에서, 상기 브릿지 올리고 또는 브릿지 올리고 복합체는 샘플을 식별하기 위한 정보를 포함하고, 고유 식별인자를 포함한다. 이러한 경우에, 상기 제1 및 제2 프로브는 모든 샘플에 범용으로 적용 가능하다 (표적을 식별하기 위한 정보만을 포함한다). 그러므로, 바람직한 일 구체예에서, 상기 브릿지 올리고 또는 브릿지 올리고 복합체가 각 샘플의 표적 서열의 계수를 가능하게 하는 고유한 서열을 포함하는 바코드를 포함하는, 본 발명에 따른 방법 또는 키트가 제공된다.
추가의 일 양상에서, 본 발명은 복수의 용기를 포함하는 부재들의 키트에 관한 것으로서, 적어도 하나의 용기는 하나 이상의 단일 프로브를 포함하고, 적어도 하나의 용기는 하나 이상의 브릿지 올리고를 포함하며,
상기 단일 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 표적 특이적 부분, 바코드를 포함하는 스페이서 부분, 및 제2 프로브의 3' 말단에 제2 표적 특이적 부분을 포함하고,
상기 브릿지 올리고는 상기 단일 프로브의 스페이서 부분 또는 스페이서 부분의 일부에 상보적인 서열을 함유하며;
상기 단일 프로브 또는 상기 브릿지 올리고는 제1 포획 모이어티를 포함하고, 이는 고체 지지체에 연결된 제2 포획 모이어티에 연결될 수 있다.
또한, 본 발명은 하기에 관한 것이다:
구체예 1: 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법으로서, 상기 방법은:
(i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
제1 프로브, 제2 프로브, 및 브릿지 올리고를 제공하는 단계로서,
상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
상기 브릿지 올리고는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 브릿지 올리고-특이적 서열 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 함유하고;
상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 각각에 존재하고; 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 중 적어도 하나는 제1 포획 모이어티를 포함하는 것인 단계;
(ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 제2 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고와 접촉시키고, 자가-어닐링으로 복수의 결찰 복합체가 형성되도록 하는 단계;
(iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 각 샘플 내에 존재하는 핵산을 상기 결찰 복합체와 접촉시키는 단계;
(iv) 각각의 제1 프로브 및 제2 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체가 형성되도록 하는 단계;
(v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
(vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
(vii) 상기 혼성화 복합체에서 프로브들을 결찰하여 결찰된 결찰 복합체를 제공하는 단계;
(viii) 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링하는 단계;
(ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
(x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술에 적용하여 바코드 서열(들)을 결정하는 단계; 및
(xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계를 포함하고,
상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있는 것인 방법.
구체예 2: 구체예 1에 있어서, 상기 복수의 샘플은 혈액 샘플, 타액 샘플, 소변 샘플 또는 대변 샘플을 포함하는 것인 방법.
구체예 3: 구체예 1 또는 2에 있어서, 상기 제1 포획 모이어티는 바이오틴 모이어티이고, 상기 제2 포획 모이어티는 스트렙타비딘 모이어티 또는 아비딘 모이어티인 것인 방법.
구체예 4: 구체예 1 내지 3 중 어느 하나에 있어서, 세척 단계는 단계 (vi) 및 (vii) 사이에 수행되는 것인 방법.
구체예 5: 구체예 1 내지 4 중 어느 하나에 있어서, 상기 시퀀싱은 차세대 DNA 또는 RNA 시퀀싱에 의해 수행되는 것인 방법.
구체예 6: 구체예 1 내지 5 중 어느 하나에 있어서, 상기 제1 프로브의 3' 말단 또는 상기 제2 프로브의 5' 말단, 또는 이들 모두는 상기 제1 프로브가 상기 제2 프로브에 화학적 결찰되도록 변형되는 것인 방법.
구체예 7: 구체예 1 내지 6 중 어느 하나에 있어서, 상기 제1 프로브 또는 상기 제2 프로브, 또는 이들 모두의 가교 부분은 상기 브릿지 올리고에 대한 결합이 개선되도록 하는 화학적으로 변형된 염기를 포함하는 것인 방법.
구체예 8: 구체예 1 내지 7 중 어느 하나에 있어서, 상기 제1 표적 특이적 부분, 제2 표적 특이적 부분, 제1 브릿지 올리고-특이적 서열, 및/또는 제2 브릿지 올리고-특이적 서열은 서로 독립적으로, 하나 이상의 화학적으로 변형된 뉴클레오티드를 함유하는 것인 방법.
구체예 9: 구체예 1 내지 8 중 어느 하나에 있어서, T7 RNA 폴리머라제에 대한 프로모터 서열이 상기 제1 프로브, 제2 프로브 또는 브릿지 올리고에 존재하고, 상기 단계 (ix)에서의 증폭 단계는 상기 결찰된 결찰 복합체내에 내장된 T7 RNA 폴리머라제 프로모터로부터 RNA 합성을 개시하는 T7 RNA 폴리머라제를 사용하여 하나 이상의 결찰된 결찰 복합체로부터의 RNA 합성을 포함하는 것인 방법.
구체예 10: 구체예 9에 있어서, 상기 제1 프로브, 제2 프로브, 또는 브릿지 올리고는 우라실-특이적 절제 시약을 사용한 절단에 의해 선형화되는 데옥시우리딘 모이어티를 포함하는 것인 방법.
구체예 11: 구체예 9에 있어서, 상기 단계 (x) 이전에, 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고에 존재하는 범용 부위에 역-상보적인 DNA-올리고뉴클레오티드 분자를 사용하여 RNA 분자로부터 cDNA를 제조하는 것인 방법.
구체예 12: 구체예 1 내지 8 중 어느 하나에 있어서, 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 중 적어도 하나는 엔도뉴클레아제에 대한 인식 서열을 포함하고, 여기서 (a) 단계 (ix)에서 하나 이상의 결찰된 결찰 복합체로부터 핵산의 증폭은 가닥-치환 폴리머라제로 롤링 서클 증폭을 사용하여 수행하는 단계, 이어서 (b) 선택적으로, 수득된 증폭된 하나 이상의 단일-가닥 연쇄체 서열을 상기 인식 서열을 함유하는 특정 올리고뉴클레오티드와 어닐링하는 단계로서, 상기 특정 올리고뉴클레오티드는 인식 서열로 어닐링하여 상기 엔도뉴클레아제에 대한 인식 부위가 수득되는 것인 단계, 및 (c) 수득된 증폭된 하나 이상의 단일-가닥 연쇄체 서열 또는 수득된 어닐링된 복합체를 상기 엔도뉴클레아제로 절단하는 단계를 포함하는 것인 방법.
구체예 13: 구체예 1 내지 8 중 어느 하나에 있어서, 상기 단계 (ix)의 증폭 단계는 상기 제1 및 제2 프로브의 범용 부분에 결합하는 프라이머를 사용하여 PCR에 의해 수행되는 것인 방법.
구체예 14: 구체예 1 내지 13 중 어느 하나에 있어서, 유전자 표적 계수는 표적당 및 샘플당 분자 바코드의 수를 계수함으로써 허용되는 것인 방법.
구체예 15: 구체예 9 내지 14 중 어느 하나에 있어서, 상기 뉴클레오티드 분자는 제1 프라이머 및 제2 프라이머로 증폭되어 증폭 산물을 제공하는 것인 방법.
구체예 16: 복수의 용기를 포함하는 부재들의 키트로서, 상기 적어도 하나의 용기는 제1 프로브 및 제2 프로브의 하나 이상의 세트를 포함하고, 적어도 하나의 용기는 하나 이상의 브릿지 올리고를 포함하며,
상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
상기 브릿지 올리고는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 포함하고;
상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 각각에 존재하며;
상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 중 적어도 하나는 제1 포획 모이어티를 포함하고, 이는 고체 지지체에 연결된 제2 포획 모이어티에 연결될 수 있는 것인 키트.
실시예
방법
일례에서 출발 물질은 5 ml의 소변이었다. 상기 방법은 샘플을 +95℃로 15분 동안 가열하여 샘플 물질 중 단백질을 변성시킴으로써 개시되었다. 그 후, 상기 샘플 물질을 18,000 xg로 10분 동안 원심분리하여 침전된 단백질 및 기타 데브리스를 제거하고, 후속 단계를 위해 상등액을 수집하였다.
하기를 포함하는, 3부분의 프로브 복합체가 형성되도록 하였다 (도 2에 도시된 바와 같음):
(a) 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 갖는 제1 프로브;
(b) 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 갖는 제2 프로브; 및
(c) 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 브릿지 올리고-특이적 서열 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 5' 바이오틴을 갖는 브릿지 올리고.
상기 3부분의 프로브 복합체를 펨토몰 (femtomolar) 농도로 샘플 상등액에 부가하고 어닐링하였다 (도 1의 단계 1에 도시됨).
그 후 Dynabeads MyOne 스트렙타비딘 C1 자기 입자 (Dynabeads MyOne Streptavidin C1 magnetic particles)를 반응에 부가하고, 실온에서 1시간 동안 인큐베이션하여 바이오틴 및 스트렙타비딘이 상호작용하여 혼성화 복합체가 상기 입자에 연결되도록 하였다. 그 후에, 상기 입자를 자석을 사용하여 수집하고, 상기 입자를 Tween 20-함유 TE 버퍼를 사용하여 세척하여, 샘플 불순물을 제거하였다.
세척 단계 이후에, 비드-결합된 프로브 복합체를 연장되고 (갭 필링) (도 2b), DreamTaq DNA 폴리머라제 및 Ampligase DNA 리가제의 조합을 부가하고 +45℃에서 1시간 동안 인큐베이션하여 결찰하였다. 생성된 연장 및 결찰된 생성물은 좌측 프로브의 우라실 모이어티를 표적으로 하는, 우라실-특이적 효소 믹스를 부가하여 절단하였다 (New England Biolabs, 제조자 지침에 따라 사용함).
연장, 결찰 및 절단 후에, 상기 비드-결합된 분자들을 T7 반응 버퍼로 세척하였고, T7 RNA 폴리머라제 및 RiboLock RNase 억제제의 조합을 부가하고 +37℃에서 1시간 동안 인큐베이션하여 RNA 합성을 수행하였다. 그 후에 자기 입자는 자석을 사용하여 제거하고, 상등액을 후속 처리를 위해 보관하였다.
상기 상등액의 RNA는 상보적 올리고뉴클레오티드를 부가하고 +75℃에서 5분 동안 인큐베이션함으로써 cDNA 합성을 위해 프라이밍하였다. 그 후에 RiboLock RNase 억제제 및 M-MLV 역전사효소를 상기 반응에 부가하고, +37℃에서 1시간 동안 인큐베이션하였다.
그 후에 인덱스 PCR 프라이머를 사용하고 Phusion Hot Start II DNA 폴리머라제에 의한 PCR 증폭을 사용하여 cDNA를 Illumina-호환 DNA 시퀀싱 라이브러리로 준비하였다.
마지막으로, 상기 라이브러리는 Illumina MiSeq 또는 iSeq를 사용하여 시퀀싱되었고, 시퀀싱 데이터는 Unix command line tools 및 Python 및 R 프로그래밍 언어의 조합을 사용하여 처리되었다. 간략하게, 서열 처리의 근거는 각 리드 (read) 내에서 프로브 서열을 식별하고, 이들 사이의 게놈 영역을 시퀀싱하고, 각 유전자 표적과 회합된 분자 바코드의 수를 계수하는 것이었다.
실험
제1 실험에서, AKT1, CD74-ROS1, CHEK2, EGFR, EML4-ALK, KRAS, PIK3CA 및 TP53과 같은 유전자의 전형적인 종양원성 돌연변이와 유사한 합성 올리고뉴클레오티드의 femtomolar 농도로 소변 샘플을 스파이크하였다. 이러한 유전자들을 표적으로 하는 바이오틴-함유 3부분의 프로브를 부가하였다. 상기 제1, 제2 및 브릿지 프로브의 길이는 각각 61, 85 및 50 nt이었다.
상기 스파이크된 샘플을 상기 기재된 방법에 따라 처리하였다. 생성물을 겔 전기영동으로 분석하였다. 전형적인 결과의 예는 도 3에 개시되어 있다.
표적 유전자는 각 리드 내에서 프로브 서열들을 일치시키고, 프로브 서열들 사이의 게놈 서열 영역을 식별하고, 분자 바코드를 계수함으로써, 서열 데이터 내에서 검출되었다. 상기 계수 데이터는 스파이크-인된 (spiked-in) 주형 분자의 수를 정확하게 반영하였고, 응답은 4차수에 걸쳐 선형이었다 (도 4). 검출된 신호는 표적 분자의 존재/부재에 대해 매우 특이적이었다 (도 5).
다른 예에서, 출발 물질은 1 ml의 타액이었다. 분석을 수행하기 전에 샘플을 끓이고 원심분리한 것을 제외하고는, 유사한 방법으로 수행하였다. 또한 이러한 샘플들에 대해, 검출된 신호는 표적 분자의 존재/부재에 대해 매우 특이적이었다.
도 1 및 2의 상세한 설명
도 1은 T7 RNA 폴리머라제가 증폭을 위해 사용되는, 개시된 발명의 일 구체예의 워크플로우를 예시한다. 기재된 바와 같이, 대체 증폭 방법이 또한 가능하다. 단계 1에서, 샘플 (102)내 핵산 (DNA 또는 RNA)을 결찰 복합체 세트 (104)와 접촉하게 한다. 상기 결찰 복합체는 표적 핵산 (106)에 어닐링된다. 단계 2에서, 상기 표적-결합된 결찰 복합체는 샘플 물질로부터 포획되어, 샘플 불순물 (103)을 남겼다. 단계 3에서, 상기 어닐링된 결찰 복합체들이 결찰되어, 결찰된 결찰 복합체를 생성한다. 단계 4에서, 다수의 샘플 (110)로부터의 결찰된 결찰 복합체가 함께 풀링된다 (112). 단계 5에서, T7 RNA 폴리머라제를 사용하여 상기 결찰된 결찰 복합체로부터 RNA를 합성하였다. 프로브 및 샘플 DNA는 선택적으로 엔도- 및 엑소뉴클레아제의 혼합물을 사용하여 제거된다. 상기 증폭된 RNA는 cDNA (116)로 전환되고, 선택적으로 PCR 또는 에멀젼 PCR을 사용하여 증폭된다. 단계 6에서, 상기 증폭된 DNA는 차세대 DNA 시퀀싱을 사용하여 시퀀싱된다. 단계 7에서, 상기 DNA 시퀀싱 결과는 생물정보학 파이프라인을 사용하여 표적 계수로 전환된다.
도 2a는 본원의 일 구체예에 따른 복수의 프로브 엔티티를 갖는 프로브 삼중항의 원리 구조를 도시하였다. 상기 복수의 프로브 엔티티는 샘플 어닐링 전에 조립된 좌측 프로브, 우측 프로브 및 브릿지 올리고를 포함한다. 상기 좌측 프로브의 제1 염기는 선택적으로 변형 1 (202)로 언급되는 인접한 프로브의 5' 말단에 화학적 결찰을 허용하는 변형 또는 효소 결찰을 위한 포스페이트 모이어티를 포함한다. 상기 좌측 프로브의 15-25개의 염기는 브릿지 결합 서열 1 (204)을 포함하며, 이는 브릿지 부위 1로 언급되는 효과적인 브릿지 올리고 결합을 위해 화학적으로 변형된 염기를 추가로 포함할 수 있다. 상기 언급된 세그먼트는 또한 선택적으로 상기 T7 RNA 폴리머라제 프로모터의 역상보적 서열을 포함한다. 이전에 언급한 바와 같이, 이러한 프로모터 서열은 상기 브릿지 올리고내에 존재하는 대신에 상기 제1 프로브 또는 제2 프로브내에 존재할 수 있으며, 단 상기 올리고 및 프로브들은 상기 T7 RNA 폴리머라제가 상이한 샘플내 표적 서열의 계수에 대한 모든 필요한 정보를 전사할 수 있도록 디자인되었다. 상기 좌측 프로브의 다음 15-30개의 염기는 선택적으로 본원에서 범용 부위 1 (206)로 언급되는 PCR 프라이머에 대한 범용 결합 부위를 포함한다. 상기 좌측 프로브는 선택적으로 바코드 1 (208)로 언급되는, 분자-특이적 바코드 또는 샘플-특이적 바코드를 형성하는 무작위 뉴클레오티드의 세그먼트를 포함하는, 5' 말단으로부터 다음 10-20개의 염기를 추가로 포함한다. 상기 좌측 프로브는 5' 말단으로부터 다음 15-30개의 염기를 추가로 포함하고, 유전자 표적 (210)에 결합한다. 204 또는 210의 뉴클레오티드들 중 일부 또는 전부는 표적 또는 브릿지 올리고 (226)에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다. 상기 좌측 프로브의 마지막 염기는 선택적으로 변형 1 (210)로 언급되는 인접한 프로브의 5' 말단에 화학적 결찰을 허용하는 변형 또는 효소적 결찰을 위한 포스페이트 모이어티를 포함한다.
상기 우측 프로브의 제1 염기는 선택적으로 변형 2 (214)로 언급되는 인접한 프로브의 5' 말단에 화학적 결찰을 허용하는 변형 또는 효소 결찰을 위한 포스페이트 모이어티를 포함한다. 상기 우측 프로브의 5' 말단으로부터 15-30개의 염기는 유전자 표적 (216)에 결합하는 우측 프로브의 일부를 포함한다. 상기 우측 프로브의 5' 말단으로부터 다음 10-20개의 염기는 선택적으로 바코드 2 (218)로 언급되는 분자-특이적 바코드 또는 샘플-특이적 바코드를 형성하는 무작위 뉴클레오티드의 세그먼트를 포함한다. 상기 우측 프로브의 5' 말단으로부터 다음 15-30개의 염기는 선택적으로 범용 부위 2 (220)로 언급되는 PCR 프라이머에 대한 범용 결합 부위를 포함한다. 상기 우측 프로브의 마지막 15-25개의 염기는 브릿지 서열 2 (222)로 언급되는 효과적인 브릿지 올리고 결합을 위한 서열을 포함한다. 상기 언급된 세그먼트는 또한 선택적으로 T7 RNA 폴리머라제 프로모터의 역상보적 서열을 포함한다. 이전에 언급한 바와 같이, 이러한 프로모터 서열은 상기 브릿지 올리고내에 존재하는 대신에 상기 제1 프로브 또는 제2 프로브내에 존재할 수 있으며, 단 상기 올리고 및 프로브들은 상기 T7 RNA 폴리머라제가 상이한 샘플내 표적 서열의 계수에 대한 모든 필요한 정보를 전사할 수 있도록 디자인되었다. 216 또는 222의 뉴클레오티드들 중 일부 또는 전부는 표적 또는 브릿지 올리고 (224)에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다. 상기 우측 프로브의 마지막 염기는 선택적으로 변형 2로 언급되는 인접한 프로브의 5' 말단에 화학적 결찰을 허용하는 변형 또는 효소적 결찰을 위한 포스페이트 모이어티를 포함한다.
상기 브릿지 올리고의 5' 말단으로부터 처음 15-25개의 염기는 브릿지 서열 3 (226)으로 언급되고, 우측 프로브 (204)의 브릿지 서열 1에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 상기 브릿지의 다음 15-25개의 염기는 브릿지 서열 4 (224)로 언급되고, 좌측 프로브 (222)의 브릿지 서열 2 서열에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 브릿지 서열 3 (226) 또는 브릿지 서열 4 (224)는 선택적으로 T7 RNA 폴리머라제 프로모터의 서열을 포함한다. 상기 브릿지 올리고의 5' 말단은 결찰 복합체를 포획하는데 사용되는 제1 포획 모이어티 (228)를 포함한다.
도 2b는 본원의 일 구체예에 따른 제1 프로브 및 제2 프로브 사이의 갭 필링을 도시한다. 본원에서, 상기 브릿지 올리고는 브릿지 서열 3 (226) 및 브릿지 서열 4 (224) 사이에 갭 서열 1 (230)을 함유한다. 상기 갭 서열 (230)은 선택적으로 T7 RNA 폴리머라제 프로모터의 서열을 포함할 수 있다. 상기 좌측 프로브 및 우측 프로브 사이의 갭은 폴리머라제 및 하나 이상의 뉴클레오티드를 도입하여 필링된다. 이러한 과정을 위해, Stoffel 단편, Taq 폴리머라제 또는 Phusion 폴리머라제를 사용할 수 있다. 상기 폴리머라제는 (a) 범용 브릿지 올리고 서열에 상보적이고 (b) 표적 서열에 상보적인 뉴클레오티드를 부가하고, 이에 의해 제1 프로브 및 제2 프로브 사이의 2개의 갭 즉 갭 1 및 갭 2에 필링되어, 상기 브릿지 올리고에 상보적인 좌측 프로브 및 우측 프로브의 결찰을 유도하였다. 이러한 방식으로, 바코드가 위치 230의 브릿지 올리고에 존재하는 경우, 이는 상보적 서열에 통합된다. 선택적으로, 상기 브릿지 올리고 프로브 (224)는 상기 결찰된 프로브에 상보적인 5' 부위 또는 3' 부위로부터 연장되어, 프로브 1 또는 프로브 2에 존재하는 바코드 (존재하는 경우), 및/또는 표적 서열 (210 및 216)이 상기 브릿지 올리고로 통합되고, 이에 의해 결찰된 결찰 복합체를 형성하였다. 그러나 폴리머라제 작용이 표적 서열 부위에서 프로브의 결찰을 방해하지 않도록 주의해야 한다. 예를 들어, 표적 서열에 혼성화되는 제1 프로브 및 제2 프로브의 부분에 존재하는 이중가닥 DNA 부분에 도달할 때 이의 작용을 정지시키는 폴리머라제를 사용하는 것이 가능하다. T7 RNA 폴리머라제 프로모터 서열은 브릿지 올리고의 위치 226, 230 또는 224에 있는 결찰 복합체에 내장될 수 있다. 상기 데옥시우리딘 모이어티는 위치 204 및 206 사이, 또는 좌측 프로브의 206 내에 내장될 수 있다.
도 2c는 본원의 일 구체예에 따른 복수의 프로브 엔티티를 갖는 프로브 오중항 (probe quintet)의 원리 구조를 도시하였다. 상기 복수의 프로브 엔티티는 좌측 프로브, 우측 프로브 및 3개의 올리고들로 구성된 브릿지를 포함한다. 본원에서 상기 프로브 복합체는 좌측 프로브 및 제2 브릿지 (228 및 236) 사이, 제2 브릿지 및 우측 프로브 (240 및 222) 사이, 제1 및 제3 브릿지 올리고들 (238 및 242) 사이, 및 좌측 프로브 및 우측 프로브 (208 및 216) 사이에 갭들을 포함한다. 이러한 갭들은 폴리머라제 및 하나 이상의 뉴클레오티드를 도입하여 필링된다. 이러한 과정을 위해, Stoffel 단편, Taq 폴리머라제 또는 Phusion 폴리머라제, 및 DNA 리가제 예컨대 Ampligase의 혼합물을 사용할 수 있다. 상기 폴리머라제는 이러한 갭들을 필링하고, DNA 리가제의 후속 작용으로 프로브 및 브릿지 올리고를 원형 복합체로 결찰되도록 유도하였다.
상기 좌측 프로브의 15-25개의 염기는 브릿지 결합 서열 1 (228)을 포함하며, 이는 선택적으로 브릿지 서열 1로 언급되는 효과적인 브릿지 올리고 결합을 위해 화학적으로 변형된 염기를 포함한다. 상기 좌측 프로브는 선택적으로 라이브러리 인덱싱 (204)에 사용되는 범용 서열을 포함하는, 5' 말단으로부터 다음 10-20개의 염기를 추가로 포함한다. 상기 좌측 프로브는 선택적으로 바코드 1 (206)로 언급되는 분자-특이적 바코드 또는 샘플-특이적 바코드를 형성하는 무작위 뉴클레오티드의 세그먼트를 포함하는, 5' 말단으로부터 다음 10-20개의 염기를 추가로 포함한다. 상기 좌측 프로브는 5' 말단으로부터 다음 15-30개의 염기를 추가로 포함하고, 유전자 표적 (208)에 결합한다. 228의 뉴클레오티드들 중 일부 또는 전부는 표적 또는 브릿지 (226)에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다. 상기 좌측 프로브의 마지막 염기는 선택적으로 변형 1 (210)로 언급되는 인접한 프로브의 5' 말단에 화학적 결찰을 허용하는 변형 또는 효소적 결찰을 위한 포스페이트 모이어티를 포함한다.
상기 우측 프로브의 제1 염기는 선택적으로 변형 2 (214)로 언급되는 인접한 프로브의 5' 말단에 화학적 결찰을 허용하는 변형 또는 효소 결찰을 위한 포스페이트 모이어티를 포함한다. 상기 우측 프로브의 5' 말단으로부터 15-30개의 염기는 유전자 표적 (216)에 결합하는 우측 프로브의 일부를 포함한다. 상기 우측 프로브의 5' 말단으로부터 다음 10-20개의 염기는 선택적으로 바코드 2 (218)로 언급되는 분자-특이적 바코드 또는 샘플-특이적 바코드를 형성하는 무작위 뉴클레오티드의 세그먼트를 포함한다. 상기 우측 프로브의 5' 말단으로부터 다음 10-20개의 염기는 선택적으로 범용 서열 (220)을 포함한다. 상기 우측 프로브의 마지막 15-25개의 염기는 브릿지 서열 8 (222)로 언급되고, 제3 브릿지 올리고 (224)의 브릿지 서열 7에 역상보적이다. 208, 216, 222 또는 228의 뉴클레오티드들 중 일부 또는 전부는 표적 또는 브릿지 올리고에 대한 프로브의 친화도를 증가시키는 화학적 변형을 포함할 수 있다.
상기 제1 브릿지 올리고의 5' 말단으로부터 처음 15-25개의 염기는 브릿지 서열 3 (226)으로 언급되고, 우측 프로브 (228)의 브릿지 서열 1에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 상기 제1 브릿지 올리고의 마지막 15-25개의 염기는 브릿지 서열 2 (238)로 언급되고, 제2 브릿지 올리고 (236)의 브릿지 서열 4 서열에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 상기 제1 브릿지 올리고의 5' 말단은 선택적으로 결찰 복합체를 포획하는데 사용되는 포획 모이어티 (230)를 포함한다.
상기 제2 브릿지 올리고의 5' 말단으로부터 처음 15-25개의 염기는 브릿지 서열 5 (240)로 언급되고, 제3 브릿지 올리고의 브릿지 서열 6 (242)에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 상기 제2 브릿지 올리고의 마지막 15-25개의 염기는 브릿지 서열 4 (236)로 언급되고, 제1 브릿지 올리고 (238)의 브릿지 서열 2 서열에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다.
상기 5' 말단으로부터 제3 브릿지 올리고의 처음 15-25개의 염기는 브릿지 서열 6 (242)으로 언급되고, 제2 브릿지 올리고 (240)의 브릿지 서열 5 서열에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 상기 제1 브릿지 올리고의 마지막 15-25개의 염기는 브릿지 서열 7 (224)로 언급되고, 우측 프로브 (222)의 브릿지 서열 8 서열에 역상보적이며, 선택적으로 결합 증가를 위해 화학적으로 변형된 뉴클레오티드를 포함한다. 상기 제3 브릿지 올리고의 3' 말단은 선택적으로 갭 필링 중에 연장을 방지하기 위해 포스페이트 (또는 다른 절단 가능한) 모이어티 (234)를 포함한다.
T7 RNA 폴리머라제 프로모터 서열은 브릿지 올리고의 위치 226, 238 또는 242 또는 224에 있는 결찰 복합체에 내장될 수 있다. 상기 데옥시우리딘 모이어티는 위치 204 및 228 사이, 또는 좌측 프로브의 206 내에 내장될 수 있다.
SEQUENCE LISTING <110> Genomill Health Oy <120> METHODS FOR ACCURATE PARALLEL QUANTIFICATION OF NUCLEIC ACIDS IN DILUTE OR NON-PURIFIED SAMPLES <130> Genomill002EP <140> EP21163299.7 <141> 2021-03-18 <160> 31 <170> PatentIn version 3.5 <210> 1 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence <400> 1 ggggcccgcc gtcgatcgga gccgttagga t 31 <210> 2 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 2 ttaaggtgcc gtcgatcgga gccgacgtac g 31 <210> 3 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 3 ttaaggtgcc gtcgatcgga gccgacgtac g 31 <210> 4 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 4 tataatagag gtcgtgcagt cacgacccgg t 31 <210> 5 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 5 accaggtgcc gtcgatcgga gccgacccgg t 31 <210> 6 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 6 gggccgggag gtcgtgcagt cacgttagga t 31 <210> 7 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 7 tccaggtgag tcgatccgtc acgtacgtac g 31 <210> 8 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 8 aaaattttag cgtacgtcgt acgtttagga t 31 <210> 9 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 9 tataatagag gtcgtgcagt cacgacccgg t 31 <210> 10 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 10 aggaccttga gtcgatccgc acgtacccgg t 31 <210> 11 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 11 agcgaccgag gtcgtgcagt cacgacgtac g 31 <210> 12 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 12 tataatagag gtcgtgcagt cacgacccgg t 31 <210> 13 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 13 ggaaaaagcc gtcgatcgga gccgttagga t 31 <210> 14 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 14 atatacagag gtcgtgcagt cacgttagga t 31 <210> 15 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 15 gagagccgag gtcgtgcagt cacgacccgg t 31 <210> 16 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 16 cgcacgcgag gtcgtgcagt cacgacgtac g 31 <210> 17 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 17 attacaagcc gtcgatcgga gccgacccgg t 31 <210> 18 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 18 tataatagag gtcgtgcagt cacgacccgg t 31 <210> 19 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 19 gggcaattag cgtacgtcgt acgtacgtac g 31 <210> 20 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 20 tatgcgagcc gtcgatcgga gccgacgtac g 31 <210> 21 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 21 aggaccttga gtcgatccgc acgtacccgg t 31 <210> 22 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 22 attacaagcc gtcgatcgga gccgacccgg t 31 <210> 23 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 23 gaagaattag cgtacgtcgt acgtttagga t 31 <210> 24 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 24 gggcaattag cgtacgtcgt acgtacgtac g 31 <210> 25 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 25 gggcaattag cgtacgtcgt acgtacgtac g 31 <210> 26 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 26 gagcacttag cgtacgtcgt acgtacccgg t 31 <210> 27 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 27 aaaggggcga gtcgatccgc acgtttagga t 31 <210> 28 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 28 agcgcgcgcc gtcgatcgga gccgttagga t 31 <210> 29 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <400> 29 cgacgacgac agaaccagat acacgacgta cgcacgacat 40 <210> 30 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <220> <221> misc_feature <222> (33)..(42) <223> n is a, c, g, or t <400> 30 ggttctgtcg tcgtcggaca cgacgctccg ctnnnnnnnn nnagctgagc gtattcgat 59 <210> 31 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> random sequence - just for illustration <220> <221> misc_feature <222> (18)..(27) <223> n is a, c, g, or t <400> 31 ctggatcgtc gtatgctnnn nnnnnnngat cgacccattg gagaagatga tgtcgtgcgg 60 tacgtcgt 68

Claims (20)

  1. 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법 (method for the high-throughput detection)으로서, 상기 방법은:
    (i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
    제1 프로브, 제2 프로브, 및 브릿지 올리고 (bridge oligo) 또는 서로 어닐링하여 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 제공하는 단계로서,
    상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
    상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
    상기 브릿지 올리고 또는 브릿지 올리고 복합체는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 브릿지 올리고-특이적 서열 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 함유하고;
    상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 각각에 존재하며;
    상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 제1 포획 모이어티 (capture moiety)를 포함하는 것인 단계;
    (ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 제1 프로브 및 제2 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드와 접촉시키고, 자가-어닐링으로 복수의 결찰 복합체 (ligation complexes)가 형성되도록 하는 단계;
    (iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 각 샘플 내에 존재하는 핵산을 상기 결찰 복합체와 접촉시키는 단계;
    (iv) 각각의 제1 프로브 및 제2 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체 (hybridization complex)가 형성되도록 하는 단계;
    (v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
    (vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
    (vii) 상기 혼성화 복합체에서 프로브들을 결찰하여 결찰된 결찰 복합체 (ligated ligation complexes)를 제공하는 단계;
    (viii) 선택적으로, 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링 (pooling)하는 단계;
    (ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
    (x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술 (high-throughput sequencing technology)에 적용하여 바코드 서열(들)을 결정하는 단계; 및
    (xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계를 포함하고,
    상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있는 것인 방법.
  2. 청구항 1에 있어서, 상기 복수의 샘플은 혈액 샘플, 타액 샘플, 소변 샘플, 대변 샘플, 다른 체액 샘플 또는 신체 물질로부터의 추출물을 포함하는 것인 방법.
  3. 청구항 1 또는 2에 있어서, 상기 제1 포획 모이어티는 바이오틴 모이어티이고, 상기 제2 포획 모이어티는 스트렙타비딘 모이어티 또는 아비딘 모이어티인 것인 방법.
  4. 청구항 1 내지 3 중 어느 한 항에 있어서, 세척 단계는 단계 (vi) 및 (vii) 사이에 수행되는 것인 방법.
  5. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 시퀀싱은 차세대 DNA 또는 RNA 시퀀싱에 의해 수행되는 것인 방법.
  6. 청구항 1 내지 5 중 어느 한 항에 있어서, 상기 제1 프로브의 3' 말단 또는 상기 제2 프로브의 5' 말단, 또는 이들 모두는 상기 제1 프로브가 상기 제2 프로브에 화학적 결찰되도록 변형되는 것인 방법.
  7. 청구항 1 내지 6 중 어느 한 항에 있어서, 상기 제1 프로브 또는 상기 제2 프로브, 또는 이들 모두의 가교 부분 (bridging portion)은 상기 브릿지 올리고 또는 브릿지 올리고 복합체에 대한 결합이 개선되도록 하는 화학적으로 변형된 염기를 포함하는 것인 방법.
  8. 청구항 1 내지 7 중 어느 한 항에 있어서, 상기 제1 표적 특이적 부분, 제2 표적 특이적 부분, 제1 브릿지 올리고-특이적 서열, 및/또는 제2 브릿지 올리고-특이적 서열은 서로 독립적으로, 하나 이상의 화학적으로 변형된 뉴클레오티드를 함유하는 것인 방법.
  9. 청구항 1 내지 8 중 어느 한 항에 있어서, T7 RNA 폴리머라제에 대한 프로모터 서열이 상기 제1 프로브, 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체에 존재하고, 상기 단계 (ix)에서의 증폭 단계는 상기 결찰된 결찰 복합체내에 내장된 T7 RNA 폴리머라제 프로모터로부터 RNA 합성을 개시하는 T7 RNA 폴리머라제를 사용하여 하나 이상의 결찰된 결찰 복합체로부터의 RNA 합성을 포함하는 것인 방법.
  10. 청구항 9에 있어서, 상기 제1 프로브, 제2 프로브, 또는 브릿지 올리고 또는 브릿지 올리고 복합체는 우라실-특이적 절제 시약 (uracil-specific excision reagent)을 사용한 절단에 의해 선형화되는 데옥시우리딘 모이어티를 포함하는 것인 방법.
  11. 청구항 9에 있어서, 상기 단계 (x) 이전에, 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체에 존재하는 범용 부위 (universal site)에 역-상보적인 DNA-올리고뉴클레오티드 분자를 사용하여 RNA 분자로부터 cDNA를 제조하는 것인 방법.
  12. 청구항 1 내지 8 중 어느 한 항에 있어서, 상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 엔도뉴클레아제에 대한 인식 서열을 포함하고, 여기서 (a) 단계 (ix)에서 하나 이상의 결찰된 결찰 복합체로부터 핵산의 증폭은 가닥-치환 폴리머라제 (strand-displacing polymerase)로 롤링 서클 증폭 (rolling circle amplification)을 사용하는 수행하는 단계, 이어서 (b) 선택적으로, 수득된 증폭된 하나 이상의 단일-가닥 연쇄체 서열 (concatemeric sequence)을 상기 인식 서열을 함유하는 특정 올리고뉴클레오티드와 어닐링하는 단계로서, 상기 특정 올리고뉴클레오티드는 인식 서열로 어닐링하여 상기 엔도뉴클레아제에 대한 인식 부위가 수득되는 것인 단계, 및 (c) 선택적으로, 수득된 증폭된 하나 이상의 단일-가닥 연쇄체 서열 또는 수득된 어닐링된 복합체를 상기 엔도뉴클레아제로 절단하는 단계를 포함하는 것인 방법.
  13. 청구항 1 내지 8 중 어느 한 항에 있어서, 상기 단계 (ix)의 증폭 단계는 상기 제1 및 제2 프로브의 범용 부분에 결합하는 프라이머를 사용하여 PCR에 의해 수행되는 것인 방법.
  14. 청구항 1 내지 13 중 어느 한 항에 있어서, 유전자 표적 계수 (enumeration)는 표적당 (per target) 및 샘플당 (per sample) 분자 바코드의 수를 계수함으로써 허용되는 것인 방법.
  15. 청구항 9 내지 14 중 어느 한 항에 있어서, 상기 뉴클레오티드 분자는 제1 프라이머 및 제2 프라이머로 증폭되어 증폭 산물을 제공하는 것인 방법.
  16. 복수의 용기를 포함하는 부재들의 키트 (kit of parts)로서, 상기 적어도 하나의 용기는 제1 프로브 및 제2 프로브의 하나 이상의 세트를 포함하고, 적어도 하나의 용기는 하나 이상의 브릿지 올리고 또는 브릿지 올리고 복합체를 형성할 수 있는 복수의 올리고뉴클레오티드를 포함하며,
    상기 제1 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 브릿지 올리고-특이적 서열, 선택적으로 제1 서열 바코드, 및 제1 프로브의 3' 말단에 제1 표적 특이적 부분을 포함하고;
    상기 제2 프로브는 그 분자의 5' 말단으로부터 시작하여, 제2 표적 특이적 부분, 선택적으로 제2 서열 바코드, 및 제2 프로브의 3' 말단에 제2 브릿지 올리고-특이적 서열을 포함하며;
    상기 브릿지 올리고 또는 브릿지 올리고 복합체는 상기 제1 프로브 및 상기 제2 프로브 각각에서의 제1 및 제2 브릿지 올리고-특이적 서열에 상보적인 서열, 및 선택적으로 제3 바코드를 포함하고;
    상기 제1 서열 바코드 또는 제2 서열 바코드 또는 제3 바코드 중 적어도 하나는 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 각각에 존재하며;
    상기 제1 프로브 또는 제2 프로브 또는 브릿지 올리고 또는 브릿지 올리고 복합체 중 적어도 하나는 제1 포획 모이어티를 포함하고, 이는 고체 지지체에 연결된 제2 포획 모이어티에 연결될 수 있는 것인 키트.
  17. 복수의 샘플에서 하나 이상의 표적 뉴클레오티드 서열의 고처리량 검출 방법으로서, 상기 방법은:
    (i) 각 샘플에서 각 표적 뉴클레오티드 서열에 대해,
    Figure pat00005
    단일 프로브로서, 그 분자의 5' 말단으로부터 시작하여, 제1 표적 특이적 부분, 바코드를 포함하는 스페이서 부분, 및 제2 프로브의 3' 말단에 제2 표적 특이적 부분을 포함하는 단일 프로브, 및
    Figure pat00006
    브릿지 올리고로서, 그 브릿지 올리고는 상기 단일 프로브의 스페이서 부분 또는 스페이서 부분의 일부에 상보적인 서열을 함유하는 브릿지 올리고를 제공하는 단계로서,
    상기 단일 프로브 또는 상기 브릿지 올리고는 제1 포획 모이어티를 포함하는 것인 단계;
    (ii) 상기 하나 이상의 표적 뉴클레오티드 서열 각각에 대해, 상기 단일 프로브를, 바람직하게는 개별 튜브 내의 샘플 각각에 대해, 상기 브릿지 올리고와 접촉시키고, 자가-어닐링하는 단계;
    (iii) 상기 표적 뉴클레오티드 서열에 대해 테스트할 복수의 샘플 내에 존재하는 핵산을 상기 단일 프로브와 접촉시키고, 상기 브릿지 올리고에 어닐링하는 단계;
    (iv) 상기 단일 프로브의 제1 표적 특이적 부분 및 제2 표적 특이적 부분을 상기 표적 서열 상의 본질적으로 인접한 섹션에 혼성화되도록 하여, 이에 의해 혼성화 복합체가 형성되도록 하는 단계;
    (v) 상기 혼성화 복합체를 제2 포획 모이어티를 포함하는 고체 지지체와 접촉시키고, 상기 혼성화 복합체가 상기 고체 지지체에 연결되도록 제1 포획 모이어티 및 제2 포획 모이어티가 상호작용되도록 하는 단계;
    (vi) 상기 고체-지지체-연결된 혼성화 복합체를 고체-지지체에 연결되지 않은 샘플의 성분들로부터 분리하는 단계;
    (vii) 상기 단일 프로브의 5' 말단 및 3' 말단을 결찰하여 결찰된 결찰 복합체를 제공하는 단계;
    (viii) 선택적으로, 복수의 샘플들로부터 상기 결찰된 결찰 복합체를 풀링하는 단계;
    (ix) 상기 하나 이상의 결찰된 결찰 복합체로부터 핵산을 증폭시키는 단계;
    (x) 단계 (ix)에서 수득된 핵산을 고처리량 시퀀싱 기술에 적용하여 바코드 서열(들)을 결정하는 단계; 및
    (xi) 상기 제1 표적 특이적 부분 및/또는 제2 표적 특이적 부분의 적어도 일부, 및/또는 상기 제1 바코드 및/또는 제2 바코드의 적어도 일부, 및/또는 상기 제3 바코드의 적어도 일부의 결정에 의해, 복수의 샘플에서 표적 뉴클레오티드 서열의 존재 및/또는 수를 확인하는 단계를 포함하고,
    상기 단계 (vii) 및 (viii)는 임의의 순서로 수행될 수 있는 것인 방법.
  18. 청구항 17에 있어서, 상기 단일 프로브는 화학적으로 연결된 2개 이상의 올리고뉴클레오티드를 포함하는 것인 방법.
  19. 청구항 17 또는 18에 있어서, 청구항 2 내지 15 중 어느 한 항의 특징을 추가로 포함하는 것인 방법.
  20. 복수의 용기를 포함하는 부재들의 키트로서, 상기 적어도 하나의 용기는 하나 이상의 단일 프로브를 포함하고, 적어도 하나의 용기는 하나 이상의 브릿지 올리고를 포함하며,
    상기 단일 프로브는 그 분자의 5' 말단으로부터 시작하여, 제1 표적 특이적 부분, 바코드를 포함하는 스페이서 부분, 및 제2 프로브의 3' 말단에 제2 표적 특이적 부분을 포함하고,
    상기 브릿지 올리고는 상기 단일 프로브의 스페이서 부분 또는 스페이서 부분의 일부에 상보적인 서열을 함유하며;
    상기 단일 프로브 또는 상기 브릿지 올리고는 제1 포획 모이어티를 포함하고, 이는 고체 지지체에 연결된 제2 포획 모이어티에 연결될 수 있는 것인 키트.
KR1020220030312A 2021-03-18 2022-03-10 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법 KR20220130591A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP21163299.7A EP4060049B1 (en) 2021-03-18 2021-03-18 Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples
EP21163299.7 2021-03-18
EP22152614.8 2022-01-21
EP22152614.8A EP4060052A1 (en) 2021-03-18 2022-01-21 Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples

Publications (1)

Publication Number Publication Date
KR20220130591A true KR20220130591A (ko) 2022-09-27

Family

ID=75108124

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220030312A KR20220130591A (ko) 2021-03-18 2022-03-10 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법

Country Status (8)

Country Link
US (1) US11898202B2 (ko)
EP (2) EP4060049B1 (ko)
JP (1) JP2022145605A (ko)
KR (1) KR20220130591A (ko)
CN (1) CN115109846A (ko)
CA (1) CA3149035A1 (ko)
ES (1) ES2960777T3 (ko)
TW (1) TW202302861A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4326898B1 (en) * 2021-08-16 2024-07-31 10X Genomics, Inc. Probes comprising a split barcode region and methods of use
US20240068010A1 (en) * 2022-08-31 2024-02-29 Genomill Health Oy Highly sensitive methods for accurate parallel quantification of variant nucleic acids

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007145612A1 (en) * 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
CN106661631B (zh) * 2014-06-06 2021-04-02 康奈尔大学 从血液特异性靶向捕获人类基因组和转录组区域的方法
US9856521B2 (en) * 2015-01-27 2018-01-02 BioSpyder Technologies, Inc. Ligation assays in liquid phase
GB2570412A (en) * 2016-08-31 2019-07-24 Harvard College Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
GB201621514D0 (en) * 2016-12-16 2017-02-01 Q-Linea Ab Padlock probe detection method
EP3447152A1 (en) 2017-08-25 2019-02-27 Eawag, Swiss Federal Institute of Aquatic Science and Technology Accurate and massively parallel quantification of nucleic acid
CN114901818A (zh) * 2018-11-21 2022-08-12 艾维达生物医学公司 靶向核酸文库形成的方法

Also Published As

Publication number Publication date
TW202302861A (zh) 2023-01-16
EP4060049B1 (en) 2023-08-23
EP4060052A1 (en) 2022-09-21
EP4060049C0 (en) 2023-08-23
CN115109846A (zh) 2022-09-27
EP4060049A1 (en) 2022-09-21
CA3149035A1 (en) 2022-09-18
JP2022145605A (ja) 2022-10-04
US20220298566A1 (en) 2022-09-22
ES2960777T3 (es) 2024-03-06
US11898202B2 (en) 2024-02-13

Similar Documents

Publication Publication Date Title
EP3673081B1 (en) Accurate and massively parallel quantification of nucleic acid
JP5986572B2 (ja) 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定
US11486003B2 (en) Highly sensitive methods for accurate parallel quantification of nucleic acids
US11898202B2 (en) Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples
US11970736B2 (en) Methods for accurate parallel detection and quantification of nucleic acids
US20240068010A1 (en) Highly sensitive methods for accurate parallel quantification of variant nucleic acids
EP4215619A1 (en) Methods for sensitive and accurate parallel quantification of nucleic acids