KR20230020950A - 단일 분자 서열분석 및 표적 핵산 검출을 위한 lash 방법 - Google Patents

단일 분자 서열분석 및 표적 핵산 검출을 위한 lash 방법 Download PDF

Info

Publication number
KR20230020950A
KR20230020950A KR1020227037538A KR20227037538A KR20230020950A KR 20230020950 A KR20230020950 A KR 20230020950A KR 1020227037538 A KR1020227037538 A KR 1020227037538A KR 20227037538 A KR20227037538 A KR 20227037538A KR 20230020950 A KR20230020950 A KR 20230020950A
Authority
KR
South Korea
Prior art keywords
luminescent
nucleotide
substrate
conjugate
nucleic acid
Prior art date
Application number
KR1020227037538A
Other languages
English (en)
Inventor
이난치 오르탁
Original Assignee
사르말, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사르말, 인크. filed Critical 사르말, 인크.
Publication of KR20230020950A publication Critical patent/KR20230020950A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/103Nucleic acid detection characterized by the use of physical, structural and functional properties luminescence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

발광 반응을 위한 성분을 이용하여 단일 핵산 분자를 서열분석 또는 검출하기 위한 방법 및 시스템이 본 명세서에 제공된다.

Description

단일 분자 서열분석 및 표적 핵산 검출을 위한 LASH 방법
본 발명은 단일 분자 핵산 서열분석 및 표적 서열의 검출을 위한 방법에 관한 것이다.
현재의 서열분석 기술은 2가지의 주요 범주, 즉, 짧은 판독 서열분석(short-read sequencing) 및 긴 판독 서열분석(long-read sequencing)으로 그룹화될 수 있다. 각 범주에서 DNA는 특정 수의 뉴클레오타이드 또는 염기쌍(bp)까지의 길이를 가진 조각으로 절단된다. 모든 경우에, 모든 DNA 조각은 2차원 어레이로 확산되고 적어도 하나의 센서가 DNA 조각과 일치하는 위치에 상응하는 센서 어레이에 의해 검출된다.
짧은 판독 서열분석 접근법은 결찰에 의한 서열분석(sequencing-by-ligation: SBL) 및 합성에 의한 서열분석(sequencing-by-synthesis: SBS)을 포함하는 간단한 순환 기반의 기술이다. SBL 접근법으로는 SOLID(Thermo Fisher) 및 Complete Genomics(BGI)를 포함한다. SOLID에 의하면 약 75 염기쌍(bp)의 판독 길이에 도달하는 반면, Complete Genomics 접근법에 의하면 28 내지 100개의 염기쌍 판독이 실현 가능하다. 이러한 접근법들에 의하면 구조 변경 및 게놈 조립이 불가능하여 단독중합체 오류에 민감하다. 이들의 진행시간은 수 일 정도이다. Illumina 및 Qiagen의 GeneReader 기술은 순환식 가역성 종결과 함께 SBS 접근법을 이용한다. 최대 300bp에 도달할 수 있다. 그러나, 주요 단점으로는 AT 및 GC 풍부 영역, 치환 오류 및 높은 절반 양성률이 대표적이다.
한편, 454 파이로시퀀싱(454 pyrosequencing) 및 Ion Torrent(Thermo Fisher)와 같은 다른 SBS 접근법은 단일 뉴클레오타이드 첨가/종결을 사용한다. 454 파이로시퀀싱은 400bp에 도달할 수 있는 반면, Ion Torrent는 700bp 판독 길이를 달성할 수 있다. 그러나, 이들 기술은 더 빠르고 현장 관리가 좋지만 삽입/결실 오류의 우세, 및 단독중합체 영역 오류를 비롯한 많은 단점도 있다. 이들은 장거리 게놈 또는 전사체 구조를 밝히는 데 사용될 수 없으며 쌍을 이룬 말단 서열분석을 수행할 수 없다.
긴 판독 서열분석 접근법은 2가지 주요 유형인, 합성 긴 판독 서열분석 또는 실시간 긴 판독 서열분석을 포함한다. Illumina 및 10X Genomics에 의해 사용된 합성 조각 맞추기(pieced together) 긴 판독 서열분석은 바코드를 투입하고 큰 단편들의 전산적 조립을 허용하는 라이브러리 제조물에 초점을 맞춘다. 실제로 이들 기술은 실제 긴 판독을 하지 않고, 오히려 짧은 판독을 하여, DNA 조각이 바코드화 접근법을 사용하여 조직화되고, 이는 분석 동안 약간의 복잡성을 없애는데 도움을 주고, 실제 긴 판독 방법과 유사한 데이터를 얻을 수 있게 한다. 그러나, 이 접근법은 부분적으로 훨씬 더 많은 적용범위(coverage)를 필요로 하기 때문에 비용이 매우 많이 든다. 긴 판독 서열분석의 다른 유형은 Pacific Biosciences 및 Oxford Nanopore Technologies에서 사용하는 실시간 긴 판독 서열분석이다. 합성 긴 판독 서열분석과 달리, 실시간 긴 판독 서열분석은 증폭된 DNA의 클론성 집단에 의존하지 않고 화학적 순환을 필요로 하지 않는다. Nanopore의 기술은 약 30%의 매우 높은 오류율을 갖고 있으며 비용에 크게 기여하는 매우 높은 적용범위를 필요로 한다. 변형된 염기의 사용은 특히 Nanopore 기술의 과제였는데, 이는 분석을 훨씬 더 복잡하게 만드는 고유 신호를 생성했다. Pacific Biosciences는 최대 4000 내지 5000bp의 판독 길이에 도달할 수 있다. 그러나, 긴 판독의 경우 약 15%의 높은 단일-패스 오류율로 인해, 높은 적용범위를 필요로 하며, 이는 1Gb 서열분석 비용을 $1000이 넘게 한다(예를 들어, 문헌[Goodwin et al., Nat. Rev. Genet. 17: 333-351, 2016] 참조). 또한, 이들 방법에 의해 이용되는 열적 배경 및 여기 에너지는 임계 반응에서 사용되는 DNA 중합효소를 손상시키고, 이는 궁극적으로 본 기술의 판독 길이 및 적용 가능성을 제한한다. 또한, 생성된 발광이 폴리머라제에 의해 부착된 뉴클레오타이드와 독립적인 일반적 스펙트럼이기 때문에, 파이로시퀀싱은 각 뉴클레오타이드가 모든 결합 사건으로부터 신호를 수집하여 하나씩 투여되는 주기-기반 접근을 필요로 한다. 이는 다음 뉴클레오타이드를 투여하기 위해 비결합 뉴클레오타이드를 제거하기 위한 세척 주기에 따른다.
현재 기술의 대다수는 단위당 뉴클레오타이드의 짧은 판독 길이(약 40 내지 100개 염기 길이)를 제공하기 때문에 가장 도전이 되는 문제 중 하나는 서열의 작은 조각을 하나의 큰 의미 있는 서열로 정렬하고, 강력한 슈퍼 컴퓨터를 사용하여 복잡한 알고리즘으로 높은 적용범위 데이터 및 생성된 데이터 로드의 후처리를 분석하는 데 있다. 차세대 단일 분자 기반의 서열분석 기술은 잠재적으로 이 문제를 해결할 수 있다. 그러나, 이들 선행 기술은 높은 오류율을 갖고 있어, 각각 신뢰할 수 있는 데이터를 얻기 위해 종종 약 30× 내지 100× 정도의 높은 적용범위(서열의 동일 영역에 대한 다중 판독)를 필요로 한다.
따라서, 핵산 서열분석을 위한 개선된 방법이 필요하다.
본 명세서에는 다음을 포함하는 핵산 주형을 서열분석하는 방법이 제공된다:
(i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 및 프라이머, 및 (iv) 길어지는(growing) 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는 서열분석 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기(예를 들어, PPi-LS)를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 상이한 발광-기질을 가지며, 발광-기질-부착-이탈기는 주형 가닥에 대한 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 시 절단되는, 서열분석 혼합물을 제공하는 단계;
복수의 뉴클레오타이드-접합체-유사체가 주형에 순차적으로 첨가되어: a) 뉴클레오타이드-접합체-유사체가 폴리머라제와 회합하고, b) 해당 뉴클레오타이드-접합체-유사체 상의 발광-기질-부착-이탈기가 폴리머라제에 의해 절단될 때 뉴클레오타이드-접합체-유사체는 폴리머라제에 의해 주형 가닥에 혼입되되, 발광-기질-부착-이탈기는 발광 반응에서 발광-효소와 조합되고, 발광-기질은 제한된 기간 동안 뉴클레오타이드-특이적-발광을 생성되도록 발생-효소에 의해 촉매되게, 핵산 합성을 수행하는 단계; 및
핵산 합성이 일어나는 동안 뉴클레오타이드-특이적-발광 신호(광)를 검출하고, 주형 핵산의 서열을 결정하기 위해 각각의 개별 발광 기간 동안 검출된 뉴클레오타이드-특이적-발광 신호를 이용하는 단계.
따라서, 실시간 또는 주기 기반 단일 분자 서열분석을 위한 방법, 즉, LASH(연속 혼성화에 의한 발광 활성화(Luminescence Activation By Serial Hybridization))가 본 명세서에 제공된다. 이 접근에서, 다양한 뉴클레오타이드(예를 들어, dNTP)의 포스페이트, 예를 들어, 감마 포스페이트 등에 부착된 발광-기질이 있다. 각각의 뉴클레오타이드는 상이한 스펙트럼을 갖는 발광-기질을 갖는다. 폴리머라제는 이런 변형된 뉴클레오타이드를 기질로서 수용한다. 폴리머라제가 주형 가닥에 대한 상보성 뉴클레오타이드에 결합할 때마다, 폴리머라제에 의해 주형 가닥에 혼입된 뉴클레오타이드에 부착되고 이에 고유한 발광-기질과의 파이로포스페이트를 방출한다.
부착된 발광-기질에 의해 변형된 파이로포스페이트(본 명세서에서 발광-기질-부착-이탈기 또는 PPi-LS로서 지칭됨)는 각각의 상이한 뉴클레오타이드에 대한 고유 스펙트럼을 갖고, 발광 효소(즉, 반딧불이 루시퍼라제, 방아벌레 루시퍼라제, 가우시안 루시퍼라제, 레닐라(renilla) 루시퍼라제, 마이크로퍼옥시다제, 미엘로퍼옥시다제, 겨자무과산화효소, 카탈라제, 잔틴 옥시다제, 아트로마이세스 라모서스(Arthromyces ramosus)로부터의 박테리아 퍼옥시다제, 알칼리포스파타제, 기질로서 인독실 접합체의 존재 하에 β-D-갈락토시다제 및 b-글루코시다제, 락테이트 옥시다제, 아실CoA 합성효소 및 아실CoA 옥시다제, 다이아민 옥시다제, 3-a 하이드록시스테로이드 탈수소효소 또는 글루코스-6-포스페이트 탈수소효소 등)와 상호작용하여 주형 가닥에 혼입된 염기 또는 뉴클레오타이드에 상응하는 단명(short-lived) 뉴클레오타이드-특이적-발광 신호를 생성한다. 실시간 서열분석은 부착된 각 뉴클레오타이드에 상응하는 고유 스펙트럼을 갖는 단명 펄스를 판독함으로써 달성된다.
본 발명의 서열분석 방법(본 명세서에서 LASH 서열분석 방법; 연속 혼성화에 의한 발광 활성화로도 지칭됨)의 중요한 이점은 본 발명의 반응 조건에서, 예컨대, 특정 표면에 부착되는 것에 의해, 또는 신호를 생성하기 위해 사용되는 외부 광 여기의 다회 노출을 실시함으로써 폴리머라제 효소가 기존의 방법에 의해 일어난 것과 같이 손상되지 않는다는 것이다. 본 발명은 폴리머라제에 대한 주요 변형, 또는 표면에 대한 이의 부착뿐만 아니라 폴리머라제가 이의 본래의 사슬 연장 기능(elongation function)을 수행하지 못하도록 압박하는 외부 광원에 대한 노출을 필요로 하지 않는다. 이는 유리하게는 본래의 환경에서 발생되는 바와 같은 높은 정확도로 매우 긴 판독 길이에 도달할 수 있는 보다 길게 작용하는 폴리머라제를 생성하며; 기존의 방법보다 훨씬 더 적은 적용범위가 요구된다.
예를 들어, 본 발명의 특정 실시형태에서, 단일 폴리머라제 또는 복수의 폴리머라제는 서열분석 반응 혼합물, 예를 들어, 단일 액적 등으로 가둬지되(confined), 폴리머라제(들)는 검출될 dNTP 혼입 신호를 생성하기 위해 외부 광 여기로 처리되지 않는다.
본 발명의 방법은 전체 게놈 서열분석, SNP-변이체 검출 등을 포함하는 다양한 용도를 갖는다. 기존의 방법 이상의 본 방법의 한 가지 이점은 제어된, 고유하게 정의된, 개별로 그리고/또는 일시적으로 제한된 뉴클레오타이드-특이적-발광 신호를 생성하기 위한 뉴클레오타이드-특이적-발광 반응(예를 들어, 해양 루시퍼라제 및 코엘렌테라진(coelenterazine), 또는 박테리아 루시퍼라제 및 FMNH2 등을 이용)에서의 부착된 발광-기질(예를 들어, 발광-기질-부착-뉴클레오타이드)을 갖는 변형된 뉴클레오타이드-접합체-유사체의 이용이다. 놀랍게도, 발광-기질-부착-이탈기가 해양 루시퍼라제 및 코엘렌테라진, 또는 박테리아 루시퍼라제 및 FMNH2 등을 이용하여 뉴클레오타이드-특이적-발광 반응에서 작용할 수 있다는 것이 발견되었다. 기존의 방법 이상으로 본 발명의 방법의 다른 이점은 발광 반응에 의해 이용되는 광 강도의 감소이므로, DNA 폴리머라제에 대한 손상이 일어나지 않는데, 가장 통상적인 방법이 종국적으로 폴리머라제를 변성시키는 고강도 광에 의한 외부 여기를 필요로 하기 때문이다. 예를 들어, 생성된 발광 광 강도는 적어도 5-배, 10-배, 25-배, 50-배, 75-배, 100-배, 최대 적어도 1,000-배만큼 기존의 서열분석 방법에 비해서 감소될 수 있다. 특정 실시형태에서, 광 강도의 감소는 적어도 5-배, 10-배, 25-배, 50-배, 75-배, 100-배, 200-배, 300-배, 400-배, 500-배, 600-배, 700-배, 800-배, 900-배, 1000-배, 2000-배 등일 수 있다. 이런 이점은 DNA 폴리머라제의 더 긴 작용을 초래하여, 보다 긴 판독 길이를 생성한다.
특정 실시형태에서, 본 명세서에 제공된 본 발명의 방법은, 이들이 dNTP를 순차적으로 혼입하기 때문에 개개 폴리머라제 효소의 결과 모니터링에 기반한 단일 분자 서열분석 기술이다. 특정 실시형태에서, 본 발명은 폴리머라제가 주형에 상보성인 dNTP, 또는 이의 유사체를 혼입하는 과정을 포괄하며, 뉴클레오타이드-특이적-발광 신호는 혼입 과정 동안 일시적으로, 고유하게 그리고/또는 개별로 생성되되, 이러한 뉴클레오타이드-특이적-발광 신호는 일시적, 고유 및/또는 개별 발광 반응에 의해 야기된다. 다시 말해서, 발광 반응은 여기 스펙트럼 등을 통해 각각의 발광-기질을 야기하여, 특정 dNTP에 특이적인 제한된 양의 시간 동안 그리고 이에 상응하는 검출 가능한 신호를 방출한다. 다음의 dNTP 혼입을 위해 이 과정을 반복한다(도 1).
더 구체적으로는, 폴리머라제가 주형 DNA에 상보성인 가닥에 변형된 데옥시리보뉴클레오사이드 트라이포스페이트(dNTP) 뉴클레오타이드-접합체-유사체를 혼입시킬 때마다, 부착된 뉴클레오타이드 유형에 특이적인 발광 신호(예를 들어, 뉴클레오타이드-특이적-발광 신호)가 생성된다. dNTP에는 5가지 유형, 즉, 데옥시아데노신 트라이포스페이트(dATP), 데옥시구아노신 트라이포스페이트(dGTP), 데옥시사이티딘 트라이포스페이트(dCTP), 데옥시티미딘 트라이포스페이트(dTTP) 및 데옥시유리딘 트라이포스페이트(dUTP)가 있다. 이들 dNTP 중 넷 또는 다섯은 주형 지시 핵산 합성 반응에서 사용되어 주형 핵산 가닥에서 이의 보체(예를 들어, 아데닌, 구아닌, 사이토신 또는 티민)를 식별(즉, 호출)함으로써, 주형 핵산 가닥을 서열분석한다.
각각의 변형된 뉴클레오타이드-접합체-유사체는, 이들이 폴리머라제 효소에 의해 상보성 가닥에 부착되는 동안에, 부착된 발광 기질로부터의 고유 발광 신호(예를 들어, 411, 417, 428, 440, 484, 509㎚ 등의 파장)를 생성한다. dTTP 또는 dUTP 중 하나 또는 둘 다의 임의의 조합물은 서열 내 상보성 아데닌(ATP)을 호출(즉, 식별)하기 위해 핵산 합성 사슬 연장 반응에서 사용될 수 있다. 변형된 dTTP와 dUTP 유사체가 둘 다 반응에서 사용된다면, 이들은 각각 이에 부착된 동일한 발광 기질을 가져서, 동일한 파장 신호를 생성할 수 있거나; 또는 각각은 이들에 부착된 개별 발광 기질을 가질 수 있다. 이전에 부착된 뉴클레오타이드-접합체-유사체의 3' 모이어티에 대한 뉴클레오타이드-접합체-유사체의 부착 완료 시, 발광-기질-부착-이탈기에 의해 생성된 발광은 적절한 발광 센서 및/또는 검출 장치에 의해 검출되고, 이어서, 일부 실시형태에서, 이는 후속적으로 각각의 dNTP 혼입을 위한 발광 반응의 붕괴(decay)에 의해 빠르게 종결된다. 다시 말해서, 주형 가닥에 혼입된 각각의 dNTP는 해당되는 각각의 dNTP 혼입 사건을 나타내며 고유한 광(발광 신호)의 개별, 제한된 기간의 펄스를 생성하며, 이는 서열 분석 중인 주형 핵산에서 특정 상보성 염기의 호출 또는 식별을 허용한다.
다른 실시형태에서, 발광-기질-부착-이탈기에 의해 생성된 발광은 적절한 발광 센서 및/또는 검출 장치에 의해 증폭 및 검출되고, 이어서, 일부 실시형태에서, 이는 후속적으로 해당되는 각각의 dNTP 혼입을 위한 발광 반응의 붕괴에 의해 빠르게 종결된다.
목적하는 주형 핵산의 서열분석은 뉴클레오타이드가 뉴클레오타이드 유형을 나타내는 상보성 가닥에 부착될 때마다 생성되는 발광을 검출함으로써 달성된다. 따라서, 각각 특정 뉴클레오타이드 부착은 발광 센서에 의해 검출될 수 있는 발광 신호의 짧은 피크를 생성한다. 결과적으로, 계속되는 순차적 파장 신호의 데이터 어레이가 생성되고, 이는 뉴클레오타이드 서열의 상응하는 데이터 어레이로 변환될 수 있다.
본 명세서에 개시된 본 발명의 방법에 의해 제공되는 이점은 이의 간단성 및 검출 동안 배경 신호를 상당히 감소시켜 감도를 개선하는 혁신적인 화학에 있다. 본 발명의 방법에 따르면, 시약 및 효소를 수반하는 반응 조건의 더 적은 변형은 특이성, 효율성 및 속도를 개선시킨다. 또한, 본 발명의 방법에 따르면, 폴리머라제는 거의 이상적인 조건에서 작동하고, 후처리 및 생산된 데이터의 분석을 상당히 적게 필요로 함과 동시에 높은 감도 및 특이성을 활용함으로써 DNA 폴리머라제 분자당 약 수만 개의 염기인 매우 긴 판독 길이에 도달하는 것으로 고려된다. 본 명세서에 개시된 본 발명의 방법의 조합된 특징은 경쟁 기술과 비교하여 테스트당 시간을 상당히 감소시키는 것 외에도 높은 특이성을 달성하면서 각각의 장치 및 각 진행에 대한 비용을 감소시킨다. 따라서, 개시된 발명의 방법 및 시스템은 특이성에 악영향을 미침이 없이 매우 저렴한 비용 및 실시간 핵산 서열분석 시스템의 실현을 가능하게 한다.
또한 하기 단계들을 포함하는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법이 본 명세서에 제공된다:
(i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 샘플, (iv) 특정 표적 핵산 서열에 혼성화하는(예를 들어, 이에 상보성인) 프라이머-프로브, 및 (v) 길어지는 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는 연장 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 동일 또는 상이한 발광-기질을 가지며, 발광-기질-부착-이탈기는 주형 가닥에 대한 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 시 절단되는, 연장 혼합물을 제공하는 단계;
프라이머-프로브가 표적 핵산 서열에 혼성화되는 경우, 복수의 뉴클레오타이드-접합체-유사체가 주형에 순차적으로 첨가되어: a) 뉴클레오타이드-접합체-유사체가 폴리머라제와 회합하고, b) 해당 뉴클레오타이드-접합체-유사체 상의 발광-기질-부착-이탈기가 폴리머라제에 의해 절단될 때 뉴클레오타이드-접합체-유사체는 폴리머라제에 의해 주형 가닥에 혼입되되, 발광-기질-부착-이탈기는 발광 반응에서 발광-효소와 조합되고, 발광-기질은 발광을 생성하도록 발생-효소에 의해 촉매되게, 핵산 연장 합성을 수행하는 단계; 및
핵산 합성이 일어나는 동안 발광으로부터 광을 검출하는 단계로서, 광의 검출은 특정 표적 핵산 서열의 존재를 나타내는, 검출하는 단계.
특정 실시형태에서, 표적 핵산의 양은 정량화된다. 일 실시형태에서, 표적 핵산의 양은 발광 강도에 기반하여 정량화된다. 특정 실시형태에서, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 동일한 발광-기질을 갖는다. 특정 실시형태에서, 복수의 폴리머라제 효소가 사용된다.
본 발명의 표적 핵산 서열 검출 및/또는 정량화 방법의 이점은 온도 특성시험(temperature cycling)에 대한 필요, 또는 DNA 복제수의 실질적인 증가 없이 특정 서열의 검출이다. 본 발명의 방법을 이용하여, 특정 실시형태에서, 표적 핵산에 대한 프라이머-프로브의 혼성화로부터 생성된 광은 표적 핵산 주형 길이에 기반하여 본질적으로 지속적이어서, 복제수의 기하급수적 증가 대신에 사슬-연장-광-방출 반응을 생성한다.
본 명세서에 제공된 본 발명의 광-신호 표적 핵산 검출 방법의 다른 이점은 이들이 검출 가능, 활성화 가능한 신호를 제공함에 있어서 PCR보다 훨씬 더 빠르다는 것이다. 예를 들어, 전형적인 PCR은 전형적으로 최대 대략 30 내지 40회의 열-주기를 가지며, 여기서, 각 주기는 완료하는 데 몇 분이 걸리므로 총 실행 지속시간은 적어도 1시간 내지 몇 시간이다. PCR로 더 짧은 실행을 할 수 있지만, 특이성은 포기하며; 더 짧은 실행 사례는 프라이머, 프로브 및 주형 입체배치에 관해 매우 제한적이다. 대조적으로, 표적 핵산 서열(예를 들어 LACES)을 검출 및/또는 정량화하기 위한 본 발명의 광-신호 검출 방법은 연장이 시작되자마자 검출 가능한 신호를 생성하기 시작한다. 일부 실시형태에서, 매우 초기에(예를 들어, 불과 몇 분 만에 등) 생성되는 초기 신호는 이후의 신호에 비해서 가장 높고, 가장 특이적인 신호이다. 따라서, LACES에 의해 생성된 신호의 진화는 빠른 초기 상승 다음이 긴 붕괴에 의해 설명될 수 있는 반면; 정량적 PCR에 의해, 많은 주기 및 훨씬 더 긴 시간 프레임 후에 검출 가능하게 되는 기하급수적인 증가이며, 종국적으로는 안정기에 도달된다. 더 구체적으로는, LACES는 특이성을 포기하는 일 없이 qPCR에 비해 훨씬 더 조기에 발생되는 초기의 빠른 상승 기간에 매우 특이적인 신호를 제공한다.
예를 들어, 본 발명의 특정 실시형태에서, 단일 폴리머라제 또는 복수의 폴리머라제는 (예를 들어, 벌크 반응에서 또는 단일 액적에서) 핵산 사슬 연장 반응 혼합물로 가둬지되, 폴리머라제(들)는 검출될 dNTP 혼입 신호를 생성하기 위해 외부 광 여기로 처리되지 않는다.
또한 본 명세서에서 데옥시리보뉴클레오타이드(dNTP), 또는 이의 유사체; 및 이에 부착된 발광-기질을 포함하는 발광-기질-뉴클레오타이드-접합체-유사체가 제공된다. 특정 실시형태에서, 발광-기질-뉴클레오타이드-접합체-유사체 내의 뉴클레오타이드 내의 뉴클레오타이드(dNTP)는 변형된 뉴클레오타이드 유사체이다. 특정 실시형태에서, dNTP는 dATP, dTTP, dGTP, dCTP 및 dUTP, dATPαS, dGTPαS, dCTPαS, dTTPαS 및 dUTPαS로 이루어진 군으로부터 선택된다. 특정 실시형태에서, 뉴클레오타이드-접합체-유사체는 폴리머라제에 대한 그리고 선택적 절단 활성에 대한 기질일 수 있다.
일 실시형태에서, 뉴클레오타이드-접합체-유사체는 길어지는 주형 지시 가닥에 혼입 시 절단되는 폴리포스페이트 사슬의 일부에 부착되는 발광 기질을 갖는 폴리포스페이트 사슬에 3개 이상의 포스페이트를 갖는 뉴클레오사이드 폴리포스페이트이다. 특정 실시형태에서, 폴리포스페이트는 순수한 폴리포스페이트(--O--PO3-), 파이로포스페이트(PPi) 또는 치환을 갖는 폴리포스페이트이다. 추가 실시형태에서, 발광-기질은 코엘렌테라진, FMNH2 또는 이의 유사체로부터 선택된다. 특정 실시형태에서, 발광-기질은 말단의 포스페이트에 부착된다. 다른 실시형태에서, PPi 발광-기질-부착-이탈기가 폴리머라제에 의해 생성될 때, 발광-기질 뉴클레오타이드-접합체가 주형 가닥에 혼입되는 경우, 발광-기질-부착-파이로포스페이트 또는 발광-기질-부착-이탈기는 각각의 루시퍼라제와 조합될 수 있다.
특정 실시형태에서, PPi 발광-기질-부착-이탈기는 PPi-LS, PPi-C; 또는 PPi-FMNH2로부터 선택된다. 추가 실시형태에서, 뉴클레오타이드-접합체-유사체는 고유 발광 신호를 갖는다. 특정 실시형태에서, 발광 신호는 250㎚ 내지 750㎚ 범위로부터 선택된 파장이다. 다른 실시형태에서, 발광 신호는 411, 417, 428, 440, 484 및 509㎚로 이루어진 군으로부터 선택된 파장이다.
또한, 사슬-연장 세트가 길어지는 핵산 가닥의 주형 지시 합성에 혼입될 수 있도록, 적어도 4개의 별도의 데옥시리보뉴클레오타이드(dNTP)를 포함하는 뉴클레오타이드-접합체-유사체의 사슬-연장 세트가 본 명세서에 제공된다. 일 실시형태에서, 폴리머라제가 주형 DNA에 상보성인 가닥에 변형된 데옥시리보뉴클레오사이드 트라이포스페이트(dNTP) 뉴클레오타이드-접합체-유사체를 혼입시킬 때마다, 부착된 각각의 뉴클레오타이드에 특이적인 발광 신호가 생성되도록, 각각의 dNTP, 또는 이의 유사체는 다른 dNTP에 비해서 상이한, 고유 발광 기질을 이용하여 변형된다. 다른 실시형태에서, 변형된 dTTP와 dUTP 유사체가 둘 다 반응에서 사용된다면, 이들은 각각 이에 부착된 동일한 발광 기질을 가져서, 동일한 파장 신호를 생성할 수 있거나; 또는 각각은 이들에 부착된 개별 발광 기질을 가질 수 있다.
특정 실시형태에서, dNTP는 dATP, dTTP, dGTP, dCTP 및 dUTP, dATPαS, dGTPαS, dCTPαS, dTTPαS 및 dUTPαS로 이루어진 군으로부터 선택된다. 추가 실시형태에서, 발광-기질은 코엘렌테라진, FMNH2 또는 이의 유사체로부터 선택된다. 또한 추가 실시형태에서, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트는 코엘렌테라진-dNTP 접합체 1(도 7); 코엘렌테라진-dNTP 접합체 2(도 8); 또는 코엘렌테라진-dNTP 접합체 3(도 9)으로부터 선택될 수 있다.
도 1A는 동일한 발광 효소에 의해 촉매된 각 뉴클레오타이드에 대해 4가지 상이한 발광-기질 유사체를 이용하는 본 발명의 서열분석의 한 가지 예시적인 실시형태의 일반적 예시를 도시한 도면.
도 1B는 4가지 상이한, 각각의 발광 효소에 의해 촉매되는 각 뉴클레오타이드에 대해 4가지 상이한 발광-기질 유사체가 있도록, 각 뉴클레오타이드에 대해 4가지 상이한 발광-기질-효소 시스템을 이용하는 본 발명의 서열분석 방법의 한 가지 예시적인 실시형태의 일반적 예시를 도시한 도면. 또한 4가지 변형된 뉴클레오타이드(예를 들어, A, T, G 및 C)에 대한 4가지 상이한 발광-기질 유사체에 대해 2 또는 3가지의 상이한 발광-기질-효소만을 이용하는 추가적인 실시형태가 상정된다.
도 2A는 코엘렌테라진 유사체 및 레닐라 루시퍼라제 또는 가우시아 루시퍼라제(Gaussia Luciferase) 중 하나 또는 둘 다를 이용하는 본 발명의 서열분석 방법의 한 가지 예시적인 실시형태의 일반적 예시를 도시한 도면: DNA 폴리머라제는 주형 가닥(예를 들어, dNTP-C1)에 대한 빌딩 블록으로서 각각의 코엘렌테라진 발광 기질에 의해 변형된 dNTP를 사용한다. 폴리머라제에 대한 결합 시, 코엘렌테라진 발광-기질(예를 들어, 발광-기질-부착-이탈기 또는 PPi-C1)을 함유하는 파이로포스페이트는 이후 반응을 위해 절단된다.
도 2B는 주형 가닥에 부착된 코엘렌테라진 유사체 발광-기질을 갖는 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합, 및 부착된 코엘렌테라진 유사체(PPi-C1)(이는 다음에 루시퍼라제(예를 들어, 레닐라 루시퍼라제, 가우시아 루시퍼라제 등)와 상호작용함)를 갖는 파이로포스페이트-C1 이탈기(예를 들어, 발광-기질-부착-이탈기)의 절단을 나타낸다.
도 2C는 본 명세서에 제시된 발광 반응을 위한, 시약, 발광-기질-부착-이탈기(PPi-C1) 및 레닐라 및/또는 가우시아 루시퍼라제를 도시한 도면. 발광 반응에서의 이들 시약의 상호작용을 나타내며, 이로부터 코엘렌테라진-부착-파이로포스페이트(PPi-C1)는 발광될 것이다. 뉴클레오타이드의 각 유형이 해당되는 각 염기에 상응하는 고유 발광 신호를 생성하도록, 뉴클레오타이드-접합체-유사체 dNTP의 각 유형에 대한 고유 발광 기질(예를 들어, 코엘렌테라진 또는 플라빈 유사체)이 있다.
도 3A는 플라빈 모노뉴클레오타이드 유사체(FMNH2 유사체) 및 박테리아 루시퍼라제를 이용하는 본 발명의 서열분석 방법의 한 가지 예시적인 실시형태의 일반적 예시를 도시한 도면: DNA 폴리머라제는 주형 가닥(예를 들어, dNTP-FMNH2)에 대한 빌딩 블록으로서 각각의 코엘렌테라진 발광 기질에 의해 변형된 dNTP를 사용한다. 폴리머라제에 대한 결합 시, 코엘렌테라진 발광-기질(예를 들어, 발광-기질-부착-이탈기 또는 PPi-FMNH2)을 함유하는 파이로포스페이트는 이후 반응을 위해 절단된다.
도 3B는 주형 가닥에 부착된 플라빈 모노뉴클레오타이드 유사체(FMNH2 유사체) 발광 기질을 갖는 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 및 부착된 FMNH2 유사체(PPi-FMNH2)(다음에 박테리아 루시퍼라제 등과 상호작용함)를 갖는 파이로포스페이트-FMNH2 이탈기(예를 들어, 발광-기질-부착-이탈기)의 절단을 나타낸다.
도 3C는 본 명세서에 제시된 발광 반응을 위한, 시약, 발광-기질-부착-이탈기(PPi-FMNH2) 및 박테리아 루시퍼라제를 도시한 도면. 발광 반응에서의 이들 시약의 상호작용을 나타내며, 이로부터 FMNH2-부착-파이로포스페이트(PPi-FMNH2)는 발광될 것이다. 뉴클레오타이드의 각 유형이 해당되는 각 염기에 상응하는 고유하게 검출 가능한 발광 신호를 생성하도록, 뉴클레오타이드-접합체-유사체 dNTP의 각 유형에 대한 고유 발광 기질(예를 들어, 코엘렌테라진 또는 플라빈 유사체)이 있다.
도 4는 코엘렌테라진의 대규모 합성을 위한 예시적인 전략을 도시한 도면.
도 5는 코엘렌테라진 유사체-1의 합성을 도시한 도면.
도 6은 코엘렌테라진 유사체-2의 합성을 도시한 도면.
도 7은 코엘렌테라진-dNTP 접합체-1의 합성을 도시한 도면.
도 8은 코엘렌테라진-dNTP 접합체-2의 합성을 도시한 도면.
도 9는 코엘렌테라진-dNTP 접합체 1, 2 및 3의 합성을 도시한 도면.
도 10A는 액적에 상응하는 가둠 영역(confinement area)에 LASH 반응 시약을 가두는 실시형태를 나타내며; 복수의 폴리머라제 및 복수의 프라이머를 갖는 서열 혼합물에서 단일 표적 핵산 주형을 나타내는 도면.
도 10B은 액적에 상응하는 가둠 영역에 LASH 반응 시약을 가두는 실시형태를 나타내고; 단일 표적 핵산 주형만이 서열분석되도록, 복수의 표적 핵산 주형, 복수의 폴리머라제 및 단일 프라이머를 갖는 서열 혼합물을 나타내는 도면.
도 10C는 액적에 상응하는 가둠 영역에 LASH 반응 시약을 가두는 실시형태를 나타내며; 복수의 폴리머라제를 갖는 서열 혼합물에서 단일 자기-프라이밍 표적 핵산 주형을 나타내는 도면.
도 11A는 표적 주형 핵산의 후속 결합을 위해, 프라이머가 고체 표면 기질에 부착되는 입체배치를 도시한 도면.
도 11B는 프라이머의 후속 결합을 위해, 표적 핵산 주형이 고체 표면 기질에 부착되는 입체배치를 도시한 도면.
도 12A는 단일 표적 핵산 주형 상의 복수의 폴리머라제를 이용하는 본 발명의 서열분석 방법을 개시하는 실시형태를 도시한 도면.
도 12B는 상보성 가닥 합성을 시작하는 폴리머라제가 전형적인 판독 길이를 횡단한 다음에, 주형으로부터 떨어지거나 분리되기 때문에 표적 주형의 서열분석이 실질적으로 연속적인 경우, 반응 혼합물에서 다수의 다른 폴리머라제의 다른 하나는 주형에 즉시 결합하고, 상보성 가닥 서열분석 합성을 계속하는, 실시형태를 도시한 도면.
도 13은 수많은 동일한 프라이머가 단일 전체 반응 챔버에서, 또는 개개의 개별 반응 챔버에 있을 수 있는 개별 좌위에서 각각 기재에 결합하는 실시형태를 도시한 도면. 이들 프라이머는 본질적으로 동일한 표적 주형 핵산에 결합한다.
도 14는 수많은 상이한(상호 배타적) 프라이머가 단일 전체 반응 챔버에서, 또는 개개의 개별 반응 챔버에 있을 수 있는 개별 좌위에서 각각 기재에 결합하는 실시형태를 도시한 도면. 이들 프라이머는 상이한, 상호 배타적인 표적 주형 핵산에 결합한다.
도 15는 주형 가닥에 dNTP를 혼입시키는 생화학적 과정의 간단한 개략도를 보여준다.
도 16A는 플라빈 모노뉴클레오타이드 유사체(FMNH2 유사체) 및 박테리아 루시퍼라제를 이용하는 본 발명의 서열분석 방법의 한 가지 예시적인 실시형태의 일반적 예시를 도시한 도면.
도 16B는 주형 가닥에 부착된 플라빈 모노뉴클레오타이드 유사체(FMNH2 유사체) 발광 기질을 갖는 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 및 부착된 FMNH2 유사체(PPi-FMNH2)(다음에 박테리아 루시퍼라제 등과 상호작용함)를 갖는 파이로포스페이트-FMNH2 이탈기(예를 들어, 발광-기질-부착-이탈기)의 절단을 나타낸다.
도 16C는 발광-기질-부착-이탈기(PPi-FMNH2)가 본 명세서에 제시된 발광 신호전달 반응에서 박테리아 루시퍼라제에 의해 산화되는(FMN*에 의해 도시) 산화환원효소/루시퍼라제 신호 증폭 루프의 시작을 나타내는 도면.
도 16D는 산화된 발광 기질 FMN*이 파이로포스페이트 이탈기 상의 FMNH2로 다시 환원되어 도 16C의 발광 반응으로 루프 백(loop back)됨으로써, 산화환원효소/루시퍼라제 효소 루프를 완료하는, 산화환원효소 반응을 나타낸 도면.
본 명세서에는 핵산 주형을 서열분석하는 방법이 제공되며, 상기 방법은 하기 단계들을 포함한다:
(i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 및 프라이머, 및 (iv) 길어지는 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는 서열분석 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 상이한 발광-기질을 가지며, 발광-기질-부착-이탈기는 주형 가닥에 대한 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 시 절단되는, 서열분석 혼합물을 제공하는 단계;
복수의 뉴클레오타이드-접합체-유사체가 주형에 순차적으로 첨가되어: a) 뉴클레오타이드-접합체-유사체가 폴리머라제와 회합하고, b) 해당 뉴클레오타이드-접합체-유사체 상의 발광-기질-부착-이탈기가 폴리머라제에 의해 절단될 때 뉴클레오타이드-접합체-유사체는 폴리머라제에 의해 주형 가닥에 혼입되되, 발광-기질-부착-이탈기는 발광 반응에서 발광-효소와 조합되고, 발광-기질은 제한된 기간 동안 뉴클레오타이드-특이적-발광을 생성되도록 발생-효소에 의해 촉매되게, 핵산 합성을 수행하는 단계; 및
핵산 합성이 일어나는 동안 뉴클레오타이드-특이적-발광 신호(광)를 검출하고, 주형 핵산의 서열을 결정하기 위해 각각의 개별 발광 기간 동안 검출된 뉴클레오타이드-특이적-발광 신호를 이용하는 단계.
본 명세서에 사용되는 바와 같은 어구 "발광 효소" 또는 이의 문법적 변형, 예를 들어, "발광 효소" 등은 발광 반응에서 발광-기질-부착-이탈기(즉, PPi-LS) 내의 발광 기질(또는 발광 기질)을 촉매할 수 있는 임의의 분자 또는 효소를 지칭한다. 발광-기질과 발광성-기질뿐만 아니라 발광 효소와 발광성 효소가 본 명세서에서 상호 호환적으로 사용된다. 본 명세서에 사용하기 위한 예시적인 발광 효소는 루시퍼라제, 예를 들어, 해양 또는 박테리아 루시퍼라제 등을 포함한다. 다른 실시형태에서, 예시적인 발광 효소는 발광단백질(photoprotein), 예컨대, 에쿠오린(aequorin), 오블린(obelin) 등을 포함한다. 예를 들어, 코엘렌테라진이 발광-기질로서 사용되는 일 실시형태에서, 해양 루시퍼라제, 예를 들어, 레닐라 루시퍼라제, 가우시아 루시퍼라제 등; 또는 이의 임의의 조합물이 루시퍼라제 반응에 사용된다. 코엘렌테라진을 이용하는 다른 실시형태에서, 발광단백질, 예를 들어, 에쿠오린, 오블린 등; 또는 이의 임의의 조합물이 반응 혼합물에서 사용된다. 또한 전체 발광 반응이 각각의 고유 변형된 뉴클레오타이드-접합체-유사체와 각각의 발광 신호(예를 들어, 스펙트럼)를 구별할 수 있다면, 루시퍼라제 반응에서 루시퍼라제와 발광단백질의 임의의 조합물의 용도가 본 명세서에 상정된다.
다른 실시형태에서, FMNH2가 발광-기질로서 사용될 때, 적합한 발광 효소는 비브리오(Vibrio) 및 포토박테리움(Photobacterium)을 포함하는 다양한 박테리아 ㅏ속으로부터 일반적으로 얻어지는 박테리아 루시퍼라제이다. 더 구체적으로, 본 명세서에서 사용하는 데 적합한 생물발광 루시퍼라제 종은, 예를 들어, 비브리오 하베이(Vibrio harveyi), 비브리오 피셔리(Vibrio fischeri)(Millipore로부터 상업적으로 입수 가능, SIGMA), 포토박테리움 피셔리(Photobacterium fischeri), 포토박테리움 포스포레움(Photobacterium phosphoreum), 포토박테리움 레이오그나티(P. leiognathi), 포토하두스 루미네센스(P. luminescens) 등으로부터 얻어진 것을 포함한다.
본 명세서에 사용되는 바와 같은 어구 "발광 기질", "발광성 기질" 또는 이의 문법적 변형은 해당되는 변형된 뉴클레오타이드가 연장 핵산 가닥에 혼입될 때, 발광 반응의 결과로서 발광 효소의 존재 하에 발광 신호가 생성되도록, 뉴클레오타이드 상의 임의의 위치에 부착될 수 있는 임의의 분자 또는 모이어티를 지칭한다. 본 명세서에 사용하기 위한 적합한 발광 기질은 코엘렌테라진 및 이의 유사체, 플라빈 모노뉴클레오타이드(FMNH2) 또는 이의 유사체, 루미놀, 아이소루미놀 및 이들의 유도체, 아크리디늄 유도체, 다이옥세탄, 퍼옥시옥살산 유도체 등을 포함한다.
코엘렌테라진은 레닐라 레니포미스 루시퍼라제(Rluc), 가우시아 루시퍼라제(Gluc)를 비롯한, 해양 루시퍼라제, 및 에쿠오린 및 오블린을 비롯한 발광단백질의 품종에 의해 촉매된 생물발광에 관련된 기질이다. 코엘렌테라진에 의해 제공된 한 가지 중요한 이점은 루시퍼라제 반응에서 보조인자로서 ATP를 필요로 하지 않는다는 것이며, 이는 반딧불이 및 방아벌레 루시퍼라제와 같은 다른 루시퍼라제의 보조인자 요건과 상이하다. 코엘렌테라진에 의해 제공되는 다른 이점은 이의 생물발광 광 스펙트럼이 화학적 변형에 의해 조절될 수 있다는 것이다. 따라서, 발광 기질로서 본 명세서에서 사용하기 위한 적합한 코엘렌테라진 유사체는 Molecular Probes(오리건주 유겐), Biotium(캘리포니아주 프레몬트 소재) 등을 포함하는 다양한 공급원으로부터 상업적으로 입수 가능하다. 예를 들어, C-2944(네이티브); C-14260(코엘렌테라진 cp); C-6779(코엘렌테라진 f); C-6780(코엘렌테라진 h); C-14261(코엘렌테라진 hcp); C-6776(코엘렌테라진 n)을 포함하는 Molecular Probes(오리건주 유겐)로부터 입수 가능한 코엘렌테라진 유사체. Biotium으로부터 입수 가능한 코엘렌테라진 유사체는 카탈로그 번호: No. 10110(천연 코엘렌테라진); No. 10124(코엘렌테라진 400a); No. 10112(코엘렌테라진 cp); No. 10114(코엘렌테라진 f); No. 10117(코엘렌테라진 fcp); No. 10111(코엘렌테라진 h); No. 10113(코엘렌테라진 hcp); No. 10121(코엘렌테라진 i); 10116(코엘렌테라진 ip); No. 10122(메틸 코엘렌테라진, 2-메틸 유사체); No. 10115 (코엘렌테라진 n); 등을 포함한다. 레닐라 루시퍼라제에 의한 이들 코엘렌테라진 유사체의 발광 특성에 대해 표 1을 참조한다.
Figure pct00001
광단백질 에쿠오린에 의한 이들 코엘렌테라진 유사체의 발광 특성에 대해 표 2를 참조한다.
Figure pct00002
본 명세서에서 사용하기 위한 다른 적합한 코엘렌테라진 유사체는 문헌[Jiang et al., Photochem. Photobiol. Sci. 2016, 15, 4660480]의 화합물 1 내지 120으로서 제시되고; 문헌[Jiang et al., Org. Biomol. Chem. 2017, 15, 7008-7018]에서 DeepBlueC, 및 화합물 B1 내지 B12로서 제시되고; 문헌[Lindberg et al., Chem. Sci., 2013, 4, 4395-4400]에서 화합물 CoelPhos, 2-Bno-TEG-CTZ, 및 6-BnO-TEG-CTZ로서 제시되며; 이들 각각은 모든 목적을 위해 이들의 전문이 참조에 의해 원용된다.
박테리아 루시퍼라제는 산소(O2) 및 환원 지방산(RCHO)을 이용하여 FMNH2의 산화를 촉매하고, 문헌[Mitchell et al., J. Biol. Chem., Vol. 244, No. 10, 2572-2576 (1969)]에 제시된 잘 공지된 메커니즘을 이용하여 플라빈 모노뉴클레오타이드(FMN) 및 지방산(RCOOH)의 산화 형태의 유사체를 방출한다. 최종 전자 억셉터로서 작용하는 대신, 산소가 광을 생성하기 위해 효소 루시퍼라제 및 FMNH2와 상호작용한다는 것을 제외하고, 분자 산소는 호기적 호흡에서 전자 수송 시스템의 일부를 연상시키는 반응에서 소모된다. 새로운 뉴클레오타이드가 핵산 주형 가닥에 부착될 때마다 단명 발광이 이 과정의 결과로서 생성된다. FMN이 발광에서 스펙트럼 이동을 초래하는 다양한 기능화를 수용한다는 것이 발견되었다. 예를 들어, 문헌[Mitchell et al., J. Biol. Chem., Vol. 244, No. 10, 2572-2576 (1969); Salzmann et al., J. Phys. Chem. A 2009, 113, 9365-9375; Eckstein et al., Biochemistry, 1993, 32, 404-4111] 등에 제시된 플라빈 모노뉴클레오타이드 유사체를 참조하며; 이런 논문 참고문헌 각각은 본 명세서에 모든 목적을 위해 이들의 전문이 참조에 의해 원용된다. 본 명세서에 사용하기 위한 당업계에 공지된 예시적인 플라빈 모노뉴클레오타이드 유사체는: 1-데아자리보플라빈; 5-데아자리보플라빈; 7,8-다이데메틸-아이소프로필리보플라빈; 8-아이소프로필리보플라빈; 8-치환된 3,7,10-트라이메틸아이소알록스-아진, 3-메틸-루미플라빈, 3,7,10-트라이메틸아이소알록스아진, 및 3,7-다이메틸-8-메톡시-10-에틸아이소알록스아진; 3-메틸-4a,5-프로파노-4a,5-다이하이드로아이소알록스아진; 3.7.10-트라이메틸-4a,5-프로파노-4a,5-다이하이드로아이소알록스-아진; 3.7.10-트라이메틸-8-클로로-4a,5-프로파노-4a,5-다이하이드로-아이소알록스아진; 3.7.10-트라이메틸-8-메톡시-4a,5-프로파노-4a,5-다이-하이드로아이소알록스아진 및 3,7,10-트라이메틸-8-아미노-4a,5·프로파노-4a,5-다이하이드로아이소알록스아진; FAD; 리보플라빈; 아이소-FMN; 2-티오-FMN; 2-몰폴리노, 2-데옥시 FMN; 2-(베타-하이드록시에틸 아미노)-FMN; 3-아세틸-FMN; 2-페닐이미노-FMN; 아이소리보플라빈; 테트라아세틸아이소리보플라빈; 루미플라빈-3-아세트산; 뉴트럴 레드(Neutral red); 등을 포함한다.
일 실시형태에서, FMNH2의 각 유사체가 부착되는 뉴클레오타이드 유형에 특이적으로 상응하는, 발광 반응에서 상이한 뉴클레오타이드-특이적-발광 스펙트럼(예를 들어, 파장 신호)을 갖도록, FMNH2의 상이한 유사체는 4 또는 5개의 뉴클레오타이드(예를 들어, dNTP) 각각에 부착된다. 다시 말해서, 각 뉴클레오타이드는 상이한 FMN 유사체에 의해 변형되어, 박테리아 루시퍼라제와 상호작용 시 뉴클레오타이드에 특이적인 상이한 발광 스펙트럼을 야기할 수 있다. FMNH2는 하나의 말단에 포스페이트 기를 갖고, 이 기는 특정 뉴클레오타이드의 포스페이트 쇄에 대한 말단기로서 부착될 수 있다. 당업자는, 이것이 ATP 신타제 등과 같은 효소를 이용하여 화학적으로 또는 효소적으로 행해질 수 있다는 것을 인식할 것이다.
본 명세서에 사용된 "서열분석 혼합물"이라는 어구는 본 발명의 단일 분자 서열분석 반응을 수행하는 데 사용되는 성분을 지칭한다. 일 실시형태에서, 서열분석 혼합물은 (i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 및 프라이머, 및 (iv) 길어지는 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는 서열분석 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 상이한 발광-기질을 갖는다.
본 발명에 따르면, 사용된 서열분석 혼합물은 본 발명의 서열분석 방법에서 이전의 서열분석 방법에 비해 다음과 같은 이점을 제공한다: 사용된 폴리머라제가 이의 이상적인 상태에서 기능한다는 점; 폴리머라제 효소를 변형시킬 필요가 없는 점; 높은 뉴클레오타이드(예를 들어, dNTP) 농도의 사용이 최적의 효율을 초래한다는 점; 폴리머라제 효소의 변성을 유리하게 감소시키는 발광 반응을 통해 검출 가능한 광 신호의 매우 낮은 강도, 별개 및 제한된 기능을 생성한다는 점; 염기 호출의 특이성 및 민감성을 개선시키는 배경을 본질적으로 제공하지 않는다는 점(또는 매우 낮게 제공한다는 점); 정교한 광학장치 또는 나노구조 칩 설계를 필요로 하지 않고, 이것이 비용을 감소시킨다는 점. 본 발명의 방법은 또한 높은 특이성을 제공하며, 이는 높은 적용범위에 대한 필요를 감소시킨다. 단명 신호가 사건마다 연속적으로 생성되기 때문에, 이 접근은 하나의 폴리머라제 분자에만 의존하지 않는다. 따라서, 폴리머라제가 몇몇 연속적인 염기 부착(예를 들어, 10, 100, 1,000 또는 1,000,000개의 연속적 염기 부착) 후에 주형 올리고뉴클레오타이드로부터 떨어진다면, 새로운 폴리머라제가 이전 폴리머라제가 떨어진 곳에 결합하여, 염기를 계속해서 부착한다. 이런 방법으로, 판독-길이는 사실상 제한되지 않는다. 이 접근에 의해, 전체 유전자 길이(몇 10Kb) 또는 몇 개의 유전자 길이(몇 100 Kb) 또는 심지어 몇 Mb와 같은 큰 세그먼트에 걸쳐있는 판독 길이가 가능하다. 이는 새로운 적용을 가능하게 할 뿐만 아니라 선행 기술 방법에 비해서 필요한 컴퓨터 처리를 극적으로 감소시킨다.
본 명세서에 사용되는 바와 같은 어구 "폴리머라제-발광 시약 용액" 또는 이의 문법적 변형 또는 "시약 용액"은 증가하는 핵산의 주형 지시 합성, 및 발광 반응을 수행하는 데 필요한 성분의 혼합물을 지칭한다. 일 실시형태에서, dNTP는 발광-기질로서 코엘렌테라진 및/또는 코엘렌테라진 유사체에 의해 변형된다. 본 실시형태에서, 폴리머라제, 예를 들어, DNA pol I 및 발광-효소와 함께 사용하기 위한 폴리머라제-발광 시약 용액은 해양 루시퍼라제(예를 들어, 레닐라 레니포미스 루시퍼라제(Rluc), 가우시아 루시퍼라제(Gluc) 등) 및 적합한 농도의 변형된 dNTP 유사체, 예를 들어, 본 명세서에 기재된 코엘렌테라진-변형 뉴클레오타이드-접합체-유사체를 포함한다. 일부 실시형태에서, 뉴클레오타이드-접합체-유사체는 4개 이상의 포스페이트를 가질 수 있고, 코엘렌테라진 유사체는 말단의 포스페이트에 부착된다. 예를 들어, 코엘렌테라진 유사체가 말단의 포스페이트에 부착된, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 포스페이트를 갖는 뉴클레오타이드-접합체-유사체가 본 명세서에 상정된다.
다른 실시형태에서, dNTP는 발광-기질로서 플라빈 모노뉴클레오타이드(FMNH2)의 환원 형태의 유사체에 의해 변형된다. 특정 실시형태에서, 플라빈 모노뉴클레오타이드 또는 이의 유사체는 데옥시뉴클레오타이드의 말단 포스페이트에 부착된다. 본 실시형태에서, 폴리머라제, 예를 들어, DNA pol I, 및 발광-효소와 함께 사용하기 위한 폴리머라제-발광 시약 용액은 박테리아 루시퍼라제 및 적합한 농도의 변형된 dNTP 유사체, 예를 들어, 본 명세서에 기재된 FMNH2-변형 뉴클레오타이드-접합체-유사체를 포함한다. 상기 제시한 바와 같이, 일부 실시형태에서, 뉴클레오타이드-접합체-유사체는 4개 이상의 포스페이트를 가질 수 있고, FMNH2 유사체는 말단의 포스페이트에 부착된다. 예를 들어, FMNH2 유사체가 말단의 포스페이트에 부착된, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 포스페이트를 갖는 뉴클레오타이드-접합체-유사체가 본 명세서에 상정된다.
본 명세서에 상정된 다른 실시형태에서, 해당되는 변형된 dNTP 유사체가 연장 서열 내로 혼입될 때, 발광 기질이 뉴클레오타이드-특이적-발광 반응을 겪어서 뉴클레오타이드-특이적-발광 신호를 생성하도록 발광 효소와 조합될 수 있는 경우에, 발광 기질은 각각의 dNTP 상의 임의의 다른 위치에 부착될 수 있다. 다른 실시형태에서, 발광 기질에 부착되기에 적합한 dNTP 상의 다른 위치는 염기 및 당을 포함한다.
본 명세서에 사용되는 바와 같은 어구 "발광 반응"은 방출체 온도로부터 에너지를 모두 유도하지 않거나, 또는 단독으로 유도하는 광 방출(즉, 강렬한 광 이외의 광의 방출)을 생성할 수 있는 임의의 반응을 지칭한다. 발광은 화학적 반응, 전기 에너지, 아원자(subatomic) 움직임 또는 결정 상의 응력에 의해 야기될 수 있다. "발광"은 형광, 인광, 열발광, 화학발광, 전기발광 및 생물발광을 포함하지만, 이들로 제한되지 않는다. "발광성"은 발광을 나타내는 물체를 지칭한다. 특정 실시형태에서, 광은 가시광선이다. 그러나, 본 발명은 가시광선으로 제한되지 않지만, 임의의 주파수의 전자기 복사를 포함한다. 특정 실시형태에서, 본 명세서에서 사용되는 발광 반응은 발광을 생성하기 위해 발광-기질, 예를 들어, 코엘렌테라진 또는 이의 유사체 또는 플라빈 모노뉴클레오타이드(FMNH2) 또는 이의 유사체를 촉매하는 발광 효소, 루시퍼라제(예를 들어, 해양 또는 박테리아 루시퍼라제)에 의해 야기된다.
예를 들어, 일 실시형태에서, 본 명세서에 상정된 반복적 서열분석 주기는 발광-기질-부착-이탈기(LSALG 또는 PPi+LS)의 생성을 초래하는 제1 dNTP 혼입 반응을 수반한다. 제2 반응에서, 발광 반응, 루시퍼라제는 광을 생성하기 위해 LSALG를 촉매한다. 따라서, 각각의 dNTP 유사체가 혼입된 후에, 광의 양자는 용액 중 발광-기질-부착 파이로포스페이트(PPi + C 또는 PPi + FMNH2)의 각 분자에 대해 생성된다. 본 발명은 사용되는 루시퍼라제 유형으로 제한되지 않는다. 특정의 개시된 실시형태가 해양 또는 박테리아 루시퍼라제를 이용하지만, 본 명세서에 기재된 발광-기질을 촉매할 수 있는 당업계에 공지된 임의의 루시퍼라제는 개시된 방법에서 사용될 수 있다.
본 명세서에 사용된 "폴리머라제 효소"는 핵산 합성을 수행하는데 역할을 하는 잘 알려진 단백질을 의미한다. 본 명세서에서 사용하기에 바람직한 폴리머라제 효소는 DNA 폴리머라제이다. 천연 폴리머라제 매개 핵산 합성에서, 폴리머라제 효소, 주형 핵산 서열 및 합성 과정의 개시점으로 작용하는 프라이밍 서열 간에는 복합체가 형성된다. 합성 동안, 폴리머라제는 반응 혼합물로부터 뉴클레오타이드 단량체를 샘플링하여 주형 서열의 다음 염기에 대한 상보성을 결정한다. 샘플링된 염기가 다음 염기에 상보성이면, 성장하는 발생기 가닥에 혼입된다. 이 과정은 주형 서열의 길이를 따라 계속되어 그 주형을 효과적으로 복제한다. 간단한 개략적 방식으로 설명했지만, 실제 생화학적 혼입 과정은 비교적 복잡할 수 있다. 혼입 생화학의 도해적 표현은 도 15에 제공된다. 이 다이어그램은 뉴클레오타이드 혼입 메커니즘에 대한 완전한 설명은 아니다. 반응 과정 동안 폴리머라제 효소는 메커니즘에서 일련의 입체형태적 변화를 겪는다.
도 15에 도시된 바와 같이, 합성 과정은 단계 2에서 폴리머라제(P)에 대한 프라이밍된 핵산 주형(D)의 결합으로 시작한다. 복합체와의 뉴클레오타이드(N) 결합은 단계 4에서 일어난다. 단계 6은 개방 입체구조에서 폐쇄 입체구조까지의 폴리머라제의 이성질체화를 나타낸다. 단계 8은 뉴클레오타이드가 성장하는 가닥에 혼입되는 화학 단계이다. 단계 10에서, 폴리머라제 이성질체화는 폐쇄 위치로부터 개방 위치로 발생한다. 혼입 시 절단된 폴리포스페이트 성분은 단계 12에서 복합체로부터 방출된다. 이 도면은 파이로포스페이트의 방출을 보여주지만, 뉴뉴클레오타이드-접합체-유사체가 사용되는 경우 방출된 성분은 파이로포스페이트와 다를 수 있음을 이해해야 한다. 다수의 경우에, 본 발명의 시스템 및 방법은 방출된 성분이 발광-기질(예를 들어, 발광-기질-부착-이탈기 또는 PPi―LS)에 연결된 폴리포스페이트를 포함하도록, 말단 포스페이트 상에 발광-기질(예를 들어, 코엘란타라진, FMNH2 등)을 갖는 뉴클레오타이드-접합체-유사체를 사용한다. 천연 뉴클레오타이드 또는 뉴클레오타이드-접합체-유사체 기질을 사용하여 폴리머라제는 그 다음 단계 14에서 주형 상으로 전좌한다. 전좌 후 폴리머라제는 다른 뉴클레오타이드를 첨가하고 반응 순환을 계속하기 위한 위치에 있다.
본 명세서에서 사용하기에 적합한 폴리머라제 효소는 DNA 폴리머라제를 포함하며, 이는 다양한 계통발생적 관계에 기초하여 6가지 주요 그룹, 예를 들어 이콜라이(E. coli) Pol I(클래스 A), 이콜라이 Pol II(클래스 B), 이콜라이 Pol III(클래스 C), 에우리고균(Euryarchaeotic) Pol II(클래스 D), 인간 Pol 베타(클래스 X), 이콜라이 UmuC/DinB 및 진핵생물 RAD30/색소성 건피증 변이체(클래스 Y)로 분류될 수 있다. 명명법에 대한 검토에는 문헌[Burgers et al. (2001) "Eukaryotic DNA polymerases: proposal for a revised nomenclature" J Biol Chem. 276(47):43487-90]을 참조한다. 폴리머라제 검토를 위해서는, 예를 들어, 문헌[Hubscher et al. (2002) "Eukaryotic DNA Polymerases" Annual Review of Biochemistry Vol. 71: 133-163; Alba (2001) "Protein Family Review: Replicative DNA Polymerases" Genome Biology 2(1):reviews 3002.1-3002.4; 및 Steitz (1999) "DNA polymerases: structural diversity and common mechanisms" J Biol Chem 274:17395-17398]을 참조하며; 이들은 각각 전체가 본 명세서에 참조에 의해 원용된다. 많은 폴리머라제의 기본 작용 메커니즘은 결정되어 있다. 그야말로 수백 개의 폴리머라제의 서열이 공개적으로 이용 가능하며, 이들 중 많은 폴리머라제의 결정 구조가 결정되어 있거나, 또는 상동성 폴리머라제에 대한 해결된 결정 구조와의 유사성을 기반으로 하여 유추될 수 있다.
핵산 서열분석에 적합한 많은 이러한 폴리머라제는 용이하게 입수할 수 있다. 예를 들어, 인간 DNA 폴리머라제 베타는 R&D systems에서 입수할 수 있다. 본 명세서에서 사용하기에 적합한 DNA 폴리머라제로는 Epicenter, GE Health Care, Invitrogen, New England Biolabs, Promega, Roche Applied Science, Sigma Aldrich 및 기타 여러 업체로부터 입수 가능한 DNA 폴리머라제 I을 포함한다. DNA 폴리머라제 I의 클리나우(Klenow) 단편은, 예를 들어, Ambion, Chimerx, eEnzyme LLC, GE Health Care, Invitrogen, New England Biolabs, Promega, Roche Applied Science, Sigma Aldrich 및 기타 여러 업체로부터 재조합체 및 프로테아제 분해 버전 둘 모두로 입수 가능하다. PHI.29 DNA 폴리머라제는, 예를 들어, Epicentre에서 입수 가능하다. 폴리 A 폴리머라제, 역전사효소, 시쿼나제(Sequenase), SP6 DNA 폴리머라제, T4 DNA 폴리머라제, T7 DNA 폴리머라제 및 다양한 열안정성 DNA 폴리머라제(Taq, hot start, Titanium Taq 등)가 다양한 이들 공급원 및 기타 공급원으로부터 입수 가능하다. 다른 상업적인 DNA 폴리머라제로는 New England Biolabs로부터 입수 가능한 PhusionhM High-Fidelity DNA 폴리머라제; Promega로부터 입수 가능한 GoTaq.RTM. Flexi DNA 폴리머라제; Epicentre Biotechnologies로부터 입수 가능한 RepIiPHI.TM. .PHI.29 DNA 폴리머라제; Stratagene으로부터 입수 가능한 PfuUltra.TM. Hotstart DNA 폴리머라제; Novagen으로부터 입수 가능한 KOD HiFi DNA 폴리머라제; 기타 등등을 포함한다.
이용 가능한 DNA 폴리머라제 효소는 또한 예를 들어, 엑소뉴클레아제 활성을 감소시키거나 제거하기 위해(많은 천연 DNA 폴리머라제는 예를 들어, 서열분석 적용예를 방해하는 프루프-리딩 엑소뉴클레아제 기능을 가짐), 클리나우 단편 재조합체 등과 같은 프로테아제 분해된 효소 단편을 만들어 생산을 간단히 하기 위해서와 같이 임의의 다양한 방식으로 변형되었다. 언급한 바와 같이, 폴리머라제는 또한 폴리머라제-DNA-뉴클레오타이드 복합체에서 표지된 뉴클레오타이드의 특이성, 처리도의 개선 및 개선된 체류 시간을 부여하기 위해(예를 들어, Hanzel 등의 WO 2007/076057 POLYMERASES FOR NUCLEOTIDE ANALOGUE INCORPORATION 및 Rank 등의 WO 2008/051530 POLYMERASE ENZYMES AND REAGENTS FOR ENHANCED NUCLEIC ACID SEQUNCING), 분지 분율 및 전좌를 변경하기 위해(예를 들어, 2009년 9월 4일자로 Pranav Patel 등에 의해 "ENGINEERING POLYMERASES AND REACTION CONDITIONS FOR MODIFIED INCORPORATION PROPERTIES"라는 명칭으로 출원된 미국 특허 출원 일련 제12/584,481호), 광안정성을 증가시키기 위해(예를 들어, 2009년 3월 30일자로 Keith Bjornson 등에 의한 "Enzymes Resistant to Photodamage"라는 명칭의 미국 특허 출원 제12/384,110호) 및 표면-고정화 효소 활성을 개선시키기 위해(예를 들어, Hanzel 등에 의한 WO 2007/075987(ACTIVE SURFACE COUPLED POLYMERASES) 및 Hanzel 등에 의한 WO 2007/076057(PROTEIN ENGINEERING STRATEGIES TO OPTIMIZE ACTIVITY OF SURFACE ATTACHED PROTEINS)) 변형되었다. 이들 입수 가능한 임의의 폴리머라제는 분지화 분율 형성을 감소시키고 폐쇄된 폴리머라제-DNA 복합체의 안정성을 개선시키고, 및/또는 반응 속도 상수를 변경하기 위해 본 발명에 따라 변형될 수 있다.
분지화 분획을 감소시키거나 폐쇄된 복합체 안정성을 증가시키거나, 또는 반응 속도 상수를 변경하는 돌연변이에 바람직한 기질인 DNA 폴리머라제로는 Taq 폴리머라제, 엑소뉴클레아제 결손 Taq 폴리머라제, 이콜라이 DNA 폴리머라제 1, 클리나우 단편, 역전사효소, 야생형 PHI-29 폴리머라제를 비롯한 PHI-29 관련 폴리머라제 및 이러한 폴리머라제의 유도체, 예컨대 엑소뉴클레아제 결손 형태, T7 DNA 폴리머라제, T5 DNA 폴리머라제, RB69 폴리머라제 등을 포함한다.
또한, 폴리머라제는, 예를 들어, 2009년 3월 30일자로 출원된 미국 특허 출원 일련 번호 제12/384,110호에 교시된 바와 같이, 광안정성을 증가시키기 위해, 예를 들어, WO 2007/075987 및 WO 2007/076057에 교시된 바와 같이, 표면에 결합되었을 때 효소의 활성을 개선시키기 위해, 또는 인용된 문헌에 교시되고 본 기술분야에서 일반적인 것으로서 정제 또는 취급 태그를 포함하기 위해서와 같이 적용예-특이적 이유로 인해 추가로 변형될 수 있다. 유사하게, 본 명세서에 기재된 변형된 폴리머라제는 폴리머라제 성능을 개선하기 위한 다른 전략, 예를 들어, 2009년 3월 30일자로 "Two slow-step polymerase enzyme systems and methods"라는 명칭으로 출원된 미국 특허 출원 일련 번호 제12/414,191호에 교시된 바와 같은 폴리머라제 속도 상수를 제어하기 위한 반응 조건과 조합으로 이용될 수 있고, 상기 문헌의 전체 내용은 모든 목적을 위해 본 명세서에 참조에 의해 원용된다.
본 명세서에 사용된, "주형 핵산" 또는 "표적 주형 핵산"이란 어구는 임의의 적합한 폴리뉴클레오타이드, 예를 들어, 이중가닥 DNA, 단일가닥 DNA, 단일가닥 DNA 헤어핀, DNA/RNA 혼성체, 중합화 제제의 결합을 위한 인식 부위가 있는 RNA, 및 RNA 헤어핀을 지칭한다. 또한, 본 발명의 서열분석 방법에 사용하기 위한 주형 핵산으로 적합한 표적 폴리뉴클레오타이드는 인트론, 조절 영역, 대립유전자, 변이체 또는 돌연변이와 같은 세포 게놈의 특정 부분; 전체 게놈; 또는 이의 임의의 일부일 수 있다. 다른 실시형태에서, 표적 폴리뉴클레오타이드는 mRNA, tRNA, rRNA, 리보자임, 안티센스 RNA 또는 RNAi일 수 있다. 특정 실시형태에서, 예를 들어, 특정 표적을 서열분석하는 데 사용하기 위해 단일 폴리머라제만이 상정되는 경우, 표적 폴리뉴클레오타이드는 임의의 길이, 예컨대 약 10개 염기 내지 약 100,000개 염기까지, 약 10,000개 염기 내지 약 90,000개 염기까지, 약 20,000개 염기 내지 약 80,000개 염기까지, 약 30,000개 염기 내지 약 70,000개 염기까지, 약 40,000개 염기 내지 약 60,000개 염기까지 또는 그 이상일 수 있고, 전형적인 범위는 약 10,000 내지 50,000개 염기이다. 또한, 예를 들어, 특정 단일 폴리머라제 실시형태에서, 약 100개 염기 내지 10,000개 염기의 표적 주형 핵산 길이가 본 명세서에 상정된다. 또한 주형 핵산당 다중 폴리머라제를 이용하는 실시형태에서, 상기 제시한 주형 핵산 길이에 추가로, 주형 핵산 길이는 100,000개 초과의 염기, 100,000개의 염기 내지 1,000,000개, 1,000,000개의 염기 내지 1,000,000,000개의 염기, 또는 1,000,000,000개 초과의 염기일 수 있다는 것이 본 명세서에 상정된다.
따라서, 핵산 서열 판독-길이는 본 발명의 방법을 이용하여 서열분석 중인 주형 핵산의 전체 길이까지일 수 있기 때문에, 본 발명의 방법에 의해 달성된 염기쌍 판독-길이는 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000(즉, 1×106), 10000000(1×107), 100000000(1×108), 1000000000(1×109) 이상으로 이루어진 군으로부터 선택된다.
본 발명의 주형 핵산은 또한 PNA, 변형된 올리고뉴클레오타이드(예를 들어, 생물학적 RNA 또는 DNA에 전형적이지 않은 뉴클레오타이드를 포함하는 올리고뉴클레오타이드, 예를 들어 2'-O-메틸화 올리고뉴클레오타이드), 변형된 포스페이트 골격 등과 같은 비천연 핵산을 포함할 수 있다. 핵산은, 예를 들어, 단일 가닥 또는 이중 가닥일 수 있다.
본 명세서에 사용되는 바와 같은 용어 "프라이머"는 주형 핵산에 결합하기에 충분하고 핵산 합성 사슬-연장 반응 동안 효소 연장을 허용하는 임의의 길이를 포함하는 올리고뉴클레오타이드 분자를 지칭한다. 특정 실시형태에서, 프라이머는 약 12 내지 약 100개의 뉴클레오타이드 길이의 1개의 이어지는 가닥이며; 더 구체적으로는 12, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 70, 75, 80, 85, 90, 95 또는 100개 이상의 뉴클레오타이드 길이이다. 다른 실시형태에서, 프라이머는 100개의 뉴클레오타이드보다 길고, 예컨대, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950 또는 1,000개 이상의 뉴클레오타이드 길이이다. 특정 실시형태에서, 본 발명의 방법이 핵산 표적 검출을 위해 사용되는 경우에, 프라이머는 프라이머-프로브이다.
표적 핵산의 검출 방법
또한 하기 단계를 포함하는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법이 본 명세서에 제공된다:
(i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 샘플, (iv) 특정 표적 핵산 서열에 혼성화하는(예를 들어, 이에 상보성인) 프라이머-프로브, 및 (v) 길어지는 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는, 연장 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 동일 또는 상이한 발광-기질을 가지며, 발광-기질-부착-이탈기는 주형 가닥에 대한 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 시 절단되는, 연장 혼합물을 제공하는 단계;
프라이머-프로브가 표적 핵산 서열에 혼성화되는 경우, 복수의 뉴클레오타이드-접합체-유사체가 주형에 순차적으로 첨가되어: a) 뉴클레오타이드-접합체-유사체가 폴리머라제와 회합하고, b) 해당 뉴클레오타이드-접합체-유사체 상의 발광-기질-부착-이탈기가 폴리머라제에 의해 절단될 때 뉴클레오타이드-접합체-유사체는 폴리머라제에 의해 주형 가닥에 혼입되되, 발광-기질-부착-이탈기는 발광 반응에서 발광-효소와 조합되고, 발광-기질은 발광을 생성하도록 발생-효소에 의해 촉매되게, 핵산 연장 합성을 수행하는 단계; 및
핵산 합성이 일어나는 동안 발광으로부터 광을 검출하는 단계로서, 광의 검출은 특정 표적 핵산 서열의 존재를 나타내는, 검출하는 단계.
특정 실시형태에서, 표적 핵산의 양은 정량화된다. 일 실시형태에서, 표적 핵산의 양은 발광 강도에 기반하여 정량화된다. 특정 실시형태에서, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 동일한 발광-기질을 갖는다. 특정 실시형태에서, 복수의 폴리머라제 효소가 사용된다.
다른 실시형태에서, 1, 2, 3개 또는 모든 뉴클레오타이드-접합체-유사체는 동일한 발광-기질 유사체로 표지된다. 반응 연장 혼합물은 1개 이상의 주형 올리고뉴클레오타이드를 함유한다. 주형 핵산에 대한 프라이머-프로브의 결합 시 및 프라이머-주형 복합체에 대한 폴리머라제의 결합 시, DNA 쇄 연장 반응은 복합체 중 하나 이상에서 시작된다. 각 반응은 절단된 발광성 기질(예를 들어, PPi-LS; 발광-기질-부착-이탈기)의 일정한 스트림을 생성하고, 이는 발광 신호를 생성하는 발광선 반응으로 공급된다. 특정 실시형태에서, 생성된 발광 신호 강도는 프라이머-주형 쌍의 수와 상관관계가 있으며; 따라서, 해당 프라이머-주형 쌍의 존재를 검출 및 정량화하는 데 사용된다. 이런 특정 실시형태에서, 프라이머 서열은 주형 올리고뉴클레오타이드 상의 특정된 표적-상보성 서열의 존재를 검출하기 위해 프로브 서열로서 사용된다. 따라서, 서열 결정에 추가로, 중합효소 연쇄 반응 또는 마이클 어레이와 같은 다른 분자 생물학 방법에 대한 목표와 유사하게, 주형 올리고뉴클레오타이드 상의 특정 서열(세그먼트)의 검출 및/또는 정량화를 가능하게 하는 본 발명의 방법이 또한 본 명세서에 제공된다. 이러한 본 발명의 표적 검출 방법은 신속한 검출, 현장진단, 핵산 검출에서 유용하다.
또 다른 실시형태에서, 주형 가닥에 부착 또는 혼입되는 각 뉴클레오타이드(예를 들어, 뉴클레오타이드-접합체-유사체)에 대해 지속적 발광 신호를 생성하고, 따라서 발광 신호를 증폭시키는 데 사용될 수 있는 효소 루프가 생성된다(도 16 참조). 주형 핵산 가닥에 혼입되는 각 뉴클레오타이드-접합체-유사체에 의해, 생성된 총 발광에 추가로 새로운 효소 루프가 생성될 것이다. 이런 효소 루프 실시형태는 프로브(예를 들어, 프라이머-프로브)로서 프라이머 올리고뉴클레오타이드를 이용하는 특정 표적 핵산 서열 존재의 검출과 같은 적용에 특히 유리하다. 일 실시형태에서, 산화환원효소/루시퍼라제 루프로서 본 명세서에서 언급되는, 환원된 플라빈 모노뉴클레오타이드(또는 이의 유사체)가 뉴클레오타이드 중 1, 2, 3 또는 모두 4개의 말단 포스페이트(dNTP-FMNH2)에 부착된다. 폴리머라제에 의한 주형 가닥에 뉴클레오타이드-접합체-유사체를 혼입시킨 후에, 환원된 플라빈 모노뉴클레오타이드 유사체(PPi-FMNH2)에 부착된 파이로포스페이트는 발광-기질-부착-이탈기로서 방출되고, 이어서, 박테리아 루시퍼라제에 의해 산화되어 발광을 생성한다. 이런 특정 실시형태에서 사용되는 산화환원효소의 존재 하에, 산화된 플라빈 모노뉴클레오타이드 유사체(PPi-FMN*)는 산화환원효소에 의해 PPi-FMNH2로 환원되는 한편, 또한 다이하이드로니코틴아마이드-아데닌 다이뉴클레오타이드 포스페이트(NADPH)를 산화된 형태인 NADP+로 전환시킨다. 이는, 환원된 지방산(RCOOH)이 용액 중에서 완전히 고갈된다면, 계속되는 발광 반응 루프를 생성한다. 다른 실시형태에서, ATP를 소모함으로써 환원된 지방산을 추가로 재순환시키기 위해 지방산 환원효소를 추가로 포함할 수 있다.
본 명세서에서 사용되는 바와 같은 용어 "산화환원효소/루시퍼라제 루프" 또는 이의 문법적 변형은 일반적으로 산화환원효소와 루시퍼라제 사이에서 효소 루프로서 지칭되고(도 16C 내지 도 16D), 이에 의해 박테리아 루시퍼라제에 의해 촉매되는 환원된 플라빈 모노뉴클레오타이드 유사체(PPi-FMNH2)의 발광성 반응 후에, 산화환원효소는, 이어서, 형성된 산화된 플라빈 모노뉴클레오타이드 유사체(PPi-FMN*)를 다시 초기의 PPi-FMNH2로 환원시키고, 또한 다이하이드로니코틴아마이드-아데닌 다이뉴클레오타이드 포스페이트(NADPH)를 산화된 형태인 NADP+로 전환시킨다. 이는, 환원된 지방산(RCOOH)이 용액 중에서 완전히 고갈된다면, 계속되는 발광 반응 루프를 생성한다. 다른 실시형태에서, ATP를 소모함으로써 환원된 지방산을 추가로 재순환시키기 위해 지방산 환원효소는 반응 혼합물에 첨가될 수 있다. 이런 산화환원효소/루시퍼라제 효소 루프는 FMNH2-부착된-파이로포스페이트 이탈기로부터의 연속 신호를 생성하고, 이에 의해 가장 최근의 뉴클레오타이드의 효소 혼입으로부터 생성된 루시퍼라제 신호에 대한 증폭 메커니즘으로서 작용할 것이다.
본 명세서에 제시된 바와 같이, 도 16C로부터의 이런 파이로포스페이트(PPi-FMN*)는 산화환원효소/루시퍼라제 증폭 루프에서 도 16D에 제시된 반응을 통해 여러 번 루프 백된다. 파이로포스페이트(PPi-FMN*)가 각 뉴클레오타이드-유사체-접합체(dNTP) 혼입 사건에 대한 각 발광 신호를 증폭시키기 위해 루프 백될 수 있는 횟수는 적어도 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000 및 적어도 1000000회로 이루어진 군으로부터 선택될 수 있다.
본 명세서에 사용되는 바와 같은 용어 "프라이머-프로브"는 특정 표적 핵산 서열, 바람직하게는 조사 중인 알려지지 않은 핵산 샘플에서 특정 표적 핵산 서열을 식별하기 위한 프로브로서도 작용하는 사슬 연장을 개시할 수 있는 프라이머를 지칭한다. 온도 순환 및 변성이 없고, PCR과 같은 혼성화 주기가 존재하지 않기 때문에, 본 발명의 방법에서 사용될 수 있는 길이 및 서열에 관한 프로브 설계에서 상당한 유연성이 있다. 본 명세서에 제공된 본 발명의 방법에 의해, PCR에 필요한 2개의 프라이머를 이용하는 대신에 하나의 올리고뉴클레오타이드 프로브(예를 들어, 프라이머-프로브)를 설계하는 것으로 충분하다. 프라이머-프로브의 길이는, 주형 핵산 샘플 중에서 각각의 표적 핵산 서열에 정확하게 결합하는 한, 임의의 크기일 수 있다. 예를 들어, 프라이머에 대해 상기 제시한 길이에 추가로, 본 명세서에서 사용하기 위한 프라이머-프로브 길이의 다른 적합한 범위는 20 내지 100, 20 내지 90, 20 내지 80, 20 내지 70, 20 내지 60, 20 내지 50, 20 내지 40, 20 내지 30, 5 내지 100, 10 내지 100, 30 내지 100, 40 내지 100, 50 내지 100, 60 내지 100, 70 내지 100, 80 내지 100, 90 내지 100, 15 내지 150, 10 내지 200, 5 내지 300, 20 내지 200, 20 내지 300, 20 내지 400, 20 내지 500, 20 내지 600, 20 내지 700, 20 내지 800, 20 내지 900, 20 내지 1000, 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900 적어도 1000개의 뉴클레오타이드 염기로 이루어진 군으로부터 선택될 수 있다.
본 명세서에서 사용하는 데 적합한 프라이머-프로브 길이의 다른 범위는 5 내지 1000개의 염기, 10 내지 950, 15 내지 900, 20 내지 800, 25 내지 700, 30 내지 600, 35 내지 500, 40 내지 400, 50 내지 300, 25 내지 250, 25 내지 200, 25 내지 150, 25 내지 100, 25 내지 90, 25 내지 80, 25 내지 70, 25 내지 60, 25 내지 50개의 염기로 이루어진 군으로부터 선택될 수 있다. 다른 실시형태에서, 프라이머-프로브는 20 내지 100개 염기의 범위이다. 다른 실시형태에서, 당업자는 특이성을 증가시키기 위해 25, 30, 40, 45, 50, 55, 60, 65, 70, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 및 200개 이상의 염기로 이루어진 군으로부터의 프라이머-프로브 길이에 대해 더 긴 뉴클레오타이드 서열을 선택할 수 있다. 다른 실시형태에서, PCR에 의해, 약 20개 염기의 프로브 길이가 또한 본 명세서에서 사용을 위해 상정된다.
뉴클레오타이드-접합체-유사체
또한 본 명세서에서 데옥시리보뉴클레오타이드(dNTP), 또는 이의 유사체; 및 이에 부착된 발광-기질을 포함하는 뉴클레오타이드-접합체-유사체가 제공된다. 본 명세서에서 사용되는 어구 "뉴클레오타이드-접합체-유사체"(본 명세서에서 "발광-기질-뉴클레오타이드 접합체"로도 지칭됨)는 DNA 합성(예를 들어, 변형된 dNTP, 예컨대, dATP, dTTP, dGTP, dCTP 및 dUTP)에서 사용될 수 있는 발광-기질에 의해 변형된 임의의 뉴클레오타이드를 지칭한다. 일부 실시형태에서, 뉴클레오타이드-접합체-유사체 내의 뉴클레오타이드는 변형된 뉴클레오타이드 유사체이다. 본 발명에 사용하기 위한 뉴클레오타이드 유사체는 폴리머라제 및 선택적 절단 활성에 대한 기질이 될 수 있는 임의의 적합한 뉴클레오타이드 유사체일 수 있다. 뉴클레오타이드는 변형될 수 있고 여전히 폴리머라제 및 기타 효소의 기질로 사용될 수 있음은 밝혀져 있다. 뉴클레오타이드 유사체의 변이체가 고려되는 경우, 뉴클레오타이드 유사체와 폴리머라제 또는 엑소뉴클레아제 활성과 같은 다른 효소 활성과의 상용성은 활성 검정에 의해 결정될 수 있다. 활성 검정의 수행은 간단하고 본 기술분야에 잘 알려져 있다.
본 명세서에 제시된 본 발명의 특정 실시형태에서, 본 발명의 뉴클레오타이드-접합체-유사체는, 예를 들어, 증가되는 가닥에 혼입 시 절단되는 폴리포스페이트의 일부에 부착되는 발광성 기질과 함께 이의 폴리포스페이트 사슬에 3개 이상의 포스페이트를 갖는 뉴클레오사이드 폴리포스페이트일 수 있으며; 이는 발광-기질-부착-이탈기를 초래한다. 폴리포스페이트는 순수한 폴리포스페이트, 예를 들어, --O--PO3- 또는 파이로포스페이트(예를 들어, PPi)일 수 있고, 또는 폴리포스페이트는 치환을 포함할 수 있다. 유사체 및 이러한 유사체를 제조하는 방법에 관한 추가 세부사항은 미국 특허 제7,405,281호; 제9,464,107호 등에서 찾아볼 수 있고; 이들 문헌 전체가 모든 목적을 위해 본 명세서에 참조에 의해 원용된다.
본 발명의 다른 실시형태에서, 뉴클레오타이드-접합체-유사체를 형성하기 위해, 뉴클레오타이드 또는 이의 유사체는 말단의 포스페이트에 발광-기질(예를 들어, 코엘렌테라진, FMNH2 등)을 첨가함으로써 변형되므로(예를 들어, 본 명세서에 모든 목적을 위해 전문이 참조에 의해 원용되는 문헌[Yarbrough et al., J. Biol. Chem., 254:12069-12073, 1979] 참조), 발광-기질 뉴클레오타이드 접합체가 주형 가닥에 혼입될 때 PPi 발광-기질-부착-이탈기(예를 들어, PPi-LS, PPi-C; PPi-FMNH2 등)가 폴리머라제에 의해 생성되는 경우, 발광-기질-부착-파이로포스페이트(또는 발광-기질-부착-이탈기)는 각각의 루시퍼라제와 조합될 수 있다(도 1 내지 도 3 참조). dNTP에는 5가지 유형, 즉, 데옥시아데노신 트라이포스페이트(dATP), 데옥시구아노신 트라이포스페이트(dGTP), 데옥시사이티딘 트라이포스페이트(dCTP), 데옥시티미딘 트라이포스페이트(dTTP) 및 데옥시유리딘 트라이포스페이트(dUTP)가 있다. 이들 dNTP 중 넷 또는 다섯은 주형 지시 핵산 합성 반응에서 사용되어 주형 핵산 가닥에서 이의 보체(예를 들어, 아데닌, 구아닌, 사이토신 또는 티민)를 식별(즉, 호출)함으로써, 주형 핵산 가닥을 서열분석한다. dATP 대신에, dATPαS는 DNA 폴리머라제의 경우에 기질로서 작용하지만 루시퍼라제의 경우 기질로서 작용하기 때문에, dATP에 대한 치환체로서 사용될 수 있다.
각각의 변형된 뉴클레오타이드-접합체-유사체는, 이들이 폴리머라제 효소에 의해 상보성 가닥에 부착되는 동안에, 부착된 발광 기질로부터의 고유 발광 신호(예를 들어, 411, 417, 428, 440, 484, 509㎚ 등의 파장)를 생성한다. 일 실시형태에서, 고유 발광 신호는 250㎚ 내지 750㎚ 범위로부터 선택된 파장이다. 다른 실시형태에서, 고유 발광 신호는 411, 417, 428, 440, 484 및 509㎚로 이루어진 군으로부터 선택된 파장일 수 있다.
또한, 사슬-연장 세트가 길어지는 핵산 가닥의 주형 지시 합성에 혼입될 수 있도록, 적어도 4개의 별도의 데옥시리보뉴클레오타이드(dNTP)를 포함하는 뉴클레오타이드-접합체-유사체의 사슬-연장 세트가 본 명세서에 제공된다. dTTP 또는 dUTP 중 하나 또는 둘 다의 임의의 조합물은 서열 내 상보성 아데닌(ATP)을 호출(즉, 식별)하기 위해 핵산 합성 사슬 연장 반응에서 사용될 수 있다. 변형된 dTTP와 dUTP 유사체가 둘 다 반응에서 사용된다면, 이들은 각각 이에 부착된 동일한 발광 기질을 가져서, 동일한 파장 신호를 생성할 수 있거나; 또는 각각은 이들에 부착된 개별 발광 기질을 가질 수 있다.
본 명세서에 개시된 바람직한 실시형태에서, 각각의 dNTP, 또는 이의 유사체는 다른 dNTP에 비해서 상이한, 고유 발광성 기질(예를 들어, 코엘렌테라진 유사체, FMNH2 유사체 등)을 이용하여 변형되므로, 폴리머라제가 주형 DNA에 상보성인 가닥에 변형된 데옥시리보뉴클레오사이드 트라이포스페이트(dNTP) 뉴클레오타이드-접합체-유사체를 혼입할 때마다, 부착되는 각 뉴클레오타이드 부류 또는 유형에 특이적인 발광 신호(예를 들어, dATP, dATPαS, dTTP, dGTP 및 dCTP, 또는 당업계에 잘 공지된 다른 변형된 뉴클레오타이드 각각에 대한 고유 신호)가 생성된다. 본 명세서에사 사용하기 위해 상정된 다른 변형된 뉴클레오타이드는 문헌[Jordheim et al., Advances in the development of nucleoside and nucleotide analogues for cancer and viral diseases, Nat. Rev. Drug Discov. (2013) 12: 447-464; 및 Guo et al. Four-color DNA sequencing with 3'-O-nucleotide reversible terminators and chemically cleavable fluorescent dideoxynucleotides, Proc. Natl. Acad. Sci. U.S.A. (2008) 105:9145-9150] 등(이들 각각은 본 명세서에 전문이 참조에 의해 원용됨)에 기재된 것과 같이 당업계에 잘 공지되어 있다.
특정 실시형태에서, 본 명세서에서 사용하기 위한 "발광-기질 부착-dNTP"로도 지칭되는 예시적인 뉴클레오타이드-접합체-유사체는 코엘렌테라진-dNTP 접합체 1(도 7); 코엘렌테라진-dNTP 접합체 2(도 8); 코엘렌테라진-dNTP 접합체 3(도 9) 등을 포함한다.
또 다른 실시형태에서, dATPαS, dGTPαS, dCTPαS, dTTPαS는 dATP, dGTP, dCTP 및 dTTP를 대신해서 사용되며, 이는 폴리머라제 이외의 효소(예를 들어, 루시퍼라제)와 뉴클레오타이드의 비-특이적 상호작용을 감소시키기 위해 본 명세서에 상정된다.
각 뉴클레오타이드-접합체-유사체는 폴리머라제 효소에 의해 상보성 가닥에 부착되어 있는 동안 고유의 발광 신호 또는 스펙트럼(예를 들어, 적색, 황색, 녹색 또는 청색 등)을 효과적으로 생성한다. 이전에 부착된 뉴클레오타이드-접합체-유사체의 3' 모이어티에 대한 뉴클레오타이드-접합체-유사체의 부착 완료 시, 후속 발광 반응의 결과로서, 발광-기질-부착된-파이로포스페이트 이탈기(예를 들어, PPi + LS, PPi-C, PPi-FMH2 등)에 의해 생성된 발광 신호(스펙트럼)는 각 발광 반응의 별개 및 제한된 기간 동안 적절한 발광 센서 및/또는 검출 장치에 의해 검출된다(도 2C 및 도 3C).
본 명세서에 제공되는 본 발명의 연결된 2-효소 시스템 및 방법을 사용하면, 특정 유형의 뉴클레오타이드를 나타내는 특정 신호가 폴리머라제-루시퍼라제 반응과 뉴클레오타이드의 특정 상호작용 동안에만 생성될 것이다. 폴리머라제 상호작용 전 및 후의 상태는 유사할 것이며; 신호는 폴리머라제와 상호작용하는 동안 "변화"할 것이다. 예를 들어, 본 명세서에 기재된 일 실시형태에서:
1- 처음에 외부 광 여기가 없기 때문에, 배경 발광은 없거나 매우 낮다.
2- 본 발명의 방법의 폴리머라제-루시퍼라제 상호작용 동안에, 특정 유형의 발광이 생성된다.
3- 각 발광 반응이 중단된 후에, 발광-기질-부착된-파이로포스페이트 신호(PPi + LS)는 초기 상태로 되돌아간다.
본 명세서에 사용된 바와 같이, "발광-기질-부착-이탈기"라는 어구는 발광-기질 등이 내부에 부착되어 있는 폴리포스페이트 사슬을 지칭하며, 이는 주형 핵산 가닥에 각 dNTP의 혼입 동안 본 발명의 2 효소 폴리머라제-루시퍼라제 반응에 의해 절단되는 경우 및/또는 절단 시, 각 dNTP로부터 방출된다. 본 명세서의 특정 실시형태에서, 폴리포스페이트는 dNTP로부터 절단된 발광성 파이로포스페이트(PPi + LS)이고(도 2B 및 도 3B), 이어서, 후속적으로 본 명세서에 제시된 바와 같은, 각각의, 개별, 제한된 기간의 발광 반응(도 2C 및 도 3C)의 종료 전에 후속 발광 검출을 위해 루시퍼라제 반응(도 2C 및 도 3C)에 유입된다.
사용된 반응 조건은 또한 다양한 반응의 상대적인 속도에 영향을 미칠 수 있다. 따라서, 반응 조건의 제어는 서열분석 방법이 주형 내에서 염기를 높은 속도로 성공적으로 호출하는 데 성공적이도록 하는데 유용할 수 있다. 반응 조건으로는, 예를 들어, 완충액의 유형 및 농도, 반응의 pH, 온도, 염의 유형 및 농도, 효소의 역학에 영향을 미치는 특정 첨가제의 존재, 및 금속 보조인자를 비롯한 다양한 보조인자의 유형, 농도 및 상대적인 양을 포함한다. 폴리머라제의 2가지 느린 단계 거동을 달성하거나 향상시키기 위한 반응 조건의 조작은 본 명세서에 참조에 의해 원용된 미국 특허 제8,133,672호에 자세하게 설명되어 있다.
효소 반응은 종종 부분적으로 반응 혼합물의 pH를 제어하기 위해 사용되는 완충액의 존재 하에 수행된다. 완충액의 유형은 일부 경우에 2번의 느린 단계 동역학이 필요한 경우, 이러한 동역학을 초래할 수 있는 방식으로 폴리머라제 반응의 동역학에 영향을 미친다. 예를 들어, 일부 경우에, 완충액으로서 IRIS의 사용은 2번의 느린 단계 반응을 수득하는 데 유용하다. 적합한 완충액으로는, 예를 들어, TAPS(3-{[트리스(하이드록시메틸)메틸]아미노}프로판설폰산), 바이신(N,N-비스(2-하이드록시에틸)글리신), IRIS(트리스(하이드록시메틸)메틸아민), ACES(N-(2-아세트아미도)-2-아미노에탄설폰산), 트리신(N-트리스(하이드록시메틸)메틸글리신), HEPES 4-2-하이드록시에틸-1-피페라진에탄설폰산), TES(2-{[트리스(하이드록시메틸)메틸]아미노}에탄설폰산), MOPS(3-(N-모르폴리노)프로판설폰산), PIPES(피페라진-N,N'-비스(2-에탄설폰산)), 및 MES(2-(N-모르폴리노)에탄설폰산)을 포함한다.
반응의 pH는 폴리머라제 반응의 동역학에 영향을 미칠 수 있으며, 2번의 느린 단계 동역학을 나타내는 반응을 수득하기 위한 폴리머라제 반응 조건 중 하나로서 사용될 수 있다. pH는 2번의 느린 단계 반응 메커니즘을 생산하는 값으로 조정될 수 있다. pH는 일반적으로 약 6 내지 약 9 사이이다. 일부 실시형태에서, pH는 약 6.5 내지 약 8.0 사이이다. 다른 실시형태에서, pH는 약 6.5 내지 7.5 사이이다. 특정 실시형태에서, pH는 약 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4 또는 7.5로부터 선택된다.
반응의 온도는 반응의 상대적인 속도가 적절한 범위에서 일어나는 것을 보장하도록 조정될 수 있다. 반응 온도는 사용된 폴리머라제 또는 선택적 절단 활성의 유형에 따라 달라질 수 있다. 본 명세서에 사용된 온도는 또한 2개의 염기 사이의 수소 결합뿐만 아니라 반응 혼합물 중 물과 염기들의 상호작용을 조작 및 제어하여 반응 성분의 용해도를 제어하기 위해 고려된다.
일부 실시형태에서, 반응의 동역학에 영향을 미칠 첨가제, 예컨대, 마그네슘, 코엔자임 A 등이 반응 혼합물에 첨가될 수 있다. 일부 경우에, 첨가제는 효소의 활성 부위와 상호작용하여, 예를 들어, 경쟁적 저해제로서 작용할 수 있다. 일부 경우에, 첨가제는 반응의 동역학에 영향을 미칠 방식으로 활성 부위에서 떨어진 효소 부분과 상호작용할 수 있다. 동역학에 영향을 미칠 수 있는 첨가제로는, 예를 들어, 미국 특허 제8,252,911호에 기재된 바와 같이 반응 속도를 조절하기 위한 분석 반응 중 경쟁적이지만 그렇지 않으면 비반응성인 기질 또는 저해제를 포함하며, 상기 문헌의 전체 개시내용은 모든 목적을 위해, 전체적으로 본 명세서에 참조에 의해 원용된다.
다른 예로서, 중수소와 같은 동위원소는 폴리머라제 반응 중 하나 이상의 단계의 속도에 영향을 미치기 위해 첨가될 수 있다. 일부 경우에, 중수소는 중수소 동위원소 효과로 인해 폴리머라제 반응의 하나 이상의 단계를 늦추는 데 사용될 수 있다. 폴리머라제 반응 단계의 동역학을 변경함으로써, 일부 경우, 본 명세서에 기재된 바와 같은 2번의 느린 단계 동역학이 달성될 수 있다. 중수소 동위원소 효과는, 예를 들어, 뉴클레오타이드의 혼입 속도를 제어하기 위해, 예를 들어, 혼입 속도를 늦추기 위해 사용될 수 있다. 중수소 이외의 다른 동위원소, 예를 들어, 탄소(예를 들어, 13C), 질소, 산소, 황 또는 인의 동위원소도 사용될 수 있다.
또 다른 예로서, 폴리머라제 반응의 동역학을 제어하기 위해 사용될 수 있는 첨가제로는 유기 용매의 첨가를 포함한다. 용매 첨가제는 일반적으로 수용성 유기 용매이다. 용매는 모든 농도에서 용해성일 필요는 없지만, 폴리머라제 반응의 동역학을 제어하는데 사용된 양에서 일반적으로 용해성이다. 이론적으로 제한하려는 것은 아니지만, 용매는 폴리머라제 반응 중 다양한 단계의 속도에 영향을 미칠 수 있는 폴리머라제 효소의 3차원 입체형태에 영향을 미칠 수 있는 것으로 여겨진다. 예를 들어, 용매는 이성질체화 단계와 같은 입체형태 변화를 수반하는 단계에 영향을 미칠 수 있다. 첨가된 용매는 또한 전좌 단계에 영향을 미칠 수 있고, 일부 경우에는 감속시킬 수 있다. 일부 경우에, 용매는 수소 결합 상호작용에 영향을 주어 작용한다.
단일 분자 서열분석에서 폴리머라제 반응의 하나 이상의 단계의 속도를 제어하기 위해 사용될 수 있는 수혼화성 유기 용매로는, 예를 들어, 알코올, 아민, 아마이드, 나이트릴, 설폭사이드, 에터, 및 에스터, 및 이들 작용기 중 하나보다 많은 작용기를 갖는 소분자를 포함한다. 예시적인 용매로는 메탄올, 에탄올, 프로판올, 아이소프로판올, 글리세롤 및 작은 알코올과 같은 알코올을 포함한다. 알코올은 1개, 2개, 3개 또는 그 이상의 알코올 기를 가질 수 있다. 예시적인 용매로는 또한 소분자 에터, 예컨대, 테트라하이드로푸란(THF) 및 다이옥산, 다이메틸아세트아마이드(DMA), 다이메틸설폭사이드(DMSO), 다이메틸폼아마이드(DMF), 및 아세토나이트릴을 포함한다.
수혼화성 유기 용매는 폴리머라제 반응의 동역학을 제어하기에 충분한 임의의 양으로 존재할 수 있다. 용매는 일반적으로 중량 기준으로 용매 중량 또는 부피 기준으로 용매 부피의 40% 미만의 양으로 첨가된다. 일부 실시형태에서, 용매는 약 0.1% 내지 30%, 약 1% 내지 약 20%, 약 2% 내지 약 15%, 및 약 5% 내지 12%로 첨가된다. 동역학을 제어하기 위한 유효량은 본 명세서에 기재된 방법 및 본 기술분야에 공지된 방법에 의해 결정될 수 있다.
폴리머라제 반응 조건을 제어하는 또 다른 양상은 보조인자의 유형, 수준 및 상대적인 양의 선택에 관한 것이다. 예를 들어, 폴리머라제 반응 과정 동안, 2가 금속 보조인자, 예컨대, 마그네슘 또는 망간은 활성 부위의 정의에서 구조적 역할을 하는 효소-기질 복합체와 상호작용할 것이다. 폴리머라제 반응에서 금속 보조인자 상호작용에 대한 논의는, 예를 들어, 문헌[Arndt, et al., Biochemistry (2001) 40:5368-5375]을 참고한다. 적합한 조건으로는 모든 목적에 대해 전체가 본 명세서에 참조에 의해 원용되는 미국 특허 제8,257,954호에 기재된 조건을 포함한다.
본 발명의 방법의 특정 실시형태에서, 폴리머라제 반응의 속도 및 충실도는 기질 농도, 광학 여기의 양, 화학적 변형의 수준과 같은 매개변수의 관점에서 폴리머라제가 거의 이상적인 조건에서 작동하도록 dNTP 뉴클레오타이드-접합체-유사체의 농도를 조정함으로써 제어된다. 따라서, 폴리머라제 효소는 천연 환경에서 달성되는 DNA 합성 길이와 유사한, 대략 수만개의 염기 쌍과 같은 최대 판독 길이에 도달하는 것으로 본 명세서에서 고려된다. 이것은 장치 복잡성을 줄이고 효소 감도와 특이성을 증가시켜 낮은 오류율 및 이에 따른 낮은 적용범위를 초래한다. 이는 장치 비용뿐만 아니라 게놈당 비용을 절감할 뿐만 아니라 단일 뉴클레오타이드 중합 검출, 구조 변경 및 게놈 조립과 같은 적용예를 매우 컴팩트한 시스템에서 가능하게 한다.
단일 분자 반응에서 긴 판독-길이를 달성하는 방법
긴 판독-길이를 달성하는 능력은 기존의 서열분석 방법에 대한 찾기 힘든 목표였다. 현대의 서열분석 접근은 긴 판독-길이를 달성하는 이들의 능력으로 제한된다. 특히, 단일 분자 서열분석 방법에 대해, 이런 제한은 주형 DNA에 대한 폴리머라제의 상대 친화도로부터 유래된다. 서열분석 반응 동안에, 폴리머라제는 결국 주형 DNA로부터 떨어져서, 각각의 판독 길이에서 dNTP 사슬 연장 반응을 종결할 것이다. 예를 들어, 전형적인 서열분석 기술에 의해, 세포당 하나의 주형 및 하나의 폴리머라제가 있다. 이런 단일 폴리머라제 서열분석 반응에 대해, 단일 폴리머라제가 주형으로부터 분리될 때(떨어질 때), 해당되는 특정 판독의 길이는 약 700개의 염기쌍(bp)인 것으로 여겨지는 것에 상응하는 상대적으로 짧은 판독 길이에서 종결된다.
본 발명에 따르면, 하기 단계들을 포함하는 주형 핵산의 서열분석 방법이 본 명세서에 제공된다:
표적 주형 핵산 및 프라이머, 복수 유형의 뉴클레오타이드-접합체-유사체, 및 복수의 폴리머라제 효소를 포함하는, 본 명세서에 기재된 바와 같은 서열분석 혼합물을 제공하는 단계;
복수의 뉴클레오타이드-접합체-유사체가 주형에 순차적으로 첨가되도록 핵산 합성을 수행하는 단계; 및
핵산 합성이 일어나는 동안 각각의 뉴클레오타이드-접합체-유사체를 검출하여, 주형 핵산 서열을 결정하는 단계.
본 명세서에 사용되는 바와 같은 어구 "복수의 폴리머라제 효소", "복수의 폴리머라제" 또는 이의 문법적 변형은 단일 서열분석 반응 혼합물에서 사용되는, 서열분석될 핵산 주형당 폴리머라제 효소 수를 지칭한다. 서열분석될 각 주형 가닥에 대한 "복수의 폴리머라제 효소"에서 폴리머라제의 양은 서열분석될 각 주형 가닥에 대해 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000 및 적어도 1000000 폴리머라제 효소로 이루어진 군으로부터 선택될 수 있다. 표적 핵산 주형의 지속적 서열분석의 다른 실시형태에서, 폴리머라제 대 주형의 비는 적어도 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 150:1, 200:1, 250:1, 300:1, 350:1, 400:1, 450:1, 500:1, 550:1, 600:1, 650:1, 700:1, 750:1, 800:1, 850:1, 900:1, 950:1, 1000:1, 10000:1, 20000:1, 30000:1, 40000:1, 50000:1, 60000:1, 70000:1, 80000:1, 90000:1, 100000:1, 200000:1, 300000:1, 400000:1, 500000:1, 600000:1, 700000:1, 800000:1, 900000:1 및 적어도 1000000:1로 이루어진 군으로부터 선택된다. 복수의 폴리머라제는 동일한 유형의 폴리머라제의 동종 수집물일 수 있거나, 또는 2 이상의 상이한 유형의 폴리머라제, 예를 들어, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 최대 100개 이상의 상이한 복수의 폴리머라제의 이종성 수집물일 수 있다.
특정 실시형태에서, 단일 서열분석 또는 표적 검출 반응 혼합물은 서열분석될 단지 하나(단일) 표적 주형 핵산과 함께 하나 이상의 프라이머를 가진다. 다른 실시형태에서, 단일 서열분석 또는 표적 검출 반응 혼합물은 서열분석될 하나 초과, 또는 다수, 또는 복수의 표적 주형 핵산과 함께 복수의 프라이머를 갖는다. 특정 실시형태에서, 하나의 표적 주형 핵산은 개개 광학장치 가둠으로 제공된다.
본 발명의 LASH 서열분석 방법의 일부 실시형태에서, 효소 결부는 특정 개개 가둠(예를 들어, 액적 등)으로 제공되므로, 가둠 영역에 단지 하나의 주형 표적 핵산이 있는 한편, 복수의(예를 들어, 다수의) 폴리머라제 효소 및 결부를 형성하는 상응하는 복수의 다른 효소가 있다(도 10). 본 실시형태에서, 폴리머라제 효소가 표적 주형 핵산으로부터 떨어질 때(분리될 때)(도 12B), 특정 표적 핵산 주형 영역에 가둬진 여러 복수의 다른 폴리머라제 중 하나는 이전의 폴리머라제가 중단되거나 해리된 주형 상의 위치에서 유리하게 그리고 상대적으로 즉시 사슬 연장을 시작한다(도 12B). 다시 말해서, 서열분석 사슬 연장은 제1 폴리머라제 효소가 주형 핵산으로부터 떨어지거나 분리될 때까지 일어나며, 이어서, 서열분석 사슬 연장 반응은 제2 폴리머라제(제1 폴리머라제와 상이함)가 주형 핵산으로부터 떨어지거나 분리될 때까지 계속되고, 그 다음에, 서열분석 사슬 연장 반응은 제3 폴리머라제(제2 pol과 상이함; 특정 서열분석 반응에서 제1 pol 또는 복수의 pol 중 다른 것일 수 있음)가 주형 핵산으로부터 떨어지거나 분리될 때까지, 기타 등등으로 계속된다. 당업자는 이 접근을 사용하여, 서열분석 반응이 실행되는 한, 표적 핵산 주형이 연속적으로 서열분석된다는 것을 용이하게 이해할 것이다. 당업자는 또한 본 명세서에 개시된 실질적으로 연속적인 서열분석 방법을 이용할 때, 이의 판독 길이는 각각의 사슬 연장 반응을 위해 사용되는 표적 핵산의 길이 및/또는 반응 가둠 영역의 물리적 크기에 의해서만 제한된다는 것이 용이하게 이해될 것이다.
따라서, 표적 핵산 주형을 지속적으로 서열분석하는 방법이 본 명세서에 제공된다. 본 실시형태에서, 본 명세서에 사용되는 바와 같은 "연속성", "표적 핵산 주형을 연속적으로 서열분석하는" 또는 "표적 핵산 주형을 실질적으로 연속적으로 서열분석하는"은 단일 폴리머라제는 전체 길이 판독 길이의 경우 특정 표적 핵산을 연속적으로 서열분석할 수 있다는 것을 의미하지는 않지만, 이들 사이에 함께 합쳐진 표적 핵산 주형의 반응 영역에서 복수의 폴리머라제 효소는, 앞의 폴리머라제가 특정 표적 핵산 주형으로부터 분리된 경우로부터 다음 뉴클레오타이드에서, dNTP 사슬 연장을 넘겨 받을 수 있는 다수의 폴리머라제를 연속적으로 갖는 복수의 폴리머라제 효소에 의해 연속적으로 서열분석될 수 있다는 것을 의미한다.
본 발명의 특정 실시형태에서, 지속적 LASH 서열분석 방법, 특히 복수의 폴리머라제가 단일 표적 주형 핵산을 서열분석하기 위해 사용되는 경우, 전반적 판독 길이는 특정 반응 가둠 영역에 제공되는 표적 주형 핵산의 길이에 의해서만 제한된다. 예를 들어, 단일 표적 핵산 주형 상의 복수의 폴리머라제를 이용함으로써 달성될 수 있는 본 명세서에 상정된 전체 판독 길이는 최대 전체 염색체 길이, 예를 들어, 5천만개에서 최대 약 3억개의 염기쌍(예를 들어, 300Mbp) 등이다. 본 명세서에 상정된 다른 특정 실시형태에서, 본 발명의 서열분석 방법에 의해 달성되는 판독 길이는 적어도 200bp, 300bp, 400bp, 500bp, 600bp, 700bp, 800, bp, 900bp, 1000bp(즉, 1kbp), 5kbp 10kbp, 20kbp, 30kbp, 40kbp, 50kbp, 100kbp, 200kbp, 300kbp, 400kbp, 500kbp, 600kbp, 700kbp, 800kbp, 900kbp, 1000kbp (1Mbp), 5Mbp, 10Mbp, 20Mbp, 50Mbp, 75Mbp, 100Mbp, 200Mbp, 300Mbp, 400Mbp, 500Mbp, 600Mbp, 700Mbp, 800Mbp, 900Mpb, 1000Mbp로 이루어진 군으로부터 선택될 수 있다.
상기 제시한 바와 같은 추가적인 실시형태에서, 핵산 서열 판독-길이는 본 발명의 방법을 이용하여 서열분석 중인 주형 핵산의 전체 길이까지일 수 있기 때문에, 본 발명의 방법에 의해 달성된 염기쌍 판독-길이는 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000(즉, 1×106), 10000000(1×107), 100000000(1×108), 1000000000(1×109) 이상으로 이루어진 군으로부터 선택될 수 있다.
복수의 폴리머라제에 의한 표적 주형 핵산의 실질적으로 연속적인 서열분석 때문에, 반응은 특정 판독 길이를 달성하는 단일 효소의 능력에 의해 제한되지 않는다. 이는 본 발명의 방법에서 보다 높은 특이성 및 낮은 오류율로 효소의 사용을 허용한다. 본 발명의 LASH 서열분석 방법의 특정 실시형태에 따르면, 하나의 주형, 및 하나 초과의 폴리머라제(즉, 복수)를 이용하여 무한히 긴 판독-길이를 달성할 수 있다는 것이 본 명세서에서 상정된다. 본 명세서에 제시된 바와 같이, 하나의 폴리머라제가 표적 주형 핵산을 떨어뜨리기 때문에, 다른 폴리머라제는 이전의 폴리머라제가 떨어진 경우로부터 계속될 것이며, 이는 본 발명의 LASH 서열분석 방법에서 수행하기 위해 폴리머라제가 선택 또는 최적화될 수 있는 방법을 유리하게 변경시킨다. 이런 이유로, 당업자는 폴리머라제가 또한 상대적으로 짧은 판독 길이를 가질 수 있음에도 불구하고, 매우 낮은 오류율로 폴리머라제를 선택할 수 있다. 이는 본 발명의 서열분석 방법에서 사용하도록 선택된 폴리머라제가 긴 판독 길이와 특이성을 둘 다 필요로 하지 않는다는 점에서 특정 실시형태에 대한 이점을 제공한다.
본 발명은 핵산 주형의 서열분석을 위한 시스템을 포함한다. 시스템은 복수의 핵산 주형을 동시에 서열분석하기 위해 제공된다. 시스템은 본 명세서에 기재된 모든 시약 및 방법을 포함할 수 있으며, 샘플을 함유하고, 발광 반응으로부터의 여기 광으로 샘플을 조명하고, 서열분석 동안 샘플로부터 방출되는 광을 검출하여, 각각의 dNTP가 이의 동족 주형 핵산 상에 폴리머라제에 의해 혼입됨에 따라 뉴클레오타이드-접합체-유사체로부터 절단된 발광-기질-부착-이탈기(예를 들어, PPi-C1, PPi-FMNH2 등)로부터의 강도 대 시간 데이터를 생성하고; 각각의 발광-기질-부착-이탈기, 예를 들어, PPi-C1 또는 PPi-FMNH2 등으로부터, 순차적 강도 대 시간 데이터를 사용하여 주형의 서열을 결정하는 데 필요한 기기를 제공한다.
본 명세서에 사용된 바와 같이, "광 검출"이라는 어구는, 예를 들어, 이러한 발광-기질-이탈기가 각각의 신호를 방출하는 여기 상태에 있을 때 발광-기질로부터 방출되는 발광을 검출하기 위한 잘 알려진 방법을 지칭한다.
일 실시형태에서, 서열분석을 위한 시스템은 일반적으로 예를 들어 고유 액적 등 내에 복수의 단일 폴리머라제 효소, 단일 주형, 또는 단일 프라이머를 갖는 기질을 포함한다. 고도로 전진하는 효소 폴리머라제 반응의 경우, 폴리머라제 효소, 핵산 주형 및 프라이머를 포함하는 각각은 유전자 합성이 일어날 때 각각의 뉴클레오타이드에 신호가 할당될 수 있도록 고유하게 가둬진다. 본 명세서에 제고된 다른 실시형태에서, 복수의 폴리머라제 효소는, 예를 들어, 고유 가둠, 액적 등 내에서, 단일 주형 및/또는 단일 프라이머와 함께 사용된다. 서열분석 시약은 일반적으로 뉴클레오타이드-접합체-유사체 중 둘 이상의 유형, 바람직하게는 dATP, dTTP, dAGP 및 dCTP에 상응하는 4개의 뉴클레오타이드-접합체-유사체를 포함하고, 각 뉴클레오타이드-접합체-유사체는 상이한 발광-기질 표지로 표지된다. 폴리머라제는 프라이머에서 연장되는 성장하는 가닥에 뉴클레오타이드 또는 뉴클레오타이드-접합체-유사체를 순차적으로 첨가한다. 첨가된 각각의 뉴클레오타이드 또는 뉴클레오타이드-접합체-유사체는 생산된 성장하는 가닥의 부분이 주형에 상보성이도록 주형 핵산 상의 상응하는 염기에 상보성이다.
시스템은 도 2 및 도 3에 제시된 바와 같은 발광 반응을 받는 주형 가닥에 혼입되기 때문에 각각의 dNTP로부터의 발광-기질-부착-이탈기를 조명하기 위한 발광 시약(예를 들어, 루시퍼라제 및 각각의 발광-기질)을 포함한다. 발광 반응은 각 dNTP에 상응하는 파장 범위에서 각 발광-기질-부착-이탈기를 조명한다. 본 명세서에 제시된 바와 같이, 발광-기질은 콜렌타라진 또는 이의 유사체; FMNH2 또는 이의 유사체; 루미놀, 아이소루미놀, 아크리디늄, 다이옥세탄, 퍼옥시옥살산 및 이들의 유도체로 이루어진 군으로부터 선택될 수 있다.
시스템은 주형 가닥에 대한 폴리머라제 효소 매개 첨가 동안에 각각의 뉴클레오타이드-접합체-유사체로부터 절단된 발광-기질-부착-이탈기로부터의 신호를 관찰하기 위한 검출 광학장치를 추가로 포함한다. 검출 광학장치는 동시에 복수의 단일 분자 폴리머라제 서열분석 반응을 관찰하여, 본 발명의 연결된 2 효소(폴리머라제-루시퍼라제) 시스템에서 궁극적으로 절단되는 발광-기질-부착-이탈기(예를 들어, PPi-C1 또는 PPi-FMNH2)를 통해 이들 각각에 대한 뉴클레오타이드 또는 뉴클레오타이드-접합체-유사체 첨가를 관찰한다. 관찰된 단일 분자 폴리머라제 서열분석 반응 각각에 대해, 각각의 개별 및 제한된 기한 신호가 각 발광 반응으로부터의 발광 신호의 붕괴 및 종결로 인해 중단될 때까지, 검출 광학장치는 각각의 dNTP에 상응하는 각각의 발광 반응에 의해 여기되는 각각의 발광-기질을 나타내는 발광-기질-부착-이탈기 각각으로부터의 신호를 동시에 관찰한다.
시스템은 또한 각 발광-기질-부착-이탈기로부터 관찰된 신호를 사용하여 성장하는 가닥에 첨가된 뉴클레오타이드 유사체의 유형을 결정하도록 구성된 컴퓨터를 포함하고; 이로써 발광-기질-부착-이탈기로부터 관찰된 신호는 성장하는 가닥에 혼입된 뉴클레오타이드 또는 뉴클레오타이드-접합체-유사체의 유형을 나타내는 데 사용된다. 컴퓨터는 일반적으로 신호 데이터의 형태로 검출 광학장치로부터 관찰된 신호에 관한 정보를 수신한다. 컴퓨터는 일련의 염기 호출의 순서를 생성하기 위해 신호 데이터를 사용하여 신호 데이터를 저장, 처리 및 해석한다. 염기 호출은 시퀀스 결정을 돕기 위해 컴퓨터에 제공된 다른 정보와 조합하여 수신된 신호 데이터로부터의 주형 서열의 컴퓨터 추정치를 나타낸다.
본 발명과 함께 사용될 수 있는 광학 검출 시스템은 예를 들어, 미국 특허 제8,802,424호; 제7,714,303호; 및 제7,820,983호에 기재되어 있으며, 이들 각각은 모든 목적을 위해 그 전체가 본 명세서에 참조에 의해 원용된다.
본 발명의 방법을 수행하는 데 사용하기 위한 컴퓨터는 인텔 펜티엄 또는 듀오코어 프로세서로 운영되는 PC 또는 Macintosh.RTM형 컴퓨터와 같은 개인용 컴퓨터부터 UNIX, LINUX, Windows.RTM., 또는 다른 시스템으로 실행되는 워크스테이션, 실험실 장비 또는 고속 서버까지의 범위일 수 있다. 본 발명의 논리 프로세싱은 소프트웨어 및/또는 펌웨어 논리 명령실행을 실행하는 전적으로 범용 논리 프로세서(예를 들어, CPU의)에 의해; 또는 전적으로 소프트웨어 또는 펌웨어 요소를 추가로 포함할 수 있는 실험실 또는 진단 시스템 또는 카메라 시스템에 혼입된 특수 목적의 논리 프로세싱 회로(예를 들어, ASIC)에 의해; 또는 범용 및 특수 목적 논리 회로의 조합에 의해 수행될 수 있다. 신호 데이터에 대한 데이터 형식은 JPEG, GIF, BMP, TIFF 또는 "fastq" 또는 "qseq" 형식(Illumina)을 포함한 기타 서열분석 특정 형식과 같은 디지털 이미지 기반 데이터 형식을 포함하는 임의의 편리한 형식을 포함할 수 있고; 한편, avi, mpeg, mov, rmv 또는 기타 비디오 형식과 같은 비디오 기반 형식이 사용될 수 있다. 본 발명의 소프트웨어 프로세스는 일반적으로 예를 들어 Matlab, C, C++, C#, NET, Visual Basic, Python, JAVA, CGI 등을 포함하는 다양한 프로그래밍 언어로 프로그래밍될 수 있다.
본 발명의 방법 및 시스템의 일부 실시형태에서, 광 가둠(optical confinement)은 동시에 다중 단일 분자 폴리머라제 서열분석 반응을 동시 관찰하는 능력을 향상시키는 데 사용된다. 일반적으로, 광 가둠은 기재 상에 배치되고 전자기 방사선을 제공하거나 이러한 방사선을 매우 작은 공간 또는 체적만으로부터 유도하는 데 사용된다. 이러한 광 가둠은 구조적 가둠, 예를 들어, 웰, 홈, 도관 등을 포함할 수 있거나, 다른 구성요소와 함께 광학 프로세스를 포함하여 매우 작은 체적에만 검출을 제공하거나, 이로부터 방출된 방사선을 유도할 수 있다. 이러한 광 가둠의 예로는, 예를 들어, 내부 전반사(TIR) 기반의 광학 시스템을 활용하는 시스템을 포함하여, 이에 의해 광은 기재 내에서 내부 전반사를 생성하는 각도로 기재의 투명 부분을 통해 유도된다.
특정 실시형태에서, 바람직한 광 가둠은 본 명세서에 기재된 개별 서열분석 반응을 함유할 수 있는 미세액적(micro-droplet)(예를 들어, 유중수 에멀션 등)이다. 예를 들어, 서열분석 혼합물 반응 성분은 각 미세액적이 하나의 폴리머라제-루시퍼라제 효소 세트 및 관련 시약과 하나의 주형 핵산을 함유하는 방식으로 분할될 수 있어, 각 신호 검출 단위는 단일 미세액적에 초점을 맞춘다. 본 명세서에서는 각 미세액적이 개별 단일 분자 서열분석 반응을 함유하는 단일 분자 반응 셀인 것이 상정된다. 미세액적 반응 셀은 또한 마이크로 렌즈로서 작용하여 각각의 신호 검출 단위에 광을 집중시키기 위해 본 발명의 서열분석 방법에 유리하게 유용하다.
본 발명의 기재는 일반적으로 강성이며, 종종 평면이지만, 반드시 그럴 필요는 없다. 기재가 광 가둠의 어레이를 포함하는 경우, 기재는 일반적으로 조명을 허용하고 광 가둠으로부터의 광의 측정을 허용하기 위해 광학 기기와 인터페이스할 수 있는 크기 및 모양인 것일 것이다. 전형적으로, 기재는 또한 광학 측정을 위해, 예를 들어, 시약을 함유하는 액체 매질 및 기재 및/또는 표지된 성분, 예컨대, 뉴클레오타이드-접합체-유사체와 접촉하여 유지되도록 구성될 것이다.
가둠 영역에서 본 발명의 서열분석 혼합물 성분을 제공하기 위한 예시적인 실시형태는 수많은 다른 입체배치 중에서, 도 10 내지 도 14에 나타난 것을 포함한다. 예를 들어, 일 실시형태에서, 각각의 표적 핵산 주형은 개개의 각 신호 검출기 표면에 결합된다. 일 실시형태에서, 핵산 주형은 당업계에 잘 공지된 수많은 방법, 예를 들어, 금 표면에 대한 티올 결합 등을 이용하여 표면 또는 고체 기재에 직접 결합 또는 부착될 수 있다(도 11B). 다른 실시형태에서, DNA 주형은 실란, NHS 에스터 등을 통해 각 표면에 직접 결합 또는 부착될 수 있다. 다른 실시형태에서, 서열분석을 위한 프라이머는 개개의 각 신호 검출기 표면에 결합될 수 있다(도 11A). 본 명세서에 제시된 바와 같이, 각 부착은 개개 신호 검출기 표면 상일 수 있다. 예시적인 신호 검출기는 본 명세서에 기재되었고, CCD, CMOS 센서의 픽셀일 수 있거나, 또는 이들은 광검출기, 또는 어레이를 형성하는 광전자 증배관 등일 수 있다.
기재가 광 가둠의 어레이를 포함하는 경우, 어레이는 기재 표면 상에 광 가둠의 단일 행 또는 복수의 행을 포함할 수 있으며, 여기서 복수의 레인이 존재하는 경우, 레인의 수는 일반적으로 적어도 2개, 보다 일반적으로 10개 초과, 보다 일반적으로 100개 초과일 것이다. 광 가둠의 대상 어레이는 기재의 x축 또는 y축을 따라 수평 또는 사선으로 정렬될 수 있다. 개별 가둠은 기재의 표면을 따라 또는 표면 위로 임의의 형식으로 배열될 수 있으며, 예컨대 격자를 형성하거나, 원형, 타원형, 난형, 원추형, 직사각형, 삼각형 또는 다면체 패턴을 형성하기 위한 행 및 열이 있다. 인접한 광 가둠 사이에 최근접-이웃 거리를 최소화하기 위해 육각형 어레이가 때로 선호된다.
광 가둠의 어레이는 분석의 용이함, 높은 처리량, 또는 다른 이점을 제공하는 구조, 예컨대 미량역가 플레이트 등에 포함될 수 있다. 이러한 설정은 본 명세서에서 "어레이들의 어레이"라고도 지칭된다. 예를 들어, 대상 어레이는 미량역가 플레이트와 같은 또 다른 어레이에 포함될 수 있으며, 여기서 플레이트의 각 마이크로웰은 광 가둠의 대상 어레이를 함유한다.
본 발명에 따르면, 가둠의 어레이(예를 들어, 반응 셀, 미세액적 등)는 단일 기재 상에 100개 초과, 1000개 초과, 10,000개 초과, 100,000개 초과 또는 1,000,000개 초과의 개별 반응 셀(예컨대, 미세액적 등)의 어레이로 제공된다. 또한, 반응 셀 어레이는 전형적으로 비교적 고밀도로 기재 표면 상에 포함된다. 이러한 고밀도는 전형적으로 ㎟당 10개 초과의 반응 셀, 바람직하게는 기재 표면적 ㎟당 100개 초과의 반응 셀, 더욱 바람직하게는 ㎟당 500개 또는 심지어 1000개 초과의 반응 셀, 및 많은 경우에 ㎟당 최대 100,000개 또는 초과의 반응 셀의 밀도로 존재하는 반응 셀을 포함한다. 많은 경우에, 어레이의 반응 셀은 규칙적인 패턴으로, 예를 들어, 주어진 어레이에서 규칙적으로 이격된 반응 셀의 2, 5, 10, 25, 50 또는 100개 이상의 행 및/또는 열로 이격되어 있지만, 특정 바람직한 경우에, 표준 행 및/또는 열 형식에서 벗어난 반응 셀의 구성을 어레이에 제공하는 데 유리한 점이 있다. 바람직한 양상에서, 기재는 기재 상의 별개의 단일 분자 서열분석 반응 영역을 정의하기 위한 광 가둠으로서 미세액적을 특정 반응 셀로서 포함한다.
광학 가둠의 어레이의 전체 크기는 일반적으로 두께가 수 나노미터 내지 수 밀리미터, 및 폭 및/또는 길이가 수 밀리미터 내지 50센티미터의 범위일 수 있다. 어레이는 두께가 약 수백 미크론 내지 수 밀리미터인 전체 크기를 가질 수 있고, 원하는 광 가둠의 수에 따라 임의의 폭 또는 길이를 가질 수 있다.
개별 가둠 사이의 간격은 대상 어레이가 사용될 특정 적용예를 지지하기 위해 조정될 수 있다. 예를 들어, 의도된 적용예가 광 가둠으로부터 입사 파장의 낮은 수준의 회절 산란의 유무 하에 어레이의 암시야 조명을 필요로 하는 경우, 개별 가둠은 입사 파장에 비해 서로 가깝게 배치될 수 있다.
어레이의 개별 가둠은 약 1000 젭토리터 미만, 약 900 젭토리터 미만, 약 200 젭토리터 미만, 약 80 젭토리터 미만, 약 10 젭토리터 미만의 유효 관찰 부피를 제공할 수 있다. 원하는 경우, 1 젭토리터 미만의 유효 관찰 부피가 제공될 수 있다. 바람직한 양상에서, 개별 가둠은 생리학적으로 적절한 농도 또는 그 부근으로 존재하는 효소와 같은 개별 분자의 해상도를 허용하는 유효 관찰 부피를 산출한다. 많은 생화학적 반응을 위한 생리학적으로 적절한 농도는 마이크로몰에서 밀리몰 범위인데, 그 이유는 이들 범위에서 대부분의 효소가 미카엘리스 상수를 갖기 때문이다. 따라서, 광 가둠의 바람직한 어레이는 약 1 마이크로몰(uM)보다 높은 농도, 또는 보다 바람직하게는 50uM보다 높은 농도, 또는 심지어 100uM보다 높은 농도로 존재하는 개별 분자를 검출하기 위한 유효 관찰 부피를 갖는다. 특정 실시형태에서, 전형적인 미세액적 크기는 10 마이크로미터 내지 200 마이크로미터의 범위이고, 따라서 전형적인 미세액적 부피는 약 5 피코리터 내지 20 나노리터이다.
광 가둠 내에서 화학적 또는 생화학적 분석의 정황 하에, 관심 반응이 최소한 가둠의 광학적 취조 부분 내에서 일어나도록 하고, 바람직하게는 단일 분자 폴리머라제 서열분석 반응의 반응들만이 개별 가둠(예를 들어, 미세액적 내 등)의 취조 부분 내에서 일어나도록 하는 것이 바람직하다. 관찰 체적 내에 개별 분자를 제공하기 위해서는 당업계에 잘 공지된 다수의 방법이 일반적으로 사용될 수 있다. 다양한 이들 방법은 모든 목적을 위해 전체가 본 명세서에 참조에 의해 원용되는 미국 특허 제7,763,423호에 기재되어 있으며, 이 문헌은 특히 개별 분자를 원하는 밀도로 표면에 고정시키도록 설계되어, 대략 1개, 2개, 3개 또는 몇몇 다른 선택된 수의 분자가 주어진 관찰 체적 내에 포함될 것으로 예상되도록 한 개질 표면을 기술한다. 전형적으로, 이러한 방법은 표면 상에 비교적 낮은 밀도의 커플링 기를 제공하는 희석 기술을, 표면 상에 이러한 기의 희석을 통해 또는 관심 분자와 상호작용하는 중간체 또는 최종 커플링 기의 희석을 통해, 또는 이들의 조합을 통해 활용한다. 또한, 본 명세서에서는 광 가둠을 위해 본 명세서에서 고려된 미세액적 반응에서 일어나는 것과 같이, 표면에 고정됨이 없이 주어진 관찰 체적 내에 1개, 2개, 3개 또는 몇몇 다른 선택된 수의 단일 분자 서열분석 반응이 포함되도록 하기 위한 이들 희석 기술의 용도가 고려된다. 특정 실시형태에서, 희석 기술은 본 발명의 서열분석 방법에 사용하기 위해 미세액적에 단일 분자 서열분석 반응을 제공하기 위해 활용된다.
본 발명의 시스템 및 방법은 당업계에 잘 공지된 시스템을 이용하여 본 명세서에 제시된 2 효소 pol-루시퍼라제 반응을 겪은 후에 뉴클레오타이드-접합체-유사체의 발광-기질-부착-이탈기로부터의 신호를 모니터링함으로써 개선된 서열 결정 및 개선된 염기 호출을 초래할 수 있다. 일반적으로, 신호 데이터는 처리기에 의해 수신된다. 프로세서에 의해 수신된 정보는 검출 광학장치에서 바로 비롯될 수도 있고, 검출 광학장치로부터의 신호는 프로세서에 의해 수신되기 전에 다른 프로세서에 의해 처리될 수 있다. 다수의 초기 보정 작업이 적용될 수 있다. 이러한 초기 보정 단계 중 일부는 진행 초기에 한 번만 수행되거나 진행 동안 보다 지속적인 기준으로 수행될 수 있다. 이러한 초기 보정 단계는 중심 결정, 정렬, 그리딩(gridding), 드리프트 교정, 초기 배경 감산, 노이즈 매개변수 조정, 프레임 속도 조정 등과 같은 일을 포함될 수 있다. 비닝(binning)과 같은 이러한 초기 보정 단계 중 일부는 이하에 추가로 설명되는 바와 같이, 프로세서로부터 다시 검출기/카메라로 돌아가 소통을 수반할 수 있다.
일반적으로, 일부 유형의 스펙트럼 트레이스 결정, 스펙트럼 트레이스 추출 또는 스펙트럼 필터가 초기 신호 데이터에 적용된다. 이러한 여과 단계의 일부 또는 전부는 공정 후반, 예를 들어, 펄스 식별 단계 이후에 선택적으로 수행될 수 있다. 스펙트럼 트레이스 추출/스펙트럼 필터는 다수의 노이즈 감소 및 본 기술분야에 공지된 다른 필터를 포함할 수 있다. 수신된 초기 신호 데이터는 일련의 인접 픽셀 검출기에 의해 포착된 광 수준 또는 광자 카운트이기 때문에 본 명세서에서 논의된 많은 예시적인 시스템의 경우 이 단계에서는 스펙트럼 트레이스 결정이 수행된다. 예를 들어, 하나의 예시적인 시스템에 있어서, 위치로부터의 픽셀(또는 강도 수준)은 각 프레임에서 개별 도파관마다 포착된다. 다른 주파수 또는 스펙트럼의 광은 둘 이상의 위치에 속할 것이며, 일반적으로 약간의 중첩이 있고, 가능하다면 상당한 중첩이 있을 수 있다. 본 발명의 특정 실시형태에 따르면, 스펙트럼 트레이스 추출은 각각의 스펙트럼 트레이스에 대해 가장 높은 신호 대 노이즈비를 제공하는, 아래에서 논의되는 바와 같이 다양한 유형의 분석을 사용하여 수행될 수 있다.
스펙트럼 트레이스 결정에 대한 대안으로서, 본 발명의 방법은 또한 다수의 픽셀 위치에서의 강도 수준에서 유래된 단일 신호를 분석할 수 있다(이것은 합산된 스펙트럼 신호 또는 그레이 스케일 스펙트럼 신호 또는 강도 수준 신호로 지칭될 수 있음). 그러나, 많은 상황에서 스펙트럼 추출은 더 우수한 SNR(신호 대 노이즈비)을 제공하므로 스펙트럼 트레이스를 추출했을 때 펄스 검출은 다소 개별적으로 펄스에 대해 분석된다. 추가 실시형태에서, 본 발명에 따른 방법은 은닉 마르코프 모델(Hidden Markov Model)과 같은 통계 모델을 사용하여 다수의 포착된 픽셀 데이터를 분석할 수 있다. 본 명세서에 제공되는 본 발명의 서열분석 방법 및 시스템에서, 초기 신호 데이터로부터 다수(예를 들어, 4개)의 스펙트럼 트레이스를 결정하는 것이 바람직한 방법이다.
발광-기질-부착-이탈기(예를 들어, PPi-C1 또는 PPi-FMNH2)로부터의 신호가 유의한 신호 펄스 또는 사건으로 분류될 수 있는지 여부가 결정된다. 일부 예시적인 시스템에서, 검출에 이용가능한 광자의 적은 수로 인해 그리고 검출 속도로 인해, 유의미한 펄스가 검출되었는지 여부를 결정하기 위하여 다양한 통계 분석 기술이 수행될 수 있다.
신호가 유의미한 펄스 또는 신호 사건으로서 식별되는 경우, 스펙트럼 할당을 확인하기 위해 추가 선택적인 스펙트럼 프로파일 비교가 수행될 수 있다. 이 스펙트럼 프로파일 비교는 스펙트럼 트레이스가 펄스 식별 이전 또는 펄스 식별 동안 결정되는 실시형태에서 선택적이다. 색상이 주어진 혼입 신호(예를 들어, 특정 뉴클레오타이드-접합체-유사체; dNTP-C1 또는 dNTP-FMNH2)에 할당되면, 해당 할당은 혼입된 각 염기 또는 주형 서열에서 그의 보체를 호출하는 데 사용된다. 이 결정을 내리기 위해, 각각의 발광-기질-부착-이탈기(예를 들어, PPi-발광-기질)에 상응하는 채널에서 나오는 신호는 뉴클레오타이드 표지의 펄스가 혼입 사건에 상응하는 것인지 여부를 평가하는 데 사용된다. 호출된 염기의 편집은 선형 서열 정보, 예를 들어 주형 서열 내 연속적인 뉴클레오타이드 서열을 제공하거나, 서열 단편을 더 긴 콘티그(contig)로 조립하는 등의 추가 처리를 거친다.
위에서 언급한 바와 같이, 신호 데이터는 처리 시스템, 예를 들어 적절하게 프로그래밍된 컴퓨터 또는 다른 프로세서에 입력된다. 신호 데이터는 예를 들어 실시간 신호 처리를 위해 검출 시스템으로부터 직접 입력되거나, 또는 신호 데이터 저장 파일 또는 데이터베이스로부터 입력될 수 있다. 일부 경우, 예를 들어, 검출 시스템의 성능에 대한 즉각적인 피드백을 구하고 검출 또는 다른 실험 매개변수를 조정하려는 경우에는 실시간 신호 처리가 이용될 것이다. 일부 실시형태에서, 신호 데이터는 검출 시스템으로부터 적절한 파일 또는 데이터베이스에 저장되고 반응 후 프로세싱 또는 비실시간 방식으로 처리된다.
본 발명과 관련하여 사용된 신호 데이터는 다양한 형태일 수 있다. 예를 들어, 데이터는 주어진 검출기 또는 어레이 기반 검출기의 검출 지점에서 수신된 광학 신호에 대한 강도 값을 나타내는 수치 데이터일 수 있다. 신호 데이터는 CCD, EMCCD, ICCD 또는 CMOS 센서와 같은 이미징 검출기로부터의 이미지 데이터를 포함할 수 있다. 특정 실시형태에서, 단일 분자로부터 적은 수의 광자를 검출하기 위해, 광전자 증배관(PMT) 및/또는 광자 계수기 유닛의 사용이 본 발명의 방법에 사용하기 위해 고려된다. 어느 경우든, 본 발명의 특정 실시형태에 따라 사용되는 신호 데이터는 일반적으로 강도 수준 정보 및 스펙트럼 정보 둘 모두를 포함한다. 별개의 검출기 요소의 정황에서, 이러한 스펙트럼 정보는 일반적으로 강도가 검출되는 검출기 부분(예를 들어, 픽셀)의 장소 또는 위치의 식별을 포함할 것이다. 이미지 데이터의 정황에서, 스펙트럼 이미지 데이터는 전형적으로 시스템이 전체 신호의 스펙트럼 해상도를 포함할 때 이미징 시스템 및 검출기에 대한 보정된 스펙트럼 이미지 데이터와 상관 있는 이미지 데이터에서 유래된 데이터일 것이다. 스펙트럼 데이터는 검출기로부터 추출된 이미지 데이터로부터 획득될 수 있거나, 또는 대안적으로 스펙트럼 데이터의 유도는 스펙트럼 데이터가 검출기로부터 추출되도록 검출기에서 발생할 수 있다.
위에서 설명된 서열분석 방법의 경우, 혼입 사건으로부터의 신호의 결과가 아닌, 검출 시스템에 의해 검출되는 특정 양의 광학 신호가 있을 수 있다. 이러한 신호는 시스템의 "노이즈"를 나타낼 것이며, 모니터링된 반응의 내부, 검출 시스템의 내부 및/또는 위의 모든 것에 대해 외부에 있을 수 있는 다수의 공급원에서 유래될 수 있다. 본 발명의 실행은 유리하게는 선행 기술 방법에 전형적으로 존재하는 이러한 노이즈의 전체 소스를 감소시킨다. 본 발명에 따라 유리하게 감소되는 반응에 대해 내적인 선행 기술의 노이즈의 예로는, 예를 들어 검출 사건과 연관되지 않은 광학 또는 광 방출 사건의 존재, 예를 들어, 용액에 확산되어 있는 혼입되지 않은 염기와 연관이 있는 광 방출, 복합체와 연관되지만 혼입되지 않은 염기; 개별 관찰 체적 또는 영역에 여러 복합체의 존재; 관찰 체적 내에서 기질 또는 효소 복합체에 대한 뉴클레오타이드의 비특이적 흡착; 오염된 뉴클레오타이드 유사체; 예를 들어, 반응 조건의 결과로서, 스펙트럼 이동 염료 성분 등을 포함한다. 다음 뉴클레오타이드-접합체-유사체의 혼입 전에 개별, 제한-기간 폴리머라제-루시퍼라제 반응을 겪는 각 dNTP의 발광-기질-부착-이탈기에 대한 발광-기질로부터의 발광 신호 검출 및 정보의 제어된 사용은 유리하게는 노이즈를 감소 또는 제거하여, 시스템의 신호 대 노이즈를 개선시키고, 염기 호출의 품질 및 연관된 서열 결정을 개선시키는 방법을 제공한다.
검출 시스템에 대해 내적이지만, 반응 혼합물에 대해 외적인 노이즈의 소스로는, 예를 들어, 여과 광학장치를 통해 흘러나오는 반사된 여기 방사선; 기재 또는 임의의 광학 구성요소로부터 산란된 여기 또는 발광 방사선; 인접한 신호 소스의 공간적 혼선; CCD와 같은 검출기로부터의 판독 노이즈, EMCCD 카메라와 같은 기록장치 노이즈 증가 등을 포함한다. 다른 시스템 유래의 노이즈 기여는 배경 교정 오류, 초점 드리프트 오류, 자동 초점 오류, 펄스 주파수 해상도, 정렬 오류 등과 같은 데이터 처리 문제에서 나올 수 있다. 주변광 간섭, 먼지 등을 포함하여 전체 시스템 외부의 소스에서도 또 다른 노이즈 기여가 유래될 수 있다.
이러한 노이즈 성분은 혼입 사건과 연관이 있을 수 있는 임의의 신호 펄스의 기초가 되는 배경 광자에 기여한다. 이와 같이, 노이즈 수준은 전형적으로 임의의 신호 펄스가 통계적으로 유의미한 것으로 결정될 수 있는 한계를 형성할 것이다.
전체 신호 데이터에 대한 노이즈 기여의 식별은, 예를 들어, 임의의 신호 데이터가 관련이 없는 것으로 결정된 경우, 관심 반응의 부재 하에 신호 모니터링을 포함하는 당업계에 잘 공지된 다수의 방법에 의해 수행될 수 있다. 대안적으로, 그리고 바람직하게는, 기준선 신호가 추정되고 시스템에 의해 생성된 신호 데이터로부터 차감되어, 관심 반응에 대한 측정과 동시에 노이즈 측정이 이루어진다. 기준선의 생성 및 적용은 아래에서 더 자세히 설명되는 많은 수단에 의해 수행될 수 있다.
본 발명에 따르면, 신호 처리 방법은 모든 무의미한 펄스-기반 신호 사건에 광범위하게 적용된 노이즈와, 합리적인 신뢰도로 혼입 사건과 연관 있는 것으로 고려될 수 있어 혼입 사건으로서 잠정적으로 식별될 수 있는 유의미한 신호 펄스를 서로 구별한다. 본 발명의 정황에서, 신호 사건은 먼저 이러한 신호 사건이 임의의 다수의 상이한 펄스 기준을 충족하는지 여부에 기초하여 신호 사건이 유의미한 신호 펄스를 구성하는지 여부에 대해 분류된다. 유의미한 펄스로서 식별되거나 분류되면, 신호 펄스는 이 신호 펄스가 혼입 사건을 구성하고 특정 혼입 염기로서 호출될 수 있는지 여부를 결정하기 위해 추가로 평가될 수 있다. 이해되는 바와 같이, 특정 신호 사건을 중요한 펄스로서, 그리고 궁극적으로 혼입 사건으로서 호출하기 위한 기본은 본 명세서에 일반적으로 설명된 바와 같은 다양한 매개변수에 기초하여 특정 양의 오류로 처리될 것이다. 따라서, 신호 데이터를 펄스로 분류하고 궁극적으로 혼입 사건 또는 식별된 염기로서 분류하는 것을 수반하는 본 발명의 양상은 동일하거나 유사한 오류에 처하기 쉽고, 이러한 명명은 논의의 목적으로, 그리고 호출된 염기가 서열에 정확한 염기라는 것이 어느 정도 신뢰를 갖고 예측된다는 표시로서 사용되는 것이지, 호출된 염기가 주어진 서열내 주어진 위치의 실제 염기라는 절대적인 확신의 표시가 아님이 이해될 것이다.
이러한 신호 펄스 기준 중 하나는 모든 배경 노이즈의 수준에 대한 문제의 신호 사건과 연관된 신호의 비율("신호 대 노이즈비" 또는 "SNR")이며, 이는 신호 사건을 유의미한 신호 펄스로 분류할 수 있는 신뢰도 또는 통계적 유의성의 척도를 제공한다. 유의미한 펄스 신호를 시스템적 또는 기타 노이즈 성분과 구별하는 데 있어서, 신호는 일반적으로 신호 강도, 신호 지속 시간, 일시적인 신호 펄스 모양, 펄스 간격, 및 펄스 스펙트럼 특성 등을 비롯한 하나 이상의 많은 계량값에서 신호 임계 수준을 초과해야 한다.
간단한 예로서, 신호 데이터는 처리 시스템에 입력될 수 있다. 신호 데이터가 신호 강도 및 신호 지속 시간 중 하나 이상에서 신호 임계값을 초과한다면, 유의미한 펄스 신호로 간주될 수 있다. 유사하게, 추가 계량값이 임계치로서 이용되는 경우, 신호는 특정 신호 사건을 유의미한 펄스로 식별하는 데 있어서 이러한 계량값에 대해 비교될 수 있다. 이해할 수 있듯이, 이러한 비교는 전형적으로 전술한 계량값 중 적어도 하나, 바람직하게는 적어도 2개의 그러한 임계값, 및 많은 경우에 유의미한 펄스를 식별하는 데 있어서 전술한 임계값 중 3개 또는 4개 모두를 포함할 것이다.
신호 강도, 신호 지속 시간, 펄스 모양, 간격 또는 펄스 스펙트럼 특성, 또는 이들의 조합의 측면에서이든지 간에 신호 임계값은 일반적으로 이전 실험 데이터로부터 예측된 신호 프로파일을 기반으로 하여 결정될 것이지만, 일부 경우에 이러한 임계값은 전체 신호 데이터의 백분율로부터 식별될 수 있으며, 여기서 통계적 평가는 이러한 임계화가 적절함을 나타낸다. 특히, 일부 경우에 임계값 신호 강도 및/또는 신호 지속 시간은 전체 신호 데이터의 특정 분율 또는 백분율을 제외한 모든 것을 제외하도록 설정되어 임계값의 실시간 설정을 허용할 수 있다. 그러나 다시, 백분율 또는 절대 신호 값의 면에서 임계 수준의 식별은 일반적으로 이전 실험 결과와 상관성이 있을 것이다. 대안적인 양상들에서, 신호 임계값들은 주어진 평가의 정황에서 결정될 수 있다. 특히, 예를 들어, 펄스 강도 임계값은 절대 신호 강도를 기반으로 할 수 있지만, 이러한 임계값은 사용되는 임계값에 영향을 미칠 수 있는, 특히 신호가 배경 수준에 비해 상대적으로 약한 경우에는 시약 확산 등을 통해 신호 배경 수준의 변동을 감안하지 않아도 된다. 이와 같이, 특정 양상에서, 본 발명의 방법은 문제의 특정 반응의 배경 발광을 결정하는데, 이는 미세액적 내로 자유롭게 확산하는 발광-기질 또는 뉴클레오타이드-접합체-유사체의 기여가 최소이거나 존재하지 않기 때문에 비교적 작으며, 신호 임계값을 바람직한 수준에 의해, 예를 들어, 배경 발광-기질 확산에 대한 펄스 강도의 비율로서, 또는 5 시그마 등과 같은 통계 방법에 의해 실제 배경보다 높게 설정한다. 최소 발광-기질 확산 배경과 같은 실제 반응 배경을 교정함으로써 임계값은 염료 농도, 레이저 출력 등의 변동 영향에 대해 자동으로 보정된다. 반응 배경이란 관심 반응과 구체적으로 연관된 배경 신호의 수준을 의미하며, 배경에 대한 시스템적 기여, 예를 들어, 시스템 또는 기질 구성요소의 자가발광, 레이저 블리드스루 등과 대조적으로, 반응 조건에 따라 달라지는 것으로 예측될 것이다.
혼입 사건의 실시간 검출에 의존적인 특히 바람직한 양태에서, 유의미한 신호 펄스의 식별은 신호 강도 및 신호 지속 시간 모두의 임계값을 가로지르는 신호 프로파일에 의존적일 수 있다. 예를 들어, 증가하는 방향으로 낮은 강도 임계값을 교차하는 신호가 검출되면, 동일한 세트의 검출 요소(예를 들어, 픽셀)로부터 후속되는 신호 데이터는 감소하는 방향으로 신호 강도가 동일하거나 상이한 강도 임계값을 교차할 때까지 모니터링된다. 적절한 강도의 피크가 검출되면, 강도 임계값 또는 임계값들을 초과한 기간의 지속 시간을 지속 시간 임계값과 비교한다. 피크가 충분한 지속 시간의 충분히 강한 신호를 포함하는 경우, 이를 유의미한 신호 펄스라고 부른다.
강도 및 지속 시간 임계값을 사용하는 것에 추가하여 또는 이에 대한 대안으로서, 펄스 분류는 펄스를 유의미한 것으로 분류하는 데 있어서 다수의 다른 신호 매개변수를 사용할 수 있다. 이러한 신호 매개변수는 예를 들어, 펄스 형상, 신호의 스펙트럼 프로파일, 예를 들어, 펄스 스펙트럼 중심, 펄스 높이, 펄스 확산 비율, 펄스 간격, 총 신호 수준 등을 포함한다.
유의미한 신호 펄스의 식별 이후 또는 이전에, 신호 데이터는 특정 신호 유형과 상관될 수 있다. 본 발명과 함께 사용된 광학적 검출 방식의 정황에서, 이것은 전형적으로 신호 데이터를 발생시키는 신호의 특정 스펙트럼 프로파일을 나타낸다. 특히, 본 발명의 방법 및 공정과 함께 사용되는 광학 검출 시스템은 일반적으로 구별가능한 스펙트럼 프로파일을 갖는 광학 신호를 수신하도록 구성되며, 여기서 각각의 스펙트럼적으로 구별가능한 신호 프로파일은 일반적으로 상이한 반응 사건과 상관이 있을 수 있다. 예를 들어, 핵산 서열분석의 경우, 각각의 스펙트럼으로 구별가능한 신호는 핵산 서열의 주어진 위치에 혼입되거나 존재하는 특정 뉴클레오타이드와 상관되거나 나타낼 수 있다. 결과적으로, 검출 시스템은 이러한 신호를 수신하고 이의 스펙트럼에 기초하여 신호를 분리하는 광학 트레인(train)을 포함한다. 상이한 신호는 그 다음 상이한 검출기로, 단일 어레이 기반 검출기 상의 상이한 위치로 지향되거나, 또는 동일한 이미징 검출기 상에서 차등적으로 이미지화된다(예를 들어, 모든 목적을 위해 전체가 본 명세서에 참조에 의해 원용되는 미국 특허 제7,805,081호 참조).
상이한 신호 스펙트럼에 대해 상이한 검출기를 사용하는 시스템의 경우, 주어진 신호에 대한 신호 유형의 할당(논의의 편의를 위해 이하 "색상 분류", "파장" 또는 "스펙트럼 분류"라고 지칭함)은 데이터가 유래된 검출기와 신호 펄스를 상관짓는 일이다. 특히, 각각의 분리된 신호 성분이 별개의 검출기에 의해 검출되는 경우, 그 검출기에 의한 신호 검출은 필수 색상으로 분류한 신호를 나타낸다.
그러나, 바람직한 양상에서, 본 발명과 함께 사용된 검출 시스템은 전체 신호의 상이한 스펙트럼 성분의 모든 또는 적어도 몇몇이 상이한 스펙트럼 성분 사이의 차이를 허용하는 방식으로 이미지화되는 이미징 검출기를 활용한다. 따라서, 다중 신호 성분은 동일한 전체 검출기로 유도되지만, 검출기의 완전히 또는 부분적으로 다른 영역에 입사될 수 있고, 예를 들어, 이미징 검출기의 상이한 픽셀 세트 상에 이미지화되고, 구별가능한 스펙트럼 이미지(및 관련 이미지 데이터)를 발생시킨다. 본 명세서에 사용된 바와 같이, 스펙트럼 또는 스펙트럼 이미지는 일반적으로 반응 위치로부터 수신된 광학 신호의 스펙트럼 확산에 의해 야기되는 다중 강도를 갖는 픽셀 이미지 또는 프레임(선택적으로 데이터는 1차원으로 축소됨)을 나타낸다.
가장 간단한 형태로, 검출기에서 인접한 검출 요소 또는 픽셀의 그룹에 입사하는 신호 사건에 대한 색상의 할당은 별도의 검출기에 대해 설명한 것과 유사한 방식으로 달성될 수 있다. 특히, 신호가 이미지화 시, 및 신호 데이터가 유래되는 것으로부터 픽셀 그룹의 위치는 신호 성분의 색상을 나타낸다. 하지만, 특히 바람직한 양상에서, 신호 성분의 공간적 분리는 완전하지 않을 수 있어, 구별되는 색상의 신호가 픽셀의 중첩 세트 상에 이미지화되도록 한다. 이처럼, 신호 식별은 일반적으로 신호가 입사되는 다중 픽셀의 총체적 정체(또는 신호 성분의 전체 이미지)를 기반으로 할 것이다.
특정 신호가 유의미한 펄스로 식별되고 특정 스펙트럼을 할당한다면, 스펙트럼적으로 할당된 펄스는 이 펄스가 혼입 사건으로 불릴 수 있고, 결과적으로 발생기 가닥에 혼입된 염기, 또는 주형 서열에 이의 보체를 호출할 수 있는지 여부를 결정하기 위해 추가로 평가될 수 있다. 발광-기질-부착-이탈기(예를 들어, PPi-C1, PPi-FMNH2 등)로부터의 신호는 호출되어야 하는 염기를 식별하는 데 사용된다. 상기 제시한 바와 같이, 일 실시형태에서, 본 발명의 2 효소 폴리머라제-루시퍼라제 반응 시스템을 이용함으로써, 혼입 사건에 대한 높은 신뢰도와 상관관계가 있을 수 있는 특징적 신호 세트가 생성된다.
또한, 색상 할당된 펄스 데이터로부터 염기의 호출은 전형적으로 염기가 호출되는 신뢰도 수준도 식별하는 테스트를 사용할 것이다. 전형적으로, 이러한 테스트는 유의미한 펄스를 식별하는 데 사용된 다수의 동일한 데이터 매개변수를 포함하여 신호가 수신되는 데이터 환경을 고려해야 할 것이다. 예를 들어, 이러한 테스트는 배경 신호 수준, 인접 펄스 신호 매개변수(간격, 강도, 지속 시간 등), 스펙트럼 이미지 해상도 및 기타 다양한 매개변수에 대한 고려를 포함할 수 있다. 이러한 데이터는 색상 할당된 신호 펄스에 대한 주어진 염기 호출에 점수를 할당하는데 사용될 수 있고, 이러한 점수는 호출된 염기가 부정확할 확률, 예를 들어, 1/100(99% 정확도), 1/1000(99.9% 정확도), 1/10,000(99.99% 정확도), 1/100,000(99.999% 정확도) 또는 그 이상과 상관관계가 있는 것이다. 크로마토그래피로 유도된 서열 데이터에 대한 PHRED 또는 유사한 유형의 득점과 유사하게, 이러한 점수는 서열분석 데이터에 대한 정확도 표시를 제공하고/하거나 정확도가 불충분한 서열 정보를 필터링하는 데 사용될 수 있다.
염기가 충분한 정확도로 호출되면, 동일한 서열분석 실행 및 동일한 프라이머 확장 반응에서 호출된 후속 염기는 그 다음 각각 이전에 호출된 각 염기에 첨부되어 주형 또는 발생기 가닥의 전체 서열에 염기 서열을 제공할 수 있다. 반복 처리 및 추가 데이터 처리를 사용하여 임의의 공백을 채우고, 주어진 서열에 대한 임의의 잘못 호출된 염기 등을 교정할 수 있다.
본 발명의 특정 실시형태에 따른 반응 위치의 어레이에서 혼입 반응에 의한 서열분석 분석은 모든 목적을 위해 전체가 본 명세서에 참조에 의해 원용된 미국 특허 제9,447,464호의 도 13에 도해적으로 예시된 바와 같이 수행될 수 있다. 예를 들어, 카메라에 의해 포착된 데이터는 스펙트럼의 시간 순서이기도 한 동영상으로 표현된다. 스펙트럼 보정 주형은 스펙트럼으로부터 트레이스를 추출하는 데 사용된다. 그런 다음, 트레이스에서 식별된 펄스를 사용하여 스펙트럼 데이터로 돌아가서 해당 데이터로부터 각 펄스에 대해 시간적으로 평균을 낸 펄스 스펙트럼을 생성하고, 이러한 펄스 스펙트럼은 효소 입체형태적 변화와 관련된 사건에 대한 스펙트럼을 포함할 것이다. 스펙트럼 보정 주형은 펄스 스펙트럼을 특정 염기로 분류하는 데에도 사용된다. 그런 다음 염기 분류 및 펄스 및 트레이스 계량값을 저장하거나 추가 분석을 위해 다른 로직으로 전달한다. 다운스트림 분석은 염기 호출에 대한 혼입 사건의 결정에 도움을 주기 위해 효소 입체형태적 변화로부터의 정보를 사용하는 것을 포함할 것이다. 본 발명에 사용하기 위한 추가적인 염기 호출 및 서열 결정 방법은 예를 들어, 모든 목적을 위해 전체가 본 명세서에 참조에 의해 원용되는 US 제8,182,993호에 기술된 것을 포함할 수 있다.
폴리머라제에 더 최적화된 환경에서 폴리머라제 사용을 가능하게 하는 본 발명의 단일 분자 서열분석 방법의 이점은 서열분석 실행당 달성된 매우 낮은 오류율; 또는 다시 말해서, 서열실행당 얻어진 실질적으로 높은 수준의 서열 정확도이다. 예를 들어, 천연 폴리머라제는 1억개의 염기당 1개의 오류를 만들며; 이는 본 명세서에 제공된 본 발명의 LASH 서열분석 방법에 대한 표적 오류율로서 본 명세서에서 상정된다. 또한 표적 핵산 주형마다 복수의 폴리머라제를 사용하는 본 발명에 따르면, 오류율은 판독 길이와 독립적이며; 따라서, 오류율은 보다 높은 충실도의 폴리머라제의 선택에 의해 개선될 수 있고 그 결과 더 적은 적용범위를 필요로 하며; 또한 복수의 폴리머라제를 이용함으로써 매우 긴 판독 길이를 달성할 수 있다. 적용범위 전 실행당 본 발명의 방법에서 사용되는 폴리머라제에 의해 달성되는 오류율이 고려되며, 1% 내지 30%, 1% 내지 20%, 1% 내지 10%, 1% 내지 5%, 1% 내지 3%, 1% 내지 2%, 0.000001% 내지 1%, 0.00001% 내지 1%, 0.0001% 내지 1%, 0.001% 내지 1%, 0.01% 내지 1%, 0.000001% 내지 0.00001%, 0.000001% 내지 0.0001%, 0.000001% 내지 0.001%로부터 선택된 범위에서 상정된다.
이런 이점은 산업 표준에 의해 정의되는 바와 같은 정확한 서열을 얻기 위해 필요한 전체 적용범위를 감소시키며, 이는 그에 상응하여 뉴클레오타이드 서열을 얻는 전반적인 비용을 감소시킨다. 본 명세서에 사용되는 바와 같은 적용범위는 산업 표준 내에서 특정 표적 핵산 서열에 대한 정확한 서열을 얻는 데 필요한 서열분석 실행 수를 지칭한다.
실시예
실시예 - 발광-기반 단일 분자 서열분석
단일 분자 서열분석 반응을 거치기 전에, 각각의 발광 기질을 각각 dATP, dTTP, dGTP 및 dCTP마다 상응하는 dNTP의 말단 포스페이트에 부착시킨다. 각 dNTP 염기(A, T, G, C)에 대해 상이한 발광-기질이 있다(도 1A 및 도 1B). 단일 분자 서열분석 반응 동안에, DNA 폴리머라제와의 상호작용 시, DNA 폴리머라제는 상보성 주형 가닥에 dNTP 뉴클레오타이드-접합체-유사체를 결합시키면서, 부착된 발광-기질(PPi-C1, 도 2B 및 PPi-FMNH2, 도 3B)을 포함하는 파이로포스페이트를 절단 및 방출한다.
일단 방출되면, 표지된 파이로포스페이트(PPi-C1; PPi-FMNH2)는 루시퍼라제에 결합하는 데 사용되고, 효소 촉매 작용의 결과로서 개별 및 제한된 시간 동안 발광을 생성한다(도 2C 및 도 3C). 이는 생물발광의 개별 및 제한된 기간(수명) 동안 검출 가능한 발광 방출을 초래하며, 이 광 방출 스펙트럼은 주형 가닥에 혼입된 각 dNTP에 대응한다. 따라서, DNA 폴리머라제와 상호작용하는 dNTP의 결과로서, 발광 광은 발광-효소 및 발광-기질에 의해 생성되는 발광 반응에 의해 생성되어, 특정 dNTP에 대해 선택된 파장에 상응하는 발광 신호를 생성한다. 각 발광성 광은 개별 및 제한된 기간 후 광 바니싱(light vanishing) 전에, 예컨대, 일 실시형태에서, 다음의 dNTP의 첨가 전에 검출된다.
이 dNTP 혼입 과정은 원하는 핵산 판독 길이가 달성될 때까지 반복된다.
본 실시형태가 본 명세서의 예시적인 실시형태를 참조하여 구체적으로 제시되고 설명되었지만, 본 기술분야의 기술자라면, 형태 및 세부사항의 다양한 변경이 이하 청구범위에 의해 정의된 바와 같은 본 실시형태의 사상 및 범위를 벗어남이 본 발명 내에서 이루어질 수 있음을 이해할 것이다. 본 기술분야의 기술자는 본 명세서에 기재된 특정 절차에 대해 수많은 등가물이 있음을 통상적인 실험 이상을 사용함이 없이 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 본 발명의 범위 내에 있는 것으로 간주되며 다음 청구범위에 의해 커버된다. 본 출원 전반에 걸쳐 인용된 모든 비특허 문헌 간행물, 특허 및 특허 출원의 내용은 모든 목적을 위해 그 전체가 본 명세서에 참조에 의해 원용된다. 이들 특허, 출원 및 기타 문서의 적절한 구성요소, 공정 및 방법은 본 발명 및 이의 실시형태에 대해 선택될 수 있다.

Claims (36)

  1. 핵산 주형을 서열분석하는 방법으로서,
    (i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 및 프라이머, 및 (iv) 길어지는(growing) 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는 서열분석 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 상기 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 상이한 발광-기질을 가지며, 상기 발광-기질-부착-이탈기는 상기 주형 가닥에 대한 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 시 절단되는, 서열분석 혼합물을 제공하는 단계;
    복수의 뉴클레오타이드-접합체-유사체가 상기 주형에 순차적으로 첨가되어: a) 뉴클레오타이드-접합체-유사체가 상기 폴리머라제와 회합하고, b) 해당 뉴클레오타이드-접합체-유사체 상의 상기 발광-기질-부착-이탈기가 폴리머라제에 의해 절단될 때 상기 뉴클레오타이드-접합체-유사체는 상기 폴리머라제에 의해 상기 주형 가닥에 혼입되되, 상기 발광-기질-부착-이탈기는 발광 반응에서 발광-효소와 조합되고, 상기 발광-기질은 제한된 기간 동안 뉴클레오타이드-특이적-발광을 생성되도록 발생-효소에 의해 촉매되게, 핵산 합성을 수행하는 단계; 및
    핵산 합성이 일어나는 동안 뉴클레오타이드-특이적-발광 신호(광)를 검출하고, 상기 주형 핵산의 서열을 결정하기 위해 각각의 개별 발광 기간 동안 검출된 뉴클레오타이드-특이적-발광 신호를 이용하는 단계
    를 포함하는, 핵산 주형을 서열분석하는 방법.
  2. 제1항에 있어서, 상기 발광-기질은 콜렌타라진(colentarazine) 또는 이의 유사체; FMNH2 또는 이의 유사체; 루미놀, 아이소루미놀, 아크리디늄, 다이옥세탄, 퍼옥시옥살산 및 이들의 유도체로 이루어진 군으로부터 선택되는, 핵산 주형을 서열분석하는 방법.
  3. 제1항 또는 제2항에 있어서, 뉴클레오타이드의 각각의 염기는 다른 염기에 비해서 고유 발광-기질로 표지된, 핵산 주형을 서열분석하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 발광-효소는 루시퍼라제 또는 발광단백질(photoprotein)인, 핵산 주형을 서열분석하는 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 루시퍼라제는 레닐라(Renilla) 루시퍼라제, 가우시아(Gaussia) 루시퍼라제, 비브리오 하베이(Vibrio harveyi) 루시퍼라제, 비브리오 피셔리(Vibrio fischeri) 루시퍼라제, 포토박테리움 피셔리(Photobacterium fischeri) 루시퍼라제, 포토박테리움 포스포레움(Photobacterium phosphoreum) 루시퍼라제, 포토박테리움 레이오그나티(P. leiognathi) 루시퍼라제 및 포토하두스 루미네센스(P. luminescens) 루시퍼라제로 이루어진 군으로부터 선택된, 핵산 주형을 서열분석하는 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 발광단백질은 에쿠오린(aequorin) 및 오블린(obelin)으로 이루어진 군으로부터 선택된, 핵산 주형을 서열분석하는 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 폴리머라제 효소는 DNA 폴리머라제인, 핵산 주형을 서열분석하는 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 뉴클레오타이드-접합체-유사체 유형은 dATP, dTTP, dGTP, dCTP, dUTP, dGTPαS, dCTPαS, dTTPαS 및 dATPαS로 이루어진 군으로부터 선택된 뉴클레오타이드를 포함하는, 핵산 주형을 서열분석하는 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 복수의 폴리머라제 효소가 사용되는, 핵산 주형을 서열분석하는 방법.
  10. 주형 핵산의 서열분석 방법으로서,
    표적 주형 핵산, 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하는 서열분석 혼합물을 제공하는 단계로서, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 상이한 발광-기질, 발광-효소 및 복수의 폴리머라제 효소을 갖는, 단계;
    복수의 뉴클레오타이드-접합체-유사체가 상기 주형에 순차적으로 첨가되도록 핵산 합성을 수행하는 단계; 및
    핵산 합성이 일어나는 동안 각각의 뉴클레오타이드-접합체-유사체를 검출하여, 상기 주형 핵산 서열을 결정하는 단계
    를 포함하는, 주형 핵산의 서열분석 방법.
  11. 샘플에서 표적 핵산 서열의 존재를 검출하는 방법으로서,
    (i) 폴리머라제 효소, (ii) 발광 효소, (iii) 주형 핵산 샘플, (iv) 특정 표적 핵산 서열에 혼성화하는(예를 들어, 이에 상보성인) 프라이머-프로브, 및 (v) 길어지는 핵산 가닥의 주형 지시 합성을 수행하기 위한 성분을 갖는 폴리머라제-발광 시약 용액을 포함하는, 연장 혼합물을 제공하는 단계로서, 상기 시약 용액은 복수 유형의 뉴클레오타이드-접합체-유사체를 포함하고, 각각은 이에 부착된 발광-기질을 갖되; 뉴클레오타이드-접합체-유사체의 각 유형은 상기 폴리머라제에 의해 절단 가능한 발광-기질-부착-이탈기를 갖고, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 동일 또는 상이한 발광-기질을 가지며, 상기 발광-기질-부착-이탈기는 상기 주형 가닥에 대한 각각의 뉴클레오타이드-접합체-유사체의 폴리머라제-의존적 결합 시 절단되는, 연장 혼합물을 제공하는 단계;
    상기 프라이머-프로브가 상기 표적 핵산 서열에 혼성화되는 경우, 상기 복수의 뉴클레오타이드-접합체-유사체가 상기 주형에 순차적으로 첨가되어: a) 뉴클레오타이드-접합체-유사체가 상기 폴리머라제와 회합하고, b) 해당 뉴클레오타이드-접합체-유사체 상의 상기 발광-기질-부착-이탈기가 상기 폴리머라제에 의해 절단될 때 상기 뉴클레오타이드-접합체-유사체는 상기 폴리머라제에 의해 상기 주형 가닥에 혼입되되, 상기 발광-기질-부착-이탈기는 발광 반응에서 발광-효소와 조합되고, 상기 발광-기질은 발광을 생성하도록 상기 발생-효소에 의해 촉매되게, 핵산 연장 합성을 수행하는 단계; 및
    핵산 합성이 일어나는 동안 상기 발광으로부터 광을 검출하는 단계로서, 광의 검출은 상기 특정 표적 핵산 서열의 존재를 나타내는, 검출하는 단계
    를 포함하는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  12. 제11항에 있어서, 상기 표적 핵산의 양은 정량화되는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  13. 제11항에 있어서, 상기 표적 핵산의 양은 상기 발광 강도에 기반하여 정량화되는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서, 뉴클레오타이드-접합체-유사체의 각 유형은 이에 부착된 동일한 발광-기질을 갖는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 복수의 폴리머라제 효소가 사용되는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 복수의 폴리머라제 효소는 적어도: 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000개 및 적어도 1000000개의 폴리머라제 효소로 이루어진 군으로부터 선택된 양으로 사용되는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 복수의 폴리머라제 효소는 적어도 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 150:1, 200:1, 250:1, 300:1, 350:1, 400:1, 450:1, 500:1, 550:1, 600:1, 650:1, 700:1, 750:1, 800:1, 850:1, 900:1, 950:1, 1000:1, 10000:1, 20000:1, 30000:1, 40000:1, 50000:1, 60000:1, 70000:1, 80000:1, 90000:1, 100000:1, 200000:1, 300000:1, 400000:1, 500000:1, 600000:1, 700000:1, 800000:1, 900000:1 및 적어도 1000000:1로 이루어진 군으로부터 선택되는 폴리머라제 대 주형의 비로 사용되는, 샘플에서 표적 핵산 서열의 존재를 검출하는 방법.
  18. 데옥시리보뉴클레오타이드(dNTP), 또는 이의 유사체; 및 이에 부착된 발광-기질을 포함하는, 발광-기질-뉴클레오타이드-접합체-유사체.
  19. 제18항에 있어서, 상기 발광-기질-뉴클레오타이드-접합체-유사체 내의 상기 뉴클레오타이드(dNTP)는 변형된 뉴클레오타이드 유사체인, 발광-기질-뉴클레오타이드-접합체-유사체.
  20. 제18항에 있어서, 상기 dNTP는 dATP, dTTP, dGTP, dCTP 및 dUTP, dATPαS, dGTPαS, dCTPαS, dTTPαS 및 dUTPαS로 이루어진 군으로부터 선택되는, 발광-기질-뉴클레오타이드-접합체-유사체.
  21. 제18항에 있어서, 상기 뉴클레오타이드-접합체-유사체는 상기 폴리머라제에 대한 그리고 선택적 절단 활성에 대한 기질일 수 있는, 발광-기질-뉴클레오타이드-접합체-유사체.
  22. 제18항에 있어서, 상기 뉴클레오타이드-접합체-유사체는 길어지는 주형 지시 가닥에 혼입 시 절단되는 상기 폴리포스페이트 사슬의 일부에 부착되는 발광 기질을 갖는 폴리포스페이트 사슬에 3개 이상의 포스페이트를 갖는 뉴클레오사이드 폴리포스페이트인, 발광-기질-뉴클레오타이드-접합체-유사체.
  23. 제22항에 있어서, 상기 폴리포스페이트는 순수한 폴리포스페이트(--O--PO3-), 파이로포스페이트(PPi) 또는 치환을 갖는 폴리포스페이트인, 발광-기질-뉴클레오타이드-접합체-유사체.
  24. 제18항에 있어서, 상기 발광-기질은 콜렌타라진 또는 이의 유사체; FMNH2 또는 이의 유사체; 루미놀, 아이소루미놀, 아크리디늄, 다이옥세탄, 퍼옥시옥살산 및 이들의 유도체로 이루어진 군으로부터 선택되는, 발광-기질-뉴클레오타이드-접합체-유사체.
  25. 제18항에 있어서, 상기 발광-기질은 말단의 포스페이트에 부착된, 발광-기질-뉴클레오타이드-접합체-유사체.
  26. 제25항에 있어서, 상기 PPi 발광-기질-부착-이탈기가 폴리머라제에 의해 생성될 때, 상기 발광-기질 뉴클레오타이드-접합체가 상기 주형 가닥에 혼입되는 경우, 상기 발광-기질-부착-파이로포스페이트 또는 발광-기질-부착-이탈기는 각각의 루시퍼라제와 조합될 수 있는, 발광-기질-뉴클레오타이드-접합체-유사체.
  27. 제26항에 있어서, 상기 PPi 발광-기질-부착-이탈기는 PPi-LS, PPi-C; 또는 PPi-FMNH2로부터 선택되는, 발광-기질-뉴클레오타이드-접합체-유사체.
  28. 제18항에 있어서, 상기 뉴클레오타이드-접합체-유사체는 고유 발광 신호를 갖는, 발광-기질-뉴클레오타이드-접합체-유사체.
  29. 제28항에 있어서, 상기 발광 신호는 250㎚ 내지 750㎚ 범위로부터 선택되는 파장인, 발광-기질-뉴클레오타이드-접합체-유사체.
  30. 제28항에 있어서, 상기 발광 신호는 411, 417, 428, 440, 484 및 509㎚로 이루어진 군으로부터 선택된 파장인, 발광-기질-뉴클레오타이드-접합체-유사체.
  31. 사슬-연장 세트가 길어지는 핵산 가닥의 주형 지시 합성에 혼입될 수 있도록, 적어도 4개의 별도의 데옥시리보뉴클레오타이드(dNTP)를 포함하는, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트.
  32. 제31항에 있어서, 폴리머라제가 주형 DNA에 상보성인 가닥에 변형된 데옥시리보뉴클레오사이드 트라이포스페이트(dNTP) 뉴클레오타이드-접합체-유사체를 혼입시킬 때마다, 부착된 각각의 뉴클레오타이드에 특이적인 발광 신호가 생성되도록, 각각의 dNTP, 또는 이의 유사체는 다른 dNTP에 비해서 상이한, 고유 발광 기질을 이용하여 변형되는, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트.
  33. 제31항에 있어서, 변형된 dTTP와 dUTP 유사체가 둘 다 반응에서 사용된다면, 이들은 각각 이에 부착된 동일한 발광 기질을 가져서, 동일한 파장 신호를 생성할 수 있거나; 또는 각각은 이들에 부착된 개별 발광 기질을 가질 수 있는, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트.
  34. 제31항에 있어서, 상기 dNTP는 dATP, dTTP, dGTP, dCTP 및 dUTP, dATPαS, dGTPαS, dCTPαS, dTTPαS 및 dUTPαS로 이루어진 군으로부터 선택되는, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트.
  35. 제31항에 있어서, 발광-기질은 콜렌타라진 또는 이의 유사체; FMNH2 또는 이의 유사체; 루미놀, 아이소루미놀, 아크리디늄, 다이옥세탄, 퍼옥시옥살산 및 이들의 유도체로 이루어진 군으로부터 선택되는, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트.
  36. 제31항에 있어서, 코엘렌테라진-dNTP 접합체 1(도 7); 코엘렌테라진-dNTP 접합체 2(도 8); 또는 코엘렌테라진-dNTP 접합체 3(도 9)으로부터 선택된, 뉴클레오타이드-접합체-유사체의 사슬-연장 세트.
KR1020227037538A 2020-03-27 2021-03-29 단일 분자 서열분석 및 표적 핵산 검출을 위한 lash 방법 KR20230020950A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063000979P 2020-03-27 2020-03-27
US63/000,979 2020-03-27
PCT/US2021/024721 WO2021195635A1 (en) 2020-03-27 2021-03-29 Lash methods for single molecule sequencing & target nucleic acid detection

Publications (1)

Publication Number Publication Date
KR20230020950A true KR20230020950A (ko) 2023-02-13

Family

ID=77890646

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227037538A KR20230020950A (ko) 2020-03-27 2021-03-29 단일 분자 서열분석 및 표적 핵산 검출을 위한 lash 방법

Country Status (7)

Country Link
US (1) US20230175054A1 (ko)
EP (1) EP4127230A1 (ko)
JP (1) JP2023519333A (ko)
KR (1) KR20230020950A (ko)
CN (1) CN116034167A (ko)
CA (1) CA3173699A1 (ko)
WO (1) WO2021195635A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000009487A1 (en) * 1998-08-11 2000-02-24 Bayer Corporation Near infrared chemiluminescent acridinium compounds and uses thereof
US20050147965A1 (en) * 2003-12-31 2005-07-07 Zhong Zhandong D. Compositions and methods for detecting reverse transcriptase in a sample
JP7036343B2 (ja) * 2017-03-28 2022-03-15 国立大学法人電気通信大学 新規セレンテラジン誘導体
CA3133334A1 (en) * 2018-03-13 2019-09-19 Inanc ORTAC Methods for single molecule sequencing
CN112105749A (zh) * 2018-05-11 2020-12-18 深圳华大智造科技有限公司 聚底物及其使用方法

Also Published As

Publication number Publication date
CN116034167A (zh) 2023-04-28
EP4127230A1 (en) 2023-02-08
US20230175054A1 (en) 2023-06-08
CA3173699A1 (en) 2021-09-30
WO2021195635A1 (en) 2021-09-30
JP2023519333A (ja) 2023-05-10

Similar Documents

Publication Publication Date Title
US20210040554A1 (en) Methods for single molecule sequencing
Gandelman et al. Novel bioluminescent quantitative detection of nucleic acid amplification in real-time
JP5160433B2 (ja) 迅速並行核酸分析
US9587275B2 (en) Single molecule sequencing with two distinct chemistry steps
US6274320B1 (en) Method of sequencing a nucleic acid
Mori et al. Real-time turbidimetry of LAMP reaction for quantifying template DNA
US20220033894A1 (en) Methods for single molecule sequencing
US20100184159A1 (en) Compositions, Methods, and Kits for Selective Amplification of Nucleic Acids
KR20230020950A (ko) 단일 분자 서열분석 및 표적 핵산 검출을 위한 lash 방법
US20110045485A1 (en) Analytical method and kit
US20230080657A1 (en) Methods for nucleic acid sequencing
US20240124929A1 (en) Mesophilic compositions for nucleic acid amplification
Gandelman et al. Novel Bioluminescent Quantitative Detection of Nucleic Acid Amplification in