JP2022174137A - 化学組成物とそれを利用する方法 - Google Patents

化学組成物とそれを利用する方法 Download PDF

Info

Publication number
JP2022174137A
JP2022174137A JP2022136803A JP2022136803A JP2022174137A JP 2022174137 A JP2022174137 A JP 2022174137A JP 2022136803 A JP2022136803 A JP 2022136803A JP 2022136803 A JP2022136803 A JP 2022136803A JP 2022174137 A JP2022174137 A JP 2022174137A
Authority
JP
Japan
Prior art keywords
nucleic acid
detectable label
acid molecule
nucleotides
attachment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022136803A
Other languages
English (en)
Other versions
JP7532458B2 (ja
Inventor
ホアン マーガレット
Hoang Margaret
グレゴリー マーク
Gregory Mark
キム テ
Dae Kim
エル.ダナウェイ ドウェイン
L Dunaway Dwayne
エー.マンラオ エリザベス
A Manrao Elizabeth
エム.ビーチェム ジョーセフ
M Beechem Joseph
カフィゾフ ルステム
Khafizov Rustem
コルコンダ サンガミスラ
Korukonda Sanghamithra
デン イ
Yi Deng
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanostring Technologies Inc
Original Assignee
Nanostring Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanostring Technologies Inc filed Critical Nanostring Technologies Inc
Publication of JP2022174137A publication Critical patent/JP2022174137A/ja
Application granted granted Critical
Publication of JP7532458B2 publication Critical patent/JP7532458B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6825Nucleic acid detection involving sensors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/518Detection characterised by immobilisation to a surface characterised by the immobilisation of the nucleic acid sample or target

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

【課題】酵素なし、増幅なし、ライブラリなしで迅速に実施され、読み出し長が長くてエラー率が低い核酸シークエンシングを提供するシークエンシング用プローブと、レポータプローブと、方法を提供する。【解決手段】少なくとも6個の二次核酸分子とハイブリダイズする一次核酸分子を含むプローブであって、前記複数の二次核酸分子のそれぞれが、少なくとも5個の三次核酸分子にハイブリダイズしており、前記の三次核酸分子のそれぞれが、少なくとも1個の検出可能な標識を含む、プローブを提供する。【選択図】なし

Description

関連する出願の相互参照
本出願は、2016年11月21日に出願されたアメリカ合衆国仮出願第62/424,887号と、2017年2月10日に出願されたアメリカ合衆国仮出願第62/457,237号と、2017年7月24日に出願されたアメリカ合衆国仮出願第62/536,147号の優先権と恩恵を主張する。上記特許出願のそれぞれの内容は、前記全体が参照によって本明細書に組み込まれている。
配列リスト
本出願は、EFS-Webを通じてASCII形式で提出された配列リストを含有しており、前記全体が参照によって本明細書に組み込まれている。このASCIIのコピーは2017年11月20日に作成されてNATE033-001WO_SeqList_ST25.txtと名づけられており、サイズは19,351バイトである。
現在、核酸のシークエンシング、すなわち核酸分子の中のヌクレオチドの正確な順番を求めるプロセスにはさまざまな方法がある。現在の方法は、核酸を酵素によって増幅すること(例えばPCR)および/またはクローニングによって増幅することを必要とする。光検出手段によって検出できる信号を発生させるには、酵素によるさらなるポリマー化が必要とされる。したがって本分野では、迅速で増幅と酵素が不要な核酸シークエンシングの方法が必要とされている。本開示は前記ような必要性に応える。
本開示により、読み出し長が長く、エラー率が小さく、迅速で、酵素と増幅とライブラリが不要な核酸シークエンシングを提供するシークエンシング用プローブと、方法と、キットと、装置が提供される。本明細書に記載したシークエンシング用プローブはバーコードドメインを含んでいて、前記バーコードドメインの中の各位置は、標的結合ドメインの中の少なくとも2個のヌクレオチドに対応している。さらに、この方法、キット、装置は、サンプルから結果を迅速に取得する能力を有する。これらの特徴は、臨床状況におけるシークエンシングで特に有用である。本開示は、アメリカ合衆国特許出願公開第2016/0194701号に開示されている開示内容(前記内容全体が参照によって本明細書に組み込まれている)の改良である。
本開示により、a)標的結合ドメインとバーコードドメインを含む組成物(ここで、標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性(identity)を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有する)と;前記少なくとも3つの付着位置の第1の付着位置にハイブリダイズする第1の相補的一次核酸分子(ここで、前記第1の相補的一次核酸分子は、少なくとも2つのドメインとリンカー修飾を含んでおり、そのうちの第1のドメインは、前記バーコードドメインの第1の付着位置にハイブリダイズし、第2のドメインは、少なくとも1つの第2の相補的二次核酸分子にハイブリダイズすることができ、前記リンカー修飾は、
Figure 2022174137000001
のいずれかであり、このリンカー修飾は第1のドメインと第2のドメインの間に位置する)を含む複合体が提供される。
本開示により、a)標的結合ドメインとバーコードドメインを含む組成物(ここで、標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている)と;前記少なくとも3つの付着位置の第1の付着位置にハイブリダイズする第1の相補的一次核酸分子(ここで、前記第1の相補的一次核酸分子は、少なくとも2つのドメインとリンカー修飾を含んでおり、そのうちの第1のドメインは、前記バーコードドメインの第1の付着位置にハイブリダイズし、第2のドメインは、少なくとも1つの第2の相補的二次核酸分子にハイブリダイズすることができ、前記リンカー修飾は、
Figure 2022174137000002
のいずれかであり、このリンカー修飾は第1のドメインと第2のドメインの間に位置する)を含む複合体が提供される。
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有するシークエンシング用プローブが提供される。
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有するシークエンシング用プローブが提供される。
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
合成骨格は、多糖、ポリヌクレオチド、ペプチド、ペプチド核酸、ポリペプチドのいずれかを含むことができる。合成骨格はDNAを含むことができる。合成骨格は一本鎖DNAを含んでいる。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間にある二本鎖DNAスペーサとを含んでいる。二本鎖DNAスペーサとして、長さ約1個~約100個のヌクレオチド、または長さ約2個~約50個のヌクレオチド、または長さ20個~40個のヌクレオチドが可能である。二本鎖DNAスペーサは、長さ約36個のヌクレオチドである。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間にあってポリマーをベースとするスペーサとを含むことができ、ポリマーをベースとする前記スペーサは、二本鎖DNAスペーサと同様の力学的特性を提供する。
標的結合ドメインの中のヌクレオチドの数は、バーコードドメインの中の付着位置の数と同じにすること、または前記数よりも少なくすること、または前記数よりも多くすることができる。標的結合ドメインの中のヌクレオチドの数は、バーコードドメインの中の付着位置の数よりも多いことが好ましい。標的結合ドメインの中のヌクレオチドの数は、バーコードドメインの中の付着位置の数よりも少なくとも3個多くすること、または少なくとも4個多くすること、または少なくとも5個多くすること、または少なくとも6個多くすること、または少なくとも7個多くすること、または少なくとも8個多くすること、または少なくとも9個多くすること、または少なくとも10個多くすることができる。標的結合ドメインが8個のヌクレオチドを含み、バーコードドメインが3つの付着位置を含むことが好ましい。
標的結合ドメインの中にあって標的核酸分子の中の対応するヌクレオチドを同定することのできる少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドとして、修飾されたヌクレオチドまたは核酸類似体が可能である。修飾されたヌクレオチドまたは核酸類似体として、架橋型(locked)核酸(LNA)、架橋化核酸(BNA)、プロピンで修飾された核酸、ジップ核酸(ZNA(登録商標))、イソグアニン、イソシトシン、またはこれらの任意の組み合わせが可能である。修飾されたヌクレオチドまたは核酸類似体は架橋型核酸(LNA)であることが好ましい。
標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも前に位置することができる。標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドの後ろに位置することができる。標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドのうちの少なくとも1個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも前に位置し、標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドのうちの少なくとも1個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも後ろに位置する。すなわち標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドに隣接する。
標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドとして、ユニバーサル塩基、または縮重塩基、またはこれらの組み合わせが可能である。標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも4個のヌクレオチドのうちの少なくとも2個として、ユニバーサル塩基、または縮重塩基、またはこれらの組み合わせが可能である。
バーコードドメインの中の各付着位置は、1つの付着領域を含むことができる。バーコードドメインの中の各付着位置は、2つ以上の付着領域を含むことができる。
バーコードドメインの中の各付着位置は、同数の付着領域を含むことができる。バーコードドメインの中の各付着位置は、異なる数の付着領域を含むことができる。バーコードドメインの中の少なくとも3つの付着位置のうちの少なくとも1つは、他の2つとは異なる数の付着領域を含むことができる。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は同じであってもよい。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は同じ核酸配列を含むことができる。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は異なっていてもよい。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は異なる核酸配列を含むことができる。
バーコードドメインの中の各付着領域を含む各核酸配列は、長さ約8個~約20個のヌクレオチドである。バーコードドメインの中の各付着領域を含む各核酸配列は、長さ約12個のヌクレオチドである。バーコードドメインの中の各付着領域を含む各核酸配列は、長さ約14個のヌクレオチドである。
バーコードドメインの中の少なくとも3つの付着位置のうちの少なくとも1つ、または少なくとも2つ、または少なくとも3つは、少なくとも1つのフランキング一本鎖ポリヌクレオチドに隣接することができる。バーコードドメインの中の少なくとも3つの付着位置のそれぞれは、少なくとも1つのフランキング一本鎖ポリヌクレオチドに隣接することができる。
少なくとも1つの付着位置の中の少なくとも1つ、または少なくとも2つ、または少なくとも3つの付着領域は、合成骨格に一体化することができる。少なくとも3つの付着領域それぞれの中の各付着領域は、合成骨格に一体化することができる。少なくとも1つの付着位置の中の少なくとも1つ、または少なくとも2つ、または少なくとも3つの付着領域は、合成骨格から分岐することができる。少なくとも3つの付着領域それぞれの中の各付着領域は、合成骨格から分岐することができる。
各付着位置の中の少なくとも1つの付着領域の中の少なくとも1つの核酸配列に直接または間接に結合することのできる相補的核酸分子として、RNA、DNA、PNAのいずれかが可能である。相補的核酸分子はDNAであることが好ましい。
相補的核酸分子として一次核酸分子が可能である。一次核酸分子は、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に直接結合する。
一次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に結合することができ、第2のドメインは、少なくとも1個の相補的二次核酸分子に結合することができる。一次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に結合することができ、第2のドメインは、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含んでいる。
一次核酸分子は、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域にハイブリダイズすることと、少なくとも1個、または2個、または3個、または4個、または5個、またはそれよりも多い個数の二次核酸分子にハイブリダイズすることができる。一次核酸分子は、4個の二次核酸分子にハイブリダイズすることが好ましい。一次核酸分子は、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域にハイブリダイズすること、第1の検出可能な標識と、少なくとも第2の検出可能な標識とにハイブリダイズすることができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
一次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置することが好ましい。切断可能なリンカーとして、光で切断可能なリンカー(例えばUV光で切断可能なリンカー)、還元剤で切断可能なリンカー、酵素で切断可能なリンカーのいずれかが可能である。リンカーは、光で切断可能なリンカーであることが好ましい。
二次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、少なくとも1個の一次核酸分子の中の相補的な配列に結合することができ、第2のドメインは、(a)第1の検出可能な標識と少なくとも第2の検出可能な標識に、または(b)少なくとも1個の相補的な三次核酸分子に、または(c)これらの組み合わせに結合することができる。
二次核酸分子は、少なくとも1個の一次核酸分子にハイブリダイズすることと、少なくとも1個、または2個、または3個、または4個、または5個、または6個、または7個、またはそれよりも多い個数の三次核酸分子にハイブリダイズすることができる。二次核酸分子は1個の三次核酸分子にハイブリダイズすることが好ましい。二次核酸分子は少なくとも1個の一次核酸分子にハイブリダイズすることができて、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含むことができる。二次核酸分子は、少なくとも1個の一次核酸分子と、少なくとも1個の三次核酸分子と、第1の検出可能な標識と、少なくとも第2の検出可能な標識にハイブリダイズすることができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。二次核酸分子が、少なくとも1個の一次核酸分子と、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の三次核酸分子と、第1の検出可能な標識と、少なくとも第2の検出可能な標識にハイブリダイズするとき、二次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は同じ発光スペクトルを持つことができ、三次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つことができ、二次核酸分子の表面の検出可能な標識の発光スペクトルは、三次核酸分子の表面の検出可能な標識の発光スペクトルとは異なることができる。
二次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置することが好ましい。切断可能なリンカーとして、光で切断可能なリンカー(例えばUV光で切断可能なリンカー)、還元剤で切断可能なリンカー、酵素で切断可能なリンカーのいずれかが可能である。リンカーは、光で切断可能なリンカーであることが好ましい。
三次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、少なくとも1つの二次核酸分子の中の相補的な配列に結合することができ、第2のドメインは、第1の検出可能な標識と、少なくとも第2の検出可能な標識に結合することができる。
三次核酸分子は、少なくとも1個の二次核酸分子にハイブリダイズすることと、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含むことができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
三次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置することが好ましい。切断可能なリンカーとして、光で切断可能なリンカー(例えばUV光で切断可能なリンカー)、還元剤で切断可能なリンカー、酵素で切断可能なリンカーのいずれかが可能である。リンカーは、光で切断可能なリンカーであることが好ましい。
本開示により、本明細書に開示したシークエンシング用プローブを複数含むシークエンシング用プローブの集団も提供される。前記複数のシークエンシング用プローブの中の各シークエンシング用プローブが異なる標的結合ドメインを含んでいて、標的核酸の中の異なる領域に結合することが好ましい。
本発明により核酸をシークエンシングする方法も提供され、この方法は、(1)本明細書に記載した第1のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(10)場合によっては固定化された標的核酸からシークエンシング用プローブを除去することを含んでいる。
この方法はさらに、(11)第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシグ用プローブを除去することを含むことができる。
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築(assemble)することにより、固定化された標的核酸の配列を同定することを含むことができる。
工程(5)と(6)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子と第2の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
第1の相補的核酸分子と、検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、バーコードドメインの中の第1の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
第2の相補的核酸分子と、検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、バーコードドメインの中の第2の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
本発明により、核酸をシークエンシングする方法として、(1)本明細書に記載したシークエンシング用プローブを複数含む第1のシークエンシング用プローブの少なくとも1つの第1の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し; (10)場合によっては固定化された標的核酸から第1のシークエンシング用プローブの少なくとも1つの第1の集団を除去することを含む方法も提供される。
この方法はさらに、(11)本明細書に記載したシークエンシング用プローブを複数含む第2のシークエンシング用プローブの少なくとも1つの第2の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシング用プローブの少なくとも1つの第2の集団を除去することを含むことができる。
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
工程(5)と(6)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子と第2の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
第1の相補的核酸分子と、検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、バーコードドメインの中の第1の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
第2の相補的核酸分子と、検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、バーコードドメインの中の第2の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
本開示により、核酸のヌクレオチド配列を求める方法も提供され、この方法は、(1)本明細書に開示した第1のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(3)前記第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を同定し;(4)前記第1の付着位置にハイブリダイズした第1の検出可能な標識と第2の検出可能な標識を除去し;(5)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(6)前記第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を同定し;(7)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(8)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(9)前記第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(10)シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含んでいる。
この方法はさらに、(11)場合によっては固定化された標的核酸の第1の領域から少なくとも第1のシークエンシング用プローブを除去し;(12)本明細書に開示した少なくとも第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸の第2の領域にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと少なくとも第2のシークエンシング用プローブの標的結合ドメインは異なっている);(13)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(14)第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を検出し;(15)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(16)第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を検出し;(17)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(18)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(19)第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(20)第2のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第2の領域の中の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含むことができる。
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
工程(4)と(5)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第5の検出可能な標識と少なくとも第6の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第3の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子のいずれか1つを除去する方法は、光との接触を含むことができる。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
本開示により、核酸のヌクレオチド配列を求める方法として、(1)本明細書に開示した第1のシークエンシング用プローブを、所定の遺伝子から得られて場合によっては基板に1つ以上の位置で固定化された標的核酸の第1の領域にハイブリダイズさせ;(2)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(3)第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を検出し;(4)前記第1の付着位置にハイブリダイズした第1の検出可能な標識と第2の検出可能な標識を除去し;(5)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(6)第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を検出し;(7)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(8)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(9)第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(10)第1のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第1の領域の中の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含む方法も提供される。
この方法はさらに、(11)場合によっては固定化された標的核酸の第1の領域から少なくとも第1のシークエンシング用プローブを除去し;(12)本明細書に開示した少なくとも第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸の第2の領域にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと少なくとも第2のシークエンシング用プローブの標的結合ドメインは異なっている);(13)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(14)第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を検出し;(15)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(16)第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を検出し;(17)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(18)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(19)第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(20)第2のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第2の領域の中の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含むことができる。
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
工程(4)と(5)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第5の検出可能な標識と少なくとも第6の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第3の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子のいずれか1つを除去する方法は、光との接触を含むことができる。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
本開示により、本明細書に開示した任意の方法を実施するための装置も提供される。
本開示により、基板と、本明細書に開示したシークエンシング用プローブの集団と、第1の検出可能な標識と少なくとも2つの第2の検出可能な標識を含む少なくとも3個の相補的核酸分子と、利用のための指示とを含む1つ以上のキットも提供される。この1つ以上のキットはさらに、少なくとも1つの捕獲用プローブを含むことができる。この1つ以上のキットはさらに、少なくとも2つの捕獲用プローブを含むことができる。
上記の側面のうちの任意の1つを他の任意の側面と組み合わせることができる。
特に断わらない限り、本明細書で用いられているあらゆる科学技術用語は、本開示が属する分野の当業者によって一般に理解されるのと同じ意味を持つ。明細書では、文脈から明らかに異なることがわかるのでなければ、単数形に複数も含まれ、例えば「1つの」、「前記」という用語は、単数または複数であると理解され、「または」という用語は、包括的であると理解される。例として、「1つの要素」は、1つ以上の要素を意味する。本明細書全体を通じ、「含んでいる」という単語または前記バリエーション(「含む」、「含んでいる」)は、記載されている要素、整数、工程、要素群、整数群、工程群を包含するが、他の任意の要素、整数、工程、要素群、整数群、工程群を排除しないと理解される。約は、記載されている値の10%以内、または9%以内、または8%以内、または7%以内、または6%以内、または5%以内、または4%以内、または3%以内、または2%以内、または1%以内、または0.5%以内、または0.1%以内、または0.05%以内、または0.01%であると理解される。文脈から明らかに異なることがわかるのでなければ、本明細書に提示されているあらゆる数値は「約」という用語によって変えられている。
本明細書に記載したのと似ていたり同等だったりする方法と材料を本開示の実施や試験で使用できるとはいえ、以下には適切な方法と材料を記載する。本明細書で言及したあらゆる刊行物、特許出願、特許、それ以外の参考文献は、前記全体が参照によって本明細書に組み込まれている。本明細書で引用した参考文献は、請求項の本発明に対する先行技術であるとは認められない。争いが生じた場合には、本明細書が、定義を含めて優先する。本開示の他の特徴と利点は、以下の詳細な説明と請求項から明らかになろう。
本特許または本出願ファイルは、少なくとも1枚のカラー図面を含んでいる。カラー図面を有するこの特許または特許出願公開のコピーは、請求して必要な手数料を支払うと特許商標庁から提供される。
上記の特徴とさらに別の特徴は、添付の図面と組み合わせたときに以下の詳細な説明からより明確になろう。
図1は、本開示によるシークエンシング用プローブの一例の図である。
図2は、本開示による標準シークエンシング用プローブと3部構成シークエンシング用プローブの設計を示している。
図3は、本開示によるシークエンシング用プローブの一例にハイブリダイズした本開示のレポータ複合体の一例の図である。
図4は、本開示によるレポータプローブの一例の模式図を示している。
図5は、本開示によるレポータプローブのいくつかの例の模式図である。
図6は、「追加ハンドル」を含む本開示のレポータプローブの例の模式図である。
図7は、配置の異なる三次核酸を含む本開示によるレポータプローブのいくつかの例の模式図である。
図8は、分岐した三次核酸を含む本開示によるレポータプローブのいくつかの例の模式図である。
図9は、切断可能なリンカー修飾を含む本開示によるレポータプローブの一例の図である。
図10は、本開示によるレポータプローブの一例の中で切断可能なリンカー修飾が可能な位置を示している。
図11は、本開示による2つの捕獲用プローブシステムを用いて1個の標的核酸を捕獲する模式図である。
図12は、FFPEサンプルを用いた100個の標的からなる多重がんパネルを捕獲して検出するために本発明の方法を利用する実験からの結果を示している。 上記説明に同じ。
図13は、大きな標的核酸分子を標的としたシークエンシングのため、捕獲用プローブとブロッカーオリゴとシークエンシング用プローブにハイブリダイズした2個の捕獲された標的DNA分子の模式図である。
図14は、本開示によるシークエンシング法の1つのサイクルの模式図である。
図15は、本開示によるシークエンシング法の1つのサイクルの模式図と、このサイクル中に回収された対応するイメージングデータである。 上記説明に同じ。
図16は、本開示によるシークエンシング用プローブのプールの構成の一例を示しており、8通りの色組み合わせを用いて異なる8通りのシークエンシング用プローブのプールを設計している。
図17は、アメリカ合衆国特許出願公開第2016/019470号に開示されているバーコードドメインの設計を本開示のバーコードドメインの設計と比較している。
図18は、捕獲された標的核酸分子にハイブリダイズした本開示の1つのシークエンシング用プローブまたは複数のシークエンシング用プローブの模式図である。
図19は、1つのシークエンシング用プローブまたは複数のシークエンシング用プローブを標的核酸にハイブリダイズさせるとき、本開示によるシークエンシング法の間に記録された蛍光画像を示している。
図20は、標的核酸の長さに沿って結合した本開示の複数のシークエンシング用プローブの模式図と、対応する記録された蛍光画像である。
図21は、本開示によるシークエンシングサイクルの間に記録されたイメージングデータの例と、本開示によるレポータプローブの蛍光信号強度プロファイルを示している。
図22は、本開示によるシークエンシングサイクルの模式図であり、ここでは切断可能なリンカー修飾を用いてバーコードの1つの位置を暗くしている。
図23は、本開示によるシークエンシングサイクルを図解した一例であり、ここではバーコードドメインの中の1つの位置が一次核酸の置換によって暗くされている。
図24は、FFPEサンプルからRNAとDNAをまとめて捕獲する一例を示している。
図25は、本開示のシークエンシング法を利用すると、異なるシークエンシング用プローブを用いた標的核酸の同じ塩基のシークエンシングがどのようにして可能になるかの模式図である。
図26は、標的核酸上の特定のヌクレオチド位置における複数の塩基読み取り(base call)が1つ以上のシークエンシング用プローブから記録され、どのように組み合わされてコンセンサス配列を作り出し、前記ことによって最終的な塩基読み取りの精度を上昇させているかを示している。
図27は、33キロ塩基のDNA断片の捕獲、伸長、検出の後に記録された本開示のシークエンシング法の蛍光画像を示している。
図28は、本開示のシークエンシング法を利用して取得してShortStack(商標)アルゴリズムを利用して分析した、シークエンシング実験からの結果を示している。左側のグラフに関しては、示されている配列は、左上のグラフから始まって時計回りに配列番号3、4、6、8、7、5に対応している。右側の表に関しては、配列は、上から下へと配列番号3、4、7、8、6、5に対応している。 上記説明に同じ。
図29は、FFPEサンプルからのがん遺伝子標的の多重捕獲とシークエンシングに関する実験設計の模式図を示している。
図30は、直接的なシークエンシングの模式図と、本開示のシークエンシング法を利用してRNA分子の適合性を調べる実験からの結果を示している。
図31は、本開示のシークエンシング法を利用して同じヌクレオチド配列を有するRNA分子とDNA分子をシークエンシングした結果を示している。
図32は、RNAパネルの多重標的捕獲の結果を示している。
図33は、ShortStack(商標)ソフトウエアパイプラインの工程全体の模式図を示している。
図34は、シミュレーションしたデータセットをShortStack(商標)ソフトウエアパイプラインを利用して変異分析した結果を示している。
図35は、ShortStack(商標)ソフトウエアパイプラインの総合的な変異読み取り精度をさまざまなタイプの変異について示している。
図36は、特定の色組み合わせで標識したレポータ複合体に関する強度分布である。
図37は、本開示の典型的な堆積勾配を示している。
図38は、25 ng~500 ng のDNA質量入力を滴定している間の本開示の捕獲効率を示している。
図39は、本開示のレポータ複合体の一例のHLPC精製を示している。
図40は、さまざまな緩衝液添加物の存在下における本開示のレポータプローブのハイブリダイゼーションの効率と精度を示している。 上記説明に同じ。
図41は、さまざまな緩衝液添加物の存在下で本開示のシークエンシング法を利用するときの標的核酸の損失率を示している。
図42は、12量体相補的核酸を含む本開示のレポータプローブの効率とエラーを示している。
図43は、8×8×8 14量体レポータセットの一例を用いたレポータプローブの効率とエラーを示している。
図44は、10×10×10 14量体レポータセットの一例を用いたレポータプローブの効率とエラーを示している。
図45は、本開示の標準シークエンシング用プローブと3部構成シークエンシング用プローブの性能の比較を示している。
図46は、個々のプローブを用いたときの本開示による標的結合ドメインの中でのLNA置換の効果を示している。
図47は、9つのプローブからなるプールを用いたときの本開示による標的結合ドメインの中でのLNA置換の効果を示している。
図48は、本開示による標的結合ドメインの中での修飾されたヌクレオチドと核酸類似体による置換の効果を示している。
図49は、本開示によるシークエンシング法の生の精度を定量する実験からの結果を示している。
図50は、標的核酸の中にあるヌクレオチドを2つ以上のシークエンシング用プローブによってシークエンシングするときの本開示によるシークエンシング法の精度を求める実験からの結果を示している。
本開示により、酵素なし、増幅なし、ライブラリなしで迅速に実施され、読み出し長が長くてエラー率が低い核酸シークエンシングを提供するシークエンシング用プローブと、レポータプローブと、方法と、キットと、装置が提供される。
本開示の組成物
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも1個または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり、前記標的結合ドメインの中の前記少なくとも1個または少なくとも2個のヌクレオチドは、ユニバーサル塩基または縮重塩基であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の各付着位置は、標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、標的結合ドメインが結合する標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の各付着領域は、標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、標的結合ドメインが結合する標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
本開示により、本明細書に開示した任意のシークエンシング用プローブを複数含むシークエンシング用プローブの集団も提供される。
開示されているシークエンシング用プローブの標的結合ドメイン、バーコードドメイン、骨格のほか、相補的核酸分子(例えばレポータ分子またはレポータ複合体)は、下により詳しく記載してある。
本開示のシークエンシング用プローブは、標的結合ドメインとバーコードドメインを含んでいる。図1は、本開示によるシークエンシング用プローブの一例の模式図である。図1は、標的結合ドメインが標的核酸に結合できることを示している。標的核酸として、本開示のシークエンシング用プローブがハイブリダイズすることのできる任意の核酸が可能である。標的核酸として、DNAまたはRNAが可能である。標的核酸は、対象に由来する生物サンプルから得ることができる。「標的結合ドメイン」と「シークエンシングドメイン」という用語は、本明細書では交換可能に用いられる。
標的結合ドメインは、一連のヌクレオチドを含むことができる(例えばポリヌクレオチドである)。標的結合ドメインは、DNA、またはRNA、またはこれらの組み合わせを含むことができる。標的結合ドメインがポリヌクレオチドである場合には、標的結合ドメインは、図1に示してあるように、標的核酸のうちでシークエンシング用プローブの標的結合ドメインと相補的な部分にハイブリダイズすることにより、前記標的核酸に結合する。
シークエンシング用プローブの標的結合ドメインは、シークエンシング用プローブのハイブリダイゼーションおよび/または脱ハイブリダイゼーションの可能性と、それが起こる速度を制御できるように設計することができる。一般に、プローブのTmが低くなるほど、プローブが標的核酸から脱ハイブリダイズする可能性が大きくなる。したがってTmがより低いプローブを用いると、標的核酸に結合するプローブの数が少なくなろう。
標的結合ドメインの長さが、プローブが標的核酸にハイブリダイズする可能性と標的核酸にハイブリダイズしたままになる可能性に部分的に影響を与える。一般に、標的結合ドメインが長くなるほど(ヌクレオチドの数が多くなるほど)、相補的な配列が標的ヌクレオチドの中に存在する可能性が小さくなる。逆に、標的結合ドメインが短くなるほど、相補的な配列が標的ヌクレオチドの中に存在する可能性が大きくなろう。例えば4量体配列が標的核酸の中に位置する確率は1/256であるのに対して6量体配列が標的核酸の中に位置する確率は1/4096である。前記帰結として、より短いプローブの集合は、より長いプローブの集合と比べたとき、所与の長さの核酸ではより多くの位置に結合する可能性があろう。
さまざまな場合において、所与の長さの核酸における読み出しの数を増やすには、より短い標的結合ドメインを有するプローブを用意することが好ましい。そうすることで、例えば変異またはSNPアレルを検出するとき、1つの標的核酸または前記標的核酸の一部、特に特別な興味のある部分のカバレッジが多くなる。
標的結合ドメインとして、長さが任意の個数のヌクレオチドが可能である。標的結合ドメインとして、長さが少なくとも12個のヌクレオチド、長さが少なくとも10個のヌクレオチド、長さが少なくとも8個のヌクレオチド、長さが少なくとも6個のヌクレオチド、長さが少なくとも3個のヌクレオチドのいずれかが可能である。
標的結合ドメインの中の各ヌクレオチドは、標的分子の相補的なヌクレオチドを同定(またはコード)することができる。あるいは標的結合ドメインの中のいくつかのヌクレオチドが標的分子の相補的なヌクレオチドを同定(またはコード)する一方で、標的結合ドメインの中のいくつかのヌクレオチドは、標的分子の相補的なヌクレオチドを同定(またはコード)することがない。
標的結合ドメインは、少なくとも1個の天然塩基を含むことができる。標的結合ドメインは、天然塩基を含まないことが可能である。標的結合ドメインは、少なくとも1個の修飾されたヌクレオチドまたは核酸類似体を含むことができる。標的結合ドメインは、修飾されたヌクレオチドまたは核酸類似体を含まないことが可能である。標的結合ドメインは、少なくとも1個のユニバーサル塩基を含むことができる。標的結合ドメインは、ユニバーサル塩基を含まないことが可能である。標的結合ドメインは、少なくとも1個の縮重塩基を含むことができる。標的結合ドメインは、縮重塩基を含まないことが可能である。
標的結合ドメインは、天然塩基(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数の天然塩基)、修飾されたヌクレオチドまたは核酸類似体(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数の修飾されたヌクレオチドまたは核酸類似体)、ユニバーサル塩基(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数のユニバーサル塩基)、縮重塩基(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数の縮重塩基)の任意の組み合わせを含むことができる。特定の標的結合ドメインの天然塩基、修飾されたヌクレオチドまたは核酸類似体、ユニバーサル塩基、縮重塩基は、組み合わせで存在するとき、任意の順番で配置することができる。
「修飾されたヌクレオチド」または「核酸類似体」という用語の非限定的な例に含まれるのは、架橋型核酸(LNA)、架橋化核酸(BNA)、プロピンで修飾された核酸、ジップ核酸(ZNA(登録商標))、イソグアニン、イソシトシンである。標的結合ドメインは、0~6個(例えば0個、1個、2個、3個、4個、5個、6個)の修飾されたヌクレオチドまたは核酸類似体を含むことができる。修飾されたヌクレオチドまたは核酸類似体は、架橋型核酸(LNA)であることが好ましい。
本明細書では、「架橋型核酸(LNA)」という用語の非限定的な例に含まれるのは、2'酸素と4'炭素を接続するメチレン架橋をリボース部分が含んでいる修飾されたRNAヌクレオチドである。このメチレン架橋が、リボースをA型RNA二本鎖で見られる3'-エンドコンホメーション(ノースコンホメーションとしても知られる)の中にロックする。アクセスできないRNAという用語は、LNAと交換可能に用いることができる。本明細書では、「架橋化核酸(BNA)」という用語の非限定的な例に含まれるのは、固定された3'-エンドコンホメーション(ノースコンホメーションとしても知られる)を有する5員または6員の架橋構造を含む修飾されたRNA分子である。架橋構造は、リボースの2'酸素をリボースの4'炭素に接続している。炭素原子、窒素原子、水素原子を含む異なるさまざまな架橋構造が可能である。本明細書では、「プロピンで修飾された核酸」という用語の非限定的な例に含まれるのは、ピリミジン、すなわち核酸塩基のC5位にプロピン修飾を含むシトシンとチミン/ウラシルである。本明細書では、「ジップ核酸(ZNA(登録商標))」という用語の非限定的な例に含まれるのは、カチオン性スペルミン部分に共役したオリゴヌクレオチドである。
本明細書では、「ユニバーサル塩基」という用語の非限定的な例に含まれるのは、ワトソン-クリック塩基対合規則に従わないが、標的核酸の上に位置する4種類の基本塩基(A、T/U、C、G)のうちの任意のものに結合することのできるヌクレオチド塩基である。本明細書では、「縮重塩基」という用語の非限定的な例に含まれるのは、ワトソン-クリック塩基対合規則に従わないが、標的核酸の上に位置する4種類の正規塩基(A、T/U、C、G)のうちの4種類全部ではなくて少なくとも2種類に結合することのできるヌクレオチド塩基である。縮重塩基はゆらぎ塩基とも呼ぶことができ、これらの用語は本明細書では交換可能に用いられる。
図1に例示したシークエンシング用プローブは、シークエンシングすべき標的核酸の相補的なヌクレオチド1~6に特異的にハイブリダイズする長さ6個のヌクレオチド配列(b1-b2-b3-b4-b5-b6)を含む標的結合ドメインを示している。標的結合ドメインのこの6量体部分(b1-b2-b3-b4-b5-b6)が、標的配列の中の相補的なヌクレオチド(1-2-3-4-5-6)を同定(またはコード)する。この6量体配列は、それぞれの側に塩基(N)が隣接している。(N)によって示される塩基として、独立に、ユニバーサル塩基または縮重塩基が可能である。典型的には、(N)によって示される塩基は、独立に、正規塩基のうちの1つである。(N)によって示される塩基は、標的配列の中で前記塩基が結合する相補的なヌクレオチドを同定(またはコード)することがなく、(6量体)配列(b1-b2-b3-b4-b5-b6)の核酸配列とは独立である。
図1に示したシークエンシング用プローブは、本開示のシークエンシング法と組み合わせて用いて標的核酸をシークエンシングすることができ、ハイブリダイゼーション反応だけを利用していて、共有結合化学、酵素、増幅を必要としない。標的核酸分子の中の可能なすべての6量体配列のシークエンシングをするには合計で4096通りのシークエンシング用プローブが必要とされる(46=4096)。
図1は、本開示のシークエンシング用プローブの標的結合ドメインの1つの配置例である。表1に本開示の標的結合ドメインの別のいくつかの配置を示してある。好ましい1つの標的結合ドメインは「6 LNA」標的結合ドメインと呼ばれ、標的結合ドメインの位置b1~b6に6個のLNAを含んでいる。これら6個のLNAはそれぞれの側に塩基(N)が隣接している。本明細書では、塩基(N)として、(6量体)配列(b1-b2-b3-b4-b5-b6)の核酸配列とは独立なユニバーサル塩基/縮重塩基、または正規塩基が可能である。言い換えるならば、塩基b1-b2-b3-b4-b5-b6は所与の任意の標的配列に対して特異的である可能性があるのに対し、(N)塩基は、ユニバーサル塩基/縮重塩基であること、または4種類の正規塩基のうちで、b1-b2-b3-b4-b5-b6によって指定される標的に対して特異的ではない任意のもので構成することができる。例えば調べる標的配列がCAGGCATAである場合には、標的結合ドメインの塩基b1-b2-b3-b4-b5-b6はTCCGTAになると考えられるのに対し、標的結合ドメインの(N)塩基のそれぞれは、独立に、A、C、T、Gのいずれかになることができると考えられるため、得られる標的結合ドメインは、配列ATCCGTAG、TTCCGTAC、GTCCGTAGのいずれか、または可能な16通りの配列のうちの他のどれかになることができる。あるいは2個の(N)塩基が6 LNAの前に位置することができると考えられる。あるいはさらに、2個の(N)塩基が6 LNAの後に来ることができると考えられる。
Figure 2022174137000003
表1には、10個の天然の標的特異的塩基を含む「10量体」標的結合ドメインも記載されている。
表1にはさらに、位置b1~b6に6個の天然塩基を含む「Natural I」標的結合ドメインも記載されている。これら6個の天然塩基は、それぞれの側に2個の(N)塩基が隣接している。あるいは4個の(N)塩基すべてがそれら6個の天然塩基の前に位置することができよう。あるいはさらに、4個の(N)塩基すべてがそれら6個の天然塩基の後ろに位置することができよう。4個の(N)塩基のうちの任意の個数(すなわち1個、2個、3個、4個)をそれら6個の天然塩基の前に位置させることができると、残りの(N)塩基はそれら6個の天然塩基の後ろに位置することになろう。
表1にはさらに、位置b1~b6に6個の天然塩基を含む「Natural II」標的結合ドメインも記載されている。これら6個の天然塩基はそれぞれの側に1個の(N)塩基が隣接している。あるいは両方の(N)塩基を6個の天然塩基の前に位置させることができよう。あるいはさらに、両方の(N)塩基を6個の天然塩基の後ろに位置させることができよう。
表1にはさらに、標的結合ドメインの位置b1~b6に2個のLNAと4個の天然塩基の組み合わせを含む「2 LNA」標的結合ドメインも記載されている。2個のLNAと4個の天然塩基は任意の順番に出現することができる。例えば位置b3とb4をLNAにすることができると、位置b1、b2、b5、b6は天然塩基である。塩基b1~b6はそれぞれの側に1個の(N)塩基が隣接している。あるいは塩基b1~b6の前に2個の(N)塩基を位置させることができる。あるいはさらに、塩基b1~b6の後ろに2個の(N)塩基を位置させることができる。
表1にはさらに、標的結合ドメインの位置b1~b6に4個のLNAと2個の天然塩基の組み合わせを含む「4 LNA」標的結合ドメインも記載されている。4個のLNAと2個の天然塩基は任意の順番に出現することができる。例えば位置b2~b5をLNAにすることができると、位置b1とb6は天然塩基である。塩基b1~b6はそれぞれの側に1個の(N)塩基が隣接している。あるいは塩基b1~b6の前に2個の(N)塩基を位置させることができる。あるいはさらに、塩基b1~b6の後ろに2個の(N)塩基を位置させることができる。
本開示のシークエンシング用プローブは合成骨格を含んでいる。標的結合ドメインとバーコードドメインは機能可能に連結されている。標的結合ドメインとバーコードドメインは、1つの合成骨格の一部として共有結合させることができる。標的結合ドメインとバーコードドメインはリンカー(例えば核酸リンカー、化学的リンカー)を介して結合させることができる。合成骨格は任意の材料(例えば多糖、ポリヌクレオチド、ポリマー、プラスチック、繊維、ペプチド、ペプチド核酸、ポリペプチド)を含むことができる。合成骨格は堅固であることが好ましい。合成骨格は一本鎖DNA分子を含むことができる。骨格は、6つのDNA二重螺旋からなる「DNA折り紙」を含むことができる(例えばLin他「Submicrometre geometrically encoded fluorescent barcodes self-assembled from DNA」Nature Chemistry; 2012年10月;第4巻(10):832~839ページを参照されたい)。バーコードは、DNA折り紙タイルから作製することができる(Jungmann他「Multiplexed 3D cellular super-resolution imaging with DNA-PAINT and Exchange-PAINT」Nature Methods、第 11巻、第3号、2014年)。
本開示のシークエンシング用プローブは、一部が二本鎖になっている合成骨格を含むことができる。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間の二本鎖DNAスペーサとを含むことができる。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間にあって二本鎖DNAと力学的特性が似たポリマーをベースとしたスペーサとを含むことができる。ポリマーをベースとした典型的なスペーサにはポリエチレングリコール(PEG)型ポリマーが含まれる。
二本鎖DNAスペーサは、長さが約1個~約100個のヌクレオチド、または長さが約2個~約50個のヌクレオチド、または長さが約20個~約40個のヌクレオチドで構成することができる。二本鎖DNAスペーサは長さが約36個のヌクレオチドであることが好ましい。
本開示の1つのシークエンシング用プローブを「標準プローブ」と呼び、図2の左図に示してある。図2の標準プローブは、標的結合ドメインに共有結合したバーコードドメインを含んでいるため、標的結合ドメインとバーコードドメインは同じオリゴヌクレオチド鎖の中に存在する。図2の左図では、一本鎖オリゴヌクレオチドがステムオリゴヌクレオチドに結合してステム配列と呼ばれる長さ36個のヌクレオチドの二本鎖スペーサ領域を生み出している。この構造を用いると、複数のプローブからなるプールの中の各シークエンシング用プローブが同じステム配列にハイブリダイズすることができる。
本開示の別のシークエンシング用プローブを「3部構成プローブ」と呼び、図2の右図に示してある。図2の3部構成プローブは、標的結合ドメインにリンカーを介して結合したバーコードドメインを含んでいる。この例では、リンカーは、標的結合ドメインを含有する一本鎖オリゴヌクレオチドと、バーコードドメインを含有する一本鎖オリゴヌクレオチドとにハイブリダイズする一本鎖ステムオリゴヌクレオチドであり、バーコードドメイン(18個のヌクレオチド)と標的結合ドメイン(18個のヌクレオチド)を架橋する長さ36個のヌクレオチドの二本鎖スペーサ領域を生み出している。プローブ構成のこの例を用いると、バーコードドメインの交換を阻止することを目的として、各バーコードを、単一のステム配列にハイブリダイズするように設計することができる。さらに、各バーコードドメインを対応するステムオリゴヌクレオチドにハイブリダイズさせた後に、異なるシークエンシング用プローブをまとめてプールすることもできる。
バーコードドメインは、複数の付着位置(例えば1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはそれよりも多い数の付着位置)を含んでいる。付着位置の数は、標的結合ドメインの中のヌクレオチドの数よりも少なくすること、または前記数と同じにすること、または前記数よりも多くすることができる。標的結合ドメインは、骨格ドメインの中の付着位置の数よりも多いヌクレオチド(例えば1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数のヌクレオチド)を含むことができる。標的結合ドメインは8個のヌクレオチドを含むことができ、バーコードドメインは3つの付着位置を含んでいる。標的結合ドメインは10個のヌクレオチドを含むことができ、バーコードドメインは3つの付着位置を含んでいる。
バーコードドメインは、下に説明するように、少なくとも3つの付着位置にとって十分な長さが存在する限り、長さに制限はない。「付着位置」、「位置」、「スポット」という用語は、本明細書では交換可能に用いられる。「バーコードドメイン」と「レポーティングドメイン」という用語は、本明細書では交換可能に用いられる。
バーコードドメインの中の各付着位置は、標的結合ドメインの中の2個のヌクレオチド(ジヌクレオチド)、したがって標的結合ドメインの中の前記ジヌクレオチドにハイブリダイズする標的結合ドメインの中の相補的なジヌクレオチドに対応する。非限定的な一例として、バーコードドメインの中の第1の付着位置は、標的結合ドメインの中の第1と第2のヌクレオチドに対応し(例えば図1では、R1がバーコードドメインの中の第1の付着位置であり、R1が標的結合ドメインの中のジヌクレオチドb1とb2に対応し、それが標的核酸のジヌクレオチド1と2を同定する)、バーコードドメインの中の第2の付着位置は、標的結合ドメインの中の第3と第4のヌクレオチドに対応し(例えば図1では、R2がバーコードドメインの中の第2の付着位置であり、R2が標的結合ドメインの中のジヌクレオチドb3とb4に対応し、それが標的核酸のジヌクレオチド3と4を同定する)、バーコードドメインの中の第3の付着位置は、標的結合ドメインの中の第5と第6のヌクレオチドに対応する(例えば図1では、R3がバーコードドメインの中の第3の付着位置であり、R3が標的結合ドメインの中のジヌクレオチドb5とb6に対応し、それが標的核酸のジヌクレオチド5と6を同定する)。
バーコードドメインの中の各付着位置は、少なくとも1つの付着領域(例えば1~50、またはそれよりも多い数の付着領域)を含んでいる。バーコードドメインの中のいくつかの位置は他の位置よりも多くの付着領域を持つことができる(例えば第1の付着位置は3つの付着領域を持つことができるのに対し、第2の付着位置は2つの付着領域を持つことができる)。あるいはバーコードドメインの中の各付着位置は、同数の付着領域を有する。バーコードドメインの中の各付着位置は、1つの付着領域を含むことができる。バーコードドメインの中の各付着位置は、2つ以上の付着領域を含むことができる。バーコードドメインの中の少なくとも3つの付着位置のうちの少なくとも1つは、バーコードドメインの中の他の2つの付着位置とは異なる数の付着領域を含むことができる。
各付着領域は、相補的核酸分子(例えばDNAまたはRNA)が可逆的に結合することのできる核酸配列のコピーを少なくとも1つ(すなわち1~50、例えば10~30)含んでいる。1つの付着位置における付着領域の核酸配列は同じにすることができる。前記場合には、これら付着領域に結合する相補的核酸分子は同じである。あるいはある1つの位置における付着領域の核酸配列は同じではない。前記場合には、これら付着領域に結合する相補的核酸分子は同じではない。
バーコードドメインの中の各付着領域を含む核酸配列は、長さが約8個~約20個のヌクレオチドにすることができる。バーコードドメインの中の各付着領域を含む核酸配列は、長さが約12個~約14個のヌクレオチドにすることができる。バーコードドメインの中の各付着領域を含む核酸配列は、長さが約14個のヌクレオチドであることが好ましい。
バーコードドメインの中の各付着領域を含む核酸のそれぞれは、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体であることが可能である。バーコードドメインの中の付着領域に含まれる少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチド、または核酸類似体であることが可能である。バーコードドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。バーコードドメインの中の付着領域で有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、バーコードドメインの中の適切な付着領域に対するレポータの結合効率と結合精度を改善する一方で、標的を含めて別の箇所への結合を最少にすることができる。
1つ以上の付着領域をポリヌクレオチド骨格と一体化することができる。すなわち骨格は単一のポリヌクレオチドであり、付着領域は前記単一のポリヌクレオチドの配列の一部である。1つ以上の付着領域を合成骨格の中の修飾されたモノマー(例えば修飾されたヌクレオチド)に連結させ、前記付着領域を合成骨格から分岐させることができる。1つの付着位置は、2つ以上の付着領域を含むことができ、そのうちのいくつかの付着領域が合成骨格から分岐する一方で、いくつかの付着領域は合成骨格と一体化している。少なくとも1つの付着位置の中の少なくとも1つの付着領域を合成骨格と一体化することができる。前記少なくとも1つの付着位置のそれぞれの中の各付着領域を合成骨格と一体化することができる。少なくとも1つの付着位置の中の少なくとも1つの付着領域を合成骨格から分岐させることができる。少なくとも3つの付着位置のそれぞれの中の各付着領域を合成骨格から分岐させることができる。
バーコードドメインの中の各付着位置は、16通りのジヌクレオチドのうちの1つ、すなわちアデニン-アデニン、アデニン-チミン/ウラシル、アデニン-シトシン、アデニン-グアニン、チミン/ウラシル-アデニン、チミン/ウラシル-チミン/ウラシル、チミン/ウラシル-シトシン、チミン/ウラシル-グアニン、シトシン-アデニン、シトシン-チミン/ウラシル、シトシン-シトシン、シトシン-グアニン、グアニン-アデニン、グアニン-チミン/ウラシル、グアニン-シトシン、グアニン-グアニンのいずれかに対応する。したがってバーコードドメインの単一の付着位置の中に位置する1つ以上の付着領域は、16通りのジヌクレオチドのうちの1つに対応し、前記付着領域が対応するジヌクレオチドに対して特異的な核酸配列を含んでいる。バーコードドメインの異なる付着位置の中に位置する付着領域は、バーコードドメインの中のそれらの位置が同じジヌクレオチドに対応する場合でさえ、独自の核酸配列を含有している。例えば配列A-G-A-G-A-Cをコードする6量体を有する標的結合ドメインを含有する本開示のシークエンシング用プローブが与えられると、このシークエンシング用プローブのバーコードドメインは、3つの位置を含有し、第1の付着位置はアデニン-グアニンというジヌクレオチドに対応し、第2の付着位置はアデニン-グアニンというジヌクレオチドに対応し、第3の付着位置はアデニン-シトシンというジヌクレオチドに対応することになろう。この例のプローブの位置1に位置する付着領域は、付着位置1と付着位置2の両方がアデニン-グアニンというジヌクレオチドに対応する場合でさえ、位置2に位置する付着領域の核酸配列とは異なる独自の核酸配列を含むことになろう。具体的な付着位置の配列を設計し、個々の付着位置の相補的核酸が異なる付着位置と相互作用しないことを調べる。それに加え、相補的核酸のヌクレオチド配列には制限がない。前記ヌクレオチド配列は、既知のヌクレオチド配列との実質的な相同性(例えば50%~99.9%)がないことが好ましい。そうすることで、相補的核酸と標的核酸の望ましくないハイブリダイゼーションが制限される。
図1は、バーコードドメインの一例を含む本開示のシークエンシング用プローブの一例の図を示している。図1に例示したバーコードドメインは、3つの付着位置R1、R2、R3を含んでいる。各付着位置は、標的結合ドメインの6量体配列(b1~b6)の中に存在する特定のジヌクレオチドに対応する。この例では、R1は位置b1とb2に対応し、R2は位置b3とb4に対応し、R3は位置b5とb6に対応する。したがって各位置は、標的結合ドメインの6量体配列の中に存在する特定のジヌクレオチドをデコードし、前記ことによってそれぞれのジヌクレオチドの中に存在する特定の2個の塩基(A、C、G、Tのいずれか)の同定が可能になる。
図1に示したバーコードドメインの例では、各付着位置は、合成骨格に一体化した単一の付着領域を含んでいる。3つの付着位置の各付着領域は、各付着位置によってコードされた個々のジヌクレオチドに対応する特定のヌクレオチド配列を含有している。例えば付着位置R1は、ジヌクレオチドb1-b2の属性に対応する特定の配列を有する付着領域を含んでいる。
バーコードドメインはさらに、1つ以上の結合領域を含むことができる。バーコードドメインは、少なくとも1つの付着位置に隣接した少なくとも1つの一本鎖核酸配列を含むことができる。バーコードドメインは、少なくとも2つの付着位置に隣接した少なくとも2つの一本鎖核酸配列を含むことができる。バーコードドメインは、少なくとも3つの付着位置に隣接した少なくとも3つの一本鎖核酸配列を含むことができる。これら隣接部分は「トーホールド(Toe-Hold)」として知られており、一本鎖オリゴヌクレオチドにとっての追加結合部位を提供することによってトーホールドに隣接してハイブリダイズするオリゴヌクレオチドの交換速度を加速させるのに用いることができる(「トーホールド」プローブ;例えばSeeling他「Catalyzed Relaxation of a Metastable DNA Fuel」;J. Am. Chem. Soc. 2006年、第128巻(37)、12211~12220ページを参照されたい)。
本開示のシークエンシング用プローブは、約20ナノメートル~約50ナノメートルの全長を持つことができる(前記中に、標的結合ドメインと、バーコードドメインと、オプションの任意のドメインが含まれる)。シークエンシング用プローブの骨格として、約120個のヌクレオチドを含むポリヌクレオチド分子が可能である。
シークエンシング用プローブは、切断可能なリンカー修飾を含むことができる。当業者に知られている任意の切断可能なリンカー修飾を用いることができる。切断可能なリンカー修飾の非限定的な例に含まれるのは、UV光で切断可能なリンカー、還元剤で切断可能なリンカー、酵素で切断可能なリンカーである。酵素で切断可能なリンカーの一例は、USER(商標)酵素によって切断するためのウラシルの挿入である。切断可能なリンカー修飾は、シークエンシング用プローブの長さに沿った任意の場所に位置させることができ、場所の非限定的な例に含まれるのは、標的結合ドメインとバーコードドメインの間の領域である。図10の右図は、本開示のプローブに組み込むことのできる切断可能なリンカー修飾を示している。
レポータプローブ
本開示によるシークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に結合(例えばハイブリダイズ)する核酸分子は、検出可能な標識を(直接または間接に)含んでいる。前記検出可能な標識を本明細書では「レポータプローブ」または「レポータプローブ複合体」と呼び、これらの用語を本明細書では交換可能に用いる。レポータプローブとして、DNA、RNA、PNAのいずれかが可能である。レポータプローブはDNAであることが好ましい。
レポータプローブは少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは少なくとも1個の相補的核酸分子に結合することができ、第2のドメインは第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。図3は、シークエンシング用プローブの一例のバーコードドメインの第1の付着位置に結合した本開示によるレポータプローブの一例の模式図を示している。図3では、レポータプローブの第1のドメイン(栗色の市松模様で表示)がバーコードドメインの付着位置R1の中の相補的核酸配列に結合し、レポータプローブの第2のドメイン(灰色で表示)が2つの検出可能な標識(1つは緑色の標識、1つは赤色の標識)に結合している。
あるいはレポータプローブは少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは少なくとも1つの第1の相補的核酸分子に結合することができ、第2のドメインは少なくとも1つの第2の相補的核酸分子に結合することができる。少なくとも1つの第1の相補的核酸分子と少なくとも1つの第2の相補的核酸分子は異なっている(異なる核酸配列を持つ)ことが可能である。
「一次核酸分子」は、少なくとも2つのドメインを含むレポータプローブであり、そのうちの第1のドメインは、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に結合(ハイブリダイズ)することができ、第2のドメインは、少なくとも1つの追加の相補的核酸に結合(ハイブリダイズ)することができる。一次核酸分子は、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に直接結合することができる。一次核酸分子は、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に核酸リンカーを介して間接的に結合することができる。一次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置させることができる。切断可能なリンカーは、光で切断できることが好ましい。
一次核酸分子の第1のドメインを含む核酸のそれぞれとして、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体が可能である。一次核酸分子の第1のドメインの中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であることが可能である。バーコードドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。一次核酸分子の第1のドメインで有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の適切な相補的核酸配列に対する一次核酸分子の第1のドメインの結合効率と結合精度を改善する一方で、標的を含めて別の箇所への結合を最少にすることができる。
一次核酸分子に結合する少なくとも1個の追加の相補的核酸を本明細書では「二次核酸分子」と呼ぶ。一次核酸分子は、少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、またはそれよりも多い個数の二次核酸分子に結合(例えばハイブリダイズ)することができる。一次核酸分子は、4個の二次核酸分子に結合(例えばハイブリダイズ)することが好ましい。
二次核酸分子は少なくとも2つのドメインを含んでいて、そのうちの第1のドメインは、少なくとも1個の一次核酸分子の中の少なくとも1つの相補的配列に結合(例えばハイブリダイズ)することができ、第2のドメインは、(a)第1の検出可能な標識と少なくとも第2の検出可能な標識に、または(b)少なくとも1個の追加の相補的核酸分子に、または(c)これらの組み合わせに結合(例えばハイブリダイズ)することができる。二次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置させることができる。切断可能なリンカーは、光で切断できることが好ましい。
二次核酸分子の第1のドメインを含む核酸のそれぞれとして、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体が可能である。二次核酸分子の第1のドメインの中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であることが可能である。バーコードドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。二次核酸分子の第1のドメインで有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、一次核酸分子の第2のドメインの中の適切な相補的核酸配列に対する二次核酸分子の第1のドメインの結合効率と結合精度を改善する一方で、別の箇所への結合を最少にすることができる。
二次核酸分子に結合する少なくとも1個の追加の相補的核酸を本明細書では「三次核酸分子」と呼ぶ。二次核酸分子は、少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個、または少なくとも7個、またはそれよりも多い個数の三次核酸分子に結合(例えばハイブリダイズ)することができる。前記少なくとも1個の二次核酸分子は1個の三次核酸分子に結合(例えばハイブリダイズ)することが好ましい。
三次核酸分子は少なくとも2つのドメインを含んでいて、そのうちの第1のドメインは、少なくとも1個の二次核酸分子の中の少なくとも1つの相補的配列に結合(例えばハイブリダイズ)することができ、第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合(例えばハイブリダイズ)することができる。あるいは第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識を、オリゴヌクレオチド合成の間に例えばホスホロアミダイトまたはNHS化学を利用してこれら標識を直接または間接に付着させることを通じて含むことができる。三次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置させることができる。切断可能なリンカーは、光で切断できることが好ましい。
三次核酸分子の第1のドメインを含む核酸のそれぞれは、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体である。三次核酸の第1のドメインの中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であることが可能である。三次核酸分子の第1のドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。三次核酸分子の第1のドメインで有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、二次核酸分子の第2のドメインの中の適切な相補的核酸配列に対する三次核酸分子の第1のドメインの結合効率と結合精度を改善する一方で、別の箇所への結合を最少にすることができる。
レポータプローブは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合して2色の組み合わせを生み出す。蛍光染料のこの二重の組み合わせには、単一の色の重複(例えば青-青)を含めることができる。本明細書では、「標識」という用語に、検出可能な信号を発生させることのできる単一の部分、または同じか実質的に同じ検出可能な信号を発生させることのできる複数の部分が含まれる。例えば標識には、単一の黄色蛍光染料(ALEXA FLUOR(商標)532など)、または複数の黄色蛍光染料(ALEXA FLUOR(商標)532などなど)が含まれる。
レポータプローブは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができ、それぞれの検出可能な標識は、青(B)、緑(G)、黄(Y)、赤(R)という4種類の蛍光染料のうちの1つである。これら4種類の染料を用いると、可能な2色の組み合わせが10通り(BB;BG;BR;BY;GG;GR;GY;RR;RY;YY)生じる。いくつかの側面では、図3に示したように、本開示のレポータプローブに、8通りの可能な色組み合わせ、すなわちBB;BG;BR;BY;GG;GR;GY;YYのうちの1つで標識する。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
シークエンシング用プローブと一次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも2個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;標的結合ドメインの中の前記6個のヌクレオチドのうちの少なくとも1個、または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子は第1の検出可能な標識と少なくとも第2の検出可能な標識を含み、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的一次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。標的結合ドメインの中にあって標的核酸分子の中の対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドとして、標的結合ドメインの中の少なくとも6個のヌクレオチドによって指定されない標的に対して特異的でない4通りの正規塩基のうちの任意のもの、またはユニバーサル塩基、または縮重塩基が可能である。
シークエンシング用プローブと一次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも4個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子は第1の検出可能な標識と少なくとも第2の検出可能な標識を含み、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的一次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
シークエンシング用プローブと、一次核酸分子と、二次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも2個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく、標的結合ドメインの中の前記6個のヌクレオチドのうちの少なくとも1個、または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり、標的結合ドメインの中の前記少なくとも1個、または少なくとも2個のヌクレオチドは、標的結合ドメインの中の他の塩基によって指定されない標的に対して特異的でない4種類の正規塩基のうちの任意のもの、またはユニバーサル塩基、または縮重塩基であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的二次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
シークエンシング用プローブと、一次核酸分子と、二次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも4個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的二次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
シークエンシング用プローブと、一次核酸分子と、二次核酸分子と、三次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも2個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;標的結合ドメインの中の前記6個のヌクレオチドのうちの少なくとも1個、または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり、標的結合ドメインの中にあって標的核酸分子の中の対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドとして、標的結合ドメインの中の前記少なくとも6個のヌクレオチドによって指定されない標的に対して特異的でない4種類の正規塩基のうちの任意のもの、またはユニバーサル塩基、または縮重塩基が可能であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも1個の相補的二次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的三次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的三次核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
シークエンシング用プローブと、一次核酸分子と、二次核酸分子と、三次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも4個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも1個の相補的二次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的三次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的三次核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
本開示により、シークエンシング用プローブと、二次核酸分子と三次核酸分子の両方の表面に検出可能な標識を有するレポータプローブも提供される。例えば二次核酸分子は一次核酸分子に結合することができ、前記二次核酸分子は、第1の検出可能な標識と少なくとも第2の検出可能な標識の両方を含むことができるとともに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の三次核酸分子にも結合することができる。二次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。三次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。二次核酸分子の表面に位置する検出可能な標識の発光スペクトルは、互いに同じにすること、または三次核酸分子の表面に位置する検出可能な標識の発光スペクトルとは異なるようにすることができる。
図4は、一次核酸分子と二次核酸分子と三次核酸分子の一例を含む本開示のレポータプローブの一例の模式図である。一次核酸分子は3'末端に第1のドメインを含んでいて、この第1のドメインは、シークエンシング用プローブのバーコードドメインの1つの付着位置の中の相補的付着領域にハイブリダイズする12個のヌクレオチドからなる配列を含んでいる。5'末端は、6個の二次核酸分子にハイブリダイズする第2のドメインである。例示した二次核酸分子のほうは、5'末端にあって一次核酸分子にハイブリダイズする第1のドメインと、3'部分にあって5個の三次核酸分子にハイブリダイズするドメインを含んでいる。
三次核酸分子は少なくとも2つのドメインを含んでいる。第1のドメインは、二次核酸分子に結合することができる。三次核酸の第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。三次核酸の第2のドメインは、蛍光標識された1個以上のヌクレオチドモノマーを三次核酸の第2のドメインの配列に直接組み込むことにより、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。二次核酸分子の第2のドメインには、標識された短いポリヌクレオチドを二次核酸分子の第2のドメインにハイブリダイズさせることにより、第1の検出可能な標識と少なくとも第2の検出可能な標識を結合させることができる。これらの短いポリヌクレオチド(「標識されたオリゴ」と呼ぶ)には、蛍光標識したヌクレオチドモノマーを直接組み込むことによって、または当業者に知られている他の核酸標識法によって標識することができる。図4に例示した三次核酸は「標識されたオリゴ」と見なすことができ、二次核酸分子にハイブリダイズする第1のドメインを含むとともに、例えばNHS化学を利用してオリゴヌクレオチド合成の間に標識を間接的に付着させることによって、または三次核酸分子の合成の間に蛍光標識した1個以上のヌクレオチドモノマーを組み込むことによって蛍光標識した第2のドメインを含んでいる。標識したオリゴとして、DNA、RNA、PNAのいずれかが可能である。
代わりの側面では、二次核酸分子の第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。二次核酸分子の第2のドメインは、蛍光標識した1個以上のヌクレオチドモノマーを二次核酸の第2のドメインの配列に直接組み込むことにより、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合させることができる。二次核酸分子の第2のドメインには、標識された短いポリヌクレオチドを二次核酸の第2のドメインにハイブリダイズさせることにより、第1の検出可能な標識と少なくとも第2の検出可能な標識を結合させることができる。これらの短いポリヌクレオチド(「標識されたオリゴ」と呼ぶ)には、蛍光標識したヌクレオチドモノマーを直接組み込むことによって、または当業者に知られている他の核酸標識法によって標識することができる。
一次核酸分子は、約100個、または約95個、または約90個、または約85個、または約80個、または約75個のヌクレオチドを含むことができる。一次核酸分子は約100個~約80個のヌクレオチドを含むことができる。一次核酸分子は約90個のヌクレオチドを含むことができる。二次核酸分子は、約90個、または約85個、または約80個、または約75個、または約70個のヌクレオチドを含むことができる。二次核酸分子は約90個~約80個のヌクレオチドを含むことができる。二次核酸分子は約87個のヌクレオチドを含むことができる。二次核酸分子は、約25個、または約20個、または約15個、または約10個のヌクレオチドを含むことができる。三次核酸分子は約20個~約10個のヌクレオチドを含むことができる。三次核酸分子は約15個のヌクレオチドを含むことができる。
本開示のレポータプローブはさまざまな設計にすることができる。例えば一次核酸分子を少なくとも1個(例えば1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数)の二次核酸分子にハイブリダイズさせることができる。それぞれの二次核酸分子は少なくとも1個(例えば1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数)の三次核酸分子にハイブリダイズさせることができる。特定の2色の組み合わせで標識したレポータプローブを作製するため、二次核酸分子、または三次核酸分子、または標識したオリゴ、または二次核酸分子と三次核酸分子と標識したオリゴの任意の組み合わせを前記特定の2色の組み合わせの各色で標識したものを含むレポータプローブを設計する。例えば図4は、合計30個の染料(15個の染料が色1、15個の染料が色2)を含む本開示のレポータプローブを示している。異なる蛍光染料の間の色の交換または交差ハイブリダイゼーションを回避するため、特定の標識または蛍光染料に結合したそれぞれの三次核酸または標識したオリゴは、独自のヌクレオチド配列を含んでいる。
図5は、本開示のレポータプローブの例を4つ示している。図5の左上の図は、5×5レポータプローブを示している。5×5プローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸は第2のドメインも含んでいて、前記第2のドメインは、5個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、検出可能な標識が結合した5個の三次核酸がそれぞれの二次核酸にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
図5の右上の図は、4×3レポータプローブを示している。4×3レポータプローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸は第2のドメインも含んでいて、前記第2のドメインは、4個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、検出可能な標識が結合した3個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
図5の左下の図は、3×4レポータプローブを示している。3×4レポータプローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸は第2のドメインも含んでいて、前記第2のドメインは、3個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、検出可能な標識が結合した4個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
図5の右下の図は、スペーサ3×4レポータプローブを示している。スペーサ3×4レポータプローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸の第1のドメインと第2のドメインの間には、20~40個のヌクレオチドからなるスペーサ領域が位置する。このスペーサは長さが20~40個のヌクレオチドであるとされるが、スペーサの長さに制限はなく、20個未満のヌクレオチドや40個超のヌクレオチドが可能である。一次核酸の第2のドメインは、3個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸は、検出可能な標識が結合した4個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
図5では、それぞれの一次核酸は、長さが12個のヌクレオチドである第1のドメインを含んでいる。しかし一次核酸の第1のドメインの長さに制限はなく、12個未満のヌクレオチドや12個超のヌクレオチドが可能である。一次核酸の第1のドメインは14個のヌクレオチドであることが好ましい。
図5の個々の図に示した1つの具体的なレポータプローブの設計の任意の特徴を、図5の別の図に示すか本明細書の別の箇所に記載したレポータプローブの設計の任意の特徴と組み合わせることができる。例えば5×5レポータプローブを改変し、相補的核酸と一次核酸の間に約20~40個のヌクレオチドからなるスペーサ領域が含まれるようにすることができる。別の一例では、4×3レポータプローブを改変し、4個の二次核酸が、検出可能な標識に結合した5個の三次核酸がそれぞれの二次核酸にハイブリダイズすることを可能にするヌクレオチド配列を含むようにすることで、4×5レポータプローブを作り出すことができる。
図5を参照すると、5×5レポータは蛍光標識(25個)を4×3レポータ(12個)よりも多く含有しているため、5×5レポータの蛍光強度はより大きくなろう。所与の視野FOVで検出される蛍光は、さまざまな変数(所与のレポータプローブの蛍光強度や、前記FOV内にあって場合によっては結合した標的分子の数が含まれる)の関数である。場合によっては結合した標的分子の視野(FOV)当たりの数は、FOV当たり標的が100万~250万個になる可能性がある。FOV当たりの結合した標的分子の典型的な数は、20,000~40,000個、220,000~440,000個、100万~200万個の標的分子である。典型的なFOVは0.05 mm2~1 mm2である。典型的なFOVのさらに別の例は0.05 mm2~0.65 mm2である。
図6は、二次核酸分子が「追加ハンドル」を含むレポータプローブの設計を示している。この「追加ハンドル」は三次核酸分子にハイブリダイズせず、一次核酸分子の遠位にある。図6では、それぞれの「追加ハンドル」は長さが12個のヌクレオチド(「12量体」)だが、前記長さに制限はなく、12個未満のヌクレオチドや12個超のヌクレオチドが可能である。「追加ハンドル」は、それぞれが、一次核酸分子の第1のドメインのヌクレオチド配列を含むことができ、前記配列に二次核酸がハイブリダイズする。したがってレポータプローブが「追加ハンドル」を含んでいるとき、レポータプローブは、一次核酸分子の第1のドメインを介して、または「追加ハンドル」を介してシークエンシング用プローブにハイブリダイズすることができる。したがってレポータプローブがシークエンシング用プローブに結合する可能性が大きくなる。「追加ハンドル」のこの設計は、ハイブリダイゼーションの反応速度も改善することができる。いかなる理論にも囚われることなく、「追加ハンドル」はレポータプローブの相補的核酸の有効濃度を大きくすることができる。5×4「追加ハンドル」レポータプローブを用いると、標準的FOV当たり約4750蛍光カウントになることが予想される。5×3「追加ハンドル」レポータプローブ、4×4「追加ハンドル」レポータプローブ、4×3「追加ハンドル」レポータプローブ、3×4「追加ハンドル」レポータプローブを用いると、標準的FOV当たり約6000蛍光カウントになることが予想される。図5に示したレポータプローブの設計例も「追加ハンドル」を含むように改変することができる。
レポータプローブの個々の二次核酸分子は、すべてが同じ検出可能な標識で標識された複数の三次核酸分子にハイブリダイズさせることができる。例えば図7の左図は、「5×6」レポータプローブを示している。5×6レポータプローブは、第2のドメインを含む1個の一次核酸を含んでおり、前記第2のドメインは、6個の二次核酸分子にハイブリダイズしたヌクレオチド配列を含んでいる。それぞれの二次核酸は、検出可能な標識が結合した5個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。特定の1個の二次核酸分子に結合する5個の三次核酸分子のそれぞれは、同じ検出可能な標識で標識されている。例えば二次核酸分子のうちの3個は黄色蛍光染料で標識した三次核酸分子に結合しており、残る3個の二次核酸分子は赤色蛍光で標識した三次核酸分子に結合している。
レポータプローブの個々の二次核酸分子は、異なる検出可能な標識で標識した三次核酸分子にハイブリダイズすることができる。例えば図7の中央の図は、「3×2×6」レポータプローブの設計を示している。「3×2×6」レポータプローブは、第2のドメインを含む1個の一次核酸を含んでいて、前記第2のドメインは、6個の二次核酸分子にハイブリダイズしたヌクレオチド配列を含んでいる。それぞれの二次核酸は、検出可能な標識に結合した5個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。それぞれの二次核酸は、黄色蛍光染料で標識した三次核酸分子と、赤色蛍光染料で標識した三次核酸分子の両方に結合する。この特別な例では、3個の二次核酸分子が2個の赤色三次核酸分子と3個の黄色三次核酸分子に結合している一方で、残りの3個の二次核酸分子は2個の赤色三次核酸分子と3個の黄色三次核酸分子に結合している。それぞれの二次核酸分子は、異なる検出可能な標識で標識した任意の数の三次核酸分子に結合することができる。図7の中央の図では、個々の二次核酸分子に結合した三次核酸分子は、標識の色が交互に(すなわち赤-黄-赤-黄-赤または黄-赤-黄-赤-黄)なるように配置されている。
記載したレポータプローブのどの設計でも、異なる検出可能な標識で標識した三次核酸を二次核酸に沿って任意の順番で配置することができる。例えば図7の右図は、3×2×6レポータプローブの設計と似た「FRET抵抗性3×2×6」レポータプローブを示しており、それぞれの二次核酸分子に沿った赤色三次核酸分子と黄色三次核酸分子の配置(例えば線形な順番またはグループ化)だけが異なっている。
図8は、さまざまな三次核酸分子に結合する個々の二次核酸分子を含む本開示のさらに別のレポータプローブの設計を示している。左図は、1個の一次核酸分子を含む「6×1×4.5」レポータプローブを示しており、前記一次核酸分子は第2のドメインを含んでいて、この第2のドメインは、6個の二次核酸分子にハイブリダイズしたヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、5個の三次核酸分子にハイブリダイズしている。それぞれの二次核酸分子にハイブリダイズした5個の三次核酸分子のうちの4個は、同じ色の検出可能な標識で直接標識されている。5番目の三次核酸分子(分岐三次核酸と呼ぶ)は、2色の組み合わせのうちの他方の色になった5個の標識されたオリゴに結合している。6個の二次核酸のうちの3個は、2色の組み合わせのうちの一方の色(この例では赤色)で標識した分岐三次核酸に結合しているのに対し、残りの3個の二次核酸は、2色の組み合わせのうちの他方の色(この例では黄色)で標識した分岐三次核酸に結合している。まとめると、6×1×4.5レポータプローブは合計54個の染料、それぞれの色について27個の染料で標識されている。図8の中央の図は、「4×1×4.5」レポータプローブを示している。この4×1×4.5レポータプローブは、6×1×4.5レポータプローブと同じ全体的アーキテクチャを共有しているが、一次核酸が4個の二次核酸にだけ結合するため、合計36個の染料、それぞれの色について18個の染料となる点が異なっている。
レポータプローブは、2色の組み合わせのそれぞれの色について同数の染料を含むことができる。レポータプローブは、2色の組み合わせのそれぞれの色について異なる数の染料を含むことができる。1つのレポータプローブ内でどの色の染料をより多くするかの選択は、2つの染料が吸収する光のエネルギーレベルに基づいてなすことができる。例えば図8の右図は、「5×5エネルギー最適化」レポータプローブの設計を示している。このレポータプローブの設計は、(エネルギーがより高い)15個の黄色染料と(エネルギーがより低い)10個の赤色染料を含んでいる。この例では、15個の黄色染料が第1の標識を構成し、10個の赤色染料が第2の標識を構成することができる。
検出可能な部分、標識、レポータのいずれかを、二次核酸分子、三次核酸分子、標識されたオリゴのいずれかに、検出可能な部分(蛍光部分、測色部分など)の直接的または間接的な付着を含むさまざまなやり方で結合させることができる。当業者は、核酸に標識することに関する参考文献を参照することができる。蛍光部分の非限定的な例に含まれるのは、黄色蛍光タンパク質(YFP)、緑色蛍光タンパク質(GFP)、シアン色蛍光タンパク質(CFP)赤色蛍光タンパク質(RFP)、ウンベリフェロン、フルオレセイン、イソチオシアン酸フルオレセイン、ローダミン、ジクロロトリアジニルアミンフルオレセイン、シアニン、塩化ダンシル、フィコシアニン、フィオエリトリンなどである。
蛍光標識と、ヌクレオチドおよび/またはオリゴヌクレオチドへの前記蛍光標識の付着は多くの文献に記載されており、前記中に含まれるのは、Haugland、『Handbook of Fluorescent Probes and Research Chemicals』、第9版(Molecular Probes, Inc.社、ユージン、2002年);KellerとManak、『DNA Probes』、第2版(Stockton Press社、ニューヨーク、1993年);Eckstein編、『Oligonucleotides and Analogues: A Practical Approach』(IRL Press社、オックスフォード、1991年);Wetmur、Critical Reviews in Biochemistry and Molecular Biology、第26巻:227~259ページ(1991年)である。本開示に適用できる具体的な方法は、参考文献のサンプルであるアメリカ合衆国特許第4,757,141号;第5,151,507号;第5,091,519号に開示されている。標識された標的配列のための標識として1つ以上の蛍光染料を用いることができる。それが開示されているのは、例えばアメリカ合衆国特許第5,188,934号(4,7-ジクロロフルオレセイン染料);第5,366,860号(スペクトル分解可能なローダミン染料);第5,847,162号(4,7-ジクロロローダミン染料);第4,318,846 (エーテルで置換されたフルオレセイン染料);第5,800,996号(エネルギー移動染料);Lee他 第5,066,580号(キサンチン染料);第5,688,648号(エネルギー移動染料)などである。量子ドットを用いて標識することもできる。それは例えばアメリカ合衆国特許第6,322,901号;第6,576,291号;第6,423,551号;第6,251,303号;第6,319,426号;第6,426,513号;第6,444,143号;第5,990,479号;第6,207,392号;アメリカ合衆国特許出願公開第2002/0045045号;第2003/0017264号に開示されている。本明細書では、「蛍光標識」という用語に、1個以上の分子の蛍光吸収特性および/または蛍光発生特性を通じて情報を伝えるシグナル伝達部分が含まれる。前記ような蛍光特性には、蛍光強度、蛍光の寿命、発光スペクトルの性質、エネルギー移動などが含まれる。
ヌクレオチド配列および/またはオリゴヌクレオチド配列に容易に組み込まれる市販の蛍光ヌクレオチド類似体の非限定的な例に含まれるのは、Cy3-dCTP、Cy3-dUTP、Cy5-dCTP、Cy5-dUTP(Amersham Biosciences社、ピスカタウェイ、ニュージャージー州)、フルオレセイン-12-dUTP、テトラメチルローダミン-6-dUTP、TEXAS RED(商標)-5-dUTP、CASCADE BLUE(商標)-7-dUTP、BODIPY TMFL-14-dUTP、BODIPY TMR-14-dUTP、BODIPY TMTR-14-dUTP、RHODAMINE GREEN(商標)-5-dUTP、OREGON GREENR(商標)488-5-dUTP、TEXAS RED(商標)-12-dUTP、BODIPY TM 630/650-14-dUTP、BODIPY TM 650/665-14-dUTP、ALEXA FLUOR(商標)488-5-dUTP、ALEXA FLUOR(商標)532-5-dUTP、ALEXA FLUOR(商標)568-5-dUTP、ALEXA FLUOR(商標)594-5-dUTP、ALEXA FLUOR(商標)546-14-dUTP、フルオレセイン-12-UTP、テトラメチルローダミン-6-UTP、TEXAS RED(商標)-5-UTP、mCherry、CASCADE BLUE(商標)-7-UTP、BODIPY TM FL-14-UTP、BODIPY TMR-14-UTP、BODIPY TM TR-14-UTP、RHODAMINE GREEN(商標)-5-UTP、ALEXA FLUOR(商標)488-5-UTP、LEXA FLUOR(商標)546-14-UTP(Molecular Probes, Inc.社、ユージン、オレゴン州)などである。あるいは上記の蛍光体と本明細書で言及した蛍光体をオリゴヌクレオチド合成の間に例えばホスホロアミダイトまたはNHS化学を利用して付加することができる。他の蛍光体を有するヌクレオチドのカスタム合成に関するプロトコルが本分野で知られている(Henegariu他(2000年)Nature Biotechnol. 第18巻:345ページを参照されたい)。2-アミノプリンは、合成中にオリゴヌクレオチド配列に直接組み込むことのできる蛍光性塩基である。核酸をあらかじめインターカレーティング染料(DAPI、YOYO-1、臭化エチジウム、シアニン染料(例えばSYBR Green)など)で染色することもできよう。
合成後に付着させるのに利用できる他の蛍光体の非限定的な例に含まれるのは、ALEXA FLUOR(商標)350、ALEXA FLUOR(商標)405、ALEXA FLUOR(商標)430、ALEXA FLUOR(商標)532、ALEXA FLUOR(商標)546、ALEXA FLUOR(商標)568、ALEXA FLUOR(商標)594、ALEXA FLUOR(商標)647、BODIPY 493/503、BODIPY FL、BODIPY R6G、BODIPY 530/550、BODIPY TMR、BODIPY 558/568、BODIPY 558/568、BODIPY 564/570、BODIPY 576/589、BODIPY 581/591、BODIPY TR、BODIPY 630/650、BODIPY 650/665、Cascade Blue、Cascade Yellow、Dansyl、リッサミンローダミンB、Marina Blue、Oregon Green 488、Oregon Green 514、Pacific Blue、Pacific Orange、ローダミン6G、ローダミン・グリーン、ローダミン・レッド、テトラメチルローダミン、Texas Red(Molecular Probes, Inc. 社、ユージン、オレゴン州から入手可能)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7(Amersham Biosciences社、ピスカタウェイ、ニュージャージー州)などである。FRETタンデム蛍光体も用いることができ、前記非限定的な例に含まれるのは、PerCP-Cy5.5、PE-Cy5、PE-Cy5.5、PE-Cy7、PE-Texas Red、APC-Cy7、PE-Alexa 染料(610、647、680)、APC-Alexa染料などである。
金属である銀粒子または金粒子を用い、蛍光標識したヌクレオチド配列および/またはオリゴヌクレオチド配列からの信号を増強することができる(Lakowicz他(2003年)BioTechniques 第34巻:62ページ)。
オリゴヌクレオチド配列にとって適切な他の標識に含めることができるのは、フルオレセイン(FAM、FITC)、ジゴキシゲニン、ジニトロフェノール(DNP)、ダンシル、ビオチン、ブロモデオキシウリジン(BrdU)、ヘキサヒスチジン(6×His)、リン-アミノ酸(例えばP-tyr、P-ser、P-thr)などである。以下のハプテン/抗体ペア、すなわちビオチン/a-ビオチン、ジゴキシゲニン/a-ジゴキシゲニン、ジニトロフェノール(DNP)/a-DNP、5-カルボキシフルオレセイン(FAM)/a-FAMを検出に用いることができる。前記ペアの中の抗体のそれぞれは、検出可能な標識で誘導体化されている。
本明細書に記載した検出可能な標識はスペクトル分解が可能である。複数の蛍光標識に関する「スペクトル分解可能な」は、それら標識の蛍光発光バンドが十分に明確であるため、すなわち重複のないことが十分であるため、それぞれの標識を付着させた分子タグを、それぞれの標識から発生した蛍光信号に基づき、例えば帯域通過フィルタと光増倍管などからなるシステムを用いた標準的な光検出系によって識別できることを意味する。前記ようなシステムの例は、アメリカ合衆国特許第4,230,558号;第4,811,218号など、または『Flow Cytometry: Instrumentation and Data Analysis』(Academic Press社、ニューヨーク、1985年)の中のWheeless他、21~76ページに記載されている。スペクトル分解可能な有機染料(フルオレセイン、ローダミンなど)は、最大発光波長が互いに少なくとも20 nm離れていることを意味し、別の側面では、互いに少なくとも40 nm離れていることを意味する。キレート化されたランタニド化合物や量子ドットなどに関しては、スペクトル分解可能なは、最大発光波長が互いに少なくとも10 nm離れていること、または互いに少なくとも15 nm離れていることを意味する。
レポータプローブは、1つ以上の切断可能なリンカー修飾を含むことができる。前記1つ以上の切断可能なリンカー修飾は、レポータプローブの中の任意の場所に位置させることができる。切断可能なリンカー修飾は、レポータプローブの一次核酸分子の第1のドメインと第2のドメインの間に位置させることができる。図9は、一次核酸分子の第1のドメインと第2のドメインの間にリンカー修飾を含む本開示のレポータプローブの一例を示している。切断可能なリンカー修飾は、レポータプローブの二次核酸分子の第1のドメインと第2のドメインの間に存在することができる。切断可能なリンカー修飾は、レポータプローブの一次核酸分子と二次核酸分子の第1のドメインと第2のドメインの間に存在することができる。図10の左図は、一次核酸の第1のドメインと第2のドメインの間と、二次核酸の第1のドメインと第2のドメインの間に切断可能なリンカー修飾を含む本開示のレポータプローブの一例を示している。
切断可能なリンカー修飾として、式(I)の化合物:
Figure 2022174137000004
または前記立体異性体または塩が可能である。ここで、この式においてR1は、水素、ハロゲン、C1-6アルキル、C2-6アルケニル、C2-6アルキニルであり、前記中のC1-6アルキル、C2-6アルケニル、C2-6アルキニルは、それぞれ独立に、少なくとも1個の置換基R10で場合によっては置換されており;R2は、O、NH、N(C1-6アルキル)のいずれかであり;R3は、シクロアルキル、ヘテロシクロアルキル, アリール、ヘテロアリールのいずれかであり、前記それぞれは、場合によっては少なくとも1個の置換基R10で置換されており;それぞれのR4とR7は独立に、C1-6 アルキル、C2-6 アルケニル、C2-6 アルキニルであり、前記中のC1-6アルキル、C2-6アルケニル、C2-6アルキニルは、それぞれ独立に、場合によっては少なくとも1個の置換基R10で置換されており;R5とR9は、それぞれ独立に、シクロアルキル、ヘテロシクロアルキル、アリール、ヘテロアリールのいずれかであり、前記それぞれは、場合によっては少なくとも1個の置換基R10で置換されており;R6は、O、NH、N(C1-6 アルキル)のいずれかであり;R8は、O、NH、N(C1-6アルキル) のいずれかであり;それぞれのR10は独立に、水素、ハロゲン、-C1-6アルキル、-C2-6アルケニル、-C2-6アルキニル、ハロC1-6アルキル、ハロC2-6アルケニル、ハロC2-6アルキニル、シクロアルキル、ヘテロシクリル、アリール、ヘテロアリール、-CN、-NO2、オキソ、-OR11、-SO2R11、-SO3 -、-COR11、-CO2R11、-CONR11R12、-C(=NR11)NR12R13、-NR11R12、-NR12COR12、-NR11CONR12R13、-NR11CO2R12、-NR11SONR12R13、-NR11SO2NR12R13、-NR11SO2R12のいずれかであり;R11、R12、R13は、同じでも異なっていてもよく、それぞれ独立に、水素、-C1-6アルキル、-C2-6アルケニル、-C2-6アルキニル、ハロC1-6アルキル、ハロC2-6アルケニル、ハロC2-6アルキニル、C1-6アルキルオキシC1-6アルキル-、シクロアルキル、ヘテロシクリル、アリール、ヘテロアリールのいずれかである。
1つの側面では、R1はC1-6アルキルであり、C1-3アルキル(メチル、エチル、プロピル、イソプロピルなど)が好ましく;R2はNHまたはNであり;R3は5員または6員のシクロアルキルであり、シクロヘキシルが好ましく;R4はC1-6アルキルであり、C1-3アルキレン(メチレン、エチレン、プロピレン、イソプロピレンなど)が好ましく;R5は5員または6員のヘテロシクリルであり、1個の窒素原子と、N、O、Sから選択した0個または1個の追加のヘテロ原子を含んでいて、前記ヘテロシクリルは、場合によっては1個または2個のR10で置換されており;R6はOであり;R7はC1-6アルキルであり、 C1-3 アルキレン(メチレン、エチレン、プロピレン、イソプロピレンなど)が好ましく;R8はOであり;R9は5員または6員のヘテロシクリルであり、1個の窒素原子と、N、O、Sから選択した0個または1個の追加のヘテロ原子を含んでいて、前記ヘテロシクリルは、場合によっては1個または2個のR10で置換されており;それぞれのR10は独立に、ハロゲン、C1-6アルキル、ハロC1-6アルキル、オキソ、-SO2H、-SO3 -のいずれかである。
1つの側面では、R3はシクロヘキシルであり、R4はメチレンであり、R5は1H-ピロール-2,5-ジオンであり、R9はピロリジン-2,5-ジオンであり、場合によってはSO3 -で置換されている。
リンカー化合物として、
Figure 2022174137000005
または前記立体異性体または塩が可能である。
リンカー化合物として、
Figure 2022174137000006
または前記立体異性体または塩が可能である。
リンカー化合物またはリンカー修飾として、
Figure 2022174137000007
のいずれかが可能である。
リンカー化合物またはリンカー修飾として、
Figure 2022174137000008
のいずれかが可能である。
レポータプローブは、3種類の貯蔵溶液を水と互いに混合することによって構成することができる。1つの貯蔵溶液は一次核酸分子を含有し、1つの貯蔵溶液は二次核酸分子を含有し、最後の貯蔵溶液は三次核酸分子を含有している。表2に、個々の設計のレポータプローブを構成するために混合することのできる各貯蔵溶液の量の例を示してある。
Figure 2022174137000009
標的核酸
本開示により、本開示のシークエンシング用プローブを用いて核酸をシークエンシングする方法が提供される。本開示の方法を利用してシークエンシングする核酸を本明細書では「標的核酸」と呼ぶ。「標的核酸」という用語は、本開示のプローブ、方法、装置によって配列を求める核酸分子(DNA、RNA、PNA)を意味する。一般に、「標的核酸」、「標的核酸分子」、「標的核酸配列」、「標的核酸断片」、「標的オリゴヌクレオチド」、「標的ポリヌクレオチド」という用語は交換可能に用いられ、前記非限定的な例に、さまざまな長さを持つことのできるポリマー形態のヌクレオチド(デオキシリボヌクレオチドまたはリボヌクレオチド、または前記類似体)が含まれることを想定している。核酸の非限定的な例に含まれるのは、遺伝子、遺伝子断片、エキソン、イントロン、遺伝子間DNA(前記非限定的な例に異質染色質DNAが含まれる)、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、小さな干渉性RNA(siRNA)、非コードRNA(ncRNA)、cDNA、組み換えポリヌクレオチド、分岐したポリヌクレオチド、プラスミド、ベクター、ある配列の単離されたDNA、ある配列の単離されたRNA、核酸プローブ、プライマーである。本開示の方法を利用してシークエンシングする前に、標的核酸の属性および/または配列はわかっている。あるいは前記属性および/または配列は未知である。本開示の方法を利用したシークエンシングの前に標的核酸の配列の一部がわかっていることも可能である。例えばこの方法は、既知の標的核酸分子の点変異を求めるのに利用することができる。
本開示の方法は、サンプル(例えば生物からのサンプル)から得られた核酸分子を直接シークエンシングし、変換(または増幅)工程は存在しないことが好ましい。一例として、直接的なRNAに基づくシークエンシングを実施するのに、本開示の方法は、配列を取得できるようになる前にRNA分子からDNA分子への(すなわちcDNAの合成を通じた)変換を必要としない。増幅または変換が必要ないため、本開示でシークエンシングされる核酸は、核酸がサンプルの中に存在している場合やサンプルから得られる場合には、核酸の中に存在するあらゆる独自の塩基および/またはエピジェネティックなマーカーを保持することになろう。前記ような独自の塩基および/またはエピジェネティックなマーカーは、本分野において既知のシークエンシング法では失われる。
本開示の方法を利用すると1分子の解像度でシークエンシングすることができる。言い換えると、本開示の方法により、利用者は、異なる標的核酸分子からのデータを組み合わせる必要がなく、単一の標的核酸分子から回収したデータに基づいて最終的な配列を生み出すことが可能になるため、前記特定の標的の独自の特徴がすべて保持される。
標的核酸は、核酸の任意のサンプルまたは供給源(例えば任意の細胞、組織、生物、インビトロ、化学的合成装置など)から取得することができる。標的核酸は、本分野で認められている任意の方法で得ることができる。標的核酸は、臨床対象の血液サンプルから取得することができる。標的核酸は、本分野で周知の方法とキットを利用して、供給源またはサンプルから抽出すること、または単離すること、または精製することができる。
標的核酸は、本分野で知られている任意の手段で断片化することができる。断片化は、酵素的手段または機械的手段で実施することが好ましい。機械的手段として、超音波処理または物理的剪断が可能である。酵素的手段は、ヌクレアーゼ(例えばデオキシリボヌクレアーゼI(DNアーゼI))または1つ以上の制限エンドヌクレアーゼを用いた消化によって実施することができる。
標的核酸を含む核酸分子が1つの完全な染色体であるときには、前記染色体の断片化を避ける工程を採用すべきである。
本分野で周知のように、標的核酸には天然のヌクレオチドまたは非天然のヌクレオチドを含めることができ、前記中には修飾されたヌクレオチドまたは核酸類似体が含まれる。
標的核酸分子に含めることができるのは、長さが数百キロ塩基(例えば1キロ塩基、2キロ塩基、3キロ塩基、4キロ塩基、5キロ塩基、10キロ塩基、20キロ塩基、30キロ塩基、40キロ塩基、50キロ塩基、100キロ塩基、200キロ塩基、500キロ塩基、またはそれよりも大きな数)までのDNA分子、RNA分子、PNA分子である。
捕獲用プローブ
標的核酸は基板に(例えば1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはそれよりも多くの位置で)固定化することができる。
有用な基板の例に含まれるのは結合部分を含むものであり、前記結合部分の選択は、リガンド、光源、炭水化物、核酸、受容体、レクチン、抗体からなるグループからなされる。捕獲用プローブは、基板の結合部分に結合することのできる基板結合部分を含んでいる。反応性部分を含む有用な基板の非限定的な例に含まれるのは、エポキシ、アルデヒド、金、ヒドラジド、スフルヒドリル、NHS-エステル、アミン、アルキン、アジド、チオール、カルボキシレート、マレイミド、ヒドロキシメチルホスフィン、イミドエステル、イソシアネート、ヒドロキシル、ペンタフルオロフェニル-エステル、ソラーレン、ピリジルジスルフィドまたはビニルスルホン、ポリエチレングリコール(PEG)、ヒドロゲルのいずれか、またはこれらの混合物を含む表面である。このような表面は、市販の供給源から得ること、または標準的な技術に従って用意することができる。反応性部分を含む有用な基板の非限定的な例に含まれるのは、OptArray-DNA NHSグループ(Accler8社)、Nexterion Slide AL(Schott社)、Nexterion Slide E(Schott社)である。
基板として、本分野で知られていて標的核酸を固定化することのできる任意の堅固な支持体(例えば被覆されたスライドやマイクロ流体装置)が可能である。基板として、表面、膜、ビーズ、多孔性材料、電極、アレイが可能である。基板として、例えばポリマー材料、金属、ケイ素、ガラス、石英が可能である。標的核酸は、当業者にとって明らかな任意の基板の表面に固定化することができる。
基板がアレイであるときには、基板はウエルを含むことができ、前記サイズと間隔は、付着させる標的核酸分子によって異なる。一例では、基板は、超高密度に秩序化された標的核酸のアレイが付着するように構成する。基板上の標的核酸アレイの密度の例に含まれるのは、1 mm2当たり500,000個~10,000,000個の標的核酸分子、または1,000,000個~4,000,000個の標的核酸分子、または850,000個~3,500,000個の標的核酸分子である。
基板の中のウエルは、標的核酸分子を付着させる位置である。ウエルの表面を上に説明した反応性部分を用いて機能化し、標的核酸分子の表面に存在するか標的核酸分子に結合した捕獲用プローブの表面に存在する特定の化学基を引き付けて結合させることで、標的核酸分子を引き付け、固定化し、結合させる。これら官能基は、生体分子をさまざまな共役化学を通じて特異的に引き付けて結合させうることがよく知られている。
基板(アレイなど)の上で1個の核酸分子をシークエンシングするには、ユニバーサルな捕獲用プローブを、または捕獲用プローブの基板結合部分と相補的なユニバーサル配列を、各ウエルに付着させる。次に1個の標的核酸分子を、ユニバーサルな捕獲用プローブに、または捕獲用プローブの基板結合部分と相補的で前記捕獲用プローブに結合したユニバーサル配列に結合させると、シークエンシングを開始することができる。
標的核酸分子には1つ以上の捕獲用プローブ(すなわち2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはそれよりも多い数の捕獲用プローブ)を結合させることができる。捕獲用プローブは、標的核酸の一部と相補的なドメインと、基板結合部分を含むドメインとを含んでいる。標的核酸のうちで捕獲用プローブと相補的な部分として、標的核酸の末端、または末端近くでない部分が可能である。
捕獲用プローブの基板結合部分としてビオチンが可能であり、基板としてアビジン(例えばストレプトアビジン)が可能である。アビジンを含む有用な基板は市販されており、前記中に含まれるのは、TB0200(Accler8社)、SAD6、SAD20、SAD100、SAD500、SAD2000(Xantec社)、SuperAvidin(Array-It社)、ストレプトアビジンスライド(カタログ番号MPC 000、Xenopore社)、STREPTAVIDINnslide(カタログ番号439003、Greiner Bio-one社)である。捕獲用プローブの基板結合部分としてアビジン(例えばストレプトアビジン)が可能であり、基板としてとしてビオチンが可能である。ビオチンを含んでいて市販されている有用な基板の非限定的な例に含まれるのは、Optiarray-ビオチン(Accler8社)、BD6、BD20、BD100、BD500、BD2000(Xantec社)である。
捕獲用プローブの基板結合部分として、光活性化によって基板に結合することのできる反応性部分が可能である。基板は光反応性部分を含むことができる。あるいはナノレポータの第1の部分が光反応性部分を含むことができる。光反応性部分のいくつかの例に含まれるのは、アリールアジド(N((2-ピリジルジチオ)エチル)-4-アジドサリチルアミドなど);フッ素化アリールアジド(4-アジド-2,3,5,6-テトラフルオロ安息香酸など);ベンゾフェノンに基づく試薬(4-ベンゾイル安息香酸スクシンイミジルエステルなど);5-ブロモ-デオキシウリジンである。
捕獲用プローブの基板結合部分として、基板の相補的な結合部分にハイブリダイズすることのできる核酸が可能である。捕獲用プローブの基板結合部分を含む核酸のそれぞれとして、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体が可能である。捕獲用プローブの基板結合部分の中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドとして、修飾されたヌクレオチド、または核酸類似体が可能である。捕獲用プローブの基板結合部分の中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。捕獲用プローブの基板結合部分で有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。
捕獲用プローブの基板結合部分は、当業者にとって明らかな他の結合ペアを介して基板に固定化することができる。標的核酸は、基板に結合させた後、標的核酸を伸長させるのに十分な力(例えば重力、流体力、電磁力「エレクトロストレッチング」、フロー-ストレッチング、後退メニスカス(receding meniscus)技術、これらの組み合わせ)を加えることによって伸長させることができる。捕獲用プローブは、検出可能な標識(すなわち基準スポット)を含むこと、または検出可能な標識と関連させることができる。
標的核酸には、標的核酸の第2の部分と相補的なドメインを含む第2の捕獲用プローブを結合させることができる。第2の捕獲用プローブが結合する標的核酸の第2の部分は、第1の捕獲用プローブが結合する標的核酸の第1の部分とは異なる。この部分として、標的核酸の末端、または末端近くでない部分が可能である。第2の捕獲用プローブの結合は、標的核酸の伸長後、または伸長中に起こること、または伸長し終わっていない標的核酸に対して起こることができる。第2の捕獲用プローブは、上記のような結合を持つことができる。
標的核酸には、標的核酸の第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の部分と相補的なドメインを含む第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の捕獲用プローブを結合させることができる。この部分として、標的核酸の末端、または末端近くでない部分が可能である。第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の捕獲用プローブの結合は、標的核酸の伸長後、または伸長中に起こること、または伸長し終わっていない標的核酸に対して起こることができる。第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の捕獲用プローブは、上記のような結合を持つことができる。
捕獲用プローブは標的核酸をサンプルから単離することができる。ここでは標的核酸を含むサンプルに捕獲用プローブを添加する。捕獲用プローブは、捕獲用プローブのうちで標的核酸の1つの領域と相補的な領域を介して標的核酸と結合する。捕獲用プローブの基板結合部分と結合する部分を含む基板と標的核酸が接触すると、核酸は基板の表面に固定化される。
図11は、本開示による2つの捕獲用プローブシステムを用いた1個の標的核酸の捕獲を示している。ゲノムDNAを95℃で変性させ、捕獲試薬のプールにハイブリダイズさせる。捕獲試薬のこのプールは、オリゴヌクレオチド、プローブA、プローブB、アンチセンスブロックプローブを含んでいる。プローブAは、このプローブの3'末端にあるビオチン部分と、標的核酸の5'末端と相補的な配列とを含んでいる。プローブBは、このプローブの5'末端に常磁性ビーズを結合させることのできる精製結合配列と、標的核酸の3'末端と相補的なヌクレオチド配列とを含んでいる。アンチセンスブロックプローブは、標的核酸のうちでシークエンシングする部分のアンチセンス鎖と相補的なヌクレオチド配列を含んでいる。捕獲試薬とハイブリダイズさせた後、ハイブリダイズしたプローブAとプローブBの間の標的核酸にシークエンシングウインドウを作る。プローブBの5'配列に結合する常磁性ビーズを用いて標的核酸を精製する。過剰なあらゆる捕獲試薬または相補的アンチセンスDNA鎖を洗浄除去すると、求める標的核酸が精製される。次に、精製された標的核酸が、ハイブリダイズしたプローブA上のビオチン部分に結合することのできる表面(ストレプトアビジンなど)を含むフローセルを通過するようにする。すると標的核酸の一端がフローセルの表面とつながる。他端を捕獲するには、標的核酸をフロー-ストレッチングさせ、プローブBの精製結合配列と相補的なビオチニル化されたプローブを添加する。ビオチニル化されたプローブは、プローブBの精製結合配列とハイブリダイズするとフローセルの表面に結合することができ、前記結果として、伸長していてフローセルの表面に両端が結合した捕獲された標的核酸になる。
利用者が高度に断片化されたサンプルからできるだけ多くの標的核酸分子を確実に「捕獲する」ためには、複数の捕獲用プローブが含まれていて、それぞれの捕獲用プローブが標的核酸の異なる領域と相補的になるようにすることが有用である。例えば捕獲用プローブの3つのプールが存在することが可能であり、そのうちの第1のプールは標的核酸のうちで5'末端近くの領域と相補的であり、第2のプールは標的核酸のうちで中央部の領域と相補的であり、第3のプールは標的核酸のうちで3'末端近くの領域と相補的である。これは、1つの標的核酸につき「興味あるn個の領域」に一般化することができる。この例では、断片化された標的核酸の個々のプールが、ビオチンタグを含むかビオチンタグに結合した捕獲用プローブに結合する。入力サンプルの1/n(nは標的核酸の中の異なる領域の数である)を各プール室で単離する。捕獲用プローブは興味ある標的核酸に結合する。次に標的核酸を、捕獲用プローブのビオチンを介し、基板に付着させたアビジン分子に固定化する。場合によっては、標的核酸を例えば流体力または静電力を通じて伸長させる。n個のプールすべてを同時に伸長させて結合させることや、完全に伸長した分子の数を最大にするため、(大半の5'領域を捕獲する)プール1を伸長させて最初に結合させた後、(標的の中央領域を捕獲する)プール2を伸長させて結合させ、最後にプール3を伸長させて結合させることができる。
本開示により、利用者は、複数の標的核酸を捕獲すると同時にシークエンシングすることや、複数の捕獲用プローブを複数の標的核酸が混合されたサンプルにハイブリダイズさせることも可能になる。複数の標的核酸には、それぞれの核酸が同じ配列を含む2つ以上の核酸からなるグループ、またはそれぞれの核酸が必ずしも同じ配列を含んでいない2つ以上の核酸からなるグループを含めることができる。同様に、複数の標的核酸には、配列が同じ2つ以上の捕獲用プローブからなるグループ、または配列が必ずしも同じではない2つ以上の捕獲用プローブからなるグループを含めることができる。例えばどれもが同じ配列を含む複数の捕獲用プローブを用いると、利用者は、どれもが同じ配列を含む複数の標的核酸を捕獲することができる。同じ配列を含むこの複数の標的核酸をシークエンシングすると、データが冗長であるために高レベルのシークエンシング精度を達成することができる。別の一例では、興味ある各遺伝子と相補的な捕獲用プローブを含む一群の捕獲用プローブを用いると、興味ある2つ以上の特定の遺伝子を捕獲すると同時にシークエンシングすることができる。こうすることで、利用者は、特定の遺伝子の多重シークエンシングを実施することができる。図12は、FFPEサンプルを用いた100個の標的からなる多重がんパネルを本開示の方法で捕獲して検出する実験からの結果を示している。
全範囲をシークエンシングすることが望ましい場合には、必要とされる別々の捕獲用プローブの数は、標的核酸の断片のサイズと逆になる関係がある。言い換えると、高度に断片化された標的核酸ではより多くの捕獲用プローブが必要になろう。高度に断片化され分解されている標的核酸を含むタイプのサンプル(例えばホルマリン固定パラフィン包埋組織)では、捕獲用プローブのプールを多数含めると有用である可能性がある。逆に、標的核酸の断片が長いサンプル(例えばインビトロで得られた単離された核酸)では、5'末端位置の1つの捕獲用プローブで十分である可能性がある。
標的核酸のうちで2つの捕獲用プローブに挟まれた領域、または1つの捕獲用プローブの後かつ標的核酸の末端の前の領域を「シークエンシングウインドウ」と呼ぶ。図11では、2つの捕獲用プローブを用いて1個の標的核酸を捕獲するときに生じるシークエンシングウインドウに標識している。シークエンシングウインドウは、標的核酸のうちでシークエンシング用プローブが結合に利用できる部分である。最小シークエンシングウインドウは標的結合ドメインの長さ(例えば4~10個のヌクレオチド)であり、最大シークエンシングウインドウは1つの染色体全体の大半である。
本開示の方法を利用して大きな標的核酸分子をシークエンシングするとき、1個の「ブロッカーオリゴ」または複数のブロッカーオリゴを標的核酸の長さに沿ってハイブリダイズさせてシークエンシングウインドウのサイズを制御することができる。ブロッカーオリゴは標的核酸に特定の位置でハイブリダイズし、前記ことによってシークエンシング用プローブがそれらの位置に結合することを阻止し、興味あるより小さなシークエンシングウインドウが作り出される。図13は、捕獲された2個の標的DNA分子が捕獲用プローブとブロッカーオリゴとシークエンシング用プローブにハイブリダイズしている模式図を示している。より小さなシークエンシングウインドウを作り出すことによってシークエンシング反応は標的DNA分子の興味ある特定の領域に限定されるため、シークエンシングの速度と精度が向上する。ブロッカーオリゴの使用は、標的核酸の中の既知の位置における特定の変異をシークエンシングするときに特に有用である。というのも標的核酸全体をシークエンシングする必要がないからである。図13の例は、2つの異なるハプロタイプを識別することを目的として2つの異種部位を標的としたシークエンシングを示している。
本開示の方法
本開示のシークエンシング法は、本明細書に開示した少なくとも1つのシークエンシング用プローブを標的核酸に可逆的にハイブリダイズさせることを含んでいる。
核酸のシークエンシング法は、(1)本明細書に記載したシークエンシング用プローブを標的核酸にハイブリダイズさせることを含むことができる。標的核酸は、場合によっては基板に1つ以上の位置で固定化することができる。シークエンシング用プローブの一例は、標的結合ドメインとバーコードドメインを含むことができ;標的結合ドメインは標的核酸にハイブリダイズした少なくとも8個のヌクレオチドを含んでいて、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することができ(例えば標的結合ドメインの配列が正確に6個のヌクレオチドであるときには、これら6個のヌクレオチドが、標的結合ドメインがハイブリダイズした標的分子と相補的な6個のヌクレオチドを同定する)、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することがなく(例えばこれら少なくとも2個のヌクレオチドは、標的結合ドメインがハイブリダイズした標的分子と相補的な2個のヌクレオチドを同定することがない);前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置のそれぞれは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、標的結合ドメインが結合する標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている。
この方法は、シークエンシング用プローブを標的核酸にハイブリダイズさせた後、(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定することを含んでいる。例えば第1の相補的核酸分子が2つの検出可能な標識を含んでいるときには、それら2つの検出可能な標識が、固定化された核酸分子の中の前記少なくとも2個のヌクレオチドを同定する。
前記少なくとも2つの検出可能な標識を検出した後、前記少なくとも2つの検出可能な標識を第1の相補的核酸分子から除去する。したがってこの方法はさらに、(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させることを含んでいる。したがって工程(5)の後に第1の検出可能な標識は第1の付着位置に結合しない。この方法はさらに、(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(10)場合によっては固定化された標的核酸からシークエンシング用プローブを除去することを含んでいる。
この方法はさらに、(11)第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシング用プローブを除去することを含んでいる。
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
工程(5)と(6)は順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
第1の相補的核酸は、切断可能なリンカーを含むことができる。第2の相補的核酸は、切断可能なリンカーを含むことができる。第1の相補的核酸と第2の相補的核酸は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能であることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
第1の相補的核酸と、検出可能な標識を欠く第1のハイブリダイズする核酸は、同じ核酸配列を含むことができる。例えば検出可能な標識を欠く第1のハイブリダイズする核酸は、バーコードドメインの少なくとも3つの位置のうちの第1の付着位置に結合する第1の相補的核酸分子の部分と同じ核酸配列を含むことができる。検出可能な標識を欠く第1のハイブリダイズする核酸は、バーコードドメインの中の第1の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
第2の相補的核酸と、検出可能な標識を欠く第2のハイブリダイズする核酸は、同じ核酸配列を含むことができる。検出可能な標識を欠く第2のハイブリダイズする核酸は、バーコードドメインの中の第2の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
本発明によりさらに、本明細書に開示されているシークエンシング用プローブを複数利用して核酸をシークエンシングする方法が提供される。例えば標的核酸を2つ以上のシークエンシング用プローブハイブリダイズさせると、各プローブは、標的核酸のうちで前記プローブがハイブリダイズした部分をシークエンシングすることができる。
本発明により、核酸をシークエンシングする方法として、(1)本明細書に記載したシークエンシング用プローブを複数含む第1のシークエンシング用プローブの少なくとも1つの第1の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し; (10)場合によっては固定化された標的核酸から第1のシークエンシング用プローブの少なくとも第1の集団を除去することを含む方法も提供される。
この方法はさらに、(11)本明細書に記載したシークエンシング用プローブを複数含む第2のシークエンシング用プローブの少なくとも1つの第2の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシング用プローブの少なくとも第2の集団を除去することを含むことができる。
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
工程(5)と(6)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子と第2の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能であることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
第1の相補的核酸分子と、検出可能な標識を欠く第1のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識を欠く第1のハイブリダイズする核酸分子は、バーコードドメインの中の第1の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
第2の相補的核酸分子と、検出可能な標識を欠く第2のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識を欠く第2のハイブリダイズする核酸分子は、バーコードドメインの中の第2の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
このシークエンシング法を本明細書でさらに説明する。
図14は、本開示のシークエンシング法の1つのサイクル全体の模式図を示している。本開示の方法ではシークエンシングの前に標的核酸を固定化する必要はないが、この例では、この方法は、左最上部の図にしてあるように、捕獲用プローブを用いて捕獲されてフローセルの表面に結合している標的核酸から始まる。次にシークエンシング用プローブのプールをフローセルの中に流入させてシークエンシング用プローブが標的核酸にハイブリダイズできるようにする。この例では、シークエンシング用プローブは図1に示したものである。これらシークエンシング用プローブは、標的核酸にハイブリダイズする標的結合ドメインの中に6量体配列を含んでいる。6量体はそれぞれの側に(N)塩基が隣接している。前記(N)塩基は、ユニバーサル塩基/縮重塩基であること、または塩基b1- b2- b3- b4- b5- b6によって指定されない標的に対して特異的ではない4種類の正規塩基のうちの任意のもので構成することが可能である。6量体配列を利用すると、4096(46)通りのシークエンシング用プローブのセットにより、任意の標的核酸をシークエンシングすることが可能になる。この例に関しては、4096通りのシークエンシング用プローブのセットが、512のシークエンシング用プローブからなる8つのプールそれぞれの中の標的核酸にハイブリダイズする。シークエンシング用プローブの標的結合ドメインの中の6量体配列は、図14の中央上の図に示してあるように、標的核酸の長さに沿って、前記6量体と標的核酸の間で完全に相補性が一致している位置でハイブリダイズすることになる。この例では、単一のシークエンシング用プローブが標的核酸にハイブリダイズする。結合しないあらゆるシークエンシング用プローブがフローセルから洗い流される。
これらのシークエンシング用プローブは、上に記載したように3つの付着位置R1、R2、R3を有するバーコードドメインも含んでいる。付着位置R1の中の付着領域は、シークエンシング用プローブの6量体の第1のジヌクレオチドに対応する1つ以上のヌクレオチド配列を含んでいる。したがってシークエンシング用プローブの標的結合ドメインの中に存在する第1のジヌクレオチドの属性に対応する相補的核酸を含むレポータプローブだけが付着位置R1にハイブリダイズすることになろう。同様に、シークエンシング用プローブの付着位置R2の中の付着領域は、標的結合ドメインの中に存在する第2のジヌクレオチドに対応し、シークエンシング用プローブの付着位置R3の中の付着領域は、標的結合ドメインの中に存在する第3のジヌクレオチドに対応する。
この方法は、図14の右最上部の図に続く。レポータプローブのプールをフローセルの中に流入させる。レポータプローブのプールに含まれる各レポータプローブは、2色の組み合わせの形態になった検出可能な標識と、シークエンシング用プローブの付着位置R1の中の対応する付着領域にハイブリダイズすることのできる相補的核酸を含んでいる。2色の組み合わせと特定のレポータプローブの相補的核酸は、上に説明したように、可能な16通りのジヌクレオチドのうちの1つに対応する。レポータプローブの各プールは、特定のジヌクレオチドに対応する2色の組み合わせがシークエンシング前に確立されるように設計する。例えば図14に示したシークエンシング実験では、付着位置R1にハイブリダイズするレポータプローブの第1のプールに関しては、黄-赤という2色の組み合わせをアデニン-チミンというジヌクレオチドに対応させることができる。図14の右上図に示してあるようにレポータプローブが付着位置R1にハイブリダイズした後、結合しないあらゆるレポータプローブをフローセルから洗い流し、結合したレポータプローブの検出可能な標識を記録して6量体の第1のジヌクレオチドの属性を求める。
付着位置にハイブリダイズしたレポータプローブに属する検出可能な標識を除去する。検出可能な標識を除去するため、レポータプローブは切断可能なリンカーを含むことができて、それに適切な切断試薬の添加を加えることができる。あるいは検出可能な標識を欠く相補的核酸をシークエンシング用プローブの付着位置R1にハイブリダイズさせることで、検出可能な標識を有するレポータプローブと置き換える。検出可能な標識を除去する方法が何であれ、付着位置R1はもはや検出可能な信号を発生しない。以前に検出可能な信号を発生していたバーコードドメインの付着位置をもはや検出可能な信号を発生しないようにする方法を本明細書では「暗化」と呼ぶ。
レポータプローブの第2のプールをフローセルの中に流入させる。レポータプローブのプールに含まれる各レポータプローブは、2色の組み合わせの形態になった検出可能な標識と、シークエンシング用プローブの付着位置R2の中の対応する付着領域にハイブリダイズすることのできる相補的核酸を含んでいる。2色の組み合わせと特定のレポータプローブの相補的核酸は、可能な16通りのジヌクレオチドのうちの1つに対応する。特定の2色の組み合わせが、レポータプローブの第1のプールの文脈では1つのジヌクレオチドに対応し、レポータプローブの第2のプールの文脈では別のジヌクレオチドに対応することが可能である。図14の右下図に示してあるようにレポータプローブが付着位置R2にハイブリダイズした後、結合しないあらゆるレポータプローブをフローセルから洗い流し、結合したレポータプローブの検出可能な標識を記録して6量体の第2のジヌクレオチドの属性を求める。
位置R2の検出可能な標識を除去するため、レポータプローブは切断可能なリンカーを含むことができて、それに適切な切断試薬の添加を加えることができる。あるいは検出可能な標識を欠く相補的核酸をシークエンシング用プローブの付着位置R2にハイブリダイズさせることで、検出可能な標識を有するレポータプローブと置き換える。検出可能な標識を除去する方法が何であれ、付着位置R2はもはや検出可能な信号を発生しない。
次にレポータプローブの第3のプールをフローセルの中に流入させる。第3のレポータプローブプールに含まれる各レポータプローブは、2色の組み合わせの形態になった検出可能な標識と、シークエンシング用プローブの付着位置R3の中の対応する付着領域にハイブリダイズすることのできる相補的核酸を含んでいる。2色の組み合わせと特定のレポータプローブの相補的核酸は、可能な16通りのジヌクレオチドのうちの1つに対応する。図14の中央下図に示してあるようにレポータプローブが位置R3にハイブリダイズした後、結合しないあらゆるレポータプローブをフローセルから洗い流し、結合したレポータプローブの検出可能な標識を記録して6量体の第3のジヌクレオチドの属性を求める。このようにして、標的結合ドメインの3つのジヌクレオチドがすべて同定されるため、それらをまとめて再構築して標的結合ドメインの配列を明らかにすること、したがって標的核酸の配列を明らかにすることができる。
標的核酸のシークエンシングを続けるには、結合したあらゆるシークエンシング用プローブを標的核酸から除去することができる。レポータプローブがバーコードドメインの位置R3にハイブリダイズしたままである場合でさえ、シークエンシング用プローブを標的核酸から除去することができる。あるいは位置R3にハイブリダイズしたレポータプローブは、シークエンシング用プローブを標的結合ドメインから除去する前に、例えば位置R1とR2のレポータに関して上に説明した暗化手続きを利用してバーコードドメインから除去することができる。
図14に示したシークエンシングサイクルは何回でも繰り返すことができ、各シークエンシングサイクルを、シークエンシング用プローブの同じプールを標的核酸分子にハイブリダイズさせることから始めたり、シークエンシング用プローブの異なるプールを標的核酸分子にハイブリダイズさせることから始めたりする。第1のシークエンシング用プローブ、または第1のシークエンシング用プローブのプールが第1のシークエンシングサイクルの間に標的核酸に結合した位置と重複する位置でシークエンシング用プローブの第2のプールが標的核酸に結合することが可能である。そうすることで、標的核酸の中のいくつかのヌクレオチドを2回以上シークエンシングすることと、2つ以上のシークエンシング用プローブを用いることができる。
図15は、本開示のシークエンシング法の1つのサイクル全体の模式図と、このサイクルの間に回収された対応するイメージングデータを示している。この例では、使用するシークエンシング用プローブは図1に示したものであり、シークエンシング工程は、図14に示して上に説明したのと同じである。シークエンシング用プローブのシークエンシングドメインを標的核酸にハイブリダイズさせた後、レポータプローブをシークエンシング用プローブの第1の付着位置(R1)にハイブリダイズさせる。次に第1のレポータプローブの画像を取得して色ドットを記録する。図15では、色ドットを点線の円で示してある。色ドットは、1つのサイクル全体の間に記録される単一のシークエンシング用プローブに対応する。この例では、7つのシークエンシング用プローブを記録する(1~7)。次にバーコードドメインの第1の付着位置を暗化し、二重蛍光レポータプローブをシークエンシング用プローブの第2の付着位置(R2)にハイブリダイズさせる。次に第2のレポータプローブの画像を取得して色ドットを記録する。次にバーコードドメインの第2の付着位置を暗化し、二重蛍光レポータプローブをシークエンシング用プローブの第3の付着位置(R3)にハイブリダイズさせる。次に第3のレポータプローブの画像を取得して色ドットを記録する。次に各シークエンシング用プローブ1~7からの3つの色ドットを順番に並べる。次にデコーディングマトリックスを用いてそれぞれの色ドットを特定のジヌクレオチドにマッピングしてシークエンシング用プローブ1~7の標的結合ドメインの配列を明らかにする。
1つのシークエンシングサイクルの間に標的核酸に結合した任意のシークエンシング用プローブの標的結合ドメインの配列を求めるのに必要なレポータプローブのプールの数は、バーコードドメインの中の付着位置の数と同じである。したがって3つの位置を有するバーコードドメインでは、シークエンシング用プローブで3つのレポータプローブをサイクルさせることになろう。
シークエンシング用プローブの1つのプールは、配列がすべて同じ複数のシークエンシング用プローブを含むこと、または配列がすべて同じではない複数のシークエンシング用プローブを含むことができる。シークエンシング用プローブの1つのプールが、配列がすべて同じではない複数のシークエンシング用プローブを含んでいるとき、異なるそれぞれのシークエンシング用プローブが同数存在すること、または異なるシークエンシング用プローブが異なる数で存在することができる。
図16は、本開示によるシークエンシング用プローブのプールの一構成例を示しており、ここではシークエンシング用プローブが、(a)6個のヌクレオチド(6量体)を含んでいて標的核酸に特異的に結合する標的結合ドメインと、(b)バーコードドメインの中の3つの付着位置(R1、R2、R3)を含有しているため、上に示した8通りの色組み合わせを用いてシークエンシング用プローブの8つの異なるプールを設計する。可能な4096通りの異なる6量体配列(4×4×4×4×4×4=4096)が存在する。バーコードドメインの中の3つの付着位置のそれぞれは、異なる8通りの色組み合わせのうちの1つが結合した相補的核酸にハイブリダイズすることができるため、可能な3つの色組み合わせからなる異なる512のセットが存在する(8×8×8=512)。例えばR1が色組み合わせGGに結合した相補的核酸にハイブリダイズし、R2が色組み合わせBGに結合した相補的核酸にハイブリダイズし、R3が色組み合わせYRに結合した相補的核酸にハイブリダイズするプローブでは、3つの色組み合わせのセットはGG-BG-YRである。シークエンシング用プローブの1つのプールの中では、3つの色組み合わせがそれぞれ異なるセットが、標的結合ドメインの中の異なる6量体に対応することになろう。各プールは512個の異なる6量体を含有しているため合計で4096通りの可能な6量体が存在するゆえ、可能なすべての6量体をシークエンシングするには8つのプールが必要とされる(4096/512=8)。8つのプールそれぞれの中に入る具体的なシークエンシング用プローブは、各シークエンシング用プローブが標的核酸に最適にハイブリダイズするように決められる。最適なハイブリダイゼーションを保証するにはいくつかの注意事項がある。前記注意事項に含まれるのは、(a)6量体の完全な相補体を異なるプールに分けること;(b)高いTmと低いTmを持つ6量体を異なるプールに分けること;(c)経験的に学習したハイブリダイゼーションパターンに基づいて6量体を異なるプールに分けることである。
図17は、アメリカ合衆国特許出願公開第2016/0194701号に記載されているシークエンシング用プローブと本開示のシークエンシング用プローブの違いを示している。図17の左図に示してあるように、アメリカ合衆国特許出願公開第2016/0194701号には、相補的核酸にハイブリダイズする6つの付着位置を含むバーコードドメインを有するシークエンシング用プローブが記載されている。それぞれの相補的核酸は異なる4種類の蛍光染料のうちの1つに結合する。この構成では、それぞれの色(赤、青、緑、黄)が、標的結合ドメインの中の1つのヌクレオチド(A、T、C、G)に対応する。プローブをこのように設計することにより、4096通りの異なるプローブ(46)が生まれる。図17の右図に示してあるように、本開示の一例では、各シークエンシング用プローブのバーコードドメインは、相補的核酸にハイブリダイズする3つの付着位置を含んでいる。アメリカ合衆国特許出願公開第2016/0194701号とは異なり、これら相補的核酸には、8通りの色組み合わせ(GG、RR、GY、RY、YY、RG、BB、RB)のうちの1つが結合する。それぞれの色組み合わせは、標的結合ドメインの中にある特定の1つのジヌクレオチドに対応する。この構成では、512通り(83)の異なるプローブが生まれる。標的核酸ドメインの中の可能なあらゆる6量体の組み合わせ(4096)をカバーしようとすると、1つの標的核酸全体をシークエンシングするのにこれら512の異なるプローブからなる8つの別々のプールが必要とされる。相補的核酸を標識するのに8通りの色組み合わせを用いているが可能なジヌクレオチドは16通り存在するため、シークエンシング用プローブのどのプールを用いるかに応じていくつかの色組み合わせが異なるジヌクレオチドに対応することになろう。例えば図17では、シークエンシング用プローブの第1、第2、第3、第4のプールにおいて色組み合わせBBがジヌクレオチドAAに対応し、色組み合わせGGがジヌクレオチドATに対応する。シークエンシング用プローブの第5、第6、第7、第8のプールにおいては色組み合わせBBがジヌクレオチドCAに対応し、色組み合わせCTがジヌクレオチドATに対応する。
複数のシークエンシング用プローブ(すなわち2つ以上のシークエンシング用プローブ)をシークエンシングウインドウの中でハイブリダイズさせることができる。シークエンシング中、ハイブリダイズした複数のシークエンシング用プローブの中の各シークエンシング用プローブに結合した検出可能な標識の属性と空間的位置を記録する。こうすることで、複数のジヌクレオチドの位置と属性の両方を前記後同定することが可能になる。言い換えると、複数のシークエンシング用プローブを同時に単一の標的核酸分子にハイブリダイズさせることにより、標的核酸に沿った複数の位置を同時にシークエンシングすることができるため、シークエンシングの速度が向上する。
図18は、捕獲された標的核酸分子にハイブリダイズした単一のシークエンシング用プローブと複数のシークエンシング用プローブの模式図を示している。ハイブリダイズした5'捕獲用プローブと3'捕獲用プローブの2つの間のシークエンシングウインドウにより、単一のシークエンシング用プローブ(左図)または複数のシークエンシング用プローブ(右図)を標的核酸分子の長さに沿ってハイブリダイズさせることができる。複数のシークエンシング用プローブを標的核酸分子の長さに沿ってハイブリダイズさせることにより、標的核酸分子上の2つ以上の位置を同時にシークエンシングすることができるため、シークエンシングの速度が向上する。図19は、捕獲された標的核酸に単一のシークエンシング用プローブ(左図)または複数のシークエンシング用プローブ(右図)をハイブリダイズさせたとき、本開示のシークエンシング法の間に記録された蛍光画像を示している。図19の右図は、標的核酸の長さに沿って結合した複数のシークエンシング用プローブの個々のプローブからの蛍光信号を空間的に分離できることを示している。
図20は、長さが15キロ塩基である標的核酸の長さに沿って結合した本開示による複数のシークエンシング用プローブと、対応する記録された蛍光画像の模式図を示している。図20の右図に示してあるように、シークエンシング用プローブは標的核酸の長さに沿って均等な間隔で結合することができる。図20の左図に示してあるように、シークエンシング用プローブは標的核酸の長さに沿って均等な間隔で結合する必要はない。図20に示した蛍光画像は、標的核酸の長さに沿って結合した複数のシークエンシング用プローブからの信号を空間的に分離して標的核酸の複数の位置でシークエンシング情報を同時に得ることが可能であることを示している。
標的核酸の長さに沿ったプローブの分布が、検出可能な信号の解像度にとって極めて重要である。1つの領域内のプローブが多すぎると検出可能な標識の重複が起こる可能性があるため、2つの近接したプローブの分離が妨げられる。これは以下のように説明される。1つのヌクレオチドは長さが0.34 nmであり、シークエンシング装置の横方向(x-y)の空間解像度は約200 nmであるため、シークエンシング装置の解像度の限界は約588塩基対(すなわち1個のヌクレオチド/0. 34 nm×200 nm)である。すなわち2つのプローブが互いに約588塩基対以内であるときには、上記のシークエンシング装置だと標的核酸にハイブリダイズした2つのプローブから信号を分離することができないと考えられる。したがって検出可能な標識を別々の「スポット」として分離できるようにするには、シークエンシング装置の解像度に応じて2つのプローブを約600塩基対離す必要があろう。前記ため最適な間隔では、標的核酸600 bpごとに1つのプローブが存在すべきである。プローブの集団の中の各シークエンシング用プローブは互いに600ヌクレオチドよりも近距離で結合しないことが好ましい。(例えば蛍光強度の値と波長に依存した比を利用する)さまざまなソフトウエアのアプローチを利用して標的核酸の1つの分離可能な領域の中にハイブリダイズするプローブの数をモニタし、制限し、潜在的に解析することが可能であり、それに応じてプローブの集団を設計することができる。さらに、より多くの明確に異なる信号を提供する検出可能な標識(例えば蛍光標識)を選択することができる。さらに、文献に記載されている方法(SmallとParthasarthy:「Superresolution localization methods」Annu. Rev. Phys Chem.、2014年;第65巻:107~125ページ)には、構造化されたと照明と、シークエンシング用顕微鏡の解像限界を数10ナノメートルまで低下させるさまざまな超解像アプローチが記載されている。より解像度の大きいシークエンシング装置を用いると、より短い標的結合ドメインを有するプローブを用いることが可能になる。
上述のように、プローブのTmの設計が、標的核酸にハイブリダイズするプローブの数に影響を与える可能性がある。前記代わりに、またはそれに加えて、1つの集団の中のシークエンシング用プローブの濃度を上昇させて標的核酸の特定の領域の中のプローブのカバレッジを増やすことができる。シークエンシング用プローブの濃度を低下させて標的核酸の特定の領域の中のプローブのカバレッジを減らし、例えばシークエンシング装置の解像限界よりも上にすることができる。
2つの検出可能な標識の解像限界は約600ヌクレオチドだが、こうすることで本開示の強力なシークエンシング法が妨げられることはない。いくつかの側面では、任意の集団の中の複数のシークエンシング用プローブが標的核酸上で600ヌクレオチド離れることはなかろう。しかし統計的には(ポアソン分布に従うと)、1つのシークエンシング用プローブが結合しているだけの標的核酸が存在するであろうゆえ、前記シークエンシング用プローブは光学的に分離可能なものである。600ヌクレオチド以内に複数のプローブを有する(ため、光学的に分離可能でない)標的核酸については、これら分離不能なシークエンシング用プローブに関するデータを廃棄することができる。重要なことだが、本開示の方法により、複数のシークエンシング用プローブの結合と検出の操作が複数回なされる。したがって何回かの操作ではあらゆるシークエンシング用プローブから信号を検出し、何回かの操作ではシークエンシング用プローブの一部だけから信号を検出し、何回かの操作ではどのシークエンシング用プローブからも信号を検出しないことが可能である。いくつかの側面では、標的核酸に結合したシークエンシング用プローブの分布を(例えば濃度または希釈度を制御することによって)管理し、1個の標的核酸に1つのシークエンシング用プローブだけが結合するようにできる。
ランダムにだが、部分的には標的結合ドメインの長さと、プローブのTmと、適用するプローブの濃度に応じ、1つの集団の中の2つの明確に異なるシークエンシング用プローブが互いに600ヌクレオチド以内で結合することが可能である。
前記代わりに、またはそれに加えて、1つの集団の中のシークエンシング用プローブの濃度を低下させて標的核酸の特定の領域の中のプローブのカバレッジを減らし、例えばシークエンシング装置の解像限界よりも上にし、前記ことによって解像度が制限されたスポットから単一の読み出しを発生させることができる。
本開示の方法を用いて標的核酸をシークエンシングする前に標的核酸の配列、または配列の一部がわかっている場合には、シークエンシング用プローブを、どの2つのシークエンシング用プローブも互いに600ヌクレオチド以内で結合することがないように設計して選択することができる。
シークエンシング用プローブを標的核酸にハイブリダイズさせる前に、1つ以上の相補的核酸分子に第1の検出可能な標識を結合させ、少なくとも第2の検出可能な標識をシークエンシング用プローブのバーコードドメインの中の1つ以上の付着位置にハイブリダイズさせることができる。例えば標的核酸にハイブリダイズさせる前に、第1の検出可能な標識と少なくとも第2の検出可能な標識が結合した1個以上の相補的核酸分子を各シークエンシング用プローブの第1の付着位置にハイブリダイズさせることができる。したがってシークエンシング用プローブは、標的核酸に接触させると第1の付着位置から検出可能な信号を発生させることができるため、バーコードドメイン上の第1の位置に向かう相補的核酸またはレポータプローブの第1のプールを用意する必要はない。別の一例では、第1の検出可能な標識と少なくとも第2の検出可能な標識が結合した1つ以上の相補的核酸分子をシークエンシング用プローブのバーコードドメインの中のすべての付着位置にハイブリダイズさせることができる。したがってこの例では、相補的核酸を順番に交換する必要なく、6個のヌクレオチドからなる配列を読み出すことができる。このあらかじめハイブリダイズしたシークエンシング用プローブ-レポータプローブ複合体を用いると説明した方法の多くの工程が省略されるため、配列情報を取得する時間が短縮されると考えられる。しかしこのプローブは、重複していない検出可能な標識から利益を得ると考えられる。例えば蛍光体は、重複していない波長の光によって励起されたり、重複していない波長の光を出したりする。
シークエンシングの間、記録された色ドットからの信号強度を用いて標的核酸をより正確にシークエンシングすることができる。図21は、本開示の1つのシークエンシングサイクルの間に記録されるイメージングデータを示している。図21の右図は、レポータプローブがシークエンシング用プローブの第1の付着位置にハイブリダイズした後に記録された蛍光顕微鏡の画像を示している。個々の色ドットを目立つようにし、記録された特定の色組み合わせを強調してある。これは、二重蛍光信号を明確に検出できてしかも識別可能であることを示している。基準マーカーからの明るい信号を矢印で示してある。図21の左図は、1つの色ドット内の個々の色のスポット強度を用いると、特定の1つの色ドットが1つの色の重複になっている色組み合わせ(すなわちBB、GG、YY、RRのいずれか)に対応する確率を求めることができることを示している。
バーコードドメイン内の1つの位置の暗化は、前記位置にハイブリダイズしたレポータプローブの中に存在する切断可能なリンカー修飾の位置での鎖の切断によって実現することができる。図22は、切断可能なリンカー修飾を利用してシークエンシングサイクルの間にバーコード位置を暗化することを示している。図22の最も左側の図に示した第1の工程は、レポータプローブの一次核酸をシークエンシング用プローブの第1の付着位置にハイブリダイズさせることを含んでいる。一次核酸は、バーコードドメインの第1の位置の付着領域の中の特定の相補的配列にハイブリダイゼーションする。一次核酸の第1のドメインと第2のドメインは切断可能なリンカー修飾によって共有結合している。第2の工程では、検出可能な標識を前記後記録してシークエンシング用プローブの標的結合ドメインの中の特定のジヌクレオチドの属性と位置を求める。第3の工程では、切断可能なリンカー修飾の位置でレポータプローブを切断することにより、バーコードドメインの第1の位置を暗化する。こうすることで一次核酸の第2のドメインが放出され、前記ことによって検出可能な標識が放出される。一次核酸分子の第1のドメインは、今や検出可能な標識がまったく欠けた状態でバーコードドメインの第1の付着位置にハイブリダイズしたままになっているため、バーコードドメインの第1の位置はもはや検出可能な信号を発生させず、前記後のシークエンシング工程において他のどのレポータプローブにもハイブリダイズすることはできないであろう。図22の最も右側の図に示した最終工程では、レポータプローブがバーコードドメインの第2の位置にハイブリダイズし、シークエンシングが続いていく。
バーコードドメインの付着位置は、検出可能な標識が結合しているレポータプローブの中の任意の二次核酸または三次核酸を置換する一方で、レポータプローブの一次核酸はシークエンシング用プローブにハイブリダイズしたままにすることによって暗化できる。この置換は、検出可能な標識が結合していない二次核酸または三次核酸を一次核酸にハイブリダイズさせることによって実現できる。図23は本開示のシークエンシングサイクルの一例の例示であり、バーコードドメインの中の1つの位置が、標識を有する二次核酸の置換によって暗化されている。図23の最も左側の図はシークエンシングサイクルの開始を示しており、レポータプローブの一次核酸分子がシークエンシング用プローブのバーコードドメインの第1の付着位置にハイブリダイズしている。次に、検出可能な標識に結合している二次核酸分子が一次核酸分子にハイブリダイズし、検出可能な標識が記録される。バーコードドメインの第1の位置を暗化するため、検出可能な標識に結合している二次核酸分子を、検出可能な標識を欠く二次核酸分子で置換する。シークエンシングサイクルの次の工程では、検出可能な標識を含むレポータプローブをバーコードドメインの第2の位置にハイブリダイズさせる。バーコードドメインの付着位置の暗化は、検出可能な標識が結合していない核酸をシークエンシング用プローブにバーコードドメインの対応する付着位置でハイブリダイズさせてレポータプローブの任意の一次核酸分子を置換することにより可能である。バーコードドメインが少なくとも1つの付着位置に隣接した少なくとも1つの一本鎖核酸配列を含んでいる場合には、検出可能な標識が結合していない核酸が一次核酸分子と置き換わることが、前記フランキング配列と、バーコードドメインのうちで前記一次核酸分子によって占められている部分とにハイブリダイズすることによって可能になる。必要な場合には、検出可能な標識の交換速度を大きくする小さな一本鎖オリゴヌクレオチドを組み込むことによって検出可能な標識の交換速度を大きくすることができる(例えば「トーホールド」プローブ;例えばSeeling他、「Catalyzed Relaxation of a Metastable DNA Fuel」;J. Am. Chem. Soc. 2006年、第128巻(37)、12211~12220ページを参照されたい)。
検出可能な標識を含む相補的核酸すなわちレポータプローブは、付着領域から除去することができるが、検出可能な標識を欠くハイブリダイズする核酸で置き換えることはできない。これは、例えばカオトロピック剤を添加することによって、および/または温度を上昇させることによって、および/または塩の濃度を変えることによって、および/またはpHを調整することによって、および/または流体力を加えることによって起こる可能性がある。これらの例では、より少数の試薬(すなわち検出可能な標識を欠くハイブリダイズする核酸)が必要とされる。
本開示の方法を利用して同じサンプルからRNA分子とDNA分子(mRNAとgDNAが含まれる)を同時に捕獲してシークエンシングすることができる。同じサンプルからRNA分子とDNA分子の両方を捕獲してシークエンシングすることを同じフローセルの中で実行できる。図24の左図は、本開示の方法を利用してFFPEサンプルからmRNAとgDNAの両方を同時に捕獲し、検出し、シークエンシングすることがどのようにして可能になるのかを示す模式図である。
本開示のシークエンシング法はさらに、固定化された標的核酸の各領域についてそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定する工程を含んでいる。再構築する工程では、実行可能なプログラムが記憶されている非一時的コンピュータ可読記憶媒体を利用する。前記プログラムが、標的核酸の各領域についてそれぞれ同定されたヌクレオチドの線形な順番を整える指示をマイクロプロセッサに出すことにより、核酸の配列が得られる。再構築する作業は、「リアルタイム」で、すなわちすべてのデータが回収された後や完全なデータ取得後にではなく、データがシークエンシング用プローブから回収されている間に実行することができる。
本開示によるシークエンシング法の生の特異度はほぼ94%である。本開示のシークエンシング法の精度は、2つ以上のシークエンシング用プローブを用いて標的核酸の中の同じ塩基をシークエンシングすることによってほぼ99%まで上昇させることができる。図25は、本開示のシークエンシング法によりどのようにして異なるシークエンシング用プローブを用いて標的核酸の同じ塩基のシークエンシングが可能になるかを示している。この例における標的核酸は、NRASエキソン2(配列番号1)の断片である。興味ある特定の塩基は、標的核酸の中で強調されているシトシン(C)である。興味あるこの塩基は、標的核酸に対するハイブリダイゼーションのフットプリントが異なる2つのシークエンシング用プローブにハイブリダイズすることになろう。この例では、シークエンシング用プローブ1~4(バーコード1~4)は、興味ある塩基の左側の3個のヌクレオチドに結合するのに対し、シークエンシング用プローブ5~8(バーコード5~8)は、興味ある塩基の左側の5個のヌクレオチドに結合する。すると興味ある塩基が異なる2つのプローブによってシークエンシングされるため、前記特定の位置での塩基読み取りの量が増加し、前記ことによって前記特定の位置における全体的な精度が上昇する。図26は、標的ヌクレオチド上の特定のヌクレオチド位置における複数の異なる塩基読み取りが1つ以上のシークエンシング用プローブから記録され、どのように組み合わされてコンセンサス配列(配列番号2)を作り出し、前記ことによって最終的な塩基読み取りの精度を向上させているかを示している。
「Hyb & Seq化学」、「Hyb & Seqシークエンシング」、「Hyb & Seq」は、上に説明した本開示の方法を意味する。
上記の任意の側面を本明細書に開示した他の任意の側面と組み合わせることができる。
定義
本明細書では、「アニーリング」と「ハイブリダイゼーション」という用語は交換可能に用いられ、安定な二本鎖の形成を意味する。1つの側面では、安定な二本鎖とは、二本鎖構造が、温度が二本鎖のうちの1本の鎖のTmよりも約5℃下または約5℃上、かつ1価の塩の濃度が低い(例えば0.2 M未満、または0.1 M未満、または当業者に知られている塩濃度)という条件でのストリンジェントな洗浄によって破壊されないことを意味する。「完全に一致した」という表現は、二本鎖に関して用いるときには、前記二本鎖を構成するポリヌクレオチド鎖および/またはオリゴヌクレオチド鎖が互いに二本鎖構造を形成し、それぞれの鎖に含まれるすべてのヌクレオチドが、他方の鎖に含まれるヌクレオチドとワトソン-クリック塩基対合を形成することを意味する。「二本鎖」という用語には、使用可能なヌクレオシド類似体(デオキシイノシンなど)、2-アミノプリン塩基を有するヌクレオシド、PNAなどのペアが含まれるが、これらに限定されない。2個のオリゴヌクレオチドの間の二本鎖の中にある「ミスマッチ」は、前記二本鎖の中のヌクレオチドのペアがワトソン-クリック結合を形成できないことを意味する。
本明細書では、「ハイブリダイゼーション条件」という用語は、典型的には、約1 M未満、より一般には約500 mM未満、さらに一般には約200 mM未満の塩の濃度を含むことになろう。ハイブリダイゼーションの温度として5℃という低温が可能だが、典型的には22℃超、より典型的には約30℃超であり、約37℃を超えることがしばしばある。ハイブリダイゼーションは、通常はストリンジェントな条件(例えばプローブが標的の対応する部分配列に特異的にハイブリダイズするであろう条件)下で実施される。ストリンジェントな条件は配列に依存しており、状況が異なれば異なる。より長い断片は、特異的なハイブリダイゼーションのためにはより高いハイブリダイゼーション温度を必要とする可能性がある。他の因子(相補的な鎖の塩基組成と長さ、有機溶媒の存在、塩基ミスマッチの程度が含まれる)がハイブリダイゼーションのストリンジェンシーに影響を与える可能性があるため、パラメータの組み合わせのほうが、どれか1つだけのパラメータの絶対的な指標よりも重要である。
一般に、ストリンジェントな条件は、規定されたイオン強度とpHにおける特定の配列のTmよりも約5℃低くなるように選択される。ストリンジェントな条件の例に含まれるのは、pH 7.0~8.3かつ少なくとも25℃の温度において少なくとも0.01 M~1 M以下のNaイオン濃度(または他の塩)である。例えば5×SSPE(750 mM NaCl、50 mMリン酸ナトリウム、5 mM EDTA、pH 7.4)かつ温度25~30℃という条件が、アレル特異的プローブのハイブリダイゼーションに適している。ストリンジェントな条件に関しては、例えばSambrook、Fritsche、Maniatis、『Molecular Cloning A Laboratory Manual』、第2版、Cold Spring Harbor Press(1989年)と、Anderson、『Nucleic Acid Hybridization』、初版、BIOS Scientific Publishers Limited社(1999年)を参照されたい。本明細書では、「~に特異的にハイブリダイズする」または「特異的に~にハイブリダイズする」や同様の表現は、ストリンジェントな条件下である分子が実質的に特定の1つまたは複数のヌクレオチド配列に結合すること、または二本鎖化すること、またはハイブリダイズすることを意味する。
プローブの特定の位置に付随する検出可能な標識は、1回または複数回「読み出すこと」(例えば前記蛍光の検出)が可能である。「読み出し」は、「塩基読み取り」という用語の同義語として使用できる。複数回の読み出しによって精度が向上する。標的核酸配列は、元の単一の標的分子に由来する配列情報の連続ストレッチが検出されるときに「読み出される」。典型的には、これは、(下に定義する)マルチパスコンセンサスを通じて生成する。本明細書では、「カバレッジ」または「カバーの深度」という用語は、(別々の読み出しを通じて)標的の1つの領域をシークエンシングして参照配列とアラインメントする回数を意味する。読み出しカバレッジは、特定の参照標的配列にマッピングする読み出しの合計数である。塩基カバレッジは、特定のゲノム位置における塩基読み取りの合計数である。
1つの「読み出し」は、配列出力の1つの単位である。元の単一の標的分子に由来する配列情報の連続ストレッチ。各読み出しは、前記読み出しの中の塩基読み取りの信頼レベルと関係した品質指標を有する。シークエンサ出力の単位。元の単一の標的分子に由来する配列情報の連続ストレッチ。Hyb & Seqでは、すべての読み出しがマルチパスコンセンサスを通じて生成する。
「読み出し長」は、各読み出しからの配列の長さを記述する指標である(単位はbp)。
本明細書では、「Hyb & Seqサイクル」は、特定の1つのプローブ、またはプローブの集団の表面にある各付着領域を検出するのに必要な全工程を意味する。例えば標的核酸の表面にある6つの位置を検出することのできるプローブでは、1つの「Hyb & Seqサイクル」は、少なくとも、プローブを標的核酸にハイブリダイズさせ、相補的核酸/レポータプローブをプローブのバーコードドメインの表面にある6つの位置それぞれの付着領域にハイブリダイズさせ、それら6つの位置それぞれに付随する検出可能な標識を検出することを含むことになろう。
「k量体プローブ」という用語は、本開示によるシークエンシング用プローブの同義語である。k量体読み出しは、Hyb & Seqのデータの基本単位である。1つのk量体読み出しは、1つのHyb & Seqサイクルごとに1つの標的分子から得られる。多数回のHyb & Seqサイクルを実施して単一の標的分子から十分な数の別々のk量体読み出しを生成させると、別々のk量体があいまいさなくアラインメントされて配列の連続的なストレッチを得ることが可能になる。
別々の読み出しからの2つ以上の配列をアラインメントするとき、重複している部分を組み合わせて単一のコンセンサス配列を作り出すことができる。重複している部分が同じ塩基を有する位置(アラインメントの1つの列)では、それらの塩基がコンセンサスになる。さまざまな規則を利用することで、重複している配列の間に不一致が存在する位置に関するコンセンサスを生成させることができる。単純過半数という規則では、コンセンサスとして、列の中に最もよく出現する塩基を用いる。「マルチパスコンセンサス」は、単一の標的分子からの別々のプローブ読み出しすべてのアラインメントである。プローブの集団/調査の全サイクル数に応じ、単一の標的分子の中の各塩基位置への問い合わせを異なるレベルの冗長性または重複度で実施することができる。一般に、冗長性は塩基読み取りの信頼レベルを向上させる。
「コンセンサス」は、別々の読み出しからの2つ以上のDNA配列をアラインメントする場合であり、重複している部分を組み合わせて単一のコンセンサス配列を生成させることができる。重複している部分が同じ塩基を有する位置(アラインメントの1つの列)では、それらの塩基がコンセンサスになる。さまざまな規則を利用することで、重複している配列の間に不一致が存在する位置に関するコンセンサスを生成させることができる。単純過半数という規則では、コンセンサスとして、列の中に最もよく出現する塩基を用いる。
「生の精度」は、システムが正しく塩基を同定する固有の能力の1つの指標である。生の精度はシークエンシング技術に依存する。「コンセンサスの精度」は、追加の読み出しと統計学の力を用いてシステムが正しく塩基を同定する能力の1つの指標である。「特異度」は、1回の試行ごとの全読み出しのうちで意図する標的にマッピングされる読み出しの割合を意味する。「一様性」は、標的領域相互間の配列カバレッジの変動性を意味する。大きな一様性は小さな変動性と相関している。この特徴は、標的とするすべての領域のうちで、20%以上の平均カバー深度でカバーされている標的とする領域の割合として一般に報告されている。ランダムなエラー(すなわちシークエンシング化学に固有のエラー)は、同じ標的核酸を「マルチパス」シークエンシングすることによって容易に補正できる。パスの数が十分だと、実質的に「完全なコンセンサス」または「エラーなし」のシークエンシングを実現することができる。
本明細書に記載した方法を実現すること、および/または結果を記録することは、前記方法を実現すること、および/または前記結果を記録することのできる任意の装置を用いて可能である。使用できる装置の非限定的な例に含まれるのは、あらゆるタイプのコンピュータを含む電子計算装置である。本明細書に記載した方法をコンピュータの中に実現および/または記録するとき、前記コンピュータに前記方法の工程を実行させるのに使用できるコンピュータプログラムは、前記コンピュータプログラムを収容できる任意のコンピュータ可読媒体の中に収容することができる。使用可能なコンピュータ可読媒体の非限定的な例に含まれるのは、ディスケット、CD-ROM、DVD、ROM、RAM、非一時的コンピュータ可読媒体、それ以外のメモリ、それ以外のコンピュータ記憶装置である。コンピュータに前記方法の工程を実行させる、および/または配列情報を再構築させる、および/または結果を記録させるのに使用できるコンピュータプログラムは、電子的ネットワーク(例えばインターネット、イントラネット、それ以外のネットワーク)に提供することもできる。
「使い捨てシークエンシングカード」を本分野で知られている蛍光イメージング装置に組み込むことができる。異なる多くの特徴を備えた任意の蛍光顕微鏡が、このシークエンシング読み出しを実施することができる。例えば広視野ランプ、レーザー、LED、マルチフォトン、共焦点照明、全反射照明のいずれかを励起および/または検出に用いることができる。蛍光顕微鏡の発光検出チャネルには、フィルタまたは格子に基づくスペクトル分解(スペクトル分解された1つ以上の発光波長)ができるカメラ(1台または複数台)および/または光増倍管(1個または複数個)を取り付けることが可能である。標準的なコンピュータを使用して、使い捨てシークエンシングカードと、前記カードを通過する試薬と、蛍光顕微鏡による検出のすべてを制御することができる。
シークエンシングのデータは、任意の数の標準的な次世代シークエンシングアセンブラによって分析することができる(例えばWajidとSerpedin、「Review of general algorithmic features for genome assemblers for next generation sequencers」Genomics, proteomics & bioinformatics、第10巻(2)、58~73ページ、2012年を参照されたい)。顕微鏡の1つの回折制限領域の中で得られたシークエンシングデータを「局所的に再構築する」ことにより、1つの回折スポットの中の複数の読み出しからコンセンサス配列を生成させる。次に、多数の回折スポットから再構築した読み出しをまとめてマッピングすることで、標的とする遺伝子セット全体、またはゲノム全体の新規なアセンブリを表わす連続配列を生成させる。
本開示に関係する追加の教示は、アメリカ合衆国特許第8,148,512号、第7,473,767号、第7,919,237号、第 7,941,279号、第8,415,102号、第 8,492,094号、第8,519,115号、アメリカ合衆国特許出願公開第2009/0220978号、第 2009/0299640号、第2010/0015607号、第2010/0261026号、第2011/0086774号、第 2011/0145176号、第2011/0201515号、第2011/0229888号、第2013/0004482号、第2013/0017971号、第2013/0178372号、第2013/0230851号、第2013/0337444号、第2013/0345161号、第2014/0005067号、第2014/0017688号、第2014/0037620号、第 2014/0087959号、第2014/0154681号、第2014/0162251号、第2016/0194701号のうちの1つ以上の中に記載されている。なおこれら文献のそれぞれは、前記全体が参照によって本明細書に組み込まれている。
実施例1:Hyb & Seq化学を利用した単分子長の読み出し
本開示のシークエンシング用プローブと、前記シークエンシング用プローブを用いたシークエンシング法を便宜上Hyb & Seqと呼ぶ。開示したシークエンシング用プローブとシークエンシング法を記述するのに明細書全体を通じてこの用語を使用する。Hyb & Seqは、ライブラリなし、増幅なしの単分子シークエンシング技術であり、天然標的の表面にある蛍光分子バーコードの核酸ハイブリダイゼーションサイクルを利用している。
Hyb & Seqを用いた長い読み出しを長さ33キロ塩基(kb)の単分子DNA標的について示す。重要な工程は以下の通りである:(1)長いDNA分子がシークエンシング用フローセルの表面に捕獲され、流体力によって伸長される;および/または(2)複数の完全に一致したシークエンシング用プローブが長い単分子標的に沿ってハイブリダイズする;および/または(3)蛍光レポータがシークエンシング用プローブの中のバーコード領域にハイブリダイズし、結合したすべての配列が同定される;および/または(4)空間的に分離された蛍光データを利用して単分子標的の中の配列の相対的位置が求められる。
Hyb & Seqを利用した長い読み出しの重要な利点の非限定的な例に含まれるのは、分子の長さによって決まる読み出し長が化学によって制限されないこと;および/または簡単で制限されたサンプル調製の結果として断片化がより少なくなること;および/またはシークエンシング用プローブと関係する位置情報が再構築を助けること;および/またはバリアントのフェージングによって長い範囲のハプロタイプにする能力である。
Hyb & Seq化学の設計:シークエンシング用プローブは、単分子標的と塩基対を形成する標的結合ドメインと、標的結合ドメインの中に存在する6量体配列に対応する少なくとも3つの位置(R1、R2、R3)を有するバーコードドメインを含んでいる。4096通りのシークエンシング用プローブによって任意の標的配列のシークエンシングが可能になる。レポータプローブ:3つのレポータプローブがバーコードドメインの上記位置に順番に結合する。それぞれのレポータ複合体は特定の1つのジヌクレオチドに対応する。ハイブリダイゼーションによって機能が発揮される。
本開示の長い読み出しシークエンシング法と短い読み出しシークエンシング法は、図18と図19に示してあるように、核酸を標的とした捕獲に同じ簡単なプローブハイブリダイゼーション作業フローを利用している。図18の右図に示してあるように複数のシークエンシング用プローブが標的核酸に同時にハイブリダイズすることができ、図19の右図に示してあるように光学的分解によって長い標的1つにつきいくつかのスポットを個別に識別することが可能になる。複数のシークエンシング用プローブを同時にハイブリダイズさせて記録することにより、1回の読み出しの情報内容が増える。長い範囲のハプロタイプは単分子分析に固有であり、コンピュータによる再構成ではなくて実際の物理的位置によって再構築することができる。本開示のシークエンシング法を利用すると、数百キロ塩基までの長いシークエンシング読み出しが可能である。
図20に示してあるように、特別なシークエンシング用プローブのプールが、予想されるパターンで15キロ塩基の標的にハイブリダイズしている。シークエンシング用プローブは、予想される配列特異的位置かつ相対的な物理的距離で、伸長した標的(流体力で伸長した標的が好ましい)にハイブリダイズする。本開示のシークエンシング法は、短い読み出し技術と比べて情報内容が増えているため、各サイクルでより多くの塩基を読み出すことができる。本開示の長い読み出しシークエンシング法は、シークエンシングの読み出し結果の相対位置も記録する。これは、長い読み出しの再構築を助ける。本開示の長い読み出しシークエンシング法を利用する場合には、読み出し長=コンセンサス配列の長さ=捕獲された標的分子の長さである。
図27は、33キロ塩基のDNA断片を捕獲し、伸長させ、シークエンシングプローブとレポータプローブにハイブリダイズさせ、検出した実験の結果を示している。本開示のシークエンシング法は、33キロ塩基までのDNA断片と33キロ塩基超のDNA断片に適合性がある。読み出し長は、標的核酸断片の初期長によってだけ制限され、酵素またはシークエンシング化学によっては制限されない。
図13は、標的となるフェージングされた長い読み出しに関する本開示のシークエンシング法の追加の能力を示している。フェージングされた長い範囲のハプロタイプがデータには固有であり、バリアントのフェージングに関して容易に同定される。長い標的分子全体のシークエンシングは不要である。というのも「ブロッカーオリゴ」を用いて配列のサイクリングを興味あるシークエンシングウインドウに制限できるからである。
実施例1の結果は、本開示のシークエンシング法で長い読み出し長の単分子シークエンシングが可能であることを示している。この結果は特に、15キロ塩基と33キロ塩基の一本鎖DNA分子の捕獲と流体力による伸長がうまくいくこと;空間的に分離された蛍光データが、長い単分子に沿った実際の相対位置に正確に対応していること;シークエンシングサイクルごとに10塩基超の複数の配列が同時に読み出されることを示している。
実施例2:ShortStack(商標)技術:短いヌクレオチドバリアントとInDelを分離する標的シークエンシングのためHyb & Seq読み出しを参照にガイドされて正確に再構築する
ShortStackは、Hyb & Seqの異なる6量体読み出し(6量体スペクトル)を再構築する設計のオープンソースアルゴリズムである。このアルゴリズムは、単分子をベースとしていて、画像化されたそれぞれの特徴からの6量体読み出しを用いて標的を同定し、それら6量体読み出しを再構築してコンセンサス配列にするための統計的アプローチであり、エラー補正を伴っている。
Hyb & Seq化学とShortStackを利用した単分子シークエンシングを以下のように実施した:Hyb & Seq化学を利用したハイブリダイゼーションの各サイクルの後に単分子標的の6量体読み出しを生成させた;ハイブリダイゼーションのサイクルが多数回終了した後、各単分子標的の複数の領域をカバーする6量体スペクトルが生成した;6量体スペクトルを標的核酸分子それぞれの参照配列とともに用いて各単分子標的のコンセンサス配列を導出する。
Hyb & Seq技術をShortStackとともに用いた標的シークエンシングの結果は以下のことを示している:6量体のスペクトルを用いた単分子標的同定アルゴリズムは成功率が100%であった;および/または参照によってガイドされる再構築アルゴリズムにより単分子コンセンサスの精度が5回のカバレッジで99%超(QVが約 32)になり、それに合致する体細胞バリアント検出(R2約90%)が、あらかじめ特徴付けたgDNAサンプルを用いて証明された;および/またはすべての6量体とShortStackを用いたインシリコ実験から、より大きな標的パネルで平均QVが90超であることが確認された。ShortStackアルゴリズムはHyb & Seqデータを正確に再構築することができる。図28は、シークエンシング実験からの結果を示している。この結果は、本開示のシークエンシング法を利用して取得した後にShortStackアルゴリズムを用いて分析したものである。この実験では、シークエンシングされた標的核酸に含まれているのは、遺伝子BRAF(配列番号3)の断片、遺伝子EGFRex18(配列番号4)の断片、遺伝子KRAS(配列番号5)の断片、遺伝子PIK3CA(配列番号6)の断片、遺伝子EGFRex20(配列番号7)の断片、遺伝子NRAS(配列番号8)の断片である。図28は、塩基カバレッジとバリアント読み取りの両方を示している。カバレッジのプロットは、FFPE(ホルマリン固定パラフィン包埋)gDNAにおける塩基のカバレッジを示している。結果は、利用可能なシークエンシング用プローブによって多彩な標的の大半の塩基がカバーされることを示している。エラープロットは、多彩な標的に関してFFPE gDNAサンプルの中の調べる位置におけるエラー率とカバレッジの関係を示している。結果は、8回のカバレッジでエラー率が1%未満であることを示している。頻度プロットは、シークエンシングされたHorizon gDNAサンプルに含まれるバリアントの予想頻度と既知の頻度の間の相関を示している。表にはシークエンシングされたHorizonゲノム参照gDNAが掲載されており、バリアント分子の一部が参照サンプルの既知の頻度と一致していることがわかる。
実施例2の結果は、ShortStackが、本開示のシークエンシング法を利用して得られた6量体スペクトルの部分的再構築のための正確なアルゴリズムであることを示している。結果から特にわかるのは以下のことである:シミュレーションデータを用いると、標的同定が100%の精度、塩基ごとの平均品質値が30超である;Hyb & Seq 実験データの中の塩基読み取りが5回のカバレッジで99%超の精度である;ゲノムDNAからのバリアントの検出が既知の値に合致する頻度である(R2約90%);計算性能が優れており、再構築される6量体の数に正比例し、パーソナルコンピュータで約15分間に69k個の分子を再構築することができる。
実施例3:Hyb & Seq(商標)技術を利用してFFPEサンプルから天然gDNAをライブラリなしで標的シークエンシングする - ハイブリダイゼーションに基づく単分子シークエンシングシステム
本開示のシークエンシング法(Hyb & Seq)を利用してFFPEサンプルからの天然のgDNAに関してがんパネルを標的としたシークエンシングを実施して以下のことを明らかにした:がん遺伝子標的を標的とする単分子シークエンシングにおける正確な塩基読み取り; および/または既知のがん遺伝子単ヌクレオチドバリアント(SNV)と挿入/欠失(InDel)の正確な検出;および/またはFFPEから抽出されたgDNA(DNA断片のサイズの中央値は200塩基)からのがん遺伝子標的の多重捕獲;および/または改良型プロトタイプ装置での末端から末端までの自動化シークエンシング。
Hyb & Seq化学と作業フローは以下のようであった:興味あるゲノム標的をシークエンシング用フローセルの表面に直接捕獲する;数百の6量体シークエンシング用プローブを含有するプールを前記シークエンシング室に流入させる;3回のレポータ交換サイクルで蛍光レポータプローブをシークエンシング用プローブのバーコード領域に順番にハイブリダイズさせて6量体の塩基を同定する;塩基が同定されると、シークエンシング用プローブを洗い流す;標的領域が十分な深度で読み出されるまで、シークエンシング用プローブの新しいプールを用いてサイクルを繰り返す。
Hyb & Seqの重要な利点:単純かつ迅速なFFPE作業フロー - 60分以内にシークエンシングを開始するための臨床試料;および/または酵素または増幅がない/ライブラリなしの構成;および/または全作業時間が15分間;および/または高い精度 - 低い化学エラー率+固有エラー補正;および/または長い読み出しと短い読み出しの両方 - 読み出し長は入力サンプルによって規定され、化学によっては制限されない。
Hyb & Seq化学の設計は実施例1に記載した通りである。FFPE組織を処理するためのHyb & Seqサンプルの調製は3つの簡単な工程からなる:(1)単一の試験管での脱パラフィンと溶解;(2)シリンジフィルタを用いた粒子の除去;(3)オプションのDNA断片化と標的捕獲。このプロセスでは、サンプルごとに1~3個の10ミクロンFFPE切片を使用する必要がある。このプロセス全体は60分以内に完了するため、一般的な実験室の装置だけ、すなわちヒートブロック、ピペット、フィルタ、試薬だけを必要とする。
図29は、FFPEサンプルに由来するがん遺伝子標的の捕獲とシークエンシングを多重化するための実験設計の模式図を示している。11個のがん遺伝子標的の一部(配列番号3~13)をシークエンシングするため、合計425のシークエンシング用プローブを設計して構成した。各遺伝子標的に関する既知のバリアントの遺伝子座が多数のシークエンシング用プローブでカバーされた(完全な一致+単一のミスマッチ)。塩基カバレッジと塩基ごとの精度をこれらの領域で測定した。あらかじめ特徴付けた参照サンプルを用いてバリアント検出の精度を取得した。図29の上図は、シークエンシング用プローブ(青色)が、既知のバリアントの位置(赤色)を取り囲む標的配列(灰色)にアラインメントされることを示している。各バリアントの位置(赤色)について、それぞれの(A、G、C、T)塩基バリアントを有する4つのプローブ配列が含まれるようにした。シークエンシング中に1つの標的DNA分子を800回のバーコード交換サイクルにわたって追跡すると、多数の6量体読み出しが得られ、それらを実施例2に記載したようにしてShortStack(商標)アルゴリズムによって再構築した。
図28はシークエンシングの結果を示しており、そこには、各標的の平均カバレッジ、一塩基エラー率、バリアントの頻度の観測値と予想値が含まれている。実施例3の結果は、Hyb & Seqシークエンシングを利用すると、FFPEと参照gDNAサンプルの中の11の標的領域の多重化シークエンシングを実施して一ヌクレオチドバリエーションを小さなエラーで検出できることを示している。
実施例4:Hyb & Seq (商標)化学を利用してcDNAへの変換なしに単分子RNAシークエンシングを直接実施する
Hyb & Seq化学を利用した直接的な単分子RNAシークエンシングを以下のように実施した:天然RNA分子をcDNAへの変換なしに直接捕獲し、シークエンシング用フローセルの表面に固定化した;数百の6量体シークエンシング用プローブを含有するプールを前記シークエンシング用フローセルに流入させた;完全に一致したシークエンシング用プローブを単分子RNA標的の表面にランダムにハイブリダイズさせた;蛍光レポータプローブをシークエンシング用プローブのバーコード領域に順番にハイブリダイズさせて6量体の塩基を同定した;塩基を同定した後、シークエンシング用プローブを洗い流した;標的領域が十分な深度で読み出されるまで、サイクルを繰り返した。
重要な結果:標的とされる単分子RNAをシークエンシングすると、DNAと似たカバレッジプロファイルが示された;および/または200回超のHyb & SeqサイクルにわたってRNA分子がフローセルの表面に安定に維持された;および/または単一のFFPEスライスからmRNAとゲノムDNAが同時に捕獲されて定量された;および/またはわずか10 ngの全RNAを用いて8個の転写産物が多重捕獲されて定量された。
Hyb & Seq化学の設計は実施例1に記載した通りである。図30の上図は、直接的なRNAシークエンシングに関係する実験工程を、cDNA変換を利用して実施した従来のRNAシークエンシングに関係する工程と比較した模式図を示している。図30の中央の図と下図は、RNA分子と本開示のシークエンシング法の適合性を調べる実験からの結果を示している。この実験では、4個の標的RNA分子をシークエンシングした(配列番号14~17)。結果は、少なくとも200回のシークエンシングサイクルにわたってRNA分子を捕獲して検出できることを示している。
図31は、本開示のシークエンシング法を利用して直接的な単分子RNAシークエンシングを実施する実験からの結果を示している。NRASex2(配列番号18)の断片をコードしている天然RNA分子をcDNAへの変換なしで直接捕獲し、シークエンシング用フローセルの表面に固定化し、本開示の方法を利用してシークエンシングした。この実験は、RNAの代わりに捕獲されたDNA分子も用いて繰り返した。図31は、DNAとRNAのシークエンシングのカバレッジが同等であったことを示している。これは、本開示のシークエンシング法を利用してRNAをcDNAへの変換なしに直接シークエンシングできることを示している。
図24は、FFPEサンプルからRNAとDNAをまとめて捕獲する一例を示している。図24の左図は、本開示の方法を利用してFFPEサンプルからgDNAとmRNAの両方を同時に捕獲し、検出し、シークエンシングできることを示す模式図である。サンプルは、実施例3に記載したのと同じFFPE作業フローを利用して調製した。同じ捕獲プロトコルを利用したが、RNA特異的捕獲用プローブとDNA特異的捕獲用プローブを用いた。同じフローセルの中で同じシークエンシング用プローブを用いてDNA分子とRNA分子が同時にシークエンシングされた。図24の右図は、扁桃腺FPPEサンプルからNRASのRNAとDNAを同時に捕獲して検出する実験からの結果を示している。蛍光画像は、RNAとDNAの両方を捕獲して検出できることを示している。棒グラフは、RNAとDNAを同時に捕獲するのに特異的RNA捕獲用プローブと特異的DNA捕獲用プローブが必要とされることを示している。
図32は、RNAパネルの多重標的捕獲の結果を示している。全RNAをさまざまな入力量(0 ng、1 ng、10 ng、100 ng、1000 ng)にしたときのヒトユニバーサル参照RNA(Human Universal Reference RNA)に関して中程度から高度に発現した8個の転写産物の多重捕獲を実施した。多重捕獲されたRNA分子をフローセルの表面に固定化し、特異的シークエンシング用プローブとレポータプローブを固定化された前記RNA分子にハイブリダイズさせて定量した。図32の下図は、100 ngの入力で捕獲されたRNA分子の蛍光画像を示している。各RNAの一例を円で囲み、転写産物の名称と、同定に用いた対応するレポータ複合体の色組み合わせを記載してある。図32の上図は、それぞれの特異的RNA標的に関するカウント数の定量結果を示している。
実施例4の結果は、単分子RNAシークエンシングがHyb & Seq化学で実現されることを示している。結果から特にわかるのは、(1)cDNAへの変換なしの直接的なRNAシークエンシングが可能であること;(2)Hyb & Seqサイクリングプロセスを通じてRNA分子が安定であること;(3)1つのHyb & Seq作業フローでRNA分子とDNA分子の両方を捕獲してシークエンシングできること;(4)10 ngという少ない全RNA入力でmRNAパネルの標的捕獲を実施できることである。
実施例5:Hyb & Seqシークエンシングプラットフォームから生成したハイスループットな分子レベルでの短い読み出しのための統合バイオインフォマティクスアルゴリズム
ShortStack(商標)ソフトウエアを設計して標準的なシークエンシングに基づくバイオインフォマティクス分析のタスク(アラインメント、エラー補正、変異読み取り、読み出しの再構築など)を実行した。図33は、ShortStack(商標)ソフトウエアパイプラインの工程全体の模式図を示しており、ここに含まれるのは、6量体のアラインメントとカバレッジの推定;および/または変異した配列の同定;および/またはグラフデータ構造の構成;および/または分子レベルでの配列再構成とエラー補正である。
すべてのアルゴリズムが、単分子から得られた情報の範囲中で厳密に実行されたことで、最終的な変異読み取り結果がサンプルの変異頻度に左右されないことが保証された。6量体をパネル結合位置に従って異なる分子にグループ化した。分子を標的に割り当てるため、6量体を分子ごとに異なるすべての標的領域にアラインメントさせ、最もよく一致した遺伝子標的を選択した。
1つの統計的指標を測定して分子同定の品質を評価した。N個の異なる標的領域に対するアラインメントから、各標的についてのカバレッジ値の和N個の分布が生成する。カバレッジ値の和の一致スコアが最上位のものを正しい一致として選択した。異なるN個の標的すべてのスコア分布に対する選択された最上位の一致スコアのzスコア統計を測定した。信頼度の低い分子属性(zスコアが2.5σ未満)はフィルタで除外した。
ShortStack(商標)アルゴリズムの重要な利点に含まれるのは、階層的ハッシュインデックスの設計を実現することにより、生じる可能のある配列のあいまいさを正確に取り扱えること;および/または進歩したアルゴリズム設計構造が優先順位付けによってマッピングの品質を保証し、変異の過大評価を阻止していることである。
それに加え、変異グラフデータ構造によりさまざまなタイプの変異(置換、挿入、欠失)の計算モデルを作ることが可能になり、配列再構成とバリアント読み取りのための出力が生成する(置換バリアントは、元の配列と同じ長さのグラフにおいて追加ノードとして表わされ;挿入は、任意の長さの接続されたノードを追加することによってモデル化することができ;欠失は、グラフの中の人工ノードに空の塩基対ストリングを追加することとしてモデル化される);および/またはブラインド変異検索(すなわち変異許容配列アラインメントの検索)において参照配列のすべての位置からのハミング距離が測定され、検索された変異を表わすグラフに新たなノードが追加される;および/または変異した6量体に関するカバレッジの推定が、階層的ハッシュ表を用いて実行される。
構成されたグラフデータ構造により、分子レベルでの配列再構成と装置エラーの補正が可能になる。構成されたグラフにおいて、ダイナミックプログラミングアルゴリズムを適用し、スコアが規格化された塩基カバレッジとして定義されるスコアリング経路のうちで最良のものを見いだす。グラフの最良のスコアリング経路が、分子レベルでの配列再構成を表わしていた。正しい変異配列は含まれた一方で、6量体の中の装置エラーは廃棄された。
シミュレーションデータセットから、このソフトウエアが、分子レベルでの非常に正確な配列再構成と変異読み取りの結果を供給できることを確認した。図34は、ShortStack(商標)ソフトウエアパイプラインを用いてシミュレーションデータセットの変異分析をした結果を示している。これらの結果は、10個のランダムな変異についての変異読み取りの精度を示している。装置エラーが中程度のデータセットでは、精度は平均で99.39%(標的を明確にした検索)と98.02%(ブラインド検索)を示した。装置エラーが多いシミュレーションのもとでは、性能は平均で97.19%(標的を明確にした検索)と93.53%(ブラインド検索)を示した。分子レベルでの塩基カバレッジの閾値を2倍にしたとき、結果は99.5%(2回のカバレッジ)と99.9%(3回のカバレッジ)に改善された。
ShortStack(商標)ソフトウエアは、広い範囲のさまざまな変異を処理することができる。図35は、全体的な変異読み取り精度を示しており、それぞれの棒は、さまざまなタイプの変異に関して変異した異なる10個の標的からの平均値を表わしている。挿入と欠失の長さは1 bpと15 bpの間で選択した。これらの結果は、変異読み取り精度が94.4%(1回のカバレッジ)、97.2%(2回のカバレッジ)、98.5%(3回のカバレッジ)であったことを示している。
実施例6:Hyb & SeqのためのFFPE組織を処理することを目的としたサンプル調製
ホルマリン固定パラフィン包埋(FFPE)組織は、伝統的なシークエンシングプラットフォームにとって挑戦的なタイプのサンプル入力である。Hyb & Seqのサンプル調製法によって下流シークエンシングのためのFFPE組織入力がうまく処理される。最初に、シークエンシングする核酸を1工程プロセスでホルマリン固定パラフィン包埋(FFPE)組織から抽出する。厚み10μmの1つ以上のFFPE切片を核酸抽出緩衝水溶液の中で加熱してパラフィンワックスを同時に融解させ、組織を分解し、細胞から核酸を放出させる。適切な抽出緩衝液が本分野で知られており、前記中に典型例に含まれているのは、プロテイナーゼ、洗浄剤(Triton-100など)、キレート剤(EDTAなど)、アンモニウムイオンである。FFPE切片と抽出緩衝液を56℃で30分間インキュベートして組織からパラフィンを分離し、プロテイナーゼKに組織構造を消化させることで包埋された細胞を洗浄剤に対して露出させ、細胞の溶解が可能になるようにする。溶液を8分間の間隔で3回上下反転させ、組織の脱パラフィンと消化のプロセスの間に試薬が混ざりやすくする。この工程の後、溶液を98℃まで加熱してホルムアルデヒド架橋の逆転を促進することで、核酸がさらに抽出されやすくする。
核酸がFFPE組織から抽出されると、孔のサイズが2.7μmのガラスファイバーフィルタ(Whatman社)を用いて溶液を濾過して組織のゴミと凍結したパラフィンを除去する。得られた溶液は、核酸を含有する均一で半透明な溶液である。前記核酸は、ホルマリン固定プロセスと保管条件が原因で高度に断片化されている。さらに断片化する必要がある場合には、Covaris社の集中照射式超音波処理装置を用いてDNAを物理的に剪断することができる。緩衝液の条件が理由で、核酸の剪断には延長された超音波処理が必要とされる。ピーク投入電力50 W、デューティ因子20%、200サイクル/バーストという標準的な設定を利用した超音波処理を600秒間実施して捕獲される標的をできるだけ増加させる。断片の長さをより短くするには、4℃にて21,000 gで15分間にわって遠心分離することにより、乳化したパラフィンを濾過された溶液から沈殿させることができる。こうすることで、DNAを剪断して約225 bpにすることができる。
次に、迅速なハイブリダイゼーションプロセスの間に捕獲用プローブのペアを標的核酸分子に結合させることにより、標的の捕獲を実行する。5'捕獲用プローブは3'ビオチン部分を含有しているため、標的堆積プロセスの間に、標的が、ストレプトアビジンで被覆したフローセルの表面に結合することができる。3'捕獲用プローブは、精製プロセスの間にビーズに結合できるようにする5'タグ配列(G配列)を含有している。反応速度は、反応速度を最大にするため低いナノモル範囲で添加される捕獲用プローブの濃度に支配される。捕獲用プローブは、興味ある領域に隣接するようにして標的にハイブリダイズしてシークエンシングウインドウを生成させる。それぞれのDNA標的について、捕獲用プローブセットは、標的のアンチセンス鎖にハイブリダイズして再アニーリングを阻止するため、シークエンシングウインドウと配列が同じ構成のオリゴも含んでいる。捕獲用プローブを含有する溶液を3分間にわたって98℃に加熱してゲノムDNAを変性させた後、65℃で15分間インキュベートする。400 mM~600 mMの範囲の濃度のNaClをこのハイブリダイゼーション反応で用いる。実験で確認されている100個超の標的からなるパネルを表3に掲載してある。この表には、遺伝子と、標的となるDNA領域のエキソンが詳しく記載されている。
Figure 2022174137000010
捕獲用プローブを標的となるDNA領域に結合させた後、ゲノムDNAの残部から精製すると、標的が豊富になった溶液が生じる。3'捕獲用プローブの結合配列に対するアンチセンスオリゴ(アンチG配列)で被覆したビーズを捕獲反応混合物とともに室温で15分間インキュベートする。この結合工程の後、ビーズを0.1×SSPEで3回洗浄して非標的DNAとビオチン含有5'捕獲用プローブを除去する。洗浄の後、ビーズを14μlの0.1×SSPEに再懸濁させ、次いで10分間にわたって45℃に加熱して精製されたDNA標的をビーズから溶離させる。溶離後、1μlの5 M NaClを添加して捕獲用プローブがDNA標的に結合したままになるようにする。
サンプル調製プロセスの最終工程は、DNA標的をフローセルの表面に堆積させることであり、前記場所で本明細書に開示されているようにして本開示のプローブを用いてDNA標的を分析することができる。シリンジポンプを用いて標的をフローセルの流体チャネルに装填する速度を制御する。前記ためすべての標的に、チャネルの高さを横断して拡散してストレプトアビジンの表面に結合する時間がある。この装填法によって標的の密度勾配が生じ、単位面積当たりの分子数は流体チャネルの入口において最大になり、出口に向かう流体流の方向でチャネルの長さに沿って減少していく。0.35μl/秒という流速だと、幅が1.6 mmで高さが40μmのチャネルでは約10 mmのチャネルの長さの中に大量の捕獲が実現する。ビオチニル化された5'捕獲用プローブによって標的が表面に結合すると、3'捕獲用プローブの結合配列の逆相補体であるビオチニル化されたオリゴ(Gフック)の溶液が注入されて標的の自由端が垂れ下がり、架橋した構造を生み出す。前記中央部の中のssDNA領域が、興味あるシークエンシングウインドウである。次に、G配列オリゴの溶液を添加して表面にある過剰なGフックにハイブリダイズさせ、前記表面上のssDNAの量を減らす。図11は、本開示による2つの捕獲用プローブシステムを用いた1個の標的核酸の捕獲を示している。
実施例7:Hyb & Seqのための多色レポータ画像処理
画像処理パイプラインに含まれる工程は、バックグラウンドを差し引く工程、登録する工程、特徴を検出する工程、分類の工程である。バックグラウンドを差し引く工程では、所与の任意のチャネルの平均バックグラウンドは、ショット雑音と露出の関数である。われわれのシステムでは、青色チャネルが最大レベルのバックグラウンドを持ち、それよりも大きな変動がカップルしている。半径が7画素の円形構造要素を有する単純なシルクハット形フィルタを適用して局在化したバックグラウンドを差し引く。登録に関しては、多色かつ多サイクルの特徴分析のため、興味ある特徴を完全にアラインメントすることが必須である。このシステムは、2つの形態の登録を必要とする。第1の形態に関しては、単一取得スタックの中のあらゆる画像チャネルに局所アフィン変換を適用する。この変換は光学系の関数であるため、所与の装置に適合している。この関数をすべての試行についてあらかじめ計算しておき、取得したすべての画像に適用する。第2の形態に関しては、規格化された交差相関を利用して固定シフトの形態の全体変換を計算し、試行中の機械的ガントリのドリフトを捕獲する。次の工程は特徴の検出である。
すべての画像が登録されると、一致したフィルタを用い、LoG(Laplacian of Gaussian)フィルタを通じて特徴を検出する。フィルタは、スポットの応答の増強と一致させるため、(特徴の回折限界に一致した)固定されたカーネルサイズと(対応するチャネルの波長に一致した)変化する標準偏差で適用する。極大を用いてレポータの潜在的な位置を同定する。同定されたそれぞれの特徴に関連する強度値を回収して分類する。最終工程は分類である。ガウス型ナイーブベイズモデルを用いて多色レポータの強度を分類する。このモデルは、レポータの強度が互いに独立であって正規分布に従うことを仮定している。次にこのモデルで、最大事後(maximum a posteriori)規則、すなわちMAP規則を用い、(すべてのチャネルxlにおける強度によって指定される)特定の特徴yが所定のクラス(Ck)に属する確率を計算する。
Figure 2022174137000011
個々の色組み合わせで標識したレポータ複合体の強度分布を図36に示してある。図36は、青と赤の2つの染料を用いたコード化スキームを示している。2色コーディングシナリオでは6つのクラス(バックグラウンドを含む)が存在する。実現したシステムでは、4色を選択することで14のクラスが可能になっている。単一の半染料と全染料の分布の間にはいくらか重複があることに注意されたい。前記帰結として、これらクラスの間での分類はより大きなエラー率を示し、「xG」と「GG」の間で誤って分類される割合の最大値は11.8%である。10クラスモデルで誤って分類される割合は0.2%未満である。各レポータは最大で8つのクラスを必要とするため、分類エラーが最小のものを選択するのは簡単である。検出された色コードを、参照表に基づき、同定された塩基対に翻訳する。本明細書に開示した本開示のプローブを用いて複数のサイクルで特徴を追跡する。
実施例8:捕獲用プローブを用いた標的核酸の精製と堆積
標的核酸分子を捕獲するのに2つの捕獲用プローブシステムを用い、極めて特異的な豊富化を実現する。捕獲用プローブを、標的とする興味ある領域に隣接した位置で標的核酸に結合するように設計し、「シークエンシングウインドウ」を生み出す。5'捕獲用プローブ(CapBと呼ぶ)は3'ビオチン部分を含有している。3'捕獲用プローブ(CapAと呼ぶ)は、5'親和性タグ配列(G配列と呼ぶ)を含有している。平均して捕獲用プローブは長さが約40個のヌクレオチドであり、Tmと配列の文脈に基づいて設計される。シークエンシングウインドウは長さが約70個のヌクレオチドであり、容易に調節される。図11は、2つの捕獲用プローブシステムの模式図を示している。
CapB上のビオチン部分が、標的核酸を、ストレプトアビジンで被覆したシークエンシング用フローセルの表面に接続している。CapB上の親和性タグにより、精製中に標的核酸分子を磁性ビーズに可逆的に結合させることが可能になる。CapAとCapBを用いることで、高度なストリンジェンシーでの標的豊富化が可能になる。というのも両方のプローブが1個の標的核酸分子に結合したままになり、前記標的が磁性ビーズ精製プロセスと表面堆積プロセスの両方を生き延びるからである。多重捕獲は、一度に100個までの標的で証明されている。短時間での効率的な捕獲を実現するため、捕獲用プローブは1 nM~10 nMの範囲の濃度で添加する。
実験的な試験において、約10個の標的核酸分子からなるパネルを、Gビーズと2つのプローブ捕獲システムを用いて精製した。CapAプローブとCapBプローブが標的核酸に最初にハイブリダイズした。次に、結合したCapAプローブのG配列部分がGビーズ上のGフックにハイブリダイズすることで、標的核酸分子がGビーズに連結される。0.1×SSPEを用いた一連のストリンジェントな洗浄を実施して標的とされないDNAと結合しなかったCapBを除去した。標的核酸分子をGビーズから放出させるため、低い塩濃度で45℃にて溶離させてG配列を変性させる一方で、CapAとCapBは標的核酸にハイブリダイズしたままになるようにした。
試験から、約100個の標的核酸分子からなるパネルを精製するとき、非特異的な信号/バックグラウンドの信号が有意に増加することがわかる。バックグラウンドのこの増加は、いくつかの因子に起因する可能性がある。すなわち、(1)CapAプローブ種とCapBプローブ種の間の相互作用が増加し、それが精製を通じて持ち越される増加した量の遊離したCapBプローブにつながることと、(2)CapBプローブとGフックまたはGビーズとの間の相互作用が増加し、それが望まない標的核酸の精製につながることである。さらに、パネルのサイズが大きくなるにつれて、CapB種とCapA種とシークエンシング用プローブの間で可能な相互作用が指数関数的に大きくなる。これら相互作用は、標的を密に堆積させる能力に干渉する可能性があるため、シークエンシングの読み出しが無駄になる。
遊離したプローブ種と望まない標的核酸分子の精製に起因する非特異的な信号とバックグラウンドの信号を減らすため、精製手続きをいくらか改変することができる。第1に、標的核酸分子をGビーズに結合させるときに用いる緩衝液の中にホルムアミドを30%v/vの濃度で含めると、(標的分子を欠く対照におけるカウント数によって測定したとき)バックグラウンドのカウント数が1/2に減少する。これはおそらく干渉によって遊離した捕獲用プローブがGフックと不完全にハイブリダイズすることによるのであろう。前記ため過剰なプローブを洗い流すことができる。第2に、Gビーズ上のGフックの中に4個のイソdG塩基を含め、CapA G配列の中に相補的イソdC塩基を含めると、(標的分子を欠く対照におけるカウント数によって測定したとき)バックグラウンドのカウント数が1/3に減少する。イソdCとイソdGは天然のdC塩基とdG塩基の異性体バリアントである。イソ塩基は他のイソ塩基と塩基対を形成するが天然塩基とは塩基対を形成しないため、捕獲用プローブとイソGフックの間の不完全なハイブリダイゼーションだけが、G配列の非イソ塩基とイソGフックの間に存在することができる。これらの不完全な相互作用は、ストリンジェントな洗浄の間により簡単に破壊される。最後に、Ampure(登録商標)XP(Agencourt Biosciences Company社)ビーズを用いたイソGビーズの前記後の精製によって(標的分子を欠く対照におけるカウント数によって測定したとき)バックグラウンドのカウント数が少なくとも1/20に減少する。Ampure(登録商標)XPビーズを用いた精製の間、ポリエチレングリコール(PEG)とNaClの溶液中でDNAサンプルをカルボキシル化された磁性ビーズの懸濁液と混合する。PEGとNaClの濃度を滴定し、分子量の閾値を超えた分子だけが沈殿してビーズに結合するようにできる。捕獲用プローブにハイブリダイズしたHyb & Seq標的は81 kDaのオーダーであるのに対し、遊離したプローブは17 kDa以下のオーダーである。Ampure(登録商標)XPビーズの懸濁液をイソGビーズ溶離液と体積比1.8:1で混合することにより、ハイブリダイズした標的はビーズに結合するため、遊離したプローブの有意な部分を最終的な溶離の前に洗い流すことができる。
したがってモデル精製作業フローは以下の工程からなる:(1)5×SSPE/30%ホルムアミドの中で捕獲用プローブ-標的核酸複合体をイソGビーズにハイブリダイズさせる;(2)0.1×SSPEを用いてイソGビーズを洗浄する;(3)0.1×SSPEの中で45℃にて捕獲用プローブ-標的核酸複合体を溶離させる;(4)イソGビーズ溶離液を1.8倍の体積のAmpure(登録商標)XPビーズに結合させる;(5)75%エタノールを用いてAmpure(登録商標)XPビーズを洗浄する;(6)0.1×SSPEの中で捕獲用プローブ-標的核酸複合体を溶離させると標的が7.5μlの中に溶離するため、前記後に0.5μlの5 M NaClを添加する。
精製の後、輸液シリンジポンプを用いて捕獲用プローブ-標的核酸複合体をシークエンシング表面に堆積させ、精製された標的をフローセルにゆっくりと注入する。堆積勾配を求めるため、フローセルをチャネルの長さに沿ったさまざまな位置で撮影する。典型的な堆積勾配を図37に示してある。チャネルの高さが20μmだと、サンプルを0.167μl/分の流速で装填すると標的が濃縮され、全標的の80%がチャネルの長さに沿って5.1 mm以内に結合する。これは、FOVが0.0357 mm2、フローセルのチャネル幅が1.7 mmのGen2イメージャでは約240 FOVであることを表わしている。勾配は、堆積中の流速を調節することによって変えることができる。
上に記載した手続きを利用して、約300塩基対のサイズに剪断されたゲノムDNAを有する100重の標的核酸パネルの精製と堆積を調べた。DNA入力の範囲を25 ng~500 ngにして一連の実験を三重に実施した。図38に示してあるようにフローセル上の標的の合計数を堆積勾配のイメージングによって外挿し、平均カウント数を取得した。捕獲効率は6.6%であり、DNA質量入力の範囲で一貫性があった。
実施例9:シークエンシング用プローブの設計と特徴
シークエンシング用プローブは標的結合ドメインを介して標的核酸分子にハイブリダイズする。この実施例では、標的結合ドメインは長さ8個のヌクレオチドであり、(N)塩基((N)塩基として、ユニバーサル塩基/縮重塩基または正規塩基が可能である)が隣接した架橋型核酸(LNA)6量体を含有している(N1-B1-B2-B3-B4-B5-B6-N2、ここで、B1~B6はLNAであり、N1とN2は、(6量体)配列B1-B2-B3-B4-B5-B6とは独立なユニバーサル塩基/縮重塩基または正規塩基である)。4,096通りのシークエンシング用プローブの完全なセットは可能なすべての6量体をコードしているため、任意の標的核酸のシークエンシングが可能である。それぞれのシークエンシング用プローブは、標的結合ドメインの中に存在する6量体配列をコードするバーコードドメインも含んでいる。それぞれのバーコードドメインは、3つの位置(R1、R2、R3)を含有している。バーコードドメインの中の各位置は、標的結合ドメインの6量体の中の特定のジヌクレオチドに対応し、特定の標識されたレポータ複合体に結合することのできる独自の配列を含有している。シークエンシング用プローブ全体の模式図を図1に示してある。バーコードドメインの中の各位置は、4つの蛍光染料、すなわち青(B)、緑(G)、黄(Y)、赤(R)を用いて作り出される8通りの「色組み合わせ」をコードしている。シークエンシングの各サイクル中にレポータ複合体がバーコードドメインの中の3つの位置のうちの1つに結合する。これは、標的結合ドメインの6量体の中の対応するジヌクレオチドの属性を示している。3回の連続したシークエンシングサイクルの間に3つの「色組み合わせ」が、バーコードドメインの中の各位置につき1つ記録されるため、標的結合ドメインの6量体全体の同定が可能になる。4,096通りのシークエンシング用プローブは8つのプールに分割され、それぞれは512の可能なバーコードのうちの1つと関係している。
実施例10:レポータ複合体の設計、精製、結合の条件
この実施例では、各レポータ複合体は37個のDNAオリゴマーからなる分岐構造であり、合計30個の蛍光染料(色組み合わせのそれぞれの色の染料が15個)を保持する設計にされていた。レポータ複合体を構成する37個のDNAオリゴマーはサイズによって分類することができる。一次核酸と呼ばれる最大のオリゴマーは、長さが12個または14個のヌクレオチドである相補的核酸に共有結合する。一次核酸は、長さが96個のヌクレオチドである。相補的一次核酸は、シークエンシング用プローブのバーコードドメイン上の位置R1、R2、R3のいずれかに結合する。次に大きいDNAオリゴマーは長さが89個のヌクレオチドであり、二次核酸と呼ばれる。レポータ複合体1つにつき6個の二次核酸が存在していて、色組み合わせのそれぞれの色につき3個の二次核酸である。それぞれの二次核酸はヌクレオチド14個の長さの配列を含んでいて、前記配列により二次核酸が一次核酸にハイブリダイズすることが可能になる。最小のDNAオリゴマーは長さが15個のヌクレオチドであり、三次核酸と呼ばれる。2色プローブ1つにつき30個の三次核酸が存在していて、1色につき15個の三次核酸である。37個のDNAオリゴマーからなる分岐構造の模式図を図4に示す。
三次核酸は、蛍光染料の形態になった検出可能な標識を含んでいる。4種類の蛍光染料、すなわち青(B)、緑(G)、黄(Y)、赤(R)が存在している。1つのレポータ複合体の中で染料を組み合わせると、2色の組み合わせが10通り可能になる(BB、BG、BR、BY、GG、GR、GY、RR、YR、YY)。異なる蛍光染料の間の色の交換または交差ハイブリダイゼーションを阻止するため、特定の蛍光染料に対応するそれぞれの二次核酸と三次核酸は独自の配列を含有している。例えばAlexa 288蛍光体すなわち青色で標識したそれぞれの三次核酸は、青色二次核酸に対してだけ相補的な配列を含んでいる。青色二次核酸はさらに、青を含む色組み合わせに対応する一次核酸分子に対してだけ相補的な異なる配列を有する。
それぞれの相補的核酸は、シークエンシング用プローブのバーコードドメインの位置R1、R2、R3の間で互いに異なる配列を含有している。したがって同じバーコードドメインの位置R1とR2が同じジヌクレオチドをコードしている場合でさえ、位置R1の前記ジヌクレオチドを同定する相補的核酸分子が位置R2に結合することはない。同様に、位置R2の前記ジヌクレオチドを同定する相補的核酸分子が位置R1に結合することはない。相補的核酸は、競合的トーホールド交換(長さが12個のヌクレオチドである相補的核酸の場合)を利用するか、UV切断(長さが14個のヌクレオチドである相補的核酸の場合)を利用してシークエンシング用プローブから効率的に外れることができるように設計される。
レポータ複合体の調製は、(1)三次核酸を二次核酸にハイブリダイズさせた後、(2)三次核酸+二次核酸を一次核酸にハイブリダイズさせるという2つの連続したハイブリダイゼーション工程で起こる。4.2×SSPE緩衝液の中で100μMの二次核酸と600μMの三次核酸を室温で30分間にわたって組み合わせることにより、二次核酸に対する三次核酸の反応物を別々に4つ調製する。次に、4.8×SSPEの中で2μMの一次核酸、7.2μMの二次核酸+染料#1三次核酸、7.2μMの二次核酸+染料#2三次核酸を用いて24のレポータプローブを別々に調製する。これらの反応物を5分間45℃に加熱した後、30分間室温に冷却する。次に、これら24の反応物を、バーコードドメインに対応する3つの異なるプールに分類する(すなわちR1、R2、R3)。例えばR1バーコードドメインに結合した8つの異なるレポータプローブ(それぞれ2μM)をまとめてプールし、10倍に希釈して各レポータ複合体が200 nMという最終作業濃度にする。レポータ複合体は高圧液体クロマトグラフィ(HPLC)を利用して精製することができる。図39は、遊離したオリゴマーとうまく形成されなかったプローブをHPLC精製によって除去してレポータプローブを取得できることを示している。
レポータ複合体を調製した後は、品質保証のための標準的な試験である。3つの別々のフローセルの中で、レポータプローブの3つのプールのそれぞれを、対応するバーコード領域(R1、R2、R3のいずれか)への結合に関して試験する。試験は、バーコードドメインが1つだけ存在していてフローセルの表面に固定化されている修飾されたシークエンシング用プローブコンストラクトで実施する。それぞれの色を表わす8個の12量体すべてを多重化すると、8つのレポータプローブすべてが大きな色カウント数で同定されることが予想される。
レポータプローブとシークエンシング用プローブのバーコードドメインのハイブリダイゼーションの効率と精度を向上させるため、さまざまな緩衝液添加物を試験した。図40は、5%硫酸デキストラン(500K)と、15%ホルムアミドまたは15%炭酸エチレンとを含有する緩衝液により、レポータプローブとシークエンシング用プローブのハイブリダイゼーションが短時間のうちに最高の効率と精度で可能になることを示す実験からの結果を示している。しかし図41は、炭酸エチレンがシークエンシング用スライドの表面に対してマイナスの影響を持ち、前記結果として時間が経つと標的核酸が大きく失われることを示す実験からの結果を示している。したがって5%硫酸デキストラン(500K)と15%ホルムアミドを含有する緩衝液が、レポータプローブとシークエンシング用プローブの効率的で正確なハイブリダイゼーションに関してより優れている。
実施例11:相補的核酸配列の設計と確認
レポータプローブは、シークエンシング用プローブのバーコードドメイン上の特定の位置(R1、R2、R3のいずれか)に結合する相補的核酸を含有している。12個のヌクレオチド(12量体)または14個のヌクレオチド(14量体)を含有する相補的核酸を設計して試験し、ハイブリダイゼーションに最も適した配列を求めた。スクリーニングのため、以下の基準を用いて最適な配列を求めた。すなわち前記基準とは、レポータプローブとシークエンシング用プローブが10回のシークエンシングサイクルで80%超の効率で結合するという大きな結合効率を配列が示さねばならないことと;配列が15秒~30秒以内に起こる速いハイブリダイゼーション速度を示さねばならないことと;配列がレポータプールにおいて5%未満の交差ハイブリダイゼーションエラーという大きな特異度を示さねばならないことである。
表4は、同定された24通りの12量体配列を示している(配列番号19~42)。各バーコードドメインは3つの位置を含有しているため、24通りの12量体配列を3つのグループに分割して8×8×8 12量体レポータセットを作り出すことができる。
Figure 2022174137000012
同様にして14量体配列を設計したが、3つの点で12量体配列とは異なっている。第1に、14量体配列はより長いハイブリダイゼーション配列を含有している。というのも14量体配列は、バーコードドメイン上の特定の位置に結合する14個の一本鎖ヌクレオチドを、12量体の中に存在する12個の一本鎖ヌクレオチドの代わりに含有しているからである。第2に、14量体配列は、配列の多様性がより大きい。なぜなら14量体配列はトーホールドを介した除去に適した設計にしなかったからである。14量体配列はシークエンシング用プローブにより強くハイブリダイズするため、トーホールドを介した除去の効率が低下する。したがって14量体配列に関しては配列と独立な除去戦略を探し、スクリーニング中の配列の制約を緩和した。以下の一群の規則を含むアルゴリズムを利用してスクリーニングのための配列を設計した。前記規則とは、「G」または「C」を欠くヌクレオチド組成(すなわち複雑さが低い配列);GC含量が40%~60%;融点(Tm)が35℃~37℃;ヘアピン折り畳みエネルギー(dG)が2超;他のシークエンシング用プローブとの適合性(ハミング距離が7以上)である。標的核酸の中に存在する可能性のあるゲノム配列に対する14量体配列のハイブリダイゼーションをできるだけ少なくするため、外部RNA管理コンソーシアム(External RNA Controls Consortium)配列をガイドとして用いて可能性のある配列をフィルタした。第3に、14量体相補的核酸がレポータ複合体の一次核酸に付着している位置で切断可能なリンカー修飾を利用して鎖を切断することによってシークエンシング用プローブのバーコードドメインから除去されるように14量体配列を設計した。14量体配列を除去するとレポータ複合体の信号の「暗化」が起こり、次のスクリーニングサイクルと信号の検出が可能になる。UV光で切断可能なリンカー、還元剤(TCEPなど)で切断可能なリンカー、酵素で切断可能なリンカー(USER(商標)酵素によって切断されるウラシルなど)を含むさまざまな切断可能なリンカー修飾を調べた。これらの切断可能なリンカー修飾のすべてが、レポータ複合体の効率的な暗化を促進することが見いだされた。暗化は、切断可能なリンカー修飾を二次核酸の中に導入することによってさらに増強された。これらの切断可能なリンカー修飾は、一次核酸にハイブリダイズする配列と、三次核酸にハイブリダイズする配列の間に位置させた。図10は、切断可能なリンカー修飾にとってレポータプローブの中で可能な位置を示している。
可能性のある14量体配列のスクリーニングにより、受容可能な配列の2つのグループが同定された。表5は第1のグループを示しており、ここには24個の配列が含まれていた(配列番号43~66)。これら24個の配列を3つのグループに分けて8×8×8 14量体レポータセットを作り出すことができた。
Figure 2022174137000013
表6は、他方のグループを示している。ここには30個の配列(配列番号67~96)が含まれていた。これら30個の配列を3つのグループに分けて10×10×10 14量体レポータセットを作り出すことができた。
Figure 2022174137000014
スクリーニングの後、8×8×8 12量体レポータセット、8×8×8 14量体レポータセット、10×10×10 14量体レポータセットを実験で確認した。8×8×8 12量体結合スキームに関しては、Hyb & Seqプロトタイプを用いて確認を実行し、10回のシークエンシングサイクルを記録した。長い作業フロー法と短い作業フロー法の両方においてレポータプローブの3つのプールを使用した。512の可能なシークエンシング用プローブのバーコードドメインをすべて調べた。表7は、長い作業フロー法と短い作業フロー法の実験工程を示している。
Figure 2022174137000015
長い作業フロー実験によって暗化効率が97%超になった。短い作業フロー実験に関しては暗化が同様に効率的であると推定したが、暗化されないレポータが各画像にわずかな頻度で残って新しいレポータと間違って呼ばれる可能性があることが予想された。実際、短い作業フロー実験でバーコードカウント数が最も多かったのはYYYYYYであった。これは、暗化していないアーチファクトとバックグラウンドである可能性が大きかった。図42は、短い作業フローでは長い作業フローと比べて8×8×8 12量体レポータセットの性能が一般に低いことを示している。(バーコードドメインの位置R1に結合する)レポータ複合体1と(バーコードドメインの位置R3に結合する)レポータ複合体3は、短い作業フローでは長い作業フローと比べて効率が低かった。レポータ複合体3ではそうなることが予想される。というのもレポータ複合体3は、8個の追加トーホールドオリゴヌクレオチドをそれぞれ2.5μMという高い濃度で含んでいるため、レポータのハイブリダイゼーションに干渉する可能性があるからである。レポータ複合体1は、2つの作業フローで同様に機能するはずである。というのも短い作業フローと長い作業フローのどちらでも、第1のレポータ複合体の除去にトーホールドを使用しなかったからである。全エラーも、3つのレポータプローブのすべてで、短い作業フローでは長い作業フローよりも多かった(1.3~2倍)。
可能な512のシークエンシング用プローブすべてのバーコードドメインに対する効率、特異度、ハイブリダイゼーションの速度を調べることによって8×8×8 14量体レポータセットを確認した。シークエンシング用プローブのバーコードドメインは、Hyb & Seqシークエンシングカートリッジのガラスの表面に直接固定化した。図43は、8×8×8 14量体レポータプローブがわずか15秒の間に平均効率88%でハイブリダイズして平均エラー率が5.1%であることを示している。このエラーの大半は、正確でないハイブリダイゼーションが原因ではなく、レポータの正確ではない同定に起因する。レポータの分類ミスは、レポータエラーの最大の原因のままである。
30個の相補的頭部切断シークエンシング用プローブのバーコードドメインに対する効率、特異度、ハイブリダイゼーションの速度を調べることによって10×10×10 14量体レポータセットを確認した。それぞれのバーコードドメインはレポータ結合部位を1つだけ含有していた。これらバーコードドメインは、Hyb & Seqシークエンシングカートリッジのガラスの表面に直接固定化した。図44は、10×10×10 14量体レポータセットがわずか15秒の間に平均効率90%でハイブリダイズして平均エラー率が5.0%であることを示している。ここでも、エラーの大半は、正確でないハイブリダイゼーションが原因ではなく、レポータの正確ではない同定に起因していた。
実施例12:標準シークエンシング用プローブと3部構成シークエンシング用プローブの設計と試験
シークエンシング用プローブの標的結合ドメインとバーコードドメインは二本鎖「ステム」によって隔てられている。図2は、実験で調べたシークエンシング用プローブの2つのアーキテクチャを示している。標準シークエンシング用プローブでは、標的結合ドメインとバーコードドメインは同じオリゴヌクレオチド上に存在し、前記オリゴヌクレオチドがステムオリゴヌクレオチドに結合して36個のヌクレオチドの長さがある二本鎖領域を生み出している。このアーキテクチャを用いると、プローブのプールの中の各シークエンシング用プローブは同じステム配列を利用する。3部構成プローブでは、標的結合ドメインとバーコードドメインは別々のDNAオリゴヌクレオチドであり、36個のヌクレオチドからなるステムオリゴヌクレオチドによって互いに結合している。起こる可能性のあるバーコードドメインの交換を阻止するため、各バーコードは独自のステム配列を持っていて、シークエンシング用プローブをプールする前に別々にハイブリダイズさせる。
図45は、3部構成シークエンシング用プローブを標準シークエンシング用プローブと比べた一連の実験の結果を示している。これらの実験から、3部構成シークエンシング用プローブが、第3のレポータプローブの検出を含め、両方の構成に関するあらゆる読み出しの約80%で1つのシークエンシングサイクル全体を生き延びることが確認された。3部構成プローブは、標準シークエンシング用プローブと比べて約12%少ないカウント数を示す。バーコードドメインオリゴの交換の傾向を研究するため、同じステム配列を含有する高濃度の短い代替オリゴヌクレオチドを反応物に添加した。結果は、検出された3部構成シークエンシング用プローブの約13%がバーコードオリゴを交換していたことを示していた。オリゴヌクレオチドの交換は、独自のステム配列を組み込むことによって緩和する必要があろう。3部構成プローブは、性能がわずかに低いにもかかわらず、設計の柔軟性、迅速なオリゴ合成、コスト低減という利点を提供する。
実施例13:標的結合ドメインの中の架橋型核酸置換の効果
シークエンシング用プローブの標的結合ドメインの中に置換によって架橋型核酸(LNA)を入れることの効果を以下のようにして調べた。溶液の中でシークエンシング用プローブをレポータプローブにハイブリダイズさせ、適切に形成されたシークエンシング用プローブ-レポータプローブを精製した。次に、溶液の中でシークエンシング用プローブ-レポータプローブを合成標的核酸にハイブリダイズさせ、プロトタイプシークエンシングカートリッジの表面に装填した。合成標的核酸は50個のヌクレオチドからなり、ビオチニル化されていた。シークエンシング用プローブを個別に、または9つのシークエンシング用プローブのプールの中で試験した。9つのシークエンシング用プローブのプールに関しては、プローブを、標的核酸の長さに沿って結合する設計にした。分析のため、ストレプトアビジンで被覆したカバースライドの表面に反応物全体を回路基板装置によって堆積させた後、流体力で伸長させた。次にレポータプローブの画像を取得し、適切な装置とソフトウエア(例えばNanoString nCounter(登録商標)装置とソフトウエア)を利用してカウントした。
それぞれのシークエンシング用プローブは、10個のヌクレオチド(配列番号97)からなる標的結合ドメインを含有していた。標的結合ドメイン内のLNA置換を実行し、2個、または3個、または4個のLNA塩基が図46に示した位置に含まれるようにした。図46は、LNA塩基の数が増えるにつれて標的核酸に対する個々のシークエンシング用プローブの結合親和性が大きくなったことを示している。重要なことだが、図46は、LNA塩基の組み込みによってシークエンシング用プローブの結合の特異度は低下しなかったことを示している。9つのシークエンシング用プローブのプールを試験し、プローブが標的への結合を完了できたときの塩基カバレッジを求めた。図47は、単一のLNAプローブをプールの中に導入したとき、影響を受ける塩基のカバレッジは増加するが、周囲のプローブの結合にはほとんど影響を与えなかったことを示している。これらの結果は、LNA塩基による置換が特異度の低下なしに塩基感受性を向上させうることを示していた。
実施例14:標的結合ドメインの中の修飾されたヌクレオチドと核酸類似体による置換の効果
さまざまな修飾されたヌクレオチドと核酸類似体(架橋型核酸(LNA)、架橋した核酸(BNA)、プロピンで修飾された核酸、ジップ核酸(ZNA(登録商標))、イソグアニン、イソシトシンが含まれる)による置換をシークエンシング用プローブの標的結合ドメインの中に導入することの効果を以下のようにして調べた。長さが50個のヌクレオチドであるビオチニル化された標的核酸を、プロトタイプシークエンシングカートリッジのストレプトアビジンカバースライドの表面に装填した。次にシークエンシング用プローブとレポータプローブをサンプル室の中に順番に導入し、Hyb & Seqプロトタイプ装置を用いて画像を取得した。異なるそれぞれのシークエンシング用プローブについて画像を処理してカウント数を比較した。シークエンシング用プローブの10個のヌクレオチド(配列番号99)からなる標的結合ドメインで置換を実行し、図48に示した位置にLNA塩基、BNA塩基、プロピン塩基、ZNA(登録商標)塩基が含まれるようにした。図48は、LNAとBNAを含有するプローブが結合親和性に関して最大の増加を示した一方で、特異度は維持したことを示している。前記ことは、一致した標的とミスマッチの標的で検出されたカウント数に示されている。これらの結果は、LNA塩基またはBNA塩基による置換が特異度の低下なしに塩基感受性を向上させうることを示していた。
実施例15:本開示によるシークエンシング法の精度を求める
図49は、本開示によるシークエンシング法の生の特異度を定量する実験からの結果を示している。この実験では、異なる4つのシークエンシング用プローブのプールを、NRASエキソン2(配列番号1)の断片を含む標的核酸にハイブリダイズさせるというシークエンシング反応を実施した。それぞれのシークエンシング用プローブ(バーコード1~4)は、図49の上図に示したように、6量体の位置b5が異なる以外は同じである標的結合ドメインを持っていた。この実施例では、バーコード4は正しいシークエンシング用プローブである。シークエンシング用プローブをハイブリダイズさせた後、バーコードドメインの3つの位置(R1、R2、R3)のそれぞれにレポータプローブを順番にハイブリダイズさせ、対応する蛍光データを記録した。図49の中央の図は、3つのバーコードドメインの位置について、それぞれの色組み合わせが記録された回数と、正しい組み合わせが記録された回数の割合を示している。R1における色組み合わせは96%の回数で正しく同定され、R2における色組み合わせは97%の回数で正しく同定され、R3における色組み合わせは94%の回数で正しく同定された。図49の下図に示してあるように、こうすることで全体的な生の特異度が94%になる。バーコードドメインの位置が誤って読み取られたことを説明できる可能性のあるエラー発生源に含まれるのは、(a)フローセルの表面へのレポータプローブの非特異的結合と、(b)レポータプローブの正確でないハイブリダイゼーションである。レポータハイブリダイゼーションエラーの推定値は約2~4%であった。
図50は、標的核酸の中のヌクレオチドを2つ以上のシークエンシング用プローブによってシークエンシングするときの本開示によるシークエンシング法の精度を求める実験からの結果を示している。図50の上図に示してあるように、この実施例の標的核酸は、NRASエキソン2(配列番号1)の断片である。興味ある特定の塩基は、標的核酸の中で強調してあるシトシン(C)である。興味あるこの塩基は、2つの異なるシークエンシング用プローブにハイブリダイズし、標的核酸へのハイブリダイゼーションのフットプリントがそれぞれ異なることになる。この実施例では、シークエンシング用プローブ1~4(バーコード1~4)は、興味ある塩基の左側に3個のヌクレオチドを結合させる一方で、シークエンシング用プローブ5~8(バーコード5~8)は、興味ある塩基の左側に5個のヌクレオチドを結合させる。図50の中央の図は、シークエンシング用プローブのバーコードドメインのそれぞれの位置で特定の色組み合わせが記録された回数を示している。画像の定量後、図26に示した塩基読み取り技術を利用すると、約98.98%という平均精度を記録することができる。

Claims (78)

  1. 標的結合ドメインとバーコードドメインを含むシークエンシング用プローブであって;
    前記標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;
    前記バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有する、シークエンシング用プローブ。
  2. 標的結合ドメインとバーコードドメインを含むシークエンシング用プローブであって;
    前記標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;
    前記バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、
    前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、
    前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている、シークエンシング用プローブ。
  3. 標的結合ドメインとバーコードドメインを含むシークエンシング用プローブであって;
    前記標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;
    前記バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有する、シークエンシング用プローブ。
  4. 標的結合ドメインとバーコードドメインを含むシークエンシング用プローブであって;
    前記標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;
    前記バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、
    前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、
    前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている、シークエンシング用プローブ。
  5. a)標的結合ドメインとバーコードドメインを含む組成物
    (ここで、前記標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;
    前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;
    前記バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有する)と;
    前記少なくとも3つの付着位置の第1の付着位置にハイブリダイズする第1の相補的一次核酸分子
    (ここで、前記第1の相補的一次核酸分子は、少なくとも2つのドメインとリンカー修飾を含んでおり、
    そのうちの第1のドメインは、前記バーコードドメインの第1の付着位置にハイブリダイズし、第2のドメインは、少なくとも1つの第2の相補的二次核酸分子にハイブリダイズすることができ、
    前記リンカー修飾は、
    Figure 2022174137000016
    のいずれかであり、このリンカー修飾は第1のドメインと第2のドメインの間に位置する)を含む複合体。
  6. a)標的結合ドメインとバーコードドメインを含む組成物
    (ここで、前記標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;
    前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;
    前記バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、
    前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、
    前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている)と;
    前記少なくとも3つの付着位置の第1の付着位置にハイブリダイズする第1の相補的一次核酸分子
    (ここで、前記第1の相補的一次核酸分子は、少なくとも2つのドメインとリンカー修飾を含んでおり、
    そのうちの第1のドメインは、前記バーコードドメインの第1の付着位置にハイブリダイズし、第2のドメインは、少なくとも1つの第2の相補的二次核酸分子にハイブリダイズすることができ、
    前記リンカー修飾は、
    Figure 2022174137000017
    のいずれかであり、このリンカー修飾は第1のドメインと第2のドメインの間に位置する)を含む複合体。
  7. 前記合成骨格が、多糖、ポリヌクレオチド、ペプチド、ペプチド核酸、ポリペプチドのいずれかを含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  8. 前記合成骨格が一本鎖DNAを含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  9. 一本鎖DNA合成骨格と、前記標的結合ドメインと前記バーコードドメインの間にある二本鎖DNAスペーサとを含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  10. 前記二本鎖DNAスペーサが、長さ約1個~約100個のヌクレオチドである、請求項9に記載のシークエンシング用プローブ。
  11. 前記二本鎖DNAスペーサが、長さ約36個のヌクレオチドである、請求項9に記載のシークエンシング用プローブ。
  12. 前記標的結合ドメインの中のヌクレオチドの数が、前記バーコードドメインの中の付着位置の数よりも多い、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  13. 前記標的結合ドメインの中のヌクレオチドの数が、前記バーコードドメインの中の付着位置の数よりも少なくとも5個多い、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  14. 前記標的結合ドメインが8個のヌクレオチドを含み、前記バーコードドメインが3つの付着位置を含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  15. 前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも4個のヌクレオチドが、修飾されたヌクレオチドまたはヌクレオチド類似体である、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  16. 前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも6個のヌクレオチドが、修飾されたヌクレオチドまたはヌクレオチド類似体である、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  17. 前記修飾されたヌクレオチドまたはヌクレオチド類似体が、架橋型核酸(LNA)である、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  18. 前記標的結合ドメインの中にあって前記標的核酸分子の中の対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドのうちの少なくとも1個が、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも前に位置し、前記標的結合ドメインの中にあって前記標的核酸分子の中の対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドのうちの少なくとも1個が、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドの後ろに位置する、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  19. 前記バーコードドメインの中の各付着位置が同数の付着領域を含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  20. 前記バーコードドメインの中の前記少なくとも3つの付着位置のうちの少ない1つが、他の2つとは異なる数の付着領域を含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  21. 前記バーコードドメインの中の各付着位置が1つの付着領域を含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  22. 前記バーコードドメインの中の各付着位置が、2つ以上の付着領域を含む、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  23. 前記バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域が同じである、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  24. 前記バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域が異なっている、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  25. 前記バーコードドメインの中の各付着位置を含む各核酸配列が、長さ約8個~約20個のヌクレオチドである、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  26. 前記バーコードドメインの中の各付着位置を含む各核酸配列が、長さ約12個のヌクレオチドである、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  27. 前記バーコードドメインの中の各付着位置を含む各核酸配列が、長さ約14個のヌクレオチドである、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  28. 前記バーコードドメインの中の前記少なくとも3つの付着位置のうちの少なくとも1つが、少なくとも1つのフランキング一本鎖ポリヌクレオチドに隣接している、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  29. 前記バーコードドメインの中の前記少なくとも3つの付着位置のそれぞれが、少なくとも1つのフランキング一本鎖ポリヌクレオチドに隣接している、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  30. 少なくとも1つの付着位置の中の少なくとも1つの付着領域が前記合成骨格に一体化されている、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  31. 前記少なくとも3つの付着位置のそれぞれの中の各付着領域が前記合成骨格に一体化されている、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  32. 前記相補的核酸分子が、RNA、DNA、PNAのいずれかである、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  33. 前記相補的核酸分子がDNAである、請求項32に記載のシークエンシング用プローブ。
  34. 前記相補的核酸分子が一次核酸分子であり、前記一次核酸分子が、前記バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に直接結合する、請求項1~4のいずれか1項に記載のシークエンシング用プローブ。
  35. 前記一次核酸分子が少なくとも2つのドメインを含んでいて、
    第1のドメインは、前記バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に結合することができ、
    第2のドメインは、少なくとも1個の相補的二次核酸分子に結合することができる、請求項34に記載のシークエンシング用プローブ。
  36. 前記一次核酸分子が切断可能なリンカーを含む、請求項35に記載のシークエンシング用プローブ。
  37. 前記切断可能なリンカーが、前記第1のドメインと前記第2のドメインの間に位置する、請求項36に記載のシークエンシング用プローブ。
  38. 前記リンカーが光で切断可能である、請求項36に記載のシークエンシング用プローブ。
  39. 前記一次核酸分子が、前記バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域にハイブリダイズし、第1の検出可能な標識と、少なくとも第2の検出可能な標識とを含んでいる、請求項34に記載のシークエンシング用プローブ。
  40. 前記一次核酸分子が、前記バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域にハイブリダイズするとともに、少なくとも1つの第2の核酸分子にハイブリダイズする、請求項35に記載のシークエンシング用プローブ。
  41. 前記一次核酸分子が、少なくとも1個、または2個、または3個、または4個、または5個、またはそれよりも多い個数の二次核酸分子にハイブリダイズする、請求項40に記載のシークエンシング用プローブ。
  42. 前記一次核酸分子が4個の二次核酸分子にハイブリダイズする、請求項40に記載のシークエンシング用プローブ。
  43. 前記第1の検出可能な標識と前記少なくとも第2の検出可能な標識が同じ発光スペクトルを持つか、異なる発光スペクトルを持つ、請求項39に記載のシークエンシング用プローブ。
  44. 前記二次核酸分子が少なくとも2つのドメインを含んでいて、
    第1のドメインは、少なくとも1つの一次核酸分子の中の相補的配列に結合することができ、
    第2のドメインは、(a)第1の検出可能な標識と、少なくとも第2の検出可能な標識に、または(b)相補的な少なくとも1つの第3の核酸分子に、または(c)これらの組み合わせに結合することができる、請求項35に記載のシークエンシング用プローブ。
  45. 前記二次核酸分子が切断可能なリンカーを含む、請求項44に記載のシークエンシング用プローブ。
  46. 前記切断可能なリンカーが、前記第1のドメインと前記第2のドメインの間に位置する、請求項45に記載のシークエンシング用プローブ。
  47. 前記リンカーが光で切断可能である、請求項45に記載のシークエンシング用プローブ。
  48. 前記二次核酸分子が少なくとも1個の一次核酸分子にハイブリダイズし、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含んでいる、請求項44に記載のシークエンシング用プローブ。
  49. 前記二次核酸分子が少なくとも1個の一次核酸分子にハイブリダイズするとともに、少なくとも1個の三次核酸分子にハイブリダイズする、請求項44に記載のシークエンシング用プローブ。
  50. 前記二次核酸分子が、(a)少なくとも1個の一次核酸分子と、(b)少なくとも1個の三次核酸分子と、(c)第1の検出可能な標識および少なくとも第2の検出可能な標識にハイブリダイズする、請求項44に記載のシークエンシング用プローブ。
  51. 前記二次核酸分子が、少なくとも1個、または2個、または3個、または4個、または5個、または6個、または7個、またはそれよりも多い個数の三次核酸分子にハイブリダイズする、請求項49に記載のシークエンシング用プローブ。
  52. 前記二次核酸分子が1個の三次核酸分子にハイブリダイズする、請求項49に記載のシークエンシング用プローブ。
  53. 前記第1の検出可能な標識と前記少なくとも第2の検出可能な標識が同じ発光スペクトルを持つか、異なる発光スペクトルを持つ、請求項48に記載のシークエンシング用プローブ。
  54. 前記三次核酸分子が少なくとも2つのドメインを含んでいて、
    第1のドメインは、二次核酸分子の中の相補的配列に結合することができ、
    第2のドメインは、第1の検出可能な標識と、少なくとも第2の検出可能な標識に結合することができる、請求項44に記載のシークエンシング用プローブ。
  55. 前記三次核酸分子が切断可能なリンカーを含む、請求項54に記載のシークエンシング用プローブ。
  56. 前記切断可能なリンカーが、前記第1のドメインと前記第2のドメインの間に位置する、請求項55に記載のシークエンシング用プローブ。
  57. 前記リンカーが光で切断可能である、請求項55に記載のシークエンシング用プローブ。
  58. 前記三次核酸分子が少なくとも1個の二次核酸分子にハイブリダイズし、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含んでいる、請求項54に記載のシークエンシング用プローブ。
  59. 前記第1の検出可能な標識と前記少なくとも第2の検出可能な標識が同じ発光スペクトルを持つか、異なる発光スペクトルを持つ、請求項54に記載のシークエンシング用プローブ。
  60. 前記二次核酸の表面に位置する前記第1の検出可能な標識と前記少なくとも第2の検出可能な標識が同じ発光スペクトルを持ち、前記三次核酸の表面に位置する前記少なくとも第1の検出可能な標識と第2の検出可能な標識が同じ発光スペクトルを持ち、前記二次核酸分子の表面の前記検出可能な標識の発光スペクトルが、前記三次核酸の表面の前記検出可能な標識の発光スペクトルとは異なっている、請求項57に記載のシークエンシング用プローブ。
  61. 請求項1~4のいずれか1項に記載のシークエンシング用プローブを複数含む、シークエンシング用プローブの集団。
  62. 核酸のヌクレオチド配列を求める方法であって、
    (1)請求項1~4のいずれか1項に記載の第1のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;
    (2)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;
    (3)前記第1の付着位置にハイブリダイズした前記第1の相補的核酸分子の前記第1の検出可能な標識と前記第2の検出可能な標識を同定し;
    (4)前記第1の付着位置にハイブリダイズした前記第1の検出可能な標識と前記第2の検出可能な標識を除去し;
    (5)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;
    (6)前記第2の付着位置にハイブリダイズした前記第2の相補的核酸分子の前記第3の検出可能な標識と前記第4の検出可能な標識を同定し;
    (7)前記第2の付着位置にハイブリダイズした前記第3の検出可能な標識と前記第4の検出可能な標識を除去し;
    (8)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;
    (9)前記第3の付着位置にハイブリダイズした前記第3の相補的核酸分子の前記第5の検出可能な標識と前記第6の検出可能な標識を同定し;
    (10)前記シークエンシング用プローブの前記標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の前記少なくとも6個のヌクレオチドの線形な順番を、前記第1の検出可能な標識と、前記第2の検出可能な標識と、前記第3の検出可能な標識と、前記第4の検出可能な標識と、前記第5の検出可能な標識と、前記第6の検出可能な標識の属性に基づいて同定することを含む方法。
  63. 核酸のヌクレオチド配列を求める方法であって、
    (1)請求項1~4のいずれか1項に記載の第1のシークエンシング用プローブを、所定の遺伝子から得られて場合によっては基板に1つ以上の位置で固定化された標的核酸の第1の領域にハイブリダイズさせ;
    (2)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;
    (3)前記第1の付着位置にハイブリダイズした前記第1の相補的核酸分子の前記第1の検出可能な標識と前記第2の検出可能な標識を検出し;
    (4)前記第1の付着位置にハイブリダイズした前記第1の検出可能な標識と前記第2の検出可能な標識を除去し;
    (5)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;
    (6)前記第2の付着位置にハイブリダイズした前記第2の相補的核酸分子の前記第3の検出可能な標識と前記第4の検出可能な標識を検出し;
    (7)前記第2の付着位置にハイブリダイズした前記第3の検出可能な標識と前記第4の検出可能な標識を除去し;
    (8)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;
    (9)前記第3の付着位置にハイブリダイズした前記第3の相補的核酸分子の前記第5の検出可能な標識と前記第6の検出可能な標識を同定し;
    (10)前記第1のシークエンシング用プローブの前記標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第1の領域の中の前記少なくとも6個のヌクレオチドの線形な順番を、前記第1の検出可能な標識と、前記第2の検出可能な標識と、前記第3の検出可能な標識と、前記第4の検出可能な標識と、前記第5の検出可能な標識と、前記第6の検出可能な標識の属性に基づいて同定することを含む方法。
  64. 工程(4)と(5)を順番に、または同時に実施する、請求項62または63に記載の方法。
  65. 前記第1の検出可能な標識と前記第2の検出可能な標識が同じ発光スペクトルを持つか、異なる発光スペクトルを持つ、請求項62または63に記載の方法。
  66. 前記第3の検出可能な標識と前記第4の検出可能な標識が同じ発光スペクトルを持つか、異なる発光スペクトルを持つ、請求項62または63に記載の方法。
  67. 前記第5の検出可能な標識と前記第6の検出可能な標識が同じ発光スペクトルを持つか、異なる発光スペクトルを持つ、請求項62または63に記載の方法。
  68. 前記第1の相補的核酸分子が切断可能なリンカーを含む、請求項62または63に記載の方法。
  69. 前記第2の相補的核酸分子が切断可能なリンカーを含む、請求項62または63に記載の方法。
  70. 前記第3の相補的核酸分子が切断可能なリンカーを含む、請求項62または63に記載の方法。
  71. 前記第1の相補的核酸分子と、前記第2の相補的核酸分子と、前記第3の相補的核酸分子が、それぞれ、切断可能なリンカーを含む、請求項62または63に記載の方法。
  72. 前記切断可能なリンカーが光で切断可能である、請求項68に記載の方法。
  73. 前記第1の相補的核酸分子の除去が、前記第1の相補的核酸分子を光と接触させることを含む、請求項72に記載の方法。
  74. 前記光が、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供される、請求項73に記載の方法。
  75. (11)場合によっては固定化された前記標的核酸の第1の領域から前記少なくとも第1のシークエンシング用プローブを除去し;
    (12)請求項1または2に記載の少なくとも第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された前記標的核酸の第2の領域にハイブリダイズさせ(ここで、前記第1のシークエンシング用プローブと前記少なくとも第2のシークエンシング用プローブの標的結合ドメインは異なっている);
    (13)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;
    (14)前記第1の付着位置にハイブリダイズした前記第1の相補的核酸分子の前記第1の検出可能な標識と前記第2の検出可能な標識を検出し;
    (15)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;
    (16)前記第2の付着位置にハイブリダイズした前記第2の相補的核酸分子の前記第3の検出可能な標識と前記第4の検出可能な標識を検出し;
    (17)前記第2の付着位置にハイブリダイズした前記第3の検出可能な標識と前記第4の検出可能な標識を除去し;
    (18)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、前記バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;
    (19)前記第3の付着位置にハイブリダイズした前記第3の相補的核酸分子の前記第5の検出可能な標識と前記第6の検出可能な標識を同定し;
    (20)前記少なくとも第2のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された前記標的核酸の第2の領域の中の少なくとも6個のヌクレオチドの線形な順番を、前記第1の検出可能な標識と、前記第2の検出可能な標識と、前記第3の検出可能な標識と、前記第4の検出可能な標識と、前記第5の検出可能な標識と、前記第6の検出可能な標識の属性に基づいて同定することをさらに含む、請求項62または63に記載の方法。
  76. 場合によっては固定化された前記標的核酸の前記第1の領域と前記第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、場合によっては固定化された前記標的核酸の配列を同定することを含む、請求項75に記載の方法。
  77. 請求項62~76のいずれか1項に記載の方法を実施するための装置。
  78. 基板と、請求項61に記載のシークエンシング用プローブの集団と、少なくとも1つの捕獲用プローブと、第1の検出可能な標識と少なくとも2つの第2の検出可能な標識を含む少なくとも3個の相補的核酸分子と、利用のための指示とを含むキット。
JP2022136803A 2016-11-21 2022-08-30 化学組成物とそれを利用する方法 Active JP7532458B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201662424887P 2016-11-21 2016-11-21
US62/424,887 2016-11-21
US201762457237P 2017-02-10 2017-02-10
US62/457,237 2017-02-10
US201762536147P 2017-07-24 2017-07-24
US62/536,147 2017-07-24
JP2020115005A JP7137595B2 (ja) 2016-11-21 2020-07-02 化学組成物とそれを利用する方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020115005A Division JP7137595B2 (ja) 2016-11-21 2020-07-02 化学組成物とそれを利用する方法

Publications (2)

Publication Number Publication Date
JP2022174137A true JP2022174137A (ja) 2022-11-22
JP7532458B2 JP7532458B2 (ja) 2024-08-13

Family

ID=60655103

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019527254A Active JP6730525B2 (ja) 2016-11-21 2017-11-21 化学組成物とそれを利用する方法
JP2020115005A Active JP7137595B2 (ja) 2016-11-21 2020-07-02 化学組成物とそれを利用する方法
JP2022136803A Active JP7532458B2 (ja) 2016-11-21 2022-08-30 化学組成物とそれを利用する方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2019527254A Active JP6730525B2 (ja) 2016-11-21 2017-11-21 化学組成物とそれを利用する方法
JP2020115005A Active JP7137595B2 (ja) 2016-11-21 2020-07-02 化学組成物とそれを利用する方法

Country Status (9)

Country Link
US (5) US10415080B2 (ja)
EP (1) EP3541957A1 (ja)
JP (3) JP6730525B2 (ja)
KR (4) KR102476709B1 (ja)
CN (2) CN110225980B (ja)
AU (3) AU2017361521B2 (ja)
CA (1) CA3043489A1 (ja)
SG (1) SG10202100951SA (ja)
WO (1) WO2018094385A1 (ja)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
EP4328322A3 (en) 2014-07-30 2024-05-22 President and Fellows of Harvard College Probe library construction
KR102105236B1 (ko) * 2014-11-21 2020-04-28 나노스트링 테크놀로지스, 인크. 무효소 및 무증폭 시퀀싱
EP4321627A3 (en) 2015-04-10 2024-04-17 10x Genomics Sweden AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
ES2975361T3 (es) 2015-07-17 2024-07-04 Nanostring Technologies Inc Cuantificación simultánea de una pluralidad de proteínas en una región definida por el usuario de un tejido seccionado transversalmente
CA2992492A1 (en) 2015-07-17 2017-01-26 Nanostring Technologies, Inc. Simultaneous quantification of gene expression in a user-defined region of a cross-sectioned tissue
CN116200465A (zh) 2016-04-25 2023-06-02 哈佛学院董事及会员团体 用于原位分子检测的杂交链反应方法
CN109563539A (zh) 2016-06-15 2019-04-02 慕尼黑路德维希马克西米利安斯大学 使用dna纳米技术的单分子检测或定量
WO2017222453A1 (en) 2016-06-21 2017-12-28 Hauling Thomas Nucleic acid sequencing
CN110225980B (zh) 2016-11-21 2023-01-06 纳米线科技公司 化学组合物及其使用方法
EP3551765A4 (en) 2016-12-09 2020-11-11 Ultivue, Inc. IMPROVED METHODS FOR MULTIPLEX IMAGING USING LABELED NUCLEIC ACID CONTRAST AGENTS
WO2018218150A1 (en) 2017-05-26 2018-11-29 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening
CA3078158A1 (en) 2017-10-06 2019-04-11 Cartana Ab Rna templated ligation
CN112154216A (zh) 2018-02-12 2020-12-29 纳米线科技公司 生物分子探针以及检测基因和蛋白表达的方法
CN112703255A (zh) 2018-05-14 2021-04-23 纳米线科技公司 化学组合物及其使用方法
WO2020076976A1 (en) 2018-10-10 2020-04-16 Readcoor, Inc. Three-dimensional spatial molecular indexing
US20220064630A1 (en) 2018-12-10 2022-03-03 10X Genomics, Inc. Resolving spatial arrays using deconvolution
WO2020123742A1 (en) * 2018-12-13 2020-06-18 President And Fellows Of Harvard College Amplification methods and systems for merfish and other applications
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
CN113906147B (zh) * 2019-05-31 2024-09-13 10X基因组学有限公司 检测目标核酸分子的方法
EP3754028A1 (en) 2019-06-18 2020-12-23 Apollo Life Sciences GmbH Method of signal encoding of analytes in a sample
WO2020254672A1 (en) 2019-06-19 2020-12-24 Therycell Gmbh Spatial characterisation of target structures in a sample
WO2021092433A2 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Enhancing specificity of analyte binding
US20210190770A1 (en) 2019-12-23 2021-06-24 10X Genomics, Inc. Compositions and methods for using fixed biological samples in partition-based assays
ES2982420T3 (es) 2019-12-23 2024-10-16 10X Genomics Inc Métodos para el análisis espacial mediante el uso de la ligazón con plantilla de ARN
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US12076701B2 (en) 2020-01-31 2024-09-03 10X Genomics, Inc. Capturing oligonucleotides in spatial transcriptomics
US12110541B2 (en) 2020-02-03 2024-10-08 10X Genomics, Inc. Methods for preparing high-resolution spatial arrays
US12110548B2 (en) 2020-02-03 2024-10-08 10X Genomics, Inc. Bi-directional in situ analysis
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
CN115916999A (zh) 2020-04-22 2023-04-04 10X基因组学有限公司 用于使用靶向rna耗竭进行空间分析的方法
AU2021275906A1 (en) 2020-05-22 2022-12-22 10X Genomics, Inc. Spatial analysis to detect sequence variants
EP4153775B1 (en) 2020-05-22 2024-07-24 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
US12031177B1 (en) 2020-06-04 2024-07-09 10X Genomics, Inc. Methods of enhancing spatial resolution of transcripts
EP4421186A3 (en) 2020-06-08 2024-09-18 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US12071667B2 (en) 2020-11-04 2024-08-27 10X Genomics, Inc. Sequence analysis using meta-stable nucleic acid molecules
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
US12060603B2 (en) 2021-01-19 2024-08-13 10X Genomics, Inc. Methods for internally controlled in situ assays using padlock probes
US20240255497A1 (en) * 2021-05-19 2024-08-01 Leica Microsystems Cms Gmbh Method for analyzing a biological sample or a chemical compound or a chemical element
EP4092414A1 (en) * 2021-05-19 2022-11-23 Leica Microsystems CMS GmbH Connector, marker and method for analysing biological samples
EP4347874A1 (en) * 2021-05-24 2024-04-10 California Institute of Technology Linked amplification tethered with exponential radiance
WO2022256503A1 (en) 2021-06-03 2022-12-08 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
EP4216220A1 (en) * 2022-01-25 2023-07-26 Leica Microsystems CMS GmbH Data storage device and method for storing data
WO2023235836A2 (en) * 2022-06-03 2023-12-07 Nanostring Technologies, Inc. Spatial biology informatics integration portal with programmable machine learning pipeline orchestrator
US12116626B2 (en) 2022-08-16 2024-10-15 10X Genomics, Inc. AP50 polymerases and uses thereof
WO2024041749A1 (en) * 2022-08-23 2024-02-29 Leica Microsystems Cms Gmbh Sequencing scaffold and method
WO2024196728A2 (en) 2023-03-17 2024-09-26 Nanostring Technologies, Inc. Nucleic acid probes for combined sequencing and spatial analysis
WO2024196764A2 (en) 2023-03-17 2024-09-26 Nanostring Technologies, Inc. Assay for recombinase accessible chromatin and related compositions and methods
EP4450971A1 (en) * 2023-04-21 2024-10-23 Leica Microsystems CMS GmbH Marker for analysing a biological sample

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531908A (ja) * 2011-10-14 2014-12-04 プレジデント アンド フェローズ オブ ハーバード カレッジ 構造アッセンブリによる配列決定
WO2016081740A1 (en) * 2014-11-21 2016-05-26 Nanostring Technologies, Inc. Enzyme- and amplification-free sequencing
JP2020500514A (ja) * 2016-11-21 2020-01-16 ナノストリング テクノロジーズ,インコーポレイティド 化学組成物とそれを利用する方法

Family Cites Families (280)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US327876A (en) * 1885-10-06 Automatic fire-extinguishing apparatus
US4230558A (en) 1978-10-02 1980-10-28 Coulter Electronics, Inc. Single drop separator
US4318846A (en) 1979-09-07 1982-03-09 Syva Company Novel ether substituted fluorescein polyamino acid compounds as fluorescers and quenchers
US4994373A (en) 1983-01-27 1991-02-19 Enzo Biochem, Inc. Method and structures employing chemically-labelled polynucleotide probes
US4757141A (en) 1985-08-26 1988-07-12 Applied Biosystems, Incorporated Amino-derivatized phosphite and phosphate linking agents, phosphoramidite precursors, and useful conjugates thereof
US5985549A (en) 1985-10-22 1999-11-16 University Of Massachusetts Non-isotopic in-situ hybridization method for detection of nucleic acids
US5091519A (en) 1986-05-01 1992-02-25 Amoco Corporation Nucleotide compositions with linking groups
US4811218A (en) 1986-06-02 1989-03-07 Applied Biosystems, Inc. Real time scanning electrophoresis apparatus for DNA sequencing
US5151507A (en) 1986-07-02 1992-09-29 E. I. Du Pont De Nemours And Company Alkynylamino-nucleotides
US5066580A (en) 1988-08-31 1991-11-19 Becton Dickinson And Company Xanthene dyes that emit to the red of fluorescein
US6242184B1 (en) 1988-10-18 2001-06-05 University Of Massachusetts In-situ hybridization of single-copy and multiple-copy nucleic acid sequences
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US5366860A (en) 1989-09-29 1994-11-22 Applied Biosystems, Inc. Spectrally resolvable rhodamine dyes for nucleic acid sequence determination
US5188934A (en) 1989-11-14 1993-02-23 Applied Biosystems, Inc. 4,7-dichlorofluorescein dyes as molecular probes
US5849481A (en) 1990-07-27 1998-12-15 Chiron Corporation Nucleic acid hybridization assays employing large comb-type branched polynucleotides
US5491224A (en) 1990-09-20 1996-02-13 Bittner; Michael L. Direct label transaminated DNA probe compositions for chromosome identification and methods for their manufacture
US6277569B1 (en) 1990-09-20 2001-08-21 Vysis, Inc. Methods for multiple direct label probe detection of multiple chromosomes or regions thereof by in situ hybridization
US6140496A (en) 1990-10-09 2000-10-31 Benner; Steven Albert Precursors for deoxyribonucleotides containing non-standard nucleosides
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US6037120A (en) 1995-10-12 2000-03-14 Benner; Steven Albert Recognition of oligonucleotides containing non-standard base pairs
US5320814A (en) 1991-01-25 1994-06-14 Trustees Of Tufts College Fiber optic array sensors, apparatus, and methods for concurrently visualizing and chemically detecting multiple analytes of interest in a fluid sample
CA2129105A1 (en) 1992-02-12 1993-08-19 Michael J. Conrad Applications of fluorescent n-nucleosides and fluorescent structural analogs of n-nucleosides
AU4292893A (en) 1992-04-21 1993-11-18 Regents Of The University Of California, The Multicolor in situ hybridization methods for genetic testing
US5386024A (en) 1993-02-10 1995-01-31 Gen-Probe Incorporated Method to prepare nucleic acids from a biological sample using low pH and acid protease
US5543838A (en) 1993-08-31 1996-08-06 Xerox Corporation Signal multiplexing system for an image sensor array
US5681697A (en) 1993-12-08 1997-10-28 Chiron Corporation Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor
US5654419A (en) 1994-02-01 1997-08-05 The Regents Of The University Of California Fluorescent labels and their use in separations
US5783387A (en) 1995-02-06 1998-07-21 The Regents Of The University Of California Method for identifying and quantifying nucleic acid sequence aberrations
US5780227A (en) 1995-06-07 1998-07-14 Sheridan; Patrick J. Oligonucleotide probe conjugated to a purified hydrophilic alkaline phosphatase and uses thereof
US5945515A (en) 1995-07-31 1999-08-31 Chomczynski; Piotr Product and process for isolating DNA, RNA and proteins
AU6898296A (en) 1995-08-14 1997-03-12 Ely Michael Rabani Methods and devices for parallel multiplex polynucleotide sequencing
US5981180A (en) 1995-10-11 1999-11-09 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and methods
EP0852004B1 (en) 1995-10-11 2011-01-19 Luminex Corporation Multiplexed analysis of clinical specimens
US6007994A (en) 1995-12-22 1999-12-28 Yale University Multiparametric fluorescence in situ hybridization
US7144119B2 (en) 1996-04-25 2006-12-05 Bioarray Solutions Ltd. System and method for programmable illumination pattern generation
US6387707B1 (en) 1996-04-25 2002-05-14 Bioarray Solutions Array Cytometry
US5800996A (en) 1996-05-03 1998-09-01 The Perkin Elmer Corporation Energy transfer dyes with enchanced fluorescence
US5847162A (en) 1996-06-27 1998-12-08 The Perkin Elmer Corporation 4, 7-Dichlororhodamine dyes
US6750016B2 (en) 1996-07-29 2004-06-15 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US6449562B1 (en) 1996-10-10 2002-09-10 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and method
US5853993A (en) 1996-10-21 1998-12-29 Hewlett-Packard Company Signal enhancement method and kit
US20020034737A1 (en) 1997-03-04 2002-03-21 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
US6027945A (en) 1997-01-21 2000-02-22 Promega Corporation Methods of isolating biological target materials using silica magnetic particles
JP4209471B2 (ja) 1997-02-20 2009-01-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア プラズモン共鳴粒子、方法、および装置
US5888778A (en) 1997-06-16 1999-03-30 Exact Laboratories, Inc. High-throughput screening method for identification of genetic mutations or disease-causing microorganisms using segmented primers
US20050037397A1 (en) 2001-03-28 2005-02-17 Nanosphere, Inc. Bio-barcode based detection of target analytes
US7348181B2 (en) 1997-10-06 2008-03-25 Trustees Of Tufts College Self-encoding sensor with microspheres
US7115884B1 (en) 1997-10-06 2006-10-03 Trustees Of Tufts College Self-encoding fiber optic sensor
HUP0003986A3 (en) 1997-10-14 2001-04-28 Luminex Corp Austin Precision fluorescently dyed particles and methods of making and using same
US6322901B1 (en) 1997-11-13 2001-11-27 Massachusetts Institute Of Technology Highly luminescent color-selective nano-crystalline materials
US6207392B1 (en) 1997-11-25 2001-03-27 The Regents Of The University Of California Semiconductor nanocrystal probes for biological applications and process for making and using such probes
US5990479A (en) 1997-11-25 1999-11-23 Regents Of The University Of California Organo Luminescent semiconductor nanocrystal probes for biological applications and process for making and using such probes
US6238869B1 (en) 1997-12-19 2001-05-29 High Throughput Genomics, Inc. High throughput assay system
US6673914B1 (en) 1998-01-22 2004-01-06 John Wayne Cancer Institute Human tumor-associated gene
WO1999041613A1 (en) 1998-02-12 1999-08-19 Immunivest Methods and reagents for the rapid and efficient isolation of circulating cancer cells
US6225285B1 (en) 1998-03-11 2001-05-01 Exelixis Pharmaceuticals, Inc. Semaphorin K1
US7060431B2 (en) 1998-06-24 2006-06-13 Illumina, Inc. Method of making and decoding of array sensors with microspheres
US6306643B1 (en) 1998-08-24 2001-10-23 Affymetrix, Inc. Methods of using an array of pooled probes in genetic analysis
US6251303B1 (en) 1998-09-18 2001-06-26 Massachusetts Institute Of Technology Water-soluble fluorescent nanocrystals
US6426513B1 (en) 1998-09-18 2002-07-30 Massachusetts Institute Of Technology Water-soluble thiol-capped nanocrystals
EP2306195A3 (en) 1998-09-18 2012-04-25 Massachusetts Institute of Technology Biological applications of semiconductor nanocrystals
US7079241B2 (en) 2000-04-06 2006-07-18 Invitrogen Corp. Spatial positioning of spectrally labeled beads
US6465193B2 (en) 1998-12-11 2002-10-15 The Regents Of The University Of California Targeted molecular bar codes and methods for using the same
US6429027B1 (en) 1998-12-28 2002-08-06 Illumina, Inc. Composite arrays utilizing microspheres
US7270951B1 (en) 1999-03-10 2007-09-18 Asm Scientific, Inc. Method for direct nucleic acid sequencing
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
WO2000057701A1 (en) 1999-03-31 2000-10-05 United Therapeutics Corporation Prostaglandin compounds, compositions and methods of treating peripheral vascular disease and pulmonary hypertension
KR20020007359A (ko) 1999-04-08 2002-01-26 추후제출 프라이머 쌍들의 증폭 및 시퀀싱 및 그 이용
US6908737B2 (en) 1999-04-15 2005-06-21 Vitra Bioscience, Inc. Systems and methods of conducting multiplexed experiments
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6534266B1 (en) 1999-04-22 2003-03-18 Albert Einstein College Of Medicine Of Yeshiva University Assay of transcription sites by multi-fluor fish
JP2002544488A (ja) 1999-05-07 2002-12-24 クアンタム ドット コーポレイション 半導体ナノクリスタルを用いて分析物を検出する方法
US20020051971A1 (en) 1999-05-21 2002-05-02 John R. Stuelpnagel Use of microfluidic systems in the detection of target analytes using microsphere arrays
US6316200B1 (en) 2000-06-08 2001-11-13 Becton, Dickinson And Company Probes and methods for detection of nucleic acids
AU5764500A (en) 1999-06-25 2001-01-31 Motorola, Inc. Novel methods and products for arrayed microsphere analysis
CA2382436C (en) 1999-08-30 2011-05-17 Illumina, Inc. Methods for improving signal detection from an array
US6379888B1 (en) 1999-09-27 2002-04-30 Becton, Dickinson And Company Universal probes and methods for detection of nucleic acids
US6428957B1 (en) 1999-11-08 2002-08-06 Agilent Technologies, Inc. Systems tools and methods of assaying biological materials using spatially-addressable arrays
US6727356B1 (en) 1999-12-08 2004-04-27 Epoch Pharmaceuticals, Inc. Fluorescent quenching detection reagents and methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
AU3976001A (en) 2000-02-10 2001-08-20 Illumina Inc Alternative substrates and formats for bead-based array of arrays<sup>TM</sup>
DE60136335D1 (de) 2000-02-16 2008-12-11 Illumina Inc Parallele genotypisierung mehrerer patientenproben
US20020028457A1 (en) 2000-02-16 2002-03-07 Quantum Dot Corporation Single target counting assays using semiconductor nanocrystals
CN1416365A (zh) 2000-02-22 2003-05-07 基因谱公司 微阵列制造技术及设备
US20030186426A1 (en) 2000-03-15 2003-10-02 The Regents Of The University Of California Multichannel flow cell for interacting single optically trapped, DNA molecules with different chemical species
JP2004523201A (ja) 2000-05-16 2004-08-05 ザ チルドレンズ マーシー ホスピタル シングルコピーゲノムのハイブリダイゼーションプローブおよびその作製方法
EP1287165B1 (en) 2000-06-02 2007-06-13 Bayer Corporation Method for detection and localization of genes in situ using branched-DNA hybridisation
US7763421B2 (en) 2000-06-05 2010-07-27 Ventana Medical Systems, Inc. Methods for producing nucleic acid hybridization probes that amplify hybridization signal by promoting network formation
US20020034827A1 (en) 2000-08-01 2002-03-21 Rajendra Singh Methods for solid phase nanoextraction and desorption
US6649138B2 (en) 2000-10-13 2003-11-18 Quantum Dot Corporation Surface-modified semiconductive and metallic nanoparticles having enhanced dispersibility in aqueous media
US6777244B2 (en) 2000-12-06 2004-08-17 Hrl Laboratories, Llc Compact sensor using microcavity structures
US6576291B2 (en) 2000-12-08 2003-06-10 Massachusetts Institute Of Technology Preparation of nanocrystallites
US6803200B2 (en) 2000-12-12 2004-10-12 Invitrogen Corporation Compositions and methods for the release of nucleic acid molecules from solid matrices
EP2801624B1 (en) 2001-03-16 2019-03-06 Singular Bio, Inc Arrays and methods of use
JP2005505749A (ja) 2001-05-21 2005-02-24 アクララ バイオサイエンシーズ, インコーポレイテッド タンパク質を分析するための方法および組成物
US20040161741A1 (en) 2001-06-30 2004-08-19 Elazar Rabani Novel compositions and processes for analyte detection, quantification and amplification
US7473767B2 (en) 2001-07-03 2009-01-06 The Institute For Systems Biology Methods for detection and quantification of analytes in complex mixtures
CA2453450A1 (en) 2001-07-20 2003-11-06 Quantum Dot Corporation Luminescent nanoparticles and methods for their preparation
US7189509B2 (en) 2001-08-16 2007-03-13 Zhifeng Shao Analysis of gene expression profiles using sequential hybridization
US7863012B2 (en) 2004-02-17 2011-01-04 Veridex, Llc Analysis of circulating tumor cells, fragments, and debris
ATE401574T1 (de) 2001-08-23 2008-08-15 Immunivest Corp Analyse zirkulierender tumorzellen, fragmente und trümmer
ES2329986T3 (es) 2001-09-06 2009-12-03 Rapid Micro Biosystems Inc Deteccion rapida de celulas en replicacion.
US20030148335A1 (en) 2001-10-10 2003-08-07 Li Shen Detecting targets by unique identifier nucleotide tags
US20110151438A9 (en) * 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
US7057026B2 (en) * 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
AU2002351276A1 (en) * 2001-12-10 2003-07-09 James O. Bowlby Jr. Tsunami chain reaction - geometric dna amplification
US20040229294A1 (en) 2002-05-21 2004-11-18 Po-Ying Chan-Hui ErbB surface receptor complexes as biomarkers
US7164533B2 (en) 2003-01-22 2007-01-16 Cyvera Corporation Hybrid random bead/chip based microarray
US8394944B2 (en) 2002-09-20 2013-03-12 Siemens Healthcare Diagnostics Inc. Dual-purpose primers and probes for providing enhanced hybridization assays by disruption of secondary structure formation
US20090246879A1 (en) 2002-12-20 2009-10-01 Callida Genomics Materials and Methods Relating to Nano-Tags and Nano-Brands
JP4761202B2 (ja) 2003-01-31 2011-08-31 学校法人慶應義塾 切断可能な対応付け分子およびそれを用いるスクリーニング方法
JP4283578B2 (ja) 2003-03-31 2009-06-24 学校法人片柳学園 不一致増幅物質を含むプローブ核酸を用いる標的配列の検出方法、プローブ核酸および標的配列検出用アッセイキット
ATE418621T1 (de) 2003-04-24 2009-01-15 Afshin Ahmadian Verfahren zur detektion allelspezifischer mutationen
US7385043B1 (en) 2003-04-30 2008-06-10 The Public Health Research Institute Of The City Of New York, Inc. Homogeneous multiplex screening assays and kits
US7250371B2 (en) 2003-08-26 2007-07-31 Lam Research Corporation Reduction of feature critical dimensions
US20050048498A1 (en) 2003-08-29 2005-03-03 Applera Corporation Compositions, methods, and kits for assembling probes
US20050064435A1 (en) 2003-09-24 2005-03-24 Xing Su Programmable molecular barcodes
US7402399B2 (en) 2003-10-14 2008-07-22 Monogram Biosciences, Inc. Receptor tyrosine kinase signaling pathway analysis for diagnosis and therapy
US8173785B2 (en) 2003-11-26 2012-05-08 Advandx, Inc. Peptide nucleic acid probes for analysis of certain Staphylococcus species
US7381529B2 (en) 2003-12-31 2008-06-03 Intel Corporation Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes
EP2806035B1 (en) * 2004-02-18 2017-09-13 Chromocell Corporation Methods and materials using signaling probes
US7462475B2 (en) 2004-05-20 2008-12-09 Dna Poleymerase Technology, Inc. Use of whole blood in PCR reactions
CN102680440A (zh) 2004-06-07 2012-09-19 先锋生物科技股份有限公司 用于微流体器件的光学透镜系统和方法
US20070154889A1 (en) 2004-06-25 2007-07-05 Veridex, Llc Methods and reagents for the detection of melanoma
EP1766089A1 (en) 2004-06-30 2007-03-28 Applera Corporation Analog probe complexes
WO2006031745A2 (en) 2004-09-10 2006-03-23 Sequenom, Inc. Methods for long-range sequence analysis of nucleic acids
DE602005018316D1 (de) 2004-10-08 2010-01-28 Sysmex Corp Verfahren zum Nachweis einer Zielsubstanz unter Verwendung einer Nukleinsäuresonde
JP4839051B2 (ja) 2004-10-08 2011-12-14 シスメックス株式会社 核酸プローブを用いる被検物質の検出方法
US7829278B2 (en) 2004-10-28 2010-11-09 Board Of Trustees Of The University Of Illinois Polynucleotide barcoding
US20060134917A1 (en) 2004-12-16 2006-06-22 Lam Research Corporation Reduction of etch mask feature critical dimensions
US8063196B2 (en) 2005-02-01 2011-11-22 Siemens Healthcare Diagnostics Inc. Highly orthogonal universal sequences for use in nucleic acid assays
EP2272983A1 (en) * 2005-02-01 2011-01-12 AB Advanced Genetic Analysis Corporation Reagents, methods and libraries for bead-based sequencing
US7524631B2 (en) 2005-02-02 2009-04-28 Patterson Bruce K HPV E6, E7 mRNA assay and methods of use thereof
CA2606723A1 (en) 2005-05-09 2006-11-16 Panomics, Inc. Multiplex capture of nucleic acids
US7803541B2 (en) 2005-05-12 2010-09-28 Panomics, Inc. Multiplex branched-chain DNA assays
US20070048759A1 (en) 2005-06-10 2007-03-01 Dan Luo Detection of target molecules with labeled nucleic acid detection molecules
US7842793B2 (en) 2005-06-14 2010-11-30 The California Institute Of Technology Methods of making nucleic acid nanostructures
EP3042963A1 (en) 2005-06-20 2016-07-13 Advanced Cell Diagnostics, Inc. Methods of detecting nucleic acids in individual cells and of identifying rare cells from large heterogeneous cell populations
DE602006020577D1 (de) 2005-07-01 2011-04-21 Dako Denmark As Monomere und polymere linker zur konjugierung von biologischen molekülen und anderen stoffen
WO2007044427A2 (en) 2005-10-05 2007-04-19 Panomics, Inc. Detection of nucleic acids from whole blood
ATE553211T1 (de) 2005-11-10 2012-04-15 Affymetrix Inc Nachweis von nukleinsäuren über amplifikation von stellvertreternukleinsäuren
US20090299640A1 (en) 2005-11-23 2009-12-03 University Of Utah Research Foundation Methods and Compositions Involving Intrinsic Genes
WO2007070869A2 (en) 2005-12-16 2007-06-21 Applera Corporation Method and system for phase-locked sequencing
CA2640385C (en) 2005-12-23 2014-07-15 Nanostring Technologies, Inc. Nanoreporters and methods of manufacturing and use thereof
CA2635215C (en) 2005-12-23 2016-08-30 Nanostring Technologies, Inc. Compositions comprising oriented, immobilized macromolecules and methods for their preparation
EP1994180A4 (en) 2006-02-24 2009-11-25 Callida Genomics Inc GENOME SEQUENCING ON DNA ARRAYS WITH HIGH THROUGHPUT
JP2009538123A (ja) 2006-04-19 2009-11-05 アプライド バイオシステムズ, エルエルシー ゲル非含有ビーズベースの配列決定のための試薬、方法およびライブラリー
US7941279B2 (en) 2006-05-22 2011-05-10 Nanostring Technologies, Inc. Systems and methods for analyzing nanoreporters
US7745129B1 (en) 2006-07-12 2010-06-29 Kenneth David Schatz Methods for sequencing of a necleic acid
JP2008043332A (ja) 2006-08-17 2008-02-28 Panomics Inc 組織スライドからの核酸定量
US8055034B2 (en) 2006-09-13 2011-11-08 Fluidigm Corporation Methods and systems for image processing of microfluidic devices
WO2008039998A2 (en) 2006-09-28 2008-04-03 President And Fellows Of Harvard College Methods for sequencing dna
US7629125B2 (en) 2006-11-16 2009-12-08 General Electric Company Sequential analysis of biological samples
GB2457402B (en) 2006-12-01 2011-10-19 Univ Columbia Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
WO2008069884A2 (en) 2006-12-01 2008-06-12 Panomics, Inc. Two-stage nucleic acid amplification using an amplification oligomer
AU2008237018B2 (en) 2007-04-10 2014-04-03 Bruker Spatial Biology, Inc. Methods and computer systems for identifying target-specific sequences for use in nanoreporters
DK2036989T3 (da) 2007-09-12 2012-10-22 Pasteur Institut Polynukleotid, der er egnet til enkeltcellebaseret reporterassay tilovervågning af genekspressionsmønstre med høj spatiotemporalopløsning
US20090191553A1 (en) 2007-10-01 2009-07-30 Applied Biosystems Inc. Chase Ligation Sequencing
JP2010539991A (ja) 2007-10-04 2010-12-24 ハルシオン モレキュラー 電子顕微鏡を用いた核酸ポリマーの配列決定
WO2009048530A2 (en) 2007-10-05 2009-04-16 Panomics, Inc. Highly multiplexed particle-based assays
CA2707901C (en) 2007-12-05 2015-09-15 Complete Genomics, Inc. Efficient base determination in sequencing reactions
CN101586150B (zh) 2008-05-23 2016-09-28 陕西佰美基因股份有限公司 检测探针、通用寡核苷酸芯片及核酸检测方法及其用途
US20090298709A1 (en) 2008-05-28 2009-12-03 Affymetrix, Inc. Assays for determining telomere length and repeated sequence copy number
ES2457534T3 (es) 2008-05-30 2014-04-28 The University Of North Carolina At Chapel Hill Perfiles de expresión génica para predecir desenlaces en cáncer de mama
GB2461026B (en) 2008-06-16 2011-03-09 Plc Diagnostics Inc System and method for nucleic acids sequencing by phased synthesis
JP5836803B2 (ja) 2008-08-14 2015-12-24 ナノストリング テクノロジーズ, インコーポレイテッド 安定したナノレポーター
US8309306B2 (en) 2008-11-12 2012-11-13 Nodality, Inc. Detection composition
EP2358897B1 (en) 2008-11-17 2015-02-25 Headway Technologies, Inc. Methods and compositions in particle-based detection of target molecules using linking molecules
US8715926B2 (en) 2008-11-24 2014-05-06 Loma Linda University Biomarkers for the detection of head and neck tumors
EP2367959B1 (en) 2008-12-18 2016-12-07 Siemens Healthcare Diagnostics Inc. Methods for shortening incubation times in hybridization assays
EP3150724A1 (en) 2008-12-19 2017-04-05 President and Fellows of Harvard College Particle-assisted nucleic acid sequencing
WO2010081114A2 (en) 2009-01-12 2010-07-15 20/20 Genesystems, Inc. Oligonucleotide-coated affinity membranes and uses thereof
US8404444B2 (en) 2009-02-25 2013-03-26 Diacarta Llc Method for predicting the level of damage to cells by measuring free circulating Alu nucleic acid
KR101829182B1 (ko) 2009-04-02 2018-03-29 플루이다임 코포레이션 표적 핵산의 바코딩을 위한 멀티 프라이머 증폭 방법
WO2011032040A1 (en) 2009-09-10 2011-03-17 Centrillion Technology Holding Corporation Methods of targeted sequencing
US20130023433A1 (en) 2009-09-28 2013-01-24 Yuling Luo Methods of detecting nucleic acid sequences with high specificity
JP5954876B2 (ja) 2009-10-13 2016-07-20 ナノストリング テクノロジーズ, インコーポレイテッド ナノレポーターによるタンパク質の検出
US8501490B2 (en) 2010-01-08 2013-08-06 The Regents Of The University Of California Bioassays based on polymeric sequence probe
US20130171621A1 (en) 2010-01-29 2013-07-04 Advanced Cell Diagnostics Inc. Methods of in situ detection of nucleic acids
WO2011100541A2 (en) 2010-02-11 2011-08-18 Nanostring Technologies, Inc. Compositions and methods for the detection of small rnas
US20130065780A1 (en) 2010-02-15 2013-03-14 North Carolina State University Office Of Technology Transfer Label-Free Multiplexing Bioassays Using Fluorescent Conjugated Polymers and Barcoded Nanoparticles
CA2787487C (en) 2010-02-26 2018-07-24 Ventana Medical Systems, Inc. Polytag probes
EP2547795B1 (en) 2010-03-16 2015-01-14 Nanostring Technologies, Inc Compositions and methods for the detection of genomic features
WO2011153354A1 (en) 2010-06-03 2011-12-08 Cellay, Inc. Methods and kits for in situ detection of nucleotide sequences
WO2011156432A2 (en) 2010-06-07 2011-12-15 Firefly Bioworks, Inc. Scanning multifunctional particles
US20120052498A1 (en) 2010-07-01 2012-03-01 Affymetrix, Inc. Detection of Nucleic Acids
US20120003648A1 (en) 2010-07-01 2012-01-05 Affymetrix, Inc. Signal Multiplexing and Signal Amplification
US20120004132A1 (en) 2010-07-02 2012-01-05 Affymetrix, Inc. Detection of Nucleic Acids and Proteins
ES2652600T3 (es) 2010-07-07 2018-02-05 The Regents Of The University Of Michigan Diagnóstico y tratamiento de cáncer de mama
WO2012040168A2 (en) 2010-09-20 2012-03-29 Advanced Cell Diagnostics, Inc. Biomarkers for differentiating melanoma from benign nevus in the skin
CN102445964A (zh) 2010-10-06 2012-05-09 鸿富锦精密工业(深圳)有限公司 电脑机箱及其硬盘模组
DK2625320T3 (da) 2010-10-08 2019-07-01 Harvard College High-throughput enkeltcellestregkodning
WO2012049316A1 (en) 2010-10-15 2012-04-19 Olink Ab Dynamic range methods
CN107365847A (zh) 2010-10-21 2017-11-21 领先细胞医疗诊断有限公司 用于原位检测核酸的超灵敏方法
WO2012058638A2 (en) 2010-10-29 2012-05-03 President And Fellows Of Harvard College Nucleic acid nanostructure barcode probes
US8865404B2 (en) 2010-11-05 2014-10-21 President And Fellows Of Harvard College Methods for sequencing nucleic acid molecules
JP5998148B2 (ja) 2010-11-16 2016-09-28 ナブシス 2.0 エルエルシー ハイブリダイズされたプローブの相対位置を検出することによる生体分子のシークエンシングのための方法
US20120172246A1 (en) 2010-12-31 2012-07-05 Affymetrix, Inc. Detection of Nucleic Acids
US20120178081A1 (en) 2010-12-31 2012-07-12 Affymetrix. Inc. Methods of Labeling Cells, Labeled Cells, and uses Thereof
US20120214152A1 (en) 2011-01-28 2012-08-23 Xiao-Jun Ma Rnascope® hpv assay for determining hpv status in head and neck cancers and cervical lesions
US20120295801A1 (en) 2011-02-17 2012-11-22 President And Fellows Of Harvard College High-Throughput In Situ Hybridization
AU2012229123B2 (en) 2011-03-15 2017-02-02 British Columbia Cancer Agency Branch Methods of treating breast cancer with anthracycline therapy
US9758834B2 (en) 2011-03-28 2017-09-12 Nanostring Technologies, Inc. Compositions and methods for diagnosing cancer
EP2705161A1 (de) 2011-05-04 2014-03-12 Genovoxx GmbH Nukleosid-triphosphat-konjugate und methoden zu deren anwendung
CN108342453A (zh) 2011-05-09 2018-07-31 富鲁达公司 基于探针的核酸检测
WO2012157684A1 (ja) 2011-05-16 2012-11-22 地方独立行政法人 大阪府立病院機構 血中dnaの定量的検出による悪性新生物の病勢の進行を評価する方法
JP6144623B2 (ja) 2011-06-16 2017-06-07 日鉄住金環境株式会社 核酸測定用の核酸プローブ
US20130017971A1 (en) 2011-06-24 2013-01-17 Nanostring Technologies, Inc. Multivariate Diagnostic Assays and Methods for Using Same
WO2013006495A2 (en) 2011-07-01 2013-01-10 Dana-Farber Cancer Institute, Inc. Methods of predicting prognosis in cancer
ITPD20110324A1 (it) 2011-10-12 2013-04-13 Innovation Factory S C A R L Metodo per la rilevazione di galfa15 come marcatore tumorale nel carcinoma pancreatico
WO2013071247A1 (en) 2011-11-10 2013-05-16 The United States Of America, As Represented By The Secretary, Department Of Health And Human Servic Gene expression signatures of neoplasm responsiveness to theraphy
EP2785873A4 (en) 2011-11-30 2015-11-11 Univ North Carolina METHOD FOR THE TREATMENT OF BREAST CANCER WITH TAXAN THERAPY
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
EP4108782B1 (en) 2011-12-22 2023-06-07 President and Fellows of Harvard College Compositions and methods for analyte detection
US10385392B2 (en) 2011-12-30 2019-08-20 Abbott Molecular Inc. Nucleic acid hybridization probes
US9096902B2 (en) 2012-03-22 2015-08-04 The Regents Of The University Of California Genetic barcodes
US20140178869A1 (en) 2012-04-05 2014-06-26 Advanced Cell Diagnostics, Inc. Detection of immunoglobulin light chain restriction by rna in situ hybridization
EP2852689B1 (en) 2012-05-22 2019-12-11 Nanostring Technologies, Inc. Nano46 genes and methods to predict breast cancer outcome
US9914967B2 (en) 2012-06-05 2018-03-13 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using DNA origami probes
CA2877378A1 (en) 2012-06-29 2014-01-03 Nanostring Technologies, Inc. Methods of treating breast cancer with gemcitabine therapy
US9347106B2 (en) 2012-07-18 2016-05-24 The Regents Of The University Of California Multiplex assay for the detection of citrus pathogens
US20140120083A1 (en) 2012-11-01 2014-05-01 Infinity Pharmaceuticals, Inc. Treatment of cancers using pi3 kinase isoform modulators
US20150283142A1 (en) 2013-03-15 2015-10-08 Infinity Pharmaceuticals, Inc. Treatment of cancers using pi3 kinase isoform modulators
US20140154681A1 (en) 2012-11-12 2014-06-05 Nanostring Technologies, Inc. Methods to Predict Breast Cancer Outcome
EP2971184B1 (en) 2013-03-12 2019-04-17 President and Fellows of Harvard College Method of generating a three-dimensional nucleic acid containing matrix
CN105142641A (zh) 2013-03-12 2015-12-09 广州源生医药科技有限公司 用于治疗癌症的化合物
AU2014236305B2 (en) 2013-03-14 2019-01-17 Ethris Gmbh CFTR mRNA compositions and related methods and uses
EP2970892A1 (en) 2013-03-15 2016-01-20 The Jackson Laboratory Isolation of non-embryonic stem cells and uses thereof
EP2978863B1 (en) 2013-03-28 2021-03-10 Advanced Cell Diagnostics, Inc. Differentiation between transient and persistent high risk hpv infection by in situ hybridization
KR102368591B1 (ko) 2013-04-30 2022-02-25 캘리포니아 인스티튜트 오브 테크놀로지 순차적 하이브리드화 바코딩에 의한 분자의 멀티플렉스 표지화
WO2014182598A1 (en) 2013-05-06 2014-11-13 Physicians Choice Laboratory Services, Llc Diagnostic assay combining cellular and cell free nucleic acid
ES2751454T3 (es) 2013-05-17 2020-03-31 Siemens Healthcare Diagnostics Inc Liberación y recogida de partículas
US20140377258A1 (en) 2013-05-30 2014-12-25 Infinity Pharmaceuticals, Inc. Treatment Of Cancers Using PI3 Kinase Isoform Modulators
US20140371088A1 (en) * 2013-06-14 2014-12-18 Nanostring Technologies, Inc. Multiplexable tag-based reporter system
US10697005B2 (en) 2013-06-26 2020-06-30 Ramesh Vallabhaneni Method and system for tracking specific in situ hybridizations in biological samples using molecular barcodes
US20150051117A1 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Assembly of Nucleic Acid Sequences in Emulsions
SG11201601416VA (en) 2013-08-28 2016-03-30 Stemcentrx Inc Novel sez6 modulators and methods of use
US20150105298A1 (en) 2013-10-10 2015-04-16 The Research Foundation For The State University Of New York Multi-oligomer in situ hybridization probes
NZ718817A (en) 2013-10-22 2020-07-31 Massachusetts Inst Technology Lipid formulations for delivery of messenger rna
CN105658800A (zh) 2013-10-22 2016-06-08 夏尔人类遗传性治疗公司 Mrna的cns递送及其用途
WO2015084726A1 (en) 2013-12-02 2015-06-11 Qbase, LLC Event detection through text analysis template models
JP2017500028A (ja) 2013-12-12 2017-01-05 アッヴィ・ステムセントルクス・エル・エル・シー 新規の抗dpep3抗体および使用方法
WO2015095766A2 (en) 2013-12-20 2015-06-25 Stem Centrx, Inc. Novel anti-lingo1 antibodies and methods of use
EP3087394A2 (en) 2013-12-27 2016-11-02 Merrimack Pharmaceuticals, Inc. Biomarker profiles for predicting outcomes of cancer therapy with erbb3 inhibitors and/or chemotherapies
EP3094751A4 (en) 2014-01-14 2017-06-07 Santa Maria Biotherapeutics, Inc. Activin inhibitor response prediction and uses for treatment
US20150247204A1 (en) 2014-02-07 2015-09-03 The General Hopital Corporation Differential diagnosis of hepatic neoplasms
WO2015123565A1 (en) 2014-02-14 2015-08-20 The General Hospital Corporation Methods for diagnosing igg4-related disease
EP3107576A4 (en) 2014-02-21 2017-09-06 Abbvie Stemcentrx LLC Anti-dll3 antibodies and drug conjugates for use in melanoma
AU2015220784B2 (en) 2014-02-24 2021-02-04 Ventana Medical Systems, Inc. Automated RNA detection using labeled 2'-O-methyl RNA oligonucleotide probes and signal amplification systems
WO2015131099A1 (en) 2014-02-28 2015-09-03 The General Hospital Corporation Diagnosis of multiple myeloma and lymphoma
WO2015136509A2 (en) 2014-03-14 2015-09-17 Genesis Theranostix Korlatolt Felelossegu Tarsasag Diagnostic and therapeutic targets for preeclampsia and closely related complications of pregnancy
NZ724508A (en) 2014-03-18 2024-05-31 Univ Of Massachusetts Raav-based compositions and methods for treating amyotrophic lateral sclerosis
MA39776A (fr) 2014-03-24 2017-02-01 Hoffmann La Roche Traitement du cancer avec des antagonistes de c-met et corrélation de ces derniers avec l'expression de hgf
US10858698B2 (en) 2014-03-25 2020-12-08 President And Fellows Of Harvard College Barcoded protein array for multiplex single-molecule interaction profiling
EP4328322A3 (en) 2014-07-30 2024-05-22 President and Fellows of Harvard College Probe library construction
US9933431B2 (en) 2014-08-22 2018-04-03 Arizona Board Of Regents On Behalf Of Arizona State University System and method for iterative detection of biological molecules
JP7012957B2 (ja) 2015-03-24 2022-01-31 国立大学法人群馬大学 Rna配列の簡便検出法
CA2983122A1 (en) * 2015-04-17 2016-10-20 President And Fellows Of Harvard College Barcoding systems and methods for gene sequencing and other applications
AU2016349288A1 (en) 2015-11-03 2018-05-31 President And Fellows Of Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
EP4354140A3 (en) 2016-02-26 2024-07-24 The Board of Trustees of the Leland Stanford Junior University Multiplexed single molecule rna visualization with a two-probe proximity ligation system
WO2017161251A1 (en) 2016-03-17 2017-09-21 President And Fellows Of Harvard College Methods for detecting and identifying genomic nucleic acids
US11326206B2 (en) 2016-04-07 2022-05-10 Pacific Biosciences Of California, Inc. Methods of quantifying target nucleic acids and identifying sequence variants
SG11201809913PA (en) 2016-05-16 2018-12-28 Nanostring Technologies Inc Methods for detecting target nucleic acids in a sample
WO2017222453A1 (en) 2016-06-21 2017-12-28 Hauling Thomas Nucleic acid sequencing
CA3053384A1 (en) 2017-03-01 2018-09-07 The Board Of Trustees Of The Leland Stanford Junior University Highly specific circular proximity ligation assay
KR20200143420A (ko) 2018-04-09 2020-12-23 더 보드 오브 트러스티스 오브 더 리랜드 스탠포드 쥬니어 유니버시티 계내 유전자 시퀀싱의 방법
CN112703255A (zh) 2018-05-14 2021-04-23 纳米线科技公司 化学组合物及其使用方法
SG11202101934SA (en) 2018-07-30 2021-03-30 Readcoor Llc Methods and systems for sample processing or analysis
WO2021062107A1 (en) 2019-09-26 2021-04-01 Jumpcode Genomics, Inc. Method and system for targeted nucleic acid sequencing
US20230039899A1 (en) 2020-01-03 2023-02-09 The Johns Hopkins University In situ rna analysis using probe pair ligation
US20210403992A1 (en) 2020-06-29 2021-12-30 Miltenyi Biotec B.V. & Co. KG METHOD COMBINING SINGLE CELL GENE EXPRESSION MAPPING AND TARGETED RNA OR c-DNA SEQUENCING USING PADLOCK OLIGONUCLEOTIDES COMPRISING A BARCODE REGION
US20220040346A1 (en) 2020-08-10 2022-02-10 Sterilization Station, LLC System and method for shopping cart disinfection and sterilization using ultraviolet light
EP4001432A1 (en) 2020-11-13 2022-05-25 Miltenyi Biotec B.V. & Co. KG Algorithmic method for efficient indexing of genetic sequences using associative arrays
CN114854838A (zh) 2021-02-04 2022-08-05 美天施生物科技有限两合公司 结合靶向RNA或cDNA体外测序与原位测序的方法
WO2022197801A1 (en) 2021-03-17 2022-09-22 Yale University Systems and methods for determining barcodes and screening in situ
WO2022240764A1 (en) 2021-05-10 2022-11-17 Pacific Biosciences Of California, Inc. Single-molecule seeding and amplification on a surface
WO2022241227A1 (en) 2021-05-14 2022-11-17 Akoya Biosciences, Inc. Amplification of rna detection signals in biological samples
US20220403462A1 (en) 2021-06-18 2022-12-22 Miltenyi Biotec B.V. & Co. KG Method of spatial sequencing of genes from tissue using padlocks with gaps on substrate
EP4108783B1 (en) 2021-06-24 2024-02-21 Miltenyi Biotec B.V. & Co. KG Spatial sequencing with mictag

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531908A (ja) * 2011-10-14 2014-12-04 プレジデント アンド フェローズ オブ ハーバード カレッジ 構造アッセンブリによる配列決定
WO2016081740A1 (en) * 2014-11-21 2016-05-26 Nanostring Technologies, Inc. Enzyme- and amplification-free sequencing
JP2020500514A (ja) * 2016-11-21 2020-01-16 ナノストリング テクノロジーズ,インコーポレイティド 化学組成物とそれを利用する方法

Also Published As

Publication number Publication date
JP7532458B2 (ja) 2024-08-13
KR102187291B1 (ko) 2020-12-07
WO2018094385A1 (en) 2018-05-24
CN110225980A (zh) 2019-09-10
AU2020210277B2 (en) 2023-06-29
KR20230003586A (ko) 2023-01-06
CN116334202A (zh) 2023-06-27
KR20190080952A (ko) 2019-07-08
US20190390258A1 (en) 2019-12-26
JP2021000085A (ja) 2021-01-07
US20230257800A1 (en) 2023-08-17
US20180142286A1 (en) 2018-05-24
CN110225980B (zh) 2023-01-06
US20220213532A1 (en) 2022-07-07
JP7137595B2 (ja) 2022-09-14
JP2020500514A (ja) 2020-01-16
KR20210126155A (ko) 2021-10-19
US10415080B2 (en) 2019-09-17
AU2020210277A1 (en) 2020-08-20
KR102695749B1 (ko) 2024-08-14
SG10202100951SA (en) 2021-03-30
US11821026B2 (en) 2023-11-21
US12049666B2 (en) 2024-07-30
KR102476709B1 (ko) 2022-12-09
AU2023226700A1 (en) 2023-09-28
EP3541957A1 (en) 2019-09-25
AU2017361521B2 (en) 2020-08-27
US11279969B2 (en) 2022-03-22
KR20200138426A (ko) 2020-12-09
AU2017361521A1 (en) 2019-05-30
CA3043489A1 (en) 2018-05-24
JP6730525B2 (ja) 2020-07-29
KR102313431B1 (ko) 2021-10-18
US20240084361A1 (en) 2024-03-14

Similar Documents

Publication Publication Date Title
JP7137595B2 (ja) 化学組成物とそれを利用する方法
EP3458601B1 (en) Methods for detecting target nucleic acids in a sample
JP7525402B2 (ja) 化学的組成物とそれを利用する方法
JP2024147730A (ja) 化学的組成物とそれを利用する方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220929

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230815

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240731

R150 Certificate of patent or registration of utility model

Ref document number: 7532458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150