JP6366719B2

JP6366719B2 - 断片化したゲノムｄｎａ試料におけるゲノム連結性情報の保存

Info

Publication number: JP6366719B2
Application number: JP2016541684A
Authority: JP
Inventors: ジェフリーエスフィッシャー; フランクジェイスティマーズ; ササンアミニ; ケヴィンエルガンダーソン
Original assignee: イルミナインコーポレイテッド
Priority date: 2013-12-20
Filing date: 2014-12-16
Publication date: 2018-08-01
Anticipated expiration: 2034-12-16
Also published as: JP2017505115A; US20150176071A1; US20190309360A1; AU2020205215B2; EP3957750B1; DK3083994T3; ES2890078T3; AU2022204365A1; EP3957750A1; JP6704955B2; WO2015095226A3; US10246746B2; US11149310B2; JP2018143257A; AU2014364926B2; WO2015095226A2; US20220042093A1; EP3083994A2; CN106414765A; AU2014364926A1

Description

本願は、2013年12月20日に出願された米国特許出願第61/919,529号および2014年2月4に出願された米国特許出願第61/935,776号(ともに係争中である)に基づく優先権を主張する(これらは参照により本願に組み込まれる)。

本開示は、一般に核酸の配列決定法に関し、より具体的には核酸から得られる配列情報のフェージング(phasing)、エラー訂正およびアセンブリに関する。
ヒトゲノム計画(Human Genome Project)の努力によって、ヒト遺伝コードへの窓口がさらに広く開かれた。ヒトゲノムをさらに解き明かす研究は、例えばハイスループット配列決定技術を用いて継続している。HapMap(ハプロタイプマップ)計画は、疾患を有する人からのゲノム情報と有さない人からのゲノム情報を比較することによる、その疾患をもたらす遺伝的変異体を発見することに向けた世界的な科学的努力である。特定の遺伝子座に関するDNA配列の変異形である対立遺伝子は、1以上の異なる遺伝的変異体を含むことが可能であり、特定の染色体上の種々の位置または遺伝子座における対立遺伝子のハプロタイプまたは組み合わせを同定することがHapMap計画の主な目標である。同定されたハプロタイプは、2つの群の人々が異なっている場合、評価中の疾患を引き起こす遺伝的異常の位置と関連づけることができる。このように、HapMap結果は、人における遺伝的変異の共通パターンと、それらの変異が疾患と潜在的に相関するかどうかを説明するために役立つであろう。
これらの努力によって得られた情報は、多くの疾病・疾患の原因または治療法を読み解くために役立つ有益な手段を提供すると考えられる。残念なことに、このような大規模配列決定の実施におけるコストはまだ大変高く、単一染色体ハプロタイプ解析、対立遺伝子または標的配列のフェージングなどのより詳細な情報を提供する技術は入手が困難であった。従って、ヒトゲノムからのさらなる情報を解き明かすさらなる手段および技術が必要とされている。本開示はこうした必要性に対処するものであり、他の利点もまた提供する。

本願に記載の方法は、配列断片が由来するより大きな標的核酸に関する配列断片の近接性を決定するために役立つことができる。例えば、本方法は、フェージングを決定するために用いることができ、評価中の標的核酸の長さよりも個々の配列読取り結果が短い場合の比較的長い標的核酸配列のハプロタイプを同定するために用いることができる。
本開示は、標的核酸ポリマーを配列決定する方法を提供する。本方法は、(a)標的核酸ポリマーを改変して改変核酸ポリマーを生成し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域を含み;(b)固体支持体表面を有する容器中で前記改変核酸ポリマーの断片を生成し、ここで各断片は前記配列領域の1つを含み；(c)前記固体支持体表面領域における位置に断片をランダムに捕捉し;(d)前記位置で前記断片を検出することによって前記配列領域のヌクレオチド配列を決定し;(e)断片のヌクレオチド配列および固体支持体表面上の位置間の相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成する工程を含むことができる。

同様に、(a)標的核酸ポリマーにインサートを挿入して複数の内部インサートを含む改変核酸ポリマーを形成させ;(b)固体支持体表面と接触している流体中で前記改変核酸ポリマーの断片を生成し、それによって、それぞれインサートの少なくとも一部を含む断片を放出し;(c)前記固体支持体表面上の位置に前記断片を流体からランダムに捕捉し;(d)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(e)前記断片のヌクレオチド配列および前記固体支持体表面上の位置間の相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成する工程を含む、標的核酸ポリマーを配列決定する方法もまた提供される。

本開示はさらに、(a)標的核酸ポリマーを改変して改変核酸ポリマーを生成し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域を含み;(b)固体支持体表面上の領域に前記改変核酸ポリマーを付着させ;(c)前記固体支持体表面に付着した前記改変核酸ポリマーの断片を生成し、ここで前記断片は前記固体支持体表面上の領域における位置に付着し;(d)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(e)前断片のヌクレオチド配列および前記固体支持体表面上の位置間の相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成する工程を含む、前記標的核酸ポリマーを配列決定する方法を提供する。

さらに、(a)標的核酸ポリマーにインサートを挿入して複数の内部インサートを含む改変核酸ポリマーを形成させ；(b)固体支持体表面に改変核酸ポリマーを付着させ;(c)前記固体支持体表面に付着した前記改変核酸ポリマーの断片を生成し、ここで前記断片が前記固体支持体表面上の位置に付着し、前記断片が、それぞれインサートの少なくとも一部を含み；(d)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(e)断片のヌクレオチド配列および前記固体支持体表面上の位置間の相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成する工程を含む、標的核酸ポリマーを配列決定する方法が提供される。

本願に記載の方法は、混合試料から得られた配列読取り結果の起源を決定するために役立つこともできる。例えば、本方法は、複数の生物体からの標的核酸の混合物が混合物として処理されている場合に、共通の生物体由来の配列断片を同定するために用いることができる。従って、本方法は、メタゲノム試料(metagenomic sample)において、個々の生物体を同定するために用いることができる。異なる起源からの標的核酸の混合物を含む他の試料もまた用いることができる。

本開示は、異なる起源からの配列の混合物において個々の配列の起源を決定する方法を提供する。本方法は、(a)複数の異なる起源からの標的核酸ポリマーの混合物を提供し;(b)前記標的核酸ポリマーの混合物を改変して改変核酸ポリマーの混合物を生成し、ここで前記改変核酸ポリマーの混合物は異なる起源からの複数の配列領域を含み;(c)固体支持体表面を有する容器中で前記改変核酸ポリマーの断片を生成し、ここで各断片は異なる起源のただ1つからの配列領域を含み;(d)共通の標的核酸ポリマーからの断片が選択的に前記固体支持体表面上の近接位置に局在化する条件下で前記固体支持体表面上の位置に前記断片をランダムに捕捉し;(e)前記位置で前記断片のヌクレオチド配列を決定し;(f)前記断片のヌクレオチド配列および前記固体支持体表面上の位置間の相対距離に基づいて前記複数の異なる起源における共通の起源由来のヌクレオチド配列を同定する工程を含むことができる。

異なる起源からの配列の混合物において個々の配列の起源を決定する方法であって、(a)複数の異なる起源からの標的核酸ポリマーの混合物を提供し;(b)前記混合物中の標的核酸ポリマーにインサートを挿入して改変核酸ポリマーの混合物を形成させ、ここで前記ポリマーは複数の内部インサートを含み;(c)固体支持体表面と接触している流体中で前記改変核酸ポリマーの断片を生成し、それによって、それぞれが前記インサートのそれぞれの少なくとも一部を含む断片を放出し;(d)前記固体支持体表面上の位置に前記断片を流体からランダムに捕捉し;(e)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(f)前記断片のヌクレオチド配列および固体支持体表面上の位置間の相対距離に基づいて前記複数の異なる起源における共通の起源由来のヌクレオチド配列を同定する工程を含む前記方法もまた提供される。

本開示はさらに、異なる起源からの配列の混合物において個々の配列の起源を決定する方法であって、(a)複数の異なる起源からの標的核酸ポリマーの混合物を提供し;(b)前記標的核酸ポリマーの混合物を改変して改変核酸ポリマーの混合物を生成し、ここで前記改変核酸ポリマーの混合物は異なる起源からの複数の配列領域を含み;(c)固体支持体表面に前記改変核酸ポリマーを付着させ;(d)前記固体支持体表面に付着した前記改変核酸ポリマーの断片を生成し、ここで前記複数の起源の共通の起源からの断片を前記固体支持体表面上の近接位置に付着させ;(e)前記位置で前記断片のヌクレオチド配列を決定し;(f)前記断片のヌクレオチド配列および前記固体支持体表面上の位置間の相対距離に基づいて前記複数の異なる起源における共通の起源由来のヌクレオチド配列を同定する工程を含む前記方法を提供する。

異なる起源からの配列の混合物において個々の配列の起源を決定する方法であって、(a)複数の異なる起源からの標的核酸ポリマーの混合物を提供し;(b)前記混合物中の標的核酸ポリマーにインサートを挿入して改変核酸ポリマーの混合物を形成させ、ここで前記ポリマーは複数の内部インサートを含み;(c)固体支持体表面に改変核酸ポリマーを付着させ;(d)前記固体支持体表面に付着した前記改変核酸ポリマーの断片を生成し、ここで前記複数の起源の共通の起源からの断片を前記固体支持体表面上の近接位置に付着させ;(e)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(f)前記断片のヌクレオチド配列および前記固体支持体表面上の位置間の相対距離に基づいて前記複数の異なる起源における共通の起源由来のヌクレオチド配列を同定する工程を含む前記方法もまた提供される。

リンカーによって付着された2つのトランスポゾン因子を有するインサート（パネルA）、トランスポザーゼと、核酸ポリマーに付着連結されたトランスポゾン因子との間のループした複合体の形成の概略を（パネルB）、および、連結されたトランスポゾン因子を含むインサートを含む核酸ポリマーの改変体形態の概略を示す。 3つの別々の領域に捕捉されたインサート-改変核酸ポリマーを有するフローセル(左パネル)とインサート-改変核酸ポリマーの切断および変性後のフローセル(右パネル)を示す図である。図2のフローセル上に捕捉された核酸断片のその後のブリッジ増幅から得られたクラスタークラウドを示す図である。クラスター近接情報の知識なしに50kb参照配列にアラインメントした配列読み取り結果の概略を示す（パネルA）。読み取り結果が、2つの異なるゲノムDNA分子からのものである、50kbの参照ゲノム配列にアラインメントした配列読取り結果の概略を示す（パネルB）。50kb参照ゲノム配列にアラインメントしたゲノムDNA分子の1つからの断片の配列読取り結果の図である（パネルC）。付着と、それに続くビーズ上の標的核酸の断片化を示す図である。ビーズへの改変核酸の付着と、それに続くビーズ上の標的核酸の断片化を示す図である。固体支持体表面上での標的核酸の改変と、表面からの溶液中への断片の放出を示す図である。いくつかのインサートを有する改変核酸を作製するための片面転移を示す図である。メタゲノム試料からフローセル上に捕捉され、続いてブリッジ増幅された核酸断片から得られたクラスタークラウドを示す図である。フローセル内の配列決定クラスターの空間的分布を示す。対照レーン(A)は、提案された方法を用いずに調製され、クラスターの空間位置間の相関を示さず、フローセルの領域にわたって均等に割り当てられている。このレーンは、提案された方法を用いて調製された。提案された方法を用いて調製されたレーン（B）は、自動アルゴリズムによって同定され、近接性に基づくフェージングまたはアセンブリのためにセット（C）に対して付与された、空間的に共に位置する(co-located)グループを形成する配列決定クラスターを示す。 2つの配列決定読み取り結果AおよびBからのエラー訂正の例を示す図である。配列決定読み取り結果AおよびBは、同じ位置で参照ゲノムとは異なっている(AがCに置換されている)。読み取り結果AおよびBを生成したクラスターは、フローセル上で互いに350um離れており、この距離は、配列決定アーティファクトによって生じたかもしれない距離を越えており、なお近接グループの平均半径(200〜300um)内である。

発明の詳細な説明
従来の核酸配列決定方法といわゆる次世代の配列決定方法は、ショットガンアプローチとして特徴づけられる方法を用いる。具体的には、自然によって染色体と呼ばれる連続するポリマーにまとめられているゲノムDNAは、配列決定方法における操作および検出に対応できるより小さな断片に断片化される。このショットガンアプローチの難点の1つは、個々の断片の配列が読み取られる時点までに、その染色体におけるそれらの連結性(connectivity)および相互の近接性(proximity)に関する知識が失われているという点である。染色体の配列に到達するために断片を順序づけるプロセスは一般に”アセンブリ”と呼ばれる。アセンブリプロセスは一般に時間がかかり、比較的大きな計算資源を必要とする。配列エラーおよびアセンブリエラーは、用いられる配列決定の方法論および評価中のゲノムDNA試料の質に左右される問題である可能性がある。
さらに、目的とする多くのゲノムは、各染色体の2以上のバージョンを含む。例えば、ヒトゲノムは、各親から1つのセットを遺伝した染色体の2つのセットを有する二倍体である。生物体によっては、2つのセットを超える染色体を有する多倍体ゲノムを有する。多倍体生物の例は、サケなどの動物ならびに小麦、リンゴ、オートムギおよびサトウキビなどの多くの植物種を含む。典型的なショットガン法で二倍体および多倍体ゲノムを断片化し配列決定する場合、どの断片が染色体のどのセットに由来するかという同一性(identity)に関するフェージング情報が失われる。このフェージング情報は典型的なショットガン法を用いて再現することは困難であるかまたは不可能である可能性がある。

混合試料が評価される場合、少し似ているが、多くの場合、より複雑な難点が生じうる。混合試料は、2以上の生物体からの染色体、mRNA転写産物、プラスミドなどの核酸分子を含む可能性がある。複数の生物体を有する混合試料は、多くの場合メタゲノム試料と呼ばれる。混合試料の他の例は、同じ生物体由来であっても異なる特性を有する異なる細胞または組織である。例には癌組織が含まれ、これは健常細胞と癌細胞の混合物、前癌細胞と癌細胞を含むことができる組織および2以上の種類の異なる癌細胞を含むことができる組織を含むことができる。実際、モザイク性を有する癌試料の場合のように、種々の種類の異なる癌細胞が存在しうる。単一生物体由来の異なる細胞の他の例は、妊娠女性から得られた母と子の細胞の混合物(例えば血液または組織からの)である。混合核酸試料が断片化され、典型的なショットガン法で配列決定される場合、どの断片がどの細胞、生物体または他の起源に由来するかという同一性に関する情報は失われる。この起源情報は、典型的なショットガン法を用いて再現することは困難であるかまたは不可能である可能性がある。
本開示は、標的核酸の改変バージョンが、それらが生成された元の標的核酸に存在する配列領域の連結性情報を保存する標的核酸の改変バージョンを提供する。本明細書に記載の方法を用いれば、改変核酸の断片は、生成され、固体支持体表面上の限局性領域に捕捉されることができる。異なる改変核酸の混合物が用いられる場合、各核酸分子から生成される断片は、表面上のそれぞれの領域に限局されることができる(たとえ、各断片がランダムに所定ではない位置に行き着くとしても)。このように、表面上の異なる断片の近接性は、どの断片が共通の標的核酸分子に由来するかを決定するために用いることができる。この情報は、それに続いて、より長い分子に由来した断片のフェージングおよびハプロタイプ解析を決定するために用いることもできるし、共通の細胞、生物体または他の起源に由来した2以上の断片を同定するために用いることもできる。

本開示の方法は、アセンブリを容易にし、エラー訂正を改善し、混合試料中の核酸の起源を同定し、フェージング情報を決定する利点を提供することができる。特定の実施形態は、特定の染色体(または他の核酸)における断片配列の近接性に相関する配置または組成物におけるゲノムDNA(または他の標的核酸)の断片を提供する。断片を配列決定し、配置または組成物中の断片の相対位置を評価することによって、アセンブリを容易にし、アセンブルした配列におけるエラーを同定し、訂正し、ハプロタイプ相または他の配列の特徴を決定するために用いることができる。配列および相対近接性情報はまた、その配列が、起源の混合物から得られる多くの断片から同定される場合であっても、共通の起源由来の配列を同定するために有用であることができる。
さらなる具体例として、長い標的核酸ポリマーを処理して、連鎖した断片に該ポリマーを細分するインサート因子を導入するための方法が提供される。インサート因子は、増幅および／または配列決定プロセスのプライミング部位、表面に捕捉するためのリガンドならびに／または該ポリマーを断片化するための切断部位などの様々な能力を提供することができる。インサート因子を有するポリマーは、核酸断片の捕捉および検出のための表面を有するフローセルまたは他の容器に導入することができる。次いで、該ポリマーの断片は、該ポリマーの近接断片からの断片が、互いに近接する表面上の部位に行き着くように表面部位またはその付近に生成されることができる。該断片は、場合によりその部位で増幅され、次いで配列決定技術において検出されることができる。互いから所定の距離内の断片は、同じ標的核酸ポリマーに由来したという有意な確率を有すると考えられ、この情報は、アセンブリ、エラー訂正、混合試料中の起源の同定およびフェージングを容易にするために用いることができる。
以下にさらに詳細に述べるように、本明細書に記載の方法は、ショットガン配列決定アプローチ、例えば次世代の配列決定法として商業的に知られている方法または本明細書に引用した文献に記載の方法に対する改善として用いることができる。
特記しない限り、本明細書で用いられる用語は、関連技術分野におけるそれらの普通の意味を有していると理解されるであろう。本明細書で用いられるいくつかの用語およびそれらの意味を以下に述べる。

本明細書において、用語”能動的に輸送される”は、ある分子に加えられる非拡散力によって、ある位置に向かうかまたはある位置から離れるその分子の運動のことをいう。該位置は、固体支持体表面(例えばアレイ)上の位置であることができる。非拡散力は、外部起源、例えば電場もしくは磁場、流体流または化学勾配を生じる外部起源によって加えられることができる。能動的に輸送される分子は、それらの濃度勾配に沿って、またはそれらの濃度勾配に逆らって移動することができる。従って、能動輸送は、所望の方向に、または固体支持体上の所望の位置に1以上の分子を移動させるためにエネルギーを加えることを含むことができる。
本明細書において、用語”アレイ”は、相対位置に従って互いに区別することができる部位の集団のことをいう。アレイの異なる部位にある異なる分子は、アレイにおける部位の位置に従って互いに区別することができる。個々のアレイ部位は、特定のタイプの1以上の分子を含むことができる。例えば、ある部位は、特定の配列を有する単一標的核酸分子を含むこともできるし、ある部位は、同じ配列(および／またはその相補配列)を有するいくつかの核酸分子を含むこともできる。該アレイ部位は、同じ支持体上の異なるフィーチャまたは位置であることができる。例示的な部位は、限定するものではないが、支持体内のウェル、支持体内もしくは支持体上のビーズ(もしくは他の粒子)、支持体からの投影、支持体上の隆起または支持体内の溝を含む。該アレイ部位は、それぞれが異なる分子を運ぶ別々の支持体であることができる。別々の支持体に付着した異なる分子は、支持体が付着している表面上の支持体の位置または液体もしくはゲル内の支持体の位置に従って同定されることができる。別々の支持体が表面に位置する例示的なアレイは、限定するものではないが、ウェル内にビーズを含むアレイを含む。

本明細書において、用語”付着する”は、互いに結ばれる、固定される、接着する、連結する、または結合される2つの物の状態のことをいう。例えば、核酸などの被検化合物は、共有結合または非共有結合によって固体支持体の表面などの材料に付着することができる。共有結合は、原子間で電子対を共有することを特徴とする。非共有結合は、電子対の共有を含まない化学結合であり、例えば、水素結合、イオン結合、ファンデルワールス力、親水性相互作用および疎水性相互作用を含むことができる。いくつかの実施形態において、結合が非共有結合によって媒介されない1以上の共有結合によって付着が生じる。
本明細書において、用語”切断部位”は、物理的に分子の別々の2つの他の一部分に改変または除去されることができる、リンカーなどの分子の一部分を意味するものとする。切断部位は、生化学的、化学的、物理的手段または他の手段によって改変または除去されることが可能である。
本明細書において、用語”連続した(contiguous)”は、2つのトランスポゾン因子(transposon element)に関して用いられるとき、その2つのトランスポゾン因子が互いにリンカーによって共有結合していることを意味するものとする。リンカーは、2つのトランスポゾン因子(例えば図1を参照のこと)の5’末端部位もしくはその付近、2つのトランスポゾンの3’末端部位もしくはその付近またはトランスポゾンの1つの3’末端部位もしくはその付近および他のトランスポゾンの5’末端部位またはその付近を結合することができる。有用であることができる連続したトランスポゾン因子の例は、国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023に記載されている(そのそれぞれは参照により本願に組み込まれる)。

本明細書において、用語”異なる”は、核酸に関して用いられるとき、互いに同じではないヌクレオチド配列を核酸が有することを意味する。2以上の核酸は、それらの全長を通して異なるヌクレオチド配列を有することができる。あるいはまた、2以上の核酸は、それらの長さの実質的な部分を通して異なるヌクレオチド配列を有することができる。例えば、2以上の異なる核酸は、その2以上の異なる核酸に関して同じユニバーサル配列領域を有すると同時に、互いに異なる標的ヌクレオチド配列を有することができる。
本明細書において、用語”それぞれ”は、一群の項目に関して用いられるとき、その集団の個々の項目を特定するが、必ずしもその集団のすべての項目を指すものではないものとする。明確な開示または文脈により例外が明記されている場合、例外が生じる場合がある。
本明細書において、用語”伸長”は、プライマーに関して用いられるとき、1以上のヌクレオチドがプライマーに付加される(例えばポリメラーゼ活性により)か、または1以上のオリゴヌクレオチドがプライマーに付加される(例えばリガーゼ活性により)プロセスを含むものとする。

本明細書において、用語”フローセル”は、それを横切って流体試薬が流れることができる表面をチャンバが有することを意味するものとする。一般に、フローセルは、流体の流れを容易にするための浸入開口部および流出開口部を有する。本開示の方法に容易に用いることができる．フローセルならびに関連する流体系および検出プラットフォームの例は、例えば、Bentley et al., Nature 456:53-59 (2008)、WO 04/018497; 米国特許第7,057,026号; WO 91/06678; WO 07/123744; 米国特許第7,329,492号; 米国特許第7,211,414号; 米国特許第7,315,019号; 米国特許第7,405,281号および米国特許第2008/0108082号に記載されている(そのそれぞれは、参照により本願に組み込まれる)。
本明細書において、用語 ”叉状アダプター(forked adapter)”は、2つの鎖が互いにアニーリングした第1末端および2つの鎖が互いにアニーリングしてない第2末端を有する二本鎖核酸を意味するものとする。叉状アダプターまたはY型アダプター(Y-shaped adapter)の例は、例えば、米国特許第7,741,463号(参照により本願に組み込まれる)に記載されている。
本明細書において、用語 ”断片” は、最初の核酸に関して用いられるとき、最初の核酸の配列の部分または一部を有する別の核酸を意味するものとする。一般に、断片と最初の核酸とは別々の分子である。該断片は、例えば、より大きな核酸からの物理的除去により、より大きな核酸の領域の複製もしくは増幅により、より大きな核酸の他の部分の分解により、それらの組み合わせなどにより誘導されることができる。該用語は、核酸の配列データまたは他の表示を記述するために同様に用いることができる。

本明細書において、用語 ”ハプロタイプ”は、その親の一方からの個体によって遺伝される、2以上の遺伝子座における1組の対立遺伝子のことをいう。ハプロタイプは、染色体の全部または一部からの2以上の遺伝子座を含むことができる。対立遺伝子は、例えば、一塩基多型 (SNP)、ショートタンデムリピート (STR)、遺伝子配列、染色体挿入、染色体欠失などを含む。用語”フェージングされた(phased)対立遺伝子”とは、特定の染色体またはその部分の特定の対立遺伝子の分布のことをいう。従って、2つの対立遺伝子の”フェーズ(phase)”は、1以上の染色体上の2以上の対立遺伝子の相対位置の解析または表示を指すことができる。
本明細書において、用語 ”インサート”は、ポリマーに関して用いられるとき、該ポリマーに付着している分子または該ポリマーに付着していた分子または該ポリマーに付着合するであろう分子を意味するものとする。該ポリマーは、例えば、DNA、RNA またはそれらのアナログなどの核酸であることができる。該分子は、例えば、核酸もしくはそのアナログまたは核酸部位もしくはそのアナログを有する分子であることができる。
本明細書において、用語 ”内部”は、2つの末端を有するポリマーに関して用いられるとき、該ポリマーの2つの末端の間の該ポリマーの位置にあることを意味する。例えば、ポリマー内のインサートは、該ポリマーの末端から少なくとも1、2、3、4、5、10、100、200、500 または 1000 モノマーサブユニットの位置に位置することができる。

本明細書において、用語 ”リガンド”と ”受容体”は、互いに特異的に結合して複合体を形成する成分を指すものとする。リガンドと受容体の例は、限定するものではないが、ポリヒスチジン (例えばペンタHis およびヘキサHis)とニッケル;アビジン (またはストレプトアビジンなどのそのアナログ) とビオチン (または2-イミノビオチン、デスチオビオチン、ニュートラアビジン (Molecular Probes社、ユージーン、オレゴン州)、CaptAvidin (Molecular Probes社)などのそのアナログ); 結合タンパク質とそれらの支持体 (例えばマルトースとマルトース結合タンパク質 (MBP)、カルシウムとカルシウム結合タンパク質/ペプチド (CBP); 抗体と抗原、例えば c-MYC、HA、VSV-G、HSV、V5およびFLAG Tagタグ(登録商標);アプタマーとそれらの対応する標的; フルオロフォアと抗フルオロフォア抗体; 核酸とそれらの相補鎖; などを含む。本開示においては、用語 ”リガンド” と ”受容体”は、明確な開示または文脈によって否定されない限り同義で使用されることができる。従って、例えば抗体は、抗原に対して受容体またはリガンドとみなすことができる。
本明細書において、用語 ”リンカー”は、他の2つの部分を共有結合によって架橋する化学結合または部分を意味するものとする。リンカーは、例えば、核酸部分においてヌクレオチドを連結する糖-リン酸骨格であることができる。該リンカーは、例えば、ヌクレオチド部分、核酸部分、非ヌクレオチド化学物質部分、ヌクレオチドアナログ部分、アミノ酸部分、ポリペプチド部分またはタンパク質部分の1以上を含むことができる。リンカーは、例えば、非核酸部分を含むことによって、増幅不能であることができる。例示的なリンカーは、以下ならびに国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023、(そのそれぞれは、参照により本願に組み込まれる)においてさらに詳細に述べられている。

本明細書において、用語”核酸”は、互いに結合した少なくとも2つのヌクレオチドモノマーを指すことができる。例は、限定するものではないが、DNA、例えばゲノムDNAもしくはcDNA;RNA、例えばmRNA、sRNAもしくはrRNA;またはDNAとRNAのハイブリッドを含む。以下の実施例および本明細書の他の部分から明らかなように、核酸は天然に存在する核酸構造を有することもできるし、天然に存在しない核酸アナログ構造を有することもできる。核酸は、ホスホジエステル結合を含むことができる。しかしながら、いくつかの実施形態において、核酸は、例えば、ホスホラミド、ホスホロチオエート、ホスホロジチオエート、O-チルホスホロアミダイトならびにペプチド核酸主鎖および結合を含む他の種類の骨格を有することができる。核酸は、陽性主鎖;非イオン性主鎖および非リボースベース骨格を有することができる。核酸はまた、1以上の炭素環式糖を含むこともできる。本明細書における方法または組成物に用いられる核酸は、規定されているように、一本鎖であることもできるし、二本鎖であることもできる。いくつかの実施形態において、核酸は、例えば叉状アダプターによって示されるように、二本鎖配列部分と一本鎖配列部分の両方を含むことができる。核酸は、デオキシリボヌクレオチドおよびリボヌクレオチドの任意の組み合わせならびに、ウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンタニン、ヒポキサンタニン、イソシトシン、イソグアニンを含む塩基ならびに塩基アナログ、例えばニトロピロール(3-ニトロピロールを含む)およびニトロインドール(5-ニトロインドールを含む)などの任意の組み合わせを含むことができる。いくつかの実施形態において、核酸は、少なくとも1つの無差別(promiscuous)塩基を含むことができる。無差別塩基は、塩基の2以上の異なるタイプと塩基対を形成することができ、例えば、複雑な核酸試料、例えばゲノムDNA試料においてランダムハイブリダイゼーションに用いられるオリゴヌクレオチドプライマーまたはインサートに含まれる場合に有用であることができる。無差別塩基の例は、アデニン、チミン、またはシトシンと対を形成することができるイノシンを含む。他の例は、ヒポキサンチン、5-ニトロインドール、アシル(acylic)5-ニトロインドール、4-ニトロピラゾール、4-ニトロイミダゾールおよび3-ニトロピロールを含む。少なくとも2つ、3つ、4つまたはそれ以上のタイプの塩基対を形成することができる無差別塩基を使用することができる。

本明細書において、用語”ヌクレオチド配列”は、核酸ポリマーにおけるヌクレオチドモノマーの順序およびタイプを指すものとする。ヌクレオチド配列は核酸分子の特徴であり、例えば、描写、画像、電子媒体、記号系列、数字系列、文字系列、色系列などを含む種々のフォーマットのいずれかで表すことができる。該情報は、例えば、単一ヌクレオチド解像度、高解像度(例えばヌクレオチドサブユニットの分子構造を示す)または低解像度(例えば染色体領域、例えばハプロタイプブロックを示す)で表すことができる。”A”、”T”、”G”および”C”の文字系列は、単一ヌクレオチド解像度でDNA分子の実際の配列と関連づけることができるDNAの公知の配列表示である。系列中”T”を”U”で置き換えるという条件で、RNAに関して同様な表示が用いられる。
本明細書において、用語”受動的に拡散する”は、それらの濃度勾配に沿った分子の移動を意味するものとする。

本明細書において、用語”ランダムに”とは、表面上の位置の空間配置または組成物を指すために用いることができる。例えば、本明細書に記載のアレイに関して少なくとも2つのタイプの順序がある。最初のタイプは、フィーチャ(”部位”とも呼ばれる)の空間および相対位置に関連し、第2のタイプは、特定のフィーチャに存在する特定の種の分子の同一性または所定の知識に関連する。従って、アレイのフィーチャは、最も近い隣接フィーチャが互いの間のランダムな空間を有するようにランダムに位置することができる。あるいはまた、フィーチャ間の空間は、例えば、直線格子または6角格子などの正則パターンを形成することによって順序づけることができる。他の点において、アレイのフィーチャは、空間がランダムパターンまたは正則パターンを生じるかどうかには無関係に各フィーチャを占める被検化合物(例えば特定の配列の核酸)の種の識別または所定の知識に関してランダムであることができる。本明細書に記載のアレイは、一つの観点において、順序づけられることができ、他の観点においてランダムであることができる。例えば、本明細書に記載のいくつかの実施形態において、核酸が、それらの相対位置に関して順序づけられている部位に結合するが、特定の部位に存在する核酸種の配列の知識に関してはランダムである条件下で核酸の集団と表面が接触される。表面上の位置に”ランダムに”異なる核酸を捕捉するとは、その位置にどの核酸が捕捉されるかに関する知識の非存在または事前の決定の非存在を指すものとする(その位置が順序づけられたパターンで配置されているかどうかにかかわらず)。

本明細書において、用語”領域”は、表面に関して用いられるとき、該表面上の全区域よりも小さい表面上の区域を意味する。該領域は、流体に暴露されるかまたはそれにアクセス可能な全区域よりも小さい区域であることができる。一般に用語”領域”は、その領域が表面フィーチャ、部位、外形などを含むと含まないとにかかわらず、連続する、途切れない表面上の区域を指すために用いられる。領域は、ある核酸が付着するかまたは付着するであろう1以上の位置を含むことができる。
本明細書において、用語”単一種”は、特定の属の実質的にただ1つの種を指すものとする。該用語は、存在する単一種の代表の数を必ずしも限定するものではない。例えば、同じヌクレオチド配列を各分子が有する核酸分子の集団は、核酸の単一種を含む。これに関連して、用語”単一”は、関連性のある属内ではない他の物の存在を排除しないものとする。例えば、ライブラリーからの核酸の単一種を含む表面上の位置は、同じ配列を有する複数の核酸を含むことができ、該ライブラリーからの他の標的核酸を排除するが、必ずしも任意の他の非核酸成分を排除する必要はない。見かけの単一種集団は、その集団の特定の用途のために無視できるレベルの夾雑物またはアーティファクトであると当業者によってみなされるレベルで存在する少量の他の種を有し得ることは理解できるであろう。例えば、第1配列を有する単一鋳型由来の核酸クラスターは、第1配列が検出されるとき、第2配列を有する任意の核酸分子の量が、検出されるには十分に低いかもしくは無視される場合、見かけの単一種を有するとみなされるであろう。代わりに、絶対的な単一種集団はただ1つの種を有するであろう。

本明細書において、用語”固体支持体”は、水性液に不溶性の堅い支持体のことをいう。支持体は非多孔質であることもできるし、多孔質であることもできる。支持体は、場合により、液体を吸収する(例えば多孔性により)ことができるが、通常は十分に堅いため、該支持体は、液体を吸収する場合は実質的に膨張せず、乾燥によって液体が除去される場合に、実質的に接触しない。無孔の固体支持体は、一般に液体またはガスに対して不透過性である。例示的な固体担体は、限定するものではないが、ガラスおよび改変もしくは機能化ガラス、プラスチック(アクリル、ポリスチレンならびにスチレンおよび他の材料の共重合体、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、テフロン(登録商標)、環式オレフィン、ポリイミドなどを含む)、ナイロン、セラミックス、樹脂、ゼオノア、シリカまたはシリカベース材料(シリコンおよび修飾シリコンを含む)、炭素、金属、無機ガラス、光ファイババンドルならびにポリマーを含む。いくつかの実施形態のための特に有用な固体担体は、フローセル装置内に位置する。例示的なフローセルを以下にさらに詳しく述べる。

本明細書において、用語”起源”は、核酸分子の起源、例えば組織、細胞、細胞小器官、コンパートメントまたは生物体を含むものとする。該用語は、いくつかの他の核酸の起源を含む混合物中の特定の核酸の起源を同定または区別するために用いることができる。起源は、異なる種の生物体を有するメタゲノム試料中の特定の生物体であることができる。いくつかの実施形態において、起源は、個々の起源(例えば個々の細胞または生物体)として同定されるだろう。あるいはまた、起源は、試料中の同じタイプのいくつかの個体を含む種として同定されることができる(例えば、他の種のメンバーに加えて該種のいくつかの個々のメンバーを有するメタゲノム試料中の細菌または他の生物体の種)。
本明細書において、用語”表面”は、材料に関して用いられるとき、該材料の外部部分または外層を意味するものとする。該表面は、他の材料、例えばガス、液体、ゲル、ポリマー、有機高分子、同様もしくは異なる材料の第2表面、金属または外被と接触することができる。該表面またはその領域は実質的に平らであることができる。該表面は、表面フィーチャ、例えばウェル、ピット、溝、隆起、隆起した領域、ペグ、ポストなどを有することができる。該材料は、例えば固体支持体、ゲルなどであることができる。

本明細書において、用語”標的”は、核酸ポリマーに関して用いられるとき、該核酸と、例えば他の核酸、該核酸の改変体、該核酸の断片などを語学上区別するものとする。本明細書に記載の種々の核酸のいずれも標的核酸として同定されることができ、それらの例は、ゲノムDNA(gDNA)、メッセンジャーRNA(mRNA)、コピーDNA(cDNA)およびこれらの核酸の誘導体またはアナログを含む。
本明細書において、用語”トランスポザーゼ”は、トランスポゾン因子含有組成物(例えばトランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)と機能性複合体を形成し、例えば、in vitro転移反応において、それがインキュベートされる標的DNAへのトランスポゾン因子含有組成物の挿入または転移を触媒することができる酵素を意味するものとする。該用語はまた、レトロトランスポゾンおよびレトロウイルスからのインテグラーゼを含むことができる。トランスポザーゼ、トランスポソームおよびトランスポソーム複合体は、米国特許出願公開第2010/0120098号の開示(これは参照により本願に組み込まれる)で例示されるように、一般に当業者に公知である。本明細書に記載の多くの実施形態は、Tn5トランスポザーゼおよび／または高活性Tn5トランスポザーゼに言及しているが、任意の転移システムが、標的核酸をタグ付けするために十分な効率でトランスポゾン因子を挿入することができることは明らかであろう。特定の実施形態において、好ましい転移システムは、標的核酸をタグ付けするために、ランダムまたはほぼランダムにトランスポゾン因子を挿入することができる。

本明細書において、用語”トランスポソーム(transposome)”は、核酸に結合したトランスポザーゼ酵素を意味するものとする。一般的には、該核酸は二本鎖である。例えば、該複合体は、非共有結合複合体形成を維持する条件下で、二本鎖トランスポゾンDNAとトランスポザーゼ酵素とのインキュベートの生成物であることができる。トランスポゾンDNAは、限定するものではないが、Tn5 DNA、Tn5 DNAの一部、トランスポゾン因子組成物、トランスポザーゼ、例えば高活性Tn5トランスポザーゼと相互作用することができるトランスポゾン因子組成物または他の核酸の混合物を含むことができる。
本明細書において、用語”トランスポゾン因子”は、トランスポザーゼまたはインテグラーゼ酵素とトランスポソームを形成するヌクレオチド配列を含む核酸分子またはその一部分を意味するものとする。一般的には、該核酸分子は二本鎖DNA分子である。いくつかの実施形態において、トランスポゾン因子は、転移反応において、トランスポザーゼと機能性複合体を形成することができる。限定するものではない例として、トランスポゾン因子は、野生型または変異体Tn5トランスポザーゼによって認識される19bp外端(outer end)(”OE”)トランスポゾン末端、内端(inner end)(”IE”)トランスポゾン末端もしくは”モザイク末端”(”ME”)トランスポゾン末端または、米国特許出願公開第2010/0120098号の開示(これは参照により本願に組み込まれる)に記載されているR1およびR2トランスポゾン末端を含むことができる。トランスポゾン因子は、in vitro転移反応において、トランスポザーゼまたはインテグラーゼ酵素と機能性複合体を形成するのに適した任意の核酸または核酸アナログを含むことができる。例えば、該トランスポゾン末端は、DNA、RNA、修飾塩基、非天然塩基、改変骨格を含むことができ、片鎖または両鎖にニックを含むことができる。

本明細書において、用語”ユニバーサル配列”は、2以上の核酸分子が互いに異なる配列領域を有する場合の前記核酸分子に共通の配列領域のことをいう。一群の分子の種々のメンバーに存在するユニバーサル配列は、そのユニバーサル配列に相補的なユニバーサル捕捉核酸の集団を用いて複数の異なる核酸を捕捉することを可能にすることができる。同様に、一群の分子の異なるメンバーに存在するユニバーサル配列は、該ユニバーサル配列に相補的なユニバーサルプライマーの集団を用いて複数の異なる核酸の複製、増幅または配列解析を可能にすることができる。従って、ユニバーサル捕捉核酸またはユニバーサルプライマーは、ユニバーサル配列に特異的にハイブリダイズすることができる配列を含む。
以下で説明され、かつ請求項に記載された実施形態は、上記の定義を考慮して理解することができる。

本開示は、標的核酸ポリマーを配列決定する方法を提供する。本方法は、(a)標的核酸ポリマーを改変して改変核酸ポリマーを生成し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域を含み;(b)固体支持体表面を有する容器中で前記改変核酸ポリマーの断片を生成し、ここで各断片は前記配列領域の1つを含み；(c)前記固体支持体表面領域における位置に前記断片をランダムに捕捉し;(d)前記位置で前記断片を検出することによって前記配列領域のヌクレオチド配列を決定し;(e)前記断片のヌクレオチド配列および固体支持体表面上の位置間の相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成する工程を含むことができる。
本開示はさらに、(a)標的核酸ポリマーを改変して改変核酸ポリマーを生成し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域を含み;(b)固体支持体表面上の領域に前記改変核酸ポリマーを付着させ;(c)前記固体支持体表面に付着した改前記変核酸ポリマーの断片を生成し、ここでぜ前記断片は固体支持体表面上の領域における位置に付着し;(d)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(e)前記断片のヌクレオチド配列および固体支持体表面上の位置間の相対距離に基づいて標的核酸ポリマーのヌクレオチド配列の表示を作成する工程を含む、前記標的核酸ポリマーを配列決定する方法を提供する。

本開示は、異なる起源からの配列の混合物において個々の配列の起源を決定する方法を提供する。本方法は、(a)複数の異なる起源からの標的核酸ポリマーの混合物を提供し;(b)前記標的核酸ポリマーの混合物を改変して改変核酸ポリマーの混合物を生成し、ここで前記改変核酸ポリマーの混合物は前記異なる起源からの複数の配列領域を含み;(c)固体支持体表面を有する容器中で前記改変核酸ポリマーの断片を生成し、ここで各断片は異なる起源のただ1つからの配列領域を含み;(d)共通の標的核酸ポリマーからの断片が選択的に前記固体支持体表面上の近接位置に局在化する条件下で前記固体支持体表面上の位置に前記断片をランダムに捕捉し;(e)前記位置で前記断片のヌクレオチド配列を決定し;(f)前記断片のヌクレオチド配列および固体支持体表面上の位置間の相対距離に基づいて前記複数の異なる起源における共通の起源由来のヌクレオチド配列を同定する工程を含むことができる。
異なる起源からの配列の混合物において個々の配列の起源を決定する方法であって、(a)複数の異なる起源からの標的核酸ポリマーの混合物を提供し;(b)前記混合物中の標的核酸ポリマーにインサートを挿入して改変核酸ポリマーの混合物を形成させ、ここで前記ポリマーは複数の内部インサートを含み;(c)固体支持体表面と接触している流体中で前記改変核酸ポリマーの断片を生成し、それによって、それぞれインサートのそれぞれの少なくとも一部を含む断片を放出し;(d)前記固体支持体表面上の位置に前記断片を流体からランダムに捕捉し;(e)前記位置で前記断片を検出することによって前記断片のヌクレオチド配列を決定し;(f)前記断片のヌクレオチド配列および固体支持体表面上の位置間の相対距離に基づいて前記複数の異なる起源における共通の起源由来のヌクレオチド配列を同定する工程を含む前記方法もまた提供される。

本明細書に記載の方法または組成物に有用な標的核酸は、本明細書の他の部分で示す構造および／または起源を有することができる。本明細書に記載の標的であることができる例示的な核酸種は、限定するものではないが、DNA、RNA、ペプチド核酸、モルホリノ核酸、ロックド核酸、グリコール核酸、トレオース核酸、それらの混合物およびそれらのハイブリッドを含む。好ましい実施形態において、ゲノムDNA断片またはその増幅コピーは標的核酸として用いられる。他の好ましい実施形態において、ミトコンドリアDNAまたは葉緑体DNAが用いられる。さらに他の実施形態は、RNAもしくはその誘導体、例えばmRNAまたはcDNAを標的にする。いくつかの実施形態において、標的核酸は単一細胞由来であることができる。いくつかの実施形態において、標的核酸は、無細胞性体液、例えば細胞を含まない血漿または痰由来であることができる。いくつかの実施形態において、標的核酸は循環腫瘍細胞由来であることができる。
いくつかの実施形態において、標的核酸は、リボソームRNA(rRNA)またはそれに由来する配列を含むことができる。例えば、rRNA配列は、メタゲノム試料中の異なる生物体を識別するのに特に有用であることができる。

標的核酸は、種々のヌクレオチド配列のいずれかを有することができる。いくつかの実施形態において、標的核酸はホモポリマー配列を含む。標的核酸は反復配列を含むこともできる。繰り返し単位は、例えば、少なくとも2、5、10、20、30、40、50、100、250、500、1000ヌクレオチド以上であることができる。反復配列は、連続して、または不連続に、例えば、少なくとも2、3、4、5、6、7、8、9、10、15、20回以上を含む種々の回数のいずれかで繰り返すことができる。本明細書に記載の方法は、ホモポリマーおよび／または反復配列を有する標的核酸を解析し評価するのに特に有用である。なぜなら、これらの配列領域の真の長さは、少なくとも一部分において、本方法から得られた近接情報から導かれる配列アセンブリから決定されることができるからである。
本明細書に記載のいくつかの実施形態は、シングルコピー(すなわち単一分子)で存在するか、あるいは複数コピー(すなわち同じ配列を有する核酸分子の集合)で存在する単一標的核酸種を用いることができる。他の実施形態は、複数の異なる標的核酸種(すなわち複数で存在している異なるヌクレオチド種を有する核酸分子)を用いることができる。従って、複数の標的核酸は、複数の同じ標的核酸、一部の標的核酸が同じである複数の異なる標的核酸またはすべての標的核酸が異なる複数の標的核酸を含むことができる。

複数の標的核酸を用いる実施形態は、複数の標的核酸に試薬が同時に送達されるか、または複数の標的核酸が同時に操作される(例えば本明細書に記載の方法の1以上の工程は、複数の標的核酸に対して同時に行われることができる)ような多重フォーマットで行うことができる。標的核酸または標的核酸の誘導体(例えば断片および／またはアンプリコン)は、1以上のチャンバまたは多重操作および／もしくは評価に便利なアレイ表面に供給することができる。

いくつかの実施形態において、複数の標的核酸は、特定の生物体のゲノムの実質的に全部を含むことができる。該複数の標的核酸は、例えば、そのゲノムの少なくとも約1%、5%、10%、25%、50%、75%、80%、85%、90%、95%または99%を含む、特定の生物体のゲノムの少なくとも一部を含むことができる。特定の実施形態において、該部分は、そのゲノムの多くて約1%、5%、10%、25%、50%、75%、80%、85%、90%、95%または99%である上限を有することができる。入手可能な標的核酸からの例示的なゲノムは、限定するものではないが、原核生物(例えば、エシェリキア(Escherichia)属、バチルス(Bacillus)属、セラチア(Serratia)属、サルモネラ(Salmonella)属、スタフィロコッカス(Staphylococcus)属、ストレプトコッカス(Streptococcus)属、クロストリジウム(Clostridium)属、クラミジア(Chlamydia)属、ナイセリア(Neisseria)属、トレポネーマ(Treponema)属、マイコプラズマ(Mycoplasma)属、ボレリア(Borrelia)属、レジオネラ(Legionella)属、シュードモナス(Pseudomonas)属、マイコバクテリウム(Mycobacterium)属、ヘリコバクター(Helicobacter)属、エルウィニア(Erwinia)属、アグロバクテリウム(Agrobacterium)属、リゾビウム(Rhizobium)属およびストレプトミセス(Streptomyces)属);アカエア(Achaea)、例えば、クレンアーキオータ(crenarchaeota)、ナノアーキオータ(nanoarchaeota)もしくはユリアーキオータ(euryarchaeotia);または真核生物、例えば真菌(例えば酵母)、植物、原生動物および動物(昆虫(例えば、ドロソフィラ種(Drosophila spp.))、線虫(例えばカエノラブディティス・エレガンス(Caenorhabditis elegans))、ならびに哺乳動物(例えば、ラット、マウス、サル、非ヒト霊長類およびヒト)を含む)を含む。

複数の標的核酸は、ハプロイドヒトゲノムのサイズである少なくとも約3ギガ塩基、ヒトゲノムの少なくとも約60%の表示である少なくとも約2ギガ塩基またはヒトゲノムの少なくとも約30%の表示である少なくとも約1ギガ塩基と同等である複雑度を有することができる。複数の標的核酸の複雑度は、例えば、少なくとも約0.1ギガ塩基、0.2ギガ塩基、0.5ギガ塩基、0.8ギガ塩基、1ギガ塩基、1.5ギガ塩基、2ギガ塩基、2.5ギガ塩基、3ギガ塩基、3.5ギガ塩基、4ギガ塩基、4.5ギガ塩基、5ギガ塩基であるヒトゲノムよりも大きいこともできるし、小さいこともできる。これに代えて、あるいはこれに加えて、本明細書の一実施形態において、複雑度または用いられる複数の核酸は、約5ギガ塩基、4ギガ塩基、3ギガ塩基、2ギガ塩基、1ギガ塩基、0.5ギガ塩基、0.1ギガ塩基以下であることができる。
いくつかの実施形態において、複数の標的核酸は、所望の生物体からのRNAを含み、それらの例は、限定するものではないが、上記のものを含む。標的核酸試料は、該生物体に存在するRNAの完全相補鎖の実質的に全部または一部を含むことができる。複数の標的核酸は、例えば、トランスクリプトームの少なくとも約1%、5%、10%、25%、50%、75%、80%、85%、90%、95%、または99%を含む特定の生物体のトランスクリプトームの少なくとも一部を含むことができる。これに代えて、あるいはこれに加えて、一部は、多くてトランスクリプトームの約1%、5%、10%、25%、50%、75%、80%、85%、90%、95%または99%であるという上限を有することができる。

いくつかの実施形態において、標的核酸へのインサートの組み込みによって生成される標的核酸または改変核酸は、長さ少なくとも0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb、1000kb、5000kb、10000kb、20000kb、30000kbまたは50000kbであることができる。これに代えて、あるいはこれに加えて、標的核酸または改変核酸は、長さ0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kbまたは1000kb以下である。
標的核酸は、単一生物体から得られた核酸分子から調製されることもできるし、2以上の生物体を含む自然源から得られた核酸分子の集団から調製されることもできる。標的核酸は、単一細胞;単一生物体の複数の細胞、組織(単数または複数)もしくは体液；同じ種のいくつかの生物体の細胞、組織もしくは体液；または環境試料などのメタゲノム試料と同様な複数の種、からのものであることができる。核酸分子の起源は、限定するものではないが、細胞小器官、細胞、組織、臓器または生物体を含む。

標的核酸試料は、いくつかの実施形態において、インサートを挿入する前に、または本明細書に記載の他の改変を行う前に処理されることができる。例えば、標的核酸試料は、インサートを挿入する前に、ビーズに付着させる前に、固体支持体の表面に付着させる前に、またはトランスポザーゼに付着させる前に増幅させることができる。試料の存在量が低いとき、または少量の標的核酸が得られるとき、増幅は特に有用である。ゲノム中の大多数の配列を増幅する方法は、”全ゲノム増幅”法と呼ばれる。このような方法の例は、多重置換増幅(MDA)、鎖置換増幅(SDA)または超分岐鎖置換増幅を含み、そのそれぞれは、縮重プライマーを用いて実施することができる。特に有用な方法は、全ゲノム配列決定プラットフォームの商用プロバイダによって推奨される試料調製中に用いられる方法である(例えばIllumina社、サンディエゴおよびLife Technologies社、カールズバッド)。他の有用な方法は、米国特許第7,670,810号(これは参照により本願に組み込まれる)で述べられている。
核酸の一部のみを選択的に増幅するために、それが標的核酸、改変核酸、核酸断片または本明細書に記載の他の核酸であっても、標的増幅(targeted amplification)を用いることができる。標的増幅技術の例は、限定するものではないが、多重PCR、GoldenGateアッセイ(Illumina社、サンディエゴ)、ローリングサークル増幅および当該技術分野で公知の他の方法、例えば米国特許第7,670,810号;米国特許第6,355,431号または米国特許第7,582,420号に記載されている方法(それぞれは参照により本願に組み込まれる)を含む。ゲノムの標的領域を選択的に濃縮し、場合により増幅するための他の有用な方法は、標的プローブプルアウト技術(targeted probe pullout technique)、例えばIllumina社(TruSeq(登録商標)ブランド)、NimbleGen社(SeqCap EZ(登録商標)ブランド)またはAgilent社(SureSelect(登録商標)ブランド)によって商業化されたものを含む。

いくつかの実施形態において、インサートを挿入する前に、または本明細書に記載の他の改変を行う前に標的核酸試料を断片化することができる。いくつかの実施形態において、断片化は、例えば、隣接するプライマーがハイブリダイズする部位間に存在する鋳型の部分が選択的にコピーされる場合に、増幅から本来的に生じる。別の場合では、断片化は、当該技術分野で公知の化学的、酵素的または物理的技術を用いて達成することができる。所望のサイズ範囲内の断片は、当該技術分野で公知の分離法、例えばゲル電気泳動またはSPRI(登録商標)ビーズ(AgenCourt社、ビバリー、マサチューセッツ州)による精製を用いて得ることができる。従って、大きくて長さ約10kb、5kb、4kb、3kb、2kb、1kb、0.8kb、0.6kb、0.5kb、0.4kb、0.2kbまたは0.1kb以下のインサートを挿入する前に、標的DNAポリマーを得るために断片化を行うことができる。これに代えて、あるいはこれに加えて、上記に例示されたものから選択される最大サイズおよび長さ少なくとも約0.1kb、0.5kb、1kb、2kb、3、kb、4kb、5kb、10kb以上の最小サイズを有する標的核酸ポリマーを得るためにサイズ選択を用いることができる。
本開示の方法は、標的核酸ポリマーを改変して改変核酸ポリマーを生成し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域を含む工程を含むことができる。例示的な改変は、限定するものではないが、トランスポザーゼ酵素を標的核酸に結合させてトランスポソームを形成させ、標的核酸にインサートを挿入し、ビーズまたは他の担体に標的核酸を付着させるか、または支持体の表面に標的核酸に付着させ、ここで続いて断片が捕捉されることを含む。

特定の実施形態において、標的核酸ポリマーは、1以上のインサートを該ポリマーに挿入することによって改変されることができる。従って、本開示の方法は、標的核酸ポリマーにインサートを挿入し、それによって改変核酸を調製することを含むことができる。挿入のいくつかの方法は、インサートを標的核酸に組み込むのに十分な条件下で、酵素、例えばトランスポザーゼまたはインテグラーゼの存在下で、トランスポゾン因子を有するインサートを標的核酸に接触させることを含む。いくつかの実施形態において、標的核酸へのインサートの挿入がランダムではないことができる。いくつかの実施形態において、トランスポゾン因子を有するインサートは、特定部位での組み込みを阻害する1以上のタンパク質の存在下で標的核酸と接触されることができる。例えば、インサートは、タンパク質を含むゲノムDNA、クロマチンを含むゲノムDNA、ヌクレオソームを含むゲノムDNAまたはヒストンを含むゲノムDNAへの組み込みを阻害されることができる。
標的核酸にインサートを挿入する工程は、例えば図1に示すように、溶液中の標的核酸に関して行うことができる。以下にさら詳細に説明するように、続いて固体支持体の表面に付着する断片を調製するために、溶液相標的核酸を用いることができる。別の実施形態において、標的核酸が固相担体に付着している間に標的核酸にインサートが挿入されるように、標的核酸はビーズまたは他の固相担体上に捕捉されることができる。図5は、付着したトランスポザーゼを有するビーズ100、溶液相標的核酸の存在下での同様なビーズ110および、標的核酸がビーズの表面上のトランスポザーゼに結合したビーズ120を示す。該標的核酸は、該ビーズの表面でタグメント化されることができる。固相担体は、固体担体材料(すなわち堅い)から製造されることもできるし、その材料が堅いかまたは圧縮性であるかにかかわらず(例えばハイドロゲルビーズ)、他の不溶性物質から製造されることもできる。

固相上の標的核酸にインサートを挿入するために用いることができる他の実施形態を図6に示す。この例において、ビーズ200は、改変核酸に挿入されたインサートに相補的な核酸プローブに付着している。インサートは、トランスポザーゼによって改変核酸に挿入されており、改変核酸は、プローブのインサートへのアニーリングによってビーズ210に結合して固相改変核酸を形成する。トランスポソームは、ビーズに結合するときに改変核酸上に存在することもできるし(図6に示すように)、あるいはトランスポソームは、この結合の前に除去されることもできる。固相改変核酸は、ビーズ上で断片化して、固相核酸断片を有するビーズ220を生成することができる。
本明細書に記載の種々の標的核酸または改変核酸のいずれも、ビーズまたは他の固相担体に付着させることができる。従って、標的核酸、改変核酸または核酸断片を製造し、使用するための本明細書に記載の工程は、固相付着の前または後に実施することができる。例えば、標的核酸はビーズまたは他の固相担体に結合されることができ、次いでこの付着した標的核酸は、インサートを導入するトランスポザーゼ、インテグラーゼまたは他の試薬で処理されることができる。さらにまた、インサートは固相標的核酸に挿入される必要はなく、かわりに固相標的核酸はインサートの挿入無しで断片化されることができる。標的核酸、改変核酸またはそれらの断片に付着したビーズまたは他の固相担体は、核酸断片が配列決定されるかまたは他の方法で検出される表面を有する容器に送達されることができる。

固相標的核酸にインサートを挿入するさらなる例を図7に示す。パネルAに示すように、標的核酸は、標的核酸の末端部位またはその付近の結合によって表面に結合している。必要に応じて、標的核酸上の他の部位付着させることができる。パネルBにおいて、トランスポザーゼは固相標的核酸に結合して複数の固相トランスポソームを形成している。パネルCに示すように、標的核酸はタグメント化されて、表面から複数の異なる断片が生成されることができる。放出された断片は、次いで、標的核酸が捕捉されされていた部位に近接した表面上の領域に再捕捉されることができる。捕捉された断片はさらに操作され、本明細書に記載の方法を用いて検出されることができる。
溶液相標的核酸または固相標的核酸を用いるいずれの場合でも、インサートは、種々の部分または一部分のいずれかを有することができる。特定の実施形態において、インサートは、標的核酸中の特定の配列にインサートのトランスポゾン因子を組み込むために、アフィニティタグに結合することができる。例えば、インサートは、特定の核酸配列、例えばヒストン、クロマチン結合タンパク質、転写因子、開始因子などおよび、特定の配列特異的核酸結合タンパク質に結合する抗体または抗体断片を標的とするタンパク質に結合することができる。例示的な実施形態において、インサートはアフィニティタグ、例えばビオチンと会合し、アフィニティタグは核酸結合タンパク質と会合する。

トランスポゾン因子を含むいくつかのインサートの組み込み中に、標的核酸の組み込み部位におけるいくつかの連続ヌクレオチドは、組み込まれた生成物において複製されることが理解できるであろう。従って、組み込まれた生成物は、例えば国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023(そのそれぞれは参照により本願に組み込まれる)に記載されているように、得られた改変核酸におけるインサート領域の各末端に複製された配列を含むことができる。複製された配列は宿主タグとして用いることができる。例えば、Tn5トランスポザーゼは標的核酸に結合して、いずれかの鎖に9塩基離れてDNA骨格中に2つのニックを生成する。この9塩基領域は、隣接断片に存在する宿主タグを提供する。このタグは、表面で近接し、同様に同じタグ配列を有する断片が、実際に同じ標的核酸に由来したかどうかを確認するために用いることができる。従って、このタグは、エラーを確認するために、断片配列のアセンブリを容易にするために、またはハプロタイプ相を決定するため用いることができる。

いくつかの実施形態において、本明細書で提供される複数のインサートが特定の標的核酸ポリマーに挿入される。いくつかの実施形態は、ポリマー中に組み込まれた各トランスポゾン配列の平均距離が標的核酸中の特定の連続ヌクレオチドの特定の数である、標的核酸ポリマーへの複数のトランスポゾン配列の組み込みを達成するのに十分な選択条件を含む。いくつかの実施形態において、標的核酸におけるインサート間の距離または平均距離が少なくとも約5、10、20、30、40、50、60、70、80、90、100以上の連続ヌクレオチドであるように条件が選択されることができる。いくつかの実施形態において、標的核酸におけるインサート間の距離または平均距離は、少なくとも約100、200、300、400、500、600、700、800、900、1000以上の連続ヌクレオチドである。いくつかの実施形態において、標的核酸におけるインサート間の距離または平均距離は、少なくとも約1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、90kb、100kb以上の連続ヌクレオチドである。いくつかの実施形態において、標的核酸におけるインサート間の距離または平均距離は、少なくとも約100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、1000kb以上の連続ヌクレオチドである。上記で述べた閾値に変えて、あるいはそれに加えて、標的核酸におけるインサート間の距離または平均距離は、多くて約1000kb、500kb、100kb、10kb、5kb、1kb、500塩基、100塩基、50塩基または10塩基であることができる。

いくつかの実施形態は、核酸中の配列の全部または一部をコピーすることを含むことができる。例えば、いくつかの実施形態は、インサートに組み込まれた改変核酸またはその断片のプライミング部位にプライマーをハイブリダイズさせることを含む。いくつかのこのような実施形態において、プライマーはプライミング部位にハイブリダイズし、伸長することができる。コピーされた配列は、標的核酸またはその断片の少なくとも一部を含むことができる。いくつかの実施形態において、プライマーは配列決定プライマーであることができる。いくつかの実施形態において、配列決定データは、配列決定プライマーを用いて得られる。本明細書に記載の方法のいくつかの実施形態は、1以上のインサートの少なくとも一部および標的核酸またはその断片の少なくとも一部を含む配列を増幅することを含むことができる。いくつかの実施形態において、標的核酸(またはその断片)の少なくとも一部は、標的核酸ポリマーに組み込まれたインサートのプライミング部位にハイブリダイズするプライマーを用いて増幅されることができる。

特定の実施形態において、インサートはトランスポザーゼによって標的核酸ポリマーに挿入される。トランスポザーゼは、トランスポゾン因子を含むインサートと機能性複合体を形成し、それによってトランスポソームを形成することができる。このようにして形成されたトランスポソームは、標的核酸ポリマーにインサートを組み込むための転移反応を触媒することができる。いくつかのこのような挿入イベントにおいて、トランスポザーゼ認識部位の1つの鎖が標的核酸に導入されることができる。
いくつかの実施形態は、高活性Tn5トランスポザーゼおよびTn5型トランスポザーゼ因子(例えば、Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998)を参照のこと(これは参照により本願に組み込まれる))またはMuAトランスポザーゼならびにR1およびR2末端配列を含むMuトランスポザーゼ因子(例えば、Mizuuchi, Cell, 35: 785, (1983)および Savilahti, et al., EMBO J., 14: 4893, (1995)を参照のこと(そのそれぞれは参照により本願に組み込まれる))の使用を含むことができる。高活性Tn5トランスポザーゼと複合体を形成する例示的なトランスポザーゼ因子(例えばEZ-Tn5(登録商標)トランスポザーゼ、Epicentre Biotechnologies社、マディソン、ウィスコンシン州)は、国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023に記載されている(そのそれぞれは参照により本願に組み込まれる)。

本明細書で提供される特定の実施形態に用いることができる転移システムのさらなる例は、スタフィロコッカス・アウレウス(Staphylococcus aureus)Tn552(Colegio et al., J. Bacteriol., 183: 2384-8 (2001); Kirby et al., Mol. Microbiol., 43: 173-86 (2002))、Ty1(Devine & Boeke, Nucleic Acids Res., 22: 3765-72 (1994)および国際公開番号WO 95/23875)、トランスポゾンTn7 (Craig, Science 271: 1512 (1996); Craig, Curr Top Microbiol Immunol., 204:27-48 (1996))、Tn/OおよびIS10(Kleckner et al., Curr Top Microbiol Immunol., 204:49-82 (1996))、マリナートランスポザーゼ(Lampe et al., EMBO J., 15: 5470-9, (1996))、Tc1(Plasterk, Curr. Topics Microbiol. Immunol., 204: 125-43, (1996))、P因子(Gloor, Methods Mol. Biol., 260: 97-114, (2004))、Tn3(Ichikawa & Ohtsubo, J Biol. Chem. 265:18829-32, (1990))、細菌挿入配列(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, (1996))、レトロウイルス(Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, (1989))および酵母のレトロトランスポゾン(Boeke & Corces, Annu Rev Microbiol. 43:403-34, (1989))を含む。さらなる例は、IS5、Tn10、Tn903、IS911およびトランスポザーゼファミリー酵素の操作されたバージョンを含む(Zhang et al., PLoS Genet. 5:e1000689. Epub 2009 Oct 16; and Wilson et al J. Microbiol. Methods 71:332-5 (2007))。このパラグラフに引用された文献は参照により本願に組み込まれる。

本明細書で提供されるいくつかの実施形態は、トランスポゾン因子を有するインサート、トランスポゾン因子を有する改変核酸ポリマーまたはトランスポゾン因子を有する核酸断片を含む。いくつかの実施形態において、トランスポゾン因子は、本明細書に記載の他の部位、例えば第2トランスポゾン因子に対するリンカー、増幅のプライミング部位、プライマー伸長法に基づく検出(例えばSBS検出)のためのプライミング部位、結合部分および／または切断部位に加えてインサート中にも存在する。図1は、他の部位に加えてトランスポゾン因子を含むインサートの概略図を示す。
トランスポゾン因子は、トランスポザーゼまたはインテグラーゼの特異的結合部位を含む2つの核酸鎖を含むことができる。該鎖は、それらの長さに沿って完全に相補的であることもできるし(例えば二本鎖核酸)、それらの長さの少なくとも一部に沿って相補的であることもできる(例えば叉状アダプター、非相補的オーバーハングを有するアダプターなど)。アニーリングした部位における相補鎖およびアニーリングしてない部位を形成する非相補鎖を形成する部位を有する二本鎖トランスポゾン因子の例示的な実施形態を図1に示す。

特定の実施形態において、インサートは、互いに結合される2つのトランスポゾン因子を含む。第1トランスポゾン因子が第2トランスポゾン因子に連続するようにインサート内にリンカーを含むことができる。特に有用なインサートは、国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023(そのそれぞれは参照により本願に組み込まれる)に記載の”ループした(looped)”複合体を形成する。このような構造体において、連続したトランスポゾン因子を有する単一インサートは、”ループした”複合体を形成する2つのトランスポザーゼサブユニットに結合する。ループした複合体は、元の標的核酸順序づけ情報を維持し、得られた改変核酸ポリマーを断片化しないで標的核酸にインサートを挿入するために用いることができる。ループしたトランスポゾン因子の挿入は、標的核酸を必ずしも断片化しないで標的核酸にインサートを挿入することを提供する。以下にさらに詳細に示すように、得られた改変核酸ポリマーは、その後の工程で断片化されることができる。
有用なリンカーは、限定するものではないが、1以上のヌクレオチド、核酸、化学物質部分を含む非ヌクレオチド、ヌクレオチドアナログ、アミノ酸、ポリペプチドまたはタンパク質を含む部分を有することができる。好ましい実施形態において、リンカーは核酸部分を含む。リンカーは、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20以上のヌクレオチドを含むことができる。これに代えて、あるいはこれに加えて、リンカーは、多くて約100、50、20、10、9、8、7、6、5、4、3、2または1のヌクレオチドを含むことができる。好ましい実施形態において、リンカーは、例えば自己挿入を防ぐために、二本鎖ME末端間で一本鎖である。

リンカーは、例えば1以上の非核酸部分を含むことによって増幅不能であることができる。場合によっては、リンカーは任意の核酸材料を含まず、完全にヌクレオチドを欠き得る。増幅不能リンカーの例は、合成リンカー、例えばアルキル、プロピル、PEGから選択される部分を含むリンカー；非天然塩基、例えばIsoC、isoG;またはDNAベース増幅スキームにおいて増幅しない任意の基を含む。例えば、isoC、isoG対を含むトランスポゾンは、相補性isoGおよびisoCを欠くdNTP混合物で増幅させて、挿入されたトランスポゾンのすべてにわたって増幅が起こらないことを確実にすることができる。
特定の実施形態において、増幅不能リンカーはモザイク末端(ME)領域に導入されることができる。例えば、インサートは、以下の配置:ME-プライミング部位-リンカー-プライミング部位-MEを有することができる。プライミング部位は同一であることもできるし、異なることもできる。例えば、図1に示した構築物に示すように、プライミング部位はともにP5プライミング部位であることができる。しかしながら、図1の構築物は、2つのP7プライミング部位がリンカーによって接続されるか、または叉状アダプターの1つにおけるP5プライミング部位が、他の叉状アダプターにおけるP7プライミング部位に結合するように改変されることができることは理解されるであろう。P5およびP7プライミング部位は、米国特許第8,563,477号(これは参照により本願に組み込まれる)に記載されている。

必ずしも標的核酸を断片化しないで標的核酸にインサートを挿入するさらなる方法には、片面転移(one-ended transposition)がある。片面転移は、標的DNAの転移部位のただ1つの鎖にニックを入れインサートを直接的に挿入するために用いることができる。図8に概略例を示す。トランスポザーゼを含む様々な酵素を片面転移に用いることができる。例えば、Mu、Tn5およびRag様トランスポザーゼは、片面転移を行うことが示されている。Muの特定の変異体(例えばMu E392Q)は、両面転移以上に片面転移に対して選択性を示す(Haapa et al. Nucl. Acids Res.27:2777 (1999)を参照のこと(これは参照により本願に組み込まれる))。
片面転移を達成するための例示的な方法には、活性および不活性トランスポザーゼモノマーの混合生成物であるトランスポザーゼ二量体の使用がある。不活性なモノマーは、変異誘発、化学修飾またはその両方によって作製されることができる。適切なレベルの片面転移を達成するための活性および不活性モノマーの適切な割合は、統計的推定(例えばポアソン分布)および／または滴定アッセイに基づいて決定されることができる。特定の実施形態において、トランスポザーゼ二量体は、多くて50%、25%、10%、5%、1%、0.1%または0.01%の活性モノマーを含む活性および不活性モノマーの混合物から形成させることができる。

片面転移を達成するための他の方法には、活性トランスポザーゼ二量体に加えて反応性および非反応性トランスポゾン因子の混合物の使用がある。例示的な非反応性トランスポゾン因子は、3’末端でブロックされる(例えば3’末端におけるジデオキシヌクレオチドまたは3’末端における伸長ブロッキング部分によって)ものを含む。特定の実施形態において、トランスポゾン二量体は、多くて50%、25%、10%、5%、1%、0.1%または0.01%の反応性因子を含む反応性および非反応性トランスポゾン因子の混合物から形成させることができる。
片面転移を達成すると考えられる他の方法には、モノマーのトランスポソームの使用がある。モノマーのトランスポソームは、トランスポザーゼタンパク質の二量体化接触の改変または除去によって生じると考えられる。除去は、二量体接触を形成するタンパク質構造の一部欠失させるモノマーの変異誘発および／または二量体化に関与するアミノ酸を改変するための点突然変異によって達成されることができる。これに代えて、あるいはこれに加えて、二量体接触ポイントを化学修飾によって改変することができる(例えば二量体接触領域に存在する天然アミノ酸部位または二量体接触領域に導入される反応性システインまたはリジンなどの変異アミノ酸部位において)。

本明細書に記載の方法または組成物に使用されるインサートは、1以上のプライミング部位を含むことができる。いくつかの実施形態において、インサートは、単一のタイプのプライミング部位を含む。あるいはまた、インサートは、少なくとも1以上または2以上のプライミング部位を含むことができる。このような実施形態におけるプライミング部位の向きは、第1プライミング部位にハイブリダイズするプライマーと第2プライミング部位にハイブリダイズするプライマーとが同じ向きであることもできるし、異なる向きであることもできる。一実施形態において、インサートにおけるプライミング部位の配列は、増幅のために用いられるプライマーに相補的であることができる。これに代えて、あるいはこれに加えて、プライミング部位の配列は、配列決定または他のプライマー伸長法ベース検出技術に用いられるプライマーに相補的である。他の実施形態において、増幅プライマーに相補的な第1プライミング部位および配列決定または他のプライマー伸長法ベース検出技術に用いられるプライマーに相補的な第2プライミング部位の2つのプライミング部位がインサート中に存在することができる。

いくつかの実施形態において、インサートは、第1プライミング部位および第2プライミング部位を含み、1以上の他の部位、例えば以下または本明細書の他の部分で示す切断部位、結合部分、リンカーまたは他の部分がこれらのプライミング部位間に配置される。このような実施形態は、米国特許第7,741,463号の記載に従った指向性配列決定(directional sequencing)に有用な叉状アダプターまたはY型アダプター設計を使用することができる。1例を図1に示す。
いくつかの実施形態において、ユニバーサルプライミング部位を有するインサートを使用することが有利であることができる。例えば、標的核酸は、各鎖に1つ、ユニバーサルプライミング部位の対を含むインサートを含むように改変されることができる。ユニバーサルプライミング部位は、例えば増幅、配列決定および／または標的核酸の同定に用いられるプライマーのハイブリダイゼーションスポットとして用いられるなどの様々な用途を有することができる。2つのプライミング部位が用いられるとき、第1および第2ユニバーサルプライミング部位は、同じでも、実質的に同様でも、類似でも、あるいは異なっても良い。いくつかの実施形態において、第1ユニバーサルプライミング部位(第1プライマーに相補的な)および第2ユニバーサルプライミング部位(第2プライマーに相補的な)を含む標的核酸を調製するために、インサートのトランスポゾン因子は、リンカーによって隔てられた第1トランスポザーゼ認識部位および第2トランスポザーゼ認識部位を含む。第1プライミング部位は、第2プライマー内の配列の逆相補鎖である配列を含むことができる。いくつかの実施形態において、第1プライマー部位は、第2プライマー内の配列に対して二回対称性を有する配列を含む。いくつかの実施形態において、第1プライマー部位は、第2プライマー内の配列に対してC2対称性を有する配列を含む。トランスポザーゼの存在下で、転移によって、複数のインサートが標的核酸に挿入されることができる。組み込まれた配列は、切断されて、それぞれが第1プライミング部位および第2プライミング部位を含む複数の標的核酸断片を生じることができる。

第1ユニバーサルプライミング部位および第2ユニバーサルプライミング部位は、種々の方法によって各標的核酸に組み込まれることができる。例えば、標的核酸は、テールオリゴヌクレオチド(tailed-oligonucleotide)を用いる第1プライミング部位および第2プライミング部位を用いて増幅することができる。当該技術分野では明らかなように、テールオリゴヌクレオチドは、プライマー部位に相補的な配列およびさらなる配列を含むことができる。実施形態の一例において、第1テールオリゴヌクレオチドは、第1プライミング部位に相補的な配列および第1ユニバーサルプライミング部位のための配列を含み、第2テールオリゴヌクレオチドは、第2プライミング部位に相補的な配列および第2ユニバーサルプライミング部位のための配列を含む。さらなる例は、国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023に記載されている(そのそれぞれは参照により本願に組み込まれる)。第1ユニバーサルプライマー部位および第2ユニバーサルプライマー部位を含む核酸配列は、さらなる配列決定方法に用いることができることは理解できるであろう。
本開示の方法または組成物に用いられるインサートは1以上の切断部位を含むことができる。インサートを含む改変核酸ポリマーは、次いで、切断部位で切断されて改変核酸ポリマーの断片を生成することができる。生化学的、化学的、物理的または他の切断機構に感受性を示す切断部位を用いることができる。いくつかの実施形態において、断片化部位は、様々な手段によって断片化されることができるヌクレオチドまたはヌクレオチド配列を含むことができる。例えば、断片化部位は、酵素、例えばヌクレアーゼの支持体であることができる。それぞれの制限エンドヌクレアーゼに特異的に感受性を示すヌクレオチド配列を有する制限エンドヌクレアーゼ部位が特に有用であることができる。

他の例において、断片化部位は、他にデオキシリボヌクレオチドを含むことができ、RNアーゼで切断されることができる核酸において少なくとも1つのリボヌクレオチドを含むことができる。デオキシリボヌクレオチドとリボヌクレオチドの間のホスホジエステル結合を選択的に切断することができる金属イオン、例えば希土類金属イオン(例えばLa³⁺、特にTm³⁺、Yb³⁺またはLu³⁺、Fe(3)またはCu(3))などを含む化学的切断剤または高いpHへの暴露などを使用することができる。
他の例において、切断部位は、ニッカーゼ、すなわち二本鎖核酸の片鎖を切断するニッキングエンドヌクレアーゼの1以上の認識配列を含むことができる。従って、断片化部位は、第1ニッカーゼ認識配列および場合により第2ニッカーゼ認識配列を含むことができる。第1および第2ニッカーゼ認識配列は、互い同じであることもできるし、互いに異なることもできる。
他の例において、切断部位は、非塩基部位を含み、特定の化学薬剤、例えばポリアミン、N,N′-ジメチルエチレンジアミン(DMED)の存在下で断片化部位で切断が可能な1以上のヌクレオチドアナログを含むことができる(例えば、米国特許出願公開第2010/0022403号を参照のこと(これは参照により本願に組み込まれる))。いくつかの実施形態において、非塩基部位は、例えば、ウラシルDNAグリコシラーゼ(UDG)酵素を用いて、切断部位内のウラシルヌクレオチドを改変することによって作製することができる。次いで、非塩基部位を含むポリヌクレオチド鎖は、エンドヌクレアーゼ(例えばエンドIVエンドヌクレアーゼ、APリアーゼ、FPGグリコシラーゼ/APリアーゼ、エンドVIIIグリコシラーゼ/APリアーゼ)、加熱またはアルカリで処理することによって非塩基部位で切断されることができる。非塩基部位はまた、デオキシウリジン以外のヌクレオチドアナログで作製され、類似した方法により、エンドヌクレアーゼ、加熱またはアルカリで処理することによって切断されることができる。例えば、8-オキソグアニンは、FPGグリコシラーゼへの暴露によって非塩基部位に変換されることができる。デオキシイノシンは、AlkAグリコシラーゼへの暴露によって非塩基部位に変換されることができる。このように作製される非塩基部位は、次いで、一般的には適切なエンドヌクレアーゼ、例えばEndo IVまたはAPリアーゼで処理することによって切断されることができる(例えば、米国特許特許出願第2011/0014657号を参照のこと(これは参照により本願に組み込まれる))。

他の例において、断片化部位は、過ヨウ素酸塩(例えば過ヨウ素酸ナトリウム)での処理による切断を可能にするジオール結合を含むことができる。他の例において、断片化部位は、化学的還元剤、例えばトリス(2-カルボキシエチル)ホスフェート塩酸塩(TCEP)での切断を可能にするジスルフィド基を含むことができる。
いくつかの実施形態において、断片化部位は、光分解性部分を含むことができる。光化学的切断は、共有結合を切断するために光を用いる種々の方法のいずれかによって行うことができる。光化学的切断部位は、核酸内の非ヌクレオチド化学物質部分、例えばホスホロアミダイト[4-(4,4'-ジメトキシトリチルオキシ)ブチルアミドメチル)-1-(2-ニトロフェニル)-エチル]-2-シアノエチル-(N,N-ジイソプロピル)-ホスホロアミダイト)によって提供されることができる(Glen Research, Sterling, Va., USA, Cat No. 10-4913-XX)。
いくつかの実施形態において、断片化部位は、ペプチド、例えば、ペプチド分子が核酸に結合したコンジュゲート構造を含むことができる。続いて、ペプチド分子は、適切な特異性のペプチダーゼ酵素または非酵素化学的または光化学的切断の適切な手段によって切断されることができる。いくつかの実施形態において、ペプチドと核酸の間のコンジュゲートは、核酸、例えば二本鎖核酸の片鎖にペプチドを共有結合させることによって形成される。ペプチドと核酸の間のコンジュゲートは、一般に当該技術分野で公知の技術を用いて調製されることができる。このような技術の1つにおいて、所望のアミノ酸およびヌクレオチド配列のペプチドおよび核酸成分は、別々に、例えば標準的自動化学的合成技術によって合成され、次いで水性/有機溶液中でコンジュゲートされることができる。例として、Glen Research社から市販されているOPeC(登録商標)システムは、5′-システイニルオリゴヌクレオチドへのN末端チオエステル官能基化ペプチドの天然ライゲーションに基づいている。

特定の実施形態において、改変核酸ポリマーの断片は、そのポリマーの孤立部分を増幅することによって生成される。例えば、いくつかの実施形態において、改変核酸ポリマーにプライミング部位が挿入され、そのプライミング部位に隣接する領域が、例えば、PCR増幅プロトコルまたは同様な増幅法において、そのプライミング部位にハイブリダイズするプライマーを用いて増幅されることができる。例えば、増幅技術によって断片が生じるいくつかの実施形態において、改変核酸ポリマーは切断部位を含むことを必要としないことが理解できるであろう。
改変核酸をビーズまたは他の固相担体に付着させる場合において、断片はビーズの破壊の破壊によって生成されることができる。例えば、ハイドロゲルビーズは、溶融または溶解されてビーズに付着した断片を放出することができる。

インサートは1以上のリガンドを含むことができる。インサート内に存在するリガンドは、特定の受容体に特異的な結合パートナーであることができる。例えば、リガンドは、固体支持体の表面に存在する受容体に特異的であることができる。このように、受容体-リガンド結合は、改変核酸またはリガンドを有するインサートの一部を含む核酸断片の表面捕捉を容易にすることができる。リガンドと受容体の例は、それぞれ、ストレプトアビジンまたはニッケルに結合することができるビオチンまたはポリHisを含む。他の例は、リガンドと当該技術分野で公知のそれらの受容体の対、例えば、アビジン-ビオチン、ストレプトアビジン-ビオチンおよびビオチン、ストレプトアビジンまたはアビジンの誘導体(限定するものではないが、2-イミノビオチン、デスチオビオチン、ニュートラアビジン(Molecular Probes社、ユージーン、オレゴン州)、CaptAvidin(分子プローブ)を含む)など;結合タンパク質/ペプチド(マルトース-マルトース結合タンパク質(MBP)、カルシウム-カルシウム結合タンパク質/ペプチド(CBP)を含む);エピトープタグを含む抗原-抗体(c-MYC、HA、VSV-G、HSV、V5およびFLAGタグとそれらの対応する抗エピトープ抗体を含む);ハプテン、例えば、ジニトロフェニルおよびジゴキシゲニンとそれらの対応する抗体;アプタマーとそれらの対応する標的;ポリ-Hisタグ(例えばペンタHisおよびヘキサHis)とそれらの結合パートナー(対応する固定化金属アフィニティークロマトグラフィー(IMAC)材料および抗ポリ-His抗体を含む);フルオロフォアと抗フルオロフォア抗体;核酸鎖とそれらの相補鎖;などを含む。

いくつかの実施形態において、インサートはレポーター部分を含むことができる。有用なレポーター部分は、当該技術分野で公知の種々の同定可能なタグ、標識または基のいずれかを含む。特定の実施形態において、レポーター部分はシグナルを放出することができる。シグナルの例は、蛍光性、化学発光性、生物発光性、燐光性、放射性、熱量測定性または電気化学発光性であるものを含む。例示的なレポーター部分は、フルオロフォア、放射性同位体、色原体、酵素、抗原(エピトープタグを含む)、半導体ナノ結晶、例えば量子ドット、重金属、色素、燐光性基、化学発光基、電気化学的検出部分、結合タンパク質、蛍光体、希土類キレート、遷移金属キレート、近赤外色素、電気化学ルミネッセンス標識ならびに質量分析に適用可能なレポーター部分、例えば質量タグ、荷電タグおよび同位体を含む。本明細書に記載の方法および組成物に使用することができるさらなるレポーター部分は、スペクトル標識、例えば蛍光色素(例えばフルオレセインイソチオシアナート、テキサスレッド、ローダミンなど);放射性標識(例えば³H、¹²⁵I、³⁵S、¹⁴C、³²P、³³Pなど);酵素(例えば西洋ワサビペルオキシダーゼ、アルカリホスファターゼなど);スペクトル比色標識、例えば金コロイドまたは色ガラスまたはプラスチック(例えばポリスチレン、ポリプロピレン、ラテックスなど);ビーズ;磁気標識;電気標識;温度標識;および質量タグを含む。

いくつかの実施形態において、複数の異なるインサートを使用することができ、それらの個々のインサートは特有のバーコード配列の存在によって識別することができる。従って、複数のバーコード含有インサートを標的核酸に挿入して、複数の特有のバーコードを有する改変核酸ポリマーを生成することができる。例示的なバーコードならびに調製方法および使用方法は、国際公開番号WO 2012/061832;米国特許出願公開第2012/0208724号、米国特許出願公開第2012/0208705号および国際出願番号PCT/US2013/031023に記載されている(そのそれぞれは参照により本願に組み込まれる)。別の実施形態において、このようなバーコードを使用する必要がないことは理解できるであろう。このことは、例えば、本明細書に記載の方法によって保存される連結性または近接情報が、上記文献に述べられているバーコード付けの方法を必要とせずに標的核酸ポリマーのヌクレオチド配列の正確な表示を得るのに十分である場合に可能である。従って、特定の実施形態において、本明細書に記載の方法に用いられる複数のインサートは、相互比較されるユニーク配列(例えばバーコード)を含まない。代わりに、本明細書に記載の方法に用いられるインサート、本開示の改変核酸ポリマーに存在するインサートまたは本開示の複数の核酸断片に存在するインサートのすべては同じ配列(すなわちユニバーサル配列)を有することができる。従って、本明細書に記載の方法のいくつかの実施形態は、改変核酸ポリマーまたはその断片に存在することもしないこともある個々のインサートの配列を区別する(すなわちあるインサートを別のインサートと区別する)ことなしに行われる。

本開示の方法は、流体中に改変核酸ポリマーの断片を放出する工程を含むことができる。いくつかの実施形態において、断片のそれぞれは、前もって核酸ポリマーに挿入されたインサートの少なくとも一部を含む。特定の実施形態において、工程は、(i)固体支持体表面と改変核酸ポリマーとを接触させ、(ii)流体中に改変核酸ポリマーの断片を放出すること、を含むことができる。複数の異なる改変核酸ポリマーが固体支持体表面と接触される場合、個々の改変核酸ポリマーが互いに空間的に分離されているという条件下でそれを行うことが一般に有益である。例えば、ポリマーは、表面に捕捉されたとき、容器中または表面上の最も近い近傍ポリマー間の平均距離が最も近い近傍断片に所望される平均距離と同じ相対範囲にあるように、表面を有する容器(例えば容器は検出表面を有するフローセルであることができる)に比較的薄い濃度で送達されることができる。同様な空間分離は、ビーズに付着した改変核酸ポリマーを送達することによって達成することができる。放出された断片が増幅の鋳型として用いられて表面上のクラスター(またはコロニー)を形成する場合、最も近い近傍ポリマー間の距離は、ひとたびそれらが表面で増幅される場合、クラスターの所望の平均ピッチの範囲であることができる。

特定の実施形態において、複数の異なる改変核酸ポリマーはフローセル(または他の容器)に送達されて、断片が続いて付着する表面と接触している流体を介して(能動的または受動的に)拡散させられることができる。従って、ポリマーは、ポリマーを含む溶液を初めにフローセルに流入させ、次いで流れを停止させて拡散させるストップ・フロー条件で送達することができる。3つの異なる改変核酸ポリマーが、フローセルの表面に沿った位置まで拡散させられる実施形態の概略例を図2に示す。図で例示されるように、固体支持体表面は、場合により、ポリマー上に存在する結合パートナーに結合する捕捉部分を含むことができる。本明細書に記載のまたは当該技術分野で公知の種々の受容体およびリガンドのいずれもこの目的のために使用することができる。従って、インサートは、リガンドを含むことができ、固体支持体表面は、固体支持体表面との改変核酸ポリマーの接触が表面に改変核酸ポリマーを付着させるように、リガンドのための受容体を含むことができる。

改変核酸は、ビーズなどの固相担体に付着させることができ、ビーズは、固相表面を有する容器に送達されることができる。図5は、ビーズ上の例示的な改変標的核酸を示す。図6は、ビーズ上の改変標的核酸のもう1つの例を示す。標的核酸、改変核酸またはその断片を有する固相担体は、固体支持体表面に接触させることができ(例えば重力沈降によって)、場合によっては、受容体およびリガンドまたは本明細書に記載の他の手段を用いて表面に付着させることができる。
ひとたび、1以上の異なる改変核酸が、固体支持体表面上のそれぞれの領域の部位またはその付近に存在すれば、改変核酸の断片を生成することができる。いくつかの実施形態において、異なる改変核酸ポリマーは、ポリマーの断片が生成されるように切断されることができる。切断は、改変核酸ポリマーに組み込まれたインサートに存在する切断部位で生じることができる。これに代えて、あるいはこれに加えて、断片は、改変核酸の配列領域を増幅することによって生成されることができる。例えば、増幅は、改変核酸に挿入されたインサート上のプライミング部位にアニーリングするプライマーを用いて行うことができる。断片の一本鎖バージョンを作製するために、場合により変性を行うことができる。1以上の改変核酸ポリマーから生成された断片は、以下のさらなる詳細に従って、固体支持体表面上の位置にランダムに捕捉されることができる。

改変核酸ポリマーまたはその断片の受動拡散に代わるものとして、分子を所望の位置に移動させるために、または分子の空間配置に影響を与えるために、能動輸送技術を用いることができる。特に有用な能動輸送技術は、電場補助(電場アシスト)輸送である。例えば、アレイの1以上の領域は、動力源に電気的に連結されて標的核酸ポリマーまたはその断片を誘引する電荷を生じることができる。1形態において、正電荷は、負に荷電した糖-リン酸骨格によって核酸に誘引されることができる。表面に核酸を誘引するために電場アシストを用いるための例示的な方法および装置は、米国特許出願公開第2009/0032401 A1号または米国特許出願第13/783,043号(そのそれぞれは参照により本願に組み込まれる)に記載されている。核酸を能動的に輸送するための他の有用な技術は、限定するものではないが、正または負の圧力下の流体流、遠心分離によって誘起される重力、化学的または温度勾配に沿った移動などを含む。
改変核酸ポリマーの空間配置は、本明細書に記載の方法において操作されることができる。特定の実施形態において、該ポリマーは、例えば化学的条件、温度条件または電気条件を用いて比較的コンパクトな配置に折りたたまれることを誘導することができる。コンパクトな構造を作成するための例示的な条件は、米国特許出願公開第2008/0242560 A1号または米国特許出願公開第2008/0234136 A1号(そのそれぞれは参照により本願に組み込まれる)に記載のDNAナノボールを作製するために用いられるものを含む。あるいはまた、改変核酸ポリマーの1以上は、引き延ばされた配置に引き延ばされるかまたは別なふうに形成されることができる。例えば、ポリマーは、(例えばポリマーの末端部位またはその付近で)表面に付着し、表面上の領域に沿って引き延ばされることができる。ポリマー由来の断片は、本明細書に記載の方法に従って、最終的に表面上の領域に付着することができる。核酸ポリマーを引き延ばすための例示的な技術は、限定するものではないが、流体流による引き延ばし、弱い力による引き延ばし、電場アシストによる引き延ばしまたは当該技術分野で公知の他の方法、例えば米国特許出願公開第2012/0129704 A1号に記載されているもの(これは参照により本願に組み込まれる)を含む。従って、本発明の方法は、(i)固体支持体表面に沿って改変核酸ポリマーを引き延ばし、(ii)流体中に改変核酸ポリマーの断片を放出する工程、を含むことができる。

本開示の方法において、所望の長さの断片を得るために条件を選択することができる。例えば、長さは、標的核酸ポリマーにインサートを挿入するために用いられる条件によって影響を受けることができる。インサートが切断部位を含む場合、切断から得られる断片の長さは、ポリマー内のインサート間の平均距離に関連する。断片の平均サイズは、切断反応の進行の完了の程度によっても影響を受けることができる。実質的完了まで進む切断反応は、改変核酸ポリマー中の切断部位間の平均距離に関連性を示す断片を生成するが、部分完了まで進む切断反応は、切断部位間の平均距離より大きな平均長さの断片を生成するであろう。
いくつかの実施形態において、絶対または平均断片長さは、少なくとも約5、10、20、30、40、50、60、70、80、90または100以上のヌクレオチドであることができる。いくつかの実施形態において、絶対または平均断片長さは、少なくとも約100、200、300、400、500、600、700、800、900または1000以上のヌクレオチドであることができる。いくつかの実施形態において、絶対または平均断片長さは、少なくとも約1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、90kbまたは100kb以上のヌクレオチドであることができる。いくつかの実施形態において、絶対または平均断片長さは、少なくとも約100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kbまたは1000kb以上のヌクレオチドであることができる。上記の閾値に代えて、あるいはそれに加えて、絶対または平均断片長さは、多くて約1000kb、500kb、100kb、10kb、5kb、1kb、500塩基、100塩基、50塩基または10塩基以下であることができる。

いくつかの実施形態において、標的核酸、改変核酸または核酸断片は、固体支持体の表面に付着させることができる。固体担体は二次元または三次元であることができ、平らな表面(例えばスライドガラス)であることもできるし、形を有することもできる。有用な材料は、ガラス(例えば定孔ガラス(CPG))、石英、プラスチック(例えばポリスチレン(低架橋および高架橋ポリスチレン)、ポリカーボネート、ポリプロピレンおよびポリ(メチルメタクリレート))、アクリル酸共重合体、ポリアミド、シリコン、金属(例えばアルカンチオレート誘導体化金)、セルロース、ナイロン、ラテックス、デキストラン、ゲルマトリックス(例えばシリカゲル)、ポリアクロレインまたは複合物を含む。適切な三次元固体担体は、例えば、スフェア、ミクロ粒子、ビーズ、膜、スライド、プレート、マイクロマシンチップ、チューブ(例えばキャピラリーチューブ)、マイクロウェル、ミクロ流体装置、溝、フィルターまたは核酸の固定に適した任意の他の構造体を含む。固体担体は、核酸またはプライマーの集団を含む領域を有することができる平面マイクロアレイまたはマトリックスを含むことができる。例は、ヌクレオシド誘導体化CPGおよびポリスチレンスライド;誘導体化磁気スライド;ポリエチレングリコールでグラフトされたポリスチレンなどを含む。

固体支持体の表面に核酸を付着、定着または固定するために様々な方法を用いることができる。付着は、表面に直接または間接に結合することによって達成されることができる。この結合は共有結合によることができる。Joos et al. (1997) Analytical Biochemistry, 247:96-101; Oroskar et al. (1996) Clin. Chem., 42:1547-1555; and Khandjian (1986) Mol. Bio. Rep., 11:107-11を参照のこと(そのそれぞれは参照により本願に組み込まれる)。好ましい付着は、表面に組み込まれたエポキシドへの核酸の末端ヌクレオチドの直接のアミンの結合である。この結合はまた、非共有結合によることもできる。例えば、ビオチン-ストレプトアビジン(Taylor et al. (1991) J. Phys. D: Appl. Phys., 24:1443(これは参照により本願に組み込まれる))およびジゴキシゲニン-抗ジゴキシゲニン(Smith et al., Science, 253:1122 (1992)(これは参照により本願に組み込まれる))は、表面に核酸を固定するための共通のツールである。
表面への核酸の付着は、中間構造体、例えばビーズ、粒子またはゲルによることができる。ゲルによるアレイへの核酸の付着は、Illumina社(サンディエゴ、カリフォルニア州)により市販されているフローセルにより例示され、あるいは米国特許出願公開第2010/0111768 A1号もしくは第2012-0270305 A1号;またはWO 05/065814に記載されている(そのそれぞれは参照により本願に組み込まれる)。本明細書に記載の方法および装置に用いることができる例示的なゲルは、限定するものではないが、コロイド構造を有するもの、例えばアガロース;ポリマーメッシュ構造を有するもの、例えばゼラチン;または架橋ポリマー構造を有するもの、例えばポリアクリルアミド、SFA(例えば、米国特許出願公開第2011/0059865 A1号を参照のこと(これは参照により本願に組み込まれる)またはPAZAM(例えば米国仮特許出願第61/753,833号およびWIPO PCT/US2013/044305(そのそれぞれは参照により本願に組み込まれる))を含む。

本開示は、固体支持体表面に付着させる前に標的核酸が改変されるいくつかの実施形態を記載しているが、付着の前に標的核酸を改変する必要はないことは理解できるであろう。例えば、標的核酸は、本明細書に記載の方法によって改変される前に固体支持体に付着させることができる。標的核酸が固体支持体表面に付着させた後にトランスポザーゼ処理を行うことができる。標的核酸が表面に付着し(パネルA)、トランスポザーゼで処理され、タグメンテーションによって複数の断片を生じ(パネルB)、インサートを含むいくつかの断片の溶液への放出をもたらす(パネルC)、例示的な実施形態を図7に示す。断片は、固体支持体表面上の領域内の部位にランダムに捕捉されることができる。複数の異なる標的核酸が表面上の異なる領域に付着する実施形態において、断片は放出され、各標的核酸からの断片が、それぞれの領域内の異なる位置にランダムに行き着く条件下で捕捉されることができる。捕捉された断片は、場合により、本明細書に記載のさらなる詳細に従って増幅および／または検出されることができる。
標的核酸ポリマーにインサートを挿入するためにトランスポザーゼを用いる実施形態に関して、トランスポザーゼは、インサート-改変核酸ポリマーが支持体の表面に接触される時点で存在することもできるし、接触を行う前にインサート-改変核酸ポリマーから除去されることもできる。特定の実施形態において、トランスポザーゼは、固体支持体の表面でそれぞれのリガンドまたは受容体に結合する受容体またはリガンドを含むことができる。これに代えて、あるいはこれに加えて、固体支持体への結合を媒介するリガンドまたは受容体は、改変核酸ポリマーのインサート中に存在することができる。従って、インサートは、トランスポザーゼが改変核酸ポリマーに結合するかしないかにかかわらず、表面への結合を媒介することができる。トランスポザーゼは、当該技術分野で公知の方法、例えば熱変性、化学的変性(例えば界面活性剤処理)または1以上のプロテアーゼによる処理を用いて核酸から除去されることができる。

多くの実施形態において、本明細書に記載の方法において核酸が付着する固体支持体は、連続表面またはモノリシック表面を有することができる。従って、断片は、最も近傍の断片(または断片由来の最も近傍のクラスター)間の距離が不定である空間的にランダムな位置に付着することができる。得られたアレイは、フィーチャの不定またはランダム空間パターンを有する。あるいはまた、本明細書に記載の方法に用いられる固体支持体は、繰り返しパターンで存在するフィーチャのアレイを含むことができる。このような実施形態において、フィーチャは、改変核酸ポリマーまたはその断片が付着することができる位置を提供する。特に有用な繰り返しパターンは、六角形パターン、直線パターン、グリッドパターン、反射対称を有するパターン、回転対称を有するパターンなどである。改変核酸ポリマーまたはその断片が付着するフィーチャは、それぞれ約1mm²、500μm²、100μm²、25μm²、10μm²、5μm²、1μm²、500nm²または100nm²より小さい面積を有することができる。これに代えて、あるいはこれに加えて、各フィーチャは、約100nm²、250nm²、500nm²、1μm²、2.5μm²、5μm²、10μm²、100μm²または500μm²より大きい面積を有することができる。アレイの断片の増幅から生じる核酸のクラスターまたはコロニーは(パターンを有する場合でも、空間的にランダムな場合でも)、同様に、上記に例示されたものから選択される上限値および下限値より上のまたはその間の範囲内の面積を有することができる。

表面にフィーチャのアレイを含む実施形態に関して、フィーチャは、格子間領域によって隔てられることによって不連続であることができる。あるいはまた、表面上のフィーチャの一部または全部は隣接する(すなわち格子間領域によって隔てられていない)ことができる。フィーチャが不連続の場合でも隣接している場合でも、フィーチャの平均サイズおよび／またはフィーチャ間の平均距離は、アレイが高密度、中密度または低密度であることができるように変えることができる。高密度アレイは、約15μm未満の平均ピッチを有するフィーチャを有することで特徴づけられる。中密度アレイは、約15〜30μmの平均フィーチャピッチを有し、低密度アレイは30μmを超える平均フィーチャピッチを有する。本発明に有用なアレイは、例えば100μm、50μm、10μm、5μm、1μmまたは0.5μm未満のフィーチャピッチを有することができる。これに代えて、あるいはこれに加えて、フィーチャピッチは例えば0.1μm、0.5μm、1μm、5μm、10μm、50μmまたは100μmを超えることができる。
いくつかの市販の配列決定プラットフォームは、配列検出工程において、検出試薬(例えば、454 LifeSciences社(Roche社(バーゼル、スイス)の子会社)から入手できるプラットフォームにおけるピロリン酸塩またはIon Torrent社(Life Technologies社(カールズバッド、カリフォルニア州)の子会社)から入手できるプラットフォームにおけるプロトン)の拡散に対するバリアを提供するウェルを有する支持体に依存する。本明細書に記載の方法は、フェージング情報または近接情報が保存されるようにウェルに改変核酸の断片を送達するのに有利であることができる。

本開示の方法は、固体支持体表面上の改変核酸ポリマーからの断片を捕捉する工程を含むことができる。一般に、断片は、前もってポリマーから流体中に放出され、次いで表面上の特定の位置にランダムに断片が行き着くように流体から捕捉される。位置はモノリシック表面または連続表面上であることもできるし、あるいは位置は、パターンのあるアレイ上のプレハブフィーチャであることもできる。このように、断片が付着する位置は、フィーチャの空間パターンがランダムであろうとなかろうと、どこに任意の特定の断片が付着するか(すなわちどの核酸配列が特定の位置に存在するか)という予測可能性または知識に関してランダムであることができる。
流体中の断片は、受動拡散または能動輸送によって表面上の位置にランダムに輸送されることができる。このような輸送に用いることができる例示的な条件および技術は当該技術分野で公知であるか、または表面への改変核酸の輸送との関係において本明細書に例示されている。

本開示の方法は、さらに、表面上の位置で断片を増幅して増幅された断片を生成する工程を含むことができる。増幅された断片は、例えば、以下に述べる核酸配列決定技術によって検出されることができる。特定の実施形態において、断片は、表面に付着する少なくとも1つのプライマーを用いて増幅することができる。増幅に用いられるプライマーは、少なくとも場合によりインサート上のプライミング部位にハイブリダイズすることができる。プライマーは、伸長して、例えば特定の位置における表面に付着した増幅された断片を生成することができる。以下のさらなる詳細に従って、固相伸長法(solid-phase extension)を用いることができる。
本開示の方法は、標的核酸、改変核酸またはその断片の部分を増幅する工程を含むことができる。当該技術分野で公知の任意の適切な増幅方法論を用いることができる。いくつかの実施形態において、核酸断片は固体支持体上で増幅される。例えば、いくつかの実施形態において、米国特許第5,641,658号；米国特許出願公開第2002/0055100号;米国特許第7,115,400号;米国特許出願公開第2004/0096853号;米国特許出願公開第2004/0002090号;米国特許出願公開第2007/0128624号;および米国特許出願公開第2008/0009420号(そのそれぞれは参照により本願に組み込まれる)の開示で例示されるブリッジ増幅法を用いて核酸断片が増幅される。ブリッジ増幅法は、固定された核酸分子のクラスター(または”コロニー”)を含むアレイを形成させるために、固体支持体上に増幅産物を固定させる。このようなアレイ上の各クラスターまたはコロニーは、複数の同一の固定されたポリヌクレオチド鎖および複数の同一の固定された相補的ポリヌクレオチド鎖から形成される。このように形成されたアレイを、本明細書では”クラスターを形成したアレイ”と呼ぶことができる。固相増幅反応の生成物は、固定されたポリヌクレオチド鎖および固定された相補鎖のアニーリングした対であって、両鎖が5’末端で固体支持体上に好ましくは共有結合によって固定された前記対によって形成された、いわゆる”橋かけ(bridged)”構造体である。ブリッジ増幅法は、固定されたアンプリコンを生成するために固定された核酸鋳型が用いられる方法の例である。他の適切な方法はまた、本明細書で提供される方法に従って生成される固定された核酸断片から固定されたアンプリコンを生成させるために用いることもできる。例えば、増幅プライマーの各対の片方または両方のプライマーが固定されれば、固相PCR、固相MDA、固相RCAなどによって、1以上のクラスターまたはコロニーが形成されることができる。

他の実施形態において、標的核酸、改変核酸、またはその断片は、溶液中で増幅される。例えば、いくつかの実施形態において、増幅プライマーは溶液中でインサートのプライミング部位にハイブリダイズする。他の実施形態において、増幅プライマーは、改変核酸またはその断片が固体支持体に付着するとき、インサートにハイブリダイズする。
ユニバーサルプライマーまたは標的特異的プライマーを用いる本明細書に記載の増幅方法または一般に当該技術分野で公知の増幅方法のいずれも、固定されたDNA断片を増幅するために用いることができることは明らかであろう。増幅のための適切な方法は、限定するものではないが、例えば、米国特許第8,003,354号(これは参照により本願に組み込まれる)に記載されているポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写増幅法(TMA)および核酸配列ベース増幅(NASBA)を含む。上記増幅法は、目的とする1以上の核酸を増幅するために用いることができる。例えば、固定された核酸断片を増幅するために、PCR、多重PCR、SDA、TMA、NASBAなどを用いることができる。いくつかの実施形態において、目的とする核酸に特異的に指向性を示すプライマー増幅反応に含まれる。
核酸の増幅のための他の適切な方法は、オリゴヌクレオチド伸長およびライゲーション、ローリングサークル増幅(RCA)(Lizardi et al., Nat. Genet. 19:225-232 (1998)(これは参照により本願に組み込まれる)ならびにオリゴヌクレオチドライゲーションアッセイ(OLA)を含むことができる(一般に米国特許第7,582,420号、第5,185,243号、第5,679,524号および第5,573,907号;EP 0 320 308 B1; EP 0 336 731 B1; EP 0 439 182 B1; WO 90/01069; WO 89/12696;ならびにWO 89/09835を参照のこと(そのそれぞれは参照により本願に組み込まれる)。これらの増幅方法は、固定された核酸断片を増幅するために設計されることができることは明らかであろう。例えば、いくつかの実施形態において、増幅法は目的とする核酸に特異的に指向性を示すプライマーを含むライゲーションプローブ増幅またはオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含むことができる。いくつかの実施形態において、増幅法は、目的とする核酸に特異的に指向性を示すプライマーを含むプライマー伸長法-ライゲーション反応を含むことができる。目的とする核酸を増幅するために特異的に設計されることができるプライマー伸長法およびライゲーションプライマーの限定するものではない例として、増幅は、米国特許第7,582,420号および第7,611,869号(そのそれぞれは参照によりその全体が本願に組み込まれる)で例示されるように、GoldenGate(登録商標)アッセイ(Illumina社、サンディエゴ、カリフォルニア州)のために用いられるプライマーを含むことができる。

本開示の方法において、等温増幅技術を用いることができる。例示的な等温増幅法は、限定するものではないが、例えば、Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)で例示される多重置換増幅(MDA)または、例えば米国特許第6,214,587号で例示される等温鎖置換核酸増幅を含む(そのそれぞれは、参照により本願に組み込まれる)。本開示に用いることができる他の非PCRベースの方法は、例えばWalker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995;米国特許第5,455,166号および第5,130,238号ならびにWalker et al., Nucl.Acids Res. 20:1691-96 (1992)などに記載されている鎖置換増幅(SDA)または、例えばLage et al., Genome Research 13:294-307 (2003)に記載されている高分枝鎖置換増幅を含む(そのそれぞれは参照により本願に組み込まれる)。米国特許第7,670,810号には、さらなる増幅反応、条件および成分の記述が示されている(これは参照により本願に組み込まれる)。他の有用な等温増幅技術は、組換え酵素で促進される増幅技術、例えばTwistDx社(ケンブリッジ、英国)によってTwistAmp(登録商標)キットとして市販されている、リコンビナーゼによって促進される増幅(recombinase-facilitated amplification)技術を含む。コンビナーゼによって促進される増幅試薬の有用な成分および反応条件は、米国特許第5,223,414号および米国特許第7,399,590号で示されている(そのそれぞれは参照により本願に組み込まれる)。例えば、Xu et al. EMBO Rep 5:795-800 (2004) の記載(これは参照により本願に組み込まれる)に従って、ヘリカーゼ依存増幅もまた使用することができる。

いくつかの実施形態において、再シード(re-seeding)工程を実施することが望ましい場合がある。例えば、核酸断片は表面の領域内の位置に捕捉され、増幅プロセスの1以上のサイクルで複製されることができ、元の断片および／またはそのアンプリコンはその位置から生成されることができ、放出された核酸は、同じ領域内の他の位置に捕捉されことができ、新たに捕捉された核酸は増幅されることができる。一具体例において、表面にシードされた断片に関してブリッジ増幅の単一サイクルが行われることができ、表面からの放出と同時に元の鋳型断片を洗い落す代わりに、その鋳型断片を、元々シードされた位置に近接する新規位置の表面に再シードすることができる。ブリッジ増幅のその後のラウンドによって、元のシード位置と再シード位置の両方でクラスター増殖が可能である。このような方法を用いて、複製コロニーを表面の領域に作成して技術的反復を提供することができる。技術的反復の配列の解析によって、エラーを確認する利益を提供することができる。例えば、近接クラスターのサブセットにのみ存在することが観察される(技術的反復として同定される)配列変異体は増幅エラーとして同定されることができるが、特定の断片の技術的反復として同定されるすべてのクラスターに存在する配列変異体は、真の変異体である可能性が高い。

本明細書に記載の方法は、標的核酸由来の断片を配列決定する工程を含むことができる。一例は、合成による配列決定(sequencing-by-synthesis)(SBS)である。SBSにおいて、核酸鋳型(例えば標的核酸の断片またはそのアンプリコン)に沿った核酸プライマーの伸長が、鋳型におけるヌクレオチドの配列を決定するためにモニターされる。該プライマーは、上記のインサートに存在するプライミング部位にハイブリダイズすることができる。基礎をなす化学過程は重合(例えばポリメラーゼ酵素により触媒される)であることができる。特定のポリメラーゼベースSBSの実施形態において、プライマーに付加されるヌクレオチドの順序およびタイプの検出が、鋳型の配列の決定に用いることができるように、鋳型に依存した方式で、蛍光標識されたヌクレオチドがプライマーに付加される(それによってプライマーが伸長する)。本明細書に記載の工程を用いてアレイの異なる位置に付着した複数の異なる核酸断片は、異なる鋳型に対して生じるイベントが、アレイにおけるそれらの位置によって識別されることができる条件下でSBS技術に供されることができる。

フローセルは、本開示の方法によって生じ、サイクルにおける試薬の反復送達を含むSBSまたは他の検出技術に供される核酸断片のアレイを収納する便利なフォーマットを提供する。例えば、第1SBSサイクルを開始するために、1以上の標識ヌクレオチド、DNAポリメラーゼなどは、核酸断片のアレイを収納するフローセルに流入するかまたはそれを通過して流れることができる。プライマー伸長法(例えば、核酸断片に結合したインサートに位置するプライミング部位へのプライマーのハイブリダイゼーションによる)によって、標識ヌクレオチドが組み込まれるアレイの部位を検出することができる。場合により、該ヌクレオチドはさらに、ひとたびヌクレオチドがプライマーに1つ付加されたら、さらなるプライマー伸長を終結させる、可逆的ターミネーター特性を含むことができる。例えば、脱保護剤が送達されて該部分が除去されるまで、その後の伸長が起きることができないように、可逆的ターミネーター部分を有するヌクレオチドアナログをプライマーに付加することができる。従って、可逆的ターミネーターを用いる実施形態のために、フローセルに脱保護試薬を送達することができる(前後に検出が行われる)。種々の送達工程の間に洗浄を行うことができる。次いでこのサイクルをn回反復してプライマーをnヌクレオチド伸長させ、それによって長さnの配列を検出することができる。本開示の方法によって生じるアレイの使用に容易に適用することができる例示的なSBS手順、流体系および検出プラットフォームは、例えば、Bentley et al., Nature 456:53-59 (2008)、WO 04/018497; 米国特許第7,057,026号; WO 91/06678; WO 07/123744;米国特許第7,329,492号;米国特許第7,211,414号;米国特許第7,315,019号;米国特許第7,405,281号および米国特許第2008/0108082号に記載されている(そのそれぞれは参照により本願に組み込まれる)。

サイクル反応を用いる他の配列決定手順、例えばパイロシーケンシングを用いることができる。パイロシーケンシングは、新生核酸鎖に特定のヌクレオチドに組み込まれるときの無機ピロリン酸塩(PPi)の放出を検出する(Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996); Ronaghi, Genome Res. 11(1), 3-11 (2001); Ronaghi et al. Science 281(5375), 363 (1998);米国特許第6,210,891号;米国特許第6,258,568号および米国特許第6,274,320号(そのそれぞれは参照により本願に組み込まれる)。パイロシーケンシングにおいて、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(ATP)に変換されることによって検出することができ、生成するATPのレベルは、ルシフェラーゼによって生じる光子によって検出されることができる。従って、配列決定反応は、発光検出システムによってモニターされることができる。蛍光ベース検出システムに用いられる励起放射線源は、パイロシーケンシング手順には必要ではない。パイロシーケンシングを本開示の方法に適用するために用いることができる有用な流体系、検出器および手順は、例えば、WIPO特許出願PCT/US11/57111、米国特許第2005/0191698 A1号、米国特許第7,595,883号および米国特許第7,244,559号(そのそれぞれは参照により本願に組み込まれる)に記載されている。

同様に有用なライゲーション・バイ・シーケンシング反応は、例えば、Shendure et al. Science 309:1728-1732 (2005); 米国特許第5,599,675号;および米国特許第5,750,341号(そのそれぞれは参照により本願に組み込まれる)に記載されているものを含む。いくつかの実施形態は、例えば、Bains et al., Journal of Theoretical Biology 135(3), 303-7 (1988); Drmanac et al., Nature Biotechnology 16, 54-58 (1998); Fodor et al., Science 251(4995), 767-773 (1995);およびWO 1989/10977(そのそれぞれは参照により本願に組み込まれる)に記載されているハイブリダイゼーション・バイ・シーケンシング(sequencing-by-hybridization)手順を含むことができる。ライゲーション・バイ・シーケンシング手順およびハイブリダイゼーション・バイ・シーケンシングの両方において、アレイの部位に存在する標的核酸断片(またはそのアンプリコン)は、オリゴヌクレオチドの送達および検出の反復サイクルに供される。本明細書に記載の、または本明細書に記載の引用文献に記載のSBS法のための流体系は、ライゲーション・バイ・シーケンシング手順またはハイブリダイゼーション・バイ・シーケンシング手順のための試薬の送達に容易に適合されることができる。一般的には、オリゴヌクレオチドは蛍光標識されており、本明細書に記載の、または本明細書に記載の引用文献に記載のSBS手順に関して記載されているものと同様な蛍光検出器を用いて検出することができる。

いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを含む方法を用いることができる。例えば、ヌクレオチドの取り込みは、フルオロフォア保有ポリメラーゼとγ−リン酸標識ヌクレオチドの間の蛍光共鳴エネルギー転移(FRET)相互作用によって、またはゼロモード導波路(ZMW)を用いて検出することができる。FRETベース配列決定のための技術および試薬は、例えば、Levene et al. Science 299, 682-686 (2003); Lundquist et al. Opt. Lett. 33, 1026-1028 (2008);およびKorlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)に記載されている(これらの開示は参照により本願に組み込まれる)。
いくつかのSBS実施形態は、伸長生成物へのヌクレオチドの取り込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定は、Ion Torrent社(ギルフォード、コネティカット州、Life Technologies社の子会社)から市販されている電気検出器および関連技術を用いることもできるし、米国特許第2009/0026082 A1号;米国特許第2009/0127589 A1号;米国特許第2010/0137143 A1号;または米国特許第2010/0282617 A1号(そのそれぞれは参照により本願に組み込まれる)に記載されている配列決定方法およびシステムを用いることもできる。

本方法の配列決定工程は、例えば、Deamer & Akeson Trends Biotechnol. 18, 147-151 (2000); Deamer & Branton, Acc. Chem. Res. 35:817-825 (2002);およびLi et al., Nat. Mater. 2:611-615 (2003)(そのそれぞれは参照により本願に組み込まれる)に記載されているナノポア配列決定技術を含むことができる。このような実施形態において、標的核酸断片はナノポアを通過する。該ナノポアは、合成孔または生体膜タンパク質、例えばα-ヘモリシンであることができる。標的核酸がナノポアを通過するとき、各塩基対は、孔の電気伝導度における変動を測定することによって同定されることができる。米国特許第7,001,792号;Soni & Meller Clin. Chem. 53、1996-2001 (2007); Healy, Nanomed. 2:459-481 (2007);およびCockroft et al., J. Am. Chem. Soc. 130:818-820 (2008)(そのそれぞれは参照により本願に組み込まれる)。いくつかの実施形態において、個々のナノポアの位置は、本明細書に例示されているアレイ上の部位またはフィーチャと類似している。互いに対するナノポアの近接は、それらが読み取る断片配列の近接に関連性を示して、例えば、それらが由来するより大きな配列へのそれらの断片のアセンブリを容易にすることができる。

本明細書に記載の配列決定工程は、有利には、複数の異なる標的核酸が同時に操作されるように多重フォーマットで実施することができる。特定の実施形態において、異なる標的核酸は、共通の反応容器中または特定の支持体の表面上で処理されることができる。これによって、配列決定試薬の便利な送達、未反応試薬の除去および多重方式での取り込みイベントの検出が可能になる。表面結合した標的核酸またはその断片を用いる実施形態において、標的核酸または断片はアレイフォーマット中にあることができる。アレイフォーマットにおいて、標的核酸の断片は、一般的には、空間的に区別できる方式で、例えば、本明細書に記載の結合技術を用いて表面に連結されることができる。アレイは、各部位(フィーチャとも呼ばれる)に標的核酸断片のシングルコピーを含むこともできるし、あるいは、同じ配列を有する複数コピーが各部位またはフィーチャに存在することもできる。複数コピーは、本明細書に記載のさらなる詳細に従って、増幅法、例えばブリッジ増幅またはエマルジョンPCRによって生成されることができる。

本明細書に記載の方法は、例えば、少なくとも約10フィーチャ/cm²、100フィーチャ/cm²、500フィーチャ/cm²、1,000フィーチャ/cm²、5,000フィーチャ/cm²、10,000フィーチャ/cm²、50,000フィーチャ/cm²、100,000フィーチャ/cm²、1,000,000フィーチャ/cm²、5,000,000フィーチャ/cm²、10⁷フィーチャ/cm²、5x10⁷フィーチャ/cm²、10⁸フィーチャ/cm²、5x10⁸フィーチャ/cm²、10⁹フィーチャ/cm²、5x10⁹フィーチャ/cm²以上を含む種々の密度のいずれかでフィーチャを有するアレイを用いることができる。
本開示の方法は、改変核酸ポリマーから生成される異なる断片のヌクレオチド配列に存在する多型のハプロタイプ相を決定する工程を含むことができる。従って、標的核酸ポリマーのヌクレオチド配列の表示は、改変核酸ポリマーから生成される少なくとも2つの異なる断片のヌクレオチド配列中に存在する対立遺伝子のハプロタイプ相の表示を含むことができる。
本開示の方法は、配列エラーを同定するために、固体支持体表面上の近接位置について決定された相補配列を比較する工程を含むことができる。

本明細書に記載の方法によれば、固体支持体上の任意の2つの断片種の相対近接性は、2つの断片から得られる配列情報のアラインメントに有用な情報を提供することができる。特に、固体支持体上の任意の2つの所定の断片由来のクラスター間の距離は、WO 2012/025250(これは参照により本願に組み込まれる)に詳細に記載されているように、2つのクラスターが同じ標的ポリヌクレオチド分子由来である確率と正の相関を示すことができる。同様に、固体支持体上の任意の2つの所定の断片由来のクラスター間の距離は、2つのクラスターが共通の起源由来である確率と正の相関を示すことができる(特定の標的ポリヌクレオチドのすべての断片は、その標的ポリヌクレオチドの起源に由来するため)。
例として、いくつかの実施形態において、フローセルの表面に捕捉された長い核酸分子由来の断片は、フローセルの表面をわたって一列になって存在するか(例えば断片化または増幅の前に核酸が引き延ばされていた場合)、あるいはクラウド（雲状）になって存在する(例えば、図2に示すように核酸が凝集していた場合)。さらに、次いで、固定された核酸の物理地図を作製することができる。従って、物理地図は、固定された核酸が増幅された後のクラスターの物理的関係と相関する。特に、物理地図は、WO 2012/025250に記載の組み込まれた材料のように、任意の2つのクラスターから得られた配列データが連鎖している確率を算出するために用いられる。これに代えて、あるいはこれに加えて、物理地図は、メタゲノム試料中の特定の生物体のゲノムを示すことができる。後者の場合において、物理地図は生物体のゲノム中の配列断片の順序を示すことができる。しかしながら、順序は必ずしも明記される必要はなく、代わりに、共通の生物体(または他の起源もしくは出所)における単なる2以上の断片の存在が、混合試料およびその中の1以上の生物体を特性づける物理地図のための十分な基礎であることができる。

いくつかの実施形態において、物理地図は、表面をわたって固定された核酸分子の位置を確認するために固体支持体をイメージングすることによって作成される。いくつかの実施形態において、固定された核酸は、固体支持体にイメージング剤を添加し、そのイメージング剤からシグナルを検出することによって像が形成される。いくつかの実施形態において、イメージング剤は検出可能な標識である。適切な検出可能な標識は、限定するものではないが、プロトン、ハプテン、放射性核種、酵素、蛍光標識、化学発光標識および／または色原体化合物を含む。例えば、いくつかの実施形態において、イメージング剤はインターカレート色素または非インターカレートDNA結合剤である。任意の適切なインターカレート色素または非インターカレートDNA結合剤は当該技術分野で公知であり、限定するものではないが、米国特許第2012/0282617号(これは参照により本願に組み込まれる)に記載されているものを含めて使用することができる。

特定の実施形態において、複数の改変核酸分子は、複数のナノチャネルを含むフローセル上に流入される。本明細書において、用語ナノチャネルとは、その中に長い線状核酸分子が引き延ばされる狭いチャネルのことをいう。いくつかの実施形態において、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000以下の個々の核酸の長い鎖が各ナノチャネルに沿って引き延ばされる。いくつかの実施形態において、個々のナノチャネルは、標的核酸の個々の長い鎖が複数のナノチャネルと相互作用するのを防ぐ物理的バリアによって隔てられる。いくつかの実施形態において、固体支持体は、少なくとも10、50、100、200、500、1000、3000、5000、10000、30000、50000、80000または100000のナノチャネルを含む。

いくつかの実施形態において、核酸は切断部位を有するインサートを含むように改変されており、ひとたびその核酸がチャネルに沿って引き延ばされれば、該切断部位は切断される。得られた断片は、場合により増幅され、該チャネルの表面に沿ってクラスターが形成されることができる。次いで、これらのチャネルの全長に沿って下方に該クラスターを追跡することによって近接マッピングを行うことができる。例として、ナノチャネル内でマッピングされ固定された断片化生成物を有する1000以上のナノチャネルを有するフローセルを、短い‘配置された’読み取り結果を用いて生物体のゲノムを配列決定するために用いることができる。いくつかの実施形態において、ハプロタイプを決定するために、ナノチャネル内でマッピングされ固定された断片化生成物を用いることができる。いくつかの実施形態において、ナノチャネル内でマッピングされ固定された断片化生成物は、フェージングの問題を解決するために用いることができる。
いくつかの実施形態において、本発明の上記側面の方法は、配列決定読み取り値のエラー訂正のために使用することができる。図11に、このようなエラー訂正の例を示す。2つの配列決定読み取り結果AおよびBは、同一の参照ゲノムとは異なっている(AがCに置換されている)。読み取り結果AおよびBを生成したクラスターは、フローセル上で互いに350um離れている。この距離は、配列決定アーティファクトによって引き起こされたと仮定されるには程遠く、なお近接グループの平均半径(200〜300um)内である。このことから、2つの読み取り結果が同じ開始／停止位置を有し、それらの向きが逆である事実と合わせて、それらは相補的断片として開始されたものであり、ここに示されたC変異は、試料調製または配列決定のアーティファクトではない。
いくつかの実施形態において、本発明の上記側面の方法は、遺伝子発現解析に用いることができる。いくつかの実施形態において、標的mRNAは単一細胞由来である。いくつかの実施形態において、mRNAはオリゴd(T)プローブを含むビーズ上に捕捉されることができる。

例示的な反応混合物および反応方法に関して上記で述べた成分の様々な組み合わせはキット形態で提供されることができる。このようなキットは、互いに分離された、例えば別々の容器またはパッケージに収納された個々の成分を含むことができる。キットは、本明細書に記載の成分の1以上の部分的組み合わせであって、キットの他の成分とは分離された前記1以上の部分的組み合わせを含むことができる。該部分的組み合わせは、本明細書に記載の反応混合物を調製するために組み合わせる(または本明細書に記載の方法を実施するために組み合わせる)ことができる。特定の実施形態において、個々の容器またはパッケージに存在する成分の部分的組み合わせは、本明細書に記載の方法の全工程を実施するには不十分である。しかしながら、該キットは、全体として、その内容物が本明細書に記載の方法を実施するために組み合わせることができる一群の容器またはパッケージを含むことができる。
キットは、キットの内容物を収納するために適切な包装材料を含むことができる。包装材料は、公知の方法によって、好ましくは滅菌された汚染物質フリー環境を提供するために構築されることができる。本明細書において、用いられる包装材料は、例えば、核酸配列決定システムに使用するために販売されている市販キットに通例用いられているものを含むことができる。例示的な包装材料は、限定するものではないが、本明細書に記載の成分を固定限界内に保持することができるガラス、プラスチック、紙、厚紙、ホイルなどを含む。

包装材料は、成分の特定の用途を示すラベルを含むことができる。ラベルによって示されるキットの用途は、キット内の成分の特定の組み合わせに適切な本明細書に記載の方法の1以上であることができる。例えば、ラベルは、そのキットが、核酸ポリマーへのインサートの挿入、断片を生じるための改変核酸ポリマーの切断または核酸の配列の決定に有用であることを示すことができる。
パッケージングした試薬または成分の使用説明書もまたキットに含めることができる。使用説明書は、一般的には、反応パラメータを説明する有形的表現、例えば混合されるキット成分および試料の相対量、試薬/試料混合物の維持期間、温度、緩衝液条件などを含む。
当特定の反応に必要なすべての成分が特定のキットに存在する必要はないことは理解できるであろう。むしろ、1以上のさらなる成分は他の供給源から提供されることができる。キットで提供される使用説明書は、提供されるべきさらなる成分(単数または複数)およびその入手先を明らかにすることができる。
以下の実施例は、本発明を例示するものであって、限定するものではない。

連結されたトランスポゾンを用いてゲノムDNAにインサートを組み込むことによるクラスターアレイへの連結性情報の保存
図1Aに示すように、2つのトランスポゾン因子が互いに連結される。各トランスポゾン因子は、アニーリングした二本鎖部分およびアニーリングしてない部分を形成する2つの鎖を有する叉状アダプター構築物を形成する。アニーリングした部分は、モザイク因子(ME)を形成する各鎖の相補的部分を含む。アニーリングしてない部分は、一方の鎖の5’末端のP5プライミング部位およびもう一方の鎖の3’末端付近のP7プライミング部位を含む。2つのトランスポゾンは同一であり、アニーリングしてない部分の5’末端(すなわちP5プライミング部位を含む鎖の5’末端)を介して互いに結合されている。連結されたトランスポゾン因子は、それぞれのトランスポザーゼサブユニットに結合して、ループした複合体の形態でトランスポソーム複合体を形成し、ループした複合体のいくつかは標的ゲノムDNAポリマーに結合する(図1B)。リンカーは、転移の時点で標的DNAが断片化するのを妨げる(すなわち、図1Cに示すように、連結されたトランスポゾン因子の挿入にもかかわらず、”タグメンテーション(tagmentation)”は阻害される)。5’−5’結合の結果として、改変核酸ポリマーは、単一ポリマー鎖につなぎ合わせた標的核酸ポリマーの代わりの鎖の配列部分を含む。インサートは、リンカー内に存在する切断部位を含み、任意選択で結合部分もまたリンカー内に存在する。

インサートを含むように改変された標的核酸ポリマーは、次いで、フローセルにロードされ、結合部分に特異的な受容体によってフローセルの表面上に捕捉される。例えば、リンカーが特定の核酸配列を含む場合、フローセルは、特定の配列に相補的な配列を有する捕捉プローブを含むことができ、あるいはまた、リンカーは、フローセルの表面に結合したストレプトアビジンに結合するビオチンアナログを含むことができる。インサート-改変ゲノムDNAは、図2に示すように、二本鎖型でフローセル表面に結合される。非流れ条件下では、個々のインサート-改変ゲノムDNAポリマーは、表面の限局性領域に結合するであろう。次いで、リンカーは切断され、鎖は変性されて個々の断片(例えば200b〜100kbの範囲)は互いに拡散し、図2の右側パネルに示すようにフローセル上にシードされる。拡散条件は、インサート-改変ゲノムDNAポリマーが結合した限局性領域に近接した位置に断片がシードされることを可能にするように選択される。拡散条件は、断片が過度に近接することを防ぎ、代わりに、その後のブリッジ増幅工程でミクロンサイズモノクローナルクラスターを形成することができる鋳型としてシードされるこの局在化を可能にするように選択される。図3に示すように、ひとたび鋳型がシードされ、ブリッジ増幅されれば、HiSeqまたはMiSeqプラットフォーム(Illumina社、サンディエゴ、カリフォルニア州)により、標準プロトコルを用いて配列決定を行うことができる。

図2において3つのインサート-改変ゲノムDNAポリマーがフローセル表面に付着した領域に対する図3における3つのクラスターの集団の位置の比較で例示されるように、隣接領域またはオーバーラップゲノム領域に由来するクラスターはクラスタークラウド(cluster cloud)を形成する。クラウドαが、クラウドβおよびクラウドγとは異なることで例示されるように、いくつかのクラスタークラウドは、他のクラスタークラウドとは異なることができる。クラウドβおよびクラウドγに関して例示されるように、クラスタークラウドは問題なく混ぜ合わされることができる。従って、比較的高密度でフローセルにクラスターが形成されることができる。
次いで配列解析が行われる。アセンブリ中、隣接する読み取り結果は、2つの読み取り結果が一緒にアセンブルされるべきか、フェージングされているとみなされるべきか、または互いにおけるエラーを訂正するために用いられるべきかを評価するために、距離メトリック(例えばフローセル内のクラスタ間の正規化された物理的分離)に基づいてグループ化される。近くの読み取り結果は、アセンブルすることができ、反復領域全域にわたってさえフェージングされることができ、互いにすぐそばにある相補的読み取り結果は、強固なエラー訂正のために互いに比較されることができる。

通常、フローセル上の個々のクラスターから得られたどの配列読取り結果が共通の元の分子に由来するかは未知である。これは、図4Aにおいて、50kb参照配列10に対してアラインメントした断片読み取り結果20の単色集合により例示される。しかしながら、上記方法によって生じるフローセル上の距離情報を用いて、その距離が第1ゲノムDNA分子(図4Bにおけるライトグレーの断片21)または第2ゲノムDNA分子(図4Bにおけるダークグレーの断片22)のいずれかの一致する組に読み取り結果がグループ化される。従って、第2ゲノムDNA分子に由来する断片22のセットは、図4Cに示すようにフェージングされたコンティグにアセンブルされることができる。
上記に例示された方法を用いて、フェージングされたコンティグをアセンブルするために、セット内の均一な遺伝子座および不均一な遺伝子座を用いることができ；新規アセンブリは、同じ分子に由来した読み取り結果からのオーバーラップのマッチングによって補助することができ、同じ分子からの相補的世臣取り結果は、読み取り値をエラーチェックし、まれな変異体を確認するために使用することができる。

配列決定した断片のフェーズを決定するためのアルゴリズム
標的核酸は断片のアレイを作製するために処理されることができ、ここでアレイ上の互いへの断片の近接は、その断片が同じ標的核酸分子から生成された確率に直接的に関連性を示す。処理は、実施例または本明細書の他の部分で記載されているように実施することができる。
一実施形態において、ゲノムDNA(gDNA)の損傷を最小限にして可能な範囲で標的gDNA分子の長さを保存するために、穏やかな調製方法を用いて生体源から単離された標的核酸を用いてプロセスが開始される。各標的gDNAは改変されてインサートが挿入される。改変gDNAポリマーのライブラリーがMiSeqフローセル(Illumina社、サンディエゴ、カリフォルニア州)に送達され、拡散させられてライブラリーメンバー間の分離が達成される。フローセル内で改変gDNAが断片化され、フローセルの表面上の位置にランダムに捕捉されたgDNA断片のサブライブラリーを各改変gDNAポリマーが生成する。各改変gDNAからの断片が互いの近接内に捕捉されることを可能にする条件が用いられる。それぞれの位置で各断片からのクラスターが成長する。標準的MiSeqプロトコル(Illumina社、サンディエゴ、カリフォルニア州)を用いてクラスターが配列決定される。

gDNA断片サブライブラリーに存在する配列の総和は、生体源のgDNA配列の断片を構成することができ、また少なくとも1xのgDNA配列の全体を含むことができる。一般的には、gDNA断片の完全セットは、gDNA配列の全体の例えば少なくとも10x以上を含む。完全セットにおけるgDNA断片の配列は、全gDNA配列にアラインメントされる場合、隣接するか、オーバーラップするかまたはギャップを有していることができる。
表面付着断片(または断片由来のクラスター)の近接性は、サブライブラリーメンバー間の物理的距離の特性づけとして処理されることができる。近接は”近さ”の尺度であるが、表面付着断片(またはクラスター)は、配列決定プラットフォーム検出器によって解像できるように十分に離れて間隔が置かれなければばならない。この解像度は、異なるgDNA断片サブライブラリー(すなわちサブライブラリー間)からの断片に必要であるし、同じサブライブラリー(すなわちサブライブラリー内)からの断片にも必要である。
解析の目的上、所定のサブライブラリーのメンバーは、メンバー間の空間距離が、ゲノムの隣接領域から生じた最も近いサブライブラリーへの空間距離よりもずっと少ない場合に、表面上で”近接している”とみなされる。例えば、図3を見れば、γサブライブラリーのクラスターは、γサブライブラリーのクラスターの一部が、それら自身のサブライブラリーにおけるクラスターよりも近くのβサブライブラリーにおけるクラスターに近いという事実にもかかわらず互いに”近接している”とみなされる。表面上のγサブライブラリーに物理的に近接していると思われるにもかかわらず、βサブライブラリーは、かなり離れた(すなわちαおよびγサブライブラリーは、標的ゲノムにおいて互いにかなり離れた領域に由来する)gDNA配列の領域に由来すると配列解析により特定されることができるため、γサブライブラリーのクラスターは”近接している”とみなされる。

標的gDNAにおいて連結されている断片の配列を決定するアルゴリズムは、以下：
(a)表面上のクラスターに関する配列読取り結果が得られる工程；
(b)参照ゲノムに対して配列読取り結果がアラインメントされ、変異体が同定される工程；
(c)解析される読取り結果の数を減少させるために、ゲノムに沿って移動ウインドウ(sliding window)(例えば100Kb)が用いられる工程；
(d)”近接している”クラスターのクラウド(すなわち領域)を同定するために、密度に基づいた空間クラスタリング(density based spatial clustering)アルゴリズムが用いられる工程；
(e)クラウドのそれぞれに対して仮想バーコードが付与される工程(すなわち同じクラウド由来の読取り結果は同じバーコードを有し、異なるクラウド間でバーコードは固有である；および
(f)バーコード化された読取り結果は、同定された変異体のフェージングを決定するために、ReFHapソフトウェア(Duitama et al. Proceeding of the First ACM International Conference on Bioinformatics and Computational Biology Pages 160-169 (2010)(これは参照により本願に組み込まれる)によって解析される工程
を含むことができる。
連結性を決定するための代替アルゴリズムは、上記アルゴリズムの工程(a)および(b)に続いて、ReFHapソフトウェアの距離メトリックを使用するように改変されたバージョンの使用を含むことができる。例示的な距離メトリックは、互いに離れているSNPよりも互いにより短い距離を有する(すなわち近接する)2つのSNPにより重点を置く。

メタゲノム用途
本実施例において、様々な生物体の混合試料中の単一生物体に属するとして配列読取り結果を呼び出すために近接マッピングが用いられる。従って、混合試料は、ハプロタイプ解析またはフェージング用途において識別される母親由来および父親由来ハプロタイプの混合物に類似していると考えることができる。
ワークフローは以下のように実施される：
(a)混合試料中の生物体からDNAを抽出する。
(b)場合により、所望の標的試料を富化する、または”既知および／または興味のない”生物体を試料から枯渇させる。これは、例えば以前本明細書で述べたように、核酸試料の一部のみを選択的に増幅する標的増幅法を用いて行うことができる。
(c)実施例1または本明細書の他の部分で記載されているトランスポソーム複合体を有するDNAを調製する。
(d)実施例1または本明細書の他の部分で記載されているように、工程(c)で調製されたDNAをフローセルにシードする。
(e)互いに近接しているクラスター/配列読取り結果は、同じ元の生物体に由来している特定の確率を有する。
(f)場合により、”既知および興味のない”生物体にアラインメントする読み取り結果を取り除き(すなわち２次的配列解析中に)、それによって、近接断片のノイズ周辺のクラウドの実効”密度”を低下させる。
(g)次いで、この情報は、試料における各生物体のゲノムアセンブリの足場の組み立てに役立つことができる。

生物体そのものをフローセルのある位置に捕捉し、次いで工程(b)から(d)に記載されている試料調製をin situで行う代替ワークフローを用いることができる。このようにして、生物体からの回収可能DNAの実質的に全部は、生物体からの長い断片のままの代わりに、フローセル内の所定の空間位置に局在化される。
生じうる結果の図を図9に示す。メタゲノム試料における3つの異なる生物体由来の3つの異なるクラスタークラウドが示されている。クラウドは、α、βまたはγとして識別されている。2つのクラウドがオーバーラップする場合、αおよびβクラウドに関して例示されるように、既知の生物体(例えば、β生物体)とアラインメントする断片は、α生物体由来の配列をさらに明確に同定するために、解析結果から減じるかまたは除去されることができる。

フローセル上の近接読み取り結果の生成
緩衝液10ul中のゲノムDNA50ngを用いて、フローセル上に近接読み取り結果を生成させた。このDNAに転移混合物成分(Tn5複合体、MgCl、トリス緩衝液)を加えて最終反応混合物20ulとし、55Cで10分間加熱した。このDNAを50pM濃度(平均断片サイズに基づいて)に希釈し、なおトランスポソソーム(transpososome)に結合しているDNAをフローセルにロードした。SDSを用いてDNAからトランスポザーゼ酵素を除去し、ポリメラーゼ/リガーゼ混合物を用いてギャップを修復した。断片を、最初の捕捉部位に近接するフローセル表面にシードさせた。その場で断片を増幅するブリッジ増幅を行って、クローンクラスターを形成させた。増幅したDNAの配列決定を行った。クラスターの近接グループを同定して、どの断片がDNAの同じ元の分子に由来するかを推定するために配列決定データを解析した。次いでこの情報を用いて試料中のSNPの相を決定し、図10に示した。

提案された方法を用いてヒトゲノムDNA(Coriell試料NA12878)を調製し、Illumina HiSeqプラットフォームで配列決定した。より高密度のクラスタリングおよびより正確な近接グループの同定を可能にするために、測定試料に12インデックスを付加した。参照ゲノム(HG19)に対するアラインメント後、2または3レーンからのデータを合わせて、クラスターの近接に関して解析した。次いで、近接グループからの情報を用いて、試料中の不均一SNPの相を決定した。フェージングデータを、以下の表1に示した。
表1:フェージングデータ
試料:ヒトDNA(Coriell NA12878)

本願を通して様々な公報、特許または特許出願が参照されている。本願において、本発明が属する現在の技術水準をより詳細に説明するために、これらの刊行物の開示は全て参照により本願に組み込まれる。
用語”含む”は、本明細書において、記載された要素ばかりでなく、任意のさらなる要素をさらに含むオープンエンドな用語であるものとする。
上記に、実施例を参照して本発明を詳細に説明してきたが、本発明から逸脱することなく、様々な改変を行うことが可能であることが理解されるべきである。従って、本発明は特許請求の範囲によってのみ限定される。

Claims

標的核酸ポリマーを配列決定する方法であって、
(a)標的核酸ポリマーにトランスポザーゼによってインサートを挿入することによって標的核酸ポリマーを改変して改変核酸ポリマーを作製し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域および複数の前記インサートを含み;
(b)固体支持体表面を含む容器中で前記改変核酸ポリマーの変性された断片を作製し、ここで各断片は(a)の複数の配列領域の1つ、および、(a)において挿入されるインサートの少なくとも一部を含み；
(c)固体支持体表面領域における位置に前記変性された断片をランダムに捕捉し;
(d)前記位置で前記断片を検出することによって(a)の複数の配列領域のヌクレオチド配列を決定し;および、
(e)前記断片の前記ヌクレオチド配列および前記固体支持体表面上の位置間の物理的相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成すること
を含み、
前記インサートは固体支持体表面上の受容体に結合するリガンドを含み、および、切断部位およびプライミング部位を含み、
前記インサートのそれぞれが、第1トランスポゾン因子および、前記第1トランスポゾン因子に隣接する第2トランスポゾン因子を含む、前記方法。
標的核酸ポリマーを配列決定する方法であって、
(a)標的核酸ポリマーにトランスポザーゼによってインサートを挿入することによって標的核酸ポリマーを改変して改変核酸ポリマーを作製し、ここで前記改変核酸ポリマーは前記標的核酸ポリマーからの複数の配列領域および複数の内部インサートを含み;
(b)前記改変核酸ポリマーを固体支持体表面上の領域に付着させ；
(c)固体支持体表面を含む容器中で前記改変核酸ポリマーの変性された断片を作製し、ここで各断片は(a)の複数の配列領域の1つ、および、(a)において挿入されるインサートの少なくとも一部を含み；
(d)ランダムな位置で前記固体支持体上にシードされた前記変性された断片を検出することによって(a)の複数の配列領域のヌクレオチド配列を決定し;および、
(e)前記断片の前記ヌクレオチド配列および前記固体支持体表面上の位置間の物理的相対距離に基づいて前記標的核酸ポリマーのヌクレオチド配列の表示を作成すること
を含み、
前記インサートは固体支持体表面上の受容体に結合するリガンドを含み、および、切断部位およびプライミング部位を含み、
前記インサートのそれぞれが、第1トランスポゾン因子および、前記第1トランスポゾン因子に隣接する第2トランスポゾン因子を含む、前記方法。
(b)における断片の作製が、切断部位でインサートを切断することを含む、請求項１または２に記載の方法。
(d)が、前記位置でプライミング部位にハイブリダイズするプライマーの伸長によって断片のヌクレオチド配列を決定することを含む、請求項１または２に記載の方法。
プライマーの伸長が、ポリメラーゼが触媒する少なくとも1つのヌクレオチドの付加を含む、または、プライマーの伸長が、リガーゼが触媒する少なくとも1つのオリゴヌクレオチドの付加を含む、請求項４に記載の方法。
(a)が、複数のトランスポソームの形成を含み、ここで各トランスポソームが、第1トランスポゾン因子と第2トランスポゾン因子に付着したトランスポザーゼを含む、請求項１１から５のいずれか１つに記載の方法。
第1トランスポゾン因子の5’末端が第2トランスポゾンの5’末端にリンカーによって連結している、請求項６に記載の方法。
リンカーが核酸を含む、または、リンカーが、第1トランスポゾン因子と第2トランスポゾン因子との間の非核酸結合を含む、請求項６または７に記載の方法。
第1トランスポゾン因子と第2トランスポゾン因子が、それぞれ叉状アダプターを含む、請求項８に記載の方法。
工程（ｂ）の断片を作製する工程が、改変核酸ポリマーから断片を放出することを含む、請求項１または２記載の方法。