JP2023508991A

JP2023508991A - 核酸配列分析方法

Info

Publication number: JP2023508991A
Application number: JP2022539234A
Authority: JP
Inventors: ケイシー・ロバート・ハット
Original assignee: Invivoscribe Inc
Current assignee: Invivoscribe Inc
Priority date: 2019-12-24
Filing date: 2020-12-23
Publication date: 2023-03-06
Also published as: CN115667545A; KR20220123246A; AU2020415445A1; CA3162999A1; EP4081663A1; WO2021133891A1; US20230055466A1

Abstract

本開示は、ハイスループット双方向配列決定を使用して目的の核酸試料のヌクレオチドリード配列を分析する方法を提供する。本開示の方法は、双方向配列決定が、配列リードの3'末端において重複する配列の相補的ハイブリダイゼーションを介して対合するのに十分なリード長ではないフォワード及びリバースリードを生じる場合でさえも機能するように設計される。本開示は、1つ又は複数の標的ヌクレオチド配列を発現させるために目的の核酸試料をスクリーニングするための非重複配列リードから分析するための核酸配列結果を作成するための方法を実装する、コンピューター実装方法、コンピューター可読記憶媒体及びデバイスを更に提供する。

Description

関連出願の相互参照
本出願は、2019年12月24日に出願された米国仮出願第62/953,270号からの優先権の利益を主張し、その内容全体は参照により本明細書に組み込まれる。

発明の分野
本発明は、概して、目的の核酸試料のヌクレオチド配列を分析する方法、より具体的には、ハイスループット双方向配列決定を使用して目的の核酸試料のヌクレオチド配列を分析する方法に関する。本発明の方法は、双方向配列決定が、配列リードの3'末端において重複する配列の相補的ハイブリダイゼーションを介して対合するのに十分なリード長ではないフォワード及びリバースリードを生じる場合でさえ、配列リードの3'終端末端が除去され、共局在したフォワード及びリバース配列リードの5'末端の定義された部分が、全ての連結されたリードに共通の核酸リンカーを介して連結されると、配列決定結果の正確なアラインメント及び分析が容易にされうるという決定に基づく。本発明の方法の開発は、限定されないが、細胞のクローン集団(新生物状態等)又は微生物の存在によって特徴付けられる状態の診断、このような状態の進行のモニタリング、寛解状態から疾患状態への対象の再発の可能性の予測、既存の治療薬及び/若しくは新しい治療剤の有効性の評価、又は免疫監視を含む、様々な用途において有用である。

配列表の参照による組み込み
2020年12月16日に作成され、EFS-Webにより米国特許商標庁に提出された、3KBの38093WO.P41235PCUS.SeqListing.txtとして名前を付けられた、ASCIIテキストファイルの配列表は、参照により本明細書に組み込まれる。

任意の以前の刊行物(又はそれから得られる情報)、又は公知の任意の事項に対する本明細書での言及は、以前の刊行物(又はそれから得られる情報)又は公知の事項が、本明細書が取り組む分野における共通の一般的な知識の一部を形成するという認識若しくは承認、又はいかなる形式の示唆としても解釈されず、解釈されるべきではない。

本明細書で著者によって言及されている刊行物の書誌的詳細は、説明の最後にアルファベット順にまとめられている。

クローンは、一般に、共通の前駆細胞の系統を引いている細胞の集団として理解されている。対象における細胞又は生物のクローン集団の存在の診断及び/又は検出は、一般に、比較的問題のある手順を構成していた。具体的には、クローン集団は、細胞又は生物のより大きな集団内のわずかな成分のみを構成しうる。例えば、哺乳動物の生物に関して、細胞のクローン集団の検出が必要とされる、より一般的な状況の1つは、がん等の新生物の診断及び/又は検出に関して発生する。しかしながら、1つ又は複数のクローン集団の検出はまた、脊髄異形成又は真性赤血球増加症等の状態の診断及びまた、感染、自己免疫疾患、アレルギー又は移植の状況において免疫系によって生成される抗原由来クローンの検出においても重要でありうる。

クローンのメンバーが、DNAの改変された配列等の分子マーカーによって特徴付けられる場合、検出の問題は、異なる配列を有する分子のより大きな集団内の全て同じ分子配列を有する分子の集団を検出する問題に置き換えられうる。達成されうるマーカー分子の検出レベルは、検出方法の感度及び特異性に非常に依存するが、ほとんどいつも、分子のより大きな集団内の標的分子の割合が少なくなると、より大きな集団からのシグナルノイズにより、標的分子からシグナルを検出することが困難になる。

非常に特異的であるが、その検出に関して固有の複雑性を示す特別なクラスの分子マーカーは、遺伝子組換え事象から生じるものである。体細胞における遺伝物質の組換えは、最初は離れているゲノムの2つ以上の領域を合わせることを含む。これは、ランダムなプロセスとして発生しうるが、また、正常なリンパ球細胞における発達プロセスの一部としても発生する。

がんに関して、組換えは、単純又は複雑でありうる。単純な組換えは、2つの関連しない遺伝子又は領域が並置されているものとみなすことができる。複雑な組換えは、2つより多い遺伝子又は遺伝子セグメントが、組換えられているものとみなすことができる。複雑な組換えの古典的な例は、リンパ球細胞の正常な発達の間に発生し、V、D及びJ遺伝子セグメントの組換えを伴う免疫グロブリン及びT細胞受容体可変遺伝子の再配列である。これらの遺伝子セグメントについての遺伝子座は、生殖細胞系列において広範に離れているが、リンパ球発達の間の組換えは、V、D及びJ遺伝子セグメント、又はV及びJ遺伝子セグメントの並置を生じ、これらの遺伝子セグメントの間の接合部は、ヌクレオチドの挿入及び欠失の小さな領域(N₁及びN₂領域)によって特徴付けられる。このプロセスはランダムに発生するため、各々の正常なリンパ球は、再配列される遺伝子及び再配列の性質の両方に応じて、完全なVDJ再配列又はVJ若しくはDJ再配列でありうる固有のV(D)J再配列を有するようになる。急性リンパ芽球性白血病、慢性リンパ性白血病、リンパ腫又は骨髄腫等のリンパ性がんは、単一の正常細胞における新生物変化の結果として発生するので、がん細胞の全ては、少なくとも最初は、創始細胞に元々存在する接合部のV(D)J再配列を有する。サブクローンは、新生物集団の拡大の間に生じることができ、更にV(D)J再配列がそれらにおいて発生することができる。

組換えから生じ、がんのクローン又はサブクローンに存在する固有のDNA配列は、処置に対する応答をモニタリングし、治療の判断を下すために使用されうる固有の遺伝子マーカーを提供する。クローンのモニタリングは、PCR、フローサイトメトリー又は次世代配列決定を含む、様々な技術によって実施することができ、それらの各々は、様々な長所及び短所を示す。

PCRは、標的DNA、特に少ない開始コピー数で存在するDNAを指数関数的に増幅させる能力のおかげでDNAの分析に革命をもたらしたが、サンガー配列決定等の従来の配列決定法は、依然として時間がかかった。このため、PCR増幅した患者のDNAの大規模な配列に基づく分析は、実質的に不可能であった。次世代配列決定の出現は、DNA配列決定にハイスループットアプローチを提供することによって配列決定に基づく分析に革命をもたらした。このことは、従来の配列決定に関連するターンアラウンドタイム及びコストを低減し、核酸配列決定が大規模で利用可能になることを意味した。PCRから固相ブリッジ増幅ベースのコロニー生成への進化と相まって、核酸配列決定分析によって提供される、より著しく洗練され、有益で、はるかに正確な情報が、日常的に利用可能になった。

開発されている様々なDNAライブラリー増幅方法及び次世代配列決定方法の両方が存在する。例えば、より一般的なPCRベースの増幅方法のうちの3つは、エマルジョンPCR、ローリングサークル増幅及び固相増幅である。

エマルジョンPCR法では、DNAライブラリーが最初に生成される。一本鎖DNA断片が、アダプター又はリンカーを用いてビーズの表面に付着され、1つのビーズが、DNAライブラリーからの単一のDNA断片に付着される。ビーズの表面は、DNA断片に結合するアダプターと相補的な配列を有するオリゴヌクレオチドプローブを含有する。次いでビーズは、水-油エマルジョン滴内に区画化される。水性の水-油エマルジョンでは、1つのビーズを捕捉する液滴の各々は、単一のDNA鋳型の増幅されたコピーを生成するPCRマイクロリアクターである。

グリッドローリングサークルナノボール(Gridded Rolling Circle Nanoballs)は、溶液中のローリングサークル増幅、それに続く、固定化されるDNAより小さいサイズであるスポットのグリッド上での捕捉による単一のDNA分子の集団の増幅を説明している。

DNAコロニー生成(ブリッジ増幅)は、フローセルのスライドに高密度で共有結合しているフォワード及びリバースプライマーを使用する。支持体上のプライマーの鋳型に対する比は、増幅されたクラスターの表面密度を定義している。フローセルは、ポリメラーゼベースの伸長のために試薬にさらされ、ライゲーションされた断片の自由/遠位端が、表面上の相補的オリゴヌクレオチドに「ブリッジ」するときにプライミングが発生する。変性及び伸長の反復により、フローセル表面にわたる数百万の別々の場所においてDNA断片の局所的な増幅が生じる。固相増幅は、1億～2億の空間的に離れた鋳型クラスターを生成し、自由端を提供し、次いで、その自由端にユニバーサル配列決定プライマーがハイブリダイズして配列決定反応を開始する。

次世代配列決定アプローチに関して、4つの周知の技術には、パイロシーケンシング、可逆的ターミネーター化学による配列決定、リガーゼ酵素によって媒介されるライゲーションによる配列決定、及びホスホ結合蛍光ヌクレオチド配列決定(phospholinked fluorescent nucleotides sequencing)が含まれる。

パイロシーケンシングは、一連の酵素反応を使用して、無機ピロリン酸を可視光に比例的に変換することによって無機ピロリン酸の放出を測定する非電気泳動の生物発光法である。DNA合成を終結させるために修飾ヌクレオチドを使用する他の配列決定アプローチとは異なり、パイロシーケンシング法は、制限された量でdNTPを単回付加することによりDNAポリメラーゼを操作する。相補的なdNTPを組み込むと、DNAポリメラーゼはプライマーを伸長し、停止させる。ディスペンシングサイクルにおいて次の相補的なdNTPを付加した後にDNA合成が再開される。光のピークの順序及び強度はフローグラムとして記録され、これにより、基本的なDNA配列が明らかになる。

可逆的ターミネーター化学による配列決定は、ヌクレオチド組み込み、蛍光イメージング及び切断を含む周期的方法において可逆的ターミネーター結合dNTPを使用する。各dNTPが付加され、次いで次の塩基の組み込みを可能にするために切断されるときに蛍光標識されたターミネーターは画像化される。これらのヌクレオチドは化学的にブロックされているので、各組み込みは固有の事象である。イメージング工程は、各塩基の組み込み工程の後に続き、次いでブロックされた基が化学的に除去されて、DNAポリメラーゼによる次の組み込みのために各鎖が準備される。この一連の工程は、ユーザーが定義した機器の設定によって決定して、特定の数のサイクルの間継続する。3'ブロッキング基は、最初は、酵素的又は化学的逆転と考えられていた。この方法は、Solexa社及びIllumina社の機械の基礎となっている。可逆的ターミネーター化学による配列決定は、Illumina社/Solexa社によって使用されるような4色サイクル、又はHelicos BioSciences社によって使用されるような1色サイクルとして実施されうる。Helicos BioSciences社は、阻害剤として作用する第2のヌクレオシド類似体を有するブロックされていないターミネーターである、「仮想ターミネーター」を使用する。これらのターミネーターは、単一塩基付加の後にDNA合成が終結するように基を終結又は阻害するための適切な修飾を組み込んでいる。可逆的ターミネーター配列決定は、双方向(ペアエンド)配列決定又はシングルリード配列決定として設計されうる。

リガーゼ酵素によって媒介されるライゲーションによる配列決定は、ポリメラーゼではなく、DNAリガーゼ及び1塩基コードプローブ又は2塩基コードプローブによって実行される配列伸長反応を使用する。その最も簡単な形態では、蛍光標識されたプローブは、プライミングされた鋳型に隣接するその相補配列とハイブリダイズする。次いでDNAリガーゼを付加して、色素標識化プローブをプライマーに接合する。ライゲーションされていないプローブを洗い流し、続いて蛍光イメージングにより、ライゲーションされたプローブの同一性を決定する。このサイクルは、蛍光色素を除去し、後続のライゲーションサイクルのために5'-PO4基を再生するために切断可能なプローブを使用すること(連鎖ライゲーション)によって、又は新しいプライマーを除去し、鋳型にハイブリダイズすること(非連鎖ライゲーション)によって反復されうる。

ホスホ結合蛍光ヌクレオチド配列決定は、DNA合成の間の色素標識化ヌクレオチドの連続的な組み込みのイメージングを含むリアルタイム配列決定の方法である。単一のDNAポリメラーゼ分子が、ホスホ結合ヌクレオチドが増加中のプライマー鎖に組み込まれている間の配列情報を得ることができる個々のゼロモード導波路検出器の底面に付着される。例えば、Pacific Biosciences社は、ホスホ結合ヌクレオチドを良好に組み込み、閉じた環状鋳型の再配列決定を可能にする固有のDNAポリメラーゼを使用する。

これらの技術は、以下のTable1(表1)に要約されているもの等の様々な商業的なプラットフォームで利用可能である。

標的DNAの固相ブリッジ増幅と、それに続く可逆的色素ターミネーター双方向配列決定の組合せは、ハイスループット増幅及び配列決定を達成する特に効果的な手段であることが証明された。しかしながら、双方向配列決定の有用性の制限の1つは、実施されうる最大数のサイクルであり、これにより、生成されうる最大配列リード長が制限される。例えば、Illumina HiSeq機器は、2×250塩基の双方向リードを生成することができるが、MiSeq機器は、2×300塩基の双方向リードを生成することができる。NextSeq及びNovaSeq機器は、どちらも2×150塩基の双方向リードを生成する。染色体又は他のゲノムの長いセクション等の長いDNA標的の文脈では、比較的短いリードであるものの生成は、それにもかかわらず、それらのリードが、それらの3'末端で重複する配列の相補性に基づいて対合でき(「テープ」又は「ステッチ」とも称される)、それによって、二本鎖DNA配列セクションを生成するので有用である。次いでこれらのテープ配列の各々は、ゲノム配列のより長いストレッチをアセンブルするために他のテープリードとの配列重複に基づいて更に整列されうる。このアラインメントは、多くの場合、参照配列に対して実施される。これに関して、配列リードが重複しない場合、これらのリードを整列させるための参照配列の使用は、参照配列に対してリードを分析する手段を提供することができる。しかしながら、分析を実施することができる配列リードの不在下では、非重複リードは、現在、個々の独立した配列決定結果として提供することができるといういずれかの情報の文脈以外ではほとんど有用性がない。

再配列された免疫グロブリン(本明細書では「Ig」と称される)又はT細胞受容体(本明細書では「TCR」と称される)分子等の目的の一部のDNA標的領域の文脈において、個々のアンプリコンの各々が、目的の生物学的試料内のクローン配列の集団の1つのメンバーを表すかどうか、又は代替として、残余若しくは再発生のクローン配列を表すかどうかを決定するために分析される場合、通常、双方向配列リードが、リードの3'末端が重複し、それらの相補性に基づいてテープされうるように十分なフォワード及びリバースリード長を提供することが必要であり、それによって、T若しくはB細胞の再配列されたVJ遺伝子セグメント、又は変異、染色体転座部位、DNA切断点若しくは逆位、若しくはインデル部位を包含する可能性があるゲノムDNAのスパン等の標的配列領域全体を提供する。このヌクレオチドの特徴を検出するために増幅させるのに必要とされるDNA領域が、選択された機器の化学により、配列決定を可能にするものよりも長い場合、このような鋳型の5'及び3'終端末端から生成される双方向フォワード及びリバースリードは、重複するのに十分に長くはない可能性があるので、一緒にテープすることはできない。従って、現在利用可能なハイスループット機器使用及び方法論は、特定の配列のスクリーニング又は目的のDNA集団の多様性の調査の文脈において実施されうる配列決定分析の種類及び範囲を制限する。

本発明に至るまでの研究において、双方向配列決定化学が、重複するフォワード及びリバースリードを生成するのに不十分である場合でさえ、それにもかかわらず、開始生物学的試料から鋳型DNAライブラリーを生成することによって1つ又は複数の標的ヌクレオチド配列を発現させるために目的のDNA試料をスクリーニングすることができることが予想外に判明し、個々の鋳型DNA分子の各々の長さに関係なく、標的ヌクレオチド配列が、鋳型DNAの5'及び3'末端に局在する、具体的には、使用するために選択された双方向配列リード長の長さの約80%に相当する5'又は3'終端ヌクレオチドストレッチ内にあるように鋳型が設計されている。従って、双方向配列決定ステップは、標的ヌクレオチド配列が、リード長の範囲内にあることが知られている領域に局在するので、その標的ヌクレオチド配列を効果的に配列決定する。これらの配列リードは、フォワード及びリバースリード長が重複するのに十分なリード長を含まないが、それらが、個々の鋳型DNA分子のクラスター増幅を介して固相上でそれら自体で生成されたアンプリコンから生成されている場合、リードの空間的共局在は、可能性のある双方向配列リード対を識別する手段を提供する。

しかしながら、双方向配列決定リードが3'方向において進行するにつれて配列決定エラーの可能性が高まることに起因して、これらのリードは、現在利用可能な分析ツールを使用して確実に整列させ、分析することができない。なぜなら、これらのツールは、ランダムな配列決定エラーとSNP又は点変異の存在を区別するのを支援するために対合したリードの重複する3'末端のハイブリダイゼーションに依存しているためである。なお更に、リード間の最終的な配列長の変動性が発生するという事実(全てのアンプリコンが、選択された機器についての最大の理論上のリード長まで配列決定されるとは限らない)に起因して、これらのリードの実際の配列が、生成される配列長にわたって他の点では同一である場合でさえ、これらのリードは、それにもかかわらず、単に異なるリード長に起因して別々及び別個の配列として日常的に誤って分類されることが予想外に判明した。従って、異なる長さであるが、その他の点では同一であるリードの誤った分類と共に、配列リードの3'末端において自然に発生する配列決定エラーの組合せにより、試験結果を大幅に歪めることになる。

従来の重複する双方向配列決定リードが生成される場合、上記の問題の両方は軽減される。フォワード及びリバースリードは重複し、重複する配列の相補性に基づいてハイブリダイズされうることによって、二本鎖分子を生成し、3'配列決定エラーは、容易に識別され、正確な相補的ヌクレオチドを発現する相補的な対合した末端リードによって、(固有配列として分類されるよりむしろ)破棄されるため、配列長の変動の問題は現実的に意味のないものとされる。従って、重複する配列リードの生成がない場合、それらの元の形態での非重複リードの分析は実質的に誤った結果を生じると判明しており、これは、臨床環境において非常に問題であることを証明しうる。

本発明に関して、驚くべきことに、本明細書に記載される特定の鋳型設計に加えて、残りのリードが、使用のために選択される最大の双方向配列リード長の約80%以上である点まで3'配列リードを除去するためにフォワード及びリバース配列リードが切断され、切断され、共局在したフォワード及びリバースの双方向リードが、それぞれ、前記リバース及びフォワードリードと相補的な配列と連結されて、全ての対合した共局在したリードに共通している線形リンカー配列を介して線形分子を形成し、得られた「テープ」配列リードが、他のリードと整列される場合及び/又は別の方法で分析される場合、目的のDNA試料中の標的ヌクレオチド配列の存在、性質及び/又は多様性に関して高精度の結果を生じることが判明している。また、免疫グロブリン及びTCR遺伝子再配列の文脈において、2つ以上のクラスターに由来する5'及び3'リードが同一である場合でさえ、それにもかかわらず、標的配列がこれらの分子間で同じであるが、介在する(増幅されていない)配列が異なる場合、これらのリードが、2つの異なる鋳型分子から生成される可能性が残っていることも判明している。この状況において、これらのリードは、共通のクローンに由来すると分類される。しかしながら、現在、再配列されたVDJ遺伝子セグメントの文脈において、この配列決定異常の発生率は、実際に、試験結果の感度又は特異性に悪影響を与えないことが見出されている。標的配列が、鋳型分子の5'及び3'末端に局在することを確実にするために鋳型DNAライブラリーを設計し、生成することによって、現在、鋳型DNAライブラリー断片が、選択された双方向配列決定機器使用により、完全長を配列決定することができるサイズのものであることを必ずしも確実にすることなくハイスループット次世代配列決定を行うことが可能になっている。従って、この開発により、現在、現在の次世代双方向配列決定化学及び機器使用の適用が大幅に拡大されたので、適切な機器使用の選択により、目的のDNA鋳型の長さに対して所与の機器の最大リード長によってもはや制限される必要はなくなった。標的配列が、本明細書上記の5'及び3'終端のDNA領域内で発現されうるならば、アンプリコンクラスターが生成され、配列決定されるDNA鋳型の全体の長さは、無関係になり、もはや制限されなくなる。なお更に、この方法はまた、個々のリードが整列される参照配列に対してこの工程を実施することを必要とせずに非重複配列リードの対合及び分析を可能にした。

本明細書及び以下の特許請求の範囲全体を通して、文脈が別段の定めをしない限り、「含む(comprise)」という用語、並びに「含む(comprises)」及び「含んでいる(comprising)」等の変形は、記載された整数若しくは工程又は整数の群若しくは複数の工程を包含するが、任意の他の整数若しくは工程又は整数の群若しくは複数の工程を排除しないことを示すことが理解される。

本発明は、例示のみの目的のために意図される、本明細書に記載される具体的な実施形態による範囲に限定されない。機能的に等価の製品、組成物及び方法は、本明細書に記載されるように、明確に本発明の範囲内である。

本明細書で使用される場合、「由来する」という用語は、特定の整数又は整数の群が指定された種に由来するが、必ずしも指定された供給源から直接的に得られたものではないことを示すと解釈されるものとする。更に、本明細書で使用される場合、「1つ」、「及び」及び「その」の単数形は、文脈が明確に別段を示さない限り、複数の指示対象を含む。

本主題の明細書は、参考文献目録後に本明細書に提示される、プログラムPatentInバージョン3.1を使用して作成されたヌクレオチド配列情報を含む。各ヌクレオチド配列は、配列表において、数字表示<210>と、それに続く配列識別子(例えば、<210>1、<210>2等)によって識別される。各ヌクレオチド配列についての配列(DNA等)の長さ、種類、及び供給源生物は、それぞれ、数字表示分野<211>、<212>及び<213>で提供される情報によって示される。本明細書で言及されるヌクレオチド配列は、配列番号の表示と、それに続く配列識別子(例えば、配列番号1、配列番号2等)によって識別される。本明細書で言及される配列識別子は、配列表において、数字表示分野<400>と、それに続く配列識別子(例えば、<400>1、<400>2等)で提供される情報と相関する。即ち、本明細書で詳述されている配列番号1は、配列表において<400>1として示される配列と相関する。

本発明の一態様は、1つ又は複数の標的ヌクレオチド配列を発現させるために目的の核酸試料をスクリーニングする方法であって、
(i)前記核酸試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、標的ヌクレオチド配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法を対象とする。

別の態様では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

更に別の態様では、1つ又は複数の再配列されたV、D若しくはJ遺伝子セグメントを発現させるためのB及び/又はT細胞DNAを含むDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、前記再配列されたV、D又はJ遺伝子セグメントが、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

別の実施形態では、工程(i)の前記隣接ヌクレオチド領域は、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の約80%に相当する。

別の実施形態及びV(D)J再配列の文脈では、前記標的ヌクレオチド配列は、IgH、TCRβ又はTCRδのDJ又はVDJ再配列である。別の実施形態では、前記標的ヌクレオチド配列は、Igκ、Igλ、TCRα又はTCRγのVJ再配列である。別の実施形態では、前記再配列は、カッパ欠失エレメント再配列である。

更に別の実施形態では、前記標的ヌクレオチド配列は、超変異を受けやすい領域等のV遺伝子セグメント領域及び/又はCDR3の部分をコードするJ遺伝子セグメント領域である。

なお更に別の実施形態では、前記標的ヌクレオチド配列は、Vリーダー配列、体細胞超変異を受けやすいV領域、IgH FR1、IgH FR2又はIgH FR3の全て又は一部をコードする遺伝子セグメント領域である。

更になお別の実施形態では、前記標的ヌクレオチド配列は、BCL1/JH転座又はBCL2/JH t(14:18)である。

更なる態様では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成され、前記隣接ヌクレオチド領域が、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の約80%に相当する、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

好ましくは、前記ガラス表面は、スライドガラス又はフローセルである。

更になお別の態様では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成され、前記隣接ヌクレオチド領域が、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の約80%に相当し、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

別の更なる態様では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成され、前記隣接ヌクレオチド領域が、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%に相当し、前記隣接ヌクレオチド領域の終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

一実施形態では、前記標的DNA配列は、前記鋳型の5'及び/又は3'終端末端において120個の隣接ヌクレオチドに局在するが、前記隣接ヌクレオチド領域の最大で20個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する。

別の実施形態では、前記標的DNA配列は、前記鋳型の5'及び/又は3'終端末端において125個の隣接ヌクレオチドに局在するが、前記隣接ヌクレオチド領域の最大で30個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する。

更なる態様では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成され、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)ブリッジ増幅によって前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

更になお別の態様では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成され、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)ブリッジ増幅によって前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供せず、前記双方向配列決定が、可逆的に終端化された標識化ヌクレオチドを使用した合成による配列決定である、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(b)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(c)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(d)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

上記の態様によれば、一実施形態では、前記ガラス表面は、スライドガラス又はフローセルである。

なお別の実施形態では、工程(i)の前記隣接ヌクレオチド領域は、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の約80%に相当する。

別の実施形態では、前記目的の核酸試料は、B及び/又はT細胞DNAを含み、前記1つ又は複数の標的ヌクレオチド配列は、1つ又は複数の再配列されたV、D又はJ遺伝子セグメントである。

更に別の実施形態では、前記標的ヌクレオチド配列は、IgH、TCRβ若しくはTCRδのDJ若しくはVDJ再配列、又はIgκ、Igλ、TCRα若しくはTCRγのVJ再配列である。なお別の実施形態では、前記再配列は、カッパ欠失エレメント再配列である。

なお更に別の実施形態では、前記標的ヌクレオチド配列は、超変異を受けやすい領域等のV遺伝子セグメント領域、及び/又はCDR3の部分をコードするJ遺伝子セグメント領域である。

更になお別の実施形態では、前記標的ヌクレオチド配列は、Vリーダー配列、体細胞超変異を受けやすいV領域、IgH FR1、IgH FR2又はIgH FR3の全て又は一部をコードする遺伝子セグメント領域である。

更なる実施形態では、前記隣接ヌクレオチド領域は、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%に相当し、前記フォワード及びリバースリード部分が、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%以上である。

更に別の実施形態では、前記標的DNA配列は、前記鋳型の5'及び/又は3'終端末端において120個の隣接ヌクレオチドに局在するが、前記隣接ヌクレオチド領域の20個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する。

更になお別の実施形態では、前記標的DNA配列は、前記鋳型の5'及び/又は3'終端末端において125個の隣接ヌクレオチドに局在するが、前記隣接ヌクレオチド領域の最大で30個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する。

別の更なる実施形態では、前記リンカーは、5～30ヌクレオチド長、好ましくは、5～25、より好ましくは5～20ヌクレオチド長である。別の実施形態では、前記リンカーの長さは、5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチドである。

なお別の更なる実施形態では、前記分析は、工程(iv)において生成された核酸配列結果を整列させ、目的の標的核酸配列の発現を決定する工程を含む。

関連する態様では、患者における状態について、診断、モニタリング、又はこれらでなければスクリーニングする方法であって、状態が、1つ又は複数の標的ヌクレオチド配列の発現によって特徴付けられ、
(i)核酸試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、標的ヌクレオチド配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

一実施形態では、前記状態は、細胞又は微生物のクローン集団によって特徴付けられる。

別の実施形態では、前記クローン細胞は、クローンリンパ球細胞の集団である

なお別の実施形態では、前記状態は、免疫細胞によって発現される1つ又は複数の標的ヌクレオチド配列によって特徴付けられる。

なお更に別の実施形態では、工程(i)の前記隣接ヌクレオチド領域は、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の約80%に相当する。

更になお別の実施形態では、前記状態は、1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴の発現によって特徴付けられる。

別の実施形態では、目的の前記DNA試料は、B及び/又はT細胞DNAを含み、前記1つ又は複数の標的ヌクレオチド配列は、1つ又は複数の再配列されたV、D又はJ遺伝子セグメントである。

別の実施形態では、前記リンカーは、5～25ヌクレオチド長である。なお別の実施形態では、前記リンカーは、5～20ヌクレオチド長である。更なる実施形態では、前記リンカーの長さは、5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチドであり、最も好ましくは、9、10、11又は12ヌクレオチド長である。

なお別の実施形態では、前記分析は、工程(iv)において生成された核酸配列結果を整列させ、目的の標的核酸配列の発現を決定する工程を含む。

更に別の実施形態では、1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴の発現によって特徴付けられる前記状態は、感染、移植、自己免疫、免疫不全、アレルギー、新生物又はT若しくはB細胞クローン増殖によって特徴付けられる任意の他の状態である。

前記方法は、診断、予後、分類、疾患リスクの予測、疾患の再発の検出、免疫監視、又は予防的若しくは治療的効果のモニタリングの状況において有用である。

リンパ性新生物の文脈において分析に適した疾患状態には、急性リンパ芽球性白血病、急性リンパ性白血病、急性骨髄性白血病、急性前骨髄球性白血病、慢性リンパ性白血病、慢性骨髄性白血病、骨髄増殖性新生物、例えば、骨髄腫、全身性肥満細胞症、リンパ腫及びヘアリー細胞白血病が含まれる。

1つの特定の態様では、本発明の方法は、リンパ性新生物の文脈において最小限の残存病変を検出するために使用される。

別の実施形態では、クローンリンパ球増殖によって特徴付けられる非新生物疾患には、感染、アレルギー、自己免疫、移植片拒絶、免疫療法、真性赤血球増加症、骨髄異形成及び白血球増加症、例えば、リンパ球増加症が含まれる。

本開示の別の態様は、非重複配列リードから分析するための核酸配列結果を作成するためのコンピューター実装方法を対象とする。この方法は、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別する工程であって、クラスターが、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードが、選択された双方向配列決定技術によって生成され、フォワード配列リード及びリバース配列リードが重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供しない、工程と、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第1の核酸配列結果を得る工程であって、各連結が、フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第1の核酸リンカー配列をつなぎ、それによって、フォワード配列リードの部分、第1の核酸リンカー配列、及びリバース配列リードの部分のリバース相補体をその順序で含む第1の核酸配列結果を得ることによって達成される、工程とを含み、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)リバース配列リードからの部分の長さが、分析される全てのリバース配列リードについて同じであり、(3)フォワード配列リードからの部分の長さが、分析される全てのフォワード配列リードについて同じであるが、リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第1の核酸リンカー配列が、全ての第1の核酸配列結果について同じである。

一部の実施形態では、コンピューター実装方法は、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第2の核酸配列結果を得る工程であって、各連結が、リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第2の核酸リンカー配列をつなぎ、それによって、リバース配列リードからの部分、第2の核酸リンカー配列、及びフォワード配列リードからの部分のリバース相補体をその順序で含む第2の核酸配列結果を得ることによって達成される、工程を更に含み、
(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)第2の核酸リンカーにつながれるリバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、第1の核酸リンカーにつながれるリバース配列リードからの部分の長さと同じであり、(3)第2の核酸リンカーにつながれるフォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、第1の核酸リンカーにつながれるフォワード配列リードからの部分の長さと同じであるが、第2の核酸リンカーにつながれるリバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである。

本開示の別の態様は、具現化されたプログラム命令を有する非一時的コンピューター可読記憶媒体であって、デバイスの処理要素によって実行可能なプログラム命令が、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別する工程であって、クラスターが、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードが、選択された双方向配列決定技術によって生成され、フォワード配列リード及びリバース配列リードが重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供しない、工程と、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第1の核酸配列結果を得る工程であって、各連結が、フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第1の核酸リンカー配列をつなぎ、それによって、フォワード配列リードの部分、第1の核酸リンカー配列、及びリバース配列リードの部分のリバース相補体をその順序で含む第1の核酸配列結果を得ることによって達成される、工程とによって非重複配列リードから分析するための核酸配列結果を作成するための方法をデバイスに実装させ、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)リバース配列リードからの部分の長さが、分析される全てのリバース配列リードについて同じであり、(3)フォワード配列リードからの部分の長さが、分析される全てのフォワード配列リードについて同じであるが、リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第1の核酸リンカー配列が、全ての第1の核酸配列結果について同じである、非一時的コンピューター可読記憶媒体を対象とする。

一部の実施形態では、非一時的コンピューター可読記憶媒体は、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第2の核酸配列結果を得る工程であって、各連結が、リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第2の核酸リンカー配列をつなぎ、それによって、リバース配列リードからの部分、第2の核酸リンカー配列、及びフォワード配列リードからの部分のリバース相補体をその順序で含む第2の核酸配列結果を得ることによって達成される、工程を更に含み、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)第2の核酸リンカーにつながれるリバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、第1の核酸リンカーにつながれるリバース配列リードからの部分の長さと同じであり、(3)第2の核酸リンカーにつながれるフォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、第1の核酸リンカーにつながれるフォワード配列リードからの部分の長さと同じであるが、第2の核酸リンカーにつながれるリバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである。

本開示の別の態様は、非重複配列リードから分析するための核酸配列結果を作成するためのデバイスを対象とする。このデバイスは、ハードウェアプロセッサを含み、ハードウェアプロセッサは、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別するように構成され、ここでクラスターが、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードが、選択された双方向配列決定技術によって生成され、フォワード配列リード及びリバース配列リードが重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供せず、更に、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第1の核酸配列結果を得るように構成され、ここで各連結が、フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第1の核酸リンカー配列をつなぎ、それによって、フォワード配列リードの部分、第1の核酸リンカー配列、及びリバース配列リードの部分のリバース相補体をその順序で含む第1の核酸配列結果を得ることによって達成され、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)リバース配列リードからの部分の長さが、分析される全てのリバース配列リードについて同じであり、(3)フォワード配列リードからの部分の長さが、分析される全てのフォワード配列リードについて同じであるが、リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第1の核酸リンカー配列が、全ての第1の核酸配列結果について同じである。

一部の実施形態では、ハードウェアプロセッサは、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第2の核酸配列結果を得、各連結が、リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第2の核酸リンカー配列をつなぎ、それによって、リバース配列リードからの部分、第2の核酸リンカー配列、及びフォワード配列リードからの部分のリバース相補体をその順序で含む第2の核酸配列結果を得ることによって達成されるように更に構成され、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)第2の核酸リンカーにつながれるリバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、第1の核酸リンカーにつながれるリバース配列リードからの部分の長さと同じであり、(3)第2の核酸リンカーにつながれるフォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、第1の核酸リンカーにつながれるフォワード配列リードからの部分の長さと同じであるが、第2の核酸リンカーにつながれるリバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである。

一部の実施形態では、第1の核酸リンカー配列及び第2の核酸リンカー配列は、少なくとも11ヌクレオチド長である。

一部の実施形態では、フォワード配列リードの部分の長さは、リバース配列リードの部分の長さと同じである。

一部の実施形態では、フォワード配列リードの部分は、フォワード配列リードの5'終端の指定された数の隣接ヌクレオチドを含み、リバース配列リードの部分は、リバース配列リードの5'終端の指定された数の隣接ヌクレオチドを含む。一部の実施形態では、指定された数の隣接ヌクレオチドは、約80ヌクレオチドから約180ヌクレオチドの間を含む。

一部の実施形態では、フォワード及びリバース配列リードは、DNA配列リードである。一部の実施形態では、アンプリコンのクラスターは、B及び/又はT細胞DNAから増幅される。

一部の実施形態では、アンプリコンのクラスターは、少なくとも1つの再配列されたV、D又はJ遺伝子セグメントを含む。

本開示の態様によるシステムのブロック図である。CPU:中央処理装置(「プロセッサ」)。非重複配列リードから分析するための核酸配列結果を作成するための実施形態のフローチャートである。非重複配列リードから分析するための核酸配列結果を作成するための実施形態のフローチャートである。

本発明は、部分的に、1つ又は複数の標的ヌクレオチド配列をスクリーニングするために非重複双方向配列決定リードを使用する手段の開発に基づいている。具体的には、固体プラットフォームに固定された単一の鋳型DNAから生成され、従ってクローンであるアンプリコンクラスターへの双方向配列リード結果の共局在によって、これらのリードの配列決定情報が、共通の鋳型DNAに由来するものと識別可能である。これまでの方法は、双方向配列リードからの鋳型DNA配列全体のアセンブリを可能にするために重複するフォワード及びリバースリード配列、又は互いに対する向き及び位置を決定するためにリードが整列される参照配列の使用に依存していた。これはまた、配列決定エラーが、配列リードの3'終端末端に対してより頻繁に発生することが知られているが、対合したリードの重複する相補配列により、(変異とは対照的に)一本鎖上の単一の塩基エラーの存在の識別が可能になり、次いでこれを確信して破棄することができ、テープされたリードのアラインメント及び分析を比較的正確に行うことを容易にすることできるという利点を提供した。しかしながら、双方向配列リードが重複しない場合、重複する相補的3'配列によるそれらの対合及びアセンブリは不可能である。なお更に、現在、双方向配列リードが個々に分析される場合でさえ、リードの3'末端で発生している可能性があり、エラーを示さない比較リードに対して異なる(例えば、変異した)配列として分類される単一のリードを生じる任意の配列決定エラーの問題は別として、異なる配列リード長の生成だけでは、これらのリードの実際の配列がその他の点では同一である場合でさえ、これらのリードが異なる配列として不正確に分類され、それによって、目的のDNA試料についての配列決定結果を歪めることになることが判明している。

しかしながら、フォワードリード及びリバースリードの全ての配列リードが同じ長さであるように、配列リードが、3'双方向配列リード末端から十分に切断するために変更される場合、この予期しない現象が修正されることが予想外に判明した。なお更に、フォワード及びリバースリードがこのように調整され、次いで固体支持体上の単一のアンプリコンクラスターに共局在していると識別されるフォワード及びリバースリードの3'末端が、それぞれ、線形配列リードを生成するために、リバース及びフォワードリードと相補的な配列の5'末端に付着している核酸リンカーを使用して連結されており、そのリンカーが、所与の生物学的試料についての全てのアセンブルされたリードについて同じである場合、アセンブルされた配列結果の正確なアラインメント及び比較分析が達成されうる。標的ヌクレオチド配列が、鋳型の5'及び3'末端に位置し、従って、選択された双方向配列決定技術によって配列決定されるように開始DNA鋳型ライブラリーを設計することによって、鋳型全体が完全に配列決定されない場合でさえ、免疫グロブリン又はTCR遺伝子に再配列されるVDJ遺伝子セグメント等の、かなり離れて位置する可能性がある標的ヌクレオチド配列を分析するための手段を提供する。機器使用の他の機能的特性よりむしろ、生成するリード長に基づく配列決定機器使用を選択し、従って鋳型分子が、重複する双方向配列リードを生成することを可能にするのに十分短いように鋳型DNAライブラリーを設計せざるを得ないことにもはや制限されないことによって、現在、ハイスループット次世代配列分析についての広範囲の適用が可能になった。

従って、本発明の一態様は、1つ又は複数の標的ヌクレオチド配列を発現させるために目的の核酸試料をスクリーニングする方法であって、
(i)前記核酸試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、標的ヌクレオチド配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法を対象とする。

一実施形態では、前記非隣接配列リードは、フォワード及びリバースリードを対合させるために参照配列に対して分析されない。

「核酸」又は「ヌクレオチド」又は「塩基」又は「核酸塩基」への言及は、デオキシリボ核酸又はヌクレオチド及びリボ核酸又はヌクレオチド又はプリン若しくはピリミジン塩基又はそれらの誘導体若しくは類似体の両方への言及として理解されるべきである。これに関して、とりわけ、DNA(cDNA又はゲノムDNA)、RNA若しくはmRNAを含む、リボヌクレオチド及び/又はデオキシリボヌクレオチドのリン酸エステルを包含することは理解されるべきである。本発明の核酸分子は、天然に存在する(生物学的試料に由来するもの等)、組換えにより産生された、又は合成により産生されたものを含む任意の起源のものでありうる。ヌクレオチドはまた、イノシン等の非標準的なヌクレオチドでありうる。

「誘導体」への言及は、天然、合成又は組換え源からの前記核酸分子の断片、一部、部分、ホモログ及び模倣物への言及を含むと理解されるべきである。「機能的誘導体」は、プリン若しくはピリミジン塩基、ヌクレオチド又は核酸分子の機能的活性の任意の1つ又は複数を示す誘導体として理解されるべきである。前記ヌクレオチド又は核酸配列の誘導体には、他のタンパク性又は非タンパク性分子に融合したヌクレオチド又は核酸分子の特定の領域を有する断片が含まれる。ヌクレオチド又は核酸分子のビオチン化が、本明細書で定義される「機能的誘導体」の例である。核酸分子の誘導体は、単一又は複数のヌクレオチド置換、欠失及び/又は付加に由来しうる。「機能的誘導体」という用語はまた、例えば、天然産物スクリーニング後に得られる産物等のヌクレオチド又は核酸配列の機能的活性の任意の1つ又は複数を示すヌクレオチド又は核酸を包含すると理解されるべきである。

本明細書で企図される「類似体」には、限定されないが、その化学組成若しくは立体構造全体又は任意の他の種類の天然に存在しないヌクレオチドに対する修飾等のヌクレオチド又は核酸分子に対する修飾が含まれる。これには、例えば、ヌクレオチド又は核酸分子が、骨格形成又は相補的塩基対ハイブリダイゼーションのレベル等で他のヌクレオチド又は核酸分子と相互作用する様式に対する修飾が含まれる。本発明をいかなる理論又は作用様式に限定するものではないが、核酸は、3つの部分:リン酸骨格、ペントース糖、リボース又はデオキシリボースのいずれか、及び4つの塩基のうちの1つから構成される。類似体は、これらのいずれかが変更されている可能性がある。典型的に、類似体塩基は、とりわけ、異なる塩基対合及び塩基スタッキング特性を付与する。例には、4つ全ての標準的な塩基と対合しうるユニバーサル塩基、鎖の特性に影響を与える、PNA等のリン酸-糖骨格類似体が含まれる。核酸類似体はまた、セノ核酸とも呼ばれる。天然に存在しない核酸には、ペプチド核酸(PNA)、モルホリノ及びロックド核酸(LNA)、並びにグリコール核酸(GNA)及びトレオース核酸(TNA)が含まれる。これらの各々は、分子の骨格に対する変更によって天然に存在するDNA又はRNAと区別される。

目的の核酸試料及び/又は標的ヌクレオチド配列は、DNA若しくはRNA又はそれらの誘導体若しくは類似体でありうる。前記核酸試料は、ゲノムDNA、mRNA転写物から生成されたcDNA、核酸増幅によって生成されたDNA、合成DNA又は組換えにより生成されたDNAの形態を取りうる。対象の核酸試料がRNAである場合、最初にRT-PCR等を使用してRNAをDNAに逆転写する必要があることは理解される。対象RNAは、mRNA、一次RNA転写物、リボソームRNA、転移RNA、マイクロRNA等の任意の形態のRNAでありうる。好ましくは、前記核酸試料及び前記標的ヌクレオチド配列はDNAである。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

一実施形態では、工程(i)の前記隣接ヌクレオチド領域は、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の約80%に相当する。

「標的ヌクレオチド配列」への言及は、分析されることが求められる任意のDNA又はRNA配列への言及と理解されるべきである。これは、遺伝子、遺伝子の一部、例えば、遺伝子セグメント若しくは遺伝子領域、又は遺伝子間領域でありうる。この目的のために、「遺伝子」への言及は、完全長タンパク質であるか、又はタンパク質断片であるかにかかわらず、タンパク質産物をコードするDNA分子への言及と理解されるべきである。染色体DNAに関して、遺伝子は、イントロン及びエクソン領域の両方を含む。しかしながら、核酸試料がcDNAである限り、標的ヌクレオチド配列がベクターDNA又は逆転写mRNAである場合に起こりうるように、イントロン領域が存在しない場合がある。それにもかかわらず、このようなDNAは、5'又は3'非翻訳領域を含みうる。従って、本明細書において「遺伝子」への言及は、例えば、ゲノムDNA及びcDNAを含むタンパク質又はタンパク質断片をコードする任意の形態のDNAを包含すると理解されるべきである。対象の標的ヌクレオチド配列はまた、任意の特定の遺伝子(例えば、一般に「ジャンク」DNA領域と呼ばれる)に関連することが知られていないゲノムDNAの非コード部分に対応しうる。これは、ゲノムDNAの2つの領域又はゲノムDNAの領域と、ウイルス又は導入配列等の外来DNAの領域との間の、組換えによって産生されるゲノムDNAの任意の領域に対応しうる。これはまた、SNP、染色体転座、挿入、欠失又は染色体切断点等の切断点を包含しうる領域に対応しうる。標的配列はまた、部分的又は全体的に、合成により又は組換えにより生成された核酸分子の領域に対応しうる。対象の標的配列はまた、ポリメラーゼ連鎖反応(PCR)を含む、任意の核酸増幅方法によって以前に増幅されたDNAの領域でありうる(即ち、これは増幅方法によって生成された)。

本発明の方法は、前記1つ又は複数の標的ヌクレオチド配列の「発現」をスクリーニングするように設計される。「発現」とは、試験を受ける核酸試料中の前記配列の存在を意味する。対象の配列は、転写及び/又は翻訳を受ける核酸配列に対応してもよいか、又はしなくてもよいことは理解されるべきである。

本発明の方法が、目的の「1つ又は複数の」標的ヌクレオチド配列をスクリーニングするように設計されうることは、1つ又は1つより多い別個の標的配列をスクリーニングすることができることを意味すると理解されるべきである。別個の標的配列の例には、SNP、点変異、超変異、DNA挿入、DNA欠失、染色体切断点、特定の遺伝子セグメント、特定の領域、遺伝子の一部又はセクション、遺伝子間領域等が含まれる。単一の分析の文脈において、これらの標的配列のうちの1つをスクリーニングすることができるか、又はこれらの標的配列のうちの1つより多くをスクリーニングすることができる。これらの標的配列は、試料の核酸中の別々で別個の位置に位置しうるか、又はそれらは、核酸鎖に沿って連続して位置しうる。それらは、変異が遺伝子セグメント内に見出され、変異及び遺伝子セグメント自体の両方が目的の標的配列である場合等、核酸鎖に沿って同じ位置にさえ発生する場合があることは理解されるべきである。一実施形態では、前記目的の核酸試料は、B及び/又はT細胞DNAを含み、前記1つ又は複数の標的ヌクレオチド配列は、1つ又は複数の再配列されたV、D又はJ遺伝子セグメントである。

この実施形態によれば、1つ又は複数の再配列されたV、D若しくはJ遺伝子セグメントを発現させるためのB及び/又はT細胞DNAを含むDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、前記再配列されたV、D又はJ遺伝子セグメントが、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

「B及び/又はT細胞DNA」への言及は、免疫グロブリン又はTCR可変領域遺伝子セグメントの少なくとも1つの生殖細胞系列セットを再配列した任意のリンパ球細胞に由来するDNAへの言及であることは理解されるべきである。再配列されうるゲノムDNAをコードする免疫グロブリン可変領域は、重鎖又はκ若しくはλ軽鎖に関連する可変領域を含み、一方、再配列されうるゲノムDNAをコードするTCR鎖可変領域は、α、β、γ及びδ鎖を含む。これに関して、細胞が、少なくとも1つの免疫グロブリン又はTCR遺伝子セグメント領域のDNAをコードする可変領域を再配列したならば、細胞は、「リンパ球細胞」の範囲内であることは理解されるべきである。細胞はまた、再配列されたDNAを転写及び翻訳している必要はない。これに関して、「リンパ球細胞」は、その範囲内に、TCR又は免疫グロブリン可変領域遺伝子セグメントを再配列したが、更に再配列された鎖(TCR胸腺細胞等)を発現していないか、又は更にそれらのTCR若しくは免疫グロブリン可変領域遺伝子セグメントの両方の鎖を再配列していない未熟T及びB細胞を含むが、これらに全く限定されない。この定義は更に、少なくとも一部のTCR又は免疫グロブリン可変領域再配列を受けたリンパ様細胞にまで及ぶが、この細胞は、そうでなければ、従来的に成熟T細胞又はB細胞に関連する表現型又は機能的特徴の全てを示さない場合がある。

また、一実施形態では、対象の再配列は、少なくとも1つの可変領域遺伝子領域の完全な再配列等の完全な再配列であるが、別の実施形態では、対象の再配列は、部分的な再配列であることは理解されるべきである。例えば、DJ組換え事象のみを受けたB細胞は、部分的再配列のみを受けた細胞である。DJ組換えセグメントが更にVセグメントと組換えられるまで、完全な再配列は達成されない。従って、本発明の方法は、TCR又は免疫グロブリン鎖の部分的又は完全な可変領域再配列をスクリーニングするように設計されうる。

本発明をいかなる理論又は作用様式に限定するものではないが、適応免疫系を有する生物におけるV(D)J組換えは、新しい病原体を認識し、適応するように免疫細胞を迅速に多様化するのに役立つ種類の部位特異的遺伝子組換えの例である。各リンパ球細胞は、約10¹⁶個の別個の可変領域構造の全抗原多様性を生成するために、再配列される特定の遺伝子セグメントに応じて、その生殖細胞系列可変領域遺伝子セグメント(V及びJ、D及びJ又はV、D及びJセグメントのいずれか)の体細胞組換えを受ける。T細胞又はB細胞等の任意の所与のリンパ球細胞では、TCR又は免疫グロブリン分子、具体的には、TCR並びに/又は免疫グロブリン分子の重及び軽鎖のα、β、γ又はδ鎖を含む2つの鎖のうちの2つ以上の再配列のために、少なくとも2つの異なる可変領域遺伝子セグメント再配列が発生する可能性がある。任意の所与の免疫グロブリン又はTCR遺伝子のVJ、DJ又はVDJセグメントの再配列に加えて、ヌクレオチドは、セグメント間の接合部においてランダムに除去及び/又は挿入される。これは、膨大な多様性の生成につながる。

これらの遺伝子セグメントについての遺伝子座は、生殖細胞系列において広範に離れているが、リンパ球発生の間の組換えにより、V、(D)及びJ遺伝子の並置が生じ、これらの遺伝子間の接合部は、ヌクレオチドの挿入及び欠失の小さな領域によって特徴付けられる。このプロセスはランダムに発生するので、各々の正常なリンパ球は、固有のV(D)J再配列を有するようになる。急性リンパ芽球性白血病、慢性リンパ芽球性白血病、リンパ腫又は骨髄腫等のリンパ性がんは、単一の正常細胞における新生物変化の結果として発生するので、がん細胞の全ては、少なくとも最初は、創始細胞に元々存在する接合部のV(D)J再配列を有する。サブクローンは、新生物集団の拡大の間に生じることができ、更にV(D)J再配列がそれらにおいて発生することができる。

「遺伝子セグメント」への言及は、免疫グロブリン及びT細胞受容体遺伝子のV、D及びJ領域への言及として理解されるべきである。V、D及びJ遺伝子セグメントは、ファミリーにクラスター化される。例えば、κ免疫グロブリン軽鎖について、52個の異なる機能的V遺伝子セグメント、及び5個のJ遺伝子セグメントが存在する。免疫グロブリン重鎖について、55個の機能的V遺伝子セグメント、23個の機能的D遺伝子セグメント、及び6個のJ遺伝子セグメントが存在する。免疫グロブリン並びにT細胞受容体V、D及びJ遺伝子セグメントファミリーの全体にわたって、多数の個々の遺伝子セグメントが存在し、それによって、影響を受けうるV(D)J再配列の固有の組合せに関して膨大な多様性が可能になる。明確さの目的のために、再配列された免疫グロブリン又はT細胞受容体[V(D)J]可変核酸領域は、本明細書において再配列された「遺伝子」と称され、個々のV、D又はJ核酸領域は、「遺伝子セグメント」と称される。従って、「遺伝子セグメント」という専門用語は、遺伝子のセグメントへの言及に限らない。むしろ、Ig及びTCR遺伝子再配列の文脈において、これは、それ自体で、これらの遺伝子セグメントがファミリーにクラスター化されている遺伝子への言及である。「再配列された」免疫グロブリン又はT細胞受容体可変領域遺伝子は、本明細書において、1つのVセグメント、1つのJセグメント、及び1つのDセグメント(Dセグメントが、問題となる特定の再配列された可変遺伝子に組み込まれている場合)のうちの2つ以上が、一緒にスプライシングされて単一の再配列された「遺伝子」を形成する遺伝子と理解されるべきである。事実的に、この再配列された「遺伝子」は、実際には、一緒にスプライシングされている1つのV遺伝子セグメント、1つのJ遺伝子セグメント、及び1つのD遺伝子セグメントを含むゲノムDNAのストレッチである。従って、これは、実際には、一緒にスプライシングされている、2又は3個の別個のV、D又はJ遺伝子(本明細書において遺伝子セグメントと称される)から構成されるので、時々、「遺伝子領域」とも称される。従って、再配列された免疫グロブリン又はT細胞受容体遺伝子の個々の「遺伝子セグメント」は、個々のV、D及びJ遺伝子と定義される。これらの遺伝子は、IMGTデータベースにおい
て詳細に説明されている。「遺伝子」という用語は、本明細書において、再配列された免疫グロブリン又はT細胞受容体可変遺伝子を指すために使用される。「遺伝子セグメント」という用語は、本明細書において、V、D及びJセグメントを指すために使用される。しかしながら、免疫グロブリン及びT細胞受容体再配列に関して、「遺伝子」/「遺伝子セグメント」の言語の使用において重大な矛盾が存在することに留意されるべきである。例えば、IMGTとは、個々のV、D及びJ「遺伝子」を指すが、一部の科学出版物は、これらを「遺伝子セグメント」と称する。一部の情報源は、再配列された可変免疫グロブリン又はT細胞受容体を「遺伝子領域」と称するが、その他は、これは「遺伝子」と称する。本明細書で使用される命名法は、以前に定義した通りである。

また、本発明をいかなる理論又は作用様式に限定するものではないが、遺伝子組換え事象の性質は、組換え遺伝子又は遺伝子セグメント(本明細書で定義される通り)の間の接合部は、「N領域」の形成を生じるランダムなヌクレオチドの欠失及び挿入によって特徴付けられうるようなものである。これらのN領域はまた、固有であり、従ってそれら自体が、時々、標的配列分析の文脈において有用な標的である。従って、V(D)J再配列は、組合せの多様性を提供するが、Nヌクレオチド又はパリンドローム(P)ヌクレオチドの付加は、接合部の多様性を提供することが一般に理解される。

また、V(D)J再配列の文脈において、これらの二次構造の特性をコードするV(D)J再配列内のDNA配列領域に関してではあるが、翻訳されるタンパク質分子の二次構造自体が、それら自体で、多くの場合、分析の対象である固有の特性を含むことも理解されるべきである。例えば、IgH(免疫グロブリン重鎖)又はTCRβ若しくはδ鎖の翻訳された可変領域は、通常、相補性決定領域(CDR)1、2及び3と称される、3つのループ状の超可変領域の形態を取る。これらのCDR領域には、4つのフレームワーク領域(FR)1、2、3及び4が隣接している。本発明をいかなる理論又は作用様式に限定するものではないが、V遺伝子セグメントは、CDR1、CDR2、リーダー配列、FR1、FR2及びFR3をコードすることが理解される。CDR3領域は、V遺伝子セグメントの一部、D遺伝子セグメントの全て、及びJ遺伝子セグメントの一部によってコードされる。J遺伝子セグメントの残りは、一般に、FR4をコードする。

従って、一実施形態及びV(D)J再配列の文脈では、前記標的ヌクレオチド配列は、IgH、TCRβ又はTCRδのDJ又はVDJ再配列である。別の実施形態では、前記標的ヌクレオチド配列は、Igκ、Igλ、TCRα又はTCRγのVJ再配列である。更に別の実施形態では、前記再配列は、カッパ欠失エレメント再配列である。

更になお別の実施形態では、前記標的ヌクレオチド配列は、BCL1/JH又はBCL2/JH t(14:18)転座である。

なお更に別の実施形態では、前記標的ヌクレオチド配列は、FLT3又はTP53遺伝子に関連する内部タンデム重複又は他の変異である

標的ヌクレオチド配列の性質に関して、本発明の方法は、特定のV、D若しくはJ遺伝子セグメント配列等の特定のヌクレオチド配列の存在のスクリーニング、又はその領域のDNA分子によって発現される配列の多様性を決定するための標的ヌクレオチド配列領域のスクリーニングを容易にする。この例では、標的ヌクレオチド配列は、特定のV、D又はJ遺伝子セグメントよりもむしろ、V、D又はJ遺伝子セグメントファミリーでありうるので、目的のDNA試料によって発現されるファミリー内の遺伝子セグメントの性質及び多様性の決定が可能になる。

本発明の方法は、個々の鋳型配列のクラスター増幅と、それに続く双方向配列決定の使用に基づく、従来の固相次世代配列決定技術に対する有意な改善を提供する。本発明をいかなる理論又は作用様式に限定するものではないが、この種類の技術の一実施形態では、分析のためのDNA鋳型のライブラリーの調製に続いて、これらの鋳型は、アダプター配列を介して固体支持体に固定される。付着されると、クラスター生成が開始されうる。この目的は、鋳型DNAの数百の同一の鎖を作製することである。一部はフォワード鎖に対応し、その他は相補的なリバース鎖に対応する。次いでクラスターが、ブリッジ増幅によって生成される。ポリメラーゼはDNAの鎖に沿って移動し、その相補鎖を生成する。元の鎖は洗い流され、リバース鎖のみが残る。リバース鎖の上部には、別のアダプター配列が存在する。DNA鎖は曲がり、このアダプター配列に相補的な固定されたオリゴヌクレオチドに付着する。次いでポリメラーゼがリバース鎖に付着し、その相補鎖(これは元の鎖と同一である)が生成される。ここで、各鎖が、アンプリコンの各末端に存在するアダプターと相補的である、他の占有されていない固定されたオリゴヌクレオチド配列に別々に付着することができるように二本鎖DNAが変性される。このブリッジ増幅は、固体支持体(多くの場合、「フローセル」と称される)にわたる個々の鋳型に対応する数千のクラスターを同時に生成するように進行する。従って、各クラスターが単一の開始鋳型DNAから生成されるので、増幅は個々のクラスターの文脈においてクローンである。

クローン増幅に続いて、リバース鎖はフローセルから洗い流され、フォワード鎖のみが残る。次いで可逆的に終端化された蛍光標識化オリゴヌクレオチドを使用した合成による配列決定が開始される。プライマーはフォワード鎖に付着し、ポリメラーゼは蛍光タグ化ヌクレオチドをDNA鎖に付加する。ラウンド毎に1つの塩基のみが付加される。全てのヌクレオチドに存在する可逆的ターミネーターは、1つのラウンドにおける複数の付加を阻止する。4つの塩基の各々は固有の発光を生じ、各ラウンド後に、使用される機器は、発光された蛍光に基づいてどの塩基が付加されたかを記録する。フォワードDNA鎖が読み取られ、配列リードが洗い流されると、リバース鎖が、別のラウンドのブリッジ増幅によって生成される。次いでフォワード鎖が洗い流され、合成による配列のプロセスが、リバース鎖に対して反復される。このようにして、双方向配列決定が達成される。

本発明は、選択された双方向配列リード長より長いDNA鋳型の非重複双方向配列リードを生成し、正確に対合し、アセンブルする手段の設計によってこの方法を改善する。これは、部分的に、核酸試料に由来する鋳型DNA分子のライブラリーの固有の設計によって達成される。これに関する「鋳型」DNA分子への言及は、固体支持体(空間的に分離された)に固定され、その後クローンアンプリコンのクラスターを生成するために増幅されるDNA分子への言及と理解されるべきである。即ち、この分子は、標的核酸領域及び任意の更なる核酸又は本明細書以下により詳細に記載される非核酸領域(例えば、核酸アダプター配列、配列決定プライマーハイブリダイゼーション領域、インデックス領域、固有分子識別子等)の両方を含む。これに関して、クラスター増幅及び配列決定を受ける鋳型DNA分子は一本鎖分子であるが、固体支持体への固定時に、DNA鋳型は、一本鎖形態でありうるか、又は二本鎖DNA分子等の分子複合体、若しくは非核酸成分との複合体の一部を形成しうることが理解されるべきである。例えば、固定前に鋳型集団を濃縮することが望ましい場合があり、これは、それらの単離及びそれによる固定前の濃縮を可能にするために、ビーズ又は化学化合物(例えば、ビオチン)を目的の特定の鋳型DNA分子にカップリングすることによって達成されうる。しかしながら、二本鎖又は他の分子複合体が固定される限り、当業者は、固定された鋳型DNAのみが増幅されるように、複合体をクラスター増幅前に一本鎖にする必要があることを理解するであろう。これに関して、鋳型DNAが、ビオチン等の、増幅を妨げない非核酸分子とカップリングする限り、この非核酸分子は、必ずしも切断される必要がないことが想定される。従って、「鋳型」DNA分子への言及は、実際に、増幅を受けるDNA分子への言及と意図される。鋳型DNAの「ライブラリー」とは、固体支持体に最初に適用され、固定される鋳型DNA分子(一本鎖、二本鎖又は一部の他の複合形態における)の集団を意味する。鋳型DNAは、本明細書上記のように、天然に存在する又は天然に存在しないヌクレオチドから構成されうることは理解されるべきである。

固体支持体に適用される鋳型DNA分子は、目的の核酸試料に「由来する」。「由来する」とは、試料のDNAが、固体支持体への適用前に単に断片化されている場合に行われるように、鋳型DNAが試料から直接単離されるか、又はそれが目的のDNA試料から生成される増幅産物の形態を取ることを意味する。これに関して、鋳型DNAライブラリーは、任意の適切な方法を使用して調製されうる。ライブラリーは、エンドヌクレアーゼ、特に制限酵素、エキソヌクレアーゼ、エキソ-エンドヌクレアーゼ又は部位特異的DNA切断の任意の他の手段を使用すること等の目的の核酸試料の断片化によって生成されうる。標的ヌクレオチド配列の性質及び位置に応じて、この方法は、ライブラリーを生成するのに十分でありうる。或いは、標的ヌクレオチド配列の濃縮を容易にするために、目的のヌクレオチド配列を特異的に標的とし、増幅させるプライマー、例えば、特定の免疫グロブリン若しくはTCR遺伝子セグメント再配列を増幅させるために誘導されるプライマー、発生させたSNPを有しうる遺伝子領域を増幅させるプライマー、又は特定のインデル、切断点若しくは他の染色体転座若しくは変異にわたって増幅させるプライマーを使用して目的の試料を増幅させることを選択することができる。鋳型DNA分子は、任意の適切な長さ、例えば、250～1000、250～900、300～700又は300～600ヌクレオチド長でありうる。鋳型DNAはまた、固相増幅及び配列決定を容易にするアダプター領域等を組み込みうるので、標的核酸領域に対応する鋳型DNA分子の部分は、一般に、鋳型DNAの長さより短いことは当業者によって理解されるであろう。これに関して、これらの更なる非標的領域は、鋳型DNA分子の各末端において15～75ヌクレオチド、好ましくは20～40、より好ましくは20、21、22、23、24、25、26、27、28、29又は30ヌクレオチド長を含みうる。

鋳型DNA分子が、断片化DNAの形態を取るか、又は目的のDNA試料の全て若しくは一部から増幅されるかどうかに関係なく、前記鋳型DNAはまた、本発明の文脈で使用されるハイスループット増幅及び配列決定プラットフォーム技術の有効性を促進するために必要であるか、又は望ましい、更なる核酸又は非核酸成分を導入するために更なる修飾を受けうる。このような更なる配列には、例えば、所与の核酸鋳型配列の増幅産物の識別を可能にするために制限酵素部位又はある特定の核酸タグが含まれる。他の望ましい配列には、フォールドバックDNA配列(これは、一本鎖になるとヘアピンループ又は他の二次構造を形成する)、例えば、核酸ポリメラーゼによって認識されるプロモーターDNA配列、又はDNA結合タンパク質によって認識されるオペレーターDNA配列等の、タンパク質/DNA相互作用を指示する「制御」DNA配列が含まれる。別の例では、固体支持体への鋳型DNAの固定を可能にするために、固体支持体へ鋳型DNAを付着させるための手段は、鋳型DNAにカップリングすることを必要とする。これに関して、本明細書で使用される場合、「固体支持体へ鋳型DNAを付着させるための手段」とは、化学的に修飾可能な官能基を含む、任意の化学的又は非化学的付着方法を指す。「付着」は、不可逆的受動吸着によるか、若しくは分子間の親和性によることを含む、共有若しくは非共有結合による固体支持体上での鋳型DNAの固定化(例えば、ビオチン化分子によるアビジンコート表面上での固定化)、又はハイブリダイゼーション(短い相補的核酸断片の間等)に関連する。付着は、DNA変性条件下で水又は水性緩衝剤で洗浄することによって除去することができないほどの十分な強度のものでなければならない。本明細書で使用される場合、「化学的に修飾可能な官能基」とは、例えば、リン酸基、カルボキシル若しくはアルデヒド部分、チオール、又はアミノ基等の基を指す。この目的のために、「固体支持体」への言及は、例えば、ラテックスビーズ、デキストランビーズ、ポリスチレン、ポリプロピレン表面、ポリアクリルアミドゲル、金表面、ガラス表面及びシリコンウエハー等の、核酸が共有結合されうる任意の固体表面への言及と理解されるべきである。適切な固体支持体を選択し、鋳型DNAを付着させるための手段は、当業者に周知である。一実施
形態では、前記固体支持体は、二次元位置を確認することができる固体マトリクスである。別の実施形態では、前記固体支持体が、ガラス表面(スライドガラス又はフローセル等)であり、ガラス表面へ鋳型を固定するための前記手段は、核酸アンカーである。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成される、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

更に別の実施形態では、前記標的ヌクレオチド配列は、IgH、TCRβ若しくはTCRδのDJ若しくはVDJ再配列、又はIgκ、Igλ、TCRα若しくはTCRγのVJ再配列である。別の実施形態では、前記再配列は、カッパ欠失エレメント再配列である。

核酸固定システムの典型的な例は、鋳型DNA分子の終端の5'及び/又は3'末端に付着される短い線形核酸配列(本明細書では「核酸アダプター」と称される)である。アンカーは、固体支持体に共有結合している相補的核酸配列の形態を取る。鋳型DNAが固体支持体に適用されると、共有結合した核酸アンカーと相補的な任意の核酸アダプター配列は、2つの配列のハイブリダイゼーションをもたらし、それによって、固体支持体に鋳型DNAを固定する。これに関して、鋳型DNAに付着している5'核酸アダプター配列は、対応するアンカー配列のものと同じ配列を発現するように設計されうるので、5'アダプターと相補的な配列のみがアンカーとハイブリダイズし、一方、3'核酸アダプター配列は、その対応するアンカーと相補的である。このように、鋳型DNA配列の全長がクラスター増幅を受けると、対応するアンカーとのDNA鋳型の3'末端上のアダプター配列のハイブリダイゼーション、DNA鋳型から生成されたアンプリコンの増幅が常に促進され、それによって、ブリッジ増幅及びクラスター形成が常に発生することが可能になる。当業者によって理解されるように、これは、例えば、Illumina MiSeq、HiSeq、NovaSeq、及びNextSeq機器使用により、動作する原理である。

従って、固体支持体上の個々の鋳型DNA分子を「空間的に分離する」という言及は、鋳型のクラスター増幅を可能にするために、これらの分子を固体支持体に固定するという言及として理解されるべきである。この目的のために、固体支持体に適用される分子の濃度が、固体支持体にわたるこれらの分子の分布及び固定が、固定された鋳型DNA分子の各々の近位に十分な占有されていないアンカー分子を残すようであるならば、前記鋳型分子は、「空間的に」分離されるので、局在したクローンクラスター増幅が、実質的に別のクラスターに融合する任意の1つのクローンクラスターのアンプリコンなしで発生することができ、それによって、共局在データに基づいて、高い精度で、単一の鋳型からの双方向配列決定データを対合することが可能になる。即ち、単一クラスターのアンプリコンは、固体支持体上の別個の領域内に維持され、データが空間的に割り当てられうるようにクラスター密度が最適化される。これに関して、使用のために選択される機器使用についての最適なクラスター密度を決定することは十分に当業者の範囲内である。当業者によって理解されるように、各クラスターは、各開始鋳型DNA分子についてフォワード鎖及び相補的なリバース鎖の両方を含みうる。

固体支持体への鋳型DNAの固定を容易にするために鋳型DNA分子に組み込まれうるアダプター分子に加えて、鋳型DNA分子はまた、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位、インデックス配列決定プライマーハイブリダイゼーション部位等の、臨床又は研究環境において有用である更なる特性を組み込むように修飾されうる。例えば、目的の標的ヌクレオチド配列を、本明細書上記のように鋳型の5'及び3'末端に局在することに加えて、鋳型が、更なる核酸配列領域を組み込むように修飾されるように鋳型DNA分子を設計することができ、その更なる核酸配列領域は、(a)標的ヌクレオチド配列領域に隣接し、(b)アダプターと一緒に鋳型DNA分子の5'及び3'末端のいずれか又は両方の終端末端に位置する。従って、この更なる核酸配列領域は、アダプター配列、逆多重化インデックス(一般にバーコードとも称される)のうちの1つ又は複数を発現するので、複数の異なる核酸試料を同時に分析することができ、固有分子識別子により、個々のアンプリコン、配列決定プライマーハイブリダイゼーション部位、及びインデックス配列決定プライマーハイブリダイゼーション部位の識別が可能になる。鋳型DNAの5'末端に組み込まれるように選択される特性の組合せは、3'末端に組み込まれるものと同じである必要はない。例えば、逆多重化インデックスは、鋳型DNA鎖の一端にのみ組み込まれうる。最適な実験設計を容易にするために、鋳型DNAにこのような更なる特性を設計することは十分に当業者の範囲内である。このような更なる核酸成分を組み込むための手段は周知であり、鋳型DNA分子の5'及び/又は3'末端へのこれらの特性を含む核酸断片の平滑末端ライゲーションが含まれる。或いは、鋳型ライブラリーが、目的の試料のDNAを増幅させることによって、例えば、PCRによって調製される場合、それらの5'終端末端においてこれらの更なる特性を含むように増幅プライマーを設計することができる。このように、目的の標的ヌクレオチド配列を増幅させるように設計されたプライマーは、これらの更なる核酸配列を同時に組み込むように設計することができ、それによって、単一の増幅工程においてライブラリーを生成する。別の代替では、ライブラリーを調製するために2工程増幅手順を使用する
ことを選択することができ、最初のラウンドの増幅では、標的ヌクレオチド配列を発現する鋳型DNAアンプリコンの生成を対象とするプライマーが使用され、続いて、最初のラウンドから生成された全てのアンプリコンを対象とするプライマー(例えば、コンセンサスプライマー)が使用され、このプライマーは、以前に説明したインデックス等の外因性DNAの組み込みを達成する。

一実施形態では、前記鋳型DNA分子は、終端の5'及び/又は3'位置において、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を更に発現する。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成され、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

本明細書上記に詳述したように、本発明は、鋳型DNAが、双方向配列決定化学が読み取ることができるものよりも長い場合でさえ、ハイスループット双方向配列決定の日常的な使用を容易にした。しかしながら、この開発は、部分的に、標的ヌクレオチド配列が、鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域内に位置するような鋳型DNA分子の設計に基づく。より具体的には、標的配列は、使用のために選択される双方向配列決定技術によってもたらされる最大のリード長の約80%に相当する5'及び/又は3'終端のヌクレオチドのストレッチ内に位置すべきである。これに関して、「双方向配列決定」(一般にペアエンド配列決定とも称される)への言及は、その5'及び3'末端の両方からの鋳型DNA分子に関連する配列情報の取得への言及として理解されるべきである。実際には、これは、固体支持体上でのクラスター形成によって増幅された鋳型DNAを配列決定することによって達成される。その3'末端からの標的鎖(「鋳型鎖」又は「鋳型アンプリコン」としても知られている)と相補的な鎖の配列決定により、「リバースリード」が生成される。このリードの配列は標的鎖と相補的である。この相補鎖の3'末端からの標的鎖との相補体の配列決定により、「フォワードリード」が生成される。このリードの配列は鋳型鎖に対応する。従って、2つのリードは、鋳型鎖の100程度(使用される配列決定化学に応じて)の最も3'のヌクレオチドのリバース相補体、及びその相補鎖である。

鋳型鎖が、フォワード及びリバース双方向配列リード長を合わせたものよりも短い場合、フォワード及びリバースリードは、重複し、重複領域において相補性を示す。これらの読み取りに基づいて、鋳型鎖及びその相補体の全長配列が推定されうる。しかしながら、これは、鋳型鎖の中心領域が、リードのどちらかによって配列決定されていないため、鋳型鎖が、双方向フォワード及びリバースリードのリード長を合わせたものよりも長い場合、可能ではない。本明細書で論じられているように、本発明の方法は、その適用が、その長さに関係なく、任意の鋳型DNA分子(従ってその鋳型鎖アンプリコン)に拡張されうるように、ハイスループット双方向配列決定を実施する改善された手段を提供した。

本発明の試料は、標的ヌクレオチド配列を発現する鎖及び目的の標的ヌクレオチド配列の逆鎖の両方を含む。DNAは、分子を形成するために一緒にハイブリダイズするDNAの2つの相補鎖を含む。目的の対象である標的ヌクレオチド配列は、本発明の文脈において、「フォワード鎖」(また、「鋳型鎖」又は「標的鎖」)として定義され、一方、相補鎖は、「リバース鎖」と言及される。当業者は、DNA二重らせんの二本鎖が、多くの場合、「センス」鎖、「コード」鎖、「プラス(+)」鎖、「トップ」鎖又は「アッパー」鎖と称されることも理解するであろう。これらの後者の3つの用語は、最も一般的には、目的のDNA領域がタンパク質発現産物を生成しない場合に利用される。対応する相補鎖は、多くの場合、「アンチセンス」鎖、「非コード」鎖、「マイナス(-)」鎖、「ロウワー」鎖又は「ボトム」鎖と称される。これは、染色体座の文脈において、トップ/+/アッパー鎖と相補的であり、その天然状態において、トップ鎖とハイブリダイズして、特徴的な二重らせん構造を形成する鎖を意味すると理解されるべきである。当業者によって理解されるように、この命名法は、タンパク質をコードしない多くの遺伝子領域が存在することが判明したため、次第に正確でなくなってきており(従って、センス又はコード鎖に見出されると正確に記載されていない)、更に、その遺伝子は、当業者がこれらの鎖を定義する方法に応じて、+/アッパー鎖又は-/ロウワー鎖のいずれかに見出されうる。現在、タンパク質をコードする遺伝子でさえ、従来、-/ボトム/アンチセンス鎖とみなされていたものに見出されることが知られている。従って、この専門用語のみでの言及によって、特定の染色体位置を言及せずに、又は注釈付きのヒトゲノムデータベースで使用される特定の+/-鎖の命名法での言及によって鎖を識別し、定義することは、不正確でありうる。これに関して、本発明の文脈において、「フォワード鎖」への言及は、これが2つの鎖のどちらでも、目的のヌクレオチド配列を含むDNA鎖への言及であり、一方で、「リバース鎖」は、相補鎖への言及である。従って、標的鎖は、遺伝子が染色体二重らせんに位置する場所に応じて、元のDNA生物学的試料において+/-(トップ/ボトム、アッパー/ロウワー)鎖のいずれかに対応しうる。「フォワード鎖」及び「リバース鎖
」は、本明細書上記の「フォワードリード」及び「リバースリード」の定義とは区別されるべきである。

本明細書上記に詳述したように、目的の1つ又は複数の標的ヌクレオチド配列が、鋳型の5'及び/又は3'終端末端に局在するように、核酸試料に由来するDNA鋳型が設計される。これに関して、DNA鋳型の「終端末端」への言及は、鋳型鎖に沿って3'方向において最も終端の5'ヌクレオチドから隣接して伸び、鋳型鎖に沿って5'方向において最も終端の3'ヌクレオチドから伸びる核酸配列の領域への言及である。より具体的には、使用のために選択される双方向配列決定技術によってもたらされる最大のフォワード又はリバースリード長の約80%に相当する連続した数のヌクレオチドについて、標的ヌクレオチド配列は、それぞれ3'及び5'方向において終端の5'及び/又は3'ヌクレオチドから伸びるヌクレオチドの隣接ストレッチ内に位置する。「フォワード及びリバースリード長」への言及は、両方のリードの合わせた長さではなく、単一のリードのリード長への言及として理解されるべきである。例えば、Illumina NovaSeq 6000使用機器により、300の最大サイクルの実行が可能になり、これは、フォワードリードについて150ヌクレオチド、及びリバースリードについて150ヌクレオチドの双方向配列決定リード長に相当し、この80%は、リード当たり105ヌクレオチドである。従って、「最大のリード長」への言及は、選択された機器使用又は化学が、最適な条件下で達成することができる、フォワードリード又はリバースリードのいずれかについての最大のリード長(例えば、NovaSeq 6000では150)への言及であり、この情報は、当業者に広く日常的に利用可能である。これに関して、単回の配列決定の実行において生成される全てのリードが、必ずしも最大の可能なリード長を生成するとは限らないことは理解されるべきである。なお更に、ハイスループット双方向配列決定工程において生成される数百万のフォワードリード及び数百万のリバースリードを比較する長さは等しくない。通常、配列リード長の間の変動が観察される。即ち、フォワードリード長は、リバースリード長と同様に、最大で5%ずつ異なる場合がある。本明細書上記に詳述したように、全て同じ鋳型分子に由来し、従って同じ配列を発現する一連の対合していないフォワード又は対合していないリバースリードを整列させた場合、現在利用可能なアラ
インメントソフトウェア及びアルゴリズムが、わずかに異なる長さを有するリードの生成のみに起因して、時々、これらの配列を異なる配列として分類することが予想外に判明した。最小限の残存病変、クローン進化又は少数のクローンの存在若しくは出現をスクリーニングする臨床応用に関して、このような分析エラーは、結果の特異性及び/又は感度に悪影響を与える可能性がある。

本明細書上記に詳述したように、標的ヌクレオチド配列は、最大のフォワード及びリバース双方向リード長の約80%に長さが対応するヌクレオチドの終端の5'及び/又は3'隣接ストレッチ内に位置する。一実施形態では、前記最大のリード長のパーセンテージは、70%～85%であり、別の実施形態では、75%～85%であり、更に別の実施形態では、75%～80%である。なお別の実施形態では、前記最大のリード長のパーセンテージは、75%、76%、77%、78%、79%、80%、81%、82%又は83%である。定義された隣接ヌクレオチド領域に「局在する」標的ヌクレオチド配列への言及は、標的配列が、その領域内に位置するが、必ずしもその領域の全体の長さにわたる必要はないことを意味すると理解されるべきである。即ち、標的配列を発現しない定義された領域内に配列のストレッチが存在しうる。これは、標的ヌクレオチド配列が小さい場合に発生する可能性が高い。2つの標的ヌクレオチド配列が存在しうる限り、これらは、例えば、特定のV遺伝子セグメントの部分が鋳型の5'末端に位置し、CDR3領域の一部又は全てが鋳型の3'末端に位置する場合に発生しうるように、鋳型の5'及び3'末端の遠位に位置しうる。目的の1つの標的ヌクレオチド配列のみが存在する場合、鋳型の5'又は3'終端末端のいずれかは、標的ヌクレオチド配列を発現しないことは理解されるべきである。また、単一の定義された5'又は3'領域内に位置する1つより多い標的ヌクレオチド配列が存在しうることも理解されるべきである。例えば、V遺伝子セグメント特異的配列、及び更に、特定のV遺伝子セグメント配列内の体細胞超変異の発生の両方をスクリーニングすることができる。この場合、分析の対象である2つの標的ヌクレオチド配列が存在し、これらは両方、鋳型DNAの末端の定義された隣接ヌクレオチド領域内に位置する。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成され、前記隣接ヌクレオチド領域が、工程(iii)において使用するために選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%に相当し、前記隣接ヌクレオチド領域の終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

本明細書上記に詳述したように、標的ヌクレオチド配列は、選択された双方向配列決定技術の最大の理論上のリード長の約80%に相当する鋳型DNAの定義された5'又は3'終端隣接ヌクレオチド領域内に位置しなければならない。鋳型のこの領域への言及は、標的ヌクレオチド配列を発現するために機能的に利用可能であるか否かに関係なく、定義された領域への言及であることは理解されるべきである。従って、中に標的配列が実際に位置しうる隣接ヌクレオチド領域は、最大のリード長の等価物未満でありうる。例えば、鋳型DNAが、アダプター、インデックス、バーコード、プライマーハイブリダイゼーション部位等(本明細書では「アダプター領域」と称される)の更なる核酸の特性を組み込むように設計されうる限り、終端ヌクレオチドのこのストレッチの全て又は一部は、配列決定プライマーハイブリダイゼーション部位が、アダプター領域内に位置する場所に応じて、標的配列に利用できなくなる。なぜなら、この更なるアダプター領域は、双方向配列リードの一部を必然的に形成するからである。具体的には、プライマーハイブリダイゼーション部位に対して5'に位置するアダプター配列のセクションではなく、配列決定プライマーハイブリダイゼーション部位に対して3'に位置するアダプター領域配列のセクションは、配列リードの一部を形成する。当業者は、このような非標的核酸の特性が、例えば、終端の5'及び3'位置に位置する、10～30ヌクレオチドの隣接ヌクレオチド長を含みうることが想定されることを理解するであろう。双方向配列リードが、2×100～150ヌクレオチドである限り、標的配列に利用可能ではない10～30ヌクレオチドの領域は、選択された配列リード長が、2×200～300ヌクレオチドである場合より、標的配列リード長を最大化するために使用できない、より大きな割合のリード長に対応する。しかしながら、当業者が理解するように、双方向リード長は、使用のための特定の機器使用又は化学を選択する際にのみ考慮されるわけではない。例えば、Illumina MiSeq機器使用は、2×300ヌクレオチドの双方向リード長を提供するが、2×150のリード長のみを提供する、NovaSeq機器使用より1桁超少ないリード深度を提供する。例えば、この方法をMRD分析に適用しようとする場合、配列深度は重要
な要因になる。従って、現在、使用のための任意のハイスループット双方向配列決定の機器使用及び化学を選択する能力は、重複する双方向リードが生成されうるかどうかに関係なく、このクラスの技術の適用範囲を大幅に拡大した。

一実施形態では、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において120個の隣接ヌクレオチドに局在するようにその鋳型DNA分子が生成されるが、前記隣接ヌクレオチド領域の20個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、150ヌクレオチドの最大のフォワードリード長及び150ヌクレオチドの最大のリバース長を生成する配列決定化学を使用する、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
前記部分が、フォワード及びリバースリード長の各々の120ヌクレオチドであり、リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

本明細書上記に定義したように、1つ又は複数の標的ヌクレオチド配列が、鋳型の5'及び/又は3'末端に局在するDNA鋳型を生成することは十分に当業者の範囲内であることは理解されるであろう。現在、DNA鋳型の全体の長さはほとんど重要ではないので、当業者は、標的配列を識別し、次いでそれらを正確な位置でDNA鋳型に組み込む方法を決定することのみを必要とする。目的の標的配列が1つのみ存在する場合、例えば、適切な制限酵素を使用して標的配列の近くで生物学的試料のDNAを単に切断し、次いで任意の必要なアダプター領域を断片にライゲーションするか、又は非ハイブリダイズテール領域としてプライマーの鋳型末端にアダプター領域配列を含むコンセンサスプライマーを使用して断片を増幅させ、それによって鋳型ライブラリーを生成するためにアダプター領域を増幅産物に組み込むことによって鋳型を生成することが可能でありうる。或いは、フォワード又はリバースプライマーのいずれかが標的配列に隣接し、それによって、その増幅を可能にし、一方、他方のプライマーが、PCRの進行を可能にするようにDNAの任意の適切な領域に結合している、プライマーを使用してDNA試料の増幅を実施することができる。これらのプライマーは、非ハイブリダイズ領域としてプライマーの終端末端にアダプター領域配列を組み込むことができ、それによって、単一の工程においてアダプター領域を増幅産物に組み込むか、又はアダプター領域を導入するために第1のラウンドの増幅産物を対象とするコンセンサスプライマーを使用する第2のラウンドの増幅が実施されうる。1つより多い標的配列を分析しようとする場合、当業者は、上流の標的ヌクレオチド配列の5'末端及び下流の標的ヌクレオチド配列の3'末端に隣接する増幅プライマーを設計することができる。分析のために選択される標的ヌクレオチド配列が、本明細書上記に定義されるように、終端の5'及び3'領域に局在しうるならば、介在配列の長さは関連しない。1つ又は複数の標的ヌクレオチド配列に隣接し、それらを増幅させるプライマーの設計は、日常的で簡単な手順である。当業者は、互いに対する標的配列の位置及び問題となるプライマーの向きに応じて、標的ヌクレオチド配列が開始又は終了する場所のできるだけ近くで標的配列に隣接するように増幅プライマーを配置することによって、DNA鋳型の定義された5'及び/又は3'末端に局在しうる標的ヌクレオチド配列の長さを最大化することができ、それによって配列決定することができることを理解するであろう。これに関して、プライマーが、標的配列自体内でハイブリダイズし、そのために、増幅された標的配列ヌクレオチド配列の一部を形成するようにプライマーを設計することができ、この場合、プライマー配列の長さは、配列決定される5'及び/又は3'DNA鋳型領域の一部を形成する。プライマーが標的領域の外側でハイブリダイズする場合、部位特異的形式でアンプリコンからプライマー配列を切断することができる、その3'末端に切断部位を有するプライマー配列を設計することを選択することができる。これらの例のいずれにおいても、アダプター領域は、上記のように単一又は2工程手順のいずれかで導入されうる。更に別の例では、ベクター内で標的ヌクレオチド配列を発現するDNAの領域をスプライシングし、宿主細胞複製を介してベクターを増幅させること等の、非PCRベースの方法を使用して鋳型DNAを生成することを求めることができる。このように生成されたDNA鋳型は、固体支持体へのそれらの付着を促進する前に、ベクターからの切り出しを必要とする。

本明細書上記に詳述したように、本発明の方法は、配列決定化学のリード長が合わされたものより長い鋳型DNAのために、重複する双方向リードを得ることができない場合でさえ、核酸試料をスクリーニングするためにハイスループット双方向配列決定を適用する手段を対象とする。これは、部分的に、増幅が、アンプリコンのクラスターを生成するための任意の適切な方法によって実施されうるように固体支持体上で個々の鋳型DNA分子を空間的に分離することによって達成される。これに関して、「アンプリコン」への言及は、鋳型DNA及び/又はその相補配列の増幅されたコピーへの言及である。従って、「クラスター」への言及は、クローン標的配列及びクローン相補配列のコロニーが、単一の鋳型DNAの周囲に生成されるように、生成され、鋳型DNAの近位に固定されるアンプリコンのコロニーへの言及として意図される。クラスターDNAを実施するための方法は、当業者に周知であり、通常の手順として実施されうる。このようなクラスター増幅を達成する例示的な方法は、ブリッジ増幅である。この方法では、5'及び3'末端の両方にアダプター配列を含む鋳型DNAが、適切な密度で固体支持体上に固定化されると、各コロニーが、元の固定化された鋳型DNA及びその相補配列の複数のコピーを含むように、核酸クラスターは、固定化された鋳型DNAに対して適切な数の増幅サイクルを実行することによって生成されうる。1つの増幅サイクルは、ハイブリダイゼーション、伸長及び変性の工程からなり、これらの工程は、一般に、PCRについて当該分野で周知の試薬及び条件を使用して実施される。典型的な増幅反応は、固体支持体及び付着した鋳型DNAを、ヌクレオシド三リン酸分子又は任意の他のヌクレオチド前駆体、例えば、修飾されたヌクレオシド三リン酸分子の供給と一緒に核酸ポリメラーゼの存在下でプライマーハイブリダイゼーション及び伸長を誘導する条件に供することを含む。プライマーは、鋳型DNAと相補的なヌクレオチドの付加によって伸長される。本発明で使用されうる核酸ポリメラーゼの例は、DNAポリメラーゼ(Klenow断片、T4 DNAポリメラーゼ)、種々の熱安定性細菌由来の耐熱性DNAポリメラーゼ(Taq、VENT、Pfu、Tfl DNAポリメラーゼ等)、及びそれらの遺伝子修飾誘導体(TaqGold、VEN
Texo、Pfu exo)である。DNAコロニーの増幅を生成するために、RNAポリメラーゼ及び逆転写酵素の組合せも使用することができる。好ましくは、使用されるヌクレオシド三リン酸分子は、デオキシリボヌクレオチド三リン酸、例えば、dATP、dTTP、dCTP、dGTPである。ヌクレオシド三リン酸分子は、天然に存在してもよいか、又は天然に存在しなくてもよい。

ハイブリダイゼーション及び伸長工程に続いて、2つの固定化された核酸が存在し、第1は鋳型鎖であり、第2はそれと相補的な核酸鎖である。次いでこれらの核酸分子の両方は、ブリッジの形成及びその相補的固定化アンカーとのアンプリコンの非固定化末端のハイブリダイゼーションにより更なるラウンドの増幅を開始することができる。このような更なるラウンドの増幅は、鋳型鎖及びその相補的配列の複数の固定化されたクローンコピーを含む核酸クラスターを生じる。鋳型DNAの最初の固定化は、鋳型DNAが、ブリッジのみを形成し、鋳型DNAの長さの範囲内の距離に位置するアダプターアンカーとハイブリダイズすることができることを意味する。従って、クラスターの境界は、開始鋳型DNAが固定化された比較的局所的な領域に限定される。明らかに、鋳型鎖及びその相補体のコピーが、更なるラウンドの増幅を実行することによって再度合成されると、形成されるクラスターの境界は、依然として、開始鋳型DNAが固定化された比較的局所的な領域に限定されるが、生成されるクラスターを更に伸長することができる。対象の増幅は、定性的又は定量的に実施することができる。

一実施形態では、前記増幅は、ブリッジ増幅である。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成され、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)ブリッジ増幅によって前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

クラスター形成に続いて、1つ又は複数のクラスターの1つ又は複数のアンプリコンの双方向配列決定が実施される。しかしながら、ほとんどの状況において、全てのクラスター及びこれらのクラスター内の全てのアンプリコンの並行双方向配列決定が行われることが予測される。核酸の双方向配列決定のための任意のハイスループット方法が、本発明の方法において使用されうる。一例では、可逆的に終端化された標識化ヌクレオチドを使用した合成による配列決定が適用される。本明細書上記に詳述したように、本発明をいかなる理論又は作用様式に限定するものではないが、可逆的に終端化された標識化ヌクレオチドを使用する双方向配列決定の一実施形態では、クローン増幅に続いて、リバース鎖が固体支持体から洗い流され、フォワード(鋳型)鎖のみを残す。次いで配列決定が開始される。プライマーはフォワード鎖に付着し、ポリメラーゼは蛍光タグ化ヌクレオチドをDNA鎖に付加する。ラウンド毎に1つの塩基のみが付加される。全てのヌクレオチドに存在する可逆的ターミネーターは、1つのラウンドにおける複数の付加を阻止する。4つの塩基の各々は固有の発光を生じ、各ラウンド後に、使用される機器は、発光された蛍光に基づいてどの塩基が付加されたかを記録する。フォワードDNA鎖が読み取られ、配列リードが洗い流されると、リバース鎖が、別のラウンドのブリッジ増幅によって生成される。次いでフォワード鎖が洗い流され、合成による配列のプロセスが、リバース鎖に対して反復される。このようにして、双方向配列決定が達成される。

一実施形態では、前記方法は、可逆的に終端化された標識化ヌクレオチドを使用した合成による配列決定である。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成され、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)ブリッジ増幅によって前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供せず、前記双方向配列決定が、可逆的に終端化された標識化ヌクレオチドを使用した合成による配列決定である、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

本明細書上記に詳述したように、本発明の方法は、正確で再現性のある結果を提供する非重複双方向配列リードを分析する手段の開発に基づいている。この開発は、フォワード又はリバースリードの1つ又は複数のクラスターが、同じ鋳型配列に由来し、従って同じ配列リード結果を発現するが、リードの配列のほとんどが、これらのリード間で同一であるという事実にもかかわらず、リードのみの長さのいずれかの相違が、現在の分析ソフトウェアでは、これらのリードを異なるものに分類するという予想外の判明に部分的に基づく。配列決定エラーが、配列決定リードの3'末端に対して、より頻繁になるという更なる複雑さにより、結果の分析を更に複雑にする。双方向配列リードが、重複し、相補的な3'末端を含む場合、リードが、アラインメント及び更なる分析前に一緒にテープされるので、個々のリード長の問題は、現実的に意味のないものとなる。更に、配列決定異常を発現する鎖と相補的な鎖からの情報が、いずれかのこのような配列の相違が実在するか、又はしないかどうかを決定するのに役立つため、配列決定エラーの問題は軽減される。これは、重複する相補鎖リードが利用できないリードを分析する場合、不可能である。この理由のために、ハイスループット双方向配列決定に関連する現在の教示は、その長さが、使用することが提案されている機器使用のリード長と適合するように、常に鋳型DNAを設計しなければならないことである。なお更に、当業者が知っているように、双方向配列決定の機器使用は、理論上の最大配列リード長を提供するが、得られる実際のリードは、必ずしもそのリード長を正確に反映しているとは限らず、得られる実際のリード長は、リード間で5%程度も変動する場合がある。

本方法によれば、フォワード及びリバースリードは、配列決定されたクラスターのうちの1つ又は複数について識別される。「識別された」とは、単一のクラスターに共局在するフォワード及びリバースリードについての配列情報が決定されることを意味する。これに関して、多重ハイスループットスクリーニングが実施される場合、当業者は、全てではないが、いくつかのクラスターについてフォワード及びリバースリード配列情報を最初に識別することを選択することができる。例えば、複数の患者試料を分析するために多重反応が実施される場合、結果を逆多重化することを選択することができ、他の患者ではなく1人の患者についての情報を最初に分析することができる。この逆多重化工程は、患者特有のインデックス又はバーコードの使用によって実行される。或いは、1つより多い標的配列が、別個のプライマー対(それら自体が、インデックス又は当業者に周知の他の適切な手段によって識別できるように設計されうる)の使用についてスクリーニングされた場合、これらの標的ヌクレオチド配列の1つのみを最初に分析することを選択することができる。一実施形態では、双方向配列決定情報が生成される全てのクラスターが分析される。これに関して、本明細書以下により詳細に記載されるように、配列リードの分析並びに配列結果の生成及び分析は、任意の簡便な様式で実施されうる。例えば、配列データを手動で検討することができるか、又は工程(iv)に記載される分析工程の1つ又は複数を効率的に自動化するために適切なアルゴリズムを使用することができる。或いは、工程(iv)に記載される工程を実施するために方法及びアルゴリズムの組合せを使用することができる。配列結果の生成を含む、この分析は、最も好都合には、in silicoで実施されることは理解されるべきである。

本明細書上記に詳述したように、本方法に従ってクラスター増幅及び双方向配列決定を受けた個々の鋳型DNA分子についてのフォワード及びリバースリードは、固体支持体上の単一のクラスターの位置へのこれらのリードの共局在に基づいて識別可能である。しかしながら、これらのリードは、それらの3'末端において重複し、相補的な配列領域を示さない。これらの「対合した」リードが識別されると、核酸配列結果を生成することができる。「配列結果」とは、フォワード及びリバースリードからアセンブルされ、次いで目的のDNA試料のクローン性若しくは多様性を評価するためのクラスターの各々の配列結果のアラインメント、配列を更に分類するため(例えば、遺伝子ファミリー又はコンセンサスプライマーを使用して鋳型DNAを増幅させた場合のV、D又はJ遺伝子セグメントの特定の同一性を決定するため)の参照配列に対する配列結果のアラインメント、超変異、インデル、DNA切断点、SNP等の発生及び性質の識別、クローン進化の評価、又は新しいクローンの出現の決定等の最終分析工程に適した形態になる配列を意味する。別の例では、MRDモニタリングの文脈において患者特有の配列を識別することを求めることができる。なぜなら、これは、疾患の再発を示す場合があるからである。配列結果は、配列決定プライマーハイブリダイゼーション部位が配置された場所に応じて、5'及び3'アダプター領域の位置を含む場合があることは理解されるべきである。これに関して、当業者は、配列結果が、介在するリンカー領域と一緒に、目的のDNA試料に対応する配列のみを含むように、この更なる配列を切断することを選択することができる。しかしながら、当業者はまた、これが不必要であり、配列結果が、この更なる配列を、それが識別可能であるため、その5'及び3'末端に保持することを決定することができる。

前記核酸配列結果は、アダプター領域に対応する任意の終端ヌクレオチドを含んでもよいか、又は含まなくてもよい、フォワードリード及びリバースリードの5'隣接核酸配列の部分を、通常、in silicoでアセンブルすることによって生成される。「部分」への言及は、より短いリードに関連するが、フォワード及びリバースリード配列長の必ずしも全てではないが、一部への言及として理解されるべきであり、配列全体を使用してもよい。利用される対象の部分は、当業者によって決定されるが、それは、選択された双方向配列決定技術によってもたらされる最大リードの約80%以上であり、選択された部分は、目的の所与のDNA試料について分析される全てのフォワードリード及び全てのリバースリードについて同じである。「選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長」への言及は、以前に詳述したものと同じ意味を有することが理解されるべきである。これらのパラメーター内の部分を選択することによって、これが、目的の標的配列情報に関して特異性、及び配列エラーを含む可能性が高いことを示す3'配列データの十分な除去に関して配列精度を達成するのに十分な標的ヌクレオチド配列データを提供し、それによって、目的のDNA試料についての高感度及び特異的の両方のスクリーニング結果を可能にすることが判明した。DNA試料のスクリーニングに使用される部分の決定に関して、本明細書に提供される教示に照らして考慮される場合、これを決定することは十分に当業者の範囲内である。多重アッセイが、複数の患者、複数の異なる組織からの試料を用いて実施される限り、及び/又は異なる標的配列を対象とする限り、例えば、当業者は、結果のカテゴリー間と異なる部分の長さを決定することができる。しかしながら、単一のDNA試料源の文脈において、部分は、全てのフォワード配列リードについて同じであり、全てのリバース配列リードについて同じである。これに関して、フォワードリードでの使用のために選択される部分の長さは、リバースリードについて選択される部分の長さと同じである必要はない。フォワード及びリバース部分の核酸の長さが、全てのフォワードリード部分と全てのリバースリード部分との間と同じであることを確実にすることによって、ある配列がその他よりも長いという事実のみのためにクローン配列が異なる配列であるという誤分類の可能性の予期せぬ発生を防ぐ。

前記フォワード及びリバースリード部分は、フォワードリードの3'末端を、核酸リンカーを介してリバースリード由来の配列情報と連結することによって配列リード結果を生成するためにアセンブルされる。これに関して、当業者は、フォワード及びリバースリードの配列が、鋳型/フォワード鎖の5'末端、相補/リバース鎖の5'末端の配列にそれぞれ対応することを理解するであろう。従って、これらのリードが、ハイブリダイズされる配列の全長に沿って伸長した場合、2つのリードは相補的である。従って、鋳型DNAの5'及び3'末端、並びに鋳型鎖と相補的な鎖の5'及び3'末端をテープすることを対象とする本発明の文脈において、容易且つ迅速にin silicoで達成されうる、フォワード及びリバースリード配列の各々と相補的な配列を決定すること、並びにフォワードリード配列をリバースリード配列の相補体とテープすることが必要である。同様に、フォワードリード配列の相補体は、リバースリード配列とテープされる。次いでこれは、5'及び3'末端配列のみではあるが、鋳型配列結果、及び鋳型鎖と相補的な鎖についての対応する配列結果を生成する。

「核酸リンカー」への言及は、フォワードリード配列の3'末端が、リバースリード配列と相補的な配列に連結され、リバースリード配列の3'末端が、フォワードリード配列との相補体に連結される、単一の線形隣接核酸配列を形成するように、フォワード及びリバースリード部分の3'末端、並びにフォワード及びリバースリード部分と相補的な配列の5'末端に付着される、核酸配列、好ましくは、線形配列への言及として理解されるべきである。リンカーのヌクレオチドは、任意の天然に存在するか、又は天然に存在しないヌクレオチドでありうるが、本発明のこの態様が、in silicoで実施される限り、アセンブルされた配列結果のヌクレオチドの実際の化学構造は、関連する場合、正確な相補的塩基対合を示す等の、それらの対応する物理的形態で機能するかのように解釈され、分析されるようなこれらのヌクレオチドに関連するin silicoでの機能的な情報よりも重要ではない。「天然に存在する及び天然に存在しない」ヌクレオチドへの言及は、本明細書上記に提供されたものと同じ意味を有するべきである。一実施形態では、前記核酸リンカーは、N_xであり、ここで、Nは、天然又は非天然のヌクレオチドを表し、xは、リンカーにおける隣接ヌクレオチドの数を表す。リンカー配列自体の性質に関して、これはランダムな配列でありうるが、ランダムに生成された配列が使用される場合、それは、全ての配列結果について同じでなければならない。なぜなら、アセンブルされ、他の点ではクローンに由来し、従って同一であるフォワード及びリバースリード対に使用されるリンカー配列の相違は、リンカー配列の変動のために、これらの配列が異なるものと分類される結果となる。また、免疫受容体の多様性の文脈等における単一のDNA試料の配列結果間の比較は、無意味であることを意味する。好ましくは、対象配列が、in silicoでつながれる場合、前記Nヌクレオチドは、単にNと指定され、それによって、A、T、G及びCの天然に存在するヌクレオチドに対して異なり、識別可能である。リンカー配列の長さは、当業者によって決定される任意の適切な長さでありうる。これに関して、リンカーにおけるヌクレオチドの数は、少なすぎてはならないことが判明した。なぜなら、1又は2個のみのNのヌクレオチド「リンカー」は、ランダムなヌクレオチド挿
入と解釈され、それによって、リンカーとして解釈されず、配列の整列を誤る。一実施形態では、前記リンカーは、5～30ヌクレオチド長、好ましくは5～25、より好ましくは5～20ヌクレオチド長である。別の実施形態では、前記リンカーの長さは、5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチドである。

この実施形態によれば、1つ又は複数の標的DNA配列を発現させるために目的のDNA試料をスクリーニングする方法であって、
(i)前記DNA試料に由来する個々の鋳型DNA分子のライブラリーをガラス表面上で空間的に分離する工程であって、標的DNA配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成され、前記隣接ヌクレオチド領域の終端末端が、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、工程と、
(ii)ブリッジ増幅によって前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供せず、前記双方向配列決定が、可逆的に終端化された標識化ヌクレオチドを使用した合成による配列決定である、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、5～30ヌクレオチド長であり、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

配列結果がアセンブルされると、アセンブルされた配列が分析されうる。実施される分析の種類は、当業者によって決定され、求められる情報の性質に依存する。例えば、特定の変異又は特定のV(D)J免疫グロブリン若しくはTCR再配列等の他の配列特性の存在又は不在を識別するためにこれらの結果をマイニングすることができる。これは、診断若しくはMRD目的、又は処置の相対的有効性の決定に有用でありうる。一部の疾患は、特定の変異(例えば、Flt3又はNPM1)、超変異、インデル、遺伝子切断点(例えば、BCR-ABL)等の存在によって識別される。或いは、以前の既知の標的配列の存在をスクリーニングするのではなく、目的の遺伝子領域の配列の多様性を調査することを求めることができ、次いでこの配列情報が、疾患の進行及び/又は進展を追跡するために使用されうる。例えば、単一の白血球の新生物形質転換から生じる白血球新生物は、それ自体で、新生物細胞の固有のV、D及び/又はJ再配列を識別することに基づいて識別及び追跡に役立つ。これは、最小限の残存病変を評価するのに特に有用でありうる。免疫細胞レパートリーの膨大な多様性のために、実質的に全ての白血球は、固有の免疫グロブリン又はTCR再配列を示す。新生物集団において再配列された特定の遺伝子セグメントの1つ又は複数を識別することによって、特定の細胞が追跡されうる。本発明の適用に関して、IgH VJ再配列等の特定の再配列の多様性を評価するために生物学的試料のDNAをスクリーニングすることもできる。血液又は骨髄試料からの再配列されたIgH VJ配列の全てがスクリーニングされる場合、配列結果のアラインメントは、IgH VJ遺伝子セグメント再配列の多様性の定性的又は定量的読み出しを提供する。これは、免疫療法、感染、移植、自己免疫、アレルギー、免疫不全又はT若しくはB細胞クローン増殖が、免疫活性の指標として発生しているかどうか(望ましいか、又は望ましくないか)を評価する際に有益でありうる任意の他の事態の状況又は進行を決定するために免疫系を調査する文脈において非常に有用でありうる。クローン集団の拡大(例えば、病原体又は自己抗原に対する急性免疫応答に起因する)を示すクローンが存在する場合、IgH VJ遺伝子座における再配列の他の点では異種のバックグラウンドアレイに対する、単一の特
定の再配列に対応する配列リードの数の増加が明らかになる。このクローンの存在の識別により、特定の遺伝子セグメント再配列を識別し、そのクローンについて追跡することが可能になる。これは、自己免疫の文脈において特に重要でありうる。複数のクローンが増殖している場合、これは、感染、移植又はアレルギーの文脈において複数の抗原に対する応答等の広範囲の免疫応答を示している可能性がある。

本明細書で実施される配列分析に関して、単一のクラスターについての複数の同一の配列結果が整列され、同一の配列は単一の配列結果に融合される。クラスター内の同一でない配列は、それらが、同じクラスターからの他のアンプリコンの配列と異なる場合、配列決定エラーを含む可能性があることに基づいて破棄される。DNA二重鎖結果を生成するために相補配列は対合されうる。次いでクラスター間の一本鎖又は二本鎖配列が整列される。一例では、異なるクラスターの配列間の2又は3ヌクレオチドの相違の許容差が閾値であり、この閾値を下回ると、それらの配列が、目的の開始DNA試料に存在するクローン集団に由来すると分類されうる。次いで相対的又は実際の割合(増幅が定量的に実施されたか否かに応じる)が、例えば、クローンの増殖の証拠が存在するかどうか、又は特定の配列(MRD評価について関連するもの等)が存在するかどうかを決定するために評価される。

この実施形態によれば、前記分析は、工程(iv)において生成された核酸配列結果を整列させ、目的の標的核酸配列の発現を決定する工程を含む。

従って、本方法は、1つ又は複数の標的ヌクレオチド配列の発現によって特徴付けられうる文脈又は任意の疾患若しくは非疾患状態において、診断、予後、分類、疾患リスクの予測、疾患の再発の検出、免疫監視又は予防若しくは治療効果のモニタリングに使用されうる。なお更に、この方法は、研究及び開発の文脈等の、ある特定の標的DNA及びRNA領域における配列の分析又は特定の標的DNA及びRNA配列の存在のスクリーニングが必要とされる任意の他の文脈に適用される。例えば、本発明は、科学者及びバイオテクノロジー産業が、ゲノミクス、薬理ゲノミクス、創薬、食品の特性評価、及び遺伝子型判定の分野において取り組もうとしている現在及び新たなに出現した必要性に対する解決策を提供する。

非限定的な例としてリンパ系新生物を使用して、本発明は、哺乳動物(例えば、ヒト)が新生物を有するかどうか、哺乳動物から採取した生物学的試料が、新生物細胞又は新生物細胞に由来するDNAを含有するかどうかを決定するための方法であって、新生物を発生する哺乳動物のリスク又は可能性を推定するか、抗がん処置の有効性をモニタリングするか、又はがんを有する哺乳動物において適切な処置を選択する、方法を提供する。このような方法は、リンパ系新生物が、固有のV(D)J再配列を発現する細胞のクローン増殖によって特徴付けられる決定に基づく。

本発明の方法は、新生物を有することが知られているか、若しくは有する疑いがある個体を査定するために使用されうるか、又は新生物を有すると必ずしも疑われていない個体における日常的な臨床試験として使用されうる。更に、本方法は、処置過程の有効性を評価するために使用されうる。例えば、抗がん処置の有効性は、リンパ系がんを有する哺乳動物においてDNAメチル化を経時的にモニタリングすることによって評価されうる。例えば、処置後に哺乳動物から採取された生物学的試料中の特定の標的ヌクレオチド配列によって特徴付けられるクローン集団の減少又は不在は、有効な処置を示す。

従って、本発明の方法は、リンパ系新生物の文脈であるか、本明細書上記の任意の他の適用の文脈であるかどうかにかかわらず、1回限りの試験として、又は個体の継続モニタリングとして有用である。これらの事態では、標的配列についてのスクリーニングは、個体の状況、例えば、それらの免疫系の状況の有益な指標である。

従って、別の態様では、患者における状態について、診断、モニタリング、又はこれらでなければスクリーニングする方法であって、状態が、1つ又は複数の標的ヌクレオチド配列の発現によって特徴付けられ、
(i)核酸試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、標的ヌクレオチド配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

「核酸試料」への言及は、植物、動物若しくは微生物、又は限定されないが、細胞物質、血液、粘液、糞便、尿、組織生検標本若しくは動物の体内に導入され、後で除去される液体(例えば、肺洗浄後に肺から抽出された生理食塩水又は浣腸洗浄液から回収された溶液等)、微生物(例えば、細菌、ウイルス、寄生虫)、組織培養物、又は組換えDNAプロセス等の任意の組換え、合成若しくは人工源等の任意の生物に由来するDNAの任意の試料への言及として理解されるべきである。本発明の方法に従って試験される生物学的試料は、直接試験されうるか、又は試験前に何等かの形態の処理を必要としうる。例えば、生検試料は、試験前に均質化を必要としうる。更に、生物学的試料が液体形態でない限り、試料を動員するために緩衝剤等の試薬の添加を必要としうる。

標的DNAが試料に存在する限り、試料は直接試験されうるか、又はその他に、試料に存在する核酸物質の全て又は一部が試験前に単離されうる。標的核酸分子を試験前に前処理すること、例えば、生ウイルスの不活化又はゲル上で泳動することは、本発明の範囲内である。また、試料は、新たに収集されうるか、又は試験前に保存(例えば、凍結により)されていてもよいか、又はそれらでなければ試験前に処理(培養を受ける等)されていてもよいことは理解されるべきである。試料はまた、細胞系又は細胞培養物を生成するために、in vitro培養又は操作(不死化又は組換え等)を受けていてもよい。

本明細書に開示される方法に従って試験するのに最も適した試料の種類の選択は、モニタリングされる状態の性質等の事態の性質に応じる。例えば、好ましい実施形態では、新生物状態が分析の対象である。新生物状態がリンパ性白血病である場合、血液試料、リンパ液試料又は骨髄吸引物が、適した試験試料となる可能性がある。新生物状態がリンパ腫である場合、リンパ節生検又は血液若しくは骨髄試料が、試験のための適切な組織源となる可能性がある。新生物細胞の元の供給源をモニタリングするかどうか、又は起点からの新生物の転移の存在若しくは他の形態の拡散をモニタリングするかどうかについても考慮する必要がある。これに関して、任意の1つの哺乳動物から多数の異なる試料を収集し、試験することが望ましい場合がある。別の例では、感染の場合、ウイルス増加等の、細胞増加及び微生物クローン増殖のいずれか又は両方について試験することができる。任意の所与の検出シナリオについて適切な試料を選択することは、当業者の技術の範囲内である。

本明細書で使用される限り、「哺乳動物」という用語は、ヒト、霊長類、家畜動物(例えば、ウマ、ウシ、ヒツジ、ブタ、ロバ)、実験試験動物(例えば、マウス、ラット、ウサギ、モルモット)、コンパニオンアニマル(例えば、イヌ、ネコ)、及び捕獲野生動物(例えば、カンガルー、シカ、キツネ)を含む。好ましくは、哺乳動物は、ヒト又は実験試験動物である。更により好ましくは、哺乳動物はヒトである。

試験される核酸試料は、一部の疾患状態の文脈において循環中に見出されるような無細胞DNAでありうるか、又はそれは細胞に由来しうる。

「細胞又は複数の細胞」への言及は、任意の種からの細胞の全ての形態、及びそれらの変異体又はバリアントへの言及として理解されるべきである。一実施形態では、細胞はリンパ球細胞であるが、本発明の方法は、部分的又は完全な免疫グロブリン又はTCR再配列を受けうる任意の種類の細胞に対して実施されうる。本発明をいずれか1つの理論又は作用様式に限定することなく、細胞は、生物(単細胞生物の場合)を構成することができるか、又はそれは、個々の細胞が特定の機能について多かれ少なかれ特殊化(分化)されうる、多細胞生物のサブユニットでありうる。全ての生きている生物は、1つ又は複数の細胞から構成される。対象細胞は、同系、同種異系又は異種の文脈において試験の対象である生物学的試料の一部を形成しうる。同系の文脈は、クローン細胞集団及びクローン集団が中に存在する生物学的試料が、同じMHC遺伝子型を共有することを意味する。これは、例えば、個体における新生物の存在をスクリーニングする場合に最も起こりうる。「同種異系」の文脈は、対象クローン集団が、実際に、生物学的試料が採取された個体のものとは異なるMHCを発現する場合である。これは、例えば、移植片対宿主病等の状態の文脈において移植されたドナー細胞集団(免疫適格性骨髄移植等)の増殖をスクリーニングする場合に発生しうる。「異種」の文脈は、対象クローン細胞が、生物学的試料が由来する対象のものとは完全に異なる種のものである場合である。これは、例えば、可能性のある新生物ドナー集団が、異種移植に由来する場合に発生しうる。

対象細胞の「バリアント」には、バリアントである細胞の形態学的若しくは表現型の特性又は機能的活性の全てではないが、一部を示す細胞が含まれるが、これらに限定されない。「変異体」には、遺伝子修飾された細胞等の天然又は非天然に修飾された細胞が含まれるが、これらに限定されない。

「クローン」とは、細胞又は微生物の対象集団が、共通の細胞起源に由来することを意味する。例えば、新生物細胞の集団は、特定の分化段階で形質転換を受けた単一細胞に由来する。これに関して、遺伝的に別個の新生物細胞の集団を生成するように更なるゲノム再配列又は変異を受ける新生物細胞もまた、細胞の別個のクローン集団ではあるが、細胞の「クローン」集団である。別の例では、急性又は慢性の感染又は免疫刺激に応答して増殖するT又はBリンパ球もまた、本明細書で提供される定義内の細胞の「クローン」集団である。更に別の例では、細胞のクローン集団は、より大きな微生物集団内で生じた薬物耐性クローン等の、クローン微生物集団又はウイルスクローンである。好ましくは、細胞の対象クローン集団は、細胞の新生物集団又はクローン免疫細胞集団である。

一実施形態では、前記クローン細胞は、クローンリンパ球細胞の集団である。

「リンパ球細胞」への言及は、免疫グロブリン又はTCR可変領域遺伝子セグメントの少なくとも1つの生殖細胞系列セットを再配列した任意の細胞への言及であることは理解されるべきである。再配列されうるゲノムDNAをコードする免疫グロブリン可変領域は、重鎖又はκ若しくはλ軽鎖に関連する可変領域を含み、一方、再配列されうるゲノムDNAをコードするTCR鎖可変領域は、α、β、γ及びδ鎖を含む。これに関して、細胞が、少なくとも1つの免疫グロブリン又はTCR遺伝子セグメント領域のDNAをコードする可変領域を再配列したならば、細胞は、「リンパ球細胞」の定義の範囲内であることが理解されるべきである。細胞はまた、再配列されたDNAを転写し、翻訳している必要はない。これに関して、「リンパ球細胞」は、その範囲内に、TCR又は免疫グロブリン可変領域遺伝子セグメントを再配列したが、再配列された鎖(TCR-胸腺細胞等)をまだ発現していないか、又はそれらのTCR若しくは免疫グロブリン可変領域遺伝子セグメントの両方の鎖をまだ再配列していない未熟T及びB細胞を含むが、これらに決して限定されない。この定義は更に、少なくとも一部のTCR又は免疫グロブリン可変領域再配列を受けたリンパ様細胞に及ぶが、その細胞は、他の点では、成熟T細胞又はB細胞に従来的に関連する表現型又は機能的特徴の全てを示さない場合がある。従って、本発明の方法は、1つの可変領域遺伝子領域の少なくとも一部の再配列が発生したならば、限定されないが、任意の発生の分化段階でのリンパ球細胞、活性化リンパ球細胞、又は非リンパ/リンパ様細胞を含む、細胞の新生物をモニタリングするために使用されうる。これはまた、特異的抗原に応答して発生するクローン増殖をモニタリングするために使用されうる。

別の実施形態では、前記状態は、免疫細胞によって発現される1つ又は複数の標的ヌクレオチド配列によって特徴付けられる。別の実施形態では、前記状態は、1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴の発現によって特徴付けられる。

この実施形態によれば、患者における状態について、診断、モニタリング、又はこれらでなければスクリーニングする方法であって、状態が、1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴の発現によって特徴付けられ、
(i)B及び/又はT細胞DNAを含むDNA試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、前記再配列されたV、D又はJ遺伝子セグメントが、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される1つ又は複数のクラスターごとにフォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、フォワードリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、リバースリードの終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)リンカー配列が、(a)の全ての核酸配列結果について同じであり、リンカー配列が、(b)の全ての核酸配列結果について同じである、工程と、
(v)配列結果を分析する工程と
を含む、方法が提供される。

更に別の実施形態では、1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴の発現によって特徴付けられる前記状態は、感染、移植、自己免疫、免疫不全、新生物又はT若しくはB細胞クローン増殖によって特徴付けられる任意の他の状態である。

本発明のこの態様に関して、「モニタリング」への言及は、前記集団の存在の最初の診断後に細胞の対象クローン集団の存在又はレベルについて対象を試験することへの言及として理解されるべきである。「モニタリング」は、単独の1回限りの試験又は数日、数週、数ヶ月若しくは数年にわたる一連の試験の両方を行うことへの言及を含む。試験は、限定されないが、適切な処置に関する決定に至るのを支援するために、又は新しい処置形態を試験するために、寛解状態にある哺乳動物が再発する可能性を予測すること、最小限の残存病変をスクリーニングすること、処置プロトコールの有効性をモニタリングすること、寛解状態にある患者の状況を確認すること、処置レジメンの適用の前又は後に状態の進行をモニタリングすることを含む、任意の複数の理由について行われうる。従って、本発明の方法は、臨床手段及び研究手段の両方として有用である。

「新生物細胞」への言及は、異常な「成長」を示す細胞への言及として理解されるべきである。「成長」という用語は、その最も広い意味で理解されるべきであり、増殖への言及を含む。これに関して、異常な細胞成長の例は、細胞の制御されない増殖である。リンパ球細胞の制御されない増殖は、固形腫瘍又は単一細胞懸濁液(例えば、白血病患者の血液で観察されるようなもの)のいずれかの形態を取る細胞の集団をもたらす場合がある。新生物細胞は、良性細胞又は悪性細胞でありうる。好ましい実施形態では、新生物細胞は、悪性細胞である。これに関して、「新生物状態」への言及は、対象哺乳動物における新生物細胞の存在への言及である。「新生物リンパ球状態」は、白血病、リンパ腫及び骨髄腫において発生するような異常に多い数の新生物細胞の存在への言及によって特徴付けられる疾患状態への言及を含むが、この語句はまた、哺乳動物に見出される新生物細胞の数が、通常、明らかな疾患状態から寛解状態、又はその逆への哺乳動物の移行の画定とみなされる閾値を下回る出来事への言及を含むと理解されるべきである(寛解の間に存在する細胞数は、多くの場合、「最小限の残存病変」と称される)。なお更に、哺乳動物に存在する新生物細胞の数が、本発明の出現前に利用されたスクリーニング方法によって検出可能な閾値を下回る場合でさえ、それにもかかわらず、哺乳動物は、「新生物状態」を示すとみなされる。

この実施形態の文脈における分析に適した疾患状態には、急性リンパ芽球性白血病、急性リンパ性白血病、急性骨髄性白血病、急性前骨髄球性白血病、慢性リンパ性白血病、慢性骨髄性白血病、骨髄増殖性新生物、例えば、骨髄腫、全身性肥満細胞症、リンパ腫及びヘアリー細胞白血病等の任意のリンパ系新生物が含まれる。

1つの特定の実施形態では、本発明の方法は、リンパ系新生物の文脈において最小限の残存病変を検出するために使用される。

前述の態様の全てによれば、一実施形態では、前記ガラス表面は、スライドガラス又はフローセルである。

別の実施形態では、前記隣接ヌクレオチド領域の終端末端は、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する。

更に別の実施形態では、前記増幅は、ブリッジ増幅である。

コンピューター実装方法、コンピューター可読記憶媒体及びデバイス
本開示の一部の態様は、1つ又は複数の標的ヌクレオチド配列を発現させるために目的の核酸試料をスクリーニングするための非重複配列リードから分析するための核酸配列結果を作成するための方法を実装する、コンピューター実装方法、並びにコンピューター可読記憶媒体及びデバイスを対象とする。

本明細書に記載されるコンピューター実装方法、並びにコンピューター可読記憶媒体及びデバイスは、参照配列を使用せずに非重複配列リードの分析を可能にすることによって従来技術の方法よりも利点を提供する。この方法は、共局在した非重複リード配列からフォワード及びリバース配列リードを識別する工程、識別したフォワード及びリバース配列リードをトリミングする工程(即ち、フォワード配列リードの5'部分から所定の長さ及びリバース配列リードの5'部分から所定の長さを取得する工程)、及び次にそれらを、間に所定数のN(Nは、任意のヌクレオチド(例えば、A、G、T又はCのいずれか1つ)を指す)を含む核酸リンカーと一緒にテープする工程(一方のセットの配列リード(フォワード又はリバース)を常に維持し、他方のセットのリバース相補体を取得する工程)を含む。一部の実施形態では、本明細書に記載されるコンピューター実装方法、並びにコンピューター可読記憶媒体及びデバイスは、数百万から数十億の配列リードを処理する。一部の実施形態では、本明細書に記載されるコンピューター実装方法、並びにコンピューター可読記憶媒体及びデバイスは、少なくとも100万、500万、1000万、2000万、3000万、4000万、5000万、1億、2億5000万、5億、10億、50億、100億又はそれ以上の配列リードを処理する。

本明細書で使用される場合、「メモリ」という用語は、プログラムメモリ及び作業メモリを含む。プログラムメモリは、1つ又は複数のプログラム又はソフトウェアモジュールを有しうる。作業メモリは、本明細書に記載される機能性を実行する際にCPUによって使用されるデータ又は情報を記憶する。

「プロセッサ」という用語は、シングルコアプロセッサ、マルチコアプロセッサ、単一のデバイスに配置された複数のプロセッサ、又は相互に有線若しくは無線通信でデバイスのネットワーク、インターネット、又はクラウドを介して配布された複数のプロセッサを含むことができる。従って、本明細書で使用される場合、「プロセッサ」によって実行又は実行されるように構成された機能、特性、又は命令は、単一コアプロセッサによる機能、特性、若しくは命令の実行を含むことができ、マルチコアプロセッサの複数のコアによる機能、特性、若しくは命令の集合的若しくは協調的な実行を含むことができ、又は複数のプロセッサによる集合的若しくは協調的な機能、特性、若しくは命令の実行を含むことができ、各プロセッサ又はコアは、全ての機能、特性、又は命令を個別に実行する必要がない。プロセッサは、CPU(中央処理装置)であってもよい。プロセッサは、GPU(グラフィック処理装置)等の他のタイプのプロセッサを含むことができる。本開示の他の態様では、プログラムメモリにプログラムされたCPU実行命令の代わりに、又はそれに加えて、プロセッサは、ASIC(特定用途向け集積回路)、アナログ回路、又はFPGA(フィールドプログラマブルゲートアレイ)、PAL(位相交互ライン)又はPLA(プログラマブルロジックアレイ)等の他の機能論理でありうる。

CPUは、本明細書に記載される機能性を実行するために、プログラムメモリに記憶されたプログラム(本明細書ではモジュール又は命令としても記載される)を実行するように構成される。メモリは、RAM(ランダムアクセスメモリ)、ROM(読み取り専用メモリ)、及び永続ストレージでありうるが、これらに限定されない。メモリは、例えば、限定されないが、データ、プログラム、命令、プログラムコード、及び/又は他の適切な情報等の情報を、一時的及び/又は永続的に記憶することができる任意のハードウェアの一部である。

本開示の様々な態様は、コンピューター若しくは機械で使用可能若しくは読み取り可能な媒体、又はコンピューター、プロセッサ、及び/若しくは機械で実行されると、方法の工程をコンピューター若しくは機械に実行させる媒体の群に具現化又は記憶されたプログラム、ソフトウェア、又はコンピューター命令として具現化されうる。機械によって読み取り可能なプログラム記憶デバイス、例えば、コンピューター可読媒体、本開示に記載される様々な機能性及び方法を実行するための機械によって実行可能な命令の有形に具現化するプログラムもまた、提供される。

一部の実施形態では、本開示は、CPU、ディスプレイ、ネットワークインターフェース、ユーザーインターフェース、メモリ、プログラムメモリ及び作業メモリを含むシステムを含み(図1)、そのシステムは、本開示の方法又はプロセッサに向けられたプログラム、ソフトウェア、又はコンピューター命令を実行するようにプログラムされている。例示的及び非限定的な実施形態は、図2及び図3に示される。

コンピューター実装方法
本開示の態様は、アンプリコンのクラスターからの非重複配列リードから分析するための核酸配列結果を作成するためのコンピューター実装方法を対象とする。

一部の実施形態では、コンピューター実装方法は、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別する工程を含む。一部の実施形態では、フォワード及びリバース配列リードは、DNA配列リードである。

一部の実施形態では、アンプリコンのクラスターは、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードは、選択された双方向配列決定技術によって生成される。一部の実施形態では、双方向配列決定技術は、表1に列挙された技術から選択される。一部の実施形態では、フォワード配列リード及びリバース配列リードは重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供しない。

一部の実施形態では、アンプリコンのクラスターは、B及び/又はT細胞DNAから増幅される。一部の実施形態では、アンプリコンのクラスターは、少なくとも1つの再配列されたV、D又はJ遺伝子セグメントを含む。一部の実施形態では、アンプリコンのクラスターは、IgH、TCRβ若しくはTCRδのDJ若しくはVDJ再配列、又はIgκ、Igλ、TCRα若しくはTCRγのVJ再配列を含む。具体的な実施形態では、VJ再配列は、カッパ欠失エレメント再配列である。一部の実施形態では、アンプリコンのクラスターは、超変異を受けやすい領域等のV遺伝子セグメント領域、及び/又はCDR3の部分をコードするJ遺伝子セグメント領域を含む。一部の実施形態では、アンプリコンのクラスターは、Vリーダー配列、体細胞超変異を受けやすいV領域、IgH FR1、IgH FR2又はIgH FR3の全て又は一部をコードする遺伝子セグメント領域を含む。

一部の実施形態では、コンピューター実装方法は、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第1の核酸配列結果を得る工程を含む。

一部の実施形態では、各連結は、フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第1の核酸リンカー配列をつなぎ、それによって、フォワード配列リードの部分、第1の核酸リンカー配列、及びリバース配列リードの部分のリバース相補体をその順序で含む第1の核酸配列結果を得ることによって達成される。

一部の実施形態では、識別する工程は、フォワード配列リード及びリバース配列リードに見出される、1つ又は複数のインデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位によって達成され、フォワード配列リードに見出される、1つ又は複数のインデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位は、リバース配列リードに見出される、1つ又は複数のインデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位とは異なる。

一部の実施形態では、コンピューター実装方法は、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第2の核酸配列結果を得る工程であって、各連結が、リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第2の核酸リンカー配列をつなぎ、それによって、リバース配列リードからの部分、第2の核酸リンカー配列、及びフォワード配列リードからの部分のリバース相補体をその順序で含む第2の核酸配列結果を得ることによって達成される、工程を更に含み、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)第2の核酸リンカーにつながれるリバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、第1の核酸リンカーにつながれるリバース配列リードからの部分の長さと同じであり、(3)第2の核酸リンカーにつながれるフォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、第1の核酸リンカーにつながれるフォワード配列リードからの部分の長さと同じであるが、第2の核酸リンカーにつながれるリバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである。

一部の実施形態では、フォワード配列リードからの部分の長さは、選択された双方向配列決定技術によってもたらされる最大のリード長の約75%、76%、77%、78%、79%、80%、81%、82%又は83%以上であり、リバース配列リードからの部分の長さは、選択された双方向配列決定技術によってもたらされる最大のリード長の約75%、76%、77%、78%、79%、80%、81%、82%又は83%以上である。一部の実施形態では、リバース配列リードからの部分の長さは、分析される全てのリバース配列リードについて同じである。一部の実施形態では、フォワード配列リードからの部分の長さは、分析される全てのフォワード配列リードについて同じであるが、リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよい。一部の実施形態では、フォワード配列リードの部分の長さは、リバース配列リードの部分の長さと同じである。

一部の実施形態では、フォワード配列リードの部分は、フォワード配列リードの5'終端の指定された数の隣接ヌクレオチドを含み、リバース配列リードの部分は、リバース配列リードの5'終端の指定された数の隣接ヌクレオチドを含む。一部の実施形態では、指定された数の隣接ヌクレオチドは、約80ヌクレオチドから約180ヌクレオチドの間を含む。本開示で使用される場合、「約」という用語は、所与の値の±10%を指す。一部の実施形態では、指定された数の隣接ヌクレオチドは、約80、約90、約100、約110、約120、約130、約140、約150、約160、約170、又は約180ヌクレオチドを含む。

一部の実施形態では、第1の核酸リンカー配列は、全ての第1の核酸配列結果について同じである。一部の実施形態では、第1の核酸リンカー配列は、5～30の間のヌクレオチド長、5～25の間のヌクレオチド長、又は5～20の間のヌクレオチド長である。一部の実施形態では、第1の核酸リンカー配列の長さは、少なくとも5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチド長である。

一部の実施形態では、第1の核酸リンカー配列及び第2の核酸リンカー配列は、少なくとも11ヌクレオチド長である。一部の実施形態では、第1の核酸リンカー配列及び第2の核酸リンカー配列は、5～30の間のヌクレオチド長、5～25の間のヌクレオチド長、又は5～20の間のヌクレオチド長である。一部の実施形態では、第1の核酸リンカー配列の長さは、少なくとも5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチド長である。一部の実施形態では、第2の核酸リンカー配列の長さは、少なくとも5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチド長である。

コンピューター可読記憶媒体
本開示の態様は、具現化されたプログラム命令を有する非一時的コンピューター可読記憶媒体を対象とし、プログラム命令は、アンプリコンのクラスターからの非重複配列リードから分析するための核酸配列結果を作成するための方法をデバイスに実装させるデバイスの処理要素によって実行可能である。

一部の実施形態では、非一時的コンピューター可読記憶媒体は、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別するための命令を含む。一部の実施形態では、フォワード及びリバース配列リードは、DNA配列リードである。

一部の実施形態では、非一時的コンピューター可読記憶媒体は、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第1の核酸配列結果を得るための命令を含む。

一部の実施形態では、非一時的コンピューター可読記憶媒体は、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第2の核酸配列結果を得るための更なる命令を含み、各連結が、リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に第2の核酸リンカー配列をつなぎ、それによって、リバース配列リードからの部分、第2の核酸リンカー配列、及びフォワード配列リードからの部分のリバース相補体をその順序で含む第2の核酸配列結果を得ることによって達成され、(1)フォワード配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、リバース配列リードからの部分の長さが、選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)第2の核酸リンカーにつながれるリバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、第1の核酸リンカーにつながれるリバース配列リードからの部分の長さと同じであり、(3)第2の核酸リンカーにつながれるフォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、第1の核酸リンカーにつながれるフォワード配列リードからの部分の長さと同じであるが、第2の核酸リンカーにつながれるリバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである。

デバイス
本開示の別の態様は、非重複配列リードから分析するための核酸配列結果を作成するためのデバイスを対象とする。このデバイスは、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別するように構成されるハードウェアプロセッサを含む。

一部の実施形態では、ハードウェアプロセッサは、アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別するように構成される。一部の実施形態では、フォワード及びリバース配列リードは、DNA配列リードである。

一部の実施形態では、ハードウェアプロセッサは、各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、フォワード配列リードをリバース配列リードと連結させて、複数の第1の核酸配列結果を得るように構成される。

本発明の更なる特性は、以下の非限定的な実施例により完全に記載される。

方法
ペアエンド配列決定は、B細胞又はT細胞クローン性を分析するための標準的な手段である。配列決定の長さが十分である場合、対になった2つのリード間の重複を利用することによって再配列全体を配列決定することができる。この「完全な」配列決定により、任意の更なるフォーマッティング工程を必要とせずに簡単な分析が可能になる。配列決定の長さが十分である場合(例えば、プラットフォームの制限又はアッセイ設計の理由のために)、「完全な」配列決定シナリオに使用される分析は、エラーを起こしやすくなる。クローン性の評価の目的のために非重複配列決定データを分析するための方法が本明細書に記載される。

「完全な」配列決定(ペアリードが互いに重複し、アンプリコンの配列全体が識別されうる場合)のための分析方法は、重複を識別し、固有のリード1(R1)の非重複配列、続いてリード1とリード2(R1及びR2)との間の重複配列、最後に固有のリード2(R2)の非重複配列を含むつながれた配列を生成することから始まる。配列決定プラットフォーム/アッセイが、重複配列を生成することを支持しない場合、以下の修飾により、下流分析を行うことが可能になる。

単純なテーピング:最も単純な方法は、間の固有の配列と一緒にリード対(R1及びR2)を「テープする」ことである。下流分析は参照とのアラインメントを含むので、このアラインメント工程と関与できない配列を使用することが重要である。11個の「N」の配列が選択される(11-Nmer)。なぜなら、このような配列は、一般に、標準的なアラインメントアルゴリズムの実施では整列されないからである(それらは未知のヌクレオチドとみなされるため、「N」を整列させようとしない)。最初に、R2リードが、R1に対してセンス方向になるようにリバース相補的(rcR2)にされる。次いで、11-Nmerが、R1の末端につながれる。最後に、R2リードが、R1+11-Nmer配列の末端につながれ、R1+11-Nmer+rcR2リードが生成する。このつながれたリードは、ここで、下流分析のための準備ができている。

スマートテーピング:「スマートテーピング」は、リード対が、11-Nmerにつながれる前に修飾されることを除いて、単純なテーピング法と同様である。R1及びR2リードは、これらのリードを増幅した遺伝子特異的プライマーによって最初に識別され、これは、配列の最初の20～25ntを調べ、それを既知のプライマー配列と照合することによって簡単にされる。プライマー配列の末端(即ち、アンカー点)から、更なる100ntを保存し、残りの配列を除去し(R1及びR2リードの両方について)、「トリミングした」R1及びR2リードを得る。この時点で、トリミングしたリードを、単純なテーピング法と同様に処理する:トリミングしたR2はリバース相補的にされ、11-NmerはトリミングしたR1とつながれ、トリミングしたrcR2はトリミングしたR1+11-Nmerとつながれる。このつながれたトリミングしたリードは、ここで、下流分析のための準備ができている。

下流分析:簡潔に述べると、同一のリードを、いくつのコピーがデータセットに存在したかについて注釈を付けるためにそれらのヘッダーに付着されたカウンターを有する単一のエントリーに折り畳む。折り畳まれたリードを、参照と整列させ、最適なアラインメントに基づいてV遺伝子及びJ遺伝子に割り当て、各リードの合計カウント及び相対頻度に関する定量的情報を出力する。

MISEQペアエンド配列決定
データセット:扁桃腺バックグラウンドDNAに希釈した10%の人工的な細胞系DNAからなるMiSeq配列決定ラン(2×251サイクル)を、テーピング法の効率を実証するために使用した。2×251サイクルランにより、選択した標的の「完全な」配列決定分析が可能になるが(LymphoTrack IGH FR1アッセイ)、このランに含まれるデータは、R1及びR2ペアファイル内に含まれる全てのリードの最後の100ntを除去することによって2×151サイクルを模倣するために切り捨てた。2×251サイクルデータは、「対照」データセットと呼ばれ、一方、切り捨てた2.151サイクルデータは、「テープ試験」データセットと呼ばれる。

更に、100%細胞系DNAからなるNextseq配列決定ラン(2×151サイクル)を、テーピング法の効率の現実の使用事例を実証するために使用した。

結果
完全な配列決定を使用したMiSeq対照データセットの結果:下流分析を行う前にペアリードを重複することからなる「完全な」分析を使用して対照データセットを分析した。結果はTable 2(表2)に含まれる。

これは、「完全な」配列決定プラットフォーム/アッセイを使用したこの10%の人工的なデータセットについての予期された結果であり、V3-J4再配列が、10%頻度付近(ここでは9.45%)で見出される。

単純なテーピングを使用したMiSeqテープ試験データセットの結果:R1リードとR2リードとの間に11-Nmer配列を付加することからなる「単純なテープ」分析を使用してMiSeqテープ試験データセットを分析した。結果はTable 3(表3)に含まれる。

この結果は、単純なテーピング法が、異なる長さの複数の配列に分割される10%のクローン配列を生じることを示す。この理由は、テーピング工程の間に11-Nmerを配置する場所の選択から生じるように見える。以下は、これらの上位5つのリードについての11-Nmerの上流及び下流の領域のアラインメントであり、破線は、リードに存在しない配列のアラインメントのギャップを表す。リードランク2及び5は単一のギャップを有するが、リードランク3は、4ntのギャップを有する。

単純なテーピング工程の間、11-Nmerは、R1リードの末端に直接つながれる。テーピング領域の詳細な調査により、R1リードの末端が、同じ配列であると推定されるリードについての同じ位置の一致した末端ではないことが示される。この現象は、特に、リードの配列が、もはや同一ではなく、下流分析の間に折り畳まれないため、上位のリードシグナルを減少させる、明らかに否定的な結果をもたらす。

スマートテーピングを使用したMiSeqテープ試験データセットの結果:次いでプライマー部位から100nt以上離れたR1及びR2リードから配列をトリミングする、スマートテーピング法を使用してMiSeqテープ試験データセットを分析した。結果はTable 4(表4)に見出される。

この結果は、リードの「曖昧な」末端をトリミングするためにアンカー点を使用することによる配列長の減少が、完全な配列決定アプローチによって測定された予想される比を回復することができることを示す。

NEXTSEQペアエンド配列決定
単純なテーピングを使用したNextSeqテープ試験データセットの結果:R1リードとR2リードとの間に11-Nmer配列を付加することからなる「単純なテープ」分析を使用してNextSeqテープ試験データセットを分析した。結果はTable 5(表5)に含まれる。

この結果は、単純なテーピング法が、異なる長さの複数の配列に分割される100%のクローン配列を生じることを示す。この理由は、テーピング工程の間に11-Nmerを配置する場所の選択から生じるように見える。以下は、これらの上位5つのリードについての11-Nmerの上流及び下流の領域のアラインメントであり、破線は、リードに存在しない配列のアラインメントのギャップを表す。リードランク1は単一のギャップを有し、ランク2及び5は3つのギャップを有し、ランク3はギャップを有さず、ランク4は2つのギャップを有する。

単純なテーピング工程の間、11-Nmerは、R1リードの末端及びrcR2の開始に直接つながれる。テーピング領域の詳細な調査により、rcR2リードの開始(これはR2リードの末端でもある)が、同じ配列であると推定されるリードについての同じ位置の一致した開始ではないことが示される。この現象は、特に、リードの配列が、もはや同一ではなく、下流分析の間に折り畳まれないため、上位のリードシグナルを減少させる、明らかに否定的な結果をもたらす。

スマートテーピングを使用したNextSeqテープ試験データセットの結果:次いでプライマー部位から100nt以上離れたR1及びR2リードから配列をトリミングする、スマートテーピング法を使用してNextSeqテープ試験データセットを分析した。結果はTable 6(表6)に見出される。

この結果は、リードの「曖昧な」末端をトリミングするためにアンカー点を使用することによる配列長の減少が、捕捉されるシグナルを大いに改善することができることを示す。

当業者は、本明細書に記載される発明が、具体的に記載されたもの以外の変更及び修飾を受けやすいことを理解するであろう。本発明が全てのそのような変更及び修飾を含むことは理解されるべきである。本発明はまた、個々に又は集合的に本明細書に言及又は示されている工程、特性、組成物及び化合物の全て、並びに前記工程又は特性の任意の2つ以上の任意及び全ての組合せを含む。

Claims

1つ又は複数の標的ヌクレオチド配列を発現させるために目的の核酸試料をスクリーニングする方法であって、
(i)前記核酸試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、前記標的ヌクレオチド配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するようにその鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される前記1つ又は複数のクラスターについての前記フォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、フォワードリードの前記終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、前記フォワードリードの前記終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、前記リバースリードの前記終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)前記リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)前記フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、前記リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)前記リンカー配列が、(a)の全ての前記核酸配列結果について同じであり、前記リンカー配列が、(b)の全ての前記核酸配列結果について同じである、工程と、
(v)前記配列結果を分析する工程と
を含む、方法。

患者における状態について、診断、モニタリング、又はこれらでなければスクリーニングする方法であって、前記状態が、1つ又は複数の標的ヌクレオチド配列の発現によって特徴付けられ、
(i)核酸試料に由来する個々の鋳型DNA分子のライブラリーを固体支持体上で空間的に分離する工程であって、前記標的ヌクレオチド配列が、前記鋳型の5'及び/又は3'終端末端において隣接ヌクレオチド領域に局在するように前記鋳型DNA分子が生成されている、工程と、
(ii)前記空間的に分離された鋳型DNA分子を増幅させてアンプリコンのクラスターを生成する工程であって、各クラスターが、個々の空間的に分離された鋳型DNA分子から生成される、工程と、
(iii)1つ又は複数のクラスターの1つ又は複数のアンプリコンを双方向で配列決定する工程であって、前記アンプリコンのフォワード及びリバース配列リードが、アンプリコンの全長にわたる隣接リードを提供しない、工程と、
(iv)工程(iii)に従って配列決定される前記1つ又は複数のクラスターについての前記フォワード及びリバース配列リードを識別し、核酸配列結果を生成する工程であって、前記核酸配列結果が、
(a)核酸リンカー配列の終端末端の一方にその3'末端で連結され、そのリンカー配列が、前記リバースリードの終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、前記フォワードリードの前記終端の5'隣接核酸配列の部分、及び/又は
(b)核酸リンカー配列の前記終端末端の一方にその3'末端で連結され、そのリンカー配列が、前記フォワードリードの前記終端の5'隣接核酸配列の部分と相補的な配列にその他方の終端末端で連結されている、前記リバースリードの前記終端の5'隣接核酸配列の部分
を含み、
(1)前記部分が、選択された双方向配列決定技術によってもたらされる最大のフォワード及びリバースリード長の75%以上であり、(2)前記リバースリードの隣接配列の前記部分が、分析される全てのリバースリードについて同じであり、(3)前記フォワードリードの隣接配列の前記部分が、分析される全てのフォワードリードについて同じであるが、前記リバースリードの部分に対して同じであってもよいか、又は異なっていてもよく、(4)前記リンカー配列が、(a)の全ての前記核酸配列結果について同じであり、前記リンカー配列が、(b)の全ての前記核酸配列結果について同じである、工程と、
(v)前記配列結果を分析する工程と
を含む、方法。

核酸領域がDNAである、請求項1又は2に記載の方法。

前記目的の核酸試料が、B及び/又はT細胞DNAを含み、前記1つ又は複数の標的ヌクレオチド配列が、1つ又は複数の再配列されたV、D又はJ遺伝子セグメントである、請求項2に記載の方法。

前記標的ヌクレオチド配列が、IgH、TCRβ若しくはTCRδのDJ若しくはVDJ再配列であるか、又はカッパ欠失エレメント再配列である、請求項3に記載の方法。

前記標的ヌクレオチド配列が、Igκ、Igλ、TCRα又はTCRγのVJ再配列である、請求項3に記載の方法。

前記標的ヌクレオチド配列が、超変異を受けやすい領域等のV遺伝子セグメント領域及び/又はCDR3の部分をコードするJ遺伝子セグメント領域である、請求項3に記載の方法。

前記標的ヌクレオチド配列が、Vリーダー配列、体細胞超変異を受けやすいV領域、IgH FR1、IgH FR2又はIgH FR3の全て又は一部をコードする遺伝子セグメント領域である、請求項3に記載の方法。

前記標的ヌクレオチド配列が、BCL1/JH若しくはBCL2/JH転座又はFLT3若しくはTP53遺伝子に関連する内部タンデム重複若しくは他の変異である、請求項3に記載の方法。

前記固体支持体が、ガラス表面である、請求項1から3のいずれか一項に記載の方法。

前記ガラス表面が、スライドガラス又はフローセルである、請求項10に記載の方法。

前記鋳型DNA分子が、前記終端の5'及び/又は3'位置において、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位及びインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数の核酸配列を発現する、請求項1から11のいずれか一項に記載の方法。

工程(i)の前記隣接ヌクレオチド領域が、工程(iii)において使用するために選択された前記双方向配列決定技術によってもたらされる前記最大のフォワード及びリバースリード長の約80%に相当する、請求項1から12のいずれか一項に記載の方法。

前記隣接ヌクレオチド領域が、工程(iii)において使用するために選択された前記双方向配列決定技術によってもたらされる前記最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%に相当し、前記フォワード及びリバースリード部分が、工程(iii)において使用するために選択された前記双方向配列決定技術によってもたらされる前記最大のフォワード及びリバースリード長の75%、76%、77%、78%、79%、80%、81%、82%又は83%以上である、請求項1から13のいずれか一項に記載の方法。

前記標的DNA配列が、前記鋳型の前記5'及び/又は3'終端末端において120個の隣接ヌクレオチドに局在するが、前記隣接ヌクレオチド領域の20個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する、請求項14に記載の方法。

前記標的DNA配列が、前記鋳型の前記5'及び/又は3'終端末端において125個の隣接ヌクレオチドに局在するが、前記隣接ヌクレオチド領域の最大で30個のヌクレオチド終端末端が、アダプター、インデックス、バーコード、固有分子識別子、配列決定プライマーハイブリダイゼーション部位又はインデックス配列決定プライマーハイブリダイゼーション部位に対応する1つ又は複数のヌクレオチド配列を発現する、請求項14に記載の方法。

前記増幅が、ブリッジ増幅である、請求項1から15のいずれか一項に記載の方法。

可逆的に終端化された標識化ヌクレオチドを使用した合成によって配列決定される、請求項1から16のいずれか一項に記載の方法。

前記核酸リンカーが、5～30ヌクレオチド長、好ましくは5～25、より好ましくは5～20ヌクレオチド長である、請求項1から18のいずれか一項に記載の方法。

前記リンカーが、5、6、7、8、9、10、11、12、13、14、15又は16ヌクレオチド長である、
請求項19に記載の方法。

前記分析が、工程(iv)において生成された前記核酸配列結果を整列させ、目的の前記標的核酸配列の発現を決定する工程を含む、請求項1から20のいずれか一項に記載の方法。

前記状態が、細胞又は微生物のクローン集団によって特徴付けられる、請求項2に記載の方法。

前記クローン細胞が、クローンリンパ球細胞の集団である、請求項22に記載の方法。

前記状態が、免疫細胞によって発現される1つ又は複数の標的ヌクレオチド配列によって特徴付けられる、請求項2に記載の方法。

前記標的ヌクレオチド配列が、1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴である、請求項24に記載の方法。

1つ又は複数の再配列されたV、D又はJ遺伝子セグメント配列の特徴の発現によって特徴付けられる前記状態が、感染、移植、自己免疫、免疫不全、アレルギー新生物又はT若しくはB細胞クローン増殖によって特徴付けられる任意の他の状態である、請求項25に記載の方法。

前記新生物が、リンパ性又は骨髄性新生物である、請求項26に記載の方法。

前記リンパ性又は骨髄性新生物が、急性リンパ芽球性白血病、急性リンパ性白血病、急性骨髄性白血病、急性前骨髄球性白血病、慢性リンパ性白血病、慢性骨髄性白血病、骨髄増殖性新生物、例えば、骨髄腫、全身性肥満細胞症、リンパ腫又はヘアリー細胞白血病である、請求項27に記載の方法。

最小限の残存病変を検出するために使用される、請求項27又は28に記載の方法。

前記状態が、移植片拒絶、免疫療法、真性赤血球増加症、骨髄異形成及び白血球増加症である、請求項26に記載の方法。

前記白血球増加症が、リンパ球増加症である、請求項30に記載の方法。

診断、予後、疾患リスクの予測、疾患の再発の検出、免疫監視、又は予防的若しくは治療的効果のモニタリングに適用される、請求項2に記載の方法。

非重複配列リードから分析するための核酸配列結果を作成するためのコンピューター実装方法であって、
アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別する工程であって、前記クラスターが、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードが、選択された双方向配列決定技術によって生成され、前記フォワード配列リード及び前記リバース配列リードが重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供しない、工程と、
各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、前記フォワード配列リードを前記リバース配列リードと連結させて、複数の第1の核酸配列結果を得る工程であって、各連結が、
フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に前記第1の核酸リンカー配列をつなぎ、それによって、前記フォワード配列リードの部分、前記第1の核酸リンカー配列、及び前記リバース配列リードの部分の前記リバース相補体をその順序で含む第1の核酸配列結果を得ること
によって達成される、工程と
を含み、
(1)前記フォワード配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、前記リバース配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)前記リバース配列リードからの部分の長さが、分析される全てのリバース配列リードについて同じであり、(3)前記フォワード配列リードからの部分の長さが、分析される全てのフォワード配列リードについて同じであるが、前記リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)前記第1の核酸リンカー配列が、全ての第1の核酸配列結果について同じである、コンピューター実装方法。

各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、前記フォワード配列リードを前記リバース配列リードに連結させて、複数の第2の核酸配列結果を得る工程であって、各連結が、
リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に前記第2の核酸リンカー配列をつなぎ、それによって、前記リバース配列リードからの部分、前記第2の核酸リンカー配列、及び前記フォワード配列リードからの部分の前記リバース相補体をその順序で含む第2の核酸配列結果を得ること
によって達成される、工程を更に含み、
(1)前記フォワード配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、前記リバース配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)前記第2の核酸リンカーにつながれる前記リバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、前記第1の核酸リンカーにつながれる前記リバース配列リードからの部分の長さと同じであり、(3)前記第2の核酸リンカーにつながれる前記フォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、前記第1の核酸リンカーにつながれる前記フォワード配列リードからの部分の長さと同じであるが、前記第2の核酸リンカーにつながれる前記リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)前記第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである、請求項33に記載のコンピューター実装方法。

前記第1の核酸リンカー配列及び前記第2の核酸リンカー配列が、少なくとも11ヌクレオチド長である、請求項34に記載のコンピューター実装方法。

前記フォワード配列リードの部分の長さが、前記リバース配列リードの部分の長さと同じである、請求項33に記載のコンピューター実装方法。

前記フォワード配列リードの部分が、前記フォワード配列リードの5'終端の指定された数の隣接ヌクレオチドを含み、前記リバース配列リードの部分が、前記リバース配列リードの5'終端の指定された数の隣接ヌクレオチドを含む、請求項33に記載のコンピューター実装方法。

前記指定された数の隣接ヌクレオチドが、約80ヌクレオチドから約180ヌクレオチドの間を含む、請求項37に記載のコンピューター実装方法。

前記フォワード及び前記リバース配列リードが、DNA配列リードである、請求項33から38のいずれか一項に記載のコンピューター実装方法。

アンプリコンの前記クラスターが、B及び/又はT細胞DNAから増幅される、請求項33から39のいずれか一項に記載のコンピューター実装方法。

アンプリコンの前記クラスターが、少なくとも1つの再配列されたV、D又はJ遺伝子セグメントを含む、請求項40に記載のコンピューター実装方法。

具現化されたプログラム命令を有する非一時的コンピューター可読記憶媒体であって、デバイスの処理要素によって実行可能な前記プログラム命令が、
アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別する工程であって、前記クラスターが、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードが、選択された双方向配列決定技術によって生成され、前記フォワード配列リード及び前記リバース配列リードが重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供しない、工程と、
各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、前記フォワード配列リードを前記リバース配列リードと連結させて、複数の第1の核酸配列結果を得る工程であって、各連結が、
フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に前記第1の核酸リンカー配列をつなぎ、それによって、前記フォワード配列リードの部分、前記第1の核酸リンカー配列、及び前記リバース配列リードの部分の前記リバース相補体をその順序で含む第1の核酸配列結果を得ること
によって達成される、工程と
によって非重複配列リードから分析するための核酸配列結果を作成するための方法を前記デバイスに実装させ、
(1)前記フォワード配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、前記リバース配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)前記リバース配列リードからの部分の長さが、分析される全てのリバース配列リードについて同じであり、(3)前記フォワード配列リードからの部分の長さが、分析される全てのフォワード配列リードについて同じであるが、前記リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)前記第1の核酸リンカー配列が、全ての第1の核酸配列結果について同じである、非一時的コンピューター可読記憶媒体。

各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、前記フォワード配列リードを前記リバース配列リードに連結させて、複数の第2の核酸配列結果を得る工程であって、各連結が、
リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に前記第2の核酸リンカー配列をつなぎ、それによって、前記リバース配列リードからの部分、前記第2の核酸リンカー配列、及び前記フォワード配列リードからの部分の前記リバース相補体をその順序で含む第2の核酸配列結果を得ること
によって達成される、工程を更に含み、
(1)前記フォワード配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、前記リバース配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)前記第2の核酸リンカーにつながれる前記リバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、前記第1の核酸リンカーにつながれる前記リバース配列リードからの部分の長さと同じであり、(3)前記第2の核酸リンカーにつながれる前記フォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、前記第1の核酸リンカーにつながれる前記フォワード配列リードからの部分の長さと同じであるが、前記第2の核酸リンカーにつながれる前記リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)前記第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである、請求項42に記載の非一時的コンピューター可読記憶媒体。

前記第1の核酸リンカー配列及び前記第2の核酸リンカー配列が、少なくとも11ヌクレオチド長である、請求項42に記載の非一時的コンピューター可読記憶媒体。

前記フォワード配列リードの部分の長さが、前記リバース配列リードの部分の長さと同じである、請求項42に記載の非一時的コンピューター可読記憶媒体。

前記フォワード配列リードの部分が、前記フォワード配列リードの5'終端の指定された数の隣接ヌクレオチドを含み、前記リバース配列リードの部分が、前記リバース配列リードの5'終端の指定された数の隣接ヌクレオチドを含む、請求項42に記載の非一時的コンピューター可読記憶媒体。

前記指定された数の隣接ヌクレオチドが、約80ヌクレオチドから約180ヌクレオチドの間を含む、請求項46に記載の非一時的コンピューター可読記憶媒体。

前記フォワード及び前記リバース配列リードが、DNA配列リードである、請求項42から47のいずれか一項に記載の非一時的コンピューター可読記憶媒体。

アンプリコンの前記クラスターが、B及び/又はT細胞DNAから増幅される、請求項42から48のいずれか一項に記載の非一時的コンピューター可読記憶媒体。

アンプリコンの前記クラスターが、少なくとも1つの再配列されたV、D又はJ遺伝子セグメントを含む、請求項49に記載の非一時的コンピューター可読記憶媒体。

非重複配列リードから分析するための核酸配列結果を作成するための、ハードウェアプロセッサを含むデバイスであって、
前記ハードウェアプロセッサは、
アンプリコンのクラスターの配列リードからフォワード配列リード及びリバース配列リードを識別するように構成され、ここで前記クラスターが、個々の空間的に分離された鋳型DNA分子から生成され、各配列リードが、選択された双方向配列決定技術によって生成され、前記フォワード配列リード及び前記リバース配列リードが重複せず、いずれのアンプリコンの全長にわたる隣接リードも提供せず、更に、
各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第1の核酸リンカー配列を介してフォワード配列リードに連結されるように、前記フォワード配列リードを前記リバース配列リードと連結させて、複数の第1の核酸配列結果を得るように構成され、ここで各連結が、
フォワード配列リードの終端の5'隣接核酸配列の部分の3'末端と、リバース配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に前記第1の核酸リンカー配列をつなぎ、それによって、前記フォワード配列リードの部分、前記第1の核酸リンカー配列、及び前記リバース配列リードの部分の前記リバース相補体をその順序で含む第1の核酸配列結果を得ること
によって達成され、
(1)前記フォワード配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、前記リバース配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)前記リバース配列リードからの部分の長さが、分析される全てのリバース配列リードについて同じであり、(3)前記フォワード配列リードからの部分の長さが、分析される全てのフォワード配列リードについて同じであるが、前記リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)前記第1の核酸リンカー配列が、全ての第1の核酸配列結果について同じである、デバイス。

前記ハードウェアプロセッサが、
各フォワード配列リードがリバース配列リードに連結され、各リバース配列リードが、第2の核酸リンカー配列を介してフォワード配列リードに連結されるように、前記フォワード配列リードを前記リバース配列リードと連結させて、複数の第2の核酸配列結果を得、各連結が、
リバース配列リードの終端の5'隣接核酸配列の部分の3'末端と、フォワード配列リードの終端の5'隣接核酸配列の部分のリバース相補体との間に前記第2の核酸リンカー配列をつなぎ、それによって、前記リバース配列リードからの部分、前記第2の核酸リンカー配列、及び前記フォワード配列リードからの部分の前記リバース相補体をその順序で含む第2の核酸配列結果を得ること
によって達成されるように更に構成され、
(1)前記フォワード配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、前記リバース配列リードからの部分の長さが、前記選択された双方向配列決定技術によってもたらされる最大のリード長の75%以上であり、(2)前記第2の核酸リンカーにつながれる前記リバース配列リードからの部分の長さが、全てのリバース配列リードについて同じであり、前記第1の核酸リンカーにつながれる前記リバース配列リードからの部分の長さと同じであり、(3)前記第2の核酸リンカーにつながれる前記フォワード配列リードからの部分の長さが、全てのフォワード配列リードについて同じであり、前記第1の核酸リンカーにつながれる前記フォワード配列リードからの部分の長さと同じであるが、前記第2の核酸リンカーにつながれる前記リバース配列リードからの部分の長さに対して同じであってもよいか、又は異なっていてもよく、(4)前記第2の核酸リンカー配列が、全ての第2の核酸配列結果について同じである、請求項51に記載のデバイス。

前記第1の核酸リンカー配列及び前記第2の核酸リンカー配列が、少なくとも11ヌクレオチド長である、請求項52に記載のデバイス。

前記フォワード配列リードの部分の長さが、前記リバース配列リードの部分の長さと同じである、請求項51に記載のデバイス。

前記フォワード配列リードの部分が、前記フォワード配列リードの5'終端の指定された数の隣接ヌクレオチドを含み、前記リバース配列リードの部分が、前記リバース配列リードの5'終端の指定された数の隣接ヌクレオチドを含む、請求項51に記載のデバイス。

前記指定された数の隣接ヌクレオチドが、約80ヌクレオチドから約180ヌクレオチドの間を含む、請求項55に記載のデバイス。

前記フォワード及び前記リバース配列リードが、DNA配列リードである、請求項51から56のいずれか一項に記載のデバイス。

アンプリコンの前記クラスターが、B及び/又はT細胞DNAから増幅される、請求項51から57のいずれか一項に記載のデバイス。

アンプリコンの前記クラスターが、少なくとも1つの再配列されたV、D又はJ遺伝子セグメントを含む、請求項58に記載のデバイス。