JP6085249B2

JP6085249B2 - 複雑なアンプリコンの配列解析

Info

Publication number: JP6085249B2
Application number: JP2013509047A
Authority: JP
Inventors: マレクファハム; マーティンムーアヘッド; トーマスウィリス
Original assignee: アダプティヴバイオテクノロジーズコーポレーション
Priority date: 2010-05-06
Filing date: 2011-05-04
Publication date: 2017-02-22
Anticipated expiration: 2031-05-04
Also published as: AU2011249041A1; EP2567226A1; JP2018068300A; EP3456847A1; ES2740802T3; JP2013524848A; WO2011139371A1; CA2798431A1; AU2011249041B2; CN104673899A; JP6158080B2; DK2567226T3; EP2567226B1; JP2017205112A; ES2593614T3; SG185128A1; CA2798431C; DK3144673T3; JP6533272B2; SG10201503534RA

Description

本発明は、一般的には、アンプリコンなどの核酸配列の複雑な集団を特徴づけるための方法、およびより具体的には、ハイスループットDNA配列決定を用いて免疫系分子のプロファイルを構築するための方法に関する。

発明の背景
生物学的または医学的試料の解析は、多くの場合に、DNAおよび/またはRNAの大きくかつ複雑な集団の核酸配列の決定を必要とする、例えば、Gloor et al, PLoS ONE 5(10): el5406 (2010)（非特許文献1）；Petrosino et al, Clinical Chemistry, 55(5): 856-866 (2009) （非特許文献2）；Arstila et al, Science, 286: 958-961 (1999) （非特許文献3）。特に、T細胞もしくはB細胞受容体またはそれらの成分などの免疫分子をコードする核酸のプロファイルは、生物の健康または疾患の状態に関する豊富な情報を含み、そのため、幅広い状態に対して、そのようなプロファイルを診断または予後予測の指標として使用することが提唱されている、例えば、 Faham and Willis、米国特許出願公開第2010/0151471号（特許文献1）；Freeman et al, Genome Research, 19: 1817-1824 (2009) （非特許文献4）；Boyd et al, Sci. Transl. Med., 1(12): 12ra23 (2009) （非特許文献5）；He et al, Oncotarget (March 8, 2011) （非特許文献6）。このような配列ベースのプロファイルは、増幅された標的核酸のサイズ分布、マイクロアレイによる配列サンプリング、PCRアンプリコンからのハイブリダイゼーション動態曲線などに基づくアプローチよりもはるかに高い感度を提供する、例えば、Morley et al、米国特許第5,418,134号（特許文献2）；van Dongen et al, Leukemia, 17: 2257-2317 (2003) （非特許文献7）；Ogle et al, Nucleic Acids Research, 31: el39 (2003) （非特許文献8）；Wang et al, BMC Genomics, 8: 329 (2007) （非特許文献9）；Baum et al, Nature Methods, 3(11): 895-901 (2006) （非特許文献10）。しかしながら、このような核酸集団のサイズおよび多様性のために、配列解析によって有用なプロファイルを構築することは、次世代シークエンシングプラットフォームに対してさえ大きな課題をもたらす、例えば、Warren et al, Bioinformatics, 25: 458-464 (2009) （非特許文献11）；Warren et al, Genome Research (Epub 24 Feb 2011) （非特許文献12）；Garcia-Castillo et al, Cardiovascular & Haematological Disorders-Drug Targets, 9: 124-135 (2009) （非特許文献13）。

このような課題には、配列リードの核酸品質を可能にするための標的集団の均一な増幅；ならびに、例えば、体細胞超変異、クローン進化、または同様の現象によって起こる未知の標的配列可変性を考慮した、配列決定プライマーの数、組成、および位置決めの選択が含まれる、例えば、Li et al, Blood, 102(13): 4520-4526 (2003) （非特許文献14）；Tichopad et al, Clin. Chem., 55: 1816-1823 (2009) （非特許文献15）；Brockman et al, Genome Research, 18: 763-770 (2008) （非特許文献16）。

特に、配列リードの長さに限界があるか、またはリードの長さに応じて配列の品質が有意に低下するハイスループット配列決定プラットフォームに関して、核酸の複雑な集団を解析するための現在の方法論の弱点を克服するための方法が得られるのであれば、それは医学および生物学における多くの分野にとって非常に有用でありかつ有利である。

米国特許出願公開第2010/0151471号米国特許第5,418,134号

Gloor et al, PLoS ONE 5(10): el5406 (2010) Petrosino et al, Clinical Chemistry, 55(5): 856-866 (2009) Arstila et al, Science, 286: 958-961 (1999) Freeman et al, Genome Research, 19: 1817-1824 (2009) Boyd et al, Sci. Transl. Med., 1(12): 12ra23 (2009) He et al, Oncotarget (March 8, 2011) van Dongen et al, Leukemia, 17: 2257-2317 (2003) Ogle et al, Nucleic Acids Research, 31: el39 (2003) Wang et al, BMC Genomics, 8: 329 (2007) Baum et al, Nature Methods, 3(11): 895-901 (2006) Warren et al, Bioinformatics, 25: 458-464 (2009) Warren et al, Genome Research (Epub 24 Feb 2011) Garcia-Castillo et al, Cardiovascular & Haematological Disorders-Drug Targets, 9: 124-135 (2009) Li et al, Blood, 102(13): 4520-4526 (2003) Tichopad et al, Clin. Chem., 55: 1816-1823 (2009) Brockman et al, Genome Research, 18: 763-770 (2008)

本発明は、複雑な核酸集団の配列ベースのプロファイルを作成するための方法に関する。本発明は多くの実行および適用において例証されるが、そのうちのいくつかを以下におよび本明細書を通して要約する。

1つの局面において、本発明は、以下の段階を含む、個体のT細胞受容体および/またはB細胞受容体のクロノタイププロファイルを決定するための方法に関する：（a）個体のT細胞および／またはB細胞から核酸試料を採取する段階；（b）そのような核酸試料に由来する個々の分子を空間的に単離する段階であって、該個々の分子が、試料中の核酸から各々作製されかつ体細胞再編成領域またはその一部分を各々含む鋳型の入れ子セットを含み、各入れ子セットが、同じ方向に各々延びかつ該入れ子セットが作製された核酸上の異なる位置から各々始まる複数の配列リードを生成することができる、段階；（c）該空間的に単離された個々の分子を配列決定する段階；ならびに（d）クロノタイププロファイルを作成するために、該核酸試料に由来する核酸分子における異なる配列の存在量を決定する段階。

1つの態様において、配列決定する段階は、入れ子セットの各々について複数の配列リードを生成することを含む。別の態様において、体細胞再編成領域の各々はV領域およびJ領域を含み、複数の配列リードの各々は該V領域内の異なる位置から始まりその連結したJ領域の方向へと延びる。別の態様において、配列決定する段階は、該空間的に単離された個々の分子の各々を双方向に配列決定して、少なくとも1つの順方向配列リードおよび少なくとも1つの逆方向配列リードを生成することを含む。最後の態様に加えて、順方向配列リードの少なくとも1つと逆方向配列リードの少なくとも1つとが重複領域を有し、そのような配列リード間の逆相補関係によってそのような重複領域の塩基が決定されるようにする。さらなる別の態様において、体細胞再編成領域の各々はV領域およびJ領域を含み、配列決定する段階は、その順方向配列リードのうちの1つまたは複数と、J領域内の位置から始まりその連結したV領域の方向へと延びる少なくとも1つの逆方向配列リードとから、個々の核酸分子の各々の配列を決定することをさらに含む。別の態様において、個々の分子は、完全IgH分子、不完全IgH分子、完全IgK完全、IgK不活性分子、TCRβ分子、TCRγ分子、完全TCRδ分子、および不完全TCRδ分子からなる群より選択される核酸を含む。別の態様において、配列決定する段階は、単調に下降する品質スコアを有する配列リードを生成することを含む。最後の態様に加えて、単調に下降する品質スコアとは、配列リードが以下よりも高いエラー率を有するものである：配列リードの0.2パーセントが、1〜50位の塩基において少なくとも1つのエラーを含み、配列リードの0.2〜1.0パーセントが、51〜75位に少なくとも1つのエラーを含み、配列リードの0.5〜1.5パーセントが、76〜100位に少なくとも1つのエラーを含む。別の態様において、空間的に単離された個々の分子を配列決定する段階は、配列決定が行われる固体表面上にそのような分子を配置することを含む。最後の態様に加えて、配置段階は、ブリッジPCRによって固体表面上のそのような分子を増幅する段階を含む。最後の態様にさらに加えて、そのような分子を配列決定する段階は、合成による配列決定（sequencing-by-synthesis）技法によって行われる。

別の局面において、本発明は、以下の段階を含む、V(D)J領域またはその一部を含むクロノタイプを特徴づけるための方法を提供する：(a) J領域から始まりNDN領域を通ってV領域まで延びる少なくとも1つのJ領域配列リード、およびV領域から始まりNDN領域を通ってJ領域まで延びる少なくとも1つのV領域配列リードを生成する段階であって、該J領域配列リードと該V領域配列リードとが重複し、かつ該J領域および該V領域がコドン構造を各々有する、段階；ならびに(b) NDN領域へと延びるJ領域のコドン構造が、NDN領域へと延びるV領域のコドン構造とインフレームであるかどうかを決定する段階。

本発明の、上記で特徴づけられたこれらの局面およびその他の局面は、説明がなされる多くの実行および適用において例証されるが、そのうちのいくつかを図面で示し、添付の特許請求の範囲において特徴づける。しかしながら、上記の概要は、本発明のそれぞれ説明がなされる態様またはすべての実行を記載することを意図するものではない。

本発明の新規な特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例示的な態様を記載している以下の詳細な説明、および添付の図面を参照することによって得られる。
クロノタイププロファイルを決定するための、提供する本発明の方法の態様の流れ図である。 B細胞によって産生される免疫グロブリンにおいて起こる体細胞変異の相対分布を図示する。 TCRβ遺伝子を増幅するための2段階PCRスキームを示す。 TCRβ遺伝子を増幅するための2段階PCRスキームを示す。図2A〜2Bのスキームを用いて増幅された、配列決定されるPCR産物を図示する。図3AのPCR産物のヌクレオチド配列を決定する詳細を図示する。図3AのPCR産物のヌクレオチド配列を決定する別の態様の詳細を図示する。単一反応においてIgH鎖から3つの配列決定鋳型を作製するためのPCRスキームを図示する。 3つの別々の反応においてIgH鎖から3つの配列決定鋳型を作製し、その後、得られたアンプリコンを混合して、P5プライマー結合部位およびP7プライマー結合部位を付加するための二次PCRを行うためのPCRスキームを図示する。 3つの別々の反応においてIgH鎖から3つの配列決定鋳型を作製し、その後、得られたアンプリコンを混合して、P5プライマー結合部位およびP7プライマー結合部位を付加するための二次PCRを行うためのPCRスキームを図示する。 IgH鎖について作成された配列リードの位置を図示する。 NDN領域における塩基コールを改善するための、V領域およびJ領域のコドン構造の使用を図示する。本発明のマルチプレックスPCRの再現性を証明するデータを示す。本発明のマルチプレックスPCRが最小限の増幅のバイアスを導入することを実証するデータを示す。 Accuprime、および投入鋳型としての500 ngのRNAに相当するcDNAを用いた、2つの2連の試料における各クロノタイプの頻度のlog10を示す。投入鋳型としての500 ngのRNAに相当するcDNA、およびAccuprime(X軸)または高忠実度Taq(Y軸)を用いた、各クロノタイプの頻度のlog10を示す。投入鋳型としての50 ngのRNAに相当するcDNA、およびAccuprime(X軸)または高忠実度Taq(Y軸)を用いた、各クロノタイプの頻度のlog10を示す。試料からのTCRβ分子の数。ゲノムDNAからのIgH増幅のデータを示す。試料からのTCRβ分子の数。ゲノムDNAからのIgH増幅のデータを示す。本発明によるマルチプレックス増幅が最小限の増幅のバイアスを有することを示すデータを示す。

発明の詳細な説明
本発明の実施は、特記されない限り、当技術分野の技術の範囲内にある、有機化学、分子生物学(組換え技法を含む)、細胞生物学、および生化学の従来の技法および説明を使用することができる。このような従来の技法には、血液細胞のサンプリングおよび解析、核酸の配列決定および解析などが含まれるが、これらに限定されない。適切な技法の具体的な実例は、本明細書における以下の実施例を参照することによって知ることができる。しかしながら、その他の同等な従来の手順もまた、当然ながら用いることができる。このような従来の技法および説明は、Genome Analysis: A Laboratory Manual Series (Vols. I-IV)；PCR Primer: A Laboratory Manual；およびMolecular Cloning: A Laboratory Manual (いずれもCold Spring Harbor Laboratory Pressによる)などの標準的な実験室マニュアルにおいて見出すことができる。

本発明の1つの局面は、次世代シークエンシング技術を使用して複雑な核酸集団の配列プロファイルを作成し、この配列プロファイルにより、次いで生物体などの生物学的現象、疾患状態、感染歴などの配列ベースの同定が可能になる。そのような解析に適している例示的な核酸集団には、微生物群の16 S rDNA、リンパ球集団におけるTCRまたはBCR再編成物などのアンプリコンが含まれる。1つの局面において、クロノタイププロファイルを測定するために、血液または骨髄DNAなどの試料から、遺伝子または転写物の特定部分の配列の異なる型をすべて増幅するためのマルチプレックス増幅が達成され得る。例えば、IgH配列を増幅するために、公知のVセグメントおよびアレルすべてに相補的ないくつかのプライマーを、Jセグメントおよびアレルすべてに相補的ないくつかのプライマーと共に使用することができる。図1Aは、TCRまたはBCRレパートリーの試料のクロノタイプをプロファイするために、あるクラスのDNAシーケンサーを使用する態様に関して、そのような方法の段階を説明している。B細胞またはT細胞を含む試料を採取し(100)、その後DNAまたはRNAを抽出し、これを、クロノタイプを優先的に増幅し、その後の増幅および配列決定のための末端配列を付着させる反応において増幅する(102)。増幅されたクロノタイプの個々の分子を、ガラス表面などの固体表面上にランダムに分配するが(104)、これは個々の分子のクローン集団(またはポロニーもしくはクラスター)を生成するための二次インサイチュー増幅を可能にするように構成されている(106)。次に、例えば合成による配列決定技法を用いて各クラスターの分子を配列決定し(108)、その後その配列の型および存在量を一覧にして、クロノタイププロファイルまたは同等にレパートリープロファイルなどのプロファイルを形成する(110)。本方法は、異なる配列間の増幅のバイアスがほとんどない状態で行うことができる。

別の局面において、本発明は、核酸、特に、免疫グロブリンの遺伝子および転写物のV(D)J領域または微生物16S rDNA遺伝子における超可変領域などの、限定された領域内に配列可変性を有する核酸の複雑な集団の配列を解析する方法に関する。1つの局面において、そのような複雑な集団は、配列可変性の領域内の異なる部位にアニーリングする重複プライマーを使用することにより、増幅および/または配列決定される。これは、エラー率の比較的高い配列決定化学を使用する場合、または体細胞超変異免疫グロブリン遺伝子または転写物の領域におけるように、そのような配列可変性を予め知ることが困難であるかもしくは不可能である場合に、特に有利である。したがって、後者の場合、(例えば)1つまたは複数の体細胞変異によって生じたミスマッチのために、1つまたは複数のプライマー結合部位が動作不可能であるかまたは実質的に動作不可能である場合でさえ、増幅または配列リードの生成のためのプライマー伸長が起こる。図1Bは、IgH転写物(120)における変異の分布を図示する。曲線(128)によって示される相対頻度は、プロモーターP(122)から始まり、リーダー領域(124)を経て、転写物のV(D)J領域(126)上で最大になるまで上昇し、その後ほぼゼロまで低下する。本発明の1つの局面では、鋳型の入れ子セット（nested set）を作製するための複数の順方向プライマーまたは複数の逆方向プライマーを用いるPCRによって、組換えB細胞核酸のセグメントを増幅する(図4Aおよび4Bならびに以下のそれらの説明を参照されたい)。そのようなセットからの鋳型を表面上でさらに増幅して、別々のアンプリコンを形成することができる(例えば、cBot装置、Illumina、San Diego, CAを用いるブリッジPCRによる)。同じ入れ子セットからの鋳型は、それらの共通末端において作成された配列リードによって互いに関連づけられ得る。鋳型の入れ子セットのお陰で、エラー率の比較的高い配列決定化学を用いて、配列の全長にわたって高い平均品質スコアを同時に維持しつつ、そうでない場合に可能である長さよりも長い配列を解析することが可能になる。入れ子セットにより、V領域が体細胞超変異に供された場合でさえ、V領域から少なくとも1つの配列リードが得られることが確実になる。1つの態様では、IgH分子のような可変性の高い核酸を解析するために、以下よりも高いエラー率を有する配列決定化学を使用することができる：配列リードの0.2パーセントが、1〜50位に少なくとも1つのエラーを含む；配列リードの0.2〜1.0パーセントが、51〜75位に少なくとも1つのエラーを含む；配列リードの0.5〜1.5パーセントが、76〜100位に少なくとも1つのエラーを含む；および配列リードの1〜5パーセントが、101〜125位に少なくとも1つのエラーを含む。別の態様において、配列決定プライマー結合部位は、伸長される場合にそれらが一連の配列リードを生じるように位置し、ここで、最後のものを除く各配列リードは、直接隣接する下流のプライマー結合部位および/または配列リードと重複し、それによって、単一の長い配列リードを生成するために単一の長い鋳型が使用される場合に可能である品質スコアよりも高い品質スコアを有する、連続した配列範囲が提供される。

解析のための核酸の複雑な集団は、様々な起源から生じ得る。免疫系レパートリーは、免疫細胞の試料から取得することができる。例えば、試料は、免疫細胞を含み得る、例えば、免疫細胞はT細胞および／またはB細胞を含み得る。T細胞（Tリンパ球）は、例えば、T細胞受容体を発現する細胞を含む。T細胞は、ヘルパーT細胞（エフェクターT細胞またはTh細胞）、細胞傷害性T細胞（CTL）、メモリーT細胞および制御性T細胞を含む。試料は、いくつかの用途では単一細胞を、またはより一般的には、少なくとも1,000、少なくとも10,000、少なくとも100,000、少なくとも250,000、少なくとも500,000、少なくとも750,000もしくは少なくとも1,000,000のT細胞を含むものであり得る。

B細胞は、例えば、血漿B細胞、メモリーB細胞、B1細胞、B2細胞、辺縁帯B細胞および濾胞性B細胞を含む。B細胞は、免疫グロブリン（抗体、B細胞受容体）を発現することができる。試料は、いくつかの用途（例えば、関連するB細胞を定義するための較正試験）では単一細胞を、またはより一般的には、少なくとも1,000、少なくとも10,000、少なくとも100,000、少なくとも250,000、少なくとも500,000、少なくとも750,000もしくは少なくとも1,000,000のB細胞を含むものであり得る。

試料は、核酸、例えばDNA（例えばゲノムDNAもしくはミトコンドリアDNA）またはRNA（例えばメッセンジャーRNAもしくはマイクロRNA）を含み得る。核酸は、無細胞性DNAまたはRNA、例えば循環系から抽出されたそれらであり得る。Vlassov et al, Curr. Mol. Med., 10: 142-165 (2010); Swarup et al, FEBS Lett., 581; 795-799 (2007)。提供される発明の方法において、分析され得る対象由来のRNAまたはDNAの量は、例えば、いくつかの用途（例えば較正試験）では単一細胞という少量、ならびに6pg〜60ugのDNAおよびおよそ1pg〜10ugのRNAの範囲に換算される1千万の細胞またはそれ以上という多量を含む。

以下（定義）でより十分な議論がなされているように、リンパ球の試料は、個別のクロノタイプを有する実質的にすべてのT細胞またはB細胞がその中で提示され、それによって（この用語の本明細書における意味での）レパートリーが形成されるのに十分大きなものである。1つの態様においては、0.001パーセントまたはそれ以上の頻度で存在するその集団のすべてのクロノタイプを99パーセントの確率で含む試料が採取される。別の態様においては、0.0001パーセントまたはそれ以上の頻度で存在するその集団のすべてのクロノタイプを99パーセントの確率で含む試料が採取される。１つの態様において、B細胞またはT細胞の試料は少なくとも五十万の細胞を含み、別の態様においてはそのような試料は少なくとも百万の細胞を含む。

試料を採取する供給源物質が十分でない場合、例えば臨床研究試料等の場合、その物質からDNAが、非偏向技術、例えば総ゲノム増幅（WGA）、多置換増幅（MDA）；または同様の技術、例えばHawkins et al, Curr. Opin. Biotech., 13: 65-67 (2002); Dean et al, Genome Research, 11: 1095-1099 (2001); Wang et al, Nucleic Acids Research, 32: e76 (2004); Hosono et al, Genome Research, 13: 954-964 (2003)の技術等により増幅され得る。

血液試料は、特にリンパ系新生物、例えばリンパ腫、白血病等のモニタリングにおいて特に注目され、そしてこれは、従来技術、例えばInnis et al 編, PCR Protocols（Academic Press, 1990）等の技術を用いて取得され得る。例えば、白血球は、従来技術、例えばRosetteSepキット（Stem Cell Technologies, Vancouver, Canada）を用いて血液試料から分離され得る。血液試料は、100μLから10 mLの範囲の容量であり得；1つの局面において、血液試料の容量は、200 100μLから2 mLの範囲である。DNAおよび／またはRNAは、その後、本発明の方法において使用するために、そのような血液試料から、従来技術、例えば、DNeasy Blood & Tissueキット（Qiagen, Valencia, CA）を用いて抽出され得る。任意で、白血球のサブセット、例えばリンパ球がさらに、従来技術、例えば蛍光活性化細胞ソーティング（FACS）（Becton Dickinson, San Jose, CA）、磁気活性化細胞ソーティング（MACS）（Miltenyi Biotec, Auburn, CA）等を用いて単離され得る。

他の態様では、細胞のサブセットの試料由来の核酸が分析される。例えば細胞表面マーカーを使用することにより細胞を分離する方法を使用することができる。例えば、細胞は、細胞ソーティングフローサイトメトリー、フローソーティング、蛍光活性化細胞ソーティング（FACS）、ビーズベースの分離、例えば磁気細胞ソーティング（MACS；例えば、抗体をコートした磁気粒子を用いるもの）、サイズベースの分離（例えば、ふるい、障害物のアレイもしくはフィルター）、マイクロ流体装置によるソーティング、抗体ベースの分離、沈降、親和性吸着、親和性抽出または密度勾配遠心分離により単離することができる。細胞は、レーザーキャプチャーマイクロダイセクションにより精製することができる。ソーティングは、細胞のサイズ、形態または細胞内もしくは細胞外マーカーに基づくものであり得る。腫瘍細胞を単離またはソーティングする方法は、例えば、Nagrath S. et al. (2007) Nature 450: 1235-1239；米国特許第6008002号、同第7232653号および同第7332288号；PCT公開第WO2008157220A1号；ならびに米国特許出願第US20080138805A1号および同第US20090186065号；ならびにRosenberg R. et al. (2002) Cytometry 49: 150-158に記載されており、これらの各々はその全体が参照により本明細書に組み入れられる。

識別性のある組換えは各個体の適応免疫細胞のDNAおよびそれらに関連するRNA転写物に存在するので、RNAまたはDNAのいずれかを、提供される発明の方法において配列決定することができる。T細胞受容体もしくは免疫グロブリン分子またはそれらの一部分をコードするT細胞またはB細胞由来の組換え配列は、クロノタイプと称される。DNAまたはRNAは、T細胞受容体（TCR）遺伝子または抗体をコードする免疫グロブリン（Ig）遺伝子由来の配列に対応するものであり得る。例えば、DNAおよびRNAは、TCRのα、β、γまたはδ鎖をコードする配列に対応するものであり得る。多数派のT細胞では、TCRは、α鎖およびβ鎖からなるヘテロ二量体である。TCRα鎖は、VJ組換えにより生じ、β鎖受容体はV(D)J組換えにより生じる。TCRβ鎖に関して、ヒトには48種のVセグメント、2種のDセグメントおよび13種のJセグメントが存在する。2つの接合部の各々ではいくつかの塩基が欠失または付加され得る（NおよびPヌクレオチドと呼ばれる）。少数派のT細胞では、TCRは、γおよびδデルタ鎖からなる。TCRγ鎖は、VJ組換えにより生じ、TCRδ鎖はV(D)J組換えにより生じる（Kenneth Murphy, Paul Travers, and Mark Walport, Janeway's Immunology 7th edition, Garland Science, 2007, その全体が参照により本明細書に組み入れられる）。

本発明の方法において分析されるDNAおよびRNAは、定常領域（α、δ、ε、γまたはμ）を有する重鎖免疫グロブリン（IgH）または定常領域λまたはκを有する軽鎖免疫グロブリン（IgKまたはIgL）をコードする配列に対応するものであり得る。各抗体は、2つの同一の軽鎖および2つの同一の重鎖を有する。各鎖は、定常（C）領域および可変領域から構成される。重鎖に関して、可変領域は、可変（V）、多様（D）および結合（J）セグメントから構成される。これらのセグメントの各タイプをコードするいくつかの別個の配列がゲノム中に存在する。B細胞の発達の間に特定のVDJ組換えイベントが起こり、これはその細胞が特定の重鎖を生成することを示すものである。軽鎖における多様性は、D領域がなくVJ組換えのみがある点を除いて、同様の様式で生じる。組換え部位の付近では体細胞変異がしばしば起こり、それによっていくつかのヌクレオチドが付加または欠失し、これがB細胞によって生成される重鎖および軽鎖の多様性をさらに増大させる。B細胞により生成される抗体で生じ得る多様性は、異なる重鎖と軽鎖の掛け算である。重鎖および軽鎖の可変領域は、抗原認識（または結合）領域または部位を形成するのに寄与する。この多様性に、あるエピトープに対して特異的な応答が惹起された後に起こり得る体細胞超変異が加わる。

上記のように、本発明にしたがい、プライマーは、リンパ球から抽出された組換え核酸のサブセットのアンプリコンを生成するよう選択され得る。そのようなサブセットは、本明細書において、「体細胞再編成領域（somatically rearranged regions）」と称される場合がある。体細胞再編成領域は、発達段階のまたは十分に発達したリンパ球由来の核酸を含み得、ここで発達段階のリンパ球は、免疫遺伝子の再編成が完了しておらず、完全なV(D)J領域を有する分子が形成されていない細胞である。不完全な体細胞再編成領域の例には、不完全なIgH分子（例えば、D-J領域のみを含む分子）不完全なTCRδ分子（例えば、D-J領域のみを含む分子）および不活性なIgK（例えば、Kde-V領域を含むもの）が含まれる。

細胞の十分なサンプリングは、レパートリーデータの解釈における重要な局面であり、これについては以下の「クロノタイプ」および「レパートリー」の定義の中でさらに解説されている。例えば、1,000細胞からの開始は、どのくらいの配列リードが得られるかによらず、アッセイが検知できる最低限の頻度をもたらす。したがって、本発明の1つの局面は、免疫受容体分子の投入数を定量する方法の開発である。これは、TCRβおよびIgH配列に関して実施された。いずれの場合でも、すべての異なる配列を増幅することができる同じプライマーセットが使用される。コピーの絶対数を取得するために、複数のプライマーを用いるリアルタイムPCRが、既知数の免疫受容体コピーを有する標準と共に実施される。マウスワクチン接種の実施例に対するリアルタイムPCRデータの例が、図9に示されている。このリアルタイムPCR測定は、後で配列決定される増幅反応物において実施することができるし、または同一試料の別アリコートに対して実施することもできる。DNAの場合、再編成された免疫受容体分子の絶対数は、簡単に細胞数に変換することができる（2倍以内、いくつかの細胞は、評価対象の特定の免疫受容体の再編成コピーを2つ有し、その他は1つ有するため）。cDNAの場合、リアルタイム試料において測定される再編成分子の総数が、同一試料の別の増幅反応において使用されるこれらの分子の総数を定義するために推定され得る。さらに、この方法は、単位RNA量（およそ1μg）あたりの再編成免疫受容体分子の数を定義するために、RNAの総量を決定する方法と組み合わされ、それによってcDNA合成の比効率（specific efficiency）が推測され得る。cDNAの総量が測定される場合、cDNA合成の効率を考慮する必要はない。細胞数も既知である場合、細胞あたりの再編成免疫受容体コピー数を算出することができる。細胞数が既知でない場合、特定型の細胞は通常同程度のRNA量を生成することをふまえて、それは、総RNAから概算することができる。したがって、1μgあたりの再編成免疫受容体分子のコピーから、細胞あたりのこれらの分子の数を概算することができる。

配列決定用に処理される反応とは別個にリアルタイムPCRを行う欠点の1つは、異なる酵素、投入DNA、およびその他の条件が利用され得るため、リアルタイムPCRにおいて他の反応と異なる阻害効果が生じ得ることである。リアルタイムPCR産物を配列決定用に処理することで、この問題は改善される。しかし、リアルタイムPCRを使用しての低コピー数は、コピー数の少なさもしくは阻害効果またはその反応におけるその他の最適でない条件のいずれかに起因するものであり得る。

利用できる別のアプローチは、未知の量の試料由来のcDNAまたはゲノムDNAに、既知の量の既知の配列を有する特別な免疫受容体再編成分子、すなわち、既知の量の1つまたは複数の内部標準を添加することである。同一試料中の残りの配列について得られる分子に対する既知の添加された配列について得られる分子の相対数を計数することによって、初期cDNA試料中の再編成免疫受容体分子の数を概算することができる。（そのような分子計数技術は周知である、例えば、参照により本明細書に組み入れられるBrenner et al, 米国特許第7,537,897号）。添加した特別な配列の配列決定から得られるデータは、同時にリアルタイムPCR較正も使用される場合、異なる可能性を見出すのに使用することができる。DNA（またはcDNA）中の再編成免疫受容体のコピー数が低いと、残りの試料配列についての分子数に対するスパイクされた配列についての分子数の比が高くなる。他方、リアルタイムPCRにより測定される低コピー数が反応の非効率性に起因する場合、その比は高くならない。

1つの局面において、本発明は、クロノタイプの発現を細胞レベルで測定する方法を提供する。すなわち、上記のように、クロノタイプは、リンパ球を計数するのに使用され得；したがって、ゲノムDNA由来のクロノタイプおよびRNA由来の同一クロノタイプを測定することにより、細胞ベースのクロノタイプ発現が決定され得る。1つの試料においてリンパ球数とクロノタイプ発現レベルを同時に測定する方法は、（a）個体からT細胞および／またはB細胞を含む試料を採取する段階；（b）該細胞のゲノムDNA由来の空間的に単離された個々の分子を配列決定する段階であって、そのような空間的に単離された個々の分子は試料中のリンパ球数に対応するクロノタイプ数を含む、段階；（c）該細胞のRNA由来の空間的に単離された個々の分子を配列決定する段階であって、そのような空間的に単離された個々の分子は試料のリンパ球におけるそれらの発現レベルに対応するクロノタイプ数を含む、段階；ならびに（d）クロノタイプごとに、該細胞のゲノムDNA由来の単離された個々の分子から決定された数と、該細胞のRNA由来の単離された個々の分子から決定された数とを比較することによって、試料のリンパ球におけるクロノタイプ発現レベルを決定する段階を含み得る。ゲノムDNAおよびRNAは、市販のキット、例えばAllPrep DNA/RNA Mini Kit（Qiagen GmbH, Germany）を使用することで、同一試料から容易に抽出される。上記のように、1つの態様において、決定する段階はさらに、ゲノムDNAに既知量の内部標準を添加することによって試料中のリンパ球数を決定することを包含する。別の態様において、例えば試料が末梢血の場合、試料は、その試料中のリンパ球の濃度を決定することができる程度の定められた容量を有する。典型的には、そのような定められた容量は、1 mLから50 mLの範囲であり、より多くの場合は、1 mLから10 mLの範囲である。別の態様においては、ゲノムDNAおよびRNA由来の同じクロノタイプの数が、RNA由来の単離された個々の分子から決定されたクロノタイプ数をゲノムDNA由来の単離された個々の分子から決定されたクロノタイプ数で単純に除算することによって、比較される。そのような2セットのクロノタイプは、標識、特に試料調製プロセスの間に付加されるオリゴヌクレオチドタグの使用により、同じ配列決定作業において容易に識別される。Solexaベースの配列決定では、そのような標識は、異なる試料を識別するのに使用されるタグを用いて、（例えば）DNAかRNAかを示すようタグに単一ヌクレオチドを添加することによって、または単純に各患者試料が2つのタグ、1つはゲノムDNAフラクション用、1つはRNAフラクション用、で標識されるように追加のタグを使用することによって、導入され得る。したがって、RNA由来の空間的に単離された個々の分子を配列決定する段階は、空間的に単離された個々の分子の各々を、そのRNA供給源を示す第1の標識で標識することを包含し得、ゲノムDNA由来の空間的に単離された個々の分子を配列決定する段階は、空間的に単離された個々の分子の各々を、そのゲノムDNA供給源を示す第2の標識で標識することを包含し得、その際、第1の標識は第2の標識と区別できるものである。1つの態様において、そのような標識は、配列決定によって同定される特異なオリゴヌクレオチドタグである。

同様に、本発明は、リンパ球数およびクローン性（clonality）を同時に（単一試料における測定に基づき）提供するのに使用され得る。そのような態様は、以下の段階により実施され得る：（a）個体からT細胞および／またはB細胞を含む試料を採取する段階；（b）該細胞の核酸由来の空間的に単離された個々の分子を配列決定する段階であって、そのような空間的に単離された個々の分子は試料中のリンパ球数に対応するクロノタイプ数を含む、段階；（c）空間的に単離された個々の分子の数からリンパ球数を決定する段階；（d）空間的に単離された個々の分子における異なる配列の存在量を決定し、それに基づきクロノタイププロファイルおよびクローン性の尺度を作成する段階。リンパ球の核酸は、ゲノムDNAおよび／またはRNAであり得るが；好ましくは、核酸はゲノムDNAである。上記と同様、1つの態様において、数を決定する段階はさらに、ゲノムDNAに既知量の内部標準を添加することによって試料中のリンパ球数を決定することを包含する。同様に、試料が末梢血試料の場合、それは、その試料中のリンパ球の濃度を決定できる程度の定められた容量を有する。上記のいくつかの態様においては、B細胞のみが用いられ、他の態様においては、T細胞のみが用いられる。

核酸集団の増幅
下記のように、標的核酸集団のアンプリコンは、様々な増幅技術により生成され得る。本発明の1つの局面においては、マルチプレックスPCRが、核酸の混合物、特に組換え免疫分子、例えばT細胞受容体、B細胞受容体またはそれらの一部分を含む混合物のメンバーを増幅するのに使用される。そのような免疫分子のマルチプレックスPCRを実施するための手引きは、参照により組み入れられる以下の参考文献において見出される：Morley、米国特許第5,296,351号；Gorski、米国特許第5,837,447号；Dau、米国特許第6,087,096号；Von Dongen et al、米国特許公開2006/0234234；欧州特許公報EP 1544308B1等。上記の参考文献には、「スペクトルタイピング（spectratyping）」と呼ばれる技術が記載されており、これは、免疫分子の集団をマルチプレックスPCRにより増幅し、その後に得られたアンプリコンの配列を物理的に、例えば電気泳動により分離して、優勢なサイズクラスが存在するかどうかを決定するというものである。そのようなクラスは、優勢なリンパ球のクローン集団を示すものであり、これはさらに、疾患状態の指標となる。スペクトルタイピングにおいては、ほとんどまたは全く交差反応性を示さない（すなわち、他のプライマーの結合部位にアニールしない）プライマーを選択することが重要であり；そうでなければ、そのアンプリコンにおいてサイズクラスが誤提示され得る。本発明においては、その集団の核酸が均一に増幅される限り、本発明において分析するのは増幅された核酸の配列であってそれらのサイズではないため、プライマーの交差反応性は許容される。以下でより十分な記載がなされているように、1つの局面において、個々の核酸分子を空間的に単離する段階は、事前に選択した体細胞再編成領域またはその一部分（すなわち、標的配列）の一次マルチプレックス増幅を、各々が標的配列に非相補的な尾部を有する順方向および逆方向プライマーを用いて実施し、そのメンバー配列が各末端にさらなる操作を可能にする共通配列を有する第1のアンプリコンを生成することによって達成される。例えば、そのような共通末端は、単一の順方向プライマーおよび単一の逆方向プライマーを複数のそれらに代えて使用する連続増幅のためのまたは固相表面上での個々の分子のブリッジ増幅のためのプライマー結合部位等を含み得る。そのような共通末端は、上記のような1回の増幅で付加されることもあり、またはそれらは、長鎖プライマー（例えば、50〜70塩基またはそれ以上）の混合物の製造および利用上の品質管理に関する難題を回避するために2工程手順で付加されることもある。そのような2工程プロセス（以下により十分な記載があり、かつ図4A〜4Bに図示されている）における一次増幅は、第1のアンプリコンの配列の末端に順方向および逆方向プライマー結合部位のみを提供するようプライマーの尾部の長さが制限されることを除いて、上記のようにして実施される。二次増幅は、その後、これらのプライマー結合部位に特異的な二次増幅プライマーを用いて実施され、第2のアンプリコンの末端にさらなる配列が付加される。二次増幅プライマーは、標的配列に非相補的な尾部を有し、この部分が第2のアンプリコンの末端を形成し、かつ第2のアンプリコンのクロノタイプの配列決定に関連して利用され得る。1つの態様において、そのような付加される配列は、配列リードを生成するためのプライマー結合部位、および空間的に単離された個々の分子のクローン集団を生成するため、例えばSolexaベースの配列決定が使用される場合に、固相表面上でブリッジPCRを実施するためのプライマー結合部位を含み得る。この後者のアプローチにおいては、第2のアンプリコン由来の配列の試料が、その試料の配列にアニールすることができる相補的オリゴヌクレオチドを付加された固相表面上に配置され、その後に、鋳型のクローン集団が形成されるまでプライマー伸長、変性、アニールのサイクルが実施される。好ましくは、試料のサイズは、（i）それが当初試料中のクロノタイプを効果的に提示するよう、および（ii）固相表面上のクローン集団の密度がクロノタイプの明確な配列決定を実現する範囲内となるよう選択される。

TCRもしくはBCR配列またはその一部分は、C領域にアニールする少なくとも1つのプライマーおよび1つまたは複数のVセグメントにアニールすることができる1つまたは複数のプライマーを用いるマルチプレックス反応において核酸から増幅することができる（図2A〜2Bおよび図4A〜4Bに図示され、かつ以下でより十分な議論がなされている）。マルチプレックス反応においてVセグメントにアニールするプライマーの数は、例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79または80であり得る。マルチプレックス反応においてVセグメントにアニールするプライマーの数は、例えば10〜60、20〜50、30〜50、40〜50、20〜40、30〜40または35〜40であり得る。プライマーは、異なるVセグメントにアニールするものであり得る。IgH遺伝子に関しては、Vセグメント内に体細胞変異の可能性があるため、各Vセグメントにアニールする複数のプライマー；例えば、1つのVセグメントあたり1、2、3、4または5つのプライマーが、使用され得る。マルチプレックス反応においてCセグメントにアニールするプライマーの数は、例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15を含み得る。マルチプレックス反応においてCセグメントにアニールするプライマーの数は、1〜10、2〜9、3〜8、4〜7、3〜8または3〜6であり得る。TCRまたは免疫グロブリン遺伝子の増幅は、実施例3および／または実施例4に記載されるようにして行うことができる。

増幅される領域は、全クローン配列、またはV-D接合部、免疫グロブリンもしくはT細胞受容体遺伝子のD-J接合部、免疫グロブリンもしくはT細胞受容体遺伝子の全可変領域、抗原認識領域またはCDR、例えば相補性決定領域3（CDR3）を含むクローン配列のサブセットを含み得る。

TCRまたは免疫グロブリン配列は、一次および二次増幅工程を用いて増幅することができる。異なる増幅工程の各々は、異なるプライマーを含み得る。異なるプライマーは、その免疫遺伝子配列に当初存在しなかった配列を導入することができる。例えば、増幅手順は、標的配列の末端に、マルチプレックス増幅からシングルプレックス増幅への移行のための新しいプライマー結合部位を付加することができるし、または、増幅手順は、増幅されたTCRもしくは免疫グロブリン配列の5'および／または3'末端に1つもしくは複数のタグを付加することができる（図3A〜3Bに図示されている）。タグは、増幅されたDNAのその後の配列決定を容易にする配列であり得る。タグは、増幅された配列の固相支持体への結合を容易にする配列であり得る。

他の増幅方法は、V領域においていかなるプライマーも利用しないものであり得る。代わりに、特定のプライマーをCセグメントから使用し、汎用プライマーを他の側（5'）に置くことができる。汎用プライマーは、十分に記載されているストランドスイッチング法を含む様々な方法を通じて、cDNA合成時に添加することができる。同様に、汎用プライマーは、ライゲーションを含む様々な方法を通じて、cDNAの作製後に追加することができる。

提供される発明の方法において使用することができる他の核酸増幅手段は、例えば、逆転写PCR、リアルタイムPCR、定量リアルタイムPCR、デジタルPCR（dPCR）、デジタルエマルジョンPCR（dePCR）、クローンPCR、増幅断片長多型PCR（AFLP PCR）、アレル特異的PCR、アッセンブリーPCR、非対称PCR（選択されたストランドに対して大過剰のプライマーが使用される）、コロニーPCR、ヘリカーゼ依存増幅（HDA）、ホットスタートPCR、インバースPCR（IPCR）、インサイチューPCR、ロングPCR（約5キロ塩基以上のDNAの伸長）、マルチプレックスPCR、ネステッドPCR（2以上のプライマー対を使用する）、シングルセルPCR、タッチダウンPCR、ループ媒介等温PCR（loop-mediated isothermal PCR; LAMP）および核酸配列に基づく増幅（nucleic acid sequence based amplification; NASBA）を含む。他の増幅スキームは、リガーゼ連鎖反応、分枝DNA増幅、ローリングサークル増幅、サークル・サークル増幅（Circle to Circle Amplification）、SPIA増幅、捕捉およびライゲーションによる標的増幅（Target Amplification by Capture and Ligation; TACL）およびRACE増幅を含む。

試料中のRNAの情報は、逆転写を使用することによってcDNAに変換することができる。従来的なプロトコールにしたがい、逆転写反応においてポリAプライマー、ランダムプライマーおよび／または遺伝子特異的プライマーを使用することができる。

ゲノムからのDNA増幅（またはRNAの逆転写によるcDNA形式での核酸増幅）の後、個々の核酸分子は、単離され、任意で再増幅され、次いで個別に配列決定され得る。例示的な増幅プロトコールは、参照により組み入れられるvan Dongen et al, Leukemia, 17: 2257-2317 (2003)またはvan Dongen et al、米国特許公開2006/0234234に見出され得る。簡潔に説明すると、例示的なプロトコールは以下のようなものである：反応緩衝液： ABI Buffer IIまたはABI Gold Buffer（Life Technologies, San Diego, CA）；50μLの最終反応容量；100 ngの試料DNA；10 pmolの各プライマー（以下に記載されるように増幅のバランスをとるために調整される）；終濃度200μMのdNTP；終濃度1.5 mMのMgCl₂（標的配列およびポリメラーゼに依存して最適化される）；Taqポリメラーゼ（1〜2U/チューブ）；サイクル条件：95℃での予備活性化7分間；60℃でのアニール；サイクル時間：30秒間の変性；30秒間のアニール；30秒間の伸長。

本発明の方法における増幅に使用することができるポリメラーゼは市販されており、例えば、Taqポリメラーゼ、AccuPrimeポリメラーゼまたはPfuを含む。使用するポリメラーゼの選択は、忠実性と効率性のどちらが好ましいかに基づくものであり得る。

核酸をプールから単離する方法は、DNAベクターへの核酸のサブクローニングおよび細菌の形質転換（細菌クローニング）、固相基材（例えば、ガラススライド）上での分子の二次元的な空間分離、ミセル内の溶液中での（例えばこれは分子をビーズ等の固相表面に固定してまたはしないで油エマルジョンを使用することで達成することができる）または例えばマイクロ流体もしくはナノ流体チップ上のマイクロ反応チャンバーを用いる分子の三次元的な空間分離を含む。希釈は、単一の分子が所定の容量、空間的領域、ビーズまたは反応チャンバー中に平均して存在することを確かめるのに使用することができる。そのような個々の核酸分子の単離方法の手引きは、以下の参考文献において見出される：Sambrook, Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, 2001s); Shendure et al, Science, 309: 1728-1732 (補足資料を含む) (2005); 米国特許第6,300,070号；Bentley et al, Nature, 456: 53-59 (補足資料を含む) (2008); 米国特許第7,323,305号; Matsubara et al, Biosensors & Bioelectronics, 20: 1482-1490 (2005): 米国特許第6,753,147号等。

リアルタイムPCR、ピコグリーン染色、ナノ流体電気泳動（例えば、LabChip）またはUV吸収測定は、初期工程で増幅可能な物質の関数的な量を判断するのに使用することができる。

核酸の再増幅方法は、核酸で形質転換された単離されたコロニーの細菌成長、スライド上での増幅（例えば、PCRコロニー（ポロニー））およびビーズ上での増幅（例えば、エマルジョンPCRにおけるもの）を含む。核酸の増幅と再増幅に同じ方法を使用することができ、また、核酸の増幅と再増幅で異なる方法を使用することができる。

特定の態様において、サブクローニング工程は、増幅またはライゲーション工程を通じて共通プライマーをDNAまたはRNAに付加させる工程を包含する。このプライマーは、その後、クローンを増幅するのに、および、配列決定のためのプライマーのハイブリダイゼーションにおける認識配列として使用される（例えば、図2A〜2Bおよび4A〜4Bに図示され、かつ以下でより十分に議論されている）。

1つの局面において、マルチプレックス増幅は、出発集団における配列の相対量が増幅集団またはアンプリコンにおけるそれと実質的に同一となるように実行される。すなわち、マルチプレックス増幅は、試料集団のメンバー配列間の増幅バイアスが最小となるように実行される。1つの態様において、そのような相対量は、アンプリコンにおける各相対量が出発試料におけるその値の5倍以内である場合、実質的に同一とされる。別の態様において、そのような相対量は、アンプリコンにおける各相対量が出発試料におけるその値の2倍以内である場合、実質的に同一とされる。以下でより十分な議論がなされているように、PCRにおける増幅バイアスは、任意の試料においてバイアスのない増幅を提供するPCRプライマーセットが既定のレパートリーのために選択され得る従来的な技術を用いて検出および補正され得る。

TCRまたはBCR配列に基づく多くのレパートリーに関して、マルチプレックス増幅は、任意で、すべてのVセグメントを使用する。その反応は、異なるVセグメントプライマーにより増幅される配列の相対量を維持する増幅となるよう最適化される。プライマーのいくつかは関連するものであり、したがってプライマーの多くは「クロストーク」し、それと完全には一致しない鋳型を増幅し得る。その条件は、どのプライマーがそれを増幅するかによらず各鋳型が同様の様式で増幅され得るように最適化される。換言すると、2つの鋳型が存在する場合、1,000倍増幅後には両方の鋳型がおよそ1,000倍増幅され得、鋳型の一方において増幅産物の半分がクロストークのために異なるプライマーを保持していることは重要とならない。その後の配列決定データの分析において、プライマー配列は分析から除外され、したがって鋳型が均等増幅されている限りどのプライマーが増幅に使用されたかは重要とならない。

各鋳型の量はmRNAから生成されたcDNA集団においては未知であるため、標準のセットがクロノタイプのcDNA集団のシングルプレックスPCRを用いて生成され得る。これを、TCRβクロノタイプのレパートリーにおいて実施した。（実施例3のプライマーを個別の反応において使用する）34のそのようなPCRの各々における生産物は、1つのVプライマーを含む複数の配列を含んでいた。異なる生産物を慎重に定量し、同一濃度の標準セットを作製した。全34プライマーのプールを使用し、このプライマーのプールおよび鋳型として各標準配列を使用して34のリアルタイムPCRを実施した。理想的には、バイアスがかからず、34の標準のすべてが等しい効率のリアルタイムPCR増幅を示す。そのことは、クロストークの発生によりどのプライマーが増幅を実行したかが不明確になった場合でさえも、各配列が等しく増幅されることを示唆するものである。この最適化は、実際に増幅試料に組み込まれるプライマーに関係なく等しい増幅を行うという目的に適っている。プライマープールの総濃度が高くなると、増幅効率の増加から予想されるようにダイナミックレンジが大きく低下する。さらに、平均よりも効率的に増幅するであろうと思われる鋳型については、プール中のそれらの完全一致プライマーの濃度を低くした。逆に、非効率的に増幅する鋳型については、それらの完全一致プライマーを増やした。この最適化は、すべての鋳型が平均増幅の2倍以内で増幅することを実証した。

増幅のバイアスはまた、第1または一次段階において少数の増幅サイクルを標的配列と非相補的な尾部を有するプライマーを用いて実施する2段階増幅（図2A-2Bに図示されている）を実施することによっても回避され得る。この尾部は、一次アンプリコンの配列の末端に付加されるプライマー結合部位を含み、そのような部位は、1つのみの順方向プライマーおよび1つのみの逆方向プライマーを用いる第2段階の増幅において使用され、それによって増幅のバイアスの主たる原因が除かれる。好ましくは、一次PCRは、異なるプライマーによる示差的増幅を最小限にするよう十分少ないサイクル数（例えば、5〜10）を有する。二次増幅は一対のプライマーを用いて実行され、したがって示差的増幅の問題は非常に小さい。一次PCRの1パーセントが直接二次PCRに利用される。2つの増幅間で使用される35サイクル（100倍希釈工程のない場合の約28サイクルに相当）は、サイクルの内訳によらずに：一次で1サイクル、二次で34サイクルであろうが、一次で25、二次で10であろうが、堅調な増幅を示すのに十分であった。理論的には一次PCRにおいて1サイクルのみ実施すれば増幅のバイアスが小さくなるかもしれないが、それ以外にも考慮すべきことがある。この1つの局面は、提示（representation）である。これは、出発投入量が最終的に得られるリード数に対して過剰でない場合に影響する。例えば、1,000,000のリードが得られ、1,000,000の投入分子で開始する場合、100,000の分子からの提示のみを二次増幅に移すのでは、当初試料中の異なる種の相対量の概算の精度が下がる。2つの段階の間での100倍の希釈は、一次PCR増幅が100より有意に多い分子を生成していない限り、その提示が縮小することを意味する。これは、最小で8サイクル（256倍）であるが余裕をもって10サイクル（約1,000倍）が使用され得ることを示している。その代案は、一次PCRの1%超を二次に利用することであるが、一次PCRにおいて使用されるプライマー濃度は高いため、これらのプライマーが増幅において干渉し配列間の増幅バイアスを悪化させないことを確実にするために、大きな希釈係数が使用され得る。別の代案は、精製または酵素工程を追加して一次PCR由来のプライマーを排除し、その希釈率を小さくすることである。この実施例では、一次PCRは10サイクル、二次は25サイクルとした。

マルチプレックスPCRの再現性は、実施例2の試験プライマーセットを用いて例証されているように、次の通りにして評価され得る。2つの一次PCR反応を、試験プライマーセット、例えば（実施例2の）TCRβプライマープールおよびCプライマー、ならびに鋳型としての1つのcDNA試料を用いて実施する。増幅された各鋳型における相対量を、リアルタイムPCRを用いて評価する。2つの増幅産物の各々を鋳型として用い、34の異なるリアルタイムPCR反応を、各反応でCプライマーおよびVプライマーのうちの1つを用いて実施した。図5に示されるデータは、2つの試料に対してすべてのVプライマーを使用するリアルタイムPCRにより決定された相対量が、高い再現性を有していたことを実証しており、このことは、このマルチプレックス増幅が高い再現性を有することを示している。鋳型として1つのマルチプレックス増幅産物を用いるリアルタイムPCR増幅の各々のサイクル数（Ct値）がX軸に示され、鋳型として第2のマルチプレックス増幅産物を用いた場合がY軸に示されている。

プライマーセットの増幅バイアスの量は、以下の手順を用いて評価され得、これは実施例2のプライマーセットを用いて例証されている。（上記の）試験プライマーセットを使用して鋳型としてのcDNA（例えば、リンパ球から抽出したmRNAから得られたもの）を増幅する。34の異なるプライマーの各々（とCセグメントプライマー）により増幅された鋳型の量を、リアルタイムPCRを用いて決定し、そしてその量を、同じプライマーとこのcDNAとを用いて増幅された量と比較する。増幅産物とcDNAにおいて内部配列間の相対量が同じ場合ですらクロストークが起こっている可能性があるので、増幅における有意差のみがこの読み出しを用いて検出され得る。この可能性は、多くの出発cDNA配列の内部セグメントを増幅するプライマーのコレクションを合成することによって試験され得る。例えば、Cセグメントプライマーと共に使用した場合に上記のVセグメントプライマーより内側の配列を増幅することができる12のオリゴを設計した。増幅バイアスが最小である場合、これらの内部配列の濃度は、出発cDNAと増幅産物との間でほとんど変化しないはずである。この実施例のデータは、図6に示されている。同実施例では、（実施例2の）TCRβプライマーのプールとCプライマーとを用いるマルチプレックス増幅の鋳型としてcDNA試料を使用した。Cプライマーおよび下流内部プライマーを、マルチプレックス増幅由来の鋳型物質の初期増幅に使用した。同様に、リアルタイムPCRを使用して、cDNA中のこれらと同一の配列の相対量を評価した。マルチプレックス増幅が何らかの有意なバイアスを生じた場合、増幅物質における相対量は、cDNAにおけるそれと大きく異なるものになる。図6に見られるように、高い相関性が確認され、これはマルチプレックス増幅における最小の増幅バイアスを示すものである。内部プライマーを用いるリアルタイムPCR増幅の各々におけるサイクル数（Ct値）ならびに鋳型としてのcDNAおよびマルチプレックス増幅産物が、それぞれ、X軸およびY軸に示されている。

この初期増幅は、DNAまたはRNA（例えば、cDNAに変換後）から実施することができる。

核酸集団の配列決定
本発明の方法では、任意の高スループット核酸配列決定技術を使用することができる。DNA配列決定技術は、標識されたターミネーターまたはプライマーおよびスラブまたはキャピラリー中でのゲル分離を用いるジデオキシ配列決定反応（サンガー法）、可逆的に停止される標識ヌクレオチドを用いる合成による配列決定、パイロシークエンシング、454配列決定、標識オリゴヌクレオチドプローブのライブラリーに対するアレル特異的ハイブリダイゼーション、標識クローンのライブラリーに対するアレル特異的ハイブリダイゼーションおよびその後のライゲーションを用いる合成による配列決定、重合工程内での標識ヌクレオチドの組み込みのリアルタイムモニタリング、ポロニーシークエンシング、ならびにSOLiD配列決定を含む。分離された分子の配列決定は、最近になって、ポリメラーゼまたはリガーゼを用いる連続的または単回の伸長反応によって、およびプローブのライブラリーを用いる単回または連続的なディファレンシャルハイブリダイゼーションによって実証されている。これらの反応は、多くのクローン配列に対して並列で実施され、現在の商業利用においては1億超の配列の並列化が実現している。したがってこれらの配列決定アプローチは、T細胞受容体（TCR）および／またはB細胞受容体（BCR）のレパートリーの研究に使用することができる。本発明の1つの局面においては、個々の分子を固相表面上で空間的に単離し、その表面上で配列決定を並列で行う工程を包含する高スループットの配列決定法が使用される。そのような固相表面は、非多孔性表面（例えば、Solexa配列決定におけるようなもの、例えばBentley et al, Nature,456: 53-59 (2008)、またはComplete Genomics配列決定、例えばDrmanac et al, Science, 327: 78-81 (2010)）、ビーズまたは粒子に結合された鋳型を含み得るウェルのアレイ（例えば、454と共に用いるもの、例えばMargulies et al, Nature, 437: 376-380 (2005)、またはIon Torrent配列決定、米国特許公開2010/0137143もしくは2010/0304982）、微細加工膜（例えば、SMRT配列決定と共に用いるもの、例えばEid et al, Science, 323: 133-138 (2009)）、またはビーズアレイ（SOLiD配列決定またはポロニーシークエンシングと共に用いるもの、例えばKim et al, Science, 316: 1481-1414 (2007)）を含み得る。別の局面において、そのような方法は、単離された分子を、それらを固相表面上で空間的に単離する前または後のいずれかに増幅する工程を含む。先行増幅は、エマルジョンベースの増幅、例えばエマルジョンPCR、またはローリングサークル増幅を含み得る。特に関心対象となるものは、参照により組み入れられる、Bentley et al（前出）および製造元の説明書（例えば、TruSeq（商標）Sample Preparation Kit and Data Sheet, Illumina, Inc., San Diego, CA, 2010）；さらに以下の参考文献：米国特許第6,090,592号；同第6,300,070号；同第7,115,400号；およびEP0972081B1に記載されるような、個々の鋳型分子を固相表面上で空間的に単離し、その後にそれらをブリッジPCRにより並列で増幅して個別のクローン集団またはクラスターを形成し、次いで配列決定する、Solexaベースの配列決定である。1つの態様において、固相表面上に配置され増幅される個々の分子は、1 cm²あたり少なくとも10⁵クラスターの密度；または1 cm²あたり少なくとも5 x 10⁵の密度；または1 cm²あたり少なくとも10⁶クラスターの密度のクラスターを形成する。1つの態様においては、比較的高いエラー率を有する配列決定化学が使用される。そのような態様において、そのような化学によりもたらされる平均品質スコアは、配列リード長の単調に下降する関数である。1つの態様において、そのような下降は、配列リードの0.5パーセントが1〜75位に少なくとも1つのエラーを有し；配列リードの1パーセントが76〜100位に少なくとも1つのエラーを有し；そして配列リードの2パーセントが101〜125位に少なくとも1つのエラーを有することに相当する。

1つの局面において、個体由来の試料ごとに、本発明の方法において使用される配列決定技術は、1回あたり少なくとも1000のクロノタイプの配列を生成し；別の局面において、そのような技術は、1回あたり少なくとも10,000のクロノタイプの配列を生成し；別の局面において、そのような技術は、1回あたり少なくとも100,000のクロノタイプの配列を生成し；別の局面において、そのような技術は、1回あたり少なくとも500,000のクロノタイプの配列を生成し；そして別の局面において、そのような技術は、1回あたり少なくとも1,000,000のクロノタイプの配列を生成する。さらに別の局面において、そのような技術は、1つの個体試料につき、1回あたり100,000から1,000,000の間のクロノタイプの配列を生成する。

提供される発明の方法において使用される配列決定技術は、1リードあたり約30 bp、約40 bp、約50 bp、約60 bp、約70 bp、約80 bp、約90 bp、約100 bp、約110 bp、約120 bp、1リードあたり約150 bp、約200 bp、約250 bp、約300 bp、約350 bp、約400 bp、約450 bp、約500 bp、約550 bpまたは約600 bpを生成することができる。

提供される発明の方法において使用される配列決定技術は、1リードあたり少なくとも30、40、50、60、70、80、90、100、110、120、150、200、250、300、350、400、450、500、550または600 bpを生成することができる。1つの局面において、個体の配列ベースのクロノタイププロファイルは、以下の段階を用いて取得される：（a）個体のT細胞および／またはB細胞から核酸試料を採取する段階；（b）そのような核酸試料に由来する個々の分子を空間的に単離する段階であって、個々の分子が、試料中の核酸から各々作製されかつ体細胞再編成領域またはその一部分を各々含む鋳型の入れ子セットを含み、各入れ子セットが、同じ方向に各々延びかつ該入れ子セットが作製された核酸上の異なる位置から各々始まる複数の配列リードを生成することができる、段階；（c）該空間的に単離された個々の分子を配列決定する段階；ならびに（d）クロノタイププロファイルを作成するために、該核酸試料由来の核酸分子における異なる配列の存在量を決定する段階。１つの態様において、配列決定する段階は、入れ子セットの各々について複数の配列リードを生成することを包含する。別の態様において、体細胞再編成領域の各々は、V領域およびJ領域を含み、複数の配列リードの各々は、V領域内の異なる位置から始まりその連結したJ領域の方向へと延びる。別の態様において、配列決定する段階は、空間的に単離された個々の分子の各々を双方向に配列決定し、少なくとも1つの順方向配列リードおよび少なくとも1つの逆方向配列リードを生成することを包含する。後者の態様に関してさらに、順方向配列リードの少なくとも1つと逆方向配列リードの少なくとも1つとが重複領域を有し、そのような配列リード間の逆相補関係によってそのような重複領域の塩基が決定されるようにする。さらに別の態様において、体細胞再編成領域の各々は、V領域およびJ領域を含み、配列決定する段階はさらに、その順方向配列リードの1つまたは複数と、J領域内の位置から始まりその関連するV領域の方向へと延びる少なくとも1つの逆方向配列リードとから、個々の核酸分子の各々の配列を決定することを包含する。別の態様において、個々の分子は、完全IgH分子、不完全IgH分子、完全IgK完全、IgK不活性分子、TCRβ分子、TCRγ分子、完全TCRδ分子および不完全TCRδ分子からなる群より選択される核酸を含む。別の態様において、配列決定する段階は、単調に下降する品質スコアを有する配列リードを生成することを包含する。後者の態様に関してさらに、単調に下降する品質スコアは、その配列リードが以下よりも高いエラー率を有するものである：配列リードの0.2パーセントが塩基位置1〜50に少なくとも1つのエラーを含み、配列リードの0.2から1.0パーセントが51〜75位に少なくとも1つのエラーを含み、配列リードの0.5から1.5パーセントが76〜100位に少なくとも1つのエラーを含む。

以下のレパートリーの定義で示されているように、免疫グロブリンまたはT細胞受容体遺伝子の異なる既定の領域を、配列決定することができる。いくつかの態様において、その可変領域の全長配列を配列決定し、クロノタイプを同定および定量することができる。

全長クローン配列の特有のサブセットを、配列決定することができる。いくつかの態様において、VDおよびDJ接合部を含むヌクレオチドが配列決定され、クロノタイプが個別に同定および定量される。他の態様において、配列決定できるフラグメントは、全長可変領域である。さらに別の態様において、抗原認識領域または相補性決定領域3（CDR3）が配列決定される。全長CDR3または全長可変領域を含むフラグメントを増幅し、V、DおよびJセグメントの一部分を含むCDR3を配列決定することができる。

1つの態様においては、CDR3のみが増幅および配列決定される。CDR3の増幅および配列決定は、1つまたは複数のVセグメント配列に特異的なプライマー（およびCセグメント内の、アンプリコンの反対側に対する1つまたは複数のプライマー）を使用することによって達成することができる。Vセグメントの各々に対するプライマーを1つまたは複数の増幅反応において使用することで、配列の全レパートリーの増幅を行うことができる。この配列レパートリーは、その後に混合し、分離に供し、増幅を行いまたは行わずに、記載される配列決定技術のいずれかを用いて配列決定することができる。様々なVプライマーによる増幅を別個のチューブにおいて行う場合、異なるVセグメントを保持する分子の数を、PCRの飽和により「標準化」することができる。例えば、1つの特定のVセグメントが1または複数のクローン増殖をしており、そのためその提示が他のセグメントよりも多くなっている場合でも、各セグメントに対するPCR反応は、飽和するまでまたはその付近まで進めることができるので、この情報は消去または削減され得る。各Vセグメントがどのくらい存在するのかを定量するのには、リアルタイムPCRを使用することができる。全長CDR3を配列決定することもできるし、または配列CDR3のサブセットを配列決定することもできる。

1つの態様においては、クロノタイプのサブセットのみが分析される。これは、クロノタイプのサブセットに特異的なプライマー、例えばVセグメントに特異的なプライマーを用いて増幅することにより達成することができる。特有のクロノタイプは、全連結性（full connectivity）を提供する長い連続的なリードを配列決定することによって同定することができる。いくつかの態様において、関心対象の配列が数種存在する場合、1つの接合部のみをまたぐ短いリード長から、特定のクロノタイプ固有ではなく複数のクロノタイプ間で共有されている縮重タグを生成することができる。例えば、V/J接合部をまたぐ配列決定は、Dセグメントが何であれ、同じV/Jを有するすべての配列を1つのクロノタイプとしてひとまとめにすることができる。すべてのセグメントの全連結性に関する情報は、例えば、同じVおよびJセグメントを共有しているかもしれないが異なるDセグメントに連結されている配列の識別を可能にする。

配列データからのクロノタイプ決定
本発明の1つの局面において、クロノタイプの配列（IgH、TCRα、TCRβ、TCRγ、TCRδおよび／またはIgLκ（IgK）由来のものを含むがこれらに限定されない）は、1つまたは複数の配列リードからの情報を、例えば選択された鎖のV(D)J領域に沿って組み合わせることにより決定され得る。別の局面において、クロノタイプの配列は、複数の配列リードからの情報を組み合わせることにより決定される。（本明細書において使用される場合、「配列リード（sequence read）」は、配列決定技術により生成されたデータ列であり、ヌクレオチドの配列はそこから決定される。典型的には、配列リードは、プライマーを鋳型核酸に沿って伸長する、例えばDNAポリメラーゼまたはDNAリガーゼによって伸長することによって生成される。データは、そのような伸長に関連するシグナル、例えば光学的、化学的（例えばpH変化）または電気シグナルを記録することによって生成される。そのような複数の配列リードは、センス鎖に沿う1つまたは複数の配列リード（すなわち、「順方向」配列リード）およびその相補鎖に沿う1つまたは複数の配列リード（すなわち、「逆方向」配列リード）を含み得る。複数の配列リードが同一鎖に沿って生成される場合は、最初に、配列リードの異なる位置に対する選択されたプライマーを用いて試料分子を増幅することにより、別個の鋳型が生成される。このコンセプトは、図4Aに図示されており、そこではプライマー（404、406および408）が、1回の反応でアンプリコン（それぞれ410、412および414）を生成するのに使用されている。そのような増幅は、同一反応においてまたは別個の反応において実施され得る。1つの局面において、PCRが使用される場合は、別個の鋳型を生成するために別個の増幅反応が使用され、これらはその後組み合わされ、同一鎖に沿う複数の配列リードを生成するのに使用される。この後者のアプローチは、複数の鋳型の均等増幅を実現するためにプライマー濃度（および／またはその他の反応パラメータ）のバランスをとる必要がない点で好ましい（本明細書において「バランスのとれた増幅」または「非バイアス増幅」と称されることがある）。別個の反応による鋳型の生成については、図4B〜4Cに図示されている。その中で、IgHを含む試料（400）が3等分され（472、474および476）、これらがJ領域プライマー（401）およびV領域プライマー（それぞれ404、406および408）を用いる別個のPCRに添加され、アンプリコン（それぞれ420、422および424）が生成されている。後者のアンプリコンはその後、P5およびP7プライマーを用いる二次PCR（480）において組み合わされ（478）、ブリッジPCRおよびIllumina GAシーケンサーまたは同等の機器における配列決定のための鋳型（482）が調製される。

本発明の配列リードは、様々な長さを有するものであり、それは一部、使用される配列決定技術に依存する。例えば、いくつかの技術では、その実施の中でいくつかのトレードオフ、例えば、（i）鋳型あたりの配列リードの数と長さおよび（ii）配列決定作業の費用と時間、が発生し得る。1つの態様において、配列リードは、20から400ヌクレオチドの範囲であり；別の態様において、配列リードは、30から200ヌクレオチドの範囲であり；さらに別の態様において、配列リードは、30から120ヌクレオチドの範囲である。1つの態様においては、1から4の配列リードが、各クロノタイプの配列の決定のために生成され；別の態様においては、2から4の配列リードが、各クロノタイプの配列の決定のために生成され；そして別の態様においては、2から3の配列リードが、各クロノタイプの配列の決定のために生成される。上記の態様において、示されている数は、異なる個体由来の試料を同定するのに使用される配列リードを除いたものである。以下に記載される態様において使用される様々な配列リードの長さもまた、そのリードによって捕捉することが求められる情報により変化し得；例えば、配列リードの出発位置および長さは、NDN領域の長さおよびそのヌクレオチド配列を提供するよう設計され得；したがって全NDN領域に及ぶ配列リードが選択される。他の局面において、1つまたは複数の配列リードは、Dおよび／またはNDN領域を含む。

本発明の別の局面において、クロノタイプの配列は、一部は、配列リードを1つまたは複数のV領域参照配列および1つまたは複数のJ領域参照配列とアラインすることにより、および、一部は、例えば、高可変性のNDN領域に関しては、参照配列とのアラインメントを用いない塩基決定により、決定される。様々なアラインメントアルゴリズムが、配列リードおよび参照配列に適用され得る。例えば、アラインメント法を選択する手引きは、参照により組み入れられるBatzoglou, Briefings in Bioinformatics, 6: 6-22 (2005)から入手できる。1つの局面において、（以下でより十分な記載がなされている）VリードまたはCリードがVおよびJ領域参照配列に対してアラインされる場合、ツリー検索アルゴリズムが使用される、例えば、Cormen et al, Introduction to Algorithms, Third Edition (The MIT Press, 2009)。VおよびJ参照配列のコドン構造は、以下でより十分な記載がなされているように、アラインメントプロセスにおいて、配列決定のエラーを除くためおよび／または得られるアラインメントにおける信頼性レベルを決定するために、使用され得る。別の局面において、少なくとも1つの順方向リードの末端および少なくとも1つの逆方向リードの末端は、重複領域（例えば、図3Bでは308）で重複しており、そのためそれらのリードの塩基は、相互に対して逆相補関係にある。したがって、例えば、重複領域における順方向リードが「5'-acgttgc」である場合、同じ重複領域内の、逆相補関係にある逆方向リードは「5'-gcaacgt」である。1つの局面において、そのような重複領域内の塩基は、少なくとも一部、そのような逆相補関係から決定される。すなわち、予想される重複領域における塩基コール（または関連する品質スコア）の尤度は、もしそれが2つの配列リード間の逆相補関係を保存しているまたはそれと符合している場合、高くなるのである。1つの局面において、（図3Bに図示される）TCRβおよびIgH鎖のクロノタイプは、そのJ領域から始まりその関連するV領域の方向へと延びる少なくとも1つの配列リード（本明細書において「Cリード」（304）と称される）およびそのV領域から始まりその連結したJ領域の方向へと延びる少なくとも1つの配列リード（本明細書において「Vリード」（306）と称される）により決定される。重複領域（308）は、図3Bに示されるようにNDN領域（315）を含んでいる場合といない場合がある。重複領域（308）は、全体がJ領域内にある、全体がNDN領域内にある、全体がV領域内にある場合もあるし、または、それはJ領域-NDN領域の境界もしくはV領域-NDN領域の境界またはそのような境界の両方を含む場合がある（図3Bに図示されている）。典型的には、そのような配列リードは、合成による配列決定反応においてポリメラーゼにより配列決定プライマー、例えば図3Bの（302）および（310）を伸長することによって生成される、例えば、Metzger, Nature Reviews Genetics, 11: 31-46 (2010); Fuller et al, Nature Biotechnology, 27: 1013-1023 (2009)。プライマー（302）および（310）の結合部位は、それらが配列リードの初期のアラインメントおよび分析のための出発点または投錨点を提供することができるよう、予め決定されている。1つの態様において、Cリードは、例えば図3Bおよび3Cに図示されているように、それがTCRβまたはIgH鎖のDおよび／またはNDN領域を網羅し、かつ隣接するV領域の一部を含むように位置決めされる。1つの局面において、V領域におけるVリードとCリードの重複は、これらのリードを互いにアラインするのに使用される。他の態様においては、そのような配列リードのアラインメントは必要ではなく、例えば、TCRβ鎖では、Vリードがクロノタイプの特定のV領域を同定するのに十分に長いというだけであり得る。この後者の局面は、図3Cに図示されている。配列リード（330）は、V領域を同定するのに使用され、これは別の配列リードと重複しているまたはしておらず、そして別の配列リード（332）は、NDN領域を横断するものであり、その配列を決定するのに使用される。配列リード（332）の、V領域へと延びる部分（334）は、配列リード（332）の配列情報を配列リード（330）のそれと関連付け、クロノタイプを決定するのに使用される。いくつかの配列決定法、例えばSolexa配列決定法のような塩基単位（base-by-base）のアプローチでは、分析における配列決定サイクルの数を最小限にすることによって、配列決定に要する時間および試薬の費用が削減される。任意で、図3Bに示されるように、アンプリコン（300）は、異なる生物学的試料、例えば異なる患者に由来するクロノタイプを区別するための試料タグ（312）を含むように生成される。試料タグ（312）は、プライマーをプライマー結合領域（316）にアニールさせ、それを伸長させて（314）、タグ（312）を横断する配列リードを生成し、そこから試料タグ（312）をデコードすることによって同定され得る。

IgH鎖は、少なくとも2つの要因から、TCRβ鎖よりも分析が難しい：i）体細胞変異の存在がマッピングまたはアラインメントをより困難にしている、およびii）NDN領域が大きいため、多くの場合CリードにVセグメントの一部分をマッピングすることができない。本発明の1つの局面において、この問題は、Vリードを生成するために、V領域に沿う異なる位置に配置される複数のプライマーセットを使用することによって、好ましくは、プライマー結合部位が重複せず間隔を空けて配置され、そして少なくとも1つのプライマー結合部位がNDN領域に隣接するように、例えば、1つの態様ではV-NDN接合部から5から50塩基、または別の態様ではV-NDN接合部から10から50塩基となるよう、複数のプライマーセットを使用することによって解消される。複数のプライマーセットの冗長性は、体細胞変異による影響を受ける結合部位を有する1つまたは2つのプライマーの不具合によるクロノタイプの検出の失敗の危険を最小限にする。さらに、NDN領域に隣接するプライマー結合部位が少なくとも1つ存在することにより、VリードがCリードと重複する可能性が高くなり、したがってCリードの長さが効果的に伸長される。これにより、すべてのサイズのNDN領域を網羅しかつVおよびJ領域の実質的に全体をそのNDN領域の両方の側にマッピングすることもできる連続配列を生成することが可能となる。そのようなスキームを実施する態様は、図4Aおよび4Dに図示されている。図4Aにおいて、IgH鎖を含む試料（400）は、単一セットのJ領域プライマー（401）および複数（示されているのは3）セットのV領域（402）プライマー（404、406、408）を用いて鎖を増幅し、すべてが同一のNDN領域を含みかつV領域（402）の段階的に大きくなる部分（411、413、415）を含む異なる長さを有する複数の入れ子アンプリコン（例えば410、412、416）を生成することにより、各鎖につき複数のアンプリコンを生成することによって配列決定される。入れ子セットのメンバーは、それら各々のNDN、Jおよび／またはC領域の同一性（実質的同一性）を確認することにより、配列決定後にひとつにグループ化され得、それによって、リード長および／または配列決定品質が限定される他の配列決定プラットフォームの場合よりも長いV(D)Jセグメントの再編成が実現される。1つの態様において、複数のプライマーセットは、2から5の範囲の数であり得る。別の態様において、複数は2〜3であり；さらに別の態様では複数は3である。複数のプライマーの濃度および位置は、様々変化し得る。V領域プライマーの濃度は、同一の場合もそうでない場合もある。1つの態様において、NDN領域に最も近いプライマーは、例えばNDN領域を含むアンプリコンが得られるアンプリコンにおいて提示されることを確実にするために、その複数の中の他のプライマーよりも高い濃度を有する。複数の3つのプライマーを使用する特定の態様において、60：20：20の濃度比が用いられる。NDN領域（444）に隣接する1つまたは複数のプライマー（例えば、図4Bでは435および437）は、J領域プライマー（432）によって生成される配列リード（442）と重複する1つまたは複数の配列リード（例えば、434および436）を生成するのに使用され得、それによって重複領域（440）における塩基コールの質が改善される。複数のプライマーからの配列リードは、隣接する下流のプライマー結合部位および／または隣接する下流の配列リードと重複している場合もそうでない場合もある。1つの態様においては、NDN領域に近接する配列リード（例えば、436および438）が、クロノタイプに関連する特定のV領域を同定するのに使用され得る。そのような複数のプライマーは、プライマー結合部位の1つが免疫グロブリンの発達時に超変異している場合に増幅が不完全または不成功となる可能性を低下させる。それはまた、V領域の超変異により導入された多様性がクロノタイプ配列に捕捉される可能性を高める。二次PCRは、配列決定のための入れ子アンプリコンを調製するために、例えば図示されているようなP5（401）およびP7（404、406、408）プライマーを用いる増幅によりアンプリコン（420、422および424）を生成することによって実施され得、それらは固相表面上に単一分子として配分され得、さらにブリッジPCRまたは同様の技術により増幅される。

（特に、IgH鎖の）NDN領域における塩基コールは、図4Cに図示されているように、隣接するJおよびV領域のコドン構造を使用することによって改善することができる。（本明細書において使用される場合、「コドン構造」は、NDN領域の外側のTCRまたはBCR転写物または遺伝子のセグメント、例えばV領域、J領域等の天然のリーディングフレームのコドンを意味する。）図4Bのアンプリコンの拡大図であるアンプリコン（450）は、上側には、Cリード（442）および隣接するVリード（434）の相対位置が、下側には、V領域（430）およびJ領域（446）のそれぞれのコドン構造（452および454）が、示されている。本発明のこの局面によれば、コドン構造（452および454）が従来的なVおよびJ参照配列に対するアラインメントにより同定された後、NDN領域（456）の塩基は、配列リード（434）および（442）を用いて、1度に1塩基ずつ、J領域（446）からV領域（430）に向かっておよび反対のV領域（430）からJ領域（446）に向かって移動しつつコール（または同定）される。通常の生物学的条件下では、V領域からNDN領域を通ってJ領域までのインフレームコドンを有する組換えTCRまたはIgH配列のみがタンパク質として発現される。すなわち、体細胞により生成されるバリアントのうち、発現されるのは、そのJ領域およびV領域のコドンフレームが互いに対してインフレームでありかつNDN領域を通じてインフレームの状態にあるもののみである。（ここでは、VおよびJ領域の正確なフレームは、参照配列から決定される。）フレーム外（out-of-frame）配列が1つまたは複数の低品質の塩基コールに基づき同定される場合、その対応するクロノタイプは、再評価のためまたは潜在的な疾患関連異常としてフラグを立てられる。同定された配列がインフレームでありかつ高品質の塩基コールに基づいている場合、そこにはその対応するクロノタイプが正確にコールされている高い信頼性がある。したがって、1つの局面において、本発明は、双方向配列リードからV(D)Jベースのクロノタイプを決定する方法であって、（a）J領域から始まりNDN領域へと延びる少なくとも1つのJ領域配列リードおよびV領域から始まりNDN領域へと延びる少なくとも1つのV領域配列リードを、そのJ領域配列リードおよびV領域配列リードが重複領域で重複しておりかつJ領域およびV領域の各々がコドン構造を有するように、生成する段階；（b）NDN領域へと延びるJ領域のコドン構造がNDN領域へと延びるV領域のコドン構造に対してインフレームであるかどうかを決定する段階を包含する前記方法を包含する。さらなる態様において、生成する段階は、V領域から始まり、NDN領域を通ってJ領域まで延びる少なくとも1つのV領域配列リードを、J領域配列リードおよびV領域配列リードが重複領域で重複するように生成することを包含する。

配列リードの分析。配列リードからクロノタイプへのコアレス（coalesce）。配列リードデータからのクロノタイプの構築は、一部、そのようなデータを生成するのに使用された配列決定法に依存しており、これは、方法が異なると、期待リード長およびデータ品質も異なるためである。1つのアプローチにおいて、分析用の配列リードデータの生成にSolexaシーケンサーが使用される。1つの態様において、少なくとも百万の鋳型分子を生成し、任意の増幅後に対応する百万またはそれ以上の鋳型分子のクローン集団（またはクラスター）を生成し得る、少なくとも0.5〜1.0 x 10⁶のリンパ球を提供する試料が取得される。Solexaアプローチを含む最高スループットの配列決定アプローチにおいては、各鋳型配列が配列決定の精度を向上させる大きな冗長性の下で決定されるように、そのようなクラスターレベルの過剰サンプリングが望ましい。Solexaベースでの実施において、好ましくは、各々個別の鋳型配列は10回またはそれ以上決定される。期待リード長およびデータ品質が異なる他の配列決定アプローチにおいては、同等の配列決定精度のために異なる冗長性レベルが使用され得る。当業者は、上記のパラメータ、例えば試料サイズ、冗長性等が、具体的用途に関連する選択事項であることを理解している。

所定の試料のリードセットからその個別のクロノタイプを導くことおよび各クロノタイプのリード数を記録することは、配列決定技術がエラーフリーであるならば、些細な計算上の問題である。しかし、配列決定エラーが存在する場合、各クロノタイプは、真のクロノタイプ配列に関して異なる数のエラーを有するリードの「クラウド」に包囲される。我々が配列空間内でそのクロノタイプから離れるほど周囲のクラウド、すなわちクラウドが密度を低下させるとした場合、そのようなエラーの数が多いほど密度は低くなる。様々なアルゴリズムが、配列リードをクロノタイプに変換するのに利用できる。1つの局面において、配列リードのコアレスは、3つの因子に依存する：関心対象の2つのクロノタイプの各々において得られる配列の数；相違する塩基の数；および不一致の位置における配列決定の品質。期待エラー率およびエラーの2項分布に基づく尤度比が評価される。例えば、一方が150のリードを有し、もう一方が2のリードを有し、それらの間には配列決定品質の乏しい領域内に1つの相違がある、2つのクロノタイプは、それらが配列決定エラーにより生成された可能性があるため、コアレスされる可能性がある。他方、一方が100のリードを有し、もう一方が50のリードを有し、それらの間に2つの相違がある2つのクロノタイプは、それらが配列決定エラーにより生成された可能性は低いとみなされるため、コアレスされない。本発明の1つの態様においては、以下に記載されるアルゴリズムが、配列リードからクロノタイプを決定するのに使用され得る。

この各クロノタイプを包囲するリードのクラウドは、2項分布および一塩基エラーの確率についての単純モデルを用いてモデル化することができる。この後者のエラーモデルは、VおよびJセグメントのマッピングからまたはクロノタイプ発見アルゴリズム自体から自己無撞着（self-consistency）または収斂（convergence）を通じて推測することができる。モデルは、（配列Xに関して）リードカウントC2およびE個のエラーを有する所定の「クラウド」配列Yが、完全なリードカウントC1を有する真のクロノタイプ配列Xの一部分である確率に関して、Xが配列空間のこの領域における唯一の真のクロノタイプであるというヌル（null）モデルの下で、構築される。判定は、パラメータC1、C2およびEにしたがい配列YをクロノタイプXにコアレスするかしないかに関して為される。任意の所定のC1およびEについて、配列Yをコアレスする判定のための最大値C2が事前に算出される。C2の最大値は、YがクロノタイプXの一部分であるというヌル仮説の下でYをコアレスしない確率が、配列Xの近隣にエラーEを有するすべての可能性のある配列Yにわたって積分した後に一定値P未満となるように、選択される。値Pは、アルゴリズムの挙動を制御し、コアレスを多少寛容的にする。

配列Yが、そのリードカウントがクロノタイプXにコアレスするための閾値C2を上回っているために、クロノタイプXにコアレスされない場合、それは、別個のクロノタイプをシード（seed）するための候補となる。アルゴリズムはまた、この（Xに非依存的であるとみなされた）配列Yに「より近い」任意のその他の配列Y2、Y3等がXに集約されないようにする。この「近さ（nearness）」のコンセプトは、YおよびXに関するエラーカウントとXおよびYの絶対リードカウントの両方を含む、すなわち、それは、クロノタイプXの周囲のエラー配列のクラウドに関する上記のモデルと同じ様式でモデル化される。このようにして、「クラウド」配列は、それらが2以上のクロノタイプの「近く」にあった場合に、それらの正確なクロノタイプに適切に帰属化させることができる。

アルゴリズムは、最高のリードカウントを有する配列Xから開始することにより、トップダウン式に進行する。この配列は、第1のクロノタイプをシードする。隣接する配列は、それらのカウントが事前に算出された閾値（上記参照）を下回る場合にこのクロノタイプにコアレスされるか、またはそれらが閾値を上回るもしくはコアレスされなかった別の配列に「近い」場合に放置されるかのいずれかである。最大エラーカウント内のすべての隣接する配列を検索した後、リードをクロノタイプXにコアレスするプロセスが終了する。そのリードおよびそれにコアレスされたすべてのリードが報告され、他のクロノタイプを生成するのに利用できるリードのリストから除去される。続いて、次の最高のリードカウントを有する配列に移行する。隣接するリードが上記のようにしてこのクロノタイプにコアレスされ、そしてこのプロセスは、所定の閾値を上回るリードカウントを有する配列がそれ以上存在しなくなるまで、例えば1カウント超のすべての配列がクロノタイプのシードとして使用されるまで、継続される。

上記のアルゴリズムの別の態様においては、候補配列Yを既存のクロノタイプXにコアレスするかどうかを決定するために、関連する配列リードの品質スコアを考慮するさらなる試験が追加され得る。配列YとXが相違する場合、配列Yについての平均品質スコア（配列Yを有するすべてのリードの平均）が、決定される。その平均スコアが既定の値を上回る場合、その差がコアレスされるべきでない真に異なるクロノタイプを示している可能性が高く、平均スコアがそのような既定の値を下回る場合、配列Yは配列決定エラーによるものでありしたがってXにコアレスされるべきである可能性が高い。

配列ツリー。リードをクロノタイプにコアレスする上記のアルゴリズムは、いくつかの入力配列XからE個未満のエラーを有するすべての配列を発見する効率的な方法があることに依存している。この問題は、配列ツリーを用いて解決される。このツリーの実装には、ツリーのノードが一文字のDNAであることに制限されないという点で、いくつかの珍しい特徴がある。ノードは、適宜、長い配列を有することができる。これにより、コンピュータメモリのより効率的な使用が可能となる。

所定の試料のリードのすべてが、配列ツリーに配置される。各リーフ（leaf）ノードは、その関連するリードに対するポインターを持っている。それは、ツリーをリーフからルート（root）ノードに後方に横断することにより得られる特有の配列に対応している。第1の配列は、リードの全配列を含む1つのルートノードおよび1つのリーフノードを有する簡易ツリーに配置される。次に、配列が1つずつ追加される。追加された各配列のために、そのリードと既存のツリーの間の共通配列の最終点に新しいブランチ（branch）が形成されるか、またはツリーがすでにその配列を含んでいる場合はそのリードを既存のリーフノードに追加するかのいずれかが行われる。

すべてのリードがツリーに配置されれば、以下の目的でツリーを容易に使用することができるようになる：1. 最高のリードカウント：リードカウントによるリーフノードの分別により、最多のリードを有するリーフノード（すなわち、配列）を発見することが可能となる。2. 隣接するリーフの発見：任意の配列について、この配列に関してX個未満のエラーを有するツリーを通るすべてのパス（path）が検索可能である。パスはルートから始まり、このパスをツリーに沿って進行する別個のパスに枝分かれさせる。ツリーに沿って進みつつ各パスの最新のエラーカウントが通知される。エラーカウントが最大許容エラーを超えた場合、そのパスは終結する。このようにして、ツリーの大部分が可能な限り早く切り落とされる。これは、任意の所定の配列からX個のエラー内のすべてのパス（すべてのリーフ）を発見する効率的な方法である。

体細胞超変異。1つの態様において、体細胞超変異を起こしたIgHベースのクロノタイプは、以下のようにして決定される。体細胞変異は、（関連セグメントの、通常はV、JまたはCの）対応する参照配列の塩基と異なり、かつ統計的に有意な数のリードに存在する、配列決定された塩基と定義される。1つの態様においては、Cリードが、マッピングされたJセグメントに関する体細胞変異を発見するのに使用され得、同様に、Vセグメントに関してはVリードが使用され得る。JまたはVセグメントに直接マッピングされたかまたはNDN境界までのクロノタイプ伸長物の内側であったかのいずれかのCおよびVリードのみが使用される。このようにして、NDN領域は回避され、以前にクロノタイプの決定に使用された同一の「配列情報」が、変異の発見に使用されることはない（実際は異なる組換えNDN領域であるにすぎないのに誤って変異ヌクレオチドとして分類されるのを回避するため）。セグメントタイプごとに、マッピングされたセグメント（優性のアレル）がスキャホールドとして使用され、リードのマッピング段階でこのアレルにマッピングされたすべてのリードが考慮される。少なくとも1つのリードがマッピングされている参照配列の各位置が、体細胞変異について分析される。1つの態様において、非参照塩基を有効な変異として受諾する基準は、以下のものを含む：1）所定の変異塩基を有する少なくともN個のリード、2）少なくとも所定の分数N/Mのリード（Mはこの塩基位置にマッピングされたリードの総数である）；および3）2項分布、変異塩基におけるN個のリードの平均Qスコアおよび非変異塩基を有するリードの数（M-N）に基づく統計的な切り捨て。好ましくは、上記のパラメータは、単位クロノタイプあたりの変異の誤発見率が1000中1未満、より好ましくは10000中1未満となるよう選択される。

系統発生的クロノタイプ（クラン）。癌、例えば、リンパ系新生物において、単一のリンパ球前駆体は、癌に関連する体細胞変異、例えば塩基の置換、異常な再編成等により、各々が若干異なるTCRまたはBCR、したがって異なるクロノタイプを保持および／または発現する多くの関連する子孫リンパ球を発生させ得る。そのようなクロノタイプを産生する細胞は、本明細書において、系統発生的クローン（phylogenic clone）と称され、そのような関連クローンのセットは、本明細書において「クラン（clan）」と称される。同様に、系統発生的クローンのクロノタイプは、系統発生的クロノタイプと称され、系統発生的クロノタイプのセットは、クロノタイプのクランと称され得る。1つの局面において、本発明の方法は、個々のクロノタイプの頻度ではなく、クロノタイプのクランの頻度（すなわち、そのクランの構成要素の系統発生的クロノタイプの頻度の和）をモニターする段階を包含する。系統発生的クロノタイプは、親クロノタイプとの関連性に関する1または複数の測定により同定され得る。1つの態様において、系統発生的クロノタイプは、以下でより十分な記載がなされているように、パーセント相同性により同一クランにグループ化され得る。別の態様において、系統発生的クロノタイプは、V領域、J領域および／またはNDN領域の共通した使用により同定される。例えば、クランは、共通のJおよびND領域を有するが異なるV領域を有するクロノタイプにより定義され得；またはそれは、同一のVおよびJ領域を有する（同一の塩基置換変異を含む）が異なるNDN領域を有するクロノタイプにより定義され得；またはそれは、1〜10塩基もしくは1〜5塩基もしくは1〜3塩基の、1つもしくは複数の挿入および／もしくは欠失を起こし、クランメンバーを生成したクロノタイプにより定義され得る。別の態様において、クランのメンバーは以下の通りに決定される。クロノタイプは、それらが以下の基準を満たす場合に、同一のクランに割り当てられる：i）それらが同一のVおよびJ参照セグメントにマッピングされ、そのマッピングがクロノタイプ配列の同一の相対位置で行われていること、およびii）それらのNDN領域が実質的に同一であること。クランのメンバーシップにおける「実質的」は、NDN領域におけるいくつかの小さな違いが、この領域において体細胞変異が起こり得ることを踏まえて許容されることを意味する。好ましくは、1つの態様において、NDN領域における変異を誤ってコールすることを回避するため、塩基置換が癌関連変異として受諾されるかどうかは、そのクランのNDN領域のサイズに直接的に依存する。例えば、方法は、クランのNDN配列の長さがmヌクレオチドまたはそれ以上、例えば9ヌクレオチドまたはそれ以上の場合であって、それが癌関連変異としてクランNDN配列と1塩基の違いを有するときに、クロノタイプをクランメンバーとして受諾し得、それ以外は受諾されず、またはクランのNDN配列の長さがnヌクレオチドまたはそれ以上、例えば20ヌクレオチドまたはそれ以上の場合であって、それが癌関連変異としてクランNDN配列と2塩基の違いを有するときに、クロノタイプをクランメンバーとして受諾し得、それ以外は受諾されない。別の態様において、クランのメンバーは、以下の基準を用いて決定される：（a）Vリードが同一のV領域にマッピングされること、（b）Cリードが同一のJ領域にマッピングされること、（c）NDN領域が（上記の意味で）実質的に同一であること、および（d）V-NDNの境界とJ-NDNの境界の間のNDN領域の位置が同一であること（または、Dの下流側の塩基付加の数とDの上流側の塩基付加の数が同一であること、と同等である）。単一試料のクロノタイプはクランにグループ化され、異なる時点で取得された連続性のある試料由来のクランが互いに比較され得る。特に、本発明の1つの局面において、疾患、例えばリンパ系新生物と相関するクロノタイプを含むクランが、各試料のクロノタイプから同定され、寛解の継続、再発の初期段階、さらなるクローン進化の証拠等の疾患状態を決定するために、その直前の試料のそれと比較される。

PCRのエラーは、PCRの早い段階のサイクルで変異したいくつかの塩基に集中すると考えられる。配列決定のエラーは、全体として無作為であるにもかかわらず、そのエラーがある程度の体系的バイアスを有している可能性がある場合、多くの塩基に分散すると考えられる。いくつかの塩基は、およそ5%（平均の5倍）の高い比率の配列決定エラーを有するであろうと推測される。これらの推測の下では、配列決定エラーが支配的なエラーのタイプとなる。PCRのエラーと、高度に関連するクロノタイプの発生とを区別することは、分析において重要となる。2つまたはそれ以上の高度に関連するクロノタイプが存在することを決定することには生物学的意義があるため、そのようなコールを生成するために保存的なアプローチが採用される。高い信頼性（およそ99.9%）で2以上のクロノタイプが存在することを確認するために、少数派のクロノタイプの十分な検出が考慮される。100コピー/1,000,000で存在するクロノタイプの例では、少数派のバリアントが、独立したクロノタイプとして指定されるよう、14回またはそれ以上検出される。同様に、1,000コピー/1,000,000で存在するクロノタイプにおいては、少数派のバリアントが、独立したクロノタイプとして指定されるよう、74回またはそれ以上検出され得る。このアルゴリズムは、各々の配列決定された塩基により得られる塩基品質スコアを使用することによって強化することができる。品質スコアとエラー率の間の関係が上記のように確認されれば、すべての塩基に対して保存的な5%のエラー率を使用することに代えて、品質スコアを、独立したクロノタイプをコールするために存在する必要のあるリード数を決定するのに使用することができる。すべてのリードにおける特定塩基の品質スコアの中央値を使用することができる、またはより厳密に言えば、エラーである尤度は、各リードにおける特定塩基の品質スコアに基づき計算することができ、そしてその確率は、その塩基の可能性のある配列決定エラーの数を概算するために組み合わせることができる（独立と仮定して）。結果的に、配列決定エラー仮説を拒絶する閾値は、異なる品質スコアを有する異なる塩基ごとに異なる。例えば、1,000,000あたり1,000コピー存在するクロノタイプでは、少数派のバリアントは、エラーの確率が0.01および0.05として、それぞれ22および74回検出される場合、独立と指定される。

キット
本明細書に記載の方法の商品化において、特定の体細胞再編成領域またはその一部を増幅するためのキットが特に有用である。そのようなキットは、配列分析のためのクロノタイプの試料を調製するために、所定の体細胞再編成領域またはその一部を増幅するための1または2段階PCR（上述したような）を実施するためのキットであってもよい。キットは、一般的に、1つまたは複数の試薬（非限定的に、核酸プライマーなど）を容器（非限定的に、バイアル、チューブまたはボトルなど）に入れて、これを市販に適したパッケージ（非限定的に、箱、密封袋、ブリスターパックまたはカートンなど）に入れたものである。

パッケージは、一般的には、包装されている試薬が患者の組織試料からクロノタイププロファイルを作成する方法で使用することができることを表示する、ラベルまたは添付文書を含む。本明細書で使用されるように、「包装材料」は、非限定的に、容器、バイアル、チューブ、ボトル、袋、ブリスターパック、ラベル、タグ、指示書および添付文書を含む、キット内で試薬を分配するためのパッケージングに使用される任意の物品を含む。そのようなキットの一例は、上述したような患者のT細胞または患者の末梢血リンパ球または患者の骨髄から抽出したDNAまたはRNAからTCRβ配列をチューブ1本で増幅させるために必要な試薬を含む。そのようなキットの別の例は、上述したような患者のB細胞または患者の末梢血リンパ球または患者の骨髄から抽出したDNAまたはRNAからIgH配列を複数のチューブで増幅させるために必要な試薬を含む。後者の例において、必要な試薬には、上述したような鋳型の入れ子セットを生成するための複数のプライマーセットが含まれる。一般的に、上記の複数とは2または3または4である。後者の例の場合、一態様においては、3つのプライマーセットが提供される。より具体的には、以下の3つのプライマーセットが提供される。セット1には、表5の順方向プライマーおよび表8の逆方向プライマーが含まれ、セット2には、表6の順方向プライマーおよび表8の逆方向プライマーが含まれ、セット3には、表7の順方向プライマーおよび表8の逆方向プライマーが含まれる。別の例においては、キットは、1つまたは複数のPCRプライマーセットを含む上記試薬およびTaqポリメラーゼなどの耐熱性DNAポリメラーゼ、そしてRNAから配列を増幅する場合は逆転写酵素を含む。プライマーは、上述したような患者試料中の個々のクロノタイプ配列をバランスよく増幅させる量で存在しうる。本発明の一局面においては、プライマーの量はクロノタイプを確実にバランスよく増幅させる量で提供される。そのようなバランスのとれたマルチプレックスPCRは当業者に周知であり、これは、非限定的に、個々のプライマーのアニーリング速度を増大または低下させるために、反応中のプライマー濃度を調節すること、ならびに／または対象領域内のプライマーの位置および長さを選択することを含む。一態様においては、プライマーの量は、PCRにおけるその濃度が、各プライマーがそのプライマーの結合部位にアニーリングする比率が実質的に同一であるように選択される。別の態様においては、プライマーの量は、試料中の各配列が、無作為試料のクロノタイプの平均増幅量の2倍以内の量に増幅されるように選択される。さらに別の態様においては、そのような無作為試料は、少なくとも100種のクロノタイプを含有する。

耐熱性DNAポリメラーゼおよび転写酵素は様々な製造業者から市販されている。キット内の追加材料は、適切な反応チューブまたはバイアル、バリア組成物（一般的には、場合によりマグネシウムを含むワックスビーズ）；必要な緩衝液およびdNTPなどの試薬を含む、PCR実施用の反応混合物（濃縮されていることが多い、例えば、2×、5×、10×または20×）；ヌクレアーゼまたはRNaseを含まない水；RNase阻害剤；対照核酸（すなわち、内部標準など）および／またはマルチプレックスPCR反応で使用することができる任意の追加の緩衝液、化合物、補因子、イオン成分、タンパク質および酵素、ポリマーなどを含むことができる。

キットの成分は市販可能な方法で梱包される。例えば、PCRプライマーおよび／または逆転写酵素は、アッセイを構築する際のフレキシビリティを高めるために個別に梱包してもよく、あるいは、使い易さを高め、且つ、コンタミネーションを低減させるために一緒に梱包してもよい。同様に、緩衝液、塩および補因子を個別にまたは一緒に梱包することができる。キットは、また、組織試料からの核酸の手動または自動抽出に適する試薬および機械部品を含んでもよい。これらの試薬は当業者に公知であり、一般的には、自由に設計してもよい。例えば、自動プロセスの一態様においては、組織は、キットに付属の適切な溶解溶液中で超音波破砕される。

実施例1
TCRβレパートリー解析：増幅および配列決定の戦略
この実施例において、TCRβ鎖を解析する。解析は、TCRβ配列の増幅、配列決定および解析を含む。1つのプライマー

は、Cβ1およびCβ2の共通配列に相補的であり、全48種のVセグメントを増幅することができる34種のVプライマー（表1）が存在する。Cβ1またはCβ2は、J/C結合部から10位および14位の位置で互いに異なっている。Cβ1またはCβ2のプライマーは16bpの位置で終了し、Cβ1またはCβ2の優先性はない。

34種のVプライマーを、Van Dongen等の米国特許公報2006/0234234（参照により本明細書に組み入れられる）の元のプライマーセットから改変する。

（表１）様々なVファミリーに相補的なプライマー配列

Illuminaゲノムアナライザーを使用して、上記プライマーにより生成されたアンプリコンを配列決定する。図2A〜2Bに記載のようにメッセンジャーRNA転写物（200）の2段階増幅を実施する。第1段階は上記プライマーを用い、第2段階にはブリッジ増幅および配列決定用の共通プライマーを加える。図2Aに示すように、3'末端がJ/C結合部（204）から16塩基であり、Cβ1（203）およびCβ2の2つのアレルに完全に相補的である20bpプライマー（202）を片側に使用して、一次PCRを実施する。RNA転写物（200)のV領域（206）において、異なるV領域配列に相補的なプライマー配列を含有するプライマーセット（212）が提供される（一態様においては34種）。プライマーセット（212）は、また、P7プライマー（220）に特異的なプライマー結合部位（218）を有するアンプリコン（216）を生成する非相補的テール（214）を含有する。従来のマルチプレックスPCRの後、二次増幅のためのmRNA転写物の多様なJ（D）V領域（206、208および210）および共通プライマー結合部位（203および218）を含有するアンプリコン（216）が生成し、ブリッジPCRによるクラスター形成のための試料タグ（221）およびプライマー（220および222）を加える。二次PCRにおいて、鋳型の同じ側で、J/C結合部に最も近い10塩基の配列をその3'末端に有し、J/C結合部から15〜31位の17bpの配列が続き、P5配列（224）がそれに続くプライマー（図2Bの222、本明細書において「C10-17-P5」と呼ぶ）を使用する。P5は、Solexa配列決定でのブリッジPCRによるクラスター形成において役割を果たす。（C10-17-P5プライマー（222）が一次PCRから生成した鋳型にアニーリングすると、J/C結合部に最も近い10塩基およびJ/C結合部から15〜31位の塩基の配列にプライマーがハイブリダイズするために、鋳型に4bpループ（11〜14位）が生じる。11〜14位のループ形成により、Cβ1またはCβ2を有する鋳型の差次的増幅が排除される。次に、J/C結合部に最も近い10塩基およびJ/C結合部から15〜31位の塩基の配列に相補的なプライマー(このプライマーをC'と呼ぶ)を用いて、配列決定を行う。全ての増幅された物質が、クラスター形成において効率的に使用することができる無傷の末端を有するようにするために、C10-17-P5プライマーをHPLC精製することができる。）

図2Aにおいて、Vプライマー（212）のオーバーハングの長さは14bpが好ましい。一次PCRはより短いオーバーハング（214）により支援される。あるいは、二次PCRのためには、二次PCRがこの配列からプライミングされるので、一次PCRではVプライマーのオーバーハングはできるだけ長いものが使用される。効率的な二次PCRを支援するオーバーハング（214）の最小サイズを調査した。2bp段階で10〜30のオーバーハングサイズを有する二系列Vプライマー（2つの異なるVセグメント用）を作製した。適切な合成配列を用いて、その系列の各プライマーにより一次PCRを実施し、増幅されたもの全てを示すためにゲル電気泳動を実施した。二次PCR増幅の効率を測定するために、様々な一次PCR反応からのPCR産物を鋳型として用い、Read2-タグ1-P7およびRead2-タグ2-P7をプライマーとして用いて、SYBRグリーンリアルタイムPCRを実施した。全4系列のリアルタイムデータ（2つの異なるVセグメントを用いた2回の一次PCRおよび2つの異なるタグを含む異なるプライマーを用いた2回の二次PCR）を用いて一貫性のある特徴が現れた。10〜14bpサイズのオーバーハングで効率が改善した。しかし、14bpを超えるオーバーハングでは効率はほとんど改善しなかった。プライマーが高濃度であるために、その融解温度よりもはるかに高い温度で14bpが鋳型をプライミングするのに十分となるため、オーバーハングが14bpほど小さくなった場合に効率は高いままであった。同時に、鋳型は全てがcDNAなのではなく、全ての分子が14bpのオーバーハングを有する複雑度の低いPCR産物であったため、特異性が維持された。

図2Aに示されるように、一次PCRは、RNA鋳型（200）のV領域（206）にアニーリングし、共通の14bpのオーバーハングを5'テールに含有する34種の異なるVプライマー（212）を使用する。14bpは、Illumina配列プライマーの1つ（Read2プライマーと呼ぶ）の部分配列である。同じ側における二次増幅プライマー（220）は、P7配列、タグ（221）およびRead2プライマー配列（223）を含む（このプライマーはRead2_タグX_P7と呼ぶ）。P7配列はクラスター形成に使用される。Read2プライマーおよびその相補体は、それぞれVセグメントおよびタグの配列決定に用いられる。1〜96番のタグを有する96個のこれらのプライマーセットを作製する（下記参照）。全ての増幅された物質が、クラスター形成で効率的に使用することができる無傷の末端を有するようにするため、これらのプライマーはHPLC精製される。

上記のように、二次プライマーであるC-10-17-P5（222、図2B）は一次PCRで生成した鋳型に隔たりのある相同性を有する。このプライマーを用いた増幅の効率を検証した。CsegP5と呼ばれるC-10-17-P5の代わりのプライマーは、一次ＣプライマーおよびP5を有する5'テールに完全な相同性を有する。一次PCR鋳型の増幅においてC-10-17-P5およびCsegP5を用いた効率は、リアルタイムPCRを実施することにより比較した。数回の繰り返しで、C-10-17-P5プライマーを用いたPCRは、CsegP5プライマーを用いたPCRと比較して効率にほとんど違いが認められなかった。

図2A〜2Bに示される2段階増幅から得られたアンプリコン（300）は、図3Aで示されるようなIlluminaシーケンサーで一般的に用いられる構造を有する。分子の最も外側の部位にアニーリングする2種のプライマー、Illuminaプライマー

が分子の固相増幅（クラスター形成）に使用される。分子ごとに3つの配列リードを行う。100bpの一次リードを、Illumina配列決定プロセスに適切な融解温度を有するC'プライマーを用いて行う。二次リードは6bp長のみであり、単に試料タグを同定するためのものである。これはIlluminaタグプライマー

を用いて生成される。最終リードは、配列

を有するIlluminaプライマーであるRead2プライマーである。このプライマーを用いて、一次PCRのVプライマー配列から開始する、Vセグメントにおける100bpリードが作成される。

同じ配列決定レーンで実行される異なる試料を識別するための6bpの配列タグのセットを設計した。ここで、各々のタグは、セット中の他の全てのタグと少なくとも2つの違いで異なる。2つの違いにより、仮に配列決定エラーが存在する場合でも、誤った試料へのリードの誤割り当てが妨げられる。また、タグが許容するギャップ、従って、配列決定による1つの欠失または挿入エラーを比較するために行われるアラインメントにより、リードは誤った試料に割り当てられることはない。タグを選択する際のさらなる特徴は、単一塩基の連続（4つのAまたはTおよび3つのGまたはC）を制限すること、ならびにIlluminaプライマーとの類似性がないことである。全部で143種のタグを作製し、その内の96種を使用する。

TCRβの配列決定。プールしたオリゴおよび鋳型として1つのcDNA試料を用いた6回のマルチプレックス増幅を用いた。各増幅の内の3回はAccuprimeを用いて、他の3回はハイフィデリティーTaqを用いて行った。各酵素を用いた2回の増幅は、初期RNA 500ngに相当するcDNAを使用し、各酵素を用いた1回の増幅は10分の1のcDNAを使用した。6回の反応のそれぞれについて、一次および二次PCRを実施し、Illuminaプラットフォームおよび上記のスキームを用いて増幅した物質を配列決定した。両側から100bpの配列が得られた。下記と同じ概念を用いてデータの一次解析を行った。

アッセイの再現性を評価するために、2連の実験においてクロノタイプのレベルが一貫しているかどうかを判定した。図5A〜5Cに示されるように、同じ酵素および出発投入cDNA量を用いた場合に高い相関が得られる（2つの比較はそれぞれ、r2＝0.944を有した）。異なる酵素を用いた場合は相関が悪化し（4つの可能な組み合わせについて相関中央値r2＝0.931）、より少ない投入cDNA（50ngのRNAのみに相当する）を増幅させるために2つの酵素を用いた場合には相関はただわずかに減少した（r2＝0.924）。

図5A〜5Cにおいて、各試料の同一配列を同定した。次に、配列エラーに対応するために、配列の一次解析の項に記載の一般的なアプローチを用いて、いくつかのクロノタイプをコアレスさせてより大きなクロノタイプを生成した。次に、各試料においてクロノタイプのカウントを計算した。クロノタイプの一部（図示しない）は1つの試料中に存在するが、別の試料中には存在しなかった。これは、クロノタイプを、1つの試料中に存在するが他の試料中には存在しない別のクロノタイプとコアレスさせるアルゴリズムに起因する可能性が高い。次に、試料におけるクロノタイプの頻度を、そのカウント数をその試料で得られたリード総数で割ったものとして計算する。例えば、1,000,000のリードを有する試料におけるクロノタイプに関して1,000カウントが認められる場合、その頻度は0.1％と計算される。図7Aは、Accuprimeおよび投入鋳型として500ngのRNAに相当するcDNAを用いた2つの2連の試料における、各クロノタイプの頻度のlog₁₀を示す。これらの2連間の相関（r²）は0.944である。図7Bは、投入鋳型として500ngのRNAに相当するcDNAおよびAccuprime（X軸）またはハイフィデリティーTaq（Y軸）を用いた、各クロノタイプの頻度のlog₁₀を示す。相関中央値r²＝0.931を有する、この組み合わせでの4つの比較が存在する。図に示した1つはr²＝0.929を有する。図7Cは、投入鋳型として50ngのRNAに相当するcDNAおよびAccuprime（X軸）またはハイフィデリティーTaq（Y軸）を用いた、各クロノタイプの頻度のlog₁₀を示す。認められた相関はr2＝0.924である。

実施例2
IgHレパートリー解析：増幅および配列決定の戦略
この実施例では、IgH分子のV領域を増幅させるために3種のプライマーを使用する。好ましくは、プライマーは、最大頻度の体細胞変異を有するCDRを回避する領域に存在する。3つの異なる増幅反応を実施する。各反応において、Vセグメントの各々は3種のプライマーの1つにより増幅され、全て同じCセグメントプライマーを使用する。別々の反応の各々においてプライマーはV-D結合部からほぼ同じ距離であり、異なる反応のプライマーに関しては距離が異なっており、それにより3つの反応のプライマーがVセグメントに沿って間隔を置いて配置される。Vセグメントの最後の位置を0とすると、プライマーの第1セット（フレームA）はおよそ-255の位置に3'末端を有し、第2セット（フレームB）はおよそ-160の位置に3'末端を有し、第3セット（フレームC）はおよそ-30の位置に3'末端を有する。いくつかのVセグメント間の相同性を考慮すると、48種のVセグメント全ておよび多くの公知のアレル（国際免疫遺伝学情報システム<<http://imgt.cines.fr/>>）を増幅させるために、A、BおよびCフレームそれぞれに23種、33種および32種のプライマーが必要である。プライマーのリストを表2、3および4に示す。

（表２）フレームAのプライマー

（表３）フレームBのプライマー

（表４）フレームCのプライマー

Cセグメント側では、それらの間で1塩基の違いを有する2つの配列

が、IgGの4つのセグメントおよび複数の公知のアレルをカバーする。TCRβ遺伝子の2段階PCRと類似のスキームを用いる。

V側では、各Vプライマーにおいて同じ5'の14bpオーバーハングを使用する。二次PCRでは、V側において同じRead2-タグX-P7プライマーを用いる。C側では、TCRβ増幅で使用した戦略と類似の戦略を用いて、異なるIgGセグメントおよびそれらの公知のアレル間の変異を回避する。プライマー配列

は、図4Aに示すように、異なるIgGアレルの少なくとも1つに異なる塩基を有する20位をスキップした、3〜19および21〜28位からのCセグメントの配列およびクラスター形成に用いることができるP5の配列を含む。

鋳型としてcDNAを用いて、3つのフレームに相当するプライマーの3つのプールを用いたマルチプレックスPCRを実施した。一次および二次PCRの後、生成物をアガロースゲルで泳動した。3つのプールから適切な相当するサイズの単一バンドを得た。

一態様においては、1つの試料由来の3つの異なる反応物を等モル比で混合し、配列決定に供する。上述したような2つのIlluminaプライマーを用いて両方向から配列決定を行う。両側から100bpを配列決定する。D＋Jセグメントを包含する最大の生殖系列配列は、TCRよりもBCRで約30bp長い。従って、結合部におけるヌクレオチドの除去および付加（NヌクレオチドおよびPヌクレオチド）の最終結果から、IgHおよびTCRβについて同様の分布が生じるとすると、Cセグメント後の平均90bp、最大で120bpの配列がVセグメントの3'に到達するのに十分である。従って、ほとんどの場合、Cプライマーからの配列はVセグメントに到達するのに十分である。Illuminaアダプターの1つからの配列決定により、用いられたVセグメントならびにVセグメント内の体細胞超変異が同定される。配列が3つの増幅反応のいずれに由来するかに応じて、Vセグメントの異なる部分が配列決定される。異なる増幅反応に由来する異なるリードから、BCRの完全配列をアラインすることができる。完全なCDR3配列を示す一方の末端からの配列決定反応により、異なるリードの正確なアラインメントが非常に容易になる。

実施例3
ゲノムDNAからのIgH配列の増幅
本実施例では、ゲノムDNAからのIgH配列の増幅を記載する。(1) ゲノムDNAにおけるクロノタイプのレベルは細胞数に容易に変換され得る、および(2) リンパ系新生物によっては、関連する免疫受容体再編成に関してRNAが発現されない場合があるという理由で、このような増幅は有利である。

免疫受容体再編成の増幅は、リンパ系新生物の検出にとって重要である。B細胞新生物はT細胞腫瘍よりも多く見られ、IgHは、B細胞新生物において最もよく見られる再編成された免疫受容体である。体細胞超変異のために、ゲノムDNAからのIgHの増幅の信頼性は、各Vセグメントに対する複数のプライマーを用いて増幅することによって増大し得るが、差次的な増幅のリスクが存在する。ゲノムDNAからの増幅においては、cDNAからの増幅において使用したのと同じVプライマーを使用した。各Vセグメントを、3つの異なる反応において3つのプライマー群(Vセグメントの3つの別個の領域：A、B、およびCにおける)によって増幅する(それぞれ表5〜7)(図4Aを参照されたい)。

（表５）反応AのためのヒトIgH Vセグメントプライマー
(プライマーはすべて、それらの5'末端に付加された共通の14 bp(AGATCGGAAGAGCA)(SEQ ID NO 165)を有する)

（表６）反応BのためのヒトIgH Vセグメントプライマー
(プライマーはすべて、それらの5'末端に付加された共通の14 bp(AGATCGGAAGAGCA)(SEQ ID NO 165)を有する)

（表７）反応CのためのヒトIgH Vセグメントプライマー
(プライマーはすべて、それらの5'末端に付加された共通の14 bp(AGATCGGAAGAGCA)(SEQ ID NO 165)を有する)

ゲノムDNAからのIgH配列の増幅には、cDNAからのその増幅とはいくつかの違いがある。スプライシングによってCセグメントがVDJ領域に付着するため、cDNAからの増幅にはCセグメントの配列を使用することができるが、ゲノムDNAではそうはいかない。Cセグメントを使用することで、一次増幅および二次増幅において2つの別個のプライマーを使用することが可能となり、特異性が増大する。ゲノムDNAからの増幅について、本発明者らは、J配列に相補的なプライマーを使用することを選択した(表8)。

（表８）ヒトIgH Jセグメントプライマー^*

^*使用したJセグメントプライマー。5'における18 bpは、第2段階の増幅を可能にするために、Jセグメントに相補的な配列に付加されている共通配列である。Nの位置は、配列決定されるクラスターにおいて多様性を得るための1つのランダムな位置を示す。小文字の配列はイントロン内であり、配列の3'における大文字の配列はエキソン内である。イタリック体は、プライマー間で異なる塩基を強調するものである。

これらのプライマーはエキソン-イントロン境界にまたがり、使用される4つのプライマーは、IMGTデータベースに記載されている異なるJセグメントおよびアレルを増幅する。第2段階のプライマーは、ゲノム配列に相補的な配列を全く含まない。

IgG定常領域に相補的な定常領域プライマーよりもJプライマーを使用することによって、他のクラス(IgM、IgD、IgA、およびIgE)の評価も可能になる。

cDNAの場合、Jプライマーを使用するかまたは定常領域プライマーを使用するかの選択が存在する。クロノタイプに関する情報をその特定のクラスに結びつけるために、いくつかの定常領域プライマーを用いて、すべてのクラスを増幅し、Jセグメントに入る前の定常領域の一部を配列決定することができる。シークエンシング技術の多くの配列リードは短く、これを達成することは難しい。市販されている現在のプラットフォームの1つ(454 Roche)は、より長いリードを有するが、これは他のプラットフォームよりも処理能力が低い。これらの技術がさらに発展するにつれて、この選択肢も可能になる。現在の短いリード(＜100 bp)を用いる場合、ゲノムDNAアッセイに関する本発明者らの研究から、JプライミングアプローチおよびCプライミングアプローチの両方を使用して、cDNAからの増幅を行うことができることが示唆される。本発明者らは、cDNAからの、Jプライマーを用いる増幅を実行することができる。しかしながら、これらのプライマーのエキソンセグメントが、cDNAからの特異的増幅のためには短すぎる場合があることを考慮すると、潜在的には、第1段階のPCRは、異なるクラスのすべてを包含する定常領域プライマーのセット(および本発明者らが実証した反対側のVセグメントプライマー)を用いて行うことができる。次に、複雑性の低い鋳型を使用する第2段階のPCRに対して高い特異性を有するのに十分長いJプライマーを用いて、第2段階のPCRを行うことができる。次に、産物を配列決定する。上記のように、IgGについて実証したスキームと比較した不利点は、J配列における体細胞変異が増幅を阻害し得るという点である。利点は、各クロノタイプのクラスに関する情報が十分に決定されていなくても、異なるクラスすべてが評価されるという点である。潜在的には、IgG、IgM、IgD、IgA、またはIgEのクラス特異的な増幅を行い、全プライマーの後にJプライマーを用いることによって得られる全体像と比較することができる。例えば、IgG増幅から得られたクロノタイププロファイルを、全プライマーの後にJプライマーを用いた場合のクロノタイププロファイルと比較することができる。その差はおそらく、Jプライマーにおける体細胞変異(IgGプライマーを用いる反応において容易に同定され得る)および他のクラスのクロノタイプに起因し、次にこれを定量することができる。

cDNAにおいてJプライマーを使用することにより、cDNAの結果とゲノムDNAの結果を直接比較することが可能になる。これは、クロノタイプレベルでの発現レベル情報を提供し、実際に機能的関連性を有し得る。本発明の1つの局面は、同一の血液試料またはその他の生体試料に由来するcDNAとゲノムDNAのクロノタイププロファイルを比較することによって、細胞当たりの著しい高発現または低発現を示唆する異なる頻度を有するクロノタイプが同定されることである。この機能的情報を使用して、クロノタイプが疾患と相関する可能性が高いか否かを予測することができる。加えて、疾患と相関するクロノタイプの細胞当たりの発現レベルを用いて、疾患活動性または疾患転帰の可能性を判断することができる。例えば、2名の個体において、相関クロノタイプに関するcDNAアッセイで同様のレベルが得られても、細胞当たりのクロノタイプ発現レベル(ゲノムDNAクロノタイププロファイリングとの比較によって決定される)が異なる場合には、このことは、これらの患者が異なる疾患活動性を有することを示し得る。

第2段階のPCRは、増幅に必要な配列を付着させることである。第2段階で用いられるプライマーを表9に記載する。

（表９）共通プライマー^*

^*すべてのアッセイ(例えば、マウスTCRβおよびヒトIgH)について、第3段階は任意の増幅段階である。これは、フローセルに付着しているオリゴヌクレオチドとハイブリダイズする末端配列の完全性を確実にするために行われる。共通の第2段階プライマーは、すべてのアッセイ(例えば、マウスTCRβおよびヒトIgH)において用いられる。共通の第2段階プライマーにおけるNの使用は、これらのプライマーがそれぞれ、試料が後に同定されることを可能にする特有の6塩基対タグを含むという事実を意味することに留意されたい。

上記のプライマー、および実質的に類似しているその他の配列を用いて、増幅が可能である。図8A〜8Bはそのような増幅の例を示し、これは、20μlの投入ゲノムDNA中の少なくともゲノムDNA 50〜2,000μgの範囲で成功した。

アッセイは、ダイナミックレンジの大きいDNAに対応する必要がある。生検試料は大量の物質を含んでいない場合があるが、腫瘍が大幅に濃縮されている可能性が高いことを考慮すると、大量の出発物質は必要ではない。その一方で、100万個の細胞は、約6μgのゲノムDNAを有する。100万個のB細胞を含むPBMCは、約20μgのゲノムDNAを有する可能性が高い。100万個のB細胞を評価できるようにするには、3つのPCR反応のそれぞれにおいて約6.6μgのゲノムDNAを使用する。プライマーの1つに相補的な配列中に体細胞変異が存在する場合、この例では約660K個のB細胞のみが調べられることに留意されたい。これは、アッセイが50〜10,000 ngの範囲にわたって機能する場合に有用である。アッセイは、20μl中、50〜2,000 ngのDNAの範囲で機能することが実証された。反応を100μlまでスケールアップすることにより、10μgのDNAを使用することができる。

いくつかの特定の態様例を参照して本発明を説明してきたが、本発明の精神および範囲から逸脱することなく、それらに対して多くの変更がなされ得ることを、当業者は認識するであろう。本発明は、上記のものに加えて、様々なセンサー実現およびその他の主題に適用可能である。

定義
本明細書において他に具体的に規定されない限り、本明細書で用いられる核酸化学、生化学、遺伝学、および分子生物学の用語および記号は、当分野における標準的な論文および教科書、例えば、Kornberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992)；Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975)；Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999)；Abbas et al, Cellular and Molecular Immunology, 6^th edition (Saunders, 2007)の用語および記号に従っている。

「アンプリコン」とは、ポリヌクレオチド増幅反応の産物；すなわち、一本鎖または二本鎖であってよく、1つまたは複数の出発配列から複製されるポリヌクレオチドのクローン集団を意味する。1つもしくは複数の出発配列は、同じ配列の1つもしくは複数のコピーであってもよいし、またはそれらは異なる配列の混合物であってもよい。好ましくは、アンプリコンは、単一の出発配列の増幅によって形成される。アンプリコンは、その産物が1つまたは複数の出発核酸または標的核酸の複製物を含む、様々な増幅反応によって生成され得る。1つの局面において、アンプリコンを生成する増幅反応は、ヌクレオチドまたはオリゴヌクレオチドのいずれかである反応物の塩基対形成が、反応産物の創出に必要な相補体を鋳型ポリヌクレオチドにおいて有するという点で、「鋳型駆動型」である。1つの局面において、鋳型駆動型反応は、核酸ポリメラーゼによるプライマー伸長、または核酸リガーゼによるオリゴヌクレオチド連結である。このような反応には、参照により本明細書に組み入れられる以下の参考文献：Mullisら、米国特許第4,683,195号；第4,965,188号；第4,683,202号；第4,800,159号(PCR)；Gelfandら、米国特許第5,210,015号(「taqman」プローブによるリアルタイムPCR)；Wittwerら、米国特許第6,174,670号；Kacianら、米国特許第5,399,491号(「NASBA」)；Lizardi、米国特許第5,854,033号；Aonoら、特開平4-262799(ローリングサークル増幅)などに開示されているポリメラーゼ鎖反応(PCR)、線状ポリメラーゼ反応、核酸配列ベースの増幅(NASBA)、ローリングサークル増幅などが含まれるが、これらに限定されない。1つの局面において、本発明のアンプリコンはPCRによって生成される。増幅反応の進行に伴った反応産物の測定を可能にする検出化学が利用できるのであれば、増幅反応は「リアルタイム」増幅であってよく、例えば、以下に記載される「リアルタイムPCR」、またはLeon et al, Nucleic Acids Reseqrch, 26: 2150-2155 (1988)、および同様の参考文献に記載されているような「リアルタイムNASBA」であってよい。本明細書で用いられる「増幅すること」という用語は、増幅反応を行うことを意味する。「反応混合物」とは、反応を行うために必要な反応物をすべて含む溶液を意味し、この反応物には、反応中にpHを選択されたレベルに維持するための緩衝剤、塩、補因子、スカベンジャーなどが含まれ得るが、これらに限定されない。

本明細書で用いられる「クローン性」とは、レパートリーのクロノタイプの間のクロノタイプ存在量の分布が1種または数種のクロノタイプに歪む程度の尺度を意味する。大まかに言うと、クローン性はクロノタイプ多様性の逆の尺度である。多くの尺度または統計学が、本発明によるクローン性尺度に対して使用され得る、種と存在量の関係を説明する生態学、例えば、Chapters 17 & 18, in Pielou, An Introduction to Mathematical Ecology, (Wiley-Interscience, 1969)から利用できる。1つの局面において、本発明と共に用いられるクローン性尺度はクロノタイププロファイル(すなわち、検出される別個のクロノタイプの数およびそれらの存在量)に依存し、したがって、クロノタイププロファイルを測定した後、そこからクローン性を計算して、1つの数字をもたらすことができる。1つのクローン性尺度はシンプソンの尺度であり、これは単純に、ランダムに選び出された2つのクロノタイプが同じである確率である。その他のクローン性尺度には、情報ベースの尺度、およびPielou(上記)に開示されているマッキントッシュの多様性指数が含まれる。

「クロノタイプ」とは、T細胞受容体(TCR)もしくはB細胞受容体(BCR)またはその一部をコードする、T細胞またはB細胞の組換えヌクレオチド配列を意味する。1つの局面において、個体のリンパ球集団の別個のクロノタイプすべての収集物は、そのような集団のレパートリーである、例えば、Arstila et al, Science, 286: 958-961 (1999)；Yassai et al, Immunogenetics, 61: 493-502 (2009)；Kedzierska et al, Mol. Immunol., 45(3): 607-618 (2008)など。本発明で用いられる「クロノタイププロファイル」または「レパートリープロファイル」とは、レパートリーのクロノタイプおよびそれらの相対存在量の実質的にすべてを含めた、T細胞および/またはB細胞の試料(そのような細胞を含む末梢血試料など)のクロノタイプの集計である。「クロノタイププロファイル」、「レパートリープロファイル」、および「レパートリー」は、本発明において互換的に用いられる。(すなわち、以下にさらに詳述する「レパートリー」という用語は、リンパ球の試料から測定されるレパートリーを意味する)。本発明の1つの局面において、クロノタイプは、免疫グロブリン重鎖(IgH)またはTCRβ鎖の一部を含む。本発明の他の局面において、クロノタイプは、免疫グロブリン軽鎖もしくはTCRα鎖またはそれらの一部などのその他の組換え分子に基づき得る。

「相補性決定領域」(CDR)とは、免疫グロブリン(すなわち、抗体)またはT細胞受容体の領域を意味するものであり、この領域において該分子は抗原の高次構造を補完し、それによって該分子の特異性を決定し、特異的抗原と接触する。T細胞受容体および免疫グロブリンはそれぞれ、3つのCDRを有する：CDR1およびCDR2は可変(V)ドメイン中に見出され、CDR3は、Vの一部、多様部(D)(重鎖のみ)および結合部(J)のすべて、ならびに定常(C)ドメインの一部を含む。

「内部標準」とは、試料中の標的ポリヌクレオチドの絶対的もしくは相対的な定量を可能にするために、同じ増幅反応において1つまたは複数の標的ポリヌクレオチドとして増幅される核酸配列を意味する。内部標準は、内因性であっても外因性であってもよい。すなわち、内部標準は試料中に天然に存在してもよいし、または増幅前に試料中に添加されてもよい。1つの局面では、較正を提供するために、複数の外因性内部標準配列を一連の所定の濃度で反応混合物に添加することができ、この較正に対して標的アンプリコンを比較して、試料中のその対応する標的ポリヌクレオチドの量を決定することができる。外因性内部標準の数、配列、長さ、およびその他の特徴の選択は、当業者にとって日常的な設計上の選択である。好ましくは、本明細書において「参照配列」とも称される内因性の内部標準とは、一定でかつ細胞周期非依存的な転写レベルを示す最低限にしか調節されない遺伝子に対応する、試料にとって天然の配列である、例えば、Selvey et al, Mol. Cell Probes, 15: 307-311 (2001)。例示的な参照配列には、以下の遺伝子からの配列が含まれるが、これらに限定されない：GAPDH、β₂ミクログロブリン、18SリボソームRNA、およびβアクチン(また、上記のSelvey et alを参照されたい)。

「キット」とは、本発明の方法を行うための物質または試薬を運搬するための任意の運搬システムを指す。反応アッセイとの関連において、このような運搬システムには、ある位置から別の位置への反応試薬(例えば、適切な容器中のプライマー、酵素など)および/または支持物質(例えば、緩衝液、アッセイを行うための書面による説明書など)の貯蔵、輸送、または運搬を可能にするシステムが含まれる。例えば、キットは、関連の反応試薬および/または支持物質を含む1つまたは複数の封入物(例えば、箱)を含む。このような内容物は、共にまたは別々に、意図される受け手へと運搬され得る。例えば、第1容器はアッセイにおいて使用するための酵素を含んでよく、第2容器はプライマーを含む。

「リンパ系新生物」とは、悪性または非悪性であってよいリンパ球の異常な増殖を意味する。リンパ系癌とは、悪性のリンパ系新生物である。リンパ系新生物は、濾胞性リンパ腫、慢性リンパ性白血病(CLL)、急性リンパ性白血病(ALL)、ヘアリー細胞白血病、リンパ腫、多発性骨髄腫、移植後のリンパ球増殖障害、マントル細胞リンパ腫(MCL)、びまん性大細胞型B細胞リンパ腫(DLBCL)、T細胞リンパ腫などを含むがこれらに限定されないリンパ球増殖障害の結果であるか、またはそれに付随する、例えば、Jaffe et al, Blood, 112: 4384-4399 (2008)；Swerdlow et al, WHO Classification of Tumours of Haematopoietic and Lymphoid Tissues (e. 4^th) (IARC Press, 2008)。

参照配列と別の配列(「比較配列」)との比較に関して用いられる「相同性の割合」、「同一性の割合」、または同様の用語は、この2つの配列の間の最適な整列において、比較配列が、表示される割合に等しいサブユニット位置の数において参照配列と同一であることを意味し、このサブユニットは、ポリヌクレオチド比較に関してはヌクレオチドであり、またはポリペプチド比較に関してはアミノ酸である。本明細書で用いられる、比較される配列の「最適な整列」とは、サブユニット間の一致を最大にし、かつ整列の構築において使用されるギャップの数を最小にする整列である。同一性の割合は、Needleman and Wunsch, J. Mol. Biol., 48: 443-453 (1970)("GAP" program of Wisconsin Sequence Analysis Package, Genetics Computer Group, Madison, WI)などによって記載されているようなアルゴリズムの商用の実行によって決定され得る。整列を構築し、同一性の割合または類似性の他の尺度を算出するための、当技術分野におけるその他のソフトウェアパッケージには、Smith and Waterman, Advances in Applied Mathematics, 2: 482-489 (1981) (Wisconsin Sequence Analysis Package, Genetics Computer Group, Madison, WI)のアルゴリズムに基づく「BestFit」プログラムが含まれる。言い換えれば、例えば、参照ヌクレオチド配列と少なくとも95パーセント同一であるヌクレオチド配列を有するポリヌクレオチドを得るためには、参照配列中のヌクレオチドの5パーセントまでが欠失されるか、もしくは別のヌクレオチドで置換されてよく、または参照配列中の全ヌクレオチド数の5パーセントまでのヌクレオチド数が参照配列中に挿入されてよい。

「ポリメラーゼ連鎖反応」または「PCR」とは、DNAの相補鎖の同時プライマー伸長による、特定のDNA配列のインビトロ増幅のための反応を意味する。言い換えると、PCRは、プライマー結合部位が隣接する標的核酸の複数のコピーまたは複製物を作製するための反応であり、このような反応は以下の段階の1回または複数回の反復を含む：(i) 標的核酸を変性させる段階、(ii) プライマーをプライマー結合部位にアニーリングさせる段階、および(iii) ヌクレオシド三リン酸の存在下で核酸ポリメラーゼによりプライマーを伸長させる段階。通常、反応は、サーマルサイクラー装置において、各段階に最適化された異なる温度の間で繰り返される。特定の温度、各段階における持続時間、および段階間の変化速度は、例えば参考文献：McPherson et al, editors, PCR: A Practical Approach and PCR2: A Practical Approach (IRL Press, Oxford、それぞれ1991および1995)によって例示される、当業者に周知の多くの要因に依存する。例えば、Taq DNAポリメラーゼを用いる従来のPCRでは、＞90℃の温度で二本鎖標的核酸が変性され得、50〜75℃の範囲の温度でプライマーがアニーリングされ得、そして72〜78℃の範囲の温度でプライマーが伸長され得る。「PCR」という用語は、RT-PCR、リアルタイムPCR、ネステッドPCR、定量的PCR、マルチプレックスPCRなどを含むがこれらに限定されない、該反応の派生形態を包含する。反応容量は、数百ナノリットル、例えば200 nL〜数百μL、例えば200μLの範囲である。「逆転写PCR」または「RT-PCR」とは、標的RNAを相補的な一本鎖DNAへと変換する逆転写反応によって先行され、次いで増幅されるPCRを意味する、例えば、参照により本明細書に組み入れられる、Tecottら、米国特許第5,168,038号。「リアルタイムPCR」とは、反応の進行と共に反応産物、すなわちアンプリコンの量がモニターされるPCRを意味する。主に反応産物のモニタリングに用いられる検出化学が異なる、リアルタイムPCRの多くの形態が存在する、例えば、参照により本明細書に組み入れられる、Gelfandら、米国特許第5,210,015号(「taqman」)；Wittwerら、米国特許第6,174,670号および第6,569,627号(インターカレート色素)；Tyagiら、米国特許第5,925,517号(分子ビーコン)。リアルタイムPCRのための検出化学は、同様に参照により本明細書に組み入れられる、Mackay et al, Nucleic Acids Research, 30: 1292-1305 (2002)において概説されている。「ネステッドPCR」とは、一次PCRのアンプリコンが、プライマーの新たなセットを用いる二次PCRのための試料となる2段階PCRを意味し、そのセットのうちの少なくとも一方は一次アンプリコンの内部の位置に結合する。ネステッド増幅反応に関する、本明細書で用いられる「初期プライマー」とは、一次アンプリコンを作製するために用いられるプライマーを意味し、「二次プライマー」とは、二次または入れ子アンプリコンを作製するために用いられる1つまたは複数のプライマーを意味する。「マルチプレックスPCR」とは、複数の標的配列(または単一の標的配列および1つまたは複数の参照配列)が同じ反応混合物中で同時に行われるPCRを意味する、例えば、Bernard et al, Anal. Biochem., 273: 221-228 (1999)(2色リアルタイムPCR)。通常、増幅される各配列について、プライマーの別個のセットが用いられる。典型的には、マルチプレックスPCRにおける標的配列の数は、2〜50、または2〜40、または2〜30の範囲である。「定量的PCR」とは、試料または標本中の1つまたは複数の特定の標的配列の存在量を測定するために設計されたPCRを意味する。定量的PCRは、このような標的配列の絶対的な定量および相対的な定量の両方を含む。定量的な測定は、標的配列と別々にまたは共にアッセイされ得る1つまたは複数の参照配列または内部標準を用いてなされる。参照配列は、試料または標本にとって内因性であっても外因性であってもよく、後者の場合には、1つまたは複数の競合鋳型を含み得る。典型的な内因性の参照配列には、以下の遺伝子の転写物のセグメントが含まれる：βアクチン、GAPDH、β_２ミクログロブリン、リボソームRNAなど。定量的PCRのための技法は、参照により組み入れられる以下の参考文献において例証されるように、当業者に周知である：Freeman et al, Biotechniques, 26: 112-126 (1999)；Becker-Andre et al, Nucleic Acids Research, 17: 9437-9447 (1989)；Zimmerman et al, Biotechniques, 21: 268-279 (1996)；Diviacco et al, Gene, 122: 3013-3020 (1992)；Becker-Andre et al, Nucleic Acids Research, 17: 9437-9446 (1989)など。

「プライマー」とは、ポリヌクレオチド鋳型との二重鎖の形成に際して、核酸合成の開始点として働くことができ、伸長された二重鎖が形成されるように、鋳型に沿ってその3'末端から伸長され得る、天然または合成のいずれかのオリゴヌクレオチドを意味する。プライマーの伸長は、通常、DNAポリメラーゼまたはRNAポリメラーゼなどの核酸ポリメラーゼを用いて行われる。伸長過程において付加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーはDNAポリメラーゼによって伸長される。プライマーは通常、14〜40ヌクレオチドの範囲、または18〜36ヌクレオチドの範囲の長さを有する。プライマーは、様々な核酸増幅反応、例えば、単一のプライマーを用いる線状増幅反応、または2つもしくはそれ以上のプライマーを用いるポリメラーゼ連鎖反応において用いられる。特定の適用に関してプライマーの長さおよび配列を選択するための指針は、参照により組み入れられる以下の参考文献によって明らかなように、当業者に周知である：Dieffenbach, editor, PCR Primer: A Laboratory Manual, 2^nd Edition (Cold Spring Harbor Press, New York, 2003)。

「品質スコア」とは、特定の配列位置における塩基の割り当てが正しい確率の尺度である。異なる配列決定化学、検出系、塩基コールアルゴリズムなどの結果としてコールされる塩基に関するような特定の状況について、品質スコアを算出するための様々な方法が当業者に周知である。一般的に、品質スコア値は、正しい塩基コールの確率に単調に関連している。例えば、10という品質スコアまたはQは、塩基が正しくコールされる可能性が90パーセントあることを意味し得、20というQは、塩基が正しくコールされる可能性が99パーセントあることを意味し得、以下同様である。いくつかの配列決定プラットフォーム、特に合成による配列決定化学を用いる配列決定プラットフォームでは、平均品質スコアは配列リード長に応じて低下し、その結果、配列リードの始めの品質スコアは配列リードの終わりの品質スコアよりも高く、そのような低下は、不完全な伸長、繰り返し伸長、鋳型の減少、ポリメラーゼの減少、キャップ形成の障害、脱保護の障害などのような現象に起因する。

「レパートリー」または「免疫レパートリー」とは、個体のリンパ球集団中の、T細胞受容体(TCR)もしくはB細胞受容体(BCR)またはそれらの断片それぞれをコードする別個の組換えヌクレオチド配列のセットを意味し、該セットのヌクレオチド配列は、該集団のリンパ球の実質的にすべてについて、別個のリンパ球またはそれらのクローン亜集団と1対1の対応を有する。1つの局面において、レパートリーが決定されるリンパ球集団は、1つまたは複数の血液試料などの1つまたは複数の組織試料から取り出される。レパートリーのメンバーヌクレオチド配列は、本明細書において「クロノタイプ」と称される。1つの局面において、レパートリーのクロノタイプは、TCRまたはBCRの発達中に体細胞組換えを起こしたT細胞またはB細胞集団に共通する核酸の任意のセグメントを含み、これには正常なまたは異常な(例えば、癌と関連する)その前駆体分子が含まれ、以下のもの：免疫グロブリン重鎖(IgH)またはそのサブセット(例えば、IgH可変領域、CDR3領域など)、不完全なIgH分子、免疫グロブリン軽鎖またはそのサブセット(例えば、可変領域、CDR領域など)、T細胞受容体α鎖またはそのサブセット、T細胞受容体β鎖またはそのサブセット(例えば、可変領域、CDR3、V(D)J領域など)、CDR(TCRもしくはBCRのいずれかのCDR1、CDR2、もしくはCDR3、またはそのようなCDRの組み合わせを含む)、TCRまたはBCRのいずれかのV(D)J領域、IgH可変領域の超変異領域などのうちのいずれかが含まれるがこれらに限定されない。1つの局面において、レパートリーのクロノタイプを規定する核酸セグメントは、それらの多様性(すなわち、セット中の別個の核酸配列の数)が十分に大きく、結果として個体中の実質的にすべてのT細胞もしくはB細胞またはそのクローンがそのようなレパートリーの特有の核酸配列を保有するように、選択される。すなわち、本発明に従って、実施者は、T細胞またはB細胞の集団の完全な多様性を反映しない、TCRまたはBCRをコードする組換え核酸の特定のセグメントまたは領域を、クロノタイプを規定するために選択してもよい；しかしながら、好ましくは、クロノタイプは、それらの由来元であるT細胞および/またはB細胞の集団の多様性を反映するように規定される。すなわち、好ましくは、試料のそれぞれ異なるクローンは異なるクロノタイプを有する。(当然ながら、いくつかの適用においては、白血病またはリンパ腫患者由来の試料の場合のように、プロファイル内には1つまたは複数の特定のクロノタイプの複数のコピーが存在する)。本発明の他の局面において、レパートリーに相当するリンパ球の集団は、循環B細胞であってよく、または循環T細胞であってよく、またはCD4+ T細胞、もしくはCD8+ T細胞、もしくは細胞表面マーカーによって規定されるその他の亜集団などを含むがこれらに限定されない、前述の集団のいずれかの亜集団であってよい。そのような亜集団は、特定の組織、例えば骨髄もしくはリンパ節などから試料を採取することによって、または1つもしくは複数の細胞表面マーカー、サイズ、形態などに基づいて試料(末梢血など)から細胞を選別もしくは濃縮することによって得られ得る。さらなる他の局面において、レパートリーに相当するリンパ球の集団は、腫瘍組織、感染組織などの罹患組織に由来し得る。1つの態様において、ヒトTCRβ鎖またはその断片を含むレパートリーは、0.1×10⁶個〜1.8×10⁶個の範囲、または0.5×10⁶個〜1.5×10⁶個の範囲、または0.8×10⁶個〜1.2×10⁶個の範囲の数の別個のヌクレオチド配列を含む。別の態様において、ヒトIgH鎖またはその断片を含むレパートリーは、0.1×10⁶個〜1.8×10⁶個の範囲、または0.5×10⁶個〜1.5×10⁶個の範囲、または0.8×10⁶個〜1.2×10⁶個の範囲の数の別個のヌクレオチド配列を含む。特定の態様において、本発明のレパートリーは、IgH鎖のV(D)J領域の実質的にすべてのセグメントをコードするヌクレオチド配列のセットを含む。1つの局面において、本明細書で用いられる「実質的にすべての」とは、0.001パーセントもしくはそれ以上の相対存在量を有するすべてのセグメントを意味し；または別の局面において、本明細書で用いられる「実質的にすべての」とは、0.0001パーセントもしくはそれ以上の相対存在量を有するすべてのセグメントを意味する。別の特定の態様において、本発明のレパートリーは、TCRβ鎖のV(D)J領域の実質的にすべてのセグメントをコードするヌクレオチド配列のセットを含む。別の態様において、本発明のレパートリーは、25〜200ヌクレオチドの範囲の長さを有し、かつTCRβ鎖のV、D、およびJ領域のセグメントを含むヌクレオチド配列のセットを含む。別の態様において、本発明のレパートリーは、25〜200ヌクレオチドの範囲の長さを有し、かつIgH鎖のV、D、およびJ領域のセグメントを含むヌクレオチド配列のセットを含む。別の態様において、本発明のレパートリーは、別個のIgH鎖を発現するリンパ球の数と実質的に等しい数の別個のヌクレオチド配列を含む。別の態様において、本発明のレパートリーは、別個のTCRβ鎖を発現するリンパ球の数と実質的に等しい数の別個のヌクレオチド配列を含む。さらなる別の態様において、「実質的に等しい」とは、ヌクレオチド配列のレパートリーが、0.001パーセントまたはそれ以上の頻度の個体の集団のすべてのリンパ球によって保有または発現されるIgHもしくはTCRβまたはその一部をコードするヌクレオチド配列を99パーセントの確率で含むことを意味する。さらなる別の態様において、「実質的に等しい」とは、ヌクレオチド配列のレパートリーが、0.0001パーセントまたはそれ以上の頻度で存在するすべてのリンパ球によって保有または発現されるIgHもしくはTCRβまたはその一部をコードするヌクレオチド配列を99パーセントの確率で含むことを意味する。前述の2文に記載されるクロノタイプのセットは、本明細書において、IgHおよび/またはTCRβ配列の「完全なレパートリー」を示すと見なされる場合がある。上記のように、クロノタイププロファイル(またはレパートリープロファイル)を測定または作成する場合には、そのようなプロファイルが、特定の適用に対してレパートリーのかなり正確な表示を提供するように、十分に大きなリンパ球の試料を入手する。1つの局面において、特に1〜10 mLの末梢血試料から得られる場合、10⁵〜10⁷個のリンパ球を含む試料が用いられる。

「配列タグ」(または「タグ」)とは、ポリヌクレオチドまたは鋳型に付着させ、反応において該ポリヌクレオチドまたは鋳型を同定および/または追跡するために用いられるオリゴヌクレオチドを意味する。場合により本明細書において「タグ化ポリヌクレオチド」または「タグ化鋳型」または「タグ-ポリヌクレオチド複合物」などと称される線状複合物を形成させるために、オリゴヌクレオチドタグをポリヌクレオチドもしくは鋳型の3'末端もしくは5'末端に付着させることができ、またはこれをそのようなポリヌクレオチド鋳型の内部に挿入することができる。オリゴヌクレオチドタグは、大きさおよび組成が大きく異なってよく；以下の参考文献は、特定の態様に適したオリゴヌクレオチドタグのセットを選択するための指針を提供する：Brenner、米国特許第5,635,400号；Brenner et al, Proc. Natl. Acad. Sci., 97: 1665-1670 (2000)；Churchら、欧州特許出願公開第0 303 459号；Shoemaker et al, Nature Genetics, 14: 450-456 (1996)；Morrisら、欧州特許出願公開第0799897A1号；Wallace、米国特許第5,981,179号など。オリゴヌクレオチドタグの長さおよび組成は大きく異なってよく、特定の長さおよび/または組成の選択は、例えばハイブリダイゼーション反応によるか、もしくは配列決定のように酵素反応によるなど、リードを生成するためにタグがどのように用いられるか；それらが例えば蛍光色素などによって標識されるかどうか；ポリヌクレオチドのセットなどを明確に同定するために必要な、識別可能なオリゴヌクレオチドタグの数、および例えばクロスハイブリダイゼーションもしくは配列決定エラーによる誤同定がないことなど、信頼できる同定を確実にするために、セットのタグがどれだけ異なるべきかを非限定的に含む、いくつかの要因に依存する。1つの局面において、オリゴヌクレオチドタグはそれぞれ、それぞれ2〜36ヌクレオチド、または4〜30ヌクレオチド、または8〜20ヌクレオチド、または6〜10ヌクレオチドの範囲内の長さを有し得る。1つの局面においては、セットの各オリゴヌクレオチドタグが、同じセットの他のすべてのタグのヌクレオチド配列と少なくとも2塩基だけ異なる特有のヌクレオチド配列を有する、タグのセットが用いられ；別の局面においては、セットの各タグの配列が、同じセットの他のすべてのタグの配列と少なくとも3塩基だけ異なる、タグのセットが用いられる。

Claims

以下の段階を含む、個体のT細胞受容体および/またはB細胞受容体のクロノタイププロファイルを決定するための方法：
ａ）前記個体から単離されたT細胞および/またはB細胞から得られた試料中の核酸に由来する個々の核酸分子を空間的に単離する段階であって、
前記試料中の核酸がｃＤＮＡおよびゲノムＤＮＡを含み、
前記個々の核酸分子が、前記試料中の核酸から各々作製された鋳型の入れ子セットであって体細胞再編成領域またはその一部を各々含む鋳型の入れ子セットに由来し、
前記鋳型の入れ子セットが、ゲノムＤＮＡから作製された入れ子鋳型の第１のサブセットとｃＤＮＡから作製された入れ子鋳型の第２のサブセットとを含み、
鋳型の入れ子セットのそれぞれが、複数の重複する鋳型を含み、
前記複数の重複する鋳型の各鋳型が、共通の端部および異なる端部を有し、
各入れ子セットが、同じ方向に各々延びる複数の配列リードであって前記入れ子セットが作製された核酸上の異なる位置から各々始まる複数の配列リードを生成することができる、
段階；
ｂ）空間的に単離された個々の核酸分子を配列決定する段階であって、
前記配列決定が、前記入れ子鋳型の第１のサブセットに由来する複数のクロノタイプおよび前記入れ子鋳型の第２のサブセットに由来する複数のクロノタイプについての配列リードを生成する、
段階；ならびに
ｃ）前記入れ子鋳型の第１のサブセットに由来する複数のクロノタイプと前記入れ子鋳型の第２のサブセットに由来する複数のクロノタイプとを比較する段階であって、前記比較によって、異なる頻度を有するクロノタイプのプロファイルが同定される、段階。
配列決定する段階が、入れ子セットの各々について複数の配列リードを生成することを含む、請求項1記載の方法。
体細胞再編成領域の各々が、V領域およびJ領域を含み、かつ複数の配列リードの各々が、該V領域内の異なる位置から始まりその連結したJ領域の方向へと延びる、請求項1記載の方法。
配列決定する段階が、少なくとも1つの順方向配列リードおよび少なくとも1つの逆方向配列リードを生成するために、空間的に単離された個々の核酸分子を双方向に配列決定することを含む、請求項1記載の方法。
順方向配列リードの少なくとも1つと逆方向配列リードの少なくとも1つとが重複領域を有し、配列リード間の逆相補関係によって前記重複領域の塩基が決定される、請求項4記載の方法。
体細胞再編成領域の各々が、V領域およびJ領域を含み、かつ配列決定する段階が、その順方向配列リードのうちの1つまたは複数と、J領域内の位置から始まりその連結したV領域の方向へと延びる少なくとも1つの逆方向配列リードとから、個々の核酸分子の各々の配列を決定することをさらに含む、請求項5記載の方法。
個々の核酸分子が、完全IgH分子、不完全IgH分子、完全IgK完全、IgK不活性分子、TCRβ分子、TCRγ分子、完全TCRδ分子、および不完全TCRδ分子からなる群より選択される核酸を含む、請求項1記載の方法。
個々の核酸分子が、0.01パーセントまたはそれ以上の頻度で存在するクロノタイプのレパートリーを99パーセントの確率で含む、請求項1記載の方法。
試料が、個体から単離された末梢血または骨髄から得られる、請求項1記載の方法。
空間的に単離する段階が、個々の核酸分子を固体表面上に配置することと、その表面上で該個々の核酸分子を、その単離されたクローン集団を形成するように増幅することとを含む、請求項1記載の方法。
増幅することが、ブリッジPCRによって行われる、請求項10記載の方法。
複数の配列リードが、プライマーを鋳型の入れ子セットの各鋳型上のプライマー結合部位にアニーリングさせてDNAポリメラーゼで該プライマーを伸長させることによって、生成される、請求項1記載の方法。
複数の配列リードの少なくとも1つが、プライマー結合部位の少なくとも1つと重複する、請求項12記載の方法。
配列決定する段階が、単調に下降する品質スコアを有する配列リードを生成することを含む、請求項1記載の方法。
単調に下降する品質スコアが、配列リードが以下よりも高いエラー率を有するものである、請求項14記載の方法：
配列リードの0.2パーセントが、1〜50位の塩基において少なくとも1つのエラーを含み、配列リードの0.2〜1.0パーセントが、51〜75位に少なくとも1つのエラーを含み、配列リードの0.5〜1.5パーセントが、76〜100位に少なくとも1つのエラーを含む。
空間的に単離された個々の核酸分子を配列決定する段階が、少なくとも30ヌクレオチドの配列長を各々有する少なくとも1000種のクロノタイプを提供する、請求項1記載の方法。
試料が個体のB細胞に由来する、請求項1記載の方法。