JP6513035B2 - 希少クロノタイプおよびその用途 - Google Patents

希少クロノタイプおよびその用途 Download PDF

Info

Publication number
JP6513035B2
JP6513035B2 JP2015558958A JP2015558958A JP6513035B2 JP 6513035 B2 JP6513035 B2 JP 6513035B2 JP 2015558958 A JP2015558958 A JP 2015558958A JP 2015558958 A JP2015558958 A JP 2015558958A JP 6513035 B2 JP6513035 B2 JP 6513035B2
Authority
JP
Japan
Prior art keywords
clonotype
sequence
clonotypes
database
profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015558958A
Other languages
English (en)
Other versions
JP2016507248A (ja
JP2016507248A5 (ja
Inventor
ペピン,フランソワ
ファハム,マレク
ムーアヘッド,マーティン
Original Assignee
アダプティヴ バイオテクノロジーズ コーポレーション
アダプティヴ バイオテクノロジーズ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/834,794 external-priority patent/US9528160B2/en
Application filed by アダプティヴ バイオテクノロジーズ コーポレーション, アダプティヴ バイオテクノロジーズ コーポレーション filed Critical アダプティヴ バイオテクノロジーズ コーポレーション
Publication of JP2016507248A publication Critical patent/JP2016507248A/ja
Publication of JP2016507248A5 publication Critical patent/JP2016507248A5/ja
Application granted granted Critical
Publication of JP6513035B2 publication Critical patent/JP6513035B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は希少クロノタイプおよびその用途に関する。
相互参照
本出願は、2013年2月22日付け出願の米国仮特許出願第61/768,269号に基づく優先権を主張している2013年3月15日付け出願の同時係属米国特許出願第13/834,794号の一部継続出願である。米国特許出願第13/834,794号はまた、2011年2月25日付け出願の米国仮特許出願第61/446,822号、2011年2月23日付け出願の第61/445,743号および2010年5月6日付け出願の第61/332,175号に基づく優先権を主張している2011年5月4日付け出願の米国特許出願第13/100,365号の一部継続出願である。米国特許出願第13/100,365号はまた、2008年11月7日付け出願の米国仮特許出願第61/112,693号に基づく優先権を主張している2009年11月9日付け出願の米国特許出願第12/615,263号、現在は米国特許第8,236,503号の一部継続出願である。本出願はまた、2013年2月22日付け出願の米国仮特許出願第61/768,269号の利益を主張するものである。前記出願の全ての全体を参照により本明細書に組み入れることとする。
診断および予後用途における大規模DNA配列決定は、その速度が増加し、その塩基当たりのコストが減少するにつれて、急速に拡大してきている。例えば、Dingら,Nature,481(7382):506−510(2012);Chiuら,Brit.Med.J.,342:c7401(2011);Kuら,Annals of Neurology,71(1):5−14(2012)など。特に、T細胞もしくはB細胞受容体またはそれらの成分のような免疫分子をコードする核酸のプロファイルは生物の健康または疾患の状態に関する大量の情報を含有し、したがって、多種多様な状態に関する診断または予後指標としてのそのようなプロファイルの使用が提示されている。例えば、FahamおよびWillis,米国特許公開第2010/0151471号;Freemanら,Genome Research,19:1817−1824(2009);Boydら,Sci.Transl.Med.,1(12):12ra23(2009);Heら,Oncotarget(2011年3月8日)。
多数の癌に関して、治療された患者は、しばしば、該癌に関連した最小残存病変(MRD)を保有する。すなわち、治療に応答した該疾患の完全寛解を患者が臨床的尺度により示しうる場合であっても、何らかの理由により破壊を免れたほんの僅かな癌細胞が残存しうる。この残存集団のタイプおよびサイズは患者の継続治療に関する重要な予後因子である。例えば、Campana,Hematol.Oncol.Clin.North Am.,23(5):1083−1098(2009);Buccisanoら,Blood,119(2):332−341(2012)。したがって、フローサイトメトリー、in situハイブリダイゼーション、細胞遺伝学、核酸マーカーの増幅などに基づく技術を含む、この集団を評価するための幾つかの技術が開発されている。例えば、Buccisanoら,Current Opinion in Oncology,21:582−588(2009);van Dongenら,Leukemia,17(12):2257−2317(2003)など。組換え免疫受容体のセグメントをコードする核酸(すなわち、クロノタイプ)の増幅が、白血病およびリンパ腫におけるMRDを評価するのに特に有用である。なぜなら、そのようなクロノタイプは典型的に、対応関連癌細胞に対する分子標的として役立ちうる特有の配列を有するからである。しかし、全てのクロノタイプが非常に多様な受容体セグメント、例えばV(D)Jセグメントをコードしているわけではない。クロノタイプが、より低い多様性の受容体セグメント、例えばDJセグメントをコードしていることも少なくなく、あるいは考えられうる発生的または機能的理由により優先的に表される反復モチーフを形成するセグメントをコードしており、それにより種々の個体間で比較的よく共通している。例えば、Gaussら,Mol.Cell.Biol.,16(1):258−269(1996);Muruganら,Proc.Natl.Acad.Sci.,109(40):16161−16166(2012);Venturiら,J.Immunol.,186:4285−4294(2011);Robins,J.Immunol.,189(6):3221−3230(2012)。いずれの状況においても、そのようなクロノタイプは、MRDを評価するためのマーカーとして最適以下であったり、あるいは更には役に立たないことがある。
前記を考慮すると、クロノタイプを希少性または特有性に関して評価して、偽陽性結果の可能性の低い最小残存病変の正確な尺度にそれらがなりうるかどうかを決定するための方法が利用可能になれば、非常に有利であろう。
発明の概括
本発明は、偽陽性結果を最小にするために癌の最小残存病変をモニタリングするため及びサンプル汚染を検出するために使用されうる希少クロノタイプを選択する方法に関する。本発明は幾つかの実施および適用において例示され、それらの幾つかは以下に及び本明細書の全体にわたって要約されている。
1つの態様において、本発明は、以下の工程:すなわち、(a)T細胞および/またはB細胞を含む、患者からの診断サンプルを得、(b)該サンプルのT細胞および/またはB細胞からの核酸の分子(該核酸分子はT細胞受容体遺伝子または免疫グロブリン遺伝子からの組換えDNA配列を含む)を増幅し、(c)核酸の増幅分子を配列決定してクロノタイププロファイルを形成し、(d)1以上の候補クロノタイプのセットを、該クロノタイププロファイルにおけるそれらの頻度に基づいて選択し、(e)該セットからの1以上の候補クロノタイプを、該患者以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプデータベースのクロノタイプと比較して、各候補クロノタイプの該クロノタイプデータベースにおける存在、非存在および/またはレベルを決定し、所定頻度より大きな、該クロノタイプデータベースにおける頻度を有する候補クロノタイプを該セットから除去し、(f)最小残存病変をモニタリングするための1以上の患者特異的クロノタイプとして、該セット内に残存した候補クロノタイプを選択することを含む、リンパ増殖障害の最小残存病変をモニタリングするためにリンパ増殖障害と相関する1以上の患者特異的クロノタイプを選択する方法に関する。
もう1つの態様において、本発明は、以下の工程:すなわち、(a)T細胞および/またはB細胞を含む、患者からの診断サンプルを得、(b)該サンプルのT細胞および/またはB細胞からの核酸の分子(該核酸分子はT細胞受容体遺伝子または免疫グロブリン遺伝子からの組換えDNA配列を含む)を増幅し、(c)核酸の増幅分子を配列決定してクロノタイププロファイルを形成し、(d)該クロノタイププロファイルからのクロノタイプを、該患者以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプデータベースのクロノタイプと比較して、該クロノタイププロファイルからの各クロノタイプの該クロノタイプデータベースにおける存在、非存在および/またはレベルを決定し、(e)それぞれリンパ系新生物と相関しており、それぞれ該クロノタイプデータベースに存在しない又は所定頻度未満の該クロノタイプデータベースにおけるレベルでしか存在しない、最小残存病変をモニタリングするための1以上の患者特異的クロノタイプを選択することを含む、リンパ系新生物の最小残存病変をモニタリングするためにリンパ系新生物と相関する1以上の患者特異的クロノタイプを選択する方法に関する。
もう1つの態様において、本発明は、以下の工程:すなわち、(a)第1個体からの組織サンプルの核酸から第1クロノタイププロファイルを作製し、(b)第2個体からの組織サンプルの核酸から第2クロノタイププロファイルを作製し、(c)第1および第2クロノタイププロファイルからのクロノタイプを、第1および第2個体以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプデータベースのクロノタイプと比較して、それぞれ該クロノタイプデータベースに存在しない又は所定頻度未満の該クロノタイプデータベースにおけるレベルでしか存在しない第1および第2クロノタイププロファイルからの各クロノタイプの該クロノタイプデータベースにおける存在、非存在および/またはレベルを決定し、(d)そのような決定されたクロノタイプのいずれかが第1および第2クロノタイププロファイルの両方に存在する場合には、第1個体からの組織サンプルを、第2個体からの核酸により汚染されているものとして分類することを含む、第1個体からのT細胞および/またはB細胞を含む組織サンプルが、第2個体からのT細胞および/またはB細胞を含む組織サンプルを汚染しているかどうかを判定するための方法に関する。
本発明のこれらの前記で特徴づけられた態様および他の態様は幾つかの例示されている実施および用途において例証されており、それらの幾つかは図面に示されており、添付の特許請求の範囲において特徴づけられている。しかし、前記概要は、本発明の例示されている実施形態の全てを記載しているわけではなく、また、実施の全てを記載しているわけではないと意図される。
本発明の新規特徴は添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点のより深い理解は、本発明の原理が利用されている例示実施形態を記載している以下の詳細な説明および後記の添付図面を参照することにより得られる。
発明の詳細な説明
本発明の実施は、特に示されていない限り、当技術分野の技量の範囲内である分子生物学(組換え技術を含む)、バイオインフォマティクス、細胞生物学および生化学の通常の技術および説明を用いうる。そのような通常の技術には、血液細胞のサンプル採取および分析、核酸配列決定および分析などが含まれるが、これらに限定されるものではない。適当な技術の具体的な例示は、本明細書における後記実施例を参照することにより得られうる。しかし、他の同等の通常の方法も勿論用いられうる。そのような通常の技術および説明は、標準的な実験マニュアル、例えばGenome Analysis:A Laboratory Manual Series(Vols.I−IV);PCR Primer:A Laboratory Manual;およびMolecular Cloning:A Laboratory Manual(全てCold Spring Harbor Laboratory Pressからのもの)などに見出されうる。
1つの態様においては、本発明は、リンパまたは骨髄増殖障害と相関しており、疾患再発の偽陽性判定がなされる最小の可能性で該障害の状態をモニタリングするために使用されうる希少クロノタイプおよび/または関連クロノタイプの希少群を選択するための方法に関する。そのような希少クロノタイプは、治療後の癌の最小残存病変をモニタリングするのに特に有用であり、ここで、そのようなモニタリングの結果は、治療を継続すべきか、中断すべきか又は変更すべきかを決定する際に鍵となる要因である。多数の悪性リンパおよび骨髄新生物においては、診断組織サンプル(または本明細書においては「診断サンプル」とも称される)、例えば末梢血サンプルまたは骨髄サンプルは、クロノタイププロファイル(「診断クロノタイププロファイル」)が作製される治療(処理)の前に得られる。1以上の疾患相関クロノタイプ(すなわち、「相関クロノタイプ」)は、通常、最高頻度を有するクロノタイプとしてクロノタイププロファイルにおいて特定される。例えば、所定診断頻度が決定されることが可能であり、所定診断頻度より大きな頻度を有する各クロノタイプが候補クロノタイプのセットのメンバーとして選択される。幾つかの実施形態においては、MRDをモニタリングするために使用される1以上の相関クロノタイプは、MRDの偽陽性判定を最小にするのに十分な程度に希少である候補クロノタイプのセットから採用される。セット内の候補クロノタイプの数は癌のタイプ、癌の病期、治療履歴などに応じて変動しうる。幾つかの実施形態においては、セットは診断クロノタイププロファイルの最高頻度クロノタイプの10個までを含む。他の実施形態においては、セットは診断クロノタイププロファイルの最高頻度クロノタイプの5個までを含む。治療(処理)後、および好ましくは癌の完全な寛解が得られた後、そのような相関クロノタイプの存在、非存在または頻度を定期的に評価して、治療後クロノタイププロファイルにおける相関クロノタイプ(または関連クロノタイプ)の存在またはその頻度の増加に基づいて、寛解が維持されているかどうか、あるいは新生物が再現または再発しているかどうかを決定する。すなわち、治療後、相関クロノタイプの存在、非存在または頻度に基づいて、癌の最小残存病変を評価する。通常、そのような相関クロノタイプの頻度またはレベルが、所定値、例えば.01%または0.1%または1%(これは該疾患、該疾患の病期、患者の状態などに左右されうる)と等しくなる又はそれを超えるまで増加すれば、例えば、これまでの方式に従って更なる治療を実施すべきであるという治療判断、および例えば、投与量を増加させること、異なる治療方法を加えること、例えば異なる薬物を使用することにより、治療方式を変更すべきであるという治療判断などがなされうる。前記のとおり、そのような相関クロノタイプが一般的である、または(非癌細胞が該クロノタイプを共有しうるように)十分な多様性を欠く再編成受容体セグメントに対応する場合には、治療後クロノタイププロファイルにおけるそのようなクロノタイプの存在は再発の偽陽性指標を与えうる。1つの態様においては、本発明は、相関クロノタイプの希少性を評価するための方法を提供し、したがって、再発の偽陽性判定の可能性を最小にする相関クロノタイプを選択するための方法を提供する。概念が後記で更に詳細に記載されているとおり、この態様においては、診断クロノタイププロファイルを作製した後、クロノタイプデータベースを、同一クロノタイプと、クランに関連したクロノタイプとの両方の存在に関して検索する。このようにして、どの相関クロノタイプがモニタリングのために選択されるかには無関係に、(選択されたクロノタイプの直接PCRによる場合も、クロノタイププロファイリングによる場合も)治療後試験が開始する前でさえも、選択されたクロノタイプが偽陽性指標を与えうる可能性が推定されうる。
本発明の方法はいずれかの増殖性疾患のモニタリングに適用可能であり、ここで、該疾患に関与する細胞のマーカーとして、免疫受容体をコードする再編成核酸またはその一部が使用されうる。したがって、本発明の方法は、各治療後測定におけるクロノタイププロファイルの作製を含む配列ベース法と、単一クロノタイプのPCR増幅を含む単一クローン追跡(single−clone tracking)法との両方に適用可能である。1つの態様においては、本発明の方法はリンパおよび骨髄増殖障害に適用可能である。もう1つの態様においては、本発明の方法はリンパ腫および白血病に適用可能である。もう1つの態様においては、本発明の方法は濾胞性リンパ腫、慢性リンパ性白血病(CLL)、急性リンパ性白血病(ALL)、慢性骨髄性白血病(CML)、急性骨髄性白血病(AML)、ホジキンおよび非ホジキンリンパ腫、多発性骨髄腫(MM)、意義不明の単クローン性免疫グロブリン血症(MGUS)、マントル細胞リンパ腫(MCL)、びまん性大細胞型B細胞リンパ腫(DLBCL)、骨髄異形成症候群(MDS)、T細胞リンパ腫などにおけるMRDのモニタリングに適用可能である。特定の実施形態においては、本発明の方法はALL、MMまたはDLBCLにおけるMRDのモニタリングに特に好適である。
特にリンパおよび骨髄増殖障害に関する幾つかの実施形態においては、複数のタイプのクロノタイプが評価されうるように複数のクロノタイププロファイルを診断サンプルから作製する。すなわち、T細胞および/またはB細胞からの組換えDNAまたは核酸配列(本明細書においては「体細胞再編成DNAまたは核酸」または「再編成DNAまたは核酸」とも称される)は、以下のものの完全鎖または一部をコードする核酸配列を含みうる:IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、およびTCRδのVD再編成。患者の癌がB細胞に由来することが他の試験から既知の場合には、診断サンプルにおいて分析されるクロノタイプは、以下のものの完全鎖または一部をコードする核酸配列に限定されうる:IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、および/またはIgLのVJ再編成。同様に、患者の癌がT細胞に由来することが他の試験から既知の場合には、診断サンプルにおいて分析されるクロノタイプは、以下のものの完全鎖または一部をコードする核酸配列に限定されうる:TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、および/またはTCRδのVD再編成。幾つかの実施形態においては、本発明の方法において診断サンプルから得られるクロノタイププロファイルは、以下のものの完全鎖または一部をコードするクロノタイプに基づく:IgHのVDJ含有セグメント、IgHのDJ含有セグメント、IgKのVJ含有セグメント、TCRβのVDJ含有セグメント、TCRγのセグメント、および/またはTCRδのセグメント。幾つかの実施形態においては、診断サンプルは骨髄、末梢血またはリンパ節もしくは他のリンパ組織からの組織を含みうる。
幾つかの実施形態においては、本発明の前記態様は、以下の工程:すなわち、(a)T細胞および/またはB細胞を含む、患者からの診断サンプルを得、(b)該サンプルのT細胞および/またはB細胞からの核酸の分子(該核酸分子はT細胞受容体遺伝子または免疫グロブリン遺伝子からの組換えDNA配列を含む)を増幅し、(c)核酸の増幅分子を配列決定してクロノタイププロファイルを形成し、(d)1以上の候補クロノタイプのセットを、該クロノタイププロファイルにおけるそれらの頻度に基づいて選択し、(e)該セットからの1以上の候補クロノタイプを、該患者以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプデータベースのクロノタイプと比較して、各候補クロノタイプの該クロノタイプデータベースにおける存在、非存在および/またはレベルを決定し、所定頻度より大きな、該クロノタイプデータベースにおける頻度を有する候補クロノタイプを該セットから除去し、(f)最小残存病変をモニタリングするための1以上の患者特異的クロノタイプとして、該セット内に残存した候補クロノタイプを選択することにより実施されうる。後記で更に詳細に説明されるとおり、クロノタイププロファイルから得られたセットの候補クロノタイプ(すなわち、「測定クロノタイプ」)をクロノタイプデータベース内のものと比較する工程は、例えば配列の近縁性により又はクローン進化により、合致クロノタイプまたは関連クロノタイプに関してクロノタイプデータベースを検索することにより行われる。幾つかの実施形態においては、比較する工程は、マッチとみなすためには測定クロノタイプとデータベースクロノタイプとの間の厳密な合致(マッチ)を必要とすることにより実施されうる。他の実施形態においては、比較する工程は、マッチとみなすためには測定クロノタイプとデータベースクロノタイプとの間のヌクレオチドの一部のみの合致(マッチ)を必要とすることにより実施されうる。例えば、幾つかの実施形態においては、データベースクロノタイプが測定クロノタイプと合致しているとみなされうるのは、それらの2つの間に90%を超える同一性が存在する場合である。幾つかの実施形態においては、データベースクロノタイプが測定クロノタイプと合致しているとみなされうるのは、それが、該測定クロノタイプと同じクラン内に存在することにより関連づけられる場合である。幾つかの実施形態においては、クロノタイプは、幾らか低い所定閾値または頻度でそれがクロノタイプデータベース内に存在する場合であっても、MRDまたは汚染をモニタリングするためのクロノタイプとして有用でありうる。そのような実施形態においては、クロノタイプが、MRDをモニタリングするため又は汚染を検出するために使用されうるのは、それが所定頻度で又はそれ未満で存在する場合であり、これはデータベースのサイズまたはデータベース内のクロノタイプエントリーの数に左右されうる。1つの実施形態においては、所定頻度は10−7であり、もう1つの実施形態においては、所定頻度は10−8であり、もう1つの実施形態においては、所定頻度は10−9である。
幾つかの実施形態においては、候補クロノタイプとクロノタイプデータベースのメンバーとの間の配列相違が何らかの最小値(本明細書においては「所定相違」と称される)未満である場合、該候補クロノタイプはセットから除去されうる。配列相違には、ハミング(Hamming)距離のような配列距離尺度による尺度でありうる塩基置換、挿入および欠失相違が含まれる。配列相違には、VH置換のような体細胞再編成による相違も含まれる。幾つかの実施形態においては、候補クロノタイプの配列がデータベース内のクロノタイプ配列の何らかの所定配列距離尺度以内である場合、該候補クロノタイプはセットから除去されうる。1つの実施形態においては、そのような配列距離尺度はハミング距離である。
本発明の工程の適用後のセット内に候補クロノタイプが残存していない場合には、候補クロノタイプを選択するための所定診断頻度に関する、または候補クロノタイプをセットから棄却するための所定頻度に関する選択が、より高い偽陽性結果の可能性を有するMRDモニタリングのための相関クロノタイプを得るために改変されうる。本発明の工程の適用後のセット内に複数の候補クロノタイプが残存している場合には、例えば、FahamおよびWillis、例えば米国特許第8,236,503号または第8,628,927号(これらを参照により本明細書に組み入れることとする)により教示されているとおり、MRDをモニタリングするために残存メンバーの1以上が使用されうる。幾つかの実施形態においては、データベースクロノタイプとの最大相違を有する単一候補クロノタイプが、MRDをモニタリングするために使用されうる。幾つかの実施形態においては、本発明の工程の適用後のセット内に少なくとも1つの候補クロノタイプが残存するように、所定頻度および所定診断頻度が選択される。
クランメンバーシップに基づいて2つのクロノタイプが「マッチ(合致)している」とみなすことに関しては、以下の基準の1以上が満たされる場合には、2つのクロノタイプは同一クラン内のものであるとみなされうる:(a)クロノタイプは互いに少なくとも90%同一である;(b)クロノタイプは、VH置換により関連している免疫グロブリン重鎖からの組換え配列を含む;(c)クロノタイプは、超突然変異により関連している免疫グロブリン重鎖からの組換え配列を含む;ならびに(d)クロノタイプは、それらが同一に突然変異したV領域およびJ領域を有する点で関連しているが、異なるNDN領域を有する。
もう1つの態様においては、本発明は、特にサンプル間の交差サンプル汚染を検出および/または定量するために使用されうる希少クロノタイプおよび/またはクランもしくは関連クロノタイプの希少群を選択する方法に関するものであり、この方法においては、PCRのような技術により再配列免疫受容体をコードするヌクレオチド配列を増幅する。本明細書に記載されているとおりにクロノタイププロファイルを作製することにより種々の患者からのサンプルを加工する臨床検査室のような場面においては、第1サンプルからのクロノタイプが第2サンプルのクロノタイププロファイルのメンバーであるものとして記録されることを含みうる、サンプルの交差汚染の有意な可能性が存在する。そのような潜在的汚染は、第1サンプルからのクロノタイププロファイルの希少クロノタイプを第2サンプルからのクロノタイププロファイルのものと比較することにより迅速に検出されうる。1以上のマッチが存在する場合には、サンプル間の交差汚染の可能性が高い。
幾つかの実施形態においては、本発明の前記態様は、以下の工程、すなわち、(a)第1個体からの組織サンプルの核酸から第1クロノタイププロファイルを作製し、(b)第2個体からの組織サンプルの核酸から第2クロノタイププロファイルを作製し、(c)第1および第2クロノタイププロファイルからのクロノタイプを、第1および第2個体以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプデータベースのクロノタイプと比較して、それぞれ該クロノタイプデータベースに存在しない又は所定頻度未満の該クロノタイプデータベースにおけるレベルでしか存在しない第1および第2クロノタイププロファイルからの各クロノタイプの該クロノタイプデータベースにおける存在、非存在および/またはレベルを決定し、(d)そのような決定されたクロノタイプのいずれかが第1および第2クロノタイププロファイルの両方に存在する場合には、第1個体からの組織サンプルを、第2個体からの核酸により汚染されているものとして分類することにより実施されうる。
幾つかの実施形態においては、T細胞および/またはB細胞における組換えDNA配列のクロノタイププロファイルを作製するための方法は以下の工程を含む:(a)T細胞および/またはB細胞を含む、被験者(対象)からのサンプルを得、(b)固体基体上の該細胞から組換えDNA配列の個々の分子を空間的に単離し、(c)組換えDNA配列の前記の空間的に単離された個々の分子を配列決定して、エラー率をそれぞれが有する少なくとも1000個の配列リード(sequence read;配列読取)を得、(d)配列リードが少なくとも99.9%の信頼度を伴って特徴的である場合、該サンプルの種々の組換えDNA配列へと配列リードを合体させ、(e)該サンプルからの前記の種々の組換えDNA配列のレベルを決定して、組換えDNA配列の該プロファイルを得る。
幾つかの実施形態においては、クロノタイプデータベースは、該患者以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプの任意のデータベースでありうる。通常、クロノタイプデータベースは複数の個体のクロノタイププロファイルからのクロノタイプのコレクション(収集物)である。例えば、そのようなコレクションは、それぞれが少なくとも100の個体からのものである少なくとも10個のクロノタイプのクロノタイププロファイルを含みうる。もう1つの実施形態においては、クロノタイプデータベースは、個体の集団からの少なくとも10個のクロノタイプをそれぞれが有するクロノタイププロファイルを含み、したがって、該データベースは少なくとも10個のクロノタイプまたは10個のクロノタイプまたは1010個のクロノタイプを含有する。前記クロノタイプデータベースは、個々の免疫受容体分子の特異的セグメントをコードするクロノタイプを含みうる。後記で更に詳細に説明するとおり、1つの態様においては、本発明の方法において得られるクロノタイプは、該方法において検索されるクロノタイプデータベースのクロノタイプによりコードされるものと同一である又は実質的に同一である免疫受容体分子のセグメントをコードしており、ここで、「実質的に同一」は、測定クロノタイプがデータベースクロノタイプに対して有効に検索されうるように十分な重複が存在することを意味する。1つの実施形態においては、該方法において得られるクロノタイプおよびデータベースクロノタイプは共に、IgH分子のV(D)J領域またはその一部をコードしており、もう1つの実施形態においては、該方法において得られるクロノタイプおよびデータベースクロノタイプは共に、IgH分子のDJ領域またはその一部をコードしており、もう1つの実施形態においては、該方法において得られるクロノタイプおよびデータベースクロノタイプは共に、IgK分子またはその一部をコードしており、もう1つの実施形態においては、該方法において得られるクロノタイプおよびデータベースクロノタイプは共に、TCRβ分子またはその一部をコードしており、もう1つの実施形態においては、該方法において得られるクロノタイプおよびデータベースクロノタイプは共に、TCRγ分子またはその一部をコードしており、もう1つの実施形態においては、該方法において得られるクロノタイプおよびデータベースクロノタイプは共に、TCRδ分子またはその一部をコードしている。他の実施形態においては、測定クロノタイプおよびデータベースクロノタイプは共に、以下の免疫受容体のセグメントをコードしている:IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、およびTCRδのVD再編成。幾つかの実施形態においては、測定クロノタイプおよびデータベースクロノタイプは共に、25〜400ヌクレオチドの範囲の長さを有する。幾つかの実施形態においては、測定クロノタイプおよびデータベースクロノタイプは共に、同じ長さを有する。
幾つかの実施形態においては、クロノタイプデータベースに寄与する個体は関連集団または群からのものでありうる。例えば、クロノタイプデータベースは、特定の疾患、例えばリンパまたは骨髄増殖障害、リンパ系新生物または構成状態(constituent condition)、例えばMGUSを有する個体に特異的でありうる。幾つかの実施形態においては、クロノタイプデータベースに寄与する個体は、例えばアフリカ人、日本人、白人などのような関連民族または人種群からのものでありうる。1つの実施形態においては、クロノタイプデータベースは、B細胞新生物に罹患している複数の患者から得られた少なくとも10個のクロノタイプをそれぞれが有するクロノタイププロファイルを含む。もう1つの実施形態においては、クロノタイプデータベースは、B細胞リンパ腫に罹患している複数の患者から得られた少なくとも10個のクロノタイプをそれぞれが有するクロノタイププロファイルを含む。もう1つの実施形態においては、クロノタイプデータベースは、びまん性大細胞型B細胞リンパ腫に罹患している複数の患者から得られた少なくとも10個のクロノタイプをそれぞれが有するクロノタイププロファイルを含む。もう1つの実施形態においては、クロノタイプデータベースは、多発性骨髄腫に罹患している複数の患者から得られた少なくとも10個のクロノタイプをそれぞれが有するクロノタイププロファイルを含む。
もう1つの実施形態においては、クロノタイプデータベースは、T細胞新生物に罹患している複数の患者から得られた少なくとも10個のクロノタイプをそれぞれが有するクロノタイププロファイルを含む。
測定クロノタイプをデータベースクロノタイプと比較する工程を実施するためには、多種多様な検索方法またはアルゴリズムが使用されうる。多数の通常の配列アライメントおよび検索アルゴリズムは公に利用可能であり、参照により本明細書に組み入れる以下の参照文献に記載されている:Mount,Bioinformatics Sequence and Genome Analysis,Second Edition(Cold Spring Harbor Press,2004);Batzoglou,Briefings in Bioinformatics,6:6−22(2005);Altschulら,J.Mol.Biol.,215(3):403−410(1990);NeedlemanおよびWunsch,J.Mol.Biol.,48:443−453(1970);SmithおよびWaterman,Advances in Applied Mathematics,2:482−489(1981)など。後記で更に詳細に説明するとおり、幾つかの比較工程は、バイオインフォマティクスの分野の当業者により実施されうる、より専門化された検索方法を要しうる。なぜなら、例えば、VH置換などのような再編成により関連しているクロノタイプの検索は、利用可能な検索方法またはアルゴリズムの明らかな修飾を要しうるからである。例えば、VH置換の存在を判定するために、VDJに基づくクロノタイプとデータベース内のクロノタイプとの間で通常のアライメントを行うことは、意味をなさないかもしれない。そのような場合、V領域配列より小さなクロノタイプ配列を使用してアライメントが行われうる、と当業者は理解するであろう。
本発明の1つの態様においては、クロノタイプデータベースは、測定クロノタイプと同一であるクロノタイプに関してだけでなく、例えば同一クランのメンバーであることにより又は系統学的関係を有することにより関連しているクロノタイプに関しても検索される。したがって、幾つかの実施形態においては、クロノタイプデータベースの検索は、測定クロノタイプと同じクランのメンバーであるいずれかのデータベースクロノタイプを検索するであろう。そのような検索は、測定クロノタイプと同一である配列を有していても有していなくてもよいがクランメンバーシップの決定のための1以上の関連性基準を満たすクランメンバーの存在を示す。クランを定めるための典型的な基準は以下の1以上を含みうる:(a)クロノタイプは互いに対して少なくとも90%同一である;(b)クロノタイプはIgHセグメントをコードしており、体細胞超突然変異からの種々の突然変異以外は同一である;(c)クロノタイプはVH置換により関連している;(d)クロノタイプは同一V領域および同一J領域(各領域において同一突然変異を含む)を有するが、異なるNDN領域を有する;(e)クロノタイプは、1〜10塩基の、1以上の挿入および/または欠失以外は、同一配列を有する。幾つかの実施形態においては、前記例(e)においては、クロノタイプは、それらが1〜5塩基または1〜3塩基の1以上の挿入および/または欠失以外は同一配列を有する場合には、同一クランのメンバーでありうる。
本発明のもう1つの態様においては、1以上のクロノタイプデータベースからの情報を用いてクロノタイプ発生のモデルのパラメータを決定することが可能であり、ついでそれを用いて、それらの構造、すなわち、それらの構成遺伝子セグメントのタイプおよび/またはサイズならびに再編成プロセスによるそれらの修飾に基づいて、クロノタイプの頻度または存在確率を迅速に得ることが可能である。例えば、Muruganら(前掲)はクロノタイプの限定セットに関するクロノタイプそのようなモデルの一例を示している。もう1つの例は、IgHまたはTCRβ分子のVDJ領域をコードするクロノタイプの場合に関して、図4Aを用いて例示される。クロノタイプデータベースの精査は、自然プロセスにより恐らく産生されうる全てのクロノタイプが同等に可能なわけではないことを示している。VDJ領域の多様性の生成のためのプロセスが図4Aに例示されている。大雑把に言うと、該プロセスは、(i)DおよびJ遺伝子セグメントの末端に「P」ヌクレオチドを付加し、(ii)DJ接合部においてJまたはD遺伝子セグメントから、そしてDV接合部においてDまたはV遺伝子セグメントから、ヌクレオチドを欠失させ、(iii)それぞれのそのような接合部において1〜40ヌクレオチドをランダムに挿入するメカニズムを含む。例えば、Janewayら,Immunobiology,Sixth Edition(Garland Science,New York,2005)。したがって、このプロセスの可能な結果の全てが列挙可能であり、それらのそれぞれの頻度がクロノタイプデータベースから決定されうる。あるいは、該成分セグメントの頻度、例えば、J領域(または与えられたトランケート化を有するJ領域)、V領域(または与えられたトランケート化を有するV領域)、NDN領域などの頻度が決定されうる。そのような頻度モデルは、個々の測定クロノタイプの希少性を決定するために、クロノタイプデータベースの検索の代わりに使用されうる。この概念の概要は図4Bのフローチャートに記載されている。クロノタイプ(例えば、VDJ組換え体)は前記プロセスの1以上の実施により作製される。該プロセスは確率的であり、幾つかの場合には相反する目的(例えば、ヌクレオチド付加対ヌクレオチド欠失)で働くため、ほぼ全てのクロノタイプは前記操作による複数の経路により産生されうる(例えば、9ヌクレオチドを付加し、ついで(3ヌクレオチドの実効付加となるように)6ヌクレオチドを欠失させることは、4個を付加し、ついで1個を欠失させることと等価でありうる)。しかし、9個の付加およびそれに続く6個の欠失の確率は、4個の付加およびそれに続く1個の欠失の場合とは非常に異なる確率を有しうる。クロノタイプデータベースは、与えられたクロノタイプを与える種々の操作に関連した確率を評価するために使用されうる。すなわち、各クロノタイプ特性をその存在の確率で注釈を付ける(アノテートする)(452)ために、クロノタイプデータベースが使用されうる。図4Bの(450)に示されているとおり、VDJ再編成に基づくクロノタイプに関しては、そのような特性はJセグメント選択、Dセグメント選択、Vセグメント選択、存在するPヌクレオチド、付加されたNヌクレオチド、Δ(欠失したヌクレオチドの数)などを含みうる。そのようなモデルが得られたら、与えられたクロノタイプの、その成分特性に基づく希少性(または頻度の推定値)が、成分確率を互いに掛け算することにより決定されうる(454)。
4Aに戻って、IgHまたはまたはTCRβ分子は、J領域(400)、D領域(402)およびV領域(403)から構築されたVDJ領域を含むが、構築中に、JD接合部およびDV接合部における遺伝子セグメントの末端の0個〜数個のヌクレオチドが欠失する。線(408)および(410)が、JDおよびDV接合部が存在しない欠失の位置を示す場合、矢印により示されている範囲(414)および(412)は該遺伝子セグメントの末端からの可能な欠失の範囲を示す。幾つかの場合には、D領域(402)は完全に欠失していてもよい。0〜約20ヌクレオチドを各接合部に挿入するメカニズムにより、多様性が更に生成される。例えば、欠失後、オリゴヌクレオチドセグメント(424)および(426)が該遺伝子セグメントの(恐らくはトランケート化されている)末端の間に挿入される。挿入の配置は、何が欠失したかに左右されるが、それは範囲(420)および(422)内で生じる。これらのメカニズムの結果として、認識可能なD領域(430)を含む又は含まないことが可能な非常に多数の可能なクロノタイプ(428)が生成される。これらの再編成のいずれかの可能性は、1以上のクロノタイプデータベースにおけるそれらの存在を調べることにより評価されうる。したがって、特定の長さを有する特定のタイプのJ領域(434)は存在の予想頻度を有しうる。同様に、特定可能なD遺伝子セグメントの存在または非存在下の特定の長さのNDN領域(432)は存在の予想頻度を有することが可能であり、V領域(436)に関しても同様である。この態様の1つの実施形態においては、測定クロノタイプの希少性は、その構成成分領域の予想頻度(または確率)を掛け算することにより迅速に推定されうる。
サンプル
本発明の方法のためのクロノタイププロファイルは免疫細胞のサンプルから得られうる。例えば、免疫細胞はT細胞および/またはB細胞を含みうる。T細胞(Tリンパ球)は、例えば、T細胞受容体を発現する細胞を含む。T細胞はヘルパーT細胞(エフェクターT細胞またはTh細胞)、細胞傷害性T細胞(CTL)、記憶T細胞および調節性T細胞を含む。1つの態様においては、T細胞のサンプルは少なくとも1,000個のT細胞を含むが、より典型的には、サンプルは少なくとも10,000個のT細胞を含み、より典型的には、少なくとも100,000個のT細胞を含む。もう1つの態様においては、サンプルは1000〜1,000,000細胞の範囲の数のT細胞を含む。免疫細胞のサンプルはB細胞をも含みうる。B細胞は、例えば、形質B細胞、記憶B細胞、B1細胞、B2細胞、辺縁帯B細胞および濾胞B細胞を含む。B細胞は免疫グロブリン(抗体、B細胞受容体)を発現しうる。前記のとおり、1つの態様においては、B細胞のサンプルは少なくとも1,000個のB細胞を含むが、より典型的には、サンプルは少なくとも10,000個のT細胞を含み、より典型的には、少なくとも100,000個のB細胞を含む。もう1つの態様においては、サンプルは1000〜1,000,000細胞の範囲の数のB細胞を含む。
本発明の方法において使用されるサンプルは、例えば腫瘍組織、血液および血漿、リンパ液、脳および脊髄を取り巻く脳脊髄液、関節を取り巻く滑液などを含む種々の組織に由来しうる。1つの実施形態においては、サンプルは血液サンプルである。血液サンプルは約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5または5.0mLでありうる。サンプルは腫瘍生検サンプルでありうる。該生検サンプルは、例えば、脳、肝臓、肺、心臓、結腸、腎臓または骨髄の腫瘍からのものでありうる。サンプルを被験者(対象)から単離するためには、当業者により用いられるいずれかの生検技術が用いられうる。例えば、生検はオープン生検であることが可能であり、この場合、全身麻酔が用いられる。生検はクローズド(closed)生検であることが可能であり、この場合、オープン生検より小さな切開が施される。生検はコアまたは切開生検であることが可能であり、この場合、組織の一部が摘出される。生検は切除生検であることが可能であり、この場合、病変全体を摘出する試みが行われる。生検は穿刺吸引生検であることが可能であり、この場合、組織または流体のサンプルが針で取り出される。
サンプルは生検サンプル、例えば皮膚生検サンプルでありうる。該生検サンプルは、例えば、例えば、脳、肝臓、肺、心臓、結腸、腎臓または骨髄からのものでありうる。サンプルを被験者(対象)から単離するためには、当業者により用いられるいずれかの生検技術が用いられうる。例えば、生検はオープン生検であることが可能であり、この場合、全身麻酔が用いられる。生検はクローズド(closed)生検であることが可能であり、この場合、オープン生検より小さな切開が施される。生検はコアまたは切開生検であることが可能であり、この場合、組織の一部が摘出される。生検は切除生検であることが可能であり、この場合、病変全体を摘出する試みが行われる。生検は穿刺吸引生検であることが可能であり、この場合、組織または流体のサンプルが針で取り出される。
サンプルは、被験者から取り出された身体物質から得られうる。そのような廃棄物にはヒト排泄物が含まれうる。廃棄物には、剥がれ取れた皮膚細胞、血液、歯または毛も含まれうるであろう。
リンパ腫のようなリンパ増殖障害の場合、較正または診断用サンプルはリンパ組織から、または該障害により引き起こされる病変、例えば転移病変から、または該障害により間接的に冒された組織から得られうる。リンパ新生物の場合、免疫表現型検査および疾患関連リンパ球の富化のための広く利用可能な指針および商業的に入手可能なキットが存在する。例えば、“U.S.−Canadian consensus recommendations on the immunophenotypic analysis of haematologic neoplasia by flow cytometry,”Cytometry,30:214−263(1997);MultiMixTM Antibody Panels for Immunophenotyping Leukemia and Lymphoma by Flow Cytometry(Dako,Denmark)など。リンパ組織には、リンパ節、脾臓、扁桃、咽頭扁桃、胸腺などが含まれる。
該サンプルは核酸、例えばDNA(例えば、ゲノムDNA)またはRNA(例えば、メッセンジャーRNA)を含みうる。該核酸は、例えば循環系から抽出された、無細胞DNAまたはRNAでありうる(Vlassovら,Curr.Mol.Med.,10:142−165(2010);Swarupら,FEBS Lett.,581:795−799(2007))。提供する本発明の方法においては、分析されうる被験体からのRNAまたはDNAの量は、例えば、幾つかの用途(例えば、較正試験)における僅か1個の細胞、ならびに6pg〜60μgのDNAおよび約1pg〜10μgの範囲に相当する1000万個以上もの細胞を含む。
1つの実施形態においては、クロノタイププロファイルを作製するためのリンパ球のサンプルは、異なる(特徴的な)クロノタイプを有する実質的に全てのT細胞またはB細胞がそれにおいて表されるのに十分な程度に大きい。1つの実施形態においては、それぞれの異なるクロノタイプの十分な表現を得るためには、.001%以上の頻度で存在する集団の各クロノタイプを99%の確率で含有するサンプルを採取する。もう1つの実施形態においては、.0001%以上の頻度で存在する集団の各クロノタイプを99%の確率で含有するサンプルを採取する。1つの実施形態においては、B細胞またはT細胞のサンプルは少なくとも50万個の細胞を含み、もう1つの実施形態においては、そのようなサンプルは少なくとも100万個の細胞を含む。
臨床研究サンプルなどの場合のように、サンプルが採取された起源物質が僅かしかない場合には、該物質からのDNAは非バイアス技術、例えば全ゲノム増幅(WGA)、複数置換増幅(multiple displacement amplification)(MDA)など(例えば、Hawkinsら,Curr.Opin.Biotech.,13:65−67(2002);Deanら,Genome Research,11:1095−1099(2001);Wangら,Nucleic Acids Research,32:e76(2004);Hosonoら,Genome Research,13:954−964(2003))により増幅されうる。
血液サンプルに特に関心が持たれ、それは、通常の技術(例えばInnisら編,PCR Protocols(Academic Press, 1990)など)を用いて得られうる。例えば、白血球は、通常の技術、例えばRosetteSepキット(Stem Cell Technologies,Vancouver,Canada)を用いて、血液サンプルから分離されうる。血液サンプルは100μL〜10mLの体積の範囲であることが可能であり、1つの態様においては、血液サンプルの体積は100μL〜2mLの範囲である。ついで、本発明の方法における使用のための通常の技術、例えばDNeasy Blood & Tissue Kit(Qiagen,Valencia,CA)を用いて、そのような血液サンプルからDNAおよび/またはRNAが抽出されうる。所望により、通常の技術、例えば蛍光標示式細胞分取(FACS)(Becton Dickinson,San Jose,CA)、磁気細胞分離(MACS)(Miltenyi Biotec,Auburn,CA)などを用いて、白血球のサブセット、例えばリンパ球が更に単離されうる。例えば、記憶B細胞は表面マーカーCD19およびCD27により単離されうる。
各個体の適応免疫細胞のDNAおよびそれらに伴うRNA転写産物には、特定に役立つ組換えが存在するため、提供する本発明の方法においてはRNAまたはDNAが配列決定されうる。T細胞受容体または免疫グロブリン分子をコードするT細胞またはB細胞からの組換え配列またはその一部はクロノタイプと称される。該DNAまたはRNAは、抗体をコードするT細胞受容体(TCR)遺伝子または免疫グロブリン(Ig)遺伝子からの配列に対応しうる。例えば、該DNAおよびRNAは、TCRのα、β、γまたはδ鎖をコードする配列に対応しうる。大多数のT細胞においては、TCRは、α鎖およびβ鎖からなるヘテロ二量体である。TCRα鎖はVJ組換えにより産生され、β鎖受容体はV(D)J組換えにより産生される。ヒトにおけるTCRβ鎖の場合、48個のVセグメント、2個のDセグメントおよび13個のJセグメントが存在する。2つの接合部のそれぞれにおいては、幾つかの塩基が欠失され、他の塩基が付加されうる(NおよびPヌクレオチドと称される)。少数のT細胞においては、TCRはγおよびδデルタ鎖からなる。TCRγ鎖はVJ組換えにより産生され、TCRδ鎖はV(D)J組換えにより産生される(Kenneth Murphy,Paul TraversおよびMark Walport,Janeway’s Immunology 7th edition,Garland Science,2007(その全体を参照により本明細書に組み入れることとする))。
本発明の方法において分析されるDNAおよびRNAは、定常領域(α、δ、ε、γまたはμ)を有する重鎖免疫グロブリン(IgH)、または定常領域λもしくはκを有する軽鎖免疫グロブリン(IgKまたはIgL)をコードする配列に対応しうる。各抗体は2本の同一軽鎖および2本の同一重鎖を有する。各鎖は定常(C)および可変領域から構成される。重鎖の場合、可変領域は可変(V)、多様性(D)および連結(J)セグメントから構成される。各タイプのこれらのセグメントをコードする幾つかの特徴的な配列がゲノム内に存在する。特異的VDJ組換え事象がB細胞の発生中に生じて、その細胞を特徴づけて、特異的重鎖を産生する。軽鎖における多様性も同様に生じるが、この場合は、D領域は存在せず、したがって、VJ組換えのみが生じる。体細胞突然変異が、しばしば、組換え部位の近傍で生じて、幾つかのヌクレオチドの付加または欠失を引き起こして、B細胞により産生された重鎖および軽鎖の多様性を更に増大させる。したがって、B細胞により産生された抗体の可能な多様性は異なる重鎖および軽鎖の産物である。重鎖および軽鎖の可変領域は、抗原認識(または結合)領域または部位を生成するように寄与する。特異的応答が何らかのエピトープに対して惹起された後に生じうる体細胞高頻度突然変異の過程がこの多様性に加えられる。
前記のとおり、本発明においては、プライマーは、リンパ球から抽出された組換え核酸のサブセットのアンプリコンを産生するように選択されうる。そのようなサブセットは本明細書においては「体細胞再編成領域」と称されうる。体細胞再編成領域は、発生中の又は完全に発生したリンパ球からの核酸を含むことが可能であり、ここで、発生中のリンパ球は、完全なV(D)J領域を有する分子を生成するようには免疫遺伝子の再編成が完了していない細胞である。典型的な不完全な体細胞再編成領域には、不完全なIgH分子(例えば、D−J領域のみを含有する分子)、不完全なTCRδ分子(例えば、D−J領域のみを含有する分子)および不活性IgK(例えば、Kde−V領域を含むもの)が含まれる。
「クロノタイプ」および「レパトワ」の定義において後記で更に詳細に説明するとおり、細胞の適切なサンプリングは、レパトワデータを解釈する重要な態様である。例えば、1,000細胞から開始すると、どのくらい多数の配列決定リードが得られるかには無関係に、該アッセイが感受性である最小頻度が得られる。したがって、本発明の1つの態様は、投入免疫受容体分子の数を定量するための方法の開発である。これはTCRβおよびIgH配列に関して実施されている。いずれの場合にも、種々の配列の全てを増幅しうるプライマーの同一セットを使用する。コピーの絶対数を得るために、多重プライマーを使用するリアルタイムPCRを、既知数の免疫受容体コピーを有する標準物と共に使用して行う。このリアルタイムPCR測定は、後に配列決定される増幅反応から実施可能であり、あるいは同じサンプルの別のアリコートで行われうる。DNAの場合には、再編成免疫受容体分子の絶対数は細胞数に容易に変換されうる(評価される特異的免疫受容体の、2個の再編成コピーを有する細胞もあれば、1個を有する細胞もあるため、2倍以内)。cDNAの場合には、リアルタイムサンプルにおける再編成分子の測定総数は、同じサンプルの別の増幅反応において用いられるこれらの分子の総数を定めるために外挿されうる。また、この方法は、cDNA合成の比効率を仮定して、単位量(例えば、1μg)のRNAにおける再編成免疫受容体分子の数を定めるために、RNAの総量を決定するための方法と組合されうる。cDNAの総量を測定する場合には、cDNA合成の効率を考慮する必要はない。細胞数も既知である場合には、細胞当たりの再編成免疫受容体コピーが計算されうる。細胞数が不明の場合には、全RNAからそれを推定することが可能である。なぜなら、特定のタイプの細胞は、通常、比較しうる量のRNAを産生するからである。したがって、1μg当たりの再編成免疫受容体分子のコピーから、細胞当たりのこれらの分子の数を推定することが可能である。
配列決定のために処理される反応とは別のリアルタイムPCRを行う1つの欠点は、リアルタイムPCRにおいてその他の反応とは異なる抑制効果が存在しうることである。なぜなら、異なる酵素、投入DNAおよび他の条件が利用されうるからである。配列決定のためのリアルタイムPCRの産物の処理はこの問題を改善するであろう。しかし、リアルタイムPCRを用いた場合の低いコピー数は、低いコピー数もしくは抑制効果、または該反応における他の最適でない条件によるものでありうる。
用いられうるもう1つのアプローチは、既知配列を有する既知量の特有の免疫受容体再編成分子(すなわち、既知量の1以上の内部標準)を不明量のサンプルからのcDNAまたはゲノムDNAに加えることである。該既知添加配列に関して得られた分子の相対数を、同じサンプルの配列の残りと比較して計数することにより、初期cDNAサンプルにおける再編成免疫受容体分子の数を推定することが可能である(分子計数のためのそのような技術はよく知られている;例えば、Brennerら,米国特許第7,537,897号(これを参照により本明細書に組み入れることとする))。前記の特有の添加配列の配列決定からのデータは、リアルタイムPCR較正も用いられている場合に、異なる可能性を区別するために用いられうる。DNA(またはcDNA)における再編成免疫受容体の低コピー数は、サンプル配列の残りと比較された添加配列の分子数の高い比を与えるであろう。一方、リアルタイムPCRによる測定された低コピー数が該反応における非効率によるものであれば、該比は高くないであろう。
核酸集団の増幅
核酸の標的集団のアンプリコンは種々の増幅技術により作製されうる。本発明の1つの態様においては、多重PCRを用いて、核酸の混合物、特に、組換え免疫分子、例えばT細胞受容体またはその一部を含む混合物の成分を増幅する。そのような免疫分子の多重PCRを行うための指針は以下の参考文献(それらを参照により本明細書に組み入れることとする)に見出される:Morley,米国特許第5,296,351号;Gorski,米国特許第5,837,447号;Dau,米国特許第6,087,096号;Von Dongenら,米国特許公開第2006/0234234号;欧州特許公開番号EP 1544308B1など。
ゲノムからのDNAの増幅(またはRNAを逆転写することによるcDNAの形態の核酸の増幅)の後、個々の核酸分子は単離され、所望により再増幅され、ついで個別に配列決定されうる。典型的な増幅法はvan Dongenら,Leukemia,17:2257−2317(2003)またはvan Dongenら,米国特許公開第2006/0234234号(これらを参照により本明細書に組み入れることとする)において見出されうる。簡潔に説明すると、典型的な方法は以下のとおりである:反応バッファー:ABI Buffer IIまたはABI Gold Buffer(Life Technologies,San Diego,CA);50μLの最終反応体積;100ngのサンプルDNA;10pmolの各プライマー(後記のとおりに増幅を釣り合わせるための調節に付される);最終濃度200μMのdNTP;最終濃度1.5mMのMgCl(標的配列およびポリメラーゼに応じた最適化に付される);Taqポリメラーゼ(1〜2U/チューブ);サイクリング条件:95℃で7分間の前活性化;60℃でのアニーリング;サイクリング時間:30秒間の変性;30秒間のアニーリング;30秒間の伸長。本発明の方法における増幅に使用されうるポリメラーゼは商業的に入手可能であり、例えば、Taqポリメラーゼ、AccuPrimeポリメラーゼまたはPfuを包含する。使用するポリメラーゼの選択は、忠実度が優先されるか効率が優先されるかに基づいて行われうる。
増幅可能物質の機能的量を判断するための初期工程においてリアルタイムPCR、ピコグリーン染色、ナノ流体電気泳動(例えば、LabChip)またはUV吸収測定が用いられうる。
1つの態様においては、出発集団における配列の相対量が増幅集団またはアンプリコンの場合と実質的に同じとなるように多重増幅を行う。すなわち、サンプル集団のメンバー配列間の最小増幅バイアスで多重増幅を行う。1つの実施形態においては、そのような相対量が実質的に同じと言えるのは、アンプリコンにおける各相対量が出発サンプルにおけるその値の5倍以内である場合である。もう1つの実施形態においては、そのような相対量が実質的に同じと言えるのは、アンプリコンにおける各相対量が出発サンプルにおけるその値の2倍以内である場合である。後記で更に詳細に記載されているとおり、任意のサンプルの非バイアス増幅をもたらす予め決定されたレパトワのためのPCRプライマーのセットが選択されうるように、通常の技術を用いて、PCRにおける増幅バイアスが検出され補正されうる。
TCRまたはBCR配列に基づく多数のレパトワに関しては、多重増幅は、所望により、Vセグメントの全てを使用する。該反応は、種々のVセグメントプライマーによる増幅される配列の相対存在量を維持する増幅を得るために最適化される。該プライマーの幾つかは関連しており、したがって、該プライマーの多くは「クロストーク(cross talk)」して、それと完全にはマッチ(合致)していない鋳型を増幅しうる。どのプライマーが各鋳型を増幅するかにかかわらず類似様態で各鋳型が増幅されるように、条件が最適化される。換言すれば、2つの鋳型が存在する場合、1,000倍の増幅の後、両方の鋳型は約1,000倍増幅されることが可能であり、それらの鋳型の一方に関して、増幅産物の半分がクロストークゆえに異なるプライマーを担持していることは問題でない。配列決定データの後続分析においては、プライマー配列は該分析から排除され、したがって、鋳型が同等に増幅される限り、増幅においてどのようなプライマーが使用されるのかは問題でない。
1つの実施形態においては、2工程増幅(前記で引用されているFahamおよびWillisにおいて記載されているとおり)を行うことにより増幅バイアスを回避することが可能であり、この場合、標的配列に対して非相補的な尾部を有するプライマーを使用する第1または一次段階において少数の増幅サイクルを行う。該尾部は、一次アンプリコンの配列の末端に付加されるプライマー結合部位を含み、そのような部位は、単一フォワードプライマーおよび単一リバースプライマーのみを使用する第2段階の増幅において使用され、それにより増幅バイアスの主要原因が排除される。幾つかの実施形態においては、一次PCRは、異なるプライマーによる増幅の相違を最小にするのに十分な程度に小さいサイクル数(例えば、5〜10)を有する。二次増幅は、1対のプライマーを使用して行い、これは増幅の相違を最小にする。幾つかの実施形態においては、小さな比率(例えば、1%)の一次PCRを二次PCRに直接使用する。幾つかの実施形態においては、第1段階〜第2段階に割り当てられる合計35サイクル(100倍希釈工程を伴わない〜28サイクルに匹敵する)は、通常、サイクルの分割が以下のとおり、すなわち、一次1サイクルおよび二次34サイクル、または一次25サイクルおよび二次10サイクルであるかどうかに無関係に、頑強(ロウバスト)な増幅を示すのに十分である。
簡潔に説明すると、IgHコード化またはTCRβコード化核酸(RNA)を増幅するためのFahamおよびWillis(前記で引用)の方法が図1A〜1Cに例示されている。不完全IgH再編成、IgK、Kde、IgL、TCRγ、TCRδ、Bcl1−IgH、Bcl2−IgHなどのような他の免疫受容体セグメントのために、類似した増幅方法が利用できる(例えば、Van Dongenら,Leukemia,17:2257−2317(2003))。核酸(1200)をサンプル中のリンパ球から抽出し、C領域(1203)に特異的なプライマー(1202)および免疫グロブリンまたはTCR遺伝子の種々のV領域(1206)に特異的なプライマー(1212)とPCRにおいて併用する。プライマー(1212)はそれぞれ、増幅の第2段階のためのプライマー結合部位を供与する同一尾部(1214)を有する。前記のとおり、プライマー(1202)はC領域(1203)とJ領域(1210)との間の接合部(1204)に隣接して配置される。該PCRにおいては、Cコード領域(1203)の部分、Jコード領域(1210)、Dコード領域(1208)およびVコード領域(1206)の部分を含有するアンプリコン(1216)が産生される。アンプリコン(1206)は、Illumina DNA配列決定装置における使用のために設計された尾部(それぞれ1225および1221/1223)をそれぞれ有するプライマーP5(1222)およびプライマーP7(1220)を使用する第2段階において更に増幅される。プライマーP7(1220)の尾部(1221/1223)は、所望により、配列決定プロセスにおける別のサンプルを標識するためのタグ(1221)を含んでいてもよい。第2段階の増幅は、Illumina DNA配列決定装置において使用されうるアンプリコン(1230)を産生する。
配列リードの作製
核酸を配列決定するための任意のハイスループット技術が本発明の方法において用いられうる。好ましくは、そのような技術は大量の配列データを費用効果的に作製する能力を有し、該配列データから少なくとも1000個のクロノタイプが決定可能であり、好ましくは、少なくとも10,000〜1,000,000個のクロノタイプが決定可能である。DNA配列決定技術には、標識ターミネーターまたはプライマーおよびスラブまたはキャピラリーにおけるゲル分離を用いる古典的なジデオキシ配列決定反応(サンガー法)、可逆的終結標識ヌクレオチドを使用する合成による配列決定、ピロシーケンス、454配列決定、標識オリゴヌクレオチドプローブのライブラリーに対する対立遺伝子特異的ハイブリダイゼーション、標識クローンのライブラリーに対する対立遺伝子特異的ハイブリダイゼーションおよびそれに続く連結を用いる合成による配列決定、重合工程中の標識ヌクレオチドの取り込みのリアルタイムモニタリング、ポローニ(polony)配列決定、ならびにSOLiD配列決定が含まれる。より最近になって、分離された分子の配列決定は、ポリメラーゼまたはリガーゼを使用する逐次的または単一伸長反応により、およびプローブのライブラリーでの単一または逐次的差次的ハイブリダイゼーションにより実証されている。これらの反応は多数のクローン配列上で並行して行われており、1億個を超える配列の現在の商業的並行適用における実証が含まれる。したがって、これらの配列決定アプローチは、T細胞受容体(TCR)および/またはB細胞受容体(BCR)のレパトワを研究するために用いられうる。本発明の1つの態様においては、個々の分子を固体表面上で空間的に単離し、該部位においてそれらを並行的に配列決定する工程を含むハイスループット配列決定法が用いられる。そのような固体表面は無孔表面(例えば、Solexa配列決定、例えば、Bentleyら,Nature,456:53−59(2008)またはComplete Genomics配列決定、例えば、Drmanacら,Science,327:78−81(2010))、ビーズまたは粒子結合鋳型を含みうるウェルのアレイ(例えば、454の場合、例えば、Marguliesら,Nature,437:376−380(2005)またはIon Torrent配列決定,米国特許公開第2010/0137143号もしくは第2010/0304982号)、微細加工膜(例えば、SMART配列決定の場合、例えば、Eidら,Science,323:133−138(2009))またはビーズアレイ(SOLiD配列決定またはポローニ(polony)配列決定、例えば、Kimら,Science,316:1481−1414(2007))を含みうる。もう1つの態様においては、そのような方法は、該単離分子を、それらが固体表面上で空間的に単離される前または後に増幅することを含む。前増幅は、エマルションに基づく増幅、例えば、エマルションPCR、またはローリングサークル増幅を含みうる。特に関心が持たれるのは、Solexa(ソレクサ)に基づく配列決定であり、この場合、個々の鋳型分子を固体表面上で空間的に単離し、ついでそれらを、別々のクローン集団またはクラスターを得るために架橋(bridge)PCRにより並行的に増幅し、ついで配列決定し、これは、Bentleyら(前記引用)および製造業者の説明書(例えば、TruSeq(商標)Sample Preparation Kit and Data Sheet,Illumina,Inc.,San Diego,CA,2010)ならびに更に以下の参考文献に記載されているとおりに行われる:米国特許第6,090,592号、第6,300,070号、第7,115,400号およびEP0972081B1(それらを参照により本明細書に組み入れることとする)。1つの実施形態においては、固体表面上に配置され増幅される個々の分子は少なくとも10クラスター/cmの密度または少なくとも5×10クラスター/cmの密度または少なくとも10クラスター/cmの密度でクラスターを形成する。1つの実施形態においては、比較的高いエラー率を有する配列決定の化学的手法が用いられる。そのような実施形態においては、そのような化学的手法により得られる平均質スコアは配列リード長の単調減少関数である。1つの実施形態においては、そのような減少は配列リードの0.5%に相当し、これは1〜75位に少なくとも1つのエラーを有し、配列リードの1%は76〜100位に少なくとも1つのエラーを有し、配列リードの2%は101〜125位に少なくとも1つのエラーを有する。
1つの態様においては、個体の、配列に基づくクロノタイププロファイルは、以下の工程を用いて得られる:(a)個体のT細胞および/またはB細胞から核酸サンプルを得、(b)そのような核酸サンプルから誘導された個々の分子を空間的に単離し(個々の分子、該サンプル中の核酸から生成した少なくとも1つの鋳型を含み、該鋳型は体細胞再編成領域またはその一部を含み、それぞれの個々の分子は少なくとも1つの配列リードを産生しうる)、(c)前記の空間的に単離された個々の分子を配列決定し、(d)該核酸サンプルからの核酸分子の種々の配列の存在量を決定して、クロノタイププロファイルを作製する。1つの実施形態においては、体細胞再編成領域のそれぞれはV領域およびJ領域を含む。もう1つの実施形態においては、配列決定の工程は、空間的に単離された個々の分子のそれぞれを双方向に配列決定して、少なくとも1つのフォワード(順方向)配列リードおよび少なくとも1つのリバース(逆方向)配列リードを得ることを含む。後者の実施形態に関しては、フォワード配列リードの少なくとも1つおよびリバース配列リードの少なくとも1つは重複領域を有していて、そのような重複領域の塩基はそのような配列リード間の逆相補関係により決定される。更にもう1つの実施形態においては、体細胞再編成領域のそれぞれはV領域およびJ領域を含み、配列決定の工程は、空間的に単離された個々の核酸分子のそれぞれの配列を、そのフォワード配列リードの1以上、およびJ領域内の或る位置から出発してその付随V領域の方向へ伸長する少なくとも1つのリバース配列リードから決定する。もう1つの実施形態においては、個々の分子は、完全IgH分子、不完全IgH分子、完全IgK分子、IgK不活性分子、TCRβ分子、TCRγ分子、完全TCRδ分子および不完全TCRδ分子からなる群から選択される核酸を含む。もう1つの実施形態においては、配列決定の工程は、単調減少する質スコアを有する配列リードを作製することを含む。後者の実施形態に関しては、単調減少する質スコアは、該配列リードがせいぜい以下のエラー率を有するようなものである:配列リードの0.2%が塩基の1〜50位に少なくとも1つのエラーを有し、配列リードの0.2〜1.0%が51〜75位に少なくとも1つのエラーを有し、配列リードの0.5〜1.5%が76〜100位に少なくとも1つのエラーを有する。もう1つの実施形態においては、前記方法は以下の工程を含む:(a)該個体のT細胞および/またはB細胞から核酸サンプルを得、(b)そのような核酸サンプルから誘導された個々の分子を空間的に単離し(個々の分子は、それぞれ該サンプル中の核酸から生成した鋳型のネスティッドセット(nested set)を含み、それぞれは体細胞再編成領域またはその一部を含み、各ネスティッドセットは、該ネスティッドセットを与えた核酸上の異なる位置からそれぞれが出発し同じ方向にそれぞれが伸長している複数の配列リードを産生しうる)、(c)前記の空間的に単離された個々の分子を配列決定し、(d)該核酸サンプルからの核酸分子の種々の配列の存在量を決定して、クロノタイププロファイルを作製する。1つの実施形態においては、配列決定の工程は、該ネスティッドセットのそれぞれに関して複数の配列リードを作製することを含む。もう1つの実施形態においては、体細胞再編成領域のそれぞれはV領域およびJ領域を含み、複数の配列リードのそれぞれはV領域内の異なる位置から出発し、その付随J領域の方向へ伸長する。
1つの態様においては、個体からの各サンプルに関して、本発明の方法において用いられる配列決定技術は1実施当たり少なくとも1000個のクロノタイプの配列を与え、もう1つの態様においては、そのような技術は1実施当たり少なくとも10,000個のクロノタイプの配列を与え、もう1つの態様においては、そのような技術は1実施当たり少なくとも100,000個のクロノタイプの配列を与え、もう1つの態様においては、そのような技術は1実施当たり少なくとも500,000個のクロノタイプの配列を与え、もう1つの態様においては、そのような技術は1実施当たり少なくとも1,000,000個のクロノタイプの配列を与える。更にもう1つの態様においては、そのような技術は個々のサンプル当たり1実施当たり100,000〜1,000,000個のクロノタイプの配列を与える。
提供する本発明の方法において用いられる配列決定技術はリード当たり約30bp、約40bp、約50bp、約60bp、約70bp、約80bp、約90bp、約100bp、約110bp、約120bp、約150bp、約200bp、約250bp、約300bp、約350bp、約400bp、約450bp、約500bp、約550bpまたは約600bpを与えうる。
配列データからのクロノタイプの作製
配列リード(sequence read;配列読取)データからのクロノタイプの構築はFahamおよびWillis(前記引用)(これを参照により本明細書に組み入れることとする)に開示されている。簡潔に説明すると、配列リードデータからのクロノタイプの構築は、部分的には、そのようなデータを得るために用いた配列決定方法に左右される。なぜなら、方法が異なれば、予想されるリード長およびデータの質も異なるからである。1つのアプローチにおいては、分析用の配列リードデータを得るためにSolexa(ソレクサ)配列決定装置を使用する。1つの実施形態においては、所望により行われうる増幅の後で鋳型分子(またはクラスター)の100万個以上の対応クローン集団を与えうる少なくとも100万個の鋳型分子を得るために少なくとも0.5〜1.0×10個のリンパ球を与えるサンプルを得る。Solexaアプローチを含むほとんどのハイスループット配列決定アプローチにおいては、配列決定の精度を増加させるために大きな多重度で各鋳型配列が決定されるように、そのようなクラスターレベルでのオーバーサンプリングが望ましい。Solexaに基づく実施の場合、好ましくは、それぞれの独立した鋳型の配列を10回以上決定する。異なる予想リード長およびデータ品質を有する他の配列決定アプローチにおいては、比較しうる配列決定精度のために、異なるレベルの多重度が用いられうる。当業者は、前記パラメータ、例えばサンプルサイズ、多重度などは、個々の用途に関連した設計選択物であると認識している。
1つの態様においては、IgH鎖またはTCRβ鎖(図2Aに例示されている)のクロノタイプは、C領域において出発し付随V領域の方向に伸長する少なくとも1つの配列リード(本明細書においては「Cリード」(2304)と称される)、およびV領域において出発し付随J領域の方向に伸長する少なくとも1つの配列リード(本明細書においては「Vリード」(2306)と称される)により決定される。そのようなリードは重複領域(2308)を有していても有していなくてもよく、そのような重複は、図2Aに示されているNDN領域(2315)を含んでいても含んでいなくてもよい。重複領域(2308)は全体がJ領域内に存在することが可能であり、全体がNDN領域内に存在することが可能であり、全体がV領域内に存在することが可能であり、あるいはそれはJ領域−NDN領域境界またはV領域−NDN領域境界またはそのような両方の境界を含む(図2Aに例示されているとおり)ことが可能である。典型的には、そのような配列リードは、合成−配列決定(sequencing−by−synthesis)反応においてポリメラーゼを使用して、配列決定プライマー、例えば図2Aにおける(2302)および(2310)を伸長させることにより得られる(例えば、Metzger,Nature Reviews Genetics,11:31−46(2010);Fullerら,Nature Biotechnology,27:1013−1023(2009))。プライマー(2302)および(2310)の結合部位は、それらが配列リードの初期アライメントおよび分析のための出発点または固着点を与えうるように、予め決定されている。1つの実施形態においては、Cリードは、それがIgH鎖のDおよび/またはNDN領域を含み隣接V領域の一部を含むように位置する(例えば、図2Aおよび2Bに例示されているとおり)。1つの態様においては、V領域内のCリードおよびVリードの重複を用いて該リードを互いにアライメント(整列)させる。他の実施形態においては、配列リードのそのようなアライメントは必ずしも必要ではなく、Vリードは、クロノタイプの個々のV領域を特定するのに十分な長さのみを有することが可能である。この後者の態様は図2Bに例示されている。配列リード(2330)は、もう1つの配列リードとの重複を伴って又は伴わないで、V領域を特定するために使用され、もう1つの配列リード(2332)はNDN領域を横切り、その配列を決定するために使用される。V領域内に伸長する配列リード(2332)の一部(2334)は、クロノタイプを決定するために、配列リード(2332)の配列情報を配列リード(2330)の配列情報と関連づけるために使用される。幾つかの配列決定方法、例えば、Solexa配列決定法のような塩基ごとのアプローチの場合、配列決定実施時間および試薬の費用は、分析における配列決定サイクルの数を最小にすることにより減少する。所望により、図2Aに例示されているとおり、アンプリコン(2300)は、異なる生物学的サンプル(例えば、異なる患者)に由来するクロノタイプを識別するためのサンプルタグ(2312)を伴って産生される。サンプルタグ(2312)は、プライマーをプライマー結合領域(2316)アニーリングさせ、それを伸長させて(2314)、タグ(2312)にわたる配列リードを得ることにより特定可能であり、該配列リードからサンプルタグ(2312)が解読されうる。
本発明の1つの態様においては、クロノタイプの配列は、例えば、選択された鎖のV(D)J領域に沿った1以上の配列リードからの情報を組合せることにより決定されうる。もう1つの態様においては、クロノタイプの配列は、複数の配列リードからの情報を組合せることにより決定される。そのような複数の配列リードは、センス鎖に沿った1以上の配列リード(すなわち、「フォワード」配列リード)、および対応相補鎖に沿った1以上の配列リード(すなわち、「リバース」配列リード)を含みうる。同じ鎖に沿った複数の配列リードを得る場合、まず、配列リードの種々の位置に関して選択されたプライマーでサンプル分子を増幅することにより別々の鋳型を得る。この概念は図3Aに例示されており、この場合、プライマー(3404、3406および3408)を使用して、単一反応においてアンプリコン(それぞれ3410、3412および3414)を得る。そのような増幅は同じ反応または別々の反応において行われうる。1つの態様においては、PCRを用いる場合はいつでも、別々の増幅反応を用いて別々の鋳型を得、そしてこれらを組合せ、使用して、同じ鎖に沿った複数の配列リードを得る。複数の鋳型の同等増幅(本明細書においては「バランス増幅」または「非バイアス増幅」と称されることもある)を保証するためにプライマー濃度(および/または他の反応パラメータ)を釣り合わせる必要性を回避するためには、この後者のアプローチが好ましい。別々の反応における鋳型の作製は図3B〜3Cに例示されている。それにおいては、IgH(3400)を含有するサンプルを3つの部分(3470、3472および3474)に分割し、それらを、J領域プライマー(3401)およびV領域プライマー(それぞれ3404、3406および3408)を使用する別々のPCRに加えて、アンプリコン(それぞれ3420、3422および3424)を得る。ついで後者のアンプリコンを、P5およびP7プライマーを使用する二次PCR(3480)において組合せて(3478)、架橋PCRおよびIllumina GA配列決定装置などの装置における配列決定のための鋳型(3482)を得る。
本発明の配列リードは、1つには用いられる配列決定技術に応じて、多種多様な長さを有しうる。例えば、幾つかの技術の場合には、その実施において、例えば、(i)鋳型当たりの配列リードの数および長さ、ならびに(ii)配列決定操作のコストおよび持続時間において、幾つかの妥協がなされうる。1つの実施形態においては、配列リードは20〜200ヌクレオチドの範囲であり、もう1つの実施形態においては、配列リードは30〜200ヌクレオチドの範囲であり、更にもう1つの実施形態においては、配列リードは30〜120ヌクレオチドの範囲である。1つの実施形態においては、各クロノタイプの配列を決定するために1〜4個の配列リードを得、もう1つの実施形態においては、各クロノタイプの配列を決定するために2〜4個の配列リードを得、もう1つの実施形態においては、各クロノタイプの配列を決定するために2〜3個の配列リードを得る。幾つかの実施形態においては、各クロノタイプを作製するために複数の配列リードを使用し、幾つかの実施形態においては、クロノタイプを作製するために使用する複数の配列リードは少なくとも10個であり、他の実施形態においては、クロノタイプを作製するために使用する複数の配列リードは少なくとも20個である。幾つかの実施形態においては、クロノタイプを作製するために使用する複数の配列リードは、少なくとも99%の信頼性レベルで、異なるクロノタイプが異なると判定するために要求される数であり、他の実施形態においては、クロノタイプを作製するために使用する複数の配列リードは、少なくとも99.9%の信頼性レベルで、異なるクロノタイプが異なると判定するために要求される数である。後記のとおり、配列および/または増幅エラー率、配列リード頻度、配列相違などを考慮した方法(後記開示において例示されているとおり)に従い配列リードを組合せる(一緒にする)工程(または本明細書においては、合体させる工程と称されることもある)により、配列リードからクロノタイプが作製されうる。前記実施形態においては、示されている数は、異なる個体からのサンプルを特定するために使用される配列リードを除いたものである。また、後記実施形態において使用される種々の配列リードの長さは、該リードにより得られることが求められる情報に基づいて変動しうる。例えば、配列リードの出発位置および長さは、NDN領域およびそのヌクレオチド配列の長さが得られるように設計可能であり、したがって、NDN領域全体にわたる配列リードが選択される。他の態様においては、Dおよび/またはNDN領域を(別々にではなく)組合されて含む1以上の配列リードで十分である。
本発明のもう1つの態様においては、クロノタイプの配列は、部分的には、配列リードを1以上のV領域参照配列および1以上のJ領域参照配列とアライメント(整列)させることにより、そして部分的には、例えば高可変NDN領域の場合のように参照配列に対するアライメントを伴わない塩基決定により決定される。種々のアライメントアルゴリズムが配列リードおよび参照配列に適用されうる。例えば、アライメント法を選択するための指針はBatzoglou,Briefings in Bioinformatics,6:6−22(2005)(これを参照により本明細書に組み入れることとする)において得られうる。1つの態様においては、VリードまたはCリード(前記のとおり)をVおよびJ領域参照配列に対してアライメントさせ、例えば、Gusfield(前記引用)およびCormenら,Introduction to Algorithms,Third Edition(The MIT Press,2009)に一般的に記載されているとおりに、木検索アルゴリズムを使用する。
配列リードからのIgHクロノタイプの構築は、以下の少なくとも2つの要因により特徴づけられる:i)アライメントをより困難にする体細胞突然変異の存在、およびii)Vセグメントの一部をCリードに位置づけることがしばしば不可能となるほどにNDN領域がより大きい。本発明の1つの態様においては、この問題は、V領域に沿った種々の位置に位置するVリードを得るための複数のプライマーセットを使用することにより克服され、好ましくは、該プライマー結合部位は非重複性であり、隔てられて配置され、少なくとも1つのプライマー結合部位はNDN領域に隣接しており、例えば、1つの実施形態においてはV−NDN接合部から5〜50塩基、あるいはもう1つの実施形態においてはV−NDN接合部から10〜50塩基の位置に位置する。複数のプライマーセットの多重性は、体細胞突然変異により影響を受けた結合部位を1個または2個のプライマーが有さないためにクロノタイプを検出できないというリスクを最小にする。また、NDN領域に隣接した少なくとも1つの結合部位の存在は、VリードがCリードと重複してCリードの長さを有効に伸長させる可能性を高くする。これは、NDN領域の全サイズにわたりNDN領域の両側の実質的に全VおよびJ領域をも位置づけうる連続配列の生成を可能にする。そのような方法を実施するための実施形態を図3Aおよび3Dに例示する。図3Aにおいては、V領域(3402)の連続的に長くなる部分(3411、3413、3415)を含む異なる長さを有し同じNDN領域を全てが含む複数のネスティッドアンプリコン(例えば、3410、3412、3414)を得るために、単一セットのJ領域プライマー(3401)および複数(3つが示されている)セットのV領域(3402)プライマー(3404、3406、3408)で鎖を増幅することにより各鎖に関する複数のアンプリコンを得ることにより、IgH鎖(3400)を含むサンプルを配列決定する。ネスティッドセットのメンバーは、それらのそれぞれのNDN、Jおよび/またはC領域の同一性(または実質的な同一性)に注目することにより配列決定後に一緒に分類されることが可能であり、それにより、限られたリード長および/または配列品質を有する配列決定法に関してそうでない場合より長いV(D)Jセグメントの再構築を可能にする。1つの実施形態においては、プライマーセットの個数は2〜5個の範囲でありうる。もう1つの実施形態においては、該個数は2〜3個であり、更にもう1つの実施形態においては、該個数は3個である。複数のプライマーの濃度および位置は大きく変動しうる。それらのV領域プライマーの濃度は同じであっても同じでなくてもよい。1つの実施形態においては、NDN領域に最も近いプライマーは該複数個のその他のプライマーより高い濃度を有していて、例えば、NDN領域を含有するアンプリコンが、生じるアンプリコンにおいて表現されることを保証する。3個のプライマーを使用する特定の実施形態においては、60:20:20の濃度比を用いる。J領域プライマー(3432)により産生された配列リード(3442)と重複する1以上の配列リード(例えば、3434および3436)を産生させ、それにより、重複領域(3440)における塩基コール(base call;塩基呼出)の質を改善するために、NDN領域(3444)に隣接する1以上のプライマー(例えば、図3Dにおける3435および3437)が使用されうる。複数のプライマーからの配列リードは隣接下流プライマー結合部位および/または隣接下流配列リードと重複しても重複しなくてもよい。1つの実施形態においては、NDN領域に近い配列リード(例えば、3436および3438)は、該クロノタイプに関連した個々のV領域を特定するために使用されうる。そのような複数のプライマーは、免疫グロブリン発生中にプライマー結合部位の1つが超突然変異している場合の不完全または無効な増幅の可能性を減少させる。それはまた、V領域の超突然変異により導入された多様性がクロノタイプ配列内に獲得される可能性を増加させる。例えば、例示されているとおりのP5(3401)およびP7(3404、3406、3408)プライマーで増幅してアンプリコン(3420、3422および3424)を得ることにより、配列決定のためのネスティッドアンプリコンを得るために、二次PCRを行うことが可能であり、該アンプリコンは固体表面上に単一分子として分布することが可能であり、その部位においてそれらは架橋PCRなどの技術により更に増幅される。
体細胞超突然変異。1つの実施形態においては、体細胞超突然変異を受けた、IgHに基づくクロノタイプを、以下のとおりに決定する。体細胞突然変異は、(関連セグメント、通常はV、JまたはCの)参照配列の対応塩基とは異なる、統計的に有意な数のリードに存在する配列決定塩基と定義される。1つの実施形態においては、Cリードは、位置づけられたJセグメントに関する体細胞突然変異を見出すために、そして同様にVリードはVセグメントに関して使用されうる。JまたはVセグメントに直接的に位置づけられた、あるいはNDN境界までのクロノタイプ伸長の内部に存在するCおよびVリードの一部分のみが使用される。このようにして、NDN領域が回避され、(実際には僅かに異なっている組換えNDN領域であるヌクレオチドを突然変異として誤って分類することを回避するために)クロノタイプ決定のために既に用いられたのと同じ「配列情報」は、突然変異を見出すためには使用されない。各セグメントのタイプに関して、位置づけられたセグメント(主要対立遺伝子)がスカフォールド(骨格)として使用され、リードの位置づけ(マッピング)の段階中にこの対立遺伝子に位置づけられた全てのリードが考慮される。少なくとも1つのリードが位置づけられた参照配列の各位置を体細胞突然変異に関して分析する。1つの実施形態においては、非参照塩基を妥当な突然変異として受け入れる基準は以下のものを含む:1)与えられた突然変異塩基を有する少なくともNリード、2)少なくとも与えられた一部のN/Mリード(ここで、Mは、この塩基位置における、位置づけられたリードの総数である)、および3)非突然変異塩基を有するリードの数(N−M)、突然変異塩基におけるNリードの平均Qスコアおよび二項分布に基づく統計的カット。好ましくは、前記パラメータは、クロノタイプ当たりの突然変異の偽発見率が1/1000未満、より好ましくは1/10000となるように選択される。
PCRエラーは、PCRの初期サイクルにおいて突然変異した幾つかの塩基に集中すると予想される。配列決定エラーは多数の塩基に分布すると予想され、たとえそれが完全にランダムであったとしてもそうである。なぜなら、該エラーは何らかの系統的バイアスを有する可能性が高いからである。幾つかの塩基は、より高い率、例えば5%(平均の5%)の配列決定エラーを有すると仮定される。これらの仮定を考慮すると、配列決定エラーが主要エラー型となる。PCRエラーを高関連性クロノタイプの存在から区別することは分析において何らかの役割を果たすであろう。2以上の高関連性クロノタイプが存在することを決定することの生物学的重要性を考慮して、そのようなコールを行うための保存的アプローチが採用される。1個を超えるクロノタイプが存在することが高い信頼性(例えば、99.9%)で保証されるように、非主要クロノタイプの十分な検出が考慮される。100コピー/1,000,000で存在するクロノタイプの例では、非主要変異体は、それが独立クロノタイプと称されるためには、14倍以上検出される。同様に、1,000コピー/1,000,000で存在するクロノタイプでは、非主要変異体は、独立クロノタイプと称されるためには、74倍以上検出されうる。このアルゴリズムは、各配列決定塩基で得られる塩基品質スコア(base quality score)を使用することにより増強されうる。品質スコアとエラー率との間の関係が前記で実証されれば、全塩基に関する保存的な5%のエラー率を用いる代わりに、独立クロノタイプと呼ぶために存在することが必要とされるリードの数を決定するために品質スコアが用いられうる。該リードの全てにおける特定の塩基のメジアン品質スコアを用いることが可能であり、あるいはより厳格には、各リードにおける特定の塩基の品質スコアが与えられれば、エラーである可能性が算出可能であり、ついで、その塩基に関する配列決定エラーの考えられうる数を推定するために、(独立を仮定すると)該確率が組合されうる。結果として、異なる品質スコアを有する異なる塩基に関する配列エラー仮説を棄却する異なる閾値が存在する。例えば、1,000コピー/1,000,000で存在するクロノタイプの場合、非主要変異体が独立性だと言えるのは、エラーの確率が0.01および0.05であれば、それがそれぞれ22および74倍で検出される場合である。
配列決定エラーの存在下、各真正クロノタイプは、配列に関して種々の数のエラーを有するリードの「クラウド(cloud)」により包囲される。配列決定エラーの「クラウド」は、配列空間におけるクロノタイプからの距離が増加するにつれて、密度において減少する。配列リードをクロノタイプに変換するためには種々のアルゴリズムが利用可能である。1つの態様においては、配列リードの合体(すなわち、1以上の配列決定エラーを有すると決定された候補クロノタイプの併合)は以下の少なくとも3つの要因に左右される:比較されるクロノタイプのそれぞれに関して得られた配列の数、それらが異なる塩基の数、およびそれらが合致しない位置における配列決定品質スコア。予想エラー率およびエラーの二項分布に基づく尤度比が得られ、評価されうる。例えば、1つは150個のリードを有し、もう1つは2個のリードを有し、それらの間に不良な配列決定の質の領域における1つの相違が存在する、2つのクロノタイプは、それらは配列決定エラーにより生じる可能性が高いため、合体される可能性が高いであろう。一方、1つは100個のリードを有し、もう1つは50個のリードを有し、それらの間に2つの相違が存在する、2つのクロノタイプは、合体されない。なぜなら、それらは配列決定エラーによっては生じそうにないとみなされるからである。本発明の1つの実施形態においては、配列リードからクロノタイプを決定するために後記アルゴリズムが使用されうる。本発明の1つの実施形態においては、配列リードを、まず、候補クロノタイプに変換する。そのような変換は、用いる配列決定法に左右される。高いQスコアの長い配列リードを与える方法の場合、配列リードまたはその一部は候補クロノタイプとして直接的に採用されうる。より低いQスコアのより短い配列リードを与える方法の場合、関連配列リードの組合せを候補クロノタイプに変換するために幾つかのアライメントおよび構築(アセンブリー)工程が要求されうる。例えば、Solexaに基づく方法の場合、幾つかの実施形態においては、前記のとおりの複数(例えば、10個以上)のクラスターからのペアになったリードの集団から候補クロノタイプを得る。
各候補クロノタイプを包囲する配列リードのクラウドは、二項分布、および単一塩基エラーの確率に関する単純モデルを用いてモデル化されうる。この後者のエラーモデルは、VおよびJセグメントを位置づけること、または自己整合性および収束によるクロノタイプ発見アルゴリズム自体から推論されうる。Xが配列空間のこの領域における唯一の真のクロノタイプであるという帰無(ヌル)モデル下、リードカウントC2およびEエラー(配列Xに関するもの)を有する与えられた「クラウド」配列Yが、完全なリードカウントC1を有する真のクロノタイプ配列Xの一部である確率に関して、モデルを構築する。パラメータC1、C2およびEに従い配列YをクロノタイプXに合体させるべきか否かの判断がなされる。任意の与えられたC1およびEに関して、配列Yを合体させることを決定するために最大値C2を予備計算する。YがクロノタイプXの一部であるという帰無仮説下でYを合体させない確率が、配列Xの近傍におけるエラーEを有する全ての可能な配列Yにわたって積分した後で或る値Pより小さくなるように、C2の最大値が選択される。値Pは該アルゴリズムの挙動を制御し、該合体を多少なりとも許容性にする。
配列Yが、そのリードカウントがクロノタイプXとの合体に関する閾値C2を超えるため、クロノタイプXに合体されない場合、それは、別のクロノタイプをシード化(seed;播種)するための候補となる。そのような原理を実行するアルゴリズムは、この配列Y(これはXから独立していると既にみなされている)に「より接近している」任意の他の配列Y2、Y3などがXに合体されないことを保証する。「接近性」のこの概念はYおよびXに関するエラーカウントならびにXおよびYの絶対的リードカウントの両方を含む。すなわち、それは、クロノタイプXの周囲のエラー配列のクラウドに関する前記モデルと同様にモデル化される。このように、「クラウド」配列は、それらが偶然に2以上のクロノタイプに「接近して」存在していれば、それらの正しいクロノタイプに適切に帰属されうる。
1つの実施形態においては、アルゴリズムは、最高リードカウントを有する配列Xから出発することによりトップダウン式に進行する。この配列は第1クロノタイプをシード化する。近傍配列は、それらのカウントが予備計算閾値(前記を参照されたい)より低い場合にはこのクロノタイプに合体され、あるいはそれらが該閾値より大きい、または合体されなかった別の配列に「より接近している」場合には、そのままにされる。最高エラーカウント内の全ての近傍配列を検索した後、リードをクロノタイプXに合体させる過程を終了する。そのリード、およびそれに合体された全リードが明らかにされ、他のクロノタイプを得るために利用可能なリードのリストから除去される。ついで、最高リードカウントを有する次の配列に移る。前記のとおりに近傍リードをこのクロノタイプに合体させ、与えられた閾値を超えるリードカウントを有する配列がそれ以上存在しなくなるまで、例えば、1を超えるカウントを有する全ての配列がクロノタイプのシードとして使い果たされるまで、この過程を継続する。
前記のとおり、前記アルゴリズムのもう1つの実施形態においては、関連配列リードの品質スコアを考慮して候補配列Yを既存クロノタイプXに合体させるべきかどうかを決定するためのもう1つの試験を加えることが可能である。平均品質スコアは配列Yに関して決定される(配列Yを有する全リードにわたって平均される)(配列YおよびXは異なる)。平均スコアが所定値を超える場合には、合体されるべきでない真に異なるクロノタイプを該相違が示す可能性がより高く、平均スコアがそのような所定値より低い場合には、配列Yが配列決定エラーにより生じ、したがってXに合体されるべきである可能性がより高い。
関連クロノタイプ
しばしば、リンパ球は関連クロノタイプを産生する。すなわち、類似した配列を有するクロノタイプを産生する複数のリンパ球が存在または発生しうる。これは、IgH分子の場合の超突然変異のような種々のメカニズムによるものでありうる。もう1つの例としては、リンパ系新生物のような癌においては、単一リンパ球前駆体は多数の関連リンパ球後代を与えることが可能であり、それらのそれぞれは、塩基置換、異常再編成などのような癌関連体細胞突然変異ゆえに、若干異なるTCRまたはBCR、したがって異なるクロノタイプを有し、および/または発現する。一群のそのような関連クロノタイプは本明細書においては「クラン(clan)」と称される。幾つかの場合、クランのクロノタイプは別のクランのメンバーの突然変異から生じうる。そのような「後代」クロノタイプは系統学的クロノタイプと称されうる。クラン内のクロノタイプは親クロノタイプまたはお互いに対する関連性の1以上の尺度により特定されうる。1つの実施形態においては、後記で更に詳細に記載されているとおり、クロノタイプは相同性(%)により同一クランに分類されうる。もう1つの実施形態においては、クロノタイプはV領域、J領域および/またはNDN領域の共通の利用頻度によりクランに帰属されうる。例えば、クランは、共通のJおよびND領域を有するが異なるJ領域を有するクロノタイプにより定義されうる。あるいはそれは、(同じ塩基置換突然変異を含む)同じVおよびJ領域を有するが異なるNDN領域を有するクロノタイプにより定義されうる。あるいはそれは、クランメンバーを生成するように1〜10個の塩基または1〜5個の塩基または1〜3個の塩基の1以上の挿入および/または欠失を受けたクロノタイプにより定義されうる。もう1つの実施形態においては、クランのメンバーは以下のとおりに決定される。
クロノタイプが同一クランに帰属されるのは、それらが以下の基準を満たす場合である:i)それらは同じVおよびJ参照セグメントに位置づけられ、該位置づけは該クロノタイプ配列内の同一相対位置において生じる;ならびにii)それらのNDN領域は実質的に同一である。クランのメンバーであること(メンバーシップ)に関する「実質的」は、NDN領域内で体細胞突然変異が生じた可能性があるため、NDN領域内の幾つかの小さな相違が許容されることを意味する。好ましくは、1つの実施形態においては、NDN領域内の突然変異を誤って認定(コール)することを避けるために、塩基置換が癌関連突然変異として受け入れられるかどうかはクランのNDN領域のサイズに直接的に左右される。例えば、ある方法がクロノタイプをクランメンバーとして受け入れうるのは、それが癌関連突然変異としてのクランNDN配列との1塩基の相違を有し、クランNDN配列の長さがmヌクレオチド以上、例えば9ヌクレオチド以上である場合であり、そうでない場合には、それは受け入れられず、あるいはそれが癌関連突然変異としてのクランNDNとの2塩基の相違を有し、クランNDN配列の長さがnヌクレオチド以上、例えば20ヌクレオチド以上である場合であり、そうでない場合には、それは受け入れられない。もう1つの実施形態においては、クランのメンバーは、以下の基準を用いて決定される:(a)Vリードは同じV領域に位置づけられる、(b)Cリードは同じJ領域に位置づけられる、(c)実質的に同一のNDN領域(前記のとおり)、ならびに(d)V−NDN境界とJ−NDN境界との間のNDN領域の位置は同じである(あるいは同等に、Dへの下流塩基付加の数およびDへの上流塩基付加の数は同じである)。単一サンプルのクロノタイプを幾つかのクランに分類することが可能であり、種々の時点で得られた連続的サンプルからのクランを互いに比較することが可能である。特に、本発明の1つの態様においては、リンパ系新生物のような疾患と相関するクロノタイプを含有するクランを各サンプルのクロノタイプから特定し、直前のサンプルのものと比較して、例えば連続的寛解、初期再発、更なるクローン進化の証拠などのような病態を決定する。クランに関して本明細書中で用いる「サイズ」は該クランにおけるクロノタイプの数を意味する。
前記のとおり、1つの態様においては、本発明の方法は個々のクロノタイプではなくクロノタイプのクランのレベルをモニタリングする。これはクローン進化の現象に基づくものである(例えば、Campbellら,Proc.Natl.Acad.Sci.,105:13081−13086(2008);Gerlingerら,Br.J.Cancer,103:1139−1143(2010))。診断サンプル中に存在するクローンの配列は後のサンプル(例えば、疾患の再発時に採取されたサンプル)におけるものと全く同じままではないかもしれない。したがって、該診断サンプル配列に一致する厳密なクロノタイプ配列に従っている場合、再発の検出に失敗する可能性があるであろう。そのような進化クローンは配列決定により容易に検出され、特定される。例えば、該進化クローンの多くはV領域置換(VH置換と称される)により生じる。これらのタイプの進化クローンはリアルタイムPCR技術によっては見逃される。なぜなら、誤ったVセグメントをプライマーが標的化するからである。しかし、D−J接合部が進化クローンにおいて無傷なままであると仮定すると、個々の空間的に分離した分子の配列決定を用いる本発明においては、それは検出され特定されうる。更に、診断サンプルにおけるかなりの頻度でのこれらの関連クロノタイプの存在はクロノタイプの関連性の可能性を増大させる。同様に、免疫受容体配列における体細胞超突然変異の発生はリアルタイムPCRプローブ検出を妨げうるが、配列決定読出しに適用される適当なアルゴリズム(前記で開示されているとおり)はクロノタイプを進化クロノタイプとして尚も認識しうる。例えば、VまたはJセグメントにおける体細胞超突然変異が認識されうる。これは、最も近い生殖系列VおよびJ配列にクロノタイプを位置づけることにより行われる。生殖系列配列との相違は体細胞超突然変異に起因すると考えられうる。したがって、VまたはJセグメントにおける体細胞超突然変異を経て進化するクロノタイプは容易に検出され特定されうる。NDN領域における体細胞超突然変異は予測されうる。残りのDセグメントが、認識され位置づけられるのに十分に長い場合、それにおける任意の体細胞突然変異が容易に認識されうる。N+P塩基(または位置づけ不可能なDセグメント)における体細胞超突然変異は確実には認識され得ない。なぜなら、これらの配列は、癌性クロノタイプの後代ではない可能性のある新たに組換えられた細胞において修飾されうるからである。しかし、体細胞突然変異によるものであるという高い可能性を有する塩基変化を特定するためのアルゴリズムが容易に構築される。例えば、同じVおよびJセグメントを有し、元のクローンとのNDN領域内の1塩基の相違を有するクロノタイプは、体細胞組換えの結果であるという高い可能性を有する。VおよびJセグメントに他の体細胞超突然変異が存在すれば、この可能性は増大されうる。なぜなら、これは、体細胞超突然変異の対象物であるものとして、この特定のクロノタイプを特定するからである。したがって、元のクロノタイプからの体細胞超突然変異の結果であるというクロノタイプの可能性は、幾つかのパラメータ、すなわち、NDN領域内の相違の数、NDN領域の長さ並びにVおよび/またはJセグメントにおける他の体細胞超突然変異の存在を用いて計算されうる。
クローン進化データは有益でありうる。例えば、主要クローンが進化クローン(これまでに存在せず、したがってこれまでに記録されていないもの)である場合、これは、潜在的な選択上の利点を伴う新たな遺伝的変化を腫瘍が獲得したという指標である。これは、免疫細胞受容体における特異的変化が該選択的利点の原因であるということではなく、それらがそれに関するマーカーに相当しうるということである。進化したクロノタイプを有する腫瘍は差次的予後に潜在的に関連づけられうる。本発明の1つの態様においては、リンパ系新生物、例えば白血病のような疾患の患者特異的バイオマーカーとして用いられるクロノタイプは、モニタリングされるクロノタイプの体細胞突然変異体であるこれまでに記録されていないクロノタイプを含む。もう1つの態様においては、任意のこれまでに記録されていないクロノタイプが、患者特異的バイオマーカーとして働く既存クロノタイプまたはクロノタイプ群に対して少なくとも90%相同である場合はいつでも、そのような相同クロノタイプは、前に進めてモニタリングされるクロノタイプと共に又は該クロノタイプの群に含まれる。すなわち、1以上の患者特異的クロノタイプがリンパ系新生物において特定され、(例えば、それほど侵襲的でない方法で得られた血液サンプルに関する測定を行うことにより)該疾患を定期的にモニタリングするために使用される場合、および1つのそのような測定の経過中に、現在のセット(集合)のクロノタイプの体細胞突然変異である新たな(これまでに記録されていない)クロノタイプが検出された場合には、それは、後続の測定のためにモニタリングされる患者特異的クロノタイプのセットに加えられる。1つの実施形態においては、そのようなこれまでに記録されていないクロノタイプが現在のセットのメンバーに対して少なくとも90%相同である場合には、それは、患者に対して行われる次の試験のためのクロノタイプバイオマーカーの患者特異的セットに加えられ、すなわち、そのようなこれまでに記録されていないクロノタイプは、(クロノタイプデータの前記分析に基づいて)それが由来するクロノタイプの現在のセットのメンバーのクランに含まれる。もう1つの実施形態においては、これまでに記録されていないクロノタイプが現在のセットのメンバーに対して少なくとも95%相同である場合に、そのような包含が行われる。もう1つの実施形態においては、これまでに記録されていないクロノタイプが現在のセットのメンバーに対して少なくとも98%相同である場合に、そのような包含が行われる。
NDN領域を置換するが、VおよびJセグメントをそれらの蓄積した突然変異と共に維持する過程を経て、細胞は進化する可能性もある。そのような細胞は、共通のVおよびJセグメントの特定により、これまでに記録されていない癌クロノタイプとして特定されうる。ただし、それらは、独立して誘導されるこれらの突然変異の可能性を小さくするのに十分な数の突然変異を含有するものである。もう1つの制約としては、NDN領域が、これまでに配列決定されたクローンに類似したサイズのものであることが挙げられうる。
本発明は幾つかの特定の例示実施形態に関して記載されているが、本発明の精神および範囲から逸脱することなく、それに対して多数の変更が施されうる、と当業者は認識するであろう。本発明は、前記のものに加えて種々のセンサー装置および他の目的物に適用可能である。
定義
本明細書中に特に示されていない限り、本明細書中で用いられている核酸化学、生化学、遺伝学および分子生物学の用語および記号は、当分野における標準的な論文および教科書[例えば、KornbergおよびBaker,DNA Replication,Second Edition(W.H.Freeman,New York,1992);Lehninger,Biochemistry,Second Edition(Worth Publishers,New York,1975);StrachanおよびRead,Human Molecular Genetics,Second Edition(Wiley−Liss,New York,1999);Abbasら,Cellular and Molecular Immunology,6th edition(Saunders,2007)]のものに準拠している。
「アライメント」は、何らかの配列距離尺度に基づいてどの参照配列または参照配列のどの部分が最も近いかを決定するために、例えば配列リードのような試験配列を1以上の参照配列と比較する方法を意味する。ヌクレオチド配列のアライメントの典型的な方法はスミス・ウォーターマン(Smith Waterman)アルゴリズムである。距離尺度はハミング(Hamming)距離、レベンシュタイン(Levenshtein)距離などを含む。距離尺度は、比較される配列のヌクレオチドの品質値に関連した成分を含みうる。
「アンプリコン」はポリヌクレオチド増幅反応の産物、すなわち、ポリヌクレオチドのクローン集団を意味し、それは一本鎖または二本鎖であることが可能であり、1以上の出発配列から複製される。1以上の出発配列は同一配列のコピーの1以上であることが可能であり、あるいはそれらは種々の配列の混合物でありうる。好ましくは、アンプリコンは単一の出発配列の増幅により形成される。アンプリコンは種々の増幅反応により産生されることが可能であり、その産物は1以上の出発または標的核酸の複製物を含む。1つの態様においては、反応物(ヌクレオチドまたはオリゴヌクレオチド)の塩基対形成が、反応産物の生成に要求される鋳型ポリヌクレオチドにおける相補体を含む点において、アンプリコンを産生する増幅反応は「鋳型駆動性」である。1つの態様においては、鋳型駆動性反応は核酸ポリメラーゼでのプライマー伸長または核酸リガーゼでのオリゴヌクレオチド連結である。そのような反応には、限定的なものではないが、ポリメラーゼ連鎖反応(PCR)、リニア(linear)ポリメラーゼ反応、核酸配列に基づく増幅(NASBA)、ローリングサークル増幅などが含まれ、これらは、参照により本明細書に組み入れる以下の参照文献に開示されている:Mullisら,米国特許第4,683,195号;第4,965,188号;第4,683,202号;第4,800,159号(PCR);Gelfandら,米国特許第5,210,015号(「タックマン(taqman)」プローブを使用するリアルタイムPCR);Wittwerら,米国特許第6,174,670号;Kacianら,米国特許第5,399,491号(「NASBA」);Lizardi,米国特許第5,854,033号;Aonoら,日本国特許公開JP 4−262799(ローリングサークル増幅)など。1つの態様においては、本発明のアンプリコンはPCRにより産生される。増幅反応が進行するにつれて反応産物が測定されることを可能にする検出化学が利用可能である場合には、増幅反応は「リアルタイム」増幅となりうる(例えば、後記の「リアルタイムPCR」、またはLeoneら,Nucleic Acids Research,26:2150−2155(1998)などの参考文献に記載されている「リアルタイムNASBA」)。本明細書中で用いる「増幅する」なる語は、増幅反応を行うことを意味する。「反応混合物」は、選択されたレベルにpHを反応中に維持するための緩衝剤、塩、補因子、スカベンジャーなど(これらに限定されるものではない)を含みうる、反応を行うための必要な反応物の全てを含有する溶液を意味する。
本明細書中で用いる「クローン性」は、レパトワのクロノタイプにおけるクロノタイプ存在の分布が単一または数個のクロノタイプに傾いている度合の尺度を意味する。大雑把に言うと、クローン性はクロノタイプ多様性の逆尺度である。本発明におけるクローン性尺度に用いられうる種存在関係を記載している生態学からの多数の尺度または統計学が利用可能である(例えば、Chapters 17&18,Pielou,An Introduction to Mathematical Ecology(Wiley−Interscience,1969))。1つの態様においては、本発明で用いるクローン性尺度はクロノタイププロファイル(すなわち、検出される異なるクロノタイプの数およびそれらの存在量)の関数であり、したがって、クロノタイププロファイルを測定した後、それからクローン性を計算して単一の数を得ることが可能である。1つのクローン性尺度として、シンプソン(Simpson’s)尺度が挙げられ、これは単に、2つのランダムに抽選されたクロノタイプが同一となる確率である。他のクローン性尺度には、情報に基づく尺度、およびPielou(前記引用)に開示されているマッキントッシュ(McIntosh’s)多様性指数が含まれる。
「クロノタイプ」は、免疫受容体をコードするリンパ球の組換えヌクレオチド配列またはその一部を意味する。より詳しくは、クロノタイプは、T細胞受容体(TCR)またはB細胞受容体(BCR)をコードするT細胞またはB細胞の組換えヌクレオチド配列あるいはその一部を意味する。種々の実施形態においては、クロノタイプは、IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、TCRδのVD再編成、Kde−V再編成などの全部または一部をコードしうる。クロノタイプはまた、Bcl1−IgHまたはBcl1−IgHのような免疫受容体遺伝子を伴うトランスロケーション限界点(breakpoint)領域をコードしうる。1つの態様においては、クロノタイプは、それが由来する免疫分子の多様性を表現または反映するのに十分に長い配列を有し、その結果、クロノタイプの長さは大きく変動しうる。幾つかの実施形態においては、クロノタイプは25〜400ヌクレオチドの範囲の長さを有し、他の実施形態においては、クロノタイプは25〜200ヌクレオチドの範囲の長さを有する。
「クロノタイププロファイル」は、リンパ球の集団に由来する異なるクロノタイプおよびそれらの相対存在量の一覧を意味する。典型的には、リンパ球の集団は組織サンプルから得られる。「クロノタイププロファイル」なる語は、以下のような参考文献に記載されている免疫「レパトワ」の免疫学的概念に関連しているが、それより一般的である:Arstilaら,Science,286:958−961(1999);Yassaiら,Immunogenetics,61:493−502(2009);Kedzierskaら,Mol.Immunol.,45(3):607−618(2008)など。「クロノタイププロファイル」なる語は、リンパ球の選択されたサブセット(部分集合)(例えば、組織浸潤性リンパ球、免疫表現性サブセットなど)から誘導されうる又は完全免疫受容体と比べて低減した多様性を有する免疫受容体の部分をコードしうる再編成免疫受容体コード化核酸の多種多様な一覧および存在量を含む。幾つかの実施形態においては、クロノタイププロファイルは少なくとも10個の異なるクロノタイプを含みうる。他の実施形態においては、クロノタイププロファイルは少なくとも10個の異なるクロノタイプを含みうる。他の実施形態においては、クロノタイププロファイルは少なくとも10個の異なるクロノタイプを含みうる。他の実施形態においては、クロノタイププロファイルは少なくとも10個の異なるクロノタイプを含みうる。そのような実施形態においては、そのようなクロノタイププロファイルは異なるクロノタイプのそれぞれの存在量または相対頻度を更に含みうる。1つの態様においては、クロノタイププロファイルは、個体のリンパ球の集団においてそれぞれT細胞受容体(TCR)またはB細胞受容体(BCR)またはそれらの断片をコードする異なる組換えヌクレオチド配列(それらの存在量を伴う)のセットであり、ここで、該セットのヌクレオチド配列は、該集団のリンパ球の実質的に全てに関する、異なるリンパ球またはそれらのクローン性亜集団に対する1対1の対応を有する。1つの態様においては、クロノタイプを定める核酸セグメントは、個体における実質的に全てのT細胞もしくはB細胞またはそれらのクローンがそのようなレパトワの特有の核酸配列を含有するようにそれらの多様性(すなわち、該セットにおける異なる核酸配列の数)が十分に大きくなるように選択される。すなわち、好ましくは、サンプルの、それぞれの異なるクローンは、異なるクロノタイプを有する。本発明の他の態様においては、レパトワに対応するリンパ球の集団は循環B細胞であることが可能であり、あるいは循環T細胞であることが可能であり、あるいは前記集団の亜集団、例えば、CD4+ T細胞もしくはCD8+ T細胞、または細胞表面マーカーにより定められる他の亜集団など(これらに限定されるものではない)であることが可能である。そのような亜集団は、特定の組織、例えば骨髄またはリンパ節などからサンプルを採取することにより、あるいは1以上の細胞表面マーカー、サイズ、形態学的特徴などに基づいてサンプル(例えば、末梢血)からの細胞を選別または富化することにより得られうる。更に他の態様においては、レパトワに対応するリンパ球の集団は、例えば腫瘍組織、感染組織などのような疾患組織から誘導されうる。1つの実施形態においては、ヒトTCRβ鎖またはその断片を含むクロノタイププロファイルは0.1×10〜1.8×10個の範囲または0.5×10〜1.5×10個の範囲または0.8×10〜1.2×10個の範囲の多数の異なるヌクレオチド配列を含む。もう1つの実施形態においては、ヒトIgH鎖またはその断片を含むクロノタイププロファイルは0.1×10〜1.8×10個の範囲または0.5×10〜1.5×10個の範囲または0.8×10〜1.2×10個の範囲の多数の異なるヌクレオチド配列を含む。特定の実施形態においては、本発明のクロノタイププロファイルは、IgH鎖のV(D)J領域の実質的に全てのセグメントをコードするヌクレオチド配列のセットを含む。1つの態様においては、本明細書中で用いる「実質的に全て」は、.001%以上の相対存在量を有する各セグメントを意味し、もう1つの態様においては、本明細書中で用いる「実質的に全て」は、.0001%以上の相対存在量を有する各セグメントを意味する。もう1つの特定の実施形態においては、本発明のクロノタイププロファイルは、TCRβ鎖のV(D)J領域の実質的に全てのセグメントをコードするヌクレオチド配列のセットを含む。もう1つの実施形態においては、本発明のクロノタイププロファイルは、25〜200ヌクレオチドの範囲の長さを有しTCRβ鎖のV、DおよびJ領域のセグメントを含むヌクレオチド配列のセットを含む。もう1つの実施形態においては、本発明のクロノタイププロファイルは、25〜200ヌクレオチドの範囲の長さを有しIgH鎖のV、DおよびJ領域のセグメントを含むヌクレオチド配列のセットを含む。もう1つの実施形態においては、本発明のクロノタイププロファイルは、異なるIgH鎖を発現するリンパ球の数と実質的に等価である数の異なるヌクレオチド配列を含む。もう1つの実施形態においては、本発明のクロノタイププロファイルは、異なるTCRβ鎖を発現するリンパ球の数と実質的に等価である数の異なるヌクレオチド配列を含む。更にもう1つの実施形態においては、「実質的に等価」は、99%の確率で、クロノタイププロファイルが、.001%以上の頻度で個体の集団の各リンパ球により含有または発現されるIgHもしくはTCRβをコードするヌクレオチド配列またはその一部を含むことを意味する。更にもう1つの実施形態においては、「実質的に等価」は、99%の確率で、ヌクレオチド配列のレパトワが、.0001%以上の頻度で存在する各リンパ球により含有または発現されるIgHもしくはTCRβをコードするヌクレオチド配列またはその一部を含むことを意味する。幾つかの実施形態においては、クロノタイププロファイルは、10〜10個のリンパ球を含むサンプルから誘導される。そのような数のリンパ球は1〜10mLの末梢血サンプルから得られうる。
「相補性決定領域」(CDR)は、免疫グロブリン(すなわち、抗体)またはT細胞受容体の領域であって、該分子が抗原のコンホメーションを相補し、それにより、該分子の特異性および特異的抗原との接触を決定する、領域を意味する。T細胞受容体および免疫グロブリンのそれぞれは3個のCDRを有し、CDR1およびCDR2は可変(V)ドメイン内に存在し、CDR3はVドメインの一部、多様性(D)ドメイン(重鎖のみ)および連結(J)ドメインの全部、ならびに定常(C)ドメインの一部を含む。
「クロノタイプデータベース」は、検索の容易さ及び速さのために定型化(フォーマット)され整理された、クロノタイプのコレクション(収集物)を意味する。幾つかの実施形態においては、クロノタイプデータベースは、免疫受容体の同一領域またはセグメントをコードするクロノタイプのコレクションを含む。幾つかの実施形態においては、クロノタイプデータベースは複数の個体からのクロノタイププロファイルのクロノタイプを含む。幾つかの実施形態においては、クロノタイプデータベースは、少なくとも10の個体からの少なくとも10個のクロノタイプのクロノタイププロファイルのクロノタイプを含む。幾つかの実施形態においては、クロノタイプデータベースは少なくとも10個のクロノタイプまたは少なくとも10個のクロノタイプまたは少なくとも10個のクロノタイプまたは少なくとも1010個のクロノタイプを含む。クロノタイプデータベースは、例えばNucleic Acids Research,31:307−310(2003)に記載されているIMGTデータベース(www.imgt.org)のような、クロノタイプを含有する公的データベースでありうる。クロノタイプデータベースはFASTA形態のものであることが可能であり、クロノタイプデータベースのエントリーは、BLASTアルゴリズム(例えば、Altschulら,J.Mol.Biol.,215(3):403−410(1990))または同様のアルゴリズムを使用して検索または比較されうる。
「合体」は、配列相違を有する2つのクロノタイプを同じものとして処理することを意味し、ここで、そのような相違は実験的または測定エラーによるものであり、真正な生物学的相違によるものではないことを判定することにより該処理を行う。1つの態様においては、より高い頻度のクロノタイプの配列を、より低い頻度のクロノタイプと比較し、所定基準が満たされれば、より低い頻度のクロロタイプの数を、より高い頻度のクロノタイプのものに加え、より低い頻度のクロノタイプを以降は無視する。すなわち、より低い頻度のクロノタイプに関連した配列リードカウントを、より高い頻度のクロノタイプのものに加える(そして幾つかの実施形態においては、より低い頻度のクロノタイプに関連した配列をクロノタイププロファイルの作製における更なる考慮から除外する)。
「リンパまたは骨髄増殖障害」は、そのような障害をモニタリングするためのマーカーとして、1以上の再編成免疫受容体をコードする1以上のヌクレオチド配列が使用されうる、いずれかの異常増殖障害を意味する。「リンパ系または骨髄新生物」
は、悪性または非悪性でありうるリンパ球または骨髄細胞の異常増殖を意味する。リンパ性癌は悪性リンパ系新生物である。骨髄癌は悪性骨髄新生物である。リンパ系および骨髄新生物はリンパ増殖または骨髄増殖障害の結果であり、または該障害に関連しており、限定的なものではないが、濾胞性リンパ腫、慢性リンパ性白血病(CLL)、急性リンパ性白血病(ALL)、慢性骨髄性白血病(CML)、急性骨髄性白血病(AML)、ホジキンおよび非ホジキンリンパ腫、多発性骨髄腫(MM)、意義不明の単クローン性免疫グロブリン血症(MGUS)、マントル細胞リンパ腫(MCL)、びまん性大細胞型B細胞リンパ腫(DLBCL)、骨髄異形成症候群(MDS)、T細胞リンパ腫などを包含する(例えば、Jaffeら,Blood,112:4384−4399(2008);Swerdlowら,WHO Classification of Tumours of Haematopoietic and Lymphoid Tissues(e.4th)(IARC Press,2008))。
参照配列と別の配列(「比較配列」)との比較に関して用いられる「相同性(%)」、「同一性(%)」などの語は、それらの2つの配列間の最適アライメントにおいて、示されている百分率と同等のサブユニット位置数において(ここで、該サブユニットはポリヌクレオチド比較の場合にはヌクレオチドであり、あるいはポリペプチド比較の場合にはアミノ酸である)、比較配列が参照配列と同一であることを意味する。本明細書中で用いる、比較される配列の「最適アライメント」は、アライメントの構築において用いられるギャップの数を最小にしサブユニット間のマッチを最大にするアライメントである。同一性(%)は、商業的に入手可能なアルゴリズム[例えば、NeedlemanおよびWunsch,J.Mol.Biol.,48:443−453(1970)(Wisconsin Sequence Analysis Package,Genetics Computer Group,Madison,WIの「ギャップ(GAP)」プログラム)に記載されているものなど]の実行により決定されうる。アライメントを構築し同一性(%)を計算する当技術分野における他のソフトウェアパッケージまたは他の類似手段には、SmithおよびWaterman,Advances in Applied Mathematics,2:482−489(1981)のアルゴリズムに基づく「BestFit」プログラム(Wisconsin Sequence Analysis Package,Genetics Computer Group,Madison,WI)が含まれる。言い換えると、例えば、参照ヌクレオチド配列に対して少なくとも95%同一であるヌクレオチド配列を有するポリヌクレオチドを得るためには、参照配列におけるヌクレオチドの5%までが欠失し又は別のヌクレオチドで置換されていてもよく、あるいは参照配列におけるヌクレオチドの総数の5%までのヌクレオチド数が参照配列内に挿入されていてもよい。
「ポリメラーゼ連鎖反応」または「PCR」はDNAの相補鎖の同時プライマー伸長による特異的DNA配列のインビトロ増幅のための反応を意味する。言い換えると、PCRは、プライマー結合部位に隣接した標的核酸の複数のコピーまたは複製物を得るための反応であり、そのような反応は、以下の工程の、1以上の反復を含む:(i)標的核酸を変性させ、(ii)プライマーをプライマー結合部位にアニールさせ、(iii)ヌクレオシド三リン酸の存在下で核酸ポリメラーゼによりプライマーを伸長させる。通常、サーマルサイクラー装置において各工程に関して最適化された種々の温度により該反応を循環させる。個々の温度、各工程の持続時間および工程間の変化速度は、例えば以下の参考文献に例示されている当業者によく知られた多数の要因に左右される:McPhersonら編,PCR:A Practical ApproachおよびPCR2:A Practical Approach(IRL Press,Oxford,それぞれ1991および1995)。例えば、Taq DNAポリメラーゼを使用する通常のPCRにおいては、二本鎖標的核酸を90℃を超える温度で変性させ、プライマーを50〜75℃の範囲の温度でアニールさせ、プライマーを72〜78℃の範囲の温度で伸長させることが可能である。「PCR」なる語は、該反応の誘導形態、例えばRT−PCR、リアルタイムPCR、ネスティッドPCR、定量的PCR、多重PCRなど(これらに限定されるものではない)を含む。反応体積は数百ナノリットル、例えば200nLから数百μL、例えば200μLまでの範囲である。「逆転写PCR」または「RT−PCR」は、標的RNAを相補的一本鎖DNAに変換する逆転写反応の後で該DNAを増幅するPCRを意味する(例えば、Tecottら,米国特許第5,168,038号(これを参照により本明細書に組み入れることとする))。「リアルタイムPCR」は、反応が進行するにつれて反応産物(すなわち、アンプリコン)の量がモニタリングされるPCRを意味する。反応産物をモニタリングするために用いられる検出化学において主に異なる多数の形態のリアルタイムPCRが存在する(例えば、Gelfandら,米国特許第5,210,015号(“taqman”);Wittwerら,米国特許第6,174,670号および第6,569,627号(インターカレート色素);Tyagiら,米国特許第5,925,517号(分子ビーコン)(それらの特許を参照により本明細書に組み入れることとする))。リアルタイムPCRのための検出化学はMackayら,Nucleic Acids Research,30:1292−1305(2002)(これも参照により本明細書に組み入れることとする)に概説されている。「ネスティッドPCR」は、2段階PCRであって、第1PCRのアンプリコンが、新たなプライマーセットを使用する第2PCRのサンプルとなり、該プライマーセットの少なくとも1つが第1アンプリコンの内部位置に結合するものを意味する。ネスティッド増幅反応に関して本明細書中で用いる「初期プライマー」は、第1アンプリコンを産生させるために使用されるプライマーを意味し、「第2プライマー」は、第2のネスティッドアンプリコンを産生させるために使用される1以上のプライマーを意味する。「多重PCR」は、複数の標的配列(または単一の標的配列および1以上の参照配列)を同一反応混合物中で同時に使用するPCRを意味する(例えば、Bernardら,Anal.Biochem.,273:221−228(1999)(二色リアルタイムPCR))。通常、増幅される各配列に対して、異なるプライマーセットを使用する。典型的には、多重PCRにおける標的配列の数は2〜50個、または2〜40個、または2〜30個の範囲である。「定量的PCR」は、サンプルまたは試料における1以上の特異的標的配列の存在量を測定するために設計されたPCRを意味する。定量的PCRはそのような標的配列の絶対的定量および相対的定量の両方を含む。標的配列と一緒に又は別々にアッセイされうる1以上の参照配列または内部標準を使用して定量的測定を行う。参照配列はサンプルまたは試料にとって内因性または外因性であることが可能であり、後者の場合には1以上の競合鋳型を含みうる。典型的な内因性参照配列は以下の遺伝子の転写産物のセグメントを含む:βアクチン、GAPDH、βミクログロブリン、リボソームRNAなど。定量的PCRのための技術は、参照により本明細書に組み入れる以下の参考文献に例示されているとおり、当業者によく知られている:Freemanら,Biotechniques,26:112−126(1999);Becker−Andreら,Nucleic Acids Research,17:9437−9447(1989);Zimmermanら,Biotechniques,21:268−279(1996);Diviaccoら,Gene,122:3013−3020(1992);Becker−Andreら,Nucleic Acids Research,17:9437−9446(1989)など。
「プライマー」は、ポリヌクレオチド鋳型との二本鎖形成に際して核酸合成の開始点として作用し該鋳型に沿ってその3’末端から伸長されて伸長二本鎖を形成しうる天然または合成オリゴヌクレオチドを意味する。プライマーの伸長は通常、核酸ポリメラーゼ、例えばDNAまたはRNAポリメラーゼを使用して行われる。伸長プロセスにおいて加えられるヌクレオチドの配列は鋳型ポリヌクレオチドの配列により決定される。通常、プライマーはDNAポリメラーゼにより伸長される。プライマーは通常、14〜40ヌクレオチドの範囲または18〜36ヌクレオチドの範囲の長さを有する。プライマーは、種々の核酸増幅反応、例えば、単一プライマーを使用するリニア(linear)増幅反応、または2以上のプライマーを使用するポリメラーゼ連鎖反応において使用される。個々の用途のためのプライマーの長さ及び配列を選択するための指針は、参照により本明細書に組み入れる以下の参考文献に記載されているとおり、当業者によく知られている:Dieffenbach編,PCR Primer:A Laboratory Manual,2nd Edition(Cold Spring Harbor Press,New York,2003)。
「品質スコア」は、個々の配列位置における塩基帰属が正しい確率の尺度を意味する。個々の状況に関する品質スコアを計算するための種々の方法(例えば、種々の配列決定化学の結果としてコールされる塩基の場合、検出系、塩基コーリングアルゴリズムなど)が当業者によく知られている。一般に、品質スコア値は、正しい塩基コーリングの確率に単調に関連づけられる。例えば、10の品質スコアまたはQは、塩基が正しくコールされる90%の確率が存在することを意味することが可能であり、20のQは、塩基が正しくコールされる99%の確率が存在することを意味することが可能である、などである。幾つかの配列決定プラットフォーム、特に、合成による配列決定の化学を用いるものの場合、平均品質スコアは配列リード長の関数として減少し、配列リードの出発部分の品質スコアは配列リードの終結部分のものより高く、そのような減少は不完全な伸長、繰越伸長、鋳型の喪失、ポリメラーゼの喪失、キャッピング不全、脱保護不全などのような現象によるものである。
「配列リード(sequence read)」は、配列決定技術により得られた配列またはデータの流れから決定されたヌクレオチドの配列を意味し、該決定は、例えば、該技術に関連した塩基コーリングソフトウェア、例えば、DNA配列決定プラットフォームの商業的供給業者から得られる塩基コーリングソフトウェアにより行われる。配列リードは通常、該配列における各ヌクレオチドに関する品質スコアを含む。典型的には、配列リードは、例えばDNAポリメラーゼまたはDNAリガーゼを使用して、鋳型核酸に沿ってプライマーを伸長させることにより調製される。データは、そのような伸長に伴う光学的、化学的(例えば、pH変化)または電気的シグナルのようなシグナルを記録することにより得られる。そのような初期データは配列リードに変換される。
図1A〜1Cは、IgHまたはTCRβ遺伝子を増幅し配列決定するための2段階PCR法を示す。 図2A〜2Bは、図1A〜1Cに例示されている方法により産生されたアンプリコンの配列リード(配列読取)に基づいてクロノタイプを決定するための種々の実施形態を例示する。 図3Aは、単一反応においてIgH鎖から3つの配列決定鋳型を作製するためのPCR法を例示する。図3B〜3Cは、3つの別々の反応においてIgH鎖から3つの配列決定鋳型を作製するためのPCR法を例示しており、その後、得られたアンプリコンは、P5およびP7プライマー結合部位を付加するための二次PCRのために一緒にされる。図3Dは、IgH鎖に関して得られた配列リードの位置を例示する。 図4A〜4Bは、希少クロノタイプの選択に有用であるクロノタイプデータベース内の情報を要約するために使用されうるクロノタイプ頻度モデルを例示する。

Claims (10)

  1. リンパ系新生物の最小残存病変をモニタリングするためにリンパ系新生物と相関する1以上の患者特異的クロノタイプを選択する方法であって、
    (a)患者から取得されたサンプルのT細胞および/またはB細胞からの核酸分子を増幅する工程であって、該核酸分子はT細胞受容体遺伝子または免疫グロブリン遺伝子からの組換えDNA配列を含む、工程と、
    (b)増幅された核酸分子を配列決定してクロノタイププロファイルを形成する工程と、
    (c)該クロノタイププロファイルからのクロノタイプを、該患者以外の少なくとも1つの個体からのクロノタイプを含有するクロノタイプデータベースのクロノタイプと比較して、該クロノタイププロファイルからの各クロノタイプの該クロノタイプデータベースにおける存在、非存在および/またはレベルを決定する工程と、
    (d)それぞれ該クロノタイプデータベースには存在しないか又は該クロノタイプデータベースにおいて所定頻度未満のレベルである、前記最小残存病変をモニタリングするためのリンパ系新生物と相関する1以上の患者特異的クロノタイプを選択する工程と、
    を含み、
    該クロノタイププロファイルからの各クロノタイプが、IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、およびTCRδのVD再編成からなる群から選択される免疫受容体または免疫受容体成分のセグメントを含み、
    前記比較は、該クロノタイプデータベースを検索することを含み、
    該クロノタイププロファイルからのクロノタイプは、該クロノタイププロファイルからのクロノタイプが該クロノタイプデータベースからのクロノタイプとマッチするか該クロノタイプデータベースからのクロノタイプとクローン進化により関連している場合に、存在すると判定され、
    該クロノタイプデータベースからのクロノタイプは、該クロノタイプデータベースからのクロノタイプの配列が該クロノタイププロファイルからのクロノタイプの配列に対して90%超同一である場合、マッチしており、
    該クロノタイプデータベースからのクロノタイプは、(i)該クロノタイプデータベースからのクロノタイプの配列が、該クロノタイププロファイルからのクロノタイプの配列に対して、V遺伝子セグメントおよびJ遺伝子セグメントにおいて少なくとも90%同一である場合;(ii)該クロノタイプデータベースからのクロノタイプの配列が、免疫グロブリン重鎖からの組換え配列を含み、且つ該クロノタイププロファイルからのクロノタイプの配列とVH置換により関連している場合;(iii)該クロノタイプデータベースからのクロノタイプの配列が、該クロノタイププロファイルからのクロノタイプの配列と同一に突然変異したV領域およびJ領域を有するが、異なるNDN領域を有する場合;または(iv)該クロノタイプデータベースからのクロノタイプの配列が、免疫グロブリン重鎖からの組換え配列を含み、且つ該クロノタイププロファイルからのクロノタイプの配列と超突然変異により関連している場合、クローン進化により関連している、
    方法。
  2. 該クロノタイププロファイルからのクロノタイプを該クロノタイプデータベースのクロノタイプと比較して、該クロノタイププロファイルの各クロノタイプと該クロノタイプデータベースの各クロノタイプとの間の配列相違を決定し、所定相違未満の配列相違を有するクロノタイプを該クロノタイププロファイルから除去する工程を更に含む、請求項1記載の方法。
  3. 該配列相違が配列距離である、請求項2記載の方法。
  4. 該配列距離がハミング(Hamming)距離であり、
    任意選択で、該所定相違が、(i)10以下のハミング距離または(ii)5以下のハミング距離である、
    請求項3記載の方法。
  5. 該クロノタイプデータベースにおけるクロノタイプの所定頻度が10−6より大きい、請求項1記載の方法。
  6. 該クロノタイプデータベースが個体集団からの各個体からのクロノタイププロファイルデータを含有する、請求項1記載の方法。
  7. 該集団が少なくとも10個の個体を含む、請求項6記載の方法。
  8. 各個体からのクロノタイププロファイルデータが少なくとも10個のクロノタイプのヌクレオチド配列を含む、請求項6記載の方法。
  9. 前記1以上の患者特異的クロノタイプは、それぞれ25〜400ヌクレオチドである、請求項1記載の方法。
  10. 比較する工程が、該クロノタイププロファイルのクロノタイプの配列を該クロノタイプデータベースのクロノタイプの配列とアライメントさせることを含む、請求項1記載の方法。
JP2015558958A 2013-02-22 2014-02-20 希少クロノタイプおよびその用途 Active JP6513035B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361768269P 2013-02-22 2013-02-22
US61/768,269 2013-02-22
US13/834,794 US9528160B2 (en) 2008-11-07 2013-03-15 Rare clonotypes and uses thereof
US13/834,794 2013-03-15
PCT/US2014/017416 WO2014130685A1 (en) 2013-02-22 2014-02-20 Rare clonotypes and uses thereof

Publications (3)

Publication Number Publication Date
JP2016507248A JP2016507248A (ja) 2016-03-10
JP2016507248A5 JP2016507248A5 (ja) 2017-03-02
JP6513035B2 true JP6513035B2 (ja) 2019-05-15

Family

ID=51391810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015558958A Active JP6513035B2 (ja) 2013-02-22 2014-02-20 希少クロノタイプおよびその用途

Country Status (6)

Country Link
EP (1) EP2959020B1 (ja)
JP (1) JP6513035B2 (ja)
AU (1) AU2014218910A1 (ja)
CA (1) CA2900240A1 (ja)
ES (1) ES2748204T3 (ja)
WO (1) WO2014130685A1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
CN104195227B (zh) 2008-11-07 2017-04-12 适应生物技术公司 通过序列分析监测状况的方法
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US8685898B2 (en) 2009-01-15 2014-04-01 Imdaptive, Inc. Adaptive immunity profiling and methods for generation of monoclonal antibodies
CA2765949C (en) 2009-06-25 2016-03-29 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
US9043160B1 (en) 2009-11-09 2015-05-26 Sequenta, Inc. Method of determining clonotypes and clonotype profiles
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
AU2012325791B2 (en) 2011-10-21 2018-04-05 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
ES2683037T3 (es) 2011-12-09 2018-09-24 Adaptive Biotechnologies Corporation Diagnóstico de tumores malignos linfoides y detección de enfermedad residual mínima
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
US10077478B2 (en) 2012-03-05 2018-09-18 Adaptive Biotechnologies Corp. Determining paired immune receptor chains from frequency matched subunits
SG10201507700VA (en) 2012-05-08 2015-10-29 Adaptive Biotechnologies Corp Compositions and method for measuring and calibrating amplification bias in multiplexed pcr reactions
AU2013327423B2 (en) 2012-10-01 2017-06-22 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
US10150996B2 (en) 2012-10-19 2018-12-11 Adaptive Biotechnologies Corp. Quantification of adaptive immune cell genomes in a complex mixture of cells
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
ES2741740T3 (es) 2014-03-05 2020-02-12 Adaptive Biotechnologies Corp Métodos que usan moléculas sintéticas que contienen segmentos de nucleótidos aleatorios
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
ES2784343T3 (es) 2014-10-29 2020-09-24 Adaptive Biotechnologies Corp Detección simultánea altamente multiplexada de ácidos nucleicos que codifican heterodímeros de receptores inmunes adaptativos emparejados de muchas muestras
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
CA2968543C (en) 2014-11-25 2024-04-02 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
WO2016138122A1 (en) 2015-02-24 2016-09-01 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining hla status using immune repertoire sequencing
EP3277294B1 (en) 2015-04-01 2024-05-15 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
CA2983937A1 (en) 2015-04-27 2016-11-03 Abvitro Llc Methods of sequencing, determining, pairing, and validating therapeutic agents and disease specific antigens
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
WO2019046817A1 (en) 2017-09-01 2019-03-07 Life Technologies Corporation COMPOSITIONS AND METHODS FOR IMMUNOLOGICAL REPERTOIRE SEQUENCING
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
JP2024512608A (ja) 2021-03-24 2024-03-19 ジェネンテック, インコーポレイテッド Tリンパ球における効率的なtcr遺伝子編集

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990004648A1 (en) 1988-10-20 1990-05-03 Alexander Alan Morley Method for diagnosis of monoclonality in leukaemia and lymphoma
US5837447A (en) 1992-04-15 1998-11-17 Blood Center Research Foundation, Inc., The Monitoring an immune response by analysis of amplified immunoglobulin or T-cell-receptor nucleic acid
US6087096A (en) 1995-11-13 2000-07-11 Dau; Peter C. Method of intrafamily fragment analysis of the T cell receptor α and β chain CDR3 regions
WO1997046706A1 (en) * 1996-06-03 1997-12-11 University Of Alberta Methods for detection of rearranged dna
WO2004033728A2 (en) 2002-10-11 2004-04-22 Erasmus Universiteit Rotterdam Nucleic acid amplification primers for pcr-based clonality studies
EP1544308B1 (en) 2003-12-15 2009-01-28 Institut Pasteur Repertoire determination of a lymphocyte B population
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
US9528160B2 (en) * 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
EP2567226B1 (en) * 2010-05-06 2016-08-10 Adaptive Biotechnologies Corporation Monitoring health and disease status using clonotype profiles

Also Published As

Publication number Publication date
ES2748204T3 (es) 2020-03-13
AU2014218910A1 (en) 2015-08-20
EP2959020A1 (en) 2015-12-30
WO2014130685A1 (en) 2014-08-28
CA2900240A1 (en) 2014-08-28
EP2959020A4 (en) 2017-02-08
EP2959020B1 (en) 2019-09-18
JP2016507248A (ja) 2016-03-10

Similar Documents

Publication Publication Date Title
JP6513035B2 (ja) 希少クロノタイプおよびその用途
US9528160B2 (en) Rare clonotypes and uses thereof
US20140234835A1 (en) Rare clonotypes and uses thereof
CN105658812B (zh) 用序列标签进行大规模生物分子分析
US9043160B1 (en) Method of determining clonotypes and clonotype profiles
US9499865B2 (en) Detection and measurement of tissue-infiltrating lymphocytes
US10385475B2 (en) Random array sequencing of low-complexity libraries
US20150031553A1 (en) Method of measuring immune activation
US20140349883A1 (en) Monitoring transformation of follicular lymphoma to diffuse large b-cell lymphoma by immune repertoire analysis
US20150299800A1 (en) Monitoring mantle cell lymphoma clonotypes in peripheral blood after immunotransplant
US20140255944A1 (en) Monitoring treatment-resistant clones in lymphoid and myeloid neoplasms by relative levels of evolved clonotypes
US20130324422A1 (en) Detecting disease-correlated clonotypes from fixed samples
US20150275308A1 (en) Monitoring diffuse large b-cell lymphoma from peripheral blood samples
US20140342360A1 (en) Method of measuring immune activation
JP2015535178A (ja) 末梢血における形質細胞増殖障害のクロノタイプのモニタリング
JP2015512655A (ja) 免疫レパートリ分析におけるサンプル混入の検出および定量化

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20151201

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160224

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20160224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170125

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170125

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190409

R150 Certificate of patent or registration of utility model

Ref document number: 6513035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250