JP7317078B2

JP7317078B2 - 腫瘍変異負荷を評価するための方法及びシステム

Info

Publication number: JP7317078B2
Application number: JP2021131496A
Authority: JP
Inventors: ザカリーアール．チャルマース，; ケイトリンエフ．コネリー，; デーヴィッドファブリツィオ，; ギャレットマイケルフランプトン，; プリティヘッジ，; マルチンコワネッツ，; フィリップジェー．スティーヴンズ，; ジェームズシンサン，; ローマンイエレンスキー，
Original assignee: Genentech Inc
Current assignee: Genentech Inc
Priority date: 2016-02-29
Filing date: 2021-08-12
Publication date: 2023-07-28
Anticipated expiration: 2037-02-27
Also published as: IL261126A; AU2021203640A1; EP3423828A4; AU2017225876A1; AU2021203640B2; MX2018010362A; US20180363066A1; KR102358206B1; KR20180130506A; CA3014653C; CN109196359A; WO2017151524A1; KR20220018627A; CN114959918A; JP2019512218A; CN109196359B; JP6930992B2; CA3014653A1; EP3423828A1; JP2021191276A

Description

関連出願の相互参照
本出願は、２０１６年２月２９日出願の米国仮出願第６２／３０１，５３４号の利益を主張する。前述の出願内容は、参照によってそれらの全体が本明細書に組み込まれる。

本発明は、腫瘍変異負荷などの遺伝子変化を評価する方法に関する。

がん細胞は、がんの発症及び進行の間、変異を蓄積する。これらの変異は、ＤＮＡ修復、複製、もしくは修飾の本質的な機能不全、または外部の変異原への曝露の結果であり得る。ある特定の変異は、がん細胞に対して成長の利点を付与しており、がんが発症する組織の微小環境において正に選択される。有利な変異の選択は腫瘍発生に寄与するが、腫瘍ネオ抗原の生成及びその後の免疫認識の尤度もまた、変異が発生すると増加する（ＧｕｂｉｎａｎｄＳｃｈｒｅｉｂｅｒ．Ｓｃｉｅｎｃｅ３５０：１５８－９，２０１５）。よって、全ての変異負荷は、全エクソーム解析（ＷＥＳ）によって測定される場合、患者の治療決定を導くために使用されて、例えば、がん免疫療法に対する持続的応答を予測し得る。しかし、全エクソーム解析は広く利用可能であるわけではなく、高価で多大な時間がかかり、かつ技術的な課題があるため、ゲノム研究を日常的な診療に結び付けるには問題が残されたままである。

よって、ゲノムまたはエクソームのサブセットを標的とするゲノムプロファイリングを含む、腫瘍試料中の変異荷重を正確に測定するための新規の手法がなおも必要とされている。

本発明は、例えば、ハイブリッド捕捉に基づく次世代配列決定（ＮＧＳ）プラットフォームを使用して、患者試料からのゲノムまたはエクソームの小画分をプロファイリングすることが、全ての変異荷重の分析に対して有効な代替法の役割を果たすという発見に少なくとも部分的に基づく。変異負荷を検出するための標的ＮＧＳ手法を含む方法を使用することは、例えば、全ゲノムまたは全エクソーム解析と比較してより早い、例えば、より臨床的に管理可能な結果所要時間（約２週間）、標準化情報学パイプライン、及びより管理可能なコストを含むが、これらに限定されない、いくつかの利点を有する。本明細書に開示される方法は、本方法が主観的尺度（例えば、病理学的スコア付け）よりむしろ、客観的尺度（例えば、変異荷重）を生み出すために、組織化学的に検出されるタンパク質発現などの従来のマーカーを上回る他の利点を有する。本明細書に開示される方法は、標的療法のための実施可能な変化、ならびに免疫療法のための変異負荷の同時検出も可能にする。これらの方法は、がんを有する患者における療法に対する応答の臨床的に実施可能な予測因子を提供し得る。

したがって、本発明は、試料からのサブゲノム区間のセットの配列を提供すること、及び変異荷重に対する値を決定することによって、試料中の変異荷重を評価する方法を少なくとも部分的に提供し、ここで、値は、サブゲノム区間のセット内の変化の数の関数である。ある特定の実施形態において、サブゲノム区間のセットは、所定の遺伝子セット、例えば、全ゲノムまたはエクソームを含まない所定の遺伝子セットからのものである。ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間のセットである。他の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間及び非コードサブゲノム区間の両方を含有する。ある特定の実施形態において、変異荷重に対する値は、サブゲノム区間のセット内の変化（例えば、体細胞変化）の数の関数である。ある特定の実施形態において、変化の数は、機能的変化、生殖細胞変化、またはそれらの両方を除外する。いくつかの実施形態において、試料は、腫瘍試料または腫瘍由来の試料である。本明細書に記載される方法はまた、例えば、試料から複数の腫瘍メンバーを含むライブラリを取得することと、ライブラリをベイトセットと接触させて、ハイブリダイゼーションによって選択された腫瘍メンバーを提供し、それにより、ライブラリキャッチを提供することと、ライブラリキャッチからの腫瘍メンバーから変化を含むサブゲノム区間に対する読み取りデータを取得することと、整列法によって読み取りデータを整列させることと、読み取りデータから事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることと、割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものであるサブゲノム区間のセットを選択することと、のうちの１つ以上を含み得る。

一態様において、本発明は、試料、例えば、腫瘍試料（例えば、腫瘍から取得される試料）中の変異荷重を評価する方法を特徴とする。本方法は、
ａ）試料からのサブゲノム区間（例えば、コードサブゲノム区間）のセットであって、所定の遺伝子セットからのものである、サブゲノム区間のセットの配列、例えば、ヌクレオチド配列を提供することと、
ｂ）変異荷重に対する値を決定することと、を含み、値は、サブゲノム区間のセット内の変化（例えば、１つ以上の変化）、例えば、体細胞変化（例えば、１つ以上の体細胞変化）の数の関数である。

ある特定の実施形態において、変化の数は、サブゲノム区間内の機能的変化を除外する。他の実施形態において、変化の数は、サブゲノム区間内の生殖細胞変化を除外する。ある特定の実施形態において、変化の数は、サブゲノム区間内の機能的変化及びサブゲノム区間内の生殖細胞変化を除外する。

ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間を含む。他の実施形態において、サブゲノム区間のセットは、非コードサブゲノム区間を含む。ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間を含む。他の実施形態において、サブゲノム区間のセットは、１つ以上のコードサブゲノム区間及び１つ以上の非コードサブゲノム区間を含む。ある特定の実施形態において、サブゲノム区間のセット内のサブゲノム区間の約５％以上、約１０％以上、約２０％以上、約３０％以上、約４０％以上、約５０％以上、約６０％以上、約７０％以上、約８０％以上、約９０％以上、または約９５％以上がコードサブゲノム区間である。他の実施形態において、サブゲノム区間のセット内のサブゲノム区間の約９０％以下、約８０％以下、約７０％以下、約６０％以下、約５０％以下、約４０％以下、約３０％以下、約２０％以下、約１０％以下、または約５％以下が非コードサブゲノム区間である。

他の実施形態において、サブゲノム区間のセットは、全ゲノムまたは全エクソームを含まない。他の実施形態において、コードサブゲノム区間のセットは、全エクソームを含まない。

ある特定の実施形態において、所定の遺伝子セットは、全ゲノムまたは全エクソームを含まない。他の実施形態において、所定の遺伝子セットは、表１～４または図３Ａ～４Ｄに記載される１つ以上の遺伝子を含むか、またはそれらからなる。

ある特定の実施形態において、値は、所定の遺伝子セットの関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのコード領域の関数として表される。他の実施形態において、値は、所定の遺伝子セットの非コード領域の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのエクソンの関数として表される。他の実施形態において、値は、所定の遺伝子セットのイントロンの関数として表される。

ある特定の実施形態において、値は、配列決定された所定の遺伝子セットの関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのコード領域の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットの非コード領域の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのエクソンの関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットのイントロンの関数として表される。

ある特定の実施形態において、値は、所定の遺伝子セットの事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのコード領域の事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットの非コード領域の事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのエクソンの事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットのイントロンの事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。

ある特定の実施形態において、値は、配列決定された所定の遺伝子セットの事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのコード領域の事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットの非コード領域の事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのエクソンの事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットのイントロンの事前選択された位置の数における変化（例えば、体細胞変化）の数の関数として表される。

ある特定の実施形態において、値は、事前選択された単位当たりの変化（例えば、体細胞変化）の数の関数として、例えば、１メガ塩基当たりの体細胞変化の数の関数として表される。

ある特定の実施形態において、値は、所定の遺伝子セット内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのコード領域内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットの非コード領域内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのエクソン内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットのイントロン内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。

ある特定の実施形態において、値は、配列決定された所定の遺伝子セット内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのコード領域内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットの非コード領域内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのエクソン内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットのイントロン内の１メガ塩基当たりの変化（例えば、体細胞変化）の数の関数として表される。

ある特定の実施形態において、変異荷重は、より多くのゲノムに、例えば、エクソームまたは全ゲノムに外挿されて、例えば、全ての変異荷重を得る。他の実施形態において、変異荷重は、より多くのエクソームに、例えば、全エクソームに外挿される。

ある特定の実施形態において、試料は、対象からのものである。ある特定の実施形態において、対象は、障害、例えば、がんを有する。他の実施形態において、対象は、療法、例えば、免疫療法を受けているか、または受けたことがある。

ある特定の実施形態において、変異荷重は、例えば、参照集団からの試料中の変異荷重におけるパーセンタイルとして表される。ある特定の実施形態において、参照集団は、対象と同じ型のがんを有する患者を含む。他の実施形態において、参照集団は、対象と同じ種類の療法を受けているか、または受けたことのある患者を含む。

別の態様において、本発明は、試料、例えば、腫瘍試料または腫瘍由来の試料中の変異荷重を評価する方法を特徴とする。本方法は、
（ｉ）試料から複数の腫瘍メンバーを含むライブラリを取得することと、
（ｉｉ）ライブラリを、選択された腫瘍メンバーを提供するためのベイトセットであって、腫瘍メンバーとハイブリッド形成する、該ベイトセットと接触させて、それにより、ライブラリキャッチを提供することと、
（ｉｉｉ）例えば、次世代配列決定法によって、該ライブラリキャッチからの腫瘍メンバーから変化（例えば、体細胞変化）を含むサブゲノム区間に対する読み取りデータを取得することと、
（ｉｖ）整列法によって該読み取りデータを整列させることと、
（ｖ）該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることと、
（ｖｉ）割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものである、サブゲノム区間（例えば、コードサブゲノム区間）のセットを選択することと、
（ｖｉｉ）変異荷重に対する値を決定することと、を含み、値は、サブゲノム区間のセット内の変化（例えば、１つ以上の変化）、例えば、体細胞変化（例えば、１つ以上の体細胞変化）の数の関数である。

ある特定の実施形態において、変化の数（例えば、体細胞変化）は、サブゲノム区間内の機能的変化を除外する。他の実施形態において、変化の数は、サブゲノム区間内の生殖細胞変化を除外する。ある特定の実施形態において、変化の数（例えば、体細胞変化）は、サブゲノム区間内の機能的変化及びサブゲノム区間内の生殖細胞変化を除外する。

変化の種類
本明細書に記載されるような方法またはシステムにおいて、様々な種類の変化（例えば、体細胞変化）が評価され得、変異荷重の分析のために使用され得る。

体細胞変化
ある特定の実施形態において、本明細書に記載される方法に従って評価される変化は、変化（例えば、体細胞変化）である。

ある特定の実施形態において、変化（例えば、体細胞変化）は、短いコード変異形、例えば、塩基置換またはインデル（挿入または欠失）である。ある特定の実施形態において、変化（例えば、体細胞変化）は、点変異である。他の実施形態において、変化（例えば、体細胞変化）は、再編成以外、例えば、転座以外である。ある特定の実施形態において、変化（例えば、体細胞変化）は、スプライス変異形である。

ある特定の実施形態において、変化（例えば、体細胞変化）は、サイレント変異、例えば、同義変化である。他の実施形態において、変化（例えば、体細胞変化）は、非同義一塩基変異形（ＳＮＶ）である。他の実施形態において、変化（例えば、体細胞変化）は、パッセンジャー変異、例えば、細胞のクローンの適応度に対して検出可能な影響を有さない変化である。ある特定の実施形態において、変化（例えば、体細胞変化）は、意義不明の変異形（ＶＵＳ）、例えば、病原性を確認も排除もできない変化である。ある特定の実施形態において、変化（例えば、体細胞変化）は、がん表現型に関連していると識別されていない。

ある特定の実施形態において、変化（例えば、体細胞変化）は、細胞分裂、成長、もしくは生存に対する影響に関連していないか、またはそれに関連すると知られていない。他の実施形態において、変化（例えば、体細胞変化）は、細胞分裂、成長、または生存に対する影響に関連する。

ある特定の実施形態において、体細胞変化のレベル増加は、１つ以上の分類または種類の体細胞変化（例えば、再編成、点変異、インデル、またはそれらの任意の組み合わせ）のレベル増加である。ある特定の実施形態において、体細胞変化のレベル増加は、１つの分類または１つの種類の体細胞変化（例えば、再編成のみ、点変異のみ、またはインデルのみ）のレベル増加である。ある特定の実施形態において、体細胞変化のレベル増加は、事前選択された位置（例えば、本明細書に記載される変化）における体細胞変化のレベル増加である。ある特定の実施形態において、体細胞変化のレベル増加は、事前選択された体細胞変化（例えば、本明細書に記載される変化）のレベル増加である。

機能的変化
ある特定の実施形態において、変化の数（例えば、体細胞変化）は、サブゲノム区間内の機能的変化を除外する。

いくつかの実施形態において、機能的変化は、参照配列、例えば、野生型配列または未変異配列と比較すると、細胞分裂、成長、または生存に対して影響を有し、例えば、細胞分裂、成長、または生存を促進する変化である。ある特定の実施形態において、機能的変化は、機能的変化のデータベース、例えば、ＣＯＳＭＩＣデータベース（ｃａｎｃｅｒ．ｓａｎｇｅｒ．ａｃ．ｕｋ／ｃｏｓｍｉｃ；Ｆｏｒｂｅｓｅｔａｌ．Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．２０１５；４３（Ｄ１）：Ｄ８０５－Ｄ８１１）に含むことにより識別される。他の実施形態において、機能的変化は、例えば、ＣＯＳＭＩＣデータベースにおいて既知の体細胞変化として起こる既知の機能状態を伴う変化である。ある特定の実施形態において、機能的変化は、機能的である可能性が高い状態、例えば、腫瘍抑制遺伝子における切断を伴う変化である。ある特定の実施形態において、機能的変化は、ドライバー変異、例えば、細胞生存または繁殖を増加することによって、クローンにその微小環境において、選択優位性を供与する変化である。他の実施形態において、機能的変化は、クローン展開を引き起こすことができる変化である。ある特定の実施形態において、機能的変化は、次の（ａ）成長シグナルにおける自給自足、（ｂ）抗成長シグナルの減少、例えば、それに対する非感受性、（ｃ）アポトーシスの減少、（ｄ）複製能の増加、（ｅ）血管新生の持続、または（ｆ）組織浸潤もしくは転移のうちの１つ、２つ、３つ、４つ、５つ、または全てを引き起こすことができる変化である。

ある特定の実施形態において、機能的変化は、パッセンジャー変異ではなく、例えば、細胞のクローンの適応度に対して検出可能な影響を有さない変化ではない。ある特定の実施形態において、機能的変化は、意義不明の変異形（ＶＵＳ）ではなく、例えば、その病原性を確認も排除もできない変化ではない。

ある特定の実施形態において、所定の遺伝子セット内の事前選択された腫瘍遺伝子における複数（例えば、約１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％以上）の機能的変化が除外される。ある特定の実施形態において、所定の遺伝子セット内の事前選択された遺伝子（例えば、腫瘍遺伝子）における全ての機能的変化が除外される。ある特定の実施形態において、所定の遺伝子セット内の複数の事前選択された遺伝子（例えば、腫瘍遺伝子）における複数の機能的変化が除外される。ある特定の実施形態において、所定の遺伝子セット内の全ての遺伝子（例えば、腫瘍遺伝子）における全ての機能的変化が除外される。

生殖細胞変異
ある特定の実施形態において、変化の数は、サブゲノム区間内の生殖細胞変異を除外する。ある特定の実施形態において、体細胞変化は、生殖細胞変異と同一または同様ではなく、例えば、それと区別可能である。

ある特定の実施形態において、生殖細胞変化は、一塩基多型（ＳＮＰ）、塩基置換、インデル（例えば、挿入または欠失）、またはサイレント変異（例えば、同義変異）である。

ある特定の実施形態において、生殖細胞変化は、適合正常配列との比較を使用しない方法の使用によって除外される。他の実施形態において、生殖細胞変化は、ＳＧＺアルゴリズムの使用を含む方法によって除外される。ある特定の実施形態において、生殖細胞変化は、生殖細胞変化のデータベース、例えば、ｄｂＳＮＰデータベース（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＳＮＰ／ｉｎｄｅｘ．ｈｔｍｌ；Ｓｈｅｒｒｙｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００１；２９（１）：３０８－３１１）に含むことにより識別される。他の実施形態において、生殖細胞変化は、ＥｘＡＣデータベースの複数のカウント（ｅｘａｃ．ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｏｒｇ；ＥｘｏｍｅＡｇｇｒｅｇａｔｉｏｎＣｏｎｓｏｒｔｉｕｍｅｔａｌ．“Ａｎａｌｙｓｉｓｏｆｐｒｏｔｅｉｎ－ｃｏｄｉｎｇｇｅｎｅｔｉｃｉｎ６０，７０６ｈｕｍａｎｓ，”ｂｉｏＲｘｉｖｐｒｅｐｒｉｎｔ．Ｏｃｔｏｂｅｒ３０，２０１５）に含むことにより識別される。いくつかの実施形態において、生殖細胞変化は、１０００人ゲノムプロジェクトデータベース（ｗｗｗ．１０００ｇｅｎｏｍｅｓ．ｏｒｇ；ＭｃＶｅａｎｅｔａｌ．Ｎａｔｕｒｅ．２０１２；４９１，５６－６５）に含むことにより識別される。いくつかの実施形態において、生殖細胞変化は、ＥＳＰデータベース（ＥｘｏｍｅＶａｒｉａｎｔＳｅｒｖｅｒ，ＮＨＬＢＩＧＯＥｘｏｍｅＳｅｑｕｅｎｃｉｎｇＰｒｏｊｅｃｔ（ＥＳＰ），Ｓｅａｔｔｌｅ，ＷＡ（ｅｖｓ．ｇｓ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／ＥＶＳ／）に含むことにより識別される。

多重遺伝子分析
本明細書に記載される方法及びシステムは、例えば、所定の遺伝子セットからの、例えば、サブゲノム区間のセットを評価する。

ある特定の実施形態において、所定の遺伝子セットは、変異体形態で、細胞分裂、成長、もしくは生存に対する影響に関連するか、またはがん、例えば、本明細書に記載されるがんに関連する複数の遺伝子を含む。

ある特定の実施形態において、所定の遺伝子セットは、少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、約３５０個以上、約４００個以上、約４５０個以上、約５００個以上、約５５０個以上、約６００個以上、約６５０個以上、約７００個以上、約７５０個以上、または約８００個以上の、例えば、本明細書に記載されるような遺伝子を含む。いくつかの実施形態において、所定の遺伝子セットは、表１～４または図３Ａ～４Ｄから選ばれる遺伝子または遺伝子産物のうちの少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、または全てを含む。

ある特定の実施形態において、本方法は、試料から複数の腫瘍メンバーを含むライブラリを取得することをさらに含む。ある特定の実施形態において、本方法は、ライブラリをベイトセットと接触させて、選択された腫瘍メンバーを提供することをさらに含み、ここで、該ベイトセットは、ライブラリからの腫瘍メンバーとハイブリッド形成して、それにより、ライブラリキャッチを提供する。ある特定の実施形態において、本方法は、ライブラリまたはライブラリキャッチからの腫瘍メンバーから変化（例えば、体細胞変化）を含むサブゲノム区間に対する読み取りデータを取得し、それにより、例えば、次世代配列決定法によってサブゲノム区間に対する読み取りデータを取得することをさらに含む。ある特定の実施形態において、本方法は、整列法、例えば、本明細書に記載される整列法によってサブゲノム区間に対する読み取りデータを整列させることをさらに含む。ある特定の実施形態において、本方法は、例えば、本明細書に記載される変異呼び出し法によってサブゲノム区間に対する読み取りデータから事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることをさらに含む。

ある特定の実施形態において、本方法は、
（ａ）試料から複数の腫瘍メンバーを含むライブラリを取得すること、
（ｂ）ライブラリを、選択された腫瘍メンバーを提供するためのベイトセットであって、腫瘍メンバーとハイブリッド形成する、該ベイトセットと接触させて、それにより、ライブラリキャッチを提供すること、
（ｃ）該ライブラリキャッチからの腫瘍メンバーから変化（例えば、体細胞変化）を含むサブゲノム区間に対する読み取りデータを取得し、それにより、例えば、次世代配列決定法によってサブゲノム区間に対する読み取りデータを取得すること、
（ｄ）整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させること、または
（ｅ）例えば、本明細書に記載される変異呼び出し法によって、該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること、のうちの１つ、２つ、３つ、４つ、または全てをさらに含む。

ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、約３５０個以上、約４００個以上、約４５０個以上、約５００個以上、約５５０個以上、約６００個以上、約６５０個以上、約７００個以上、約７５０個以上、または約８００個以上の遺伝子からのサブゲノム区間を配列決定することを含む。ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、表１～４または図３Ａ～４Ｄから選ばれる遺伝子または遺伝子産物のうちの少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、または全てからのサブゲノム区間を配列決定することを含む。

ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、平均固有カバレッジの約２５０Ｘ超で配列決定することを含む。他の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、平均固有カバレッジの約５００Ｘ超で配列決定することを含む。他の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、平均固有カバレッジの約１，０００Ｘ超で配列決定することを含む。

ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、配列決定された遺伝子（例えば、エクソン）の約９９％超において、平均固有カバレッジの約２５０Ｘ超で配列決定することを含む。他の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、配列決定された遺伝子（例えば、エクソン）の約９５％超において、平均固有カバレッジの約５００Ｘ超で配列決定することを含む。ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、配列決定された遺伝子（例えば、エクソン）の約９９％超において、平均固有カバレッジの約２５０Ｘ超、約５００Ｘ超、または約１，０００Ｘ超で配列決定することを含む。

ある特定の実施形態において、本明細書に記載される、サブゲノム区間（例えば、コードサブゲノム区間）のセットの配列、例えば、ヌクレオチド配列は、本明細書に記載される方法によって提供される。ある特定の実施形態において、配列は、適合正常対照（例えば、野生型対照）、適合腫瘍対照（例えば、原発対転移性）、またはそれらの両方を含む方法を使用することなく提供される。

ＳＧＺ分析
ある特定の実施形態において、生殖細胞変化は、ＳＧＺアルゴリズムの使用を含む方法またはシステムによって除外される。

ある特定の実施形態において、本方法は、腫瘍試料中の変異形、例えば、変化を、
ａ）ｉ）複数の選択されたサブゲノム区間の各々に対して、選択されたサブゲノム区間における正規化された配列カバレッジに対する値を含む配列カバレッジ入力（ＳＣＩ）であって、サブゲノム区間に対する読み取りデータの数と処理適合対照に対する読み取りデータの数との関数である、ＳＣＩ、
ｉｉ）複数の選択された生殖細胞ＳＮＰの各々に対して、腫瘍試料中の対立遺伝子頻度に対する値を含むＳＮＰ対立遺伝子頻度入力（ＳＡＦＩ）であって、腫瘍試料中の低頻度または代替的対立遺伝子の頻度に少なくとも部分的に基づく、ＳＡＦＩ、及び
ｉｉｉ）腫瘍試料中の該変異形に対する対立遺伝子頻度を含む、変異形対立遺伝子頻度入力（ＶＡＦＩ）を取得することと、
ｂ）ＳＣＩ及びＳＡＦＩの関数として、
ｉ）複数のゲノム分節の各々に対するゲノム分節総コピー数（Ｃ）、
ｉｉ）複数のゲノム分節の各々に対するゲノム分節低頻度対立遺伝子コピー数（Ｍ）、及び
ｉｉｉ）試料純度（ｐ）に対する値を取得することであって、
Ｃ、Ｍ、及びｐの値が、ゲノム全体でのコピー数モデルをＳＣＩ及びＳＡＦＩに適合させることによって得られる、取得することと、
ｃ）変異形が、体細胞、サブクローナル体細胞変異形、生殖細胞、または区別不可能であることを示し、ＶＡＦＩ、ｐ、Ｃ、及びＭの関数である、変異型に対する値、ｇを取得することと、によって特徴付けることをさらに含む。

ある特定の実施形態において、本方法は、複数の選択されたサブゲノム区間の各々、複数の選択された生殖細胞ＳＮＰの各々、及び変異形（例えば、変化）を配列決定することをさらに含み、ここで、正規化の前の平均配列カバレッジは、少なくとも約２５０ｘ、例えば、少なくとも約５００ｘである。

ある特定の実施形態において、ゲノム全体でのコピー数モデルをＳＣＩに適合させることは、以下の等式を使用することを含み、

、式中、ψが腫瘍倍数性である。

ある特定の実施形態において、ゲノム全体でのコピー数モデルをＳＡＦＩに適合させることは、以下の等式を使用することを含み、

、式中、ＡＦは、対立遺伝子頻度である。

ある特定の実施形態において、ｇは、体細胞／生殖細胞状態のモデルに対するＶＡＦＩ、ｐ、Ｃ、及びＭの値の適合を決定することによって決定される。ある特定の実施形態において、ｇの値は、以下によって取得され、

、式中、ＡＦは、対立遺伝子頻度である。

ある特定の実施形態において、０であるか、または０に近いｇの値は、変異形が体細胞変異形であることを示し、１であるか、または１に近いｇの値は、変異形が生殖細胞変異形であることを示し、０超であるが１未満であるｇの値は、区別不能な結果を示すか、または０を著しく下回るｇの値は、変異形がサブクローナル体細胞変異形であることを示す。

ＳＧＺアルゴリズムは、国際出願公開第ＷＯ２０１４／１８３０７８号及び米国出願公開第２０１４／０３３６９９６号に記載されており、それらの内容は、参照によってそれらの全体が組み込まれる。ＳＧＺアルゴリズムは、Ｓｕｎｅｔａｌ．ＣａｎｃｅｒＲｅｓｅａｒｃｈ２０１４；７４（１９Ｓ）：１８９３－１８９３にも記載されている。

試料、例えば、腫瘍試料
本明細書に記載される方法及びシステムは、いくつかの異なる供給源からの様々な種類の試料中の変異荷重を評価するために使用され得る。

いくつかの実施形態において、試料は、腫瘍試料または腫瘍由来の試料である。ある特定の実施形態において、試料は、固形腫瘍、血液癌、またはそれらの転移形態から取得される。ある特定の実施形態において、試料は、本明細書に記載されるように、がんを有する対象、または療法を受けているか、もしくは療法を受けたことがある対象から得られる。

いくつかの実施形態において、試料（例えば、腫瘍試料）は、前悪性もしくは悪性細胞；固形腫瘍、軟組織腫瘍、もしくは転移性病巣からの細胞；外科的縁からの組織もしくは細胞；組織学的に正常な組織；１つ以上の循環腫瘍細胞（ＣＴＣ）；正常な近接組織（ＮＡＴ）；腫瘍を有するか、もしくはそれを有するリスクがある同じ対象からの血液試料；またはＦＦＰＥ試料のうちの１つ以上を含む。ある特定の実施形態において、試料は、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む。

ある特定の実施形態において、試料は、ＦＦＰＥ試料である。ある特定の実施形態において、ＦＦＰＥ試料は、次の特性のうちの１つ、２つ、または全てを有する：（ａ）約１０ｍｍ^２以上、約２５ｍｍ^２以上、または約５０ｍｍ^２以上の表面積を有するか、（ｂ）約１ｍｍ^３以上、約２ｍｍ^３以上、約３ｍｍ^３以上、約４ｍｍ^３以上、または約５ｍｍ^３以上の試料体積を有するか、あるいは（ｃ）約５０％以上、約６０％以上、約７０％以上、約８０％以上、もしくは約９０％以上、または約１０，０００個以上の細胞、約２０，０００個以上の細胞、約３０，０００個以上の細胞、約４０，０００個以上の細胞、もしくは約５０，０００個以上の細胞の有核の細胞充実性を有する。

システム
別の態様において、本発明は、試料（例えば、腫瘍試料または腫瘍由来の試料）中の変異荷重を評価するためのシステムを特徴とする。システムは、メモリに動作可能に接続された少なくとも１つのプロセッサを備え、少なくとも１つのプロセッサは、実行すると、
ａ）試料からのサブゲノム区間（例えば、コードサブゲノム区間）のセットの配列、例えば、ヌクレオチド配列を取得することであって、コードサブゲノム区間のセットが所定の遺伝子セットからのものである、配列を取得することと、
ｂ）変異荷重に対する値を決定することと、を行うように構成され、ここで、値は、サブゲノム区間のセット内の変化（例えば、体細胞変化）の数の関数である。

ある特定の実施形態において、該変化の数は、（ｉ）サブゲノム区間内（例えば、コードサブゲノム区間）の機能的変化、（ｉｉ）サブゲノム区間内（例えば、コードサブゲノム区間）の生殖細胞変化、または（ｉｉｉ）それらの両方を除外する。

用途
いくつかの実施形態において、本方法は、変異荷重、例えば、変異荷重のレベル増加の評価に応じて治療を選択することをさらに含む。いくつかの実施形態において、本方法は、変異荷重、例えば、変異荷重のレベル増加の評価に応じて治療を施すことをさらに含む。いくつかの実施形態において、本方法は、変異荷重の評価に応じて試料、またはその試料が由来する対象を分類することをさらに含む。いくつかの実施形態において、本方法は、報告書、例えば、電子報告書、ウェブベース報告書、または書面報告書を作成し、患者、または別の者もしくは実体、介護者、内科医、腫瘍医、病院、診療所、第３者の支払人、保険会社、もしくは官庁に提出することをさらに含む。いくつかの実施形態において、報告書は、変異荷重を含む本方法による結果を含む。

本発明の追加の態様または実施形態は、次のうちの１つ以上を含む。

整列
本明細書に開示される方法は、多数の個別に調節される整列法またはアルゴリズムの使用を統合して、配列決定法において、特に、例えば、本明細書に記載されるがん由来の多くの多様な遺伝子における多くの多様な遺伝的事象の超並列配列決定法に依存する方法、例えば、腫瘍試料を分析する方法において能力を最適化し得る。実施形態において、異なる遺伝子のいくつかの変異形の各々に対して個別にカスタマイズまたは調節される多数の整列法は、読み取りデータを分析するために使用される。実施形態において、調節することは、配列決定されている遺伝子（または、他のサブゲノム区間）、試料中の腫瘍型、配列決定されている変異形の（うちの１つ以上の）機能、または試料もしくは対象の特質であり得る。配列決定されるいくつかの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対して個別に調節される整列条件の選択または使用によって、速度、感度、及び特異性の最適化が可能になる。本方法は、比較的多くの多様な対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対する読み取りデータの整列が最適化される場合、特に有効である。

したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍（または、前悪性腫瘍）、例えば、本明細書に記載される血液悪性腫瘍（または、前悪性腫瘍）からの腫瘍試料を分析する方法を特徴とする。本方法は、
（ａ）試料から複数のメンバー、例えば、腫瘍試料から複数の腫瘍メンバーを含む１つまたは複数のライブラリを取得することと、
（ｂ）任意に、例えば、１つまたは複数のライブラリを、ベイトセット（または、複数のベイトセット）と接触させることによって、事前選択された配列に対する１つまたは複数のライブラリを富化して、選択されたメンバー（本明細書において、ライブラリキャッチと称される場合もある）を提供することと、
（ｃ）例えば、配列決定することを含む方法によって、例えば、次世代配列決定法を用いて、メンバー、例えば、ライブラリまたはライブラリキャッチからの腫瘍メンバーから、対象区間、例えば、サブゲノム区間または発現サブゲノム区間に対する読み取りデータを取得することと、
（ｄ）整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
（ｅ）該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、ベイジアン法を用いて、例えば、変異を呼び出すこと）と、を含み、
それにより、該腫瘍試料を分析し、
ここで、任意に、
Ｘ個の固有の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々からの読み取りデータは、固有の整列法で整列され、固有の対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、他のＸ－１個の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）とは異なることを意味し、固有の整列法は、他のＸ－１個の整列法とは異なることを意味し、Ｘは、少なくとも２である。

実施形態において、本方法は、サブゲノム区間に対応するメンバー及び発現サブゲノム区間に対応するメンバーが各々得られるライブラリを取得することを含む。

実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第１のライブラリを取得することと、発現サブゲノム区間に対応するメンバーが得られる第２のライブラリを取得することと、を含む。

実施形態において、ベイトセットは、サブゲノム区間及び発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために使用される。

実施形態において、第１のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第２のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。

実施形態において、ステップ（ｂ）は、存在する。実施形態において、ステップ（ｂ）は、存在しない。

実施形態において、Ｘは、少なくとも３、４、５、１０、１５、２０、３０、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００である。

実施形態において、少なくともＸ個の遺伝子、例えば、表１～４または図３Ａ～４Ｄからの少なくともＸ個の遺伝子からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、固有の整列法で整列され、Ｘは、２、３、４、５、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、またはそれ以上と等しい。

実施形態において、方法（例えば、上述される方法の要素（ｄ））は、読み取りデータを分析する、例えば、整列させるための整列法を選択または使用することを含み、
ここで、該整列法は、
（ｉ）腫瘍型、例えば、該試料中の腫瘍型、
（ｉｉ）配列決定されている該対象区間（例えば、サブゲノム区間または発現サブゲノム区間）が位置する遺伝子または遺伝子の型、例えば、事前選択されているまたは変異形もしくは変異形の種類、例えば、変異を特徴とするか、あるいは事前選択された頻度の変異を特徴とする遺伝子または遺伝子の型、
（ｉｉｉ）分析されている部位（例えば、ヌクレオチド位置）、
（ｉｖ）評価されている対象区間（例えば、サブゲノム区間または発現サブゲノム区間）内の変異形の種類、例えば、置換、
（ｖ）試料の種類、例えば、ＦＦＰＥ試料、血液試料、または骨髄穿刺液試料、及び
（ｖｉ）評価されている該サブゲノム区間内またはその付近の配列、例えば、該対象区間（例えば、サブゲノム区間または発現サブゲノム区間）の誤整列に対して予想される傾向、例えば、該対象区間（例えば、サブゲノム区間または発現サブゲノム区間）内またはその付近の反復配列の存在、のうちの１つ以上または全ての関数であるか、それらに応じて選択されるか、またはそれらに対して最適化される。

本方法は、本明細書の他の箇所で言及されるように、比較的多くの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対する読み取りデータの整列が最適化される場合、特に有効である。故に、実施形態において、少なくともＸ個の固有の整列法が少なくともＸ個の固有のサブゲノム区間に対する読み取りデータを分析するために使用され、ここで、固有のとは、他のＸ－１個とは異なることを意味し、Ｘは、２、３、４、５、１０、１５、２０、３０、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、またはそれ以上と等しい。

実施形態において、表１～４または図３Ａ～４Ｄからの少なくともＸ個の遺伝子からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、分析され、Ｘは、２、３、４、５、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、またはそれ以上と等しい。

実施形態において、固有の整列法は、少なくとも３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、または５００個の異なる遺伝子の各々における対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に適用される。

実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０、１６０もしくは１８０、２００、３００、４００、または５００個の遺伝子、例えば、表１～４または図３Ａ～４Ｄからの遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の整列法は、分析される該遺伝子の少なくとも１０、２０、３０、４０、または５０％の各々における対象区間（例えば、サブゲノム区間または発現サブゲノム区間）に適用される。

本明細書に開示される方法は、煩雑な読み取りデータ、例えば、再編成を有する読み取りデータの急速及び効率的な整列を可能にする。故に、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）に対する読み取りデータが再編成、例えば、転座されたヌクレオチド位置を含む実施形態において、本方法は、適切に調節され、かつ
読み取りデータとの整列のための、事前選択されて、事前選択された再編成と整列される該再編成参照配列を選択すること（実施形態において、参照配列は、ゲノム再編成と同一ではない）、
読み取りデータを該事前選択された再編成参照配列と比較すること、例えば、整列させることを含む整列法を使用することを含み得る。

実施形態において、煩雑な読み取りデータを整列させるために他の方法が使用される。これらの方法は、比較的多くの多様なサブゲノム区間に対する読み取りデータの整列が最適化される場合、特に有効である。例として、腫瘍試料を分析する方法は、
第１のパラメータのセット（例えば、第１のマッピングアルゴリズム、または第１の参照配列を用いて）の下で読み取りデータの比較、例えば、整列比較を行い、該読み取りデータが第１の所定の整列基準を満たすか（例えば、読み取りデータが該第１の参照配列と、例えば、事前選択された不一致の数未満で整列され得るか）否かを判定することと、
該読み取りデータが第１の所定の整列基準を満たさない場合、第２のパラメータのセット（例えば、第２のマッピングアルゴリズム、または第２の参照配列を用いて）の下で第２の整列比較を行うことと、
任意に、該読み取りデータが該第２の所定の基準を満たす（例えば、読み取りデータが該第２の参照配列と、事前選択された不一致の数未満で整列され得るか）否かを判定することと、を含み得、
ここで、該第２のパラメータのセットは、パラメータのセット、例えば、該第２の参照配列を使用することを含み、これは、該第１のパラメータのセットと比較して、事前選択された変異形、例えば、再編成、例えば、挿入、欠失、または転座に対する読み取りデータとの整列をもたらす可能性がより高くなる。

これら及び他の整列法は、本明細書の他の箇所、例えば、「発明を実施するための形態」内の「整列」という題名の項でより詳細に論じられる。そのモジュールの要素は、腫瘍を分析する方法に含められ得る。実施形態において、「整列」（「発明の概要」及び／または「発明を実施するための形態」内）という題名の項からの整列法は、「変異呼び出し」（「発明の概要」及び／または「発明を実施するための形態」内）という題名の項からの変異呼び出し法、及び／または「ベイト」（「発明の概要」内）という題名の項及び／または「ベイトの設計及び構築」及び「ベイト合成」「発明を実施するための形態」内）という題名の項からのベイトセットと組み合わせられる。本方法は、「遺伝子選択」（「発明の概要」及び／または「発明を実施するための形態」内）という題名の項からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットに適用され得る。

変異呼び出し
本明細書に開示される方法は、カスタマイズまたは調節される変異呼び出しパラメータの使用を統合して、配列決定法において、特に、例えば、腫瘍試料からの、例えば、本明細書に記載されるがん由来の、多くの多様な遺伝子における多くの多様な遺伝的事象の超並行配列決定法に依存する方法において能力を最適化し得る。本方法の実施形態において、いくつかの事前選択された対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々に対する変異呼び出しは、個別にカスタマイズされるか、または微調節される。カスタマイズ化または調節することは、本明細書に記載される因子のうちの１つ以上、例えば、試料中のがんの型、配列決定される対象区間（例えば、サブゲノム区間または発現サブゲノム区間）が位置する遺伝子、または配列決定される変異形に基づき得る。配列決定されるいくつかの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対して微調節される整列条件のこの選択または使用によって、速度、感度、及び特異性の最適化が可能になる。本方法は、比較的多くの多様な対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対する読み取りデータの整列が最適化される場合、特に有効である。

したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍（または、前悪性腫瘍）、例えば、本明細書に記載される血液悪性腫瘍（または、前悪性腫瘍）からの腫瘍試料を分析する方法を特徴とする。本方法は、
（ａ）試料から複数のメンバー、例えば、試料、例えば、腫瘍試料から複数の腫瘍メンバーを含む１つまたは複数のライブラリを取得することと、
（ｂ）任意に、例えば、ライブラリを、ベイトセット（または、複数のベイトセット）と接触させることによって、事前選択された配列に対する１つまたは複数のライブラリを富化して、選択されたメンバー、例えば、ライブラリキャッチを提供することと、
（ｃ）例えば、配列決定することを含む方法によって、例えば、次世代配列決定法を用いて、該ライブラリまたはライブラリキャッチからのメンバー、例えば、腫瘍メンバーから、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）に対する読み取りデータを取得することと、
（ｄ）整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
（ｅ）該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、本明細書に記載されるベイジアン法または呼び出し法を用いて、例えば、変異を呼び出すこと）と、を含み、
それにより、該腫瘍試料を分析する。
ここで、任意に、ヌクレオチド値は、固有の呼び出し法によってＸ個の固有の対象区間（サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々においてヌクレオチド位置に割り当てられ、固有の対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、他のＸ－１個の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）とは異なることを意味し、固有の呼び出し法は、他のＸ－１個の呼び出し法とは異なることを意味し、Ｘは、少なくとも２である。呼び出し法は異なり得、それにより、例えば、異なるベイジアン先行値に依存することによって、固有であり得る。

実施形態において、該ヌクレオチド値を割り当てることは、腫瘍型において該事前選択されたヌクレオチド位置で、事前選択された変異形、例えば、変異を示す読み取りデータを観察する先行（例えば、文献）期待値であるかまたはそれを表す値の関数である。

実施形態において、本方法は、少なくとも１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）を含み、ここで、各割り当ては、腫瘍型において該事前選択されたヌクレオチド位置で、事前選択された変異形、例えば、変異を示す読み取りデータを観察する先行（例えば、文献）期待値であるかまたはそれを表す固有（他の割り当てに対する値とは対照的）の値の関数である。

実施形態において、該ヌクレオチド値を割り当てることは、変異形がある頻度（例えば、１％、５％、または１０％など）で試料中に存在する場合、及び／または変異形が存在しない（例えば、塩基呼び出しエラーのみに起因して読み取りデータで観察される）場合、該事前選択されたヌクレオチド位置で該事前選択された変異形を示す読み取りデータを観察する確率を表す値のセットの関数である。

実施形態において、方法（例えば、上述される方法のステップ（ｅ））は、変異呼び出し法を含む。本明細書に記載される変異呼び出し法は、次の：
該Ｘ個の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々における事前選択されたヌクレオチド位置に対して、
（ｉ）腫瘍型Ｘにおいて該事前選択されたヌクレオチド位置で、事前選択された変異形、例えば、変異を示す読み取りデータを観察する先行（例えば、文献）期待値であるか、またはそれを表す第１の値、及び
（ｉｉ）変異形がある頻度（例えば、１％、５％、１０％など）で試料中に存在する場合、及び／または変異形が存在しない（例えば、塩基呼び出しエラーのみに起因して読み取りデータで観察される）場合、該事前選択されたヌクレオチド位置で該事前選択された変異形を示す読み取りデータを観察する確率を表す第２の値のセットを取得すること、
該値に応じて、第１の値を使用して第２のセット中の値の間で比較を、例えば、本明細書に記載されるベイジアン法によって重み付けする（例えば、変異の存在の事後確率を計算する）ことにより、該読み取りデータから該事前選択されたヌクレオチド位置の各々にヌクレオチド値を割り当て（例えば、変異を呼び出し）、それにより、該試料を分析すること、を含み得る。

実施形態において、本方法は、次のうちの１つ以上または全てを含む：
（ｉ）少なくとも１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１０００個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、各割り当ては、（他の割り当てとは対照的に）固有の第１及び／または第２の値に基づく、割り当てること；
（ｉｉ）割り当ての少なくとも１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、または５００は、例えば、事前選択された腫瘍型における細胞の、５、１０、または２０％未満で事前選択された変異形が存在する確率の関数である第１の値を用いて行われる、（ｉ）の方法の割り当て；
（ｉｉｉ）少なくともＸ個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、この各々は、事前選択された腫瘍型、例えば、該試料の腫瘍型中に存在する（他のＸ－１個の割り当てとは対照的に）固有の確率を有する事前選択された変異形に関連し、ここで、任意に、Ｘ個の割り当ての各々は、（他のＸ－１個の割り当てとは対照的に）固有の第１及び／または第２の値に基づく（ここで、Ｘ＝２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、または５００）、割り当てること；
（ｉｖ）第１及び第２のヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、ここで、該第１のヌクレオチド位置で第１の事前選択された変異形が事前選択された腫瘍型（例えば、該試料の腫瘍型）中に存在する尤度は、該第２のヌクレオチド位置で第２の事前選択された変異形が存在する尤度よりも少なくとも２、５、１０、２０、３０、または４０倍大きく、各割り当ては、任意に（他の割り当てとは対照的に）固有の第１及び／または第２の値に基づく、割り当てること；
（ｖ）複数の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、該複数のものは、次の確率範囲のうちの１つ以上、例えば、少なくとも３、４、５、６、７、または全てに入る変異形に対する割り当てを含み：
０．０１以下、
０．０１超～０．０２以下、
０．０２超～０．０３以下、
０．０３超～０．０４以下、
０．０４超～０．０５以下、
０．０５超～０．１以下、
０．１超～０．２以下、
０．２超～０．５以下、
０．５超～１．０以下、
１．０超～２．０以下、
２．０超～５．０以下、
５．０超～１０．０以下、
１０．０超～２０．０以下、
２０．０超～５０．０以下、及び
５０超～１００．０％以下、
ここで、確率範囲は、事前選択されたヌクレオチド位置での事前選択された変異形が事前選択された腫瘍型（例えば、該試料の腫瘍型）中に存在する確率、または事前選択されたヌクレオチド位置での事前選択された変異形が腫瘍試料中の細胞、腫瘍試料からのライブラリ、もしくは事前選択された型（例えば、該試料の腫瘍型）に対するそのライブラリからのライブラリキャッチの記載される％で腫瘍中に存在する確率の範囲であり；
任意に、各割り当ては、固有の第１及び／または第２の値に基づく（例えば、記載される確率範囲での他の割り当てとは対照的に固有であるか、または他の列挙される確率範囲のうちの１つ以上もしくは全てに対する第１の及び／または第２の値とは対照的に固有である）、割り当てること。
（ｖｉ）該試料中のＤＮＡの５０、４０、２５、２０、１５、１０、５、４、３、２、１、０．５、０．４、０．３、０．２、または０．１％未満で存在する事前選択された変異形を各々独立して有する、少なくとも１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、ここで、任意に、各割り当ては、（他の割り当てとは対照的に）固有の第１及び／または第２の値に基づく、割り当てること；
（ｖｉｉ）第１及び第２のヌクレオチド位置にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、ここで、該試料のＤＮＡ中の第１の位置での事前選択された変異形の尤度は、該試料のＤＮＡ中の該第２のヌクレオチド位置での事前選択された変異形の尤度よりも少なくとも２、５、１０、２０、３０、または４０倍大きく、ここで、任意に、各割り当ては、（他の割り当てとは対照的に）固有の第１及び／または第２の値に基づく、割り当てること；
（ｖｉｉｉ）次のうちの１つ以上または全てにおいてヌクレオチド値を割り当てることであって、（例えば、変異を呼び出すこと）：
（１）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の１％未満で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（２）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の１～２％で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（３）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の２％超～３％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（４）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の３％超～４％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（５）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の４％超～５％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（６）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の５％超～１０％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（７）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の１０％超～２０％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（８）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の２０％超～４０％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
（９）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の４０％超～５０％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；または
（１０）該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の５０％超～１００％以下で存在する事前選択された変異形を有する、少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置；
ここで、任意に、各割り当ては、固有の第１及び／または第２の値に基づく（例えば、記載される範囲での他の割り当てとは対照的に固有であるか（例えば、１％未満の（１）における範囲）、または他の列挙される範囲のうちの１つ以上もしくは全てにおける決定に対する第１及び／または第２の値とは対照的に固有である）、割り当てること；あるいは
（ｉｘ）Ｘ個のヌクレオチド位置の各々にヌクレオチド値を割り当てること（例えば、変異を呼び出すこと）であって、各ヌクレオチド位置は、独立して、他のＸ－１個のヌクレオチド位置での事前選択された変異形に関する尤度と比較すると固有である（該試料のＤＮＡ中に存在している事前選択された変異形の）尤度を有し、ここで、Ｘ個は、１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００以上であり、各割り当ては、（他の割り当てとは対照的に）固有の第１及び／または第２の値に基づく、割り当てること。

本方法の実施形態において、「閾値」は、読み取りデータを評価するために、及び読み取りデータから、例えば、遺伝子における特定の位置で変異を呼び出して、ヌクレオチド位置に対する値を選択するために使用される。本方法の実施形態において、いくつかの事前選択された対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々に対する閾値は、カスタマイズまたは微調節される。カスタマイズ化または調節することは、本明細書に記載される因子のうちの１つ以上、例えば、試料中のがんの型、配列決定される対象区間（サブゲノム区間または発現サブゲノム区間）が位置する遺伝子、または配列決定される変異形に基づき得る。これは、配列決定されるいくつかの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々に対して微調節された呼び出しを提供する。本方法は、比較的多くの多様なサブゲノム区間が分析される場合、特に有効である。

故に、別の実施形態において、腫瘍を分析する方法は、次の変異呼び出し法を含む：
該Ｘ個の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々に関して閾値を取得し、該取得されたＸ個の閾値の各々は、他のＸ－１個の閾値と比較して固有であり、それにより、Ｘ個の固有の閾値を提供し、
該Ｘ個の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々に対して、事前選択されたヌクレオチド位置に事前選択されたヌクレオチド値を有する読み取りデータの数の関数である実測値をその固有の閾値と比較し、それにより、該Ｘ個の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々にその固有の閾値を適用し、
任意に、該比較の結果に応じて、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てて、
ここで、Ｘは、２以上である。

実施形態において、本方法は、０．５、０．４、０．２５、０．１５、０．１０、０．０５、０．０４、０．０３、０．０２、または０．０１未満である確率の関数である第１の値を各々独立して有する、少なくとも２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることを含む。

実施形態において、本方法は、他のＸ－１個の第１の値と比較すると固有である第１の値を各々独立して有する、少なくともＸ個のヌクレオチド位置の各々にヌクレオチド値を割り当てることを含み、ここで、該Ｘ個の第１の値の各々は、０．５、０．４、０．２５、０．１５、０．１０、０．０５、０．０４、０．０３、０．０２、または０．０１未満である確率の関数であり、Ｘは、１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００以上である。

実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０、１６０もしくは１８０、２００、３００、４００、または５００個の遺伝子、例えば、表１～４または図３Ａ～４Ｄからの遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の第１及び／または第２の値は、分析される該遺伝子の少なくとも１０、２０、３０、４０、または５０％の各々における対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に適用される。

本方法の実施形態は、例えば、次の実施形態から分かるように、比較的多くの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対する閾値が最適化される場合、適用され得る。

実施形態において、固有の閾値は、少なくとも３、５、１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、または１，０００個の異なる遺伝子の各々において対象区間、例えば、サブゲノム区間または発現サブゲノム区間に適用される。

実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０、１６０もしくは１８０、２００、３００、４００、または５００個の遺伝子、例えば、表１～４または図３Ａ～４Ｄからの遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の閾値は、分析される該遺伝子の少なくとも１０、２０、３０、４０、または５０％の各々におけるサブゲノム区間に適用される。

実施形態において、表１～４または図３Ａ～４Ｄからの少なくとも５、１０、２０、３０、または４０個の遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の閾値は、分析される該遺伝子の少なくとも１０、２０、３０、４０、または５０％の各々における対象区間（例えば、サブゲノム区間または発現サブゲノム区間）に適用される。

これら及び他の変異呼び出し法は、本明細書の他の箇所、例えば、「変異」という題名の項でより詳細に論じられる。そのモジュールの要素は、腫瘍を分析する方法に含められ得る。実施形態において、「変異呼び出し」という題名の項からの整列法は、「整列」という題名の項からの整列法及び／または「ベイト」という題名の項からのベイトセットと組み合わせられる。本方法は、「遺伝子選択」という題名の項からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットに適用され得る。

ベイト
本明細書に記載される方法は、配列決定される標的核酸の選択のためのベイト、例えば、溶液ハイブリダイゼーションにおける使用のためのベイトの適切な選択によって、１名以上の対象からの、試料、例えば、本明細書に記載されるがん由来の腫瘍試料からの多くの遺伝子及び遺伝子産物の最適化配列決定を提供する。事前選択された選択効率を有するベイトセットに従って、様々な対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）、またはそれらの分類に対して選択効率を適合させる。この項で使用される場合、「選択効率」は、標的対象区間（複数可）（例えば、サブゲノム区間（複数可）、発現サブゲノム区間（複数可）、またはそれらの両方）に従って調整されるような配列カバレッジのレベルまたは深さを指す。

故に、方法（例えば、上述される方法のステップ（ｂ））は、ライブラリを、複数のベイトと接触させて、選択されたメンバー（例えば、ライブラリキャッチ）を提供することを含む。

したがって、一態様において、本発明は、試料、例えば、がん、例えば、本明細書に記載されるがん由来の腫瘍試料を分析する方法を特徴とする。本方法は、
（ａ）試料から複数のメンバー（例えば、標的メンバー）、例えば、腫瘍試料から複数の腫瘍メンバーを含む１つまたは複数のライブラリを取得することと、
（ｂ）１つまたは複数のライブラリをベイトセット（または、複数のベイトセット）と接触させて、選択されたメンバー（例えば、ライブラリキャッチ）を提供することと、
（ｃ）例えば、配列決定を含む方法によって、例えば、次世代配列決定法を用いて、該ライブラリまたはライブラリキャッチからのメンバー、例えば、腫瘍メンバーから、対象区間、例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方に対する読み取りデータを取得することと、
（ｄ）整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
（ｅ）該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、ベイジアン法または本明細書に記載される方法を用いて、例えば、変異を呼び出すこと）と、を含み、
それにより、該腫瘍試料を分析し、
ここで、任意に、本方法は、ライブラリを、複数の、例えば、少なくとも２、３、４、または５つのベイトまたはベイトセットと接触させることを含み、該複数の各ベイトまたはベイトセットは、（複数の他のベイトとは対照的に）固有の、事前選択された選択効率を有する。例えば、各固有のベイトまたはベイトセットは、配列決定の固有の深さを提供する。「ベイトセット」という用語は、本明細書で使用されるとき、１つのベイトまたは複数のベイト分子をまとめて指す。

実施形態において、本方法は、サブゲノム区間に対応するメンバー及び発現ゲノム区間に対応するメンバーが各々得られるライブラリを取得することを含む。

実施形態において、複数である第１のベイトセットの選択効率は、複数である第２のベイトセットの効率と少なくとも２倍異なる。実施形態において、第１及び第２のベイトセットは、少なくとも２倍異なる配列決定の深さを提供する。

実施形態において、本方法は、次のベイトセットのうちの１つまたは複数をライブラリと接触させることを含む：
ａ）約５００Ｘ以上の配列決定深さを提供するために、例えば、試料からの細胞のうちの５％以下で存在する変異を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット；
ｂ）約２００Ｘ以上、例えば、約２００Ｘ～約５００Ｘの配列決定深さを提供するために、例えば、試料からの細胞のうちの１０％以下で存在する変異を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット；
ｃ）約１０～１００Ｘの配列決定深さを提供するために、例えば、ｉ）異なる薬物を患者が代謝する能力を説明し得る薬理ゲノム（ＰＧｘ）一塩基多型（ＳＮＰ）、もしくはｉｉ）患者を固有に識別（例えば、フィンガープリント）するために使用され得るゲノムＳＮＰから選ばれる１つ以上のサブゲノム区間（例えば、エクソン）を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット；
ｄ）約５～５０Ｘの配列決定深さを提供するために、例えば、構造限界点、例えば、ゲノム転座もしくはインデルを検出するために、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む十分なメンバーを選択するベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために５～５０Ｘの配列対スパニング深さを必要とする。このようなベイトセットは、例えば、転座／インデルが起こり易いがん遺伝子を検出するために使用され得るか；または
ｅ）約０．１～３００Ｘの配列決定深さを提供するために、例えば、コピー数の変化を検出するために、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む十分なメンバーを選択するベイトセット。一実施形態において、配列決定深さは、コピー数の変化を検出するために約０．１～１０Ｘの配列決定深さの範囲である。他の実施形態において、配列決定深さは、ゲノムＤＮＡのコピー数の増加／減少またはヘテロ接合性喪失（ＬＯＨ）を評価するために使用されるゲノムＳＮＰ／遺伝子座を検出するために、約１００～３００Ｘの範囲である。このようなベイトセットは、例えば、増幅／欠失が起こり易いがん遺伝子を検出するために使用され得る。

配列決定深さのレベル（例えば、配列決定深さのＸ倍レベル）は、本明細書で使用されるとき、重複読み取りデータ、例えば、ＰＣＲ重複読み取りデータの検出及び除去後の読み取りデータ（例えば、固有の読み取りデータ）のカバレッジのレベルを指す。

一実施形態において、ベイトセットは、１つ以上の再編成、例えば、ゲノム再編成を含有するイントロンを含有する対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を選択する。このような実施形態において、ベイトセットは、選択効率を増加させるために反復配列が遮蔽されるように設計される。再編成が既知の連結配列を有する実施形態において、選択効率を増加させるために、連結配列に対して相補的なベイトセットが設計され得る。

実施形態において、本方法は、２つ以上の異なる標的カテゴリを捕捉するように設計されたベイトの使用を含み、各々のカテゴリは、異なるベイト設計方策を有する。実施形態において、本明細書に開示されるハイブリッド捕捉方法及び組成物は、標的配列の定められたサブセット（例えば、標的メンバー）を捕捉し、そのサブセットの外側のカバレッジを最小限にしながら、標的配列の均質なカバレッジを提供する。一実施形態において、標的配列は、ゲノムＤＮＡからの全エクソン、またはその選択されたサブセットを含む。別の実施形態において、標的配列は、大きな染色体領域、例えば、染色体アーム全体を含む。本明細書に開示される方法及び組成物は、複雑な標的核酸配列（例えば、核酸ライブラリ）に対してカバレッジの異なる深さ及びパターンを達成するための異なるベイトセットを提供する。

実施形態において、本方法は、１つまたは複数の核酸ライブラリの選択されたメンバー（例えば、ライブラリキャッチ）を提供することを含む。本方法は、
複数のメンバー、例えば、標的核酸メンバー（例えば、複数の腫瘍メンバー、参照メンバー、及び／またはＰＧｘメンバーを含む）を含む１つまたは複数のライブラリ（例えば、１つまたは複数の核酸ライブラリ）を提供すること、
１つまたは複数のライブラリを、例えば、溶液系の反応において、複数のベイト（例えば、オリゴヌクレオチドベイト）と接触させて、複数のベイト／メンバーハイブリッドを含むハイブリダイゼーション混合物を形成すること、
例えば、該ハイブリダイゼーション混合物を、該複数のベイト／メンバーハイブリッドの分離を可能にする結合実体と接触させることによって、該ハイブリダイゼーション混合物から複数のベイト／メンバーハイブリッドを分離し、
それにより、ライブラリキャッチ（例えば、１つまたは複数のライブラリからの核酸分子の、選択されたまたは富化された下位群）を提供することを含み、
ここで、任意に、複数のベイトは、次のうちの２つ以上を含む：
ａ）低頻度、例えば、約５％以下で出現する（すなわち、試料からの細胞のうちの５％がそれらのゲノムにおいて変化を保有する）変化（例えば、１つ以上の変異）に対する高レベルの感度を可能にするために、最大深さのカバレッジが必要とされる、高レベルの標的（例えば、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む１つ以上の腫瘍メンバー、例えば、遺伝子、エクソン、または塩基）を選択する第１のベイトセット。一実施形態において、第１のベイトセットは、約５００Ｘ以上の配列決定深さを必要とする変化（例えば、点変異）を含む腫瘍メンバーを選択する（例えば、それに相補的である）。
ｂ）ａ）における高レベルの標的よりも高い頻度、例えば、約１０％の頻度で出現する（すなわち、試料からの細胞のうちの１０％がそれらのゲノムにおいて変化を保有する）変化（例えば、１つ以上の変異）に対する高レベルの感度を可能にするために高いカバレッジが必要とされる、中レベルの標的（例えば、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む１つ以上の腫瘍メンバー、例えば、遺伝子、エクソン、または塩基）を選択する第２のベイトセット。一実施形態において、第２のベイトセットは、約２００Ｘ以上の配列決定深さを必要とする変化（例えば、点変異）を含む腫瘍メンバーを選択する（例えば、それに相補的である）。
ｃ）高レベルの感度を可能にするために、例えば、ヘテロ接合性の対立遺伝子を検出するために、低－中程度のカバレッジが必要とされる、低レベルの標的（例えば、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む１つ以上のＰＧｘメンバー、例えば、遺伝子、エクソン、または塩基）を選択する第３のベイトセット。例えば、ヘテロ接合性の対立遺伝子の検出は、高い検出信頼性を確保するために１０～１００Ｘの配列決定深さを必要とする。一実施形態において、第３のベイトセットは、ａ）患者が異なる薬物を代謝する能力を説明し得る薬理ゲノム（ＰＧｘ）一塩基多型（ＳＮＰ）、またはｂ）患者を固有に識別（例えば、フィンガープリント）するために使用され得るゲノムＳＮＰから選ばれる１つ以上の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方、例えば、エクソン）を選択し；
ｄ）例えば、ゲノム転座もしくはインデルなどの構造限界点を検出するために、低－中程度のカバレッジが必要とされる第１のイントロン標的（例えば、イントロン配列を含むメンバー）を選択する第４のベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために５～５０Ｘの配列対スパニング深さを必要とする。該第４のベイトセットは、例えば、転座／インデルが起こり易いがん遺伝子を検出するために使用され得るか、または
ｅ）コピー数の変化を検出する能力を改善するために低密度のカバレッジが必要とされる第２のイントロン標的（例えば、イントロンメンバー）を選択する第５のベイトセット。例えば、いくつかの末端エクソンの１コピー欠失の検出は、高い検出信頼性を確保するために０．１～３００Ｘのカバレッジを必要とする。一実施形態において、カバレッジの深さは、コピー数の変化を検出するために約０．１～１０Ｘの範囲である。他の実施形態において、カバレッジの深さは、ゲノムＤＮＡのコピー数の増加／減少またはヘテロ接合性喪失（ＬＯＨ）を評価するためのゲノムＳＮＰ／遺伝子座を検出するために、約１００～３００Ｘの範囲である。該第５のベイトセットは、例えば、増幅／欠失が起こり易いがん遺伝子を検出するために使用され得る。

前述のベイトセットのうちの２、３、４、またはそれ以上の任意の組み合わせ、例えば、第１及び第２のベイトセット、第１及び第３のベイトセット、第１及び第４のベイトセット、第１及び第５のベイトセット、第２及び第３のベイトセット、第２及び第４のベイトセット、第２及び第５のベイトセット、第３及び第４のベイトセット、第３及び第５のベイトセット、第４及び第５のベイトセット、第１、第２、及び第３のベイトセット、第１、第２、及び第４のベイトセット、第１、第２、及び第５のベイトセット、第１、第２、第３、第４のベイトセット、第１、第２、第３、第４、及び第５のベイトセットなどの組み合わせが使用され得る。

一実施形態において、第１、第２、第３、第４、または第５のベイトセットの各々は、事前選択された選択（例えば、捕捉）効率を有する。一実施形態において、選択効率に対する値は、ａ）～ｅ）による全５つのベイトのうちの少なくとも２、３、４個に関して同じである。他の実施形態において、選択効率に対する値は、ａ）～ｅ）による全５つのベイトのうちの少なくとも２、３、４個に関して異なる。

いくつかの実施形態において、少なくとも２、３、４、または５個全てのベイトセットは、異なる事前選択された効率値を有する。例えば、次のうちのより多くのうちの１つから選ばれた選択効率に対する値は：
（ｉ）第１の事前選択された効率は、少なくとも約５００Ｘ以上の配列決定深さである第１の選択効率に対する値を有するか（例えば、第２、第３、第４、または第５の事前選択された選択効率よりも大きい選択効率に対する値を有する（例えば、第２の選択効率に対する値よりも約２～３倍大きく、第３の選択効率に対する値よりも約５～６倍大きく、第４の選択効率に対する値よりも約１０倍大きく、第５の選択効率に対する値よりも約５０～５０００倍大きい）、
（ｉｉ）第２の事前選択された効率は、少なくとも約２００Ｘ以上の配列決定深さである第２の選択効率に対する値を有し、例えば、第３、第４、もしくは第５の事前選択された選択効率よりも大きい選択効率に対する値を有するか（例えば、第３の選択効率に対する値よりも約２倍大きく、第４の選択効率に対する値よりも約４倍大きく、第５の選択効率に対する値よりも約２０～２０００倍大きい）、
（ｉｉｉ）第３の事前選択された効率は、少なくとも約１００Ｘ以上の配列決定深さである第３の選択効率に対する値を有し、例えば、第４もしくは第５の事前選択された選択効率よりも大きい選択効率に対する値を有するか（例えば、第４の選択効率に対する値よりも約２倍大きく、第５の選択効率に対する値よりも約１０～１０００倍大きい）、
（ｉｖ）第４の事前選択された効率は、少なくとも約５０Ｘ以上の配列決定深さである第４の選択効率に対する値を有し、例えば、第５の事前選択された選択効率よりも大きい選択効率に対する値を有するか（例えば、第５の選択効率に対する値よりも約５０～５００倍大きい）、または
（ｖ）第５の事前選択された効率は、少なくとも約１０Ｘ～０．１Ｘの配列決定深さである第５の選択効率に対する値を有する。

ある特定の実施形態において、選択効率に対する値は、異なるベイトセットの差次的な表示、ベイトサブセットの差次的な重複、差次的なベイトパラメータ、異なるベイトセットの混合、及び／または異なる種類のベイトセットの使用のうちの１つ以上によって改変される。例えば、選択効率の変動（例えば、各ベイトセット／標的カテゴリの相対的配列カバレッジ）は、次のうちの１つ以上を変化させることによって調整され得る：
（ｉ）異なるベイトセットの差次的な表示－所与の標的（例えば、標的メンバー）を捕捉するためのベイトセット設計は、より多くの／より少ないコピー数に含まれて、相対的な標的カバレッジの深さを増強／低減させ得る；
（ｉｉ）ベイトサブセットの差次的な重複－所与の標的（例えば、標的メンバー）を捕捉するためのベイトセット設計は、近隣ベイト間のより長いかまたはより短い重複を含み、相対的な標的カバレッジの深さを増強／低減させ得る；
（ｉｉｉ）差次的なベイトパラメータ－所与の標的（例えば、標的メンバー）を捕捉するためのベイトセット設計は、配列修飾／より短い長さを含み、捕捉効率を低減させ、相対的な標的カバレッジの深さを低下させ得る；
（ｉｖ）異なるベイトセットの混合－異なる標的セットを捕捉するように設計されるベイトセットは、異なるモル比で混合されて、相対的な標的カバレッジの深さを増強／低減させ得る；
（ｖ）異なる種類のオリゴヌクレオチドベイトセットの使用－ある特定の実施形態において、ベイトセットは次のものを含み得る：
（ａ）１つ以上の化学的に（例えば、非酵素的に）合成された（例えば、個別に合成された）ベイト、
（ｂ）アレイにおいて合成された１つ以上のベイト、
（ｃ）１つ以上の酵素的に調製された、例えば、インビトロで転写されたベイト、
（ｄ）（ａ）、（ｂ）、及び／もしくは（ｃ）の任意の組み合わせ、
（ｅ）１つ以上のＤＮＡオリゴヌクレオチド（例えば、天然または非天然のＤＮＡオリゴヌクレオチド）、
（ｆ）１つ以上のＲＮＡオリゴヌクレオチド（例えば、天然または非天然のＲＮＡオリゴヌクレオチド）、
（ｇ）（ｅ）及び（ｆ）の組み合わせ、または
（ｈ）上記のいずれかの組み合わせ。

異なるオリゴヌクレオチドの組み合わせは、異なる比、例えば、１：１、１：２、１：３、１：４、１：５、１：１０、１：２０、１：５０、１：１００、１：１０００などから選ばれる比で混合され得る。一実施形態において、化学合成されたベイト対アレイ生成ベイトの比は、１：５、１：１０、または１：２０から選ばれる。ＤＮＡまたはＲＮＡオリゴヌクレオチドは、天然または非天然であり得る。ある特定の実施形態において、ベイトは、例えば、融解温度を上昇させるために１つ以上の非天然ヌクレオチドを含む。例示的な非天然オリゴヌクレオチドには、修飾ＤＮＡまたはＲＮＡヌクレオチドが含まれる。例示的な修飾ヌクレオチド（例えば、修飾ＲＮＡまたはＤＮＡヌクレオチド）には、ロックド核酸（ＬＮＡ）（ＬＮＡヌクレオチドのリボース部分が２’酸素及び４’炭素を連結する余分な架橋で修飾される）；ペプチド核酸（ＰＮＡ）、例えば、ペプチド結合によって連結された繰り返しＮ－（２－アミノエチル）－グリシン単位から構成されるＰＮＡ；低ＧＣ領域を捕捉するように修飾されたＤＮＡまたはＲＮＡオリゴヌクレオチド；二環式核酸（ＢＮＡ）；架橋オリゴヌクレオチド；修飾５－メチルデオキシシチジン；及び２，６－ジアミノプリンが含まれるがこれらに限定されない。他の修飾ＤＮＡ及びＲＮＡヌクレオチドが当技術分野で知られている。

ある特定の実施形態において、標的配列（例えば、標的メンバー）の実質的に均一または均質なカバレッジが得られる。例えば、各ベイトセット／標的カテゴリ内で、カバレッジの均一性は、ベイトパラメータを修飾することによって、例えば次のうちの１つ以上によって最適化され得る：
（ｉ）同じカテゴリ中の他の標的に対して過小／過剰にカバーされる標的（例えば、標的メンバー）のカバレッジを増強／低減させるために、ベイト表示もしくは重複を増加／減少させることが使用され得るか、
（ｉｉ）標的配列（例えば、高ＧＣ含量配列）を捕捉することが困難である低カバレッジに関して、例えば、近接配列（例えば、ＧＣリッチ度がより低い近接配列）をカバーするようにベイトセットで標的化されている領域を拡大するか、
（ｉｉｉ）ベイトの二次構造を低減させ、その選択効率を増強させるために、ベイト配列を修飾することが使用され得るか、
（ｉｖ）同じカテゴリ内の異なるベイトの融解ハイブリダイゼーション速度を等しくするために、ベイトの長さを変更することが使用され得る。（長さが様々なベイトを産生することによって）直接、もしくは（一貫した長さのベイトを産生し、ベイト末端をランダムな配列で置き換えることによって）間接的にベイトの長さを変更し得るか、
（ｖ）同じ標的領域（すなわち、フォワード及びリバース鎖）に対して異なる配向のベイトを修飾することによって、結合効率が異なり得る。各標的に対して最適のカバレッジを提供するいずれかの配向を有するベイトセットが選択され得るか、
（ｖｉ）各ベイト上に存在する結合実体、例えば、捕捉タグ（例えば、ビオチン）の量を変更することによって、その結合効率が影響を受け得る。相対的な標的カバレッジを増強／低減させるために、特定の標的を標的とするベイトのタグレベルを増加／減少させることが使用され得るか、
（ｖｉｉ）標的への結合親和性に影響を及ぼし、相対的な標的カバレッジを増強／低減させるために、異なるベイトに対して使用されるヌクレオチドの種類の変更が使用され得るか、または
（ｖｉｉｉ）高ＧＣ含量に対して低いもしくは正常なＧＣ含量の領域間での融解ハイブリダイゼーション速度を等しくするために、修飾オリゴヌクレオチドベイトを使用すること、例えば、より安定した塩基対形成を有することが使用され得る。

例えば、異なる種類のオリゴヌクレオチドベイトセットが使用され得る。

一実施形態において、選択効率に対する値は、事前選択された標的領域を包含するために異なる種類のベイトオリゴヌクレオチドを使用することによって変更される。例えば、第１のベイトセット（例えば、１０，０００～５０，０００のＲＮＡまたはＤＮＡベイトを含むアレイに基づくベイトセット）は、大きな標的範囲（例えば、１～２ＭＢの全標的範囲）をカバーするために使用され得る。第１のベイトセットは、第２のベイトセット（例えば、５，０００個未満のベイトを含む個別に合成されたＲＮＡまたはＤＮＡベイトセット）に添加されて、事前選択された標的領域（例えば、標的範囲の対象とするスパニング、例えば、２５０ｋｂ以下の選択されたサブゲノム区間）、及び／またはより高い二次構造、例えば、より高いＧＣ含量の領域をカバーし得る。対象とする選択された対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、本明細書に記載される遺伝子もしくは遺伝子産物、またはそれらの断片のうちの１つ以上に対応し得る。第２のベイトセットは、所望のベイト重複に応じて、約１～５，０００、２～５，０００、３～５，０００、１０～５，０００、１００～５，０００、５００～５，０００、１００～５，０００、１，０００～５，０００、２，０００～５，０００個のベイトを含み得る。他の実施形態において、第２のベイトセットは、第１のベイトセットに添加される選択されたオリゴベイト（例えば、４００、２００、１００、５０、４０、３０、２０、１０、５、４、３、２、または１個未満のベイト）を含み得る。第２のベイトセットは、個別のオリゴベイトの任意の比で混合され得る。例えば、第２のベイトセットは、１：１の等モル比として存在する個別のベイトを含み得る。あるいは、第２のベイトセットは、例えば、ある特定の標的（例えば、ある特定の標的は、他の標的と比較して５～１０Ｘの第２のベイトセットを有し得る）の捕捉を最適化するために、異なる比（例えば、１：５、１：１０、１：２０）で存在する個別のベイトを含み得る。

他の実施形態において、ベイトの当モル混合物を使用した場合に観察される差次的な配列捕捉効率に関連してベイトの相対的存在量または結合実体の密度（例えば、ハプテンまたは親和性タグ密度）を調整し、次いで、第２の群のベイトに対して、全体的なベイト混合物に差次的過剰量の第１群のベイトを導入することによって、群内の個別のベイト（例えば、第１、第２、または第３の複数のベイト）の効率を等しくすることによって、選択効率が調整される。

実施形態において、本方法は、腫瘍メンバー、例えば、腫瘍細胞からの対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む核酸分子を選択するベイトセット（本明細書で「腫瘍ベイトセット」とも称される）を含む複数のベイトセットの使用を含む。腫瘍メンバーは、腫瘍細胞中に存在する任意のヌクレオチド配列、例えば、腫瘍またはがん細胞中に存在する本明細書に記載されるような変異型、野生型、ＰＧｘ、参照、またはイントロンヌクレオチド配列であり得る。一実施形態において、腫瘍メンバーは、低頻度で出現する変化（例えば、１つ以上の変異）を含み、例えば、腫瘍試料からの細胞の約５％以下は、それらのゲノムにおいて変化を保有する。他の実施形態において、腫瘍メンバーは、腫瘍試料からの細胞の約１０％の頻度で出現する変化（例えば、１つ以上の変異）を含む。他の実施形態において、腫瘍メンバーは、ＰＧｘ遺伝子または遺伝子産物からのサブゲノム区間、イントロン配列、例えば、本明細書に記載されるようなイントロン配列、腫瘍細胞中に存在する参照配列を含む。

別の態様において、本発明は、本明細書に記載されるベイトセット、本明細書に記載される個別のベイトセットの組み合わせ、例えば、本明細書に記載される組み合わせを特徴とする。ベイトセット（複数可）は、説明書、標準物質、緩衝液もしくは酵素、または他の試薬を任意に含み得るキットの一部であり得る。

遺伝子選択
分析のための事前選択された対象区間、例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方、例えば、遺伝子及び他の領域のセットまたは群に対するサブゲノム区間の群またはセットが本明細書に記載される。

故に、実施形態において、方法は、取得された核酸試料からの少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の遺伝子または遺伝子産物からの対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を、例えば、次世代配列決定法によって配列決定し、それにより、例えば、本明細書に記載されるがん由来の腫瘍試料を分析することを含み、ここで、遺伝子または遺伝子産物は、表１～４または図３Ａ～４Ｄから選ばれる。

したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍（または、前悪性腫瘍）、例えば、本明細書に記載される血液悪性腫瘍（または、前悪性腫瘍）からの腫瘍試料を分析する方法を特徴とする。本方法は、
（ａ）試料から複数メンバー、例えば、血液悪性腫瘍（または、前悪性腫瘍）、例えば、本明細書に記載される血液悪性腫瘍（または、前悪性腫瘍）からの腫瘍試料から複数の腫瘍メンバーを含む１つまたは複数のライブラリを取得することと、
（ｂ）任意に、例えば、１つまたは複数のライブラリを、ベイトセット（または、複数のベイトセット）と接触させることによって、事前選択された配列に対する１つまたは複数のライブラリを富化して、選択されたメンバー（例えば、ライブラリキャッチ）を提供することと、
（ｃ）例えば、配列決定することを含む方法によって、例えば、次世代配列決定法を用いて、該ライブラリまたはライブラリキャッチからのメンバー、例えば、腫瘍メンバーから、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）に対する読み取りデータを取得することと、
（ｄ）整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
（ｅ）該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること（例えば、ベイジアン法または本明細書に記載される方法を用いて、例えば、変異を呼び出すこと）と、を含み、
それにより、該腫瘍試料を分析し、
ここで、任意に、本方法は、試料からの少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の遺伝子または遺伝子産物からの対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を、例えば、次世代配列決定法によって配列決定することを含み、ここで、遺伝子または遺伝子産物は、表１～４または図３Ａ～４Ｄから選ばれる。

別の実施形態において、次のセットまたは群のうちの１つの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）を分析する。例えば、腫瘍またはがん遺伝子または遺伝子産物、参照（例えば、野生型）遺伝子または遺伝子産物、及びＰＧｘ遺伝子または遺伝子産物に関連する対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、腫瘍試料からサブゲノム区間の群またはセットを提供し得る。

実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットを取得し、ここで、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、次のうちの少なくとも１、２、３、４、５、６、７、または全てから選ばれる：
Ａ）表１～４または図３Ａ～４Ｄによる変異型または野生型遺伝子または遺伝子産物からの、少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の対象区間、例えば、サブゲノム区間、または発現サブゲノム区間、またはそれらの両方；
Ｂ）腫瘍またはがんに関連する遺伝子または遺伝子産物（例えば、陽性もしくは陰性治療応答予測因子であるか、陽性もしくは陰性予後因子であるか、または腫瘍もしくはがんの差次的な診断を可能とするもの、例えば、表１～４または図３Ａ～４Ｄによる遺伝子または遺伝子産物）からの少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）；
Ｃ）表１～４または図３Ａ～４Ｄから選ばれる、薬物代謝、薬物応答性、または毒性のうちの１つ以上に関連する遺伝子または遺伝子産物（本明細書において「ＰＧｘ」遺伝子とも称される）中に存在するサブゲノム区間の変異型または野生型遺伝子または遺伝子産物（例えば、一塩基多型（ＳＮＰ）からの少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）；
Ｄ）表１～４または図３Ａ～４Ｄから選ばれる、（ｉ）薬物で治療されたがん患者のより良好な生存率（例えば、パクリタキセルで治療された乳癌患者のより良好な生存率）、（ｉｉ）パクリタキセル代謝、（ｉｉｉ）薬物に対する毒性、または（ｉｖ）薬物に対する副作用のうちの１つ以上に関連する遺伝子または遺伝子産物中に存在する対象区間（例えば、サブゲノム区間または発現サブゲノム区間）の変異型または野生型ＰＧｘ遺伝子または遺伝子産物（例えば、一塩基多型（ＳＮＰ）からの少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）；
Ｅ）表１～４または図３Ａ～４Ｄによる少なくとも５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００個以上の遺伝子または遺伝子産物を伴う複数の転座変化；
Ｆ）例えば、事前選択された位置での対立遺伝子の多様性が事前選択された腫瘍型に関連し、該対立遺伝子の多様性が、該腫瘍型における細胞の５％未満で存在する、表１～４または図３Ａ～４Ｄから選択される少なくとも５個の遺伝子または遺伝子産物；
Ｇ）ＧＣリッチ領域に埋め込まれている、表１～４または図３Ａ～４Ｄから選択される少なくとも５個の遺伝子または遺伝子産物；あるいは
Ｈ）がん発症のための遺伝（例えば、生殖細胞リスク）要因を示す少なくとも５個の遺伝子または遺伝子産物（例えば、遺伝子または遺伝子産物は表１～４または図３Ａ～４Ｄから選ばれる）。

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットを取得し、ここで、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、表１に記載される遺伝子または遺伝子産物のうちの、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、または全てから選ばれる。

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットを取得し、ここで、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、表２に記載される遺伝子または遺伝子産物のうちの、５、６、７、８、９、１０、１５、２０、２５、３０、または全てから選ばれる。

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットを取得し、ここで、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、表３に記載される遺伝子または遺伝子産物のうちの、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、または全てから選ばれる。

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のセットを取得し、ここで、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、表４に記載される遺伝子または遺伝子産物のうちの、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、または全てから選ばれる。

これら及び他のサブゲノム区間のセット及び群は、本明細書の他の箇所、例えば、「遺伝子選択」という題名の項でより詳細に論じられる。

本明細書に記載される方法のいずれも、次の実施形態のうちの１つ以上と組み合わせられ得る。

他の実施形態において、試料は腫瘍試料であり、例えば、１つ以上の前悪性または悪性細胞を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、悪性血液腫瘍（または前悪性腫瘍）、例えば、本明細書に記載される悪性血液腫瘍（または、前悪性腫瘍）から取得される。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組織腫瘍、または転移性病巣から取得される。他の実施形態において、試料、例えば、腫瘍試料は、外科的縁からの組織または細胞を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、腫瘍浸潤リンパ球を含む。試料は、組織学的に正常な組織であり得る。別の実施形態において、試料、例えば、腫瘍試料は、１つ以上の循環腫瘍細胞（ＣＴＣ）（例えば、血液試料から取得されるＣＴＣ）を含む。実施形態において、試料、例えば、腫瘍試料は、１つ以上の非悪性細胞を含む。実施形態において、試料、例えば、腫瘍試料は、１つ以上の腫瘍浸潤リンパ球を含む。

一実施形態において、本方法は、試料、例えば、本明細書に記載されるような腫瘍試料を取得することをさらに含む。試料は、直接的または間接的に取得され得る。実施形態において、試料は、悪性細胞及び非悪性細胞（例えば、腫瘍浸潤リンパ球）の両方を含有する試料から、例えば、単離または精製によって取得される。

他の実施形態において、本方法は、本明細書に記載される方法を使用して、試料、例えば、組織学的に正常な試料、例えば、外科的縁からの試料を評価することを含む。出願人は、組織学的に正常な組織から得られた試料（例えば、他の点では組織学的に正常な組織縁）が、本明細書に記載されるような変化を依然として有し得ることを発見した。故に、本方法は、検出された変化の存在に基づいて組織試料を再分類することをさらに含み得る。

別の実施形態において、取得されるかまたは分析される読み取りデータの少なくとも１０、２０、３０、４０、５０、６０、７０、８０、または９０％は、本明細書に記載される遺伝子、例えば、表１～４または図３Ａ～４Ｄからの遺伝子からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対するものである。

実施形態において、本方法で作製される変異呼び出しの少なくとも１０、２０、３０、４０、５０、６０、７０、８０、または９０％は、本明細書に記載される遺伝子または遺伝子産物、例えば、表１～４または図３Ａ～４Ｄからの遺伝子または遺伝子産物からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対するものである。

実施形態において、本方法において使用される固有の閾値の少なくとも１０、２０、３０、４０、５０、６０、７０、８０、または９０％は、本明細書に記載される遺伝子または遺伝子産物、例えば、表１～４または図３Ａ～４Ｄからの遺伝子または遺伝子産物からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対するものである。

実施形態において、アノテーションされるかまたは第３者に対して報告される変異呼び出しの少なくとも１０、２０、３０、４０、５０、６０、７０、８０、または９０％は、本明細書に記載される遺伝子または遺伝子産物、例えば、表１～４または図３Ａ～４Ｄからの遺伝子または遺伝子産物からの対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対するものである。

実施形態において、本方法は、腫瘍及び／または対照核酸試料（例えば、ＦＦＰＥ由来核酸試料）から得られたヌクレオチド配列読み取りデータを取得することを含む。

実施形態において、読み取りデータは、ＮＧＳ配列決定法によって提供される。

実施形態において、本方法は、核酸メンバーの１つまたは複数のライブラリを提供することと、該１つまたは複数のライブラリの複数のメンバーから、事前選択されたサブゲノム区間を配列決定することと、を含む。実施形態において、本方法は、配列決定のための該１つまたは複数のライブラリのサブセットを選択するステップ、例えば、溶液ベースの選択または固体支持体（例えば、アレイ）ベースの選択を含み得る。

実施形態において、本方法は、１つまたは複数のライブラリを複数のベイトと接触させて、核酸の選択下位群、例えば、ライブラリキャッチを提供するステップを含む。一実施形態において、接触ステップは、溶液ハイブリダイゼーションにおいて実施される。別の実施形態において、接触ステップは、固体支持体、例えば、アレイにおいて実施される。ある特定の実施形態において、本方法は、１回以上の追加のハイブリダイゼーションによってハイブリダイゼーションステップを反復することを含む。いくつかの実施形態において、本方法は、同じかまたは異なるベイト集合体を用いた１回以上の追加のハイブリダイゼーションにライブラリキャッチを供することをさらに含む。

さらに他の実施形態において、本方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定法、例えば、本明細書に記載されるような次世代配列決定法によって分析される。本方法は、例えば、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定によってそのライブラリキャッチを供することを含む。ある特定の実施形態において、ライブラリキャッチは、再配列決定され得る。次世代配列決定法は、当技術分野で知られており、例えば、Ｍｅｔｚｋｅｒ，Ｍ．（２０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：３１－４６に記載されている。

実施形態において、ヌクレオチド位置に対する割り当て値は、任意に、説明的なアノテーション付きで第３者に伝達される。

実施形態において、ヌクレオチド位置に対する割り当て値は、第３者に伝達されない。

実施形態において、複数のヌクレオチド位置に対する割り当て値は、任意に、説明的なアノテーション付きで、第３者に伝達され、第２の複数のヌクレオチド位置に対する割り当て値は第３者に伝達されない。

実施形態において、少なくとも０．０１、０．０２、０．０３、０．０４、０．０５、０．１、０．２、０．３、０．４、０．５、０．６、０．７、０．８、０．９、１．０、２．０、５．０、１０、１５、または３０メガ塩基、例えば、ゲノム塩基が配列決定される。

実施形態において、本方法は、少なくとも１つのＳＮＰを含む複数の読み取りデータを評価することを含む。

実施形態において、本方法は、試料及び／または対照読み取りデータ中のＳＮＰ対立遺伝子比を決定することを含む。

実施形態において、本方法は、例えば、バーコード解析によって、１つ以上の読み取りデータを対象に割り当てることを含む。

実施形態において、本方法は、例えば、バーコード解析によって、腫瘍読み取りデータまたは対照読み取りデータとして１つ以上の読み取りデータを割り当てることを含む。

実施形態において、本方法は、例えば、参照配列との整列によって、該１つ以上の読み取りデータの各々をマッピングすることを含む。

実施形態において、本方法は、呼び出された変異を提出することを含む。

実施形態において、本方法は、呼び出された変異をアノテーションすること、例えば、変異構造の指標を有する呼び出された変異、例えば、ミスセンス変異、または機能、例えば、疾患表現型をアノテーションすることを含む。

実施形態において、本方法は、腫瘍及び対照核酸に対するヌクレオチド配列読み取りデータを取得することを含む。

実施形態において、本方法は、例えば、ベイジアン呼び出し法または非ベイジアン呼び出し法を用いて、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）の各々に対する、ヌクレオチド値、例えば、変異形、例えば、変異を呼び出すことを含む。

実施形態において、例えば、異なる対象からの複数の試料が同時に処理される。

本明細書に開示される方法は、対象のゲノムまたはトランスクリプトームに存在する変化を検出するために使用され得、ＤＮＡ及びＲＮＡ配列決定、例えば、標的化ＲＮＡ及び／またはＤＮＡ配列決定に適用され得る。故に、本発明において取り上げられる別の態様は、本明細書に記載される変化を検出するための、標的化ＲＮＡ配列決定、例えば、試料、例えば、ＦＦＰＥ試料、血液試料、または骨髄穿刺液試料から取得されたＲＮＡ由来のｃＤＮＡの配列決定のための方法を含む。この変化は、再編成、例えば、遺伝子融合をコードする再編成であり得る。他の実施形態において、本方法は、遺伝子または遺伝子産物のレベルの変化（例えば、増加または減少）、例えば、本明細書に記載される遺伝子または遺伝子産物の発現の変化の検出を含む。任意に、本方法は、標的ＲＮＡに対して試料を富化するステップを含み得る。他の実施形態において、本方法は、ある特定の高存在量のＲＮＡ、例えば、リボソームまたはグロビンＲＮＡの試料を枯渇させるステップを含む。ＲＮＡ配列決定法は、単独で、または本明細書に記載されるＤＮＡ配列決定法と組み合わせて使用され得る。一実施形態において、本方法は、ＤＮＡ配列決定ステップ及びＲＮＡ配列決定ステップを行うことを含む。本方法は、任意の順序で行われ得る。例えば、本方法は、本明細書に記載される変化の発現をＲＮＡ配列決定することによって確認すること、例えば、本発明のＤＮＡ配列決定法によって検出される変異または融合の発現を確認することを含み得る。他の実施形態において、本方法は、ＲＮＡ配列決定ステップを行い、続いてＤＮＡ配列決定ステップを行うことを含む。

別の態様において、本発明は、標的化サブゲノム領域に対する配列決定／整列アーチファクトのデータベースを構築することを含む方法を特徴とする。実施形態において、データベースは、偽の変異呼び出しを除去し、特異性を改善するために使用され得る。実施形態において、データベースは、無関係の非腫瘍（例えば、ＦＦＰＥ、血液、または骨髄穿刺液）試料または細胞株の配列決定を行い、これらの正常試料のうちの１つ以上においてランダムな配列決定エラーのみに起因する、予想されるものよりも頻度が高いと思われる非参照対立遺伝子事象を記録することによって構築される。この手法は、生殖細胞変動をアーチファクトとして分類し得るが、それは、体細胞変異に関する方法では許容可能である。アーチファクトとしての生殖細胞変動のこの誤分類は、必要に応じて、既知の生殖細胞変動（共通変異形の除去）に対して、及び１個体のみに出現するアーチファクトに対して（希少変動の除去）、このデータベースをフィルタリングすることによって改善され得る。

本明細書に開示される方法は、例えば、ゲノムのがん関連分節に適用されるような、最適化されたベイトに基づく選択、最適化された整列、及び最適化された変異呼び出しを含むいくつかの最適化された要素の統合を可能にする。本明細書に記載される方法は、がんごと、遺伝子ごと、及び部位ごとに最適化され得る腫瘍のＮＧＳに基づく分析を提供する。これは、例えば、本明細書に記載される遺伝子／部位及び腫瘍型に適用され得る。本方法は、所与の配列決定技術を用いて変異検出に対する感度及び特異性のレベルを最適化する。がんごと、遺伝子ごと、及び部位ごとの最適化は、臨床製品にとって必須である非常に高いレベルの感度／特異性（例えば、両方に関して＞９９％）を提供する。

本明細書に記載される方法は、最適な治療及び疾患管理の決断を知らせるために、日常的な実在の試料からの、次世代配列決定技術を使用した、臨床及び規制グレードの包括的な分析、ならびに妥当に実施可能な遺伝子の包括的セット（これは、典型的には、５０～５００個の遺伝子の範囲であり得る）に対するゲノム異常の解釈を提供する。

本明細書に記載される方法は、最適治療及び疾患管理の判断を知らせるために、腫瘍試料を送付して、その腫瘍に対するゲノム及び他の分子の変化の包括的な分析及び説明を受領する腫瘍医／病理学者のためのワンストップショッピングを提供する。

本明細書に記載される方法は、標準的な入手可能な腫瘍試料を採取する堅牢で現実的な臨床腫瘍診断ツールを提供し、１つの試験で、どの異常が腫瘍の原因になり得、腫瘍医に治療判断を知らせるのに有用であり得るかの包括的な説明を腫瘍医に提供するために、包括的なゲノム及び他の分子異常分析を提供する。

本明細書に記載される方法は、臨床グレードの品質の、患者のがんゲノムの包括的な分析を提供する。方法は、最も関連性の高い遺伝子及び潜在的な変化を含み、変異（例えば、インデルまたは塩基置換）、コピー数、再編成、例えば、転座、発現、及びエピジェネティックマーカーの分析のうちの１つ以上を含む。遺伝子分析の結果は、実施可能な結果の記述的報告とともに状況を説明し得る。方法は、この使用を、関連する科学的及び医学的知識の最新のセットと結び付ける。

本明細書に記載される方法は、患者のケアの質及び効率の両方の向上を提供する。これは、標準治療がないかまたは確立された一連の療法が患者にとって無効であるような、腫瘍が稀であるかまたはあまり研究されていない型のものであり、追加の療法の選択のための、または臨床試験参加のための合理的基準が有用であり得る適用を含む。例えば、本方法は、療法の任意の時点で、腫瘍医が意思決定を知らせるために利用可能な完全な「分子イメージ」及び／または「分子サブ診断」を有することによって利益を得る選択を可能にする。

本明細書に記載される方法は、患者または別の者または実体、例えば、介護者、例えば、内科医、例えば、腫瘍医、病院、診療所、第３者の支払人、保険会社、もしくは官庁に対する、報告書、例えば、電子報告書、ウェブベース報告書、または書面報告書を提供することを含み得る。この報告書は、本方法からの結果、例えば、ヌクレオチド値の同定、試料の種類の腫瘍に関連する、例えば、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対する、変化、変異、または野生型配列の有無の指標を含み得る。報告書は、配列の役割における情報、例えば、疾患における変化、変異、または野生型配列も含み得る。このような情報は、予後、耐性、または潜在的もしくは示唆された療法選択肢に対する情報を含み得る。報告書は、療法選択肢の推定有効性、療法選択肢の許容性、または、本報告書で識別される患者、例えば、試験において、及び実施形態において識別される配列、変化を有する患者に対する療法選択肢の適用の適否に対する情報を含み得る。例えば、報告書は、薬物の投与、例えば、事前選択された用量での、または事前選択された治療レジメンでの、例えば、他の薬物と組み合わせられた、患者への投与に対する情報または推奨を含み得る。実施形態において、本方法で識別される変異の全てが報告書で識別されるわけではない。例えば、報告書は、例えば、事前選択された療法選択肢による治療に対するがんの発生、予後、ステージ、または易罹患性との事前選択された相関レベルを有する遺伝子における変異に限定され得る。本明細書において取り上げられる方法は、本方法を実施する実体による試料の受領から７日、１４日、または２１日以内に、例えば、本明細書に記載される実体に報告書を送付することを可能にする。

故に、本発明において取り上げられる方法は、例えば、試料の受領から７、１４、または２１日以内という、迅速な結果所用時間を可能にする。

本明細書に記載される方法は、組織学的に正常な試料、例えば、外科的縁からの試料を評価するためにも使用され得る。本明細書に記載されるような１つ以上の変化が検出される場合、組織は、例えば、悪性または前悪性として再分類され得、及び／または治療経過が変更され得る。

ある特定の態様において、本明細書に記載される配列決定法は、非がん用途、例えば、法医学用途（例えば、歯科記録の使用の代替としてまたはそれに加えた同定）、親子検査、ならびに例えば、中でも感染性疾患、自己免疫障害、嚢胞性線維症、ハンチントン病、アルツハイマー病に関する疾患の診断及び予後において有用である。例えば、本明細書に記載される方法による遺伝子変化の同定は、特定の障害を発症することに関しての個体の存在またはリスクを示し得る。

別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の技術者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様または同等の方法及び材料が本発明の実施または試験で使用され得るが、好適な方法及び材料が以下に記載される。本明細書で言及される全ての刊行物、特許出願、特許、及び他の参考文献は、参照によってその全体が組み込まれる。加えて、材料、方法、及び実施例は例示にすぎず、限定であることは意図されない。

本発明の他の特徴及び利点は、発明を実施するための形態、図面から、及び特許請求の範囲から明らかになるであろう。

腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。変異検出に対する先行期待値及び読み取りデータ深さの影響を示す。本明細書に記載される方法に従って、（例えば、固形腫瘍中の）評価され得る追加の例示的な遺伝子を示す。本明細書に記載される方法に従って、（例えば、固形腫瘍中の）評価され得る追加の例示的な遺伝子を示す。本明細書に記載される方法に従って、（例えば、血液悪性腫瘍または肉腫中の）評価され得る追加の例示的な遺伝子を示す。本明細書に記載される方法に従って、（例えば、血液悪性腫瘍または肉腫中の）評価され得る追加の例示的な遺伝子を示す。本明細書に記載される方法に従って、（例えば、血液悪性腫瘍または肉腫中の）評価され得る追加の例示的な遺伝子を示す。本明細書に記載される方法に従って、（例えば、血液悪性腫瘍または肉腫中の）評価され得る追加の例示的な遺伝子を示す。標的遺伝子から測定される全エクソーム変異負荷と変異負荷との間の相関を示す散布図を示す。標的遺伝子から測定される全エクソーム変異負荷と変異負荷との間の相関を示す散布図を示す。肺癌における腫瘍変異負荷分布を示す。１０，６７６ケースの肺腺癌腫（図７Ａ）、１，９６０ケースの肺扁平上皮細胞癌腫（図７Ｂ）、２２０ケースの肺大細胞癌腫（図７Ｃ）、及び７８４ケースの肺小細胞癌腫（図７Ｄ）の臨床検体、それぞれにおいて、ＴＭＢを包括的ゲノムプロファイリングによって決定した。肺癌における腫瘍変異負荷分布を示す。１０，６７６ケースの肺腺癌腫（図７Ａ）、１，９６０ケースの肺扁平上皮細胞癌腫（図７Ｂ）、２２０ケースの肺大細胞癌腫（図７Ｃ）、及び７８４ケースの肺小細胞癌腫（図７Ｄ）の臨床検体、それぞれにおいて、ＴＭＢを包括的ゲノムプロファイリングによって決定した。肺癌における腫瘍変異負荷分布を示す。１０，６７６ケースの肺腺癌腫（図７Ａ）、１，９６０ケースの肺扁平上皮細胞癌腫（図７Ｂ）、２２０ケースの肺大細胞癌腫（図７Ｃ）、及び７８４ケースの肺小細胞癌腫（図７Ｄ）の臨床検体、それぞれにおいて、ＴＭＢを包括的ゲノムプロファイリングによって決定した。肺癌における腫瘍変異負荷分布を示す。１０，６７６ケースの肺腺癌腫（図７Ａ）、１，９６０ケースの肺扁平上皮細胞癌腫（図７Ｂ）、２２０ケースの肺大細胞癌腫（図７Ｃ）、及び７８４ケースの肺小細胞癌腫（図７Ｄ）の臨床検体、それぞれにおいて、ＴＭＢを包括的ゲノムプロファイリングによって決定した。肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫（図８Ａ）、肺扁平上皮細胞癌腫（図８Ｂ）、肺大細胞癌腫（図８Ｃ）、及び肺小細胞癌腫（図８Ｄ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。肺癌の４つ全てのサブタイプ（図８Ｅ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫（図８Ａ）、肺扁平上皮細胞癌腫（図８Ｂ）、肺大細胞癌腫（図８Ｃ）、及び肺小細胞癌腫（図８Ｄ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。肺癌の４つ全てのサブタイプ（図８Ｅ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫（図８Ａ）、肺扁平上皮細胞癌腫（図８Ｂ）、肺大細胞癌腫（図８Ｃ）、及び肺小細胞癌腫（図８Ｄ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。肺癌の４つ全てのサブタイプ（図８Ｅ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫（図８Ａ）、肺扁平上皮細胞癌腫（図８Ｂ）、肺大細胞癌腫（図８Ｃ）、及び肺小細胞癌腫（図８Ｄ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。肺癌の４つ全てのサブタイプ（図８Ｅ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫（図８Ａ）、肺扁平上皮細胞癌腫（図８Ｂ）、肺大細胞癌腫（図８Ｃ）、及び肺小細胞癌腫（図８Ｄ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。肺癌の４つ全てのサブタイプ（図８Ｅ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。結腸直腸腺癌腫における腫瘍変異負荷分布を示す。６，７４２ケースの結腸腺癌腫（図９Ａ）及び１，１７６ケースの直腸腺癌腫（図９Ｂ）の臨床検体、それぞれにおいて、ＴＭＢを包括的ゲノムプロファイリングによって決定した。結腸直腸腺癌腫における腫瘍変異負荷分布を示す。６，７４２ケースの結腸腺癌腫（図９Ａ）及び１，１７６ケースの直腸腺癌腫（図９Ｂ）の臨床検体、それぞれにおいて、ＴＭＢを包括的ゲノムプロファイリングによって決定した。結腸直腸腺癌腫における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、結腸腺癌腫（図１０Ａ）及び直腸腺癌腫（図１０Ｂ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。結腸直腸腺癌腫（図１０Ｃ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。結腸直腸腺癌腫における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、結腸腺癌腫（図１０Ａ）及び直腸腺癌腫（図１０Ｂ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。結腸直腸腺癌腫（図１０Ｃ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。結腸直腸腺癌腫における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、結腸腺癌腫（図１０Ａ）及び直腸腺癌腫（図１０Ｂ）、それぞれにおいて、頻繁に入れ替わった２５個の遺伝子を識別した。結腸直腸腺癌腫（図１０Ｃ）の集合遺伝子保有率が示される。ＳＶ：短い変異形、ＣＮＡ：コピー数変化、ＲＥ：再編成、複合：同じ遺伝子における多数の種類の変化。は、２４種類の新生物における腫瘍変異負荷分布を示す。例えば、膀胱、脳、乳房、子宮頸部、頭頸部、肝臓、卵巣、膵臓、前立腺、皮膚、胃、及び子宮の腫瘍を含む合計１５５０８ケースの臨床検体において、ＴＭＢを包括的ゲノムプロファイリングによって決定した。

本発明は、例えば、ハイブリッド捕捉に基づく次世代配列決定（ＮＧＳ）プラットフォームを使用して、患者試料からのゲノムまたはエクソームの小画分をプロファイリングすることが、全ての変異荷重の分析に対して有効な代替法の役割を果たすという発見に少なくとも部分的に基づく。

理論に束縛されるものではないが、免疫原性腫瘍ネオ抗原を生成する尤度は、確率的な様式で、変異が発生すると増加し、免疫認識の尤度を増加すると考えられている（ＧｕｂｉｎａｎｄＳｃｈｒｅｉｂｅｒ．Ｓｃｉｅｎｃｅ３５０：１５８－９，２０１５）。しかし、全ての変異荷重を評価することは、全エクソーム解析（ＷＥＳ）を必要とする。この手法は、特化された組織処理、適合正常検体を要し、現在、研究ツールとして広く行われている。臨床的セッティングにおいてＷＥＳを行う上での技術的及び情報学的課題を考慮すると、変異負荷を検出する代理方法が必要とされる。本明細書に記載される有効化されたハイブリッド捕捉に基づくＮＧＳプラットフォームを含む本方法は、例えば、より臨床的に実現可能な結果所要時間（約２週間）、標準化情報学パイプライン、及びより管理可能なコストを含むいくつかの実用本位の利点を有する。この手法は、それが主観的尺度（病理学的スコア付け）よりむしろ、客観的尺度（例えば、変異荷重）を生み出すために、組織化学によって検出されるタンパク質発現などの従来のマーカーを上回る他の利点を有する（ＨａｎｓｅｎａｎｄＳｉｕ．ＪＡＭＡＯｎｃｏｌ２（１）：１５－６，２０１６）。さらに、このプラットフォームは、標的療法に関連する実施可能な変化の同時検出を容易にする。

したがって、本発明は、試料からのサブゲノム区間のセットの配列を提供すること、及び変異荷重に対する値を決定することによって、試料中の変異荷重を評価する方法を少なくとも部分的に提供し、ここで、値は、サブゲノム区間のセット内の変化の数の関数である。ある特定の実施形態において、サブゲノム区間のセットは、所定の遺伝子セット、例えば、全ゲノムまたはエクソームを含まない所定の遺伝子セットからのものである。ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間のセットである。他の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間及び非コードサブゲノム区間の両方を含有する。ある特定の実施形態において、変異荷重に対する値は、サブゲノム区間のセット内の変化（例えば、体細胞変化）の数の関数である。ある特定の実施形態において、変化の数は、機能的変化、生殖細胞変化、またはそれらの両方を除外する。いくつかの実施形態において、試料は、腫瘍試料または腫瘍由来の試料である。本明細書に記載される方法はまた、例えば、試料から複数の腫瘍メンバーを含むライブラリを取得することと、ライブラリをベイトセットと接触させて、ハイブリダイゼーションによって選択された腫瘍メンバーを提供し、それにより、ライブラリキャッチを提供することと、ライブラリキャッチからの腫瘍メンバーから変化を含むサブゲノム区間に対する読み取りデータを取得することと、整列法によって読み取りデータを整列させることと、読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることと、割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものであるサブゲノム区間のセットを選択することと、のうちの１つ以上を含み得る。試料中の変異荷重を評価するためのシステムも開示されている。

ある特定の用語が最初に定義される。追加の用語は、本明細書全体を通して定義される。

本明細書で使用されるとき、冠詞「ａ」及び「ａｎ」は、冠詞の文法上の目的語のうちの１つまたは１つを超えるもの（例えば、少なくとも１つ）を指す。

「約」及び「およそ」は、概して、測定の性質または精度を考慮して、測定された量に対する許容可能なエラーの程度を意味する。例示的なエラーの程度は、所与の値また値の範囲の２０パーセント（％）以内、典型的には１０％以内、及びより典型的には５％以内である。

「取得する」または「取得すること」という用語は、本明細書で使用されるとき、物理的実体、もしくは値、例えば、「直接的に取得する」ことによって数値、または「間接的に取得する」ことによって物理的実体もしくは値を得ることを指す。「直接的に取得すること」は、プロセスを行って（例えば、合成方法または分析方法を行って）、物理的実体または値を得ることを意味する。「間接的に取得すること」は、別の団体または供給源（例えば、物理的実体または値を直接的に取得した第３者の研究室）から物理的実体または値を受領することを指す。物理的実体を直接的に取得することは、物理的物質、例えば、開始材料中で物理的変化を含むプロセスを行うことを含む。例示的な変化には、２つ以上の開始材料から物理的実体を作製すること、物質をせん断または断片化すること、物質を分離または精製すること、２つ以上の別個の実体を組み合わせて混合物にすること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。値を直接的に取得することは、試料または別の物質中で物理的変化を含むプロセスを行うこと、例えば、物質、例えば、試料、分析物、または試薬中で物理的変化を含む分析プロセス（本明細書において、「物理的な分析」と称される場合もある）を行うこと、分析方法、例えば、次の：物質、例えば、分析物、もしくは断片、もしくはそれらの他の誘導体を、別の物質から分離もしくは精製すること、分析物、もしくは断片、もしくはそれらの他の誘導体を、別の物質、例えば、緩衝剤、溶媒、もしくは反応物質と組み合わせること、または、例えば、分析物の第１及び第２の原子間の共有結合もしくは非共有結合を切断もしくは形成することによって、分析物、もしくは断片、もしくはそれらの他の誘導体の構造を変化させること、または、例えば、試薬の第１及び第２の原子間の共有結合もしくは非共有結合を切断もしくは形成することによって、試薬、もしくは断片、もしくはそれらの他の誘導体の構造を変化させることのうちの１つ以上を含む方法を行うことを含む。

「配列を取得すること」または「読み取りデータを取得すること」という用語は、本明細書で使用されるとき、「直接的に取得すること」によってヌクレオチド配列もしくはアミノ酸配列、または「間接的に取得すること」によって配列もしくは読み取りデータを得ることを指す。配列または読み取りデータを「直接的に取得すること」は、プロセスを行って（例えば、合成方法または分析方法を行って）、例えば、配列決定法（例えば、次世代配列決定（ＮＧＳ）法）を行って、配列を得ることを意味する。配列または読み取りデータを「間接的に取得すること」は、別の団体または供給源（例えば、配列を直接的に取得した第３者の研究室）から、配列の情報もしくは知識を受領すること、または配列を受領することを指す。取得された配列または読み取りデータは、完全配列である必要はなく、例えば、配列を取得する対象構成に存在していると本明細書に開示される変化のうちの１つ以上を識別する少なくとも１個のヌクレオチドの配列決定、または情報もしくは知識を得ることである。

配列または読み取りデータを直接的に取得することは、物理的物質、例えば、開始材料、例えば、組織または細胞試料、例えば、生体組織または単離核酸（例えば、ＤＮＡまたはＲＮＡ）試料における物理的変化を含むプロセスを行うことを含む。例示的な変化には、２つ以上の開始材料から物理的実体を作製すること、物質、例えば、ゲノムＤＮＡ断片をせん断または断片化すること、物質を分離または精製すること（例えば、組織から核酸試料を単離すること）、２つ以上の別個の実体を組み合わせて混合物にすること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。値を直接的に取得することは、上述されるような試料または別の物質における物理的変化を含むプロセスを行うことを含む。

「試料を取得すること」という用語は、本明細書で使用されるとき、試料を「直接的に取得すること」または「間接的に取得すること」によって、試料、例えば、組織試料または核酸試料を得ることを指す。「試料を直接的に取得すること」は、試料を得るためのプロセスを行うこと（例えば、外科的手術または抽出などの物理的方法を行うこと）を意味する。「試料を間接的に取得すること」は、別の団体または供給源（例えば、試料を直接的に取得した第３者の研究室）から試料を受領することを指す。試料を直接的に取得することは、物理的物質、例えば、開始材料、例えば、組織、例えば、ヒト患者における組織、または患者から以前に単離された組織における物理的変化を含むプロセスを行うことを含む。例示的な変化には、開始材料から物理的実体を作製すること、組織を解剖または擦り取ること、物質（例えば、試料組織または核酸試料）を分離または精製すること、２つ以上の別個の実体を組み合わせて混合物にすること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。試料を直接的に取得することは、例えば、上述されるような試料または別の物質における物理的変化を含むプロセスを行うことを含む。

「整列セレクタ」は、本明細書で使用されるとき、事前選択されたサブゲノム区間の配列決定を最適化し得る整列法、例えば、整列アルゴリズムまたはパラメータの選択を可能にするかまたは指示するパラメータを指す。整列セレクタは、例えば、次のうちの１つ以上の関数に特異的であり得るか、またはそれらの関数として選択され得る。
１．配列状況、例えば、サブゲノム区間（例えば、評価される事前選択されたヌクレオチド位置）に対する読み取りデータの誤整列に対する傾向に関連する該サブゲノム区間の配列状況。例えば、ゲノムの他の場所で反復される評価されるサブゲノム区間中またはその付近の配列要素の存在は、誤整列を引き起こし得、それにより、能力が低減し得る。誤整列を最小限にするアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、配列状況、例えば、ゲノム（または、分析されているゲノムの一部分）中の少なくとも事前選択された回数反復される事前選択された長さの配列の有無の関数であり得る。
２．分析されている腫瘍型。例えば、特定の腫瘍型は、欠失率の増加を特徴とし得る。故に、インデルに対してより感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、腫瘍型の関数、例えば、腫瘍型に対する識別子であり得る。実施形態において、値は、腫瘍型、例えば、血液悪性腫瘍（または前悪性腫瘍）の同一性である。
３．分析されている遺伝子または遺伝子の型、例えば、遺伝子または遺伝子の型が分析され得る。例として、発がん遺伝子は、置換またはインフレームインデルを特徴とすることが多い。故に、これらの変異形に対して特に感度が高く、他のものに対して特異的であるアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。腫瘍抑制因子は、フレームシフトインデルを特徴とすることが多い。故に、これらの変異形に対して特に感度があるアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。故に、サブゲノム区間と適合するアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、遺伝子または遺伝子の型の関数、例えば、遺伝子または遺伝子の型に対する識別子であり得る。実施形態において、値は、遺伝子の同一性である。
４．分析されている部位（例えば、ヌクレオチド位置）。この場合、整列セレクタに対する値は、部位または部位の種類の関数、例えば、部位または部位の種類に対する識別子であり得る。実施形態において、値は、部位の同一性である。（例えば、その部位を含有する遺伝子が別の遺伝子と相同性が高い場合、正常型／高速の短い読み取りデータ整列アルゴリズム（例えば、ＢＷＡ）は、２個の遺伝子間を区別することが困難であり得、より強力な整列法（Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ）または均等アセンブリ（ＡＲＡＣＨＮＥ）を要する可能性がある。同様に、遺伝子配列が複雑性の低い領域（例えば、ＡＡＡＡＡＡ）を含有する場合、より強力な整列法が必要であり得る。
５．評価されているサブゲノム区間に関連する、変異形または変異形の種類。例えば、置換、挿入、欠失、転座、または他の再編成。故に、特異的な変異形の種類に対してより感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、変異形の種類の関数、例えば、変異形の種類に対する識別子であり得る。実施形態において、値は、変異形の種類、例えば、置換の同一性である。
６．試料の種類、ＦＦＰＥまたは他の固定試料。試料の種類／品質は、エラー（非参照配列の偽の観察）率に影響を及ぼし得る。故に、試料中の真偽率を正確に具現化するアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、試料の種類の関数、例えば、試料の種類に対する識別子であり得る。実施形態において、値は、試料の種類、例えば、固定試料の同一性である。

遺伝子または遺伝子産物（例えば、マーカー遺伝子または遺伝子産物）の「変化」または「変化した構造」は、本明細書で使用されるとき、正常または野生型遺伝子と比較して、遺伝子または遺伝子産物内の変異（複数可）、例えば、遺伝子または遺伝子産物の完全性、配列、構造、量、または活性に影響を及ぼす変異の存在を指す。この変化は、正常または健康な組織または細胞（例えば、対照）におけるその量、構造、及び／または活性と比較した場合の、がん組織またはがん細胞における量、構造、及び／または活性におけるものであり得、がんなどの疾患状態に関連する。例えば、がんに関連するか、または抗がん療法に対する応答性を予測する変化は、がん組織またはがん細胞において、正常で健康な組織または細胞と比較して、変化したヌクレオチド配列（例えば、変異）、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性、エピジェネティック修飾（例えば、メチル化状態もしくはアセチル化状態、または翻訳後修飾を有し得る。例示的な変異には、点変異（例えば、サイレント、ミスセンス、またはナンセンス）、欠失、挿入、逆位、重複、増幅、転座、染色体間再編成、及び染色体内再編成が含まれるが、これらに限定されない変異は、遺伝子のコードまたは非コード領域に存在し得る。ある特定の実施形態において、変化（複数可）は、再編成、例えば、１つ以上のイントロンまたはその断片（例えば、５’－及び／または３’－ＵＴＲにおける１つ以上の再編成）を含むゲノム再編成として検出される。ある特定の実施形態において、変化は、表現型、例えば、がん性表現型（例えば、がんリスク、がん進行、がん治療、またはがん治療に対する耐性のうちの１つ以上）に関連する（か、または関連しない）。一実施形態において、変化は、がんに対する遺伝的リスク因子、陽性治療応答予測因子、陰性治療応答予測因子、陽性予後因子、陰性予後因子、または診断因子のうちの１つ以上に関連する。

本明細書で使用されるとき、「インデル」という用語は、細胞の核酸中の１つ以上のヌクレオチドの挿入、欠失、またはそれらの両方を指す。ある特定の実施形態において、インデルは、１つ以上のヌクレオチドの挿入及び欠失の両方を含み、ここで、挿入及び欠失の両方は、核酸上の付近にある。ある特定の実施形態において、インデルは、ヌクレオチドの合計数において正味の変化をもたらす。ある特定の実施形態において、インデルは、約１～約５０個のヌクレオチドの正味の変化をもたらす。

「クローンプロファイル」という用語は、本明細書で使用されるとき、出現、同一性、可変性、分布、発現（サブゲノムシグネチャーの転写コピーの出現またはレベル）、または対象区間の（または、それを含む細胞の）１つ以上の配列、例えば、対立遺伝子もしくはシグネチャーの存在量、例えば、相対的存在量を指す。実施形態において、クローンプロファイルは、対象区間に対する複数の配列、対立遺伝子、またはシグネチャーが試料中に存在する場合、対象区間（または、それを含む細胞）に対する１つの配列、対立遺伝子、またはシグネチャーに関する相対的存在量に対する値である。例えば、実施形態において、クローンプロファイルは、対象区間に対する複数のＶＤＪまたはＶＪの組み合わせのうちの１つ以上の相対的存在量に対する値を含む。実施形態において、クローンプロファイルは、対象区間に対する選択されたＶ分節の、相対的存在量に対する値を含む。実施形態において、クローンプロファイルは、対象区間の配列内での、例えば、体細胞高頻度変異から生じるような多様性に対する値を含む。実施形態において、クローンプロファイルは、例えば、配列、対立遺伝子、またはシグネチャーを含む発現サブゲノム区間の出現またはレベルによって証明されるような、配列、対立遺伝子、またはシグネチャーの発現の出現またはレベルに対する値を含む。

「発現サブゲノム区間」という用語は、本明細書で使用されるとき、サブゲノム区間の転写された配列を指す。実施形態において、発現サブゲノム区間の配列は、それが転写されるサブゲノム区間とは異なり、例えば、いくつかの配列は、転写され得ない。

「シグネチャー」という用語は、本明細書で使用されるとき、対象区間の配列を指す。シグネチャーは、対象区間で複数の可能性のうちの１つの出現を示し得、例えば、シグネチャーは、再編成された重鎖または軽鎖可変領域遺伝子における選択されたＶ分節の出現；選択されたＶＪ接合部の出現、例えば、再編成された重鎖可変領域遺伝子における選択されたＶ分節及び選択されたＪ分節の出現を示し得る。実施形態において、シグネチャーは、複数の特異的な核酸配列を含む。故に、シグネチャーは、特異的な核酸配列に限定されず、むしろ、対象区間での配列または可能性の第１の群と、対象区間での可能性の第２の群とを区別し得、例えば、第１のＶ分節と第２のＶ分節とを区別し得るのに十分固有であり、これにより、例えば、様々なＶ分節の使用の評価が可能となる。シグネチャーという用語は、特異的な核酸配列である、特異的シグネチャーという用語を含む。実施形態において、シグネチャーは、特異的な事象、例えば、再編成事象を示すものであるか、またはその結果である。

「サブゲノム区間」という用語は、本明細書で使用されるとき、ゲノム配列の一部分を指す。実施形態において、サブゲノム区間は、単一のヌクレオチド位置、例えば、腫瘍表現型と（陽性または陰性に）関連するヌクレオチド位置変異形であり得る。実施形態において、サブゲノム区間は、１個を超えるヌクレオチド位置を含む。このような実施形態は、少なくとも２、５、１０、５０、１００、１５０、または２５０個のヌクレオチド位置の長さの配列を含む。サブゲノム区間は、遺伝子全体またはその事前選択された部分、例えば、コード領域（または、その一部）、事前選択されたイントロン（または、その一部）、またはエクソン（または、その一部）を含み得る。サブゲノム区間は、天然の、例えば、ゲノムＤＮＡ、核酸の断片の全てまたは一部を含み得る。例えば、サブゲノム区間は、配列決定反応に供されるゲノムＤＮＡの断片に対応し得る。実施形態において、サブゲノム区間は、ゲノムの供給源からの連続的な配列である。実施形態において、サブゲノム区間は、ゲノム中で連続していない配列を含み、例えば、それは、ｃＤＮＡ中のエクソン－エクソン接合部で形成されることが見られる接合部を含み得る。

実施形態において、サブゲノム区間は、再編成された配列、例えば、Ｖ分節とＤ分節、Ｄ分節とＪ分節、Ｖ分節とＪ分節、またはＪ分節と分類分節との連結の結果として生じるＢまたはＴ細胞における配列に対応する。

実施形態において、サブゲノム区間において多様性はない。

実施形態において、サブゲノム区間において多様性があり、例えば、サブゲノム区間が１つを超える配列によって表され、例えば、ＶＤ配列をカバーするサブゲノム区間が１つを超えるシグネチャーによって表され得る。

実施形態において、サブゲノム区間は、単一のヌクレオチド位置；遺伝子内領域または遺伝子間領域；エクソンもしくはイントロン、またはそれらの断片、典型的にはエクソン配列またはその断片；コード領域または非コード領域、例えば、プロモーター、エンハンサー、５’非翻訳領域（５’ＵＴＲ）もしくは３’非翻訳領域（３’ＵＴＲ）、またはそれらの断片；ｃＤＮＡまたはその断片；ＳＮＰ；体細胞変異、生殖細胞変異、またはそれらの両方；変化、例えば、点または単一変異；欠失変異（例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失）；挿入変異（例えば、遺伝子内挿入）；逆位変異（例えば、染色体内逆位）；連結変異；連結された挿入変異；逆位重複変異；タンデム重複（例えば、染色体内タンデム重複）；転座（例えば、染色体転座、非相反転座）；再編成（例えば、ゲノム再編成（例えば、１つ以上のイントロンまたはその断片の再編成；再編成されたイントロンは、５’－及び／または３’ＵＴＲを含み得る））；遺伝子コピー数の変化；遺伝子発現の変化；ＲＮＡレベルの変化；あるいはそれらの組み合わせを含むかまたはそれらからなる。「遺伝子のコピー数」は、特定の遺伝子産物をコードする細胞中のＤＮＡ配列の数を指す。概して、所与の遺伝子に関して、哺乳動物は各遺伝子の２つのコピーを有する。コピー数は、例えば、遺伝子増幅もしくは重複によって増加され得るか、または欠失によって低減され得る。

「対象区間」という用語は、本明細書で使用されるとき、サブゲノム区間または発現サブゲノム区間を指す。実施形態において、サブゲノム区間及び発現サブゲノム区間は対応し、これは、つまり、発現サブゲノム区間が、対応するサブゲノム区間から発現される配列を含むことを意味する。実施形態において、サブゲノム区間及び発現サブゲノム区間は対応せず、これは、つまり、発現サブゲノム区間が、対応しないサブゲノム区間から発現される配列を含まないが、むしろ異なるサブゲノム区間に対応することを意味する。実施形態において、サブゲノム区間及び発現サブゲノム区間は部分的に対応し、これは、つまり、発現サブゲノム区間が、対応するサブゲノム区間から発現される配列及び異なる対応するサブゲノム区間から発現される配列を含むことを意味する。

本明細書で使用されるとき、「ライブラリ」という用語は、メンバーの集合体を指す。一実施形態において、ライブラリは、核酸メンバーの集合体、例えば、全ゲノム、サブゲノム断片、ｃＤＮＡ、ｃＤＮＡ断片、ＲＮＡ、例えば、ｍＲＮＡ、ＲＮＡ断片、またはそれらの組み合わせの集合体を含む。一実施形態において、ライブラリメンバーの一部または全てがアダプター配列を含む。アダプター配列は、一方または両方の末端に位置し得る。アダプター配列は、例えば、配列決定法（例えば、ＮＧＳ法）に対して、増幅に対して、逆転写に対して、またはベクターへのクローニングに対して有用であり得る。

ライブラリは、メンバー、例えば、標的メンバー（例えば、腫瘍メンバー、参照メンバー、ＰＧｘメンバー、またはそれらの組み合わせ）の集合体を含み得る。ライブラリのメンバーは、単一の個体のものであり得る。実施形態において、ライブラリは、１人を超える対象（例えば、２、３、４、５、６、７、８、９、１０、２０、３０人以上の対象）からのメンバーを含み得、例えば、異なる対象からの２つ以上のライブラリが組み合わされ、１人を超える対象からのメンバーを含むライブラリを形成し得る。一実施形態において、対象は、がんまたは腫瘍を有するか、またはそれらを有するリスクがあるヒトである。

「ライブラリキャッチ」は、ライブラリのサブセット、例えば、事前選択されたサブゲノム区間、例えば、事前選択されたベイトとのハイブリダイゼーションによって捕捉された産物に関して富化されたサブセットを指す。

「メンバー」、または「ライブラリメンバー」、または他の同様の用語は、本明細書で使用されるとき、ライブラリのメンバーである核酸分子、例えば、ＤＮＡ、ＲＮＡ、またはそれらの組み合わせを指す。典型的には、メンバーは、ＤＮＡ分子、例えば、ゲノムＤＮＡまたはｃＤＮＡである。メンバーは、断片化された、例えば、せん断または酵素的に調製されたゲノムＤＮＡであり得る。メンバーは、対象からの配列を含み、対象に由来しない配列、例えば、アダプター配列、プライマー配列、または同定を可能にする他の配列、例えば、「バーコード」配列も含み得る。

「ベイト」は、本明細書で使用されるとき、ハイブリッド捕捉試薬の種類である。ベイトは、標的核酸にハイブリッド形成し得（例えば、それに相補的であり得る）、それにより、それの捕捉を可能にする核酸分子、例えば、ＤＮＡまたはＲＮＡ分子であり得る。一実施形態において、ベイトは、ＲＮＡ分子（例えば、天然または修飾ＲＮＡ分子）、ＤＮＡ分子（例えば、天然または修飾ＤＮＡ分子）、またはそれらの組み合わせである。他の実施形態において、ベイトは、例えば、結合実体への結合による、ベイト、及びベイトに対してハイブリッド形成される核酸によって形成されるハイブリッドの捕捉及び分離を可能にする、結合実体、例えば、親和性タグを含む。一実施形態において、ベイトは、溶液相ハイブリダイゼーションに好適である。一実施形態において、ベイトは、二環式核酸（ＢＮＡ）分子である。

「ベイトセット」は、本明細書で使用されるとき、１つまたは複数のベイト分子を指す。

「結合実体」は分析物に特異的に結合することができる、分子タグが直接的または間接的に連結され得る任意の分子を意味する。結合実体は、各ベイト配列上の親和性タグであり得る。ある特定の実施形態において、結合実体は、アビジン分子などのパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物からベイト／メンバーハイブリッドを分離することを可能にする。例示的な結合実体には、ビオチン分子、ハプテン、抗体、抗体結合断片、ペプチド、及びタンパク質が含まれるが、これらに限定されない。

「相補的」は、２つの核酸鎖の領域間、または同じ核酸鎖の２つの領域間の配列相補性を指す。第１の核酸領域のアデニン残基は、残基がチミンまたはウラシルである場合、第１の領域に対して逆平行である第２の核酸領域の残基と特異的な水素結合を形成（「塩基対形成」）できることが知られている。同様に、第１の核酸鎖のシトシン残基は、残基がグアニンである場合、第１の鎖に対して逆平行である第２の核酸鎖の残基と塩基対形成できることが知られている。核酸の第１の領域は、２つの領域が逆平行な様式で配置されるときに第１の領域の少なくとも１個のヌクレオチド残基が、第２の領域の残基と塩基対形成できる場合、同じかまたは異なる核酸の第２の領域と相補的である。ある特定の実施形態において、第１の領域は第１の部分を含み、第２の領域は第２の部分を含み、それにより、第１及び第２の部分が逆平行の様式で配置される場合、第１の部分のヌクレオチド残基の少なくとも約５０％、少なくとも約７５％、少なくとも約９０％、または少なくとも約９５％が、第２の部分のヌクレオチド残基と塩基対形成できる。他の実施形態において、第１の部分の全てのヌクレオチド残基は、第２の部分のヌクレオチド残基と塩基対形成できる。

「がん」または「腫瘍」という用語は、本明細書において互換的に使用される。これらの用語は、制御されない増殖、不死性、転移能、急速な成長及び増殖速度、ならびにある特定の特質的な形態学的特徴など、がんを引き起こす細胞の典型的な特質を保有する細胞の存在を指す。がん細胞は、腫瘍の形態であることが多いが、このような細胞は、動物内に単独で存在し得るか、または非腫瘍化がん細胞、例えば、白血病細胞などであり得る。これらの用語には、固形腫瘍、軟部組織腫瘍、または転移性病巣が含まれる。本明細書で使用されるとき、「がん」という用語は、前悪性、ならびに悪性のがんを含む。

「可能性が高い」または「尤度の増加」は、本明細書で使用されるとき、物品、物体、物、または人間が出現する確率が高いことを指す。故に、一例において、治療に応答する可能性が高い対象は、参照対象または対象の群に対して、治療に応答する確率が高くなる。

「可能性が低い」は、参照に対して、事象、物品、物体、物、または人間が出現する確率が低いことを指す。故に、治療に応答する可能性が低い対象は、参照対象または対象の群に対して、治療に応答する確率が低くなる。

「対照メンバー」は、非腫瘍細胞からの配列を有するメンバーを指す。

「インデル整列配列セレクタ」は、本明細書で使用されるとき、事前選択されたインデルの場合、読み取りデータを一緒に整列しようとする配列の選択を可能にするか、またはそれを方向付けるパラメータを指す。このような配列の使用は、インデルを含む事前選択されたサブゲノム区間の配列決定を最適化し得る。インデル整列配列セレクタに対する値は、事前選択されたインデルの関数、例えば、インデルに対する識別子である。実施形態において、値は、インデルの同一性である。

「次世代配列決定またはＮＧＳまたはＮＧ配列決定」は、本明細書で使用されるとき、ハイスループット様式で、（例えば、１回の分子配列決定において）個別の核酸分子または個別の核酸分子に対するクローン増大された代理物のいずれかのヌクレオチド配列を決定する任意の配列決定法を指す（例えば、１０^３、１０^４、１０^５以上を超える分子を同時に配列決定する）。一実施形態において、ライブラリ中の核酸種の相対的存在量は、配列決定実験によって生成されたデータ中のそれらの同族配列の出現の相対数を数えることによって推定され得る。次世代配列決定法は、当技術分野で知られており、例えば、参照によって本明細書に組み込まれる、Ｍｅｔｚｋｅｒ，Ｍ．（２０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：３１－４６に記載されている。次世代配列決定は、試料中の核酸の５％未満で存在する変異形を検出し得る。

「ヌクレオチド値」は、本明細書において言及されるとき、事前選択されたヌクレオチド位置を占有するかまたはこれに割り当てられるヌクレオチド（複数可）の同一性を表す。典型的なヌクレオチド値には、欠損（例えば、欠失）、付加（例えば、１つ以上のヌクレオチドの挿入、その同一性は含まれてもまたは含まれなくてもよい）、もしくは存在（占有）、Ａ、Ｔ、Ｃ、またはＧが含まれる。他の値は、例えば、Ｙでなくてもよく（Ｙは、Ａ、Ｔ、Ｇ、またはＣである）、ＡもしくはＸ（Ｘは、Ｔ、Ｇ、またはＣのうちの１つまたは２つである）、ＴもしくはＸ（Ｘは、Ａ、Ｇ、またはＣのうちの１つまたは２つである）、ＧもしくはＸ（Ｘは、Ｔ、Ａ、またはＣのうちの１つまたは２つである）、ＣもしくはＸ（Ｘは、Ｔ、Ｇ、またはＡのうちの１つまたは２つである）、ピリミジンヌクレオチド、またはプリンヌクレオチドであり得る。ヌクレオチド値は、ヌクレオチド位置で１個以上、例えば、２、３、または４個の塩基（または、本明細書に記載される他の値、例えば、欠損または付加）に対する頻度であり得る。例えば、ヌクレオチド値は、ヌクレオチド位置での、Ａに対する頻度及びＧに対する頻度を含み得る。

「または」は、文脈が別途明確に示さない限り、「及び／または」という用語を意味するために本明細書で使用され、これと互換的に使用される。本明細書のいくつかの場所における「及び／または」という用語の使用は、文脈が別途明確に示さない限り、「または」という用語の使用が「及び／または」という用語と互換的ではないことを意味しない。

「一次対照」は、腫瘍試料中のＮＡＴ組織以外の非腫瘍組織を指す。血液は、典型的な一次対照である。

「再編成整列配列セレクタ」は、事前選択された再編成の場合、読み取りデータを一緒に整列しようとする配列の選択を可能にするか、またはそれを方向付けるパラメータを指す。このような配列の使用は、再編成を含む事前選択されたサブゲノム区間の配列決定を最適化し得る。再編成整列配列セレクタに対する値は、事前選択された再編成の関数、例えば、再編成に対する識別子である。実施形態において、値は、再編成の同一性である。「インデル整列配列セレクタ」（本明細書の他の箇所でも定義される）は、再編成整列配列セレクタの例である。

「試料」、「組織試料」、「患者試料」、「患者細胞もしくは組織試料」、または「検体」は、対象または患者から得られた組織、細胞、例えば、循環細胞を含む。組織試料の供給源は、採取したての、凍結された、及び／または保存された臓器、組織試料、生体組織、もしくは穿刺液；血液もしくは任意の血液成分；脳脊髄液、羊水、腹腔液、もしくは間質液などの体液；または対象の妊娠期間もしくは発達における任意の時期の細胞からの固形組織であり得る。組織試料は、防腐剤、抗凝固剤、緩衝剤、固定剤、栄養剤、抗生物質など、本質的に組織とは自然に混合されない化合物を含有し得る。一実施形態において、試料は、凍結試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフィン包埋（ＦＦＰＥ）組織調製物として保存される。例えば、試料は、マトリックス、例えば、ＦＦＰＥブロックまたは凍結試料中に包埋され得る。別の実施形態において、試料は血液試料である。さらに別の実施形態において、試料は、骨髄穿刺液試料である。別の実施形態において、試料は、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む。別の実施形態において、試料は、循環腫瘍細胞（ＣＴＣ）を含む。

実施形態において、試料は、腫瘍、例えば、腫瘍細胞または腫瘍浸潤リンパ球（ＴＩＬ）に関連する細胞である。一実施形態において、試料は、腫瘍試料であり、例えば、１つ以上の前悪性または悪性細胞を含む。実施形態において、試料は、血液悪性腫瘍（または、前悪性腫瘍）、例えば、本明細書に記載される血液悪性腫瘍（または、前悪性腫瘍）から取得される。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組織腫瘍、または転移性病巣から取得される。他の実施形態において、試料、例えば、腫瘍試料は、外科的縁からの組織または細胞を含む。別の実施形態において、試料、例えば、腫瘍試料は、１つ以上の循環腫瘍細胞（ＣＴＣ）（例えば、血液試料から取得されるＣＴＣ）を含む。実施形態において、試料は、腫瘍、例えば、非腫瘍細胞または末梢血リンパ球に関連しない細胞である。

「感度」は、本明細書で使用されるとき、不均一な配列集団中での事前選択された配列変異形を検出するための方法の能力の尺度である。事前選択された配列変異形が試料中の配列の少なくともＦ％として存在する試料であれば、ある方法が事前選択されたＣ％の信頼度でＳ％の回数で事前選択された配列を検出し得る場合、その方法は、Ｆ％の変異形に対してＳ％の感度を有する。例として、事前選択された変異形配列が試料中の配列の少なくとも５％として存在する試料であれば、ある方法が事前選択された９９％の信頼度で１０回のうちの９回、事前選択された配列を検出し得る場合、その方法は、５％の変異形に対して９０％の感度を有する（Ｆ＝５％、Ｃ＝９９％、Ｓ＝９０％）。例示的な感度には、Ｃ＝９０％、９５％、９９％、及び９９．９％の信頼度レベルで、Ｆ＝１％、５％、１０％、２０％、５０％、１００％の配列変異形に対して、Ｓ＝９０％、９５％、９９％の感度が含まれる。

「特異性」は、本明細書で使用されるとき、真に出現する事前選択された配列変異形を配列決定アーチファクトまたは他の密接に関連する配列と区別するための方法の能力の尺度である。それは、偽陽性検出を回避する能力である。偽陽性検出は、試料調製中の対象とする配列に導入されるエラー、配列決定エラー、または偽遺伝子もしくは遺伝子ファミリーのメンバーのような密接に関連する配列の偶然の配列決定から生じ得る。Ｘ_正の配列が真に変異形であり、Ｘ_{正ではない}配列が真に変異形ではないＮ_合計配列の試料セットに適用したときにある方法が変異形でないものとして真ではない変異形の少なくともＸ％を選択する場合、この方法はＸ％の特異性を有する。例えば、５００個の配列が真に変異形であり、５００個の配列が真に変異形ではない１０００個の配列の試料セットに適用したときにある方法が変異形でないものとして５００個の真ではない変異形の９０％を選択する場合、この方法は９０％の特異性を有する。例示的な特異性には、９０、９５、９８、及び９９％が含まれる。

「腫瘍核酸試料」は、本明細書で使用されるとき、腫瘍またはがん試料からの核酸分子を指す。典型的には、それは、腫瘍またはがん試料からのＤＮＡ、例えば、ゲノムＤＮＡ、またはＲＮＡ由来のｃＤＮＡである。ある特定の実施形態において、腫瘍核酸試料は、精製または単離される（例えば、その天然の状態から除去される）。

「対照」または「参照」「核酸試料」は、本明細書で使用されるとき、対照または参照試料からの核酸分子を指す。典型的には、それは、遺伝子または遺伝子産物の変化または変動を含有しないＤＮＡ、例えば、ゲノムＤＮＡ、またはＲＮＡに由来するｃＤＮＡである。ある特定の実施形態において、参照または対照核酸試料は、野生型または非変異配列である。ある特定の実施形態において、参照核酸試料は、精製または単離される（例えば、その天然状態から除去される）。他の実施形態において、参照核酸試料は、同じかもしくは異なる対象からの、非腫瘍試料、例えば、血液対照、正常近接組織（ＮＡＴ）、または任意の他の非がん性試料からのものである。

核酸分子を「配列決定すること」は、分子（例えば、ＤＮＡ分子、ＲＮＡ分子、またはＲＮＡ分子に由来するｃＤＮＡ分子）中の少なくとも１個のヌクレオチドの同一性を決定することを必要とする。実施形態において、分子中の部分的なヌクレオチドの同一性が決定される。他の実施形態において、分子中のヌクレオチドの大部分または全ての同一性が決定される。

「閾値」は、本明細書で使用されるとき、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）にヌクレオチド値を割り当てるために存在する必要がある読み取りデータの数の関数である値である。例えば、それは、そのヌクレオチド値をサブゲノム区間中のそのヌクレオチド位置に割り当てるために必要とされる、ヌクレオチド位置での特定のヌクレオチド値、例えば、「Ａ」を有する読み取りデータの数の関数である。閾値は、例えば、整数などの読み取りデータの数として（または、その関数として）、または事前選択された値を有する読み取りデータの割合として表され得る。例として、閾値がＸであり、「Ａ」のヌクレオチド値を有するＸ＋１個の読み取りデータが存在する場合、「Ａ」の値が、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）における事前選択された位置に割り当てられる。閾値はまた、変異もしくは変異形予想の関数、変異頻度、またはベイジアン事前法として表され得る。実施形態において、事前選択された変異頻度は、そのヌクレオチド値を呼び出すために、事前選択された位置でヌクレオチド値、例えば、ＡまたはＧを有する読み取りデータの事前選択された数または割合を必要とするであろう。実施形態において、閾値は、変異予想の関数、例えば、変異頻度及び腫瘍型であり得る。例えば、事前選択されたヌクレオチド位置の事前選択された変異形は、患者が第１の腫瘍型を有する場合、第１の閾値を有し得、患者が第２の腫瘍型を有する場合、第２の閾値を有し得る。

本明細書で使用されるとき、「標的メンバー」は、核酸ライブラリから単離させることが望ましい核酸分子を指す。一実施形態において、標的メンバーは、本明細書に記載されるような腫瘍メンバー、参照メンバー、対照メンバー、またはＰＧｘメンバーであり得る。

「腫瘍メンバー」または他の同様の用語（例えば、「腫瘍またはがん関連メンバー」）は、本明細書で使用されるとき、腫瘍細胞からの配列を有するメンバーを指す。一実施形態において、腫瘍メンバーは、がん性表現型に関連する変化（例えば、変異）を有する配列（例えば、ヌクレオチド配列）を有する対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む。他の実施形態において、腫瘍メンバーは、野生型配列（例えば、野生型ヌクレオチド配列）を有する対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む。例えば、がん細胞に存在するヘテロ接合型またはホモ接合型野生型対立遺伝子からの対象区間（例えば、サブゲノム区間または発現サブゲノム区間）。腫瘍メンバーは、参照メンバーまたはＰＧｘメンバーを含み得る。

「参照メンバー」または他の同様の用語（例えば、「対照メンバー」）は、本明細書で使用されるとき、がん性表現型に関連しない配列（例えば、ヌクレオチド配列）を有する対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含むメンバーを指す。一実施形態において、参照メンバーは、変異した場合、がん性表現型に関連する遺伝子または遺伝子産物の野生型または非変異ヌクレオチド配列を含む。参照メンバーは、がん細胞または非がん細胞に存在し得る。

「ＰＧｘメンバー」または他の同様の用語は、本明細書で使用されるとき、遺伝子の薬理遺伝学的または薬理ゲノムプロファイルに関連する対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含むメンバーを指す。一実施形態において、ＰＧｘメンバーは、ＳＮＰ（例えば、本明細書に記載されるようなＳＮＰ）を含む。他の実施形態において、ＰＧｘメンバーは、表１～４または図３Ａ～４Ｄによる対象区間（例えば、サブゲノム区間または発現サブゲノム区間）を含む。

「変異形」は、本明細書で使用されるとき、１つを超える構造、例えば、多型遺伝子座における対立遺伝子を有し得るサブゲノム区間で存在し得る構造を指す。

本明細書で使用されるとき、「Ｘは、Ｙの関数である」は、例えば、１つの可変Ｘが、別の可変Ｙに関連することを意味する。一実施形態において、ＸがＹの関数である場合、ＸとＹとの間に因果関係があることを意味するが、必ずしも存在するとは限らない。

見出し、例えば、（ａ）、（ｂ）、（ｉ）などは、明細書及び特許請求の範囲を単に読み易くするために呈示される。明細書または特許請求の範囲における見出しの使用は、ステップまたは要素がアルファベット順もしくは数字順、またはそれらが呈示される順序で行われる必要はない。

変異荷重
本明細書で使用されるとき、「変異荷重（ｍｕｔａｔｉｏｎｌｏａｄ）」または「変異荷重（ｍｕｔａｔｉｏｎａｌｌｏａｄ）」という用語は、所定の遺伝子セット内（例えば、所定の遺伝子セットのコード領域内）の事前選択された単位当たり（例えば、１メガ塩基当たり）の変化（例えば、１つ以上の変化、例えば、１つ以上の体細胞変化）のレベル、例えば、数を指す。変異荷重は、例えば、全ゲノムもしくはエクソームに基づいて、またはゲノムもしくはエクソームのサブセットに基づいて測定され得る。ある特定の実施形態において、ゲノムまたはエクソームのサブセットに基づいて測定された変異荷重は、外挿されて、全ゲノムまたはエクソームの変異荷重を決定する。

ある特定の実施形態において、変異荷重は、対象、例えば、本明細書に記載される対象からの試料、例えば、腫瘍試料（例えば、腫瘍試料または腫瘍由来の試料）中で測定される。ある特定の実施形態において、変異荷重は、例えば、参照集団からの試料中の変異荷重におけるパーセンタイルとして表される。ある特定の実施形態において、参照集団は、対象と同じ型のがんを有する患者を含む。他の実施形態において、参照集団は、対象と同じ種類の療法を受けているか、または受けたことのある患者を含む。ある特定の実施形態において、本明細書に記載される方法、例えば、表１～４または図３Ａ～４Ｄに記載される所定の遺伝子セット内の変化（例えば、体細胞変化）のレベルを評価することによって得られる変異荷重は、全ゲノムまたはエクソームの変異荷重と相関する。

「変異荷重（ｍｕｔａｔｉｏｎｌｏａｄ）」、「変異荷重（ｍｕｔａｔｉｏｎａｌｌｏａｄ）」、「変異負荷（ｍｕｔａｔｉｏｎｂｕｒｄｅｎ）」、及び「変異負荷（ｍｕｔａｔｉｏｎａｌｂｕｒｄｅｎ）」という用語は、本明細書において互換的に使用される。腫瘍の場合、変異荷重は、本明細書において、「腫瘍変異負荷（ｔｕｍｏｒｍｕｔａｔｉｏｎａｌｂｕｒｄｅｎ）」、「腫瘍変異負荷（ｔｕｍｏｒｍｕｔａｔｉｏｎｂｕｒｄｅｎ）」、または「ＴＭＢ」とも称される。

遺伝子選択
選択された遺伝子または遺伝子産物（本明細書において、「標的遺伝子または遺伝子産物」とも称される）は、遺伝子内領域または遺伝子間領域を含む対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）を含み得る。例えば、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、エクソンもしくはイントロン、またはそれらの断片、典型的にはエクソン配列またはその断片を含み得る。対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、コード領域または非コード領域、例えば、プロモーター、エンハンサー、５’非翻訳領域（５’ＵＴＲ）もしくは３’非翻訳領域（３’ＵＴＲ）、またはそれらの断片を含み得る。他の実施形態において、対象区間は、ｃＤＮＡまたはその断片を含む。他の実施形態において、対象区間は、例えば、本明細書に記載されるようなＳＮＰを含む。

他の実施形態において、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、ゲノム、例えば、本明細書に記載されるような対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）のうちの１つ以上の中の実質的に全てのエクソン（例えば、対象とする選択される遺伝子または遺伝子産物（例えば、本明細書に記載されるようながん性表現型に関連する遺伝子または遺伝子産物）からのエクソン）を含む。一実施形態において、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、体細胞変異、生殖細胞変異、またはそれらの両方を含む。一実施形態において、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、変化、例えば、点もしくは単一変異、欠失変異（例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失）、挿入変異（例えば、遺伝子内挿入）、逆位変異（例えば、染色体内逆位）、連結変異、連結された挿入変異、逆位重複変異、タンデム重複（例えば、染色体内タンデム重複）、転座（例えば、染色体転座、非相反転座）、再編成、遺伝子コピー数の変化、またはそれらの組み合わせを含む。ある特定の実施形態において、対象区間（例えば、サブゲノム区間または発現サブゲノム区間）は、試料中の腫瘍細胞のゲノムのコード領域の５％、１％、０．５％、０．１％、０．０１％、０．００１％未満を構成する。他の実施形態において、対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）は、疾患に関与せず、例えば、本明細書に記載されるようながん性表現型に関連しない。

一実施形態において、標的遺伝子または遺伝子産物はバイオマーカーである。本明細書で使用されるとき、「バイオマーカー」または「マーカー」は、変化し得る遺伝子、ｍＲＮＡ、またはタンパク質であり、該変化はがんに関連する。この変化は、正常または健康な組織または細胞（例えば、対照）におけるその量、構造、及び／または活性と比較した場合の、がん組織またはがん細胞における量、構造、及び／または活性におけるものであり得、がんなどの疾患状態に関連する。例えば、がんに関連するか、または抗がん療法に対する応答性を予測するマーカーは、がん組織またはがん細胞において、正常で健康な組織または細胞と比較して、変化したヌクレオチド配列、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性、エピジェネティック修飾（例えば、メチル化状態もしくはアセチル化状態、または翻訳後修飾を有し得る。さらに、「マーカー」は、その構造が変化している、例えば、変異している（変異を含有する）分子を含み、例えば、がんなどの疾患状態に関連する組織または細胞に存在する場合、例えば、置換、欠失、または挿入により、ヌクレオチドまたはアミノ酸レベルで野生型配列と異なる。

一実施形態において、標的遺伝子または遺伝子産物は、一塩基多型（ＳＮＰ）を含む。別の実施形態において、遺伝子または遺伝子産物は、小さな欠失、例えば、小さな遺伝子内欠失（例えば、インフレームまたはフレームシフト欠失）を有する。さらに別の実施形態において、標的配列は、遺伝子全体の欠失から生じる。さらに別の実施形態において、標的配列は、小さな挿入、例えば、小さな遺伝子内挿入を有する。一実施形態において、標的配列は、逆位、例えば、染色体内逆位から生じる。別の実施形態において、標的配列は、染色体間転座から生じる。さらに別の実施形態において、標的配列は、タンデム重複を有する。一実施形態において、標的配列は、望ましくない特徴（例えば、高ＧＣ含量または反復要素）を有する。別の実施形態において、標的配列は、例えば、その反復性のために、それ自体がうまく標的化され得ないヌクレオチド配列の一部分を有する。一実施形態において、標的配列は、代替的スプライシングから生じる。別の実施形態において、標的配列は、表１～４または図３Ａ～４Ｄによる遺伝子もしくは遺伝子産物、またはそれらの断片から選ばれる。

実施形態において、標的遺伝子もしくは遺伝子産物、またはそれらの断片は、抗体遺伝子もしくは遺伝子産物、免疫グロブリンスーパーファミリー受容体（例えば、Ｂ細胞受容体（ＢＣＲ）またはＴ細胞受容体（ＴＣＲ））遺伝子もしくは遺伝子産物、またはそれらの断片である。

ヒト抗体分子（及び、Ｂ細胞受容体）は、少なくとも次の３個の遺伝子座上の遺伝子によってコードされる定常領域（Ｃ）及び可変領域（Ｖ）の両方を有する重鎖及び軽鎖から構成される。

１．免疫グロブリン重鎖に対する遺伝子分節を含有する１４番染色体上の免疫グロブリン重鎖遺伝子座（ＩＧＨ＠）；
２．免疫グロブリン軽鎖に対する遺伝子分節を含有する２番染色体上の免疫グロブリンカッパ（κ）遺伝子座（ＩＧＫ＠）；
３．免疫グロブリン軽鎖に対する遺伝子分節を含有する２２番染色体上の免疫グロブリンラムダ（λ）遺伝子座（ＩＧＬ＠）。

各重鎖及び軽鎖遺伝子は、抗体タンパク質の可変領域に対する３つの異なる型の遺伝子分節の多数のコピーを含有する。例えば、免疫グロブリン重鎖領域は、５個の異なる分類のγ、δ、α、μ、及びε、４４個の可変（Ｖ）遺伝子分節、２７個の多様性（Ｄ）遺伝子分節、ならびに６個の連結（Ｊ）遺伝子分節のうちの１つを含有し得る。軽鎖はまた、多くのＶ及びＪ遺伝子分節を保有し得るが、Ｄ遺伝子分節は有さない。ラムダ軽鎖は、７個の可能なＣ領域を有し、カッパ軽鎖は、１個を有する。

免疫グロブリン重鎖遺伝子座（ＩＧＨ＠）は、ヒト抗体（または、免疫グロブリン）の重鎖に対する遺伝子を含有するヒト１４番染色体上の領域である。例えば、ＩＧＨ遺伝子座は、ＩＧＨＶ（可変）、ＩＧＨＤ（多様性）、ＩＧＨＪ（連結）、及びＩＧＨＣ（定常）遺伝子を含む。免疫グロブリン重鎖をコードする例示的な遺伝子には、ＩＧＨＶ１－２、ＩＧＨＶ１－３、ＩＧＨＶ１－８、ＩＧＨＶ１－１２、ＩＧＨＶ１－１４、ＩＧＨＶ１－１７、ＩＧＨＶ１－１８、ＩＧＨＶ１－２４、ＩＧＨＶ１－４５、ＩＧＨＶ１－４６、ＩＧＨＶ１－５８、ＩＧＨＶ１－６７、ＩＧＨＶ１－６８、ＩＧＨＶ１－６９、ＩＧＨＶ１－３８－４、ＩＧＨＶ１－６９－２、ＩＧＨＶ２－５、ＩＧＨＶ２－１０、ＩＧＨＶ２－２６、ＩＧＨＶ２－７０、ＩＧＨＶ３－６、ＩＧＨＶ３－７、ＩＧＨＶ３－９、ＩＧＨＶ３－１１、ＩＧＨＶ３－１３、ＩＧＨＶ３－１５、ＩＧＨＶ３－１６、ＩＧＨＶ３－１９、ＩＧＨＶ３－２０、ＩＧＨＶ３－２１、ＩＧＨＶ３－２２、ＩＧＨＶ３－２３、ＩＧＨＶ３－２５、ＩＧＨＶ３－２９、ＩＧＨＶ３－３０、ＩＧＨＶ３－３０－２、ＩＧＨＶ３－３０－３、ＩＧＨＶ３－３０－５、ＩＧＨＶ３－３２、ＩＧＨＶ３－３３、ＩＧＨＶ３－３３－２、ＩＧＨＶ３－３５、ＩＧＨＶ３－３６、ＩＧＨＶ３－３７、ＩＧＨＶ３－３８、ＩＧＨＶ３－４１、ＩＧＨＶ３－４２、ＩＧＨＶ３－４３、ＩＧＨＶ３－４７、ＩＧＨＶ３－４８、ＩＧＨＶ３－４９、ＩＧＨＶ３－５０、ＩＧＨＶ３－５２、ＩＧＨＶ３－５３、ＩＧＨＶ３－５４、ＩＧＨＶ３－５７、ＩＧＨＶ３－６０、ＩＧＨＶ３－６２、ＩＧＨＶ３－６３、ＩＧＨＶ３－６４、ＩＧＨＶ３－６５、ＩＧＨＶ３－６６、ＩＧＨＶ３－７１、ＩＧＨＶ３－７２、ＩＧＨＶ３－７３、ＩＧＨＶ３－７４、ＩＧＨＶ３－７５、ＩＧＨＶ３－７６、ＩＧＨＶ３－７９、ＩＧＨＶ３－３８－３、ＩＧＨＶ３－６９－１、ＩＧＨＶ４－４、ＩＧＨＶ４－２８、ＩＧＨＶ４－３０－１、ＩＧＨＶ４－３０－２、ＩＧＨＶ４－３０－４、ＩＧＨＶ４－３１、ＩＧＨＶ４－３４、ＩＧＨＶ４－３９、ＩＧＨＶ４－５５、ＩＧＨＶ４－５９、ＩＧＨＶ４－６１、ＩＧＨＶ４－８０、ＩＧＨＶ４－３８－２、ＩＧＨＶ５－５１、ＩＧＨＶ５－７８、ＩＧＨＶ５－１０－１、ＩＧＨＶ６－１、ＩＧＨＶ７－４－１、ＩＧＨＶ７－２７、ＩＧＨＶ７－３４－１、ＩＧＨＶ７－４０、ＩＧＨＶ７－５６、ＩＧＨＶ７－８１、ＩＧＨＶＩＩ－１－１、ＩＧＨＶＩＩ－１５－１、ＩＧＨＶＩＩ－２０－１、ＩＧＨＶＩＩ－２２－１、ＩＧＨＶＩＩ－２６－２、ＩＧＨＶＩＩ－２８－１、ＩＧＨＶＩＩ－３０－１、ＩＧＨＶＩＩ－３１－１、ＩＧＨＶＩＩ－３３－１、ＩＧＨＶＩＩ－４０－１、ＩＧＨＶＩＩ－４３－１、ＩＧＨＶＩＩ－４４－２、ＩＧＨＶＩＩ－４６－１、ＩＧＨＶＩＩ－４９－１、ＩＧＨＶＩＩ－５１－２、ＩＧＨＶＩＩ－５３－１、ＩＧＨＶＩＩ－６０－１、ＩＧＨＶＩＩ－６２－１、ＩＧＨＶＩＩ－６５－１、ＩＧＨＶＩＩ－６７－１、ＩＧＨＶＩＩ－７４－１、ＩＧＨＶＩＩ－７８－１、ＩＧＨＶＩＩＩ－２－１、ＩＧＨＶＩＩＩ－５－１、ＩＧＨＶＩＩＩ－５－２、ＩＧＨＶＩＩＩ－１１－１、ＩＧＨＶＩＩＩ－１３－１、ＩＧＨＶＩＩＩ－１６－１、ＩＧＨＶＩＩＩ－２２－２、ＩＧＨＶＩＩＩ－２５－１、ＩＧＨＶＩＩＩ－２６－１、ＩＧＨＶＩＩＩ－３８－１、ＩＧＨＶＩＩＩ－４４、ＩＧＨＶＩＩＩ－４７－１、ＩＧＨＶＩＩＩ－５１－１、ＩＧＨＶＩＩＩ－６７－２、ＩＧＨＶＩＩＩ－６７－３、ＩＧＨＶＩＩＩ－６７－４、ＩＧＨＶＩＩＩ－７６－１、ＩＧＨＶＩＩＩ－８２、ＩＧＨＶＩＶ－４４－１、ＩＧＨＤ１－１、ＩＧＨＤ１－７、ＩＧＨＤ１－１４、ＩＧＨＤ１－２０、ＩＧＨＤ１－２６、ＩＧＨＤ２－２、ＩＧＨＤ２－８、ＩＧＨＤ２－１５、ＩＧＨＤ２－２１、ＩＧＨＤ３－３、ＩＧＨＤ３－９、ＩＧＨＤ３－１０、ＩＧＨＤ３－１６、ＩＧＨＤ３－２２、ＩＧＨＤ４－４、ＩＧＨＤ４－１１、ＩＧＨＤ４－１７、ＩＧＨＤ４－２３、ＩＧＨＤ５－５、ＩＧＨＤ５－１２、ＩＧＨＤ５－１８、ＩＧＨＤ５－２４、ＩＧＨＤ６－６、ＩＧＨＤ６－１３、ＩＧＨＤ６－１９、ＩＧＨＤ６－２５、ＩＧＨＤ７－２７、ＩＧＨＪ１、ＩＧＨＪ１Ｐ、ＩＧＨＪ２、ＩＧＨＪ２Ｐ、ＩＧＨＪ３、ＩＧＨＪ３Ｐ、ＩＧＨＪ４、ＩＧＨＪ５、ＩＧＨＪ６、ＩＧＨＡ１、ＩＧＨＡ２、ＩＧＨＧ１、ＩＧＨＧ２、ＩＧＨＧ３、ＩＧＨＧ４、ＩＧＨＧＰ、ＩＧＨＤ、ＩＧＨＥ、ＩＧＨＥＰ１、ＩＧＨＭ、及びＩＧＨＶ１－６９Ｄが含まれるが、これらに限定されない。

免疫グロブリンカッパ遺伝子座（ＩＧＫ＠）は、抗体（または、免疫グロブリン）のカッパ（κ）軽鎖に対する遺伝子を含有するヒト２番染色体上の領域である。例えば、ＩＧＫ遺伝子座は、ＩＧＫＶ（可変）、ＩＧＫＪ（連結）、及びＩＧＫＣ（定常）遺伝子を含む。免疫グロブリンカッパ軽鎖をコードする例示的な遺伝子には、ＩＧＫＶ１－５、ＩＧＫＶ１－６、ＩＧＫＶ１－８、ＩＧＫＶ１－９、ＩＧＫＶ１－１２、ＩＧＫＶ１－１３、ＩＧＫＶ１－１６、ＩＧＫＶ１－１７、ＩＧＫＶ１－２２、ＩＧＫＶ１－２７、ＩＧＫＶ１－３２、ＩＧＫＶ１－３３、ＩＧＫＶ１－３５、ＩＧＫＶ１－３７、ＩＧＫＶ１－３９、ＩＧＫＶ１Ｄ－８、ＩＧＫＶ１Ｄ－１２、ＩＧＫＶ１Ｄ－１３、ＩＧＫＶ１Ｄ－１６ＩＧＫＶ１Ｄ－１７、ＩＧＫＶ１Ｄ－２２、ＩＧＫＶ１Ｄ－２７、ＩＧＫＶ１Ｄ－３２、ＩＧＫＶ１Ｄ－３３、ＩＧＫＶ１Ｄ－３５、ＩＧＫＶ１Ｄ－３７、ＩＧＫＶ１Ｄ－３９、ＩＧＫＶ１Ｄ－４２、ＩＧＫＶ１Ｄ－４３、ＩＧＫＶ２－４、ＩＧＫＶ２－１０、ＩＧＫＶ２－１４、ＩＧＫＶ２－１８、ＩＧＫＶ２－１９、ＩＧＫＶ２－２３、ＩＧＫＶ２－２４、ＩＧＫＶ２－２６、ＩＧＫＶ２－２８、ＩＧＫＶ２－２９、ＩＧＫＶ２－３０、ＩＧＫＶ２－３６、ＩＧＫＶ２－３８、ＩＧＫＶ２－４０、ＩＧＫＶ２Ｄ－１０、ＩＧＫＶ２Ｄ－１４、ＩＧＫＶ２Ｄ－１８、ＩＧＫＶ２Ｄ－１９、ＩＧＫＶ２Ｄ－２３、ＩＧＫＶ２Ｄ－２４、ＩＧＫＶ２Ｄ－２６、ＩＧＫＶ２Ｄ－２８、ＩＧＫＶ２Ｄ－２９、ＩＧＫＶ２Ｄ－３０、ＩＧＫＶ２Ｄ－３６、ＩＧＫＶ２Ｄ－３８、ＩＧＫＶ２Ｄ－４０、ＩＧＫＶ３－７、ＩＧＫＶ３－１１、ＩＧＫＶ３－１５、ＩＧＫＶ３－２０、ＩＧＫＶ３－２５、ＩＧＫＶ３－３１、ＩＧＫＶ３－３４、ＩＧＫＶ３Ｄ－７、ＩＧＫＶ３Ｄ－１１、ＩＧＫＶ３Ｄ－１５、ＩＧＫＶ３Ｄ－２０、ＩＧＫＶ３Ｄ－２５、ＩＧＫＶ３Ｄ－３１。ＩＧＫＶ３Ｄ－３４、ＩＧＫＶ４－１、ＩＧＫＶ５－２、ＩＧＫＶ６－２１、ＩＧＫＶ６Ｄ－２１、ＩＧＫＶ６Ｄ－４１、ＩＧＫＶ７－３、ＩＧＫＪ１、ＩＧＫＪ２、ＩＧＫＪ３、ＩＧＫＪ４、ＩＧＫＪ５、及びＩＧＫＣが含まれるが、これらに限定されない。

免疫グロブリンラムダ遺伝子座（ＩＧＬ＠）は、抗体（または、免疫グロブリン）のラムダ軽鎖に対する遺伝子を含有するヒト２２番染色体上の領域である。例えば、ＩＧＬ遺伝子座は、ＩＧＬＶ（可変）、ＩＧＬＪ（連結）、及びＩＧＬＣ（定常）遺伝子を含む。免疫グロブリンラムダ軽鎖をコードする例示的な遺伝子には、ＩＧＬＶ１－３６、ＩＧＬＶ１－４０、ＩＧＬＶ１－４１、ＩＧＬＶ１－４４、ＩＧＬＶ１－４７、ＩＧＬＶ１－５０、ＩＧＬＶ１－５１、ＩＧＬＶ１－６２、ＩＧＬＶ２－５、ＩＧＬＶ２－８、ＩＧＬＶ２－１１、ＩＧＬＶ２－１４、ＩＧＬＶ２－１８、ＩＧＬＶ２－２３、ＩＧＬＶ２－２８、ＩＧＬＶ２－３３、ＩＧＬＶ２－３４、ＩＧＬＶ３－１、ＩＧＬＶ３－２、ＩＧＬＶ３－４、ＩＧＬＶ３－６、ＩＧＬＶ３－７、ＩＧＬＶ３－９、ＩＧＬＶ３－１０、ＩＧＬＶ３－１２、ＩＧＬＶ３－１３、ＩＧＬＶ３－１５、ＩＧＬＶ３－１６、ＩＧＬＶ３－１７、ＩＧＬＶ３－１９、ＩＧＬＶ３－２１、ＩＧＬＶ３－２２、ＩＧＬＶ３－２４、ＩＧＬＶ３－２５、ＩＧＬＶ３－２６、ＩＧＬＶ３－２７、ＩＧＬＶ３－２９、ＩＧＬＶ３－３０、ＩＧＬＶ３－３１、ＩＧＬＶ３－３２、ＩＧＬＶ４－３、ＩＧＬＶ４－６０、ＩＧＬＶ４－６９、ＩＧＬＶ５－３７、ＩＧＬＶ５－３９、ＩＧＬＶ５－４５、ＩＧＬＶ５－４８、ＩＧＬＶ５－５２、ＩＧＬＶ６－５７、ＩＧＬＶ７－３５、ＩＧＬＶ７－４３、ＩＧＬＶ７－４６、ＩＧＬＶ８－６１、ＩＧＬＶ９－４９、ＩＧＬＶ１０－５４、ＩＧＬＶ１０－６７、ＩＧＬＶ１１－５５、ＩＧＬＶＩ－２０、ＩＧＬＶＩ－３８、ＩＧＬＶＩ－４２、ＩＧＬＶＩ－５６、ＩＧＬＶＩ－６３、ＩＧＬＶＩ－６８、ＩＧＬＶＩ－７０、ＩＧＬＶＩＶ－５３、ＩＧＬＶＩＶ－５９、ＩＧＬＶＩＶ－６４、ＩＧＬＶＩＶ－６５、ＩＧＬＶＩＶ－６６－１、ＩＧＬＶＶ－５８、ＩＧＬＶＶ－６６、ＩＧＬＶＶＩ－２２－１、ＩＧＬＶＶＩ－２５－１、ＩＧＬＶＶＩＩ－４１－１、ＩＧＬＪ１、ＩＧＬＪ２、ＩＧＬＪ３、ＩＧＬＪ４、ＩＧＬＪ５、ＩＧＬＪ６、ＩＧＬＪ７、ＩＧＬＣ１、ＩＧＬＣ２、ＩＧＬＣ３、ＩＧＬＣ４、ＩＧＬＣ５、ＩＧＬＣ６、及びＩＧＬＣ７が含まれるが、これらに限定されない。

Ｂ細胞受容体（ＢＣＲ）は、次の２つの部分から構成される：ｉ）１つのアイソタイプの膜結合型免疫グロブリン分子（例えば、ＩｇＤまたはＩｇＭ）。膜内在性ドメインの存在を除いて、これらは、それらの分泌型と同一であり得、ｉｉ）シグナル伝達部分：ジスルフィド架橋によって一緒に結合されたＩｇ－α／Ｉｇ－β（ＣＤ７９）と呼ばれるヘテロ二量体。二量体の各メンバーは、原形質膜にまたがり、免疫受容体活性化チロシンモチーフ（ＩＴＡＭ）を有する細胞質尾部を有する。

Ｔ細胞受容体（ＴＣＲ）は、２本の異なるタンパク質鎖（すなわち、ヘテロ二量体）から構成される。Ｔ細胞のうちの９５％において、これは、アルファ（α）鎖とベータ（β）鎖からなり、一方でＴ細胞のうちの５％において、これは、ガンマ（γ）及びデルタ（δ）鎖からなる。この比率は、個体発生中及び病的状態において変化し得る。Ｔ細胞受容体遺伝子は、固有の抗原受容体を各細胞に提供するためにリンパ球の発生中に再編成されるそれらのベータ及びデルタ鎖中に多数のＶ、Ｄ、及びＪ遺伝子分節（ならびに、それらのアルファ鎖及びガンマ鎖においてＶ及びＪ遺伝子分節）も含有するという点において、免疫グロブリン遺伝子と同様である。

Ｔ細胞受容体アルファ遺伝子座（ＴＲＡ）は、ＴＣＲアルファ鎖に対する遺伝子を含有するヒト１４番染色体上の領域である。例えば、ＴＲＡ遺伝子座は、例えば、ＴＲＡＶ（可変）、ＴＲＡＪ（連結）、及びＴＲＡＣ（定常）遺伝子を含む。Ｔ細胞受容体アルファ鎖をコードする例示的な遺伝子には、ＴＲＡＶ１－１、ＴＲＡＶ１－２、ＴＲＡＶ２、ＴＲＡＶ３、ＴＲＡＶ４、ＴＲＡＶ５、ＴＲＡＶ６、ＴＲＡＶ７、ＴＲＡＶ８－１、ＴＲＡＶ８－２、ＴＲＡＶ８－３、ＴＲＡＶ８－４、ＴＲＡＶ８－５、ＴＲＡＶ８－６、ＴＲＡＶ８－７、ＴＲＡＶ９－１、ＴＲＡＶ９－２、ＴＲＡＶ１０、ＴＲＡＶ１１、ＴＲＡＶ１２－１、ＴＲＡＶ１２－２、ＴＲＡＶ１２－３、ＴＲＡＶ１３－１、ＴＲＡＶ１３－２、ＴＲＡＶ１４ＤＶ４、ＴＲＡＶ１５、ＴＲＡＶ１６、ＴＲＡＶ１７、ＴＲＡＶ１８、ＴＲＡＶ１９、ＴＲＡＶ２０、ＴＲＡＶ２１、ＴＲＡＶ２２、ＴＲＡＶ２３ＤＶ６、ＴＲＡＶ２４、ＴＲＡＶ２５、ＴＲＡＶ２６－１、ＴＲＡＶ２６－２、ＴＲＡＶ２７、ＴＲＡＶ２８、ＴＲＡＶ２９ＤＶ５、ＴＲＡＶ３０、ＴＲＡＶ３１、ＴＲＡＶ３２、ＴＲＡＶ３３、ＴＲＡＶ３４、ＴＲＡＶ３５、ＴＲＡＶ３６ＤＶ７、ＴＲＡＶ３７、ＴＲＡＶ３８－１、ＴＲＡＶ３８－２ＤＶ８、ＴＲＡＶ３９、ＴＲＡＶ４０、ＴＲＡＶ４１、ＴＲＡＪ１、ＴＲＡＪ２、ＴＲＡＪ３、ＴＲＡＪ４、ＴＲＡＪ５、ＴＲＡＪ６、ＴＲＡＪ７、ＴＲＡＪ８、ＴＲＡＪ９、ＴＲＡＪ１０、ＴＲＡＪ１１、ＴＲＡＪ１２、ＴＲＡＪ１３、ＴＲＡＪ１４、ＴＲＡＪ１５、ＴＲＡＪ１６、ＴＲＡＪ１７、ＴＲＡＪ１８、ＴＲＡＪ１９、ＴＲＡＪ２０、ＴＲＡＪ２１、ＴＲＡＪ２２、ＴＲＡＪ２３、ＴＲＡＪ２４、ＴＲＡＪ２５、ＴＲＡＪ２６、ＴＲＡＪ２７、ＴＲＡＪ２８、ＴＲＡＪ２９、ＴＲＡＪ３０、ＴＲＡＪ３１、ＴＲＡＪ３２、ＴＲＡＪ３３、ＴＲＡＪ３４、ＴＲＡＪ３５、ＴＲＡＪ３６、ＴＲＡＪ３７、ＴＲＡＪ３８、ＴＲＡＪ３９、ＴＲＡＪ４０、ＴＲＡＪ４１、ＴＲＡＪ４２、ＴＲＡＪ４３、ＴＲＡＪ４４、ＴＲＡＪ４５、ＴＲＡＪ４６、ＴＲＡＪ４７、ＴＲＡＪ４８、ＴＲＡＪ４９、ＴＲＡＪ５０、ＴＲＡＪ５１、ＴＲＡＪ５２、ＴＲＡＪ５３、ＴＲＡＪ５４、ＴＲＡＪ５５、ＴＲＡＪ５６、ＴＲＡＪ５７、ＴＲＡＪ５８、ＴＲＡＪ５９、ＴＲＡＪ６０、ＴＲＡＪ６１、及びＴＲＡＣが含まれるが、これらに限定されない。

Ｔ細胞受容体ベータ遺伝子座（ＴＲＢ）は、ＴＣＲベータ鎖に対する遺伝子を含有するヒト７番染色体上の領域である。例えば、ＴＲＢ遺伝子座は、例えば、ＴＲＢＶ（可変）、ＴＲＢＤ（多様性）、ＴＲＢＪ（連結）、及びＴＲＢＣ（定常）遺伝子を含む。Ｔ細胞受容体ベータ鎖をコードする例示的な遺伝子には、ＴＲＢＶ１、ＴＲＢＶ２、ＴＲＢＶ３－１、ＴＲＢＶ３－２、ＴＲＢＶ４－１、ＴＲＢＶ４－２、ＴＲＢＶ４－３、ＴＲＢＶ５－１、ＴＲＢＶ５－２、ＴＲＢＶ５－３、ＴＲＢＶ５－４、ＴＲＢＶ５－５、ＴＲＢＶ５－６、ＴＲＢＶ５－７、ＴＲＢＶ６－２、ＴＲＢＶ６－３、ＴＲＢＶ６－４、ＴＲＢＶ６－５、ＴＲＢＶ６－６、ＴＲＢＶ６－７、ＴＲＢＶ６－８、ＴＲＢＶ６－９、ＴＲＢＶ７－１、ＴＲＢＶ７－２、ＴＲＢＶ７－３、ＴＲＢＶ７－４、ＴＲＢＶ７－５、ＴＲＢＶ７－６、ＴＲＢＶ７－７、ＴＲＢＶ７－８、ＴＲＢＶ７－９、ＴＲＢＶ８－１、ＴＲＢＶ８－２、ＴＲＢＶ９、ＴＲＢＶ１０－１、ＴＲＢＶ１０－２、ＴＲＢＶ１０－３、ＴＲＢＶ１１－１、ＴＲＢＶ１１－２、ＴＲＢＶ１１－３、ＴＲＢＶ１２－１、ＴＲＢＶ１２－２、ＴＲＢＶ１２－３、ＴＲＢＶ１２－４、ＴＲＢＶ１２－５、ＴＲＢＶ１３、ＴＲＢＶ１４、ＴＲＢＶ１５、ＴＲＢＶ１６、ＴＲＢＶ１７、ＴＲＢＶ１８、ＴＲＢＶ１９、ＴＲＢＶ２０－１、ＴＲＢＶ２１－１、ＴＲＢＶ２２－１、ＴＲＢＶ２３－１、ＴＲＢＶ２４－１、ＴＲＢＶ２５－１、ＴＲＢＶ２６、ＴＲＢＶ２７、ＴＲＢＶ２８、ＴＲＢＶ２９－１、ＴＲＢＶ３０、ＴＲＢＶＡ、ＴＲＢＶＢ、ＴＲＢＶ５－８、ＴＲＢＶ６－１、ＴＲＢＤ１、ＴＲＢＤ２、ＴＲＢＪ１－１、ＴＲＢＪ１－２、ＴＲＢＪ１－３、ＴＲＢＪ１－４、ＴＲＢＪ１－５、ＴＲＢＪ１－６、ＴＲＢＪ２－１、ＴＲＢＪ２－２、ＴＲＢＪ２－２Ｐ、ＴＲＢＪ２－３、ＴＲＢＪ２－４、ＴＲＢＪ２－５、ＴＲＢＪ２－６、ＴＲＢＪ２－７、ＴＲＢＣ１、及びＴＲＢＣ２が含まれるが、これらに限定されない。

Ｔ細胞受容体デルタ遺伝子座（ＴＲＤ）は、ＴＣＲデルタ鎖に対する遺伝子を含有するヒト１４番染色体上の領域である。例えば、ＴＲＤ遺伝子座は、例えば、ＴＲＤＶ（可変）、ＴＲＤＪ（連結）、及びＴＲＤＣ（定常）遺伝子を含む。Ｔ細胞受容体デルタ鎖をコードする例示的な遺伝子には、ＴＲＤＶ１、ＴＲＤＶ２、ＴＲＤＶ３、ＴＲＤＤ１、ＴＲＤＤ２、ＴＲＤＤ３、ＴＲＤＪ１、ＴＲＤＪ２、ＴＲＤＪ３、ＴＲＤＪ４、及びＴＲＤＣが含まれるが、これらに限定されない。

Ｔ細胞受容体ガンマ遺伝子座（ＴＲＧ）は、ＴＣＲガンマ鎖に対する遺伝子を含有するヒト７番染色体上の領域である。例えば、ＴＲＧ遺伝子座は、例えば、ＴＲＧＶ（可変）、ＴＲＧＪ（連結）、及びＴＲＧＣ（定常）遺伝子を含む。Ｔ細胞受容体ガンマ鎖をコードする例示的な遺伝子には、ＴＲＧＶ１、ＴＲＧＶ２、ＴＲＧＶ３、ＴＲＧＶ４、ＴＲＧＶ５、ＴＲＧＶ５Ｐ、ＴＲＧＶ６、ＴＲＧＶ７、ＴＲＧＶ８、ＴＲＧＶ９、ＴＲＧＶ１０、ＴＲＧＶ１１、ＴＲＧＶＡ、ＴＲＧＶＢ、ＴＲＧＪ１、ＴＲＧＪ２、ＴＲＧＪＰ、ＴＲＧＪＰ１、ＴＲＧＪＰ２、ＴＲＧＣ１、及びＴＲＧＣ２が含まれるが、これらに限定されない。

例示的ながんには、Ｂ細胞癌、例えば、多発性骨髄腫、黒色腫、乳癌、肺癌（非小細胞肺癌腫またはＮＳＣＬＣなど）、気管支癌、結腸直腸癌、前立腺癌、膵臓癌、胃癌（ｓｔｏｍａｃｈｃａｎｃｅｒ）、卵巣癌、膀胱癌、脳または中枢神経系癌、末梢神経系癌、食道癌、子宮頸癌、子宮または子宮内膜癌、口腔または咽頭の癌、肝臓癌、腎臓癌、精巣癌、胆道癌、小腸または虫垂癌、唾液腺癌、甲状腺癌（ｔｈｙｒｏｉｄｇｌａｎｄｃａｎｃｅｒ）、副腎癌、骨肉腫、軟骨肉腫、血液組織の癌、腺癌腫、炎症性筋線維芽細胞腫、消化管間質腫瘍（ＧＩＳＴ）、結腸癌、多発性骨髄腫（ＭＭ）、骨髄異形成症候群（ＭＤＳ）、骨髄増殖性障害（ＭＰＤ）、急性リンパ球性白血病（ＡＬＬ）、急性骨髄球性白血病（ＡＭＬ）、慢性骨髄球性白血病（ＣＭＬ）、慢性リンパ球性白血病（ＣＬＬ）、真性赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫（ＮＨＬ）、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫（ｅｎｄｏｔｈｅｌｉｏｓａｒｃｏｍａ）、リンパ管肉腫、リンパ管内皮肉腫（ｌｙｍｐｈａｎｇｉｏｅｎｄｏｔｈｅｌｉｏｓａｒｃｏｍａ）、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮細胞癌腫、基底細胞癌腫、腺癌腫、汗腺癌腫、脂腺癌腫、乳頭癌腫、乳頭腺癌腫、髄様癌腫、気管支癌腫、腎細胞癌腫、肝細胞癌、胆管癌腫、絨毛癌腫、セミノーマ、胎生期癌腫、ウィルムス腫瘍、膀胱癌腫、上皮癌腫、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起神経膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、肝細胞癌腫、甲状腺癌（ｔｈｙｒｏｉｄｃａｎｃｅｒ）、胃癌（ｇａｓｔｒｉｃｃａｎｃｅｒ）、頭頸部癌、小細胞癌、本態性血小板血症、特発性骨髄化生、好酸球増加症候群、全身性肥満細胞症、一般的な過好酸球増加症、慢性好酸球性白血病、神経内分泌癌、カルチノイド腫瘍などが含まれるが、これらに限定されない。

追加の例示的ながんは、表６に記載されている。

実施形態において、がんは、血液悪性腫瘍（または、前悪性腫瘍）である。本明細書で使用されるとき、血液悪性腫瘍は、造血性腫瘍またはリンパ組織腫瘍、例えば、血液、骨髄、またはリンパ節に影響を及ぼす腫瘍を指す。例示的な血液悪性腫瘍には、白血病（例えば、急性リンパ芽球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ球性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、有毛細胞性白血病、急性単球性白血病（ＡＭｏＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、若年性骨髄単球性白血病（ＪＭＭＬ）、または大型顆粒リンパ球性白血病）、リンパ腫（例えば、ＡＩＤＳ関連リンパ腫、皮膚Ｔ細胞リンパ腫、ホジキンリンパ腫（例えば、古典的ホジキンリンパ腫、または結節性リンパ球優位型ホジキンリンパ腫）、菌状息肉腫、非ホジキンリンパ腫（例えば、Ｂ細胞非ホジキンリンパ腫（例えば、バーキットリンパ腫、小リンパ球性リンパ腫（ＣＬＬ／ＳＬＬ）、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、免疫芽球性大細胞型リンパ腫、前駆Ｂリンパ芽球性リンパ腫、またはマントル細胞リンパ腫）、またはＴ細胞非ホジキンリンパ腫（菌状息肉腫、未分化大細胞リンパ腫、または前駆Ｔリンパ芽球性リンパ腫）、原発性中枢神経系リンパ腫、セザリー症候群、ワルデンストレームマクログロブリン血症）、慢性骨髄増殖性腫瘍、ランゲルハンス細胞組織球増加症、多発性骨髄腫／形質細胞腫瘍、骨髄異形成症候群、または骨髄異形成／骨髄増殖性腫瘍が含まれるが、これらに限定されない。前悪性腫瘍は、本明細書で使用されるとき、悪性ではないが悪性になると思われる組織を指す。

一実施形態において、標的遺伝子もしくは遺伝子産物、またはそれらの断片は、表１～４または図３Ａ～４Ｄに記載される遺伝子または遺伝子産物のいずれかから選択される。

追加の例示的な遺伝子は、図３Ａ～４Ｄに示される。

一実施形態において、標的遺伝子もしくは遺伝子産物、またはそれらの断片は、がん、例えば、血液悪性腫瘍（または、前悪性腫瘍）に関連する１つ以上の置換、インデル、またはコピー数変化を有する。例示的な遺伝子または遺伝子産物には、ＡＢＬ１、ＡＣＴＢ、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＭＥＲ１（ＦＡＭ１２３ＢまたはＷＴＸ）、ＡＰＣ、ＡＰＨ１Ａ、ＡＲ、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＨＧＡＰ２６（ＧＲＡＦ）ＡＲＩＤ１Ａ、ＡＲＩＤ２、ＡＳＭＴＬ、ＡＳＸＬ１、ＡＴＭ、ＡＴＲ、ＡＴＲＸ、ＡＵＲＫＡ、ＡＵＲＫＢ、ＡＸＩＮ１、ＡＸＬ、Ｂ２Ｍ、ＢＡＰ１、ＢＡＲＤ１、ＢＣＬ１０、ＢＣＬ１１Ｂ、ＢＣＬ２、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＣＬ７Ａ、ＢＣＯＲ、ＢＣＯＲＬ１、ＢＩＲＣ３、ＢＬＭ、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、ＢＲＤ４、ＢＲＩＰ１（ＢＡＣＨ１）、ＢＲＳＫ１、ＢＴＧ２、ＢＴＫ、ＢＴＬＡ、ｃ１１、もしくは、ｆ３０（ＥＭＳＹ）、ＣＡＤ、ＣＡＲＤ１１、ＣＢＦＢ、ＣＢＬ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＣＴ６Ｂ、ＣＤ２２、ＣＤ２７４、（ＰＤＬ１）、ＣＤ３６、ＣＤ５８、ＣＤ７０、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＣＤＣ７３、ＣＤＨ１、ＣＤＫ１２、ＣＤＫ４、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ１Ｂ、ＣＤＫＮ２Ａ、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＥＢＰＡ、ＣＨＤ２、ＣＨＥＫ１、ＣＨＥＫ２、ＣＩＣ、ＣＩＩＴＡ、ＣＫＳ１Ｂ、ＣＰＳ１、ＣＲＥＢＢＰ、ＣＲＫＬ、ＣＲＬＦ２、ＣＳＦ１Ｒ、ＣＳＦ３Ｒ、ＣＴＣＦ、ＣＴＮＮＡ１、ＣＴＮＮＢ１、ＣＵＸ１、ＣＸＣＲ４、ＤＡＸＸ、ＤＤＲ２、ＤＤＸ３Ｘ、ＤＮＭ２、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、ＤＴＸ１、ＤＵＳＰ２、ＤＵＳＰ９、ＥＢＦ１、ＥＣＴ２Ｌ、ＥＥＤ、ＥＧＦＲ、ＥＬＰ２、ＥＰ３００、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ７、ＥＰＨＢ１、ＥＲＢＢ２、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、ＥＳＲ１、ＥＴＳ１、ＥＴＶ６、ＥＸＯＳＣ６、ＥＺＨ２、ＦＡＦ１、ＦＡＭ４６Ｃ、ＦＡＮＣＡ、ＦＡＮＣＣ、ＦＡＮＣＤ２、ＦＡＮＣＥ、ＦＡＮＣＦ、ＦＡＮＣＧ、ＦＡＮＣＬ、ＦＡＳ（ＴＮＦＲＳＦ６）、ＦＢＸＯ１１、ＦＢＸＯ３１、ＦＢＸＷ７、ＦＧＦ１０、ＦＧＦ１４、ＦＧＦ１９、ＦＧＦ２３、ＦＧＦ３、ＦＧＦ４、ＦＧＦ６、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＧＦＲ４、ＦＨＩＴ、ＦＬＣＮ、ＦＬＴ１、ＦＬＴ３、ＦＬＴ４、ＦＬＹＷＣＨ１、ＦＯＸＬ２、ＦＯＸＯ１、ＦＯＸＯ３、ＦＯＸＰ１、ＦＲＳ２、ＧＡＤＤ４５Ｂ、ＧＡＴＡ１、ＧＡＴＡ２、ＧＡＴＡ３、ＧＩＤ４（Ｃ１７ｏｒｆ３９）、ＧＮＡ１１、ＧＮＡ１２、ＧＮＡ１３、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＲＩＮ２Ａ、ＧＳＫ３Ｂ、ＧＴＳＥ１、ＨＤＡＣ１、ＨＤＡＣ４、ＨＤＡＣ７、ＨＧＦ、ＨＩＳＴ１Ｈ１Ｃ、ＨＩＳＴ１Ｈ１Ｄ、ＨＩＳＴ１Ｈ１Ｅ、ＨＩＳＴ１Ｈ２ＡＣ、ＨＩＳＴ１Ｈ２ＡＧ、ＨＩＳＴ１Ｈ２ＡＬ、ＨＩＳＴ１Ｈ２ＡＭ、ＨＩＳＴ１Ｈ２ＢＣ、ＨＩＳＴ１Ｈ２ＢＪ、ＨＩＳＴ１Ｈ２ＢＫ、ＨＩＳＴ１Ｈ２ＢＯ、ＨＩＳＴ１Ｈ３Ｂ、ＨＮＦ１Ａ、ＨＲＡＳ、ＨＳＰ９０ＡＡ１、ＩＣＫ、ＩＤ３、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＫＺＦ２、ＩＫＺＦ３、ＩＬ７Ｒ、ＩＮＨＢＡ、ＩＮＰＰ４Ｂ、ＩＮＰＰ５Ｄ（ＳＨＩＰ）、ＩＲＦ１、ＩＲＦ４、ＩＲＦ８、ＩＲＳ２、ＪＡＫ１、ＪＡＫ２、ＪＡＫ３、ＪＡＲＩＤ２、ＪＵＮ、ＫＡＴ６Ａ（ＭＹＳＴ３）、ＫＤＭ２Ｂ、ＫＤＭ４Ｃ、ＫＤＭ５Ａ、ＫＤＭ５Ｃ、ＫＤＭ６Ａ、ＫＤＲ、ＫＥＡＰ１、ＫＩＴ、ＫＬＨＬ６、ＫＭＴ２Ａ（ＭＬＬ）、ＫＭＴ２Ｂ（ＭＬＬ２）、ＫＭＴ２Ｃ（ＭＬＬ３）、ＫＲＡＳ、ＬＥＦ１、ＬＲＰ１Ｂ、ＬＲＲＫ２、ＭＡＦ、ＭＡＦＢ、ＭＡＧＥＤ１、ＭＡＬＴ１、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＡＰ２Ｋ４、ＭＡＰ３Ｋ１、ＭＡＰ３Ｋ１４、ＭＡＰ３Ｋ６、ＭＡＰ３Ｋ７、ＭＡＰＫ１、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＤ１２、ＭＥＦ２Ｂ、ＭＥＦ２Ｃ、ＭＥＮ１、ＭＥＴ、ＭＩＢ１、ＭＩＴＦ、ＭＫＩ６７、ＭＬＨ１、ＭＰＬ、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ３、ＭＳＨ６、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣ、ＭＹＣＬ（ＭＹＣＬ１）、ＭＹＣＮ、ＭＹＤ８８、ＭＹＯ１８Ａ、ＮＣＯＲ２、ＮＣＳＴＮ、ＮＦ１、ＮＦ２、ＮＦＥ２Ｌ２、ＮＦＫＢＩＡ、ＮＫＸ２－１、ＮＯＤ１、ＮＯＴＣＨ１、ＮＯＴＣＨ２、ＮＰＭ１、ＮＲＡＳ、ＮＴ５Ｃ２、ＮＴＲＫ１、ＮＴＲＫ２、ＮＴＲＫ３、ＮＵＰ９３、ＮＵＰ９８、Ｐ２ＲＹ８、ＰＡＧ１、ＰＡＫ３、ＰＡＬＢ２、ＰＡＳＫ、ＰＡＸ５、ＰＢＲＭ１、ＰＣ、ＰＣＢＰ１、ＰＣＬＯ、ＰＤＣＤ１、ＰＤＣＤ１１、ＰＤＣＤ１ＬＧ２（ＰＤＬ２）、ＰＤＧＦＲＡ、ＰＤＧＦＲＢ、ＰＤＫ１、ＰＨＦ６、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＩＫ３Ｒ２、ＰＩＭ１、ＰＬＣＧ２、ＰＯＴ１、ＰＰＰ２Ｒ１Ａ、ＰＲＤＭ１、ＰＲＫＡＲ１Ａ、ＰＲＫＤＣ、ＰＲＳＳ８、ＰＴＣＨ１、ＰＴＥＮ、ＰＴＰＮ１１、ＰＴＰＮ２、ＰＴＰＮ６（ＳＨＰ－１）、ＰＴＰＲＯ、ＲＡＤ２１、ＲＡＤ５０、ＲＡＤ５１、ＲＡＦ１、ＲＡＲＡ、ＲＡＳＧＥＦ１Ａ、ＲＢ１、ＲＥＬＮ、ＲＥＴ、ＲＨＯＡ、ＲＩＣＴＯＲ、ＲＮＦ４３、ＲＯＳ１、ＲＰＴＯＲ、ＲＵＮＸ１、Ｓ１ＰＲ２、ＳＤＨＡ、ＳＤＨＢ、ＳＤＨＣ、ＳＤＨＤ、ＳＥＲＰ２、ＳＥＴＢＰ１、ＳＥＴＤ２、ＳＦ３Ｂ１、ＳＧＫ１、ＳＭＡＤ２、ＳＭＡＤ４、ＳＭＡＲＣＡ１、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＭＣ１Ａ、ＳＭＣ３、ＳＭＯ、ＳＯＣＳ１、ＳＯＣＳ２、ＳＯＣＳ３、ＳＯＸ１０、ＳＯＸ２、ＳＰＥＮ、ＳＰＯＰ、ＳＲＣ、ＳＲＳＦ２、ＳＴＡＧ２、ＳＴＡＴ３、ＳＴＡＴ４、ＳＴＡＴ５Ａ、ＳＴＡＴ５Ｂ、ＳＴＡＴ６、ＳＴＫ１１、ＳＵＦＵ、ＳＵＺ１２、ＴＡＦ１、ＴＢＬ１ＸＲ１、ＴＣＦ３、ＴＣＬ１Ａ、ＴＥＴ２、ＴＧＦＢＲ２、ＴＬＬ２、ＴＭＥＭ３０Ａ、ＴＭＳＢ４ＸＰ８（ＴＭＳＬ３）、ＴＮＦＡＩＰ３、ＴＮＦＲＳＦ１１Ａ、ＴＮＦＲＳＦ１４、ＴＮＦＲＳＦ１７、ＴＯＰ１、ＴＰ５３、ＴＰ６３、ＴＲＡＦ２、ＴＲＡＦ３、ＴＲＡＦ５、ＴＳＣ１、ＴＳＣ２、ＴＳＨＲ、ＴＵＳＣ３、ＴＹＫ２、Ｕ２ＡＦ１、Ｕ２ＡＦ２、ＶＨＬ、ＷＤＲ９０、ＷＨＳＣ１（ＭＭＳＥＴ、または、ＮＳＤ２）、ＷＩＳＰ３、ＷＴ１、ＸＢＰ１、ＸＰＯ１、ＹＹ１ＡＰ１、ＺＭＹＭ３、ＺＮＦ２１７、ＺＮＦ２４（ＺＳＣＡＮ３）、ＺＮＦ７０３、またはＺＲＳＲ２が含まれるが、これらに限定されない。

一実施形態において、標的遺伝子もしくは遺伝子産物、またはそれらの断片は、がん、例えば、血液悪性腫瘍（または、前悪性腫瘍）に関連する１つ以上の再編成を有する。例示的な遺伝子または遺伝子産物には、ＡＬＫ、ＢＣＬ６、ＢＲＡＦ、ＣＲＬＦ２、ＥＰＯＲ、ＥＴＶ４、ＥＴＶ６、ＦＧＦＲ２、ＩＧＫ、ＢＣＬ２、ＢＣＲ、ＣＣＮＤ１、ＥＧＦＲ、ＥＴＶ１、ＥＴＶ５、ＥＷＳＲ１、ＩＧＨ、ＩＧＬ、ＪＡＫ１、ＫＭＴ２Ａ、（ＭＬＬ）、ＮＴＲＫ１、ＰＤＧＦＲＢ、ＲＡＲＡ、ＲＯＳ１、ＴＲＧ、ＪＡＫ２、ＭＹＣ、ＰＤＧＦＲＡ、ＲＡＦ１、ＲＥＴ、またはＴＭＰＲＳＳ２が含まれるが、これらに限定されない。

別の実施形態において、標的遺伝子もしくは遺伝子産物、またはそれらの断片は、がんに関連する１つ以上の融合を有する。例示的な遺伝子または遺伝子産物には、ＡＢＩ１、ＣＢＦＡ２Ｔ３、ＥＩＦ４Ａ２、ＦＵＳ、ＪＡＫ１、ＭＵＣ１、ＰＢＸ１、ＲＮＦ２１３、ＴＥＴ１、ＡＢＬ１、ＣＢＦＢ、ＥＬＦ４、ＧＡＳ７、ＪＡＫ２、ＭＹＢ、ＰＣＭ１、ＲＯＳ１、ＴＦＥ３、ＡＢＬ２、ＣＢＬ、ＥＬＬ、ＧＬＩ１、ＪＡＫ３、ＭＹＣ、ＰＣＳＫ７、ＲＰＬ２２、ＴＦＧ、ＡＣＳＬ６、ＣＣＮＤ１、ＥＬＮ、ＧＭＰＳ、ＪＡＺＦ１、ＭＹＨ１１、ＰＤＣＤ１ＬＧ２（ＰＤＬ２）、ＲＰＮ１、ＴＦＰＴ、ＡＦＦ１、ＣＣＮＤ２、ＥＭＬ４、ＧＰＨＮ、ＫＡＴ６Ａ（ＭＹＳＴ３）、ＭＹＨ９、ＰＤＥ４ＤＩＰ、ＲＵＮＸ１、ＴＦＲＣ、ＡＦＦ４、ＣＣＮＤ３、ＥＰ３００、ＨＥＲＰＵＤ１、ＫＤＳＲ、ＮＡＣＡ、ＰＤＧＦＢ、ＲＵＮＸ１Ｔ１（ＥＴＯ）、ＴＬＸ１、ＡＬＫ、ＣＤ２７４（ＰＤＬ１）、ＥＰＯＲ、ＨＥＹ１、ＫＩＦ５Ｂ、ＮＢＥＡＰ１（ＢＣＬ８）、ＰＤＧＦＲＡ、ＲＵＮＸ２、ＴＬＸ３、ＡＲＨＧＡＰ２６（ＧＲＡＦ）、ＣＤＫ６、ＥＰＳ１５、ＨＩＰ１、ＫＭＴ２Ａ（ＭＬＬ）、ＮＣＯＡ２、ＰＤＧＦＲＢ、ＳＥＣ３１Ａ、ＴＭＰＲＳＳ２、ＡＲＨＧＥＦ１２、ＣＤＸ２、ＥＲＢＢ２、ＨＩＳＴ１Ｈ４Ｉ、ＬＡＳＰ１、ＮＤＲＧ１、ＰＥＲ１、ＳＥＰＴ５、ＴＮＦＲＳＦ１１Ａ、ＡＲＩＤ１Ａ、ＣＨＩＣ２、ＥＲＧ、ＨＬＦ、ＬＣＰ１、ＮＦ１、ＰＨＦ１、ＳＥＰＴ６、ＴＯＰ１、ＡＲＮＴ、ＣＨＮ１、ＥＴＳ１、ＨＭＧＡ１、ＬＭＯ１、ＮＦ２、ＰＩＣＡＬＭ、ＳＥＰＴ９、ＴＰ６３、ＡＳＸＬ１、ＣＩＣ、ＥＴＶ１、ＨＭＧＡ２、ＬＭＯ２、ＮＦＫＢ２、ＰＩＭ１、ＳＥＴ、ＴＰＭ３、ＡＴＦ１、ＣＩＩＴＡ、ＥＴＶ４、ＨＯＸＡ１１、ＬＰＰ、ＮＩＮ、ＰＬＡＧ１、ＳＨ３ＧＬ１、ＴＰＭ４、ＡＴＧ５、ＣＬＰ１、ＥＴＶ５、ＨＯＸＡ１３、ＬＹＬ１、ＮＯＴＣＨ１、ＰＭＬ、ＳＬＣ１Ａ２、ＴＲＩＭ２４、ＡＴＩＣ、ＣＬＴＣ、ＥＴＶ６、ＨＯＸＡ３、ＭＡＦ、ＮＰＭ１、ＰＯＵ２ＡＦ１、ＳＮＸ２９（ＲＵＮＤＣ２Ａ）、ＴＲＩＰ１１、ＢＣＬ１０、ＣＬＴＣＬ１、ＥＷＳＲ１、ＨＯＸＡ９、ＭＡＦＢ、ＮＲ４Ａ３、ＰＰＰ１ＣＢ、ＳＲＳＦ３、ＴＴＬ、ＢＣＬ１１Ａ、ＣＮＴＲＬ（ＣＥＰ１１０）、ＦＣＧＲ２Ｂ、ＨＯＸＣ１１、ＭＡＬＴ１、ＮＳＤ１、ＰＲＤＭ１、ＳＳ１８、ＴＹＫ２、ＢＣＬ１１Ｂ、ＣＯＬ１Ａ１、ＦＣＲＬ４、ＨＯＸＣ１３、ＭＤＳ２、ＮＴＲＫ１、ＰＲＤＭ１６、ＳＳＸ１、ＵＳＰ６、ＢＣＬ２、ＣＲＥＢ３Ｌ１、ＦＥＶ、ＨＯＸＤ１１、ＭＥＣＯＭ、ＮＴＲＫ２、ＰＲＲＸ１、ＳＳＸ２、ＷＨＳＣ１（ＭＭＳＥＴ、またはＮＳＤ２）、ＢＣＬ３、ＣＲＥＢ３Ｌ２、ＦＧＦＲ１、ＨＯＸＤ１３、ＭＫＬ１、ＮＴＲＫ３、ＰＳＩＰ１、ＳＳＸ４、ＷＨＳＣ１Ｌ１、ＢＣＬ６、ＣＲＥＢＢＰ、ＦＧＦＲ１ＯＰ、ＨＳＰ９０ＡＡ１、ＭＬＦ１、ＮＵＭＡ１、ＰＴＣＨ１、ＳＴＡＴ６、ＹＰＥＬ５、ＢＣＬ７Ａ、ＣＲＬＦ２、ＦＧＦＲ２、ＨＳＰ９０ＡＢ１、ＭＬＬＴ１（ＥＮＬ）、ＮＵＰ２１４、ＰＴＫ７、ＳＴＬ、ＺＢＴＢ１６、ＢＣＬ９、ＣＳＦ１、ＦＧＦＲ３、ＩＧＨ、ＭＬＬＴ１０（ＡＦ１０）、ＮＵＰ９８、ＲＡＢＥＰ１、ＳＹＫ、ＺＭＹＭ２、ＢＣＯＲ、ＣＴＮＮＢ１、ＦＬＩ１、ＩＧＫ、ＭＬＬＴ３、ＮＵＴＭ２Ａ、ＲＡＦ１、ＴＡＦ１５、ＺＮＦ３８４、ＢＣＲ、ＤＤＩＴ３、ＦＮＢＰ１、ＩＧＬ、ＭＬＬＴ４、（ＡＦ６）、ＯＭＤ、ＲＡＬＧＤＳ、ＴＡＬ１、ＺＮＦ５２１、ＢＩＲＣ３、ＤＤＸ１０、ＦＯＸＯ１、ＩＫＺＦ１、ＭＬＬＴ６、Ｐ２ＲＹ８、ＲＡＰ１ＧＤＳ１、ＴＡＬ２、ＢＲＡＦ、ＤＤＸ６、ＦＯＸＯ３、ＩＬ２１Ｒ、ＭＮ１、ＰＡＦＡＨ１Ｂ２、ＲＡＲＡ、ＴＢＬ１ＸＲ１、ＢＴＧ１、ＤＥＫ、ＦＯＸＯ４、ＩＬ３、ＭＮＸ１、ＰＡＸ３、ＲＢＭ１５、ＴＣＦ３（Ｅ２Ａ）、ＣＡＭＴＡ１、ＤＵＳＰ２２、ＦＯＸＰ１、ＩＲＦ４、ＭＳＩ２、ＰＡＸ５、ＲＥＴ、ＴＣＬ１Ａ（ＴＣＬ１）、ＣＡＲＳ、ＥＧＦＲ、ＦＳＴＬ３、ＩＴＫ、ＭＳＮ、ＰＡＸ７、ＲＨＯＨ、またはＴＥＣが含まれるが、これらに限定されない。

追加の例示的な遺伝子は、例えば、国際出願公開第ＷＯ２０１２／０９２４２６号の表１～１１に記載されており、その内容は、参照によってその全体が組み込まれる。

前述の方法の適用は、医学的検体における配列決定のための特定の遺伝子（複数可）の全ての既知の配列変異形（または、そのサブセット）を含有するオリゴヌクレオチドのライブラリを使用することを含む。

ある特定の実施形態において、本方法またはアッセイは、次のうちの１つ以上をさらに含む：
（ｉ）核酸試料のフィンガープリントを行うこと、
（ｉｉ）核酸試料中の遺伝子もしくは遺伝子産物（例えば、本明細書に記載されるような遺伝子または遺伝子産物）の存在量を定量化すること、
（ｉｉｉ）試料中の転写物の相対的存在量を定量化すること、
（ｉｖ）核酸試料を特定の対象（例えば、正常対照またはがん患者）に属するものとして識別すること、
（ｖ）核酸試料中の遺伝形質（例えば、１つ以上の対象の遺伝形質（例えば、民族性、人種、家族の特徴）を識別すること、
（ｖｉ）核酸試料中の倍数性を決定し、核酸試料中のヘテロ接合性喪失を決定すること、
（ｖｉｉ）核酸試料中の遺伝子重複事象の有無を判定すること、
（ｖｉｉｉ）核酸試料中の遺伝子増幅事象の有無を判定すること、または
（ｉｘ）核酸試料中の腫瘍／正常細胞混合のレベルを決定すること。

核酸試料
様々な組織試料が、本方法で使用される核酸試料の供給源となり得る。ゲノムまたはサブゲノム核酸（例えば、ＤＮＡまたはＲＮＡ）は、対象の試料（例えば、腫瘍試料、正常近接組織（ＮＡＴ）、血液試料）、循環腫瘍細胞（ＣＴＣ）を含有する試料、または任意の正常な対照）から単離され得る。ある特定の実施形態において、組織試料は、凍結試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフィン包埋（ＦＦＰＥ）組織調製物として保存される。例えば、試料は、マトリックス、例えば、ＦＦＰＥブロックまたは凍結試料中に包埋され得る。ある特定の実施形態において、組織試料は、血液試料である。他の実施形態において、組織試料は、骨髄穿刺液（ＢＭＡ）試料である。単離ステップは、個別の染色体の流動選別、及び／または対象の試料（例えば、腫瘍試料、ＮＡＴ、血液試料）を顕微解剖することを含み得る。

「単離」核酸分子は、核酸分子の天然の供給源に存在する他の核酸分子から分離されている核酸分子である。ある特定の実施形態において、「単離」核酸分子は、核酸が由来する生物のゲノムＤＮＡ中の核酸（すなわち、核酸の５’及び３’ 末端に位置する配列）に天然に隣接する配列（タンパク質コード配列など）を含まない。例えば、様々な実施形態において、単離核酸分子は、核酸が由来する細胞のゲノムＤＮＡ中の核酸分子に天然に隣接する、約５ｋＢ未満、約４ｋＢ未満、約３ｋＢ未満、約２ｋＢ未満、約１ｋＢ未満、約０．５ｋＢ未満、または約０．１ｋＢ未満のヌクレオチド配列を含有し得る。さらに、ＲＮＡ分子またはｃＤＮＡ分子などの「単離」核酸分子は、例えば、組み換え技法によって産生されるか、または化学的前駆体もしくは他の化学物質を実質的に含まない場合、例えば、化学合成される場合、他の細胞性物質または培地を実質的に含み得ない。

「他の細胞性物質または培地を実質的に含まない」という語は、核酸分子が単離されているかまたは組み換え産生される細胞の細胞構成成分から、その分子が分離される、核酸分子の調製物を含む。故に、実質的に細胞性物質を含まない核酸分子は、約３０％未満、約２０％未満、約１０％未満、または約５％未満（乾燥重量による）の他の細胞性物質または培地を有する核酸分子の調製物を含む。

ある特定の実施形態において、核酸は、経年試料、例えば、経年ＦＦＰＥ試料から単離される。経年試料は、例えば、１年、２年、３年、４年、５年、１０年、１５年、２０年、２５年、５０年、７５年、または１００年以上であり得る。

核酸試料は、様々なサイズの組織試料（例えば、生体組織、ＦＦＰＥ試料、血液試料、または骨髄穿刺試料）から得ることができる。例えば、核酸は、５～２００μｍ以上の組織試料から単離され得る。例えば、組織試料は、５μｍ、１０μｍ、２０μｍ、３０μｍ、４０μｍ、５０μｍ、７０μｍ、１００μｍ、１１０μｍ、１２０μｍ、１５０μｍ、または２００μｍ以上を測定し得る。

国際特許出願公開第ＷＯ２０１２／０９２４２６号の実施例１に提供されるような組織試料からのＤＮＡ単離のためのプロトコルが、当技術分野で知られている。ホルムアルデヒドまたはパラホルムアルデヒド固定、パラフィン包埋（ＦＦＰＥ）組織から核酸（例えば、ＤＮＡ）を単離するための追加の方法は、例えば、ＣｒｏｎｉｎＭ．ｅｔａｌ．，（２００４）ＡｍＪＰａｔｈｏｌ．１６４（１）：３５－４２、ＭａｓｕｄａＮ．ｅｔａｌ．，（１９９９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２７（２２）：４４３６－４４４３、ＳｐｅｃｈｔＫ．ｅｔａｌ．，（２００１）ＡｍＪＰａｔｈｏｌ．１５８（２）：４１９－４２９、ＡｍｂｉｏｎＲｅｃｏｖｅｒＡｌｌ（商標）ＴｏｔａｌＮｕｃｌｅｉｃＡｃｉｄＩｓｏｌａｔｉｏｎＰｒｏｔｏｃｏｌ（Ａｍｂｉｏｎ，Ｃａｔ．Ｎｏ．ＡＭ１９７５，Ｓｅｐｔｅｍｂｅｒ２００８）、Ｍａｘｗｅｌｌ（登録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔＴｅｃｈｎｉｃａｌＭａｎｕａｌ（ＰｒｏｍｅｇａＬｉｔｅｒａｔｕｒｅ＃ＴＭ３４９，Ｆｅｂｒｕａｒｙ２０１１）、Ｅ．Ｚ．Ｎ．Ａ．（登録商標）ＦＦＰＥＤＮＡＫｉｔＨａｎｄｂｏｏｋ（ＯＭＥＧＡｂｉｏ－ｔｅｋ，Ｎｏｒｃｒｏｓｓ，ＧＡ，ｐｒｏｄｕｃｔｎｕｍｂｅｒｓＤ３３９９－００，Ｄ３３９９－０１，ａｎｄＤ３３９９－０２；Ｊｕｎｅ２００９）、及びＱＩＡａｍｐ（登録商標）ＤＮＡＦＦＰＥＴｉｓｓｕｅＨａｎｄｂｏｏｋ（Ｑｉａｇｅｎ，Ｃａｔ．Ｎｏ．３７６２５，Ｏｃｔｏｂｅｒ２００７）に開示されている。ＲｅｃｏｖｅｒＡｌｌ（商標）ＴｏｔａｌＮｕｃｌｅｉｃＡｃｉｄＩｓｏｌａｔｉｏｎＫｉｔは、高温でキシレンを使用して、パラフィン包埋試料及びグラスファイバーフィルターを溶解させて核酸を捕捉する。Ｍａｘｗｅｌｌ（登録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔは、ＦＦＰＥ組織の１～１０μｍ切片からのゲノムＤＮＡの精製のために、Ｍａｘｗｅｌｌ（登録商標）１６機器とともに使用される。ＤＮＡは、シリカ被覆常磁性粒子（ＰＭＰ）を使用して精製され、低溶出体積で溶出される。Ｅ．Ｚ．Ｎ．Ａ．（登録商標）ＦＦＰＥＤＮＡＫｉｔは、ゲノムＤＮＡの単離のためにスピンカラム及び緩衝液系を使用する。ＱＩＡａｍｐ（登録商標）ＤＮＡＦＦＰＥＴｉｓｓｕｅＫｉｔは、ゲノム及びミトコンドリアＤＮＡの精製のために、ＱＩＡａｍｐ（登録商標）ＤＮＡＭｉｃｒｏ技術を使用する。血液からのＤＮＡ単離のためのプロトコルは、例えば、Ｍａｘｗｅｌｌ（登録商標）１６ＬＥＶＢｌｏｏｄＤＮＡＫｉｔ及びＭａｘｗｅｌｌ１６ＢｕｃｃａｌＳｗａｂＬＥＶＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔＴｅｃｈｎｉｃａｌＭａｎｕａｌ（ＰｒｏｍｅｇａＬｉｔｅｒａｔｕｒｅ＃ＴＭ３３３，Ｊａｎｕａｒｙ１，２０１１）に開示されている。

ＲＮＡ単離のためのプロトコルは、例えば、Ｍａｘｗｅｌｌ（登録商標）１６ＴｏｔａｌＲＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔＴｅｃｈｎｉｃａｌＢｕｌｌｅｔｉｎ（ＰｒｏｍｅｇａＬｉｔｅｒａｔｕｒｅ＃ＴＢ３５１，Ａｕｇｕｓｔ２００９）に開示されている。

単離核酸試料（例えば、ゲノムＤＮＡ試料）は、日常的な技法を実施することによって断片化またはせん断され得る。例えば、ゲノムＤＮＡは、物理的せん断法、酵素的切断法、化学的切断法、及び当業者に周知の他の方法によって断片化され得る。核酸ライブラリは、ゲノムの複雑性の全てまたは実質的に全てを含み得る。この文脈において「実質的に全て」という用語は、実際には、手順の最初のステップの間に、ゲノムの複雑性のいくつかの不必要な喪失があり得る可能性を指す。本明細書に記載される方法はまた、核酸ライブラリがゲノムの一部である場合、すなわち、ゲノムの複雑性が設計によって低減される場合にも有用である。いくつかの実施形態において、ゲノムの任意の選択部分は、本明細書に記載される方法とともに使用され得る。ある特定の実施形態において、全エクソームまたはそのサブセットは、単離される。

本発明において取り上げられる方法は、核酸試料を単離して、ライブラリ（例えば、本明細書に記載されるような核酸ライブラリ）を提供することをさらに含み得る。ある特定の実施形態において、核酸試料は、全ゲノム、サブゲノム断片、またはそれらの両方を含む。単離核酸試料は、核酸ライブラリを調製するために使用され得る。故に、一実施形態において、本発明において取り上げられる方法は、核酸試料を単離して、ライブラリ（例えば、本明細書に記載されるような核酸ライブラリ）を提供することをさらに含む。全ゲノムまたはサブゲノム断片からライブラリを単離及び調製するためのプロトコルが、当技術分野で知られている（例えば、ＩｌｌｕｍｉｎａのゲノムＤＮＡ試料調製キット）。ある特定の実施形態において、ゲノムまたはサブゲノムＤＮＡ断片は、対象の試料（例えば、腫瘍試料、正常近接組織（ＮＡＴ）、血液試料、または任意の正常な対照））から単離される。一実施形態において、試料（例えば、腫瘍またはＮＡＴ試料）は、保存検体である。例えば、試料は、マトリックス、例えば、ＦＦＰＥブロックまたは凍結試料中に包埋される。ある特定の実施形態において、単離ステップは、個別の染色体の流動選別、及び／または対象の試料（例えば、腫瘍試料、ＮＡＴ、血液試料）を顕微解剖することを含む。ある特定の実施形態において、核酸ライブラリを生成するために使用される核酸試料は、５マイクログラム未満、１マイクログラム未満、または５００ｎｇ未満、２００ｎｇ未満、１００ｎｇ未満、５０ｎｇ未満、１０ｎｇ未満、５ｎｇ未満、または１ｎｇ未満である。

さらに他の実施形態において、ライブラリを生成するために使用される核酸試料は、ＲＮＡまたはＲＮＡ由来のｃＤＮＡを含む。いくつかの実施形態において、ＲＮＡは、全細胞ＲＮＡを含む。他の実施形態において、ある大量のＲＮＡ配列（例えば、リボソームＲＮＡ）は、枯渇している。いくつかの実施形態において、全ＲＮＡ調製物中のポリ（Ａ）尾部付きｍＲＮＡ画分は、富化されている。いくつかの実施形態において、ｃＤＮＡは、ランダム刺激ｃＤＮＡ合成方法によって産生される。他の実施形態において、ｃＤＮＡ合成は、オリゴ（ｄＴ）含有オリゴヌクレオチドで刺激することによって成熟ｍＲＮＡのポリ（Ａ）尾部で惹起される。枯渇、ポリ（Ａ）富化、及びｃＤＮＡ合成のための方法が、当業者によく知られている。

本方法は、当業者に周知の特異的または非特異的核酸増幅法によって核酸試料を増幅することをさらに含み得る。いくつかの実施形態において、核酸試料は、例えば、ランダム刺激鎖置換増幅などの全ゲノム増幅法によって増幅される。

他の実施形態において、核酸試料は、物理的または酵素的方法によって断片化またはせん断され、合成アダプターに連結され、（例えば、分取ゲル電気泳動によって）サイズ選択され、（例えば、ＰＣＲによって）増幅される。他の実施形態において、核酸の断片化及びアダプター連結群は、ハイブリッド選択の前に、明確なサイズ選択または増幅なしに使用される。

他の実施形態において、単離ＤＮＡ（例えば、ゲノムＤＮＡ）は、断片化またはせん断される。いくつかの実施形態において、ライブラリは、例えば、他の手段によって細分画化されているゲノムの簡約表示または定義された部分であるゲノムＤＮＡの細画分などの、ゲノムＤＮＡの５０％未満を含む。他の実施形態において、ライブラリは、全てまたは実質的に全てのゲノムＤＮＡを含む。

いくつかの実施形態において、ライブラリは、例えば、他の手段によって細分画化されているゲノムの簡約表示または定義された部分であるゲノムＤＮＡの細画分などの、ゲノムＤＮＡの５０％未満を含む。他の実施形態において、ライブラリは、全てまたは実質的に全てのゲノムＤＮＡを含む。全ゲノムまたはサブゲノム断片からライブラリを単離及び調製するためのプロトコルが、当技術分野で知られており（例えば、ＩｌｌｕｍｉｎａのゲノムＤＮＡ試料調製キット）、実施例において本明細書に記載される。例えば、国際特許出願公開第ＷＯ２０１２／０９２４２６号の実施例４に記載されているようなＤＮＡせん断するための代替的な方法が、当技術分野で知られている。例えば、代替的なＤＮＡせん断法は、より自動化可能及び／またはより効率的であり得る（例えば、分解されたＦＦＰＥ試料を用いる）。ＤＮＡせん断法に対する代替法は、ライブラリ調製中の連結ステップを回避するためにも使用され得る。

本明細書に記載される方法は、例えば、供給源ＤＮＡまたはＲＮＡの量が（例えば、全ゲノム増幅の後でさえも）限定される場合、少量の核酸を使用して行われ得る。一実施形態において、核酸は、約５μｇ、４μｇ、３μｇ、２μｇ、１μｇ、０．８μｇ、０．７μｇ、０．６μｇ、０．５μｇ未満、または４００ｎｇ、３００ｎｇ、２００ｎｇ、１００ｎｇ、５０ｎｇ、１０ｎｇ、５ｎｇ、１ｎｇ以下の核酸試料を含む。例えば、典型的には５０～１００ｎｇのゲノムＤＮＡを用いて開始することができる。しかし、ハイブリダイゼーションステップ、例えば、溶液ハイブリダイゼーションの前に、（例えば、ＰＣＲを使用して）ゲノムＤＮＡを増幅する場合、より少ない量で開始することができる。故に、ハイブリダイゼーション、例えば、溶液ハイブリダイゼーションの前に、ゲノムＤＮＡを増幅することは可能であるが必須ではない。

ライブラリを生成するために使用される核酸試料は、ＲＮＡまたはＲＮＡ由来のｃＤＮＡも含み得る。いくつかの実施形態において、ＲＮＡは、全細胞ＲＮＡを含む。他の実施形態において、ある大量のＲＮＡ配列（例えば、リボソームＲＮＡ）は、枯渇している。他の実施形態において、全ＲＮＡ調製物中のポリ（Ａ）尾部付きｍＲＮＡ分画は、富化されている。いくつかの実施形態において、ｃＤＮＡは、ランダム刺激ｃＤＮＡ合成方法によって産生される。他の実施形態において、ｃＤＮＡ合成は、オリゴ（ｄＴ）含有オリゴヌクレオチドで刺激することによって成熟ｍＲＮＡのポリ（Ａ）尾部で惹起される。枯渇、ポリ（Ａ）富化、及びｃＤＮＡ合成のための方法が、当業者によく知られている。

本方法は、当業者に既知の特異的または非特異的核酸増幅法によって核酸試料を増幅することをさらに含み得る。核酸試料は、例えば、ランダム刺激鎖置換増幅などの全ゲノム増幅法によって増幅され得る。

核酸試料は、本明細書に記載されるような物理的または酵素的方法によって断片化またはせん断され、合成アダプターに連結され、（例えば、分取ゲル電気泳動によって）サイズ選択され、（例えば、ＰＣＲによって）増幅され得る。核酸の断片化及びアダプター連結群は、ハイブリッド選択の前に、明確なサイズ選択または増幅なしに使用される。

実施形態において、核酸試料は、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）、またはそれらの両方を含む。実施形態において、核酸試料は、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）、またはそれらの両方を含み、がん細胞または悪性細胞からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）、またはそれらの両方を含まないか、または本質的にこれらを含まない。

実施形態において、核酸試料は、がん細胞または悪性細胞からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）を含む。実施形態において、核酸試料は、がん細胞または悪性細胞からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）を含み、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）、またはそれらの両方を含まないか、または本質的にこれらを含まない。

実施形態において、核酸試料は、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）、またはそれらの両方、ならびにがん細胞または悪性細胞からのＤＮＡ、ＲＮＡ（または、ＲＮＡ由来のｃＤＮＡ）、またはそれらの両方を含む。

ベイトの設計及び構築
ベイトは、標的核酸にハイブリッド形成し得（例えば、それに相補的であり得る）、それにより、それの捕捉を可能にする核酸分子、例えば、ＤＮＡまたはＲＮＡ分子であり得る。ある特定の実施形態において、標的核酸は、ゲノムＤＮＡ分子である。他の実施形態において、標的核酸は、ＲＮＡ分子、またはＲＮＡ分子由来のｃＤＮＡ分子である。一実施形態において、ベイトは、ＲＮＡ分子である。他の実施形態において、ベイトは、例えば、結合実体への結合による、ベイト、及びベイトに対してハイブリッド形成される核酸によって形成されるハイブリッドの捕捉及び分離を可能にする、結合実体、例えば、親和性タグを含む。一実施形態において、ベイトは、溶液相ハイブリダイゼーションに好適である。

典型的には、ＲＮＡ分子は、ベイト配列として使用される。ＲＮＡ－ＤＮＡ二重鎖は、ＤＮＡ－ＤＮＡ二重鎖よりも安定しており、よって、核酸のより良好である可能性がある捕捉を提供する。

ＲＮＡベイトは、ＤＮＡ依存性ＲＮＡポリメラーゼを使用するＤＮＡ分子のデノボ化学合成及び転写を含むが、これらに限定されない、当技術分野で既知の方法を使用して、本明細書の他の箇所に記載されるように作製され得る。一実施形態において、ベイト配列は、例えば、ヒトＤＮＡまたはプールされたヒトＤＮＡ試料をテンプレートとして使用する、ＰＣＲなどの既知の核酸増幅法を使用して産生される。次いで、オリゴヌクレオチドは、ＲＮＡベイトに変換され得る。一実施形態において、インビトロ転写は、例えば、ＲＮＡポリメラーゼプロモーター配列のオリゴヌクレオチドの一方の末端への付加に基づいて使用される。一実施形態において、ＲＮＡポリメラーゼプロモーター配列は、例えば、ＰＣＲまたは他の核酸増幅法を使用して、ベイト配列を増幅または再増幅することによって、例えば、各標的特異的プライマー対のうちの一方のプライマーをＲＮＡプロモーター配列と尾部付加することによって、ベイトの末端に付加される。一実施形態において、ＲＮＡポリメラーゼは、Ｔ７ポリメラーゼ、ＳＰ６ポリメラーゼ、またはＴ３ポリメラーゼである。一実施形態において、ＲＮＡベイトは、タグ、例えば、親和性タグで標識される。一実施形態において、ＲＮＡベイトは、例えば、ビオチン化ＵＴＰを使用してインビトロ転写によって作製される。別の実施形態において、ＲＮＡベイトは、ビオチンなしで産生され、次いで、ビオチンは、ソラレン架橋などの当技術分野で周知の方法を使用してＲＮＡ分子に架橋される。一実施形態において、ＲＮＡベイトは、ＲＮａｓｅ耐性ＲＮＡ分子であり、これは、例えば、ＲＮａｓｅ分解に耐性があるＲＮＡ分子を産生するために転写中に修飾ヌクレオチドを使用することによって作製され得る。一実施形態において、ＲＮＡベイトは、二重鎖ＤＮＡ標的の一方の鎖にのみ対応する。典型的には、このようなＲＮＡベイトは、自己相補的ではなく、ハイブリダイゼーションドライバーとしてより有効である。

ベイトセットは、ベイトが参照配列の標的を選択するのに最適であるように、参照配列から設計され得る。いくつかの実施形態において、ベイト配列は、混合塩基（例えば、縮重）を使用して設計される。例えば、混合塩基（複数可）は、共通のＳＮＰまたは変異の位置（複数可）でベイト配列中に含められ得、両方の対立遺伝子（例えば、ＳＮＰ及び非ＳＮＰ；変異体及び非変異体）を捕捉するためにベイト配列を最適化し得る。いくつかの実施形態において、全ての既知の配列変動（または、そのサブセット）は、混合縮重オリゴヌクレオチドを使用するよりむしろ、多数のオリゴヌクレオチドベイトを用いて標的化され得る。

ある特定の実施形態において、ベイトセットは、約１００ヌクレオチド～３００ヌクレオチド長のオリゴヌクレオチド（または、複数のオリゴヌクレオチド）を含む。典型的には、ベイトセットは、約１３０ヌクレオチド～２３０ヌクレオチドまたは約１５０～２００ヌクレオチド長のオリゴヌクレオチド（または、複数のオリゴヌクレオチド）を含む。他の実施形態において、ベイトセットは、約３００ヌクレオチド～１０００ヌクレオチド長のオリゴヌクレオチド（または、複数のオリゴヌクレオチド）を含む。

いくつかの実施形態において、オリゴヌクレオチド中の標的メンバー特異的配列は、約４０～１０００ヌクレオチド、約７０～３００ヌクレオチド、約１００～２００ヌクレオチド長、典型的には約１２０～１７０ヌクレオチド長である。

いくつかの実施形態において、ベイトセットは、結合実体を含む。結合実体は、各ベイト配列上の親和性タグであり得る。いくつかの実施形態において、親和性タグは、ビオチン分子またはハプテンである。ある特定の実施形態において、結合実体は、アビジン分子などのパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物からベイト／メンバーハイブリッドを分離することを可能にする。

他の実施形態において、ベイトセット中のオリゴヌクレオチドは、同じ標的メンバー配列に対して順相補及び逆相補配列を含有し、それにより、逆相補的メンバー特異的配列を有するオリゴヌクレオチドは、逆相補ユニバーサル尾部も保有する。これは、同じ鎖であり、すなわち、互いに相補的でない、ＲＮＡ転写物をもたらし得る。

他の実施形態において、ベイトセットは、１つ以上の位置に縮重または混合塩基を含有するオリゴヌクレオチドを含む。さらに他の実施形態において、ベイトセットは、単一種の集団または生物の群集に存在する多数または実質的に全ての既知の配列変異形を含む。一実施形態において、ベイトセットは、ヒト集団に存在する多数または実質的に全ての既知の配列変異形を含む。

他の実施形態において、ベイトセットは、ｃＤＮＡ配列を含むか、またはｃＤＮＡ配列に由来する。他の実施形態において、ベイトセットは、ゲノムＤＮＡ、ｃＤＮＡ、またはクローン化ＤＮＡから増幅される増幅産物（例えば、ＰＣＲ産物）を含む。

他の実施形態において、ベイトセットは、ＲＮＡ分子を含む。いくつかの実施形態において、セットは、より安定し、ＲＮａｓｅに対して耐性であるものを含むが、これらに限定されない、化学的、酵素的に修飾された、またはインビトロで転写されたＲＮＡ分子を含む。

さらに他の実施形態において、ベイトは、参照によって本明細書に組み込まれるＵＳ２０１０／００２９４９８及びＧｎｉｒｋｅ，Ａ．ｅｔａｌ．（２００９）ＮａｔＢｉｏｔｅｃｈｎｏｌ．２７（２）：１８２－１８９に記載されている方法によって産生される。例えば、ビオチン化ＲＮＡベイトは、最初にマイクロアレイ上で合成された長い合成オリゴヌクレオチドのプールを得て、オリゴヌクレオチドを増幅してベイト配列を産生することによって産生され得る。いくつかの実施形態において、ベイトは、ベイト配列の一方の末端でＲＮＡポリメラーゼプロモーター配列を付加し、ＲＮＡポリメラーゼを使用してＲＮＡ配列を合成することによって産生される。一実施形態において、合成オリゴデオキシヌクレオチドのライブラリは、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．などの市販業者から得ることができ、既知の核酸増幅法を使用して増幅され得る。

したがって、前述のベイトセットを作製する方法が提供される。本方法は、１つ以上の標的特異的ベイトオリゴヌクレオチド配列（例えば、本明細書に記載されるような１つ以上の変異捕捉、参照、または対照オリゴヌクレオチド配列）を選択することと、標的特異的ベイトオリゴヌクレオチド配列のプールを得る（例えば、マイクロアレイ合成によって、標的特異的ベイトオリゴヌクレオチド配列のプールを合成する）ことと、任意に、オリゴヌクレオチドを増幅してベイトセットを産生することと、を含む。

他の実施形態において、本方法は、１つ以上のビオチン化プライマーを使用してオリゴヌクレオチドを（例えば、ＰＣＲによって）増幅することをさらに含む。いくつかの実施形態において、オリゴヌクレオチドは、マイクロアレイに連結される各オリゴヌクレオチドの末端にユニバーサル配列を含む。本方法は、オリゴヌクレオチドからユニバーサル配列を除去することをさらに含み得る。このような方法はまた、オリゴヌクレオチドの相補鎖を除去し、オリゴヌクレオチドをアニーリングし、オリゴヌクレオチドを伸長させることも含み得る。これらの実施形態のいくつかにおいて、オリゴヌクレオチドを（例えば、ＰＣＲによって）増幅するための方法は、１つ以上のビオチン化プライマーを使用する。いくつかの実施形態において、本方法は、増幅されたオリゴヌクレオチドのサイズ選択をさらに含む。

一実施形態において、ＲＮＡベイトセットが作製される。本方法は、本明細書に記載される方法に従って、ベイト配列のセットを産生することと、ベイト配列の一方の末端でＲＮＡポリメラーゼプロモーター配列を付加することと、ＲＮＡポリメラーゼを使用してＲＮＡ配列を合成することと、を含む。ＲＮＡポリメラーゼは、Ｔ７ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡポリメラーゼ、またはＴ３ＲＮＡポリメラーゼから選ぶことができる。他の実施形態において、ＲＮＡポリメラーゼプロモーター配列は、ベイト配列を（例えば、ＰＣＲによって）増幅することによってベイト配列の末端で付加される。ベイト配列がゲノムＤＮＡまたはｃＤＮＡからの特異的なプライマー対を用いてＰＣＲによって増幅される実施形態において、ＲＮＡプロモーター配列を各対の２つの特異的プライマーの一方の５’末端に付加することによって、標準的な方法を使用して、ＲＮＡベイトに転写され得るＰＣＲ産物がもたらされる。

他の実施形態において、ベイトセットは、ヒトＤＮＡまたはプールされたヒトＤＮＡ試料をテンプレートとして使用して産生され得る。このような実施形態において、オリゴヌクレオチドは、ポリメラーゼ連鎖反応（ＰＣＲ）によって増幅される。他の実施形態において、増幅されたオリゴヌクレオチドは、ローリングサークル増幅またはハイパーブランチドローリングサークル増幅によって再増幅される。ヒトＤＮＡまたはプールされたヒトＤＮＡ試料をテンプレートとして使用してベイト配列を産生するために、同じ方法が使用され得る。制限消化、パルスフィールドゲル電気泳動、流動選別、ＣｓＣｌ密度勾配遠心分離、選択的動的再会合、染色体調製物の顕微解剖、及び当業者に既知の他の分画化方法を含むが、これらに限定されない他の方法によって得られたゲノムの細画分を使用してベイト配列を産生するためにも、同じ方法が使用され得る。

ある特定の実施形態において、ベイトセット中のベイト数は、１，０００未満である。他の実施形態において、ベイトセット中のベイト数は、１，０００超、５，０００超、１０，０００超、２０，０００超、５０，０００超、１００，０００超、または５００，０００超である。

ベイト配列の長さは、約７０ヌクレオチド～１０００ヌクレオチドであり得る。一実施形態において、ベイトの長さは、約１００～３００ヌクレオチド、１１０～２００ヌクレオチド、または１２０～１７０ヌクレオチド長である。上述されるものに加えて、約７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、３００、４００、５００、６００、７００、８００、及び９００ヌクレオチド長の中間的なオリゴヌクレオチド長が、本明細書に記載される方法において使用され得る。いくつかの実施形態において、約７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、または２３０個の塩基のオリゴヌクレオチドが、使用され得る。

各ベイト配列は、一方または両方の末端に標的特異的（例えば、メンバー特異的）ベイト配列及びユニバーサル尾部を含み得る。本明細書で使用されるとき、「ベイト配列」という用語は、標的特異的ベイト配列、またはオリゴヌクレオチドの標的特異的「ベイト配列」及び他のヌクレオチドを含むオリゴヌクレオチド全体を指し得る。ベイト中の標的特異的配列は、約４０ヌクレオチド～１０００ヌクレオチド長である。一実施形態において、標的特異的配列は、約７０ヌクレオチド～３００ヌクレオチド長である。別の実施形態において、標的特異的配列は、約１００ヌクレオチド～２００ヌクレオチド長である。さらに別の実施形態において、標的特異的配列は、約１２０ヌクレオチド～１７０ヌクレオチド長、典型的には１２０ヌクレオチド長である。上述されるものに加えて、約４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、３００、４００、５００、６００、７００、８００、及び９００ヌクレオチド長の標的特異的配列、ならびに上述される長さ間の長さの標的特異的配列など、中間的な長さも、本明細書に記載される方法において使用され得る。

一実施形態において、ベイトは、約５０～２００ヌクレオチド長（例えば、約５０、６０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１９０、または２００ヌクレオチド長）のオリゴマー（例えば、ＲＮＡオリゴマー、ＤＮＡオリゴマー、またはそれらの組み合わせからなる）である。一実施形態において、各ベイトオリゴマーは、標的特異的ベイト配列である約１２０～１７０個、または典型的には約１２０個のヌクレオチドを含む。ベイトは、一方または両方の末端に追加の非標的特異的ヌクレオチド配列を含み得る。追加のヌクレオチド配列は、例えば、ＰＣＲ増幅のために、またはベイト識別子として使用され得る。ある特定の実施形態において、ベイトは、本明細書に記載されるような結合実体（例えば、ビオチン分子などの捕捉タグ）をさらに含む。結合実体、例えば、ビオチン分子は、例えば、ベイトの５’－、３’－末端、または内部に（例えば、ビオチン化ヌクレオチドを組み込むことによって）ベイトに連結され得る。一実施形態において、ビオチン分子は、ベイトの５’－末端で連結される。

例示的な一実施形態において、ベイトは、約１５０ヌクレオチド長のオリゴヌクレオチドであり、そのうちの１２０のヌクレオチドが、標的特異的「ベイト配列」である。他の３０のヌクレオチド（例えば、各末端で１５のヌクレオチド）は、ＰＣＲ増幅のために使用されるランダムなユニバーサル尾部である。尾部は、使用者により選択される任意の配列であり得る。例えば、合成オリゴヌクレオチドのプールは、５’－ＡＴＣＧＣＡＣＣＡＧＣＧＴＧＴＮ_１２０ＣＡＣＴＧＣＧＧＣＴＣＣＴＣＡ－３’（配列番号１）の配列のオリゴヌクレオチドを含み得、Ｎ_１２０は、標的特異的ベイト配列を示す。

本明細書に記載されるベイト配列は、エクソン及び短い標的配列の選択のために使用され得る。一実施形態において、ベイトは、約１００ヌクレオチド～３００ヌクレオチド長である。別の実施形態において、ベイトは、約１３０ヌクレオチド～２３０ヌクレオチド長である。さらに別の実施形態において、ベイトは、約１５０ヌクレオチド～２００ヌクレオチド長である。例えば、エクソン及び短い標的配列の選択のための、ベイト中の標的特異的配列は、約４０ヌクレオチド～１０００ヌクレオチド長である。一実施形態において、標的特異的配列は、約７０ヌクレオチド～３００ヌクレオチド長である。別の実施形態において、標的特異的配列は、約１００ヌクレオチド～２００ヌクレオチド長である。さらに別の実施形態において、標的特異的配列は、約１２０ヌクレオチド～１７０ヌクレオチド長である。

いくつかの実施形態において、長いオリゴヌクレオチドは、標的配列を捕捉するために必要なオリゴヌクレオチドの数を最小限にし得る。例えば、エクソン１個当たり１つのオリゴヌクレオチドを使用し得る。ヒトゲノム中のタンパク質コードエクソンの平均及び中央値の長さがそれぞれ、約１６４及び１２０塩基対であることが当技術分野で知られている。長いベイトほど、特異性が高く、短いものよりも良好に捕捉し得る。結果として、オリゴヌクレオチドベイト配列当たりの成功率は、短いオリゴヌクレオチドの場合よりも高い。一実施形態において、最小ベイトカバー配列は、例えば、エクソンサイズの標的を捕捉する場合、１つのベイトのサイズ（例えば、１２０～１７０塩基）である。ベイト配列の長さを決定する際、不必要に長いベイトが、標的に直接近接するより多くの不必要なＤＮＡを捕捉することも考慮され得る。また、長いオリゴヌクレオチドベイトほど、短いものよりもＤＮＡ試料中の標的領域における多型に対してより耐性であり得る。典型的には、ベイト配列は、参照ゲノム配列に由来する。実際のＤＮＡ試料中の標的配列が参照配列から逸脱する場合、例えば、それが一塩基多型（ＳＮＰ）を含有する場合、それは、ベイトとあまり効率的にハイブリッド形成し得ず、よって、ベイト配列とハイブリッド形成される配列中で表示不十分であるかまたは完全に不在であり得る。例えば、１２０～１７０塩基における単一の不一致が、多重増幅及びマイクロアレイ捕捉それぞれにおける典型的なベイトまたはプライマー長である２０または７０塩基の単一の不一致よりもハイブリッドの安定性に対する影響が少なくなり得るという理由から、より長い合成ベイト分子では、ＳＮＰに起因する対立遺伝子の脱落が起こる可能性が低くなり得る。

ゲノム領域など、捕捉ベイトの長さと比較して長い標的の選択に関して、ベイト配列の長さは、典型的には、近接配列の標的化を最小限にするという唯一の目的のためにベイト配列の最大サイズを限定する必要がないことを除いて、上述の短い標的に対するベイトと同じサイズ範囲にある。あるいは、オリゴヌクレオチドは、はるかに幅広い枠（典型的には、６００塩基）にわたり表記され得る。この方法は、典型的なエクソンよりもはるかい大きい（例えば、約５００塩基）ＤＮＡ断片を捕捉するために使用され得る。結果として、かなり多くの不必要な隣接非標的配列が選択される。

ベイト合成
ベイトは、任意の種類のオリゴヌクレオチド、例えば、ＤＮＡまたはＲＮＡであり得る。ＤＮＡまたはＲＮＡベイト（「オリゴベイト」）は、個別に合成され得るか、またはＤＮＡもしくはＲＮＡベイトセットとしてアレイで合成され得る（「アレイベイト」）。オリゴベイトは、アレイ方式で提供されるか、または単離オリゴとして提供されるかにかかわらず、典型的には１本鎖である。ベイトは、本明細書に記載されるような結合実体（例えば、ビオチン分子などの捕捉タグ）をさらに含み得る。結合実体、例えば、ビオチン分子は、ベイトに、例えば、ベイトの５’または３’－末端、典型的にはベイトの５’－末端に連結され得る。ベイトセットは、例えば、国際特許出願公開第ＷＯ２０１２／０９２４２６号に記載されているような、当技術分野に記載されている方法によって合成され得る。

ハイブリダイゼーション条件
本発明において取り上げられる方法は、ライブラリ（例えば、核酸ライブラリ）を複数のベイトと接触させて、選択されたライブラリキャッチを提供するステップを含む。接触ステップは、溶液ハイブリダイゼーションにおいて実施され得る。ある特定の実施形態において、本方法は、１回以上の追加の溶液ハイブリダイゼーションによってハイブリダイゼーションステップを反復することを含む。いくつかの実施形態において、本方法は、同じかまたは異なるベイト集合体を用いた１回以上の追加の溶液ハイブリダイゼーションにライブラリキャッチを供することをさらに含む。本明細書の方法における使用に適合され得るハイブリダイゼーション法は、例えば、国際特許出願公開第ＷＯ２０１２／０９２４２６号に記載されているように、当技術分野に記載されている。

本発明の追加の実施形態または特徴は、次の通りである。
別の態様において、本発明は、前述のベイトセットを作製する方法を特徴とする。本方法は、１つ以上の標的特異的ベイトオリゴヌクレオチド配列（例えば、本明細書に記載されるような遺伝子または遺伝子産物の対象区間（例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方）に対応するベイト配列のいずれか）を選択することと、標的特異的ベイトオリゴヌクレオチド配列のプールを得る（例えば、マイクロアレイ合成によって、標的特異的ベイトオリゴヌクレオチド配列のプールを合成する）ことと、任意に、オリゴヌクレオチドを増幅してベイトセットを産生することと、を含む。

さらに別の態様において、本発明は、核酸試料中のがん性表現型（例えば、本明細書に記載される遺伝子または遺伝子産物における変化のうちの少なくとも１０、２０、３０、５０個以上）に、例えば、陽性または陰性に関連する変化の有無を判定するための方法を特徴とする。本方法は、本明細書に記載される方法のいずれかに従って、溶液ベースの反応において試料中の核酸をベイトと接触させて核酸キャッチを得ることと、（例えば、次世代配列決定によって）核酸キャッチの全てまたはサブセットを配列決定し、それにより、本明細書に記載される遺伝子または遺伝子産物における変化の有無を判定することと）、を含む。

他の実施形態において、ベイトセットは、ｃＤＮＡ配列を含むか、またはｃＤＮＡ配列に由来する。一実施形態において、ｃＤＮＡは、ＲＮＡ配列、例えば、腫瘍またはがん細胞由来のＲＮＡ、例えば、腫瘍－ＦＦＰＥ試料、血液試料、または骨髄穿刺試料から得られるＲＮＡから調製される。他の実施形態において、ベイトセットは、ゲノムＤＮＡ、ｃＤＮＡ、またはクローン化ＤＮＡから増幅される増幅産物（例えば、ＰＣＲ産物）を含む。

他の実施形態において、ベイトセットは、ＲＮＡ分子を含む。いくつかの実施形態において、セットは、より安定し、ＲＮａｓｅに対して耐性であるものを含むが、これに限定されない、化学的、酵素的に修飾された、またはインビトロで転写されたＲＮＡ分子を含む。

ある特定の実施形態において、ベイトセット中のベイト数は、１，０００未満、例えば、２、３、４、５、１０、５０、１００、５００ベイトである。他の実施形態において、ベイトセット中のベイト数は、１，０００超、５，０００超、１０，０００超、２０，０００超、５０，０００超、１００，０００超、または５００，０００超である。

ある特定の実施形態において、ライブラリ（例えば、核酸ライブラリ）は、メンバーの集合体を含む。本明細書に記載される場合、ライブラリメンバーは、標的メンバー（例えば、腫瘍メンバー、参照メンバー、及び／または対照メンバー；本明細書において、それぞれ第１、第２、及び／または第３のメンバーとも称される）を含み得る。ライブラリのメンバーは、単一の個体のものであり得る。実施形態において、ライブラリは、１人を超える対象（例えば、２、３、４、５、６、７、８、９、１０、２０、３０人以上の対象）からのメンバーを含み得、例えば、異なる対象からの２つ以上のライブラリが組み合わされ、１人を超える対象からのメンバーを有するライブラリを形成し得る。一実施形態において、対象は、がんまたは腫瘍を有するか、またはそれらを有するリスクがあるヒトである。

「メンバー」、または「ライブラリメンバー」、または他の同様の用語は、本明細書で使用されるとき、ライブラリのメンバーである核酸分子、例えば、ＤＮＡまたはＲＮＡを指す。典型的には、メンバーは、ＤＮＡ分子、例えば、ゲノムＤＮＡまたはｃＤＮＡである。メンバーは、せん断されたゲノムＤＮＡであり得る。他の実施形態において、メンバーは、ｃＤＮＡであり得る。他の実施形態において、メンバーは、ＲＮＡであり得る。メンバーは、対象からの配列を含み、対象に由来しない配列、例えばプライマー、または、同定を可能にする配列、例えば「バーコード」配列も含み得る。

さらに別の実施形態において、本発明において取り上げられる方法は、核酸試料を単離して、ライブラリ（例えば、本明細書に記載されるような核酸ライブラリ）を提供することをさらに含む。ある特定の実施形態において、核酸試料は、全ゲノム、サブゲノム断片、またはそれらの両方を含む。全ゲノムまたはサブゲノム断片からライブラリを単離及び調製するためのプロトコルが、当技術分野で知られている（例えば、ＩｌｌｕｍｉｎａのゲノムＤＮＡ試料調製キット）。ある特定の実施形態において、ゲノムまたはサブゲノムＤＮＡ断片は、対象の試料（例えば、腫瘍試料、正常近接組織（ＮＡＴ）、血液試料、または任意の正常な対照））から単離される。一実施形態において、試料（例えば、腫瘍またはＮＡＴ試料）は、保存物である。例えば、試料は、マトリックス、例えば、ＦＦＰＥブロックまたは凍結試料中に包埋される。ある特定の実施形態において、単離ステップは、個別の染色体の流動選別、及び／または対象の試料（例えば、腫瘍試料、ＮＡＴ、血液試料）を顕微解剖することを含む。ある特定の実施形態において、核酸ライブラリを生成するために使用される核酸試料は、５マイクログラム未満、１マイクログラム未満、または５００ｎｇ未満（例えば、２００ｎｇ以下）である。

本方法は、当業者に周知の特異的または非特異的核酸増幅法によって核酸試料を増幅することをさらに含み得る。

いくつかの実施形態において、核酸試料は、例えば、ランダム刺激鎖置換増幅などの全ゲノム増幅法によって増幅される。

ある特定の実施形態において、ライブラリのメンバーは、遺伝子内領域または遺伝子間領域を含むサブゲノム区間を含む。別の実施形態において、サブゲノム区間は、エクソンもしくはイントロン、またはそれらの断片、典型的にはエクソン配列またはその断片を含む。一実施形態において、サブゲノム区間は、コード領域または非コード領域、例えば、プロモーター、エンハンサー、５’非翻訳領域（５’ＵＴＲ）もしくは３’非翻訳領域（３’ＵＴＲ）、またはそれらの断片を含む。他の実施形態において、サブゲノム区間は、ｃＤＮＡまたはその断片（例えば、腫瘍ＲＮＡ（例えば、腫瘍試料、例えば、ＦＦＰＥ－腫瘍試料から抽出されたＲＮＡ）から得られるｃＤＮＡ）を含む。他の実施形態において、サブゲノム区間は、例えば、本明細書に記載されるようなＳＮＰを含む。他の実施形態において、標的メンバーは、ゲノム中の実質的に全てのエクソンを含む。他の実施形態において、標的メンバーは、本明細書に記載されるようなサブゲノム区間、例えば、対象とする選択された遺伝子または遺伝子産物（例えば、本明細書に記載されるような、がん性表現型に関連する遺伝子または遺伝子産物）からのサブゲノム区間、例えば、エクソンを含む。

一実施形態において、サブゲノム区間は、体細胞変異、生殖細胞変異、またはそれらの両方を含む。一実施形態において、サブゲノム区間は、変化、例えば、点もしくは単一変異、欠失変異（例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失）、挿入変異（例えば、遺伝子内挿入）、逆位変異（例えば、染色体内逆位）、連結変異、連結された挿入変異、逆位重複変異、タンデム重複（例えば、染色体内タンデム重複）、転座（例えば、染色体転座、非相反転座）、再編成（例えば、ゲノム再編成）、遺伝子コピー数の変化、またはそれらの組み合わせを含む。ある特定の実施形態において、サブゲノム区間は、試料中の腫瘍細胞のゲノムのコード領域の５％、１％、０．５％、０．１％、０．０１％、０．００１％未満を構成する。他の実施形態において、サブゲノム区間は、疾患に関与せず、例えば、本明細書に記載されるようながん性表現型に関連しない。

本発明において取り上げられる方法は、１つまたは複数のライブラリ（例えば、１つまたは複数の核酸ライブラリ）を複数のベイトと接触させて、核酸の選択された下位群、例えば、ライブラリキャッチを提供するステップを含む。一実施形態において、接触ステップは、固体支持体、例えば、アレイにおいて実施される。ハイブリダイゼーションに好適な固体支持体は、例えば、Ａｌｂｅｒｔ，Ｔ．Ｊ．ｅｔａｌ．（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４（１１）：９０３－５、Ｈｏｄｇｅｓ，Ｅ．ｅｔａｌ．（２００７）Ｎａｔ．Ｇｅｎｅｔ．３９（１２）：１５２２－７、及びＯｋｏｕ，Ｄ．Ｔ．ｅｔａｌ．（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４（１１）：９０７－９に記載されており、それらの内容は参照によって本明細書に組み込まれる。他の実施形態において、接触ステップは、溶液ハイブリダイゼーションにおいて実施される。ある特定の実施形態において、本方法は、１回以上の追加のハイブリダイゼーションによってハイブリダイゼーションステップを反復することを含む。いくつかの実施形態において、本方法は、同じかまたは異なるベイト集合体を用いた１回以上の追加のハイブリダイゼーションにライブラリキャッチを供することをさらに含む。

他の実施形態において、本発明において取り上げられる方法は、（例えば、ＰＣＲによって）ライブラリキャッチを増幅することをさらに含む。他の実施形態において、ライブラリキャッチは、増幅されない。

さらに他の実施形態において、本方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定法、例えば、本明細書に記載されるような次世代配列決定法によって分析される。本方法は、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定によってそのライブラリキャッチを供することを含む。ある特定の実施形態において、ライブラリキャッチは、再配列決定され得る。次世代配列決定法は、当技術分野で知られており、例えば、Ｍｅｔｚｋｅｒ，Ｍ．（２０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：３１－４６に記載されている。

さらに他の実施形態において、本方法は、ライブラリキャッチを遺伝子型判定に供し、それにより、選択された核酸の遺伝子型を識別するステップをさらに含む。

ある特定の実施形態において、本方法は、次のうちの１つ以上をさらに含む：
ｉ）核酸試料のフィンガープリントを行うこと、
ｉｉ）核酸試料中の遺伝子もしくは遺伝子産物（例えば、本明細書に記載されるような遺伝子または遺伝子産物）の存在量を定量化すること（例えば、試料中の転写物の相対的存在量を定量化すること）、
ｉｉｉ）核酸試料を特定の対象（例えば、正常対照またはがん患者）に属するものとして識別すること、
ｉｖ）核酸試料中の遺伝形質（例えば、１つ以上の対象の遺伝形質（例えば、民族性、人種、家族の特徴）を識別すること、
ｖ）核酸試料中の倍数性を決定し、核酸試料中のヘテロ接合性喪失を決定すること、
ｖｉ）核酸試料中の遺伝子重複事象の有無を判定すること、
ｖｉｉ）核酸試料中の遺伝子増幅事象の有無を判定すること、または
ｖｉｉｉ）核酸試料中の腫瘍／正常細胞混合のレベルを決定すること。

実施形態において、本方法は、腫瘍及び／または対照核酸試料（例えば、ＦＦＰＥ由来核酸試料、または血液試料もしくは骨髄穿刺液試料由来の核酸試料）から得られたヌクレオチド配列読み取りデータを取得することを含む。

実施形態において、読み取りデータは、次世代配列決定法によって提供される。

実施形態において、本方法は、核酸メンバーのライブラリを提供することと、該ライブラリの複数のメンバーから、事前選択されたサブゲノム区間を配列決定することと、を含む。実施形態において、本方法は、配列決定のための該ライブラリのサブセットを選択するステップ、例えば、溶液ベースの選択を含み得る。

ある特定の実施形態において、方法は、２つ以上の異なる標的カテゴリを捕捉するように設計されたハイブリッド捕捉方法を含み、各々のカテゴリは、異なるベイト設計方策を有する。ハイブリッド捕捉方法及び組成物は、標的配列の定められたサブセット（例えば、標的メンバー）を捕捉し、そのサブセットの外側のカバレッジを最小限にしながら、標的配列の均質なカバレッジを提供すること意図している。一実施形態において、標的配列は、ゲノムＤＮＡからの全エクソン、またはその選択されたサブセットを含む。本明細書に開示される方法及び組成物は、複雑な標的核酸配列（例えば、ライブラリ）に対する異なる深さ及びカバレッジのパターンを達成するための異なるベイトセットを提供する。

ある特定の実施形態において、ベイトセット及び標的の異なるカテゴリは、次の通りである。

Ａ．低頻度で出現する変異に対する高レベルの感度を可能にするために、最大深さのカバレッジが必要とされる高レベルの標的（例えば、１つ以上の腫瘍メンバー及び／または参照メンバー、例えば、遺伝子、エクソン、または塩基）を選択する第１のベイトセット。例えば、約５％以下の頻度で出現する点変異の検出（すなわち、試料が調製された細胞の５％が、それらのゲノム中にこの変異を保有する）。第１のベイトセットは、典型的には、高い検出信頼性を確保するために約５００Ｘ以上の配列決定深さを必要とする。一実施形態において、第１のベイトセットは、ある特定のがんの型において頻繁に変異が起こっている１つ以上のサブゲノム区間（例えば、エクソン）、例えば、表１～４または図３Ａ～４Ｄによる遺伝子または遺伝子産物を選択する。

Ｂ．高レベル標的より高い頻度で、例えば、約１０％の頻度で出現する変異に対する高レベルの感度を可能にするために、高いカバレッジが必要とされる中レベルの標的（例えば、１つ以上の腫瘍メンバー及び／または参照メンバー、例えば、遺伝子、エクソン、または塩基）を選択する第２のベイトセット。例えば、１０％の頻度で出現する変化（例えば、点変異）の検出は、高い検出信頼性を確保するために約２００Ｘ以上の配列決定深さを必要とする。一実施形態において、第２のベイトセットは、表１～４または図３Ａ～４Ｄによる遺伝子または遺伝子産物から選ばれる１つ以上のサブゲノム区間（例えば、エクソン）を選択する。

Ｃ．高レベルの感度を可能にするために、例えば、ヘテロ接合性の対立遺伝子を検出するために、低－中程度のカバレッジが必要とされる、低レベルの標的（例えば、１つ以上のＰＧｘメンバー、例えば、遺伝子、エクソン、または塩基）を選択する第３のベイトセット。例えば、ヘテロ接合性の対立遺伝子の検出は、高い検出信頼性を確保するために１０～１００Ｘの配列決定深さを必要とする。一実施形態において、第３のベイトセットは、ａ）患者が異なる薬物を代謝する能力を説明し得る薬理ゲノムＳＮＰ、ｂ）患者を固有に識別（フィンガープリント）するために使用され得るゲノムＳＮＰ、ならびにｃ）ゲノムＤＮＡのコピー数増加／減少及びヘテロ接合性喪失（ＬＯＨ）を評価するために使用され得るゲノムＳＮＰ／遺伝子座から選ばれる１つ以上のサブゲノム区間（例えば、エクソン）を選択する。

Ｄ．ゲノム転座またはインデルなどの構造限界点を検出するために、低－中程度のカバレッジが必要とされるイントロン標的（例えば、イントロンメンバー）を選択する第４のベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために５～５０Ｘの配列対スパニング深さを必要とする。該第４のベイトセットは、例えば、転座／インデルが起こり易いがん遺伝子を検出するために使用され得る。

Ｅ．コピー数の変化を検出する能力を改善するために低密度のカバレッジが必要とされるイントロン標的（例えば、イントロンメンバー）を選択する第５のベイトセット。例えば、いくつかの末端エクソンの１コピー欠失の検出は、高い検出信頼性を確保するために０．１～１０Ｘのカバレッジを必要とする。該第５のベイトセットは、例えば、増幅／欠失が起こり易いがん遺伝子を検出するために使用され得る。

本発明において取り上げられる方法及び組成物は、各ベイトセット／標的カテゴリの相対的配列カバレッジを調節することを含む。ベイト設計における相対的配列カバレッジの差異を実現するための方法は、次のうちの１つ以上を含む：
（ｉ）異なるベイトセットの差次的な表示－所与の標的（例えば、標的メンバー）を捕捉するためのベイトセット設計は、より多くの／より少ないコピー数に含まれて、相対的な標的カバレッジの深さを増強／低減させ得る；
（ｉｉ）ベイトサブセットの差次的な重複－所与の標的（例えば、標的メンバー）を捕捉するためのベイトセット設計は、近隣ベイト間のより長いかまたはより短い重複を含み、相対的な標的カバレッジの深さを増強／低減させ得る；
（ｉｉｉ）差次的なベイトパラメータ－所与の標的（例えば、標的メンバー）を捕捉するためのベイトセット設計は、配列修飾／より短い長さを含み、捕捉効率を低減させ、相対的な標的カバレッジの深さを低下させ得る；
（ｉｖ）異なるベイトセットの混合－異なる標的セットを捕捉するように設計されるベイトセットは、異なるモル比で混合されて、相対的な標的カバレッジの深さを増強／低減させ得る；
（ｖ）異なる種類のオリゴヌクレオチドベイトセットの使用－ある特定の実施形態において、ベイトセットは、次のものを含み得る：
（ａ）１つ以上の化学的に（例えば、非酵素的に）合成された（例えば、個別に合成された）ベイト、
（ｂ）アレイにおいて合成された１つ以上のベイト、
（ｃ）１つ以上の酵素的に調製された、例えば、インビトロで転写されたベイト、
（ｄ）（ａ）、（ｂ）、及び／もしくは（ｃ）の任意の組み合わせ、
（ｅ）１つ以上のＤＮＡオリゴヌクレオチド（例えば、天然または非天然のＤＮＡオリゴヌクレオチド）、
（ｆ）１つ以上のＲＮＡオリゴヌクレオチド（例えば、天然または非天然のＲＮＡオリゴヌクレオチド）、
（ｇ）（ｅ）及び（ｆ）の組み合わせ、または
（ｈ）上記のいずれかの組み合わせ。

異なるオリゴヌクレオチドの組み合わせは、異なる比、例えば、１：１、１：２、１：３、１：４、１：５、１：１０、１：２０、１：５０、１：１００、１：１０００などから選ばれる比で混合され得る。一実施形態において、化学合成されたベイト対アレイ生成ベイトの比は、１：５、１：１０、または１：２０から選ばれる。ＤＮＡまたはＲＮＡオリゴヌクレオチドは、天然または非天然であり得る。ある特定の実施形態において、ベイトは、例えば、融解温度を上昇させるために１つ以上の非天然ヌクレオチドを含む。例示的な非天然オリゴヌクレオチドには、修飾ＤＮＡまたはＲＮＡヌクレオチドが含まれる。例示的な修飾ＲＮＡヌクレオチドは、ロックド核酸（ＬＮＡ）であり、ここで、ＬＮＡヌクレオチドのリボース部分は、２’酸素及び４’炭素を連結する余分な架橋で修飾されている（Ｋａｕｒ，Ｈ；Ａｒｏｒａ，Ａ；Ｗｅｎｇｅｌ，Ｊ；Ｍａｉｔｉ，Ｓ；Ａｒｏｒａ，Ａ．；Ｗｅｎｇｅｌ，Ｊ．；Ｍａｉｔｉ，Ｓ．（２００６）． “Ｔｈｅｒｍｏｄｙｎａｍｉｃ，Ｃｏｕｎｔｅｒｉｏｎ，ａｎｄＨｙｄｒａｔｉｏｎＥｆｆｅｃｔｓｆｏｒｔｈｅＩｎｃｏｒｐｏｒａｔｉｏｎｏｆＬｏｃｋｅｄＮｕｃｌｅｉｃＡｃｉｄＮｕｃｌｅｏｔｉｄｅｓｉｎｔｏＤＮＡＤｕｐｌｅｘｅｓ”．Ｂｉｏｃｈｅｍｉｓｔｒｙ４５（２３）：７３４７－５５）。他の修飾された例示的なＤＮＡ及びＲＮＡヌクレオチドには、ペプチド結合によって連結される反復Ｎ－（２－アミノエチル）－グリシン単位から構成されるペプチド核酸（ＰＮＡ）（Ｅｇｈｏｌｍ，Ｍ．ｅｔａｌ．（１９９３）Ｎａｔｕｒｅ３６５（６４４６）：５６６－８）、低ＧＣ領域を捕捉するように修飾されたＤＮＡまたはＲＮＡオリゴヌクレオチド、二環式核酸（ＢＮＡ）または架橋オリゴヌクレオチド、修飾５－メチルデオキシシチジン、及び２，６－ジアミノプリンが含まれるが、これらに限定されない。他の修飾ＤＮＡ及びＲＮＡヌクレオチドが当技術分野で知られている。

一実施形態において、選択効率に対する値は、事前選択された標的領域を包含するために異なる種類のベイトオリゴヌクレオチドを使用することによって変更される。例えば、第１のベイトセット（例えば、１０，０００～５０，０００のＲＮＡまたはＤＮＡベイトを含むアレイに基づくベイトセット）は、大きな標的範囲（例えば、１～２ＭＢの全標的範囲）をカバーするために使用され得る。第１のベイトセットは、第２のベイトセット（例えば、５，０００個未満のベイトを含む個別に合成されたＲＮＡまたはＤＮＡベイトセット）に添加されて、事前選択された標的領域（例えば、標的範囲の対象とするスパニング、例えば、２５０ｋｂ以下の選択されたサブゲノム区間）、及び／またはより高い二次構造、例えば、より高いＧＣ含量の領域をカバーし得る。対象とする選択されたサブゲノム区間は、本明細書に記載される遺伝子もしくは遺伝子産物、またはそれらの断片のうちの１つ以上に対応し得る。第２のベイトセットは、所望のベイト重複に応じて、約２，０００～５，０００ベイトを含み得る。さらに他の実施形態において、第２のベイトセットは、第１のベイトに添加される選択されたオリゴベイト（例えば、４００、２００、１００、５０、４０、３０、２０、１０個未満のベイト）を含み得る。第２のベイトセットは、個別のオリゴベイトの任意の比で混合され得る。例えば、第２のベイトセットは、１：１の等モル比として存在する個別のベイトを含み得る。あるいは、第２のベイトセットは、例えば、ある特定の標的（例えば、ある特定の標的は、他の標的と比較して５～１０Ｘの第２のベイトを有し得る）の捕捉を最適化するために、異なる比（例えば、１：５、１：１０、１：２０）で存在する個別のベイトを含み得る。

配列決定
本発明はまた、核酸を配列決定する方法も含む。これらの方法において、核酸ライブラリメンバーは、例えば、溶液ハイブリダイゼーションを使用して本明細書に記載される方法を使用することによって単離され、それにより、ライブラリキャッチを提供する。ライブラリキャッチまたはその下位群は、配列決定され得る。したがって、本発明において取り上げられる方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定法、例えば、本明細書に記載されるような次世代配列決定法によって分析される。本方法は、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定によってそのライブラリキャッチを供することを含む。ある特定の実施形態において、ライブラリキャッチは、再配列決定され得る。

当技術分野で既知の任意の配列決定法が使用され得る。選択方法によって単離された核酸の配列決定は、典型的には、次世代配列決定（ＮＧＳ）を使用して行われる。本明細書における使用に好適な配列決定法は、例えば、国際特許出願公開第ＷＯ２０１２／０９２４２６号に記載されているように、当技術分野に記載されている。

ＮＧＳ読み取りデータが生成された後、それらは、既知の参照配列と整列され得るか、または新規にアセンブリされ得る。例えば、試料（例えば、腫瘍試料）中の一塩基多型及び構造変異形などの遺伝的変異を識別することは、ＮＧＳ読み取りデータを参照配列（例えば、野生型配列）と整列させることによって達成され得る。ＮＧＳに対する配列整列の方法は、例えば、ＴｒａｐｎｅｌｌＣ．ａｎｄＳａｌｚｂｅｒｇＳ．Ｌ．ＮａｔｕｒｅＢｉｏｔｅｃｈ．，２００９，２７：４５５－４５７に記載されている。新規のアセンブリの例は、例えば、ＷａｒｒｅｎＲ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２００７，２３：５００－５０１、ＢｕｔｌｅｒＪ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．，２００８，１８：８１０－８２０、及びＺｅｒｂｉｎｏＤ．Ｒ．ａｎｄＢｉｒｎｅｙＥ．，ＧｅｎｏｍｅＲｅｓ．，２００８，１８：８２１－８２９に記載されている。配列整列またはアセンブリは、１つ以上のＮＧＳプラットフォームからの読み取りデータを使用して、例えば、Ｒｏｃｈｅ／４５４及びＩｌｌｕｍｉｎａ／Ｓｏｌｅｘａ読み取りデータを混合して、行われ得る。

整列
整列は、読み取りデータをある位置、例えば、ゲノムの位置と一致させるプロセスである。誤整列（例えば、ゲノム中の正しくない位置へ、短い読み取りデータからの塩基対を配置）、例えば、実際のがん変異の周辺の読み取りデータの配列状況（例えば、反復配列の存在）に起因する誤整列は、代替的対立遺伝子の読み取りデータが、代替的対立遺伝子読み取りデータの主な集積を回避し得るため、変異検出の感度の低減をもたらし得る。実際の変異が存在しない場合に問題のある配列状況が生じる場合、誤整列は、参照ゲノム塩基の実際の読み取りデータを誤った位置に配置することによって、「変異が起こった」対立遺伝子のアーチファクトの読み取りデータを導入し得る。増加した多重遺伝子分析のための変異呼び出しアルゴリズムは、存在量が少ない変異に対しても感度があるはずなので、これらの誤整列は、偽陽性発見率を増加させ／特異性を低減し得る。

本明細書で論じられるように、実際の変異に対する感度の低減は、分析されている遺伝子における予想される変異部位の周辺の整列の質を（手動でまたは自動化様式で）評価することによって対処され得る。評価される部位は、がん変異のデータベース（例えば、ＣＯＳＭＩＣ）から得ることができる。問題があると識別される領域は、例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ整列などのより遅いがより正確な整列アルゴリズムを使用した整列最適化（または、再整列）によって、関連する配列状況においてより良好な能力を供与するように選択されたアルゴリズムを使用して修正され得る。一般的な整列アルゴリズムが問題を修正することができない場合、カスタマイズされた整列手法は、例えば、置換を含有する尤度が高い遺伝子に対する最大差不一致ペナルティパラメータの調整、ある特定の腫瘍型で共通する特定の変異型に基づいて特定の不一致ペナルティパラメータ（例えば、黒色腫におけるＣ→Ｔ）を調整すること、またはある特定の試料の種類で共通する特定の変異型に基づいて特定の不一致ペナルティパラメータ（例えば、ＦＦＰＥで共通する置換）を調整することによって作成され得る。

誤整列に起因する評価遺伝子領域における特異性の低減（偽陽性率の増加）は、配列決定された試料中の全ての変異呼び出しの手動または自動化検査によって評価され得る。誤整列に起因する偽の変異呼び出しを起こし易いことが分かった領域は、上述と同じ整列修正に供され得る。可能なアルゴリズム修正が見つからない場合、問題領域からの「変異」は、試験パネルから分類または選別して排除され得る。

本明細書に開示される方法によって、再編成、例えば、インデルが関連するサブゲノム区間の配列決定において、特に、例えば、腫瘍試料からの、多くの多様な遺伝子における多くの多様な遺伝的事象の超並列配列決定に依存する方法において、能力を最適化するための多数の個別に調節された整列方法またはアルゴリズムの使用が可能になり得る。実施形態において、異なる遺伝子におけるいくつかの再編成の各々に対して個別にカスタマイズまたは調節される多数の整列法は、読み取りデータを分析するために使用される。実施形態において、調節することは、配列決定されている遺伝子（または、他のサブゲノム区間）、試料中の腫瘍型、配列決定されている変異形の（うちの１つ以上の）機能、または試料もしくは対象の特質であり得る。配列決定されるいくつかのサブゲノム区間に対して微調節される整列条件のこの選択または使用によって、速度、感度、及び特異性の最適化が可能になる。本方法は、比較的多くの多様なサブゲノム区間に対する読み取りデータの整列が最適化される場合、特に有効である。実施形態において、本方法は、再編成に最適化された整列方法、及び再編成に関連しないサブゲノム区間に対して最適化された他の方法の使用を含む。

故に、実施形態において、本明細書に記載される方法、例えば、腫瘍試料を分析する方法は、本明細書に記載される再編成のための整列方法を含む。

概して、インデル変異の正確な検出は、本明細書において無効である配列決定プラットフォーム上の偽のインデル率が比較的低いので、整列における演習である（故に、正しく整列されたインデルの僅かな観察でさえ、変異の強力な証拠となり得る）。しかし、インデルの存在下での正確な整列は、困難であり得る（特に、インデル長が長くなる場合）。整列に関連する、例えば、置換の一般的な問題に加えて、インデル自体が整列に問題を引き起こし得る。（例えば、ジヌクレオチド反復の２ｂｐの欠失は、容易かつ断定的には配置され得ない）。感度及び特異性の両方は、より短い（＜１５ｂｐ）明らかなインデル含有読み取りデータの正しくない配置によって低減され得る。より大きいインデル（個別の読み取りデータの長さ、例えば、３６ｂｐの読み取りデータにより近付くこと）によって、読み取りデータを全く整列することができなくなり、標準的な整列読み取りデータのセットにおいてインデルの検出が不可能になる。

がん変異のデータベースは、これらの問題に対処し、能力を改善するために使用され得る。偽陽性インデルの発見を低減させる（特異性を改善する）ために、一般的に予想されるインデル周辺の領域は、配列状況に起因する問題のある整列に関して調査され、上記の置換と同様に対処され得る。インデル検出の感度を改善するために、がんで予想されるインデルにおける情報を使用するいくつかの異なる手法が使用され得る。例えば、予想されるインデルを含有した短い読み取りデータが模擬実験され、整列が試みられ得る。整列は研究され得、問題のあるインデル領域は、例えば、ギャップオープン／伸長ペナルティを低減させることによって、または部分的な読み取りデータ（例えば、読み取りデータの前半または後半）を整列することによって、整列パラメータを調整し得る。

あるいは、最初の整列は、正常な参照ゲノムだけでなく、既知または可能性のあるがんインデル変異の各々を含有するゲノムの代替的バージョンでも試みられ得る。この手法において、最初に整列できなかったかまたは整列が不正確であったインデルの読み取りデータは、ゲノムの代替的（変異）バージョンにおいて問題なく配置される。

このようにして、インデルの整列（故に、呼び出し）は、予想されるがん遺伝子／部位に対して最適化され得る。本明細書で使用されるとき、配列整列アルゴリズムは、読み取りデータ配列と参照配列との間の類似性を評価することによって、読み取りデータ配列（例えば、次世代配列決定からの、例えば、短い読み取りデータ配列）がゲノム中のどこから由来する可能性が最も高いかを識別するために使用される計算方法または手法を具体化する。様々なアルゴリズムが、配列整列の問題に対して適用され得る。いくつかのアルゴリズムは、比較的遅いが、比較的高い特異性を可能にする。これらには、例えば、ダイナミックプログラミングに基づくアルゴリズムが含まれる。ダイナミックプログラミングは、複雑な問題をより単純なステップに分解することによって解決するための方法である。他の手法は、比較的より効率的であるが、典型的には完璧なものではない。これらには、例えば、発見的アルゴリズム及び大規模データベース検索のために設計された確率的方法が含まれる。

整列パラメータは、アルゴリズムの能力を調整するために、例えば、読み取りデータ配列と参照配列との間で最適な網羅的または局所的整列を産生させるために、整列アルゴリズムにおいて使用される。整列パラメータは、一致、不一致、及びインデルに対して重みを供与し得る。例えば、重みが低いほど、より多くの不一致及びインデルとの整列が可能になる。

配列状況、例えば、反復配列（例えば、タンデム反復、散在反復）、低複雑性領域、インデル、偽遺伝子、またはパラログの存在は、整列特異性に影響を及ぼし得る（例えば、誤整列を引き起こす）。本明細書で使用されるとき、誤整列は、ゲノム中の正しくない位置での短い読み取りデータからの塩基対の配置を指す。

整列アルゴリズムが選択される場合、または整列パラメータが腫瘍型、例えば、特定の変異もしくは変異型を有する傾向のある腫瘍型に基づいて調整される場合、整列の感度は、増加され得る。

整列アルゴリズムが選択される場合、または整列パラメータが特定の遺伝子型（例えば、発がん遺伝子、腫瘍抑制遺伝子）に基づいて調整される場合、整列の感度は、増加され得る。がん関連遺伝子の異なる型における変異は、がん表現型に対して異なる影響を有し得る。例えば、変異発がん遺伝子対立遺伝子は、典型的には、優性である。変異体腫瘍抑制因子対立遺伝子は、典型的に、劣性であり、これは、殆どの場合、影響が現れる前に腫瘍抑制因子遺伝子の両方の対立遺伝子が影響を受けるはずであることを意味する。

整列アルゴリズムが選択される場合、または整列パラメータが変異型（例えば、一塩基多型、インデル（挿入または欠失）、逆位、転座、タンデム反復）に基づいて調整される場合、整列の感度は、調整され（例えば、増加され）得る。

整列アルゴリズムが選択される場合、または整列パラメータが変異部位（例えば、変異ホットスポット）に基づいて調整される場合、整列の感度は、調整され（例えば、増加され）得る。変異ホットスポットは、変異が正常の変異率よりも最大１００倍頻繁に起きるゲノム中の部位を指す。

整列アルゴリズムが選択される場合、または整列パラメータが試料の種類（例えば、ＦＦＰＥ試料）に基づいて調整される場合、整列の感度／特異性は、調整され（例えば、増加され）得る。

整列アルゴリズムは、試料の種類（例えば、ＦＦＰＥ試料、血液試料、または骨髄穿刺試料）に基づいて、整列感度／特異性を調整する（例えば、増加させる）ように選択され得る。

整列の最適化は、例えば、国際特許出願公開第ＷＯ２０１２／０９２４２６号に記載されているように、当技術分野に記載されている。

変異呼び出し
塩基呼び出しは、配列決定装置の生の結果を指す。変異呼び出しは、配列決定されているヌクレオチド位置にヌクレオチド値、例えば、Ａ、Ｇ、Ｔ、またはＣを選択するプロセスを指す。典型的には、ある位置に対する配列決定読み取りデータ（または、塩基呼び出し）は、１つを超える値を提供し、例えば、いくつかの読み取りデータはＴを供与し、一部はＧを供与するであろう。変異呼び出しは、ヌクレオチドチ値、例えばこれらの値のうちの１つを配列に割り当てるプロセスである。これは、「変異」呼び出しと称されるが、任意のヌクレオチド位置、例えば、変異体対立遺伝子、野生型対立遺伝子、変異型もしくは野生型のいずれとも特徴付けられていない対立遺伝子に対応する位置に、または可変性を特徴としない位置に、ヌクレオチド値を割り当てるために適用され得る。変異呼び出しのための方法は、次の：参照配列における各位置での情報に基づいて独立呼び出しを作製すること（例えば、配列読み取りデータを調査すること、塩基呼び出し及び品質スコアを調査すること、可能性のある遺伝子型を考慮し、観察される塩基及び品質スコアの確率を計算すること、ならびに（例えば、ベイズ規則を使用して）遺伝子型を割り当てること）、偽陽性を除去すること（例えば、読み取りデータ深さが予想よりもかなり低いかまたは高いＳＮＰを拒絶するために深さ閾値を使用すること、小さなインデルに起因する偽陽性を除去するための局所的再整列）、及び連鎖不均衡（ＬＤ）／インピュテーションに基づく分析を行って、呼び出しを改良すること、のうちの１つ以上を含み得る。

特異的な遺伝子型及び位置に関連する遺伝子型尤度を計算するための等式は、例えば、ＬｉＨ．ａｎｄＤｕｒｂｉｎＲ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１０；２６（５）：５８９－９５に記載されている。ある特定のがん型における特定の変異に対する先行期待値は、そのがん型からの試料を評価する場合に使用され得る。このような尤度は、がん変異の公開データベース、例えば、ＣａｔａｌｏｇｕｅｏｆＳｏｍａｔｉｃＭｕｔａｔｉｏｎｉｎＣａｎｃｅｒ（ＣＯＳＭＩＣ）、ＨＧＭＤ（ＨｕｍａｎＧｅｎｅＭｕｔａｔｉｏｎＤａｔａｂａｓｅ）、ＴｈｅＳＮＰＣｏｎｓｏｒｔｉｕｍ，ＢｒｅａｓｔＣａｎｃｅｒＭｕｔａｔｉｏｎＤａｔａＢａｓｅ（ＢＩＣ）、及びＢｒｅａｓｔＣａｎｃｅｒＧｅｎｅＤａｔａｂａｓｅ（ＢＣＧＤ）由来であり得る。

ＬＤ／インピュテーションに基づく分析の例は、例えば、ＢｒｏｗｎｉｎｇＢ．Ｌ．ａｎｄＹｕＺ．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．２００９，８５（６）：８４７－６１に記載されている。低カバレッジＳＮＰ呼び出し法の例は、例えば、ＬｉＹ．ｅｔａｌ．，Ａｎｎｕ．Ｒｅｖ．ＧｅｎｏｍｉｃｓＨｕｍ．Ｇｅｎｅｔ．２００９，１０：３８７－４０６に記載されている。

整列の後、呼び出し法、例えば、ベイジアン変異呼び出し法を使用して置換の検出が行われ得、これは、サブゲノム区間の各々、例えば、評価される遺伝子のエクソンにおける各塩基に適用され、代替的対立遺伝子の存在が観察される。この方法は、変異の存在下で読み取りデータを観察する確率を、塩基呼び出しエラーのみの存在下で読み取りデータを観察する確率と比較する。この比較が変異の存在を十分に強力に支持する場合、変異が呼び出され得る。

がんＤＮＡの分析のための５０％または１００％の頻度からの限定的な逸脱に対処する方法が開発されている。（例えば、ＳＮＶＭｉｘ－Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０Ｍａｒｃｈ１５；２６（６）：７３０－７３６）。しかし、本明細書に開示される方法によって、試料ＤＮＡの１％～１００％の全範囲で、特に、５０％未満のレベルで変異体対立遺伝子の存在の可能性を考慮することが可能になる。この手法は、天然（多クローン性）腫瘍ＤＮＡの低純度ＦＦＰＥ試料における変異の検出に特に重要である。

ベイジアン変異検出手法の利点は、変異の存在の確率と、塩基呼び出しエラーのみの確率との比較が、その部位での変異の存在の先行期待値によって重み付けされ得ることである。代替的対立遺伝子のいくつかの読み取りデータが所与のがん型に対する頻繁に変異が起こる部位で観察される場合、変異の証拠の量が通常の閾値を満たさない場合でも、変異の存在が確信的に呼び出され得る。次いで、この柔軟性は、より希少な変異／より低い純度の試料に対してさえも検出感度を増加させるためか、または読み取りデータカバレッジを減少させるためにその試験をより堅牢なものにするために使用され得る。がんで変異が起こっているゲノム中のランダムな塩基対の尤度は、約１ｅ－６である。典型的な多重遺伝子癌ゲノムパネルにおける多くの部位での特異的な変異の尤度は、より高い桁であり得る。これらの尤度は、がん変異の公開データベース（例えば、ＣＯＳＭＩＣ）由来であり得る。インデル呼び出しは、挿入または欠失によって参照配列と異なる配列決定データにおいて塩基を探すプロセスであり、典型的には、関連する信頼スコアまたは統計学的証拠の計量を含む。

インデル呼び出しの方法は、候補インデルを識別し、局所的再整列を通じて遺伝子型尤度を計算し、ＬＤに基づく遺伝子型推測及び呼び出しを行うステップを含み得る。典型的には、ベイジアン手法は、可能性のあるインデル候補を得るために使用され、次いで、これらの候補が、ベイジアンフレームワークにおいて参照配列と一緒に試験される。

候補インデルを生成するためのアルゴリズムは、例えば、ＭｃＫｅｎｎａＡ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１０；２０（９）：１２９７－３０３、ＹｅＫ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２００９；２５（２１）：２８６５－７１、ＬｕｎｔｅｒＧ．ａｎｄＧｏｏｄｓｏｎＭ．ＧｅｎｏｍｅＲｅｓ．２０１０（印刷物に先行して電子版で公開）、及びＬｉＨ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００９，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２５（１６）：２０７８－９に記載されている。

インデル呼び出し及び個別のレベルの遺伝子型尤度を生成するための方法には、例えば、Ｄｉｎｄｅｌアルゴリズム（ＡｌｂｅｒｓＣ．Ａ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１１；２１（６）：９６１－７３）が含まれる。例えば、ベイジアンＥＭアルゴリズムは、読み取りデータを分析し、最初のインデル呼び出しを作製し、各候補インデルに対して遺伝子型尤度を生成するために使用され得、続いて、例えば、ＱＣＡＬＬ（ＬｅＳ．Ｑ．ａｎｄＤｕｒｂｉｎＲ．ＧｅｎｏｍｅＲｅｓ．２０１１；２１（６）：９５２－６０）を使用して遺伝子型のインピュテーションを行う。パラメータ、例えば、インデルを観察するという先行期待値は、インデルのサイズまたは場所に基づいて調整され得る（例えば、増加または減少され得る）。

変異呼び出しの最適化は、例えば、国際特許出願公開第ＷＯ２０１２／０９２４２６号に記載されているように、当技術分野に記載されている。

ＳＧＺアルゴリズム
様々な種類の変化、例えば、体細胞変化及び生殖細胞変異は、本明細書に記載される方法（例えば、配列決定法、整列法、または変異呼び出し法）によって検出され得る。ある特定の実施形態において、生殖細胞変異は、ＳＧＺアルゴリズムを使用する方法によってさらに識別される。ＳＧＺアルゴリズムは、Ｓｕｎｅｔａｌ．ＣａｎｃｅｒＲｅｓｅａｒｃｈ２０１４；７４（１９Ｓ）：１８９３－１８９３、国際出願公開第ＷＯ２０１４／１８３０７８号、及び米国出願公開第２０１４／０３３６９９６号に記載されており、それらの内容は、参照によってそれらの全体が本明細書に組み込まれる。

他の実施形態
本明細書に記載される方法の実施形態において、本方法におけるステップまたはパラメータは、本方法における下流のステップまたはパラメータを修正するために使用される。

実施形態において、該試料からの核酸の単離、ライブラリ構築、ベイトの設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み取りデータマッピング、変異呼び出し法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上または全てにおいて下流のステップまたはパラメータを修正するために、腫瘍試料の特質が使用される。

実施形態において、該試料からの核酸の単離、ライブラリ構築、ベイトの設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み取りデータマッピング、変異呼び出し法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上または全てにおいて下流のステップまたはパラメータを修正するために、単離された腫瘍、または対照、核酸の特質が使用される。

実施形態において、該試料からの核酸の再単離、その後の構築、ベイトの設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み取りデータマッピング、変異呼び出し法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上または全てにおいて下流のステップまたはパラメータを修正するために、ライブラリの特質が使用される。

実施形態において、該試料からの核酸の再単離、その後の構築、ベイトの設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み取りデータマッピング、変異呼び出し法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上または全てにおいて下流のステップまたはパラメータを修正するために、ライブラリキャッチの特質が使用される。

実施形態において、該試料からの核酸の再単離、その後の構築、ベイトの設計もしくは選択、その後のハイブリダイゼーション条件の決定、その後の配列決定、読み取りデータマッピング、変異呼び出し法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上または全てにおいて下流のステップまたはパラメータを修正するために、配列決定法の特質が使用される。

実施形態において、該試料からの核酸の再単離、その後の構築、ベイトの設計もしくは選択、その後のハイブリダイゼーション条件の決定、その後の配列決定、その後の読み取りデータマッピング、変異呼び出し法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上または全てにおいて下流のステップまたはパラメータを修正するために、マッピングされた読み取りデータの収集物の特質が使用される。

実施形態において、本方法は、腫瘍試料の特質に対する値を取得すること、例えば、該試料中の腫瘍細胞の割合に対する、該腫瘍試料の細胞充実性に対する、または腫瘍試料の画像からの値を取得することを含む。

実施形態において、本方法は、腫瘍試料の特質に対する該取得された値に応じて、腫瘍試料からの核酸の単離、ライブラリ構築、ベイト設計もしくは選択、ベイト／ライブラリメンバーハイブリダイゼーション、配列決定、または変異呼び出しに対するパラメータを選択することを含む。

実施形態において、方法は、該腫瘍試料中に存在する腫瘍組織の量に対する値を取得することと、該取得された値を参照基準と比較することと、該参照基準が満たされる場合、該腫瘍試料を許容し、例えば、該腫瘍試料が３０、４０、または５０％を超える腫瘍細胞を含有する場合、該腫瘍試料を許容することと、をさらに含む。

実施形態において、方法は、例えば、該腫瘍試料からの、参照基準を満たすことができない腫瘍試料からの腫瘍組織を、顕微鏡を使用しない解剖（ｍａｃｒｏｄｉｓｓｅｃｔｉｎｇ）をすることによって、腫瘍細胞に対して富化されたサブ試料を取得することをさらに含む。

実施形態において、方法は、一次対照、例えば、血液試料が利用可能であるかを判定して、そうである場合、該一次対照から対照核酸（例えば、ＤＮＡ）を単離することをさらに含む。

実施形態において、方法は、ＮＡＴが該腫瘍試料中に存在するか否かを判定すること（例えば、一次対照試料が利用可能ではない場合）をさらに含む。

実施形態において、方法は、例えば、一次対照を伴わない腫瘍試料中の該ＮＡＴからの非腫瘍組織を、顕微鏡を使用しない解剖（ｍａｃｒｏｄｉｓｓｅｃｔｉｎｇ）をすることによって、非腫瘍細胞に対して富化されたサブ試料を取得することをさらに含む。

実施形態において、方法は、利用可能な一次対照及びＮＡＴがないことを判定することと、適合対照なしの分析に対して該腫瘍試料をマークすることと、をさらに含む。

実施形態において、方法は、該腫瘍試料から核酸を単離して、単離された腫瘍核酸試料を提供することをさらに含む。

実施形態において、方法は、対照から核酸を単離して、単離された対照核酸試料を提供することをさらに含む。

実施形態において、方法は、検出可能な核酸を有さない試料を拒絶することをさらに含む。

実施形態において、方法は、該単離核酸試料中での核酸収率に対する値を取得することと、取得された値を参照基準と比較することと、をさらに含み、ここで、例えば、該取得された値が該参照基準未満である場合、ライブラリ構築前に該単離核酸試料を増幅することを含む。

実施形態において、方法は、該単離核酸試料中の核酸断片のサイズに対する値を取得することと、取得された値を参照基準、例えば、少なくとも３００、６００、または９００ｂｐのサイズ、例えば、平均のサイズと比較することと、をさらに含む。本明細書に記載されるパラメータは、この決定に応じて調整または選択され得る。

実施形態において、方法は、ライブラリを取得することをさらに含み、ここで、ライブラリ中の該核酸断片のサイズは、参照値以下であり、該ライブラリは、ＤＮＡ単離とライブラリ作製との間の断片化のステップなしに作製される。

実施形態において、方法は、核酸断片を取得することをさらに含み、該核酸断片のサイズが参照値以上である場合、断片化され、次いでこのような核酸断片はライブラリに作製される。

実施形態において、方法は、例えば、複数のメンバーの各々に識別可能な別個の核酸配列（バーコード）を付加することによって、複数のライブラリメンバーの各々を標識することをさらに含む。

実施形態において、方法は、複数のライブラリメンバーの各々にプライマーを連結させることをさらに含む。

実施形態において、方法は、複数のベイトを提供することと、
複数のベイトを選択することとをさらに含み、該選択は、：１）患者の特質、例えば、年齢、腫瘍のステージ、以前の治療、または耐性、２）腫瘍型、３）腫瘍試料の特質、４）対照試料の特質、５）対照の存在または種類、６）単離された腫瘍（または、対照）核酸試料の特質、７）ライブラリの特質、８）腫瘍試料中の腫瘍型に関連することで既知の変異、９）腫瘍試料中の腫瘍型に関連することが知られていない変異、１０）事前選択された配列の配列を決定する（または、それとハイブリッド形成するかまたはそれを回収する）か、または事前選択された変異、例えば、高ＧＣ領域もしくは再編成を有する配列に関連する難しさを識別する能力、あるいは１１）配列決定されている遺伝子に応じる。

実施形態において、方法は、例えば、該腫瘍試料中の少数の腫瘍細胞の決定に応じて、ベイト（複数可）を選択すること、第２の遺伝子のメンバーと比較すると、第１の遺伝子からのメンバーを比較的高効率的に捕捉することをさらに含み、例えば、ここで、第１の遺伝子における変異は、腫瘍試料の腫瘍型に対する腫瘍表現型に関連する。

実施形態において、方法は、ライブラリ－キャッチの特質に対する値、例えば、核酸濃度または表示を取得することと、取得された値を核酸濃度に対するかまたは表示に対する参照基準と比較することと、をさらに含む。

実施形態において、方法は、（例えば、参照基準を満たすよう値を替えるための）再処理に対する参照基準を満たさないライブラリの特質に対する値を有するライブラリを選択することをさらに含む。

実施形態において、方法は、ライブラリ定量化に対する参照基準を満たすライブラリの特質に対する値を有するライブラリを選択することをさらに含む。

実施形態において、方法は、対象に対する腫瘍型、遺伝子、及び遺伝子変化（ＴＧＡ）の関連を提供することをさらに含む。

実施形態において、方法は、複数の要素を有する事前選択されたデータベースを提供することをさらに含み、ここで、各要素は、ＴＧＡを含む。

実施形態において、方法は、事前選択されたデータベース、例えば、有効化されたＴＧＡのデータベースに該ＴＧＡが存在するか否かを判定することと、該対象からの（アノテーションする）該ＴＧＡと事前選択されたデータベースからのＴＧＡに対する情報を関連付けることと、任意に、該事前選択されたデータベースに該対象に対する第２以降のＴＧＡが存在するかを判定し、そうである場合、事前選択されたデータベースからの第２以降のＴＧＡに対する情報を該患者に存在する該第２のＴＧＡと関連付けることと、を含む、対象のＴＧＡを特徴付けることをさらに含む。

実施形態において、方法は、報告書を作成するために対象のＴＧＡの有無、及び任意に、関連するアノテーションを提出することをさらに含む。

実施形態において、方法は、受領者側に該報告書を送付することをさらに含む。

実施形態において、方法は、事前選択されたデータベース、例えば、有効化されたＴＧＡのデータベースに該ＴＧＡが存在するか否かを判定すること、または、該事前選択されたデータベースにないＴＧＡが既知の臨床的に関連するＧまたはＡを有するかを判定し、そうである場合、該事前選択されたデータベースにおける該ＴＧＡに対するエントリーを提供すること、を含む、対象のＴＧＡを特徴付けることをさらに含む。

実施形態において、方法は、報告書を作成するために対象からの腫瘍試料のＤＮＡで見られる変異の有無を提出することをさらに含む。

本発明は、次の付番された段落のいずれかで定義され得る。
１．試料（例えば、腫瘍試料または腫瘍由来の試料）中の腫瘍変異負荷を評価する方法であって、
ａ）前記試料からのサブゲノム区間（例えば、コードサブゲノム区間）のセットであって、所定の遺伝子セットからのものである、前記サブゲノム区間のセットの配列、例えば、ヌクレオチド配列を提供することと、
ｂ）前記腫瘍変異負荷に対する値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の体細胞変化（例えば、１つ以上の体細胞変化）の数の関数であり、前記変化の数が、
（ｉ）サブゲノム区間内の機能的変化、及び
（ｉｉ）サブゲノム区間内の生殖細胞変化を除外し、
それにより、前記試料中の前記腫瘍変異負荷を評価する、前記方法。

２．試料（例えば、腫瘍試料または腫瘍由来の試料）中の腫瘍変異負荷を評価する方法であって、
（ｉ）前記試料から複数の腫瘍メンバーを含むライブラリを取得することと、
（ｉｉ）前記ライブラリを、選択された腫瘍メンバーを提供するためのベイトセットであって、前記腫瘍メンバーとハイブリッド形成する、前記ベイトセットと接触させて、それにより、ライブラリキャッチを提供することと、
（ｉｉｉ）例えば、次世代配列決定法によって、前記ライブラリキャッチからの腫瘍メンバーから変化（例えば、体細胞変化）を含むサブゲノム区間（例えば、コードサブゲノム区間）に対する読み取りデータを取得することと、
（ｉｖ）整列法によって前記読み取りデータを整列させることと、
（ｖ）前記読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることと、
（ｖｉ）前記割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものである、サブゲノム区間のセットを選択することと、
（ｖｉｉ）前記腫瘍変異負荷に対する値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の体細胞変化（例えば、１つ以上の体細胞変化）の数の関数であり、前記変化の数が、
（ａ）サブゲノム区間内の機能的変化、及び
（ｂ）サブゲノム区間内の生殖細胞変化を除外し、
それにより、前記試料中の前記腫瘍変異負荷を評価する、前記方法。

３．前記所定の遺伝子セットが、全ゲノムまたは全エクソームを含まない、請求項１または２に記載の方法。

４．前記サブゲノム区間のセットが、全ゲノムまたは全エクソームを含まない、請求項１～３のいずれかに記載の方法。

５．前記値が、前記所定の遺伝子セット、例えば、前記所定の遺伝子セットの前記コード領域の関数として表される、請求項１～４のいずれかに記載の方法。

６．前記値が、配列決定された前記サブゲノム区間、例えば、配列決定された前記コードサブゲノム区間の関数として表される、請求項１～５のいずれかに記載の方法。

７．前記値が、事前選択された単位当たりの体細胞変化の数の関数として、例えば、１メガ塩基当たりの体細胞変化の数の関数として表される、請求項１～６のいずれかに記載の方法。

８．前記値が、前記所定の遺伝子セットの事前選択された位置の数における体細胞変化の数、例えば、前記所定の遺伝子セットの前記コード領域の関数として表される、請求項１～７のいずれかに記載の方法。

９．前記値が、配列決定された前記サブゲノム区間（例えば、コードサブゲノム区間）の事前選択された位置の数における体細胞変化の数の関数として表される、請求項１～８のいずれかに記載の方法。

１０．前記値が、前記所定の遺伝子セット内の１メガ塩基当たりの体細胞変化の数、例えば、前記所定の遺伝子セットの前記コード領域の関数として表される、請求項１～９のいずれかに記載の方法。

１１．前記値が、配列決定された前記サブゲノム区間（例えば、コードサブゲノム区間）内の１メガ塩基当たりの変化の数の関数として表される、請求項１～１０のいずれかに記載の方法。

１２．前記腫瘍変異負荷が、より多くの前記ゲノムに、例えば、全エクソームまたは全ゲノムに外挿される、請求項１～１１のいずれかに記載の方法。

１３．前記試料が、対象、例えば、がんを有する対象、または療法を受けているか、もしくは受けたことのある対象からのものである、請求項１～１２のいずれかに記載の方法。

１４．前記腫瘍変異負荷が、例えば、参照集団、例えば、前記対象と同じ型のがんを有する患者、または前記対象と同じ種類の療法を受けているか、もしくは受けたことのある患者の参照集団からの試料中の前記腫瘍変異負荷におけるパーセンタイルとして表される、請求項１～１３のいずれかに記載の方法。

１５．前記機能的変化は、参照配列、例えば、野生型配列または未変異配列と比較すると、細胞分裂、成長、または生存に対して影響を有し、例えば、細胞分裂、成長、または生存を促進する変化である、請求項１～１４のいずれかに記載の方法。

１６．前記機能的変化が、機能的変化のデータベース、例えば、ＣＯＳＭＩＣデータベース（ｃａｎｃｅｒ．ｓａｎｇｅｒ．ａｃ．ｕｋ／ｃｏｓｍｉｃ；Ｆｏｒｂｅｓｅｔａｌ．Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．２０１５；４３（Ｄ１）：Ｄ８０５－Ｄ８１１）に含むことにより識別される、請求項１～１５のいずれかに記載の方法。

１７．前記機能的変化が、例えば、ＣＯＳＭＩＣデータベースにおいて既知の体細胞変化として起こる既知の機能状態を伴う変化である、請求項１～１６のいずれかに記載の方法。

１８．前記機能的変化が、機能的である可能性が高い状態、例えば、腫瘍抑制遺伝子における切断を伴う変化である、請求項１～１７のいずれかに記載の方法。

１９．前記機能的変化が、ドライバー変異、例えば、細胞生存または繁殖を増加することによって、クローンにその微小環境において、選択優位性を供与する変化である、請求項１～１８のいずれかに記載の方法。

２０．前記機能的変化が、クローン展開を引き起こすことができる変化である、請求項１～１９のいずれかに記載の方法。

２１．前記機能的変化が、次の：
（ａ）成長シグナルにおける自給自足、
（ｂ）抗成長シグナルの減少、例えば、それに対する非感受性、
（ｃ）アポトーシスの減少、
（ｄ）複製能の増加、
（ｅ）血管新生の持続、または
（ｆ）組織浸潤もしくは転移、のうちの１つ以上を引き起こすことができる変化である、請求項１～２０のいずれかに記載の方法。

２２．前記機能的変化が、パッセンジャー変異ではなく、例えば、クローンの適応度に対して検出可能な影響を有する変化である、請求項１～２１のいずれかに記載の方法。

２３．前記機能的変化が、意義不明の変異形（ＶＵＳ）ではなく、例えば、その病原性を確認も排除もできない変化ではない、請求項１～２２のいずれかに記載の方法。

２４．前記所定の遺伝子セット内の事前選択された遺伝子（例えば、腫瘍遺伝子）における複数（例えば、１０％、２０％、３０％、４０％、５０％、または７５％以上）の機能的変化が除外される、請求項１～２３のいずれかに記載の方法。

２５．前記所定の遺伝子セット内の事前選択された遺伝子（例えば、腫瘍遺伝子）における全ての機能的変化が除外される、請求項１～２４のいずれかに記載の方法。

２６．前記所定の遺伝子セット内の複数の事前選択された遺伝子（例えば、腫瘍遺伝子）における複数の機能的変化が除外される、請求項１～２５のいずれかに記載の方法。

２７．前記所定の遺伝子セット内の全ての遺伝子（例えば、腫瘍遺伝子）における全ての機能的変化が除外される、請求項１～２６のいずれかに記載の方法。

２８．前記生殖細胞変化が、適合正常配列との比較を使用しない方法の使用によって除外される、請求項１～２７のいずれかに記載の方法。

２９．前記生殖細胞変化が、ＳＧＺアルゴリズムの使用を含む方法によって除外される、請求項１～２８のいずれかに記載の方法。

３０．前記生殖細胞変化が、生殖細胞変化のデータベース、例えば、ｄｂＳＮＰデータベース（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＳＮＰ／ｉｎｄｅｘ．ｈｔｍｌ；Ｓｈｅｒｒｙｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００１；２９（１）：３０８－３１１）に含むことにより識別される、請求項１～２９のいずれかに記載の方法。

３１．前記生殖細胞変化が、ＥｘＡＣデータベースの複数のカウント（ｅｘａｃ．ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｏｒｇ；ＥｘｏｍｅＡｇｇｒｅｇａｔｉｏｎＣｏｎｓｏｒｔｉｕｍｅｔａｌ．“Ａｎａｌｙｓｉｓｏｆｐｒｏｔｅｉｎ－ｃｏｄｉｎｇｇｅｎｅｔｉｃｉｎ６０，７０６ｈｕｍａｎｓ，”ｂｉｏＲｘｉｖｐｒｅｐｒｉｎｔ．Ｏｃｔｏｂｅｒ３０，２０１５）に含むことにより識別される、請求項１～３０のいずれかに記載の方法。

３２．前記生殖細胞変化が、一塩基多型（ＳＮＰ）、塩基、置換、インデル、またはサイレント変異（例えば、同義変異）である、請求項１～３１のいずれかに記載の方法。

３３．前記生殖細胞変化が、１０００人ゲノムプロジェクトデータベース（ｗｗｗ．１０００ｇｅｎｏｍｅｓ．ｏｒｇ；ＭｃＶｅａｎｅｔａｌ．Ｎａｔｕｒｅ．２０１２；４９１，５６－６５）に含むことにより識別される、請求項１～３２のいずれかに記載の方法。

３４．前記生殖細胞変化が、ＥＳＰデータベース（ＥｘｏｍｅＶａｒｉａｎｔＳｅｒｖｅｒ，ＮＨＬＢＩＧＯＥｘｏｍｅＳｅｑｕｅｎｃｉｎｇＰｒｏｊｅｃｔ（ＥＳＰ），Ｓｅａｔｔｌｅ，ＷＡ（ｅｖｓ．ｇｓ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／ＥＶＳ／）に含むことにより識別される、請求項１～３３のいずれかに記載の方法。

３５．前記体細胞変化が、サイレント変異、例えば、同義変化である、請求項１～３４のいずれかに記載の方法。

３６．前記体細胞変化が、パッセンジャー変異、例えば、クローンの適応度に対して検出可能な影響を有さない変化である、請求項１～３５のいずれかに記載の方法。

３７．前記体細胞変化が、意義不明の変異形（ＶＵＳ）、例えば、その病原性を確認も排除もできない変化である、請求項１～３６のいずれかに記載の方法。

３８．前記体細胞変化が、点変異である、請求項１～３７のいずれかに記載の方法。

３９．前記体細胞変化が、短い変異形（例えば、短いコード変異形）、例えば、塩基置換、インデル、挿入、または欠失である、請求項１～３８のいずれかに記載の方法。

４０．前記体細胞変化が、非同義一塩基変異形（ＳＮＶ）である、請求項１～３９のいずれかに記載の方法。

４１．前記体細胞変化が、スプライス変異形である、請求項１～４０のいずれかに記載の方法。

４２．前記体細胞変化が、がん表現型に関連していると識別されていない、請求項１～４１のいずれかに記載の方法。

４３．前記体細胞変化が、再編成以外、例えば、転座以外である、請求項１～４２のいずれかに記載の方法。

４４．前記所定の遺伝子セットが、変異体形態で、細胞分裂、成長、もしくは生存に対する影響に関連するか、またはがんに関連する複数の遺伝子を含む、請求項１～４３のいずれかに記載の方法。

４５．前記所定の遺伝子セットが、少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、約３５０個以上、約４００個以上、約４５０個以上、または約５００個以上の遺伝子を含む、請求項１～４４のいずれかに記載の方法。

４６．前記所定の遺伝子セットが、表１～４または図３Ａ～４Ｄから選ばれる遺伝子または遺伝子産物のうちの少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、または全てを含む、請求項１～４５のいずれかに記載の方法。

４７．前記腫瘍試料から複数の腫瘍メンバーを含むライブラリを取得することをさらに含む、請求項１～４６のいずれかに記載の方法。

４８．前記ライブラリをベイトセットと接触させて、選択された腫瘍メンバーを提供することをさらに含み、前記ベイトセットが前記腫瘍メンバーとハイブリッド形成して、それにより、ライブラリキャッチを提供する、請求項１～４７のいずれかに記載の方法。

４９．前記ライブラリまたはライブラリキャッチからの腫瘍メンバーから体細胞変化を含むサブゲノム区間に対する読み取りデータを取得し、それにより、例えば、次世代配列決定法によって前記サブゲノム区間に対する読み取りデータを取得することをさらに含む、請求項１～４８のいずれかに記載の方法。

５０．整列法によって前記読み取りデータを整列させることをさらに含む、請求項１～４９のいずれかに記載の方法。

５１．前記読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることをさらに含む、請求項１～５０のいずれかに記載の方法。

５２．前記サブゲノム区間に対する読み取りデータを取得することが、表１～４または図３Ａ～４Ｄから選ばれる遺伝子または遺伝子産物のうちの少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、または全てからのサブゲノム区間を配列決定することを含む、請求項１～５１のいずれかに記載の方法。

５３．前記サブゲノム区間に対する読み取りデータを取得することが、平均固有カバレッジの約２５０Ｘ超、約５００Ｘ超、または約１，０００Ｘ超で配列決定することを含む、請求項１～５２のいずれかに記載の方法。

５４．前記サブゲノム区間に対する読み取りデータを取得することが、配列決定された遺伝子（例えば、エクソン）の９５％超、約９７％超、または約９９％超において、平均固有カバレッジの約２５０Ｘ超、約５００Ｘ超、または約１，０００Ｘ超で配列決定することを含む、請求項１～５３のいずれかに記載の方法。

５５．前記配列が、請求項１～５４のいずれかに記載の方法によって提供される、請求項１～５４のいずれかに記載の方法。

５６．前記腫瘍試料中の変異形、例えば、変化を、
ａ）ｉ）複数の選択されたサブゲノム区間の各々に対して、前記選択されたサブゲノム区間における正規化された配列カバレッジに対する値を含む配列カバレッジ入力（ＳＣＩ）であって、サブゲノム区間に対する読み取りデータの数と処理適合対照に対する読み取りデータの数との関数である、前記ＳＣＩ、
ｉｉ）複数の選択された生殖細胞ＳＮＰの各々に対して、前記腫瘍試料中の対立遺伝子頻度に対する値を含むＳＮＰ対立遺伝子頻度入力（ＳＡＦＩ）であって、前記腫瘍試料中の低頻度または代替的対立遺伝子の頻度に少なくとも部分的に基づく、前記ＳＡＦＩ、及び
ｉｉｉ）前記腫瘍試料中の前記変異形に対する前記対立遺伝子頻度を含む、変異形対立遺伝子頻度入力（ＶＡＦＩ）を取得することと、
ｂ）ＳＣＩ及びＳＡＦＩの関数として、
ｉ）複数のゲノム分節の各々に対するゲノム分節総コピー数（Ｃ）、
ｉｉ）複数のゲノム分節の各々に対するゲノム分節低頻度対立遺伝子コピー数（Ｍ）、及び
ｉｉｉ）試料純度（ｐ）、に対する値を取得することであって、
前記Ｃ、Ｍ、及びｐの値が、ゲノム全体でのコピー数モデルをＳＣＩ及びＳＡＦＩに適合させることによって得られる、取得することと、
ｃ）前記変異形が、体細胞、サブクローナル体細胞変異形、生殖細胞、または区別不可能であることを示し、ＶＡＦＩ、ｐ、Ｃ、及びＭの関数である、変異型に対する値、ｇを取得することと、によって特徴付けることをさらに含む、請求項１～５５のいずれかに記載の方法。

５７．複数の選択されたサブゲノム区間の各々、複数の選択された生殖細胞ＳＮＰの各々、及び変異形（例えば、変化）を配列決定することをさらに含み、正規化の前の前記平均配列カバレッジが、少なくとも約２５０ｘ、例えば、少なくとも約５００ｘである、請求項１～５６のいずれかに記載の方法。

５８．前記ゲノム全体でのコピー数モデルをＳＣＩに適合させることが、以下の等式を使用することを含み、

、式中、ψが腫瘍倍数性である、請求項５６または５７に記載の方法。

５９．前記ゲノム全体でのコピー数モデルをＳＡＦＩに適合させることが、以下の等式を使用することを含み、

、式中、ＡＦが対立遺伝子頻度である、請求項５６～５８のいずれかに記載の方法。

６０．ｇが、体細胞／生殖細胞状態のモデルに対するＶＡＦＩ、ｐ、Ｃ、及びＭの値の適合を決定することによって決定される、請求項５６～５９のいずれかに記載の方法。

６１．ｇの前記値が、以下によって取得され、

、式中、ＡＦが対立遺伝子頻度である、請求項５６～６０のいずれかに記載の方法。

６２．０であるか、または０に近いｇの値が、前記変異形が体細胞変異形であることを示し、
１であるか、または１に近いｇの値が、前記変異形が生殖細胞変異形であることを示し、
０超であるが１未満であるｇの値が、区別不能な結果を示し、
０を著しく下回るｇの値が、前記変異形がサブクローナル体細胞変異形であることを示す、請求項５６～６１のいずれかに記載の方法。

６３．前記試料（例えば、腫瘍試料または腫瘍由来の試料）が、１つ以上の前悪性もしくは悪性細胞；固形腫瘍、軟組織腫瘍、もしくは転移性病巣からの細胞；外科的縁からの組織もしくは細胞；組織学的に正常な組織；１つ以上の循環腫瘍細胞（ＣＴＣ）；正常な近接組織（ＮＡＴ）；前記腫瘍を有するか、もしくはそれを有するリスクがある同じ対象からの血液試料；またはＦＦＰＥ試料を含む、請求項１～６２のいずれかに記載の方法。

６４．前記試料が、ＦＦＰＥ試料である、請求項１～６３のいずれかに記載の方法。

６５．前記ＦＦＰＥ試料が、次の特性：
（ａ）２５ｍｍ^２以上の表面積を有するか、
（ｂ）１ｍｍ^３以上の試料体積を有するか、または
（ｃ）８０％以上もしくは３０，０００個以上の細胞の有核の細胞充実性を有するか、のうちの１つ、２つ、または全てを有する、請求項６３または６４に記載の方法。

６６．前記試料が、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む試料である、請求項１～６５のいずれかに記載の方法。

６７．前記試料が、固形腫瘍、血液癌、またはそれらの転移形態から取得される、請求項１～６６のいずれかに記載の方法。

６８．前記腫瘍変異負荷の評価に応じて前記腫瘍試料、または前記腫瘍試料が由来する前記対象を分類することをさらに含む、請求項１～６７のいずれかに記載の方法。

６９．前記患者または別の者または実体、介護者、内科医、腫瘍医、病院、診療所、第３者の支払人、保険会社、もしくは官庁に対する、報告書、例えば、電子報告書、ウェブベース報告書、または書面報告書を作成することをさらに含む、請求項１～６８のいずれかに記載の方法。

７０．前記報告書が、前記腫瘍変異負荷を含む前記方法による結果を含む、請求項６９に記載の方法。

７１．試料（腫瘍試料または腫瘍由来の試料）中の腫瘍変異負荷を評価するためのシステムであって、
メモリに動作可能に接続された少なくとも１つのプロセッサを備え、前記少なくとも１つのプロセッサが、実行すると、
ａ）前記腫瘍試料からのサブゲノム区間（例えば、コードサブゲノム区間）のセットの配列、例えば、ヌクレオチド配列を取得することであって、前記コードサブゲノム区間のセットが所定の遺伝子セットからのものである、配列を取得することと、
ｂ）前記腫瘍変異負荷に対する前記値を決定することと、を行うように構成され、前記値が、前記サブゲノム区間のセット内の体細胞変化（例えば、１つ以上の体細胞変化）の数の関数であり、前記変化の数が、
（ｉ）サブゲノム区間（例えば、コードサブゲノム区間）内の機能的変化、及び
（ｉｉ）サブゲノム区間（例えば、コードサブゲノム区間）内の生殖細胞変化を除外する、前記システム。

腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図が図１Ａ～１Ｆに提供される。

本開示は、表５（添付Ａ）を含み、これは、本明細書の一部であり、参照によってその全体が本明細書に組み込まれる。

本発明は、次の実施例によりさらに説明されるが、限定するものとして見なされてはならない。本明細書全体を通じて引用される、全ての参考文献、図、配列表、特許、及び公開済み特許出願の内容は、参照によって本明細書に組み込まれる。

実施例１：標的遺伝子によって測定される変異負荷と全ゲノム変異負荷との比較
この実施例において、３１５個の遺伝子（１．１Ｍｂのコードゲノム）を標的とする包括的ゲノムプロファイリング（ＣＧＰ）試験によって測定される場合、ＴＭＢが全エクソームＴＭＢの正確な評価を提供し得るか否かを判定した。標的化包括的ゲノムプロファイリング試験によるＴＭＢの正確な測定を示した。

方法
ＴＣＧＡデータの分析
ＴＣＧＡデータを公開リポジトリ（ＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓＲｅｓｅａｒｃｈＮｅｔｗｏｒｋｅｔａｌ．ＮａｔＧｅｎｅｔ２０１３；４５：１１１３－２０）から得た。この分析に関して、ＴＣＧＡによって決定されるような体細胞呼び出し変異形を生の変異数として使用した。３８Ｍｂをエクソームサイズの推定値として使用した。ダウンサンプリング分析に関して、１部分当たり０～１０Ｍｂの範囲であるエクソームの様々な部分に対して、全エクソームＴＭＢ＝１００変異／Ｍｂ、２０変異／Ｍｂ、及び１０変異／Ｍｂで二項分布を使用して、観察された変異／Ｍｂの数を１０００回模擬実験した。黒色腫ＴＣＧＡデータをｄｂＧａｐ受託番号ｐｈｓ０００４５２．ｖ１．ｐ１（Ｂｅｒｇｅｒｅｔａｌ．Ｎａｔｕｒｅ２０１２；４８５：５０２－６）から得た。

腫瘍変異負荷
理論に束縛されるものではないが、この実施例において、腫瘍変異負荷を次の通り決定した。腫瘍変異負荷を、調査したゲノムの１メガ塩基当たりの体細胞、コーディング、塩基置換、及びインデル変異の数として測定した。同義変化を含む、標的遺伝子のコード領域内の全ての塩基置換及びインデルを最初に計数し、その後、下記に記載されるようにフィルタリングした。サンプリングの雑音を低減させるために同義変異を計数した。同義変異は、免疫原性の作成に直接関与しない可能性が高いが、それらの存在は、ゲノム内の他の箇所で非同義変異及びネオ抗原ももたらす変異プロセスのシグナルである。非コーディング変化は計数しなかった。試験した遺伝子ががんにおける機能変異を有する遺伝子に偏向しているため、ＣＯＳＭＩＣにおいて既知の体細胞変化及び腫瘍抑制因子遺伝子における切断として列挙される変化は計数しなかった（Ｂａｍｆｏｒｄｅｔａｌ．ＢｒＪＣａｎｃｅｒ２００４；９１：３５５－８）。体細胞生殖細胞接合（ＳＧＺ）アルゴリズムによって生殖細胞であると予測した変化は計数しなかった（Ｓｕｎｅｔａｌ．ＣａｎｃｅｒＲｅｓｅａｒｃｈ２０１４；７４（１９Ｓ）：１８９３－１８９３）。臨床検体のコホートにおいて生殖細胞であると回帰的に予測した変化は計数しなかった。ｄｂＳＮＰにおける既知の生殖細胞変化は計数しなかった。ＥｘＡＣデータベースにおける複数のカウントを伴って起こる生殖細胞変化は計数しなかった（Ｌｅｋｅｔａｌ．Ｎａｔｕｒｅ２０１６；５３６：２８５－９１）。１メガ塩基当たりのＴＭＢを計算するために、計数した変異の総数を標的領域のコード領域のサイズで除算した。次に、ノンパラメトリックＭａｎｎ－ＷｈｉｔｎｅｙＵ－試験を使用して、２つの集団間における平均値の差異の有意性に関して試験した。

結果
一般利用が可能なＴＣＧＡ全エクソーム解析データセット（ＴｈｅＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ；ｃａｎｃｅｒｇｅｎｏｍｅ．ｎｉｈ．ｇｏｖ）の最初の分析を行って、標的遺伝子（例えば、図３Ａ～３Ｂに記載される遺伝子）を使用して測定した変異負荷が全エクソーム変異負荷の正確な評価を提供するか否かを判定した。３５の別個の研究／疾患からの７，００１個の検体に関する完全変異呼び出しデータをＴＣＧＡからダウンロードした。全エクソームデータセットに関して体細胞コーディング変異の数を計数し、図３Ａ～３Ｂに記載される遺伝子を使用した試験によって、遺伝子において起こるこれらの変異の数を標的化した。これらのデータは、表５（添付Ａ）及び／または図５～６に示される散布図で呈示される。全エクソームからの変異負荷は、０．９７４の決定係数（Ｒ^２）のみで、図３Ａ～３Ｂに記載される遺伝子からの変異負荷と相関する。

さらなる分析は、合計８，９１７個のがん検体（ＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓＲｅｓｅａｒｃｈＮｅｔｗｏｒｋｅｔａｌ．ＮａｔＧｅｎｅｔ２０１３；４５：１１１３－２０）を調査した、ＴｈｅＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓの一部として公開されている３５の研究からの全クソーム配列決定データを含んだ。変異の総数を決定し、試験によって標的化した３１５個の遺伝子における変異の数と比較した。これらの結果もまた、高く相関した（Ｒ^２＝０．９８）。

これらの結果は、何百という遺伝子の全コード領域を標的とするＣＧＰを使用して（例えば、図３Ａ～３Ｂに記載される遺伝子を使用した試験によって標的化した遺伝子からのデータのみを使用して）、全エクソーム変異負荷が正確に評価され得ることを示す。

要約すると、この研究は、１．１Ｍｂの包括的ゲノムプロファイリングアッセイを使用して計算した腫瘍変異負荷が変異負荷の全エクソーム尺度と合致することを示す。これは、何百という遺伝子の全コード領域を標的とするＣＧＰが、十分なゲノムスペースをカバーして、全エクソーム変異負荷を正確に評価することを示す。生殖細胞変化及び希少な変異形を除去することを使用してＴＭＢの正確な測定を得ることができ、かつ、これが、配列決定データセットにおいて十分に表されていない人種背景を有する患者において特に有用であり得ることが分かった。これらの発見は、ＴＭＢの測定において、ＣＧＰが正確で費用効果があり、かつ臨床的に利用可能なツールであることを示す。ダウンサンプリング分析の結果は、１．１Ｍｂを配列決定する場合のサンプリングに起因する測定の変動が、許容可能に低く、ＴＭＢレベルの範囲でＴＭＢのかなり正確な呼び出しをもたらすことを示す。このサンプリング変動は、配列決定されたＭｂの数が減少すると、特に、より低いＴＭＢのレベルで増加する。

実施例２：がん型にわたる変異負荷の景観
この実施例において、≧１００，０００個のがん検体の多様なコホートにわたってＴＭＢの分布を記載し、１００を上回る腫瘍型に関して、体細胞変化とＴＭＢとの間の関連を試験した。患者のサブセットが、多くの希少な腫瘍型を含むほぼ全てのがん疾患の種類にわたって高いＴＭＢを示すことが分かった。ＴＭＢは、年齢とともに著しく増加し、１０歳と９０歳との間では２．４倍の差異を示すことが分かった。約１．１Ｍｂのコードゲノムを標的とするＣＧＰアッセイを使用して、免疫療法から利益を受けるであろう高いＴＭＢを有する相当な数の患者において、多くの疾患の種類があることが分かった。

この研究により、＞１００，０００人の患者の多様な腫瘍型の包括的ゲノムプロファイリング（ＣＧＰ）からのデータに基づいて、ヒトのがんのスペクトルにわたってＴＭＢの景観がより深く理解される。この実施例に記載される分析は、がんにおける変異負荷を定量化するデータの存在により著しく発展し、多くの前述されていないがん型に関するデータを提供する。新しいデータが提供されて、免疫療法から利益を受け得る患者集団の合理的な拡大を支持し、未試験のがん型における免疫療法剤の臨床試験の情報価値のある設計（ｉｎｆｏｒｍｅｄｄｅｓｉｇｎ）を可能にする。

方法
包括的ゲノムプロファイリング
詳細に前述されているようなＣＧＰを行った（Ｆｒａｍｐｔｏｎｅｔａｌ．ＮａｔＢｉｏｔｅｃｈ２０１３；３１：１０２３－１０３１；Ｈｅｅｔａｌ．Ｂｌｏｏｄ２０１６；１２７：３００４－１４；ＦｏｕｎｄａｔｉｏｎＯｎｅａｓｓａｙ（Ｃａｍｂｒｉｄｇｅ，ＭＡ，ＵＳＡ））。簡潔には、ヘマトキシリン及びエオシン（Ｈ＆Ｅ）染色スライド及び全ての試料を精査することによって各ケースの病理診断を確認し、最小で２０％の腫瘍細胞を含有するＤＮＡ抽出に進んだ。がん内に共通して再編成された１８５、２３６、３１５、または４０５個のがん関連遺伝子からのエクソン領域及び１９、２８、または３１個の遺伝子からの選択イントロンのハイブリダイゼーション捕捉を、ホルマリン固定パラフィン包埋臨床がん検体から抽出した≧５０ｎｇのＤＮＡに適用した。高く均一の中央カバレッジ（＞５００ｘ）に対してこれらのライブラリを配列決定し、塩基置換、短い挿入及び欠失、コピー数変化、ならびに遺伝子融合／再編成に関して評価した（Ｆｒａｍｐｔｏｎｅｔａｌ．ＮａｔＢｉｏｔｅｃｈ２０１３；３１：１０２３－１０３１）。アッセイの３つのバージョンの各々からのデータを分析で使用した。

腫瘍変異負荷
理論に束縛されるものではないが、この実施例において、腫瘍変異負荷を実施例１に記載されるように決定した。

コホート選択
１０２，２９２個の試料の最初の臨床コホートから、同じ患者からの重複アッセイの結果を除外し、３００ｘ未満の中央エクソンカバレッジを有する試料を除外して、９２，４３９個の試料の分析セットを作製した。がん型による分析のためには、それらは、試料レベルフィルタリング後、最小５０個の固有の検体を含有する必要があった。

研究室においてプロファイリングした患者のコホートにわたって、ＴＭＢの景観を調査した。１０２，２９２人のがん患者に対して、日常的な臨床ケアにおいてＣＧＰを行った（この実施例の「方法」の項を参照されたい）。固有の患者コホートは、４１，９６４人の男性及び５０，３７６人の女性患者を含んだ。検体収集時の患者の中央年齢は、６０歳であり（範囲：＜１歳～＞８９歳）、及びケースの２．５パーセントは、１８歳未満の小児患者からのものであった。この多くのデータは、分析のための５４１個の別個のがん型を提供した。特に、検体の大半は、著しく事前に治療を受けた、進行性、及び転移性疾患を有する患者からのものであった。全データセットにわたって、中央変異負荷は、３．６変異／Ｍｂであり、０～１，２４１変異／Ｍｂの範囲であった。これは、全エクソーム研究からの変異負荷の事前推定値と合致する（Ａｌｅｘａｎｄｒｏｖｅｔａｌ．Ｎａｔｕｒｅ２０１３；５００：４１５－２１、Ｌａｗｒｅｎｃｅｅｔａｌ．Ｎａｔｕｒｅ２０１３；４９９：２１４－８）。年齢の増加に伴うＴＭＢの著しい増加（ｐ＜１ｘ１０^－１６）が見られたが、影響の規模は小さかった（図７）。１０歳における中央ＴＭＢは、１．６７変異／Ｍｂであり、８８歳における中央ＴＭＢは、４．５０変異／Ｍｂであった。データに適合した線形モデルにより、１０歳と９０歳との間ではＴＭＢにおいて２．４倍の差異が予測され、これは、これらの年齢における中央ＴＭＢ差異と一致した。女性患者と男性患者との間で中央変異負荷において統計的に有意な差異はなかった（図８Ａ）。

１６７個の別個のがん型に関してＴＭＢを調査し、５０個を超える検体を試験した（図９、表６）。中央ＴＭＢは、骨髄異形成症候群の０．８変異／Ｍｂから皮膚扁平上皮細胞癌腫の４５．２変異／Ｍｂまで幅広い範囲に及んだ。小児悪性腫瘍（患者年齢が１８歳未満）が、成人悪性腫瘍（中央３．６変異／Ｍｂ）より低いＴＭＢ（中央１．７変異／Ｍｂ）を有することが分かった。白血病、リンパ腫、及び神経芽細胞腫などの、小児患者で共通する疾患の種類は、肉腫と同様に低ＴＭＢを有した（表６）。
表６．疾患によるＴＭＢ特性の要約

＊ＣＩ：信頼区間

肺及び皮膚癌などの著しい変異原曝露を有することで既知の疾患は、より高く変異が起きた（それぞれ、７．２変異／Ｍｂ及び１３．５変異／Ｍｂの中央ＴＭＢ）。黒色腫、非小細胞肺癌（ＮＳＣＬＣ）、及び膀胱を含む免疫療法が現在承認されている疾患適応症は、高いＴＭＢを有した（表６を参照されたい）。高いＴＭＢを有する追加のがん型を識別することは、チェックポイント阻害薬妨害に有利に応答する適応症のリストを拡大する機会であると言える。これらには、皮膚扁平上皮細胞癌腫、肺小細胞未分化癌腫、びまん性大細胞型Ｂ細胞リンパ腫、ならびに多くの他のがんの型（図６Ａ～６Ｃ）が含まれる。全体的に高いＴＭＢを有する追加のがん型を識別することに加えて、ほぼ全部のがん型にわたって高いＴＭＢを伴うケースが見られた（表６～７を参照されたい）。これにより、ほぼ全部のがんの型において、免疫療法から利益を受け得る高いＴＭＢを有する患者が識別され得る可能性が高まる。例えば、軟組織血管肉腫において、中央変異負荷は３．８変異／Ｍｂであったが、そのケースの１３．４％が２０変異／Ｍｂ超を有した。全体的には、高いＴＭＢを有した患者の１０％超において８個の組織に影響を及ぼす２０の腫瘍型及び高いＴＭＢを有した患者の５％超において１９個の組織に影響を及ぼす３８の腫瘍型が識別された（表７を参照されたい）。
表７．高いＴＭＢ（＞２０変異／Ｍｂ）を示す検体を有する５％超の疾患適応症。

要約すると、この研究は、多くの前述されていないがんの型を含む進行性疾患からの１００，０００個を超える臨床がん検体にわたって腫瘍変異負荷を記載する広範囲にわたるデータを特徴付けし、それらを提供する。これらのデータは、広範な適応症にわたる免疫療法臨床試験の設計を導くために使用され得る。現在、ＣＴＬＡ－４、ＰＤ－１、及びＰＤ－Ｌ１を標的とする免疫療法は、少数の適応症、黒色腫、膀胱、ＮＳＣＬＣ、及び腎細胞癌腫において承認されている。黒色腫及びＮＳＣＬＣが、最も高い変異負荷指標のうちのいくつかを表すことが観察された。免疫腫瘍治療の開発に関して、良好な標的であり得る高い変異負荷を有するいくつかの新規の疾患の種類が識別された。加えて、多くのがん型にわたって多様なＴＭＢが観察された。これらの療法から利益を受けるであろう相当な数の患者において、多くの疾患の種類があり得ることが分かった。全体的には、患者の１０％超が高いＴＭＢを有した８個の組織に影響を及ぼす２２の腫瘍型が識別された。

実施例３：肺癌における変異荷重を評価するための包括的ゲノムプロファイリング
肺癌は、特にＥＧＦＲ、ＡＬＫ、またはＲＯＳ１変異が検出され得ず、細胞傷害性療法が成功しない場合、管理課題を呈示する。変異荷重と、新規の免疫療法薬（例えば、ＰＤ－１／ＰＤ－Ｌ１及びＣＴＬＡ４阻害薬）の効能との関連を研究するために、肺癌を有する患者のための臨床ケアにおいて行ったゲノムプロファイリングによって変異荷重を評価した。

方法
簡潔には、肺癌を有する患者からの４０ミクロンのＦＦＰＥ切片からＤＮＡを抽出した。３１５個のがん関連遺伝子に関する６６３×の中央カバレッジ深さ及びがんにおいて頻繁に再編成される２８個の遺伝子からのイントロンに対して、ハイブリダイゼーション捕捉アダプターリゲーションに基づくライブラリでＣＧＰを行った。理論に束縛されるものではないが、この実施例において、本明細書に記載されるような既知の体細胞及び機能的変化を、これらがハイブリッド捕捉によって選択されることを考慮して、フィルタリング除去した後の１メガ塩基（Ｍｂ）当たりの塩基置換またはインデルの数として、変異荷重を特徴付けた。

ＦＦＰＥ腫瘍試料
試料要件は、次の通りである：表面積：≧２５ｍｍ^２、試料体積：≧１ｍｍ^３、有核の細胞充実性：≧８０％または≧３０，０００細胞、腫瘍含量：≧２０％、分析に不十分な組織を有する患者の画分：１０～１５％。

配列決定ライブラリ調製
研究室プロセスは、≧５０ｎｇのｄｓＤＮＡ（ＰｉｃｏＧｒｅｅｎにより定量化）を必要とした。超音波処理（Ｃｏｖａｒｉｓ）によってＤＮＡを断片化し、「ビーズ付き」ライブラリ構築で使用した。ビオチン化ＤＮＡオリゴヌクレオチドを用いたハイブリダイゼーションによってＤＮＡ断片を捕捉した。＞９９％のエクソンにおける＞１００×で、＞５００×平均固有カバレッジに対して、ＩｌｌｕｍｉｎａＨｉＳｅｑプラットフォームで４９×４９対形成末端配列決定を行った。

分析パイプライン
ベイジアンアルゴリズムによって塩基置換を分析した。局所的アセンブリによって短い挿入／欠失を評価した。処理適合正常対照との比較によってコピー数変化を分析した。キメラ読み取りデータ対の分析によって遺伝子融合を調査した。

分析方法は、任意の変異体対立遺伝子頻度で存在する変異形に対する感度を有し、ド・ブラングラフに基づく局所的アセンブリを使用して長い（１～４０ｂｐ）インデル変異形を検出することができた。分析方法は、コピー数変化（ＣＮＡ）の評価に関して、読み取りデータ深さの比較ゲノムハイブリダイゼーション（ＣＧＨ）のような分析も使用した。

臨床報告
報告手法は、適合正常試料なしでの解釈を提供した。１０００人ゲノムプロジェクト（ｄｂＳＮＰ１３５）からの生殖細胞変異形を除去した。既知のドライバー変化（ＣＯＳＭＩＣｖ６２）を生物学的に重要であるとして強調した。各変化に対して、生医学的文献及び現在の臨床試験の簡潔な要約が提供された。

変異荷重分析方法
変異荷重アルゴリズムのゴールは、ＦｏｕｎｄａｔｉｏｎＯｎｅ（登録商標）試験で検出した体細胞変異の数を定量化し、全体的にその値をエクソームまたはゲノムに外挿することである。

ＦｏｕｎｄａｔｉｏｎＯｎｅ試験で検出した全ての短い変異形変化（塩基置換及びインデル）を計数する。サイレント変化を含む全てのコーディング変化を計数する。非コーディング変化は計数しない。（ＣＯＳＭＩＣデータベース；ｃａｎｃｅｒ．ｓａｎｇｅｒ．ａｃ．ｕｋ／ｃｏｓｍｉｃにおいて既知の体細胞変化として起こる）既知の機能状態及び機能的である可能性が高い状態（腫瘍抑制因子遺伝子における切断）を伴う変化は計数しない。ｄｂＳＮＰデータベース（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＳＮＰ）において既知の生殖細胞変化は計数しない。ＥｘＡＣデータベース（ｅｘａｃ．ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｏｒｇ）における複数のカウントを伴って起こる生殖細胞変化は計数しない。体細胞生殖細胞接合（ＳＧＺ）アルゴリズムによって、評価されている検体中で生殖細胞であると予測した変化（例えば、国際出願公開第ＷＯ２０１４／１８３０７８号、米国出願公開第２０１４／０３３６９９６号、及びＳｕｎｅｔａｌ．ＣａｎｃｅｒＲｅｓｅａｒｃｈ２０１４；７４（１９Ｓ）：１８９３－１８９３に記載されているようなもの）は計数しない。ＳＧＺアルゴリズムによって、＞６０，０００個の臨床検体のコホートにおいて高い信頼を有する生殖細胞であると予測した変化は計数しない。１メガ塩基当たりの変異荷重を計算するために、計数した変異の総数を試験のコード領域標的領域によって除算し、これは、現在の試験バージョンにおいては１．２５２メガ塩基である。

結果
合計１０，６７６の肺腺癌腫、１，９６０の肺扁平上皮細胞癌腫、２２０の肺大細胞癌腫、及び７８４の肺小細胞癌腫由来のゲノムプロファイルを評価した。男性：女性の比が０．９：１である肺癌患者の中央年齢は、６６歳であった。０～９８４の範囲として１メガ塩基当たりの平均変異を評価し、２５番目、中央値、及び７５番目の四分閾値は、２．７、７．２、及び２２．５であった。

肺癌患者コホートの臨床的特質は、表８に示される。肺癌の変異荷重特質は、表９に示される。
表８．肺癌患者コホートの臨床的特質

表９．肺癌の変異荷重特質

臨床コホートにおける変異荷重分布は、図７Ａ～７Ｄに示される。肺癌における変異保有率は、図８Ａ～８Ｅに示される。

要約すると、肺癌を有する患者において高い可変変異荷重が見られた。患者の適合正常検体が利用できない場合、体細胞変異と正常な変異とを計算して正確に区別する能力が不可欠である。肺癌のケースの実質的な画分は、高い変異荷重（１Ｍｂ当たり、３９％≧１０；１Ｍｂ当たり、１３％≧２０）を有し、免疫療法薬の臨床試験のための潜在的な候補である。

実施例４：結腸直腸腺癌腫における変異荷重を評価するための包括的ゲノムプロファイリング
結腸直腸腺癌腫には、特にＫＲＡＳまたはＮＲＡＳ遺伝子に変異が起き、細胞傷害性療法が成功しない場合、依然として臨床的課題が残る。腫瘍変異荷重と、免疫チェックポイント阻害薬からの予測した利益との関連を研究するために、日常的な臨床ケアにおいて、ゲノムプロファイリングを使用して、結腸直腸腺癌腫試料における変異負荷と臨床的に関連するゲノムの変化との関係を評価した。

方法
結腸直腸腺癌腫を有する患者からの４０ミクロンのＦＦＰＥ切片からＤＮＡを抽出した。３１５個のがん関連遺伝子に関する６９８×の平均カバレッジ深さ及びがんにおいて頻繁に再編成される２８個の遺伝子からのイントロンに対して、ハイブリダイゼーション捕捉アダプターリゲーションに基づくライブラリでＣＧＰを行った。理論に束縛されるものではないが、この実施例において、本明細書に記載されるような既知の体細胞及び機能的変化を、これらがハイブリッド捕捉によって選択されることを考慮して、フィルタリング除去した後の１メガ塩基（Ｍｂ）当たりの塩基置換またはインデルの数として、変異荷重を特徴付けた。

試料要件、配列決定ライブラリ調製、分析パイプライン、臨床報告、及び変異荷重分析方法は、実施例３に記載されている通りである。

結果
合計６，７４２の結腸及び１，１７６の直腸腺癌腫由来のゲノムプロファイルを評価した。男性：女性の比が１．２：１である結腸直腸腺癌腫患者の中央年齢は、５７歳であった。０～８６６の範囲として１メガ塩基当たりの平均変異を評価し、２５番目、中央値、及び７５番目の四分閾値は、２．７、４．５、及び６．３であった。

結腸直腸腺癌腫の１７４（２．２％）、１９１（２．４％）、３１５（３．９％）、または２８３（３．６％）ケースにおいて、不一致修復遺伝子ＭＬＨ１、ＭＳＨ２、ＭＳＨ６、またはＤＮＡポリメラーゼ遺伝子ＰＯＬＤ１で遺伝子変化が検出され、これらは、それぞれ、３０、２３、２９、または１５の中央腫瘍変異荷重に関連した。しかし、このコホートにおいて最も頻繁に変化するゲンス（ｇｅｎｓ）の上位１０個－ＡＰＣ（７６％）、ＴＰ５３（７６％）、ＫＲＡＳ（５１％）、ＰＩＫ３ＣＡ（１８％）、ＳＭＡＤ４（１５％）、ＦＢＸＷ７（１０％）、ＳＯＸ９（１０％）、ＭＹＣ（８％）、ＢＲＡＦ（８％）、及びＰＴＥＮ（８％）は、腫瘍変異荷重における差異に関連していなかった。

結腸直腸腺癌腫患者コホートの臨床的特質は、表１０に示される。結腸直腸腺癌腫の変異荷重特質は、表１１に記載されている。
表１０．結腸直腸腺癌腫患者コホートの臨床的特質

表１１．結腸直腸腺癌腫の変異荷重特質

臨床コホートにおける変異荷重分布は、図９Ａ～９Ｂに示される。結腸直腸腺癌腫における変異保有率は、図１０Ａ～１０Ｃに示される。

要約すると、臨床ケアにおけるＣＧＰは、結腸直腸腺癌腫における変異荷重を評価するために使用され得る。ＤＮＡ不一致修復遺伝子における変異は、予想通り、より高い変異負荷に関連した。結腸直腸腺癌腫ケースの実質的な画分は、高い変異荷重（１Ｍｂ当たり、９％≧１０；１Ｍｂ当たり、５％≧２０）を有し、免疫療法薬の臨床試験のための潜在的な候補である。ＣＧＰを現在行われている見込みのある免疫療法試験及び診療に組み込むには、これらの関係を改善することが必要とされる。

実施例５：２４種類のヒト新生物における変異荷重を評価するための包括的ゲノムプロファイリング
腫瘍変異荷重と、免疫チェックポイント阻害薬からの予測した利益との関連を研究するために、日常的な臨床ケアにおいて、ゲノムプロファイリングを使用して、２４種類の新生物における変異負荷の分布を評価した。

方法
２４種類のうちの１種類の新生物を有する患者からの４０ミクロンのＦＦＰＥ切片からＤＮＡを抽出した。３１５個のがん関連遺伝子に関する５００×超の平均カバレッジ深さ及びがんにおいて頻繁に再編成される２８個の遺伝子からのイントロンに対して、ハイブリダイゼーション捕捉アダプターリゲーションに基づくライブラリでＣＧＰを行った。理論に束縛されるものではないが、この実施例において、本明細書に記載されるような既知の体細胞及び機能的変化を、これらがハイブリッド捕捉によって選択されることを考慮して、フィルタリング除去した後の１メガ塩基（Ｍｂ）当たりの塩基置換またはインデルの数として、変異荷重を特徴付けた。

結果
合計１５，５０８の新生物検体由来のゲノムプロファイルを評価した。男性：女性の比が０．６：１である患者コホートの中央年齢は、６０歳であった。０～６８９の範囲として１メガ塩基当たりの平均変異を評価し、２５番目、中央値、及び７５番目の四分閾値は、１．８、３．６、及び５．４であった。

患者コホートの臨床的特質は、表１２に示される。２４種類の新生物の変異荷重特質は、表１３に記載されている。２４種類の異なる新生物におけるＴＭＢ分布は、図１１に示される。
表１２．がん患者コホートの臨床的特質

表１３．２４種類の新生物の変異荷重特質

本明細書に記載される方法及びシステムに関連する追加の実施例は、例えば、国際出願公開第ＷＯ２０１２／０９２４２６号の実施例１～１７、国際出願公開第ＷＯ２０１６／０９０２７３号の実施例１６及び１７に記載されており、前述の刊行物及び実施例の内容は、参照によってそれらの全体が組み込まれる。

参照による組み込み
本明細書で述べられる全ての刊行物、特許、及び特許出願は、各々の個々の刊行物、特許、または特許出願が参照によって組み込まれることが具体的かつ個別に示されるかのように、参照によってそれらの全体が本明細書に組み込まれる。矛盾する場合は、本明細書におけるいかなる定義をも含む本出願が優先する。

ｔｉｇｒ．ｏｒｇのワールドワイドウェブ上でＴｈｅＩｎｓｔｉｔｕｔｅｆｏｒＧｅｎｏｍｉｃＲｅｓｅａｒｃｈ（ＴＩＧＲ）及び／またはｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖのワールドワイドウェブ上でＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）によって維持されているものなどの公開データベースにおけるエントリーと相関する受託番号を参照する任意のポリヌクレオチド及びポリペプチド配列も参照によってそれらの全体が組み込まれる。

等価物
当業者は、日常的な実験のみを使用して、本明細書に記載される本発明の特定の実施形態に対する多くの等価物を認識、または確認することができるであろう。このような等価物は、次の特許請求の範囲によって包含されることが意図される。

Claims

試料中の腫瘍変異負荷を評価する方法であって、
ａ）前記試料からのサブゲノム区間のセットのヌクレオチド配列を提供することであって、前記サブゲノム区間のセットは、所定の遺伝子セットからのものである、提供することと、
ｂ）前記腫瘍変異負荷についての値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の１つ以上の体細胞変化の数の関数であり、前記１つ以上の体細胞変化の数は、
（ｉ）サブゲノム区間内の機能的変化であって、参照配列と比較して、細胞分裂、成長または生存に影響を与える変化である、機能的変化、及び
（ｉｉ）サブゲノム区間内の生殖細胞変化
を除外し、
試料は、個体からの血液試料であり、試料は、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）及び／又は１以上の循環腫瘍細胞（ＣＴＣ）を含み、
それにより、前記試料中の前記腫瘍変異負荷を評価し、
前記サブゲノム区間のセットが、全エクソームを含まない、前記方法。
試料中の腫瘍変異負荷を評価する方法であって、
ａ）試料からのサブゲノム区間のセットのヌクレオチド配列を提供することであって、サブゲノム区間のセットは、所定の遺伝子セットからのものである、提供することと、
ｂ）前記腫瘍変異負荷についての値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の１つ以上の体細胞変化の数の関数であり、前記１つ以上の体細胞変化は、同義変化、及び／又は非同義一塩基多型（ＳＮＶ）を含み、前記１つ以上の体細胞変化の数は、
（ｉ）サブゲノム区間内の機能的変化であって、
（ａ）機能的変化は、機能的変化のデータベースに含むことによりそのように識別される、
（ｂ）機能的変化は、既知の機能状態を伴う機能的変化である、及び／又は、
（ｃ）機能的変化は、可能性のある機能状態を伴う機能的変化であり、可能性のある機能状態を伴う変化は、腫瘍抑制遺伝子における切断であってもよい、
サブゲノム区間における機能的変化、及び、
（ｉｉ）サブゲノム区間内の生殖細胞変化
を除外し、
それにより、前記試料中の前記腫瘍変異負荷を評価し、
前記サブゲノム区間のセットが、全エクソームを含まない、前記方法。
試料中の腫瘍変異負荷を評価する方法であって、
ａ）試料からのサブゲノム区間のセットのヌクレオチド配列を提供することであって、サブゲノム区間のセットは、所定の遺伝子セットからのものである、提供することと、
ｂ）前記腫瘍変異負荷についての値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の１つ以上の体細胞変化の数の関数であり、１つ以上の体細胞変化は、同義変化、及び／又は非同義一塩基多型（ＳＮＶ）を含み、前記１つ以上の体細胞変化の数は、
（ｉ）サブゲノム区間における機能的変化であって、参照配列と比較して、細胞分裂、成長または生存に影響を与える変化である、機能的変化、及び
（ｉｉ）サブゲノム区間内の生殖細胞変化であって、
（ａ）生殖細胞変化は、生殖細胞変化のデータベースに含むことによりそのように識別される、及び／又は、
（ｂ）前記生殖細胞変化は、体細胞生殖細胞接合（ＳＧＺ）アルゴリズムによりそのように予測される生殖細胞変化である、
サブゲノム区間内の生殖細胞変化
を除外し、
それにより、前記試料中の前記腫瘍変異負荷を評価し、
前記サブゲノム区間のセットが、全エクソームを含まない、前記方法。
試料は、個体からの血液試料であり、試料は、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）及び／又は１以上の循環腫瘍細胞（ＣＴＣ）を含む、請求項２または３に記載の方法。
サブゲノム区間内の生殖細胞変化は、臨床検体のコホートにおいてそのように識別される、請求項１から３のいずれか一項に記載の方法。
前記サブゲノム区間のセットが、コードサブゲノム区間のセットである、請求項１から３のいずれか一項に記載の方法。
前記値が、（ｉ）前記所定の遺伝子セットの関数、または（ｉｉ）配列決定された前記サブゲノム区間の関数として表される、請求項１から３のいずれか一項に記載の方法。
前記値が、
（ｉ）前記所定の遺伝子セットのコード領域の関数;又は、
（ｉｉ）配列決定された前記コードサブゲノム区間の関数
として表される、請求項７に記載の方法。
前記値が、
（ｉ）事前選択された単位当たりの体細胞変化の数の関数、又は、
（ｉｉ）前記所定の遺伝子セットの、事前選択された数の位置における体細胞変化の数の関数
として表される、請求項１から３のいずれか一項に記載の方法。
前記値が、
（ｉ）１メガ塩基当たりの体細胞変化の数の関数、又は、
（ｉｉ）前記所定の遺伝子セットのコード領域の、事前選択された数の位置における体細胞変化の数の関数
として表される、請求項９に記載の方法。
前記値が、
（ｉ）配列決定された前記サブゲノム区間の、事前選択された数の位置における体細胞変化の数の関数、又は、
（ｉｉ）前記所定の遺伝子セット内の１メガ塩基当たりの体細胞変化の数の関数
として表される、請求項１から３のいずれか一項に記載の方法。
前記値が、
（ｉ）配列決定されたコードサブゲノム区間の、事前選択された数の位置における体細胞変化の数の関数、又は、
（ｉｉ）前記所定の遺伝子セットの前記コード領域内の１メガ塩基当たりの体細胞変化の数の関数
として表される、請求項１１に記載の方法。
前記値が、配列決定された前記サブゲノム区間内の１メガ塩基当たりの変化の数の関数として表される、請求項１から３のいずれか一項に記載の方法。
前記腫瘍変異負荷が、ゲノムのより多くの部分に外挿される、請求項１から３のいずれか一項に記載の方法。
前記腫瘍変異負荷が、全エクソームまたは全ゲノムに外挿される、請求項１４に記載の方法。
前記試料が、がんを有する対象、または療法を受けているか、もしくは受けたことのある対象からのものである、請求項１から３のいずれか一項に記載の方法。
前記腫瘍変異負荷が、パーセンタイルとして表される、請求項１から３のいずれか一項に記載の方法。
前記腫瘍変異負荷が、参照集団からの試料中の前記腫瘍変異負荷におけるパーセンタイルとして表され、
試料は、がんを有する対象、または、療法を受けているか、もしくは受けたことのある対象からのものであってもよく、
参照集団は、前記対象と同じ型のがんを有する患者、または前記対象と同じ種類の療法を受けているか、もしくは受けたことのある患者の参照集団である、請求項１７に記載の方法。
前記機能的変化は、参照配列と比較して、細胞分裂、成長、または生存を促進する変化である、請求項１から３のいずれか一項に記載の方法。
前記機能的変化が、機能的変化のデータベースに含むことによりそのように識別される、請求項１または３に記載の方法。
前記機能的変化が、既知の機能状態を伴う変化である、請求項１または３に記載の方法。
前記機能的変化が、機能的である可能性が高い状態を伴う変化である、請求項１または３に記載の方法。
前記機能的変化が、ドライバー変異である、請求項１から３のいずれか一項に記載の方法。
前記ドライバー変異は、クローンに、その微小環境において選択的利点を供与する変化である、請求項２３に記載の方法。
前記ドライバー変異は、細胞生存または繁殖を増加させることによって、クローンに、その微小環境において選択的利点を供与する変化である、請求項２４に記載の方法。
前記機能的変化が、クローン展開を引き起こすことができる変化である、請求項１から３のいずれか一項に記載の方法。
前記機能的変化が、次の：
（ａ）成長シグナルにおける自給自足、
（ｂ）抗成長シグナルに対する非感受性又は感受性の減少、
（ｃ）アポトーシスの減少、
（ｄ）複製能の増加、
（ｅ）血管新生の持続、または
（ｆ）組織浸潤もしくは転移
のうちの１つ以上を引き起こすことができる変化である、請求項１から３のいずれか一項に記載の方法。
前記機能的変化が、パッセンジャー変異ではない、請求項１から３のいずれか一項に記載の方法。
パッセンジャー変異は、クローンの適応度に対して検出可能な影響を有する変化である、請求項２８に記載の方法。
前記機能的変化が、意義不明の変異形（ＶＵＳ）ではない、請求項１から３のいずれか一項に記載の方法。
ＶＵＳは、その病原性を確認も排除もできない変化ではない、請求項３０に記載の方法。
前記所定の遺伝子セット内の事前選択された遺伝子における複数の機能的変化が除外される、請求項１から３のいずれか一項に記載の方法。
前記所定の遺伝子セット内の事前選択された遺伝子における全ての機能的変化が除外される、請求項１から３のいずれか一項に記載の方法。
前記所定の遺伝子セット内の複数の事前選択された遺伝子における複数の機能的変化が除外される、請求項１から３のいずれか一項に記載の方法。
前記所定の遺伝子セット内の全ての遺伝子における全ての機能的変化が除外される、請求項１から３のいずれか一項に記載の方法。
前記生殖細胞変化が、適合正常配列との比較を使用しない方法の使用によって除外される、請求項１から３のいずれか一項に記載の方法。
前記生殖細胞変化が、ＳＧＺアルゴリズムの使用を含む方法によって除外される、請求項１または２に記載の方法。
前記生殖細胞変化が、生殖細胞変化のデータベースに含むことによりそのように識別される、請求項１または２に記載の方法。
前記生殖細胞変化が、一塩基多型（ＳＮＰ）、塩基、置換、インデル、またはサイレント変異である、請求項１から３のいずれか一項に記載の方法。
前記サイレント変異は、同義変化である、請求項３９に記載の方法。
前記体細胞変化が、サイレント変異である、請求項１から３のいずれか一項に記載の方法。
前記サイレント変異は、同義変化である、請求項４１に記載の方法。
前記体細胞変化が、パッセンジャー変異である、請求項１から３のいずれか一項に記載の方法。
パッセンジャー変異が、クローンの適応度に対して検出可能な影響を有さない変化である、請求項４３に記載の方法。
前記体細胞変化が、ＶＵＳである、請求項１から３のいずれか一項に記載の方法。
ＶＵＳは、その病原性を確認も排除もできない変化である、請求項４５に記載の方法。
前記体細胞変化が、点変異である、請求項１から３のいずれか一項に記載の方法。
前記体細胞変化が、短い変異形である、請求項１から３のいずれか一項に記載の方法。
短い変異形は、短いコード変異形である、請求項４８に記載の方法。
前記体細胞変化が、非同義一塩基変異形（ＳＮＶ）である、請求項１から３のいずれか一項に記載の方法。
前記体細胞変化が、スプライス変異形である、請求項１から３のいずれか一項に記載の方法。
前記体細胞変化が、がん表現型に関連していると識別されていない、請求項１から３のいずれか一項に記載の方法。
前記体細胞変化が、再編成以外である、請求項１から３のいずれか一項に記載の方法。
前記体細胞変化が、転座以外である、請求項５３に記載の方法。
前記所定の遺伝子セットが、変異体形態で、細胞分裂、成長、もしくは生存に対する影響に関連するか、またはがんに関連する複数の遺伝子を含む、請求項１から３のいずれか一項に記載の方法。
前記所定の遺伝子セットが、少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、約３５０個以上、約４００個以上、約４５０個以上、または約５００個以上の遺伝子を含む、請求項１から３のいずれか一項に記載の方法。
前記所定の遺伝子セットが、表１～４または図３Ａ～４Ｄから選ばれる遺伝子または遺伝子産物のうちの少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、または全てを含む、請求項１から３のいずれか一項に記載の方法。
前記サブゲノム区間に対する読み取りデータを取得することが、表１～４または図３Ａ～４Ｄから選ばれる遺伝子または遺伝子産物のうちの少なくとも約５０個以上、約１００個以上、約１５０個以上、約２００個以上、約２５０個以上、約３００個以上、または全てからのサブゲノム区間を配列決定することを含む、請求項１から３のいずれか一項に記載の方法。
前記サブゲノム区間に対する読み取りデータを取得することが、平均固有カバレッジの約２５０Ｘ超、約５００Ｘ超、または約１，０００Ｘ超で配列決定することを含む、請求項１から３のいずれか一項に記載の方法。
前記サブゲノム区間に対する読み取りデータを取得することが、配列決定された遺伝子の約９５％超、約９７％超、または約９９％超において、平均固有カバレッジの約２５０Ｘ超、約５００Ｘ超、または約１，０００Ｘ超で配列決定することを含む、請求項１から３のいずれか一項に記載の方法。
腫瘍試料中の変異形を、
ａ）ｉ）複数の選択されたサブゲノム区間の各々に対して、前記選択されたサブゲノム区間における正規化された配列カバレッジに対する値を含む配列カバレッジ入力（ＳＣＩ）であって、サブゲノム区間に対する読み取りデータの数と処理適合対照に対する読み取りデータの数との関数である、前記ＳＣＩ、
ｉｉ）複数の選択された生殖細胞ＳＮＰの各々に対して、前記腫瘍試料中の対立遺伝子頻度に対する値を含むＳＮＰ対立遺伝子頻度入力（ＳＡＦＩ）であって、前記腫瘍試料中の低頻度または代替的対立遺伝子の頻度に少なくとも部分的に基づく、前記ＳＡＦＩ、及び
ｉｉｉ）前記腫瘍試料中の前記変異形に対する前記対立遺伝子頻度を含む、変異形対立遺伝子頻度入力（ＶＡＦＩ）
を取得することと、
ｂ）ＳＣＩ及びＳＡＦＩの関数として、
ｉ）複数のゲノム分節の各々に対するゲノム分節総コピー数（Ｃ）、
ｉｉ）複数のゲノム分節の各々に対するゲノム分節低頻度対立遺伝子コピー数（Ｍ）、及び
ｉｉｉ）試料純度（ｐ）
についての値を取得することであって、
前記Ｃ、Ｍ、及びｐの値が、ゲノム全体でのコピー数モデルをＳＣＩ及びＳＡＦＩに適合させることによって得られる、前記取得することと、
ｃ）前記変異形が、体細胞、サブクローナル体細胞変異形、生殖細胞、または区別不可能であることを示し、ＶＡＦＩ、ｐ、Ｃ、及びＭの関数である、変異型に対する値、ｇを取得することと、
によって特徴付けることをさらに含む、請求項１から３のいずれか一項に記載の方法。
複数の選択されたサブゲノム区間の各々、複数の選択された生殖細胞ＳＮＰの各々、及び変異形を配列決定することをさらに含み、正規化の前の平均配列カバレッジが、少なくとも２５０ｘ、又は、少なくとも５００ｘである、請求項６１に記載の方法。
変異形は、変化である、請求項６１に記載の方法。
前記ゲノム全体でのコピー数モデルをＳＣＩに適合させることが、以下の等式を使用することを含み、

、式中、ψが腫瘍倍数性である、請求項６１に記載の方法。
前記ゲノム全体でのコピー数モデルをＳＡＦＩに適合させることが、以下の等式
を使用することを含み、

、式中、ＡＦが対立遺伝子頻度である、請求項６１に記載の方法。
ｇが、体細胞／生殖細胞状態のモデルに対するＶＡＦＩ、ｐ、Ｃ、及びＭの値の適合を決定することによって決定される、請求項６１に記載の方法。
前記ｇの値が、以下によって取得され、

、式中、ＡＦが対立遺伝子頻度である、請求項６１に記載の方法。
０であるか、または０に近いｇの値が、前記変異形が体細胞変異形であることを示し、
１であるか、または１に近いｇの値が、前記変異形が生殖細胞変異形であることを示し、
０超であるが１未満であるｇの値が、区別不能な結果を示し、かつ
０を著しく下回るｇの値が、前記変異形がサブクローナル体細胞変異形であることを示す、請求項６１に記載の方法。
前記試料を得た患者または別の者または実体、介護者、内科医、腫瘍医、病院、診療所、第３者の支払人、保険会社、もしくは官庁に対する、報告書を作成することをさらに含む、請求項１から３のいずれか一項に記載の方法。
前記報告書が、前記腫瘍変異負荷を含む前記方法による結果を含む、請求項６９に記載の方法。