JP7437429B2

JP7437429B2 - 腫瘍試料の多重遺伝子分析の最適化

Info

Publication number: JP7437429B2
Application number: JP2022019434A
Authority: JP
Inventors: ダウニング，シーン，アール; ヤロス，ミルナ; リプソン，ドロン; オツトー，ジエフリー，アラン; パーカー，アレクサンダー，エヌ; シヤピロ，ミカイル，ジー; ステイーブンス，フイリツプ，ジエイムズ; イエレンスキー，ロマン
Original assignee: Foundation Medicine Inc
Current assignee: Foundation Medicine Inc
Priority date: 2010-12-30
Filing date: 2022-02-10
Publication date: 2024-02-22
Anticipated expiration: 2031-12-29
Also published as: WO2012092426A1; EP3564395A1; AU2019201446A1; AU2018211304A1; AU2011352070A1; AU2018279012A1; KR20140024270A; IL261052A; AU2017208342A1; AU2017276313A1; KR20190002733A; US11136619B2; AU2018203684A1; JP2017077244A; CA2823621A1; AU2020201108B2; JP2020000253A; JP2014507133A; CA2823621C; AU2020201108A1

Description

関連出願

本出願は、２０１０年１２月３０日出願の米国仮出願第６１／４２８，５６８号、２０
１０年１２月３０日出願の米国仮出願第６１／４２８，６０２号、２０１０年１２月３０
日出願の米国仮出願第６１／４２８，６２６号、２０１０年１２月３０日出願の米国仮出
願第６１／４２８，６３８号、２０１１年３月２５日出願の米国仮出願第６１／４６７，
７９８号、２０１１年３月２５日出願の米国仮出願第６１／４６７，７４８号、２０１１
年５月１３日出願の米国仮出願第６１／４８６，００６号、２０１１年５月１３日出願の
米国仮出願第６１／４８６，０１２号、２０１１年５月１３日出願の米国仮出願第６１／
４８６，０２６号、２０１１年５月１３日出願の米国仮出願第６１／４８６，０３３号、
および２０１１年１０月２８日出願の米国仮出願第６１／５５２，８８４号の利益を主張
する。これらすべての先行出願の内容は、参照によりそれらの全体が本明細書に組み込ま
れる。

本発明の背景
本発明は、腫瘍試料由来の核酸を分析するために最適化された方法、例えば、統合され
た最適化核酸選択、読み取りアライメント、および変異呼び出しを有する方法に関する。

本明細書に開示の方法は、例えば、サブゲノム間隔の最適化された組、例えば、癌に関
連した本明細書に記載のゲノムの断片の組に適用されるような、ベイトベースの選択、ア
ライメント、および変異呼び出しを含む１つ以上の最適化要素の統合を提供する。本明細
書に記載の方法は、癌ごとに、遺伝子ごとに、かつ／または部位ごとに最適化され得る腫
瘍の次世代配列決定（ＮＧＳ）に基づく分析を提供する。

したがって、一態様において、本発明は、腫瘍試料を分析する方法を特色とする。方法
は、
（ａ）複数の標的メンバー、例えば、腫瘍メンバーを含むライブラリを、試料、例えば
、腫瘍試料から取得することと、
（ｂ）任意で、ライブラリをベイトセット（または複数のベイトセット）と接触させて
選択されたメンバーを提供することと（本明細書で「ライブラリ捕獲物」と称される場合
もある）、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定によって、例えば、次
世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からの腫瘍メンバーか
ら取得することと、
（ｄ）該読み取りをアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置、例えば、複数のサブゲノム間隔のそれぞれ、
例えば、複数の遺伝子のそれぞれにおいて事前選択されたヌクレオチド位置に対する該読
み取りからのヌクレオチド値を割り当てる（例えば、ベイズ方法を用いて、例えば、変異
を呼び出す）ことと、を含み、
それによって、該試料を分析し、
該分析において、
（ｉ）Ｘ個のヌクレオチド位置がそれぞれ、ステップ（ｂ）、（ｃ）、（ｄ）、もしく
は（ｅ）のうちの１つまたはそれらの組み合わせについて一意の組の条件下で分析される
（一意とは、他のＸ－１個の組の条件とは異なることを意味し、Ｘは、少なくとも２、５
、１０、２０、３０、４０、５０、１００、２００、３００、もしくは５００である）。
例えば、第１の組の条件、例えば、本明細書に記載の組の条件が、例えば、第１のサブゲ
ノム間隔または遺伝子における第１のヌクレオチド位置のために使用され、第２の組の条
件、例えば、本明細書に記載の第２の組の条件が、例えば、第２のサブゲノム間隔または
遺伝子における第２のヌクレオチド位置のために使用される。
（ｉｉ）Ｘ個のヌクレオチド位置のそれぞれについて、ヌクレオチド位置で生じ得る事
前選択された変化、例えば、変異の特性、例えば、本明細書に記載の特性に応答して、ヌ
クレオチド位置は、一意の組の条件下で分析され（一意とは、他のＸ－１個の組の条件と
は異なることを意味し、Ｘは、少なくとも２、５、１０、２０、３０、４０、５０、１０
０、２００、３００、もしくは５００である）。例えば、第１のサブゲノム間隔における
ヌクレオチド位置で生じ得る事前選択された変化、例えば、変異の特性、例えば、本明細
書に記載の特性に応答して、ヌクレオチド位置は、第１の組の条件下で分析され、第２の
サブゲノム間隔におけるヌクレオチド位置で生じ得る事前選択された変化、例えば、変異
の特性、例えば、本明細書に記載の特性に応答して、ヌクレオチド位置は、第２の組の条
件下で分析され、そこで（ｉｉｉ）該方法は、試料、例えば、保存された腫瘍試料上で、
少なくとも２、５、１０、２０、５０、もしくは１００個のサブゲノム間隔、例えば、遺
伝子におけるヌクレオチド位置に対して９５、９８、もしくは９９％の感度または特異性
を可能にする条件下で行われる。あるいは
（ｉｖ）方法は、以下のうちの１つ以上もしくはすべてを含む：
ａ）第１のサブゲノム間隔を配列決定して約５００倍以上の配列決定深度を提供する、
例えば、試料由来の５％を超えない細胞に存在する変異を配列決定すること、
ｂ）第２のサブゲノム間隔を配列決定して約２００倍以上、例えば、約２００倍～約５
００倍の配列決定深度を提供する、例えば、試料由来の１０％を超えない細胞に存在する
変異を配列決定すること、
ｃ）第３のサブゲノム間隔を配列決定して約１０～１００倍の配列決定深度を提供する
、例えば、ａ）異なる薬物を代謝する患者の能力を説明し得る薬理ゲノム（ＰＧｘ）単一
ヌクレオチド多型（ＳＮＰ）、またはｂ）患者を一意に特定する（例えば、フィンガープ
リントする）ために使用され得るゲノムＳＮＰから選択される１つ以上のサブゲノム間隔
（例えば、エクソン）を配列決定すること、
ｄ）第４のサブゲノム間隔を配列決定して約５～５０倍の配列決定深度を提供し、例え
ば、ゲノム転座またはインデル等の構造ブレークポイントを検出すること。例えば、イン
トロンブレークポイントの検出は、高い検出信頼性を確保するために、５～５０倍の配列
対スパン深度を必要とする。そのようなベイトセットを用いて、例えば、転座／インデル
の傾向のある癌遺伝子を検出することができる、または
ｅ）第５のサブゲノム間隔を配列決定して約０．１～３００倍の配列決定深度を提供し
、例えば、コピー数の変化を検出すること。一実施形態において、コピー数の変化を検出
するための配列決定深度は、約０．１～１０倍の配列決定深度の範囲である。他の実施形
態では、ゲノムＤＮＡのコピー数獲得／喪失またはヘテロ接合性の消失（ＬＯＨ）を評価
するために使用されるゲノムＳＮＰ／遺伝子座を検出するための配列決定深度は、約１０
０～３００倍の範囲である。

例となる第１および第２の組の条件は、以下であるものを含む：
第１のベイトセットが、第１のサブゲノム間隔のために使用され、第２のベイトセット
が、第２のサブゲノム間隔のために使用される。
第１のアライメント方法が、第１のサブゲノム間隔についての読み取りに適用され、第
２のアライメント方法が、第２のサブゲノム間隔についての読み取りに適用される。
第１の変異呼び出し方法が、第１のサブゲノム間隔のヌクレオチド位置に適用され、第
２の変異呼び出し方法が、第２のサブゲノム間隔のヌクレオチド位置に適用される。
ある実施形態において、
第１のヌクレオチド位置が、第１の組のベイト条件、第１のアライメント方法、および
第１の変異呼び出し方法で分析され、
第２のヌクレオチド位置が、該第１の組のベイト条件、第２のアライメント方法、およ
び該第１の変異呼び出し方法で分析され、
第３のヌクレオチド位置が、該第１の組のベイト条件、該第１のアライメント方法、お
よび第２の変異呼び出し方法で分析され、
他の２つと比較して、それぞれ一意の条件下で分析された３個のヌクレオチド位置を提
供する。
ある実施形態において、条件は、以下であるものを含む：
第１のベイトセットが、第１のサブゲノム間隔のために使用され、第２のベイトセット
が、第２のサブゲノム間隔のために使用されること、
第１のアライメント方法が、第１のサブゲノム間隔についての読み取りに適用され、第
２のアライメント方法が、第２のサブゲノム間隔についての読み取りに適用されること、
または
第１の変異呼び出し方法が、第１のサブゲノム間隔のヌクレオチド位置に適用され、第
２の変異呼び出し方法が、第２のサブゲノム間隔のヌクレオチド位置に適用されることを
含む。

例となる特性は、以下を含む：
（ｉ）変化が位置する遺伝子もしくは遺伝子型、例えば、癌遺伝子もしくは腫瘍抑制遺
伝子、事前選択されたバリアントもしくはバリアントの種類、例えば、変異、または事前
選択された頻度の変異を特徴とする遺伝子もしくは遺伝子型、または本明細書に記載の他
の遺伝子もしくは遺伝子型、
（ｉｉ）変化の種類、例えば、置換、挿入、欠失、または転座、
（ｉｉｉ）試料の種類、例えば、変化について分析されるＦＦＰＥ試料、
（ｉｖ）評価される変化の該ヌクレオチド位置における配列またはその付近の配列、例
えば、予想されるサブゲノム間隔の誤アライメント傾向に影響を及ぼし得る配列、例えば
、ヌクレオチド位置における反復配列またはその付近の反復配列の存在、
（ｖ）例えば、事前選択された腫瘍型における変化、例えば、変異を示す読み取りを観
察する先行（例えば、文献）予想、
（ｖｉ）塩基呼び出しエラーのみによる変化を示す読み取りを観察する確率、あるいは
（ｖｉｉ）変化の検出に所望される事前選択された配列決定深度。

ある実施形態において、特性は、配列決定されるヌクレオチドの同一性以外であり、す
なわち、特性は、配列がａであるか、ｔであるかではない。

ある実施形態において、ステップ（ｂ）が存在する。ある実施形態において、ステップ
（ｂ）が欠如する。

ある実施形態において、少なくともＸ個の遺伝子、例えば、表１および表１Ａの少なく
ともＸ個の遺伝子、例えば、表１および表１Ａにおいて優先順位が１のアノテーションを
有する遺伝子由来のサブゲノム間隔が異なる条件下で分析され、Ｘは、２、３、４、５、
１０、１５、２０、または３０に等しい。

ある実施形態において、方法は、以下のうちの１つ以上を含む：
（ｉ）方法、例えば、上述の方法の（ｂ）は、本明細書に記載のベイトセット、例えば
、表題「ベイト」もしくは「ベイトモジュール」に記載されるベイトセットの使用を含む
こと、
（ｉｉ）方法、例えば、上述の方法の（ｃ）は、一組もしくは一群のサブゲノム間隔に
ついての読み取りを本明細書に記載の遺伝子の組もしくは群から取得することを含むこと
、
（ｉｉｉ）方法、例えば、上述の方法の（ｄ）は、本明細書に記載の複数のアライメン
ト方法、例えば、表題「アライメント」もしくは「アライメントモジュール」に記載され
る方法の使用を含むこと、
（ｉｖ）方法、例えば、上述の方法の（ｅ）は、ヌクレオチド値を本明細書に記載の事
前選択されたヌクレオチド位置に割り当てるための複数の方法、例えば、表題「変異呼び
出し」もしくは「変異呼び出しモジュール」または表題「臨床癌検体の次世代配列決定由
来の体細胞ゲノム変化の高感度検出に対するベイズ手法」の項に記載される方法の使用を
含むこと、あるいは
（ｖ）方法は、ヌクレオチド値を本明細書、例えば、表題「遺伝子選択または遺伝子選
択モジュール」の項に記載の一組のサブゲノム間隔に割り当てることを含むこと。

ある実施形態において、方法は、（ｉ）、および（ｉｉ）～（ｖ）のうちの１つ、２つ
、３つ、またはすべてを含む。

ある実施形態において、方法は、（ｉｉ）、ならびに（ｉ）および（ｉｉｉ）～（ｖ）
のうちの１つ、２つ、３つ、またはすべてを含む。

ある実施形態において、方法は、（ｉｉｉ）、ならびに（ｉ）、（ｉｉ）、（ｉｖ）、
および（ｖ）のうちの１つ、２つ、３つ、またはすべてを含む。

ある実施形態において、方法は、（ｉｖ）、ならびに（ｉ）～（ｉｉｉ）および（ｖ）
のうちの１つ、２つ、３つ、またはすべてを含む。

ある実施形態において、方法は、（ｖ）、および（ｉ）～（ｉｖ）のうちの１つ、２つ
、３つ、またはすべてを含む。

アライメント

本明細書に開示の方法は、複数の個別に調整されたアライメント方法またはアルゴリズ
ムの使用を統合して、配列決定方法、具体的には、多数の様々な遺伝子における多数の様
々な遺伝的事象の大規模並列配列決定に依存する方法、例えば、腫瘍試料を分析する方法
の性能を最適化することができる。実施形態において、異なる遺伝子中のいくつかのバリ
アントのそれぞれに合わせて個別にカスタマイズまたは調整された複数のアライメント方
法を用いて、読み取りを分析する。実施形態において、調整は、配列決定される遺伝子（
または他のサブゲノム間隔）、試料中の腫瘍型、配列決定されるバリアント、または試料
もしくは対象の特性（のうちの１つ以上）の関数である。配列決定されるいくつかのサブ
ゲノム間隔に合わせて個別に調整されたアライメント条件の選択または使用は、速度、感
度、および特異性の最適化を可能にする。この方法は、比較的多数の様々なサブゲノム間
隔についての読み取りのアライメントが最適化されるときに特に効果的である。

したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
（ｂ）任意で、例えば、ライブラリをベイトセット（または複数のベイトセット）と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
（本明細書でライブラリ捕獲物と称される場合もある）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りをアライメント方法、例えば、本明細書に記載のアライメント方法を
用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対して該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法を用いて、例えば、変異を呼び出す）ことと、を含み
それによって、該腫瘍試料を分析し、

Ｘ個の一意のサブゲノム間隔のそれぞれからの読み取りは、一意のアライメント方法で
アライメントされ、一意のサブゲノム間隔とは、他のＸ－１個のサブゲノム間隔とは異な
ることを意味し、一意のアライメント方法とは、他のＸ－１個のアライメント方法とは異
なることを意味し、Ｘは、少なくとも２である。

ある実施形態において、ステップ（ｂ）が存在する。ある実施形態において、ステップ
（ｂ）が欠如する。
ある実施形態において、Ｘは、少なくとも３、４、５、１０、１５、２０、３０、５０
、１００、５００、または１，０００である。
ある実施形態において、少なくともＸ個の遺伝子、例えば、表１および表１Ａの少なく
ともＸ個の遺伝子、例えば、表１および表１Ａにおいて優先順位が１のアノテーションを
有する遺伝子由来のサブゲノム間隔は、一意のアライメント方法でアライメントされ、Ｘ
は、２、３、４、５、１０、１５、２０、または３０に等しい。

ある実施形態において、方法（例えば、上述の方法の要素（ｄ））は、読み取りを分析
するため、例えば、アライメントするためのアライメント方法を選択もしくは使用するこ
とを含み、
該アライメント方法は、以下のうちの１つ以上もしくはすべての関数であるか、それら
に応答して選択されるか、またはそれらのために最適化される：
（ｉ）腫瘍型、例えば、該試料中の腫瘍型、
（ｉｉ）配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、
事前選択されたバリアントもしくはバリアントの種類、例えば、変異、または事前選択さ
れた頻度の変異を特徴とする遺伝子もしくは遺伝子型、
（ｉｉｉ）分析される部位（例えば、ヌクレオチド位置）、
（ｉｖ）評価されるサブゲノム間隔内のバリアントの種類、例えば、置換、
（ｖ）試料の種類、例えば、ＦＦＰＥ試料、および
（ｖｉ）評価される該サブゲノム間隔における配列もしくはその付近の配列、例えば、
該サブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における
反復配列またはその付近の反復配列の存在。

本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔につい
ての読み取りのアライメントが最適化されるときに特に効果的である。したがって、ある
実施形態において、少なくともＸ個の一意のアライメント方法を用いて、少なくともＸ個
の一意のサブゲノム間隔についての読み取りを分析し、一意とは、他のＸ－１とは異なる
ことを意味し、Ｘは、２、３、４、５、１０、１５、２０、３０、５０、１００、５００
、または１，０００に相当する。

ある実施形態において、例えば、表１および表１Ａにおいて優先順位が１のアノテーシ
ョンを有する表１および表１Ａの少なくともＸ個の遺伝子由来のサブゲノム間隔が分析さ
れ、Ｘは、２、３、４、５、１０、１５、２０、または３０に相当する。

ある実施形態において、一意のアライメント方法は、少なくとも３、５、１０、２０、
４０、５０、６０、７０、８０、９０、または１００個の異なる遺伝子のそれぞれにおけ
るサブゲノム間隔に適用される。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０、または１８０個の遺伝子、例えば、表１および表１Ａの遺伝子におけるヌクレ
オチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意のアライ
メント方法は、少なくとも１０、２０、３０、４０、または５０％の分析される該遺伝子
のそれぞれにおけるサブゲノム間隔に適用される。

本明細書に開示の方法は、厄介な読み取り、例えば、再編成を有する読み取りの迅速か
つ効率的なアライメントを可能にする。したがって、サブゲノム間隔についての読み取り
が再編成、例えば、インデルを有するヌクレオチド位置を含む実施形態において、方法は
、適切に調整されるアライメント方法の使用を含んでもよく、
事前選択された再編成とアライメントするために事前選択される再編成参照配列を読み
取りとのアライメントのために選択することと（実施形態において、参照配列はゲノム再
編成と同一ではない）、
読み取りを該事前選択された再編成参照配列と比較する、例えば、アライメントするこ
とを含む。

実施形態において、他の方法を用いて、厄介な読み取りをアライメントする。これらの
方法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライメントが最適化
されるときに特に効果的である。例として、腫瘍試料を分析する方法は、
第１の組のパラメータ下で（例えば、第１のマッピングアルゴリズムまたは第１の参照
配列との）読み取りの比較、例えば、アライメント比較を行うことと、該読み取りが第１
の所定のアライメント基準を満たす（例えば、読み取りが、例えば、事前選択された数未
満のミスマッチで、該第１の参照配列とアライメントされ得る）かを決定することと、
該読み取りが第１の所定のアライメント基準を満たすことができない場合、第２の組のパ
ラメータ下で（例えば、第２のマッピングアルゴリズムまたは第２の参照配列との）第２
のアライメント比較を行うことと、
任意で、該読み取りが該第２の所定の基準を満たす（例えば、読み取りが事前選択された
数未満のミスマッチで該第２の参照配列とアライメントされ得る）かを決定することとを
含んでもよく、
該第２の組のパラメータは、一組のパラメータ、例えば、該第１の組のパラメータと比較
して、事前選択されたバリアント、例えば、再編成、例えば、挿入、欠失、または転座に
ついての読み取りとのアライメントをもたらす見込みがより高い該第２の参照配列の使用
を含む。

これらおよび他のアライメント方法は、本明細書の他の箇所、例えば、表題「アライメ
ントモジュール」の項でさらに詳細に論じられる。そのモジュールの要素を、腫瘍を分析
する方法に含んでもよい。実施形態において、「アライメントモジュール」のアライメン
ト方法は、「変異呼び出しモジュール」の変異呼び出し方法および／または「ベイトモジ
ュール」のベイトセットと組み合わせられる。この方法を、「遺伝子選択モジュール」の
サブゲノム間隔の組に適用してもよい。
変異呼び出し

本明細書に開示の方法は、配列決定方法、特に、例えば、腫瘍試料由来の多数の様々な
遺伝子における多数の様々な遺伝的事象の大規模並列配列決定に依存する方法の性能を最
適化するようにカスタマイズまたは調整された変異呼び出しパラメータの使用を統合する
ことができる。本方法の実施形態において、いくつかの事前選択されたサブゲノム間隔の
それぞれの変異呼び出しは、個別にカスタマイズまたは微調整される。カスタマイゼーシ
ョンまたは調整は、本明細書に記載の要因、例えば、試料中の癌型、配列決定されるサブ
ゲノム間隔が位置する遺伝子、または配列決定されるバリアントのうちの１つ以上に基づ
き得る。配列決定されるいくつかのサブゲノム間隔に合わせて微調整されたこのアライメ
ント条件の選択または使用は、速度、感度、および特異性の最適化を可能にする。この方
法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライメントが最適化さ
れるときに特に効果的である。

したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを試料、例えば、腫瘍試料から取得することと、
（ｂ）任意で、例えば、ライブラリをベイトセット（または複数のベイトセット）と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
、例えば、ライブラリ捕獲物を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法または本明細書に記載の呼び出し方法を用いて、例えば、
変異を呼び出す）ことと、を含み、
それによって、該腫瘍試料を分析し、
Ｘ個の一意のサブゲノム間隔のそれぞれにおいてヌクレオチド位置に対して割り当てら
れるヌクレオチド値は、一意の呼び出し方法によって割り当てられ、一意のサブゲノム間
隔とは、他のＸ－１個のサブゲノム間隔とは異なることを意味し、一意の呼び出し方法と
は、他のＸ－１個の呼び出し方法とは異なることを意味し、Ｘは、少なくとも２である。
呼び出し方法は、例えば、異なるベイズ先行値に依存するという点で異なり、したがって
、一意であり得る。

ある実施形態において、該ヌクレオチド値の割り当ては、腫瘍型における該事前選択さ
れたヌクレオチド位置で事前選択されたバリアント、例えば、変異を示す読み取りを観察
する先行（例えば、文献）予想であるか、またはそれを表す値の関数である。

ある実施形態において、方法は、少なくとも１０、２０、４０、５０、６０、７０、８
０、９０、または１００個の事前選択されたヌクレオチド位置に対するヌクレオチド値を
割り当てる（例えば、変異を呼び出す）ことを含み、それぞれの割り当ては、腫瘍型にお
ける該事前選択されたヌクレオチド位置で事前選択されたバリアント、例えば、変異を示
す読み取りを観察する先行（例えば、文献）予想であるか、またはそれを表す（他の割り
当ての値ではなく）一意の値の関数である。

ある実施形態において、該ヌクレオチド値の割り当ては、バリアントがある頻度で（例
えば、１％、５％、１０％等）試料中に存在する場合、および／またはバリアントが不在
である（例えば、塩基呼び出しエラーのみによる読み取りにおいて観察される）場合、該
事前選択されたヌクレオチド位置で該事前選択されたバリアントを示す読み取りを観察す
る確率を表す一組の値の関数である。

ある実施形態において、方法（例えば、上述の方法の要素（ｅ））は、変異呼び出し方
法を含む。本明細書に記載の変異呼び出し方法は、以下を含むことができる：
該Ｘ個のサブゲノム間隔のそれぞれにおける事前選択されたヌクレオチド位置に対して
、
（ｉ）腫瘍型Ｘにおける該事前選択されたヌクレオチド位置で事前選択されたバリアント
、例えば、変異を示す読み取りを観察する先行（例えば、文献）予想であるか、またはそ
れを表す第１の値、
（ｉｉ）バリアントがある頻度で（例えば、１％、５％、１０％等）試料中に存在する場
合、および／またはバリアントが不在である（例えば、塩基呼び出しエラーのみによって
読み取りにおいて観察される）場合、該事前選択されたヌクレオチド位置で該事前選択さ
れたバリアントを示す読み取りを観察する確率を表す第２の一組の値、
を取得することと、
該値に応答して、例えば、本明細書に記載のベイズ方法によって、第１の値を用いて第
２の組の値の間の比較を検討する（例えば、変異の存在の事後確率を算出する）ことによ
って、該事前選択されたヌクレオチド位置のそれぞれに対する該読み取りからのヌクレオ
チド値を割り当て（例えば、変異を呼び出す）、それによって、該試料を分析すること。

ある実施形態において、方法は、以下のうちの１つ以上もしくはすべてを含む：
（ｉ）少なくとも１０、２０、４０、５０、６０、７０、８０、９０、または１００個の
事前選択されたヌクレオチド位置に対するクレオチド値を割り当てる（例えば、変異を呼
び出す）こと（この場合において、それぞれの割り当ては、（他の割り当てではなく）一
意の第１および／または第２の値に基づく）、
（ｉｉ）（ｉ）の方法の割り当てであって、少なくとも１０、２０、３０、もしくは４０
個の割り当ては、例えば、事前選択された腫瘍型の細胞の５、１０、または２０％未満に
存在する事前選択されたバリアントの確率の関数である第１の値を用いて行われること、
（ｉｉｉ）割り当てがそれぞれ事前選択された腫瘍型、例えば、該試料の腫瘍型に存在す
る（他のＸ－１個の割り当てではなく）一意の確率を有する事前選択されたバリアントに
関連する、少なくともＸ個の事前選択されたヌクレオチド位置に対するヌクレオチド値を
割り当てる（例えば、変異を呼び出す）こと（この場合において、任意で、それぞれの該
Ｘ個の割り当ては、（他のＸ－１個の割り当てではなく）一意の第１および／または第２
の値（Ｘ＝２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、もしくは１
００）に基づく）、
（ｉｖ）ヌクレオチド値を第１および第２のヌクレオチド位置で割り当てる（例えば、変
異を呼び出す）ことであって、該第１のヌクレオチド位置における第１の事前選択された
バリアントが事前選択された腫瘍型（例えば、該試料の腫瘍型）に存在する可能性が、該
第２のヌクレオチド位置での第２の事前選択されたバリアントが存在する可能性よりも少
なくとも２、５、１０、２０、３０、または４０倍大きく、任意で、それぞれの割り当て
は、（他の割り当てではなく）一意の第１および／または第２の値に基づくこと、
（ｖ）ヌクレオチド値を複数の事前選択されたヌクレオチド位置に割り当てる（例えば、
変異を呼び出す）ことであって、該複数の事前選択されたヌクレオチド位置は、以下の確
率範囲：
．０１未満、．０１～．０２未満、
０．０２より大きく０．０３以下、
０．０３より大きく０．０４以下、
０．０４より大きく０．０５以下、
０．０５より大きく０．１以下、
０．１より大きく０．２以下、
０．２より大きく０．５以下、
０．５より大きく１．０以下、
１．０より大きく２．０以下、
２．０より大きく５．０以下、
５．０より大きく１０．０以下、
１０．０より大きく２０．０以下、
２０．０より大きく５０．０以下、ならびに
５０より大きく１００．０％以下
のうちの１つ以上、例えば、少なくとも３、４、５、６、７つ、もしくはすべてに分類さ
れるバリアントの割り当てを含み、
確率範囲は、事前選択されたヌクレオチド位置における事前選択されたバリアントが、事
前選択された腫瘍型（例えば、該試料の腫瘍型）に存在する確率の範囲であるか、または
事前選択されたヌクレオチド位置における事前選択されたバリアントが、事前選択された
型（例えば、該試料の腫瘍型）の腫瘍試料、腫瘍試料由来のライブラリ、またはそのライ
ブラリ由来のライブラリ捕獲物中の列挙された％の細胞に存在する確率であり、
任意で、それぞれの割り当ては、一意の第１および／もしくは第２の値に基づく（例えば
、列挙された確率範囲の他の割り当てではなく一意であるか、または他の列記された確率
範囲のうちの１つ以上もしくはすべての第１および／もしく第２の値とは対照的に一意で
ある）こと、
（ｖｉ）それぞれ独立して、該試料中のＤＮＡの５０、４０、２５、２０、１５、１０、
５、４、３、２、１、０．５、０．４、０．３、０．２、または０．１％未満に存在する
事前選択されたバリアントを有する少なくとも１、２、３、５、１０、２０、４０、５０
、６０、７０、８０、９０、または１００個の事前選択されたヌクレオチド位置に対する
ヌクレオチド値を割り当てる（例えば、変異を呼び出す）こと（この場合において、任意
で、それぞれの割り当ては、（他の割り当てではなく）一意の第１および／または第２の
値に基づく）、
（ｖｉｉ）ヌクレオチド値を第１および第２のヌクレオチド位置で割り当てる（例えば、
変異を呼び出す）ことであって、該試料のＤＮＡにおける第１の位置での事前選択された
バリアントの可能性は、該試料のＤＮＡにおける該第２のヌクレオチド位置での事前選択
されたバリアントの可能性よりも少なくとも２、５、１０、２０、３０、または４０倍大
きく、任意で、それぞれの割り当ては、（他の割り当てではなく）一意の第１および／ま
たは第２の値に基づくこと、
（ｖｉｉｉ）ヌクレオチド値を以下のうちの１つ以上もしくはすべてにおいて割り当てる
（例えば、変異を呼び出す）こと、
（１）該試料由来のライブラリにおける核酸、またはライブラリ由来のライブラリ捕獲物
における核酸の該試料の細胞の１．０％未満に存在する事前選択されたバリアントを有す
る少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置、
（２）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の１．０～２．０％に存在する事前選択されたバリアン
トを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置
、
（３）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の２．０％より大きく３％以下に存在する事前選択され
たバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレ
オチド位置、
（４）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の３．０％より大きく４％以下に存在する事前選択され
たバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレ
オチド位置、
（５）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の４．０％より大きく５％以下に存在する事前選択され
たバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレ
オチド位置、
（６）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の５．０％より大きく１０％以下に存在する事前選択さ
れたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌク
レオチド位置、
（７）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の１０．０％より大きく２０％以下に存在する事前選択
されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌ
クレオチド位置、
（８）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の２０．０％より大きく４０％以下に存在する事前選択
されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌ
クレオチド位置、
（９）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の４０．０％より大きく５０％以下に存在する事前選択
されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌ
クレオチド位置、あるいは
（１０）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ
捕獲物における核酸の該試料の細胞の５０．０％より大きく１００％以下に存在する事前
選択されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択され
たヌクレオチド位置、
（この場合において、任意で、それぞれの割り当ては、一意の第１および／または第２の
値に基づく（例えば、列挙された範囲（例えば、１％未満の（ｉ）の範囲）の他の割り当
てではなく一意であるか、または他の列記された範囲のうちの１つ以上もしくはすべてに
おける決定のために、第１および／または第２の値ではなく一意である））、あるいは
（ｉｘ）ヌクレオチド値をＸ個のヌクレオチド位置のそれぞれに割り当てる（例えば、変
異を呼び出す）ことであって、それぞれのヌクレオチド位置は、独立して、他のＸ－１個
のヌクレオチド位置での事前選択されたバリアントの可能性と比較して一意の（該試料の
ＤＮＡに存在する事前選択されたバリアントの）可能性を有し、Ｘは、１、２、３、５、
１０、２０、４０、５０、６０、７０、８０、９０、もしくは１００以上であり、それぞ
れの割り当ては、（他の割り当てではなく）一意の第１および／または第２の値に基づく
こと。

本方法の実施形態において、「閾値」を用いて、読み取りを評価し、読み取りからヌク
レオチド位置の値を選択する、例えば、遺伝子の特定の位置での変異を呼び出す。本方法
の実施形態において、いくつかの事前選択されたサブゲノム間隔のそれぞれの閾値は、カ
スタマイズまたは微調整される。カスタマイゼーションまたは調整は、本明細書に記載の
要因、例えば、試料中の癌型、配列決定されるサブゲノム間隔が位置する遺伝子、または
配列決定されるバリアントのうちの１つ以上に基づき得る。これは、配列決定されるいく
つかのサブゲノム間隔それぞれに対して微調整される呼び出しを提供する。この方法は、
比較的多数の様々なサブゲノム間隔が分析されるときに特に効果的である。

したがって、別の実施形態では、腫瘍を分析する方法は、以下の変異呼び出し方法を含
む：
該Ｘ個のサブゲノム間隔のそれぞれについての閾値を取得し（該取得されたＸ個の閾値
がそれぞれ他のＸ－１個の閾値と比較して一意である）、それによって、一意のＸ個の閾
値を提供することと、
該Ｘ個のサブゲノム間隔のそれぞれについて、事前選択されたヌクレオチド位置におい
て事前選択されたヌクレオチド値を有する読み取りの数の関数である観察された値をその
一意の閾値と比較し、それによって、その一意の閾値を該Ｘ個のサブゲノム間隔のそれぞ
れに適用することと、
任意で、該比較の結果に応答して、ヌクレオチド値を事前選択されたヌクレオチド位置
に割り当てること。
式中、Ｘは、２以上である。

ある実施形態において、方法は、ヌクレオチド値を少なくとも２、３、５、１０、２０
、４０、５０、６０、７０、８０、９０、または１００個の事前選択されたヌクレオチド
位置で割り当てることを含み、それぞれ独立して、０．５、０．４、０．２５、０．１５
、０．１０、０．０５、０．０４、０．０３、０．０２、または０．０１未満の確率の関
数である第１の値を有する。

ある実施形態において、方法は、ヌクレオチド値を少なくともＸ個のヌクレオチド位置
のそれぞれで割り当てることを含み、それぞれの独立して、他の第１のＸ－１個の値と比
較して一意の第１の値を有し、該第１のＸ個の値はそれぞれ、０．５、０．４、０．２５
、０．１５、０．１０、０．０５、０．０４、０．０３、０．０２、または０．０１未満
の確率の関数であり、
Ｘは、１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、または１０
０以上である。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０、もしくは１８０個の遺伝子、例えば、表１の遺伝子におけるヌクレオチド位置
に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の第１および／また
は第２の値が、少なくとも１０、２０、３０、４０、もしくは５０％の分析される該遺伝
子のそれぞれにおけるサブゲノム間隔に適用される。

本方法の実施形態は、例えば、以下の実施形態から見られるように、比較的多数のサブ
ゲノム間隔の閾値が最適化される場合に適用され得る。

ある実施形態において、一意の閾値が、少なくとも３、５、１０、２０、４０、５０、
６０、７０、８０、９０、または１００個の異なる遺伝子のそれぞれにおけるサブゲノム
間隔に適用される。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０または１８０個の遺伝子、例えば、表１の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾値は、少なくとも１
０、２０、３０、４０、または５０％の分析される該遺伝子のそれぞれにおけるサブゲノ
ム間隔に適用される。

ある実施形態において、優先順位が１のアノテーションを有する表１の少なくとも５、
１０、２０、３０、または４０個の遺伝子におけるヌクレオチド位置に、ヌクレオチド値
が割り当てられる。ある実施形態において、一意の閾値は、少なくとも１０、２０、３０
、４０、または５０％の分析される該遺伝子のそれぞれにおけるサブゲノム間隔に適用さ
れる。

これらのおよび他の変異呼び出し方法は、本明細書の他の箇所で、例えば、表題「変異
呼び出しモジュール」の項において、さらに詳細に論じられる。そのモジュールの要素を
、腫瘍を分析する方法に含んでもよい。実施形態において、「変異呼び出しモジュール」
のアライメント方法は、「アライメントモジュール」のアライメント方法および／または
「ベイトモジュール」のベイトセットと組み合わせられる。この方法を、「遺伝子選択モ
ジュール」の一組のサブゲノム間隔に適用することができる。
ベイト

本明細書に記載の方法は、配列決定される標的核酸の選択のために、ベイト、例えば、
溶液ハイブリダイゼーション用のベイトの適切な選択によって、１つ以上の対象由来の試
料、例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物の最適化された配列決定を提
供する。様々なサブゲノム間隔またはそのクラスの選択効率は、事前選択された選択効率
を有するベイトセットに従って適合される。この項で使用される「選択効率」は、標的サ
ブゲノム間隔（複数を含む）に従って調節されるときの配列の対象範囲のレベルまたは深
度を指す。

したがって、方法（例えば、上述の方法の要素（ｂ））は、ライブラリを複数のベイト
と接触させて選択されたメンバー（例えば、ライブラリ捕獲物）を提供することを含む。

したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
（ａ）複数のメンバー（例えば、標的メンバー）を含むライブラリを試料から、例えば
、複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
（ｂ）ライブラリをベイトセットと接触させて選択されたメンバー（例えば、ライブラ
リ捕獲物）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りをアライメント方法、例えば、本明細書に記載のアライメント方法を
用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す）ことと、を含み、
それによって、該腫瘍試料を分析し、
この方法は、ライブラリを複数の、例えば、少なくとも２つ、３つ、４つ、または５つの
ベイトまたはベイトセットと接触させることを含み、該複数のそれぞれのベイトまたはベ
イトセットは、（複数のベイトセットのうちの他のベイトセットとではなく）一意の事前
選択された選択効率を有する。例えば、それぞれの一意のベイトまたはベイトセットは、
一意の配列決定深度を提供する。本明細書で使用される「ベイトセット」という用語は、
集合的に、１つのベイトまたは複数のベイト分子を指す。

ある実施形態において、複数のベイトセットのうちの第１のベイトセットの選択効率は
、複数のベイトセットのうちの第２のベイトセットの効率とは少なくとも２倍異なる。あ
る実施形態において、第１および第２のベイトセットは、少なくとも２倍異なる配列決定
深度を提供する。

ある実施形態において、方法は、以下のベイトセットのうちの１つもしくは複数をライ
ブラリと接触させることを含む：
ａ）約５００倍以上の配列決定深度を提供する、例えば、試料由来の５％を超えない細
胞に存在する変異を配列決定するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット、
ｂ）約２００倍以上、例えば、約２００倍～約５００倍の配列決定深度を提供する、例
えば、試料由来の１０％を超えない細胞に存在する変異を配列決定するのに十分な数のサ
ブゲノム間隔を含むメンバーを選択するベイトセット、
ｃ）約１０～１００倍の配列決定深度を提供する、例えば、ａ）異なる薬物を代謝する
患者の能力を説明し得る薬理ゲノム（ＰＧｘ）単一ヌクレオチド多型（ＳＮＰ）、または
ｂ）患者を一意に特定する（例えば、フィンガープリントする）ために使用され得るゲノ
ムＳＮＰから選択される１つ以上のサブゲノム間隔（例えば、エクソン）を配列決定する
のに十分な数のサブゲノム間隔を含むメンバーを選択するベイトセット、
ｄ）約５～５０倍の配列決定深度を提供する、例えば、ゲノム転座またはインデル等の
構造ブレークポイントを検出するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット（例えば、イントロンブレークポイントの検出は、高い検出信頼性を確保
するために、５～５０倍の配列対スパン深度を必要とし、そのようなベイトセットを用い
て、例えば、転座／インデルの傾向のある癌遺伝子を検出することができる）、または
ｅ）約０．１～３００倍の配列決定深度を提供する、例えば、コピー数の変化を検出す
るのに十分な数のサブゲノム間隔を含むメンバーを選択するベイトセット。一実施形態に
おいて、配列決定深度は、コピー数の変化を検出するために、約０．１～１０倍の配列決
定深度の範囲である。他の実施形態では、配列決定深度は、ゲノムＤＮＡのコピー数獲得
／喪失またはヘテロ接合性の消失（ＬＯＨ）を評価するために使用されるゲノムＳＮＰ／
遺伝子座を検出するために、約１００～３００倍の範囲である。そのようなベイトセット
を用いて、例えば、増幅／欠失の傾向のある癌遺伝子を検出することができる。

本明細書で使用される配列決定深度のレベル（例えば、配列決定深度のＸ倍のレベル）
は、重複読み取り、例えば、ＰＣＲ重複読み取りの検出および除去後の読み取り（例えば
、一意の読み取り）の対象範囲のレベルを指す。

一実施形態において、ベイトセットは、１つ以上の再編成を含有するサブゲノム間隔、
例えば、ゲノム再編成を含有するイントロンを選択する。そのような実施形態において、
ベイトセットは、反復配列がマスクされて選択効率を増加させるように設計される。再編
成が既知の接合配列を有する実施形態では、接合配列に対して相補的なベイトセットは、
選択効率を増加させるように設計されてもよい。

実施形態において、方法は、それぞれが異なるベイト設計戦略を有する２つ以上の異な
る標的カテゴリーを捕捉するように設計されるベイトの使用を含む。実施形態において、
本明細書に開示のハイブリッド捕捉方法および組成物は、標的配列（例えば、標的メンバ
ー）の定義されたサブセットの外側の対象範囲を最小限に抑えながら、そのサブセットを
捕捉し、標的配列の均一な対象範囲を提供する。一実施形態において、標的配列は、ゲノ
ムＤＮＡからの全エクソーム、またはその選択されたサブセットを含む。本明細書に開示
の方法および組成物は、複合標的核酸配列（例えば、核酸ライブラリ）の異なる深度およ
びパターンの対象範囲を達成するために、異なるベイトセットを提供する。

ある実施形態において、方法は、核酸ライブラリ（例えば、ライブラリ捕獲物）の選択
されたメンバーを提供することを含む。その方法は、
複数のメンバー、例えば、標的核酸メンバー（例えば、複数の腫瘍メンバー、参照メン
バー、および／またはＰＧｘメンバーを含む）を含むライブラリ（例えば、核酸ライブラ
リ）を提供することと、
ライブラリを、例えば、溶液ベースの反応において、複数のベイト（例えば、オリゴヌ
クレオチドベイト）と接触させて、複数のベイト／メンバーハイブリッドを含むハイブリ
ダイゼーション混合物を形成することと、
複数のベイト／メンバーハイブリッドを、例えば、該ハイブリダイゼーション混合物を
、該複数のベイト／メンバーハイブリッドの分離を可能にする結合実体と接触させること
によって、該ハイブリダイゼーション混合物から分離することと、を含み、
それによって、ライブラリ捕獲物（例えば、ライブラリ由来の核酸分子の選択または強化
されたサブグループ）を提供し、
複数のベイトは、以下のうちの２つ以上を含む：
ａ）低頻度、例えば、約５％（すなわち、それらのゲノムにおける変化を持つ試料由来
の細胞の５％）以下で出現する変化（例えば、１つ以上の変異）に対する高レベルの感度
を可能にするために最深の対象範囲が要求される、高レベルの標的（例えば、遺伝子、エ
クソン、または塩基等のサブゲノム間隔を含む１つ以上の腫瘍メンバー）を選択する第１
のベイトセット（一実施形態において、第１のベイトセットは、約５００倍以上の配列決
定深度を必要とする変化（例えば、点変異）を含む腫瘍メンバーを選択する（例えば、そ
れに相補的である））、
ｂ）ａ）における高レベルの標的よりも高い頻度、例えば、約１０％（すなわち、それ
らのゲノムにおける変化を持つ試料由来の細胞の１０％）の頻度で出現する変化（例えば
、１つ以上の変異）に対する高レベルの感度を可能にするために高い対象範囲が要求され
る、中間レベルの標的（例えば、遺伝子、エクソン、または塩基等のサブゲノム間隔を含
む１つ以上の腫瘍メンバー）を選択する第２のベイトセット（一実施形態において、第２
のベイトセットは、約２００倍以上の配列決定深度を必要とする変化（例えば、点変異）
を含む腫瘍メンバーを選択する（例えば、それに相補的である））、
ｃ）高レベルの感度を可能にするために、例えば、ヘテロ接合体対立遺伝子を検出する
ために低～中程度の対象範囲が要求される、低レベルの標的（例えば、遺伝子、エクソン
、または塩基等のサブゲノム間隔を含む１つ以上のＰＧｘメンバー）を選択する第３のベ
イトセット（例えば、ヘテロ接合体対立遺伝子の検出は、高い検出信頼性を確保するため
に、１０～１００倍の配列決定深度を必要とする。一実施形態において、第３のベイトセ
ットは、以下のうちの２つ以上を含む：ａ）異なる薬物を代謝する患者の能力を説明し得
る薬理ゲノム（ＰＧｘ）単一ヌクレオチド多型（ＳＮＰ）、またはｂ）患者を一意に特定
する（例えば、フィンガープリントする）ために使用され得るゲノムＳＮＰから選択され
る１つ以上のサブゲノム間隔（例えば、エクソン）を選択する）、
ｄ）例えば、ゲノム転座またはインデル等の構造ブレークポイントを検出するために低
～中程度の対象範囲が要求される、第１のイントロン標的（例えば、イントロン配列を含
むメンバー）を選択する第４のベイトセット（例えば、イントロンブレークポイントの検
出は、高い検出信頼性を確保するために、５～５０倍の配列対スパン深度を必要とする。
該第４のベイトセットを用いて、例えば、転座／インデルの傾向のある癌遺伝子を検出す
ることができる）、または
ｅ）コピー数の変化を検出する能力を改善するために密でない対象範囲が要求される、
第２のイントロン標的（例えば、イントロンメンバー）を選択する第５のベイトセット（
例えば、いくつかの末端エクソンの１コピー欠失の検出は、高い検出信頼性を確保するた
めに、０．１～３００倍の対象範囲を必要とする。一実施形態において、コピー数の変化
を検出するための対象範囲深度は、約０．１～１０倍の範囲である。他の実施形態では、
ゲノムＤＮＡのコピー数獲得／喪失またはヘテロ接合性の消失（ＬＯＨ）を評価するため
に使用されるゲノムＳＮＰ／遺伝子座を検出するための対象範囲深度は、約１００～３０
０倍の範囲である。該第５のベイトセットを用いて、例えば、増幅／欠失の傾向のある癌
遺伝子を検出することができる）。

前述のベイトセットのうちの２つ、３つ、４つ、またはそれ以上の任意の組み合わせ、
例えば、第１および第２のベイトセット；第１および第３のベイトセット；第１および第
４のベイトセット；第１および第５のベイトセット；第２および第３のベイトセット；第
２および第４のベイトセット；第２および第５のベイトセット；第３および第４のベイト
セット；第３および第５のベイトセット；第４および第５のベイトセット；第１、第２、
および第３のベイトセット；第１、第２、および第４のベイトセット；第１、第２、およ
び第５のベイトセット；第１、第２、第３、第４のベイトセット；第１、第２、第３、第
４、および第５のベイトセット等の組み合わせを用いることができる。

一実施形態において、第１、第２、第３、第４、または第５のベイトセットはそれぞれ
、事前選択された選択（例えば、捕捉）効率を有する。一実施形態において、選択効率の
値は、ａ）～ｅ）に従って、５つすべてのベイトのうちの少なくとも２つ、３つ、４つに
おいて同一である。他の実施形態では、選択効率の値は、ａ）～ｅ）に従って、５つすべ
てのベイトのうちの少なくとも２つ、３つ、４つにおいて異なる。

いくつかの実施形態では、少なくとも２つ、３つ、４つ、または５つすべてのベイトセ
ットは、事前選択された異なる効率値を有する。例えば、選択効率値は、のうちの１つ以
上から選択される：
（ｉ）第１の事前選択された効率が、少なくとも約５００倍以上の配列決定深度である
第１の選択効率値を有する（例えば、第２、第３、第４、もしくは第５の事前選択された
選択効率よりも大きい（例えば、第２の選択効率値よりも約２～３倍大きく、第３の選択
効率値よりも約５～６倍大きく、第４の選択効率値よりも約１０倍大きく、第５の選択効
率値よりも約５０～５０００倍大きい）選択効率値を有する）。
（ｉｉ）第２の事前選択された効率が、少なくとも約２００倍以上の配列決定深度であ
る第２の選択効率値を有する（例えば、第３、第４、もしくは第５の事前選択された選択
効率よりも大きい（例えば、第３の選択効率値よりも約２倍大きく、第４の選択効率値よ
りも約４倍大きく、第５の選択効率値よりも約２０～２０００倍大きい）選択効率値を有
する）。
（ｉｉｉ）第３の事前選択された効率が、少なくとも約１００倍以上の配列決定深度で
ある第３の選択効率値を有する（例えば、第４もしくは第５の事前選択された選択効率よ
りも大きい（例えば、第４の選択効率値よりも約２倍大きく、第５の選択効率値よりも約
１０～１０００倍大きい）選択効率値を有する）。
（ｉｖ）第４の事前選択された効率が、少なくとも約５０倍以上の配列決定深度である
第４の選択効率値を有する（例えば、第５の事前選択された選択効率よりも大きい（例え
ば、第５の選択効率値よりも約５０～５００倍大きい）選択効率値を有する）。または、
（ｖ）第５の事前選択された効率が、少なくとも約１０～０．１倍の配列決定深度であ
る第５の選択効率値を有する。

ある特定の実施形態において、選択効率値は、異なるベイトセットの差次的表示、ベイ
トサブセットの差次的オーバーラップ、差次的ベイトパラメータ、異なるベイトセットの
混合、および／または異なる種類のベイトセットの使用のうちの１つ以上によって修正さ
れる。例えば、選択効率（例えば、それぞれのベイトセット／標的カテゴリーの相対配列
対象範囲）の変化を、以下のうちの１つ以上を変化させることによって調節することがで
きる：
（ｉ）異なるベイトセットの差次的表示：所与の標的（例えば、標的メンバー）を捕捉
するためのベイトセット設計をより多い／より少ない数のコピーに含んで、相対的な標的
の対象範囲深度を強化する／減少させることができる。
（ｉｉ）ベイトサブセットの差次的オーバーラップ：所与の標的（例えば、標的メンバ
ー）を捕捉するためのベイトセット設計に、隣接ベイト間により長いか、またはより短い
オーバーラップを含ませて、相対的な標的の対象範囲を強化する／減少させることができ
る。
（ｉｉｉ）差次的ベイトパラメータ：所与の標的（例えば、標的メンバー）を捕捉する
ためのベイトセット設計に、配列修正／より短い長さを含ませて、捕捉効率を減少させ、
かつ相対的な標的の対象範囲を低下させることができる。
（ｉｖ）異なるベイトセットの混合：異なる標的セットを捕捉するように設計されるベ
イトセットを異なるモル比で混合して、相対的な標的の対象範囲深度を強化する／減少さ
せることができる。
（ｖ）異なる種類のオリゴヌクレオチドベイトセットの使用：ある特定の実施形態にお
いて、ベイトセットは、以下のものを含んでもよい：
（ａ）１つ以上の化学的に（例えば、非酵素的に）合成された（例えば、個別に合成さ
れた）ベイト、
（ｂ）アレイで合成された１つ以上のベイト、
（ｃ）１つ以上の酵素的に調製された、例えば、生体外で転写されたベイト、
（ｄ）（ａ）、（ｂ）、および／もしくは（ｃ）の任意の組み合わせ、
（ｅ）１つ以上のＤＮＡオリゴヌクレオチド（例えば、自然発生もしくは非自然発生の
ＤＮＡオリゴヌクレオチド）、
（ｆ）１つ以上のＲＮＡオリゴヌクレオチド（例えば、自然発生もしくは非自然発生の
ＲＮＡオリゴヌクレオチド）、
（ｇ）（ｅ）および（ｆ）の組み合わせ、または
（ｈ）上記のうちのいずれかの組み合わせ。

異なるオリゴヌクレオチドの組み合わせを異なる比率、例えば、１：１、１：２、１：
３、１：４、１：５、１：１０、１：２０、１：５０、１：１００、１：１０００等から
選択される比率で混合してもよい。一実施形態において、化学的に合成されたベイトとア
レイで生成されたベイトの比率は、１：５、１：１０、または１：２０から選択される。
ＤＮＡまたはＲＮＡオリゴヌクレオチドは、自然発生または非自然発生であり得る。ある
特定の実施形態において、ベイトは、例えば、融解温度を増加させるために、１つ以上の
非自然発生のヌクレオチドを含む。例となる非自然発生のオリゴヌクレオチドは、修飾さ
れたＤＮＡまたはＲＮＡヌクレオチドを含む。例となる修飾されたヌクレオチド（例えば
、修飾されたＲＮＡまたはＤＮＡヌクレオチド）は、ＬＮＡヌクレオチドのリボース部分
が２’酸素と４’炭素を結合する追加の架橋で修飾されるロックド核酸（ＬＮＡ）；ペプ
チド核酸（ＰＮＡ）、例えば、ペプチド結合によって結合された反復Ｎ－（２－アミノエ
チル）－グリシンユニットから成るＰＮＡ；低ＧＣ領域を捕捉するように修飾されたＤＮ
ＡまたはＲＮＡオリゴヌクレオチド；二環式核酸（ＢＮＡ）；架橋オリゴヌクレオチド；
修飾された５－メチルデオキシシチジン；および２，６－ジアミノプリンを含むが、これ
らに限定されない。他の修飾されたＤＮＡおよびＲＮＡヌクレオチドは、当技術分野で既
知である。

ある特定の実施形態において、実質的に均一または同様の対象範囲の標的配列（例えば
、標的メンバー）が得られる。例えば、それぞれのベイトセット／標的カテゴリー内で、
対象範囲の均一性を、ベイトパラメータを修正することによって、例えば、以下のうちの
１つ以上によって最適化することができる：
（ｉ）ベイト表示またはオーバーラップの増加／減少を用いて、同一のカテゴリー内の
他の標的と比較して不十分に／過度に対象範囲とされる標的（例えば、標的メンバー）の
対象範囲を強化する／減少させることができる。
（ｉｉ）標的配列（例えば、高ＧＣ含量配列）を捕捉するのが困難な低い対象範囲の場
合、ベイトセットで標的化される領域を拡大して、例えば、隣接配列（例えば、ＧＣが比
較的豊富ではない隣接配列）を対象範囲とする。
（ｉｉｉ）ベイト配列の修正を行って、ベイトの二次構造を減少させ、かつその選択効
率を強化することができる。
（ｉｖ）ベイト長の修正を用いて、同一のカテゴリー内の異なるベイトの融解ハイブリ
ダイゼーション動態を均等化することができる。ベイト長を直接的に（異なる長さを有す
るベイトを産生することによって）または間接的に（一貫した長さのベイトを産生し、ベ
イト末端を任意の配列に置き換えることによって）修飾することができる。
（ｖ）同一の標的領域（すなわち、順方向鎖および逆方向鎖）に対して異なる配向を有
するベイトの修正が、異なる結合効率を有し得る。それぞれの標的に最適な対象範囲を提
供するいずれかの配向を有するベイトセットを選択することができる。
（ｖｉ）それぞれのベイト上に存在する結合実体、例えば、捕捉タグ（例えば、ビオチ
ン）の量の修正が、その結合効率に影響を及ぼし得る。特定の標的を標的化するベイトの
タグレベルの増加／減少を用いて、相対標的対象範囲を強化する／減少させることができ
る。
（ｖｉｉ）異なるベイトに使用されるヌクレオチドの種類の修正を変更して、標的に対
する結合親和性に影響を及ぼし、かつ相対標的対象範囲を強化する／減少させることがで
きる。または、
（ｖｉｉｉ）例えば、より安定した塩基対合を有する修飾されたオリゴヌクレオチドベ
イトを使用して、高ＧＣ含量と比較して低いか、もしくは正常なＧＣ含量の領域間の融解
ハイブリダイゼーション動態を均等化することができる。

例えば、異なる種類のオリゴヌクレオチドベイトセットを用いることができる。

一実施形態において、選択効率値は、異なる種類のベイトオリゴヌクレオチドを用いる
ことによって修正され、事前選択された標的領域を包含する。例えば、第１のベイトセッ
ト（例えば、１０，０００～５０，０００個のＲＮＡまたはＤＮＡベイトを含むアレイベ
ースのベイトセット）を用いて、広大な標的領域（例えば、１～２ＭＢの全標的領域）を
対象範囲とすることができる。第１のベイトセットを、第２のベイトセット（例えば、５
，０００個未満のベイトを含む個別に合成されたＲＮＡまたはＤＮＡベイトセット）でス
パイクして、事前選択された標的領域（例えば、例えば、２５０ｋｂ以下の標的領域にま
たがる目的とする選択されたサブゲノム間隔）および／または高次二次構造、例えば、よ
り高いＧＣ含量を有する領域を対象範囲とすることができる。目的とする選択されたサブ
ゲノム間隔は、本明細書に記載の遺伝子もしくは遺伝子産物、またはその断片のうちの１
つ以上に対応し得る。第２のベイトセットは、所望のベイトオーバーラップに応じて、約
１～５，０００、２～５，０００、３～５，０００、１０～５，０００、１００～５，０
００、５００～５，０００、１００～５，０００、１０００～５，０００、２，０００～
５，０００個のベイトを含み得る。他の実施形態では、第２のベイトセットは、第１のベ
イトセット内にスパイクされる選択されたオリゴベイト（例えば、４００、２００、１０
０、５０、４０、３０、２０、１０、５、４、３、２または１個未満のベイト）を含み得
る。第２のベイトセットを、個別のオリゴベイトの任意の比率で混合してもよい。例えば
、第２のベイトセットは、１：１の等モル比で存在する個別のベイトを含み得る。あるい
は、第２のベイトセットは、例えば、ある特定の標的（例えば、ある特定の標的は、他の
標的と比較して５～１０倍の第２のベイトを有し得る）の捕捉を最適化するために、異な
る比率（例えば、１：５、１：１０、１：２０）で存在する個別のベイトを含み得る。

他の実施形態では、選択効率は、等モル混合物のベイトを用いるときに観察される差次
的配列捕捉効率を参照してベイトの相対存在量または結合実体の密度（例えば、ハプテン
または親和性タグ密度）を調節することによって、ある群内の個別のベイト（例えば、第
１、第２、または第３の複数のベイト）の効率を平準化し、その後、内部的に平準化され
た第２群に対して、差次的の過度の内部的に平準化された第１群を全体のベイト混合物に
導入することによって調節される。

ある実施形態において、方法は、腫瘍メンバー、例えば、腫瘍細胞由来のサブゲノム間
隔を含む核酸分子を選択するベイトセット（本明細書で「腫瘍ベイトセット」とも称され
る）を含む複数のベイトセットの使用を含む。腫瘍メンバーは、腫瘍細胞に存在する任意
のヌクレオチド配列（例えば、変異、野生型、ＰＧｘ、参照）または腫瘍もしくは癌細胞
に存在する本明細書に記載のイントロンヌクレオチド配列であり得る。一実施形態におい
て、腫瘍メンバーは、低頻度、例えば、それらのゲノムの変化を持つ腫瘍試料由来の細胞
の約５％以下で出現する変化（例えば、１つ以上の変異）を含む。他の実施形態では、腫
瘍メンバーは、腫瘍試料由来の細胞の約１０％の頻度で出現する変化（例えば、１つ以上
の変異）を含む。他の実施形態では、腫瘍メンバーは、ＰＧｘ遺伝子または遺伝子産物由
来のサブゲノム間隔、イントロン配列、例えば、本明細書に記載のイントロン配列、腫瘍
細胞に存在する参照配列を含む。

別の態様では、本発明は、本明細書に記載のベイトセット、本明細書に記載の個別のベ
イトセットの組み合わせ、例えば、本明細書に記載の組み合わせを特色とする。ベイトセ
ット（複数を含む）は、取扱説明書、標準物質、緩衝液、もしくは酵素、または他の試薬
を任意で含み得るキットの一部であってもよい。
遺伝子選択

分析のために事前選択されたサブゲノム間隔、例えば、複数の組または群の遺伝子およ
び他の領域に対する一群または一組のサブゲノム間隔が本明細書に記載される。

したがって、実施形態において、方法は、例えば、次世代配列決定方法を用いて、取得
された核酸試料由来の少なくとも５、６、７、８、９、１０、１５、２０、２５、３０個
、もしくはそれ以上の遺伝子または遺伝子産物由来のサブゲノム間隔を配列決定すること
を含み、遺伝子または遺伝子産物は、ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ
、ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮ
ＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬ
Ｔ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、
ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲ
Ａ、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、
ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦＵ、またはＴＰ５３から選択され、それに
よって、腫瘍試料を分析する。

したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
ショックとする。その方法は、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
（ｂ）任意で、例えば、ライブラリをベイトセット（または複数のベイトセット）と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
（例えば、ライブラリ捕獲物）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す）ことと、を含み、
それによって、該腫瘍試料を分析し、
該方法は、例えば、次世代配列決定方法を用いて、試料由来の少なくとも５、６、７、８
、９、１０、１５、２０、２５、３０個、もしくはそれ以上の遺伝子または遺伝子産物由
来のサブゲノム間隔を配列決定することを含み、遺伝子または遺伝子産物は、ＡＢＬ１、
ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ
４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧ
ＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、
ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ
１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１
、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦＵ
、またはＴＰ５３から選択される。

別の実施形態では、以下の組または群のうちの１つのサブゲノム間隔が分析される。例
えば、腫瘍または癌遺伝子もしくは遺伝子産物、参照（例えば、野生型）遺伝子もしくは
遺伝子産物、およびＰＧｘ遺伝子もしくは遺伝子産物に関連したサブゲノム間隔は、腫瘍
試料由来の一群または一組のサブゲノム間隔を提供することができる。

ある実施形態において、方法は、一組のサブゲノム間隔についての読み取り、例えば、
配列を腫瘍試料から取得し、サブゲノム間隔は、以下のうちの少なくとも１、２、３、４
、５、６、７、８、９、１０、１１、１２、１３、またはすべてから選択される。
Ａ）以下のうちの少なくとも５つ以上から選択される変異または野生型遺伝子もしくは
遺伝子産物由来の少なくとも５、６、７、８、９、１０、１５、２０、２５、３０個、も
しくはそれ以上のサブゲノム間隔：ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、
ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮ
Ｂ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ
３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、Ｍ
ＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ
、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、Ｒ
Ｂ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦＵ、もしくはＴＰ５３、
Ｂ）ＡＢＬ２、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ
、ＡＵＲＫＢ、ＢＡＰ１、ＢＣＬ２、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣ
Ｌ６、ＢＲＣＡ１、ＢＲＣＡ２、ＣＢＬ、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ２、ＣＣＮＤ
３、ＣＣＮＥ１、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５
、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫ
Ｌ、ＣＲＬＦ２、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、Ｅ
ＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ６、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、Ｅ
ＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ
７、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ４、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ
、ＧＮＡＳ、ＧＰＲ１２４、ＧＵＣＹ１Ａ２、ＨＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１
、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２
、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＤＭ６Ａ、ＫＤＲ、ＬＲＰ１Ｂ、ＬＲＰ６、ＬＴＫ、
ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ
、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、
ＮＦ２、ＮＫＸ２－１、ＮＴＲＫ１、ＮＴＲＫ２、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、
ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ
、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭ
ＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＯＸ１０、ＳＯＸ２、ＳＲＣ、ＴＢＸ２２、ＴＥＴ２、
ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＮＦＡＩＰ３、ＴＮＫ、ＴＮＫＳ２、ＴＯＰ１、ＴＳ
Ｃ１、ＴＳＣ２、ＵＳＰ９Ｘ、ＶＨＬ、もしくはＷＴ１のうちの少なくとも５つ以上から
選択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも５、６、７、８
、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７
０、７５、８０、８５、９０、９５、１００、１０５、１１０、１１５、１２０個、もし
くはそれ以上のサブゲノム間隔、
Ｃ）表１、１Ａ、２、３、もしくは４に従う、遺伝子もしくは遺伝子産物由来の少なく
とも５、６、７、８、９、１０、１５、２０個、もしくはそれ以上のサブゲノム間隔、
Ｄ）腫瘍または癌に関連した（例えば、腫瘍もしくは癌の正もしくは負の治療応答予測
因子であるか、腫瘍もしくは癌の正もしくは負の予後因子であるか、または腫瘍もしくは
癌の差次的診断を可能にする）遺伝子もしくは遺伝子産物、例えば、ＡＢＬ１、ＡＫＴ１
、ＡＬＫ、ＡＲ、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、ＣＥＢＰＡ、ＥＧＦＲ、ＥＲＢＢ
２、ＦＬＴ３、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＮＰＭ１、ＰＤＧＦＲＡ、ＰＩＫ
３ＣＡ、ＲＡＲＡ、ＡＫＴ２、ＡＫＴ３、ＭＡＰ２Ｋ４、ＮＯＴＣＨ１、およびＴＰ５３
のうちの１つ以上から選択される遺伝子もしくは遺伝子産物由来の少なくとも５、６、７
、８、９、１０、１５、２０個、もしくはそれ以上のサブゲノム間隔、
Ｅ）ＡＢＬ１遺伝子のコドン３１５；ＡＰＣのコドン１１１４、１３３８、１４５０、
もしくは１５５６；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコドン３２、３３、３４、
３７、４１、もしくは４５；ＥＧＦＲのコドン７１９、７４６～７５０、７６８、７９０
、８５８、もしくは８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳのコドン１２、１３、も
しくは６１；ＪＡＫ２のコドン６１７；ＫＩＴのコドン８１６；ＫＲＡＳのコドン１２、
１３、もしくは６１；ＰＩＫ３ＣＡのコドン８８、５４２、５４５、５４６、１０４７、
もしくは１０４９；ＰＴＥＮのコドン１３０、１７３、２３３、もしくは２６７；ＲＥＴ
のコドン９１８；ＴＰ５３のコドン１７５、２４５、２４８、２７３、もしくは３０６の
うちの１つ以上から選択される変異コドンまたは野生型コドンを含む少なくとも５、６、
７、８、９、１０個、もしくはそれ以上のサブゲノム間隔（例えば、表１に示されるコド
ンのうちの１つ以上を含む、少なくとも５、１０、１５、２０個、もしくはそれ以上のサ
ブゲノム間隔）、
Ｆ）ＡＢＣＢ１、ＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、Ｃ１ｏｒｆ１４４、ＣＹＰ１Ｂ
１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＰ
ＹＤ、ＥＲＣＣ２、ＥＳＲ２、ＦＣＧＲ３Ａ、ＧＳＴＰ１、ＩＴＰＡ、ＬＲＰ２、ＭＡＮ
１Ｂ１、ＭＴＨＦＲ、ＮＱＯ１、ＮＲＰ２、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ
１Ｂ３、ＳＯＤ２、ＳＵＬＴ１Ａ１、ＴＰＭＴ、ＴＹＭＳ、ＵＧＴ１Ａ１、もしくはＵＭ
ＰＳから選択される薬物代謝、薬物応答性、または毒性（本明細書で「ＰＧｘ」遺伝子と
も称される）のうちの１つ以上に関連した遺伝子もしくは遺伝子産物に存在するサブゲノ
ム間隔の変異または野生型遺伝子もしくは遺伝子産物（例えば、単一ヌクレオチド多型（
ＳＮＰ））由来の少なくとも５、６、７、８、９、１０、１５、２０、２５、３０個、も
しくはそれ以上のサブゲノム間隔、
Ｇ）（ｉ）薬物で治療された癌患者のより良好な生存率（例えば、パクリタキセル（例
えば、ＡＢＣＢ１遺伝子）で治療された乳癌患者のより良好な生存率）、（ｉｉ）パクリ
タキセル代謝（例えば、表２に示される異なる遺伝子座および変異におけるＣＹＰ２Ｃ８
遺伝子；ＣＹＰ３Ａ４遺伝子）、（ｉｉｉ）薬物に対する毒性（例えば、ＡＢＣＣ４遺伝
子で見られる６－ＭＰ毒性（表２）；ＤＰＹＤ遺伝子、ＴＹＭＳ遺伝子、もしくはＵＭＰ
Ｓ遺伝子で見られる５－ＦＵ毒性（表２）；ＴＭＰＴ遺伝子で見られるプリン毒性（表２
）；ＮＲＰ２遺伝子、Ｃｌｏｒｆ１４４遺伝子、ＣＹＰ１Ｂ１遺伝子で見られるダウノル
ビシン毒性（表２））、または（ｉｖ）薬物の副作用（例えば、ＡＢＣＧ２、ＴＹＭＳ、
ＵＧＴ１Ａ１、ＥＳＲ１、およびＥＳＲ２遺伝子（表２））のうちの１つ以上に関連した
遺伝子もしくは遺伝子産物に存在するサブゲノム間隔の変異または野生型ＰＧｘ遺伝子ま
たは遺伝子産物（例えば、単一ヌクレオチド多型（ＳＮＰ））由来の少なくとも５、６、
７、８、９、１０、１５、２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｈ）表３に従う少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、５
０、７５、１１０個、もしくはそれ以上の遺伝子もしくは遺伝子産物の転座変化、
Ｊ）表３に明記される癌型由来の固形腫瘍試料における、表３に従う少なくとも５、１
０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１１０個、もしくはそれ
以上の遺伝子もしくは遺伝子産物の転座変化、
Ｋ）表４に従う少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、５
０、７５、１００、１５０、２００個、もしくはそれ以上の遺伝子もしくは遺伝子産物の
転座変化、
Ｌ）表４に明記される癌型由来のヘム腫瘍試料における、表４に従う少なくとも５、１
０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００
個、もしくはそれ以上の遺伝子もしくは遺伝子産物の転座変化、
Ｍ）表１～４から選択される少なくとも５個の遺伝子もしくは遺伝子産物（例えば、事
前選択された位置における対立遺伝子変異は、事前選択された種類の腫瘍に関連し、該対
立遺伝子変異は、該腫瘍型中の細胞の５％未満に存在する）、
Ｎ）ＧＣが豊富な領域に埋め込まれる表１、表１Ａ－４から選択される少なくとも５個
の遺伝子もしくは遺伝子産物、あるいは
Ｏ）癌発生の遺伝（例えば、生殖細胞系危険）因子を示す少なくとも５個の遺伝子もし
くは遺伝子産物（例えば、遺伝子もしくは遺伝子産物は、ＢＲＣＡ１、ＢＲＣＡ２、ＥＧ
ＦＲ、ＨＲＡＳ、ＫＩＴ、ＭＰＬ、ＡＬＫ、ＰＴＥＮ、ＲＥＴ、ＡＰＣ、ＣＤＫＮ２Ａ、
ＭＬＨ１、ＭＳＨ２、ＭＳＨ６、ＮＦ１、ＮＦ２、ＲＢ１、ＴＰ５３、ＶＨＬ、もしくは
ＷＴ１のうちの１つ以上から選択される）。

さらに別の実施形態では、方法は、一組のサブゲノム間隔についての読み取り、例えば
、配列を腫瘍試料から取得し、サブゲノム間隔は、表１Ｂに記載される変化のうちの１、
２、３、４、５、１０、１５個、もしくはすべてから選択される。一実施形態において、
サブゲノム間隔は、カテゴリーＡ、Ｂ、Ｃ、Ｄ、またはＥのうちの１つ以上に分類される
変化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料、例えば、結腸、肺、また
は乳房腫瘍試料におけるＫＲＡＳＧ１３Ｄの変化を含む。他の実施形態では、サブゲノ
ム間隔は、腫瘍試料、例えば、黒色腫または結腸腫瘍試料におけるＮＲＡＳＱ６１Ｋの
変化を含む。さらに他の実施形態では、サブゲノム間隔は、腫瘍試料、例えば、黒色腫、
結腸、または肺腫瘍試料におけるＢＲＡＦＶ６００Ｅの変化を含む。他の実施形態では
、サブゲノム間隔は、腫瘍試料、例えば、肺腫瘍試料におけるＢＲＡＦＤ５９４Ｇの変
化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料、例えば、乳房または結腸腫
瘍試料におけるＰＩＫ３ＣＡＨ１０４７Ｒの変化を含む。さらに他の実施形態では、サ
ブゲノム間隔は、腫瘍試料、例えば、肺腫瘍試料におけるＥＧＦＲＬ８５８ＲまたはＴ
７９０Ｍの変化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるＥＲＢ
Ｂ２の変化、例えば、乳房腫瘍試料におけるＥＲＢＢ２増幅を含む。他の実施形態では、
サブゲノム間隔は、腫瘍試料におけるＢＲＣＡ１の変化、例えば、乳房腫瘍試料における
ＢＲＣＡ１両アレル不活性化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料に
おけるＢＲＣＡ２の変化、例えば、膵臓腫瘍試料におけるＢＲＣＡ２両アレル不活性化を
含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるＡＴＭの変化、例えば、
乳房腫瘍試料におけるＡＴＭ両アレル不活性化を含む。他の実施形態では、サブゲノム間
隔は、腫瘍試料におけるＴＳＣの変化、例えば、結腸腫瘍試料におけるＴＳＣ両アレル不
活性化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるＰＴＥＮの変化
、例えば、乳房または結腸腫瘍試料におけるＰＴＥＮ両アレル不活性化を含む。さらに他
の実施形態では、サブゲノム間隔は、腫瘍試料におけるＶＨＬの変化、例えば、腎臓腫瘍
試料におけるＶＨＬ両アレル不活性化を含む。他の実施形態では、サブゲノム間隔は、腫
瘍試料におけるＡＴＲの変化、例えば、乳房腫瘍試料におけるＡＴＲ両アレル不活性化を
含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるＭＹＣの変化、例えば、
乳房腫瘍試料におけるＭＹＣ両アレル不活性化を含む。

これらならびに他の組および群のサブゲノム間隔は、本明細書の他の箇所で、例えば、
表題「遺伝子選択モジュール」の項でさらに詳細に論じられる。

本明細書に記載の方法のうちのいずれかを、以下の実施形態のうちの１つ以上と組み合
わせることができる。

他の実施形態では、試料は腫瘍試料であり、例えば、１つ以上の前悪性または悪性細胞
を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組織腫
瘍、または転移病巣から取得される。他の実施形態では、試料、例えば、腫瘍試料は、切
除縁由来の組織または細胞を含む。試料は、組織学的に正常な組織であり得る。別の実施
形態では、試料、例えば、腫瘍試料は、１つ以上の循環腫瘍細胞（ＣＴＣ）（例えば、血
液試料から取得されたＣＴＣ）を含む。

一実施形態において、方法は、試料、例えば、本明細書に記載の腫瘍試料を取得するこ
とをさらに含む。試料を直接的にまたは間接的に取得することができる。

他の実施形態では、方法は、例えば、切除縁由来の試料、例えば、組織学的に正常な試
料を、本明細書に記載の方法を用いて評価することを含む。出願者は、組織学的に正常な
組織（例えば、さもなければ組織学的に正常な組織縁）から得られた試料が依然として本
明細書に記載の変化を有し得ることを発見した。したがって、方法は、検出された変化の
存在に基づいて組織試料を再分類することをさらに含み得る。

別の実施形態では、取得または分析される読み取りの少なくとも１０、２０、３０、４
０、５０、６０、７０、８０、もしくは９０％が、本明細書に記載の遺伝子、例えば、表
１～１Ａの遺伝子、または表１の優先順位が１の遺伝子由来のサブゲノム間隔に対するも
のである。

ある実施形態において、この方法で行われる変異呼び出しの少なくとも１０、２０、３
０、４０、５０、６０、７０、８０、もしくは９０％が、本明細書に記載の遺伝子、例え
ば、表１～１Ａの遺伝子、または表１の優先順位が１の遺伝子由来のサブゲノム間隔に対
するものである。

ある実施形態において、この方法で使用される一意の閾値の少なくとも１０、２０、３
０、４０、５０、６０、７０、８０、もしくは９０％が、本明細書に記載の遺伝子、例え
ば、表１～１Ａの遺伝子、または表１の優先順位が１の遺伝子由来のサブゲノム間隔に対
するものである。

ある実施形態において、アノテートされるか、または第三者に報告される変異呼び出し
の少なくとも１０、２０、３０、４０、５０、６０、７０、８０、もしくは９０％が、本
明細書に記載の遺伝子、例えば、表１～１Ａの遺伝子、または表１の優先順位が１の遺伝
子由来のサブゲノム間隔に対するものである。

ある実施形態において、方法は、腫瘍および／または対照核酸試料（例えば、ＦＦＰＥ
由来の核酸試料）から得られるヌクレオチド配列読み取りを取得することを含む。

ある実施形態において、読み取りは、ＮＧＳ配列決定方法によって提供される。

ある実施形態において、方法は、核酸メンバーのライブラリを提供すること、および該
ライブラリの複数のメンバーからの事前選択されたサブゲノム間隔を配列決定することを
含む。実施形態において、方法は、配列決定のために該ライブラリのサブセットを選択す
るステップ、例えば、溶液ベースの選択または固体支持体（例えば、アレイ）ベースの選
択を含み得る。

ある実施形態において、方法は、ライブラリを複数のベイトと接触させて、核酸の選択
されたサブグループ、例えば、ライブラリ捕獲物を提供するステップを含む。一実施形態
において、接触させるステップは、溶液ハイブリダイゼーションにおいて達成される。別
の実施形態では、接触させるステップは、固体支持体、例えば、アレイにおいて達成され
る。ある特定の実施形態において、方法は、１つ以上のさらなるラウンドのハイブリダイ
ゼーションによってハイブリダイゼーションステップを繰り返すことを含む。いくつかの
実施形態では、方法は、ライブラリ捕獲物を同一または異なる群のベイトを用いて１つ以
上のさらなるラウンドのハイブリダイゼーションに供することをさらに含む。

さらに他の実施形態では、方法は、ライブラリ捕獲物を分析することをさらに含む。一
実施形態において、ライブラリ捕獲物は、配列決定方法、例えば、本明細書に記載の次世
代配列決定方法によって分析される。方法は、例えば、溶液ハイブリダイゼーションによ
ってライブラリ捕獲物を単離すること、および核酸配列決定によってライブラリ捕獲物を
供することを含む。ある特定の実施形態において、ライブラリ捕獲物を再配列決定するこ
とができる。次世代配列決定方法は当技術分野で既知であり、例えば、Ｍｅｔｚｋｅｒ，
Ｍ．（２０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：
３１－４６に記載されている。

ある実施形態において、ヌクレオチド位置に対して割り当てられた値は、任意で、説明
的アノテーションを伴って、第三者に送信される。

ある実施形態において、ヌクレオチド位置に対して割り当てられた値は、第三者に送信
されない。

ある実施形態において、複数のヌクレオチド位置に対して割り当てられた値は、任意で
、説明的アノテーションを伴って、第三者に送信され、第２の複数のヌクレオチド位置に
対して割り当てられた値は、第三者に送信されない。

ある実施形態において、少なくとも０．０１、０．０２、０．０３、０．０５、０．１
、０．２、０．３、０．４、０．５、０．６、０．７、０．８、０．９、１．０、１５、
または３０メガベースの塩基、例えば、ゲノム塩基が配列決定される。

ある実施形態において、方法は、少なくとも１つのＳＮＰを含む複数の読み取りを評価
することを含む。

ある実施形態において、方法は、試料および／または対照読み取りにおけるＳＮＰと対
立遺伝子の比率を決定することを含む。

ある実施形態において、方法は、例えば、バーコードデコンボリューションによって、
１つ以上の読み取りを対象に割り当てることを含む。

ある実施形態において、方法は、例えば、バーコードデコンボリューションによって、
１つ以上の読み取りを腫瘍読み取りまたは対照読み取りとして割り当てることを含む。

ある実施形態において、方法は、例えば、参照配列とのアライメントによって、該１つ
以上の読み取りのそれぞれをマッピングすることを含む。

ある実施形態において、方法は、呼び出された変異をメモリアライズすることを含む。

ある実施形態において、方法は、呼び出された変異をアノテートする、例えば、呼び出
された変異を、変異構造、例えば、ミスセンス変異、または関数、例えば、疾患表現型の
指標を用いてアノテートすることを含む。

ある実施形態において、方法は、腫瘍および対照核酸についてのヌクレオチド配列読み
取りを取得することを含む。

ある実施形態において、方法は、例えば、ベイズ呼び出し方法または非ベイズ呼び出し
方法を用いて、Ｘ個のサブゲノム間隔のそれぞれのヌクレオチド値、例えば、バリアント
、例えば、変異を呼び出すことを含む。

ある実施形態において、例えば、異なる対象由来の複数の試料が、同時に処理される。

本明細書に開示の方法を用いて、対象のゲノムまたはトランスクリプトームに存在する
変化を検出することができ、ＤＮＡおよびＲＮＡの配列決定、例えば、標的化されたＲＮ
Ａおよび／またはＤＮＡの配列決定に適用することができる。したがって、本発明で特色
とされる別の態様は、本明細書に記載の変化を検出するために、標的化されたＲＮＡを配
列決定する、例えば、試料、例えば、ＦＦＰＥ試料から取得されたＲＮＡ由来のｃＤＮＡ
を配列決定する方法を含む。変化は、再編成、例えば、遺伝子融合物をコードする再編成
であり得る。他の実施形態では、方法は、遺伝子または遺伝子産物のレベルの変化（例え
ば、増加または減少）、例えば、本明細書に記載の遺伝子または遺伝子産物の発現の変化
の検出を含む。方法は、任意で、標的ＲＮＡの試料を濃縮するステップを含んでもよい。
他の実施形態では、方法は、ある特定の多量のＲＮＡ、例えば、リボソームまたはグロビ
ンＲＮＡの試料を枯渇させるステップを含む。ＲＮＡ配列決定方法を、単独で、または本
明細書に記載のＤＮＡ配列決定方法と組み合わせて用いることができる。一実施形態にお
いて、方法は、ＤＮＡ配列決定ステップおよびＲＮＡ配列決定ステップを行うことを含む
。方法を任意の順序で行うことができる。例えば、方法は、ＲＮＡ配列決定によって本明
細書に記載の変化の発現を確認すること、例えば、本発明のＤＮＡ配列決定方法によって
検出される異または融合の発現を確認することを含み得る。他の実施形態では、方法は、
ＲＮＡ配列決定ステップ、その後、ＤＮＡ配列決定ステップを行うことを含む。

別の態様では、本発明は、標的とされるサブゲノム領域に対する配列決定／アライメン
トのアーチファクトのデータベースを構築することを含む方法を特色とする。実施形態に
おいて、データベースを用いて、誤った変異呼び出しを除外し、特異性を改善することが
できる。ある実施形態において、データベースは、非関連の非腫瘍（例えば、ＦＦＰＥ）
試料または細胞株を配列決定し、これらの正常な試料のうちの１つ以上において、無作為
な配列決定エラーのみに起因して予想されるより頻繁に出現する非参照対立遺伝子イベン
トを記録することによって構築される。この手法は、生殖細胞系バリエーションをアーチ
ファクトに分類し得るが、体細胞変異に関係した方法においては許容される。この生殖細
胞系バリエーションをアーチファクトとして誤分類することを、所望の場合、既知の生殖
細胞系バリエーション（一般的なバリアントを除去）および１人の個人にのみ出現するア
ーチファクト（より稀有なバリエーションを除去）に関するこのデータベースにフィルタ
をかけることによって改善することができる。

本明細書に開示の方法は、例えば、癌に関連したゲノムの断片に適用されるとき、最適
化されたベイトベースの選択、最適化されたアライメント、および最適化された変異呼び
出しを含むいくつかの最適化要素の統合を可能にする。本明細書に記載の方法は、癌ごと
に、遺伝子ごとに、かつ部位ごとに最適化され得る腫瘍のＮＧＳに基づく分析を提供する
。これを、例えば、本明細書に記載の遺伝子／部位および腫瘍型に適用することができる
。方法は、所与の配列決定技術を用いて変異検出への感度および特異性レベルを最適化す
る。癌ごと、遺伝子ごと、および部位ごとの最適化は、臨床産物にとって不可欠な非常に
高いレベルの感度／特異性（例えば、両方ともに９９％を超える）を提供する。

本明細書に記載の方法は、最適な治療法および疾患管理の決定を通知するために、次世
代配列決定技術を用いて、日常的な実在の試料由来の包括的な組の妥当な程度に行動でき
る遺伝子（典型的には、５０～５００個の範囲の遺伝子であり得る）のゲノム異常の臨床
および規制グレードの包括的分析ならびに解釈を提供する。

本明細書に記載の方法は、最適な治療および疾患管理決定を通知するために腫瘍試料を
送り、かつその腫瘍についてのゲノムおよび他の分子変化の包括的分析および記述を受け
るワンストップショッピングを癌専門医／病理学者に提供する。

本明細書に記載の方法は、標準の利用可能な腫瘍試料を取り込み、一試験において、癌
専門医に包括的記述を提供するために、どのような異常が腫瘍を推進し得、かつ癌専門医
に治療法の決定を通知するのに有用であり得るかの包括的ゲノムおよび他の分子異常分析
を提供する、実環境での強固な臨床癌診断ツールを提供する。

本明細書に記載の方法は、臨床グレードの品質の患者の癌ゲノムの包括的分析を提供す
る。方法は、最も関連性のある遺伝子および可能性のある変化を含み、変異、コピー数、
再編成、例えば、転座、発現、およびエピジェネティックマーカーの分析のうちの１つ以
上を含む。遺伝分析の出力を、実用的な結果の記述的な報告書で文脈化することができる
。方法は、使用を最新の一連の関連性のある科学および医学知識と結びつける。

本明細書に記載の方法は、治療の質と効率の両方の向上を提供する。これは、腫瘍が希
有であるか、またはよく研究されていない種類のものであり、したがって、標準的治療が
存在しないか、あるいは患者が確立された一連の治療に効果を示さず、さらなる治療法の
選択または臨床試験参加の合理的根拠が有用であり得る場合の、適用を含む。例えば、方
法は、治療の任意の時点で、意思決定を通知するために利用可能なすべての「分子像」お
よび／または「分子副診断」を有することによって癌専門医が恩恵を受ける、選択を可能
にする。

本明細書に記載の方法は、例えば、電子形態、ウェブベース形態、または書面形態で、
患者または別の人物もしくは事業体、例えば、介護人、例えば、医師、例えば、癌専門医
、病院、診療所、第三者支払人、保険会社、もしくは官庁に報告書を提供することを含み
得る。報告書は、例えば、試料の腫瘍型に関連したサブゲノム間隔についての方法からの
出力、例えば、ヌクレオチド値の同定、変化、変異、または野生型配列の存在もしくは不
在の指標を含み得る。報告書は、疾患における配列、例えば、変化、変異、または野生型
配列の役割に関する情報も含み得る。そのような情報は、予後、抵抗、あるいは見込みが
あるか、または推奨される治療選択肢に関する情報を含み得る。報告書は、治療選択肢の
予期される有効性、治療選択肢の容認度、または治療選択肢を患者、例えば、試験で同定
され、かつ実施形態において、報告書で同定された配列、変化、または変異を有する患者
に適用する推奨度に関する情報を含み得る。例えば、報告書は、患者への薬物の投与、例
えば、事前選択された投与量もしくは事前選択された治療レジメンでの投与、例えば、他
の薬物と組み合わせた投与に関する情報、または提言を含み得る。ある実施形態において
、この方法において同定されるすべての変異が報告書で特定されるわけではない。例えば
、報告書は、例えば、事前選択された治療選択肢を用いた治療に対して、癌の発生、予後
、病期、または感受性との事前選択されたレベルの相関関係がある遺伝子における変異に
限定され得る。本明細書の特色とされる方法は、方法を実践する実在者が試料を受容して
から７、１４、または２１日以内に、例えば、本明細書に記載の実在者に報告書を送達す
ることを可能にする。

したがって、本発明で取り上げられる方法は、迅速なターンアラウンドタイム（例えば
、試料の受容から７、１４、または２１日以内）を可能にする。

本明細書に記載の方法を用いて、組織学的に正常な試料、例えば、切除縁由来の試料を
評価することもできる。本明細書に記載の１つ以上の変化が検出される場合、組織を、例
えば、悪性組織または前悪性組織に再分類することができ、かつ／または治療過程を修正
することができる。

ある特定の態様において、本明細書に記載の配列決定方法は、非癌応用、例えば、法医
学的応用（例えば、歯科記録の使用の代替案として、またはそれに加えての特定）、実父
確定検査、ならびに例えば、とりわけ、嚢胞性線維症、ハンチントン病、アルツハイマー
病の疾患診断および予後において有用である。例えば、本明細書に記載の方法による遺伝
子変化の同定は、特定の障害の存在または個人が特定の障害を発症する危険性を示し得る
。

別途定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本
発明が属する当業者によって一般に理解される意味と同一の意味を有する。それらの本明
細書に記載のものと同様または同等の方法および材料を本発明の実践または試験で使用す
ることができるが、好適な方法および材料が以下に記載される。本明細書で言及されるす
べての出版物、特許出願、特許、および他の参考文献は、参照によりそれらの全体が組み
込まれる。加えて、材料、方法、および実施例は、例示目的のみであり、限定することを
意図しない。

本発明の他の特徴および利点は、発明を実施するための形態、図面、および特許請求の
範囲から明らかとなる。

最初に図面を説明する。
Ａ～Ｆは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。Ａ～Ｆは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。Ａ～Ｆは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。Ａ～Ｆは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。Ａ～Ｆは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。Ａ～Ｆは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。先行予想および読み取り深度の変異検出への影響を示す。１００個を超える臨床癌試料における変異頻度を示す。対象範囲ヒストグラムの線形表示である。標的の数（y軸）が、対象範囲の関数（x軸）として示される。線１は、個別に合成されたビオチン化ＤＮＡオリゴヌクレオチドベイトでスパイクされたアレイ由来のビオチン化ＲＮＡオリゴヌクレオチドベイトを含むベイトセット（本明細書で「ベイトセット１」と称される）を用いた対象範囲を表す。線２は、ビオチン化されたアレイ由来のＲＮＡオリゴヌクレオチドベイトのみ（本明細書で「ベイトセット２」と称される）を含むベイトセットを用いて得られた対象範囲を表す。ベイトセット２を用いた全体の平均対象範囲が９２４であった一方で、ベイトセット２を用いた高ＧＣ含量の領域（約６８％）における対象範囲は７３であった。対照的に、ベイトセット１を用いたとき、全体の対象範囲は約９１８であったが、高ＧＣ含量の領域における対象範囲は１８３に改善された。アレイ由来のビオチン化ＲＮＡオリゴヌクレオチドベイトのみを含むベイトセット（「ベイトセット３」）と比較した、個別に合成されたビオチン化ＤＮＡオリゴヌクレオチドベイトのみからなるベイトセット（ベイトセット１）および個別に合成されたビオチン化ＤＮＡオリゴヌクレオチドベイト（「ベイトセット２」）でスパイクされたアレイ由来のビオチン化ＲＮＡオリゴヌクレオチドベイトを含むベイトセットを用いて検出された対象範囲の均一性を比較する対象範囲ヒストグラムである。ベイトセットは、図５で１、２、および３として示される。図５に示されるように、対象範囲におけるいくつかのギャップがベイトセット３を用いたときに検出されたが、ベイトセット１～２を用いたときは検出されなかった。

選択された群の遺伝子および遺伝子産物を評価することによる、１つ以上の対象由来の
試料、例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物を配列決定するための最適
化方法およびアッセイが開示される。一実施形態において、本発明で取り上げられる方法
およびアッセイは、マルチプレックスアッセイ形式で、例えば、多数の様々な遺伝的事象
からの複数のシグナルを多数の遺伝子に組み込んだアッセイにおいて使用される。癌表現
型（例えば、癌の危険性、癌進行、癌治療、または治療に対する抵抗のうちの１つ以上）
に（例えば、正もしくは負に）関連した選択された群の遺伝子または遺伝子産物に少なく
ともある程度基づく方法およびアッセイが本明細書に開示される。そのような事前選択さ
れた遺伝子または遺伝子産物は、配列決定方法、具体的には、例えば、腫瘍または対照試
料由来の多数の様々な遺伝子の大規模並列配列決定に依存する方法の適用を可能にする。

ある特定の用語が最初に定義される。さらなる用語が本明細書を通して定義される。

本明細書で使用される「ａ」および「ａｎ」という冠詞は、冠詞の文法上の目的語の１
つまたは２つ以上（例えば、少なくとも１つ）を指す。

「約（ａｂｏｕｔ）」および「約（ａｐｐｒｏｘｙｉｍａｔｅｌｙ）」は、概して、測
定の本質または精度を考慮して測定される量に対する誤差の許容できる程度を意味する。
例となる誤差の程度は、所与の値または値の範囲の２０パーセント（％）以内、典型的に
は、１０％以内、より典型的には、５％以内である。

「取得する」または「取得すること」という用語が本明細書で使用されるとき、物理的
実体または値、例えば、数値を、物理的実体または値を「直接的に取得する」か、または
「間接的に取得する」ことによって、入手することを指す。「直接的に取得する」とは、
プロセスを行って（例えば、合成または分析方法を行って）物理的実体または値を得るこ
とを意味する。「間接的に取得する」とは、物理的実体または値を別の団体またはソース
（例えば、物理的実体または値を直接的に取得した第三者研究所）から受け取ることを指
す。物理的実体を直接的に取得することは、物理的物質、例えば、出発原料の物理的変化
を含むプロセスを行うことを含む。例となる変化は、物理的実体を２つ以上の出発原料か
ら作製すること、物質を剪断または断片化すること、物質を分離または精製すること、２
つ以上の別個の実体を混合物中に合わせること、共有もしくは非共有結合の破壊または形
成を含む化学反応を行うことを含む。値を直接的に取得することは、試料または別の物質
の物理的変化を含むプロセスを行うこと、例えば、物質、例えば、試料、検体、または試
薬の物理的変化を含む分析プロセスを行うこと（本明細書で「物理的分析」と称される場
合もある）、分析方法、例えば、物質、例えば、検体、またはその断片もしくは他の誘導
体を別の物質から分離または精製すること、検体、またはその断片もしくは他の誘導体を
、別の物質、例えば、緩衝液、溶媒、または反応物と合わせること、あるいは例えば、検
体の第１の原子と第２の原子との間の共有もしくは非共有結合を破壊または形成すること
によって、検体、またはその断片もしくは他の誘導体の構造を変化させること、あるいは
例えば、試薬の第１の原子と第２の原子との間の共有または非共有結合を破壊または形成
することによって、試薬、またはその断片もしくは他の誘導体の構造を変化させることの
うちの１つ以上を含む方法を行うことを含む。

「配列を取得する」または「読み取りを取得する」という用語が本明細書で使用される
とき、配列または読み取りを「直接的に取得する」か、または「間接的に取得する」こと
によって、ヌクレオチド配列またはアミノ酸配列を入手することを指す。配列または読み
取りを「直接的に取得する」とは、プロセスを行って（例えば、合成または分析方法を行
って）、例えば、配列決定方法（例えば、次世代配列決定（ＮＧＳ）方法）を行って、配
列を得ることを意味する。配列または読み取りを「間接的に取得する」ことは、別の団体
またはソース（例えば、配列を直接的に取得した第三者研究所）から配列の情報または知
識を受け取ること、あるいは配列を受け取ることを指す。取得した配列または読み取りは
、完全な配列である必要はなく、例えば、少なくとも１つのヌクレオチドを配列決定する
か、または対象に存在する本明細書に開示の変化のうちの１つ以上を特定する情報もしく
は知識を得ることが、配列を取得することの本質をなす。

配列または読み取りを直接的に取得することは、物理的物質、例えば、組織もしくは細
胞試料、例えば、生検、または単離された核酸（例えば、ＤＮＡもしくはＲＮＡ）試料等
の出発原料の物理的変化を含むプロセスを行うことを含む。例となる変化は、物理的実体
を２つ以上の出発原料から作製すること、ゲノムＤＮＡ断片等の物質を剪断または断片化
すること、物質を分離または精製すること（例えば、核酸試料を組織から単離すること）
、２つ以上の別個の実体を混合物中に合わせること、共有もしくは非共有結合の破壊また
形成を含む化学反応を行うことを含む。値を直接的に取得することは、上述の試料または
別の物質の物理的変化を含むプロセスを行うことを含む。

「試料を取得する」という用語が本明細書で使用されるとき、試料を「直接的に取得す
る」か、または「間接的に取得する」ことによって、試料、例えば、組織試料または核酸
試料を入手することを指す。「試料を直接的に取得する」とは、プロセスを行って（例え
ば、手術または摘出等の物理的方法を行って）試料を得ることを意味する。「試料を間接
的に取得する」とは、試料を別の団体またはソース（例えば、試料を直接的に取得した第
三者研究所）から受け取ることを指す。試料を直接的に取得することは、物理的物質、例
えば、出発原料、例えば、ヒト患者の組織または患者から以前に単離された組織等の組織
の物理的変化を含むプロセスを行うことを含む。例となる変化は、物理的実体を出発原料
から作製すること、組織を解剖または解体すること、物質（例えば、試料組織もしくは核
酸試料）を分離または精製すること、２つ以上の別個の実体を混合物中に合わせること、
共有もしくは非共有結合の破壊または形成を含む化学反応を行うことを含む。試料を直接
的に取得することは、例えば、上述の試料または別の物質の物理的変化を含むプロセスを
行うことを含む。

本明細書で使用される「アライメントセレクタ」、は、アライメント方法の選択を可能
にするか、または指向するパラメータ、例えば、事前選択されたサブゲノム間隔の配列決
定を最適化することができるアライメントアルゴリズムまたはパラメータを指す。アライ
メントセレクタは、例えば、以下のうちの１つ以上の関数に特異的であり得るか、または
その関数として選択され得る：
１．該サブゲノム間隔についての読み取りの誤アライメント傾向に関連した配列コンテキ
スト、例えば、サブゲノム間隔（例えば、評価される事前選択されたヌクレオチド位置）
の配列コンテキスト。例えば、ゲノムの他の場所で繰り返される評価されるサブゲノム間
隔における配列要素、またはその付近での配列要素の存在が、誤アライメントを引き起こ
し、それによって、性能を低下させ得る。誤アライメントを最小化するアルゴリズムまた
はアルゴリズムパラメータを選択することによって、性能を強化することができる。この
場合において、アライメントセレクタの値は、配列コンテキスト、例えば、ゲノム（また
は分析されるゲノムの一部）で少なくとも事前選択された回数繰り返される事前選択され
た長さの配列の存在または不在の関数であり得る。
２．分析される腫瘍型。例えば、特定の腫瘍型は、欠失速度の増加を特徴とし得る。した
がって、インデルにより敏感なアルゴリズムまたはアルゴリズムパラメータを選択するこ
とによって、性能を強化することができる。この場合において、アライメントセレクタの
値は、腫瘍型の関数、例えば、腫瘍型の識別子であり得る。ある実施形態において、値は
、腫瘍型、例えば、乳癌の識別である。
３．分析される遺伝子または遺伝子型、例えば、ある遺伝子または遺伝子型を分析するこ
とができる。癌遺伝子は、例として、多くの場合、置換またはインフレームインデルを特
徴とする。したがって、これらのバリアントに特に敏感であり、かつ他のバリアントに対
して特異的なアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能
を強化することができる。腫瘍抑制遺伝子は、多くの場合、フレームシフトインデルを特
徴とする。したがって、これらのバリアントに特に敏感なアルゴリズムまたはアルゴリズ
ムパラメータを選択することによって、性能を強化することができる。したがって、サブ
ゲノム間隔と適合するアルゴリズムまたはアルゴリズムパラメータを選択することによっ
て、性能を強化することができる。この場合において、アライメントセレクタの値は、遺
伝子または遺伝子型の関数、例えば、遺伝子または遺伝子型の識別子であり得る。ある実
施形態において、値は、遺伝子の識別である。
４．分析される部位（例えば、ヌクレオチド位置）。この場合において、アライメントセ
レクタの値は、部位または部位型の関数、例えば、部位または部位型の識別子であり得る
。ある実施形態において、値は、部位の識別である（例えば、その部位を含有する遺伝子
が別の遺伝子と高度に相同する場合、標準／高速の短い読み取りアライメントアルゴリズ
ム（例えば、ＢＷＡ）は、２つの遺伝子を見分けるのが困難である場合があり、より集約
的なアライメント方法（Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ）またはさらにはアセンブリ（Ａ
ＲＡＣＨＮＥ）を必要とする可能性がある。）同様に、遺伝子配列が複雑度の低い領域（
例えば、ＡＡＡＡＡＡ）を含有する場合、より集約的なアライメント方法が必要であり得
る。
５．評価されるサブゲノム間隔に関連したバリアントまたはバリアント型。例えば、置換
、挿入、欠失、転座、または他の再編成。したがって、特定のバリアント型により敏感な
アルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を強化するこ
とができる。この場合において、アライメントセレクタの値は、バリアント型の関数、例
えば、バリアント型の識別子であり得る。ある実施形態において、値は、バリアント型、
例えば、置換の識別である。
６．試料の種類、ＦＦＰＥ、または他の固定試料。試料型／品質は、エラー（非参照配列
の誤った観察）速度に影響を及ぼし得る。したがって、試料における真のエラー率を正確
にモデル化するアルゴリズムまたはアルゴリズムパラメータを選択することによって、性
能を強化することができる。この場合において、アライメントセレクタの値は、試料の種
類の関数、例えば、試料の種類の識別子であり得る。ある実施形態において、値は、試料
の種類、例えば、固定試料の識別である。

本明細書で使用される遺伝子もしくは遺伝子産物（例えば、マーカー遺伝子もしくは遺
伝子産物）の「変化」または「変化した構造」は、遺伝子もしくは遺伝子産物内における
１つの変異もしくは複数の変異の存在、例えば、正常な遺伝子または野生型遺伝子と比較
して、遺伝子もしくは遺伝子産物の量または活性に影響を及ぼす変異を指す。変化は、癌
組織または癌細胞における量、構造、および／または活性の、正常もしくは健常組織また
は細胞（例えば、対照）におけるその量、構造、および／または活性と比較した変化であ
り得、癌等の病状に関連する。例えば、癌に関連した変化、または抗癌治療に対する応答
性を予測する変化は、正常かつ健康な組織または細胞と比較して、１つの癌組織または複
数の癌細胞におけるヌクレオチド配列（例えば、変異）、アミノ酸配列、染色体転座、染
色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性、またはメチル
化状態の変化を有し得る。例となる変異には、点変異（例えば、サイレント、ミスセンス
、またはナンセンス）、欠失、挿入、逆位、連鎖変異、重複、転座、染色体外再編成、お
よび染色体内再編成が含まれるが、これらに限定されない。変異は、遺伝子のコード領域
または非コード領域に存在し得る。ある特定の実施形態において、変化（複数を含む）は
、再編成、例えば、その１つ以上のイントロンまたは断片を含むゲノム再編成（例えば、
５’および／または３’－ＵＴＲにおける１つ以上の再編成）として検出される。ある特
定の実施形態において、変化は、表現型、例えば、癌表現型（例えば、癌の危険性、癌進
行、癌治療、または癌治療に対する抵抗のうちの１つ以上）に関連する（か、または関連
しない）。一実施形態において、変化は、癌の遺伝的危険因子、正の治療応答予測因子、
負の治療応答予測因子、正の予後因子、負の予後因子、または診断因子のうちの１つ以上
に関連する。

本明細書で使用される「ベイト」は、一種のハイブリッド捕捉試薬である。ベイトは、
標的核酸にハイブリダイズし（例えば、標的核酸に相補的である）、それによって、標的
核酸の捕捉を可能にする核酸分子、例えば、ＤＮＡ分子またはＲＮＡ分子であり得る。一
実施形態において、ベイトは、ＲＮＡ分子（例えば、自然発生のＲＮＡ分子もしくは修飾
されたＲＮＡ分子）、ＤＮＡ分子（例えば、自然発生のＤＮＡ分子もしくは修飾されたＤ
ＮＡ分子）、またはそれらの組み合わせである。他の実施形態では、ベイトは、例えば、
結合実体に結合することによって、結合実体、例えば、ベイトによって形成されたハイブ
リッドおよびベイトにハイブリダイズした核酸の捕捉および分離を可能にする親和性タグ
を含む。一実施形態において、ベイトは、溶液相ハイブリダイゼーションに好適である。

本明細書で使用される「ベイトセット」は、１つまたは複数のベイト分子を指す。

「結合実体」とは、検体に特異的に結合することができる、分子タグが直接的または間
接的に結合し得る任意の分子を意味する。結合実体は、それぞれのベイト配列上の親和性
タグであり得る。ある特定の実施形態において、結合実体は、アビジン分子等のパートナ
ー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、
ハイブリダイゼーション混合物からのベイト／メンバーハイブリッドの分離を可能にする
。例となる結合実体には、ビオチン分子、ハプテン、抗体、抗体結合断片、ペプチド、お
よびタンパク質が含まれるが、これらに限定されない。

「相補的」とは、２つの核酸鎖の領域間または同一の核酸鎖の２つの領域間の配列相補
性を指す。第１の核酸領域のアデニン残基は、残基がチミンまたはウラシルである場合、
第１の領域に逆平行な第２の核酸領域の残基と特定の水素結合を形成（「塩基対合」）で
きることが知られている。同様に、第１の核酸鎖のシトシン残基は、残基がグアニンであ
る場合、第１の鎖に逆平行な第２の核酸鎖の残基と塩基対合できることが知られている。
２つの領域が逆平行様式で配置されるとき、核酸の第１の領域は、第１の領域の少なくと
も１つのヌクレオチド残基が第２の領域の残基と塩基対合できる場合、同一または異なる
核酸の第２の領域に相補的である。ある特定の実施形態において、第１の領域が第１の部
分を含み、第２の領域が第２の部分を含み、それにより、第１および第２の部分が逆平行
様式で配置されるとき、第１の部分のヌクレオチド残基の少なくとも約５０％、少なくと
も約７５％、少なくとも約９０％、または少なくとも約９５％が、第２の部分のヌクレオ
チド残基で塩基対合できる。他の実施形態では、第１の部分のすべてのヌクレオチド残基
が、第２の部分のヌクレオチド残基と塩基対合することができる。

「癌」または「腫瘍」という用語は、本明細書で同義に使用される。これらの用語は、
無制限増殖、不死、転移能、速い成長および増殖速度、ならびにある特定の特徴的な形態
学的特徴等の発癌性細胞の典型的な特性を有する細胞の存在を指す。癌細胞は、多くの場
合、腫瘍の形態であるが、そのような細胞は、動物内に単独で存在し得るか、または白血
病細胞等の非腫瘍原性癌細胞であり得る。これらの用語は、固形腫瘍、軟組織腫瘍、また
は転移病巣を含む。本明細書で使用される「癌」という用語は、前悪状態、ならびに悪性
癌を含む。

本明細書で使用される「～の可能性が高い」または「可能性の増加」は、項目、目的物
、物体、または人が生じる確率の増加を指す。したがって、一例において、参照対象また
は対象群と比較して、治療に応答する可能性の高い対象は治療に応答する確率が増加する
。

「～の可能性が低い」とは、参照に対して、事象、項目、目的物、物体、または人が生
じる確率の減少を指す。したがって、参照対象または対象群と比較して、治療に応答する
可能性の低い対象は治療に応答する確率が減少する。

「対照メンバー」は、非腫瘍細胞由来の配列を有するメンバーを指す。

本明細書で使用される「インデルアライメント配列セレクタ」は、事前選択されたイン
デルの場合、読み取りがアライメントされる配列の選択を可能にするか、または指向する
パラメータを指す。そのような配列を用いて、インデルを含む事前選択されたサブゲノム
間隔の配列決定を最適化することができる。インデルアライメント配列セレクタの値は、
事前選択されたインデルの関数、例えば、インデルの識別子である。ある実施形態におい
て、値は、インデルの識別である。

本明細書で使用される「ライブラリ」という用語は、メンバーの収集物を指す。一実施
形態において、ライブラリは、核酸メンバーの収集物、例えば、全ゲノム、サブゲノム断
片、ｃＤＮＡ、ｃＤＮＡ断片、ＲＮＡ、ＲＮＡ断片、またはそれらの組み合わせの収集物
を含む。一実施形態において、ライブラリメンバーの一部またはすべては、アダプター配
列を含む。アダプター配列は、一方の末端または両方の末端に位置し得る。アダプター配
列は、例えば、増幅、逆転写、またはベクターへのクローニングのための配列決定方法（
例えば、ＮＧＳ方法）に有用であり得る。

ライブラリは、メンバーの収集物、例えば、標的メンバー（例えば、腫瘍メンバー、参
照メンバー、ＰＧｘメンバー、またはそれらの組み合わせ）を含み得る。ライブラリのメ
ンバーは、１人の個人由来であり得る。実施形態において、ライブラリは、１人を超える
対象（例えば、２、３、４、５、６、７、８、９、１０、２０、３０人、またはそれ以上
の対象）由来のメンバーを含んでもよく、例えば、異なる対象由来の２つ以上のライブラ
リを、１人を超える対象由来のメンバーを有するライブラリと合わせることができる。一
実施形態において、対象は、癌もしくは腫瘍を有するか、またはそれを有する危険性のあ
るヒトである。

「ライブラリ捕獲物」は、ライブラリのサブセット、例えば、事前選択されたサブゲノ
ム間隔に対して濃縮されたサブセット、例えば、事前選択されたベイトとのハイブリダイ
ゼーションによって捕捉された産物を指す。

本明細書で使用される「メンバー」もしくは「ライブラリメンバー」または他の同様の
用語は、ライブラリのメンバーである核酸分子、例えば、ＤＮＡ、ＲＮＡ、またはそれら
の組み合わせを指す。典型的には、メンバーは、ＤＮＡ分子、例えば、ゲノムＤＮＡまた
はｃＤＮＡである。メンバーは、断片化された、例えば、剪断されたか、または酵素的に
調製されたゲノムＤＮＡであり得る。メンバーは、対象由来の配列を含み、対象由来では
ない配列、例えば、アダプター配列、プライマー配列、または他の同定を可能にする配列
、例えば、「バーコード」配列も含み得る。

本明細書で使用される「次世代配列決定またはＮＧＳもしくはＮＧ配列決定」は、ハイ
スループット様式で、（例えば、単一分子配列決定における）個別の核酸分子または個別
の核酸分子のクローン的に広がったプロキシのいずれかのヌクレオチド配列を決定する（
例えば、１０^３、１０^４、１０^５より多いか、またはそれ以上の数の分子が同時に配列決
定される）任意の配列決定方法を指す。一実施形態において、配列決定実験によって生成
されるデータにおけるそれらの同族配列発生の相対数を計数することによって、ライブラ
リにおける核酸種の相対存在量を推定することができる。次世代配列決定方法は当技術分
野で既知であり、例えば、参照により本明細書に組み込まれるＭｅｔｚｋｅｒ，Ｍ．（２
０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：３１－４
６に記載されている。次世代配列決定は、試料中の核酸の５％未満に存在するバリアント
を検出することができる。

本明細書で言及される「ヌクレオチド値」は、事前選択されたヌクレオチド位置を占有
するか、またはそれに割り当てられるヌクレオチド（複数を含む）の識別を表す。典型的
なヌクレオチド値は、喪失（例えば、欠失）、付加（例えば、１つ以上のヌクレオチドの
挿入であり、その識別は含まれても含まれなくてもよい）、または存在（占有）、Ａ、Ｔ
、Ｃ、もしくはＧを含む。他の値は、例えば、Ｙでなくてもよく（Ｙは、Ａ、Ｔ、Ｇ、も
しくはＣである）、ＡもしくはＸ（Ｘは、Ｔ、Ｇ、もしくはＣのうちの１つもしくは２つ
である）、ＴもしくはＸ（Ｘは、Ａ、Ｇ、もしくはＣのうちの１つもしくは２つである）
、ＧもしくはＸ（Ｘは、Ｔ、Ａ、もしくはＣのうちの１つもしくは２つである）、Ｃもし
くはＸ（Ｘは、Ｔ、Ｇ、もしくはＡのうちの１つもしくは２つである）、ピリミジンヌク
レオチド、またはプリンヌクレオチドであり得る。ヌクレオチド値は、ヌクレオチド位置
における１個以上、例えば、２、３、もしくは４個の塩基の頻度（または本明細書に記載
の他の値、例えば、喪失または付加）であり得る。例えば、ヌクレオチド値は、ヌクレオ
チド位置におけるＡの頻度およびＧの頻度を含み得る。

本明細書で使用される「または」は、文脈が別途明確に示さない限り、「および／また
は」という用語を意味し、それと同義に使用される。本明細書のいくつかの箇所での「お
よび／または」という用語の使用は、文脈が別途明確に示さない限り、「または」という
用語の使用が「および／または」という用語と同義ではないことを意味しない。

「一次対照」は、腫瘍試料中のＮＡＴ組織以外の非腫瘍組織を指す。血液は、典型的な
一次対照である。

本明細書で使用される「再編成アライメント配列セレクタ」は、事前選択された再編成
の場合に、読み取りがアライメントされる配列の選択を可能にするか、または指向するパ
ラメータを指す。そのような配列の使用が、再編成を含む事前選択されたサブゲノム間隔
の配列決定を最適化することができる。再編成アライメント配列セレクタの値は、事前選
択された再編成の関数、例えば、再編成の識別子である。ある実施形態において、値は、
再編成の識別である。「インデルアライメント配列セレクタ」（本明細書の他の箇所でも
定義される）は、再編成アライメント配列セレクタの一例である。

「試料」、「組織試料」、「患者試料」、「患者細胞もしくは組織試料」、または「検
体」はそれぞれ、対象もしくは患者の組織または循環細胞から得られる同様の細胞の収集
物を指す。組織試料の供給源は、新鮮な、凍結し、かつ／もしくは保存された器官、組織
試料、生検、または吸引物；血液または任意の血液成分；脳脊髄液、羊水、腹水、もしく
は間質液等の体液；あるいは対象の妊娠または発達における任意の時点の細胞由来の固体
組織であり得る。組織試料は、防腐剤、抗凝固剤、緩衝液、固定剤、栄養剤、抗生物質等
の本質的に組織と自然混合されていない化合物を含有し得る。一実施形態において、試料
は、冷凍試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフ
ィン包埋（ＦＦＰＥ）組織調製物として保存される。例えば、試料を、マトリックス、例
えば、ＦＦＰＥブロックまたは冷凍試料に埋め込むことができる。

一実施形態において、試料は、腫瘍試料であり、例えば、１つ以上の前悪性または悪性
細胞を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組
織腫瘍、または転移病巣から取得される。他の実施形態では、試料、例えば、腫瘍試料は
、切除縁由来の組織または細胞を含む。別の実施形態では、試料、例えば、腫瘍試料は、
１つ以上の循環腫瘍細胞（ＣＴＣ）（例えば、血液試料から取得されたＣＴＣ）を含む。

本明細書で使用される「感度」は、方法が配列の不均一集団において事前選択された配
列バリアントを検出することができる尺度である。方法は、事前選択された配列バリアン
トが試料中で配列の少なくともＦ％で存在する試料を考慮して、方法がＣ％の事前選択さ
れた信頼度（Ｓ％の確率）で事前選択された配列を検出することができる場合、Ｆ％のバ
リアントに対してＳ％の感度を有する。例として、方法は、事前選択されたバリアント配
列が試料中で配列の少なくとも５％で存在する試料を考慮して、方法が９９％の事前選択
された信頼度（１０中９）で事前選択された配列を検出することができる場合（Ｆ＝５％
、Ｃ＝９９％、Ｓ＝９０％）、５％のバリアントに対して９０％の感度を有する。例とな
る感度は、Ｃ＝９０％、９５％、９９％、および９９．９％の信頼度レベルで、Ｆ＝１％
、５％、１０％、２０％、５０％、１００％の配列バリアントに対して、Ｓ＝９０％、９
５％、９９％の感度を含む。

本明細書で使用される「特異性」は、方法が偽りなく生じる事前選択された配列バリア
ントを配列決定アーチファクトまたは他の密接に関連した配列から見分けることができる
尺度である。これは、誤検出を回避する能力である。誤検出は、試料調製中に目的とする
配列に導入されたエラー、配列決定エラー、または偽遺伝子もしくは遺伝子ファミリーの
メンバー等の密接に関連した配列の不注意による配列決定に起因し得る。方法は、Ｘ_Ｔｒ
_ｕｅ個の配列が偽りのないバリアントであり、Ｘ_{Ｎｏｔｔｒｕｅ}が偽りのないバリアン
トではない、Ｎ_{Ｔｏｔａｌ}個の配列の試料セットに適用されるとき、方法が偽りのないバ
リアントではない配列の少なくともＸ％をバリアントではない配列として選択する場合、
Ｘ％の特異性を有する。例えば、方法は、５００個が偽りなくバリアント配列であり、５
００個が偽りのないバリアント配列である、１，０００個の配列の試料セットに適用され
るとき、方法が５００個の偽りのないバリアントではない配列の９０％をバリアントでは
ない配列としてを選択する場合、９０％の特異性を有する。例となる特異性は、９０、９
５、９８、および９９％を含む。

本明細書で使用される「腫瘍核酸試料」は、腫瘍または癌試料由来の核酸分子を指す。
典型的には、それは、腫瘍もしくは癌試料由来のＤＮＡ、例えば、ゲノムＤＮＡ、または
ＲＮＡ由来のｃＤＮＡである。ある特定の実施形態において、腫瘍核酸試料は、精製また
は単離される（例えば、その天然の状態から除去される）。

本明細書で使用される「対照」または「参照」「核酸試料」は、対照または参照試料由
来の核酸分子を指す。典型的には、これは、遺伝子もしくは遺伝子産物の変化または変異
を含有しないＤＮＡ、例えば、ゲノムＤＮＡ、またはＲＮＡ由来のｃＤＮＡである。ある
特定の実施形態において、参照または対照核酸試料は、野生型または非変異配列である。
ある特定の実施形態において、参照核酸試料は、精製または単離される（例えば、その天
然の状態から除去される）。他の実施形態では、参照核酸試料は、同一または異なる対象
由来の非腫瘍試料、例えば、血液対照、正常な隣接腫瘍（ＮＡＴ）、または任意の他の非
癌性試料に由来する。

核酸分子の「配列決定」は、分子中の少なくとも１個のヌクレオチドの識別の決定を必
要とする。実施形態において、分子中のヌクレオチドのうちのすべてより少ない識別が決
定される。他の実施形態では、分子中のヌクレオチドのうちの大多数またはすべての識別
が決定される。

本明細書で言及される「サブゲノム間隔」は、ゲノム配列の一部を指す。ある実施形態
において、サブゲノム間隔は、単一ヌクレオチド位置であり得、例えば、そのヌクレオチ
ド位置バリアントは、腫瘍表現型と（正または負に）関連する。ある実施形態において、
サブゲノム間隔は、１個を超えるヌクレオチド位置を含む。そのような実施形態は、少な
くとも２、５、１０、５０、１００、１５０、または２５０長のヌクレオチド位置の配列
を含む。サブゲノム間隔は、全遺伝子、またはその事前選択された部分、例えば、コード
領域（もしくはその部分）、事前選択されたイントロン（もしくはその部分）、またはエ
クソン（もしくはその部分）を含み得る。サブゲノム間隔は、自然発生の、例えば、ゲノ
ムの核酸の断片のすべてまたは一部を含み得る。例えば、サブゲノム間隔は、配列決定反
応に供されるゲノムＤＮＡの断片に相当し得る。実施形態において、サブゲノム間隔は、
ゲノムソース由来の連続配列である。実施形態において、サブゲノム間隔は、ゲノムにお
いて連続していない配列を含み、例えば、これは、ｃＤＮＡ中のエクソン－エクソン接合
部に見られる形成された接合部を含み得る。

ある実施形態において、サブゲノム間隔は、単一ヌクレオチド位置；遺伝子内領域また
は遺伝子間領域；エクソンもしくはイントロン、またはその断片、典型的には、エクソン
配列またはその断片；コード領域もしくは非コード領域、例えば、プロモーター、エンハ
ンサー、５’非翻訳領域（５’ＵＴＲ）、もしくは３’非翻訳領域（３’ＵＴＲ）、また
はその断片；ｃＤＮＡもしくはその断片；ＳＮＰ；体細胞変異、生殖細胞変異、もしくは
それら両方；変化、例えば、点もしくは単一変異；欠失変異（例えば、インフレーム欠失
、遺伝子内欠失、全遺伝子欠失）；挿入変異（例えば、遺伝子内挿入）；逆位変異（例え
ば、染色体内逆位）；連鎖変異；連鎖された挿入変異；逆位重複変異；タンデム重複（例
えば、染色体内タンデム重複）；転座（例えば、染色体転座、非相反転座）；再編成（例
えば、ゲノム再編成（例えば、１つ以上のイントロン、またはその断片の再編成；再編成
されたイントロンは、５’－および／もしくは３’－ＵＴＲを含み得る）；遺伝子コピー
数の変化；遺伝子発現の変化；ＲＮＡレベルの変化；あるいはそれらの組み合わせを含む
か、またはそれらからなる。「遺伝子のコピー数」とは、特定の遺伝子産物をコードする
細胞におけるＤＮＡ配列の数を指す。概して、所与の遺伝子の場合、哺乳動物は、それぞ
れの遺伝子の２つのコピーを有する。コピー数は、例えば、遺伝子増幅もしくは重複によ
り増加し得るか、または欠失により減少し得る。

本明細書で使用される「閾値」は、ヌクレオチド値をサブゲノム間隔に割り当てるため
に存在することが要求される読み取りの数の関数の値である。例えば、これは、サブゲノ
ム間隔においてそのヌクレオチド値をそのヌクレオチド位置に割り当てることが要求され
る、ヌクレオチド位置での特定のヌクレオチド値、例えば、Ａを有する読み取りの数の関
数である。閾値を、例えば、読み取りの数（もしくはその関数）として、例えば、整数、
または事前選択された値を有する読み取りの割合として表すことができる。例として、閾
値がＸであり、「Ａ」のヌクレオチド値を有するＸ＋１個の読み取りが存在する場合、「
Ａ」の値は、サブゲノム間隔において事前選択された位置に割り当てられる。閾値を、変
異またはバリアント予想、変異頻度、またはベイズ先行の関数として表すことができる。
ある実施形態において、事前選択された変異頻度は、そのヌクレオチド値を呼び出すため
に、事前選択された位置でヌクレオチド値、例えば、ＡもしくはＧを有する事前選択され
た数または割合の読み取りを必要とする。実施形態において、閾値は、変異予想、例えば
、変異頻度、および腫瘍型の関数であり得る。例えば、事前選択されたヌクレオチド位置
における事前選択されたバリアントは、患者が第１の腫瘍型を有する場合、第１の閾値を
有し得、患者が第２の腫瘍型を有する場合、第２の閾値を有し得る。

本明細書で使用される「標的メンバー」は、核酸ライブラリから単離することが所望さ
れる核酸分子を指す。一実施形態において、標的メンバーは、本明細書に記載の腫瘍メン
バー、参照メンバー、対照メンバー、またはＰＧｘメンバーであり得る。

本明細書で使用される「腫瘍メンバー」、または他の同様の用語（例えば、「腫瘍また
は癌関連メンバー」）は、腫瘍細胞由来の配列を有するメンバーを指す。一実施形態にお
いて、腫瘍メンバーは、癌表現型に関連した変化（例えば、変異）を有する配列（例えば
、ヌクレオチド配列）を有するサブゲノム間隔を含む。他の実施形態では、腫瘍メンバー
は、野生型配列（例えば、野生型ヌクレオチド配列）を有するサブゲノム間隔を含む。例
えば、ヘテロ接合性またはホモ接合性野生型対立遺伝子由来のサブゲノム間隔は、癌細胞
に存在する。腫瘍メンバーには、参照メンバーまたはＰＧｘメンバーが含まれ得る。

本明細書で使用される「参照メンバー」または他の同様の用語（例えば、「対照メンバ
ー」）は、癌表現型に関連しない配列（例えば、ヌクレオチド配列）を有するサブゲノム
間隔を含むメンバーを指す。一実施形態において、参照メンバーは、変異が癌表現型に関
連する場合に、遺伝子もしくは遺伝子産物の野生型または非変異ヌクレオチド配列を含む
。参照メンバーは、癌細胞または非癌細胞に存在し得る。

本明細書で使用される「ＰＧｘメンバー」または他の同様の用語は、遺伝子の薬理遺伝
学的または薬理ゲノム学的特性に関連したサブゲノム間隔を含むメンバーを指す。一実施
形態において、ＰＧｘメンバーは、ＳＮＰ（例えば、本明細書に記載のＳＮＰ）を含む。
他の実施形態では、ＰＧｘメンバーは、表１または表２に従うサブゲノム間隔を含む。

本明細書で使用される「バリアント」は、２個以上の構造を有し得るサブゲノム間隔で
存在し得る構造、例えば、多型遺伝子座における対立遺伝子を指す。

例えば、（ａ）、（ｂ）、（ｉ）等の見出しは、単に本明細書および特許請求の範囲の
解釈を簡略化するために提示される。本明細書または特許請求の範囲における見出しの使
用は、ステップもしくは要素をアルファベット順もしくは番号順、またはそれらが提示さ
れる順序で行うことを必要としない。
遺伝子または遺伝子産物の選択

選択された遺伝子または遺伝子産物（本明細書で「標的遺伝子または遺伝子産物」とも
称される）は、遺伝子内領域または遺伝子間領域を含むサブゲノム間隔を含み得る。例え
ば、サブゲノム間隔は、エクソンもしくはイントロン、またはその断片、典型的には、エ
クソン配列もしくはその断片を含み得る。サブゲノム間隔は、コード領域もしくは非コー
ド領域、例えば、プロモーター、エンハンサー、５’非翻訳領域（５’ＵＴＲ）、または
３’非翻訳領域（３’ＵＴＲ）、あるいはその断片を含み得る。他の実施形態では、サブ
ゲノム間隔は、ｃＤＮＡまたはその断片を含む。他の実施形態では、サブゲノム間隔は、
ＳＮＰ、例えば、本明細書に記載のＳＮＰを含む。

他の実施形態では、サブゲノム間隔、例えば、本明細書に記載のサブゲノム間隔のうち
の１つ以上は、ゲノム中の実質的にすべてのエクソン（例えば、目的とする選択された遺
伝子または遺伝子産物由来のエクソン（例えば、本明細書に記載の癌表現型に関連した遺
伝子または遺伝子産物））を含む。一実施形態において、サブゲノム間隔は、体細胞変異
、生殖細胞変異、またはこれら両方を含む。一実施形態において、サブゲノム間隔は、変
化、例えば、点変異もしくは単一変異、欠失変異（例えば、インフレーム欠失、遺伝子内
欠失、全遺伝子欠失）、挿入変異（例えば、遺伝子内挿入）、逆位変異（例えば、染色体
内逆位）、連鎖変異、連鎖された挿入変異、逆位重複変異、タンデム重複（例えば、染色
体内タンデム重複）、転座（例えば、染色体転座、非相反転座）、再編成、遺伝子コピー
数の変化、またはそれらの組み合わせを含む。ある特定の実施形態において、サブゲノム
間隔は、試料中の腫瘍細胞のゲノムのコード領域の５、１、０．５、０．１％、０．０１
％、０．００１％未満を構成する。他の実施形態では、サブゲノム間隔は、疾患に関与せ
ず、例えば、本明細書に記載の癌表現型に関連しない。

一実施形態において、標的遺伝子または遺伝子産物は、バイオマーカーである。本明細
書で使用される「バイオマーカー」または「マーカー」は、変化することができる遺伝子
、ｍＲＮＡ、またはタンパク質であり、該変化は、癌に関連する。変化は、正常もしくは
健常な組織または細胞（例えば、対照）におけるその量、構造、および／または活性と比
較した、癌組織または癌細胞の量、構造、および／または活性の変化であり得、癌等の病
状に関連する。例えば、癌に関連したマーカー、または抗癌治療に対する応答性を予測す
るマーカーは、正常かつ健康な組織もしくは細胞と比較して、癌組織もしくは癌細胞にお
けるヌクレオチド配列、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベ
ル、タンパク質レベル、タンパク質活性、またはメチル化状態の変化を有し得る。さらに
、「マーカー」は、癌等の病状に関連した組織もしくは細胞に存在するときに、その構造
が変化する、例えば、変異する（変異を含有する）、例えば、ヌクレオチドまたはアミノ
酸レベルで野生型配列とは、例えば、置換、欠失、または挿入の分だけ異なる分子を含む
。

一実施形態において、標的遺伝子または遺伝子産物は、単一ヌクレオチド多型（ＳＮＰ
）を含む。別の実施形態では、遺伝子または遺伝子産物は、小さい欠失、例えば、小さい
遺伝子内欠失（例えば、インフレームまたはフレームシフト欠失）を有する。さらに別の
実施形態では、標的配列は、全遺伝子の欠失に起因する。さらに別の実施形態では、標的
配列は、小さい挿入、例えば、小さい遺伝子内挿入を有する。一実施形態において、標的
配列は、逆位、例えば、染色体内逆位に起因する。別の実施形態では、標的配列は、染色
体間転座に起因する。さらに別の実施形態では、標的配列は、タンデム重複を有する。一
実施形態において、標的配列は、望ましくない特徴（例えば、高ＧＣ含量または反復要素
）を有する。別の実施形態では、標的配列は、例えば、その反復性のため、それ自体うま
く標的化されることができないヌクレオチド配列の一部を有する。一実施形態において、
標的配列は、選択的スプライシングに起因する。別の実施形態では、標的配列は、表１、
１Ａ、２、３、または４に従う遺伝子もしくは遺伝子産物、またはその断片から選択され
る。

癌には、Ｂ細胞癌、例えば、多発性骨髄腫、黒色腫、乳癌、肺癌（非小細胞肺癌または
ＮＳＣＬＣ等）、気管支癌、結腸直腸癌、前立腺癌、膵臓癌、胃癌（ｓｔｏｍａｃｈｃ
ａｎｃｅｒ）、卵巣癌、膀胱癌（ｕｒｉｎａｒｙｂｌａｄｄｅｒｃａｎｃｅｒ）、脳
または中枢神経系の癌、末梢神経系の癌、食道癌、子宮頸癌、子宮または子宮内膜癌、口
腔または咽頭癌、肝臓癌、腎臓癌、睾丸癌、胆道癌、小腸または虫垂癌、唾液腺癌、甲状
腺癌、副腎癌、骨肉腫、軟骨肉腫、血液組織の癌、腺癌、炎症性筋線維芽腫瘍、消化管間
質腫瘍（ＧＩＳＴ）、結腸癌、多発性骨髄腫（ＭＭ）、骨髄異形成症候群（ＭＤＳ）、骨
髄増殖症候群（ＭＰＤ）、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）
、慢性骨髄性白血病（ＣＭＬ）、慢性リンパ球性白血病（ＣＬＬ）、真性赤血球増加症、
ホジキンリンパ腫、非ホジキンリンパ腫（ＮＨＬ）、軟部組織肉腫、線維肉腫、粘液肉腫
、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、
滑液腫瘍、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮癌、基底細胞癌
、腺癌、汗腺癌、脂腺癌、乳頭癌、乳頭腺癌、髄様癌、気管支癌、腎細胞癌、肝癌、胆管
癌、絨毛腫、セミノーマ、胎生期癌、ウィルムス腫瘍、膀胱癌（ｂｌａｄｄｅｒｃａｒ
ｃｉｎｏｍａ）、上皮癌、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣細胞腫
、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞
腫、濾胞性リンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、肝細胞
癌、甲状腺癌、胃癌（ｇａｓｔｒｉｃｃａｎｃｅｒ）、頭頸部癌、小細胞癌、本態性血
小板血症、原発性骨髄線維症、好酸球増加症候群、全身性肥満細胞症、家族性過好酸球増
加症、慢性好酸球性白血病、神経内分泌癌、カルチノイド腫瘍等が含まれるが、これらに
限定されない。

一実施形態において、標的遺伝子もしくは遺伝子産物は、ＡＢＣＢ１、ＡＢＣＣ２、Ａ
ＢＣＣ４、ＡＢＣＧ２、ＡＢＬ１、ＡＢＬ２、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、
ＡＰＣ、ＡＲ、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ、
ＡＵＲＫＢ、ＢＣＬ２、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＲＡ
Ｆ、ＢＲＣＡ１、ＢＲＣＡ２、Ｃ１ｏｒｆ１４４、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ１、
ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５、Ｃ
ＤＫ４、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ａ、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＥＢＰＡ
、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫＬ、ＣＲＬＦ２、ＣＴＮＮＢ１、ＣＹＰ１Ｂ１、ＣＹ
Ｐ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＮＭＴ３Ａ
、ＤＯＴ１Ｌ、ＤＰＹＤ、ＥＧＦＲ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、ＥＰＨＡ７
、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ６、ＥＲＢＢ２、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＣ
Ｃ２、ＥＲＧ、ＥＳＲ１、ＥＳＲ２、ＥＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷＳ
Ｒ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ７、ＦＣＧＲ３Ａ、ＦＧＦＲ１、ＦＧＦＲ２、Ｆ
ＧＦＲ３、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ３、ＦＬＴ４、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮ
Ａ１１、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＳＴＰ１、ＧＵＣＹ１Ａ２、ＨＯＸＡ３
、ＨＲＡＳ、ＨＳＰ９０ＡＡ１、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢ
ＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２、ＩＴＰＡ、ＪＡＫ１、ＪＡＫ２、ＪＡＫ３、
ＪＵＮ、ＫＤＲ、ＫＩＴ、ＫＲＡＳ、ＬＲＰ１Ｂ、ＬＲＰ２、ＬＴＫ、ＭＡＮ１Ｂ１、Ｍ
ＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＮ１、
ＭＥＴ、ＭＩＴＦ、ＭＬＨ１、ＭＬＬ、ＭＰＬ、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、Ｍ
ＴＨＦＲ、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣ、ＭＹＣＬ１、ＭＹＣＮ、ＮＦ１、ＮＦ２、Ｎ
ＫＸ２－１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＱＯ１、ＮＲＡＳ、ＮＲＰ２、ＮＴＲＫ１、Ｎ
ＴＲＫ３、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＡ、ＰＤＧＦＲＢ、ＰＩＫ３ＣＡ、ＰＩＫ３
Ｒ１、ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＣＨ１、ＰＴＥＮ、ＰＴＰＮ１１、Ｐ
ＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ、ＲＢ１、ＲＥＴ、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ
１、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ１Ｂ３、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭ
ＡＤ４、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＯＤ２、ＳＯＸ１０、ＳＯＸ２、
ＳＲＣ、ＳＴＫ１１、ＳＵＬＴ１Ａ１、ＴＢＸ２２、ＴＥＴ２、ＴＧＦＢＲ２、ＴＭＰＲ
ＳＳ２、ＴＯＰ１、ＴＰ５３、ＴＰＭＴ、ＴＳＣ１、ＴＳＣ２、ＴＹＭＳ、ＵＧＴ１Ａ１
、ＵＭＰＳ、ＵＳＰ９Ｘ、ＶＨＬ、およびＷＴ１からなる群から選択される全長のものま
たはそれらの断片から選択される。

一実施形態において、標的遺伝子もしくは遺伝子産物、またはその断片は、薬理遺伝学
および薬理ゲノム学（ＰＧｘ）、例えば、薬物代謝および毒性に関連する１つ以上のＳＮ
Ｐを有する。例となる遺伝子または遺伝子産物には、ＡＢＣＢ１、ＡＢＣＣ２、ＡＢＣＣ
４、ＡＢＣＧ２、Ｃ１ｏｒｆ１４４、ＣＹＰ１Ｂ１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、Ｃ
ＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＰＹＤ、ＥＲＣＣ２、ＥＳＲ２、ＦＣＧＲ
３Ａ、ＧＳＴＰ１、ＩＴＰＡ、ＬＲＰ２、ＭＡＮ１Ｂ１、ＭＴＨＦＲ、ＮＱＯ１、ＮＲＰ
２、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ１Ｂ３、ＳＯＤ２、ＳＵＬＴ１Ａ１、Ｔ
ＰＭＴ、ＴＹＭＳ、ＵＧＴ１Ａ１、およびＵＭＰＳが含まれるが、これらに限定されない
。

別の実施形態では、標的遺伝子もしくは遺伝子産物、またはその断片は、癌に関連した
１つ以上のコドンを有する。例となる遺伝子または遺伝子産物には、ＡＢＬ１（例えば、
コドン３１５）、ＡＫＴ１、ＡＬＫ、ＡＰＣ（例えば、コドン１１１４、１３３８、１４
５０、および１５５６）、ＡＲ、ＢＲＡＦ（例えば、コドン６００）、ＣＤＫＮ２Ａ、Ｃ
ＥＢＰＡ、ＣＴＮＮＢ１（例えば、コドン３２、３３、３４、３７、４１、および４５）
、ＥＧＦＲ（例えば、７１９、７４６－７５０、７６８、７９０、８５８、および８６１
）、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３（例えば、
コドン８３５）、ＨＲＡＳ（例えば、コドン１２、１３、および６１）、ＪＡＫ２（例え
ば、コドン６１７）、ＫＩＴ（例えば、コドン８１６）、ＫＲＡＳ（例えば、コドン１２
、１３、および６１）、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、Ｎ
ＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ（例えば、コドン８８、５４２、５４５、５４６、
１０４７、および１０４９）、ＰＴＥＮ（例えば、コドン１３０、１７３、２３３、およ
び２６７）、ＲＢ１、ＲＥＴ（例えば、コドン９１８）、ＴＰ５３（例えば、１７５、２
４５、２４８、２７３、および３０６）が含まれるが、これらに限定されない。

さらに別の実施形態では、標的遺伝子もしくは遺伝子産物、またはその断片は、癌に関
連する。例となる遺伝子または遺伝子産物には、ＡＢＬ２、ＡＫＴ２、ＡＫＴ３、ＡＲＡ
Ｆ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ、ＡＵＲＫＢ、ＢＣＬ２
、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＲＣＡ１、ＢＲＣＡ２、Ｃ
ＡＲＤ１１、ＣＢＬ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＤＨ１、Ｃ
ＤＨ２、ＣＤＨ２０、ＣＤＨ５、ＣＤＫ４、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ｂ、ＣＤＫ
Ｎ２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫＬ、ＣＲＬＦ２、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、
ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、ＥＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ
６、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、ＥＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷ
ＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ７、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ４、ＦＯＸ
Ｐ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＵＣＹ１Ａ２、
ＨＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢ
ＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＤＲ、ＬＲ
Ｐ１Ｂ、ＬＴＫ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、Ｍ
ＤＭ４、ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、
ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、ＮＦ２、ＮＫＸ２－１、ＮＴＲＫ１、Ｎ
ＴＲＫ３、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、ＰＩＫ３Ｒ１、ＰＫＨＤ１、ＰＬＣＧ１
、ＰＲＫＤＣ、ＰＴＣＨ１、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ、ＲＩＣＴ
ＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭＡＲＣＡ４
、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＯＸ１０、ＳＯＸ２、ＳＲＣ、ＳＴＫ１１、ＴＢＸ２２、
ＴＥＴ２、ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＯＰ１、ＴＳＣ１、ＴＳＣ２、ＵＳＰ９Ｘ
、ＶＨＬ、およびＷＴ１が含まれるが、これらに限定されない。

前述の方法の適用は、医学検体における配列決定のために特定の遺伝子または遺伝子の
すべての既知の配列バリアント（またはそのサブセット）を含有するオリゴヌクレオチド
のライブラリの使用を含む。
遺伝子選択モジュール

このモジュールは、本発明で取り上げられる方法で用いる複数の組のサブゲノム間隔、
例えば、本明細書に記載の遺伝子および他の領域の複数の組または群のサブゲノム間隔を
開示する。

１名以上の対象由来の試料、例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物を
配列決定するための最適化方法およびアッセイが開示される。一実施形態において、本発
明で特色とする方法およびアッセイ、例えば、多数の遺伝子に多数の様々な遺伝的事象か
らの複数のシグナルを組み込むアッセイは、マルチプレックスな多重遺伝子アッセイ形式
で使用される。癌表現型（例えば、癌の危険性、癌進行、癌治療応答、または癌治療に対
する抵抗のうちの１つ以上）に（例えば、正もしくは負に）関連する事前選択された組の
遺伝子または遺伝子産物に少なくともある程度基づく方法およびアッセイが本明細書に開
示される。そのような事前選択された遺伝子または遺伝子産物は、配列決定方法、具体的
には、例えば、腫瘍または対照試料由来の多数の様々な遺伝子の大規模並列配列決定に依
存する方法の適用を可能にする

したがって、本発明は、試料、例えば、腫瘍試料を分析する方法を特色とする。方法は
、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
（ｂ）任意で、例えば、ライブラリをベイトセット（または複数のベイトセット）と接
触させることによって、事前選択された配列のライブラリを濃縮して、選択されたメンバ
ー（本明細書でライブラリ捕獲物と称される場合もある）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す）ことと、を含み、
それによって、該腫瘍試料を分析し、
方法は、例えば、次世代配列決定方法を用いて、試料由来の少なくとも５、６、７、８、
９、１０、１５、２０、２５、３０個、もしくはそれ以上の遺伝子もしくは遺伝子産物由
来のサブゲノム間隔を配列決定することを含み、遺伝子もしくは遺伝子産物は、ＡＢＬ１
、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤ
Ｋ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、Ｆ
ＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ
、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰ
Ｍ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ
１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦ
Ｕ、またはＴＰ５３から選択される。

したがって、実施形態において、方法は、例えば、次世代配列決定方法を用いて、取得
された核酸試料由来の少なくとも５、６、７、８、９、１０、１５、２０、２５、３０個
、もしくはそれ以上の遺伝子もしくは遺伝子産物由来のサブゲノム間隔を配列決定するこ
とを含み、遺伝子もしくは遺伝子産物は、ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、Ａ
ＬＫ、ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、Ｃ
ＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、
ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥ
Ｔ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧ
ＦＲＡ、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥ
Ｎ、ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦＵ、またはＴＰ５３から選択され、そ
れによって、腫瘍試料を分析する。

ある特定の実施形態において、方法またはアッセイは、ＡＢＬ２、ＡＲＡＦ、ＡＲＦＲ
Ｐ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ、ＡＵＲＫＢ、ＢＡＰ１、ＢＣＬ２、
ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＲＣＡ１、ＢＲＣＡ２、ＣＢ
Ｌ、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＤ７９Ａ、ＣＤ７
９Ｂ、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ｂ
、ＣＤＫＮ２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫＬ、ＣＲＬＦ２、ＤＮＭＴ３Ａ、ＤＯ
Ｔ１Ｌ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、ＥＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、
ＥＰＨＢ６、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、ＥＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ
６、ＥＷＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ７、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ４
、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＵＣＹ
１Ａ２、ＨＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ
、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＤ
Ｍ６Ａ、ＫＤＲ、ＬＲＰ１Ｂ、ＬＲＰ６、ＬＴＫ、ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、
ＭＤＭ４、ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６
、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、ＮＦ２、ＮＫＸ２－１、ＮＴＲＫ１、
ＮＴＲＫ２、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ
、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮ
Ｘ１、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＯＸ
１０、ＳＯＸ２、ＳＲＣ、ＴＢＸ２２、ＴＥＴ２、ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＮ
ＦＡＩＰ３、ＴＮＫ、ＴＮＫＳ２、ＴＯＰ１、ＴＳＣ１、ＴＳＣ２、ＵＳＰ９Ｘ、ＶＨＬ
、またはＷＴ１のうちの１、２、３、４、５、１０、１５、２０、２５、３０、３５、４
０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１
０５、１１０、１１５、１２０個、もしくはそれ以上から選択される遺伝子または遺伝子
産物由来のサブゲノム間隔を配列決定することをさらに含む。

他の実施形態では、方法またはアッセイは、薬物代謝、薬物応答性、または毒性のうち
の１つ以上に関連した遺伝子もしくは遺伝子産物（本明細書で「ＰＧｘ」遺伝子とも称さ
れる）中に存在するサブゲノム間隔を配列決定することをさらに含む。ある特定の実施形
態において、配列決定されるサブゲノム間隔は、変化（例えば、単一ヌクレオチド多型（
ＳＮＰ））を含む。一実施形態において、配列決定されるサブゲノム間隔は、ＡＢＣＢ１
、ＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、Ｃ１ｏｒｆ１４４、ＣＹＰ１Ｂ１、ＣＹＰ２Ｃ１
９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＰＹＤ、ＥＲＣＣ２
、ＥＳＲ２、ＦＣＧＲ３Ａ、ＧＳＴＰ１、ＩＴＰＡ、ＬＲＰ２、ＭＡＮ１Ｂ１、ＭＴＨＦ
Ｒ、ＮＱＯ１、ＮＲＰ２、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ１Ｂ３、ＳＯＤ２
、ＳＵＬＴ１Ａ１、ＴＰＭＴ、ＴＹＭＳ、ＵＧＴ１Ａ１、またはＵＭＰＳのうちの１、２
、３、４、５、１０、１５、２０、２５、３０個、もしくはそれ以上から選択される遺伝
子または遺伝子産物に由来する。

他の実施形態では、方法またはアッセイは、ＡＲＦＲＰ１、ＢＣＬ２Ａ１、ＣＡＲＤ１
１、ＣＤＨ２０、ＣＤＨ５、ＤＤＲ２、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ７、ＥＰＨＢ
１、ＦＯＸＰ４、ＧＰＲ１２４、ＧＵＣＹ１Ａ２、ＩＮＳＲ、ＬＲＰ１Ｂ、ＬＴＫ、ＰＡ
Ｋ３、ＰＨＬＰＰ２、ＰＬＣＧ１、ＰＴＰＲＤ、ＳＴＡＴ３、ＴＢＸ２２、またはＵＳＰ
９Ｘのうちの１、２、３、４、５、１０、１５、２０個、もしくはそれ以上から選択され
る遺伝子または遺伝子産物中に存在するサブゲノム間隔を配列決定することをさらに含む
。

ある特定の実施形態において、核酸試料の配列決定されたサブゲノム間隔は、表１もし
くは表１Ａの少なくとも５０、７５、１００、１５０、２００個、もしくはそれ以上の遺
伝子または遺伝子産物由来のヌクレオチド配列を含む。他の実施形態では、核酸試料の配
列決定されたサブゲノム間隔は、表１もしくは表１Ａに明記される癌型由来の腫瘍試料か
ら取得された表１もしくは表１Ａの少なくとも５０、７５、１００、１５０、２００個、
もしくはそれ以上の遺伝子または遺伝子産物由来のヌクレオチド配列を含む。さらに他の
実施形態では、配列決定されたサブゲノム間隔は、表１もしくは表１Ａに従う優先順位が
１の遺伝子およびＰＧｘ遺伝子（例えば、表１もしくは表１Ａに従う、少なくとも５、１
０、２０、もしくは３０個の優先順位が１の遺伝子、および少なくとも５、１０、２０、
もしくは３０個のＰＧＸ遺伝子）との組み合わせを含む。他の実施形態では、配列決定さ
れたサブゲノム間隔は、表１もしくは表１Ａに従う、優先順位が１の遺伝子、癌遺伝子、
およびＰＧｘ遺伝子（例えば、表１もしくは表１Ａに従う、少なくとも５、１０、２０、
もしくは３０個の優先順位が１の遺伝子；少なくとも５、１０、２０、もしくは３０個の
癌遺伝子；および少なくとも５、１０、２０、もしくは３０個のＰＧＸ遺伝子）の組み合
わせを含む。

ある特定の実施形態において、核酸試料の配列決定されたサブゲノム間隔は、ＡＢＬ１
遺伝子のコドン３１５；ＡＰＣのコドン１１１４、１３３８、１４５０、もしくは１５５
６；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコドン３２、３３、３４、３７、４１、も
しくは４５；ＥＧＦＲのコドン７１９、７４６～７５０、７６８、７９０、８５８、もし
くは８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳのコドン１２、１３、もしくは６１；Ｊ
ＡＫ２のコドン６１７；ＫＩＴのコドン８１６；ＫＲＡＳのコドン１２、１３、もしくは
６１；ＰＩＫ３ＣＡのコドン８８、５４２、５４５、５４６、１０４７、もしくは１０４
９；ＰＴＥＮのコドン１３０、１７３、２３３、もしくは２６７；ＲＥＴのコドン９１８
；ＴＰ５３のコドン１７５、２４５、２４８、２７３、もしくは３０６のうちの１つ以上
から選択されるコドンを含む。ある特定の実施形態において、前述のコドンのうちの２、
３、４、５、１０、１５、２０個、もしくはそれ以上が配列決定される。他の実施形態で
は、配列決定されたサブゲノム間隔は、表１もしくは表１Ａに示されるコドンのうちの１
つ以上を含む。

他の実施形態では、核酸試料の配列決定されたサブゲノム間隔は、表１の少なくとも１
、５、１０、１５、２０、２５個、もしくはそれ以上のＰＧｘ遺伝子または遺伝子産物由
来のヌクレオチド配列を含む。他の実施形態では、核酸試料の配列決定されたサブゲノム
間隔は、表２の少なくとも１、５、１０、１５、２０、２５、３０、３５、４０、４５、
５０、７５個、もしくはそれ以上のＰＧｘ遺伝子または遺伝子産物由来のヌクレオチド配
列を含む。さらに他の実施形態では、配列決定されたサブゲノム間隔は、薬物代謝、薬物
応答性、薬物毒性、または副作用のうちの１つ以上に関連した表２に従う少なくとも１つ
のＰＧｘ遺伝子（および／または少なくとも１つのＰＧｘ遺伝子変異）由来のヌクレオチ
ド配列を含む。例えば、配列決定されたサブゲノム間隔は、薬物で治療された癌患者のよ
り良好な生存率（例えば、パクリタキセル（例えば、ＡＢＣＢ１遺伝子）で治療された乳
癌患者のより良好な生存率）に関連した少なくとも１個のＰＧｘ遺伝子由来のヌクレオチ
ド配列を含み得る。他の実施形態では、配列決定されたサブゲノム間隔は、パクリタキセ
ル代謝（例えば、表２に示される異なる遺伝子座および変異におけるＣＹＰ２Ｃ８遺伝子
、ＣＹＰ３Ａ４遺伝子）に関連する。さらに他の実施形態では、配列決定されたサブゲノ
ム間隔は、薬物に対する毒性（例えば、ＡＢＣＣ４遺伝子で見られる６－ＭＰ毒性（表２
）；ＤＰＹＤ遺伝子、ＴＹＭＳ遺伝子、およびＵＭＰＳ遺伝子で見られる５－ＦＵ毒性（
表２）；ＴＭＰＴ遺伝子で見られるプリン毒性（表２）；ＮＲＰ２遺伝子、Ｃｌｏｒｆ１
４４遺伝子、ＣＹＰ１Ｂ１遺伝子で見られるダウノルビシン毒性（表２））に関連する。
他の実施形態では、配列決定されたサブゲノム間隔は、薬物の副作用（例えば、ＡＢＣＧ
２、ＴＹＭＳ、ＵＧＴ１Ａ１、ＥＳＲ１、およびＥＳＲ２遺伝子（表２））に関連する。

別の実施形態では、以下の組または群のうちの１つ由来のサブゲノム間隔、例えば、腫
瘍または癌遺伝子もしくは遺伝子産物、参照（例えば、野生型）遺伝子もしくは遺伝子産
物、またはＰＧｘ遺伝子もしくは遺伝子産物に関連したサブゲノム間隔が分析され、それ
によって、腫瘍試料由来のサブゲノム間隔の選択されたサブセットが得られる。

ある実施形態において、方法は、腫瘍試料由来のサブゲノム間隔のサブセットを配列決
定し、サブゲノム間隔は、以下のうちの少なくとも１、２、３、４、５、６、７、８、９
、１０、１１、１２、１３個、もしくはすべてから選択される：
Ａ）ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲＡＦ、Ｃ
ＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２
、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、Ｋ
ＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯ
ＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＩＫ３Ｃ
Ｇ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴ
Ｋ１１、ＳＵＦＵ、またはＴＰ５３のうちの少なくとも５つ以上から選択される変異また
は野生型遺伝子もしくは遺伝子産物由来の少なくとも５、６、７、８、９、１０、１５、
２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｂ）ＡＢＬ２、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ
、ＡＵＲＫＢ、ＢＡＰ１、ＢＣＬ２、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣ
Ｌ６、ＢＲＣＡ１、ＢＲＣＡ２、ＣＢＬ、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ２、ＣＣＮＤ
３、ＣＣＮＥ１、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５
、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫ
Ｌ、ＣＲＬＦ２、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、Ｅ
ＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ６、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、Ｅ
ＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ
７、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ４、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ
、ＧＮＡＳ、ＧＰＲ１２４、ＧＵＣＹ１Ａ２、ＨＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１
、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２
、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＤＭ６Ａ、ＫＤＲ、ＬＲＰ１Ｂ、ＬＲＰ６、ＬＴＫ、
ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ
、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、
ＮＦ２、ＮＫＸ２－１、ＮＴＲＫ１、ＮＴＲＫ２、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、
ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ
、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭ
ＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＯＸ１０、ＳＯＸ２、ＳＲＣ、ＴＢＸ２２、ＴＥＴ２、
ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＮＦＡＩＰ３、ＴＮＫ、ＴＮＫＳ２、ＴＯＰ１、ＴＳ
Ｃ１、ＴＳＣ２、ＵＳＰ９Ｘ、ＶＨＬ、またはＷＴ１のうちの少なくとも５つ以上から選
択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも５、６、７、８、
９、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０
、７５、８０、８５、９０、９５、１００、１０５、１１０、１１５、１２０個、もしく
はそれ以上のサブゲノム間隔、
Ｃ）表１、１Ａ、２、３、もしくは４に従う遺伝子もしくは遺伝子産物由来の少なくと
も５、６、７、８、９、１０、１５、２０個、もしくはそれ以上のサブゲノム間隔、
Ｄ）腫瘍もしくは癌に関連した（例えば、腫瘍もしくは癌の正もしくは負の治療応答予
測因子であるか、腫瘍もしくは癌の正もしくは負の予後因子であるか、または腫瘍もしく
は癌の差次的診断を可能にする）遺伝子もしくは遺伝子産物、例えば、ＡＢＬ１、ＡＫＴ
１、ＡＬＫ、ＡＲ、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、ＣＥＢＰＡ、ＥＧＦＲ、ＥＲＢ
Ｂ２、ＦＬＴ３、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＮＰＭ１、ＰＤＧＦＲＡ、ＰＩ
Ｋ３ＣＡ、ＲＡＲＡ、ＡＫＴ２、ＡＫＴ３、ＭＡＰ２Ｋ４、ＮＯＴＣＨ１、およびＴＰ５
３のうちの１つ以上から選択される遺伝子もしくは遺伝子産物由来の少なくとも５、６、
７、８、９、１０、１５、２０個、もしくはそれ以上のサブゲノム間隔、
Ｅ）ＡＢＬ１遺伝子のコドン３１５；ＡＰＣのコドン１１１４、１３３８、１４５０、
もしくは１５５６；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコドン３２、３３、３４、
３７、４１、もしくは４５；ＥＧＦＲのコドン７１９、７４６－７５０、７６８、７９０
、８５８、もしくは８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳのコドン１２、１３、も
しくは６１；ＪＡＫ２のコドン６１７；ＫＩＴのコドン８１６；ＫＲＡＳのコドン１２、
１３、もしくは６１；ＰＩＫ３ＣＡのコドン８８、５４２、５４５、５４６、１０４７、
もしくは１０４９；ＰＴＥＮのコドン１３０、１７３、２３３、もしくは２６７；ＲＥＴ
のコドン９１８；ＴＰ５３のコドン１７５、２４５、２４８、２７３、もしくは３０６の
うちの１つ以上から選択される変異コドンまたは野生型コドンを含む、少なくとも５、６
、７、８、９、１０個、もしくはそれ以上のサブゲノム間隔（例えば、表１もしくは表１
Ａに示されるコドンのうちの１つ以上を含む、少なくとも５、１０、１５、２０個、もし
くはそれ以上のサブゲノム間隔）、
Ｆ）ＡＢＣＢ１、ＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、Ｃ１ｏｒｆ１４４、ＣＹＰ１Ｂ
１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＰ
ＹＤ、ＥＲＣＣ２、ＥＳＲ２、ＦＣＧＲ３Ａ、ＧＳＴＰ１、ＩＴＰＡ、ＬＲＰ２、ＭＡＮ
１Ｂ１、ＭＴＨＦＲ、ＮＱＯ１、ＮＲＰ２、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ
１Ｂ３、ＳＯＤ２、ＳＵＬＴ１Ａ１、ＴＰＭＴ、ＴＹＭＳ、ＵＧＴ１Ａ１、またはＵＭＰ
Ｓから選択される薬物代謝、薬物応答性、または毒性のうちの１つ以上に関連した遺伝子
または遺伝子産物に存在するサブゲノム間隔の変異または野生型遺伝子もしくは遺伝子産
物（例えば、単一ヌクレオチド多型（ＳＮＰ））由来の少なくとも５、６、７、８、９、
１０、１５、２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｇ）（ｉ）薬物で治療された癌患者のより良好な生存率（例えば、パクリタキセル（例
えば、ＡＢＣＢ１遺伝子）で治療された乳癌患者のより良好な生存率）、（ｉｉ）パクリ
タキセル代謝（例えば、表２に示される異なる遺伝子座および変異におけるＣＹＰ２Ｃ８
遺伝子、ＣＹＰ３Ａ４遺伝子）、（ｉｉｉ）薬物に対する毒性（例えば、ＡＢＣＣ４遺伝
子で見られる６－ＭＰ毒性（表２）；ＤＰＹＤ遺伝子、ＴＹＭＳ遺伝子、もしくはＵＭＰ
Ｓ遺伝子で見られる５－ＦＵ毒性（表２）；ＴＭＰＴ遺伝子で見られるプリン毒性（表２
）；ＮＲＰ２遺伝子、Ｃｌｏｒｆ１４４遺伝子、ＣＹＰ１Ｂ１遺伝子で見られるダウノル
ビシン毒性（表２）、または（ｉｖ）薬物の副作用（例えば、ＡＢＣＧ２、ＴＹＭＳ、Ｕ
ＧＴ１Ａ１、ＥＳＲ１、およびＥＳＲ２遺伝子（表２））のうちの１つ以上に関連した遺
伝子もしくは遺伝子産物に存在するサブゲノム間隔の変異または野生型ＰＧｘ遺伝子もし
くは遺伝子産物（例えば、単一ヌクレオチド多型（ＳＮＰ））由来の少なくとも５、６、
７、８、９、１０、１５、２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｈ）表３に従う少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、５
０、７５、１１０個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化、
Ｊ）表３に明記される癌型由来の固形腫瘍試料における、表３に従う少なくとも５、１
０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１１０個、もしくはそれ
以上の遺伝子もしくは遺伝子産物の転座変化、
Ｋ）表４に従う少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、５
０、７５、１００、１５０、２００個、もしくはそれ以上の遺伝子もしくは遺伝子産物の
転座変化、
Ｌ）表４に明記される癌型由来のヘム腫瘍試料における、表４に従う少なくとも５、１
０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００
個、もしくはそれ以上の遺伝子もしくは遺伝子産物の転座変化、
Ｍ）例えば、事前選択された位置での対立遺伝子変異は、事前選択された腫瘍型に関連
し、該対立遺伝子変異は、該腫瘍型の細胞の５％未満に存在する、表１、表１Ａ－４から
選択される少なくとも５個の遺伝子もしくは遺伝子産物、
Ｎ）ＧＣが豊富な領域に埋め込まれる表１、表１Ａ－４から選択される少なくとも５個
の遺伝子もしくは遺伝子産物、あるいは
Ｏ）癌を発現させる遺伝（例えば、生殖細胞系危険）因子を示す少なくとも５個の遺伝
子もしくは遺伝子産物（例えば、遺伝子もしくは遺伝子産物は、ＢＲＣＡ１、ＢＲＣＡ２
、ＥＧＦＲ、ＨＲＡＳ、ＫＩＴ、ＭＰＬ、ＡＬＫ、ＰＴＥＮ、ＲＥＴ、ＡＰＣ、ＣＤＫＮ
２Ａ、ＭＬＨ１、ＭＳＨ２、ＭＳＨ６、ＮＦ１、ＮＦ２、ＲＢ１、ＴＰ５３、ＶＨＬ、ま
たはＷＴ１のうちの１つ以上から選択される）。

ある特定の実施形態において、方法またはアッセイを取得するステップは、該腫瘍試料
由来の本明細書に記載の複数の腫瘍または癌関連メンバー、参照メンバー、および／また
はＰＧｘメンバーを含むライブラリを取得することを含む。ある特定の実施形態において
、選択するステップは、例えば、それぞれ、本明細書に記載の遺伝子または遺伝子産物由
来のサブゲノム間隔を含む、腫瘍もしくは癌関連メンバー、参照メンバー（例えば、野生
型メンバー）、またはＰＧｘメンバーを選択または濃縮するために、溶液ベースのハイブ
リダイゼーションを含む。

本発明のさらなる実施形態または特徴は、以下の通りである。
一実施形態において、核酸試料のサブゲノム間隔は、遺伝子内領域または遺伝子間領域
を含む。一実施形態において、サブゲノム間隔は、遺伝子もしくはその断片、エクソンも
しくはその断片、または事前選択されたヌクレオチド位置を含む。別の実施形態では、サ
ブゲノム間隔は、エクソンもしくはイントロン、またはその断片、典型的には、エクソン
またはその断片を含む。一実施形態において、サブゲノム間隔は、コード領域または非コ
ード領域、例えば、プロモーター、エンハンサー、５’非翻訳領域（５’ＵＴＲ）、もし
くは３’非翻訳領域（３’ＵＴＲ）、またはその断片を含む。

他の実施形態では、核酸試料のサブゲノム間隔は、例えば、癌表現型（例えば、癌の危
険性、癌進行、癌治療、または治療に対する抵抗のうちの１つ以上）に正もしくは負に関
連した変化（例えば、１つ以上の変異）を含む。さらに別の実施形態では、サブゲノム間
隔は、変化、例えば、点変異もしくは単一変異、欠失変異（例えば、インフレーム欠失、
遺伝子内欠失、全遺伝子欠失）、挿入変異（例えば、遺伝子内挿入）、逆位変異（例えば
、染色体内逆位）、連鎖変異、連鎖された挿入変異、逆位重複変異、タンデム重複（例え
ば、染色体内タンデム重複）、転座（例えば、染色体転座、非相反転座）、再編成、遺伝
子コピー数の変化、またはそれらの組み合わせを含む。

他の実施形態では、核酸試料のサブゲノム間隔は、試料由来の腫瘍型の癌表現型に関連
しない核酸分子を（同一または異なるサブゲノム間隔において）含む。一実施形態におい
て、配列決定されたサブゲノム間隔は、変異が癌表現型に関連するとき、遺伝子もしくは
遺伝子産物の野生型または非変異ヌクレオチド配列（例えば、エクソン配列またはその断
片）（例えば、本明細書に記載の遺伝子もしくは遺伝子産物の野生型または非変異配列）
を含む。例えば、配列決定されたサブゲノム間隔は、腫瘍を有するか、または有する危険
性のある同一の対象由来の正常な（例えば、非癌性）参照試料（例えば、腫瘍試料を得た
同一の対象由来）、正常な隣接組織（ＮＡＴ）、または血液試料に由来する。他の実施形
態では、配列決定されたサブゲノム間隔は、１名以上の異なる対象（例えば、健常な対象
、あるいは腫瘍を有するか、または有する危険性のある他の対象）由来の腫瘍または癌関
連メンバーとは異なる対象に由来する（例えば、異なる対象由来の同一もしくは異なる腫
瘍試料、正常な（例えば、非癌性）参照試料、正常な隣接組織（ＮＡＴ）、または血液試
料のうちの１つ以上に由来する）。

他の実施形態では、核酸試料のサブゲノム間隔は、表３、表４、またはそれらの組み合
わせに示される１つ以上の転座変化を含む。ある特定の実施形態において、配列決定され
たサブゲノム間隔は、表３に従う少なくとも５、１０、１５、２０、２５、３０、３５、
４０、４５、５０、７５、１１０個、もしくはそれ以上の遺伝子または遺伝子産物の転座
変化を含む。他の実施形態では、配列決定されたサブゲノム間隔は、表３に明記される癌
型由来の腫瘍試料における表３に従う少なくとも５、１０、１５、２０、２５、３０、３
５、４０、４５、５０、７５、１１０個、もしくはそれ以上の遺伝子または遺伝子産物の
転座変化を含む。他の実施形態では、配列決定されたサブゲノム間隔は、表４に従う少な
くとも５、１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１
５０、２００個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化を含む。他の実
施形態では、配列決定されたサブゲノム間隔は、表４に明記される癌型由来の腫瘍試料に
おける表４の少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、５０、
７５、１００、１５０、２００個、もしくはそれ以上の遺伝子または遺伝子産物の転座変
化を含む。

一実施形態において、核酸試料のサブゲノム間隔は、癌表現型に関連した単一ヌクレオ
チド変化を含むエクソン配列を含む。例えば、サブゲノム間隔は、染色体１２のヌクレオ
チド２５，３９８，２１５～２５，３９８，３３４を含む。他の実施形態では、サブゲノ
ム間隔は、ＫＲＡＳ遺伝子においてＧ１２Ｓ変異を表す２５，３９８，２８６位でのＣ－
Ｔ置換を含む。

別の実施形態では、核酸試料のサブゲノム間隔は、参照ヌクレオチド（例えば、染色体
）配列由来の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１
５、１６、１７、１８、１９、２０個、もしくはそれ以上のコドンのインフレーム欠失を
含む。一実施形態において、サブゲノム間隔は、ＥＧＦＲ遺伝子のコドン７４６～７５０
のインフレーム欠失を含む（例えば、サブゲノム間隔は、染色体７のヌクレオチド５５，
２４２，４００～５５，２４２，５３５を含むが、ヌクレオチド５５，２４２，４６４～
５５，２４２，４７９を欠く）。

さらに別の実施形態では、核酸試料のサブゲノム間隔は、ＰＴＥＮ遺伝子のコドン６４
からのジヌクレオチド配列「ＣＡ」の欠失を含む（例えば、サブゲノム間隔は、染色体１
０のヌクレオチド９，６７５，２１４～８９，６７５，２７４、続いて、染色体１０の塩
基８９，６７５，２７７～８９，６７５，３３７を含む）。

さらに別の実施形態では、核酸試料のサブゲノム間隔は、ＰＴＥＮのコドン１３６に続
くアミノ酸残基「Ｇｌｙ－Ｍｅｔ」の挿入を含む（例えば、サブゲノム間隔は、染色体１
０のヌクレオチド８９，６９２，８６４～８９，６９２，９２４、続いて、ヌクレオチド
配列「ＧＧＮＡＴＧ」、続いて、染色体１０のヌクレオチド８９，６９２，９２５～８９
，６９２，９８０を含む）。

さらに別の実施形態では、核酸試料のサブゲノム間隔は、ＣＤＫＮ２Ａ遺伝子の欠失を
含む（例えば、サブゲノム間隔は、染色体９の塩基２２，００１，１７５～２２，００１
，２３５に隣接した染色体９のヌクレオチド２１，９６１，００７～２１，９６１，０６
７を含む）。

別の実施形態では、配列決定された核酸試料のサブゲノム間隔は、ＥＭＬ４－ＡＬＫ融
合を引き起こす逆位を含む（例えば、サブゲノム間隔は、染色体２のヌクレオチド２９，
４４９，９９３～２９，４４９，９３３と並列した染色体２のヌクレオチド４２，５２２
，８９３～４２，５２２，９５３を含む）。

別の実施形態では、核酸試料のサブゲノム間隔は、ＢＣＲ－ＡＢＬ融合をもたらす染色
体間転座を含む（例えば、サブゲノム間隔は、染色体９のヌクレオチド１３３，６８１，
７９３～１３３，６８１，８５３と並列した染色体２２のヌクレオチド２３，６３２，５
５２～２３，６３２，６１２を含む）。

別の実施形態では、核酸試料のサブゲノム間隔は、ＦＬＴ３遺伝子における内部タンデ
ム重複（ＩＴＤ）変異を含む（例えば、サブゲノム間隔は、同一の配向に２回反復した染
色体１３のヌクレオチド２８，６０８，２５９～２８，６０８，２８５を含む）。

別の実施形態では、核酸試料のサブゲノム間隔は、マイクロサテライトマーカー配列を
含む（例えば、サブゲノム間隔は、Ｄ２Ｓ１２３のマイクロサテライトマーカー配列、例
えば、染色体２のヌクレオチド５１，２８８，３８０～５１，２８８，５００およびヌク
レオチド５１，２８８，５６０～５１，２８８，６８０を含む）。

別の実施形態では、核酸試料のサブゲノム間隔は、融合配列に対応するヌクレオチド配
列（例えば、非融合転写物の融合転写物または癌関連の選択的スプライシングされた形態
）を含む。

他の実施形態では、核酸試料のサブゲノム間隔は、ヌクレオチド配列を含み、事前選択
された対立遺伝子バリアントの存在もしくは不在は、癌関連の表現型（例えば、癌の危険
性、癌進行、癌治療応答、または治療に対する抵抗、腫瘍病期分類、転移可能性等のうち
の１つ以上）を示す。ある特定の実施形態において、配列決定された核酸試料のサブゲノ
ム間隔は、ヌクレオチド配列を含み、事前選択された対立遺伝子バリアントの存在もしく
は不在は、正の臨床転帰、および／または治療に対する応答性を予測する。他の実施形態
では、配列決定された核酸試料のサブゲノム間隔は、ヌクレオチド配列を含み、事前選択
された対立遺伝子バリアントの存在もしくは不在は、負の臨床転帰、および／または治療
に対する応答性を予測する。ある特定の実施形態において、配列決定された核酸試料のサ
ブゲノム間隔は、ヌクレオチド配列を含み、事前選択された対立遺伝子バリアントの存在
または不在は、癌を発現させる遺伝（例えば、生殖細胞系危険）因子を示す（例えば、遺
伝子または遺伝子産物は、ＢＲＣＡ１、ＢＲＣＡ２、ＥＧＦＲ、ＨＲＡＳ、ＫＩＴ、ＭＰ
Ｌ、ＡＬＫ、ＰＴＥＮ、ＲＥＴ、ＡＰＣ、ＣＤＫＮ２Ａ、ＭＬＨ１、ＭＳＨ２、ＭＳＨ６
、ＮＦ１、ＮＦ２、ＲＢ１、ＴＰ５３、ＶＨＬ、またはＷＴ１のうちの１つ以上から選択
される）。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、表１、１Ａ、３
、もしくは４に記載される癌型のうちの１つ以上から選択される癌に関連した表１、１Ａ
、３、もしくは４に示される１つ以上の遺伝子または遺伝子産物に由来する。

一実施形態において、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＣＭＬ、ＡＬ
Ｌ、またはＴ－ＡＬＬのうちの１つ以上から選択される軟組織悪性腫瘍に関連したＡＢＬ
－１遺伝子もしくは遺伝子産物に由来する。他の実施形態では、配列決定された核酸試料
のサブゲノム間隔は、癌表現型、例えば、乳癌、結腸直腸癌、卵巣癌、または非小細胞肺
癌（ＮＳＣＬＣ）のうちの１つ以上から選択される癌に関連したＡＫＴ１遺伝子もしくは
遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＡＬＣＬ、ＮＳ
ＣＬＣ、または神経芽細胞腫のうちの１つ以上から選択される癌に関連したＡＬＫ遺伝子
もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、膵
臓癌、類腱腫、肝芽腫、神経膠腫、または他のＣＮＳ癌もしくは腫瘍のうちの１つ以上か
ら選択される癌に関連したＡＰＣ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、黒色腫、結腸直
腸癌、肺癌、他の上皮悪性腫瘍、またはＡＭＬもしくはＡＬＬを含む血液悪性腫瘍のうち
の１つ以上から選択される癌に関連したＢＲＡＦ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、黒色腫、膵臓癌
、または他の腫瘍型のうちの１つ以上から選択される癌に関連したＣＤＫＮ２Ａ遺伝子も
しくは遺伝子産物に由来する。

他の実施形態では、配列決定された核酸試料のサブゲノム間隔は、癌表現型、例えば、
ＡＭＬまたはＭＤＳのうちの１つ以上から選択される癌に関連したＣＥＢＰＡ遺伝子もし
くは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、卵
巣癌、肝芽腫、または多形性唾液腺腫のうちの１つ以上から選択される癌に関連したＣＴ
ＮＮＢ１遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、神経膠腫、肺癌
、またはＮＳＣＬＣのうちの１つ以上から選択される癌に関連したＥＧＦＲ遺伝子もしく
は遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、例えば、癌表現型、例えば、乳癌、
卵巣癌、ＮＳＣＬＣ、胃癌、または他の固形腫瘍のうちの１つ以上から選択される癌に正
もしくは負に関連したＥＲＢＢ２遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、乳房腫瘍、卵巣
腫瘍、または子宮内膜腫瘍のうちの１つ以上から選択される癌に関連したＥＳＲ１遺伝子
もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＭＰＤまたはＮ
ＨＬのうちの１つ以上から選択される癌に関連したＦＧＦＲ１遺伝子もしくは遺伝子産物
に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、胃腫瘍、ＮＳＣ
ＬＣ、または子宮内膜腫瘍のうちの１つ以上から選択される癌に関連したＦＧＦＲ２遺伝
子もしくは遺伝子産物に由来する。一実施形態において、ライブラリ、例えば、核酸ライ
ブラリは、胃腫瘍、ＮＳＣＬＣ、もしくは子宮内膜腫瘍のうちの１つ以上を有するか、ま
たは有する危険性のある対象由来の試料から得られる。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、膀胱癌、多発性
骨髄腫、またはＴ細胞リンパ腫のうちの１つ以上から選択される癌に関連したＦＧＦＲ３
遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＡＭＬ、黒色腫
、結腸直腸癌、甲状腺乳頭癌、卵巣癌、非小細胞肺癌（ＮＳＣＬＣ）、胆管癌、または毛
様細胞性星状細胞腫のうちの１つ以上から選択される癌に関連したＦＬＴ３遺伝子もしく
は遺伝子産物、またはそのサブゲノム間隔に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、横紋筋肉腫、神
経節芽細胞腫、膀胱癌、肉腫、または他の癌型のうちの１つ以上から選択される癌に関連
したＨＲＡＳ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＡＬＬ、ＡＭＬ
、ＭＰＤ、またはＣＭＬのうちの１つ以上から選択される癌に関連したＪＡＫ２遺伝子も
しくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、消化管間質腫瘍
（ＧＩＳＴ）、ＡＭＬ、ＴＧＣＴ、肥満細胞症、粘膜黒色腫、または上皮腫のうちの１つ
以上から選択される癌に関連したＫＩＴ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、膵臓癌、結腸癌
、結腸直腸癌、肺癌、甲状腺癌、またはＡＭＬのうちの１つ以上から選択される癌に関連
したＫＲＡＳ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、腎臓癌または頭
頸部扁平上皮癌のうちの１つ以上から選択される癌に関連したＭＥＴ遺伝子もしくは遺伝
子産物に由来する。

他の実施形態では、配列決定された核酸試料のサブゲノム間隔は、癌表現型、例えば、
ＡＭＬまたはＡＬＬのうちの１つ以上から選択される癌に関連したＭＬＬ遺伝子もしくは
遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、神経繊維腫また
は神経膠腫のうちの１つ以上から選択される癌に関連したＮＦ１遺伝子もしくは遺伝子産
物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、Ｔ－ＡＬＬ癌に
関連したＮＯＴＣＨ１遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＮＨＬ、ＡＰＬ
またはＡＭＬのうちの１つ以上から選択される癌に関連したＮＰＭ１遺伝子もしくは遺伝
子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、黒色腫、結腸直
腸癌、多発性骨髄腫、ＡＭＬ、または甲状腺癌のうちの１つ以上から選択される癌に関連
したＮＲＡＳ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ＧＩＳＴまたは
特発性好酸球増加症候群のうちの１つ以上から選択される癌に関連したＰＤＧＦＲＡ遺伝
子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、胃
癌、膠芽腫、または乳癌のうちの１つ以上から選択される癌に関連したＰＩＫ３ＣＡ遺伝
子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、神
経膠腫、前立腺癌、または子宮内膜癌のうちの１つ以上から選択される癌に関連したＰＴ
ＥＮ遺伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、網膜芽細胞腫、
肉腫、乳癌、または小細胞肺癌のうちの１つ以上から選択される癌に関連したＲＢ１遺伝
子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、甲状腺髄様癌、
甲状腺乳頭癌、または褐色細胞腫のうちの１つ以上から選択される癌に関連したＲＥＴ遺
伝子もしくは遺伝子産物に由来する。

他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、乳癌、結腸直腸
癌、肺癌、肉腫、副腎皮質癌、神経膠腫、または他の腫瘍型のうちの１つ以上から選択さ
れる癌に関連したＴＰ５３遺伝子もしくは遺伝子産物に由来する。

一実施形態において、核酸試料のサブゲノム間隔は、治療応答の正の予測因子である。
治療応答の正の予測因子の例には、ＮＳＣＬＣ患者の小分子ＥＧＦＲＴＫＩ（例えば、
イレッサ／ゲフィチニブ）に対する応答性を予測するＥＧＦＲ遺伝子における活性化変異
、ＮＳＣＬＣ患者のＡＬＫ阻害剤（例えば、ＰＦ－０２３４１０６６）に対する応答性を
予測するＥＭＬ４／ＡＬＫ融合遺伝子の存在、黒色腫患者のＢＲＡＦ阻害（例えば、ＰＬ
Ｘ－４０３２）に対する応答性を予測するＢＲＡＦＶ６００Ｅ変異の存在が挙げられる
が、これらに限定されない。

他の実施形態では、核酸試料のサブゲノム間隔は、治療応答の負の予測因子である。治
療応答の負の予測因子の例には、ＣＲＣ患者の抗ＥＧＦＲモノクローナル抗体（セテュキ
マブ、パニツムマブ）への応答欠如を予測するＫＲＡＳ遺伝子における活性化変異、およ
びＣＭＬ患者のグリーベック／イマチニブに対する抵抗を予測するＢＣＲ／Ａｂｌ融合遺
伝子におけるＭ３５１Ｔ変異の存在が挙げられるが、これらに限定されない。

他の実施形態では、核酸試料のサブゲノム間隔は、予後因子である。予後因子の例には
、ＡＭＬ患者の再発の負の予後であるＦＬＴ３遺伝子における挿入変異の存在、甲状腺髄
様癌患者の生存の負の予後因子である特定のＲＥＴ遺伝子変異、例えば、Ｍ９１８Ｔの存
在が挙げられるが、これらに限定されない。

他の実施形態では、核酸試料のサブゲノム間隔は、診断因子である。予後因子の例には
、ＣＭＬの診断であるＢＣＲ／Ａｂｌ融合遺伝子の存在、および腎臓のラブドイド腫瘍の
診断であるＳＭＡＲＣＢ１変異の存在が挙げられるが、これらに限定されない。

他の実施形態では、核酸試料は、腫瘍試料中の細胞の少数の一部（例えば、５％未満）
に存在する遺伝子または遺伝子産物由来のサブゲノム間隔を含む。一実施形態において、
核酸試料は、例えば、癌関連の表現型に正もしくは負に関連するが、腫瘍試料中の細胞の
少数の一部（例えば、未満５％）に存在する遺伝子または遺伝子産物由来のサブゲノム間
隔を含む。他の実施形態では、核酸試料は、腫瘍試料中の細胞の５０、４０、３０、１０
、５、もしくは１％未満に存在する遺伝子または遺伝子産物由来のサブゲノム間隔を含む
。さらに他の実施形態では、核酸試料は、腫瘍試料中の細胞の５０、６０、７０、８０％
を超えるか、もしくはそれ以上に存在する遺伝子または遺伝子産物由来のサブゲノム間隔
を含む。

さらに他の実施形態では、核酸試料は、腫瘍試料中の腫瘍細胞のゲノムのコード領域の
５、１、０．５、０．１％、０．０１％、０．００１％未満に存在する遺伝子または遺伝
子産物由来のサブゲノム間隔を含む。

一実施形態において、核酸試料は、腫瘍または癌に関連した（例えば、腫瘍または癌の
正もしくは負の治療応答予測因子であるか、腫瘍または癌の正もしくは負の予後因子であ
るか、あるいは腫瘍または癌の差次的診断を可能にする）遺伝子または遺伝子産物、例え
ば、ＡＢＬ１、ＡＫＴ１、ＡＬＫ、ＡＲ、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、ＣＥＢＰ
Ａ、ＥＧＦＲ、ＥＲＢＢ２、ＦＬＴ３、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＮＰＭ１
、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＲＡＲＡ、ＡＫＴ２、ＡＫＴ３、ＭＡＰ２Ｋ４、ＮＯＴ
ＣＨ１、およびＴＰ５３のうちの１つ以上から選択される遺伝子または遺伝子産物由来の
サブゲノム間隔を含む。

一実施形態において、遺伝子または遺伝子産物に関連した癌表現型は、腫瘍試料と同一
の腫瘍型である。他の実施形態では、遺伝子または遺伝子産物に関連した癌表現型は、腫
瘍試料とは異なる腫瘍型に由来する。

ある特定の実施形態において、方法またはアッセイは、少なくともＸ名の対象（Ｘ＝１
、２、３、４、５、６、７、８、９、１０、２０、３０、４０名、またはそれ以上の対象
）由来の腫瘍試料由来の核酸試料を配列決定することを含む。一実施形態において、対象
は、癌もしくは腫瘍を有するか、または有する危険性のあるヒトである。方法は、少なく
ともＸ名の対象由来の本明細書に記載の少なくとも５、１０、１５、２０、３０、４０、
５０、７５個、もしくはそれ以上の遺伝子または遺伝子産物（例えば、表１、１Ａ、２、
３、もしくは４の遺伝子または遺伝子産物）を配列決定することを含む。ある特定の実施
形態において、遺伝子または遺伝子産物は、癌表現型、例えば、癌の危険性、癌進行、癌
治療応答、または治療に対する抵抗のうちの１つ以上に関連した変化を含む。

他の実施形態において、または前述の実施形態に加えて、方法またはアッセイは、腫瘍
試料と同一の対象由来の遺伝子または遺伝子産物由来の対照または参照サブゲノム間隔、
例えば、本明細書に記載の遺伝子または遺伝子産物（例えば、表１、１Ａ、２、３、もし
くは４の遺伝子または遺伝子産物）の野生型または非変異ヌクレオチド配列を配列決定す
ることを含む。一実施形態において、対照遺伝子または遺伝子産物は、腫瘍を有するか、
または有する危険性のある同一の対象由来、あるいは異なる対象由来の腫瘍試料と同一の
対象または腫瘍試料とは異なる対象に由来する（例えば、同一もしくは異なる腫瘍試料、
正常な（例えば、非癌性）試料、正常な隣接組織（ＮＡＴ）、または血液試料のうちの１
つ以上に由来する）。

他の実施形態において、または前述の実施形態に加えて、方法またはアッセイは、薬物
代謝、薬物応答性、または毒性に関連した遺伝子（本明細書に記載のＰＧｘ遺伝子）に存
在するサブゲノム間隔を配列決定することを含む。ある特定の実施形態において、配列さ
れたサブゲノム間隔は、変化（例えば、単一ヌクレオチド多型（ＳＮＰ））を含む。

ある特定の実施形態において、方法またはアッセイは、第１の対象由来の表１、１Ａ、
２、３、もしくは４の第１の組の遺伝子または遺伝子産物を配列決定する（かつ／または
配列決定の結果を報告する）ことを含む。他の実施形態では、方法またはアッセイは、第
１もしくは第２の対象由来の表１、１Ａ、２、３、もしくは４の遺伝子または遺伝子産物
の第２の組、第３の組、またはそれ以上の（例えば、オーバーラップするが、異なる）組
を配列決定する（かつ／または配列決定の結果を報告する）ことを含む。ある特定の実施
形態において、第１の対象由来の腫瘍試料は、第１の型の腫瘍を含み、第２の対象由来の
腫瘍試料は、第２の型の腫瘍を含む。他の実施形態では、第１の対象および第２の対象由
来の腫瘍試料は、同一の腫瘍型に由来する。

ある特定の実施形態において、方法またはアッセイは、以下のうちの１つ以上をさらに
含む：
（ｉ）核酸試料をフィンガープリントすること、
（ｉｉ）核酸試料における遺伝子または遺伝子産物（例えば、本明細書に記載の遺伝
子または遺伝子産物）の存在量を定量化すること、
（ｉｉｉ）試料における転写物の相対存在量を定量化すること、
（ｉｖ）特定の対象（例えば、正常な対照または癌患者）に属する核酸試料を特定す
ること、
（ｖ）核酸試料中の遺伝形質（例えば、１つ以上の対象の遺伝子構造（例えば、民族
性、人種、家族性形質））を特定すること、
（ｖｉ）核酸試料の倍数性を決定し、核酸試料におけるヘテロ接合性の消失を決定す
ること、
（ｖｉｉ）核酸試料における遺伝子重複事象の存在もしくは不在を決定すること、
（ｖｉｉｉ）核酸試料における遺伝子増幅事象の存在もしくは不在を決定すること、
あるいは
（ｉｘ）核酸試料中の腫瘍／正常な細胞混合物のレベルを決定すること。

他の実施形態では、核酸試料は、腫瘍試料由来の複数の腫瘍核酸メンバー、参照もしく
は対照（例えば、野生型）核酸メンバー、および／またはＰＧｘ関連の核酸メンバー（例
えば、本明細書に記載のサブゲノム間隔を含む核酸）を含むライブラリ、または選択され
たライブラリ出力を含む。一実施形態において、ライブラリ（例えば、核酸ライブラリ）
は、１、２、３、４、５、６、７、８、９、１０、２０、３０名、もしくはそれ以上の対
象由来の複数のメンバー、例えば、標的核酸メンバーを含む。一実施形態において、対象
は、癌もしくは腫瘍を有するか、または有する危険性のあるヒトである。ある特定の実施
形態において、ライブラリは、１、２、３、４、５、６、７、８、９、１０、２０、３０
名、もしくはそれ以上の対象由来の腫瘍または癌関連の核酸メンバーおよび対照核酸断片
をさらに含む。

ある特定の実施形態において、選択されたサブゲノム間隔のサブセットは、溶液または
固体支持体ベースのハイブリダイゼーションによって核酸試料から分離または濃縮される
。一実施形態において、方法またはアッセイは、核酸ライブラリ（例えば、ライブラリ捕
獲物）の選択されたメンバーを提供する。方法は、
複数のメンバー、例えば、標的メンバー（例えば、複数の腫瘍もしくは癌関連のメンバ
ー、参照メンバー、および／またはＰＧｘメンバーを含む）を含むライブラリ（例えば、
核酸ライブラリ）を提供することと、
ライブラリを、例えば、溶液もしくは固体支持体ベースの反応で、複数のベイト（例え
ば、オリゴヌクレオチドベイト）と接触させて、複数のベイト／メンバーハイブリッドを
含むハイブリダイゼーション混合物を形成することと、
複数のベイト／メンバーハイブリッドを、例えば、該ハイブリダイゼーション混合物を
、該複数のベイト／メンバーハイブリッドの分離を可能にする結合実体と接触させること
によって、該ハイブリダイゼーション混合物から分離することと、を含み、
それによって、ライブラリ捕獲物（例えば、ライブラリ由来の核酸分子の選択または濃縮
されたサブグループ）を提供し、
複数のベイトは、
ａ）本明細書に記載の腫瘍または参照遺伝子もしくは遺伝子産物、例えば、表１、１Ａ
、３、もしくは４に記載される腫瘍または参照遺伝子もしくは遺伝子産物由来のサブゲノ
ム間隔を含む腫瘍もしくは癌関連または参照（例えば、野生型）メンバーを選択する第１
のベイトセット、
ｂ）表１もしくは表２に記載される遺伝子もしくは遺伝子産物由来のサブゲノム間隔を
（ａと同一または異なるサブゲノム間隔において）含むＰＧｘメンバーを選択する第２の
ベイトセットのうちの少なくとも１つもしくは２つを含む。

ある特定の実施形態において、方法またはアッセイは、該メンバーを配列決定するステ
ップをさらに含む。ある特定の実施形態において、少なくとも１、２、３、４、５、６、
７、８、９、１０、２０、３０名、もしくはそれ以上の対象由来の腫瘍メンバーが配列決
定される（例えば、それぞれの対象由来の表１もしくは表１Ａの遺伝子または遺伝子産物
由来の少なくとも５０、７５、１００、もしくは１５０個のサブゲノム間隔が配列決定さ
れる）。

ある特定の実施形態において、方法またはアッセイは、核酸試料において、表１の少な
くとも１０個（例えば、２０、３０、４０個）の優先、癌、またはＰＧｘ遺伝子もしくは
遺伝子産物の事前選択された変化（例えば、対立遺伝子変異）を検出するステップをさら
に含む。ある特定の実施形態において、変化（例えば、対立遺伝子変異）は、とりわけ、
細胞遺伝学的異常、非相反転座、再編成、染色体内逆位、変異、点変異、欠失、遺伝子コ
ピー数の変化、ＳＮＰを含む。

ある特定の実施形態において、方法またはアッセイは、検出された変化（例えば、対立
遺伝子変異）の存在もしくは不在を参照値（例えば、文献報告書または腫瘍試料と同一の
対象または異なる対象由来の対照試料の配列、例えば、血液適合対照またはＮＡＴ（正常
な隣接腫瘍））と比較するステップをさらに含む。

ある特定の実施形態において、方法またはアッセイは、変化（例えば、事前選択された
対立遺伝子変異）の存在もしくは不在をメモリアライズし、かつ例えば、メモリアライゼ
ーションを含む報告書を提供するするステップをさらに含む。

ある特定の実施形態において、方法またはアッセイは、変化をアノテートし、かつ例え
ば、変異構造の指標を有する事前選択された対立遺伝子変異、例えば、ミスセンス変異、
または関数、例えば、疾患表現型との関連をアノテートするステップをさらに含む。

ある特定の実施形態において、方法またはアッセイは、データセットを提供するステッ
プをさらに含み、データセットのそれぞれの要素は、腫瘍型、遺伝子、および事前選択さ
れた変化（例えば、対立遺伝子変異）（「ＴＧＡ」）の関連性を含む。

ある特定の実施形態において、方法またはアッセイは、対象のＴＧＡの存在もしくは不
在をメモリアライズし、任意で関連したアノテーションを行って、報告書を形成するステ
ップをさらに含む。

ある特定の実施形態において、方法またはアッセイは、報告書を受領関係者に送信する
ステップをさらに含む。

前述の選択方法および試薬を含むアッセイ、例えば、マルチプレックスアッセイも提供
される。
核酸試料

様々な組織試料が、本方法で使用される核酸試料の供給源であり得る。ゲノムまたはサ
ブゲノム核酸（例えば、ＤＮＡまたはＲＮＡ）を、対象の試料（例えば、腫瘍試料、正常
な隣接組織（ＮＡＴ）、血液試料、循環腫瘍細胞（ＣＴＣ）もしくは任意の正常な対照を
含有する試料）から単離することができる。ある特定の実施形態において、組織試料は、
冷凍試料またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフィン包埋（Ｆ
ＦＰＥ）組織調製物として保存される。例えば、試料を、マトリックス、例えば、ＦＦＰ
Ｅブロック、または冷凍試料に埋め込んでもよい。単離ステップは、個別の染色体の流動
選別、および／または対象の試料（例えば、腫瘍試料、ＮＡＴ、血液試料）のミクロ解剖
を含んでもよい。

「単離された」核酸分子は、核酸分子の天然供給源に存在する他の核酸分子から分離さ
れるものである。ある特定の実施形態において、「単離された」核酸分子は、核酸が由来
する生物のゲノムＤＮＡ中の核酸に自然に隣接する配列（タンパク質をコードする配列等
）（すなわち、核酸の５’末端および３’末端に位置する配列）を含まない。例えば、様
々な実施形態において、単離された核酸分子は、核酸が由来する細胞のゲノムＤＮＡ中の
核酸分子に自然に隣接するヌクレオチド配列の約５ｋＢ未満、約４ｋＢ未満、約３ｋＢ未
満、約２ｋＢ未満、約１ｋＢ未満、約０．５ｋＢ未満、または約０．１ｋＢ未満を含有し
得る。さらに、ｃＤＮＡ分子等の「単離された」核酸分子は、組換え技術によって産生さ
れるときに他の細胞物質または培養培地を実質的に含まないか、または化学的に合成され
るときに化学的前駆体もしくは他の化学物質を実質的に含まない場合がある。

「他の細胞物質もしくは培養培地を実質的に含まない」という言い回しは、分子が細胞
の細胞成分から分離される核酸分子の調製物を含み、分子が細胞の細胞成分から単離され
るか、または組換え産生される。したがって、細胞物質を実質的に含まない核酸分子は、
他の細胞物質または培養培地の約３０乾燥重量％未満、約２０乾燥重量％未満、約１０乾
燥重量％未満、もしくは約５乾燥重量％未満を有する核酸分子の調製物を含む。

ある特定の実施形態において、核酸は、熟成試料、例えば、熟成ＦＦＰＥ試料から単離
される。熟成試料は、例えば、年齢、例えば、１年、２年、３年、４年、５年、１０年、
１５年、２０年、２５年、５０年、７５年、もしくは１００年齢、またはそれ以上の年齢
であり得る。

核酸試料を、様々な大きさの組織試料（例えば、生検またはＦＦＰＥ試料）から得るこ
とができる。例えば、核酸を、５～２００μｍ、またはそれより大きい組織試料から単離
することができる。例えば、組織試料は、５μｍ、１０μｍ、２０μｍ、３０μｍ、４０
μｍ、５０μｍ、７０μｍ、１００μｍ、１１０μｍ、１２０μｍ、１５０μｍ、もしく
は２００μｍ、またはそれ以上の大きさであることができる。

組織試料からのＤＮＡ単離のプロトコルが実施例１に提供される。核酸（例えば、ＤＮ
Ａ）をホルムアルデヒドまたはパラホルムアルデヒド固定パラフィン包埋（ＦＦＰＥ）組
織から単離するさらなる方法が、例えば、ＣｒｏｎｉｎＭ．ｅｔａｌ．，（２００４
）ＡｍＪＰａｔｈｏｌ．１６４（１）：３５－４２、ＭａｓｕｄａＮ．ｅｔａｌ
．，（１９９９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２７（２２）：４４３６－４４
４３、ＳｐｅｃｈｔＫ．ｅｔａｌ．，（２００１）ＡｍＪＰａｔｈｏｌ．１５８
（２）：４１９－４２９、ＡｍｂｉｏｎＲｅｃｏｖｅｒＡｌｌ（商標）全核酸単離プロ
トコル（Ａｍｂｉｏｎ、カタログ番号ＡＭ１９７５、２００８年９月）、Ｍａｘｗｅｌｌ
（登録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡ精製キット技術マニュアル（Ｐｒ
ｏｍｅｇａ文献番号ＴＭ３４９、２０１１年２月）、Ｅ．Ｚ．Ｎ．Ａ．（登録商標）ＦＦ
ＰＥＤＮＡキットハンドブック（ＯＭＥＧＡｂｉｏ－ｔｅｋ，Ｎｏｒｃｒｏｓｓ，Ｇ
Ａ、製品番号Ｄ３３９９－００、Ｄ３３９９－０１、およびＤ３３９９－０２、２００９
年６月）、ならびにＱＩＡａｍｐ（登録商標）ＤＮＡＦＦＰＥ組織ハンドブック（Ｑｉ
ａｇｅｎ、カタログ番号３７６２５、２００７年１０月）に開示される。Ｒｅｃｏｖｅｒ
Ａｌｌ（商標）全核酸単離キットは、パラフィン包埋試料を可溶化するためにキシレンを
高温で、かつ核酸を捕捉するためにガラス繊維フィルタを使用する。Ｍａｘｗｅｌｌ（登
録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡ精製キットは、１～１０μｍのＦＦＰ
Ｅ組織切片由来のゲノムＤＮＡの精製のために、Ｍａｘｗｅｌｌ（登録商標）１６機器と
ともに使用される。ＤＮＡは、シリカクラッド常磁性粒子（ＰＭＰ）を用いて精製され、
低溶出体積中に溶出される。Ｅ．Ｚ．Ｎ．Ａ．（登録商標）ＦＦＰＥＤＮＡキットは、
ゲノムＤＮＡの単離のためにスピンカラムおよび緩衝系を使用する。ＱＩＡａｍｐ（登録
商標）ＤＮＡＦＦＰＥ組織キットは、ゲノムおよびミトコンドリアＤＮＡの精製のため
にＱＩＡａｍｐ（登録商標）ＤＮＡマイクロ技術を使用する。血液からのＤＮＡ単離のプ
ロトコルが、例えば、Ｍａｘｗｅｌｌ（登録商標）１６ＬＥＶ血液ＤＮＡキットおよび
Ｍａｘｗｅｌｌ１６ＢｕｃｃａｌＳｗａｂＬＥＶＤＮＡ精製キット技術マニュ
アル（Ｐｒｏｍｅｇａ文献番号ＴＭ３３３、２０１１年１月１日）に開示される。

ＲＮＡ単離のプロトコルが、例えば、Ｍａｘｗｅｌｌ（登録商標）１６全ＲＮＡ精製キ
ット技術告示（Ｐｒｏｍｅｇａ文献番号ＴＢ３５１、２００９年８月）に開示される。

単離された核酸試料（例えば、ゲノムＤＮＡ試料）を、日常の技術を実践して断片化ま
たは剪断することができる。例えば、物理的剪断方法、酵素的切断方法、化学的切断方法
、および当業者に周知の他の方法によって、ゲノムＤＮＡを断片化することができる。核
酸ライブラリは、ゲノムの複雑度のうちのすべてまたは実質的にすべてを含有し得る。「
実質的にすべて」という用語は、この文脈において、実際には、手順の最初のステップ中
に、ゲノムの複雑度にある望ましくない喪失が存在し得る可能性を指す。本明細書に記載
の方法は、核酸ライブラリがゲノムの一部である場合、すなわち、ゲノムの複雑度が設計
によって低下する場合にも有用である。いくつかの実施形態では、ゲノムの任意の選択さ
れた部分を本明細書に記載の方法とともに使用することができる。ある特定の実施形態に
おいて、全エクソームまたはそのサブセットが単離される。

本発明が特色とする方法は、核酸試料を単離して、ライブラリ（例えば、本明細書に記
載の核酸ライブラリ）を提供することをさらに含むことができる。ある特定の実施形態に
おいて、核酸試料は、全ゲノム断片、サブゲノム断片、またはこれらの両方を含む。単離
された核酸試料を用いて、核酸ライブラリを調製することができる。したがって、一実施
形態において、本発明で取り上げられる方法は、核酸試料を単離して、ライブラリ（例え
ば、本明細書に記載の核酸ライブラリ）を提供することをさらに含む。ライブラリを全ゲ
ノム断片またはサブゲノム断片から単離および調製するためのプロトコル（例えば、Ｉｌ
ｌｕｍｉｎａのゲノムＤＮＡ試料調製キット）は、当技術分野で既知である。ある特定の
実施形態において、ゲノムまたはサブゲノムＤＮＡ断片は、対象の試料（例えば、腫瘍試
料、正常な隣接組織（ＮＡＴ）、血液試料、または任意の正常な対照）から単離される。
一実施形態において、試料（例えば、腫瘍またはＮＡＴ試料）は、保存された検体である
。例えば、試料は、マトリックス、例えば、ＦＦＰＥブロックまたは冷凍試料に埋め込ま
れる。ある特定の実施形態において、単離ステップは、個別の染色体の流動選別、および
／または対象の試料（例えば、腫瘍試料、ＮＡＴ、血液試料）のミクロ解剖を含む。ある
特定の実施形態において、核酸ライブラリを生成するために使用される核酸試料は、５マ
イクログラム未満、１マイクログラム未満、または５００ｎｇ未満、２００ｎｇ未満、１
００ｎｇ未満、５０ｎｇ未満、１０ｎｇ未満、５ｎｇ未満、もしくは１ｎｇ未満である。

さらに他の実施形態において、ライブラリを生成するために使用される核酸試料は、Ｒ
ＮＡまたはＲＮＡ由来のｃＤＮＡを含む。いくつかの実施形態では、ＲＮＡは、全細胞Ｒ
ＮＡを含む。他の実施形態では、ある特定の豊富なＲＮＡ配列（例えば、リボソームＲＮ
Ａ）が枯渇している。いくつかの実施形態では、全ＲＮＡ調製物中のポリ（Ａ）尾部ｍＲ
ＮＡ画分が濃縮されている。いくつかの実施形態では、ｃＤＮＡは、ランダムプライムｃ
ＤＮＡ合成法によって産生される。他の実施形態では、ｃＤＮＡ合成は、オリゴ（ｄＴ）
含有オリゴヌクレオチドによるプライミングによって、成熟したｍＲＮＡのポリ（Ａ）尾
部で始まる。枯渇方法、ポリ（Ａ）濃縮方法、およびｃＤＮＡ合成方法は、当業者に周知
である。

方法は、当業者に周知の特異的または非特異的核酸増幅法によって核酸試料を増幅する
ことをさらに含んでもよい。いくつかの実施形態、ある特定の実施形態では、核酸試料は
、例えば、ランダムプライム鎖置換増幅等の全ゲノム増幅法によって増幅される。

他の実施形態では、核酸試料は、物理的もしくは酵素的方法によって断片化または剪断
され、合成アダプターにライゲートされ、寸法選択され（例えば、分取ゲル電気泳動によ
って）増幅される（例えば、ＰＣＲによって）。他の実施形態では、断片化され、かつア
ダプターでライゲートされた核酸の基は、ハイブリッド選択の前に明確な寸法選択または
増幅なしで使用される。

他の実施形態では、単離されたＤＮＡ（例えば、ゲノムＤＮＡ）は、断片化または剪断
される。いくつかの実施形態では、ライブラリは、ゲノムの簡約表示または定義された部
分である、例えば、他の手段によって細分画されたゲノムＤＮＡの細画分等のゲノムＤＮ
Ａの５０％未満を含む。他の実施形態では、ライブラリは、すべてまたは実質的にすべて
のゲノムＤＮＡを含む。

いくつかの実施形態では、ライブラリは、ゲノムの簡約表示または定義された部分であ
る、例えば、他の手段によって細分画されたゲノムＤＮＡの細画分等のゲノムＤＮＡの５
０％未満を含む。他の実施形態では、ライブラリは、すべてまたは実質的にすべてのゲノ
ムＤＮＡを含む。ライブラリを全ゲノムまたはサブゲノム断片から単離および調製するた
めのプロトコルは、当技術分野で既知であり（例えば、ＩｌｌｕｍｉｎａのゲノムＤＮＡ
試料調製キット）、実施例２Ａ、２Ｂ、および３として本明細書に記載される。ＤＮＡ剪
断の代替方法が実施例２Ｂとして本明細書に記載される。例えば、代替のＤＮＡ剪断方法
は、より自動化可能であり、かつ／またはより効率的であり得る（例えば、劣化したＦＦ
ＰＥ試料を用いて）。ＤＮＡ剪断方法の代替案を、ライブラリ調製中のライゲーションス
テップを回避するために使用することもできる。

本明細書に記載の方法を、例えば、供給源ＤＮＡの量が限定的であるとき（例えば、全
ゲノム増幅後でさえも）少量の核酸を用いて行うことができる。一実施形態において、核
酸は、約５μｇ、４μｇ、３μｇ、２μｇ、１μｇ、０．８μｇ、０．７μｇ、０．６μ
ｇ、０．５μｇ、または４００ｎｇ、３００ｎｇ、２００ｎｇ、１００ｎｇ、５０ｎｇ、
１０ｎｇ、５ｎｇ、１ｎｇ未満、もしくはそれ以下の核酸試料を含む。例えば、典型的に
は、５０～１００ｎｇのゲノムＤＮＡから始めてもよい。しかしながら、ハイブリダイゼ
ーションステップ、例えば、溶液ハイブリダイゼーションの前にゲノムＤＮＡを増幅する
場合（例えば、ＰＣＲを用いて）、それ未満で始めてもよい。したがって、ハイブリダイ
ゼーション、例えば、溶液ハイブリダイゼーションの前にゲノムＤＮＡを増幅することは
可能であるが、必須ではない。

ライブラリを生成するために使用される核酸試料は、ＲＮＡまたはＲＮＡ由来のｃＤＮ
Ａも含み得る。いくつかの実施形態では、ＲＮＡは、全細胞ＲＮＡを含む。他の実施形態
では、ある特定の豊富なＲＮＡ配列（例えば、リボソームＲＮＡ）が枯渇している。他の
実施形態では、全ＲＮＡ調製物中のポリ（Ａ）尾部ｍＲＮＡ画分が濃縮されている。いく
つかの実施形態では、ｃＤＮＡは、ランダムプライムｃＤＮＡ合成法によって産生される
。他の実施形態では、ｃＤＮＡ合成は、オリゴ（ｄＴ）含有オリゴヌクレオチドによるプ
ライミングによって、成熟したｍＲＮＡのポリ（Ａ）尾部で始まる。枯渇方法、ポリ（Ａ
）濃縮方法、およびｃＤＮＡ合成方法は、当業者に周知である。

方法は、当業者に既知の特異的または非特異的核酸増幅法によって核酸試料を増幅する
ことをさらに含んでもよい。核酸試料を、例えば、ランダムプライム鎖置換増幅等の全ゲ
ノム増幅法によって増幅することができる。

核酸試料を、本明細書に記載の物理的もしくは酵素的方法によって断片化または剪断し
、合成アダプターにライゲートし、寸法選択し（例えば、分取ゲル電気泳動によって）、
増幅する（例えば、ＰＣＲによって）ことができる。断片化され、かつアダプターでライ
ゲートされた核酸の基は、ハイブリッド選択の前に明確な寸法選択または増幅なしで使用
される。
ライブラリメンバー

本明細書で使用される「メンバー」もしくは「ライブラリメンバー」または他の同様の
用語は、ライブラリのメンバー（または「ライブラリ捕獲物」）である核酸分子、例えば
、ＤＮＡまたはＲＮＡを指す。ライブラリメンバーは、本明細書に記載の腫瘍メンバー、
参照メンバー、またはＰＧｘメンバーのうちの１つ以上であり得る。典型的には、メンバ
ーは、ＤＮＡ分子、例えば、ゲノムＤＮＡまたはｃＤＮＡ分子である。メンバーを、例え
ば、酵素的に、またはゲノムＤＮＡを剪断することによって断片化することができる。メ
ンバーは、対象由来のヌクレオチド配列を含むことができ、対象由来ではないヌクレオチ
ド配列、例えば、プライマーまたはアダプター（例えば、ＰＣＲ増幅または配列決定のた
めに）、または試料の特定を可能にする配列、例えば、「バーコード」配列も含むことが
できる。

本明細書で使用される「標的メンバー」は、核酸ライブラリから単離することが所望さ
れる核酸分子を指す。一実施形態において、標的メンバーは、本明細書に記載の腫瘍メン
バー、参照メンバー、またはＰＧｘメンバーであり得る。実際に核酸ライブラリから選択
されるメンバーは、本明細書で「ライブラリ捕獲物」と称される。一実施形態において、
ライブラリ捕獲物は、ライブラリのメンバーの選択または濃縮、例えば、本明細書に記載
の１つ以上のラウンドのハイブリッド捕捉後のライブラリの濃縮または選択された出力を
含む。

標的メンバーは、ライブラリのサブグループであり得、すなわち、ライブラリメンバー
のすべてが本明細書に記載のプロセスの任意の特定の使用によって選択されるわけではな
い。他の実施形態では、標的メンバーは、所望の標的領域内である。例えば、標的メンバ
ーは、いくつかの実施形態では、最低で１０％または最高で９５％～９８％、またはそれ
以上のライブラリメンバーの割合であってもよい。一実施形態において、ライブラリ捕獲
物は、標的メンバーの少なくとも約２０％、３０％、４０％、５０％、６０％、７０％、
７５％、８０％、８５％、９０％、９５％、９８％、９９％、９９．９％、またはそれ以
上を含む。別の実施形態では、ライブラリは、標的メンバーの１００％を含有する。一実
施形態において、ライブラリ捕獲物の純度（標的に対してアライメントする読み取りの割
合）は、少なくとも約２０％、３０％、４０％、５０％、６０％、７０％、７５％、８０
％、８５％、９０％、９５％、９８％、９９％、９９．９％、またはそれ以上である。

ゲノムＤＮＡから得られる標的メンバー（またはライブラリ捕獲物）は、それがゲノム
ＤＮＡの約０．０００１％未満、少なくとも約０．０００１％、少なくとも約０．００１
％、少なくとも約０．０１％、または少なくとも約０．１％を含むように、全ゲノムＤＮ
Ａのごく一部を含み得るか、またはそれがゲノムＤＮＡの少なくとも約１％、２％、３％
、４％、５％、６％、７％、８％、９％、もしくは１０％、またはゲノムＤＮＡの１０％
超を含むように、全ゲノムＤＮＡのより有意な割合を含み得る。

一実施形態において、標的メンバー（またはライブラリ捕獲物）は、ゲノムの複合混合
物から選択される。例えば、１つの細胞型（例えば、癌細胞）由来のＤＮＡの選択は、他
の細胞型（例えば、正常な細胞）由来のＤＮＡを含有する試料からである。そのような適
用において、標的メンバーは、複合試料に存在する核酸配列の全複雑度の０．０００１％
未満、少なくとも０．０００１％、少なくとも約０．００１％、少なくとも約０．０１％
、もしくは少なくとも約０．１％を含み得るか、またはそれが複合試料に存在する核酸配
列の全複雑度の少なくとも約１％、２％、５％、１０％、もしくは１０％超を含むように
、より有意な割合を含み得る。

一実施形態において、本明細書に記載の方法（例えば、溶液ハイブリダイゼーション選
択法）によって選択された標的メンバー（またはライブラリ捕獲物）は、ゲノム中のエク
ソンのすべてまたは一部、例えば、ゲノムエクソンの約０．１％、１％、２％、５％、１
０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、もしくは９
５％超を含む。別の実施形態では、標的メンバー（またはライブラリ捕獲物）は、特定の
群のエクソン、例えば、少なくとも約１００、２００、３００、４００、５００、６００
、７００、８００、９００、または１０００個の特定のエクソン、例えば、癌等の特定の
疾患に関連したエクソンであり得る。さらに別の実施形態では、標的メンバー（またはラ
イブラリ捕獲物）は、目的とする選択された遺伝子のエクソンまたは他の部分を含有する
。特定のベイト配列の使用は、熟練者が標的配列（選択される理想的な組の配列）および
多くのエクソンもしくはわずかなエクソン（または他の配列）を含有する核酸のサブグル
ープ（選択される実際の組の配列）を特定の選択のために核酸の群から選択することを可
能にする。

一実施形態において、標的メンバー（またはライブラリ捕獲物）は、一組のｃＤＮＡを
含む。ｃＤＮＡ捕捉を用いて、例えば、スプライスバリアントを見出し、融合転写物を特
定する（例えば、ゲノムＤＮＡ転座から）ことができる。別の実施形態では、標的メンバ
ー（およびライブラリ捕獲物）は、例えば、腫瘍中の細胞、組織、または器官のＲＮＡ画
分に現れる単一塩基変化および他の配列変化を見出すために使用される。

標的メンバー（またはライブラリ捕獲物）（例えば、エクソン、ｃＤＮＡ、および他の
配列）は、所望に応じて、関連性があってもなくてもよい。例えば、選択された標的メン
バー（およびライブラリ捕獲物）を、疾患に関与する遺伝子である核酸の群、例えば、癌
等の１つ以上の疾患に関与する遺伝子の群、特定のＳＮＰを含有する核酸の群から得るこ
とができる。
ベイトの設計および構築

ベイトは、標的核酸にハイブリダイズし（例えば、標的核酸に相補的であり）、それに
よって、標的核酸の捕捉を可能にすることができる核酸分子、例えば、ＤＮＡ分子または
ＲＮＡ分子であり得る。一実施形態において、ベイトは、ＲＮＡ分子である。他の実施形
態では、ベイトは、例えば、結合実体に結合することによって、ベイトによって形成され
たハイブリッドおよびベイトにハイブリダイズした核酸の捕捉および分離を可能にする結
合実体、例えば、親和性タグを含む。一実施形態において、ベイトは、溶液相ハイブリダ
イゼーションに好適である。

典型的には、ＲＮＡ分子が、ベイト配列として使用される。ＲＮＡ－ＤＮＡ二本鎖は、
ＤＮＡ－ＤＮＡ二本鎖よりも安定しており、したがって、潜在的により良好な核酸の捕捉
を提供する。

ＤＮＡ依存性ＲＮＡポリメラーゼを用いたＤＮＡ分子のデノボ化学合成および転写を含
むが、これに限定されない当技術分野で既知の方法を用いて、ＲＮＡベイトを本明細書の
他の箇所で記載されるように作製することができる。一実施形態において、ベイト配列は
、ＰＣＲ等の既知の核酸増幅法を用いて、例えば、鋳型としてヒトＤＮＡまたはプールさ
れたヒトＤＮＡ試料を用いて産生される。その後、オリゴヌクレオチドをＲＮＡベイトに
変換することができる。一実施形態において、生体外転写は、例えば、ＲＮＡポリメラー
ゼプロモーター配列のオリゴヌクレオチドの一方の末端への付加に基づいて使用される。
一実施形態において、ＲＮＡポリメラーゼプロモーター配列は、例えば、ＰＣＲまたは他
の核酸増幅法を用いてベイト配列を増幅または再増幅することによって、例えば、それぞ
れの標的特異的プライマー対の一方のプライマーにＲＮＡプロモーター配列をテーリング
することによって、ベイトの末端に付加される。一実施形態において、ＲＮＡポリメラー
ゼは、Ｔ７ポリメラーゼ、ＳＰ６ポリメラーゼ、またはＴ３ポリメラーゼである。一実施
形態において、ＲＮＡベイトは、タグ、例えば、親和性タグで標識化される。一実施形態
において、ＲＮＡベイトは、例えば、ビオチン化されたＵＴＰを用いた生体外転写によっ
て作製される。別の実施形態では、ＲＮＡベイトは、ビオチンを用いることなく産生され
、その後、ビオチンは、ソラレン架橋結合等の当技術分野で周知の方法を用いて、ＲＮＡ
分子に架橋結合される。一実施形態において、ＲＮＡベイトは、ＲＮａｓｅ抵抗性ＲＮＡ
分子であり、例えば、転写中に修飾されたヌクレオチドを用いて作製し、ＲＮａｓｅ分解
に抵抗するＲＮＡ分子を産生することができる。一実施形態において、ＲＮＡベイトは、
二本鎖ＤＮＡ標的の１本の鎖にのみ一致する。典型的には、そのようなＲＮＡベイトは、
自己相補的ではなく、ハイブリダイゼーションドライバとしてより効果的である。

ベイトが参照配列の標的選択に最適であるように、ベイトセットを参照配列から設計す
ることができる。いくつかの実施形態では、ベイト配列は、混合塩基（例えば、縮重）を
用いて設計される。例えば、混合塩基（複数を含む）を共通のＳＮＰまたは変異の位置（
複数を含む）でベイト配列に含み、ベイト配列を最適化して、両方の対立遺伝子（例えば
、ＳＮＰおよび非ＳＮＰ、変異体および非変異体）を捕獲することができる。いくつかの
実施形態では、すべての既知の配列バリエーション（またはそのサブセット）を、混合縮
重オリゴヌクレオチドを用いるのではなく、複数のオリゴヌクレオチドベイトで標的化す
ることができる。

ある特定の実施形態において、ベイトセットは、約１００ヌクレオチド長～３００ヌク
レオチド長のオリゴヌクレオチド（または複数のオリゴヌクレオチド）を含む。典型的に
は、ベイトセットは、約１３０ヌクレオチド長～２３０ヌクレオチド長、または約１５０
～２００ヌクレオチド長のオリゴヌクレオチド（または複数のオリゴヌクレオチド）を含
む。他の実施形態では、ベイトセットは、約３００ヌクレオチド長～１０００ヌクレオチ
ド長のオリゴヌクレオチド（または複数のオリゴヌクレオチド）を含む。

いくつかの実施形態では、オリゴヌクレオチド中の標的メンバー特異的配列は、約４０
～１０００ヌクレオチド長、約７０～３００ヌクレオチド長、約１００～２００ヌクレオ
チド長、典型的には、約１２０～１７０ヌクレオチド長である。

いくつかの実施形態では、ベイトセットは、結合実体を含む。結合実体は、それぞれの
ベイト配列上の親和性タグであり得る。いくつかの実施形態では、親和性タグは、ビオチ
ン分子またはハプテンである。ある特定の実施形態において、結合実体は、アビジン分子
等のパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合するこ
とによって、ベイト／メンバーハイブリッドのハイブリダイゼーション混合物からの分離
を可能にする。

他の実施形態では、ベイトセット中のオリゴヌクレオチドは、同一の標的メンバー配列
に対して順方向および逆位の相補的配列を含有し、それによって、逆方向相補メンバー特
異的配列を有するオリゴヌクレオチドは、逆方向に相補的なユニバーサル尾部も担持する
。これは、同一の鎖である、すなわち、相互に相補的ではないＲＮＡ転写物をもたらし得
る。

他の実施形態では、ベイトセットは、１つ以上の位置で縮重または混合塩基を含有する
オリゴヌクレオチドを含む。さらに他の実施形態において、ベイトセットは、生物の単一
の種または群集の集団に存在する複数または実質的にすべての既知の配列バリアントを含
む。一実施形態において、ベイトセットは、ヒト集団に存在する複数または実質的にすべ
ての既知の配列バリアントを含む。

他の実施形態では、ベイトセットは、ｃＤＮＡ配列を含むか、またはｃＤＮＡ配列に由
来する。他の実施形態では、ベイトセットは、ゲノムＤＮＡ、ｃＤＮＡ、またはクローン
化ＤＮＡから増幅される増幅産物（例えば、ＰＣＲ産物）を含む。

他の実施形態では、ベイトセットは、ＲＮＡ分子を含む。いくつかの実施形態では、ベ
イトセットは、より安定しており、かつＲＮａｓｅに対して抵抗性を示すＲＮＡ分子を含
むが、これに限定されない、化学的かつ酵素的に修飾されたか、または生体外で転写され
たＲＮＡ分子を含む。

さらに他の実施形態では、ベイトは、参照により本明細書に組み込まれる米国第２０１
０／００２９４９８号およびＧｎｉｒｋｅ，Ａ．ｅｔａｌ．（２００９）ＮａｔＢｉ
ｏｔｅｃｈｎｏｌ．２７（２）：１８２－１８９に記載の方法によって産生される。例え
ば、ビオチン化されたＲＮＡベイトを、マイクロアレイ上に最初に合成された長い合成オ
リゴヌクレオチドのプールを得て、かつオリゴヌクレオチドを増幅してベイト配列を産生
することによって産生することができる。いくつかの実施形態では、ベイトは、ベイト配
列の一方の末端にＲＮＡポリメラーゼプロモーター配列を付加し、かつＲＮＡポリメラー
ゼを用いてＲＮＡ配列を合成することによって産生される。一実施形態において、合成オ
リゴデオキシヌクレオチドのライブラリを、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ
，Ｉｎｃ．等の商業的供給業者から入手することができ、既知の核酸増幅法を用いて増幅
することができる。

したがって、前述のベイトセットの作製方法が提供される。方法は、１つ以上の標的特
異的ベイトオリゴヌクレオチド配列（例えば、本明細書に記載の参照または対照オリゴヌ
クレオチド配列を捕捉する１つ以上の変異）を選択すること、標的特異的ベイトオリゴヌ
クレオチド配列のプールを得る（例えば、マイクロアレイ合成によって、例えば、標的特
異的ベイトオリゴヌクレオチド配列のプールを合成する）こと、および任意で、オリゴヌ
クレオチドを増幅してベイトセットを産生することを含む。

他の実施形態では、方法は、１つ以上のビオチン化されたプライマーを用いてオリゴヌ
クレオチドを増幅する（例えば、ＰＣＲによって）ことをさらに含む。いくつかの実施形
態では、オリゴヌクレオチドは、マイクロアレイに結合したそれぞれのオリゴヌクレオチ
ドの末端にユニバーサル配列を含む。方法は、ユニバーサル配列をオリゴヌクレオチドか
ら除去することをさらに含み得る。そのような方法は、オリゴヌクレオチドの相補鎖を除
去することと、オリゴヌクレオチドをアニーリングすることと、オリゴヌクレオチドを伸
長することとも含み得る。これらの実施形態のいくつかにおいて、オリゴヌクレオチドを
増幅する（例えば、ＰＣＲによって）方法は、１つ以上のビオチン化されたプライマーを
用いる。いくつかの実施形態では、方法は、増幅したオリゴヌクレオチドをサイズ選択す
ることをさらに含む。

一実施形態において、ＲＮＡベイトセットが作製される。方法は、本明細書に記載の方
法に従って一組のベイト配列を産生すること、ベイト配列の一方の末端にＲＮＡポリメラ
ーゼプロモーター配列を付加すること、およびＲＮＡポリメラーゼを用いてＲＮＡ配列を
合成することを含む。ＲＮＡポリメラーゼを、Ｔ７ＲＮＡポリメラーゼ、ＳＰ６ＲＮ
Ａポリメラーゼ、またはＴ３ＲＮＡポリメラーゼから選択することができる。他の実施
形態では、ＲＮＡポリメラーゼプロモーター配列は、ベイト配列を増幅する（例えば、Ｐ
ＣＲによって）ことによって、ベイト配列の末端に付加される。ベイト配列がゲノムまた
はｃＤＮＡ由来の特異的プライマー対を用いてＰＣＲによって増幅される実施形態におい
て、それぞれの対における２つの特異的プライマーのうちの１つの５’末端へのＲＮＡプ
ロモーター配列の付加が、標準方法を用いてＲＮＡベイトに転写され得るＰＣＲ産物をも
たらす。

他の実施形態では、ベイトセットを、鋳型としてヒトＤＮＡまたはプールされたヒトＤ
ＮＡ試料を用いて産生することができる。そのような実施形態において、オリゴヌクレオ
チドは、ポリメラーゼ連鎖反応（ＰＣＲ）によって増幅される。他の実施形態では、増幅
したオリゴヌクレオチドは、ローリングサークル増幅または超分岐ローリングサークル増
幅によって再増幅される。鋳型としてヒトＤＮＡまたはプールされたヒトＤＮＡ試料を用
いてベイト配列を産生するために、同一の方法を使用することもできる。制限消化、パル
スフィールドゲル電気泳動、流動選別、ＣｓＣｌ密度勾配遠心分離法、選択的動的再会合
、染色体調製物のミクロ解剖、および当業者に既知の他の分画方法を含むが、これらに限
定されない他の方法によって得られるゲノムの細画分を用いてベイト配列を産生するため
に、同一の方法を使用することもできる。

ある特定の実施形態において、ベイトセット中のベイトの数は、１，０００未満である
。他の実施形態では、ベイトセット中のベイトの数は、１，０００を超えるか、５，００
０を超えるか、１０，０００を超えるか、２０，０００を超えるか、５０，０００を超え
るか、１００，０００を超えるか、または５００，０００を超える。

一実施形態において、ベイト配列は、例えば、ＳＮＰをコードする標的遺伝子もしくは
遺伝子産物、またはその断片におけるその結合能力（例えば、親和性および／または特異
性）を増大させるために、ＳＮＰに相補的な塩基を選択する。例となる遺伝子もしくは遺
伝子産物には、ＡＢＣＢ１、ＡＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、Ｃ１ｏｒｆ１４４、
ＣＹＰ１Ｂ１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３
Ａ５、ＤＰＹＤ、ＥＲＣＣ２、ＥＳＲ２、ＦＣＧＲ３Ａ、ＧＳＴＰ１、ＩＴＰＡ、ＬＲＰ
２、ＭＡＮ１Ｂ１、ＭＴＨＦＲ、ＮＱＯ１、ＮＲＰ２、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２
、ＳＬＣＯ１Ｂ３、ＳＯＤ２、ＳＵＬＴ１Ａ１、ＴＰＭＴ、ＴＹＭＳ、ＵＧＴ１Ａ１、お
よびＵＭＰＳが含まれるが、これらに限定されない。

別の実施形態では、ベイトセットは、癌に関連した標的遺伝子もしくは遺伝子産物、ま
たはその断片中のコドンを選択する。例となる遺伝子もしくは遺伝子産物には、ＡＢＬ１
（例えば、コドン３１５）、ＡＫＴ１、ＡＬＫ、ＡＰＣ（例えば、コドン１１１４、１３
３８、１４５０、および１５５６）、ＡＲ、ＢＲＡＦ（例えば、コドン６００）、ＣＤＫ
Ｎ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１（例えば、コドン３２、３３、３４、３７、４１、お
よび４５）、ＥＧＦＲ（例えば、７１９、７４６～７５０、７６８、７９０、８５８、お
よび８６１）、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３
（例えば、コドン８３５）、ＨＲＡＳ（例えば、コドン１２、１３、および６１）、ＪＡ
Ｋ２（例えば、コドン６１７）、ＫＩＴ（例えば、コドン８１６）、ＫＲＡＳ（例えば、
コドン１２、１３、および６１）、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、Ｎ
ＰＭ１、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ（例えば、コドン８８、５４２、５４５
、５４６、１０４７、および１０４９）、ＰＴＥＮ（例えば、コドン１３０、１７３、２
３３、および２６７）、ＲＢ１、ＲＥＴ（例えば、コドン９１８）、ＴＰ５３（例えば、
１７５、２４５、２４８、２７３、および３０６）が含まれるが、これらに限定されない
。

さらに別の実施形態では、ベイトセットは、癌に関連した標的遺伝子もしくは遺伝子産
物、またはその断片を選択する。例となる遺伝子もしくは遺伝子産物には、ＡＢＬ２、Ａ
ＫＴ２、ＡＫＴ３、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫ
Ａ、ＡＵＲＫＢ、ＢＣＬ２、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣＬ６、Ｂ
ＲＣＡ１、ＢＲＣＡ２、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＤ３、
ＣＣＮＥ１、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５、ＣＤＫ４、ＣＤＫ６、ＣＤＫ
８、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫＬ、ＣＲＬＦ２、Ｄ
ＮＭＴ３Ａ、ＤＯＴ１Ｌ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、ＥＰＨＡ７、ＥＰＨＢ
１、ＥＰＨＢ４、ＥＰＨＢ６、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、ＥＴＶ１、ＥＴＶ４、
ＥＴＶ５、ＥＴＶ６、ＥＷＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ７、ＦＧＦＲ４、Ｆ
ＬＴ１、ＦＬＴ４、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ
１２４、ＧＵＣＹ１Ａ２、ＨＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１、ＩＤＨ２、ＩＧＦ
１Ｒ、ＩＧＦ２Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２、ＪＡＫ１、ＪＡＫ
３、ＪＵＮ、ＫＤＲ、ＬＲＰ１Ｂ、ＬＴＫ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＡＰ２Ｋ４
、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ、ＭＲＥ１１
Ａ、ＭＳＨ２、ＭＳＨ６、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、ＮＦ２、ＮＫ
Ｘ２－１、ＮＴＲＫ１、ＮＴＲＫ３、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、ＰＩＫ３Ｒ１
、ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＣＨ１、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡ
Ｆ１、ＲＡＲＡ、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭＡＤ２、ＳＭＡＤ３、Ｓ
ＭＡＤ４、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＯＸ１０、ＳＯＸ２、ＳＲＣ、
ＳＴＫ１１、ＴＢＸ２２、ＴＥＴ２、ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＯＰ１、ＴＳＣ
１、ＴＳＣ２、ＵＳＰ９Ｘ、ＶＨＬ、およびＷＴ１が含まれるが、これらに限定されない
。

ベイト配列は、約７０ヌクレオチド長～１０００ヌクレオチド長であり得る。一実施形
態において、ベイトの長さは、約１００～３００ヌクレオチド長、１１０～２００ヌクレ
オチド長、または１２０～１７０ヌクレオチド長である。上述のものに加えて、約７０、
８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８
０、１９０、２００、２１０、２２０、２３０、２４０、２５０、３００、４００、５０
０、６００、７００、８００、および９００ヌクレオチド長の中程度のオリゴヌクレオチ
ドを本明細書に記載の方法で使用することができる。いくつかの実施形態では、約７０、
８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８
０、１９０、２００、２１０、２２０、または２３０塩基長のオリゴヌクレオチドを用い
ることができる。

それぞれのベイト配列は、標的特異的（例えば、メンバー特異的）ベイト配列および一
方または両方の末端にユニバーサル尾部を含み得る。本明細書で使用される「ベイト配列
」という用語は、標的特異的ベイト配列、または標的特異的「ベイト配列」およびオリゴ
ヌクレオチドの他のヌクレオチドを含む全オリゴヌクレオチドを指し得る。ベイトの標的
特異的配列は、約４０ヌクレオチド長～１０００ヌクレオチド長である。一実施形態にお
いて、標的特異的配列は、約７０ヌクレオチド長～３００ヌクレオチド長である。別の実
施形態では、標的特異的配列は、約１００ヌクレオチド長～２００ヌクレオチド長である
。さらに別の実施形態では、標的特異的配列は、約１２０ヌクレオチド長～１７０ヌクレ
オチド長、典型的には、１２０ヌクレオチド長である。上述のものに加えて中程度の長さ
、例えば、約４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、
１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、
２４０、２５０、３００、４００、５００、６００、７００、８００、および９００ヌク
レオチド長の標的特異的配列、ならびに上述の範囲内の長さの標的特異的配列等も本明細
書に記載の方法で使用することができる。

一実施形態において、ベイトは、約５０～２００ヌクレオチド長（例えば、約５０、６
０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、
１９０、または２００ヌクレオチド長）のオリゴマー（例えば、ＲＮＡオリゴマー、ＤＮ
Ａオリゴマー、またはそれらの組み合わせから成る）である。一実施形態において、それ
ぞれのベイトオリゴマーは、標的特異的ベイト配列である約１２０～１７０個、または典
型的には、約１２０個のヌクレオチドを含む。ベイトは、一方または両方の末端に追加の
非標的特異的ヌクレオチド配列を含み得る。それらの追加のヌクレオチド配列を、例えば
、ＰＣＴ増幅のために、またはベイト識別子として使用してもよい。ある特定の実施形態
において、ベイトは、本明細書に記載の結合実体（例えば、ビオチン分子等の捕捉タグ）
をさらに含む。結合実体、例えば、ビオチン分子は、ベイト、例えば、ベイトの５’末端
、３’末端、または内部に（例えば、ビオチン化されたヌクレオチドを組み込むことによ
って）結合することができる。一実施形態において、ビオチン分子は、ベイトの５’末端
に結合する。

例となる一実施形態において、ベイトは、約１５０ヌクレオチド長のオリゴヌクレオチ
ドであり、そのうちの１２０個のヌクレオチドは、標的特異的「ベイト配列」である。残
りの３０個のヌクレオチド（例えば、それぞれの末端に１５個のヌクレオチド）は、ＰＣ
Ｒ増幅に使用される任意のユニバーサル尾部である。尾部は、ユーザが選択した任意の配
列であり得る。例えば、合成オリゴヌクレオチドのプールは、５’－ＡＴＣＧＣＡＣＣＡ
ＧＣＧＴＧＴＮ_１２０ＣＡＣＴＧＣＧＧＣＴＣＣＴＣＡ－３’（配列番号１）の配列のオ
リゴヌクレオチドを含み得、Ｎ_１２０は、標的特異的ベイト配列を示す。

本明細書に記載のベイト配列を、エクソンおよび短い標的配列の選択に用いることがで
きる。一実施形態において、ベイトは、約１００ヌクレオチド長～３００ヌクレオチド長
である。別の実施形態では、ベイトは、約１３０ヌクレオチド長～２３０ヌクレオチド長
である。さらに別の実施形態では、ベイトは、約１５０ヌクレオチド長～２００ヌクレオ
チド長である。ベイトの標的特異的配列は、例えば、エクソンおよび短い標的配列の選択
のために、約４０ヌクレオチド長～１０００ヌクレオチド長である。一実施形態において
、標的特異的配列は、約７０ヌクレオチド長～３００ヌクレオチド長である。別の実施形
態では、標的特異的配列は、約１００ヌクレオチド長～２００ヌクレオチド長である。さ
らに別の実施形態では、標的特異的配列は、約１２０ヌクレオチド長～１７０ヌクレオチ
ド長である。

いくつかの実施形態では、長いオリゴヌクレオチドは、標的配列を捕捉するのに必要な
オリゴヌクレオチドの数を最小限に抑えることができる。例えば、１個のエクソンにつき
１個のオリゴヌクレオチドを用いることができる。ヒトゲノムのタンパク質コードエクソ
ンの長さの平均および中央値が、それぞれ、約１６４個および１２０個の塩基対であるこ
とは、既知の当技術分野では既知である。より長いベイトは、短いベイトよりも特異的で
あり、より良好に捕捉することができる。結果として、１個のオリゴヌクレオチドベイト
配列当たりの成功率は、短いオリゴヌクレオチドよりも高い。一実施形態において、最小
のベイトが対象範囲とする配列は、例えば、エクソンサイズの標的を捕捉するために、１
個のベイト（例えば、１２０～１７０個の塩基）の大きさである。ベイト配列の長さを決
定する際、不必要に長いベイトがより多くの望ましくない標的に直接隣接したＤＮＡを捕
獲することを考慮に入れることができる。より長いオリゴヌクレオチドベイトは、ＤＮＡ
試料の標的化された領域における多型性に短いオリゴヌクレオチドベイトよりも高い耐性
を示し得る。典型的には、ベイト配列は、参照ゲノム配列に由来する。実際のＤＮＡ試料
中の標的配列が参照配列から外れる場合、例えば、それが単一ヌクレオチド多型（ＳＮＰ
）を含有する場合、それは、より低い効率でベイトにハイブリダイズし得、したがって、
ベイト配列にハイブリダイズした配列において表示不足であるか、または完全に不在であ
り得る。例えば、１２０～１７０個の塩基における単一のミスマッチのハイブリッド安定
性に与える影響が２０個または７０個の塩基（それぞれ、マルチプレックス増幅およびマ
イクロアレイ捕捉において典型的なベイトまたはプライマーの長さである）における単一
のミスマッチよりも小さくあり得るという理由から、より長い合成ベイト分子におけるＳ
ＮＰによる対立遺伝子ドロップアウトの可能性はより低い場合がある。

ゲノム領域等の捕捉ベイトの長さよりも長い標的を選択する場合、ベイト配列の長さは
、典型的には、上述の短い標的のベイトと同一のサイズ範囲であるが、但し、隣接配列の
標的化を最小限に抑えることを唯一の目的としてベイト配列の最大サイズを制限する必要
はないということを除く。あるいは、はるかにより幅広いウィンドウ（典型的には、６０
０個の塩基）にわたってオリゴヌクレオチドにタイトル付けすることができる。この方法
を用いて、典型的なエクソンよりもはるかに大きい（例えば、約５００個の塩基）ＤＮＡ
断片を捕捉することができる。結果として、はるかにより多くの望ましくないフランキン
グ非標的配列が選択される。
ベイト合成

ベイトは、任意の種類のオリゴヌクレオチド、例えば、ＤＮＡまたはＲＮＡであり得る
。ＤＮＡまたはＲＮＡベイト（「オリゴベイト」）を、ＤＮＡまたはＲＮＡベイトセット
（「アレイベイト」）として、個別に合成することができるか、またはアレイで合成する
ことができる。オリゴベイトは、アレイ形式で提供されるか、または単離されたオリゴと
して提供されるかにかかわらず、典型的には、一本鎖である。ベイトは、本明細書に記載
の結合実体（例えば、ビオチン分子等の捕捉タグ）をさらに含み得る。結合実体、例えば
、ビオチン分子は、ベイト、例えば、ベイトの５’末端または３’末端、典型的には、ベ
イトの５’末端に結合し得る。

いくつかの実施形態では、個別のオリゴベイトをアレイベイトセットに付加してもよい
。これらの場合において、オリゴベイトを、アレイベイトによって標的化される領域と同
一の領域を標的化するように設計することができ、追加のオリゴベイトを設計し、標準の
アレイベイトに付加して、ゲノムのある特定の領域において強化されたか、またはより完
全な対象範囲を達成することができる。例えば、追加のオリゴベイトを、標準のアレイベ
イトセットを用いた最初の配列決定ラウンド後に配列対象範囲の低い領域を標的化するよ
うに設計することができる。いくつかの実施形態では、オリゴベイトは、アレイベイトセ
ットの対象範囲領域にわたってタイル状効果を有するか、または他のオリゴベイトの対象
範囲領域にわたってタイル状効果を有するように設計される。

一実施形態において、個別のオリゴベイトは、ＲＮＡもしくはＤＮＡオリゴアレイベイ
トセット、またはその組み合わせ（例えば、市販のアレイベイトセット）を補充するため
に使用されるＤＮＡオリゴである。他の実施形態では、個別のオリゴベイトは、個別に設
計および合成されたオリゴの収集物であるＲＮＡもしくはＤＮＡオリゴベイトセット、ま
たはその組み合わせを補充するために使用されるＤＮＡオリゴである。一実施形態におい
て、個別のオリゴベイトは、ＲＮＡもしくはＤＮＡオリゴアレイベイトセット、またはそ
の組み合わせ（例えば、市販のアレイベイトセット）を補充するために使用されるＲＮＡ
オリゴである。他の実施形態では、個別のオリゴベイトは、個別に設計および合成された
オリゴの収集物であるＲＮＡもしくはＤＮＡオリゴベイトセット、またはその組み合わせ
を補充するために使用されるＲＮＡオリゴである。

さらに別の実施形態では、個別のオリゴベイトは、ＤＮＡオリゴアレイベイトセット（
例えば、市販のアレイベイトセット）を補充するために使用されるＤＮＡオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるＤＮＡオリゴベイトセットを補充するために使用されるＤＮＡオリゴである。

さらに別の実施形態では、個別のオリゴベイトは、ＲＮＡオリゴアレイベイトセット（
例えば、市販のアレイベイトセット）を補充するために使用されるＤＮＡオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるＲＮＡオリゴベイトセットを補充するために使用されるＤＮＡオリゴである。

さらに別の実施形態では、個別のオリゴベイトは、ＲＮＡオリゴアレイベイトセット（
例えば、市販のアレイベイトセット）を補充するために使用されるＲＮＡオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるＲＮＡオリゴベイトセットを補充するために使用されるＲＮＡオリゴである。

さらに別の実施形態では、個別のオリゴベイトは、ＤＮＡオリゴアレイベイトセット（
例えば、市販のアレイベイトセット）を補充するために使用されるＲＮＡオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるＤＮＡオリゴベイトセットを補充するために使用されるＲＮＡオリゴである。

一実施形態において、オリゴベイトは、特に関心のある遺伝子の配列を標的とする、例
えば、拡大された遺伝子の組の配列対象範囲増加を達成するように設計される。

別の実施形態では、オリゴベイトは、ゲノムのサブセットを表す配列を標的とするよう
に設計され、混合され、アレイベイトの代わりに、またはアレイベイトに加えて、プール
として使用される。

一実施形態において、第１の組のオリゴベイトは、配列対象範囲の低い領域を標的とす
るように設計され、第２の組のオリゴベイトは、特に関心のある遺伝子を標的化するよう
に設計される。その後、両方の組のオリゴベイトは合わせられ、任意で、配列決定のため
に使用される標準のアレイベイトセットと混合される。

一実施形態において、オリゴベイト混合物が、例えば、ゲノム再編成およびコピー数の
変化（アレイＣＧＨ（包括的ゲノムハイブリダイゼーション）と同等）を探す目的で、例
えば、標的化された遺伝子パネルを同時に配列決定し、かつ作成された単一ヌクレオチド
多型（ＳＮＰ）のパネルをスクリーニングするために使用される。例えば、ＳＮＰのパネ
ルを最初にアレイベイトとしてアレイ方法によって作製することができ、その後、追加の
ＤＮＡオリゴヌクレオチドベイトを、配列対象範囲の低い領域を標的化された組の遺伝子
に標的化するように設計することができる。その後、ＳＮＰの収集物の配列決定を最初の
アレイベイトセットに加えて追加のオリゴベイトで繰り返し、目的とする全配列対象範囲
を達成することができる。

いくつかの実施形態では、オリゴベイトが、より完全な配列対象範囲を達成するために
、標準のアレイベイトセットに付加される。一実施形態において、オリゴベイトは、標準
のアレイベイトセットでの最初の配列決定ラウンド後に配列対象範囲の低い領域を標的す
るように設計される。

別の実施形態では、オリゴベイトは、特に関心のある遺伝子の配列を標的化するように
設計される。これらのオリゴベイトを標準のアレイベイトセットまたは現行のオリゴ／ア
レイハイブリッドベイトセットに付加して、例えば、全アレイベイトプール再設計サイク
ルを経ることなく、拡大された遺伝子の組の配列対象範囲増加を達成することができる。

オリゴベイトを、ＮｉｍｂｌｅＧｅｎ（Ｒｏｃｈｅ）から、またはＤＮＡオリゴの場合
はＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ（ＩＤＴ）等の商業的供給
源から入手することができる。オリゴをＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓから
入手することができる。濃縮のプロトコルは、公的に入手可能であり、例えば、Ｓｕｒｅ
ＳｅｌｅｃｔＴａｒｇｅｔＥｎｒｉｃｈｍｅｎｔＳｙｓｔｅｍがある。

ベイトを、参照により本明細書に組み込まれる米国第２０１０／００２９４９８号およ
びＧｎｉｒｋｅ，Ａ．ｅｔａｌ．（２００９）ＮａｔＢｉｏｔｅｃｈｎｏｌ．２７（
２）：１８２－１８９に記載の方法で産生することができる。例えば、ビオチン化された
ＲＮＡベイトを、マイクロアレイ上で最初に合成された長い合成オリゴヌクレオチドのプ
ールを得て、かつオリゴヌクレオチドを増幅してベイト配列を産生することによって産生
することができる。いくつかの実施形態では、ベイトは、ベイト配列の一方の末端にＲＮ
Ａポリメラーゼプロモーター配列を付加し、かつＲＮＡポリメラーゼを用いてＲＮＡ配列
を合成することによって産生される。一実施形態において、合成オリゴデオキシヌクレオ
チドのライブラリを、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．等の商業的
供給業者から入手することができ、既知の核酸増幅法を用いて増幅することができる。

例えば、ベイトの大きな収集物を、最初にオリゴヌクレオチドアレイ、例えば、Ａｇｉ
ｌｅｎｔのプログラム可能なＤＮＡマイクロアレイ上で合成された合成オリゴヌクレオチ
ドのカスタムプールから生成することができる。したがって、少なくとも約２，５００、
５，０００、１０，０００、２０，０００、３，０００、４０，０００、５０，０００、
または６０，０００個の一意のオリゴヌクレオチドを同時に合成することができる。

一実施形態において、最小の組の一意のオリゴヌクレオチドが選択され、例えば、事前
選択された組の標的（例えば、事前選択された組のエクソン）を捕捉するように設計され
たベイトの場合、合成オリゴヌクレオチドアレイの最大容量に達するまで、追加のコピー
（例えば、逆補体と最初の順方向鎖との間で交互に起こる）が付加される。別の実施形態
では、標的は、例えば、順方向および逆方向相補オリゴヌクレオチドの両方を合成するこ
とによって、少なくとも２回表される。所与の標的のために順方向および逆方向相補オリ
ゴヌクレオチドを合成することで、この合成ステップにおいて全く同一の配列を２回合成
するよりも良好な冗長性を提供することができる。さらに別の実施形態では、ＰＣＲ産物
またはベイトは、順方向および逆方向相補オリゴヌクレオチドの場合でも同じである。

チップからのオリゴヌクレオチドを１度合成し、その後、増幅して、一組のオリゴヌク
レオチドを作成することができ、それを何度も使用することができる。この手法は、多数
の選択実験用のベイトとして使用することができるユニバーサル試薬を生成し、それによ
って、配列決定費用のごく一部であるチップの費用を償却する。あるいは、ベイト配列を
、鋳型としてヒトＤＮＡまたはプールされたヒトＤＮＡ試料を用いたＰＣＲ等の既知の核
酸増幅法を用いて産生することができる。

合成後、オリゴヌクレオチドを化学的切断によってアレイから解放し（例えば、取り去
り）、その後、保護基を除去し、ユニバーサルプライマーを用いてＰＣＲを二本鎖ＤＮＡ
に増幅することができる。第２ラウンドのＰＣＲを用いて、プロモーター（例えば、Ｔ７
、ＳＰ６、またはＴ３プロモーター）部位を増幅産物に組み込むことができ、これは、Ｄ
ＮＡを一本鎖ＲＮＡに転写するために使用される。

一実施形態において、ベイトは、ギャップまたはオーバーラップなしで、配列（例えば
、エクソン）に沿ってタイルされる。例えば、ベイトは、ＵＣＳＣゲノムブラウザに示さ
れる参照ゲノム配列の鎖の最も「左」のコード塩基で始まってもよく（例えば、遺伝子の
配向に応じて、コード配列に沿って５’から３’または３’から５’）、すべてのコード
塩基が対象範囲とされるまでさらにベイトが付加される。別の実施形態では、それぞれの
標的につき少なくとも２つ、３つ、４つ、または５つのベイトが、少なくとも約１５、３
０、４５、または６０個の塩基分オーバーラップさせて設計される。オリゴヌクレオチド
合成およびユニバーサルプライマーを用いたＰＣＲ増幅後、二本鎖ＤＮＡの尾部のうちの
一方を酵素分解することができ、その後、その鎖のうちの１本を分解する。一本鎖産物を
ハイブリダイズし、充填して完全な二本鎖にし、ＰＣＲによって増幅することができる。
この様式で、少なくとも約３００、４００、５００、または６００個の連続した標的特異
的塩基を含有するベイトを産生することは可能であり、これは、化学的に合成され得るよ
りも多い。そのような長いベイトは、高い特異性および感度を必要とする用途、またはベ
イト長を制限すること（例えば、長く連続したゲノム領域の捕捉）から恩恵を受けるとは
限らない用途に有用であり得る。

一実施形態において、それぞれの標的の対象範囲を評価することができ、同様の対象範
囲もたらす標的をグループ化することができる。はっきりと異なる組のベイト配列をそれ
ぞれの標的群のために作成し、表示をさらに改善することができる。別の実施形態では、
マイクロアレイチップからのオリゴヌクレオチドは、ハイブリダイゼーションの有効性に
ついて試験され、オリゴヌクレオチドがそれらの捕捉有効性によってグループ化されるマ
イクロアレイチップの産生ラウンドが要求され、したがって、ベイト有効性の変化を相殺
する。さらに別の実施形態では、複合体プールの間に捕捉有効性の変化が少ししか存在し
ないように、オリゴヌクレオチドプールを凝集して比較的少ない数の複合体プールを形成
することができる。

本明細書に記載のベイトをタグ、例えば、親和性タグで標識化することができる。例と
なる親和性タグには、ビオチン分子、磁気粒子、ハプテン、またはタグ分子でタグ付けさ
れたベイトの単離を可能にする他のタグ分子が含まれるが、これらに限定されない。それ
らを核酸に結合するそのような分子および方法（例えば、本明細書に開示の方法で使用さ
れるベイト）は、当技術分野で周知である。ビオチン化されたベイトを作製する例となる
方法は、例えば、参照により全体が本明細書に組み込まれるＧｎｉｒｋｅＡ．ｅｔａ
ｌ．，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．２００９；２７（２）：１８２－９に記載されて
いる。

タグ付けされたベイトに結合するか、またはタグ付けされたベイトをハイブリダイゼー
ション混合物から分離することができる分子、粒子、またはデバイスも当技術分野で既知
である。一実施形態において、分子、粒子、またはデバイスは、タグ（例えば、親和性タ
グ）に結合する。一実施形態において、分子、粒子、またはデバイスは、アビジン分子、
磁石、または抗体もしくはその抗原結合断片である。一実施形態において、タグ付けされ
たベイトは、ストレプトアビジン分子でコーティングされた磁気ビーズを用いて分離され
る。

オリゴヌクレオチドライブラリを調製する例となる方法は、例えば、参照により全体が
本明細書に組み込まれるＧｎｉｒｋｅＡ．ｅｔａｌ．，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏ
ｌ．２００９；２７（２）：１８２－９、およびＢｌｕｍｅｎｓｔｉｅｌＢ．ｅｔａ
ｌ．，Ｃｕｒｒ．Ｐｒｏｔｏｃ．Ｈｕｍ．Ｇｅｎｅｔ．２０１０；Ｃｈａｐｔｅｒ１８
：Ｕｎｉｔ１８．４に記載されている。
ハイブリダイゼーション条件

本発明で特色とする方法は、ライブラリ（例えば、核酸ライブラリ）を複数のベイトと
接触させて、選択されたライブラリ捕獲物を提供するステップを含む。接触ステップを、
溶液ハイブリダイゼーションにおいて達成することができる。ある特定の実施形態におい
て、方法は、１つ以上のさらなるラウンドの溶液ハイブリダイゼーションによってハイブ
リダイゼーションステップを繰り返すことを含む。いくつかの実施形態では、方法は、同
一または異なるベイト収集物を用いて、ライブラリ捕獲物を１つ以上のさらなるラウンド
の溶液ハイブリダイゼーションに供することをさらに含む。

他の実施形態では、本発明で取り上げられる方法は、ライブラリ捕獲物を増幅する（例
えば、ＰＣＲによって）ことをさらに含む。他の実施形態では、ライブラリ捕獲物は増幅
されない。

さらに他の実施形態では、方法は、ライブラリ捕獲物を遺伝子型判定に供し、それによ
って、選択された核酸の遺伝子型を特定するステップをさらに含む。

より具体的には、数千個のベイト配列の混合物が、核酸基のうちの相補的な核酸に効果
的にハイブリダイズすることができ、そのようなハイブリダイズした核酸（核酸のサブグ
ループ）を効果的に分離し、回収することができる。一実施形態において、本明細書に記
載の方法は、約１，０００個を超えるベイト配列、約２，０００個を超えるベイト配列、
約３，０００個を超えるベイト配列、約４，０００個を超えるベイト配列、約５，０００
個を超えるベイト配列、約６，０００個を超えるベイト配列、約７，０００個を超えるベ
イト配列、約８，０００個を超えるベイト配列、約９，０００個を超えるベイト配列、約
１０，０００個を超えるベイト配列、約１５，０００個を超えるベイト配列、約２０，０
００個を超えるベイト配列、約３０，０００個を超えるベイト配列、約４０，０００個を
超えるベイト配列、または約５０，０００個を超えるベイト配列を含有する一組のベイト
配列を使用する。

いくつかの実施形態では、選択プロセスは、例えば、選択された核酸の濃縮を増加させ
るために、核酸の選択されたサブグループ上で繰り返される。例えば、ハイブリダイゼー
ションの１ラウンド後、数千倍の核酸の濃縮を観察することができる。第２ラウンド後、
濃縮は、例えば、約１５，０００倍の平均濃縮まで上昇することができ、単一のシーケン
サーランで数百倍の標的対象範囲を提供することができる。したがって、ハイブリッド選
択の単一のラウンドでは達成不可能な濃縮因子を必要とする実験において、方法は、典型
的には、その組のベイト配列を用いて、単離された核酸のサブグループ（すなわち、標的
配列の一部またはすべて）を１つ以上のさらなるラウンドの溶液ハイブリダイゼーション
に供することを含む。

２つの異なるベイト配列（ベイト１、ベイト２）を用いた連続ハイブリッド選択を用い
て、「交差点」、すなわち、例えば、染色体間の濃縮を含むが、これに限定されない用途
に使用されるベイト１およびベイト２に結合するＤＮＡ配列のサブグループを単離し、配
列決定することができる。例えば、染色体１上の配列に特異的なベイトを有する腫瘍試料
からのＤＮＡの選択、続いて、染色体２に特異的なベイトにハイブリダイズする配列の第
１の選択の産物からの選択は、それら両方の染色体由来の配列を含有する染色体転座接合
部で配列を濃縮することができる。

任意の特定の核酸のモル濃度が、核酸のサブグループ内のすべての選択された核酸の平
均モル濃度のわずかな変化の範囲内であるように、選択された核酸のサブグループのモル
濃度を制御することができる。標的表示の均等性を制御および最適化する方法には、当技
術分野で周知のプローブ設計の物理化学的および経験的規定に基づいたベイト配列の合理
的設計、ならびに平均よりも低い働きをすることで既知であるか、または平均よりも低い
働きをする疑いのある配列がそれらの本質的弱点を相殺するために大きな比率を占めるベ
イトのプールが含まれるが、これらに限定されない。いくつかの実施形態では、単離され
た核酸のサブグループの少なくとも約５０％、６０％、６５％、７０％、７５％、８０％
、８５％、９０％、または９５％は、平均モル濃度の約２０倍、１５倍、１０倍、５倍、
３倍、または２倍の範囲内である。一実施形態において、単離された核酸のサブグループ
の少なくとも約５０％は、平均モル濃度の約３倍の範囲内である。別の実施形態では、単
離された核酸のサブグループの少なくとも約９０％は、平均モル濃度の約１０倍の範囲内
である。

ベイトの濃度を変化させることによって、選択効率の変化をさらに調節することができ
る。一実施形態において、選択効率は、ベイトの等モル混合物を用いるときに観察される
差次的配列捕捉効率を参照してベイトの相対存在量または結合実体の密度（例えば、ハプ
テンもしくは親和性タグ密度）を調節することによって、ある群内の個別のベイト（例え
ば、第１、第２、もしくは第３の複数のベイト）の効率を平準化し、その後、内部的に平
準化された第２群に対して、差次的の過度の内部的に平準化された第１群の必要な量を全
体のベイト混合物に導入することにより調節される。

ある特定の実施形態において、本明細書に記載の方法は、標的配列の均等な対象範囲を
達成することができる。一実施形態において、予想される対象範囲の少なくとも約５０％
を有する標的塩基の割合は、例えば、タンパク質コードエクソン等の短い標的の場合、少
なくとも約６０％、７０％、８０％、または９０％である。別の実施形態では、予想され
る対象範囲の少なくとも約５０％を有する標的塩基の割合は、例えば、ゲノム領域等の捕
捉ベイトの長さよりも長い標的の場合、少なくとも約８０％、９０％、または９５％であ
る。

ハイブリダイゼーションの前に、ベイトを当技術分野で周知の方法に従って変性するこ
とができる。概して、ハイブリダイゼーションステップは、過剰なブロッキングＤＮＡを
標識化されたベイト組成物に付加すること、ハイブリダイゼーション条件下でブロッキン
グされたベイト組成物を検出される標的配列と接触させること、ハイブリダイズされてい
ないベイトを洗い流すこと、およびベイト組成物の標的への結合を検出することを含む。

ベイトは、ハイブリダイゼーション条件下で標的配列にハイブリダイズまたはアニーリ
ングされる。「ハイブリダイゼーション条件」は、ベイトと標的核酸との間のアニーリン
グを促進する条件である。異なるベイトのアニーリングがプローブの長さ、塩基濃度等に
応じて変化するため、アニーリングは、ベイト濃度、ハイブリダイゼーション温度、塩濃
度、および当技術分野で周知の他の要因を変化させることによって促進される。

ハイブリダイゼーション条件は、ベイトの濃度、塩基組成、複雑度、および長さ、なら
びにインキュベーションの塩濃度、温度、および期間を変化させることによって促進され
る。例えば、ハイブリダイゼーションを、５倍ＳＳＰＥ、５倍デンハルト液、５ｍＭのＥ
ＤＴＡ、および０．１％のＳＤＳ、ならびにブロッキングＤＮＡを含有するハイブリダイ
ゼーション緩衝液中で行って、非特異的ハイブリダイゼーションを抑制することができる
。ベイトがＲＮＡである場合、ＲＮａｓｅ阻害剤を使用することができる。概して、上述
のハイブリダイゼーション条件は、約２５℃～約６５℃、典型的には、約６５℃の温度、
および約０．５時間～約９６時間、典型的には、約６６時間のインキュベーション期間を
含む。さらなる例となるハイブリダイゼーション条件は、本明細書の実施例１２Ａ～１２
Ｃおよび表１４にある。

本明細書に記載の方法は、標準の液体処理方法およびデバイスに適応可能である。いく
つかの実施形態では、方法は、マルチウェルプレートを処理するデバイス等の当技術分野
で既知の自動液体処理技術を用いて実行される（例えば、Ｇｎｉｒｋｅ，Ａ．ｅｔａｌ
．（２００９）ＮａｔＢｉｏｔｅｃｈｎｏｌ．２７（２）：１８２－１８９を参照のこ
と）。これは、自動ライブラリ構築、ならびに溶液ハイブリダイゼーションの設定および
溶液ハイブリダイゼーション後の洗浄を含む溶液ハイブリダイゼーションステップを含み
得るが、これらに限定されない。例えば、そのような自動化された方法を実行するための
装置を溶液ハイブリダイゼーション反応後のビーズ捕捉および洗浄ステップに使用するこ
とができる。例となる装置は、ストレプトアビジンでコーティングされた磁気ビーズを含
有するマルチウェルプレート用の位置；試薬を予熱し、かつユーザ定義の温度で洗浄ステ
ップを実行するためのＩ／Ｏ制御熱ブロックである、ハイブリッド－選択反応溶液を含有
するマルチウェルプレート用の位置；ピペット先端のラック用の位置；ピペット先端を洗
浄し、かつ廃棄物を処分する洗浄ステーションである、磁石固定化ビーズからの上清の分
離を促進するある特定の構成でレイアウトされた磁石を有する位置；ならびに低および高
ストリンジェンシー洗浄緩衝液または最終捕獲物のアルカリ溶出用の溶液等の他の溶液お
よび試薬用の位置を含み得るが、これらに限定されない。一実施形態において、装置は、
同時に捕獲中和ステップを介するビーズ捕捉ステップからの最大９６個のハイブリッド選
択を処理するように設計される。別の実施形態では、１つ以上の位置が二重機能を有する
。さらに別の実施形態では、ユーザは、１つのプレートを別のプレートに交換するプロト
コルによって指示される。

直接的に選択された核酸を連鎖させて剪断することができ、これは、短い配列決定読み
取りの制限を打開するために行われる。一実施形態において、それぞれのエクソンサイズ
の配列決定標的は、標的と略同一のサイズであり、かつ標的のエンドポイントに近いエン
ドポイントを有する単一のベイト分子で捕捉される。約１００個以上の連続塩基対を有す
る二本鎖分子を形成するハイブリッドのみが、ストリンジェントなハイブリダイゼーショ
ン後の洗浄に耐え抜く。結果として、選択された核酸のサブグループ（すなわち、「捕獲
物」）は、ランダムに剪断されたゲノムＤＮＡ断片のために濃縮され、その末端は、ベイ
ト分子の末端に近い。非常に短い配列決定読み取りを用いた単なる「捕獲物」の末端配列
決定が、標的の末端近く（またはさらには外側）でより高い対象範囲をもたらし、中間近
くで対象範囲を低下させ得る。

ライゲーションによって「捕獲」分子を連鎖し、その後、ランダム剪断およびショット
ガン配列決定を行うことは、標的配列の全長に沿って配列対象範囲を得る１つの方法であ
る。この方法は、非常に短い読み取りでの末端配列決定よりも高い割合の（標的付近では
なく）標的上の配列決定された塩基を産生する。共ライゲーションによって分子を連鎖さ
せる方法は、当技術分野で周知である。連鎖を平滑末端ライゲーションによって行うこと
ができる。効率的なライゲーションのための「粘着」末端を、それらの５’末端近くに制
限部位を有するＰＣＲプライマーを用いた「捕獲物」のＰＣＲ増幅、その後、対応する制
限酵素（例えば、ＮｏｔＩ）での消化を含む様々な方法によって、あるいはＴ４ＤＮＡ
ポリメラーゼによる部分的「チューバック」等のＰＣＲ産物のライゲーション依存性クロ
ーニングに一般的に使用される戦略と同様の戦略（Ａｓｌａｎｉｄｉｓａｎｄｄｅ
Ｊｏｎｇ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：６０６９－６０７４，１９９０
）、またはＵＤＧグリコシラーゼおよびリアーゼエンドＶＩＩＩでのウラシル含有ＰＣＲ
産物の処理（例えば、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓｃａｔ．Ｅ５５００Ｓ
）によって産生することができる。

別の実施形態では、互い違いの組のベイト分子を用いて領域を標的とし、標的領域にわ
たって頻出するベイト末端を得る。いくつかの実施形態では、単に末端配列された「捕獲
物」（すなわち、連鎖および剪断なし）が、実際の配列決定標的（例えば、エクソン）を
含むベイトによって対象範囲とされる全領域に沿って極めて均一な配列対象範囲を提供す
る。ベイト分子を互い違いにしてベイトによって対象範囲とされる断片を広げると、配列
決定された塩基は、より広い領域にわたって分布される。結果として、標的上の配列と標
的付近の配列との比率は、１つの標的につき単一のベイトのみを必要とすることの多いオ
ーバーラップしないベイトで選択した場合よりも低い。

別の実施形態では、わずかにより長い読み取り（例えば、７６個の塩基）での末端配列
決定は、短い選択された標的（例えば、エクソン）を配列決定するための典型的な方法で
ある。非常に短い読み取りでの末端配列決定とは異なり、この方法は、中間での対象範囲
の低下を伴うことなく単様式の対象範囲特性をもたらす。この方法は、上述の連鎖および
剪断方法よりも簡単に行われ、標的に沿って比較的均一の対象範囲をもたらし、ベイトお
よび標的に適切の重なる高い割合の配列決定された塩基を生成する。

一実施形態において、選択された核酸のサブグループは、配列決定または遺伝子型判定
によって分析される前に増幅される（例えば、ＰＣＲによって）。別の実施形態では、サ
ブグループは、例えば、選択されたサブグループが、単一の分子を読み取ることができる
高感度分析法によって分析されるとき、増幅ステップなしで分析される。
ベイトモジュール

本明細書に記載の方法は、配列決定される標的核酸の選択のために、ベイト、例えば、
溶液ハイブリダイゼーション用のベイトの適切な選択による１名以上の対象由来の試料、
例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物の最適化配列決定を提供する。様
々なサブゲノム間隔またはそのクラスの選択効率は、事前選択された選択効率を有するベ
イトセットに従って適合される。

したがって、方法（例えば、上述の方法の要素（ｂ））は、ライブラリを複数のベイト
と接触させて選択されたメンバー（本明細書でライブラリ捕獲物と称される場合もある）
を提供することを含む。

したがって、試料、例えば、腫瘍試料を分析する方法が提供される。方法は、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
（ｂ）ライブラリをベイトセットと接触させて選択されたメンバー（例えば、ライブラ
リ捕獲物）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
によってアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す）ことと、を含み、
それによって、該腫瘍試料を分析し、
方法は、ライブラリを複数、例えば、少なくとも２つ、３つ、４つ、または５つのベイト
セットと接触させることとを含み、該複数のベイトセットはそれぞれ、（他の複数のベイ
トセットとは対照的に）一意の事前選択された選択効率を有し、例えば、それぞれの一意
のベイトセットは、一意の配列決定深度を提供する。

ある実施形態において、第１の複数のベイトセットの選択効率は、第２の複数のベイト
セットの効率とは少なくとも２倍異なる。ある実施形態において、第１および第２のベイ
トセットは、少なくとも２倍異なる配列決定深度を提供する。

ある実施形態において、方法は、以下のベイトセットのうちの１つまたは複数をライブ
ラリと接触させることを含む：
ａ）約５００倍以上の配列決定深度を提供する、例えば、試料由来の５％を超えない細
胞に存在する変異を配列決定するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット、
ｂ）約２００倍以上、例えば、約２００倍～約５００倍の配列決定深度を提供する、例
えば、試料由来の１０％を超えない細胞に存在する変異を配列決定するのに十分な数のサ
ブゲノム間隔を含むメンバーを選択するベイトセット、
ｃ）約１０～１００倍の配列決定深度を提供する、例えば、ａ）異なる薬物を代謝する
患者の能力を説明し得る薬理ゲノム（ＰＧｘ）単一ヌクレオチド多型（ＳＮＰ）、ｂ）患
者を一意に同定する（例えば、フィンガープリントする）ために使用され得るゲノムＳＮ
Ｐ、ｃ）ゲノムＤＮＡのコピー数の獲得／喪失およびヘテロ接合性の消失（ＬＯＨ）を評
価するために使用され得るゲノムＳＮＰ／遺伝子座から選択される１つ以上のサブゲノム
間隔（例えば、エクソン）を配列決定するのに十分な数のサブゲノム間隔を含むメンバー
を選択するベイトセット、
ｄ）約５～５０倍の配列決定深度を提供する、例えば、ゲノム転座またはインデル等の
構造ブレークポイントを検出するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット（例えば、イントロンブレークポイントの検出は、高い検出信頼性を確保
するために、５～５０倍の配列対スパン深度を必要とし、そのようなベイトセットを用い
て、例えば、転座／インデルの傾向のある癌遺伝子を検出することができる）、または
ｅ）約０．１～３００倍の配列決定深度を提供する、例えば、コピー数の変化を検出す
るのに十分な数のサブゲノム間隔を含むメンバーを選択するベイトセット。一実施形態に
おいて、コピー数の変化を検出するための配列決定深度は、約０．１～１０倍の配列決定
深度の範囲である。他の実施形態では、ゲノムＤＮＡのコピー数獲得／喪失またはヘテロ
接合性の消失（ＬＯＨ）を評価するために使用されるゲノムＳＮＰ／遺伝子座を検出する
ための配列決定深度は、約１００～３００倍の範囲である。そのようなベイトセットを用
いて、例えば、増幅／欠失の傾向のある癌遺伝子を検出することができる。

実施形態において、方法は、それぞれが異なるベイト設計戦略を有する２つ以上の異な
る標的カテゴリーを捕捉するように設計されるベイトの使用を含む。実施形態において、
本明細書に開示のハイブリッド捕捉方法および組成物は、標的配列（例えば、標的メンバ
ー）の定義されたサブセットの外側の対象範囲を最小限に抑えながら、そのサブセットを
捕捉し、標的配列の均一な対象範囲を提供する。一実施形態において、標的配列は、ゲノ
ムＤＮＡからの全エクソーム、またはその選択されたサブセットを含む。本明細書に開示
の方法および組成物は、異なる深度およびパターンの複合標的核酸配列（例えば、核酸ラ
イブラリ）の対象範囲を達成するために、異なるベイトセットを提供する。

ある実施形態において、方法は、核酸ライブラリ（例えば、ライブラリ捕獲物）の選択
されたメンバーを提供することを含む。方法は、
複数のメンバー、例えば、標的核酸メンバー（例えば、複数の腫瘍メンバー、参照メン
バー、および／またはＰＧｘメンバーを含む）を含むライブラリ（例えば、核酸ライブラ
リ）を提供することと、
ライブラリを、例えば、溶液またはアレイベースの反応で、複数のベイト（例えば、オ
リゴヌクレオチドベイト）と接触させて、複数のベイト／メンバーハイブリッドを含むハ
イブリダイゼーション混合物を形成することと、
複数のベイト／メンバーハイブリッドを、例えば、該ハイブリダイゼーション混合物を
該複数のベイト／メンバーハイブリッドの分離を可能にする結合実体と接触させることに
よって、該ハイブリダイゼーション混合物から分離することと、を含み、
それによって、ライブラリ捕獲物（例えば、ライブラリ由来の核酸分子の選択または濃縮
されたサブグループ）を提供し、
複数のベイトは、以下のうちの２つ以上を含む：
ａ）低頻度、例えば、約５％（すなわち、それらのゲノムにおける変化を持つ試料由来
の細胞の５％）以下で出現する変化（例えば、１つ以上の変異）に対する高レベルの感度
を可能にするために最深の対象範囲が要求される、高レベルの標的（例えば、遺伝子、エ
クソン、または塩基等のサブゲノム間隔を含む１つ以上の腫瘍メンバー）を選択する第１
のベイトセット（一実施形態において、第１のベイトセットは、約５００倍以上の配列決
定深度を必要とする変化（例えば、点変異）を含む腫瘍メンバーを選択する（例えば、そ
れに相補的である））、
ｂ）ａ）における高レベルの標的よりも高い頻度、例えば、約１０％（すなわち、それ
らのゲノムにおける変化を持つ試料由来の細胞の１０％）の頻度で出現する変化（例えば
、１つ以上の変異）に対する高レベルの感度を可能にするために高い対象範囲が要求され
る、中間レベルの標的（例えば、遺伝子、エクソン、または塩基等のサブゲノム間隔を含
む１つ以上の腫瘍メンバー）を選択する第２のベイトセット（一実施形態において、第２
のベイトセットは、約２００倍以上の配列決定深度を必要とする変化（例えば、点変異）
を含む腫瘍メンバーを選択する（例えば、それに相補的である））、
ｃ）高レベルの感度を可能にするために、例えば、ヘテロ接合体対立遺伝子を検出する
ために低～中程度の対象範囲が要求される、低レベルの標的（例えば、遺伝子、エクソン
、または塩基等のサブゲノム間隔を含む１つ以上のＰＧｘメンバー）を選択する第３のベ
イトセット（例えば、ヘテロ接合体対立遺伝子の検出は、高い検出信頼性を確保するため
に、１０～１００倍の配列決定深度を必要とする。一実施形態において、第３のベイトセ
ットは、ａ）異なる薬物を代謝する患者の能力を説明し得る薬理ゲノム（ＰＧｘ）単一ヌ
クレオチド多型（ＳＮＰ）、またはｂ）患者を一意に同定する（例えば、フィンガープリ
ントする）ために使用され得るゲノムＳＮＰ、ｃ）ゲノムＤＮＡのコピー数の獲得／喪失
およびヘテロ接合性の消失（ＬＯＨ）を評価するために使用され得るゲノムＳＮＰ／遺伝
子座から選択される１つ以上のサブゲノム間隔（例えば、エクソン）を選択する、
ｄ）例えば、ゲノム転座またはインデル等の構造ブレークポイントを検出するために低
～中程度の対象範囲が要求される、第１のイントロン標的（例えば、イントロン配列を含
むメンバー）を選択する第４のベイトセット（例えば、イントロンブレークポイントの検
出は、高い検出信頼性を確保するために、５～５０倍の配列対スパン深度を必要とする。
該第４のベイトセットを用いて、例えば、転座／インデルの傾向のある癌遺伝子を検出す
ることができる）、または
ｅ）コピー数の変化を検出する能力を改善するためにわずかな対象範囲が要求される、
第２のイントロン標的（例えば、イントロンメンバー）を選択する第５のベイトセット（
（例えば、いくつかの末端エクソンの１コピー欠失の検出は、高い検出信頼性を確保する
ために、０．１～１０倍の対象範囲を必要とする。該第５のベイトセットを用いて、例え
ば、増幅／欠失の傾向のある癌遺伝子を検出することができる）。

前述のベイトセットのうちの２、３、４つ、またはそれ以上の任意の組み合わせ、例え
ば、第１および第２のベイトセット；第１および第３のベイトセット；第１および第４の
ベイトセット；第１および第５のベイトセット；第２および第３のベイトセット；第２お
よび第４のベイトセット；第２および第５のベイトセット；第３および第４のベイトセッ
ト；第３および第５のベイトセット；第４および第５のベイトセット；第１、第２、およ
び第３のベイトセット；第１、第２、および第４のベイトセット；第１、第２、および第
５のベイトセット；第１、第２、第３、第４のベイトセット；第１、第２、第３、第４、
および第５のベイトセットの組み合わせ等を、本明細書で取り上げられる方法および組成
物で使用することができる。

一実施形態において、第１、第２、第３、第４、または第５のベイトセットはそれぞれ
、事前選択された選択（例えば、捕捉）効率を有する。一実施形態において、選択効率値
は、ａ）～ｅ）に従って、５つすべてのベイトのうちの少なくとも２つ、３つ、４つにお
いて同一である。他の実施形態では、選択効率値は、ａ）～ｅ）に従って、５つすべての
ベイトのうちの少なくとも２つ、３つ、４つにおいて異なる。

いくつかの実施形態では、少なくとも２つ、３つ、４つ、または５つすべてのベイトセ
ットは、異なる事前選択された効率値を有する。例えば、選択効率値は、のうちの１つ以
上から選択される：
（ｉ）第１の事前選択された効率が、少なくとも約５００倍以上の配列決定深度である
第１の選択効率値を有する（例えば、第２、第３、第４、もしくは第５の事前選択された
選択効率よりも大きい（例えば、第２の選択効率値よりも約２～３倍大きく、第３の選択
効率値よりも約５～６倍大きく、第４の選択効率値よりも約１０倍大きく、第５の選択効
率値よりも約５０～５０００倍大きい）選択効率値を有する）こと、
（ｉｉ）第２の事前選択された効率が、少なくとも約２００倍以上の配列決定深度であ
る第２の選択効率値を有する（例えば、第３、第４、もしくは第５の事前選択された選択
効率よりも大きい（例えば、第３の選択効率値よりも約２倍大きく、第４の選択効率値よ
りも約４倍大きく、第５の選択効率値よりも約２０～２０００倍大きい）選択効率値を有
する）こと、
（ｉｉｉ）第３の事前選択された効率が、少なくとも約１００倍以上の配列決定深度で
ある第３の選択効率値を有する（例えば、第４もしくは第５の事前選択された選択効率よ
りも大きい（例えば、第４の選択効率値よりも約２倍大きく、第５の選択効率値よりも約
１０～１０００倍大きい）選択効率値を有する）こと、
（ｉｖ）第４の事前選択された効率が、少なくとも約５０倍以上の配列決定深度である
第４の選択効率値を有する（例えば、第５の事前選択された選択効率よりも大きい（例え
ば、第５の選択効率値よりも約５０～５００倍大きい）選択効率値を有する）こと、また
は
（ｖ）第５の事前選択された効率が、少なくとも約１０～０．１倍の配列決定深度であ
る第５の選択効率値を有すること。

ある特定の実施形態において、選択効率値は、異なるベイトセットの差次的表示、ベイ
トサブセットの差次的オーバーラップ、差次的ベイトパラメータ、または異なるベイトセ
ットの混合のうちの１つ以上によって修正される。例えば、選択効率（例えば、それぞれ
のベイトセット／標的カテゴリーの相対配列対象範囲）の変化を、以下のうちの１つ以上
を変化させることによって調節することができる。
（ｉ）異なるベイトセットの差次的表示：所与の標的（例えば、標的メンバー）を捕捉
するためのベイトセット設計をより多い／より少ない数のコピーに含んで、相対標的対象
範囲深度を強化する／減少させることができる。
（ｉｉ）ベイトサブセットの差次的オーバーラップ：所与の標的（例えば、標的メンバ
ー）を捕捉するためのベイトセット設計に、隣接ベイト間により長いか、またはより短い
オーバーラップを含ませて、相対標的対象範囲深度を強化する／減少させることができる
。
（ｉｉｉ）差次的ベイトパラメータ：所与の標的（例えば、標的メンバー）を捕捉する
ためのベイトセット設計に、配列修正／より短い長さを含ませて、捕捉効率を減少させ、
かつ相対標的対象範囲深度を低下させることができる。
（ｉｖ）異なるベイトセットの混合：異なる標的セットを捕捉するように設計されるベ
イトセットを異なるモル比で混合して、相対標的対象範囲深度を強化する／減少させるこ
とができる。
（ｖ）異なる種類のオリゴヌクレオチドベイトセットの使用：ある特定の実施形態にお
いて、ベイトセットは、以下のものを含んでもよい：
（ａ）１つ以上の化学的に（例えば、非酵素的に）合成された（例えば、個別に合成さ
れた）ベイト、
（ｂ）アレイで合成された１つ以上のベイト、
（ｃ）１つ以上の酵素的に調製された、例えば、生体外で転写されたベイト、
（ｄ）（ａ）、（ｂ）、および／もしくは（ｃ）の任意の組み合わせ、
（ｅ）１つ以上のＤＮＡオリゴヌクレオチド（例えば、自然発生もしくは非自然発生の
ＤＮＡオリゴヌクレオチド）、
（ｆ）１つ以上のＲＮＡオリゴヌクレオチド（例えば、自然発生もしくは非自然発生の
ＲＮＡオリゴヌクレオチド）、
（ｇ）（ｅ）および（ｆ）の組み合わせ、または
（ｈ）上記のうちのいずれかの組み合わせ。

異なるオリゴヌクレオチドの組み合わせを、異なる比率で、例えば、１：１、１：２、
１：３、１：４、１：５、１：１０、１：２０、１：５０、１：１００、１：１０００等
から選択される比率で混合してもよい。一実施形態において、化学的に合成されたベイト
とアレイで生成されたベイトの比率は、１：５、１：１０、または１：２０から選択され
る。ＤＮＡまたはＲＮＡオリゴヌクレオチドは、自然発生または非自然発生であり得る。
ある特定の実施形態において、ベイトは、例えば、融解温度を増加させるために、１つ以
上の非自然発生のヌクレオチドを含む。例となる非自然発生のオリゴヌクレオチドは、修
飾されたＤＮＡまたはＲＮＡヌクレオチドを含む。例となる修飾されたヌクレオチド（例
えば、修飾されたＲＮＡまたはＤＮＡヌクレオチド）は、ＬＮＡヌクレオチドのリボース
部分が２’酸素と４’炭素を結合する追加の架橋で修飾されるロックド核酸（ＬＮＡ）；
ペプチド核酸（ＰＮＡ）、例えば、ペプチド結合によって結合された反復Ｎ－（２－アミ
ノエチル）－グリシンユニットから成るＰＮＡ；低ＧＣ領域を捕捉するように修飾された
ＤＮＡまたはＲＮＡオリゴヌクレオチド；二環式核酸（ＢＮＡ）；架橋オリゴヌクレオチ
ド；修飾された５－メチルデオキシシチジン；および２，６－ジアミノプリンを含むが、
これらに限定されない。他の修飾されたＤＮＡおよびＲＮＡヌクレオチドは、当技術分野
で既知である。

ある特定の実施形態において、実質的に均一または同様の対象範囲の標的配列（例えば
、標的メンバー）が得られる。例えば、それぞれのベイトセット／標的カテゴリー内で、
対象範囲の均一性を、ベイトパラメータを修正することによって、例えば、以下のうちの
１つ以上によって最適化することができる：
（ｉ）ベイト表示またはオーバーラップの増加／減少を用いて、同一のカテゴリー内の
他の標的と比較して不十分に／過度に対象範囲とされるされる標的（例えば、標的メンバ
ー）の対象範囲を強化する／減少させることができること、
（ｉｉ）標的配列（例えば、高ＧＣ含量配列）を捕捉するのが困難な低対象範囲の場合
、ベイトセットで標的化される領域を拡大して、例えば、隣接配列（例えば、ＧＣが比較
的豊富ではない隣接配列）を対象範囲とすること、
（ｉｉｉ）ベイト配列の修正を行って、ベイトの二次構造を減少させ、かつその選択効
率を強化することができること、
（ｉｖ）ベイト長の修正を用いて、同一のカテゴリー内の異なるベイトの融解ハイブリ
ダイゼーション動態を均等化することができること（ベイト長を直接的に（異なる長さを
有するベイトを産生することによって）または間接的に（一貫した長さのベイトを産生し
、ベイト末端を任意の配列に置き換えることによって）修飾することができる）、
（ｖ）同一の標的領域（すなわち、順方向鎖および逆方向鎖）に対して異なる配向を有
するベイトの修正が、異なる結合効率を有し得ること（それぞれの標的に最適な対象範囲
を提供するいずれかの配向を有するベイトセットを選択することができる）、
（ｖｉ）それぞれのベイト上に存在する結合実体、例えば、捕捉タグ（例えば、ビオチ
ン）の量の修正が、その結合効率に影響を及ぼし得ること（特定の標的を標的化するベイ
トのタグレベルの増加／減少を用いて、相対標的対象範囲を強化する／減少させることが
できる）、
（ｖｉｉ）異なるベイトに使用されるヌクレオチドの種類の修正を変更して、標的に対
する結合親和性に影響を及ぼし、かつ相対標的対象範囲を強化する／減少させることがで
きること、または
（ｖｉｉｉ）例えば、より安定した塩基対合を有する修飾されたオリゴヌクレオチドベ
イトを使用して、高ＧＣ含量と比較して低いか、もしくは正常なＧＣ含量の領域間の融解
ハイブリダイゼーション動態を均等化することができること。

他の実施形態では、選択効率は、等モル混合物のベイトを用いるときに観察される差次
的配列捕捉効率を参照してベイトの相対存在量または結合実体の密度（例えば、ハプテン
または親和性タグ密度）を調節することによって、ある群内の個別のベイト（例えば、第
１、第２、または第３の複数のベイト）の効率を平準化し、その後、内部的に平準化され
た第２群に対して、差次的の過度の内部的に平準化された第１群を全体のベイト混合物に
導入することにより調節される。

ある実施形態において、ライブラリ捕獲物が、腫瘍メンバー、例えば、腫瘍細胞由来の
サブゲノム間隔を含む核酸分子を選択するベイトセット（本明細書で「腫瘍ベイトセット
」とも称される）を含む複数のベイトセットの使用によって提供される。腫瘍メンバーは
、腫瘍細胞に存在する任意のヌクレオチド配列（例えば、変異、野生型、ＰＧｘ、参照）
または腫瘍もしくは癌細胞に存在する本明細書に記載のイントロンヌクレオチド配列（例
えば、メンバー）であり得る。一実施形態において、腫瘍メンバーは、低頻度、例えば、
それらのゲノムの変化を持つ腫瘍試料由来の細胞の約５％以下で出現する変化（例えば、
１つ以上の変異）を含む。他の実施形態では、腫瘍メンバーは、腫瘍試料由来の細胞の約
１０％の頻度で出現する変化（例えば、１つ以上の変異）を含む。他の実施形態では、腫
瘍メンバーは、ＰＧｘ遺伝子または遺伝子産物由来のサブゲノム間隔、イントロン配列、
例えば、本明細書に記載のイントロン配列、腫瘍細胞に存在する参照配列を含む。

他の実施形態では、方法は、非腫瘍メンバー、例えば、非腫瘍細胞に存在する核酸分子
（サブゲノム間隔等）を検出することをさらに含む。一実施形態において、複数のベイト
セットは、非腫瘍メンバー（本明細書で「非腫瘍ベイトセット」とも称される）を選択す
るベイトセットを含む。例えば、非腫瘍メンバーは、腫瘍を有するか、または有する危険
性のある同一の対象由来の正常な（例えば、非癌性）参照試料（例えば、腫瘍試料を得た
同一の対象由来）、正常な隣接組織（ＮＡＴ）、または血液試料由来であり得る。他の実
施形態では、非腫瘍メンバーは、１名以上の異なる対象（例えば、健常な対象、あるいは
腫瘍を有するか、または有する危険性のある他の対象）由来の腫瘍メンバーとは異なる対
象に由来する（例えば、正常な（例えば、非癌性）参照試料、正常な隣接組織（ＮＡＴ）
、または血液試料に由来する）。一実施形態において、非腫瘍メンバーは、非腫瘍細胞に
存在するＰＧｘ遺伝子または遺伝子産物、イントロン配列、参照配列由来のサブゲノム間
隔を含む。

一実施形態において、腫瘍ベイトセットは、以下のＡ～Ｍのうちの１、２、３、４、５
、６、７、８、９、１０、１１、１２個、もしくはすべてから選択される：
Ａ．癌表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択するベイトセ
ット、
Ｂ．参照ヌクレオチド（例えば、染色体）配列由来の１、２、３、４、５、６、７、８
、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個、または
それ以上のコドンのインフレーム欠失を選択するベイトセット、
Ｃ．遺伝子内欠失を選択するベイトセット、
Ｄ．遺伝子内挿入を選択するベイトセット、
Ｅ．全遺伝子の欠失を選択するベイトセット、
Ｆ．逆位、例えば、染色体内逆位を選択するベイトセット、
Ｇ．染色体間転座を選択するベイトセット、
Ｈ．タンデム重複、例えば、染色体内タンデム重複を選択するベイトセット、
Ｉ．非反復隣接配列に隣接する目的とするヌクレオチド配列を選択するベイトセット、
Ｊ．融合配列に対応する１つ以上のサブゲノム間隔、例えば、融合配列（例えば、融合
転写物または非融合転写物の癌関連選択的スプライシングされた形態）に対応する事前選
択された対のサブゲノム間隔（例えば、事前選択された対のエクソン）を選択するベイト
セット、
Ｋ．望ましくない特徴を含むヌクレオチド配列、例えば、高ＧＣ含量のヌクレオチド配
列、１つ以上の反復要素および／または逆位反復を含むヌクレオチド配列に隣接したサブ
ゲノム間隔を選択するベイトセット、
Ｌ．再編成、例えば、ゲノム再編成（例えば、イントロン配列、例えば、５’もしくは
３’－ＵＴＲを含む再編成）を選択するベイトセット、あるいは
Ｍ．癌関連遺伝子融合物に隣接したエクソンを含むサブゲノム間隔を選択するベイトセ
ット。

ベイトセットおよびそれらを使用する方法のさらなる実施形態は、以下の通りである。
一実施形態において、ベイトセットは、ハイブリダイゼーションによってメンバーを選
択する（例えば、ベイトセット中のベイトまたは複数のベイトは、本明細書に記載の１つ
以上のメンバー、例えば、第１～第５のメンバー等の標的メンバー、腫瘍または非腫瘍メ
ンバーに相補的である）。

一実施形態において、ライブラリ（例えば、核酸ライブラリ）は、１、２、３、４、５
、６、７、８、９、１０、２０、３０名、もしくはそれ以上の対象由来の複数のメンバー
、例えば、標的核酸メンバーを含む。一実施形態において、対象は、癌もしくは腫瘍を有
するか、または有する危険性のあるヒトである。

ある特定の実施形態において、方法は、少なくともＸ名の対象由来の腫瘍試料由来の腫
瘍メンバーを配列決定することを含む（Ｘ＝１、２、３、４、５、６、７、８、９、１０
、２０、３０、４０名、もしくはそれ以上の対象）。一実施形態において、対象は、癌も
しくは腫瘍を有するか、または有する危険性のあるヒトである。方法は、少なくともＸ名
の対象由来の本明細書に記載の少なくとも５、１０、１５、２０、３０、４０、５０、７
５個、もしくはそれ以上の遺伝子または遺伝子産物（例えば、表１、１Ａ、２、３、もし
くは４の遺伝子または遺伝子産物）を配列決定することを含む。

他の実施形態において、または前述の実施形態に加えて、方法は、腫瘍試料と同一の対
象由来の遺伝子または遺伝子産物、例えば、本明細書に記載の遺伝子または遺伝子産物（
例えば、表１、１Ａ、２、３、もしくは４の遺伝子または遺伝子産物）の野生型または非
変異ヌクレオチド配列からの参照サブゲノム間隔を配列決定することを含む。一実施形態
において、参照遺伝子または遺伝子産物は、腫瘍を有するか、または有する危険性のある
同一の対象由来、あるいは異なる対象由来の腫瘍試料と同一の対象または異なる対象に由
来する（例えば、同一もしくは異なる腫瘍試料、正常な（例えば、非癌性）試料、正常な
隣接組織（ＮＡＴ）、または血液試料のうちの１つ以上に由来する）。

一実施形態において、メンバー（例えば、本明細書に記載のメンバーのうちのいずれか
）は、サブゲノム間隔を含む。一実施形態において、サブゲノム間隔は、遺伝子内領域ま
たは遺伝子間領域を含む。一実施形態において、サブゲノム間隔は、遺伝子もしくはその
断片、エクソンもしくはその断片、または事前選択されたヌクレオチド位置（例えば、塩
基）を含む。別の実施形態では、サブゲノム間隔は、エクソンもしくはイントロン、また
はその断片、典型的には、エクソンまたはその断片を含む。一実施形態において、サブゲ
ノム間隔は、コード領域もしくは非コード領域、例えば、プロモーター、エンハンサー、
５’非翻訳領域（５’ＵＴＲ）、または３’非翻訳領域（３’ＵＴＲ）、あるいはその断
片を含む。

別の実施形態では、メンバー（例えば、本明細書に記載のメンバーのうちのいずれか）
のサブゲノム間隔は、癌表現型（例えば、癌の危険性、癌進行、癌治療、または癌治療に
対する抵抗のうちの１つ以上）に、例えば、正もしくは負に関連した変化（例えば、１つ
以上の変異）を含む。さらに別の実施形態では、サブゲノム間隔は、変化、例えば、点変
異または単一変異、欠失変異（例えば、インフレーム欠失、遺伝子内欠失、全遺伝子欠失
）、挿入変異（例えば、遺伝子内挿入）、逆位変異（例えば、染色体内逆位）、連鎖変異
、連鎖された挿入変異、逆位重複変異、タンデム重複（例えば、染色体内タンデム重複）
、転座（例えば、染色体転座、非相反転座）、再編成（例えば、ゲノム再編成（例えば、
１つ以上のイントロンもしくはその断片の再編成；再編成されたイントロンは、５’－お
よび／もしくは３’－ＵＴＲを含み得る）、遺伝子コピー数の変化、遺伝子発現の変化、
ＲＮＡレベルの変化、またはそれらの組み合わせを含む。一実施形態において、第１もし
くは第２のメンバーのサブゲノム間隔は、表１、１Ａ、３、もしくは４に従う遺伝子また
は遺伝子産物の変化を含む。

一実施形態において、腫瘍メンバーは、１つ以上の変化（例えば、腫瘍試料由来の遺伝
子もしくは遺伝子産物由来の１つ以上の変化または変異したサブゲノム間隔）を含む。い
くつかの実施形態では、ベイトセット（例えば、本明細書に記載のベイトセットのうちの
いずれか）は、癌表現型に、例えば、正もしくは負に関連した変化（例えば、１つ以上の
変異）を含む腫瘍メンバー、例えば、核酸分子（例えば、遺伝子、エクソン、またはその
断片等のサブゲノム間隔）を選択する（例えば、それに相補的である）。

ある実施形態において、メンバーは、癌表現型、例えば、癌の危険性、癌進行、癌治療
、または癌治療に対する抵抗のうちの１つ以上に関連する。癌表現型との関連は、癌の遺
伝的危険因子、正の治療応答予測因子、負の治療応答予測因子、正の予後因子、負の予後
因子、または診断因子のうちの１つ以上を含み得る。一実施形態において、腫瘍メンバー
に関連した癌表現型は、試料の組織学的分析によって検出されるものと同一の腫瘍型であ
る。他の実施形態では、腫瘍メンバーに関連した癌表現型は、試料の組織学的分析によっ
て検出されるものとは異なる腫瘍型に由来する。

ある特定の実施形態において、サブゲノム間隔は、ヌクレオチド配列を含み、事前選択
された対立遺伝子バリアントの存在もしくは不在は、正の臨床転帰および／または治療に
対する応答性を予測する。他の実施形態では、サブゲノム間隔は、ヌクレオチド配列を含
み、事前選択された対立遺伝子バリアントの存在もしくは不在は、負の臨床転帰および／
または治療に対する応答性を予測する。ある特定の実施形態において、核酸試料のサブゲ
ノム間隔は、ヌクレオチド配列を含み、事前選択された対立遺伝子バリアントの存在もし
くは不在は、癌を発現させる遺伝（例えば、生殖細胞系危険）因子を示す（例えば、遺伝
子または遺伝子産物は、ＢＲＣＡ１、ＢＲＣＡ２、ＥＧＦＲ、ＨＲＡＳ、ＫＩＴ、ＭＰＬ
、ＡＬＫ、ＰＴＥＮ、ＲＥＴ、ＡＰＣ、ＣＤＫＮ２Ａ、ＭＬＨ１、ＭＳＨ２、ＭＳＨ６、
ＮＦ１、ＮＦ２、ＲＢ１、ＴＰ５３、ＶＨＬ、もしくはＷＴ１のうちの１つ以上から選択
される）。

他の実施形態では、メンバーは、癌表現型に関連しない。ある特定の実施形態において
、メンバー（例えば、本明細書に記載のメンバーのうちのいずれか）のサブゲノム間隔は
、試料由来の腫瘍型の癌表現型に関連しない核酸分子を（同一または異なるサブゲノム間
隔において）含む。

一実施形態において、メンバー（例えば、本明細書に記載のメンバーのうちのいずれか
）のサブゲノム間隔は、遺伝子もしくは遺伝子産物の野生型または非変異ヌクレオチド配
列（例えば、エクソン配列またはその断片）を含む。一実施形態において、第１もしくは
第２のメンバーのサブゲノム間隔は、変異が癌表現型に関連するときに遺伝子もしくは遺
伝子産物の野生型または非変異ヌクレオチド配列（例えば、本明細書に記載の遺伝子もし
くは遺伝子産物、例えば、本明細書の表１、１Ａ、３、もしくは４に記載の遺伝子もしく
は遺伝子産物の野生型または非変異配列）を含む。野生型または非変異遺伝子もしくは遺
伝子産物配列を含有するメンバーは、本明細書で「参照メンバー」とも称される。例えば
、サブゲノム間隔は、ヘテロ接合体変異の野生型対立遺伝子、正常な（例えば、非癌性）
参照試料（例えば、腫瘍試料を得た同一の対象由来）、正常な隣接組織（ＮＡＴ）、ある
いは腫瘍を有するか、または有する危険性のある同一の対象由来の血液試料のうちの１つ
以上に由来する。他の実施形態では、サブゲノム間隔は、１名以上の異なる対象（例えば
、健常な対象、あるいは腫瘍を有するか、または有する危険性のある他の対象）由来の腫
瘍メンバーとは異なる対象に由来する（例えば、異なる対象、正常な（例えば、非癌性）
参照試料、正常な隣接組織（ＮＡＴ）、または血液試料由来の同一または異なる腫瘍試料
のうちの１つ以上に由来する）。

一実施形態において、第１のベイトセットまたは腫瘍ベイトセットは、約５％以下の頻
度で出現する、例えば、高い検出信頼性を確保するために約５００倍以上の配列決定深度
を必要とする点変異を含む（すなわち、試料を調製した細胞の５％がそれらのゲノムでこ
の変異を持つ）サブゲノム間隔を選択する（例えば、それに相補的である）。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、ＡＢＬ１、ＡＫＴ
１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ４、Ｃ
ＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１
、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＡＰ
２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、Ｎ
ＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＴ
ＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦＵ、また
はＴＰ５３遺伝子もしくは遺伝子産物のうちの１、２、３、４、５、６、７、８、９、１
０、１５、２０、２５、３０個、もしくはそれ以上から選択される腫瘍または参照メンバ
ーを選択する（例えば、それに相補的である）。一実施形態において、第１のベイトセッ
トまたは腫瘍ベイトセットは、ＡＢＬ１遺伝子のコドン３１５；ＡＰＣのコドン１１１４
、１３３８、１４５０、もしくは１５５６；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコ
ドン３２、３３、３４、３７、４１、もしくは４５；ＥＧＦＲのコドン７１９、７４６～
７５０、７６８、７９０、８５８、もしくは８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳ
のコドン１２、１３、もしくは６１；ＪＡＫ２のコドン６１７；ＫＩＴのコドン８１６；
ＫＲＡＳのコドン１２、１３、もしくは６１；ＰＩＫ３ＣＡのコドン８８、５４２、５４
５、５４６、１０４７、もしくは１０４９；ＰＴＥＮのコドン１３０、１７３、２３３、
もしくは２６７；ＲＥＴのコドン９１８；ＴＰ５３のコドン１７５、２４５、２４８、２
７３、もしくは３０６のうちの１つ以上から選択される１、２、３、４、５、６、７、８
、９、１０、１５、２０、２５、３０、３５個のコドンを選択する（例えば、それに相補
的である）。

一実施形態において、第１のベイトセットまたは腫瘍ベイトセットは、ある特定の癌型
において頻繁に変異する１つ以上のサブゲノム間隔、例えば、表１もしくは表１Ａに従う
優先順位が１の癌遺伝子または遺伝子産物由来の少なくとも５、１０、２０、３０個、も
しくはそれ以上のサブゲノム間隔を選択する。

他の実施形態では、第２のベイトセットは、１０％の頻度で出現する、例えば、高い検
出信頼性を確保するために約２００倍以上の配列決定深度を必要とする変化（例えば、点
変異）を含む腫瘍メンバーを選択する（例えば、それに相補的である）。

他の実施形態では、第２のベイトセットは、ＡＢＬ２、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲ
ＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ、ＡＵＲＫＢ、ＢＡＰ１、ＢＣＬ２、ＢＣＬ２Ａ
１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＲＣＡ１、ＢＲＣＡ２、ＣＢＬ、ＣＡＲ
Ｄ１１、ＣＢＬ、ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＣＤ
Ｈ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ｂ、ＣＤＫＮ
２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫＬ、ＣＲＬＦ２、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、Ｅ
ＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、ＥＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ６
、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、ＥＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷＳ
Ｒ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ７、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ４、ＦＯＸＰ
４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＵＣＹ１Ａ２、Ｈ
ＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢＫ
Ｅ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＤＭ６Ａ、Ｋ
ＤＲ、ＬＲＰ１Ｂ、ＬＲＰ６、ＬＴＫ、ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、
ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、ＭＴＯＲ
、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、ＮＦ２、ＮＫＸ２－１、ＮＴＲＫ１、ＮＴＲＫ２
、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＰＮ
１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭ
ＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＯＸ１０、ＳＯ
Ｘ２、ＳＲＣ、ＴＢＸ２２、ＴＥＴ２、ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＮＦＡＩＰ３
、ＴＮＫ、ＴＮＫＳ２、ＴＯＰ１、ＴＳＣ１、ＴＳＣ２、ＵＳＰ９Ｘ、ＶＨＬ、またはＷ
Ｔ１遺伝子もしくは遺伝子産物のうちの１、２、３、４、５、１０、１５、２０、２５、
３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９
５、１００、１０５、１１０、１１５、１２０個、もしくはそれ以上から選択される腫瘍
メンバーを選択する（例えば、それに相補的である）。

一実施形態において、第２のベイトセットまたは腫瘍ベイトセットは、表１もしくは表
１Ａに従う少なくとも５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１
００個、もしくはそれ以上の癌遺伝子または遺伝子産物から選択される１つ以上のサブゲ
ノム間隔（例えば、エクソン）を選択する。

ある特定の実施形態において、第１もしくは第２のベイトセットまたは腫瘍ベイトセッ
トは、野生型および／または非変異ヌクレオチド配列、例えば、野生型または非変異ヌク
レオチド配列、例えば、本明細書に記載される、例えば、表１、１Ａ、３、もしくは４に
記載される遺伝子もしくは遺伝子産物のサブゲノム間隔の野生型および／または非変異ヌ
クレオチド配列を有する参照メンバーを選択する。

一実施形態において、第１もしくは第２のベイトセットまたは腫瘍セットは、変異が癌
表現型に、例えば、正もしくは負に関連するときに、遺伝子もしくは遺伝子産物の野生型
または非変異ヌクレオチド配列（例えば、エクソン配列またはその断片）を有するメンバ
ー、例えば、参照メンバーを選択する。

一実施形態において、参照メンバーは、腫瘍を有するか、または有する危険性のある同
一の対象由来の腫瘍メンバーと同一の対象に由来する（例えば、同一もしくは異なる腫瘍
試料、変異メンバーの野生型ヘテロ接合体対立遺伝子、正常な（例えば、非癌性）参照試
料、正常な隣接組織（ＮＡＴ）、または血液試料のうちの１つ以上に由来する）。他の実
施形態では、参照メンバーは、腫瘍を有するか、または有する危険性のある１名以上の異
なる対象由来の腫瘍メンバーとは異なる対象に由来する（例えば、異なる対象由来の同一
もしくは異なる腫瘍試料、正常な（例えば、非癌性）参照試料、正常な隣接組織（ＮＡＴ
）、または血液試料のうちの１つ以上に由来する）。

一実施形態において、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、癌
表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択する。例えば、第１の
ベイトセットまたは腫瘍ベイトセットは、染色体１２のヌクレオチド２５，３９８，２１
５～２５，３９８，３３４に相補的なヌクレオチド配列を含むことができ、ＫＲＡＳ遺伝
子におけるＧ１２Ｓ変異を表す２５，３９８，２８６位でのＣ－Ｔ置換に相補的な塩基を
含有する。

別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、参照
ヌクレオチド（例えば、染色体）配列由来の１、２、３、４、５、６、７、８、９、１０
、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個、もしくはそれ以上
のコドンのインフレーム欠失を特徴とする腫瘍メンバーを選択する。一実施形態において
、第１のベイトセットまたは腫瘍ベイトセットは、それらの参照の５’から３’の配向で
、３、６、９、１２、１５、１８、２１、２４、２７、３０、３３、３６、３９、４２、
４５、４８、５１、５４、５７、６０個、もしくはそれ以上のヌクレオチドのうちのいず
れかのギャップによって参照染色体配列上で分離された参照染色体配列の２つの不連続の
ヌクレオチド配列を含む（またはそれらからなる）。例えば、第１のベイトセットまたは
腫瘍ベイトセット、染色体７のヌクレオチド５５，２４２，４００～５５，２４２，５３
５に相補的であるが、ヌクレオチド５５，２４２，４６４～５５，２４２，４７９を欠く
ヌクレオチド配列を含んでもよく、これは、ＥＧＦＲ遺伝子のコドン７４６～７５０のイ
ンフレーム欠失を表す。

さらに別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは
、遺伝子内欠失を特徴とする腫瘍メンバーを選択する。一実施形態において、第１のベイ
トセットまたは腫瘍ベイトセットは、それらの参照の５’から３’の配向で、１、５、１
０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０個のヌクレオチドに
よって参照染色体配列から分離された参照ヌクレオチド（例えば、染色体）配列の２つの
不連続の断片を含む（またはそれらからなる）。例えば、第１のベイトセットまたは腫瘍
ベイトセットは、染色体１０のヌクレオチド９，６７５，２１４～８９，６７５，２７４
、続いて、染色体１０の塩基８９，６７５，２７７～８９，６７５，３３７に相補的なヌ
クレオチド配列を含んでもよく、これは、ＰＴＥＮ遺伝子のコドン６４からのジヌクレオ
チド配列「ＣＡ」の欠失を表す。

さらに別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは
、遺伝子内挿入を特徴とする腫瘍メンバーを選択する。一実施形態において、第１のベイ
トセットまたは腫瘍ベイトセットは、１、５、１０、１５、２０、２５、３０、３５、４
０、４５、５０、５５、６０個のヌクレオチドの非参照配列によって分離された参照ヌク
レオチド（例えば、染色体）配列の２つの連続した断片を含む（またはそれらからなる）
。例えば、第１のベイトセットまたは腫瘍ベイトセットは、染色体１０のヌクレオチド８
９，６９２，８６４～８９，６９２，９２４、続いて、ヌクレオチド配列「ＧＧＮＡＴＧ
」、続いて、染色体１０のヌクレオチド８９，６９２，９２５～８９，６９２，９８０に
相補的なヌクレオチド配列を含んでもよく、これは、ＰＴＥＮ遺伝子のコドン１３６の後
のアミノ酸残基「Ｇｌｙ－Ｍｅｔ」の挿入を表す。

別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、全遺
伝子の欠失を特徴とする腫瘍メンバーを選択する。一実施形態において、第１のベイトセ
ットまたは腫瘍ベイトセットは、それらの参照の５’から３’の配向で、５００、１００
０、１５００、２０００、２５００、３０００、４０００、５０００個、もしくはそれ以
上のヌクレオチドによって参照染色体配列から分離された参照ヌクレオチド（例えば、染
色体）配列の２つの不連続の断片を含む（またはそれらからなる）。例えば、第１のベイ
トセットまたは腫瘍ベイトセットは、染色体９の塩基２２，００１，１７５～２２，００
１，２３５に隣接した染色体９の塩基２１，９６１，００７～２１，９６１，０６７に相
補的なヌクレオチド配列を含んでもよく、これは、ＣＤＫＮ２Ａ遺伝子の欠失を表す。

別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、逆位
、例えば、染色体内逆位を特徴とする腫瘍メンバーを選択する。一実施形態において、第
１のベイトセットまたは腫瘍ベイトセットは、参照ヌクレオチド（例えば、染色体）配列
の２つの不連続の断片に相補的なヌクレオチド配列を含み、それらのうちの１つは、例え
ば、逆位に起因するメンバーを捕捉するために、その参照配向とは逆方向である。例えば
、第１のベイトセットまたは腫瘍ベイトセットは、染色体２のヌクレオチド２９，４４９
，９９３～２９，４４９，９３３と並列した染色体２のヌクレオチド４２，５２２，８９
３～４２，５２２，９５３を含んでもよく、これは、ＥＭＬ４：ＡＬＫ融合を産生する逆
位を表す。

別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、染色
体間転座を特徴とする腫瘍メンバーを選択する。一実施形態において、第１のベイトセッ
トまたは腫瘍ベイトセットは、例えば、染色体内転座に起因するメンバーを捕捉するため
に、異なる参照染色体配列由来の参照ヌクレオチド（例えば、ゲノム）配列の２つの不連
続の断片に相補的なヌクレオチド配列を含む。例えば、第１のベイトセットまたは腫瘍ベ
イトセットは、染色体９のヌクレオチド１３３，６８１，７９３～１３３，６８１，８５
３と並列した染色体２２のヌクレオチド２３，６３２，５５２～２３，６３２，６１２を
含んでもよく、これは、ＢＣＲ－ＡＢＬ融合をもたらす染色体転座の存在を表す。

さらに別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは
、タンデム重複、例えば、染色体内タンデム重複を特徴とする腫瘍メンバーを選択する。
一実施形態において、第１のベイトセットまたは腫瘍ベイトセットは、例えば、タンデム
重複を有するメンバーを捕捉するために、その参照配向で少なくとも１度、例えば、２、
３、４、もしくは５回繰り返される、少なくとも３、６、９、１２、１５、１８、２１、
２４、２７、もしくは３０ヌクレオチド長の参照ヌクレオチド（例えば、染色体）配列の
１つの断片に相補的なヌクレオチド配列を含む。例えば、ベイトは、同一の配向で２回繰
り返される染色体１３の塩基２８，６０８，２５９～２８，６０８，２８５を含んでもよ
く、これは、ＦＬＴ３遺伝子における内部タンデム重複（ＩＴＤ）変異を表す。

さらに別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは
、非反復隣接配列に隣接する目的とするヌクレオチド配列を特徴とする腫瘍メンバーを選
択する。一実施形態において、第１のベイトセットまたは腫瘍ベイトセットは、少なくと
も２つの不連続のヌクレオチド配列を含む。第１のヌクレオチド配列は、目的とする配列
の５’フランキング領域に相補的であり、第２のヌクレオチド配列は、目的とする配列の
３’フランキング領域に相補的である。例えば、ベイトの第１および第２の対は、染色体
２のヌクレオチド５１，２８８，３８０～５１，２８８，５００（ベイト１）に相補的な
第１のヌクレオチド配列と染色体２のヌクレオチド５１，２８８，５６０～５１，２８８
，６８０（ベイト２）に相補的な第２のヌクレオチド配列を含んでもよく、これは、マイ
クロサテライトマーカー配列Ｄ２Ｓ１２３を含有するメンバーを捕捉することができる。

別の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、融合
配列（例えば、融合転写物または非融合転写物の癌関連選択的スプライシングされた形態
）に対応する事前選択された対のサブゲノム間隔（例えば、事前選択された対のエクソン
）を選択する（例えば、それに相補的である）。

他の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、望ま
しくない特徴を含むヌクレオチド配列、例えば、高ＧＣ含量のヌクレオチド配列、１つ以
上の反復要素および／または逆位反復を含むヌクレオチド配列に隣接したサブゲノム間隔
を選択する。一実施形態において、第１のベイトセットまたは腫瘍ベイトセットは、反復
要素を含むが、反復要素にハイブリダイズしない（例えば、ＢＲＣＡ２遺伝子において反
復要素にハイブリダイズしない）サブゲノム間隔を選択する。

他の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、癌関
連遺伝子融合物に隣接したエクソンを含むサブゲノム間隔を選択し、それによって、遺伝
子融合物に隣接した核酸配列（例えば、ｃＤＮＡ断片）の捕捉を促進する。

他の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは、癌表
現型、例えば、表１、１Ａ、３、もしくは４に記載される癌型のうちの１つ以上から選択
される癌に関連した、表１、１Ａ、３、もしくは４に示される１つ以上の遺伝子または遺
伝子産物に由来するサブゲノム間隔を選択する。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＣＭＬ、ＡＬＬ、もしくはＴ－ＡＬＬのうちの１つ以上から選択される軟組織悪性腫瘍
に関連したＡＢＬ－１遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する
。一実施形態において、ライブラリ、例えば、核酸ライブラリは、ＣＭＬ、ＡＬＬ、もし
くはＴ－ＡＬＬのうちの１つ以上を有するか、または有する危険性のある対象由来の試料
から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、乳癌、結腸直腸癌、卵巣癌、もしくは非小細胞肺癌（ＮＳＣＬＣ）のうちの１つ以上か
ら選択される癌に関連したＡＫＴ１遺伝子もしくは遺伝子産物、またはそのサブゲノム間
隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、乳癌、結
腸直腸癌、卵巣癌、もしくは非小細胞肺癌（ＮＳＣＬＣ）のうちの１つ以上を有するか、
または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＡＬＣＬ、ＮＳＣＬＣ、もしくは神経芽細胞腫のうちの１つ以上から選択される癌に関
連したＡＬＫ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施
形態において、ライブラリ、例えば、核酸ライブラリは、ＡＬＣＬ、ＮＳＣＬＣ、もしく
は神経芽細胞腫のうちの１つ以上を有するか、または有する危険性のある対象由来の試料
から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、膵臓癌、類腱腫、肝芽腫、神経膠腫、もしくは他のＣＮＳ癌または腫瘍の
うちの１つ以上から選択される癌に関連したＡＰＣ遺伝子もしくは遺伝子産物、またはそ
のサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラ
リは、結腸直腸癌、膵臓癌、類腱腫、肝芽腫、神経膠腫、もしくは他のＣＮＳ癌または腫
瘍のうちの１つ以上を有するか、または有する危険性のある対象由来の試料から得られる
。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、黒色腫、結腸直腸癌、肺癌、他の上皮悪性腫瘍、またはＡＭＬもしくはＡＬＬを含む血
液悪性腫瘍のうちの１つ以上から選択される癌に関連したＢＲＡＦ遺伝子もしくは遺伝子
産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば
、核酸ライブラリは、黒色腫、結腸直腸癌、肺癌、他の上皮悪性腫瘍、またはＡＭＬもし
くはＡＬＬを含む血液悪性腫瘍のうちの１つ以上を有するか、または有する危険性のある
対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、黒色腫、膵臓癌、もしくは他の腫瘍型のうちの１つ以上から選択される癌に関連したＣ
ＤＫＮ２Ａ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形
態において、ライブラリ、例えば、核酸ライブラリは、黒色腫、膵臓癌、または他の腫瘍
型のうちの１つ以上を有するか、または有する危険性のある対象由来の試料から得られる
。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＡＭＬもしくはＭＤＳのうちの１つ以上から選択される癌に関連したＣＥＢＰＡ遺伝子
もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライ
ブラリ、例えば、核酸ライブラリは、ＡＭＬもしくはＭＤＳのうちの１つ以上を有するか
、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、卵巣癌、肝芽腫、もしくは多形性唾液腺腫のうちの１つ以上から選択され
る癌に関連したＣＴＮＮＢ１遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選
択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、結腸直腸癌、卵
巣癌、肝芽腫、もしくは多形性唾液腺腫のうちの１つ以上を有するか、または有する危険
性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、神経膠腫、肺癌、もしくはＮＳＣＬＣのうちの１つ以上から選択される癌に関連したＥ
ＧＦＲ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態に
おいて、ライブラリ、例えば、核酸ライブラリは、神経膠腫、肺癌、もしくはＮＳＣＬＣ
のうちの１つ以上を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、例えば、癌表現型
、例えば、乳癌、卵巣癌、ＮＳＣＬＣ、胃癌、もしくは他の固形腫瘍のうちの１つ以上か
ら選択される癌に正もしくは負に関連したＥＲＢＢ２遺伝子もしくは遺伝子産物、または
そのサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブ
ラリは、乳房、卵巣、ＮＳＣＬＣ、胃、もしくは他の固形腫瘍型のうちの１つ以上を有す
るか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、乳癌、卵巣癌、もしくは子宮内膜腫瘍のうちの１つ以上から選択される癌に関連したＥ
ＳＲ１遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態に
おいて、ライブラリ、例えば、核酸ライブラリは、乳癌、卵癌、もしくは子宮内膜腫瘍の
うちの１つ以上を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＭＰＤもしくはＮＨＬのうちの１つ以上から選択される癌に関連したＦＧＦＲ１遺伝子
もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライ
ブラリ、例えば、核酸ライブラリは、ＭＰＤもしくはＮＨＬのうちの１つ以上を有するか
、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、胃癌、ＮＳＣＬＣ、もしくは子宮内膜腫瘍のうちの１つ以上から選択される癌に関連し
たＦＧＦＲ２遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施
形態において、ライブラリ、例えば、核酸ライブラリは、胃癌、ＮＳＣＬＣ、もしくは子
宮内膜腫瘍のうちの１つ以上を有するか、または有する危険性のある対象由来の試料から
得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、膀胱癌、多発性骨髄腫、もしくはＴ細胞リンパ腫のうちの１つ以上から選択される癌に
関連したＦＧＦＲ３遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。
一実施形態において、ライブラリ、例えば、核酸ライブラリは、膀胱癌、多発性骨髄腫、
もしくはＴ細胞リンパ腫のうちの１つ以上を有するか、または有する危険性のある対象由
来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、。癌表現型、例え
ば、黒色腫、結腸直腸癌、甲状腺乳頭癌、卵巣癌、非小細胞肺癌（ＮＳＣＬＣ）、胆管癌
、もしくは毛様細胞性星状細胞腫のうちの１つ以上から選択される癌に関連したＦＬＴ３
遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において
、ライブラリ、例えば、核酸ライブラリは、黒色腫、結腸直腸癌、甲状腺乳頭癌、卵巣癌
、非小細胞肺癌（ＮＳＣＬＣ）、胆管癌、もしくは毛様細胞性星状細胞腫のうちの１つ以
上を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、横紋筋肉腫、神経節芽細胞腫、膀胱癌、肉腫、もしくは他の癌型のうちの１つ以上から
選択される癌に関連したＨＲＡＳ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔
を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、横紋筋肉腫
、神経節芽細胞腫、膀胱癌、肉腫、もしくは他の癌型のうちの１つ以上を有するか、また
は有する危険性のある対象由来の試料から得られる。

他の実施形態では、癌表現型、例えば、ＡＬＬ、ＡＭＬ、ＭＰＤ、もしくはＣＭＬのう
ちの１つ以上から選択される癌に関連した第１のベイトセットまたは腫瘍ベイトセットは
、ＪＡＫ２遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形
態において、ライブラリ、例えば、核酸ライブラリは、ＡＬＬ、ＡＭＬ、ＭＰＤ、もしく
はＣＭＬのうちの１つ以上を有するか、または有する危険性のある対象由来の試料から得
られる。

他の実施形態では、癌表現型、例えば、消化管間質腫瘍（ＧＩＳＴ）、ＡＭＬ、ＴＧＣ
Ｔ、肥満細胞症、粘膜黒色腫、もしくは上皮腫のうちの１つ以上から選択される癌に関連
した第１のベイトセットまたは腫瘍ベイトセットは、ＫＩＴ遺伝子もしくは遺伝子産物、
またはそのサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸
ライブラリは、消化管間質腫瘍（ＧＩＳＴ）、ＡＭＬ、ＴＧＣＴ、肥満細胞症、粘膜黒色
腫、もしくは上皮腫のうちの１つ以上を有するか、または有する危険性のある対象由来の
試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、膵臓癌、結腸癌、結腸直腸癌、肺癌、甲状腺癌、もしくはＡＭＬのうちの１つ以上から
選択される癌に関連したＫＲＡＳ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔
を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、膵臓癌、結
腸癌、結腸直腸癌、肺癌、甲状腺癌、もしくはＡＭＬのうちの１つ以上を有するか、また
は有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、腎臓癌もしくは頭頸部扁平上皮癌のうちの１つ以上から選択される癌に関連したＭＥＴ
遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において
、ライブラリ、例えば、核酸ライブラリは、腎臓癌もしくは頭頸部扁平上皮癌のうちの１
つ以上を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＡＭＬもしくはＡＬＬのうちの１つ以上から選択される癌に関連したＭＬＬ遺伝子もし
くは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライブラ
リ、例えば、核酸ライブラリは、ＡＭＬもしくはＡＬＬのうちの１つ以上を有するか、ま
たは有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットは、癌表現型、例えば、神経繊維腫もしくは神
経膠腫のうちの１つ以上から選択される癌に関連したＮＦ１遺伝子もしくは遺伝子産物、
またはそのサブゲノム間隔を選択する（例えば、それに相補的である）。一実施形態にお
いて、ライブラリ、例えば、核酸ライブラリは、神経繊維腫もしくは神経膠腫のうちの１
つ以上を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、Ｔ－ＡＬＬ癌に関連したＮＯＴＣＨ１遺伝子もしくは遺伝子産物、またはそのサブゲノ
ム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、Ｔ－
ＡＬＬ癌を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＮＨＬ、ＡＰＬ、もしくはＡＭＬのうちの１つ以上から選択される癌に関連したＮＰＭ
１遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態におい
て、ライブラリ、例えば、核酸ライブラリは、ＮＨＬ、ＡＰＬ、もしくはＡＭＬのうちの
１つ以上を有するか、または有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、黒色腫、結腸直腸癌、多発性骨髄腫、ＡＭＬ、もしくは甲状腺癌のうちの１つ以上から
選択される癌に関連したＮＲＡＳ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔
を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、黒色腫、結
腸直腸癌、多発性骨髄腫、ＡＭＬ、もしくは甲状腺癌のうちの１つ以上を有するか、また
は有する危険性のある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ＧＩＳＴもしくは特発性好酸球増加症候群のうちの１つ以上から選択される癌に関連し
たＰＤＧＦＲＡ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実
施形態において、ライブラリ、例えば、核酸ライブラリは、ＧＩＳＴもしくは特発性好酸
球増加症候群のうちの１つ以上を有するか、または有する危険性のある対象由来の試料か
ら得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、胃癌、膠芽腫、もしくは乳癌のうちの１つ以上から選択される癌に関連し
たＰＩＫ３ＣＡ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実
施形態において、ライブラリ、例えば、核酸ライブラリは、結腸直腸癌、胃癌、膠芽腫、
もしくは乳癌のうちの１つ以上を有するか、または有する危険性のある対象由来の試料か
ら得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、神経膠腫、前立腺癌、もしくは子宮内膜癌のうちの１つ以上から選択され
る癌に関連したＰＴＥＮ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択す
る。一実施形態において、ライブラリ、例えば、核酸ライブラリは、結腸直腸癌、神経膠
腫、前立腺癌、もしくは子宮内膜癌のうちの１つ以上を有するか、または有する危険性の
ある対象由来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、網膜芽細胞腫、肉腫、乳癌、もしくは小細胞肺癌のうちの１つ以上から選択される癌に
関連したＲＢ１遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実
施形態において、ライブラリ、例えば、核酸ライブラリは、網膜芽細胞腫、肉腫、乳癌、
もしくは小細胞肺癌のうちの１つ以上を有するか、または有する危険性のある対象由来の
試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、甲状腺髄様癌、甲状腺乳頭癌、もしくは褐色細胞腫のうちの１つ以上から選択される癌
に関連したＲＥＴ遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一
実施形態において、ライブラリ、例えば、核酸ライブラリは、甲状腺髄様癌、甲状腺乳頭
癌、もしくは褐色細胞腫のうちの１つ以上を有するか、または有する危険性のある対象由
来の試料から得られる。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、乳癌、結腸直腸癌、肺癌、肉腫、副腎皮質癌、神経膠腫、もしくは他の腫瘍型のうちの
１つ以上から選択される癌に関連したＴＰ５３遺伝子もしくは遺伝子産物、またはそのサ
ブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは
、乳癌、結腸直腸癌、肺癌、肉腫、副腎皮質癌、神経膠腫、もしくは他の腫瘍型のうちの
１つ以上を有するか、または有する危険性のある対象由来の試料から得られる。

一実施形態において、第１のベイトセットまたは腫瘍ベイトセットは、治療応答の正の
予測因子である遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。治療
応答の正の予測因子の例には、ＮＳＣＬＣ患者の小分子ＥＧＦＲＴＫＩ（例えば、イレ
ッサ／ゲフィチニブ）に対する応答性を予測するＥＧＦＲ遺伝子における活性化変異、Ｎ
ＳＣＬＣ患者のＡＬＫ阻害剤（例えば、ＰＦ－０２３４１０６６）に対する応答性を予測
するＥＭＬ４／ＡＬＫ融合遺伝子の存在、黒色腫患者のＢＲＡＦ阻害（例えば、ＰＬＸ－
４０３２）に対する応答性を予測するＢＲＡＦＶ６００Ｅ変異の存在が挙げられるが、
これらに限定されない。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、治療応答の負の予
測因子である遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。治療応
答の負の予測因子の例には、ＣＲＣ患者の抗ＥＧＦＲモノクローナル抗体（セテュキマブ
、パニツムマブ）への応答欠如を予測するＫＲＡＳ遺伝子における活性化変異、およびＣ
ＭＬ患者のグリーベック／イマチニブに対する抵抗を予測するＢＣＲ／Ａｂｌ融合遺伝子
におけるＭ３５１Ｔ変異の存在が挙げられるが、これらに限定されない。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、予後因子である遺
伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。予後因子の例には、Ａ
ＭＬ患者の再発の負の予後であるＦＬＴ３遺伝子における挿入変異の存在、甲状腺髄様癌
患者の生存の負の予後因子である特定のＲＥＴ遺伝子変異、例えば、Ｍ９１８Ｔの存在が
挙げられるが、これらに限定されない。

他の実施形態では、第１のベイトセットまたは腫瘍ベイトセットは、診断因子である遺
伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。予後因子の例には、Ｃ
ＭＬの診断であるＢＣＲ／Ａｂｌ融合遺伝子の存在、および腎臓のラブドイド腫瘍の診断
であるＳＭＡＲＣＢ１変異の存在が挙げられるが、これらに限定されない。

さらに他の実施形態では、第１もしくは第２のベイトセットまたは腫瘍ベイトセットは
、腫瘍進行および／または耐性に関連した変化を含み、かつ癌進行の後期発症（例えば、
転移関連変異、薬物抵抗関連変異）を有する核酸分子（例えば、サブゲノム間隔）を選択
する。

さらに他の実施形態では、腫瘍メンバーは、腫瘍試料中の腫瘍細胞のゲノムのコード領
域の５、１、０．５、０．１％、０．０１％、０．００１％未満に存在する遺伝子または
遺伝子産物由来のサブゲノム間隔を含む。

一実施形態において、腫瘍メンバーは、腫瘍または癌に関連した（例えば、正もしくは
負の治療応答予測因子であるか、正もしくは負の予後因子であるか、または腫瘍または癌
の差次的診断を可能にする）遺伝子または遺伝子産物、例えば、ＡＢＬ１、ＡＫＴ１、Ａ
ＬＫ、ＡＲ、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、ＣＥＢＰＡ、ＥＧＦＲ、ＥＲＢＢ２、
ＦＬＴ３、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＮＰＭ１、ＰＤＧＦＲＡ、ＰＩＫ３Ｃ
Ａ、ＲＡＲＡ、ＡＫＴ２、ＡＫＴ３、ＭＡＰ２Ｋ４、ＮＯＴＣＨ１、およびＴＰ５３のう
ちの１つ以上から選択される遺伝子または遺伝子産物由来のサブゲノム間隔を含む。

一実施形態において、腫瘍メンバーは、表１、表１Ａ－４に従う野生型または変異遺伝
子もしくは遺伝子産物から選択されるサブゲノム間隔を含む。

一実施形態において、腫瘍メンバーは、ＧＣが豊富な領域に埋め込まれる、表１、表１
Ａ－４に従う野生型または変異遺伝子もしくは遺伝子産物から選択されるサブゲノム間隔
を含む。

別の実施形態では、腫瘍メンバーは、表３に従う少なくとも５、１０、１５、２０、２
５、３０、３５、４０、４５、５０、７５、１１０個、もしくはそれ以上の遺伝子または
遺伝子産物の転座変化を含む。他の実施形態では、腫瘍メンバーは、表３に明記される癌
型由来の固形腫瘍試料における、表３に従う少なくとも５、１０、１５、２０、２５、３
０、３５、４０、４５、５０、７５、１１０個、もしくはそれ以上の遺伝子または遺伝子
産物の転座変化を含む。

一実施形態において、腫瘍メンバーは、表４に従う少なくとも５、１０、１５、２０、
２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００個、もしくはそれ
以上の遺伝子または遺伝子産物の転座変化を含む。別の実施形態では、腫瘍メンバーは、
表４に明記される癌型由来のヘム腫瘍試料における、表４に従う少なくとも５、１０、１
５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００個、も
しくはそれ以上の遺伝子または遺伝子産物の転座変化を含む。

他の実施形態では、複数のベイトは、対照メンバー、例えば、ライブラリにおける標的
核酸メンバーのフィンガープリント、ライブラリ中の標的核酸メンバーの存在量の定量化
、ライブラリ中の患者の標的核酸メンバーの同定、ライブラリが由来する試料の倍数性の
決定、ライブラリが由来する試料におけるヘテロ接合性の消失の決定、ライブラリが由来
する試料における遺伝子重複の決定、ライブラリが由来する試料における遺伝子増幅の決
定、またはライブラリが由来する試料における腫瘍／正常な細胞混合物の決定のうちの１
つ以上のために使用される核酸を選択する（例えば、それに相補的な）ベイトセットをさ
らに含む。そのようなベイトは、本明細書で「対照ベイト」と称される。一実施形態にお
いて、対照ベイトセットは、第３のベイトセットまたはＰＧｘベイトセットである。他の
実施形態では、対照ベイトセットは、本明細書に記載のＰＧｘメンバーを選択する（例え
ば、それに相補的である）。他の実施形態では、対照ベイトは、ＳＮＰ（例えば、本明細
書に記載のＳＮＰ）を含む核酸分子を選択する。

ある特定の実施形態において、第３のベイトセット、腫瘍もしくは非腫瘍ベイトセット
、またはＰＧｘベイトセット（本明細書で集合的に「対照ベイトセット」と称される）は
、低レベルの標的である核酸分子を（腫瘍または参照メンバーと同一または異なるサブゲ
ノム間隔において）選択し、例えば、ヘテロ接合体対立遺伝子の検出は、高い検出信頼性
を確保するために、１０～１００倍の配列決定深度を必要とする。一実施形態において、
第３のベイトセット、または腫瘍もしくはＰＧｘベイトセットは、ライブラリにおける標
的核酸メンバーのフィンガープリント、ライブラリにおける標的核酸メンバーの存在量の
定量化、ライブラリにおける患者の標的核酸メンバーの同定、ライブラリが由来する試料
の倍数性の決定、ライブラリが由来する試料におけるヘテロ接合性の消失の決定、ライブ
ラリが由来する試料における遺伝子重複の決定、ライブラリが由来する試料における遺伝
子増幅の決定、またはライブラリが由来する試料における腫瘍／正常な細胞混合物の決定
のうちの１つ以上のために使用されるサブゲノム間隔を選択する。

一実施形態において、対照ベイトセット（例えば、第３のベイトセット、腫瘍もしくは
非腫瘍ベイトセット、またはＰＧｘベイトセット）は、ａ）異なる薬物を代謝する患者の
能力を説明し得る薬理ゲノムＳＮＰ、ｂ）患者を一意に特定する（フィンガープリントす
る）ために使用され得るゲノムＳＮＰ、ｃ）ゲノムＤＮＡのコピー数獲得／喪失およびヘ
テロ接合性の消失（ＬＯＨ）を評価するために使用され得るゲノムＳＮＰ／遺伝子座から
選択される１つ以上のサブゲノム間隔（例えば、エクソン）を選択する。

一実施形態において、対照ベイトセット（例えば、第３のベイトセット、腫瘍もしくは
非腫瘍ベイトセット、またはＰＧｘベイトセット）は、薬物代謝または毒性に関連したバ
リアントを含む核酸分子を選択する。一実施形態において、対照ベイトセット（例えば、
第３のベイトセット、腫瘍もしくは非腫瘍ベイトセット、またはＰＧｘベイトセット）は
、対象の遺伝子構造（例えば、民族性、人種、家族性形質）に関連した核酸分子を選択す
る（例えば、それに相補的である）。

他の実施形態では、対照ベイトセット（例えば、第３のベイトセット、腫瘍もしくは非
腫瘍ベイトセット、またはＰＧｘベイトセット）は、単一ヌクレオチド多型（ＳＮＰ）を
選択する。一実施形態において、第３のベイトセット、腫瘍もしくは非腫瘍（例えば、Ｐ
Ｇｘ）ベイトセットは、ＡＢＣＢ１、ＡＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、Ｃ１ｏｒｆ
１４４、ＣＹＰ１Ｂ１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、
ＣＹＰ３Ａ５、ＤＰＹＤ、ＥＲＣＣ２、ＥＳＲ２、ＦＣＧＲ３Ａ、ＧＳＴＰ１、ＩＴＰＡ
、ＬＲＰ２、ＭＡＮ１Ｂ１、ＭＴＨＦＲ、ＮＱＯ１、ＮＲＰ２、ＳＬＣ１９Ａ１、ＳＬＣ
２２Ａ２、ＳＬＣＯ１Ｂ３、ＳＯＤ２、ＳＵＬＴ１Ａ１、ＴＰＭＴ、ＴＹＭＳ、ＵＧＴ１
Ａ１、およびＵＭＰＳのうちの１、２、３、４、５、１０、１５、２０、２５、または３
０個から選択されるＳＮＰを選択する（例えば、それに相補的である）。一実施形態にお
いて、対照ベイトセットは、表２に従う遺伝子または遺伝子産物を選択する。

他の実施形態では、対照ベイトセット（例えば、第３のベイトセット、腫瘍もしくは非
腫瘍ベイトセット、またはＰＧｘベイトセット）は、（ｉ）薬物で治療された癌患者のよ
り良好な生存率（例えば、パクリタキセル（例えば、ＡＢＣＢ１遺伝子）で治療された乳
癌患者のより良好な生存率）、（ｉｉ）パクリタキセル代謝（例えば、表２に示される異
なる遺伝子座および変異におけるＣＹＰ２Ｃ８遺伝子、ＣＹＰ３Ａ４遺伝子）、（ｉｉｉ
）薬物に対する毒性（例えば、ＡＢＣＣ４遺伝子で見られる６－ＭＰ毒性（表２）；ＤＰ
ＹＤ遺伝子、ＴＹＭＳ遺伝子、またはＵＭＰＳ遺伝子で見られる５－ＦＵ毒性（表２）；
ＴＭＰＴ遺伝子で見られるプリン毒性（表２）；ＮＲＰ２遺伝子、Ｃｌｏｒｆ１４４遺伝
子、ＣＹＰ１Ｂ１遺伝子で見られるダウノルビシン毒性（表２）、または（ｉｖ）薬物の
副作用（例えば、ＡＢＣＧ２、ＴＹＭＳ、ＵＧＴ１Ａ１、ＥＳＲ１、およびＥＳＲ２遺伝
子（表２））のうちの１つ以上に関連した遺伝子もしくは遺伝子産物に存在するサブゲノ
ム間隔の変異または野生型ＰＧｘ遺伝子もしくは遺伝子産物（例えば、単一ヌクレオチド
多型（ＳＮＰ））由来のサブゲノム間隔を選択する。

他の実施形態では、対照ベイトセット（例えば、第３のベイトセット、腫瘍もしくは非
腫瘍ベイトセット、またはＰＧｘベイトセット）は、ライブラリにおける標的核酸メンバ
ーの存在量の定量化を提供するために事前選択されたサブゲノム間隔（例えば、エクソン
またはＵＴＲ配列）を選択する。一実施形態において、第３のベイトセット、腫瘍もしく
は非腫瘍（例えば、ＰＧｘ）は、ライブラリ、例えば、ｃＤＮＡライブラリにおける転写
物の相対存在量の定量化を提供する。

他の実施形態では、第４のベイトセットは、例えば、ゲノム転座またはインデル等の構
造ブレークポイントを検出するために低～中程度の対象範囲が要求される、第１のイント
ロン標的（例えば、イントロン配列含むメンバー）を選択する。例えば、イントロンブレ
ークポイントの検出は、高い検出信頼性を確保するために、５～５０倍の配列対スパン深
度を必要とする。該第４のベイトセットを用いて、例えば、転座／インデルの傾向のある
癌遺伝子を検出することができる。

さらに他の実施形態では、第５のベイトセットは、コピー数の変化を検出する能力を改
善するために、わずかな対象範囲が要求される、第２のイントロン標的（例えば、イント
ロンメンバー）を選択する。例えば、いくつかの末端エクソンの１コピー欠失の検出は、
高い検出信頼性を確保するために、０．１～１０倍の対象範囲を必要とする。該第５のベ
イトセットを用いて、例えば、増幅／欠失の傾向のある癌遺伝子を検出することができる
。

さらに別の実施形態では、本明細書に記載のベイトセットのうちのいずれも（例えば、
第１、第２、第３のベイト、第４のベイト、第５のベイトセット、対照、腫瘍、非腫瘍ベ
イトセット、またはＰＧｘベイトセット）、二次構造の形成を減少させるように修飾され
る（例えば、ヌクレオチドを二次構造の形成の減少をもたらす異なるヌクレオチドで置換
することによって）。一実施形態において、修飾されたベイトセットを用いて、高ＧＣ含
量の領域を捕捉する。一実施形態において、修飾されたベイト（または複数のベイト）は
、１つ以上のヌクレオチドの異なる天然ヌクレオチド（例えば、Ａ、Ｃ、Ｇ、Ｕ、または
Ｔ）での置換を含む。別の実施形態では、修飾されたベイト（または複数のベイト）は、
１つ以上のヌクレオチドの非天然ヌクレオチド類似体（例えば、イノシンまたはデオキシ
イノシン）での置換を含む。一実施形態において、ベイトセットは、表８の例となる配列
によって示されるように修飾される。

他の実施形態では、第１、第２、または第３のベイトセットのうちの２つ以上は、同一
のサブゲノム間隔（例えば、同一の遺伝子または遺伝子産物）である。一実施形態におい
て、第１および第２のベイトセットは、同一のサブゲノム間隔である。別の実施形態では
、第１および第３のベイトセットは、同一のサブゲノム間隔である。別の実施形態では、
第２および第３のベイトセットは、同一のサブゲノム間隔である。他の実施形態では、第
１、第２、および第３のベイトセットは、異なるサブゲノム間隔（例えば、異なる遺伝子
または遺伝子産物）である。

前述のベイトセットの任意の組み合わせが、本明細書に記載の方法で使用され得る。一
実施形態において、前述の第１、第２、および／もしくは第３のベイトのサブセットまた
はすべて、あるいは複数のベイトは、組み合わせて使用される。

一実施形態において、組み合わせは、本明細書に記載の第１のベイトセットおよび第２
のベイトセットを含む。例えば、第１のベイトセットは、表１もしくは表１Ａにおいて優
先順位が１の本明細書に記載の変化（例えば、１つ以上の変異）を含む腫瘍メンバー、例
えば、サブゲノム間隔を選択し、第２のベイトセットは、表１もしくは表１Ａにおいて癌
遺伝子として本明細書に記載のメンバーを選択する。

他の実施形態では、組み合わせは、本明細書に記載の第１のベイトおよび第３のベイト
セットを含む。例えば、第１のベイトセットは、表１もしくは表１Ａにおける優先順位が
１の本明細書に記載の変化（例えば、１つ以上の変異）を含む腫瘍メンバー、例えば、サ
ブゲノム間隔を選択し、第３のベイトセットは、ＰＧｘメンバー、例えば、試料のフィン
ガープリント、患者の試料の特定、倍数性の決定、ヘテロ接合性の消失の決定、遺伝子重
複の決定、遺伝子増幅の決定、または腫瘍／正常な細胞混合物（例えば、本明細書に記載
のＳＮＰ）のうちの１つ以上の決定のために使用される核酸分子を（同一または異なるサ
ブゲノム間隔において）選択する。

他の実施形態では、組み合わせは、本明細書に記載の第２のベイトセットおよび第３の
ベイトセットを含む。例えば、第２のベイトセットは、表１もしくは表１Ａにおける癌遺
伝子として本明細書に記載のメンバーを選択し、第３のベイトセットは、ＰＧｘメンバー
、例えば、試料のフィンガープリント、患者の試料の同定、倍数性の決定、ヘテロ接合性
の消失の決定、遺伝子重複の決定、遺伝子増幅の決定、または腫瘍／正常な細胞混合物（
例えば、本明細書に記載のＳＮＰ）の決定のうちの１つ以上のために使用れる核酸分子を
（同一または異なるサブゲノム間隔において）選択する。

さらに他の実施形態では、組み合わせは、本明細書に記載の第１のベイトセット、第２
のベイトセット、および第３のベイトセットを含む。

さらに他の実施形態では、組み合わせは、表１もしくは表１Ａに従う遺伝子または遺伝
子産物の変化（例えば、本明細書に記載の１つ以上の変異）を含む変異腫瘍メンバー、例
えば、サブゲノム間隔を選択する第１のベイトセットを含む。一実施形態において、第１
のベイトセットは、ＡＢＬ１遺伝子のコドン３１５；ＡＰＣのコドン１１１４、１３３８
、１４５０、もしくは１５５６；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコドン３２、
３３、３４、３７、４１、もしくは４５；ＥＧＦＲのコドン７１９、７４６～７５０、７
６８、７９０、８５８、もしくは８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳのコドン１
２、１３、もしくは６１；ＪＡＫ２のコドン６１７；ＫＩＴのコドン８１６；ＫＲＡＳの
コドン１２、１３、もしくは６１；ＰＩＫ３ＣＡのコドン８８、５４２、５４５、５４６
、１０４７、もしくは１０４９；ＰＴＥＮのコドン１３０、１７３、２３３、もしくは２
６７；ＲＥＴのコドン９１８；ＴＰ５３のコドン１７５、２４５、２４８、２７３、もし
くは３０６のうちの１つ以上から選択される１、２、３、４、５、６、７、８、９、１０
、１５、２０、２５、３０、３５個のコドンを選択し、野生型配列（例えば、参照メンバ
ー）を選択する第１のベイトセットは、前述の遺伝子または遺伝子産物のうちの１つ以上
に対応する。

さらに他の実施形態では、組み合わせは、腫瘍メンバー、例えば、変化（例えば、本明
細書に記載の１つ以上の変異）を含むサブゲノム間隔を選択する第１のベイトセットを含
む。腫瘍または癌関連のメンバーは、ＡＢＬ１、ＡＫＴ１、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲ
ＡＦ、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、Ｆ
ＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ
、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＰＤＧＦＲＡ
、ＰＩＫ３ＣＡ、ＰＴＥＮ、ＲＢ１、ＲＥＴ、またはＴＰ５３遺伝子もしくは遺伝子産物
のうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０個、もし
くはそれ以上から選択される。一実施形態において、第１のベイトセットは、ＡＢＬ１遺
伝子のコドン３１５；ＡＰＣのコドン１１１４、１３３８、１４５０、もしくは１５５６
；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコドン３２、３３、３４、３７、４１、もし
くは４５；ＥＧＦＲのコドン７１９、７４６～７５０、７６８、７９０、８５８、もしく
は８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳのコドン１２、１３、もしくは６１；ＪＡ
Ｋ２のコドン６１７；ＫＩＴのコドン８１６；ＫＲＡＳのコドン１２、１３、もしくは６
１；ＰＩＫ３ＣＡのコドン８８、５４２、５４５、５４６、１０４７、もしくは１０４９
；ＰＴＥＮのコドン１３０、１７３、２３３、もしくは２６７；ＲＥＴのコドン９１８；
ＴＰ５３のコドン１７５、２４５、２４８、２７３、もしくは３０６のうちの１つ以上か
ら選択される１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３
５個のコドンを選択し、第３のベイトセットは、試料のフィンガープリント、患者の試料
の同定、倍数性の決定、ヘテロ接合性の消失の決定、遺伝子重複の決定、遺伝子増幅の決
定、または腫瘍／正常な細胞混合物（例えば、本明細書に記載のＳＮＰ）の決定のうちの
１つ以上のために使用される核酸分子を（同一または異なるサブゲノム間隔において）選
択する。

さらに他の実施形態では、第１のベイトセットは、腫瘍進行および／または耐性に関連
した変化を含み、かつ癌進行の後期発症（例えば、転移関連変異、薬物抵抗関連変異）を
有する核酸分子（例えば、サブゲノム間隔）を選択し、第２のベイトセットは、腫瘍進行
および／または耐性に関連した変化を含み、かつ癌進行の早期発症（例えば、結腸癌にお
けるＡＰＣまたはＴＰ５３変異）を有する核酸分子（例えば、サブゲノム間隔）を選択す
る（例えば、それに相補的である）。

別の実施形態では、ベイトセットは、以下のうちの少なくとも２つ、もしくはすべてを
含む：
第１のサブゲノム間隔の対象範囲の第１のパターンを有する第１のベイトセット、
第２のサブゲノム間隔の対象範囲の第２のパターンを有する第２のベイトセット、およ
び
（任意で）第３のサブゲノム間隔の対象範囲の第３のパターンを有する第３、第４、ま
たは第５のベイトセット。

一実施形態において、第１のサブゲノム間隔は、第１の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたＳＮＰを有する領域のヌクレオ
チド配列のうちの１つ以上から選択される。

一実施形態において、第２のサブゲノム間隔は、第１の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたＳＮＰを有する領域のヌクレオ
チド配列のうちの１つ以上から選択される。

一実施形態において、第３のサブゲノム間隔は、第１の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたＳＮＰを有する領域のヌクレオ
チド配列のうちの１つ以上から選択される。

一実施形態において、第４のサブゲノム間隔は、第１の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたＳＮＰを有する領域のヌクレオ
チド配列のうちの１つ以上から選択される。

一実施形態において、第５のサブゲノム間隔は、第１の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたＳＮＰを有する領域のヌクレオ
チド配列のうちの１つ以上から選択される。

一実施形態において、第１、第２、および第３のサブゲノム間隔は、異なる遺伝子また
は遺伝子産物に存在する。

一実施形態において、第１、第２、および第３のサブゲノム間隔のうちの少なくとも２
つは、同一遺伝子または遺伝子産物に存在する。

一実施形態において、第１、第２、および第３のサブゲノム間隔は、同一の遺伝子また
は遺伝子産物に存在する。

ある特定の実施形態において、対象範囲の第１、第２、および第３のパターンは同一で
ある。

他の実施形態では、該対象範囲パターンのうちの少なくとも１つ以上は異なる。

他の実施形態では、該対象範囲パターンのうちの少なくとも２つ以上は異なる。

さらに他の実施形態では、対象範囲の第１、第２、および第３のパターンは異なる。

別の実施形態では、複数のベイトは、
第１のサブゲノム間隔に対して第１のレベルのオーバーハング（正または負）を有する
第１の複数のベイト、
第２のサブゲノム間隔に対して第２のレベルのオーバーハング（正または負）を有する
第２の複数のベイト、
第３のサブゲノム間隔に対して第２のレベルのオーバーハング（正または負）を有する
第３の複数のベイト、および
（任意で）第３のサブゲノム間隔に対して第２のレベルのオーバーハング（正または負
）を有する第４または第５の複数のベイトのうちの少なくとも２つ、もしくはすべてを含
み、少なくとも複数の該レベルは異なる。

一実施形態において、第１、第２、第３、第４、または第５のサブゲノム間隔は、第１
の遺伝子、エクソン、イントロン、遺伝子間領域、または本明細書に記載の事前選択され
たＳＮＰを有する領域のヌクレオチド配列のうちの１つ以上から選択される。

別の態様では、本発明は、修飾されたベイトセットを提供する方法を特色とする。方法
は、二次構造を減少させるためにベイト配列および／または長さを修正することを含む。

一実施形態において、二次構造は、ベイト配列の５’末端で形成される。別の実施形態
では、二次構造は、ベイト配列の中間で形成される。さらに別の実施形態では、二次構造
は、ベイト配列の３’末端で形成される。

一実施形態において、方法は、ヌクレオチドを二次構造の形成の減少をもたらす異なる
ヌクレオチドで置換するステップを含む。一実施形態において、修飾されたベイト（また
は複数のベイト）は、高ＧＣ含量の領域を捕捉するために使用される。一実施形態におい
て、修飾されたベイト（または複数のベイト）は、１つ以上のヌクレオチドの異なる天然
ヌクレオチド（例えば、Ａ、Ｃ、Ｇ、Ｕ、またはＴ）での置換を含む。別の実施形態では
、修飾されたベイト（または複数のベイト）は、１つ以上のヌクレオチドの非天然ヌクレ
オチド類似体（例えば、イノシンまたはデオキシイノシン）での置換を含む。一実施形態
において、ベイトセットは、表８の例となる配列によって示されるように修飾される。

別の実施形態では、方法は、本明細書に記載のベイトのうちのいずれか、または複数の
ベイト（例えば、第１、第２、もしくは第３のベイト、もしくは複数のベイト）の比率（
例えば、モル濃度）の調節、最適化ハイブリダイゼーション緩衝液の提供のうちの１つ以
上を含む。

別の態様では、本発明は、ベイトセット（例えば、本明細書に記載のベイトセット）を
特色とする。

一実施形態において、ベイトまたはベイトの収集物は、本明細書に記載の第１、第２、
第３、第４、第５、腫瘍、もしくは対照ベイトセットのうちの１つ、そのサブセット、ま
たはそれらのすべてである／を含む。他の実施形態では、ベイトセットは、本明細書に記
載の変異捕捉、参照、もしくは対照ベイトセットのうちの１つ、そのサブセット、または
それらのすべてである／を含む。

いくつかの実施形態では、ベイトセットは、本明細書に記載の遺伝子もしくは遺伝子産
物、またはそのサブゲノム間隔を選択し、本明細書に記載の癌表現型に、例えば、正もし
くは負に関連する。

ある特定の実施形態において、ベイトセットは、野生型または非変異ヌクレオチド配列
を選択する。

他の実施形態では、本明細書に記載のベイトセットは、ライブラリにおける標的核酸メ
ンバーのフィンガープリント、ライブラリにおける標的核酸メンバーの存在量の定量化、
ライブラリにおける患者の標的核酸メンバーの同定、ライブラリが由来する試料の倍数性
の決定、ライブラリが由来する試料におけるヘテロ接合性の消失の決定、ライブラリが由
来する試料における遺伝子重複の決定、ライブラリが由来する試料における遺伝子増幅の
決定、またはライブラリが由来する試料における腫瘍／正常な細胞混合物の決定のうちの
１つ以上のために使用される核酸を選択する。そのようなベイトは、本明細書で「対照ベ
イト」と称される。一実施形態において、核酸分子に相補的な対照ベイト（または複数の
対照ベイト）は、ＳＮＰ（例えば、本明細書に記載のＳＮＰ）を含む。

さらに別の実施形態では、本明細書に記載のベイトセットのうちのいずれかは、二次構
造の形成を減少させるように修飾される（例えば、ヌクレオチドを二次構造の形成の減少
をもたらす異なるヌクレオチドで置換することによって）。一実施形態において、修飾さ
れたベイト（または複数のベイト）は、高ＧＣ含量の領域を捕捉するために使用される。
一実施形態において、修飾されたベイト（または複数のベイト）は、１つ以上のヌクレオ
チドの異なる天然ヌクレオチド（例えば、Ａ、Ｃ、Ｇ、Ｕ、またはＴ）での置換を含む。
別の実施形態では、修飾されたベイト（または複数のベイト）は、１つ以上のヌクレオチ
ドの非天然ヌクレオチド類似体（例えば、イノシンまたはデオキシイノシン）での置換を
含む。一実施形態において、ベイトセットは、表８の例となる配列によって示されるよう
に修飾される。

本発明のさらなる実施形態または特徴は、以下の通りである。
別の態様では、本発明は、前述のベイトセットを作製する方法を特色とする。方法は、
１つ以上の標的特異的ベイトオリゴヌクレオチド配列（例えば、本明細書に記載の遺伝子
または遺伝子産物のサブゲノム間隔に対応するベイト配列のうちのいずれか）を選択する
こと、標的特異的ベイトオリゴヌクレオチド配列のプールを得ること（例えば、標的特異
的ベイトオリゴヌクレオチド配列のプールを、例えば、マイクロアレイ合成によって合成
すること）、および任意で、オリゴヌクレオチドを増幅してベイトセットを産生すること
を含む。

さらに別の態様では、本発明は、核酸試料における癌表現型（例えば、本明細書に記載
の遺伝子または遺伝子産物の変化のうちの少なくとも１０、２０、３０、５０個、もしく
はそれ以上）に、例えば、正もしくは負に関連した変化の存在もしくは不在を決定するた
めの方法を特色とする。方法は、試料中の核酸を本明細書に記載の方法およびベイトのう
ちのいずれかに従う溶液ベースの選択に供して、核酸捕獲物を得ること、ならびに核酸捕
獲物のすべてまたはサブセットを（例えば、次世代配列決定によって）配列決定すること
を含み、それによって、本明細書に記載の遺伝子または遺伝子産物における変化の存在も
しくは不在を決定する。

いくつかの実施形態では、オリゴヌクレオチドの標的メンバー特異的配列は、約４０～
１０００ヌクレオチド長、約７０～３００ヌクレオチド長、約１００～２００ヌクレオチ
ド長、典型的には、約１２０～１７０ヌクレオチド長である。

他の実施形態では、ベイトセットは、ｃＤＮＡ配列を含むか、またはｃＤＮＡ配列由来
である。一実施形態において、ｃＤＮＡは、ＲＮＡ配列、例えば、腫瘍または癌細胞由来
のＲＮＡ、例えば、腫瘍－ＦＦＰＥ試料から得られるＲＮＡから調製される。他の実施形
態では、ベイトセットは、ゲノムＤＮＡ、ｃＤＮＡ、またはクローン化ＤＮＡから増幅さ
れる増幅産物（例えば、ＰＣＲ産物）を含む。

他の実施形態では、ベイトセットは、ＲＮＡ分子を含む。いくつかの実施形態では、ベ
イトセットは、より安定しており、かつＲＮａｓｅに対して抵抗性を示すＲＮＡ分子を含
むが、これらに限定されない、化学的かつ酵素的に修飾されたか、または生体外で転写さ
れたＲＮＡ分子を含む。

さらに他の実施形態では、ベイトは、参照により本明細書に組み込まれる米国第２０１
０／００２９４９８号およびＧｎｉｒｋｅ，Ａ．ｅｔａｌ．（２００９）ＮａｔＢｉ
ｏｔｅｃｈｎｏｌ．２７（２）：１８２－１８９に記載の方法によって産生される。例え
ば、ビオチン化されたＲＮＡベイトを、マイクロアレイ上に最初に合成された長い合成オ
リゴヌクレオチドのプールを得て、オリゴヌクレオチドを増幅してベイト配列を産生する
ことによって産生することができる。いくつかの実施形態では、ベイトは、ＲＮＡポリメ
ラーゼプロモーター配列を末端ベイト配列の一方に付加し、ＲＮＡポリメラーゼを用いて
ＲＮＡ配列を合成することによって産生される。一実施形態において、合成オリゴデオキ
シヌクレオチドのライブラリを、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．
等の商業的供給業者から入手することができ、既知の核酸増幅法を用いて増幅することが
できる。

したがって、前述のベイトセットを作製する方法が提供される。方法は、１つ以上の標
的特異的ベイトオリゴヌクレオチド配列（例えば、本明細書に記載の１つ以上の変異捕捉
、参照、または対照オリゴヌクレオチド配列）を選択すること、標的特異的ベイトオリゴ
ヌクレオチド配列のプールを得ること（例えば、標的特異的ベイトオリゴヌクレオチド配
列のプールを、例えば、マイクロアレイ合成によって合成すること）、および任意で、オ
リゴヌクレオチドを増幅してベイトセットを産生することを含む。

他の実施形態では、方法は、１つ以上のビオチン化されたプライマーを用いてオリゴヌ
クレオチドを増幅すること（例えば、ＰＣＲによって）をさらに含む。いくつかの実施形
態では、オリゴヌクレオチドは、マイクロアレイに結合したそれぞれのオリゴヌクレオチ
ドの末端にユニバーサル配列を含む。方法は、ユニバーサル配列をオリゴヌクレオチドか
ら除去することをさらに含み得る。そのような方法は、オリゴヌクレオチドの相補鎖の除
去、オリゴヌクレオチドのアニーリング、およびオリゴヌクレオチドの伸長も含み得る。
これらの実施形態のうちのいくつかにおいて、オリゴヌクレオチドを増幅するための方法
（例えば、ＰＣＲによって）は、１つ以上のビオチン化されたプライマーを使用する。い
くつかの実施形態では、方法は、増幅したオリゴヌクレオチドをサイズ選択することをさ
らに含む。

一実施形態において、ＲＮＡベイトセットが作製される。方法は、本明細書に記載の方
法に従って一組のベイト配列を産生すること、ＲＮＡポリメラーゼプロモーター配列を末
端ベイト配列の一方に付加すること、およびＲＮＡポリメラーゼを用いてＲＮＡ配列を合
成することを含む。ＲＮＡポリメラーゼを、Ｔ７ＲＮＡポリメラーゼ、ＳＰ６ＲＮＡ
ポリメラーゼ、またはＴ３ＲＮＡポリメラーゼから選択することができる。他の実施形
態では、ＲＮＡポリメラーゼプロモーター配列は、ベイト配列を増幅する（例えば、ＰＣ
Ｒによって）ことによって、ベイト配列の末端に付加される。ベイト配列がゲノムまたは
ｃＤＮＡ由来の特異的プライマー対を用いてＰＣＲによって増幅される実施形態において
、それぞれの対における２つの特異的プライマーのうちの１つの５’末端へのＲＮＡプロ
モーター配列の付加が、標準方法を用いてＲＮＡベイトに転写され得るＰＣＲ産物をもた
らす。

他の実施形態では、ベイトセットを、鋳型としてヒトＤＮＡまたはプールされたヒトＤ
ＮＡ試料を用いて産生することができる。そのような実施形態において、オリゴヌクレオ
チドは、ポリメラーゼ連鎖反応（ＰＣＲ）によって増幅される。他の実施形態では、増幅
したオリゴヌクレオチドは、ローリングサークル増幅または超分岐ローリングサークル増
幅によって再増幅される。同一の方法を用いて、鋳型としてヒトＤＮＡまたはプールされ
たヒトＤＮＡ試料を用いてベイト配列を産生することもできる。制限消化、パルスフィー
ルドゲル電気泳動、流動選別、ＣｓＣｌ密度勾配遠心分離法、選択的動的再会合、染色体
調製物のミクロ解剖、および当業者に既知の他の分画方法を含むが、これらに限定されな
い他の方法によって得られるゲノムの細画分を用いてベイト配列を産生するために、同一
の方法を使用することもできる。

ある特定の実施形態において、ベイトセット中のベイトの数は、１，０００未満、例え
ば、２、３、４、５、１０、５０、１００、５００個である。他の実施形態では、ベイト
セット中のベイトの数は、１，０００を超えるか、５，０００を超えるか、１０，０００
を超えるか、２０，０００を超えるか、５０，０００を超えるか、１００，０００を超え
るか、または５００，０００を超える。

ある特定の実施形態において、ライブラリ（例えば、核酸ライブラリ）は、メンバーの
収集物を含む。本明細書に記載されるように、ライブラリメンバーは、標的メンバー（例
えば、本明細書でそれぞれ、第１、第２、および／または第３のメンバーとも称される腫
瘍メンバー、参照メンバー、および／または対照メンバー）を含み得る。ライブラリのメ
ンバーは、１人の個人由来であり得る。実施形態において、ライブラリは、１名を超える
対象（例えば、２、３、４、５、６、７、８、９、１０、２０、３０名、もしくはそれ以
上の対象）由来のメンバーを含み得る。、例えば、異なる対象由来の２つ以上のライブラ
リを合わせて、１名を超える対象由来のメンバーを有するライブラリを形成することがで
きる。一実施形態において、対象は、癌もしくは腫瘍を有するか、または有する危険性の
あるヒトである。

本明細書で使用される「メンバー」もしくは「ライブラリメンバー」または他の同様の
用語は、ライブラリのメンバーである核酸分子、例えば、ＤＮＡまたはＲＮＡを指す。典
型的には、メンバーは、ＤＮＡ分子、例えば、ゲノムＤＮＡまたはｃＤＮＡである。メン
バーは、剪断されたゲノムＤＮＡであり得る。他の実施形態では、メンバーは、ｃＤＮＡ
であり得る。他の実施形態では、メンバーは、ＲＮＡであり得る。メンバーは、対象由来
の配列を含み、対象由来ではない配列、例えば、同定を可能にするプライマーまたは配列
、例えば、「バーコード」配列も含み得る。

さらに別の実施形態では、本発明で特色とされる方法は、核酸試料を単離してライブラ
リ（例えば、本明細書に記載の核酸ライブラリ）を提供することをさらに含む。ある特定
の実施形態において、核酸試料は、全ゲノム、サブゲノム断片、またはこれら両方を含む
。ライブラリを全ゲノムまたはサブゲノム断片から単離および調製するためのプロトコル
は、既知の当技術分野で既知である（例えば、ＩｌｌｕｍｉｎａのゲノムＤＮＡ試料調製
キット）。ある特定の実施形態において、ゲノムまたはサブゲノムＤＮＡ断片は、対象の
試料（例えば、腫瘍試料、正常な隣接組織（ＮＡＴ）、血液試料、または任意の正常な対
照））から単離される。一実施形態において、試料（例えば、腫瘍またはＮＡＴ試料）は
、保存される。例えば、試料は、マトリックス、例えば、ＦＦＰＥブロックまたは冷凍試
料に埋め込まれる。ある特定の実施形態において、単離ステップは、個別の染色体の流動
選別、および／または対象の試料（例えば、腫瘍試料、ＮＡＴ、血液試料）のミクロ解剖
を含む。ある特定の実施形態において、核酸ライブラリを生成するために使用される核酸
試料は、５マイクログラム未満、１マイクログラム未満、または５００ｎｇ未満（例えば
、２００ｎｇ以下）である。

方法は、当業者に周知の特異的または非特異的核酸増幅法によって核酸試料を増幅する
ことをさらに含み得る。

いくつかの実施形態では、ある特定の実施形態、核酸試料は、例えば、ランダムプライ
ム鎖置換増幅等の全ゲノム増幅法によって増幅される。

他の実施形態では、核酸試料は、物理的もしくは酵素的方法によって断片化または剪断
され、合成アダプターにライゲートされ、寸法選択され（例えば、分取ゲル電気泳動によ
って）、増幅される（例えば、ＰＣＲによって）。他の実施形態では、断片化され、かつ
アダプターでライゲートされた核酸の基は、ハイブリッド選択の前に明確な寸法選択また
は増幅なしで使用される。

ある特定の実施形態において、ライブラリのメンバーは、遺伝子内領域または遺伝子間
領域を含むサブゲノム間隔を含む。別の実施形態では、サブゲノム間隔は、エクソンもし
くはイントロン、またはその断片、典型的には、エクソン配列またはその断片を含む。一
実施形態において、サブゲノム間隔は、コード領域もしくは非コード領域、例えば、プロ
モーター、エンハンサー、５’非翻訳領域（５’ＵＴＲ）、もしくは３’非翻訳領域（３
’ＵＴＲ）、またはその断片を含む。他の実施形態では、サブゲノム間隔は、ｃＤＮＡま
たはその断片（例えば、腫瘍ＲＮＡから得られるｃＤＮＡ（例えば、腫瘍試料、例えば、
ＦＦＰＥ－腫瘍試料から抽出されるＲＮＡ）を含む。他の実施形態では、サブゲノム間隔
は、例えば、本明細書に記載のＳＮＰを含む。他の実施形態では、標的メンバーは、ゲノ
ム中の実質的にすべてのエクソンを含む。他の実施形態では、標的メンバーは、本明細書
に記載のサブゲノム間隔、例えば、選択された目的とする遺伝子または遺伝子産物（例え
ば、本明細書に記載の癌表現型に関連した遺伝子または遺伝子産物）由来のサブゲノム間
隔、例えば、エクソンを含む。

一実施形態において、サブゲノム間隔は、体細胞変異、生殖細胞変異、またはこれら両
方を含む。一実施形態において、サブゲノム間隔は、変化、例えば、点変異もしくは単一
変異、欠失変異（例えば、インフレーム欠失、遺伝子内欠失、全遺伝子欠失）、挿入変異
（例えば、遺伝子内挿入）、逆位変異（例えば、染色体内逆位）、連鎖変異、連鎖された
挿入変異、逆位重複変異、タンデム重複（例えば、染色体内タンデム重複）、転座（例え
ば、染色体転座、非相反転座）、再編成（例えば、ゲノム再編成）、遺伝子コピー数の変
化、またはそれらの組み合わせを含む。ある特定の実施形態において、サブゲノム間隔は
、試料中の腫瘍細胞のゲノムのコード領域の５、１、０．５、０．１％、０．０１％、０
．００１％未満を構成する。他の実施形態では、サブゲノム間隔は、疾患に関与しない、
例えば、本明細書に記載の癌表現型に関連しない。

本発明で特色とされる方法は、ライブラリ（例えば、核酸ライブラリ）を複数のベイト
と接触させて、核酸の選択されたサブグループ、例えば、ライブラリ捕獲物を提供するス
テップを含む。一実施形態において、接触ステップは、固体支持体、例えば、アレイにお
いて達成される。ハイブリダイゼーションに好適な固体支持体は、例えば、Ａｌｂｅｒｔ
，Ｔ．Ｊ．ｅｔａｌ．（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４（１１）：９０３－５
、Ｈｏｄｇｅｓ，Ｅ．ｅｔａｌ．（２００７）Ｎａｔ．Ｇｅｎｅｔ．３９（１２）：１
５２２－７、Ｏｋｏｕ，Ｄ．Ｔ．ｅｔａｌ．（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４
（１１）：９０７－９に記載されており、それらの内容は、参照により本明細書に組み込
まれる。他の実施形態では、接触ステップは、溶液ハイブリダイゼーションにおいて達成
される。ある特定の実施形態において、方法は、１つ以上のさらなるラウンドのハイブリ
ダイゼーションによってハイブリダイゼーションステップを繰り返すことを含む。いくつ
かの実施形態では、方法は、ライブラリ捕獲物を同一または異なるベイト収集物を用いて
１つ以上のさらなるラウンドのハイブリダイゼーションに供することをさらに含む。

他の実施形態では、本発明で特色とされる方法は、ライブラリ捕獲物の増幅（例えば、
ＰＣＲによる）をさらに含む。他の実施形態では、ライブラリ捕獲物は増幅されない。

さらに他の実施形態では、方法は、ライブラリ捕獲物の分析をさらに含む。一実施形態
において、ライブラリ捕獲物は、配列決定方法、例えば、本明細書に記載の次世代配列決
定方法によって分析される。方法は、溶液ハイブリダイゼーションによってライブラリ捕
獲物を単離すること、および核酸配列決定によってライブラリ捕獲物を供することを含む
。ある特定の実施形態において、ライブラリ捕獲物を再配列決定することができる。次世
代配列決定方法は、当技術分野で既知であり、例えば、Ｍｅｔｚｋｅｒ，Ｍ．（２０１０
）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：３１－４６に記
載されている。

さらに他の実施形態では、方法は、ライブラリ捕獲物を遺伝子型判定に供し、それによ
って、選択された核酸の遺伝子型を特定するステップをさらに含む。
ある特定の実施形態において、方法は、以下のうちの１つ以上をさらに含む：
（ｉ）核酸試料をフィンガープリントすること、
（ｉｉ）核酸試料における遺伝子または遺伝子産物（例えば、本明細書に記載の遺伝
子または遺伝子産物）の存在量を定量化すること（例えば、試料における転写物の相対存
在量を定量化すること）、
（ｉｉｉ）特定の対象（例えば、正常な対照または癌患者）に属するとして核酸試料
を特定すること、
（ｉｖ）核酸試料における遺伝形質（例えば、１名以上の対象の遺伝子構成（例えば
、民族性、人種、家族性形質））を特定定すること、
（ｖ）核酸試料の倍数性を決定し、核酸試料におけるヘテロ接合性の消失を決定する
こと、
（ｖｉ）核酸試料における遺伝子重複事象の存在もしくは不在を決定すること、
（ｖｉｉ）核酸試料における遺伝子増幅事象の存在もしくは不在を決定すること、あ
るいは
（ｖｉｉｉ）核酸試料における腫瘍／正常な細胞混合物のレベルを決定すること。

本明細書に記載の方法のうちのいずれをも、以下の実施形態のうちの１つ以上と組み合
わせることができる。

ある実施形態において、読み取りは、次世代配列決定方法によって提供される。

ある実施形態において、方法は、核酸メンバーライブラリを提供すること、および該ラ
イブラリの複数のメンバー由来の事前選択されたサブゲノム間隔を配列決定することを含
む。実施形態において、方法は、配列決定、例えば、溶液ベースの選択のために、該ライ
ブラリのサブセットを選択するステップを含み得る。

ある特定の実施形態において、方法は、それぞれが異なるベイト設計戦略を有する２つ
以上の異なる標的カテゴリーを捕捉するように設計されるハイブリッド捕捉方法を含む。
ハイブリッド捕捉方法および組成物は、標的配列（例えば、標的メンバー）の定義された
サブセットの外側の対象範囲を最小限に抑えながら、そのサブセットを捕捉し、標的配列
の均一な対象範囲を提供するよう意図される。一実施形態において、標的配列は、ゲノム
ＤＮＡからの全エクソーム、またはその選択されたサブセットを含む。本明細書に開示の
方法および組成物は、複合標的核酸配列（例えば、ライブラリ）の異なる深度およびパタ
ーンの対象範囲を達成するために、異なるベイトセットを提供する。

ある特定の実施形態において、ベイトセットおよび標的の異なるカテゴリーは、以下の
通りである。
Ａ．低頻度で出現する変異に対する高レベルの感度を可能にするために最深の対象範囲
が要求される、高レベルの標的（例えば、遺伝子、エクソン、または塩基等の１つ以上の
腫瘍メンバーおよび／もしくは参照メンバー）を選択する第１のベイトセット。例えば、
約５％以下の頻度で出現する点変異の検出（すなわち、試料が調製された細胞の５％がそ
れらのゲノムでこの変異を持つ）。第１のベイトセットは、典型的には、高い検出信頼性
を確保するために、約５００倍以上の配列決定深度を必要とする。一実施形態において、
第１のベイトセットは、ある特定の癌型、例えば、表１もしくは表１Ａに従う優先順位が
１の癌遺伝子または遺伝子産物において頻繁に変異する１つ以上のサブゲノム間隔（例え
ば、エクソン）を選択する。
Ｂ．高レベルの標的よりも高い頻度、例えば、約１０％の頻度で出現する変異に対する
高レベルの感度を可能にするために対象範囲が要求される、中間レベルの標的標的（例え
ば、遺伝子、エクソン、または塩基等の１つ以上の腫瘍メンバーおよび／もしくは参照メ
ンバー）を選択する第２のベイトセット。例えば、１０％の頻度で出現する変化（例えば
、点変異）の検出は、高い検出信頼性を確保するために、約２００倍以上の配列決定深度
を必要とする。一実施形態において、第２のベイトセットは、表１もしくは表１Ａに従う
癌遺伝子または遺伝子産物から選択される１つ以上のサブゲノム間隔（例えば、エクソン
）を選択する。
Ｃ．高レベルの感度を可能にする、例えば、ヘテロ接合体対立遺伝子を検出するために
低～中程度の対象範囲が要求される、低レベルの標的（例えば、遺伝子、エクソン、また
は塩基等の１つ以上のＰＧｘメンバー）を選択する第３のベイトセット。例えば、ヘテロ
接合体対立遺伝子の検出は、高い検出信頼性を確保するために、１０～１００倍の配列決
定深度を必要とする。一実施形態において、第３のベイトセットは、から選択される１つ
以上のサブゲノム間隔（例えば、エクソン）を選択する。ａ）異なる薬物を代謝する患者
の能力を説明し得る薬理ゲノムＳＮＰ、ｂ）患者を一意に特定する（フィンガープリント
する）ために使用され得るゲノムＳＮＰ、ｃ）ゲノムＤＮＡのコピー数獲得／喪失および
ヘテロ接合性の消失（ＬＯＨ）を評価するために使用され得るゲノムＳＮＰ／遺伝子座。
Ｄ．ゲノム転座またはインデル等の構造ブレークポイントを検出するために低～中程度
の対象範囲が要求される、イントロン標的（例えば、イントロンメンバー）を選択する第
４のベイトセット。例えば、イントロンブレークポイントの検出は、高い検出信頼性を確
保するために、５～５０倍の配列対スパン深度を必要とする。該第４のベイトセットを用
いて、例えば、転座／インデルの傾向のある癌遺伝子を検出することができる。
Ｅ．コピー数の変化を検出する能力を改善するために、わずかな対象範囲が要求される
、イントロン標的（例えば、イントロンメンバー）を選択する第５のベイトセット。例え
ば、いくつかの末端エクソンの１コピー欠失の検出は、高い検出信頼性を確保するために
、０．１～１０倍の対象範囲を必要とする。該第５のベイトセットを用いて、例えば、増
幅／欠失の傾向のある癌遺伝子を検出することができる。

本発明で特色とされる方法および組成物は、それぞれのベイトセット／標的カテゴリー
の対象範囲の相対配列の調整を含む。ベイト設計における相対配列対象範囲の差を実行す
るための方法は、以下のうちの１つ以上を含む。
（ｉ）異なるベイトセットの差次的表示：所与の標的（例えば、標的メンバー）を捕捉
するためのベイトセット設計をより多い／より少ない数のコピーに含んで、相対標的対象
範囲深度を強化する／減少させることができる。
（ｉｉ）ベイトサブセットの差次的オーバーラップ：所与の標的（例えば、標的メンバ
ー）を捕捉するためのベイトセット設計に、隣接ベイト間により長いか、またはより短い
オーバーラップを含ませて、相対標的対象範囲深度を強化する／減少させることができる
。
（ｉｉｉ）差次的ベイトパラメータ：所与の標的（例えば、標的メンバー）を捕捉する
ためのベイトセット設計に、配列修正／より短い長さを含ませて、捕捉効率を減少させ、
かつ相対標的対象範囲深度を低下させることができる。
（ｉｖ）異なるベイトセットの混合：異なる標的セットを捕捉するように設計されるベ
イトセットを異なるモル比で混合して、相対標的対象範囲深度を強化する／減少させるこ
とができる。
（ｖ）異なる種類のオリゴヌクレオチドベイトセットの使用：ある特定の実施形態にお
いて、ベイトセットは、以下のものを含んでもよい：
（ａ）１つ以上の化学的に（例えば、非酵素的に）合成された（例えば、個別に合成さ
れた）ベイト、
（ｂ）アレイで合成された１つ以上のベイト、
（ｃ）１つ以上の酵素的に調製された、例えば、生体外で転写されたベイト、
（ｄ）（ａ）、（ｂ）、および／もしくは（ｃ）の任意の組み合わせ、
（ｅ）１つ以上のＤＮＡオリゴヌクレオチド（例えば、自然発生もしくは非自然発生の
ＤＮＡオリゴヌクレオチド）、
（ｆ）１つ以上のＲＮＡオリゴヌクレオチド（例えば、自然発生もしくは非自然発生の
ＲＮＡオリゴヌクレオチド）、
（ｇ）（ｅ）および（ｆ）の組み合わせ、または
（ｈ）上記のうちのいずれかの組み合わせ。

異なるオリゴヌクレオチド組み合わせを、異なる比率、例えば、１：１、１：２、１：
３、１：４、１：５、１：１０、１：２０、１：５０、１：１００、１：１０００等から
選択される比率で混合してもよい。一実施形態において、化学的に合成されたベイトとア
レイで生成されたベイトの比率は、１：５、１：１０、または１：２０から選択される。
ＤＮＡまたはＲＮＡオリゴヌクレオチドは、自然発生または非自然発生であり得る。ある
特定の実施形態において、ベイトは、例えば、融解温度を増加させるために、１つ以上の
非自然発生のヌクレオチドを含む。例となる非自然発生のオリゴヌクレオチドは、修飾さ
れたＤＮＡまたはＲＮＡヌクレオチドを含む。例となる修飾されたＲＮＡヌクレオチドは
、ロックド核酸（ＬＮＡ）であり、ＬＮＡヌクレオチドのリボース部分は、２’酸素と４
’炭素とを結合する追加の架橋で修飾される（Ｋａｕｒ，Ｈ、Ａｒｏｒａ，Ａ、Ｗｅｎｇ
ｅｌ，Ｊ、Ｍａｉｔｉ，Ｓ、Ａｒｏｒａ，Ａ．、Ｗｅｎｇｅｌ，Ｊ．、Ｍａｉｔｉ，Ｓ．
（２００６）“Ｔｈｅｒｍｏｄｙｎａｍｉｃ，Ｃｏｕｎｔｅｒｉｏｎ，ａｎｄＨｙｄｒ
ａｔｉｏｎＥｆｆｅｃｔｓｆｏｒｔｈｅＩｎｃｏｒｐｏｒａｔｉｏｎｏｆＬ
ｏｃｋｅｄＮｕｃｌｅｉｃＡｃｉｄＮｕｃｌｅｏｔｉｄｅｓｉｎｔｏＤＮＡ
Ｄｕｐｌｅｘｅｓ”．Ｂｉｏｃｈｅｍｉｓｔｒｙ４５（２３）：７３４７－５５）。他
の修飾された例となるＤＮＡおよびＲＮＡヌクレオチドは、ペプチド結合によって結合さ
れた反復Ｎ－（２－アミノエチル）－グリシンユニットから成るペプチド核酸（ＰＮＡ）
（Ｅｇｈｏｌｍ，Ｍ．ｅｔａｌ．（１９９３）Ｎａｔｕｒｅ３６５（６４４６）：５
６６－８）、低ＧＣ領域を捕捉するように修飾されたＤＮＡまたはＲＮＡオリゴヌクレオ
チド、二環式核酸（ＢＮＡ）または架橋オリゴヌクレオチド、修飾された５－メチルデオ
キシシチジン、および２，６－ジアミノプリンを含むが、これらに限定されない。他の修
飾されたＤＮＡおよびＲＮＡヌクレオチドは、当技術分野で既知である。

ある特定の実施形態において、実質的に均一または同様の対象範囲の標的配列（例えば
、標的メンバー）が得られる。例えば、それぞれのベイトセット／標的カテゴリー内で、
対象範囲の均一性を、ベイトパラメータを修正することによって、例えば、以下のうちの
１つ以上によって最適化することができる：
（ｉ）ベイト表示またはオーバーラップの増加／減少を用いて、同一のカテゴリー内の
他の標的と比較して不十分に／過度に対象範囲とされる標的（例えば、標的メンバー）の
対象範囲を強化する／減少させることができること、
（ｉｉ）標的配列（例えば、高ＧＣ含量配列）を捕捉するのが困難な低対象範囲の場合
、ベイトセットで標的化される領域を拡大して、例えば、隣接配列（例えば、ＧＣが比較
的豊富ではない隣接配列）を対象範囲とすること、
（ｉｉｉ）ベイト配列の修正を行って、ベイトの二次構造を減少させ、かつその選択効
率を強化することができること、
（ｉｖ）ベイト長の修正を用いて、同一のカテゴリー内の異なるベイトの融解ハイブリ
ダイゼーション動態を均等化することができること（ベイト長を直接的に（異なる長さを
有するベイトを産生することによって）または間接的に（一貫した長さのベイトを産生し
、ベイト末端を任意の配列に置き換えることによって）修飾することができる）、
（ｖ）同一の標的領域（すなわち、順方向鎖および逆方向鎖）に対して異なる配向を有
するベイトの修正が、異なる結合効率を有し得ること（それぞれの標的に最適な対象範囲
を提供するいずれかの配向を有するベイトセットを選択することができる）、
（ｖｉ）それぞれのベイト上に存在する結合実体、例えば、捕捉タグ（例えば、ビオチ
ン）の量の修正が、その結合効率に影響を及ぼし得ること（特定の標的を標的化するベイ
トのタグレベルの増加／減少を用いて、相対標的対象範囲を強化する／減少させることが
できる）、
（ｖｉｉ）異なるベイトに使用されるヌクレオチドの種類の修正を変更して、標的に対
する結合親和性に影響を及ぼし、かつ相対標的対象範囲を強化する／減少させることがで
きること、または
（ｖｉｉｉ）例えば、より安定した塩基対合を有する修飾されたオリゴヌクレオチドベ
イトを使用して、高ＧＣ含量と比較して低いか、もしくは正常なＧＣ含量の領域間の融解
ハイブリダイゼーション動態を均等化することができること。

一実施形態において、選択効率値は、異なる種類のベイトオリゴヌクレオチドを用いる
ことによって修正され、事前選択された標的領域を包囲する。例えば、第１のベイトセッ
ト（例えば、１０，０００～５０，０００個のＲＮＡまたはＤＮＡベイトを含むアレイベ
ースのベイトセット）を用いて、広大な標的領域（例えば、１～２ＭＢの全標的領域）を
対象範囲とすることができる。第１のベイトセットを、第２のベイトセット（例えば、５
，０００個未満のベイトを含む個別に合成されたＲＮＡまたはＤＮＡベイトセット）でス
パイクして、事前選択された標的領域（例えば、２５０ｋｂ以下の標的領域にまたがる、
例えば、目的とする選択されたサブゲノム間隔）および／またはより高い二次構造、例え
ば、より高いＧＣ含量の領域を対象範囲とすることができる。目的とする選択されたサブ
ゲノム間隔は、本明細書に記載の遺伝子もしくは遺伝子産物、またはその断片のうちの１
つ以上に相当し得る。第２のベイトセットは、所望のベイトオーバーラップに応じて、約
２，０００～５，０００個のベイトを含み得る。さらに他の実施形態では、第２のベイト
セットは、第１のベイトセット内にスパイクされる選択されたオリゴベイト（例えば、４
００、２００、１００、５０、４０、３０、２０、１０個未満のベイト）を含み得る。第
２のベイトセットを、個別のオリゴベイトの任意の比率で混合してもよい。例えば、第２
のベイトセットは、１：１の等モル比で存在する個別のベイトを含み得る。あるいは、第
２のベイトセットは、例えば、ある特定の標的の捕捉を最適化するために、異なる比率（
例えば、１：５、１：１０、１：２０）で存在する個別のベイトを含み得る（例えば、あ
る特定の標的は、他の標的と比較して、第２のベイトの５～１０倍を有し得る）。
配列決定

本発明は、核酸を配列決定する方法も含む。これらの方法において、核酸ライブラリメ
ンバーは、本明細書に記載の方法を用いることによって、例えば、溶液ハイブリダイゼー
ションを用いることによって単離され、それによって、ライブラリ捕獲物を提供する。ラ
イブラリ捕獲物またはそのサブグループを配列決定することができる。したがって、本発
明で特色とされる方法は、ライブラリ捕獲物の分析をさらに含む。一実施形態において、
ライブラリ捕獲物は、配列決定方法、例えば、本明細書に記載の次世代配列決定方法によ
って分析される。方法は、溶液ハイブリダイゼーションによってライブラリ捕獲物を単離
すること、および核酸配列決定によってライブラリ捕獲物を供することを含む。ある特定
の実施形態において、ライブラリ捕獲物を再配列決定することができる。

当技術分野で既知の任意の配列決定方法を用いることができる。選択方法によって単離
された核酸の配列決定は、典型的には、次世代配列決定（ＮＧＳ）を用いて実行される。
次世代配列決定は、高度に並行した様式で、個別の核酸分子または個別の核酸分子のクロ
ーン的に広がったプロキシのいずれかのヌクレオチド配列を決定する任意の配列決定方法
を含む（例えば、１０^５個を超える分子が同時に配列決定される）。一実施形態において
、ライブラリにおける核酸種の相対存在量を、配列決定実験によって生成されるデータに
おけるそれらの同族配列の発生の相対数を計数することにより推定することができる。次
世代配列決定方法は、当技術分野で既知であり、例えば、参照により本明細書に組み込ま
れるＭｅｔｚｋｅｒ，Ｍ．（２０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲ
ｅｖｉｅｗｓ１１：３１－４６に記載されている。

一実施形態において、次世代配列決定は、個別の核酸分子のヌクレオチド配列の決定を
可能にする（例えば、ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓのＨｅｌｉＳｃｏｐｅ遺
伝子配列決定システム、およびＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓのＰａｃＢｉｏ
ＲＳシステム）。他の実施形態では、配列決定方法は、個別の核酸分子のクローン的に
広がったプロキシのヌクレオチド配列を決定し（例えば、Ｓｏｌｅｘａシーケンサ、Ｉｌ
ｌｕｍｉｎａＩｎｃ．，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ；４５４ＬｉｆｅＳｃｉ
ｅｎｃｅｓ（Ｂｒａｎｆｏｒｄ，Ｃｏｎｎ．）；およびＩｏｎＴｏｒｒｅｎｔ）（例え
ば、短い読み取りの大規模並列配列決定（例えば、Ｓｏｌｅｘａシーケンサ、Ｉｌｌｕｍ
ｉｎａＩｎｃ．，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．））、それは、より少ない数であ
るがより長い読み取りを生成する他の配列決定方法よりも１つの配列決定ユニット当たり
より多くの配列塩基を生成する。次世代配列決定のための他の方法または機械には、４５
４ＬｉｆｅＳｃｉｅｎｃｅｓ（Ｂｒａｎｆｏｒｄ，Ｃｏｎｎ．）、Ａｐｐｌｉｅｄ
Ｂｉｏｓｙｓｔｅｍｓ（ＦｏｓｔｅｒＣｉｔｙ，Ｃａｌｉｆ．、ＳＯＬｉＤシーケンサ
）、ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓＣｏｒｐｏｒａｔｉｏｎ（Ｃａｍｂｒｉ
ｄｇｅ，Ｍａｓｓ．）によって提供されるシーケンサ、ならびにエマルジョンおよびマイ
クロ流体配列決定技術であるナノ液滴（例えば、ＧｎｕＢｉｏ液滴）が含まれるが、これ
らに限定されない。

次世代配列決定用のプラットフォームには、Ｒｏｃｈｅ／４５４のゲノムシーケンサ（
ＧＳ）ＦＬＸシステム、Ｉｌｌｕｍｉｎａ／Ｓｏｌｅｘａのゲノムアナライザ（ＧＡ）、
Ｌｉｆｅ／ＡＰＧの支持オリゴヌクレオチドライゲーション検出（ＳＯＬｉＤ）システム
、ＰｏｌｏｎａｔｏｒのＧ．００７システム、ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓ
のＨｅｌｉＳｃｏｐｅ遺伝子配列決定システム、およびＰａｃｉｆｉｃＢｉｏｓｃｉｅ
ｎｃｅｓのＰａｃＢｉｏＲＳシステムが含まれるが、これらに限定されない。

ＮＧＳ技術は、以下のステップ、例えば、鋳型調製、配列決定および画像化、ならびに
データ分析のうちの１つ以上を含み得る。

鋳型調製。鋳型調製法は、核酸（例えば、ゲノムＤＮＡまたはｃＤＮＡ）をランダムに
破壊してより小さくするステップ、および配列決定鋳型（例えば、断片鋳型または噛合対
鋳型）を生成するステップ等を含み得る。空間的に分離された鋳型は、固体表面もしくは
支持体に結合または固定化されてもよく、同時に行われる大量の配列決定反応を可能にす
る。ＮＧＳ反応に使用することができる鋳型の種類には、例えば、単一ＤＮＡ分子由来の
クローン的に増幅した鋳型、および単一ＤＮＡ分子鋳型が含まれる。

クローン的に増幅した鋳型を調製する方法には、例えば、エマルジョンＰＣＲ（ｅｍＰ
ＣＲ）および固相増幅が含まれる。

ＥｍＰＣＲを用いて、ＮＧＳ用の鋳型を調製することができる。典型的には、核酸断片
のライブラリが生成され、ユニバーサルプライミング部位を含有するアダプターが、断片
の末端にライゲートされる。その後、断片は一本鎖に変性され、ビーズによって捕捉され
る。それぞれのビーズは、単一の核酸分子を捕捉する。ｅｍＰＣＲビーズの増幅および濃
縮後、大量の鋳型は、標準の顕微鏡スライド（例えば、Ｐｏｌｏｎａｔｏｒ）上のポリア
クリルアミドゲル中で結合または固定化されるか、アミノコーティングガラス表面（例え
ば、Ｌｉｆｅ／ＡＰＧ、Ｐｏｌｏｎａｔｏｒ）に化学的に架橋結合するか、またはＮＧＳ
反応が行われ得る個別のＰｉｃｏＴｉｔｅｒＰｌａｔｅ（ＰＴＰ）ウェル（例えば、Ｒｏ
ｃｈｅ／４５４）内に沈着することができる。

固相増幅を用いて、ＮＧＳ用の鋳型を産生することもできる。典型的には、順方向およ
び逆方向プライマーは、固体支持体に共有結合される。増幅した断片の表面密度は、支持
体上のプライマーと鋳型の比率によって定義される。固相増幅は、何億もの空間的に分離
された鋳型クラスター（例えば、Ｉｌｌｕｍｉｎａ／Ｓｏｌｅｘａ）を産生することがで
きる。鋳型クラスターの末端を、ＮＧＳ反応用のユニバーサル配列決定プライマーにハイ
ブリダイズさせてもよい。

クローン的に増幅した鋳型を調製する他の方法には、例えば、複数の置換増幅（ＭＤＡ
）（ＬａｓｋｅｎＲ．Ｓ．ＣｕｒｒＯｐｉｎＭｉｃｒｏｂｉｏｌ．２００７；１０
（５）：５１０－６）も含まれる。ＭＤＡは、非ＰＣＲベースのＤＮＡ増幅技術である。
この反応は、ランダムな六量体プライマーの鋳型へのアニーリング、および高忠実度酵素
（典型的には、一定温度でФ２９）によるＤＮＡ合成を含む。ＭＤＡは、大型の産物を低
いエラー頻度で生成することができる。

ＰＣＲ等の鋳型増幅法をＮＧＳプラットフォームと連動させて、ゲノムの特定の領域（
例えば、エクソン）を標的化または濃縮することができる。例となる鋳型濃縮方法は、例
えば、微小液滴ＰＣＲ技術（ＴｅｗｈｅｙＲ．ｅｔａｌ．，ＮａｔｕｒｅＢｉｏｔ
ｅｃｈ．２００９，２７：１０２５－１０３１）、カスタム設計されたオリゴヌクレオチ
ドマイクロアレイ（例えば、Ｒｏｃｈｅ／ＮｉｍｂｌｅＧｅｎオリゴヌクレオチドマイク
ロアレイ）、および溶液ベースのハイブリダイゼーション法（例えば、分子逆位プローブ
（ＭＩＰ）（ＰｏｒｒｅｃａＧ．Ｊ．ｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ，
２００７，４：９３１－９３６、ＫｒｉｓｈｎａｋｕｍａｒＳ．ｅｔａｌ．，Ｐｒｏ
ｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，２００８，１０５：９２９６－９３１０、Ｔ
ｕｒｎｅｒＥ．Ｈ．ｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ，２００９，６：３
１５－３１６）、ならびにビオチン化されたＲＮＡ捕捉配列（ＧｎｉｒｋｅＡ．ｅｔ
ａｌ．，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．２００９；２７（２）：１８２－９）を含む。

単一分子鋳型は、ＮＧＳ反応に使用され得る別の種類の鋳型である。空間的に分離され
た単一分子鋳型は、様々な方法によって固体支持体上に固定化され得る。１つの手法にお
いて、個別のプライマー分子は、固体支持体に共有結合される。アダプターが鋳型に付加
され、その後、鋳型は固定化プライマーにハイブリダイズされる。別の手法では、単一分
子鋳型が、一本鎖の単一分子鋳型をプライムし、かつそれを固定化されたプライマーから
伸長させることによって固体支持体に共有結合される。その後、ユニバーサルプライマー
が、鋳型にハイブリダイズされる。さらに別の手法では、単一ポリメラーゼ分子は、プラ
イムされた鋳型が結合される固体支持体に結合される。

配列決定および画像化。ＮＧＳのための例となる配列決定および画像化方法には、循環
可逆的停止（ＣＲＴ）、ライゲーションによる配列決定（ＳＢＬ）、単一分子付加（熱配
列決定）、およびリアルタイム配列決定が含まれるが、これらに限定されない。

ＣＲＴは、ヌクレオチド組み込みステップ、蛍光画像化ステップ、および切断ステップ
を最小限に含む循環方法において、可逆的ターミネーターを使用する。典型的には、ＤＮ
Ａポリメラーゼは、鋳型塩基の相補的ヌクレオチドに対応する単一の蛍光修飾されたヌク
レオチドをプライマーに組み込む。ＤＮＡ合成は、単一のヌクレオチドの付加後に終了し
、組み込まれていないヌクレオチドは洗い流される。画像化を行い、組み込まれた標識化
ヌクレオチドの同一性を決定する。その後、切断ステップにおいて、終了／阻害群および
蛍光色素が除去される。ＣＲＴ方法を用いた例となるＮＧＳプラットフォームには、全内
部反射蛍光（ＴＩＲＦ）によって検出される４色のＣＲＴ方法に連動してクローン的に増
幅した鋳型方法を用いるＩｌｌｕｍｉｎａ／Ｓｏｌｅｘａゲノムアナライザ（ＧＡ）、お
よびＴＩＲＦによって検出される１色のＣＲＴ方法と連動して単一分子鋳型方法を用いる
ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓ／ＨｅｌｉＳｃｏｐｅが含まれるが、これらに
限定されない。

ＳＢＬは、配列決定のために、ＤＮＡリガーゼおよび１塩基コードプローブまたは２塩
基コードプローブのいずれかを使用する。典型的には、蛍光標識されたプローブは、プラ
イムされた鋳型に隣接したその相補的配列にハイブリダイズする。ＤＮＡリガーゼを用い
て、色素標識されたプローブをプライマーにライゲートする。蛍光画像化を行い、ライゲ
ートしていないプローブが洗い流された後にライゲートしたプローブの同一性を決定する
。蛍光色素を切断可能なプローブを用いて除去し、その後のライゲーションサイクルのた
めに、５’－ＰＯ_４基を再生成することができる。あるいは、古いプライマーが除去され
た後に、新たなプライマーを鋳型にハイブリダイズさせてもよい。例となるＳＢＬプラッ
トフォームには、２塩基コードプローブを用いるＬｉｆｅ／ＡＰＧ／ＳＯＬｉＤ（支持オ
リゴヌクレオチドライゲーション検出）が含まれるが、これに限定されない。

熱配列決定方法は、別の化学発光酵素を用いたＤＮＡポリメラーゼの活性検出に基づく
。典型的には、この方法は、ＤＮＡの一本鎖に沿って相補鎖を１塩基対ずつ合成すること
によるＤＮＡの一本鎖の配列決定、およびどの塩基が各ステップで実際に付加されたかの
検出を可能にする。鋳型ＤＮＡは不動であり、Ａ、Ｃ、Ｇ、およびＴヌクレオチドの溶液
は、連続して添加され、反応物から除去される。ヌクレオチド溶液が鋳型の第１の不対塩
基を補完する場合にのみ、光が産生される。化学発光シグナルを産生する溶液の配列は、
鋳型の配列決定を可能にする。例となる熱配列決定プラットフォームには、ＰＴＰウェル
内に沈着した１００～２００万個のビーズを用いたｅｍＰＣＲによって調製されたＤＮＡ
鋳型を用いるＲｏｃｈｅ／４５４が含まれるが、これに限定されない。

リアルタイム配列決定は、ＤＮＡ合成中に色素標識されたヌクレオチドの連続的な組み
込みを画像化することを含む。例となるリアルタイム配列決定プラットフォームには、リ
ン酸結合されたヌクレオチドが増大するプライマー鎖に組み込まれるときに、個別のゼロ
モード導波路（ＺＭＷ）検出器の表面に結合したＤＮＡポリメラーゼ分子を用いて配列情
報を得るＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓプラットフォーム、蛍光共鳴エネルギ
ー移動（ＦＲＥＴ）によるヌクレオチド組み込み後に、結合した蛍光色素を有する改変さ
れたＤＮＡポリメラーゼを用いて強化されたシグナルを生成するＬｉｆｅ／ＶｉｓｉＧｅ
ｎプラットフォーム、および配列決定反応において色素クエンチャーヌクレオチドを用い
るＬＩ－ＣＯＲＢｉｏｓｃｉｅｎｃｅｓプラットフォームが含まれるが、これらに限定
されない。

ＮＧＳの他の配列決定方法には、ナノ細孔配列決定、ハイブリダイゼーションによる配
列決定、ナノトランジスタアレイに基づく配列決定、ポロニー配列決定、走査トンネル顕
微鏡法（ＳＴＭ）に基づく配列決定、およびナノワイヤ分子センサに基づく配列決定が含
まれるが、これらに限定されない。

ナノ細孔配列決定は、その中で単一核酸ポリマーを分析することができる高度に閉ざさ
れた空間を提供するナノスケール細孔を通る溶液中での核酸分子の電気泳動を含む。ナノ
細孔配列決定の例となる方法は、例えば、ＢｒａｎｔｏｎＤ．ｅｔａｌ．，Ｎａｔ
Ｂｉｏｔｅｃｈｎｏｌ．２００８；２６（１０）：１１４６－５３に記載されている。

ハイブリダイゼーションによる配列決定は、ＤＮＡマイクロアレイを用いる非酵素的方
法である。典型的には、ＤＮＡの単一のプールが蛍光標識され、既知の配列を含有するア
レイにハイブリダイズされる。アレイ上の所与のスポットからのハイブリダイゼーション
シグナルは、ＤＮＡ配列を特定することができる。ＤＮＡの１本鎖のそのＤＮＡ二重らせ
んの相補鎖への結合は、ハイブリッド領域が短いときに均一な単一塩基ミスマッチに敏感
であるか、ミスマッチを検出するタンパク質が存在するときに特殊化される。ハイブリダ
イゼーションによる配列決定の例となる方法は、例えば、ＨａｎｎａＧ．Ｊ．ｅｔａ
ｌ．，Ｊ．Ｃｌｉｎ．Ｍｉｃｒｏｂｉｏｌ．２０００；３８（７）：２７１５－２１、お
よびＥｄｗａｒｄｓＪ．Ｒ．ｅｔａｌ．，Ｍｕｔ．Ｒｅｓ．２００５；５７３（１－
２）：３－１２に記載されている。

ポロニー配列決定は、複数の単一塩基伸長を介するポロニー増幅および合成による配列
決定に基づく（ＦＩＳＳＥＱ）。ポロニー増幅は、ポリアクリルアミド膜上でＤＮＡをイ
ンサイチュ増幅する方法である。例となるポロニー配列決定方法は、例えば、米国特許出
願公開第２００７／００８７３６２号に記載されている。

カーボンナノチューブ電界効果トランジスタ（ＣＮＴＦＥＴ）等のナノトランジスタア
レイベースのデバイスもＮＧＳに用いることができる。例えば、ＤＮＡ分子が駆動微細加
工電極によって伸張され、ナノチューブ上を駆動する。ＤＮＡ分子は、カーボンナノチュ
ーブ表面と連続的に接触し、それぞれの塩基からの電流フローの差異は、ＤＮＡ分子とナ
ノチューブとの間の電荷移動によって産生される。ＤＮＡは、これらの差異を記録するこ
とによって配列決定される。例となるナノトランジスタアレイに基づく配列決定方法は、
例えば、米国特許出願公開第２００６／０２４６４９７号に記載されている。

走査トンネル顕微鏡法（ＳＴＭ）もＮＧＳに用いることができる。ＳＴＭは、検体のラ
スター走査を行ってその表面の画像を形成する圧電制御プローブを用いる。ＳＴＭを用い
て、単一ＤＮＡ分子の物理的特性を画像化する、例えば、走査トンネル顕微鏡とアクチュ
エータ駆動型の可塑性のギャップを統合することによって、コヒーレント電子トンネル画
像化および分光法を生成することができる。ＳＴＭを用いた例となる配列決定方法は、例
えば、米国特許出願公開第２００７／０１９４２２５号に記載されている。

ナノワイヤ分子センサから成る分子分析デバイスもＮＧＳに用いることができる。その
ようなデバイスは、ナノワイヤ上に配置される窒素性物質とＤＮＡ等の核酸分子との相互
作用を検出することができる。分子ガイドが、分子センサ付近の分子を誘導するように構
成され、相互作用およびその後の検出を可能にする。方法ナノワイヤ分子センサを用いた
例となる配列決定は、例えば、米国特許出願公開第２００６／０２７５７７９号に記載さ
れている。

両末端配列決定方法をＮＧＳに用いることができる。両末端配列決定は、ブロックされ
たプライマーおよびブロックされていないプライマーを用いて、ＤＮＡのセンス鎖および
アンチセンス鎖の両方を配列決定する。典型的には、これらの方法は、ブロックされてい
ないプライマーを核酸の第１の鎖にアニーリングするステップ、第２のブロックされたプ
ライマーを核酸の第２の鎖にアニーリングするステップ、ポリメラーゼを用いて第１の鎖
に沿って核酸を伸長するステップ、第１の配列決定プライマーを終了するステップ、第２
のプライマーを脱ブロッキングするステップ、および第２の鎖に沿って核酸を伸長するス
テップを含む。例となる両末端配列決定方法は、例えば、米国特許第７，２４４，５６７
号に記載されている。

データ分析。ＮＧＳの読み取りが生成された後、それらを既知の参照配列に対してアラ
イメントするか、またはデノボアセンブリすることができる。

例えば、試料（例えば、腫瘍試料）における単一ヌクレオチド多型および構造バリアン
ト等の遺伝的バリエーションの特定を、ＮＧＳ読み取りを参照配列（例えば、野生型配列
）に対してアライメントすることによって達成することができる。ＮＧＳのための配列ア
ライメント方法は、例えば、ＴｒａｐｎｅｌｌＣ．ａｎｄＳａｌｚｂｅｒｇＳ．Ｌ
．ＮａｔｕｒｅＢｉｏｔｅｃｈ．，２００９，２７：４５５－４５７に記載されている
。

デノボアセンブリの例は、例えば、ＷａｒｒｅｎＲ．ｅｔａｌ．、Ｂｉｏｉｎｆｏ
ｒｍａｔｉｃｓ，２００７，２３：５００－５０１、ＢｕｔｌｅｒＪ．ｅｔａｌ．，
ＧｅｎｏｍｅＲｅｓ．，２００８，１８：８１０－８２０、およびＺｅｒｂｉｎｏＤ
．Ｒ．ａｎｄＢｉｒｎｅｙＥ．，ＧｅｎｏｍｅＲｅｓ．，２００８，１８：８２１
－８２９に記載されている。

配列アライメントまたはアセンブリを、例えば、Ｒｏｃｈｅ／４５４およびＩｌｌｕｍ
ｉｎａ／Ｓｏｌｅｘａ読み取りデータを混合した１つ以上のＮＧＳプラットフォームから
の読み取りデータを用いて行うことができる。
アライメント
概要

アライメントは、読み取りを位置、例えば、ゲノム位置と適合させるプロセスである。
誤アライメント（例えば、ゲノム内の誤った位置上の短い読み取りからの塩基対の配置）
、例えば、実際の癌変異前後の読み取りの配列コンテキスト（例えば、反復配列の存在）
による誤アライメントは、代替対立遺伝子の読み取りが代替対立遺伝子読み取りの主な集
積から変化し得るため、変異検出の感度の減少につながり得る。実際の変異が存在しない
場合に問題のある配列コンテキストが生じるとき、誤アライメントは、参照ゲノム塩基の
実際の読み取りを間違った位置に配置することによって、「変異」対立遺伝子の人為的な
読み取りを導入し得る。複数の多重遺伝子分析の変異呼び出しアルゴリズムがさらに低い
存在量変異に敏感であるべきであるという理由から、これらの誤アライメントは、誤検出
発見率を増加させ得る／特異性を減少させ得る。

本明細書で論じられるように、実際の変異に対する感度の減少は、分析される遺伝子に
おける予想される変異部位周囲のアライメントの品質を評価する（手作業で、または自動
化された様式で）ことによって対処することができる。評価される部位を、癌変異のデー
タベース（例えば、ＣＯＳＭＩＣ）から得ることができる。問題があると見なされる領域
を、例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアライメント等のより緩徐であるがより正確
なアライメントアルゴリズムを用いたアライメント最適化（または再アライメント）によ
って関連性のある配列コンテキストにおいてより良好な性能をもたらすために選択される
アルゴリズムを用いて修復することができる。一般的なアライメントアルゴリズムがその
問題を修正できない場合において、カスタマイズされたアライメント手法を、例えば、置
換を含有する可能性の高い遺伝子の最大差ミスマッチペナルティパラメータの調節、ある
特定の腫瘍型でよく見られる特異的変異型に基づく特定のミスマッチペナルティパラメー
タの調節（例えば、黒色腫におけるＣ→Ｔ）、またはある特定の試料型でよく見られる特
異的変異型に基づく特定のミスマッチペナルティパラメータの調節（例えば、ＦＦＰＥで
よく見られる置換）によって作成することができる。誤アライメントによる評価される遺
伝子領域の特異性低下（誤検出率増加）を、配列決定される試料におけるすべての変異呼
び出しの手動または自動化された試験によって評価することができる。誤アライメントに
起因した誤った変異呼び出しの傾向があると考えられるそれらの領域を、上述と同一のア
ライメント修正に供してもよい。いかなるアルゴリズム修正も可能ではないと見なされる
場合、問題の領域からの「変異」を、試験パネルから分類または排除してもよい。
挿入／欠失（インデル）

概して、インデル変異の正確な検出は、本明細書で無効にされた配列決定プラットフォ
ーム上での誤ったインデル率が比較的低いため、アライメントの演習である（したがって
、正しくアライメントされたインデルのわずかな観察でさえも変異の有力な証拠であり得
る）。しかしながら、インデルの存在下における正確なアライメントは困難であり得る（
特にインデルの長さが増加するとき）。アライメントに関連した一般的な問題、例えば、
置換の一般的な問題に加えて、インデル自体がアライメントに関連する問題を引き起こし
得る（例えば、ジヌクレオチド繰り返しの２ｂｐの欠失を容易かつ断定的に配置すること
はできない）。感度および特異性の両方が、より短い（１５ｂｐ未満）外見上のインデル
を含有する読み取りの誤った配置によって低下し得る。より大きいインデル（我々の現在
のプロセスにおいて、大きさが個別の読み取りの長さ（３６ｂｐ）に近づいている）は、
全く読み取りをアライメントせず、標準の組のアライメントされた読み取りにおけるイン
デルの検出を不可能にし得る。

癌変異のデータベースを用いて、これらの問題に対処し、性能を改善することができる
。誤検出インデルの発見を減少させる（特異性を改善する）ために、一般に予想されるイ
ンデル周辺の領域を、配列コンテキストに起因する問題のあるアライメントについて試験
し、上記の置換と同様に対処することができる。インデル検出の感度を改善するために、
癌において予想されるインデルに関する情報を用いたいくつかの異なる手法を使用するこ
とができる。例えば、予想されるインデルを含有する短い読み取りを模擬し、アライメン
トを試みることができる。アライメントを研究することができ、問題のあるインデル領域
は、例えば、ギャップの開き／伸長ペナルティを減少させることによって、または部分的
な読み取り（例えば、読み取りの前半もしくは後半）をアライメントすることによって、
アライメントパラメータを調節することができる。

あるいは、正常な参照ゲノムだけでなく、既知のまたは見込みのある癌インデル変異の
それぞれを含有するゲノムの代替バージョンも用いて最初のアライメントを試みることが
できる。この手法において、最初にアライメントし損なったか、または誤ってアライメン
トされたインデルの読み取りは、ゲノムの代替（変異）バージョンでうまく配置される。

この方法で、予想される癌遺伝子／部位のインデルアライメント（したがって、呼び出
し）を最適化することができる。例えば、乳癌試料を評価するとき、腫瘍抑制遺伝子ＰＴ
ＥＮにおけるアライメントを、表５に例示されるように、インデル変異の存在の可能性の
ために最適化することができる。

調整
調整：配列アライメントアルゴリズム

本明細書で使用されるとき、配列アライメントアルゴリズムは、読み取り配列（例えば
、次世代配列決定に由来する、例えば、短い読み取り配列）が由来する可能性の高いゲノ
ム中の位置を読み取り配列と参照配列との間の類似性を評価することによって特定するた
めに使用される計算法または手法を具現化する。様々なアルゴリズムを、配列アライメン
ト問題に適用してもよい。いくつかのアルゴリズムは、比較的緩徐であるが、比較的高い
特異性を可能にする。これらには、例えば、ダイナミックプログラミングに基づくアルゴ
リズムが含まれる。ダイナミックプログラミングは、より単純なステップに分けることに
よって複雑な問題を解決するための方法である。他の手法は、比較的より効率的であるが
、典型的には、それほど完全ではない。これらには、例えば、大規模のデータベース検索
用に設計される発見的アルゴリズムおよび確率論的方法が含まれる。

典型的には、アライメントプロセスには、２つのステップ、すなわち候補検索および配
列アライメントが存在し得る。候補検索は、配列アライメント用の検索空間を全ゲノムか
らより短いリストの可能性のあるアライメント位置まで減少させる。その用語が示唆する
ように、配列アライメントは、配列を候補検索ステップで提供される配列とアライメント
することを含む。これを、大域アライメント（例えば、Ｎｅｅｄｌｅｍａｎ－Ｗｕｎｓｃ
ｈアライメント）または局所アライメント（例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアラ
イメント）を用いて行うことができる。

高速アライメントアルゴリズムのほとんどを、インデックス作成方法、すなわち、ハッ
シュ表（例えば、ＢＬＡＳＴ、ＥＬＡＮＤ、ＳＯＡＰ）、サフィックス木（例えば、Ｂｏ
ｗｔｉｅ、ＢＷＡ）、およびマージソート（例えば、Ｓｌｉｄｅｒ）に基づくアルゴリズ
ムに基づいて、３種類のうちの１つとして特徴づけることができる。

短い読み取り配列は、典型的には、アライメントに使用される。短い読み取り配列用の
配列アライメントアルゴリズム／プログラムの例には、ＢＦＡＳＴ（ＨｏｍｅｒＮ．ｅ
ｔａｌ．、ＰＬｏＳＯｎｅ．２００９；４（１１）：ｅ７７６７）、ＢＬＡＳＴＮ（
ｗｗｗ．ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ上）、ＢＬＡＴ（ＫｅｎｔＷ
．Ｊ．ＧｅｎｏｍｅＲｅｓ．２００２；１２（４）：６５６－６４）、Ｂｏｗｔｉｅ（
ＬａｎｇｍｅａｄＢ．ｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌ．２００９；１０（３）
：Ｒ２５）、ＢＷＡ（ＬｉＨ．ａｎｄＤｕｒｂｉｎＲ．Ｂｉｏｉｎｆｏｒｍａｔｉ
ｃｓ，２００９，２５：１７５４－６０）、ＢＷＡ－ＳＷ（ＬｉＨ．ａｎｄＤｕｒｂ
ｉｎＲ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１０；２６（５）：５８９－９５）、Ｃ
ｌｏｕｄＢｕｒｓｔ（ＳｃｈａｔｚＭ．Ｃ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００９
；２５（１１）：１３６３－９）、ＣｏｒｏｎａＬｉｔｅ（ＡｐｐｌｉｅｄＢｉｏｓ
ｙｓｔｅｍｓ，Ｃａｒｌｓｂａｄ，Ｃａｌｉｆｏｒｎｉａ，ＵＳＡ）、ＣＡＳＨＸ（Ｆａ
ｈｌｇｒｅｎＮ．ｅｔａｌ．，ＲＮＡ，２００９；１５，９９２－１００２）、ＣＵ
ＤＡ－ＥＣ（ＳｈｉＨ．ｅｔａｌ．，ＪＣｏｍｐｕｔＢｉｏｌ．２０１０；１７
（４）：６０３－１５）、ＥＬＡＮＤ（ｗｗｗ．ｂｉｏｉｔ．ｄｂｉ．ｕｄｅｌ．ｅｄｕ
／ｈｏｗｔｏ／ｅｌａｎｄ上）、ＧＮＵＭＡＰ（ＣｌｅｍｅｎｔＮ．Ｌ．ｅｔａｌ．
，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０；２６（１）：３８－４５）、ＧＭＡＰ（Ｗ
ｕＴ．Ｄ．ａｎｄＷａｔａｎａｂｅＣ．Ｋ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０
０５；２１（９）：１８５９－７５）、ＧＳＮＡＰ（ＷｕＴ．Ｄ．ａｎｄＮａｃｕ
Ｓ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０；２６（７）：８７３－８１）、Ｇｅｎ
ｅｉｏｕｓＡｓｓｅｍｂｌｅｒ（ＢｉｏｍａｔｔｅｒｓＬｔｄ．，Ａｕｃｋｌａｎｄ
，ＮｅｗＺｅａｌａｎｄ）、ＬＡＳＴ、ＭＡＱ（ＬｉＨ．ｅｔａｌ．，Ｇｅｎｏｍ
ｅＲｅｓ．２００８；１８（１１）：１８５１－８）、Ｍｅｇａ－ＢＬＡＳＴ（ｗｗｗ
．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｂｌａｓｔ／ｍｅｇａｂｌａｓｔ．ｓｈｔｍｌ上
）、ＭＯＭ（ＥａｖｅｓＨ．Ｌ．ａｎｄＧａｏＹ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ
．２００９；２５（７）：９６９－７０）、ＭＯＳＡＩＫ（ｗｗｗ．Ｂｉｏｉｎｆｏｒｍ
ａｔｉｃｓ．ｂｃ．ｅｄｕ／ｍａｒｔｈｌａｂ／Ｍｏｓａｉｋ上）、Ｎｏｖｏａｌｉｇｎ
（ｗｗｗ．ｎｏｖｏｃｒａｆｔ．ｃｏｍ／ｍａｉｎ／ｉｎｄｅｘ．ｐｈｐ上）、ＰＡＬＭ
ａｐｐｅｒ（ｗｗｗ．ｆｍｌ．ｔｕｅｂｉｎｇｅｎ．ｍｐｇ．ｄｅ／ｒａｅｔｓｃｈ／ｓ
ｕｐｐｌ／ｐａｌｍａｐｐｅｒ上）、ＰＡＳＳ（ＣａｍｐａｇｎａＤ．ｅｔａｌ．，
Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００９；２５（７）：９６７－８）、ＰａｔＭａＮ（
ＰｒｕｆｅｒＫ．ｅｔａｌ．、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００８；２４（１
３）：１５３０－１）、ＰｅｒＭ（ＣｈｅｎＹ．ｅｔａｌ．、Ｂｉｏｉｎｆｏｒｍａ
ｔｉｃｓ，２００９、２５（１９）：２５１４－２５２１）、ＰｒｏｂｅＭａｔｃｈ（Ｋ
ｉｍＹ．Ｊ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００９；２５（１１）
：１４２４－５）、ＱＰａｌｍａ（ｄｅＢｏｎａＦ．ｅｔａｌ．，Ｂｉｏｉｎｆｏ
ｒｍａｔｉｃｓ，２００８，２４（１６）：ｉ１７４）、ＲａｚｅｒＳ（ＷｅｅｓｅＤ
．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ，２００９，１９：１６４６－１６５
４）、ＲＭＡＰ（ＳｍｉｔｈＡ．Ｄ．ｅｔａｌ．、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．
２００９；２５（２１）：２８４１－２）、ＳｅｑＭａｐ（ＪｉａｎｇＨ．ｅｔａｌ
．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００８；２４：２３９５－２３９６．）、Ｓｈｒｅ
ｃ（ＳａｌｍｅｌａＬ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０；２６（１０）：
１２８４－９０）、ＳＨＲｉＭＰ（ＲｕｍｂｌｅＳ．Ｍ．ｅｔａｌ．，ＰＬｏＳＣ
ｏｍｐｕｔ．Ｂｉｏｌ．，２００９，５（５）：ｅ１０００３８６）、ＳＬＩＤＥＲ（Ｍ
ａｌｈｉｓＮ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２００９、２５（１）
：６－１３）、ＳＬＩＭＳｅａｒｃｈ（ＭｕｌｌｅｒＴ．ｅｔａｌ．，Ｂｉｏｉｎ
ｆｏｒｍａｔｉｃｓ．２００１；１７Ｓｕｐｐｌ１：Ｓ１８２－９）、ＳＯＡＰ（Ｌ
ｉＲ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００８；２４（５）：７１３
－４）、ＳＯＡＰ２（ＬｉＲ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００
９；２５（１５）：１９６６－７）、ＳＯＣＳ（ＯｎｄｏｖＢ．Ｄ．ｅｔａｌ．，Ｂ
ｉｏｉｎｆｏｒｍａｔｉｃｓ，２００８；２４（２３）：２７７６－７）、ＳＳＡＨＡ（
ＮｉｎｇＺ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２００１；１１（１０）：１７２
５－９）、ＳＳＡＨＡ２（ＮｉｎｇＺ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２００
１；１１（１０）：１７２５－９）、Ｓｔａｍｐｙ（印刷前に電子出版されたＬｕｎｔｅ
ｒＧ．ａｎｄＧｏｏｄｓｏｎＭ．ＧｅｎｏｍｅＲｅｓ．２０１０）、Ｔａｉｐａ
ｎ（ｗｗｗ．ｔａｉｐａｎ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ上）、ＵＧＥＮＥ（ｗｗｗ
．ｕｇｅｎｅ．ｕｎｉｐｒｏ．ｒｕ上）、ＸｐｒｅｓｓＡｌｉｇｎ（ｗｗｗ．ｂｃｇｓｃ
．ｃａ／ｐｌａｔｆｏｒｍ／ｂｉｏｉｎｆｏ／ｓｏｆｔｗａｒｅ／ＸｐｒｅｓｓＡｌｉｇ
ｎ上）、およびＺＯＯＭ（ＢｉｏｉｎｆｏｒｍａｔｉｃｓＳｏｌｕｔｉｏｎｓＩｎｃ
．，Ｗａｔｅｒｌｏｏ，ＯＮ，Ｃａｎａｄａ）が含まれるが、これらに限定されない。

配列アライメントアルゴリズムを、例えば、配列決定技術、読み取りの長さ、読み取り
の数、利用可能な計算資源、および感度／スコア化要件を含むいくつかの要因に基づいて
選択することができる。異なる配列アライメントアルゴリズムは、異なるレベルの速度、
アライメント感度、およびアライメント特異性を得ることができる。アライメント特異性
は、典型的には、予測されるアライメントと比較した、正しくアライメントされる提出試
料において見られるアライメントされた標的配列残基の割合を指す。アライメント感度は
、通常、予測されるアライメントにおいて見られるアライメントされた標的配列残基の割
合を指し、それは、提出試料でも正しくアライメントされている。

速度が最初に考慮されるべき要因である場合、ＥＬＡＮＤまたはＳＯＡＰ等のアライメ
ントアルゴリズムを、短い読み取り（例えば、Ｉｌｌｕｍｉｎａ／Ｓｏｌｅｘａシーケン
サからの）を参照ゲノムに対してアライメントする目的で使用することができる。特異性
が最も重要な要因である場合、ＢＬＡＳＴまたはＭｅｇａ－ＢＬＡＳＴ等のアライメント
アルゴリズムを、短い読み取り（例えば、ＲｏｃｈｅＦＬＸからの）を用いた類似点検
索の目的で用いることができるが、これらの方法は比較的緩徐である。ＭＡＱまたはＮｏ
ｖｏａｌｉｇｎ等のアライメントアルゴリズムは、品質スコアを考慮に入れるため、精度
が絶対不可欠である場合に（例えば、ハイスループットＳＮＰ調査において）、シングル
エンドまたはペアエンドデータセットの両方に用いることができる。Ｂｏｗｔｉｅまたは
ＢＷＡ等のアライメントアルゴリズムは、Ｂｕｒｒｏｗｓ－Ｗｈｅｅｌｅｒ変換（ＢＷＴ
）を用いるため、比較的小さいメモリフットプリントを必要とする。ＢＦＡＳＴ、Ｐｅｒ
Ｍ、ＳＨＲｉＭＰ、ＳＯＣＳ、またはＺＯＯＭ等のアライメントアルゴリズムは、色空間
読み取りをマッピングするため、ＡＢＩのＳＯＬｉＤプラットフォームとともに用いても
よい。いくつかの適用において、２つ以上のアライメントアルゴリズムからの結果を合わ
せてもよい。
調整：アライメントパラメータ

アライメントパラメータが、アルゴリズムの性能を調節する、例えば、読み取り配列と
参照配列との間の最適な大域アライメントまたは局所アライメントをもたらすために、ア
ライメントアルゴリズムで使用される。アライメントパラメータは、適合、ミスマッチ、
およびインデルに重み付けを与えることができる。例えば、より低い重みは、より多くの
ミスマッチおよびインデルとのアライメントを可能にする。

アライメントパラメータの例には、マッチリワード、ミスマッチペナルティ、ギャップ
ペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ）、予測閾値、
語長、フィルタ、またはマスクが含まれるが、これらに限定されない。

例えば、ギャップペナルティは、アライメントが読み取り配列または参照配列における
挿入によって破壊されたときにアライメントスコアを減少させるように設計される。ギャ
ップペナルティを用いて、配列中の他の隣接点で残基と残基の良好なアライメントを達成
することが可能である場合に、アライメントにおけるギャップまたは挿入を容認するかの
決定を支援することができる。具体的には、ペナルティを、それぞれの開かれたギャップ
（「ギャップ開き」ペナルティ）のスコアと、損失（「ギャップ伸長」ペナルティ）を乗
じたギャップ空間の総数のスコアから差し引くことができる。典型的には、ギャップを伸
長する損失は、ギャップを開く損失よりも少なくとも約２、３、４、５、６、７、８、９
、または１０倍低くなっている。予測閾値は、特定のサイズのデータベースを検索すると
きに偶然目撃することが「予測」され得るヒットの数を説明するパラメータである。
調整：アルゴリズムおよびパラメータの配列コンテキストに基づく選択／調整

配列コンテキスト、例えば、反復配列（例えば、タンデム反復配列、散在反復配列）、
複雑度の低い領域、インデル、偽遺伝子、またはパラログの存在が、アライメント特異性
に影響を及ぼし得る（例えば、誤アライメントを引き起こし得る）。本明細書で使用され
るとき、誤アライメントは、ゲノム中の誤った位置上での短い読み取りからの塩基対の配
置を指す。

より緩徐であるが、より正確なアライメントアルゴリズム（例えば、Ｓｍｉｔｈ－Ｗａ
ｔｅｒｍａｎアライメント、または多配列（読み取り）アライナＣＬＵＳＴＡＬＷ）等の
アライメントアルゴリズムを選択して、アライメント特異性を増加させる（例えば、配列
コンテキスト、例えば、反復配列の存在によって引き起こされる誤アライメントの可能性
を減少させる）ことができる。

マッチリワード、ミスマッチペナルティ、ギャップペナルティ（例えば、ギャップ開き
ペナルティ、ギャップ伸長ペナルティ）、予測閾値、語長、フィルタ、またはマスク等の
アライメントパラメータを調節して（例えば、増加または減少させて）、アライメント特
異性を増加させる（例えば、配列コンテキストによって引き起こされる誤アライメントの
可能性を減少させる）ことができる。
調整：アルゴリズムおよびパラメータの腫瘍型に基づく選択／調整

腫瘍型、例えば、特異的変異もしくは変異型を有する傾向のある腫瘍型に基づいて、ア
ライメントアルゴリズムが選択されるか、またはアライメントパラメータが調節されると
き、アライメント感度を増加させることができる。

核酸がある特定の腫瘍型の試料から単離されるときに、アライメントアルゴリズムを選
択して、アライメント感度を調節する（例えば、増加させる）ことができる。

核酸がある特定の腫瘍型の試料から単離されるときに、マッチリワード、ミスマッチペ
ナルティ、ギャップペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナル
ティ）、予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを調節し
て（例えば、増加または減少させて）、アライメント感度を調節する（例えば、増加させ
る）ことができる。例えば、Ｃ→Ｔ置換は、黒色腫の一般的な変異型である。したがって
、黒色腫試料からの核酸配列のミスマッチペナルティが減少または増加するときに、アラ
イメント感度を調節する（例えば、増加させる）ことができる。
調整：アルゴリズムおよびパラメータの遺伝子型に基づく選択／調整

特定の遺伝子型（例えば、癌遺伝子、腫瘍抑制遺伝子遺伝子）に基づいて、アライメン
トアルゴリズムが選択されるか、またはアライメントパラメータが調節されるとき、アラ
イメント感度を増加させることができる。異なる種類の癌関連遺伝子における変異は、癌
表現型に異なる影響を有し得る。例えば、変異体癌遺伝子対立遺伝子は、典型的には、優
性である。変異体腫瘍抑制遺伝子対立遺伝子は、典型的には、劣性であり、これは、多く
の場合、影響が現れる前に腫瘍抑制遺伝子の両方の対立遺伝子が影響を受けていなくては
ならないことを意味する。

遺伝子型（例えば、癌遺伝子、腫瘍抑制遺伝子）に基づいて、アライメントアルゴリズ
ムを選択して、アライメント感度を調節する（例えば、増加させる）ことができる。

遺伝子型（例えば、癌遺伝子、腫瘍抑制遺伝子）に基づいて、マッチリワード、ミスマ
ッチペナルティ、ギャップペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長
ペナルティ）、予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを
調節して（例えば、増加または減少させて）、アライメント感度／特異性を調節する（例
えば、増加させる）ことができる。例えば、インフレームインデルは、腫瘍抑制遺伝子に
一般に関連している。したがって、標準のギャップペナルティ手法（例えば、ギャップ開
き＋ギャップ伸長）が、癌遺伝子の場合はインフレームインデルを、腫瘍抑制遺伝子の場
合はフレームシフトインデルを好むように修正されるときに、アライメント感度および特
異性を調節する（例えば、増加させる）ことができる。
調整：アルゴリズムおよびパラメータの変異型に基づく選択／調整

変異型（例えば、単一ヌクレオチド多型、インデル（挿入もしくは欠失）、逆位、転座
、タンデム反復）に基づいて、アライメントアルゴリズムが選択されるか、またはアライ
メントパラメータが調節されるときに、アライメント感度を調節する（例えば、増加させ
る）ことができる。

変異型（例えば、単一ヌクレオチド多型、インデル（挿入または欠失）、逆位、転座、
タンデム反復）に基づいて、ＢＷＡ（高速の単一の短い読み取り）、Ｓｍｉｔｈ－Ｗａｔ
ｅｒｍａｎ（より緩徐でより正確な単一の短い読み取り）、およびＣＬＵＳＴＡＬＷ（さ
らにより緩徐であるが、複数の読み取りを考慮する）等のアライメントアルゴリズムを選
択して、アライメント感度を調節する（例えば、増加させる）ことができる。

変異型（例えば、単一ヌクレオチド多型、インデル（挿入もしくは欠失）、逆位、転座
、タンデム反復）に基づいて、マッチリワード、ミスマッチペナルティ、ギャップペナル
ティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ）、予測閾値、語長、
フィルタ、またはマスク等のアライメントパラメータを調節して（例えば、増加または減
少させて）、アライメント感度／特異性を調節する（例えば、増加させる）ことができる
。例えば、点変異は、ＫＲＡＳ遺伝子に一般に関連している。したがって、その位置のミ
スマッチペナルティが減少すると、アライメント感度が増加し得る。同様に、欠失は、Ｅ
ＧＦＲ遺伝子に一般に関連している。したがって、その位置（複数を含む）または遺伝子
のギャップペナルティ（例えば、ギャップの開きペナルティ、ギャップ伸長ペナルティ）
が減少すると、アライメント感度が増加し得る。部分的な配列（例えば、読み取りの前半
または後半）がアライメントに使用される場合、アライメント感度が増加する場合もある
。
アルゴリズムおよびパラメータの調整／変異部位に基づく選択／調整

変異部位（例えば、変異ホットスポット）に基づいて、アライメントアルゴリズムが選
択されるか、またはアライメントパラメータが調節されるときに、アライメント感度を調
節する（例えば、増加させる）ことができる。変異ホットスポットは、変異が通常の変異
率よりも最大１００倍頻繁に生じるゲノム中の部位を指す。

変異部位（例えば、変異ホットスポット）に基づいて、アライメントアルゴリズムを選
択して、アライメント感度を調節する（例えば、増加させる）ことができる。

変異部位（例えば、変異ホットスポット）に基づいて、マッチリワード、ミスマッチペ
ナルティ、ギャップペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナル
ティ）、予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを調節し
て（例えば、増加または減少させて）、アライメント感度を調節する（例えば、増加させ
る）ことができる。例えば、コドン１２での変異は、ＫＲＡＳ遺伝子に一般に関連してい
る。したがって、その部位のミスマッチペナルティが減少すると、アライメント感度が増
加し得る。

調整：アルゴリズムおよびパラメータの試料型に基づく選択／調整

試料型（例えば、ＦＦＰＥ試料）に基づいて、アライメントアルゴリズムが選択される
か、またはアライメントパラメータが調節されるときに、アライメント感度／特異性を調
節する（例えば、増加させる）ことができる。

試料型（例えば、ＦＦＰＥ試料）に基づいて、アライメントアルゴリズムを選択して、
アライメント感度／特異性を調節する（例えば、増加させる）ことができる。

試料型（例えば、ＦＦＰＥ試料）に基づいて、マッチリワード、ミスマッチペナルティ
、ギャップペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ）、
予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを調節して（例え
ば、増加または減少させて）、アライメント感度／特異性を調節する（例えば、増加させ
る）ことができる。例えば、ＤＮＡ損傷による移行変異アーチファクトは、ＦＦＰＥ試料
に一般に関連している。したがって、ＦＦＰＥ試料から得られる配列のミスマッチペナル
ティが増加すると、アライメント感度／特異性が増加し得る。
アライメントモジュール
アライメントの一般方法

本明細書に開示の方法は、複数の個別に調整されたアライメント方法またはアルゴリズ
ムの使用を可能にし、配列決定方法、特に多数の様々な遺伝子における多数の様々な遺伝
的事象の大規模並列配列決定に依存する方法、例えば、腫瘍試料を分析する方法における
能力を最適化する。実施形態において、異なる遺伝子におけるいくつかのバリアントのそ
れぞれに個別にカスタマイズまたは調整される複数のアライメント方法を用いて、読み取
りを分析する。実施形態において、調整は、配列決定される遺伝子（または他のサブゲノ
ム間隔）、試料の腫瘍型、配列決定されるバリアント、または試料もしくは対象の特性（
のうちの１つ以上）の関数であり得る。配列決定されるいくつかのサブゲノム間隔に個別
に調整されたアライメント条件の選択または使用は、速度、感度、および特異性の最適化
を可能にする。方法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライ
メントが最適化されるときに特に効果的である。

したがって、一態様において、試料、例えば、腫瘍試料を分析する方法が提供される。
方法は、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
（ｂ）任意で、例えば、ライブラリをベイトセット（または複数のベイトセット）と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
（本明細書でライブラリ捕獲物と称される場合もある）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、ベイズ方法を用いて、例えば、変異を呼び出す）ことと、を含み、
それによって、該腫瘍試料を分析し、
Ｘ個の一意のサブゲノム間隔のそれぞれからの読み取りは、一意のアライメント方法と
アライメントされ、一意のサブゲノム間隔とは、他のＸ－１個のサブゲノム間隔とは異な
ることを意味し、一意のアライメント方法とは、他のＸ－１個のアライメント方法とは異
なることを意味し、Ｘは、少なくとも２である。

ある実施形態において、Ｘは、少なくとも３、４、５、１０、１５、２０、３０、５０
、１００、５００、または１，０００である。

したがって、ある実施形態において、本明細書に記載の方法、例えば、腫瘍試料を分析
する方法は、本明細書に記載のアライメント方法を含む。例として、方法（例えば、ステ
ップ（ｃ））は、該読み取りを分析する、例えば、アライメントするためにアライメント
方法を選択することを含んでもよく、アライメント方法は、以下のうちの１つ以上もしく
はすべての関数であるか、それらに応答して選択されるか、またはそれらのために最適化
される：
（ｉ）該試料における腫瘍型、例えば、腫瘍型、
（ｉｉ）配列決定される該サブゲノム間隔が位置する遺伝子または遺伝子型、例えば、バ
リアントまたはバリアント型、例えば、変異の事前選択された確率に関連した遺伝子また
は遺伝子型、
（ｉｉｉ）分析される部位（例えば、ヌクレオチド位置）、
（ｉｖ）評価されるサブゲノム間隔内のバリアント型、例えば、置換、
（ｖ）試料型、例えば、ＦＦＰＥ試料、および
（ｖｉ）評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該
サブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反
復配列またはその付近の反復配列の存在。

本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔につい
ての読み取りのアライメントが最適化されるときに特に効果的である。したがって、ある
実施形態において、少なくともＸ個の一意のアライメント方法を用いて、少なくともＸ個
の一意のサブゲノム間隔についての読み取りを分析し、一意とは、他のＸ－１とは異なる
ことを意味し、Ｘは、２、３、４、５、１０、１５、２０、３０、５０、１００、２００
、５００、または１，０００に等しい。

ある実施形態において、サブゲノム間隔が表１の少なくともＸ個の遺伝子から分析され
、Ｘは、３、４、５、１０、１５、２０、または３０に等しい。

ある実施形態において、サブゲノム間隔が優先順位が１のアノテーションを有する表１
の少なくともＸ個の遺伝子から分析され、Ｘは、３、４、５、１０、１５、２０、または
３０に等しい。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０、または１８０個の遺伝子、例えば、表１もしくは表１Ａの遺伝子におけるヌク
レオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意のアラ
イメント方法は、少なくとも１０、２０、３０、４０、または５０％の分析される該遺伝
子のそれぞれにおけるサブゲノム間隔に適用される。

ある実施形態において、優先順位が１のアノテーションを有する表１もしくは表１Ａの
少なくとも５、１０、２０、３０、または４０個の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意のアライメント方法は、
少なくとも１０、２０、３０、４０、または５０％の分析される該遺伝子のそれぞれにお
けるサブゲノム間隔に適用される。

ある実施形態において、表１、表１Ａ、表２、または表３の少なくとも１０、２０、３
０、４０、５０、１００、１５０、２００、３００、４００、または５００個のバリアン
トまたはコドン、例えば、変異のヌクレオチド位置に、ヌクレオチド値が割り当てられる
。ある実施形態において、一意のアライメント方法は、少なくとも１０、２０、３０、４
０、または５０％の分析される該遺伝子のそれぞれにおけるサブゲノム間隔に適用される
。

ある実施形態において、方法は、
一意のアライメント方法をＸ個のゲノム間隔のそれぞれに適用することを含み、該ゲノ
ム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、点
変異であり、Ｘは、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、ま
たは１００より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子に位置する
。

ある実施形態において、方法は、
一意のアライメント方法をＸ個のゲノム間隔のそれぞれ適用することを含み、該ゲノム
間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、再編
成、例えば、欠失、挿入、または転座であり、Ｘは、２、３、５、１０、２０、４０、５
０、６０、７０、８０、９０、または１００より大きく、該サブゲノム間隔はそれぞれ、
異なる遺伝子に位置する。

ある実施形態において、
第１の一意のアライメント方法は、事前選択されたヌクレオチド位置を含む第１のサブ
ゲノム間隔に適用され、そのバリアントは、腫瘍表現型に関連し、
第２の一意のアライメント方法は、該第１の事前選択されたヌクレオチド位置以外の事
前選択されたヌクレオチドを含むサブゲノム間隔、例えば、腫瘍表現型を有するバリアン
トを有しない位置に適用される。

ある実施形態において、方法は、
ａ）第１のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、点
変異、例えば、表６の変異である、第１の一意のアライメント方法を第１のゲノム間隔に
適用することと、
ｂ）第２のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、再
編成、例えば、欠失、挿入、または転座、例えば、表５の変異である、第２の一意のアラ
イメント方法を第２のゲノム間隔に適用することと、
ｃ）第３の一意のアライメント方法を第３のゲノム間隔、例えば、バリアントが腫瘍表
現型または該試料におけるその型の腫瘍に関連しないゲノム間隔に適用することと、を含
む。

ある実施形態において、遺伝子または遺伝子型は、
例えば、チロシンキナーゼ領域における活性化変異に関連し得る癌遺伝子、
不活性化（例えば、ナンセンス）変異を伴い得る腫瘍抑制遺伝子、または
高活性もしくは低活性の生殖細胞系遺伝的バリエーションを伴い得る薬物ＡＤＭＥ関連
遺伝子である。

ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムで用い
るパラメータ（またはその値）、例えば、マッチリワード、ミスマッチペナルティ、ギャ
ップペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ）、予想閾
値、語長、フィルタ、またはマスクの選択を含む。パラメータ（またはその値）を、事前
選択されたパラメータ、例えば、事前選択された限界または限度によって定義されるパラ
メータのパネルから選択してもよい。

ある実施形態において、既知の癌置換および既知の生殖細胞系インデルを含有する遺伝
子のためにアライメントする（またはアライメントを最適化する）とき、生殖細胞系バリ
アントが正しく捕捉され、かつ目的とする体細胞変異周辺のアライメントに悪影響を及ぼ
さないように、ギャップペナルティを減少させることができる。

ある実施形態において、アライメント方法の選択は、置換を含有する可能性の高い遺伝
子の最大差ミスマッチペナルティパラメータの選択を含む。

ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムの選択
、例えば、より高速な、例えば、ＢＷＡの代わりに、より緩徐であるが、より正確なアル
ゴリズム、例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアライメントの選択、またはＣＬＵＳ
ＴＡＬＷ等の複数のアライメント方法を用いたアライメント最適化の選択を含む。

ある実施形態において、該アライメント方法は、核酸試料の特性、例えば、試料年齢、
試料組織源（例えば、膵臓）、発癌物質の存在／変異原暴露（例えば、喫煙、ＵＶ）、試
料における核酸試料の品質（例えば、核酸断片化のレベル）の関数であるか、それらに応
答して選択されるか、またはそれらのために最適化される。

ある実施形態において、少なくともＸ個（Ｘは、１、２、３、４、５、１０、１５、２
０、３０、４０、もしくは５０である）のアライメント方法（複数を含む）は、（ｉ）の
関数であるか、それに応答して選択されるか、またはそのために最適化される。

ある実施形態において、少なくともＸ個（Ｘは、１、２、３、４、５、１０、１５、２
０、３０、４０、もしくは５０である）のアライメント方法（複数を含む）は、（ｉｉ）
の関数であるか、それに応答して選択されるか、またはそのために最適化される。

ある実施形態において、少なくともＸ個（Ｘは、１、２、３、４、５、１０、１５、２
０、３０、４０、もしくは５０である）のアライメント方法（複数を含む）は、（ｉｉｉ
）の関数であるか、それに応答して選択されるか、またはそのために最適化される。

ある実施形態において、第１のアライメント方法は、（ｉ）の関数であるか、それに応
答して選択されるか、またはそのために最適化され、第２のアライメント方法は、（ｉｉ
）の関数であるか、それに応答して選択されるか、またはそのために最適化され、第３の
アライメント方法は、（ｉｉｉ）の関数であるか、それに応答して選択されるか、または
そのために最適化される。

ある実施形態において、少なくとも１つのアライメント方法は、（ｉ）および（ｉｉ）
、（ｉｉｉ）、（ｉｖ）、（ｖ）、または（ｖｉｉ）のうちの１つ以上の関数であるか、
それらに応答して選択されるか、またはそれらのために最適化される。

ある実施形態において、少なくともＸ個（Ｘは、１、２、３、４、５、１０、１５、２
０、３０、４０、もしくは５０である）のアライメント方法（複数を含む）は、（ｉｉ）
および（ｉｉ）、（ｉｉｉ）、（ｉｖ）、（ｖ）、または（ｖｉｉ）のうちの１つ以上の
関数であるか、それらに応答して選択されるか、またはそれらのために最適化される。

ある実施形態において、該アライメント方法は、遺伝子もしくは遺伝子型、例えば、事
前選択された確率またはバリアント型、例えば、変異に関連した遺伝子もしくは遺伝子型
の関数であるか、それらに応答して選択されるか、またはそれらのために最適化される。

ある実施形態において、該アライメント方法は、以下を提供する：
置換を含有する可能性の高い遺伝子の最大差ミスマッチペナルティパラメータの調節、
設定、もしくは使用、
事前選択された腫瘍型によく見られる特異的変異型に基づく特定のミスマッチペナルテ
ィパラメータ（例えば、黒色腫におけるＣ→Ｔ）の調節、設定、もしくは使用、または
ある特定の試料型によく見られる特異的変異型に基づく特定のミスマッチペナルティパ
ラメータ（例えば、ＦＦＰＥによく見られる置換）の調節、設定、もしくは使用。

ある実施形態において、方法は、再編成に関連しないサブゲノム間隔のために最適化さ
れた第１のアライメント方法および再編成に関連したサブゲノム間隔のために最適化され
た第２のアライメント方法の使用を含む。

ある実施形態において、方法は、以下のうちの１、２、３、４個、もしくはすべての適
用を含む（実施形態において、以下のうちの２つ以上の群が含まれ、その群のそれぞれの
アライメント方法が一意である）：
（ｉ）比較的低い頻度で出現する変異に対する高レベルの感度を可能にするために最深の
対象範囲が要求される高レベルの標的（例えば、遺伝子、エクソン、または塩基）に応答
して選択されるか、またはそのために最適化される第１のアライメント方法。例えば、試
料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸において５％以下の頻度
で出現するバリアント、例えば、点変異に応答して選択されるか、またはそのために最適
化されるアライメント方法。典型的には、これらのバリアントは、高い検出信頼性を確保
するために、５００倍を超える配列決定深度を必要とする。例となる適用は、事前選択さ
れた癌において頻繁に変異されるエクソンである。
（ｉｉ）比較的高い頻度、例えば、上記の（ｉ）の変異よりも高い頻度で出現する変異に
対する高レベルの感度を可能にするために高い対象範囲（実施形態において、上記の（ｉ
）の対象範囲未満であるが）が要求される中間レベルの標的（例えば、遺伝子、エクソン
、または塩基）に応答して選択されるか、またはそのために最適化される第２のアライメ
ント方法。例えば、試料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸に
おいて５％を超え、最大１０、１５、もしくは２０％の頻度で出現するバリアント、例え
ば、点変異に応答して選択されるか、またはそのために最適化されるアライメント方法。
典型的には、これらのバリアントは、高い検出信頼性を確保するために、２００倍を超え
る配列決定深度を必要とする。例となる適用は、癌に関連した遺伝子における適用である
。
（ｉｉｉ）低～中程度の対象範囲（実施形態において、上述の（ｉ）もしくは（ｉｉ）の
対象範囲未満）が、ヘテロ接合体対立遺伝子に対する高レベルの感度を可能にするために
要求される低レベルの標的（例えば、遺伝子、エクソン、または塩基）に応答して選択さ
れるか、またはそのために最適化される第３のアライメント方法。例えば、バリアント、
例えば、（１）薬物に応答するか、またはそれを代謝する患者の能力に関連し得る薬理ゲ
ノムＳＮＰ、（２）患者を一意に特定する（フィンガープリントする）ために使用され得
るゲノムＳＮＰ、あるいは（３）ゲノムＤＮＡおよびＬＯＨのコピー数獲得／喪失を評価
するために使用され得るゲノムＳＮＰ／遺伝子座に応答して選択されるか、またはそのた
めに最適化されるアライメント方法。
（ｉｖ）中間レベルの標的（例えば、再編成、例えば、転座またはインデルにおける、例
えば、構造ブレークポイント）に応答して選択されるか、またはそのために最適化される
第４のアライメント方法。実施形態において、該対象範囲は、（ｉ）、（ｉｉ）、または
（ｉｉｉ）のうちの１つの対象範囲未満である。例えば、実施形態において、高い検出信
頼性を確保するために５～５０倍の配列対スパン深度を必要とするバリアント、例えば、
イントロンブレークポイントに応答して選択されるか、またはそのために最適化されるア
ライメント方法。例となる適用は、転座／インデルの傾向のある癌遺伝子である。
（ｖ）わずかな対象範囲がコピー数の変化を検出する能力を改善し得るイントロン標的等
の標的に応答して選択されるか、またはそのために最適化される第５のアライメント方法
。実施形態において、該対象範囲は、（ｉ）、（ｉｉ）、（ｉｉｉ）、または（ｉｖ）の
うちの１つの対象範囲未満である。例えば、いくつかの末端エクソンの１コピー欠失の検
出は、高い検出信頼性を確保するために、０．１～１０倍の対象範囲を必要とする。例と
なる適用は、増幅／欠失の傾向のある癌遺伝子に対する。

ある実施形態において、該アライメント方法は、別のアライメント方法が読み取りをア
ライメントする目的、例えば、受け入れ難い目的で使用された後に適用される。

ある実施形態において、方法は、事前選択されたサブゲノム間隔についての読み取りを
アライメントする第２またはその後の目的で第２のアライメント方法を選択および適用す
ることをさらに含む。例えば、ある実施形態において、第１の方法は、第１の比較的高速
なアルゴリズムの使用を含み、第２のアライメント方法は、第２のより緩徐であるがより
正確なアルゴリズムの使用を含む。

ある実施形態において、該アライメント方法は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアライ
メントアルゴリズムもしくは同様のアルゴリズム、またはＣＬＵＳＴＡＬＷ等の複数のア
ライメントアルゴリズムを含む。

ある実施形態において、（例えば、任意の方法によって）正確なアライメントに対して
抵抗性を示すサブゲノム間隔において、デノボまたは参照誘導アセンブリは、ＡＲＡＣＨ
ＮＥまたはＰｈｕｓｉｏｎ等の方法を用いることによって始まる。

ある実施形態において、ａ～ｃ、またはｂ～ｃは、上記の配列において行われる。

ある実施形態において、方法は、
ｄ）読み取りと該選択されたアライメント方法（例えば、事前選択されたアルゴリズム
またはパラメータ）との比較、例えば、アライメント比較を行うこと、および
ｅ）任意で、該読み取りが所定のアライメント基準（例えば、所定の基準は、事前選択
された数未満のミスマッチまたはギャップを有する参照とのアライメントである）を満た
すかを決定することをさらに含む。

ある実施形態において、（ｃ）は、
ｆ）サブゲノム間隔、例えば、バリアント、例えば、置換または再編成、例えば、イン
デルに関連したヌクレオチド位置を含むサブゲノム間隔のアライメントセレクタの値を取
得すること、および
ｇ）アライメントセレクタの該取得された値に応答して、読み取りを分析する、例えば
、アライメントするためのアライメント方法を選択することによってアライメント方法を
選択することを含むが、
但し、該アライメントセレクタが、以下のうちの１つ以上もしくはすべての関数であるか
、それらに応答して選択されるか、またはそれらのために最適化されることを条件とする
：
ｉ）該試料における腫瘍型、例えば、腫瘍型、
ｉｉ）配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、事
前選択された確率またはバリアント型、例えば、変異に関連した遺伝子もしくは遺伝子型
、
ｉｉｉ）分析される部位（例えば、ヌクレオチド位置）、
ｉｖ）評価されるサブゲノム間隔に関連したバリアントの種類、例えば、置換、
ｖ）試料の種類、例えば、ＦＦＰＥ試料、および
ｖｉ）評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該サ
ブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反復
配列またはその付近の反復配列の存在。

ある実施形態において、方法は、一意の閾値以外の閾値、例えば、一意ではない閾値を
取得し、かつそれをサブゲノム間隔、例えば、本明細書に記載の該サブゲノム間隔のうち
の１つに適用することを含む。
再編成をアライメントするための方法

本明細書に開示の方法は、再編成、例えば、インデルに関連したサブゲノム間隔の配列
決定の性能、具体的には、例えば、腫瘍試料由来の多数の様々な遺伝子における多数の様
々な遺伝的事象の大規模並列配列決定に依存する方法の性能を最適化するように複数の個
別に調整されたアライメント方法またはアルゴリズムの使用を可能にする。実施形態にお
いて、異なる遺伝子におけるいくつかの再編成のそれぞれに個別にカスタマイズまたは調
整される複数のアライメント方法を用いて、読み取りを分析する。実施形態において、調
整は、配列決定される遺伝子（もしくは他のサブゲノム間隔）、試料における腫瘍型、配
列決定されるバリアント、または試料もしくは対象の特性（のうちの１つ以上）の関数で
あり得る。配列決定されるいくつかのサブゲノム間隔に微調整されたこのアライメント条
件の選択または使用は、速度、感度、および特異性の最適化を可能にする。方法は、比較
的多数の様々なサブゲノム間隔についての読み取りのアライメントが最適化されるときに
特に効果的である。実施形態において、方法は、再編成のために最適化されたアライメン
ト方法および再編成に関連しないサブゲノム間隔のために最適化されたその他のアライメ
ント方法の使用を含む。

したがって、ある実施形態において、本明細書に記載の方法、例えば、腫瘍試料を分析
する方法は、本明細書に記載の再編成のアライメント方法を含む。

例として、サブゲノム間隔についての読み取りが、再編成、例えば、インデルを有する
ヌクレオチド位置を含む場合、方法は、
ｃ）事前選択された再編成とアライメントするために事前選択される再編成参照配列を
読み取りとのアライメントのために選択すること（実施形態において、参照配列は、ゲノ
ム再編成と同一ではない）（ある実施形態において、再編成参照配列断片（すなわち「代
替の参照」）は、読み取りにおいて見られることが予想される再編成と同一である。この
代替の参照が予想される再編成とも多少異なる（例えば、周辺の生殖細胞系バリアントも
含有し得る）ことも可能である）、
ｅ）該事前選択された再編成参照配列を読み取りと比較する、例えば、アライメントす
ること、および
ｆ）任意で、該読み取りが所定のアライメント基準を満たすかを決定することを含むア
ライメント方法を用いること（例えば、所定の基準は、事前選択されたレベル未満のミス
マッチまたはギャップを有する該事前選択された再編成参照とのアライメントであり得る
）を含み、
それによって、読み取りを分析するが、
但し、少なくともＸ個の一意の事前選択された再編成アライメント配列は、少なくとも
Ｘ個の一意のサブゲノム間隔についての読み取りを分析するために使用されることを条件
とし、一意とは、他のＸ－１とは異なることを意味し、Ｘは、２、３、４、５、１０、１
５、２０、３０、５０、１００、３００、５００、１０００、２０００、または３０００
に等しい。

ある実施形態において、事前選択された再編成アライメント配列は、該事前選択された
再編成、例えば、事前選択されたインデルの特定を可能にするために選択された配列を含
む。

ある実施形態において、事前選択された再編成アライメント配列は、該事前選択された
再編成、例えば、事前選択されたインデルに対応する配列（例えば、配列またはその相補
体のいずれか）を含む。

ある実施形態において、事前選択された再編成アライメント配列は、該事前選択された
配列の読み取りとアライメントするために選択された模擬配列（例えば、インデルの配列
またはその相補体以外の配列）を含む。

ある実施形態において、事前選択された再編成アライメント配列は、再編成の一方の側
面または両方の側面に隣接する配列、例えば、模擬配列を含む。

ある実施形態において、事前選択された再編成アライメント配列は、該再編成の接合部
からの配列、例えば、模擬配列を含む。

ある実施形態において、アライメントは、腫瘍型のために事前選択される事前選択され
た再編成アライメント配列で行われる。

ある実施形態において、部分的な読み取りアライメントが行われる、例えば、すべてに
満たない読み取りがアライメントされる、例えば、９０、８０、７０、５０、５０、４０
、３０、２０、または１０％未満の読み取りがアライメントされる。

ある実施形態において、方法は、再編成に関連したサブゲノム間隔のために最適化され
る第１のアライメント方法および再編成に関連しないサブゲノム間隔のために最適化され
る第２のアライメント方法の使用を含む。

ある実施形態において、方法は、
（ｇ）該読み取りを分析する、例えば、アライメントするためにアライメント方法を選
択または適用することをさらに含み、
それによって、該読み取りを分析するが、
但し、該アライメント方法が、以下のうちの１つ以上もしくはすべての関数であるか、そ
れらに応答して選択されるか、またはそれらのために最適化されることを条件とする：
ｉ）該試料における腫瘍型、例えば、腫瘍型、
ｉｉ）配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、
バリアントまたはバリアント型、例えば、変異の事前選択された確率に関連した遺伝子も
しくは遺伝子型、
ｉｉｉ）分析される部位（例えば、ヌクレオチド位置）、
ｉｖ）評価されるサブゲノム間隔に関連したバリアント型、例えば、置換、
ｖ）試料型、例えば、ＦＦＰＥ試料、および
ｖｉ）評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該サ
ブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反復
配列またはその付近の反復配列の存在。

本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔につい
ての読み取りのアライメントが最適化されるときに特に効果的である。したがって、ある
実施形態において、少なくともＸ個の一意のアライメント方法を用いて、少なくともＸ個
の一意のサブゲノム間隔についての読み取りを分析し、一意とは、他のＸ－１とは異なる
ことを意味し、Ｘは、２、３、４、５、１０、１５、２０、または３０に等しい。

ある実施形態において、表１もしくは表１Ａの少なくともＸ個の遺伝子のサブゲノム間
隔が分析され、Ｘは、２、３、４、５、１０、１５、２０、または３０に等しい。

ある実施形態において、優先順位が１のアノテーションを有する表１もしくは表１Ａの
少なくともＸ個の遺伝子のサブゲノム間隔が分析され、Ｘは、２、３、４、５、１０、１
５、２０、または３０に等しい。

ある実施形態において、一意のアライメント方法が、少なくとも３、５、１０、２０、
４０、５０、６０、７０、８０、９０、または１００個の異なる遺伝子のそれぞれにおけ
るサブゲノム間隔に適用される。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０、または１８０個の遺伝子、例えば、表１もしくは表１Ａの遺伝子におけるヌク
レオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意のアラ
イメント方法が、少なくとも１０、２０、３０、４０、または５０％の分析される該遺伝
子のそれぞれにおけるサブゲノム間隔に適用される。

ある実施形態において、優先順位が１のアノテーションを有する表１もしくは表１Ａの
少なくとも５、１０、２０、３０、または４０個の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意のアライメント方法が、
少なくとも１０、２０、３０、４０、または５０％の分析される該遺伝子のそれぞれにお
けるサブゲノム間隔に適用される。

ある実施形態において、例えば、表１、表２、または表３の少なくとも１０、２０、３
０、４０、５０、１００、１５０、２００、３００、４００、または５００個のバリアン
トまたはコドンのヌクレオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態
において、一意のアライメント方法が、少なくとも１０、２０、３０、４０、または５０
％の分析される該遺伝子のそれぞれにおけるサブゲノム間隔に適用される。

ある実施形態において、方法は、
一意のアライメント方法をＸ個のゲノム間隔のそれぞれに適用することを含み、該ゲノ
ム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、再
編成、例えば、欠失、挿入、または転座であり、Ｘは、２、３、５、１０、２０、４０、
５０、６０、７０、８０、９０、もしくは１００より大きく、該サブゲノム間隔はそれぞ
れ、異なる遺伝子に位置する。

ある実施形態において、
第１の一意のアライメント方法は、第１の事前選択されたヌクレオチド位置に適用され
、そのバリアントは、腫瘍表現型に関連し（例えば、表１０に提供されるバリアント、例
えば、一般的な上皮癌、すなわち、肺癌、乳癌、結腸癌、前立腺癌におけるインデルバリ
アント）、
第２の一意のアライメント方法は、該第１の事前選択されたヌクレオチド位置以外の事
前選択されたヌクレオチド、例えば、腫瘍表現型に関連したバリアントを有しない位置（
例えば、表１０において変数として存在しない配列）に適用される。

ある実施形態において、方法は、
ａ）第１のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、点
変異、例えば、表６の変異である第１のゲノム間隔に、第１の一意のアライメント方法を
適用することと、
ｂ）第２のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、再
編成、例えば、欠失、挿入、または転座、例えば、表５の変異である第２のゲノム間隔に
、第２の一意のアライメント方法を適用することと、
ｃ）第３の一意のアライメント方法を取得し、これを第３のゲノム間隔、例えば、バリ
アントが腫瘍表現型または該試料におけるその型の腫瘍に関連しないゲノム間隔に適用す
ることとを含む。

ある実施形態において、遺伝子もしくは遺伝子型は、
例えば、変異チロシンキナーゼ領域における活性化に関連し得る癌遺伝子、
不活性化（例えば、ナンセンス）変異を伴い得る腫瘍抑制遺伝子、または
高活性もしくは低活性の生殖細胞系遺伝的バリエーションを伴い得る薬物ＡＤＭＥ関連
遺伝子である。

ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムに用い
るパラメータ（もしくはその値）、例えば、マッチリワード、ミスマッチペナルティ、ギ
ャップペナルティ（例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ）、予想
閾値、語長、フィルタ、またはマスク、の選択を含む。パラメータ（またはその値）を、
事前選択されたパラメータ、例えば、事前選択された限界または限度によって定義される
パラメータのパネルから選択してもよい。

ある実施形態において、既知の癌置換および既知の生殖細胞系インデルを含有する遺伝
子をアライメントする（またはアライメントを最適化する）とき、生殖細胞系バリアント
が正しく捕捉され、かつ目的とする体細胞変異周囲のアライメントに悪影響を及ぼさない
ように、ギャップペナルティを減少させることができる。

ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムの選択
、例えば、より高速なアルゴリズム、例えば、ＢＷＡの代わりに、より緩徐であるが、よ
り正確なアルゴリズム、例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアライメントの選択、ま
たはＣＬＵＳＴＡＬＷ等の複数のアライメント方法を用いたアライメント最適化の選択を
含む。

ある実施形態において、少なくともＸ個（Ｘは、１、２、３、４、５、１０、１５、２
０、３０、４０、もしくは５０である）のアライメント方法（複数を含む）は、（ｉｉ）
および（ｉｉ）、（ｉｉｉ）、（ｉｖ）、（ｖ）、または（ｖｉｉ）のうちの１つ以上の
関数であるか、それに応答して選択されるか、またはそのために最適化される。

ある実施形態において、該アライメント方法は、遺伝子もしくは遺伝子型、例えば、事
前選択された確率またはバリアント型、例えば、変異に関連した遺伝子または遺伝子型の
関数であるか、それらに応答して選択されるか、またはそれらのために最適化される。

ある実施形態において、該アライメント方法は、以下を提供する：
置換を含有する可能性の高い遺伝子の最大差ミスマッチペナルティパラメータの調節、
設定、もしくは使用、
インデルを含有する可能性の高い遺伝子のギャップペナルティパラメータの調節、設定
、もしくは使用（例えば、ＮＳＣＬＣにおけるＥＧＦＲ）、
事前選択された腫瘍型によく見られる特異的変異型に基づく特定のミスマッチペナルテ
ィパラメータの調節、設定、もしくは使用（例えば、黒色腫におけるＣ→Ｔ）、または
ある特定の試料型によく見られる特異的変異型に基づく特定のミスマッチペナルティパ
ラメータの調節、設定、もしくは使用（例えば、ＦＦＰＥによく見られる置換）。

ある実施形態において、方法は、再編成に関連しないサブゲノム間隔のために最適化さ
れた第１のアライメント方法および最適化再編成に関連したサブゲノム間隔のために最適
化された第２のアライメント方法の使用を含む。

ある実施形態において、アライメントパラメータ、例えば、ギャップの開き／伸長ペナ
ルティは、調節される、例えば、減少させられる。

ある実施形態において、方法は、以下のうちの１、２、３、４個、もしくはすべての適
用を含む（実施形態において、以下のうちの２つ以上の群が含まれ、その群のそれぞれの
アライメント方法が一意である）：
（ｉ）比較的低い頻度で出現する変異に対する高レベルの感度を可能にするために最深の
対象範囲が要求される高レベルの標的（例えば、遺伝子、エクソン、または塩基）に応答
して選択されるか、またはそのために最適化される第１のアライメント方法。例えば、試
料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸において５％以下の頻度
で出現するバリアント、例えば、点変異に応答して選択されるか、またはそのために最適
化されるアライメント方法。典型的には、これらのバリアントは、高い検出信頼性を確保
するために、５００倍を超える配列決定深度を必要とする。例となる適用は、事前選択さ
れた癌において頻繁に変異されるエクソンである。
（ｉｉ）比較的高い頻度、例えば、上記の（ｉ）の変異よりも高い頻度で出現する変異に
対する高レベルの感度を可能にするために高い対象範囲（実施形態において、上記の（ｉ
）の対象範囲未満であるが）が要求される中間レベルの標的（例えば、遺伝子、エクソン
、または塩基）に応答して選択されるか、またはそのために最適化される第２のアライメ
ント方法。例えば、試料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸に
おいて５％を超え、最大１０、１５、もしくは２０％の頻度で出現するバリアント、例え
ば、点変異に応答して選択されるか、またはそのために最適化されるアライメント方法。
典型的には、これらのバリアントは、高い検出信頼性を確保するために、２００倍を超え
る配列決定深度を必要とする。例となる適用は、癌に関連した遺伝子における適用である
。
（ｉｉｉ）低～中程度の対象範囲（実施形態において、上述の（ｉ）もしくは（ｉｉ）の
対象範囲未満）が、ヘテロ接合体対立遺伝子に対する高レベルの感度を可能にするために
要求される低レベルの標的（例えば、遺伝子、エクソン、または塩基）に応答して選択さ
れるか、またはそのために最適化される第３のアライメント方法。例えば、バリアント、
例えば、（１）薬物に応答するか、またはそれを代謝する患者の能力に関連し得る薬理ゲ
ノムＳＮＰ、（２）患者を一意に特定する（フィンガープリントする）ために使用され得
るゲノムＳＮＰ、あるいは（３）ゲノムＤＮＡおよびＬＯＨのコピー数獲得／喪失を評価
するために使用され得るゲノムＳＮＰ／遺伝子座に応答して選択されるか、またはそのた
めに最適化されるアライメント方法。
（ｉｖ）中間レベルの標的（例えば、再編成、例えば、転座またはインデルにおける、例
えば、構造ブレークポイント）に応答して選択されるか、またはそのために最適化される
第４のアライメント方法。実施形態において、実施形態において、該対象範囲は、（ｉ）
、（ｉｉ）、または（ｉｉｉ）のうちの１つの対象範囲未満である。例えば、実施形態に
おいて、高い検出信頼性を確保するために５～５０倍の配列対スパン深度を必要とするバ
リアント、例えば、イントロンブレークポイントに応答して選択されるか、またはそのた
めに最適化されるアライメント方法。例となる適用は、転座／インデルの傾向のある癌遺
伝子である。
（ｖ）わずかな対象範囲がコピー数の変化を検出する能力を改善し得るイントロン標的等
の標的に応答して選択されるか、またはそのために最適化される第５のアライメント方法
。実施形態において、該対象範囲は、（ｉ）、（ｉｉ）、（ｉｉｉ）、または（ｉｖ）の
うちの１つの対象範囲未満である。例えば、いくつかの末端エクソンの１コピー欠失の検
出は、高い検出信頼性を確保するために、０．１～１０倍の対象範囲を必要とする。例と
なる適用は、増幅／欠失の傾向のある癌遺伝子に対する。

ある実施形態において、該アライメント方法は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎもしく
は同様のアルゴリズム、またはＣＬＵＳＴＡＬＷ等の複数のアライメントアルゴリズムを
含む。

ある実施形態において、ａ～ｃ、またはｂ～ｃは、上記の順序において行われる。

ある実施形態において、方法は、
ｄ）読み取りと該選択されたアライメント方法（例えば、事前選択されたアルゴリズム
またはパラメータ）との比較、例えば、アライメント比較を行うことと、
ｅ）任意で、該読み取りが所定のアライメント基準（例えば、所定の基準は、事前選択
された数未満のミスマッチまたはギャップを有する参照とのアライメントである）を満た
すかを決定することとをさらに含む。

ある実施形態において、方法は、腫瘍および／または対照核酸試料（例えば、ＦＦＰＥ
由来の核酸試料）から得られるヌクレオチド配列読み取りの取得を含む。

ある実施形態において、方法は、核酸メンバーのライブラリを提供すること、および該
ライブラリの複数のメンバーからの事前選択されたサブゲノム間隔を配列決定することを
含む。実施形態において、方法は、配列決定のために、該ライブラリのサブセットを選択
するステップ、例えば、溶液ベースの選択を含み得る。

ある実施形態において、（ｃ）は、
ｆ）サブゲノム間隔、例えば、バリアント、例えば、置換または再編成、例えば、イン
デルに関連したヌクレオチド位置を含むサブゲノム間隔のアライメントセレクタの値を取
得すること、および
ｇ）アライメントセレクタの該取得された値に応答して、読み取りを分析する、例えば
、アライメントするためのアライメント方法を選択することによってアライメント方法を
選択することを含むが、
但し、該アライメントセレクタが、以下のうちの１つ以上もしくはすべての関数であるか
、それらに応答して選択されるか、またはそれらのために最適化されることを条件とする
：
ｉ）該試料における腫瘍型、例えば、腫瘍型、
ｉｉ）配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、
事前選択された確率またはバリアント型、例えば、変異に関連した遺伝子もしくは遺伝子
型、
ｉｉｉ）分析される部位（例えば、ヌクレオチド位置）、
ｉｖ）評価されるサブゲノム間隔に関連したバリアント型、例えば、置換、
ｖ）試料型、例えば、ＦＦＰＥ試料、および
ｖｉ）評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該サ
ブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反復
配列またはその付近の反復配列の存在。

ある実施形態において、該取得された値は、核酸試料の特性、例えば、試料年齢、試料
組織源（例えば、膵臓）、発癌物質の存在／変異原暴露（例えば、喫煙、ＵＶ）、試料に
おける核酸試料の品質（例えば、核酸断片化のレベル）の関数である。

ある実施形態において、例えば、第１の（または２個以上の）アライメント方法の失敗
後、方法は、例えば、新規の複雑な再編成を回収するために、アライメントされていない
読み取りの（例えば、ＡＲＡＣＨＮＥ方法を伴う）アセンブリを含む。
より困難な読み取りのアライメント

本明細書に開示の方法は、厄介な読み取りの迅速かつ効率的なアライメントを可能にす
る。方法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライメントが最
適化されるときに特に効果的である。例として、腫瘍試料を分析する方法は、
任意で、核酸を配列決定して読み取りを取得すること、
任意で、読み取りを取得すること（例えば、腫瘍および／または対照核酸試料（例えば
、ＦＦＰＥ由来の核酸試料）から得られるヌクレオチド配列読み取りを取得すること）、
第１の組のパラメータ下で（例えば、第１のマッピングアルゴリズム下で、または第１
の参照配列との）読み取りの比較、例えば、アライメント比較を行って、該読み取りが第
１の所定のアライメント基準を満たす（例えば、読み取りが、例えば、事前選択された数
未満のミスマッチを有する該第１の参照配列とアライメントされ得る）かを決定すること
、
該読み取りが第１の所定のアライメント基準を満たすことができない場合、第２の組の
パラメータ下で（例えば、第２のマッピングアルゴリズム下で、または第２の参照配列と
の）第２のアライメント比較を行うこと、および
任意で、該読み取りが該第２の所定の基準を満たす（例えば、読み取りが事前選択され
た数未満のミスマッチを有する該第２の参照配列とアライメントされ得る）かを決定する
ことを含んでもよく、
該第２の組のパラメータは、一組のパラメータ、例えば、該第１の組のパラメータと比較
して、事前選択されたバリアント、例えば、再編成、例えば、挿入、欠失、または転座に
ついての読み取りとのアライメントをもたらす可能性が高い該第２の参照配列の使用を含
み、
それによって、読み取りを分析する。

ある実施形態において、該第２の参照配列は、事前選択されたバリアント、例えば、染
色体再編成、例えば、挿入、欠失、または転座に隣接する配列を含む。

ある実施形態において、該第２の参照配列は、事前選択されたバリアント、例えば、染
色体再編成、例えば、挿入、欠失、または転座からの読み取りとアライメントするように
設計される配列を含む。

ある実施形態において、該第２の参照配列は、該事前選択された再編成、例えば、事前
選択されたインデルの同定を可能にするように選択された配列を含む。

ある実施形態において、該第２の参照配列は、該事前選択された再編成、例えば、事前
選択されたインデルに対応する配列（例えば、配列またはその相補体のいずれか）を含む
。

ある実施形態において、該第２の参照配列は、該事前選択された配列の読み取りとアラ
イメントするように選択された模擬配列（例えば、インデルの配列またはその相補体以外
の配列）を含む。

ある実施形態において、該第２の参照配列は、再編成の一方の側面または両方の側面に
隣接する配列、例えば、模擬配列を含む。

ある実施形態において、該第２の参照配列は、該再編成の接合部からの配列、例えば、
模擬配列を含む。
変異呼び出し

塩基呼び出しは、配列決定デバイスの生出力を指す。変異呼び出しは、配列決定される
ヌクレオチド位置のヌクレオチド値、例えば、Ａ、Ｇ、Ｔ、またはＣを選択するプロセス
を指す。典型的には、位置についての配列決定読み取り（または塩基呼び出し）は、２個
以上の値を提供し、例えば、いくつかの読み取りはＴを提供し、いくつかの読み取りはＧ
を提供する。変異呼び出しは、ヌクレオチド値、例えば、配列に対する値のうちの１つを
割り当てるプロセスである。これは「変異」呼び出しと称されるが、これを適用して、ヌ
クレオチド値を任意のヌクレオチド位置、例えば、変異体対立遺伝子、野生型対立遺伝子
、変異体もしくは野生型のいずれにも見なされていない対立遺伝子に対応する位置、また
は可変性を特徴としない位置に割り当ててもよい。変異呼び出し方法は、参照配列におけ
るそれぞれの位置での情報に基づいて独立した呼び出しを行うこと（例えば、配列読み取
りを試験すること、塩基呼び出しおよび品質スコアを試験すること、可能性のある遺伝子
型を考慮して観察される塩基および品質スコアの確率を計算すること、および遺伝子型を
割り当てること（例えば、ベイズの規則を用いて））、誤検出を除去すること（例えば、
深度閾値を用いて、予測よりもはるかに低いか、または高い読み取り深度を有するＳＮＰ
を拒否する；局所再アライメントを用いて小さなインデルによる誤検出を除去する）、な
らびに連鎖不均衡（ＬＤ）／インピュテーションに基づく分析を行って呼び出しを洗練す
ることのうちの１つ以上を含み得る。

特定の遺伝子型および位置に関連した遺伝子型の可能性を計算する等式は、例えば、Ｌ
ｉＨ．ａｎｄＤｕｒｂｉｎＲ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１０；２６（
５）：５８９－９５に記載されている。ある特定の癌型における特異的変異についての先
行予想をその癌型由来の試料を評価するときに用いることができる。そのような可能性は
、癌変異の公開データベース、例えば、癌における体細胞変異カタログ（ＣＯＳＭＩＣ）
、ＨＧＭＤ（ヒト遺伝子変異データベース）、ＳＮＰコンソーシアム、乳癌変異データベ
ース（ＢＩＣ）、および乳癌遺伝子データベース（ＢＣＧＤ）に由来し得る。

ＬＤ／インピュテーションに基づく分析の例は、例えば、ＢｒｏｗｎｉｎｇＢ．Ｌ．
ａｎｄＹｕＺ．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．２００９，８５（６）：８４７－６
１に記載されている。低対象範囲ＳＮＰ呼び出し方法の例は、例えば、ＬｉＹ．ｅｔ
ａｌ．，Ａｎｎｕ．Ｒｅｖ．ＧｅｎｏｍｉｃｓＨｕｍ．Ｇｅｎｅｔ．２００９，１０：
３８７－４０６に記載されている。
変異呼び出し：置換

アライメント後、呼び出し方法、例えば、ベイズ変異呼び出し方法を用いて置換の検出
を行うことができ、それは、サブゲノム間隔のそれぞれにおける各塩基、例えば、評価さ
れる遺伝子のエクソンに適用され、そこで代替の対立遺伝子の存在が観察される。この方
法は、変異の存在下で読み取りデータを観察する確率と塩基呼び出しエラーのみの存在下
で読み取りデータを観察する確率を比較する。この比較が変異の存在を十分かつ強力に支
援する場合、変異を呼び出すことができる。

癌ＤＮＡの分析のために５０％または１００％の頻度からの限定的なずれに対処する方
法が開発されている（例えば、ＳＮＶＭｉｘ－Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０
Ｍａｒｃｈ１５；２６（６）：７３０－７３６）。しかしながら、本明細書に開示の方
法は、試料ＤＮＡの１％～１００％、および特に、５０％よりも低いレベルでの変異体対
立遺伝子の存在の可能性の検討を可能にする。この手法は、天然（多クローン）腫瘍ＤＮ
Ａの低純度のＦＦＰＥ試料における変異の検出にとって特に重要である。

ベイズ変異－検出手法の利点は、変異の存在の確率と塩基呼び出しエラーのみの確率と
の比較をその部位における変異の存在の先行予想によって重み付けをすることができるこ
とである。代替の対立遺伝子のいくつかの読み取りが所与の癌型の頻繁に変異した部位で
観察される場合、変異の存在は、変異の証拠量が通常閾値を満たさない場合でさえも確信
的に呼び出され得る。ひいては、この柔軟性を用いて、より珍しい変異／より低い純度の
試料の検出感度さえも増加させるか、または試験をよりロバストにして、読み取り対象範
囲を減少させることができる。癌において変異するゲノムにおけるランダム塩基対の可能
性は、約１ｅ－６である。典型的な多遺伝子性癌ゲノムパネルにおける多くの部位での特
異的変異の可能性は、桁違いに高くあり得る。これらの可能性は、癌変異の公開データベ
ース（例えば、ＣＯＳＭＩＣ）に由来し得る。例えば、分析される遺伝子のうちの１つで
あるＫＲＡＳについて、以下の表６に提供される変異の先行予想を結腸癌試料の評価時に
用いることができる。

そこで、そのような表を作成し、公開データベース内の十分な情報が利用可能な多遺伝子
試験における任意の遺伝子の変異呼び出しアルゴリズムで用いることができる。
変異呼び出し：インデル

インデル呼び出しは、挿入または欠失の点で参照配列とは異なる配列決定データにおい
て塩基を見つけるプロセスであり、典型的には、関連した信頼スコアまたは統計学的証拠
メトリックを含む。

インデル呼び出し方法は、候補インデルを特定するステップ、局所再アライメントを介
して遺伝子型の可能性を計算するステップ、ならびにＬＤベースの遺伝子型推測および呼
び出しを行うステップを含み得る。典型的には、可能性のあるインデル候補を得るために
ベイズ手法が使用され、その後、これらの候補は、ベイズフレームワーク内の参照配列と
ともに試験される。

候補インデルを生成するアルゴリズムは、例えば、ＭｃＫｅｎｎａＡ．ｅｔａｌ．
，ＧｅｎｏｍｅＲｅｓ．２０１０；２０（９）：１２９７－３０３、ＹｅＫ．ｅｔ
ａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２００９；２５（２１）：２８６５－７１、Ｌ
ｕｎｔｅｒＧ．ａｎｄＧｏｏｄｓｏｎＭ．ＧｅｎｏｍｅＲｅｓ．２０１０（印刷
前に電子出版された）、ＬｉＨ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２０
０９，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２５（１６）：２０７８－９に記載されている。

インデル呼び出しおよび個別レベルの遺伝子型の可能性を生成するための方法は、例え
ば、Ｄｉｎｄｅｌアルゴリズム（ＡｌｂｅｒｓＣ．Ａ．ｅｔａｌ．，Ｇｅｎｏｍｅ
Ｒｅｓ．２０１０Ｏｃｔ２７（印刷前に電子出版された））を含む。例えば、ベイズ
ＥＭアルゴリズムを用いて、読み取りを分析し、最初のインデル呼び出しを作製し、それ
ぞれの候補インデルの遺伝子型の可能性を生成することができ、その後、例えば、ＱＣＡ
ＬＬ（ＬｅＳ．Ｑ．ａｎｄＤｕｒｂｉｎＲ．ＧｅｎｏｍｅＲｅｓ．２０１０Ｏ
ｃｔ２７（印刷前に電子出版された））を用いた遺伝子型のインピュテーションが続く
。インデルを観察する先行予想等のパラメータをインデルのサイズまたは位置に基づいて
調節する（例えば、増加または減少させる）ことができる。

変異呼び出しモジュール

本明細書に開示の方法は、配列決定方法、具体的には、例えば、腫瘍試料由来の多数の
様々な遺伝子における多数の様々な遺伝的事象の大規模並列配列決定に依存する方法の性
能を最適化するようにカスタマイズまたは調整された変異呼び出しパラメータの使用を提
供する。本方法の実施形態において、いくつかの事前選択されたサブゲノム間隔のそれぞ
れの変異呼び出しは、個別にカスタマイズまたは微調整される。カスタマイゼーションも
しくは調整は、本明細書に記載の要因、例えば、試料の癌型、配列決定されるサブゲノム
間隔が位置する遺伝子、または配列決定されるバリアントのうちの１つ以上に基づき得る
。

この配列決定されるいくつかのサブゲノム間隔に微調整されたアライメント条件の選択
または使用は、速度、感度、および特異性の最適化を可能にする。方法は、比較的多数の
様々なサブゲノム間隔についての読み取りのアライメントが最適化されるときに特に効果
的である。

したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
（ａ）複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
（ｂ）任意で、例えば、ライブラリをベイトセット（または複数のベイトセット）と接
触させることとによって事前選択された配列のライブラリを濃縮して、選択されたメンバ
ー（本明細書でライブラリ捕獲物と称される場合もある）を提供することと、
（ｃ）サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
（ｄ）該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる（例えば、本明細書に記載のベイズ方法または呼び出し方法を用いて、例えば、
変異を呼び出す）こととを含み、
それによって、該腫瘍試料を分析し、
Ｘ個の一意のサブゲノム間隔のそれぞれにおいてヌクレオチド位置に対して割り当てら
れるヌクレオチド値は、一意の呼び出し方法によって割り当てられ、一意のサブゲノム間
隔とは、他のＸ－１個のサブゲノム間隔とは異なることを意味し、一意の呼び出し方法と
は、他のＸ－１個の呼び出し方法とは異なることを意味し、Ｘは、少なくとも２である。
呼び出し方法は異なってもよく、それによって、例えば、異なるベイズ先行値に依存する
という点で一意であってもよい。

したがって、腫瘍試料を分析する方法は、変異呼び出し方法を含み得る。本明細書に記
載の変異呼び出し方法は、
（ｂ）それぞれの該Ｘ個のサブゲノム間隔の事前選択されたヌクレオチド位置のために
、以下を取得することと、
（ｉ）腫瘍型Ｘにおける該事前選択されたヌクレオチド位置で事前選択されたバリアン
ト、例えば、変異を示す読み取りを観察する先行（例えば、文献）予想であるか、または
それを表す第１の値、
（ｉｉ）バリアントがある頻度で（例えば、１％、５％、１０％等）試料中に存在する場
合、および／またはバリアントが不在である（例えば、塩基呼び出しエラーのみによる読
み取りにおいて観察される）場合、該事前選択されたヌクレオチド位置で該事前選択され
たバリアントを示す読み取りを観察する確率を表す第２の一組の値、
（ｃ）該値に応答して、例えば、本明細書に記載のベイズ方法によって、第１の値を用
いて第２の組の値の比較を検討する（例えば、変異の存在の事後確率を算出する）ことに
よって、該事前選択されたヌクレオチド位置のそれぞれに対する該読み取りからのヌクレ
オチド値を割り当てる（例えば、変異を呼び出す）こととを含んでもよく、それによって
、該試料を分析する。

ある実施形態において、方法は、以下のうちの１つ以上もしくはすべてを含む：
（ｉ）少なくとも１０、２０、４０、５０、６０、７０、８０、９０、もしくは１００
個の事前選択されたヌクレオチド位置に対するヌクレオチド値を割り当てる（例えば、変
異を呼び出す）こと（それぞれの割り当ては、（他の割り当てではなく）一意の第１およ
び／もしくは第２の値に基づく）、
（ｉｉ）（ｉ）の方法の割り当て（その割り当ての少なくとも１０、２０、３０、もし
くは４０個は、例えば、事前選択された腫瘍型における細胞の５、１０、または２０％未
満で存在する事前選択されたバリアントの確率の関数である第１の値で作成される）、
（ｉｉｉ）少なくともＸ個の事前選択されたヌクレオチド位置に対するヌクレオチド値
を割り当てる（例えば、変異を呼び出す）こと（Ｘ個の事前選択されたヌクレオチド位置
のそれぞれは、事前選択された腫瘍型、例えば、該試料の腫瘍型に存在する（他のＸ－１
個の割り当てとは対照的に）一意の確率を有する事前選択されたバリアントに関連し、任
意で、該Ｘ個の割り当てのそれぞれは、（他のＸ－１個の割り当てではなく）一意の第１
および／もしくは第２の値に基づく（Ｘ＝２３、５、１０、２０、４０、５０、６０、７
０、８０、９０、もしくは１００））、
（ｉｖ）ヌクレオチド値を第１および第２のヌクレオチド位置で割り当てる（例えば、
変異を呼び出す）こと（事前選択された腫瘍型（例えば、該試料の腫瘍型）に存在する該
第１のヌクレオチド位置での第１の事前選択されたバリアントの可能性は、存在する該第
２のヌクレオチド位置での第２の事前選択されたバリアントの可能性よりも少なくとも２
、５、１０、２０、３０、もしくは４０倍大きく、任意で、それぞれの割り当ては、（他
の割り当てではなく）一意の第１および／もしくは第２の値に基づく）、
（ｖ）ヌクレオチド値を複数の事前選択されたヌクレオチド位置に割り当てる（例えば
、変異を呼び出す）こと（該複数は、以下の確率範囲のうちの１つ以上の、例えば、少な
くとも３、４、５、６、７個、もしくはすべてに分類されるバリアントの割り当てを含む
：
０．０１未満、０．０１～０．２、
０．０２より大きく、０．０３以下、
０．０３より大きく、０．０４以下、
０．０４より大きく、０．０５以下、
０．０５より大きく、０．１以下、
０．１より大きく、０．２以下、
０．２より大きく、０．５以下、
０．５より大きく、１．０以下、
１．０より大きく、２．０以下、
２．０より大きく、５．０以下、
５．０より大きく、１０．０以下、
１０．０より大きく、２０．０以下、
２０．０より大きく、５０．０以下、および
５０より大きく、１００．０％以下、
ここで確率範囲は、事前選択されたヌクレオチド位置での事前選択されたバリアントが
事前選択された腫瘍型（例えば、該試料の腫瘍型）に存在する確率、または事前選択され
たヌクレオチド位置での事前選択されたバリアントが事前選択された型の腫瘍試料（例え
ば、該試料の腫瘍型）、腫瘍試料由来のライブラリ、もしくはそのライブラリからのライ
ブラリ捕獲物中の細胞の列挙された％に存在する確率の範囲であり、
任意で、それぞれの割り当ては、一意の第１および／もしくは第２の値に基づく（例え
ば、列挙された確率範囲の他の割り当てではなく、一意であるか、または他の列記された
確率範囲のうちの１つ以上もしくはすべての第１および／もしくは第２の値ではなく、一
意である））、
（ｖｉ）少なくとも１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９
０、もしくは１００個の事前選択されたヌクレオチド位置に対するヌクレオチド値を割り
当てる（例えば、変異を呼び出す）こと（事前選択されたヌクレオチド位置はそれぞれ、
独立して、該試料中のＤＮＡの５０、４０、２５、２０、１５、１０、５、４、３、２、
１、０．５、０．４、０．３、０．２、もしくは０．１％未満に存在する事前選択された
バリアントを有し、任意で、それぞれの割り当ては、（他の割り当てではなく）一意の第
１および／もしくは第２の値に基づく）、
（ｖｉｉ）ヌクレオチド値を第１および第２のヌクレオチド位置で割り当てる（例えば
、変異を呼び出す）こと（該試料のＤＮＡにおける第１の位置での事前選択されたバリア
ントの可能性は、該試料のＤＮＡにおける該第２のヌクレオチド位置での事前選択された
バリアントの可能性よりも少なくとも２、５、１０、２０、３０、もしくは４０倍大きく
、任意で、それぞれの割り当ては、（他の割り当てではなく）一意の第１および／もしく
は第２の値に基づく）、
（ｖｉｉｉ）ヌクレオチド値を以下のうちの１つ以上もしくはすべてにおいて割り当て
る（例えば、変異を呼び出す）こと、
（１）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の１．０％未満に存在する事前選択されたバリアントを
有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置、
（２）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の１．０～２．０％に存在する事前選択されたバリアン
トを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレオチド位置
、
（３）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の２．０％より大きく３％以下に存在する事前選択され
たバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレ
オチド位置、
（４）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の３．０％より大きく４％以下に存在する事前選択され
たバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレ
オチド位置、
（５）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の４．０％より大きく５％以下に存在する事前選択され
たバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌクレ
オチド位置、
（６）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の５．０％より大きく１０％以下に存在する事前選択さ
れたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌク
レオチド位置、
（７）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の１０．０％より大きく２０％以下に存在する事前選択
されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌ
クレオチド位置、
（８）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の２０．０％より大きく４０％以下に存在する事前選択
されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌ
クレオチド位置、
（９）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の４０．０％より大きく５０％以下に存在する事前選択
されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択されたヌ
クレオチド位置、または
（１０）該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ
捕獲物における核酸の該試料の細胞の５０．０％より大きく１００％以下に存在する事前
選択されたバリアントを有する少なくとも１、２、３、４、もしくは５個の事前選択され
たヌクレオチド位置、
ここで、任意で、それぞれの割り当ては、一意の第１および／もしくは第２の値に基づく
（例えば、列挙された範囲（例えば、（ｉ）の１％未満の範囲）の他の割り当てではなく
、一意であるか、または他の列記された範囲のうちの１つ以上もしくはすべてにおける決
定のために第１および／もしくは第２の値ではなく、一意である））、あるいは
（ｉｘ）ヌクレオチド値をＸ個のヌクレオチド位置のそれぞれで割り当てる（例えば、
変異を呼び出す）こと（それぞれのヌクレオチド位置は、独立して、他のＸ－１個のヌク
レオチド位置での事前選択されたバリアントの可能性と比較して一意である（該試料のＤ
ＮＡに存在する事前選択されたバリアントの）可能性を有し、Ｘは、１、２３、５、１０
、２０、４０、５０、６０、７０、８０、９０、もしくは１００以上であり、それぞれの
割り当ては、（他の割り当てではなく）一意の第１および／もしくは第２の値に基づく）
。

ある実施形態において、方法は、ヌクレオチド値を少なくとも２、３、５、１０、２０
、４０、５０、６０、７０、８０、９０、または１００個の事前選択されたヌクレオチド
位置で割り当てることを含み、事前選択されたヌクレオチド位置はそれぞれ独立して、０
．５、０．４、０．２５、０．１５、０．１０、０．０５、０．０４、０．０３、０．０
２、または０．０１未満の確率の関数である第１の値を有する。

ある実施形態において、方法は、ヌクレオチド値を少なくともＸ個のヌクレオチド位置
のそれぞれで割り当てることを含み、Ｘ個のヌクレオチド位置はそれぞれ独立して、他の
Ｘ－１個の第１の値と比較して一意の第１の値を有し、該Ｘ個の第１の値はそれぞれ、０
．５、０．４、０．２５、０．１５、０．１０、０．０５、０．０４、０．０３、０．０
２、または０．０１未満の確率の関数であり、Ｘは、１、２、３、５、１０、２０、４０
、５０、６０、７０、８０、９０、または１００以上である。

ある実施形態において、該第１および／または第２の値は、該事前選択されたヌクレオ
チド位置での事前選択されたバリアントの存在の先行予想によって、例えば、腫瘍型の関
数として重み付けされる。

ある実施形態において、事前選択されたヌクレオチド位置に対するヌクレオチド値を割
り当てる（例えば、変異を呼び出す）のに必要とされる読み取りの数は、該第１の値の大
きさと逆相関する。

ある実施形態において、事前選択されたヌクレオチド位置に対するヌクレオチド値を割
り当てる（例えば、変異を呼び出す）のに必要とされる読み取りの数は、事前選択された
バリアントの予想される確率の大きさと正に相関する。

本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔の変異
呼び出しが最適化されるときに特に効果的である。したがって、ある実施形態において、
少なくともＸ個の一意の第１および／または第２の値は、少なくともＸ個の一意のサブゲ
ノム間隔についての読み取りを分析するために使用され、一意とは、他のＸ－１とは異な
ることを意味し、Ｘは、２、３、４、５、１０、１５、２０、または３０に相当する。

ある実施形態において、表１の少なくともＸ個の遺伝子からのサブゲノム間隔が分析さ
れ、Ｘは、３、４、５、１０、１５、２０、または３０に等しい。

ある実施形態において、優先順位が１のアノテーションを有する表１の少なくともＸ個
の遺伝子からのサブゲノム間隔が分析され、Ｘは、３、４、５、１０、１５、２０、また
は３０に等しい。

ある実施形態において、一意の第１および／または第２の値が、少なくとも３、５、１
０、２０、４０、５０、６０、７０、８０、９０、または１００個の異なる遺伝子のそれ
ぞれのサブゲノム間隔に適用される。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０または１８０個の遺伝子、例えば、表１もしくは表１Ａの遺伝子におけるヌクレ
オチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の第１お
よび／または第２の値が、少なくとも１０、２０、３０、４０、または５０％の分析され
る該遺伝子のそれぞれのサブゲノム間隔に適用される。

ある実施形態において、優先順位が１のアノテーションを有する表１もしくは表１Ａの
少なくとも５、１０、２０、３０、または４０個の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意の第１および／または第
２の値が、少なくとも１０、２０、３０、４０、または５０％の分析される該遺伝子のそ
れぞれのサブゲノム間隔に適用される。

ある実施形態において、表１、表１Ａ、表２、もしくは表３の少なくとも１０、２０、
３０、４０、５０、１００、１５０、２００、３００、４００、もしくは５００個のバリ
アントまたはコドン、例えば、変異のヌクレオチド位置に、ヌクレオチド値が割り当てら
れる。ある実施形態において、一意の第１および／もしくは第２の値が、少なくとも１０
、２０、３０、４０、もしくは５０％の分析される該遺伝子のそれぞれのサブゲノム間隔
に適用される。

ある実施形態において、方法は、
一意の第１および／または第２の値をＸ個のゲノム間隔のそれぞれに適用することを含
み、該ゲノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリア
ントは、点変異であり、Ｘは、２、３、５、１０、２０、４０、５０、６０、７０、８０
、９０、または１００より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子
に位置する。

ある実施形態において、方法は、
一意の第１および／または第２の値をＸ個のゲノム間隔のそれぞれに適用することを含
み、該ゲノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリア
ントは、再編成、例えば、欠失、挿入、または転座であり、Ｘは、２、３、５、１０、２
０、４０、５０、６０、７０、８０、９０、または１００より大きく、該サブゲノム間隔
はそれぞれ、異なる遺伝子に位置する。

ある実施形態において、方法は、以下のうちの１、２、３、４個、もしくはすべてを含
む（実施形態において、以下のうちの２つ以上の群が含まれ、その群のそれぞれの第１お
よび／もしくは第２の値は一意である）：
（ｉ）第１および／もしくは第２の値に応答して、例えば、比較的低頻度で出現する変
異に対する高レベルの感度を可能にするために最深の対象範囲が要求される第１の事前選
択されたヌクレオチド位置に対する読み取りからのヌクレオチド値を割り当てる（例えば
、変異を呼び出す）こと（例として、試料中の細胞、ライブラリの核酸、またはライブラ
リ捕獲物の核酸において５％以下の頻度で出現するバリアント、例えば、点変異が挙げら
れる。典型的には、これらのバリアントは、高い検出信頼性を確保するために、５００倍
を超える配列決定深度を必要とする。例となる適用は、事前選択された癌において頻繁に
変異するエクソンである）、
（ｉｉ）第１および／もしくは第２の値に応答して、例えば、高対象範囲（実施形態に
おいて、上記の（ｉ）の対象範囲未満であるが）が、比較的高い頻度で、例えば、上記の
（ｉ）における変異よりも高い頻度で出現する変異に対する高レベルの感度を可能にする
ために要求される第２の事前選択されたヌクレオチド位置に対する読み取りからのヌクレ
オチド値を割り当てる（例えば、変異を呼び出す）こと（例として、試料中の細胞、ライ
ブラリの核酸、またはライブラリ捕獲物の核酸において５％より大きく、最大１０、１５
、もしくは２０％の頻度で出現するバリアント、例えば、点変異が挙げられる。典型的に
は、これらのバリアントは、高い検出信頼性を確保するために、２００倍を超える配列決
定深度を必要とする。例となる適用は、癌に関連した遺伝子においてである）、
（ｉｉｉ）第１および／もしくは第２の値に応答して、例えば、低～中間の対象範囲（
実施形態において、上述の（ｉ）もしくは（ｉｉ）の対象範囲未満である）が、ヘテロ接
合体対立遺伝子に対する高レベルの感度を可能にするために要求される第３の事前選択さ
れたヌクレオチド位置に対する読み取りからのヌクレオチド値を割り当てる（例えば、変
異を呼び出す）こと（例として、バリアント、例えば、（１）薬物に応答するか、または
それを代謝する患者の能力に関連し得る薬理ゲノムＳＮＰ、（２）患者を一意に特定する
（フィンガープリントする）ために使用され得るゲノムＳＮＰ、あるいは（３）ゲノムＤ
ＮＡおよびＬＯＨのコピー数獲得／喪失を評価するために使用され得るゲノムＳＮＰ／遺
伝子座が挙げられる）、
（ｉｖ）第１および／もしくは第２の値に応答して、第４の事前選択されたヌクレオチ
ド位置、例えば、再編成、例えば、転座またはインデルにおける、例えば、構造ブレーク
ポイントに対する読み取りからのヌクレオチド値を割り当てる（例えば、変異を呼び出す
）こと（実施形態において、対象範囲は、（ｉ）、（ｉｉ）、もしくは（ｉｉｉ）のうち
の１つの対象範囲未満である。例として、実施形態において、高い検出信頼性を確保する
ために、５～５０倍の配列対スパン深度を必要とするイントロンブレークポイントが挙げ
られる。例となる適用は、転座／インデルの傾向のある癌遺伝子である）、
（ｖ）第１および／もしくは第２の値に応答して、例えば、わずかな対象範囲がコピー
数の変化を検出する能力を改善し得る第５の事前選択されたヌクレオチド位置に対する読
み取りからのヌクレオチド値を割り当てる（例えば、変異を呼び出す）こと（実施形態に
おいて、対象範囲は、（ｉ）、（ｉｉ）（ｉｉｉ）、もしくは（ｉｖ）のうちの１つの対
象範囲未満である。例として、例えば、高い検出信頼性を確保するために０．１～１０倍
の対象範囲を必要とするいくつかの末端エクソンの１コピー欠失がある。例となる適用は
、増幅／欠失の傾向のある癌遺伝子に対する）。

本明細書に開示の方法は、配列決定方法、具体的には、多数の様々な遺伝子における多
数の様々な遺伝的事象の大規模並列配列決定に依存する方法の性能を最適化するようにカ
スタマイズまたは調整された変異呼び出しパラメータの使用を提供する。本方法の実施形
態において、「閾値」を用いて、読み取りを評価し、読み取りからヌクレオチド位置の値
を選択する、例えば、遺伝子の特定の位置で変異を呼び出す。本方法の実施形態において
、いくつかの事前選択されたサブゲノム間隔のそれぞれの閾値は、カスタマイズまたは微
調整される。カスタマイゼーションまたは調整は、本明細書に記載の要因、例えば、試料
の癌型、配列決定されるサブゲノム間隔が位置する遺伝子、または配列決定されるバリア
ントのうちの１つ以上に基づき得る。これは、配列決定されるいくつかのサブゲノム間隔
のそれぞれに微調整される呼び出しを提供する。方法は、比較的多数の様々なサブゲノム
間隔が分析されるときに特に効果的である。

したがって、別の態様では、対象由来の試料、例えば、腫瘍試料を分析する方法を特徴
とする。方法は、
（ａ）Ｘ個のサブゲノム間隔のそれぞれについての１つまたは複数の読み取りを該試料
由来の核酸から取得することと、
（ｂ）該Ｘ個のサブゲノム間隔のそれぞれのために、閾値を取得し（該取得されたＸ個
の閾値のそれぞれは、他のＸ－１個の閾値と比較して一意である）、それによって、Ｘ個
の一意の閾値を提供することと、
（ｃ）該Ｘ個のサブゲノム間隔のそれぞれのために、事前選択されたヌクレオチド位置
で事前選択されたヌクレオチド値を有する読み取りの数の関数である観察された値をその
一意の閾値と比較し、それによって、その一意の閾値を該Ｘ個のサブゲノム間隔のそれぞ
れに適用することと、
（ｄ）任意で、該比較の結果に応答して、ヌクレオチド値を事前選択されたヌクレオチ
ド位置に割り当てることとを含み、
Ｘは、２以上であり、
それによって、該試料を分析する。

本方法の実施形態は、例えば、以下の実施形態に見られるように、比較的多数のサブゲ
ノム間隔の閾値が最適化される場合に適用され得る。

ある実施形態において、Ｘは、少なくとも３、５、１０、２０、４０、５０、６０、７
０、８０、９０、もしくは１００である。

ある実施形態において、一意の閾値が、少なくとも３、５、１０、２０、４０、５０、
６０、７０、８０、９０、もしくは１００個の異なる遺伝子のそれぞれのサブゲノム間隔
に適用される。

ある実施形態において、少なくとも２０、４０、６０、８０、１００、１２０、１４０
、１６０、もしくは１８０個の遺伝子、例えば、表１もしくは表１Ａの遺伝子におけるヌ
クレオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾
値が、少なくとも１０、２０、３０、４０、もしくは５０％の分析される該遺伝子のそれ
ぞれのサブゲノム間隔に適用される。

ある実施形態において、優先順位が１のアノテーションを有する表１もしくは表１Ａの
少なくとも５、１０、２０、３０、もしくは４０個の遺伝子におけるヌクレオチド位置に
、ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾値が、少なくとも
１０、２０、３０、４０、もしくは５０％の分析される該遺伝子のそれぞれのサブゲノム
間隔に適用される。

ある実施形態において、表１、表１Ａ、表２、もしくは表３の少なくとも１０、２０、
３０、４０、５０、１００、１５０、２００、３００、４００、もしくは５００個のバリ
アントまたはコドン、例えば、変異のヌクレオチド位置に、ヌクレオチド値が割り当てら
れる。ある実施形態において、一意の閾値が、少なくとも１０、２０、３０、４０、もし
くは５０％の分析される該遺伝子のそれぞれのサブゲノム間隔に適用される。

ある実施形態において、表９の下半分または下３分の１の少なくとも１０、２０、３０
、４０、５０、１００、もしくは２００個のバリアント、例えば、変異のヌクレオチド位
置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾値が、少なく
とも１０、２０、３０、４０、もしくは５０％の分析される該遺伝子のそれぞれのサブゲ
ノム間隔に適用される。

ある実施形態において、方法は、
一意の閾値を取得し、それをＸ個のゲノム間隔のそれぞれに適用することを含み、該ゲ
ノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、
点変異であり、Ｘは、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、
もしくは１００より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子に位置
する。

ある実施形態において、方法は、
一意の閾値を取得し、それをＸ個のゲノム間隔のそれぞれに適用することを含み、該ゲ
ノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、
再編成、例えば、欠失、挿入、または転座であり、Ｘは、２、３、５、１０、２０、４０
、５０、６０、７０、８０、９０、もしくは１００より大きく、該サブゲノム間隔はそれ
ぞれ、異なる遺伝子に位置する。

本方法の実施形態は、例えば、以下の実施形態で見られるように、適用において使用さ
れる他の閾値と比較した閾値の調整を可能にし得る。

ある実施形態において、
一意の閾値が、ヌクレオチド値を表４の少なくとも１０、２０、３０、４０、５０、７
５、１００、１５０、もしくは２００個のバリアント、例えば、変異に対応する事前選択
されたヌクレオチド位置に割り当てるために、サブゲノム間隔に適用される。
適用される該一意の閾値のうちのＸ個は、試験で使用される別の閾値よりも高い、例え
ば、５０％高い閾値、例えば、使用される最低の閾値、使用される平均もしくは中央閾値
、または表９に列記される閾値等の一般的な臨床的に関連する変異の閾値を有し、Ｘは、
１、２、３、４、５、１０、１５、２０、もしくは３０以上である。

ある実施形態において、表９の上半分または上３分の１の少なくとも１０、２０、３０
、４０、５０、１００、もしくは２００個のバリアント、例えば、変異のヌクレオチド位
置にヌクレオチド値が割り当てられ、任意で、その割り当ては、第三者に送信される。実
施形態において、
一意の閾値は、ヌクレオチド値を少なくとも１０、２０、３０、４０、５０、７５、１
００、１５０、もしくは２００個のバリアントに対応する事前選択されたヌクレオチド位
置に割り当てるために、サブゲノム間隔に適用され、
適用される該一意の閾値のＸ個は、試験で使用される別の閾値よりも低い、例えば、５
０％低い閾値、例えば、使用される最高閾値、使用される平均もしくは中央閾値、または
以前は癌において変異するように見られなかったゲノム位置の閾値を有し、Ｘは、１、２
、３、４、５、１０、１５、２０、もしくは３０以上である。

ある実施形態において、
一意の閾値が、表１１の大腸癌の遺伝子に列記される遺伝子のうちの少なくとも２、３
、５、７、もしくは８個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値のうちの３つずつのＸ個の組み合わせ（すなわち、対での組み合
わせ）について、対での組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対し
て有する相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１
０、もしくは２０以上である。例として、ある実施形態では、大腸癌の分析において、一
意の閾値が、ＡＰＣ、ＳＭＡＤ４、およびＣＤＮＫ２ａのサブゲノム間隔に（低い閾値か
ら高い閾値の順に）適用される。したがって、３つの対での組み合わせ、ＡＰＣ／ＳＭＡ
Ｄ４、ＡＰＣ／ＣＤＮＫ２ａ、およびＳＭＡＤ４／ＣＤＮＫ２ａのそれぞれにおいて、対
での組み合わせのそれぞれの両方のメンバーは、表１１のそれらの遺伝子が相互に対して
有する相対順位と同一の相対順位を相互に対して有する（例えば、実施形態および表１１
の両方において、ＡＰＣはＳＭＡＤ４よりも低い）。

ある実施形態において、
一意の閾値が、表１１の大腸癌の遺伝子に列記される遺伝子のうちの少なくとも３、５
、７、もしくは８個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値のうちの３つずつのＸ個の組み合わせ（すなわち、３元の組み合
わせ）について、３元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対し
て有する相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１
０、もしくは２０以上である。例として、ある実施形態では、大腸癌の分析において、一
意の閾値が、ＡＰＣ、ＳＭＡＤ４、ＣＤＮＫ２ａ、およびＶＨＬのサブゲノム間隔に適用
される（低い閾値から高い閾値の順）。したがって、例えば、３元の組み合わせ、ＡＰＣ
／ＳＭＡＤ４／ＣＤＮＫ２ａにおいて、３元の組み合わせの３つのメンバーはすべて、表
１１のそれらの遺伝子が相互に対して有する相対順位と同一の相対順位を相互に対して有
する。同様に、３元の組み合わせ、ＡＰＣ／ＣＤＮＫ２ａ／ＶＨＬにおいて、３元の組み
合わせの３つのメンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相対順
位と同一の相対順位を相互に対して有する。

ある実施形態において、
一意の閾値が、表１１の大腸癌の遺伝子に列記された遺伝子のうちの少なくとも４、５
、７、もしくは８個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の４つずつのＸ個の組み合わせ（すなわち、４元の組み合わせ）
について、４元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、１０、もしく
は２０以上である。例として、ある実施形態では、大腸癌の分析において、一意の閾値が
、ＡＰＣ、ＳＭＡＤ４、ＣＤＮＫ２ａ、ＶＨＬ、ＭＳＨ６、およびＭＳＨ２におけるサブ
ゲノム間隔に適用される（低い閾値から高い閾値の順）。したがって、例えば、ＡＰＣ／
ＳＭＡＤ４／ＣＤＮＫ２ａ／ＭＳＨ２の４元の組み合わせにおいて、４元の組み合わせの
４つのメンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相対順位と同一
の相対順位を相互に対して有する。

ある実施形態において、
一意の閾値が、表１１の肺癌の遺伝子に列記された遺伝子のうちの少なくとも２、３、
５、もしくは７個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の２つずつのＸ個の組み合わせ（すなわち、対での組み合わせ）
について、対での組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１０、も
しくは２０以上である。例として、ある実施形態では、肺癌の分析において、一意の閾値
が、ＣＤＮＫ２ａ、ＳＴＫ１１、ＲＢ１、ＡＰＣ、およびＳＭＡＤ４におけるサブゲノム
間隔に適用される（低い閾値から高い閾値の順）。したがって、３つの対での組み合わせ
、ＣＤＮＫ２ａ／ＳＴＫ１１、ＳＴＫ１１／ＡＰＣ、およびＲＢ１／ＳＭＡＤ４のそれぞ
れにおいて、対での組み合わせのそれぞれの両方のメンバーは、表１１のそれらの遺伝子
が相互に対して有する相対順位と同一の相対順位を相互に対して有する（例えば、実施形
態および表１１の両方において、ＳＴＫ１１はＳＭＡＤ４よりも低い）。

ある実施形態において、
一意の閾値は、表１１の肺癌の遺伝子に列記された遺伝子のうちの少なくとも３、５、
もしくは７個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の３つずつのＸ個の組み合わせ（すなわち、３元の組み合わせ）
について、３元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１０、も
しくは２０以上である。例として、ある実施形態では、肺癌の分析において、一意の閾値
は、ＣＤＮＫ２ａ、ＳＴＫ１１、ＲＢ１、ＡＰＣ、およびＳＭＡＤ４におけるサブゲノム
間隔に適用される（低い閾値から高い閾値の順）。したがって、例えば、３元の組み合わ
せ、ＣＤＮＫ２／ＡＰＣ／ＳＭＡＤ４において、３元の組み合わせの３つのメンバーはす
べて、表１１のそれらの遺伝子が相互に対して有する相対順位と同一の相対順位を相互に
対して有する。

ある実施形態において、
一意の閾値は、表１１の肺癌の遺伝子に列記された遺伝子のうちの少なくとも４、５、
もしくは７個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の４つずつのＸ個の組み合わせ（すなわち、４元の組み合わせ）
について、４元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、１０、もしく
は２０以上である。例として、ある実施形態では、肺癌の分析において、一意の閾値が、
ＣＤＮＫ２ａ、ＳＴＫ１１、ＲＢ１、ＡＰＣ、およびＳＭＡＤ４におけるサブゲノム間隔
に適用される（低い閾値から高い閾値の順）。したがって、例えば、４元の組み合わせ、
ＣＤＮＫ２ａ／ＳＴＫ１１／ＡＰＣ／ＳＭＡＤ４において、４元の組み合わせの４つのメ
ンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相対順位と同一の相対順
位を相互に対して有する。

ある実施形態において、
一意の閾値が、表１１の前立腺癌の遺伝子に列記された遺伝子のうちの少なくとも２、
３、４、５、６、もしくは７個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の２つずつのＸ個の組み合わせ（すなわち、対での組み合わせ）
について、対での組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１０、も
しくは２０以上である。例として、ある実施形態では、前立腺癌の分析において、一意の
閾値が、ＣＥＢＰＡ、ＭＳＨ２、ＣＤＫＮ２Ａ、ＡＰＣ、ＲＢ１、ＮＦ１におけるサブゲ
ノム間隔に適用される（低い閾値から高い閾値の順）。したがって、３つの対での組み合
わせ、ＳＴＫ１１／ＣＥＢＰＡ、ＲＢ１／ＮＦ１、およびＣＥＢＰＡ／ＣＤＫＮ２Ａのそ
れぞれにおいて、対での組み合わせのそれぞれの両方のメンバーは、表１１のそれらの遺
伝子が相互に対して有する相対順位と同一の相対順位を相互に対して有する（例えば、実
施形態および表１１の両方において、ＳＴＫ１１はＣＥＢＰＡよりも低い）。

ある実施形態において、
一意の閾値が、表１１の前立腺癌の遺伝子に列記された遺伝子のうちの少なくとも３、
４、５、６、もしくは７個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の３つずつのＸ個の組み合わせ（すなわち、３元の組み合わせ）
について、３元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、もしくは５、
１０、もしくは２０以上である。例として、ある実施形態では、前立腺癌の分析において
、一意の閾値が、ＳＴＫ１１、ＣＥＢＰＡ、ＭＳＨ２、ＣＤＫＮ２Ａ、ＡＰＣ、およびＲ
Ｂ１におけるサブゲノム間隔に適用される（低い閾値から高い閾値の順）。したがって、
例えば、３元の組み合わせ、ＣＤＮＫ２／ＡＰＣ／ＲＢ１において、３元の組み合わせの
３つのメンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相対順位と同一
の相対順位を相互に対して有する。

ある実施形態において、
一意の閾値が、表１１の前立腺癌の遺伝子に列記された遺伝子のうちの少なくとも４、
５、６、もしくは７個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の４つずつのＸ個の組み合わせ（すなわち、４元の組み合わせ）
について、４元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、１０、もしく
は２０以上である。例として、ある実施形態では、前立腺癌の分析において、一意の閾値
が、ＳＴＫ１１、ＣＥＢＰＡ、ＭＳＨ２、ＣＤＫＮ２Ａ、ＡＰＣ、ＲＢ１、およびＮＦ１
におけるサブゲノム間隔に適用される（低い閾値から高い閾値の順）。したがって、例え
ば、４元の組み合わせ、ＳＴＫ１１／ＡＰＣ／ＲＢ１／ＮＦ１において、４元の組み合わ
せの４つのメンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相対順位と
同一の相対順位を相互に対して有する。

ある実施形態において、
一意の閾値は、表１１の乳癌の遺伝子に列記された遺伝子のうちの少なくとも２、３、
５、７、もしくは８個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の２つずつのＸ個の組み合わせ（すなわち、対での組み合わせ）
について、対での組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１０、も
しくは２０以上である。例として、ある実施形態では、乳癌の分析において、一意の閾値
が、ＣＤＨ１、ＣＤＫＮ２Ａ、ＡＰＣ、ＲＢ１、ＳＭＡＤ４、ＮＦ２、ＳＴＫ１１、ＭＳ
Ｈ２におけるサブゲノム間隔に適用される（低い閾値から高い閾値の順）。したがって、
３つの対での組み合わせ、ＡＰＣ／ＳＭＡＤ４、ＡＰＣ／ＮＦ２、およびＳＭＡＤ４／Ｍ
ＳＨ２のそれぞれにおいて、対での組み合わせのそれぞれの両方のメンバーは、表１１の
それらの遺伝子が相互に対して有する相対順位と同一の相対順位を相互に対して有する（
例えば、実施形態および表１１の両方において、ＡＰＣはＳＭＡＤ４よりも低い）。

ある実施形態において、
一意の閾値が、表１１の乳癌の遺伝子に列記された遺伝子のうちの少なくとも３、５、
７、または８個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の３つずつのＸ個の組み合わせ（すなわち、３元の組み合わせ）
について、３元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、５、１０、も
しくは２０以上である。例として、ある実施形態では、乳癌の分析において、一意の閾値
が、ＣＤＨ１、ＣＤＫＮ２Ａ、ＲＢ１、ＳＭＡＤ４、ＮＦ２、ＳＴＫ１１、ＭＳＨ２にお
けるサブゲノム間隔に適用される（低い閾値から高い閾値の順）。したがって、例えば、
３元の組み合わせ、ＣＤＨ１／ＲＢ１／ＳＴＫ１１において、３元の組み合わせの３つの
メンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相対順位と同一の相対
順位を相互に対して有する。

ある実施形態において、
一意の閾値が、表１１の乳癌の遺伝子に列記された遺伝子のうちの少なくとも４、５、
７、または８個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の４つずつのＸ個の組み合わせ（すなわち、４元の組み合わせ）
について、４元の組み合わせのメンバーは、表１１のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Ｘは、１、２、３、４、１０、もしく
は２０以上である。例として、ある実施形態では、乳癌の分析において、一意の閾値が、
ＣＤＨ１、ＣＤＫＮ２Ａ、ＡＰＣ、ＲＢ１、ＳＭＡＤ４、ＮＦ２、ＳＴＫ１１、ＭＳＨ２
におけるサブゲノム間隔に適用される（低い閾値から高い閾値の順）。したがって、例え
ば、４元の組み合わせ、ＣＤＨ１／ＳＭＡＤ４／ＳＴＫ１１／ＭＳＨ２において、４元の
組み合わせの４つのメンバーはすべて、表１１のそれらの遺伝子が相互に対して有する相
対順位と同一の相対順位を相互に対して有する。

ある実施形態において、
一意の閾値が、遺伝子ＡＰＣ、ＳＭＡＤ４、およびＡＴＭのうちの少なくとも２個もし
くは３個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の２つずつのＸ個の組み合わせ（すなわち、対での組み合わせ）
について、対での組み合わせのメンバーは、ＡＰＣ、ＳＭＡＤ４、およびＡＴＭの相対順
位であり、Ｘは、１、２、もしくは３以上である。例として、ある実施形態では、大腸癌
の分析において、一意の閾値が、ＡＰＣ、ＳＭＡＤ４、およびＡＴＭにおけるサブゲノム
間隔に適用される（低い閾値から高い閾値の順）。したがって、対での組み合わせ、ＡＰ
Ｃ／ＳＭＡＤ４およびＡＰＣ／ＡＴＭのそれぞれにおいて、対での組み合わせのそれぞれ
の両方のメンバーは、ＡＰＣ、ＳＭＡＤ４、およびＡＴＭにおける相対順位と同一の相対
順位を有する。

ある実施形態において、
一意の閾値が、遺伝子ＡＰＣ、ＳＭＡＤ４、およびＡＴＭのそれぞれのサブゲノム間隔
に適用され、低い閾値から高い閾値の順位は、ＡＰＣ、ＳＭＡＤ４、およびＡＴＭである
。
（表１１は、それらの遺伝子のいくつかまたはすべてのコード塩基対、例えば、表９の塩
基等のより速い速度で変異することで特に知られている塩基の別の廃止リストによって別
様に特定されない塩基対の閾値が増加する順に遺伝子の順序を列挙する。）

ある実施形態において、
第１の一意の閾値が、第１の事前選択されたヌクレオチド位置に適用され、そのバリア
ントは、腫瘍表現型に関連し、
第２の一意の閾値が、該第１の事前選択されたヌクレオチド位置以外の事前選択された
ヌクレオチド、例えば、腫瘍表現型に関連したバリアントを有しない位置に適用され、該
第１の閾値は、第２の閾値よりも高い。

ある実施形態において、方法は、
ａ）第１の一意の閾値を取得し、それを第１のゲノム間隔に適用することと（そのバリ
アントは、腫瘍表現型に関連し、例えば、バリアントは、点変異、例えば、表６の変異で
ある）、
ｂ）第２の一意の閾値を取得し、それを第２のゲノム間隔に適用することと（そのバリ
アントは、腫瘍表現型に関連し、例えば、バリアントは、再編成、例えば、欠失、挿入、
または転座、例えば、表５の変異である）、
ｃ）第３の一意の閾値を取得し、それを第３のゲノム間隔、例えば、バリアントが腫瘍
表現型または該試料の腫瘍型に関連しないゲノム間隔に適用することとを含む。

ある実施形態において、方法は、以下のうちの１、２、３、４個、もしくはすべてを含
む（実施形態において、以下のうちの２つ以上の群が含まれ、その群のそれぞれの閾値が
一意である）：
（ｉ）例えば、最深の対象範囲が比較的低い頻度で出現する変異に対する高レベルの感
度を可能にするように要求される、第１の閾値を第１の事前選択されたヌクレオチド位置
についての読み取りに適用すること（例として、試料中の細胞、ライブラリの核酸、また
はライブラリ捕獲物の核酸において５％以下の頻度で出現するバリアント、例えば、点変
異が挙げられる。典型的には、これらのバリアントは、高い検出信頼性を確保するために
、５００倍を超える配列決定深度を必要とする。例となる適用は、事前選択された癌にお
いて頻繁に変異するエクソンである）、
（ｉｉ）例えば、高い対象範囲（実施形態において、上記の（ｉ）未満であるが）が、
比較的高い頻度、例えば、上記の（ｉ）における変異よりも高い頻度で出現する変異に対
する高レベルの感度を可能にするために要求される、第２の閾値を第２の事前選択された
ヌクレオチド位置についての読み取りに適用すること（例として、試料中の細胞、ライブ
ラリの核酸、またはライブラリ捕獲物の核酸において５％より大きく、最大１０、１５、
もしくは２０％の頻度で出現するバリアント、例えば、点変異が挙げられる。典型的には
、これらのバリアントは、高い検出信頼性を確保するために、２００倍を超える配列決定
深度を必要とする。例となる適用は、癌に関連した遺伝子においてである）、
（ｉｉｉ）例えば、低～中程度の対象範囲（実施形態において、上述の（ｉ）または（
ｉｉ）の対象範囲未満）が、ヘテロ接合体対立遺伝子に対する高レベルの感度を可能にす
るために要求される、第３の閾値を第３の事前選択されたヌクレオチド位置についての読
み取りに適用すること（例として、バリアント、例えば、（１）薬物に応答するか、また
はそれを代謝する患者の能力に関連し得る薬理ゲノムＳＮＰ、（２）患者を一意に特定す
る（フィンガープリントする）ために使用され得るゲノムＳＮＰ、あるいは（３）ゲノム
ＤＮＡおよびＬＯＨのコピー数獲得／喪失を評価するために使用され得るゲノムＳＮＰ／
遺伝子座が挙げられる）、
（ｉｖ）第４の閾値を第４の事前選択されたヌクレオチド位置、例えば、再編成、例え
ば、転座またはインデルにおける、例えば、構造ブレークポイントについての読み取りに
適用すること（実施形態において、対象範囲は、（ｉ）、（ｉｉ）、もしくは（ｉｉｉ）
のうちの１つの対象範囲未満である。例として、実施形態において、高い検出信頼性を確
保するために５～５０倍の配列対スパン深度を必要とするイントロンブレークポイントが
挙げられる。例となる適用は、転座／インデルの傾向のある癌遺伝子である）、
（ｖ）例えば、わずかな対象範囲がコピー数の変化を検出する能力を改善し得る、第５
の閾値を第５の事前選択されたヌクレオチド位置についての読み取りに適用すること（実
施形態において、対象範囲は、（ｉ）、（ｉｉ）（ｉｉｉ）、もしくは（ｉｖ）のうちの
１つの対象範囲未満である。例として、例えば、高い検出信頼性を確保するために０．１
～１０倍の対象範囲を必要とするいくつかの末端エクソンの１コピー欠失がある。例とな
る適用は、増幅／欠失の傾向のある癌遺伝子に対する）。

ある実施形態において、
第１の閾値は、第２の閾値よりも大きく、
第２の閾値は、第３の閾値よりも大きく、
第３の閾値は、第４の閾値よりも大きく、
第４の閾値は、第５の閾値よりも大きい。

ある実施形態において、Ｘ個の閾値、例えば、一意または非一意の閾値は、以下の特性
：
ａ）変異予想、
ｂ）変異確率値、
ｃ）ベイズ先行、
ｄ）変異頻度、
ｅ）事前選択されたヌクレオチド位置に関連したバリアント型、例えば、腫瘍表現型、
例えば、点変異または再編成、例えば、欠失、挿入、または転座に関連したバリアント、
ｆ）コピー数、
ｇ）サブゲノム間隔の腫瘍型、あるいは
ｈ）サブゲノム間隔、
のうちの１、２、３、４個以上、もしくはすべての関数であるか、あるいはそれらに基づ
いて選択され、Ｘは、少なくとも１、２、３、５、１０、２０、４０、５０、６０、７０
、８０、９０、もしくは１００である。

ある実施形態において、Ｘ個の閾値、例えば、一意または非一意の閾値は、ａおよびｅ
、ａおよびｇ、ｅおよびｇを含むか、またはそれらである要因の関数であるか、あるいは
それらに基づいて選択され、Ｘは、少なくとも１、２、３、５、１０、２０、４０、５０
、６０、７０、８０、９０、もしくは１００である。

ある実施形態において、特性ａ～ｆのうちの１つ以上もしくはすべては、事前選択され
たヌクレオチド位置、事前選択された腫瘍型、または事前選択された遺伝子のうちの１つ
以上もしくはすべての関数である。

ある実施形態において、Ｘ個の閾値、例えば、一意または非一意の閾値は、バックグラ
ウンドゲノム変異頻度の関数であるか、またはそれに基づいて選択され、Ｘは、少なくと
も１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、もしくは１００
である。

ある実施形態において、Ｘ個の閾値、例えば、一意または非一意の閾値は、以下の患者
特性：
年齢、性別、事前環境暴露、例えば、変異原もしくは発癌物質への事前環境暴露、薬物
もしくは治療への事前暴露、例えば、抗腫瘍剤での事前治療、患者が現在喫煙しているか
、または過去に喫煙していたか、腫瘍型、あるいはサブゲノム間隔における生殖細胞系変
化のうちの１、２、３、４個以上、もしくはすべての関数であるか、またはそれらに基づ
いて選択され、
Ｘは、少なくとも１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、
もしくは１００である。

ある実施形態において、Ｘ個の閾値、例えば、一意または非一意の閾値は、以下の試料
特性：
腫瘍型、部位特異的腫瘍倍数性（例えば、ＳＮＰ分析に基づいて）、腫瘍接合性、試料純
度、腫瘍試料中の細胞充実度（例えば、試料中の腫瘍細胞の割合）、対象の腫瘍と対照Ｓ
ＮＰ遺伝子型が適合するか、あるいは予測または観察されるＤＮＡ損傷のレベルのうちの
１、２、３、４個以上、もしくはすべての関数であるか、またはそれに基づいて選択され
、
Ｘは、少なくとも１、２、３、５、１０、２０、４０、５０、６０、７０、８０、９０、
もしくは１００である。

ある実施形態において、方法は、一意の閾値を複数のサブゲノム間隔に適用することを
含む。

ある実施形態において、方法は、一意の閾値を第１のサブゲノム間隔の事前選択された
組の位置、例えば、遺伝子に適用することを含む。例えば、ある実施形態において、
該事前選択された組は、
第１の遺伝子におけるヌクレオチド位置のすべて、またはその事前選択された部分、
第１の遺伝子のイントロンのヌクレオチド位置のすべて、またはその事前選択された部
分、
第１の遺伝子のエクソンのヌクレオチド位置のすべて、またはその事前選択された部分
、
第１の遺伝子におけるヌクレオチド位置、例えば、バリアントが腫瘍表現型に関連する
ヌクレオチド位置を含む、事前選択された範囲内のヌクレオチド位置のすべてを含むか、
あるいはそれらに限定され、例えば、バリアントは、点変異または再編成、例えば、欠失
、挿入、または転座である。

ある実施形態において、方法は、一意の閾値を、第１のサブゲノム間隔、例えば、遺伝
子の事前選択された組の位置に適用すること、および一意の閾値を、それに続く、例えば
、第２、第３、第４、第５、もしくは第６のサブゲノム間隔、例えば、遺伝子の事前選択
された組の位置にさらに適用することを含む。ある実施形態において、該それに続く遺伝
子の事前選択された組は、
該それに続く遺伝子におけるヌクレオチド位置のすべて、またはその事前選択された部
分、
該それに続く遺伝子のイントロンのヌクレオチド位置のすべて、またはその事前選択さ
れた部分、
該それに続く遺伝子のエクソンのヌクレオチド位置のすべて、またはその事前選択され
た部分、
該それに続く遺伝子におけるヌクレオチド位置を含む、事前選択された範囲内のヌクレ
オチド位置のすべてを含むか、あるいはそれに限定され、そのバリアントは、腫瘍表現型
に関連し、例えば、バリアントは、点変異または再編成、例えば、欠失、挿入、または転
座である。

実施形態において、２個以上の閾値が、遺伝子、または他のサブゲノム間隔に適用され
る。したがって、ある実施形態において、方法は、
例えば、バックグラウンド変異率の関数である第１の一意の閾値を、サブゲノム間隔、
例えば、遺伝子の第１の事前選択された位置または第１の事前選択された組の位置に適用
すること、および
例えば、本明細書に開示の要因、例えば、腫瘍表現型に関連したバリアントの予想頻度
に応答して選択される、それに続く、例えば、第２、第３、第４、第５、もしくは第６の
一意の閾値を、該サブゲノム間隔のそれに続く、例えば、第２、第３、第４、第５、もし
くは第６の事前選択された位置または事前選択された組の位置に適用することを含む。

そのような実施形態において、第１の事前選択された組は、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置以外のヌクレオチド位置、また
は
遺伝子におけるヌクレオチド位置の大部分を含み得るか、あるいはそれに限定され得る
。

ある実施形態において、第２の事前選択された組は、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置、
該遺伝子のイントロンの第１の事前選択された部分のヌクレオチド位置、
該遺伝子のエクソンの第１の事前選択された部分のヌクレオチド位置、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置を含む、事前選択された範囲
内のヌクレオチド位置のすべて（例えば、バリアントは、点変異または再編成、例えば、
欠失、挿入、または転座である）、
遺伝子におけるヌクレオチド位置の小さな一部、あるいは
遺伝子の１、２、３、３、５、１０、もしくは２０個を超えないヌクレオチド位置を含
むか、またはそれに限定される。

そのような実施形態において、第１の事前選択された組は、
そのバリアントが腫瘍表現型に関連する該ヌクレオチド位置以外のヌクレオチド位置、
該遺伝子のイントロンの第１の事前選択された部分の該ヌクレオチド位置以外のヌクレ
オチド位置、
該遺伝子のエクソンの第１の事前選択された部分の該ヌクレオチド位置以外のヌクレオ
チド位置、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置を含む、事前選択された範囲
内の該ヌクレオチド位置以外のヌクレオチド位置（例えば、バリアントは、点変異または
再編成、例えば、欠失、挿入、または転座である）を含み得るか、あるいはそれに限定さ
れ得る。

そのような実施形態において、第１の一意の閾値は、該その後の一意の閾値よりも低く
あり得る。
臨床癌検体の次世代の配列決定からの体細胞のゲノム変化の高感度検出のためのベイズ手
法

本明細書の他の箇所で論じられるように、本発明は、試料、例えば、腫瘍試料を分析す
る方法を特色とする。本明細書に記載の方法は、
（ａａａ）Ｘ個のサブゲノム間隔のそれぞれについての１つまたは複数の読み取りを該
試料由来の核酸から取得することと、
（ｂｂｂ）該Ｘ個のサブゲノム間隔のそれぞれの事前選択されたヌクレオチド位置のた
めに、以下を取得することと、
（ｉ）腫瘍型Ｘの該事前選択されたヌクレオチド位置で事前選択されたバリアント、
例えば、変異を示す読み取りを観察する先行（例えば、文献）予想であるか、またはそれ
を表す第１の値、および
（ｉｉ）バリアントがある頻度（例えば、１％、５％、１０％等）で試料に存在する
場合、および／またはバリアントが不在である（例えば、塩基呼び出しエラーのみにより
読み取りで観察される）場合、該事前選択されたヌクレオチド位置で該事前選択されたバ
リアントを示す読み取りを観察する確率を表す第２の組の値、
（ｃｃｃ）該値に応答して、第１の値を用いて第２の組の値の間の比較を検討する（例
えば、変異の存在の事後確率を算出する）ことによって、該事前選択されたヌクレオチド
位置のそれぞれに対する該読み取りからのヌクレオチド値を割り当てる（例えば、変異を
呼び出す）こととを含んでもよく、それによって、該試料を分析する。

この方法は、例えば、その変数間の比較の検討において、ＮＧＳに基づく手法のための
分析成分を、体細胞変異頻度および多様性の知識を組み込んで検出を最適化する腫瘍ゲノ
ム評価に提供する。癌ゲノムにおける変異の頻度は比較的低いが（例えば、１Ｍｂゲノム
幅当たり約１～１０の割合の塩基置換が予想される）、特定のドライバ変異は、ある特定
の腫瘍型において頻繁に生じることが知られている。例えば、ＫＲＡＳ変異ｃ．３５Ｇ＞
Ａ（ｐ．Ｇ１２Ｄ）は、結腸癌の約１０％において予想され得る。効率的な変異－検出手
法は、この先行情報を利用して、感度と特異性との間のトレードオフを最適化し、かつ「
困難な」試料における検出力を最大化することができる。例えば、方法は、以下の関係を
用いた分析を含み得る：
Ｐ（変異存在｜読み取りデータ「Ｒ」）＝Ｐ（変異の頻度「Ｆ」＞０｜Ｒ）＝１－Ｐ（Ｆ
＝０｜Ｒ）

は、等式Ａに対する離散近似であり、これを、離散化近似の代わりにこの関係において代
替的に評価することができる。
等式Ａ：

Ｐ（Ｆ＝０）＝癌型における変異の１－先行予想。「ｐ」上記の（ｉ）の値は、ｐに対
応する。

（例えば、ｎ＝１００）は、先行過剰頻度の均一な分布を仮定し、したがって、ｉｉ）で
言及される変異頻度の先行予想を特定する。この項は、特定の試料で測定された純度もし
くは異数性等の予想される変異頻度、または特定の腫瘍型、摘出方法等の予想される変異
頻度に関する任意の先行知識に対して調整するために、均一な分布から調節へと変化させ
ることができる。

は、例えば、対立遺伝子計数観察、較正品質スコア、および置換変異の多項分布を用いて
、変異型に従って評価される。

本明細書で提供される検出手法は、以下のステップを含むことができる：配列決定およ
びアライメント、品質スコア再較正、ベイズ変異呼び出し、ならびに変異呼び出しフィル
タリング。例えば、配列決定およびアライメントは、１８２個の癌関連遺伝子のエクソン
のハイブリッド選択、ＩｌｌｕｍｉｎａＨｉＳｅｑプラットフォーム上での深部配列決
定、Ｂｕｒｒｏｗｓ－Ｗｈｅｅｌｅｒアライナ（ＢＷＡ）でのアライメント（ＬｉＨ．
ａｎｄＤｕｒｂｉｎＲ．（２００９）Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２５：１７５
４－６０）、ならびにゲノム分析ツールキット（ＧＡＴＫ）（ＭｃＫｅｎｎａＡ．Ｈ．
ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１０２０（９）：１２９７－３０３）を用
いたアライメント最適化を含み得る。品質スコア再較正は、報告された品質スコアを経験
的エラー率にマッピングする。ベイズ変異呼び出しは、変異が任意の頻度で存在する可能
性を可能にする（二倍体に限定されない）。ＣＯＳＭＩＣからの変異の組織特異的先行確
率を組み込み、感度を高める。変異呼び出しフィルタリングは、鎖バイアス、低マッピン
グ品質、および読み取り位置バイアス等の指標を用いてアーチファクトをフィルタリング
し、最も細菌様のバリエーション（ｄｂＳＮＰ）を除去する。

関連性のあるＰ（読み取りデータＲ｜変異頻度＝ｆ）を導き出すことによって、この手
法を追加の変異型（インデル／転座／ＣＮＶ）まで拡張することができる。
重複読み取り

配列決定プロセス中、エラーは、例えば、配列決定化学によって、または画像分析ソフ
トウェアによってプロセスの異なる段階で読み取りに導入され得る。重複読み取りは、典
型的には、別個の読み取りとして配列決定される。変異呼び出しアルゴリズムは、配列決
定エラーと実際の配列バリエーションを見分け、後者を正しく呼び出す必要がある。本明
細書に記載の方法は、配列決定エラーを減少させるように重複読み取りを分析し、それに
よって、変異呼び出しアルゴリズムの感度を改善することができる。

これは、典型的には、同一のゲノム位置を対象範囲とする独立した読み取りを比較する
ことによって行われる。読み取り重複は、ライブラリ調製（例えば、ＰＣＲ増幅）の様々
なステップ中に生成され、別個の読み取りとして配列決定される。これらが独立した読み
取りではない（すなわち、それらが同一の最初のＤＮＡ分子に由来する）ため、典型的に
は、任意の数の重複のうちの１つのみが変異検出プロセスに使用され、残りは破棄される
。

配列決定エラーを減少させ、それによって、変異呼び出しアルゴリズムの感度を改善す
るための重複読み取りの使用が本明細書に記載される。重複読み取りを、同一の開始およ
び終了位置の所有によって特定することができる。本質的には重複読み取りが同一の最初
のＤＮＡ分子の複製読み取りであるため、重複の間の任意の相違は、配列決定エラーであ
るはずであり、したがって、無視してもよい。例えば、高度に重複したデータが利用可能
である場合、３個以上の重複のコンセンサスを用いることができる。あるいは、塩基の品
質スコアを、２個以上の読み取り重複の間の同意を反映するために再定義し、任意の下流
プロセスによって利用してもよい。例えば、変異呼び出しアルゴリズムは、すべての重複
によって支援されない配列相違に置かれる重点を軽くしてもよい。

重複にコンセンサス配列を生成することによって、推奨される方法をいくつかの配列決
定データ上で試験した。コンセンサス読み取り配列のエラー率は、最初の読み取りのエラ
ー率よりも著しく低いことが示された。

この方法は、例えば、１）シーケンサのいくつかの失敗モードがより高いエラー率を有
する使用可能な配列データをもたらし、これがこのデータにおける変異呼び出す能力に悪
影響を及ぼすときに用いることができる。２）試料における特にまれな癌細胞由来のＤＮ
Ａを配列決定するときに（例えば、循環腫瘍細胞は、試料中の細胞の１％未満であり得る
）、重複を用いてエラーを減少させることは、このシナリオにおいて特に効果的であるべ
きであり、変異呼び出しパイプラインを機械故障に対してよりロバストにし、塩基エラー
率の任意の改善は、これらの腫瘍細胞における変異を正しく同定する能力を著しく増加さ
せ得る。

例となる一実施形態において、高い重複率（６９％）を有するデータセットが重複につ
いて走査される。重複の１つの読み取りを任意に選択する一般に使用されるソフトウェア
除去ツール（ＰｉｃａｒｄＭａｒｋＤｕｐｌｉｃａｔｅｓ）を用いて重複が除去される
とき、結果として生じるエラー率は、０．４０％であった。並行して、少なくとも３個の
重複を有するすべての読み取りは別個に処理され、それぞれの組の重複のコンセンサス配
列は、重複の最も一般的な配列を選択することによって得られた。コンセンサス配列のエ
ラー率は０．２０％であり、それらの配列を比較することによってより低い重複読み取り
エラー率を達成することができることを実証した。

コンセンサス読み取りを導き出す例：
読み取り１：ＣＣＡＡＡＡＣＴＡＡＡＣＴＧＣＴＣＴＴＴＡＡＡＴＡＴＣＴＴＡＧＡＣ
ＡＣＴ（配列番号２）
読み取り２：ＣＣＡＡＡＡＣＴＡＡＡＣＴＧＣＴＣＴＴＴＡＡＡＴＡＴＣＴＴＡＧＡＣ
ＡＣＴ（配列番号３）
読み取り３：ＣＣＡＡＣＡＣＴＡＡＡＣＴＧＣＴＣＴＴＴＡＡＡＴＡＴＣＴＴＡＧＡＣ
ＡＣＴ（配列番号４）
コンセンサス：ＣＣＡＡＡＡＣＴＡＡＡＣＴＧＣＴＣＴＴＴＡＡＡＴＡＴＣＴＴＡＧＡ
ＣＡＣＴ（配列番号５）

したがって、別の態様では、本発明は、例えば、
（ａ）任意で、（例えば、該サブゲノム間隔の最初のコピーの増幅によって形成された
）サブゲノム間隔の複数の重複を取得することと、
（ｂ）該複数の重複のそれぞれについての読み取りを取得して、複数の重複読み取りを
提供することと、
（ｃ）該複数の重複読み取りのそれぞれにおける第１のヌクレオチド位置でのヌクレオ
チド値を比較することと（典型的には、１個の重複読み取りにおけるヌクレオチド位置は
、第２の読み取りにおける対応するヌクレオチド位置と比較される）、
（ｄ）任意で、該複数の重複読み取りのそれぞれにおける第２のヌクレオチド位置での
ヌクレオチド値を比較することと、
（この場合において、ヌクレオチド位置のうちの一方では、該複数の読み取りのそれぞ
れは、同一のヌクレオチド値を有さず、任意で、該ヌクレオチド位置の他方では、該複数
の読み取りのそれぞれは、同一のヌクレオチド値を有する）
（ｅ）第１の分類子、例えば、品質スコアまたは重複調節されたヌクレオチド値を、該
複数の読み取りのすべてにおいて同一のヌクレオチド値を有しない位置でのヌクレオチド
値に割り当てることと、
（ｆ）任意で、第２の分類子、例えば、品質スコアまたは重複調節されたヌクレオチド
値を、複数の読み取りのそれぞれにおいて同一のヌクレオチド値を有する位置でのヌクレ
オチド値に割り当てることとを含む、腫瘍試料由来の核酸の配列を分析する方法を含み、
該第１の分類子は、それが割り当てられるヌクレオチド値が正しいという第１のレベル
の品質または信頼度を示し、該第２の分類子は、それが割り当てられるヌクレオチド値が
正しいという第２のレベルの品質または信頼度を示し、該第１のレベルは、事前選択され
た基準以下である。

一実施形態において、該第１のレベルは、該複数の読み取りがそれぞれ同一のヌクレオ
チド値を有した場合に割り当てられるヌクレオチド値よりも低い。

別の実施形態では、該第１のレベルは、該第２のレベルよりも低い。

別の実施形態では、分類は、複数のそのヌクレオチド位置とは異なるヌクレオチド値の
割合の関数である。

別の実施形態では、分類は、複数の重複読み取りの数の関数である。

さらに別の実施形態では、ヌクレオチド位置での変異呼び出し方法は、そのヌクレオチ
ド位置でのそのヌクレオチド値の分類の関数である。

別の実施形態では、重複読み取りは、同定も除去もされない。重複読み取りの非除去は
、重複読み取りの画分が対照試料と試験試料との間で著しく異なるとき、腫瘍ＤＮＡにお
けるコピー数異常の同定および対立遺伝子バランスの評価に特に有用であり得る。例えば
、高い重複率を有する試料における高い対象範囲深度を有するゲノム領域は、低い重複率
を有する試料における比較可能な深度を有する同一の領域よりも多くの読み取りを喪失し
得るが、低対象範囲の領域は、この作用を起こす傾向が低いと思われる。したがって、重
複読み取りの画分が対照試料と試験試料との間で著しく異なる場合、その２つの間の比較
はよりノイズを有する場合があり、したがって、コピー数変化の呼び出しの感度および／
または特異性を低下させる。

ＤＮＡ試験試料、例えば、腫瘍から抽出されるＤＮＡ試料の配列分析は、試験試料と対
照試料、例えば、非癌性組織由来のＤＮＡ試料との比較を必要とする。

ゲノムＤＮＡ試料の配列決定の際に重複読み取りが生成される。読み取り重複は、ライ
ブラリ調製（例えば、ＰＣＲ増幅）の様々なステップ中に生成され、別個の読み取りとし
て配列決定される。これらが独立した読み取りではない（すなわち、それらが同一の最初
のＤＮＡ分子に由来する）ため、典型的には、任意の数の重複のうちの１つのみが変異検
出プロセスに使用されるが、残りは破棄される。典型的には、対照試料および試験試料の
両方からの重複読み取りは、試験ＤＮＡ配列と対照ＤＮＡ配列との間の比較分析を行う前
に除去される。

一実施形態において、本出願者は、重複読み取りの数が試験試料と対照試料との間で著
しく異なる状況下において、（対照試料および試験試料のいずれか、またはそれらの両方
からの）重複読み取りの除去は、それが異なる試料の対象範囲深度パターンを別様に変形
させるため、コピー数の変化等の変化を呼び出す能力に悪影響を与えることを発見した。
したがって、重複読み取りの画分が試験試料と対照試料との間で著しく異なる（例えば、
２０％超、３０％超、４０％超、５０％超、６０％超、またはそれ以上異なる）という状
況下において、試験試料における変異を正しく同定する能力を最大化するために、重複読
み取りが比較分析前に除去されないことが好ましい。例えば、対照試料および試験試料に
おける重複読み取りの数が、それぞれ、２０％および８０％（または７０％または６０％
または５０％）である状況下において、重複読み取りは、好ましくは、比較分析前に除去
されない。
他の実施形態

本明細書に記載の方法の実施形態において、本方法におけるステップまたはパラメータ
が、本方法における下流ステップまたはパラメータを修正するために使用される。

ある実施形態において、腫瘍試料の特性が、該試料からの核酸の単離、ライブラリ構築
、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み取りマッピン
グ、変異呼び出し方法の選択、変異呼び出し、または変異アノテーションのうちの１つ以
上もしくはすべてにおける下流ステップまたはパラメータを修正するために使用される。

ある実施形態において、単離された腫瘍または対照核酸の特性が、該試料からの核酸の
単離、ライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決
定、読み取りマッピング、変異呼び出し方法の選択、変異呼び出し、または変異アノテー
ションのうちの１つ以上もしくはすべて下流ステップまたはパラメータを修正するために
使用される。

ある実施形態において、ライブラリの特性が、該試料からの核酸の再単離、その後のラ
イブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み
取りマッピング、変異呼び出し方法の選択、変異呼び出し、または変異アノテーションの
うちの１つ以上もしくはすべてにおける下流ステップまたはパラメータを修正するために
使用される。

ある実施形態において、ライブラリ捕獲物の特性が、該試料からの核酸の再単離、その
後のライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決定
、読み取りマッピング、変異呼び出し方法の選択、変異呼び出し、または変異アノテーシ
ョンのうちの１つ以上もしくはすべてにおける下流ステップまたはパラメータを修正する
ために使用される。

ある実施形態において、配列決定方法の特性が、該試料からの核酸の再単離、その後の
ライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件のその後の決定
、その後の配列決定、読み取りマッピング、変異呼び出し方法の選択、変異呼び出し、ま
たは変異アノテーションのうちの１つ以上もしくはすべてにおける下流ステップまたはパ
ラメータを修正するために使用される。

ある実施形態において、マッピングされた読み取りの収集物の特性が、該試料からの核
酸の再単離、その後のライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーショ
ン条件のその後の決定、その後の配列決定、その後の読み取りマッピング、変異呼び出し
方法の選択、変異呼び出し、または変異アノテーションのうちの１つ以上もしくはすべて
における下流ステップまたはパラメータを修正するために使用される。

ある実施形態において、方法は、腫瘍試料特性の値を取得すること、例えば、該試料中
の腫瘍細胞の割合の値、該腫瘍試料の細胞充実度の値、または腫瘍試料の画像から値を取
得することを含む。

実施形態において、方法は、該取得された腫瘍試料特性の値に応答して、腫瘍試料から
の核酸の単離、ライブラリ構築、ベイト設計もしくは選択、ベイト／ライブラリメンバー
ハイブリダイゼーション、配列決定、または変異呼び出しのパラメータを選択することを
含む。

ある実施形態において、方法は、該腫瘍試料に存在する腫瘍組織の量の値を取得するこ
と、該取得された値を参照基準と比較すること、および該参照基準が満たされる場合、該
腫瘍試料を受容すること、例えば、該腫瘍試料が３０、４０、または５０％を超える腫瘍
細胞を含有する場合、該腫瘍試料を受容することをさらに含む。

ある実施形態において、方法は、例えば、該腫瘍試料、参照基準を満たすことができな
い腫瘍試料由来の腫瘍組織をマクロ解剖することによって、腫瘍細胞のために濃縮された
サブ試料を取得することをさらに含む。

ある実施形態において、方法は、一次対照、例えば、血液試料が利用可能であるかを決
定すること、および利用可能である場合、対照核酸（例えば、ＤＮＡ）を該一次対照から
単離することをさらに含む。

ある実施形態において、方法は、ＮＡＴが（例えば、いずれの一次対照試料も利用可能
ではない）該腫瘍試料に存在するかを決定することをさらに含む。

ある実施形態において、方法は、例えば、一次対照を伴わない腫瘍試料中の該ＮＡＴ由
来の非腫瘍組織をマクロ解剖することによって、非腫瘍細胞のために濃縮されたサブ試料
を取得することをさらに含む。

ある実施形態において、方法は、一次対照もＮＡＴも利用可能ではないことを決定する
こと、および適合した対照なしで分析用の該腫瘍試料を作製することをさらに含む。

ある実施形態において、方法は、核酸を該腫瘍試料から単離して、単離された腫瘍核酸
試料を提供することをさらに含む。

ある実施形態において、方法は、核酸を対照から単離して、単離された対照核酸試料を
提供することをさらに含む。

ある実施形態において、方法は、検出可能な核酸を有しない試料を拒否することをさら
に含む。

ある実施形態において、方法は、該単離された核酸試料における核酸収率の値を取得す
ること、および取得された値を参照基準と比較すること、例えば、該取得された値が該参
照基準未満である場合、ライブラリ構築前に該単離された核酸試料を増幅することをさら
に含む。

ある実施形態において、方法は、該単離された核酸試料中の核酸断片の大きさの値を取
得すること、および取得された値を参照基準、例えば、少なくとも３００、６００、また
は９００ｂｐの大きさ、例えば、平均の大きさと比較することをさらに含む。本明細書に
記載のパラメータを、この決定に応じて調節または選択することができる。

ある実施形態において、方法は、該核酸断片の大きさが参照値以下であるライブラリを
取得することをさらに含み、該ライブラリは、ＤＮＡ単離とライブラリ作製の間に断片化
ステップを伴うことなく作製される。

ある実施形態において、方法は、核酸断片を取得することをさらに含み、該核酸断片の
大きさが参照値以上である場合、断片化され、その後、ライブラリにされる。

ある実施形態において、方法は、例えば、同定可能なはっきりと異なる核酸配列（バー
コード）を複数のメンバーのそれぞれに付加することによって、複数のライブラリメンバ
ーのそれぞれを標識化することをさらに含む。

ある実施形態において、方法は、プライマーを複数のライブラリメンバーのそれぞれに
付着させることをさらに含む。

ある実施形態において、方法は、複数のベイトを提供すること、および
複数のベイトを選択することをさらに含み、該選択は、１）患者の特性、例えば、年齢、
腫瘍の病期、前治療、または抵抗力、２）腫瘍型、３）腫瘍試料の特性、４）対照試料の
特性、５）対照の存在または種類、６）単離された腫瘍（または対照）核酸試料の特性、
７）ライブラリの特性、８）腫瘍試料の腫瘍型に関連することが知られている変異、９）
腫瘍試料の腫瘍型に関連することが知られていない変異、１０）事前選択された配列を配
列決定する（またはハイブリダイズもしくは回収する）か、または事前選択された変異、
例えば、高ＧＣ領域の配列決定もしくは再編成に関連した困難性を同定する能力、あるい
は１１）配列決定される遺伝子に応答する。

ある実施形態において、方法は、例えば、該腫瘍試料中の少数の腫瘍細胞の決定に応じ
て、ベイトまたは複数のベイトを選択すること、第２の遺伝子のメンバーと比較して第１
の遺伝子からのメンバーに比較的高効率の捕捉を与えることをさらに含み、例えば、第１
の遺伝子における変異は、腫瘍試料の腫瘍型の腫瘍表現型に関連する。

ある実施形態において、方法は、ライブラリ捕獲物の特性、例えば、核酸濃度または表
示の値を取得すること、および取得された値を核酸濃度または表示の参照基準と比較する
ことをさらに含む。

ある実施形態において、方法は、再処理の参照基準を満たさないライブラリ特性の値を
有するライブラリを選択することをさらに含む。

ある実施形態において、方法は、ライブラリ定量化の参照基準を満たすライブラリ特性
の値を有するライブラリを選択することをさらに含む。

ある実施形態において、方法は、対象の腫瘍型、遺伝子、および遺伝子変化（ＴＧＡ）
の関連性を提供することをさらに含む。

ある実施形態において、方法は、複数の要素を有する事前選択されたデータベースを提
供することをさらに含み、それぞれの要素は、ＴＧＡを含む。

ある実施形態において、方法は、対象のＴＧＡを特徴付けることをさらに含み、
該ＴＧＡが事前選択されたデータベース、例えば、有効なＴＧＡのデータベースに存在
するかを決定すること、
所定のデータベースからのＴＧＡの情報を該対象の該ＴＧＡと関連付ける（アノテート
する）こと、および
任意で、該対象の第２またはその後のＴＧＡが該事前選択されたデータベースに存在す
るかを決定し、かつ存在する場合、所定のデータベースからの第２またはその後のＴＧＡ
の情報を該患者に存在する該第２のＴＧＡと関連付けることを含む。

ある実施形態において、方法は、報告書を作成するために、対象のＴＧＡの存在もしく
は不在、および任意で関連したアノテーションをメモリアライズすることをさらに含む。

ある実施形態において、方法は、該報告書を受領関係者に送信することをさらに含む。

ある実施形態において、方法は、対象のＴＧＡを特徴付けることをさらに含み、
該ＴＧＡが事前選択されたデータベース、例えば、有効なＴＧＡのデータベースに存在
するかを決定すること、
該事前選択されたデータベースに存在しないＴＧＡが既知の臨床的に関連性のあるＧま
たはＡを有するかを決定し、有する場合、該事前選択されたデータベースにおける該ＴＧ
Ａの入力を提供することを含む。

ある実施形態において、方法は、報告書を作成するために、対象由来の腫瘍試料のＤＮ
Ａに見られる変異の存在もしくは不在をメモリアライズすることをさらに含む。

腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写が図１に提供される。
例証

本発明は、以下の実施例によってさらに説明され、それらは、限定的であると解釈され
るべきではない。本出願を通して引用されるすべての参考文献、図、配列表、特許、およ
び公開された特許出願の内容は、参照により本明細書に組み込まれる。
実施例１：腫瘍試料からの核酸単離

パラフィンブロックから切り取られた３×２０μｍの切片を４００μＬの緩衝液ＦＴＬ
とボルテックスによって混合し、１．５ｍＬの遠心分離管内で９０℃で１５分間インキュ
ベートした。８８～９２℃の範囲がインキュベーションのために許容できるものであった
。その後、試料を２０μＬのプロテイナーゼＫとともに５５℃で６時間、および１０μＬ
のＲＮａｓｅ（１ｍｇ／ｍＬ）とともに室温で５分間インキュベートした。次に、４６０
μＬの緩衝液ＢＬおよび５００μＬの無水エタノールを試料に添加した。結果として得ら
れた試料溶液をさらに使用するまで室温で保管した。

ＤＮＡ結合カラムを調製するために、１００μＬの平衡緩衝液をＭｉｃｒｏＥｌｕｔｅ
カラムに添加し、そのカラムを１０，０００ｘｇで３０秒間遠心分離した。上述の７００
μＬの試料溶液をＭｉｃｒｏＥｌｕｔｅカラムに移し、そのカラムを１０，０００ｘｇで
１分間遠心分離した。流体がＭｉｃｒｏＥｌｕｔｅカラムを完全に通過しなかった場合、
遠心分離ステップを繰り返した。残りの試料溶液をＭｉｃｒｏＥｌｕｔｅカラムに上述と
同一の方法で適用した。その後、ＭｉｃｒｏＥｌｕｔｅカラムを５００μＬの緩衝液ＨＢ
で処理し、１０，０００ｘｇで１分間遠心分離した。次に、エタノールで希釈した７００
μＬのＤＮＡ洗浄緩衝液をＭｉｃｒｏＥｌｕｔｅカラム内に添加し、そのカラムを１０，
０００ｘｇで１分間遠心分離した。ＭｉｃｒｏＥｌｕｔｅカラムをエタノールで希釈した
７００μＬのＤＮＡ洗浄緩衝液を用いて再度洗浄し、１０，０００ｘｇで１分間遠心分離
し、１３，０００ｘｇ超で３分間遠心分離して、カラムを乾燥させた。ＭｉｃｒｏＥｌｕ
ｔｅカラムを、蓋が取り外された状態の標準の１．５ｍＬの遠心分離管内に設置した。７
０℃に予熱した５０～７５μＬの溶出緩衝液をカラム内に添加し、室温で３分間インキュ
ベートした。そのカラムを回収管内で１３，０００ｘｇ超で１分間遠心分離した。７０℃
に予熱した別の５０～７５μＬの溶出緩衝液をＭｉｃｒｏＥｌｕｔｅカラム内に添加し、
室温で３分間インキュベートした。そのカラムを回収管内で１３，０００ｘｇ超で１分間
再度遠心分離した。全溶液を新鮮な１．５ｍＬの遠心分離管に移し、－２０℃で保管した
。

ＦＴＬ緩衝液、プロテイナーゼＫ、ＢＬ緩衝液、平衡緩衝液、ＭｉｃｒｏＥｌｕｔｅカ
ラム、緩衝液ＨＢ、ＤＮＡ洗浄緩衝液、および溶出緩衝液は、Ｅ．Ｚ．Ｎ．Ａ．（商標）
ＦＦＰＥＤＮＡキット（ＯＭＥＧＡｂｉｏ－ｔｅｋ，Ｎｏｒｃｒｏｓｓ，ＧＡ、カタ
ログ番号Ｄ３３９９－００、Ｄ３３９９－０１、およびＤ３３９９－０２）内に提供され
る。

核酸（例えば、ＤＮＡ）をホルムアルデヒドまたはパラホルムアルデヒド固定パラフィ
ン包埋（ＦＦＰＥ）組織から単離するさらなる方法が、例えば、ＣｒｏｎｉｎＭ．ｅｔ
ａｌ．，（２００４）ＡｍＪＰａｔｈｏｌ．１６４（１）：３５－４２、Ｍａｓｕ
ｄａＮ．ｅｔａｌ．，（１９９９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２７（２
２）：４４３６－４４４３、ＳｐｅｃｈｔＫ．ｅｔａｌ．，（２００１）ＡｍＪ
Ｐａｔｈｏｌ．１５８（２）：４１９－４２９、ＡｍｂｉｏｎＲｅｃｏｖｅｒＡｌｌ（
商標）全核酸単離プロトコル（Ａｍｂｉｏｎ、カタログ番号ＡＭ１９７５、２００８年９
月）、Ｍａｘｗｅｌｌ（登録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡ精製キット
技術マニュアル（Ｐｒｏｍｅｇａ、文献番号ＴＭ３４９、２０１１年２月）、およびＱＩ
Ａａｍｐ（登録商標）ＤＮＡＦＦＰＥ組織ハンドブック（Ｑｉａｇｅｎ、カタログ番号
３７６２５、２００７年１０月）に開示されている。ＲｅｃｏｖｅｒＡｌｌ（商標）全核
酸単離キットは、パラフィン包埋試料を可溶化するためにキシレンを高温で、かつ核酸を
捕捉するためにガラス繊維フィルタを使用する。Ｍａｘｗｅｌｌ（登録商標）１６ＦＦ
ＰＥＰｌｕｓＬＥＶＤＮＡ精製キットを、ＦＦＰＥ組織の１～１０μｍ切片のゲノム
ＤＮＡ精製のために、Ｍａｘｗｅｌｌ（登録商標）１６機器とともに使用する。ＤＮＡを
シリカクラッド常磁性粒子（ＰＭＰ）を用いて精製し、低溶出体積中に溶出される。ＱＩ
Ａａｍｐ（登録商標）ＤＮＡＦＦＰＥ組織キットは、ゲノムおよびミトコンドリアＤＮ
Ａの精製のために、ＱＩＡａｍｐ（登録商標）ＤＮＡマイクロ技術を使用する。
実施例２Ａ：ＤＮＡの剪断

循環冷却器を有するＣｏｖａｒｉｓ（商標）Ｅ２１０機器を４℃に設定した。その機器
の水槽に蒸留／脱イオン水を充填ラインのレベル「６」まで充填した。ＳｏｎｏＬａｂ（
商標）ソフトウェアを起動させ、指示されたときにシステムがホーミング配列を実行する
ことができた。機器の水槽内の水を少なくとも４５分間脱気した後に、試料を剪断した。

剪断用のゲノムＤＮＡ試料を調製するために、試料を最初にマイクロプレートリーダー
（ＳｐｅｃｔｒａｍａｘＭ２、分子デバイス）上のＰｉｃｏＧｒｅｅｎ（登録商標）ア
ッセイ（Ｉｎｖｉｔｒｏｇｅｎ）を用いて定量した。濃度に基づいて、低ＴＥ（１０ｍＭ
のＴｒｉｓ、０．２ｍＭのＥＤＴＡ、ｐＨ８．０）を有する１２０μＬの所望の入力ＤＮ
Ａ（２ｎｇ／μＬ）をこの実験に使用した。その１００μＬの個別の試料を管の蓋の隔壁
を通してＣｏｖａｒｉｓＭｉｃｒｏＴＵＢＥ（Ｃｏｖａｒｉｓ、カタログ番号５２００
４５）内にピペットで緩徐に移した。その後、ＣｏｖａｒｉｓＭｉｃｒｏＴＵＢＥをＣ
ｏｖａｒｉｓＥシリーズの管立てに設置した。２００ｂｐ剪断のために、設定は以下の
通りであった：負荷サイクル１０％、強度５、２００サイクル／バースト、１８０秒間、
および周波数掃引モード。剪断後、小型遠心分離機内の適切なアダプターを用いてＣｏｖ
ａｒｉｓＭｉｃｒｏＴＵＢＥを短期間沈降させ、剪断した試料をきれいな１．５ｍＬの
マイクロ遠心分離管に移した。それぞれの剪断したＤＮＡ試料をＱＩＡＧＥＮＭｉｎＥ
ｌｕｔｅ（登録商標）カラムを用いて精製した。簡潔に、５倍のＱＩＡＧＥＮＰＢＩ緩
衝液を１．５ｍＬのマイクロ遠心分離管内の試料に添加した（例えば、５００μＬのＰＢ
Ｉ緩衝液を１００μＬの試料に添加した）。それぞれの試料をボルテックスし、短期間沈
降させ、ＭｉｎＥｌｕｔｅスピンカラムに移した。ＭｉｎＥｌｕｔｅスピンカラムを１３
，０００ｒｐｍで１分間遠心分離し、流入物を廃棄した。７５０μＬのＱＩＡＧＥＮＰ
Ｅ緩衝液をそのカラムに添加し、１３，０００ｒｐｍで１分間遠心分離し、流入物を廃棄
した。スピンカラムを再度１３，０００ｒｐｍで１分間遠心分離し、きれいな１．５ｍＬ
のマイクロ遠心分離管に移した。そのカラムを２～３分間風乾させた。第１の溶出におい
て、１８μＬのＱＩＡＧＥＮ溶出緩衝液をそれぞれのカラムに添加し、２～３分間インキ
ュベートし、その後、１３，０００ｒｐｍで１分間遠心分離した。第２の溶出において、
１５μＬのＱＩＡＧＥＮ溶出緩衝液を添加し、１分間インキュベートし、その後、１３，
０００ｒｐｍで１分間遠心分離した。溶出物を回収し、スピンカラムを廃棄した。

典型的には、２００ｎｇはＤＮＡ剪断のために使用されるが、ＤＮＡの量は、２０～２
００ｎｇまたはそれ以上に及び得る。
実施例２Ｂ：ＤＮＡ剪断の代替案

本実施例は、実施例２ＡのＤＮＡ剪断の代替方法を説明する。

二本鎖ゲノムＤＮＡを最初に変性して一本鎖ＤＮＡとし、その後、プライマー、ＤＮＡ
ポリメラーゼ（例えば、エキソ－ＤＮＡポリメラーゼ）、ｄＮＴＰ、および少量のｄｄＮ
ＴＰと混合した。プライマー配列は、ランダム六量体、または５’末端においてアダプタ
ー配列でタグ付けされたランダム六量体であり得る。タグ付けされたランダム六量体増幅
を用いて微量のＤＮＡをクローニングおよび配列決定する方法は、例えば、ＷｏｎｇＫ
．Ｋ．ｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１９９６；２４（１９）：
３７７８－８３に記載されている。反応物をプライマー－鋳型アニーリングおよびＤＮＡ
合成を可能にする条件下でインキュベートする。ＤＮＡ合成は、ｄｄＮＴＰが新たに合成
された第１の鎖に組み込まれるときに終了する。合成された第１の鎖ＤＮＡの長さを、ｄ
ＮＴＰとｄｄＮＴＰの比率によって制御することができる。例えば、ｄＮＴＰとｄｄＮＴ
Ｐのモル比は、少なくとも約１０００：１、約５０００：１、または約１００００：１で
ある。第１の鎖の合成後、短い断片（短い長さおよびｄｄＮＴＰを有するプライマーおよ
び合成された第１の鎖ＤＮＡ等）を、寸法選択によって（例えば、寸法選択スピンカラム
を用いて）除去することができる。結果として得られた第１の鎖ＤＮＡを、プライマー（
例えば、ランダム六量体またはアダプター配列でタグ付けされたランダム六量体）、ＤＮ
Ａポリメラーゼ（例えば、エキソ＋ＤＮＡポリメラーゼ）、およびｄＮＴＰと混合する。
エキソ＋ＤＮＡポリメラーゼを用いて、３’末端ｄｄＮＴＰを第１の鎖ＤＮＡから除去す
るか、またはさらには第２のプライミング部位上に平滑末端を生成することができる。そ
の後、反応物をプライマー－鋳型アニーリングおよびＤＮＡ合成を可能にする条件下でイ
ンキュベートする。第２の鎖の合成後、結果として得られる二本鎖ＤＮＡ断片を精製し、
ライブラリ構築で直接使用することができる。あるいは、二本鎖ＤＮＡ断片を、アダプタ
ー配列を含有するプライマーを用いてＰＣＲ増幅することができる。これらのアダプター
配列が第１および第２の鎖合成のためにプライマーに含まれていた場合に、ＰＣＲ増幅用
のプライマーは、全配列および／またはバーコード配列も含み得る。

実施例３：ライブラリ調製
末端修復反応

末端修復試薬（ＮＥＢ番号Ｅ６０５０Ｌ）を解凍し、末端修復マスターミックスを氷上
で調製した。１つの試料につき７０μＬのマスターミックスを調製するために、５５μＬ
のヌクレアーゼを含まない水を１０μＬの１０倍の末端修復反応緩衝液および５μＬの末
端修復酵素ミックスと混合した。その後、７０μＬのマスターミックスを氷上の９６ウェ
ルＰＣＲプレート中の３０μＬのそれぞれ剪断されたＤＮＡ試料に添加した。反応物を熱
循環機内で２０℃で３０分間インキュベートした。それぞれの試料をＱＩＡＧＥＮＭｉ
ｎＥｌｕｔｅ（登録商標）カラムを用いて精製した。簡潔に、５倍のＱＩＡＧＥＮＰＢ
Ｉ緩衝液を、１．５ｍＬのマイクロ遠心分離管中の試料に添加した（例えば、５００μＬ
のＰＢＩ緩衝液を１００μＬの試料に添加した）。それぞれの試料をボルテックスし、短
期間沈降させ、ＭｉｎＥｌｕｔｅスピンカラムに移した。ＭｉｎＥｌｕｔｅスピンカラム
を１３，０００ｒｐｍで１分間遠心分離し、流入物を廃棄した。７５０μＬのＱＩＡＧＥ
ＮＰＥ緩衝液をそのカラムに添加し、１３，０００ｒｐｍで１分間遠心分離し、流入物
を廃棄した。スピンカラムを再度１３，０００ｒｐｍで１分間遠心分離し、きれいな１．
５ｍＬのマイクロ遠心分離管に移した。カラムを２～３分間風乾させた。第１の溶出にお
いて、２２μＬのＱＩＡＧＥＮ溶出緩衝液（１０ｍＭのＴｒｉｓ、ｐＨ８．５）をそれぞ
れのカラムに添加し、２～３分間インキュベートし、その後、１３，０００ｒｐｍで１分
間遠心分離した。第２の溶出において、２２μＬのＱＩＡＧＥＮ溶出緩衝液を添加し、１
分間インキュベートし、その後、１３，０００ｒｐｍで１分間遠心分離した。溶出物を回
収し、スピンカラムを廃棄した。
３’Ａ－塩基添加

Ａ－塩基添加試薬（ＮＥＢ番号Ｅ６０５３Ｌ）を氷上で解凍し、Ａ－塩基添加マスター
ミックスを氷上で調製した。１つの試料につき１０μＬのマスターミックスを調製するた
めに、２μＬのヌクレアーゼを含まない水を５μＬの１０倍のｄＡテーリング反応緩衝液
および３μＬのＫｌｅｎｏｗ断片（３’→５’のエキソ）と混合した。１０μＬのマスタ
ーミックスを氷上の９６ウェルＰＣＲプレート内の４０μＬのそれぞれ精製された末端修
復ＤＮＡ試料に添加した。反応物を熱循環機内で３７℃で３０分間インキュベートした。
それぞれの試料をＱＩＡＧＥＮＭｉｎＥｌｕｔｅ（登録商標）カラムを用いて精製した
。簡潔に、５倍のＱＩＡＧＥＮＰＢＩ緩衝液を１．５ｍＬのマイクロ遠心分離管中の試
料に添加した（例えば、２５０μＬのＰＢＩ緩衝液を５０μＬの試料に添加した）。それ
ぞれの試料をボルテックスし、短期間沈降させ、ＭｉｎＥｌｕｔｅスピンカラムに移した
。ＭｉｎＥｌｕｔｅスピンカラムを１３，０００ｒｐｍで１分間で遠心分離し、流入物を
廃棄した。７５０μＬのＱＩＡＧＥＮＰＥ緩衝液をそのカラムに添加し、１３，０００
ｒｐｍで１分間遠心分離し、流入物を廃棄した。スピンカラムを再度１３，０００ｒｐｍ
で１分間遠心分離し、きれいな１．５ｍＬのマイクロ遠心分離管に移した。カラムを２～
３分間風乾させた。第１の溶出において、１３μＬのＱＩＡＧＥＮ溶出緩衝液（１０ｍＭ
のＴｒｉｓ、ｐＨ８．５）をそれぞれのカラムに添加し、２～３分間インキュベートし、
その後、１３，０００ｒｐｍで１分間遠心分離した。第２の溶出において、１３μＬのＱ
ＩＡＧＥＮ溶出緩衝液を添加し、１分間インキュベートし、その後、１３，０００ｒｐｍ
で１分間遠心分離した。溶出物を回収し、スピンカラムを廃棄した。
マルチプレックスアダプターのライゲーション

ライゲーション試薬（ＮＥＢ番号Ｅ６０５６Ｌ）を解凍し、ライゲーションマスターミ
ックスを氷上で調製した。１つの試料につき３６μＬのマスターミックスを調製するため
に、１２μＬの５倍のＱｕｉｃｋライゲーション反応緩衝液を３．３μＬのＩｌｌｕｍｉ
ｎａマルチプレックスアダプター（１５ｕＭ、Ｉｌｌｕｍｉｎａ、カタログ番号ＰＥ－４
００－１００１に含まれる）に添加した（３．３μＬのアダプター／１μｇの出発入力Ｄ
ＮＡを使用した）。例えば、５００ｎｇの入力ＤＮＡの１つの試料に対し、アダプターを
最初に水（２μＬのアダプターおよび２μＬのＨ_２Ｏ）中に希釈し、その後、３．３μＬ
のこの希釈したアダプター混合物、１５．７μＬのヌクレアーゼを含まない水、および５
μＬのＱｕｉｃｋＴ４ＤＮＡリガーゼをライゲーション反応物に添加した。１μｇを
超える出発原料に対しては、３．３μＬを超えるアダプターを使用した。したがって、よ
り少ない水を添加して、希釈したアダプター混合物の全体積およびヌクレアーゼを含まな
い水を１９μＬで維持した。

３６μＬのマスターミックスおよびそれぞれ２４μＬのｄＡテーリングＤＮＡ試料を氷
上の９６ウェルＰＣＲプレートのウェルに添加した。反応物を熱循環機内で２５℃で３０
分間インキュベートした。それぞれの試料をＱＩＡＧＥＮＭｉｎＥｌｕｔｅ（登録商標
）カラムを用いて精製した。簡潔に、５倍のＱＩＡＧＥＮＰＢＩ緩衝液を１．５ｍＬの
マイクロ遠心分離管中の試料に添加した（例えば、３００μＬのＰＢＩ緩衝液を６０μＬ
の試料に添加した）。それぞれの試料をボルテックスし、短期間沈降させ、ＭｉｎＥｌｕ
ｔｅスピンカラムに移した。ＭｉｎＥｌｕｔｅスピンカラムを１３，０００ｒｐｍで１分
間遠心分離し、流入物を廃棄した。７５０μＬのＱＩＡＧＥＮＰＥ緩衝液をそのカラム
に添加し、１３，０００ｒｐｍで１分間遠心分離し、流入物を廃棄した。スピンカラムを
再度１３，０００ｒｐｍで１分間遠心分離し、きれいな１．５ｍＬのマイクロ遠心分離管
に移した。カラムを２～３分間風乾させた。第１の溶出において、２０μＬのＱＩＡＧＥ
Ｎ溶出緩衝液（１０ｍＭのＴｒｉｓ、ｐＨ８．５）をそれぞれのカラムに添加し、２～３
分間インキュベートし、その後、１３，０００ｒｐｍで１分間遠心分離した。第２の溶出
において、２０μＬのＱＩＡＧＥＮ溶出緩衝液を添加し、１分間インキュベートし、その
後、１３，０００ｒｐｍで１分間遠心分離した。溶出物を回収し、スピンカラムを廃棄し
た。
ＰＣＲ濃縮

ＰＣＲ試薬を解凍し、ＰＣＲマスターミックスを氷上で調製した。１つの試料につき６
２μＬのマスターミックスにおいて、５０μＬのＨＦ緩衝液を有する２倍のＰｈｕｓｉｏ
ｎ高忠実度マスターミックス（Ｆｉｎｎｚｙｍｅ、ＮＥＢカタログ番号Ｆ－５３１Ｓ）、
８μＬのヌクレアーゼを含まない水、２μＬのＩｌｌｕｍｉｎａプライマー１．０（２５
μＭ）、および２μＬのＩｌｌｕｍｉｎａプライマー２．０（０．５μＭ）を使用した。
その後、６２μＬのマスターミックスを、適切なバーコードを有する２μＬのＩｌｌｕｍ
ｉｎａインデックスプライマー（２５μＭ、Ｉｌｌｕｍｉｎａカタログ番号ＰＥ－４００
－１００１に含まれる）および３６μＬのライゲートされたＤＮＡ試料と９６ウェルＰＣ
Ｒプレート中で混合した。反応物を熱循環機内で以下のようにインキュベートした：
１サイクル９８℃ ３０秒間
１８サイクル９８℃ １０秒間
６５℃ ３０秒間
７２℃ ３０秒間
１サイクル７２℃ ５分間
４℃ 保持

それぞれのＰＣＲ反応物を、１．８倍の体積のＡＭＰｕｒｅＸＰビーズ（Ａｇｅｎｃｏ
ｕｒｔ、ＢｅｃｋｍａｎＣｏｕｌｔｅｒＧｅｎｏｍｉｃｓカタログ番号Ａ６３８８）
でサイズ選択した。簡潔に、１．８倍のＡＭＰｕｒｅＸＰビーズを１．５ｍＬのマイクロ
遠心分離管中の試料に添加し（例えば、１８０μＬのビーズを１００μＬの試料に添加し
）、ボルテックスし、転倒回転混合しながら５分間インキュベートした。溶液が透明にな
るまで（２分間）管を磁石スタンドに設置した。磁石上に捕捉されたビーズを乱さずに上
清を廃棄した。６００μＬの新たに作製された７０％エタノールをそのビーズに添加し、
１分間インキュベートし、その後、エタノールを除去した。第２の一定分量の６００μＬ
の新たに作製された７０％エタノールをそのビーズに添加し、１分間インキュベートし、
エタノールを除去した。管を磁石スタンドに１～２分間戻し、ビーズを再捕捉した。残り
のエタノールを除去し、ビーズを室温で５～１０分間風乾させた。３０μＬのＱＩＡＧＥ
Ｎ溶出緩衝液をそのビーズに添加し、ボルテックスし、２分間インキュベートした。溶液
が透明になるまで（２分間）管を磁石スタンドに戻して設置した。上清を新鮮な１．５ｍ
Ｌの管に移し、ビーズを廃棄した。Ｑ－ＰＣＲアッセイを用いて溶出したＤＮＡ試料を定
量化した。これらの定量化は、プールされたハイブリッド捕捉選択内のそれぞれのライブ
ラリの均等な表示を確保するために、等モルプーリングを可能にする。
実施例４：ハイブリッド選択
プールインデックス試料ライブラリ

Ｑ－ＰＣＲによってインデックスされ、精製され、かつ定量化されたライブラリのプー
ル（最大１２ｐｌｅｘ）を氷上で作製した。等モルプールを１．５ｍＬのマイクロ遠心分
離管内で調製し、それぞれの試料がハイブリッド選択プロセスで均等に表されることを確
実にした。これらのプールのそれぞれの全入力ＤＮＡは、２０００ｎｇ～５００ｎｇに及
び得る。典型的には、全入力ＤＮＡは、２０００ｎｇである。したがって、１２個の試料
がプールされる場合、それぞれ１６６．６７ｎｇをプールして、合計２０００ｎｇにする
ことができる。２０００ｎｇのライブラリプールの最終量は、４μＬであるはずである。
インデックスされたライブラリの異なる濃度により、より大量のプールを作製することが
できるが、そのプールを（低熱を用いた）ＳｐｅｅｄＶａｃによって乾燥させ、４μＬの
ヌクレアーゼを含まない水中で再構成するべきである。

ライブラリ構築の収率が大きいほど、ライブラリの複雑さが増す。
プールされたＤＮＡライブラリをビオチン化ＲＮＡベイトにハイブリダイズする

ＡｇｉｌｅｎｔのＳｕｒｅＳｅｌｅｃｔ標的濃縮対合末端キット（番号Ｇ３３６０Ａ－
Ｊ）をこの実験で使用した。ハイブリダイゼーション緩衝液３番、ＳｕｒｅＳｅｌｅｃｔ
ブロック１番、ＳｕｒｅＳｅｌｅｃｔブロック２番、対合末端プライマー１．０ブロック
、インデックスプライマー１－１２ブロック、ＲＮＡｅブロック、およびビオチン化され
たＲＮＡベイトを氷上で解凍した。以下のマスターミックスを調製した。
ａ．ハイブリダイゼーション緩衝混合液（１反応当たり１３μＬ）：
ｉ．ハイブリダイゼーション緩衝液１番（Ａｇｉｌｅｎｔ）－２５μＬ
ｉｉ．ハイブリダイゼーション緩衝液２番（Ａｇｉｌｅｎｔ）－１μＬ
ｉｉｉ．ハイブリダイゼーション緩衝液３番（Ａｇｉｌｅｎｔ）－１０μＬ
ｉｖ．ハイブリダイゼーション緩衝液４番（Ａｇｉｌｅｎｔ）－１３μＬ
ｂ．ブロッキング混合物（１反応当たり８μＬ）：
ｉ．ＳｕｒｅＳｅｌｅｃｔブロック１番（Ａｇｉｌｅｎｔ）－２．５μＬ
ｉｉ．ＳｕｒｅＳｅｌｅｃｔブロック２番（Ａｇｉｌｅｎｔ）－２．５μＬ
ｉｉｉ．対合末端プライマー１．０ブロック（ＩＤＴ、Ｈ_２Ｏで２００ｕＭに再懸濁
した）－１．５μＬ
ｉｖ．インデックスプライマー１－１２ブロック（ＩＤＴ、Ｈ_２Ｏで２００ｕＭに再
懸濁した）－１．５μＬ
ｃ．ＲＮａｓｅブロックの希釈
ｉ．３Ｍｂ未満のテリトリーを有するカスタムビオチン化ＲＮＡベイトの場合：１μ
ＬのＲＮａｓｅブロック（Ａｇｉｌｅｎｔ）を９μＬの水中に希釈した。
ｉｉ．３Ｍｂを超えるベイトテリトリーを有するカスタムベイトの場合：１μＬのＲ
Ｎａｓｅブロックを３μＬの水中に希釈した（７ｕＬの捕捉反応につき依然として０．５
μＬのＲＮａｓｅブロック）
ｄ．ベイト混合物：（１反応当たり７μＬ）
ｉ．ＲＮＡベイト－２μＬ（３Ｍｂを超えるベイトテリトリーを有するベイトの場合
、５μＬのベイトを使用した）
ｉｉ．希釈されたＲＮａｓｅブロック－５μＬ（３Ｍｂを超えるベイトテリトリーを
有するベイトの場合、上述のように希釈された２μＬのＲＮａｓｅブロックを使用した）

ハイブリダイゼーション緩衝混合液、ブロッキング混合物、およびベイト混合物（複数
を含む）を調製した時点で、ハイブリダイゼーション緩衝混合液をボルテックスし、沈降
させ、６５℃になるまで熱ブロック内で加熱した。ハイブリッド選択される４μＬのそれ
ぞれプールされた試料ライブラリを８μＬのブロッキング混合物と９６ウェルＰＣＲプレ
ート中で混合した。反応物を熱循環機内で９５℃で５分間インキュベートし、その後、６
５℃で保持した。プールされた試料ライブラリ／ブロッキング混合物を９５℃で５分間、
その後、６５℃で２．５分間インキュベートしているときに、ベイト混合物（＝ベイト／
ＲＮＡｅブロック混合物）を熱ブロック内に６５℃で２．５分間入れた。ハイブリダイゼ
ーション緩衝液含有管を急速に沈降させ、その後、即座に６５℃の熱ブロックに戻した。
９６ウェルプレートを６５℃の熱循環機内に残したまま、１３μＬの加熱したハイブリダ
イゼーション緩衝混合液をピペットでそれぞれの試料ライブラリ／ブロック混合物に移し
た。ベイト混合物を６５℃で２．５分間インキュベートした時点で、９６ウェルプレート
を６５℃の熱循環機内に残したまま、７μＬのベイト混合物をそれぞれの試料ライブラリ
／ブロック／ハイブリダイゼーション緩衝混合液に添加した。反応物（全体積は３２μＬ
であった）を熱循環機内で６５℃で２４時間インキュベートした。
磁気ビーズの調製

ＳｕｒｅＳｅｌｅｃｔ洗浄緩衝液２番を熱ブロック内で６５℃で予温した。Ｄｙｎａｌ
ＭｙＯｎｅストレプトアビジンＴ１ビーズ（Ｉｎｖｉｔｒｏｇｅｎ）をボルテックスし
、再懸濁させた。ビーズを、５０μＬのＤｙｎａｌビーズにつき２００μＬのＳｕｒｅＳ
ｅｌｅｃｔ結合緩衝液を添加することによって洗浄した（例えば、３００μＬのＤｙｎａ
ｌビーズを調製するのに１２００μＬのＳｕｒｅＳｅｌｅｃｔ結合緩衝液を使用した）。
ビーズを５秒間ボルテックスし、短期間沈降させた。ビーズを約１５秒間、またはすべて
のビーズが捕捉されるまで磁石スタンドに設置した。上清を除去し、廃棄した。Ｓｕｒｅ
Ｓｅｌｅｃｔ結合緩衝液での洗浄をもう２回繰り返し、合計３回洗浄した。洗浄後、ビー
ズを５０μＬのＤｙｎａｌビーズにつき２００μＬのＳｕｒｅＳｅｌｅｃｔ結合緩衝液中
に再懸濁させた（例えば、３００μＬのＤｙｎａｌビーズを調製するのに１２００μＬの
ＳｕｒｅＳｅｌｅｃｔ結合緩衝液を使用した）。再懸濁したビーズをボルテックスし、短
期間沈降させた。２００μＬの再懸濁したビーズを個別の１．５ｍＬのマイクロ遠心分離
管に分注した。
ハイブリッド捕捉ＤＮＡの選択

２４時間インキュベートした後、６５℃の熱循環機内のＰＣＲプレートのそれぞれのハ
イブリダイズした試料を室温の２００μＬの調製したビーズを含有する管にピペットで迅
速に移した。試料およびビーズの混合物を５秒間ボルテックスし、室温で３０分間、ロー
テータ上でインキュベートし、適切な混合を確保した。その後、管を急速に沈降させた。
ビーズを磁石上に捕捉し（２分間）、上清を除去し、廃棄した。ビーズを低ストリンジェ
ンシー洗浄のために５００μＬのＳｕｒｅＳｅｌｅｃｔ洗浄緩衝液１番中に再懸濁させた
。試料を５秒間ボルテックスし、室温で１５分間インキュベートし、磁石から外した。試
料を３～５分間おきに５秒間ボルテックスした。管を急速に沈降させた。その後、ビーズ
を磁石スタンド上で２分間捕捉し、上清を除去し、廃棄した。高ストリンジェンシー洗浄
で的外れの物質を除去するために、ビーズをＳｕｒｅＳｅｌｅｃｔ洗浄緩衝液２番で洗浄
し、６５℃に予熱した。簡潔に、ビーズを５００μＬの予め加温したＳｕｒｅＳｅｌｅｃ
ｔ洗浄緩衝液２番中に再懸濁させ、ボルテクサー上で５秒間混合し、ビーズを再懸濁した
。ビーズを遠心分離機内で短期間沈降させ、時々室温で５秒間ボルテックス混合しながら
６５℃で１０分間、熱ブロック内でインキュベートした。その後、ビーズを遠心分離機内
で短期間沈降させ、磁石上に２分間捕捉した。６５℃に予め加温したＳｕｒｅＳｅｌｅｃ
ｔ洗浄緩衝液２番での洗浄をさらに２回繰り返し、合計３回洗浄した。その後、洗浄緩衝
液を完全に除去し、５０μＬのＳｕｒｅＳｅｌｅｃｔ溶出緩衝液をビーズに添加し、続い
て５秒間ボルテックスしてビーズを混合した。時々５秒間ボルテックス混合しながら、試
料を室温で１０分間インキュベートした。ビーズを遠心分離機内で短期間沈降させ、磁石
スタンド上で捕捉した。捕捉ＤＮＡを含有する上清を新しい１．５ｍＬのマイクロ遠心分
離管にピペットで移した。５０μＬのＳｕｒｅＳｅｌｅｃｔ中和緩衝液を捕捉ＤＮＡに添
加した。試料を５秒間ボルテックスし、遠心分離機内で短期間沈降させ、１．８倍量のＡ
ＭＰｕｒｅＸＰビーズを用いて精製した。ＤＮＡを４０μＬのヌクレアーゼを含まない水
中に溶出した。
捕捉ＤＮＡのＰＣＲ濃縮

ＰＣＲ試薬を解凍し、ＰＣＲマスターミックスを氷上で調製した。１つの試料につき６
０μＬのマスターミックスにおいて、ＨＦ緩衝液（ＮＥＢ番号Ｆ－５３１Ｓ）を有する５
０μＬの２倍のＰｈｕｓｉｏｎ高忠実度マスターミックスを、８μＬのヌクレアーゼを含
まない水、１μＬのＱＰＣＲプライマー１．１（Ｈ_２Ｏ中１００μＭ）、および１μＬの
ＱＰＣＲプライマー２．１（Ｈ_２Ｏ中１００μＭ）と混合した。Ｑ－ＰＣＲのプライマー
配列は、以下の通りである。
ＱＰＣＲプライマー１．１（ＩＤＴからＨＰＬＣ精製した）：
５’ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡＧＡＴ３’（配列番号４８）
ＱＰＣＲプライマー２．１（ＩＤＴからＨＰＬＣ精製した）：
５’ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡ３’（配列番号４９）
６０μＬのマスターミックスを９６ウェルＰＣＲプレート中の４０μＬのそれぞれ精製
した捕捉ＤＮＡ試料に添加した。反応物を以下のように熱循環機内でインキュベートした
：
１サイクル９８℃ ３０秒間
１２サイクル９８℃ １０秒間
６５℃ ３０秒間
７２℃ ３０秒間
１サイクル７２℃ ５分間
４℃ 保持

それぞれの１００μＬのＰＣＲ反応物を１．８倍量のＡＭＰｕｒｅＸＰビーズで精製し
、３５μＬの溶出緩衝液（１０ｍＭのＴｒｉｓ、ｐＨ８．５）中に溶出した。ハイブリッ
ド選択／捕捉ＤＮＡ試料をＱ－ＰＣＲアッセイを用いて定量化した。Ｑ－ＰＣＲアッセイ
は、末端アダプターを検出し、読み取りは、適切なクラスター密度を得るためにどれだけ
のそれぞれの試料が配列決定フローセル上に装填されるべきかを示した。
実施例５：方法

以下は、実施例に従って変化を特定するために使用されるある特定の方法の実施形態お
よび実験条件を例示する。さらなる転座スクリーニングを、例えば、事前選択された腫瘍
試料から調製されたｃＤＮＡのｑＲＴ－ＰＣＲ分析のいずれかを用いて行うことができる
。

大規模並列ＤＮＡ配列決定を、アーカイブした固定パラフィン包埋組織から単離された
ＤＮＡを用いてハイブリダイゼーションで捕捉したアダプターライゲーションベースのラ
イブラリ上で行った。分析ツールの組み合わせを用いてデータを分析し、ＤＮＡ変化呼び
出しを割り当てた。さらなる転座スクリーニングを、冷凍腫瘍から調製されたｃＤＮＡの
ｑＲＴ－ＰＣＲ分析またはアーカイブしたＦＦＰＥ検体のＩＨＣ評価のいずれかを用いて
行った。ＦＦＰＥ組織から単離されたＲＮＡを用いて両方の新規の転座の発現を確認する
ために大規模並列ｃＤＮＡ配列決定を行った。血液由来の適合した正常な参照ゲノムＤＮ
ＡをインデックスＮＳＣＬＣ患者のために配列決定して、再編成の体細胞起源を確認した
。
ゲノムＤＮＡ配列決定

１４５個の癌遺伝子の２５７４個のエクソンの配列決定をアーカイブしたホルマリン固
定パラフィン包理（ＦＦＰＥ）腫瘍検体由来のＤＮＡを用いて行い、２４個はＮＳＣＬＣ
患者由来であった。配列決定ライブラリをゲノムＤＮＡを用いたアダプターライゲーショ
ン方法によって構築し、最適化ＲＮＡハイブリダイゼーション捕捉プローブ（Ａｇｉｌｅ
ｎｔのＳｕｒｅＳｅｌｅｃｔカスタムキット）でのハイブリダイゼーション選択が続いた
。２５３倍の平均深度に対して３６×３６の対合読み取りを用いて、配列決定をＨｉＳｅ
ｑ２０００機器（Ｉｌｌｕｍｉｎａ）上で行った。腫瘍組織からの変異呼び出しのために
最適化されたツールの組み合わせを用いて、塩基置換、インデル、コピー数変化、および
ゲノム再編成のデータ処理ならびに変異割り当てを行った。
ｃＤＮＡ配列決定

ＲｏｃｈｅＨｉｇｈＰｕｒｅキットを用いて単一の５～１０ｕｍのＦＦＰＥ組織切
片から抽出される全ＲＮＡからｃＤＮＡを生成し、ＳｕｐｅｒＳｃｒｉｐｔ（登録商標）
ＩＩＩ第１鎖合成システム（Ｉｎｖｉｔｒｏｇｅｎ）を用いてランダム六量体プライマー
でｃＤＮＡに逆転写した。二本鎖ｃＤＮＡをＮＥＢＮｅｘｔ（登録商標）ｍＲＮ第２鎖合
成モジュール（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）で作製し、ＦＦＰＥＤＮＡ
試料に関して、ライブラリ構築への入力、ハイブリッド捕捉、および配列決定として使用
した。分析ツールの組み合わせを用いて発現レベルの分析を行った。
実施例６：マルチプレックス分析用の例となる選択された遺伝子およびバリアント

この実施例は、マルチプレックス分析のために遺伝子、バリアント、および癌型の選択
を概要する４つの例となる表を提供する。

実用能カテゴリーは、下記のように分類される。表１Ｂは、異なる癌型の例となる変化へ
の異なるカテゴリーの適用の概要を提供する。

カテゴリーＡ：承認された／標準の治療に対する感度または抵抗を予測する承認された／
標準の変化
転移性結腸癌におけるＫＲＡＳＧ１３Ｄ
乳癌におけるＥＲＢＢ２増幅
非小細胞肺癌におけるＥＧＦＲＬ８５８Ｒ
カテゴリーＢ：特定の実験的治療の対象基準または除外基準である変化
結腸癌、肺癌、または乳癌におけるＫＲＡＳＧ１３Ｄ
黒色腫、結腸癌、または肺癌におけるＢＲＡＦＶ６００Ｅ
黒色腫におけるＮＲＡＳＱ６１Ｋ
乳癌におけるＰＩＫ３ＣＡＨ１０４７Ｒ
乳癌におけるＦＧＦＲ１増幅
乳癌におけるＰＴＥＮ両アレル不活性化
乳癌または膵臓癌におけるＢＲＣＡ１両アレル不活性化
カテゴリーＣ：標準治療もしくは実験的治療に対する感度または抵抗を予測する限られた
証拠（早期臨床データ、相反する臨床データ、臨床前データ、理論的データ）を有する変
化
結腸癌におけるＫＲＡＳＱ６１Ｈ（早期臨床）
乳癌におけるＰＩＫ３ＣＡＨ１０４７Ｒ（相反する臨床）
結腸癌におけるＢＲＡＦＶ６００Ｅ（相反する臨床）
肺癌におけるＥＲＢＢ２変異または増幅（ケース報告）
肺癌におけるＢＲＡＦＤ５９４Ｇ（臨床前）
乳癌におけるＦＧＦＲ１増幅（臨床前）
乳癌におけるＡＴＭ両アレル不活性化（臨床前）
結腸癌におけるＴＳＣ１両アレル不活性化（臨床前）
乳癌におけるＡＴＲ二対立遺伝子不活性化（理論的）
肉腫におけるＢＲＡＦＶ６００Ｅ変異（理論的）
カテゴリーＤ：特定の癌のサブタイプの予後または診断的有用性を有する変化
結腸癌におけるＭＳＨ２両アレル不活性化（強力な臨床的証拠）
結腸癌におけるＢＲＡＦＶ６００Ｅ（強力な臨床的証拠）
肺癌におけるＫＲＡＳＧ１３Ｄ（強力な臨床的証拠）
乳癌におけるＢＲＣＡ１不活性化（強力な臨床的証拠）
カテゴリーＥ：明確な臨床的意義を有しない、癌における明確な生物学的意義を有する変
化（すなわち、ドライバ変異）
結腸癌におけるＡＰＣ両アレル不活性化
乳癌におけるＴＰ５３両アレル不活性化
黒色腫におけるＭＩＴＦ増幅
卵巣癌におけるＡＲＩＤ１Ａ
カテゴリーＦ：癌における既知の生物学的意義を有しない変化
既知の癌遺伝子における新規の変化
治療の標的
既知の癌遺伝子のオルソログ

実施例７：ハイブリッド捕捉のための例となるベイト配列

表７は、例となるベイトを３つの標的：ＳＭＡＤ３＿標的＿１０、ＳＭＡＤ３＿標的＿
１１、ＳＭＡＤ３＿標的＿１２に提供する。
表７：例となるベイト
１．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１０染色体１５：６７４７７０１３～６７４７７１３
２
ＣＣＡＴＴＧＴＧＴＧＴＧＡＧＣＡＡＡＧＧＣＡＣＣＣＴＧＴＣＣＡＧＴＣＴＡＡＣＣＴ
ＧＡＡＴＣＴＣＴＧＴＡＧＧＡＡＧＡＧＧＣＧＴＧＣＧＧＣＴＣＴＡＣＴＡＣＡＴＣＧＧ
ＡＧＧＧＧＡＧＧＴＣＴＴＣＧＣＡＧＡＧＴＧＣＣＴＣＡＧＴＧＡＣＡＧＣＧＣＴＡＴＴ
（配列番号６）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１０．２）
２．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１０染色体１５：６７４７７０３７～６７４７７１５
６
ＣＴＧＴＣＣＡＧＴＣＴＡＡＣＣＴＧＡＡＴＣＴＣＴＧＴＡＧＧＡＡＧＡＧＧＣＧＴＧＣ
ＧＧＣＴＣＴＡＣＴＡＣＡＴＣＧＧＡＧＧＧＧＡＧＧＴＣＴＴＣＧＣＡＧＡＧＴＧＣＣＴ
ＣＡＧＴＧＡＣＡＧＣＧＣＴＡＴＴＴＴＴＧＴＣＣＡＧＴＣＴＣＣＣＡＡＣＴＧＴＡＡＣ
（配列番号７）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１０．４）
３．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１０染色体１５：６７４７７０６１～６７４７７１８
０
ＧＴＡＧＧＡＡＧＡＧＧＣＧＴＧＣＧＧＣＴＣＴＡＣＴＡＣＡＴＣＧＧＡＧＧＧＧＡＧＧ
ＴＣＴＴＣＧＣＡＧＡＧＴＧＣＣＴＣＡＧＴＧＡＣＡＧＣＧＣＴＡＴＴＴＴＴＧＴＣＣＡ
ＧＴＣＴＣＣＣＡＡＣＴＧＴＡＡＣＣＡＧＣＧＣＴＡＴＧＧＣＴＧＧＣＡＣＣＣＧＧＣＣ
（配列番号８）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１０．６）
４．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１０染色体１５：６７４７７０８５～６７４７７２０
４
ＴＡＣＡＴＣＧＧＡＧＧＧＧＡＧＧＴＣＴＴＣＧＣＡＧＡＧＴＧＣＣＴＣＡＧＴＧＡＣＡ
ＧＣＧＣＴＡＴＴＴＴＴＧＴＣＣＡＧＴＣＴＣＣＣＡＡＣＴＧＴＡＡＣＣＡＧＣＧＣＴＡ
ＴＧＧＣＴＧＧＣＡＣＣＣＧＧＣＣＡＣＣＧＴＣＴＧＣＡＡＧＡＴＣＣＣＡＣＣＡＧＧＴ
（配列番号９）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１０．１）
５．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１０染色体１５：６７４７７１０９～６７４７７２２
８
ＧＡＧＴＧＣＣＴＣＡＧＴＧＡＣＡＧＣＧＣＴＡＴＴＴＴＴＧＴＣＣＡＧＴＣＴＣＣＣＡ
ＡＣＴＧＴＡＡＣＣＡＧＣＧＣＴＡＴＧＧＣＴＧＧＣＡＣＣＣＧＧＣＣＡＣＣＧＴＣＴＧ
ＣＡＡＧＡＴＣＣＣＡＣＣＡＧＧＴＡＡＡＣＧＡＧＣＣＧＣＡＣＡＧＧＣＡＣＣＣＣＴＧ
（配列番号１０）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１０．５）
６．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１０染色体１５：６７４７７１３３～６７４７７２５
２
ＴＴＴＧＴＣＣＡＧＴＣＴＣＣＣＡＡＣＴＧＴＡＡＣＣＡＧＣＧＣＴＡＴＧＧＣＴＧＧＣ
ＡＣＣＣＧＧＣＣＡＣＣＧＴＣＴＧＣＡＡＧＡＴＣＣＣＡＣＣＡＧＧＴＡＡＡＣＧＡＧＣ
ＣＧＣＡＣＡＧＧＣＡＣＣＣＣＴＧＣＣＴＴＧＡＧＧＴＣＣＣＴＣＴＣＣＧＡＧＴＧＣＡ
（配列番号１１）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１０．３）
７．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１１染色体１５：６７４７９６５５～６７４７９７７
４
ＧＡＣＣＴＧＧＣＣＡＣＴＴＣＣＡＴＣＣＣＣＡＣＡＧＣＣＣＴＧＴＴＴＣＴＧＴＧＴＴ
ＴＴＴＧＧＣＡＧＧＡＴＧＣＡＡＣＣＴＧＡＡＧＡＴＣＴＴＣＡＡＣＡＡＣＣＡＧＧＡＧ
ＴＴＣＧＣＴＧＣＣＣＴＣＣＴＧＧＣＣＣＡＧＴＣＧＧＴＣＡＡＣＣＡＧＧＧＣＴＴＴＧ
（配列番号１２）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１１．１）
８．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１１染色体１５：６７４７９６７９～６７４７９７９
８
ＧＣＣＣＴＧＴＴＴＣＴＧＴＧＴＴＴＴＴＧＧＣＡＧＧＡＴＧＣＡＡＣＣＴＧＡＡＧＡＴ
ＣＴＴＣＡＡＣＡＡＣＣＡＧＧＡＧＴＴＣＧＣＴＧＣＣＣＴＣＣＴＧＧＣＣＣＡＧＴＣＧ
ＧＴＣＡＡＣＣＡＧＧＧＣＴＴＴＧＡＧＧＣＴＧＴＣＴＡＣＣＡＧＴＴＧＡＣＣＣＧＡＡ
（配列番号１３）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１１．５）
９．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１１染色体１５：６７４７９７０３～６７４７９８２
２
ＧＡＴＧＣＡＡＣＣＴＧＡＡＧＡＴＣＴＴＣＡＡＣＡＡＣＣＡＧＧＡＧＴＴＣＧＣＴＧＣ
ＣＣＴＣＣＴＧＧＣＣＣＡＧＴＣＧＧＴＣＡＡＣＣＡＧＧＧＣＴＴＴＧＡＧＧＣＴＧＴＣ
ＴＡＣＣＡＧＴＴＧＡＣＣＣＧＡＡＴＧＴＧＣＡＣＣＡＴＣＣＧＣＡＴＧＡＧＣＴＴＣＧ
（配列番号１４）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１１．３）
１０．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１１染色体１５：６７４７９７２７～６７４７９８４
６
ＡＣＣＡＧＧＡＧＴＴＣＧＣＴＧＣＣＣＴＣＣＴＧＧＣＣＣＡＧＴＣＧＧＴＣＡＡＣＣＡ
ＧＧＧＣＴＴＴＧＡＧＧＣＴＧＴＣＴＡＣＣＡＧＴＴＧＡＣＣＣＧＡＡＴＧＴＧＣＡＣＣ
ＡＴＣＣＧＣＡＴＧＡＧＣＴＴＣＧＴＣＡＡＡＧＧＣＴＧＧＧＧＡＧＣＧＧＡＧＴＡＣＡ
（配列番号１５）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１１．４）
１１．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１１染色体１５：６７４７９７５１～６７４７９８７
０
ＣＣＣＡＧＴＣＧＧＴＣＡＡＣＣＡＧＧＧＣＴＴＴＧＡＧＧＣＴＧＴＣＴＡＣＣＡＧＴＴ
ＧＡＣＣＣＧＡＡＴＧＴＧＣＡＣＣＡＴＣＣＧＣＡＴＧＡＧＣＴＴＣＧＴＣＡＡＡＧＧＣ
ＴＧＧＧＧＡＧＣＧＧＡＧＴＡＣＡＧＧＴＣＡＧＴＴＡＴＧＧＧＴＧＣＴＧＣＣＴＡＣＡ
（配列番号１６）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１１．２）
１２．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１１染色体１５：６７４７９７７５～６７４７９８９
４
ＡＧＧＣＴＧＴＣＴＡＣＣＡＧＴＴＧＡＣＣＣＧＡＡＴＧＴＧＣＡＣＣＡＴＣＣＧＣＡＴ
ＧＡＧＣＴＴＣＧＴＣＡＡＡＧＧＣＴＧＧＧＧＡＧＣＧＧＡＧＴＡＣＡＧＧＴＣＡＧＴＴ
ＡＴＧＧＧＴＧＣＴＧＣＣＴＡＣＡＴＣＡＧＧＧＧＡＣＣＣＡＡＣＴＣＣＡＧＧＴＧＡＣ
（配列番号１７）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１１．６）
１３．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１２染色体１５：６７４８２６９２～６７４８２８１
１
ＴＧＴＡＡＣＣＣＣＣＴＧＧＡＧＡＴＴＴＴＴＴＡＡＧＴＣＣＣＣＣＡＣＣＣＣＡＣＣＣ
ＣＴＴＴＣＣＣＴＡＴＴＴＣＴＴＡＣＡＧＧＡＧＡＣＡＧＡＣＴＧＴＧＡＣＣＡＧＴＡＣ
ＣＣＣＣＴＧＣＴＧＧＡＴＴＧＡＧＣＴＧＣＡＣＣＴＧＡＡＴＧＧＧＣＣＴＴＴＧＣＡＧ
（配列番号１８）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１２．５）
１４．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１２染色体１５：６７４８２７１６～６７４８２８３
５
ＧＴＣＣＣＣＣＡＣＣＣＣＡＣＣＣＣＴＴＴＣＣＣＴＡＴＴＴＣＴＴＡＣＡＧＧＡＧＡＣ
ＡＧＡＣＴＧＴＧＡＣＣＡＧＴＡＣＣＣＣＣＴＧＣＴＧＧＡＴＴＧＡＧＣＴＧＣＡＣＣＴ
ＧＡＡＴＧＧＧＣＣＴＴＴＧＣＡＧＴＧＧＣＴＴＧＡＣＡＡＧＧＴＣＣＴＣＡＣＣＣＡＧ
（配列番号１９）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１２．３）
１５．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１２染色体１５：６７４８２７４０～６７４８２８５
９
ＡＴＴＴＣＴＴＡＣＡＧＧＡＧＡＣＡＧＡＣＴＧＴＧＡＣＣＡＧＴＡＣＣＣＣＣＴＧＣＴ
ＧＧＡＴＴＧＡＧＣＴＧＣＡＣＣＴＧＡＡＴＧＧＧＣＣＴＴＴＧＣＡＧＴＧＧＣＴＴＧＡ
ＣＡＡＧＧＴＣＣＴＣＡＣＣＣＡＧＡＴＧＧＧＣＴＣＣＣＣＡＡＧＣＡＴＣＣＧＣＴＧＴ
（配列番号２０）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１２．２）
１６．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１２染色体１５：６７４８２７６４～６７４８２８８
３
ＡＣＣＡＧＴＡＣＣＣＣＣＴＧＣＴＧＧＡＴＴＧＡＧＣＴＧＣＡＣＣＴＧＡＡＴＧＧＧＣ
ＣＴＴＴＧＣＡＧＴＧＧＣＴＴＧＡＣＡＡＧＧＴＣＣＴＣＡＣＣＣＡＧＡＴＧＧＧＣＴＣ
ＣＣＣＡＡＧＣＡＴＣＣＧＣＴＧＴＴＣＣＡＧＴＧＴＧＴＣＴＴＡＧＡＧＡＣＡＴＣＡＡ
（配列番号２１）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１２．４）
１７．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１２染色体１５：６７４８２７８８～６７４８２９０
７
ＣＴＧＣＡＣＣＴＧＡＡＴＧＧＧＣＣＴＴＴＧＣＡＧＴＧＧＣＴＴＧＡＣＡＡＧＧＴＣＣ
ＴＣＡＣＣＣＡＧＡＴＧＧＧＣＴＣＣＣＣＡＡＧＣＡＴＣＣＧＣＴＧＴＴＣＣＡＧＴＧＴ
ＧＴＣＴＴＡＧＡＧＡＣＡＴＣＡＡＧＴＡＴＧＧＴＡＧＧＧＧＡＧＧＧＣＡＧＧＣＴＴＧ
（配列番号２２）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１２．６）
１８．遺伝子標的ベイトゲノム位置
ＳＭＡＤ３ＳＭＡＤ３＿標的＿１２染色体１５：６７４８２８１２～６７４８２９３
１
ＴＧＧＣＴＴＧＡＣＡＡＧＧＴＣＣＴＣＡＣＣＣＡＧＡＴＧＧＧＣＴＣＣＣＣＡＡＧＣＡ
ＴＣＣＧＣＴＧＴＴＣＣＡＧＴＧＴＧＴＣＴＴＡＧＡＧＡＣＡＴＣＡＡＧＴＡＴＧＧＴＡ
ＧＧＧＧＡＧＧＧＣＡＧＧＣＴＴＧＧＧＧＡＡＡＡＴＧＧＣＣＡＴＧＣＡＧＧＡＧＧＴＧ
（配列番号２３）
（ベイトＩＤ：ＳＭＡＤ３＿標的＿１２．１）

表８は、配列を有するベイトを２つの標的：二次構造を減少させるように修飾されたＦ
ＬＴ３＿標的＿２４、より短いベイトに効果的に類似したベイトの両末端上にいくつかの
任意の配列を有するＦＬＴ４＿標的＿３１に提供する。両方ともに対象範囲を約４倍改善
した（約４倍の対象範囲改善）。
表８：例となるベイト
１．遺伝子標的ベイトゲノム位置
ＦＬＴ３ＦＬＴ３＿標的＿２４染色体１３：２８６７４６２６～２８６７４７４５
元の配列
ＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣＣＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡＧＣＣＣＧＧＧＧ
ＴＣＣＣＣＡＧＧＣＣＧＣＧＣＣＧＧＣＣＣＡＧＣＣＣＴＧＣＧＡＴＧＣＣＧＣＣＴＧＧ
ＡＧＣＧＧＣＧＣＧＣＣＴＣＧＣＧＣＴＧＣＡＧＧＴＧＧＣＴＣＴＣＴＴＡＡＧＧＡＴＧ
（配列番号２４）
修飾された配列
ＣＧＴＣＴＣＡＣＧＣＣＡＡＣＧＣＡＡＧＣＡＴＧＴＣＣＴＣＣＧＧＡＧＣＣＣＧＧＧＧ
ＴＣＣＣＣＡＧＧＣＣＧＣＧＣＣＧＧＣＣＣＡＧＣＣＣＴＧＣＧＡＴＧＣＣＧＣＣＴＧＧ
ＡＧＣＧＧＣＧＣＧＣＣＴＣＧＣＡＣＴＧＣＡＧＡＴＧＧＣＴＣＴＣＴＴＡＡＧＧＡＴＧ
（配列番号２５）
（ベイトＩＤ：ＦＬＴ３＿標的＿２４．１）
２．遺伝子標的ベイトゲノム位置
ＦＬＴ３ＦＬＴ３＿標的＿２４染色体１３：２８６７４６０２～２８６７４７２１
元の配列
ＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＧＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣ
ＣＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡＧＣＣＣＧＧＧＧＴＣＣＣＣＡＧＧＣＣＧＣＧＣＣＧ
ＧＣＣＣＡＧＣＣＣＴＧＣＧＡＴＧＣＣＧＣＣＴＧＧＡＧＣＧＧＣＧＣＧＣＣＴＣＧＣＧ
（配列番号２６）
修飾された配列
ＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＧＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣ
ＣＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡＧＣＣＣＧＧＧＧＴＣＣＣＣＡＧＧＣＣＧＣＧＣＡＴ
ＧＣＣＣＡＧＣＣＣＴＧＣＧＡＴＧＣＣＧＣＣＴＴＧＡＧＣＡＡＣＧＣＧＣＣＴＣＡＣＧ
（配列番号２７）
（ベイトＩＤ：ＦＬＴ３＿標的＿２４．２）
３．遺伝子標的ベイトゲノム位置
ＦＬＴ３ＦＬＴ３＿標的＿２４染色体１３：２８６７４５７８～２８６７４６９７
元の配列
ＧＣＴＧＣＧＡＧＣＧＡＧＣＧＡＧＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＧ
ＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣＣＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡ
ＧＣＣＣＧＧＧＧＴＣＣＣＣＡＧＧＣＣＧＣＧＣＣＧＧＣＣＣＡＧＣＣＣＴＧＣＧＡＴＧ
（配列番号２８）
修飾された配列
ＧＣＴＴＣＧＡＧＡＧＡＧＣＧＡＧＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣＡＧＣＡＧＣＡＧ
ＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣＣＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡ
ＧＣＣＣＧＧＧＧＴＣＣＣＣＡＧＧＣＣＧＣＧＣＣＡＧＣＣＣＡＧＣＣＣＴＧＡＧＡＴＧ
（配列番号２９）
（ベイトＩＤ：ＦＬＴ３＿標的＿２４．３）
４．遺伝子標的ベイトゲノム位置
ＦＬＴ３ＦＬＴ３＿標的＿２４染色体１３：２８６７４５５４～２８６７４６７３
元の配列
ＧＴＧＧＧＧＧＣＴＧＡＧＧＧＡＣＣＧＣＧＡＧＧＧＧＣＴＧＣＧＡＧＣＧＡＧＣＧＡＧ
ＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＧＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣ
ＧＣＣＡＡＣＧＣＣＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡＧＣＣＣＧＧＧＧＴＣＣＣＣＡＧＧ
（配列番号３０）
修飾された配列
ＧＡＧＧＴＧＧＣＴＧＡＧＡＧＡＣＣＧＣＧＡＧＧＡＧＣＴＧＣＧＡＧＣＧＡＧＣＧＡＧ
ＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＧＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣ
ＧＣＣＡＡＣＧＣＡＧＧＣＡＴＧＧＣＣＴＣＣＧＧＡＧＣＣＣＡＧＧＧＴＣＣＣＣＡＧＧ
（配列番号３１）
（ベイトＩＤ：ＦＬＴ３＿標的＿２４．４）
５．遺伝子標的ベイトゲノム位置
ＦＬＴ３ＦＬＴ３＿標的＿２４染色体１３：２８６７４５０６～２８６７４６２５
元の配列
ＣＧＡＧＧＣＧＧＣＴＧＧＧＣＣＧＧＡＧＧＡＧＧＣＧＣＧＣＧＣＣＣＧＧＧＴＣＣＡＣ
ＡＣＴＧＣＧＧＧＧＴＧＧＧＧＧＣＴＧＡＧＧＧＡＣＣＧＣＧＡＧＧＧＧＣＴＧＣＧＡＧ
ＣＧＡＧＣＧＡＧＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＧＣＴＧＧＣＣＧＣ
（配列番号３２）
修飾された配列
ＣＧＡＧＧＣＧＧＣＴＧＧＧＣＣＧＧＡＧＧＡＧＧＣＧＣＧＣＧＣＣＣＧＧＡＴＣＣＡＣ
ＡＣＴＧＣＧＧＧＧＴＧＧＧＧＧＣＴＧＡＧＧＧＡＣＣＧＣＧＡＧＧＧＧＣＴＧＣＧＡＧ
ＣＧＡＧＣＧＡＧＣＧＧＧＧＡＣＴＴＡＣＣＧＡＧＣＡＧＣＧＧＣＡＡＣＴＧＧＡＣＧＣ
（配列番号３３）
（ベイトＩＤ：ＦＬＴ３＿標的＿２４．５）
６．遺伝子標的ベイトゲノム位置
ＦＬＴ３ＦＬＴ３＿標的＿２４染色体１３：２８６７４５３０～２８６７４６４９
元の配列
ＧＣＧＣＧＣＣＣＧＧＧＴＣＣＡＣＡＣＴＧＣＧＧＧＧＴＧＧＧＧＧＣＴＧＡＧＧＧＡＣ
ＣＧＣＧＡＧＧＧＧＣＴＧＣＧＡＧＣＧＡＧＣＧＡＧＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣ
ＡＧＣＧＧＣＡＧＣＴＧＧＣＣＧＣＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣＣＧＧＣＡＴＧＧ
（配列番号３４）
修飾された配列
ＧＣＡＣＧＣＡＣＧＧＡＴＣＣＡＣＡＣＴＧＣＧＧＧＧＴＧＧＧＧＧＣＴＧＡＧＧＧＡＣ
ＣＧＣＧＡＧＧＡＧＣＴＧＣＧＡＧＣＧＡＧＣＧＡＧＣＧＧＧＧＣＣＴＴＡＣＣＧＡＧＣ
ＡＧＣＧＧＣＡＧＣＴＧＧＣＡＧＣＣＧＴＣＧＣＧＣＧＣＣＡＡＣＧＣＣＧＧＣＡＴＧＧ
（配列番号３５）
（ベイトＩＤ：ＦＬＴ３＿標的＿２４．６）
７．遺伝子標的ベイトゲノム位置
ＦＬＴ４ＦＬＴ４＿標的＿３１染色体５：１８００７６５１６～１８００７６６３５
元の配列
ＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＧＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴＣＣＧＧＣＣＧＣ
ＴＧＣＧＣＧＴＧＧＧＴＣＣＧＡＣＣＣＧＡＧＣＧＧＣＣＧＣＧＧＣＴＣＧＧＧＧＣＴＧ
ＡＡＡＧＴＧＴＣＣＧＣＧＣＧＧＧＣＧＣＣＧＧＣＴＧＧＣＣＴＧＧＧＧＣＧＧＧＧＣＧ
（配列番号３６）
修飾された配列
ＣＡＣＡＣＡＣＡＣＡＡＧＣＧＣＧＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴＣＣＧＧＣＣＧＣ
ＴＧＣＧＣＧＴＧＧＧＴＣＣＧＡＣＣＣＧＡＧＣＧＧＣＣＧＣＧＧＣＴＣＧＧＧＧＣＴＧ
ＡＡＡＧＴＧＴＣＣＧＣＧＣＧＧＧＣＧＣＣＧＧＣＴＧＧＣＣＴＧＣＡＣＡＣＡＣＡＣＡ
（配列番号３７）
（ベイトＩＤ：ＦＬＴ４＿標的＿３１．１）
８．遺伝子標的ベイトゲノム位置
ＦＬＴ４ＦＬＴ４＿標的＿３１染色体５：１８００７６３９６～１８００７６５１
５
元の配列
ＧＧＣＧＧＡＧＣＧＧＴＣＴＣＡＧＣＧＣＣＣＧＣＣＣＣＡＧＧＴＧＣＧＣＧＧＴＡＣＣ
ＣＣＣＴＣＣＣＣＧＧＣＣＡＧＣＣＣＣＡＣＧＣＴＣＧＧＧＣＧＧＧＴＧＧＣＣＣＧＴＴ
ＣＧＣＣＧＣＧＣＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣＣＣＡＧＧＣＡＧＡＧＣＣＡＣＡＧ
（配列番号３８）
修飾された配列
ＣＡＣＡＣＡＣＡＣＡＴＣＴＣＡＧＣＧＣＣＣＧＣＣＣＣＡＧＧＴＧＣＧＣＧＧＴＡＣＣ
ＣＣＣＴＣＣＣＣＧＧＣＣＡＧＣＣＣＣＡＣＧＣＴＣＧＧＧＣＧＧＧＴＧＧＣＣＣＧＴＴ
ＣＧＣＣＧＣＧＣＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣＣＣＡＧＧＣＣＡＣＡＣＡＣＡＣＡ
（配列番号３９）
（ベイトＩＤ：ＦＬＴ４＿標的＿３１．２）
９．遺伝子標的ベイトゲノム位置
ＦＬＴ４ＦＬＴ４＿標的＿３１染色体５：１８００７６４２０～１８００７６５３
９
元の配列
ＣＣＡＧＧＴＧＣＧＣＧＧＴＡＣＣＣＣＣＴＣＣＣＣＧＧＣＣＡＧＣＣＣＣＡＣＧＣＴＣ
ＧＧＧＣＧＧＧＴＧＧＣＣＣＧＴＴＣＧＣＣＧＣＧＣＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣ
ＣＣＡＧＧＣＡＧＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＧＧＣＧＣＣＣＣＧ
（配列番号４０）
修飾された配列
ＣＡＣＡＣＡＣＡＣＡＧＧＴＡＣＣＣＣＣＴＣＣＣＣＧＧＣＣＡＧＣＣＣＣＡＣＧＣＴＣ
ＧＧＧＣＧＧＧＴＧＧＣＣＣＧＴＴＣＧＣＣＧＣＧＣＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣ
ＣＣＡＧＧＣＡＧＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＡＣＡＣＡＣＡＣＡ
（配列番号４１）
（ベイトＩＤ：ＦＬＴ４＿標的＿３１．３）
１０．遺伝子標的ベイトゲノム位置
ＦＬＴ４ＦＬＴ４＿標的＿３１染色体５：１８００７６４６８～１８００７６５８
７
元の配列
ＧＧＣＣＣＧＴＴＣＧＣＣＧＣＧＣＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣＣＣＡＧＧＣＡＧ
ＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＧＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴ
ＣＣＧＧＣＣＧＣＴＧＣＧＣＧＴＧＧＧＴＣＣＧＡＣＣＣＧＡＧＣＧＧＣＣＧＣＧＧＣＴ
（配列番号４２）
修飾された配列
ＣＡＣＡＣＡＣＡＣＡＣＣＧＣＧＣＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣＣＣＡＧＧＣＡＧ
ＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＧＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴ
ＣＣＧＧＣＣＧＣＴＧＣＧＣＧＴＧＧＧＴＣＣＧＡＣＣＣＧＡＧＣＣＡＣＡＣＡＣＡＣＡ
（配列番号４３）
（ベイトＩＤ：ＦＬＴ４＿標的＿３１．４）
１１．遺伝子標的ベイトゲノム位置
ＦＬＴ４ＦＬＴ４＿標的＿３１染色体５：１８００７６４４４～１８００７６５６
３
元の配列
ＧＧＣＣＡＧＣＣＣＣＡＣＧＣＴＣＧＧＧＣＧＧＧＴＧＧＣＣＣＧＴＴＣＧＣＣＧＣＧＣ
ＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣＣＣＡＧＧＣＡＧＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣ
ＡＣＡＧＣＧＣＧＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴＣＣＧＧＣＣＧＣＴＧＣＧＣＧＴＧ
（配列番号４４）
修飾された配列
ＣＡＣＡＣＡＣＡＣＡＡＣＧＣＴＣＧＧＧＣＧＧＧＴＧＧＣＣＣＧＴＴＣＧＣＣＧＣＧＣ
ＴＣＡＣＣＧＴＣＣＡＧＧＡＧＴＣＣＣＡＧＧＣＡＧＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣ
ＡＣＡＧＣＧＣＧＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴＣＣＧＧＣＣＣＡＣＡＣＡＣＡＣＡ
（配列番号４５）
（ベイトＩＤ：ＦＬＴ４＿標的＿３１．５）
１２．遺伝子標的ベイトゲノム位置
ＦＬＴ４ＦＬＴ４＿標的＿３１染色体５：１８００７６４９２～１８００７６６１
１
元の配列
ＣＡＧＧＡＧＴＣＣＣＡＧＧＣＡＧＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＧ
ＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴＣＣＧＧＣＣＧＣＴＧＣＧＣＧＴＧＧＧＴＣＣＧＡＣ
ＣＣＧＡＧＣＧＧＣＣＧＣＧＧＣＴＣＧＧＧＧＣＴＧＡＡＡＧＴＧＴＣＣＧＣＧＣＧＧＧ
（配列番号４６）
修飾された配列
ＣＡＣＡＣＡＣＡＣＡＡＧＧＣＡＧＡＧＣＣＡＣＡＧＴＣＧＣＡＧＧＣＡＣＡＧＣＧＣＧ
ＧＣＧＣＣＣＣＧＣＴＧＣＡＴＣＴＣＣＧＧＣＣＧＣＴＧＣＧＣＧＴＧＧＧＴＣＣＧＡＣ
ＣＣＧＡＧＣＧＧＣＣＧＣＧＧＣＴＣＧＧＧＧＣＴＧＡＡＡＧＴＧＣＡＣＡＣＡＣＡＣＡ
（配列番号４７）
（ベイトＩＤ：ＦＬＴ４＿標的＿３１．６）
実施例８：次世代の配列決定臨床癌検体由来の体細胞ゲノム変化の高感度検出のためのベ
イズ手法

本明細書に記載のベイズ手法を以下の例で実現した。

この手法の実用性は、出力計算によって説明され、臨床状況において関連性のある変異
頻度のより狭い範囲内の置換検出へのデータ駆動先行の影響を説明する。図２に示される
ように、先行予想（例えば、１ｅ－６または１０％先行）および変異頻度（例えば、１％
、５％、または１５％変異）の値は、それぞれ、「次世代の配列決定臨床癌検体由来の体
細胞ゲノム変化の高感度検出のためのベイズ手法」の（ｉ）および（ｉｉ）に記載される
値に相当する。図２は、先行予想を組み込むことで、例えば、変異部位での必須の対象範
囲深度を減少させるか、または推定の変異検出力（感度）を増加させることにより、より
珍しい変異の検出力を改善することができることを示す。
実施例９：ベイズ手法：構成された低純度多クローン性試料への適用

本明細書に開示のベイズ手法のこれらの利点をさらに実証するために、１０００人ゲノ
ム計画のうちの１０名の参加者由来のＤＮＡを均等に混合することによって人工的な低純
度の多クローン性「腫瘍」試料を構築し、それによって、（非公式のヘテロ接合体ＳＮＰ
から生じた）全ＤＮＡの約５％または１０％に存在する多数の配列バリアントを含有する
ＤＮＡプールを作成した。その混合物を１８２個の癌関連遺伝子のエクソンのハイブリッ
ド選択に供し、ｌｌｕｍｉｎａＨｉＳｅｑ２０００プラットフォーム上で配列決定して
、遺伝子パネルにわたって約３５０倍の平均対象範囲をもたらした。それぞれの成分試料
も同様に個別に処理し、すべてのＳＮＰ部位における遺伝子型を決定した。プールに存在
する約２６０個の約５％「変異」のうち、８９％が１ｅ－６先行を用いて高信頼度で検出
された一方で、９４％および９５％が、それぞれ、１％および１０％先行を用いて検出可
能であり（見逃された部位の平均対象範囲約１２５倍）、上記の理論的結論を支援する。
プールに存在する１０２個の１０％「変異」のうち、９８％が１ｅ－６先行を用いて高信
頼度で検出されたが、９９％および９９％が、１％および１０％先行を用いて検出可能で
あった（見逃された部位の対象範囲１３倍）。
実施例１０：ベイズ手法：肺および結腸腫瘍試料への適用

ＣＯＳＭＩＣデータベース（ｗｗｗ．ｓａｎｇｅｒ．ａｃ．ｕｋ／ｇｅｎｅｔｉｃｓ／
ＣＧＰ／ｃｏｓｍｉｃ上）からのいくつかの癌型における関連性のある変異の頻度の先行
予想を導き出し、日常の臨床検体から抽出される８０個を超える肺および結腸癌試料を分
析した。２０個を超える異なる遺伝子における既知の変異が観察され、その観察には、こ
の癌型におけるこの変異の３％先行の組み込みによってのみ検出することができた結腸癌
における１％のＰＩＫ３ＣＡ変異ｐ．Ｈ１０４７Ｒが含まれた。これらの結果は、腫瘍型
特異的変異スペクトル周辺の先行予想の賢明な組み込みがＮＧＳベースの腫瘍ゲノム分析
の臨床状況への変換において有益であり得ることを示す。
実施例１１：ベイズ手法：乳癌試料への適用

ＦＦＰＥ乳癌試料のために約２６０回配列決定された１８２個の癌関連遺伝子のエクソ
ンにおける置換変異呼び出しを行った。代替の対立遺伝子２個を超えるコピーを有する部
位の数は、１，７９３である。変異の存在下で９９％を超える事後信頼を有する部位の数
は、４０２である。フィルタ後に留まったままの部位の数は１８８であり、バリアント部
位の予想数に近い。ｄｂＳＮＰ中に存在しない部位の数は１４であり、ｄｂＳＮＰが９０
％を超えるバリエーションを捕捉するため、ｄｂＳＮＰ中に存在しない部位の予想数に近
い。非同義部位の数は５である。ＣＯＳＭＩＣ中の部位の数は２である（ＰＩＫ３ＣＡ
ｐ．Ｈ１０４７ＲおよびＰ５３ｐ．Ｆ１１３Ｓ）。
実施例１２：ベイズ手法：低頻度変異の検出

多くの日常の臨床検体は、関連性のある珍しい変異を含有する。図３は、１００個を超
える臨床癌試料における変異頻度を示す。試料は、主に結腸および肺癌のＦＦＰＥ生検、
外科的切除物、または細針吸引物であった。一連の臨床試料において見られる既知の変異
の頻度スペクトルが表１２に示される。

実施例１３Ａ．個別に合成されたオリゴヌクレオチド捕捉プローブを用いた高性能の溶液
ベースの標的選択

溶液ベースのゲノム標的選択技術の可用性は、標的とされた配列決定適用の迅速な開発
を可能にしており、それらのうちのいくつかは、臨床配列決定試験の導入をもたらした。
商品化されたハイブリダイゼーション捕捉試薬は、アレイ合成オリゴヌクレオチドに基づ
き、それは、ビオチン化ＤＮＡまたはＲＮＡプローブ（「ベイト」）に変換される。しか
しながら、プローブのこれらの複雑なプールを生成する方法は、性能上の課題、例えば、
高いＧＣ含量標的の捕捉に直面する。

５７個の臨床的に関連し、かつ実用的な癌関連遺伝子を表す約１３０ｋｂの標的領域を
捕捉するために個別に合成された５’－ビオチン化オリゴヌクレオチド（「オリゴベイト
」）を用いた代替の手法が本明細書に記載される。２４時間のハイブリダイゼーション手
順でこれらのオリゴベイトを用いて選択されたインデックス付き配列決定ライブラリは、
５，０００倍の標的濃縮をもたらした。５０Ｍの４９×４９対合末端読み取りは、５６８
倍（２７％）の標準偏差で２１００倍の平均標的対象範囲を生成した。９９．９５％の標
的化塩基が５００倍超で対象範囲とされ、すべての標的を対象範囲とすることに成功した
。さらに、標的対象範囲は、実質的にＧＣバイアスを有しなかった。７０％を超えるＧＣ
含量を有する標的は、平均して１，９７５倍の対象範囲となり、３５％未満のＧＣ含量を
有する標的は、平均して１，９９６倍の対象範囲になった。

さらにより短いハイブリダイゼーション時間を用いて高性能を維持した：９９．３％の
標的化塩基が２．５時間のハイブリダイゼーション後に５００倍超で対象範囲とされた。

ＳＳＰＥ（ＳａｌｍｏｎＳｐｅｒｍ，ＰＥ）／デンハルト液の使用は、ＴＥＡＣｌ、
ＴＭＡＣｌ、および／または硫酸デキストランを含有するハイブリッド／洗浄緩衝液より
も優れていた。

オリゴベイトをアレイ由来のベイトプール内にスパイクして、別の方法では捕捉するの
が困難な（例えば、高ＧＣ含量の）領域の対象範囲を増加させるか、または新たな遺伝子
含量を迅速に付加することができる。この手法は、高性能の標的化臨床配列決定試験を開
発する非常に効果的かつ拡張可能な方法を提供する。
実施例１３Ｂ：ベイトの捕捉を最適化する方法

３つのベイトセットを試験した。結果は図５に要約される。ベイトセットは以下のもの
であった：
ベイトセット１は、個別に合成された５’－ビオチン化ＤＮＡオリゴヌクレオチドベイ
トのみからなる。
ベイトセット２は、個別に合成された５’－ビオチン化ＤＮＡオリゴヌクレオチドベイ
トでスパイクされたアレイ由来のビオチン化ＲＮＡベイトを含む。
ベイトセット３は、アレイ由来のビオチン化ＲＮＡベイトのみからなる。

すべての個別に合成された５’－ビオチン化ＤＮＡオリゴヌクレオチドは、５’ビオチ
ンを有する１２０個の塩基であった。

図５は、ベイトセット３と比較した、ベイトセット１およびベイトセット２で検出され
た対象範囲の均一性を比較する対象範囲ヒストグラムである。ベイトセットは、図５にお
いて１、２、および３で示される。図５に示されるように、高ＧＣ含量に相当するベイト
セット３を用いたときに対象範囲におけるいくつかのギャップが存在したが、対応する領
域は、ベイトセット１および２を用いたときに深く対象範囲とされた。図５において、「
ＧＣ＿密度＿標的．．．」とラベル付けされた左側のパネルは、標的内の局所ＧＣ含量を
示す。線は、６５％のＧＣ含量を表し、その線を超える任意の値は、より高いＧＣ含量を
表す。ヒストグラムに示されるように、高ＧＣ含量の領域におけるベイトセット３の対象
範囲が最も低い。図５の「ＩＤＴ＿ベイト．．．」とラベル付けされた一番下のパネルは
、示される標的を対象範囲とするオリゴの配置を示す。

アレイ由来のベイトセットのみまたは個別に合成されたベイトでスパイクされたベイト
を用いた標的の数および対象範囲の変化を示すグラフが図４に示される。より具体的には
、図４は、対象範囲ヒストグラムの線形表示である。標的の数（Ｙ軸）は、対象範囲の関
数（Ｘ軸）として示される。線１は、個別に合成された５’－ビオチン化ＤＮＡオリゴヌ
クレオチドベイト（図４において「ベイトセット１」と称される）でスパイクされたアレ
イ由来の５’－ビオチン化ＲＮＡオリゴヌクレオチドベイトを含むベイトセットを用いた
対象範囲を表す。線２は、アレイ由来のビオチン化ＲＮＡオリゴヌクレオチドベイトのみ
（図４において「ベイトセット２」と称される）を含むベイトセットを用いて得られた対
象範囲を表す。ベイトセット２を用いたときの全体の平均対象範囲が９２４であった一方
で、ベイトセット２を用いたときの高ＧＣ含量（約６８％）の領域における対象範囲は７
３であった。対照的に、ベイトセット１を使用したとき、全体の対象範囲は、ベイトセッ
ト１と同様であった（約９１８）が、高ＧＣ含量の領域における対象範囲は、１８３に改
善された。
実施例１３Ｃ：ベイトセットを評価するための例となる実験条件

ベイトセットＡは、個別に合成された５’－ビオチン化ＤＮＡオリゴヌクレオチドベイ
トのみからなる。最初のセットは、１３３ｋｂの標的テリトリーを対象範囲とする１００
０個のオリゴ（本明細書で「ラージセット」、「ベイトセットＡ」、または「ＤＮＡオリ
ゴベイト」と称される）であった。

「スパイクイン」実験において、最初の１０００個のＤＮＡオリゴセット（「ラージセ
ット」）を、アレイ由来のビオチン化ＲＮＡオリゴヌクレオチドベイトからなるベイトセ
ット（この実施例において「ベイトセットＢ」または「ＲＮＡベイト」と称される）に添
加した。ベイトセットＡとは異なる比率のＤＮＡオリゴベイトをベイトセットＢ由来のＲ
ＮＡベイトと混合した。具体的には、１：１０比のＤＮＡオリゴベイト：ＲＮＡベイトを
使用した（合計１０ｎｇのＤＮＡオリゴベイト：合計１００ｎｇのＲＮＡベイト）。ハイ
ブリダイゼーションおよび洗浄条件を、ＲＮＡベイトにとって最も理想的な条件に適合し
た（ＲＮＡベイトの最適な洗浄温度は約７０Ｃであるが、ＤＮＡオリゴベイトにおいては
約５０Ｃであることが主な相違点である）。

低タイリング密度で、対象範囲の強度の周期性がベイト配置に一致したＤＮＡオリゴベ
イトを用いたときに検出された。加えて、低タイリング密度は、インデルを有する対立遺
伝子の捕捉をより困難にし得る。したがって、ベイトセットを表１３に示される異なるタ
イリング密度でＭＡＰ３Ｋ１のために設計した。以下の混合物において、６個の癌関連遺
伝子（ＤＡＸＸ、ＴＲＲＡＰ、ＣＲＥＢＢＰ、ＧＲＩＮ２Ａ、ＳＰＯＰ、ＧＮＡ１１）の
エクソンを捕捉するように設計された個別に合成された５’－ビオチン化ＤＮＡオリゴベ
イトを含有する混合物１を、アレイ由来のＲＮＡオリゴヌクレオチドベイトのみ（ベイト
セットＢ）内にスパイクした。ＤＡＸＸ、ＴＲＲＡＰ、ＣＲＥＢＢＰ、ＧＲＩＮ２Ａ、お
よびＳＰＯＰは、ＲＮＡベイトセット中に存在しなかった。混合物２～４をベイトセット
Ａ（ＤＮＡオリゴベイトのラージセット）内にスパイクして、異なるタイリング密度（混
合物２の密度が最も高い）のＭＡＰ３Ｋ１のエクソンの捕捉ベイトを試験した。ＲＮＡベ
イトセットのみが約１ＭＢの配列を対象範囲とした。

２μｇのプールされた細胞株ＤＮＡライブラリを捕捉物に入れた。２μｇのライブラリ
をブロッキング混合物（表１４）と混合し、乾燥させ、９μＬの水中に再懸濁させた。そ
の後、この混合物をプレートに入れ、サイクラーに移し、９８℃で５分間、続いて６８℃
で２分間実行した。その後、プレートを開封し、６８℃の１１μＬのＤＮＡベイト／ハイ
ブリッド緩衝液混合物を添加した。６８℃のＤＮＡベイト／ハイブリッド混合物は、１０
μＬのハイブリッド緩衝液＋１μＬのベイト（１０ｎｇ、５０ｎｇ、または１００ｎｇの
ベイトを含有する）であった。

ＤＮＡベイトのみ（例えば、ベイトセットＡ）での捕捉の場合、６８℃でハイブリダイ
ゼーションを行い、５０℃で洗浄を行った。ベイトを、（２ｕｇの入力ライブラリにつき
）５ｎｇ、１０ｎｇ、１００ｎｇ、１０００ｎｇ、および２０００ｎｇで試験した。２４
時間のハイブリダイゼーションの場合、５～１０ｎｇ条件が理想的であり、１００ｎｇ条
件も許容可能であった。２．５時間のハイブリダイゼーションの場合、１００ｎｇが最も
良好に作用した。

低性能／高ＧＣ領域をレスキューするためにＲＮＡ－アレイベイトセット（ｂ）内にス
パイクされる大きいＤＮＡベイトセット（１００ｋｂ）での捕捉の場合、６８℃でハイブ
リダイゼーションを行い、７０℃で洗浄を行った。ベイトセットを１：１０のＤＮＡオリ
ゴ：ＲＮＡベイトで試験した（すなわち、合計質量１０ｎｇのオリゴベイトおよび合計質
量１００ｎｇのＲＮＡベイト）。

ＲＮＡベイトセット内にスパイクされる遺伝子に焦点を当てた小さいＤＮＡベイトセッ
トでの捕捉の場合、６８℃でハイブリダイゼーションを行い、洗浄温度の範囲を試験した
（６２℃、６４℃、６６℃、６８℃、７０℃、および７２℃）。

混合物１（６個の新たな遺伝子を添加した）を、１：５、１：１０、および１：２０の
全オリゴＤＮＡベイト質量：ＲＮＡベイト質量（すなわち、２０ｎｇ：１００ｎｇ、１０
ｎｇ：１００ｎｇ、および５ｎｇ：１００ｎｇ）の比率で試験した。

混合物５（経路低対象範囲に対するＳＴＫ１１のエクソン３を表す３個のオリゴ）を１
：５００、１：１０００、および１：２０００のＤＮＡオリゴ：ＲＮＡオリゴで試験した
。合計１００ｎｇのＲＮＡベイトを使用した。ＲＮＡベイトのみで捕捉したときにＳＴＫ
１１が低検出性能で重要な癌標的を示すとして、ＳＴＫ１１を試験した。ＳＴＫ１１のエ
クソン３のＤＮＡオリゴスパイキングは、対象範囲を平均７０倍から３００倍に増加させ
た。

実施例１４．低入力のホルマリン固定組織由来のＤＮＡを用いた敏感な腫瘍プロファイリ
ングのための日常の超深度配列決定

ハイスループットＤＮＡ配列決定技術を幅広く採用することで、癌ゲノムの急速な発達
を促進している。しかしながら、ゲノム癌診断における標準治療は、依然として個別の遺
伝子および特異的変異に焦点を当てた試験を含む。臨床的に実用的な変異の数が増加する
と、特に組織検体が概して生検と同様に限定的であるときに、１試験パラダイム当たりの
この単一の変異は実現不可能になる。腫瘍試料の包括的ゲノムプロファイリングの臨床的
必要性に対処するために、我々は、２００個を超える癌関連遺伝子の大規模並列配列デー
タを送達する臨床試験を開発した。さらに、この試験は、臨床的に関連性があると示され
ており、超深部配列決定データを最低で５０ｎｇのＤＮＡ入力を有するホルマリン固定パ
ラフィン包埋（ＦＦＰＥ）組織試料および最長で１１年齢の試料から生成する。

多種多様の試料上でこの試験の性能を評価するために、ＤＮＡを経年したブロックセッ
ト由来の９６個のＦＦＰＥ検体から単離し、１、３、５、７、９、および１１年齢にわた
ってそれぞれの組織に均一に分布された乳房、結腸、肺、および腎臓組織のそれぞれに由
来する１２個の腫瘍組織／正常な組織の対を含んだ。２００ｎｇおよび／または５０ｎｇ
の入力ＤＮＡを用いて、インデックス付き配列決定ライブラリを構築し、その後、これを
溶液ベースのハイブリッド捕捉方法を用いて２００個を超える癌関連遺伝子に濃縮し、Ｉ
ｌｌｕｍｉｎａＨｉＳｅｑ（商標）２０００プラットフォーム上で配列決定した。

ライブラリ構築のために少なくとも２００ｎｇのＤＮＡを産生する７６個の試料の場合
、配列対象範囲は、ＰＣＲ重複の除去後に平均して１，０００倍になり、９５％を超える
試料が３５０倍を超える平均対象範囲をもたらした。ライブラリ構築に５０ｎｇを使用し
た試料の場合、対象範囲は、平均して４５０倍になった。配列決定性能は、すべての試料
組織型および年齢にわたって一致した。そのような超深部配列決定は、最低で５～１０％
の頻度で存在する変異の高信頼度検出を可能にする。
実施例１５．循環腫瘍細胞を用いた腫瘍ゲノムのプロファイリング

循環腫瘍細胞（ＣＴＣ）は、低侵襲的な連続した様式でヒト悪性腫瘍をサンプリングす
る独自の機会を提供する。癌ゲノムの分子を特徴付けるためにＣＴＣを使用することは、
２つの主要課題を提示する。第１に、ＣＴＣを血液から効率的に単離しなければならず、
その場合、ＣＴＣは非腫瘍細胞の数の１０^７分の１であり得る。第２に、材料の喪失およ
びバイアスの導入を最小限に抑えながら、ＣＴＣ試料中に存在する腫瘍ゲノムの限られた
数をアクセス可能な形態で捕捉しなければならない。

以前のＣＴＣ遺伝分析は、対立遺伝子特異的ＰＣＲを使用しており、これらの方法は、
１０^４倍以上の野生型配列のバックグラウンドにおける非常に少ないコピー数の特異的変
異の検出を可能にする。ＣＴＣ存在量および捕捉効率の二重課題に対処するが、この手法
は、本来、予め指定された選択バリアントの限られた特徴付けに限定される。分子ＣＴＣ
分析をゲノム時代に持ち込むために、我々は、ＣＴＣの回収を可能にする珍しい細胞のマ
イクロ流体捕捉システムと何万ではなく数百個のみの白血球のバックグラウンドを連結し
、次世代プラットフォームは、単一のＣＴＣ試料由来の２００個を超える癌関連遺伝子の
再深度配列決定を可能にする。

最大１０個の癌細胞株の複合混合物を用いたとき、敏感な変異検出（１０％以上の存在
量の遺伝子の場合、約９４％）は、最少で合計１００個の細胞を形成し、対立遺伝子頻度
を概して保存した（Ｒ^２約０．９０）。全血内にスパイクされる培養細胞を再捕捉するこ
とによって、１０個という少ない癌細胞を含有する検体からの多遺伝子変異特性を得た。
この感度レベルは、臨床ＣＴＣ試料の大半をＮＧＳ分析の届く範囲に配置する。乳癌患者
由来の一連の血液試料において、潜在的なＣＴＣ異質性を、Ｈｅｒ２Ｎｅｕ陽性細胞の頻
度を体細胞変異陽性ＤＮＡの相対存在量と比較することによって調査した。
実施例１６．ＦＦＰＥ腫瘍試料の標的化ＤＮＡおよびＲＮＡ深度配列決定の統合を介する
遺伝子発現における癌関連変異、転座、および変化の検出

個別治療の癌への広範な適用は、腫瘍のゲノムおよびトランスクリプトームに存在する
様々な異常の包括的で敏感かつタイムリーな特徴付けを必要とする。ホルマリン固定パラ
フィン包理（ＦＦＰＥ）ブロックとして一般に保管される大部分の臨床癌試料由来のＲＮ
ＡおよびＤＮＡは、品質が悪く、分子プロファイリングでの使用が困難であった。新生の
次世代ＤＮＡ配列決定アッセイは、損傷されたＤＮＡとうまく機能し、多くの種類のゲノ
ム異常を検出するのに十分敏感である。現在、ＦＦＰＥ腫瘍試料由来のトランスクリプト
ームの包括的分析の比較可能なＲＮＡ配列決定プロトコルが存在しない。
結果：

ＦＦＰＥ適合性標的化ＲＮＡ配列決定ならびに２００個を超える癌関連遺伝子における
変異、再編成、および発現変化の高感度検出の分析方法を開発した。プロトコルを細胞株
ＲＮＡ上で検証し、５０個を超えるＦＦＰＥ非小細胞肺癌（ＮＳＣＬＣ）腫瘍を研究する
ために使用した。既知の変異および遺伝子融合物（例えば、ＢＣＲ－ＡＢＬ１）を細胞株
中で検出した。デジタル発現プロファイリングの技術的再現性は、細胞株およびＦＦＰＥ
ＲＮＡにおいて、それぞれ、Ｒ^２＝０．９９および０．９を上回った。癌ゲノムでは予
想通り、ＲＮＡ配列は、既知の癌遺伝子を伴う点変異および新規の再編成を含むゲノムに
おける以上の証拠を提供した。ＥＧＦＲ、ＦＧＦＲ３、ＣＤＨ５、ＫＩＴ、およびＲＥＴ
を含む癌遺伝子の非常に有意な差次的発現が明らかになり、異なる腫瘍にわたって２．５
～７０倍の範囲に及んだ。同一のＦＦＰＥ試料上でのＲＮＡおよびＤＮＡ配列決定データ
の組み合わせは、ゲノム変化の機能的結果を裏付け、例として、変異ＴＰ５３対立遺伝子
の発現およびＤＮＡレベルでヘテロ接合性の消失を呈した腫瘍におけるＳＴＫ１１発現の
減少が挙げられる。次世代配列決定技術のＦＦＰＥＲＮＡへの適用および現存のＤＮＡ
配列決定方法との統合が、臨床的に関連する癌生物学の理解を深め、患者ケアを改善する
ことが期待される。
方法：

製造業者の指示に従って、ＲｏｃｈｅＨｉｇｈＰｕｒｅパラフィンキットを用いて
、ＲＮＡをＦＦＰＥ組織切片、典型的には、１個または２個の１０μｍカールから抽出す
る。抽出したＲＮＡを－８０℃で保管する。ＲＮＡの収量および品質を、それぞれ、製造
業者の指示に従って、ＲｉｂｏＧｒｅｅｎ（Ｉｎｖｉｔｒｏｇｅｎ）およびバイオアナラ
イザＲＮＡピコチップ（Ａｇｉｌｅｎｔ）で評価する。典型的な収量は５００ｎｇ～２μ
ｇであり、ＲＩＮスコアは４未満である。

相補的ＤＮＡ（ｃＤＮＡ）の第１の鎖を、製造業者のプロトコルに従って、Ｓｕｐｅｒ
ＳｃｒｉｐｔＩＩＩ（Ｉｎｖｉｔｒｏｇｅｎ）を使用して、５５０ｐｍｏｌのランダム
六量体をプライマーとして用いて、２０μＬの反応物中の１００～６００ｎｇのＦＦＰＥ
ＲＮＡから産生する。第１の鎖合成の直後に、製造業者のプロトコルに従って、６０μ
ＬのＮＥＢＮｅｘｔＳｅｃｏｎｄＳｔｒａｎｄＳｙｎｔｈｅｓｉｓＭｏｄｕｌｅ
（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）マスターミックスを添加し、１６℃で１５
０分間インキュベートして、完全な二本鎖ｃＤＮＡを生成する第２の鎖合成を行う。二本
鎖ｃＤＮＡの品質および収量を、それぞれ、ＰｉｃｏＧｒｅｅｎ（Ｉｎｖｉｔｒｏｇｅｎ
）およびバイオアナライザ高感度チップ（Ａｇｉｌｅｎｔ）を用いて評価することができ
る。概して、全ｃＤＮＡ合成収量を標準のＦＭＩライブラリ構築プロトコルへの入力とし
て使用する。

対合末端適合性配列決定ライブラリの構築ならびにＦＦＰＥＲＮＡから生成されるｃ
ＤＮＡのその後のハイブリッド選択および配列決定を、本明細書に記載のＦＦＰＥＤＮ
Ａと同様のプロトコルを用いて行うが、ＦＦＰＥＲＮＡの高度な断片化特性が剪断を不
必要にするため、末端修復ステップから直接開始する。

当技術分野で既知の方法を用いてＦＦＰＥＲＮＡからの配列決定データの分析を行う
ことができる。例えば、読み取り対すべてを参照ゲノム配列（ｈｇ１９）および／または
参照トランスクリプトーム（既知の転写物の配列すべて、例えば、ＲｅｆＳｅｑ）にマッ
ピングすることによって、ＦＦＰＥＲＮＡからの配列決定データの分析を行うことがで
きる。その後、マッピングされた読み取りは、例えば、Ｂｅｒｇｅｒｅｔａｌ．（２
０１０）ＧｅｎｏｍｅＲｅｓ．２０（４）：４１３－２７（ＰＭＩＤ２０１７９０２２
）およびＧａｒｂｅｒｅｔａｌ．（２０１１）ＮａｔＭｅｔｈｏｄｓ．８（６）：
４６９－７７（ＰＭＩＤ２１６２３３５３）の文献に記載されるように、遺伝子融合、遺
伝子配列における変異、選択的スプライシングを特定し、かつ遺伝子発現を定量化するた
めに使用される。Ｌｅｖｉｎｅｔａｌ．（２００９）ＧｅｎｏｍｅＢｉｏｌ．１０
（１０）：Ｒ１１５（ＰＭＩＤ１９８３５６０６）によって実証されるように、標的化Ｒ
ＮＡ配列を採用して、選択された組の遺伝子における変異検出および融合発見を改善し、
かつ発現プロファイリングの定量的情報を保存することができる。
実施例１７．臨床腫瘍試料の超深度配列決定による高感度かつ正確な変異呼び出し

癌ゲノムの理解の急速な進歩および利用可能な標的療法数の増大は、包括的な腫瘍プロ
ファイリングに基づいて、効果的な癌治療の拡大する機会を提供する。研究セッティング
における次世代配列決定による腫瘍ゲノムを分析する実験的および計算的手法が著しく進
歩したが、これらの技術を診療所に拡大適用することは、重大なさらなる課題を提示する
。これらの課題の手がかりは、臨床検体の限定的な純度および異質性であり、その要件と
相まって、広範囲の臨床的に実用的な可能性のある変異に高感度および高精度を提供する
。

この課題に対処するために、我々は、２００個を超える癌関連遺伝子の超深度配列デー
タ（７００倍超）を日常のＦＦＰＥ腫瘍試料から生成することができる臨床試験、ならび
にこの深度を利用して低画分で存在する異なる種類の変異に高レベルの感度および精度を
提供することができる計算ツールを開発した。我々の分析パイプラインは、既知の変異頻
度を説明するマッピングされた配列データ中の短いバリアントを検出し、ブレークポイン
ト検出と局所アセンブリを合わせて代替の方法では頻繁に見逃されるより大きい挿入およ
び欠失を特定する。加えて、コピー数の変化および主要な癌遺伝子を含む再編成を特定す
る。

我々が新たに開発した方法の分析性能を検証するために、我々は、異種ＤＮＡにおける
珍しい事象のモデルとして２０個の正常なＨａｐＭａｐ細胞株および２８個の個別に特徴
付けられた癌細胞株を含む試料混合物の広範囲な研究を設計および実行した。我々は、混
合物の１０％超に存在する置換に対して１００％の感度および１～５０ｂｐのインデルに
対して９０％を超える感度を報告し、両方ともに、ＰＰＶが９９％を超える。我々の試験
の２２７個の黒色腫、前立腺、乳房、結腸、および肺腫瘍試料のコホートへの適用は、４
２７個の既知の見込みのある体細胞ドライバ変異を示し、そのうちの４０％は、２０％お
よび１８％未満、１０％未満の試料画分に存在し、高感度の変異呼び出しの重要性を強調
した。
実施例１８．切除縁における癌変異の検出

腫瘍の縁の組織が組織学的に正常な場合でも、癌関連変異を検出することができること
が見出されている。過形成性結腸ポリープに関連した組織試料を三連構造としてＢｉｏＳ
ｅｒｖｅ（Ｂｅｌｔｓｖｉｌｌｅ，ＭＤ）から購入した。その三連構造は、末梢血液白血
球由来のゲノムＤＮＡ、正常な組織ＦＦＰＥ（ホルマリン固定パラフィン包埋）、および
腫瘍組織ＦＦＰＥを含んだ。

例えば、
増分的に試験した過形成性結腸ポリープの縁から単離された正常な結腸試料由来の６個
の切片において、ポリープから最も遠位の切片（切片１）ではＫＲＡＳ変異は観察されな
かった。ポリープから２番目に遠位の切片（切片２）の細胞の１％、ポリープから３番目
に遠位の切片（切片３）の細胞の２％、ポリープから４番目に遠位の切片（切片４）の細
胞の３％、ポリープから５番目に遠位の切片（切片５）の細胞の４％、およびポリープに
最も近い切片（切片６）の細胞の５％においてＫＲＡＳｐ．Ｇ１３Ｄ変異が観察された
。ポリープの縁由来の切片から単離された細胞の６％において変異が観察された。

切片１、３、および５由来の組織試料のＨ＆Ｅ染色から、癌組織の組織学的証拠は確認
されなかった。切片６由来の組織のＨ＆Ｅ染色から、ポリープの存在が確認された。

腫瘍の異質性が、遠位直腸由来の適度に分化した浸潤性の腺癌の切片で検出された。具
体的には、増分的に試験した切片１～６は、それぞれ、変異ＢＲＡＦｐ．Ｖ６００Ｅ、
ＴＰ５３ｐ．Ｒ２１３Ｘ、ＢＲＣＡ１ｃ．２１０５ｄｅｌＧ、ＡＰＣｃ．５５４１
ｉｎｓＧ、およびＡＰＣｃ．６４６３ｄｅｌＡを含んだ。

これらの実験の結果は、切除縁での組織の遺伝子検査が癌組織または前癌組織の検出に
より敏感であることを示した。したがって、切除縁で組織の遺伝子検査を行うことによっ
て、例えば、本明細書に記載の配列決定方法によって、医療関係者は、より情報に基づい
てさらなる治療過程について提言することができる。例えば、遺伝子検査の結果に応じて
、さらなる治療を提言するか、またはそれ以上の治療を行わないことについて提言するこ
とができる。さらなる治療には、遺伝子検査によって特定された変異に基づいて、例えば
、化学治療もしくは放射線、またはそれら両方、あるいは化学治療の場合、特定の薬物も
しくは薬物の組み合わせ、または特定の投与レジメンが含まれ得る。
参照による組み込み

本明細書で言及されるすべての出版物、特許、および特許出願は、それぞれの個別の出
版物、特許、または特許出願が参照により組み込まれると具体的かつ個別に示されるかの
ように、参照によりそれらの全体が本明細書に組み込まれる。矛盾が生じる場合、本明細
書における任意の定義を含めて、本出願が優先される。

ワールドワイドウエブ上のｔｉｇｒ．ｏｒｇにおいてゲノム研究期間（ＴｈｅＩｎｓ
ｔｉｔｕｔｅｆｏｒＧｅｎｏｍｉｃＲｅｓｅａｒｃｈ：ＴＩＧＲ）によって、およ
び／またはワールドワイドウエブ上のｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖにおいて国立生
物工学情報センター（ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌ
ｏｇｙＩｎｆｏｒｍａｔｉｏｎ：ＮＣＢＩ）によって維持される公開データベース等の
公開データベースのエントリと相関する受入番号を参照する任意のポリヌクレオチドおよ
びポリペプチド配列も、参照によりそれらの全体が組み込まれる。
等価物

当業者であれば、本明細書に記載の本発明の特定の実施形態に対する多くの等価物を理
解するか、または日常の実験のみを用いて確かめることができる。そのような等価物は、
以下の特許請求の範囲によって包含されるよう意図される。

本発明は以下のものを含む。
[項１]
腫瘍試料を分析する方法であって、
（ａ）複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
（ｂ）前記ライブラリを複数のベイトセットと接触させて選択されたメンバーを提供し
、それによって、ライブラリ捕獲物を提供することと、
（ｃ）サブゲノム間隔についての読み取りを前記ライブラリまたはライブラリ捕獲物か
らの腫瘍メンバーから取得することと、
（ｄ）前記読み取りをアライメントすることと、
（ｅ）事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド値を
複数のサブゲノム間隔のそれぞれにおいて割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
Ｘ個のヌクレオチド位置はそれぞれ、ステップ（ｂ）、（ｃ）、（ｄ）、もしくは（ｅ
）のうちの１つまたはそれらの組み合わせについて一意の組の条件下で分析され、Ｘは、
少なくとも１０、２０、３０、４０、５０、１００、２００、３００、もしくは５００で
あり、一意とは、他のＸ－１個の組の条件とは異なることを意味する、
方法。
[項２]
第１のヌクレオチド位置が、第１の組のベイト条件、第１のアライメント方法、および
第１の変異呼び出し方法で分析され、
第２のヌクレオチド位置が、前記第１の組のベイト条件、第２のアライメント方法、お
よび前記第１の変異呼び出し方法で分析され、
第３のヌクレオチド位置が、前記第１の組のベイト条件、前記第１のアライメント方法
、および第２の変異呼び出し方法で分析され、
他の２つと比較して、それぞれ一意の条件下で分析された３個のヌクレオチド位置を提
供する、
請求項１に記載の方法。
[項３]
前記条件は、
第１のベイトセットが前記第１のサブゲノム間隔のために使用され、第２のベイトセッ
トが前記第２のサブゲノム間隔のために使用されること、
第１のアライメント方法が前記第１のサブゲノム間隔についての読み取りに適用され、
第２のアライメント方法が第２のサブゲノム間隔についての読み取りに適用されること、
または
第１の変異呼び出し方法が前記第１のサブゲノム間隔のヌクレオチド位置に適用され、
第２の変異呼び出し方法が前記第２のサブゲノム間隔のヌクレオチド位置に適用されるこ
と、
のうちの１つ以上を含む、請求項１に記載の方法。
[項４]
少なくとも２つのサブゲノム間隔におけるヌクレオチド位置が異なるベイトセットで分
析されること、
少なくとも２つのサブゲノム間隔におけるヌクレオチド位置が異なるアライメント方法
で分析されること、または
少なくとも２つのサブゲノム間隔におけるヌクレオチド位置が異なる変異呼び出し方法
で分析されること
のうちの１つ以上をさらに含む、請求項１に記載の方法。
[項５]
Ｘ個のヌクレオチド位置のそれぞれについて、前記ヌクレオチド位置で生じる事前選択
された変化の特性に応答して、前記ヌクレオチド位置は、一意の組の条件下で分析される
（一意とは、他のＸ－１個の組の条件とは異なることを意味し、Ｘは、少なくとも１０、
２０、３０、４０、５０、１００、２００、３００、または５００である）、
請求項１に記載の方法。
[項６]
前記特性は、
（ｉ）前記サブゲノム間隔に存在する変化の種類、
（ｉｉ）評価される前記ヌクレオチド位置の前記ヌクレオチド位置における配列または
その付近の配列が、前記サブゲノム間隔の予想される誤アライメント傾向に影響を及ぼし
得る配列を含むこと、
（ｉｉｉ）事前選択された腫瘍型の変化を示す読み取りを観察する先行予想、
（ｉｖ）塩基呼び出しエラーのみによる前記変化を示す読み取りを観察する確率、
（ｖ）前記変化の検出に所望される事前選択された配列決定深度、または
（ｖｉ）（ａ）癌遺伝子もしくは腫瘍抑制遺伝子、または（ｂ）事前選択された変化を
特徴とする遺伝子もしくは遺伝子型のうちの１つ以上から選択され得る、前記変化が位置
する遺伝子もしくは遺伝子型
のうちの１つ以上から選択され得る、請求項５に記載の方法。
[項７]
前記方法は、保存された腫瘍試料上で、少なくとも１０、２０、５０、もしくは１００
個のサブゲノム間隔におけるヌクレオチド位置に対して９５、９８、もしくは９９％の感
度または特異性を可能にする条件下で行われる、請求項１に記載の方法。
[項８]
腫瘍試料を分析する方法であって、
（ａ）複数のメンバーを含むライブラリを腫瘍試料から取得することと、
（ｂ）前記ライブラリを複数のベイトセットと接触させることによって事前選択された
配列の前記ライブラリを濃縮して、選択されたメンバーを提供し、それによって、ライブ
ラリ捕獲物を産生することと、
（ｃ）サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラ
リまたはライブラリ捕獲物からの腫瘍メンバーから取得することと、
（ｄ）前記読み取りをアライメント方法を用いてアライメントすることと、
（ｅ）前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
Ｘ個の一意のサブゲノム間隔のそれぞれからの読み取りが、一意のアライメント方法で
アライメントされ、Ｘは、少なくとも２であり、
一意のサブゲノム間隔とは、他のＸ－１個のサブゲノム間隔とは異なることを意味し、
一意のアライメント方法とは、他のＸ－１個のアライメント方法とは異なることを意味す
る、
方法。
[項９]
Ｘは、少なくとも１０、１５、２０、３０、５０、１００、５００、または１，０００
である、請求項８に記載の方法。
[項１０]
表１もしくは表１Ａにおいて優先順位が１のアノテーションを有する少なくともＸ個の
遺伝子由来のサブゲノム間隔は、一意のアライメント方法でアライメントされ、Ｘは、１
０、１５、２０、または３０に相当する、請求項８に記載の方法。
[項１１]
ａ）第１の一意のアライメント方法を第１のゲノム間隔に適用することであって、前記
第１のゲノムのバリアントが腫瘍表現型に関連し、前記バリアントが表６の点変異である
ことと、
ｂ）第２の一意のアライメント方法を第２のゲノム間隔に適用することであって、前記
第２のゲノムのバリアントが腫瘍表現型に関連し、前記バリアントが、表５の欠失、挿入
、または転座から選択される再編成であることと、
ｃ）バリアントが前記試料の腫瘍表現型または前記腫瘍型に関連しないゲノム間隔を含
む第３のゲノム間隔に第３の一意のアライメント方法を適用することと、
を含む、請求項８に記載の方法。
[項１２]
分析されるサブゲノム間隔は、再編成を有するヌクレオチド位置を含み、
事前選択された再編成とアライメントするように事前選択され、かつ前記ゲノム再編成
と同一ではない再編成参照配列を読み取りとのアライメントのために選択することと、
読み取りを前記事前選択された再編成参照配列と比較することと、
前記読み取りが、事前選択されたレベル未満のミスマッチまたはギャップを有する前記
事前選択された再編成参照に対するアライメントであるという、所定のアライメント基準
を満たすかを決定することと、を含むアライメント方法を用いることを含み、
それによって、読み取りを分析する、
請求項８に記載の方法。
[項１３]
第１のアライメント方法は、マッチリワード、ミスマッチペナルティ、ギャップペナル
ティ、予想閾値、語長、フィルタ、またはマスクの値が第２のアライメント方法とは異な
る、請求項８に記載の方法。
[項１４]
腫瘍試料を分析する方法であって、
（ａ）複数のメンバーを含むライブラリを腫瘍試料から取得することと、
（ｂ）前記ライブラリを複数のベイトセットと接触させることによって事前選択された
配列の前記ライブラリを濃縮して、選択されたメンバーを提供し、それによって、ライブ
ラリ捕獲物を提供することと、
（ｃ）サブゲノム間隔についての読み取りを前記ライブラリまたはライブラリ捕獲物か
らの腫瘍メンバーから取得することと、
（ｄ）前記読み取りをアライメント方法を用いてアライメントすることと、
（ｅ）前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
Ｘ個の一意のサブゲノム間隔においてそれぞれのヌクレオチド位置に対して割り当てら
れたヌクレオチド値は、一意の呼び出し方法を用いて割り当てられ、Ｘは、少なくとも２
であり、
一意のサブゲノム間隔とは、他のＸ－１個のサブゲノム間隔とは異なることを意味し、
一意の呼び出し方法とは、他のＸ－１個の呼び出し方法とは異なることを意味する、
方法。
[項１５]
前記呼び出し方法は、第１のベイズ先行の関数である第１のヌクレオチド位置に適用さ
れる第１の呼び出し方法および第２のベイズ先行の関数である第２のヌクレオチド位置に
適用される第２の呼び出し方法から選択される異なるベイズ先行値に依存するという点で
異なり得る、請求項１４に記載の方法。
[項１６]
前記ヌクレオチド値の割り当ては、腫瘍型における前記事前選択されたヌクレオチド位
置で事前選択されたバリアント、例えば、変異を示す読み取りを観察する先行（例えば、
文献）予想であるか、またはそれを表す値の関数である、請求項１４に記載の方法。
[項１７]
前記方法は、少なくともＸ個（Ｘは、１０、２０、４０、５０、６０、７０、８０、９
０、もしくは１００である）の事前選択されたヌクレオチド位置に対するヌクレオチド値
を割り当てることを含み、それぞれの割り当ては、腫瘍型における前記事前選択されたヌ
クレオチド位置で事前選択されたバリアントを示す読み取りを観察する先行予想であるか
、またはそれを表す（他のＸ－１個の割り当ての値ではなく）一意の値の関数である、請
求項１４に記載の方法。
[項１８]
前記ヌクレオチド値の割り当ては、前記バリアントが前記試料中に１０％未満の頻度で
存在する場合、および／または前記バリアントが不在である場合、前記事前選択されたヌ
クレオチド位置で前記事前選択されたバリアントを示す読み取りを観察する確率を表す一
組の値の関数である、請求項１４に記載の方法。
[項１９]
腫瘍試料の配列を分析する方法であって、
（ａ）サブゲノム間隔の複数の重複を取得することと、
（ｂ）前記複数の重複のそれぞれについての読み取りを取得して、複数の重複読み取り
を提供することと、
（ｃ）前記複数の重複読み取りにおけるそれぞれの第１のヌクレオチド位置での前記ヌ
クレオチド値を比較することと、
（ｄ）前記複数の重複読み取りにおけるそれぞれの第２のヌクレオチド位置での前記ヌ
クレオチド値を比較することと、
（この場合において、前記ヌクレオチド位置の一方では、前記複数の読み取りがそれぞ
れ同一のヌクレオチド値を有さず、前記ヌクレオチド位置の他方では、前記複数の読み取
りがそれぞれ同一のヌクレオチド値を有する）
（ｅ）品質スコアまたは重複調節されたヌクレオチド値を有する第１の分類子を、前記
ヌクレオチド値に前記複数の読み取りのすべてにおいて同一のヌクレオチド値を有しない
前記位置で割り当てることと、
（ｆ）品質スコアまたは重複調節されたヌクレオチド値を有する第２の分類子を、前記
ヌクレオチド値に前記複数の読み取りのそれぞれにおいて同一のヌクレオチド値を有する
前記位置で割り当てることと、を含み、
前記第１の分類子は、それが割り当てられる前記ヌクレオチド値が正しいという第１の
レベルの品質または信頼度を示し、前記第２の分類子は、それが割り当てられる前記ヌク
レオチド値が正しいという第２のレベルの品質または信頼度を示し、前記第１のレベルは
、事前選択された基準以下である、
方法。
[項２０]
腫瘍試料を分析する方法であって、
複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することとであって、選択さ
れたメンバーは、それによって、ライブラリ捕獲物を提供することと、
サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラリまた
はライブラリ捕獲物からの腫瘍メンバーから取得することと、
前記読み取りをアライメントすることと、
事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド値を複数の
サブゲノム間隔のそれぞれにおいて割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
前記方法は、
ａ）第１のサブゲノム間隔を配列決定して約５００倍以上の配列決定深度を提供し、そ
れによって、前記試料由来の５％を超えない細胞に存在する変異を検出すること、
ｂ）第２のサブゲノム間隔を配列決定して約２００倍～約５００倍の配列決定深度を提
供し、それによって、前記試料由来の１０％を超えない細胞中に存在する変異を検出する
こと、
ｃ）第３のサブゲノム間隔を配列決定して約１０～１００倍の配列決定深度を提供する
こと（この場合において、前記サブゲノム間隔は、ａ）異なる薬物を代謝する患者の能力
を見分ける薬理ゲノム（ＰＧｘ）単一ヌクレオチド多型（ＳＮＰ）、またはｂ）患者を一
意に特定するゲノムＳＮＰのうちの１つ以上から選択される）、
ｄ）第４のサブゲノム間隔を配列決定して約５～５０倍の配列決定深度を提供し、構造
ブレークポイントを検出すること、あるいは
ｅ）第５のサブゲノム間隔を配列決定して約１００～３００倍の配列決定深度を提供し
、コピー数の変化を検出する、例えば、ゲノムＤＮＡのコピー数の獲得／喪失またはヘテ
ロ接合性の消失（ＬＯＨ）を評価するために使用されるゲノムＳＮＰ／遺伝子座を検出す
ること
のうちの１つ、もしくは２、３、４、もしくは５つを含む、方法。
[項２１]
腫瘍試料を分析する方法であって、
（ａ）複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
（ｂ）前記ライブラリをベイトセットと接触させて選択されたメンバーを提供し、それ
によって、ライブラリ捕獲物を提供することと、
（ｃ）サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラ
リまたはライブラリ捕獲物からの腫瘍メンバーから取得することと、
（ｄ）前記読み取りをアライメント方法を用いてアライメントすることと、
（ｅ）前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
前記方法は、前記ライブラリを少なくとも２つ、３つ、４つ、または５つのベイトセッ
トと接触させることを含み、前記複数のベイトセットはそれぞれ、（前記複数の他のベイ
トセットではなく）一意の事前選択されたその標的選択効率を有する、
方法。
[項２２]
前記複数のベイトセットのうちの第１のベイトセットの前記選択効率は、前記複数のベ
イトセットのうちの第２のベイトセットの前記効率とは少なくとも２倍異なる、請求項２
１に記載の方法。
[項２３]
ある実施形態において、前記第１および第２のベイトセットは、少なくとも２倍異なる
配列決定深度を提供する。
[項２４]
以下のうちの１つもしくは複数のベイトセットを前記ライブラリと接触させることを含
む、請求項２１に記載の方法：
ａ）細胞のゲノムにおける前記試料由来のある変化を持つ前記細胞の約５％以下の頻度
で出現する前記変化を有するサブゲノム間隔を含む、１つ以上の腫瘍メンバーから選択さ
れる高レベルの標的を選択する第１のベイトセット、
ｂ）細胞のゲノムにおける前記試料由来のある変化を持つ前記細胞の約１０％という、
より高い頻度で出現する前記変化を有するサブゲノム間隔を含む、１つ以上の腫瘍メンバ
ーから選択される中間レベルの標的を選択する第２のベイトセット、
ｃ）ａ）異なる薬物を代謝する患者の能力を見分ける薬理ゲノム（ＰＧｘ）単一ヌクレ
オチド多型（ＳＮＰ）、ｂ）患者を一意に特定するゲノムＳＮＰ、ｃ）ゲノムＤＮＡのコ
ピー数の獲得／喪失およびヘテロ接合性の消失（ＬＯＨ）を評価するために使用されるゲ
ノムＳＮＰ／遺伝子座のうちの１つ以上から選択されるサブゲノム間隔を含む１つ以上の
ＰＧｘメンバーから選択される低レベルの標的を選択する第３のベイトセット、
ｄ）構造ブレークポイントを検出するイントロン配列を含むメンバーを選択する第４の
ベイトセット、または
ｅ）いくつかの末端エクソンの１コピー欠失を選択する第５のベイトセット。
[項２５]
前記選択効率値は、
（ｉ）異なるベイトセットの差次的表示、
（ｉｉ）ベイトサブセットの差次的オーバーラップ、
（ｉｉｉ）差次的ベイトパラメータ、
（ｉｖ）異なるベイトセットを異なるモル比で混合して、相対標的対象範囲深度を強化
するか、または減少させること、
（ｖ）異なる種類のオリゴヌクレオチドベイトを用いること、
のうちの１つ以上によって修正される、請求項２１に記載の方法。
[項２６]
異なる種類のオリゴヌクレオチドベイトは、
（ａ）１つ以上の化学的に（非酵素的に）個別に合成されたベイト、
（ｂ）アレイで合成された１つ以上のベイト、
（ｃ）１つ以上の生体外で転写されたベイト、
（ｄ）（ａ）、（ｂ）、および／もしくは（ｃ）の任意の組み合わせ、
（ｅ）１つ以上の自然発生もしくは非自然発生のＤＮＡオリゴヌクレオチド、
（ｆ）１つ以上の自然発生もしくは非自然発生のＲＮＡオリゴヌクレオチド、
（ｇ）（ｅ）および（ｆ）の組み合わせ、または
（ｈ）上記の任意の組み合わせ
のうちの１つ以上から選択され得る、請求項２５に記載の方法。
[項２７]
前記異なる種類のオリゴヌクレオチドベイトは、１：１、１：２、１：３、１：４、１
：５、１：１０、１：２０、１：５０、１：１００、または１：１０００から選択される
比率で混合される、請求項２６に記載の方法。
[項２８]
化学的に合成されたベイトとアレイで生成されたベイトの比率は、１：５、１：１０、
または１：２０から選択される、請求項２７に記載の方法。
[項２９]
前記非自然発生のＤＮＡもしくはＲＮＡオリゴヌクレオチドは、ロックド核酸（ＬＮＡ
）、ペプチド核酸（ＰＮＡ）、低ＧＣ領域を捕捉するように修飾されたＤＮＡもしくはＲ
ＮＡオリゴヌクレオチド、二環式核酸（ＢＮＡ）、架橋オリゴヌクレオチド、修飾された
５－メチルデオキシシチジン、または２，６－ジアミノプリンのうちの１つ以上から選択
される、請求項２６に記載の方法。
[項３０]
以下のベイトパラメータのうちの１つ以上が修正される、請求項２１に記載の方法：
（ｉ）ベイト表示またはオーバーラップの増加／減少が、同一のカテゴリー内の他の標
的と比較して不十分に／過度に対象とされる腫瘍メンバーの対象範囲を強化する／減少さ
せるために使用され得ること、
（ｉｉ）標的配列（高ＧＣ含量配列を含む）を捕捉するのが困難な低対象範囲の場合、
隣接配列を対象範囲とするベイトセットで標的化すること、
（ｉｉｉ）ベイト配列の修正が、前記ベイトの二次構造を減少させ、かつその選択効率
を強化するために行われ得ること、
（ｉｖ）ベイト長の修正が、同一のカテゴリー内の異なるベイトの融解ハイブリダイゼ
ーション動態を均等化するために使用されること、
（ｖ）同一の標的領域（順方向鎖および逆方向鎖）に対して異なる配向を有するベイト
の修正が、異なる結合効率を有し得ること、
（ｖｉ）それぞれのベイト上に存在する結合実体の量の修正が、その結合効率に影響を
及ぼし得ること、特定の標的を標的化するベイトのタグレベルの増加／減少が、相対的な
標的の対象範囲を強化する／減少させるために使用され得ること、
（ｖｉｉ）異なるベイトに使用されるヌクレオチドの前記種類の修正が、前記標的に対
する結合親和性に影響を及ぼし、かつ相対的な標的の対象範囲を強化する／減少させるよ
うに変更され得ること、または
（ｖｉｉｉ）より安定した塩基対合を有する修飾されたオリゴヌクレオチドベイトが、
高ＧＣ含量と比較して低いか、もしくは標準的なＧＣ含量の領域間の融解ハイブリダイゼ
ーション動態を均等化するために使用され得ること。
[項３１]
前記ベイトセットは、以下のＡ～Ｍのうちの１、２、３、４、５、６、７、８、９、１
０、１１、１２個、もしくはすべてから選択される、請求項２１に記載の方法：
Ａ．癌表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択するベイトセ
ット、
Ｂ．参照ヌクレオチド配列由来の１、２、３、４、５、６、７、８、９、１０、１１、
１２、１３、１４、１５、１６、１７、１８、１９、２０個、またはそれ以上のコドンの
インフレーム欠失を選択するベイトセット、
Ｃ．遺伝子内欠失を選択するベイトセット、
Ｄ．遺伝子内挿入を選択するベイトセット、
Ｅ．全遺伝子の欠失を選択するベイトセット、
Ｆ．逆位を選択するベイトセット、
Ｇ．染色体間転座を選択するベイトセット、
Ｈ．タンデム重複を選択するベイトセット、
Ｉ．非反復隣接配列に隣接する目的とするヌクレオチド配列を選択するベイトセット、
Ｊ．融合配列に対応する１つ以上のサブゲノム間隔を選択するベイトセット、
Ｋ．高ＧＣ含量のヌクレオチド配列または１つ以上の反復要素および／もしくは逆位反
復を含むヌクレオチド配列から選択される望ましくない特徴を含むヌクレオチド配列に隣
接したサブゲノム間隔を選択するベイトセット、
Ｌ．５’もしくは３’－ＵＴＲ由来のイントロン配列を含むゲノム再編成を選択するベ
イトセット、あるいは
Ｍ．癌関連遺伝子融合体に隣接してエクソンを含むサブゲノム間隔を選択するベイトセ
ット。
[項３２]
前記ベイトセットは、約１００ヌクレオチド長～３００ヌクレオチド長の複数のオリゴ
ヌクレオチドを含む、請求項３１に記載の方法。
[項３３]
前記サブゲノム間隔は、単一ヌクレオチド位置；遺伝子内領域もしくは遺伝子間領域；
エクソンもしくはイントロン、またはそれらの断片、典型的には、エクソン配列またはそ
の断片；コード領域もしくは非コード領域、例えば、プロモーター、エンハンサー、５’
非翻訳領域（５’ＵＴＲ）もしくは３’非翻訳領域（３’ＵＴＲ）、またはそれらの断片
；ｃＤＮＡまたはその断片；ＳＮＰ；体細胞変異、生殖細胞変異、もしくはそれら両方；
変化、例えば、点変異もしくは単一変異；欠失変異；インフレーム欠失、遺伝子内欠失、
全遺伝子欠失；挿入変異；遺伝子内挿入；逆位変異；染色体内逆位；連鎖変異；連鎖され
た挿入変異；逆位重複変異；タンデム重複；染色体内タンデム重複；転座；染色体転座、
非相反転座；再編成；ゲノム再編成；１つ以上のイントロンもしくはその断片の再編成；
再編成されたイントロン（５’－もしくは３’－ＵＴＲを含む）；あるいはそれらの組み
合わせのうちの１つ以上を含むか、またはそれらからなる、請求項１～３２のいずれかに
記載の方法。
[項３４]
前記腫瘍メンバーは、癌に関連付けられるか、または抗癌治療に対する応答性を予測す
る１つ以上の変化を含む、請求項１～３２のいずれかに記載の方法。
[項３５]
前記変化は、正常かつ健康な組織または細胞と比較して、癌組織または癌細胞における
ヌクレオチド配列の変化、アミノ酸配列の変化、染色体転座、染色体内逆位、コピー数の
変化、発現レベルの変化、タンパク質レベルの変化、タンパク質活性の変化、またはメチ
ル化状態の変化を含む、請求項３４に記載の方法。
[項３６]
前記変化は、癌の危険性、癌進行、癌治療、もしくは癌治療に対する耐性；癌の遺伝的
危険因子；正の治療応答予測因子；負の治療応答予測因子；正の予後因子；負の予後因子
；または診断因子のうちの１つ以上に関連する（または関連しない）、請求項３４に記載
の方法。
[項３７]
前記腫瘍試料は、１つ以上の前悪性もしくは悪性細胞；固形腫瘍、軟組織腫瘍、もしく
は転移病巣由来の細胞；切除縁由来の組織もしくは細胞；組織学的に正常な組織；１つ以
上の循環腫瘍細胞（ＣＴＣ）；正常な隣接組織（ＮＡＴ）；前記腫瘍を有するか、または
有する危険性のある同一の対象由来の血液試料を含む、請求項１～３２のいずれかに記載
の方法。
[項３８]
前記腫瘍試料は、ＦＦＰＥ試料である、請求項３７に記載の方法。
[項３９]
前記方法は、腫瘍試料から取得されたＲＮＡ由来のｃＤＮＡの配列決定を含む、請求項
１～３２のいずれかに記載の方法。
[項４０]
ＤＮＡ配列決定ステップおよびＲＮＡ配列決定ステップを行うことをさらに含む、請求
項３９に記載の方法。
[項４１]
前記変化を含む遺伝子または遺伝子産物のレベルの変化を検出すること、標的ＲＮＡに
ついて試料を濃縮すること、または前記試料から、ある程度高い存在量のＲＮＡを枯渇さ
せることのうちの１つ以上から選択されるステップをさらに含む、請求項４０に記載の方
法。
[項４２]
（ｉ）前記核酸試料をフィンガープリントすること、
（ｉｉ）遺伝子もしくは遺伝子産物の存在量を定量化すること、
（ｉｉｉ）前記試料中の転写物の相対存在量を定量化すること、
（ｉｖ）特定の対象に属するとして前記核酸試料を特定すること、
（ｖ）対象の遺伝的構成、民族性、人種、もしくは家族性形質のうちの１つ以上を含む
前記核酸試料の遺伝形質を特定すること、
（ｖｉ）前記核酸試料の倍数性を決定すること、
（ｖｉｉ）前記核酸試料におけるヘテロ接合性の消失を決定すること、
（ｖｉｉｉ）前記核酸試料における遺伝子重複事象の存在もしくは不在を決定すること
、
（ｉｘ）前記核酸試料における遺伝子増幅事象の存在もしくは不在を決定すること、ま
たは
（ｘ）前記核酸試料中の腫瘍／正常な細胞混合物のレベルを決定すること、
のうちの１つ以上をさらに含む、請求項２０～３２のいずれかに記載の方法。
[項４３]
前記試料由来の少なくとも５、６、７、８、９、１０、１５、２０、２５、３０個、も
しくはそれ以上の遺伝子または遺伝子産物由来のサブゲノム間隔を配列決定することを含
み、前記遺伝子または遺伝子産物は、ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ
、ＡＰＣ、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮ
ＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬ
Ｔ３、ＨＲＡＳ、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、
ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲ
Ａ、ＰＩＫ３ＣＡ、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、
ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴＫ１１、ＳＵＦＵ、またはＴＰ５３から選択される、請求
項１～３２のいずれかに記載の方法。
[項４４]
以下うちの少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３
個、もしくはすべてから選択されるサブゲノム間隔を配列決定することを含む、請求項１
～３２のいずれかに記載の方法：
Ａ）ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲＡＦ、Ｃ
ＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２
、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡＫ２、Ｋ
ＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ１、ＮＯ
ＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＩＫ３Ｃ
Ｇ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、ＲＢ１、ＲＥＴ、ＳＭＯ、ＳＴ
Ｋ１１、ＳＵＦＵ、もしくはＴＰ５３のうちの少なくとも５つ以上から選択される変異ま
たは野生型遺伝子もしくは遺伝子産物由来の少なくとも５、６、７、８、９、１０、１５
、２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｂ）ＡＢＬ２、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ
、ＡＵＲＫＢ、ＢＡＰ１、ＢＣＬ２、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣ
Ｌ６、ＢＲＣＡ１、ＢＲＣＡ２、ＣＢＬ、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ２、ＣＣＮＤ
３、ＣＣＮＥ１、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５
、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫ
Ｌ、ＣＲＬＦ２、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、Ｅ
ＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ６、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＧ、Ｅ
ＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ
７、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ４、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ
、ＧＮＡＳ、ＧＰＲ１２４、ＧＵＣＹ１Ａ２、ＨＯＸＡ３、ＨＳＰ９０ＡＡ１、ＩＤＨ１
、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２
、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＤＭ６Ａ、ＫＤＲ、ＬＲＰ１Ｂ、ＬＲＰ６、ＬＴＫ、
ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＮ１、ＭＩＴＦ、ＭＬＨ１、ＭＰＬ
、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣＬ１、ＭＹＣＮ、
ＮＦ２、ＮＫＸ２－１、ＮＴＲＫ１、ＮＴＲＫ２、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＢ、
ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ
、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭ
ＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＯＸ１０、ＳＯＸ２、ＳＲＣ、ＴＢＸ２２、ＴＥＴ２、
ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＮＦＡＩＰ３、ＴＮＫ、ＴＮＫＳ２、ＴＯＰ１、ＴＳ
Ｃ１、ＴＳＣ２、ＵＳＰ９Ｘ、ＶＨＬ、もしくはＷＴ１のうちの少なくとも５つ以上から
選択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも５、６、７、８
、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７
０、７５、８０、８５、９０、９５、１００、１０５、１１０、１１５、１２０個、もし
くはそれ以上のサブゲノム間隔、
Ｃ）表１、１Ａ、２、３、もしくは４に記載の遺伝子または遺伝子産物由来の少なくと
も５、６、７、８、９、１０、１５、２０個、もしくはそれ以上のサブゲノム間隔、
Ｄ）ＡＢＬ１、ＡＫＴ１、ＡＬＫ、ＡＲ、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、ＣＥＢ
ＰＡ、ＥＧＦＲ、ＥＲＢＢ２、ＦＬＴ３、ＪＡＫ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＮＰＭ
１、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＲＡＲＡ、ＡＫＴ２、ＡＫＴ３、ＭＡＰ２Ｋ４、ＮＯ
ＴＣＨ１、およびＴＰ５３のうちの１つ以上から選択される遺伝子または遺伝子産物由来
の少なくとも５、６、７、８、９、１０、１５、２０個、もしくはそれ以上のサブゲノム
間隔、
Ｅ）前記ＡＢＬ１遺伝子のコドン３１５；ＡＰＣのコドン１１１４、１３３８、１４５
０、もしくは１５５６；ＢＲＡＦのコドン６００；ＣＴＮＮＢ１のコドン３２、３３、３
４、３７、４１、もしくは４５；ＥＧＦＲのコドン７１９、７４６～７５０、７６８、７
９０、８５８、もしくは８６１；ＦＬＴ３のコドン８３５；ＨＲＡＳのコドン１２、１３
、もしくは６１；ＪＡＫ２のコドン６１７；ＫＩＴのコドン８１６；ＫＲＡＳのコドン１
２、１３、もしくは６１；ＰＩＫ３ＣＡのコドン８８、５４２、５４５、５４６、１０４
７、もしくは１０４９；ＰＴＥＮのコドン１３０、１７３、２３３、もしくは２６７；Ｒ
ＥＴのコドン９１８；ＴＰ５３のコドン１７５、２４５、２４８、２７３、もしくは３０
６のうちの１つ以上から選択される変異コドンまたは野生型コドンを含む少なくとも５、
６、７、８、９、１０個、もしくはそれ以上のサブゲノム間隔、
Ｆ）ＡＢＣＢ１、ＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、Ｃ１ｏｒｆ１４４、ＣＹＰ１Ｂ
１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＰ
ＹＤ、ＥＲＣＣ２、ＥＳＲ２、ＦＣＧＲ３Ａ、ＧＳＴＰ１、ＩＴＰＡ、ＬＲＰ２、ＭＡＮ
１Ｂ１、ＭＴＨＦＲ、ＮＱＯ１、ＮＲＰ２、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ
１Ｂ３、ＳＯＤ２、ＳＵＬＴ１Ａ１、ＴＰＭＴ、ＴＹＭＳ、ＵＧＴ１Ａ１、もしくはＵＭ
ＰＳから選択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも５、６
、７、８、９、１０、１５、２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｇ）（ｉ）薬物で治療された癌患者のより良好な生存率、（ｉｉ）パクリタキセル代謝
、（ｉｉｉ）薬物毒性、もしくは（ｉｖ）薬物の副作用のうちの１つ以上に関連した変異
または野生型ＰＧｘ遺伝子もしくは遺伝子産物由来の少なくとも５、６、７、８、９、１
０、１５、２０、２５、３０個、もしくはそれ以上のサブゲノム間隔、
Ｈ）表３に記載の少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、
５０、７５、１１０個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化、
Ｊ）表３に明記される前記癌型由来の固形腫瘍試料における、表３に記載の少なくとも
５、１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１１０個、もしく
はそれ以上の遺伝子または遺伝子産物の転座変化、
Ｋ）表４に記載の少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、
５０、７５、１００、１５０、２００個、もしくはそれ以上の遺伝子または遺伝子産物の
転座変化、
Ｌ）表４に明記される前記癌型由来のヘム腫瘍試料における、表４に記載の少なくとも
５、１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、
２００個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化、
Ｍ）対立遺伝子変異が事前選択された腫瘍型に関連し、前記対立遺伝子変異が前記腫瘍
型の前記細胞の５％未満に存在する、表１、表１Ａ－４から選択される少なくとも５個の
遺伝子もしくは遺伝子産物、
Ｎ）ＧＣが豊富な領域に埋め込まれる表１、表１Ａ－４から選択される少なくとも５個
の遺伝子もしくは遺伝子産物、あるいは
Ｏ）ＢＲＣＡ１、ＢＲＣＡ２、ＥＧＦＲ、ＨＲＡＳ、ＫＩＴ、ＭＰＬ、ＡＬＫ、ＰＴＥ
Ｎ、ＲＥＴ、ＡＰＣ、ＣＤＫＮ２Ａ、ＭＬＨ１、ＭＳＨ２、ＭＳＨ６、ＮＦ１、ＮＦ２、
ＲＢ１、ＴＰ５３、ＶＨＬ、もしくはＷＴ１のうちの１つ以上から選択される癌を発現さ
せる遺伝因子を示す少なくとも５個の遺伝子もしくは遺伝子産物。
[項４５]
以下のＡ～Ｍのうちの１、２、３、４、５、６、７、８、９、１０、１１、１２個、も
しくはすべてから選択される、複数のベイトセット：
Ａ．癌表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択するベイトセ
ット、
Ｂ．参照ヌクレオチド配列由来の１、２、３、４、５、６、７、８、９、１０、１１、
１２、１３、１４、１５、１６、１７、１８、１９、２０個、もしくはそれ以上のコドン
のインフレーム欠失を選択するベイトセット、
Ｃ．遺伝子内欠失を選択するベイトセット、
Ｄ．遺伝子内挿入を選択するベイトセット、
Ｅ．全遺伝子の欠失を選択するベイトセット、
Ｆ．逆位を選択するベイトセット、
Ｇ．染色体間転座を選択するベイトセット、
Ｈ．タンデム重複を選択するベイトセット、
Ｉ．非反復隣接配列に隣接する目的とするヌクレオチド配列を選択するベイトセット、
Ｊ．融合配列に対応する１つ以上のサブゲノム間隔を選択するベイトセット、
Ｋ．高ＧＣ含量ヌクレオチド配列または１つ以上の反復要素および／もしくは逆位反復
を含むヌクレオチド配列から選択される望ましくない特徴を含むヌクレオチド配列に隣接
したサブゲノム間隔を選択するベイトセット、
Ｌ．５’もしくは３’－ＵＴＲ由来のイントロン配列を含むゲノム再編成を選択するベ
イトセット、あるいは
Ｍ．癌関連遺伝子融合物に隣接してエクソンを含むサブゲノム間隔を選択するベイトセ
ット。
[項４６]
請求項４５に記載のベイトセットを作製する方法であって、
前記サブゲノム間隔に対応する１つ以上の腫瘍ベイトオリゴヌクレオチド配列を選択す
ることと、
腫瘍ベイトオリゴヌクレオチド配列のプールを得ることと、
を含む、方法。
[項４７]
癌表現型と正もしくは負に関連した変化の存在または不在を決定するための方法であっ
て、
（ａ）複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
（ｂ）前記ライブラリを複数のベイトセットと接触させることによって事前選択された
配列の前記ライブラリを濃縮して、選択されたメンバーを提供することと、
（ｃ）サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラ
リからの腫瘍メンバーから取得することと、
（ｄ）前記読み取りをアライメント方法を用いてアライメントすることと、
（ｅ）前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
前記方法は、前記試料由来の少なくとも２０、２５、３０個、もしくはそれ以上の遺伝
子または遺伝子産物由来のサブゲノム間隔を配列決定することを含み、前記遺伝子または
遺伝子産物は、ＡＢＬ１、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＫ、ＡＰＣ、ＡＲ、ＢＲ
ＡＦ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＥＢＰＡ、ＣＴＮＮＢ１、ＥＧＦＲ、Ｅ
ＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＨＲＡＳ、ＪＡ
Ｋ２、ＫＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＬ、ＭＹＣ、ＮＦ
１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ３、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、Ｐ
ＩＫ３ＣＧ、ＰＩＫ３Ｒ１、ＰＴＣＨ１、ＰＴＣＨ２、ＰＴＥＮ、ＲＢ１、ＲＥＴ、ＳＭ
Ｏ、ＳＴＫ１１、ＳＵＦＵ、またはＴＰ５３から選択される、
方法。
[項４８]
電子形態、ウェブベース形態、または書面形態で、報告書を、前記患者、または別の人
物もしくは事業体、介護人、医師、癌専門医、病院、診療所、第三者支払人、保険会社、
または官庁に提供することをさらに含む、請求項１～３２のいずれかに記載の方法。
[項４９]
前記報告書は、前記方法からの出力を含み、ヌクレオチド値の特定、前記試料の前記腫
瘍型に関連したサブゲノム間隔における変化、変異、または野生型配列の存在もしくは不
在の指標を含む、請求項４８に記載の方法。
[項５０]
前記報告書は、疾患における配列、変化、変異、または野生型配列の役割に関する情報
を含み、前記情報は、予後、耐性、または可能性のある治療選択肢もしくは推奨される治
療選択肢に関する情報を含む、請求項４８に記載の方法。
[項５１]
前記報告書は、試験で特定され、かつ実施形態において、前記報告書で特定された治療
選択肢の見込みのある有効性、治療選択肢の容認性、または配列、変化、もしくは変異を
有する患者への前記治療選択肢の適用の推奨度に関する情報を含む、請求項４８に記載の
方法。
[項５２]
前記報告書は、薬物の投与、他の薬物と組み合わせた事前選択された投与量または事前
選択された治療レジメンでの前記患者への投与に関する情報もしくは提言を含み得る、請
求項４８に記載の方法。
[項５３]
前記方法で特定されたすべての変異が前記報告書で特定されるわけではなく、前記報告
書は、事前選択された治療選択肢を用いて、治療される前記癌の発生、予後、病期、また
は感受性と事前選択されたレベルの相関関係を有する遺伝子における変異に限定され得る
、請求項４８に記載の方法。
[項５４]
前記報告書は、前記方法を実践する事業体が前記試料を受領してから７、１４、もしく
は２１以内に前記患者または別の人物もしくは前記事業体に提供される、請求項４８に記
載の方法。

Claims

配列決定の方法であって、
溶液中において、複数の標的メンバーを含む核酸ライブラリを複数のベイトと接触させ
て複数のベイト／標的メンバーハイブリッドを含むハイブリダイゼーション混合物を形成
すること、但し、ここで、前記複数のベイトは、点変異を含む第１の標的メンバーを選択
するように構成された第１のベイトセットおよび構造ブレークポイントを含む第２の標的
メンバーを選択するように構成された第２のベイトセットを含み、但し、ここで、第１の
ベイトセットは第１の標的メンバーに対する第１の事前選択された選択効率を有し、第２
のベイトセットは第２の標的メンバーに対する第２の事前選択された選択効率を有し、第
１の事前選択された選択効率が、第２の事前選択された選択効率と少なくとも２倍異なる
；
ベイト／標的メンバーハイブリッドを、前記ハイブリダイゼーション混合物から分離し
、それによって、ライブラリ捕獲物を提供すること、；および
ベイト／標的メンバーハイブリッドの標的メンバーを配列決定すること、但し、ここで
、第１の標的メンバーは、第２の標的メンバーが配列決定される配列決定深度とは少なく
とも２倍異なる配列決定深度で配列決定される；
を含む、前記方法。
次世代配列決定方法を用いて標的メンバーの配列を決定する、請求項１に記載の方法。
第１の標的メンバーが２００倍以上の配列決定深度で配列決定され、第２の標的メンバ
ーが５倍から５０倍の配列決定深度で配列決定される、請求項１に記載の方法。
構造ブレークポイントがインデルである、請求項１から３のいずれか一項に記載の方法
。
構造ブレークポイントが挿入、欠失、逆位または重複の結果である、請求項１から３の
いずれか一項に記載の方法。
構造ブレークポイントが遺伝子融合の結果である、請求項１から３のいずれか一項に記
載の方法。
構造ブレークポイントがゲノム転座構造ブレークポイントである、請求項１から３のい
ずれか一項に記載の方法。
構造ブレークポイントがイントロン中にある、請求項１から３のいずれか一項に記載の
方法。
構造ブレークポイントがエクソン－エクソン接合部である、請求項１から３のいずれか
一項に記載の方法。
前記複数の標的メンバーが、複数の腫瘍メンバーを含む、請求項１から９のいずれか一
項に記載の方法。
サンプルから核酸ライブラリを得ることをさらに含む、請求項１から１０のいずれか一
項に記載の方法。
サンプルが腫瘍サンプルである、請求項１１に記載の方法。
ベイトが、結合実体および標的配列を捕捉するように構成された配列を含む、請求項１
から１２のいずか一項に記載の方法。
結合実体がビオチン分子、ハプテン、抗体、抗体結合断片、ペプチドまたはタンパク質
である、請求項１３に記載の方法。
結合実体がビオチン分子である、請求項１３に記載の方法。
ベイトが、標的配列を捕捉するように構成された配列を含むＲＮＡ分子を含む、請求項
１３から１５のいずれか一項に記載の方法。
核酸ライブラリがＤＮＡを含む、請求項１から１６のいずれか一項に記載の方法。
核酸ライブラリがＲＮＡまたはｃＤＮＡを含む、請求項１から１６のいずれか一項に記
載の方法。
前記複数の標的メンバーを増幅することをさらに含む、請求項１から１８のいずれか一
項に記載の方法。
前記複数のベイトが、１００から３００塩基長のベイトを含む、請求項１から１９のい
ずれか一項に記載の方法。
前記複数のベイトが、第２の構造ブレークポイントを含む第３の標的メンバーを標的化
するように構成された第３のベイトセットをさらに含み、前記第２の構造ブレークポイン
トが、第２の標的メンバーの構造ブレークポイントとは異なったタイプの構造ブレークポ
イントである、請求項１から３および１０から２０のいずれか一項に記載の方法。
前記複数のベイトが、第１のベイトセット、第２のベイトセット、第３のベイトセット
および第４のベイトセットを含み、ここで、前記構造ブレークポイントがインデルであり
、第３のベイトセットが遺伝子融合を含む第３の標的メンバーを標的化するように構成さ
れており、第４のベイトセットがイントロン中に構造ブレークポイントを含む第４の標的
メンバーを標的化するように構成されている、請求項１から３および１０から２０のいず
れか一項に記載の方法。
点変異を含む第１の標的メンバーを選択するように構成された第１のベイトセットおよ
び構造ブレークポイントを含む第２の標的メンバーを選択するように構成された第２のベ
イトセットを含む組成物であって、但し、第１のベイトセットは第１の標的メンバーに対
する第１の事前選択された選択効率を有し、第２のベイトセットは第２の標的メンバーに
対する第２の事前選択された選択効率を有し、第１の事前選択された選択効率が、第２の
事前選択された選択効率と少なくとも２倍異なる、前記組成物。
複数の標的メンバーを含む核酸ライブラリをさらに含む、請求項２３に記載の組成物。
前記核酸ライブラリがサンプルから得られたものである、請求項２４に記載の組成物。
サンプルが腫瘍サンプルである、請求項２５に記載の組成物。
核酸ライブラリがＤＮＡを含む、請求項２５または２６に記載の組成物。
核酸ライブラリがＲＮＡまたはｃＤＮＡを含む、請求項２５から２６のいずれか一項に
記載の組成物。
前記複数の標的メンバーが複数の腫瘍メンバーを含む、請求項２４から２８のいずれか
一項に記載の組成物。
構造ブレークポイントがインデルである、請求項２３から２９のいずれか一項に記載の
組成物。
構造ブレークポイントが挿入、欠失、逆位または重複の結果である、請求項２３から２
９のいずれか一項に記載の組成物。
構造ブレークポイントが遺伝子融合の結果である、請求項２３から２９のいずれか一項
に記載の組成物。
構造ブレークポイントがゲノム転座ブレークポイントである、請求項２３から２９のい
ずれか一項に記載の組成物。
構造ブレークポイントがイントロン中にある、請求項２３から２９のいずれか一項に記
載の組成物。
構造ブレークポイントがエクソン－エクソン接合部である、請求項２３から２９のいず
れか一項に記載の組成物。
第１のベイトセットおよび第２のベイトセット中のベイトが、結合実体および標的配列
を捕捉するように構成された配列を含む、請求項２３から３５のいずか一項に記載の組成
物。
結合実体がビオチン分子、ハプテン、抗体、抗体結合断片、ペプチドまたはタンパク質
である、請求項３６に記載の組成物。
結合実体がビオチン分子である、請求項３７に記載の組成物。
ベイトが、標的配列を捕捉するように構成された配列を含むＲＮＡ分子を含む、請求項
３６から３８のいずれか一項に記載の組成物。
第１のベイトセットおよび第２のベイトセットがそれぞれ、１００から３００塩基長の
ベイトを含む、請求項２３から３９のいずれか一項に記載の組成物。
第２の構造ブレークポイントを含む第３の標的メンバーを標的化するように構成された
第３のベイトセットをさらに含み、前記第２の構造ブレークポイントが、第２の標的メン
バーの構造ブレークポイントとは異なったタイプの構造ブレークポイントである、請求項
２３から２９および３６から４０のいずれか一項に記載の組成物。
第１のベイトセット、第２のベイトセット、第３のベイトセットおよび第４のベイトセ
ットを含み、ここで、前記構造ブレークポイントがインデルであり、第３のベイトセット
が遺伝子融合を含む第３の標的メンバーを標的化するように構成されており、第４のベイ
トセットがイントロン中に構造ブレークポイントを含む第４の標的メンバーを標的化する
ように構成されている、請求項２３から２９および３６から４０のいずれか一項に記載の
組成物。