JP2017525371A

JP2017525371A - 無細胞ＤＮＡ（ｃｆＤＮＡ）の定量的遺伝子解析のための方法

Info

Publication number: JP2017525371A
Application number: JP2017510397A
Authority: JP
Inventors: クリストファーケー．レイモンド，; リーピー．リム，; クリストファーディー．アーマー，
Original assignee: レゾリューションバイオサイエンス，インコーポレイテッド
Priority date: 2014-08-22
Filing date: 2014-08-22
Publication date: 2017-09-07
Anticipated expiration: 2034-08-22
Also published as: EP3194612B1; WO2016028316A1; SG11201701113WA; CA2957657A1; EP4410978A2; DK3194612T3; CN107002118A; EP3194612A1; CN107002118B; CN115029342A; JP6709778B2

Abstract

本発明は、標的にした特定のゲノム座位の遺伝子配列と染色体コピー数両方を単一アッセイにおいて明らかにする、個体の遺伝子解析のための方法を提供する。本発明は、標的遺伝子配列および遺伝子発現プロファイルの高感度で特異的な検出のための方法をさらに提供する。様々な実施形態では、無細胞ＤＮＡ（ｃｆＤＮＡ）の遺伝子解析のための方法であって、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップを含む方法が提供される。

Description

配列表に関する記述
本出願に関連する配列表は、紙コピーの代わりにテキスト形式で提供し、ここでは参照により本明細書に組み入れる。配列表を含むテキストファイルの名称は、ＣＬＦＫ＿００２＿００ＵＳ＿ＳＴ２５．ｔｘｔである。このテキストファイルは１１７ＫＢであり、２０１４年８月２２日に作成したものであり、ＥＦＳ−Ｗｅｂ経由で電子的に提出される。

背景
技術分野
本発明は、一般に、無細胞ＤＮＡ（ｃｆＤＮＡ）の定量的遺伝子解析のための組成物および方法に関する。詳細には、本発明は、ｃｆＤＮＡの遺伝子特徴付けおよび解析のための改善された標的化配列捕捉組成物および方法に関する。

関連技術の記載
最もよく見られるヒトがんのすべてではないにせよ大部分はヒトゲノムの疾患であることが次第に明らかになってきている。個体の生涯の間に体細胞変異が蓄積し、それらの一部は、それらを有する細胞が腫瘍に進展しうる確率を増すという事実が明るみになりつつある（Vogelsteinら、Science ３３９巻（６１２７号）：１５４６〜１５５８頁（２０１３年））。蓄積された変異事象のまさに悪い組合せを有する前がん状態のものは、無制限増殖を抑制する制約を失い、その結果として生ずる細胞塊ががん化する。がんを引き起こすのに必要かつ十分な様々な変異は、まとめて「ドライバー変異」と呼ばれることが多い。最近の徹底した分子解析から浮上した論題の１つは、かつては単一の組織特異的疾患と考えられていたがんが、実際には、各々が特有の分子病態を有する関連疾患の群であるということである。ヒトゲノム計画は、がんのゲノムワイド解析の基礎を作った。

例えば、次世代シークエンシング技術の導入（２００４年現在）は、ＮＳＣＬＣの診断の根拠となる原因ゲノム因子の発見の速度を加速させ、その結果、ＮＳＣＬＣは、実際には、各々が異なる標的療法に応答しうる関連疾患のファミリーであることが明らかになった。

当技術分野には、遺伝疾患の解析のための信頼性のある頑強な分子解析方法がない。旧来、分子診断は、抗体ベースの試験（免疫組織化学）、ＤＮＡプローブを用いるインサイツハイブリダイゼーション（蛍光インサイツハイブリダイゼーション）、および特異的ヌクレオチド配列を照会するハイブリダイゼーションまたはＰＣＲベースの試験からなっている。最近まで、分子診断ツールとしてのＤＮＡシークエンシングは、一般に、１つまたは２つの遺伝子のコーディングエクソンに限られていた。ＤＮＡシークエンシングは、固形がんの診断および処置に使用されているが、これらの方法の最も重大な欠点の１つは、それらが腫瘍組織への直接到達を要することである。そのような材料は、疾患の診断に使用される初期生検から得ることが困難であることが多く、時間をかけて何度も繰り返して得ることは、事実上、不可能である。同様に、生検は、到達し難い腫瘍を有する患者では可能でなく、転移性疾患に罹患している個体には現実的でない。

したがって、遺伝疾患、胎児試験、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、メンデル型遺伝病、遺伝子モザイク、病原体スクリーニング、マイクロバイオームプロファイリングおよび臓器移植モニタリングのための分子診断の巨大な可能性は、まだ実現されていない。今までの、既存の分子診断アプローチには、個々のＤＮＡ分子のクローニングおよび増幅に対する効率的な解決策がなく、試料処理中に生ずる偽陽性シグナルと真の陽性試験結果を区別するのに十分な感度での、シークエンシングの特定のゲノム座位への効率的な標的化に対する解決策もない。

Vogelsteinら、Science ３３９巻（６１２７号）：１５４６〜１５５８頁（２０１３年）

本発明は、一般に、ｃｆＤＮＡの遺伝子解析のための改善された組成物および方法のための組成物および方法に関する。

様々な実施形態では、無細胞ＤＮＡ（ｃｆＤＮＡ）の遺伝子解析のための方法であって、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡライブラリークローンを生成するステップ、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、およびｃｆＤＮＡライブラリークローン中の１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップを含む方法が提供される。

特定の実施形態では、方法は、対象の生体試料からｃｆＤＮＡを単離するステップをさらに含む。

追加の実施形態では、ｃｆＤＮＡは、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液（mucous）および汗からなる群から選択される生体試料から単離される。

ある特定の実施形態では、１つまたは複数のアダプターは、複数のアダプター種を含む。

特定の実施形態では、１つまたは複数のアダプター各々は、ｃｆＤＮＡライブラリーの増幅のためのプライマー結合部位を含む。

さらなる実施形態では、１つまたは複数のアダプター各々は、１つまたは複数のユニークリードコードを含む。

追加の実施形態では、１つまたは複数のアダプター各々は、試料多重化のための１つまたは複数の試料コードを含む。

別の実施形態では、１つまたは複数のアダプター各々は、ＤＮＡシークエンシングのための１つまたは複数の配列を含む。

特定の実施形態では、ｑＰＣＲをｃｆＤＮＡクローンライブラリーに対して行い、ｑＰＣＲ測定値を既知ゲノム当量の標準と比較してｃｆＤＮＡクローンライブラリーのゲノム当量を決定する。

別の特定の実施形態では、Ａｌｕ配列と結合するプライマーおよびアダプター中の配列と結合するプライマーを用いてｑＰＣＲを行う。

ある特定の実施形態では、定量的遺伝子解析を、ｃｆＤＮＡライブラリークローン中の複数の遺伝子座位に対して行う。

さらなる実施形態では、定量的遺伝子解析を、複数のｃｆＤＮＡクローンライブラリー中の複数の遺伝子座位に対して行う。

追加の実施形態では、定量的遺伝子解析は、１つまたは複数の捕捉プローブを標的遺伝子座位にハイブリダイズさせて、捕捉プローブ−ｃｆＤＮＡクローン複合体を形成することを含む。

特定の実施形態では、定量的遺伝子解析は、捕捉プローブ−ｃｆＤＮＡクローン複合体を単離することを含む。

ある特定の実施形態では、定量的遺伝子解析は、単離されたハイブリダイズした捕捉プローブ−ｃｆＤＮＡクローン複合体中のｃｆＤＮＡクローン配列の増幅を含む。

さらなる実施形態では、定量的遺伝子解析は、複数のシークエンシングリードを生成するためのＤＮＡシークエンシングを含む。

別の実施形態では、定量的遺伝子解析は、複数のシークエンシングリードのバイオインフォマティック解析を含む。

特定の実施形態では、バイオインフォマティクス解析は、ｃｆＤＮＡクローンライブラリー中の解析されるゲノム当量の数を定量するため、標的遺伝子座位における遺伝子バリアントを検出するため、標的遺伝子座位内の変異を検出するため、標的遺伝子座位内の遺伝子融合を検出するため、および標的遺伝子座位内のコピー数増減を測定するために使用される。

追加の実施形態では、対象は、遺伝疾患を有さない。

ある特定の実施形態では、対象は、遺伝疾患と診断されていない。

別のある特定の実施形態では、対象は、遺伝疾患と診断されている。

別の実施形態では、定量的遺伝子解析は、遺伝疾患を引き起こすまたは遺伝疾患に関連する１つまたは複数の遺伝子病変を同定または検出するために使用される。

ある特定の実施形態では、遺伝子病変は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。

特定の実施形態では、遺伝子病変は、ＡＬＫ遺伝子の３’コード領域を別の遺伝子に融合させるゲノム再編成を含む。

特定の実施形態では、ＡＬＫ遺伝子の３’コード領域がＥＭＬ４遺伝子に融合している。

別の実施形態では、遺伝疾患はがんである。

さらなる実施形態では、対象は妊娠している。

追加の実施形態では、定量的遺伝子解析は、胎児ｃｆＤＮＡ中の１つまたは複数の標的遺伝子座位の１つまたは複数の遺伝子バリアントまたは遺伝子病変を同定または検出するために使用される。

特定の実施形態では、対象は移植レシピエントである。

追加の実施形態では、定量的遺伝子解析は、対象におけるドナーｃｆＤＮＡを同定または検出するために使用される。

様々な実施形態では、対象における遺伝疾患を予測、診断またはモニターする方法であって、対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、およびｃｆＤＮＡクローンライブラリー中の遺伝疾患に関連する１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップを含み、１つまたは複数の標的遺伝子座位における１つまたは複数の遺伝子病変の同定または検出が、遺伝疾患の予後を予測し、それを診断し、またはその進行をモニターする、方法が提供される。

追加の実施形態では、ｃｆＤＮＡは、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される。

さらなる実施形態では、ＡＬＫ遺伝子の３’コード領域がＥＭＬ４遺伝子に融合している。

特定の実施形態では、遺伝疾患はがんである。

様々な実施形態では、遺伝疾患のコンパニオン診断であって、対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、およびｃｆＤＮＡクローンライブラリー中の遺伝疾患に関連する１つまたは複数のバイオマーカーの定量的遺伝子解析を行うステップを含み、１つまたは複数のバイオマーカーの少なくとも１つの検出、または検出できないことが、対象を遺伝疾患について処置すべきかどうかを示す、コンパニオン診断が提供される。

特定の実施形態では、ｃｆＤＮＡは、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される。

追加の実施形態では、バイオマーカーは遺伝子病変である。

特定の実施形態では、遺伝子病変は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。

追加の実施形態では、遺伝子病変は、ＡＬＫ遺伝子の３’コード領域を別の遺伝子に融合させるゲノム再編成を含む。

ある特定の実施形態では、遺伝疾患はがんである。

図１は、ユニークリードのフィルタリング不在下での混合希釈度の関数としての期待対観測バリアント頻度を示す図である。ユニークリードのフィルタリング不在下で、これら４つの選択位置でのランダムな塩基変化が、測定可能な非ゼロ頻度で発生した。このことから特定の一塩基バリアント（ＳＮＶ）を検出するための感度を欠いていることが立証される。

図２は、図１で生成したデータに対して行ったユニークリードのフィルタリングを示す図である。左手のパネルは、ユニークリードのフィルタリングなしでのＢＲＡＦＩ３２６ＴＳＮＶに関する図１からのデータを示す。右手のパネルは、同じデータのユニークリードフィルタリングの使用が、アッセイ感度を増加させ、真のシグナルと間違いの元となるノイズの区別を可能にしたことを示す。

図３は、捕捉プローブ性能を長さおよび洗浄温度の関数として示す図である。ｙ軸は、各捕捉プローブに関連するリードの総数を示す。棒グラフの棒は、２つのカテゴリーに分けられており、白棒は、意図した捕捉プローブ標的にアラインするオンターゲットリードに対応し、黒棒は、捕捉プローブに関連するがゲノムの意図せぬ領域にマッピングされるオフターゲットリードを示す。全体的に見て、４０ｍｅｒおよび６０ｍｅｒ捕捉プローブは、４４℃および４７℃の洗浄では実質的に同じように機能する。５０℃の洗浄に関しては、４０ｍｅｒ捕捉プローブは不規則に機能する。これらのデータは、約４４℃〜約４７℃の範囲の洗浄温度での４０ｍｅｒ捕捉プローブの使用の正当性を立証する。

図４は、ＡＬＫ遺伝子の第１９イントロンの標的化し配向させたシークエンシングの概略図を示す図である。Ａ）「野生型」参照配列では、アンチセンス配向のＡＬＫ捕捉プローブは、第１９イントロンからの配列を同定する。Ｂ）病原性融合遺伝子の場合、一部のＡＬＫ捕捉プローブは、遺伝子融合事象に関連するジャンクション配列を同定することになる。

図５は、標的領域の完全シークエンシングのための高密度捕捉プローブ配置の概略図を示す図である。各捕捉プローブは、各塩基位置での累積カバレッジをもたらす一群の配列を捕捉する。ここでは、カバレッジを線によって表し、その線の振幅が、特定の捕捉プローブに由来するカバレッジの深度を示す。隣接する捕捉プローブからの重複するカバレッジによって、可能性のある両方の方向の標的領域の完全シークエンシングが提供される。加えて、相対する鎖の捕捉プローブのヘッドトゥーヘッド配置によって、すべての捕捉プローブ結合部位が確実にシークエンシングされる。

図６は、ライブラリー構築に使用した断片化ＤＮＡのサイズ分布の代表例を示す図である。

図７は、代表実験における高密度４０ｍｅｒ捕捉プローブの性能を示す図である。ｙ軸は、リードの総数を示し、それがオンターゲットリード、オフターゲットリードおよびマッピング不能リードとして分割されている。ｘ軸は、配列捕捉のためにこの実験で使用した１０５の捕捉プローブの各々を列挙するものである。

図８は、高密度４０ｍｅｒ捕捉プローブを使用する標的領域の累積カバレッジの代表例を示す図である。ここに示されているのは、ＴＰ５３コーディングエクソンの累積カバレッジである。

図９Ａは、無細胞ＤＮＡ（ｃｆＤＮＡ）ライブラリーのサイズ分布の代表例を示す図である。主要バンドは、９０ｂｐのアダプターにライゲーションした一群の１７０±１０ｂｐ断片と一致する。図９Ｂは、ｃｆＤＮＡの公開されているゲル画像と、本明細書において開示および／または企図される方法を使用して生成した代表ｃｆＤＮＡライブラリーとを示す図である。定性的「ラダー」の外観は、ライブラリーに保存されるが、ライブラリーは、９０ｂｐのアダプター配列の付加によってより高い質量にシフトされる。図９Ｃは、卵巣がん患者（ＯｖＣ）および「健常ドナー」（ＨＤ）からのゲノム、血漿由来ｃｆＤＮＡライブラリーの代表例を示す図である。

図１０は、４つの血漿試料から得た８つのｃｆＤＮＡライブラリーにわたるユニークリード数を示す図である。この試料２３４０７を用いたライブラリー構築前の断片化（ｆｒａｇ）はライブラリー収量を２倍より大きく増加させた。

図１１は、ＴＰ５３遺伝子の領域全域のｃｆＤＮＡの代表リードカバレッジを示す図である。「ＴＰ５３＿ＮＭ＿０００５４６＿ｃｈｒ１７：７５７９３５１：ｒｅｇｉｏｎ＿３：２８０ｎｔ：４１：８０：ｒ」捕捉プローブ（配列番号２０１）によって捕捉された２４個の１３１ｂｐリードをランダムに選択し、ＵＣＳＣゲノムブラウザ内のＢＬＡＴアルゴリズムを使用してアラインした。２１個のリードが標的領域にマッピングされ、カバレッジが重複するパターンでそのようにされる。これらのリードを捕捉するために使用したプローブに矢印を付けてある。

図１２は、ｃｆＤＮＡゲノムライブラリーからのＴＰ５３遺伝子のコード領域の標的化ＤＮＡシークエンシングの大要を示す図である。カバレッジ（横軸）は、１０個すべてのコード領域にわたって伸び、ｍＲＮＡスプライシングに関与するイントロン領域を含む。シークエンシングの深度（縦軸）は、最大４８５１に達し、全コーディングエクソンにわたって均一である。

図１３は、ＡＣＡ２ベースのアッセイにおけるｑＰＣＲ推定ゲノム当量に対するユニークリード数のプロットを示す図である。Ｙ軸のリード数に対してＸ軸にｑＰＣＲ測定値を示す。これらの測定値間の完全な一致を対角線として示す。測定値間の相関は、特により低いゲノムインプットでは、あったとしても非常に不良であった。これらのデータは、ＡＣＡ２ベースのｑＰＣＲアッセイが、ライブラリー複雑度を慢性的に過小推定し、ゲノム当量の測定に不適切であることを示す。

図１４は、ゲノム反復配列特異的プライマー（例えばＡｌｕ）と長いアダプター特異的プライマーを対にするｑＰＣＲゲノム当量測定アッセイのコアエレメントの概略図を示す図である。（Ａ）ＡＣＡ２という名の単一の２５ｎｔプライマー（プライマー１）を使用する標準ライブラリー増幅。（Ｂ）より長い、５８ｎｔバージョンＡＣＡ２プライマー（プライマー２）は、ステム−ループ抑制のためゲノムライブラリーを増幅させない。（Ｃ）コンセンサスヒトＡｌｕ反復配列エレメントに指向されたフォワードおよびリバースプライマー（プライマー３および４）は、何千もの座位を認識し、ゲノムＤＮＡを容易に増幅させる。（Ｄ）ロングＡＣＡ２プライマー（プライマー２）と対にした、フォワードまたはリバースどちらか一方の単独の単一Ａｌｕプライマー（プライマー３またはプライマー４）は、ゲノムＤＮＡを増幅させない。（Ｅ）（Ｄ）の場合と同じプライマー対は、Ａｌｕ配列を含有するゲノムｃｆＤＮＡライブラリークローンを容易に増幅させる。

図１５は、ゲノム当量のＡｌｕプラスアダプターベースのｑＰＣＲアッセイについての概念実証データを示す図である。（Ａ）様々なＰＣＲプライマーでの１０ｐｇの標準ゲノムライブラリーの増幅。ｘ軸は、増幅に使用したＰＣＲプライマーを特定し、Ｙ軸（ｌｏｇスケール）は、測定したＰＣＲシグナルを単位ｆｇ／μＬで示す。標準ＡＣＡ２プライマーは、予想通り、強いシグナルを生成した。ＡＣＡ２ロングプライマーは、ＰＣＲ抑制のためシグナルを生成できなかった。２つのＡｌｕプライマー対は両方とも、ＡＣＡ２量の１％でシグナルを生成した。これは、クローンの１％が増幅可能なＡｌｕ配列を有することを示唆する。ロングＡＣＡ２プライマーと任意のＡｌｕプライマーとの組合せも、クローンの約１％においてシグナルを生成した。（Ｂ）１０ｐｇのゲノムＤＮＡ（左側４試料）または１０ｐｇのライブラリーＤＮＡ（右側４クローン）に対する検証。Ａｌｕプライマー対は、ゲノムＤＮＡまたはゲノムライブラリーから同等のシグナルを増幅させる。対照的に、ＡｌｕプライマーおよびロングＡＣＡ２プライマーからなるプライマー対は、ゲノムＤＮＡをあまり増幅させない（Ｌ＋Ａ１Ｆ）か、全く増幅させない（Ｌ＋Ａ１Ｒ）。これらの同じ対は、Ａｌｕプライマー対からのシグナルをわずかに上回るライブラリー増幅を示す。

図１６は、ＡＣＡ２プライマーｑＰＣＲアッセイとＡｌｕ−ＡＣＡ２ロング−プライマーｑＰＣＲアッセイの直接比較を示す図である。ＡｌｕＡＣＡ２ロング−プライマーｑＰＣＲアッセイは、シークエンシングデータから導出されるユニークリード数とより一致する、検出可能なゲノム当量の８倍増加を示す。

図１７は、解析されるゲノム当量を正確に決定する高感度、定量的遺伝子アッセイのアダプター構造および機能の代表例を示す図である。（Ａ）アダプターライゲーション鎖の詳細な構造。番号を付けた各エレメントに関する詳細は実施例４で提供する。（Ｂ）４５ｎｔライゲーション鎖および１２ｎｔパートナーオリゴ鎖とで形成された二本鎖は、末端修復ｃｆＤＮＡ断片（黒棒）と適合性の平滑末端ライゲーション基質を生成する。（Ｃ）ライゲーション後、ライゲーション鎖の相補体がＤＮＡポリメラーゼ媒介フィルイン反応によって生成される。

図１８は、ｃｆＤＮＡを模倣するように処理した２つのＤＮＡ試料（ＮＡ０６９９４およびＮＣＩ−Ｈ２２２８）のサイズ分布の代表例を示す図である。

図１９は、正常ゲノムＤＮＡ（Ｎ）と混合した腫瘍試料ＤＮＡ（Ｈ２２２８）におけるＴＰ５３点変異Ｑ３３１^＊の検出感度の代表例を示す図である。最高感度の検出は、遺伝子の正常なコピー１０００個中、ＴＰ５３の変異体コピー約１個に相当する。

図２０は、本明細書において企図される組成物および方法を使用する、細胞株ＮＣＩ−Ｈ２２２８内にあるＥＭＬ４−ＡＬＫ融合遺伝子についてのジャンクション配列の正確な決定を示す図である。

図２１は、正常ゲノムＤＮＡ（Ｎ）と混合したＥＭＬ４−ＡＬＫ融合遺伝子腫瘍試料ＤＮＡ（Ｈ２２２８）の検出を示す図である。この融合体は、ＮＣＩ−Ｈ２２２８細胞株中にヘテロ接合体として存在するので、最高感度の検出は、ＡＬＫ遺伝子の正常染色体コピー約１００個（５０ゲノム当量）中、遺伝子融合体１個に相当する。

図２２は、正常ヒトＤＮＡ（Ｎ）へと希釈される細胞株ＮＣＩ−Ｈ６９（Ｈ６９）の混合物におけるＭＹＣＮ遺伝子増幅の検出を示す図である。２つの正常二倍体コピーの閾値を赤い破線として示す。

図２３は、３名の異なるがん患者のＴＰ５３遺伝子において検出されたＤＮＡ変異を示す図である。規範的遺伝子モデルを図の上部に示す。ピークは、ＤＮＡ配列カバレッジ（Ｘ軸）および深度（Ｙ軸）を表す。シークエンシングの深度は、解析したすべての試料について、＞４０００ゲノム当量であった。その遺伝子モデルの下の第７エクソンの拡大図は、検出されたすべての変異が局在定位された位置を示す。ｃｆＤＮＡ（血漿）、腫瘍組織および正常隣接組織における変異体検出頻度を入手可能な場合は示す（ＮＡ−入手不能）。ＯＶＡ１およびＯＶＡ２は、卵巣がん患者であり、ＣＲＣ４０６およびＣＲＣ４０７は、結腸直腸がん患者である。ＯＶＡ１試料のいずれにおいてもＴＰ５３の変異は見いだされなかった。

図２４は、より大きい１３遺伝子パネル（四角で囲われているもの）のＤＮＡシークエンシングを示す図である。このシークエンシングによって、卵巣がん患者ＯＶＡ１からのｃｆＤＮＡおよび腫瘍においてＫＲＡＳ変異が同定された。

図２５は、より大きい１２遺伝子パネルのＤＮＡシークエンシングを示す図である。このシークエンシングによって、結腸直腸がん患者ＣＲＣ４０７の血漿においてＥＲＢＢ２遺伝子増幅が同定された。

Ａ．大要
本発明は、一部には、無細胞ＤＮＡ（ｃｆＤＮＡ）を使用する個体の遺伝子状態の定量的遺伝子解析のための組成物および方法を企図している。本明細書で使用する場合、用語「遺伝子状態」は、遺伝性状態または遺伝疾患についての原因とならない正常配列に関係するまたは原因となる配列に関係するゲノムにおける１つまたは複数の標的ゲノム配列の配列を指す。一実施形態では、遺伝子状態の解析は、標的遺伝子座位における遺伝子バリアントの同定、定量またはモニタリングを指し、バリアントは参照配列（例えば、正常または変異配列）に対して異なる。本発明者らは、真の陽性を偽陽性と区別する感度の欠如、個々のＤＮＡ分子の非効率的なクローニングおよび増幅、ならびにシークエンシングの特異的ゲノム座位への非効率的な標的化に関連する、遺伝性状態または遺伝疾患の分子診断上の問題の解決策を提供した。本明細書において企図される解決策は、試料処理中に生ずる偽陽性シグナルと真の陽性試験結果を区別するのに十分な感度を有する信頼性のある頑強な定量的遺伝子解析のための組成物および方法を含む。

次世代シークエンシング技術は、がん、胎児診断、親子鑑定、病原体スクリーニングおよび臓器移植モニタリングを含む様々なシナリオでの分子診断に広範なゲノム調査を加える機会を与えている。遺伝疾患との関連で、次世代シークエンシング情報は、遺伝子機能を変化させる可能性が高い遺伝子内の変異を同定するために、細胞内の遺伝物質の増加または減少を同定するため、および正常な健常細胞では見いだされないゲノム再編成を同定するために臨床の場で使用されている。これらの広範な診断調査の結果は、患者の処置を導出するために使用されることが多い。

しかし、個体の遺伝子状態または遺伝性状態もしくは遺伝疾患の診断および処置におけるＤＮＡシークエンシングの潜在的利点より、試料を得るために罹患組織に直接到達する必要性のほうが上回る。そのような材料は、疾患の診断に使用される初期生検から得ることが困難であることが多く、時間をかけて何度も繰り返して得ることは、事実上、不可能である。同様に、がん患者の場合、生検は、到達し難い腫瘍を有する患者では可能でなく、転移性疾患に罹患している個体には現実的でない。対照的に、本発明者らのアプローチは、すべての組織が生存するために脈管構造への到達を必要とし、結果としてこれらの塊が体液中にＤＮＡを堆積させるという事実に由来する。罹病細胞のＤＮＡを見つけられる体液の１つの主要な貯蔵所はヒト血液の血漿である。

浅いゲノムワイド配列カバレッジに依存する試験方法とは対照的に、個体の遺伝子状態、遺伝疾患、メンデル型遺伝病、遺伝子モザイク、胎児試験、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、病原体スクリーニング、マイクロバイオームプロファイリング、および臓器移植モニタリングのための本明細書において企図される分子診断は、ｃｆＤＮＡの入手可能性を活用して、選択された標的遺伝子の深い配列カバレッジをもたらす。加えて、本明細書において企図されるｃｆＤＮＡベースのがん診断には、タンパク質機能を変化させる体細胞配列変動、キメラ遺伝子融合を生じさせる大規模染色体再編、および遺伝子コピーの減少または増加を含むコピー数変動を含む、様々な遺伝子変化を検出する能力がある。企図される組成物および方法を使用すると、健常組織内で起こる正常な代謝回転プロセスが一因となるｃｆＤＮＡ内の正常配列の有意な希釈またはそのような正常配列の混合にもかかわらず、これらの変化を検出でき、定量できる。本明細書において企図される組成物および方法は、疾患の原因となる低頻度遺伝子変化の検出に関連する大きな課題、すなわち、ｃｆＤＮＡが高度に断片化されること、ｃｆＤＮＡレベルが、異なる個体間で実質的に異なること、および正常配列に対する罹病配列の混合度が、患者間で、同じ分子病および病期に罹患している個体の中でさえ、高度に可変的であることにもうまく対処する。

様々な実施形態では、遺伝子解析のための組成物および方法は、生体液試料および糞便試料中のＤＮＡ画分を調べることを含む。本明細書において企図される方法は、様々な生物源から入手できるｃｆＤＮＡを使用する分子遺伝子解析に対処するための新規包括的フレームワークを提供する。精製ｃｆＤＮＡのクローニングは、下流の解析のための情報を与え、結果として生ずるクローンライブラリーの増幅を可能にするタグ付きｃｆＤＮＡ配列を導入する。標的特異的オリゴヌクレオチドを用いるハイブリッド捕捉が、その後の解析のための特異的配列を検索するために使用される。ライブラリー中に存在するゲノムの数の独立した測定が各試料に適用され、これらのアッセイが、そのアッセイの感度を推定するための手段を提供する。本明細書において企図されるアッセイは、遺伝子状態、遺伝性状態または遺伝疾患を解析、検出、診断またはモニターするための信頼性のある、再現性のある、頑強な方法を提供する。

本発明の特定の実施形態の実施は、特に相反する指示がない限り、当技術分野の技術の範囲内である化学、生化学、有機化学、分子生物学、微生物学、組換えＤＮＡ技術、遺伝学、免疫学および細胞生物学の従来の方法を利用することになり、これらの方法の多くを説明のために下に記載する。そのような技術は、文献で十分に説明されている。例えば、Sambrookら、Molecular Cloning: A Laboratory Manual（第３版、２００１年）；Sambrookら、Molecular Cloning: A Laboratory Manual（第２版、１９８９年）；Maniatisら、Molecular Cloning: A Laboratory Manual（１９８２年）；Ausubelら、Current Protocols in Molecular Biology（John Wiley and Sons、２００８年７月改定）；Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology、Greene Pub.Associates and Wiley-Interscience；Glover、DNA Cloning: A Practical Approach、ＩおよびＩＩ巻（IRL Press、Oxford、１９８５年）；Anand、Techniques for the Analysis of Complex Genomes（Academic Press、New York、１９９２年）；Transcription and Translation（B. HamesおよびS. Higgins編、１９８４年）；Perbal、A Practical Guide to Molecular Cloning（１９８４年）；ならびにHarlowおよびLane、Antibodies（Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、１９９８年）を参照されたい。

Ｂ．定義
別段の定義がない限り、本明細書において使用するすべての専門および科学用語は、本発明が属する技術分野の当業者によって一般に理解されているのと同じ意味を有する。本明細書に記載のものと同様または等価の任意の方法および材料を本発明の実施または試験に使用してもよいが、組成物、方法および材料の好ましい実施形態を本明細書に記載する。本発明のために、以下の用語を下で定義する。

冠詞「ａ」、「ａｎ」および「ｔｈｅ」は、その冠詞の文法上の目的語の１つまたは１つより多く（すなわち少なくとも１つ）を指すために本明細書では使用する。例として、「要素（ａｎｅｌｅｍｅｎｔ）」は、１つの要素または１つより多くの要素を意味する。

選択肢（例えば「または」）の使用は、選択肢のどちらか一方、両方、またはそれらの任意の組合せを意味すると理解するべきである。

用語「および／または」は、選択肢のどちらか一方、または両方を意味すると理解するべきである。

本明細書で使用する場合、用語「約」または「おおよそ」は、参照数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さに対して１５％、１０％、９％、８％、７％、６％、５％、４％、３％、２％または１％ほど変る数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さを指す。一実施形態では、用語「約」または「おおよそ」は、参照数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さについての±１５％、±１０％、±９％、±８％、±７％、±６％、±５％、±４％、±３％、±２％または±１％の数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さの範囲を指す。

本明細書を通して、文脈上他の意味に解すべき場合を除き、語「〜を含む（ｃｏｍｐｒｉｓｅ）」、「〜を含む（ｃｏｍｐｒｉｓｅｓ）」および「〜を含むこと（ｃｏｍｐｒｉｓｉｎｇ）」は、述べられているステップもしくは要素またはステップもしくは要素の群の包含を含意するが、他のいかなるステップもしくは要素またはステップもしくは要素の群の除外も含意しないと理解されるであろう。特定の実施形態では、用語「〜を含む（ｉｎｃｌｕｄｅ）」、「〜を有する（ｈａｓ）」、「〜を含有する（ｃｏｎｔａｉｎｓ）」および「〜を含む（ｃｏｍｐｒｉｓｅ）」を同義で使用する。

「〜からなる」は、その句「〜からなる」の後に続くものを何であれ含み、それに限定されることを意図する。したがって、句「〜からなる」は、挙げられている要素が必要とされ、または必須であること、および他の要素が存在し得ないことを示す。

「〜から本質的になる」は、この句の後に挙げられており、その挙げられている要素についての開示の中で指定されている活性または作用に干渉も寄与もしない他の要素に限定されるあらゆる要素を含むことを意図する。したがって、句「〜から本質的になる」は、挙げられている要素が必要とされるまたは必須であるが、他の要素は、任意選択ではなく、挙げられている要素の活性または作用にそれらが影響を与えるか否かに応じて存在してもしなくてもよいことを示す。

本明細書を通して「一実施形態」、「ある実施形態」、「特定の実施形態」、「関連実施形態」、「ある特定の実施形態」、「追加の実施形態」もしくは「さらなる実施形態」またはこれらの組合せへの言及は、その実施形態に関連して記載する特定の特徴、構造または特性が本発明の少なくとも一実施形態に含まれることを意味する。したがって、本明細書を通して様々な箇所での上述の句の出現は、必ずしもすべてが同じ実施形態に言及していない。さらに、特定の特徴、構造または特性を１つまたは複数の実施形態においていずれの好適な様式で組み合わせてもよい。

本明細書で使用する場合、用語「単離された」は、そのネイティブ状態で通常はそれに付随する成分が実質的にまたは本質的にない物質を意味する。特定の実施形態では、用語「得られた」または「由来する」を単離されたと同義で使用している。

本明細書で使用する場合、用語「ＤＮＡ」は、デオキシリボ核酸を指す。様々な実施形態では、用語ＤＮＡは、ゲノムＤＮＡ、組換えＤＮＡ、合成ＤＮＡまたはｃＤＮＡを指す。一実施形態では、ＤＮＡは、ゲノムＤＮＡまたはｃＤＮＡを指す。特定の実施形態では、ＤＮＡは、「標的領域」を含む。本明細書において企図されるＤＮＡライブラリーは、ゲノムＤＮＡライブラリーおよびＲＮＡ（例えば、ＲＮＡ発現ライブラリー）から構築されたｃＤＮＡライブラリーを含む。様々な実施形態では、ＤＮＡライブラリーは、１つまたは複数の追加のＤＮＡ配列および／またはタグを含む。

「標的遺伝子座位」または「ＤＮＡ標的領域」は、ＤＮＡ配列内の目的の領域を指す。様々な実施形態では、標的化遺伝子解析は、標的遺伝子座位に対して行われる。特定の実施形態では、ＤＮＡ標的領域は、特定の遺伝子状態、遺伝性状態、遺伝疾患、胎児試験、遺伝子モザイク、親子鑑定、薬物処置に対する応答の予測、病状の診断もしくはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニング、または臓器移植モニタリングに関連する遺伝子の領域である。

本明細書で使用する場合、用語「循環ＤＮＡ」、「循環無細胞ＤＮＡ」および「無細胞ＤＮＡ」は、多くの場合、交換可能に使用しており、細胞外ＤＮＡであるＤＮＡ、細胞から押し出されたＤＮＡ、または壊死もしくはアポトーシス細胞から放出されたＤＮＡを指す。

本明細書で使用される「対象」、「個体」または「患者」は、本明細書において企図される組成物で検出または同定することができる状態の症状を示すあらゆる動物を含む。好適な対象は、実験動物（例えばマウス、ラット、ウサギまたはモルモット）、家畜（例えばウマ、ウシ、ヒツジ、ブタ）、および飼育動物またはペット（例えばネコまたはイヌ）を含む。特定の実施形態では、対象は哺乳動物である。ある特定の実施形態では、対象は非ヒト霊長類であり、好ましい実施形態では、対象はヒトである。

Ｃ．無細胞ＤＮＡの遺伝子解析の方法
様々な実施形態では、ｃｆＤＮＡの遺伝子解析のための方法が提供される。

特定の実施形態では、ｃｆＤＮＡの遺伝子解析のための方法は、ｃｆＤＮＡライブラリーを生成し、増幅させるステップ、ｃｆＤＮＡライブラリー中のゲノム当量の数を決定するステップ、および１つまたは複数のゲノム標的座位の定量的遺伝子解析を行うステップを含む。

ｃｆＤＮＡの遺伝子解析のための方法は、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成し、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡライブラリークローンを生成するステップ、ｃｆＤＮＡライブラリークローンのゲノム当量の数を決定するステップ、およびｃｆＤＮＡライブラリークローン中の１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップを含む。

１．ｃｆＤＮＡライブラリーの生成
特定の実施形態では、本明細書において企図される遺伝子解析の方法は、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、および末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップを含む、ｃｆＤＮＡライブラリーを生成するステップを含む。

（ａ）無細胞ＤＮＡ（ｃｆＤＮＡ）
本明細書において企図される方法および組成物は、無細胞ＤＮＡ（ｃｆＤＮＡ）を分析物として使用して遺伝子状態、遺伝性状態、遺伝疾患、遺伝子モザイク、胎児診断、親子鑑定、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植モニタリングを効率的に解析、検出、診断および／またはモニターするように設計される。ｃｆＤＮＡのサイズ分布は、約１５０ｂｐ〜約１８０ｂｐ断片の範囲である。断片化は、エンドヌクレアーゼ切断活性および／またはエキソヌクレアーゼ切断活性の結果でありえ、ｃｆＤＮＡの正確で信頼性のある頑強な解析に厄介な課題を提示する。ｃｆＤＮＡの解析のもう１つの課題は、約１５分程度の血流中でのその短い半減期である。いかなる特定の理論にも拘束されることを望むものではないが、本発明は、一部には、ｃｆＤＮＡの解析が、「リキッドバイオプシー」のようなものであって、現状の生物学的過程のリアルタイムスナップショットであることを企図している。

さらに、ｃｆＤＮＡは細胞内では見いだされず、生体液および糞便試料を含むが、これらに限定されないいくつかの好適な源から得ることができるので、解析する組織への直接到達などの次世代シークエンシング解析を悩ませる既存の制限を受けない。

特定の実施形態でのｃｆＤＮＡを単離するための好適な源である生体液の実例としては、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、粘液および汗が挙げられるが、これらに限定されない。

特定の実施形態では、生体液は、血液または血漿である。

ある特定の実施形態では、市販のキットおよび当業者に公知の他の方法を使用して、患者の生体液から、あるいは以前に得た、例えば、凍結および／またはＥＤＴＡ、ＥＧＴＡ、もしくは二価カチオンに特異的な他のキレート剤を含むがこれらに限定されない酵素キレート剤の添加によって必要に応じて安定化された生体試料から、直接ｃｆＤＮＡを単離することができる。

（ｂ）末端修復ｃｆＤＮＡの生成
特定の実施形態では、ｃｆＤＮＡライブラリーの生成は、単離されたｃｆＤＮＡの末端修復を含む。断片化ｃｆＤＮＡを末端修復酵素によって処理して、平滑末端、５’−オーバーハングまたは３’−オーバーハングを有する、末端修復ｃｆＤＮＡを生成する。一部の実施形態では、末端修復酵素は、例えば産出することができる。一部の実施形態では、末端修復ｃｆＤＮＡは、平滑末端を含有する。一部の実施形態では、末端修復ｃｆＤＮＡは、平滑末端を含有するように処理される。一部の実施形態では、末端修復ｃｆＤＮＡの平滑末端は、単一塩基対オーバーハングを含有するようにさらに修飾される。一部の実施形態では、平滑末端を含有する末端修復ｃｆＤＮＡを、アデニン（Ａ）／チミン（Ｔ）オーバーハングを含有するようにさらに処理することができる。一部の実施形態では、平滑末端を含有する末端修復ｃｆＤＮＡを、単一塩基対オーバーハングとしてアデニン（Ａ）／チミン（Ｔ）オーバーハングを含有するようにさらに処理することができる。一部の実施形態では、末端修復ｃｆＤＮＡは、鋳型なし３’オーバーハングを有する。一部の実施形態では、末端修復ｃｆＤＮＡは、３’オーバーハングを含有するように処理される。一部の実施形態では、末端修復ｃｆＤＮＡは、３’オーバーハングを含有するようにターミナルトランスフェラーゼ（ＴｄＴ）で処理される。一部の実施形態では、ＧテールをＴｄＴによって付加させることができる。一部の実施形態では、末端修復ｃｆＤＮＡは、任意の公知の制限酵素で（例えば、酵素Ｓａｕ３Ａなどで）の部分消化を使用してオーバーハング末端を含有するように処理される。

（ｃ）末端修復ｃｆＤＮＡへのアダプター分子のライゲーション
特定の実施形態では、ｃｆＤＮＡライブラリーの生成は、末端修復ｃｆＤＮＡの各末端への１つまたは複数のアダプターのライゲーションを含む。本発明は、一部には、ｃｆＤＮＡライブラリー中の多数のゲノム当量に対応するように設計されたアダプターモジュールを企図している。アダプターモジュールは、ｃｆＤＮＡライブラリー中に存在するゲノム当量の数、およびその延長で、配列変異を同定するために使用されるシークエンシングアッセイの感度を測定するように構成される。

本明細書で使用する場合、用語「アダプターモジュール」は、少なくとも５つのエレメント：（ｉ）単一プライマーライブラリー増幅のためのＰＣＲプライマー結合部位を含む第１のエレメント、（ｉｉ）一意的に同定された各シークエンシングリードに作用する５ヌクレオチドリードコードを含む第２のエレメント、（ｉｉｉ）異なる試料を識別し、シークエンシングラン中に試料多重化を可能にするための３ヌクレオチド試料コードを含む第３のエレメント、（ｉｖ）シークエンシングリードの中の適正な塩基コールの校正を可能にし、パートナーオリゴヌクレオチドへのハイブリダイゼーションのためのアンカーとして作用する、１２ヌクレオチドアンカー配列を含む第４のエレメント、および（ｖ）エレメント４の２つの３’末端ヌクレオチドを含む第５のエレメント（図１７および表１２〜１６）を含むポリヌクレオチドを指す。アダプターモジュールを、エレメント４に相補的であるパートナーオリゴヌクレオチドにハイブリダイズさせて、ｃｆＤＮＡ、必要に応じて末端修復され平滑末端化されたｃｆＤＮＡの末端へのライゲーションに好適なアダプターを形成する。

特定の実施形態では、アダプターモジュールは、１つまたは複数のＰＣＲプライマー配列、１つまたは複数のリードコード、１つまたは複数の試料コード、１つまたは複数のアンカー配列、および効率的ライゲーション基質である２つまたはそれ超の３’ヌクレオチドを含む。追加の実施形態では、アダプターモジュールは、１つまたは複数のシークエンシングプライマー結合部位をさらに含む。

特定の実施形態では、アダプターモジュールは、ｃｆＤＮＡライブラリーの単一プライマー増幅のための１つまたは複数のＰＣＲプライマー結合配列を含む第１のエレメントを含む。一実施形態では、ＰＣＲプライマー結合配列は、約１２〜約４０ヌクレオチド、約１８〜約４０ヌクレオチド、約２０〜約３５ヌクレオチド、または約２０〜約３０ヌクレオチドである。別の実施形態では、ＰＣＲプライマー結合配列は、約１２ヌクレオチド、約１３ヌクレオチド、約１４ヌクレオチド、約１５ヌクレオチド、約１６ヌクレオチド、約１７ヌクレオチド、約１８ヌクレオチド、約１９ヌクレオチド、約２０ヌクレオチド、約２１ヌクレオチド、約２２ヌクレオチド、約２３ヌクレオチド、約２４ヌクレオチド、約２５ヌクレオチド、約２６ヌクレオチド、約２７ヌクレオチド、約２８ヌクレオチド、約２９ヌクレオチド、約３０ヌクレオチド、約３１ヌクレオチド、約３２ヌクレオチド、約３３ヌクレオチド、約３４ヌクレオチド、約３５ヌクレオチド、約３６ヌクレオチド、約３７ヌクレオチド、約３８ヌクレオチド、約３９ヌクレオチド、または約４０ヌクレオチドまたはそれ超である。

一実施形態では、ＰＣＲプライマー結合配列は、約２５ヌクレオチドである。

特定の実施形態では、アダプターモジュールは、１つまたは複数のリードコード配列を含む第２のエレメントを含む。本明細書で使用する場合、用語「リードコード」は、ユニークシークエンシングリードを同定するために使用されるポリヌクレオチドを指す。一実施形態では、リードコードは、ヌクレオチドのランダム配列である。一実施形態では、リードコードは、約１ヌクレオチド、約２ヌクレオチド、約３ヌクレオチド、約４ヌクレオチド、約５ヌクレオチド、約６ヌクレオチド、約７ヌクレオチド、約８ヌクレオチド、約９ヌクレオチド、約１０ヌクレオチドまたはそれ超である。

非限定的な例として、５ヌクレオチドコードは、可能性のある２５６のユニーク配列からなり、ここで選択される各コードは、そのセット内の他のすべてのコードと２ヌクレオチド異なる。この特徴によって、ユニークな別個のリードと、コード領域内のシークエンシングエラーのためユニークであるように見えるリードとを区別することが可能になる。特定の実施形態では、特定の配列の組合せのため、アダプター機能に干渉すると実験によって判定されたコードは使用から除外されることがあり、例えば、２５６のうちの７つのコードにはＧヌクレオチドの過剰提示があったので除外した。

他の実施形態では、５、６、７、８、９、１０またはそれ超のヌクレオチドの各リードコードは、他のすべてのリードコードと２、３、４または５ヌクレオチド異なることがある。

一実施形態では、リードコードは、約５ヌクレオチドであり、他のすべてのリードコードと２ヌクレオチド異なる。

特定の実施形態では、アダプターモジュールは、１つまたは複数の試料コード配列を含む第３のエレメントを含む。本明細書で使用する場合、用語「試料コード」は、試料を識別するために使用されるポリヌクレオチドを指す。試料コードは、多重シークエンシング反応を確立するのにも有用である。なぜなら、各試料コードは試料に一意であり、したがって、各試料コードを使用して、多重シークエンシング反応物中の特定の試料からリードを識別することができるからである。

一実施形態では、試料コードは、約１、約２ヌクレオチド、約３ヌクレオチド、約４ヌクレオチドもしくは約５ヌクレオチドまたはそれ超である配列を含む。別の実施形態では、２、３、４、５またはそれ超のヌクレオチドの各試料コードは、他のすべての試料コードと２、３、４または５ヌクレオチド異なることがある。

一実施形態では、試料コードは、約３ヌクレオチドであり、他の試料に使用される他のすべての試料コードと２ヌクレオチド異なる。

特定の実施形態では、アダプターモジュールは、１つまたは複数のアンカー配列を含む第４のエレメントを含む。本明細書で使用する場合、「アンカー配列」は、少なくとも８ヌクレオチド、少なくとも１０ヌクレオチド、少なくとも１２ヌクレオチド、少なくとも１４ヌクレオチド、または少なくとも１６ヌクレオチドのヌクレオチド配列であって、パートナーオリゴヌクレオチドにハイブリダイズし、以下の３つの特性を含むヌクレオチド配列を指す：（１）各アンカー配列が、伸長内の各部位における可能性のある４つのＤＮＡ塩基の各々を集合的に表すアンカー配列４つのファミリーの一部である（この特徴、バランスのとれた塩基提示は、特定の実施形態でのシークエンシングリードにおける適正な塩基コーリングの校正に有用である）、（２）各アンカー配列が、可能性のある４つの塩基のうちの２つだけからなり、これらが、同数のＡ＋Ｃまたは同数のＧ＋Ｔのどちらか一方であるように特異的に選択される（２つだけの塩基から形成されるアンカー配列は、適正なアダプター機能を不可能にすることになる二次構造形成にアンカー配列が関与する可能性を低下させる）、および（３）各アンカー配列は同数のＡ＋ＣまたはＧ＋Ｔからなるので、各アンカー配列が、４つ１セットの他のすべてのアンカー配列と大体同じ融解温度および二本鎖安定性を共有する。

特定の実施形態では、アダプター分子は、エレメント４の２つの３’末端ヌクレオチドからなる第５のエレメントを含む。各アンカーの３’末端のこれら２つの塩基は、これら２つのヌクレオチドがｃｆＤＮＡへのライゲーションに効率的な基質であることを示す実験による判定に基づいて選択される。特定の実施形態では、エレメント５は、ＡＡ、ＣＣ、ＴＴおよびＧＧからなる群から選択される配列を含む。特定の実施形態では、エレメント５は、ジヌクレオチドの組合せＣＧまたはＴＧを含まない。本発明者らは、これらの組合せが効率的なライゲーション基質でないと判断したからである。

特定の実施形態では、ライゲーションステップは、「タグ付き」ｃｆＤＮＡライブラリーを生成するために末端修復ｃｆＤＮＡにアダプターモジュールをライゲーションすることを含む。一部の実施形態では、単一のアダプターモジュールが利用される。一部の実施形態では、２、３、４または５つのアダプターモジュールが利用される。一部の実施形態では、同一配列のアダプターモジュールが、断片化された末端修復ＤＮＡの各末端にライゲーションされる。

一実施形態では、複数のアダプター種が末端修復ｃｆＤＮＡライブラリーにライゲーションされる。複数のアダプターの各々は、ｃｆＤＮＡライブラリーの増幅のための１つまたは複数のプライマー結合部位、１つまたは複数のリードコード配列、試料多重化のための１つまたは複数の配列、およびＤＮＡシークエンシングのための１つまたは複数の配列を含むことがある。

本明細書において企図される１つまたは複数のアダプターのライゲーションは、当業者に公知の方法によって行うことができる。特定の実施形態では、本明細書において企図される１つまたは複数のアダプターは、平滑末端を含む末端修復ｃｆＤＮＡにライゲーションされる。ある特定の実施形態では、本明細書において企図される１つまたは複数のアダプターは、用いられるライゲーション方法に適している相補末端を含む末端修復ｃｆＤＮＡにライゲーションされる。ある特定の実施形態では、本明細書において企図される１つまたは複数のアダプターは、３’オーバーハングを含む末端修復ｃｆＤＮＡにライゲーションされる。

２．ｃｆＤＮＡライブラリー増幅
特定の実施形態では、本明細書において企図される遺伝子解析の方法は、ｃｆＤＮＡクローンライブラリーまたはｃｆＤＮＡクローンのライブラリーを生成するためのｃｆＤＮＡライブラリーの増幅を含む。ｃｆＤＮＡライブラリーの各分子は、末端修復ｃｆＤＮＡの各末端にライゲーションされたアダプターを含み、各アダプターは、１つまたは複数のＰＣＲプライマー結合部位を含む。一実施形態では、異なるアダプターが末端修復ｃｆＤＮＡの異なる末端にライゲーションされる。

好ましい実施形態では、同じアダプターがｃｆＤＮＡの両末端にライゲーションされる。末端修復ｃｆＤＮＡの両末端への同じアダプターのライゲーションは、単一プライマー配列でのＰＣＲ増幅を可能にする。特定の実施形態では、アダプターがライゲーションされたｃｆＤＮＡライブラリーの一部は、標準ＰＣＲ技術を使用して単一プライマー配列駆動増幅で増幅されることになる。一実施形態では、単一プライマー配列は、約２５ヌクレオチドであり、場合によっては標準イオン強度条件下で５５℃以上の推定Ｔｍを有する。

特定の実施形態では、初期ｃｆＤＮＡライブラリーの数ピコグラムがｃｆＤＮＡクローンの数マイクログラムに増幅され、これは、１０，０００倍増幅を含意する。増幅産物の量は、当技術分野において公知の方法、例えば、Ｑｕｂｉｔ２．０またはＮａｎｏｄｒｏｐ装置での定量を使用して、測定することができる。

３．ゲノム当量の数の決定
様々な実施形態では、ｃｆＤＮＡの遺伝子解析のための方法は、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップを含む。本明細書で使用する場合、用語「ゲノム当量」は、各ライブラリー中のゲノムコピーの数を指す。本明細書において企図される組成物および方法によって対処される重要な課題は、遺伝子配列における低頻度の遺伝子変異または差の検出および解析に十分なアッセイ感度を獲得することである。試料ごとにアッセイ感度値を決定するために、シークエンシングライブラリー中に存在するゲノム当量の数を測定することによって、各試料中に存在する異なる別個の配列の数を測定する。感度を確立するために、ゲノム当量の数を各試料ライブラリーについて測定しなければならない。

ゲノム当量の数は、ｑＰＣＲアッセイによって、またはシークエンシングを行った後にバイオインフォマティクスベースの計数を使用することによって決定することができる。臨床試料のプロセスフローでは、ゲノム当量のｑＰＣＲ測定が、ｃｆＤＮＡライブラリーのＱＣステップとして使用される。そのｑＰＣＲ測定によって、配列解析前にアッセイ感度の期待値が確立され、試料を、その対応するｃｆＤＮＡクローンライブラリーがゲノム当量の要求深度を欠く場合、解析から除外することができる。最後に、ゲノム当量のバイオインフォマティクスベースの計数も、所与のｃｆＤＮＡクローンライブラリー各々についてのゲノム当量の同定に使用され、したがってアッセイ感度および偽陰性推定値の同定に使用される。

実験的ｑＰＣＲアッセイと統計的計数アッセイは、よく相関するはずである。シークエンシングによってｃｆＤＮＡクローンライブラリーの配列深度を明らかにすることができない場合、ｃｆＤＮＡクローンライブラリーの再処理および／または追加のシークエンシングが必要とされることがある。

一実施形態では、ｃｆＤＮＡクローンライブラリー中のゲノム当量は、定量的ＰＣＲ（ｑＰＣＲ）アッセイを使用して決定される。特定の実施形態では、既知濃度の標準ライブラリーを使用して標準曲線を構築し、得られた標準曲線にｑＰＣＲアッセイからの測定値をフィッティングし、そのフィットからゲノム当量の値を導出する。驚くべきことに、本発明者らは、ゲノム内の共通配列、例えば反復配列に特異的にハイブリダイズする１つのプライマーと、アダプター内のプライマー結合部位と結合するもう１つのプライマーとを含むｑＰＣＲ「反復配列ベースの」アッセイによって、（ｃｆＤＮＡクローンの両末端に存在する）アダプター特異的プライマーのみを使用する方法と比較して、ゲノム当量の８倍増加が測定されることを発見した。反復配列ベースのアッセイによって測定されるゲノム当量の数は、ライブラリー間でのより一貫した性能、およびゲノム当量のｑＰＣＲ推定値とシークエンシングランでバイオインフォマティクスによって計数されるタグ当量とのより良好なアラインメントをもたらす。

本明細書において企図される反復配列ベースのゲノム当量アッセイでの使用に好適な反復配列の実例としては、短鎖散在反復配列（ＳＩＮＥ）、例えばＡｌｕ反復配列；長鎖散在反復配列（ＬＩＮＥ）、例えばＬＩＮＥ１、ＬＩＮＥ２、ＬＩＮＥ３；マイクロサテライト反復配列エレメント、例えば、短鎖タンデム反復配列（ＳＴＲ）；単純配列反復（ＳＳＲ）；および哺乳類ワイド散在反復配列（ＭＩＲ）が挙げられるが、これらに限定されない。

一実施形態では、反復配列は、Ａｌｕ反復配列である。

４．定量的遺伝子解析
様々な実施形態では、ｃｆＤＮＡの遺伝子解析のための方法は、ｃｆＤＮＡライブラリークローンの１つまたは複数の標的遺伝子座位の定量的遺伝子解析を含む。定量的遺伝子解析は、以下のステップの１つもしくは複数、またはすべてを含む：標的遺伝子座位を含むｃｆＤＮＡクローンを捕捉するステップ、捕捉された標的化遺伝子座位の増幅ステップ、捕捉され増幅された標的化遺伝子座位をシークエンシングするステップ、および得られた配列リードについてのバイオインフォマティック解析ステップ。

（ａ）標的遺伝子座位の捕捉
本発明は、一部には、より大きいプローブの効率および信頼性を保持するように、しかしｃｆＤＮＡクローンライブラリーにおける情報価値のない配列生成を最小にするように設計された捕捉プローブモジュールを企図している。「捕捉プローブモジュール」は、捕捉プローブ配列とテール配列とを含むポリヌクレオチドを指す。特定の実施形態では、捕捉プローブモジュール配列またはその一部分は、１つまたは複数のシークエンシングプライマーのためのプライマー結合部位として役立つ。

特定の実施形態では、捕捉プローブモジュールは、捕捉プローブを含む。本明細書で使用する場合、「捕捉プローブ」は、特異的ＤＮＡ標的領域にハイブリダイズすることができる領域を指す。ｃｆＤＮＡの平均サイズは約１５０〜約１７０ｂｐであり、高度に断片化されているので、本明細書において企図される組成物および方法は、目的のＤＮＡ標的領域を調べるための、高密度の比較的短い捕捉プローブの使用を含む。

高密度捕捉プローブの使用に伴う１つの特定の懸念は、一般に捕捉プローブが特異的「配列規則」を使用して設計されることである。例えば、冗長配列の領域、または極度の塩基組成の偏りを示す領域は、一般に、捕捉プローブの設計では除外される。しかし、本発明者らは、捕捉プローブ設計規則の柔軟性の欠如がプローブの性能に実質的に影響を及ぼさないことを発見した。対照的に、位置制約によって厳密に選択された捕捉プローブは、オンターゲット配列情報を提供し、オフターゲットのマッピング不能なリード捕捉を殆ど示さず、ほんの少数の例外はあるが均一で有用なオンターゲットリードをもたらす。さらに、接近したプローブ間隔での高い冗長性は、あまりよく機能しないこともある捕捉プローブを補って余りある。

特定の実施形態では、標的領域は複数の捕捉プローブによって標的とされ、ここで、任意の２つまたはそれ超の捕捉プローブは、互いに１０ヌクレオチド以内、互いに１５ヌクレオチド以内、互いに２０ヌクレオチド以内、互いに２５ヌクレオチド以内、互いに３０ヌクレオチド以内、互いに３５ヌクレオチド以内、互いに４０ヌクレオチド以内、互いに４５ヌクレオチド以内、もしくは互いに５０ヌクレオチドまたはそれ超以内、およびすべての介在するヌクレオチド長で、標的領域と結合するように設計されている。

一実施形態では、捕捉プローブは、約２５ヌクレオチド、約２６ヌクレオチド、約２７ヌクレオチド、約２８ヌクレオチド、約２９ヌクレオチド、約３０ヌクレオチド、約３１ヌクレオチド、約３２ヌクレオチド、約３３ヌクレオチド、約３４ヌクレオチド、約３５ヌクレオチド、約３６ヌクレオチド、約３７ヌクレオチド、約３８ヌクレオチド、約３９ヌクレオチド、約４０ヌクレオチド、約４１ヌクレオチド、約４２ヌクレオチド、約４３ヌクレオチド、約４４ヌクレオチド、または約４５ヌクレオチドである。

一実施形態では、捕捉プローブは、約１００ヌクレオチド、約２００ヌクレオチド、約３００ヌクレオチド、約４００ヌクレオチド、または約１００ヌクレオチドである。別の実施形態では、捕捉プローブは、約１００ヌクレオチド〜約５００ヌクレオチド、約２００ヌクレオチド〜約５００ヌクレオチド、約３００ヌクレオチド〜約５００ヌクレオチド、もしくは約４００ヌクレオチド〜約５００ヌクレオチド、またはこれらに介在する任意の範囲である。

特定の実施形態では、捕捉プローブは、６０ヌクレオチドではない。

別の実施形態では、捕捉プローブは、６０ヌクレオチドより実質的に小さいが、同じＤＮＡ標的領域を標的にする６０ヌクレオチド捕捉プローブと同程度に、同様に、またはそれより良好にハイブリダイズする。

ある特定の実施形態では、捕捉プローブは、４０ヌクレオチドである。

ある特定の実施形態では、捕捉プローブモジュールは、テール配列を含む。本明細書で使用する場合、用語「テール配列」は、特定の実施形態ではプライマー結合部位として役立つことができる、捕捉プローブモジュールの５’末端のポリヌクレオチドを指す。特定の実施形態では、シークエンシングプライマーは、テール領域内のプライマー結合部位と結合する。

特定の実施形態では、テール配列は、約５〜約１００ヌクレオチド、約１０〜約１００ヌクレオチド、約５〜約７５ヌクレオチド、約５〜約５０ヌクレオチド、約５〜約２５ヌクレオチド、または約５〜約２０ヌクレオチドである。ある特定の実施形態では、第３の領域は、約１０〜約５０ヌクレオチド、約１５〜約４０ヌクレオチド、約２０〜約３０ヌクレオチドもしくは約２０ヌクレオチド、または介在する任意の数のヌクレオチドである。

特定の実施形態では、テール配列は、約３０ヌクレオチド、約３１ヌクレオチド、約３２ヌクレオチド、約３３ヌクレオチド、約３４ヌクレオチド、約３５ヌクレオチド、約３６ヌクレオチド、約３７ヌクレオチド、約３８ヌクレオチド、約３９ヌクレオチド、または約４０ヌクレオチドである。

様々な実施形態では、捕捉プローブモジュールは、捕捉プローブにハイブリダイズするタグ付きおよび／または増幅ｃｆＤＮＡライブラリーの１つまたは複数の捕捉断片の単離および／または精製を可能にするための、結合対の特異的メンバーを含む。特定の実施形態では、捕捉プローブモジュールはビオチンまたは別の好適なハプテン、例えば、ジニトロフェノール、ジゴキシゲニンに結合している。

様々な実施形態では、捕捉プローブモジュールを、必要に応じて増幅されたタグ付きのｃｆＤＮＡライブラリーにハイブリダイズさせて複合体を形成する。一部の実施形態では、多官能性捕捉プローブモジュールは、ｃｆＤＮＡライブラリーの特異的ゲノム標的領域に実質的にハイブリダイズする。

ハイブリダイゼーションまたはハイブリダイズ条件は、２つのヌクレオチド配列が安定な複合体を形成する、例えば、タグ付きｃｆＤＮＡライブラリーと捕捉プローブモジュールが安定なタグ付きｃｆＤＮＡライブラリー−捕捉プローブモジュール複合体を形成する、任意の反応条件を含むことができる。そのような反応条件は当技術分野において周知であり、そのような条件を適宜改変することができる、例えば、より短い長さの捕捉プローブを用いてアニーリング温度を低下させることができること、およびそのような条件が本発明の範囲内でありうることは、当業者には理解されるであろう。実質的なハイブリダイゼーションは、捕捉プローブ複合体の第２の領域がタグ付きｃｆＤＮＡライブラリーの領域と１００％、９９％、９８％、９７％、９６％、９５％、９４％、９３％、９２％、９１％、９０％、８９％、８８％、８５％、８０％、７５％または７０％の配列同一性、相同性または相補性を示すときに起こりうる。

特定の実施形態では、捕捉プローブは、約４０ヌクレオチドであり、約４４℃〜約４７℃の最適アニーリング温度を有する。

ある特定の実施形態では、本明細書において企図される方法は、タグ付きｃｆＤＮＡライブラリー−捕捉プローブモジュール複合体を単離するステップを含む。特定の実施形態では、ＤＮＡ複合体を単離する方法は当業者に周知であり、当業者によって適切と思われる任意の方法を本発明の方法とともに用いることができる（Ausubelら、Current Protocols in Molecular Biology、２００７〜２０１２年）。特定の実施形態では、複合体は、ビオチン−ストレプトアビジン単離技術を使用して単離される。

特定の実施形態では、単離されたタグ付きｃｆＤＮＡライブラリー−捕捉プローブモジュール複合体からの一本鎖３’末端の除去が企図される。ある特定の実施形態では、方法は、一本鎖３’末端を除去するための、単離されたタグ付きＤＮＡライブラリー−多官能性捕捉プローブモジュール複合体の３’−５’エキソヌクレアーゼ酵素的処理を含む。

ある特定の他の実施形態では、方法は、単離されたタグ付きＤＮＡライブラリー断片を鋳型として利用して多官能性捕捉プローブの５’−３’ＤＮＡポリメラーゼ伸長を行うステップを含む。

ある特定の他の実施形態では、方法は、５’ＦＬＡＰエンドヌクレアーゼの協奏作用、ＤＮＡ重合、およびＤＮＡリガーゼによるニック閉鎖による、捕捉プローブと単離されたタグ付きｃｆＤＮＡのハイブリッド標的分子を生成するステップを含む。

単離されたタグ付きｃｆＤＮＡライブラリー−多官能性捕捉プローブモジュール複合体の３’−５’エキソヌクレアーゼ酵素的処理に様々な酵素を利用することができる。特定の実施形態で利用することができる、３’−５’エキソヌクレアーゼ酵素活性を示す好適な酵素の実例としては、Ｔ４またはエキソヌクレアーゼＩ、ＩＩＩ、Ｖが挙げられるが、これらに限定されない（Shevelev IV、Hubscher U.、「The 3' 5' exonucleases」、Nat Rev Mol Cell Biol.、３巻（５号）：３６４〜７６頁（２００２年）も参照されたい）。特定の実施形態では、３’−５’エキソヌクレアーゼ活性を含む酵素は、Ｔ４ポリメラーゼである。特定の実施形態では、３’−５’エキソヌクレアーゼ酵素活性を示し、プライマー鋳型伸長能力がある酵素を利用することができ、そのような酵素としては、例えば、Ｔ４またはエキソヌクレアーゼＩ、ＩＩＩ、Ｖが挙げられる。同書。

一部の実施形態では、本明細書において企図される方法は、上記および本明細書中の他の箇所で論じられている３’−５’エキソヌクレアーゼで酵素的に処理された複合体に関するシークエンシングおよび／またはＰＣＲを行うステップを含む。特定の実施形態では、捕捉プローブ分子のテール部分をコピーして、ハイブリッド核酸分子を生成する。一実施形態では、生成されるハイブリッド核酸分子は、捕捉プローブモジュールおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的領域を含む。

特定の実施形態では、遺伝子解析は、ａ）１つまたは複数の捕捉プローブモジュールを複数のｃｆＤＮＡライブラリークローン中の１つまたは複数の標的遺伝子座位にハイブリダイズさせて、１つまたは複数の捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体を形成するステップ、ｂ）ａ）からの１つまたは複数の捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体を単離するステップ、ｃ）ステップｂ）からの１つまたは複数の単離された捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体を酵素的に処理するステップ、ｄ）ｃ）からの酵素的に処理された複合体に関するＰＣＲを行うステップであって、捕捉プローブ分子のテール部分をコピーして増幅されたハイブリッド核酸分子を生成し、増幅されたハイブリッド核酸分子が、捕捉プローブおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的ゲノム座位の標的配列を含むステップ、ならびにｅ）ｄ）からの増幅されたハイブリッド核酸分子に関する定量的遺伝子解析を行うステップを含む。

特定の実施形態では、特異的標的遺伝子座位のコピー数を決定する方法であって、ａ）１つまたは複数の捕捉プローブモジュールを複数のｃｆＤＮＡライブラリークローン中の１つまたは複数の標的遺伝子座位にハイブリダイズさせて、１つまたは複数の捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体を形成するステップ、ｂ）ａ）からの１つまたは複数の捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体を単離するステップ、ｃ）ステップｂ）からの１つまたは複数の単離された捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体を酵素的に処理するステップ、ｄ）ｃ）からの酵素的に処理された複合体に関するＰＣＲを行うステップであって、捕捉プローブ分子のテール部分をコピーして、増幅されたハイブリッド核酸分子を生成し、増幅されたハイブリッド核酸分子が、捕捉プローブおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的遺伝子座位の標的配列を含むステップ、ｅ）ｄ）における増幅されたハイブリッド核酸分子のＰＣＲ増幅を行うステップ、ならびにｆ）ｅ）におけるＰＣＲ反応を定量するステップであって、定量が、特異的標的領域のコピー数の決定を可能にするステップを含む方法が企図される。

一実施形態では、ステップｃ）の酵素的処理は、３’−５’エキソヌクレアーゼ活性を使用してｂ）からの１つもしくは複数の捕捉プローブモジュール−ｃｆＤＮＡライブラリークローン複合体に関する３’−５’エキソヌクレアーゼ酵素的処理を行って、一本鎖３’末端を除去すること；５’ＦＬＡＰエンドヌクレアーゼの協奏作用、ＤＮＡ重合、およびＤＮＡリガーゼによるニック閉鎖によって捕捉プローブモジュールとｃｆＤＮＡライブラリークローンの１つもしくは複数のハイブリッド分子を生成すること；または複合体中の単離されたｃｆＤＮＡクローンを鋳型として使用して捕捉プローブの５’−３’ＤＮＡポリメラーゼ伸長を行うことを含む。

一実施形態では、ステップｃ）の酵素的処理は、複合体中の単離されたｃｆＤＮＡクローンを鋳型として使用して捕捉プローブの５’−３’ＤＮＡポリメラーゼ伸長を行うことを含む。

特定の実施形態では、ＰＣＲは、当業者に周知の任意の標準ＰＣＲ反応条件を使用して行うことができる。ある特定の実施形態では、ｅ）におけるＰＣＲ反応は、２つのＰＣＲプライマーを利用する。一実施形態では、ｅ）におけるＰＣＲ反応は、標的遺伝子座位内の反復配列にハイブリダイズする第１のＰＣＲプライマーを利用する。特定の実施形態では、ｅ）におけるＰＣＲ反応は、ハイブリッド核酸分子の標的遺伝子座位／テールジャンクションにハイブリダイズする第２のＰＣＲプライマーを利用する。ある特定の実施形態では、ｅ）におけるＰＣＲ反応は、標的遺伝子座位にハイブリダイズする第１のＰＣＲプライマーと、増幅されたハイブリッド核酸分子の標的遺伝子座位／テールジャンクションにハイブリダイズする第２のＰＣＲプライマーとを利用する。特定の実施形態では、第２のプライマーは、標的遺伝子座位／テールジャンクションに、プライマーの少なくとも１つまたは複数のヌクレオチドが標的遺伝子座位にハイブリダイズし、プライマーの少なくとも１つまたは複数のヌクレオチドがテール配列にハイブリダイズするように、ハイブリダイズする。

ある特定の実施形態では、ステップｅ）から得られる増幅されたハイブリッド核酸分子がシークエンシングされ、それらの配列は水平方向にアラインされる、すなわち、互いにアラインされるが、参照配列にアラインされない。特定の実施形態では、ステップａ）〜ｅ）は、１つまたは複数の捕捉プローブモジュールを用いて１回または複数回反復される。捕捉プローブモジュールは、同じであってもまたは異なってもよく、標的遺伝子座位のｃｆＤＮＡ鎖のどちらか一方を標的にするように設計することができる。一部の実施形態では、捕捉プローブが異なる場合、それらは、タグ付きｃｆＤＮＡクローンライブラリー中の標的遺伝子座位内の重複または隣接標的配列にハイブリダイズする。一実施形態では、複数の捕捉プローブが標的遺伝子座位にハイブリダイズし、複数の捕捉プローブの各々が、タグ付きｃｆＤＮＡクローンライブラリー中の標的遺伝子座位にハイブリダイズする任意の他の捕捉プローブの約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、１００、２００ｂｐ以内（介在するすべての距離を含む）の標的遺伝子座位にハイブリダイズする、高密度捕捉プローブ戦略を使用する。

一部の実施形態では、方法は、１つが標的領域の上流の「ワトソン」鎖（非コード鎖または鋳型鎖）にハイブリダイズし、１つが標的領域の下流の「クリック」鎖（コード鎖または非鋳型鎖）にハイブリダイズする、２つの捕捉プローブモジュールを、標的遺伝子座位１つにつき使用して行うことができる。

特定の実施形態では、本明細書において企図される方法は、標的遺伝子座位１つにつき任意の数の捕捉プローブモジュール、例えば、２、３、４、５、６、７、８、９もしくは１０またはそれ超の捕捉プローブモジュールであって、それらのうちの任意の数がワトソンまたはクリック鎖にハイブリダイズする捕捉プローブモジュールを任意の組合せで用いて、さらに何度も行うことができる。一部の実施形態では、得られた配列を互いにアラインして、いくつかの差のいずれかを同定することができる。

ある特定の実施形態では、１つまたは複数の捕捉プローブモジュールを使用して、単一反応で複数の標的遺伝子座位、例えば、１００、２００、３００、４００、５００、６００、７００、８００、９００、１０００、１５００、２０００、２５００、３０００、３５００、４０００、４５００、５０００、１００００、５００００、１０００００、５０００００またはそれ超の標的遺伝子座位が調べられる。

（ｂ）シークエンシング
特定の実施形態では、定量的遺伝子解析は、上記の、本明細書中の他の箇所で論じたような、複数のハイブリッド核酸分子を、複数のユニークシークエンシングリードを得るのに十分なシークエンシング深度を生じさせるようにシークエンシングするステップを含む。ユニークリードは、すべてがｃｆＤＮＡ内の同じリードコードおよび配列開始点を共有するリードの「ファミリー」からの単一のコンセンサスリードと定義する。各捕捉プローブは、ファミリーに分類することによって全リードから計算により抜き出される、１セットのユニークリードを生じさせる。次いで、所与の試料についてのユニークリードは、プローブごとに観測されたすべてのユニークリードの平均値として計算される。明らかなコピー数変化があるケースは、平均値の計算に使用されるデータセットから除外される。各ユニークリードをユニークｃｆＤＮＡクローンから導出しなければならないので、ユニークリードは重要である。各ユニークリードは、ゲノムＤＮＡの一倍体当量のインプットおよび解析を表す。ユニークリードの合計は、解析された一倍体ゲノムの合計である。そしてまた、解析されたゲノム数によって、シークエンシングアッセイの感度が定義される。非限定的な例として、平均ユニークリード数が１００ゲノム当量である場合には、その特定のアッセイは、１００個中の１個、すなわち１％の変異リードを検出することができる感度を有する。これ未満のいかなる観測も正当でない。

特定の実施形態では、定量的遺伝子解析は、複数の試料に由来するハイブリッド核酸分子の多重シークエンシングを含む。

様々な実施形態では、定量的遺伝子解析は、１つもしくはそれ超または複数のタグ付きＤＮＡライブラリークローンを得るステップであって、各クローンが、第１のＤＮＡ配列および第２のＤＮＡ配列を含み、第１のＤＮＡ配列が標的化遺伝子座位の配列を含み、第２のＤＮＡ配列が捕捉プローブ配列を含むステップ、１つもしくは複数のクローンに関する対の末端シークエンシング反応を行い、１つもしくは複数のシークエンシングリードを得るステップ、または約１００、２００、３００、４００、５００もしくはそれ超のヌクレオチドより大きい単一の長いシークエンシングリードが得られる１つもしくは複数のクローンに関するシークエンシング反応を行うステップであって、リードが、第１のＤＮＡ配列と第２のＤＮＡ配列の両方を同定するのに十分であるステップ、ならびにシークエンシングリードのプローブ配列に従って１つまたは複数のクローンのシークエンシングリードを順序付けまたはクラスタリングするステップを含む。

（ｃ）バイオインフォマティクス解析
様々な実施形態では、定量的遺伝子解析は、シークエンシングリードのバイオインフォマティック解析をさらに含む。バイオインフォマティック解析は、シークエンシングのための組成物または方法の不在下で行われる任意の純粋な精神分析を除外する。ある特定の実施形態では、バイオインフォマティクス解析は、配列アラインメント、ゲノム当量解析、一塩基バリアント（ＳＮＶ）解析、遺伝子コピー数変動（ＣＮＶ）解析、および遺伝子病変の検出を含むが、これらに限定されない。特定の実施形態では、バイオインフォマティクス解析は、ｃｆＤＮＡクローンライブラリー中の解析されるゲノム当量の数の定量に、標的遺伝子座位の遺伝子状態の検出に、標的遺伝子座位内の遺伝子病変の検出に、および標的遺伝子座位内のコピー数増減の測定に有用である。

配列アラインメントを配列リードと１つまたは複数のヒト参照ＤＮＡ配列との間で行ってもよい。特定の実施形態では、シークエンシングアラインメントは、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化または遺伝子融合の検出を含むがこれらに限定されない、標的遺伝子座位での遺伝子病変の検出に使用することができる。原因または予後指標である遺伝子病変の検出は、特定の遺伝性状態または疾患の診断、予後予測、処置および／またはモニタリングに有用でありうる。

本明細書では水平配列解析と呼ぶ、参照配列へのアラインメントを必要とせずに行うことができる配列アラインメント解析の方法も本明細書において企図される。そのような解析を、本明細書において企図される方法または任意の他の方法によって生成された任意の配列に対して行うことができる。特定の実施形態では、配列解析は、本明細書において企図される方法によって得られるリードに関する配列アラインメントを行うことを含む。

一実施形態では、ｃｆＤＮＡクローンライブラリー中のゲノム当量は、シークエンシングを行った後にバイオインフォマティクスベースの計数を使用して決定される。各シークエンシングリードは特定の捕捉プローブと関連付けられ、各捕捉プローブに割り当てられた一群のリードは、グループに分別される。グループ内の個々のリードのセットは、同じリードコードおよびゲノム配列内の同じＤＮＡ配列開始位置を共有する。これらの個々のリードを「ファミリー」に分類し、このファミリーの単一のコンセンサス代表を「ユニークリード」として繰越す。ファミリーを構成する個々のリードのすべてが単一のライゲーション事象に由来し、したがって、それらは、互いに増幅由来の「同胞」である。各ユニークリードは、ユニークライゲーション事象と考えられ、ユニークリードの合計は、解析されるゲノム当量の数と等しいと考えられる。

ユニーククローン数が可能性のある配列の組合せの総数に近づくと、確率により、同じコードおよび開始部位の組合せが独立事象によって生じることになり、これらの独立事象が単一ファミリー内で不適切にグループ化されることになることが決定される。最終結果は、解析されるゲノム当量の過小推定となり、低頻度の変異リードは、同じ識別子を有する野生型リードと重複するので、シークエンシングエラーとして処分されることがある。

特定の実施形態では、ｃｆＤＮＡクローンライブラリーの正確な解析をもたらすために、解析されるゲノム当量の数は、可能性のあるユニーククローンの数の約１／１０、約１／１２、約１／１４、約１／１６、約１／１８、約１／２０、約１／２５またはそれ未満である。上で概要を述べた手順は、説明に役立つものに過ぎず、限定ではないことを理解するべきである。

一部の実施形態では、解析されるゲノム当量の数を増加させる必要があることもある。ゲノム当量の深度を拡大するために少なくとも２つの解決策が企図される。第１の解決策は、試料１つにつき１つより多くのアダプターセットを使用することである。アダプターを組み合わせることにより、可能性のあるクローンの総数を乗法的に拡大することが可能であり、したがって、ゲノムインプットの満足のいく限界を拡大することが可能である。第２の解決策は、リードコードを１、２、３、４、または５もしくはそれ超の塩基、拡大することである。他のすべてのリードコードと少なくとも２塩基異なる、可能性のあるリードコードの数は、４^{（ｎ−１）}となり、式中、ｎは、リードコード内の塩基の数である。したがって、非限定的な例では、リードコードが５ヌクレオチドである場合、４^{（５−１）}＝２５６。したがって、追加の塩基を含めることで利用可能なレパートリーは追加の塩基ごとに４倍拡大される。

一実施形態では、定量的遺伝子解析は、低頻度の一塩基バリアント（ＳＮＶ）を同定するためのシークエンシングリードのバイオインフォマティック解析を含む。

次世代シークエンシングは、およそ０．０２〜０．０２％の固有エラー率を有し、これは、１／２００〜１／５００塩基コールが不正確であることを意味する。これより低い頻度で、例えば１０００配列に１配列の頻度で発生するバリアントおよび他の変異を検出するために、分子アノテーション戦略を行使する必要がある。非限定的な例として、標的化配列捕捉技術を使用する５０００のユニーク分子の解析は、各ユニークリードが、すべてが同じリードコードを有するリードの「ファミリー」に属する一群の５０００ユニークリードを、５０，０００リードを超える十分なシークエンシング深度で生成する。ファミリー内で発生するＳＮＶは、低頻度バリアントであることの候補である。この同じバリアントが１つより多くのファミリーで観測された場合、それは、出発試料内に存在する低頻度バリアントであることの非常に強い候補になる。対照的に、ファミリー内で散発的に発生するバリアントは、シークエンシングエラーである可能性が高く、１つのおよび１つだけのファミリー内で発生するバリアントは、低頻度であるか、エクスビボで発生する塩基の変化（例えば、ＤＮＡ塩基の酸化またはＰＣＲ導入エラー）の結果である。

一実施形態では、ＳＮＶを検出する方法は、アッセイの所望の標的感度に応じて１０倍を超えるゲノムインプット（ゲノムまたはゲノム当量）を導入するステップを含む。１つの非限定的な例では、所望の感度が２％（１００中２）である場合には、実験標的は、２０００ゲノムのインプットである。

特定の実施形態では、シークエンシングデータのバイオインフォマティクス解析は、遺伝子状態、遺伝性状態または遺伝疾患、遺伝子モザイク、胎児試験、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植のモニタリングに関連するＳＮＶを検出または同定するために使用する。

様々な実施形態では、コピー数決定解析のための方法であって、１つもしくはそれ超または複数のクローンを得るステップを含み、各クローンが、第１のＤＮＡ配列および第２のＤＮＡ配列を含み、第１のＤＮＡ配列が標的化遺伝子座位の配列を含み、第２のＤＮＡ配列が捕捉プローブ配列を含む方法が提供される。関連実施形態では、１つまたは複数のクローンに関する対の末端シークエンシング反応を行い、１つまたは複数のシークエンシングリードを得る。別の実施形態では、１つまたは複数のクローンに関するシークエンシング反応であって、約１００より多いヌクレオチドの単一の長いシークエンシングリードが得られ、リードが第１のＤＮＡ配列と第２のＤＮＡ配列の両方を同定するのに十分である、シークエンシング反応を行う。１つまたは複数のクローンのシークエンシングリードを、該シークエンシングリードのプローブ配列に従って順序付けまたはクラスタリングすることができる。

コピー数解析は、所与のゲノムＤＮＡ試料中で発生する特定の遺伝子または変異のコピー数を調査する解析であって、所与の試料中の所与の遺伝子のコピー数または配列差異の定量的判定をさらに含むことができる解析を含むが、これらに限定されない。特定の実施形態では、コピー数解析は、遺伝子状態、遺伝性状態または遺伝疾患、胎児試験、遺伝子モザイク、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植のモニタリングに関連する遺伝子増幅を検出または同定するために使用される。

特定の実施形態では、シークエンシングデータのバイオインフォマティクス解析は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化または遺伝子融合の検出を含むがこれらに限定されない、標的遺伝子座位での１つまたは複数の配列または遺伝子病変の検出または同定に使用される。原因または予後指標である遺伝子病変の検出は、特定の遺伝性状態または遺伝疾患の診断、予後予測、処置および／またはモニタリングに有用でありうる。一実施形態では、遺伝子病変は、遺伝子状態、遺伝性状態または遺伝疾患、胎児試験、遺伝子モザイク、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植のモニタリングに関連する。

Ｄ．定量的遺伝子解析の臨床的応用
様々な実施形態では、本発明は、対象における状態または疾患を検出、同定、予測、診断またはモニターする方法を企図している。

特定の実施形態では、対象における遺伝子状態、遺伝性状態または遺伝疾患を検出、同定、予測、診断またはモニターする方法は、ｃｆＤＮＡクローンライブラリー中の１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行って、１つまたは複数の標的遺伝子座位における配列の変化を検出または同定するステップを含む。

一実施形態では、遺伝子状態、遺伝性状態または遺伝疾患を検出、同定、予測、診断またはモニターする方法は、対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、およびｃｆＤＮＡクローンライブラリー中の１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行って、１つまたは複数の標的遺伝子座位における配列の変化を検出または同定するステップを含む。

特定の実施形態では、遺伝疾患、遺伝子モザイクからなる群から選択される遺伝子状態、または遺伝性状態または遺伝疾患の検出、同定、予測、診断またはモニタリング、胎児試験、親子鑑定、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植モニタリングの方法であって、対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、およびｃｆＤＮＡクローンライブラリー中の１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行って、１つまたは複数の標的遺伝子座位の配列におけるヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化または遺伝子融合を検出または同定するステップを含む方法。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる遺伝疾患の実例としては、がん、アルツハイマー病（ＡＰＯＥ１）、シャルコー・マリー・トゥース病、レーバー遺伝性視神経萎縮症（ＬＨＯＮ）、アンジェルマン症候群（ＵＢＥ３Ａ、ユビキチン−タンパク質リガーゼＥ３Ａ）、プラダー・ウィリー症候群（１５番染色体内の領域）、β−サラセミア（ＨＢＢ、β−グロビン）、ゴーシェ病（Ｉ型）（ＧＢＡ、グルコセレブロシダーゼ）、嚢胞性線維症（ＣＦＴＲ上皮クロライドチャネル）、鎌状赤血球症（ＨＢＢ、β−グロビン）、テイ・サックス病（ＨＥＸＡ、ヘキソサミニダーゼＡ）、フェニルケトン尿症（ＰＡＨ、フェニルアラニンヒドロリアーゼ）、家族性高コレステロール血症（ＬＤＬＲ、低密度リポタンパク質受容体）、成人型嚢胞腎（ＰＫＤ１、ポリシスチン）、ハンチントン病（ＨＤＤ、ハンチンチン）、神経線維腫症Ｉ型（ＮＦ１、ＮＦ１腫瘍抑制遺伝子）、筋強直性ジストロフィー（ＤＭ、ミオトニン）、結節性硬化症（ＴＳＣ１、ツベリン）、軟骨無形成症（ＦＧＦＲ３、線維芽細胞増殖因子受容体）、脆弱Ｘ症候群（ＦＭＲ１、ＲＮＡ結合タンパク質）、デュシェンヌ型筋ジストロフィー（ＤＭＤ、ジストロフィン）、血友病Ａ（Ｆ８Ｃ、血液凝固第ＶＩＩＩ因子）、レッシュ・ナイハン症候群（ＨＰＲＴ１、ヒポキサンチングアニンリボシルトランスフェラーゼ１）、および副腎白質ジストロフィー（ＡＢＣＤ１）が挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができるがんの実例としては、Ｂ細胞がん、例えば多発性骨髄腫、黒色腫、乳がん、肺がん（例えば、非小細胞肺癌またはＮＳＣＬＣ）、気管支がん、結腸直腸がん、前立腺がん、膵がん、胃がん（ｓｔｏｍａｃｈｃａｎｃｅｒ）、卵巣がん、膀胱がん、脳または中枢神経系のがん、末梢神経系のがん、食道がん、子宮頸がん、子宮または子宮内膜がん、口腔または咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸または虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺癌、炎症性筋線維芽細胞性腫瘍、消化管間質腫瘍（ＧＩＳＴ）、結腸がん、多発性骨髄腫（ＭＭ）、骨髄異形成症候群（ＭＤＳ）、骨髄増殖性疾患（ＭＰＤ）、急性リンパ球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性リンパ球性白血病（ＣＬＬ）、真正赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫（ＮＨＬ）、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮癌、基底細胞癌、腺癌、汗腺癌、皮脂腺癌、乳頭癌、乳頭状腺癌、髄様癌、気管支原性肺癌、腎細胞癌、ヘパトーマ、胆管癌、絨毛癌、精上皮腫、胎児性癌、ウィルムス腫瘍、膀胱癌、上皮癌、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、脳室上衣腫、松果体腫、血管芽細胞腫、聴神経腫瘍、乏突起神経膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型Ｂ細胞性リンパ腫、マントル細胞リンパ腫、肝細胞癌、甲状腺がん、胃がん（ｇａｓｔｒｉｃｃａｎｃｅｒ）、頭頸部がん、小細胞がん、本態性血小板血症、原因不明の骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性過好酸球増加症、慢性好酸球性白血病、神経内分泌がん、カルチノイド腫瘍などが挙げられるが、これらに限定されない。

一実施形態では、遺伝子病変は、Ｃｏｓｍｉｃデータベース（病変および配列データをcancer.sanger.ac.uk/cosmic/censusからダウンロードすることができる）でアノテーションされている病変、またはＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ（病変および配列データをtcga-data.nci.nih.gov/tcga/tcgaDownload.jspからダウンロードすることができる）でアノテーションされている病変である。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができるがんに関連する１つまたは複数の遺伝子病変を有する遺伝子の実例としては、ＡＢＣＢ１、ＡＢＣＣ２、ＡＢＣＣ４、ＡＢＣＧ２、ＡＢＬ１、ＡＢＬ２、ＡＫＴ１、ＡＫＴ２、ＡＫＴ３、ＡＬＤＨ４Ａ１、ＡＬＫ、ＡＰＣ、ＡＲ、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ１Ａ、ＡＴＭ、ＡＴＲ、ＡＵＲＫＡ、ＡＵＲＫＢ、ＢＣＬ２、ＢＣＬ２Ａ１、ＢＣＬ２Ｌ１、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＲＡＦ、ＢＲＣＡ１、ＢＲＣＡ２、Ｃｌｏｒｆ１４４、ＣＡＲＤ１１、ＣＢＬ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＤＨ１、ＣＤＨ２、ＣＤＨ２０、ＣＤＨ５、ＣＤＫ４、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ２Ａ、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＥＢＰＡ、ＣＨＥＫ１、ＣＨＥＫ２、ＣＲＫＬ、ＣＲＬＦ２、ＣＴＮＮＢ１、ＣＹＰ１Ｂ１、ＣＹＰ２Ｃ１９、ＣＹＰ２Ｃ８、ＣＹＰ２Ｄ６、ＣＹＰ３Ａ４、ＣＹＰ３Ａ５、ＤＮＭＴ３Ａ、ＤＯＴ１Ｌ、ＤＰＹＤ、ＥＧＦＲ、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＡ６、ＥＰＨＡ７、ＥＰＨＢ１、ＥＰＨＢ４、ＥＰＨＢ６、ＥＰＨＸ１、ＥＲＢＢ２、ＥＲＢＢ３、ＥＲＢＢ４、ＥＲＣＣ２、ＥＲＧ、ＥＳＲ１、ＥＳＲ２、ＥＴＶ１、ＥＴＶ４、ＥＴＶ５、ＥＴＶ６、ＥＷＳＲ１、ＥＺＨ２、ＦＡＮＣＡ、ＦＢＸＷ７、ＦＣＧＲ３Ａ、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＧＦＲ４、ＦＬＴ１、ＦＬＴ３、ＦＬＴ４、ＦＯＸＰ４、ＧＡＴＡ１、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＳＴＰ１、ＧＵＣＹ１Ａ２、ＨＯＸＡ３、ＨＲＡＳ、ＨＳＰ９０ＡＡ１、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＧＦ２Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＮＨＢＡ、ＩＲＳ２、ＩＴＰＡ、ＪＡＫ１、ＪＡＫ２、ＪＡＫ３、ＪＵＮ、ＫＤＲ、ＫＩＴ、ＫＲＡＳ、ＬＲＰ１Ｂ、ＬＲＰ２、ＬＴＫ、ＭＡＮ１Ｂ１、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＡＰ２Ｋ４、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＮ１、ＭＥＴ、ＭＩＴＦ、ＭＬＨ１、ＭＬＬ、ＭＰＬ、ＭＲＥ１１Ａ、ＭＳＨ２、ＭＳＨ６、ＭＴＨＦＲ、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣ、ＭＹＣＬ１、ＭＹＣＮ、ＮＦ１、ＮＦ２、ＮＫＸ２−１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＱＯ１、ＮＲＡＳ、ＮＲＰ２、ＮＴＲＫ１、ＮＴＲＫ３、ＰＡＫ３、ＰＡＸ５、ＰＤＧＦＲＡ、ＰＤＧＦＲＢ、ＰＩＫ３ＣＡ、ＰＩＫ３Ｒ１、ＰＫＨＤ１、ＰＬＣＧ１、ＰＲＫＤＣ、ＰＴＣＨ１、ＰＴＥＮ、ＰＴＰＮ１１、ＰＴＰＲＤ、ＲＡＦ１、ＲＡＲＡ、ＲＢ１、ＲＥＴ、ＲＩＣＴＯＲ、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＬＣ１９Ａ１、ＳＬＣ２２Ａ２、ＳＬＣＯ１Ｂ３、ＳＭＡＤ２、ＳＭＡＤ３、ＳＭＡＤ４、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＯＤ２、ＳＯＸ１０、ＳＯＸ２、ＳＲＣ、ＳＴＫ１１、ＳＵＬＴ１Ａ１、ＴＢＸ２２、ＴＥＴ２、ＴＧＦＢＲ２、ＴＭＰＲＳＳ２、ＴＮＦＲＳＦ１４、ＴＯＰ１、ＴＰ５３、ＴＰＭＴ、ＴＳＣ１、ＴＳＣ２、ＴＹＭＳ、ＵＧＴ１Ａ１、ＵＭＰＳ、ＵＳＰ９Ｘ、ＶＨＬおよびＷＴ１が挙げられるが、これらに限定されない。

一実施形態では、遺伝子病変は、ＡＬＫ遺伝子の３’コード領域を別の遺伝子に融合させる遺伝子融合である。

一実施形態では、遺伝子病変は、ＡＬＫ遺伝子の３’コード領域をＥＭＬ４遺伝子に融合させる遺伝子融合である。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる胎児試験に好適な状態の実例としては、ダウン症候群（トリソミー２１）、エドワーズ症候群（トリソミー１８）、パトー症候群（トリソミー１３）、クラインフェルター症候群（ＸＸＹ）、トリプルＸ症候群、ＸＹＹ症候群、トリソミー８、トリソミー１６、ターナー症候群（ＸＯ）、ロバートソン型転座、ディ・ジョージ症候群およびウォルフ・ヒルショルン症候群が挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる親子鑑定に好適な対立遺伝子の実例は、Ｄ２０Ｓ１０８２、Ｄ６Ｓ４７４、Ｄ１２ＡＴＡ６３、Ｄ２２Ｓ１０４５、Ｄ１０Ｓ１２４８、Ｄ１Ｓ１６７７、Ｄ１１Ｓ４４６３、Ｄ４Ｓ２３６４、Ｄ９Ｓ１１２２、Ｄ２Ｓ１７７６、Ｄ１０Ｓ１４２５、Ｄ３Ｓ３０５３、Ｄ５Ｓ２５００、Ｄ１Ｓ１６２７、Ｄ３Ｓ４５２９、Ｄ２Ｓ４４１、Ｄ１７Ｓ９７４、Ｄ６Ｓ１０１７、Ｄ４Ｓ２４０８、Ｄ９Ｓ２１５７、アメロゲニン、Ｄ１７Ｓ１３０１、Ｄ１ＧＡＴＡ１１３、Ｄ１８Ｓ８５３、Ｄ２０Ｓ４８２およびＤ１４Ｓ１４３４のうちの１６またはそれ超を含むが、これらに限定されない。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる薬物処置に対する応答の予測に好適な遺伝子の実例は、次の遺伝子の１つまたは複数を含むが、これらに限定されない：ＡＢＣＢ１（ＡＴＰ結合カセット、サブファミリーＢ（ＭＤＲ／ＴＡＰ）、メンバー１）、ＡＣＥ（アンジオテンシンＩ転換酵素）、ＡＤＨ１Ａ（アルコールデヒドロゲナーゼ１Ａ（クラスＩ）、アルファポリペプチド）、ＡＤＨ１Ｂ（アルコールデヒドロゲナーゼＩＢ（クラスＩ）、ベータポリペプチド）、ＡＤＨ１Ｃ（アルコールデヒドロゲナーゼ１Ｃ（クラスＩ）、ガンマポリペプチド）、ＡＤＲＢ１（アドレナリン作用性、ベータ−１−、受容体）、ＡＤＲＢ２（アドレナリン作用性、ベータ−２−、受容体、表面）、ＡＨＲ（アリール炭化水素受容体）、ＡＬＤＨ１Ａ１（アルデヒドデヒドロゲナーゼ１ファミリー、メンバーＡ１）、ＡＬＯＸ５（アラキドン酸５−リポキシゲナーゼ）、ＢＲＣＡ１（乳がん１、早期発症型）、ＣＯＭＴ（カテコール−Ｏ−メチルトランスフェラーゼ）、ＣＹＰ２Ａ６（チトクロムＰ４５０、ファミリー２、サブファミリーＡ、ポリペプチド６）、ＣＹＰ２Ｂ６（チトクロムＰ４５０、ファミリー２、サブファミリーＢ、ポリペプチド６）、ＣＹＰ２Ｃ９（チトクロムＰ４５０、ファミリー２、サブファミリーＣ、ポリペプチド９）、ＣＹＰ２Ｃ１９（チトクロムＰ４５０、ファミリー２、サブファミリーＣ、ポリペプチド１９）、ＣＹＰ２Ｄ６（チトクロムＰ４５０、ファミリー２、サブファミリーＤ、ポリペプチド６）、ＣＹＰ２Ｊ２（チトクロムＰ４５０、ファミリー２、サブファミリーＪ、ポリペプチド２）、ＣＹＰ３Ａ４（チトクロムＰ４５０、ファミリー３、サブファミリーＡ、ポリペプチド４）、ＣＹＰ３Ａ５（チトクロムＰ４５０、ファミリー３、サブファミリーＡ、ポリペプチド５）、ＤＰＹＤ（ジヒドロピリミジンデヒドロゲナーゼ）、ＤＲＤ２（ドーパミン受容体Ｄ２）、Ｆ５（凝固第Ｖ因子）、ＧＳＴＰ１（グルタチオンＳ−トランスフェラーゼパイ）、ＨＭＧＣＲ（３−ヒドロキシ−３−メチルグルタリル補酵素Ａレダクターゼ）、ＫＣＮＨ２（カリウム電位依存性チャネル、サブファミリーＨ（ｅａｇ関連）、メンバー２）、ＫＣＮＪ１１（内向き整流性カリウムチャネル、サブファミリーＪ、メンバー１１）、ＭＴＨＦＲ（５，１０−メチレンテトラヒドロ葉酸レダクターゼ（ＮＡＤＰＨ））、ＮＱＯ１（ＮＡＤ（Ｐ）Ｈデヒドロゲナーゼ、キノン１）、Ｐ２ＲＹ１（プリン受容体Ｐ２Ｙ、Ｇタンパク質結合型、１）、Ｐ２ＲＹ１２（プリン受容体Ｐ２Ｙ、Ｇタンパク質結合型、１２）、ＰＴＧＩＳ（プロスタグランジンＩ２（プロスタサイクリン）シンターゼ）、ＳＣＮ５Ａ（ナトリウムチャネル、電圧依存性、Ｖ型、アルファ（ＱＴ延長症候群３））、ＳＬＣ１９Ａ１（溶質輸送体ファミリー１９（葉酸トランスポーター）、メンバー１）、ＳＬＣＯ１Ｂ１（溶質輸送体有機アニオントランスポーターファミリー、メンバー１Ｂ１）、ＳＵＬＴ１Ａ１（スルホトランスフェラーゼファミリー、サイトゾル性、１Ａ、フェノール選択性、メンバー１）、ＴＰＭＴ（チオプリンＳ−メチルトランスフェラーゼ）、ＴＹＭＳ（チミジル酸シンセターゼ）、ＵＧＴ１Ａ１（ＵＤＰグルクロノシルトランスフェラーゼ１ファミリー、ポリペプチドＡ１）、ＶＤＲ（ビタミンＤ（１，２５−ジヒドロキシビタミンＤ３）受容体）、ＶＫＯＲＣ１（ビタミンＫエポキシドレダクターゼ複合体、サブユニット１）。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる病状の実例としては、脳卒中、一過性虚血発作、外傷性脳損傷、心疾患、心臓発作、狭心症、アテローム動脈硬化症および高血圧が挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いてスクリーニングすることができる病原体の実例としては、細菌、真菌およびウイルスが挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いてスクリーニングすることができる細菌種の実例としては、Ｍｙｃｏｂａｃｔｅｒｉｕｍｓｐｐ．、Ｐｎｅｕｍｏｃｏｃｃｕｓｓｐｐ．、Ｅｓｃｈｅｒｉｃｈｉａｓｐｐ．、Ｃａｍｐｙｌｏｂａｃｔｅｒｓｐｐ．、Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍｓｐｐ．、Ｃｌｏｓｔｒｉｄｉｕｍｓｐｐ．、Ｓｔｒｅｐｔｏｃｏｃｃｕｓｓｐｐ．、Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓｐｐ．、Ｐｓｅｕｄｏｍｏｎａｓｓｐｐ．、Ｓｈｉｇｅｌｌａｓｐｐ．、Ｔｒｅｐｏｎｅｍａｓｐｐ．、またはＳａｌｍｏｎｅｌｌａｓｐｐ．が挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いてスクリーニングすることができる真菌種の実例としては、Ａｓｐｅｒｇｉｌｌｉｓｓｐｐ．、Ｂｌａｓｔｏｍｙｃｅｓｓｐｐ．、Ｃａｎｄｉｄａｓｐｐ．、Ｃｏｃｃｉｃｉｏｉｄｅｓｓｐｐ．、Ｃｒｙｐｔｏｃｏｃｃｕｓｓｐｐ．、皮膚糸状菌、Ｔｉｎｅａｓｐｐ．、Ｔｒｉｃｈｏｐｈｙｔｏｎｓｐｐ．、Ｍｉｃｒｏｓｐｏｒｕｍｓｐｐ．、Ｆｕｓａｒｉｕｍｓｐｐ．、Ｈｉｓｔｏｐｌａｓｍａｓｐｐ．、Ｍｕｃｏｒｏｍｙｃｏｔｉｎａｓｐｐ．、Ｐｎｅｕｍｏｃｙｓｔｉｓｓｐｐ．、Ｓｐｏｒｏｔｈｒｉｘｓｐｐ．、Ｅｘｓｅｒｏｐｈｉｌｕｍｓｐｐ．またはＣｌａｄｏｓｐｏｒｉｕｍｓｐｐ．が挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いてスクリーニングすることができるウイルスの実例としては、Ａ型インフルエンザ、例えばＨ１Ｎ１、Ｈ１Ｎ２、Ｈ３Ｎ２およびＨ５Ｎ１（鳥インフルエンザ）、Ｂ型インフルエンザ、Ｃ型インフルエンザウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、Ｄ型肝炎ウイルス、Ｅ型肝炎ウイルス、ロタウイルス、ノーウォークウイルス群のあらゆるウイルス、腸内アデノウイルス、パルボウイルス、デング熱ウイルス、サルポックス、モノネガウイルス、ラッサウイルス、例えば狂犬病ウイルス、ラゴスコウモリウイルス、モコラウイルス、ドゥベンヘイジウイルス、ヨーロッパコウモリウイルス１および２ならびにオーストラリアコウモリウイルス、エフェメロウイルス、ベシクロウイルス、水疱性口内炎ウイルス（ＶＳＶ）、ヘルペスウイルス、例えば単純ヘルペスウイルス１および２型、水痘帯状疱疹、サイトメガロウイルス、エプスタイン・バーウイルス（ＥＢＶ）、ヒトヘルペスウイルス（ＨＨＶ）、ヒトヘルペスウイルス６および８型、モロニーマウス白血病ウイルス（Ｍ−ＭｕＬＶ）、モロニーマウス肉腫ウイルス（ＭｏＭＳＶ）、ハーベイマウス肉腫ウイルス（ＨａＭｕＳＶ）、マウス乳癌ウイルス（ＭｕＭＴＶ）、テナガザル白血病ウイルス（ＧａＬＶ）、ネコ白血病ウイルス（ＦＬＶ）、スプーマウイルス、フレンドマウス白血病ウイルス、マウス幹細胞ウイルス（ＭＳＣＶ）およびラウス肉腫ウイルス（ＲＳＶ）、ＨＩＶ（ヒト免疫不全ウイルス；ＨＩＶ１型およびＨＩＶ２型を含む）、ビスナ・マエディウイルス（ＶＭＶ）ウイルス、ヤギ関節炎脳炎ウイルス（ＣＡＥＶ）、ウマ伝染性貧血ウイルス（ＥＩＡＶ）、ネコ免疫不全ウイルス（ＦＩＶ）、ウシ免疫不全ウイルス（ＢＩＶ）およびサル免疫不全ウイルス（ＳＩＶ）、パピローマウイルス、マウスガンマヘルペスウイルス、アレナウイルス、例えばアルゼンチン出血熱ウイルス、ボリビア出血熱ウイルス、サビア関連出血熱ウイルス、ベネズエラ出血熱ウイルス、ラッサ熱ウイルス、マチュポウイルス、リンパ球性脈絡髄膜炎ウイルス（ＬＣＭＶ）、Ｂｕｎｙａｖｉｒｉｄｉａｅ、例えばクリミア・コンゴ出血熱ウイルス、ハンタウイルス、腎症候性出血熱原因ウイルス、リフトバレー熱ウイルス、Ｆｉｌｏｖｉｒｉｄａｅ（フィロウイルス）（エボラ出血熱およびマールブルグ出血熱を含む）、Ｆｌａｖｉｖｉｒｉｄａｅ（キャサヌル森林病ウイルス、オムスク出血熱ウイルス、マダニ媒介脳炎原因ウイルスを含む）、ならびにＰａｒａｍｙｘｏｖｉｒｉｄａｅ、例えばヘンドラウイルスおよびニパウイルス、大痘瘡および小痘瘡（天然痘）、アルファウイルス、例えばベネズエラウマ脳炎ウイルス、東部ウマ脳炎ウイルス、西部ウマ脳炎ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ−ＣｏＶ）、西ナイルウイルスおよび任意の脳炎原因ウイルスが挙げられるが、これらに限定されない。

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる移植レシピエントにおける臓器移植のモニタリングに好適な遺伝子の実例は、次の遺伝子の１つまたは複数を含むが、これらに限定されない：ＨＬＡ−Ａ、ＨＬＡ−Ｂ、ＨＬＡ−Ｃ、ＨＬＡ−ＤＲ、ＨＬＡ−ＤＰおよびＨＬＡ−ＤＱ。

特定の実施形態では、バイオインフォマティック解析は、ｃｆＤＮＡクローンライブラリー中の解析されるゲノム当量の数を定量するために、標的遺伝子座位の遺伝子バリアントを検出するために、標的遺伝子座位内の変異を検出するために、標的遺伝子座位内の遺伝子融合を検出するために、または標的遺伝子座位内のコピー数増減を測定するために使用される。

Ｅ．コンパニオン診断
様々な実施形態では、遺伝疾患のコンパニオン診断であって、対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、およびｃｆＤＮＡクローンライブラリー中の遺伝疾患に関連する１つまたは複数のバイオマーカーの定量的遺伝子解析を行うステップを含み、１つまたは複数のバイオマーカーの少なくとも１つの検出、または検出できないことが、対象を遺伝疾患について処置すべきかどうかを示す、コンパニオン診断が提供される。

本明細書で使用する場合、用語「コンパニオン診断」は、特定の抗がん療法に結びつけられる診断検査を指す。特定の実施形態では、これらの診断方法は、生体試料中の関連するバイオマーカーに関する遺伝子病変の検出を含み、それによって抗がん療法で処置すべきまたはすべきでない患者の迅速な同定が可能になる。

抗がん療法は、外科手術、放射線、化学療法薬、抗がん薬および免疫調節薬を含むが、これらに限定されない。

抗がん薬の実例としては、アルキル化剤、例えば、チオテパおよびシクロホスファミド（ＣＹＴＯＸＡＮ（商標））；アルキルスルホン酸、例えばブスルファン、インプロスルファンおよびピポスルファン；アジリジン、例えば、ベンゾドーパ、カルボコン、メツレドーパおよびウレドーパ；エチレンイミンおよびメチルメラミン（methylamelamines）（アルトレタミン、トリエチレンメラミン、トリエチレンホスホラミド、トリエチレンチオホスホラミドおよびトリメチロールメラミン（trimethylolomelamine）レジュメを含む）；ナイトロジェンマスタード、例えば、クロラムブシル、クロルナファジン、コロホスファミド、エストラムスチン、イホスファミド、メクロレタミン、メクロレタミンオキシド塩酸塩、メルファラン、ノベムビチン、フェネステリン、プレドニムスチン、トロホスファミド、ウラシルマスタード；ニトロソウレア、例えば、カルムスチン、クロロゾトシン、ホテムスチン、ロムスチン、ニムスチン、ラニムスチン；抗生物質、例えば、アクラシノマイシン（aclacinomysins）、アクチノマイシン、アントラマイシン（authramycin）、アザセリン、ブレオマイシン、カクチノマイシン、カリケアマイシン、カラビシン、カルミノマイシン、カルジノフィリン、クロモマイシン、ダクチノマイシン、ダウノルビシン、デトルビシン、６−ジアゾ−５−オキソ−Ｌ−ノルロイシン、ドキソルビシンおよびそのＰＥＧ化製剤、エピルビシン、エソルビシン、イダルビシン、マルセロマイシン、マイトマイシン、ミコフェノール酸、ノガラマイシン、オリボマイシン、ペプロマイシン、ポトフィロマイシン、ピューロマイシン、クエラマイシン、ロドルビシン、ストレプトニグリン、ストレプトゾシン、ツベルシジン、ウベニメクス、ジノスタチン、ゾルビシン；代謝拮抗薬、例えば、メトトレキサートおよび５−フルオロウラシル（５−ＦＵ）；葉酸類似体、例えば、デノプテリン、メトトレキサート、プテロプテリン、トリメトレキサート；プリン類似体、例えば、フルダラビン、６−メルカプトプリン、チアミプリン、チオグアニン；ピリミジン類似体、例えば、アンシタビン、アザシチジン、６−アザウリジン、カルモフール、シタラビン、ジデオキシウリジン、ドキシフルリジン、エノシタビン、フロクスウリジン、５−ＦＵ；アンドロゲン、例えば、カルステロン、プロピオン酸ドロモスタノロン、エピチオスタノール、メピチオスタン、テストラクトン；抗副腎薬（anti-adrenals）、例えば、アミノグルテチミド、ミトタン、トリロスタン；葉酸補充薬、例えば、フォリン酸（frolinic acid）；アセグラトン；アルドホスファミドグリコシド；アミノレブリン酸；アムサクリン；ベストラブシル；ビスアントレン；エダトレキサート（edatraxate）；デフォファミン；デメコルシン；ジアジコン；エルフォルミチン；酢酸エリプチニウム；エトグルシド；硝酸ガリウム；ヒドロキシウレア；レンチナン；ロニダミン；ミトグアゾン；ミトキサントロン；モピダモール；ニトラクリン；ペントスタチン；フェナメット；ピラルビシン；ポドフィリン酸；２−エチルヒドラジド；プロカルバジン；ＰＳＫ（登録商標）；ラゾキサン；シゾフィラン；スピロゲルマニウム；テヌアゾン酸；トリアジコン；２，２’，２”−トリクロロトリエチルアミン；ウレタン；ビンデシン；ダカルバジン；マンノムスチン；ミトブロニトール；ミトラクトール；ピポブロマン；ガシトシン；アラビノシド（「Ａｒａ−Ｃ」）；シクロホスファミド；チオテパ；タキソイド、例えば、パクリタキセル（ＴＡＸＯＬ（登録商標）、Ｂｒｉｓｔｏｌ−ＭｙｅｒｓＳｑｕｉｂｂＯｎｃｏｌｏｇｙ、Ｐｒｉｎｃｅｔｏｎ、Ｎ．Ｊ．）およびドセタキセル（doxetaxel）（ＴＡＸＯＴＥＲＥ（登録商標）、Ｒｈｎｅ−ＰｏｕｌｅｎｃＲｏｒｅｒ、Ａｎｔｏｎｙ、Ｆｒａｎｃｅ）；クロラムブシル；ゲムシタビン；６−チオグアニン；メルカプトプリン；メトトレキサート；白金類似体、例えば、シスプラチンおよびカルボプラチン；ビンブラスチン；白金；エトポシド（ＶＰ−１６）；イホスファミド；マイトマイシンＣ；ミトキサントロン；ビンクリスチン；ビノレルビン；ナベルビン；ノバントロン；テニポシド；アミノプテリン；ゼローダ；イバンドロネート；ＣＰＴ−１１；トポイソメラーゼ阻害剤ＲＦＳ２０００；ジフルオロメチルオルニチン（difluoromethylomithine）（ＤＭＦＯ）；レチノイン酸誘導体、例えば、Ｔａｒｇｒｅｔｉｎ（商標）（ベキサロテン）、Ｐａｎｒｅｔｉｎ（商標）（アリトレチノイン）；ＯＮＴＡＫ（商標）（デニロイキンジフチトクス）；エスペラミシン；カペシタビン；ならびに上記のいずれかの薬学的に許容される塩、酸または誘導体が挙げられるが、これらに限定されない。がんに対するホルモン作用を調節または阻害するように作用する抗ホルモン剤、例えば、抗エストロゲン剤、例えば、タモキシフェン、ラロキシフェン、４（５）−イミダゾールを阻害するアロマターゼ、４−ヒドロキシタモキシフェン、トリオキシフェン、ケオキシフェン、ＬＹ１１７０１８、オナプリストン、およびトレミフェン（フェアストン）など；ならびに抗アンドロゲン剤、例えば、フルタミド、ニルタミド、ビカルタミド、ロイプロリドおよびゴセレリン；ならびに上記のいずれかの薬学的に許容される塩、酸または誘導体もこの定義に含まれる。

免疫調節薬の実例としては、シクロスポリン、タクロリムス、トレスペリムス、ピメクロリムス、シロリムス、ベロリムス、ラフルニムス、ラキニモドおよびイミキモド、ならびにこれらの類似体、誘導体、塩、イオンおよび複合体が挙げられるが、これらに限定されない。

本明細書に引用されているすべての出版物、特許出願および発行特許は、個々の出版物、特許出願または発行特許各々が参照により組み入れられていると具体的にかつ個々に示されているかのごとく、参照により本明細書に組み入れられている。

上述の発明は、理解を明確にする目的で説明および例としてある程度詳細に記載されているが、本発明の教示を考慮して、添付の特許請求の範囲の趣旨または範囲を逸脱することなく、ある特定の変更および改変をそこに加えることができることは、当業者には容易に明らかであろう。以下の実施例は、単に説明として与えるものであり、限定として与えるものではない。当業者は、本質的に同様の結果が得られるように変更または改変することができる、様々な重要性の低いパラメータに容易に気付くであろう。

（実施例１）
標的化配列捕捉技術を使用する低頻度変異の正確な検出
目的
本実験の目的は、標的化配列捕捉技術を使用する低頻度バリアント検出の原理証明を直接実証することであった。

背景
標的配列捕捉技術は、核酸の定量的な配列ベースの遺伝子解析をもたらし、この技術を活用して、薬物代謝遺伝子の変異数とコピー数の組合せ解析を行うことができる。本発明者らは、標的化配列捕捉技術およびその後の遺伝子解析を使用して、低頻度配列バリアントを検出した。

ゲノムＤＮＡインプットは、低頻度バリアント検出に中心的な役割を果たすが、ゲノムインプットの定量的解析および制御によって、低頻度バリアント解析の推定感度の限界値がおかれる。本発明者らはゲノムインプットを推定するためにゲノムｑＰＣＲアッセイを使用した。

低頻度バリアント解析の１つの実験目標は、アッセイの標的感度に対して１０倍多いゲノムインプットの導入である。言い換えると、１％（１００中１）の感度でバリアントを測定するためには、実験標的は、１０００ゲノムのインプットとなる。シークエンシングの下流でバイオインフォマティクス解析がユニークリード数を明らかにし、これは、ゲノムインプットの直交的測定とより直接的な測定の両方であるという望ましい品質を有する。

概要
ＳＮＶが既知である細胞株（ＺＲ７５−３０）と生殖系列ＤＮＡ試料（ＮＡ１２８７８）とを１対１〜１対１０００の範囲の希釈系列で混合した。既知の配列差に対応する標的領域を、標的化配列捕捉技術を使用して検索し、シークエンシングした。１０００配列につき１未満の頻度で発生する配列バリアントを検出した。

方法
捕捉プローブ
次の表は、この実験で使用した一群の６２捕捉プローブを示す。

捕捉プローブモジュールをストックプレートからプールし、パートナーオリゴ＃１３８（配列番号６３）（ＧＴＧＡＡＡＡＣＣＡＧＧＡＴＣＡＡＣＴＣＣＣＧＴＧＣＣＡＧＴＣＡＣＡＴ／３ＢｉｏＴＥＧ／）と併せ、１ｎＭの最終作業濃度に希釈した。

ゲノム試料
生殖系列試料ＮＡ１２８７８および細胞株ＺＲ７５−３０からの商業的に購入したゲノムＤＮＡを、Ｃｏｖａｒｉｓ超音波処理装置で、１０〜２０ｎｇ／μｌの濃度で５００ｂｐの標的断片サイズに断片化した。そのＤＮＡを１：１濃度のＤＮＡ精製ビーズで精製し、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＮＥＢ）Ｑｕｉｃｋｂｌｕｎｔキットを使用して１５〜３０ｎｇ／μＬの最終濃度で末端修復した。生殖系列ＤＮＡと細胞株ＤＮＡをそれぞれ１：１、１０：１、１００：１および１０００：１の比でブレンドした。ライブラリーを構築し、精製し、定量した。ライブラリー構築に使用した試料コード、ライブラリー定量およびインプットを表２に示す。

ゲノムライブラリーをプールし、変性させ、プローブと併せ、ハイブリダイズし、洗浄した。洗浄した捕捉プローブ−タグ付きゲノムライブラリー複合体をフォワードおよびリバース完全長プライマーで増幅させ、精製し、Ｐｉｐｐｉｎ−ｐｒｅｐ装置で２２５〜６００ｂｐ断片をサイズ選択した。最後に、１５０−Ｖ３Ｉｌｌｕｍｉｎａシークエンシングキットを使用して、捕捉された物質をシークエンシングした。

結果
ＢＲＡＦ（２つの座位で）、ＭＹＣＮおよびＣＤＨ１を標的にする対の捕捉プローブを使用して、これらの座位におけるＳＮＶを解析した。結果を表３に示す。

縦列３は、ユニークリード数の総数を示し、そしてまたその数によってアッセイの感度における限界値が提供される。推定および測定ゲノムインプットは、十分に互いの範囲内であった。薄い影を付けたボックスは、細胞株配列が生殖系列配列とは異なっていたＳＮＶを強調する。表の右の部分に示した、ユニークリードのフィルタリング不在下では、これら４つの選択位置で、測定可能な、非ゼロ頻度の、ランダムな塩基変化が発生した。図１。変化がユニークリードファミリー内で発生することを要求することにより、間違いの元となるノイズから真のシグナルを選別することが可能になった。図２。

（実施例２）
高度に断片化されたｇＤＮＡ内の標的領域の包括的シークエンシングに有効な新規プローブ設計
目的
これらの実験の目的は、循環ＤＮＡを確実にかつ再現可能に調べるためのアッセイシステムを開発することである。

背景
体液からの循環ＤＮＡの解析は、分子診断の胸の高鳴るような、しかしまだ実現されていない機会を意味する。ゲノムＤＮＡは、非常にインタクトである。文献は、循環ＤＮＡの平均サイズが、単一ヌクレオソームヒストン複合体に巻き付いているＤＮＡのサイズに十分に相関する約１５０ｂｐであることを示唆している。

概要
本明細書において企図される標的化配列捕捉技術の技術パラメータは、高度に断片化されたＤＮＡに対応するように、および標的化ＤＮＡの広範囲にわたる配列カバレッジを生じさせる能力を保持するように設計した。捕捉プローブ密度を増加させ、捕捉プローブ配列の長さを６０ヌクレオチドから４０ヌクレオチドに短縮して、クローンライブラリーにおける情報価値のない配列の生成を最小にした。ヒトゲノムには、反復配列、および塩基組成の極端な増減が多く存在するので、より高い捕捉プローブ密度およびより短い捕捉プローブを実装することの適切性は認められておらず、この新規アッセイの実験による検証を要した。

より短い４０ｍｅｒ捕捉プローブ配列が信頼性のある頑強なアッセイ性能を示す条件を確立した。実験の第１のセットでは、アッセイを使用して、２つの大きな領域−腫瘍抑制遺伝子ＴＰ５３のコード領域とＡＬＫがん遺伝子の長い連続する第１９イントロン（これらの両方ががん診断の中核をなすものである）−を照会した。実験の第２のセットでは、より短い４０ヌクレオチド捕捉プローブ配列を有する、いくつかの高密度の対での捕捉プローブを使用して、ＮＣＩ−Ｈ６９細胞株中に存在する既知のＳＮＶを調べた。

この新規の高密度でより短い捕捉プローブを使用して短い断片化ＤＮＡの照会に成功し、結果は、このアッセイ設計が血液の血漿画分において見いだされる循環ＤＮＡのシークエンシングによく適していることを示した。

方法−改変型４０ｍｅｒ捕捉プローブ
４０ｍｅｒ捕捉プローブの性能を実験により検証するために使用した捕捉プローブ配列を表４に示す。

４０ｍｅｒ捕捉プローブの性能を６０ｍｅｒ捕捉プローブのものと比較した。６０ｍｅｒの５’末端から２０ヌクレオチド除去することによって、６０ｍｅｒから４０ｍｅｒを設計した。両方の捕捉プローブセットの３’末端は、捕捉されたゲノムクローンからコピーされる配列に関して同一であるが、プローブ配列シグネチャー（対合末端リードのリード２）は、６０ｍｅｒプローブセットと４０ｍｅｒプローブセット間で異なる。この設計は、捕捉プローブをシークエンシング中に多重化することが可能であり、その後、それらの性能を下流のバイオインフォマティクスデコンボリューション（deconvolution）中に解析することが可能であるので、有用である。

ゲノム試料
１２のゲノムＤＮＡ試料（１１２ヒトゲノムＤＮＡのＣｏｒｉｅｌｌヒトパネルから選択したもの）のプールを標的ＤＮＡとして使用した。それらの１２試料を、表５に詳細に示すように各々が試料４つの４セットに分けた。

ハイブリダイゼーション、洗浄およびシークエンシング
６つの異なるハイブリダイゼーション条件を使用して、６０ｍｅｒおよび４０ｍｅｒプローブをゲノム標的ＤＮＡにハイブリダイズした：
１）６０ｍｅｒプローブを５０℃で洗浄
２）４０ｍｅｒプローブを５０℃で洗浄
３）６０ｍｅｒプローブを４７℃で洗浄
４）４０ｍｅｒプローブを４７℃で洗浄
５）６０ｍｅｒプローブを４４℃で洗浄
６）４０ｍｅｒプローブを４４℃で洗浄。

実験ごとに、捕捉プローブオリゴをパートナーオリゴと併せた。二本鎖捕捉プローブの最終濃度は、各捕捉プローブについて１ｎＭであった。

各ハイブリダイゼーション反応は、全体積４０μｌ中に約２．５μｇのゲノムライブラリーを有した。各試料を２分間、９８℃に加熱し、次いで、氷で冷却した。２０μｌの捕捉プローブおよび９０μｌのハイブリダイゼーションバッファーを添加し、そのハイブリダイゼーション混合物を、８０℃で出発して４８分ごとに１度低下させて５０℃にする２４時間のインキュベーションに付した。複合体を全体積１ｍＬのＴＥｚｅｒｏバッファー＋０．０５％Ｔｗｅｅｎ２０（ＴＴ）中の２０ｕｌのストレプトアビジンビーズと結合させた。ビーズを２００ｕｌのＴＴで各々５分間、３回洗浄し、４５℃で５分間、洗浄バッファー中で１回洗浄した。次いで、ビーズをＴＥｚｅｒｏで洗浄し、反応ごとに２０μｌＴＥｚｅｒｏに再懸濁させた。次いで、複合体を、完全長フォワード（ＡＣＡ２＿ＦＬＦＰ；配列番号１５２；ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡＧＡＴＣＴＡＣＡＣＧＴＣＡＴＧＣＡＧＧＡＣＣＡＧＡＧＡＡＴＴＣＧＡＡＴＡＣＡ）および完全長リバース（ＣＡＣ３＿ＦＬＲＰ；配列番号１５３；ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴＧＴＧＡＣＴＧＧＣＡＣＧＧＧＡＧＴＴＧＡＴＣＣＴＧＧＴＴＴＴＣＡＣ）プライマーでＰＣＲ増幅させた。

増幅および精製後、得られた産物の質量を測定し、等しい質量をシークエンシングのためにプールした。

結果−改変型４０ｍｅｒプライマー
長さおよび洗浄温度の関数として捕捉プローブ性能を図３に図示する。全体として、４０ｍｅｒ捕捉プローブは、４４℃および４７℃洗浄で６０ｍｅｒ捕捉プローブと同様によく機能した。５０℃洗浄では、４０ｍｅｒ捕捉プローブは散発的な挙動を示す。これらのデータは、これらの試薬を使用する場合の４０ｍｅｒ捕捉プローブおよび４４℃〜４７℃の範囲の洗浄温度の使用を実験により検証するものである。

方法−高密度４０ｍｅｒ
一般に、配列捕捉プローブは、特異的「規則」を使用して設計する。例えば、冗長配列の領域、または極度の塩基組成の偏りを示す領域を一般に避ける。高いプローブ密度および標的領域に沿った近いプローブ間隔の要件の１つの重要な含意は、あらゆるそのようなプローブ設計規則に対応するためにプローブを移動させる許容範囲が殆どまたは全くないことである。この研究では、プローブを、プローブ結合配列を一切考慮せずに、互いに対するそれらの位置にのみ基づいて設計したため、この高密度アプローチの使用は、ハイブリダイゼーション方法および処理方法がそのような一群のプローブに対応することを実験により検証することを必要とする。

ヒトＡＬＫ遺伝子は、早期発生に重要なプロテインキナーゼをコードするが、正常なＡＬＫ遺伝子発現は、正常な成人では本質的に検出できない。発がん性ＡＬＫ融合体は、ＡＬＫの第１９イントロンが、ＡＬＫのキナーゼコード部分を別の遺伝子の５’末端に融合させる非正統組換えを受けたとき生成される。そのような遺伝子融合体は、ＡＬＫキナーゼの異所性発現を引き起こすことが多く、そしてまたこの異所性発現は、肺腫瘍で観察される不適切な細胞増殖の駆動に重要である。肺がんの場合、この「他の遺伝子」はＥＭＬ４であることが多いが、他の融合パートナーも検出されている。可能性のあるあらゆるＡＬＫ遺伝子融合事象を検出することができるアッセイを作成するために、ＡＬＫの第１９イントロンに８０ヌクレオチド間隔で配置される４０ヌクレオチドプローブを設計した。これらのプローブを遺伝子に対してアンチセンスになるように配向させた（図４）。これは、それらの３’末端が伸長し、それらのハイブリダイゼーション部位に対して５’にある遺伝子領域をコピーすることを意味する。融合遺伝子が存在する場合、融合ジャンクション付近に位置するプローブからのプローブ伸長は、ジャンクション配列をコピーする。これらのジャンクションクローンから得られるＤＮＡ配列は、それらの５’末端に融合パートナー配列を有し、融合ジャンクション配列を有し、そしてそれらの３’末端にＡＬＫ第１９イントロン配列を有する（図４Ｂ）。

がんにおけるもう１つの重要な診断標的は、ＴＰ５３遺伝子である。この遺伝子は、腫瘍抑制因子をコードし、がんにおいて、多くの場合、変異によって不活性化される。遺伝子機能を不活性化することができる変異はこの遺伝子全体にわたって散在するので、ＴＰ５３不活性化変異についての配列ベースの包括的アッセイは、この遺伝子の全コード領域および非翻訳領域（ＵＴＲ）に対処しなければならない。循環ＤＮＡ断片は短いので、高密度プローブを使用してＴＰ５３遺伝子のすべての標的領域を調べた。ＡＬＫとは異なり、ＴＰ５３についてのプローブを可能性のある両方の配向で配置する（図５）。高いプローブ密度では、複数のプローブからの累積カバレッジが標的領域の均一な深いシークエンシングカバレッジをもたらす。

この研究に使用した一連の１０５プローブを表６に示す。ＡＬＫの融合しやすい領域およびＴＰ５３のコード領域を標的にするプローブに加えて、細胞株ＤＮＡにおける既知のＳＮＶを包括するプローブも含めた。

ゲノム試料
ゲノムＤＮＡの３つの試料を解析した：
１）生殖系列試料ＮＡ０６９９４ − Ｃｏｒｉｅｌｌレポジトリから得た正常ヒト試料、
２）がん細胞株ＮＣＩ−Ｈ６９ − ＴＰ５３に変異があり、ＭＹＣＮ座位の増幅があり、標的プローブセット内に含めたＡＬＤＨ４Ａ１、ＢＲＣＡ１、ＢＲＣＡ２、ＣＤＫＮ２Ａ、ＤＰＹＤ、ＥＰＨＸ１、ＭＹＣ、ＲＢ１およびＴＮＦＲＳＦ１４にＳＮＶがあることが既知の細胞株、
３）がん細胞株ＺＲ−７５−１、この細胞株はＥＭＬ４−ＡＬＫ融合遺伝子を有することが報告されている（Linら、Mol.Cancer Res.、７巻（９号）：１４６６頁、２００９年）。

ＤＮＡシークエンシングライブラリーは、一般に、共有ＤＮＡ断片から構築される。音響分解を使用して、サイズが２００〜＞５００ｂｐの範囲であるＤＮＡ断片を生成した。ヌクレオソームの約１５０ｂｐ断片で構成されていると考えられる循環ＤＮＡを模倣する目的で、音響によって断片化されたＤＮＡの酵素的断片化を行った。簡単に言うと、２０〜４０ｎｇ／μｌのＤＮＡを２００ｂｐ設定で超音波処理し、サイズが１５０ｂｐ〜４００ｂｐの範囲である広いスメアの断片を得た。０．０１および０．０２μｌのＤＮＡｓｅ酵素（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ組換えウシＤＮＡｓｅ）をＤＮＡｓｅバッファー（１０ｍＭＴｒｉｓｐＨ８．０、２．５ｍＭＭｎＣｌ_２、０．５ｍＭＣａＣｌ_２）中のＤＮＡの５０μｌアリコートに添加することによって、ＤＮＡをさらに断片化した。ＤＮＡｓｅ反応を３７℃で１０分間インキュベートし、０．５ＭＥＤＴＡを２５ｍＭの最終濃度まで添加することで反応を停止させた。１５０ｂｐの平均サイズを有するＤＮＡを、最初に０．９体積のビーズを１体積のＤＮＡに添加することにより「両側」ビーズ選択によって精製した。ビーズは望ましくないより大きい断片に結合するので、それらのビーズを廃棄し、追加の１．６体積のビーズをその上清に添加する。次いで、結合物質を精製し、定量する。ライブラリー構築に使用した、結果として生じた高度に断片化された短いＤＮＡのアガロースゲルを図６に示す。

断片化されたＤＮＡを、ＮＥＢからのＱｕｉｃｋＢｌｕｎｔキットを使用して末端修復し、表７に示す比でブレンドした。次いで、１０ナノグラムのブレンドＤＮＡを、表７に示す配列を有するアダプターにライゲーションした。混合物９および１５については、各々１０ｎｇを用いる２回のライゲーション反応を行い、その後、プールした。混合物１６については、４回の反応を行った。ｑＰＣＲアッセイを使用する各ライブラリーへのゲノムインプットの推定値も表７に示す。

標的化シークエンシング
表７に示した１６のＤＮＡライブラリー各々の１マイクログラムをプールし、１６０μＬの最終体積になるように調整した。８つの同一の２０μＬアリコートを９８℃で変性させ、氷上で冷却し、１ｎＭ／プローブでの２０μＬのプローブ（表６）と５０μＬのＣＦｈｙｂバッファーとを添加した。試料を２４時間、８０℃〜５０℃でアニールし、洗浄し、増幅させた。結果として生じた捕捉され処理された断片の増幅後、１７５〜４００ｂｐのサイズ選択でＰｉｐｐｉｎＰｒｅｐ（商標）装置を使用して最終シークエンシングライブラリーをサイズ選択した。１５０リードＶ３キットを使用してＩｌｌｕｍｉｎａＭｉＳｅｑでライブラリーをシークエンシングした。

結果
位置に基づいて選択した高密度捕捉プローブの標的配列に関する捕捉プローブ性能をモニターした。各捕捉プローブの性能のグラフ表示を図７に示す。これらのデータは、
１）位置拘束によって厳密に選択したすべての捕捉プローブによってオンターゲット配列情報が得られたこと、
２）大部分の捕捉プローブがオフターゲットのマッピング不能なリード捕捉を殆ど示さないこと、および
３）有用なオンターゲットリードの収量が実質的に均一であったこと
を立証する。

大きな割合のオフターゲットでマッピング不能なリードを捕捉した捕捉プローブをさらに解析した。これらの捕捉プローブは、一般に、低い配列複雑度／高い配列冗長性の領域に位置した。しかし、ここで、そのような捕捉プローブは、シークエンシング深度に有意な有害な影響を与えなかった。なぜなら、高レベルのプローブ冗長性（高密度プローブ）は、いくつかのプローブに由来するリードによってすべての領域が包括されることを意味するからである。正味の効果は、カバレッジの優れた均一性であった。例えば、図８、４０ｍｅｒ捕捉プローブを使用するＴＰ５３遺伝子のプローブカバレッジを参照されたい。

結論
総合すると、これらのデータは、（捕捉洗浄温度を調整すると）プローブ性能の識別可能な損失が殆どまたは全くなく捕捉プローブ長を６０ヌクレオチドから４０ヌクレオチドに短縮することができることを立証する。これらのデータは、プローブ設計が位置拘束に従うことができ、一般に配列関係および組成を無視してもよいことも示す。この方法論が、あまりよく機能しないこともあるプローブを生じさせたとしても、近いプローブ間隔での高い冗長性は、個々のプローブの欠損を補って余りある。

（実施例３）
循環ＤＮＡの遺伝子解析
目的
この実施例の目的は、ｃｆＤＮＡおよび標的検索システムの効率的クローニング手順を使用してｃｆＤＮＡの遺伝子解析を評価することであった。

背景
科学および医療団体の「リキッドバイオプシー」−潜在的疾患状態に関連するマーカーについての循環ＤＮＡ（ｃｆＤＮＡ）の解析−に対する意気込みはとてつもなく大きいが、この潜在的分析物についての実際の情報は著しく少ない。

概要
健常ドナーおよび卵巣がんまたは結腸がんのどちらか一方に罹患している個体から採取した血漿試料を使用して、循環ＤＮＡの遺伝子解析を行った。循環ｃｆＤＮＡの量および全般的特徴は、個体によって大きく異なりうる。驚くべきことに、本発明者らは、ｃｆＤＮＡを高度に精製された断片化ゲノムＤＮＡと区別できない効率で容易にクローニングすることができること、断片サイズが（７／８試料で）１７０±１０ｂｐの平均クローンインサートサイズで顕著に一致していたこと、およびそのような試料からのゲノム提示が均一であり、精製ｇＤＮＡを使用して行った実験と同等であったことを見いだした。ユニークリードを計数することによって、各ライブラリーにおける提示の深度により、罹病患者のｃｆＤＮＡ中に存在する腫瘍マーカーについての小さい対立遺伝子頻度の推定値が得られることをさらに確証した。この研究は、本明細書において企図される組成物および標的検索システムがｃｆＤＮＡの定量的遺伝子解析に有効に適用されることを確証した。

方法
ＤＮＡ精製
８セットの血漿試料をＰｒｏｔｅｏｇｅｎｅｘ，Ｉｎｃ．、ＣｕｌｖｅｒＣｉｔｙ、ＣＡから購入した（表８）。ＱｉａｇｅｎからのＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＰｕｒｉｆｉｃａｔｉｏｎキットを使用して循環ＤＮＡを試料から（別々に２回）抽出した。遠心分離を使用して試料をＤＮＡｍｉｎｉカラムに通した。検体ＩＤおよびＤＮＡの収量を表８に示す。

ライブラリー構築
４ｍＬの血漿からの精製ＤＮＡを１００μｌの溶出バッファーに採取した。結腸がん患者（ＣＲＣ）から採取した４つの試料について、ＤＮＡを半分に分け、各患者からの５０μｌアリコート１つを超音波処理して２００ｂｐにした。未処置ｃｆＤＮＡの５０μｌアリコート１つおよび各患者（各患者からの全試料）からの５０μｌ断片化ｃｆＤＮＡ１つを、
・６μｌの１０Ｘｑｕｉｃｋｂｌｕｎｔバッファー（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＮＥＢ））
・０．６μｌの１０ｍＭｄＮＴＰ
・２．４μｌのｑｕｉｃｋｂｌｕｎｔ酵素ミックス
・１．２μｌのＰｒｅＣＲ酵素ミックス
を（試料ごとに）添加することによって末端修復した。
試料を２０℃で３０分間および７０℃で１０分間インキュベートした。
・６０μｌ末端修復ｃｆＤＮＡ
・１２μｌアダプター二本鎖（１０μＭ）
・１０μｌ１０Ｘリガーゼバッファー（ＮＥＢ）
・１５μｌ５０％ＰＥＧ_８０００
・３μｌＨＣＴ４ＤＮＡリガーゼ
を併せることによってアダプター（表２）とのライゲーションを行った。

反応物を２２℃で１時間および６５℃で１０分間インキュベートした。ライゲーション産物を、１００μｌのビーズの添加、洗浄および４０μｌのＴＥｚｅｒｏでの溶出によって精製した。４０μｌのライゲーション産物すべてをプライマーＡＣＡ２（配列番号２８３）でのＰＣＲによって増幅させ、標的化捕捉のために同質量で併せた。

標的化配列捕捉およびシークエンシング
４つの非断片化および４つの断片化結腸血漿試料（図９Ｃ）を、ＴＰ５３、ＡＬＫを特に標的にする本発明者らの高密度、４０ヌクレオチドプローブセットとハイブリダイズした。上の実施例２で説明したように捕捉複合体を処理した。

結果
ライブラリーの外観
５０ｎｇの各ライブラリーを負荷した２％アガロースゲルの着色写真を図９Ａに示す。平均断片サイズは、２６０±２０ｂｐの狭い範囲であった。これらのデータは、ｃｆＤＮＡのクローニング可能画分が主にヌクレオソーム断片として存在することを示した。加えて、ｃｆＤＮＡライブラリーのサイズは、ｃｆＤＮＡライブラリーがアダプター配列の付加によってより高い質量にシフトしたことを除いて、腎臓透析患者のｃｆＤＮＡ（Atamaniukら、Clinical Chemistry ５２巻（３号）：５２３〜２６頁（２００６年））と同じ基本的表面外観を有した（図９Ｂ）。対照的に、ｃｆＤＮＡライブラリーは、広いスメアとして現れる超音波処理したｇＤＮＡライブラリーとは劇的に異なっていた。

ｃｆＤＮＡライブラリーの追加の４セットを、２つの卵巣がん患者血漿試料および健常ボランティアからの２つの血漿試料から構築した。５０μｌの全体積中、３８μｌのｃｆＤＮＡアリコートを末端修復した。ライゲーションは、４０μｌの末端修復断片、１６μｌのアダプター（１０μＭ）、８ｕｌの１０Ｘリガーゼバッファー、１６μｌの５０％ＰＥＧおよび４μｌのＨＣＴ４ＤＮＡリガーゼを８０μｌの全体積で含んだ。ライゲーション反応を２０℃で１時間および６５℃で１０分間インキュベートした。精製のために、２０μｌのＴＥｚｅｒｏおよび１５０μｌのビーズを添加した。精製されたライゲーション産物を４０μｌに再懸濁させ、そのすべてを、ＰＣＲによるその後の２００μｌライブラリー増幅に使用した。得られた増幅ライブラリーを図９Ｃに示す。

シークエンシングデータ解析
８つのライブラリーの各々で観測された平均ユニークリード数は、約７００ユニークリード〜＞３０００ユニークリードの範囲であり、これは、約０．１５％〜約０．０３％の感度の範囲を規定する。図１０。低頻度変異リードは１回より多く観測される可能性が高く、これは、最低感度が上で算出したものより低いことを意味する。好ましい実施形態では、ユニークリードによって統計的に正当な観測頻度の下限が得られる。

ｃｆＤＮＡクローニング効率
試料２３４０７を基準として使用した。１０ｎｇ／ｍＬのｃｆＤＮＡを血漿試料から回収し、２０ｎｇの単離されたｃｆＤＮＡを２つのライブラリー構築の取り組みの各々に使用した。ユニークリード数は、本発明者らが非断片化ＤＮＡ（図１０の「２３４０７」）から平均７００のユニークリード（ゲノム当量）を回収したことを示した。各ゲノムが０．００３ｎｇのｇＤＮＡを含有することを考えると、このライブラリーにおける２．１ｎｇのインプットＤＮＡ（１０％クローニング効率）が回収された。

この試料でのライブラリー構築前の断片化は、ライブラリー収量を２倍より大きく増加させた（図１０の「２３４０７ｆｒａｇ」）。これは、２３４０７試料中に存在するＤＮＡの多くが、クローニング可能であるために断片化を必要とする高分子量ＤＮＡであったことを示す。したがって、ライブラリークローニング効率は、１０％よりはるかに高い可能性が高く、インプットｃｆＤＮＡの２０％の範囲である可能性が高かった。このクローニング効率は、高度に精製されたゲノムＤＮＡと同等であり、ｃｆＤＮＡが、下流のクローニングの取り組みに有害であるいかなる形でも修飾されない可能性が高かったことを示す。

ライブラリーカバレッジ
ｃｆＤＮＡライブラリーは、ランダムな標的領域カバレッジを有する１セットの個別バンドに似ていた。図１１は、配列データのランダム抽出を示す。クローニング前に断片化しなかった（図１０を参照）およびＴＰ５３プローブ「ｃｈｒ１７：７５７９３５１：ｒｅｇｉｏｎ＿３：２８０ｎｔ：４１：８０：ｒ」（配列番号２０１）によって捕捉された試料２３４０７からのリードのランダムセットを、ＢＬＡＴを使用してアラインした。試料を調製した方法を考えると、これらは、一般にｃｆＤＮＡ断片の反映である可能性が高い。なぜなら、これらのリードの左側の部分（リード開始部位）が標的領域全体にわたってランダムに分布しているからである。このランダムな分布は、ゲノムＤＮＡのランダム破壊を示し、ｃｆＤＮＡライブラリーのバンド様外観にもかかわらずシークエンシングアウトプットがランダムな標的領域カバレッジであったことを立証する。このランダムな分布は、本明細書において企図される技術を使用する有効な遺伝子解析に重要である。

図１２は、典型的なｃｆＤＮＡライブラリーについてのＴＰ５３コード領域シークエンシングのより高い分解能の大要を提供する。標的シークエンシングのエレメント−すべての標的領域にわたるカバレッジおよびシークエンシングした各塩基での均一な深度−が一目瞭然である。塩基１つにつき４０００を超えるユニークリードというこの深度で、および正統な候補塩基変化に少なくとも２回遭遇しなければならないという前提条件で、この特定のライブラリーについての変異検出感度は、２０００配列中約１変異、すなわち０．０５％であったと推定することが可能である。この感度レベルは、驚くべき、予想外の、極めて優れた技術成果を意味する。

結論
細胞株から単離された、高度に精製されたｇＤＮＡ（判断基準）と同等の効率で、血漿クローンからｃｆＤＮＡを単離し、クローニングした。ｃｆＤＮＡライブラリーは、循環ヌクレオソームサイズのＤＮＡ断片＋アダプターに似ており、末端は、効率的遺伝子解析を可能にする十分にランダムな特徴を有した。加えて、血漿ｃｆＤＮＡライブラリーに特有の高度に均一なサイズは、プローブ末端から１２０ｂｐ（＝１６０−４０）ほども遠い標的の信頼性のあるカバレッジを最大にするための捕捉戦略および基礎をなすプローブ配列の設計を可能にする。

（実施例４）
循環ＤＮＡライブラリーにおけるゲノム当量の測定
目的および背景
循環、無細胞ＤＮＡの解析における大きな課題の１つは、十分なアッセイ感度の達成である。十分な感度が達成されない場合には、ｃｆＤＮＡライブラリーの解析が交絡する。試料がシークエンシングされ、変異事象が検出されない場合、その結果は、変異が存在しないこと、または試料抽出深度が小さすぎるため有意な事象が見逃されたことを意味すると解釈されることがある。アッセイの感度は、統計用語で偽陰性率として定義される。循環、無細胞ＤＮＡのシークエンシングに関連して、有意な障害は、大過剰の参照配列に混ざっている低頻度配列の検出である。

アッセイ感度を判定する１つの方法は、変異配列を非変異参照配列へと徐々に希釈する１セットの試料における変異配列の出現率の測定である。変異配列がもはや検出されない希釈度によってアッセイ感度が規定される。この方法は、変異配列の正体と希釈度の両方が既知である場合に適している。残念なことに、臨床試料は、一般に、どちらのパラメータも提供しない。多くの場合、変異配列の正体は未知であり、希釈度は、試料によって異なる。この関連で、アッセイ感度は、試料ごとに確立される。

試料ごとに感度値を割り当てるために、シークエンシングライブラリー中に存在するゲノム当量の数を測定することによって各試料中に存在する異なる別個の配列の数を測定する。非限定的な例として、ＤＮＡシークエンシングライブラリーが、３ｎｇ（３０００ｐｇ）のヒトゲノムＤＮＡを含有することが分かっており、各ヒトゲノムが３ｐｇの質量を有する場合には、そのライブラリーは、ＤＮＡの３０００÷３＝１０００ゲノム当量を有する。統計的に有意であるために変異体ＤＮＡ配列を２回検出しなければならない場合には、この特定のライブラリーの可能な最高検出感度は、２変異配列÷１０００全配列＝０．００２＝０．２％である。感度を確立するために、ゲノム当量の数を各試料ライブラリーについて測定しなければならない。

概要
２つの方法を使用してゲノム当量を測定した。第１の方法は、定量的ＰＣＲ（ｑＰＣＲ）に基づく。ゲノム断片へのアダプターのライゲーションと、１つが共通ゲノム配列（例えばＡｌｕＩ反復配列）に特異的であり、１つがアダプターに特異的である、１対のＰＣＲプライマーとを使用して、ゲノムライブラリーを構築した。これらのｃｆＤＮＡライブラリーのライゲーションされたアダプター：断片配列の存在量を測定した。既知濃度の標準ライブラリーを使用して標準曲線を構築し、得られた標準曲線に測定値をフィッティングし、そのフィットからゲノム当量の値を導出した。

ゲノム当量を測定するための第２の方法は、シークエンシングを行った後にバイオインフォマティクス計数を使用した。ライブラリー内の各ユニーク配列を、そのランダム配列標識およびゲノム配列の出発分子によって同定した。さらに、各ユニーク配列は、独立したゲノムに由来しなければならない。したがって、配列データ中に存在するユニーク配列の合計によって、試料中に存在するゲノム当量の数の正確な定量的測定が確立された。

方法および結果
ｑＰＣＲアッセイ開発
ｑＰＣＲベースのゲノム当量アッセイの第１のバージョンは、ＡＣＡ２プライマー（表１０）を使用したが、このアッセイは、ｃｆＤＮＡライブラリー中に存在するゲノム当量の数を慢性的に過小報告する（図１３）。

アッセイの改良バージョンは、ヒトゲノム全体にわたって非常に高頻度で見いだされる内在性反復配列（例えば、Ａｌｕ反復配列）に基づいた。Ａｌｕ特異的プライマーをアダプター特異的プライマーと対にすることによって、アダプターがゲノム断片に連結される頻度を確実に測定した。既知のゲノム当量のライブラリーを使用して標準曲線を作成し、クローニングしたライブラリー中のゲノム当量の数をその曲線へのフィッティングによって測定した。

Ａｌｕ＋アダプターベースのｑＰＣＲアッセイを開発するために使用したＰＣＲプライマーを表１０に示す。Ａｌｕ増幅のためのＰＣＲプライマーは、プライマー３（Ａｌｕ＿Ｆ１およびＡｌｕ＿Ｒ１、それぞれ配列番号２８５および２８６）を使用してコンセンサスヒトＡｌｕ配列（BatzerおよびDeininger、Nat Rev Genet.、３巻（５号）３７０〜９頁（２００２年））から設計した。残りの２つのＡｌｕプライマー（Ａｌｕ＿Ｆ２およびＡｌｕ＿Ｒ２、それぞれ配列番号２８７および２８８）は、文献（Marulloら、Genome Biology １１巻：Ｒ９（２０１０年））に報告されている。

アッセイ設計の概略図を図１４に示す。単一ＰＣＲプライマーを使用してゲノムＤＮＡライブラリーを増幅させることができる（図１４Ａ）ため、アダプター配列を認識するがゲノムクローンを増幅できないプライマーを使用した。５８ヌクレオチドＡＣＡ２−ＦＬＦＰプライマー（これ以降ＡＦと略記する、配列番号２８４）は、その長さが強いステム−ループＰＣＲ抑制を誘導する（図１４Ｂ）ので、これらの基準を満たす。加えて、機能性Ａｌｕプライマー対を使用した（図１４Ｃ）。さらに、ゲノムＤＮＡを増幅させない、１つのＡｌｕプライマーとロングＡＣＡ２プライマーとからなるプライマー対を使用した（図１４Ｄ）。これらの同じプライマーは、ゲノムライブラリークローンも増幅させた（図１４Ｅ）。

機能性Ａｌｕベースのアッセイの必要エレメントのすべてを検証した。図１５。具体的には、単独でのロングプライマーは不活性であり、Ａｌｕプライマー対の両方のセットがヒトゲノムＤＮＡを認識し、１つのＡｌｕプライマーとロングＡＣＡ２プライマーの任意の組合せがゲノムライブラリークローンを増幅させた（図１５Ａ）。最後に、ゲノムＤＮＡとゲノムライブラリークローンとを区別するＡｌｕプライマー＋ロングＡＣＡ２プライマー対の能力を図１５Ｂに示す。Ａｌｕ＿Ｒ１プライマーとＡＦプライマーの組合せを、新たに構築したライブラリー中のゲノム当量の測定に使用した。

ＡＣＡ２ベースのｑＰＣＲアッセイとＡｌｕベースのｑＰＣＲアッセイとの直接比較を図１６に示す。ゲノム当量の８倍差が見いだされた。加えて、Ａｌｕベースのアッセイは、ライブラリー間のより一貫した性能およびｑＰＣＲ導出当量とシークエンシングランでバイオインフォマティクスによって計数されたタグ当量とのより良好なアラインメントをもたらした（表１１）。

ゲノム当量の配列ベースの計数のための高感度ライブラリーアダプター
上で論じたように、変異配列が、他の大過剰の「正常」（生殖系列を意味する）ＤＮＡ配列中の低頻度成分でありうるというのが、ｃｆＤＮＡを使用する疾患監視の現実である。したがって、高感度で定量可能なシークエンシングアッセイが必要とされている。シークエンシングライブラリー中に存在するユニーク配列の数を計数することによってアッセイ感度を生じさせることができた。しかし、そのような計数は、感度の偽の過小推定につながることになる。なぜなら、ｃｆＤＮＡ断片はかなり短く（約１６５ｂｐ）、実際には独立したクローニング事象に由来した同一のリードをもたらすことがあるからである。この問題の１つの解決策は、例えば、ライブラリーを構築するために使用するアダプターに１セットのＤＮＡタグを含めることによって、ライブラリー構築中に独立したシークエンシングクローン各々にマークを付けることである。

そのようなライブラリー構築アダプターセットを、具体的には、ｃｆＤＮＡライブラリー中に存在するゲノム当量の数、およびその延長で、変異配列をモニターするために使用されるシークエンシングアッセイの感度を測定するように設計した。

ｃｆＤＮＡライブラリー中の多数のゲノム当量に対応するように構成した高感度ライブラリーアダプターの構造を図１７に示す。末端修復ｃｆＤＮＡ断片に結合される鎖である４５ヌクレオチドライゲーション鎖内に工学的に作製された相当量の分子がある。アダプターは、少なくとも５つのエレメントを含む。

エレメント１は、単一プライマーライブラリー増幅プライマーＡＣＡ２のためのＰＣＲプライマー結合部位である（表１２）。

エレメント２は、５ヌクレオチドリードコードである。このコードとゲノムＤＮＡ配列の組合せは、各リードを一意的に同定するために使用したＤＮＡタグを構成する。５ヌクレオチドコードは、このセットの他のすべてのコードと２塩基変化異なるように選択した、可能性のある２５６のユニーク配列からなる。この特徴によって、ユニークな別個のリードと、コード領域内のシークエンシングエラーのためユニークであるように見えるリードとを区別することが可能になった。Ｇ残基が過剰提示される７つのコードであって、アダプター機能に干渉することが実験的に証明されたコードを除去することによって、２４９のランダムコードが残った。表１３。

エレメント３は、少なくとも２塩基変化異なる３ヌクレオチド試料コードである。このエレメントは、異なる試料を同定するために使用し、シークエンシングラン中の試料多重化を可能にした。表１４。

エレメント４は、ライブラリー構築および下流のシークエンシングに関する３つの重要な特性を有する１２ヌクレオチドアンカー配列である。表１５。これらの特性は次の通りである：Ａ）１２塩基伸長の各々が、伸長内の各部位の可能性のある４つのＤＮＡ塩基の各々を集合的に表す４つの１２塩基伸長のファミリーの一部である。この特徴、バランスのとれた塩基提示、は、シークエンシングリード中の適正な塩基コーリングを校正するためにＩｌｌｕｍｉｎａシークエンシング装置によって必要とされる。Ｂ）各伸長が、可能性のある４塩基のうちの２つだけからなり、これらが、６つのＡ＋６つのＣまたは６つのＧ＋６つのＴのどちらか一方であるように特異的に選択される。２つだけの塩基から形成されるこの伸長は、適正なアダプター機能を不可能にすることになる二次構造形成に伸長配列が関与する可能性を大幅に低下させる。Ｃ）各伸長が同数のＡ＋ＣまたはＧ＋Ｔからなるので、各伸長は、４つ１セットの他のすべての伸長と大体同じ融解温度および二本鎖安定性を共有する。

エレメント５は、エレメント４の３’末端で見いだされる２塩基配列である。特定の２塩基伸長を、これら２塩基配列がライゲーションのための効率的基質であることを示す実験データに基づいて選択した。表１５。
４．

アダプターモジュールをパートナーオリゴヌクレオチドにハイブリダイズさせる。表１６。エレメント４内の配列とパートナーオリゴヌクレオチドとのハイブリダイゼーションを行う。二本鎖アダプターを末端修復ｃｆＤＮＡにライゲーションした。

独立して合成してプールしたライゲーション鎖２５６本（これらの各々が共通の試料コードを共有し、したがって、単一の試料アダプターセットを構成する）のセットを、ライゲーションに好適な二本鎖に変換するために、４５ヌクレオチドライゲーション鎖を適切な相補１２ヌクレオチドパートナー鎖と併せ、９５℃に加熱し、５分間、６５℃に冷却し、次いで、室温に冷却した。この二本鎖は、図１７Ｂに示すように平滑末端ライゲーション基質を形成した。ライゲーションおよびＤＮＡ精製後、ＰＣＲ増幅前に行うＤＮＡポリメラーゼ媒介ステップによってパートナー鎖を置換し、ライゲーション鎖をコピーして、単一プライマーＰＣＲによる指数関数的増幅に好適である二本鎖アダプターを形成した。

次いで、標的化シークエンシングデータから導出したゲノム当量の定量的解析を行った。各ユニークリードをユニークライゲーション事象と考え、ユニークリードの合計を、解析されるゲノム当量の数と等しいと考えた。

おおまかな、「たやすく計算できる」、「おおざっぱな」算定を行って、解析することができるゲノム当量の数を決定した。各ｃｆＤＮＡクローンは、おおよそ１５０塩基対であり、そのうちの５０塩基対が捕捉プローブとの結合に必要であった。これによって、任意の捕捉されたｃｆＤＮＡクローン中に可能性のあるおおよそ１００の配列開始部位が残った。その可能性のある１００の開始部位の各々に２４９のランダムコードを結合させることで、可能性のある約２４９，０００のユニーククローンの全レパートリーを生成した。ユニーククローン数が可能性のある配列の組合せの総数に近づくと、確率により、同じコードおよび開始部位の組合せが独立事象によって生じることになり、これらの独立事象が単一ファミリー内で不適切にグループ化されることになることが決定される。最終結果は、解析されるゲノム当量の過小推定となり、低頻度の変異リードは、同じ識別子を有する野生型リードと重複するので、シークエンシングエラーとして処分されることがある。これを回避するために、ｑＰＣＲアッセイを使用してゲノムインプットを可能性のあるユニーククローンの数の１０分の１またはそれ未満に制約する取り組みを行った。例えば、単一アダプターは、可能性のある２４，９００のクローンを有し、したがって、２５００またはそれ未満のゲノム当量からなるライブラリーの正確な解析をもたらす信頼性のある能力を有する。

概要を述べる手順は、一例として提供するものであり、本明細書において企図される方法をこの実施例によって限定することを意図しない。場合によっては、解析されるゲノム当量の数は、前の段落で説明した限度２５００を十分に超えることもある。ゲノム当量の深度を拡大するために、この問題の２つの解決策を容易に得ることができる。第１の解決策は、試料１つにつき１つより多くのアダプターセットを使用することである。アダプターを組み合わせることにより、可能性のあるクローンの総数を拡大することが可能であり、したがって、ゲノムインプットの満足のいく限度を拡大することが可能である。非限定的な例として、１つの試料に使用する４つのアダプターセットの組合せは、解析を可能性のある配列２４，９００ｘ４＝９９，６００に、および合理的に解析されるゲノム当量約１０，０００に拡大することになる。第２の解決策は、図１７Ａのエレメント２のコードを６、７またはそれ超の塩基に拡大することである。他のすべてのコードと少なくとも２塩基異なる、可能性のあるコードの数は、４^{（ｎ−１）}となり、式中、ｎは、エレメント２内の塩基の数である。したがって、ここで提示する非限定的な例では、ｎ＝５および４^{（５−１）}＝２５６。したがって、追加の塩基を含めることで利用可能なレパートリーは追加の塩基ごとに４倍拡大される。

結論
この実施例からの結果は、ゲノム当量の決定のための２つの独立した方法が試料を処理する作業の流れに役立つことを示した。第１の方法、ｑＰＣＲは、ｃｆＤＮＡ解析のライブラリー構築段階中に実施し、妥当な数のゲノム当量をライブラリー増幅、標的化配列捕捉およびＤＮＡシークエンシングによって確実に動かす品質管理ステップとして使用した。他の方法は、情報科学の考慮事項に該当するゲノム当量の実際の数のより直接的な尺度として、ユニークリードの明確な計数を使用する。

（実施例５）
定量的遺伝子解析
目的
この実施例の目的は、定量的遺伝子解析を、正常なＤＮＡが混合されているがんゲノムにおよびがん患者の血漿から単離した特徴付けされていないｃｆＤＮＡに適用することであった。

背景
３タイプのゲノム事象がヒトがんではよく見られる。これらは、罹患遺伝子およびその発現タンパク質産物の機能を変化させる体細胞変異；新規生物学的特性を有するキメラ遺伝子融合体およびしたがって発現融合タンパク質を生じさせるゲノム再編成；ならびに遺伝子減少および遺伝子産物の過小発現、または逆に遺伝子の増幅および対応する遺伝子産物の過剰提示につながる遺伝子コピー数の変化である。がん患者の循環ＤＮＡの場合、これらの異常な座位は、その多くが患者のケアを導出する上で非常に重要な意義を有し、患者の正常な生殖系列ＤＮＡと混合されている（混ざっている）。

概要
前の実施例では、がん監視を目的として、循環、無細胞ＤＮＡ（ｃｆＤＮＡ）の解析のために構成した技術を説明した。しかし、この技術は、これらに限定されないが遺伝疾患、胎児試験、メンデル型遺伝病、病原体スクリーニングおよび臓器移植のモニタリングを含む、循環ＤＮＡが可能性のある分析物であるあらゆる解析、診断およびモニタリングパラダイムに広く適用可能である。この実施例では、前の実施例で強調した技術的特徴を混合がん試料の解析に適用する。この検証の第１段階では、がん由来の細胞株を正常ヒトＤＮＡと規定の希釈度で混合し、定量的遺伝子解析を行った。この研究の第２段階では、特徴付けされていないｃｆＤＮＡをがん患者の血漿から単離し、その後、定量的遺伝子解析を使用して調査した。

方法
細胞株ゲノムＤＮＡと正常ヒトＤＮＡの混合
以下のＤＮＡ試料を使用した：
・ＮＡ０６９９４ − 正常ヒトゲノムＤＮＡ（Ｃｏｒｉｅｌｌレポジトリ）、
・ＮＣＩ−Ｈ２２２８ − 非法細胞肺がん細胞株（ＡＴＣＣ）、ＴＰ５３の変異（Ｑ３３１^＊）およびＥＭＬ４−ＡＬＫ遺伝子融合（切断点不明）を有する、ならびに
・ＮＣＩ−Ｈ６９ − 小細胞肺がん細胞株（ＡＴＣＣ）、ＭＹＣＮ遺伝子の増幅（約１００コピー）を有する。

ライブラリー調製：細胞株（上記３つすべて）から単離したゲノムＤＮＡは、ｃｆＤＮＡの小さいサイズとは異なる高分子量物質である。これらの検証実験では、ｃｆＤＮＡを模倣するために、ＣｏｖａｒｉｓＡｃｏｕｓｔｉｃＳｏｎｉｃａｔｏｒを使用して「１５０ｂｐ」設定でゲノムＤＮＡをまず断片化した。この超音波処理は、一般に、広いスメアを生じさせ、「両側」ビーズ選択を使用してそのＤＮＡをさらに処理した。ＤＮＡ精製ビーズの希薄溶液を試料に添加し、ビーズに付着する、より高分子質量の断片を廃棄した（精製ＤＮＡのサイズは、添加したビーズの量に比例する）。ビーズの追加のアリコートを残存上清に添加し、この第２ラウンドでは、ビーズに付着しているＤＮＡに添加し、（より高い全濃度の結合バッファー中で）精製する。この「両側」精製は、ｃｆＤＮＡの合理的代用物である狭いサイズ分布を生じさせる（図１８）。

断片化されたゲノムＤＮＡを末端修復し、定量し、表１７に示した様々な比で混合し、下の結果の節で説明する。

ｃｆＤＮＡライブラリーは、限られたＤＮＡインプットを有しうる。患者血漿１ｍＬ当りの得られるｃｆＤＮＡの量は広範に変動しうるが、下限（例えば、実施例３）は一般に約１０ｎｇ／ｍＬであり、これは３３００ヒトゲノムと等価である。限られたｃｆＤＮＡ量に備えるために、混合実験は、患者から日常的に採取されるｃｆＤＮＡの下限を反映するようにモデル化した。この制約を、最も極端な混合を除いてすべてに適用した。これらの後者の混合では、ライブラリーを、４ｍＬ（ＮＡ０６９９４：Ｈ２２２８１０００：１）または８ｍＬ（ＮＡ０６９９４：Ｈ６９５００：１）の低収量患者ｃｆＤＮＡからのインプットを模倣するように作製した。混合した試料を、次いで、実施例４に記載のアダプターセットにライゲーションした。ｑＰＣＲを使用する各精製ライブラリー中のゲノム当量の測定値（実施例４）も表１７に示す。ライブラリーを増幅させ、定量し、各ライブラリーの等価質量（各々の５００ｎｇ）をプールした。プールした試料を、実施例２の表６に収載した概念実証、高密度４０ｍｅｒ捕捉プローブとハイブリダイズした。得られた複合体を、前の実施例に記載したように、ストレプトアビジン被覆ビーズ上に捕捉し、洗浄し、処理し、増幅させ、精製し、サイズ選択した。得られたライブラリーを、ＩｌｌｕｍｉｎａＭｉＳｅｑ装置でＩｌｌｕｍｉｎａ１５０ｂｐ−Ｖ３Ｍｉｓｅｑシークエンシングキットを使用して解析した。

バイオインフォマティクス解析のために、低頻度体細胞バリアントコーラーを使用して変異を検出し、スプリットリードアライナを使用して融合遺伝子を検出し、タグを定量して統計的にフィッティングする自社解析を使用してコピー数変動（ＣＮＶ）をコールした。

ＴＰ５３遺伝子の混合点変異の検出を図１９に示す。ＴＰ５３がＮＣＩ−Ｈ２２２８細胞株ではヘミ接合性であることは公知であるので、「期待」頻度は混合比から外れる。自動ソフトウェアは、５０：１混合の変異体対立遺伝子をコールすることができた。１０００：１での変異事象をコールするにはマニュアルキュレーションが必要であった。特異性に関しては、実施例１に記載のタグフィルタリングを解析に適用し、このタグフィルターを適用後はＴＰ５３において他の変異コールは検出されなかった。

細胞株ＮＣＩ−Ｈ２２２８がＥＭＬ４とＡＬＫとの融合遺伝子を有することは公知であり、この細胞株は、蛍光インサイツハイブリダイゼーションにおいても、ＲＴ−ＰＣＲを使用する融合遺伝子転写物の検出においても陽性対照として役立つ。遺伝子融合ジャンクションの正確な位置についての報告は発表されていない。ＡＬＫの第１９イントロン領域の高密度プローブカバレッジを使用して、配列解析は、２つの遺伝子が融合したときに形成されるジャンクションの正確な位置および配列を明らかにした（図２０）。ＮＣＩ−Ｈ２２２８細胞株における正常リードのジャンクションリードに対する頻度（それぞれ、３７８対２４９）は、融合遺伝子がＡＬＫの正常コピーとヘテロ接合体であることを示唆する。

混合の関数としてのジャンクションリードの検出を図２１に示す。点変異検出と同様に、変異体対立遺伝子が二倍体ゲノム１つにつき１コピーで見いだされることを反映するように期待値を調整した。１０００：１の混合試料では融合リードは検出されなかった。

図２２は、ＭＹＣＮ遺伝子についてのＣＮＶ決定の結果を混合の関数として示す。ＮＣＩ−Ｈ６９細胞株は、高度に増幅されたＭＹＣＮ遺伝子を有する。ＭＹＣＮは、通常、単一コピー遺伝子として二倍体ゲノム１つにつき２つ見いだされるため、徐々に希釈した混合物について期待された結果は、タグ算出ＣＮＶが漸近的に２コピーに近づくべきであるというものである（漸近線を図中で強調する）。ここに示す検証実験は、本発明で説明されるアッセイシステムが高度に増幅された遺伝子に対する感度が頑強であることを示した。

がん患者からのｃｆＤＮＡにおけるバリアントの発見
本明細書において企図される技術の最も厳密な検証は、変異スペクトラムが不明であるｃｆＤＮＡ試料への該技術の適用である。解析は、２名の卵巣がん患者からのマッチしたｃｆＤＮＡ、腫瘍および正常隣接組織（ＮＡＴ）試料をシークエンシングすることによって行った。加えて、結腸直腸がん（ＣＲＣ）患者からの２つのｃｆＤＮＡ試料および健常ボランティアからの２つのｃｆＤＮＡ試料を解析した。どの場合も、変異、融合および異常ＣＮＶは、健常ボランティア試料では検出されなかった。

最初に、４名のがん患者からのｃｆＤＮＡのライブラリーを、実施例２の表６に記載した標的化プローブを使用してスクリーニングした。これらのプローブは、主として、ＴＰ５３遺伝子における点変異、ＡＬＫとの遺伝子融合、およびＭＹＣＮの増幅を検出するように構成した。この初期シークエンシングスクリーンの結果を図２３に示す。同じ塩基位置で発生する点変異が１名の卵巣患者のｃｆＤＮＡ、腫瘍およびＮＡＴにおいて見いだされた。卵巣がん患者のマッチした試料の他のセットではＴＰ５３変異は見いだされなかった。マッチする組織を入手できない２つのＣＲＣｃｆＤＮＡライブラリーでも点変異が検出された。これらの点変異のすべてが腫瘍において以前に同定されており、すべては、腫瘍発生の原因駆動因子であることが公知である。０．９％のｃｆＤＮＡライブラリーＣＲＣ４０６における変異配列検出は、十分にアッセイ感度の範囲内であった。感度は、すべてが変異配列を有する、タグ付きリードの複数のファミリーの存在によって定義される。これらのデータは、本明細書において企図されるシステムの臨床上の有用性を強調する。

ｃｆＤＮＡライブラリーおよび関連組織におけるがん関連変化の検出をさらに探求するために、同じライブラリーを、合計２０の異なるがん関連遺伝子に指向されているプローブ６７９個のセット（表１８）にハイブリダイズさせた。このプローブセットでは１４遺伝子のコード領域のすべてを標的にしたが、残りの６遺伝子では選択座位を標的にした。

図２４に示したように、ＴＰ５３の検出可能な変化が一切なかったＯＶＡ１試料は、ＫＲＡＳの変異を有し、この変異は、ｃｆＤＮＡにおいても対応する腫瘍においても見いだされた。この観測は、ここに記載するアッセイシステムの有意な特徴を強調する。ｃｆＤＮＡから生成したライブラリーを（この実施例でのように）何百もの、およびさらには何千もの標的化プローブで調べることができる。得られた標的化ライブラリーのシークエンシングは、腫瘍内に存在し、罹患個体の生殖系列の中には存在しない体細胞変異を明らかにした。これらの腫瘍関連体細胞マーカーは、（生殖系列配列を有するｃｆＤＮＡに対して）腫瘍から排出される循環ＤＮＡの量を定量するためにも使用することができる。したがって、変異の発見によって、それらの生物学的意義に関係なく、混合ｃｆＤＮＡ中の腫瘍含有量も推定される。

多くの標的療法は、正常遺伝子の存在下で最も大きな成功を収めている（例えば、ＥＧＦＲ阻害剤は、野生型ＫＲＡＳの存在下でのみ機能する）。循環腫瘍ＤＮＡレベルの定量的評定は、遺伝子の変異が見いだされないこれらの場合に特に有意になる。言い換えると、特定の標的遺伝子での野生型シークエンシング結果と相まって循環腫瘍ＤＮＡの実証可能な存在は、標的遺伝子が腫瘍内では正常であることを示唆しており、そのような結果は、療法の選択の誘導に有意な影響をもたらすことができる。前述のことは、図２４で強調されているＯＶＡ１試料にも当てはまる。ｃｆＤＮＡライブラリー中のＫＲＡＳ変異の存在は、この患者の腫瘍が野生型ＴＰ５３遺伝子を有することを示唆した。

異常な遺伝子発見のもう１つの例を図２５に示す。標的化定量的遺伝子解析システムは、ＨＥＲ−２／ｎｅｕと言い換えられる、ＥＲＢＢ２遺伝子における有意な増幅の存在を明らかにした。このタイプの増幅は、乳がんに関して多く公表されているが、結腸直腸癌でも同定されることがある。

結論
細胞株ＤＮＡでの検証実験は、がんにおける新生物成長の駆動の中核をなす３タイプの遺伝的変動の検出の閾値を明らかにした。がん患者に由来するｃｆＤＮＡの特徴付けは、解析した４つすべての試料での再構成実験によって設定した閾値より十分上である腫瘍関連遺伝子変化を明らかにした。これらのデータは、本明細書において企図される定量的解析には、特に、リキッドバイオプシーが最も適切である状況で、臨床的有用性がありうることを示した。

一般に、下記の特許請求の範囲において使用する用語は、本明細書および本特許請求の範囲において開示する特定の実施形態に本特許請求の範囲を限定すると解釈すべきでなく、そのような特許請求の範囲が権利を与えている均等物の全範囲とともにすべての可能な実施形態を含むと解釈すべきである。したがって、本特許請求の範囲は、本開示によって限定されない。

Claims

無細胞ＤＮＡ（ｃｆＤＮＡ）の遺伝子解析のための方法であって、
（ａ）ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、
（ｂ）前記末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、
（ｃ）前記ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡライブラリークローンを生成するステップ、
（ｄ）ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、および
（ｅ）前記ｃｆＤＮＡライブラリークローン中の１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップ
を含む方法。
対象の生体試料からｃｆＤＮＡを単離するステップをさらに含む、請求項１に記載の方法。
前記ｃｆＤＮＡが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される、請求項１または請求項２に記載の方法。
前記１つまたは複数のアダプターが、複数のアダプター種を含む、請求項１〜３のいずれか一項に記載の方法。
前記１つまたは複数のアダプター各々が、前記ｃｆＤＮＡライブラリーの増幅のためのプライマー結合部位を含む、請求項１〜４のいずれか一項に記載の方法。
前記１つまたは複数のアダプター各々が、１つまたは複数のユニークリードコードを含む、請求項１〜５のいずれか一項に記載の方法。
前記１つまたは複数のアダプター各々が、試料多重化のための１つまたは複数の試料コードを含む、請求項１〜６のいずれか一項に記載の方法。
前記１つまたは複数のアダプター各々が、ＤＮＡシークエンシングのための１つまたは複数の配列を含む、請求項１〜６のいずれか一項に記載の方法。
ｑＰＣＲを前記ｃｆＤＮＡクローンライブラリーに対して行い、ｑＰＣＲ測定値を既知ゲノム当量の標準と比較して前記ｃｆＤＮＡクローンライブラリーのゲノム当量を決定する、請求項１〜８のいずれか一項に記載の方法。
Ａｌｕ配列と結合するプライマーおよびアダプター中の配列と結合するプライマーを用いて前記ｑＰＣＲを行う、請求項９に記載の方法。
前記定量的遺伝子解析を、前記ｃｆＤＮＡライブラリークローン中の複数の遺伝子座位に対して行う、請求項１〜１０のいずれか一項に記載の方法。
前記定量的遺伝子解析を、複数のｃｆＤＮＡクローンライブラリー中の複数の遺伝子座位に対して行う、請求項１〜１１のいずれか一項に記載の方法。
前記定量的遺伝子解析が、１つまたは複数の捕捉プローブを標的遺伝子座位にハイブリダイズさせて、捕捉プローブ−ｃｆＤＮＡクローン複合体を形成することを含む、請求項１〜１２のいずれか一項に記載の方法。
前記定量的遺伝子解析が、前記捕捉プローブ−ｃｆＤＮＡクローン複合体を単離することを含む、請求項１３に記載の方法。
前記定量的遺伝子解析が、前記単離されたハイブリダイズした捕捉プローブ−ｃｆＤＮＡクローン複合体中の前記ｃｆＤＮＡクローン配列の増幅を含む、請求項１４に記載の方法。
前記定量的遺伝子解析が、複数のシークエンシングリードを生成するためのＤＮＡシークエンシングを含む、請求項１〜１５のいずれか一項に記載の方法。
前記複数のシークエンシングリードのバイオインフォマティック解析をさらに含む、請求項１６に記載の方法。
バイオインフォマティクス解析が、
（ａ）前記ｃｆＤＮＡクローンライブラリー中の解析されるゲノム当量の数を定量するため、
（ｂ）標的遺伝子座位における遺伝子バリアントを検出するため、
（ｃ）標的遺伝子座位内の変異を検出するため、
（ｄ）標的遺伝子座位内の遺伝子融合を検出するため、および
（ｅ）標的遺伝子座位内のコピー数増減を測定するために
使用される、請求項１〜１７のいずれか一項に記載の方法。
前記対象が、遺伝疾患を有さない、請求項２〜１８のいずれか一項に記載の方法。
前記対象が、遺伝疾患と診断されていない、請求項２〜１８のいずれか一項に記載の方法。
前記対象が、遺伝疾患と診断されている、請求項２〜１８のいずれか一項に記載の方法。
前記定量的遺伝子解析が、前記遺伝疾患を引き起こすまたは前記遺伝疾患に関連する１つまたは複数の遺伝子病変を同定または検出するために使用される、請求項２１に記載の方法。
前記遺伝子病変が、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む、請求項２２に記載の方法。
前記遺伝子病変が、ＡＬＫ遺伝子の３’コード領域を別の遺伝子に融合させるゲノム再編成を含む、請求項２２に記載の方法。
前記ＡＬＫ遺伝子の３’コード領域が、ＥＭＬ４遺伝子に融合される、請求項２４に記載の方法。
前記遺伝疾患ががんである、請求項２２〜２５のいずれか一項に記載の方法。
前記対象が妊娠している、請求項２〜１８のいずれか一項に記載の方法。
前記定量的遺伝子解析が、胎児ｃｆＤＮＡ中の１つまたは複数の標的遺伝子座位の１つまたは複数の遺伝子バリアントまたは遺伝子病変を同定または検出するために使用される、請求項２７に記載の方法。
前記対象が、移植レシピエントである、請求項２〜１８のいずれか一項に記載の方法。
前記定量的遺伝子解析が、前記対象におけるドナーｃｆＤＮＡを同定または検出するために使用される、請求項２７に記載の方法。
対象における遺伝疾患を予測、診断またはモニターする方法であって、
（ａ）対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、
（ｂ）前記ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、
（ｃ）前記末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、
（ｄ）前記ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、
（ｅ）前記ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、および
（ｆ）前記ｃｆＤＮＡクローンライブラリー中の前記遺伝疾患に関連する１つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップ
を含み、前記１つまたは複数の標的遺伝子座位における１つまたは複数の遺伝子病変の同定または検出が、前記遺伝疾患の予後を予測し、それを診断し、またはその進行をモニターする、方法。
前記ｃｆＤＮＡが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される、請求項２９に記載の方法。
前記遺伝子病変が、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む、請求項２９に記載の方法。
前記遺伝子病変が、ＡＬＫ遺伝子の３’コード領域を別の遺伝子に融合させるゲノム再編成を含む、請求項３１に記載の方法。
前記ＡＬＫ遺伝子の３’コード領域が、ＥＭＬ４遺伝子に融合される、請求項３２に記載の方法。
前記遺伝疾患ががんである、請求項２９〜３２のいずれか一項に記載の方法。
遺伝疾患のコンパニオン診断であって、
（ａ）対象の生体試料からｃｆＤＮＡを単離するまたは得るステップ、
（ｂ）前記ｃｆＤＮＡを１つまたは複数の末端修復酵素で処置して末端修復ｃｆＤＮＡを生成するステップ、
（ｃ）前記末端修復ｃｆＤＮＡの各末端に１つまたは複数のアダプターをライゲーションしてｃｆＤＮＡライブラリーを生成するステップ、
（ｄ）前記ｃｆＤＮＡライブラリーを増幅させてｃｆＤＮＡクローンライブラリーを生成するステップ、
（ｅ）前記ｃｆＤＮＡクローンライブラリー中のゲノム当量の数を決定するステップ、および
（ｆ）前記ｃｆＤＮＡクローンライブラリー中の前記遺伝疾患に関連する１つまたは複数のバイオマーカーの定量的遺伝子解析を行うステップ
を含み、前記１つまたは複数のバイオマーカーの少なくとも１つの検出、または検出できないことが、前記対象を前記遺伝疾患について処置すべきかどうかを示す、コンパニオン診断。
前記ｃｆＤＮＡが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される、請求項３５に記載の方法。
前記バイオマーカーが、遺伝子病変である、請求項３５に記載の方法。
前記遺伝子病変が、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む、請求項３７に記載の方法。
前記遺伝子病変が、ＡＬＫ遺伝子の３’コード領域を別の遺伝子に融合させるゲノム再編成を含む、請求項３７に記載の方法。
前記ＡＬＫ遺伝子の３’コード領域が、ＥＭＬ４遺伝子に融合される、請求項３９に記載の方法。
前記遺伝疾患ががんである、請求項３５〜４０のいずれか一項に記載の方法。