JP2014502155A

JP2014502155A - 癌関連の遺伝子または分子異常の検出

Info

Publication number: JP2014502155A
Application number: JP2013541152A
Authority: JP
Inventors: ミンデニスローユク; クワンチーチャン; クンロッサチューワイ; ペイヨンチャン
Original assignee: Chinese University of Hong Kong CUHK
Current assignee: Chinese University of Hong Kong CUHK
Priority date: 2010-11-30
Filing date: 2011-11-30
Publication date: 2014-01-30
Anticipated expiration: 2031-11-30
Also published as: AU2011335891A1; CN103403182B; TW201307570A; JP2018019696A; DK3243910T3; CA2817370C; MY169852A; TWI642786B; US20170220736A1; EA038374B1; BR112013013421A2; HK1217553A1; DK2646579T3; EP3243910B1; NZ611599A; CN108899091B; KR20200133825A; JP2022000021A; CN105243295B; EA201300649A1

Abstract

生物由来の生体試料中の遺伝子または分子異常を決定するシステム、装置、および方法を提供する。細胞を含まないＤＮＡ断片を含む生体試料を分析して、例えば、腫瘍中の欠失および／または増幅による染色体領域の不平衡を同定する。複数の遺伝子座を各染色体領域に使用する。次いで、かかる不平衡を使用して、患者の癌を診断（スクリーニング）し、ならびに癌患者を予見するか、または患者における前悪性状態の存在を検出するか、もしくは進行をモニタリングすることができる。不平衡の重症度ならびに不平衡を示す領域数を使用することもできる。ゲノムの重複しない断片の系統的な分析によって、試料の一般的スクリーニング手段を提供することができる。加えて、患者を経時的に検査し、１つもしくは複数の染色体領域のそれぞれの重症度および染色体領域数を追跡して、スクリーニングおよび予測を可能にし、ならびに（例えば治療後に）進行をモニタリングすることができる。
【選択図】図１０

Description

関連出願の相互参照
本願は、２０１０年１１月３０日に出願された「癌関連の遺伝子異常の検出（ＤＥＴＥＣＴＩＯＮＯＦＧＥＮＥＴＩＣＡＢＥＲＲＡＴＩＯＮＳＡＳＳＯＣＩＡＴＥＤＷＩＴＨＣＡＮＣＥＲ）」と題された、米国仮特許出願第６１／４１８，３９１号、および２０１１年８月３１日に出願された「癌関連の遺伝子または分子異常の検出（ＤＥＴＥＣＴＩＯＮＯＦＧＥＮＥＴＩＣＯＲＭＯＬＥＣＵＬＡＲＡＢＥＲＲＡＴＩＯＮＳＡＳＳＯＣＩＡＴＥＤＷＩＴＨＣＡＮＣＥＲ）」と題された、米国仮特許出願第６１／５２９，８７７号の優先権を主張し、かつ本願はその非仮特許出願であり、これらの全内容は、すべての目的で参照することによって本明細書に組み込まれる。

本願は、同一出願人が所有する、２０１０年１１月５日にＬｏらによって出願された（代理人整理番号８００１５−７９４１０１／００６６１０ＵＳ）「サイズベースのゲノム分析（Ｓｉｚｅ−ＢａｓｅｄＧｅｎｏｍｉｃＡｎａｌｙｓｉｓ）」と題された、米国特許出願第１２／９４０，９９２号（米国公開特許第２０１１／０２７６２７７号）、および２０１０年１１月５日にＬｏらによって出願された（代理人整理番号８００１５−７９４１０３／００６７１０ＵＳ）「母体生体試料由来の胎児ゲノム分析（ＦｅｔａｌＧｅｎｏｍｉｃＡｎａｌｙｓｉｓＦｒｏｍＡＭａｔｅｒｎａｌＢｉｏｌｏｇｉｃａｌＳａｍｐｌｅ）」と題された、米国特許出願第１２／９４０，９９３号（米国公開特許第２０１１／０１０５３５３号）に関し、これらの開示は、参照することによってそれらの全体が組み込まれる。

背景
癌は、多くの人に影響する一般的な疾患である。癌は、重度の症状が現れるまで同定されないことが多い。一般的な癌タイプにおいては、癌を有する場合がある患者を同定するスクリーニング技術がある。しかしながら、かかる技術は、信頼できないか、患者を放射線に曝すことが多い。他の多くの癌タイプにおいては、効果的なスクリーニング技術はない。

ヘテロ接合性の欠失（ＬＯＨ）は、肺および頭頸部癌患者の循環ＤＮＡの特定の遺伝子座において検出されている（ＣｈｅｎＸＱ，ｅｔａｌ．ＮａｔＭｅｄ１９９６；２：１０３３−５；ＮａｗｒｏｚＨ，ｅｔａｌ．ＮａｔＭｅｄ１９９６；２：１０３５−７）。しかしながら、かかる技術は、特定の遺伝子座を試験することによって検出可能であるＬＯＨは比較的少量であることによって妨げられている。デジタルＰＣＲを使用する場合でも、これらの方法は依然として、少量のＬＯＨを検出することができないことから問題を抱えている。さらに、かかる技術は、特定の癌タイプにおいて起こると知られている特定の遺伝子座の調査に依然として限定される。したがって、一般的に癌スクリーニングは、可能ではないかまたは効果的ではない。

癌の存在のスクリーニングの他、当該技術はまた、癌患者の予後および治療効果（例えば術後回復、または化学療法、免疫療法、もしくは標的療法）のモニタリングを提供しない。かかる技術は、高額（例えば造影技術）、不正確、非効率、非感受性であるかまたは造影技術に使用される放射線に患者を曝し得ることが多い。

したがって、癌のスクリーニング、予測、および患者のモニタリングの新規技術を提供することが所望される。

簡単な概要
実施形態は、癌関連の遺伝子異常を決定するシステム、装置、および方法を提供する。細胞を含まないＤＮＡ断片を含む生体試料を分析して、例えば、腫瘍中の欠失および／または増幅による染色体領域の不平衡を同定する。複数の遺伝子座を伴う染色体領域を使用して、有効性および／または精度を高めることができる。次いで、かかる不平衡を使用して、患者の癌を診断もしくはスクリーニングし、ならびに癌患者を予見することができる。不平衡の重症度ならびに不平衡を示す領域数も使用することができる。加えて、患者を経時的に検査して１つもしくは複数の染色体領域のそれぞれの重症度ならびに染色体領域数を追跡してスクリーニングおよび予測を可能とし、ならびに（例えば治療後に）進行をモニタリングすることができる。

１つの実施形態によって、生物の生体試料における癌関連染色体の欠失または増幅の分析方法を提供する。生体試料は、正常細胞に由来し、潜在的に癌関連細胞に由来する核酸分子を含む。核酸分子の少なくとも一部は試料中に細胞を含まない。第１および第２ハプロタイプは、生物の正常細胞を第１染色体領域において決定する。第１染色体領域は、第１の複数の異型接合の遺伝子座を含む。試料中の複数の各核酸分子は、同定された生物の基準ゲノムにおける位置および決定されたそれぞれの対立遺伝子を有する。位置および決定された対立遺伝子は、第１ハプロタイプ由来の核酸分子の第１群および第２ハプロタイプ由来の第２群を決定するために使用される。コンピュータシステムは、第１群の第１値および第２群の第２値を算出する。各値は、核酸分子の各群の特性（例えば群中の分子の平均サイズまたは数）を定義した。第１値を第２値と比較し、第１染色体領域がいずれかの癌関連細胞内で欠失または増幅を示すかどうかの分類を決定する。

別の実施形態によって、生物の生体試料の分析方法を提供する。生体試料は、正常細胞に由来し、潜在的に癌関連細胞に由来する核酸分子を含む。核酸分子の少なくとも一部は試料中で細胞を含まない。生物の複数の重複しない染色体領域を同定する。各染色体領域は、複数の遺伝子座を含む。試料中の複数の核酸分子はそれぞれ、同定された生物の基準ゲノムにおける位置を有する。各染色体領域において、核酸分子の各群を、同定した位置に基づき染色体領域由来と同定する。各群はそれぞれ、染色体領域の複数の遺伝子座のそれぞれに位置する少なくとも１つの核酸分子を含む。コンピュータシステムは、各群の各値を算出し、各値は、各群の核酸分子の特性を定義する。各値を基準値と比較し、染色体領域が欠失または増幅を示すかどうかの分類を決定する。次いで、欠失または増幅を示すとして分類される染色体領域量を決定する。

別の実施形態によって、正常細胞に由来し、潜在的に癌関連細胞に由来する核酸分子を含む生体試料を用いて生物の染色体異常の進行を決定する方法を提供する。核酸分子の少なくとも一部は生体試料中で細胞を含まない。１つまたは複数の重複しない染色体領域を生物の基準ゲノムにおいて同定する。各染色体領域は、複数の遺伝子座を含む。生物から異なる時点で採取した試料を分析して、進行を決定する。試料において、試料中の複数の核酸分子はそれぞれ、同定された生物の基準ゲノムにおける位置を有する。各染色体領域において、核酸分子の各群を、同定した位置に基づき染色体領域由来と同定する。少なくとも１つの核酸分子を含む各群は、染色体領域の複数の遺伝子座のそれぞれに位置する。コンピュータシステムは、核酸分子の各群の各値を算出する。各値は、各群の核酸分子の特性を定義する。各値を基準値と比較して、第１染色体領域が欠失または増幅を示すかどうかの分類を決定する。次いで、生物の染色体異常の進行を決定するために複数時点での各染色体領域分類を使用する。

本発明の他の実施形態は、本明細書に記載の方法に関連したシステム、携帯型消費者装置、およびコンピュータ読み取り可能媒体に関する。

以下の発明を実施するための形態および添付の図面を参照して、本発明の本質および利点のより良い理解が得られ得る。

欠失異常を示す癌細胞の染色体領域を図示する。増幅異常を示す癌細胞の染色体領域を図示する。異なる癌タイプおよび関連領域およびそれらの対応する異常を例証する表３００を示す。本発明の実施形態による、血漿中で行なわれた測定値と共に異常を示さない癌細胞内の染色体領域を図示する。本発明の実施形態による、欠失領域を決定するため血漿中で行なわれた測定値と共に癌細胞内の染色体領域５１０の欠失を図示する。本発明の実施形態による、増幅領域を決定するため血漿中で行なわれた測定値と共に癌細胞内の染色体領域６１０の増幅を図示する。本発明の実施形態による、腫瘍組織中の単対立遺伝子の増幅を示す染色体１ｐに位置する断片の肝細胞癌（ＨＣＣ）患者の血漿ＤＮＡのＲＨＤＯ分析を示す。本発明の実施形態による、欠失を含む腫瘍が存在する場合、染色体領域の２ハプロタイプにおける断片サイズ分布変化を示す。本発明の実施形態による、増幅を含む腫瘍が存在する場合、染色体領域の２ハプロタイプにおける断片サイズ分布変化を示す。本発明の実施形態による、染色体領域が欠失または増幅を示すかどうかを決定する生物の生体試料のハプロタイプの分析方法を例証するフローチャートである。本発明の実施形態による、欠失領域を決定するための血漿中で行なわれた測定値と共に癌細胞内で欠失している副領域１１３０を伴う領域１１１０を示す。本発明の実施形態による、ＲＨＤＯ分析を用いた異常位置のマッピング方法を示す。本発明の実施形態による、別方向から開始したＲＨＤＯ分類を示す。本発明の実施形態による、複数の染色体領域を用いて生物の生体試料を分析する方法１４００のフローチャートである。本発明の実施形態による、腫瘍由来断片の様々な数の断片および分画濃度に必要な深さを例証する表１５００を示す。図１５は、試料中の癌由来ＤＮＡの分画濃度の異なるパーセンテージを分析する推定分子数を提供する。本発明の実施形態による、相対的ハプロタイプ用量（ＲＨＤＯ）分析による血漿中の腫瘍由来ＤＮＡの分画濃度を測定する原理を示す。ＨａｐＩとＨａｐＩＩは、本発明の実施形態による、非腫瘍組織における２ハプロタイプを示す。本発明の実施形態による、核酸分子を含む生体試料を用いて、生物の染色体異常の進行を決定する方法を例証するフローチャートである。癌患者の染色体４のｑ群の断片のＲＨＤＯ分析用のＳＰＲＴ曲線を示す。点は、各異型接合の遺伝子座後の累積数の比率を表す。は、治療後の患者の染色体４のｑ群の断片のＲＨＤＯ分析用のＳＰＲＴ曲線を示す。ＨＣＣ中に見られる一般的な染色体異常を示す。標的の分析を用いてＨＣＣと健常患者の正規化タグ数比率の結果を示す。ＨＣＣ患者３例および健常対照対象４例における対象の富化および大規模並列シークエンシング後のサイズ分析の結果を示す。本発明の実施形態による、血漿ＤＮＡを計数する配列したタグからのデータを示すＨＣＣ患者の円状プロットを示す。本発明の実施形態による、ＨＣＣを呈さない慢性Ｂ型肝炎ウイルス（ＨＢＶ）保因者の血漿試料における配列したタグ計数分析を示す。本発明の実施形態による、第３期鼻咽頭癌（ＮＰＣ）患者の血漿試料における配列したタグ計数分析を示す。本発明の実施形態による、第４期ＮＰＣ患者の血漿試料における配列したタグ計数分析を示す。本発明の実施形態による、腫瘍組織中のヘテロ接合の欠失（ＬＯＨ）を示す領域サイズに対する血漿ＤＮＡの累積頻度プロットを示す。ＬＯＨ領域における配列した血漿ＤＮＡのサイズに対するΔＱを示す。本発明の実施形態による、サイズ１３０ｂｐでΔＱは０．２に達する。本発明の実施形態による、腫瘍組織中の染色体の複製を伴う領域サイズに対する血漿ＤＮＡの累積頻度プロットを示す。本発明の実施形態による、増幅した領域における配列した血漿ＤＮＡサイズに対するΔＱを示す。本発明の実施形態によるシステムおよび方法と共に使用可能な例のコンピュータシステム９００のブロック図を示す。

定義
本明細書において使用される用語「生体試料」とは、対象（例えば、ヒト、癌患者、癌患者の疑いがあるもの、または他の生物）から採取される任意の試料を指し、１つまたは複数の目的の核酸分子を含む。

用語「核酸」または「ポリヌクレオチド」とは、デオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）、および一本または二本鎖のいずれかの形態であるそれらのポリマーを指す。特に限定されない限り、当該用語は、基準核酸と同程度の結合特性を有する、既知の天然ヌクレオチドアナログを含む核酸を含み、そして天然に存在するヌクレオチドに同様の方法で代謝される。他に示されない限り、特定の核酸配列はまた、その保存的に改変された改変体（例えば、縮重コドン置換）、対立遺伝子、オルソログ、単一のヌクレオチド多型（ＳＮＰ）、コピー数変異体、および相補的配列、ならびに明確に示された配列を暗黙的に含む。具体的には、縮重コドン置換は、１つまたは複数の選択された（またはすべての）コドンの第三の位置が混合塩基および／またはデオキシイノシン残基で置換されている配列を生じさせることによって達成され得る（Ｂａｔｚｅｒｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ．１９：５０８１（１９９１）；Ｏｈｔｓｕｋａｅｔａｌ，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２６０：２６０５−２６０８（１９８５）；およびＲｏｓｓｏｌｉｎｉｅｔａｌ，Ｍｏｌ．Ｃｅｌｌ．Ｐｒｏｂｅｓ８：９１−９８（１９９４））。核酸という用語は、遺伝子、ｃＤＮＡ、ｍＲＮＡ、低分子ノンコードＲＮＡ、マイクロＲＮＡ（ｍｉＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ、ならびに遺伝子もしくは遺伝子座によってコードされたショートヘアピンＲＮＡ（ｓｈＲＮＡ）を含むが、これらに限定されない。

用語「遺伝子」とは、ポリペプチド鎖または転写ＲＮＡ生成物を産生することに関与するＤＮＡ断片を意味する。それは、コード領域に先行する、およびコード領域に続く領域（リーダーおよびトレイラー）、ならびに個々のコード断片（エキソン）間の介在配列（イントロン）を含み得る。

本明細書において使用される用語「臨床関連核酸配列」または「臨床関連染色体領域」（または検査される領域／断片）とは、その潜在的不平衡が検査される、より大きなゲノム配列断片に対応するポリヌクレオチド配列のことか、またはそのより大きなゲノム配列自体を指すことができる。例としては、欠失もしくは増幅した、または潜在的に欠失もしくは増幅したゲノム断片（単純な複製を含む）、または断片の副領域を含むより大きい領域が挙げられる。いくつかの実施形態では、複数の臨床関連核酸配列、または臨床関連核酸配列の同等の複数のマーカーを、領域の不平衡を検出するためのデータを提供するために使用することができる。例えば、染色体上の５つの非連続的配列からのデータは、可能性のある不平衡の決定のための付加的な方法において、効果的に必要とされる試料の容量を１／５へと減少させるために使用することができる。

本明細書において使用される用語「基準核酸配列」または「基準染色体領域」とは、試験領域と比較するために定量プロファイルまたはサイズ分布を使用する核酸配列を指す。基準核酸配列の例としては、欠失または増幅を含まない染色体領域、完全ゲノム（例えば配列したタグ総数による正規化を介して）、正常であると知られている１つまたは複数の試料由来の領域（試験される試料の同一領域である可能性がある）、または染色体領域の特定のハプロタイプが挙げられる。かかる基準核酸配列は、試料中に内因的に存在していてもよく、試料プロセスまたは分析中に外因的に添加されてもよい。いくつかの実施形態では、基準染色体領域は、疾患を伴わない健常状態を代表するサイズプロファイルを示す。さらに他の実施形態では、基準染色体領域は、疾患を伴わない健常状態を代表する定量プロファイルを示す。

本明細書において使用される用語「に基づく」とは、「少なくとも一部に基づく」ことを意味し、そして、１つの方法の入力とその方法の出力との関係において生じる、別の値の決定において使用される１つの値（または結果）を指す。本明細書において使用される用語「導く」とは、１つの方法の入力とその方法の出力との関係を指し、例えば誘導が公式算出であるときに起こる。

本明細書において使用される用語「変数」とは、定量的データのセットを特徴づける数値、および／または定量的データセット間における数的関係を意味する。例えば、第１の核酸配列の第１の量と第２の核酸配列の第２の量との間における比率（または比率の関数）は変数である。

本明細書において使用される用語「遺伝子座（ｌｏｃｕｓ）」またはその複数形「遺伝子座（ｌｏｃｉ）」は、ゲノム全体で多型を有する場合がある任意の長さのヌクレオチド（または塩基対）の位置またはアドレスである。

本明細書において使用される用語「配列不平衡」または「異常」とは、臨床関連染色体領域における少なくとも１つのカットオフ値によって定義される、基準量からの任意の有意な偏差を意味する。配列不平衡は、染色体用量不平衡、対立遺伝子の不平衡、変異用量不平衡、コピー数不平衡、ハプロタイプ用量不平衡および他の類似した不平衡を含むことができる。例として、対立遺伝子の不平衡は、腫瘍が、遺伝子の欠失した１つの対立遺伝子または遺伝子の増幅した１つの対立遺伝子またはそのゲノム中の２つの対立遺伝子の差動増幅を有し、それによって、試料中の特定の遺伝子座の不平衡を生成する場合に起こる可能性がある。別の例では、患者は、腫瘍抑制遺伝子中の遺伝性変異を有する可能性がある。次いで、患者は、腫瘍抑制遺伝子の非変異性対立遺伝子が欠失している腫瘍発現に進展する可能性がある。したがって、腫瘍内、変異用量不平衡がある。腫瘍がそのＤＮＡを患者の血漿中へ放出する場合、腫瘍ＤＮＡは、血漿中で患者の構成上ＤＮＡ（正常細胞由来）と混合される。本明細書に記載の方法の使用を介して、血漿中のこのＤＮＡ混合物の変異用量不平衡を検出することができる。

本明細書において使用される用語「ハプロタイプ」とは、同一染色体または染色体領域上に共に伝達される複数の遺伝子座での対立遺伝子の組み合わせを指す。ハプロタイプは、わずか１つの遺伝子座対もしくは染色体領域、または完全染色体を指し得る。用語「対立遺伝子」とは、同一物理的ゲノム遺伝子座での代替ＤＮＡ配列を指し、これは異なる表現型の特性をもたらしてももたらさなくてもよい。（男性ヒト対象の性染色体を除く）各染色体の２コピーを伴う任意の特定の二倍体生物において、各遺伝子の遺伝子型は、同型接合体中で同じであり、異型接合体中で異なる遺伝子座に存在する対立遺伝子対を含む。生物の集団または種は、典型的には、様々な個体間の各遺伝子座で複数の対立遺伝子を含む。集団中に複数の対立遺伝子が見出されるゲノム遺伝子座は、多形部位と称する。遺伝子座の対立遺伝子多型は、集団中の対立遺伝子数（すなわち、多型度）の存在、または異型接合体率（すなわち、ヘテロ接合率）として測定可能である。本明細書において使用される用語「多型」とは、その頻度に関わらず、ヒトゲノム中の任意の個人間多型を指す。かかる多型の例としては、単一のヌクレオチド多型、単純な直列反復多型、挿入欠失多型、変異（疾患原因であり得る）およびコピー数の多型が挙げられるが、これらに限定されない。

用語「配列したタグ」とは、核酸分子、例えば、ＤＮＡ断片のすべてまたは一部から決定する配列を指す。断片の片端のみ、例えば、約３０ｂｐを配列することが多い。次いで、配列したタグは基準ゲノムに整列できる。あるいは、断片の両端は、２つの配列したタグを配列して生成することができ、これは、アラインメントのより高い精度を得ることができ、断片長も得ることができる。

用語「ユニバーサルシークエンシング」とは、アダプターを断片末端に加え、シークエンシング用のプライマーをアダプターに結合するシークエンシングを指す。したがって、任意の断片を同一プライマーと配列でき、したがってシークエンシングはランダムとすることができる。

用語「サイズ分布」とは、特定の群（例えば特定のハプロタイプ由来または特定の染色体領域由来の断片）に対応する分子の長さ、質量、重量、または他のサイズ測定値を示す任意の１つの値または一連の値を指す。様々な実施形態において、様々なサイズ分布を使用することができる。いくつかの実施形態では、サイズ分布は、１つの染色体断片サイズ（例えば、平均（ａｖｅｒａｇｅ）、中央値、または平均（ｍｅａｎ））を他の染色体断片と比較したランキングに関する。他の実施形態では、サイズ分布は、染色体断片の実サイズの統計値に関することができる。１つの遂行では、統計値は、染色体断片の任意の平均（ａｖｅｒａｇｅ）、平均（ｍｅａｎ）、または中央値サイズを含むことができる。別の遂行において、統計値は、カットオフ値未満の断片の全長を含むことができ、これは、全断片または少なくとも大きなカットオフ値未満の断片の全長で割ってもよい。

本明細書において使用される用語「分類」とは、試料の特定の特性に関連する任意の数（１つまたは複数）または他の特性（１つまたは複数）を指す。例えば、「＋」記号（または「正」という言葉）は、欠失または増幅を有するとして分類される試料を表すことができる。分類は、２進（例えば、正または負）とすることも、より多くの分類のレベル（例えば、１〜１０または０〜１段階）を有することもできる。用語「カットオフ」および「閾値」は、操作に使用される所定数を指す。例えば、カットオフサイズは、これを超えると断片が除外されるサイズを指すことができる。閾値は、これを超えるまたはこれ未満のものに特定の分類が適用される値であってもよい。これらの用語はいずれも、これら文脈のいずれにおいても使用することができる。

用語「癌レベル」は、癌の有無、癌病期、腫瘍サイズ、どれだけの染色体領域の欠失もしくは増幅が関与したか（例えば二倍または三倍）、ならびに／または癌重症度の他の測定値を指すことができる。癌レベルは、数であっても他の特性であってもよい。レベルは０である可能性がある。癌レベルはまた、欠失または増幅に関する前悪性状態または前癌状態も含む。

詳細な説明
癌組織（腫瘍）は、異常（染色体領域の欠失または増幅等）を有する可能性がある。腫瘍は、ＤＮＡ断片を体液中に放出する可能性がある。実施形態では、ＤＮＡ断片を分析して染色体領域におけるＤＮＡの正常（予想）値と比較して異常を同定することによって、腫瘍を同定することができる。

欠失もしくは増幅の厳密なサイズならびに位置は変わる可能性がある。一般的に癌または特定の癌タイプにおいて特定領域が異常を示す（それによって、特定の癌の診断に至る）と知られている時点があり得る。特定領域が未知である場合、ゲノム（例えば欠失または増幅した塩基数）全体を通して分散する場合があり、かつ全体サイズが変化する、異常領域を検出するために完全ゲノムまたは大部分のゲノムの系統的な分析方法を適用してもよい。染色体領域（１つまたは複数）を経時的に追跡し、異常の重症度または異常を示す領域数の変化を同定することができる。この追跡により、腫瘍のスクリーニング、予測、およびモニタリングに関する重要な情報を（例えば治療後、または再発もしくは腫瘍進行を検出するために）得ることができる。

この詳細は、まず癌中の染色体異常の例から始まる。次いで、生体試料中で細胞を含まないＤＮＡを検出および分析することによって染色体異常の検出方法の例について論じる。１つの染色体領域における異常の検出方法を確立後、多くの染色体領域における異常の検出方法を系統的な方法に使用して、患者をスクリーニング（診断）および予見する方法について記載する。この詳細は、経時的な１つまたは複数の領域における染色体異常の検査から得られた数値指標を追跡して、患者のスクリーニング、予測、およびモニタリングを提供する方法についても記載する。次いで、実施例について論じる。

Ｉ．癌中の染色体異常の例
染色体異常は、一般に癌細胞内で検出される。さらに、染色体異常の特徴パターンは、選択された癌タイプに見出すことができる。例えば、染色体群１ｐ、１ｑ、７ｑ、１５ｑ、１６ｐ、１７ｑおよび２０ｑにおけるＤＮＡ獲得ならびに３ｐ、４ｑ、９ｐおよび１１ｑにおけるＤＮＡ喪失は、一般に肝細胞癌（ＨＣＣ）に検出される。先行研究は、かかる遺伝子異常は癌患者の循環ＤＮＡ中にも検出することができることによって立証されている。例えば、ヘテロ接合性の欠失（ＬＯＨ）は、肺および頭頸部癌患者の循環ＤＮＡ分子の特定の遺伝子座に対して検出されている（ＣｈｅｎＸＱ，ｅｔａｌ．ＮａｔＭｅｄ１９９６；２：１０３３−５；ＮａｗｒｏｚＨ，ｅｔａｌ．ＮａｔＭｅｄ１９９６；２：１０３５−７）。血漿または血清中に検出された遺伝子改変は、腫瘍組織中に見出されるものと同一である。しかしながら、腫瘍由来ＤＮＡは総循環の細胞を含まないＤＮＡのわずかな部分のみの寄与となるため、通常、腫瘍細胞のＬＯＨに起因する対立遺伝子の不平衡は小さい。循環ＤＮＡ分子間の異なる遺伝子座の対立遺伝子の正確な定量化（ＣｈａｎｇＨＷ，ｅｔａｌ．ＪＮａｔｌＣａｎｃｅｒＩｎｓｔ．２００２；９４：１６９７−７０３）において、多数の治験担当医がデジタルポリメラーゼ連鎖反応（ＰＣＲ）技術を開発している（ＶｏｇｅｌｓｔｅｉｎＢ，ＫｉｎｚｌｅｒＫＷ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．１９９９；９６：９２３６−４１；ＺｈｏｕＷ，ｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ２００１；１９：７８−８１；ＺｈｏｕＷ，ｅｔａｌ．Ｌａｎｃｅｔ．２００２；３５９：２１９−２５）。腫瘍ＤＮＡ中の特定の遺伝子座におけるＬＯＨに起因する小さな対立遺伝子の不平衡の検出においてデジタルＰＣＲは、リアルタイムＰＣＲまたは他のＤＮＡ定量化方法よりはるかに感受性がある。しかしながら、デジタルＰＣＲは、特定の遺伝子座における非常に小さな対立遺伝子の不平衡の同定に依然として困難を有する可能性があり、したがって、本明細書に記載の実施形態では、集合的な形式で染色体領域について分析する。

本明細書に記載の技術はまた、前悪性状態または前癌状態検出における適応も有する。かかる状態の例としては、肝硬変および頸部上皮内癌が挙げられる。前者の状態は、肝細胞癌における前悪性状態であるのに対し、後者の状態は、頸部癌における前悪性状態である。かかる前悪性状態は、それらの発生においていくつかの分子改変をすでに所有し、悪性腫瘍となることが報告されている。例えば、染色体群１ｐ、４ｑ、１３ｑ、１８ｑにおけるＬＯＨの存在、および３つを超す遺伝子座における併用欠失は、肝硬変患者におけるＨＣＣ出現リスクの増大に関与する（ＲｏｎｃａｌｌｉＭｅｔａｌ．Ｈｅｐａｔｏｌｏｇｙ２０００；３１：８４６−５０）。かかる前悪性病巣はまた、低濃度の可能性が高いが、循環中にＤＮＡを放出もする。当該技術によって、血漿中のＤＮＡ断片を分析して血漿中の循環前悪性ＤＮＡの濃度（分画濃度を含む）を測定することによって欠失または増幅を検出することができる。かかる異常は容易に検出され（例えばかかる変化のシークエンシング深さまたは数が検出される）、濃度は、末期癌状態へ進行する可能性または迅速さを予測することになる。

Ａ．染色体領域の欠失
図１は、欠失異常を示す癌細胞の染色体領域を例証する。正常細胞は、２ハプロタイプ、ＨａｐＩとＨａｐＩＩで示される。図示するように、ＨａｐＩとＨａｐＩＩの両方は、複数の異型接合の遺伝子座１１０（単一のヌクレオチド多型ＳＮＰとも呼ばれる）のそれぞれで配列を有する。癌関連細胞内において、ＨａｐＩＩは染色体領域１２０が欠失している。例として、癌関連細胞は、腫瘍（例えば、悪性腫瘍）、腫瘍の転移巣（例えば局所リンパ節内、または遠位臓器内）由来であることも、前癌または前悪性病巣（例えば、上述）由来であることもできる。

２相同ハプロタイプの１つが欠失している癌細胞の染色体領域１２０において、異型接合のＳＮＰ１１０はすべて、対応する欠失した相同染色体上の他の対立遺伝子の欠失による同種接合を示すことになる。したがって、この染色体異常タイプは、ヘテロ接合性の欠失（ＬＯＨ）と呼ばれる。領域１２０において、これらのＳＮＰの欠失していない対立遺伝子は、正常組織中に見出すことができる２ハプロタイプのうち１つを表す。図１に示す実施例において、ＬＯＨ領域１２０でハプロタイプＩ（ＨａｐＩ）は、腫瘍組織の遺伝子型を特定することによって決定することができる。他のハプロタイプ（ＨａｐＩＩ）は、正常組織の明らかな遺伝子型と癌組織とを比較することによって決定することができる。ＨａｐＩＩは、欠失した対立遺伝子をすべて結合することによって構築することができる。すなわち、癌細胞の領域１２０内に現れない領域１２０の正常細胞内の対立遺伝子のすべてが、同一ハプロタイプ、すなわちＨａｐＩ上で決定される。この分析を介して、患者（例えば、肝細胞癌ＨＣＣ患者）のハプロタイプは、腫瘍組織中ＬＯＨを示すすべての染色体領域において決定することができる。かかる方法は、患者が癌細胞を有する場合にのみ有用であり、領域１２０内のハプロタイプを決定するためにのみ役に立つが、欠失した染色体領域の良好な例証を提供する。

Ｂ．染色体領域の増幅
図２は、増幅異常を示す癌細胞の染色体領域を例証する。正常細胞は、２ハプロタイプ、ＨａｐＩとＨａｐＩＩで示される。図示するように、ＨａｐＩとＨａｐＩＩの両方は、複数の異型接合の遺伝子座２１０のそれぞれの配列を有する。腫瘍細胞内のＨａｐＩＩは２倍（複製）増幅した染色体領域２２０を有する。

同様に、腫瘍組織中の単対立遺伝子増幅を伴う領域において、マイクロアレー分析等の方法によってＳＮＰ２１０で増幅した対立遺伝子を検出することができる。２ハプロタイプのうち１つ（図２に示す実施例のＨａｐＩＩ）は、染色体領域２２０におけるすべての増幅した対立遺伝子を結合することによって決定することができる。特定の遺伝子座で増幅した対立遺伝子は、遺伝子座の各対立遺伝子数を比較することによって決定することができる。次いで、他のハプロタイプ（ＨａｐＩ）は、増幅されていない対立遺伝子を結合することによって決定することができる。かかる方法は、患者が癌細胞を有する場合にのみ有用であり、領域２２０内のハプロタイプを決定するためにのみ役に立つが、増幅した染色体領域の良好な例証を提供する。

増幅は、２つを超す染色体を有することに起因しても、１染色体中に遺伝子を反復することに起因してもよい。１領域は直列的に複製されていても、領域の１つまたは複数のコピーを含む微小染色体であってもよい。増幅はまた、コピーされ、かつ異なる染色体または同一染色体における異なる領域に挿入された１染色体の遺伝子からもたらされてもよい。かかる挿入は増幅タイプである。

ＩＩ．染色体領域の選択
癌組織はこれらの細胞を含まないＤＮＡ（および潜在的細胞ＤＮＡ）の少なくとも一部に寄与することになるため、癌組織のゲノム異常は、試料（血漿および血清等）中に検出することができる。異常検出の問題は、腫瘍または癌が非常に小さいことによって癌細胞から得られるＤＮＡが比較的少ない場合がある点である。したがって、異常を伴う循環ＤＮＡ量は非常に少なく、それによって、検出が非常に困難となる。異常を検出する上で十分なＤＮＡがゲノム中の単一遺伝子座にない場合がある。本明細書に記載の方法は、複数の遺伝子座（ハプロタイプ）を含む染色体領域でＤＮＡを分析し、したがって、ハプロタイプ上で凝集時に１遺伝子座での小さな多型を認知可能な差に変換することによって、この困難を克服することができる。したがって、領域の複数遺伝子座を分析することによって、より高い精度を得ることができ、偽陽性および偽陰性を低減することができる。

さらに、異常領域が非常に小さいことによって異常の同定が困難となる場合がある。１遺伝子座または特定の遺伝子座のみを使用する場合、それらの遺伝子座にない異常は見逃されることになる。本明細書に記載の一部の方法によって、一部の領域の異常を見つけるために全領域を調査できる。分析する領域がゲノムをスパンする場合、各種長さおよび位置の異常を見つけるために以下に詳述するように完全ゲノムを分析することができる。

これらの点を例証するため、上に示すように、領域は異常を有することができる。しかしながら、領域は、分析用に選択しなければならない。領域の長さおよび位置は、結果を変え、したがって分析に影響を及ぼす可能性がある。例えば、図１の第１領域を分析する場合、異常が検出されないことになる。第２領域を分析する場合、例えば、本明細書に記載の方法を用いて異常を検出することができる。第１領域と第２領域の両方を含む広い領域を分析する場合、あるものは広い領域の一部のみが異常を有すという困難に直面し、これは、いかなる異常を同定することもより困難にし得、ならびに異常の正確な位置および長さを同定する問題に直面する。様々な実施形態は、これらの困難の一部および／またはすべてに対処することができる。領域選択の説明は、同じ染色体領域のハプロタイプを使用するか、または２つの異なる染色体領域を使用する方法に等しく適応可能である。

Ａ．特定の染色体領域の選択
１つの実施形態では、特定領域は癌または患者の知識に基づき選択できる。例えば、領域は、一般に多くの癌または特定の癌において異常を示すことが既知である可能性がある。領域の正確な長さおよび位置は、癌タイプまたは特定のリスク要因を有する患者に関して何が周知であるかに関する文献を参照することによって決定することができる。加えて、上記のように患者の腫瘍組織を得て分析し、異常領域を同定することができる。かかる技術には癌細胞を得ることを必要であるが（これは、診断されたばかりの患者において実用的でない場合がある）、かかる技術は、（例えば、癌組織を除去する術後、または化学療法もしくは免疫療法もしくは標的療法後、または腫瘍再発もしくは進行を検出するため）同患者において経時的にモニタリングする領域を同定するために使用することができる。

あるものは、複数の特定領域を同定することができる。かかる領域のそれぞれ１つの分析を独立して使用することも、異なる領域を集合的に分析することもできる。加えて、異常の位置付けにおいてより高い精度を得るために領域を再分割してもよい。

図３は、異なる癌タイプおよび関連領域、ならびにそれらの対応する異常を例証する表３００を示す。列３１０は異なる癌タイプを列挙する。本明細書に記載の実施形態は、異常に関連する任意のタイプの癌に使用することができ、したがって、このリストは、例にすぎない。列３２０は、獲得（増幅）が同じ列の特定の癌と関連する領域（例えば、７ｐなどの広い領域、または１７ｑ２５）を示す。列３３０は、喪失（欠失）を見出すことができる領域を示す。列３４０は、これらの領域と特定の癌との関係を論じる参照を列挙する。

潜在的染色体異常を有するこれらの領域は、本明細書に記載の方法によって分析用の染色体領域（１つまたは複数）として使用することができる。癌中の改変された他のゲノム領域の例は、ＣａｎｃｅｒＧｅｎｏｍｅＡｎａｔｏｍｙＰｒｏｊｅｃｔデータベース（ｃｇａｐ．ｎｃｉ．ｎｉｈ．ｇｏｖ／Ｃｈｒｏｍｏｓｏｍｅｓ／ＲｅｃｕｒｒｅｎｔＡｂｅｒｒａｔａｉｏｎｓ）およびＡｔｌａｓｏｆＧｅｎｅｔｉｃｓａｎｄＣｙｔｏｇｅｎｅｔｉｃｓｉｎＯｎｃｏｌｏｇｙａｎｄＨａｅｍａｔｏｌｏｇｙ（ａｔｌａｓｇｅｎｅｔｉｃｓｏｎｃｏｌｏｇｙ．ｏｒｇＴｕｍｏｒｓ／Ｔｕｍｏｒｌｉｓｔｅ．ｈｔｍｌ）に見ることができる。

見ることができるように、同定した領域は非常に広い可能性があるのに対し、他はより具体的である可能性がある。異常は、表中に同定した完全領域を含まない場合がある。したがって、異常タイプに関するかかる指標は、特定の患者において異常が実在する位置を厳密に突き止めないが、分析用の広い領域に関する概略ガイドとしてより頻繁に使用し得る。かかる広い領域は、個別にならびに集合的に分析する多くの副領域（均一サイズであり得る）を広い領域内に含み得る（詳細については本明細書に記載）。したがって、実施形態は、次に記載のように、検査する特定の癌に基づき広い領域を選択する態様と併合し得るが、より一般的な技術（例えば、副領域の検査）も使用し得る。

Ｂ．恣意的な染色体領域の選択
別の実施形態では、分析する染色体領域を恣意的に選択する。ゲノムは、例えば、１メガベース（Ｍｂ）長、または他の所定の断片長（５００Ｋｂまたは２Ｍｂ等）の領域に分離することができる。半数体ヒトゲノムには約３０億の塩基があるため、領域が１Ｍｂである場合は、ヒトゲノム中に約３，０００領域があることになる。これらの領域は、次いで、後に詳細に論じるようにそれぞれ分析することができる。

かかる領域は、癌または患者のいかなる知識にも基づかず、ゲノムの分析する領域への系統的な分割に基づき決定されてもよい。１つの遂行では、染色体が複数の所定の断片長を有しない（例えば、百万塩基によって割ることができない）場合、染色体の最終領域が所定の長さ未満（例えば１ＭＢ未満）である可能性がある。別の遂行において、染色体全長および作製する断片数（典型的には染色体間で異なる）に基づき、各染色体を等長（またはほぼ等しく、丸め誤差内で）の領域に分離することができる。かかる遂行では、各染色体断片長は異なる可能性がある。

上述のように、検査する特定の癌に基づき特定領域を同定することができるが、次いで特定の領域を、より狭い領域（例えば、より大きい領域にわたる等サイズの副領域）に再分割することができる。このような形で、異常を突き止め得る。以下の論説において、染色体領域に関する一般的な言及はいずれも、具体的に同定された領域であっても、恣意的に選択された領域であっても、または両方の組み合わせであってもよい。

ＩＩＩ．特定のハプロタイプにおける異常の検出
この項目において、細胞を含まないＤＮＡを含む生体試料を分析することによる、単一染色体領域における異常の検出方法を記載する。この項目のある実施形態では、単一染色体領域は、領域の複数の遺伝子座での異型接合（異なる対立遺伝子）であり、それによって、所定の遺伝子座での特定の対立遺伝子を知ることによって区別することができる２ハプロタイプを提供する。したがって、所与の核酸分子（例えば、細胞を含まないＤＮＡ断片）は、２ハプロタイプの特定の１つ由来と同定することができる。例えば、断片を配列して、染色体領域に整列された配列タグを得ることができ、次いで、対立遺伝子が属する異型接合の遺伝子座でのハプロタイプを同定することができる。２つの一般的技術タイプが、特定のハプロタイプ（Ｈａｐ）での異常の決定、具体的にタグ計数およびサイズ分析について以下に記載する。

Ａ．ハプロタイプの決定
２ハプロタイプを識別するため、染色体領域の２ハプロタイプをまず決定する。例えば、図１の正常細胞に示される２ハプロタイプＨａｐＩとＨａｐＩＩを決定することができる。図１において、ハプロタイプは、異型接合しており２ハプロタイプを識別することができるようにする第１の複数の遺伝子座１１０を含む。この第１の複数の遺伝子座は、分析する染色体領域にわたる。異なる異型接合の遺伝子座（異性）上の対立遺伝子をまず決定して、次いで段階的に患者のハプロタイプを決定することができる。

ＳＮＰ対立遺伝子のハプロタイプは、単分子分析方法によって決定することができる。かかる方法の例は、Ｆａｎｅｔａｌ（ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１１；２９：５１−７），Ｙａｎｇｅｔａｌ（ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１１；１０８：１２−７）およびＫｉｔｚｍａｎｅｔａｌ（ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１１Ｊａｎ；２９：５９−６３）によって記載されている。あるいは、個体のハプロタイプは、家族（例えば両親、兄弟姉妹、および子供）の遺伝子型の分析によって決定することができる。例として、Ｒｏａｃｈｅｔａｌ（ＡｍＪＨｕｍＧｅｎｅｔ．２０１１；８９（３）：３８２−９７）およびＬｏｅｔａｌ（ＳｃｉＴｒａｎｓｌＭｅｄ．２０１０；２：６１ｒａ９１）によって記載されている方法が挙げられる。さらに別の実施形態では、個体のハプロタイプは、腫瘍組織およびゲノムＤＮＡの遺伝子型結果を比較することによって決定することができる。これらの対象の遺伝子型は、ｔを使用するなどのマイクロアレー分析によって実施することができる。

ハプロタイプは、当業者に周知である他の方法によっても構築できる。かかる方法の例としては、単分子分析ベースのもの（デジタルＰＣＲ等）（ＤｉｎｇＣａｎｄＣａｎｔｏｒＣＲ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００３；１００：７４４９−７４５３；ＲｕａｎｏＧｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１９９０；８７：６２９６−６３００）、染色体選別もしくは分離（ＹａｎｇＨｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２０１１；１０８：１２−１７；ＦａｎＨＣｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ２０１１；２９：５１−５７）、精子ハプロタイプ（ＬｉｅｎＳｅｔａｌ．ＣｕｒｒＰｒｏｔｏｃＨｕｍＧｅｎｅｔ２００２；Ｃｈａｐｔｅｒ１：Ｕｎｉｔ１．６）ならびに造影技術（ＸｉａｏＭｅｔａｌ．ＨｕｍＭｕｔａｔ２００７；２８：９１３−９２１）が挙げられる。他の方法としては、対立遺伝子特異性ＰＣＲベースのもの（Ｍｉｃｈａｌａｔｏｓ−ＢｅｌｏｉｎＳｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ１９９６；２４：４８４１−４８４３；ＬｏＹＭＤｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ１９：３５６１−３５６７）、クローニングおよび制限酵素消化（ＳｍｉｒｎｏｖａＡＳｅｔａｌ．Ｉｍｍｕｎｏｇｅｎｅｔｉｃｓ２００７；５９：９３−８）等が挙げられる。さらに他の方法は、対象のハプロタイプを統計的評価から推定する集団中のハプロタイプブロック不平衡構造の分布および結合に基づく（ＣｌａｒｋＡＧ．ＭｏｌＢｉｏｌＥｖｏｌ１９９０；７：１１１−２２；１０：１３−９；ＳａｌｅｍＲＭｅｔａｌ．ＨｕｍＧｅｎｏｍｉｃｓ２００５；２：３９−６６）。

ＬＯＨ領域のハプロタイプの別の決定方法は、腫瘍組織が入手可能である場合、対象の正常組織および腫瘍組織の遺伝子型を特定することによる。ＬＯＨの存在下、腫瘍細胞の非常に高い分画濃度を伴う腫瘍組織は、ＬＯＨを示す領域内のすべてのＳＮＰ遺伝子座において明らかな同型接合性を示すことになる。これらのＳＮＰ遺伝子座の遺伝子型は１ハプロタイプ（図１のＬＯＨ領域のＨａｐＩ）を含むことになる。他方、正常組織は、対象がＬＯＨ領域内のＳＮＰ遺伝子座において異型接合していることを示すことになる。正常組織に存在するが腫瘍組織には存在しない対立遺伝子は、もう一方のハプロタイプ（図１のＬＯＨ領域のＨａｐＩＩ）を含むことになる。
Ｂ．相対的ハプロタイプ用量（ＲＨＤＯ）分析

上述のように、染色体領域の１ハプロタイプの増幅または欠失を伴う染色体異常は、腫瘍組織中の染色体領域の２ハプロタイプの用量不平衡に至ることになる。腫瘍増殖患者の血漿中の循環ＤＮＡの一部は、腫瘍細胞に由来する。癌患者の血漿中の腫瘍由来ＤＮＡの存在に起因し、かかる不平衡はそれらの血漿にも存在することになる。２ハプロタイプの用量不平衡は、各ハプロタイプ由来の分子数計数を介して検出することができる。

ＬＯＨが腫瘍組織中に観察された染色体領域（例えば図１の領域１２０）において、ＨａｐＩは、腫瘍組織からのＨａｐＩＩの寄与の欠如のため、ＨａｐＩＩと比較して循環ＤＮＡ分子（断片）間で過剰発現する。腫瘍組織中にコピー数増幅が観察される染色体領域において、腫瘍組織からさらなるＨａｐＩＩ用量が放出されるために、ＨａｐＩＩの単対立遺伝子増幅による影響を受ける領域においてＨａｐＩＩはＨａｐＩと比較して過剰発現する。過剰発現か不足発現かを決定するため、試料中のあるＤＮＡ断片は、ＨａｐＩまたはＨａｐＩＩ由来と判定され、これは様々な方法、例えばユニバーサルシークエンシングを実施すること、ならびにデジタルＰＣＲおよび配列特異性プローブを整列するかもしくは使用することによって行なうことができる。

癌患者の血漿（または他の生体試料）由来の複数のＤＮＡ断片をシークエンシングして配列したタグを生成後、２ハプロタイプ上の対立遺伝子に対応する配列したタグを同定して計数することができる。次いで、２ハプロタイプのそれぞれに対応する配列したタグ数を比較して、２ハプロタイプが血漿中で等しく発現しているかどうかを決定することができる。１つの実施形態では、血漿中の２ハプロタイプ発現が有意に異なるかどうかを決定するために逐次確率比検定（ＳＰＲＴ）を使用することができる。統計的有意差によって、分析する染色体領域での染色体異常の存在が示唆される。さらに、血漿中の２ハプロタイプの定量差は、下記のように血漿中の腫瘍由来ＤＮＡの分画濃度推定に使用することができる。

本願に記載のＤＮＡ断片の同一性（例えばヒトゲノムにおけるその位置）決定のための診断アプローチは、検出基盤として大規模並列シークエンシング使用に限定されない。これらの診断アプローチは、例えば、マイクロフルイディクスデジタルＰＣＲ（例えば、Ｆｌｕｉｄｉｇｍデジタルアレーシステム、マイクロ液滴デジタルＰＣＲシステム（例えばＲａｉｎＤａｎｃｅ、およびＱｕａｎｔａＬｉｆｅ製）、ＢＥＡＭｉｎｇシステム（すなわちビーズ、乳剤ＰＣＲ、増幅、および磁気）（Ｄｉｅｈｌｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００５；１０２：１６３６８−１６３７３）、リアルタイムＰＣＲ、質量分析ベースのシステム（例えばＳｅｑｕｅｎｏｍＭａｓｓＡｒｒａｙシステム）および多重結紮依存プローブ増幅（ＭＬＰＡ）分析にも適用できるが、これらに限定されない。

正常領域
図４は、本発明の実施形態による、血漿中で行なわれた測定値と共に異常を示さない癌細胞内の染色体領域を例証する。染色体領域４１０は、任意の方法によって、例えば、検査する特定の癌に基づき、またはゲノムの広い領域にわたる所定の断片を使用する一般的スクリーニングに基づき選択されてもよい。２ハプロタイプを識別するため、２ハプロタイプをまず決定する。図４は、染色体領域４１０における正常細胞の２ハプロタイプ（ＨａｐＩとＨａｐＩＩ）を示す。ハプロタイプは、第１の複数の遺伝子座４２０を含む。この第１の複数の遺伝子座４２０は、分析する染色体領域４１０にわたる。図示するように、これらの遺伝子座は、正常細胞内で異型接合している。癌細胞の２ハプロタイプも示される。癌細胞内において、欠失または増幅する領域はない。

図４はまた、各遺伝子座４２０の各ハプロタイプ上の対立遺伝子数を示す。染色体領域４１０のある副領域において総累積も得られる。対立遺伝子数は、それぞれの特定の遺伝子座で特定のハプロタイプに対応するＤＮＡ断片数に対応する。例えば、第１遺伝子座４２１を含み、対立遺伝子Ａを有するＤＮＡ断片はＨａｐＩに向かって計数されることになる。そして、対立遺伝子Ｔを有するＤＮＡ断片は、ＨａｐＩＩに向かって計数されることになる。断片の整列位置（すなわち特定の遺伝子座を含むかどうか）および含有対立遺伝子の決定は、本明細書に記載のように様々な方法で決定することができる。２ハプロタイプ上の数の比率は、統計的有意差が存在するかどうかを決定するために使用し得る。この比率は、本明細書においてオッズ比と呼ばれる。２値間の差も使用されてもよく、この差は、断片の総数によって正規化し得る。比率および差（およびその関数）は、異常の有無の分類を決定する閾値と比較する変数例である。

ＲＨＤＯ分析は、同一ハプロタイプ上のすべての対立遺伝子（例えば累積数）を使用して、例えば、上述のＬｏの特許出願第１２／９４０，９９２号および同第１２／９４０，９９３号に記載の母体血漿中で行なうことができる、血漿中の２ハプロタイプの何らかの不平衡が存在するかどうかを決定することができる。この方法は、何らかの不平衡が存在するかどうかを決定するために使用されるＤＮＡ分子数を有意に増大でき、それゆえ、癌または前悪性状態の不在下において対立遺伝子数の確率的な分布由来の癌の存在に起因する不平衡を識別するより良い統計的検出力をもたらす。複数のＳＮＰ遺伝子座の別々の分析と対照的に、ＲＨＤＯアプローチは、同一染色体上に位置する対立遺伝子を共に分析することができるように、２つの染色体（ハプロタイプ情報）上の対立遺伝子の相対位置を使用することができる。ハプロタイプ情報の不在下、異なるＳＮＰ遺伝子座の対立遺伝子数は、血漿中のハプロタイプが過剰発現であるか不足発現であるかどうかを統計的に決定するために共に添加することができない。対立遺伝子数の定量化は、大規模並列シークエンシング（例えば、合成システムによるイルミナシークエンシング、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓによる結紮技術（ＳＯＬｉＤ）によるシークエンシング、ＩｏｎＴｏｒｒｅｎｔ、およびＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓによるＩｏｎＴｏｒｒｅｎｔシークエンシングシステム、ナノポアシークエンシング（ｎａｎｏｐｏｒｅｔｅｃｈ．ｃｏｍ）、および４５４シークエンシング技術（Ｒｏｃｈｅ）、デジタルＰＣＲ（例えばマイクロフルイディクスデジタルＰＣＲ（例えば、Ｆｌｕｉｄｉｇｍ（ｆｌｕｉｄｉｇｍ．ｃｏｍ））またはＢＥＡＭｉｎｇ（ビーズ、乳剤ＰＣＲ、増幅、磁気（ｉｎｏｓｔｉｃｓ．ｃｏｍ））または液滴ＰＣＲ（例えばＱｕａｎｔａＬｉＦｅ（ｑｕａｎｔａｌｉｆｅ．ｃｏｍ）およびＲａｉｎＤａｎｃｅ（ｒａｉｎｄａｎｃｅｔｅｃｈｎｏｌｏｇｉｅｓ．ｃｏｍ）製）およびリアルタイムＰＣＲを用いて実施することができるが、これらに限定されない。技術の他の遂行において、溶液中捕獲を用いて（例えば、ＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔシステム、ＩｌｌｕｍｉｎａＴｒｕＳｅｑＣｕｓｔｏｍＥｎｒｉｃｈｍｅｎｔＫｉｔ（ｉｌｌｕｍｉｎａ．ｃｏｍ／ａｐｐｌｉｃａｔｉｏｎｓ／ｓｅｑｕｅｎｃｉｎｇ／ｔａｒｇｅｔｅｄ＿ｒｅｓｅｑｕｅｎｃｉｎｇ．ｉｌｍｎ）、またはＭｙＧｅｎｏｓｔｉｃｓＧｅｎＣａｐＣｕｓｔｏｍＥｎｒｉｃｈｍｅｎｔシステム（ｍｙｇｅｎｏｓｔｉｃｓ．ｃｏｍ／））を用いて）またはアレーベースの捕獲（例えば、ＲｏｃｈｅＮｉｍｂｌｅＧｅｎシステムを用いて）富化された標的シークエンシングを使用することができる。

図４に示す実施例において、わずかな対立遺伝子の不平衡が第１の２つのＳＮＰ遺伝子座において観察された（第１ＳＮＰにおいて２４対２６および第２ＳＮＰにおいて１８対２０）。しかしながら、対立遺伝子数は、実際の対立遺伝子の不平衡が存在するかどうかを決定する上で統計的に十分ではない。したがって、染色体領域４１０において２ハプロタイプ間に対立遺伝子の不平衡が存在しないと統計的に結論する上で２ハプロタイプの対立遺伝子の累積数が十分になるまで、同一ハプロタイプ上の対立遺伝子数を共に添加する（本実施例における第５ＳＮＰ）。統計的有意な分類に達した後、累積数を初期化する（本実施例における第６ＳＮＰ）。次いで、領域４１０の特定の副領域において２ハプロタイプ間に対立遺伝子の不平衡が存在しないと統計的に結論する上で再び２ハプロタイプの対立遺伝子の累積数が十分になるまで累積数を決定する。総累積数は、完全領域にも使用することができるが、先の方法によって、完全領域４１０に対向して異常の位置を決定する上で精度を高めるために提供する異なる副領域（すなわち副領域）を検査することができる。実際の対立遺伝子の不平衡の有無を決定するための統計的検査の例としては、逐次確率比検定（ＺｈｏｕＷ，ｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ２００１；１９：７８−８１；ＺｈｏｕＷ，ｅｔａｌ．Ｌａｎｃｅｔ．２００２；３５９：２１９−２５）、ｔ検定、およびカイ二乗検定が挙げられるが、これらに限定されない。

欠失の検出
図５は、本発明の実施形態による、欠失領域を決定するため血漿中で行なわれた測定値と共に癌細胞内の染色体領域５１０の欠失を例証する。図５は、染色体領域５１０における正常細胞の２ハプロタイプ（ＨａｐＩとＨａｐＩＩ）を示す。ハプロタイプは、分析する染色体領域５１０にわたる第１の複数の異型接合の遺伝子座５２０を含む。癌細胞の２ハプロタイプも示される。癌細胞内において、領域５１０はＨａｐＩＩにおいて欠失している。図４、図５には、さらに各遺伝子座５２０の対立遺伝子数も示す。総累積はまた、染色体領域５１０内のある副領域に対しても維持される。

腫瘍組織は典型的には腫瘍細胞と非腫瘍細胞の混合物を含むため、ＬＯＨは領域５１０内の遺伝子座の２つの対立遺伝子量の比率の非対称性によって明らかにされ得る。かかる状況において、領域５１０内のハプロタイプＨａｐＩＩ欠失は、正常組織上の対応する遺伝子座と比較してＤＮＡ断片量の相対的低下を示す遺伝子座５２０の組み合わせによって決定することができる。より頻繁に現れる断片とのハプロタイプはＨａｐＩであり、これは腫瘍細胞内に保持される。ある実施形態では、欠失したハプロタイプおよび保持されたハプロタイプがより容易に決定されるように、腫瘍試料中の腫瘍細胞率を富化する手順を実施することが所望され得る。かかる手順の１例は、（手動またはレーザ捕獲技術のいずれかによる）顕微解剖である。

理論的に、ＨａｐＩ上の各対立遺伝子は腫瘍組織中のＬＯＨを示す染色体領域における循環ＤＮＡ中で過剰発現し、対立遺伝子の不平衡度は血漿中の腫瘍ＤＮＡの分画濃度に依存する。しかしながら、同時に、任意の循環ＤＮＡ試料中の２つの対立遺伝子の相対的豊富さも、ポアソン分布によっても支配されることになる。統計的分析を実施して、観察された対立遺伝子の不平衡が癌組織中ＬＯＨの存在によるかまたは偶然によるかを判定することができる。癌中ＬＯＨに関する実際の対立遺伝子の不平衡の検出力は、分析する循環ＤＮＡ分子数、腫瘍ＤＮＡの分画濃度に依存する。腫瘍ＤＮＡのより高い分画濃度および分析するより多数の分子によって、実際の対立遺伝子の不平衡を検出するための感受性および特異性がより高まる。

図５に示す実施例において、わずかな対立遺伝子の不平衡が第１の２つのＳＮＰ遺伝子座において観察された（第１ＳＮＰにおいて２４対２２、および第２ＳＮＰにおいて１８対１５）。しかしながら、対立遺伝子数は、実際の対立遺伝子の不平衡が存在するかどうかを決定する上で統計的に十分ではない。したがって、領域５１０において２ハプロタイプ間に対立遺伝子の不平衡が存在しないと統計的に結論する上で２ハプロタイプの対立遺伝子の累積数が十分になるまで、同一ハプロタイプ上の対立遺伝子数を共に添加する（本実施例における第５ＳＮＰ）。いくつかの実施形態では、不平衡のみ既知であり、具体的なタイプ（欠失または増幅）は決定されない。次いで、領域５１０の特定の副領域において２ハプロタイプ間に対立遺伝子の不平衡が存在しないと統計的に結論する上で再び２ハプロタイプの対立遺伝子の累積数が十分になるまで累積数を決定する。総累積数は、完全領域にも使用することができ、ならびに本明細書に記載の任意の方法で行ない得る。

染色体領域の増幅の検出
図６は、本発明の実施形態による、増幅領域を決定するため血漿中で行なわれた測定と共に癌細胞内の染色体領域６１０の増幅を例証する。ＬＯＨに加えて、染色体領域の増幅も癌組織中に頻繁に観察される。図６に示す実施例において、染色体領域６１０内のＨａｐＩＩは、癌細胞内の３つのコピーに増幅される。図示するように、領域６１０は、先行の図に示すより長い領域に対向する６つの異型接合の遺伝子座のみを含む。増幅は、過剰発現が統計的有意であると決定される第６遺伝子座において統計的有意として検出される。いくつかの実施形態では、不平衡のみ既知であり、具体的なタイプ（欠失または増幅）は決定されない。他の実施形態では、癌細胞を得て分析し得る。かかる分析によって、不平衡が欠失による（癌細胞が欠失領域において同種接合している）か、または増幅による（癌細胞が増幅領域において異型接合している）かに関する情報を得ることができる。他の実施では、欠失または増幅が存在するかどうかを、ＩＶ項の方法を用いて決定し、領域全体（すなわち個別にハプロタイプではない）を分析することができる。領域が過剰発現の場合、異常は増幅であり；および領域が不足発現である場合、異常は欠失である。領域６２０もまた分析して、累積数は不平衡が存在しないことを確認する。

血漿ＲＨＤＯ分析のＳＰＲＴ分析
異型接合の遺伝子座を有する任意の染色体領域において、ＲＨＤＯ分析は、血漿中に２ハプロタイプの何らかの用量不平衡があるかどうかを決定するために使用することができる。これらの領域において、血漿中のハプロタイプ用量不平衡の存在は、血漿試料中の腫瘍由来ＤＮＡの存在を示唆する。１つの実施形態では、ＳＰＲＴ分析は、ＨａｐＩおよびＨａｐＩＩの配列したリード数差が統計的有意であるかどうかを判定するために使用することができる。このＳＰＲＴ分析例において、我々はまず２ハプロタイプのそれぞれに由来する配列したリード数を決定する。次いで、我々は潜在的に過剰発現したハプロタイプ（例えば、１ハプロタイプのリード数を他のハプロタイプのリード数で割った部分）によって寄与された、配列したリードの比例的量を示す変数（例えば部分）を決定することができる。潜在的に過剰発現したハプロタイプは、ＬＯＨのシナリオにおいて欠失していないハプロタイプ、および染色体領域の単対立遺伝子増幅のシナリオにおいて増幅したハプロタイプである。次いで、この部分は、帰無仮説、すなわちハプロタイプ用量不平衡の不在、および代替的な仮説、すなわちハプロタイプ用量不平衡の存在に基づき構築される２つの閾値（上限および下限の閾値）と比較する。部分が上限の閾値を超す場合、血漿中の２ハプロタイプの統計的有意な不平衡の存在を示す。部分が下限の閾値未満の場合、２ハプロタイプの統計的有意な不平衡の不在を示す。部分が上限の閾値と下限の閾値との間の場合、結論を下す上で十分な統計的検出力がないことを示す。分析する領域の異型接合の遺伝子座数の漸増は、順調なＳＰＲＴ分類を作製できるまで実施され得る。

ＳＰＲＴの上限の境界および下限の境界を算出する方程式は、
上限の閾値＝［（ｌｎ８）／Ｎ−ｌｎδ］／ｌｎγ；下限の閾値＝［（ｌｎ１／８）／Ｎ−ｌｎδ］／ｌｎγであり、式中、

および

であり、θ_１は対立遺伝子の不平衡が血漿に存在する場合に潜在的に過剰発現したハプロタイプからの配列したタグの推定部分であり、θ_２は対立遺伝子の不平衡が存在しない場合の任意の２ハプロタイプの推定部分、すなわち０．５であり、ＮはＨａｐＩとＨａｐＩＩの配列したタグ総数であり、ｌｎは自然対数、すなわちｌｏｇ_ｅを表す数学記号である。θ_１は、血漿試料に存在するものと予期される（または存在することが既知である）腫瘍由来ＤＮＡの分画濃度（Ｆ）に依存する。

ＬＯＨのシナリオにおいて、θ_１＝１／（２−Ｆ）である。単対立遺伝子増幅のシナリオにおいて、θ_１＝（１＋ｚＦ）／（２＋ｚＦ）である（式中ｚは、腫瘍中で増幅する染色体領域の余剰コピー数を示す）。例えば、１つの染色体が複製される場合、特定の染色体の１余剰コピーがあることになる。次いで、ｚは１と等しい。

図７は、本発明の実施形態による、腫瘍組織中の単対立遺伝子の増幅を示す染色体１ｐに位置する断片に対するＨＣＣ患者の血漿ＤＮＡのＲＨＤＯ分析を示す。緑色三角は患者データを表す。分析するＳＮＰ数が増大するにつれ、配列したリード総数は増大した。腫瘍中の増幅したハプロタイプからの配列したリードの総数の部分は、分析する配列したリード総数が増加するにつれて変わり、最終的に上限の閾値を超す値に達した。これは、有意なハプロタイプ用量不平衡を示し、それゆえ、血漿中にこの癌関連染色体異常が存在することを支持する。

腫瘍組織中で増幅および欠失を示すＨＣＣ患者のすべての染色体領域において、ＳＰＲＴを用いたＲＨＤＯ分析を実施した。結果は、ＬＯＨを有することが既知である９２２断片および増幅を有することが既知である１０５断片において以下のとおりである。ＬＯＨについて、９２２断片をＳＰＲＴに分類し、血漿中にハプロタイプ用量不平衡を有するものとして断片９２１を正確に同定し、精度９９．９９％を得た。単対立遺伝子増幅において、１０５断片をＳＰＲＴに分類し、血漿中にハプロタイプ用量不平衡を有するものとして断片１０５を正確に同定し、精度１００％を得た。

Ｃ．相対的ハプロタイプサイズ分析
２ハプロタイプに整列された断片用量の代替的な計数法として、それぞれのハプロタイプの断片サイズを使用することができる。例えば、特定の染色体領域において、あるハプロタイプ由来のＤＮＡ断片サイズを他のハプロタイプのＤＮＡ断片サイズと比較することができる。あるものは、領域の第１ハプロタイプの異型接合の遺伝子座で任意の対立遺伝子に対応するＤＮＡ断片サイズ分布を分析して、それを第２ハプロタイプの異型接合の遺伝子座で任意の対立遺伝子に対応するＤＮＡ断片サイズ分布と比較することができる。サイズ分布の統計的有意差は、計数でできる方法と同様に、異常を同定するために使用することができる。

総（すなわち腫瘍＋非腫瘍）血漿ＤＮＡのサイズ分布は、癌患者中で増大することが報告されている（ＷａｎｇＢＧ，ｅｔａｌＣａｎｃｅｒＲｅｓ．２００３；６３：３９６６−８）。しかしながら、あるものが（総（すなわち腫瘍＋非腫瘍）ＤＮＡ量の代わりに）特に腫瘍由来ＤＮＡについて研究している場合、腫瘍由来ＤＮＡ分子のサイズ分布は、非腫瘍細胞に由来する分子でより短いことが観察されている（Ｄｉｅｈｌｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００５；１０２：１６３６８−７３）。したがって、循環ＤＮＡのサイズ分布は、癌関連染色体異常が存在するかどうかを決定するために使用することができる。サイズ分析の原理を図８に示す。

図８は、本発明の実施形態による、欠失を含む腫瘍が存在する場合の染色体領域の２ハプロタイプにおける断片サイズ分布変化を示す。図８に例証するように、Ｔ対立遺伝子は、腫瘍組織中で欠失している。その結果、腫瘍組織は、血漿中へＡ対立遺伝子の短い分子のみ放出する。腫瘍由来の短いＤＮＡ分子は、血漿中のＡ対立遺伝子のためのサイズ分布の全体的な短縮に至り、それゆえ、血漿中のＴ対立遺伝子と比較してＡ対立遺伝子のより短いサイズ分布に至る。先の項目で論じたように、同一ハプロタイプ上に位置する対立遺伝子はすべて共に分析することができる。換言すれば、あるハプロタイプ上に位置する対立遺伝子を保因するＤＮＡ分子のサイズ分布は、他のハプロタイプ上の対立遺伝子を保因するＤＮＡ分子のサイズ分布と比較することができる。腫瘍組織中の欠失ハプロタイプは、血漿中のより長いサイズ分布を示す。

サイズ分析はまた、癌関連染色体領域の増幅を検出するためにも適用できる。図９は、本発明の実施形態による、増幅を含む腫瘍が存在する場合、染色体領域の２ハプロタイプにおける断片サイズ分布変化を示す。図９に示す実施例において、対立遺伝子Ｔを保因する染色体領域が腫瘍中に複製される。その結果、Ｔ対立遺伝子を保因する増量した短いＤＮＡ分子は血漿中に放出され、それゆえＴ対立遺伝子のサイズ分布は、結果的にＡ対立遺伝子のサイズ分布と比較して全体的に短縮される。サイズ分析を適用して、同一ハプロタイプ上に位置する対立遺伝子をすべてまとめることができる。換言すれば、腫瘍組織中で増幅したハプロタイプのサイズ分布は、腫瘍中で増幅しないハプロタイプのサイズ分布より短いことになる。

循環ＤＮＡのサイズ分布短縮の検出
２ハプロタイプ、すなわちＨａｐＩおよびＨａｐＩＩから生じるＤＮＡ断片サイズは、対末端大規模並列シークエンシングによって決定することができるが、これに限定されない。ＤＮＡ断片の端のシークエンシング後、配列したリード（タグ）を基準ヒトゲノムに整列することができる。配列したＤＮＡ分子サイズは、各端の最外ヌクレオチド配位から推定することができる。分子の配列したタグは、配列したＤＮＡ断片がＨａｐＩまたはＨａｐＩＩから生じたかどうかを決定するために使用することができる。例えば、配列したタグの１つは、分析する染色体領域に異型接合の遺伝子座を含み得る。

したがって、配列した分子のそれぞれにおいて、我々はサイズと、ＨａｐＩまたはＨａｐＩＩから生じているかどうかとの両方を決定することができる。各ハプロタイプに整列された断片サイズに基づき、コンピュータシステムは、ＨａｐＩおよびＨａｐＩＩの両サイズ分布プロファイル（例えば平均断片サイズ）を算出できる。ＨａｐＩとＨａｐＩＩ由来のＤＮＡ断片サイズ分布は、異常を同定する上で十分にサイズ分布が異なる時点を決定するために適切な統計的分析を用いて比較することができる。対末端大規模並列シークエンシングとは別に、ＤＮＡ断片サイズを決定するために、全ＤＮＡ断片のシークエンシング、質量分析、および標準と観察されたＤＮＡ分子長を観察して比較する視覚的な方法が挙げられるが、これらに限定されない他の方法を使用することができる。

次に、我々は腫瘍の遺伝子異常に関連する短い循環ＤＮＡの２つの検出方法例を紹介する。これら２方法は、ＤＮＡ断片の２集団のサイズ分布差の定量的測定値を得ることを目的とする。ＤＮＡ断片の２集団は、ＨａｐＩとＨａｐＩＩに対応するＤＮＡ分子を指す。

短いＤＮＡ断片の部分差
１つの遂行では、短いＤＮＡ断片の部分を使用する。あるものは、カットオフサイズ（ｗ）を短いＤＮＡ分子を定義するものとして設定する。カットオフサイズは変わることができ、異なる診断目的に適合するように選択することができる。コンピュータシステムは、サイズカットオフ以下の分子数を決定することができる。次いで、ＤＮＡ断片の部分（Ｑ）は、短いＤＮＡ数をＤＮＡ断片総数で割ることによって算出できる。Ｑ値は、ＤＮＡ分子集団のサイズ分布による影響を受ける。短い全体のサイズ分布は、ＤＮＡ分子の高い割合が短い断片であり、したがって、高いＱ値が得られることを示す。

次いで、ＨａｐＩとＨａｐＩＩ間の短いＤＮＡ断片の部分の差を使用することができる。ＨａｐＩ由来とＨａｐＩＩ由来とのＤＮＡ断片サイズ分布差は、ＨａｐＩとＨａｐＩＩとにおける短い断片の部分の差（ΔＱ）によって反映することができる。ΔＱ＝Ｑ_ＨａｐＩ−Ｑ_{ＨａｐＩＩ}（式中、Ｑ_ＨａｐＩはＨａｐＩＤＮＡ断片の短い断片の部分であり、かつＱ_{ＨａｐＩＩ}は、ＨａｐＩＩＤＮＡ断片の短い断片の部分である）。Ｑ_ＨａｐＩおよびＱ_{ＨａｐＩＩ}は、各ハプロタイプ由来の断片サイズ分布の２群の統計値例である。

先の項目における例証として、腫瘍組織中ＨａｐＩＩが欠失している場合、ＨａｐＩＤＮＡ断片サイズ分布は、ＨａｐＩＩＤＮＡ断片より短いことになる。その結果、正のΔＱ値が観察されることになる。正のΔＱ値は、閾値と比較して、欠失が存在しているとみなす上で十分にΔＱが大きいかどうかを決定することができる。ＨａｐＩの増幅はまた、正のΔＱ値も示す。腫瘍組織中にＨａｐＩＩの複製がある場合、ＨａｐＩＩＤＮＡ断片サイズ分布は、ＨａｐＩＤＮＡ断片より短いことになる。それゆえ、ΔＱ値は負となることになる。染色体異常の不在下、血漿／血清中のＨａｐＩとＨａｐＩＩＤＮＡ断片サイズ分布は類似する。それゆえ、ΔＱ値はほぼ０である。

患者のΔＱは、正常個体と比較して値が正常であるかどうかを決定することができる。さらにまたはあるいは、患者のΔＱ値は、類似した癌の患者から得られた値と比較して値が異常であるかどうかを決定することができる。かかる比較は、本明細書に記載の閾値との比較（１つまたは複数）に関与する可能性がある。疾患モニタリングの状況において、ΔＱ値は、経時的に連続してモニタリングできる。ΔＱ値の変化は、血漿／血清中の腫瘍ＤＮＡの増大した分画濃度を示し得る。この技術の選択された遂行では、腫瘍ＤＮＡの分画濃度は、腫瘍病期、疾患の前兆および進行と相関する可能性がある。異なる時点での測定値を用いたかかる遂行について、後に詳細に論じる。

短いＤＮＡ断片に寄与する全長の部分差
この遂行では、短いＤＮＡ断片によって寄与される全長の部分を使用する。コンピュータシステムは、（例えば所与の領域の特定のハプロタイプ由来の断片または所与の領域由来のみである）試料中ＤＮＡ断片群の全長を決定することができる。これ未満は「短い断片」として定義されるＤＮＡ断片カットオフサイズ（ｗ）を選択することができる。カットオフサイズは変わる可能性があり、異なる診断目的に適合するように選択することができる。次いで、コンピュータシステムは、カットオフサイズ以下のＤＮＡ断片のランダムな選択の長さを積算することによって短いＤＮＡ断片の全長を決定することができる。短いＤＮＡ断片によって寄与された全長の部分は、次いで、Ｆ＝Σ^ｗ長さ／Σ^Ｎ長さ（式中、Σ^ｗ長さは、長さｗ（ｂｐ）以下のＤＮＡ断片の合計した長さを示し、かつΣ^Ｎ長は、所定の長さＮ以下のＤＮＡ断片の合計した長さを示す）に従い算出できる。１つの実施形態では、Ｎは６００塩基である。しかしながら、「全長」を算出するために、他のサイズ限界、例えば１５０塩基、１８０塩基、２００塩基、２５０塩基、３００塩基、４００塩基、５００塩基および７００塩基を使用することができる。

イルミナゲノム分析器システムは、６００塩基より長いＤＮＡ断片の増幅およびシークエンシングに効果的ではないため、６００塩基値以下を選択し得る。さらに、分析を６００塩基未満のＤＮＡ断片に限定することはまた、ゲノムの構造的多型から生じるバイアスを回避することもできる。サイズが基準ゲノムにＤＮＡ断片端をマッピングすることによって生物情報工学的に推定される場合、構造的多型、例えば、再配列（ＫｉｄｄＪＭｅｔａｌ，Ｎａｔｕｒｅ２００８；４５３：５６−６４）の存在下でＤＮＡ断片サイズは過大評価する可能性がある。さらに、成功裏に配列して基準ゲノムにマッピングした全ＤＮＡ断片の＞９９．９％が６００塩基未満であるため、６００塩基以下の長さの断片をすべて含むことによって、試料中のＤＮＡ断片サイズ分布の代表的な推定が得られる。

したがって、ＨａｐＩとＨａｐＩＩとの間の短いＤＮＡ断片によって寄与された全長の部分差を使用することができる。ＨａｐＩおよびＨａｐＩＩＤＮＡ断片間のサイズ分布の摂動化は、それらのＦ値の差によって反映することができる。ここで我々は、Ｆ_ＨａｐＩおよびＦ_{ＨａｐＩＩ}をそれぞれＨａｐＩおよびＨａｐＩＩに対する短いＤＮＡ断片によって寄与された全長の部分として定義する。ＨａｐＩとＨａｐＩＩとの間の短いＤＮＡ断片の全長の部分差（ΔＦ）は、ΔＦ＝Ｆ_ＨａｐＩ−Ｆ_{ＨａｐＩＩ}として算出できる。Ｆ_ＨａｐＩおよびＦ_{ＨａｐＩＩ}は、各ハプロタイプ由来の断片サイズ分布２群の統計値例である。

先の項目に例証した実施形態に類似して、腫瘍組織中のＨａｐＩＩの欠失は、ＨａｐＩＤＮＡ断片サイズ分布のＨａｐＩＩＤＮＡ断片と比較した明らかな短縮につながる。これはΔＦの正値につながる。ＨａｐＩＩが複製される場合、負のΔＦ値が観察されることになる。染色体異常の不在下、ΔＦ値はほぼ０である。

患者のΔＦ値は、正常個体と比較して、値が正常であるかどうかを決定することができる。患者のΔＦ値は、類似した癌の患者から得られた値と比較して、値が異常であるかどうかを決定することができる。かかる比較は、本明細書に記載の閾値との比較（１つまたは複数）に関与する可能性がある。疾患モニタリングの状況において、ΔＱ値は、連続的にモニタリングできる。ΔＦ値の変化は、血漿／血清中の腫瘍ＤＮＡの増大した分画濃度を示し得る。

Ｄ．一般的方法
図１０は、本発明の実施形態による、染色体領域が欠失または増幅を示すかどうかを決定する生物の生体試料のハプロタイプの分析方法を例証するフローチャートである。生体試料は、正常細胞に由来し、潜在的に癌関連細胞に由来する核酸分子（断片とも呼ばれる）を含む。これらの分子は、試料中で細胞を含まない場合がある。生物は、複数の染色体コピー、すなわち、少なくとも二倍体生物を有する任意のタイプとすることができるが、より高倍数体の生物を含むことができる。

この方法および本明細書に記載の他の任意の方法の１つの実施形態では、生体試料は、細胞を含まないＤＮＡ断片を含む。本願に記載の異なる方法を例証するために血漿ＤＮＡ分析を使用しているが、これらの方法は、正常および腫瘍由来ＤＮＡの混合物を含む試料中の腫瘍関連染色体異常を検出するためにも適用できる。他の試料タイプとしては、唾液、裂傷、胸膜流体、腹水、胆液、尿、血清、膵液、大便および子宮頸管スミア試料が挙げられる。

１０１０工程では、第１および第２ハプロタイプは、生物の正常細胞の第１染色体領域において決定される。ハプロタイプは、任意の適切な方法（本明細書に記載の方法等）によって決定することができる。染色体領域は、任意の方法、例えば、本明細書に記載の方法によって選択し得る。第１染色体領域は、異型接合している第１の複数の遺伝子座（例えば、領域４１０の遺伝子座４２０）を含む。異型接合の遺伝子座（異性）は互いに離れていてもよく、例えば、遺伝子座は、第１の複数の遺伝子座の別の遺伝子座と５００または１０００塩基（以上）離れていることができる。他の異性は、第１染色体領域に存在し得るが、使用されない。

１０２０工程では、生体試料中の複数の核酸分子は、各分子の位置および対立遺伝子に関して特性決定される。例えば、生物の基準ゲノムにおける核酸分子の位置を同定することができる。この位置付けは、分子シークエンシングを実施して（例えばユニバーサルシークエンシングを介して）、分子の１つまたは２つ（対末端）の配列したタグを得て、次いで配列したタグ（１つまたは複数）を基準ゲノムに整列することを含む様々な方法で実施することができる。かかる整列は、塩基局所整列検索ツール（ＢＬＡＳＴ）等のツールを用いて実施することができる。位置は、染色体群中の番号で同定することができる。断片が由来するハプロタイプがどれかを決定するために、１つの異型接合の遺伝子座（異性）の対立遺伝子を使用することができる。

１０３０工程では、核酸分子の第１群を、同定した位置および決定した対立遺伝子に基づき第１ハプロタイプ由来と同定する。例えば、対立遺伝子Ａを有する図４の遺伝子座４２１を含む断片を、ＨａｐＩ由来と同定することになる。第１群は、第１の複数の遺伝子座のそれぞれで位置する少なくとも１つの核酸分子を含むことによって、第１染色体領域にわたることができる。

１０４０工程では、核酸分子の第２群を、同定した位置および決定した対立遺伝子に基づき第２ハプロタイプ由来と同定する。例えば、対立遺伝子Ｔを有する図４の遺伝子座４２１を含む断片を、ＨａｐＩＩ由来と同定することになる。第２群は、第１の複数の遺伝子座のそれぞれで位置する少なくとも１つの核酸分子を含む。

１０５０工程では、コンピュータシステムは、核酸分子の第１群の第１値を算出する。第１値は第１群の核酸分子の特性を決定する。第１値の例としては、第１群における分子数のタグ数および第１群における分子のサイズ分布が挙げられる。

１０６０工程では、コンピュータシステムは、核酸分子の第２群の第２値を算出する。第２値は第２群の核酸分子の特性を決定する。

１０７０工程では、第１値を第２値と比較し、第１染色体領域が欠失または増幅を示すかどうかの分類を決定する。欠失または増幅の存在の分類によって、癌関連細胞を有する生物に関する情報を得ることができる。比較例としては、本明細書に記載のように、２値の差もしくは比率の取得、ならびに結果と１つもしくは複数の閾値との比較が挙げられる。例えば、比率は、ＳＰＲＴ分析における閾値と比較することができる。分類例は、正（すなわち検出した増幅または欠失）、負、および未分類、ならびに各種の正負度（例えば、１〜１０の整数、または０〜１の実数の使用）を含むことができる。増幅は、単純な複製を含むことができる。かかる方法は、腫瘍ＤＮＡ、および前癌病巣、すなわち癌の前駆体由来のＤＮＡを含む癌関連核酸の存在を検出することができる。

Ｅ．深さ
分析の深さとは、特定の精度内で分類または他の決定を得るために分析する必要がある分子量を指す。１つの実施形態では、深さは、既知の異常に基づき算出し得、次いで、当該深さを有する測定および分析を実施し得る。別の実施形態では、分析は、分類するまで継続し得、分類する深さは、癌レベル（例えば、癌病期または腫瘍サイズ）を決定するために使用することができる。以下に、深さに関与する一部の算出例を提供する。

偏差は、本明細書に記載の任意の差または比率を指すことができる。例として、偏差は、第１値と第２値との間であることも、または本明細書に記載の閾値もしくは腫瘍濃度由来の変数とすることもできる。偏差が二重の場合、測定する必要がある断片数は１／４低下する。より一般に、偏差がＮ倍増大する場合、測定する必要がある断片数は１／Ｎ^２である。命題として、偏差が１／Ｎ低下する場合、試験する断片数はＮ^２増加する。Ｎは実数とすることも整数とすることもできる。

腫瘍ＤＮＡが試料（例えば血漿）１０％である症例を想定すると、一千万個の断片のシークエンシングから統計的有意差が見られると推定される。例えば、ここで、富化手順は、試料中に２０％の腫瘍ＤＮＡがあり、次いで、必要な断片数が２，５００，０００断片となるように実施する。このような形で、深さは、試料中の腫瘍ＤＮＡパーセンテージに相関することができる。

増幅量はまた、深さにも影響を及ぼす。当該領域の２倍のコピー量（例えば正常２個に対して４個）を有する領域において、Ｘ断片数を分析する必要があるものと仮定する。領域が正常コピーの４倍量を有する場合、この領域は、Ｘ／４量の断片を必要とする。

Ｆ．閾値
標準値からの変数の偏差量（例えば各ハプロタイプ値の差または比率）は、上記のように診断を得るために使用することができる。例えば、偏差は、領域の一方のハプロタイプ断片の平均サイズと、もう一方のハプロタイプ断片の平均サイズとの差であり得る。偏差がある量（例えば、正常試料および／または領域から決定される閾値）を超える場合、欠失または増幅が同定される。しかしながら、閾値を超える範囲も参考にすることができ、これはそれぞれ異なる癌レベルに対応する複数の閾値として使用につながる。例えば、正常より高い偏差からどの癌病期にあるかを得ることができる（例えば第４病期の不平衡度は第３病期の不平衡度より高い）。より高い偏差はまた、大型であるために多くの断片を放出するおよび／または領域が何倍も増幅している腫瘍に起因している可能性もある。

異なる癌レベルが得られる他に、各種閾値によって、異常を伴う領域または特定の領域を効率的に検出することもできる。例えば、あるものは、主に３倍以上の増幅を追及する高閾値を設定し、１ハプロタイプの欠失より大きな不平衡を得ることができる。領域の２コピーの欠失も検出することができる。また、低閾値は、異常を有し得る領域を同定するために使用することができ、次いで、これらの領域をさらに分析して、異常の有無および位置を確認することができる。例えば、二分探索（または八分木等の高分探索）を、高閾値を用いた階層の低層で実施することができる。

図１１は、本発明の実施形態による、欠失領域を決定するための血漿中で行なわれた測定値と共に癌細胞内で欠失している副領域１１３０を伴う領域１１１０を示す。染色体領域１１１０は、本明細書に記載の任意の方法（ゲノムを均一サイズの断片に分割する等）によって選択し得る。図１１はさらに、各遺伝子座１１２０の対立遺伝子数を示す。領域１１４０（正常領域）および領域１１３０（欠失領域）のそれぞれにおいて総累積も維持される。

領域１１１０を分析用に選択する場合、累積数はＨａｐＩに対して２５８、ＨａｐＩＩに対して２４０であり、１１遺伝子座において１８差となる。かかる差は、総数パーセンテージとして、欠失した副領域１１３０のみを分析する場合より小さい。これは、領域１１１０の約半分が正常であり、癌細胞内の副領域１１３０はすべて欠失しているため道理にかなっている。したがって、使用する閾値に応じて領域１１１０内の異常が見逃される可能性がある。

副領域の欠失を検出するため、実施形態は、比較的広い領域の低閾値を使用することができる（本実施例において、領域１１１０は、同定する欠失領域サイズより比較的大きいと考えられる）。低閾値はより多くの領域を同定し、これは一部の偽陽性を含むが、偽陰性を低減する。ここで、偽陽性は、さらなる分析を介して除去することができ、これはまた異常を突き止めることもできる。

領域をさらなる分析用にフラグ化後、さらなる分析用に領域を副領域に分割することができる。図１１において、あるものは１１個の遺伝子座を（例えば、二分木を用いて）半分に分割して、６つの遺伝子座の副領域１１４０および５つの遺伝子座をともなう副領域１１３０を得ることができる。これらの領域は、同一閾値以上の厳しい閾値で分析できる。次いで、本実施例において、副領域１１４０は正常と同定し、副領域１１３０は欠失または増幅を含むと同定する。このような形で、異常を有しないものとしてより大きい領域を却下することができ、高信頼で（例えば、より高い閾値を用いて）異常を示す副領域を同定するために疑わしい領域（低閾値を超す領域）のさらなる分析に時間を費やすことができる。本明細書においてＲＨＤＯを使用したが、サイズ技術も等しく適応可能である。

第1のレベルの探索のための領域サイズ（および低分木レベルの副領域サイズ）を、検出する異常サイズに基づき選択することができる。癌は、１０ＭＢ長の異常を伴う１０領域を示すことが見出されている。患者はまた、異常を示す１００ＭＢ領域も有している。癌の後期は、より長い異常部分を有し得る。

Ｇ．領域内の異常位置の精練
前の項目において、探索木に基づく領域の副領域への分割を論じた。ここで、我々は副領域を分析する他の方法について論じ、領域内の異常を突き止める。

図１２は、本発明の実施形態による、ＲＨＤＯ分析を用いた異常位置のマッピング方法を示す。染色体領域は、ＨａｐＩとＨａｐＩＩで標識した非癌細胞のハプロタイプで水平に示す。癌細胞内のＨａｐＩＩの欠失領域はＬＯＨで標識する。

図示のように、ＲＨＤＯ分析は、仮説染色体領域１２０２の左側から開始して右側方向に行なわれる。各矢印は、断片のＲＨＤＯ分類を示す。各断片は、断片自体の領域、具体的には、より広い領域の異性の一部を有する副領域とみなすことができる。ＲＨＤＯ分類断片サイズは、分類を決定できる前の遺伝子座の数（および遺伝子座位）に依存する。各ＲＨＤＯ断片に含まれる遺伝子座の数は、各断片において分析する分子数、所望精度（例えばＳＰＲＴ分析におけるオッズ比）、および試料中の腫瘍由来ＤＮＡの分画濃度に依存する。図４および図５に例証した実施例として２ハプロタイプ間に統計的有意差が存在するかどうかを決定する上で分子数が適している場合に、分類を行なう。

各色つきの水平矢印は、ＤＮＡ試料中にハプロタイプ用量不平衡がないことを示すＲＨＤＯ分類断片を示す。腫瘍中ＬＯＨを伴わない領域内で、６つのＲＨＤＯ分類を行ない、それぞれハプロタイプ用量不平衡がないことを示す。次のＲＨＤＯ分類断片１２１０は、ＬＯＨを伴うおよび伴わない領域間１２０５接合と交差する。図１２の下部にて、ＲＨＤＯ断片１２１０のＳＰＲＴ曲線を示す。黒色垂直矢印は、ＬＯＨを伴う領域と伴わない領域との間の接合を示す。ＬＯＨを伴う領域からの増大データが蓄積すると共に、この断片のＲＨＤＯの分類はハプロタイプ用量不平衡の存在を示す。

各白色水平矢印は、ハプロタイプ用量不平衡が存在することを示すＲＨＤＯ分類断片を示す。右側の連続する４つのＲＨＤＯはまた、ＤＮＡ試料中のハプロタイプ用量不平衡の存在も示す。ＬＯＨを伴うおよび伴わない領域間の接合の位置は、ＲＨＤＯ分類の変化、すなわちハプロタイプ用量不平衡の存在から不在またはその逆変化を示す第１ＲＨＤＯ断片以内と推定することができる。

図１３は、本発明の実施形態による、別方向から開始したＲＨＤＯ分類を示す。図１３において、両方向からのＲＨＤＯ分類を示す。左側から開始するＲＨＤＯ分析から、ＬＯＨを伴うおよび伴わない領域間の接合は、ハプロタイプ用量不平衡の存在を示す第１ＲＨＤＯ断片１３１０以内と推定することができる。右側から開始するＲＨＤＯ分析から、接合は、ハプロタイプ用量不平衡は存在しないと示唆される第１ＲＨＤＯ断片１３２０以内と推定することができる。２方向に実行されるＲＨＤＯ分析の情報を統合し、ＬＯＨを伴うおよび伴わない領域間の接合位置１３３０を推定することができる。

ＩＶ．異常の非特異的ハプロタイプ検出
ＲＨＤＯ方法は、異型接合の遺伝子座の使用に依存する。ここで、二倍体生物の染色体は、２ハプロタイプをもたらす一部の差を有するが、異型接合の遺伝子座の数は変わる可能性がある。一部の個体は、比較的少ない異型接合の遺伝子座を有し得る。この項目に記載の実施形態は、２領域を比較して同種接合であり、同一領域の２ハプロタイプではない遺伝子座にも使用することができる。したがって、いくつかの欠点が２つの異なる染色体領域との比較から存在し得るが、より多くのデータポイントが得られ得る。

相対的染色体領域用量方法において、（例えば、当該領域に整列された配列したタグの計数によって決定した）１染色体領域由来の断片数を、（基準染色体領域由来であっても健常と知られている別試料の同一領域であってもよい）予想値と比較する。このような形で、配列したタグがどのハプロタイプに由来するかに関わらず断片の染色体領域を算出することになる。したがって、異性を含まない配列したタグを依然として使用することができる。比較を行なうため、実施形態は、比較前にタグ数を正規化できる。各領域は、（互いに離れた）少なくとも２つの遺伝子座によって定義し、これら遺伝子座での断片を使用して領域に関する集合的な値を得ることができる。

特定領域における配列したリード（タグ）の正規化した値は、その領域に整列された配列したリード数を完全ゲノムに整列可能な配列したリード総数で割ることによって算出することができる。この正規化したタグ数によって、１つの試料からの結果を別の試料の結果と比較できる。例えば、正規化された値は、上述のように、特定領域由来であると予想される配列したリード率（例えば、パーセンテージまたは分数）とすることができる。しかしながら、当業者に明らかであるように他の多くの正規化が可能である。例えば、あるものは、１領域数を基準領域数で割ることによって標準化できる（上の症例では、基準領域は、単に完全ゲノムである）。次いで、この正規化タグ数は、癌を示さない１つまたは複数の基準試料から決定し得る閾値と比較されてもよい。

次いで、研究症例の正規化したタグ数を、１つまたは複数の基準対象、例えば癌を呈さない者の正規化したタグ数と比較する。１つの実施形態では、比較は、特定の染色体領域における症例のｚ−スコアを算出することによって行なう。ｚ−スコアは、以下の方程式：ｚ−スコア＝（症例の正規化したタグ数−平均）／Ｓ．Ｄ．（式中、「平均」は、基準試料において特定の染色体領域に整列された平均の正規化したタグ数であり；およびＳ．Ｄ．は基準試料において特定領域に整列された正規化したタグ数の標準偏差である）を用いて算出する。それゆえ、ｚ−スコアは、研究症例の染色体領域の正規化したタグ数が１つまたは複数の基準対象の同染色体領域において平均の正規化したタグ数から離れている標準偏差の数である。

検査した生物が癌を有する状況において、腫瘍組織中で増幅される染色体領域は、血漿ＤＮＡ中で過剰発現することになる。これは、ｚ−スコア値に正値をもたらすことになる。他方、腫瘍組織中に欠失している染色体領域は、血漿ＤＮＡ中で不足発現する。これは、ｚ−スコア値に負値をもたらすことになる。ｚ−スコアの等級は、いくつかの要因によって決定される。

１要因は、生体試料（例えば血漿）中の腫瘍由来ＤＮＡの分画濃度である。試料（例えば血漿）中の腫瘍由来ＤＮＡの分画濃度が高いほど、研究症例の正規化したタグ数と基準症例間の差が開く。それゆえ、ｚ−スコアの等級はより大きくなる。

別の要因は、１つまたは複数の基準症例における正規化したタグ数の多型である。研究症例の生体試料（例えば血漿）中の染色体領域の同程度の過剰発現と共に、基準群の正規化したタグ数の多型が小さい（すなわち標準偏差が小さい）と、より高いｚ−スコアをもたらすことになる。同様に、研究症例の生体試料（例えば血漿）中の染色体領域の同程度の不足発現と共に、基準群の正規化したタグ数の標準偏差が小さいほど、より負のｚ−スコアをもたらすことになる。

別の要因は、腫瘍組織中の染色体異常の等級である。染色体異常の等級とは、特定の染色体領域（獲得または喪失のいずれか）におけるコピー数変化を指す。腫瘍組織中のコピー数変化が高いほど、血漿ＤＮＡ中の特定の染色体領域の過剰発現度または不足発現度は高い。例えば、染色体の両コピーの喪失は、２つの染色体コピーのうちの１つの喪失より血漿ＤＮＡ中の染色体領域の高い不足発現をもたらし、それゆえ、より負のｚ−スコアをもたらす。典型的には、癌中に複数の染色体異常がある。各癌における染色体異常はさらにその本質（すなわち増幅または欠失）、程度（単一または複数のコピーの獲得または喪失）および範囲（染色体の長さの点から見た異常サイズ）によって変わる可能性がある。

正規化したタグ数の測定精度は、分析する分子数による影響を受ける。我々は、分画濃度が約１２．５％、６．３％および３．２％である場合、１つのコピー変化（獲得または喪失のいずれか）を伴う染色体異常を検出するためにそれぞれ１５，０００、６０，０００および２４０，０００分子を分析する必要があるものと予期する。異なる染色体領域における癌の検出のためのタグ計数に関するさらなる詳細については、Ｌｏらによる「大規模並列ゲノムシークエンシングを用いた胎児染色体の異数性診断（ＤｉａｇｎｏｓｉｎｇＦｅｔａｌＣｈｒｏｍｏｓｏｍａｌＡｎｅｕｐｌｏｉｄｙＵｓｉｎｇＭａｓｓｉｖｅｌｙＰａｒａｌｌｅｌＧｅｎｏｍｉｃＳｅｑｕｅｎｃｉｎｇ）」と題された米国特許公開第２００９／００２９３７７号（その内容全体は、すべての目的で参照によって本明細書に組み込まれる）に記載されている。

実施形態は、タグ計数法の代わりにサイズ分析も使用することができる。正規化したタグ数の代わりに、サイズ分析も使用し得る。サイズ分析は、本明細書および米国特許第１２／９４０，９９２号に記載されるように様々な変数を使用することができる。例えば、上記Ｑ値を使用してもＦ値を使用してもよい。これらの値はリード数で測らないため、かかるサイズ値は他の領域からの計数による正規化を必要としない。ハプロタイプ特異的方法の技術は、非特異的方法にも同様に使用することができる。例えば、領域の深さおよび精練に関与する技術を使用し得る。いくつかの実施形態では、２領域を比較時に特定領域のＧＣバイアスを考慮することができる。ＲＨＤＯ方法は同じ領域を用いるため、かかる補正は必要ではない。

Ｖ．複数の領域
ある癌は典型的には特定の染色体領域に異常を伴い存在する可能性があるが、かかる癌は必ずしも同一領域のみに存在しない。例えば、追加の染色体領域は、異常を示す可能性があり、かかる追加領域の位置は未知である場合がある。さらに、早期癌を同定するために患者をスクリーニングする場合、あるものは、広範囲の癌を同定することを望む場合があり、これはゲノム全体に存在する異常を示す可能性がある。これらの状態に対応するため、実施形態は、どの領域が異常を示すかを決定する系統的な形式で複数の領域を分析することができる。異常の数およびそれらの位置（例えばそれらが連続的であるかどうか）を使用して、例えば、異常を確認し、癌病期を決定し、癌の診断を行ない（例えば数が閾値を超す場合）、ならびに異常を示す様々な領域の数および位置に基づき予後を得ることができる。

したがって、実施形態は、異常を示す領域数に基づき生物が癌を有するかどうかを同定することができる。したがって、あるものは複数（例えば、３０００）の領域を試験して異常を示すいくつかの領域を同定することができる。領域は、完全ゲノムを網羅してもよいし、一部のみのゲノム、例えば、非反復領域を網羅してもよい。

図１４は、本発明の実施形態による、複数の染色体領域を用いて生物の生体試料を分析する方法１４００のフローチャートである。生体試料は、核酸分子（断片とも呼ばれる）を含む。

１４１０工程では、生物の複数の重複しない染色体領域を同定する。各染色体領域は、複数の遺伝子座を含む。上述のように、領域は、１Ｍｂサイズであることも、他の一部の同等サイズであることもできる。次いで、完全ゲノムは、それぞれ所定のサイズおよび位置の約３，０００領域を含むことができる。また、上述のように、かかる所定の領域は、使用する特定の染色体の長さもしくは特定数の領域、ならびに本明細書に記載の他の任意の基準に適するように変更することができる。領域が異なる長さを有する場合、かかる長さは、例えば、本明細書に記載のように、結果を正規化するために使用することができる。

１４２０工程では、生物の基準ゲノムにおける核酸分子の位置を、複数の核酸分子のそれぞれに対して同定する。位置は、本明細書に記載の任意の方法、例えば、配列したタグを得るための断片のシークエンシングおよび基準ゲノムへの配列したタグの整列によって決定し得る。分子の特定のハプロタイプは、ハプロタイプ特異的方法においても決定することができる。

１４３０〜１４５０工程は、各染色体領域において実施される。１４３０工程では、核酸分子の各群を、同定した位置に基づき染色体領域由来と同定する。各群は、染色体領域の複数の遺伝子座のそれぞれで位置する少なくとも１つの核酸分子を含む。１つの実施形態では、例えば、上記のＲＨＤＯ方法のように、群は、染色体領域の特定のハプロタイプに整列された断片とすることができる。別の実施形態では、群は、ＩＶ項に記載の方法のように染色体領域に整列された任意の断片とすることができる。

１４４０工程では、コンピュータシステムは、核酸分子の各群の各値を算出する。各値は、各群の核酸分子の特性を定義する。各値は、本明細書に記載の任意の値とすることができる。例えば、値は、群の断片数または群の断片サイズ分布の統計値とすることができる。各値はまた、正規化した値、例えば、試料のタグ数の総番号または基準領域のタグ数番号のために分割した領域のタグ数とすることもできる。各値は、別の値（例えば、ＲＨＤＯにおいて）からの差とすることも、または比率とすることもでき、それによって、領域差の特性を提供することができる。

１４５０工程では、各値を基準値と比較して、第１染色体領域が欠失を示すか、または増幅を示すかの分類を決定する。この基準値は、本明細書に記載の任意の閾値または基準値とすることができる。例えば、基準値は正常試料のために決定された閾値とすることができる。ＲＨＤＯにおいて、各値は、２ハプロタイプのタグ数の差または比率とすることができ、基準値は、統計的有意な偏差が存在することを決定する閾値とすることができる。別の例では、基準値は、別のハプロタイプまたは領域のタグ数またはサイズ値とすることができ、比較は、差または比率（またはかかる関数）を取り、次いで、差または比率が閾値を超すかどうかの決定を含むことができる。

基準値は、他の領域の結果に基づき変わる可能性がある。例えば、隣接領域も偏差を示す場合（１つの閾値、例えば、ｚ−スコア３と比較して小さい）、低い閾値を使用することができる。例えば、３つの連続領域がすべて第１の閾値を超す場合、癌の可能性が高い場合がある。したがって、この第１の閾値は、断続的領域から癌を同定する必要がある別の閾値より低い場合がある。さらに偏差の小さな３つの（または３つを超える）領域を有することは、感受性および特異性を保持できる確率効果の十分に低い確率を有することができる。

１４６０工程では、欠失または増幅を示すとして分類される染色体領域量を決定する。算出する染色体領域は、制限を設けることができる。例えば、少なくとも１つの他の領域と隣接した領域のみを算出し得る（または連続領域は、あるサイズ、例えば、４つ以上の領域を必要とする可能性がある）。領域が等しくない実施形態において、数は、またそれぞれの長さも考慮できる（例えば、数は、異常領域の全長である可能性がある）。

１４７０工程では、量は、試料の分類を決定する閾値量と比較する。例として、分類は、生物が癌を有するかどうか、癌病期、および癌の予後とすることができる。１つの実施形態では、領域が現れる位置に関わらず、全異常領域を計数し、単一閾値を使用する。別の実施形態では、閾値は、計数された領域の位置およびサイズに基づき変わる可能性がある。例えば、特定の染色体または染色体群上の領域量は、特定の染色体（または群）の閾値と比較し得る。複数の閾値を使用し得る。例えば、特定の染色体（または群）上の異常領域量は、第１の閾値より高くなければならず、ゲノム中の異常領域の総量は、第２の閾値より高くなければならない。

この領域量の閾値はまた、計数された領域の不平衡の強度にも依存する可能性がある。例えば、癌分類を決定する閾値として使用される領域量は、各領域の異常を検出するために使用される特異性および感受性（異常閾値）に依存する可能性がある。例えば、異常閾値が低い（例えばｚ−スコア２である）場合、閾値量は、高く（例えば、１５０）選択することができる。しかしながら、異常閾値が高い（例えば、ｚ−スコア３である）場合、閾値量は、より低（例えば、５０）い場合がある。異常を示す領域量は、加重値とすることもでき、例えば、高不平衡を示す１つの領域は、小さな不平衡のみを示す領域より加重であることができる（すなわち異常の単なる正負以上の分類がある）。

したがって、正規化したタグ数（または群の特性の他の各値）の有意な過剰発現または不足発現を示す染色体領域量（数および／またはサイズを含み得る）は、疾患重症度を反映するために使用することができる。異常正規化したタグ数を伴う染色体領域量は、２つの要因、すなわち腫瘍組織中の染色体異常の数（またはサイズ）および生体試料（例えば血漿）中の腫瘍由来ＤＮＡの分画濃度によって決定することができる。癌が進行性であるほど、より多くの（およびより大きな）染色体異常を示す傾向がある。それゆえ、より多くの癌関連染色体異常が試料（例えば血漿）中に潜在的に検出可能である。より進行性の癌患者であるほど、より高い腫瘍負荷が血漿中の腫瘍由来ＤＮＡのより高い分画濃度につながることになる。その結果、腫瘍関連染色体異常は、血漿試料中でより容易に検出される。

癌スクリーニングまたは検出の状況において、正規化したタグ数（または他の値）の過剰発現または不足発現を示す染色体領域量を、検査された対象が癌を有する可能性を決定するために使用することができる。カットオフ±２（すなわちｚ−スコア＞２または＜−２）を用いて、研究領域の約５％が、確率のみによって対照対象の平均から有意に離れたｚ−スコアを提供すると予想される。完全ゲノムを１Ｍｂ断片に分割する場合、完全ゲノムに対して約３，０００断片である。したがって、約１５０断片がｚ−スコア＞２または＜−２を有すると予想される。

したがって、癌の有無を決定するためにｚ−スコア＞２または＜−２の断片の数に対してカットオフ値（閾値）１５０を使用することができる。診断目的に適合するように、異常ｚ−スコアの断片数に対して他のカットオフ値（例えば、１００、１２５、１７５、２００、２５０および３００）を選択することができる。低カットオフ値、例えば１００は、より感受性が高い検査をもたらすことになるが、特異性はより低く、より高いカットオフ値はより特異的だが感受性は低い。偽陽性分類数は、ｚ−スコアのカットオフ値を増大することによって低減できる。例えば、カットオフ値が３に増大する場合、断片０．３％のみが偽陽性である。この状況において、異常ｚ−スコアを有する4つ以上の断片を癌の存在を示すために使用することができる。他のカットオフ値、例えば１、２、４、５、１０、２０および３０も、異なる診断目的に適合するように選択できる。しかしながら、癌関連染色体異常を検出する感受性は低下することになり、診断するために必要な異常断片数は増大する。

特異性を損なわずに感受性を改善する１つの可能なアプローチは、隣接する染色体断片の結果を考慮する。１つの実施形態では、ｚ−スコアのカットオフは＞２および＜−２であり続ける。しかしながら、染色体領域は、２連続断片が同一タイプの異常を示す（例えば両断片のｚ−スコアが＞２である）場合のみに潜在的に異常であるとして分類される。正規化したタグ数の偏差がランダムな誤差である場合、同一方向に偽陽性である２つの連続断片を有する確率は０．１２５％（５％×５％／２）である。他方、染色体異常が２つの連続断片を包含する場合、低カットオフ値は、血漿試料中の断片の過剰発現または不足発現の検出の感受性をより高くすることになる。対照対象の平均からの正規化したタグ数（または他の値）の偏差はランダムな誤差によらないため、連続的分類の必要性は、感受性に対して有意な有害な影響を有しない。他の実施形態では、隣接断片のｚ−スコアは、より高いカットオフ値を用いて共に添加できる。例えば、３つの連続断片のｚ−スコアを合計してカットオフ値５を使用することができる。この概念は、４つ以上の連続断片に拡大することができる。

量と異常閾値の組み合わせはまた分析目的、および任意の生物についての先行する知識（またはその欠如）にも依存する可能性がある。例えば、正常健常集団の癌をスクリーニングする場合、典型的にはあるものは、領域が異常を有すると同定される場合に、潜在的領域量（すなわち領域数の高閾値）と異常閾値の両方での、高特異性を使用する。しかしながら、高リスク患者（例えば、しこりまたは家族歴、喫煙、ＨＰＶウイルス、肝炎ウイルス、または他のウイルスを訴える患者）において、より高い感受性を有する（偽陰性が低い）ために閾値はより低くする可能性がある。

１つの実施形態では、あるものが染色体異常を検出するために１Ｍｂ消散および低検出限界６．３％の腫瘍由来ＤＮＡを使用する場合、各１Ｍｂ断片の分子数は６０，０００のである必要があることになる。これは、完全ゲノムに対して約１億８千万（６０，０００リード／Ｍｂ×３，０００Ｍｂ）の整列可能なリードに変換される。

図１５は、本発明の実施形態による、腫瘍由来断片の様々な数の断片および分画濃度に必要な深さを例証する表１５００を示す。列１５１０は、試料のための腫瘍細胞由来の断片濃度を提供する。濃度が高いほど異常の検出が容易であるため、分析に必要な分子数が少ない。列１５２０は、断片ごとに必要な推定分子数を提供し、これは、深さに関する上記の項目に記載の方法を介して算出し得る。

断片サイズが小さいほど、より小さな染色体異常を検出するより高い消散が得られる。しかしながら、これは全体で分析する分子数の必要性を増大することになる。断片サイズが大きいほど、消散支出の分析に必要な分子数は低下する。したがって、大きな異常のみ検出することができる。１つの遂行では、より広い領域を使用することができ、異常を示す断片を再分割してこれらの副領域を（例えば、上記のように）分析して、より良い消散が得られる可能性がある。列１５３０は、各断片サイズを提供する。値が小さいほど、より多くの領域が使用される。列１５４０は、完全ゲノムについて分析される分子数を示す。したがって、あるものが推定値（または検出する最小濃度）を有する場合、分析する分子数を決定することができる。

ＶＩ．経時的進行
腫瘍が進行するにつれ、腫瘍はより多くのＤＮＡ断片を放出するため（例えば、腫瘍増殖、より多くの壊死、より高い血管分布によって）、腫瘍断片量は増大する。腫瘍組織から血漿中へのＤＮＡ断片が増えるほど、血漿中の不平衡度は増大する（例えば、ＲＨＤＯ中の２ハプロタイプ間のタグ数差は増大する）。加えて、腫瘍断片数が増大するため、異常が存在する領域数はより容易に検出することができる。例えば、領域の腫瘍ＤＮＡ量は少なすぎて異常を検出することができない可能性がある。なぜなら腫瘍が小さく少量の癌ＤＮＡ断片が放出される場合は十分な断片が分析されず、統計的有意差を確立することができないためである。小さい腫瘍でも多くの断片を分析できるが、大量の試料（例えば多くの血漿）を必要とする可能性がある。

癌進行の追跡は、１つまたは複数の領域における異常量（例えば、不平衡または必要な深さによって）または異常を示す染色体領域量（数および／またはサイズ）を使用することができる。１例では、１つの領域（またはいくつかの領域）の異常量が他の領域の異常より速く増大する場合、当該領域（１つまたは複数）を、癌をモニタリングする好ましいマーカーとして使用することができる。この増大は、大きいことから断片を多く放出し、かつ／または領域が何倍にも増幅している腫瘍によってもたらされる可能性がある。あるものはまた、術後の異常値（例えば異常量もしくは異常を示す領域数、またはその組み合わせ）をモニタリングして、腫瘍が適切に除去されていることを確認することもできる。

該技術の様々な遂行において、腫瘍ＤＮＡの分画濃度の決定は、癌病期、前兆、または進行モニタリングに使用される。進行度の測定によって、現時点での癌病期ならびに癌の増殖もしくは拡大速度に関する情報を得ることができる。癌の「病期」は、以下、すなわち、腫瘍サイズ、組織学的外観、リンパ節合併症の存在／不在、および遠位転移の存在／不在のすべてまたは一部に関する。癌の「前兆」は、疾患進行の機会および／または癌からの生存の機会の推定に関与する。これはまた、患者の臨床的進行の無いことになる時間または生存期間の推定にも関与する可能性がある。癌の「モニタリング」は、癌が進行しているか（例えば、サイズ増大、リンパ節合併症の増大、または遠位臓器への拡大、すなわち転移）の確認にも関与することになる。モニタリングはまた、腫瘍が治療によって制御されているかどうかの確認にも関与する可能性がある。例えば、治療が効果的である場合、あるものは、腫瘍サイズの低下、転移またはリンパ節合併症の退化、患者の一般的な健康な状態の改善（例えば体重増加）を確認することができる。

Ａ．癌ＤＮＡの分画濃度の決定
１つまたは複数の領域の異常増量の追跡方法の１つは、領域（１つまたは複数）に対する癌ＤＮＡの分画濃度の決定である。次いで、癌ＤＮＡの分画濃度の変化を腫瘍の経時的追跡に使用することができる。この追跡は診断に使用することができる、例えば、第１測定値は、背景レベル（人の一般的異常レベルに対応し得る）を提供することができ、後の測定値によって、腫瘍増殖（したがって、癌）を示唆する変化を確認することができる。癌ＤＮＡの分画濃度の変化はまた、治療がいかに良く行なわれているかの予見にも使用することができる。この技術の他の遂行では、血漿中の腫瘍ＤＮＡの分画濃度増大は、患者の予後不良、または腫瘍負荷の増大を示すことになる。

癌ＤＮＡの分画濃度は、様々な方法で決定することができる。例えば、あるハプロタイプを別のハプロタイプと比較した（または１つの領域を別の領域と比較した）タグ数の差である。別の方法は、統計的有意差が見られる前の深さ（すなわち分析する断片数）である。先の例において、ハプロタイプ用量の差は、ヘテロ接合の欠失を有する染色体領域を分析することによって、生体試料（例えば血漿）中の腫瘍由来ＤＮＡの分画濃度を決定するために使用することができる。

腫瘍由来ＤＮＡ量は、癌患者における腫瘍負荷と正相関することが示されている（Ｌｏｅｔａｌ．ＣａｎｃｅｒＲｅｓ．１９９９；５９：５４５２−５．およびＣｈａｎｅｔａｌ．ＣｌｉｎＣｈｅｍ．２００５；５１：２１９２−５）。したがって、ＲＨＤＯ分析による生体試料（例えば血漿試料）中の腫瘍由来ＤＮＡの分画濃度の連続モニタリングを使用して患者の疾患進行をモニタリングすることができる。例えば、治療後に連続収集した試料（例えば血漿）中の腫瘍由来ＤＮＡの分画濃度のモニタリングを、治療の成功を決定するために使用することができる。

図１６は、本発明の実施形態による、ＲＨＤＯ分析による血漿中の腫瘍由来ＤＮＡの分画濃度を測定する原理を示す。２ハプロタイプ間の不平衡を決定し、この不平衡度を、試料中の腫瘍ＤＮＡの分画濃度を決定するために使用することができる。

ＨａｐＩとＨａｐＩＩは、非腫瘍組織中の２ハプロタイプを示す。ＨａｐＩＩは、副領域１６１０内の腫瘍組織中で部分的に欠失している。したがって、血漿中に検出された欠失領域１６１０に対応するＨａｐＩＩ関連断片は、非腫瘍組織によって寄与されている。他方、ＨａｐＩ中の領域１６１０は、腫瘍組織と非腫瘍組織の両方に存在する。したがって、ＨａｐＩとＨａｐＩＩとのリード数差は、血漿中の腫瘍由来ＤＮＡ量を表す。

腫瘍由来ＤＮＡの分画濃度（Ｆ）は、以下の式：Ｆ＝（Ｎ_ＨａｐＩ−Ｎ_{ＨａｐＩＩ}）／Ｎ_ＨａｐＩ×１００％（式中、Ｎ_ＨａｐＩは、ＬＯＨによる影響を受ける染色体領域に位置する異型接合のＳＮＰにおけるＨａｐＩ上の対立遺伝子に対応する配列したリード数であり、かつＮ_{ＨａｐＩＩ}は、ＬＯＨによる影響を受ける染色体領域１６１０に位置する異型接合のＳＮＰにおけるＨａｐＩＩ上の対立遺伝子に対応する配列したリード数である）を用いて、ＬＯＨによる影響を受ける染色体領域における欠失しているおよび欠失していない染色体由来の配列リード（タグ）数から算出できる。

上の式は、欠失を含まない染色体領域（ＨａｐＩ）上に位置する異型接合の遺伝子座における累積タグ数としてのｐ、および欠失を含む染色体領域（ＨａｐＩＩ）１６１０の累積タグ数としてのｑの決定と同等であり、試料中の腫瘍ＤＮＡの分画濃度（Ｆ）をＦ＝１−ｑ／ｐとして算出する。図１１に例証した例において、腫瘍ＤＮＡの分画濃度は１４％（１−１０４／１２１）である。

ＨＣＣ患者の血漿試料中の腫瘍由来ＤＮＡの分画濃度を腫瘍切除の前後に収集した。腫瘍切除前、所与の染色体領域の第１ハプロタイプにおけるＮ_ＨａｐＩは３０，４４３であり、染色体領域の第２ハプロタイプにおけるΝ_{ＨａｐＩＩ}は１６，２２１であり、これによってＦ４６．７％が得られた。腫瘍切除後、Ｎ_ＨａｐＩは３１，５３４であり、Ｎ_{ＨａｐＩＩ}は３１，０８９であり、これによってＦ１．４％が得られた。このモニタリングによって、腫瘍切除が成功したことが示される。

循環ＤＮＡサイズプロファイル変化度は、分画濃度を決定するためにも使用することができる。１つの遂行では、腫瘍組織と非腫瘍組織の両方に由来する血漿ＤＮＡの正確なサイズ分布を決定することができ、次いで、２つの既知の分布間に収まる測定したサイズ分布によって分画濃度を得ることができる（例えば、腫瘍組織と非腫瘍組織のサイズ分布の２つの統計値の間の線形モデルを用いて）。あるいは、サイズ変化の連続モニタリングを使用することができる。１つの態様では、サイズ分布変化は、血漿中の腫瘍ＤＮＡの分画濃度に比例するものとして決定される。

異なる領域間の差も類似した形で、すなわち、上記の非特異的ハプロタイプ検出方法において使用することができる。タグ計数法において、いくつかの変数を疾患進行のモニタリングに使用することができる。例えば、染色体異常を示す領域のｚ−スコアの等級は、生体試料（例えば血漿）中の腫瘍由来ＤＮＡの分画濃度を反映するために使用することができる。特定領域の過剰発現度または不足発現度は、試料中の腫瘍由来ＤＮＡの分画濃度および腫瘍組織中のコピー範囲またはコピー数の変化数に比例する。ｚ−スコアの等級は、対照対象と比較した試料中の特定の染色体領域の過剰発現度または不足発現度の測定値である。したがって、ｚ−スコアの等級は、試料中の腫瘍ＤＮＡの分画濃度、および、ひいては患者の腫瘍負荷を反映することができる。

Ｂ．領域数の追跡
上述のように、染色体異常を示す領域数を癌スクリーニングに使用することができ、同様にモニタリングおよび予見するためにも使用することができる。例として、モニタリングは、現時点での癌病期、癌が再発したかどうか、および治療が効いたかどうかを決定するために使用することができる。腫瘍が進行するにつれ、腫瘍のゲノム構成はより分解する。この継続した分解を同定するため、領域の数（例えば、前定義した１Ｍｂの領域）を追跡する方法を、腫瘍の進行を同定するために使用することができる。癌病期がより進行した腫瘍は、異常を示す領域をより多く有する。

Ｃ．方法
図１７は、本発明の実施形態による、核酸分子を含む生体試料を用いて、生物の染色体異常の進行を決定する方法を例証するフローチャートである。１つの実施形態では、核酸分子の少なくとも一部は細胞を含まない。例として、染色体異常は、悪性腫瘍であっても前悪性病巣由来であってもよい。また、異常増大は、経時的に染色体異常を含む細胞をより多く有する生物に起因する可能性があり、または細胞当たり増大した量の異常を含む細胞率を有する生物に起因する可能性がある。低下の例として、治療（例えば手術または化学療法）は、癌関連細胞の除去または低減を生じる可能性がある。

１７１０工程では、生物の１つまたは複数の重複しない染色体領域を同定する。各染色体領域は複数の遺伝子座を含む。領域は、任意の適切な方法、例えば、本明細書に記載の方法によって同定することができる。

１７２０〜１７５０工程は、複数時点のそれぞれで実施される。各時間は、試料を生物から採取時の異なる時間と対応する。この試料は、所与の期間において分析する試料である。例えば、試料は、６ヶ月の間、毎月採取され得、試料の採取直後に分析することができる。あるいは、いくつかの測定値を複数期間にわたって採取後に分析することもできる。

１７２０工程では、生物のこの生体試料を分析して、生物の核酸分子の基準ゲノムにおける位置を同定する。位置は、本明細書に記載の任意の方法、例えば、配列したタグを得るための断片のシークエンシングおよび基準ゲノムへの配列したタグの整列によって決定し得る。分子の特定のハプロタイプは、ハプロタイプ特異的方法に対しても決定することができる。

１７３０〜１７５０工程は、１つまたは複数の染色体領域のそれぞれに対して実施する。複数の領域を使用する場合、Ｖ項の実施形態を使用し得る。１７３０工程では、核酸分子の各群を、同定した位置に基づき染色体領域由来として同定する。各群は、染色体領域の複数の遺伝子座のそれぞれで位置する少なくとも１つの核酸分子を含む。１つの実施形態では、例えば、上記のＲＨＤＯ方法のように、群は、染色体領域の特定のハプロタイプに整列された断片とすることができる。別の実施形態では、群は、ＩＶ項に記載の方法のように染色体領域に整列された任意の断片とすることができる。

１７４０工程では、コンピュータシステムは、核酸分子の各群の各値を算出する。各値は、各群の核酸分子の特性を定義する。各値は、本明細書に記載の任意の値とすることができる。例えば、値は、群内の断片数、または群内の断片サイズ分布の統計値とすることができる。各値はまた、正規化した値、例えば、試料のタグ数の総番号または基準領域に対するタグ数の番号を分割した領域のタグ数とすることもできる。各値は、別の値（例えば、ＲＨＤＯにおける）からの差、または比率とすることもでき、それによって、領域差の特性を得ることができる。

１７５０工程では、各値を基準値と比較して、第１染色体領域が欠失を示すか、または増幅を示すかの分類を決定する。この基準値は、本明細書に記載の任意の閾値または基準値とすることができる。例えば、基準値は正常試料を決定する閾値とすることができる。ＲＨＤＯに対して、各値は、２ハプロタイプのタグ数差またはタグ数比率とすることができ、基準値は、統計的有意な偏差が存在することを決定する閾値とすることができる。別の例では、基準値は、別のハプロタイプまたは領域のタグ数またはサイズ値とすることができ、比較は、差または比率（またはかかる関数）を取り、次いで、差または比率が閾値を超すかどうか決定することを含むことができる。基準値は、例えば、本明細書に記載の任意の適切な方法および基準に応じて決定することができる。

１７６０工程では、生物の染色体異常の進行を決定するために複数時点での各染色体領域の分類を使用する。進行は、生物が癌を有するかどうか、癌病期、および癌の予後を決定するために使用することができる。これらの決定はそれぞれ、本明細書に記載の癌分類に関与する可能性がある。

この癌分類は、様々な方法で実施することができる。例えば、異常領域量を計数して、閾値と比較することができる。領域の分類は数値（例えば、異なるハプロタイプまたは異なる領域の各値および基準値を伴う腫瘍濃度）とすることができ、濃度変化を決定することができる。濃度変化は閾値と比較して有意な上昇が生じたかどうか、したがって腫瘍の存在を示唆するかどうかを決定することができる。

ＶＩＩ．実施例
Ａ．ＳＰＲＴを用いたＲＨＤＯ
この項目では、我々は、肝細胞癌（ＨＣＣ）患者においてＳＰＲＴを用いた相対的ハプロタイプ用量（ＲＨＤＯ）分析の使用例を示す。この患者の腫瘍組織中、２つの染色体４の１つの欠失が観察された。これは染色体４上のＳＮＰにおいてヘテロ接合の欠失をもたらす。この患者のハプロタイピングにおいて、患者、患者の妻および息子のゲノムＤＮＡを分析して、個体３例の遺伝子型を決定した。次いで、患者の構成上ハプロタイプは、それらの遺伝子型に由来した。大規模並列シークエンシングを実施して、染色体４の２ハプロタイプに対応するＳＮＰ対立遺伝子で配列したリードを同定して、計数した。

ＲＨＤＯおよびＳＰＲＴの方程式および原理を上述した。１つの実施形態では、ＲＨＤＯ分析は、例えば、２ハプロタイプのうち１つが増幅または欠失している場合に腫瘍由来ＤＮＡ１０％の存在に対応するＤＮＡ試料中ハプロタイプ用量差１０％を検出するためにプログラムされる。他の実施形態では、ＲＨＤＯ分析の感受性は、ＤＮＡ試料中の腫瘍由来ＤＮＡ２％、５％、１５％、２０％、２５％、３０％、４０％および５０％等を検出するように設定することができる。ＲＨＤＯ分析の感受性は、ＳＰＲＴ分類曲線の上限閾値および下限の算出のための変数において調節することができる。調節可能な変数は、所望の検出限界レベル（例えば、分析する分子数に影響する検出可能であるべき腫瘍濃度パーセンテージ）および分類閾値、例えば、オッズ比（あるハプロタイプのタグ数を他のハプロタイプのタグ数と比較した比率）の使用とすることができる。

このＲＨＤＯ分析において、帰無仮説では、同一用量で存在する染色体４における２ハプロタイプである。代替仮説では、２ハプロタイプ用量は、生体試料（例えば血漿）中１０％超異なる。２ハプロタイプに対応するＳＮＰ対立遺伝子を用いて配列したリード数は、異なるＳＮＰ累積からのデータとしての２仮説と統計的に比較した。ＳＰＲＴ分類は、累積したデータが２ハプロタイプ用量が等量か、または少なくとも１０％統計的に異なる量で存在するかを決定する上で十分である場合に行なわれる。染色体４のｑ群の典型的ＳＰＲＴ分類ブロックを図１８Ａに示す。本明細書において例証目的としてのみ閾値１０％を使用する。他の程度差（例えば０．１％、１％、２％、５％、１５％または２０％）も検出できる。一般に、検出を望む差が小さいほど、分析する必要があるＤＮＡ分子数は多い。逆に言えば、検出を望む差が大きいほど、分析する必要があるＤＮＡ分子数は少なく、なおかつ統計的有意な結果に達する。この分析において、ＳＰＲＴにオッズ比を使用するが、他の変数（ｚ−スコアまたはｐ値等）も使用し得る。

ＨＣＣ患者から診断時で採取したこの血漿試料では、染色体４のｐ群およびｑ群には成功的なＲＨＤＯ分類がそれぞれ７６件および１４８件あった。ＲＨＤＯ分類はすべて、診断時に採取した血漿試料中にはハプロタイプ用量不平衡があったことを示している。比較として、腫瘍の外科的切除後に採取した患者の血漿試料も図１８Ｂに示すように分析した。治療後の試料において、染色体４のｐ群およびｑ群は成功的なＲＨＤＯ分類がそれぞれ４件および９件あった。４つのＲＨＤＯ分類はすべて、血漿試料中に＞１０％の観察可能なハプロタイプ用量不平衡が存在しなかったことを示している。染色体４ｑの９つのＲＨＤＯ分類中、７つはハプロタイプ用量不平衡が存在しないことを示し、２つは不平衡が存在することを示している。ＲＨＤＯブロック数は、＞１０％の用量不平衡は腫瘍切除後に有意に低下したことを示し、これは、＞１０％の用量不平衡を示す染色体領域サイズは、治療後試料中では治療前試料中より有意に小さいことを示している。これらの結果によって、血漿中腫瘍ＤＮＡの分画濃度は、腫瘍の外科的切除後に低下したことが示唆される。

非ハプロタイプ特異的方法と比較して、ＲＨＤＯ分析によって腫瘍ＤＮＡの分画濃度をより正確に推定することができ、特に疾患進行のモニタリングに有用である。したがって、あるものは、疾患進行をともなう症例は血漿中の腫瘍ＤＮＡの分画濃度増大を示し、対して、疾患の安定したか、または腫瘍の退行もしくは腫瘍サイズの縮小した症例は、血漿中の腫瘍ＤＮＡの分画濃度の低下を有することになることを予期する。
Ｂ．標的分析

選択された実施形態では、ＤＮＡ断片のユニバーサルシークエンシングは、以下の標的富化アプローチを実施することができる。本明細書において、かかるアプローチは、富化された標的シークエンシングとも呼ばれる。かかるアプローチの１つの実施形態は、溶液中捕獲システム（例えばＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔシステム、イルミナＴｒｕＳｅｑＣｕｓｔｏｍＥｎｒｉｃｈｍｅｎｔＫｉｔ（ｉｌｌｕｍｉｎａ．ｃｏｍ／ａｐｐｌｉｃａｔｉｏｎｓ／ｓｅｑｕｅｎｃｉｎｇ／ｔａｒｇｅｔｅｄ＿ｒｅｓｅｑｕｅｎｃｉｎｇ．ｉｌｍｎ）を用いたか、またはＭｙＧｅｎｏｓｔｉｃｓＧｅｎＣａｐＣｕｓｔｏｍＥｎｒｉｃｈｍｅｎｔシステム（ｍｙｇｅｎｏｓｔｉｃｓ．ｃｏｍ／））もしくはマイクロアレーベースの捕獲システム（例えばＲｏｃｈｅＮｉＭｂｌｅＧｅｎｅシステム）による断片の前選択である。他の何らかの領域も捕獲することができるが、ある領域が選択的に捕獲される。かかる方法は、分析されるかかる領域をより深く（例えば、デジタルＰＣＲを用いてより多くの断片を配列化または分析することができる）、かつ／またはより安価で分析することを可能にすることができる。深さが深いほど、領域の感受性は増大できる。他の富化方法は、断片サイズおよびメチル化パターンに基づき実施することができる。

したがって、ゲノム形式でのＤＮＡ試料分析の代替は、一般的な染色体異常を検出するために目的の領域を標的化することである。分析的プロセスは主に染色体異常が潜在的に存在する領域か、または特に特定の腫瘍タイプの特徴である変化、もしくは特に臨床的に重要となる変化を伴う領域に焦点を当てるため、標的アプローチは、このアプローチの費用効果を潜在的に改善できる。後者の例としては、特定の癌タイプの腫瘍形成において早期に起こる変化（例えば１ｑおよび８ｑの増幅存在、ならびに８ｑの欠失は、ＨＣＣにおける早期染色体変化である−ｖａｎＭａｌｅｎｓｔｅｉｎｅｔａｌ．ＥｕｒＪＣａｎｃｅｒ２０１１；４７：１７８９−９７）、または良好予後もしくは不良予後に関連する変化（例えば６ｑおよび１７ｑ獲得、ならびに６ｐおよび９ｐ喪失が腫瘍進行中に観察され、１８ｑ、８ｐおよび１７ｐのＬＯＨ存在は大腸癌患者の生存不良に関連する−Ｗｅｓｔｒａｅｔａｌ．ＣｌｉｎＣｏｌｏｒｅｃｔａｌＣａｎｃｅｒ２００４；４：２５２−９）、または治療応答の予測（例えば７ｐでの獲得の存在は、上皮成長因子受容体変異患者におけるチロシンキナーゼ阻害剤への応答を予測する−Ｙｕａｎｅｔａｌ．ＪＣｌｉｎＯｎｃｏｌ２０１１；２９：３４３５−４２）が挙げられる。癌中で改変されたゲノム領域の他の例は、いくつかのオンラインデータベース（例えばＣａｎｃｅｒＧｅｎｏｍｅＡｎａｔｏｍｙＰｒｏｊｅｃｔデータベース（ｃｇａｐ．ｎｃｉ．ｎｉｈ．ｇｏｖ／Ｃｈｒｏｍｏｓｏｍｅｓ／ＲｅｃｕｒｒｅｎｔＡｂｅｒｒａｔａｉｏｎｓ）およびＡｔｌａｓｏｆＧｅｎｅｔｉｃｓａｎｄＣｙｔｏｇｅｎｅｔｉｃｓｉｎＯｎｃｏｌｏｇｙａｎｄＨａｅｍａｔｏｌｏｇｙ（ａｔｌａｓｇｅｎｅｔｉｃｓｏｎｃｏｌｏｇｙ．ｏｒｇ／／Ｔｕｍｏｒｓ／Ｔｕｍｏｒｌｉｓｔｅ．ｈｔｍｌ）に見ることができる。対して、非標的ゲノムアプローチでは、潜在的に異常を伴う領域と同程度で染色体異常が生じる可能性が低い領域を分析する。

我々は、標的富化戦略を適用して、ＨＣＣ患者３例および健常対照対象４例由来の血漿試料を分析した。Ａｇｉｌｅｎｔ製ＳｕｒｅＳｅｌｅｃｔ捕獲システム（Ｇｎｉｒｋｅｅｔａｌ．Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ２００９．２７：１８２−９）を用いて、標的富化を実施した。可能な標的富化技術の例としてＳｕｒｅＳｅｌｅｃｔシステムを選択した。他の溶液相（ＩｌｌｕｍｉｎａＴｒｕＳｅｑＣｕｓｔｏｍＥｎｒｉｃｈｍｅｎｔシステム）、または固相（例えばＲｏｃｈｅ−Ｎｉｍｂｌｅｇｅｎシステム）標的捕獲システム、およびアンプリコンベースの標的富化システム（例えばＱｕａｎｔａＬｉｆｅｓｙｓｔｅｍおよびＲａｉｎＤａｎｃｅシステム）も使用することができる。捕獲プローブは、ＨＣＣ中の一般に異常を示す、およびめったに異常を示さない染色体領域上に位置するように設計される。次いで、標的捕獲後、各ＤＮＡ試料をＩｌｌｕｍｉｎａＧＡＩＩｘ分析器上の流れ細胞の１列によって配列した。増幅および欠失がめったに起こらない領域は、増幅および欠失がより一般的に存在する領域との比較参照用に使用される。

図１９において、ＨＣＣ中に見られる一般的な染色体異常を示す（図は、Ｗｏｎｇら（ＡｍＪＰａｔｈｏｌ１９９９；１５４：３７−４３）から適応した）。染色体表意文字の右側の線は個々の患者試料中の染色体の獲得を表し、左側の線は染色体の喪失を表す。太線は、高レベル獲得を表す。長方形は、標的捕獲プローブの位置を表す。

標的タグ計数分析
染色体異常の検出において、我々はまず潜在的異常を伴う領域および基準領域の正規化したタグ数を算出した。次いで、Ｃｈｅｎら（ＰＬｏＳＯｎｅ２０１ｌ；６：ｅ２１７９１）によって既に記載されているように、正規化したタグ数を領域のＧＣ含量用に補正した。この実施例において、染色体８のｐ−群を潜在的異常領域として選択し、染色体９のｑ−群を基準領域として選択した。染色体異常用のＡｆｆｙｍｅｔｒｉｘＳＮＰ６．０アレーを用いてＨＣＣ患者３例の腫瘍組織を分析した。患者３例の腫瘍組織中８ｐおよび９ｑにおける染色体用量の変化を以下に示す。ＨＣＣ０１３患者は、８ｐ喪失を有し、９ｑは不変であった。ＨＣＣ０２７患者は、８ｐ獲得を有し、９ｑは不変であった。ＨＣＣ０２３患者は、８ｐ喪失を有し、９ｑは不変であった。

次いで、標的分析を用いて、ＨＣＣ患者３例および健常対照対象４例のｃｈｒ８ｐと９ｑとの間の正規化したタグ数比を算出した。図２０Ａは、ＨＣＣと健常患者との正規化したタグ数比の結果を示す。ＨＣＣ０１３およびＨＣＣ０２３症例において、８ｐと９ｑとの間の正規化したタグ数比の低下が観察された。これは、腫瘍組織中の染色体８ｐ喪失の所見と一致する。ＨＣＣ０２７症例において、増大した比率が観察され、これはこの症例の腫瘍組織中の染色体８ｐ獲得と一致する。点線は、４例の正常症例の平均値の２つの標準偏差を伴う領域を表す。

標的サイズ分析
先の項目において、我々は、癌患者における血漿ＤＮＡ断片サイズプロファイルを決定することによって、癌関連改変の検出原理について記載している。サイズ改変も、標的富化アプローチを用いて検出することができる。ＨＣＣ症例３例（ＨＣＣ０１３、ＨＣＣ０２７およびＨＣＣ０２３）において、配列したリードを基準ヒトゲノムに整列後に配列したＤＮＡ断片の各サイズを決定した。両端の最外ヌクレオチド配位から配列したＤＮＡ断片サイズを推定した。他の実施形態では、完全ＤＮＡ断片を配列して、次いで、配列した長さから断片サイズを直接決定することができる。染色体８ｐに整列されたＤＮＡ断片サイズ分布を染色体９ｑに整列されたＤＮＡ断片サイズ分布と比較した。２つのＤＮＡ集団のサイズ分布差の検出において、１５０ｂｐより短いＤＮＡ断片の割合をこの実施例の各集団においてまず決定した。他の実施形態では、他のサイズカットオフ値、例えば８０ｂｐ、１１０ｂｐ、１００ｂｐ、１１０ｂｐ、１２０ｂｐ、１３０ｂｐ、１４０ｂｐ、１６０ｂｐおよび１７０ｂｐを使用することができる。次いで、ΔＱ値を２つの割合の差として決定した。ΔＱ＝Ｑ_８ｐ−Ｑ_９ｑ（式中、Ｑ_８ｐは、１５０ｂｐより短い染色体８ｐに整列されたＤＮＡ断片の割合であり、かつＱ_９ｑは、１５０ｂｐより短い染色体９ｑに整列されたＤＮＡ断片の割合である）。

ＤＮＡ断片のサイズ分布がより短いとカットオフ値（すなわちこの実施例において１５０ｂｐ）より短いＤＮＡの割合がより高くなるため、より高い（より正側の）ΔＦ値は、染色体９ｑに整列されたものと相対的に染色体８ｐに整列されたＤＮＡ断片のより短い分布を表す。反対に、より小さな（より負側の）結果は、染色体９ｑに整列されたものと比較して染色体８ｐに整列されたＤＮＡ断片のより長いサイズ分布を示すことになる。

図２０Ｂは、ＨＣＣ患者３例および健常対照対象４例における対象の富化および大規模並列シークエンシング後のサイズ分析の結果を示す。健常対照対象４例の正のΔＱ値は、染色体９ｑに整列されたものと比較して染色体８ｐに整列されたＤＮＡ断片のわずかにより短いサイズ分布を示す。点線は、対照対象４例の平均からの２つの標準偏差内のΔＱ間隔を表す。ＨＣＣ０１３およびＨＣＣ０２３症例のΔＱ値は、対照対象の平均値未満の２つを超す標準偏差であった。これら２症例は、腫瘍組織中の染色体８ｐの欠失を有していた。腫瘍中８ｐの欠失は、この染色体領域における血漿に対する腫瘍由来ＤＮＡの寄与の低下をもたらす。循環中の腫瘍由来ＤＮＡは非腫瘍組織に由来するＤＮＡより短いため、これは、染色体８ｐに整列された血漿ＤＮＡ断片より明らかに長いサイズ分布につながる。これは、これら２症例のより低い（より負側の）ΔＱ値と一致する。対して、ＨＣＣ０２７症例における８ｐの増幅は、この領域に整列されたＤＮＡ断片の明らかにより短い分布につながる。したがって、８ｐに整列された血漿ＤＮＡ断片のより高い割合は短いとみなされる。これは、ＨＣＣ０２７のΔＱ値は、健常対照対象より正側であるという観察と一致する。

Ｃ．腫瘍由来染色体異常の検出のための複数領域
染色体異常（ある染色体領域の欠失および増幅を含む）は、一般に腫瘍組織中に検出される。染色体異常の特徴的パターンは、異なる癌タイプにおいて観察される。ここで、我々は、いくつかの例を用いて、癌患者の血漿中のこれら癌関連染色体異常を検出する異なるアプローチを例証する。我々のアプローチはまた、癌スクリーニングならびに疾患進行および治療応答のモニタリングにも有用である。ＨＣＣ患者１例および鼻咽頭（ＮＰＣ）患者２例由来の試料を分析した。ＨＣＣ患者では、腫瘍の外科的切除前後に静脈血試料を収集した。ＮＰＣ患者２例では、診断時に静脈血試料を収集した。加えて、慢性Ｂ型肝炎保因者１例の血漿試料および血漿中に検出可能なエプスタイン・バール・ウイルスＤＮＡを保有する対象１例を分析した。これら対象２例はいずれの癌も呈さなかった。

腫瘍由来染色体異常の検出をマイクロアレー分析を用いて実施した。具体的には、ＡｆｆｙｍｅｔｒｉｘＳＮＰ６．０マイクロアレーシステムを用いてＨＣＣ患者の血球および腫瘍試料から抽出したＤＮＡを分析した。血球および腫瘍組織の遺伝子型は、ＡｆｆｙｍｅｔｒｉｘＧｅｎｏｔｙｐｉｎｇＣｏｎｓｏｌｅｖ４．０を用いて決定した。獲得および喪失を含む染色体異常は、ＳＮＰの異なる対立遺伝子の強度およびマイクロアレー上のコピー数多型（ＣＮＶ）プローブに基づくＢｉｒｄｓｅｅｄｖ２アルゴリズムを用いて決定した。
計数ベース分析

血漿中の配列したタグ計数分析を実施するため、静脈血１０ミリリットルを各対象から収集した。各血液試料において、遠心分離後の試料から血漿を単離した。ＱＩＡｍｐ血液ミニキット（Ｑｉａｇｅｎ）を用いて、ＤＮＡを４〜６ｍＬの血漿から抽出した。既に記載されているように（ＬｏＹＭＤ．ＳｃｉＴｒａｎｓｌＭｅｄ２０１０，２：６１ｒａ９１）、血漿ＤＮＡライブラリーを構築してから、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒ基盤を用いて、大規模並列シークエンシングに供した。血漿ＤＮＡ分子の対末端シークエンシング実施した。各分子を５０ｂｐの２つの各端で配列し、したがって、計１００ｂｐ／分子とした。ＳＯＡＰ２プログラム（ｓｏａｐ．ｇｅｎｏｍｉｃｓ．ｏｒｇ．ｃｎ／）（ＬｉＲｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００９，２５：１９６６−７）を用いて、各配列の２つの端を非反復マスクヒトゲノム（ＵＣＳＣｇｅｎｏｍｅ．ｕｃｓｃ．ｅｄｕよりダウンロードしたＨｇｌ８ＮＣＢＩ．３６）に整列した。

次いで、ゲノムを複数の１メガベース（１Ｍｂ）断片に分割し、各１Ｍｂ断片に整列された配列したリード数を決定した。次いで、各ビンのタグ数を、各ビンのＧＣ含量による局所重み付き散布図平滑化（ＬＯＥＳＳ）回帰に基づくアルゴリズムを用いて補正した（ＣｈｅｎＥｅｔａｌ．ＰＬｏＳＯｎｅ２０１１，６：ｅ２１７９１）。この補正は、異なるゲノム断片間のＧＣ含量差のために生じるシークエンシングに関する定量バイアスを最小限にすることを目的とする。１Ｍｂ断片への上記分割は、例証目的で使用する。他の断片サイズ、例えば２Ｍｂ、１０Ｍｂ、２５Ｍｂ、または５０Ｍｂ等も使用することができる。また、特定の患者の特定の腫瘍および全般的な腫瘍の特定タイプのゲノム特徴に基づき断片サイズを選択することが可能である。さらに、例えば、Ｈｅｌｉｃｏｓシステム（ｗｗｗ．ｈｅｌｉｃｏｓｂｉｏ．ｃｏｍ）、またはＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓＳｉｎｇｌｅＭｏｌｅｃｕｌａｒＲｅａｌ−Ｔｉｍｅシステム（ｗｗｗ．ｐａｃｉｆｉｃｂｉｏｓｃｉｅｎｃｅｓ．ｃｏｍ）等の単分子シークエンシング技術に対する、シークエンシングプロセスによってＧＣバイアスが低いことを示すことができる場合、ＧＣ補正工程は省略できる。

先行研究において、我々は、癌を有しない対象由来の血漿試料５７件を配列した。これらの血漿シークエンシング結果を、各１Ｍｂ断片に対してタグ数の基準範囲を決定するために使用した。各１Ｍｂ断片に対して、個体５７例のタグ数の平均および標準偏差を決定した。次いで、研究対象の結果は、以下の方程式：ｚ−スコア＝（症例の配列したタグ数−平均）／Ｓ．Ｄ．（式中、「平均」は、基準試料において特定の１Ｍｂ断片に整列された配列したタグ数の平均であり、かつＳ．Ｄ．は、基準試料において特定の１Ｍｂ断片に整列された配列したタグ数の標準偏差である）を用いて算出したｚ−スコアとして表した。

図２１〜２４は、研究対象４例の配列したタグ計数分析の結果を示す。１Ｍｂ断片は、プロット端に示される。ヒト染色体数および表意文字（最外環）は、時計回り方向のｐｔｅｒからｑｔｅｒに配向される（動原体は黄色で示す）。図２１において、内環２１０１は、腫瘍分析から決定した異常（欠失または増幅）領域を示す。内環２１０１は５段階で示される。当該段階は−２（最内線）〜＋２（最外線）である。−２値は対応する領域の両染色体コピーの喪失を示す。−１値は２つの染色体コピーのうち１つの喪失を示す。０値は染色体の獲得も喪失も示さない。＋１値は１つの染色体コピーの獲得を示し、＋２値は２つの染色体コピーの獲得を示す。

中央環２１０２は血漿分析結果を示す。見られるように、結果は内環に反映する。中央環２１０２は尺度のより多くの線であるが、進行は同一である。外環２１０３は治療後の血漿分析からのデータポイントを示し、これらのデータポイントは灰色である（過剰／不足発現なし−異常なしを確認）。

血漿中の配列したタグの過剰発現を伴う染色体領域（ｚ−スコア＞３）を緑色点２１１０で表す。血漿中の配列したタグの不足発現を伴う領域（ｚ−スコア＜−３）を赤色点２１２０で表す。血漿中で有意な染色体異常が検出されない領域（ｚ−スコアが、−３〜３）を灰色点で表す。過剰／不足発現を計数の総数によって正規化する。シークエンシング前の増幅において、正規化にはＧＣバイアスを考慮し得る。

図２１は、本発明の実施形態による、血漿ＤＮＡを計数する配列したタグからのデータを示すＨＣＣ患者の円状プロットを示す。内側から外側への追跡：マイクロアレー分析により検出した腫瘍組織の染色体異常（赤色および緑色は、それぞれ欠失および増幅を表す）；腫瘍の外科的切除前および切除後１ヶ月目に得た血漿試料のｚ−スコア分析。腫瘍切除前、マイクロアレー分析により腫瘍組織中に同定したものと十分に相関する染色体異常を血漿中に検出した。腫瘍切除後、ほとんどの癌関連染色体異常は血漿中に消失した。これらのデータは、疾患進行および治療効果のモニタリングのかかるアプローチ値を反映する。

図２２は、本発明の実施形態による、ＨＣＣを有しない慢性ＨＢＶ保因者の血漿試料における配列したタグ計数分析を示す。ＨＣＣ患者（図２１）と対照的に、この患者の血漿中の癌関連染色体異常は検出されなかった。これらのデータは、癌のスクリーニング、診断、およびモニタリングのアプローチ値を反映する。

図２３は、本発明の実施形態による、第３期ＮＰＣ患者の血漿試料における配列したタグ計数分析を示す。治療前に採取した血漿試料中の染色体異常を検出した。具体的には、染色体１、３、７、９、および１４において有意な異常を同定した。

図２４は、本発明の実施形態による、第４期ＮＰＣ患者の血漿試料における配列したタグ計数分析を示す。治療前に採取した血漿試料中の染色体異常を検出した。第３期の疾患患者（図２３）と比べてより多くの染色体異常を検出した。配列したタグ数も対照平均からより離れ、すなわちｚ−スコアはゼロから（正または負のいずれか側に）より離れた。対照と比較して増加した染色体異常数および配列したタグ数の高い偏差度は、より進行した疾患の病期においてゲノム改変度がより深いことを反映し、それゆえ、病期、前兆および癌のモニタリングのかかるアプローチ値を反映する。

サイズベース分析
先行研究において、腫瘍組織に由来するＤＮＡのサイズ分布は、非腫瘍組織に由来するサイズ分布より短いことが示されている（ＤｉｅｈｌＦｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００５，１０２（４５）：１６３６８−７３）。先の項目において、我々は、血漿ＤＮＡのサイズ分析によって血漿ハプロタイプ不平衡を検出するアプローチを概説した。ここで、我々は、このアプローチをさらに例証するために、ＨＣＣ患者のシークエンシングデータを使用した。

例証目的において、我々はサイズ分析用の２領域を同定した。１つの領域（染色体１（ｃｈｒ１）；配位：１５９，９３５，３４７〜１６７，２１９，１５８）において、２つの相同染色体の１つの複製を腫瘍組織中に検出した。他の領域（染色体１０（ｃｈｒ１０）；配位：１００，１３７，０５０〜１０１，９０７，３５６）において、２つの相同染色体の１つの欠失（すなわちＬＯＨ）を腫瘍組織中に検出した。さらに、配列した断片がどのハプロタイプに由来するかの決定に加えて、配列した断片サイズも、基準ゲノムにおける配列した断片の最外ヌクレオチド配位を用いて生物情報工学的に決定された。次いで、２ハプロタイプのそれぞれから断片サイズ分布を決定した。

Ｃｈｒ１０のＬＯＨ領域において、１ハプロタイプが腫瘍組織中で欠失していた（欠失ハプロタイプ）。したがって、この欠失したハプロタイプに整列された血漿ＤＮＡ断片はすべて非癌組織に由来した。他方、腫瘍組織中で欠失していなかったハプロタイプ（非欠失ハプロタイプ）に整列された断片は腫瘍組織に由来することも非腫瘍組織に由来することもできる。腫瘍由来ＤＮＡのサイズ分布はより短いため、我々は、欠失していないハプロタイプ由来の断片に対して、欠失したハプロタイプ由来のものと比較してより短いサイズ分布を予期することになる。２つのサイズ分布差は、断片の累積頻度をＤＮＡ断片サイズに対してプロットすることによって決定することができる。短いサイズ分布のＤＮＡ集団は、短いＤＮＡをより豊富に有することになり、それゆえ、サイズスペクトルの短い末端で累積頻度がより急速に増大する。

図２５は、本発明の実施形態による、腫瘍組織中のＬＯＨを示す領域サイズに対する血漿ＤＮＡの累積頻度プロットを示す。Ｘ軸は、塩基対の断片サイズである。Ｙ軸は、Ｘ軸上の値未満のサイズを有する断片パーセンテージである。欠失していないハプロタイプ由来の配列は、欠失したハプロタイプ由来の配列と比較すると、より急速に増大し、サイズ１７０ｂｐ未満の累積頻度がより高い。これは、欠失していないハプロタイプ由来の短いＤＮＡ断片がより豊富であったことを示す。これは、欠失していないハプロタイプ由来の腫瘍由来の短いＤＮＡの寄与となるため、上の予測と一致する。

１つの実施形態では、サイズ分布差は、２つのＤＮＡ分子集団の累積頻度差によって定量化することができる。我々は、ΔＱを２つの集団の累積頻度差として定義する。ΔＱ＝Ｑ_非欠失−Ｑ_欠失（式中、Ｑ_非欠失は、欠失していないハプロタイプ由来の配列したＤＮＡ断片の累積頻度を示し、かつＱ_欠失は、欠失したハプロタイプ由来の配列したＤＮＡ断片の累積頻度を示す）。

図２６は、ＬＯＨ領域における配列した血漿ＤＮＡサイズに対するΔＱを示す。本発明の実施形態による、サイズ１３０ｂｐでΔＱは０．２に達する。これは、短いＤＮＡを決定するカットオフとして１３０ｂｐを使用することが上の方程式における使用のために最適であることを示す。このカットオフを用いて、短いＤＮＡ分子は、欠失していないハプロタイプ由来の集団中で、欠失したハプロタイプ由来の集団中と比較して、２０％より豊富である。次いで、このパーセンテージ差（または同様に由来した値）は、癌を呈さない個体に由来する閾値と比較することができる。

染色体の増幅を伴う領域において、１ハプロタイプを腫瘍組織中で複製した（増幅したハプロタイプ）。この増幅したハプロタイプ由来の腫瘍由来の短いＤＮＡ分子の余剰量が血漿中へ放出されるため、増幅したハプロタイプ由来の断片サイズ分布は、増幅されていないハプロタイプ由来の断片におけるサイズ分布より短い。ＬＯＨシナリオに類似して、サイズ分布差は、断片の累積頻度をＤＮＡ断片サイズに対してプロットすることによって決定することができる。短いサイズ分布のＤＮＡ集団は、短いＤＮＡをより豊富に有することになり、それゆえ、サイズスペクトルの短い末端で累積頻度がより急速に増大する。

図２７は、本発明の実施形態による、腫瘍組織中の染色体の複製を伴う領域サイズに対する血漿ＤＮＡの累積頻度プロットを示す。増幅したハプロタイプ由来の配列は、増幅されていないハプロタイプ由来の配列と比較すると、より急速に増大し、サイズ１７０ｂｐ未満の累積頻度がより高い。これは、増幅したハプロタイプ由来の短いＤＮＡ断片がより豊富であったことを示す。これは、腫瘍由来の短いＤＮＡのより多数が増幅したハプロタイプに由来したため、以下に示す予測と一致する。

ＬＯＨシナリオに類似して、サイズ分布差は、２つのＤＮＡ分子集団の累積頻度差によって定量化することができる。我々は、ΔＱを２つの集団の累積頻度差として定義する。ΔＱ＝Ｑ_増幅−Ｑ_非増幅（式中、Ｑ_増幅は、増幅したハプロタイプ由来の配列したＤＮＡ断片の累積頻度を示し、かつＱ_非増幅は、増幅されていないハプロタイプ由来の配列したＤＮＡ断片の累積頻度を示す）。

図２８は、本発明の実施形態による、増幅した領域における配列した血漿ＤＮＡサイズに対するΔＱを示す。ΔＱは、本発明の実施形態による、１２６ｂｐサイズで、０．０８に達する。これは、短いＤＮＡを決定するカットオフとして１２６ｂｐを使用し、短いＤＮＡ分子は、増幅したハプロタイプ集団中で増幅されていないハプロタイプからの集団と比較して、８％より豊富であることを示す。

Ｄ．追加の技術
他の実施形態では、配列特異性技術を使用し得る。例えば、オリゴヌクレオチドは、特定領域の断片のハイブリッド形成に設計し得る。次いで、オリゴヌクレオチドは、配列したタグ数と類似した形で計数することができる。この方法は、特定の異常を示す癌に使用し得る。

ＶＩＩＩ．コンピュータシステム
本明細書に記載の任意のコンピュータシステムは、任意の適切な数のサブシステムを使用し得る。かかるサブシステムの例を、図９でコンピュータ装置９００に示す。いくつかの実施形態では、コンピュータシステムは、サブシステムをコンピュータ装置の構成部分とすることができる単独コンピュータ装置を含む。他の実施形態では、コンピュータシステムは、内部構成部分と共にそれぞれサブシステムである複数のコンピュータ装置を含むことができる。

図２９に示されたサブシステムは、システムバス２９７５を通じて相互接続される。さらなるサブシステム、例えばプリンター２９７４、キーボード２９７８、固定ディスク２９７９、ディスプレイアダプター２９８２と接続されたモニター２９７６等が示される。Ｉ／Ｏコントローラー２９７１と接続する、周辺機器および入力／出力（Ｉ／Ｏ）装置は、当技術分野において既知である任意の数の手段、例えばシリアルポート２９７７によってコンピュータシステムと接続することができる。例えば、シリアルポート２９７７または外部インターフェース２９８１（例えばイーサネット、ワイファイ等）は、コンピュータシステム２９００をインターネットのような広い領域ネットワーク、マウス入力装置、またはスキャナーと接続するために使用することができる。システムバス２９７５経由の相互接続によって、セントラルプロセッサ２９７３を個々のサブシステムと通信させ、そしてシステムメモリー２９７２または固定ディスク２９７９からの指示の実行、およびサブシステム間の情報の交換をさせることが可能である。システムメモリー２９７２および／または固定ディスク２９７９は、コンピュータ読み取り可能媒体を具現化し得る。本明細書に記載のいずれの値も、１構成部分から別の構成部分に出力することができ、ユーザーに提供することができる。

コンピュータシステムは、例えば、外部インターフェース２９８１によって、または内部インターフェースによって共に接続されている複数の同一構成部分またはサブシステムを含むことができる。いくつかの実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワーク上で伝達できる。かかる例では、１つのコンピュータはクライアントとみなすことができ、別のコンピュータはサーバーととみなすことができ、それぞれ同一コンピュータシステムの一部とすることができる。クライアントおよびサーバーは、それぞれ、複数のシステム、サブシステム、または構成部分を含むことができる。

本発明の任意の実施形態は、モジュール式または統合した様式で、ハードウェアを用いて、および／またはコンピュータソフトを用いて、制御ロジック式に実行できることが理解されるべきである。本明細書に提供する本開示および教示に基づき、ハードウェアおよびハードウェアとソフトウェアの組み合わせを用いて本発明の実施形態を実行する他のやり方（ｗａｙｓ）および／または方法（ｍｅｔｈｏｄｓ）について当業者は知っており理解しているであろう。

本用途に記載される任意のソフトウェア・コンポーネントまたはソフトウェア機能は、任意の適切なコンピュータ言語、例えばＪａｖａ、Ｃ＋＋またはＰｅｒｌ等を使用して、例えば従来の、またはオブジェクト指向の技術を使用して処理装置によって実行される、ソフトウェアコードとして実装されてもよい。ソフトウェアコードは、一連の指示またはコマンドとして、記憶および／または伝達のためのコンピュータ読み取り可能媒体に記憶されてもよく、適切な媒体としては、ランダムアクセスメモリー（ＲＡＭ）、読み取り専用メモリー（ＲＯＭ）、ハードドライブもしくはフロッピーディスクなどの磁気媒体、またはコンパクトディスク（ＣＤ）もしくはＤＶＤ（デジタル多用途ディスク）などの光学媒体、フラッシュメモリー等が挙げられる。コンピュータ読み取り可能媒体は、かかる記憶装置または伝達装置の任意の組み合わせであり得る。

かかるプログラムはまた、コード化され、インターネットを含む種々のプロトコールに従う有線、光、および／または無線ネットワークを経由した伝達のために適合されるキャリア信号を使用して伝達され得る。したがって、本発明の実施形態のコンピュータ読み取り可能媒体は、かかるプログラムでコード化されたデータ信号を使用して作製し得る。プログラムコードでコード化されたコンピュータ読み取り可能媒体は、互換性のある装置と共にパッケージ化されてもよいし、他の装置とは別に（例えばインターネットダウンロードを通じて）提供されてもよい。任意のかかるコンピュータ読み取り可能媒体は、単一のプログラム製品（例えばハードドライブ、ＣＤ、または全コンピュータシステム）上にまたはその中に装備されてもよく、システムまたはネットワーク内における異なるコンピュータプログラム製品上またはその中に存在してもよい。コンピュータシステムは、ユーザーに本明細書において言及された任意の結果を提供するためのモニター、プリンター、または他の好適なディスプレイを含んでもよい。

本明細書に記載の方法はいずれも、工程を実施するように構成することができる処理装置を含むコンピュータシステムを用いて、全体として実施してもよいし部分的に実施してもよい。したがって、実施形態は、本明細書に記載の任意の方法の工程を、潜在的に各工程または工程の各群を実施する異なる構成部分と共に実施するように構成されたコンピュータシステムに関することができる。番号付けした工程を提示するが、本明細書の方法の工程は、同時に実施しても異なる順で実施してもよい。加えて、これらの工程の一部は、他の方法からの他の工程の一部とともに使用してもよい。また、工程のすべてまたは一部は任意選択的であり得る。加えて、モジュール、回路、またはこれらの工程を実施する他の手段を用いて任意の方法の任意の工程を実施することができる。

特定の実施形態の具体的な詳細は、本発明の実施形態の真意および範囲から逸脱することなく任意の適切な形で併合し得る。しかしながら、本発明の他の実施形態は、それぞれ個々の態様、またはこれら個々の態様の具体的な組み合わせに関する具体的な実施形態に関し得る。

上述の本発明の例示的な実施形態の記述は、例証および説明目的で提示している。記載した厳密な形に本発明を包括または限定することは意図しておらず、多くの改変および変形が上の教示に照らして可能である。本発明の原理およびその実用的な応用を最適に説明し、それにより企図される特定の使用に適するように様々な改変を伴い様々な実施形態で本発明を他の当業者が最適に使用することを可能にするために、実施形態を選択および記載した。

「ａ」、「ａｎ」または「ｔｈｅ」の列挙は、これに反すると別段の記載のない限り、「１つまたは複数」を意味するものとする。上述したすべての特許、特許出願、刊行物、および上述の説明は、すべての目的で参照することによってそれらの全体が本明細書に組み込まれる。先行技術として認められるものはない。

Claims

生物の生体試料における癌関連の染色体の欠失もしくは増幅の分析方法であって、
前記生体試料が正常細胞、および潜在的に癌関連細胞に由来する核酸分子を含み、前記核酸分子の少なくとも一部は前記生体試料中に細胞を含まず、以下のステップ：
第１染色体領域の前記生物の正常細胞の第１および第２ハプロタイプを決定すること、ここで、前記第１染色体領域は第１の複数の遺伝子座を含み、前記第１および第２ハプロタイプは、前記第１の複数の遺伝子座のそれぞれで異型接合する；
前記生体試料中の複数の前記核酸分子のそれぞれに対して、前記生物の基準ゲノム中の前記核酸分子の位置を同定し、前記核酸分子のそれぞれの対立遺伝子を決定すること；
前記同定した位置および決定した対立遺伝子に基づき核酸分子の第１群を前記第１ハプロタイプ由来と同定すること、ここで、前記第１群は前記第１の複数の遺伝子座のそれぞれで位置する少なくとも１つの核酸分子を含む；
前記同定した位置および決定した対立遺伝子に基づき核酸分子の第２群を前記第２ハプロタイプ由来と同定すること、ここで、前記第２群は前記第１の複数の遺伝子座のそれぞれで位置する少なくとも１つの核酸分子を含む；
核酸分子の前記第１群の第１値をコンピュータシステムで算出すること、ここで、前記第１値は前記第１群の前記核酸分子の特性を決定する；
核酸分子の前記第２群の第２値を前記コンピュータシステムで算出すること、ここで、前記第２値は前記第２群の前記核酸分子の特性を決定する；
前記第１値を前記第２値と比較して、前記第１染色体領域がいずれかの癌関連細胞中に欠失または増幅を示すかどうかの分類を決定すること、
を含む、方法。
前記第１染色体領域が癌関連細胞中の欠失または増幅を示すとして分類され、前記癌関連細胞が悪性腫瘍および／または前悪性病巣を含む、請求項１に記載の方法。
前記第１の複数の遺伝子座の各遺伝子座が、前記第１の複数の遺伝子座の別の遺伝子座と少なくとも５００塩基離れている、請求項１に記載の方法。
前記比較が前記第１値と前記第２値との間の差を決定することを含み、前記分類が前記差を少なくとも１つの閾値と比較することを含む、請求項１に記載の方法。
前記少なくとも１つの閾値が、健常な生物由来であるかまたは欠失もしくは増幅を有しない領域由来であり、前記逐次確率比検定、ｔ検定、またはカイ二乗検定が前記少なくとも１つの閾値を決定するために使用される、請求項４に記載の方法。
前記第１値が前記第１群の前記核酸分子のサイズ分布の統計値に対応し、前記第２値が前記第２群の前記核酸分子のサイズ分布の統計値に対応する、請求項１に記載の方法。
前記第１値が前記第１群の前記核酸分子の平均サイズであり、前記第２値が前記第２群の前記核酸分子の平均サイズである、請求項６に記載の方法。
前記第１値Ｑ_ＨａｐＩがカットオフサイズより短い前記第１群中の核酸分子の部分であり、第２値Ｑ_{ＨａｐＩＩ}がカットオフサイズより短い第２群中の核酸分子の部分である、請求項６に記載の方法。
前記比較が前記第１値と前記第２値との間の差を決定することを含み、前記差がΔＱ＝Ｑ_ＨａｐＩ−Ｑ_{ＨａｐＩＩ}であり、閾値を超す正のΔＱ値は、前記第２ハプロタイプが前記生物中の腫瘍組織の欠失を含むかまたは前記第１ハプロタイプが前記生物中の腫瘍組織の増幅を含むことを示す、請求項８に記載の方法。
前記比較が前記第１値と前記第２値との間の差の決定を含み、前記差がΔＱ＝Ｑ_ＨａｐＩ−Ｑ_{ＨａｐＩＩ}であり、ΔＱ値がほぼゼロであることが、前記第１染色体領域中に欠失または増幅が存在しないことを示す、請求項８に記載の方法。
前記第１値Ｆ_ＨａｐＩおよび第２値Ｆ_{ＨａｐＩＩ}がそれぞれのハプロタイプに対してＦ＝Σ^ｗ長／Σ^Ｎ長として定義され、式中Σ^ｗ長はカットオフサイズｗ以下の長さに対応する群の核酸分子長の合計を示し、かつΣ^Ｎ長はＮ塩基以下の長さに対応する群の核酸分子長の合計を示し、式中Ｎがｗより大きい、請求項６に記載の方法。
前記差がΔＦ＝Ｆ_ＨａｐＩ−Ｆ_{ＨａｐＩＩ}であり、閾値より大きいΔＦの正値は、前記第２ハプロタイプが前記生物中に腫瘍組織の欠失を含むことを示す、請求項１１に記載の方法。
前記差がΔＦ＝Ｆ_ＨａｐＩ−Ｆ_{ＨａｐＩＩ}であり、閾値より大きいΔＦの負値は、前記第２ハプロタイプが前記生物中に腫瘍組織の増幅を含むことを示す、請求項１１に記載の方法。
前記第１群の前記第１値が、前記第１の複数の遺伝子座に位置する核酸分子数に対応し、前記第２群の前記第２値が、前記第１の複数の遺伝子座に位置する核酸分子数に対応する、請求項１に記載の方法。
前記生体試料中の癌ＤＮＡの分画濃度を決定するために、前記第１値と前記第２値との比率を算出することをさらに含む、請求項１４に記載の方法。
前記生体試料中の癌ＤＮＡの分画濃度を複数時点で決定すること、
前記生物中の癌レベルを診断、病期決定、予見、もしくは進行をモニタリングするために前記複数時点で前記分画濃度を使用すること、
をさらに含む、請求項１５に記載の方法。
複数の他の染色体領域のそれぞれに対して、
請求項１に記載の方法を反復すること、
欠失もしくは増幅を示す染色体領域の第１番号を決定すること、
前記第１番号を１つもしくは複数の閾値と比較して前記生物中の癌レベルを決定すること、をさらに含む、請求項１に記載の方法。
欠失もしくは増幅を示すものとして同定された各染色体領域に対する欠失もしくは増幅量を決定することと、
前記量を１つもしくは複数の閾値と比較して前記生物中の癌レベルを決定することと、をさらに含む、請求項１７に記載の方法。
請求項１７に記載の方法を複数時点で反復すること、
前記生物中の前記癌レベルを診断、病期決定、予見、もしくは進行をモニタリングするために前記第１番号を前記複数時点で使用すること、
をさらに含む、請求項１７に記載の方法。
前記生物中の前記癌レベルを診断、病期決定、予見、または進行をモニタリングするために前記第１番号を前記複数時点で使用することが、前悪性状態の前記存在または進行を決定することを含む、請求項１９に記載の方法。
前記各染色体領域が所定の長さである、請求項１７に記載の方法。
生物の生体試料を分析する方法であって、
前記生体試料が正常細胞、および潜在的に癌関連の細胞に由来する核酸分子を含み、前記核酸分子の少なくとも一部は前記生体試料中に細胞を含まず、以下のステップ：、
各染色体領域が複数の遺伝子座を含む、前記生物の複数の重複しない染色体領域を同定することと、
前記生物の生体試料中の複数の核酸分子のそれぞれに対して、
前記生物の基準ゲノムにおける前記核酸分子の位置を同定すること；
各染色体領域に対して、核酸分子の各群を、前記同定した位置、前記染色体領域の前記複数の遺伝子座のそれぞれに位置する少なくとも１つの核酸分子を含む前記各群に基づき前記染色体領域由来であると同定すること；
核酸分子の前記各群の各値、前記各群の前記核酸分子の特性を定義する前記各値をコンピュータシステムで算出すること；
前記各値を基準値と比較し、前記染色体領域が欠失または増幅を示すかどうかの分類を決定すること；
欠失もしくは増幅を示すとして分類される染色体領域の量を決定すること、
を含む、方法。
前記量を閾値と比較し、前記生物が癌を有するかどうかの分類を決定することをさらに含む、請求項２２に記載の方法。
各染色体領域が所定の長さである、請求項２２に記載の方法。
前記複数の重複しない染色体領域が前記生物の前記ゲノムにわたる、請求項２２に記載の方法。
正常細胞、および潜在的に癌関連細胞に由来する核酸分子を含む生体試料を用いて生物の染色体異常の進行を決定する方法であって、
前記核酸分子の少なくとも一部は前記生体試料中に細胞を含まず、以下のステップ：
前記生物の基準ゲノムにおける１つまたは複数の重複しない染色体領域を同定すること、ここで、各染色体領域が複数の遺伝子座を含み、
複数時点のそれぞれで、前記生物の生体試料中の複数の核酸分子のそれぞれに対して、前記基準ゲノムにおける前記核酸分子の位置を同定すること；
各染色体領域に対して、核酸分子の各群を、前記同定した位置、前記染色体領域の前記複数の遺伝子座のそれぞれに位置する少なくとも１つの核酸分子を含む前記各群に基づき前記染色体領域由来であると同定すること；
核酸分子の前記各群の各値、前記各群の前記核酸分子の特性を定義する前記各値をコンピュータシステムで算出すること；
前記各値を基準値と比較し、前記第1染色体領域が欠失または増幅を示すかどうかの分類を決定すること；
前記複数時点で前記染色体領域分類の各々を使用して前記生物中の前記染色体異常の前記進行を決定すること、
を含む、方法。
前記分類が、各時点で各染色体領域において前記各値と前記基準値との間の差を反映する数値である、請求項２６に記載の方法。
１つまたは複数の重複しない染色体領域が複数の染色体領域である、請求項２６に記載の方法。
前記複数時点のそれぞれで、
欠失もしくは増幅を示すとして分類される染色体領域量を決定すること、
前記量を使用して前記生物の前記癌の進行をモニタリングすること、
をさらに含む、請求項２８に記載の方法。
前記基準値が、前記核酸分子が得られた時点で欠失または増幅を示さない基準染色体領域由来と同定される核酸分子群から得られる、請求項２６に記載の方法。
前記１つまたは複数の重複しない染色体領域、第１の複数の遺伝子座を含む前記第１染色体領域の第１染色体領域での前記生物の正常細胞に対する第１および第２ハプロタイプを決定すること、ここで、前記２ハプロタイプが前記第１の複数の遺伝子座のそれぞれで異型接合している、をさらに含み
前記第１の染色体領域の前記各値が前記第１ハプロタイプ由来と同定された核酸分子の第１群から得られ、
前記第１の染色体領域の前記基準値が前記第２ハプロタイプ由来と同定された核酸分子の第２群から得られる、請求項２６に記載の方法。
本明細書に記載の方法に対する作動を実施する処理装置を制御するための複数の命令を記憶するコンピュータ読み取り可能媒体を含むコンピュータプログラム製品であって、前記命令が請求項１〜３１のいずれか１項に記載の工程を含む、コンピュータプログラム製品。
請求項１〜３２のいずれか１項に記載の方法を実行するためにプログラムされた処理装置を含むコンピュータシステム。