JP2019503016A

JP2019503016A - がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム

Info

Publication number: JP2019503016A
Application number: JP2018542073A
Authority: JP
Inventors: ジュハンキム
Original assignee: サイフェローム
Priority date: 2015-10-26
Filing date: 2016-10-26
Publication date: 2019-01-31
Anticipated expiration: 2036-10-26
Also published as: CN108475300B; KR20170048227A; EP3396573A4; KR101949286B1; CN108475300A; US20180312928A1; JP6681475B2; EP3396573A2

Abstract

【課題】本発明は、がんゲノム塩基配列変異と患者生存情報を利用したカスタマイズ型の薬物選択方法とシステムに関し、さらに具体的に、がんゲノム塩基配列変異の中で合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子の変異情報を利用したカスタマイズ型の抗がん治療薬物選択方法及びシステムに関する。【解決手段】本発明によるがんゲノム突然変異と患者生存情報、またはがん細胞及び組織の浸潤または転移能力の評価を利用したカスタマイズ型の抗がん治療方法及びシステムは、がんゲノム塩基配列変異とがん生存及び転移情報から導出した合成がん生存遺伝子対の変異解析を通じて、個人別に治療効果及び予後の良い抗がん治療薬物を効果的に選択することができる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。【選択図】図１

Description

本発明は、がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法とシステムに関し、さらに具体的に、がん患者のゲノム塩基配列変異の中で合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子の変異情報を利用したカスタマイズ型の抗がん治療薬物選択方法及びシステムに関する。

生命工学技術の発展により、現在は、人間の全ゲノム塩基配列（ｗｈｏｌｅｇｅｎｏｍｅｓｅｑｕｅｎｃｅ）を分析して、個々人の疾病を予測し、カスタマイズ型の疾病予防及び治療方法を提供する段階まで到達した。

ゲノム学の急速な発展により、がんの病因論としてゲノムの不安定性と累積した変形が定説として扱われ、ゲノムの高速大容量の分析及び情報処理新技術の急速な発展により、先進国では実際の臨床適用が急速に実現されている。

一方、原発性腫瘍のあるがん患者の治療において、重要な部分の一つは、正確な予後（ｐｒｏｇｎｏｓｉｓ）の予測であり、このような予後は、年齢、病理学的所見などの一般的な臨床変因に基づいて判断されるだけでなく、最近では、ゲノム学的変異や増幅のような分子的変因に基づいて判断されている。代表として、ＥＲ、ＰＲ、ＨＥＲ２のタンパク質発現レベルが乳がんの重要な予後因子として確認され、これは、実際の治療にも適用されている。また、最近の卵巣がんの分子的プロファイルを利用して予後予測した研究が紹介され、この研究では、乳がんの予後因子として知られていたＢＲＣＡ１遺伝子とＢＲＣＡ２遺伝子に存在する突然変異の有無によって当該患者群の予後が互いに異なることを報告した。この研究は、臨床的変因の他に分子的プロファイルでもがん患者の予後が測定可能なことを確認した初期研究の一つであり、分子ゲノム学的指標が様々ながん腫に多様な方式で活用可能なことを示唆した研究である。

最近、多様ながんゲノム分析データとその分析結果などがＴＣＧＡ（ＴｈｅＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ）、ＩＣＧＣ（ＩｎｔｅｒｎａｔｉｏｎａｌＣａｎｃｅｒＧｅｎｏｍｅＣｏｎｓｏｒｔｉｕｍ）などの事業を通じて発表され、関連論文も多数発表された。現在、多くの主要がん腫に対して、ゲノム、トランスクリプトーム、後成ゲノムなどのプロファイル分析データが発表され、がんの原因遺伝子探し、がんの分子的分類を助ける生物学的指標（ｂｉｏｍａｒｋｅｒ）探し、予後因子探し、治療反応指標探し、がん組織とがんゲノム変異の異質性（ｈｅｔｅｒｏｇｅｎｅｉｔｙ）などに関する多様な内容が含まれた。

現在まで発表された多くの研究は、個別遺伝子の特性と役割に対する研究に焦点が当てられており、がんの治療標的や予後指標と関連した研究も、個別遺伝子と単一がん腫に対する限定的研究がほとんどである。しかし、このように確認された原因遺伝子が直接的に治療標的や新薬開発に適用することはあまり容易ではなく、がんの複雑性と異質性（ｈｅｔｅｒｏｇｅｎｅｉｔｙ）により単一生物学的指標中心のがん研究の結果は、個人差を反映した個別化医学（ｐｅｒｓｏｎａｌｉｚｅｄｍｅｄｉｃｉｎｅ）的適用が容易ではなく、実際の臨床適用で多様な限界を表している。

従って、現在の単一生物学的指標を利用したがん研究の限界を克服するためには、個人別ゲノム塩基配列変異の総合的な分析情報を直接活用したデータ基盤のカスタマイズ型の抗がん治療薬物選択方法論に基づいた個人カスタマイズ型のがん診断及び治療方法論の開発の必要性が強く提起される。

本発明は、上記のような点を勘案して案出されたもので、がん患者のゲノム突然変異情報と生存情報を活用して、がん腫別合成がん生存の遺伝子対を導出した後、個人のがん患者のゲノム塩基配列変異情報の分析を通じて、一つ以上の合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定し、前記選定された一つ以上の変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子が抑制可能な一つ以上の候補薬物を選択することで、カスタマイズ型の抗がん治療薬物選択のための情報を提供する方法及びシステムを提供する。

一つの様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対に属する一つ以上の遺伝子の塩基配列変異情報を決定する段階と、前記塩基配列変異情報から合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選定する段階とを含む、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法を提供する。

他の様態において、本発明は、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、前記データベースにアクセス可能な通信部と、がんゲノム塩基配列分析部と、薬物選択情報提供部と、表示部とを含み、前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、前記薬物選択情報提供部は、前記一つ以上の対応遺伝子を抑制する抗がん治療薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムを提供する。

また、他の様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。

また、他の様態において、本発明は、がん患者ゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対に属する一つ以上の遺伝子の数を算出する段階を含む、がん患者の予後の予測のための情報を提供する方法を提供する。

また、他の様態において、本発明は、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、前記データベースにアクセス可能な通信部と、がんゲノム塩基配列分析部と、薬物選択情報提供部と、表示部とを含み、前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子対選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、前記薬物選択情報提供部は、前記がん患者の合成がん生存遺伝子対の個数を増加させる薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムを提供する。

また、他の様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物の中で合成がん生存遺伝子対の個数を増加させる候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。

本発明によるがん患者のゲノム突然変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステムは、がん患者のゲノム突然変異情報と生存情報から導出した合成がん生存遺伝子対の塩基配列変異分析を通じて、個人別に治療効果及び予後の良い抗がん治療薬物を選択することができる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。

本発明による方法及びシステムを利用する場合、合成がん生存を誘発する遺伝子対に属する一つ以上の変異遺伝子を選定し、当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子の選定を通じて、前記対応遺伝子を抑制する一つ以上の抗がん治療薬物を選択することで、数個の比較対象薬物の中で個人別カスタマイズ型の抗がん剤の選択が可能であり、薬物の効果または副作用のリスクなどを事前に予測することで、個人に適用される抗がん剤間の優先順位、最適な組み合わせ、または使用可否を決定することができる。また、合成がん生存遺伝子対に属する変異遺伝子の組み合わせの中で、特定のがん腫別に当該がん腫で多数の患者から発見される一つ以上の変異遺伝子の組み合わせを選定し、個別患者のゲノム塩基配列分析結果とは独立して、一般的に当該がん腫の多数の患者で治療効果及び予後が良いと予測される一つ以上の抗がん治療薬物の組み合わせを選択して、各がん腫別に特化した複合抗がん療法（ｃｏｍｂｉｎａｔｉｏｎｃｈｅｍｏｔｈｅｒａｐｙ）の開発及び臨床適用に活用することができる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。

また、本発明による方法及びシステムは、合成がん生存遺伝子対の個人別の塩基配列変異の頻度及び分布分析を通じて、がんの予後を予測するのに使用されることができ、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じて、がんの予後を予測するのに使用されることができる。また、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じて、薬物治療反応性を予測するのにも効果的に使用されることができる。

皮膚黒色種患者から発見された合成がん生存遺伝子対の一つであるＤＮＡＨ２とＸＩＲＰ２遺伝子対の一例を挙げて、当該一合成がん生存遺伝子対に属する二つの遺伝子とも深刻な（低い）遺伝子損傷点数を示す場合（赤色線）、二つの遺伝子のうち一つのみが深刻な遺伝子損傷点数を示す二種の場合（黄色線と青色線）、二つの遺伝子とも深刻な遺伝子損傷点数を示さない場合（緑色線）の生存分析曲線を示す図である。合成がん生存遺伝子対を構成する遺伝子のネットワークを示す図である（肺腺がん（ＬＵＡＤ、赤色線）、皮膚黒色種（ＳＫＣＭ、黄色線）、肺扁平上皮がん（ＬＵＳＣ、青色線）、ＨＮＳＣ（頭頸部扁平上皮がん、茶色線）、ＫＩＲＰ（ＫｉｄｎｅｙＲｅｎａｌＣｌｅａｒＣｅｌｌＣａｒｃｉｎｏｍａ、紫色線））。肺腺がん患者群から発見される合成がん生存遺伝子対で構成された肺腺がん合成がん生存ネットワークを背景として、一人の肺腺がん患者の体細胞突然変異を重ねて描いた図面である。灰色で描かれた肺腺がん合成がん生存ネットワークにおいて、一つのノードは、肺腺がんの合成がん生存遺伝子対に属する一つの遺伝子を意味し、連結線は、一対の合成がん生存遺伝子対を連結する。黄色のノードと赤色のノードは、当該肺腺がん患者で遺伝子損傷点数の低い体細胞突然変異を示す遺伝子を表し、この中で赤色ノードは、連結線で連結された対応ノードと共に合成がん生存遺伝子対を構成したノードを意味する。黄色のノードは、連結線で連結された対応ノードのうち低い遺伝子損傷点数を有する遺伝子が存在せず合成がん生存遺伝子対を構成しないノードを意味する。肺腺がんの一例を挙げて、肺腺がん患者で低い遺伝子損傷点数を示す体細胞突然変異の発生頻度を遺伝子別に例示し、棒グラフで示す図である。ＴＰ５３とＴＴＮ遺伝子が最も多く遺伝子損傷の体細胞突然変異を示すことが例示された。肺腺がんの一例を挙げて、肺腺がん患者で合成がん生存遺伝子対をなす遺伝子がそれぞれ幾つの合成がん生存遺伝子対に参加するかを当該参加頻度によって累積棒グラフで示す図である。例示された赤色の折れ線グラフは、当該遺伝子が幾つの合成がん生存遺伝子対に参加して発見されるか、その頻度を例示した図である。肺腺がんの場合、ＸＩＲＰ２とＲＹＲ３が最も多く合成がん生存遺伝子対を構成することが例示された。３４１人の肺腺がん患者を対象として、合成がん生存遺伝子対を一つも持っていない１４９人、１個以上〜１０個未満を持っている１２２人、及び１０個以上を持っている７０人と、計三群に分けて、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを適用した生存分析を行った図面である。図６の下段にある３個の生存分析グラフは、３４１人の肺腺がん患者を合成がん生存遺伝子対の保有数によって計三群に分けた後、それぞれの部分群を体細胞突然変異個数の多少によって折半して、体細胞突然変異の負担がより高い（ｈｉｇｈ）７４人、６１人、３５人の生存曲線は赤色で、体細胞突然変異の負担がより低い（ｌｏｗ）７５人、６１人、３５人の生存曲線は空色で示した図面である。１８１人の皮膚黒色種患者を対象として、合成がん生存遺伝子対を一つも持っていない８８人、１個以上〜５個未満を持っている４７人、及び５個以上持っている４６人と、計三群に分けて、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを適用した生存分析を行った図面である。図７の下段にある３個の生存分析グラフは、１８１人の皮膚黒色種患者を合成がん生存遺伝子対の保有数によって計三群に分けた後、それぞれの部分群を体細胞突然変異数の多少によって折半して、体細胞突然変異の負担がより高い（ｈｉｇｈ）４４人、２３人、２３人の生存曲線は赤色で、体細胞突然変異の負担がより低い（ｌｏｗ）４４人、２４人、２３人の生存曲線は空色で示した図面である。肺腺がん患者と皮膚黒色種患者で体細胞突然変異の負担と合成がん生存の負担の相関関係をログ−ログ関係で示す図である。５個の肺がん細胞株、Ａ（□）、Ｂ（○）、Ｃ（△）、Ｄ（＋）、及びＥ（ｘ）のゲノム塩基配列分析で得た体細胞突然変異の負担と合成がん生存の負担の相関関係を示す図である。Ｍａｔｒｉｇｅｌｉｎｖａｓｉｏｎａｓｓａｙ方法を使用して５個の肺がん細胞株、Ａ（□）、Ｂ（○）、Ｃ（△）、Ｄ（＋）、及びＥ（ｘ）のＭａｔｒｉｇｅｌ浸潤能力または転移能力を３回の実験で同定した結果を棒グラフで示した図面である。図１０の下段に並べられた３行の撮影写真は、前記５個の肺がん細胞株に対する３回のＭａｔｒｉｇｅｌｉｎｖａｓｉｏｎａｓｓａｙ結果を撮影して示す図である。

本発明は、従来公知された合成致死（ｓｙｎｔｈｅｔｉｃｌｅｔｈａｌｉｔｙ）の概念から脱して、特定の患者で特定の二つの遺伝子のうち、当該二つの遺伝子の機能が全て損傷される場合のみに当該患者の生存率が高く、当該二つの遺伝子の機能が正常であるか、当該二つの遺伝子のいずれか一つの機能が損傷された場合でも患者の生存率が低い組み合わせの形態である「合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ、ＳＣＳ）」の概念に基づいたもので、これを利用してがんの遺伝子相互作用の分析、カスタマイズ型の抗がん治療薬物選択及びがん患者の予後を予測することに活用することができる新しい方法を提供する。

本発明で使用される用語である「塩基配列またはヌクレオチド配列（ｂａｓｅｓｅｑｕｅｎｃｅｏｒｎｕｃｌｅｏｔｉｄｅｓｅｑｕｅｎｃｅ）」とは、核酸ＤＮＡまたはＲＮＡ構成の基本単位であるヌクレオチドの構成成分の一つである塩基を順に並べた配列である。

本発明で使用される用語である「塩基配列変異情報」は、核酸塩基配列が比較対象である参照塩基配列と配列上の差異を示す場合、その差異を示す部分を意味するもので、遺伝子のエクソンを構成する塩基の置換、付加または結実に関する情報を意味する。このような塩基の置換、付加、または結実は、様々な原因によって発生することができ、例えば、染色体の突然変異、切断、結実、重複、逆位及び／又は転座を含む構造的差異によることができる。

前記参照塩基配列または参照誘電体（Ｒｅｆｅｒｅｎｃｅｂａｓｅ（ｏｒｎｕｃｌｅｏｔｉｄｅ）ｓｅｑｕｅｎｃｅｏｒＲｅｆｅｒｅｎｃｅｇｅｎｏｍｅ）とは、塩基配列を比較する際に基準となる塩基配列で、参照塩基配列もしくは標準塩基配列という。

本発明で使用されるがんゲノム塩基配列情報は、公知された塩基配列分析法を利用して決定されることができ、また、商用化されたサービスを提供するＢＧＩ（ＢｅｉｊｉｎｇＧｅｎｏｍｅＩｎｓｔｉｔｕｔｅ）、Ｋｎｏｍｅ、Ｍａｃｒｏｇｅｎ、ＤＮＡＬｉｎｋなどのサービスを利用することができ、これに制限されない。

本発明において、がんゲノム塩基配列に存在する遺伝子塩基配列変異情報は、様々な方法を利用して抽出されることができ、参照群、例えばＨＧ１９のゲノム塩基配列との配列比較プログラム、例えば、ＡＮＮＯＶＡＲ（Ｗａｎｇｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、２０１０；３８（１６）：ｅ１６４）、ＳＶＡ（ＳｅｑｕｅｎｃｅＶａｒｉａｎｔＡｎａｌｙｚｅｒ）（Ｇｅｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１１；２７（１４）：１９９８−２０００）、ＢｒｅａｋＤａｎｃｅｒ（Ｃｈｅｎｅｔａｌ．，ＮａｔＭｅｔｈｏｄｓ．２００９Ｓｅｐ；６（９）：６７７−８１）などを利用した塩基配列比較分析を通じて得られることができる。

前記遺伝子塩基配列変異情報は、コンピュータシステムを通じて受付及び得られることができ、このような側面で、本発明の方法は、遺伝子変異情報をコンピュータシステムで受け付ける段階をさらに含むことができる。本発明で使用されるコンピュータシステムは、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースを含む一つ以上のデータベースを含むか、データベースにアクセスすることができる。

本発明で使用される用語である「合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ、ＳＣＳ）」は、がん細胞またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する現象であり、それらの二つ以上の変異遺伝子のうち、個別変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、それらの二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する場合、その現象を合成がん生存という。本発明で使用される用語である合成がん生存は、合成がん生存を誘発する二つ以上の変異遺伝子の組み合わせが必ずしも一つのがん細胞内で発生した場合のみを指すものではない。このような二つ以上の変異遺伝子の組み合わせが互いに異なるがん細胞であっても、同一のがん組織内の互いに異なるがん細胞でそれぞれ発生して組み合わせをなした場合でも、これを合成がん生存という。本発明の一実施例では、がん患者のゲノム突然変異と生存情報を利用したがん患者の生存分析を通じて合成がん生存遺伝子を選定し、本発明の他の一実施例では、がん細胞株またはがん組織におけるゲノム突然変異の分析及び、前記がん細胞株またはがん組織における浸潤能または転移能の同定を通じて合成がん生存遺伝子を選定した。

本発明で使用される用語である「合成がん生存遺伝子対（ＳＣＳｐａｉｒｏｆｇｅｎｅｓ）」は、がん細胞またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対であり、それらの二つ以上の変異遺伝子のうち、個別変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、それらの二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する場合、その遺伝子対を合成がん生存遺伝子対という。本発明で使用される用語である合成がん生存遺伝子対は、合成がん生存を誘発する遺伝子対が必ずしも一つのがん細胞内で発生した場合のみを指すものではなく、互いに異なるがん細胞であっても、同一のがん組織内の互いに異なるがん細胞でそれぞれ発生して組み合わせをなした遺伝子対も合成がん生存遺伝子対という。この時、合成がん生存遺伝子対に属する二つの遺伝子のうち、二つとも低い遺伝子損傷点数を有する変異遺伝子であれば、当該二つの遺伝子は合成がん生存遺伝子対を構成したと定義する。また、合成がん生存遺伝子対に属する二つの遺伝子のうち一つは、低い遺伝子損傷点数を有する変異遺伝子であり、他の一つは、遺伝子損傷点数が低くない対応遺伝子であれば、当該対応遺伝子を抑制する薬物で当該対応遺伝子を抑制すれば、当該がん患者の生存率が高められると予測することができる。本発明の一実施例では、がんゲノム突然変異と患者生存情報を利用した生存分析を通じて合成がん生存遺伝子対を選定し、その具体的な例を表２に示し、本発明の範囲がこれに制限されない。

さらに具体的に、本発明の一実施例では、がん患者のゲノム突然変異と生存情報を利用したがん患者の生存分析を通じて合成がん生存遺伝子対を選定したが、前記合成がん生存遺伝子対は、がん患者から直接得たがん細胞やがん組織のみを使用して得るだけでなく、ｉｎｖｉｔｒｏ上でがん細胞株実験やがん組織実験を通じても得られる。この場合、がん患者の生存情報に対応するがん細胞の転移または浸潤能力を基準として、転移または浸潤能力が低いほど対応する生存率が高いと推定することができ、転移または浸潤能力が高いほど対応する生存率が低いと推定することができる。即ち、本発明による合成がん生存遺伝子対は、患者群の臨床情報だけでなく、細胞、組織、または動物実験などを通じても得られる。特に、細胞、組織、または動物実験の場合、自然発生的なゲノム塩基配列変異だけでなく、突然変異の誘発（ｍｕｔａｇｅｎｅｓｉｓ）、薬物やＲＮＡ干渉現象などを通じた遺伝子発現の抑制実験を通じて、特定遺伝子の機能損傷状況を実験的に実現できるため、実際の臨床で観察可能ながん患者のゲノム塩基配列変異よりさらに多様な塩基配列変異を人為的に誘発するか、これに該当する遺伝子機能抑制を多様に実験して、さらに多様な合成がん生存遺伝子対が得られる。

このようにがん患者の生存情報及び自然発生的なゲノム塩基配列変異だけでなく、人為的に突然変異を誘発した塩基配列変異や遺伝子発現の抑制などの方法により、がん細胞、組織又は動物実験で転移または浸潤能力の同定を通じて得た合成がん生存遺伝子対も本発明の範囲に属する。

本発明で使用される用語である合成がん生存は、「合成致死（ＳｙｎｔｈｅｔｉｃＬｅｔｈａｌｉｔｙ）」とは互いに差別される概念である。合成致死は、二つ以上の遺伝子の塩基配列変異の組み合わせが細胞死を誘発する現象で、それらの二つ以上の遺伝子の塩基配列変異のうち個別遺伝子の塩基配列変異のそれぞれは、細胞死を誘発しない生存可能な塩基配列変異（ｖｉａｂｌｅｍｕｔａｔｉｏｎ／ｖａｒｉａｎｔ）であるが、それらの二つ以上の遺伝子の生存可能な塩基配列変異の組み合わせが細胞死を誘発する場合、その現象を合成致死という。

前記合成致死は、二つ以上の遺伝子の塩基配列変異の組み合わせが細胞死を誘発する現象で、がん疾患に適用すると、二つ以上の遺伝子の塩基配列変異の組み合わせががん細胞の死亡を誘発する現象を指す。がん疾患の場合、がん細胞の死亡が当該がん患者の生存率に多少の影響を及ぼすことはできるが、その影響の程度は制限的であり、がんの転移ががん細胞の死亡よりがん患者の生存率にさらに大きな影響を及ぼすことが知られている。また、合成致死の評価指標は、細胞死であり、がん患者の生存率ではなく、本発明の合成がん生存は、がん細胞を死亡に至らせる合成致死とは違って、がんのゲノム変異ががん細胞の成長能力や転移能力など、当該がん患者に与える能力の低下を誘発して、当該がん患者の生存に向上をもたらす現象を指す概念で、本発明で開示している合成がん生存と従来公知された合成致死とは差別化される概念である。

また、二つ以上の遺伝子の塩基配列変異の組み合わせが細胞死を誘発する従来に公知された合成致死現象の場合、当該がん細胞は死亡に至るものであるため、実験室（ｉｎｖｉｔｒｏ）で観察はできるが、実際の患者のがん組織では発見し難いという特徴がある。一方、合成がん生存は、実際の患者のがん組織で発見される二つ以上の遺伝子の塩基配列変異の組み合わせによって発生する現象であるため、従来公知された合成致死とは差別化される概念である。

さらに具体的に、本発明の実施例１〜実施例３に例示されたように、本発明者は、実際に様々ながん腫の組織及びがん細胞株で多数の合成がん生存遺伝子対を発見し、前記がん組織及びがん細胞株が細胞死に至らず生きていることを確認した。このような結果から、上述したように、本発明で開示しているがん患者の生存に関する概念である合成がん生存と細胞死に関する概念である合成致死とは差別化される概念であることを確認することができる。

また、本発明の実施例４及び実施例５に例示されたように、本発明者は、合成がん生存の負担（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌＢｕｒｄｅｎ）に対する概念を提示し、合成がん生存遺伝子対をさらに多く持った患者であるほどがん生存率がよくなる量の線形相関関係を確認した。一方、合成致死の概念では、このような線形相関関係が議論されたことがなく、合成致死の概念では、一対の合成致死遺伝子対の損傷だけでも当該細胞が不可逆的に死亡すると定義される。従って、二対、または三対、またはそれ以上の合成致死遺伝子対がさらに発見されるからといって、さらに多いか大きいか強い死亡を誘発するという概念は有効でない。従って、「合成致死の負担（ＳｙｎｔｈｅｔｉｃＬｅｔｈａｌｉｔｙＢｕｒｄｅｎ）」のような概念は、成立しないか立証されていない。合成がん生存の負担の新概念から確認できるように、合成がん生存と合成致死は差別化される概念である。

本発明において、変異遺伝子と対応遺伝子は、機能喪失変異（ＬｏｓｓｏｆＦｕｎｃｔｉｏｎＶａｒｉａｎｔ）を保有するか否かを基準として算出されることができる。前記機能喪失変異には、ｎｏｎｓｅｎｓｅｍｕｔａｔｉｏｎ、ｆｒａｍｅｓｈｉｆｔｉｎｓｅｒｔｉｏｎａｎｄｄｅｌｅｔｉｏｎ、ｎｏｎｓｔｏｐｍｕｔａｔｉｏｎａｎｄｓｐｌｉｃｅｓｉｔｅｍｕｔａｔｉｏｎが含まれることができ、これに制限されない。

さらに具体的に、変異遺伝子と対応遺伝子は、各当該遺伝子が保有した遺伝子塩基配列変異の点数によって決定されることができる。

本発明で使用される用語である「遺伝子塩基配列変異点数」とは、ゲノム塩基配列変異がタンパク質をコーディングする遺伝子のエクソン部位から発見された時、このような個別変異が当該遺伝子がコーディングするタンパク質のアミノ酸配列変異（置換、付加または結実）または転写調節変異などをもたらして、当該タンパク質の構造及び／又は機能に有意な変化もしくは損傷を誘発する程度を数値化した点数をいい、前記遺伝子塩基配列変異点数は、ゲノム塩基配列上でアミノ酸の進化論的な保存程度、変形されたアミノ酸の物理的特性による当該タンパク質の構造や機能の変化に及ぼす程度を考慮して算出することができる。

本発明による遺伝子損傷点数の算出方法に使用される遺伝子塩基配列変異点数を算出することは、当業界に公知された方法を利用して行うことができる。例えば、ＳＩＦＴ（ＳｏｒｔｉｎｇＩｎｔｏｌｅｒａｎｔＦｒｏｍＴｏｌｅｒａｎｔ、ＰａｕｌｉｎｅＣｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２００１Ｍａｙ；１１（５）：８６３−８７４；ＰａｕｌｉｎｅＣｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２００２Ｍａｒｃｈ；１２（３）：４３６−４４６；ＪｉｎｇＨｕｌｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌ．２０１２；１３（２）：Ｒ９）、ＰｏｌｙＰｈｅｎ、ＰｏｌｙＰｈｅｎ−２（ＰｏｌｙｍｏｒｐｈｉｓｍＰｈｅｎｏｔｙｐｉｎｇ、ＲａｍｅｎｓｋｙＶｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００２Ｓｅｐｔｅｍｂｅｒ１；３０（１７）：３８９４−３９００；ＡｄｚｈｕｂｅｉＩＡｅｔａｌ．，ＮａｔＭｅｔｈｏｄｓ７（４）：２４８−２４９（２０１０）、ＭＡＰＰ（ＥｒｉｃＡ．ｅｔａｌ．，ＭｕｌｔｉｖａｒｉａｔｅＡｎａｌｙｓｉｓｏｆＰｒｏｔｅｉｎＰｏｌｙｍｏｒｐｈｉｓｍ、ＧｅｎｏｍｅＲｅｓ．２００５；１５：９７８−９８６）、Ｌｏｇｒｅ（ＬｏｇＲＰｆａｍＥ−ｖａｌｕｅ、ＣｌｉｆｆｏｒｄＲ．Ｊｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００４；２０：１００６−１０１４）、ＭｕｔａｔｉｏｎＡｓｓｅｓｓｏｒ（ＲｅｖａＢｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌ．２００７；８：Ｒ２３２、ｈｔｔｐ：／／ｍｕｔａｔｉｏｎａｓｓｅｓｓｏｒ．ｏｒｇ／）、Ｃｏｎｄｅｌ（Ｇｏｎｚａｌｅｚ−ＰｅｒｅｚＡｅｔａｌ．，ＴｈｅＡｍｅｒｉｃａｎＪｏｕｒｎａｌｏｆＨｕｍａｎＧｅｎｅｔｉｃｓ２０１１；８８：４４０−４４９、ｈｔｔｐ：／／ｂｇ．ｕｐｆ．ｅｄｕ／ｆａｎｎｓｄｂ／）、ＧＥＲＰ（Ｃｏｏｐｅｒｅｔａｌ．，ＧｅｎｏｍｉｃＥｖｏｌｕｔｉｏｎａｒｙＲａｔｅＰｒｏｆｉｌｉｎｇ、ＧｅｎｏｍｅＲｅｓ．２００５；１５：９０１−９１３、ｈｔｔｐ：／／ｍｅｎｄｅｌ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ＳｉｄｏｗＬａｂ／ｄｏｗｎｌｏａｄｓ／ｇｅｒｐ／）、ＣＡＤＤ（ＣｏｍｂｉｎｅｄＡｎｎｏｔａｔｉｏｎ−ＤｅｐｅｎｄｅｎｔＤｅｐｌｅｔｉｏｎ、ｈｔｔｐ：／／ｃａｄｄ．ｇｓ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／）、ＭｕｔａｔｉｏｎＴａｓｔｅｒ、ＭｕｔａｔｉｏｎＴａｓｔｅｒ２（Ｓｃｈｗａｒｚｅｔａｌ．，ＭｕｔａｔｉｏｎＴａｓｔｅｒ２：ｍｕｔａｔｉｏｎｐｒｅｄｉｃｔｉｏｎｆｏｒｔｈｅｄｅｅｐ−ｓｅｑｕｅｎｃｉｎｇａｇｅ．ＮａｔｕｒｅＭｅｔｈｏｄｓ２０１４；１１：３６１−３６２、ｈｔｔｐ：／／ｗｗｗ．ｍｕｔａｔｉｏｎｔａｓｔｅｒ．ｏｒｇ／）、ＰＲＯＶＥＡＮ（Ｃｈｏｉｅｔａｌ．，ＰＬｏＳＯｎｅ．２０１２；７（１０）：ｅ４６６８８）、ＰＭｕｉｔ（Ｆｅｒｒｅｒ−Ｃｏｓｔａｅｔａｌ．，Ｐｒｏｔｅｉｎｓ２００４；５７（４）：８１１−８１９、ｈｔｔｐ：／／ｍｍｂ．ｐｃｂ．ｕｂ．ｅｓ／ＰＭｕｔ／）、ＣＥＯ（ＣｏｍｂｉｎａｔｏｒｉａｌＥｎｔｒｏｐｙＯｐｔｉｍｉｚａｔｉｏｎ、Ｒｅｖａｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌ２００７；８（１１）：Ｒ２３２）、ＳＮＰｅｆｆｅｃｔ（Ｒｅｕｍｅｒｓｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２００６；２２（１７）：２１８３−２１８５、ｈｔｔｐ：／／ｓｎｐｅｆｆｅｃｔ．ｖｉｂ．ｂｅ）、ｆａｔｈｍｍ（Ｓｈｉｈａｂｅｔａｌ．，ＦｕｎｃｔｉｏｎａｌＡｎａｌｙｓｉｓｔｈｒｏｕｇｈＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌｓ、ＨｕｍＭｕｔａｔ２０１３；３４：５７−６５、ｈｔｔｐ：／／ｆａｔｈｍｍ．ｂｉｏｃｏｍｐｕｔｅ．ｏｒｇ．ｕｋ／）、ＭＳＲＶ（Ｊｉａｎｇ、Ｒ．ｅｔａｌ．Ｓｅｑｕｅｎｃｅ−ｂａｓｅｄｐｒｉｏｒｉｔｉｚａｔｉｏｎｏｆｎｏｎｓｙｎｏｎｙｍｏｕｓｓｉｎｇｌｅ−ｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓｆｏｒｔｈｅｓｔｕｄｙｏｆｄｉｓｅａｓｅｍｕｔａｔｉｏｎｓ．ＡｍＪＨｕｍＧｅｎｅｔ２００７；８１：３４６−３６０、ｈｔｔｐ：／／ｍｓｍｓ．ｕｓｃ．ｅｄｕ／ｍｓｒｖ／）、Ａｌｉｇｎ−ＧＶＧＤ（Ｔａｖｔｉｇｉａｎ、ＳｅａｎＶ．、ｅｔａｌ．Ｃｏｍｐｒｅｈｅｎｓｉｖｅｓｔａｔｉｓｔｉｃａｌｓｔｕｄｙｏｆ４５２ＢＲＣＡ１ｍｉｓｓｅｎｓｅｓｕｂｓｔｉｔｕｔｉｏｎｓｗｉｔｈｃｌａｓｓｉｆｉｃａｔｉｏｎｏｆｅｉｇｈｔｒｅｃｕｒｒｅｎｔｓｕｂｓｔｉｔｕｔｉｏｎｓａｓｎｅｕｔｒａｌ．Ｊｏｕｒｎａｌｏｆｍｅｄｉｃａｌｇｅｎｅｔｉｃｓ２００６：２９５−３０５．、ｈｔｔｐ：／／ａｇｖｇｄ．ｈｃｉ．ｕｔａｈ．ｅｄｕ／）、ＤＡＮＮ（Ｑｕａｎｇ、Ｄａｎｉｅｌ、ＹｉｆｅｉＣｈｅｎ、ａｎｄＸｉａｏｈｕｉＸｉｅ．ＤＡＮＮ：ａｄｅｅｐｌｅａｒｎｉｎｇａｐｐｒｏａｃｈｆｏｒａｎｎｏｔａｔｉｎｇｔｈｅｐａｔｈｏｇｅｎｉｃｉｔｙｏｆｇｅｎｅｔｉｃｖａｒｉａｎｔｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２０１４：ｂｔｕ７０３．、ｈｔｔｐｓ：／／ｃｂｃｌ．ｉｃｓ．ｕｃｉ．ｅｄｕ／ｐｕｂｌｉｃ＿ｄａｔａ／ＤＡＮＮ／）、Ｅｉｇｅｎ（Ｉｏｎｉｔａ−Ｌａｚａ、Ｉｕｌｉａｎａ、ｅｔａｌ．Ａｓｐｅｃｔｒａｌａｐｐｒｏａｃｈｉｎｔｅｇｒａｔｉｎｇｆｕｎｃｔｉｏｎａｌｇｅｎｏｍｉｃａｎｎｏｔａｔｉｏｎｓｆｏｒｃｏｄｉｎｇａｎｄｎｏｎｃｏｄｉｎｇｖａｒｉａｎｔｓ．Ｎａｔｕｒｅｇｅｎｅｔｉｃｓ（２０１６）：２１４−２２０．、ｈｔｔｐ：／／ｗｗｗ．ｃｏｌｕｍｂｉａ．ｅｄｕ／〜ｉｉ２１３５／ｅｉｇｅｎ．ｈｔｍｌ）、ＫＧＧＳｅｑ（ＬｉＭＸ、ＧｕｉＨＳ、ＫｗａｎＪＳ、ＢａｏＳＹ、ＳｈａｍＰＣ．ＡｃｏｍｐｒｅｈｅｎｓｉｖｅｆｒａｍｅｗｏｒｋｆｏｒｐｒｉｏｒｉｔｉｚｉｎｇｖａｒｉａｎｔｓｉｎｅｘｏｍｅｓｅｑｕｅｎｃｉｎｇｓｔｕｄｉｅｓｏｆＭｅｎｄｅｌｉａｎｄｉｓｅａｓｅｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０１２Ａｐｒ；４０（７）：ｅ５３．、ｈｔｔｐ：／／ｇｒａｓｓ．ｃｇｓ．ｈｋｕ．ｈｋ／ｌｉｍｘ／ｋｇｇｓｅｑ／）、ＬＲＴ（Ｃｈｕｎ、Ｓｕｎｇ、ａｎｄＪｕｓｔｉｎＣ．Ｆａｙ．Ｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｄｅｌｅｔｅｒｉｏｕｓｍｕｔａｔｉｏｎｓｗｉｔｈｉｎｔｈｒｅｅｈｕｍａｎｇｅｎｏｍｅｓ．ＧｅｎｏｍｅＲｅｓ．２００９：１５５３−１５６１．、ｈｔｔｐ：／／ｗｗｗ．ｇｅｎｅｔｉｃｓ．ｗｕｓｔｌ．ｅｄｕ／ｊｆｌａｂ／ｌｒｔ＿ｑｕｅｒｙ．ｈｔｍｌ）、ＭｅｔａＬＲ（Ｄｏｎｇ、Ｃｈｅｎｇｌｉａｎｇ、ｅｔａｌ．ＣｏｍｐａｒｉｓｏｎａｎｄｉｎｔｅｇｒａｔｉｏｎｏｆｄｅｌｅｔｅｒｉｏｕｓｎｅｓｓｐｒｅｄｉｃｔｉｏｎｍｅｔｈｏｄｓｆｏｒｎｏｎｓｙｎｏｎｙｍｏｕｓＳＮＶｓｉｎｗｈｏｌｅｅｘｏｍｅｓｅｑｕｅｎｃｉｎｇｓｔｕｄｉｅｓ．Ｈｕｍａｎｍｏｌｅｃｕｌａｒｇｅｎｅｔｉｃｓ２０１５；２４（８）：２１２５−２１３７）、ＭｅｔａＳＶＭ（Ｄｏｎｇ、Ｃｈｅｎｇｌｉａｎｇ、ｅｔａｌ．ＣｏｍｐａｒｉｓｏｎａｎｄｉｎｔｅｇｒａｔｉｏｎｏｆｄｅｌｅｔｅｒｉｏｕｓｎｅｓｓｐｒｅｄｉｃｔｉｏｎｍｅｔｈｏｄｓｆｏｒｎｏｎｓｙｎｏｎｙｍｏｕｓＳＮＶｓｉｎｗｈｏｌｅｅｘｏｍｅｓｅｑｕｅｎｃｉｎｇｓｔｕｄｉｅｓ．Ｈｕｍａｎｍｏｌｅｃｕｌａｒｇｅｎｅｔｉｃｓ２０１５；２４（８）：２１２５−２１３７）、ＭｕｔＰｒｅｄ（Ｍｏｒｔ、Ｍａｔｔｈｅｗ、ｅｔａｌ．ＭｕｔＰｒｅｄＳｐｌｉｃｅ：ｍａｃｈｉｎｅｌｅａｒｎｉｎｇ−ｂａｓｅｄｐｒｅｄｉｃｔｉｏｎｏｆｅｘｏｎｉｃｖａｒｉａｎｔｓｔｈａｔｄｉｓｒｕｐｔｓｐｌｉｃｉｎｇ．ＧｅｎｏｍｅＢｉｏｌｏｇｙ２０１４；（１５）１：１、ｈｔｔｐ：／／ｗｗｗ．ｍｕｔｄｂ．ｏｒｇ／ｍｕｔｐｒｅｄｓｐｌｉｃｅ／ａｂｏｕｔ．ｈｔｍ）、ＰＡＮＴＨＥＲ（Ｍｉ、Ｈｕａｉｙｕ、ｅｔａｌ．ＴｈｅＰＡＮＴＨＥＲｄａｔａｂａｓｅｏｆｐｒｏｔｅｉｎｆａｍｉｌｉｅｓ、ｓｕｂｆａｍｉｌｉｅｓ、ｆｕｎｃｔｉｏｎｓａｎｄｐａｔｈｗａｙｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ２００５；（３３）ｓｕｐｐｌ１：Ｄ２８４−Ｄ２８８．、ｈｔｔｐ：／／ｗｗｗ．ｐａｎｔｈｅｒｄｂ．ｏｒｇ／ｔｏｏｌｓ／ｃｓｎｐＳｃｏｒｅＦｏｒｍ．ｊｓｐ）、Ｐａｒｅｐｒｏ（Ｔｉａｎ、Ｊｉａｎ、ｅｔａｌ．Ｐｒｅｄｉｃｔｉｎｇｔｈｅｐｈｅｎｏｔｙｐｉｃｅｆｆｅｃｔｓｏｆｎｏｎ−ｓｙｎｏｎｙｍｏｕｓｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓｂａｓｅｄｏｎｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｓ．ＢＭＣｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００７；８．１、ｈｔｔｐ：／／ｗｗｗ．ｍｏｂｉｏｉｎｆｏｒ．ｃｎ／ｐａｒｅｐｒｏ／ｃｏｎｔａｃｔ．ｈｔｍ）、ｐｈａｓｔＣｏｎｓ（Ｓｉｅｐｅｌ、Ａｄａｍ、ｅｔａｌ．Ｅｖｏｌｕｔｉｏｎａｒｉｌｙｃｏｎｓｅｒｖｅｄｅｌｅｍｅｎｔｓｉｎｖｅｒｔｅｂｒａｔｅ、ｉｎｓｅｃｔ、ｗｏｒｍ、ａｎｄｙｅａｓｔｇｅｎｏｍｅｓ．ＧｅｎｏｍｅＲｅｓ．２００５；９１５）８：１０３４−１０５０、ｈｔｔｐ：／／ｃｏｍｐｇｅｎ．ｃｓｈｌ．ｅｄｕ／ｐｈａｓｔ／）、ＰｈＤ−ＳＮＰ（Ｃａｐｒｉｏｔｔｉ、Ｅ．、Ｃａｌａｂｒｅｓｅ、Ｒ．、Ｃａｓａｄｉｏ、Ｒ．Ｐｒｅｄｉｃｔｉｎｇｔｈｅｉｎｓｕｒｇｅｎｃｅｏｆｈｕｍａｎｇｅｎｅｔｉｃｄｉｓｅａｓｅｓａｓｓｏｃｉａｔｅｄｔｏｓｉｎｇｌｅｐｏｉｎｔｐｒｏｔｅｉｎｍｕｔａｔｉｏｎｓｗｉｔｈｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｓａｎｄｅｖｏｌｕｔｉｏｎａｒｙｉｎｆｏｒｍａｔｉｏｎ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００６；２２：２７２９−２７３４．、ｈｔｔｐ：／／ｓｎｐｓ．ｂｉｏｆｏｌｄ．ｏｒｇ／ｐｈｄ−ｓｎｐ／）、ｐｈｙｌｏＰ（Ｐｏｌｌａｒｄ、ＫａｔｈｅｒｉｎｅＳ．、ｅｔａｌ．Ｄｅｔｅｃｔｉｏｎｏｆｎｏｎｎｅｕｔｒａｌｓｕｂｓｔｉｔｕｔｉｏｎｒａｔｅｓｏｎｍａｍｍａｌｉａｎｐｈｙｌｏｇｅｎｉｅｓ．＿ＧｅｎｏｍｅＲｅｓ．２０１０；（２０）１：１１０−１２１．、ｈｔｔｐ：／／ｃｏｍｐｇｅｎ．ｃｓｈｌ．ｅｄｕ／ｐｈａｓｔ／ｂａｃｋｇｒｏｕｎｄ．ｐｈｐ）、ＰＯＮ−Ｐ（Ｎｉｒｏｕｌａ、Ａｂｈｉｓｈｅｋ、ＳｉｄｄｈａｌｉｎｇＵｒｏｌａｇｉｎ、ａｎｄＭａｕｎｏＶｉｈｉｎｅｎ．ＰＯＮ−Ｐ２：ｐｒｅｄｉｃｔｉｏｎｍｅｔｈｏｄｆｏｒｆａｓｔａｎｄｒｅｌｉａｂｌｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｈａｒｍｆｕｌｖａｒｉａｎｔｓ．ＰＬｏＳＯｎｅ２０１５；（１０）２：ｅ０１１７３８０．、ｈｔｔｐ：／／ｓｔｒｕｃｔｕｒｅ．ｂｍｃ．ｌｕ．ｓｅ／ＰＯＮ−Ｐ２／）、ＳｉＰｈｙ（Ｇａｒｂｅｒ、Ｍａｎｕｅｌ、ｅｔａｌ．Ｉｄｅｎｔｉｆｙｉｎｇｎｏｖｅｌｃｏｎｓｔｒａｉｎｅｄｅｌｅｍｅｎｔｓｂｙｅｘｐｌｏｉｔｉｎｇｂｉａｓｅｄｓｕｂｓｔｉｔｕｔｉｏｎｐａｔｔｅｒｎｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００９；（２５）１２：ｉ５４−ｉ６２、ｈｔｔｐ：／／ｐｏｒｔａｌｓ．ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｏｒｇ／ｇｅｎｏｍｅ＿ｂｉｏ／ｓｉｐｈｙ／ｄｏｃｕｍｅｎｔａｔｉｏｎ．ｈｔｍｌ）、ＳＮＡＰ（Ｂｒｏｍｂｅｒｇ、Ｙ．ａｎｄＲｏｓｔ、Ｂ．ＳＮＡＰ：ｐｒｅｄｉｃｔｅｆｆｅｃｔｏｆｎｏｎ−ｓｙｎｏｎｙｍｏｕｓｐｏｌｙｍｏｒｐｈｉｓｍｓｏｎｆｕｎｃｔｉｏｎ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００７；３５：３８２３−３８３５、ｗｈｔｔｐ：／／ｗｗｗ．ｒｏｓｔｌａｂ．ｏｒｇ／ｓｅｒｖｉｃｅｓ／ＳＮＡＰ）、ＳＮＰｓ＆ＧＯ（ＲｅｍｏＣａｌａｂｒｅｓｅ、ＥｍｉｄｉｏＣａｐｒｉｏｔｔｉ、ＰｉｅｒｏＦａｒｉｓｅｌｌｉ、ＰｉｅｒＬｕｉｇｉＭａｒｔｅｌｌ

ｉ、ａｎｄＲｉｔａＣａｓａｄｉｏ．Ｆｕｎｃｔｉｏｎａｌａｎｎｏｔａｔｉｏｎｓｉｍｐｒｏｖｅｔｈｅｐｒｅｄｉｃｔｉｖｅｓｃｏｒｅｏｆｈｕｍａｎｄｉｓｅａｓｅ−ｒｅｌａｔｅｄｍｕｔａｔｉｏｎｓｉｎｐｒｏｔｅｉｎｓ．ＨｕｍａｎＭｕｔａｔａｔｉｏｎ２００９；３０：１２３７−１２４４、ｈｔｔｐ：／／ｓｎｐｓ．ｂｉｏｆｏｌｄ．ｏｒｇ／ｓｎｐｓ−ａｎｄ−ｇｏ／）、ＶＥＰ（ＭｃＬａｒｅｎＷ、ＰｒｉｔｃｈａｒｄＢ、ＲｉｏｓＤ、ＣｈｅｎＹ、ＦｌｉｃｅｋＰａｎｄＣｕｎｎｉｎｇｈａｍＦ．ＤｅｒｉｖｉｎｇｔｈｅｃｏｎｓｅｑｕｅｎｃｅｓｏｆｇｅｎｏｍｉｃｖａｒｉａｎｔｓｗｉｔｈｔｈｅＥｎｓｅｍｂｌＡＰＩａｎｄＳＮＰＥｆｆｅｃｔＰｒｅｄｉｃｔｏｒ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２０１０；２６：２０６９−７０ｈｔｔｐ：／／ｗｗｗ．ｅｎｓｅｍｂｌ．ｏｒｇ／ｉｎｆｏ／ｄｏｃｓ／ｔｏｏｌｓ／ｖｅｐ／）、ＶＥＳＴ（ＣａｒｔｅｒＨ、ＤｏｕｖｉｌｌｅＣ、ＳｔｅｎｓｏｎＰ、ＣｏｏｐｅｒＤ、ＫａｒｃｈｉｎＲＩｄｅｎｔｉｆｙｉｎｇＭｅｎｄｅｌｉａｎｄｉｓｅａｓｅｇｅｎｅｓｗｉｔｈｔｈｅＶａｒｉａｎｔＥｆｆｅｃｔＳｃｏｒｉｎｇＴｏｏｌＢＭＣＧｅｎｏｍｉｃｓ２０１３；１４（Ｓｕｐｐｌ３）：Ｓ３）、ＳＮＡＰ２（ＹａｎａＢｒｏｍｂｅｒｇ、ＧｕｙＹａｃｈｄａｖ、ａｎｄＢｕｒｋｈａｒｄＲｏｓｔ．ＳＮＡＰｐｒｅｄｉｃｔｓｅｆｆｅｃｔｏｆｍｕｔａｔｉｏｎｓｏｎｐｒｏｔｅｉｎｆｕｎｃｔｉｏｎ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００８；２４：２３９７−２３９８、ｈｔｔｐ：／／ｗｗｗ．ｒｏｓｔｌａｂ．ｏｒｇ／ｓｅｒｖｉｃｅｓ／ＳＮＡＰ）、ＣＡＲＯＬ（ＬｏｐｅｓＭＣ、ＪｏｙｃｅＣ、ＲｉｔｃｈｉｅＧＲ、ＪｏｈｎＳＬ、ＣｕｎｎｉｎｇｈａｍＦｅｔａｌ．Ａｃｏｍｂｉｎｅｄｆｕｎｃｔｉｏｎａｌａｎｎｏｔａｔｉｏｎｓｃｏｒｅｆｏｒｎｏｎ−ｓｙｎｏｎｙｍｏｕｓｖａｒｉａｎｔｓ、ｈｔｔｐ：／／ｗｗｗ．ｓａｎｇｅｒ．ａｃ．ｕｋ／ｓｃｉｅｎｃｅ／ｔｏｏｌｓ／ｃａｒｏｌ）、ＰａＰＩ（Ｌｉｍｏｎｇｅｌｌｉ、Ｉｖａｎ、ＳｉｍｏｎｅＭａｒｉｎｉ、ａｎｄＲｉｃｃａｒｄｏＢｅｌｌａｚｚｉ．ＰａＰＩ：ｐｓｅｕｄｏａｍｉｎｏａｃｉｄｃｏｍｐｏｓｉｔｉｏｎｔｏｓｃｏｒｅｈｕｍａｎｐｒｏｔｅｉｎ−ｃｏｄｉｎｇｖａｒｉａｎｔｓ．ＢＭＣｂｉｏｉｎｆｏｒｍａｔｉｃｓ２０１５；（１６）１：１、ｈｔｔｐ：／／ｐａｐｉ．ｕｎｉｐｖ．ｉｔ／）、Ｇｒａｎｔｈａｍ（Ｇｒａｎｔｈａｍ、Ｒ．Ａｍｉｎｏａｃｉｄｄｉｆｆｅｒｅｎｃｅｆｏｒｍｕｌａｔｏｈｅｌｐｅｘｐｌａｉｎｐｒｏｔｅｉｎｅｖｏｌｕｔｉｏｎ．Ｓｃｉｅｎｃｅ１９７４；（１８５）４１５４：８６２−８６４、ｈｔｔｐｓ：／／ｉｏｎｒｅｐｏｒｔｅｒ．ｔｈｅｒｍｏｆｉｓｈｅｒ．ｃｏｍ／ｉｏｎｒｅｐｏｒｔｅｒ／ｈｅｌｐ／ＧＵＩＤ−Ｄ９ＤＦＢ２１Ｃ−６５２Ｄ−４Ｆ９５−８１３２−Ａ０Ｃ４４２Ｆ６５３９９．ｈｔｍｌ）、ＳＩｎＢａＤ（Ｌｅｈｍａｎｎ、Ｋｊｏｎｇ−Ｖａｎ、ａｎｄＴｉｎｇＣｈｅｎ．Ｅｘｐｌｏｒｉｎｇｆｕｎｃｔｉｏｎａｌｖａｒｉａｎｔｄｉｓｃｏｖｅｒｙｉｎｎｏｎ−ｃｏｄｉｎｇｒｅｇｉｏｎｓｗｉｔｈＳＩｎＢａＤ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ２０１３；（４１）１：ｅ７−ｅ７、ｈｔｔｐ：／／ｔｉｎｇｃｈｅｎｌａｂ．ｃｍｂ．ｕｓｃ．ｅｄｕ／ｓｉｎｂａｄ／）、ＶＡＡＳＴ（Ｈｕ、Ｈａｏ、ｅｔａｌ．ＶＡＡＳＴ２．０：Ｉｍｐｒｏｖｅｄｖａｒｉａｎｔｃｌａｓｓｉｆｉｃａｔｉｏｎａｎｄｄｉｓｅａｓｅ＿］ｇｅｎｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｕｓｉｎｇａｃｏｎｓｅｒｖａｔｉｏｎ＿］ｃｏｎｔｒｏｌｌｅｄａｍｉｎｏａｃｉｄｓｕｂｓｔｉｔｕｔｉｏｎｍａｔｒｉｘ．Ｇｅｎｅｔｉｃｅｐｉｄｅｍｉｏｌｏｇｙ２０１３；（３７）６：６２２−６３４、ｈｔｔｐ：／／ｗｗｗ．ｙａｎｄｅｌｌ−ｌａｂ．ｏｒｇ／ｓｏｆｔｗａｒｅ／ｖａａｓｔ．ｈｔｍｌ）、ＲＥＶＥＬ（Ｉｏａｎｎｉｄｉｓ、ＮｉｌａｈＭ．、ｅｔａｌ．ＲＥＶＥＬ：ａｎＥｎｓｅｍｂｌｅＭｅｔｈｏｄｆｏｒＰｒｅｄｉｃｔｉｎｇｔｈｅＰａｔｈｏｇｅｎｉｃｉｔｙｏｆＲａｒｅＭｉｓｓｅｎｓｅＶａｒｉａｎｔｓ．＿ＡＧＨＧ２０１６、ｈｔｔｐｓ：／／ｓｉｔｅｓ．ｇｏｏｇｌｅ．ｃｏｍ／ｓｉｔｅ／ｒｅｖｅｌｇｅｎｏｍｉｃｓ／）、ＣＨＡＳＭ（ＣａｒｔｅｒＨ、ＣｈｅｎＳ、ＩｓｉｋＬ、ＴｙｅｋｕｃｈｅｖａＳ、ＶｅｌｃｕｌｅｓｃｕＶＥ、ＫｉｎｚｌｅｒＫＷ、ＶｏｇｅｌｓｔｅｉｎＢ、ＫａｒｃｈｉｎＲＣａｎｃｅｒ−ｓｐｅｃｉｆｉｃｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔａｎｎｏｔａｔｉｏｎｏｆｓｏｍａｔｉｃｍｕｔａｔｉｏｎｓ：ｃｏｍｐｕｔａｔｉｏｎａｌｐｒｅｄｉｃｔｉｏｎｏｆｄｒｉｖｅｒｍｉｓｓｅｎｓｅｍｕｔａｔｉｏｎｓＣａｎｃｅｒＲｅｓ２００９；６９（１６）：６６６０−７、ｈｔｔｐ：／／ｗｗｗ．ｃｒａｖａｔ．ｕｓ）、ｍＣｌｕｓｔｅｒ（ＹｕｅＰ、ＦｏｒｒｅｓｔＷＦ、ＫａｍｉｎｋｅｒＪＳ、ＬｏｈｒＳ、ＺｈａｎｇＺ、ＣａｖｅｔＧ：Ｉｎｆｅｒｒｉｎｇｔｈｅｆｕｎｃｔｉｏｎａｌｅｆｆｅｃｔｓｏｆｍｕｔａｔｉｏｎｔｈｒｏｕｇｈｃｌｕｓｔｅｒｓｏｆｍｕｔａｔｉｏｎｓｉｎｈｏｍｏｌｏｇｏｕｓｐｒｏｔｅｉｎｓ．Ｈｕｍａｎｍｕｔａｔｉｏｎ．２０１０；３１（３）：２６４−２７１．１０．１００２／ｈｕｍｕ．２１１９４．）、ｎｓＳＮＰＡｎａｙｚｅｒ（ＬｅｉＢａｏ、ＭｉＺｈｏｕ、ａｎｄＹａｎＣｕｉｎｓＳＮＰＡｎａｌｙｚｅｒ：ｉｄｅｎｔｉｆｙｉｎｇｄｉｓｅａｓｅ−ａｓｓｏｃｉａｔｅｄｎｏｎｓｙｎｏｎｙｍｏｕｓｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２００５；３３：４８０−４８２、ｈｔｔｐ：／／ｓｎｐａｎａｌｙｚｅｒ．ｕｔｈｓｃ．ｅｄｕ／）、ＳＡＡＰｐｒｅｄ（ＮｏｕｆＳＡｌ−ＮｕｍａｉｒａｎｄＡｎｄｒｅｗＣＲＭａｒｔｉｎ．ＴｈｅＳＡＡＰｐｉｐｅｌｉｎｅａｎｄｄａｔａｂａｓｅ：ｔｏｏｌｓｔｏａｎａｌｙｚｅｔｈｅｉｍｐａｃｔａｎｄｐｒｅｄｉｃｔｔｈｅｐａｔｈｏｇｅｎｉｃｉｔｙｏｆｍｕｔａｔｉｏｎｓ．ＢＭＣＧｅｎｏｍｉｃｓ２０１３；１４（３）：１−１１、ｗｗｗ．ｂｉｏｉｎｆ．ｏｒｇ．ｕｋ／ｓａａｐ／ｄａｐ／）、ＨａｎＳａ（ＡｃｈａｒｙａＶ．ａｎｄＮａｇａｒａｊａｒａｍＨ．Ａ．ＨａｎｓａＡｎａｕｔｏｍａｔｅｄｍｅｔｈｏｄｆｏｒｄｉｓｃｒｉｍｉｎａｔｉｎｇｄｉｓｅａｓｅａｎｄｎｅｕｔｒａｌｈｕｍａｎｎｓＳＮＰｓ．ＨｕｍａｎＭｕｔａｔｉｏｎ２０１２；２：３３２−３３７、ｈａｎｓａ．ｃｄｆｄ．ｏｒｇ．ｉｎ：８０８０／）、ＣａｎＰｒｅｄｉｃｔ（Ｋａｍｉｎｋｅｒ、Ｊ．Ｓ．ｅｔａｌ．ＣａｎＰｒｅｄｉｃｔ：ａｃｏｍｐｕｔａｔｉｏｎａｌｔｏｏｌｆｏｒｐｒｅｄｉｃｔｉｎｇｃａｎｃｅｒ−ａｓｓｏｃｉａｔｅｄｍｉｓｓｅｎｓｅｍｕｔａｔｉｏｎｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．、２００７；３５：５９５：５９８、ｈｔｔｐ：／／ｐｇｗｓ．ｎｃｉ．ｎｉｈ．ｇｏｖ／ｃｇｉ−ｂｉｎ／ＧｅｎｅＶｉｅｗｅｒ．ｃｇｉ＿）、ＦＩＳ（ＢｏｒｉｓＲｅｖａ、ＹｅｖｇｅｎｉｙＡｎｔｉｐｉｎ、ａｎｄＣｈｒｉｓＳａｎｄｅｒ．Ｐｒｅｄｉｃｔｉｎｇｔｈｅｆｕｎｃｔｉｏｎａｌｉｍｐａｃｔｏｆｐｒｏｔｅｉｎｍｕｔａｔｉｏｎｓ：Ａｐｐｌｉｃａｔｉｏｎｔｏｃａｎｃｅｒｇｅｎｏｍｉｃｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２０１１；３９：ｅ１１８−ｅ１１８．）、ＢＯＮＧＯ（ＣｈｅｎｇＴ．Ｍ．Ｋ．、ＬｕＹ−Ｅ、ＶｅｎｄｒｕｓｃｏｌｏＭ．、ＬｉｏＰ．、ＢｌｕｎｄｅｌｌＴ．Ｌ．Ｐｒｅｄｉｃｔｉｏｎｂｙｇｒａｐｈｔｈｅｏｒｅｔｉｃｍｅａｓｕｒｅｓｏｆｓｔｒｕｃｔｕｒａｌｅｆｆｅｃｔｓｉｎｐｒｏｔｅｉｎｓａｒｉｓｉｎｇｆｒｏｍｎｏｎ−ｓｙｎｏｎｙｍｏｕｓｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓ．ＰＬｏＳＣｏｍｐＢｉｏｌｏｇｙ２００８；（４）７：ｅ１０００１３５、ｈｔｔｐ：／／ｗｗｗ．ｂｏｎｇｏ．ｃｌ．ｃａｍ．ａｃ．ｕｋ／Ｂｏｎｇｏ２／Ｂｏｎｇｏ．ｈｔｍ）などのようなアルゴリズムを各当該遺伝子が保有した遺伝子塩基配列変異に適用して、遺伝子塩基配列変異情報から遺伝子塩基配列変異点数を算出することができ、これに制限されない。例えば、ＳＩＦＴ点数を利用して遺伝子塩基配列変異点数を付与する時、ＳＩＦＴ点数０．７点以上の変異は、当該遺伝子の機能に有意味な変化を誘発しないという仮定を適用して、０．７点以上の変異を変異が存在しないものに換算するなどのフィルタリング過程が適用されることができ、このような変形は、本発明の範囲に属する。例えば、ＳＩＦＴ点数を利用して遺伝子塩基配列変異点数を付与する時、当該ＳＩＦＴの点数を任意の関数を通じて変形（ｔｒａｎｓｆｏｒｍ）した値を算出して適用した点数も、本発明の範囲に属する。

上述したアルゴリズムの目的は、それぞれの遺伝子塩基配列変異が当該タンパク質の発現または機能にどれだけ影響を及ぼし、この影響がタンパク質にどれだけ損傷を与えるか、あるいは特に影響がないかなどを見出すためである。それらは、基本的に個別遺伝子塩基配列変異がもたらす当該遺伝子がコーディングするタンパク質のアミノ酸配列及び関連変化を判断することで、当該タンパク質の発現、構造及び／又は機能に及ぼす影響を判断するという点で共通点がある。

本発明による一実施形態では、個別遺伝子塩基配列変異点数を算出するために、ＳＩＦＴ（ＳｏｒｔｉｎｇＩｎｔｏｌｅｒａｎｔＦｒｏｍＴｏｌｅｒａｎｔ）アルゴリズムを利用した。ＳＩＦＴアルゴリズムの場合、例えば、ＶＣＦ（ＶａｒｉａｎｔＣａｌｌＦｏｒｍａｔ）形式ファイルで遺伝子塩基配列変異情報の入力を受けて、それぞれの遺伝子塩基配列変異が当該遺伝子を損傷させる程度を点数化する。ＳＩＦＴアルゴリズムの場合、算出点数が０に近いほど当該遺伝子がコーディングするタンパク質の損傷が激しく、当該機能が損傷されたと判断し、１に近いほど当該遺伝子がコーディングするタンパク質が正常機能を維持していると判断する。

また、他のアルゴリズムであるＰｏｌｙＰｈｅｎ−２の場合、算出点数が高いほど当該遺伝子がコーディングするタンパク質の機能的な損傷程度が大きいと判断する。

最近では、ＳＩＦＴ、Ｐｏｌｙｐｈｅｎ２、ＭＡＰＰ、Ｌｏｇｒｅ、ＭｕｔａｔｉｏｎＡｓｓｅｓｓｏｒを互いに比較し総合してＣｏｎｄｅｌアルゴリズムを提示した研究（Ｇｏｎｚａｌｅｚ−Ｐｅｅｒｅｚ、Ａ．＆Ｌｏｐｅｚ−Ｂｉｇａｓ、Ｎ．ＩｍｐｒｏｖｉｎｇｔｈｅａｓｓｅｓｓｍｅｎｔｏｆｔｈｅｏｕｔｃｏｍｅｏｆｎｏｎｓｙｎｏｎｙｍｏｕｓＳＮＶｓｗｉｔｈａｃｏｎｓｅｎｓｕｓｄｅｌｅｔｅｒｉｏｕｓｎｅｓｓｓｃｏｒｅ、Ｃｏｎｄｅｌ．ＴｈｅＡｍｅｒｉｃａｎＪｏｕｒｎａｌｏｆＨｕｍａｎＧｅｎｅｔｉｃｓ、２０１１；８８（４）：４４０−４４９）が発表され、前記研究では、タンパク質に損傷を与える遺伝子塩基配列変異及び影響の少ない遺伝子塩基配列変異と関連して公知されたデータの集合であるＨｕｍＶａｒとＨｕｍＤｉｖ（Ａｄｚｈｕｂｅｉ、ＩＡｅｔａｌ．，Ａｍｅｔｈｏｄａｎｄｓｅｒｖｅｒｆｏｒｐｒｅｄｉｃｔｉｎｇｄａｍａｇｉｎｇｍｉｓｓｅｎｓｅｍｕｔａｔｉｏｎｓ．ＮａｔｕｒｅＭｅｔｈｏｄｓ、２０１０；７（４）：２４８−２４９）を使用して前記５個のアルゴリズムを比較した。その結果、ＨｕｍＶａｒの９７．９％のタンパク質の損傷を引き起こす遺伝子塩基配列変異と９７．３％の影響の少ない遺伝子塩基配列変異が前記５個のアルゴリズムのうち少なくとも３個のアルゴリズムで同一に感知され、ＨｕｍＤｉｖの９９．７％のタンパク質損傷を引き起こす遺伝子塩基配列変異と９８．８％の影響の少ない遺伝子塩基配列変異が前記５個のアルゴリズムのうち少なくとも３個のアルゴリズムで同一に感知された。また、前記ＨｕｍＤｉｖとＨｕｍＶａｒに対して、前記５個のアルゴリズムと各アルゴリズムを統合して計算した結果の正確度を表すＲＯＣ（ＲｅｃｉｅｖｅｒＯｐｅｒａｔｉｎｇＣｕｒｖｅ）曲線を描いた結果、非常に高い水準（６９％〜８８．２％）でＡＵＣ（ＡｒｅａＵｎｄｅｒｔｈｅＲｅｃｉｅｖｅｒＯｐｅｒａｔｉｎｇＣｕｒｖｅ）の一致度を表すことを確認した。つまり、上述した様々なアルゴリズムは、その算出方法は異なっても、算出された遺伝子塩基配列変異点数は互いに有意に相関したものである。従って、上述したアルゴリズムまたはアルゴリズムを応用した方法を適用して遺伝子塩基配列変異点数を算出する互いに異なるアルゴリズムの種類に関係なく、本発明の範囲に属する。遺伝子塩基配列変異がタンパク質をコーディングする遺伝子のエクソン部位に発生する場合、タンパク質の発現、構造及び／又は機能に直接的な影響を及ぼし得る。従って、前記遺伝子塩基配列変異情報をタンパク質機能の損傷程度と関連させることができる。このような側面で、本発明の方法は、遺伝子塩基配列変異点数を基盤として「遺伝子損傷点数」を算出する概念を含む。さらに具体的に、変異遺伝子と対応遺伝子は、前述したアルゴリズムを各当該遺伝子が保有した遺伝子塩基配列変異に適用して算出された遺伝子塩基配列変異点数から算出される遺伝子損傷点数によって決定されることができる。

本発明において、変異遺伝子と対応遺伝子は、各当該遺伝子が保有した遺伝子塩基配列変異が二つ以上の場合、各遺伝子塩基配列変異点数の平均値として算出される遺伝子損傷点数によって決定されることができる。

本発明で使用される用語である「遺伝子損傷点数（ＧｅｎｅＤｅｌｅｔｅｒｉｏｕｓｎｅｓｓＳｃｏｒｅ、ＧＤＳ）」とは、一つのタンパク質をコーディングする遺伝子に二つ以上の有意な塩基配列変異が発見され、一つのタンパク質が二つ以上の遺伝子塩基配列変異点数を有する場合、前記遺伝子塩基配列変異点数を総合して計算された点数をいい、もし、タンパク質をコーディングする遺伝子部位に有意な塩基配列変異が一つである場合は、遺伝子損傷点数を当該遺伝子塩基配列変異点数と同一に算出することができる。この時、タンパク質をコーディングする遺伝子塩基配列変異が二つ以上である場合、遺伝子損傷点数は、各変異別に計算された遺伝子塩基配列変異点数の平均値で計算され、このような平均値は、例えば、幾何平均、算術平均、調和平均、算術幾何平均、算術調和平均、幾何調和平均、ピタゴラス平均、四分平均、二次平均、切削平均、ウィンザー化平均、加重平均、加重幾何平均、加重算術平均、加重調和平均、関数の平均、冪平均、一般化されたｆ−平均、百分位数、最大値、最小値、最頻値、中央値、中央範囲、または中心傾向度（ｍｅａｓｕｒｅｓｏｆｃｅｎｔｒａｌｔｅｎｄｅｎｃｙ）、単純積または加重積、または前記算出値の関数演算で計算されることができるが、これに制限されない。

本発明による一実施形態では、下記の数１によって遺伝子損傷点数を算出し、下記の数１は、多様な変形が可能であるので、これに制限されない。

前記数１において、Ｓｇは、遺伝子ｇがコーディングするタンパク質の遺伝子損傷点数、ｎは、前記遺伝子ｇの塩基配列変異の中で分析対象の塩基配列変異の数、ｖｉは、ｉ番目の分析対象の塩基配列変異の前記塩基配列変異点数であり、ｐは、０ではなく実数である。

前記数１において、前記ｐの値が１の場合は算術平均、前記ｐの値が−１の場合は調和平均となり、前記ｐの値が０に近づく極限の場合は幾何平均となる。

本発明によるまた他の一実施形態では、下記の数２によって遺伝子損傷点数を算出した。

前記数２において、Ｓｇは、遺伝子ｇがコーディングするタンパク質の遺伝子損傷点数、ｎは、前記遺伝子ｇの塩基配列変異の中で分析対象の塩基配列変異の数、ｖｉは、ｉ番目の分析対象の塩基配列変異の前記遺伝子塩基配列変異点数であり、ｗｉは、前記ｉ番目の塩基配列変異の前記遺伝子塩基配列変異点数ｖｉに与えられる加重値である。

全ての加重値ｗｉが同じ値を有する場合、前記遺伝子損傷点数Ｓｇは、前記遺伝子塩基配列変異点数ｖｉの幾何平均値となる。前記加重値は、当該タンパク質の種類、当該タンパク質の薬動学的または薬力学的分類、当該薬物酵素タンパク質の薬動学的パラメータ、人口集団または人種別分布を考慮して付与されることができる。

本発明による塩基配列変異点数及び遺伝子損傷点数は、大韓民国特許出願番号１０−２０１４−０１０７９１６、ＰＣＴ国際出願番号ＰＣＴ／ＫＲ２０１４／００７６８５に開示され、この開示内容は、その全体が参照として本願に含まれる。

本発明による方法は、前記合成がん生存遺伝子対情報を利用して、前記がん患者に対して適用される薬物間の優先順位を決定する段階、または前記合成がん生存遺伝子対情報を利用して、前記がん患者に適用される薬物を使用するか否かを決定する段階をさらに含むことができる。

本発明による方法は、追加的にがん腫別に有意な生物学的マーカーを基準として二つ以上の部分群に区分した後、各部分群におけるゲノム突然変異と患者生存情報を利用した生存分析を通じて、合成がん生存遺伝子対を選定することができる。

前記生物学的マーカーは、がんと関連した診断、治療及び予後に関与するもので、当業界に知られた公知されたマーカーを全て含む概念である。例えば、大腸がんの診断、治療及び予後に重要な生物学的マーカーとして知られたＭＳＩ（Ｍｉｃｒｏｓａｔｅｌｌｉｔｅｉｎｓｔａｂｉｌｉｔｙ）をはじめ、各がん別に公知されたマーカーを制限なく利用することができる。

本発明において、候補薬物の選定は、前記がん患者のゲノム塩基配列情報から選別された合成がん生存遺伝子対に属する一つ以上の対応遺伝子と対をなす一つ以上の変異遺伝子の個数を算出し、その算出された個数を基準として候補薬物の優先順位または組み合わせを決定する段階によって行われることができる。

本発明によるシステムは、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースにアクセスして関連情報を抽出し、これにより、前記カスタマイズ型の薬物選択情報をユーザに提供するユーザインタフェースをさらに含むことができる。

本発明によるシステムにおいて、前記データベースまたはそのアクセス情報を含むサーバ、算出された情報及びこれと連結したユーザインタフェース装置は、互いに連携して使用されることができる。

本発明によるシステムにおいて、ユーザインターフェースまたは端末は、サーバからがんゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択処理を要請、結果を受信及び／又は格納することができ、スマートフォン、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、タブレットＰＣ、個人携帯情報端末機（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ、ＰＤＡ）、ウェブパッドなどのようにメモリー手段を具備し、マイクロプロセッサを搭載して演算能力を備えた移動通信機能を具備した端末機で構成されることができる。

本発明によるシステムにおいて、サーバは、データベースに対するアクセスを提供する手段で、通信部を通じてユーザインターフェースまたは端末と連結され、各種の情報が交換できるように構成される。ここで、通信部は、同一のハードウェアにおける通信はもちろん、構内情報通信網（ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ、ＬＡＮ）、都市圏通信網（ｍｅｔｒｏｐｏｌｉｔａｎａｒｅａｎｅｔｗｏｒｋ、ＭＡＮ）、広域通信網（ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ、ＷＡＮ）、インターネット、２Ｇ、３Ｇ、４Ｇ移動通信網、ワイファイ（Ｗｉ−Ｆｉ）、ワイブロ（Ｗｉｂｒｏ）などを含むことができ、通信方式も、有線、無線を問わず、いずれの通信方式でも構わない。データベースも、サーバに直接設置されたものだけでなく、目的によって、インターネットなどを通じてアクセス可能な多様な生命科学データベースに連結されることができる。

本発明による方法は、ハードウェア、ファームウェア、またはソフトウェア又はそれらの組み合わせで実現されることができる。ソフトウェアで実現される場合、格納媒体は、コンピュータのような装置によって読み取り可能な形の格納または伝達する任意の媒体を含む。例えば、コンピュータ読み取り可能な媒体は、ＲＯＭ（ｒｅａｄｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、磁気ディスク格納媒体、光格納媒体、フラッシュメモリー装置、及びその他の電気的、光学的または音響的信号伝達媒体などを含む。

このような様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。

本発明による方法及びシステムを利用する場合、合成がん生存を誘発する遺伝子対に属する一つ以上の変異遺伝子を選定し、当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子の選定を通じて、前記対応遺伝子を抑制する一つ以上の抗がん治療薬物を選択することにより、数個の比較対象薬物の中で個人別カスタマイズ型の抗がん剤の選択が可能であり、薬物の効果または副作用のリスクなどを事前に予測することで、個人に適用される抗がん剤間の優先順位、最適な組み合わせ、また使用可否を決定することができる。また、合成がん生存遺伝子対に属する変異遺伝子の組み合わせせの中で、特定がん腫別に当該がん腫で多数の患者から発見される一つ以上の変異遺伝子の組み合わせを選定し、個別患者のゲノム塩基配列分析結果とは独立して、一般的に、当該がん腫の多数の患者で治療効果及び予後が良いと予測される一つ以上の抗がん治療薬物の組み合わせを選択して、各がん腫別に特化された複合抗がん療法（ｃｏｍｂｉｎａｔｉｏｎｃｈｅｍｏｔｈｅｒａｐｙ）の開発及び臨床適用に活用できる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。

また、本発明による方法及びシステムは、合成がん生存遺伝子対の個人別の塩基配列変異の頻度及び分布分析を通じて、がんの予後を予測するのに使用されることができ、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じてがんの予後を予測するのに使用されることができる。また、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じて、薬物治療反応性を予測するのにも効果的に使用されることができる。

前記方法は、前記がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対に属する一つ以上の遺伝子の数及び体細胞突然変異遺伝子の数を算出する段階を含むことができる。

本発明の一実施例では、合成がん生存遺伝子対を多く有するほど、がん患者の生存率が統計学的に有意に高まることを確認したが、がん患者の遺伝対分析を通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担を確認することで、当該がん患者の生存予後を効果的に予測することができる。

本発明の一実施例では、カスタマイズ型の薬物選択方法を適用して選択した薬物を患者に処置した場合、当該薬物に対する治療反応も、当該薬物が遮断する遺伝子により増加する合成がん生存遺伝子対の個数分析を通じて予測することができることを確認し、さらに具体的に、当該処置薬物が当該患者の合成がん生存遺伝子対の個数を増やす程度によって当該治療反応を予測することができ、逆に当該治療反応の向上が大きい薬物にカスタマイズの治療薬物を選択することができることを確認した。

本発明に利用されるコンピュータ読み取り可能な媒体については、既に上述したので、重複を避けるためにその記載を省略する。

以下で、本発明の理解を助けるために、好ましい実施例を提示する。しかし、下記の実施例は、本発明をより容易に理解するために提供されるだけで、実施例によって本発明の内容が限定されるものではない。

実施例１．がん腫別合成がん生存遺伝子対の検出及びこれを利用したカスタマイズ型の薬物選択方法

１−１．対象データの選定
分析のためのデータをＴＣＧＡデータポータルから２０１５年３月４日を基準としてダウンロードした。前記データは、５６１８人のｌｅｖｅｌ２体細胞突然変異（ｓｏｍａｔｉｃｍｕｔａｔｉｏｎ）データと６８３８人のｌｅｖｅｌ２の臨床データを含んでいる。前記ｌｅｖｅｌ２体細胞突然変異データは、ｍａｆ（ｍｕｔａｔｉｏｎａｎｎｏｔａｔｉｏｎｆｏｒｍａｔ）形式で格納されている。分析のために、突然変異位置と突然変異分類が適用された。突然変異は、「Ｍｉｓｓｅｎｓｅｍｕｔａｔｉｏｎ」、「Ｎｏｎｓｅｎｓｅｍｕｔａｔｉｏｎ」、「Ｆｒａｍｅｓｈｉｆｔｉｎｄｅｌ」、「Ｉｎｆｒａｍｅｉｎｄｅｌ」、「ｓｐｌｉｃｅｓｉｔｅｍｕｔａｔｉｏｎ；Ｓｉｌｅｎｔｍｕｔａｔｉｏｎ」、「Ｉｎｔｒｏｎ」、「ＵＴＲ」及び「Ｉｎｔｅｒｇｅｎｉｃ」などに分類されている。前記ｌｅｖｅｌ２の臨床データは、がん腫による多様な臨床変因を含んでおり、実際的にＣｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌに使用された変因は、専門的な病理学者によって検討された。

１−２．データの処理及び分析データの構成
先ず、臨床データのうちＣｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌのための情報がない患者のデータを除いた。次に、他の悪性腫瘍を持っているか転移が発生した患者、放射線治療、ｐｈａｒｍａｃｏ、ａｂｌａｔｉｏｎａｄｊｕｖａｎｔ治療のある患者を確認した後、前記要因が患者予後の強い撹乱変因である点を考慮して、当該患者のデータを除いた。また、突然変異データのない患者のデータを除いた。さらに具体的に、突然変異データは、先ずｓｙｎｏｎｙｍｏｕｓ突然変異を除いた後、ＨＧＮＣｓｙｍｂｏｌのない遺伝子でデータに「Ｕｎｋｎｏｗｎ」と表記された遺伝子を除いた。最後に、臨床情報のない患者のデータを除き、最終的に４，８４４人の患者のデータを利用して以降の分析に使用した。

データ処理の結果、２０個のがん腫で４，８８４人の臨床データと体細胞突然変異データを得た。このように得られたデータは、二つのデータタイプを全て持っており、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌに必要な全ての臨床変因データを持っており、以降の分析に使用した。

１−３．遺伝子損傷点数
本実施例では、遺伝子の有害程度を定量化するために、遺伝子損傷点数（ＧｅｎｅＤｅｌｅｔｅｒｉｏｕｓｎｅｓｓＳｃｏｒｅ、ＧＤＳ）を定義した。遺伝子損傷点数は、当該遺伝子の突然変異個数と種類を考慮して計算され、０点から１点間の値を有するように定義された。遺伝子損傷点数は、より小さい点数であるほど当該遺伝子の機能的構造的損傷がさらに激しいという意味で定義された。例えば、もしある遺伝子がｎｏｎｓｅｎｓｅｍｕｔａｔｉｏｎ、ｆｒａｍｅｓｈｉｆｔｉｎｓｅｒｔｉｏｎａｎｄｄｅｌｅｔｉｏｎ、ｎｏｎｓｔｏｐｍｕｔａｔｉｏｎａｎｄｓｐｌｉｃｅｓｉｔｅｍｕｔａｔｉｏｎのような機能喪失変異（ＬｏｓｓｏｆＦｕｎｃｔｉｏｎ（ＬｏＦ）Ｖａｒｉａｎｔ）を持っていれば、当該遺伝子の遺伝子損傷点数は０点と決めた。もしある遺伝子がＬｏＦ変異を持たなければ、当該遺伝子の遺伝子損傷点数は、当該遺伝子にある全てのｎｏｎ−ｓｙｎｏｎｙｍｏｕｓ突然変異のうち、ＳＩＦＴ点数が０．７以下の突然変異のＳＩＦＴ点数の幾何平均で決めた。この時、分母が０になる場合を避けるために、ＳＩＦＴ点数が０点であれば、これを１０ｅ−８点に代替した。前記ＳＩＦＴ点数０．７のフィルタリング基準は、本実施例の場合に適用された任意的なフィルタリング基準であり、分析の目的によって多様なフィルタリング基準を適用することができる。また、分母が０になることを避けるために付与した１０ｅ−８点の変異点数も、本実施例の場合に適用された任意的な基準であり、分析の目的によって様々な基準を適用することができる。本実施例で遺伝子損傷点数を算出するために使用されたＳＩＦＴアルゴリズム（下記の数３参照）も、本実施例の場合に適用された任意的なアルゴリズムであり、分析の目的によって多様なアルゴリズムを適用することができる。

１−４．遺伝子損傷点数の分布と分析閾値の設定
前記実施例１−２で分類した分析データを元に、それぞれのがん腫で少なくとも一つ以上のｎｏｎ−ｓｙｎｏｎｙｍｏｕｓｍｕｔａｔｉｏｎを有する全ての遺伝子の遺伝子損傷点数を計算した。ｎｏｎ−ｓｙｎｏｎｙｍｏｕｓｍｕｔａｔｉｏｎを一つも持たない遺伝子には、１点の遺伝子損傷点数を付与した。

その結果、がん細胞で多数の体細胞突然変異が発生するが、全体の遺伝子で体細胞突然変異が発生することはよくある現象ではないため、殆どの遺伝子の遺伝子損傷点数は１点であることを確認することができた。１点の他には、体細胞突然変異を示す多数の遺伝子の遺伝子損傷点数が０点に分布した。本実施例では、遺伝子損傷点数０．３点を基準（分析閾値）として中等度以上の遺伝子機能の損傷が起こった遺伝子と、そうでない遺伝子の二群に分けて、以降の分析に使用した。

１−５．がん腫別合成がん生存遺伝子対の検出とがん腫別合成がん生存遺伝子のネットワーク構築
がん患者のゲノムデータから合成がん生存（ＳＣＳ、ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）の現象を検出するために、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを使用した生存分析を行った。Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌは、臨床変因の撹乱作用を補正することができる。それぞれのがん腫別患者群を全ての遺伝子対に対して４群に分けた。二つの遺伝子とも遺伝子損傷点数が０．３以下の対損傷群、二つの遺伝子のうち一つの遺伝子の遺伝子損傷点数のみが０．３以下であり、他の一つは、そうでない二つの外損傷群、及び二つの遺伝子とも遺伝子損傷点数が０．３より大きい非損傷群。

よく使用される最尤度（ｍａｘｉｍｕｍｌｉｋｅｌｉｈｏｏｄ）基盤のＣｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌの場合、患者死亡事件が０回の場合に「収斂（ｃｏｎｖｅｒｇｅｎｃｅ）」の問題が発生するため、本実施例では、これを避けるためにｐｅｎａｌｉｚｅｄｌｉｋｅｌｉｈｏｏｄを利用したＣｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを使用した。生存分析は、ＲＳｔａｔｉｓｔｉｃａｌＰａｃｋａｇｅバージョン３．２．０の「ｃｏｘｐｈｆ」パッケージを利用して進行した。また、それぞれのがん腫別に臨床変数の撹乱作用を補正するために、Ｃｏｘ模型に追加された。年齢や性別のような一般的な臨床変因と病理学専門医が検討し、以前の研究で使用された臨床変因を追加した。

図１に、皮膚黒色種患者群をＤＮＡＨ２遺伝子とＸＩＲＰ２遺伝子対の体細胞突然変異状態によって一つの対損傷群、二つの外損傷群及び一つの非損傷群などの計４群に分けて、それぞれの生存曲線を例示した。この時、４群の生存曲線と共に生存分析結果を表記した。図１に示すように、ＤＮＡＨ２遺伝子とＸＩＲＰ２遺伝子は、互いに合成がん生存遺伝子対の関係にあることが分かる。つまり、ＤＮＡＨ２とＸＩＲＰ２対において、ＤＮＡＨのみが遺伝子損傷点数が低いか（青色線）ＸＩＲＰのみが遺伝子損傷点数が低い（黄色線）外損傷群の場合、二つの遺伝子とも遺伝子損傷点数は低くない非損傷群（緑色線）と比較した時、がん生存率で有意な差を示さないが、ＤＮＡＨ２とＸＩＲＰ２の遺伝子損傷点数が全て低い対損傷群は、残りの三つの群全てに比べて統計学的に有意にがん患者の生存率が高い（ｐ＜０．０５、ＨＲ＞１．０）ことを確認することができた。従って、皮膚黒色種で体細胞突然変異を示すＤＮＡＨ２遺伝子とＸＩＲＰ２遺伝子対は、上記で定義した皮膚黒色種の合成がん生存遺伝子対の判断基準に符合することを確認した。

また、図２に、５種のがん腫（肺腺がん、皮膚黒色種、肺扁平上皮がん、頭頸部扁平上皮がん、腎臓細胞がん）で各がん腫別に得た合成がん生存遺伝子対で構成された合成がん生存遺伝子ネットワークを例示した。肺腺がん（ＬＵＡＤ）合成がん生存遺伝子対は、赤色の連結線で、皮膚黒色種（ＳＫＣＭ）合成がん生存遺伝子対は、黄色の連結線で、肺扁平上皮がん（ＬＵＳＣ）合成がん生存遺伝子対は、青色の連結線で、頭頸部扁平上皮がん（ＨＮＳＣ）合成がん生存遺伝子対は、茶色の連結線で、腎臓細胞がん（ＫＩＲＰ）合成がん生存遺伝子対は、紫色の連結線で表記した。図２に示すように、各がん腫別に多様な合成がん生存（ＳＣＳ）遺伝子対が存在することを確認することができ、これに対する具体的な説明は、実施例２に開示した。

本実施例では、実際のがん患者のがんゲノム変異情報の分析を通じて多様な合成がん生存遺伝子対を得ているが、これは、応用可能な多様な方法のうち一つの方法であるだけで、当該方法だけに制限されない。例えば、細胞株または動物実験環境で様々な方式で遺伝子変異を誘発し、実際のがん患者では観察され難い変異遺伝子の分析を通じて合成がん生存遺伝子対を得て、合成がん生存遺伝子ネットワークを構成することができる。特に、実施例５及び図９〜図１０に例示されたように、ＩｎｖａｓｉｏｎＡｓｓａｙを含むがん細胞転移能力を同定するための様々な実験方法を使用して、合成がん生存遺伝子対が得られる。

１−６．がん腫別合成がん生存遺伝子対の分析を利用したカスタマイズ型の薬物選択方法
本発明によるがん患者のゲノム突然変異と生存分析方法及びシステムを通じて、がん腫別合成がん生存遺伝子対を効果的かつ効率的に求め、これを利用してカスタマイズ型の薬物選択を行うための方法を説明するために、下記のような実験を行った。

図３に、ある肺腺がん患者の体細胞突然変異の分布を合成がん生存遺伝子対のネットワークに重ねて図示した。図３のノードと連結線は、肺腺がんゲノムシーケンシングデータを分析して獲得した合成がん生存遺伝子対のネットワークを意味する。この時、ノードは、それぞれの遺伝子を意味し、連結線で連結された一対の遺伝子は、肺腺がんの合成がん生存遺伝子対であることを意味する。赤色で塗られた遺伝子ノードは、当該がん患者で対応する遺伝子と共に合成がん生存遺伝子対をなして体細胞突然変異が発見される遺伝子を意味する。黄色で塗られた遺伝子ノードは、当該遺伝子は、低い遺伝子損傷点数を示す体細胞突然変異を有する遺伝子であるが、当該遺伝子と対をなして合成がん生存遺伝子対をなす遺伝子の中では、低い遺伝子損傷点数を示す体細胞突然変異を有する対応遺伝子が一つも発見されず、合成がん生存遺伝子対をなしていない遺伝子を意味する。灰色で塗られた遺伝子ノードは、当該がん患者で低い遺伝子損傷点数を示す体細胞突然変異が発見されない遺伝子を意味する。

従って、図３は、灰色で塗られた遺伝子の中で合成がん生存遺伝子ネットワーク情報を考慮して選定した一つ以上の遺伝子を当該の遺伝子に対する一つ以上の遮断剤で抑制すれば、他の遺伝子とどのように幾つの合成がん生存遺伝子対をなすかが分かる方法を例示する。例えば、図３に例示された肺腺がん患者のがん細胞にＸＩＲＰ２遮断剤を処理すれば、ＲＹＲ２、ＬＰＡ、ＦＡＴ４等の遺伝子と複数の合成がん生存遺伝子対をなし、当該肺腺がん患者の生存率が向上可能なことを予測することができる。また、前記肺腺がん患者のがん細胞にＲＹＲ３を遮断しても、複数の遺伝子と合成がん生存遺伝子対をなすことができることが分かるが、ＲＹＲ３の場合、Ｄａｎｄｒｏｌｅｎｅなどのカルシウムチャネル遮断剤で遮断することができる。最近では、抗体新薬の開発を通じて特定遺伝子を遮断することが可能であるため、本発明による合成遺伝子対の分析を通じて新しい新薬開発の標的遺伝子を選別することも可能である。一研究（Ｚｈａｎｇｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１１Ａｕｇ１６；１０８（３３）：１３６５３−１３６５８．）によると、ＲＹＲ３を抑制するｍｉｃｒｏ−ＲＮＡｍｉＲ−３６７の結合部位の単一塩基多型性によって卵巣がんの予後が異なることを明らかにし、このような所見が本発明の結果物である合成がん生存遺伝子対の主要参加遺伝子であるＲＹＲ３遮断効果によるものであるかは未だ明らかでないが、本発明の結果物である合成がん生存ゲノム上の関係を通じて予後の差異を示した学術的蓋然性は高いと推定することができる。新薬の開発は、その効果性だけでなく副作用といった安全性も共に考慮して開発しなければならないが、本実施例は、がん患者のゲノム情報の次世代のシーケンシングデータ分析を通じて本発明で究明した合成がん生存遺伝子対の特性を活用して、がん患者のカスタマイズ型の薬物選択及び開発に有用な情報が提供可能なことを示す。

実施例２．がん腫別合成がん生存遺伝子対の分布及び予後の予測
前記実施例１で提示したように、合成がん生存遺伝子分析を行った結果、５つのがん腫で４３６個の合成がん生存遺伝子対を選定し、その結果を表１に示した（ｐ＜０．０５、ＨＲ＞１）。本実施例で使用された合成がん生存遺伝子対の選別基準は、厳格に適用された。合成がん生存遺伝子対を検出するための様々な条件の組み合わせが可能なことは明確であるが、実施例１に例示したように、対損傷群と非損傷群との比較でも統計的に有意な差異を示し、対損傷群と二つの外損傷群とのそれぞれの比較でも統計的に有意な差異を示す一方、非損傷群と二つの外損傷群との間の三回の比較では統計的に有意な差異を示さない厳格な判断基準を適用して、がん腫別合成がん生存遺伝子対を選定した。

表１に示すように、肺腺がん（Ｌｕｎｇａｄｅｎｏｃａｒｃｉｎｏｍａ、ＬＵＡＣ）及び皮膚黒色種（Ｓｋｉｎｃｕｔａｎｅｏｕｓｍｅｌａｎｏｍａ、ＳＫＣＭ）で特に多くの合成がん生存遺伝子対を選別し、本実施例で選定した４３６個の合成がん生存遺伝子対は、さらに具体的には、２８１個の遺伝子で構成されており、最も多くの合成がん生存遺伝子対に属する遺伝子は、ＸＩＲＰ２とＲＹＲ３などである。

本実施例の判断基準を適用して、５個のがん腫別に得た４３６個の合成がん生存遺伝子対のリストを表２に示した。

合成がん生存遺伝子対に属する二つの遺伝子のうち、二つとも低い遺伝子損傷点数を有する変異遺伝子の場合、当該二つの遺伝子は合成がん生存遺伝子対を構成したと定義する。合成がん生存遺伝子対に属する二つの遺伝子のうち、一つは低い遺伝子損傷点数を有する変異遺伝子であり、他の一つは遺伝子損傷点数は低くない対応遺伝子の場合、当該対応遺伝子を抑制する薬物を利用すれば、当該がん患者の生存率が高められると予測することができる。

図２に、前記表２に開示した合成がん生存遺伝子対で構成された遺伝子ネットワークを多重グラフで例示した。この時、それぞれのノードは遺伝子であり、互いに連結線で連結された遺伝子対は、合成がん生存遺伝子対を意味する。

また、図４に、肺腺がん患者群で遺伝子損傷点数が０．３点以下の変異遺伝子の頻度をバーグラフで図示し、図５に、肺腺がんから検出された合成がん生存遺伝子対に属する変異遺伝子が肺腺がん患者から発見される頻度を図示した。

図４及び図５に示すように、多くの患者でＸＩＲＰ２とＲＹＲ３遺伝子が合成がん生存遺伝子対を構成していることが分かる。一方、ＴＴＮ遺伝子の場合、ＴＴＮ遺伝子の遺伝子損傷点数が低い患者の数は多かったが、ＴＴＮ遺伝子が合成がん生存遺伝子対をなす患者の数は相対的に少ないことが分かった。即ち、従来の研究は、がん遺伝子の体細胞突然変異頻度を中心として行われてきたが、単に個別遺伝子の突然変異の分析だけでは、がん患者の予後及び治療反応の予測が容易でなく、本発明のように遺伝子対の分析及び遺伝子ネットワークの分析ががん患者の予後及び治療反応の予測に大きく寄与することができることを示唆する。

実施例３．がん腫別合成がん生存の負担を利用したがんの生存及び予後の予測
がん患者の合成がん生存遺伝子対の個数ががん患者の予後と生存率に及ぼす影響を分析した。その一例として、３４１人の肺腺がん患者（ＬＵＡＤ）と１８１人の皮膚黒色種患者（ＳＫＣＭ）における結果を図６及び図７にそれぞれ示した。

先ず、３４１人の肺腺がん患者を、合成がん生存遺伝子対を一つも持っていない１４９人、１つ以上〜１０個未満を持っている１２２人、及び１０個以上を持っている７０人と、計三群に分けて、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを適用した生存分析を行った。その結果、図６に示すように、合成がん生存遺伝子対を最も多く持っている（１０個以上を持っている）７０人の生存率が最も高く、１つ以上〜１０個未満を持っている１２２人の生存率が中間値を表し、合成がん生存遺伝子対を一つも持っていない１４９人の生存率が最も低いことを確認し、これを通じて、合成がん生存遺伝子対を多く持つほど肺腺がん患者の生存率が統計学的に有意に高いことを確認することができた。

次に、１８１人の皮膚黒色種患者を、合成がん生存遺伝子対を一つも持っていない８８人、１つ以上〜５個未満を持っている４７人、及び５個以上持っている４６人と、計三群に分けて、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを適用した生存分析を行った。その結果、図７に示すように、合成がん生存遺伝子対を多く持つほど皮膚黒色種患者の生存率が統計学的に有意に高いことを確認することができた。

以上の実験を通じて、がん患者の遺伝対分析を通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担を確認することで、当該がん患者の生存予後を効果的に予測することができることを確認した。

実施例４．がん腫別合成がん生存の負担と体細胞突然変異の負担を利用したがんの生存及び予後の予測
前記実施例３で開示したがん患者から発見される合成がん生存遺伝子対の個数を活用したがん患者の生存率の分析は、医学的に非常に重要な意味を有する。現在、一般的には、がん細胞のｎｏｎ−ｓｙｎｏｎｙｍｏｕｓ体細胞突然変異が多いほどがん患者の予後が悪いと知られていたが、これとは異なる分析結果だからである。

さらに具体的に、合成がん生存遺伝子対の個数とｎｏｎ−ｓｙｎｏｎｙｍｏｕｓ体細胞突然変異の頻度をログ−ロググラフで示した（図８）。図８に示すように、合成がん生存遺伝子対の個数は、肺腺がんと皮膚黒色種の両方でｎｏｎ−ｓｙｎｏｎｙｍｏｕｓ体細胞突然変異の頻度と正比例する。従って、体細胞突然変異が多いほど予後が悪いとされる現在の一般的な見解によると、体細胞突然変異の負担に正比例するがん生存遺伝子対の個数が多いほど予後が悪く表れる可能性は高いと判断することができる。しかし、実施例３の結果は、合成がん生存遺伝子対の個数が多いほど予後が良いことを示す。つまり、実施例３に開示したように、合成がん生存遺伝子対の個数が多い患者の場合、体細胞突然変異も共に増える可能性が高いが、体細胞突然変異の特殊な形態である合成がん生存遺伝子対の変異がさらに増えれば、むしろ予後が良いことが分かる。

このようながん腫別合成がん生存の負担と体細胞突然変異の負担のがん患者の予後に与える影響の逆相関関係は、図６及び図７の下段に表記された各群別の生存分析グラフで明確に確認することができる。さらに具体的に、図６の下段にある３個の生存分析グラフは、３４１人の肺腺がん患者を合成がん生存遺伝子対の保有数によって三群に分けて生存分析を行った結果、三群の全てで赤色で表記された体細胞突然変異の負担がより高い患者（それぞれ７４人、６１人、３５人）が空色で表記された体細胞突然変異の負担がより低い患者（それぞれ７５人、６１人、３５人）より統計的に有意に悪い予後を示すことを提示する。

また、図７の下段にある３個の生存分析グラフは、１８１人の皮膚黒色種患者を合成がん生存遺伝子対の保有数によって三群に分けて、生存分析を行った結果、三群の全てで赤色で表記された体細胞突然変異の負担がより高い患者（それぞれ４４人、２３人、２３人）が空色で表記された体細胞突然変異の負担がより低い患者（それぞれ４４人、２４人、２３人）より統計的に有意に悪い予後を示すことを提示する。

前記結果を通じて、合成がん生存遺伝子対の個数が補正されれば、体細胞突然変異数が多いほど予後が悪いという従来の学説と一致することが分かる。逆に、図６及び図７に示した分析結果を通じて、体細胞突然変異数が多い場合でも、その突然変異数を補正すれば合成がん生存遺伝子対の負担が重要ながん予後の予測因子であることが分かる。

総合的に本発明で提示している合成がん生存遺伝子対の分析は、従来に知られた体細胞突然変異の分析と差別化される概念である。つまり、体細胞突然変異の負担が同一であれば、合成がん生存負担が大きいほど当該のがん患者の予後が良く、合成がん生存の負担が同一であれば、体細胞突然変異の負担が少ないほど当該がん患者の予後が良いと予測することが可能である。このような現象を関数化することで、がん患者の予後を予測するためにがんゲノム分析を通じて獲得可能な合成がん生存の負担と体細胞突然変異の負担情報を提供することができる。

さらに、前記実施例１で開示したように、がん患者のカスタマイズ型の薬物選択方法を適用して選択した薬物を患者に処置した場合、当該薬物に対する治療反応も当該薬物が遮断する遺伝子により増加する合成がん生存遺伝子対の個数分析を通じて予測可能なことが分かる。つまり、当該処置薬物が当該患者の合成がん生存遺伝子対の個数を増やす程度によって当該治療反応を予測することができ、逆に、当該治療反応の向上が大きい薬物でカスタマイズの治療薬物を選択することができる。

実施例５．がん腫別合成がん生存の負担と体細胞突然変異の負担を利用したがん細胞の転移能力の予測
がん患者は、がんで死亡するよりがんの転移で死亡する。がん組織自体は除去するか放射線治療などの局所治療法で統制できるが、転移がんの処置は非常に難しく、転移したがん細胞が多様な危害を誘発するからである。即ち、本発明の結果物である合成がん生存遺伝子対が多くなるほどがんの予後が良くなることは、合成がん生存遺伝子対が当該がん細胞の転移能力を低下させることと関連があると推定することができる。現在、がん細胞の転移能力を同定する方法の一つとして、細胞浸潤検査（ｃｅｌｌｉｎｖａｓｉｏｎａｓｓａｙ）がある。一例として、コーニング社で提供するＭａｔｒｉｇｅｌｉｎｖａｓｉｏｎａｓｓａｙ方法は、Ｅｎｇｅｌｂｒｅｔｈ−Ｈｏｌｍ−Ｓｗａｒｍ（ＥＨＳ）マウス肉腫細胞が分泌するゼラチン形態のタンパク質混合物であり、がん細胞がこのＭａｔｒｉｇｅｌをどれだけ入り込む能力を持っているかを定量的に評価することができる実験方法を提供する。

本発明の結果で得られた合成がん生存遺伝子対のがん転移に及ぼす影響を分析するために、肺がん細胞株５個（Ａ、Ｂ、Ｃ、Ｄ、Ｅ）でＷｈｏｌｅｅｘｏｍｅｓｅｑｕｅｎｃｉｎｇ（ＷＸＳ）とＭａｔｒｉｇｅｌｉｎｖａｓｉｏｎａｓｓａｙを進行した。実験は、二回行い検証し、最初の実験のＭａｔｒｉｇｅｌの最終濃度は３００ｕｇ／ｍｌ、培養時間は２４時間、使用細胞数はウェル当たり約７５０００個で行い、二回目の実験のＭａｔｒｉｇｅｌの最終濃度は３００ｕｇ／ｍｌ、培養時間は４２時間、使用細胞数はウェル当たり約７５０００個を実験条件として使用して、二回繰り返し実験した。実験は、計３回行われた。ＷＸＳは、ｉｌｌｎｕｍｉｎａＨｉＳｅｑ２０００Ｓｙｓｔｅｍを使用し、Ｈｇ１９バージョンのＨｕｍａｎＲｅｆｅｒｅｎｃｅＧｅｎｏｍｅを使用した。

図９は、前記５個の細胞株の体細胞突然変異の負担と合成がん生存の負担の分布を例示する。図９は、実施例４で説明したように、合成がん生存遺伝子対の個数が体細胞突然変異の個数と正比例して増加することを示す。図１０は、Ｍａｔｒｉｇｅｌｉｎｖａｓｉｏｎａｓｓａｙの結果である各細胞株別Ｍａｔｒｉｇｅｌ浸潤能力（ｉｎｖａｓｉｖｅｎｅｓｓ）または転移能力をバーグラフで示す。つまり、フィールド当たり浸潤した細胞数が多いほど当該がん細胞株の浸潤能力あるいは転移能力が大きく、これは、がん転移能力が大きいことを意味する。従って、Ｃ、Ｂ、Ｄ、Ｅ、Ａ細胞株順でがん転移能力が高いと判断することができる。

図９に示した体細胞突然変異の負担と合成がん生存の負担の分布を活用すれば、体細胞突然変異の負担が４００個を少し超えるＤとＡの比較で、合成がん生存の負担がより大きいＡのがん転移能力がより低いと予測され、これは、図１０の棒グラフで予測通り確認される。また、体細胞突然変異の負担が４６０個前後のＢとＥの比較で、合成がん生存の負担がより大きいＥのがん転移能力がより低いと予測され、これは、図１０の棒グラフで予測通り確認される。また、合成がん生存負担３７個のＢとＡの比較で、体細胞突然変異の負担がより大きいＢのがん転移能力がより高いと予測され、これは、図１０の棒グラフで予測通り確認される。そのため、本発明の結果物である合成がん生存遺伝子対の分析を通じて、がん細胞の転移能力が評価可能なことが確認できた。本実施例では、がん細胞又は組織の浸潤能力、あるいは転移能力の同定のために、がん細胞株のＭａｔｒｉｇｅｌ細胞浸潤検査を行ったが、これに制限されない。例えば、がん細胞又は組織の浸潤能力、あるいは転移能力を評価するために、免疫能力が統制された実験動物にがん細胞または組織を移植して、より直接的にがん細胞又は組織の浸潤能力、あるいは転移能力を同定する方法が可能であり、このような様々ながん細胞又は組織の浸潤能力、あるいは転移能力の同定を通じて合成がん生存遺伝子対を発見し、合成がん生存現象を活用したカスタマイズ型の薬物選択方法は、本発明の範囲に属する。

実施例６．生物学的マーカーを活用してがんの細部群の分類による合成がん生存遺伝子対分析の有用性
本実施例は、分析対象がん腫を特定の生物学的マーカーを活用して細部群に分けた後、合成がん生存遺伝子対を検出し、カスタマイズ型の薬物選択及び予後を予測する方法を例示する。即ち、本実施例は、前記実施例１〜４で例示されたがん腫別合成がん生存分析において、従来の臨床的、病理学的がん分類体系だけでなく、主要診断、治療及び予後関連の生物学的マーカーに伴う細部群に分けて、さらに精密な合成がん生存分析を行うことが可能であり、このような生物学的マーカーを活用した細部群別合成がん生存分析が本発明の範囲に属することを例示する。

一例として、ＭＳＩ（Ｍｉｃｒｏｓａｔｅｌｌｉｔｅｉｎｓｔａｂｉｌｉｔｙ）は、大腸がんの診断、治療及び予後に非常に重要な生物学的マーカーとして知られている。本実施例は、大腸がんでＭＳＩの状態によって患者群を分けて合成がん生存分析を行うことが、上述した実施例１〜実施例４に該当する合成がん生存分析の結果を導出することができるだけでなく、さらに有用で安定した精密分析結果が得られることを例示する。

大腸がん（ＣＯＡＤ）データは、米国ＮＣＩＧＤＣ（ＮａｔｉｏｎａｌＣａｎｃｅｒＩｎｓｔｉｔｕｔｅＧｅｎｏｍｉｃＤａｔａＣｏｍｍｏｎｓ）データポータルから２０１６年７月１１日基準、ＴＣＧＡデータポータルから２０１６年３月２１日基準としてダウンロードした。前記データのうちＮＣＩＧＤＣデータは、４３３人の体細胞突然変異（ｓｏｍａｔｉｃｍｕｔａｔｉｏｎ）データを含み、ＴＣＧＡデータは、４５８人のＭＳＩ（Ｍｉｃｒｏｓａｔｅｌｌｉｔｅｉｎｓｔａｂｉｌｉｔｙ）データと４５９人の臨床データとを含んでいる。前記体細胞突然変異データは、ＶＣＦ（ＶａｒｉａｎｔＣａｌｌＦｏｒｍａｔ）ファイル形式であり、人間標準ゲノムＧＲＣｈ３８標準で整列し、ＭｕＴｅｃｔ２で変異を決定した。前記ｌｅｖｅｌ２の臨床データは、様々な臨床変因を含んでおり、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌに使用される変因は、病理学者が選別した。前記ＭＳＩデータは、各患者別にＭＳＩの状態によって「ＭＳＳ」、「ＭＳＩ−Ｌ」、「ＭＳＩ−Ｈ」に分類しており、本実施例では、ＭＳＩ−ＬとＭＳＩ−Ｈ群をＭＳＩ陽性群、ＭＳＳ群をＭＳＩ陰性群に区分して分析した。

Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌの適用に必要な情報のない患者、他の悪性腫瘍の陽性、あるいは転移陽性、放射線治療、薬物、ａｂｌａｔｉｏｎａｄｊｕｖａｎｔの治療患者のデータを除いた。そして、体細胞突然変異データとＭＳＩデータのない患者を除いた。ＶＡＴ（ＶａｒｉａｎｔＡｎｎｏｔａｔｉｏｎＴｏｏｌ）で変異の注釈を付けてｓｙｎｏｎｙｍｏｕｓ変異を除いた後、ＨＧＮＣｓｙｍｂｏｌのない遺伝子のデータを除いた。最後に、臨床情報とＭＳＩデータのない患者のデータを除いた。最終的に、４２７人の大腸がん患者が分析に使用された。

先ず、全体４２７人の大腸がん患者を対象として実施例１〜２に例示された方法で合成がん生存遺伝子対を探そうとしたが、一つの有意な合成がん生存遺伝子対も見つけられなかった。大腸がんの場合、ＭＳＩの状態によって体細胞突然変異の数及び予後が異なるので、ＭＳＩ陽性群１５１人と陰性群２７６人に区分した。ＭＳＩの状態によって大腸がん患者を二群に分けて、ＭＳＩ陽性群（ＭＳＩ−Ｌ＆ＭＳＩ−Ｈ）で１４個の有意な合成がん生存遺伝子対を検出した（ｐ＜０．０５、ＨＲ＞１）。しかし、体細胞突然変異の負担が低いＭＳＩ陰性群では、有意な合成がん生存遺伝子対が一つも発見されなかった。ＭＳＩ陽性群で検出した大腸がんの合成がん生存遺伝子対を表３に示した。

表３に示すように、１４個の合成がん生存遺伝子対は、１７個の遺伝子で構成され、細胞のｍｏｔｏｒａｃｔｉｖｉｔｙやｎｕｃｌｅｏｓｉｄｅ／ｎｕｃｌｅｏｔｉｄｅｂｉｎｄｉｎｇと関連した。特に、ＭＳＩ群でＯＢＳＣＮ遺伝子とＰＩＫ３ＣＡ遺伝子が互いに合成がん生存遺伝子対をなすことを確認した。つまり、ＯＢＳＣＮとＰＩＫ３ＣＡ対において、ＯＢＳＣＮのみが遺伝子損傷点数が低いか、ＩＫ３ＣＡのみが遺伝子損傷点数が低い外損傷群の二群は、二つの遺伝子とも遺伝子損傷点数は低くない非損傷群と比較した時、がん生存率で有意な差異を示さなかったが、ＯＢＳＣＮとＰＩＫ３ＣＡの遺伝子損傷点数が低い対損傷群は、残りの三群全てに比べて統計学的に有意にがん患者の生存率が高い（ｐ＜０．０５、ＨＲ＞１．０）ことを確認することができた。従って、大腸がんで体細胞突然変異を示すＯＢＳＣＮ遺伝子とＰＩＫ３ＣＡ遺伝子対は、上記で定義した大腸がんの合成がん生存遺伝子対の判断基準に符合することを確認した。

次に、実施例３と同様に、合成がん生存遺伝子対の個数ががん患者の予後と生存率に及ぼす影響を分析した。その結果を表４に示した。

表４に示すように、４２７人の大腸がん患者を合成がん生存遺伝子対を一つも持たない３４５人、１つ以上持った８２人の二群に分けて、Ｃｏｘｐｒｏｐｏｒｔｉｏｎａｌｈａｚａｒｄｍｏｄｅｌを適用した生存分析を行った結果、合成がん生存遺伝子対を持った８２人の生存率が統計学的に有意に高いことを確認することができた（ｐ＜０．０００５、ＨＲ＞１．０）。これを通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担の確認を通じて、当該がん患者の生存予後が予測可能なことが分かった。

上述したように、同一のデータでＭＳＩの状態を区分せず全体の大腸がん患者を対象として行った分析で合成がん生存遺伝子対が一つも発見されなかったことと比較して、以上の結果は非常に重要な医学的意味を有する。一般的に、全体の大腸がん患者を使用した場合のように、より多くの患者を対象として統計分析を行う場合、有意な結果が検出される確率が高いと知られている。

しかし、本実施例は、生物学的マーカーを基準として区分したさらに同質的な群で合成がん生存分析を行うことがより精密な結果が提供可能なことを例示する。例えば、乳がんは、ＥＲ（ＥｓｔｒｏｇｅｎＲｅｃｅｐｔｏｒ）、ＰＲ（ＰｒｏｇｅｓｔｅｒｏｎＲｅｃｅｐｔｏｒ）などのホルモン受容体発現有無によって、診断、治療、予後に重大な影響を及ぼすため、臨床的な細部群を分けて判断する。従って、本実施例は、最新の生物学的マーカーによって同じがん腫も多様な細部群に分けて合成がん生存分析を行うことが有用かつ効果的なことを例示し、このような方法が本発明の範囲に属することを例示する。

Claims

がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対に属する一つ以上の遺伝子の塩基配列変異情報を決定する段階と、
前記塩基配列変異情報から合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選定する段階とを含む、
がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記遺伝子塩基配列変異情報は、遺伝子のエクソン（ｅｘｏｎ）を構成する塩基の置換、付加または結実である、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記塩基の置換、付加または結実は、染色体の切断、結実、重複、逆位または転座を含む構造的異常による、請求項２に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記遺伝子塩基配列変異情報は、参照群のゲノム塩基配列との比較分析を通じて得られる、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記変異遺伝子と前記対応遺伝子は、機能喪失変異（ＬｏｓｓｏｆＦｕｎｃｔｉｏｎ（ＬｏＦ）Ｖａｒｉａｎｔ）を保有しているか否かを基準として算出される、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記変異遺伝子と前記対応遺伝子は、各当該遺伝子が保有した遺伝子塩基配列変異点数によって決定される、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記変異遺伝子と前記対応遺伝子は、ＳＩＦＴ（ＳｏｒｔｉｎｇＩｎｔｏｌｅｒａｎｔＦｒｏｍＴｏｌｅｒａｎｔ）、ＰｏｌｙＰｈｅｎ、ＰｏｌｙＰｈｅｎ−２（ＰｏｌｙｍｏｒｐｈｉｓｍＰｈｅｎｏｔｙｐｉｎｇ）、ＭＡＰＰ（ＭｕｌｔｉｖａｒｉａｔｅＡｎａｌｙｓｉｓｏｆＰｒｏｔｅｉｎＰｏｌｙｍｏｒｐｈｉｓｍ）、Ｌｏｇｒｅ（ＬｏｇＲＰｆａｍＥ−ｖａｌｕｅ）、ＭｕｔａｔｉｏｎＡｓｓｅｓｓｏｒ、Ｃｏｎｄｅｌ、ＧＥＲＰ（ＧｅｎｏｍｉｃＥｖｏｌｕｔｉｏｎａｒｙＲａｔｅＰｒｏｆｉｌｉｎｇ）、ＣＡＤＤ（ＣｏｍｂｉｎｅｄＡｎｎｏｔａｔｉｏｎ−ＤｅｐｅｎｄｅｎｔＤｅｐｌｅｔｉｏｎ）、ＭｕｔａｔｉｏｎＴａｓｔｅｒ、ＭｕｔａｔｉｏｎＴａｓｔｅｒ２、ＰＲＯＶＥＡＮ、ＰＭｕｉｔ、ＣＥＯ（ＣｏｍｂｉｎａｔｏｒｉａｌＥｎｔｒｏｐｙＯｐｔｉｍｉｚａｔｉｏｎ）、ＳＮＰｅｆｆｅｃｔ、ｆａｔｈｍｍ、ＭＳＲＶ（ＭｕｌｔｉｐｌｅＳｅｌｅｃｔｉｏｎＲｕｌｅＶｏｔｉｎｇ）、Ａｌｉｇｎ−ＧＶＧＤ、ＤＡＮＮ、Ｅｉｇｅｎ、ＫＧＧＳｅｑ、ＬＲＴ（ＬｉｋｅｌｉｈｏｏｄＲａｔｉｏＴｅｓｔ）、ＭｅｔａＬＲ、ＭｅｔａＳＶＭ、ＭｕｔＰｒｅｄ、ＰＡＮＴＨＥＲ、Ｐａｒｅｐｒｏ、ｐｈａｓｔＣｏｎｓ、ＰｈＤ−ＳＮＰ、ｐｈｙｌｏＰ、ＰＯＮ−Ｐ、ＰＯＮ−Ｐ２、ＳｉＰｈｙ、ＳＮＡＰ、ＳＮＰｓ＆ＧＯ、ＶＥＰ（ＶａｒｉａｎｔＥｆｆｅｃｔＰｒｅｄｉｃｔｏｒ）、ＶＥＳＴ（ＶａｒｉａｎｔＥｆｆｅｃｔＳｃｏｒｉｎｇＴｏｏｌ）、ＳＮＡＰ２、ＣＡＲＯＬ、ＰａＰＩ、Ｇｒａｎｔｈａｍ、ＳＩｎＢａＤ、ＶＡＡＳＴ、ＲＥＶＥＬ、ＣＨＡＳＭ（Ｃａｎｃｅｒ−ｓｐｅｃｉｆｉｃＨｉｇｈ−ｔｈｒｏｕｇｈｐｕｔＡｎｎｏｔａｔｉｏｎｏｆＳｏｍａｔｉｃＭｕｔａｔｉｏｎｓ）、ｍＣｌｕｓｔｅｒ、ｎｓＳＮＰＡｎａｙｚｅｒ、ＳＡＡＰｐｒｅｄ、ＨａｎＳａ、ＣａｎＰｒｅｄｉｃｔ、ＦＩＳ及びＢＯＮＧＯ（ＢｏｎｄｓＯＮＧｒａｐｈｓ）からなる群より選択されたいずれか一つ以上のアルゴリズムを各当該遺伝子が保有した遺伝子塩基配列変異に適用して算出された一つ以上の遺伝子塩基配列変異点数から算出される、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記変異遺伝子と前記対応遺伝子は、ＳＩＦＴ（ＳｏｒｔｉｎｇＩｎｔｏｌｅｒａｎｔＦｒｏｍＴｏｌｅｒａｎｔ）、ＰｏｌｙＰｈｅｎ、ＰｏｌｙＰｈｅｎ−２（ＰｏｌｙｍｏｒｐｈｉｓｍＰｈｅｎｏｔｙｐｉｎｇ）、ＭＡＰＰ（ＭｕｌｔｉｖａｒｉａｔｅＡｎａｌｙｓｉｓｏｆＰｒｏｔｅｉｎＰｏｌｙｍｏｒｐｈｉｓｍ）、Ｌｏｇｒｅ（ＬｏｇＲＰｆａｍＥ−ｖａｌｕｅ）、ＭｕｔａｔｉｏｎＡｓｓｅｓｓｏｒ、Ｃｏｎｄｅｌ、ＧＥＲＰ（ＧｅｎｏｍｉｃＥｖｏｌｕｔｉｏｎａｒｙＲａｔｅＰｒｏｆｉｌｉｎｇ）、ＣＡＤＤ（ＣｏｍｂｉｎｅｄＡｎｎｏｔａｔｉｏｎ−ＤｅｐｅｎｄｅｎｔＤｅｐｌｅｔｉｏｎ）、ＭｕｔａｔｉｏｎＴａｓｔｅｒ、ＭｕｔａｔｉｏｎＴａｓｔｅｒ２、ＰＲＯＶＥＡＮ、ＰＭｕｉｔ、ＣＥＯ（ＣｏｍｂｉｎａｔｏｒｉａｌＥｎｔｒｏｐｙＯｐｔｉｍｉｚａｔｉｏｎ）、ＳＮＰｅｆｆｅｃｔ、ｆａｔｈｍｍ、ＭＳＲＶ（ＭｕｌｔｉｐｌｅＳｅｌｅｃｔｉｏｎＲｕｌｅＶｏｔｉｎｇ）、Ａｌｉｇｎ−ＧＶＧＤ、ＤＡＮＮ、Ｅｉｇｅｎ、ＫＧＧＳｅｑ、ＬＲＴ（ＬｉｋｅｌｉｈｏｏｄＲａｔｉｏＴｅｓｔ）、ＭｅｔａＬＲ、ＭｅｔａＳＶＭ、ＭｕｔＰｒｅｄ、ＰＡＮＴＨＥＲ、Ｐａｒｅｐｒｏ、ｐｈａｓｔＣｏｎｓ、ＰｈＤ−ＳＮＰ、ｐｈｙｌｏＰ、ＰＯＮ−Ｐ、ＰＯＮ−Ｐ２、ＳｉＰｈｙ、ＳＮＡＰ、ＳＮＰｓ＆ＧＯ、ＶＥＰ（ＶａｒｉａｎｔＥｆｆｅｃｔＰｒｅｄｉｃｔｏｒ）、ＶＥＳＴ（ＶａｒｉａｎｔＥｆｆｅｃｔＳｃｏｒｉｎｇＴｏｏｌ）、ＳＮＡＰ２、ＣＡＲＯＬ、ＰａＰＩ、Ｇｒａｎｔｈａｍ、ＳＩｎＢａＤ、ＶＡＡＳＴ、ＲＥＶＥＬ、ＣＨＡＳＭ（Ｃａｎｃｅｒ−ｓｐｅｃｉｆｉｃＨｉｇｈ−ｔｈｒｏｕｇｈｐｕｔＡｎｎｏｔａｔｉｏｎｏｆＳｏｍａｔｉｃＭｕｔａｔｉｏｎｓ）、ｍＣｌｕｓｔｅｒ、ｎｓＳＮＰＡｎａｙｚｅｒ、ＳＡＡＰｐｒｅｄ、ＨａｎＳａ、ＣａｎＰｒｅｄｉｃｔ、ＦＩＳ及びＢＯＮＧＯ（ＢｏｎｄｓＯＮＧｒａｐｈｓ）からなる群より選択されたいずれか一つ以上のアルゴリズムを各当該遺伝子が保有した遺伝子塩基配列変異に適用して算出された一つ以上の遺伝子塩基配列変異点数から算出される遺伝子損傷点数によって決定される、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記変異遺伝子と前記対応遺伝子は、各当該遺伝子が保有した遺伝子塩基配列変異が二つ以上の場合、各遺伝子塩基配列変異点数の平均値として算出される遺伝子損傷点数によって決定される、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記平均値は、幾何平均、算術平均、調和平均、算術幾何平均、算術調和平均、幾何調和平均、ピタゴラス平均、ヘロン平均、逆調和平均、平均平方根偏差、セントロイド平均、四分平均、二次平均、切削平均、ウィンザー化平均、加重平均、加重幾何平均、加重算術平均、加重調和平均、関数の平均、冪平均、一般化されたｆ−平均、百分位数、最大値、最小値、最頻値、中央値、中央範囲、中心傾向度（ｍｅａｓｕｒｅｓｏｆｃｅｎｔｒａｌｔｅｎｄｅｎｃｙ）、単純積及び加重積からなる群より選択されたいずれか一つ以上によって計算される、請求項９に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記遺伝子損傷点数は、下記数１によって算出される、請求項８に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記数１において、Ｓｇは、遺伝子ｇがコーディングするタンパク質の遺伝子損傷点数、ｎは、前記遺伝子ｇの塩基配列変異の中で分析対象の塩基配列変異の数、ｖｉは、ｉ番目の分析対象の塩基配列変異の前記塩基配列変異点数であり、ｐは、０でない実数である。
前記遺伝子損傷点数は、下記数２によって算出される、請求項８に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記数２において、Ｓｇは、遺伝子ｇがコーディングするタンパク質の遺伝子損傷点数、ｎは、前記遺伝子ｇの塩基配列変異の中で分析対象の塩基配列変異の数、ｖｉは、ｉ番目の分析対象の塩基配列変異の前記遺伝子塩基配列変異点数であり、ｗｉは、前記ｉ番目の塩基配列変異の前記遺伝子塩基配列変異点数ｖｉに与えられる加重値である。
前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対を意味し、前記二つ以上の変異遺伝子の中で個別変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記合成がん生存遺伝子対情報を利用して前記がん患者に対して適用される薬物間の優先順位を決定する段階、または前記合成がん生存遺伝子対情報を利用して前記がん患者に適用される薬物を使用するか否かを決定する段階をさらに含む、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記塩基配列変異情報の決定対象である一つ以上の遺伝子が属する合成がん生存遺伝子対の選定は、
がん患者のゲノム突然変異と生存情報を利用したがん患者の生存分析を行う段階、または
がん細胞株またはがん組織におけるゲノム突然変異の分析及び、前記がん細胞株またはがん組織における浸潤能または転移能の同定を行う段階、を通じて行われる、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記がん患者の生存分析は、生物学的マーカーを基準として二つ以上の部分群に区分した後、各部分群におけるゲノム突然変異と患者生存情報を利用する、請求項１５に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
前記候補薬物の選定は、
前記がん患者のゲノム塩基配列情報から選別された合成がん生存遺伝子対に属する一つ以上の対応遺伝子と対をなす一つ以上の変異遺伝子の個数を算出し、その算出された個数を基準として候補薬物の優先順位または組み合わせを決定する段階による、請求項１に記載のがん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法。
がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムにおいて、
前記システムは、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、
前記データベースにアクセス可能な通信部と、
がんゲノム塩基配列分析部と、
薬物選択情報提供部と、
表示部とを含み、
前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、
前記薬物選択情報提供部は、前記一つ以上の対応遺伝子を抑制する抗がん治療薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システム。
下記プロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体と、
がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対を選別する段階と、
前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選別する段階とを含む動作を行うプロセッサ。
がん患者ゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対に属する一つ以上の遺伝子の数を算出する段階を含む、がん患者の予後の予測のための情報を提供する方法。
前記方法は、前記がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対に属する一つ以上の遺伝子の数及び体細胞突然変異遺伝子の数を算出する段階を含む、請求項２０に記載のがん患者の予後の予測のための情報を提供する方法。
がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムにおいて、
前記システムは、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、
前記データベースにアクセス可能な通信部と、
がんゲノム塩基配列分析部と、
薬物選択情報提供部と、
表示部とを含み、
前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子対選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、
前記薬物選択情報提供部は、前記がん患者の合成がん生存遺伝子対の個数を増加させる薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システム。
下記プロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体と、
がん患者のゲノム塩基配列情報から合成がん生存（ＳｙｎｔｈｅｔｉｃＣａｎｃｅｒＳｕｒｖｉｖａｌ）遺伝子対を選別する段階と、
前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物の中で合成がん生存遺伝子対の個数を増加させる候補薬物を選別する段階とを含む動作を行うプロセッサ。