JP2011520206A - 医療分析システム - Google Patents

医療分析システム Download PDF

Info

Publication number
JP2011520206A
JP2011520206A JP2011509052A JP2011509052A JP2011520206A JP 2011520206 A JP2011520206 A JP 2011520206A JP 2011509052 A JP2011509052 A JP 2011509052A JP 2011509052 A JP2011509052 A JP 2011509052A JP 2011520206 A JP2011520206 A JP 2011520206A
Authority
JP
Japan
Prior art keywords
clinical
data
modality
patient
analysis system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011509052A
Other languages
English (en)
Other versions
JP5464503B2 (ja
Inventor
エンジェル ジェイ ジャネブスキ
ネベンカ ディミトロバ
シチャーザン カマラカラン
ヤッサー エイチ アルサファジ
ニランジャナ バネルジー
アンカ アイ デー ブクール
リーウェン ジャスパー ジェイ アー ヴァン
ヴィナイ ヴィヴィ ヴァラダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2011520206A publication Critical patent/JP2011520206A/ja
Application granted granted Critical
Publication of JP5464503B2 publication Critical patent/JP5464503B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Bioethics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本発明は、患者の効果的な診断及び治療計画について臨床医を補助することに関係する。特に、本発明は、分子的分類の改善を可能にする医療分析システムを提供する。このシステムは、正しい化学療法を提供し、癌再発を監視するようにフォローアップするために、改善された診断、予後診断、応答予測を可能にする分子プロファイリング解決策を提供する。

Description

本発明は、医療分析システムに関する。特に、本発明は、対応するプロセス及び対応するコンピュータプログラムにも関する。
乳癌は、複数の分子変更の蓄積により駆動される複雑な遺伝子病である。高いスループットのゲノム、転写(トランスクリプトミック)及びエピ・ゲノム技術の最近の分子的進歩は、乳癌の分子的複雑さに焦点を当てることを可能にし、癌予測及び治療予測をガイドするのを助けることを可能にした。
ペロウらは、乳癌がそれらの遺伝子発現プロファイルに基づいて別々のグループに分類できることを示した。エストロゲンレセプタ陽性(ER+)のグループは、通常、胸部内腔上皮細胞(「内腔」癌)により表される遺伝子のパネルのより高い発現により特徴づけられる。ER−分岐は、腫瘍の3つのサブグループをカバーした:1)ERBB2(HER2)を過剰発現させること、2)胸部基底細胞(基底状癌)に特有の遺伝子を発現させること、3)正常のサンプル。臨床上の重要性は、ER+腫瘍が、通常、良好な予後を示し、基底状及びHER2腫瘍が劣った予後を持つことである。
遺伝子発現プロファイリングは、2つの遺伝子発現分析、Oncotype DX及びMamma Printの開発にもつながり、これらは、初期リンパ節陰性乳癌に対する患者の乳癌再発の危険度を決定する。Oncotype DXは、21個の遺伝子の発現を分析して、患者の癌再発の可能性及び化学療法から、これらのありそうな利点の評価を識別するための再発スコアを計算する。Mamma Printは、70個の遺伝子の発現を分析して、初期乳癌を持つ患者(61歳未満)が遠隔転移の高い又は低いリスクを持つとして分類可能にする。このとき、高リスク患者は、より積極的な治療で管理される。
多くの他の分子プロファイリング技術が、同様の臨床的問題に対処するために用いられる。代表的なオリゴヌクレチオドマイクロアレイ分析(ROMA)は、ゲノム増幅及び欠失を検出し、特定のコピー数変化パターンの検出を可能にして、それらの相関を患者生存に対して測定する。
乳癌のような癌診断及び局所的癌の一次治療に続いて、医師は、治療のための多くのオプションを持つ。治療のための「正しい」判断が、どのようになされるのか。伝統的に、画像診断は、腫瘍の位置、形態及び拡がりを特徴づけることにより、癌治療選択において重要な役割を果たしてきた。癌は、DNA内の変化及びその制御力と相関し、患者の腫瘍細胞分子プロファイルの特定の特徴が、「正しい」治療に臨床医を導くことができる。
今日、分子試験は、上述したER、PR及びHER2遺伝子発現のような単一の遺伝子テストに基づいて、患者を分類する。しかしながら、DNAメチル化及び遺伝子発現を使用して改善された試験のための範囲及び同様の臨床的分類を持つ腫瘍の範囲内の治療反応における重要なバリエーションが依然ある。DNAメチル化は、遺伝子コードの変化なしに遺伝子調節に影響を及ぼす。異常なDNAメチル化プロファイルは、癌のような疾患と関連している。遺伝子発現プロファイリングは、全体的なゲノムのレベルで遺伝子活性を評価する。
Agendia(Mamma Printは予後の試験である)及びGenomicHealth(Oncotype Dx)のような幾つかの小さなベンチャー及び大きい会社が、分子治療計画の領域で事業している。これらの会社のターゲット領域は、乳癌患者(リンパ節陰性、ER陽性の腫瘍を持つ患者のような)の副集合に対する化学療法のための患者の層別化である。加えて、年齢、腫瘍サイズ、リンパ節の状態、等級のような臨床的ファクタを使用して、判断サポート及び治療計画サービスを提供することに集中させる補助(アジュバント)がある。
しかしながら、分子分類の更なる改良は、結果的に臨床的重要性を異ならせる結果となり得る。よって、改良された診断、予後、正しい化学療法を提供するための反応予測、及び癌再発を監視する追跡調査を提供する分子プロファイリング解決案の臨床的ニーズがある。
よって、改良された医療判断ツール又はシステムは有利であり、特に、より効率的及び/又は信頼性が高いシステムは有利である。
従って、本発明は、好ましくは、上述の不具合の一つ以上を単独で又は組み合わせて緩和し、軽減し、又は排除するように試みている。特に、速さ及び/又は信頼性がある態様で、一人以上の患者に対する適当な処置を見つけて、従来技術の上述の課題を解決する医療的分析システムを提供することが、本発明の目的として見い出される。
よって、本発明の目的は、患者の効果的な診断及び治療計画について臨床医を補助することに関係する。特に、この目的及び他の目的を得る際に、従来技術の上述の課題を解決する医療的分析システムを提供することが、本発明の目的である。
よって、本発明の第1の態様は、少なくとも一人の患者から得られるデータの事前臨床分析及び/又は臨床分析のための医療分析システムであって、データ、分析結果、フロー定義、ツール定義、及びデータベースリポジトリを利用するツールのための他の関係するデータの集まりを有する内部データベース(IDB)と、前記内部データベースへのアクセスを供給するデータベースアクセスユニット(DA)と、前記患者と関係する生体分子データを有する第1の生体分子モダリティ、及び前記患者と関係する臨床データを有する第2の臨床モダリティを有する複数のデータモダリティの分析並びに視覚化の設定可能なフローの実行を供給するフロー定義ユニット(FD)と、データモダリティの一つ以上で働く一つ以上のツールを前記システムが設定しインスタンスを作成するためのインタフェースを持つツール実行エンジン(TEE)と、前記システムが実行するツールの集まりを有するツールレポジトリであって、前記ツールがグラフィカルユーザインタフェース(GUI)での実行を視覚化可能にするためにルールのセットに従う当該ツールレポジトリと、前記システム自体に格納される又は前記内部データベース(IDB)とは異なるデータベースに格納されるデータを表す一つ以上の関連する外部データベース(EDB)と、データ、分析結果及び一つ以上のツール実行の結果を同時に視覚化するグラフィカルユーザインタフェース(GUI)とを有し、当該GUIは、1)第1の生体分子モダリティの結果と、2)第2の臨床モダリティの結果とを同時に視覚化する、医療分析システムに関する。
本発明は、特に、排他的ではないが、個人化された治療をデザインするための多様な手法を得るのに有益である。これにより、本発明は、関連する分子情報(例えば他と異なるDNAメチル化だけでなく遺伝子発現)と共に患者に関する臨床情報にアクセス可能にする充分に集積された遺伝子デザイン及び分析ツールボックスを容易にする。
さらに、本発明は、a)遺伝子発現プロファイリング、b)DNAメチル化プロファイリング、c)臨床的、生物学的知識を分子データと組み合わせること、及び/又はd)統計ツールによる分子モダリティの統合において、専門化されている複数の機械学習ツールの統合を容易にする。
本発明は、複数のモダリティのデータを分析し、署名発見プロセスからの結果及びデータをブラウズするため先進の手段を促進する生物情報科学的ツールの実行の設定可能なフローを可能にする。本発明は、軽量インタフェースを(動的セットの)新規なツール及び既存のツールに供給し、これらを変更なしで又はほとんど変更なしで実行可能にする。
この解決策の利点は、分析処理の迅速な実行及び遂行、並びに方法及び結果についての臨床医及び他の利害関係者との通信の容易さである。
第1の態様によるシステムは、事前臨床状況で少なくとも一人の患者に適用される。一つの利点は、患者に関するデータ及び情報が、生体分子署名を発見するためのシステムで使用されることである。そうすることの他の利点は、システムが、データの利用可能性を拡大するためにシステム内で患者のデータを統合することである。
第1の態様によるシステムは、また、患者のグループに適用されてもよい。
第1の態様によるシステムは、臨床状況で一人の患者に適用される。これにより、システムは、医師が、患者のデータ内の生体分子/医療署名を識別可能にし、これにより患者の診断及び患者の更なる処置を補助する。
前述に沿って、第1の態様によるシステムは、臨床判断サポートシステムとして機能する。
第1の態様によるシステムは、また、第1の生体分子モダリティ及び第2の臨床モダリティが、機械学習アルゴリズムにより統合可能であり、この統合の結果は前記GUIで視覚化可能であるように構成される。このセットアップの主要な利点は、非常に大きく複雑なデータコレクションの中で複雑な生体分子署名の発見を可能にすることである。
更に、第1の態様によるシステムは、第1の生体分子モダリティ及び第2の臨床モダリティが、統計アルゴリズムにより統合可能であり、この統合の結果は前記GUIで視覚化可能であるように構成される。
第1の態様によるシステムは、また、第1の生体分子モダリティ及び第2の臨床モダリティが、それぞれのゲノム注釈に基づいて統合可能であり、この統合の結果は前記GUIで視覚化可能であるように構成される。
他の実施例では、第1の態様によるシステムは、第1の生体分子モダリティが高いスループットデータサンプリングモダリティに基づくように構成される。これにより、システムは、他のモダリティのデータを含む状況内の高いスループットデータの分析を可能にする。
第1の態様によるシステムは、前記高いスループットデータサンプリングモダリティにより供給されるサンプルが、少なくとも100000個のパラメータ/種でのデータを有するように構成される。
第1の態様によるシステムは、また、第1の生体分子モダリティが高いスループット遺伝子発現プロファイリング、DNAメチル化状態プロファイリング、比較ゲノムハイブリダイゼーション分析から成るグループから選択されるように構成される。これらのモダリティは、システムに適用され、モダリティ間の生体分子署名を識別するために使用される大きくて複雑なデータセットを生成する。
第1の態様によるシステムの一つの特定のバージョンでは、前記フロー定義ユニット(FD)が少なくとも一つの他の生体分子モダリティを有する。システムのバージョンは、より多くの生体分子モダリティを集積する。
第1の態様によるシステムの他のバージョンでは、前記他の生体分子モダリティは、高いスループット遺伝子発現プロファイリング、DNAメチル化状態プロファイリング、比較ゲノムハイブリダイゼーション分析、及びSNPプロファイルから成るグループから選択される。
第1の態様によるシステムでは、前記患者は、癌、心疾患、代謝性疾患、胃腸疾患、神経疾患から成るグループから選択される臨床状態を持つ。このシステムの一つの利点は、システムの使用が、特定の状態と関連する生体分子又は臨床署名を発見し、結局、臨床設定におけるシステム及び署名のアプリケーションを可能にすることである。
第2の態様では、本発明は、本発明の第1の態様による医療分析システムの使用を有する、特定の臨床状態と関連する生体分子又は臨床署名の発見のプロセスに関する。
本発明は、排他的ではないが、癌、心疾患、代謝性疾患、胃腸疾患、神経疾患から成るグループから選択される臨床状態に関係する生体分子又は臨床署名の発見に対して特に好適である。
本発明は、排他的ではないが、乳癌又は大腸癌に関係する生体分子又は臨床署名を発見するプロセスに対して更に特に好適である。乳癌及び大腸癌は、異常な遺伝子発現プロファイル/DNAメチル化プロファイルと相関することが知られている。
更に、第2の態様によるプロセスは、遺伝子発現署名、DNAメチル化状態署名、比較ゲノムハイブリダイゼーション署名、及びSNP署名から成るグループから選択される署名を発見するためのプロセスである。通常、これらのモダリティは、存在する生体分子を現すために、高い容量システムを必要とする大量のデータを生成する。
第3の態様によると、本発明は、本発明の第1の態様による医療分析システムの使用を有する臨床判断サポートのためのプロセスに関する。
本発明は、また、患者のデータが、臨床状態と関連する生体分子又は臨床署名の識別のためのシステムに適用されることを提供する。この実施例の利点は、生体分子/医療署名のアプリケーションが、当該署名に関連する臨床状態を患者が患う可能性があるかどうかを示すために使用されることである。
第4の態様によると、本発明は、関連したデータ格納手段を持つ少なくとも一つのコンピュータを有するコンピュータシステムが本発明の第2の態様による分析プロセス制御可能にするために適したコンピュータプログラムに関する。
本発明のこの態様は、本発明の第2の態様のオペレーションをコンピュータシステムが実施出来るようにするコンピュータプログラムにより本発明が実行されるという、排他的ではないが特に利点がある。このように、幾つかの既知の医療分析システムは、前記医療分析システムを制御するコンピュータシステム上にコンピュータプログラムをインストールすることにより本発明によってオペレーションが変更されることが意図される。斯様なコンピュータプログラムは、例えば磁気的若しくは光学的な媒体のようなコンピュータ可読媒体、又は例えばインターネットのようなコンピュータベースのネットワークを通じて提供される。
本発明の第1、第2、第3及び第4の態様各々は、他の態様の何れと組み合わされてもよい。本発明のこれら及び他の態様は、これ以降説明される実施例を参照して明らかに説明されるだろう。
本発明は、添付の図面を参照して単なる例示として説明されるだろう。
図1は、システムのアーキテクチャを示す。 図2は、データアクセス、分析、及び医療判断のための概念的フローシナリオを示す。 図3は、分析状況及び視覚的表示に関するシステムの状態を示す。 図4は、本発明のシステムのメインスクリーンの例を示す。 図5は、データベースから患者情報をローディングする例を示す。 図6は、組織病理学的モダリティに関係したスクリーンの例を示す。 図7は、比較ゲノムハイブリダイゼーション(CGH)モダリティに関係したスクリーンの例を示す。 図8は、遺伝子発現モダリティに関係したスクリーンの例を示す。 図9は、DNAメチル化モダリティに関係したスクリーンの例を示す。 図10は、遺伝子発現署名の2つのグループの調査に関係したスクリーンの例を示し、一方は、単に遺伝子発現データだけを使用し、他方は、DNAメチル化データに関連して遺伝子発現データを使用している。 図11は、遺伝子発現署名のための特徴ブラウザの例を示す。 図12は、遺伝子発現署名のための遺伝カードリンクの例を示す。 図13は、DNAメチル化署名の調査に関係したスクリーンの例を示す。 図14は、DNAメチル化マーカーのための特徴ブラウザの例を示す。 図15は、メチル化署名のための医療判断支援スクリーン(CDS)の例を示す。 図16は、遺伝子アルゴリズム概要ツールに関係したスクリーンの例を示す。 図17は、2つの遺伝子アルゴリズム概要ツールの出力の圧縮に関係した分割スクリーンの例を示す。 図18は、遺伝子共起ツールに関係したスクリーンの例を示す。 図19は、メチル結合部位ツールに関係したスクリーンの例を示す。 図20は、トップダウン階層的な分類(TDHS)に関係したスクリーンの例を示す。 図21は、遺伝子発現フィルタリングツールに関係したスクリーンの例を示す。 図22は、多モード相関特徴分析―グラフィック出力に関係したスクリーンの例を示す。 図23は、多モード相関特徴分析―テキスト出力に関係したスクリーンの例を示す。 図24は、多モード相関特徴分析―テキスト出力に関係したスクリーンの例を示す。 図25は、遺伝子発現のためのCDSスクリーンの例を示す。 図26は、サンプルのグラウンド真実ラベリングを最善に予測する特徴のサブセットを自動的に展開させるようにデザインされた遺伝子アルゴリズム(GA)ベースのツールの4つの可能な出力を示す。 図27は、発見されたすべての候補特徴サブセットと、後処理分析において重要であるとわかった特徴サブセットとのパフォーマンス値の比較を示す。 図28は、複数の特徴を視覚化する遺伝子発現署名のための特徴ブラウザの例を示す。 図29は、遺伝子署名メタデータの視覚化を生成するプロセスを記述するフローチャートを示す。 図30は、遺伝子署名メタデータの分布を示す例を示す。 図31は、トップダウン階層的分類(TDHS)の例を示す。 図32は、遺伝子発現及びDNAメチル化データの相関の例を示す。
本発明は、以下により詳細に説明されるだろう。
特に現在の癌治療において、分子生命情報科学に基づいた翻訳治療ツールのためのニーズがある。本発明者らは、組織病理結果及び生存情報のような医療パラメータだけでなく、ゲノム及びエピ・ゲノム測定モダリティに依存する医療判断をなすためのツールを本発明で開示する。
本発明の目的は、臨床状態の分子的プロファイルの発見を容易にし、臨床設定の際にこれらの使用を可能にすることである。本発明は、組織標本からゲノム情報を得て、診断、適切な治療の決定及び経過観察を援助するための新しい技術を説明する。
発明者の医者アクセス可能な事前医療分析アプリケーション(Physician Accessible Preclinical Analytics Application(PAPAyA))は、異なるモダリティでの接続に影響を及ぼし得る統計的及び機械学習ツールの強力なセットを統合する。本システムは、既存の調査方法及びツールの強力なデータ分析パイプラインへの統合をサポートするために容易に拡張可能及び再構成可能である。PAPAyAは、臨床研究、新規な臨床仮説の定式化からのデータの分析を可能にし、臨床医のための分子プロファイルを抽出することにより、臨床判断支援を容易にする。乳癌分子プロファイル上でのパフォーマンスの例を持つPAPAyAの現在の構成は、動作中のシステムを示すために用いられる。
発明者らは、個人的な治療をデザインするための多モード分子手法を示す。特に、本方法は、腫瘍細分類に集中し、予測診断試験を導く化学療法(例えばHerceptin)に最もおそらく反応する患者の部分母集団を識別する。
発明者らは、胸部及び卵巣がん患者の生検のサンプルを特徴づける分子プロファイルの臨床前発見を改善するプロトタイプのゲノムデザイン及び分析ツールボックスを提供する。発明者らは、また、患者の層別化に役立ち、治療反応を予測する一組の判断分析ツールからの結果を提供する。
本発明のシステムは、高いスループット分子測定に基づいて臨床調査周辺の結果の分析及び解釈を可能にする設定可能なプラットフォームを供給する。本発明のシステムは、翻訳リサーチ、前臨床コース及び臨床アプリケーションの一部のために使用されるべき生命情報科学ソフトウェア方法を結合する。本発明のシステムは、以下の態様をカバーする:
−結果及び患者の状態に関与する(また、治療反応のために使用される)最も重要な遺伝子/座位についての相関情報を推定するために、複数のモダリティの分析を集積すること。発明者らは、組織学的等級、リンパ節、ER/PR状態及び結果のような臨床パラメータに加えて、遺伝子発現及びDNAメチル化からの患者情報の組込みを提供する。
−(文献の斯様なツールの記述を越えて)このデータを分析するためのさまざまな機械学習ツールを結合すること、
−診断、予後、治療反応及び経過観察のため斯様に統合された分析の使用。
発明者らは、患者情報及び遺伝子署名を通じてブラウズし、相関及び共起に基づいて推論するだけでなく、差動のDNAメチル化プロファイルと同様に、個別に遺伝子発現プロファイルを分析するために、一組の判断分析ツールから、結果を供給する。これらのツールは、腫瘍サイズ、ホルモン及び組織病理パラメータのような患者情報に基づいて、他の医療予測及び予後の指標と同様に高いスループット遺伝子発現プロファイリングに依存する。
発明者らは、Papayaと呼ばれる、胸部及び卵巣がんのための臨床前発見フェーズにおいて支援する方法を含む、ゲノムデザイン及び分析ツールボックス(GDAT)を使用して、これらのツール及び結果を提供する。特に、これらのツールは、判断分析だけでなく、特徴サブセット選択、分類、クラスタ形成方法及びトップダウン階層的分類を含み、タンパク質―DNAインタラクション、医療予後の指標、DNAメチル化及び遺伝子発現プロファイリングデータについての生物学的知識を組み込む。我々は、更に診断法を改善するために、複数の分子モダリティ、例えば高いスループット遺伝子発現プロファイリング及びDNAメチル化プロファイリングに影響を及ぼすGDATからの結果を提示する。
本発明のシステムは、発見された分子署名を画像及び付加的な臨床情報と結合することにより、包括的な図を提供する。更に、本システムは、診断を組み立て、治療方向(例えばホルモン又は化学療法)を選択し、疾患の進展及び経過観察を適当に監視する際の支援ツールとして使用される。システムは、臨床医、又はサードパーティの判断サポートシステムに対するサービスとして、(例えば、分子署名を対応するメタ・データと組み合わせた)分子情報パッケージを提供するためにも使用される。その上、システムは、患者の分子プロファイルにカスタマイズできる分子医学の強化された臨床ガイドラインを開発し提供するために使用される。
高いスループット・ゲノム・データ分析との幾つかのチャレンジは、高い測定及び生物学的ノイズ、膨大な数の特徴及び限られた患者試料を対処することにある。本発明は、多くのスプリアス信号を除去しそうである、複数の分子モダリティ及び臨床情報を利用する統計学的に厳密な手法を提供するので、我々が疾患の基礎をなす生態に集中することができる。
結果のより多くの従来の臨床予測値と腫瘍自体からの分子情報(例えば、メチル化及び遺伝子発現)との融合は有効であるとみなされるが、見込みの情報を解釈し、結果を医師及び患者と通信するやり方を学ぶことは大きなチャレンジである。この課題に対する本発明を備える解決案が、提供される。システムは、臨床において個別化医療のアプリケーションを援助する。
患者の臨床、組織病理及び分子プロファイルを考慮する統合された判断サポートシステムのための明確な臨床ニーズがある。斯様なシステムは、腫瘍委員会(放射線科医、病理学者、外科医、放射線療法士及び腫瘍学者)により、充分な情報に基づいた判断をすることを補助するためのワンストップ解決案を提供する。
上記記述は、主に臨床調査のための臨床前使用のための実施例である。他の実施例では、本発明は、臨床アプリケーションとして同じように使用できる。
システム
本システムの構造は、以下のコンポーネントを持ち、また、図1Aを参照されたい。
-GUI:グラフィカルユーザーインターフェイス(GUI)は、同期をとって、データ、分析結果及びツール実行の結果を示すコンポーネントを結合する。
-データアクセス(DA):調査情報、測定値、分析値のデータベースへのアクセスを提供。
-フロー定義(FD):ゲノムデータ分析及び臨床/分子データブラウザステップの設定可能なフローの実行を供給。
-ツール実行エンジン(TEE):さまざまなプラットフォームからツールをシームレスに設定しインスタンス化するアプリケーションのためのインタフェースを供給。これは、新しいツールでの拡張が、ほとんど又は全く変形なしで設定及びフローを容易に加えることができるようにする。
-内部データベース(IDB):調査データ、分析結果、フロー及びツール定義、並びにデータベースリポジトリを利用する外部ツールのための他のデータの収集。
-ツール「レポジトリ」(TR):アプリケーションが実行するように設定されるツールのコレクション。これらのツールは、ツールがツールの実行を視覚化できるようにするために、基本的なルールのセットに従う。
-外部「データベース」(EDB):外部ツールがファイルシステム上又はIDBとは異なるデータベース内の何れかに格納された外部ツールが使用する全てのデータ及び他のファイルの収集。
本システムの僅かに変形したアーキテクチャが、図1Bに例示されていて、ここで、図1Aのフロー定義(FD)及びデータアクセス(DA)が図1Bのフロー制御へ結合される。同様に、汎用ユーザインタフェース(GUI)が、図1Bに示されるようなユーザインタフェース、プレゼンテーション及びアクションのモジュールへ副分割される。より下の構造も、図1Bに示されるようにわずかに変形されていて、ここで、データベース管理システムはモジュール「ツール」及び「外部データ」と共に示される。
従って、本発明の第1の態様は、少なくとも一人の患者から得られるデータの事前臨床分析及び/又は臨床分析のための医療分析システムであって、データ、分析結果、フロー定義、ツール定義、及びデータベースリポジトリを利用するツールのための他の関係するデータの集まりを有する内部データベースと、前記内部データベースへのアクセスを供給するデータベースアクセスユニットと、前記患者と関係する生体分子データを有する第1の生体分子モダリティ、及び前記患者と関係する臨床データを有する第2の臨床モダリティを有する複数のデータモダリティの分析並びに視覚化の設定可能なフローの実行を供給するフロー定義ユニットと、データモダリティの一つ以上で働く一つ以上のツールを前記システムが設定しインスタンスを作成するためのインタフェースを持つツール実行エンジンと、前記システムが実行するツールの集まりを有するツールレポジトリであって、前記ツールがグラフィカルユーザインタフェース(GUI)での実行を視覚化可能にするためにルールのセットに従う当該ツールレポジトリと、前記システム自体に格納される又は前記内部データベースとは異なるデータベースに格納されるデータを表す一つ以上の関連する外部データベースと、データ、分析結果及び一つ以上のツール実行の結果を同時に視覚化するグラフィカルユーザインタフェース(GUI)とを有し、当該GUIは、1)第1の生体分子モダリティの結果と、2)第2の臨床モダリティの結果とを同時に視覚化する、医療分析システムに関する。
ある実施例では、医療分析システムは、事前臨床状況での少なくとも一人の患者に適用される。他の実施例では、医療分析システムは、患者のグループに適用される。更に他の実施例では、医療分析システムは、臨床状況で一人の患者に適用される。更に他の実施例では、医療分析システムは、臨床判断サポートシステム(CDS)として機能する。
臨床前の状況において、患者データは、データを拡大し、及び/又は、癌、心疾患、代謝性疾患、胃腸疾患、若しくは神経疾患の臨床状況と相関する生体分子又は臨床署名を識別する目的のために、システムに適用されてもよい。
本発明の一つの実施例では、本発明のシステムは、個人化された治療のデザインを支援するための多様なアプローチとしてである。
本システムは、
関連する分子情報(例えば差動DNAメチル化だけでなく遺伝子発現)に沿って患者に関する臨床情報へのアクセスを可能にする完全に統合されたゲノムデザイン及び分析ツールボックスと、
a)遺伝子発現プロファイリング、b)DNAメチル化プロファイリング、c)臨床パラメータを分子レベル情報と結合、d)臨床、生物学的知識を分子データと結合、e)統計ツールにより分子モダリティの統合で専門化されている複数の機械学習ツールの統合とを提供する。
本発明は、署名―発見プロセスからデータ及び結果をブラウズする先進の手段を促進する生物情報科学ツールの実行の設定可能なフローを可能にする。
本発明は、(動的セットの)存在しているツールへの軽量インタフェースを供給し、これらツールをほとんど又は全く変形なしに実行できるようにする。この解決策の利点は、分析プロセスの速い実行及び実施と、方法及び結果について臨床医及び他の関係者との通信の容易さである。
モダリティ
請求項1に記載の医療分析システムによる本発明の一つの実施例では、第1の生体分子モダリティ及び第2の臨床モダリティは、機械学習アルゴリズムにより統合可能であり、この統合の結果は前記GUIで視覚化可能である。
請求項1に記載の医療分析システムによる本発明の第2の実施例では、第1の生体分子モダリティ及び第2の臨床モダリティは、統計アルゴリズムにより統合可能であり、この統合の結果は前記GUIで視覚化可能である。
請求項1に記載の医療分析システムによる本発明の第3の実施例では、第1の生体分子モダリティは高いスループットデータサンプリングモダリティに基づく。
ここで高いスループット分析とは、本願の出願時に従来の方法を使用して得難い、生物学的な質問又は臨床質問に対処する生物学的データの大規模分析を指す。高いスループットは、更に、分析のためデータを生成するモダリティにより定められる。
高いスループット遺伝子発現分析は、通常は、サンプル当たり数千個の発現生成物のデータを有する、発現プロファイルの分析を含む。単一のマイクロアレイ実験からの遺伝子発現データは、何百もの刺激の下で、数千から何十万もにわたる多くの遺伝子の活動を追跡できる。
サンプル当たり100,000のCpGサイト/島のデータを有する高いスループットDNAメチル化状態プロファイリング(高いスループット差動メチル化ハイブリダイゼーション(DMH)マイクロアレイ又はMOMAマイクロアレイ)。
質量分析プロテオミクスは、通常は、生体試料のタンパク質の1つの特定のサブセットに焦点を合わせるため一つ以上の質量分析計及び追加ステップを含む測定セットアップにおいて、タンパク質ペプチドの100000個の質量電荷比(m/z)値の同時測定を含む。
このように、一つの実施例において、高いスループットは、単一の測定(例えばマイクロアレイで)において100000から数100万の範囲でのテストで定義される。特に、遺伝子発現データは、通常、10000の遺伝子発現プロファイルを測定し、DNAメチル化は、CpGの島の100000の断片のメチル化状態を測定し、質量分析プロテオミクスは、通常、100000のm/z値を測定する。
他の実施例では、高いスループットは、速くて同時の何百万もの生化学的、遺伝学的、又は薬理学的試験を可能にする特性である全てのモダリティに適用可能な差異のレベルを指す。
一つの実施例において、前記高いスループット・データ・サンプリング・モダリティにより供給されるサンプルは、少なくとも100000個のパラメータ/種に関するデータを有する。
本発明のシステムは、高いスループット・モダリティを含むが、これに限らず、広範囲にわたるモダリティの統合を可能にする。
一つの実施例において、第1の生体分子モダリティは、高いスループット遺伝子発現プロファイリング、DNAメチル化状態プロファイリング、比較ゲノムハイブリダイゼーション分析、質量分析プロテオミクス、単一のヌクレオチド多型性(SNP)及び他のゲノム全体の塩基配列決定モダリティから成るグループから選択される。
他の実施例では、第1の生体分子モダリティは、免疫組織学、ELISA、酵素活性、Q―PCR、RT―PCRなどのPCRのような組織構造モダリティから成るグループから選択される。
一つの実施例では、患者に関する臨床データを有する第2の臨床モダリティは、年齢、性別、患者の身体的検査、臨床医により収集された他の情報(例えば、患者へのインタビューからのデータ)のようなデータに関する。
第1の生体分子モダリティから離れて、システムは、複数の生体分子モダリティの統合を可能にする。よって、他の実施例において、フロー定義ユニット(FD)は、少なくとも一つの他の生体分子モダリティを有する。
追加的な生体分子モダリティは、ここで説明される生体分子モダリティのいずれかであってもよい。よって、一つの実施例において、他の生体分子モダリティは、高いスループット遺伝子発現プロファイリング、DNAメチル化状態プロファイリング、比較ゲノムハイブリダイゼーション分析及びSNPプロファイルからなるグループから選択される。
他の実施例では、第1の生体分子モダリティ及び第2の臨床モダリティの統合は、それぞれのゲノム注釈に基づいて統合可能であり、ここで、前記統合の結果がグラフィカル・ユーザ・インタフェースで視覚化可能である。ゲノム注釈は、遺伝子名、機能、経路情報、遺伝子オントロジーである。
システムのフロー、状態及びトランザクション
非限定的な概念上のフローシナリオが、図2で供給される。このシステムを実行するために、この実施例では、5つのスクリーンタイプが定義された:
患者スクリーン:
目的:どのくらい評価患者(サンプル)が署名のデータベースと合うかを示す。
データ:サンプル(メチル化/発現プロファイル及び患者の病歴、臨床指標を含む)、署名。
ツール:署名とのマッチング、関連した(マッチした)署名の概要。
制御:負荷患者;署名を拡大する;署名(例えば、遺伝子順位、経路、...)の概要を選択する;判断サポート。
署名スクリーン:
目的:署名(オプションでサンプル又は一組の署名の状況において)のコンテンツ及び特性を例示する。
データ:署名(遺伝子/座のセット)、注釈(拡張リソース、例えばNCBIへのリンク)。
ツール:マッチング、関連した(マッチした)署名の概要(統計的データの概要)。
制御:「分析」へ又は分析における初期のステップへナビゲートし、視覚要素を強調又は除去する図の変更(又は、例えば遺伝子の番号付きリストからヒートマップへのように完全に図を変更さえする)。
ツール1vsツール2スクリーン:
目的:比較目的及び多モードデータ統合のためツール1からツール2を「ドライブする」ためのオプションで、同時に、2つのツールからの出力を示すための手段を供給する。
データ:ツールに依存して何れのデータでも。
ツール:何れのツールでも。
例:1)ツール1=階層クラスタリングvsツール2=トップダウン階層。分類例2)遺伝子発現データ上のツール1vsメチル化データ上のツール1。
制御:パラメータを供給し、ツール2をドライブする。コールされる所で、ナビゲートする。
ツールスクリーン:
目的:事前に決められた状況情報(例えば現在のサンプル、現在の署名、他のツールからの現在の出力)の中で、ツールを実行する。
データ:ツールに依存して何れのデータでも。
ツール:何れのツールでも。
制御:基本のパラメータ入力。デフォルトパラメータが、使用されるべきであって、必要に応じてその場で変更できる。フローの幾つかの状況を得て、後続のツール呼び出しのため状況を更新する。コールされる所で、ナビゲートする。同様のツールへナビゲートする。パイプラインでそれに先行するツールにナビゲートする。
CDSスクリーン:
目的:患者サンプルに対するマッチングの結果がどのくらいCDSのような出力に翻訳されるかについての一つ以上のアイデアを視覚化する。
データ:分析及び注釈に基づくデータ。
ツール:なし。提示される情報だけ。例えば、臨床指標、治療計画。
制御:幾つかのデータは、外部ソース(例えば「PubMed」刊行物、経路情報)へのハイパーリンクを含む。コールされる所で、ナビゲートする。
本発明の一つの実施例では、フローは、図3の例のような状態及び可能性がある遷移(アクション)を使用して定義される。各状態は、また、それに関連したスクリーンタイプを持つ。許容された遷移を実行するために、この実施例では、我々は、以下を特定する:
-開始:遷移を生じる状態から。
-状態:結果的な状態へ。
-説明:アクションのフリーテキスト記述
-アクションタイプ:ツール呼び出し(外部ツールを呼ぶ);習慣(内部的に定義されたアクションを実行する);ボタン(スクリーンに供給されるボタンから、外部ツールを呼ぶ)。
-ツール:適用できる場合、呼ばれるべきツールの記述へのポインタ。
-既存の制約:このアクションが許容されるために、以前のアクションによりセットされる必要があるか又はセットされる必要がないフラグ。
-設定制約:このアクションがセットするフラグ。
-セットしない制約:このアクションがセットしないフラグ。
アプリケーションは、初期状態で始まる。状態に入ると、アプリケーションは、遷移テーブルを問い合わせて、入った状態並びにシステムのセットされた及びセットされていない制約に基づいて全ての可能性がある遷移のサブセットを編集する。フロー定義ユニットは、この仕様を使用し、ユーザがデータ及びツールを通じてナビゲートして、システムの状態を維持する。
以下のデータ構造は、フロー、当該フローにリンクされるツール、及びこれらのパラメータを定義する:
フロー定義:
Figure 2011520206
ツール定義
Figure 2011520206
ツールパラメータ定義
Figure 2011520206
以下に、包括的なツールの限定的なリストが供給される。ツールは、アプリケーション及び機能性によって4つのグループにグループ化される。
前処理:
i プローブレベルの特性の分析
ii スケーリング
iii 正規化
生物マーカー発見:
i 特徴ランキング
ii 生存分析
iii 特徴副セット選択
iv フィルタ
v ラッパ
クロスモーダルツール:
i 2つ以上のモダリティからのデータの視覚化
ii 1つのモダリティから他のモダリティへの翻訳
iii 測定されたモダリティ及びそれぞれの生物マーカーの相関
臨床判断サポートツール:
i 一つ以上の患者サンプルプロファイルに基づく署名特徴
ii 複数のモダリティ間の一つ以上の患者プロファイルの視覚化
iii 患者のプロファイルのレパートリに関する一つ以上の患者のプロファイルの視覚化
システムのアプリケーション
本発明は、翻訳リサーチ、前臨床、及び臨床アプリケーションの一部のために使用されるべき生命情報科学ソフトウェアツールを結合する。
システムは、特定の臨床質問のために微調整できる系統的処理パイプラインで実行されるべき患者中心の分析及び情報科学支援された発見を可能にする。例えば、マルチモダリティ遡及的な乳癌データの統合された分析の2つの使用シナリオにより。
特定の患者サンプルを選択すると、ユーザは、腫瘍サイズ、ステージ及び等級のような腫瘍についての基本的な患者中心の臨床データと、ホルモン受容体状態(エストロゲン受容体ER及びプロゲステロン受容体PR)及びErbB2増幅のような組織病理データとを提示される。
更にまた、臨床データエクスプローラが、また、高いスループット遺伝子発現、DNAメチル化及びコピー数測定から得られる署名へのアクセスを供給する。新しい署名は、単一の又は高いスループット測定の組合せからPAPAyA内部の発見アルゴリズムを使用しても得られる。斯様な署名は、異なる臨床ニーズである良性対悪性、腫瘍サブタイプ及び再発がない生存に対処する。
システムの遺伝子発現タブから、ユーザは、mRNAプロファイリングから誘導される署名にアクセスできる。例えば、図10においては、管腔又は基礎のサブタイプに属するとして患者を分類する署名のリストを閲覧するときのシステムインタフェースのスクリーンショットである。ここで、候補署名のうちの1つは、遺伝子カード及び特徴ブラウザへのアクセスを持つそれらのメンバー遺伝子(トップ3の遺伝子としてGIMAP6、TBCC、CRABP2を含む)へのアクセスを得るために拡大される。臨床パラメータによりグループ化される所与の遺伝子の表現値をプロットする特徴ブラウザツール(図11及び図28参照)で、これらの遺伝子の1つを探査してもよい。ユーザは、この遺伝子の発現レベルがまた、ホルモン状態(ホルモン陽性において表されるより下、ホルモン陽性において表されるより上)及び腫瘍等級(分類I及びIIにおいて表わされるより上、分類IIIにおいて表されるより下)と相関することを観察する。このツールは、このように、署名発見プロセスにおいて使用されなかった臨床関連への洞察をユーザが得られるようにする。これは、これらの遺伝子が見つかる署名に対する信頼性だけでなく、遺伝子の重要性を確立するために使用できる。
他の使用シナリオにおいて、システムは、DNAメチル化マイクロアレイ測定(図13参照)に基づいて分子署名を調査するために使用される。署名を評価するために、ゲノムの特定の座のためのメチル化状態を視覚化する(図14参照)異なるツールが使用される。
従って、本発明の一態様は、請求項1による医療分析システムの使用を有する特定の臨床状態と関連した生体分子又は臨床署名の発見のためのプロセスに関する。
データは、臨床状態を患っている患者から得られる。本発明の一つの実施例では、患者は、癌、心疾患、代謝性疾患、胃腸疾患、神経疾患から成るグループから選択される臨床状態を持つ。
システムにより発見される生体分子又は臨床署名は、例えば臨床条件の患者の層別化のために臨床に適用される。
一つの実施例において、臨床状態は、癌、心疾患、代謝性疾患、胃腸疾患、神経疾患からなるグループから選択される。特定の実施例では、癌は、乳癌又は大腸癌である。
署名は、モダリティ、又は本発明のシステムにより使用されるモダリティの組合せのいずれに関してもよい。
よって、一つの実施例では、署名は、遺伝子発現署名、DNAメチル化状態署名、比較ゲノムハイブリダイゼーション署名及びSNP署名である。
一つの実施例では、システムは、分子診断及び監視テストから得た複雑なデータを分析する手段を供給する。これらの目標とされたテストは、まさに診断のポイントから、治療計画へ、治療のフォローアップまでの患者の疾患の経過の分子図を供給する。
他の実施例では、本発明のシステムは、全体の看護サイクルの全体にわたって臨床医を補助する判断サポートシステムを開発するために使用される。これらのシステムは、発見される分子署名をイメージング及び治療計画情報と組み合わせることにより、包括的な図を供給する。これらのシステムは、治療選択(例えばホルモン又は化学療法)及び疾患の経過を監視するための適切な画像モダリティを示唆できる。
第3の実施例では、システムは、分子情報パッケージ(例えば、関連するメタデータを持つ分子署名)を臨床医に、又は第三者判断サポートシステムに提供するために使用される。
更に実施例において、システムは、患者の分子プロファイルにカスタマイズできる拡張された臨床ガイドラインを展開するために使用される。斯様なガイドラインは、分子医学において有効である。
発明者らは、更に、完全に異なる態様で臨床設定の使用を提供し、従って、発明者らは、このように、臨床判断サポート(CDS)が患者データに適用可能であるデータを調査して、提示する異なる態様を提供した。PAPAyAのCDS部分は、患者の腫瘍プロファイルの解釈を支援する。それは、選択された署名に関してカスタマイズされた図を供給する。
発見プロセスから得られる署名は、最終的に、患者サンプルを層別化するために適用され、データベースの全ての患者に関して署名のパフォーマンスに基づいて層別化に対する信頼を割り当てるために使用できる。現在、PAPAyAシステムのCDSモジュールは、遺伝子発現又はメチル化プロファイリングデータを使用した腫瘍サブタイプを予測するためのサポートベクトル機械ベースの識別器を含む。これらの統計値は、臨床医に患者の生理的状態に対する処置を調整するための洞察を提供できる。ノッティンガム予後指標及びセントギャレン・コンセンサスのような乳癌臨床予後指標は、患者の評価に容易に組み込まれ得る。加えて、アーキテクチャは、第三者の署名のシステムへの統合を可能にする。
本発明の他の態様は、請求項1による医療分析システムの使用を有する、臨床判断サポートのためのプロセスに関する。
プロセスは、臨床アプリケーションの署名及びシステムのアプリケーションへの署名発見プロセスの継続を反映する。
このように、一つの実施例では、患者のデータは、臨床状態と関連した生体分子又は臨床署名の識別のためのシステムに適用される。
本発明の態様の1つで説明されている実施例及び特徴は、本発明の他の態様にも適用する点に留意されるべきである。
本願で引用された特許文献及び非特許文献は、全て参照により本願に組み込まれる。
本発明は、ここで、以下の非限定的な例で更に詳細に説明されるだろう。
アプリケーションは、ロードされたデフォルトの患者で「Analytics(分析)」スクリーン(図4)を開く。ユーザは、このスクリーンから患者情報をロードでき、ゲノムデザイン及び分析ツールボックス(GDAT)で供給される異なる種類の分析を開始できる。示される第1のモダリティは「Histology(組織構造)」であり、ここで、患者サンプルで実施される組織病理学的分析の概要を見ることができる。
データベースから患者情報をロード
データベースから要約された患者(サンプル)情報が示され、アプリケーションは他の分析のため患者の選択(ハイライトされている)(図5)を可能にする。
組織病理モダリティ
所与の患者のための組織病理学的分析の要約は、「FISH」及び免疫組織化学による、エストロゲン受容体、プロゲステロン受容体、Her2過剰発現の状態を含むこのスクリーン(図6)に示される。
CGHモダリティ
ROMAデータ(代表のオリゴヌクレチオドマイクロアレイ分析)からサンプルに対するためのファイアストーム指標とともに、遺伝子増幅の数、削除等のような、サンプルに関連した比較ゲノムハイブリダイゼーション(CGH)データの要約。図7参照。
遺伝子発現モダリティ
遺伝子発現署名等の他の探査を許容する、サンプルのための遺伝子発現データの要約(図8参照)。
サンプルのための「Methylation Oligonucleotide Microarray Analysis」(メチル化オリゴヌクレチオドマイクロアレイ分析(MOMA))により得られる差動のメチル化データの要約が示される。これも、潜在的なメチル化ベースの署名の更なる調査を許容する(図9参照)。
遺伝子発現署名を調査
このスクリーンは、遺伝子発現モダリティスクリーンの下部右側の隅の「署名」ボタンをクリックすることにより到達できる(図10参照)。遺伝子発現及びメチル化データ分析を使用して発見される署名と同様に、遺伝子発現データを単独で使用して識別される署名が示される。特定の患者への統計的関連の順に並べられた一番上の署名が、示される。スクリーンの左側の署名のいずれかをクリックすることで、署名に含まれるすべての遺伝子の概要を供給する。「特徴ブラウザ」及び「遺伝子カード」のような個々の遺伝子のためのデータの外部ソースへのリンクがある。
遺伝子発現署名のための特徴ブラウザ
特徴ブラウザが特定の遺伝子のために呼ばれる(クリックされる)とき、このツールは、ホルモン受容体(HR)状態、Her2FISH状態及び腫瘍等級の状態のような異なる臨床注釈によって分類される全ての患者間の遺伝子発現レベルの分布を示す(図11参照)。
遺伝子発現署名のための遺伝子カードリンク
所与の遺伝子に対する「遺伝子カード」リンクをクリックすることで、外的資源から遺伝子に関して一般公開されている情報をユーザが得ることができるインターネットブラウザを開く(図12参照)。
メチル化署名を調査
遺伝子発現署名と同様に、ユーザはメチル化モダリティの中でDNAメチル化署名を調査することを選択できる。これも、特徴ブラウザリンクを使用してメチル化マーカーの他の調査を可能にする(図13及び図14参照)。
メチル化署名のためのCDSスクリーン
このスクリーン(図14)において、メチル化署名は、患者をクラスタ形成するために使用され、現在の患者が図の「X」マークによりマークされている。これは、ユーザが患者のメチル化プロファイルに基づいて患者の臨床注釈を見ることができる。
左の「クラスタメチル化」ボタンによって、ユーザがメチル化署名のいずれかに従って患者をクラスタ形成でき、よって、ここで示されるものと同様の多くの異なるクラスタ出力へのアクセスを供給する。
発見区域
発見区域は、署名を生成する際に使用された多くの発見ツールへのアクセスを供給する。ここで、我々は、専用の機械学習アルゴリズムだけでなく公の機械学習アルゴリズムと統計方法とを含める。個々のツールは、左側のボタンを使用してアクセスできる(図16参照)。
遺伝子アルゴリズム要約ツール
このツールは、遺伝子アルゴリズムベースの署名発見ツールの学習及び評価性能の概要を示す。ツールが、図16及び図17に示されるように、個々のスクリーン上に、又は分割スクリーンとして、学習及び性能を表示するために使用できる。
遺伝子共起ツール
このツールは、遺伝子アルゴリズムにより発見される署名の範囲内で、遺伝子共起を示す。ツールは、「GAGeneNwks(EXP)」ボタンをクリックすることにより単独で遺伝子発現データを使用して発見された署名、又は「GAGeneNwks(EXP―MET)」ボタンを使用して遺伝子発現及びメチル化データ両方を利用することにより発見される署名のための遺伝子共起を見るために使用できる(図18参照)。
メチル結合部位ツール
このツールは、重要な差動メチル化プローブ(シーケンス)のための関連したメチル結合部位を示す(図19参照)。
トップダウンの階層的な分類ツール
トップダウンの階層的な分類(TDHS)は、クラスタ形成するアルゴリズムと同様であるが、クラスタ形成では、2つのパターンがグローバルな類似性を示す階層的クラスタ形成するのと対照的に、TDHSでは、最も類似のパターン(局所的マッチが高い所)の分類を実施する(図20参照)。
遺伝子発現フィルタリングツール
このツールによって、ユーザがn層発現強度変化に基づいて遺伝子発現データをフィルタリングできる(図21参照)。
多モード相関特徴分析−グラフィックス出力
このツールは、遺伝子発現データと差動DNAメチル化データ間の相関の出力を示す。相関は、患者の結果に基づいて測定される。サンプルは、生存する(正の結果)もので肯定的に相関し、死亡の(負の結果)カテゴリで負に相関される必要がある(図22参照)。多モード特徴分析は、図23及び図24に示される。
臨床判断サポート区域
遺伝子発現のためのCDSスクリーン
署名スクリーン(図25参照)から、ユーザは、特定の署名を選択でき、その後、選択された署名を使用して、特定の患者の層別化情報を与える臨床判断サポート(CDS)スクリーンへ移動できる。
これは、また、所与の患者のための署名のランク、選ばれた署名を使用した層別化予測の確率、更には署名の長さ(署名の特徴の数)に関する情報を提供する。
このスクリーンによって、臨床専門家(ユーザ)が署名スクリーン又は患者のデータスクリーンに戻ることができる。
サポートベクトル機械分類器のための遺伝子アルゴリズムラッパを使用した特徴サブセット選択
遺伝子発現データ分析の主要段階は、患者サンプルの特定のラベリングに関して全体のデータセットを単独で記載できる特徴(遺伝子)サブセットの検索である。発明者らは、サンプルの現地踏査ラベリングを最善に予測する特徴の副セットを自動的に展開するようにデザインされる遺伝子アルゴリズム(GA)に基づいたツールを使用している。特に、遺伝子発現データの(フィルタ処理された)セットは、2つの乳癌サブタイプ・グループ:管腔及び基底に基づいて、ラベルをつけられる3,501本の遺伝子発現プローブ及び104個の患者サンプルを含む。ツールは、学習のための78個のサンプル及び評価のための26個のサンプルの異なる組合せに、100回動作した。正確な同じセットアップが、患者サンプルラベルが100回の実行の各々においても置換されるデータで繰り返された。このデータは、統計的に有意なサブセットを選択するために後で使用される。
他の後処理作業の中で、発明者らはまた、我々のツールにより評価される数百万のサブセットにおけるエラーの全体分布を推定する。これは、我々にツールの実施の粗い特徴づけ、及び別個の実行を比較するためのまた便利な方法を与える。特に、検索ツールの2つのセットアップが比較された。第1のセットアップにおいて、我々は、GAラッパを単に3,501x104遺伝子発現データについてその分類だけに基づく特徴サブセットを展開させた。第2のセットアップにおいて、発明者らは、DNAメチル化データに基づいて別々の分析からサンプルの約60%に関する分類情報を使用した。このセットアップにおいて、発明者らは、検索の付加的なガイダンスを提供するために、遺伝子発現及びDNAメチル化(誤)分類パフォーマンスを結合した。多モード手法での主要なアイデアは、メチル化データが、情報の付加的な(直交の)ソースとして、広大な検索空間を通じた検索を支援する制約として役立つということである。
図26は、このツールの4つの可能性がある出力を示す。各グラフは、両方のセットアップにおける分類エラーの分布を示す。鍵となる観察は、以下の通りである:
患者の適当な又は置換されたラベリング両方に対して、学習パフォーマンスは、付加的なメチル化ベースの制約の有無両方で同様である。これは場合に乏しい特徴の豊富なデータ(3,501の特徴対78のサンプル)の直接的な結果であり、これによりツールがデータをほとんどラベリングにフィットさせることができる。
検証パフォーマンスプロットは、我々のツールが、実際に意味がある特徴サブセットを見つけることを証明する。発現のみの分析では、検証パフォーマンス(26の目に見えないサンプルでの)は、置換されたラベル上のパフォーマンスと全く異なる(3.5%エラーにある中央値対41.3%エラーにある中央値)。
メチル化限定された実行の評価パフォーマンスは、また、適当なラベルと置換されたラベル(3.2%対40.8%の中央値エラー分類)間の同じ明白な評価エラー分布を示すが、また、メチル化駆動ケースのわずかな評価パフォーマンス改善を示す。
予測されたラベルの確率推定及び学習パフォーマンスの統計的有意性を使用して署名を特徴づけること。
GA―SVMは、学習データ上のパフォーマンスの程度を変化させて、何千もの署名を生成する能力を持つ。GA自体が下位学習エラー及びより短い長さを持つ署名を選択するためのメカニズムを持つ一方で、GA―SVMの結果として生じる出力は、まだ他の特徴描写を必要とする。これをなすために、GA―SVMは、学習データのための結果ラベルの100個の独立置換を使用して、独立して実行する。置換された試行に対するGAの出力を使用して、ツールは、所与のサイズのすべての署名間の学習エラーの分布を使用してギュンベル(タイプIの極値)分布のパラメータを推定する。よって、GA実行の10から45の範囲のサイズの署名がある場合、別々のEVDパラメータは、それらのサイズの各々に対して計算される。背景分布としてランダムなデータ上に良好な実行の署名を発見する際にGAのパフォーマンスを使用して、発明者らは、ここで、実際のデータ上でGAにより識別される署名が統計的に有意かどうか識別できる。さらに、多数の遺伝子署名のため、ツールは、多重比較のために調整されて、所与のデータで極端にありそうもなく偶然見つけられた(p<0.05%)学習パフォーマンスを達成しているそれらの署名だけを選択する。この「p値フィルタ」を通過するそれらの署名の間で、最善に実行している署名は、より大きい署名で最もありそうである。従って、ツールは、p値フィルタを生き残ったサブセットのプールから100個の最大の署名を選択する。
図27から分かるように、選択された署名(青の)は、GA―SVMツールにより生成されるすべての署名と比較して、著しくより良好な評価パフォーマンスを持つ。
最後に、選択された遺伝子発現署名は、サンプルのためのそれらの予測されたラベルの信頼に基づいて、あらゆるサンプルにおいてランク付けられる。この信頼測定値は、署名により定義された超平面からのサンプルの距離の関数である。
臨床注釈により分類される患者間の遺伝子発現を視覚化すること
複数の分類の間で患者を識別する遺伝子署名が発見されると、それらの機能的な関連性に関する疾患及びゲイン信頼へのメカニズムへの幾つかの洞察を得るために、遺伝子を調査して、特徴づけることは重要である。乳癌マイクロアレイ遺伝子発現データは、しばしば、適当な治療計画を選択する際に臨床医を援助する、例えば腫瘍等級、ホルモン受容体状態などの患者に対するさまざまな臨床パラメータを供給する。調査ステップとして、署名の特定の遺伝子がどのくらい臨床注釈と相関するかを評価することが重要である。例えば、人は尋ねることができる−癌の管腔及び基礎のサブタイプ間を区別する遺伝子は、ホルモン受容体状態のような臨床注釈内にクラスタ形成を示すか?答がYESであれば、ホルモン受容体状態(しばしば疾患の積極性を示す)は、特定のサブタイプにリンクされることができ、メカニズムに関する他の仮説が生成できる。我々の特徴ブラウザツールは、ユーザは特定の臨床注釈によって分類される患者間の遺伝子の発現強度を視覚化できる。
ツールの現在のバージョンは、3つの臨床注釈、1)ホルモン受容体状態、2)Her2FISH状態、及び3)腫瘍等級に焦点を合わせている(図28参照)。発明者らは、これらの注釈の各々の概要を提供する。ホルモン受容体状態テストは、エストロゲン及び/又はプロゲステロンホルモン類が腫瘍に燃料を供給するか否か示す。ホルモン受容体否定(例えばER−)である癌より、ホルモン感受性である(例えばER+)癌は、わずかにゆっくり成長し、ホルモン抑制治療に反応する良好な可能性を持つ。ホルモン陰性癌は、他の種類の治療に反応し、ホルモン抑制が必要ではない。Her2FISH状態は、乳癌組織のHER2タンパク質の過剰発現を決定する。この表皮性成長レセプタは、悪性の乳癌と関連している。HER2陽性の患者は、ハーセプチン治療の良好な候補である。腫瘍等級は、癌細胞が顕微鏡の下でどれくらい異常に見えるか、腫瘍がどれくらい速く、成長して、拡散しそうかに関して、癌細胞を分類するために使用されるシステムである。癌細胞の顕微鏡的な外観に基づいて、病理学者は、4度の発病度:等級1、2、3及び4により一般に腫瘍等級を説明する。等級1の腫瘍のセルは、通常のセルに似ていて、成長して、ゆっくり逓倍する傾向がある。等級1の腫瘍は、挙動において最少の積極性であると概してみなされる。他方では、等級3又は等級4の腫瘍のセルは、同じタイプの通常のセルのように見えない。等級3及び等級4の腫瘍は、急速に成長して、下位等級を持つ腫瘍より急速に拡散する傾向がある。
本発明の遺伝子発現署名発見プロセスにおいて、CRABP2(細胞レチノイン酸結合タンパク質2)は、リード弁別器であると決定される。図11において、特徴ブラウザツールは、この遺伝子の発現が複数の臨床注釈によってクラスタ形成されることを示す。ホルモン受容体肯定患者は、一般に、ホルモン受容体否定患者より高いCRABP2発現のレベルを持つ。視覚化から、人は、CRABP2が疾患のホルモン受容体経路に関係すると推測するかもしれない。図28は、同じパターンをフォローするように見えない2つの他の遺伝子の状況のCRABP2を示す。速い文献検索で、レチノイン酸経路が癌経過において重要であることが分かる。
遺伝署名のメタデータを視覚化するためのツール
このツールの目的は、遺伝子署名と関連したメタデータの視覚化を提供することである。遺伝子署名は、遺伝子アルゴリズムのような統計方法により生成できる遺伝子のサブセットである。署名の生成についての他の記述は、タイトルをつけられた区域に含まれる:サポートベクトル機械分類器のための遺伝子アルゴリズムラッパを使用して特徴サブセット選択。
メタデータソースの例は、遺伝子オントロジー(GO)である。遺伝子オントロジーは、非周期的指定グラフとして構成される用語の制御用語集である。このオントロジーは、分子生物学の基本的な領域をカバーしている3つの関係あるオントロジーに分割される:遺伝子産物の分子機能、多段階生物学的プロセスでのそれらの役割、及び細胞コンポーネントに対するそれらの位置測定。研究者は、世界的に遺伝子産物に注釈をつけて、すなわちオントロジーから用語を使用して遺伝子産物を特徴づけて、それらを遺伝子注釈ファイルに含まれるべき「GO」プロジェクトに提出する。遺伝子注釈ファイルにおいて、各注釈は、単一の「GO」用語を持つ単一の遺伝子産物の関連である。遺伝子産物は、それが位置する細胞コンポーネント、その分子機能、及びそれが参加する生物学的プロセスを示している用語により注釈できる。
幾つかのメタデータが他より豊富であるので、署名の遺伝子の注釈(メタデータ)は署名の生物学的意味の理解を提供する。以下の段落は、遺伝子署名メタデータの視覚化を生成するプロセスを説明する。このプロセスを説明しているフローチャートは、図29に表される。
1 遺伝子署名、所望の生物学的状況及び表示パラメータを得る。遺伝子署名は、遺伝子サブセットを含むリストの指標である。ユーザは、調査されるべき生物学的状況を定める。生物学的状況の例は、セル状コンポーネント、分子機能及び生物学的プロセスである。ユーザは、示されるべきアイテムの数のようなプレゼンテーションパラメータ、及び全スクリーン又は半分のスクリーンの表示モードも定めることができる。
2 遺伝子署名と関連するメタデータを得る。例えば、署名の遺伝子と関連した遺伝子オントロジー注釈を得る。さらにまた、これらの注釈は、ユーザにより定められる生物学的状況に限定できる。
3 メタデータの分布を計算する。例えば、それは、以前に収集された遺伝子オントロジー注釈の分布を計算する。
4 降順又は昇順で分布を分類する。
5 視覚教材(例えば棒グラフ)で、一番上からn個の分布を示す。この表示の例は、図30に表される。
メチル結合タンパク質DNA結合部位を見つけること
プログラムは、DNAシーケンスのメチル結合部位を識別する。ツールは、マイクロアレイプローブで働き、これらのプローブ・シーケンスの中で特定パターンを認識するようにデザインされていた。
発明者らは、パターン検索を差別的にメチル化されたシーケンスに適用する。我々のCpG島アレイは、ゲノム全体のCpG島を含む。統計分析によりフォローされるハイブリダイゼーション実験に基づいて、我々は、差別的にメチル化される一組の座(プローブ/シーケンス)を得る。これは、結果のより簡単な生物学的解釈を可能にする。プログラムへの入力は、以下を含む:
1 指標ファイル−このファイルは、我々が分析を行いたいMspI断片に対応する指標のリストを含む。指標ファイルの第1のラインは、ヘッダ情報と考えられ、処理されない。
2 マイクロアレイプローブ注釈ファイル−このファイルは、プローブID、それらのシーケンス及び他の関連情報を含む。MOMAアレイのために、処理される情報は、以下を含む:
a MspFragID
b シーケンス
c 隣接する遺伝子及びMsp断片までのそれらの距離。これらの値は、センス鎖及びアンチセンス鎖両方で、5'及び3'方向両方に対してリストされる。
第1のラインは、ヘッダ情報であると考えられて、処理されない。
プログラムの全体のフローは、以下の通りである:
1 マイクロアレイ注釈ファイルをアレイに入れる。
2 指標ファイルの各指標に対して、注釈ファイル・アレイから対応する行を抜粋する。指標ファイルに明記されている指標番号と対応するMsp断片の行番号との間の直接の対応付けがある。
3 Msp断片行を値のアレイに分割する。
4 Msp断片に最も近い遺伝子を計算する。
5 Msp断片(行アレイのその位置によりアクセスされる)のシーケンス上のメチル結合部位のリストを調べるために簡易な発現マッチを実行する。
6 最も近い遺伝子及び最小距離に加えてファイルへのヒットを印刷する。
プログラムは、以下を持つファイルを印刷する:
1 識別される特定のパターン又はメチル結合部位
2 MspFragID
3 Msp断片に最も近い遺伝子(遺伝子記号)
4 最も近い遺伝子までの距離。
サンプルのプリントアウト:
Kaiso: MspFrag129193 355698 KIAA0427
Kaiso: MspFrag87210 482172 BC033889
Kaiso: MspFrag139352 99006 AK074590
MeCP2: MspFrag145432 293059 CEBPB
Kaiso: MspFrag6016 12977 MGC15668
MeCP2: MspFrag148218 1146 ZNF295
MeCP2: MspFrag121388 357633 LHX1
Kaiso: MspFrag27766 1055474GPR27
MeCP2: MspFrag27766 1055474GPR27
Kaiso: MspFrag86939 326583 LRP5
MeCP2: MspFrag86939 326583 LRP5
Kaiso: MspFrag150179 219969 BCR
Kaiso: MspFrag46871 24399 HLA−F
MZIF: MspFrag46871 24399 HLA−F
Kaiso: MspFrag108348 22589 AK000173
MeCP2: MspFrag137260 269802 ZNF507
Kaiso: MspFrag47714 14469 BC091488
MeCP2: MspFrag1006 61125 BC065369
Kaiso: MspFrag110545 131366 AK127296
MeCP2: MspFrag128335 813522 GATA6
MeCP2: MspFrag152493 3200 CELSR1
Kaiso: MspFrag42758 341720 CXXC5
Kaiso: MspFrag144741 4395 MAFB
トップダウンの階層的な分類
当該方法は、各列で見られる値に基づいて行を分類して、同じ列の一つ以上の強いパターンを呈しているそれらの行を検出して、グループ化する。この分類方法で、異なった列のコンテンツは、個別に分析される。パターンが個々の列で検索され、グローバルな計量が列間で計算される必要がないので、標準クラスタ形成アルゴリズムとは対照的に、我々の方法は並列化にかなり適している。
ツールにおいて、この方法は、マイクロアレイ実験データのパターンを検出する分類(クラスタ形成する)手法として適用される。マイクロアレイ・データを持つ課題は、プローブ(特徴)の数対サンプルの数の巨大な差異があるということである。単一の遺伝子(又は、座)に集中することにより、全体の分類及びサブセット選択課題上の単一の遺伝子の影響が示される。単一のデータサンプル/患者に集中することにより、発明者らは、サンプル/患者ごとに同じように表される遺伝子を検出できる。
列がデータサンプルを表すとする例において、行がその特定のデータサンプルのためのマイクロアレイの遺伝子(座)のメチル化濃度を表す。各データサンプルは、異なる患者から、または、1人の患者の異なる組織から生じ得る。
分類方法は、以下の通りに進行する:
-各列の値の棒グラフを引き出す。
-各列に対する棒グラフ比較に基づいて行を分類する。
棒グラフを作る
各列に対して、「類似である」値が一緒にグループ化され、各クラスに入る値の数を示す棒グラフが作られる。
分類
次に、各列に対して、特定の基準(例えば最大のクラス)によって、一つ以上の棒グラフクラスが選択される。棒グラフクラスに基づいて、領域は、選ばれたアルゴリズムに従って行のグループ(クラスタ)に分割され、中止基準に到達されるまで、選択プロセスが、サブドメインの各々において繰り返される。生成されるクラスタに基づいて、同じアルゴリズムが、行上の必要な置換を特定する(分類)。
トップダウン階層的な分類(TDH)を実施−図31
TDHSで最初に、列の何れかにおいて最も長いパターン(すなわち、最大の棒グラフクラスに対応するパターン)が計算される。最大の棒グラフクラスは、「類似の」値を共有する行の最大数を供給する。全ての列(各列に対して、単一の棒グラフがある)間の全ての棒グラフにおいて最大値が見つかると、最大の棒グラフの列が選択され、最長棒グラフクラス(すなわち最長パターン)に貢献する行が一緒にグループ化される。最長パターンに基づいて、TDHSは、行の領域を最長パターン及び残りを含むものに分割する。このように、行の全体の領域は、その列及び残りの類似性を共有するグループに分割され、2つの「クラスタ」を得る(これが、我々がこの用語を採用する語の厳密な意味においてクラスタ形成アルゴリズムではないにもかかわらず)。次の繰り返しにおいて、値の棒グラフが再び作られるか、又は計算された棒グラフがクラスタへの分割を反映するために更新される。2つのクラスタの各々において、(次に)最長の棒グラフクラスが選択され、領域が再び2つのクラスタへ分割される。最長の棒グラフのサイズが既定の閾値未満であるとき、ユーザー定義の数の抽出されるべき長いパターンに到達されるとき、又は2つのクラスタの各々が単一の行を含むときに、繰り返しは止まる。結局、我々は、パターンの階層を持つ。我々は、各ステップで両方のクラスタ又は最長パターンを持つクラスタだけを表示することを選択できる。この戦略は、パターンが前のステップで分割されるときのパターン(又は一部)を逃す。TDHSの1つのバリエーションは、ツリーの一方の側―既に最長パターンを含む側を分割することを止めることである。これは、片側が複数の葉に枝分かれしたバイナリツリーとなる。
遺伝子発現及びDNAメチル化データの相関(図32)
ツールは、他のモダリティの座と強く相関される遺伝子(特徴)を見つけるために、遺伝子発現特徴と差動DNAメチル化オーダーとの間の統計的相関を使用する。我々は、一方のモダリティ(RNA及びDNAメチル化)から他方のモダリティへ特徴を相関付ける方法を使用し、未知の場合の結果を予測するために、最も高く相関していて、予測的な特徴を見つける。我々は、1つの指標の場合(良性/生存した)の最善に相関する特徴の対を選択し、逆の指標の場合(悪性の/死んだ)の特徴の対を選択する。予測のための特徴の対の回帰モデルが生成される。この回帰モデルに基づいて、我々は、未知の場合の指標を予測する。トレーニングしながら、我々は一つ以外除外する方法を使用する:一人以外全ての患者ケースがトレーニングのために使用され、一人のケースがテストのために使用される。
当該方法は、供給されたデータに基づいて2つの可能なモードで使用される:
1 遺伝子発現データセットからの署名を最善に実施することだけvs差動DNAメチル化データセットから署名を最善に実施すること。
2 全ての遺伝子発現特徴が相関していることvs全ての差動DNAメチル化座。
サブタイプにより分類された患者間の断片メチル化を視覚化
機能的関連性への幾つかの洞察を得るために、断片ベースで断片上の疾患病変に関わる断片を調査して特徴づけることが重要である。乳癌は、例えば腫瘍等級、ホルモン受容体状態などの患者の様々な臨床パラメータを持ち、癌は異なるタイプにサブグループ化できる。調査ステップとして、署名の特定の断片がどのくらいこれらのサブグループと相関するかを評価することが重要である。
ツールの現在のバージョンは、データベースから選択される一組の患者に関連して、所与の患者の所与の断片メチル化状態をプロットする。患者はそれらのサブグループに従ってグループ化され、患者のメチル化状態は黒い長方形で強調される。
階層的にクラスタ形成することによって患者のクラスタ系統樹を視覚化すること
署名が得られるとき、署名がどのように患者を様々なサブタイプにグループ化するかを見ることが重要である。このタイプの視覚化は、DNAメチル化データに対してだけでなく遺伝子発現データに対して両方とも可能である。この時、我々は、種々異なるサブグループが、結果、組織変化、レセプタ状態等の臨床設定において関連するかどうか見ることができる。
所与の署名に対して、我々は、距離メトリックとしてピアソン相関を使用して階層的クラスタ形成を実施する。系統樹出力は、ER状態のような臨床パラメータを使用して注釈がついている。クラスタの所与の患者は、Xにより示される。この時、臨床医は、患者が再発、ER状態等の高い又は低い危険度を持つグループにあるとして分類されるかどうか決定できる。また、系統樹は、患者が非定型のグループにどのように属するかという着想を与える。時々、臨床パラメータは、患者が治療に応答して、ER陽性のサブグループに帰属していることを示してもよい。しかし、署名の状況において、患者は、悪い予後を持つER陰性グループに属すると分類されるかもしれない。ここで、臨床医は、この患者を、古典的臨床パラメータが別途指示する場合であっても、サブグループに従って悪いリスクプロファイルをおそらく持つとして、治療する必要がある。
最後の2つの例において、本発明の最もキーとなる進歩的な態様を含む一連の概念が説明されている。本システムは、全ての患者に対して少なくとも10年の生存経過観察でもって、200人の患者に対する高いスループット(遺伝子発現及びDNAメチル化)及び臨床データを与えられる。データは内部データベースにロードされ、システムは本発明の本文に説明されたツールを使用するように設定される。
この例では、遺伝子発現データは、分析が進行するにつれて、ユーザに利用可能な一連のツールを使用して分析される。まず最初に、ユーザは、フィルタリングツールの一つを選択し、この選択に基づいて分析の状況が遺伝子発現のために設定され、利用できるツールの次のセットは、例えば、遺伝子発現データのためにデザインされる分類器周辺の遺伝子アルゴリズムラッパである。この分析の結果は、研究者が、この状況において追加利用できるツールのアプリケーションに基づいて分析し優先させることができる一組の候補署名である。これらのツールの1つは、特徴サブセット選択のための遺伝子アルゴリズムへの付加的な入力として、DNAメチル化測定を使用してデータを再分析することである。この出力は、システムで登録されたより多くのツールを使用して、調査が再び分析し優先させることができる候補署名の追加セットである。一つ又は2つ最後に、臨床評価のこれらの署名が選択される場合、PAPAyAのアプリケーションのリサーチ部分は完全である。イノベーションのこの態様の鍵は、パイプラインのステージ(例えば前処理、分析又は後処理)及び選択されたモダリティを含む分析の状況において適用できるツールをユーザに継続的に供給することである。
この例では、本発明の調査モードで発見される一つ以上の候補署名が確認され、分子診断テストが臨床に利用でき、臨床実践の一部である。アプリケーションの臨床判断サポートモードは、臨床医が患者の分子プロファイルを見れるようにするが、さらに重要なことに、当該システムは、状況に基づいて、他の臨床調査の状況の患者データの視覚化及び処理を可能にするツールへアクセスを提供する。例えば、臨床医は、診断テストが基づいている署名を決定したオリジナルの臨床調査の状況の患者のプロファイルを見たいと所望する。再び、システムは、判断サポートインタラクションの現在の状況を維持して、分子及び臨床モダリティとデータの他の関連ソースとの間の切り換えを可能にする関連したツールを臨床医に供給する。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせを含む何れの適当な形式で実行できる。本発明又は本発明の幾つかの特徴は、一つ以上のデータプロセッサ及び/又はデジタル信号プロセッサで走るコンピュータソフトウェアとして実行できる。本発明の実施例の要素及び部品は、適当な態様で物理的、機能的及び論理的に実行されてもよい。実際、機能は、単一のユニット、複数のユニット又は他の機能的ユニットの一部として実行されてもよい。このように、本発明は、単一のユニットで実行されてもよいし、異なるユニット及びプロセッサ間に物理的及び機能的に分配されてもよい。
本発明は、特定の実施例に関連して説明されたが、ここで述べられた特定の形式に限定されることが意図されていない。むしろ、本発明の範囲は、添付の請求項によってのみ限定される。請求項において、用語「有する」は、他の要素又はステップの存在を除外しない。加えて、個別の特徴は、別々の請求項に含まれているが、これらは好適に組み合わせられてもよく、異なる請求項に含まれていることは、特徴の組み合わせが実現可能でない、及び/又は有利でないことを暗示しない。加えて、単数の符号は、複数を除外しない。よって、「a」、「an」、「第1の」、「第2の」等の符号は複数を除外しない。更に、請求項の参照符号は、範囲を限定するものと解釈されない。

Claims (21)

  1. 少なくとも一人の患者から得られるデータの事前臨床分析及び/又は臨床分析のための医療分析システムであって、データ、分析結果、フロー定義、ツール定義、及びデータベースリポジトリを利用するツールのための他の関係するデータの集まりを有する内部データベースと、前記内部データベースへのアクセスを供給するデータベースアクセスユニットと、前記患者と関係する生体分子データを有する第1の生体分子モダリティ、及び前記患者と関係する臨床データを有する第2の臨床モダリティを有する複数のデータモダリティの分析並びに視覚化の設定可能なフローの実行を供給するフロー定義ユニットと、データモダリティの一つ以上で働く一つ以上のツールを前記システムが設定しインスタンスを作成するためのインタフェースを持つツール実行エンジンと、前記システムが実行するツールの集まりを有するツールレポジトリであって、前記ツールがグラフィカルユーザインタフェース(GUI)での実行を視覚化可能にするためにルールのセットに従う当該ツールレポジトリと、前記システム自体に格納される又は前記内部データベースとは異なるデータベースに格納されるデータを表す一つ以上の関連する外部データベースと、データ、分析結果及び一つ以上のツール実行の結果を同時に視覚化するグラフィカルユーザインタフェース(GUI)とを有し、当該GUIは、1)第1の生体分子モダリティの結果と、2)第2の臨床モダリティの結果とを同時に視覚化する、医療分析システム。
  2. 事前臨床状況で少なくとも一人の患者に適用される、請求項1に記載の医療分析システム。
  3. 患者のグループに適用される、請求項1に記載の医療分析システム。
  4. 臨床状況で一人の患者に適用される、請求項1に記載の医療分析システム。
  5. 臨床判断サポートシステムとして機能する、請求項1に記載の医療分析システム。
  6. 第1の生体分子モダリティ及び第2の臨床モダリティは、機械学習アルゴリズムにより統合可能であり、この統合の結果は前記GUIで視覚化可能である、請求項1に記載の医療分析システム。
  7. 第1の生体分子モダリティ及び第2の臨床モダリティは、統計アルゴリズムにより統合可能であり、この統合の結果は前記GUIで視覚化可能である、請求項1に記載の医療分析システム。
  8. 第1の生体分子モダリティ及び第2の臨床モダリティは、それぞれのゲノム注釈に基づいて統合可能であり、この統合の結果は前記GUIで視覚化可能である、請求項1に記載の医療分析システム。
  9. 第1の生体分子モダリティは高いスループットデータサンプリングモダリティに基づく、請求項1に記載の医療分析システム。
  10. 前記高いスループットデータサンプリングモダリティにより供給されるサンプルは、少なくとも100000個のパラメータ/種でのデータを有する、請求項9に記載の医療分析システム。
  11. 第1の生体分子モダリティは、高いスループット遺伝子発現プロファイリング、DNAメチル化状態プロファイリング、比較ゲノムハイブリダイゼーション分析から成るグループから選択される、請求項1に記載の医療分析システム。
  12. 前記フロー定義ユニット(FD)が少なくとも一つの他の生体分子モダリティを有する、請求項1に記載の医療分析システム。
  13. 前記他の生体分子モダリティは、高いスループット遺伝子発現プロファイリング、DNAメチル化状態プロファイリング、比較ゲノムハイブリダイゼーション分析、及びSNPプロファイルから成るグループから選択される、請求項1乃至12の何れか一項に記載の医療分析システム。
  14. 前記患者は、癌、心疾患、代謝性疾患、胃腸疾患、神経疾患から成るグループから選択される臨床状態を持つ、請求項13に記載の医療分析システム。
  15. 請求項1に記載の医療分析システムの使用を有する、特定の臨床状態と関連する生体分子又は臨床署名の発見のプロセス。
  16. 前記臨床状態が、癌、心疾患、代謝性疾患、胃腸疾患、神経疾患から成るグループから選択される、請求項15に記載のプロセス。
  17. 前記癌は乳癌又は大腸癌である、請求項16に記載のプロセス。
  18. 前記署名は、遺伝子発現署名、DNAメチル化状態署名、比較ゲノムハイブリダイゼーション署名、及びSNP署名である、請求項15に記載のプロセス。
  19. 請求項1に記載の医療分析システムの使用を有する臨床判断サポートのためのプロセス。
  20. 患者のデータが、臨床状態と関連する生体分子又は臨床署名の識別のためのシステムに適用される、請求項19に記載のプロセス。
  21. 関連したデータ格納手段を持つ少なくとも一つのコンピュータを有するコンピュータシステムが、請求項1に記載の医療分析システムを制御可能にするコンピュータプログラム。
JP2011509052A 2008-05-12 2009-05-06 医療分析システム Active JP5464503B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US5246208P 2008-05-12 2008-05-12
US61/052,462 2008-05-12
PCT/IB2009/051862 WO2009138909A1 (en) 2008-05-12 2009-05-06 A medical analysis system

Publications (2)

Publication Number Publication Date
JP2011520206A true JP2011520206A (ja) 2011-07-14
JP5464503B2 JP5464503B2 (ja) 2014-04-09

Family

ID=40875017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011509052A Active JP5464503B2 (ja) 2008-05-12 2009-05-06 医療分析システム

Country Status (6)

Country Link
US (3) US9858392B2 (ja)
EP (1) EP2279478A1 (ja)
JP (1) JP5464503B2 (ja)
CN (2) CN102084366A (ja)
RU (2) RU2010150771A (ja)
WO (1) WO2009138909A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016066137A (ja) * 2014-09-24 2016-04-28 富士フイルム株式会社 診療支援装置、診療支援装置の作動方法および作動プログラム、並びに診療支援システム
CN109072309A (zh) * 2016-02-02 2018-12-21 夸登特健康公司 癌症进化检测和诊断
JP2018206446A (ja) * 2018-10-04 2018-12-27 富士フイルム株式会社 診療支援装置、診療支援装置の作動方法および作動プログラム、並びに診療支援システム
JP2019512795A (ja) * 2016-03-16 2019-05-16 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
KR20200031875A (ko) * 2018-09-17 2020-03-25 유진바이오소프트 주식회사 대화형 인터페이스를 이용한 통계 분석 시스템과 통계분석 방법

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012517215A (ja) * 2009-01-30 2012-08-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 胸部腫瘍のサブ分類のための方法
BR112013031048A2 (pt) * 2011-06-06 2016-11-29 Koninkl Philips Nv método de adaptação de um composto de assinatura de um fenótipo que é derivado a partir de medições da amostra; aparelho de imagem clínica para a adaptação de uma assinatura composta de um fenótipo que é derivado de medições de uma amostra; elemento do programa para a adaptação de uma assinatura composta de um fenótipo; meio de leitura por computador
EP2613278A2 (en) 2011-12-05 2013-07-10 Koninklijke Philips Electronics N.V. Retroactive extraction of clinically relevant information from patient sequencing data for clinical decision support
CN114530203A (zh) * 2012-04-02 2022-05-24 皇家飞利浦有限公司 用于临床决策支持的途径可视化
US9104683B2 (en) 2013-03-14 2015-08-11 International Business Machines Corporation Enabling intelligent media naming and icon generation utilizing semantic metadata
US9201629B2 (en) 2013-03-14 2015-12-01 International Business Machines Corporation Instruction for performing a pseudorandom number seed operation
US20150161331A1 (en) * 2013-12-04 2015-06-11 Mark Oleynik Computational medical treatment plan method and system with mass medical analysis
WO2016103036A1 (en) * 2014-12-24 2016-06-30 Oncompass Gmbh System and method for adaptive medical decision support
GB2554591A (en) * 2015-04-29 2018-04-04 Univ British Columbia Clinical support system and method
JP6240804B1 (ja) * 2017-04-13 2017-11-29 大▲連▼大学 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム
CN111684539A (zh) * 2017-12-06 2020-09-18 心脏起搏器股份公司 改善临床工作流程的系统
CN113643825B (zh) * 2021-06-25 2023-08-01 合肥工业大学 基于临床关键特征信息的医疗案例知识库构建方法和系统
WO2023194795A1 (en) * 2022-04-04 2023-10-12 Citadel Information Services Private Limited A multi-modal, multi-omic enterprise graph-based, semantic ontology-based recommender framework.

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003503770A (ja) * 1999-06-29 2003-01-28 インターセット リミテッド ヒト癌仮想シミュレーション装置
JP2005309836A (ja) * 2004-04-22 2005-11-04 Link Genomics Kk がん診断支援システム
WO2006072011A2 (en) * 2004-12-30 2006-07-06 Proventys, Inc. Methods, systems, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality
JP2006202235A (ja) * 2005-01-24 2006-08-03 Nara Institute Of Science & Technology 経時的現象発生解析装置及び経時的現象発生解析方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE197511T1 (de) * 1995-07-25 2000-11-11 Horus Therapeutics Inc Rechnergestütztes verfahren und anordnung zur diagnose von krankheiten
US20020069086A1 (en) * 1999-12-06 2002-06-06 Fracek Stephen P. Web linked database for tracking clinical activities and competencies and evaluation of program resources and program outcomes
UA73967C2 (en) * 2000-02-14 2005-10-17 First Opinion Corp Structure-based automatic processing for diagnostics (variants)
US20020010552A1 (en) * 2000-05-26 2002-01-24 Hugh Rienhoff System for genetically characterizing an individual for evaluation using genetic and phenotypic variation over a wide area network
CA2377213A1 (en) * 2001-03-20 2002-09-20 Ortho-Clinical Diagnostics, Inc. Method for providing clinical diagnostic services
US8135595B2 (en) * 2004-05-14 2012-03-13 H. Lee Moffitt Cancer Center And Research Institute, Inc. Computer systems and methods for providing health care
CN101160411B (zh) * 2005-04-15 2014-05-14 Epi基因组股份公司 分析细胞增殖性病症的方法和核酸
CN100452067C (zh) * 2005-10-29 2009-01-14 深圳清华大学研究院 一种医学图像数据传输与三维可视化的实现方法
EP3399450A1 (en) 2006-05-18 2018-11-07 Caris MPI, Inc. System and method for determining individualized medical intervention for a disease state
US20080270183A1 (en) * 2007-04-26 2008-10-30 Michael Hawkins Systems and methods for presentation of clinical evidence for diagnostic interpretation
US20090307179A1 (en) * 2008-03-19 2009-12-10 Brandon Colby Genetic analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003503770A (ja) * 1999-06-29 2003-01-28 インターセット リミテッド ヒト癌仮想シミュレーション装置
JP2005309836A (ja) * 2004-04-22 2005-11-04 Link Genomics Kk がん診断支援システム
WO2006072011A2 (en) * 2004-12-30 2006-07-06 Proventys, Inc. Methods, systems, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality
JP2006202235A (ja) * 2005-01-24 2006-08-03 Nara Institute Of Science & Technology 経時的現象発生解析装置及び経時的現象発生解析方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10714214B2 (en) 2014-09-24 2020-07-14 Fujifilm Corporation Medical assistance device, operation method and operation program for medical assistance device, and medical assistance system
JP2016066137A (ja) * 2014-09-24 2016-04-28 富士フイルム株式会社 診療支援装置、診療支援装置の作動方法および作動プログラム、並びに診療支援システム
CN109072309A (zh) * 2016-02-02 2018-12-21 夸登特健康公司 癌症进化检测和诊断
US11996202B2 (en) 2016-02-02 2024-05-28 Guardant Health, Inc. Cancer evolution detection and diagnostic
JP2019512823A (ja) * 2016-02-02 2019-05-16 ガーダント ヘルス, インコーポレイテッド がんの進化の検出および診断
US11621083B2 (en) 2016-02-02 2023-04-04 Guardant Health, Inc. Cancer evolution detection and diagnostic
US11335463B2 (en) 2016-02-02 2022-05-17 Guardant Health, Inc. Cancer evolution detection and diagnostic
JP2022020620A (ja) * 2016-03-16 2022-02-01 コーニンクレッカ フィリップス エヌ ヴェ 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
JP7117246B2 (ja) 2016-03-16 2022-08-12 コーニンクレッカ フィリップス エヌ ヴェ 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
JP2019512795A (ja) * 2016-03-16 2019-05-16 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
JP7261846B2 (ja) 2016-03-16 2023-04-20 コーニンクレッカ フィリップス エヌ ヴェ 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
KR102136604B1 (ko) 2018-09-17 2020-07-22 유진바이오소프트 주식회사 대화형 인터페이스를 이용한 통계 분석 시스템과 통계분석 방법
WO2020060161A1 (ko) * 2018-09-17 2020-03-26 유진바이오소프트 주식회사 대화형 인터페이스를 이용한 통계 분석 시스템과 통계분석 방법
KR20200031875A (ko) * 2018-09-17 2020-03-25 유진바이오소프트 주식회사 대화형 인터페이스를 이용한 통계 분석 시스템과 통계분석 방법
JP2018206446A (ja) * 2018-10-04 2018-12-27 富士フイルム株式会社 診療支援装置、診療支援装置の作動方法および作動プログラム、並びに診療支援システム

Also Published As

Publication number Publication date
US20180089392A1 (en) 2018-03-29
US9858392B2 (en) 2018-01-02
JP5464503B2 (ja) 2014-04-09
RU2014129772A (ru) 2016-02-10
CN107092770A (zh) 2017-08-25
US20200395128A1 (en) 2020-12-17
CN102084366A (zh) 2011-06-01
RU2010150771A (ru) 2012-06-20
EP2279478A1 (en) 2011-02-02
US20110077964A1 (en) 2011-03-31
WO2009138909A1 (en) 2009-11-19

Similar Documents

Publication Publication Date Title
US20200395128A1 (en) Medical analysis system
Ching et al. Opportunities and obstacles for deep learning in biology and medicine
AU2017338775B2 (en) Phenotype/disease specific gene ranking using curated, gene library and network based data structures
Kuehn et al. Using GenePattern for gene expression analysis
Rosa et al. VAMP: visualization and analysis of array-CGH, transcriptome and other molecular profiles
McDermott et al. Challenges in biomarker discovery: combining expert insights with statistical analysis of complex omics data
US9141913B2 (en) Categorization and filtering of scientific data
JP4594622B2 (ja) 薬発見法
US10275711B2 (en) System and method for scientific information knowledge management
Phan et al. Convergence of biomarkers, bioinformatics and nanotechnology for individualized cancer treatment
US8364665B2 (en) Directional expression-based scientific information knowledge management
JP2006501531A5 (ja)
JP2003021630A (ja) 臨床診断サービスを提供するための方法
Heinzel et al. Functional molecular units for guiding biomarker panel design
Chakraborty et al. Multi-OMICS approaches in cancer biology: New era in cancer therapy
JP2007504542A (ja) 生物学データを処理する方法
Rosati et al. Differential gene expression analysis pipelines and bioinformatic tools for the identification of specific biomarkers: A review
US20220044762A1 (en) Methods of assessing breast cancer using machine learning systems
Perera-Bel et al. Bioinformatic methods and resources for biomarker discovery, validation, development, and integration
Kaddi et al. Developing robust predictive models for head and neck cancer across microarray and RNA-seq data
Wong Using biological networks in protein function prediction and gene expression analysis
Cervantes-Gracia et al. Integrative Analysis of Incongruous Cancer Genomics and Proteomics Datasets
Frascarelli et al. Artificial intelligence in diagnostic and predictive pathology
Huang et al. GENVISAGE: Rapid Identification of Discriminative and Explainable Feature Pairs for Genomic Analysis
Ray Methods for Information Content Analysis of Multimodal High-Throughput Biomedical Data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120427

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130523

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130822

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131217

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140109

R150 Certificate of patent or registration of utility model

Ref document number: 5464503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250