JP6916107B2 - 患者データに基づく健康診断および治療のためのベイジアン因果関係ネットワークモデル - Google Patents

患者データに基づく健康診断および治療のためのベイジアン因果関係ネットワークモデル Download PDF

Info

Publication number
JP6916107B2
JP6916107B2 JP2017513538A JP2017513538A JP6916107B2 JP 6916107 B2 JP6916107 B2 JP 6916107B2 JP 2017513538 A JP2017513538 A JP 2017513538A JP 2017513538 A JP2017513538 A JP 2017513538A JP 6916107 B2 JP6916107 B2 JP 6916107B2
Authority
JP
Japan
Prior art keywords
variables
network
data
network model
causal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017513538A
Other languages
English (en)
Other versions
JP2017537365A (ja
Inventor
ナレイン,ニーブン,ラジン
アクマエブ,ビアチェスラブ,アール.
ベムラパリ,ヴィジェータ
Original Assignee
バーグ エルエルシー
バーグ エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バーグ エルエルシー, バーグ エルエルシー filed Critical バーグ エルエルシー
Publication of JP2017537365A publication Critical patent/JP2017537365A/ja
Application granted granted Critical
Publication of JP6916107B2 publication Critical patent/JP6916107B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

<関連出願>
本願は、2014年9月11日出願の米国仮特許出願62/049,148号に関連し、同願の優先権を主張する。同文献の全体は、参照により本願に組み込まれる。
本文書は一般に、データ分析のシステムおよび方法に関する。具体的には、ヘルスケアデータを用いて因果関係ネットワークモデルを生成することに関する。
多くのシステムは、データを分析してヘルスケアの様々な側面についての知見を得る。データ間の関係を判定することにより、知見を得ることができる。従来手法は、いくつかの関連変数をあらかじめ定め、ヘルスケアデータから分析処理のためのものを抽出する。少数の事前選択した変数に基づき、様々な要因間の関係が構築される。例えば医薬、病気、症状などの関係である。フォーカスする変数を事前選択することにより、新たなまたは未知の関係を発見する能力が制限される。また変数を事前選択することにより、他の関係変数を発見する能力も制限される。例えば糖尿病の分析を検討する際に変数が事前選択される場合、それらの変数に制限され、糖尿病に関連するヘルスケア業界にとって未知な他の変数は分析によってサポートされない。
1側面において本発明は、患者データに基づき因果関係ネットワークモデルを生成するための、コンピュータ実装した方法に関する。前記方法は:複数の患者に対応するデータを受信するステップであって、前記データは各患者の診断情報および/または治療情報を含む、ステップ;前記データをパースして、複数の変数についての正規化データを生成するステップであって、各患者について前記正規化データは1以上の変数について生成される、ステップ;ベイジアンネットワークアルゴリズムを用いて前記生成した正規化データに基づき前記複数の変数に関する因果関係ネットワークモデルを生成するステップであって、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含み、前記因果関係ネットワークは、ネットワークモデル構築コードを保持するストレージと前記ネットワーク構築コードを実行するように構成された1以上のプロセッサを有するプログラムされたコンピュータシステムを用いて生成される、ステップ;を有する。
1実施形態において、前記因果関係ネットワークモデルは、各前記医学的状態の1以上の予測変数を示す関係を含む。1実施形態において、前記受信したデータは、1以上の前記医学的状態に関連するものとして事前選択されない。実施形態において、前記方法はさらに:1以上の追加患者に対応する追加データを受信するステップ;前記追加データに基づき前記因果関係ネットワークモデルを更新するステップ;を有する。1実施形態において、前記因果関係ネットワークモデルは、前記生成した正規化データのみに基づき生成される。
実施形態において、前記方法はさらに:前記因果関係ネットワークからサブネットワークを判定するステップであって、前記サブネットワーク内の1以上の変数は選択された医学的状態と対応付けられている、ステップ;前記サブネットワーク内の関係をプローブして前記選択した医学的状態についての1以上の予測変数を決定するステップ;を有する。1実施形態において、前記選択した医学的状態についての前記1以上の予測変数は、前記選択した医学的状態と同時発生する医学的状態を示す。1実施形態において、前記サブネットワークの広がりは、前記選択された医学的状態と対応付けられた前記1以上の変数、および前記1以上の変数と前記因果関係ネットワーク内の他の変数との間の前記関係の強度、に基づき決定される。1実施形態において、前記サブネットワークは、前記選択された医学的状態に関連付けられた1以上の変数を含み、追加変数の第1セットはそれぞれ前記1以上の変数と第1強度関係を有し、追加変数の第2セットはそれぞれ前記1以上の変数と第2強度関係を有する。実施形態において、前記1以上の予測変数のうち少なくとも1つは、未知のものである。実施形態において、前記1以上の予測変数のうち少なくとも1つは、前記医学的状態の予測変数として新たに認識されたものである。1実施形態において、前記予測変数の個数は前記変数の個数よりも少ない。
実施形態において、前記方法はさらに、ユーザインターフェースにおいて前記1以上の予測変数、前記1以上の変数と前記1以上の予測変数との間の関係、を表示するステップを有する。前記表示は、前記1以上の変数のグラフ表示を含む。実施形態において、前記方法はさらに、前記サブネットワークのグラフをユーザインターフェースに表示するステップを有する。実施形態において、前記方法はさらに、前記1以上の変数と前記1以上の予測変数との間の関係強度に基づき前記1以上の予測変数をランク付けするステップを有する。
1実施形態において、前記方法はさらに:前記因果関係ネットワークモデルからサブネットワークを決定するステップであって、前記サブネットワーク内の1以上の変数は、選択した薬に関連付けられる、ステップ;前記サブネットワークをプローブして前記選択した薬に関連する1以上の予測変数を決定するステップ;を有する。実施形態において、前記選択した薬に関連する前記1以上の予測変数は、前記選択した薬とともに投与された薬を示す。実施形態において、前記1以上の予測変数は、前記選択した薬と1以上の他の薬との間の有害な相互作用を示す。実施形態において、前記サブネットワークの広がりは、前記選択した薬と関連付けられている前記1以上の変数、および前記1以上の変数と前記因果関係ネットワークモデル内の他の変数との間の関係強度、に基づき決定される。実施形態において、前記サブネットワークは、前記選択された薬に関連付けられた1以上の変数を含み、追加変数の第1セットはそれぞれ前記1以上の変数と第1強度関係を有し、追加変数の第2セットはそれぞれ前記1以上の変数と第2強度関係を有する。他実施形態において、前記1以上の予測変数のうち少なくとも1つは、未知のものである。実施形態において、前記1以上の予測変数のうち少なくとも1つは、前記医学的状態の予測変数として新たに認識されたものである。他実施形態において、前記予測変数の個数は前記変数の個数よりも少ない。
1実施形態において、前記因果関係ネットワークモデルは少なくとも50変数に基づき生成される。
1実施形態において、前記因果関係ネットワークモデルは少なくとも100変数に基づき生成される。
1実施形態において、前記因果関係ネットワークモデルは少なくとも1000変数に基づき生成される。
1実施形態において、前記因果関係ネットワークモデルは少なくとも100000変数に基づき生成される。
1実施形態において、前記因果関係ネットワークモデルは50変数から1000000変数の間に基づき生成される。
他実施形態において、前記因果関係ネットワークモデルは50患者から1000000患者の間のデータに基づき生成される。
他実施形態において、前記データは患者の電子健康レコードからの情報を含む。
1実施形態において、前記受信したデータはさらに、前記複数の患者のうち少なくとも一部について、以下の少なくとも1つを含む:患者の人物情報、医療履歴、患者の家族の医療履歴、有効薬品情報、有効でない過去の薬品情報、アレルギー情報、免疫状態情報、実験室テスト結果、放射線画像、バイタルサイン情報、患者の体重、請求情報、ライフスタイル情報、習慣情報、保険請求情報、薬局情報。実施形態において、前記患者の人物情報は、患者の年齢、人種、民族のうち少なくとも1つを含む。
1実施形態において、前記受信したデータは、患者チャートからの情報を含む。実施形態において、前記患者チャートからの情報は、以下のうち少なくとも1つを含む:ヘルスケア専門家によるメモ、ヘルスケア専門家による観察結果、薬品と治療の投与、薬品と治療の投与の順番、テスト結果、x線画像。
1実施形態において、前記受信したデータは患者の退院情報を含む。実施形態において前記患者の退院情報は、以下のうち少なくとも1つを含む:診断コード、治療コード、保険課金コード、診断関連グループコード、国際疫病分類コード。
1実施形態において、前記受信したデータは選択した病院からの複数の患者に関するものである。1実施形態において、前記受信したデータは選択した地域からの複数の患者に関するものである。
実施形態において、ベイジアンネットワークアルゴリズムを用いて前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成するステップは:ベイジアンフラグメント列挙プロセスを介して、前記変数に基づきネットワーク断片のライブラリを生成するステップ;仮ネットワークの集合を生成するステップであって、各仮ネットワークは前記ライブラリ内の前記ネットワーク断片の異なるサブセットから構築される、ステップ;シミュレーテッドアニーリングを介して局所変形させて各仮ネットワークを進化させることにより前記仮ネットワークの集合をグローバル最適化し、コンセンサス因果関係ネットワークモデルを生成するステップ;を有する。実施形態において、ベイジアンネットワークアルゴリズムを用いて前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成するステップはさらに、入力データに基づく前記コンセンサス因果関係ネットワークモデルのコンピュータシミュレーションを実施することにより、前記因果関係ネットワークモデル内の1以上の因果関係についての予測の確信レベルを提供するステップを含む。
他側面において本発明は、因果関係ネットワークモデルを用いるコンピュータ実装した方法に関する。前記方法は:複数の医学的状態からの医学的状態の選択を受信するステップ;コンピュータ生成した因果関係ネットワークモデルからサブネットワークを決定するステップであって、前記因果関係ネットワークモデルはベイジアンネットワークアルゴリズムを用いて患者データから生成され、前記複数の医学的状態に関連する変数を含む複数の変数を有し、前記因果関係ネットワークモデルは前記選択した医学的状態に基づいており、前記サブネットワークは前記選択した医学的状態に対応付けられた1以上の変数を含む、ステップ;前記サブネットワークをスキャンして前記選択した医学的状態についての1以上の予測変数を識別するステップ;前記選択した医学的状態についての前記1以上の予測変数を保存するステップ;を有する。
1実施形態において、前記医学的状態の選択は、ユーザインターフェースを介してユーザから受信する。実施形態において、前記1以上の予測変数のうち少なくとも1つは、未知のものである。実施形態において、前記1以上の予測変数のうち少なくとも1つは、前記医学的状態についての予測変数として新たに認識された予測変数である。実施形態において、前記予測変数の個数は前記変数の個数よりも少ない。
実施形態において、前記方法はさらに、前記予測変数に対して回帰アルゴリズムを適用して、各予測変数と前記選択した医学的状態または薬との間の関係を判定するステップを有する。実施形態において、前記方法はさらに、前記予測変数、前記1以上の選択した変数と前記予測変数との間の関係、を前記ユーザインターフェースに表示するステップを有する。前記表示は、前記1以上の選択した変数のグラフを含む。実施形態において、前記方法はさらに、前記ユーザインターフェースに前記サブネットワークのグラフを表示するステップを有する。実施形態において、前記方法はさらに、前記1以上の選択した変数と前記1以上の予測変数との間の関係強度に基づき前記1以上の予測変数をランク付けするステップを有する。
1実施形態において、前記1以上の予測変数は、1以上の薬品と関連付けられる。1実施形態において、前記予測変数は1以上の医学的状態と関連付けられる。
他側面において本発明は、因果関係ネットワークモデルを用いるコンピュータ実装した方法に関する。前記方法は:複数の医学的状態のうちいずれかの医学的状態に関するクエリを受信するステップ;コンピュータ生成した因果関係ネットワークモデルのなかからサブネットワークを決定するステップであって、前記因果関係ネットワークモデルはベイジアンネットワークアルゴリズムを用いて患者データから生成され、前記複数の医学的状態に関連する変数を含む複数の変数を有し、前記因果関係ネットワークモデルは前記クエリされた医学的状態に基づき、前記サブネットワークは前記クエリされた医学的状態に関連付けられた1以上の変数を含む、ステップ;前記サブネットワークをスキャンして前記クエリされた医学的状態についての1以上の予測変数を識別するステップ;前記クエリされた医学的状態についての前記1以上の予測変数を保存するステップ;を有する。1実施形態において、前記ユーザから受信した前記クエリは、医学的状態および/または医薬品に関連する情報を含む。
1側面において本発明は、因果関係ネットワークモデルを用いるコンピュータ実装した方法に関する。前記方法は:医薬品に関連する情報を受信するステップ;コンピュータ生成した因果関係ネットワークモデルからサブネットワークを決定するステップであって、前記因果関係ネットワークモデルはベイジアンネットワークアルゴリズムを用いて患者データから生成され、前記複数の医薬品に関連する変数を含む複数の変数を有し、前記因果関係ネットワークモデルは前記医薬品に基づいており、前記サブネットワークは前記医薬品に関連する1以上の変数を含む、ステップ;前記サブネットワークをスキャンして前記医薬品についての1以上の予測変数を識別するステップ;前記医薬品についての前記1以上の予測変数を保存するステップ;を有する。
他側面において本発明は、患者データに基づき因果関係ネットワークモデルを生成するシステムに関する。前記システムは:複数の患者に関するデータを受信するように構成されたデータ受信モジュールであって、前記データは各患者の診断情報および/または治療情報を含む、データ受信モジュール;前記データをパースして複数の変数についての正規化データを生成するように構成されたパースモジュールであって、各患者について前記正規化データは1以上の変数について生成される、パースモジュール;ベイジアンネットワークアルゴリズムを用いて前記生成した正規化データに基づき前記複数の変数に関する因果関係ネットワークモデルを生成するように構成されたプロセッサ実装関係ネットワークモジュールであって、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含む、プロセッサ実装関係ネットワークモジュール;を備える。1実施形態において前記因果関係ネットワークモデルは、前記複数の医学的状態それぞれについての1以上の予測変数を示す関係を含む。
他側面において本発明は、患者データに基づく因果関係ネットワークモデルを用いるシステムを提供する。前記システムは:医学的状態に関連する情報を受信するように構成されたデータ受信モジュール;コンピュータ生成した因果関係ネットワークモデルからサブネットワークを決定するように構成されたサブネットワークモジュールであって、前記因果関係ネットワークモデルはベイジアンネットワークアルゴリズムを用いて患者データから生成され、複数の医学的状態に関連する変数を含む複数の変数を有し、前記因果関係ネットワークモデルは前記医学的状態に基づいており、前記サブネットワークは前記医学的状態に関連付けられた1以上の変数を含む、サブネットワークモジュール;前記サブネットワークをスキャンし前記医学的状態についての1以上の予測変数を識別するように構成された変数識別モジュール;を備える。1実施形態において、前記コンピュータ生成した因果関係ネットワークモデルは、本実施形態の方法を用いて生成される。
他側面において本発明は、少なくとも1つのプロセッサが実行することにより、前記少なくとも1つのプロセッサに本実施形態の方法を実施させる、少なくとも1つのプログラムを格納する不揮発性機械読取可能記憶媒体を提供する。
他側面において本発明は、医学的状態についての予測変数を生成するシステムを提供する。前記システムは:複数の患者に対応するデータを受信するように構成された因果関係ネットワークモデル生成器であって、前記データは各患者の診断情報および/または治療情報を含み、前記因果関係ネットワークモデル生成器はさらに、前記データをパースして複数の変数についての正規化データを生成するように構成され、各患者について前記正規化データは1以上の変数について生成され、前記因果関係ネットワークモデル生成器はさらに、前記生成した正規化データに基づきベイジアンネットワークアルゴリズムを用いて各変数を前記複数の変数の1以上に関連付ける因果関係ネットワークモデルを生成するように構成され、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含む、因果関係ネットワークモデル生成器;を備える。1実施形態において前記因果関係ネットワークモデルは、前記複数の医学的状態それぞれについての1以上の予測変数を示す関係を含む。実施形態において前記システムはさらに、ユーザインターフェースを介してユーザから医学的状態に関連付けられた情報を受信し、前記因果関係ネットワークモデルからサブネットワークを決定するように構成された、サブネットワーク選択モジュールであって、前記サブネットワークは前記医学的状態に関連する1以上の変数を含み、前記サブネットワーク選択モジュールはさらに、前記サブネットワークをスキャンして前記医学的状態についての1以上の予測変数を識別し、前記医学的状態についての前記1以上の予測変数を保存するように構成されている、サブネットワーク選択モジュールを備える。
他側面において本発明は、患者データに基づき因果関係ネットワークモデルを生成するシステムを提供する。前記システムは:第1プロセッサにより実装され、複数の患者に対応するデータを受信するように構成された、データ受信モジュールであって、前記データは各患者の診断情報および/または治療情報を含み、前記データ受信モジュールはさらに、前記データをパースして複数の変数についての正規化データを生成するように構成されており、各患者について前記正規化データは1以上の変数について生成される、データ受信モジュール;1以上の追加プロセッサによって実装され、前記生成された正規化データに基づきベイジアンネットワークアルゴリズムを用いて前記複数の変数に関する因果関係ネットワークモデルを生成するように構成され、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含む、因果関係ネットワークモジュール;を備える。
本願全体を通して、リストに提示する値:例えば上述のものは、本発明の一部として意図する範囲の上下限値であってもよい。
本文書は例によって記載されており、これにより限定するものではない。添付する図面において、明示しない限り同様の符号は同様の要素を示す。
1実施形態に基づくヘルスケア分析のためのシステムを示す概略ネットワーク図である。
1実施形態に基づきモジュールの観点からヘルスケア分析システムの概略を示すブロック図である。
1実施形態に基づき関係ネットワークモデルを生成することによるヘルスケア分析方法のフローチャートである。
1実施形態に基づく関係ネットワークモデルを用いる方法のフローチャートである。
例1におけるヘルスケア分析方法のフローチャートである。
例1において用いるヘルスケアエンティティからのデータセット例である。
例1において生成される関係ネットワークモデルの概略を示す。
心不全&心臓発作と腎不全にフォーカスした図7の関係ネットワークのサブネットワークの概略を示す。
図7の関係ネットワークモデルのサブネットワークの概略を示す。心不全&心臓発作にフォーカスし、心不全&心臓発作と肺炎&胸膜炎との間の接続、および心不全&心臓発作と呼吸器感染症との間の接続をハイライトしている。
心不全&心臓発作が肺炎&胸膜炎および呼吸器感染症&炎症とどのようにつながるかについての概略を示す。
図9Aの心不全&心臓発作サブネットワークの概略を示す。心不全&心臓発作とCOPDとの間の接続をハイライトしている。
COPDがどのように心不全につながるかについての概略を示す。
心不全&心臓発作サブネットワークの概略を示す。心不全&心臓発作と不整脈&伝導障害との間の接続をハイライトしている。
心不全&心臓発作サブネットワークの概略を示す。胃腸出血と心不全&心臓発作との間の接続をハイライトしている。
胃腸出血がどのように心不全につながるかについての概略を示す。
心不全&心臓発作サブネットワークの概略を示す。腎不全と心不全&心臓発作との間の接続をハイライトしている。
例1の関係ネットワークモデルから生成した、心不全&心臓発作と腎不全との間の関連プロットである。
例1の関係ネットワークモデルから生成した、心不全&心臓発作と腎不全との間の関係の4分グラフである。
例1の関係ネットワークモデルから生成した、心不全&心臓発作と胃腸出血との間の関連プロットである。
例1の関係ネットワークモデルから生成した、心不全&心臓発作と胃腸出血との間の4分グラフである。
図8のサブネットワークの第2部分の概略を示す。腎不全にフォーカスしている。
図7の関係ネットワークモデルのサブネットワークの概略を示す。腎不全にフォーカスし、気管支炎&喘息と腎不全との間の接続をハイライトしている。
腎不全サブネットワークにおける気管支炎&喘息と腎不全との間の接続、および気管支炎&喘息と腎不全との間の関係についての回帰モデルの概略を示す。
例1の関係ネットワークモデルから生成した、腎不全と気管支炎および喘息との間の関連プロットである。
例1の関係ネットワークモデルから生成した、腎不全と気管支炎および喘息との間4分グラフである。
臨床研究に基づく経路の概略を示す図である。例1の腎不全サブネットワークから判定した、気管支炎&喘息と腎不全との間の新規な接続を説明している。
例1の腎不全サブネットワークから判定した気管支炎&喘息と腎不全との間の新規接続の基盤として存在する可能性がある分子メカニズムの概略を示す図である。
例1の関係ネットワークモデルおよび選択した例2の赤血球障害サブネットワークの概略を示す。
本明細書のヘルスケア分析システムおよび法補遺の実施形態を実装するために用いることができるコンピュータデバイスのブロック図である。
近年、ヘルスケアデータの量が爆発的に増えている。電子健康レコードに適応するためである。このヘルスケアデータを利用して、ヘルスケアを発展させるための新たな道を開くことができる。これは、患者ケアを改善するとともにケアを届ける新たな能力を生成することによる。例えば患者固有の分子的臨床的要因に起因する治療結果のバリエーションを理解することにより、医薬品の正確なモデルを生成することができる。
ヘルスケアにおいて主にビッグデータにフォーカスすることは、ヘルスケアデータをよりよく管理し利用することであり、データマイニングにより仮説をテストすることである。健康データの従来の分析手法は、長期間保持されてきた生物学的または臨床的表現型仮説に依拠することによって、あるいは分析の基盤となるその他仮説に依拠することによって、制限されている。
本明細書の実施形態は、ヘルスケア分析のためのシステム、方法、およびコンピュータ読取可能媒体を含む。実施形態は、様々なヘルスケア領域(例えば患者ケア)に関連するデータに基づき、ベイジアンネットワークアルゴリズムを用いて因果関係ネットワークモデルを生成する。関係ネットワークを生成するために用いるデータは、関連性について事前選択や事前フィルタリングされてない大容量データである。さらに因果関係ネットワークの生成は、どの変数が関係しまたは無関係であるかについての仮定や、変数間の関係についての事前知識に、依拠していない。このバイアスなしアプローチにより、データ収集によりサポートされる接続を表すネットワークモデルを構築する方法とシステムの実施形態を実現できる。このネットワークモデルは、既知の臨床研究によってバイアスされていない。したがって、関連性についてデータを事前選択するとともに変数間の関係についての事前知識を用いる従来アプローチとは異なり、実施形態により得られるネットワークは変数間の新たな相関を含んでいる可能性がより高い。この変数間の相関は、ヘルスケア業界において未知のものであるか、またはヘルスケア業界がこれまで研究探究してこなかったものである可能性がある。実施形態は、患者データをモデル化する方法およびシステムに関するものであり、完全にデータ駆動であって現行知識によりバイアスされていない。このようなデータ駆動非バイアスモデルを用いて、病状の新たな(そして場合によっては驚くべき)傾向を発見することができる。実施形態を用いて、自明ではない併存疾患を識別し、治療方針と手順を改善することができる。
実施形態において、ヘルスケア関連情報を含むデータを取得または受信する。受信したデータを処理およびパースして、複数の変数についての正規化データを生成する。因果関係ネットワークモデルは、ベイジアンネットワークアルゴリズムを用いて、その変数に基づき生成される。例えば関係ネットワークモデルは、複数の医学的状態、および複数の医薬品を含み、その医学的状態と医薬品との間の関係を示す。
実施形態は、生成した因果関係ネットワークを用いる方法を含む。例えば実施形態は、医学的状態または医薬品に関する情報をユーザから受信する。受信した情報に基づき、生成した因果関係ネットワークモデルからサブネットワークを決定する。サブネットワークをスキャンまたはプローブして、医学的状態または医薬品についての予測変数を判定する。予測変数は例えば、医学的状態または医薬品に対して影響がある重要要因である。
定義
本明細書において、具体的に定義することを意図しているが本明細書の他の部分においてまだ定義されていないいくつかの用語を、ここで定義する。
用語“診断/治療情報”は、実施した診断をコード化した任意の情報またはどのような治療が提供されたかを記述する情報のことである。
用語“医学的状態”は、症状や兆候を提示している人の任意の病理学的状態、病状、および/または疾患のことである。
用語“医薬品”または“薬”は、医学的状態を治療し、処置し、および/または防ぐ際に用いることができる、および/または医学的状態を診断する際に用いることができる、任意の医薬、薬剤、治療薬、および/または化学物質のことである。
用語“予測変数”は、数式、アルゴリズム、または決定支援ツールにおいて結果を予測するために用いることができる変数のことである。数式、アルゴリズム、または決定支援ツールは、結果を予測するために複数の予測変数を用いることができる。
以下の説明は、ヘルスケア分析のシステムおよび方法を当業者が生成および使用できるようにするために提示するものである。実施形態に対する様々な変形は、当業者にとって明らかである。本明細書が定義する一般原理は、本発明の原理と範囲から逸脱することなく、他の実施形態やアプリケーションに対して適用することができる。以下の説明において、説明のため様々な詳細部分を記載している。しかし、そのような特定の詳細部分がなくとも本発明を実施できることを、当業者は理解するであろう。他の例において、不要な詳細説明によって本発明の記載を不明瞭にしないため、既知の構造やプロセスはブロック図として示される。したがって本文書は、実施形態を限定するためのものではなく、本明細書の原理と特徴に準じて最も広く解釈されるべきである。
図1は、システム100の例のネットワーク図を示す。システム100は、その一部または全体が本実施形態に基づくヘルスケアシステムに含まれるものである。システム100は、ネットワーク105、クライアントデバイス110、クライアントデバイス115、クライアントデバイス120、クライアントデバイス125、サーバ130、サーバ135、データベース140、データベースサーバ145を有する。クライアントデバイス110、115、120、125、サーバ130、サーバ135、データベース140、データベースサーバ145は、それぞれネットワーク105と接続されている。
実施形態において、ネットワーク105の1以上の部分は、アドホックネットワーク、イントラネット、エクストラネット、仮想プライベートネットワーク(VPN)、ローカルエリアネットワーク(LAN)、無線LAN(WLAN)、ワイドエリアネットワーク(WAN)、無線ワイドエリアネットワーク(WWAN)、メトロポリタンネットワーク(MAN)、インターネットの一部、公衆電話網(PSTN)の一部、携帯電話ネットワーク、無線ネットワーク、WiFiネットワーク、WiMaxネットワーク、その他任意タイプのネットワーク、またはこれらネットワークの2以上の組み合わせである。
クライアントデバイスの例としては、以下が挙げられるがこれに限らない:ワークステーション、パーソナルコンピュータ、汎用目的コンピュータ、インターネットアプライアンス、ラップトップ、デスクトップ、マルチプロセッサシステム、セットトップボックス、ネットワークPC、無線デバイス、ポータブルデバイス、ウェアラブルコンピュータ、携帯電話、携帯電子個人端末(PDA)、スマートフォン、タブレット、ウルトラブック、ネットブック、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラム可能電子機器、ミニコンピュータ、など。クライアントデバイス110、115、120、125は、有線または無線接続を介してネットワーク105と接続することができる。
実施形態において、クライアントデバイス110、115、120、125に含まれるヘルスケア分析システムは、本明細書が記載する機能をローカル実施するように構成することができる。一方でサーバ130、135は、本明細書が記載するその他機能を実施する。例えばクライアントデバイス110、115、120、125は、患者データを受け取り、患者データをパースすることができる。一方でサーバ135は、因果関係ネットワークを生成することができる。他例において、クライアントデバイス110、115、120、125は条件の選択を受け取ることができ、サーバ135は、因果関係ネットワークからサブネットワークを決定し、サブネットワークをスキャンして選択した条件についての予測変数を識別し、識別した予測変数を保存することができる。他例において、クライアントデバイス110、115、120、125は、条件の選択を受け取ることができ、サーバ135は、因果関係ネットワークからサブネットワークを決定するとともにそのサブネットワークをスキャンして選択した条件についての予測変数を識別することができる。クライアントデバイス110、115、120、125はその識別した予測変数を保存することができる。
別実施形態において、クライアントデバイス110、115、120、125は、本明細書が記載する全機能を実施することができる。例えばクライアントデバイス110、115、120、125は、患者データを受信し、患者データをパースし、患者データに基づき因果関係ネットワークを生成することができる。他例においてクライアントデバイス110、115、120、125は、条件の選択を受け取り(例えば医学的状態や医薬品)、選択した条件に基づき因果関係ネットワークからサブネットワークを決定し、そのサブネットワークをスキャンして選択した条件についての予測変数を識別し、その識別した予測変数を保存することができる。
他実施形態において、ヘルスケア分析システムはクライアントデバイス110、115、120、125に含めることができ、サーバ135は本明細書が記載する機能を実施する。例えばサーバ135は、患者データを受け取り、患者データをパースし、患者データに基づき因果関係ネットワークを生成することができる。他例においてサーバ135は、条件の選択(例えば医学的状態や医薬品)を受け取り、選択した条件に基づき因果関係ネットワークからサブネットワークを決定し、そのサブネットワークをスキャンして選択した条件についての予測変数を識別し、その識別した予測変数を保存することができる。
実施形態において、サーバ130とサーバ135は、分散コンピュータ環境の一部であってもよい。タスク/機能の一部はサーバ130と135の間で分散される。実施形態において、サーバ130とサーバ135は、並列コンピュータ環境の一部であり、サーバ130とサーバ135はタスク/機能を並列実施して、本明細書が記載する因果関係ネットワークモデルを生成するために必要なコンピュータリソースと処理リソースを提供する。
実施形態において、サーバ130、135、データベース140、データベースサーバ145は、有線接続によりネットワーク105と接続される。これに代えて、サーバ130、135、データベース140、データベースサーバ145のうち1以上は、無線接続によりネットワーク105と接続することもできる。図示していないが、データベースサーバ145は、データベース140と直接接続することができ、サーバ130、135はデータベースサーバ145および/またはデータベース140と直接接続することができる。サーバ130、135は、ネットワーク105を介してクライアントデバイス110、115、120、125と通信するように構成された1以上のコンピュータまたはプロセッサを備える。サーバ130、135は、クライアントデバイス110、115、120、125がアクセスする1以上のアプリケーションまたはウェブサイトをホストし、および/またはデータベース140のコンテンツにアクセスできるようにする。データベースサーバ145は、データベース140のコンテンツにアクセスできるようにするように構成された1以上のコンピュータまたはプロセッサを備える。データベース140は、サーバ130、135、データベース145、および/またはクライアントデバイス110、115、120、125が用いるデータおよび/または命令を格納する1以上のストレージデバイスを備える。データベース140、サーバ130、135、および/またはデータベースサーバ145は、1以上の地理的に互いに分散した場所に配置し、またはクライアントデバイス110、115、120、125から地理的に分散した場所に配置することができる。これに代えてデータベース140は、サーバ130、135、またはデータベースサーバ145に含めることができる。
図2は、実施形態にしたがってモジュールで実装されたヘルスケア分析システムを示すブロック図200である。実施形態においてモジュールは、データモジュール210、パースモジュール220、関係ネットワークモジュール230、サブネットワークモジュール240、予測変数モジュール250を含む。実施形態において、モジュール210、220、230、240、250のうち1以上は、サーバ130および/またはサーバ135に含まれる。モジュール210、220.230、240、250のうちその他のものは、クライアントデバイス110、115、120、125において提供される。例えばデータモジュール210はクライアントデバイス110、115、120、125に含まれ、パースモジュール220、関係ネットワークモジュール230、サブネットワークモジュール240、予測変数モジュール250はサーバ130またはサーバ135に含まれる。他例において、データモジュール210はクライアントデバイス110、115、120、125に含まれ、パースモジュール220と関係ネットワークモジュール230はサーバ130において提供され、サブネットワークモジュール240と予測変数モジュール250はサーバ135において提供される。他例において、関係ネットワークモジュール230の機能の一部はサーバ130によって実施され、関係ネットワークモジュール230の機能のその他部分はサーバ135によって実施される。
別実施形態において、モジュールはクライアントデバイス110、115、120、125のいずれかが実装することができる。モジュールは、クライアントデバイス110、115、120、125が備える1以上のプロセッサが実行するように構成された1以上のソフトウェアコンポーネント、プログラム、アプリケーション、apps、その他のコードベースユニットまたは命令を備える。実施形態において、モジュール210、220、230、240、250は、ウェブサイトからダウンロードすることができる。他実施形態において、モジュール210、220、230、240、250は、外部ハードウェアコンポーネントからインストールすることができる。例えば外部記憶装置(例:USBドライブ、サムドライブ、CD、DVDなど)である。
図2においてモジュール210、220、230、240、250は個別のモジュールとして示しているが、モジュール210、220、230、240、250は図示するよりも少ないまたは多いモジュールとして実装できることを理解されたい。モジュール210、220、230、240、250は、1以上の外部コンポーネントと通信できることを理解されたい。例えばデータベース、サーバ、データベースサーバ、クライアントデバイスである。
データモジュール210は、データを受け取り管理するように構成されたハードウェア実装したモジュールであってもよい。パースモジュール220は、受信したデータを複数の変数について処理し、パースし、分析するように構成されたハードウェア実装したモジュールであってもよい。関係ネットワークモジュール230は、受信したデータからベイジアンネットワークアルゴリズムを用いて複数の変数に関する因果関係ネットワークモデルを生成するように構成された、ハードウェア実装したモジュールであってもよい。因果関係ネットワークモデルは、多大なプロセッサ性能を必要とする;したがって関係ネットワークモジュールの機能は、実施形態によってはサーバ130とサーバ135によって実施することができる。サブネットワークモジュール240は、因果関係ネットワークモデルを管理し、ユーザから受け取った情報に関するサブネットワークを因果関係ネットワークモデルから決定するように構成された、ハードウェア実装したモジュールであってもよい。予測変数モジュール250は、サブネットワークをスキャンしてユーザから受け取った情報に対応する1以上の予測変数を識別するように構成された、ハードウェア実装したモジュールであってもよい。
図3は、実施形態にしたがって因果関係ネットワークモデルを生成する方法のフロー図300の例を示す。ブロック302において、複数の患者に対応するデータを受信する。実施形態において、データモジュール210がデータを受信する(図2参照)。実施形態において、データは各患者の診断情報および/または治療情報を含む。データは、例えば以下のような情報を含むことができる:患者の人物情報、医療履歴、患者の家族の医療履歴、有効薬品情報、有効でない過去の薬品情報、アレルギー情報、免疫状態情報、実験室テスト結果、放射線画像、バイタルサイン情報、患者の体重、請求情報、ライフスタイル情報、習慣情報、保険請求情報、薬局情報、など。患者人物情報は例えば、患者の年齢、患者の人種、患者の民族を含む。データはこれらに加えてまたはこれらに代えて、患者チャートからの情報(例えばヘルスケア専門家のメモ)、ヘルスケア専門家による観察結果、薬品と治療の投与、薬品と措置の投与の順番、テスト結果、x線画像、などを含むことができる。データはこれらに加えてまたはこれらに代えて、退院情報を含むことができる。例えば診断コード、治療コード、保険課金コード、診断関連グループコード、国際疫病分類コード、などである。データモジュール210(図2参照)は、様々なヘルスケアデータ、情報、および/または統計を管理し利用できるようにするエンティティからデータを抽出または取得する。データは様々なソースから取得することができる。例えば公共利用可能ソース、データを収集する商用エンティティ、ヘルスケアプロバイダ、などである。実施形態において、データは複数の医学的状態または薬と関連しているものとして事前選択または事前決定されていない。入力データの例として、図6で説明する例1を参照されたい。
ブロック304において、ブロック302で受信したデータをパースして、複数の変数について正規化データを生成する。実施形態において、パースモジュール220がデータをパースする(図2参照)。正規化データは、各患者について1以上の変数につき生成される。データの正規化は、データを正規形式に縮小すること、および/またはデータをより使いやすいフォーマットに整形することを含む。実施形態において、データをパースすることはさらに、データをフィルタリングおよび補完することを含む。データをフィルタリングすることは、データ点の完全性や正確性などの条件に基づきデータ点を除去することを含む。データの補完は、欠けているデータ点を適当な代替値によって置き換えることを含む。
ブロック306において、複数の変数について生成した正規化データに基づき因果関係ネットワークモデルを生成する。実施形態において、因果関係ネットワークモデルは、関係ネットワークモジュール230によって生成される(図2参照)。実施形態において、ベイジアンネットワークアルゴリズムを用いて、複数の変数に関する因果関係ネットワークモデルを生成する。実施形態において、生成した因果関係ネットワークモデルは、複数の医学的状態および/または薬に関する変数を含む。例えば因果関係ネットワークモデルは、プログラムされたコンピュータシステムを用いて生成される。このコンピュータシステムは、ネットワークモデル構築コード、ネットワークモデル構築コードを実行する1以上のプロセッサを備える。因果関係ネットワークモデルは、複数の医学的状態または薬それぞれについての1以上の予測変数を示す関係を含む。因果関係ネットワークモデルは、正規化データのみに基づき生成することができる。実施形態において、関係ネットワークモデルは人工知能ベースネットワークモデルである。
因果関係ネットワークモデルは、できる限り多くの変数に基づき生成することもできるし、意味のあるデータ分析に適した変数に基づき生成することもできる。例えば実施形態において、モデルは少なくとも50変数に基づき生成することができる。他実施形態において、モデルは少なくとも100変数、少なくとも1000変数、少なくとも10000変数、少なくとも100000変数、または少なくとも1000000変数に基づき生成することができる。上述のように、変数は未処理/生入力データから判定/抽出したデータに対応する。実施形態において、変数は因果関係ネットワークモデルのノードとなる。
因果関係ネットワークモデルは、できる限り多くの患者からのデータに基づき生成することもできるし、意味のあるデータ分析に適した患者からのデータに基づき生成することもできる。例えば実施形態において、モデルは少なくとも50患者からのデータに基づき生成することができる。他実施形態において、モデルは少なくとも100患者、少なくとも1000患者、少なくとも10000患者、少なくとも100000患者、または少なくとも1000000患者からのデータに基づき生成することができる。
本方法は他のステップを有することもできる。例えば1以上の追加患者に対応する追加データを受信し、その追加データに基づき因果関係ネットワークモデルを更新または再生成することができる。
実施形態において、生成した関係ネットワークモデルの一部または全てのグラフをユーザに対して表示することができる。実施形態において、生成した関係ネットワークモデルは後に用いるため保存される。
多くの異なる人工知能ベースプラットフォームまたはシステムを用いて、ベイジアンネットワークアルゴリズムにより因果関係ネットワークモデルを生成することができる。実施形態として、商用利用可能なシステムであるGNS社(マサチューセッツ州ケンブリッジ)のREFS(TM)(Reverse Engineering/Forward Simulation)を用いることができる。実施形態を実装するのに適したAIベースシステムまたはプラットフォームは、入力データのみに基づき数学的アルゴリズムを用いて変数間の因果関係を確立し、可能性のある、確立された、および/または検証済の関係についての既存知識を考慮しない。
例えばREFS(TM)AIベースインフォマティクスプラットフォームは、正規化入力データを受け取り、多数の計算を高速に実施して、システム内のデータ点がどのように相互作用するかを決定することができる。REFS(TM)AIベースインフォマティクスプラットフォームは、コンピュータ実装した関係ネットワークモデルを生成するためのリバースエンジニアリングプロセスを入力データに基づき実施する。関係ネットワークモデルは、様々な健康状態と予測変数との間の関係を定量的に表す。さらに、コンピュータ実装した関係ネットワークモデルに基づき仮説を構築して高速にシミュレートし、予測結果を得ることができる。仮説に関連する確信レベルも得られる。REFSプラットフォームを用いて因果関係モデルを生成する具体例を以下に説明する。
図4は、実施形態にしたがって因果関係ネットワークモデルを用いる方法のフロー図400の例を示す。方法400は、実施例のシステムによって実装することができ、ヘルスケア分析システムを用いる方法として記述することができる。因果関係ネットワークモデルを用いる方法は、因果関係ネットワークモデルからの結果を解釈する方法として参照することもできる。
ブロック402において、ユーザから情報を受け取る。実施形態において、データモジュール210が情報を受け取る(図2参照)。実施形態において、関係ネットワークモデルを生成するためデータ集合を受け取るデータモジュールは、生成した関係ネットワークモデルを用いるためユーザから情報を受け取るデータモジュールとは異なるかまたは分離されている。
ユーザから受け取った情報は、1以上の医学的状態または1以上の医薬品の選択を含む。実施形態において、ユーザは選択するための医学的状態および/または医薬品のリストを提示される。
ユーザから受け取る情報は、1以上の医学的状態または1以上の医薬品に関するクエリの形式であってもよい。実施形態において、ユーザは検索/クエリフィールドにテキストを入力する。
実施形態において、因果関係ネットワークモデルの一部またはすべてのグラフを表示する。実施形態において、ユーザから受け取った情報は、表示している因果関係ネットワークモデルの一部または全部のグラフの1以上のノードを選択することである。
ブロック404において、ユーザからブロック402で受け取った情報に基づき、因果関係ネットワークモデルからサブネットワークを決定する。実施形態において、サブネットワークはサブネットワークモジュール240によって決定される。サブネットワークを決定する因果関係ネットワークモデルは、上述のようにベイジアンネットワークアルゴリズムを用いて患者データから生成することができ、複数の医学的状態に関する変数を含む複数の変数を有する。決定したサブネットワークに含まれる1以上の変数は、ユーザから受け取った情報に対応するものである。例えば受け取った情報が1以上の医学的状態に関連するものである場合、サブネットワーク内の1以上の変数は、1以上の医学的状態に関するものである。他例として、受け取った情報が1以上の薬に関するものである場合、サブネットワーク内の1以上の変数は1以上の薬に関するものである。
サブネットワークの広がりは、選択された1以上の医学的状態または1以上の薬に関連付けられた1以上の変数に基づき、および1以上の変数と因果関係ネットワークモデル内の他の変数との間の関連強度に基づき、決定することができる。サブネットワークは、医学的状態または薬に関連付けられた1以上の変数、および1以上の変数と第1強度関係を有する追加変数の第1セットを含む。実施形態において、サブネットワークはさらに、1以上の変数と第2強度関係を有する追加変数の第2セットを含む。
ブロック406において、サブネットワークをスキャンして予測変数を識別する。実施形態において、予測変数モジュール250がサブネットワークをスキャンする(図2参照)。予測変数は、ユーザから受け取った情報に関連するものとして識別される。予測変数は、医学的状態または薬と因果関係を有する要因、データ点、またはノードである。例えば腎不全は心不全の予測変数である。因果関係ネットワークモデルから1以上の予測変数が識別されると、従来の統計分析や回帰分析において識別した予測変数を用いて、医学的状態または薬に対する予測変数の重要度を判定することができる。医学的状態についての1以上の予測変数は、関心のある医学的状態と同時発生する医学的状態を示す場合がある。1以上の予測変数は、関心のある薬と同時に投与される薬を示し、あるいは有害な副作用を示す場合がある。識別した予測変数は、医学的状態または薬についての未知のものであるか、または新規な予測変数である。識別した予測変数は、医学的状態または薬についての予測変数として新たに識別されたものである場合がある。予測変数の個数は、サブネットワーク内の変数またはノードの個数よりも少ない。ブロック408において、識別した予測変数を保存する。
本方法は別のステップを有することもできる。例えば変数、予測変数、変数と予測変数との間の関係のグラフを介して、識別した予測変数をユーザインターフェースに表示することができる。決定したサブネットワークは、ユーザインターフェースに表示することができる。
因果関係ネットワークモデルの生成
ベイジアンネットワークアルゴリズムを用いて生成した正規化データに基づき複数の変数に関する因果関係ネットワークを生成するステップ(図3のブロック306)を、説明目的のため、REFS AIベースインフォマティクスシステムについて詳細に説明する。ただし当業者は、ベイジアン分析を用いる他のシステムを用いることができることを理解するであろう。
複数の変数についての正規化データを、REFSシステムに対して入力データセットとして入力する。REFSシステムは、“ネットワーク断片”のライブラリを生成する。これは、ヘルスケアシステム内の接続と関係を構築する変数(例:医学的状態、医薬品、退院コード)を含む。REFSシステムは、ライブラリ内のネットワーク断片のサブセットを選択し、選択したサブセットから初期仮ネットワークを構築する。AIベースシステムはさらに、ライブラリ内のネットワーク断片の別のサブセットを選択して、他の初期仮ネットワークを構築する。これにより、ライブラリ内のネットワーク断片の複数のサブセットから初期仮ネットワークの集合(例:1000ネットワーク)が生成される。このプロセスは、パラレル集合サンプリングと呼ぶ。集合内の各仮ネットワークは、ライブラリからネットワーク断片を追加、削除、および/または置換することにより、発展または最適化される。ネットワーク断片ライブラリの生成、仮ネットワークの生成、およびネットワークの発展の詳細については後述する。追加データが取得されると、ライブラリ内のネットワーク断片に組み込まれ、各仮ネットワークの発展にともなって仮ネットワークの集合に組み込まれる。最適化/発展プロセスが完了すると、仮ネットワークの集合は、関係ネットワークモデルとなる。
生成した関係ネットワークモデルの集合を用いて、様々な医学的状態および/または薬の間の接続の挙動をシミュレートすることができる。シミュレーションを用いて、医学的状態および/または薬の相互作用を予測することができる。これは、医学的研究と実験を用いて検証することができる。生成した関係ネットワークモデル内の関係の定量的パラメータは、シミュレーション機能を用いて、各ノードに対して摂動をシミュレートし、関係ネットワークモデル内の他ノードに対する影響を観察することにより、抽出することができる。
REFSの構築ブロックは、多数のデータ機器から複数のデータタイプを組み込んでいる。例えば連続値、離散値、Bool値である。モデル集合の生成は、多大な処理能力を必要とする。実施形態においてモデル集合は、30000以上のプロセッサを有する並列IBM Blue Geneマシンを用いて生成される。得られるネットワークにより、仮説を高スループットでコンピュータテストすることができる。ネットワークは、予測のランク順位と確信度指標を含む。これにより仮説を検証することができる。
上記のように、事前処理したデータを用いて、ネットワーク断片ライブラリを構築することができる。ネットワーク断片は、測定した変数(入力データ)のセット(例:2〜3メンバーセットまたは2〜4メンバーセット)間の定量的連続的関係を定義する。断片内の変数間の関係は、線形、ロジスティック、多項式、優性ホモ接合、劣性ホモ接合、などである。各断片における関係は、ベイジアン確率スコアを割り当てられる。このスコアは、関係候補が入力データを与えられる可能性を反映したものであり、数学的複雑さによって関係に対してペナルティを与える。入力データから推測したペアおよび3方向関係(実施形態によっては4方向関係)をスコア付することにより、ライブラリ内の最も可能性のある断片を識別することができる(尤もらしい断片)。関係の定量パラメータは、各断片について入力データに基づき計算し、保存することができる。断片列挙において様々なモデルタイプを用いることができる。例えば以下が挙げられるがこれに限らない:ロジスティック回帰、(分散分析)ANOVAモデル、(共分散分析)ANCOVAモデル、非線形/多項回帰モデル、非パラメトリック回帰。モデルパラメータに対する従来の仮定は、モデルにおいて用いるパラメータ数に関してGull分散またはベイジアン情報量基準(BIC)ペナルティを想定している。ネットワーク作用プロセスにおいて、初期仮ネットワーク集合内の各ネットワークは、断片ライブラリ内の断片のサブセットから構築される。初期仮ネットワーク集合内の各初期仮ネットワークは、断片ライブラリ内の断片の異なるサブセットにより構築される。
モデルは、入力データを仮定したとき、最も尤もらしい因子分解または最も尤もらしいパラメータを判定することにより、発展または最適化される。これは、“ベイジアンネットワークを学習する”と呼ぶことができる。換言すると、入力データのトレーニングセットを与えられると、その入力データに最も合致するネットワークを発見することである。これは、各ネットワークを入力データに対して評価するスコアリング関数を用いることにより実現される。
ベイジアンフレームワークを用いて、入力データを与えられたときの因子分解の可能性を判定することができる。ベイズの定理によれば、モデルM、所与のデータDの事後確率P(D|M)は、想定モデルP(D|M)を与えられるとき、データの事後確率とモデルの事前確率P(M)の積に比例する。データの確率P(D)はモデル全体にわたって一定であると仮定する。これは以下の式により表される:
Figure 0006916107
モデルを想定したデータの事後確率は、パラメータの事前分布でデータ尤度を積分することにより得られる:
Figure 0006916107
全てのモデルが均等尤度(すなわちP(M)が一定)であると仮定すると、モデルM、所与のデータDの事後確率は、各ローカルネットワーク断片Miについてのパラメータの積分に因子分解することができる:
Figure 0006916107
上記数式において、主要定数項は省略している。実施形態において、ベイジアン情報量基準(BIC)はモデルの事後確率P(D|M)の負対数をとり、各モデルを“スコアリング”するために用いることができる:
Figure 0006916107
モデルMについての総スコアStotは、ローカルスコアSiの各ローカルネットワーク断片についての合計である。BICはさらに、各ネットワーク断片のスコアを判定する数式を与えている:
Figure 0006916107
κ(Mi)は、モデルMiにおけるフィッティングパラメータの個数である。Nはサンプル(データ点)の個数である。SMLE(Mi)は、ネットワーク断片の尤度関数の負対数であり、各ネットワーク断片について用いる関数関係から計算することができる。BICスコアについて、スコアが低いほどモデルは入力データに合致する。
仮ネットワーク集合はグローバル最適化され、これはネットワークを最適化または発展させると呼ぶ。例えば仮ネットワークは、メトロポリスモンテカルロサンプリングアルゴリズムにしたがって発展し最適化される。シミュレーテッドアニーリングを用いて局所変形することにより、集合内の各仮ネットワークを最適化または発展させることができる。シミュレーテッドアニーリングプロセスの例において、各仮ネットワークは、ライブラリからネットワーク断片を追加することにより、仮ネットワークからネットワーク断片を削除することにより、ネットワーク断片を置き換えることにより、またはネットワークトポロジーを変更することにより変更され、ネットワークの新たなスコアが計算される。一般に、スコアが改善すると変更が維持され、スコアが悪化すると変更は拒否される。“温度”パラメータにより、悪化するスコアを維持するようなローカル変更を実施することができる。これは、最適化プロセスが局所解を回避するためのものである。“温度”パラメータは時間にともなって減少し、これにより最適化/発展プロセスを収束させることができる。
ネットワーク推定プロセスの全部または一部は、異なる仮ネットワークについて並列実施することができる。各ネットワークは別のプロセッサおよび/または別のコンピュータデバイス上で並行して最適化される。実施形態において最適化プロセスは、並列動作する数百から数千のプロセッサを組み込んだスーパーコンピュータ上で実施することができる。情報は、並列プロセッサ上で実施される最適化プロセス間で共有することができる。実施形態において、最適化プロセスは1以上の量子コンピュータ上で実施することができる。量子コンピュータは、特定の計算をシリコンベースコンピュータよりも大幅に速く実施する能力を有する。
最適化プロセスは、ネットワークフィルタを含むことができる。ネットワークフィルタは、総合スコアが閾値基準を満たさないネットワークを集合から除去する。除去されたネットワークは新たな仮ネットワークによって置き換えられる。“スケールフリー”でないネットワークも集合から除去することができる。ネットワーク集合が最適化または発展完了すると、その結果は関係ネットワークモデルの集合と呼ぶことができる。これはコンセンサスネットワークと呼ぶことができる。
シミュレーションを用いて、生成した関係ネットワークモデル内の各関係に関する定量パラメータ情報を抽出することができる。例えば定量情報抽出のシミュレーションは、ネットワーク内の各ノードを10倍摂動させるステップ(増やすまたは減らす)、モデル内の他ノードについて事後分散を計算するステップ、を含む。終端はtテストによって、グループあたり100サンプル、有意度0.01カットオフで比較される。tテスト統計は、100個のtテストの中央値である。このシミュレーション技術を用いて、予測の強度を表す曲線下面積(AUC)と、終端を構築するノードの計算量を表す比とが、ネットワーク集合内の各関係について生成される。
ローカルコンピュータシステムの関係定量化モジュールを用いて、摂動をAIベースシステムに実施させ、AUC情報と比情報を抽出することができる。抽出した定量情報は、親ノードを子ノードと接続する各エッジについての比率とAUCを含む。実施形態において、カスタム構築したRプログラムを用いて、定量情報を抽出することができる。
実施形態において、生成した関係ネットワークモデルの集合をシミュレーションで用いて、条件変化に対する応答を予測することができる。これは医学的研究や実験により検証することができる。
AIベースシステムの出力は、定量関係パラメータおよび/またはその他シミュレーション予測であってもよい。
実施形態は、Berg Interrogative Biology(TM)Informatics Suiteを用いて実施することができる方法を組み込んでいる。これは、様々な生物学的プロセスを理解するためのツールである。生物学的プロセスとは例えば、病態生理や、生物学的プロセスの基盤にあるキー分子ドライバであり、病態プロセスを形成する要因を含むものである。実施形態は、Berg Interrogative Biology(TM)Informatics Suiteを用いて、他の病気、医薬品、生物学的プロセスなどに対する病気の相互作用に関する新たな知見を得る。実施形態は、Berg Interrogative Biology(TM)Informatics Suiteの少なくとも一部または全部を組み込んだシステムを含む。
実施例
例1:CMSデータから生成した関係ネットワークモデル:心不全&心臓発作と腎不全のサブネットワーク
人工知能(AI)において開発されている数学的および統計的学習ツールは、ビッグデータの複雑な相互作用パターンを読み解くのに適している。Berg Interrogative Biology(TM)Informatics Suiteは、様々なデータ機器と因果関係の推定を、ベイジアンネットワーク(BN)を用いて純データ駆動方式で統合するコンピュータワークフローである。本例は、ヘルスケアビッグデータ分析においてBNを用いることに関する。これは、患者ケアを拡大しヘルスケアと病院効率を改善することに対して多大な影響を有する。
密度の低い公開利用可能なデータを用いて新たな発見を取得し、ケアを直接通知し、生成した因果関係ネットワークモデルを用いて新たな仮説を導いた。診断コードのデータ関係ネットワークは、メディケア&メディケイドサービスセンター(CMS)からの公開利用可能な請求データに基づき生成した。
図5の方法500に概略的に示すように、CMSリリースからデータを抽出した。フィルタリング、正規化、補完によりデータを事前処理した。AIベースモデル構築を用いて、事前処理したデータからモデルを生成した。その結果、診断コードネットワークの形式の関係ネットワークを得た。
CMSデータリリースからデータ集合を得た。CMSは、ヘルスケアプロバイダの様々な手続きのため、患者ケア、保険情報、診断コード、退院コード、課金コードに関するデータをリリースしている(すなわちウェブサイト上で公開利用可能にする)。図6は、1つの医療機関についてのCMSデータの一部の例を示す。この例において、取得したデータは複数のヘルスケアプロバイダと、2011年のトップ100診断コードを含んでいる。
Berg Interrogative Biology(TM)Informatics Suiteを用いて、データを事前処理およびモデル構築した。診断関連グループコード(DRG)と退院総数についての情報を含むカラムがデータセットから抽出されるように、収集したデータを処理した。退院カウント情報は、DRGコード対病院の行列として整形した。70%以上の病院において欠けているDRGコードは、以後の分析から除去した。25DRGコード以上の情報が欠けている病院は、データセットからフィルタリングした。フィルタリング後、データセットは100DRGコードと1618病院を有することとなった。このデータ行列に対して中央値分散正規化を実施し、欠けているデータを“ゼロ処理”により補完した。REFS技術を用いて因果関係ネットワークモデルを構築した。得られた関係ネットワーク内の接続を、カットオフ0.65の曲線下面積(AUC)でフィルタリングした。適当なグラフ環境/インターフェースソフトウェアを用いて得られたネットワークを視覚化した。具体的にはCytoscapeを用いた。これは、生体分子相互作用ネットワークの統合モデルのためのソフトウェア環境であり、Cytoscapeコンソーシアムが提供している。Cytoscape環境内において、ネットワークは“エッジ”によって接続される“ノード”として視覚化される。それぞれが、エッジによって接続された2つのノード間の関係をグラフ的に表示する。
DRGコードに基づき生成した関係ネットワークの概略グラフを図7に示す。この関係ネットワークは、60診断と、これらをリンクする88接続/関係を含む。ネットワーク内の各ノードは、特定の診断についての退院数を表す。エッジ(例:ノード間の接続)は、様々な診断に関連付けられている退院数間の相互作用を表す。図7において、ノードのサイズは特定の診断についての退院コード数に対応する。ネットワーク内のエッジと接続の解釈は、特定の診断に依拠する。例えばソースノードが糖尿病であり、ターゲットノードが高血圧である場合、その接続は共存症を表す。ソースノードが糖尿病であり、ターゲットノードが神経症である場合、接続は合併症を表す。このように、関係ネットワークはDRGコード間の相互作用を表す。
サブネットワークを選択して、生成した関係ネットワークから関連情報を取得した。サブネットワーク(図8に示すもの)は、中心に“心不全&心臓発作”と“腎不全”があり、図7の因果関係ネットワークモデルから決定したものである。この例において、“心不全&心臓発作”と“腎不全”は、疫病対策センター(CDC)が編集した死亡原因において顕著であるので、選択されたものである。CDCレポートによれば、心臓疾患は2011年の死因トップである。腎臓関連のものは、9位、12位、13位である。ただし腎臓関連のもの全てを組み合わせると、主な死因となる。
図8のサブネットワークのグラフにおいて、矢印の接続は、第1状態における診断数と第2状態における診断数が正相関していることを示す。臨床的には、関連する状態に応じて接続を別に解釈することができる(例:心不全&心臓発作から肺炎&胸膜炎に対する矢印は、患者の統計的大部分において、心不全&心臓発作が肺炎&胸膜炎につながることを示す)。ノード間の各接続は、線で示しており、ノード間のエッジとして表すことができる。ノード間の接続を形成する線の幅(線の“重み”とも呼ぶ)は、ノード間の接続強度をグラフ表示するものである。例えば、心不全&心臓発作から肺炎&胸膜炎への矢印は、心不全&心臓発作から呼吸器感染&炎症への矢印よりも広い。この意味は、心不全&心臓発作と肺炎&胸膜炎の関係が心不全&心臓発作と呼吸器感染&炎症の関係よりも強いことを、モデルが予測したということである。
心不全サブネットワークと腎不全サブネットワークにおける接続は、関係ネットワークモデルに現れる接続が信頼できることの検証に役立つ。以下に説明する。
心不全は、心臓が血液をポンプする能力が減退する状態によって生じる。これらの状態としては以下が挙げられる:先天性心臓欠陥、不整脈、動脈が経時的に狭くなる冠動脈疾患、心臓を弱めまたは堅くして血液をポンプしにくくする高血圧。心不全とそれ以外の状態との間の関係は、サブネットワーク内の心不全とその他ノードとの間の接続によって反映されており、以下にこれを説明する。
呼吸器感染と炎症/肺炎と胸膜炎:心不全により血液が体を移動する速度が遅くなり、これにより腎臓は体液を持ち続けるようになることが、よく知られている。体液保持は、体の下部分で始まるが、次第に肺へ進み、胸膜炎を引き起こす。肺における体液集結により、呼吸器感染の確率が高まる。関係ネットワークモデルは、患者の統計的大部分において心不全&心臓発作が肺炎&胸膜炎につながることを予測した。これは図9Aの心不全&心臓発作から肺炎&胸膜炎への矢印によって示している。関係ネットワークモデルは、患者の統計的大部分において心不全&心臓発作の診断が呼吸器感染&炎症につながることを予測した。これは図9Aの心不全&心臓発作から呼吸器感染&炎症への矢印によって示している。図9Bは、心不全&心臓発作が肺炎&胸膜炎と呼吸器感染&炎症につながる経路を示すグラフである。
慢性肺疾患(COPD):肺が血液中の低酸素濃度を補償しようとするとき、肺内の血圧が上がり、これによりCOPDは肺高血圧を引き起こす。肺内の血圧が上がると、肺高血圧が生じ、これが右心室を緊張させて心不全に至る。したがって、心不全の診断は以前診断されなかったCOPDの診断につながる。よって、心不全診断数が増えると、COPD診断数が増える。関係ネットワークモデルは、心不全&心臓発作の診断数が増えるとCOPDの診断数が増えることを予測した。これは、図10Aにおける心不全&心臓発作からCOPDへの矢印によって示している。これは、患者の統計的大部分において心不全&心臓発作がCOPDを引き起こしていると直接的に解釈できる。図10Bは、COPDが心不全&心臓発作につながる経路のグラフを示す。これは、心不全&心臓発作がCOPDにつながっているのではない。このように、モデル予測と既知の心不全&COPDの関係の間でタイミングが明らかに反対であるのは、従来診断されなかったCOPDが心不全の後に診断されたことによると考えられる。医療従事者は、心不全が原因を探索する契機となって、COPDを発見する。したがって、COPDは心不全の前に存在するが、COPDは心不全が診断されるまでは診断されない。
心不整脈と伝導障害:心不整脈と伝導障害は、心不全を直接的に引き起こす。心不全の診断は、これら原因状態の診断につながる。したがって、心不全診断数が増えると、心不整脈と伝導障害の診断数が増える。関係ネットワークモデルは、心不全&心臓発作の診断数が増えると心不整脈&伝導障害の診断数が増えることを予測した。これは、図11の心不全&心臓発作から心不整脈&伝導障害への矢印によって示している。
胃腸(G.I.)出血:心不全は、乏血性ショックの結果である場合がある。乏血性ショックは、大量の循環血液が高速に失われることによって起こる。出血性ショック(乏血性ショックの先行症状)の最も多い原因は、外傷、胃腸出血、臓器傷害である。関係ネットワークモデルは、患者の統計的大部分において胃腸出血の診断が心不全&心臓発作の診断につながることを予測した。これは、図12Aの胃腸出血から心不全&心臓発作への矢印によって示している。図12Bは、胃腸出血が心不全につながる経路を示すグラフである。
腎不全:貧血、心臓疾患、腎臓疾患の間のリンクはよく知られており、心腎機能不全の患者を治療する試みが文書化されている。腎疾患患者の4分の1は、鬱血性の心疾患を有している。腎疾患が悪化すると、心疾患患者の割合は65〜70%に増加する。腎疾患の悪化は、以前心不全を診断された患者の死亡率と入院率が高まることと関連があることを、多くの研究が示している。したがって、この接続は既によく知られている。関係ネットワークモデルは、患者の統計的大部分において腎不全の診断が心不全の診断につながることを予測した。これは図13の腎不全から心不全&心臓発作への矢印によって示している。
図14Aと図14Bは、心不全&心臓発作と腎不全との間の関係強度に関する関連ネットワークモデルの予測についてさらに詳細に示す。図14Aは、関係ネットワークモデルを構築するために用いたデータから導いた、心不全と腎不全の関連プロットである。関連プロットは、2×2テーブルで表され、データセット内の変数について実際の頻度が期待頻度から逸脱している程度を示す。ピアソン残差は、期待頻度と実際の頻度との間の距離を示す。これにより、期待値から逸脱しているカテゴリを識別することができる。図14Aの関連プロットにおいて、各矩形の幅はデータ点の個数を示し、高さと色はピアソン残差を表す。この例において、心不全と腎不全が独立に分散しているというnull仮説に基づき期待値を計算した。これが正しいのであれば、プロットは主に淡いグレーとなり、ピアソン残差はゼロ近傍になる(すなわち2未満−2超)。実際には、ピアソン残差がー2未満であることを表す中濃グレー淡領域と、ピアソン残差が2超であることを表す濃グレー領域が、観察された。これは、心不全と腎不全が独立していないことを示す。したがってnull仮説から逸脱していることになる。違いをもたらす最大要素は、ピアソン残差によって示され、腎不全と心不全いずれにおいても最高カテゴリであった。要約するとこの例において。図14Aの関連プロットは、心不全と腎不全との間の相互作用を示した。この相互作用は主に、腎不全と心不全をともに有する患者によってもたらされる。
図14Bは、関係ネットワークモデルを構築する際に用いたデータから導いた、心不全と腎不全の4分プロットである。4分プロットは、関心カテゴリ間の独立性からの逸脱を表す他の手法である。4分プロットにおいて、各矩形内の数値はそのカテゴリ内のデータ点の個数である。図14Bは、腎不全が心不全に対して与える影響を示す。4分円のサイズ比較によれば、プロットの左半分は、低腎不全率と比較すると高腎不全率は高心不全率と強い関係を有することを示す。プロットの右半分は、高腎不全率と低腎不全率は低心不全率に対して与える影響があまり変わらないことを示す。要約するとこのプロットは、関心状態間(心不全と腎不全)の関係をさらに強化する。心不全の腎不全に対する相対リスクは、関係ネットワークモデルに基づき2.57と計算された。
図15Aと図15Bは、心不全&心臓発作と胃腸出血との間の関係強度に関する関連ネットワークモデルの予測についてさらに詳細に示す。図15Aは、関係ネットワークモデルを構築するために用いたデータから導いた、心不全と胃腸出血の関連プロットである。このプロットにおいて、濃グレー矩形はピアソン残差4.0超を表し、中濃グレー矩形はピアソン残差−2未満を表し、胃腸出血と心不全が独立でないことを示す。具体的には、濃グレー矩形は、両状態が高いことは強い相互作用があることを示す。図15Bは、心不全と胃腸出血の4分プロットである。このプロットは、高心不全率が高胃腸出血率と強く関連していることを示す。図示するように、心不全の胃腸出血に対する相対リスクは3.22と計算された。
心疾患&心臓発作と様々な状態(すなわち、肺炎と胸膜炎、呼吸器感染と炎症、COPD、心不整脈&伝導障害、胃腸出血、腎不全)との間の関係についての情報を仮定せず、DRGと退院コードのみに基づき関係ネットワークモデルを生成した。それにもかかわらず、中心に心不全&心臓発作を持つ関係ネットワークモデルのサブネットワークは、心不全&心臓発作とその他状態との間の関係についての医療分野における現行知識を反映するものとなった。これは、関係ネットワークモデルの検証をサポートするものである。
この分析における腎不全に対応する診断コードは、慢性/急性腎疾患その他腎臓障害を包含する。腎不全/機能障害は、腎臓が老廃物を血液から除去する能力が減退することである。20歳以上の大人の10%以上がCKDを有し、CKD治療コストは非常に高い。これは共存症とクオリティオブライブに関するコストによるものである。ある研究によれば、末期腎疾患(ESRD)を治療するコストは増加し続け、この状態のメディケアコストは2009年に300億ドルに達した。腎不全を中心とするサブネットワークの概略を図16に示す。サブネットワーク内の腎不全との接続を以下に説明する。
腎&尿管感染:関係ネットワークモデルは、腎不全と腎&尿管感染との間の統計的に顕著な関係を予測した。これは図16の腎不全から腎&尿管感染への矢印によって示している。尿管および腎感染を治療しないと、腎不全につながることが知られている。方向が反対であることは未だ説明されていないが、状態間の接続を関係ネットワークモデル内で表している。したがって、この接続は驚くべきことではない。
栄養、代謝、体液/電解質の障害:腎臓は、体液と電解質のバランスを維持するために重要な役割を果たす。したがって腎不全の診断は、栄養、代謝、体液と電解質バランスの問題のフォローアップテストと診断につながる可能性がある。関係ネットワークモデルは、腎不全の診断が栄養、代謝、体液/電解質障害の診断につながることを予測した。これは図16の腎不全から栄養、代謝、体液/電解質障害への矢印によって示している。
肺炎と胸膜炎:慢性腎疾患は感染率を上げることが知られ、肺炎は腎疾患の合併感染症であることが文献に記されている。関係ネットワークモデルは、腎不全と肺炎&胸膜炎との間の統計的に顕著な関係を予測した。これは図16の腎不全から肺炎&胸膜炎への矢印によって示している。図8のサブネットワークのグラフにおいて、T型接続は、第1状態の診断個数と第2状態の診断個数が負相関していることを示す。具体的には、肺炎&胸膜炎の診断数と腎不全の診断数は、負相関している。
腎不全中心サブネットワークについて、選択したサブネットワークの1つの接続(具体的には、気管支炎&喘息と腎不全との間の接続)が、医療分野における現行知識によってサポートされた。これにより、関係ネットワークモデルからの結果が信頼できることが検証され、相互作用の新たな予測を探求する余地があることが示された。
関係ネットワークモデルからの結果は、新たな相互作用を識別することにつながる。例えば腎不全と気管支炎&喘息との間の新たな相互作用が、腎不全サブネットワークに基づき識別された。図17Aに示すように、関係ネットワークモデルは、患者の統計的大部分において気管支炎&喘息の診断が腎不全の診断につながることを予測した。矢印の太さは腎不全とその他任意の状態(心不全&心臓発作、腎&尿管感染、肺炎&胸膜炎、栄養、代謝、体液/電解質の様々な障害)との関係または接続が強いことを示す。腎不全と気管支炎&喘息との間の関係についての文献はあまり知られていないかまたは入手できないので、この相互作用は、治療、病院、および/または診断順序の観点から新たな発見である可能性がある。図17Bに示すように、相互作用の強度を識別するため、回帰モデルを構築した。回帰モデルは、気管支炎&喘息が腎不全データの〜2.5%の原因になっていることを示した(p値1.8×10−10)。p値は、null仮説を想定して実際に観察されたテスト統計結果が少なくとも1つある確率である。この例において、気管支炎&喘息が完全に独立である場合にこのデータを得る確率は、1.8×10−10である。
図18Aは、腎不全と気管支炎&喘息の関連プロットである。図18Aに示すデータは、p値2.22×10−16以下である。このプロットは、気管支炎&喘息と腎不全が独立ではなく、気管支炎&喘息率が高いと腎不全率を上げることを示す。図18Bは、腎不全と気管支炎&喘息の4分プロットである。このプロットも、気管支炎&喘息率が高いと腎不全率を上げることを示す。腎不全と喘息&気管支炎の相対リスクは5.13と計算された。
新たな仮説を構築して、これら状態をリンクした。具体的な仮説は、腎不全および/または腎機能障害は喘息と気管支炎の治療の副作用によって生じるというものである。したがって、気管支炎&喘息の件数が増えると、腎不全の件数も増える。この仮説を以下に説明する。
気管支炎&喘息は、延焼によって気道が狭くなる呼吸器疾患である。症状をコントロールし気道を広げるために、以下の表1に示すように多くの医薬品の選択肢がある。これら薬の主な成分は、長時間作用するβ2アドレナリン作動薬であり、禁忌には低カリウム血症が含まれる。実際にアルブテロール(β2作動薬)は、腎不全/機能障害を有する患者の低カリウム血症を治療するために広く用いられている。したがって、有効β2作動薬を含む薬を長期間使用すると、カリウムレベルが下がり、低カリウム血症につながる。喘息のためにβ2作動薬を処方した患者は、電解質アンバランスが認められた。
表1:2011年〜2012年における喘息薬の選択トップ10。薬情報は、処方薬の薬目次から得た。処方カウント情報は、IMSヘルスによる調査から得た。
Figure 0006916107
研究によると、低カリウム血症はマウスに腎障害をもたらし、低カリウム血症は人間に腎不全をもたらす。55患者の研究において、慢性低カリウム血症は、シストジェネシス(cystogenesis)をともない、瘢痕化と腎ダメージが生じて腎機能障害に至る。他の研究によれば、腎疾患を有する患者の低カリウム血症は、末期腎疾患へ進行する可能性を高め、死亡率を高める。β2作動薬は、アルドステロンレベルを高め、これにより腎機能障害につながる。アルドステロンの機能を阻害すると、腎機能の改善につながる。
図19Aと図19Bは、気管支炎と喘息の治療が腎不全および/または機能障害を引き起こす経路を示す。これは、仮説をサポートし、気管支炎&喘息と腎不全との間の新たな接続を説明するものである。図19Aの経路は、公開されている医療研究をリンクすることにより構築した。図19Bは、経路の基盤となる分子メカニズムを示す。これは、公開されている医療研究における医学的発見をサポートするものである。図19Bにおけるタンパク質の略語は、Gs(グアニンヌクレオチド結合調節タンパク)、cAMP(環状アデノシン一リン酸)、PKA(プロテインキナーゼA)、ACE(アンジオテンシン変換酵素阻害薬)である。図19Aは、気管支炎&喘息と腎不全を接続する仮説を概略的に示す。気管支炎&喘息に対する治療は、長時間作用するβ2アドレナリン作動薬を含む薬を用いることが多い。長時間作用するβ2アドレナリン作動薬は、アルドステロンレベルを増やすことが知られている。アルドステロンレベルが増えると腎不全を引き起こす。連邦医薬品局(FDA)が述べるように、低カリウム血症は長時間作用するβ2アドレナリン作動薬にとって禁忌であり、低カリウム血症は腎不全率が高まることのマーカとして知られている。図19Bは、喘息&気管支炎治療と腎不全をリンクする、提示されている分子メカニズムの概略を示す。長時間作用するβ2アドレナリン作動薬は、Gsの活動を増やす。これはcAMPの生成を含み、これによりPKAが増える。その結果、傍系球体セルによってレニン分泌が増える。レニンはアンジオテンシンIを生成する触媒となり、さらに肺のACEによりアンジオテンシンIIへ変換される。アンジオテンシンIIレベルが上がると、アルドステロンが増加する。腎臓の副腎皮質において、増加したアルドステロンにより、カリウム除去、水再吸収、ナトリウム再吸収が増加し、最終的に低カリウム血症と腎不全を引き起こす。表2は、公開されている医療研究のリストを含み、これは図19Aと図19Bに示す経路と分子メカニズムをサポートするものである。
表2:気管支炎&喘息と腎不全との間の接続に関する仮説における経路と分子メカニズムをサポートする公開済みの医療研究。
Figure 0006916107
このCMSデータセットにおいて患者の腎疾患を治療する総コストは、入院患者領域ン事前設定方式(IPPS)に加入している3000病院について、23億ドルであった。このCMSデータセットは、総メディケア退院の60%を表す。したがってこの診断コード単体の2011年における総メディケアコストは、38.3億ドルである。このコストのなかで2.5%が、気管支炎&喘息を治療するために用いた薬の副作用によるものである。例1の関係ネットワークモデルを用いて判定した腎不全と気管支炎&喘息との間の関係に基づき喘息/気管支炎の治療ガイドラインを探求および変更することにより、患者ケアをよりよくするのみならず、コスト節約効果も多大である。例えば患者レベルデータにより、医療履歴と遺伝的要因に基づき、腎臓副作用のリスクが高い患者を識別することができる。高リスク患者については、別の治療方針または腎機能監視により、よりよい結果をもたらし、メディケアなどの支払人にとってのコストを抑制できる。このようなケア改善は、臨床診断意思決定支援システムを通じて医院に組み込むことができる。これは、患者電子健康レコードをナレッジベースと統合して、個別患者ケアガイドラインを提供することによる。
例2:CMSデータから生成した関係ネットワークモデル:赤血球(RBC)障害のサブネットワーク
赤血球(RBC)障害を中心とするサブネットワークを、例1で説明した関係ネットワークモデルから選択した。図20は、関係ネットワークモデルおよび選択したRBC障害サブネットワークの概略を示す。RBC障害サブネットワークから新たな相互作用を判定した。
RBC障害のDRGコードは、貧血(栄養、遺伝、共存症によって生じる)、輸血からの反応(ABO、Rh不整合)、血球減少をカバーする。RBC障害を他の診断とリンクする分析に際して、関連する全ての診断を考慮した。
RBC障害サブネットワークは、患者の統計的大部分において蜂巣炎の診断がRBC障害の診断につながることを示した。蜂巣炎が治療されないと、感染したバクテリアが血流に入り、敗血症を引き起こす。これまでの研究によれば、敗血症はRBCモルフォロジーとレオロジーを変化させる。したがって、蜂巣炎の診断が増えるとRBC障害の診断が増えることを説明できる。
RBC障害サブネットワークは、患者の統計的大部分においてRBC障害の診断が敗血症または重症敗血症の診断につながることを示した。敗血症は、外科患者において発生しやすく、これにより静脈注入することになる。静脈注入を多数回または長時間実施すると汎血球減少症を引き起こし、これがRBC障害と敗血症をリンクすることになる。
RBC障害サブネットワークは、患者の統計的大部分において“他の循環系診断”がRBC障害につながることを示した。循環系コード(すなわち、他の循環系障害)は、心臓組織の感染および機能障害、心臓手術の合併症(バイパス、シャント設置、インプラント、弁)を含む。循環器障害とRBC障害との間の接続としてあり得るのは、人工弁からの溶血性貧血である。具体的には、鉄欠乏性貧血、RBC障害は、高心拍数または不整脈につながり、これにより心肥大または心不全を引き起こす。
例1や例2で識別した新たな相互作用などの発見は、患者とプロバイダ双方にとって多大な影響がある。ヘルスケアを効率的に届けることの重要な側面は、リソース要求を予測すること、リソースを最大利用する方針を立てること、プロバイダオプションを利用できること、である。現在、例えば事例混合表などのメディケア請求データの一部のみが、プランニングにおいて用いられている。このようなデータを請求データの統計的分析によって補強することにより、ヘルスケア管理の効率を大幅に改善し、ヘルスケアシステムを大幅に節約することができる。ビッグデータをより発展的に分析することの新たな可能性が示され、より重要なのは、本明細書の方法を用いてビッグデータから有効な情報を抽出できることを示したことである。推測したBNは、本実施形態に基づく関係ネットワークモデルであり、これを分析して患者ケアを改善することができる。これは、副作用、共存症、病因を識別することによる。本明細書の例は、本実施形態を用いて大量の複雑なデータセットを理解し、新たな相互作用を識別し、有効なヘルスケア分析結果とヘルスケア経済を生成する方法を示した。
例1と例2において、実施形態にしたがって退院数に基づき診断間の相互作用を表す意味のある関係ネットワークモデルを構築した。完全にデータ駆動の方法で、現行知識や仮説によってバイアスすることなく、関係ネットワークモデルを生成した。関係ネットワークモデルからの結果を、文献サポートを用いて検証した。本例は、低密度データに対する比較的小スケールの分析であっても、医学的影響がある新たな相互作用を識別できることを示した。
本例の結果は、ビッグデータの分析に際して本明細書の実施形態にしたがって純粋にデータ駆動の方法を実施することにより、ヘルスケアにおいて独自の知見を提供することにより医療研究を促進するとともに患者ケアを改善できることを示す。本例の結果は、ビッグデータ分析のアプリケーションにおける新たな可能性を示し、より重要なのは、ベイジアンネットワークアルゴリズムを用いて形成する関係ネットワークモデルを用いて有効な情報を抽出できることを示したことである。
このように、本明細書が記載するヘルスケア分析システムおよび方法を用いて、大量データセットを分析し、データセット内のデータ点の関係に対して新たな知見を収集することができる。この分析は、DRGコード情報、患者レベル請求情報、患者医療情報(例えば診断、医療、横断的データ、医療テスト結果、など)、を含むデータセットに対して実施することができる。この分析は、以下の観点から医薬業界において有用である:診断推奨、副作用および毒性分析、薬相互作用、既存薬再開発、薬試用患者グループ、など。この分析は、以下の観点から病院業界にとって有用である:臨床意思決定支援システム、結果ベース支払の結果の改善、標準ケアの改善、など。
実施形態は、論理回路またはコンポーネント、モジュール、メカニズムを含むものとして記載している。モジュールは、ソフトウェアモジュール(例:機械読取可能媒体または伝送信号に実装したコード)またはハードウェアモジュールを構成する。ハードウェアモジュールは、動作を実施することができる有体ユニットであり、何らかの態様で構成または配置することができる。実施形態において、1以上のコンピュータシステム(例:スタンドアロン、クライアントまたはサーバコンピュータシステム)またはコンピュータシステムの1以上のハードウェアモジュール(例:プロセッサまたはプロセッサグループ)は、ソフトウェア(例:アプリケーションまたはその一部)によって、本明細書が記載する動作を実施するハードウェアモジュールとして構成することができる。
実施形態において、ハードウェアモジュールは機械的または電子異的に実装することができる。例えばハードウェアモジュールは、動作を実施するように永続的に構成された専用回路または論理回路(例:特殊用途プロセッサ、例えばfield programmable gate array(FPGA)、特定用途集積回路(ASIC)、Graphics Processing Unit(GPU))を備えることができる。ハードウェアモジュールは、動作を実施するようにソフトウェアによって一時的に構成されたプログラム可能論理回路(例:汎用プロセッサその他のプログラム可能プロセッサに包含されるもの)を備えることができる。専用永続構成回路において機械的にまたは一時構成回路(例:ソフトウェアによって構成されるもの)においてハードウェアモジュールを実装する決定は、コストと時間によって決まることを理解されたい。
したがって、用語“ハードウェアモジュール”は、有体物を包含するものとして理解されたい。すなわち、本明細書が記載する態様で動作および/または動作を実施するように物理的に構築され、永続的に構成され、または一時的に構成されたエンティティであるものとして理解されたい。ハードウェアモジュールが一時的に構成された(例:プログラムされた)実施形態を考えると、各ハードウェアモジュールは任意の時点で構成またはインスタンス化する必要はない。例えばハードウェアモジュールがソフトウェアを用いて構成された汎用プロセッサを備える場合、汎用プロセッサは異なる時点において異なるハードウェアモジュールとして構成される。したがってソフトウェアは、プロセッサを設定して、ある時点において特定のハードウェアモジュールを構成し、別の時点において別のハードウェアモジュールを構成する。
ハードウェアモジュールは、他のハードウェアモジュールと情報を送受信する。したがってハードウェアモジュールは、接続されているとみなすことができる。複数のハードウェアモジュールが同時に存在する場合、ハードウェアモジュールを接続する信号伝搬(例:適当な回路またはバスを介して)によって通信を実施できる。複数ハードウェアモジュールが異なる時点において構成されまたはインスタンス化される実施形態において、そのハードウェア間の通信は例えば、複数ハードウェアがアクセスするメモリ構造において情報を格納取得することにより実施できる。例えばあるハードウェアモジュールがある動作を実施してその出力を接続されたメモリデバイスに書き込む。別のハードウェアモジュールは後にそのメモリデバイスにアクセスし、格納されている出力を取得および処理する。ハードウェアモジュールは、入力デバイスまたは出力デバイスと通信することができ、リソース上(例:情報のコレクション)で動作することもできる。
本明細書が記載する方法の様々な動作は、関連する動作を実施するように一時的に(例:ソフトウェアによって)または永続的に構成された1以上のプロセッサによって、少なくとも部分的に実施することができる。一時的または永続的いずれであっても、そのプロセッサは1以上の動作または機能を実施するプロセッサ実装したモジュールを構成する。ここでいうモジュールは、実施形態においては、プロセッサ実装したモジュールである。
同様に、本明細書が記載する方法は、少なくとも部分的にプロセッサ実装することができる。例えば方法の少なくとも一部の動作は、1以上のプロセッサまたはプロセッサ実装したモジュールによって実施できる。動作の実施は、1以上のプロセッサ間で分散してもよく、単一マシン内にのみ配置する必要はなく、複数マシンに配置することができる。実施形態において、プロセッサは1つの位置に配置することができ(例:家庭環境、オフィス環境、サーバファーム)、他実施形態においてプロセッサは複数位置に分散することができる。
1以上のプロセッサは、“クラウドコンピューティング”環境で、または“ソフトウェアアズアサービス(SaaS)”として、動作をサポートすることができる。例えば少なくとも一部の動作をコンピュータグループ(プロセッサを含むマシン)によって実施し、その動作をネットワーク経由でまたは1以上の適当なインターフェース(例:API)経由でアクセス可能にすることができる。
実施形態は、デジタル電子回路、コンピュータハードウェア、ファームウェア、ソフトウェア、これらの組み合わせに実装することができる。実施形態は、コンピュータプログラム製品を用いて実装することができる。例えば情報搬送体に実装したコンピュータプログラムである。情報搬送体は例えば、データ処理装置によって実行しまたはその動作を制御する機械読取可能媒体である。データ処理装置は例えば、プログラム可能プロセッサ、コンピュータ、複数コンピュータである。
コンピュータプログラムは、任意のプログラミング言語で記述することができる。これはインタープリタ言語を含む。コンピュータプログラムは、任意形態で配置することができる。例えばスタンドアロンプログラム、モジュール、サブルーチン、その他のコンピュータ環境において用いるのに適したユニットを含む。コンピュータプログラムを配信して1以上のコンピュータ上で実行することができる。1つのサイト上で実行してもよいし、通信ネットワークによって接続された複数サイトにまたがって実行してもよい。
実施形態において、コンピュータプログラムを実行する1以上のプログラム可能プロセッサによって動作を実施して、入力データを操作し出力を生成することにより、機能を実施することができる。実施形態の方法および装置は、特定用途論理回路によって実施し、または特定用途論理回路として実装することができる(例:FPGAまたはASIC)。
コンピュータシステムは、クライアントとサーバを含む。クライアントとサーバは一般に、互いに離れており、通常は通信ネットワークを介してやり取りする。クライアントとサーバの関係は、各コンピュータ上で動作するコンピュータプログラムによって生じ、互いにクライアント−サーバ関係を有する。プログラム可能コンピュータシステムを配置する実施形態において、ハードウェアアーキテクチャとソフトウェアアーキテクチャともに考慮を要することを理解されたい。具体的には、ある機能を永続構成ハードウェア(例:ASIC)で実装するか、一時構成ハードウェア(例:ソフトウェアとプログラム可能プロセッサの組み合わせ)で実装するか、永続構成ハードウェアと一時構成ハードウェアの組み合わせで実装するかは、設計選択であることを理解されたい。以下は、設定されたハードウェア(例:マシン)とソフトウェアのアーキテクチャであり、様々な実施形態において用いることができる。
図21は、コンピュータシステム900の形態のマシンのブロック図である。マシン(例:クライアントデバイス110、115、120、125;サーバ135;データベースサーバ140;データベース130)に本明細書の1以上の方法を実施させる命令を備える。別実施形態において、マシンはスタンドアロンデバイスとして動作し、または他のマシンと接続(例:ネットワーク)することができる。ネットワーク配置において、マシンはサーバとして動作し、またはサーバ−クライアントネットワーク環境におけるクライアントマシンとして動作し、またはピアトゥピア(または分散)ネットワーク環境におけるピアマシンとして動作する。マシンは例えば、パーソナルコンピュータ(PC)、タブレットPC、セットトップボックス(STB)、PDA、携帯電話、ウェブアプライアンス、ネットワークルータ、スイッチまたはブリッジ、その他のマシン動作を指定する命令(シーケンシャルでもよいしそうでなくともよい)を実行できるマシンである。単一マシンのみを示しているが、用語“マシン”は、個別にまたは連携して命令セットを実行して本明細書が記載する1以上の方法を実施するマシンコレクションを含むものとして理解されたい。
コンピュータシステム900は、プロセッサ902(例:central processing unit(CPU)、マルチコアプロセッサ、および/またはgraphics processing unit(GPU))、メインメモリ904、スタティックメモリ906を備える。これらはバス908を介して相互通信する。コンピュータシステム900はさらに、ビデオディスプレイユニット910(例:液晶ディスプレイ(LCD)、タッチスクリーン、ブラウン管(CRT))を備える。コンピュータシステム900は、英数字入力デバイス912(例:物理キーボードまたは仮想キーボード)、ユーザインターフェース(UI)ナビゲーションデバイス914(例:マウス)、ディスクドライブユニット916、信号生成デバイス918(例:スピーカ)、ネットワークインターフェースデバイス920を備える。
ディスクドライブユニット916は、機械読取可能媒体922を備える。機械読取可能媒体922上には、本明細書が記載する方法または機能の1以上を実装しまたはこれを用いる1以上の命令セットとデータ構造(例:ソフトウェア)924が格納される。命令924は、コンピュータシステム900が実行する間に、その全部または一部をメインメモリ904、スタティックメモリ906、および/またはプロセッサ902内に配置することができる。メインメモリ904とプロセッサ902は、機械読取可能媒体を構成する。
機械読取可能媒体922は、単一媒体として示したが、用語“機械読取可能媒体”は、固体メモリ、光媒体、磁気媒体を含むものと解釈されたい。ただしこれらに限るものではない。機械読取可能媒体の例として、不揮発性メモリが挙げられる。例えば以下を含む:半導体メモリデバイス(例:Erasable Programmable Read Onlu Memory(EPROM)、Electrically Erasable Programmable Read Only Memory(EEPROM))、フラッシュメモリデバイス;内部ハードディスクやリムーバブルディスクなどの磁気ディスク;磁気光学ディスク;CDROM、DVDROM。
通信ネットワーク926上で伝送媒体を用いて命令924を送受信することができる。命令924は、ネットワークインターフェースデバイス920を用いて、任意の既存通信プロトコル(例:HTTP)により送信することができる。通信ネットワークの例として以下が挙げられる:LAN、WAN、インターネット、携帯電話ネットワーク、音声電話(POTS)ネットワーク、無線データネットワーク(例:WiFi、WiMaxネットワーク)。用語“伝送媒体”は、マシンが実行する命令を格納し、コード化し、搬送することができる任意の媒体を含むものとして理解されたい。さらに、デジタルまたはアナログ通信信号その他のソフトウェア通信を可能にする媒体を含む。
具体的実施形態を参照して本発明を説明したが、本発明の趣旨と範囲から逸脱することなくこれら実施形態に対して様々な変形や変更が可能であることは明らかである。したがって本明細書と図面は、限定的意味ではなく説明のためのものであると理解されたい。
明確性のため、以上の説明は複数の機能ユニットとプロセッサを参照して実施形態を記載したことを理解されたい。ただし、本発明の機能を損なうことなく、機能を異なる機能ユニット、プロセッサ、またはドメイン間で分散できることは、明らかである。例えば別のプロセッサまたはコントローラが実施するように記載した機能は、同じプロセッサまたはコントローラが実施することもできる。したがって、特定の機能ユニットを参照することは、その機能を提供するのに適した手段を参照しているに過ぎず、厳密な論理的または物理的構造や組織を示しているのではない。
具体的実施例を参照して実施形態を説明したが、本発明の趣旨と範囲から逸脱することなくこれら実施形態に対して様々な変形や変更をできることは、明らかである。したがって、本明細書と図面は説明目的のものであり、限定的に解するべきではない。添付する図面は、本発明を実施する実施形態を説明するためのものであり、限定のためのものではない。説明した実施形態は、当業者が本明細書の教示を実現できる程度に詳細に記載したものである。他の実施形態を用いまたは派生して、本開示の範囲から逸脱することなく構造的または論理的代替や変更をすることができる。したがって本明細書は、限定的に解するべきではなく、実施形態の範囲は特許請求範囲によってのみ定義され、これと等価な全ての範囲も含まれる。
本発明の実施形態を、個別におよび/またはまとめて説明した。これに際して用語“発明”を用いているが、これは便宜上のものであり、1以上のものが開示されていれば本願の範囲を自発的に単一の概念に制限する意図ではない。したがって、本明細書は具体的な実施形態を説明しているが、同じ目的を実現する構成はその具体的実施形態について置き換えできることを理解されたい。本開示は、様々な実施形態の全ての適用形態および変形をカバーすることを意図している。上記実施形態の組み合わせおよび本明細書が具体的に記載していない他の実施形態は、本明細書を参照すれば当業者にとって明らかである。
本文書において、特許文書において一般的であるように、用語“a”を用いている。これは“少なくとも1つ”または“1以上”と明示しなくとも、1以上を含むものである。本文書において、用語“または”を用いている。これは、非排他的であることを意味しており、“AまたはB”は明示しない限り以下を含む:“AであるがBでない”、“BであるがAでない”、“AおよびB”。特許請求範囲において、用語“含む”や“において”を用いている。これは “備える”や“であって”と等価である。特許請求範囲において、用語“含む”や“備える”は、無制限のものである。すなわち、請求項においてその語句の後にリストされた要素を備えるシステム、デバイス、物品、プロセスは、その請求項の範囲に含まれる。さらに特許請求範囲において、用語“第1”、“第2”、“第3”などはラベルのためのみに用いており、数的要件を強調する意図するものではない。
要約を提供して、読者が本開示の内容を早く理解できるようにした。これは特許請求範囲の範囲や意味を限定するために用いるものではない。本明細書において、本開示を整理するため、様々な要素を1つの実施形態にグループ化している。この開示方法は、特許請求する実施形態が各請求項によって明示的に記載している以上の要素を必要とすることを表すものではない。特許請求範囲は、本発明が実施形態の全要素よりも少ない要素を備え得ることを反映したものである。したがって特許請求範囲は、個々の請求項が個別の実施形態上に立脚するものである。

Claims (46)

  1. 患者データに基づき因果関係ネットワークモデルを生成するための、コンピュータ実装した方法であって、コンピュータシステムに、
    50人から1,000,000人の患者を含む複数の患者に対応するデータを受信するステップであって、前記データは各患者の診断情報および/または治療情報を含む、ステップ、
    前記データをパースして、各患者の診断または治療に関する少なくとも1つの変数を含む複数の変数についての正規化データを生成するステップであって、各患者について前記正規化データは1以上の変数について生成される、ステップ、
    前記生成した正規化データに基づき前記複数の変数に関する因果関係ネットワークモデルを生成するステップであって、前記生成するステップは、50人から1,000,000人の患者から生成した前記正規化データに基づきベイジアンネットワークの集合を作成するステップを含み、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含む、ステップ、
    実行させ
    前記因果関係ネットワークモデルを生成する前記コンピュータシステムは、ネットワークモデル構築コードを保持するストレージと前記ネットワークモデル構築コードを実行するように構成された1以上のプロセッサを有し、
    前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成するステップは、
    ネットワーク断片のリストを生成するステップであって、各ネットワークフラグメントは1以上の関係によって接続された2以上の変数を含み、さらに、前記複数の変数について前記正規化データに基づき各ネットワークフラグメントに関連する確率スコアを決定するステップ、
    ベイジアンネットワークの集合である仮ネットワークの集合を生成するステップであって、各仮ネットワークは前記ネットワーク断片のリストの異なるサブセットから構築される、ステップ、
    シミュレーテッドアニーリングを介して局所変形させて各仮ネットワークを進化させることにより前記仮ネットワークの集合をグローバル最適化し、コンセンサス因果関係ネットワークモデルを生成するステップ、
    を有する
    ことを特徴とする方法。
  2. 前記因果関係ネットワークモデルは、各前記医学的状態の1以上の予測変数を示す関係を含む
    ことを特徴とする請求項1記載の方法。
  3. 前記受信したデータは、1以上の前記医学的状態に関連するものとして事前選択されていない
    ことを特徴とする請求項1記載の方法。
  4. 前記複数の患者は、医学的状態の診断を示すデータをそれぞれ有する患者の第1サブセットと、医学的状態の診断を示していないデータをそれぞれ有する患者の第2サブセットとを含む
    ことを特徴とする請求項1記載の方法。
  5. 前記方法はさらに、前記コンピュータシステムに、
    1以上の追加患者に対応する追加データを受信するステップ、
    前記追加データに基づき前記因果関係ネットワークモデルを更新するステップ、
    実行させることを特徴とする請求項1記載の方法。
  6. 前記方法はさらに、前記コンピュータシステムに、
    前記複数の患者の1以上に対応する更新されたまたは追加されたデータを受信するステップ、
    前記更新または追加されたデータに基づき前記因果関係ネットワークモデルを更新するステップ、
    実行させることを特徴とする請求項1記載の方法。
  7. 前記因果関係ネットワークモデルは、前記生成した正規化データのみに基づき生成される
    ことを特徴とする請求項1記載の方法。
  8. 前記方法はさらに、前記コンピュータシステムに、
    前記因果関係ネットワークモデルからサブネットワークを判定するステップであって、前記サブネットワーク内の1以上の変数は選択された医学的状態と対応付けられている、ステップ、
    前記サブネットワーク内の関係をプローブして前記選択した医学的状態についての1以上の予測変数を決定するステップ、
    実行させることを特徴とする請求項1記載の方法。
  9. 前記選択した医学的状態についての前記1以上の予測変数は、前記選択した医学的状態と同時発生する医学的状態を示す
    ことを特徴とする請求項8記載の方法。
  10. 前記サブネットワークの広がりは、前記選択された医学的状態と対応付けられた前記1以上の変数、および前記1以上の変数と前記因果関係ネットワークモデル内の他の変数との間の前記関係の強度、に基づき決定される
    ことを特徴とする請求項8記載の方法。
  11. 前記サブネットワークは、前記選択された医学的状態に関連付けられた1以上の変数を含み、追加変数の第1セットはそれぞれ前記1以上の変数と第1強度関係を有し、追加変数の第2セットはそれぞれ前記1以上の変数と第2強度関係を有する
    ことを特徴とする請求項8記載の方法。
  12. 前記1以上の予測変数のうち少なくとも1つは、前記医学的状態の予測変数として未知のものである
    ことを特徴とする請求項8記載の方法。
  13. 前記1以上の予測変数のうち少なくとも1つは、前記医学的状態の予測変数として新たに認識されたものである
    ことを特徴とする請求項8記載の方法。
  14. 前記予測変数の個数は前記変数の個数よりも少ない
    ことを特徴とする請求項8記載の方法。
  15. 前記方法はさらに、前記コンピュータシステムに、ユーザインターフェースにおいて前記1以上の予測変数、前記1以上の変数と前記1以上の予測変数との間の関係、を表示するステップを実行させ
    前記表示は、前記1以上の変数のグラフ表示を含む
    ことを特徴とする請求項8記載の方法。
  16. 前記方法はさらに、前記コンピュータシステムに、前記サブネットワークのグラフをユーザインターフェースに表示するステップを実行させる
    ことを特徴とする請求項8記載の方法。
  17. 前記方法はさらに、前記コンピュータシステムに、前記1以上の変数と前記1以上の予測変数との間の関係強度に基づき前記1以上の予測変数をランク付けするステップを実行させる
    ことを特徴とする請求項8記載の方法。
  18. 前記方法はさらに、前記コンピュータシステムに、
    前記因果関係ネットワークモデルからサブネットワークを決定するステップであって、前記サブネットワーク内の1以上の変数は、選択した薬に関連付けられる、ステップ、
    前記サブネットワークをプローブして前記選択した薬に関連する1以上の予測変数を決定するステップ、
    実行させることを特徴とする請求項1記載の方法。
  19. 前記選択した薬に関連する前記1以上の予測変数は、前記選択した薬とともに投与された薬を示す
    ことを特徴とする請求項18記載の方法。
  20. 前記1以上の予測変数は、前記選択した薬と1以上の他の薬との間の有害な相互作用を示す
    ことを特徴とする請求項18記載の方法。
  21. 前記1以上の予測変数のうち少なくとも1つは、前記選択した薬と前記1以上の薬との間の有害な相互作用についての予測変数として新たに認識されたものである
    ことを特徴とする請求項20記載の方法。
  22. 前記サブネットワークの広がりは、前記選択した薬と関連付けられている前記1以上の変数、および前記1以上の変数と前記因果関係ネットワークモデル内の他の変数との間の関係強度、に基づき決定される
    ことを特徴とする請求項18記載の方法。
  23. 前記サブネットワークは、前記選択された薬に関連付けられた1以上の変数を含み、追加変数の第1セットはそれぞれ前記1以上の変数と第1強度関係を有し、追加変数の第2セットはそれぞれ前記1以上の変数と第2強度関係を有する
    ことを特徴とする請求項18記載の方法。
  24. 前記1以上の予測変数のうち少なくとも1つは、前記選択した薬についての予測変数として未知のものである
    ことを特徴とする請求項18記載の方法。
  25. 前記予測変数の個数は前記変数の個数よりも少ない。
    ことを特徴とする請求項18記載の方法。
  26. 前記因果関係ネットワークモデルは少なくとも50変数に基づき生成される
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  27. 前記因果関係ネットワークモデルは少なくとも100変数に基づき生成される
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  28. 前記因果関係ネットワークモデルは少なくとも1000変数に基づき生成される
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  29. 前記因果関係ネットワークモデルは少なくとも100000変数に基づき生成される
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  30. 前記データは患者の電子健康レコードからの情報を含む
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  31. 前記受信したデータはさらに、前記複数の患者のうち少なくとも一部について、
    患者の人物情報、医療履歴、患者の家族の医療履歴、有効薬品情報、有効でない過去の薬品情報、アレルギー情報、免疫状態情報、実験室テスト結果、放射線画像、バイタルサイン情報、患者の体重、請求情報、ライフスタイル情報、習慣情報、保険請求情報、薬局情報、
    の少なくとも1つを含む
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  32. 前記患者の人物情報は、患者の年齢、人種、民族のうち少なくとも1つを含む
    ことを特徴とする請求項31記載の方法。
  33. 前記受信したデータは、患者チャートからの情報を含む
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  34. 前記患者チャートからの情報は、
    ヘルスケア専門家によるメモ、ヘルスケア専門家による観察結果、薬品と治療の投与、薬品と治療の投与の順番、テスト結果、x線画像、
    のうち少なくとも1つを含む
    ことを特徴とする請求項33記載の方法。
  35. 前記受信したデータは患者の退院情報を含む
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  36. 前記患者の退院情報は、
    診断コード、治療コード、保険課金コード、診断関連グループコード、国際疫病分類コード、
    のうち少なくとも1つを含む
    ことを特徴とする請求項35記載の方法。
  37. 前記受信したデータは選択した病院からの複数の患者に関するものである
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  38. 前記受信したデータは選択した地域からの複数の患者に関するものである
    ことを特徴とする請求項1から25のいずれか1項記載の方法。
  39. 前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成するステップはさらに、
    入力データに基づく前記コンセンサス因果関係ネットワークモデルのコンピュータシミュレーションを実施することにより、前記因果関係ネットワークモデル内の1以上の因果関係についての予測の確信レベルを提供するステップを有する
    ことを特徴とする請求項記載の方法。
  40. 患者データに基づき因果関係ネットワークモデルを生成するシステムであって、
    50人から1,000,000人の患者を含む複数の患者に関するデータを受信するように構成されたデータ受信モジュールであって、前記データは各患者の診断情報および/または治療情報を含む、データ受信モジュール、
    前記データをパースして、各患者の診断または治療に関する少なくとも1つの変数を含む複数の変数についての正規化データを生成するように構成されたパースモジュールであって、各患者について前記正規化データは1以上の変数について生成される、パースモジュール、
    前記生成した正規化データに基づき前記複数の変数に関する因果関係ネットワークモデルを生成するように構成されたプロセッサ実装関係ネットワークモジュールであって、前記生成は、50人から1,000,000人の患者から生成した前記正規化データに基づきベイジアンネットワークの集合を作成するステップを含み、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含む、プロセッサ実装関係ネットワークモジュール、
    を備え
    前記プロセッサ実装関係ネットワークモジュールは、
    ネットワーク断片のリストを生成するステップであって、各ネットワークフラグメントは1以上の関係によって接続された2以上の変数を含み、さらに、前記複数の変数について前記正規化データに基づき各ネットワークフラグメントに関連する確率スコアを決定するステップ、
    ベイジアンネットワークの集合である仮ネットワークの集合を生成するステップであって、各仮ネットワークは前記ネットワーク断片のリストの異なるサブセットから構築される、ステップ、
    シミュレーテッドアニーリングを介して局所変形させて各仮ネットワークを進化させることにより前記仮ネットワークの集合をグローバル最適化し、コンセンサス因果関係ネットワークモデルを生成するステップ、
    によって、前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成する
    ことを特徴とするシステム。
  41. 前記因果関係ネットワークモデルは、前記複数の医学的状態それぞれについての1以上の予測変数を示す関係を含む
    ことを特徴とする請求項40記載のシステム。
  42. 少なくとも1つのプロセッサが実行することにより、前記少なくとも1つのプロセッサに請求項1から25いずれか1項記載の方法を実施させる、少なくとも1つのプログラムを格納する
    ことを特徴とする不揮発性機械読取可能記憶媒体。
  43. 医学的状態についての予測変数を生成するシステムであって、
    50人から1,000,000人の患者を含む複数の患者に対応するデータを受信するように構成された因果関係ネットワークモデル生成器を備え、前記データは各患者の診断情報および/または治療情報を含み、
    前記因果関係ネットワークモデル生成器はさらに、前記データをパースして、各患者の診断または治療に関する少なくとも1つの変数を含む複数の変数についての正規化データを生成するように構成され、各患者について前記正規化データは1以上の変数について生成され、
    前記因果関係ネットワークモデル生成器はさらに、前記生成した正規化データに基づき各変数を前記複数の変数の1以上に関連付ける因果関係ネットワークモデルを生成するように構成され、前記生成は、50人から1,000,000人の患者から生成した前記正規化データに基づきベイジアンネットワークの集合を作成するステップを含み、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含み、
    前記因果関係ネットワークモデル生成器は、
    ネットワーク断片のリストを生成するステップであって、各ネットワークフラグメントは1以上の関係によって接続された2以上の変数を含み、さらに、前記複数の変数について前記正規化データに基づき各ネットワークフラグメントに関連する確率スコアを決定するステップ、
    ベイジアンネットワークの集合である仮ネットワークの集合を生成するステップであって、各仮ネットワークは前記ネットワーク断片のリストの異なるサブセットから構築される、ステップ、
    シミュレーテッドアニーリングを介して局所変形させて各仮ネットワークを進化させることにより前記仮ネットワークの集合をグローバル最適化し、コンセンサス因果関係ネットワークモデルを生成するステップ、
    によって、前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成する
    ことを特徴とするシステム。
  44. 前記因果関係ネットワークモデルは、前記複数の医学的状態それぞれについての1以上の予測変数を示す関係を含む
    ことを特徴とする請求項43記載のシステム。
  45. 前記システムはさらに、サブネットワーク選択モジュールを備え、
    前記サブネットワーク選択モジュールは、ユーザインターフェースを介してユーザから医学的状態に関連付けられた情報を受信するように構成され、
    前記サブネットワーク選択モジュールはさらに、前記因果関係ネットワークモデルからサブネットワークを決定するように構成され、前記サブネットワークは前記医学的状態に関連する1以上の変数を含み、
    前記サブネットワーク選択モジュールはさらに、前記サブネットワークをスキャンして前記医学的状態についての1以上の予測変数を識別し、前記医学的状態についての前記1以上の予測変数を保存するように構成されている
    ことを特徴とする請求項43記載のシステム。
  46. 患者データに基づき因果関係ネットワークモデルを生成するシステムであって、
    第1プロセッサにより実装され、50人から1,000,000人の患者を含む複数の患者に対応するデータを受信するように構成された、データ受信モジュールであって、前記データは各患者の診断情報および/または治療情報を含み、
    前記データ受信モジュールはさらに、前記データをパースして、各患者の診断または治療に関する少なくとも1つの変数を含む複数の変数についての正規化データを生成するように構成されており、各患者について前記正規化データは1以上の変数について生成され、
    前記システムはさらに、1以上の追加プロセッサによって実装された因果関係ネットワークモジュールを備え、
    前記因果関係ネットワークモジュールは、前記生成された正規化データに基づき前記複数の変数に関する因果関係ネットワークモデルを生成するように構成され、前記生成は、50人から1,000,000人の患者から生成した前記正規化データに基づきベイジアンネットワークの集合を作成するステップを含み、前記因果関係ネットワークモデルは複数の医学的状態に関する変数を含み、
    前記因果関係ネットワークモジュールは、
    ネットワーク断片のリストを生成するステップであって、各ネットワークフラグメントは1以上の関係によって接続された2以上の変数を含み、さらに、前記複数の変数について前記正規化データに基づき各ネットワークフラグメントに関連する確率スコアを決定するステップ、
    ベイジアンネットワークの集合である仮ネットワークの集合を生成するステップであって、各仮ネットワークは前記ネットワーク断片のリストの異なるサブセットから構築される、ステップ、
    シミュレーテッドアニーリングを介して局所変形させて各仮ネットワークを進化させることにより前記仮ネットワークの集合をグローバル最適化し、コンセンサス因果関係ネットワークモデルを生成するステップ、
    によって、前記生成した正規化データに基づき複数の患者についての変数に関連する前記因果関係ネットワークモデルを生成する
    ことを特徴とするシステム。
JP2017513538A 2014-09-11 2015-09-11 患者データに基づく健康診断および治療のためのベイジアン因果関係ネットワークモデル Active JP6916107B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462049148P 2014-09-11 2014-09-11
US62/049,148 2014-09-11
PCT/US2015/049552 WO2016040725A1 (en) 2014-09-11 2015-09-11 Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data

Publications (2)

Publication Number Publication Date
JP2017537365A JP2017537365A (ja) 2017-12-14
JP6916107B2 true JP6916107B2 (ja) 2021-08-11

Family

ID=55459589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017513538A Active JP6916107B2 (ja) 2014-09-11 2015-09-11 患者データに基づく健康診断および治療のためのベイジアン因果関係ネットワークモデル

Country Status (13)

Country Link
US (3) US10482385B2 (ja)
EP (1) EP3191975A4 (ja)
JP (1) JP6916107B2 (ja)
KR (1) KR102662004B1 (ja)
CN (2) CN114203296A (ja)
AU (2) AU2015314956A1 (ja)
CA (1) CA2960837A1 (ja)
HK (1) HK1243509A1 (ja)
IL (1) IL250966B (ja)
NZ (1) NZ730197A (ja)
SG (2) SG11201701963UA (ja)
WO (1) WO2016040725A1 (ja)
ZA (1) ZA201701611B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023022495A1 (ko) * 2021-08-20 2023-02-23 가톨릭대학교 산학협력단 예후 예측 장치, 방법 및 기록매체

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114203296A (zh) 2014-09-11 2022-03-18 博格有限责任公司 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型
US20210280317A1 (en) * 2014-10-07 2021-09-09 AlignCare Services, LLC. System and Method for Improving Health Care Management and Compliance
US11443206B2 (en) 2015-03-23 2022-09-13 Tibco Software Inc. Adaptive filtering and modeling via adaptive experimental designs to identify emerging data patterns from large volume, high dimensional, high velocity streaming data
US10839024B2 (en) * 2016-06-20 2020-11-17 Tibco Software Inc. Detecting important variables and their interactions in big data
WO2017214068A1 (en) * 2016-06-05 2017-12-14 Berg Llc Systems and methods for patient stratification and identification of potential biomarkers
US11182229B2 (en) * 2016-12-16 2021-11-23 Sap Se Data processing for predictive analytics
US11315685B2 (en) * 2017-01-25 2022-04-26 UCB Biopharma SRL Method and system for predicting optimal epilepsy treatment regimes
KR101830314B1 (ko) 2017-07-26 2018-02-20 재단법인 구미전자정보기술원 인공지능 기반 베이지안 네트워크를 이용한 췌장암 진단에 필요한 정보제공 방법, 컴퓨터 프로그램 및 컴퓨터 판독 가능한 기록 매체
US10699450B2 (en) 2017-09-28 2020-06-30 International Business Machines Corporation Interactive tool for causal graph construction
US11164678B2 (en) * 2018-03-06 2021-11-02 International Business Machines Corporation Finding precise causal multi-drug-drug interactions for adverse drug reaction analysis
CN110322019A (zh) * 2018-03-29 2019-10-11 日本电气株式会社 用于处理数据集的方法、系统和存储介质
CN110555047B (zh) * 2018-03-29 2024-03-15 日本电气株式会社 数据处理方法和电子设备
US11694800B2 (en) * 2018-05-09 2023-07-04 International Business Machines Corporation Medical diagnosis system with continuous learning and reasoning
US11276494B2 (en) 2018-05-11 2022-03-15 International Business Machines Corporation Predicting interactions between drugs and diseases
CN110827988B (zh) * 2018-08-14 2022-10-21 上海明品医学数据科技有限公司 一种基于移动终端进行医学数据研究的控制方法
WO2020097122A1 (en) * 2018-11-05 2020-05-14 Children's Hospital Medical Center Computation model of learning networks
CN110147878B (zh) * 2018-11-28 2023-01-31 腾讯科技(深圳)有限公司 数据处理方法、装置及设备
CN112233736B (zh) * 2019-01-15 2022-09-16 合肥工业大学 一种知识库的构建方法和系统
US20220093271A1 (en) 2019-01-25 2022-03-24 Children's Hospital Medical Center Bayesian causal inference models for healthcare treatment using real world patient data
KR102238762B1 (ko) 2019-01-31 2021-04-16 주식회사 이노제닉스 패혈증 진단을 위한 reba 결과 판독 영상인식 시스템 및 이를 이용한 패혈증 진단 방법
US11861508B2 (en) * 2019-06-06 2024-01-02 Nec Corporation Causal analysis
US11468994B2 (en) * 2019-06-28 2022-10-11 Cerner Innovation, Inc. Pneumonia readmission prevention
US12100515B2 (en) * 2019-07-11 2024-09-24 International Business Machines Corporation Altering a targeted brain therapeutic based on a brain circuit model
WO2021022365A1 (en) * 2019-08-02 2021-02-11 Intellijoint Surgical Inc. Systems and methods to collaborate, to train an expert system and to provide an expert system
US11107555B2 (en) 2019-10-02 2021-08-31 Kpn Innovations, Llc Methods and systems for identifying a causal link
US11645565B2 (en) 2019-11-12 2023-05-09 Optum Services (Ireland) Limited Predictive data analysis with cross-temporal probabilistic updates
KR102272296B1 (ko) * 2019-11-25 2021-07-02 (주)오렌지아이 2차 전지의 성능 평가 지원 장치, 성능 평가 데이터 저장 및 분석 시스템 및 그의 이용 방법
US12106842B2 (en) 2020-01-31 2024-10-01 Direct Supply, Inc. Systems, methods, and media for automated dietary management in healthcare facilities
US11552785B2 (en) * 2020-04-02 2023-01-10 Epidaurus Health, Inc. Methods and systems for a synchronized distributed data structure for federated machine learning
WO2021205541A1 (ja) * 2020-04-07 2021-10-14 日本電信電話株式会社 分析装置、分析方法及びプログラム
CN113554449A (zh) * 2020-04-23 2021-10-26 阿里巴巴集团控股有限公司 商品变量预测方法、设备以及计算机可读介质
US11797776B2 (en) * 2020-09-07 2023-10-24 Accenture Global Solutions Limited Utilizing machine learning models and in-domain and out-of-domain data distribution to predict a causality relationship between events expressed in natural language text
US11335443B1 (en) 2020-09-07 2022-05-17 OpenNano Pte. Ltd. Phenotypic patient data derivation from economic data
CN112185583B (zh) * 2020-10-14 2022-05-31 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
US11763325B2 (en) * 2020-11-13 2023-09-19 Adobe Inc. Automated discovery of causal relationships in mixed datasets
CN112614595A (zh) * 2020-12-25 2021-04-06 联仁健康医疗大数据科技股份有限公司 生存分析模型的构建方法、装置、电子终端及存储介质
US20220246297A1 (en) * 2021-02-01 2022-08-04 Anthem, Inc. Causal Recommender Engine for Chronic Disease Management
CN113436725B (zh) * 2021-06-24 2023-06-23 深圳平安智慧医健科技有限公司 数据处理方法、系统、计算机设备及计算机可读存储介质
CN113221391B (zh) * 2021-07-08 2021-09-07 中国电子科技集团公司第九研究所 用bic准则分析环行器性能指导物料尺寸参数筛选的方法
CN114176600B (zh) * 2021-12-28 2023-10-20 上海交通大学 基于因果分析的心电图st段异常判别系统
CN115424741B (zh) * 2022-11-02 2023-03-24 之江实验室 基于因果发现的药物不良反应信号发现方法及系统
KR20240084699A (ko) 2022-12-07 2024-06-14 주식회사 디케이닥터 헬스 디바이스 측정 데이터의 실효성 향상을 위한 사용자 인증 시스템
CN117637184B (zh) * 2023-12-22 2024-06-04 湖北省疾病预防控制中心(湖北省预防医学科学院) 一种纵向数据的贝叶斯敏感性分析方法及系统

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5918200A (en) 1992-08-31 1999-06-29 Yamatake-Honeywell Co., Ltd. State estimating apparatus
US6678669B2 (en) * 1996-02-09 2004-01-13 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
EP0879449A2 (en) * 1996-02-09 1998-11-25 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US6763307B2 (en) 2000-03-06 2004-07-13 Bioseek, Inc. Patient classification
US20030124548A1 (en) 2001-03-13 2003-07-03 Christos Hatzis Method for association of genomic and proteomic pathways associated with physiological or pathophysiological processes
US8000949B2 (en) 2001-06-18 2011-08-16 Genego, Inc. Methods for identification of novel protein drug targets and biomarkers utilizing functional networks
US7393656B2 (en) 2001-07-10 2008-07-01 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for risk stratification
US7415359B2 (en) 2001-11-02 2008-08-19 Gene Network Sciences, Inc. Methods and systems for the identification of components of mammalian biochemical networks as targets for therapeutic agents
AU2002304965A1 (en) 2002-05-24 2003-12-12 Zensun (Shanghai) Sci-Tech.Ltd Neuregulin based methods and compositions for treating viral myocarditis and dilated cardiomyopathy
EP1540505B1 (en) 2002-08-29 2008-06-18 Gene Network Sciences, Inc. Systems and methods for inferring biological networks
US20040093331A1 (en) * 2002-09-20 2004-05-13 Board Of Regents, University Of Texas System Computer program products, systems and methods for information discovery and relational analyses
CN1714371A (zh) 2002-11-19 2005-12-28 Gni美国公司 根据时间序列基因表达数据的基因网络的非线性模拟
JP4288345B2 (ja) 2003-06-19 2009-07-01 独立行政法人産業技術総合研究所 新規てんかんモデル動物
EP1512970A1 (en) 2003-09-05 2005-03-09 Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO Method for determining the impact of a multicomponent mixture on the biological profile of a disease
JPWO2005035780A1 (ja) 2003-10-14 2006-12-21 株式会社セルフリーサイエンス 指標物質の新規スクリーニング方法
CA2955027A1 (en) 2004-04-15 2005-11-10 University Of Florida Research Foundation, Inc. Neural proteins as biomarkers for nervous system injury and other neural disorders
US8185367B2 (en) 2004-04-30 2012-05-22 Merck Sharp & Dohme Corp. Systems and methods for reconstructing gene networks in segregating populations
EP1607898A3 (en) 2004-05-18 2006-03-29 Neal E. Solomon A bioinformatics system for functional proteomics modelling
GB0419124D0 (en) 2004-08-27 2004-09-29 Proteome Sciences Plc Methods and compositions relating to Alzheimer's disease
US20100316629A1 (en) 2004-09-01 2010-12-16 Shaughnessy Jr John D Use of gene expression profiling to predict survival in cancer patient
CA2587765A1 (en) 2004-11-17 2006-05-26 Immunivest Corporation Magnetic enrichment of circulating cells, fragments and debris for enabling hts proteomics and genomics in disease detection
EP1842147A2 (en) 2005-01-24 2007-10-10 The Board of Trustees of The Leland Stanford Junior University Method for modeling cell signaling systems by means of bayesian networks
EP1866818A1 (en) 2005-03-31 2007-12-19 Koninklijke Philips Electronics N.V. System and method for collecting evidence pertaining to relationships between biomolecules and diseases
WO2006129401A1 (ja) 2005-05-31 2006-12-07 Jcl Bioassay Corporation プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法
US7906116B2 (en) 2005-09-01 2011-03-15 Parkash Gill Methods for using and identifying modulators of Delta-like 4
WO2007039255A1 (en) 2005-09-30 2007-04-12 Universiteit Maastricht Tumor angiogenesis associated genes and a method for their identification
US20080281170A1 (en) * 2005-11-08 2008-11-13 Koninklijke Philips Electronics N.V. Method for Detecting Critical Trends in Multi-Parameter Patient Monitoring and Clinical Data Using Clustering
EP1840574A1 (en) 2006-03-30 2007-10-03 Institut Pasteur Use of the alpha chain of brain spectrin and fragments thereof, for diagnosing cerebral diseases
US20080046290A1 (en) * 2006-08-21 2008-02-21 Cerner Innovation, Inc. System and method for compiling and displaying discharge instructions for a patient
WO2008060620A2 (en) 2006-11-15 2008-05-22 Gene Network Sciences, Inc. Systems and methods for modeling and analyzing networks
US8637244B2 (en) * 2006-12-05 2014-01-28 Decode Genetics Ehf. Genetic markers for risk management of atrial fibrillation, atrial flutter, and stroke
CN101105841B (zh) 2007-02-12 2011-06-15 浙江大学 由大规模基因芯片表达谱数据构建基因调控亚网络的方法
US8140270B2 (en) 2007-03-22 2012-03-20 National Center For Genome Resources Methods and systems for medical sequencing analysis
US20090117562A1 (en) 2007-04-09 2009-05-07 Valerie Wailin Hu Method and kit for diagnosing Autism using gene expression profiling
CA2684665A1 (en) 2007-05-16 2009-02-12 Edsa Micro Corporation Real-time predictive systems for intelligent energy monitoring and management of electrical power networks
JP2009050171A (ja) 2007-08-23 2009-03-12 Toyobo Co Ltd 表面プラズモン共鳴による基板上におけるリン酸化の検出方法
DE102007044380A1 (de) * 2007-09-17 2009-03-19 Siemens Ag Verfahren zum rechnergestützten Lernen eines probabilistischen Netzes
US7895146B2 (en) 2007-12-03 2011-02-22 Microsoft Corporation Time modulated generative probabilistic models for automated causal discovery that monitors times of packets
AU2009217278B2 (en) 2008-02-20 2015-08-20 The Children's Hospital Of Philadelphia Genetic alterations associated with autism and the autistic phenotype and methods of use thereof for the diagnosis and treatment of autism
US8173369B2 (en) 2008-05-15 2012-05-08 The Regents Of The University Of California Peripheral gene expression biomarkers for autism
US8005770B2 (en) * 2008-06-09 2011-08-23 Microsoft Corporation Parallel generation of a bayesian network
CN102132280A (zh) 2008-08-15 2011-07-20 皇家飞利浦电子股份有限公司 模型增强的成像
BRPI0917871A2 (pt) 2008-08-15 2017-06-20 Merrimack Pharmaceuticals Inc agente terapêutico anti-erbb3 para uso em terapia de um tumor, métodos para predizer responsividade de um tumor de um agente terapêutco anti-erbb3, para selecionar terapia anti-erbb3 para um paciente, para predizer a resposta de células ao tratamento com um agente terapêutico, para identificar um biomarcador, e para evitar administração de uma droga para câncer anti-erbb3, e, kit para predizer a resposta das células ao tratamento com um agente terapêutico
WO2010045463A2 (en) * 2008-10-15 2010-04-22 Government Of The United States As Represented By The Secretary Of The Army Clinical decision model
WO2010056982A2 (en) 2008-11-17 2010-05-20 The George Washington University Compositions and methods for identifying autism spectrum disorders
US8541170B2 (en) 2008-11-17 2013-09-24 Veracyte, Inc. Methods and compositions of molecular profiling for disease diagnostics
EA034552B1 (ru) 2009-05-11 2020-02-19 БЕРГ ЭлЭлСи Способ лечения или предотвращения прогрессирования онкологических заболеваний
US20110202486A1 (en) * 2009-07-21 2011-08-18 Glenn Fung Healthcare Information Technology System for Predicting Development of Cardiovascular Conditions
EP2476053A4 (en) 2009-09-08 2014-03-12 Nodality Inc ANALYSIS OF CELL NETWORKS
WO2011060314A1 (en) * 2009-11-12 2011-05-19 eTenum, LLC Method and system for optimal estimation in medical diagnosis
US20130123124A1 (en) 2010-03-12 2013-05-16 Children's Medical Center Corporation Methods and compositions for characterizing autism spectrum disorder based on gene expression patterns
US20130023574A1 (en) 2010-03-31 2013-01-24 National University Corporation Kumamoto University Method for generating data set for integrated proteomics, integrated proteomics method using data set for integrated proteomics that is generated by the generation method, and method for identifying causative substance using same
US11195213B2 (en) 2010-09-01 2021-12-07 Apixio, Inc. Method of optimizing patient-related outcomes
WO2012119129A1 (en) 2011-03-02 2012-09-07 Berg Biosystems, Llc Interrogatory cell-based assays and uses thereof
JP2013537326A (ja) * 2011-08-31 2013-09-30 アピシオ,インク. 医療情報ナビゲーションエンジン(mine)システム
CN103107315B (zh) 2011-11-10 2016-03-30 北京有色金属研究总院 一种纳米硅碳复合材料及其制备方法
WO2013134315A1 (en) 2012-03-05 2013-09-12 Berg Pharma Llc Compositions and methods for diagnosis and treatment of pervasive developmental disorder
SG10201608234UA (en) 2012-04-02 2016-11-29 Berg Llc Interrogatory cell-based assays and uses thereof
US20130315885A1 (en) 2012-05-22 2013-11-28 Niven Rajin Narain Interogatory cell-based assays for identifying drug-induced toxicity markers
CN114203296A (zh) 2014-09-11 2022-03-18 博格有限责任公司 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023022495A1 (ko) * 2021-08-20 2023-02-23 가톨릭대학교 산학협력단 예후 예측 장치, 방법 및 기록매체

Also Published As

Publication number Publication date
US20160171383A1 (en) 2016-06-16
US11734593B2 (en) 2023-08-22
WO2016040725A1 (en) 2016-03-17
HK1243509A1 (zh) 2018-07-13
CN114203296A (zh) 2022-03-18
US20240169223A1 (en) 2024-05-23
NZ730197A (en) 2022-07-01
JP2017537365A (ja) 2017-12-14
US10482385B2 (en) 2019-11-19
EP3191975A1 (en) 2017-07-19
KR20170058391A (ko) 2017-05-26
AU2020244596A1 (en) 2020-11-05
IL250966A0 (en) 2017-04-30
EP3191975A4 (en) 2018-04-18
SG10201902151UA (en) 2019-04-29
AU2020244596B2 (en) 2023-02-23
CN107111603A (zh) 2017-08-29
US20200143278A1 (en) 2020-05-07
SG11201701963UA (en) 2017-04-27
ZA201701611B (en) 2019-09-25
AU2015314956A1 (en) 2017-04-06
CA2960837A1 (en) 2016-03-17
IL250966B (en) 2021-07-29
KR102662004B1 (ko) 2024-04-29

Similar Documents

Publication Publication Date Title
JP6916107B2 (ja) 患者データに基づく健康診断および治療のためのベイジアン因果関係ネットワークモデル
Diller et al. Lifespan perspective on congenital heart disease research: JACC state-of-the-art review
Paranjpe et al. Insights into computational drug repurposing for neurodegenerative disease
Taylor et al. Prediction of in‐hospital mortality in emergency department patients with sepsis: a local big data–driven, machine learning approach
JP6127160B2 (ja) 個人化ヘルスケアシステム及び方法
US20160063212A1 (en) System for Generating and Updating Treatment Guidelines and Estimating Effect Size of Treatment Steps
US20160098519A1 (en) Systems and methods for scalable unsupervised multisource analysis
Visco et al. Artificial intelligence in hypertension management: an ace up your sleeve
JP6901308B2 (ja) データ分析支援システム及びデータ分析支援方法
US20140358570A1 (en) Healthcare support system and method
US20230087969A1 (en) Systems and methods for machine learning approaches to management of healthcare populations
CN105096225A (zh) 辅助疾病诊疗的分析系统、装置及方法
US10783997B2 (en) Personalized tolerance prediction of adverse drug events
Kaur et al. Big data in nephrology
Khera et al. Transforming cardiovascular care with artificial intelligence: from discovery to practice: JACC State-of-the-Art Review
Dankwa‐Mullan et al. Applications of big data science and analytic techniques for health disparities research
Gandin et al. Deep-learning-based prognostic modeling for incident heart failure in patients with diabetes using electronic health records: a retrospective cohort study
Mpanya et al. Predicting in-hospital all-cause mortality in heart failure using machine learning
Pushkaran et al. From understanding diseases to drug design: can artificial intelligence bridge the gap?
Toor et al. Network analysis as a computational technique and its benefaction for predictive analysis of healthcare data: a systematic review
Rafiei et al. Meta-learning in healthcare: A survey
Sharma et al. Big data analytics in healthcare
JP2022551612A (ja) 医療診断および介入推奨の指示
Kalantzaki et al. Nonparametric network design and analysis of disease genes in oral cancer progression
Murphy et al. Progress toward prognosis in patients with pulmonary embolism

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210715

R150 Certificate of patent or registration of utility model

Ref document number: 6916107

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150