JP2018170004A - 新規患者の挙動を予測するためのシステムおよび方法 - Google Patents

新規患者の挙動を予測するためのシステムおよび方法 Download PDF

Info

Publication number
JP2018170004A
JP2018170004A JP2018006263A JP2018006263A JP2018170004A JP 2018170004 A JP2018170004 A JP 2018170004A JP 2018006263 A JP2018006263 A JP 2018006263A JP 2018006263 A JP2018006263 A JP 2018006263A JP 2018170004 A JP2018170004 A JP 2018170004A
Authority
JP
Japan
Prior art keywords
patient
clinical
activity
pattern
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018006263A
Other languages
English (en)
Inventor
ビリャソン−テラサス・ボリス
Villazon-Terrazas Boris
サンタ・ヌリア ガルシア
Garcia Santa Nuria
サンタ・ヌリア ガルシア
ラ トーレ・ビクトール デ
De La Torre Victor
ラ トーレ・ビクトール デ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2018170004A publication Critical patent/JP2018170004A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】新規患者の臨床挙動を予測するよう構成されたシステムを提供する。
【解決手段】各臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と、新規患者の活動挙動を、該新規患者のヘルスケア施設への任意の訪問に関する活動情報の形で入力する段階(該活動情報は、訪問されたヘルスケア施設の型および訪問の日時を含む)と、新規患者の識別情報を、新規患者についての各活動情報についての活動ノードとリンクさせる、新規患者についてのPAOを生成する段階と、機械学習を使って新規患者を臨床パターンのうちの一つに分類することを、新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と、新規患者が分類された臨床パターンの諸臨床ノードから、新規患者の臨床挙動を予測する段階とを実行する。
【選択図】図2

Description

本発明は、医療状態をもつ、通例患者と称される、個人または生命体の臨床挙動の予測に関する。患者は人間または潜在的には動物、たとえば希少種の標本またさらにはペットであってもよい。多くのシナリオにおいて、患者は不調を患っていることもありうるが、他のシナリオでは患者は現在のところ健康であり、医療状態という用語は不調、疾患および疾病のほかに妊娠などの状態を含む。このように、本発明は、医療、ヘルスケアおよび獣医科学において適用可能である。
ヘルスケア・システム内では、患者の挙動は二つの視点/観点から表現されうる。二つとは、(1)患者の症状、処置、診断および薬物を含む臨床上の観点と、(2)病院ユニットへの異なる訪問、たとえば、患者Aが2016年11月18日16:00に緊急治療室に来たといったことを含む活動の観点である。
ヘルスケア・システムにおいて将来の患者挙動(患者経路としても知られる)をモデル化および推定することは、健康システム活動を理解し、よってその機能性を改善することにおいて重要と考えられている。一つの困難は、電子健康記録(EHR: electronic health records)の時間的側面を表現できる特徴の良好な集合を定義することである。EHRの臨床変数は非同期的に収集される。つまり、異なる時点において測定される。
患者の挙動をモデル化および予測することは、単純なタスクではない。ヘルスケア・システム内での患者の次の諸ステップをモデル化および予測するモデルおよび機構はない。予測は保険会社にとっても重要である。保険会社は、医療インシデントがより少ない顧客にインセンティブを与え、促進する意欲があるからである。
健康保険は、個人の間で医療費がかかるリスクに対する保険である。対象グループの間でヘルスケアおよび健康システム費用の全体的なリスクを推定することによって、保険業者は、保険契約において指定されたヘルスケア給付のために支払うべく資金が利用可能であることを保証するための、月次の掛け金または源泉徴収税のような日常業務の金融構造を開発することができる。よって、健康保険会社も、自分たちの顧客の潜在的な医療/臨床挙動を知ることを望むであろう。この挙動に応じて顧客保険証券を増加/減少できるようにするためである。
本発明の第一の側面のある実施形態によれば、新規患者の臨床挙動を予測するよう構成された、プロセッサおよびメモリを有するシステムが提供される。前記プロセッサは:
患者母集団における各患者の履歴臨床挙動を受け入れ、各患者について前記メモリに記憶されるPCOを生成する患者臨床オブジェクト(PCO: patient clinical object)エンジンであって、前記履歴臨床挙動は、任意の症状、処置、診断および薬物を同定し、該症状、処置、診断または薬物の日時を含む臨床情報の形であり、各患者についての前記PCOは、患者識別情報をその患者についての臨床情報の各履歴情報についての臨床ノードとリンクする、PCOエンジンと;
前記患者母集団における各患者の履歴活動挙動を入力し、各患者について前記メモリに記憶されるPAOを生成する患者活動オブジェクト(PAO: patient activity object)エンジンであって、前記履歴活動挙動は、ヘルスケア施設への任意の訪問を同定し、訪問されたヘルスケア施設の型および訪問の日時を含む活動情報の形であり、各患者についての前記PAOは、患者識別情報をその患者についての活動情報の各履歴情報についての活動ノードとリンクする、PAOエンジンと;
前記メモリに記憶された患者母集団の諸PCOに対して機械学習を使って、諸患者を前記母集団の各患者のPCOに従って、二つ以上の臨床パターンにクラスタリングする臨床パターン・マイニング器(miner)と;
患者挙動推定器とを提供するよう構成されており、前記患者挙動推定器は:
前記メモリから、各臨床パターン内にクラスタリングされた前記患者母集団の各患者についてのPAOおよびPCOを入力し、機械学習を使って前記臨床パターンのモデルを生成する段階であって、前記モデルは、各臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
新規患者の活動挙動を、該新規患者のヘルスケア施設への任意の訪問に関する活動情報の形で入力する段階であって、該活動情報は、訪問されたヘルスケア施設の型および訪問の日時を含む、段階と;
前記新規患者の識別情報を、前記新規患者についての各活動情報についての活動ノードとリンクさせる、前記新規患者についてのPAOを生成する段階と;
機械学習を使って前記新規患者を前記臨床パターンのうちの一つに分類することを、前記新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と;
前記新規患者が分類された臨床パターンの諸臨床ノードから、新規患者の臨床挙動を予測する段階とを実行するものである。
患者母集団における各患者についてのPCOおよびPAOはリンクされ、一緒になって本質的に、たとえばEHRからの、EHRにおいて範疇分けされているような、その患者の臨床および活動(訪問)挙動すべてを提供する。臨床パターン・マイニング器は、患者を、その臨床挙動に従ってクラスター(グループ)にクラスタリングする。患者挙動推定器は、各臨床パターン内にクラスタリングされた前記患者母集団の各患者についてのPAOおよびPCO(すべての臨床ノードおよびすべての活動ノード)を入力する。各患者についてのノードは、もちろん、患者識別情報および潜在的には患者臨床情報によって一緒にリンクされる。すると、患者挙動推定器は、機械学習を使って、諸臨床パターンのモデルを生成する。モデルは、各臨床パターン内にクラスタリングされる患者からの臨床ノードおよび活動ノードを含む。新規患者の活動挙動をもつPAOが、各パターン内の諸活動ノードと比較され、該新規患者のPAOをあるパターンに分類し、その新規患者が分類された臨床パターンの諸臨床ノードから、新規患者の臨床挙動を予測することができる。予測される臨床挙動は、その臨床パターン内の予測されたノードから取られる。パターンの名称が、パターンの全体的な指示として、システム・ユーザーに提供されてもよい。
このように、本発明の実施形態は、臨床的な(そして潜在的にはまた活動の)観点から新規患者の挙動を予測することをねらいとし、臨床情報のいかなる入力もなしに新規患者の活動挙動のみに依拠することができる。疑いのないよう述べておくが、入力という用語は、別個のシステムもしくはメモリからの入力および手動入力を含む。
換言すれば、発明実施形態は、患者の臨床(および活動)挙動を予測できる。この目的に向け、本発明は、患者母集団の臨床および活動データ、すなわちすべての症状、処置、診断および薬物ならびに病院訪問および病院内外の個別のユニットもしくは他のヘルスケア施設への訪問に依拠する。結果として得られる予測により、ヘルスケア・システムは、ずっとよい仕方で資源を管理できる。さらに、患者はよりよい処置を適時に得ることになる。同じ予測が、学術的な医療センターで、ヘルスケア・システムでの研究またさらには改善された診断/処置のために、使用されることができる。
臨床パターン・マイニング器は、生物医学的知識グラフを使うよう構成されてもよい。生物医学的知識グラフは、理論的および経験的知識からの、症状、薬物、処置、診断および疾病ならびにそれらの症状、薬物、処置、診断および疾病の間のリンクを含む。臨床パターン・マイニング器は、生物医学的知識グラフを使って、患者母集団からの情報を補足しうる。
たとえば、臨床パターン・マイニング器は、生物医学的知識グラフから取られた追加的な臨床ノードを含む補足されたPCOを提供するために、患者PCO上のノードを補足するよう構成されていてもよい。この補足は、生物医学的知識グラフとPCOの両方にすでに存在するPCOノードに、生物医学的知識グラフからの近隣ノードを追加することによってでもよい。生物医学的知識グラフは単一の患者よりずっと多くの関係をエンコードしていると見られるので、そのような補足されたPCOは生物医学的知識グラフのサブグラフと見てもよい。
生物医学的知識グラフは、エンティティ間のリンクに対するリンク重み(たとえば0から1まで)を含んでいてもよく、この場合、すでに存在するノードへの、閾値(たとえば0.5)より高い重みをもつリンクをもつ近隣ノードが、追加的な臨床ノードとなってもよい。
患者挙動推定器は、各臨床パターン内にクラスタリングされた前記患者母集団の各患者について前記追加的な臨床ノード(ならびに前記活動ノードおよび臨床ノード)を入力するよう構成されていてもよい。ここで、各臨床パターンは、その臨床パターン内にクラスタリングされる患者からの追加的な臨床ノードを含む。よって、生物医学的知識グラフからのデータは、新規患者の挙動を予測することにおいて使用される。
患者挙動推定器は、臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードのそれぞれに、そのノードを含み、そのパターン内にクラスタリングされている前記母集団内の患者の比率から導出されるノード重みをラベル付けするよう構成されていてもよい。
患者挙動推定器は、そのパターン内に分類されることの複合確率を導出するために、新規患者のPAO内に含まれるそのパターンの諸ノード(および潜在的にはまた諸ノードについての重み)を使うよう構成されたメタ予測器を含んでいてもよい。
たとえば、複合確率は、諸ノードを診断、薬物、症状、処置および訪問に範疇分けすることによって、かつ各範疇の寄与を、その範疇についての割り当てられた重みにより重み付けすることによって、導出されてもよい。
本システムはさらに、患者母集団の諸PAOに対する機械学習を使って、諸患者を、患者母集団の各患者のPAOに従って二つ以上の活動パターンにクラスタリングする、活動パターン・マイニング器を有していてもよい。前記患者挙動推定器はさらに:
機械学習を使って活動パターンのモデルを生成する段階であって、前記モデルは各活動パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
機械学習を使って新規患者を活動パターンの一つに分類することを、新規患者のPAO内の活動ノードをパターン内の活動ノードと比較することによって行なう段階と;
新規患者が分類されたパターンの活動ノードから新規患者の活動挙動を予測する段階とを実行するよう構成される。
このように、同じシステムおよび同じ履歴データならびに新規患者データを使って、新規患者の挙動を予測しうる。
ある臨床または活動パターンへの分類において使用されることのできる臨床挙動データが新規患者について利用可能であることがありうる。そこで、患者挙動推定器はさらに:
新規患者の臨床挙動を入力する段階であって、前記臨床挙動は、任意の症状、処置、診断および薬物を同定し、該症状、処置、診断または薬物の日時を含む臨床情報の形である、段階と;前記新規患者識別情報を前記新規患者についての各臨床情報についての臨床ノードとリンクする、前記新規患者についてのPCOを生成する段階と:
さらに、前記新規患者のPCOの臨床ノードを使って、前記新規患者をある(臨床または活動)パターンに分類することを、前記新規患者のPCOにおける(臨床活動)ノードをパターン内の臨床ノードとさらに比較することによって、行なう段階とを実行するよう構成される。
この場合、メタ予測器はさらに、新規患者のPCO内に含まれるパターンの諸ノード/諸ノードについてのノード重みを使って、パターン内への分類の前記複合確率を導出するよう構成されてもよい。
本発明の第二の側面のある実施形態によれば、新規患者の臨床挙動を予測するコンピュータ実装される方法が提供される。本方法は:
患者母集団における各患者の履歴臨床挙動を入力し、各患者についてのPCOを生成する段階であって、前記履歴臨床挙動は、任意の症状、処置、診断および薬物を同定し、該症状、処置、診断または薬物の日時を含む臨床情報の形であり、各患者についての前記PCOは患者識別情報をその患者についての臨床情報の各履歴情報についての臨床ノードとリンクする、段階と;
前記患者母集団における各患者の履歴活動挙動を入力し、各患者についてのPAOを生成する段階であって、前記履歴活動挙動は、ヘルスケア施設への任意の訪問を同定し、訪問されたヘルスケア施設の型および訪問の日時を含む活動情報の形であり、各患者についての前記PAOは患者識別情報をその患者についての活動情報の各履歴情報についての活動ノードとリンクする、段階と;
患者母集団の諸PCOに対して機械学習を使って、諸患者を前記患者母集団の各患者のPCOに従って、二つ以上の臨床パターンにクラスタリングする段階と;
各臨床パターン内にクラスタリングされた患者母集団の各患者についてのPAOおよびPCOを入力し、機械学習を使って各臨床パターンのモデルを生成する段階であって、前記モデルは、その臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
新規患者の活動挙動を、該新規患者のヘルスケア施設への任意の訪問に関する活動情報の形で入力する段階であって、該活動情報は、訪問されたヘルスケア施設の型および訪問の日時を含む、段階と;
前記新規患者の識別情報を、前記新規患者についての各活動情報についての活動ノードとリンクする、前記新規患者についてのPAOを生成する段階と;
機械学習を使って前記新規患者を前記臨床パターンのうちの一つに分類することを、前記新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と;
前記新規患者が分類された臨床パターンの諸臨床ノードから新規患者の臨床挙動を予測する段階とを含む。
本発明の好ましい実施形態に基づく方法は、装置側面の任意の組み合わせを有することができる。さらなる実施形態に基づく方法またはコンピュータ・プログラムは、処理およびメモリ機能を必要とするという意味でコンピュータ実装されると記述されることができる。
好ましい実施形態に基づく装置は、ある種の機能を実行するよう構成されているもしくは配置されているまたは単にある種の機能を実行するものとして記述される。この構成または配置は、ハードウェアもしくはミドルウェアまたは他の任意の好適なシステムの使用によることができる。好ましい実施形態では、構成または配置はソフトウェアによる。
このように、ある側面によれば、少なくとも一つのコンピュータにロードされたときに、先の装置定義の任意のものまたはその任意の組み合わせに基づくシステムとなるよう該コンピュータを構成するプログラムが提供される。
あるさらなる側面によれば、前記少なくとも一つのコンピュータにロードされたときに、先の方法定義の任意のものまたはその任意の組み合わせに基づく方法段階を実行するよう前記少なくとも一つのコンピュータを構成するプログラムが提供される。
一般に、前記コンピュータは、定義された機能を提供するよう構成されるまたは配置されるものとして列挙される諸要素を有していてもよい。たとえば、このコンピュータは、メモリ、処理およびネットワーク・インターフェースを含んでいてもよい。
本発明は、デジタル電子回路においてまたはコンピュータ・ハードウェア、ファームウェア、ソフトウェアまたはそれらの組み合わせにおいて実装されることができる。本発明は、一つまたは複数のハードウェア・モジュールによる実行のためにまたは一つまたは複数のハードウェア・モジュールの動作を制御するための、コンピュータ・プログラムまたはコンピュータ・プログラム・プロダクト、すなわち非一時的な情報担体において、たとえば機械可読記憶デバイスにおいて、または伝搬される信号において有体に具現されているコンピュータ・プログラムとして実装されることができる。
コンピュータ・プログラムは、スタンドアローンのプログラム、コンピュータ・プログラムの一部分または二つ以上のコンピュータ・プログラムの形であることができ、コンパイルされる言語またはインタープリター言語を含む任意の形のプログラミング言語で書かれることができ、コンピュータ・プログラムは、スタンドアローンのプログラムとして、またはモジュール、コンポーネント、サブルーチンまたはデータ処理環境における使用に好適な他の単位としてなど、任意の形で展開されることができる。コンピュータ・プログラムは、一つのモジュール上で、あるいは一つのサイトにあるまたは複数のサイトを横断して分散され通信ネットワークによって相互接続された複数のモジュール上で実行されるよう展開されることができる。
本発明の方法段階は、入力データに対して作用して出力データを生成することにより本発明の機能を実行するようコンピュータ・プログラムを実行する一つまたは複数のプログラム可能プロセッサによって実行されることができる。本発明の装置は、プログラムされたハードウェアとしてまたは特殊目的論理回路、たとえばFPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)として実装されることができる。
コンピュータ・プログラムの実行に好適なプロセッサは、たとえば、汎用および特殊目的マイクロプロセッサの両方ならびに任意の種類のデジタル・コンピュータの任意の一つまたは複数のプロセッサを含む。一般に、プロセッサは命令およびデータを読み出し専用メモリもしくはランダム・アクセス・メモリまたは両方から受領する。コンピュータの本質的な要素は、命令およびデータを記憶する一つまたは複数のメモリ・デバイスに結合された、命令を実行するためのプロセッサである。
本発明は、具体的な実施形態を用いて記述される。他の実施形態が付属の請求項の範囲内である。たとえば、本発明の段階は、異なる順序で実行され、それでも望ましい結果を達成することができる。オブジェクト指向プログラミング技術を使うことなく、複数の試験スクリプト・バージョンが編集され、単位として呼び出されることができる。たとえば、スクリプト・オブジェクトの要素は構造化データベースまたはファイル・システムにおいて編成されることができ、スクリプト・オブジェクトによって実行されるとして記述されている動作は試験制御プログラムによって実行されることができる。
本発明の要素は、「患者臨床オブジェクト(PCO)エンジン」、「患者活動オブジェクト(PAO)エンジン」、「パターン・マイニング器」および「患者挙動推定器」などの用語を使って記述されてきた。当業者は、そのような機能的な用語およびその等価物が、空間的に離れているが組み合わさって、定義される機能に資するシステムの諸部分を指しうることを理解するであろう。同じく、システムの同じ物理的な部分が、定義される機能の二つ以上を提供してもよい。
たとえば、別個に定義された手段が、適宜同じメモリおよび/またはプロセッサを使って実装されてもよい。
本発明の好ましい特徴についてこれから、付属の図面を参照して純粋に例として述べる。
本発明の一般的な実施形態における主要なシステム・コンポーネントのブロック図である。 一般的な実施形態における方法のフローチャートである。 さらなる実施形態における主要なシステム・コンポーネントのブロック図である。 生物医学的知識グラフ・エンジンのブロック図である。 生物医学的理論的知識グラフの例である。 生物医学的経験的知識グラフの例である。 生物医学的知識グラフの例である。 患者挙動パターン・エンジンのブロック図である。 グラフおよびタイムラインの形でのPCOの例である。 グラフおよびタイムラインの形でのPAOの例である。 臨床パターン・マイニング器の入力および出力のブロック図である。 結果として得られる患者のグループ分けとともに臨床パターン・マイニング器の例を示す図である。 活動パターン・マイニング器の入力および出力のブロック図である。 結果として得られる患者のグループ分けとともに活動パターン・マイニング器の例を示す図である。 患者挙動推定器のブロック図である。 臨床挙動推定器の例を、患者データおよびその出力とともに示す図である。 二つの臨床グループのうちの一方への患者の分類を示す図である。 患者挙動推定器のブロック図である。 二つの活動グループのうちの一方への患者の分類を示す図である。 患者活動データのみを使っての二つの臨床グループのうちの一方への患者の分類を示す図である。 オープンなデータの検索のためのハードウェア構成を示すブロック図である。 発明実施形態の実装のための好適なハードウェアのブロック図である。
発明実施形態は、患者挙動を二つの主要な部分に分ける:
・臨床挙動。これは患者の症状、処置、診断および薬物を含む(処置はこの文脈では薬物を含まず、投薬でない処置、たとえば理学療法、作業療法、カウンセリング、メッセージなどを含むことを注意しておくべきである);
・活動挙動。これは、患者の種々の病院エリア(または他のヘルスケア・エリア)への訪問を含む。
保険会社の例について、保険会社は患者の活動挙動へのアクセスをもつだけであることを述べておくことが重要である。本発明の実施形態は、活動挙動をもつだけで、臨床挙動を予測できる。これは、いくつかの実施形態では、理論的な生物医学的知識グラフ、より重要なことには、該理論的な生物医学的知識グラフの、本物の患者データに基づく経験的な生物医学的知識グラフとの組み合わせを使うことによって、支援される。これらのグラフについては、のちにより詳細に述べる。
また、資源の管理を改善することに関し、限られたデータ・セット(たとえば活動挙動だけ、または臨床挙動だけ)を用いて、ヘルスケア・システム内での患者の次のステップを予測できることが有利である。よって、発明実施形態は、最適でないデータ条件のもとでも機能する。
まとめると、発明実施形態は、
・患者母集団の患者電子健康記録データから挙動(臨床または活動)パターンを識別すること、
・新規患者がいつ識別された挙動(臨床または活動)パターンの一つ(または複数)に分類されうるかを、該新規患者の電子健康記録(EHR)に基づいて予測/推定できるモデルを構築すること、
・それらの挙動の背後にある主要な動因がどれであるかを理解すること(用語「動因」〔ドライバー〕は、その挙動を定義している潜在的な症状、処置、診断および薬物ならびに病院訪問を指す)、
ができる。
発明実施形態は、新規患者についての個別データならびに他の患者からの大量の履歴データに基づいて精密医療を実装する。これは、遺伝子、生理、解剖構造、環境および生活習慣における個々の変動性を考慮に入れる、疾病診断、処置および予防についての台頭しつつあるアプローチである。精密医療は、現在の臨床作業フローを改善し、ヘルスケア・エコシステム内での患者挙動(患者経路としても知られる)を予測するための根本的に異なるアプローチを表わす。
〈背景〉
先述したように、特定の患者がヘルスケア・システム内でどのように振る舞うかを推定および予測することは、病院、医療センターおよび保険会社一般にとって非常に重要である。
患者経路に関連するこれまでの努力は、臨床挙動と活動挙動の間の区別を考慮しない、患者の個々の特徴に焦点を当てない、または患者のこれからの経路/挙動を予測/推定しないものであった。
〈一般的実施形態〉
図1は、一般的な発明実施形態に基づくシステム10のブロック図である。
システムは、患者母集団の各患者についてPCOを――たとえば一つまたは複数の病院からのEHRを使って――生成するPCO(患者臨床オブジェクト)エンジン20を含む。EHRは、臨床データを、症状、処置、診断および薬物の範疇に分類してもよい。この「患者臨床オブジェクト」は、所与の患者についての情報をカプセル化する、諸臨床エンティティの意味的にリッチな(構造化された)集合体である。PCOは患者についての情報、たとえば年齢および性別ならびにその臨床データ、たとえば(1)症状、(2)処置、(3)診断および(4)薬物を含む。
PCOはグラフとして表現されてもよく、そのノードは患者の臨床特徴のそれぞれについて対応するタイムスタンプを含む。すべてのノードは、中心ノードと見なされてもよい患者素性にリンクされる。臨床特徴は、グラフの形でもマトリクス・フォーマットでも他の任意の好適な形式でもよいリレーショナル・データ構造のノードである。
PAOエンジン30は、母集団の各患者についての、種々の病院エリアへの当該患者の病院訪問を対応するタイムスタンプとともに含むPAO(患者活動オブジェクト)を生成する。ここでもまた、PAOはグラフとして表現されてもよく、そのノードは患者の活動特徴のそれぞれについて対応するタイムスタンプを含む。すべてのノードは、中心ノードと見なされてもよい患者素性にリンクされる。活動特徴は、グラフの形でもマトリクス・フォーマットでも他の任意の好適な形式でもよいリレーショナル・データ構造のノードである。
システムは、そのようなPCOおよびPAOの時間的なビュー表現を提供できる。時間的情報のおかげで、システムは、患者母集団についての時間的パターン(たとえば患者臨床パターンおよび/または患者活動パターン)を識別/抽出できる。臨床パターン・マイニング器40は、機械学習、たとえば教師なし機械学習を使って臨床挙動パターンを抽出する。各PCOは、これらのパターンの一つに分類されることができる。
最後に、患者挙動推定器50では、システムは、機械学習を使って、各臨床パターンを含むモデルを生成できる。モデルは、臨床ノードおよび活動ノードをもつパターンから構成される。これは、個別の新規患者(先の母集団の一員ではない)の活動挙動のみが利用可能であるときでさえ、推定器が(症状、処置、診断および薬物の形の)患者臨床挙動を予測/推定することを許容する。
個別の患者は、一つ(または複数)の識別/抽出された患者挙動(臨床および活動)パターンに分類されてもよく、ユーザーは、それらの挙動の背後の主要な動因の指示を(たとえばGUI上で)提供されてもよい。
図2は、一般的な発明実施形態に基づく方法のフローチャートである。患者母集団の各患者について、段階S10においてPCOが生成され、おそらくは並列に段階S20がPAOを生成する。
段階S30では、PCOデータに対して機械学習を使って、患者が臨床パターンに分類される。段階S40では、諸臨床パターンのモデルが、それぞれの臨床パターン内にクラスタリングされた患者からの活動および臨床ノードを使って生成される。段階S50では、個別の新規患者の活動挙動の入力(たとえばGUIを使った手動入力またはシステムによる入力)がある。もちろん、適切であれば、臨床挙動もこの段階で入力されることができる。
段階S60は、機械学習を使って、個別患者の活動挙動(およびもし利用可能なら臨床挙動)をモデル内の諸パターンと比較することによって、個別患者の臨床挙動を予測する。
〈一般的記述〉
以下の詳細な実施形態は、活動挙動から臨床挙動を予測するだけでなく、履歴の活動および/または臨床挙動から将来の活動および/または臨床挙動を予測するなど、いくつもの異なる仕方で使用できるシステムに関する。
本システムは三つの主要なモジュールからなる:
・第一のモジュールは、患者電子健康記録から利用可能な挙動(臨床および活動)パターンを抽出/識別するためのパターン・マイニング器を含む。多くのPCOおよびPAO(それぞれは患者母集団の単一の患者についてのもの)が使用されて、各患者に一つずつで、多くの時間的表現が生成される。次いで、患者は、その臨床挙動(PCO)および/または活動挙動(PAO)の内容に従ってグループに分けられる。
・第二のモジュールは、理論的および経験的知識に基づいて、生物医学的知識グラフを生成するためのものである。生物医学的知識グラフは、健康関係の概念を表現するための知識ベースであり、理論的知識をエンコードしているが、経験的知識で向上されている。生物医学的知識グラフはシステムの結果の正確さを高める。
・第三のモジュールは、個別患者の患者挙動を、該個別患者からのデータならびに挙動(臨床および/または活動)パターンおよび任意的には生物医学的知識グラフから抽出された生物医学的概念関係に基づいて予測/推定するためのものである。
典型的には、ユーザーが一つまたは複数の識別可能な属性(たとえば名前、IDなど)によって個別患者を選択し、クライアント・ソフトウェアによってサポートされている患者挙動機能を立ち上げる。この機能は、可能性のある患者挙動グループのリストを生成してもよい。各グループは、その個別患者がそのグループに関連付けられる確からしさを示す数値、たとえば0から1または0%から100%までの間の重みに関連付けられる。
上記のシステム上で走るソフトウェアは、図3に描かれる三つの主要なモジュールを含む。それらは次のとおり:
患者挙動パターン・エンジン60。これは挙動(臨床および活動)患者パターン110の集合を抽出/識別するという最終的な目標をもつ;
生物医学的知識グラフ・エンジン70。これは、(i)科学的文献および健康標準から抽出された理論的知識および(ii)本物の患者電子健康記録から抽出された経験的知識をエンコードする生物医学的知識グラフ100を構築する;そして
患者挙動推定器50。これは、新規患者ケース120について、識別/抽出された患者挙動パターン110および生物医学的知識グラフ100からの関係を入力として取って、潜在的挙動130を予測/推定する。
患者データ80は、患者挙動パターン・エンジン60および生物医学的知識グラフ・エンジン70の両方において使用されうる。オープンなデータ90が、生物医学的知識グラフ・エンジン70において使うために、下記でより詳細に述べるように、オープンなソースから収集される。臨床担当者の知識が、生物医学的知識グラフ・エンジン70へのもう一つの入力であってもよい。
〈生物医学的知識グラフ・エンジン70〉
このエンジンは、下記のものをエンコードする知識グラフを構築するためのものである。
・科学的医学文献、たとえばPubMed(PubMedは米国国立医学図書館(登録商標)(NLM(登録商標))のサービスであって、MEDLINE(登録商標)への無料アクセスを提供する。MEDLINEは医学、看護、歯科、獣医学、ヘルスケアおよび前臨床課程の科学ジャーナル論文への索引付けされた引用およびアブストラクトのNLMデータベースである)および利用可能な健康標準、たとえばICD9およびICD10(国際疾病分類の第9版および第10版;http://www.icd9data.com/およびhttp://www.icd10data.com/参照)、CHEBI(Chemical Entities of Biological Interest[生物学的に関心のある化学エンティティ];これは分子エンティティのデータベースおよびオントロジーである;https://www.ebi.ac.uk/chebi/参照)、ATC(Anatomical Therapeutic Chemical Classification[解剖学療法化学分類])、SNOMED CT(個人のケアに関係する用語の標準化された多言語語彙)、MESH(MEDLINEのための論文に索引付けするために使われる米国国立医学図書館の統制語彙シソーラス;https://www.nlm.nih.gov/mesh/参照)およびHDO(疾病オントロジー; http://disease-ontology.org/参照)など。
・経験的な証拠からの知識、たとえば患者電子健康記録(PCOおよびPAOを構築するために使われるものと必ずしも同じ母集団でなくてもよい)に基づき、潜在的にはまた臨床ガイドラインおよびプロトコルにも基づく、医学的なエンティティ(症状、処置、診断および薬物)の間のつながり。
図4は、このモジュールの主要なサブコンポーネントを描いている。このモジュールは、それぞれ理論的知識グラフ150および経験的知識グラフ170を提供する別個の理論的知識エンジン140および経験的知識エンジン160をもって構成される。
これらの知識グラフ・エンジンは、いかなる適切な仕方で機能してもよい。これらは、医学用語の初期集合のためのシード(たとえば提案される用語の形のシード)およびシード用語の間の関係を収集するよう構成されていてもよい。ひとたび上記二つの別個の知識グラフが生成されたら、それらが調和されてもよい。これは、広く適用可能であり、よって後続工程のためによりよい品質の、一般的でありかつ実際的に焦点を絞った用語集合を許容する。
生物医学的知識グラフ・エンジンは、二つの知識グラフの間の関係を生成する。
図5は、薬物(図示した二つのサブグラフの左下ノード)、診断(上の二つのノード)および症状(右下ノード)の間の関係を示す理論的知識グラフの抜粋を呈示している。処置ノードはこの抜粋には示されていない。すべての情報は、科学的医学刊行物、ヘルスケア標準および臨床ガイドラインおよびプロトコルから抽出されている。たとえば、グラフにおいて異なる診断がリンクされることがあるが、これは、どちらも刊行された論文に含まれているからである。あるいは、同じ薬物が二つの診断両方のために処方されるために、二つの診断が関係していることがありうる。ノード間のリンクは、データ・セット全体にわたるリンクされる用語の共起に従って重み付けされてもよい。
図6は、薬物(左下ノード)、診断(上の四つのノード)および症状(右下ノード)の間の関係を示す経験的知識グラフの抜粋を呈示している。これらの関係は、そのような証拠をもつ患者の数を表わす。たとえば、「認知症」と「神経症性障害」の間には両方の診断を有していた10人の患者がおり、「血管性認知症」と「ドネペジル」では、「ドネペジル」の投薬を受けた「血管性認知症」の患者が12人いる。
前記抜粋に従って、前記二つのグラフが組み合わされて、図7に描かれるグラフを与える。結果として得られるグラフにおけるリンクは、患者数の詳細のみを示されているが、最終的な重みは、両方の構成要素グラフからの重み付けを組み込むことができる。
〈患者挙動パターン・エンジン60〉
このモジュールは、患者挙動(臨床および活動)パターンを履歴臨床データから識別/抽出する。そのコンポーネントが図8に描かれており、次のとおりである。
患者臨床オブジェクト・エンジン200は、PCO(患者臨床オブジェクト)を構築する。PCOは、健康特徴についての対応するタイムスタンプ(日時)を含む。PCOはグラフとして、またはタイムラインとして、または他の任意の好適な形、たとえばリレーショナル・データ・テーブルで表現できることを注意しておく価値がある。図9は、PCOを二つの異なる表現で描いている。グラフの形は患者情報(ID、性別および年齢を含む)を中心としている。各臨床ノードはこの中心ノードにリンクし、(おそらくはEHRにおける範疇に従って)症状、処置、診断または薬物ノードとして、リンクされた時間t1〜t4を付して範疇分けされる。この簡単な例は四つの臨床ノードを含む。図9の上に示した代替的な表現は時間的表現であり、これは図8の時間的整形器210を使って情報を時間順に構造化する。t1における患者P1についての「心臓動悸」の症状がまず現われ、それにt2、t3、そしてt4において臨床挙動が続く。
患者活動オブジェクト・エンジン300はPAO(患者活動オブジェクト)を構築する。PAOは種々の病院エリアへの患者の病院訪問を、対応するタイムスタンプ(日時)とともに含む。PCOと同様に、PAOはグラフとして、またはタイムラインとして、または他の任意の好適な形、たとえばリレーショナル・データ・テーブルで表現できる。図10は、上記PCOで表現されたのと同じ患者のPAOを二つの異なる表現で描いている。グラフの形は患者情報(ID、性別および年齢を含む)を中心としている。各活動ノードはこの中心ノードにリンクし、病院訪問またはER(緊急治療室)MH(心の健康)もしくは心臓病訪問のような具体的な型の病院訪問として(おそらくはEHRにおける範疇に従って)、リンクされた時間t1〜t4を付して範疇分けされる。この簡単な例は三つの臨床ノードを含む。図10の上に示した代替的な表現は時間的表現であり、これは図8の時間的整形器310を使って情報を時間順に構造化する。t1における患者P1についての病院訪問にt2において心の健康での訪問、t3での心臓病訪問が続く。もちろん、PCOとPAOは組み合わされることができ、患者素性によってリンクされる。
時間的整形器210/310は、情報を時間順に構造化することによって、PCOおよびPAOのグラフ表現を時間的表現に変換する。この表現は、その先のパターン抽出のタスクを容易にする。
臨床パターン・マイニング器40は、患者の集合から患者臨床パターンを抽出/識別する。基本的に、このコンポーネントは、機械学習技法に依拠することによって、患者の臨床パターンの集合を抽出および識別する、すなわち患者臨床特徴に基づいて患者を、同様の患者のクラスターにクラスタリングすることによって、分類する。機械学習は、期待されるパターンの型や数の入力なしに、教師なしでもよい。パターンは、いったん生成されてから、システム・ユーザーによってラベル付けされてもよい。
図11は、臨床パターン・マイニング器・コンポーネントの入力および出力を示している。この図は、患者のリスト(P1……Pn)を、(以前にグラフ表現からタイムライン表現に変換された)そのPCOとともに呈示している。Dxは特定の時刻における特定の症状、診断、処置、薬物などを表わす。臨床患者マイニング器は(この場合)(1)主要な診断として血管性認知症をもつ血管性認知症患者と、(2)主要な診断として抑鬱症をもつ抑鬱症患者の二つの患者グループを識別する。これらの各グループは左側の入力患者の部分集合をもつ。
図12は、より詳細な例であり、各患者についての諸PCOの時間表現を、患者P1ないしP6およびP100000についてのPCOをもって詳細に示している。列はその年または数年のうちの日を示している。
この表において、Dは診断を表わし、Treatは処置を表わす。たとえば、患者ID1をもつ行1は、01/01/2010のD1(診断1)および01/01/2010のDrug2〔薬物2〕を含む。
パターン・マイニング器は、患者の
・症状
・処置
・薬物
・診断
・および上記の頻度を考慮に入れる。
パターン・マイニング器は、教師なし学習に依拠して、上記の情報に基づいて患者のクラスターを生成する。
例として、システムは、「認知症」または「抑鬱症」として患者の二つのクラスター/グループを生成した。これらは挙動パターン、この場合は臨床パターン、たとえば図11にも示した認知症および抑鬱症である。
臨床パターン・マイニング器はこの例では、生物医学的グラフ上の生物医学的エンティティ(症状、薬物、処置、診断および疾病)の間の関係を利用することによって、生物医学的知識グラフからの入力を使う。たとえば、患者PCOを生物医学的知識グラフと比較することは、両方に含まれているノード(エンティティ)(たとえば同じ薬)を明らかにする。PCOのデータは、生物医学的知識グラフにおいてPCOエンティティにリンクされたエンティティを用いて補足されてもよい。たとえば、生物医学的知識グラフからの同じ薬物ノードの近隣のノードが、すでに存在しているのでなければ、PCOに追加されてもよい。より洗練された使用はさらに、リンクの重みおよび/またはPCOのエンティティ/ノードから2リンク以上離れたエンティティを考慮してもよい。
活動パターン・マイニング器320は、患者の集合から患者活動パターンを抽出/識別する。基本的に、このコンポーネントは、機械学習技法に依拠することによって、患者活動パターンの集合を抽出および識別する、すなわち患者を患者臨床特徴に基づいて分類する。図13は、このコンポーネントの入力および出力を示している。この図は、患者のリスト(P1……Pn)を、(以前にグラフ表現からタイムライン表現に変換された)そのPAOとともに呈示している。各HUxは病院ユニットを表わす。活動患者マイニング器は(この場合)過少(hypo)グループおよび過多(hyper)グループの二つの患者グループを識別する。これらの各グループは左側の入力患者の部分集合をもつ。
たとえば、本コンポーネントは、(1)過少〔低頻度〕訪問者、つまり病院訪問数が少ない患者と、(2)過多〔高頻度〕訪問者、つまり病院訪問数が多い患者との二つの患者グループを抽出/識別することができる。機械学習は、期待されるパターンの型や数についての入力がなく、教師なしであってもよい。パターンは、ひとたび生成されたら、システム・ユーザーによってラベル付けされてもよい。
患者の集合からの単一の患者の、グループ分けされたPCOとPAOは、いまだリンクされていることを注意しておくべきである。
このコンポーネントの帰結は、活動および臨床特徴について、提案される一つまたは複数のグループに分類された、ある医療機関の患者のリストをもつ、クラスタリングされた表である。分類ラベルの数に関し、あらかじめ固定された数がないことを強調しておく必要がある。この場合には二つ(活動特徴についての過多〔高頻度〕および過少〔低頻度〕)があるが、調べるべきパターン挙動に依存して、もっとあってもよく、それぞれの場合について臨床/活動パターン・マイニング器を適応させる。この帰結は、新規患者の潜在的な挙動を分類するためのパターンとして使われる。
図14は、より詳細な例であり、各患者についてのPAOの時間表現を、患者P1ないしP6およびP100000についてのPAOをもって詳細に示している。列はその年または数年のうちの日を示している。
たとえば、行1は患者ID1を含み、01/01/2010に病院ユニットHU1への病院訪問がある。
パターン・マイニング器は、患者の、
・訪問数
・どの病院ユニットか
・訪問の頻度
を考慮に入れる。
パターン・マイニング器は、教師なし学習技法に依拠して、上記情報に従って患者の諸クラスターを生成する。例として、「過少」または「過多」の二つの患者クラスター/グループがある。これらは挙動パターン、この場合、活動パターン、たとえば図13に示される過少および過多である。
活動パターン・マイニング器は、生物医学的知識グラフに依拠しない。
〈患者挙動推定器50〉
最後に、システムは、患者がいつ一つ(または複数の)識別/抽出された挙動(臨床および活動)パターンに分類されることができるかを予測/推定し、どれがそれらの挙動パターンの背後にある主要な動因(根底にあるノード)であるかを提供することができる。
新規の個別患者が評価されるとき、推定器は、すでに識別されたグループ(パターン)のどれに新規患者が当てはまるかを予測する。推定器は、どの特徴/動因が(どの診断、処置、薬物などが)、新規患者をそのグループに分類することを許容するものであるかをも出力する。
図15は、このモジュールのフローおよび主要コンポーネントを描いている。モジュールはまず、患者電子健康記録に関係したすべての情報を含む患者ケース330を取得し、PCOおよびPAOを、その時間的表現とともに生成する(たとえば図示していないPAOおよびPCOエンジン200/300を使って)。次に、機械学習コンポーネント400におけるマルチラベル機械学習または深層学習技法に依拠することによって、本コンポーネントは新規患者を、すでに識別されている挙動(臨床および活動)パターンの一つに分類する。出力は、一つまたは複数の潜在的な患者挙動グループ130の集合であり、各グループは、のちにより詳細に説明するように、重みと関連付けられている。
機械学習分類器は、ランダム・フォレスト分類器であることができる。一つの分類器が、臨床分類器および活動分類器の両方のはたらきをしてもよく、あるいは異なる分類器が使われてもよい。
図16は、臨床挙動推定器の例を、患者データおよびその出力とともに、分類器を使って示している。臨床挙動推定器は入力として:
・諸患者の、結果的な諸グループ(この例では臨床パターン・マイニング器から)
・挙動活動を予測すべき新規患者
を取る。
この目的に向け、各患者についての臨床および活動挙動をもつ行列〔マトリクス〕(またはPAOおよびPCOについての他のデータ構造)が使われる。これは、(臨床パターン・マイニング器から抽出された)臨床グループについての列を含む。行列のヘッダは患者IDと、すべての処置、診断、薬物および症状ならびに病院訪問およびその患者についての臨床グループとに対応する。
この例では、患者ID 1は診断D1およびDnおよびDrug1〔薬物1〕ならびに病院訪問HU1をもち、その患者は「認知症」グループに含まれるとして識別された。
次に、機械/深層学習分類器が、各パターンについての生物医学的エンティティに重みを割り当てるグラフまたは他のリレーショナル・データ構造の形で、モデルを生成する。ちなみに、同じエンティティが複数の異なるパターンに分類されて、あるパターンにおいてある重み(たとえば0.3)をもち、第二のパターンにおいて異なる重み(たとえば0.7)をもつことができる。モデルは、識別された臨床グループについてどの生物医学的エンティティが重要であるかをカプセル化する。この例では、「血管性認知症」が認知症グループ内で0.7の重みをもつ。これはたとえば、母集団中で、このグループに分類され血管性認知症をもつ患者の、患者総数に対する比率を示す。モデルはまた、同じ比の方法論を使って活動の諸要素をも含む。たとえば、「n回より多いER訪問」は認知症グループ内で0.7の重みをもつ。
機械/深層学習分類器は生物医学的知識グラフに依拠し、先に説明したように、臨床データを補足するために、生物医学的知識グラフ上の生物医学的エンティティ(症状、薬物、処置、診断、疾病)の間の関係を使うことを述べておくことは価値がある。
図17は、臨床パターン・マイニング器によって識別された二つの患者臨床パターン(すなわち、認知症および抑鬱症の患者特徴)のうちの一方への患者の分類を示している。ひとたび生物医学的エンティティに重みを割り当てる前記モデルにおけるパターンがあれば、前記モデルは、識別された臨床グループについてどの生物医学的エンティティが重要であるかをカプセル化し、こうして「血管性認知症」の診断をもつ患者は認知症患者として分類される0.7の確率をもつ。同じく、「パニック」症状をもつ患者は、抑鬱症のある患者として分類される0.75の確率をもつ。
本システムは、新規患者の潜在的な臨床挙動を、新規患者のPCOデータの前記二つのパターンのノードとの比較を使って、予測することができる。本システムは、患者活動データをも考慮に入れてもよい。
図18は、活動挙動推定器の例を、患者データおよびその出力とともに、分類器を使って示している。活動挙動推定器は入力として:
・諸患者の、結果的な諸グループ(この例では活動パターン・マイニング器から)
・挙動活動を予測すべき新規患者
を取る。
この目的に向け、各患者についての臨床および活動挙動をもつ行列(または他のリレーショナル・データ構造)が使われる。これは、(活動パターン・マイニング器から抽出された)活動グループについての列を含む。
行列のヘッダは患者IDと、すべての処置、診断、薬物および症状ならびに活動および各患者についての活動グループとに対応する。
この例では、患者ID 1はD1、Dn、Drug1ならびに病院訪問HU1をもち、その患者は「過少〔低頻度〕」として識別された。
次に、機械/深層学習分類器が、生物医学的エンティティに重みを割り当てるグラフまたは他のリレーショナル・データ構造の形で、モデルを生成する。モデルは、先に説明した比を使って、識別された活動グループについてどの生物医学的エンティティが重要であるかをカプセル化する。この例では、「血管性認知症」が過少グループ内で0.7の重みをもつ。モデルはまた、活動の諸要素をも含む。たとえば、「n回未満」は過少グループ内で0.7の重みをもつ。
ここでもまた、機械/深層学習分類器は生物医学的知識グラフに依拠し、データを補足するために、生物医学的知識グラフ上の生物医学的エンティティ(症状、薬物、処置、診断、疾病)の間の関係を使う。
図19は、二つの活動グループ/患者活動パターン、すなわち、過少訪問者および過多訪問者のうちの一方への患者の分類を示している。ひとたび各パターンについて生物医学的エンティティに重みを割り当てる前記モデルがあれば、前記モデルは、識別された活動グループについてどの生物医学的エンティティが重要であるかをカプセル化する。この例では、「血管性認知症」は過少グループ内で0.7の重みをもつ。過少と過多は単にパターン・マイニング器によって識別されるパターン/グループの例であり、これらのパターンは、確率を伴うノードからなる特徴(動因)を含む。
本システムは、新規患者の潜在的な活動挙動を、新規患者のPAOデータの前記二つのパターンのノードとの比較を使って、予測することもできる。本システムは、患者臨床データがあればそれも考慮に入れてもよい。
図20は、患者活動データのみを使って、患者を二つの臨床グループ、すなわち痴呆症および抑鬱症の一方に分類することを示している。これは、発明実施形態の基礎になる概念である。本システムは、新規患者の活動挙動のみを使って新規患者の臨床挙動を予測できる。
ひとたび生物医学的エンティティに重みを割り当てるモデルが生成されたとき、モデルは、識別された臨床グループについてどの生物医学的エンティティが重要であるかをカプセル化する。これら二つのグループのうちで、生物医学的知識グラフからの健康概念を、その関係の間に識別することができ、生物医学的知識グラフが該データを補足するために使われた。この例では、「血管性認知症」が認知症グループ内で0.7の重みをもつ。だが、認知症グループ内には0.7の重みをもつ「ER訪問>n」もある。このように、新規患者の潜在的な「臨床挙動」を、患者の活動挙動のみを用いて予測することが可能である。例示の目的で、この新規患者は、心の健康およびERの訪問をもつが心の健康での訪問のほうが確率が高い(0.75)ので、抑鬱症グループに分類される。この場合、新規患者をパターンにマッチさせるために、活動ノードのみが利用可能である。
もちろん、これらは簡略化された例であり、患者母集団についての全データや新規患者についての全データを示すものではない。全データはずっと複雑なものである可能性が高い。
深層/機械学習分類器からの、結果として得られるモデルは、できるだけ多くの患者データを供給される必要がある。母集団における患者数が多いほど、予測はよくなるであろう。
患者挙動推定器は、いくつかの予測器によって生成される予測を整理および処理することによって予測を行なうメタ予測器であり、ハイブリッド/複合予測器としても知られる。個々の予測器は、モデルにおいて識別された諸パターンから関連する諸特徴についての情報を取る。すなわち、新規患者は、そのパターンにおける諸活動ノードにマッチするその諸活動ノードを使って、パターンに分類される。パターン中のマッチするノード(単数または複数)は、ある個別の予測器において使われ、すべてのマッチするノードについての確率が組み合わされて、そのパターンへの分類の全体的な確率を与える。
別の言い方をすると、患者がそのパターン(よってその分類)に含まれる確率が、そのパターンおよび患者データ両方にあるすべてのノードの確率を見ることによって、計算される。よって、たとえば図20において、機能できる唯一の予測器は、病院訪問に基づくものである。他の状況については、より多くの予測器が活躍することになる。
利用可能な個々の予測器は次のとおり。
・診断に基づく予測器。この場合、予測は患者の診断をチェックおよび吟味し、パターンにおいてマッチする診断ノードがあればその確率を利用することによってなされる。
・患者が服用していた薬物に基づく予測器。パターンにおいてマッチする薬物ノードがあればその確率を利用する。
・患者の症状に基づく予測器。パターンにおいてマッチする症状ノードがあればその確率を利用する。
・患者が受けている処置に基づく予測器。パターンにおいてマッチする処置ノードがあればその確率を利用する。
・患者の病院訪問に基づく予測器。パターンにおいてマッチする訪問ノードがあればその確率を利用する。これらの病院訪問は時間を経てのいくつかの病院に関係している。
メタ予測器コンポーネントは、よりよい予測性能を提供するために、(利用可能な場合に)個々の予測器を組み合わせる。この目的に向け、コンポーネントは、それぞれの予測器に与えられた重みを調整してもよい。次式:
Hypoj=WdPd+WdrPdr+WsPs+WtPt+WvPv
において、
Hypojは患者jが過少訪問者(hypo-frequenter)の挙動をもつ確率であり、
Wdは患者診断(diagnosis)に基づく、予測器への割り当てられた重みであり、
Pdは診断に基づく予測であり、
Wdrは患者が服用していた薬物(drugs)に基づく予測器への割り当てられた重みであり、
Pdrは患者が服用していた薬物に基づく予測であり、
Wsは患者の症状(symptoms)に基づく予測器への割り当てられた重みであり、
Psは患者の症状に基づく予測であり、
Wtは患者の処置(treatments)に基づく予測器への割り当てられた重みであり、
Ptは患者の処置に基づく予測であり、
Wvは患者の訪問(visits)数に基づく予測器への割り当てられた重みであり(異なる型の訪問については異なるノードがあってもよい)、
Pvは患者の訪問数に基づく予測である(ここでも、異なる型の訪問があってもよい)。
これらの割り当てられた重みWは、諸ノードに割り当てられる重みである。
範疇当たり二つ以上のノードがある場合、ノード確率は平均されてもよい。重みは、異なる範疇の重要性に従って、たとえば臨床挙動に対して活動挙動を強調する、または逆に活動挙動に対して臨床挙動を強調するよう、調整されてもよい。
本発明の全体的な出力は、新規患者が、その臨床挙動または活動挙動に基づいて、(患者パターン・マイニング器からの以前に識別された諸グループ/パターンのうちの)あるグループに分類されることができるかどうかについての判断と、それに伴う、マッチするノードの重みに基づく、新規患者のPAO/PCOが識別されたグループにどのくらいよくマッチするかの指標である。
〈恩恵〉
・簡単に言うと、特定の患者の臨床および活動挙動を推定することは、その患者の処置のためによりよい資源を割り当てることとともに、健康資源のよりよい管理の助けになる。
・本発明の実施形態は、活動挙動だけをもつことによって、臨床挙動を予測することができる。
・本発明の実施形態は、理論的生物医学的知識グラフの使用、そしてより重要なことに本物の患者データに基づく経験的生物医学的知識グラフの使用により、高い正確さをもちうる。
発明実施形態のいくつかの要素は次のとおり。
・理論的および経験的知識をエンコードする生物医学的知識グラフ
・臨床特徴のタイムスタンプを含む、向上された患者臨床オブジェクト
・時間を追っての病院訪問および病院ユニットをエンコードする患者活動オブジェクト
・グラフ表現を時間的表現に変換できるコンポーネントである時間的整形器
・臨床パターン・マイニング器
・活動パターン・マイニング器
・臨床および活動患者挙動を含む患者挙動推定器。
〈ハードウェア〉
図21に示されるデータ検索のためのシステムは、それぞれ特定の型のデータのデータ処理を受け持つ諸コンピュータ(たとえばPUBMED4、ATC5、ICD96、ICD107、SNOMED8などといった医学文献の処理専用のコンピュータ/サーバー)のネットワークを含んでいてもよい。そのような専用のコンピュータは、物理的に別個であっても、あるいは共有される物理的な機械で走る仮想サーバーとして提供されてもよい。データは、該サーバー/コンピュータ上でローカルに記憶されてもよく、クライアント機械のユーザー・インターフェースUIを通じて本システムにアクセスするユーザーによって問い合わせされてもよい。
図22は、本発明を具現し、発明実施形態に従って臨床挙動を予測する方法を実装するために使用されうる、データ記憶サーバーのようなコンピューティング装置のブロック図である。本コンピューティング装置はプロセッサ993およびメモリ994を有する。任意的に、本コンピューティング装置は、他のコンピューティング装置との、たとえば発明実施形態の他のそのようなコンピューティング装置との通信のためのネットワーク・インターフェース997をも含む。
本コンピューティング装置は図21に示したサーバーの一つであってもよく、あるいは別個の装置であってもよい。たとえば、ある実施形態は、そのようなコンピューティング装置のネットワークから構成されてもよい。任意的に、本コンピューティング装置は、キーボードおよびマウスのような一つまたは複数の入力機構996と、一つまたは複数のモニタのようなディスプレイ・ユニット995とを含む。コンポーネントはバス992を介して互いに接続可能である。
メモリ994はPCOおよびPAOを記憶し、図3に示した完成された生物医学的知識グラフ100ならびに該生物医学的知識グラフを構築するために使われた経験的知識グラフおよび理論的知識グラフを記憶してもよい。PCO/PAOの分類のような中間結果をも記憶してもよい。メモリはコンピュータ可読媒体を含んでいてもよい。この用語は、コンピュータ実行可能命令を担持するまたはデータ構造が記憶されるよう構成された単一の媒体または複数の媒体(たとえば、中央集中式または分散式のデータベースおよび/または付随するキャッシュおよびサーバー)を指しうる。コンピュータ実行可能命令はたとえば、汎用コンピュータ、特殊目的コンピュータまたは特殊目的処理装置(たとえば一つまたは複数のプロセッサ)によってアクセス可能であり、それに一つまたは複数の機能または動作を実行させる命令およびデータを含んでいてもよい。よって、用語「コンピュータ可読記憶媒体」は、機械による実行のための一組の命令を記憶、エンコードまたは担持することができ、機械に本開示の方法の任意の一つまたは複数を実行させるいかなる媒体をも含みうる。よって、用語「コンピュータ可読記憶媒体」は、半導体メモリ、光学式メディアおよび磁気メディアを含むがそれに限られないものと解釈されうる。限定ではなく例として、そのようなコンピュータ可読媒体は、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、電気的に消去可能なプログラム可能型読み出し専用メモリ(EEPROM)、コンパクトディスク読み出し専用メモリ(CD-ROM)または他の光ディスク記憶、磁気ディスク記憶または他の磁気記憶デバイス、フラッシュ・メモリ・デバイス(たとえば半導体メモリ・デバイス)を含む非一時的なコンピュータ可読記憶媒体を含みうる。
プロセッサ993はコンピューティング装置を制御し、処理動作を実行する、たとえば本稿および請求項において記載されているモジュールのさまざまな異なる機能を実装するためにメモリに記憶されているコードを実行するよう構成されている。そのようなモジュールは、患者臨床オブジェクト(PCO)エンジン、患者活動オブジェクト(PAO)エンジン、パターン・マイニング器(単数または複数)および患者挙動推定器を含む。メモリ994は、プロセッサ993によって読まれ、書かれるデータ、たとえば入力(たとえば、PCOおよびPAO、理論的および経験的な医療データおよび患者データ)を記憶する。本稿で言うところでは、プロセッサは、マイクロプロセッサ、中央処理ユニットなどといった一つまたは複数の汎用処理装置を含みうる。プロセッサは、複雑命令セット・コンピューティング(CISC)マイクロプロセッサ、縮小命令セット・コンピューティング(RISC)マイクロプロセッサ、超長命令語(VLIW: very long instruction word)マイクロプロセッサまたは他の命令セットを実装するプロセッサまたは命令セットの組み合わせを実装する諸プロセッサを含みうる。プロセッサは、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、ネットワーク・プロセッサなどといった一つまたは複数の特殊目的処理装置をも含みうる。一つまたは複数の実施形態では、プロセッサは、本稿で論じられる動作および段階を実行するための命令を実行するよう構成される。
ディスプレイ・ユニット995は、コンピューティング装置によって記憶されているデータの表現を表示してもよく、カーソルおよびダイアログ・ボックスならびにスクリーンをも表示してもよく、ユーザーとコンピューティング装置に記憶されているプログラムおよびデータとの間の対話を可能にしうる。入力機構996はユーザーがデータおよび命令をコンピューティング装置に入力できるようにする。たとえば、ユーザーは、個別の患者の指標を入力してもよく、これはその個人のデータの検索およびその個人の臨床もしくは活動パターンへの分類ならびにそのような分類に関連付けられた確率の生成を促してもよい。
ネットワーク・インターフェース(ネットワークI/F)997は、オープンなデータおよび潜在的には図1に示されるような経験的データおよび個別患者データおよび患者母集団データの取得のために、インターネットのようなネットワークに接続されてもよく、該ネットワークを介して他のそのようなコンピューティング装置に接続可能である。ネットワークI/F 997はネットワークを介した他の装置との間のデータ入出力を制御しうる。マイクロフォン、スピーカー、プリンター、電源ユニット、ファン、ケース、スキャナ、トラックボールなどといった他の周辺装置がコンピューティング装置に含まれていてもよい。
患者臨床オブジェクト(PCO)エンジン20は、メモリ994の一部に記憶された処理命令を有していてもよく、プロセッサ993は該処理命令を実行してPCOを構築してもよく、前記メモリ994の一部が、前記処理命令の実行中に、入力の患者母集団臨床データおよび結果として得られるPCOデータを記憶してもよい。患者臨床オブジェクト(PCO)エンジンの出力は、それぞれの完成されたPCOの形で、メモリ994および/または接続された記憶ユニットに記憶されてもよい。
患者活動オブジェクト(PAO)エンジン30は、メモリ994の一部に記憶された処理命令を有していてもよく、プロセッサ993は該処理命令を実行してPAOを構築してもよく、前記メモリ994の一部が、前記処理命令の実行中に、入力の患者母集団活動データおよび結果として得られるPAOデータを記憶してもよい。患者臨床オブジェクト(PAO)エンジンの出力は、それぞれの完成されたPAOの形で、メモリ994および/または接続された記憶ユニットに記憶されてもよい。
パターン・マイニング器(単数または複数)40、320はそれぞれ、メモリ994の一部に記憶された処理命令を有していてもよく、プロセッサ993が該処理命令を実行する。前記メモリ994の一部が、前記処理命令の実行中に、(PCOおよび/またはPAOの形の)入力データおよび結果データ(諸患者の臨床もしくは活動パターンへのグループ分け)を記憶してもよい。パターン・マイニング器およびフルの患者挙動パターン・エンジン60の出力(諸患者の臨床または活動パターンへのグループ分け)が、メモリ994および/または接続された記憶ユニットに記憶されてもよい。
患者挙動推定器50は、メモリ994の一部に記憶された処理命令を有していてもよく、プロセッサ993が該処理命令を実行する。前記メモリ994の一部が、前記処理命令の実行中に、入力データ(患者データおよびグループ分け)および結果データを記憶してもよい。分類器400によって生成された、個別/新規患者のあるグループへの分類および関連する確率という形の患者挙動推定器の出力が、メモリ994および/または接続された記憶ユニットに記憶されてもよい。
本発明を具現する方法は、図22に示されるようなコンピューティング装置で実行されてもよい。そのようなコンピューティング装置は図22に示されるすべてのコンポーネントを有する必要はなく、それらのコンポーネントの部分集合から構成されていてもよい。本発明を具現する方法は、一つまたは複数のデータ記憶サーバーとネットワークを介して通信する単一のコンピューティング装置によって実行されてもよい。該コンピューティング装置は、上記で論じたようなモジュールの結果データを記憶するデータ記憶そのものであってもよい。
本発明を具現する方法は、互いと協働して動作する複数のコンピューティング装置によって実行されてもよい。前記複数のコンピューティング装置の一つまたは複数は、結果データの少なくとも一部を記憶するデータ記憶サーバーであってもよい。
〈使用される技術用語の簡単な説明〉
患者挙動/経路(patient behaviour/pathway):病院との最初の接触から紹介を通じて処置/治療の完了まで患者がたどるルート。経路は、入院または治療センターから退院/放免までの期間をもカバーする。これは、診察、診断、処置/治療、投薬、食餌、評価、教授および病院からの退院/放免を含む、処置に関係するすべてのイベントが入力されることのできるタイムラインである。
診断(diagnosis):検査によって、疾病状態の性質および状況を、その徴候および症状から判定するプロセス。
医療処置(medical treatment):患者の管理およびケア。これは、看護、心理学的介入および専門家の心の健康のリハビリテーションを含む。
薬物(drugs):疾病の症状を治療または予防または軽減する物質。
機械学習(machine learning):「明示的にプログラムされることなく学習する能力をコンピュータに与える」コンピュータ科学の一分野。これは、データから学習し、データについて予測することができるアルゴリズムの研究および構築を探求する。
深層学習(deep learning):データにおける高レベルの抽象化をモデル化しようとする一組のアルゴリズムに基づく、機械学習の分科。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
新規患者の臨床挙動を予測するよう構成された、プロセッサおよびメモリを有するシステムであって、前記プロセッサは:
患者母集団における各患者の履歴臨床挙動を受け入れ、各患者について前記メモリに記憶されるPCOを生成する患者臨床オブジェクト(PCO)エンジンであって、前記履歴臨床挙動は、症状、処置、診断および薬物があればそれを同定し、該症状、処置、診断または薬物の日付を含む臨床情報の形であり、各患者についての前記PCOは、患者識別情報をその患者についての臨床情報の各履歴情報についての臨床ノードとリンクする、PCOエンジンと;
前記患者母集団における各患者の履歴活動挙動を入力し、各患者について前記メモリに記憶されるPAOを生成する患者活動オブジェクト(PAO)エンジンであって、前記履歴活動挙動は、ヘルスケア施設への訪問があればそれを同定し、訪問されたヘルスケア施設の型および訪問の日付を含む活動情報の形であり、各患者についての前記PAOは、患者識別情報をその患者についての活動情報の各履歴情報についての活動ノードとリンクする、PAOエンジンと;
前記メモリに記憶された患者母集団の諸PCOに対して機械学習を使って、諸患者を前記患者母集団の各患者のPCOに従って、二つ以上の臨床パターンにクラスタリングする臨床パターン・マイニング器と;
患者挙動推定器とを提供するよう構成されており、前記患者挙動推定器は:
前記メモリから、各臨床パターン内にクラスタリングされた前記患者母集団の各患者についてのPAOおよびPCOを入力し、機械学習を使って前記臨床パターンのモデルを生成する段階であって、前記モデルは、各臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
新規患者の活動挙動を、該新規患者のヘルスケア施設への訪問があればそれに関する活動情報の形で入力する段階であって、該活動情報は、訪問されたヘルスケア施設の型および訪問の日付を含む、段階と;
前記新規患者の識別情報を、前記新規患者についての各活動情報についての活動ノードとリンクさせる、前記新規患者についてのPAOを生成する段階と;
機械学習を使って前記新規患者を前記臨床パターンのうちの一つに分類することを、前記新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と;
前記新規患者が分類された臨床パターンの諸臨床ノードから、新規患者臨床挙動を予測する段階とを実行するものである、
システム。
(付記2)
前記臨床パターン・マイニング器は:
生物医学的知識グラフを使うよう構成されており、前記生物医学的知識グラフは、理論的および経験的知識から取られた、症状、薬物、処置、診断および疾病ならびにそれらの症状、薬物、処置、診断および疾病の間のリンクを含む、
付記1記載のシステム。
(付記3)
前記臨床パターン・マイニング器は:
患者PCO上のノードを補足して、前記生物医学的知識グラフから取られた追加的な臨床ノードを含む補足されたPCOを提供するよう構成されており、この補足は、前記生物医学的知識グラフと前記PCOの両方にすでに存在するPCOノードに、前記生物医学的知識グラフからの近隣ノードを追加することによってなされる、
付記2記載のシステム。
(付記4)
前記患者挙動推定器は、各臨床パターン内にクラスタリングされた前記患者母集団の各患者について前記追加的な臨床ノードを入力するよう構成されており、各臨床パターンは、その臨床パターン内にクラスタリングされる患者からの追加的な臨床ノードを含む、
付記2または3記載のシステム。
(付記5)
前記患者挙動推定器は:
臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードのそれぞれに、そのノードを含み、そのパターン内にクラスタリングされている前記母集団内の患者の比率から導出されるノード重みをラベル付けするよう構成されている、
付記1ないし4のうちいずれか一項記載のシステム。
(付記6)
前記患者挙動推定器は:
そのパターン内に分類されることの複合確率を導出するために、新規患者PAO内に含まれるそのパターンの諸ノードについての重みを使うよう構成されたメタ予測器を含む、
付記5記載のシステム。
(付記7)
前記複合確率は、諸ノードを診断、薬物、症状、処置および訪問に範疇分けすることによって、かつ各範疇の寄与に、その範疇についての割り当てられた重みにより重み付けすることによって、導出される、
付記6記載のシステム。
(付記8)
患者母集団の諸PAOに対する機械学習を使って、諸患者を、患者母集団の各患者のPAOに従って二つ以上の活動パターンにクラスタリングする、活動パターン・マイニング器をさらに有しており、
前記患者挙動推定器はさらに:
機械学習を使って活動パターンのモデルを生成する段階であって、前記モデルは各活動パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
機械学習を使って新規患者を活動パターンの一つに分類することを、新規患者のPAO内の活動ノードをパターン内の活動ノードと比較することによって行なう段階と;
新規患者が分類されたパターンの活動ノードから新規患者の活動挙動を予測する段階とを実行するよう構成されている、
付記1ないし7のうちいずれか一項記載のシステム。
(付記9)
前記患者挙動推定器はさらに:
新規患者の臨床挙動を入力する段階であって、前記臨床挙動は、症状、処置、診断および薬物があればそれを同定し、該症状、処置、診断または薬物の日付を含む臨床情報の形である、段階と;
前記新規患者の識別情報を前記新規患者についての各臨床情報についての臨床ノードとリンクする、前記新規患者についてのPCOを生成する段階と:
さらに、前記新規患者のPCOの臨床ノードを使って、前記新規患者をあるパターンに分類することを、前記新規患者のPCOにおける臨床ノードをパターン内の臨床ノードとさらに比較することによって、行なう段階とを実行するよう構成されている、
付記1ないし8のうちいずれか一項記載のシステム。
(付記10)
前記メタ予測器がさらに:
前記新規患者のPCO内に含まれるパターンの諸ノードについてのノード重みを使って、パターン内への分類の前記複合確率を導出するよう構成されている、
付記9記載のシステム。
(付記11)
新規患者の臨床挙動を予測するコンピュータ実装される方法であって:
患者母集団における各患者の履歴臨床挙動を入力し、各患者についてのPCOを生成する段階であって、前記履歴臨床挙動は、症状、処置、診断および薬物があればそれを同定し、該症状、処置、診断または薬物の日付を含む臨床情報の形であり、各患者についての前記PCOは患者識別情報をその患者についての臨床情報の各履歴情報についての臨床ノードとリンクする、段階と;
前記患者母集団における各患者の履歴活動挙動を入力し、各患者についてのPAOを生成する段階であって、前記履歴活動挙動は、ヘルスケア施設への訪問があればそれを同定し、訪問されたヘルスケア施設の型および訪問の日付を含む活動情報の形であり、各患者についての前記PAOは患者識別情報をその患者についての活動情報の各履歴情報についての活動ノードとリンクする、段階と;
患者母集団の諸PCOに対して機械学習を使って、諸患者を前記患者母集団の各患者のPCOに従って、二つ以上の臨床パターンにクラスタリングする段階と;
各臨床パターン内にクラスタリングされた患者母集団の各患者についてのPAOおよびPCOを入力し、機械学習を使って各臨床パターンのモデルを生成する段階であって、前記モデルは、その臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
新規患者の活動挙動を、該新規患者のヘルスケア施設への訪問があればそれに関する活動情報の形で入力する段階であって、該活動情報は、訪問されたヘルスケア施設の型および訪問の日付を含む、段階と;
前記新規患者の識別情報を、前記新規患者についての各活動情報についての活動ノードとリンクする、前記新規患者についてのPAOを生成する段階と;
機械学習を使って前記新規患者を前記臨床パターンのうちの一つに分類することを、前記新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と;
前記新規患者が分類された臨床パターンの諸臨床ノードから新規患者の臨床挙動を予測する段階とを含む
方法。
(付記12)
コンピューティング装置上で実行されたときに付記11記載の方法を実行するコンピュータ・プログラム。
(付記13)
付記12記載のコンピュータ・プログラムを記憶している非一時的なコンピュータ可読媒体。
10 システム
20 PCOエンジン
30 PAOエンジン
40 臨床パターン・マイニング器
50 患者挙動推定器
60 患者挙動パターン・エンジン
80 患者データ
90 オープンなデータ
100 生物医学的知識グラフ
110 患者挙動パターン
120 患者ケース
130 患者挙動
140 理論的知識エンジン
150 理論的知識グラフ
160 経験的知識エンジン
170 経験的知識グラフ
200 患者臨床オブジェクト・エンジン
210 時間的整形器
300 患者活動オブジェクト・エンジン
310 時間的整形器
320 活動パターン・マイナー

S10 PCOを生成
S20 PAOを生成
S30 PCOに対して機械学習を使って、臨床パターンに分類
S40 臨床パターン内にクラスタリングされた患者からの活動および臨床ノードを使って、各臨床パターンのモデルを生成
S50 個別患者の活動挙動の入力
S60 機械学習を使って、個別患者の活動挙動を諸パターンと比較することによって、個別患者の臨床挙動を予測

Claims (13)

  1. 新規患者の臨床挙動を予測するよう構成された、プロセッサおよびメモリを有するシステムであって、前記プロセッサは:
    患者母集団における各患者の履歴臨床挙動を受け入れ、各患者について前記メモリに記憶されるPCOを生成する患者臨床オブジェクト(PCO)エンジンであって、前記履歴臨床挙動は、症状、処置、診断および薬物があればそれを同定し、該症状、処置、診断または薬物の日付を含む臨床情報の形であり、各患者についての前記PCOは、患者識別情報をその患者についての臨床情報の各履歴情報についての臨床ノードとリンクする、PCOエンジンと;
    前記患者母集団における各患者の履歴活動挙動を入力し、各患者について前記メモリに記憶されるPAOを生成する患者活動オブジェクト(PAO)エンジンであって、前記履歴活動挙動は、ヘルスケア施設への訪問があればそれを同定し、訪問されたヘルスケア施設の型および訪問の日付を含む活動情報の形であり、各患者についての前記PAOは、患者識別情報をその患者についての活動情報の各履歴情報についての活動ノードとリンクする、PAOエンジンと;
    前記メモリに記憶された患者母集団の諸PCOに対して機械学習を使って、諸患者を前記患者母集団の各患者のPCOに従って、二つ以上の臨床パターンにクラスタリングする臨床パターン・マイニング器と;
    患者挙動推定器とを提供するよう構成されており、前記患者挙動推定器は:
    前記メモリから、各臨床パターン内にクラスタリングされた前記患者母集団の各患者についてのPAOおよびPCOを入力し、機械学習を使って前記臨床パターンのモデルを生成する段階であって、前記モデルは、各臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
    新規患者の活動挙動を、該新規患者のヘルスケア施設への訪問があればそれに関する活動情報の形で入力する段階であって、該活動情報は、訪問されたヘルスケア施設の型および訪問の日付を含む、段階と;
    前記新規患者の識別情報を、前記新規患者についての各活動情報についての活動ノードとリンクさせる、前記新規患者についてのPAOを生成する段階と;
    機械学習を使って前記新規患者を前記臨床パターンのうちの一つに分類することを、前記新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と;
    前記新規患者が分類された臨床パターンの諸臨床ノードから、新規患者臨床挙動を予測する段階とを実行するものである、
    システム。
  2. 前記臨床パターン・マイニング器は:
    生物医学的知識グラフを使うよう構成されており、前記生物医学的知識グラフは、理論的および経験的知識から取られた、症状、薬物、処置、診断および疾病ならびにそれらの症状、薬物、処置、診断および疾病の間のリンクを含む、
    請求項1記載のシステム。
  3. 前記臨床パターン・マイニング器は:
    患者PCO上のノードを補足して、前記生物医学的知識グラフから取られた追加的な臨床ノードを含む補足されたPCOを提供するよう構成されており、この補足は、前記生物医学的知識グラフと前記PCOの両方にすでに存在するPCOノードに、前記生物医学的知識グラフからの近隣ノードを追加することによってなされる、
    請求項2記載のシステム。
  4. 前記患者挙動推定器は、各臨床パターン内にクラスタリングされた前記患者母集団の各患者について前記追加的な臨床ノードを入力するよう構成されており、各臨床パターンは、その臨床パターン内にクラスタリングされる患者からの追加的な臨床ノードを含む、
    請求項2または3記載のシステム。
  5. 前記患者挙動推定器は:
    臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードのそれぞれに、そのノードを含み、そのパターン内にクラスタリングされている前記母集団内の患者の比率から導出されるノード重みをラベル付けするよう構成されている、
    請求項1ないし4のうちいずれか一項記載のシステム。
  6. 前記患者挙動推定器は:
    そのパターン内に分類されることの複合確率を導出するために、新規患者PAO内に含まれるそのパターンの諸ノードについての重みを使うよう構成されたメタ予測器を含む、
    請求項5記載のシステム。
  7. 前記複合確率は、諸ノードを診断、薬物、症状、処置および訪問に範疇分けすることによって、かつ各範疇の寄与に、その範疇についての割り当てられた重みにより重み付けすることによって、導出される、
    請求項6記載のシステム。
  8. 患者母集団の諸PAOに対する機械学習を使って、諸患者を、患者母集団の各患者のPAOに従って二つ以上の活動パターンにクラスタリングする、活動パターン・マイニング器をさらに有しており、
    前記患者挙動推定器はさらに:
    機械学習を使って活動パターンのモデルを生成する段階であって、前記モデルは各活動パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
    機械学習を使って新規患者を活動パターンの一つに分類することを、新規患者のPAO内の活動ノードをパターン内の活動ノードと比較することによって行なう段階と;
    新規患者が分類されたパターンの活動ノードから新規患者の活動挙動を予測する段階とを実行するよう構成されている、
    請求項1ないし7のうちいずれか一項記載のシステム。
  9. 前記患者挙動推定器はさらに:
    新規患者の臨床挙動を入力する段階であって、前記臨床挙動は、症状、処置、診断および薬物があればそれを同定し、該症状、処置、診断または薬物の日付を含む臨床情報の形である、段階と;
    前記新規患者の識別情報を前記新規患者についての各臨床情報についての臨床ノードとリンクする、前記新規患者についてのPCOを生成する段階と:
    さらに、前記新規患者のPCOの臨床ノードを使って、前記新規患者をあるパターンに分類することを、前記新規患者のPCOにおける臨床ノードをパターン内の臨床ノードとさらに比較することによって、行なう段階とを実行するよう構成されている、
    請求項1ないし8のうちいずれか一項記載のシステム。
  10. 前記メタ予測器がさらに:
    前記新規患者のPCO内に含まれるパターンの諸ノードについてのノード重みを使って、パターン内への分類の前記複合確率を導出するよう構成されている、
    請求項9記載のシステム。
  11. 新規患者の臨床挙動を予測するコンピュータ実装される方法であって:
    患者母集団における各患者の履歴臨床挙動を入力し、各患者についてのPCOを生成する段階であって、前記履歴臨床挙動は、症状、処置、診断および薬物があればそれを同定し、該症状、処置、診断または薬物の日付を含む臨床情報の形であり、各患者についての前記PCOは患者識別情報をその患者についての臨床情報の各履歴情報についての臨床ノードとリンクする、段階と;
    前記患者母集団における各患者の履歴活動挙動を入力し、各患者についてのPAOを生成する段階であって、前記履歴活動挙動は、ヘルスケア施設への訪問があればそれを同定し、訪問されたヘルスケア施設の型および訪問の日付を含む活動情報の形であり、各患者についての前記PAOは患者識別情報をその患者についての活動情報の各履歴情報についての活動ノードとリンクする、段階と;
    患者母集団の諸PCOに対して機械学習を使って、諸患者を前記患者母集団の各患者のPCOに従って、二つ以上の臨床パターンにクラスタリングする段階と;
    各臨床パターン内にクラスタリングされた患者母集団の各患者についてのPAOおよびPCOを入力し、機械学習を使って各臨床パターンのモデルを生成する段階であって、前記モデルは、その臨床パターン内にクラスタリングされた患者からの臨床ノードおよび活動ノードを含む、段階と;
    新規患者の活動挙動を、該新規患者のヘルスケア施設への訪問があればそれに関する活動情報の形で入力する段階であって、該活動情報は、訪問されたヘルスケア施設の型および訪問の日付を含む、段階と;
    前記新規患者の識別情報を、前記新規患者についての各活動情報についての活動ノードとリンクする、前記新規患者についてのPAOを生成する段階と;
    機械学習を使って前記新規患者を前記臨床パターンのうちの一つに分類することを、前記新規患者のPAOにおける活動ノードをそのパターンにおける活動ノードと比較することによって、行なう段階と;
    前記新規患者が分類された臨床パターンの諸臨床ノードから新規患者の臨床挙動を予測する段階とを含む
    方法。
  12. コンピューティング装置上で実行されたときに請求項11記載の方法を実行するコンピュータ・プログラム。
  13. 請求項12記載のコンピュータ・プログラムを記憶している非一時的なコンピュータ可読媒体。
JP2018006263A 2017-03-30 2018-01-18 新規患者の挙動を予測するためのシステムおよび方法 Pending JP2018170004A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17164007.1A EP3382584A1 (en) 2017-03-30 2017-03-30 A system and a method to predict patient behaviour
EP17164007.1 2017-03-30

Publications (1)

Publication Number Publication Date
JP2018170004A true JP2018170004A (ja) 2018-11-01

Family

ID=58464334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018006263A Pending JP2018170004A (ja) 2017-03-30 2018-01-18 新規患者の挙動を予測するためのシステムおよび方法

Country Status (2)

Country Link
EP (1) EP3382584A1 (ja)
JP (1) JP2018170004A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7444280B2 (ja) 2020-11-02 2024-03-06 富士通株式会社 機械学習プログラム、推定プログラム、装置、及び方法
JP7491106B2 (ja) 2020-01-27 2024-05-28 富士フイルムビジネスイノベーション株式会社 方法、プログラム、及びコンピュータ装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020074555A1 (en) * 2018-10-11 2020-04-16 Koninklijke Philips N.V. Population-level care plan recommender tool
US11610679B1 (en) * 2020-04-20 2023-03-21 Health at Scale Corporation Prediction and prevention of medical events using machine-learning algorithms
CN111803804B (zh) * 2020-06-19 2023-04-07 山东省肿瘤防治研究院(山东省肿瘤医院) 自适应放疗系统、存储介质及设备
CN112542243B (zh) * 2020-12-05 2024-06-04 东软教育科技集团有限公司 一种icu电子病历知识图谱构建方法、系统和存储介质
CN112786131B (zh) * 2020-12-31 2023-07-04 医渡云(北京)技术有限公司 识别就诊信息的方法及装置、电子设备和存储介质
CN114974579B (zh) * 2022-04-20 2024-02-27 山东大学齐鲁医院 消化道粘膜下肿瘤内镜治疗预后的辅助判定系统及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014196087A1 (ja) * 2013-06-28 2014-12-11 株式会社日立製作所 診療プロセス分析システム
JP2015529359A (ja) * 2012-08-16 2015-10-05 ジンジャー.アイオー, インコーポレイテッドGinger.Io, Inc. 挙動及び健康変化をモデリングする方法
JP2016153961A (ja) * 2015-02-20 2016-08-25 東芝メディカルシステムズ株式会社 医用情報処理装置および医用情報処理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110295621A1 (en) * 2001-11-02 2011-12-01 Siemens Medical Solutions Usa, Inc. Healthcare Information Technology System for Predicting and Preventing Adverse Events
US10978208B2 (en) * 2013-12-05 2021-04-13 International Business Machines Corporation Patient risk stratification by combining knowledge-driven and data-driven insights
WO2016073776A1 (en) * 2014-11-05 2016-05-12 Healthcare Business Intelligence Solutions Inc. System for management of health resources

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015529359A (ja) * 2012-08-16 2015-10-05 ジンジャー.アイオー, インコーポレイテッドGinger.Io, Inc. 挙動及び健康変化をモデリングする方法
WO2014196087A1 (ja) * 2013-06-28 2014-12-11 株式会社日立製作所 診療プロセス分析システム
JP2016153961A (ja) * 2015-02-20 2016-08-25 東芝メディカルシステムズ株式会社 医用情報処理装置および医用情報処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7491106B2 (ja) 2020-01-27 2024-05-28 富士フイルムビジネスイノベーション株式会社 方法、プログラム、及びコンピュータ装置
JP7444280B2 (ja) 2020-11-02 2024-03-06 富士通株式会社 機械学習プログラム、推定プログラム、装置、及び方法

Also Published As

Publication number Publication date
EP3382584A1 (en) 2018-10-03

Similar Documents

Publication Publication Date Title
Guo et al. Big data analytics in healthcare
JP2018170004A (ja) 新規患者の挙動を予測するためのシステムおよび方法
JP6915282B2 (ja) オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
JP6780520B2 (ja) オープンデータ及び臨床医の入力を用いて患者のリスクを評価するシステム及び方法
US10943679B2 (en) Computer apparatus and method to identify healthcare resources used by a patient of a medical institution
US11195213B2 (en) Method of optimizing patient-related outcomes
Poongodi et al. Deep learning techniques for electronic health record (EHR) analysis
CN102067140B (zh) 用于系谱分析的系统、方法和计算机程序产品
CN112908452A (zh) 事件数据建模
Xiao et al. Introduction to deep learning for healthcare
Chapman et al. Natural language processing for biosurveillance: detection and characterization from textual clinical reports
US11127502B2 (en) Computer apparatus and method to identify healthcare resources used by a patient given a potential diagnosis
Ahmad et al. A survey on the role of artificial intelligence in managing Long COVID
Chung et al. Big data analysis and artificial intelligence in epilepsy–common data model analysis and machine learning-based seizure detection and forecasting
CN116543917A (zh) 一种针对异构时间序列数据的信息挖掘方法
Mythili et al. Similarity Disease Prediction System for Efficient Medicare
Patel et al. Predicting Heart Disease Using Machine Learning Algorithms
Basha et al. Deep learning neural network (DLNN)-based classification and optimization algorithm for organ inflammation disease diagnosis
CN114664447A (zh) 一种骨质疏松健康风险评估方法及设备
Landi et al. The evolution of mining electronic health records in the era of deep learning
Umoren et al. Modeling and prediction of pregnancy risk for efficient birth outcomes using decision tree classification and regression model
Gautam et al. An overview of big data applications in healthcare: opportunities and challenges
Lee et al. FuzzyGap: sequential pattern mining for predicting chronic heart failure in clinical pathways
Zakharov et al. Infrastructure of the electronic health record data management for digital patient phenotype creating
US12008613B2 (en) Method of optimizing patient-related outcomes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220426