JP2019125240A - 分析装置および分析方法 - Google Patents

分析装置および分析方法 Download PDF

Info

Publication number
JP2019125240A
JP2019125240A JP2018006370A JP2018006370A JP2019125240A JP 2019125240 A JP2019125240 A JP 2019125240A JP 2018006370 A JP2018006370 A JP 2018006370A JP 2018006370 A JP2018006370 A JP 2018006370A JP 2019125240 A JP2019125240 A JP 2019125240A
Authority
JP
Japan
Prior art keywords
prediction
unit
clinical pathway
importance
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018006370A
Other languages
English (en)
Other versions
JP6893480B2 (ja
Inventor
渉 竹内
Wataru Takeuchi
渉 竹内
琢磨 柴原
Takuma Shibahara
琢磨 柴原
健 直野
Takeshi Naono
健 直野
信二 垂水
Shinji Tarumi
信二 垂水
俊太郎 由井
Shuntaro Yui
俊太郎 由井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018006370A priority Critical patent/JP6893480B2/ja
Priority to US16/245,096 priority patent/US11527325B2/en
Publication of JP2019125240A publication Critical patent/JP2019125240A/ja
Application granted granted Critical
Publication of JP6893480B2 publication Critical patent/JP6893480B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】機械学習による予測に寄与した特徴量とクリニカルパスウェイとの関連について解釈可能性の向上を図ること。【解決手段】分析装置は、患者の第1特徴項目に関する第1入力データと、診療行為の工程に関するクリニカルパスウェイ内の予測対象への遷移条件を規定する第2特徴項目と、医学的用語間の関連性を示すクリニカルターミノロジーと、に基づいて、第1特徴項目の重みを有する第2入力データを生成する生成部と、第1入力データと、生成部によって生成された第2入力データと、を与えると、クリニカルパスウェイ内の予測対象に対する予測結果と、第1特徴項目の重要度と、を出力するニューラルネットワークと、ニューラルネットワークから出力された予測結果および重要度に基づいて、クリニカルパスウェイを編集する編集部と、編集部によって編集された編集結果を出力する出力部とを有する。【選択図】図1

Description

本発明は、コンピュータアーキテクチャに関する。
診療に関する患者への介入行為時には、医師は、診療ガイドラインなどの医学的コンセンサス情報や自身の経験に基づき介入要否ないし介入方法を決定する。診療ガイドラインはエビデンスレベルが高く、医師が診療行為を行うに際し根拠となる。しかし、ガイドラインに基づいて実運用するには境界条件が曖昧なことが多い。このため、ガイドラインに基づく実運用は、個々の医師の解釈や判断に大きく依存する。
一方、機械学習や所謂AI(Artificial Intelligence)に基づき意思決定支援をするようなソフトウェアを用いる場合がある。この場合、データに記録された患者毎の特徴(たとえば、年齢や体重などの基本情報、検査値や罹患疾病などの診療情報)に応じて、推奨される介入行為が変化する。
特許文献1は、蓄積された診療記録を分析し、クリニカルパスを作成・修正および記憶する機能を備えたクリニカルパス分析環境と、蓄積されたクリニカルパスから患者状態等に応じた最適クリニカルパス選択機能と、を有し、クリニカルパス分析環境は、診療プロセス評価機能とクリニカルパス評価機能を備えるクリニカルパス運用支援情報システムを開示する。
また、特許文献2は、第1のユーザ入力に基づき、ガイドライングラフをロード及び表示するステップと、上記ガイドライングラフの所望の部分を選択する第2のユーザ入力を受信するステップと、上記ガイドライングラフの上記所望の部分を含むサブグラフをロード及び表示するため、上記第2のユーザ入力を処理するステップとに関するシステム及び方法を開示する。
また、特許文献3は、患者を治療する際にガイダンスを提供する実行可能な臨床実務ガイドラインを実行するシステム及び方法を開示する。当該システムは、複数の実行可能な臨床実務ガイドラインを記憶するガイドラインリポジトリと、前記患者及び前記患者の治療の少なくとも1つに関連付けられた臨床状況データを入力する少なくとも1つのインターフェースと、ディスプレイとを含む。当該システムのサーバは、前記臨床状況データを受信すると、自動的に適切な臨床実務ガイドラインを選択し、前記ディスプレイ上で視覚的ナビゲータを用いて前記ガイドラインを表示する。前記サーバは、自動的に現在の抽出レベルで前記ガイドラインを提供し、また前記現在の抽出レベルを規定する視覚的ナビゲータを前記ユーザに提供する。代わりに、ユーザがUIを介して手動で選択することにより生成された信号を受信すると、前記ガイドライン及び前記ガイドラインの抽出レベルが表示される。前記抽出レベルは、手動及び自動モードの両方でユーザ入力により変更されることができる。
また、特許文献4は、少なくとも1人の患者の1つまたは複数の臨床経路およびリソース要件を予測するためのシステムを開示する。このシステムは、患者診断データに関する入力を受信するための入力モジュールを備え、患者診断データは、患者の診断中に識別された情報を含む。このシステムはまた、患者データおよび既存の臨床経路のうちの少なくとも1つを含むデータを格納するリポジトリを含む。患者データは、入力モジュールから受信した患者診断データの少なくとも1つを含み、患者の過去の治療データと、患者の人口統計的な詳細を含む患者の人口統計データとを含む患者履歴データを含む。このシステムはまた、患者データおよび既存の臨床経路上に所定の分析モデルを適用することによって臨床経路を予測するための臨床経路予測モジュールを備える。このシステムは、患者のリソース要件を予測するためのリソース要件予測モジュールをさらに備える。
また、特許文献5は、医療従事者が症状を診断し、治療または検査を処方するための臨床経路と呼ばれるプロセスを管理し、医師または他のヘルスケア専門家が、ビジネスルールによって接続されたネットワーク内の球体としてプログラムされた臨床経路を使用して、意思決定および患者ケアに集中することを可能にする臨床経路システムを開示する。
また、特許文献6は、情報処理装置において蓄積されている中から業務フローを検索する際に、検索条件とする業務フローの入力を受け付け、記憶部から検索対象とする業務フローを取得し、検索条件および検索対象の業務フローのそれぞれに含まれる個々のタスクと該個々のタスクを行なうアクタとの組合せのそれぞれの一致度に基づいて、検索条件とした業務フローに対する比較した業務フローの類似度を算出し、算出した個々の類似度に基づいて、検索結果を提示する業務フロー検索装置を開示する。
また、特許文献7は、検索対象となるXML文書集合を分析し、XML文書の構造情報に基づくDOM木の形状を格納する数列と、DOM木の各ノードに対応する構造パスの種類を記録する1つ以上の数列からなる数列群とを作成し、数列と数列群を走査することにより、検索クエリである構造パスに合致する箇所を計算するXML文書検索装置を開示する。
また、特許文献8は、第1のデータ管理操作のための第1のヘルスケア・パーティシパントの第1組のコンプライアンス・ポリシーを定義する、第1のデータ管理操作のための第1のデータ管理プロセスを呼び出し、第1組のコンプライアンス・ポリシーとは異なる、第1のデータ管理操作のための第2のヘルスケア・パーティシパントの第2組のコンプライアンス・ポリシーを定義する、第1のデータ管理操作のための第2のデータ管理プロセスを呼び出す電子カルテシステムを開示する。
入力データから出力データを予測する手法として、パーセプトロンと呼ばれる手法がある。パーセプトロンは、入力となる特徴量ベクトルと、重みベクトルの線形結合の演算結果により予測値を出力する。ニューラルネットワークは、別名、マルチパーセプトロンとも呼ばれ、複数のパーセプトロンを多層的に重ねることで、線形分離不可能問題を解く能力をもたせた技術であり、1980年代に登場した。2012年頃から、ドロップアウト等の新しい技術を導入したニューラルネットワークはdeep learningと呼ばれている。
機械学習分野では、特徴量ベクトルから得られた予測値と実際の値(真値)の誤差が最小となるように、学習パラメータ(パーセプトロンにおける重みベクトル等)を計算することを学習と呼ぶ。学習のプロセスが完了すると、学習に用いなかったデータ(以降、テストデータと呼ぶ)から新しい予測値を計算することができる。パーセプトロンでは、重みベクトルの各要素値の大きさが、予測に寄与した因子の重要度として用いられている。
一方、deep learningを含むニューラルネットワークにおいては、特徴量ベクトルの各要素はパーセプトロンを通過するたびに、他の要素と重み付き積和演算が実施されることから、各要素単体での重要度を知ることは原理的に困難である。
非特許文献1の手法は、特徴量の重要度を算出する機能を持たないdeep learningなどの機械学習手法の識別結果を説明できるように、新たに線形回帰を学習させる手法である。また、ロジスティック回帰はパーセプトロンと等価な機械学習モデルであり、あらゆる分野で最も広く用いられている。たとえば、下記非特許文献2の119ページに示されるロジスティック回帰は、データサンプル全体について特徴量の重要度を算出する機能を持つ。
特開2008−47154号公報 特表2013−513847号公報 特表2008−514334号公報 米国特許第8744870号公報 米国特許公開2012/0310667号公報 特開2012−243268号公報 特開2013−175053号公報 特開2017−168129号公報
Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. "Why should I trust you ?: Explaining the predictions of any classifier." Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2016. Friedman J, Trevor H, Robert T. The elements of statistical learning. second edition. New York: Springer series in statistics, 2001.
しかしながら、機械学習は一般には所謂ブラックボックスである。非特許文献1の手法は、線形回帰で後付け的に説明を試みているにすぎず、deep learningが予測する際に利用している特徴量の重要度を完全に算出できる数学的な保証はない。また、完全に線形回帰がdeep learningと同一の予測精度を達成できるならば、もはや、最初のdeep learning自体が必要ではなくなり、手法の構成概念には矛盾がある。また、ロジスティック回帰は、データサンプル個々についての特徴量の重要度を算出する機能を持たない。
このため、機械学習モデルの予測結果と診療ガイドラインなどの医学的エビデンスに基づいた診療行為の選択基準(クリニカルパスウェイ)との関連性は不明である。したがって、予測結果と選択基準とを結び付けて解釈することは困難である。たとえば、データに記録された患者毎の特徴(たとえば、年齢や体重などの基本情報、検査値や罹患疾病などの診療情報)に応じて、推奨される介入行為が変化するが、推奨介入行為が推奨される根拠を医師に提示することは容易ではない。
本発明は、上記に鑑みてなされたものであって、機械学習による予測に寄与した特徴量とクリニカルパスウェイとの関連性の解釈可能性の向上を図ることを目的とする。
本願において開示される発明の一側面となる分析装置は、患者の第1特徴項目に関する第1入力データと、診療行為の工程に関するクリニカルパスウェイ内の予測対象への遷移条件を規定する第2特徴項目と、医学的用語間の関連性を示すクリニカルターミノロジーと、に基づいて、前記第1特徴項目の重みを設定した第2入力データを生成する生成部と、前記第1入力データと、前記生成部によって生成された第2入力データと、を与えると、前記クリニカルパスウェイ内の予測対象に対する予測結果と、前記第1特徴項目の重要度と、を出力するニューラルネットワークと、前記ニューラルネットワークから出力された予測結果および重要度に基づいて、前記クリニカルパスウェイを編集する編集部と、前記編集部によって編集された編集結果を出力する出力部と、を有することを特徴とする。
本発明の代表的な実施の形態によれば、機械学習による予測に寄与した特徴量とクリニカルパスウェイとの関連について解釈可能性の向上を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
図1は、クリニカルパスウェイの更新例を示す説明図である。 図2は、特徴量ベクトルの再配置例を示す説明図である。 図3は、分析システムのシステム構成例を示すブロック図である。 図4は、本実施例にかかるニューラルネットワークの構造例を示す説明図である。 図5は、ニューラルネットワークの機能的構成例を示すブロック図である。 図6は、ニューラルネットワークによる学習処理および予測処理手順例を示すフローチャートである。 図7は、分析装置の機能的構成例を示すブロック図である。 図8は、説明可能ベクトル生成部による説明可能ベクトルの生成処理例を示す説明図である。 図9は、分析装置による分析シーケンス例を示すシーケンス図である。 図10は、説明付きクリニカルパスウェイを表示する画面例(ケース1)を示す説明図である。 図11は、説明付きクリニカルパスウェイを表示する画面例(ケース2)を示す説明図である。 図12は、説明付きクリニカルパスウェイを表示する画面例(ケース3)を示す説明図である。 図13は、説明付きクリニカルパスウェイを表示する画面例(ケース4)を示す説明図である。 図14は、説明付きクリニカルパスウェイを表示する画面例(ケース5)を示す説明図である。
本実施例では、機械学習の予測モデルを用いてその予測結果を出力するに際し、重視した特徴量を可視化することで、予測に寄与した特徴量とクリニカルパスウェイとの関連性の解釈可能性が向上し、機械学習モデルの診療業務への導入が容易になる。すなわち、精度の高い予測結果の理由や根拠といった医師が納得するための情報提示が可能となる。
また、医学論文などの医学的エビデンスの蓄積には時間がかかるため、従来のクリニカルパスウェイの情報更新は時間がかかったが、本実施例により、機械学習予測モデルの予測結果との関連性に説明がつきやすくなるため、従来型医学的エビデンスに加え実際の臨床データに基づくクリニカルパスウェイの情報更新による、更新速度の高速化を促進することができる。したがって、クリニカルパスウェイの信頼性の向上を図ることができる。
なお、クリニカルパスウェイ(クリニカルパスともいう)とは、診療ガイドラインなどの診療行為の工程(選択基準ともいう)に関する情報であり、たとえば、診療の順序であったり、疾病の進行順序などがある。本実施例のクリニカルパスはコンピュータに読み取り可能な情報(たとえば、フローや表など文字列を含む図形データ、文章を示すテキストデータ)とする。
<クリニカルパスウェイの更新例>
図1は、クリニカルパスウェイの更新例を示す説明図である。クリニカルパスウェイCPの更新例は、ニューラルネットワークNNの選択101、特徴量ベクトルXの生成102、説明可能ベクトルzの生成103、選択ニューラルネットワークNNでの予測104、クリニカルパスウェイCPの編集105により実行され、説明付きクリニカルパスウェイCPeが生成、表示される。なお、本例では、クリニカルパスウェイCPの予測起点のノードP1からノードP3bを経由してノードP4aに到達する診療経路において、において予測対象モデルPTM内の予測対象のノードP2a,P2b,P2cのいずれが最適な経路かを予測するものとする。
ニューラルネットワークNNの選択101では、モデルパラメータMPを参照して、ニューラルネットワーク群NNsから予測対象モデルPTMの予測に適したニューラルネットワークNNが選択される。一般に、ニューラルネットワークは、入力層と、出力層と、入力層と出力層との間において前段の層からのデータと学習パラメータとを活性化関数に与えて計算して後段の層に計算結果を出力する1層以上の中間層と、により構成される。
通常のニューラルネットワークでは、予測結果のみが出力されるが、本実施例のニューラルネットワークNNは、予測結果のほか、特徴項目(以下、単に「項目」)の重要度も出力される。ニューラルネットワーク群NNsの各ニューラルネットワークNNは、たとえば、予測対象モデルPTMごとに存在し、教師有り学習により教師データ(訓練データ)が与えられることで、学習モデルが構築されているものとする。
モデルパラメータMPは、予測対象モデルPTMおよび予測パラメータを含む情報である。予測対象モデルPTMとは、予測起点となるノードから予測対象となるノードまでの診療経路である。たとえば、図1に示す予測対象モデルPTMは、症状P1が予測起点、治療法P2a〜P2dが予測対象である。予測パラメータは予測対象の取捨選択追加などの編集情報や予測対象の順位付け方法などを設定するためのパラメータである。
具体的には、たとえば、予測対象モデルPTMは、症状P1の場合に、その患者の検査結果がE>x[mg]であれば、治療法P2aが適するとされ、E≦x[mg]でかつA≧y[%]であれば治療法P2bが適するとされ、C<z[mmol/ml]であれば治療法P2cが適するとされることとを示す診療経路とする。なお、予測起点と予測対象との間の経路上に非予測対象のノードが存在してもよい。
この、『E>x[mg]』、『E≦x[mg]でかつA≧y[%]』、および『C<z[mmol/ml]』がクリニカルパスウェイ分岐条件である。クリニカルパスウェイ分岐条件は、たとえば、診療経路上のノードの分岐条件となる。クリニカルパスウェイ分岐条件には、このほか、患者の個人情報を指定する情報(たとえば、年齢や性別)が含まれていてもよい。
また、モデルパラメータMPは、予測対象モデルPTMには存在しない予測対象を追加することができる。たとえば、クリニカルパスウェイCPの予測対象モデルPTMに治療法P2dが含まれていないが、最新の論文や実際の臨床データにおいて治療法P2dが適する可能性がある場合、追加の予測対象として治療法P2dをモデルパラメータMPに含めることができる。このように、クリニカルパスウェイCPの更新遅延にも対応することが可能となる。
特徴量ベクトルXの生成102では、患者の特徴を示す特徴量ベクトルXが生成される。特徴量ベクトルXは、選択ニューラルネットワークNNに与えられるベクトルであり、診療DB100から抽出された患者データにより生成される。診療DB100とは、患者ごとの電子カルテを記憶するデータベースである。したがって、特徴量ベクトルXの特徴量を示す要素となる「項目」には、患者の年齢、性別、血液型といった個人情報や、疾病や外傷の種類、治療や手術、検査の種類、投与した薬剤、診断画像、費用などがある。「値」は「項目」を示す値である。「単位」は、「値」を数値で表すための基準である。
たとえば、「項目」が「投与した薬剤」である場合、その投与量が「0.879[mg]」であれば、「0.879」が「値」となり、「[mg]」が単位となる。なお、特徴量ベクトルが「値」についての1次元列ベクトルである場合、「値」の位置により、「項目」および「単位」が確定するものとする。
説明可能ベクトルzの生成103では、特徴量ベクトルX、予測対象モデルPTM、およびクリニカルターミノロジーCTを用いて、説明可能ベクトルzが生成される。説明可能ベクトルzとは、特徴ベクトルXの項目の重要性を説明するためのベクトルであり、特徴ベクトルXとともにニューラルネットワークNNに与えられる。「重み」は、「関連項目」との関連性の高さを示す値である。本実施例では、「重み」は、0以上、1以下の範囲の値であり、値が高いほど関連性が高いことを示す。「関連項目」とは、クリニカルターミノロジーCTにおいて「項目」に関連する項目である。
「関連項目」は、説明可能ベクトルzの生成102において、クリニカルターミノロジーCTを参照することにより得られる。クリニカルターミノロジーCTとは、医学的用語およびそれらの関連性を示す情報であり、たとえば、医学的用語をノード、関連性をリンクとするネットワーク情報である。リンクは、当該リンクの両端の医学的用語間の関連性を示す。関連性は、たとえば、リンク長により表現される。リンク長が短いほど関連度が高いことを示す。A,C,Eのように、「項目」が予測対象モデルPTMに含まれ、かつ、「関連項目」と一致すれば、重みは最高値の「1」となる。「項目」が予測対象モデルPTMに含まれていない場合、予測対象モデルPTMの「項目」までのリンク長の逆数が重みとなる。
選択ニューラルネットワークNNでの予測104では、選択ニューラルネットワークNNに特徴量ベクトルXnおよび説明可能ベクトルzを与えることで、予測結果および項目の重要度が算出される。予測結果は、たとえば、予測対象P2a〜P2cになる確率である。
モデルパラメータMPに追加の予測対象P2dが含まれている場合、予測対象P2dになる確率も予測結果として算出される。項目の重要度は、特徴量ベクトルXの各項目の重要度であり、本例では値が高いほど重要性が高いことを示す。そして、項目の重要度は、どの項目が最も確率が高い予測結果に寄与するかを示す。
クリニカルパスウェイCPの編集105では、予測結果および項目の重要度を用いてクリニカルパスウェイCPが編集される。たとえば、予測対象モデルPTMには存在せず、モデルパラメータMPにより追加された予測対象である治療法P2dが最高確率である場合、P1とP2dを接続するリンク(遷移)LKaと、P2dとP3bを接続するリンクLKbとが生成される。
また、リンクLKaと説明情報110がリンクLKxで関連付けられる。説明情報110は、予測結果および項目の重要度を含む情報である。本例の場合、説明情報110は、予測起点P1から予測対象P2a〜P2cではなく追加の予測対象P2dに遷移する根拠となる。これにより、クリニカルパスウェイCPに説明情報110が関連付けされた説明付きクリニカルパスウェイCPeが得られる。説明付きクリニカルパスウェイCPeは、たとえば、モニタに表示される。
このように、機械学習の予測モデルにおいてその予測結果を出力するに際し、重要度の高い項目を可視化することで、予測に寄与した項目とクリニカルパスウェイCPとの関連性の解釈可能性の向上を図ることができ、機械学習の診療業務への導入を容易にすることができる。したがって、精度の高い予測結果の理由や根拠といった医師が納得するための情報提示が可能となる。
<特徴量ベクトルXの再配置例>
AIは、線形分離不可能問題を解く能力を持つが、AIが、どうしてそのような判断をしたかが不明である。特に、deep learningなどの機械学習手法は、予測精度は高いが説明能力が低い。たとえば、ある患者に対して「風邪をひきやすい」という診断結果をAIが出力した場合、医師は、AIがなぜそのような結果を得たかを答えることができない。もし、AIがその原因まで判断できれば、医師は、患者に対して適切な治療をおこなうことがきる。
図2は、特徴量ベクトルの再配置例を示す説明図である。(A)特徴量空間SP1には、複数の特徴量ベクトルx(n=1,2,…,N。Nは、たとえば、患者数)が存在する。複数の特徴量ベクトルxは、たとえば、非線形の予測モデルPM1により正解ラベルLa,Lbに識別される。(B)特徴量空間SP2には、複数の特徴量ベクトルxが存在する。複数の特徴量ベクトルxは、たとえば、線形の予測モデルPM2により正解ラベルLa,Lbに識別される。
(A)deep learningなどの機械学習手法は、識別結果である予測モデルPM1を説明するため、新たに線形回帰を学習する。具体的には、たとえば、この機械学習手法は、予測モデルPM1を求めた後に局所的に直線近似するという後付け的な処理を実行する。しかしながら、このような後付け的な処理では、直線近似された予測モデルPM1の局所部分が、特徴量ベクトルxを正しく説明できるかが不明である。また、何より、直線近似というロジスティック回帰を実行するため、都合2回の機械学習を実行する必要がある。
(B)の予測モデルPM2は線形であるため、その傾きを参照すれば、特徴量ベクトルxが特徴量空間SP2内のどのパラメータで重みづけされているがわかり、特徴量ベクトルxを正しく説明することができる。本実施例では、複数の特徴量ベクトルxについて、(A)のように非線形な予測モデルPM1を求めることなく、特徴量空間SP1の複数の特徴量ベクトルxを、他の特徴量空間SP2に再配置する。これにより、線形な予測モデルPM2が得られるため、特徴量ベクトルxが特徴量空間SP2内のどのパラメータで重みづけされているがわかり、その重要度に応じて特徴量ベクトルxを正しく説明することができる。
すなわち、ユーザは特徴量ベクトルxのあるサンプルごとに(例えば、患者ごとに)、特徴量xに内包されるどの因子(特徴)が予測結果に寄与しているかが分かるため、どうしてそのような予測結果になったのかという説明がしやすくなる。したがって、機械学習における説明能力の向上を図ることができる。上記の例でいえば、ある患者に対して「治療法P2dを発症」という診断結果をAIがなぜ出力したか(たとえば、項目Eの値(検査結果)が異常に高いからなど)、が分かることになる。また、(A)のように機械学習を2回も実行する必要がないため、機械学習の効率化も図ることができる。したがって、上記のような説明を迅速に提供することができる。
<システム構成例>
図3は、分析システムのシステム構成例を示すブロック図である。図3では、サーバ−クライアント型の分析システム3を例に挙げて説明するが、スタンドアロン型でもよい。(A)は、分析システム3のハードウェア構成例を示すブロック図であり、(B)は、分析システム3の機能的構成例を示すブロック図である。(A)および(B)において同一構成には同一符号を付す。
分析システム3は、クライアント端末300とサーバである分析装置320とがネットワーク310で通信可能に接続される構成である。
(A)において、クライアント端末300は、補助記憶装置であるHDD(hard disk drive)301、主記憶装置であるメモリ302、プロセッサ303、キーボードやマウスである入力装置304、モニタ305を有する。分析装置320は、補助記憶装置であるHDD321、主記憶装置であるメモリ322、プロセッサ323、キーボードやマウスである入力装置324、モニタ325を有する。なお、主記憶装置、補助記憶装置、および、図示しない可搬型の記憶媒体を総称して、記憶デバイスと称す。記憶デバイスは、ニューラルネットワークNNおよびこれらの学習パラメータ365を記憶する。
(B)において、クライアント端末300は、クライアントデータベース(DB)351を有する。クライアントDB351は、HDD301やメモリ302などの記憶デバイスに格納される。クライアントDB351には、テストデータ集合352と、予測結果353と、が格納される。テストデータ集合352は、テストデータの集合である。予測結果353は、予測部362からネットワーク310経由で得られたデータである。なお、サーバ−クライアント型の場合、クライアント端末300は1台以上存在する。
分析装置320は、学習部361と、予測部362と、サーバデータベース(DB)363と、を有する。学習部361は、特徴量ベクトルxを訓練データとしてニューラルネットワークNNに与えて正解ラベルtと比較して誤差逆伝搬するという学習処理を実行し、学習パラメータ365を出力する機能部である。
予測部362は、学習パラメータ365を用いて、ニューラルネットワークNNを構築し、ニューラルネットワークNNにテストデータが与えられることで、予測処理を実行し、予測結果353をクライアント端末300に出力する機能部である。学習部361および予測部362は、HDD321、メモリ322などの記憶デバイスに記憶されたプログラムをプロセッサ323に実行させることによりその機能を実現する。
サーバDB363は、訓練データ集合364と、学習パラメータ365と、を格納する。訓練データ集合364は、特徴量ベクトルxと、正解ラベルtと、を含む。学習パラメータ365は、学習部361からの出力データであり、後述する行列W ,行列W ,行列W ,行列W、重みベクトルwを含む。なお、学習パラメータが設定されたニューラルネットワークを「予測モデル」と称す。
なお、分析装置320は複数台で構成されてもよい。たとえば、負荷分散のため、分析装置320が複数存在してもよい。また、分析装置320は、機能ごとに複数台で構成されてもよい。たとえば、学習部361およびサーバDB363を含む第1のサーバと、予測部362およびサーバDB363を含む第2のサーバとで構成されてもよい。また、また、学習部361および予測部362を含む第1分析装置と、サーバDB363を含む第2分析装置とで構成されてもよい。また、学習部361を含む第1分析装置と、予測部362を含む第2分析装置と、サーバDB363を含む第3分析装置とで構成されてもよい。
<ニューラルネットワークの構造例>
図4は、本実施例にかかるニューラルネットワークの構造例を示す説明図である。ニューラルネットワークNNは、データユニット群DUと、レポーティングユニット群RUと、ハーモナイジングユニット群HUと、アテンションユニットAUと、リアロケーションユニットRAUと、ユニファイユニットUUと、デシジョンユニットDCUと、インポータンスユニットIUと、を有する。
データユニット群DUは、複数のデータユニットDUl(lは、階層番号であり、1≦l≦L。Lは最下層の階層番号であり、図4では、L=4)を直列に接続した構成である。最上段であるl=1のデータユニットDU1は、ニューラルネットワークNNの入力層401であり、l≦2のデータユニットDUlは、ニューラルネットワークNNの中間層(隠れ層ともいう)に相当する。データユニットDUlは、前段のデータユニットDU(l−1)からの出力データを入力して、自データユニットDUlの学習パラメータを用いて計算して出力データを出力するパーセプトロンである。
ただし、データユニットDU1は、学習部361による学習時に訓練データを保持する。ここで、訓練データは、たとえば、特徴量ベクトルxとその真値となる正解ラベルtとの組み合わせ{x,t}により構成されるサンプルデータである(n=1,2,…,N。Nは、たとえば、患者数)。特徴量ベクトルxは、項目数をd(d≧1を満たす整数)とすると、d次元のベクトルとして取り扱う。
正解ラベルtは、特徴量ベクトルxの種類数Kに対して、onehot表現で種類を示すK次元のベクトルとしてもよい。onehot表現では、ベクトルのある要素が特徴量ベクトルxの種類に対応しており、ただ1つの要素だけに1.0が格納され、他の要素は全て0.0である。1.0の要素に対応する種類が正解となる種類である。なお、X線、CT、MRI、超音波等の医療用画像を特徴量ベクトルxとして入力とした場合、正解ラベルtは、疾病の種類や患者の予後(良いor悪い)を表す真値である。
∈R(Rはd次元の実数)を、d次元の実数Rからなる特徴量ベクトルとする。データユニットDU(l+1)を示す関数hl+1 は、下記式(1)で表現される。
式(1)中、添え字l(1≦l≦Lを満たす整数。)は、階層番号を示す(以下の式も同様)。Lは1以上の整数であり、最深の階層番号を示す。右辺のf は活性化関数である。活性化関数は、たとえば、シグモイド関数、双曲線正接関数(tanh関数)、ReLU(Rectified Linear Unit)関数など、様々な活性化関数を用いてよい。行列W は、データユニットDUlの学習パラメータである。右辺のベクトルh は、データユニットDUlに入力される入力ベクトル、すなわち、前段のデータユニットDUlからの出力ベクトルである。なお、層数l=1である場合のデータユニットDU1からの出力ベクトルh は、h =xとなる。
なお、データユニットDU1は、予測部362におる予測時にテストデータとして、特徴量ベクトルxを保持する。
レポーティングユニットRUl(2≦l≦L)は、同一階層のデータユニットDUlからの出力ベクトルh を入力し、当該出力ベクトルh の次元数を縮約させる。レポーティングユニットRUlを示す関数h は、下記式(2)で表現される。
式(2)中、行列W は、レポーティングユニットRUlの学習パラメータである。 式(2)により、データユニットDUlからのd次元の出力ベクトルh は、m次元の出力ベクトルh に縮約される。また、σは、シグモイド関数である。
ハーモナイジングユニットHUl(2≦l≦L)は、中間層のデータユニットDUlとリアロケーションユニットRAUとの間に、中間層のデータユニットDUlごとに設けられる。ハーモナイジングユニットHUlは、中間層のデータユニットDUlからの出力データの次元数を揃える変換を実施する。したがって、リアロケーションユニットRAUには、ハーモナイジングユニットHUlで、同一サイズの次元数のデータが入力される。
ハーモナイジングユニットHUlは、同一階層のデータユニットDUlからの出力ベクトルh を入力し、出力ベクトルh の次元数を同一サイズの次元数に変換する。ハーモナイジングユニットHUlを示す関数h は、下記式(3)で表現される。
式(3)中、行列W は、ハーモナイジングユニットHUlの学習パラメータ365である。これにより、データユニットDUlからのd次元の出力ベクトルh は、v次元の出力ベクトルh に変換される。また、fは、活性化関数である。
アテンションユニットAUは、各レポーティングユニットRUlからの出力ベクトルh を用いて、各データユニットDUlの重みαを計算する。アテンションユニットAUを示す関数αは、下記式(4)で表現される。
式(4)中、行列Wは、アテンションユニットAUの学習パラメータである。活性化関数の1つであるsoftmax関数では、層数L(下記式(5)の例ではL=4)に等しい次元のベクトルhが計算される。下記式(5)に示すように、式(4)の右辺のベクトルhは、h を垂直方向にスタックしたベクトルである。
したがって、行列Wは、L行M列(Mは、ベクトルhの要素数)の行列となる。アテンションユニットAUにsoftmax関数を採用することにより、層数Lのベクトルhの各要素(全要素の和は1)は、対応するデータユニットDUlの重みをあらわすことになる。
リアロケーションユニットRAUは、ある特徴量空間の特徴量ベクトルxを他の特徴量空間に再配置する。具体的には、たとえば、図2に示したように、特徴量空間SP1上での特徴量ベクトル群により得られた予測モデルが非線形である場合、リアロケーションユニットRAUは、特徴量空間SP2において線形な予測モデルが得られるように、特徴量ベクトル群を特徴量空間SP2に移し替える。リアロケーションユニットRAUを示す関数h は、下記式(6)で表現される。
関数fは、ベクトル同士のアダマール積や、要素加算などを用いることができる。本実施例では、アダマール積とする(下記式(7)を参照)。式(7)では、ハーモナイジングユニットHUlからの出力ベクトルh と説明ベクトルzとのアダマール積となる。
ユニファイユニットUUは、リアロケーションユニットRAUからの出力ベクトルh と、アテンションユニットAUからの出力ベクトルαとを統合する。すなわち、ユニファイユニットUUは、リアロケーションユニットRAUからの出力ベクトルh を、アテンションユニットAUからの出力ベクトルαで重み付けする。ユニファイユニットUUを示す関数hは、下記式(8)で表現される。
式(8)中、右辺のα[k]は、式(4)の出力ベクトルαのk次元目の要素(重み)を示す。
デシジョンユニットDCUは、予測値yを決定する。具体的には、たとえば、デシジョンユニットDCUは、ユニファイユニットUUからの出力ベクトルhに、学習パラメータ365の1つである重みベクトルwで重み付けして、シグモイド関数σに与えることにより、予測値yaを得る。デシジョンユニットDCUを示す関数yaは、下記式(9)で表現される。式(9)中、w のtは、転置を意味する。
インポータンスユニットIUは、ニューラルネットワークNNの各層における特徴量についての項目の重要度を示す重要度ベクトルs を算出する。インポータンスユニットIUを示す関数s は、下記式(10)で表現される。
式(10)中、右辺のα[l]は、式(4)の出力ベクトルαのl階層目の要素(重み)を示す。関数fは、式(6)と同様、ベクトル同士のアダマール積や、要素加算などを用いることができる。本実施例では、アダマール積とする。式(10)では、重みベクトルwとハーモナイジングユニットHUlからの出力ベクトルh とのアダマール積となる。重要度ベクトルs は、n番目の特徴量ベクトルxの階層lにおける重要度である。
<ニューラルネットワークNNの機能的構成例>
図5は、ニューラルネットワークNNの機能的構成例を示すブロック図である。ニューラルネットワークNNは、入力層401と、中間層402と、出力層403と、変換部501と、再配置部502と、予測データ算出部503と、重要度算出部504と、設定部505と、統合部506と、縮約部507と、選択部508と、を有する。これらは、学習部361および予測部362の内部構成例である。
変換部501は、式(3)に示したように、各中間層DUl(l≧2)からの出力ベクトルh と行列W とに基づいて、出力ベクトルh の次元数dを縮約させて、変換後の出力ベクトルh を出力する。変換部501は、上述したハーモナイジングユニット群HUである。
再配置部502は、式(6)、(7)に示したように、変換部501からの変換後の出力ベクトルh と、入力層401に与えられた特徴量空間SP1の特徴量ベクトルxと、に基づいて、特徴量空間SP1の特徴量ベクトルxを第2特徴量空間SP2に再配置する。再配置部502は、上述したリアロケーションユニットRAUである。
予測データ算出部503は、式(9)に示したように、再配置部502による再配置結果h と重みベクトルwとに基づいて、特徴量空間SP1の特徴量ベクトルxに対する予測ベクトルyを算出する。予測データ算出部503は、上述したデシジョンユニットDCUである。
重要度算出部504は、式(10)に示したように、変換後の出力ベクトルh と重みベクトルwとに基づいて、中間層402における階層lにおける特徴量ベクトルxの重要度ベクトルs を算出する。重要度算出部504は、上述したインポータンスユニットIUである。
たとえば、特徴量ベクトルxが診断画像を示す場合、たとえば、ある階層laの出力ベクトルhla がある被写体の形状が癌組織にふさわしいか否かを示す特徴量であり、ある階層lb(≠la)の出力ベクトルhlb が当該被写体の模様が癌組織にふさわしいか否かを示す特徴量とする。この場合、対応する重要度ベクトルsla 、slb を参照することにより、ニューラルネットワークNNが、当該診断画像が被写体のどの特徴を考慮してその被写体を癌組織であると判別したかを、ユーザは説明することができる。たとえば、重要度ベクトルsla は低いが重要度ベクトルslb が高い場合、ニューラルネットワークNNが、当該画像xが被写体の模様を考慮してその被写体を癌組織であると判別していると、ユーザは説明することができる。
設定部505は、式(4)、(5)に示したように、中間層402からの出力ベクトルh と行列Wとに基づいて、中間層402の重みαを設定する。設定部505は、上述したアテンションユニットAUである。
統合部506は、式(8)に示したように、再配置結果h と、設定部505によって設定された重みαと、を統合する。統合部506は、上述したユニファイユニットUUである。この場合、予測データ算出部503は、統合部506による統合結果hと重みベクトルwとに基づいて、予測ベクトルyを算出する。また、重要度算出部504は、設定部505によって設定された重みαと、変換後の出力ベクトルh と、重みベクトルwと、に基づいて、重要度ベクトルs を算出する。
縮約部507は、式(2)に示したように、中間層402からの出力ベクトルh と行列W とに基づいて、出力ベクトルh の次元数dを縮約させて、縮約後の出力ベクトルh を出力する。縮約部507は、上述したレポーティングユニット群RUである。この場合、設定部505は、縮約部507からの縮約後の出力ベクトルh と行列Wとに基づいて、中間層402の重みαを設定する。
学習部361は、特徴量空間SP1の特徴量ベクトルxと予測ベクトルyに対する正解ラベルtとを含む訓練データが与えられた場合に、予測ベクトルyと正解ラベルtとを用いて、第1学習パラメータである行列W 、第2学習パラメータである行列W 、第3学習パラメータである重みベクトルw、第4学習パラメータである行列W、および、第5学習パラメータである行列W を、たとえば、正解ラベルtと予測値yとのクロスエントロピーが最小化するように、最適化する。
予測部362は、最適化された学習パラメータ365をニューラルネットワークNNに設定し、かつ、入力層401にテストデータとして特徴量ベクトルx´を与えることにより、採取的に予測データ算出部503に予測ベクトルy´を算出させる。
<学習処理および予測処理手順例>
図6は、ニューラルネットワークNNによる学習処理および予測処理手順例を示すフローチャートである。図6のうち、ステップS601〜S602が学習部361による学習処理であり、ステップS603〜S607が予測部362による予測処理である。まず、分析装置320は、訓練データ集合364を読み込む(ステップS601)。
分析装置320は、ニューラルネットワークNNに、訓練データ{x,t}を与えることにより学習をおこない、学習パラメータ365(行列W ,行列W ,行列W´ ,行列W、重みベクトルw)を生成する(ステップS602)。学習(ステップS602)では、たとえば、学習部361が、統計的勾配法により、正解ラベルtと予測値yaとのクロスエントロピーが最小化するように、学習パラメータ365を最適化する。分析装置320は、生成した学習パラメータ365をサーバDB363に保存する。
つぎに、分析装置320は、テストデータとなる特徴量ベクトルxおよび説明可能ベクトルzを読み込み(ステップS603)、学習パラメータ365が反映されたニューラルネットワークNN(予測モデル)に与えて、式(9)により、予測結果353として予測値yaを算出し(ステップS604)、式(10)により、項目の重要度を示す重要度ベクトルs を計算する(ステップS605)。
そして、分析装置320は、予測結果353と重要度ベクトルs とを保存し、予測結果353をクライアント端末300に出力する(ステップS606)。クライアント端末300は、予測結果353と重要度ベクトルs とをモニタ305に表示する。このように、ニューラルネットワークNNによれば、サンプルデータである特徴量ベクトルxについての重要度s を得ることができ、予測結果353の解釈性を高めることができる。また、サンプル(特徴量ベクトルx)の事前再配置により、線形な予測モデルが得られるため、学習時および予測時において、高精度かつ低負荷で予測値を算出することができる。
<分析装置320の機能的構成例>
図7は、分析装置320の機能的構成例を示すブロック図である。分析装置320は、モデルパラメータ設定部701と、パスウェイ選択部702と、特徴量ベクトル生成部703と、説明可能ベクトル生成部704と、編集部705と、出力部706と、を有する。これらは、HDD321、メモリ322などの記憶デバイスに記憶されたプログラムをプロセッサ323に実行させることによりその機能を実現する。また、ニューラルネットワークNN、診療DB100、パスウェイDB710、およびクリニカルターミノロジーCTは、分析装置320に存在してもよく、分析装置320とネットワーク310を介して通信可能な外部装置(不図示)に記憶されていてもよい。
パスウェイDB710は、クリニカルパスウェイCPを記憶するデータベースである。なお、コンピュータに読み取り可能でない、医学的ルールを示したクリニカルパスウェイについては、あらかじめ、XML/JSONコンバータにより、コンピュータに読み取り可能なフォーマットのクリニカルパスウェイCPに変換されて、パスウェイDB710に記憶されている。同様に、ガイドラインなどの医学的な電子文献も、Word2Vecコンバータにより、単語ベクトル付きのコンピュータに読み取り可能なフォーマットのクリニカルパスウェイCPに変換されて、パスウェイDB710に記憶されている。
モデルパラメータ設定部701は、モデルパラメータMPを設定する。具体的には、たとえば、モニタ305,325にモデルパラメータMPの選択画面を表示させ、ユーザが入力装置304,324を操作してモデルパラメータMPを選択することで、モデルパラメータMPを設定する。また、モデルパラメータMPは、ネットワーク310を介して外部装置(不図示)から与えられたモデルパラメータMPを設定してもよい。
パスウェイ選択部702は、モデルパラメータ設定部701によって設定されたモデルパラメータMPを検索キーとして、該当するクリニカルパスウェイCPをパスウェイDB710から選択する。具体的には、たとえば、パスウェイ選択部702は、モデルパラメータMPで設定された予測対象モデルPTMに該当するクリニカルパスウェイCPをパスウェイDB710から選択する。選択されたクリニカルパスウェイCPが複数存在する場合、パスウェイ選択部702は、複数のクリニカルパスウェイCPをモニタ305,325に出力して、ユーザに選択させてもよい。また、選択されたクリニカルパスウェイCPが複数存在する場合、パスウェイ選択部702は、文章を示すテキストデータのクリニカルパスウェイCPよりも図形データのクリニカルパスウェイCPを優先選択してもよく、また、予測起点から予測対象までの経路がより短いクリニカルパスウェイCPを優先選択してもよい。
特徴量ベクトル生成部703は、診療DB100を参照して、モデルパラメータMPに基づいて特徴量ベクトルxを生成する。ニューラルネットワークNNの学習時では、特徴量ベクトル生成部703は、不特定多数の患者についての特徴量ベクトルxを訓練データ集合364として生成して、ニューラルネットワークNNに与える。ニューラルネットワークNNでの予測時では、特徴量ベクトル生成部703は、特定の患者についての特徴量ベクトルxを生成して、ニューラルネットワークNNに与える。
説明可能ベクトル生成部704は、特徴量ベクトル生成部703によって生成された特徴量ベクトルxとパスウェイ選択部702によって選択されたクリニカルパスウェイ(選択クリニカルパスウェイ)とに基づいて、説明可能ベクトルzを生成する。説明可能ベクトルzの詳細な生成処理については、図8で後述する。
編集部705は、ニューラルネットワークNNから出力された予測結果353および項目の重要度を用いて、選択クリニカルパスウェイCPを編集する。選択クリニカルパスウェイCPの詳細な編集については、図10〜図14で説明する。
出力部706は、編集部705によって編集された編集結果を出力する。編集結果の出力先は、具体的には、たとえば、HDD301,321、メモリ302,322、モニタ305,325、ネットワーク310を介して通信可能な外部装置(不図示)である。モニタ305,325には、図10〜図14で示すように、編集結果を示す画面が表示される。これにより、ユーザである医師は、精度の高い予測結果353の理由や根拠を確認することができる。
<説明可能ベクトルの生成例>
図8は、説明可能ベクトル生成部704による説明可能ベクトルzの生成処理例を示す説明図である。説明可能ベクトルzの生成103では、特徴量ベクトルxと、モデルパラメータMP(予測対象モデルPTMおよび予測パラメータ)と、クリニカルパスウェイ分岐条件CPcを用いる。上述したように、特徴量ベクトルxは、項目801、値802、および単位803を含む。
(A)説明可能ベクトル生成部704は、特徴量ベクトルxの項目801とクリニカルパスウェイ分岐条件CPcとを比較し、共通項目と非共通項目とを特定する。項目801は、「A」,「B」,「C」,「D」,「E」を有する。一方、クリニカルパスウェイ分岐条件CPcは、「A」,「C」,「E」を有する。したがって、共通項目は、「A」,「C」,「E」であり、非共通項目は、「B」,「D」である。
(B)説明可能ベクトル生成部704は、クリニカルターミノロジーCTを用いて、各項目801に関連する関連項目805を特定するとともに、各項目801の重み804を算出して、説明可能ベクトルzを生成する。関連項目805は、項目801とクリニカルターミノロジーCTとの関連性を示す項目であり、重み804はその関連性の度合いを示す値である。
共通項目については、共通項目がクリニカルターミノロジーCTに存在すれば、重み804は「1.0」、関連項目805は、項目801と同一項目となる。ただし、共通項目がクリニカルターミノロジーCTに存在していなければ、重み804は「0.0」、関連項目805は、「なし」となる。したがって、共通項目「A」,「C」,「E」については、関連項目805はそれぞれ、「A」,「C」,「E」、重み804はそれぞれ「1.0」となる。
非共通項目については、非共通項目がクリニカルターミノロジーCTに存在すれば、説明可能ベクトル生成部704は、クリニカルターミノロジーCTにおいて、非共通項目と共通項目との関連性を示す関連度Rを算出する。関連度Rは、非共通項目から共通項目までの最短距離である。クリニカルターミノロジーCTは、上述したように、医学的用語およびそれらの関連性を示す情報であり、たとえば、医学的用語をノード、関連性をリンクとするネットワーク情報である。リンクは、当該リンクの両端の医学的用語の関連性を示す。関連性は、たとえば、リンク長により表現される。リンク長が短いほど関連度が高いことを示す。
非共通項目「D」を例に挙げると、リンクL1,L2,L3を経由することで共通項目「A」に到達する。リンクL1,L2,L3をそれぞれリンク長とすると、下記式により関連度Rが表される。
R=L1+L2+L3
本例では、R=2.5とする。非共通項目「D」の重み804は、関連度Rの逆数(1/R=0.4)となり、関連項目805は「A」となる。したがって、共通項目までの距離が短いほど、重み804は高くなる。これにより、各項目801の重み804により、クリニカルターミノロジーCTで各項目801の重要性を客観的に数値化して確認することができる。また、関連項目805により重み804の根拠についてもクリニカルターミノロジーCTで客観的に確認することができる。
<分析シーケンス例>
図9は、分析装置320による分析シーケンス例を示すシーケンス図である。なお、ニューラルネットワークNNは、訓練データ集合364により学習モデルを生成済みであるものとする。また、説明を簡略化するため、分析装置320は、パスウェイDB710、およびクリニカルターミノロジーCTを有するものとする。
クライアント端末300は、患者情報要求を診療DB100に送信し(ステップS901)、診療DB100は患者情報要求に対応する患者情報をクライアント端末300に返す(ステップS902)。これにより、クライアント端末300のユーザは、患者情報をモニタ305で確認することができる。
クライアント端末300は、ユーザ操作により、取得した患者情報を用いて、モデルパラメータMPを含む予測分析リクエストを作成して、分析装置320に送信する(ステップS903)。分析装置320の予測機能910は、予測分析リクエストを受信すると、特徴量ベクトル生成部703により、特徴量ベクトルxを生成する(ステップS904)。具体的には、たとえば、予測機能910は、患者情報要求を診療DB100に送り(ステップS905)、診療DB100を参照して、患者情報要求に対応する患者情報を取得する(ステップS906)。
そして、予測機能910は、特徴量ベクトル生成部703により、モデルパラメータMPと、患者情報と、を用いて、特徴量ベクトルxを生成し、生成した特徴量ベクトルxを分析装置320の説明機能920に出力する(ステップS907)。また、予測機能910は、予測分析リクエスト内のモデルパラメータMPを説明機能920に出力する(ステップS908)。
説明機能920は、パスウェイ選択部702により、編集対象となるクリニカルパスウェイCPを選択する(ステップS909)。具体的には、たとえば、説明機能920は、モデルパラメータMPに基づいてパスウェイリクエストを生成し、パスウェイDB710に出力し(ステップS910)、パスウェイDB710から該当するクリニカルパスウェイCPを取得する(ステップS911)。
そして、説明機能920は、説明可能ベクトル生成部704により、特徴量ベクトルxと、選択クリニカルパスウェイCPとに基づいて、説明可能ベクトルzを生成する(ステップS912)。具体的には、たとえば、説明機能920は、クリニカルターミノロジーリクエストをクリニカルターミノロジーCTに送り、クリニカルターミノロジーCTを取得する(ステップS914)。説明機能920は、クリニカルターミノロジーCTを用いて、説明可能ベクトルzを生成し、予測機能910に出力する(ステップS915)。
予測機能910は、ニューラルネットワークNNによる予測処理を実行する(ステップS916)。具体的には、たとえば、予測機能910は、モデルパラメータMPによりニューラルネットワーク群NNsから該当するニューラルネットワークNNを選択する。そして、予測機能910は、選択したニューラルネットワークNNに、特徴量ベクトルxと説明可能ベクトルzとを与えることにより、予測結果353および項目の重要度を算出し、説明機能920に出力する(ステップS917)。
説明機能920は、編集部705によりクリニカルパスウェイCPを編集する(ステップS918)。具体的には、たとえば、説明機能920は、クリニカルパスウェイCPに予測結果353および項目の重要度を与えることで、説明付きクリニカルパスウェイCPeを生成し、予測機能910に返す(ステップS919)。予測機能910は、説明付きクリニカルパスウェイCPeをクライアント端末300に送信する(ステップS920)。クライアント端末300は、受信した説明付きクリニカルパスウェイCPeをモニタ305に表示する(ステップS921)。これにより、ユーザである医師は、精度の高い予測結果353の理由や根拠を確認することができる。
<画面例>
つぎに、図10〜図14を用いて、編集部705によって作成された説明付きクリニカルパスウェイCPeを表示する画面例について説明するとともに、編集部705によるクリニカルパスウェイの編集処理内容についても説明する。
図10は、説明付きクリニカルパスウェイCPeを表示する画面例(ケース1)を示す説明図である。ケース1は、ニューラルネットワークNNの予測結果353と、クリニカルパスウェイCPの予測対象とが、合致するケースである。ケース1の画面を第1画面1000と称す。
第1画面1000は、重要度データ1001と、説明付きクリニカルパスウェイCPeと、を表示する画面である。重要度データは、特徴量ベクトルxの項目,値,および単位に、項目の重要度を対応付けたデータである。本例では、項目の重要度は、「Very high」,「high」,「Middle」,「Low」,「None」の5段階としたが、2段階以上であれば、4段階以下でも6段階以上でもよい。また、項目の重要度は数値で表現してもよい。ケース1では、特徴量ベクトルxは、クリニカルパスウェイ分岐条件CPcのE≦100[mg]でかつA≧23.2[%]という基準を充足しているため、項目E,Aの重要度「Very high」,「high」は他の項目の重要度に比べて高くなっている。
説明付きクリニカルパスウェイCPeは、クリニカルパスウェイCPと説明情報110とをリンクLKxにより関連付けた情報である。説明情報110は、特徴量の重要性に関する予測分析情報1011と、クリニカルパスウェイ情報1012と、提案情報1013と、を有し、編集部705によって作成される。
予測分析情報1011は、各項目の値と重要度とを対応付けた情報である。クリニカルパスウェイ情報1012は、特徴量ベクトルxの項目の値が充足したクリニカルパスウェイ分岐条件CPcを示す。ケース1では、特徴量ベクトルxが治療法P2bに関するクリニカルパスウェイ分岐条件CPcのE≦x[mg]でかつA≧y[%]を充足していることを示す。
提案情報1013は、予測対象モデルPTMの中で推奨する経路を提案する情報である。ケース1では、予測結果353において治療法P2bが最も治療奏功確率が高いとする。したがって、編集部705は、症状P1から治療法P2bへの経路を推奨経路とし、その旨の文字列情報を提案情報1013として作成する。また、編集部705は、推奨経路の症状P1および治療法P2bを強調表示し、この推奨経路と説明情報110とをリンクLKxで接続する。
このように、ケース1を示す第1画面1000の説明付きクリニカルパスウェイCPeでは、この特徴量ベクトルxで特定される患者については、当該患者の項目E,A,Cの順にその重要度が高く、かつ、当該患者は、症状P1の場合に治療法P2bが治療奏功確率が最も高い。したがって、医師は、当該患者が症状P1において治療法P2bを選択する場合、その根拠として重要度の順に項目E,A,Cを挙げて説明することができる。
図11は、説明付きクリニカルパスウェイCPeを表示する画面例(ケース2)を示す説明図である。ケース2は、ニューラルネットワークNNの予測結果353と、クリニカルパスウェイCPの予測対象とが不一致だが、予測対象モデルPTM内に予測結果353を表現可能な経路が存在するケースである。ケース2の画面を第2画面1100と称す。
第2画面1100は、重要度データ1001と、説明付きクリニカルパスウェイCPeと、を表示する画面である。ケース2では、特徴量ベクトルxは、E≦x[mg]、A<y[%]、C≧z[mmol/ml]であり、クリニカルパスウェイ分岐条件CPcのいずれも充足していないものとする。
説明付きクリニカルパスウェイCPeは、クリニカルパスウェイCPと説明情報110とをリンクLKxにより関連付けた情報である。説明情報110は、特徴量の重要性に関する予測分析情報1011と、クリニカルパスウェイ情報1012と、提案情報1013と、補足データ1114とを有し、編集部705によって作成される。
ケース2では、特徴量ベクトルxは、E≦x[mg]、A<y[%]、C≧z[mmol/ml]であり、クリニカルパスウェイ分岐条件CPcのいずれも充足していないため、クリニカルパスウェイ情報1012は、特徴量ベクトルxの項目の値が充足するための予クリニカルパスウェイ分岐条件CPcを示す。これにより、ユーザは、特徴量ベクトルxがクリニカルパスウェイ分岐条件CPcを充足していないことを確認することができる。
ケース2では、予測結果353において治療法P2cが最も高い治療奏功確率であったものとする。提案情報1013は、したがって、編集部705は、症状P1から治療法P2cへの経路を推奨経路とし、その旨の文字列情報を提案情報1013として作成する。また、編集部705は、推奨経路の症状P1および治療法P2cを強調表示し、この推奨経路と説明情報110とをリンクLKxで接続する。
補足データ1114は、提案情報1013を補足して、提案情報1013の根拠を示す。編集部705は、ケース2の患者の特徴量ベクトルxは、E≦x[mg]、A<y[%]、C≧z[mmol/ml]であり、この場合に、ニューラルネットワークNNでは治療法P2cが最も高い奏功確率(82%)であることを、補足データとして作成する。
このように、ケース2を示す第2画面1100の説明付きクリニカルパスウェイCPeでは、この特徴量ベクトルxで特定される患者については、特徴量ベクトルxが治療法P2a〜P2cのクリニカルパスウェイ分岐条件CPcのいずれにも該当しないが、ニューラルネットワークNNは、当該患者は治療法P2cの治療奏功確率が最も高いと予測した。このため、分析装置320は、クリニカルパスウェイCPと予測結果353との相違を指摘することができる。したがって、医師は、当該患者が症状P1において治療法P2cを選択した場合、その選択の根拠として、重要度の順に項目E,A,Cを挙げて説明することができる。また、このような症例が積み重なれば、治療法P2cに関するクリニカルパスウェイ分岐条件CPcの見直しやクリニカルパスウェイCPの修正などに寄与することができる。
図12は、説明付きクリニカルパスウェイCPeを表示する画面例(ケース3)を示す説明図である。ケース3は、ニューラルネットワークNNの予測結果353と、クリニカルパスウェイCPの予測対象とが不一致であり、かつ、予測対象モデルPTM内に予測結果353を表現可能な経路が存在しないケースである。ケース3の画面を第3画面1200と称す。
ケース3では、モデルパラメータMPに予測対象として治療法P2dが追加され、かつ、治療法P2a〜P2cのほか、治療法P2dを考慮した学習済みのニューラルネットワークNNが選択されたものとする。なお、治療法P2dは、クリニカルパスウェイCPには存在しないが、ユーザが治療法P2dも考慮したいと考えたためにモデルパラメータMPに追加されたものとする。
第3画面1200は、重要度データ1001と、説明付きクリニカルパスウェイCPeと、を表示する画面である。ケース3ではケース2と同様、特徴量ベクトルxは、E≦x[mg]、A<y[%]、C≧z[mmol/ml]であり、クリニカルパスウェイ分岐条件CPcのいずれも充足していないものとする。
説明付きクリニカルパスウェイCPeは、クリニカルパスウェイCPと説明情報110とをリンクLKxにより関連付けた情報である。説明情報110は、特徴量の重要性に関する予測分析情報1011と、クリニカルパスウェイ情報1012と、提案情報1013と、補足データ1114とを有し、編集部705によって作成される。
ケース3では、特徴量ベクトルxは、E≦x[mg]、A<y[%]、C≧z[mmol/ml]であり、クリニカルパスウェイ分岐条件CPcのいずれも充足していないため、クリニカルパスウェイ情報1012は、特徴量ベクトルxの項目の値が充足するためのクリニカルパスウェイ分岐条件CPcを示す。これにより、ユーザは、特徴量ベクトルxがクリニカルパスウェイ分岐条件CPcを充足していないことを確認することができる。
ケース3では、予測結果353において治療法P2が最も奏功確率が高かったものとする。提案情報1013は、したがって、編集部705は、症状P1から治療法P2cへの経路を推奨経路とし、その旨の文字列情報を提案情報1013として作成する。また、編集部705は、推奨経路の症状P1および治療法P2dを強調表示し、症状P1と治療法P2dとをリンクLKaで接続し、治療法P2dと治療P3dとをリンクLKbで接続し、症状P1から治療法P2dへの推奨経路と説明情報110とをリンクLKxで接続する。
補足データ1114は、提案情報1013の根拠を示す。編集部705は、ケース3の患者の特徴量ベクトルxは、ケース2と同様、E≦x[mg]、A<y[%]、C≧z[mmol/ml]であり、この場合に、ニューラルネットワークNNでは治療法P2dが最も高い治療奏功確率(67%)であり、予測対象である治療法P2a〜P2cの確率20%、32%、45%を上回っていることを、補足データとして作成する。
このように、ケース3を示す第3画面1200の説明付きクリニカルパスウェイCPeでは、この特徴量ベクトルxで特定される患者については、特徴量ベクトルxが治療法P2a〜P2cのクリニカルパスウェイ分岐条件CPcのいずれにも該当しないが、ニューラルネットワークNNは、当該患者はモデルパラメータMPで追加された治療法P2dによる治療奏功確率が最も高いと予測した。このため、分析装置320は、クリニカルパスウェイCPには予測結果353は存在しないことを確認し、かつ、クリニカルパスウェイCPにはない新たな診療経路およびその新しいクリニカルパスウェイ分岐条件CPcを特定することができる。したがって、医師は、当該患者が症状P1において治療法P2dを選択した場合、その選択の根拠として、重要度の順に項目E,A,Cを挙げて説明することができる。
図13は、説明付きクリニカルパスウェイCPeを表示する画面例(ケース4)を示す説明図である。ケース4は、クリニカルパスウェイCPが、図形データがない電子文書1301であり、当該電子文書に重要特徴量の項目に関する文字列が記載されているケースである。重要特徴量とは、項目の重要度が「High」以上の項目に関する文字列である。ケース4の画面を第4画面と称す。
ケース4では、クリニカルパスウェイCPの選択の際、パスウェイ選択部702は、たとえば、TF−IDFにより、予測対象モデルPTMに含まれる予測対象の重要特徴量が最も多く出現する電子文書を選択する。
第4画面1300は、重要度データ1001と、電子文書1301と、ランキングデータ1310と、を表示する。編集部705は、電子文書1301内の当該文字列(電子文書1301中、項目を示すA〜Eで表記)を検索して強調表示処理を施す。また、ケース1〜3と同様、編集部705は、重要度データ1001を作成する。また、編集部705は、項目の出現個数を重要度で重み付けして、項目ごとにスコアを算出し、スコアの降順で順位1311をつけたランキングデータ1310を作成する。
このように、電子文書1301では、診療経路が特定しづらいため、その代わりに、項目801とスコア1312とを比較することにより、重要特徴量がどの程度、電子文書(クリニカルパスウェイ)1301に存在するかを確認することができる。したがって、医師は、当該患者が症状P1において治療法P2a〜P2cのいずれかを選択した場合、その選択の根拠として、電子文書1301内の項目801のスコア1312の順に項目E,A,Cが記載されている箇所を参照して、説明することができる。
図14は、説明付きクリニカルパスウェイCPeを表示する画面例(ケース5)を示す説明図である。ケース5は、クリニカルパスウェイCPが、図形データがない電子文書1301であり、当該電子文書1301に重要特徴量の項目に関する文字列が記載されていないケースである。ケース5の画面を第5画面1400と称す。
ケース5では、ケース4と同様、クリニカルパスウェイCPの選択の際、パスウェイ選択部702は、たとえば、TF−IDFにより、予測対象モデルPTMに含まれる予測対象の重要特徴量が最も多く出現する電子文書を選択する。第5画面1400は、重要度データ1001を表示する。電子文書1301には重要特徴量が記載されていないため、第4画面1300のように表示しない。同様に、ランキングデータ1310も表示しない。
ケース5では、クリニカルパスウェイ(電子文書1301)CPは当てにならない。したがって、医師は、当該患者が症状P1において予測対象の治療法を選択した場合、その選択の根拠として、クリニカルパスウェイ(電子文書1301)CPを用いずに、重要度の順に項目E,A,Cを挙げて説明することができる。
(1)以上説明したように、分析装置320は、説明可能ベクトル生成部704と、ニューラルネットワークNNと、編集部705と、出力部706と、を有する。説明可能ベクトル生成部704は、患者の第1特徴項目{A〜E}に関する第1入力データ(特徴量ベクトルx)と、診療行為の工程に関するクリニカルパスウェイCP内の予測対象(P2a〜P2c)への遷移条件(クリニカルパスウェイ分岐条件CPc)を規定する第2特徴項目{A,C,E}と、医学的用語間の関連性を示すクリニカルターミノロジーCTと、に基づいて、第1特徴項目{A〜E}の重みを有する第2入力データ(説明可能ベクトルz)を生成する。
ニューラルネットワークNNは、第1入力データ(特徴量ベクトルx)と、説明可能ベクトル生成部704によって生成された第2入力データ(説明可能ベクトルz)と、を与えると、クリニカルパスウェイCP内の予測対象(P2a〜P2c)に対する予測結果353と、第1特徴項目{A〜E}の重要度1002と、を出力する。
編集部705は、ニューラルネットワークNNから出力された予測結果353および重要度1002に基づいて、クリニカルパスウェイCPを編集する。出力部706は、編集部705によって編集された編集結果を出力する。
これにより、編集結果を参照することにより、機械学習による予測に寄与した第1特徴項目{A〜E}とクリニカルパスウェイCPとの関連について解釈可能性の向上を図ることができる。
(2)また、上記(1)の分析装置320において、説明可能ベクトル生成部704は、第2特徴項目{A,C,E}に一致する第1特徴項目{A〜E}である共通項目{A,C,E}の重みを、第2特徴項目{A,C,E}に一致しない第1特徴項目{A〜E}である非共通項目{B,D}の重みよりも高い値に設定することにより、第2入力データ(説明可能ベクトルz)を生成する。
これにより、共通項目であるほど高い重み値で特徴項目に対する重み付けが可能となり、特徴項目を重要度で差別化することができる。
(3)また、上記(1)において、編集部705は、予測結果353および重要度1002を用いて予測結果353の根拠を示す説明情報110を生成し、クリニカルパスウェイCP内の予測対象(P2a〜P2c)と説明情報110とを関連付けることにより、説明付きクリニカルパスウェイCPeを編集結果として生成する。
これにより、予測結果353の説明の根拠をクリニカルパスウェイCPと関連性の明確化を図ることができる。
(4)また、上記(3)の分析装置320において、編集部705は、説明付きクリニカルパスウェイCPeと第1特徴項目{A〜E}の重要度1002とを編集結果として生成する。
これにより、どの特徴項目が重要でどの特徴項目が重要でないかを明確にして、予測結果353の説明の根拠とすることができる。
(5)上記(3)の分析装置320において、編集部705は、第1入力データ(特徴量ベクトルx)が予測対象(P2a〜P2c)のうち特定の予測対象P2bの遷移条件(E≦x、A≧y)を充足し、かつ、特定の予測対象P2bへの遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り予測結果353の中で最も評価が高い場合、特定の予測対象P2bへの遷移を推奨する提案1013を含む説明情報110を生成し、クリニカルパスウェイCP内の特定の予測対象P2bと説明情報110とを関連付けることにより、説明付きクリニカルパスウェイCPeを編集結果として生成する。
これにより、当該患者の特徴項目E,A,Cの順にその重要度が高く、かつ、当該患者は、症状P1の場合に治療法P2bによる治療奏功確率が最も高いため、医師は、当該患者が症状P1において治療法P2bを選択した場合、その選択の根拠として重要度の順に項目E,A,Cを挙げて説明することができる。
(6)上記(3)の分析装置320において、編集部705は、第1入力データ(特徴量ベクトルx)が予測対象(P2a〜P2c)のいずれの遷移条件(クリニカルパスウェイ分岐条件CPc)も充足しないが、予測対象(P2a〜P2c)のうち特定の予測対象P2cへの遷移の発生確率が予測結果353の中で最も高い場合、特定の予測対象P2cへの遷移を推奨する提案1013を含む説明情報110を生成し、クリニカルパスウェイCP内の特定の予測対象P2cと説明情報110とを関連付けることにより、説明付きクリニカルパスウェイCPeを編集結果として生成する。
これにより、クリニカルパスウェイCPと予測結果353との相違を指摘することができる。したがって、医師は、当該患者が症状P1において治療法P2cを選択した場合、その選択の根拠として、重要度の順に項目E,A,Cを挙げて説明することができる。また、このような症例が積み重なれば、治療法P2cに関するクリニカルパスウェイ分岐条件CPcの見直しやクリニカルパスウェイCPの修正などに寄与することができる。
(7)また、上記(6)の分析装置320において、編集部705は、説明情報110に、特定の予測対象P2cへの遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り予測結果353の中で最も評価が高いことを示す、提案1013を補足する補足データ1114を追加する。これにより、特定の予測対象P2cへの遷移の推奨根拠を提示することができる。
(8)また、上記(3)の分析装置320において、編集部705は、第1入力データ(特徴量ベクトルx)が予測対象(P2a〜P2c)のいずれの遷移条件(クリニカルパスウェイ分岐条件CPc)も充足しないが、予測対象外P2dへの遷移LKaの発生確率が予測結果353の中で最も高い場合、予測対象外P2dへの遷移LKaを推奨する提案1013を含む説明情報110を生成し、クリニカルパスウェイCP内に予測対象外P2dおよび予測対象外P2dへの遷移LKaを追加し、当該遷移LKaと説明情報110とを関連付けることにより、説明付きクリニカルパスウェイCPeを編集結果として生成する。
これにより、クリニカルパスウェイCPには予測結果353は存在しないことを確認し、かつ、クリニカルパスウェイCPにはない新たな診療経路およびその新しいクリニカルパスウェイ分岐条件CPcを特定することができる。したがって、医師は、当該患者が症状P1において治療法P2dを選択した場合、その選択の根拠として、重要度の順に項目E,A,Cを挙げて説明することができる。
(9)また、上記(8)の分析装置320において、編集部705は、説明情報110に、予測対象外P2dへの遷移LKaが予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り予測結果353の中で最も評価が高いことを示す、提案1013を補足する補足データ1114を追加する。これにより、予測対象外P2dへの遷移LKaの推奨根拠を提示することができる。
(10)また、上記(3)の分析装置320において、編集部705は、クリニカルパスウェイCPが文章により構成された電子文書1301であり、かつ、電子文書1301内において所定重要度(High)以上の特定重要度の第1特徴項目{A,E}を示す用語がある場合、特定重要度の第1特徴項目{A,E}を示す用語を強調表示可能に設定し、電子文書1301内での第1特徴項目{A〜E}を示す用語の出現頻度と重要度1002とに基づいて、第1特徴項目{A〜E}の重要性を示すスコア1312を算出することにより、説明付きクリニカルパスウェイCPeを編集結果として生成する。
これにより、特定重要度の第1特徴項目{A,E}を示す用語がどの程度、電子文書(クリニカルパスウェイ)1301に存在するかを確認することができる。したがって、医師は、当該患者が症状P1において治療法P2a〜P2cのいずれかを選択した場合、その選択の根拠として、電子文書1301内の項目801のスコア1312の順に項目E,A,Cが記載されている箇所を参照して、説明することができる。
(11)また、上記(3)の分析装置320において、編集部705は、クリニカルパスウェイCPが文章により構成された電子文書1301であり、かつ、電子文書1301内において所定重要度(High)以上の特定重要度の第1特徴項目{A,E}を示す用語がない場合、第1特徴項目{A〜E}の重要度1002を編集結果として生成する。
これにより、医師は、予測対象(P2a〜P2c)に遷移した根拠として、クリニカルパスウェイ(電子文書1301)CPを用いずに、重要度1002の順に項目E,A,Cを挙げて説明することができる。
また、分析装置320は、変換部501と、再配置部502と、重要度算出部504と、を有する。したがって、特徴量ベクトルxの事前再配置により、線形な予測モデルが得られるため、学習時および予測時において、高精度かつ低負荷で予測値を算出することができる。また、特徴量ベクトルxにどのような特徴があるかを、重要度算出部504からの階層lごとの重要度により把握することができる。これにより、ニューラルネットワークNNに与えられた特徴ベクトルxについての説明の容易化を高精度かつ効率的に実現することができる。
また、分析装置320は、予測データ算出部503を有するため、特徴ベクトルxに対し、ニューラルネットワークNNからの予測結果353が得られた理由についての説明の容易化を高精度かつ効率的に実現ができる。
また、分析装置320は、設定部505と統合部506とを有することにより、予測データ算出部503は、再配置結果に基づく予測結果353を高精度に算出することができる。
また、分析装置320は、縮約部507を有することにより、次元縮約によりデータ分析の効率化を図ることができる。
また、分析装置320は、学習パラメータ365の学習により、高精度な予測モデルを構築することができる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。また、尚、本実施例において予測分析情報1011、クリニカルパスウェイ情報1012、提案情報1013、補足データ1114などを文章で記載しているが、表やグラフなどの形態でも良く、またこれらのうちどれかが表示され無くとも良い。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
3 分析システム
110 説明情報
300 クライアント端末
320 分析装置
361 学習部
362 予測部
364 訓練データ集合
365 学習パラメータ
501 変換部
502 再配置部
503 予測データ算出部
504 重要度算出部
505 設定部
506 統合部
507 縮約部
508 選択部
701 モデルパラメータ設定部
702 パスウェイ選択部
703 特徴量ベクトル生成部
704 説明可能ベクトル生成部
705 編集部
706 出力部

Claims (12)

  1. 患者の第1特徴項目に関する第1入力データと、診療行為の工程に関するクリニカルパスウェイ内の予測対象への遷移に関する第2特徴項目と、医学的用語間の関連性を示すクリニカルターミノロジーと、に基づいて、前記第1特徴項目の重みを有する第2入力データを生成する生成部と、
    前記第1入力データと、前記生成部によって生成された第2入力データと、を与えると、前記クリニカルパスウェイ内の予測対象に対する予測結果と、前記第1特徴項目の重要度と、を出力するニューラルネットワークと、
    前記ニューラルネットワークから出力された予測結果および重要度に基づいて、前記クリニカルパスウェイを編集する編集部と、
    前記編集部によって編集された編集結果を出力する出力部と、
    を有することを特徴とする分析装置。
  2. 請求項1に記載の分析装置であって、
    前記生成部は、前記第2特徴項目に一致する第1特徴項目である共通項目の重みを、前記第2特徴項目に一致しない第1特徴項目である非共通項目の重みよりも高い値に設定することにより、前記第2入力データを生成する、
    ことを特徴とする分析装置。
  3. 請求項1に記載の分析装置であって、
    前記編集部は、前記予測結果および重要度を用いて前記予測結果の根拠を示す説明情報を生成し、前記クリニカルパスウェイ内の予測対象と前記説明情報とを関連付けることにより、説明付きクリニカルパスウェイを前記編集結果として生成する、
    ことを特徴とする分析装置。
  4. 請求項3に記載の分析装置であって、
    前記編集部は、前記説明付きクリニカルパスウェイと前記第1特徴項目の重要度とを前記編集結果として生成する、
    ことを特徴とする分析装置。
  5. 請求項3に記載の分析装置であって、
    前記編集部は、前記第1入力データが前記予測対象のうち特定の予測対象の遷移条件を充足し、かつ、前記特定の予測対象への遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り前記予測結果の中で最も評価が高い場合、前記特定の予測対象への遷移を推奨する提案を含む説明情報を生成し、前記クリニカルパスウェイ内の前記特定の予測対象と前記説明情報とを関連付けることにより、説明付きクリニカルパスウェイを前記編集結果として生成する、
    ことを特徴とする分析装置。
  6. 請求項3に記載の分析装置であって、
    前記編集部は、前記第1入力データが前記予測対象のいずれの遷移条件も充足しないが、前記予測対象のうち特定の予測対象への遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り前記予測結果の中で最も評価が高い場合、前記特定の予測対象への遷移を推奨する提案を含む説明情報を生成し、前記クリニカルパスウェイ内の前記特定の予測対象と前記説明情報とを関連付けることにより、説明付きクリニカルパスウェイを前記編集結果として生成する、
    ことを特徴とする分析装置。
  7. 請求項6に記載の分析装置であって、
    前記編集部は、前記説明情報に、前記特定の予測対象への遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り前記予測結果の中で最も評価が高いことを示す、前記提案を補足する補足データを追加する、
    ことを特徴とする分析装置。
  8. 請求項3に記載の分析装置であって、
    前記編集部は、前記第1入力データが前記予測対象のいずれの遷移条件も充足しないが、予測対象外への遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り前記予測結果の中で最も評価が高い場合、前記予測対象外への遷移を推奨する提案を含む説明情報を生成し、前記クリニカルパスウェイ内に前記予測対象外および前記予測対象外への遷移を追加し、当該遷移と前記説明情報とを関連付けることにより、説明付きクリニカルパスウェイを前記編集結果として生成する、
    ことを特徴とする分析装置。
  9. 請求項8に記載の分析装置であって、
    前記編集部は、前記説明情報に、前記予測対象外への遷移が予測パラメータとして与えられまたは規定値として設定された予測対象の順位付けルールに則り前記予測結果の中で最も評価が高いことを示す、前記提案を補足する補足データを追加する、
    ことを特徴とする分析装置。
  10. 請求項3に記載の分析装置であって、
    前記編集部は、前記クリニカルパスウェイが文章により構成された電子文書であり、かつ、前記電子文書内において所定重要度以上の特定重要度の第1特徴項目を示す用語がある場合、前記特定重要度の第1特徴項目を示す用語を強調表示可能に設定し、前記電子文書内での前記第1特徴項目を示す用語の出現頻度と前記重要度とに基づいて、前記第1特徴項目の重要性を示すスコアを算出することにより、説明付きクリニカルパスウェイを前記編集結果として生成する、
    ことを特徴とする分析装置。
  11. 請求項3に記載の分析装置であって、
    前記編集部は、前記クリニカルパスウェイが文章により構成された電子文書であり、かつ、前記電子文書内において所定重要度以上の特定重要度の第1特徴項目を示す用語がない場合、前記第1特徴項目の重要度を前記編集結果として生成する、
    ことを特徴とする分析装置。
  12. プロセッサが、
    患者の第1特徴項目に関する第1入力データと、診療行為の工程に関するクリニカルパスウェイ内の予測対象への遷移条件を規定する第2特徴項目と、医学的用語間の関連性を示すクリニカルターミノロジーと、に基づいて、前記第1特徴項目の重みを有する第2入力データを生成する生成処理と、
    前記第1入力データと、前記生成処理によって生成された第2入力データと、を与えると、前記クリニカルパスウェイ内の予測対象に対する予測結果と、前記第1特徴項目の重要度と、を出力するニューラルネットワークにより予測する予測処理と、
    前記ニューラルネットワークから出力された予測結果および重要度に基づいて、前記クリニカルパスウェイを編集する編集処理と、
    前記編集処理によって編集された編集結果を出力する出力処理と、
    を実行することを特徴とする分析方法。
JP2018006370A 2018-01-18 2018-01-18 分析装置および分析方法 Active JP6893480B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018006370A JP6893480B2 (ja) 2018-01-18 2018-01-18 分析装置および分析方法
US16/245,096 US11527325B2 (en) 2018-01-18 2019-01-10 Analysis apparatus and analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018006370A JP6893480B2 (ja) 2018-01-18 2018-01-18 分析装置および分析方法

Publications (2)

Publication Number Publication Date
JP2019125240A true JP2019125240A (ja) 2019-07-25
JP6893480B2 JP6893480B2 (ja) 2021-06-23

Family

ID=67213036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018006370A Active JP6893480B2 (ja) 2018-01-18 2018-01-18 分析装置および分析方法

Country Status (2)

Country Link
US (1) US11527325B2 (ja)
JP (1) JP6893480B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021071823A (ja) * 2019-10-30 2021-05-06 富士通株式会社 予測モデル説明方法、予測モデル説明プログラム、予測モデル説明装置
JP7034453B1 (ja) * 2021-03-03 2022-03-14 株式会社Fronteo 情報解析装置、情報解析方法および情報解析用プログラム
JP2022549316A (ja) * 2019-09-24 2022-11-24 グーグル エルエルシー 強化学習ベースの局所解釈可能モデル
JP7353952B2 (ja) 2019-12-09 2023-10-02 株式会社日立製作所 分析システムおよび分析方法
JP7453076B2 (ja) 2020-07-03 2024-03-19 株式会社日立製作所 生成装置、生成方法、および生成プログラム
JP7476600B2 (ja) 2020-03-24 2024-05-01 富士フイルムビジネスイノベーション株式会社 情報処理装置、及びコンピュータプログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11152119B2 (en) * 2018-09-11 2021-10-19 Hitachi, Ltd. Care path analysis and management platform
US11315008B2 (en) * 2018-12-31 2022-04-26 Wipro Limited Method and system for providing explanation of prediction generated by an artificial neural network model
EP3745416A1 (en) * 2019-05-29 2020-12-02 Koninklijke Philips N.V. Clinical decision support
US11657920B2 (en) * 2019-07-08 2023-05-23 Koninklijke Philips N.V. Dynamic and locally-faithful explanation of machine learning models for precision medicine
US11711310B2 (en) 2019-09-18 2023-07-25 Tweenznet Ltd. System and method for determining a network performance property in at least one network
EP3806107A1 (en) * 2019-10-11 2021-04-14 C The Signs Limited Diagnostic tool
US11716338B2 (en) * 2019-11-26 2023-08-01 Tweenznet Ltd. System and method for determining a file-access pattern and detecting ransomware attacks in at least one computer network
US10734105B1 (en) 2019-11-30 2020-08-04 Kpn Innovations, Llc Methods and systems for informed selection of prescriptive therapies
US11901056B2 (en) * 2019-11-30 2024-02-13 Kpn Innovations, Llc Methods and systems for informed selection of prescriptive therapies
CN112652405A (zh) * 2020-12-24 2021-04-13 平安科技(深圳)有限公司 临床路径的挖掘方法、装置、设备及存储介质
WO2023101884A1 (en) * 2021-12-03 2023-06-08 F. Hoffmann-La Roche Ag Automated parallelized processing of decision-tree guidelines using electronic record

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02196334A (ja) * 1989-01-26 1990-08-02 Toshiba Corp 医療情報処理方式
JP2006043007A (ja) * 2004-08-02 2006-02-16 Fujitsu Ltd 診断支援プログラムおよび診断支援装置
JP2014048798A (ja) * 2012-08-30 2014-03-17 Canon Inc 医療診断支援装置、医療診断支援方法及びプログラム
JP2015153306A (ja) * 2014-02-18 2015-08-24 株式会社日立製作所 標準外治療判定支援システム、標準外治療判定支援方法、および標準外治療判定支援プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7444308B2 (en) * 2001-06-15 2008-10-28 Health Discovery Corporation Data mining platform for bioinformatics and other knowledge discovery
WO2006035383A1 (en) 2004-09-30 2006-04-06 Koninklijke Philips Electronics N.V. Decision support systems for clinical guideline and for navigatiing said clinical guidelines according to different levels of abstraction
JP4775358B2 (ja) 2007-10-19 2011-09-21 株式会社日立製作所 クリニカルパス運用支援情報システム
US20100145720A1 (en) * 2008-12-05 2010-06-10 Bruce Reiner Method of extracting real-time structured data and performing data analysis and decision support in medical reporting
US20120310694A1 (en) 2009-12-10 2012-12-06 Koninklijke Philips Electronics N.V. Enhancements To Executable Guideline Engines
US8744870B2 (en) 2010-12-10 2014-06-03 Infosys Limited Method and system for forecasting clinical pathways and resource requirements
JP5854187B2 (ja) 2011-05-24 2016-02-09 日本電気株式会社 業務フロー検索装置、業務フロー検索方法、およびプログラム
US20120310667A1 (en) 2011-06-03 2012-12-06 Roy Altman Dynamic clinical pathways
JP5695586B2 (ja) 2012-02-24 2015-04-08 株式会社日立製作所 Xml文書検索装置及びプログラム
US9996889B2 (en) * 2012-10-01 2018-06-12 International Business Machines Corporation Identifying group and individual-level risk factors via risk-driven patient stratification
US10483003B1 (en) * 2013-08-12 2019-11-19 Cerner Innovation, Inc. Dynamically determining risk of clinical condition
WO2015176011A1 (en) * 2014-05-15 2015-11-19 The Johns Hopkins University Method, system and computer-readable media for treatment plan risk analysis
WO2016036831A1 (en) * 2014-09-02 2016-03-10 Kyron, Inc. System for generating and updating treatment guidelines and estimating effect size of treatment steps
US20160283686A1 (en) * 2015-03-23 2016-09-29 International Business Machines Corporation Identifying And Ranking Individual-Level Risk Factors Using Personalized Predictive Models
US20170177822A1 (en) * 2015-12-18 2017-06-22 Pointright Inc. Systems and methods for providing personalized prognostic profiles
US10546237B2 (en) * 2017-03-30 2020-01-28 Atomwise Inc. Systems and methods for correcting error in a first classifier by evaluating classifier output in parallel
JP2017168129A (ja) 2017-05-12 2017-09-21 ヒューレット パッカード エンタープライズ デベロップメント エル ピーHewlett Packard Enterprise Development LP カスタマイズ可能なコンプライアンス・ポリシーを有する電子カルテシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02196334A (ja) * 1989-01-26 1990-08-02 Toshiba Corp 医療情報処理方式
JP2006043007A (ja) * 2004-08-02 2006-02-16 Fujitsu Ltd 診断支援プログラムおよび診断支援装置
JP2014048798A (ja) * 2012-08-30 2014-03-17 Canon Inc 医療診断支援装置、医療診断支援方法及びプログラム
JP2015153306A (ja) * 2014-02-18 2015-08-24 株式会社日立製作所 標準外治療判定支援システム、標準外治療判定支援方法、および標準外治療判定支援プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西村悟史 ほか: "行動根拠の納得と実行を促進する人間行動モデルCHARM", 2011年度人工知能学会全国大会(第25回)論文集 [CD-ROM], JPN6021017978, 1 June 2011 (2011-06-01), JP, pages 1 - 4, ISSN: 0004508648 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022549316A (ja) * 2019-09-24 2022-11-24 グーグル エルエルシー 強化学習ベースの局所解釈可能モデル
JP7304488B2 (ja) 2019-09-24 2023-07-06 グーグル エルエルシー 強化学習ベースの局所解釈可能モデル
JP2021071823A (ja) * 2019-10-30 2021-05-06 富士通株式会社 予測モデル説明方法、予測モデル説明プログラム、予測モデル説明装置
JP7395960B2 (ja) 2019-10-30 2023-12-12 富士通株式会社 予測モデル説明方法、予測モデル説明プログラム、予測モデル説明装置
JP7353952B2 (ja) 2019-12-09 2023-10-02 株式会社日立製作所 分析システムおよび分析方法
JP7476600B2 (ja) 2020-03-24 2024-05-01 富士フイルムビジネスイノベーション株式会社 情報処理装置、及びコンピュータプログラム
JP7453076B2 (ja) 2020-07-03 2024-03-19 株式会社日立製作所 生成装置、生成方法、および生成プログラム
JP7034453B1 (ja) * 2021-03-03 2022-03-14 株式会社Fronteo 情報解析装置、情報解析方法および情報解析用プログラム
WO2022185442A1 (ja) * 2021-03-03 2022-09-09 株式会社Fronteo 情報解析装置、情報解析方法および情報解析用プログラム

Also Published As

Publication number Publication date
US20190221311A1 (en) 2019-07-18
US11527325B2 (en) 2022-12-13
JP6893480B2 (ja) 2021-06-23

Similar Documents

Publication Publication Date Title
JP6893480B2 (ja) 分析装置および分析方法
Shickel et al. Deep EHR: a survey of recent advances in deep learning techniques for electronic health record (EHR) analysis
RU2703679C2 (ru) Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов
JP6780520B2 (ja) オープンデータ及び臨床医の入力を用いて患者のリスクを評価するシステム及び方法
US8949082B2 (en) Healthcare information technology system for predicting or preventing readmissions
US10943676B2 (en) Healthcare information technology system for predicting or preventing readmissions
US20140149132A1 (en) Adaptive medical documentation and document management
US20080033894A1 (en) Prognosis Modeling From One or More Sources of Information
JP2008532104A (ja) 複数の医療関連アウトカムの予測を行い、インターベンション計画の評価を行い、更に同時にバイオマーカー因果性検証を行うことのできる、予測モデルを生成して適用する方法、そのシステム、及びそのコンピュータ・プログラム製品
Stivaros et al. Decision support systems for clinical radiological practice—towards the next generation
Caetano et al. Using data mining for prediction of hospital length of stay: An application of the CRISP-DM methodology
US10424403B2 (en) Adaptive medical documentation system
JP7107375B2 (ja) 状態遷移予測装置、予測モデル学習装置、方法およびプログラム
US20190147993A1 (en) Clinical report retrieval and/or comparison
US20190318829A1 (en) Adaptive medical documentation system
Zhang et al. Advanced diagnostic imaging utilization during emergency department visits in the United States: A predictive modeling study for emergency department triage
CN109074858A (zh) 没有明显准标识符的去识别的健康护理数据库的医院匹配
CN114078593A (zh) 临床决策支持
Khilji et al. Healfavor: Dataset and a prototype system for healthcare chatbot
JP7437386B2 (ja) 医療記録を分類する方法
Rabie et al. A decision support system for diagnosing diabetes using deep neural network
JP2020042645A (ja) 時系列データ分析装置、時系列データ分析方法、および時系列データ分析プログラム
Vathy-Fogarassy et al. Multi-level process mining methodology for exploring disease-specific care processes
US20230307133A1 (en) Method and system for generating a patient-specific clinical meta-pathway using machine learning
JP2016153961A (ja) 医用情報処理装置および医用情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210601

R150 Certificate of patent or registration of utility model

Ref document number: 6893480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150