JP2024034529A - 情報処理装置、情報処理方法、及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法、及び情報処理プログラム Download PDF

Info

Publication number
JP2024034529A
JP2024034529A JP2022138808A JP2022138808A JP2024034529A JP 2024034529 A JP2024034529 A JP 2024034529A JP 2022138808 A JP2022138808 A JP 2022138808A JP 2022138808 A JP2022138808 A JP 2022138808A JP 2024034529 A JP2024034529 A JP 2024034529A
Authority
JP
Japan
Prior art keywords
model
prediction
data
information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022138808A
Other languages
English (en)
Inventor
大記 古川
翔太郎 三沢
竜示 狩野
大和 鑓水
友紀 谷口
智子 大熊
浩平 小野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2022138808A priority Critical patent/JP2024034529A/ja
Priority to US18/457,331 priority patent/US20240071619A1/en
Publication of JP2024034529A publication Critical patent/JP2024034529A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】特定の対象に関する情報を表す情報データに含まれる項目毎に、適切な重要度を導出することができる情報処理装置、情報処理方法、及び情報処理プログラムを提供する。【解決手段】第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備え、前記プロセッサは、特定の対象に関する情報を表す情報データを取得し前記情報データに基づいて、前記複数のモデルから予測に用いる選択モデルを選択し、前記選択モデルを用いて、前記情報データに含まれる項目毎に前記特定の対象に対する重要度を導出する。【選択図】図11

Description

本開示は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
特定の対象に関する情報を表す情報データに含まれる項目毎に、機械学習モデルを用いて得られた特定の対象に対する重要度を導出する技術が知られている。このような重要度として、例えば、機械学習モデルにおける出力データの導出に対する入力データの寄与度が挙げられる。寄与度を導出するための技術としては、LIME(Local Interpretable Model-agnostic Explanations)等の手法が挙げられる。
例えば、特許文献1には、人物に係る単語データを入力とし、その人物に対する評価を出力する予測モデルに対する、単語毎の寄与度を導出する技術が開示されている。
特開2020-113218号公報
ところで、特定の対象の状態等に応じて、適用すべき機械学習モデルが異なる場合がある。そのため、適切ではない機械学習モデルを適用して特定の対象に対する重要度を導出した場合、導出された重要度が適切とはいえない場合があった。
本開示は、上記の事情を鑑みてなされたものであり、特定の対象に関する情報を表す情報データに含まれる項目毎に、適切な重要度を導出することができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
上記目的を達成するために本開示の第1の態様の情報処理装置は、第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備え、プロセッサは、特定の対象に関する情報を表す情報データを取得し、情報データに基づいて、複数のモデルから予測に用いる選択モデルを選択し、選択モデルを用いて、情報データに含まれる項目毎に特定の対象に対する重要度を導出する。
第2の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、情報データを第1モデルに入力させ、第1予測タスクに係わる出力結果を取得し、出力結果に基づいて、第1モデルまたは第2モデルのいずれかを選択モデルとして選択する。
第3の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、第1予測タスクは、第1状態になる確率を導出するタスクであり、第2予測タスクは、第1状態と異なる第2状態に係わるタスクであり、プロセッサは、第1状態になる確率が閾値を超える場合、第1モデルを選択モデルとして選択し、第1状態になる確率が閾値以下の場合、第2モデルを選択モデルとして選択する。
第4の態様の情報処理装置は、第1の態様の情報処理装置において、情報データは、複数の文書データを含む文書データ群であり、文書データ群を第1モデルに入力させ、第1予測タスクに係わる出力結果を取得し、出力結果に基づいて、第1モデルまたは第2モデルのいずれかを選択モデルとして選択し、選択モデルを用いて、文書データ群に含まれる文書データ毎の選択モデルにおける重要度を導出する。
第5の態様の情報処理装置は、第1の態様の情報処理装置において、第1データは、複数の患者の各々に対応付けられた複数の第1医療情報データであり、特定の対象は、特定の患者であり、情報データは、特定の患者が対応付けられた複数の第2医療情報データであり、項目は、複数の第2医療情報データの各々である。
第6の態様の情報処理装置は、第1の態様の情報処理装置において、第1予測タスク及び第2予測タスクの各々は、医療に関連するタスクである。
第7の態様の情報処理装置は、第6の態様の情報処理装置において、第1予測タスクは、死亡予測タスクであり、第2予測タスクは、長期入院予測タスクまたは合併症予測タスクである。
また、上記目的を達成するために本開示の第8の態様の情報処理方法は、第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置のプロセッサが実行する情報処理方法であって、特定の対象に関する情報を表す情報データを取得し、情報データに基づいて、複数のモデルから予測に用いる選択モデルを選択し、選択モデルを用いて、情報データに含まれる項目毎に特定の対象に対する重要度を導出する。
また、上記目的を達成するために本開示の第9の態様の情報処理プログラムは、第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置のプロセッサに、特定の対象に関する情報を表す情報データを取得し、情報データに基づいて、複数のモデルから予測に用いる選択モデルを選択し、選択モデルを用いて、情報データに含まれる項目毎に特定の対象に対する重要度を導出する処理を実行させるためのものである。
本開示によれば、特定の対象に関する情報を表す情報データに含まれる項目毎に、適切な重要度を導出することができる。
実施形態の情報処理システムにおける全体の構成の一例を概略的に表した構成図である。 患者情報の一例について説明するための図である。 第1実施形態の情報処理装置の構成の一例を示すブロック図である。 死亡予測モデルの入力及び出力を説明するための図である。 死亡予測モデルの学習フェーズにおける処理の概要を示す図である。 長期入院予測モデルの入力及び出力を説明するための図である。 長期入院予測モデルの学習フェーズにおける処理の概要を示す図である。 第1実施形態の情報処理装置の構成の一例を表す機能ブロック図である。 第1実施形態の情報処理装置の作用を説明するための図である。 第1実施形態の情報処理装置の作用を説明するための図である。 第1実施形態の情報処理装置による情報処理の流れの一例を表したフローチャートである。 表示部に文書データを表示させた状態の一例を示す図である。 第2実施形態の情報処理装置が備えるストレージの構成の一例を示すブロック図である。 第2実施形態の情報処理装置の構成の一例を表す機能ブロック図である。 第2実施形態の情報処理装置の作用を説明するための図である。 第2実施形態の情報処理装置の作用を説明するための図である。 死亡予測評価値に対する重みと長期入院予測結果に対する重みとを説明するための図である。 第2実施形態の情報処理装置による情報処理の流れの一例を表したフローチャートである。 第2実施形態の情報処理装置の作用を説明するための図である。
以下、図面を参照して本開示の実施形態を詳細に説明する。なお、本実施形態は本開示の技術を限定するものではない。
[第1実施形態]
まず、本実施形態の情報処理システムにおける、全体の構成の一例について説明する。図1には、本実施形態の情報処理システム1における、全体の構成の一例を表す構成図が示されている。図1に示すように、本実施形態の情報処理システム1は、情報処理装置10及び患者情報DB(DataBase)14を備える。情報処理装置10及び患者情報DB14は、ネットワーク9を介して有線通信または無線通信により接続されている。
患者情報DB14には、複数の患者に関する患者情報15が記憶される。患者情報DB14は、汎用コンピュータにデータベース管理システム(DataBase Management system:DBMS)の機能を提供するソフトウェアプログラムがインストールされたサーバ装置等に備えられた、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等の記憶媒体によって実現される。
一例として本実施形態の患者情報15は、特定の患者の診療に係わる文書を表す文書データ15Dである。図2に示すように、文書データ15Dは、例えば、カルテ情報や、患者プロファイル情報、及び検査結果情報を含む。なお、本実施形態において「文書」とは、単語及び文の少なくとも一方を構成要素とした情報である。例えば、文書は、1つの単語のみを含んでいてもよいし、また、複数の文を含んでいてもよい。図2に示した例では、カルテ情報である文書データ15Dとして、「9/5S」、「9/5O」、「9/5A」、「9/7O」、及び「9/7P」の5つが図示されている。また、患者プロファイル情報である文書データ15Dとして、「年齢・性別」及び「既往症」の2つが図示されている。また、検査結果情報の文書データ15Dとして、「アルブミン」(アルブミンの検査値)、及び「尿素・窒素」(尿素の検査値と窒素の検査値)の2つが図示されている。
患者情報15は、特定の患者毎に、患者を識別するための識別情報と対応付けられて患者情報DB14に記憶されている。
本実施形態の特定の患者が、本開示の特定の対象の一例であり、本実施形態の患者情報15が、本開示の情報データの一例であり、本実施形態の文書データ15Dが、本開示の項目の一例である。
情報処理装置10は、特定の患者の患者情報15に基づいて、詳細を後述する(図9、図10参照)死亡予測モデル32及び長期入院予測モデル33のうち、特定の患者の診療に関する予測に用いるのに適切なモデルを選択し、選択したモデルを用いて、医師等のユーザに情報を提供する装置である。
図3に示すように本実施形態の情報処理装置10は、制御部20、記憶部22、通信I/F(Interface)部24、操作部26、及び表示部28を備えている。制御部20、記憶部22、通信I/F部24、操作部26、及び表示部28はシステムバスやコントロールバス等のバス29を介して相互に各種情報の授受が可能に接続されている。
本実施形態の制御部20は、情報処理装置10の全体の動作を制御する。制御部20は、プロセッサであり、CPU(Central Processing Unit)20Aを備える。また、制御部20は、後述する記憶部22と接続される。なお、制御部20は、GPU(Graphics Processing Unit)を備えても良い。
操作部26は、特定の患者の予後予測に関する指示や各種情報等をユーザが入力するために用いられる。操作部26は特に限定されるものではなく、例えば、各種スイッチ、タッチパネル、タッチペン、及びマウス等が挙げられる。表示部28は、死亡予測結果16、文書データ15D、及び各種情報等を表示する。なお、操作部26と表示部28とを一体化してタッチパネルディスプレイとしてもよい。
通信I/F部24は、無線通信または有線通信により、ネットワーク9を介して患者情報DB14との間で各種情報の通信を行う。情報処理装置10は、患者情報DB14から患者情報15を、通信I/F部24を介して無線通信または有線通信により受信する。
記憶部22は、ROM(Read Only Memory)22A、RAM(Random Access Memory)22B、ストレージ22Cを備える。ROM22Aには、CPU20Aにより実行される各種のプログラム等が予め記憶されている。RAM22Bは、各種データを一時的に記憶する。ストレージ22Cは、CPU20Aで実行される情報処理プログラム30、死亡予測モデル32、長期入院予測モデル33、及びその他の各種情報等が記憶される。ストレージ22Cは不揮発性の記憶部であり、例えば、HDDやSSD等が挙げられる。
本実施形態の死亡予測モデル32は、図4に示すように患者情報15を入力すると、死亡予測結果16として、患者が死亡状態となる確率、具体的には死亡確率を死亡予測結果16として出力するモデルである。本実施形態の死亡状態が、本開示の第1状態の一例であり、本実施形態の死亡予測モデル32が、本開示の第1モデルの一例である。
一例として図5に示すように、本実施形態の死亡予測モデル32は、学習フェーズにおいて、訓練データまたは教師データとも呼ばれる第1学習データ90を与えられて学習される。第1学習データ90は、学習用患者情報95と、正解死亡予測結果96Cとの組である。第1学習データ90は、ある患者の診療に係わる複数の学習用文書データ95Dを含む。正解死亡予測結果96Cは、例えば、その患者の予後を実際に観察した結果から得られた死亡確率である。具体的には、実際に死亡した患者の死亡確率を1(100%))」、「死亡しなかった患者の死亡確率を0(0%)」とする。なお、死亡確率については、100%及び0%に限らず、種々の調整が可能である。例えば、死亡までの期間が長い場合は死亡確率を100%から低下させる等としてもよい。なお、本形態に限定されず、正解死亡予測結果96Cとして、例えば、医師が学習用文書データ95Dを参照して、その患者に対して実際に下した死亡確率を用いてもよい。
学習フェーズにおいて、死亡予測モデル32には、学習用患者情報95が学習用文書データ95D毎にベクトル化されて入力される。死亡予測モデル32は、学習用患者情報95に対して学習用死亡予測結果96を出力する。学習用死亡予測結果96及び正解死亡予測結果96Cに基づいて、損失関数を用いた死亡予測モデル32の損失演算がなされる。そして、損失演算の結果に応じて死亡予測モデル32の各種係数の更新設定がなされ、更新設定にしたがって、死亡予測モデル32が更新される。
学習フェーズにおいては、学習用患者情報95の死亡予測モデル32への入力、死亡予測モデル32からの学習用死亡予測結果96の出力、損失演算、更新設定、及び死亡予測モデル32の更新の上記一連の処理が、第1学習データ90が交換されつつ繰り返し行われる。上記一連の繰り返しは、正解死亡予測結果96Cに対する学習用死亡予測結果96の予測精度が、予め定められた設定レベルまで達した場合に終了される。このようにして、学習済みの死亡予測モデル32が生成される。
一方、本実施形態の長期入院予測モデル33は、図6に示すように患者情報15を入力すると、長期入院予測結果18として、患者が長期入院状態となる確率、具体的には長期入院確率を長期入院予測結果18として出力するモデルである。本実施形態の長期入院状態が、本開示の第2状態の一例であり、本実施形態の長期入院予測モデル33が、本開示の第2モデルの一例である。
一例として図7に示すように、本実施形態の長期入院予測モデル33は、学習フェーズにおいて、訓練データまたは教師データとも呼ばれる第2学習データ91を与えられて学習される。第2学習データ91は、学習用患者情報95と、正解長期入院予測結果98Cとの組である。第2学習データ91は、ある患者の診療に係わる複数の学習用文書データ95Dを含む。正解長期入院予測結果98Cは、医師が学習用文書データ95Dを参照して、その患者の実際の入院日数等から得られた長期入院確率である。なお、上述の死亡予測モデル32の学習に用いる第1学習データ90に含まれる学習用患者情報95と、長期入院予測モデル33の学習に用いる第2学習データ91に含まれる学習用患者情報95とは、同一であってもよいし、異なっていてもよく、また、一部が同一であってもよい。
学習フェーズにおいて、長期入院予測モデル33には、学習用患者情報95が学習用文書データ95D毎にベクトル化されて入力される。長期入院予測モデル33は、学習用患者情報95に対して学習用長期入院予測結果98を出力する。学習用長期入院予測結果98及び正解長期入院予測結果98Cに基づいて、損失関数を用いた長期入院予測モデル33の損失演算がなされる。そして、損失演算の結果に応じて長期入院予測モデル33の各種係数の更新設定がなされ、更新設定にしたがって、長期入院予測モデル33が更新される。
学習フェーズにおいては、学習用患者情報95の長期入院予測モデル33への入力、長期入院予測モデル33からの学習用長期入院予測結果98の出力、損失演算、更新設定、及び長期入院予測モデル33の更新の上記一連の処理が、第2学習データ91が交換されつつ繰り返し行われる。上記一連の繰り返しは、正解長期入院予測結果98Cに対する学習用長期入院予測結果98の予測精度が、予め定められた設定レベルまで達した場合に終了される。このようにして、学習済みの長期入院予測モデル33が生成される。
さらに、図8には、本実施形態の情報処理装置10の構成の一例の機能ブロック図が示されている。図8に示すように情報処理装置10は、取得部40、モデル選択部42、文書抽出部44、重要度導出部46、及び表示制御部48を備える。一例として本実施形態の情報処理装置10は、制御部20のCPU20Aがストレージ22Cに記憶されている情報処理プログラム30を実行することにより、CPU20Aが取得部40、モデル選択部42、文書抽出部44、重要度導出部46、及び表示制御部48として機能する。
取得部40は、患者情報DB14から予測対象である特定の患者の患者情報15を取得する。一例として、本実施形態の取得部40は、予後予測を行う対象となる特定の患者を表す患者識別情報を受け付けると、受け付けた患者識別情報に応じた患者情報15を、ネットワーク9を介して患者情報DB14から取得する。取得部40は、取得した患者情報15を、モデル選択部42及び文書抽出部44に出力する。
モデル選択部42は、患者情報15に基づいて、死亡予測モデル32及び長期入院予測モデル33のうち、予測に用いる選択モデルを選択する。なお、ここでは、死亡予測モデル32及び長期入院予測モデル33のうち、モデル選択部42によって選択されるモデルを「選択モデル」という。
具体的には、図9及び図10に示すように、一例として、本実施形態のモデル選択部42は、患者情報15に含まれる全ての文書データ15Dをベクトル化して、死亡予測モデル32に入力し、出力された患者情報単位の死亡予測結果16Aを取得する。すなわち、モデル選択部42は、死亡予測モデル32を用いて、患者情報単位の死亡予測結果16Aを導出する。モデル選択部42は、導出した患者情報単位の死亡予測結果16Aが閾値を超える場合、死亡予測モデル32を選択モデルとして選択する。また、モデル選択部42は、患者情報単位の死亡予測結果16Aが閾値以下の場合、長期入院予測モデル33を選択モデルとして選択する。なお、図9及び図10に示した例では、死亡予測モデル32及び長期入院予測モデル33のいずれを選択するかの基準となる閾値を「30%」としているが、具体的な閾値の値については、特に限定されず、死亡確率が高いか否かを判断するための値であればよい。すなわち、モデル選択部42は、患者情報単位の死亡予測結果16Aに基づいて、死亡確率が高いと予測される場合、死亡予測モデル32を選択し、死亡確率が高くないと予測される場合、長期入院予測モデル33を選択する。
モデル選択部42は、上記のようにして選択した選択モデルを表す情報を重要度導出部46に出力する。
文書抽出部44は、患者情報15から文書データ15Dを、予め定められた基準に基づいて抽出する。一例として本実施形態の文書抽出部44は、患者情報15に含まれる1つの文を1つの文書データ15Dとして、単文単位で文書データ15Dを抽出する。なお、患者情報15から文書データ15Dを抽出するための上記基準は特に限定されず、例えば、対応付けられている日付が同日であることを基準としてもよい。この場合、例えば、図9及び図10に示した例では、「9/5:A,9/5:P,9/5:S,9/5:O」が1つの文書データ15Dとして抽出される。文書抽出部44は、抽出した文書データ15Dを、重要度導出部46に出力する。
重要度導出部46は、文書データ15D毎に、死亡予測モデル32及び長期入院予測モデル33のうち、モデル選択部42によって選択された選択モデルに入力し、出力された予測結果を取得する。具体的には重要度導出部46は、選択モデルが死亡予測モデル32の場合、図9に示すように、文書データ15Dをベクトル化して、死亡予測モデル32に入力させ、出力された文書単位の死亡予測結果16Dを取得する。一方、重要度導出部46は、選択モデルが長期入院予測モデル33の場合、図10に示すように、文書データ15Dをベクトル化して、長期入院予測モデル33に入力させ、出力された文書単位の長期入院予測結果18Dを取得する。
重要度導出部46は、取得した文書単位の死亡予測結果16Dまたは文書単位の長期入院予測結果18Dに基づいて、特定の患者に対する重要度を導出する。本実施形態の重要度は、文書データ15Dを入力した場合の選択モデルの出力に対して相関関係を有する。本実施形態では、文書データ15Dを入力とし、選択モデルから出力された百分率で表された確率を少数に直した値を重要度として採用している。例えば、文書単位の死亡予測結果16Dが90%の場合の重要度は「0.9」であり、文書単位の死亡予測結果16Dが30%の場合の重要度は「0.3」であり、文書単位の長期入院予測結果18Dが90%の場合の重要度は「0.9」である。そのため、本実施形態の重要度は、0以上、1以下の値となる。なお、本実施形態では、重要度を具体的な数値として表しているが、例えば、「高」、「中」、及び「低」等で表すようにしてもよい。重要度導出部46は、文書データ15D毎に導出した重要度を表示制御部48に出力する。
表示制御部48は、文書データ15D毎の重要度に基づいて、患者情報15に含まれる全ての複数の文書データ15Dから、表示対象とする文書データ15Dを特定する。例えば、表示制御部48は、重要度が高い順に所定の数の文書データ15Dを、表示対象として特定する。また、表示制御部48は、重要度が所定値以上の文書データ15Dを、表示対象として特定する。なお、表示制御部48は、表示対象の特定において、Beam Searchの手法を用いて、文書データ15Dを1つずつ選択してもよい。この場合、表示制御部48は、まず、表示優先度が最も高い第1表示優先度を付与する文書データ15Dとして、患者情報15に含まれる全ての文書データ15Dのうちから、重要度のランキングにおいて上位K個の文書データ15Dを抽出する。そして、抽出した文書データ15Dに、他の文書データ15Dを加えて、重要度を元にランキングし、上位K個の文書データ15Dに、第1表示優先度の次に高い、第2表示優先度を付与する。この処理を、所定の数の文書データ15Dを特定するか、または、表示優先度を付与した全ての文書データ15Dの長さを加算した全長が、所定の長さとなるまで繰り返す。
また、表示制御部48は、重要度に基づいて、文書データ15Dを表示する表示順序を特定する。例えば、表示制御部48は、重要度が高い順に、表示優先度が高くなるように表示順序を特定する。なお、表示制御部48は、表示順序として、文書データ15Dに対応付けられている日時に基づいた時系列順を採用してもよい。表示順序を時系列順とする場合、日時が新しいものほど、表示優先度が高くなる。また、重要度に応じた順序と、時系列順とを組み合わせた表示順序を採用してもよい。なお、この場合、文書データ15Dが長いほど、文書データ15Dを読むユーザに係る負担が大きくなるため、文書データ15Dの長さをペナルティとして加えてもよい。具体的には、文書データ15Dの長さが長くなるほど大きくなるペナルティを加えてもよい。
なお、表示対象及び表示順序の少なくとも一方について予め定められている場合、表示制御部48は、表示対象及び表示順序のうち、予め定められていない方の特定を行えばよく、両方とも予め定められている場合は、表示対象の特定及び表示順序の特定を省略してもよい。例えば、表示対象を全ての文書データ15Dとすることが予め定められている場合、表示制御部48は、表示順序のみを特定すればよい。また、表示対象を上記の方法で特定し、表示順序は別の方法を用いて特定する他、表示対象は別の方法で特定し、表示順序のみを上記の方法で特定してもよい。例えば、医療文書として電子カルテ、放射線検査報告書、及び看護録等があった場合に、表示対象を電子カルテに限定してすべて表示し、その電子カルテを特定した表示順序で並び替えてもよい。また、表示対象を特定する方法として、表示対象として特定した文書データ15Dを、表示対象としなかった文書データ15Dよりも強調して表示する形態としてもよい。例えば、表示対象として特定した文書データ15Dをハイライトして表示し、表示対象としなかった文書はグレーアウトされるようにしてもよい。
また、表示制御部48は、表示対象として特定した文書データ15Dを、特定した表示順序で表示部28に表示させる制御を行う。
次に、本実施形態の情報処理装置10の作用について図面を参照して説明する。図11には、本実施形態の情報処理装置10において実行される情報処理の流れの一例を表したフローチャートが示されている。本実施形態の情報処理装置10は、一例として、操作部26により行われた、ユーザの開始指示等に基づいて、制御部20のCPU20Aが、ストレージ22Cに記憶されている情報処理プログラム30を実行することにより、図11に一例を示した情報処理を実行する。
図11のステップS100で取得部40は、上述したようにユーザが、操作部26を用いて指定した患者識別情報を受け付ける。次のステップS102で取得部40は、上述したように、患者識別情報に対応付けられている患者情報15を患者情報DB14からネットワーク9を介して取得する。
次のステップS104でモデル選択部42は、上述したように、患者情報15に含まれる全ての文書データ15Dを死亡予測モデル32に入力して、患者情報単位の死亡予測結果16Aを導出する。
次のステップS106でモデル選択部42は、上述したように、患者情報単位の死亡予測結果16Aである死亡確率が閾値を超えるか否か判定する。図9に示したように、死亡確率が閾値を超える場合、ステップS106の判定が肯定判定となり、ステップS108へ移行する。この場合、モデル選択部42は、死亡予測モデル32を選択モデルとして選択する。
ステップS108で文書抽出部44は、上述したように、上記ステップS102で取得した患者情報15から文書データ15Dを1つ抽出する。次のステップS110で重要度導出部46は、上述したように、重要度として、文書単位の死亡予測結果16Dを導出する。具体的には、重要度導出部46は、上記ステップS108で抽出した文書データ15Dを死亡予測モデル32に入力させ、出力された文書単位の死亡予測結果16Dを重要度として取得する。
次のステップS112で文書抽出部44は、患者情報15に含まれる全ての文書データ15Dについて、死亡予測を行ったか否かを判定する。未だ全ての文書データ15Dについて死亡予測を行っていない場合、ステップS112の判定が否定判定となり、ステップS108に戻り、ステップS108及びS110の処理を繰り返す。一方、全ての文書データ15Dについて、死亡予測を行った場合、ステップS112の処理が肯定判定となり、ステップS120へ移行する。
一方、上記ステップS106において、図10に示したように、患者情報単位の死亡予測結果16Aである死亡確率が閾値以下の場合、ステップS106の判定が否定判定となり、ステップS114へ移行する。この場合、モデル選択部42は、長期入院予測モデル33を選択モデルとして選択する。
ステップS114で文書抽出部44は、上述したように、重要度として、文書単位の長期入院予測結果18Dを導出する。具体的には、重要度導出部46は、上記ステップS114で抽出した文書データ15Dを長期入院予測モデル33に入力させ、出力された文書単位の長期入院予測結果18Dを重要度として取得する。
次のステップS118で文書抽出部44は、患者情報15に含まれる全ての文書データ15Dについて、長期入院予測を行ったか否かを判定する。未だ全ての文書データ15Dについて長期入院予測を行っていない場合、ステップS118の判定が否定判定となり、ステップS114に戻り、ステップS114及びS116の処理を繰り返す。一方、全ての文書データ15Dについて、長期入院予測を行った場合、ステップS118の処理が肯定判定となり、ステップS120へ移行する。
ステップS120で表示制御部48は、上述したように、患者情報15に含まれる全ての文書データ15Dから表示対象の特定を行い、また、表示対象とした文書データ15Dの表示順序を特定する。
次のステップS122で表示制御部48は、上述したように表示対象とした文書データ15Dに応じた文書を特定した表示順序で表示部28に表示させる。図12には、表示部28に表示対象とした文書データ15Dを特定した表示順序で表示させた状態の一例を示す。図12に示した文書データ15D~15Dでは、文書データ15Dの重要度が最も高く、文書データ15Dの重要度が最も低い。このように上記ステップS120で特定した表示対象の文書データ15Dを、特定した表示順序で表示部28に表示することにより、特定の患者の診療に関して、有用な情報が、重要度が高い順でユーザに提供される。ステップS122の処理が終了すると図11に示した情報処理が終了する。
このように本実施形態の情報処理装置10は、患者情報15を入力とし、死亡予測タスクを遂行する死亡予測モデル32と、患者情報15を入力とし、長期入院予測タスクを推敲する長期入院予測モデル33と、を備える。
取得部40は、特定の患者に関する情報を表す患者情報15を取得し、モデル選択部42は、死亡予測モデル32から出力された患者情報単位の死亡予測結果16Aに基づいて、死亡予測モデル32及び長期入院予測モデル33から予測に用いる選択モデルを選択する。また、重要度導出部46は、選択モデルから出力された文書単位の死亡予測結果16Dまたは文書単位の長期入院予測結果18Dに応じて重要度を導出する。
これにより、本実施形態の情報処理装置10によれば、特定の患者に関する情報を表す患者情報15に含まれる文書データ15D毎に、特定の患者に対する適切な重要度を導出することができる。
なお、本実施形態では、死亡予測を行う死亡予測モデル32と、長期入院予測を行う長期入院予測モデル33とを用いる形態について説明したが、本形態に限定されない。例えば、長期入院予測モデル33に代えて、または、長期入院予測モデル33と共に、合併症について予測する合併症予測モデルを用いてもよい。死亡予測モデル32、長期入院予測モデル33、及び合併症モデルの3つの機械学習モデルを用いる場合、上述の閾値を2つ設ければよい。
[第2実施形態]
図13~図19を参照して、本実施形態の情報処理装置10について説明する。なお、本実施形態の情報処理装置10は、第1実施形態の情報処理装置10と同様の構成を含むため、同様の構成については、その旨を記し、詳細な説明は省略する。
まず、本実施形態の情報処理装置10の構成について説明する。図13に示すように、本実施形態の情報処理装置10では、第1実施形態の情報処理プログラム30(図3参照)に代えて、ストレージ22Cに情報処理プログラム30Aが記憶されている。
さらに、図14には、本実施形態の情報処理装置10の構成の一例の機能ブロック図が示されている。図14に示すように情報処理装置10は、取得部50、文書抽出部52、第1評価値導出部54、第2評価値導出部56、重み導出部58、重要度導出部60、及び表示制御部62を備える。一例として本実施形態の情報処理装置10は、制御部20のCPU20Aがストレージ22Cに記憶されている情報処理プログラム30Aを実行することにより、CPU20Aが、取得部50、文書抽出部52、第1評価値導出部54、第2評価値導出部56、重み導出部58、重要度導出部60、及び表示制御部62として機能する。
取得部50は、第1実施形態の取得部40と同様に、患者情報DB14から予測対象である特定の患者の患者情報15を取得する。また、取得部50は、取得した患者情報15を、文書抽出部52及び重み導出部58に出力する。
文書抽出部52は、第1実施形態の文書抽出部44と同様に、患者情報15から文書データ15Dを、予め定められた基準に基づいて抽出する。また、文書抽出部52は、抽出した文書データ15Dを、第1評価値導出部54及び第2評価値導出部56に出力する。
第1評価値導出部54は、図15に示すように、患者情報15に含まれる文書データ15D毎に死亡予測モデル32の入力として、死亡予測に係わる文書単位の死亡予測結果16Dに対する死亡予測評価値を導出する。
第1評価値導出部54は、図15に示すように、文書データ15Dをベクトル化して、死亡予測モデル32に入力させ、出力された文書単位の死亡予測結果16Dを取得する。また、第1評価値導出部54は、文書単位の死亡予測結果16Dを評価する死亡予測評価値17を導出する。一例として、本実施形態の死亡予測評価値17は、文書単位の死亡予測結果16Dである百分率で表された死亡確率を少数に直した値を採用している。なお、死亡予測評価値17は、本形態に限定されず、文書単位の死亡予測結果16Dと相関する評価値であればよい。第1評価値導出部54は、導出した死亡予測評価値17を重要度導出部60に出力する。
第2評価値導出部56は、図16に示すように、文書データ15Dをベクトル化して、長期入院予測モデル33に入力させ、出力された文書単位の長期入院予測結果18Dを取得する。また、第1評価値導出部54は、文書単位の長期入院予測結果18Dを評価する長期入院予測評価値19を導出する。一例として、本実施形態の長期入院予測評価値19は、文書単位の長期入院予測結果18Dである百分率で表された長期入院確率を少数に直した値を採用している。なお、長期入院予測評価値19は、本形態に限定されず、文書単位の長期入院予測結果18Dと相関する評価値であればよい。第2評価値導出部56は、導出した長期入院予測評価値19を重要度導出部60に出力する。
重み導出部58は、患者情報単位の死亡予測結果16Aに基づいて、死亡予測評価値17及び長期入院予測評価値19の各々に対する重み付けに用いる重みを導出する。重み導出部58は、導出した重みを重要度導出部60に出力する。
重要度導出部60は、重み導出部58が導出した重みにより重み付けされた死亡予測評価値17及び長期入院予測評価値19により、文書データ15D毎に、特定の患者に対する重要度を導出する。
ここで、本実施形態において重み導出部58が導出する「重み」及び重要度導出部60が導出する重要度について図17を参照して説明する。一例として、本実施形態では、患者が長期入院状態になることよりも、死亡状態となることを重要としている。そのため、「重み」は、図17に示すように、患者情報単位の死亡予測結果16Aを基準として、予め定められている。図17に示すように、患者情報単位の死亡予測結果16Aである死亡確率が高くなるほど、死亡予測評価値17(死亡予測)に対する重みが大きくなる。また、患者情報単位の死亡予測結果16Aである死亡確率が高くなるほど、長期入院予測評価値19(長期入院予測)に対する重みが大きくなる。
重要度導出部60は、下記(1)式に基づいて、重要度を導出する。
重要度=(min(1,γ×患者情報単位の死亡確率)×死亡予測評価値)+λ×(1-min値)×長期入院予測評価値 ・・・(1)
上記(1)式における「min(1,γ×患者情報単位の死亡確率)」が死亡予測評価値17に対する重みであり、「λ×(1-min値)」が長期入院予測評価値19に対する重みである。
なお、上記(1)式における「患者情報単位の死亡確率」は、患者情報単位の死亡予測結果16Aである百分率で表された死亡確率を少数に直した値である。
また、上記(1)式における「γ」及び「λ」は、ハイパパラメータである。γは、死亡予測結果を重視する度合いを表しており、図17における「長期入院予測結果」と「死亡予測結果」との境界となる境界線の傾きを制御するパラメータである。γが大きいほど、図17における「死亡予測結果」の割合が大きくなり、死亡予測結果(死亡予測評価値17)を重視する度合いが大きくなる。図17では、γ=2の場合を示している。γ=2では、患者情報単位の死亡予測結果16Aが50%以上の場合、長期入院予測評価値19に対する重みが「0」となり、長期入院予測評価値19は重要度の導出に用いられない。
一方、λは、死亡予測結果と、長期入院予測結果とのバランスをとるための係数である。例えば、文書単位の死亡予測結果16Dである死亡確率は0%~30%の範囲内の値であることが多く、長期入院単位の長期入院予測結果18Dである長期入院確率は20%~100%の範囲内の値であることが多いとする。上記(1)式において、λを用いなかった場合、長期入院確率の方が死亡確率よりも大きな値を示すことが多いため、長期入院予測結果(長期入院予測評価値19)が重視されてしまうことになる。そこで、λをハイパパラメータとして用いることにより、死亡予測結果(死亡予測評価値17)と、長期入院予測結果(長期入院予測評価値19)とのバランスをとっている。例えば、λは、人手により定められてもよい。また例えば、λは、死亡予測評価値17の統計値を、長期入院予測評価値19の平均値で割った値としてもよい。なお、この場合の統計値としては、例えば、平均値や、中央値が挙げられる。
表示制御部62は、第1実施形態の表示制御部48と同様に、文書データ15D毎の重要度に基づいて、患者情報15に含まれる全ての複数の文書データ15Dから、表示対象とする文書データ15Dを特定する。また、表示制御部62は、重要度に基づいて、文書データ15Dを表示する表示順序を特定する。また、表示制御部62は、表示対象として特定した文書データ15Dを、特定した表示順序で表示部28に表示させる制御を行う。
次に、本実施形態の情報処理装置10の作用について図面を参照して説明する。図18には、本実施形態の情報処理装置10において実行される情報処理の流れの一例を表したフローチャートが示されている。本実施形態の情報処理装置10は、一例として、操作部26により行われた、ユーザの開始指示等に基づいて、制御部20のCPU20Aが、ストレージ22Cに記憶されている情報処理プログラム30Aを実行することにより、図18に一例を示した情報処理を実行する。
図18のステップS200で取得部50は、第1実施形態の情報処理のステップS100(図11参照)と同様に、ユーザが、操作部26を用いて指定した患者識別情報を受け付ける。次のステップS202で取得部50は、第1実施形態の情報処理のステップS102(図11参照)と同様に、患者識別情報に対応付けられている患者情報15を患者情報DB14からネットワーク9を介して取得する。
次のステップS204で重み導出部58は、第1実施形態の情報処理のステップS104(図11参照)と同様に、患者情報15に含まれる全ての文書データ15Dを死亡予測モデル32に入力して、患者情報単位の死亡予測結果16Aを導出する。
次のステップS206で重み導出部58は、上述したように、患者情報単位の死亡予測結果16Aに基づいて、死亡予測評価値17及び長期入院予測評価値19の各々に対する重み付けに用いる重みを導出する。具体的な本実施形態の重み導出部58は、死亡予測評価値17に対する重み「min(1,γ×患者情報単位の死亡確率)」と、長期入院予測評価値19に対する重み「λ×(1-min値)」とを導出する。
次のステップS208で文書抽出部52は、第1実施形態の情報処理のステップS108またはS114(図11参照)と同様に、上記ステップS202で取得した患者情報15から文書データ15Dを1つ抽出する。
次のステップS210で第1評価値導出部54は、上述したように、文書データ15Dを死亡予測モデル32に入力させ、出力された文書単位の死亡予測結果16Dに基づいて、死亡予測評価値17を導出する。
次のステップS212で第2評価値導出部56は、上述したように、文書データ15Dを長期入院予測モデル33に入力させ、出力された文書単位の長期入院予測結果18Dに基づいて、長期入院予測評価値19を導出する。
次のステップS214で重要度導出部60は、上述したように、文書データ15D毎に、特定の患者に対する重要度を導出する。具体的には、重要度導出部60は、上記ステップS206で導出した重みと、上記ステップS210で導出した死亡予測評価値17と、上記ステップS212で導出した長期入院予測評価値19と、を用いて、上記(1)式により、文書データ15D毎に、特定の患者に対する重要度を導出する。
図19には、ハイパパラメータであるγ及びλが共に1であり、また、死亡予測結果16Aである死亡確率が60%である場合の文書データ15D~文書データ15Dの重要度61~61が示されている。この場合、死亡予測評価値17に対する重みは、「min(1,1×0.6)=0.6」である。また、長期入院予測評価値19に対する重みは、「1×(1-0.6)=0.4」である。
図19に示した例では、文書データ15Dの場合、死亡予測評価値17が0.4、長期入院予測評価値19が0.7であるため、重要度61は、0.6×0.4+0.4×0.7=0.52となる。また、文書データ15Dの場合、死亡予測評価値17が0.6、長期入院予測評価値19が0.1であるため、重要度61は、0.6×0.6+0.4×0.1=0.40となる。また、文書データ15Dの場合、死亡予測評価値17が0.2、長期入院予測評価値19が0.9であるため、重要度61は、0.6×0.2+0.4×0.9=0.48となる。
次のステップS216で重要度導出部60は、患者情報15に含まれる全ての文書データ15Dについて、特定の患者に対する重要度を導出したか否かを判定する。未だ全ての文書データ15Dについて特定の患者に対する重要度を導出していない場合、ステップS216の判定が否定判定となり、ステップS208に戻り、ステップS208~S214の処理を繰り返す。一方、全ての文書データ15Dについて特定の患者に対する重要度を導出した場合、ステップS216の判定が肯定判定となり、ステップS218へ移行する。
ステップS218で表示制御部62は、上述したように、患者情報15に含まれる全ての文書データ15Dから表示対象の特定を行い、また、表示対象とした文書データ15Dの表示順序を特定する。例えば、表示順序を重要度61が高い順とした場合、図19に示した例では、表示制御部62は、文書データ15Dの表示順序を最も高い1番とし、文書データ15Dの表示順序を2番とし、文書データ15Dの表示順序を3番と特定する。
次のステップS220で表示制御部62は、上述したように表示対象とした文書データ15Dに応じた文書を特定した表示順序で表示部28に表示させる。このように上記ステップS218で特定した表示対象の文書データ15Dを、特定した表示順序で表示部28に表示することにより、特定の患者の診療に関して、有用な情報が、重要度が高い順でユーザに提供される。ステップS220の処理が終了すると図18に示した情報処理が終了する。
このように、本実施形態の情報処理装置10は、患者情報15を入力とし、死亡予測タスクを遂行する死亡予測モデル32と、患者情報15を入力と、を備える。取得部50は、特定の患者に関する情報を表す患者情報15を取得する。第1評価値導出部54は、患者情報15に含まれる文書データ15D毎に死亡予測モデル32の入力として、文書単位の死亡予測結果16Dに対する死亡予測評価値17を導出する。第2評価値導出部56は、患者情報15に含まれる文書データ15D毎に長期入院予測モデル33の入力として、文書単位の長期入院予測結果18Dに対する長期入院予測評価値19を導出する。重み導出部58は、患者情報15を死亡予測モデル32の入力として、患者情報単位の死亡予測結果16Aを取得し、死亡予測評価値17及び長期入院予測評価値19の各々を、患者情報単位の死亡予測結果16Aに応じた重みにより重み付けする。
これにより、本実施形態の情報処理装置10によれば、特定の患者に関する情報を表す患者情報15に含まれる文書データ15D毎に、特定の患者に対する適切な重要度を導出することができる。
なお、本形態では重要度導出部60が文書データ15D毎に重要度を導出する形態について説明したが、重要度を導出せずに、重み導出部58が導出した重みに応じて、表示対象とする死亡予測に係わる文書データ15D、及び表示順序の少なくとも一方を特定する形態としてもよい。また、重要度を導出せずに、重み導出部58が導出した重みに応じて、表示対象とする長期入院予測に係わる文書データ15D、及び表示順序の少なくとも一方を特定する形態としてもよい。
なお、上記第1及び第2実施形態では本開示の特定の対象の一例として、特定の患者を採用したが、特定の対象は、これに限定されるものではない。例えば、特定の企業、特定のペット、及び特定の商品等でもよい。また、上記各形態では、本開示の第1予測タスクを、特定の患者の診療に係わる診療サマリを生成するタスクにおける、死亡予測タスクとし、本開示の第1モデルを死亡予測モデル32とし、かつ本開示の第2予測タスクを、長期入院予測タスクとし、本開示の第2モデルを長期入院予測モデル33とした形態について説明したが、これらに限定されるものではない。
例えば、本開示の第1予測タスクを、特定の企業における社内文書の要約を生成するタスクにおける文書が役員向けの文書として採用される採用確率を出力するタスクとし、本開示の第1モデルをその採用確率を出力する役員向け文書採用モデルとしてもよい。この場合、本開示の第2予測タスクを、文書が部門内向けの文書として採用される採用確率を出力するタスクとし、本開示の第2モデルをその採用確率を出力する部門文書採用モデルとしてもよい。また、この場合、特定の企業に対する重要度を導出すればよい。
なお、本開示の第1予測タスク(第1モデル)と、第2予測タスク(第2モデル)とでは、より第1予測タスクの方が、第2予測タスクよりも特定の対象に対して重要視されるタスクである。上記第1及び第2実施形態では、「死亡」の方が、「長期入院」よりも重要であるため、死亡予測タスクを本開示の第1タスクの一例としており、長期入院予測タスクを本開示の第2タスクの一例としている。
また、第1及び第2実施形態では、死亡予測モデル32及び長期入院予測モデル33という2つの予測モデルを用いる形態について説明したが、3つ以上の予測モデルを用いる形態であってもよい。
また、上記形態において、例えば、取得部40、モデル選択部42、文書抽出部44、重要度導出部46、及び表示制御部48といった各種の処理と、取得部50、文書抽出部52、第1評価値導出部54、第2評価値導出部56、重み導出部58、重要度導出部60、及び表示制御部62と行った各種の処理との各々を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
また、上記各実施形態では、情報処理プログラム30または情報処理プログラム30Aが記憶部22のストレージ22Cに予め記憶(インストール)されている態様を説明したが、これに限定されない。情報処理プログラム30及び情報処理プログラム30Aの各々は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、情報処理プログラム30及び情報処理プログラム30Aの各々は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。つまり、本実施形態で説明したプログラム(プログラム製品)は、記録媒体で提供するほか、外部のコンピュータから配信する形態であっても良い。
以上の上記実施形態に関し、更に以下の付記を開示する。
(付記1)
第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、
少なくとも1つのプロセッサと、を備え、
前記プロセッサは、
特定の対象に関する情報を表す情報データを取得し、
前記情報データに基づいて、前記複数のモデルから予測に用いる選択モデルを選択し、
前記選択モデルを用いて、前記情報データに含まれる項目毎に前記特定の対象に対する重要度を導出する
情報処理装置。
(付記2)
前記プロセッサは、
前記情報データを前記第1モデルに入力させ、前記第1予測タスクに係わる出力結果を取得し、
前記出力結果に基づいて、前記第1モデルまたは前記第2モデルのいずれかを前記選択モデルとして選択する
付記1に記載の情報処理装置。
(付記3)
前記第1予測タスクは、第1状態になる確率を導出するタスクであり、
前記第2予測タスクは、前記第1状態と異なる第2状態に係わるタスクであり、
前記プロセッサは、
前記第1状態になる確率が閾値を超える場合、前記第1モデルを選択モデルとして選択し、
前記第1状態になる確率が閾値以下の場合、前記第2モデルを選択モデルとして選択する
付記1または付記2に記載の情報処理装置。
(付記4)
前記情報データは、複数の文書データを含む文書データ群であり、
前記文書データ群を前記第1モデルに入力させ、前記第1予測タスクに係わる出力結果を取得し、
前記出力結果に基づいて、前記第1モデルまたは前記第2モデルのいずれかを前記選択モデルとして選択し、
前記選択モデルを用いて、前記文書データ群に含まれる文書データ毎に前記特定の対象に対する重要度を導出する
付記1から付記3のいずれか1つに記載の情報処理装置。
(付記5)
第1データは、複数の患者の各々に対応付けられた複数の第1医療情報データであり、
特定の対象は、特定の患者であり、情報データは、特定の患者が対応付けられた複数の第2医療情報データであり、項目は、複数の第2医療情報データの各々である
付記1に記載の情報処理装置。
(付記6)
前記第1予測タスク及び前記第2予測タスクの各々は、医療に関連するタスクである
付記1から付記5のいずれか1つに記載の情報処理装置。
(付記7)
前記第1予測タスクは、死亡予測タスクであり、
前記第2予測タスクは、長期入院予測タスクまたは合併症予測タスクである
付記6に記載の情報処理装置。
(付記8)
第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置のプロセッサが実行する情報処理方法であって、
特定の対象に関する情報を表す情報データを取得し、
情報データに基づいて、複数のモデルから予測に用いる選択モデルを選択し、
選択モデルを用いて、情報データに含まれる項目毎に特定の対象に対する重要度を導出する
情報処理方法。
(付記9)
第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置のプロセッサに、
特定の対象に関する情報を表す情報データを取得し、
情報データに基づいて、複数のモデルから予測に用いる選択モデルを選択し、
選択モデルを用いて、情報データに含まれる項目毎に特定の対象に対する重要度を導出する
処理を実行させるための情報処理プログラム。
(付記10)
第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、
少なくとも1つのプロセッサと、を備え、
前記プロセッサは、
予測対象である情報データを取得し、
前記情報データに含まれる項目データ毎に前記第1モデルの入力として、前記第1予測に係わる第1出力結果に対する第1評価値を導出し、
前記情報データに含まれる項目データ毎に前記第2モデルの入力として、前記第2予測に係わる第2出力結果に対する第2評価値を導出し、
前記情報データを前記第1モデルの入力として、前記第1予測に係わる第3出力結果を取得し、
前記第1評価値及び前記第2評価値を、前記第3出力結果に応じた重みにより重み付けする
情報処理装置。
(付記11)
重み付けされた前記第1評価値及び前記第2評価値により、前記項目毎に、前記特定の対象に対する重要度を導出する
付記10に記載の情報処理装置。
(付記12)
第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置のプロセッサが実行する情報処理方法であって、
予測対象である情報データを取得し、
前記情報データに含まれる項目データ毎に前記第1モデルの入力として、前記第1予測に係わる第1出力結果に対する第1評価値を導出し、
前記情報データに含まれる項目データ毎に前記第2モデルの入力として、前記第1予測に係わる第2出力結果に対する第2評価値を導出し、
前記情報データを前記第1モデルの入力として、前記第1予測に係わる第3出力結果を取得し、
前記第1評価値及び前記第2評価値を、前記第3出力結果に応じた重みにより重み付けする
情報処理方法。
(付記13)
第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置のプロセッサに、
予測対象である情報データを取得し、
前記情報データに含まれる項目データ毎に前記第1モデルの入力として、前記第1予測に係わる第1出力結果に対する第1評価値を導出し、
前記情報データに含まれる項目データ毎に前記第2モデルの入力として、前記第1予測に係わる第2出力結果に対する第2評価値を導出し、
前記情報データを前記第1モデルの入力として、前記第1予測に係わる第3出力結果を取得し、
前記第1評価値及び前記第2評価値を、前記第3出力結果に応じた重みにより重み付けする
処理を実行させるための情報処理プログラム。
1 情報処理システム
9 ネットワーク
10 情報処理装置
14 患者情報DB
15 患者情報、15D、15D~15D 文書データ
16、死亡予測結果、16A 患者情報単位の死亡予測結果、16D 文書単位の死亡予測結果
17、17~17 死亡予測評価値
18 長期入院予測結果、18D 文書単位の長期入院予測結果
19、19~19 長期入院予測評価値
20 制御部、20A CPU
22 記憶部、22A ROM、22B RAM、22C ストレージ
24 通信I/F部
26 操作部
28 表示部
29 バス
30、30A 情報処理プログラム
32 予後予測モデル
33 長期入院予測モデル
40 取得部
42 モデル選択部
44 文書抽出部
46 重要度導出部
48 表示制御部
50 取得部
52 文書抽出部
54 第1評価値導出部
56 第2評価値導出部
58 重み導出部
60 重要度導出部
61~61 重要度
62 表示制御部
90 第1学習データ
91 第2学習データ
95 学習用患者情報、95D 学習用文書データ
96 学習用死亡予測結果、96C 正解死亡予測結果
98 学習用長期入院予測結果、98C 正解死亡予測結果

Claims (9)

  1. 第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、
    少なくとも1つのプロセッサと、を備え、
    前記プロセッサは、
    特定の対象に関する情報を表す情報データを取得し、
    前記情報データに基づいて、前記複数のモデルから予測に用いる選択モデルを選択し、
    前記選択モデルを用いて、前記情報データに含まれる項目毎に前記特定の対象に対する重要度を導出する
    情報処理装置。
  2. 前記プロセッサは、
    前記情報データを前記第1モデルに入力させ、前記第1予測タスクに係わる出力結果を取得し、
    前記出力結果に基づいて、前記第1モデルまたは前記第2モデルのいずれかを前記選択モデルとして選択する
    請求項1に記載の情報処理装置。
  3. 前記第1予測タスクは、第1状態になる確率を導出するタスクであり、
    前記第2予測タスクは、前記第1状態と異なる第2状態に係わるタスクであり、
    前記プロセッサは、
    前記第1状態になる確率が閾値を超える場合、前記第1モデルを選択モデルとして選択し、
    前記第1状態になる確率が閾値以下の場合、前記第2モデルを選択モデルとして選択する
    請求項1に記載の情報処理装置。
  4. 前記情報データは、複数の文書データを含む文書データ群であり、
    前記文書データ群を前記第1モデルに入力させ、前記第1予測タスクに係わる出力結果を取得し、
    前記出力結果に基づいて、前記第1モデルまたは前記第2モデルのいずれかを前記選択モデルとして選択し、
    前記選択モデルを用いて、前記文書データ群に含まれる文書データ毎に前記特定の対象に対する重要度を導出する
    請求項1に記載の情報処理装置。
  5. 前記第1データは、複数の患者の各々に対応付けられた複数の第1医療情報データであり、
    前記特定の対象は、特定の患者であり、前記情報データは、前記特定の患者が対応付けられた複数の第2医療情報データであり、前記項目は、前記複数の第2医療情報データの各々である
    請求項1に記載の情報処理装置。
  6. 前記第1予測タスク及び前記第2予測タスクの各々は、医療に関連するタスクである
    請求項1に記載の情報処理装置。
  7. 前記第1予測タスクは、死亡予測タスクであり、
    前記第2予測タスクは、長期入院予測タスクまたは合併症予測タスクである
    請求項6に記載の情報処理装置。
  8. 第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置の前記プロセッサが実行する情報処理方法であって、
    特定の対象に関する情報を表す情報データを取得し、
    前記情報データに基づいて、前記複数のモデルから予測に用いる選択モデルを選択し、
    前記選択モデルを用いて、前記情報データに含まれる項目毎に前記特定の対象に対する重要度を導出する
    情報処理方法。
  9. 第1データを入力とし、第1予測タスクを遂行する第1モデルと、第2データを入力とし、前記第1予測タスクと異なる第2予測タスクを遂行する第2モデルとを少なくとも含む複数のモデルと、少なくとも1つのプロセッサと、を備えた情報処理装置の前記プロセッサに、
    特定の対象に関する情報を表す情報データを取得し、
    前記情報データに基づいて、前記複数のモデルから予測に用いる選択モデルを選択し、
    前記選択モデルを用いて、前記情報データに含まれる項目毎に前記特定の対象に対する重要度を導出する
    処理を実行させるための情報処理プログラム。
JP2022138808A 2022-08-31 2022-08-31 情報処理装置、情報処理方法、及び情報処理プログラム Pending JP2024034529A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022138808A JP2024034529A (ja) 2022-08-31 2022-08-31 情報処理装置、情報処理方法、及び情報処理プログラム
US18/457,331 US20240071619A1 (en) 2022-08-31 2023-08-28 Information processing apparatus, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022138808A JP2024034529A (ja) 2022-08-31 2022-08-31 情報処理装置、情報処理方法、及び情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2024034529A true JP2024034529A (ja) 2024-03-13

Family

ID=89998233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022138808A Pending JP2024034529A (ja) 2022-08-31 2022-08-31 情報処理装置、情報処理方法、及び情報処理プログラム

Country Status (2)

Country Link
US (1) US20240071619A1 (ja)
JP (1) JP2024034529A (ja)

Also Published As

Publication number Publication date
US20240071619A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
CN109147931B (zh) 电脑辅助医疗法、非暂态电脑可读取存储媒体及医疗系统
US7917377B2 (en) Patient data mining for automated compliance
US7801839B2 (en) Method for training a learning-capable system
US20120271612A1 (en) Predictive modeling
US7668826B2 (en) Predicting apparatus, predicting method, and computer product
JP5977898B1 (ja) 行動予測装置、行動予測装置の制御方法、および行動予測装置の制御プログラム
JP4318221B2 (ja) 医療情報分析装置、方法及びプログラム
JP6177609B2 (ja) 医療カルテシステム及び医療カルテ検索方法
Hans et al. Boosting distributional copula regression
De Neve et al. A Mann–Whitney type effect measure of interaction for factorial designs
JP2024034529A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Li et al. InterVA4: An R package to analyze verbal autopsy data
JP6301853B2 (ja) 経年変化予測システム
JP2021135930A (ja) 分析装置、分析方法、および分析プログラム
JP2024035034A (ja) 情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム
Bruckers et al. Cluster analysis for repeated data with dropout: Sensitivity analysis using a distal event
US20240070545A1 (en) Information processing apparatus, learning apparatus, information processing system, information processing method, learning method, information processing program, and learning program
Shruthi et al. Diabetes prediction using machine learning technique
US11875901B2 (en) Registration apparatus, registration method, and recording medium
Budiana et al. Bayesian Additive Regression Tree Application for Predicting Maternity Recovery Rate of Group Long-Term Disability Insurance
JP2024034528A (ja) モデル生成装置、文書生成装置、モデル生成方法、文書生成方法、及びプログラム
EP4235683A1 (en) Health improvement path search device and health improvement path search method
Sarathchandra An Improved Machine Learning Framework for Cardiovascular Disease Prediction
Zhao et al. Time-varying coefficient models with ARMA–GARCH structures for longitudinal data analysis
JP2023103763A (ja) Ai学習データ作成支援システム、ai学習データ作成支援方法およびai学習データ作成支援プログラム