JP2022190877A

JP2022190877A - 医用情報処理装置及び医用情報処理システム

Info

Publication number: JP2022190877A
Application number: JP2021099384A
Authority: JP
Inventors: 佑介狩野; Yusuke Karino; 杏莉佐藤; Anri Sato
Original assignee: Canon Medical Systems Corp
Current assignee: Canon Medical Systems Corp
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2022-12-27
Also published as: US20220399110A1

Abstract

【課題】因果推論を適切に行うことである。【解決手段】実施形態に係る医用情報処理装置は、第１取得部と、第２取得部と、第１抽出部と、算出部とを具備する。第１取得部は、観測交絡因子に基づいてユーザが判断した結果に対応する第１数値を取得する。第２取得部は、前記観測交絡因子及び前記ユーザの判断を支援する第１支援情報に基づいて前記ユーザが判断した結果に対応する第２数値を取得する。第１抽出部は、前記第１数値と前記第２数値との間の第１差分を抽出する。算出部は、前記第１差分及び前記観測交絡因子に基づいて、前記ユーザの判断に対する未観測交絡因子の影響度を算出する。【選択図】図１

Description

本明細書及び図面に開示の実施形態は、医用情報処理装置及び医用情報処理システムに関する。

因果推論は、データから介入又は曝露がアウトカムに及ぼす因果効果を推定する手法であり、医療、経済、政治、マーケティングなどの広範な分野において利用されている。近年では、機械学習を用いてデータから個別因果効果を推定する手法（例えば、ＴＡＲＮｅｔ、Causal Forest、ＣＭＧＰ、ＧＡＮＩＴＥ、X-learner）が数多く提案されている。このような機械学習を用いた因果推論において、因果効果を適切に推定するためには、因果関係に影響する全ての交絡因子を特定する必要がある。

しかし、交絡因子の特定には、人間による対象分野の専門知識（ドメイン知識）が理論上不可欠とされており、全ての交絡因子を特定することは一般的に困難である。さらに、データからドメイン知識や因果推論の結果が正しいか否かを厳密に検証する手段は存在しないため、未観測の交絡因子が存在する余地が残される。未観測の交絡因子が存在する場合に因果効果を推定する手法として、例えばランダム化比較試験（ＲＣＴ：Randomized Controlled Trial）、回帰不連続デザイン（ＲＤＤ：Regression Discontinuity Design）、操作変数（ＩＶ：Instrumental Variable）法、フロントドア基準が挙げられるが、これらは条件が厳しく現実的ではない。また、近年提案されている機械学習による因果推論の手法の多くは、未観測の交絡因子がないことを前提としているが、実際の分析では当該前提の妥当性は蔑ろにされている。したがって、機械学習を用いた因果推論において因果効果を適切に推定するため、未観測の交絡因子の影響度を定量化することが望まれる。

特開２０２０－１６８３９７号公報

本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、因果推論を適切に行うことである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。

実施形態に係る医用情報処理装置は、第１取得部と、第２取得部と、第１抽出部と、算出部とを具備する。第１取得部は、観測交絡因子に基づいてユーザが判断した結果に対応する第１数値を取得する。第２取得部は、前記観測交絡因子及び前記ユーザの判断を支援する第１支援情報に基づいて前記ユーザが判断した結果に対応する第２数値を取得する。第１抽出部は、前記第１数値と前記第２数値との間の第１差分を抽出する。算出部は、前記第１差分及び前記観測交絡因子に基づいて、前記ユーザの判断に対する未観測交絡因子の影響度を算出する。

図１は、実施形態に係る医用情報処理システムの構成例である。図２は、実施形態に係る医用情報処理装置の構成例である。図３は、医用情報処理装置の動作例である。図４は、因果推論用のデータセットを収集する方法の一例である。図５は、因果推論用のデータセットの一例である。図６は、傾向スコアの予測関数のパラメータを学習する方法の一例である。図７は、各交絡因子の支援情報への影響度の一例である。

以下、図面を参照しながら実施形態に係る医用情報処理装置及び医用情報処理システムについて説明する。以下の実施形態では、同一の参照符号を付した部分は同様の動作を行うものとして、重複する説明を適宜、省略する。

図１は、実施形態に係る医用情報処理システム１００の構成例である。
医用情報処理システム１００は、医用情報処理装置１及び診療情報データベース２を含む。医用情報処理システム１００において、医用情報処理装置１及び診療情報データベース２は互いに通信可能に接続される。なお、医用情報処理システム１００は、例えば特定の医療機関内において構築された院内ネットワーク（ＬＡＮ）でもよいし、ネットワークを介して複数の医療機関に跨って構築された広域ネットワーク（ＷＡＮ）でもよい。すなわち、医用情報処理システム１００は、上記の通信経路が構築されている限り、如何なる規模のネットワークでもよい。

医用情報処理装置１は、医療に関する種々の情報を処理するコンピュータである。具体的には、医用情報処理装置１は、診療情報データベース２から因果推論用のデータセット２００（図５に後述）を取得して種々の処理を行うことで、未観測の交絡因子の影響度を定量化する。なお、医用情報処理装置１は、高速な処理を実行可能なワークステーションであってもよい。

診療情報データベース２は、患者ごとに種々の診療情報を記憶する。診療情報は、例えば基本情報（患者番号、年齢、性別、生年月日など）、個人情報（身長、体重、血液型、既往歴、持病の有無、生活習慣（運動、喫煙、食事、飲酒、ストレス、睡眠）など）、及び疾患情報（疾患名、ステージ、虚弱スコア、実施された治療法（手術又は投薬）、治療後の予後など）を含む。さらに、診療情報は、種々の医用画像診断装置（ＣＲ（Computer Radiography）装置、ＣＴ（Computed Tomography）装置、ＭＲＩ（Magnetic Resonance Imaging）装置、ＵＬ（Ultrasound）装置、ＲＩ（Radio Isotope）装置、内視鏡装置など）により撮影された医用画像を含む。本実施形態において、診療情報データベース２は、因果推論用のデータセット２００を含む。なお、診療情報データベース２は、医用情報処理装置１に格納されてもよい。

図２は、実施形態に係る医用情報処理装置１の構成例である。
医用情報処理装置１は、処理回路１１、メモリ１２、ディスプレイ１３、入力インタフェース１４、及び通信インタフェース１５を含む。各構成は、共通の信号伝送路であるバスを介して互いに通信可能に接続される。なお、各構成は個々のハードウェアにより実現されなくともよい。例えば、各構成のうち少なくとも２つが１つのハードウェアにより実現されてもよい。

処理回路１１は、医用情報処理装置１を制御することで種々の動作を実行させる。処理回路１１は、ハードウェアとしてＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）などのプロセッサを有する。処理回路１１は、プロセッサを介してメモリ１２に展開されたプログラムを実行することで、各プログラムに対応する各機能（例えば、取得機能１１１、抽出機能１１２、算出機能１１３、学習機能１１４、更新機能１１５、推定機能１１６、出力機能１１７）を実現する。なお、各機能は複数のプロセッサを組み合わせた処理回路１１により実現されてもよい。

取得機能１１１は、観測交絡因子に基づいてユーザが判断した結果に対応する第１数値を取得する。また、取得機能１１１は、観測交絡因子及びユーザの判断を支援する第１支援情報に基づいてユーザが判断した結果に対応する第２数値を取得する。
抽出機能１１２は、第１数値と第２数値との間の第１差分を抽出する。また、抽出機能１１２は、第１傾向スコアと第２傾向スコアとの間の第２差分を抽出する。第１傾向スコア及び第２傾向スコアはそれぞれ、第１数値の予測値及び第２数値の予測値である。
算出機能１１３は、第１差分及び観測交絡因子に基づいて、ユーザの判断に対する未観測交絡因子の影響度を算出する。
学習機能１１４は、第１差分と第２差分との間の予測残差を最小化するように、第１関数の第１パラメータ及び第２関数の第２パラメータを学習する。
更新機能１１５は、第１支援情報を出力するモデルを、未観測交絡因子の影響度を用いて更新する。
推定機能１１６は、未観測交絡因子の影響度に基づいて、ユーザの判断がアウトカムに与える因果効果を推定する。
出力機能１１７は、因果効果に基づいて、ユーザの判断を支援する第２支援情報を出力する。また、出力機能１１７は、第２支援情報における未観測交絡因子の影響度の割合を出力する。また、出力機能１１７は、第２支援情報に影響する未観測交絡因子の候補を出力する。

メモリ１２は、処理回路１１が使用するデータやプログラムなどの情報を記憶する。メモリ１２は、ハードウェアとしてＲＡＭ（Random Access Memory）などの半導体メモリ素子を有する。なお、メモリ１２は、磁気ディスク（フロッピー（登録商標）ディスク、ハードディスク）、光磁気ディスク（ＭＯ）、光学ディスク（ＣＤ、ＤＶＤ、Ｂｌｕ－ｒａｙ（登録商標））、フラッシュメモリ（ＵＳＢフラッシュメモリ、メモリカード、ＳＳＤ）、磁気テープなどの外部記憶装置との間で情報を読み書きする駆動装置であってもよい。なお、メモリ１２の記憶領域は、医用情報処理装置１内部にあってもよいし、外部記憶装置にあってもよい。本実施形態において、メモリ１２は、観測交絡因子を入力として第１数値の予測値である第１傾向スコアを出力する第１関数と、観測交絡因子を入力として第２数値の予測値である第２傾向スコアを出力する第２関数とを記憶する。さらに、メモリ１２は、ＣＤＳ（Clinical Decision Support：臨床決定支援）モデル３を記憶する。メモリ１２は、記憶部の一例である。

ＣＤＳモデル３は、医用情報処理装置１を利用するユーザの臨床的な意思決定を支援する。ユーザは、例えば患者を診療する医師や看護師などの医療従事者を含む。本実施形態において、ＣＤＳモデル３は、患者に関する複数種類の診療情報を入力として、当該患者を診療する医師の判断を支援する支援情報を出力するものとする。これに限らず、ＣＤＳモデル３は、医師の判断を変化させ得る情報（生データ、予測、推奨など）を出力してもよい。ＣＤＳモデル３は、例えばニューラルネットワークなどの機械学習モデルにより実装される。

ディスプレイ１３は、処理回路１１が生成したデータやメモリ１２に格納されるデータ、ＣＤＳモデル３が出力したデータなどを表示する。ディスプレイ１３として、例えば、ブラウン管（ＣＲＴ：Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬディスプレイ（ＯＥＬＤ：Organic Electro-Luminescence Display）、及びタブレット端末を含む任意のディスプレイが使用可能である。

入力インタフェース１４は、医用情報処理装置１を利用するユーザからの入力を受け付け、受け付けた入力を電気信号に変換して処理回路１１に出力する。入力インタフェース１４として、例えば、マウス、キーボード、トラックボール、スイッチ、ボタン、ジョイスティック、タッチパッド、タッチパネルディスプレイを含む任意の操作部品が使用可能である。なお、入力インタフェース１４は、医用情報処理装置１とは別体である外部の入力装置から入力を受け付け、受け付けた入力を電気信号に変換して処理回路１１に出力する装置であってもよい。

通信インタフェース１５は、医用情報処理装置１と診療情報データベース２との間で種々のデータを通信する。通信規格として、例えば医用画像情報に関する通信にはＤＩＣＯＭ（Digital Imaging and Communications in Medicine）が使用可能であり、医用文字情報に関する通信にはＨＬ７（Health Level 7）が使用可能である。

図３は、医用情報処理装置１の動作例である。
ステップＳ１０１において、医用情報処理装置１は、取得機能１１１により、因果推論用のデータセット２００を取得する。具体的には、医用情報処理装置１は、通信インタフェース１５を介して診療情報データベース２にアクセスすることで、因果推論用のデータセット２００を取得する。データセット２００には、観測交絡因子に基づいてユーザが判断した結果に対応する第１数値と、観測交絡因子及びユーザの判断を支援する第１支援情報に基づいてユーザが判断した結果に対応する第２数値とが含まれる。なお、データセット２００は、予め診療情報データベース２に記憶されていてもよいし、医用情報処理装置１が、図４に示す方法に従って新たに収集してもよい。

ステップＳ１０２において、医用情報処理装置１は、学習機能１１４により、傾向スコアの予測関数のパラメータを学習する。具体的には、医用情報処理装置１は、取得されたデータセット２００を用いて、第１数値の予測値である第１傾向スコアを予測する第１関数の第１パラメータと、第２数値の予測値である第２傾向スコアを予測する第２関数の第２パラメータとを学習する。パラメータ学習の詳細は、図６に後述する。

ステップＳ１０３において、医用情報処理装置１は、算出機能１１３により、未観測交絡因子の影響度を算出する。具体的には、医用情報処理装置１は、第１数値と学習された第１パラメータを用いて予測された第１傾向スコアとの間の差分、又は、第２数値と学習された第２パラメータを用いて予測された第２傾向スコアとの間の差分を、未観測交絡因子の影響度として算出する。

ステップＳ１０４において、医用情報処理装置１は、推定機能１１６により、因果効果を推定する。具体的には、医用情報処理装置１は、算出された未観測交絡因子の影響度に基づいて、ユーザの判断がアウトカムに与える因果効果を推定する。また、医用情報処理装置１は、更新機能１１５により、ユーザの判断を支援する第１支援情報を出力するモデル（ＣＤＳモデル３）を、算出された未観測交絡因子の影響度を用いて更新してもよい。

ステップＳ１０５において、医用情報処理装置１は、出力機能１１７により、支援情報を出力する。具体的には、医用情報処理装置１又はＣＤＳモデル３は、推定された因果効果に基づいて、ユーザの判断を支援する第２支援情報を出力する。

ステップＳ１０６において、医用情報処理装置１は、出力機能１１７により、各交絡因子の影響度を出力する。具体的には、医用情報処理装置１は、第２支援情報における未観測交絡因子の影響度の割合を出力する。また、医用情報処理装置１は、出力機能１１７により、第２支援情報に影響する未観測交絡因子の候補を出力してもよい。

図４は、因果推論用のデータセット２００を収集する方法の一例である。
以下、因果推論の一例として、患者の治療法に関する医師の判断（治療判断とも呼ぶ）と、当該判断に基づいて当該患者が治療された場合における患者の生存期間との間の因果関係に着目する。当該因果関係において、医師の判断が介入Ｔ（Treatment）に相当し、介入Ｔによる患者の生存期間がアウトカムＹに相当する。このとき、介入ＴとアウトカムＹとの間の因果関係を歪める複数の交絡因子が存在すると考えられる。複数の交絡因子は、データが得られている等の理由により、客観的に明らかであり観測される交絡因子（観測交絡因子：Ｗとも呼ぶ）と、データが得られておらず、客観的に明らかではなく観測されない交絡因子や、データは得られているが、交絡因子として認識されていない因子（未観測交絡因子：Ｕとも呼ぶ）とに二分される。これら交絡因子は、それぞれ異なる影響度で医師の判断Ｔに影響し、かつ、患者の生存期間Ｙにも影響する。本実施形態において、医師は明示的に観測交絡因子Ｗを考慮しつつ、暗黙的に未観測交絡因子Ｕを考慮して判断Ｔを行うものと想定する。なお、医師の判断Ｔに対する各交絡因子の影響度は、それぞれ異なる太さの矢印により図示される。

因果推論用のデータセット２００を収集するため、本手法ではＣＤＳモデル３が支援情報を提示する前後それぞれにおいて医師が患者への治療法を判断する。ここでは、医師の判断に対する未観測交絡因子Ｕ及び判断の誤差εの影響度は、支援情報の提示前後で不変又は一定であると仮定する。逆に言えば、医師の判断に対する観測交絡因子Ｗの影響度は、支援情報の提示前後で変化する。

まず、支援情報の提示前（ＣＤＳ提示前）において、医師は観測交絡因子Ｗ及び未観測交絡因子Ｕに基づいて判断する。例えば、観測交絡因子Ｗが年齢Ｗ_１及びステージＷ_２であり、未観測交絡因子Ｕが虚弱さＵ_１及び性別Ｕ_２である場合を想定する。医師は患者の年齢Ｗ_１及びステージＷ_２を考慮して、当該患者への治療法に関する第１判断Ｔを下す。年齢Ｗ_１は任意の数値を取り得る量的変数であり、ステージＷ_２は複数のカテゴリを持つ質的変数である。具体的には、医師は患者の年齢Ｗ_１をステージＷ_２よりも重視して第１判断Ｔを下している。このとき、医師は暗黙的に未観測交絡因子Ｕである患者の虚弱さＵ_１や性別Ｕ_２をさらに考慮して第１判断Ｔを下したものとする。具体的には、虚弱さＵ_１の影響度は性別Ｕ_２の影響度よりも僅かに高い。

第１判断Ｔは、複数のカテゴリを持つ質的変数である。本実施形態において、第１判断Ｔは「手術」又は「投薬」の２つのカテゴリを持つ二値変数である。具体的には、ダミー変数を用いて「手術」を「Ｔ＝１」と表現し、「投薬」を「Ｔ＝０」と表現する。もちろん、第１判断Ｔは、３つ以上のカテゴリを持つ多値変数であってもよい。すなわち、第１判断Ｔは、各カテゴリの数Ｎ（Ｎは自然数）に応じたＮ次元のＯｎｅ－ｈｏｔベクトルにより表現されてもよい。第１判断Ｔは、診療情報データベース２に記憶される。

続いて、医用情報処理装置１は、ＣＤＳモデル３を介してディスプレイ１３に支援情報を表示する。具体的には、医用情報処理装置１は、ＣＤＳモデル３に対してＣＤＳ提示前における観測交絡因子Ｗである年齢Ｗ_１及びステージＷ_２を入力する。ＣＤＳモデル３は、入力された患者の年齢Ｗ_１及びステージＷ_２に基づいて、医師の判断を支援する支援情報を出力する。例えば、ＣＤＳモデル３は支援情報として、患者に推奨される治療法（推奨治療とも呼ぶ）を出力する。推奨治療は、ＣＤＳ提示後における医師の判断Ｔ´に影響を与えるが患者の生存期間Ｙには影響を与えないため、観測交絡因子Ｗに含まれないとする。

これに限らず、ＣＤＳモデル３は、患者の生存期間Ｙにも影響を与える支援情報を出力してもよい。例えば、ＣＤＳモデル３は、患者の年齢Ｗ_１及びステージＷ_２を入力として、当該患者の虚弱スコアＷ_３を出力してもよい。虚弱スコアＷ_３は、ＣＤＳ提示後における医師の判断Ｔ´に影響を与え、患者の生存期間Ｙにも影響を与えることから、観測交絡因子Ｗに含まれる。医師は、ディスプレイ１３に表示された支援情報を確認することで、患者に対する治療法の判断を再考する。なお、医用情報処理装置１は、医師に対して治療判断のために参照すべき観測交絡因子Ｗの生データを支援情報として提示してもよい。すなわち、支援情報としては、医師の治療判断を変化させ得る如何なる因子でもよい。

なお、支援情報は、複数の観測交絡因子のうち、全部又は一部の観測交絡因子から構成される値、又は計算される値であってもよい。一例として、複数の観測交絡因子Ｗ１、Ｗ２、Ｗ３、Ｗ４が存在する場合、支援情報は一部の観測交絡因子Ｗ１及びＷ２から計算される値であってもよい。

最後に、支援情報の提示後（ＣＤＳ提示後）において、医師は観測交絡因子Ｗ、支援情報、及び未観測交絡因子Ｕに基づいて判断する。例えば、医師は患者の年齢Ｗ_１、ステージＷ_２、及びＣＤＳモデル３が提示した推奨治療を考慮して、当該患者への治療法に関する第２判断Ｔ´を下す。ここでは、医師は患者の年齢Ｗ_１よりもステージＷ_２を重視して第２判断Ｔ´を下している。前述の通り、第１判断Ｔ及び第２判断Ｔ´において未観測交絡因子Ｕ及び誤差εの影響度は不変であると仮定するため、第１判断Ｔから第２判断Ｔ´への医師の判断変化は、観測交絡因子Ｗの影響度の変化に起因すると見なすことができる。

第２判断Ｔ´は、複数のカテゴリを持つ質的変数である。本実施形態において、第２判断Ｔ´は「手術」又は「投薬」の２つのカテゴリを持つ二値変数である。具体的には、ダミー変数を用いて「手術」を「Ｔ´＝１」と表現し、「投薬」を「Ｔ´＝０」と表現する。もちろん、第２判断Ｔ´は、３つ以上のカテゴリを持つ多値変数であってもよい。すなわち、第２判断Ｔ´は、各カテゴリの数Ｎ（Ｎは自然数）に応じたＮ次元のＯｎｅ－ｈｏｔベクトルにより表現されてもよい。換言すれば、第１判断Ｔ及び第２判断Ｔ´の定義は同様である。第２判断Ｔ´は、診療情報データベース２に記憶される。

また、第２判断Ｔ´に基づいて患者に治療が実施された結果である当該患者の生存期間Ｙが、診療情報データベース２に記憶される。本実施形態において、生存期間Ｙは、任意の数値を取り得る量的変数である。生存期間Ｙは、第２判断Ｔ´が「手術」である場合（Ｔ´＝１）における生存期間Ｙ_（１）と、第２判断Ｔ´が「投薬」である場合（Ｔ´＝０）における生存期間Ｙ_（０）とに二分される。一人の患者について、Ｙ_（１）又はＹ_（０）のうちいずれか一方が観測されるが他方は観測されないため、観測されないアウトカムＹ_（１）又はＹ_（０）を潜在アウトカム（potential outcome）とも呼ぶ。

以上の一連の判断フローにより、診療情報データベース２には、一人の患者について観測交絡因子Ｗ_１及びＷ_２、第１判断Ｔ、第２判断Ｔ´、並びにアウトカムＹ_（１）又はＹ_（０）のそれぞれの値が対応付けられたデータが格納される。同様なフローが複数の患者それぞれについて繰り返されることで、患者ごとに上記の各値が対応付けられた因果推論用のデータセット２００が収集される。前述の通り、本手法においてはユーザに２回判断させるという実験に近い操作が行われるため、データセット２００は純粋な観察データではないといえる。

図５は、因果推論用のデータセット２００の一例である。
データセット２００において、Ｎ人（Ｎは自然数）の患者それぞれについて観測交絡因子Ｗ_１及びＷ_２、未観測交絡因子Ｕ、治療判断Ｔ及びＴ´、並びにアウトカムＹ_（０）又はＹ_（１）のそれぞれの値が対応付けられて格納される。各患者について、未観測交絡因子Ｕ、並びに潜在アウトカムＹ_（０）又はＹ_（１）のそれぞれの値は不明であるため、値が不明であるセルは「？」で示される。なお、未観測交絡因子Ｕ１及びＵ２は単に「Ｕ」として集約して示される。

例えば、患者番号「１」で表される患者について、各値はＷ_１＝Ｗ_１ ^１、Ｗ_２＝Ｗ_２ ^１、Ｔ＝１、Ｔ´＝１、Ｙ_（１）＝Ｙ_（１） ^１である。換言すれば、患者の年齢Ｗ_１はＷ_１ ^１、疾患のステージＷ_２はＷ_２ ^１である。つまり、データセット２００によれば、医師は患者に対するＣＤＳ提示前の治療判断Ｔとして「手術」を選択し、ＣＤＳ提示後の治療判断Ｔ´として「手術」を選択し、後者の治療判断Ｔ´に基づいて患者に「手術」が実施された結果、患者はＹ_（１） ^１の期間だけ生存した、という事例が把握できる。すなわち、本事例においてＣＤＳ提示前後で医師の判断は変化しなかったことが分かる。

同様に、患者番号「２」で表される患者について、各値はＷ_１＝Ｗ_１ ^２、Ｗ_２＝Ｗ_２ ^２、Ｔ＝０、Ｔ´＝１、Ｙ_（１）＝Ｙ_（１） ^２である。換言すれば、患者の年齢Ｗ_１はＷ_１ ^２、疾患のステージＷ_２はＷ_２ ^２である。つまり、データセット２００によれば、医師は患者に対するＣＤＳ提示前の治療判断Ｔとして「投薬」を選択し、ＣＤＳ提示後の治療判断Ｔ´として「手術」を選択し、後者の治療判断Ｔ´に基づいて患者に「手術」が実施された結果、患者はＹ_（１） ^２の期間だけ生存した、という事例が把握できる。すなわち、本事例においてＣＤＳ提示前後で医師の判断は変化したことが分かる。

次に、医用情報処理装置１は、因果推論用のデータセット２００に基づいて学習することで、医師の治療判断Ｔが患者の生存期間Ｙに及ぼす因果効果Ｙ_（１）－Ｙ_（０）を推定する。ここで、因果効果Ｙ_（１）－Ｙ_（０）を推定するためのアウトカムＹの予測式が以下の式（１）により表されると仮定する。ここでは線形モデルによりアウトカムＹが予測される場合を想定するが、非線形モデルによりアウトカムＹが予測されてもよい。

式（１）において、Ｙはアウトカムの値、αは定数項、β_Ｔ、β_１、β_２、β_Ｕは偏回帰係数、Ｔは治療判断の値、Ｗ_１、Ｗ_２は観測交絡因子の値、Ｕは未観測交絡因子の値である。さらに、Ｔ＝１のときのアウトカムＹがアウトカムＹ_（１）に相当し、Ｔ＝０のときのアウトカムＹがアウトカムＹ_（０）に相当する。偏回帰係数β_ＴはＹ_（１）とＹ_（０）との間の差分Ｙ_（１）－Ｙ_（０）に影響するため、因果効果の推定にはβ_Ｔを適切に推定することが重要である。

しかしながら、データセット２００において未観測交絡因子Ｕの値は不明であるため、未観測交絡因子ＵのアウトカムＹへの影響度を表す偏回帰係数β_Ｕは算出されない。そこで次に、式（１）における「＋β_ＵＵ」の項を排除した以下の式（２）を仮定する。

式（２）を用いて、医用情報処理装置１は、因果推論用のデータセット２００に基づいて重回帰分析などにより学習することでα、β_Ｔ、β_１、β_２の値それぞれを算出することはできる。ところが、「＋β_ＵＵ」の項が排除されているため、算出されていないβ_Ｕの値の分の影響が、算出されたα、β_Ｔ、β_１、β_２の値それぞれに加わる。すなわち、算出されたβ_Ｔの値にバイアスが含まれるため、医用情報処理装置１は、式（２）を用いて因果効果を適切に推定することができない。

そこで本実施形態において、医用情報処理装置１は、患者が手術（Ｔ＝１）に割り付けられる確率である傾向スコアｅ（propensity score）を利用して因果効果を推定する。傾向スコアｅは１以上の観測交絡因子Ｗの関数であり、理想的には全ての交絡因子Ｗ、Ｕを用いて傾向スコアｅが適切に推定されれば、因果効果も適切に推定される。図４に示す通り、ＣＤＳ提示前後において医師の判断への未観測交絡因子Ｕの影響度は不変であると仮定すれば、第１判断Ｔから第２判断Ｔ´への判断の変化量ΔＴは、データセット２００における観測交絡因子Ｗの値から予測される。医用情報処理装置１は、第１判断Ｔの予測値である第１傾向スコアＴ^～を予測する第１関数ｆと、第２判断Ｔ´の予測値である第２傾向スコアＴ´^～を予測する第２関数ｇとを用いて、判断の変化量ΔＴを予測する。ここで、上付きチルダ（^～）は、予測値を示し、文字の直上にチルダが付されることを示す。また、データセット２００が収集された時点において、各患者の傾向スコアｅの値は不明であるため、各患者の傾向スコアｅに関するセルは「？」で示される。

図６は、傾向スコアの予測関数のパラメータを学習する方法の一例である。
まず、ＣＤＳ提示前において、第１関数ｆは観測交絡因子Ｗ_１及びＷ_２を入力として、第１傾向スコアＴ^～を出力する。第１関数ｆは、ＣＤＳ提示前における観測交絡因子の医師の判断への影響度を表す第１パラメータγ_１及びγ_２を用いて以下の式（３）のようにモデル化される。ここでは線形モデルにより傾向スコアが予測される場合を想定するが、非線形モデルにより傾向スコアが予測されてもよい。

式（３）において、ｆ（γ,Ｗ）は第１関数、γ_１、γ_２は第１パラメータ、Ｗ_１、Ｗ_２は観測交絡因子の値、Ｔ^～は第１傾向スコアである。また、ＣＤＳ提示前において、第１判断の真値Ｔと第１傾向スコアＴ^～との間の第１予測残差は「｜Ｔ－Ｔ^～｜^２」で表される。

同様に、ＣＤＳ提示後において、第２関数ｇは観測交絡因子Ｗ_１及びＷ_２を入力として、第２傾向スコアＴ´^～を出力する。第２関数ｇは、ＣＤＳ提示後における観測交絡因子の医師の判断への影響度を表す第２パラメータγ´_１及びγ´_２を用いて以下の式（４）のようにモデル化される。

式（４）において、ｇ（γ´,Ｗ）は第２関数、γ´_１、γ´_２は第２パラメータ、Ｗ_１、Ｗ_２は観測交絡因子の値、Ｔ´^～は第２傾向スコアである。また、ＣＤＳ提示後において、第２判断の真値Ｔ´と第２傾向スコアＴ´^～との間の第２予測残差は「｜Ｔ´－Ｔ´^～｜^２」で表される。

以上のように、医用情報処理装置１は、ＣＤＳ提示前後それぞれにおいて、治療判断の真値Ｔ及びＴ´をそれぞれ予測する第１関数ｆ及び第２関数ｇをモデル化する。ＣＤＳ提示前からＣＤＳ提示後への判断変化の真値ΔＴは、未観測交絡因子Ｕの影響度が不変であるという仮定の下で、観測交絡因子Ｗから予測され得る。すなわち、ＣＤＳ提示前後の差異における判断変化の真値ΔＴは、第１関数ｆ及び第２関数ｇを用いて予測可能である。

ＣＤＳ提示前後の差異において、第３関数ｈは観測交絡因子Ｗ_１及びＷ_２を入力として、判断変化の予測値ΔＴ^～を出力する。第３関数ｈは第１関数ｆ及び第２関数ｇを用いて以下の式（５）のようにモデル化される。

式（５）において、ｈ（γ,γ´,Ｗ）は第３関数、ΔＴ^～は判断変化の予測値である。また、ＣＤＳ提示前後の差異において、判断変化の真値ΔＴと判断変化の予測値ΔＴ^～との間の第３予測残差は「｜ΔＴ－ΔＴ^～｜^２」で表される。本実施形態において、第３関数ｈは第２関数ｇから第１関数ｆを引いた差分であるが、これに限らない。例えば、第３関数ｈは、第２関数ｇを第１関数ｆで除算したものでもよい。

以上のようにしてモデル化された第１予測誤差、第２予測誤差、及び第３予測誤差を用いて、医用情報処理装置１はパラメータγ_１、γ_２、γ´_１、γ´_２を学習する。このとき、パラメータγ_１、γ_２、γ´_１、γ´_２を学習するための損失関数Ｌは以下の式（６）のように表される。

医用情報処理装置１は、損失関数Ｌの値を最小化するように各パラメータγ_１、γ_２、γ´_１、γ´_２を学習する。このときの学習は、具体的には以下の式（７）で表される。

式（７）において、λはハイパーパラメータである。具体的には、医用情報処理装置１は、第３予測残差｜ΔＴ－ΔＴ^～｜^２が、第１予測残差｜Ｔ－Ｔ^～｜^２及び第２予測残差｜Ｔ´－Ｔ´^～｜^２よりも大きくなり過ぎないよう、ハイパーパラメータλを調整する。なお、医用情報処理装置１は、第１予測残差｜Ｔ－Ｔ^～｜^２又は第２予測残差｜Ｔ´－Ｔ´^～｜^２のうちいずれか一方と、第３予測残差｜ΔＴ－ΔＴ^～｜^２とを含む２つの項の総和を最小化するようにパラメータγ_１、γ_２、γ´_１、γ´_２を学習してもよい。

前述の通り、ＣＤＳ提示前からＣＤＳ提示後への判断変化の真値ΔＴは、未観測交絡因子Ｕの影響度が不変であるという仮定の下で、観測交絡因子Ｗのみから完全に予測され得る。すなわち、式（６）において第３予測残差は０となり、第１予測残差と第２予測残差とにおける観測交絡因子Ｗでは説明されない未観測交絡因子Ｕの影響度のみが残差として残る。したがって、式（７）において上記の残差を最小化することにより算出されたパラメータγ_１、γ_２、γ´_１、γ´_２は、式（６）から未観測交絡因子Ｕの影響度を算出するために使用することができる。

パラメータγ_１、γ_２、γ´_１、γ´_２が学習された後、医用情報処理装置１は、医師の判断Ｔへの未観測交絡因子の影響度Ｕ´を、以下の式（８）又は（９）により算出する。

式（８）又は（９）に示されるように、医用情報処理装置１は、ＣＤＳ提示前又はＣＤＳ提示後における判断の真値から、学習されたパラメータを用いて予測された判断の予測値を引いた差分が、医師の判断への未観測交絡因子Ｕの影響度であるとして算出する。なお、未観測交絡因子の医師の判断への影響度Ｕ´は、予測された観測交絡因子の影響度Ｔ^～又はＴ´^～に比べて小さいと仮定する。

ここで、医師の判断への未観測交絡因子の影響度Ｕ´と、アウトカムへの未観測交絡因子の影響度Ｕに相関がある、すなわち、未観測交絡因子Ｕの内訳の比率が不変であると仮定した場合、ＵはＵ´に代替される。このようにして、医用情報処理装置１は、以下の式（１０）を用いてアウトカムＹを推定する。

式（１０）において、β´_ＵはＵ´を含む項に係る偏回帰係数である。このように推定されたＵ´を用いて、医用情報処理装置１はデータセット２００に基づいてアウトカムＹを予測するので、偏回帰係数β_Ｔにはバイアスがかからない。したがって、医用情報処理装置１は、式（１０）に基づいて因果効果を適切に推定することができる。なお、データセット２００の収集時において、ＣＤＳモデル３が未観測交絡因子Ｕの影響度を考慮しない式（２）に基づいて支援情報を提示していた場合、医用情報処理装置１は、ＣＤＳモデル３を未観測交絡因子の影響度Ｕを考慮する式（１０）に基づいて支援情報を提示するように更新してもよい。

アウトカムＹの予測については、傾向スコアとアウトカムの予測とを組み合わせた既存の手法（二重頑健推定：Doubly Robust Estimation、X-learner、R-learner、DR-learnerなど）を用いればよい。続いて、医用情報処理装置１は、予測されたアウトカムＹを用いて種々の因果効果（平均因果効果：ＡＴＥ（Average Treatment Effect）、条件付き平均因果効果：ＣＡＴＥ（Conditional Average Treatment Effect）、個別因果効果：ＩＴＥ（Individual Treatment Effect）など）を算出すればよい。

また、医用情報処理装置１又はＣＤＳモデル３は、予測された因果効果に基づいて、支援情報を出力してもよい。例えば、医用情報処理装置１は、予測された因果効果Ｙ_（１）－Ｙ_（０）の符号が正である場合には、アウトカムＹ_（１）を生じさせる介入Ｔ（すなわち、Ｔ＝１）に対応する推薦治療を支援情報として出力してもよい。逆に、医用情報処理装置１は、因果効果Ｙ_（１）－Ｙ_（０）の符号が負である場合には、アウトカムＹ_（０）を生じさせる介入Ｔ（すなわち、Ｔ＝０）に対応する推薦治療を支援情報として出力してもよい。さらに、医用情報処理装置１又はＣＤＳモデル３は、支援情報における各交絡因子の影響度の割合を出力してもよい。

図７は、各交絡因子の支援情報への影響度の一例である。図７（ａ）及び図７（ｂ）は、医用情報処理装置１のディスプレイ１３に表示され得る。
図７（ａ）において、医用情報処理装置１が各患者（患者Ａ、患者Ｂ、患者Ｃ）について提示した各支援情報における各交絡因子の影響度が棒グラフにより示される。各交絡因子の影響度は、具体的には式（１０）における各偏回帰係数β_１、β_２、β´_Ｕを標準化したそれぞれの値が、標準化された各偏回帰係数β_１、β_２、β´_Ｕそれぞれの値の総和に占める割合に相当する。例えば、標準化された各偏回帰係数β_１、β_２、β´_Ｕの総和に占める標準化されたβ´_Ｕの値が、未観測交絡因子Ｕの影響度に相当する。なお、標準化される前における、元の各交絡因子の影響度は不変である。

例えば、患者Ａに提示された支援情報に対する観測交絡因子Ｗの影響度は「０．５５」であり、未観測交絡因子Ｕの影響度は「０．４５」である。同様に、患者Ｂに提示された支援情報に対する観測交絡因子Ｗの影響度は「０．７０」であり、未観測交絡因子Ｕの影響度は「０．３０」である。医用情報処理装置１を利用するユーザは、ディスプレイ１３に表示された図７（ａ）を参照することで、未観測交絡因子の影響度を考慮して出力された支援情報における、各交絡因子の影響度の割合を確認することができる。

図７（ａ）の表示中、医用情報処理装置１を利用するユーザは入力インタフェース１４を操作して所望の患者に関する棒グラフを選択することができる。例えば、患者Ａに関する棒グラフが選択された場合、図７（ａ）から図７（ｂ）の表示画面に移行する。

図７（ｂ）において、観測交絡因子Ｗの影響度と、未観測交絡因子Ｕの影響度とがともに算出され、棒グラフの内訳が表示される。ここで、所定のデータを解析することで、医用情報処理装置１は、未観測交絡因子Ｕに関する１以上の候補をウィンドウ３００に表示してもよい。具体的には、ウィンドウ３００には未観測交絡因子の複数の候補として「虚弱スコア」、「性別」、「喫煙の有無」…が表示される。未観測交絡因子の候補の決定方法としては、例えばデータ解析を実行及び支援するユーザ（データサイエンティスト又はナレッジ提供医師）が、手動で候補を選択してもよい。あるいは、例えば医用情報処理装置１が、他のデータ処理で利用された観測交絡因子のうち、医用情報処理装置１の処理結果では観測交絡因子として選択されていない交絡因子を、未観測交絡因子Ｕの候補として決定してもよい。

未観測交絡因子Ｕの候補を提示するため、例えば医用情報処理装置１は、１つ以上の未観測交絡因子Ｕを交絡因子Ｗの一部としてＣＤＳモデル３に入れ、再度同様な方法にて影響度を算出する。医用情報処理装置１は、処理前後で未観測交絡因子Ｕの影響度が一定以上減少すれば、ＣＤＳモデル３に入れた因子を上記の候補として提示すればよい。上記の処理では、データとしては得られているが観測交絡因子Ｗとして認識されていない未観測交絡因子Ｕが存在することを前提とする。

以上、実施形態に係る医用情報処理装置１について説明した。医用情報処理装置１は、観測交絡因子の影響度に基づいて間接的に、未観測の交絡因子の影響度を定量化する。医用情報処理装置１によれば、医師の判断に影響を及ぼしている未観測の交絡因子の影響度を定量化することができる。その結果として、医師は、因果推論の信頼性の程度を定量的に評価することができる。すなわち、医用情報処理装置１は、因果推論の信頼性を向上させることができる。

ここで仮に、医師が観測交絡因子のみを考慮して判断を行う場合を想定する。当該場合においても同様に、医用情報処理装置１は、支援情報（ＣＤＳ）の提示前における医師の判断に対応する第１数値と支援情報（ＣＤＳ）の提示後における医師の判断に対応する第２数値とを取得する。続いて、医用情報処理装置１は観測交絡因子に基づいて、第１数値の予測値である第１傾向スコアと第２数値の予測値である第２傾向スコアとを算出する。最後に、医用情報処理装置１は、第１数値と第１傾向スコアとの間の差分、又は第２数値と第２傾向スコアとの間の差分を、未観測交絡因子の影響度として算出する。したがって、医師が観測交絡因子のみを考慮して判断を行っていた場合には、未観測交絡因子の影響度は「０」と算出される。これにより、医用情報処理装置１を利用するユーザは、当該医師の判断には未観測交絡因子の影響が含まれていないことを確認できる。

以上説明した少なくとも１つの実施形態によれば、因果推論を適切に行うことができる。

いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均などの範囲に含まれるものである。

１…医用情報処理装置
２…診療情報データベース
３…ＣＤＳモデル
１１…処理回路
１２…メモリ
１３…ディスプレイ
１４…入力インタフェース
１５…通信インタフェース
１００…医用情報処理システム
１１１…取得機能
１１２…抽出機能
１１３…算出機能
１１４…学習機能
１１５…更新機能
１１６…推定機能
１１７…出力機能
２００…データセット
３００…ウィンドウ

Claims

観測交絡因子に基づいてユーザが判断した結果に対応する第１数値を取得する第１取得部と、
前記観測交絡因子及び前記ユーザの判断を支援する第１支援情報に基づいて前記ユーザが判断した結果に対応する第２数値を取得する第２取得部と、
前記第１数値と前記第２数値との間の第１差分を抽出する第１抽出部と、
前記第１差分及び前記観測交絡因子に基づいて、前記ユーザの判断に対する未観測交絡因子の影響度を算出する算出部と、
を具備する医用情報処理装置。
前記観測交絡因子を入力として前記第１数値の予測値である第１傾向スコアを出力する第１関数と、前記観測交絡因子を入力として前記第２数値の予測値である第２傾向スコアを出力する第２関数とを記憶する記憶部と、
前記第１傾向スコアと前記第２傾向スコアとの間の第２差分を抽出する第２抽出部と、
前記第１差分と前記第２差分との間の予測残差を最小化するように、前記第１関数の第１パラメータ及び前記第２関数の第２パラメータを学習する学習部と、
をさらに具備し、
前記算出部は、前記第１数値と前記学習された第１パラメータを用いて予測された前記第１傾向スコアとの間の差分、又は、前記第２数値と前記学習された第２パラメータを用いて予測された前記第２傾向スコアとの間の差分を、前記未観測交絡因子の影響度として算出する、
請求項１に記載の医用情報処理装置。
前記第１支援情報を出力するモデルを、前記未観測交絡因子の影響度を用いて更新する
更新部と、
をさらに具備する請求項１又は請求項２に記載の医用情報処理装置。
前記未観測交絡因子の影響度に基づいて、前記ユーザの判断がアウトカムに与える因果効果を推定する推定部と、
をさらに具備する請求項１から請求項３のいずれか１項に記載の医用情報処理装置。
前記因果効果に基づいて、前記ユーザの判断を支援する第２支援情報を出力する第１出力部と、
をさらに具備する請求項４に記載の医用情報処理装置。
前記第２支援情報における前記未観測交絡因子の影響度の割合を出力する第２出力部と、
をさらに具備する請求項５に記載の医用情報処理装置。
前記第２支援情報に影響する前記未観測交絡因子の候補を出力する第３出力部と、
をさらに具備する請求項５又は請求項６に記載の医用情報処理装置。
診療情報データベース及び医用情報処理装置を具備する医用情報処理システムであって、
前記診療情報データベースは、
観測交絡因子に基づいてユーザが判断した結果に対応する第１数値と、前記観測交絡因子及び前記ユーザの判断を支援する第１支援情報に基づいて前記ユーザが判断した結果に対応する第２数値とを記憶する記憶部と、
を具備し、
前記医用情報処理装置は、
前記第１数値を取得する第１取得部と、
前記第２数値を取得する第２取得部と、
前記第１数値と前記第２数値との間の第１差分を抽出する第１抽出部と、
前記第１差分及び前記観測交絡因子に基づいて、前記ユーザの判断に対する未観測交絡因子の影響度を算出する算出部と、
を具備する医用情報処理システム。