JP7384705B2 - 分析装置、分析方法、および分析プログラム - Google Patents

分析装置、分析方法、および分析プログラム Download PDF

Info

Publication number
JP7384705B2
JP7384705B2 JP2020033769A JP2020033769A JP7384705B2 JP 7384705 B2 JP7384705 B2 JP 7384705B2 JP 2020033769 A JP2020033769 A JP 2020033769A JP 2020033769 A JP2020033769 A JP 2020033769A JP 7384705 B2 JP7384705 B2 JP 7384705B2
Authority
JP
Japan
Prior art keywords
data
feature
specific
information
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020033769A
Other languages
English (en)
Other versions
JP2021135930A (ja
JP2021135930A5 (ja
Inventor
信二 垂水
渉 竹内
ジョージ チャルキディス
俊太郎 由井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020033769A priority Critical patent/JP7384705B2/ja
Priority to US17/140,455 priority patent/US20210271924A1/en
Publication of JP2021135930A publication Critical patent/JP2021135930A/ja
Publication of JP2021135930A5 publication Critical patent/JP2021135930A5/ja
Application granted granted Critical
Publication of JP7384705B2 publication Critical patent/JP7384705B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2115Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade

Description

本発明は、データを分析する分析装置、分析方法、および分析プログラムに関する。
実世界ヘルスケアデータを活用した効果的かつ効率的な診断支援やヘルスケア関連サービスの実現が求められている。従来型のヘルスケアは、臨床知見に基づく統一ガイドラインに則って実施されるが、この知見は全症例の10%以下の臨床研究にのみ基づくとの報告もあり、本来あるべき個別最適なヘルスケアの実現には至っていなかった。
そこで、最適なヘルスケアサービスを提供するため、実世界ヘルスケアデータ分析に基づき、医師や保健指導者などのサービス提供者を支援する技術の実現が期待されている。特に、個人に実施した医療サービス(投薬、生活習慣指導、介護サービスなど)の効果や質を、実データを活用して評価および予測する技術に注目が集まっている。たとえば、以下の技術が開示されている。
特許文献1には、「投薬効果情報送信装置17は、電子カルテサーバー16から患者への投薬終了を表す投薬終了通知が送信された場合に、投薬により患者に表れた投薬効果に関する投薬効果情報を、画像サーバー14及び電子カルテサーバー16から収集する。投薬効果情報送信装置17で収集された投薬効果情報は、投薬効果情報データベース54に格納される。クライアント端末18により、薬剤名及び患者の属性情報に基づいて投薬効果情報サーバー55を検索すると、投薬効果情報サーバー55は、検索した薬剤の平均的な投薬効果を表す平均投薬効果情報をクライアント端末18に送信する。クライアント端末18は、平均投薬効果情報を時系列にモニターに表示する。」との記載がある。
特許文献2には、「プロセッサにより実行可能な命令のセットを記憶する非一時的なコンピュータ可読記憶媒体。命令のセットは、現在の患者に関連するデータの現在の患者のセットを受信し、現在の患者のデータセットを複数の以前の患者データセット(それぞれが以前の患者に対応)と比較し、選択された以前の患者のデータセットと現在の患者のデータセットとの間の類似性のレベルに基づいて、以前の患者のデータセットの1つを選択し、選択した以前の患者のデータセットをユーザーに提供するように動作可能である。」との記載がある。
特開2014-71592号公報 国際公開第2012/080906号
医療サービスのような介入手段は、その種類によって実施の頻度が異なるため、過去の実施例が少ない場合、介入手段を訓練データとして当該医療サービスの効果を分析することは容易ではない。特に、複数の医療サービスを組み合わせた場合の効果を分析する場合、この課題は顕著であり、当該の組み合わせと完全に合致する実施例が0件となることもある。このような問題は、医療サービスに限らず、他のサービスでも起こりえる問題である。
本発明は、過去の訓練データとの異同や実施回数にかかわらず、分析精度の向上を図ることを目的とする。
本願において開示される発明の一側面となる分析装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する分析装置であって、入力層、1以上の中間層、および出力層を有し、前記入力層に割り当てられる対象者への実施行為に関する訓練データ群と、前記出力層に割り当てられる前記実施行為前の状態に関する実施行為前正解データ群および前記実施行為後に関する実施行為後正解データ群と、に基づいて学習された学習モデルに、前記訓練データ群の各々の訓練データを入力することにより、前記中間層から第1特徴量データ群を算出する第1算出処理と、前記学習モデルの予測対象データを入力することにより、前記中間層から第2特徴量データを算出する第2算出処理と、前記第1算出処理によって算出された第1特徴量データ群の中から、前記第2算出処理によって算出された第2特徴量データに類似する特定の第1特徴量データを検索する検索処理と、前記検索処理によって検索された特定の第1特徴量データの算出元となる特定の訓練データを前記実施行為に関する訓練データ群から抽出する抽出処理と、前記第1特徴量データ群を複数のクラスタに分類するクラスタリング処理と、前記クラスタリング処理によって分類された複数のクラスタの各々について、前記クラスタ内の第1特徴量データの算出元となる特定の訓練データおよび当該特定の訓練データに対応する特定の実施行為前正解データを含むクラスタリングに関する訓練データと、当該特定の訓練データに対応する特定の実施行為後正解データであるクラスタリングに関する正解データとに基づいて、予測モデルを生成する生成処理と、前記複数のクラスタの中から前記第2特徴量データの所属先クラスタを特定する特定処理と、前記特定処理によって特定された所属先クラスタの予測モデルを前記生成処理によって生成された複数の予測モデルの中から取得する取得処理と、前記取得処理によって取得された予測モデルに前記予測対象データを入力することにより、予測結果データを出力する出力処理と、を実行することを特徴とする。
本発明の代表的な実施の形態によれば、過去の介入手段との異同や実施回数にかかわらず、分析精度の向上を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
図1は、実施例1にかかる分析装置によるヘルスケアデータ分析例を示す説明図である。 図2は、分析装置のハードウェア構成例を示すブロック図である。 図3は、未整形ヘルスケア情報の一例を示す説明図である。 図4は、実施例1にかかる分析装置による学習モデル生成処理手順例を示すフローチャートである。 図5は、整形ヘルスケア情報の一例を示す説明図である。 図6は、ニューラルネットワークの一例を示す説明図である。 図7は、ニューラルネットワークの他の例を示す説明図である。 図8は、特徴量情報生成処理手順例を示すフローチャートである。 図9は、実施例1にかかる予測対象未整形ヘルスケア情報の一例を示す説明図である。 図10は、実施例1にかかる予測対象整形ヘルスケア情報の一例を示す説明図である。 図11は、実施例1にかかる分析装置による分析処理手順例を示すフローチャートである。 図12は、統計処理(ステップS1110)の結果例を示す説明図である。 図13は、実施例2にかかるクラスタの一例を示す説明図である。 図14は、図13に示したクラスタを用いた予測モデルの生成例を示す説明図である。 図15は、実施例2にかかる分析装置による予測モデル生成処理手順例を示すフローチャートである。 図16は、実施例2かかる分析装置による予測処理手順例を示すフローチャートである。 図17は、実施例2にかかる予測対象未整形ヘルスケア情報の一例を示す説明図である。 図18は、実施例2にかかる予測対象整形ヘルスケア情報の一例を示す説明図である。
<へルスケア分析例>
図1は、実施例1にかかる分析装置によるヘルスケアデータ分析例を示す説明図である。(1)分析装置は、訓練データとなる介入手段情報101と、正解データ102である患者背景情報102Aおよび介入効果情報102Bの組み合わせと、を取得する。介入手段情報101とは、介入手段を示す情報であり、介入手段データの集合である。介入手段情報101の各レコードが、患者ごとの介入手段データである。図1では、介入手段情報101は、患者a~cの3人の介入手段データ101a、101b、101cにより構成される。
介入手段とは、対象者(たとえば、患者や被験者)に介入する医療サービス(投薬、生活指導、介護サービスなど)である。「介入」とは、健康増進、疾病予防、病気の治療などを目的とした健康指導、介助、自立支援、投薬、外科的な処置などを対象者に実施する行為を意味する。介入手段データは、たとえば、投与した医薬品の有無や生活指導といった医療サービスの実施有無(「1」が有り、「0」が無し)を含む。すなわち、介入手段データは、患者に提供された1以上の医療サービスの組み合わせを規定する。
患者背景情報102Aは、患者の背景を示す情報であり、患者ごとの患者背景データの集合である。患者背景情報102Aの各レコードが、患者ごとの患者背景データである。患者背景情報102Aは、患者a~cの3人の患者背景データ102Aa、102Ab、102Acにより構成される。「Pre HbA1c」は、介入前のHbA1cの値を示す。
介入効果情報102Bは、介入効果を示す情報であり、介入効果データの集合である。介入効果とは、介入によりもたらされる結果であり、たとえば、治療アウトカムである。介入効果情報102Bの各レコードが、患者ごとの介入効果データである。図1では、介入効果情報102Bは、患者a~cの3人の介入効果データ102Ba、102Bb、102Bcにより構成される。「Post HbA1c」は、介入後のHbA1c(ヘモグロビンエーワンシー)の値を示す。
分析装置は、介入手段情報101(訓練データ)および正解データ102を訓練データセットとしてニューラルネットワーク103の入力層131および出力層133に与えて学習し、学習モデルを生成する。学習モデルは、学習パラメータ(重みパラメータおよびバイアス。ハイパーパラメータを含めてもよい(以下同様)。)が設定されたニューラルネットワーク103(以降、学習モデル103と称す。)である。
(2)分析装置は、特徴量情報104を生成する。特徴量情報104は、学習モデル103の内部表現である。特徴量情報104は、患者ごとの特徴量データの集合である。特徴量データは学習モデル103の1以上の中間層の中の特定の中間層132を構成する各ニューロンの計算結果である。特徴量データは、ニューロン数分の次元の特徴量空間内の点になる。2人の患者間の患者背景データおよび介入効果データがともに類似すると、2人の患者間の特徴量データも類似する。
また、図1では、中間層132のニューロンは3個であるため、特徴量1~3の値を含む特徴量データが患者ごとに計算される。このため、特徴量情報104は、患者a~cの3人の特徴量データ104a,104b,104cにより構成される。
(3)分析装置は、予測対象介入手段情報111内の患者zの予測対象介入手段データ111zを、学習モデル103に入力し、学習モデル103の特定の中間層132から患者zの特徴量データ114zを算出する。
(4)分析装置は、(2)で算出した特徴量情報104の中から(3)で算出した特徴量データに類似する特徴量データを検索する。特徴量データは、特定の中間層を構成するニューロン数分の要素(図1では、特徴量1~3の3要素)を持つ1次元ベクトルであるため、特徴量空間内の特徴量データ114zからのベクトル間距離が所定距離以内である特徴量情報104内の特徴量データは、特徴量データ114zに類似する特徴量データとなる。図1では、特徴量データ104aが特徴量データ114に類似する特徴量データに該当したとする(以下、類似特徴量データ104aと称す)。分析装置は、類似特徴量データ104aの算出元となる同一患者aの介入手段データ101aを取得する。
このように、特徴量データ114z,104aが類似するということは、患者zの予測対象介入手段データ111zと、患者aの介入手段データ101aとが、患者背景と介入効果のふたつの観点で共に類似することを意味する。介入効果を分析する際には、過去に類似した介入を行った事例を分析することが好ましいため、分析装置は患者zに対する予測対象介入手段と類似した介入が行われた患者aの介入手段データ101a、患者背景情報102Aa、介入効果情報102Ba、を取得する。
患者zに対する予測対象介入手段データ111zの効果や妥当性を分析するため、分析装置が抽出した類似した介入を行った事例を分析する。本例では、介入効果情報102Baに基づき介入効果に関する統計情報や推定値を提供したり、患者背景情報102Aaに基づき患者背景に関する統計情報や推定値を提供する。
なお、上述した例では、複数の異なる種類の医療サービス(医薬品処方および生活指導)の適否を示すデータ列として、介入手段情報101の介入手段データ101a~101cおよび予測対象介入手段情報111の予測対象介入手段データ111zを例示した。複数の異なる種類の医療サービスは、医薬品処方や生活指導に限らず、たとえば、治療や手術もあるため、医薬品処方、生活指導、治療および手術のうち2種類以上の組み合わせでもよい。また、これら以外の医療サービスの2種類以上の組み合わせでもよい。
また、介入手段情報101の介入手段データ101a~101cおよび予測対象介入手段情報111の予測対象介入手段データ111zは、1種類の医療サービスにおける複数のサービス属性の適否を示すデータ列としてもよい。
また、上述した介入手段情報101および予測対象介入手段情報111では、サービス属性:医薬品処方として、「医薬品A」、「医薬品B」、…の処方の有無としたが、「医薬品A→医薬品B」のように、過去に「医薬品A」を処方していたが「医薬品B」に変更したというサービス属性が含まれていてもよい。これにより、介入手段情報101および予測対象介入手段情報111を詳細に規定することができる。
<分析装置のハードウェア構成例>
図2は、分析装置のハードウェア構成例を示すブロック図である。分析装置200は、プロセッサ201と、記憶デバイス202と、入力デバイス203と、出力デバイス204と、通信インターフェース(通信IF)205と、を有する。プロセッサ201、記憶デバイス202、入力デバイス203、出力デバイス204、および通信IF205は、バス206により接続される。プロセッサ201は、分析装置200を制御する。記憶デバイス202は、プロセッサ201の作業エリアとなる。また、記憶デバイス202は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス202としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス203は、データを入力する。入力デバイス203としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス204は、データを出力する。出力デバイス204としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信IF205は、ネットワークと接続し、データを送受信する。
<未整形ヘルスケア情報>
図3は、未整形ヘルスケア情報の一例を示す説明図である。未整形ヘルスケア情報300は、記憶デバイス202に格納されている。また、分析装置200は、通信IF205を介して通信可能な他のコンピュータに格納されている未整形ヘルスケア情報300を取得してもよい。
未整形ヘルスケア情報300は、基本情報301と、検査情報302と、医薬品情報303と、処置情報304と、関連サービス情報305と、を含む。基本情報301とは、個人ID、生年月日、性別など、患者の基本的な情報である。個人IDは、患者を一意に特定する識別情報である。
検査情報302とは、個人ID、個人IDで特定される患者に対する検査の実施年月日、検査内容を示す実施項目、検査結果など、検査に関する情報である。医薬品情報303とは、個人ID、個人IDで特定される患者に医薬品を使用した実施年月日、当該使用した医薬品を示す実施項目など、医薬品に関する情報である。処置情報304とは、個人ID、個人IDで特定される患者に対する処置の実施年月日、処置の内容を示す実施項目など、処置に関する情報である。関連サービス情報305とは、個人ID、個人IDで特定される患者に対する関連サービスの実施年月日、関連サービスの内容を示す実施項目など、関連サービスに関する情報である。
基本情報301、検査情報302、医薬品情報303、処置情報304、および関連サービス情報305において、同一個人IDでかつ同一実施年月日のレコードを、未整形ヘルスケアデータと称す。個人IDおよび実施年月日の両方が同一である必要があるため、同一個人IDでも実施年月日が異なれば、それらは異なる未整形ヘルスケアデータとなる。
<学習モデル生成処理>
図4は、実施例1にかかる分析装置200による学習モデル生成処理手順例を示すフローチャートである。分析装置200は、記憶デバイス202または通信可能な他のコンピュータから未整形ヘルスケア情報300を取得する(ステップS401)。つぎに、分析装置200は、未整形ヘルスケア情報300をデータ整形し、整形ヘルスケア情報を生成する(ステップS402)。
図5は、整形ヘルスケア情報の一例を示す説明図である。整形ヘルスケア情報500は、レコードID501と、個人ID502と、介入日503と、患者背景情報102Aと、介入手段情報101と、介入効果情報102Bと、を有する。整形ヘルスケア情報500の各レコードが整形ヘルスケアデータである。
レコードID501は、整形ヘルスケアデータを一意に特定する識別情報である。個人ID502は、未整形ヘルスケア情報300で規定された個人IDである。介入日503は、個人ID502で特定される患者に介入した年月日である。介入日503は、未整形ヘルスケア情報300を構成する基本情報301、検査情報302、医薬品情報303、処置情報304、および関連サービス情報305のいずれかの実施年月日である。
患者背景情報102Aは、たとえば、性別、年齢、体重、空腹時血糖値のような個人情報を含む。患者背景情報102Aは、たとえば、基本情報301から整形される。患者背景情報102Aの各レコードを、患者背景データと称す。
介入手段情報101は、たとえば、医薬品A、医薬品B、処置X、介護サービスaのような各種介入手段を含む。介入手段情報101は、たとえば、医薬品情報303、処置情報304、および関連サービス情報305から整形される。介入手段情報101の各レコードを、介入手段データと称す。
介入効果情報102Bは、たとえば、アウトカム取得日、空腹時血糖値、医療費のような各種介入効果を含む。介入効果情報102Bは、たとえば、検査情報302から整形される。介入効果情報102Bの各レコードを、介入効果データと称す。
図4に戻り、分析装置200は、未選択の整形ヘルスケアデータがあるか否かを判断する(ステップS403)。未選択レコード(整形ヘルスケアデータ)がある場合(ステップS403:Yes)、分析装置200は、未選択レコードを選択し(ステップS404)、選択レコードから介入手段、背景データ、および介入効果データを抽出する(ステップS405~S406)。
分析装置200は、抽出した介入手段データを訓練データとし、抽出した背景データおよび介入効果データを正解データとして、ニューラルネットワーク103に与え、ニューラルネットワーク103の学習パラメータを更新し(ステップS408)、ステップS403に戻る。未選択レコードがない場合(ステップS403:No)、分析装置200は、ニューラルネットワーク103は、最新の学習パラメータが設定された学習モデル103となる。これにより、学習モデル生成処理が終了する。
<ニューラルネットワーク>
図6は、ニューラルネットワーク103の一例を示す説明図である。ニューラルネットワーク103は、入力層131、1つの中間層132、および出力層133(133A,133B)により構成される。入力層131には、介入手段データが入力される。介入手段データを、n次元のベクトルxとする。
中間層132は、学習パラメータとして、重みパラメータW1とバイアスb1とを有し、下記式(1)の演算を実行する。式(1)の演算結果が、図1に示したような特徴量データとなる。
x2A=W1・x+b1・・・(1)
W1は、下記式(2)のm×n行列で表現される。ただし、式(2)のv1i(1≦i≦n)は、m次元列ベクトルである。また、バイアスb1も、m次元列ベクトルである。
W1=(v11,v12,v13,…,v1n)・・・(2)
第1出力層133Aには、式(1)の実行結果(x2A=W1・x+b1)が入力される。第1出力層133Aは、学習パラメータとして、重みパラメータW2とバイアスb2とを有し、下記式(3)の演算を実行する。
y1=W2・x2A+b2・・・(3)
W2は、下記式(4)のl×n行列で表現される。ただし、式(4)のv2i(1≦i≦l)は、l次元列ベクトルである。また、バイアスb2も、l次元列ベクトルである。
W2=(v21,v22,v23,…,v2l)・・・(4)
第2出力層133Bには、式(1)の実行結果(x2A=W1・x+b1)が入力される。第2出力層133Bは、学習パラメータとして、重みパラメータW3とバイアスb3とを有し、下記式(5)の演算を実行する。
y2=W3・x2A+b3・・・(5)
W3は、下記式(6)のk×n行列で表現される。ただし、式(6)のv3i(1≦i≦k)は、k次元列ベクトルである。また、バイアスb3も、k次元列ベクトルである。
W3=(v31,v32,v33,…,v3k)・・・(6)
図7は、ニューラルネットワーク103の他の例を示す説明図である。図6のニューラルネットワーク103の中間層は1層であったのに対し、図7のニューラルネットワークの中間層はm層有する。図1の特定の中間層132と同様、m層の中間層のうち特定の中間層132が特徴量情報104を生成する。
<特徴量情報生成処理>
図8は、特徴量情報生成処理手順例を示すフローチャートである。分析装置200は、整形ヘルスケア情報500に未選択の介入手段データがあるか否かを判断する(ステップS801)。未選択の介入手段データがある場合(ステップS801:Yes)、分析装置200は、整形ヘルスケア情報500から未選択の介入手段データを取得する(ステップS802)。
分析装置200は、取得した介入手段データを、学習モデル103に入力する(ステップS803)。分析装置200は、学習モデル103の特定の中間層132により特徴量データを算出して記憶デバイス202に格納し、ステップS801に戻る(ステップS804)。この算出された特徴量データを、便宜的に第1特徴量データと称す。
ステップS802で取得された介入手段データが図1に示した介入手段データ101aであれば、第1特徴量データとして特徴量データ104aが算出される。ステップS801において、未選択の介入手段データがない場合(ステップS801:No)、特徴量情報生成処理は終了する。このようにして、図1の(2)に示したような特徴量情報104が生成される。
<予測対象未整形ヘルスケア情報>
図9は、実施例1にかかる予測対象未整形ヘルスケア情報の一例を示す説明図である。予測対象未整形ヘルスケア情報900は、記憶デバイス202に格納されている。また、分析装置200は、通信IF205を介して通信可能な他のコンピュータに格納されている予測対象未整形ヘルスケア情報900を取得してもよい。
予測対象未整形ヘルスケア情報900は、医薬品情報903と、処置情報904と、関連サービス情報905と、を含む。医薬品情報903、処置情報904、および関連サービス情報905は、図3に示した医薬品情報303、処置情報304、および関連サービス情報305と同一項目を有する。また、検査は実施されていないため、予測対象未整形ヘルスケア情報900には検査情報は含まれない。未整形ヘルスケア情報300の少なくとも一部を予測対象未整形ヘルスケア情報900として用いる場合、基本情報301および検査情報302を除外すればよい。
医薬品情報903、処置情報904、および関連サービス情報905において、同一個人IDでかつ同一実施年月日のレコードを、予測対象未整形ヘルスケアデータと称す。個人IDおよび実施年月日の両方が同一である必要があるため、同一個人IDでも実施年月日が異なれば、それらは異なる予測対象未整形ヘルスケアデータとなる。
図10は、実施例1にかかる予測対象整形ヘルスケア情報の一例を示す説明図である。予測対象整形ヘルスケア情報1000は、レコードID501と、個人ID502と、介入日503と、予測対象介入手段情報111と、を有する。予測対象整形ヘルスケア情報1000の各レコードが予測対象整形ヘルスケアデータである。
<分析処理>
図11は、実施例1にかかる分析装置200による分析処理手順例を示すフローチャートである。分析装置200は、記憶デバイス202または通信可能な他のコンピュータから予測対象未整形ヘルスケア情報900を取得する(ステップS1101)。つぎに、分析装置200は、予測対象未整形ヘルスケア情報900をデータ整形し、予測対象整形ヘルスケア情報1000を生成する(ステップS1102)。
分析装置200は、予測対象整形ヘルスケア情報1000から予測対象整形ヘルスケアデータを選択する(ステップS1103)。分析装置200は、選択した予測対象整形ヘルスケアデータから予測対象介入手段データを抽出する(ステップS1104)。
なお、分析装置200は、ステップS1101~S1104のように介入手段データを取得するのではなく、ユーザ操作により、入力デバイス203または通信IF205を介して通信可能な他のコンピュータから、たとえば、「医薬品A and 医薬品X」のように、介入手段データの入力を受け付けてもよい。
分析装置200は、抽出した予測対象介入手段データを学習モデル103に入力する(ステップS1105)。分析装置200は、学習モデル103の特定の中間層132により特徴量データを算出する(ステップS1106)。この特徴量データを、ステップS804の第1特徴量データと区別するため、便宜的に、第2特徴量データと称す。ステップS1104で取得された予測対象介入手段データが図1に示した予測対象介入手段データ111zであれば、第2特徴量データとして特徴量データ114zが算出される。
分析装置200は、第2特徴量データに類似する特定の第1特徴量データを検索する(ステップS1107)。具体的には、たとえば、分析装置200は、第1特徴量データの各々と第2特徴量データとの類似度を算出する。類似度が類似度しきい値以上であれば、その第1特徴量データは、第2特徴量データに類似する特定の第1特徴量データとなる。
類似度は、たとえば、特徴量空間内における第1特徴量データと第2特徴量データとの距離である。算出距離の逆数が類似度しきい値以上であれば、その第1特徴量データは、第2特徴量データに類似する特定の第1特徴量データとなる。
なお、類似度しきい値は、あらかじめ分析装置200に設定された値でもよく、ユーザ操作により、入力デバイス203または通信IF205を介して通信可能な他のコンピュータから受け付けた値でもよい。
分析装置200は、特定の第1特徴量データに対応する特定のヘルスケアデータを抽出する(ステップS1108)。具体的には、たとえば、分析装置200は、特定の第1特徴量データの算出元となる介入手段データを含む整形ヘルスケアデータを、整形ヘルスケア情報500から抽出する。図1の(5)の例では、特定の第1特徴量データが特徴量データ104aだとすると、特定のヘルスケアデータとして、介入手段情報101から介入手段データ101aが抽出される。
このあと、分析装置200は、統計処理を実行し(ステップS1110)、統計処理(ステップS1110)の結果を出力する(ステップS1111)。統計処理(ステップS1110)の詳細については後述する。
図12は、統計処理(ステップS1110)の結果例を示す説明図である。結果画面1200は、統計処理(ステップS1110)の結果を表示する画面である。結果画面は、入力領域1201と、出力領域1202と、を有する。
入力領域1201は、編集ボタン1211と、分析ボタン1212と、介入手段入力欄1213と、しきい値入力欄1214と、を有する。編集ボタン1211は、押下により介入手段入力欄1213およびしきい値入力欄1214への文字列の入力を可能にするボタンである。分析ボタン1212は、押下により図11に示した分析処理を実行するためのボタンである。
介入手段入力欄1213は、ユーザ操作により、入力デバイス203または通信IF205を介して通信可能な他のコンピュータから、たとえば、「医薬品A and 医薬品X」のように、予測対象介入手段データ111zの入力を受け付ける入力欄である。しきい値入力欄1214は、ユーザ操作により、入力デバイス203または通信IF205を介して通信可能な他のコンピュータから、たとえば、「0.80」のように、類似度を示す数値の入力を受け付ける入力欄である。
出力領域1202は、類似介入手段情報1221と、類似患者背景情報1222と、類似介入効果情報1223と、を有する。類似介入手段情報1221は、類似介入手段1231ごとに、類似度1232や症例数1233といった情報を有する。類似介入手段1231は、介入手段入力欄1213に入力された介入手段データが学習モデル103に入力された結果、ステップS1106で特定の中間層132から算出された第2特徴量データに類似する特定の第1特徴量データ(ステップS1107)の算出元となる介入手段データであり、ステップS1108で抽出される。
類似度1232は、介入手段入力欄1213に入力された予測対象介入手段データが学習モデル103に入力された結果、ステップS1106で特定の中間層132から算出された第2特徴量データと、類似介入手段1231との類似度(たとえば、算出距離の逆数)であり、ステップS1107で算出される。類似介入手段情報1221として表示される類似介入手段は、たとえば、その類似度1232が類似度しきい値以上となる介入手段データである。
症例数1233は、類似介入手段1231を介入手段データとして持つ整形ヘルスケアデータの計数値であり、統計処理(ステップS1109)で算出される。
類似患者背景情報1222は、類似介入手段1231ごとに、年齢1241や体重1242、空腹時血糖1243といった情報を有する。
年齢1241は、類似介入手段から特定される1以上の年齢の統計値(たとえば、平均値±標準偏差)である。具体的には、たとえば、分析装置200は、類似介入手段1231となる介入手段データごとに、当該介入手段データを含む整形ヘルスケアデータ(以下、類似整形ヘルスケアデータ)を整形ヘルスケア情報500から特定する。分析装置200は、類似整形ヘルスケアデータごとに、類似整形ヘルスケアデータ内の患者背景データに含まれる年齢を抽出する。分析装置200は、類似整形ヘルスケアデータごとに抽出した年齢の平均値と標準偏差を算出し、類似患者背景情報1222における類似介入手段1231に対応する年齢1241として表示する。年齢1241は、統計処理(ステップS1109)で算出される。
体重1242も年齢1241と同様、類似介入手段1231から特定される1以上の体重の統計値(たとえば、平均値±標準偏差)である。具体的には、たとえば、分析装置200は、類似整形ヘルスケアデータごとに、類似整形ヘルスケアデータ内の患者背景データに含まれる体重を抽出する。分析装置200は、類似整形ヘルスケアデータごとに抽出した体重の平均値と標準偏差を算出し、類似患者背景情報1222における類似介入手段1231に対応する体重1242として表示する。体重1242は、統計処理(ステップS1109)で算出される。
空腹時血糖1243も年齢1241と同様、類似介入手段1231から特定される1以上の介入前の空腹時血糖の統計値(たとえば、平均値±標準偏差)である。具体的には、たとえば、分析装置200は、類似整形ヘルスケアデータごとに、類似整形ヘルスケアデータ内の背景データに含まれる空腹時血糖を抽出する。分析装置200は、類似整形ヘルスケアデータごとに抽出した空腹時血糖の平均値と標準偏差を算出し、類似患者背景情報1222における類似介入手段1231に対応する空腹時血糖1243として表示する。空腹時血糖1243は、統計処理(ステップS1109)で算出される。
類似介入効果情報1223は、類似介入手段1231ごとに、空腹時血糖1251や医療費1252といった情報を有する。
空腹時血糖1251は、類似介入手段1231から特定される1以上の介入後の空腹時血糖の統計値(たとえば、平均値±標準偏差)である。具体的には、たとえば、分析装置200は、類似整形ヘルスケアデータごとに、類似整形ヘルスケアデータ内の介入効果データに含まれる空腹時血糖を抽出する。分析装置200は、類似整形ヘルスケアデータごとに抽出した空腹時血糖の平均値と標準偏差を算出し、類似介入効果情報1223における類似介入手段1231に対応する空腹時血糖1251として表示する。空腹時血糖1251は、統計処理(ステップS1109)で算出される。
医療費1252も空腹時血糖1251と同様、類似介入手段から特定される1以上の医療費の統計値(たとえば、平均値±標準偏差)である。具体的には、たとえば、分析装置200は、類似整形ヘルスケアデータごとに、類似整形ヘルスケアデータ内の介入効果データに含まれる医療費を抽出する。分析装置200は、類似整形ヘルスケアデータごとに抽出した医療費の平均値と標準偏差を算出し、類似介入効果情報1223における類似介入手段に対応する医療費1252として表示する。医療費1252は、統計処理(ステップS1109)で算出される。
以上説明したように、実施例1によれば、ある患者zに提供された1以上の医療サービスの組み合わせである予測対象介入手段データ111zと一致しない介入手段データ群から、類似介入手段情報1221のような類似した介入を行った事例と、類似介入効果情報1223のような当該の事例の介入効果に関する統計情報と、類似背景情報1222のような患者背景に関する統計情報(たとえば、平均値や標準偏差)と、を提供することができる。
つぎに、実施例2について説明する。実施例1では、類似した介入を行った事例の情報を提供するため、分析装置200は、類似した介入を行った事例と、当該の事例の介入効果に関する統計情報と、患者背景に関する統計情報(たとえば、平均値や標準偏差)と、を提供した。実施例2では、似たような介入手段データには、似たような介入効果があるため、分析装置200は、そのような予測をすることができる予測モデルを生成する。
そして、分析装置200は、この予測モデルに患者zの予測対象介入手段データ111zと患者zの予測対象患者背景データ111Azを入力することにより、患者zの介入効果データを予測することができる。なお、特に指摘しない限り、実施例2では実施例1で説明した図1~図10の内容が適用される。また、実施例1と同一構成には同一符号を付し、その説明を省略する。
<クラスタ>
図13は、実施例2にかかるクラスタの一例を示す説明図である。特徴量空間1300の特徴量データ104a~104mは、介入手段データ101a~101mが学習モデル103に入力された結果、特定の中間層132から算出される。クラスタC1~C5は、類似する特徴量データを含む。
<予測モデル>
図14は、図13に示したクラスタを用いた予測モデルの生成例を示す説明図である。予測モデルM1~M5の生成は、学習モデル103の生成と同じように実行される。たとえば、クラスタC5の場合、分析装置200は、クラスタC5に所属する特徴量データ104h~104kの算出元となる介入手段データ101h~101k、患者背景データ102Ah~102Akをニューラルネットワークの入力層に与え、対応する介入効果データ102Bh~102Bkを出力層に与えて学習し、学習パラメータ(重みパラメータおよびバイアス)を取得する。
ニューラルネットワークにこの学習パラメータが設定すると予測モデルM5となる。予測モデルM1~M4についても、クラスタC1~C4を用いて、同様に生成される。なお、予測モデルM1~M5は、その他の予測分析モデル、たとえば、線形回帰モデルでもよい。
<予測モデル生成>
図15は、実施例2にかかる分析装置200による予測モデル生成処理手順例を示すフローチャートである。分析装置200は、各介入手段データを整形ヘルスケア情報500から抽出し、学習モデル103に入力することで特定の中間層132から算出された特徴量データを取得する(ステップS1501)。これにより、図13に示したような特徴量データ104a~104mが得られる。
分析装置200は、ステップS1501で取得された特徴量データ群についてクラスタリングを実行する(ステップS1502)。たとえば、階層的クラスタリングを実行する場合、分析装置200は、(1)個々の特徴量データを1つのクラスタとして設定し、(2)クラスタ間の類似度を計算して、最も類似するクラスタを併合し、(3)クラスタ数が所定数に収束するまで、(2)を実行する。(2)のクラスタ間の類似度は、たとえば、最近隣法、最遠隣法、または重心法により算出されたクラスタ間距離の逆数である。これにより、図13に示したようなクラスタC1~C5が生成される。また、分析装置200は、k平均法などの非階層的クラスタリングを実行して、クラスタC1~C5を生成してもよい。
分析装置200は、クラスタごとにクラスタに所属する特徴量データの算出元となる介入手段データを取得する(ステップS1503)。たとえば、クラスタC5の場合、分析装置200は、クラスタC5に所属する特徴量データ104h~104kの算出元となる介入手段データ101h~101kを取得する。
そして、分析装置200は、クラスタ群のうち未選択クラスタがあるか否かを判断する(ステップS1504)。未選択クラスタがある場合(ステップS1504:Yes)、分析装置200は、未選択クラスタを選択する(ステップS1505)。
分析装置200は、選択クラスタの介入手段データごとに、対応する患者背景データおよび介入効果データを整形ヘルスケアデータから抽出する(ステップS1506)。たとえば、クラスタC5の場合、分析装置200は、介入手段データ101h~101kに対応する患者背景データ102Ah~102Ak,介入効果データ102Bh~102Bkを患者h~kのヘルスケアデータから抽出する。
分析装置200は、選択クラスタについて予測モデルを生成し(ステップS1507)、ステップS1504に戻る。たとえば、クラスタC5の場合、分析装置200は、クラスタC5に所属する特徴量データ104h~104kの算出元となる介入手段データ101h~101kをニューラルネットワークの入力層に与え、介入手段データ101h~101kに対応する患者背景データ102Ah~102Ak,介入効果データ102Bh~102Bkをニューラルネットワークの出力層に与え、予測モデルM5を生成する。
ステップS1504において、未選択クラスタがない場合(ステップS1504:No)、予測モデル生成処理が終了する。生成された予測モデル群(たとえば、予測モデルM1~M5)は、記憶デバイス202または通信IF205を介して通信可能な他のコンピュータに格納される。
<予測処理>
図16は、実施例2かかる分析装置200による予測処理手順例を示すフローチャートである。図17は、実施例2にかかる予測対象未整形ヘルスケア情報の一例を示す説明図である。予測対象未整形ヘルスケア情報1700は、記憶デバイス202に格納されている。また、分析装置200は、通信IF205を介して通信可能な他のコンピュータに格納されている予測対象未整形ヘルスケア情報1700を取得してもよい。
予測対象未整形ヘルスケア情報1700は、基本情報1701と、検査情報1702と、医薬品情報1703と、処置情報1704と、関連サービス情報1705と、を含む。基本情報1701~関連サービス情報1705は、図3に示した基本情報301~関連サービス情報305と同様な情報である。
図18は、実施例2にかかる予測対象整形ヘルスケア情報の一例を示す説明図である。予測対象整形ヘルスケア情報1800は、図5に示した整形ヘルスケア情報500と同様、レコードID501と、個人ID502と、介入日503と、患者背景情報102Aと、介入手段情報101と、を有する。ただし、予測対象であるため、介入効果情報102Bは含まれない。患者背景情報102Aには、患者zの予測対象患者背景データ111Azが含まれる。介入手段情報101には、患者zの予測対象介入手段データ111zが含まれる。
図16に戻り、分析装置200は、記憶デバイス202または通信可能な他のコンピュータから予測対象未整形ヘルスケア情報1700を取得する(ステップS1601)。つぎに、分析装置200は、予測対象未整形ヘルスケア情報1700をデータ整形し、予測対象整形ヘルスケア情報1800を生成する(ステップS1602)。分析装置200は、予測対象整形ヘルスケア情報1800から予測対象整形ヘルスケアデータを選択する(ステップS1603)。分析装置200は、選択した予測対象整形ヘルスケアデータから予測対象介入手段データおよび予測対象患者背景データを抽出する(ステップS1604)。ステップS1105とステップS1106は、図11のステップS1105とステップS1106と同じ処理であるため、説明を省略する。
なお、分析装置200は、ステップS1601~S1604のように介入手段データおよび患者背景データを取得するのではなく、ユーザ操作により、入力デバイス203または通信IF205を介して通信可能な他のコンピュータから、たとえば、「医薬品A and 医薬品X」や「SET 年齢=79」のように、介入手段データおよび患者背景データの入力を受け付け、その予測対象介入手段データおよび予測対象患者背景データを学習モデル103に入力して、特定の中間層132から第2特徴量データを算出してもよい。
ステップS1106のあと、分析装置200は、第2特徴量データの所属クラスタを特定する(ステップS1607)。第2特徴量データの所属クラスタとは、特徴量空間において第2特徴量データを包含するクラスタである。所属クラスタが存在しない場合、分析装置200は、その旨を出力し、予測対象整形ヘルスケアデータの再選択(または予測対象介入手段データの再入力)を促してもよく、また、第2特徴量データが包含するまでクラスタ総数が減少するようクラスタリングを再実行してもよい。
分析装置200は、予測モデル群の格納先からステップS1607で特定したクラスタの予測モデルを取得する(ステップS1608)。分析装置200は、取得した予測モデルに、ステップS1604で抽出した予測対象介入手段データと予測対象患者背景データを入力することにより、予測モデルから予測結果データを出力する(ステップS1610)。予測結果データは、介入効果データの予測値を含む。これにより、予測処理が終了する。
このように、実施例2によれば、クラスタC1~C5ごとに生成された予測モデルM1~M5から、予測対象介入手段データが該当するクラスタの予測モデルが特定される。したがって、特定した予測モデルを用いることにより、予測対象介入手段データと一致する介入手段データがなくても、予測対象介入手段データと患者背景データから構築された予測モデルに基づき、介入効果データの予測結果を得ることができる。
実施例3について説明する。特に指摘しない限り、実施例3では、実施例1で説明した図1~図12の内容、および、実施例2で説明した図13および図15の内容が適用される。また、実施例1および実施例2と同一構成には同一符号を付し、その説明を省略する。
実施例2では、分析装置200は、クラスタC1~C5ごとに予測モデルM1~M5を生成した。これに対し、実施例3では、分析装置200は、図13に示したようにクラスタC1~C5を生成するが(ステップS1502)、予測モデルM1~M5を生成(ステップS1507)せずに、実施例1のように、特定のヘルスケアデータを抽出して(ステップS1108)、統計処理を実行する(ステップS1109)。
具体的には、たとえば、分析装置200は、第2特徴量データの所属先クラスタをクラスタC1~C5から特定する。たとえば、分析装置200は、第2特徴量データと最も類似する(距離が近い)クラスタを、たとえば、上述した最近隣法、最遠隣法、または重心法により特定する。そして、分析装置200は、ステップS1107のように、特定した所属先クラスタ内の第1特徴量データ分群の中から第2特徴量データに類似する特定の第1特徴量データを検索する。これ以降は、分析装置200は、実施例1と同様、ステップS1108~S1110を実行する。
このように、実施例3によれば、第2特徴量データとクラスタとの類似度により第2特徴量データの所属先クラスタを特定するため、個々の第1特徴量データとの類似度を算出する必要がない。したがって、計算処理の効率化を図ることができる。
なお、上述した実施例1~実施例3では、医療サービスを用いた分析について説明したが、分析に用いる訓練データセットは、医療機関由来に限定されず、広く健康に関わるものでも良い。たとえば、診療報酬明細書などの医療費支払いに関するデータでもよい。さらに、医療サービスに限らず他のサービスでもよい。たとえば、スポーツ競技の支援サービスに適用してもよい。この場合、介入手段情報101は、選手の練習方法や栄養剤の処方となり、患者背景情報102Aは、選手の背景情報となり、介入効果情報102Bは、筋力や走力といった測定結果となる。
また、工作機械の修理サービスに適用してもよい。この場合、介入手段情報101は、修理項目となり、患者背景情報102Aは、工作機械の背景情報(製造年月日、使用年数など)となり、介入効果情報102Bは、工作機械の部位(たとえばアーム)の可動範囲となる。また、株式投資に適用してもよい。この場合、介入手段情報101は、銘柄となり、患者背景情報102Aは、投資家の背景情報(経験年数や投資額など)となり、介入効果情報102Bは、保有株式数や売買価格となる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
C1~C5 クラスタ
M1~M5 予測モデル
101 介入手段情報
102A 患者背景情報
102A 介入効果情報
102B 介入効果情報
103 学習モデル
104 特徴量情報
111 予測対象介入手段情報
111z 予測対象介入手段データ
131 入力層
132 中間層
133 出力層
200 分析装置
201 プロセッサ
202 記憶デバイス
500 整形ヘルスケア情報
1000 予測対象整形ヘルスケア情報
1231 類似介入手段
1232 類似度

Claims (9)

  1. プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する分析装置であって、
    前記プロセッサは、
    入力層、1以上の中間層、および出力層を有し、前記入力層に割り当てられる対象者への実施行為に関する訓練データ群と、前記出力層に割り当てられる前記実施行為前の状態に関する実施行為前正解データ群および前記実施行為後に関する実施行為後正解データ群と、に基づいて学習された学習モデルに、前記訓練データ群の各々の訓練データを入力することにより、前記中間層から第1特徴量データ群を算出する第1算出処理と、
    前記学習モデルの予測対象データを入力することにより、前記中間層から第2特徴量データを算出する第2算出処理と、
    前記第1算出処理によって算出された第1特徴量データ群の中から、前記第2算出処理によって算出された第2特徴量データに類似する特定の第1特徴量データを検索する検索処理と、
    前記検索処理によって検索された特定の第1特徴量データの算出元となる特定の訓練データを前記実施行為に関する訓練データ群から抽出する抽出処理と、
    前記第1特徴量データ群を複数のクラスタに分類するクラスタリング処理と、
    前記クラスタリング処理によって分類された複数のクラスタの各々について、前記クラスタ内の第1特徴量データの算出元となる特定の訓練データおよび当該特定の訓練データに対応する特定の実施行為前正解データを含むクラスタリングに関する訓練データと、当該特定の訓練データに対応する特定の実施行為後正解データであるクラスタリングに関する正解データとに基づいて、予測モデルを生成する生成処理と、
    前記複数のクラスタの中から前記第2特徴量データの所属先クラスタを特定する特定処理と、
    前記特定処理によって特定された所属先クラスタの予測モデルを前記生成処理によって生成された複数の予測モデルの中から取得する取得処理と、
    前記取得処理によって取得された予測モデルに前記予測対象データを入力することにより、予測結果データを出力する出力処理と、
    を実行することを特徴とする分析装置。
  2. 請求項1に記載の分析装置であって、
    前記検索処理では、前記プロセッサは、前記第1特徴量データ群の各々の第1特徴量データと前記第2特徴量データとの類似度を算出し、前記類似度に基づいて、前記第1特徴量データ群の中から前記特定の第1特徴量データを検索する、
    ことを特徴とする分析装置。
  3. 請求項2に記載の分析装置であって、
    前記検索処理では、前記プロセッサは、前記類似度が所定のしきい値以上となる第1特徴量データを前記特定の第1特徴量データとして検索する、
    ことを特徴とする分析装置。
  4. 請求項1に記載の分析装置であって、
    前記抽出処理では、前記プロセッサは、前記特定の訓練データに対応する特定の実施行為前正解データおよび前記特定の実施行為後正解データを前記実施行為前正解データ群および前記実施行為後正解データ群から抽出する、
    ことを特徴とする分析装置。
  5. 請求項1に記載の分析装置であって、
    前記プロセッサは、
    前記特定の訓練データに関する統計値を算出する統計処理を実行する、
    ことを特徴とする分析装置。
  6. 請求項1に記載の分析装置であって、
    前記プロセッサは、
    前記特定の実施行為前正解データに関する統計値を算出する統計処理を実行する、
    ことを特徴とする分析装置。
  7. 請求項1に記載の分析装置であって、
    前記プロセッサは、
    前記特定の実施行為後正解データに関する統計値を算出する統計処理を実行する、
    ことを特徴とする分析装置。
  8. プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する分析装置が実行する分析方法であって、
    前記分析方法は、
    前記プロセッサが、
    入力層、1以上の中間層、および出力層を有し、前記入力層に割り当てられる対象者への実施行為に関する訓練データ群と、前記出力層に割り当てられる前記実施行為前の状態に関する実施行為前正解データ群および前記実施行為後に関する実施行為後正解データ群と、に基づいて学習された学習モデルに、前記訓練データ群の各々の訓練データを入力することにより、前記中間層から第1特徴量データ群を算出する第1算出処理と、
    前記学習モデルの予測対象データを入力することにより、前記中間層から第2特徴量データを算出する第2算出処理と、
    前記第1算出処理によって算出された第1特徴量データ群の中から、前記第2算出処理によって算出された第2特徴量データに類似する特定の第1特徴量データを検索する検索処理と、
    前記検索処理によって検索された特定の第1特徴量データの算出元となる特定の訓練データを前記実施行為に関する訓練データ群から抽出する抽出処理と、
    前記第1特徴量データ群を複数のクラスタに分類するクラスタリング処理と、
    前記クラスタリング処理によって分類された複数のクラスタの各々について、前記クラスタ内の第1特徴量データの算出元となる特定の訓練データおよび当該特定の訓練データに対応する特定の実施行為前正解データを含むクラスタリングに関する訓練データと、当該特定の訓練データに対応する特定の実施行為後正解データであるクラスタリングに関する正解データとに基づいて、予測モデルを生成する生成処理と、
    前記複数のクラスタの中から前記第2特徴量データの所属先クラスタを特定する特定処理と、
    前記特定処理によって特定された所属先クラスタの予測モデルを前記生成処理によって生成された複数の予測モデルの中から取得する取得処理と、
    前記取得処理によって取得された予測モデルに前記予測対象データを入力することにより、予測結果データを出力する出力処理と、
    を実行することを特徴とする分析方法。
  9. プロセッサに、
    入力層、1以上の中間層、および出力層を有し、前記入力層に割り当てられる対象者への実施行為に関する訓練データ群と、前記出力層に割り当てられる前記実施行為前の状態に関する実施行為前正解データ群および前記実施行為後に関する実施行為後正解データ群と、に基づいて学習された学習モデルに、前記訓練データ群の各々の訓練データを入力することにより、前記中間層から第1特徴量データ群を算出する第1算出処理と、
    前記学習モデルの予測対象データを入力することにより、前記中間層から第2特徴量データを算出する第2算出処理と、
    前記第1算出処理によって算出された第1特徴量データ群の中から、前記第2算出処理によって算出された第2特徴量データに類似する特定の第1特徴量データを検索する検索処理と、
    前記検索処理によって検索された特定の第1特徴量データの算出元となる特定の訓練データを前記実施行為に関する訓練データ群から抽出する抽出処理と、
    前記第1特徴量データ群を複数のクラスタに分類するクラスタリング処理と、
    前記クラスタリング処理によって分類された複数のクラスタの各々について、前記クラスタ内の第1特徴量データの算出元となる特定の訓練データおよび当該特定の訓練データに対応する特定の実施行為前正解データを含むクラスタリングに関する訓練データと、当該特定の訓練データに対応する特定の実施行為後正解データであるクラスタリングに関する正解データとに基づいて、予測モデルを生成する生成処理と、
    前記複数のクラスタの中から前記第2特徴量データの所属先クラスタを特定する特定処理と、
    前記特定処理によって特定された所属先クラスタの予測モデルを前記生成処理によって生成された複数の予測モデルの中から取得する取得処理と、
    前記取得処理によって取得された予測モデルに前記予測対象データを入力することにより、予測結果データを出力する出力処理と、
    を実行させるための分析プログラム。
JP2020033769A 2020-02-28 2020-02-28 分析装置、分析方法、および分析プログラム Active JP7384705B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020033769A JP7384705B2 (ja) 2020-02-28 2020-02-28 分析装置、分析方法、および分析プログラム
US17/140,455 US20210271924A1 (en) 2020-02-28 2021-01-04 Analyzer, analysis method, and analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020033769A JP7384705B2 (ja) 2020-02-28 2020-02-28 分析装置、分析方法、および分析プログラム

Publications (3)

Publication Number Publication Date
JP2021135930A JP2021135930A (ja) 2021-09-13
JP2021135930A5 JP2021135930A5 (ja) 2022-04-19
JP7384705B2 true JP7384705B2 (ja) 2023-11-21

Family

ID=77463709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020033769A Active JP7384705B2 (ja) 2020-02-28 2020-02-28 分析装置、分析方法、および分析プログラム

Country Status (2)

Country Link
US (1) US20210271924A1 (ja)
JP (1) JP7384705B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT201800003980A1 (it) 2018-03-26 2019-09-26 Stmicroelectronics Application Gmbh Procedimento di comunicazione, sistema, dispositivi, segnale e veicolo corrispondenti

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017054214A (ja) 2015-09-07 2017-03-16 ヤフー株式会社 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム
JP2019046474A (ja) 2017-08-30 2019-03-22 株式会社シーディーアイ 情報処理装置及びプログラム
WO2020026643A1 (ja) 2018-08-03 2020-02-06 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017054214A (ja) 2015-09-07 2017-03-16 ヤフー株式会社 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム
JP2019046474A (ja) 2017-08-30 2019-03-22 株式会社シーディーアイ 情報処理装置及びプログラム
WO2020026643A1 (ja) 2018-08-03 2020-02-06 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP2021135930A (ja) 2021-09-13
US20210271924A1 (en) 2021-09-02

Similar Documents

Publication Publication Date Title
Ricciardi et al. Linear discriminant analysis and principal component analysis to predict coronary artery disease
JP6915282B2 (ja) オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
JP6907831B2 (ja) コンテキストベースの患者類似性の方法及び装置
US8589420B2 (en) Medical information system and program for same
JP5977898B1 (ja) 行動予測装置、行動予測装置の制御方法、および行動予測装置の制御プログラム
CN110291555B (zh) 用于促进对健康状况的计算分析的系统和方法
US20020035486A1 (en) Computerized clinical questionnaire with dynamically presented questions
ul Abideen et al. Docontap: Ai-based disease diagnostic system and recommendation system
JP6177609B2 (ja) 医療カルテシステム及び医療カルテ検索方法
Chou et al. Extracting drug utilization knowledge using self-organizing map and rough set theory
JP6963535B2 (ja) 分析方法、分析装置及びプログラム
JP7384705B2 (ja) 分析装置、分析方法、および分析プログラム
Suraj et al. SMART COVID Navigator, a clinical decision support tool for COVID-19 treatment: design and development study
CN114078593A (zh) 临床决策支持
Cousyn et al. Towards using scientific publications to automatically extract information on rare diseases
CN116312926A (zh) 健康路径推荐方法及相关装置、电子设备和存储介质
Patel et al. Predicting Heart Disease Using Machine Learning Algorithms
Suha et al. A systematic review and future research agenda on detection of polycystic ovary syndrome (PCOS) with computer-aided techniques
JP2019109717A (ja) 傷病別医療費推計装置および方法並びにプログラム
Zhu et al. DCDS: A real-time data capture and personalized decision support system for heart failure patients in skilled nursing facilities
Moradi et al. Detecting factors associated with polypharmacy in general practitioners' prescriptions: A data mining approach
Nazurah et al. HealthyHeart Data Visualization: Predicting Heart Condition Using Machine Learning
Riha et al. Medical guideline as prior knowledge in electronic healthcare record mining
Jahangiri et al. An Improved Naïve Bayes Approach to Diagnose Cardiovascular Disease: A Case Study
Bae Diagnosis Analysis of Patient Process Log Data

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220408

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231109

R150 Certificate of patent or registration of utility model

Ref document number: 7384705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150