JP2020004126A - ヘルスケアデータ分析システム、ヘルスケアデータ分析方法、ヘルスケアデータ分析プログラム、学習済みモデル、情報処理装置、情報処理方法および情報処理プログラム - Google Patents

ヘルスケアデータ分析システム、ヘルスケアデータ分析方法、ヘルスケアデータ分析プログラム、学習済みモデル、情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP2020004126A
JP2020004126A JP2018123615A JP2018123615A JP2020004126A JP 2020004126 A JP2020004126 A JP 2020004126A JP 2018123615 A JP2018123615 A JP 2018123615A JP 2018123615 A JP2018123615 A JP 2018123615A JP 2020004126 A JP2020004126 A JP 2020004126A
Authority
JP
Japan
Prior art keywords
data
target item
value
healthcare
healthcare data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018123615A
Other languages
English (en)
Other versions
JP7173482B2 (ja
Inventor
村 匠 市
Takumi Ichimura
村 匠 市
田 真 鎌
Shin Kamada
田 真 鎌
田 俊 英 原
Toshihide Harada
田 俊 英 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hiroshima Environment & Health Association
Prefectural University of Hiroshima
Original Assignee
Hiroshima Environment & Health Association
Prefectural University of Hiroshima
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hiroshima Environment & Health Association, Prefectural University of Hiroshima filed Critical Hiroshima Environment & Health Association
Priority to JP2018123615A priority Critical patent/JP7173482B2/ja
Publication of JP2020004126A publication Critical patent/JP2020004126A/ja
Application granted granted Critical
Publication of JP7173482B2 publication Critical patent/JP7173482B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】ヘルスケアデータの所定の対象項目の値に影響を与える項目を高い精度で抽出する。【解決手段】実施形態のヘルスケアデータ分析システム1は、複数のヘルスケアデータを含むデータセットを取得するデータセット取得部11と、前記複数のヘルスケアデータを、複数の正常ヘルスケアデータおよび複数の異常ヘルスケアデータに分けるデータ分類部12と、前記複数の正常ヘルスケアデータの各々から所定の対象項目に係るデータを除くことにより入力データセットを生成する入力データセット生成部13と、前記入力データセットおよび前記複数の正常ヘルスケアデータの前記対象項目に係るデータに基づいて、前記対象項目の値を出力する学習済みモデルを構築する深層学習部14と、前記学習済みモデルに基づいて前記複数の異常ヘルスケアデータの前記対象項目の値に影響を与えている項目を分析する分析部15とを備える。【選択図】図2

Description

本発明は、ヘルスケアデータ分析システム、ヘルスケアデータ分析方法、ヘルスケアデータ分析プログラム、学習済みモデル、情報処理装置、情報処理方法および情報処理プログラムに関する。
従来技術として、計測装置により測定される測定値および操作者により入力される入力値を含む複数項目の元指標を取得し、取得した元指標の値に基づいて、評価対象者の健康状態を年齢に換算した指標である健康年齢を算出し、表示する健康状態判断装置が知られている(特許文献1)。この装置において、健康年齢は、複数のリスク因子の線形和として計算される。各リスク因子の係数は、疫学データを利用して、回帰分析等の統計的手法により算出される。
また、生命保険会社の中には、Webサイト上で、閲覧者が入力したデータ(年齢、性別、健診データ等)に基づいて健康年齢を算出し、提示しているところがある(例えば、https://neofirst.co.jp/sim/health.html, https://www.dai-ichi-life-special.jp/sim/health.html, http://www.resona-gr.co.jp/resonagr/women/neo/)。
ところで、近年、深層学習(ディープラーニング)に関する技術が活発に研究、開発されている。深層学習は、多層構造のニューラルネットワークを用いた機械学習の一種である。
深層学習の一手法として、構造適応型深層学習法が知られている(非特許文献1参照)。この構造適応型深層学習法によれば、制限付きボルツマンマシン(Restricted Boltzmann Machine:RBM)を多段に重ねてディープ・ビリーフ・ネットワーク(Deep Brief Network:DBN)を構築する際に、最適な隠れニューロン数および層数を学習中に自動で求めることが可能である。すなわち、構造適応型深層学習法では、ニューラルネットワークが自己組織化的に構築される。
非特許文献2には、DBNの階層化条件等が記載されている。非特許文献3には、ニューラルネットワークにおける信号の伝播パターンの可視化等について記載されている。非特許文献4および5には、RBMにおけるニューロン生成・消滅アルゴリズムが記載されている。非特許文献6には、重みの変分ベクトルを用いて隠れニューロンの数を適応的に変更する手法が記載されている。
その他、深層学習の基本的な技術については、下記の非特許文献が知られている。
非特許文献7には、制限付きボルツマンマシン(RBM)について記載されている。RBMは、可視層と隠れ層の2層から構成されるネットワーク構造を持っており、確率分布に基づいて入力データに含まれる特徴を隠れニューロン上で学習可能な学習モデルである。RBMでは、同じ層のニューロン間の結合が無いため、計算量を削減できるとともに、隠れ層のニューロンごとに独立した確率分布を学習することが可能である。
非特許文献8には、コントラスティブ・ダイバージェンス(Contrastive Divergence:CD)法について記載されている。このCD法により、RBMのパラメータ(重み、バイアス等)を比較的少ない計算量で更新することが可能になる。
非特許文献9には、ディープ・ビリーフ・ネットワークについて記載されている。DBNは、学習済みのRBMを複数積み重ねて層数を増やすことで構築される。本手法によれば、入力データの特徴を階層的に学習することが可能である。
特開2010−26855号公報
鎌田真、市村匠、原章、"ニューロン生成/消滅アルゴリズムによる構造適応型Restricted Boltzmann Machine"、計測自動制御学会第8回コンピューテーショナル・インテリジェンス研究会、pp.90−96(2015) S.Kamada and T.Ichimura, An Adaptive Learning Method of Deep Belief Network by Layer Generation Algorithm, Proc. of IEEE TENCON 2016, pp.2971-2974 (2016) S.Kamada and T.Ichimura, Fine Tuning of Adaptive Learning of Deep Belief Network for Misclassification and its Knowledge Acquisition, International Journal Computational Intelligence Studies, vol.6, no.4, pp.333-348 (2017) S.Kamada and T.Ichimura, An Adaptive Learning Method of Restricted Boltzmann Machine by Neuron Generation and Annihilation Algorithm, Proc. of IEEE SMC 2016, pp.1273-1278, 2016. S.Kamada and T.Ichimura, A Structural Learning Method of Restricted Boltzmann Machine by Neuron Generation and Annihilation Algorithm, Neural Information Processing, vol.9950 of the series Lecture notes in Computer Science, pp.372-380, 2016. T.Ichimura and K.Yoshida Eds., Knowledge-Based Intelligent Systems for Health Care, Advanced Knowledge International, ISBN 0-9751004-4-0, 2004. G.E.Hinton, A Practical Guide to Training Restricted Boltzmann Machines, Neural Networks, Tricks of the Trade, Lecture notes in Computer Science, vol.7700, pp.599-619, 2012. G.E.Hinton, Training products of experts by minimizing contrastive divergence, Neural Computation, vol.14, pp.1771-1800, 2002. G.E.Hinton, S.Osindero and Y.Teh, A fast learning algorithm for deep belief nets, Neural Computation, vol.18, no.7, pp.1527-1554, 2006.
特許文献1の健康状態判断装置では、複数の影響因子の線形和モデルを用いて健康年齢が算出される。このため、健康年齢に影響を与える影響因子を予め定めておく必要がある。すなわち、健康年齢に影響を与える影響因子を抽出するものではない。
また、健康年齢に影響を与える影響因子は、地域性や社会性(食生活、車社会)等に応じて変化することが想定されるため、健康年齢を高精度に算出するための一般的なモデルを予め作成することはそもそも困難である。
年齢に限られず、ヘルスケアデータの所定の項目を他の項目の値に基づいて算出する場合にも、上記と同様の課題が存在する。
そこで、本発明は、ヘルスケアデータの所定の対象項目の値に影響を与える項目を高い精度で抽出することができるヘルスケアデータ分析システム、ヘルスケアデータ分析方法、ヘルスケアデータ分析プログラム、学習済みモデルを提供することを目的とする。
また、本発明は、学習済みモデルに基づいて推定された対象項目の値をユーザに提供することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。
本発明に係るヘルスケアデータ分析システムは、
複数の正常ヘルスケアデータの各々から所定の対象項目に係るデータを除いて得られる入力データセットと、前記複数の正常ヘルスケアデータの前記対象項目に係るデータとに基づいて深層学習を行うことにより、前記対象項目の値を出力する学習済みモデルを構築する深層学習部と、
前記学習済みモデルに基づいて、複数の異常ヘルスケアデータの前記対象項目の値に影響を与えている項目を分析する分析部と、
を備えることを特徴とする。
本発明に係る学習済みモデルは、
複数の項目に係るデータを有するヘルスケアデータに基づいて、所定の対象項目の値を出力するよう、コンピュータを機能させるための学習済みモデルであって、
前記ヘルスケアデータから前記対象項目を除いたデータが与えられる入力層と、前記対象項目の推定値を出力する出力層と、前記入力層と前記出力層との間の少なくとも1層の中間層とを有し、前記出力層から出力される値が前記対象項目の値に等しくなるように深層学習によりパラメータが学習されたニューラルネットワークから構成され、
前記入力層に入力されたヘルスケアデータに対し、前記ニューラルネットワークにおける学習済みの前記パラメータに基づく演算を行い、前記出力層から前記対象項目の値を出力するよう、コンピュータを機能させる。
本発明に係る情報処理装置は、
複数の項目に係るデータを有するヘルスケアデータを取得するヘルスケアデータ取得部と、
所定の対象項目の推定値を取得する推定値取得部と、
前記対象項目の推定値を表示部に表示させる表示制御部と、
を備え、
前記推定値は、前記ヘルスケアデータから前記対象項目に係るデータを除いた入力データを、前記対象項目の値を出力する学習済みモデルの入力層に与え、前記学習済みモデルの出力層から出力される値であることを特徴とする。
本発明によれば、ヘルスケアデータの所定の対象項目の値に影響を与える項目を高い精度で抽出することができる。
また、本発明によれば、ユーザが、対象項目の推定値を指標として健康状態を容易に把握することができる。
第1の実施形態に係る情報処理システム1000の概略的な構成を示す図である。 第1の実施形態に係るサーバ1Aの概略的な構成を示す図である。 第1の実施形態に係る深層学習装置1Bの概略的な構成を示す図である。 ヘルスケアデータのフォーマットの一例を示す図である。 学習済みモデルに基づく分析方法を説明するための図である。 第1の実施形態に係るヘルスケアデータ分析システム1の処理動作の一例を説明するためのフローチャートである。 図6Aに続く、ヘルスケアデータ分析システム1の処理動作の一例を説明するためのフローチャートである。 実施例において用いたデータセットの概要を示す図である。 実施例に係るヘルスケアデータのフォーマットを示す図である。 実年齢と推定年齢との誤差(年齢差)をテストデータ(使用データ)ごとに示す図である。 年齢差とエネルギー差との関係を示す図である。 図10の分布において、エネルギー差を所定の階級幅とした場合における異常ヘルスケアデータの分布等を示す図である。 図11の各階級について、分析部により抽出された項目を頻度の高い順に示す図である。 異常ヘルスケアデータにおいて異常項目の値を正常値に変更した場合における、異常ヘルスケアデータの割合を年齢差ごとに示す図である。 学習済みのニューラルネットワークを伝播する信号のパスを示す図であり、(a)は正常ヘルスケアデータを与えたときの信号パターンであり、(b)は異常ヘルスケアデータを与えたときの信号パターンである。 第2の実施形態に係る情報処理システム2000の概略的な構成を示す図である。 第2の実施形態に係るクライアント装置3の概略的な構成を示す図である。 第2の実施形態に係るサーバ4の概略的な構成を示す図である。 第2の実施形態に係る情報処理システム2000の処理動作の一例を説明するためのフローチャートである。 第2の実施形態に係るクライアント装置3の表示部に表示されるヘルスケアデータの入力画面の一例を示す図である。 第2の実施形態に係るクライアント装置3の表示部に表示される出力画面の一例を示す図である。
以下、本発明に係る実施形態について図面を参照しながら説明する。
(第1の実施形態)
まず、図1を参照して、第1の実施形態に係る情報処理システム1000の概略的な構成について説明する。なお、本実施形態に係る情報処理システム1000の各構成の内部構成・処理等については、図2以降の図面を参照して説明する。
本実施形態に係る情報処理システム1000は、複数のヘルスケアデータ(ヘルスケアデータに関するビッグデータ)を分析するための情報処理システムであり、図1に示すように、ヘルスケアデータ分析システム1と、クライアント装置2とを備える。
ヘルスケアデータ分析システム1およびクライアント装置2は、直接接続されてもよいし、あるいは、インターネット等の通信ネットワークを介して接続されてもよい。また、図1では1台のクライアント装置2のみがヘルスケアデータ分析システム1に接続されているが、複数のクライアント装置2がヘルスケアデータ分析システム1に接続されてもよい。
なお、ヘルスケアデータ分析システム1とクライアント装置2間のデータ送受信には、特願2017−93205に記載された発明を適用してもよい。これにより、深層学習が完了するまでセッションを保持し続ける必要がなくなり、インターネットを通じてデータ(新規学習データ、学習結果データ等)の送受信をセキュアに行うことができる。
ヘルスケアデータ分析システム1は、クライアント装置2から提供されるヘルスケアデータを分析する装置であり、図1に示すように、サーバ1Aと深層学習装置1Bとを有する。サーバ1Aと深層学習装置1Bについては、後ほど詳しく説明する。
ヘルスケアデータは、健康診断データでもよいし、血圧計等から取得される測定データでもよいし、それらの任意の混合データであってもよい。
本実施形態では、図1に示すように、サーバ1Aと深層学習装置1Bは直接接続されている。これに限らず、サーバ1Aと深層学習装置1Bはインターネット等の通信ネットワークを介して接続されてもよいし、あるいは、サーバ1Aと深層学習装置1Bが1つの情報処理装置として一体に構成されてもよい。
クライアント装置2は、新規学習データとしてのヘルスケアデータをヘルスケアデータ分析システム1に送信するように構成されている。クライアント装置2は、例えば、パソコン、タブレット端末、スマートフォン等の情報処理端末である。また、クライアント装置2は、ヘルスケアデータ(例えば、血圧、体重、血糖値、心拍数、歩数等)を測定するIoT機器であってもよい。クライアント装置2は、スマートウォッチ等のウェアラブル端末であってもよい。
クライアント装置2は、ヘルスケアデータを、ユーザ入力により取得してもよいし、CD−ROMやSDカード等の情報記録媒体から取得してもよいし、通信ネットワーク経由で取得してもよい。通信ネットワーク経由でヘルスケアデータを取得する場合、ヘルスケアデータを測定するIoT機器からデータを直接取得してもよい。
次に、ヘルスケアデータ分析システム1のサーバ1Aと深層学習装置1Bについて詳しく説明する。
<サーバ>
サーバ1Aは、図1に示すように、クライアント装置2に通信可能に接続され、クライアント装置2からヘルスケアデータを受信する。サーバ1Aは、例えば、Webデータサーバで構成される。
サーバ1Aは、図2に示すように、制御部10Aと、記憶部20Aと、通信部30Aとを有している。
制御部10Aは、データセット取得部11と、データ分類部12と、入力データセット生成部13と、分析部15と、学習済みモデル検証部16とを有している。各部の詳細については後ほど説明する。本実施形態では、制御部10Aの各部は、ソフトウェアにより構成され、サーバ1A内のプロセッサが所定のプログラムを実行することにより実現される。
なお、制御部10Aの各部のうち少なくとも一つが、専用処理回路等のハードウェアにより構成されてもよい。
また、制御部10Aのデータ分類部12、入力データセット生成部13、分析部15および学習済みモデル検証部16のうち少なくともいずれか一つが深層学習装置1Bに設けられてもよい。
また、制御部10Aの各部が、通信可能に接続された複数の情報処理装置に分散して設けられ、これら複数の情報処理装置が協働することにより制御部10Aの機能が実現されてもよい。
記憶部20Aは、学習データDB21Aと、学習結果DB22Aとを有する。この記憶部20Aは、例えばハードディスク、半導体メモリ(SSD等)から構成される。なお、学習データDB21Aおよび学習結果DB22Aの少なくともいずれか一つが、サーバ1Aに通信可能に接続された外部サーバの記憶部(図示せず)に記憶されてもよい。
学習データDB21Aは、クライアント装置2から受信した新規学習データ(ヘルスケアデータ)が蓄積されるデータベースである。本実施形態では、学習データDB21Aには、新規学習データのほか、深層学習装置1Bで既に深層学習に用いられたデータも格納される。なお、新規学習データのみが学習データDB21Aに格納されてもよい。
学習結果DB22Aは、深層学習装置1Bから受信した学習結果データが蓄積されるデータベースである。ここで、学習結果データとは、深層学習により得られたデータであって、ニューラルネットワークを構成するために必要となるデータである。具体的には、学習結果データは、ニューラルネットワークの形状に係る値(層数、各層のニューロン数)、ニューロン間の重み、およびニューロンのバイアス等を含むパラメータである。その他、学習結果データには、深層学習により蓄積された知識(IF−THENルールなど)が含まれてもよい。
通信部30Aは、サーバ1Aがクライアント装置2との間で情報を送受信し、また、深層学習装置1Bとの間で情報を送受信するためのインターフェースである。通信部30Aは、複数の通信モジュールで構成されてもよい。
ここで、制御部10Aの各部の詳細について説明する。
データセット取得部11は、複数のヘルスケアデータを含むデータセットを取得する。より詳しくは、データセット取得部11は、記憶部20Aの学習データDB21Aからヘルスケアデータを取得する。なお、データセット取得部11は、通信部30Aを介してクライアント装置2から直接ヘルスケアデータを取得してもよい。
各ヘルスケアデータは、図4に示すように、複数の項目(項目1,項目2,・・・,項目n)に係るデータを有する。各ヘルスケアデータに含まれる複数の項目は、例えば、健康診断項目に対応している。なお、図4では項目1が対象項目となっているが、これに限らず、項目2,・・・,項目nのうちいずれを対象項目としてもよい。また、項目には、検査項目だけでなく、名前、年齢、性別などが含まれてもよい。
項目に係るデータは、典型的には検査値であるが、問診等の文字情報であってもよいし、X線、CT、MRI検査等で得られた画像データであってもよい。
データ分類部12は、データセット取得部11により取得された複数のヘルスケアデータを、異常項目が所定数未満である複数の正常ヘルスケアデータと、異常項目が当該所定数以上である複数の異常ヘルスケアデータとに分ける。ここで、異常項目とは、異常を示すデータを有する項目のことである。例えば、LDLコレステロールの項目の値が基準範囲(例えば60〜139mg/dl)から外れている場合、当該項目が異常項目としてカウントされる。
入力データセット生成部13は、深層学習に用いる入力データセットを生成する。より詳しくは、入力データセット生成部13は、複数の正常ヘルスケアデータの各々から所定の対象項目に係るデータを除くことにより、ニューラルネットワークの入力層に与えるための入力データセットを生成する。対象項目は、ヘルスケアデータの複数の項目のいずれでもよく、例えば年齢である。なお、対象項目は年齢に限られず、任意の項目でよい。例えば、生活習慣病に関連する項目でもよい。
分析部15は、後述の深層学習部14により構築された学習済みモデルに基づいて、データ分類部12により分けられた複数の異常ヘルスケアデータの対象項目の値に影響を与えている項目を分析する。より詳しくは、分析部15は、複数の異常ヘルスケアデータの各々について以下の処理を行うことにより、対象項目の値に影響を与えている項目を分析する。
まず、図5(a)に示すように、分析部15は、異常ヘルスケアデータから対象項目に係るデータを除いて得られた入力データ(第1のデータ)を学習済みモデルの入力層に与え、出力層から出力された推定データ(対象項目の推定値)を取得する。
具体的には、分析部15は、入力層にセットされた入力データに対する隠れニューロンの発火確率を式(1)により計算する。そして、分析部15は、計算された発火確率により、隠れニューロンの出力値(0または1)を求める。これを各層について順次行うことで、出力層の値(推定データ)を得る。
式(1)の左辺は、入力データ(ベクトルv)が与えられた場合にj番目の隠れニューロン(h)の出力値が1になる(すなわち発火する)確率を示している。式(1)の右辺の関数sigmはシグモイド関数である。なお、活性化関数は、シグモイド関数以外の関数(ランプ関数など)であってもよい。
入力層に与える第1のデータは、複数の異常ヘルスケアデータに基づいて生成されてもよい。すなわち、任意の数(1〜N:異常ヘルスケアデータの総数)の異常ヘルスケアデータに基づくデータ(すなわち、異常ヘルスケアデータから対象項目に係るデータを除いたデータ)を結合して一つの入力データとし、これを第1のデータとして入力層に与えてもよい。
推定データを取得した後、図5(b)に示すように、分析部15は、推定データを学習済みモデルの出力層に与え、後方に信号伝播させて入力層から出力された復元データ(第2のデータ)を取得する。
具体的には、分析部15は、出力層にセットされた推定データに対する隠れニューロンの発火確率を式(2)により計算する。そして、分析部15は、計算された発火確率により、隠れニューロンの出力値(0または1)を求める。これを各層で行うことで、復元データを得る。
式(2)の左辺は、隠れニューロンの出力データ(ベクトルh)が与えられた場合における、i番目の可視ニューロン(v)の出力値が1になる確率である。分析部15は、計算された確率により可視ニューロンの出力値(0または1)を求める。
詳しくは後述するが、深層学習装置1Bで構築される学習済みモデルは、正常ヘルスケアデータに基づいて学習される。したがって、異常ヘルスケアデータを学習済みモデルに与えた場合、復元データ(第2のデータ)は学習された正常ヘルスケアデータの特徴の影響を受けたものとなる。すなわち、復元データの特徴は、正常ヘルスケアデータの特徴に近づくようになる。その結果、入力データ(第1のデータ)と復元データ(第2のデータ)との間には誤差が生じることとなる。
次に、分析部15は、第1のデータと第2のデータとを比較することによって、対象項目に影響を与えている項目を抽出する。具体的には、分析部15は、項目ごとに第1のデータと第2のデータを比較し、各項目の誤差を計算する。誤差は、例えば、項目の値の差の二乗、あるいは項目の値の差の絶対値を計算することにより得られる。そして、分析部15は、各項目について、誤差と、当該項目について予め定められた基準値との比較を行い、両者の差を求める。分析部15は、このように求められた差が最も大きい項目を、対象項目に影響を与えている項目として抽出する。
なお、分析部15は、全ての異常ヘルスケアデータについて第1のデータ(入力データ)と第2のデータ(復元データ)の比較を完了した後に、各項目について誤差の平均値を求め、求めた平均値と、項目ごとに予め定められた基準値との差が大きい項目を、対象項目に影響を与えている項目として抽出してもよい。
また、抽出する項目は1つに限られず、複数の項目を抽出してもよい。すなわち、差が最大の項目に加えて、差が2番目(さらには3番目・・・)に大きい項目を抽出してもよい。
分析部15は、対象項目の値に係る所定の階級ごとに、抽出された項目を集計してもよい(図12参照)。これにより、対象項目に影響を与えている項目を階級ごとに容易に把握することができる。
なお、分析部15は、異常ヘルスケアデータに含まれる年齢と、学習済みモデルにより推定される年齢(推定年齢)との差である年齢差と、エネルギー差との関係を求めてもよい(図10参照)。エネルギー差とは、2つのデータについてRBMのエネルギー関数から求められるエネルギーの差のことである。エネルギー関数は、式(3)で与えられる。
ここで、b:可視ニューロンvのバイアス、c:隠れニューロンhのバイアス、Wij:可視ニューロンvと隠れニューロンh間の重みである。
学習済みモデル検証部16は、深層学習装置1Bにより構築された学習済みモデルを検証する。具体的には、当該学習済みモデルの構築に用いられたものとは別の、複数の正常ヘルスケアデータから対象項目に係るデータを除いてテスト用データセットを生成する。そして、生成されたテスト用データセットを学習済みモデルの入力層に与える。学習済みモデル検証部16は、学習済みモデルの出力層から出力される値(対象項目の予測値)と、教師データ(対象項目の値)との間の誤差を、各正常ヘルスケアデータについて求める。誤差が、所定範囲内であれば、学習済みモデル検証部16は、学習済みモデルが正常に学習されていると判定する。
<深層学習装置>
次に、ヘルスケアデータ分析システム1の深層学習装置1Bについて詳しく説明する。
深層学習装置1Bは、サーバ1Aから受信した入力データセットを用いて深層学習を行う。この深層学習装置1Bは、例えば、既述の構造適応型深層学習法により深層学習を行う。深層学習装置1Bは、例えば、GPU(Graphics Processing Units)計算機で構成される。
深層学習装置1Bは、図3に示すように、制御部10Bと、記憶部20Bと、通信部30Bとを有している。
制御部10Bは、深層学習部14を有している。本実施形態では、深層学習部14は、ソフトウェアにより構成され、深層学習装置1B内のプロセッサが所定のプログラムを実行することにより実現される。なお、深層学習部14のうち少なくとも一部が、専用処理回路等のハードウェアにより構成されてもよい。
深層学習部14は、学習データに基づいて深層学習を行い、対象項目の値を出力する学習済みモデルを構築する。学習済みモデルは、入力データセット生成部13により生成された入力データセットと、複数の正常ヘルスケアデータの対象項目に係るデータとに基づいて深層学習を行うことにより構築される。入力データセットがニューラルネットワークの入力層に与えられ、対象項目に係るデータが教師データとして用いられる。
深層学習部14は、好ましくは、構造適応型深層学習により学習済みモデルを構築する。これにより、最適な隠れニューロン数および層数を学習中に自動で求められるとともに、高い分類精度を有する学習済みモデルを構築することができる。
深層学習では、公知の手法を用いることが可能である。例えば、教師データ(対象項目に係るデータ)を用いない事前学習として、ディープ・ビリーフ・ネットワーク(DBN)を構築する。DBNを構築した後、教師データを用いて出力層の信号を後方伝播(バックプロパゲーション)させて全体構造を学習させる(fine−tuning)。これにより、対象項目の値を出力する学習済みモデルが構築される。
記憶部20Bは、学習データDB21Bと、学習結果DB22Bとを有する。この記憶部20Bは、例えばハードディスク、半導体メモリ(SSD等)から構成される。なお、学習データDB21Bおよび学習結果DB22Bの少なくともいずれか一つが、深層学習装置1Bに通信可能に接続された外部サーバの記憶部(図示せず)に記憶されてもよい。
学習データDB21Bは、サーバ1Aから受信した学習データ(入力データセットおよび対象項目の値)が蓄積されるデータベースである。本実施形態では、学習データDB21Bには、これから深層学習に用いられる学習データのほか、既に深層学習に用いられたデータも格納される。なお、これから深層学習に用いられる学習データのみが学習データDB21Bに格納されてもよい。
学習結果DB22Bは、深層学習部14による深層学習から得られた学習結果データが蓄積されるデータベースである。なお、学習結果データには、深層学習により蓄積された知識(IF−THENルールなど)が含まれてもよい。
通信部30Bは、深層学習装置1Bがサーバ1Aとの間で情報を送受信するためのインターフェースである。
<学習済みモデル>
ここで、深層学習部14により構築される学習済みモデルについて説明する。本実施形態に係る学習済みモデルは、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。
本実施形態に係る学習済みモデルは、複数の項目に係るデータを有するヘルスケアデータに基づいて、所定の対象項目の値を出力するよう、コンピュータを機能させるための学習済みモデルである。この学習済みモデルは、ヘルスケアデータから対象項目を除いたデータが与えられる入力層と、対象項目の推定値を出力する出力層と、入力層と前記出力層との間の少なくとも1層の中間層とを有し、出力層から出力される値が対象項目の値に等しくなるように深層学習によりパラメータが学習されたニューラルネットワークから構成されている。
本実施形態に係る学習済みモデルは、入力層に入力されたヘルスケアデータに対し、ニューラルネットワークにおける学習済みのパラメータに基づく演算を行い、出力層から対象項目の値(推定値)を出力するよう、コンピュータを機能させる。すなわち、コンピュータの演算装置(CPU等)は、メモリに記憶された学習済みモデルからの指令に従って、ニューラルネットワークの入力層に入力されたヘルスケアデータに対し、ニューラルネットワークにおけるパラメータと活性化関数に基づく演算を行い、出力層から対象項目の推定値を出力するよう動作する。
なお、学習は、例えば構造適応型深層学習により行われる。構造適応型深層学習によれば、より高い精度で入力データの特徴を分類することができる。
<ヘルスケアデータ分析システムの動作>
次に、図6Aおよび図6Bのフローチャートに沿って、上記の構成を有する情報処理システム1000の処理動作の一例について説明する。
データセット取得部11が、クライアント装置2から、複数のヘルスケアデータを含むデータセットを取得する(ステップS11)。各ヘルスケアデータは、前述のように、複数の項目に係るデータを有する。
次に、データ分類部12が、ステップS11で取得された複数のヘルスケアデータを、複数の正常ヘルスケアデータと、複数の異常ヘルスケアデータとに分ける(ステップS12)。なお、本ステップの処理は、所定数のヘルスケアデータが学習データDB21Aに蓄積された場合に行うようにしてもよい。
次に、入力データセット生成部13が、ステップS12で分けられた複数の正常ヘルスケアデータから所定の対象項目に係るデータを除くことにより、ニューラルネットワークの入力層に与えるための入力データセットを生成する(ステップS13)。
次に、深層学習部14が、ステップS13で生成された入力データセットと、複数の正常ヘルスケアデータの対象項目に係るデータとに基づいて構造適応型深層学習を行うことにより、対象項目の値を出力する学習済みモデルを構築する(ステップS14)。なお、本ステップでは、構造適応型以外の深層学習により学習済みモデルを構築してもよい。
次に、ステップS14で構築された学習済みモデルを検証する。具体的には、学習済みモデル検証部16が、テスト用データセットに対する学習済みモデルの出力値の誤差が所定範囲内であるか否かを判定する(ステップS15)。判定の結果、誤差が所定範囲内である場合(S15:Yes)、ステップS16に進む。一方、誤差が所定範囲内にない場合(S15:No)、ステップS11に戻って、新たな学習データに基づいて学習済みモデルを再構築する。
次に、分析部15が、ステップS14で構築された学習済みモデルに基づいて、ステップS12で得られた複数の異常ヘルスケアデータの対象項目の値に影響を与えている項目を分析する。本分析は、以下のステップS16〜ステップS22により行われる。
まず、制御部10Aが、変数iを初期化する(ステップS16)。ここでは、変数iを1とする。
次に、制御部10Aが、変数iが異常ヘルスケアデータの数Nよりも大きいか否かを判定する(ステップS17)。判定の結果、変数iが異常ヘルスケアデータの数Nよりも大きくなければ(S17:No)、ステップS18に進み、変数iが異常ヘルスケアデータの数Nよりも大きければ(S17:Yes)、ステップS22に進む。
ステップS18では、分析部15が、図5(a)に示すように、i番目の異常ヘルスケアデータから対象項目に係るデータを除いて得られた第1のデータ(入力データ)を学習済みモデルの入力層に与え、学習済みモデルの出力層から出力された推定データを取得する。
その後、分析部15が、図5(b)に示すように、ステップS18で取得した推定データを学習済みモデルの出力層に与え、後方に信号伝播させて入力層から出力された第2のデータ(復元データ)を取得する(ステップS19)。
ステップS19の実行後、分析部15が、第1のデータと第2のデータを比較することによって、対象項目に影響を与えている項目を抽出する(ステップS20)。対象項目に影響を与えている項目の抽出は、例えば既述の方法により行う。その後、変数iをインクリメントし(ステップS21)、ステップS17に戻る。
全ての異常ヘルスケアデータについて、対象項目に影響を与えている項目を抽出した後(すなわち、S17:Yesの場合)、分析部15が、対象項目の値に係る所定の階級ごとに、ステップS20で抽出された項目を集計する(ステップS22)。階級については、例えば、ヘルスケアデータに含まれる年齢(実年齢)と、推定データが示す年齢(推定年齢)との差(年齢差)を階級とする。なお、年齢差を階級とする場合に限られず、式(3)により求められるエネルギー差を階級としてもよい。
情報処理システム1000の処理動作は上記フローチャートの例に限られない。例えば、上記の例ではニューラルネットワークの入力層に一つの異常ヘルスケアデータに基づくデータを与えた。これに限られず、任意の数の異常ヘルスケアデータに基づくデータ(すなわち、異常ヘルスケアデータから対象項目に係るデータを除いたデータ)を結合して一つの入力データとし、これを入力層に与えてもよい。
一般財団法人広島県環境保健協会の健康診断データをビッグデータとして用いて、ヘルスケアデータ分析システム1により、年齢に影響を与えている検査項目を分析した実施例について以下に説明する。
図7は、本実施例において用いたデータセットの概要(ヘルスケアデータの種類とサンプル数)を示している。ヘルスケアデータは2015年までのもの(サンプル数90,498)と、2016年のもの(サンプル数20,029)の2種類がある。2015年までのヘルスケアデータのうち、正常ヘルスケアデータ(2015−N)のサンプル数は60,111であり、異常ヘルスケアデータ(2015−A)のサンプル数は30,387である。また、2016年のヘルスケアデータのうち、正常ヘルスケアデータ(2016−N)のサンプル数は15,025であり、異常ヘルスケアデータ(2016−A)のサンプル数は5,004である。
なお、本実施例では、異常項目が1つ以上のヘルスケアデータを異常ヘルスケアデータとし、異常項目が全く無いヘルスケアデータを正常ヘルスケアデータとした。
図8は、ヘルスケアデータのフォーマットを示している。項目は全部で34個ある。このうち、年齢を推定対象の項目(すなわち、対象項目)とした。
正常ヘルスケアデータ(2015−N)から年齢を除いたデータを入力データとし、除いた年齢は教師データとして用いた。ニューラルネットワークの出力層から出力される年齢(推定年齢)と、正常ヘルスケアデータの年齢(実年齢)との誤差が小さくなるように深層学習を行った。
学習済みモデルの構築後、正常ヘルスケアデータ(2016−N)をテストデータとして用いて学習済みモデルの検証を行った。その結果、図9に示すように、95.5%のテストデータで実年齢と推定年齢との誤差が±0であった(すなわち、完全に一致した)。また、99.7%のテストデータで誤差は±5以下であった。一方、3種類の異常ヘルスケアデータを学習済みモデルに与えた場合、9.7%〜11.3%の異常ヘルスケアデータについては誤差が±0であり、半分弱(46.0%〜48.5%)の異常ヘルスケアデータについては誤差が±5以下であった。
このように、本実施例で構築された学習済みモデルは、正常ヘルスケアデータについては95%以上の精度で年齢を±0で推定でき、一方、異常ヘルスケアデータについては推定誤差が大きい。これは、前述のように、学習済みモデルが正常ヘルスケアデータに基づいて形成されていることに起因する。
なお、図9中、かっこ内の値はエネルギー差を示している。エネルギー差は、一般的には、複数のヘルスケアデータの平均値を入力層に与えたときのエネルギーと、ある(対象の)ヘルスケアデータを与えたときのエネルギーの差のことである。
図10は、年齢差とエネルギー差との関係を示している。ここでのエネルギー差は、複数の正常ヘルスケアデータの平均値を入力層に与えたときのエネルギーと、ある(対象の)異常ヘルスケアデータを与えたときのエネルギーとの差である。
図10から、年齢差が大きくなるにつれてエネルギー差も大きくなる傾向が見られる。より詳しくは、年齢差が30付近まで、エネルギー差は対数関数のような形状で増加する。それ以上の年齢差については、エネルギー差はほとんど変化しない。エネルギー差の最大値は210であり、年齢差の最大値は52であった。
図11は、図10の分布において、所定の階級幅で区分されたエネルギー差ごとの、異常ヘルスケアデータの分布等を示している。より詳しくは、各階級に含まれる年齢差の範囲、異常ヘルスケアデータの割合、異常項目数の平均値を示している。この結果から、エネルギー差および年齢差が増加するにつれて、異常項目数も増加することが分かった。
図12は、図11と同じ階級ごとに、年齢差に影響を与えている項目(すなわち、分析部15により抽出された項目)のうち上位10項目を頻度の高い順に示したものである。この分析結果によれば、エネルギー差が0−49の階級では、BMI(ボディマス指数)が異常なヘルスケアデータが10.2%存在した(すなわち、年齢に最も影響を与えている項目としてBMIが抽出されたものの割合が10.2%であった)。当該階級では、TG(中性脂肪)が異常なヘルスケアデータが10.1%存在し、DBP(拡張期血圧)が異常なヘルスケアデータが8.3%存在した。
生命保険会社による健康年齢の計算では、入力すべき検査項目として、BMI、収縮期血圧(SBP)、拡張期血圧(DBP)、尿蛋白、HDLコレステロール、中性脂肪、GOT、γ−GTP、HbA1c等の項目が挙げられている。これに対し、図12の分析結果では、各階級によって順位は異なるものの、これらの項目が全て含まれており、さらに赤血球数が含まれることが分かった。このように、本実施形態に係るヘルスケアデータ分析システムによれば、従来年齢に影響を与えると認識されていなかった項目を影響因子として抽出することができる。
また、赤血球数が年齢に影響を与えていることは、使用したデータの地域特有の傾向を示している可能性がある。
図13は、異常ヘルスケアデータ(2015−Aおよび2016−A)について異常項目の値を正常値に変更した場合における、ヘルスケアデータの割合を年齢差ごとに示している。この結果から、正常値に変更する異常項目の数が多くなるにつれて、年齢差およびエネルギー差が小さくなることが分かった。
さらに、非特許文献3で提案されている知識獲得手法を用いて、正常ヘルスケアデータと異常ヘルスケアデータをそれぞれ学習済みモデルに与えたとき、入力層から出力層に至るニューラルネットワークの信号伝播パターンを調査した。
図14は、学習済みのニューラルネットワークを伝播する信号のパスを示している。図14(a)は正常ヘルスケアデータ(2016−N)を与えたときの信号パターンであり、図14(b)は異常ヘルスケアデータ(2016−A)を与えたときの信号パターンである。ニューラルネットワークは、図14(a),(b)に示すように、入力層、出力層、および4つの中間層1〜中間層4から構成されている。図14(a),(b)中、ニューロンを示す丸印内の数字はニューロンの識別番号である。また、パスを示す線の太さは、パスを通過するデータ数が多くなるにつれて太くなるように示している。
図14(a)に示すように、学習済みモデルに正常ヘルスケアデータを与えた場合は、中間層1の221番目および281番目のニューロンへのパスが太くなっている。一方、図14(b)に示すように、学習済みモデルに異常ヘルスケアデータを与えた場合は、中間層1の30番目および432番目のニューロンへのパスが太くなっている。このように、正常ヘルスケアデータを与える場合と、異常ヘルスケアデータを与える場合とで、全く異なる信号パターンとなっている。中間層2以降も同様であり、出力層では、正常ヘルスケアデータを与えた場合は128番目のニューロンへのパスが太くなっており、異常ヘルスケアデータを与えた場合は44番目のニューロンへのパスが太くなっている。このような信号パターンの違いに起因して、実年齢と推定年齢との差が生じたものと考えられる。
以上説明したように、第1の実施形態では、複数の正常ヘルスケアデータを学習データとして深層学習を行うことにより、対象項目の値を出力する学習済みモデルを構築し、構築された学習済みモデルに基づいて異常ヘルスケアデータにおいて対象項目の値に影響を与えている項目を分析する。
これにより、第1の実施形態によれば、対象項目の値に影響を与える項目を高い精度で抽出することができる。その結果、例えば、被験者や患者等のユーザ自身が健康管理に使用可能な、エビデンスに基づく新しい指標であって、健康状態を数値的に示す新しい指標(本実施形態では推定年齢)を提供することができるようになる。また、得られた分析結果をEBM(Evidence Based Medicine)として利用することができる。
さらに、本実施形態では、単純な統計手法によるデータ分析ではなく、正常ヘルスケアデータに基づいて学習された学習済みモデルを用いてヘルスケアデータの分析を行うため、本実施形態によれば、医師が被験者や患者の健康状態を判断する際にも使用可能な新しい医学的知識の発見を促すこともできる。
(第2の実施形態)
次に、図15を参照して、第2の実施形態に係る情報処理システム2000の概略的な構成について説明する。
本実施形態に係る情報処理システム2000は、ユーザが入力したヘルスケアデータに基づいて推定された対象項目の値を提示するための情報処理システムであり、図15に示すように、少なくとも1台のクライアント装置(ユーザ端末)3と、サーバ4とを備える。
クライアント装置3は、インターネット等の通信ネットワークを介してサーバ4に接続されている。クライアント装置3は、例えば、パソコン、スマートフォン、タブレット端末等である。
サーバ4は、第1の実施形態で説明したヘルスケアデータ分析システム1により得られた学習済みモデルを有している。サーバ4は、クライアント装置3から受信したヘルスケアデータを当該学習済みモデルに与え、年齢等の対象項目に係る推定値をクライアント装置3に送信する。
図16を参照して、クライアント装置3について詳しく説明する。
クライアント装置3は、図16に示すように、制御部30と、記憶部40と、通信部50と、操作入力部60と、表示部70とを備えている。
制御部30は、ヘルスケアデータ取得部31と、推定値取得部32と、表示制御部33とを有している。
ヘルスケアデータ取得部31は、複数の項目に係るデータを有するヘルスケアデータを取得する。例えば、ヘルスケアデータ取得部31は、クライアント装置3のユーザが操作入力部60を介して入力したヘルスケアデータを取得する。
推定値取得部32は、ヘルスケアデータ取得部31により取得されたヘルスケアデータの所定の対象項目の推定値を取得する。この推定値は、ヘルスケアデータ取得部31により取得されたヘルスケアデータから対象項目に係るデータを除いた入力データを、深層学習装置1Bにより構築された学習済みモデルの入力層に与え、当該学習済みモデルの出力層から出力される値である。
表示制御部33は、推定値取得部32により取得された、対象項目の推定値を表示部70に表示させる。なお、表示制御部33は、クライアント装置3に通信可能に接続された外部の表示部(図示せず)に推定値を表示させてもよい。
制御部30の各部は、本実施形態ではソフトウェア(アプリ、Webアプリケーション等)により構成され、クライアント装置3内のプロセッサが所定のプログラムを実行することにより実現される。また、制御部30の各部のうち少なくとも一つが、専用処理回路等のハードウェアにより構成されてもよい。
記憶部40は、取得されたヘルスケアデータ、制御部30で実行されるプログラム等が記憶される。この記憶部40は、例えばハードディスク、半導体メモリ(SSD等)から構成される。
通信部50は、クライアント装置3がインターネットを介してサーバ4との間で情報を送受信するためのインターフェースである。
操作入力部60は、ユーザがクライアント装置3に情報を入力するためのインターフェースであり、例えば、キーボード、マウス、タッチパネル、ボタン、マイク等である。
表示部70は、例えば液晶ディスプレイ、有機ELディスプレイである。表示部70は、クライアント装置3のユーザからの操作を受け付けるためのGUI(Graphical User Interface)など、様々な情報を表示する。より具体的には、表示部70は、ヘルスケアデータの入力画面や、対象項目の推定値を含む出力画面を表示する。なお、操作入力部60がタッチパネルの場合には、操作入力部60が表示部70を兼ねてもよい。
次に、図17を参照して、サーバ4について詳しく説明する。
サーバ4は、制御部80と、記憶部90と、通信部100とを有している。
制御部80は、再構築部81と、推定部82とを有している。再構築部81は、記憶部90に格納された学習結果データに基づいてニューラルネットワークを再構築する。推定部82は、再構築されたニューラルネットワーク(学習済みモデル)の入力層に、クライアント装置3から受信したヘルスケアデータのうち対象項目に係るデータを除いたものを与え、対象項目の推定値を取得する。
制御部80の各部は、本実施形態ではソフトウェアにより構成され、サーバ4内のプロセッサが所定のプログラムを実行することにより実現される。また、制御部80の各部のうち少なくとも一つが、専用処理回路等のハードウェアにより構成されてもよい。
記憶部90は、学習結果データが格納された学習結果DB91を有する。この記憶部90は、例えばハードディスク、半導体メモリ(SSD等)から構成される
通信部100は、サーバ4がインターネットを介して少なくとも1台のクライアント装置3との間で情報を送受信するためのインターフェースである。
なお、サーバ4は、第1の実施形態のサーバ1Aで構成されてもよい。すなわち、サーバ1Aは、クライアント装置3に接続され、サーバ4の処理動作を行ってもよい。
<ヘルスケアデータ分析システムの動作>
次に、図18のフローチャートに沿って、上記の構成を有する情報処理システム2000の処理動作の一例について説明する。
クライアント装置3の表示部70が、ヘルスケアデータの入力画面を表示する(ステップS31)。図19は、入力画面の一例を示している。この入力画面には、各項目の値を入力するためのフィールドと、開始ボタンBが含まれる。
次に、クライアント装置3のヘルスケアデータ取得部31が、ヘルスケアデータを取得する(ステップS32)。より詳しくは、ヘルスケアデータ取得部31は、クライアント装置3のユーザが入力した各項目のデータを取得する。なお、このような形態に限られず、例えば、ユーザが健康診断結果等の電子ファイルを選択し、ヘルスケアデータ取得部31は、当該電子ファイルからヘルスケアデータを読み込んでもよい。
次に、クライアント装置3の制御部30が、開始ボタンBが選択されたか否かを判定する(ステップS33)。開始ボタンBが選択された場合(S33:Yes)、制御部30は、通信部50を介してヘルスケアデータをサーバ4に送信する。なお、未入力の項目がある場合、表示部70はエラーメッセージを表示してもよい。
クライアント装置3からヘルスケアデータを受信すると、サーバ4の推定部82が、受信したヘルスケアデータから所定の対象項目(ここでは年齢)を除いた入力データを学習済みモデルの入力層に与える(ステップS41)。
次に、サーバ4の制御部80が、学習済みモデルの出力層から出力される対象項目の推定値(ここでは、推定年齢)を、通信部100を介してクライアント装置3に送信する(ステップS42)。
その後、クライアント装置3の推定値取得部32が、サーバ4から送信された対象項目の推定値を取得する(ステップS34)。
次に、クライアント装置3の表示部70が、対象項目の推定値を表示する(ステップS35)。本ステップは、表示制御部33が、表示部70が対象項目の推定値を表示するように制御することにより実現される。
図20は、出力画面の一例を示している。この例では、実年齢(あなたの年齢)および推定年齢が表示されている。図20に示すように、コメント(異常項目名、アドバイス事項など)を表示してもよい。また、年齢差とエネルギー差との関係を示すグラフを表示してもよい。
以上説明した第2の実施形態によれば、学習済みモデルに基づいて対象項目の推定値をユーザに提供することができる。これにより、ユーザは、対象項目の推定値(推定年齢等)を指標として、健康状態を容易に把握することができる。その結果、例えば、専門的知識を持たない人(患者、専門医でないかかりつけ医等)でも容易に健康状態を把握することができるようになる。また、異常傾向にあることを早い段階で知ることができるようになる。
なお、第2の実施形態では、サーバ4が学習済みモデルを有していたが、クライアント装置3が学習済みモデルを有してもよい。この場合、例えば、学習結果データがクライアント装置3にダウンロードされ、ヘルスケアデータを学習済みモデルに与えることにより、対象項目の推定値が取得される。
上記の記載に基づいて、当業者であれば、本発明の追加の効果や種々の変形を想到できるかもしれないが、本発明の態様は、上述した実施形態に限定されるものではない。特許請求の範囲に規定された内容及びその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更及び部分的削除が可能である。
第1および第2の実施形態で説明した情報処理システムの少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理システムの少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
また、本発明に係る情報処理システムの少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
1000,2000 情報処理システム
1 ヘルスケアデータ分析システム
1A サーバ
1B 深層学習装置
2,3 クライアント装置
4 サーバ
10A,10B,30,80 制御部
11 データセット取得部
12 データ分類部
13 入力データセット生成部
14 深層学習部
15 分析部
16 学習済みモデル検証部
21A,21B 学習データDB
22A,22B 学習結果DB
31 ヘルスケアデータ取得部
32 推定値取得部
33 表示制御部
20A,20B,40,90 記憶部
30A,30B,50,100 通信部
60 操作入力部
70 表示部
81 再構築部
82 推定部
B 開始ボタン

Claims (13)

  1. 複数の正常ヘルスケアデータの各々から所定の対象項目に係るデータを除いて得られる入力データセットと、前記複数の正常ヘルスケアデータの前記対象項目に係るデータとに基づいて深層学習を行うことにより、前記対象項目の値を出力する学習済みモデルを構築する深層学習部と、
    前記学習済みモデルに基づいて、複数の異常ヘルスケアデータの前記対象項目の値に影響を与えている項目を分析する分析部と、
    を備えることを特徴とするヘルスケアデータ分析システム。
  2. 前記分析部は、
    少なくとも一つの前記異常ヘルスケアデータから前記対象項目に係るデータを除いて得られた第1のデータを前記学習済みモデルの入力層に与え、前記学習済みモデルの出力層から出力された出力データを取得し、
    前記出力データを前記出力層に与え、後方に信号伝播させて前記入力層から出力された第2のデータを取得し、
    前記第1のデータと前記第2のデータとを比較することによって、前記対象項目に影響を与えている項目を抽出することを特徴とする請求項1に記載のヘルスケアデータ分析システム。
  3. 前記分析部は、前記対象項目の値に係る所定の階級ごとに、前記抽出された項目を集計することを特徴とする請求項2に記載のヘルスケアデータ分析システム。
  4. 前記対象項目は年齢であることを特徴とする請求項1〜3のいずれかに記載のヘルスケアデータ分析システム。
  5. 前記深層学習部は、構造適応型深層学習を行って前記学習済みモデルを構築することを特徴とする請求項1〜4のいずれかに記載のヘルスケアデータ分析システム。
  6. 深層学習部が、複数の正常ヘルスケアデータの各々から所定の対象項目に係るデータを除いて得られる入力データセットと、前記複数の正常ヘルスケアデータの前記対象項目に係るデータとに基づいて深層学習を行うことにより、前記対象項目の値を出力する学習済みモデルを構築するステップと、
    分析部が、前記学習済みモデルに基づいて、複数の異常ヘルスケアデータの前記対象項目の値に影響を与えている項目を分析するステップと、
    を備えることを特徴とするヘルスケアデータ分析方法。
  7. コンピュータを、
    複数の正常ヘルスケアデータの各々から所定の対象項目に係るデータを除いて得られる入力データセットと、前記複数の正常ヘルスケアデータの前記対象項目に係るデータとに基づいて深層学習を行うことにより、前記対象項目の値を出力する学習済みモデルを構築する深層学習手段、および
    前記学習済みモデルに基づいて、複数の異常ヘルスケアデータの前記対象項目の値に影響を与えている項目を分析する分析手段
    として機能させるためのヘルスケアデータ分析プログラム。
  8. 通信可能に接続された複数のコンピュータによって、請求項1〜5のいずれかに記載のヘルスケアデータ分析システムを機能させるために、
    前記複数のコンピュータのうちの一つを請求項1〜5のいずれかに記載のヘルスケアデータ分析システムにおける各部の少なくとも1つとして機能させるための情報処理プログラム。
  9. 複数の項目に係るデータを有するヘルスケアデータに基づいて、所定の対象項目の値を出力するよう、コンピュータを機能させるための学習済みモデルであって、
    前記ヘルスケアデータから前記対象項目を除いたデータが与えられる入力層と、前記対象項目の推定値を出力する出力層と、前記入力層と前記出力層との間の少なくとも1層の中間層とを有し、前記出力層から出力される値が前記対象項目の値に等しくなるように深層学習によりパラメータが学習されたニューラルネットワークから構成され、
    前記入力層に入力されたヘルスケアデータに対し、前記ニューラルネットワークにおける学習済みの前記パラメータに基づく演算を行い、前記出力層から前記対象項目の値を出力するよう、コンピュータを機能させるための学習済みモデル。
  10. 複数の項目に係るデータを有するヘルスケアデータを取得するヘルスケアデータ取得部と、
    所定の対象項目の推定値を取得する推定値取得部と、
    前記対象項目の推定値を表示部に表示させる表示制御部と、
    を備え、
    前記推定値は、前記ヘルスケアデータから前記対象項目に係るデータを除いた入力データを、前記対象項目の値を出力する学習済みモデルの入力層に与え、前記学習済みモデルの出力層から出力される値であることを特徴とする情報処理装置。
  11. 前記対象項目は年齢であることを特徴とする請求項10に記載の情報処理装置。
  12. ヘルスケアデータ取得部が、複数の項目に係るデータを有するヘルスケアデータを取得するステップと、
    推定値取得部が、所定の対象項目の推定値を取得するステップと、
    表示制御部が、前記対象項目の推定値を表示部に表示させるステップと、
    を備え、
    前記推定値は、前記ヘルスケアデータから前記対象項目に係るデータを除いた入力データを、前記対象項目の値を出力する学習済みモデルの入力層に与え、前記学習済みモデルの出力層から出力される値であることを特徴とする情報処理方法。
  13. コンピュータを、
    複数の項目に係るデータを有するヘルスケアデータを取得するヘルスケアデータ取得手段、
    所定の対象項目の推定値を取得する推定値取得手段、および
    前記対象項目の推定値を表示部に表示させる表示制御手段、
    として機能させる情報処理プログラムであって、
    前記推定値は、前記ヘルスケアデータから前記対象項目に係るデータを除いた入力データを、前記対象項目の値を出力する学習済みモデルの入力層に与え、前記学習済みモデルの出力層から出力される値である、情報処理プログラム。
JP2018123615A 2018-06-28 2018-06-28 ヘルスケアデータ分析システム、ヘルスケアデータ分析方法およびヘルスケアデータ分析プログラム Active JP7173482B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018123615A JP7173482B2 (ja) 2018-06-28 2018-06-28 ヘルスケアデータ分析システム、ヘルスケアデータ分析方法およびヘルスケアデータ分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018123615A JP7173482B2 (ja) 2018-06-28 2018-06-28 ヘルスケアデータ分析システム、ヘルスケアデータ分析方法およびヘルスケアデータ分析プログラム

Publications (2)

Publication Number Publication Date
JP2020004126A true JP2020004126A (ja) 2020-01-09
JP7173482B2 JP7173482B2 (ja) 2022-11-16

Family

ID=69100011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018123615A Active JP7173482B2 (ja) 2018-06-28 2018-06-28 ヘルスケアデータ分析システム、ヘルスケアデータ分析方法およびヘルスケアデータ分析プログラム

Country Status (1)

Country Link
JP (1) JP7173482B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036750A (zh) * 2020-08-31 2020-12-04 平安医疗健康管理股份有限公司 适用于医疗风控的异常识别方法、装置、设备及存储介质
CN113496779A (zh) * 2020-03-18 2021-10-12 株式会社日立制作所 患者状态的预测装置、预测方法、以及预测程序
JP6982672B1 (ja) * 2020-11-21 2021-12-17 株式会社オプティム プログラム、方法、情報処理装置及びシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008547078A (ja) * 2005-06-15 2008-12-25 株式会社バイオエイジ 生体年齢測定装置及びそのサービス方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008547078A (ja) * 2005-06-15 2008-12-25 株式会社バイオエイジ 生体年齢測定装置及びそのサービス方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496779A (zh) * 2020-03-18 2021-10-12 株式会社日立制作所 患者状态的预测装置、预测方法、以及预测程序
CN112036750A (zh) * 2020-08-31 2020-12-04 平安医疗健康管理股份有限公司 适用于医疗风控的异常识别方法、装置、设备及存储介质
JP6982672B1 (ja) * 2020-11-21 2021-12-17 株式会社オプティム プログラム、方法、情報処理装置及びシステム
JP2022082478A (ja) * 2020-11-21 2022-06-02 株式会社オプティム プログラム、方法、情報処理装置及びシステム

Also Published As

Publication number Publication date
JP7173482B2 (ja) 2022-11-16

Similar Documents

Publication Publication Date Title
Jiwani et al. Novel healthcare framework for cardiac arrest with the application of AI using ANN
Mustaqeem et al. A statistical analysis based recommender model for heart disease patients
US20220093215A1 (en) Discovering genomes to use in machine learning techniques
US20220093216A1 (en) Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions
Keshavan et al. Combining citizen science and deep learning to amplify expertise in neuroimaging
US20200074313A1 (en) Determining features to be included in a risk assessment instrument
JP7173482B2 (ja) ヘルスケアデータ分析システム、ヘルスケアデータ分析方法およびヘルスケアデータ分析プログラム
Sahoo et al. Heart failure prediction using machine learning techniques
Mandal Machine learning algorithms for the creation of clinical healthcare enterprise systems
Shuvo et al. Machine learning embedded smartphone application for early-stage diabetes risk assessment
CN118116528A (zh) 基于机器学习生成人格量表的系统
Mohan et al. Perceived Stress Prediction among Employees using Machine Learning techniques
US20240206821A1 (en) Apparatus and a method for predicting a physiological indicator
Daza et al. Stacking ensemble based hyperparameters to diagnosing of heart disease: Future works
JP7485512B2 (ja) 医用情報処理装置、医用情報処理方法、及び医用情報処理プログラム
Deepa et al. Experimental evaluation of artificial intelligence assisted heart disease prediction using deep learning principle
Kachhawa et al. An Intelligent System for Early Prediction of Cardiovascular Disease using Machine Learning
Geetha et al. Human Stress Detection in and Through Sleep Patterns Using Machine Learning Algorithms
Sáez Carazo Empowering cardiovascular disease diagnosis with machine and deep learning approaches
Sinha et al. CARDPSoML: Comparative approach to analyze and predict cardiovascular disease based on medical report data and feature fusion approach
Popa et al. Risk Estimator using a Multi-Layer Perceptron Network for Coronary Artery Disease Prevention.
US20240145090A1 (en) Medical learning apparatus, medical learning method, and medical information processing system
US20230112160A1 (en) Mapping brain data to behavior
Bansal et al. Heart Guardian: A Model for Predicting Cardiovascular Diseases
Saxena et al. Deep Learning: Its Empirical Study and Comparison in Heart Disease Prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221026

R150 Certificate of patent or registration of utility model

Ref document number: 7173482

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150