JP6379199B2 - データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム - Google Patents

データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム Download PDF

Info

Publication number
JP6379199B2
JP6379199B2 JP2016532823A JP2016532823A JP6379199B2 JP 6379199 B2 JP6379199 B2 JP 6379199B2 JP 2016532823 A JP2016532823 A JP 2016532823A JP 2016532823 A JP2016532823 A JP 2016532823A JP 6379199 B2 JP6379199 B2 JP 6379199B2
Authority
JP
Japan
Prior art keywords
data
health care
score
healthcare
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016532823A
Other languages
English (en)
Other versions
JPWO2016006042A1 (ja
Inventor
守本 正宏
正宏 守本
池上 成朝
成朝 池上
秀樹 武田
秀樹 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fronteo Inc
Original Assignee
Fronteo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fronteo Inc filed Critical Fronteo Inc
Publication of JPWO2016006042A1 publication Critical patent/JPWO2016006042A1/ja
Application granted granted Critical
Publication of JP6379199B2 publication Critical patent/JP6379199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Description

構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出し、病気の予測診断が可能なデータ分析装置等に関するものである。
医療現場では、CT、MRI、PET等のモダリティで取得された画像情報の他、心電図や脳波等の波形情報、血圧、体温等の数値情報、各種検査報告、カルテ等の文字情報等、多種多様な医療情報が発生している。
また、現在、健康に対する個人の認識が高まるに連れて、病気を自覚してから医療機関に出向くよりも、病気を予防しようとする意識や、病気を早期に発見して早期に治療しようとする意識が強まっている。
多種多様な医療情報が存在する中にあって、個人の病気の予防や早期発見・治療の意識の強まりにともなって、信頼性が高い診断結果が早急に得られる手段が求められている。
特許文献1及び2においては、ユーザが所望する医療情報を、タッチパネル等の直観的なユーザインターフェースを用いて、より直観的な操作で、より容易に取得可能にする医療情報表示装置等が開示されている。
特開2012−48602号公報 再表2012−29265号公報
しかしながら、特許文献1及び2に開示された装置は、所望の医療情報を適切に絞り込むためのものではあるが、当該医療情報に基づいて、総合的に分析・解析し、診断結果を予測し、病気の予測診断需要者に報知できるものではない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出することによって、病気の予測診断需要者に信頼性が高い診断結果を報知できるデータ分析装置等を提供することである。
上記課題を解決するために、本発明の一態様に係るデータ分析装置は、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出し、病気の予測診断が可能なデータ分析装置であって、前記所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータが新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータに基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価する関係性評価部と、前記関係性評価部によって評価された関係性に応じて、前記未判断ヘルスケアデータを病気の予測診断需要者に報知するデータ報知部とを備えている。
また、本発明の一態様に係るデータ分析装置は、所定のヘルスケアデータと所定の症状との関係性の強さを示すスコアを算出するスコア算出部をさらに備え、関係性評価部は、未判断ヘルスケアデータと所定の症状との関係性を示す指標として、スコア算出部によって算出されたスコアを用いて、当該未判断ヘルスケアデータと当該所定の症状とが関係するか否かを評価し、データ報知部は、関係性評価部によって未判断ヘルスケアデータと所定の症状とが関係すると評価された場合、当該未判断ヘルスケアデータを病気の予測診断需要者に報知することができる。
また、本発明の一態様に係るデータ分析装置は、既判断ヘルスケアデータに含まれるデータ要素を、所定の基準に基づいてそれぞれ評価する要素評価部をさらに備え、スコア算出部は、要素評価部によって評価された結果を用いて、スコアを算出することができる。
また、本発明の一態様に係るデータ分析装置は、要素評価部によって評価された結果を用いて、既判断ヘルスケアデータと所定の症状との関係性を示す指標として、スコア算出部によって算出されたスコアのうち、適合率に対して設定された目標値を超過可能なスコアを、所定の閾値として特定する閾値特定部をさらに備えてよい。
また、本発明の一態様に係るデータ分析装置は、時系列に沿って取得された複数の既判断ヘルスケアデータに対してそれぞれ算出されたスコアの移動平均と、時系列に沿って取得される複数の未判断ヘルスケアデータに対してそれぞれ算出されるスコアの移動平均との相関の高低を判定する条件判定部をさらに備え、関係性評価部は、条件判定部によって判定された結果に基づいて、未判断ヘルスケアデータと所定の症状との関係性を評価することができる。
また、本発明の一態様に係るデータ分析装置は、所定のヘルスケアデータが所定の症状と関係するか否かが医師によって判断された結果を、所定の入力部を介して当該医師から取得することによって、既判断ヘルスケアデータを取得する既判断データ取得部をさらに備えることができる。
また、本発明の一態様に係るデータ分析装置は、関係性評価部によって評価された結果に基づいて、未判断ヘルスケアデータが所定の症状と関係することを示す関係性情報を付与する関係付与部をさらに備えることができる。
また、本発明の一態様に係るデータ分析装置は、遺伝子解析データ、健康診断データ、のうちの少なくとも1つを含む構造化ヘルスケアデータ、及び/又は、問診データ、生活データ、既往歴、家族の病歴のうちの少なくとも1つを含む非構造化ヘルスケアデータを、ヘルスケアデータとして取得するデータ取得部をさらに備えることができる。
また、本発明の一態様に係るデータ分析装置において、所定の症状は、不良な健康状態であってよい。
上記課題を解決するために、本発明の一態様に係るデータ分析装置の制御方法は、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出し、病気の予測診断が可能なデータ分析装置の制御方法であって、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータが新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータに基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価する関係性評価ステップと、関係性評価ステップにおいて評価した関係性に応じて、未判断ヘルスケアデータを病気の予測診断需要者に報知するデータ報知ステップとを含んでいる。
上記課題を解決するために、本発明の一態様に係るデータ分析装置の制御プログラムは、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから、所定の症状と関係するヘルスケアデータを抽出し、病気の予測診断が可能なデータ分析装置の制御プログラムであって、データ分析装置に、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータが新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータに基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価する関係性評価機能と、関係性評価機能によって評価された関係性に応じて、未判断ヘルスケアデータを病気の予測診断需要者に報知するデータ報知機能とを実現させる。
本発明の一態様に係るデータ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラムは、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータが新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータに基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価し、当該関係性に応じて、未判断ヘルスケアデータを総合的に分析して、病気の予測診断需要者に報知する。
したがって、上記データ分析装置等は、病気の予測診断需要者に信頼性が高い診断結果を報知できるという効果を奏する。
本発明の実施の形態に係るデータ分析装置の要部構成を示すブロック図である。 上記データ分析装置の概要を示す模式図である。 上記データ分析装置が実行する処理の一例を示す詳細なフローチャートである。
図1〜図3に基づいて、本発明の実施の形態を説明する。
〔データ分析装置100の概要〕
図2は、データ分析装置100の概要を示す模式図である。データ分析装置100は、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出可能な装置である。上記データ分析装置100は、以下で説明する処理を実行可能な機器でありさえすればよく、例えば、パーソナルコンピュータ、スマートフォン、その他の電子機器などを用いて実現され得る。
図2に示されるように、データ分析装置100は、例えば、不健康に至る可能性が高い状況を示す画像情報(データ1b)を、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータとして取得する。ここで、上記「所定の症状」は、医師によって、不健康な状態(人間の心や体に不調または不都合が生じた状態)であると診断された症状、疾病、疾患、症候群などを広く含む。
データ分析装置100は、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータが新たに取得された場合、医師(例えば、経験豊富な医師)によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータに基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価する。具体的には、データ分析装置100は、データ1b(例えば、不健康に至る可能性が高い状況を示す画像情報)からデータ要素2を抽出し、既判断ヘルスケアデータを用いてそれぞれ評価された当該データ要素2から、当該データ1bのスコア5eを算出する。そして、データ分析装置100は、算出されたスコア5eが所定の条件を満たす(例えば、当該スコア5eが所定の閾値を超過している)場合、当該データ1bを病気の予測診断需要者(例えば、患者、経験が乏しい医師)に報知する。
すなわち、データ分析装置100は、所定の症状と関係するか否かが医師によって判断された結果に基づいて、新たな未判断ヘルスケアデータを病気の予測診断需要者に報知するか否かを判断できる。例えば、データ分析装置100は、経験豊富な医師が、ヒヤリハットを経験(医師の診断が医療ミスには至らなかったが、医療ミスにつながってもおかしくなかった経験)した場合、当該ヒヤリハットの状況(所定の症状)と当該状況を示す外部画像との関連性を学習し、経験が乏しい医師が同様の状況に遭遇したことによって、類似の外部画像が取得された場合に、当該類似の外部画像を経験が乏しい医師に報知できる。
したがって、データ分析装置100は、病気の予測診断需要者に信頼性が高い診断結果を報知できるという効果を奏する。
〔データ分析装置100の構成〕
図1は、データ分析装置100の要部構成を示すブロック図である。図1に示されるように、データ分析装置100は、制御部10(データ取得部11、既判断データ取得部12、要素評価部13、スコア算出部14、条件判定部15、関係性評価部16、関係付与部17、データ報知部18、閾値特定部19、格納部20)、入力部40、および記憶部30を備えている。
制御部10は、データ分析装置100が有する各種の機能を統括的に制御する。制御部10は、データ取得部11、既判断データ取得部12、要素評価部13、スコア算出部14、条件判定部15、関係性評価部16、関係付与部17、データ報知部18、閾値特定部19、および格納部20を含む。
データ取得部11は、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータからヘルスケアデータ1を取得する。データ取得部11は、例えば、遺伝子解析データ、健康診断データ(例えば、身長、体重、血圧、血液の状態等)のうちの少なくとも1つ、好ましくは2つ以上を含む構造化ヘルスケアデータ、及び/又は、問診データ(例えば、吐き気や目眩がする、1週間程前から症状が出ている、左を向いて寝ると痛みが和らぐ、患部がヒリヒリする等)、生活データ(例えば、タバコを吸う、酒を毎日飲む、運動は週1する等)、患者の臨床データ(例えば、妊娠中、糖尿病を患っている等)、家族の病歴(例えば、父が脳梗塞、母が癌等)のうちの少なくとも1つ、好ましくは2つ以上をヘルスケアデータ1として取得できる。
データ取得部11は、取得したヘルスケアデータ1のうち、所定の症状と関係するか否かが医師によって判断されるべきデータ1aを、既判断データ取得部12および要素評価部13に出力し、他のデータ1b(未判断ヘルスケアデータ)をスコア算出部14に出力する。
既判断データ取得部12は、データ1aが所定の症状と関係するか否かが医師によって判断された結果(レビュー結果5a)を、入力部40を介して当該医師から取得することによって、既判断ヘルスケアデータ(データ1aとレビュー結果5aとのペア)を取得する。具体的には、既判断データ取得部12は、入力部40から取得された入力情報5bに基づいて、データ取得部11から入力されたデータ1aに対応するレビュー結果5aを取得する。そして、既判断データ取得部12は、当該レビュー結果5aを要素評価部13および閾値特定部19に出力する。
なお、レビュー結果5aをデータ分析装置100に与える医師と、当該データ分析装置100からレビュー結果を受け取る(すなわち、当該データ分析装置100からデータ1bを報知される)医師とは、同じ医師であってもよいし、異なる医師であってもよい。後者の場合、例えば、経験豊富な医師の経験・判断基準をデータ分析装置100が学習し、当該学習結果に基づいて、データ1bを経験が乏しい医師に報知することができる。すなわち、データ分析装置100は、経験豊富な医師の経験を経験が乏しい医師に生かすことができる。
要素評価部13は、既判断ヘルスケアデータに含まれるデータ要素を、所定の基準に基づいてそれぞれ評価する。具体的には、データ1aが各種検査報告、カルテ等の手書きの文字情報であった場合、要素評価部13は、当該文字情報を文書データに変換する。データ1aが問診時の音声情報であった場合、要素評価部13は、当該問診時の音声情報を認識することによって当該問診時の音声情報を文字(文書データ)に変換する。そして、要素評価部13は、当該文書データに含まれるキーワード(データ要素)と当該キーワードを含むデータ1a(問診時の音声情報、又は各種検査報告、カルテ等の文字情報)に対して医師が判断した結果(レビュー結果5a)との依存関係を表す伝達情報量を、上記所定の基準の1つとして当該キーワードの重みを算出することによって、当該キーワードを評価することができる。なお、要素評価部13は、任意の音声認識アルゴリズム(例えば、隠れマルコフモデル、カルマンフィルタ、ニューラルネットワークなど)を用いて、上記問診時の音声情報を認識してよい。
または、データ1aが画像情報であった場合、要素評価部13は、任意の画像認識技術(例えば、パターンマッチング、ベイズ推定、マルコフ連鎖モンテカルロなどの技術)を用いることにより、当該画像情報に含まれるオブジェクトを、データ要素として特定できる。そして、要素評価部13は、当該画像情報に含まれるオブジェクト(データ要素)と当該オブジェクトを含むデータ1a(画像情報)に対して医師が判断した結果(レビュー結果5a)との依存関係を表す伝達情報量を、上記所定の基準の1つとして当該オブジェクトの重みを算出することにより、当該オブジェクトを評価できる。要素評価部13は、上記データ要素と当該データ要素の重みとのペアである要素情報5cを、スコア算出部14および格納部20に出力する。
スコア算出部14は、要素評価部13によって評価された結果(要素情報5c)を用いて、データ1aと所定の症状との関係性の強さを示すスコア5dを算出する。スコア算出部14は、算出したスコア5dを閾値特定部19に出力する。また、データ取得部11からデータ1b(未判断ヘルスケアデータ)が入力された場合、スコア算出部14は、当該データ1bについてスコア5eを算出し、当該算出したスコア5eを条件判定部15に出力する。
スコア算出部14は、ヘルスケアデータ1(データ1aまたはデータ1b)に含まれるデータ要素の重みを合算することによって、当該ヘルスケアデータ1のスコア(スコア5dまたはスコア5e)を算出できる。例えば、ヘルスケアデータ1が、診察室内での問診時において録音された、「どのような症状がありますか?」「1週間ほど前から、吐き気があります。」という問診時の対話音声情報である場合を考える。この場合、「1週間ほど前」および「吐き気」というデータ要素が要素評価部13によってそれぞれ評価された結果、「1.2」および「2.2」という重みが設定された場合、スコア算出部14は、当該データ1のスコアを「3.4」(1.2+2.2)と計算できる。
具体的には、スコア算出部14は、所定のデータ要素がヘルスケアデータ1に含まれるか否かを示す要素ベクトルを生成する。上記要素ベクトルは、当該要素ベクトルのそれぞれの要素が「0」または「1」の値をとることによって、当該要素に対応付けられた所定のデータ要素が、上記ヘルスケアデータ1に含まれるか否かを示すベクトルである。例えば、上記ヘルスケアデータ1に「1週間ほど前」というデータ要素が含まれている場合、スコア算出部14は、上記要素ベクトルの上記「1週間ほど前」に対応する要素を「0」から「1」に変更する。そして、スコア算出部14は、以下の式のように、上記要素ベクトル(縦ベクトル)と重みベクトル(各データ要素に対する重みを要素にした縦ベクトル)との内積を計算することにより、上記データ1のスコアSを計算する。
Figure 0006379199
ここで、sは要素ベクトルを表し、Wは重みベクトルを表す。なお、Tは行列・ベクトルを転置する(行と列とを入れ替える)ことを表す。
または、スコア算出部14は、以下の式にしたがってスコアSを算出してもよい。
Figure 0006379199
ここで、mは、j番目のデータ要素の出現頻度を表し、wは、i番目のデータ要素の重みを表す。
なお、スコア算出部14は、データ1aおよび/またはデータ1bに含まれる第1データ要素が評価された結果(第1データ要素の重み)と、当該データ1aおよび/またはデータ1bに含まれる第2データ要素が評価された結果(第2データ要素の重み)とに基づいて、スコア5dおよび/またはスコア5eを算出してよい。すなわち、スコア算出部14は、第1データ要素がデータに出現した場合、当該データにおいて第2データ要素が出現する頻度(すなわち、第1データ要素と第2データ要素との相関、共起ともいう)を考慮して、データのスコアを計算できる。これにより、データ分析装置100は、データ要素間の相関関係を考慮してスコアを算出できるため、より高い精度で所定の症状と関係するデータを抽出できる。
条件判定部15は、スコア算出部14によって算出されたスコア5eに基づいて、データ1bが、当該データ1bを病気の予測診断需要者に報知するための所定の条件を満たしているか否かを判定する。例えば、条件判定部15は、スコア5eと適合閾値(所定の閾値)6とを比較することにより、当該スコア5eが当該適合閾値6を超過しているか否かを、上記所定の条件の1つとして判定してよい。
または、条件判定部15は、時系列に沿って取得される複数のデータ1aに対してそれぞれ算出されたスコア5dの移動平均と、時系列に沿って取得される複数のデータ1bに対してそれぞれ算出されるスコア5eの移動平均との相関が高まったか否かを、上記所定の条件の1つとして判定してもよい。例えば、上記複数のデータ1aが、ヒヤリハットを経験した状況(医師の診断が医療ミスには至らなかったが、医療ミスにつながってもおかしくなかった状況)であったことを示すレビュー結果5aが経験豊富な医師から得られたデータである場合、条件判定部15は、上記複数のデータ1aに対してそれぞれ算出されたスコア5dの移動平均を所定のパターンとして抽出する。
そして、条件判定部15は、上記所定のパターンと上記スコア5eの移動平均との相関を算出する。言い換えれば、条件判定部15は、経過時間および/またはスコアをずらしながら、両者の一致度(相関)を計算する。当該相関が高くなる場合、条件判定部15は、今回のスコア5eは将来において、上記所定のパターンに連動するように、同様の値をとる(すなわち、同様のヒヤリハットが起こる可能性が高い)と判定する。
または、条件判定部15は、データ取得部11によって過去に取得された第3者の生体情報(データ1a)の変移と、病気の予測診断需要者(例えば、患者)の生体情報(データ1b)の変移との相関が高まったか否かを、上記所定の条件の1つとして判定してもよい。例えば、上記生体情報(データ1a)が、ヒヤリハットを経験した状況であったことを示すレビュー結果5aが経験豊富な医師から得られたデータである場合、条件判定部15は、両生体情報の変移について相関を算出し、当該相関が高くなる場合、今回の生体情報は将来において、過去の生体情報に連動するように、同様の値をとる(すなわち、同様のヒヤリハットが起こる可能性が高い)と判定する。条件判定部15は、判定した結果(判定結果5f)を関係性評価部16に出力する。
関係性評価部16は、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータ(データ1b)が新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータ(データ1aとレビュー結果5aとのペア)に基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価する。例えば、未判断ヘルスケアデータ(データ1b)と所定の症状との関係性を示す指標として、スコア算出部14によって算出されたスコア5eが閾値6を超過している場合(すなわち、条件判定部15によって超過していると判定された場合)、当該未判断ヘルスケアデータと当該所定の症状とが関係していると評価する。関係性評価部16は、評価した結果(評価結果5g)を関係付与部17に出力する。
関係付与部17は、関係性評価部16によって評価された結果(評価結果5g)に基づいて、未判断ヘルスケアデータ(データ1b)が所定の症状と関係することを示す関係性情報5hを付与し、当該関係性情報5hをデータ報知部18に出力する。
データ報知部18は、関係性評価部16によって評価された関係性に応じて、未判断ヘルスケアデータ(データ1b)を病気の予測診断需要者に報知する。具体的には、データ報知部18は、所定の症状と関係することを示す関係性情報5hが、関係付与部17によって付与されたデータ1bを、上記病気の予測診断需要者に報知する。
閾値特定部19は、所定の症状に関係すると判断されたデータ1aが、所定数のデータを含むデータ群に占める割合を示す適合率に対して設定された目標値(目標適合率)を超過可能な最小のスコアを、適合閾値6として特定する。具体的には、スコア算出部14からスコア5dが入力された場合、閾値特定部19は、当該スコア5dを降順に並べ替える。次に、閾値特定部19は、最大のスコア5d(スコアのランクが1位)を有するデータ1aから順番に当該データ1aに付与されたレビュー結果5aを走査し、「所定の症状と関係する」というレビュー結果5aが付与されたデータの数が、現時点において走査が終了したデータの数に占める割合(適合率)を、順次計算する。
例えば、レビュー結果5aが付与されたデータ1aの数が100である場合に、スコアのランクが1位から20位までのデータについて走査を終了したところ、「所定の症状と関係する」というレビュー結果5aが付与されたデータの数が18であった場合、閾値特定部19は、適合率を0.9(18/20)と計算する。または、スコアのランクが1位から40位までのデータについて走査を終了したところ、「所定の症状と関係する」というレビュー結果5aが付与されたデータの数が35であった場合、閾値特定部19は、適合率を0.875(35/40)と計算する。
閾値特定部19は、データ1aに対する適合率をすべて計算し、目標適合率を超過可能な最小のスコアを特定する。具体的には、閾値特定部19は、最小のスコア5d(スコアのランクが100位)を有するデータ1aから順番に当該データ1aに対して計算された適合率を走査し、当該適合率が目標適合率を超過した場合、当該適合率に対応するスコアを、上記目標適合率を維持可能な最小スコア(適合閾値6)として条件判定部15および格納部20に出力する。
格納部20は、要素評価部13から要素情報5cが入力された場合、当該要素情報5cに含まれるデータ要素と、当該データ要素が評価された結果(重み)とを対応付けて、記憶部30に格納する。これにより、データ分析装置100は、過去のデータを分析した結果(データ要素が評価された結果としての重み)に基づいて現在のデータを分析することによって、所定の症状と関係するデータを抽出できる。また、格納部20は、閾値特定部19から適合閾値6が入力された場合、当該適合閾値6を記憶部30に格納する。
入力部(所定の入力部)40は、医師から入力を受け付ける。図1は、データ分析装置100が入力部40を備えた構成(例えば、入力部40としてキーボード、マウスなどが接続された構成)を示すが、当該入力部40は、当該データ分析装置100と通信可能に接続された外部の入力装置(例えば、クライアント端末)であってもよい。
記憶部(所定の記憶部)30は、例えば、ハードディスク、SSD(silicon state drive)、半導体メモリ、DVDなど、任意の記録媒体によって構成される記憶機器であり、要素情報5c、適合閾値6、および/またはデータ分析装置100を制御可能な制御プログラムを記憶する。なお、図1は、データ分析装置100が記憶部30を内蔵する構成を示すが、当該記憶部30は、当該データ分析装置100と通信可能に接続された外部の記憶装置であってもよい。
〔重みの再計算〕
所定の症状と関係するとデータ分析装置100によって判断されたデータ1bが、データ報知部18によって病気の予測診断需要者に報知された後、既判断データ取得部12は、当該判断に対するフィードバックを医師から受け付けることができる。すなわち、医師は、データ分析装置100によって判断された結果が妥当であるか否かを、上記フィードバックとしてそれぞれ入力できる。
要素評価部13は、上記フィードバックに基づいて各データ要素を再評価できる。具体的には、要素評価部13は、以下の式にしたがって各データ要素の重みを算出する。
Figure 0006379199
ここで、wi,LはL回目学習後のi番目のデータ要素の重みを表し、γはL回目学習における学
習パラメータを表し、θは学習効果の閾値を表す。
すなわち、要素評価部13は、データ分析装置100の判断に対して新たに得られたフィードバックに基づいて重みを再計算できる。これにより、データ分析装置100は、分析の対象とするデータに適合した重みを獲得し、当該重みに基づいて正確にスコアを算出できるため、より高い精度で所定の症状と関係するデータを抽出できる。
〔データ分析装置100が実行する処理〕
データ分析装置100が実行する処理(データ分析装置100の制御方法)は、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータ(データ1b)が新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータ(データ1aとレビュー結果5aとのペア)に基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価する関係性評価ステップと、関係性評価ステップにおいて評価した関係性に応じて、未判断ヘルスケアデータを病気の予測診断需要者に報知するデータ報知ステップとを含んでいる。
図3は、データ分析装置100が実行する処理の一例を示す詳細なフローチャートである。なお、以下の説明において、カッコ書きの「〜ステップ」は、上記データ分析装置の制御方法に含まれる各ステップを表す。
データ取得部11は、所定の症状と関係するか否かが医師によって判断されるべきデータ1aを、(例えば、外部画像を撮影するカメラ、問診時の音声を録音するマイクなどから)取得する(ステップ1、以下「ステップ」を「S」と略記する)。次に、既判断データ取得部12は、データ1aが所定の症状と関係するか否かについて医師が判断した結果(レビュー結果5a)を、入力部40を介して取得する(S2)。次に、要素評価部13は、上記所定の症状と関係するか否かが医師によって判断されたデータに含まれるデータ要素を、所定の基準に基づいてそれぞれ評価する(S3)。そして、スコア算出部14は、要素評価部13によって評価された結果(要素情報5c)に基づいて、上記所定の症状との関係性の強さを示すスコア5dをデータ1aについてそれぞれ算出し(S4)、閾値特定部19は、上記所定の症状に関係すると判断されたデータ1aが、所定数のデータを含むデータ群に占める割合を示す適合率に対して設定された目標値(目標適合率)を超過可能な最小のスコアを、適合閾値6として特定する(S5)。
次に、スコア算出部14は、要素評価部13によって評価された結果(要素情報5c)に基づいて、上記所定の症状との関係性の強さを示すスコア5eをデータ1bについてそれぞれ算出する(S6)。条件判定部15は、要素評価部13によって評価された結果(要素情報5c)に基づいて、上記所定の症状と関係するか否かが未だ判断されていないデータ1bについて算出されたスコア5eが、適合閾値6を超過しているか否かを判定し(S7)、超過していると判定される場合(S7においてYES)、関係性評価部16は、データ1bが上記所定の症状と関係していると評価する(S8、関係性評価ステップ)。
関係付与部17は、関係性評価部16によって評価されたデータ1bに、当該データ1bが上記所定の症状と関係することを示す関係性情報(文書分析システム100によるレビュー結果)を付与する(S9)。最後に、データ報知部18は、当該データ1bを病気の予測診断需要者に報知する(S10、データ報知ステップ)。
なお、上記制御方法は、図2を参照して前述した上記処理だけでなく、制御部10に含まれる各部において実行される処理を任意に含んでよい。
〔データ分析装置100が奏する効果〕
以上のように、データ分析装置100は、所定の症状と関係するか否かが判断されていない未判断ヘルスケアデータが新たに取得された場合、医師によって当該所定の症状と関係するか否かが判断された既判断ヘルスケアデータに基づいて、当該未判断ヘルスケアデータと当該所定の症状との関係性を評価し、当該関係性に応じて、未判断ヘルスケアデータを病気の予測診断需要者に報知する。
したがって、データ分析装置100は、病気の予測診断需要者に信頼性が高い診断結果を報知できるという効果を奏する。
〔サーバ装置が機能の一部または全部を提供する構成〕
以上では、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出可能なデータ分析装置の制御プログラムが、当該データ分析装置100において実行される構成(スタンドアロン構成)を説明した。
一方、上記制御プログラムの一部または全部がサーバ装置において実行され、当該実行された処理の結果が上記データ分析装置100(ユーザ端末)に返される構成(クラウド構成)であってもよい。すなわち、本発明のデータ分析装置は、ユーザ端末とネットワークを介して通信可能に接続されたサーバ装置として機能することができる。これにより、サーバ装置は、上記データ分析装置100が機能を提供する場合に、当該データ分析装置100が奏する効果と同じ効果を奏する。
〔ソフトウェアによる実現例〕
データ分析装置100の制御ブロック(特に、制御部10)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。後者の場合、データ分析装置100は、各機能を実現するソフトウェアであるデータ分析装置100の制御プログラムの命令を実行するCPU、上記制御プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記制御プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記制御プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記制御プログラムは、当該制御プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記制御プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
具体的には、本発明の実施の形態に係るデータ分析装置の制御プログラムは、構造化ヘルスケアデータ及び/又は非構造化ヘルスケアデータから取得された複数のヘルスケアデータから所定の症状と関係するヘルスケアデータを抽出可能なデータ分析装置の制御プログラムであって、上記データ分析装置に、関係性評価機能、およびデータ報知機能を実現させる。上記関係性評価機能、およびデータ報知機能は、上述した関係性評価部16、およびデータ報知部18によってそれぞれ実現され得る。詳細については上述した通りである。
なお、上記制御プログラムは、例えば、Python、ActionScript、JavaScript(登録商標)などのスクリプト言語、Objective-C、Java(登録商標)などのオブジェクト指向プログラミング言語、HTML5などのマークアップ言語などを用いて実装できる。
〔付記事項1〕
本発明は上述したそれぞれの実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施の形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施の形態についても、本発明の技術的範囲に含まれる。さらに、各実施の形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成できる。
また、本発明の一態様に係るデータ分析装置において、要素評価部は、データ要素と当該データ要素を含む既判断データに対して医師が判断した結果との依存関係を表す伝達情報量を、所定の基準の1つとして、当該データ要素を評価することができる。
〔付記事項2〕
本発明の一態様に係るデータ分析装置は、データ、患者情報、アクセス履歴情報を含むデジタル情報を取得し、患者情報から特定の患者を指定し、指定された特定の患者に関するアクセス履歴情報に基づいて、特定の患者がアクセスしたデータのみを抽出し、抽出されたデータに含まれる所定のファイルが、所定の症状に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づいて、所定の症状に関連する所定のファイルを出力する。
本発明の一態様に係るデータ分析装置は、データおよび患者情報を含むデジタル情報を取得し、患者情報に含まれる患者のうちいずれの患者に関連するものであるかを示す患者特定情報を設定し、患者を指定し、指定された患者に対応する患者特定情報が設定された所定のファイルを検索し、検索された所定のファイルが、所定の症状に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づいて、所定の症状に関連する所定のファイルを出力する。
本発明の一態様に係るデータ分析装置は、データ要素データベースに、(1a)分別符号A、(1b)分別符号Aが付与されたデータに含まれるデータ要素、(1c)分別符号Aとデータ要素との対応関係を示すデータ要素対応情報が保存されており、関連データ要素データベースに、(2a)分別符号B、(2b)分別符号Bが付与されたデータにおいて出現頻度が高い関連データ要素、(2c)分別符号Bと関連データ要素との対応関係を示す関連データ要素対応情報が保存されており、上記(1c)のデータ要素対応情報に基づいて、上記(1b)のデータ要素を含むデータに対して分別符号Aを付与し、分別符号Aを付与しなかったデータから、上記(2b)の関連データ要素を含むデータを抽出し、関連データ要素の評価値・数に基づいてスコアを算出し、そのスコアと上記(2c)の関連データ要素対応情報に基づいて、スコアが一定値を超過したデータに分別符号Bを付与し、分別符号Bを付与しなかったデータに対して、医師から分別符号Cの付与を受け付ける。
本発明の一態様に係るデータ分析装置は、データに対して所定の症状との関連性を示す分別符号を付与するために、医師から分別符号の入力を受け付け、データを分別符号ごとに分別し、分別されたデータにおいて共通して出現するデータ要素を解析・選定し、選定されたデータ要素をデータから探索し、探索した結果と、データ要素を解析した結果とを用いて、分別符号とデータとの関連性を示すスコアを算出し、算出したスコアに基づいて、データに分別符号を付与する。
本発明の一態様に係るデータ分析装置は、医師が所定の症状に関連するか否かを判断するためのデータ要素をデータベースに登録し、データベースに登録されたデータ要素をデータから検索し、検索されたデータ要素を含むセンテンスを、データから抽出し、抽出されたセンテンスから抽出される特徴量により、所定の症状との関連度合いを示すスコアを算出し、スコアに応じてセンテンスの強調の程度を変化させる。
本発明の一態様に係るデータ分析装置は、医師が行った所定の症状との関連性判断の結果、または関連性判断の進捗速度を実績情報として記録し、結果または進捗速度に関する予測情報を生成し、実績情報および予測情報を比較し、比較結果に基づいて、医師の関連性判断に対する評価を呈示するアイコンを生成する。
本発明の一態様に係るデータ分析装置は、データと所定の症状との関連性を示す結果情報について、医師から入力を受け付け、データに共通して出現するデータ要素の特徴から、そのデータ要素の評価値を結果情報ごとに算出し、評価値に基づいてデータ要素を選定し、選定されたデータ要素とその評価値とから、データのスコアを算出し、スコアに基づいて再現率を算出する。
本発明の一態様に係るデータ分析装置は、データを医師に対して表示し、レビューの対象データに対して、医師が所定の症状に関連するか否かの判断に基づいて付与した識別情報(タグ)を受け付け、タグを受け付けた対象データの特徴量と、データの特徴量とを比較し、比較結果に基づいて、所定のタグに対応するデータのスコアを更新し、更新されたスコアに基づいて、表示されるデータの表示順番を制御する。
本発明の一態様に係るデータ分析装置は、ソースコードが更新された際には、更新されたソースコードを記録し、記録されたソースコードから実行可能ファイルを作成し、実行可能ファイルを検証するために実行し、実行した検証結果を送信し、検証結果の配信をサーバが受け付ける。
本発明の一態様に係るデータ分析装置は、医師が所定の症状との関連性について判断するデータと、データを分類するための分類条件を医師に選択させるための分類ボタンとを表示し、医師が選択した分類ボタンに関する情報を選択情報として受け付け、選択情報に基づいてデータを分析した結果によってデータを分類し、分類した結果に基づいてデータを表示する。
本発明の一態様に係るデータ分析装置は、音声・画像データの付帯情報をそれぞれ確認し、付帯情報に基づいて音声・画像データを分類し、分類した音声・画像データの付帯情報に含まれる要素を抽出し、抽出した要素に基づいて類似度を解析し、類似度に基づいて統合して解析する。
本発明の一態様に係るデータ分析装置は、パスワードで保護されたパスワード付ファイルを抽出し、パスワードの候補となる候補単語が登録された辞書ファイルを用いて、パスワード付ファイルに対して候補単語を入力し、パスワード解除済ファイルに対して、医師が行った所定の症状との関連性の判断結果を受け付ける。
本発明の一態様に係るデータ分析装置は、バイナリ形式の検索対象ファイルのデータを、複数のブロックに分割し、ブロックのデータを、バイナリ形式の検索先ファイルから検索し、検索された結果を出力する。
本発明の一態様に係るデータ分析装置は、調査対象となる対象デジタル情報を選択し、特定事項と関連性を有する複数の単語の組み合せを格納し、選択された対象デジタル情報の中に、格納されている複数の単語の組み合せが含まれているか否かを検索し、含まれている場合、形態素解析の結果に基づいて、対象デジタル情報の特定事項との関連性を判断し、判断結果を対象デジタル情報に対応づける。
本発明の一態様に係るデータ分析装置は、画像情報・音声情報から画像群・音声群を抽出し、画像群・音声群に分別符号を付与するために、医師から分別符号の入力を受け付け、画像群・音声群を分別符号ごとに分別し、分別された画像群・音声群において共通して出現するデータ要素を解析・選定し、選定したデータ要素を、画像情報・音声情報から探索し、探索した結果とデータ要素を解析した結果とを用いて、スコアを算出し、算出したスコアに基づいて、画像情報・音声情報に分別符号を付与し、スコアの算出結果および分別結果を画面に表示し、再現率と規格化順位との関係に基づいて、再確認に必要な画像数・音声数を算出する。
本発明の一態様に係るデータ分析装置は、データ要素データベースに、(1a)分別符号A、(1b)分別符号Aが付与されたデータに含まれるデータ要素、(1c)分別符号Aとデータ要素との対応関係を示すデータ要素対応情報が保存されており、関連データ要素データベースに、(2a)分別符号B、(2b)分別符号Bが付与されたデータにおいて出現頻度が高い関連データ要素、(2c)分別符号Bと関連データ要素との対応関係を示す関連データ要素対応情報が保存されており、上記(1c)のデータ要素対応情報に基づいて、上記(1b)のデータ要素を含むデータに対して分別符号Aを付与し、分別符号Aを付与しなかったデータから、上記(2b)の関連データ要素を含むデータを抽出し、関連データ要素の評価値・数に基づいてスコアを算出し、そのスコアと上記(2c)の関連データ要素対応情報に基づいて、スコアが一定値を超過したデータに分別符号Bを付与し、分別符号Bを付与しなかったデータに対して、医師から分別符号Cの付与を受け付け、分別符号Cを付与されたデータを解析し、解析した結果に基づいて、分別符号が付与されていないデータに対して分別符号Dを付与する。
本発明の一態様に係るデータ分析装置は、所定の症状との関連性を示すスコアをデータごとに算出する。算出したスコアに基づいて所定の順序でデータを抽出し、抽出されたデータに対して、医師が所定の症状との関連性に基づいて付与した分別符号を受け付け、分別符号に基づいて、抽出されたデータを分別符号ごとに分別し、分別されたデータにおいて、共通して出現するデータ要素を解析・選定し、選定したデータ要素をデータから探索し、探索結果と解析結果とを用いて、スコアをデータごとに再度算出する。
本発明の一態様に係るデータ分析装置は、調査基礎データベースに、所定の症状に関連する情報が格納されており、所定の症状のカテゴリの入力を受け付け、受け付けたカテゴリに基づいて、調査の対象とする調査カテゴリを判定し、調査基礎データベースから必要な情報の種類を抽出する。
本発明の一態様に係るデータ分析装置は、特定の行動を行った行動主体のネットワーク上のメッセージファイルの送受信履歴に基づいて作成された行動発生モデルを格納し、主体のネットワーク上のメッセージファイルの送受信履歴に基づいて、主体のプロファイル情報を作成し、プロファイル情報と行動発生モデルとの適合性を示すスコアを算出し、スコアに基づいて、特定の行動が発生する可能性を判定する。
本発明の一態様に係るデータ分析装置は、所定の症状に関して、案件ごとの分別作業結果を含む案件調査結果を収集し、所定の症状に関して調査するための調査モデルパラメータを登録し、新たな調査案件の調査内容が入力されると、登録された調査モデルパラメータを検索して、入力情報に関連した調査モデルパラメータを抽出し、抽出した調査モデルパラメータを用いて調査モデルの出力を行い、調査モデル出力結果から新たな調査案件の調査を実施するための事前情報を構成する。
本発明の一態様に係るデータ分析装置は、患者に関する患者情報を取得し、患者情報に基づいて、一定時間ごとに、更新されたデジタル情報を取得し、取得されたデジタル情報に関する、記録先情報、ファイル名、メタデータに基づいて、取得されたデジタル情報を構成する複数のファイルを、所定の保存場所に整理し、整理された複数のファイルの状況を、デジタル情報にアクセスした患者の状況が把握できるよう可視化した状況分布を作成する。
本発明の一態様に係るデータ分析装置は、デジタル情報に関連付けられているメタデータを取得し、特定事項と関係を有する第1デジタル情報とメタデータとの関係に基づいて、重みづけパラメーターセットを更新し、重みづけパラメーターセットを用いて、形態素とデジタル情報との関連性を更新する。
本発明の一態様に係るデータ分析装置は、対象データに対して手動で付与された分別符号を受け付け、対象データの関連性スコアを計算し、関連性スコアに基づいて、分別符号の正誤を判断し、正誤判断の結果に基づいて、対象データに付与すべき分別符号を決定する。
本発明の一態様に係るデータ分析装置は、所定の症状が属するカテゴリの入力を受け付け、受け付けたカテゴリに基づいて調査を行い、調査の結果を報告するための報告書を作成し、調査基礎データベースに、所定の症状に関連する情報を格納し、受け付けたカテゴリに基づいて、調査の対象とする調査カテゴリを判定し、必要な情報の種類を調査基礎データベースから抽出し、抽出した情報の種類を医師に提示し、提示された情報の種類に対応した、分別符号の付与に利用されるデータ要素の入力を、医師から受け付け、データに対して自動で分別符号を付与する。
本発明の一態様に係るデータ分析装置は、主体の公開情報を取得し、公開情報を分析し、主体の外的要素を出力し、特定の行動を行った行動主体の行動外的要素に基づいた行動発生モデルを格納し、主体の外的要素から行動発生モデルに適合する行動要因を抽出して格納し、主体の内部情報を取得し、内部情報を分析し、主体の内的要素を出力し、内的要素と行動要因との類似性に基づいて、解析対象を自動で特定する。
本発明の一態様に係るデータ分析装置は、デジタル情報と特定事項との関連性を示す関連性情報を、医師から取得し、デジタル情報と特定事項との関連に応じて決定される関連性スコアを、デジタル情報ごとに算出し、関連性スコアの所定の範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対して、その範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出し、各範囲のそれぞれに対応づけられた複数の区画を、比率に基づいて色相、明度、または彩度を変化させて表示する。
本発明の一態様に係るデータ分析装置は、データと分別符号との結びつきの強さを示すスコアを時系列的に算出し、算出されたスコアから、スコアの時系列的な変化を検出し、検出されたスコアの時系列的な変化を判定するに際し、所定の基準値を超えたスコアの変化した時期を判定した結果に基づいて、調査案件と抽出されたデータの関連度を調査判定する。
本発明の一態様に係るデータ分析装置は、特定事項と関連性を有するものであって、共起表現を含む複数のデータ要素に対応づけられる重み付け情報を格納し、デジタル情報にスコアを対応づけ、スコアに基づいて、デジタル情報から標本となる標本デジタル情報を抽出し、抽出された標本デジタル情報を解析することで、重み付け情報を更新する。
本発明の一態様に係るデータ分析装置は、複数のデータに含まれるそれぞれのデータを分類可能な指標であるカテゴリを選択し、スコアをカテゴリごとに算出する。
本発明の一態様に係るデータ分析装置は、所定の症状の原因となる、所定の行動主体による所定の行為を、当該所定の行為の進展に応じて分類するフェーズを、スコアに基づいて特定し、フェーズの時間的な遷移に基づいて、特定されたフェーズの変化を推定する。
本発明の一態様に係るデータ分析装置は、所定の症状の原因となる所定の行為が生じる生成過程モデルを、当該所定の行為の進展に応じて分類するフェーズごとに格納し、所定の症状に関連する情報を、カテゴリおよび生成過程モデルごとに格納し、フェーズの時間的な序列を示す時系列情報を格納し、これらの情報に基づいて画像情報・音声情報を分析し、所定の行為が生じる可能性を示す指標を分析した結果から算出する。
本発明の一態様に係るデータ分析装置は、所定の症状の原因となる所定の行為が生じる生成過程モデルを、当該所定の行為の進展に応じて分類するフェーズごとに格納し、所定の症状に関連する情報を、カテゴリおよび生成過程モデルごとに格納し、フェーズの時間的な序列を示す時系列情報を格納し、所定の症状に関連する複数の人物の関係性を格納し、これらの情報に基づいてデータを分析し、現在のフェーズを特定する。
本発明の一態様に係るデータ分析装置は、動作を表す動詞が音声に含まれる場合、動作の対象を表す目的語を特定し、動詞および目的語を含む音声の属性を示すメタデータと、その動詞および目的語とを関連付け、関連付けに基づいて、音声と症状との関係性を評価し、症状に関連する複数の人物の関係性を表示する。
本発明の一態様に係るデータ分析装置は、複数の端末間で送受信され、複数の人物のそれぞれに対応づけられる通信データを取得し、取得した通信データの内容を分析し、分析結果を用いて、通信データの内容と所定の症状との関係性を評価し、評価結果に基づいて、所定の症状に関連する複数の人物の関係性を表示する。
本発明の一態様に係るデータ分析装置は、データ群に含まれるデータが、データ群と所定の症状との関連度を示す分別符号と結びつく強さを示すスコアを算出し、算出されたスコアに応じて、そのスコアを医師に報告し、所定の症状の調査種類に応じて、調査レポートを出力する。
本発明の一態様に係るデータ分析装置は、機密度に対応付けて機密情報を記憶するデータベースを照会し、ネットワークの外部に対するアクセスによって機密情報が漏洩する危険性を示す漏洩度を算出し、機密度または漏洩度が、機密情報が漏洩する基準を満たすか否かを判定し、満たすと判定された場合、漏洩の主体を特定する。
本発明の一態様に係るデータ分析装置は、ある期間に含まれるビヘイビアの系列Aと、直近の期間に含まれるビヘイビアの系列Bとを比較することによって、系列Aと系列Bとの差異を抽出し、抽出された差異が、機密情報が漏洩する危険性が高まったことを示唆する基準に達したか否かを判定し、達したと判定された場合、管理者に危険性を報知する。
本発明の一態様に係るデータ分析装置は、データ(例えば、問診時の音声)に含まれるセンテンスに所定のデータ要素が含まれるか否かを示すデータ要素ベクトルを、センテンスごとに生成し、データ要素ベクトルを、所定のデータ要素と他のデータ要素との相関を示す相関マトリクスにそれぞれ乗じることによって、センテンスごとに相関ベクトルを得、全ての相関ベクトルについて合算した値に基づいて、スコアを算出する。
本発明の一態様に係るデータ分析装置は、所定の症状と関係するか否かが医師によって分別された分別データに含まれるデータ要素の重みづけを学習し、所定の症状と関係するか否かが医師によって未だ分別されていない未分別データから、分別データに含まれるデータ要素を探索し、探索されたデータ要素と学習されたデータ要素の重みづけを用いて、未分別データと分別符号との結びつきの強さを評価したスコアを算出する。
1:データ、1a:データ、1b:データ、5a:レビュー結果(医師によって判断された結果)、5d:スコア、5e:スコア、6:適合閾値(所定の閾値)、11:データ取得部、12:既判断データ取得部、13:要素評価部、14:スコア算出部、15:条件判定部(超過判定部)、16:関係性評価部、17:関係付与部、18:データ報知部、19:閾値特定部、100:データ分析装置

Claims (10)

  1. ヘルスケアデータに基いて、疾病の予測診断を可能とするためのデータ分析装置であって、
    ヘルスケアデータを記憶する記憶手段と、
    前記記憶手段から、所定の疾病に関係するか否かの医療判断が行われている既判断ヘルスケアデータを抽出する抽出手段と、
    前記既判断ヘルスケアデータに含まれる、複数のデータ要素夫々を評価する要素評価手段と、
    前記記憶手段から所定のヘルスケアデータを選択する選択手段と、
    前記選択されたヘルスケアデータに含まれるデータ要素を、前記要素評価手段の評価結果に基いて分析して、当該ヘルスケアデータのスコアを算出するスコア算出手段と、
    当該ヘルスケアデータを、前記算出されたスコアに基いて、前記所定の疾病に関係するか否か評価する関係性評価手段と、
    前記関係性評価手段の評価結果を報知する報知手段と、
    を備え
    前記抽出手段は複数の既判断ヘルスケアデータを抽出し、
    前記スコア算出手段は、前記複数の既判断ヘルスケアデータ夫々のスコアを算出し、
    前記関係性評価手段は、当該スコア算出手段が算出した複数のスコアのうち、適合率に対して設定された目標値を超過可能な所定のスコアを閾値として、当該閾値に基いて、前記所定の疾病に関係するか否かを評価する、
    データ分析装置。
  2. ヘルスケアデータに基いて、疾病の予測診断を可能とするためのデータ分析装置であって、
    ヘルスケアデータを記憶する記憶手段と、
    前記記憶手段から、所定の疾病に関係するか否かの医療判断が行われている既判断ヘルスケアデータを抽出する抽出手段と、
    前記既判断ヘルスケアデータに含まれる、複数のデータ要素夫々を評価する要素評価手段と、
    前記記憶手段から所定のヘルスケアデータを選択する選択手段と、
    前記選択されたヘルスケアデータに含まれるデータ要素を、前記要素評価手段の評価結果に基いて分析して、当該ヘルスケアデータのスコアを算出するスコア算出手段と、
    当該ヘルスケアデータを、前記算出されたスコアに基いて、前記所定の疾病に関係するか否か評価する関係性評価手段と、
    前記関係性評価手段の評価結果を報知する報知手段と、
    を備え、
    前記抽出手段は、時系列に沿って、複数の既判断ヘルスケアデータを抽出し、
    前記選択手段は、時系列に沿って、前記医療判断が行われていない、複数の未判断ヘル
    スケアデータを選択し、
    前記スコア算出手段は、
    前記複数の既判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記複数の未判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記関係性評価手段は、
    前者の移動平均と後者の移動平均との相関の高低を判定し、
    この判定に基づいて、前記複数の未判断ヘルスケアデータ夫々を、前記所定の疾病に関
    係するか否かを評価する
    データ分析装置。
  3. 前記抽出手段は、時系列に沿って、複数の既判断ヘルスケアデータを抽出し、
    前記選択手段は、時系列に沿って、前記医療判断が行われていない、複数の未判断ヘルスケアデータを選択し、
    前記スコア算出手段は、
    前記複数の既判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記複数の未判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記関係性評価手段は、
    前者の移動平均と後者の移動平均との相関の高低を判定し、
    この判定に基づいて、前記複数の未判断ヘルスケアデータ夫々を、前記所定の疾病に関係するか否かを評価する
    請求項1記載のデータ分析装置。
  4. 前記関係性評価手段によって評価された結果に基づいて、前記複数の未判断ヘルスケアデータ夫々に、前記所定の疾病に関係することを示す関係性情報を付与する関係付与手段をさらに備える請求項2又は3に記載のデータ分析装置。
  5. 前記記憶手段は、
    前記ヘルスケアデータとして、
    遺伝子解析データ、健康診断データのうちの少なくとも1つを含む構造化データ、及び/又は、問診データ、生活データ、患者の臨床データ、家族の病歴のうちの少なくとも1つを含む非構造化データを、を記憶する請求項1から4のいずれか一項に記載のデータ分析装置。
  6. ヘルスケアデータに基いて疾病の予測診断を可能とするために、データ分析装置が実行するデータ制御方法であって、
    前記データ分析装置は、
    ヘルスケアデータを記憶する記憶手段から、所定の疾病に関係するか否かの医療判断が行われている既判断ヘルスケアデータを抽出する抽出ステップと、
    前記既判断ヘルスケアデータに含まれる、複数のデータ要素夫々を評価する要素評価ステップと、
    前記記憶手段から所定のヘルスケアデータを選択する選択ステップと、
    前記選択されたヘルスケアデータに含まれるデータ要素を、前記要素評価ステップの評価結果に基いて分析して、当該ヘルスケアデータのスコアを算出するスコア算出ステップと、
    当該ヘルスケアデータを、前記算出されたスコアに基いて、前記所定の疾病に関係するか否か評価する関係性評価ステップと、
    前記関係性評価ステップの評価結果を報知する報知ステップと、
    を実行し、
    前記抽出ステップは複数の既判断ヘルスケアデータを抽出し、
    前記スコア算出ステップは、前記複数の既判断ヘルスケアデータ夫々のスコアを算出し、
    前記関係性評価ステップは、当該スコア算出ステップが算出した複数のスコアのうち、適合率に対して設定された目標値を超過可能な所定のスコアを閾値として、当該閾値に基いて、前記所定の疾病に関係するか否かを評価する、
    データ制御方法。
  7. ヘルスケアデータに基いて疾病の予測診断を可能とするために、データ分析装置が実行するデータ制御方法であって、
    前記データ分析装置は、
    ヘルスケアデータを記憶する記憶手段から、所定の疾病に関係するか否かの医療判断が行われている既判断ヘルスケアデータを抽出する抽出ステップと、
    前記既判断ヘルスケアデータに含まれる、複数のデータ要素夫々を評価する要素評価ステップと、
    前記記憶手段から所定のヘルスケアデータを選択する選択ステップと、
    前記選択されたヘルスケアデータに含まれるデータ要素を、前記要素評価ステップの評価結果に基いて分析して、当該ヘルスケアデータのスコアを算出するスコア算出ステップと、
    当該ヘルスケアデータを、前記算出されたスコアに基いて、前記所定の疾病に関係するか否か評価する関係性評価ステップと、
    前記関係性評価ステップの評価結果を報知する報知ステップと、
    を実行し、
    前記抽出ステップは、時系列に沿って、複数の既判断ヘルスケアデータを抽出し、
    前記選択ステップは、時系列に沿って、前記医療判断が行われていない、複数の未判断ヘルスケアデータを選択し、
    前記スコア算出ステップは、
    前記複数の既判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記複数の未判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記関係性評価ステップは、
    前者の移動平均と後者の移動平均との相関の高低を判定し、
    この判定に基づいて、前記複数の未判断ヘルスケアデータ夫々を、前記所定の疾病に関係するか否かを評価する、
    データ制御方法。
  8. ヘルスケアデータに基いて疾病の予測診断を可能とするためのプログラムであって、
    ヘルスケアデータを記憶する記憶手段から、所定の疾病に関係するか否かの医療判断が行われている既判断ヘルスケアデータを抽出する抽出機能と、
    前記既判断ヘルスケアデータに含まれる、複数のデータ要素夫々を評価する要素評価機能と、
    前記記憶手段から所定のヘルスケアデータを選択する選択機能と、
    前記選択されたヘルスケアデータに含まれるデータ要素を、前記要素評価機能の評価結果に基いて分析して、当該ヘルスケアデータのスコアを算出するスコア算出機能と、
    当該ヘルスケアデータを、前記算出されたスコアに基いて、前記所定の疾病に関係するか否か評価する関係性評価機能と、
    前記関係性評価機能の評価結果を報知する報知機能と、
    をコンピュータに実現させるためのプログラムであって、
    前記抽出機能は複数の既判断ヘルスケアデータを抽出し、
    前記スコア算出機能は、前記複数の既判断ヘルスケアデータ夫々のスコアを算出し、
    前記関係性評価機能は、当該スコア算出機能が算出した複数のスコアのうち、適合率に対して設定された目標値を超過可能な所定のスコアを閾値として、当該閾値に基いて、前記所定の疾病に関係するか否かを評価する、
    前記プログラム
  9. ヘルスケアデータに基いて疾病の予測診断を可能とするためのプログラムであって、
    ヘルスケアデータを記憶する記憶手段から、所定の疾病に関係するか否かの医療判断が行われている既判断ヘルスケアデータを抽出する抽出機能と、
    前記既判断ヘルスケアデータに含まれる、複数のデータ要素夫々を評価する要素評価機能と、
    前記記憶手段から所定のヘルスケアデータを選択する選択機能と、
    前記選択されたヘルスケアデータに含まれるデータ要素を、前記要素評価機能の評価結果に基いて分析して、当該ヘルスケアデータのスコアを算出するスコア算出機能と、
    当該ヘルスケアデータを、前記算出されたスコアに基いて、前記所定の疾病に関係するか否か評価する関係性評価機能と、
    前記関係性評価機能の評価結果を報知する報知機能と、
    をコンピュータに実現させるためのプログラムであって、
    前記抽出機能は、時系列に沿って、複数の既判断ヘルスケアデータを抽出し、
    前記選択機能は、時系列に沿って、前記医療判断が行われていない、複数の未判断ヘルスケアデータを選択し、
    前記スコア算出機能は、
    前記複数の既判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記複数の未判断ヘルスケアデータ夫々のスコアの移動平均を算出し、
    前記関係性評価機能は、
    前者の移動平均と後者の移動平均との相関の高低を判定し、
    この判定に基づいて、前記複数の未判断ヘルスケアデータ夫々を、前記所定の疾病に関
    係するか否かを評価する
    前記プログラム。
  10. 請求項8又は9記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2016532823A 2014-07-08 2014-07-08 データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム Active JP6379199B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/068214 WO2016006042A1 (ja) 2014-07-08 2014-07-08 データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2016006042A1 JPWO2016006042A1 (ja) 2017-06-29
JP6379199B2 true JP6379199B2 (ja) 2018-08-22

Family

ID=55063718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016532823A Active JP6379199B2 (ja) 2014-07-08 2014-07-08 データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム

Country Status (3)

Country Link
US (1) US20170154157A1 (ja)
JP (1) JP6379199B2 (ja)
WO (1) WO2016006042A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200106696A (ko) * 2019-03-05 2020-09-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보 제공 장치
KR20200106691A (ko) * 2019-03-05 2020-09-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보를 제공하는 사용자 단말기

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7046499B2 (ja) * 2017-04-18 2022-04-04 キヤノンメディカルシステムズ株式会社 医用情報処理装置及び医用情報処理方法
KR102099214B1 (ko) * 2018-01-29 2020-04-09 건양대학교 산학협력단 생체정보 및 영상정보 연계를 통한 인공지능 질환 진단 시스템
CN108596735A (zh) * 2018-04-28 2018-09-28 北京旷视科技有限公司 信息推送方法、装置及系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA73967C2 (en) * 2000-02-14 2005-10-17 First Opinion Corp Structure-based automatic processing for diagnostics (variants)
US6607482B1 (en) * 2000-11-28 2003-08-19 Jacob Teitelbaum Automated questionnaire for assisting in the diagnosis and treatment of medical problems and for data gathering, analysis and organization to make a complete medical history and illness record
US20090281838A1 (en) * 2008-05-07 2009-11-12 Lawrence A. Lynn Medical failure pattern search engine
WO2003071391A2 (en) * 2002-02-19 2003-08-28 Lexicor Medical Technology, Inc. Systems and methods for managing biological data and providing data interpretation tools
JP2003265417A (ja) * 2002-03-15 2003-09-24 Toto Ltd 生体情報管理システム
CN1701343A (zh) * 2002-09-20 2005-11-23 德克萨斯大学董事会 用于信息发现以及关联分析的计算机程序产品、系统以及方法
US20040103001A1 (en) * 2002-11-26 2004-05-27 Mazar Scott Thomas System and method for automatic diagnosis of patient health
US20040267565A1 (en) * 2002-12-17 2004-12-30 Grube James A Interactive system for tracking and improving health and well-being of users by targeted coaching
US20040122708A1 (en) * 2002-12-18 2004-06-24 Avinash Gopal B. Medical data analysis method and apparatus incorporating in vitro test data
JP2005202901A (ja) * 2004-01-15 2005-07-28 Mcbi:Kk 個人情報管理方法、健康管理方法、健康管理システム、金融資産管理方法及び金融資産管理システム
US9081879B2 (en) * 2004-10-22 2015-07-14 Clinical Decision Support, Llc Matrix interface for medical diagnostic and treatment advice system and method
JP4795666B2 (ja) * 2004-10-29 2011-10-19 株式会社東芝 健康管理支援装置および健康管理支援プログラム
JP2011147493A (ja) * 2010-01-19 2011-08-04 Omron Healthcare Co Ltd 生体情報監視装置、警報値設定方法および警報値設定プログラム
EP2612293A4 (en) * 2010-09-01 2016-05-04 Apixio Inc NAVIGATION ENGINE TYPE SYSTEM FOR MEDICAL INFORMATION (MINE)
JP2013191021A (ja) * 2012-03-14 2013-09-26 Seiko Epson Corp 健康診断情報提供装置及び健康診断情報提供方法
US9002769B2 (en) * 2012-07-03 2015-04-07 Siemens Aktiengesellschaft Method and system for supporting a clinical diagnosis
JP2013239192A (ja) * 2013-07-01 2013-11-28 Healthgrid Inc 生体情報の評価システム及び評価方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200106696A (ko) * 2019-03-05 2020-09-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보 제공 장치
KR20200106691A (ko) * 2019-03-05 2020-09-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보를 제공하는 사용자 단말기
KR102202865B1 (ko) 2019-03-05 2021-01-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보 제공 장치
KR102202864B1 (ko) 2019-03-05 2021-01-15 (주)비바이노베이션 빅데이터 분석 및 인공지능 문진을 통한 질병 예측 정보를 제공하는 사용자 단말기

Also Published As

Publication number Publication date
JPWO2016006042A1 (ja) 2017-06-29
US20170154157A1 (en) 2017-06-01
WO2016006042A1 (ja) 2016-01-14

Similar Documents

Publication Publication Date Title
JP5977898B1 (ja) 行動予測装置、行動予測装置の制御方法、および行動予測装置の制御プログラム
US11922348B2 (en) Generating final abnormality data for medical scans based on utilizing a set of sub-models
US11810671B2 (en) System and method for providing health information
US9861308B2 (en) Method and system for monitoring stress conditions
US20210366106A1 (en) System with confidence-based retroactive discrepancy flagging and methods for use therewith
US20120271612A1 (en) Predictive modeling
Baker et al. Continuous and automatic mortality risk prediction using vital signs in the intensive care unit: a hybrid neural network approach
JP6379199B2 (ja) データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム
US11527312B2 (en) Clinical report retrieval and/or comparison
US20190237200A1 (en) Recording medium recording similar case retrieval program, information processing apparatus, and similar case retrieval method
Attallah et al. Bayesian neural network approach for determining the risk of re-intervention after endovascular aortic aneurysm repair
Ekong et al. A Softcomputing Model for Depression Prediction.
Ketpupong et al. Applying text mining for classifying disease from symptoms
JP2020201697A (ja) 診断支援システム
JP2012033155A (ja) 健診データ処理方法、健診データ処理装置、及び、プログラム
US20230047826A1 (en) Context based performance benchmarking
Mishra Personalized functional health and fall risk prediction using electronic health records and in-home sensor data
Martín-Rodríguez et al. Use of Machine Learning Techniques for Predicting Heart Disease Risk from Phone Enquiries Data
Bilal et al. Using Machine Learning Models for The Prediction of Coronary Arteries Disease
Anjaiah et al. Health Disease Prediction Based On Symptoms Using Macchine Learning
WO2011045699A1 (en) Method and system for facilitating data entry for an information system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170706

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180730

R150 Certificate of patent or registration of utility model

Ref document number: 6379199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250