JP6748710B2 - データ分析システム、その制御方法、プログラム、及び、記録媒体 - Google Patents

データ分析システム、その制御方法、プログラム、及び、記録媒体 Download PDF

Info

Publication number
JP6748710B2
JP6748710B2 JP2018518059A JP2018518059A JP6748710B2 JP 6748710 B2 JP6748710 B2 JP 6748710B2 JP 2018518059 A JP2018518059 A JP 2018518059A JP 2018518059 A JP2018518059 A JP 2018518059A JP 6748710 B2 JP6748710 B2 JP 6748710B2
Authority
JP
Japan
Prior art keywords
data
evaluation
target data
analysis
evaluation items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018518059A
Other languages
English (en)
Other versions
JPWO2017199445A1 (ja
Inventor
公平 松本
公平 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fronteo Inc
Original Assignee
Fronteo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fronteo Inc filed Critical Fronteo Inc
Publication of JPWO2017199445A1 publication Critical patent/JPWO2017199445A1/ja
Application granted granted Critical
Publication of JP6748710B2 publication Critical patent/JP6748710B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、データを所定事案に基づいて分析するデータ分析システム等に関する。
近年、インシデントを予防することが様々な産業分野において重要視されている。実際に、医療分野でも、医療事故を防ぐために様々な方策が検討され、下記特許文献に示すように、インシデントレポートを記録し、医療事故や医療事故に繋がり得る危険な行為をインシデントレポートに基づいて管理して医療事故を未然に防止するためのシステムが開示されている。
特開2008−165680号公報 特許第3861986号公報 米国特許出願公開第2013/0144816号明細書 米国特許出願公開第2011/0295621号明細書
医療事故には、医師や看護士等の医療行為に起因する事故の他に、患者側の事情に起因する事故、例えば、患者の転倒が存在する。医師や看護士による医療行為の質を向上させることによって、前者の事故を極力防ぐようにはできるが、患者側の要因が大きい後者の事故を防ぐことはそもそも難しい。既述の従来例によって、患者側に事故が発生し得ることを予見できるにしても、事故を定量的に予測することは困難であった。したがって、従来の対策では、患者の行動を一律に規制する等大まかな対応しか講じ得なかったのが実情であった。そこで、本発明は、例えば、転倒等人に起因する事故や危険状態といった所定事案の発生を、精度よく予測可能なデータ分析技術を提供することを目的とする。
前記目的は、データを所定事案に基づいて分析するデータ分析システムであって、 データ分析の対象となる複数の対象データを記憶するメモリと、前記複数の対象データを評価するコントローラと、を備え、前記コントローラは、所定事案に関連する複数の評価項目を設定することと、前記複数の評価項目夫々との関連性に係る分類情報が設定された学習用データを評価することと、前記学習用データの評価結果に基づいて、前記複数の評価項目夫々について、前記対象データを評価することと、前記複数の評価項目毎の前記対象データの評価を入力として、所定の予測モデルに基づく分析を行うことと、前記分析の結果に基づいて前記所定事案の発生に関する予測情報を出力することとによって達成される。さらに、データ分析システムの制御方法、そのプログラム、及び、記録媒体が提供される。
既述の開示によって、所定事案の発生を、精度よく予測可能なデータ分析技術を提供することができる。
データ分析システムのハードウェア構成の一例を示すブロック図である。 データ分析システムの動作を示すフローチャートである。 ロジスティック回帰分析の目的変数(転倒の発生確率)が時系列に変化する特性を示したグラフである。
〔データ分析システムの構成〕
図1は、本実施の形態に係るデータ分析システム(以下、単に「システム」と略記することがある)のハードウェア構成の一例を示すブロック図である。当該システムは、例えば、データ(デジタルデータ、及び/又は、アナログデータを含む)を格納可能な任意の記録媒体(例えば、メモリ、ハードディスク等)と、当該記録媒体に格納された制御プログラムを実行可能なコントローラ(例えば、CPU;Central Processing Unit)とを備え、当該記録媒体に少なくとも一時的に格納されたデータを分析するコンピュータ、又は、コンピュータシステム(複数のコンピュータが統合的に動作することによってデータ分析を実現するシステム)として実現される。
本実施の形態において、「学習用データ」(training data)は、例えば、参照データとしてユーザに提示され、分類情報が対応付けられたデータ(分類済みの参照データ、参照データと分類情報との組み合わせ)であってよい。学習用データを、「教師データ」又は「トレーニングデータ」といってもよい。また、「評価対象データ」(evaluation data)は、当該分類情報が対応付けられていないデータ(参照データとしてユーザに提示されておらず、ユーザにとっては分類されていない未分類のデータ、「未知データ」といってもよい)であってよい。ここで、上記「分類情報」は、参照データを任意に分類するために用いる識別ラベルであってよく、例えば、参照データと所定事案(上記システムがデータとの関連性を評価する対象を広く含み、その範囲は制限されない)とが関係することを示す「Related」ラベルと、両者が関係しないことを示す「Non-Related」ラベルとのように、当該参照データを任意の数(例えば、2つ)のグループに分類する情報であってよい。
クライアント装置3は、データの一部を参照データとしてユーザに提示する。これにより、当該ユーザは、評価者(又は、ビューワ)として、クライアント装置3を介して参照データに対する評価・分類のための入力を行う(分類情報を与える)ことができる。サーバ装置2は、参照データと分類情報との組み合わせ(学習用データ)に基づいて、当該データからパターン(例えば、データに含まれる抽象的な規則、意味、概念、様式、分布、サンプルなどを広く指し、いわゆる「特定のパターン」に限定されない)を学習し、当該学習したパターンに基づいて、評価対象データと所定事案との関連性を評価する。
管理計算機6は、クライアント装置3、サーバ装置2、及び、ストレージシステム5に対して、所定の管理処理を実行する。ストレージシステム5は、例えば、ディスクアレイシステムから構成され、データと当該データに対する評価・分類の結果とを記録するデータベース4を備えてよい。サーバ装置2とストレージシステム5とは、DAS(Direct Attached Storage)方式、又は、SAN(Storage Area Network)によって通信可能に接続されている。
なお、図1に示されるハードウェア構成はあくまで例示に過ぎず、上記システムは、他のハードウェア構成によっても代替等されてもよい。例えば、サーバ装置2において実行される処理の一部、又は、全部がクライアント装置3において実行される構成であってもよいし、当該処理の一部または全部がサーバ装置2において実行される構成であってもよいし、ストレージシステム5がサーバ装置2に内蔵される構成であってもよい。また、ユーザは、クライアント装置3を介してサンプルデータに対する評価・分類のための入力を行う(分類情報を与える)だけでなく、サーバ装置2に直接接続された入力機器を介して上記入力を行うこともできる。当該システムを実現可能なハードウェア構成が多様に存在し得ることは、当業者に理解されるところであり、特定の1つの構成(例えば、図1に例示されるような構成)に限定されない。
〔データ評価機能〕
上記システムは、データ評価機能を備えることができる。当該データ評価機能は、人手で分類された少数のデータ(学習用データ)に基づいて、多数の評価対象データ(ビッグデータを含む)を評価するものである。当該データ評価機能を備えることにより、上記システムは、例えば、評価対象データと所定事案との関連性の高低を示す指標(例えば、評価対象データを序列化可能にする数値(例えば、スコア)、文字(例えば、「高」、「中」、「低」など)、及び//又は、記号(例えば、「◎」、「○」、「△」、「×」など)、を導出することによって、上記評価を実現することができる。データ評価機能は、サーバ装置2のコントローラによって実現される。
上記システムが上記評価のための指標としてスコアを導出する場合、当該システムは、当該スコアを任意の方法で算出することができる。例えば、機械学習、又は、自然言語処理の分野で用いられる各種の手法(例えば、K近傍法、サポートベクターマシンを用いた手法、ニューラルネットワークを用いた手法、データに対して統計モデルを仮定する手法(例えば、ガウス過程を用いた手法など)、及び/又は、これらを組み合わせた手法など)に基づいて当該スコアを算出してもよいし、統計学の分野で用いられる各種の手法に基づいて(例えば、構成要素がデータに現れる頻度に基づいて)算出してもよい。
「構成要素」(データ要素と呼んでもよい)は、データの少なくとも一部を構成する部分データであってよく、例えば、文書を構成する形態素、キーワード、センテンス、段落、及び/又は、メタデータ(例えば、電子メールのヘッダ情報)であったり、音声を構成する部分音声、ボリューム(ゲイン)情報、及び/又は、音色情報であったり、画像を構成する部分画像、部分画素、及び/又は、輝度情報であったり、映像を構成するフレーム画像、モーション情報、及び/又は、3次元情報であったりしてよい。
構成要素がデータに現れる頻度に基づいて上記システムが上記スコアを算出する場合、例えば、次のような算出方法が考えられる。先ず、上記システムは、学習用データから、当該学習用データを構成する構成要素を抽出し、当該構成要素を評価する。このとき、上記システムは、例えば、学習用データの少なくとも一部を構成する複数の構成要素が、データと分類情報との組み合わせに寄与する度合い(言い換えれば、当該構成要素が分類情報に応じて出現する頻度)をそれぞれ評価する。度合いを重みと言い換えてもよい。より具体的な一例として、上記システムは、伝達情報量(例えば、構成要素の出現確率と分類情報の出現確率とを用いて、所定の式から算出される情報量)を用いて構成要素を評価することによって、当該構成要素の評価情報としての評価値を、下記の数1に従い算出する。
ここで、wgtは、評価前のi番目の構成要素の評価値の初期値を示す。また、wgtは、L回目の評価後のi番目の構成要素の評価値を示す。γはL回目の評価における評価パラメータを意味し、θは評価の際の閾値を意味する。これにより、上記システムは、例えば、算出した伝達情報量の値が大きいほど、構成要素が所定の分類情報の特徴を表すものとして評価することができる。
次に、上記システムは、上記構成要素と評価値とを対応付け、両者を任意のメモリ(例えば、ストレージシステム5)に格納する。そして、上記システムは、評価対象データから構成要素を抽出し、当該構成要素が上記メモリに格納されているか否かを照会し、格納されている場合は、当該構成要素に対応付けられた評価値を当該メモリから読み出し、当該評価値に基づいて評価対象データを評価する。より具体的な一例として、上記システムは、評価対象データの少なくとも一部を構成する構成要素に対応付けられた評価値を用いて以下の式を計算することによって、上記スコアを算出することができる。
:i番目の構成要素の出現頻度、wgt:i番目の構成要素の評価値
サーバ装置2は、再現率が所定の目標値になるまで、構成要素の抽出、及び、評価を継続する(繰り返す)ことができるようにしてもよい。再現率とは、所定数のデータに対して発見すべきデータが占める割合(網羅性)を示す指標であり、例えば、全データの30%に対して再現率が80%である場合、所定事案に関係するとして、発見されるべきデータの80%が、指標(スコア)上位30%のデータの中に含まれていることを示す。データ分析システムを用いず、人がデータに総当たり(リニアレビュー)した場合、発見すべきデータの量は人がレビューした量に比例するため、この比例からの乖離が大きいほどシステムのデータ分析性能が良いことになる。
前述したデータ評価機能の実現例は、あくまでも一例に過ぎない。すなわち、当該データ評価機能は、「学習用データに基づいて評価対象データを評価する」という機能でありさえすれば、その具体的な態様は特定の1つの構成(例えば、前述したスコアの算出方法)に限定されない。
〔サーバ装置2による評価対象データの評価〕
サーバ装置2による評価対象データの評価動作を説明する。図2は、サーバ装置2(詳しくはサーバ装置2のコントローラ)のフローチャートである。サーバ装置2は、ストレージシステム5に記録された評価対象データの中から一つ又は複数のデータを参照データとして取得する(ステップS300:データ取得モジュール)。各ステップを、モジュール又は手段と言い換えることもできる。次に、サーバ装置2は、ユーザが参照データを実際にレビューして分類を決定し、ユーザによって参照データに対して入力された分類情報を、任意の入力装置から取得する(ステップS302:分類情報取得モジュール)。サーバ装置2は、参照データと分類情報とを組み合わせることによって学習用データを構成し(ステップ304:学習用データ構成モジュール)、学習用データから構成要素を抽出する(ステップS306:構成要素抽出モジュール)。そして、コントローラは、当該構成要素を評価し(ステップS308:構成要素評価モジュール)、当該構成要素と評価値とを対応付け、両者をストレージシステム5に格納する(ステップS310:構成要素格納モジュール)。上記S300〜S308の処理は、「学習フェーズ」(人工知能がパターンを学習するフェーズ)に対応する。なお、学習用データを、参照データから作成する代わりに、予め用意しておいてもよい。
次に、サーバ装置2は、ストレージシステム5から評価対象データを取得する(ステップS312:評価対象データ取得モジュール)。サーバ装置2は、さらに、ストレージシステム5から構成要素とその評価値とを読み出し、当該構成要素を評価対象データから抽出する(ステップS314:構成要素抽出モジュール)。サーバ装置2は、当該構成要素に対応付けられた評価値に基づいて評価対象データを評価して(ステップS316:評価対象データ評価モジュール)、複数の評価対象データの序列化情報(ランキング)を作成することができる。上位の評価対象データであるほど所定事案との関連性が高いことにある。ステップS312以降の処理が、既述の学習フェーズに対して、評価フェーズになる。なお、既述のフローチャートに含まれる各処理は、一例であって、限定される態様を示したものでないことに留意すべきである。
〔データ分析システムの動作例〕
次に、データ分析システムの動作例を、既述の所定事案を、医療インシデントとしての「患者の転倒」に基づいて説明する。データ分析システムは、患者の転倒を予測できる転倒予測モデルとして実現される。ストレージシステム5には、電子カルテが患者毎に記録されている。電子カルテの構造化データはデータベース4に記録されている。医師、看護師、臨床検査技師、薬剤師等の医療関係者は、診療、診察、診断、治療、処置、検査、又は、投薬の都度、クライアント装置3を介して電子カルテにアクセスして、必要な情報を記録する。このように、電子カルテは時系列に更新される。サーバ装置2は、時系列に電子カルテをストレージシステム5に記録する。例えば、5月1日午後8時の電子カルテ、5月2日午後8時の電子カルテの如く、電子カルテのトランザクションデータが構成される。
患者毎の電子カルテには、例えば、診断情報、治療情報、投薬情報、血圧・脈拍等のバイタルデータ、血液等の臨床分析データ)、医療関係者が把握した患者の症状・状態・状況、患者が医療関係者に申し立てた症状、医療関係者と患者との会話、等が記録されていてよい。
既述の参照データは、ストレージシステム5に記憶された電子カルテでよい。サーバ装置2は、ストレージシステム5から所定数の電子カルテを抽出し、これをクライアント装置3に提供する(図2のS300)。医療関係者は、クライアント装置3を介してサーバ装置2から、転倒に関する評価項目を取得する(S304)。転倒に関する評価項目として、発明者によって判明された、例えば、次のようなパラメータがある。
評価項目:傾眠、貧血、せん妄、易疲労、呼吸苦、嘔気嘔吐、痺れ、麻痺、排泄異常、ふらつき、食事摂取の不良、痛み、食止め日数
医療関係者はレヴューワとして、これら項目夫々について、電子カルテが関係するか、否かの分類情報を設定する。医療関係者に提供される評価項目は、既述のパラメータ全てである必要は必ずしもなく、医療関係者によって、転倒に関連するものとして選択された複数のものであってよい。既述のパラメータは、転倒に関して互いに独立性が高く、パラメータ数が多くなれば転倒の予測精度も向上される。したがって、評価項目として、複数のパラメータが選択されることがよい。
サーバ装置2は、複数の評価項目夫々について、電子カルテと分類情報の組としての学習用データを構成する(S304)。そして、サーバ装置2は、S306〜S310に沿って、複数の評価項目夫々について、構成要素とその評価値とを決定する。次いで、サーバ装置は、ストレージシステム5から、分類用データとしての電子カルテを取得し、複数の評価項目夫々について、スコアを算出する(S312〜S316)。
(例1)
電子カルテ(評価対象データ)に、下記の情報が記録されているケースでは、「せん妄」のスコアが高い値になり、嘔気嘔吐のスコアは比較的高い値になる。
「xxxx年xx月xx日
日々の観察:視線はどこかうつろ。時折辻褄の合わない発言もあり。
飲水、著明なむせはないが、飲水後咽頭付近にわずかに喘鳴聞かれる。」
(例2)
電子カルテに、下記の情報が記録されているケースでは、「傾眠」が高いスコアになる。
「眠気を訴える。家族の見舞い中にも、同様。」
(例3)
電子カルテに、下記の情報が記録されているケースでは、「易疲労」と「嘔気嘔吐」が共に高いスコアになり、「痺れ」が比較的高いスコアになる。
「今日はしんどそうですね
本人:「(頷いた後)夕方になるとしんどい。朝は楽なときもあるの。少し痺れも有るようなないような。夜間眠れないことによる影響、嘔気嘔吐による消耗。」
次に、サーバ装置2は、患者の転倒を予測するために、複数の電子カルテ(対象データ)夫々について、複数の評価項目毎の評価を入力として、所定の予測モデルに基づく分析を行う。好適な態様では、サーバ装置2は、所定の予測モデルとしてロジスティック回帰分析を利用し、複数の電子カルテ夫々について、複数の評価項目毎のスコアを計算すると、複数の項目毎のスコアを説明変数として、下記数式に基づいてロジスティック回帰分析を実施し、目的変数である転倒なし(0)、転倒あり(1)に基づいて、転倒の発生確率(転倒の発生予測)を演算する。
β0i,β1i,・・・・βkiは回帰係数であり、予め、電子カルテの過去データを利用して、最小2乗法によって算出されていればよい。x0i,x1i,・・・・xkiは、説明変数であって、夫々に各評価項目のスコアが代入される。piは、目的変数(転倒の発生確率)である。サーバ装置2は、piを時系列に記録し、転倒の発生確率の時間的な変化、例えば、現在得られた転倒の発生確率が、所定の閾値を越えた場合、或いは、所定日数(例えば、7日間)の移動平均からプラス側に乖離(乖離率が、例えば、25%)した場合に、患者が転倒する虞があるとして、これを医療関係者の電子機器(パソコン、スマートフォン等)に通知することができる。図3は、目的変数(転倒の発生確率)が時系列に変化する特性を示したグラフであり、矢印に示す時点で、サーバ装置2は、医療関係者に、電子カルテに対応する患者に転倒の発生が起こり得ることを通知する。
実際に転倒が発生したケースでは、転倒が発生した日のから所定日数前から項目に変化が現れることが判っている。そこで、実際に転倒が発生した日を含む3日前の電子カルテのロジスティック回帰分析において、目的変数(pi)のフラグに「1」を設定して回帰係数を最適化する。そして、最適化された回帰係数に基づいて、現在の電子カルテに対してロジスティック回帰分析を行うこと依って、所定日数(例えば、3日)以内に転倒する確率が目的変数として算出される。したがって、サーバ装置2がロジスティック回帰分析を行うことによって得られた目的変数は、所定日数以内に患者が転倒する確率を示している。このように、ある程度幅を持って、転倒の発生確率が得られるため、医療関係者にとっても、患者にとっても、転倒に対する備えを行い易いという利点がある。
バイタルデータ、検査結果等の数値データも転倒の発生に関係があることが判っている。例えば、血圧、脈拍、体温、経皮的動脈血酸素飽和度 (SPO2)、食事摂取量、及び、疼痛NRS指標等の数値データ(患者から測定された医療データ)のアノマリーが、転倒の発生に深く関与していることが判っている。したがって、これらの数値データの一つ又は複数を説明変数として、ロジスティック回帰分析に適用することが、転倒の発生予測には効果的である。さらに、薬歴データ(薬剤名、薬効、用量、用法、服薬期間、副作用など)も同様に効果的である。例えば、睡眠導入剤、精神安定剤の服用は、転倒の発生に関係がある。
データ分析システム1によれば、患者側の行動に起因する転倒の発生を、所定の期間内での発生確率として出力するために、転倒の発生が効果的に予測でき、医療関係者や患者にとっても転倒に対する事前対応がし易いという効果が達成される。データ分析システム1によれば、患者の転倒に加えて、患者の転落等患者側の行動や事情による事故、危険行為の発生を予測することができる。さらに、データ分析システム1によれば、医療分野に限らず、運送、建築、土木、製品製造等他の産業分野におけるオペレータやドライバー等の人の行動や事情による事故、危険行為の発生を予測することができる。
既述の説明では、データ分析システムは、ロジスティック回帰分析のために、電子カルテから回帰に寄与する情報を、スコアとして予測符号化の処理によって取得したが、これを次のように変更してもよい。即ち、データ分析システムは、人口知能に辞書を搭載し、電子カルテ(対象データ)のテキストデータを辞書で分析、各項目に関連するテキストがあればフラグを設定する。例えば、電子カルテに“貧血”があれば貧血フラグをセットする。データ分析システムは、複数の評価項目夫々のフラグを説明変数として、ロジスティック回帰分析に適用する。複数の評価項目夫々のフラグは、電子カルテへの情報記録の際に、医師、看護士によってセットされるようにしてもよい。
転倒予測モデルにロジスティック回帰分析を適用することを説明したが、SVM(サポートベクターマシン)、決定木学習等に置換してもよい。既述の説明では、インシデントとして、患者の転倒を説明したが、これに限られず、患者の発作、患者の俳諧、患者の意識消失等、医師や看護士の医療行為に直接関連しない、患者側の異常行動が、データ分析によって予測可能である。
ロジスティック回帰分析のための説明変数に期間を設けるようにしてもよい。例えば、説明変数を5とし、3日のラグを設けるとすると、次のようになる。
5月1日のカルテを入力として5つの評価項目に対して夫々スコアを取得し、
5月2日のカルテを入力として5つの評価項目に対して夫々スコアを取得し、
5月3日のカルテを入力として5つの評価項目に対して夫々スコアを取得し、
5月3日に5つのスコアの3組を並列に繋いで15次元の説明変数に基づいてロジスティック回帰分析を行う。
この態様によれば、期間中の説明変数の変動を纏めて回帰分析に適用できるために、この期間の患者の総合的な体調変化を転倒の予測に反映させることができる。
〔データ分析システムが処理するデータ形式〕
本実施の形態において、「データ」は、コンピュータによって処理可能となる形式で表現された任意のデータであってよい。上記データは、例えば、少なくとも一部において構造定義が不完全な非構造化データであってよく、自然言語によって記述された文章を少なくとも一部に含む文書データ(例えば、電子メール(添付ファイル・ヘッダ情報を含む)、技術文書(例えば、学術論文、特許公報、製品仕様書、設計図など、技術的事項を説明する文書を広く含む)、プレゼンテーション資料、表計算資料、決算報告書、打ち合わせ資料、報告書、営業資料、契約書、組織図、事業計画書、企業分析情報、電子カルテ、ウェブページ、ブログ、ソーシャルネットワークサービスに投稿されたコメントなど)、音声データ(例えば、会話・音楽などを録音したデータ)、画像データ(例えば、複数の画素またはベクター情報から構成されるデータ)、映像データ(例えば、複数のフレーム画像から構成されるデータ)などを広く含む(これらの例に限定されない)。
例えば、文書データを分析する場合、上記システムは、学習用データとしての文書データに含まれる形態素を構成要素として抽出し、当該構成要素をそれぞれ評価し、評価用データとしての文書データから抽出した構成要素に基づいて、当該文書データと所定事案との関連性を評価することができる。また、音声データを分析する場合、上記システムは、当該音声データ自体を分析の対象としてもよいし、音声認識により当該音声データを文書データに変換し、変換後の文書データを分析の対象としてもよい。前者の場合、上記システムは、例えば、音声データを所定の長さの部分音声に分割して構成要素とし、任意の音声分析手法(例えば、隠れマルコフモデル、カルマンフィルタなど)を用いて当該部分音声を識別することによって、当該音声データを分析できる。後者の場合、任意の音声認識アルゴリズム(例えば、隠れマルコフモデルを用いた認識方法など)を用いて音声を認識し、認識後のデータ(文書データ)に対して、前述した手順と同様の手順で分析できる。また、画像データを分析する場合、上記システムは、例えば、画像データを所定の大きさの部分画像に分割して構成要素とし、任意の画像認識手法(例えば、パターンマッチング、サポートベクターマシン、ニューラルネットワークなど)を用いて当該部分画像を識別することによって、当該画像データを分析できる。さらに、映像データを分析する場合、上記システムは、例えば、映像データに含まれる複数のフレーム画像を所定の大きさの部分画像にそれぞれ分割して構成要素とし、任意の画像認識手法(例えば、パターンマッチング、サポートベクターマシン、ニューラルネットワークなど)を用いて当該部分画像を識別することによって、当該映像データを分析できる。
〔ソフトウェア・ハードウェアによる実現例〕
上記システムの制御ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPUを用いてソフトウェアによって実現してもよい。後者の場合、上記システムは、各機能を実現するソフトウェアであるプログラム(データ分析システムの制御プログラム)を実行するCPU、当該プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、当該プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、当該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。なお、上記プログラムは、任意のプログラミング言語によって実装可能である。また、上記プログラムを記録した任意の記録媒体も、本発明の範疇に入る。
〔他のアプリケーション例〕
上記システムは、上記〔データ分析システムの動作例〕で説明した転倒予測システムとしてだけではなく、例えば、ディスカバリー支援システム、フォレンジックシステム、電子メール監視システム、医療応用システム(例えば、ファーマコビジランス支援システム、治験効率化システム、医療リスクヘッジシステム、予後予測システム、診断支援システムなど)、インターネット応用システム(例えば、スマートメールシステム、情報アグリゲーション(キュレーション)システム、ユーザ監視システム、ソーシャルメディア運営システムなど)、情報漏洩検知システム、プロジェクト評価システム、マーケティング支援システム、知財評価システム、不正取引監視システム、コールセンターエスカレーションシステム、信用調査システムなど、ビッグデータを分析する人工知能システム(データと所定事案との関連性を評価可能な任意のシステム)として実現され得る。例えば、上記システムがディスカバリー支援システムとして実現される場合、所定事案は「訴訟」であり、フォレンジックシステムとして実現される場合、所定事案は「不正な事件」(犯罪)である。その他のシステムとして実現される場合、所定事案は当該システムが実現される分野に応じる。なお、本発明のデータ分析システムが応用される分野によっては、当該分野に特有の事情を考慮して、例えば、データに前処理(例えば、当該データから重要箇所を抜き出し、当該重要箇所のみをデータ分析の対象とするなど)を施したり、データ分析の結果を表示する態様を変化させたりしてよい。こうした変形例が多様に存在し得ることは、当業者に理解されるところであり、すべての変形例が本発明の範疇に入る。
本発明は上述したそれぞれの実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施の形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施の形態についても、本発明の技術的範囲に含まれる。さらに、各実施の形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成できる。
1……データ分析システム、2……サーバ装置、3……クライアント装置、4……データベース、5……ストレージシステム、6……管理計算機

Claims (9)

  1. データを所定事案に基づいて分析するデータ分析システムであって、
    データ分析の対象となる複数の対象データを記憶するメモリと、
    前記複数の対象データを評価するコントローラと、
    を備え、
    前記コントローラは、
    所定事案に関連する複数の評価項目を設定することと、
    前記対象データの評価のために参照される参照データと前記複数の評価項目夫々について前記参照データに設定された分類情報との組合せから成る学習用データの評価として、前記参照データの構成要素が前記組合せに寄与する度合いを評価することと、
    前記構成要素の評価結果に基づいて、前記複数の評価項目夫々について、前記複数の評価項目夫々と前記対象データとの関連性をスコアとして算出することによって前記対象データを評価することと、
    前記複数の評価項目毎の前記対象データの評価を入力として、所定の予測モデルに基づく分析を行うことと、
    前記分析の結果に基づいて前記所定事案の発生に関する予測情報を出力することと、
    を備えるデータ分析システム。
  2. 前記コントローラは、
    前記対象データから前記所定事案に関連する数値データを抽出することと、
    前記分析を前記対象データの評価に加えて前記数値データに基づいて行うことと、
    を備える請求項1記載のデータ分析システム。
  3. 前記コントローラは、
    前記分析を行うことが、前記複数の評価項目毎の前記対象データのスコアを説明変数として、ロジスティック回帰分析に適用することを含むようにすることと、
    前記予測情報を出力することが、前記ロジスティック回帰分析によって前記所定事案の発生確率を出力することを含むようにすることと、
    をさらに備える請求項1または2記載のデータ分析システム。
  4. 前記コントローラは、
    前記メモリから前記対象データとしての電子カルテを取得することと、
    前記予測情報に前記所定事案としての患者の転倒が発生する確率を含むようにすることと、
    をさらに備える請求項1乃至3の何れか1項記載のデータ分析システム。
  5. 前記複数の評価項目に、患者の転倒に関連するパラメータを含むようにすることと、
    前記数値データに、患者から測定された医療データを含むようにすることと、
    をさらに備える請求項2記載のデータ分析システム。
  6. 前記コントローラは、
    前記ロジスティック回帰分析によって前記発生確率を出力することが、前記所定事案が所定期間内に発生する確率を出力することを含むようにすること、
    をさらに備える請求項3記載のデータ分析システム。
  7. データを所定事案に基づいて分析するデータ分析システムの制御方法であって、
    前記データ分析システムが、
    データ分析の対象となる複数の対象データを記憶するステップと、
    所定事案に関連する複数の評価項目を設定するステップと、
    前記対象データの評価のために参照される参照データと前記複数の評価項目夫々について前記参照データに設定された分類情報との組合せから成る学習用データの評価として、前記参照データの構成要素が前記組合せに寄与する度合いを評価するステップと、
    前記構成要素の評価結果に基づいて、前記複数の評価項目夫々について、前記複数の評価項目夫々と前記対象データとの関連性をスコアとして算出することによって前記対象データを評価するステップと、
    前記複数の評価項目毎の前記対象データの評価を入力として、所定の予測モデルに基づく分析を行うステップと、
    前記分析の結果に基づいて前記所定事案の発生に関する予測情報を出力するステップと、
    実行するデータ分析システムの制御方法。
  8. データを所定事案に基づいて分析することをコンピュータに実行させるプログラムであって、
    データ分析の対象となる複数の対象データを記憶する機能と、
    所定事案に関連する複数の評価項目を設定する機能と、
    前記対象データの評価のために参照される参照データと前記複数の評価項目夫々について前記参照データに設定された分類情報との組合せから成る学習用データの評価として、前記参照データの構成要素が前記組合せに寄与する度合いを評価する機能と、
    前記構成要素の評価結果に基づいて、前記複数の評価項目夫々について、前記複数の評価項目夫々と前記対象データとの関連性をスコアとして算出することによって前記対象データを評価する機能と、
    前記複数の評価項目毎の前記対象データの評価を入力として、所定の予測モデルに基づく分析を行う機能と、
    前記分析の結果に基づいて前記所定事案の発生に関する予測情報を出力する機能と、
    をコンピュータに実現させるためのプログラム。
  9. 請求項8記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2018518059A 2016-05-20 2016-05-20 データ分析システム、その制御方法、プログラム、及び、記録媒体 Active JP6748710B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/065096 WO2017199445A1 (ja) 2016-05-20 2016-05-20 データ分析システム、その制御方法、プログラム、及び、記録媒体

Publications (2)

Publication Number Publication Date
JPWO2017199445A1 JPWO2017199445A1 (ja) 2019-03-28
JP6748710B2 true JP6748710B2 (ja) 2020-09-02

Family

ID=60326349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018518059A Active JP6748710B2 (ja) 2016-05-20 2016-05-20 データ分析システム、その制御方法、プログラム、及び、記録媒体

Country Status (2)

Country Link
JP (1) JP6748710B2 (ja)
WO (1) WO2017199445A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6652986B2 (ja) * 2018-05-02 2020-02-26 株式会社Fronteo 危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム
JP6915809B2 (ja) * 2018-05-02 2021-08-04 株式会社Fronteo 事象予測装置、予測モデル生成装置および事象予測用プログラム
JP6748769B1 (ja) * 2019-09-06 2020-09-02 株式会社ビデオリサーチ 顧客推定装置及び顧客推定方法
JP6826652B1 (ja) * 2019-12-27 2021-02-03 株式会社ビデオリサーチ 顧客推定装置及び顧客推定方法
CN111144658B (zh) * 2019-12-30 2023-06-16 医渡云(北京)技术有限公司 医疗风险预测方法、装置、系统、存储介质与电子设备
JP6945019B2 (ja) * 2020-01-27 2021-10-06 株式会社ビデオリサーチ 顧客推定装置及び顧客推定方法
JP2021117757A (ja) * 2020-01-27 2021-08-10 株式会社ビデオリサーチ 顧客推定装置及び顧客推定方法
JP7466865B2 (ja) 2020-08-07 2024-04-15 公立大学法人名古屋市立大学 自己抜去発生予測装置、自己抜去発生予測方法、プログラム、転倒転落発生予測装置、転倒転落発生予測方法および医療安全性向上支援方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5833068B2 (ja) * 2013-09-03 2015-12-16 株式会社東芝 系列データ分析装置及プログラム
JP2015194974A (ja) * 2014-03-31 2015-11-05 株式会社東芝 在宅・訪問メディカルサービスシステム

Also Published As

Publication number Publication date
WO2017199445A1 (ja) 2017-11-23
JPWO2017199445A1 (ja) 2019-03-28

Similar Documents

Publication Publication Date Title
JP6748710B2 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
US11301774B2 (en) System and method for multi-modal graph-based personalization
US10204153B2 (en) Data analysis system, data analysis method, data analysis program, and storage medium
Kaklauskas et al. Intelligent decision support systems
Redelico et al. Classification of normal and pre-ictal eeg signals using permutation entropies and a generalized linear model as a classifier
US20140279760A1 (en) Data Analysis Computer System and Method For Conversion Of Predictive Models To Equivalent Ones
Mittal et al. Opinion mining for the tweets in healthcare sector using fuzzy association rule
WO2016203652A1 (ja) データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
Mohanty et al. Machine learning for healthcare applications
Bhadra et al. Enhancing the efficacy of depression detection system using optimal feature selection from EHR
Lei et al. An improved cell situation identification approach with convolutional neural network and wavelet extreme learning machine
JP5933863B1 (ja) データ分析システム、制御方法、制御プログラム、および記録媒体
WO2016189605A1 (ja) データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
Kaur et al. A brief review of machine learning methods used in mental health research
US11232325B2 (en) Data analysis system, method for controlling data analysis system, and recording medium
JP6026036B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
Sharon et al. Application of intelligent edge computing and machine learning algorithms in MBTI personality prediction
WO2022020646A1 (en) Model-based evaluation of assessment questions, assessment answers, and patient data to detect conditions
Mallya et al. Framework for automatic diagnosis of psychological disorders
Tang et al. Analysis and evaluation of explainable artificial intelligence on suicide risk assessment
Park et al. Algorithmic fairness and AI justice in addressing health equity
Lindsay et al. Classification of health risk factors to predict the risk of falling in older adults
Beluzo et al. Machine Learning for Neonatal Mortality Risk Assessment: A Case Study Using Public Health Data from São Paulo
Santos et al. Predicting diabetic retinopathy stage using Siamese Convolutional Neural Network
Regulwar et al. Big Data Collection, Filtering, and Extraction of Features

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20181203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20181203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190514

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190514

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200807

R150 Certificate of patent or registration of utility model

Ref document number: 6748710

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250