JP7269122B2 - データ分析装置、データ分析方法及びデータ分析プログラム - Google Patents

データ分析装置、データ分析方法及びデータ分析プログラム Download PDF

Info

Publication number
JP7269122B2
JP7269122B2 JP2019132543A JP2019132543A JP7269122B2 JP 7269122 B2 JP7269122 B2 JP 7269122B2 JP 2019132543 A JP2019132543 A JP 2019132543A JP 2019132543 A JP2019132543 A JP 2019132543A JP 7269122 B2 JP7269122 B2 JP 7269122B2
Authority
JP
Japan
Prior art keywords
data
model
ensemble
analysis
data analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019132543A
Other languages
English (en)
Other versions
JP2021018508A (ja
JP2021018508A5 (ja
Inventor
大輔 福井
弘充 中川
毅 田中
佑子 佐野
賢稔 三宅
伸也 堀越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi High Tech Corp
Original Assignee
Hitachi High Tech Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2019132543A priority Critical patent/JP7269122B2/ja
Application filed by Hitachi High Tech Corp filed Critical Hitachi High Tech Corp
Priority to US17/621,884 priority patent/US20220246302A1/en
Priority to PCT/JP2020/024353 priority patent/WO2021010093A1/ja
Priority to CN202080048103.9A priority patent/CN114041152A/zh
Priority to EP20841123.1A priority patent/EP4002232A4/en
Priority to TW109122708A priority patent/TWI755782B/zh
Publication of JP2021018508A publication Critical patent/JP2021018508A/ja
Publication of JP2021018508A5 publication Critical patent/JP2021018508A5/ja
Application granted granted Critical
Publication of JP7269122B2 publication Critical patent/JP7269122B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/112Gait analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0059Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
    • A61B5/0077Devices for viewing the surface of the body, e.g. camera, magnifying lens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1121Determining geometric values, e.g. centre of rotation or angular range of movement
    • A61B5/1122Determining geometric values, e.g. centre of rotation or angular range of movement of movement trajectories
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2562/00Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
    • A61B2562/02Details of sensors specially adapted for in-vivo measurements
    • A61B2562/0219Inertial sensors, e.g. accelerometers, gyroscopes, tilt switches
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation

Description

本発明は、データ分析装置、データ分析方法及びデータ分析プログラムに関する。
人が自分の身体を自由に動かすには、骨、関節、筋肉や神経で構成される運動器が正常に機能する必要がある。ロコモディブシンドローム(運動器症候群、「ロコモ」)は運動器のいずれかあるいは複数に障害が起こり、立つ、歩く、走る、座るといった移動機能が低下している状態をいう。このような移動機能の低下が進行すると日常生活にも支障が生じるようになる。入院治療が必要になるような運動器障害は50歳以降に多発しているといわれており、高齢での運動器障害は支援や介護が必要になるリスクにつながる。運動器障害は徐々に進行するため、ロコモの予防、早期の発見、適切な対処の必要性が認識されている。特許文献1には、被計測者の歩行状態を計測し、その計測結果より特徴量データを算出し、算出した特徴量データ及び分析モデルを用いて被計測者の歩行態様の分析を行う歩行態様分析装置が開示されている。
特許文献2では、予測モデルを構築するにあたり、入力されたデータに対する前処理、ハイパーパラメータに基づくデータの学習方法などについての候補があらかじめ設定されており、それらの候補の組み合わせ(パイプラインという)の中から、より予測精度の高い予測モデルを構築可能なパイプラインを選択する。候補が増加してもパイプラインの探索に要する時間が増加しないよう、学習データから所定の比率で抽出したサンプルデータを用いて探索を行い、処理時間の制限時間を超えない限りにおいてサンプルデータの抽出比率を増大させ、予測モデルの予測精度が高くなる組み合わせを探索する。
特許第6509406号公報 特開2018-190130号公報
人の移動機能の低下は歩行障害として表れる。このため、ロコモの早期発見、改善を進める人の歩行状態を把握し、対象者に分かりやすく伝えることが有効である。さらに、運動器障害の予防あるいは早期発見の観点からは、特許文献1に開示されるような分析装置を医療機関のみならず、フィットネスジムなどに設置し、運動器障害について自覚のない被計測者であっても、気軽に自己の歩行状態について気づきを得ることができるようになることが望ましい。
しかしながら、歩行態様の分析を精密に、正確に実施しようとするほど、分析に使用する特徴量データの数は膨大になり、特徴量データの算出、特徴量データを用いた分析に要する時間も増大する。分析結果を得るために長い待ち時間が生じてしまうと、運動器障害について自覚のない被計測者から敬遠されることになりかねない。特に、被計測者にとって身近な場所に設置しようとすると、一般に普及しているPC(Personal Computer)などによって特徴量データの算出、歩行状態の分析を行うことが望ましく、特別に演算能力の高い計算機を用いることを前提とすることはできない。
特許文献2は、予測モデル構築のためのパイプライン選択の探索時間を短縮することについて開示するものであるが、予測モデルを用いた分析そのものに要する時間については言及されていない。
本発明の一実施態様であるデータ分析装置は、第1~第nのモデルによる推論を統合して推論を行うアンサンブルモデルを用いてデータ分析を行うデータ分析装置であって、プロセッサと、メモリと、ストレージと、メモリに読み込まれ、プロセッサにより実行されるデータ分析プログラムとを有し、ストレージはそれぞれ1以上のモデルを含む第1~第nのモデル群が登録されたモデルデータを格納し、アンサンブルモデルを構成する第iのモデル(1≦i≦n)は、モデルデータの第iのモデル群から選択され、第1~第nのモデル群の少なくとも1つのモデル群は複数のモデルを含んでおり、データ分析プログラムは、データ分析に対する性能要件とデータ分析に要する時間に対する制約要件とを満たすアンサンブルモデルを構成可能な第1~第nのモデルの選択肢を、それぞれ第1~第nのモデル群から提示するアンサンブルモデル作成処理部と、提示された第1~第nのモデルの選択肢の選択を受けて、選択された第1~第nのモデルを使用したアンサンブルモデルによる推論を行うアンサンブル分析処理部とを有する。
アンサンブルモデルを用いた分析において、アンサンブルモデルの予測精度と分析時間との調和を図る。
その他の課題と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
データ分析システムのハードウェア構成である。 データ分析システムのソフトウェア構成である。 アンサンブルモデルの概念図である。 分析設定データの例である。 ドメイン知識データの例である。 被計測者の歩行態様を分析する処理フローである。 計測データのデータ構造である。 特徴量データのデータ構造である。 予測結果データのデータ構造である。 モデル(弱識別機)の評価フローである。 モデルデータのデータ構造である。 モデル(弱識別機)の選択、及び算出する特徴量の選択フローである。 アンサンブルモデル決定フローである。 アンサンブルモデルデータのデータ構造である。 選択特徴量データのデータ構造である。
図1に歩行者の歩行態様を分析するデータ分析システム110のハードウェア構成を示す。データ分析システム110は、被計測者の歩行を計測するためのセンサ111と、センサ111を用いて被計測者の歩行を計測し、その計測結果より歩行態様の分析を行うデータ分析装置100を有している。
データ分析装置100は、CPU(Central Processing Unit)101、入力I/F(Interface)102、出力I/F103、メモリ104、ストレージ105、I/Oポート106を備え、それらが内部バス107により結合された、汎用計算機として実現可能な情報処理装置である。入力I/F102は、キーボードやマウス等の入力装置に接続され、また出力I/F103は、ディスプレイやプリンタに接続され、操作者に対するGUI(Graphical User Interface)を実現する。ストレージ105は通常、HDD、SSDやROM、フラッシュメモリなどの不揮発性メモリで構成され、データ分析装置100が実行するプログラムやプログラムが処理対象とするデータ等を記憶する。メモリ104はRAM(Random Access Memory)で構成され、CPU101の命令により、プログラムやプログラムの実行に必要なデータ等を一時的に記憶する。CPU101は、ストレージ105からメモリ104にロードしたプログラムを実行する。
データ分析装置100は、センサ111に対してセンシングデータの収集命令を出し、センサ111はこれに応じて被計測者の歩行についてセンシングを行い、計測結果をデータ分析装置100に送信する。センサ111としてはTOF(Time of Flight)方式による距離センサを用いることができる。被計測者の歩行態様を捉えるには、被計測者の歩行中における身体の計測点(関節等)の3次元空間における動き(軌跡)を計測する必要があり、距離センサは、3次元空間における計測点の座標を直接的に求めることができる利点を有している。なお、距離センサに限らず、センサ111をビデオカメラとし、ビデオカメラにより歩行中の計測者を撮影した映像から画像解析を行ってもよいし、加速度センサ、角度センサ、ジャイロセンサのようなセンサを用いてもよい。複数種類のセンサを用いることも可能である。
図2はデータ分析システム110のソフトウェア構成であり、データ分析装置100において実行されるプログラムとその関係を示している。データ分析プログラム200は、歩行を計測し、その計測結果より歩行態様を分析する機能を有する。ユーザ入出力処理部201は、操作者が、各モジュール202~207に指示や情報を入力するインタフェースプログラムである。モジュール202~207は、歩行を計測、あるいは歩行態様の分析に関する機能を実行するプログラムであり、その内容については後述する。データベースプログラム210は、データ分析システム110に必要な計測データや分析モデルを、ストレージ105に格納し、管理する機能を有する。
本実施例では、歩行態様の分析を、アンサンブルモデルを用いて行う。アンサンブルモデルは、複数のモデル(弱識別機)による推論を統合して1つの推論を行うモデルである。図3に、本実施例に適用されるアンサンブルモデルの概念図を示す。アンサンブルモデル300は、被計測者の歩行が健常歩行であるか否かを判定する健常歩行モデル、被計測者の歩行が異常歩行1であるか否かを判定する第1の異常歩行モデル、被計測者の歩行が異常歩行2であるか否かを判定する第2の異常歩行モデルの3つのモデル(弱識別機)の判定結果を統合して、被計測者の歩行が健常であるかどうかを判定する。異常歩行1,2は、それぞれ歩行障害とされる特定の歩行状態である。アンサンブルモデル300は、第1の異常歩行モデルの出力する異常度1(異常歩行1である確率)と第2の異常歩行モデルの出力する異常度2(異常歩行2である確率)とを比較して、大きな方を最大異常度(何らかの異常歩行である確率)とし、最大異常度と健常歩行モデルの出力する健常度(健常歩行である確率)とを統合することにより、健常者歩行度(健常歩行である確率)を出力する。図3に示す複数のモデル(弱識別機)、及びその統合方法は一例である。
ここで、アンサンブルモデル300を構成する健常度、異常度1、異常度2を出力するモデルはそれぞれのモデル群から選択され、モデル群の少なくとも一つは、複数のモデルを有するものとする。図3の例では、健常度を出力するモデルとして、健常歩行モデル群301として登録されたモデル1,2から選択可能とされ、異常度1を出力するモデルとして、第1の異常歩行モデル群302として登録されたモデル3,4から選択可能とされ、異常度2を出力するモデルとして、第2の異常歩行モデル群303として登録されたモデル5,6から選択可能とされている。本実施例のデータ分析システム110は、データ分析に求められる性能や制約に応じて、モデル群301~303に登録されたうちから1つのモデルを選択することにより、被計測者のニーズに応じた分析を実現可能にする。
このように、データ分析に求められる性能や、許容される制約が異なる被計測者層に対して、データ分析システム110を適合させるため、データ分析システム110の管理者は、分析設定処理部206を起動し、分析設定データ213とドメイン知識データ217とを登録する(図2参照)。
図4に分析設定データ213の例を示す。分析設定データ213は、被計測者層ごとに適用するアンサンブルモデルの性能と制約とを定義するものである。分析対象2132は被計測者層を示し、ここではシステム110が利用される場所によって被計測者層を定義している。なお、定義方法は本例に限定されることなく、任意である。それぞれの分析対象に対して、アンサンブルモデルの性能要件と制約要件とが定義されている。性能要件は、性能指標2133と性能閾値2134によって定義される。例えば、設定ID1として定義された被計測者層(介護施設)の場合、性能指標MCC(マシューズ相関係数)が0.2以上であることを性能要件としている。性能要件を定義するにあたり、複数の性能指標から選択した性能指標を用いることによって被計測者層ごとのニーズにより適合する結果を得ることが期待される。例えば、正確性をより重視する被計測者層か、再現性をより重視する被計測者層かによって、求められる性能を反映する指標と当該指標に対する閾値とを設定する。一方、制約要件は、データ分析に許容される時間の上限を示す時間制約2135により定義される。この例では、フィットネスジムの被計測者(設定ID2)は分析時間について厳しい制約が設けられ、医療施設の被計測者(設定ID3)は分析時間についての制約が設けられていない(時間制約2135を負の値とすることで、制約を設けていないことを表している)。
図5にドメイン知識データ217の例を示す。ドメイン知識データ217は、被計測者層ごとに重要な特徴量を定義するものである。ここでの特徴量とは、センサ111で計測した被計測者の歩行中における身体の計測点(関節等)の3次元空間における動き(軌跡)に基づき算出される特徴量であって、歩行中における被計測者の関節や軸の動き、相関などである。ドメイン知識データ217は、予測モデルにおける重み付けにかかわらず、分析に含ませる特徴量データであって、例えば、医師やトレーナが分析結果を被計測者に説明するにあたって参照したい特徴量データなどが該当する。ドメイン知識データ217も、分析設定データ213と同じ定義をされた被計測者層ごとに定義される。この例では、特徴量名2173に登録された特徴量に対して重要度2174が定義されている。例えば、分析対象「介護施設」では特徴量Bに対して特徴量Aの方が高い重要度とされており(知識ID1,2)、計測する特徴量を絞り込む場合に、重要度の値の小さいものから算出対象から外していくことができる。この例では、各特徴量の重要度を定義しているが、被計測者層ごとの各特徴量の重要度の順位付けを定義してもよい。
図6を用いて、データ分析装置100としてのPC600により、計測者610が被計測者620の歩行態様を分析する処理フローについて説明する。PC600は、分析対象として定義された特定の場所(介護施設、フィットネスジム、医療施設等)に設置され、上述した分析設定データ213に定義された設置場所に対して設定された性能要件と制約要件とを満たすよう、アンサンブルモデルが構築され、また、構築されたアンサンブルモデルに必要な特徴量データが選択された状態にある。
被計測者620が計測者610に計測依頼を行う(S600)と、計測者610は、ユーザ入出力処理部201に対し計測開始操作を行う(S601)。ユーザ入出力処理部201はまず、データ計測処理部202に計測開始要求を出す(S602)。データ計測処理部202は、センサ111を用いて被計測者620の歩行を計測し(S603)、得られた計測データをストレージ105に格納する(S604)。図7に、計測データ211のデータ構造を示す。
計測データ211は、被計測者の計測点の3次元空間の軌跡であり、タイムスタンプ2113に示される時間ごとの各計測点の(X,Y,Z)座標2114が格納されている。計測点としては、歩行態様に影響する関節等が設定される。データID2111は計測データ211に含まれるそれぞれのレコードに対応して付されるIDであり、計測ID2112は、被計測者620の計測依頼のそれぞれに対応して付されるIDである。
被計測者620の歩行の計測が終了すると、ユーザ入出力処理部201は、特徴量算出処理部203に特徴量算出要求を出す(S605)。特徴量算出処理部203は、アンサンブルモデルに使用する特徴量を指定する選択特徴量データ216、及び被計測者620の計測データ211の入力を受け(S606,607)、選択特徴量データ216により指定された特徴量データ212を算出し、得られた特徴量データをストレージ105に格納する(S608)。図8に、特徴量データ212のデータ構造を示す。特徴量データ212には、計測ID2112ごとに、選択特徴量データ216によって指定された特徴量2122が格納されている。
選択特徴量データ216により選択された特徴量の算出が終了すると、ユーザ入出力処理部201は、アンサンブル分析処理部205に分析要求を出す(S610)。アンサンブル分析処理部205は、アンサンブルモデルデータ218及び特徴量データ212の入力を受け(S611,S612)、アンサンブルモデルを用いた分析を行い、予測結果データ214(例えば、図3の例であれば、健常者歩行度、またはそれに基づく歩行が健常であるか否かの判定結果)をストレージ105に格納する(S613)とともに、ディスプレイなどに表示することによって被計測者620に結果を提示する(S614)。図9に、予測結果データ214のデータ構造を示す。予測結果データ214には、計測ID2112ごとの予測結果2143が蓄積される。
なお、図6はPC600が所定の性能要件及び制約要件下で歩行態様を分析する処理フローを示すものであり、例えば営業時間外のように制約を受けない時間帯をあらかじめ設定しておき、当該時間帯に選択特徴量データ216に指定されていない特徴量についても算出し、異なるモデル(弱識別機)を用いるアンサンブルモデルによる分析を行うようにしてもよい。あるいは、他のデータ分析装置100に計測データ211を転送し、制約のない状態で歩行態様の分析を行ってもよい。さらに、被計測者620の歩行態様を計測者610が診断可能な場合においては、計測者610が診断した被計測者620の歩行態様についての診断結果を教師データとして計測データ211あるいは計測データ211から算出した全特徴量データにタグ付けしておく。これにより、被計測者の計測データを学習データとしてモデルの再学習に用いることができる。
図6の処理フローの実行に先立って、分析設定データ213の定義を満たすよう、アンサンブルモデルの構築、算出する特徴量の選択が行われる。以下、その手順について説明する。
図10は、アンサンブルモデルを構成するモデル(弱識別機)の評価フローである。図3に示すアンサンブルモデル300の場合であれば、健常歩行モデル群301、第1の異常歩行モデル群302、第2の異常歩行モデル群303に含まれるモデル1~6のそれぞれに対して、図10に示す評価フローを実行する。この評価フローは、各モデルに対する学習を実施するごとに行う。例えば、データ分析装置100がモデルの学習を行う度に、図10の評価フローを実行して評価結果をモデルとともに格納することが望ましい。
分析者1000は、ユーザ入出力処理部201に対しモデル評価開始操作を行う(S1001)。ユーザ入出力処理部201はまず、特徴量算出処理部203に特徴量算出要求を出す(S1002)。特徴量算出処理部203は、ストレージ105に格納されている計測データ211の入力を受け(S1003)、全特徴量データ220を算出する(S1004)。計測データ211としては任意の計測データを用いればよく、例えばモデルの学習に用いた計測データを用いればよい。全特徴量データ220は、評価対象となるアンサンブルモデルの選択肢となるモデル(弱識別機)が使用する特徴量の全てを含む。全特徴量データ220が算出されると、ユーザ入出力処理部201はモデル評価部204にモデルの評価要求を出す(S1005)。モデル評価部204は、全特徴量データ220の入力を受け(S1006)、各モデルの評価を実行し、評価結果を含むモデルデータ215をストレージ105に格納する(S1007)。図11に、モデルデータ215のデータ構造を示す。
モデルID2151は、アンサンブルモデルを構成するモデル(弱識別機)を特定するIDである。アルゴリズム2152にはそれぞれのモデルで使用されているアルゴリズム、目的変数2153にはモデルの目的変数(例えば、図3の例であれば、健常歩行、異常歩行1、異常歩行2)、モデルデータ2154にはモデルのバイナリデータが格納されている。モデル評価部204が評価した結果は、処理速度2155、性能指標2156に格納される。処理速度2155は各モデルに特徴量が入力されてから、識別結果を出力するまでの時間を示す。また、性能指標2156には、アンサンブルモデルの性能要件を定義するために用いられている性能指標(分析設定データ213にあらわれる性能指標)ごとの評価結果が格納されている。
図12は、アンサンブルモデルに使用するモデル(弱識別機)の選択及び算出する特徴量の選択フローである。図12のフローは、実際の分析を行う情報処理装置、すなわち本実施例では図6の処理フローを実行するPC600で行うことが望ましい。情報処理装置の演算性能、状態によって特徴量の算出、モデルによる識別に要する時間は異なる。このため、実際の分析を行う情報処理装置でアンサンブルモデルの構築及び算出する特徴量の選択を行うことで、アンサンブルモデルの性能、制約の事前評価結果の信頼性を高めることができる。
分析者1000は、ユーザ入出力処理部201に対しアンサンブルモデル作成操作を行う(S1201)。ユーザ入出力処理部201はアンサンブルモデル作成処理部207にアンサンブルモデル作成要求を出す(S1202)。アンサンブルモデル作成処理部207は、ストレージ105に格納されている分析設定データ213、計測データ211、モデルデータ215、ドメイン知識データ217の入力を受け(S1203~S1206)、所定の性能要件及び制約要件を満たすアンサンブルモデルを構成するモデルを特定するアンサンブルモデルデータ218と、当該アンサンブルモデルのために算出が必要な特徴量を指定する選択特徴量データ216とを作成し、ストレージ105に格納する(S1207~S1208)。
図13に、アンサンブルモデル作成処理部207が実行するアンサンブルモデル決定フローを示す。まず、PC600が使用される分析対象(被計測者層)についての選択を受ける(S1301)。入力された分析対象(被計測者層)と分析設定データ213とを照合することにより、アンサンブルモデルに求められる性能要件と制約要件とを得ることができる。
続いて、アンサンブルモデルに用いるモデル(弱識別機)候補を選択する(S1302)。ここでは、モデルデータ215に格納されている処理速度2155及び性能指標2156に基づき、アンサンブルモデルに用いる候補となるモデルを選択する。選択にあたっては、性能要件として指定された性能指標が最も高くなるように選択する。このとき、複数の候補を選択してもよい。
続いて、選択したモデル(弱識別機)候補を適用したアンサンブルモデルについて、実機による性能と分析時間とを評価する(S1303)。性能評価には、性能要件として指定された性能指標を算出する。評価する分析時間には、計測データから特徴量データを算出するのに要する時間と特徴量データからアンサンブルモデルによって分析を行うのに要する時間とを含む。ここでの特徴量データの算出時間は、候補とするモデルにより構成されるアンサンブルモデルによる分析に必要な特徴量を算出するのに必要な時間である。モデルデータ215に格納されている処理速度2155は、PC600によって評価された処理速度とは限らないため、実際の計測データ211からPC600に分析を行わせることにより、より正確なアンサンブルモデルによって分析するのに要する時間を推定することができる。分析時間評価に用いる計測データは、モデルの学習に用いた計測データであってもよいし、PC600が過去に計測を行った計測データであってもよく、任意の計測データを用いることができる。
実機による分析時間評価(S1303)が分析対象の時間制約2135(図4を参照)を満たしていれば(S1304でyes)、選択したモデル(弱識別機)を使用したアンサンブルモデルの性能情報をディスプレイ等に表示する(S1307)。複数の候補があれば、それぞれについて性能情報とともに表示する。分析者1000は、性能情報を確認し、提示されたモデルの候補から、アンサンブルモデルに使用するモデル(弱識別機)を決定する(S1308)。
実機による分析時間評価(S1303)が分析対象の時間制約2135を満たしていない場合(S1304でno)、性能要件として指定された性能指標とS1303で評価した分析時間と制約要件である時間制約との乖離に基づき、性能要件として指定された性能指標がなるべく高くなるようにモデル候補を選択する(S1305)。
このとき、さらに特徴量の重要度とS1303で評価した分析時間と制約要件である時間制約との乖離に基づき、算出する特徴量を制限するように選択してもよい(S1306)。特徴量の重要度としては、分析アルゴリズム上の重要度と、分析結果の被計測者への説明における重要度の双方を考慮する。前者はモデルデータ2154のバイナリデータから判断することができ、後者はドメイン知識データ217から判断することができる。アンサンブルモデルを構成する少なくとも1つのモデルに対して、分析結果またはその説明への影響の小さな特徴量の算出を省く(この状態を「入力制限状態」と称する)ことにより、性能の低下を極力防止しながら、特徴量の算出に要する時間を削減することが期待できる。S1305,S1306においても複数の候補を選択することが可能である。
選択したモデル候補及び特徴量候補に基づき、再度実機による性能及び分析時間の評価を行い(S1303)、時間制約を満たすモデル候補及び特徴量候補が得られるまで、アンサンブルモデルを構成するモデル(弱識別機)の組み合わせや、特徴量の選択を変えながら、選択と実機によるアンサンブルモデル評価とを繰り返す。
図14は、アンサンブルモデル作成処理部207が出力するアンサンブルモデルデータ218のデータ構造である。モデルデータ215として登録されているモデル(弱識別機)のそれぞれについて、アンサンブルモデルへの採用/否採用が登録されている。
図15は、アンサンブルモデル作成処理部207が出力する選択特徴量データ216のデータ構造である。データ分析装置100が算出可能な特徴量のそれぞれについて、アンサンブルモデルへの採用/否採用が登録されている。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、これに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能なものである。本実施例では被計測者の歩行態様の分析を行う歩行態様分析装置を例に説明したが、広くアンサンブルモデルを用いてデータ分析を行う装置、システム、方法、プログラムに適用可能なものである。
100:データ分析装置、101:CPU、102:入力I/F、103:出力I/F、104:メモリ、105:ストレージ、106:I/Oポート、107:内部バス、110:データ分析システム、111:センサ、200:データ分析プログラム、201:ユーザ入出力処理部、202:データ計測処理部、203:特徴量算出処理部、204:モデル評価部、205:アンサンブル分析処理部、206:分析設定処理部、207:アンサンブルモデル作成処理部、210:データベースプログラム、211:計測データ、212:特徴量データ、213:分析設定データ、214:予測結果データ、215:モデルデータ、216:選択特徴量データ、217:ドメイン知識データ、218:アンサンブルモデルデータ、220:全特徴量データ、300:アンサンブルモデル、301:健常歩行モデル群、302:第1の異常歩行モデル群、303:第2の異常歩行モデル群。

Claims (15)

  1. 第1~第nのモデルによる推論を統合して推論を行うアンサンブルモデルを用いてデータ分析を行うデータ分析装置であって、
    プロセッサと、
    メモリと、
    ストレージと、
    前記メモリに読み込まれ、前記プロセッサにより実行されるデータ分析プログラムとを有し、
    前記ストレージは、それぞれ1以上のモデルを含む第1~第nのモデル群が登録されたモデルデータを格納し、アンサンブルモデルを構成する第iのモデル(1≦i≦n)は、前記モデルデータの第iのモデル群から選択され、前記第1~第nのモデル群の少なくとも1つのモデル群は複数のモデルを含んでおり、
    前記データ分析プログラムは、
    前記データ分析に対する性能要件と前記データ分析に要する時間に対する制約要件とを満たすアンサンブルモデルを構成可能な前記第1~第nのモデルの選択肢を、それぞれ前記第1~第nのモデル群から提示するアンサンブルモデル作成処理部と、
    提示された前記第1~第nのモデルの選択肢の選択を受けて、選択された前記第1~第nのモデルを使用したアンサンブルモデルによる推論を行うアンサンブル分析処理部とを有するデータ分析装置。
  2. 請求項1において、
    前記ストレージは、複数の分析対象ごとの前記性能要件及び前記制約要件を設定する分析設定データを格納し、
    前記アンサンブルモデル作成処理部は、前記複数の分析対象のうち、前記データ分析が対象とする分析対象の前記性能要件及び前記制約要件を満たすアンサンブルモデルを構成可能な前記第1~第nのモデルの選択肢を提示するデータ分析装置。
  3. 請求項2において、
    前記性能要件は、性能指標と前記性能指標の閾値とによって定義され、
    前記性能指標として、前記複数の分析対象に応じた指標が設定されるデータ分析装置。
  4. 請求項2において、
    前記制約要件は、計測データから特徴量データを算出するのに要する時間と特徴量データからアンサンブルモデルを用いて前記データ分析を行うのに要する時間とを含む分析時間の上限として設けられているデータ分析装置。
  5. 請求項4において、
    前記アンサンブルモデル作成処理部は、提示する前記第1~第nのモデルの選択肢のうち、少なくとも1つのモデルに入力する特徴量が選択された入力制限状態で推論を行うこととし、前記入力制限状態で前記性能要件及び前記制約要件を満たすアンサンブルモデルを構成可能な前記第1~第nのモデルの選択肢を提示するデータ分析装置。
  6. 請求項5において、
    前記ストレージは、前記データ分析が対象とする分析対象における特徴量の重要性を示すドメイン知識データを有し、
    前記アンサンブルモデル作成処理部は、前記ドメイン知識データ及びモデルにおける当該特徴量の重要性に基づき、前記入力制限状態でのアンサンブルモデルに入力する特徴量を選択するデータ分析装置。
  7. 請求項5において、
    前記アンサンブルモデル作成処理部は、提示された前記第1~第nのモデルの選択肢の選択を受けて、前記アンサンブル分析処理部が用いるアンサンブルモデルで使用する前記第1~第nのモデルを指定するアンサンブルモデルデータと、前記アンサンブル分析処理部が用いるアンサンブルモデルに入力する特徴量として選択された特徴量を指定する選択特徴量データを前記ストレージに格納するデータ分析装置。
  8. 請求項7において、
    前記データ分析プログラムは、
    計測データから特徴量データを算出する特徴量算出処理部を有し、
    前記特徴量算出処理部は、前記選択特徴量データに指定される特徴量について、前記計測データから前記特徴量データを算出し、
    前記アンサンブル分析処理部は、前記アンサンブルモデルデータに指定された前記第1~第nのモデルを使用したアンサンブルモデルに、前記特徴量算出処理部が算出した前記特徴量データを入力して推論を行うデータ分析装置。
  9. 請求項8において、
    前記特徴量算出処理部は、あらかじめ定められた時間帯において、前記選択特徴量データに指定されていない特徴量について、前記計測データから前記特徴量データを算出するデータ分析装置。
  10. 請求項9において、
    前記計測データから前記特徴量算出処理部が算出した前記特徴量データを、前記ストレージに格納されているモデルの学習に用いるデータ分析装置。
  11. 第1~第nのモデルによる推論を統合して推論を行うアンサンブルモデルを用いてデータ分析を行うデータ分析方法であって、
    それぞれ1以上のモデルを含む第1~第nのモデル群が登録されたモデルデータをあらかじめ記憶し、アンサンブルモデルを構成する第iのモデル(1≦i≦n)は、前記モデルデータの第iのモデル群から選択され、前記第1~第nのモデル群の少なくとも1つのモデル群は複数のモデルを含んでおり、
    前記データ分析に対する性能要件と前記データ分析に要する時間に対する制約要件とを満たすアンサンブルモデルを構成可能な前記第1~第nのモデルの選択肢を、それぞれ前記第1~第nのモデル群から提示し、
    提示された前記第1~第nのモデルの選択肢の選択を受けて、選択された前記第1~第nのモデルを使用したアンサンブルモデルによる推論を行うデータ分析方法。
  12. 請求項11において、
    提示する前記第1~第nのモデルの選択肢のうち、少なくとも1つのモデルに入力する特徴量が選択された入力制限状態で推論を行うこととし、前記入力制限状態で前記性能要件及び前記制約要件を満たすアンサンブルモデルを構成可能な前記第1~第nのモデルの選択肢を提示するデータ分析方法。
  13. 請求項12において、
    前記データ分析を行うアンサンブルモデルに入力する第1の特徴量について、計測データから第1の特徴量データを算出し、
    前記データ分析を行うアンサンブルモデルに、算出された前記第1の特徴量データを入力して推論を行うデータ分析方法。
  14. 請求項13において、
    あらかじめ定められた時間帯において、前記第1の特徴量以外の第2の特徴量について、前記計測データから第2の特徴量データを算出するデータ分析方法。
  15. それぞれ1以上のモデルを含む第1~第nのモデル群が登録されたモデルデータを記憶した情報処理装置上で、第1~第nのモデルによる推論を統合して推論を行うアンサンブルモデルを用いてデータ分析を行うデータ分析プログラムであって、
    アンサンブルモデルを構成する第iのモデル(1≦i≦n)は、前記モデルデータの第iのモデル群から選択され、前記第1~第nのモデル群の少なくとも1つのモデル群は複数のモデルを含んでおり、
    前記データ分析に対する性能要件と前記データ分析に要する時間に対する制約要件とを満たすアンサンブルモデルを構成可能な前記第1~第nのモデルの選択肢を、それぞれ前記第1~第nのモデル群から提示する第1の工程と、
    提示された前記第1~第nのモデルの選択肢の選択を受けて、選択された前記第1~第nのモデルを使用したアンサンブルモデルによる推論を行う第2の工程とを有するデータ分析プログラム。
JP2019132543A 2019-07-18 2019-07-18 データ分析装置、データ分析方法及びデータ分析プログラム Active JP7269122B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2019132543A JP7269122B2 (ja) 2019-07-18 2019-07-18 データ分析装置、データ分析方法及びデータ分析プログラム
PCT/JP2020/024353 WO2021010093A1 (ja) 2019-07-18 2020-06-22 データ分析装置、データ分析方法及びデータ分析プログラム
CN202080048103.9A CN114041152A (zh) 2019-07-18 2020-06-22 数据分析装置、数据分析方法以及数据分析程序
EP20841123.1A EP4002232A4 (en) 2019-07-18 2020-06-22 DATA ANALYSIS DEVICE, DATA ANALYSIS METHOD AND DATA ANALYSIS PROGRAM
US17/621,884 US20220246302A1 (en) 2019-07-18 2020-06-22 Data analysis apparatus, data analysis method, and data analysis program
TW109122708A TWI755782B (zh) 2019-07-18 2020-07-06 資料分析裝置、資料分析方法及資料分析程式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019132543A JP7269122B2 (ja) 2019-07-18 2019-07-18 データ分析装置、データ分析方法及びデータ分析プログラム

Publications (3)

Publication Number Publication Date
JP2021018508A JP2021018508A (ja) 2021-02-15
JP2021018508A5 JP2021018508A5 (ja) 2022-03-23
JP7269122B2 true JP7269122B2 (ja) 2023-05-08

Family

ID=74209800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019132543A Active JP7269122B2 (ja) 2019-07-18 2019-07-18 データ分析装置、データ分析方法及びデータ分析プログラム

Country Status (6)

Country Link
US (1) US20220246302A1 (ja)
EP (1) EP4002232A4 (ja)
JP (1) JP7269122B2 (ja)
CN (1) CN114041152A (ja)
TW (1) TWI755782B (ja)
WO (1) WO2021010093A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022139417A (ja) * 2021-03-12 2022-09-26 オムロン株式会社 統合モデルの生成方法、画像検査システム、画像検査用モデルの生成装置、画像検査用モデルの生成プログラム及び画像検査装置
EP4343620A1 (en) * 2021-05-18 2024-03-27 Resonac Corporation Prediction device, learning device, prediction method, learning method, prediction program, and learning program
TWI780735B (zh) * 2021-05-28 2022-10-11 長庚大學 影像分析之方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015130093A (ja) 2014-01-08 2015-07-16 株式会社東芝 画像認識アルゴリズム組合せ選択装置
JP2016082431A (ja) 2014-10-17 2016-05-16 パナソニックIpマネジメント株式会社 モニタリング装置、モニタリングシステムおよびモニタリング方法
JP2019023907A (ja) 2014-05-23 2019-02-14 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
JP2019106112A (ja) 2017-12-14 2019-06-27 オムロン株式会社 情報処理装置、識別システム、設定方法及びプログラム
US20190205773A1 (en) 2017-06-30 2019-07-04 Go Logic Decision Time, Llc Methods and systems of assertional simulation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3224822A1 (de) 1982-07-02 1984-01-05 Siemens AG, 1000 Berlin und 8000 München Schalter mit lichtbogenloeschung
AU2012318963B2 (en) * 2011-09-25 2016-02-11 Labrador Diagnostics Llc Systems and methods for multi-analysis
US20140188768A1 (en) * 2012-12-28 2014-07-03 General Electric Company System and Method For Creating Customized Model Ensembles On Demand
EP3238611B1 (en) * 2016-04-29 2021-11-17 Stichting IMEC Nederland A method and device for estimating a condition of a person
JP2020537579A (ja) * 2017-10-17 2020-12-24 ラオ、サティシュ 神経障害を識別及び監視するための機械学習ベースのシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015130093A (ja) 2014-01-08 2015-07-16 株式会社東芝 画像認識アルゴリズム組合せ選択装置
JP2019023907A (ja) 2014-05-23 2019-02-14 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
JP2016082431A (ja) 2014-10-17 2016-05-16 パナソニックIpマネジメント株式会社 モニタリング装置、モニタリングシステムおよびモニタリング方法
US20190205773A1 (en) 2017-06-30 2019-07-04 Go Logic Decision Time, Llc Methods and systems of assertional simulation
JP2019106112A (ja) 2017-12-14 2019-06-27 オムロン株式会社 情報処理装置、識別システム、設定方法及びプログラム

Also Published As

Publication number Publication date
TW202103635A (zh) 2021-02-01
TWI755782B (zh) 2022-02-21
WO2021010093A1 (ja) 2021-01-21
EP4002232A1 (en) 2022-05-25
US20220246302A1 (en) 2022-08-04
JP2021018508A (ja) 2021-02-15
CN114041152A (zh) 2022-02-11
EP4002232A4 (en) 2023-08-09

Similar Documents

Publication Publication Date Title
WO2021010093A1 (ja) データ分析装置、データ分析方法及びデータ分析プログラム
JP7157758B2 (ja) モデル支援コホート選択を行うシステム及び方法
KR102216689B1 (ko) 시계열 의료 데이터를 통한 질병 예후 예측을 위한 딥 뉴럴 네트워크의 분류 결과 시각화 방법 및 시스템
JP6839342B2 (ja) 情報処理装置、情報処理方法およびプログラム
US10912508B2 (en) Method and system for assessing mental state
US20170046484A1 (en) Methods and systems for representing, storing, and accessing computable medical imaging-derived quantities
CN103177179B (zh) 诊断因素集合确定设备和方法
Ananey-Obiri et al. Predicting the presence of heart diseases using comparative data mining and machine learning algorithms
Zhao et al. Applying incremental Deep Neural Networks-based posture recognition model for ergonomics risk assessment in construction
Juutinen et al. Parkinson’s disease detection from 20-step walking tests using inertial sensors of a smartphone: Machine learning approach based on an observational case-control study
CN111127467A (zh) 图像量化方法、计算机设备和存储介质
KR102639558B1 (ko) 관심영역별 골 성숙 분포를 이용한 성장 분석 예측 장치 및 방법
JP2012532375A (ja) 内容に基づく画像検索についての関連性フィードバック
Bora et al. Using machine learning to predict heart disease
US20200253548A1 (en) Classifying a disease or disability of a subject
Eirola et al. Predicting Huntington’s disease: Extreme learning machine with missing values
Sengupta et al. Analyzing historical diagnosis code data from NIH N3C and RECOVER Programs using deep learning to determine risk factors for Long Covid
Chiari et al. Length of stay prediction for Northern Italy COVID-19 patients based on lab tests and X-ray data
KR102394759B1 (ko) 데이터의 특징점을 취합하여 기계 학습하는 방법 및 장치
US11742081B2 (en) Data model processing in machine learning employing feature selection using sub-population analysis
KR20200051343A (ko) 시계열 데이터 예측 모델 평가 방법 및 장치
KR20220120345A (ko) 시계열 데이터에 기반한 알츠하이머병 진행감지를 위한 멀티모드 멀티테스크 딥 러닝 모델
Rguibi et al. Automatic searching of deep neural networks for medical imaging diagnostic
US11955245B2 (en) Method and system for mental index prediction
CN116052889B (zh) 一种基于血液常规指标检测的sFLC预测系统

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220314

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230421

R150 Certificate of patent or registration of utility model

Ref document number: 7269122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150