CN114041152A - 数据分析装置、数据分析方法以及数据分析程序 - Google Patents
数据分析装置、数据分析方法以及数据分析程序 Download PDFInfo
- Publication number
- CN114041152A CN114041152A CN202080048103.9A CN202080048103A CN114041152A CN 114041152 A CN114041152 A CN 114041152A CN 202080048103 A CN202080048103 A CN 202080048103A CN 114041152 A CN114041152 A CN 114041152A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- data analysis
- models
- nth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
- A61B5/112—Gait analysis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0059—Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
- A61B5/0077—Devices for viewing the surface of the body, e.g. camera, magnifying lens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
- A61B5/1121—Determining geometric values, e.g. centre of rotation or angular range of movement
- A61B5/1122—Determining geometric values, e.g. centre of rotation or angular range of movement of movement trajectories
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B2562/00—Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
- A61B2562/02—Details of sensors specially adapted for in-vivo measurements
- A61B2562/0219—Inertial sensors, e.g. accelerometers, gyroscopes, tilt switches
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4842—Monitoring progression or stage of a disease
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Veterinary Medicine (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- Heart & Thoracic Surgery (AREA)
- Biophysics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physiology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Dentistry (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Psychiatry (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
Abstract
实现集成模型的预测精度和分析时间的协调。因此,在使用合并基于第1~第n模型的推理而进行推理的集成模型(300)进行数据分析时,从模型数据的第i模型群选择构成集成模型(300)的第i模型(1≤i≤n),第1~第n模型群的至少1个模型群包括多个模型,分别从第1~第n模型群(301~303),选择能够构成满足针对数据分析的性能要件以及针对数据分析所需的时间的制约要件的集成模型的第1~第n模型。
Description
技术领域
本发明涉及数据分析装置、数据分析方法以及数据分析程序。
背景技术
人为了自由地活动自己的身体,需要使由骨、关节、肌肉、神经构成的运动器官正常地发挥功能。运动器官综合症(locomotive syndrome,运动障碍症候群)是指运动器官中的某一个或者多个发生障碍而站立、行走、奔跑、就坐这样的移动功能下降的状态。在这样的移动功能的下降发展时,也会对日常生活带来妨碍。需要入院治疗那样的运动器官障碍据说在50岁以后会多发,高龄下的运动器官障碍涉及到需要支援、护理的风险。运动器官障碍会逐渐发展,所以认识到运动障碍症候群的预防、早期的发现、恰当的处置的必要性。在专利文献1中公开了一种步行形态分析装置,测量被测量者的步行状态,根据其测量结果来计算特征量数据,使用计算出的特征量数据以及分析模型来进行被测量者的步行形态的分析。
在专利文献2中,在构筑预测模型时,预先设定有关于针对所输入的数据的前处理、基于超参数(hyperparameter)的数据的学习方法等的候选,从这些候选的组合(称为流水线(pipeline))中选择能够构筑预测精度更高的预测模型的流水线。以即使候选增加也不会使流水线的搜索所需的时间增加的方式,使用从学习数据以预定的比率抽出的采样数据进行搜索,在不超过处理时间的限制时间的限度下增大采样数据的抽出比率,搜索预测模型的预测精度变高的组合。
现有技术文献
专利文献1:日本专利第6509406号公报
专利文献2:日本特开2018-190130号公报
发明内容
人的移动功能的下降被表现为步行障碍。因此,有效的是掌握推进运动障碍症候群的早期发现、改善的人的步行状态并易于理解地传达给对象者。而且,根据运动器官障碍的预防或者早期发现的观点,优选为将专利文献1所公开那样的分析装置不仅设置于医疗机构,而且还设置于健身中心等,即便是关于运动器官障碍无认知的被测量者,也能够轻易地察觉自己的步行状态。
然而,想要越精密且准确地实施步行形态的分析,则在分析中使用的特征量数据的数量变得越庞大,特征量数据的计算、使用特征量数据的分析所需的时间也越增多。在为了得到分析结果而产生较长的等待时间时,关于运动器官障碍无认知的被测量者很可能会敬而远之。特别是,在想要设置到对于被测量者而言近旁的场所时,优选为通过一般普及的PC(Personal Computer,个人电脑)等进行特征量数据的计算、步行状态的分析,不能以使用运算能力特别高的计算机为前提。
专利文献2虽然公开了缩短用于构筑预测模型的流水线选择的搜索时间,但并未提及使用预测模型的分析自身所需的时间。
作为本发明的一个实施形态的数据分析装置是使用合并基于第1~第n模型的推理而进行推理的集成模型来进行数据分析的数据分析装置,具有:处理器;存储器;存储设备;以及数据分析程序,被读入到存储器,并由处理器执行,存储设备储存登记有分别包括1个以上的模型的第1~第n模型群的模型数据,从模型数据的第i模型群选择构成集成模型的第i模型(1≤i≤n),第1~第n模型群的至少1个模型群包括多个模型,数据分析程序具有:集成模型制作处理部,分别从第1~第n模型群,提示能够构成满足针对数据分析的性能要件以及针对数据分析所需的时间的制约要件的集成模型的第1~第n模型的选项;以及集成分析处理部,接受所提示的第1~第n模型的选项的选择,利用使用所选择的第1~第n模型的集成模型进行推理。
在使用集成模型(ensemble model)的分析中,实现集成模型的预测精度和分析时间的协调。
其它课题和新的特征根据本说明书的记述以及附图而会变得清楚。
附图说明
图1是数据分析系统的硬件结构。
图2是数据分析系统的软件结构。
图3是集成模型的概念图。
图4是分析设定数据的例子。
图5是域知识数据的例子。
图6是对被测量者的步行形态进行分析的处理流程。
图7是测量数据的数据构造。
图8是特征量数据的数据构造。
图9是预测结果数据的数据构造。
图10是模型(弱识别器)的评价流程。
图11是模型数据的数据构造。
图12是模型(弱识别器)的选择以及计算的特征量的选择流程。
图13是集成模型决定流程。
图14是集成模型数据的数据构造。
图15是选择特征量数据的数据构造。
(符号说明)
100:数据分析装置;101:CPU;102:输入I/F;103:输出I/F;104:存储器;105:存储设备;106:I/O端口;107:内部总线;110:数据分析系统;111:传感器;200:数据分析程序;201:用户输入输出处理部;202:数据测量处理部;203:特征量计算处理部;204:模型评价部;205:集成分析处理部;206:分析设定处理部;207:集成模型制作处理部;210:数据库程序;211:测量数据;212:特征量数据;213:分析设定数据;214:预测结果数据;215:模型数据;216:选择特征量数据;217:域知识数据;218:集成模型数据;220:全部特征量数据;300:集成模型;301:健康步行模型群;302:第1异常步行模型群;303:第2异常步行模型群。
具体实施方式
图1示出对行人的步行形态进行分析的数据分析系统110的硬件结构。数据分析系统110具有:传感器111,用于测量被测量者的步行;以及数据分析装置100,使用传感器111来测量被测量者的步行,根据其测量结果进行步行形态的分析。
数据分析装置100是具备CPU(Central Processing Unit,中央处理单元)101、输入I/F(Interface,接口)102、输出I/F103、存储器104、存储设备105、I/O端口106并将它们通过内部总线107来结合的能够作为通用计算机实现的信息处理装置。输入I/F102与键盘、鼠标等输入装置连接,另外输出I/F103与显示器、打印机连接,实现针对操作者的GUI(Graphical User Interface,图形用户界面)。存储设备105通常由HDD、SSD、ROM、闪存存储器等非易失性存储器构成,存储由数据分析装置100执行的程序、程序视为处理对象的数据等。存储器104由RAM(Random Access Memory,随机存取存储器)构成,根据CPU101的命令而临时地存储程序、执行程序所需的数据等。CPU101执行从存储设备105载入到存储器104的程序。
数据分析装置100针对传感器111输出感测数据的收集命令,传感器111响应于该收集命令,对于被测量者的步行进行感测,并将测量结果发送给数据分析装置100。作为传感器111,能够使用基于TOF(Time of Flight,飞行时间)方式的距离传感器。为了捕获被测量者的步行形态,需要测量被测量者的步行中的身体的测量点(关节等)在三维空间中的活动(轨迹),距离传感器具有能够直接地求出三维空间中的测量点的坐标这样的优点。此外,不限于距离传感器,也可以将传感器111设为摄像机,从由摄像机拍摄步行中的测量者得到的影像进行图像解析,还可以使用加速度传感器、角度传感器、陀螺仪传感器那样的传感器。还能够使用多个种类的传感器。
图2是数据分析系统110的软件结构,示出了在数据分析装置100中执行的程序及其关系。数据分析程序200具有测量步行并根据其测量结果来分析步行形态的功能。用户输入输出处理部201是操作者向各模块202~207输入指示、信息的接口程序。模块202~207是执行与步行的测量或者步行形态的分析有关的功能的程序,关于其内容在后面叙述。数据库程序210具有将数据分析系统110所需的测量数据、分析模型储存到存储设备105并管理的功能。
在本实施例中,使用集成模型进行步行形态的分析。集成模型是将基于多个模型(弱识别器)的推理进行合并而进行1个推理的模型。图3示出应用于本实施例的集成模型的概念图。集成模型300将判定被测量者的步行是否为健康步行的健康步行模型、判定被测量者的步行是否为异常步行1的第1异常步行模型、判定被测量者的步行是否为异常步行2的第2异常步行模型这3个模型(弱识别器)的判定结果进行合并,而判定被测量者的步行是否健康。异常步行1、2分别是被视为步行障碍的特定的步行状态。集成模型300通过比较第1异常步行模型输出的异常度1(是异常步行1的概率)和第2异常步行模型输出的异常度2(是异常步行2的概率),将大的一方作为最大异常度(是某种异常步行的概率),并将最大异常度和健康步行模型输出的健康度(是健康步行的概率)进行合并,从而输出健康者步行度(是健康步行的概率)。图3所示的多个模型(弱识别器)及其合并方法是一个例子。
在此,设为构成集成模型300的输出健康度、异常度1、异常度2的模型是从各个模型群选择的,模型群的至少一个具有多个模型。在图3的例子中,作为输出健康度的模型,能够从被登记为健康步行模型群301的模型1、2选择,作为输出异常度1的模型,能够从被登记为第1异常步行模型群302的模型3、4选择,作为输出异常度2的模型,能够从被登记为第2异常步行模型群303的模型5、6选择。本实施例的数据分析系统110根据数据分析所要求的性能、制约,从登记于模型群301~303的模型中选择1个模型,从而能够实现与被测量者的需求对应的分析。
这样,为了使数据分析系统110适合于数据分析所要求的性能、所容许的制约不同的被测量者层,数据分析系统110的管理者起动分析设定处理部206,登记分析设定数据213和域知识数据217(参照图2)。
图4示出分析设定数据213的例子。分析设定数据213是针对每个被测量者层而定义所应用的集成模型的性能和制约的数据。分析对象2132表示被测量者层,在此根据利用系统110的场所而定义了被测量者层。此外,定义方法不限定于本例,是任意的。针对各个分析对象,定义了集成模型的性能要件和制约要件。通过性能指标2133和性能阈值2134来定义性能要件。例如,在被定义为设定ID1的被测量者层(护理设施)的情况下,将性能指标MCC(Matthews Correlation Coefficient,马修斯相关系数)是0.2以上这作为性能要件。在定义性能要件时,期待通过使用从多个性能指标选择的性能指标而得到更适合于每个被测量者层的需求的结果。例如,根据是更重视准确性的被测量者层、还是更重视再现性的被测量者层,设定反映所要求的性能的指标和针对该指标的阈值。另一方面,通过表示数据分析所容许的时间的上限的时间制约2135来定义制约要件。在该例子中,健身中心的被测量者(设定ID2)关于分析时间而被设置严格的制约,医疗设施的被测量者(设定ID3)未被设置关于分析时间的制约(通过将时间制约2135设为负的值,表示未设置制约)。
图5示出域知识数据217的例子。域知识数据217是针对每个被测量者层而定义重要的特征量的数据。此处的特征量是根据由传感器111测量的被测量者的步行中的身体的测量点(关节等)在三维空间中的活动(轨迹)而计算的特征量,是步行中的被测量者的关节、轴的活动、相关性等。域知识数据217是与预测模型中的加权无关地包含于分析的特征量数据,例如相应的是在医生、教练员向被测量者说明分析结果时希望参照的特征量数据等。域知识数据217也针对进行了与分析设定数据213相同的定义的每个被测量者层而被定义。在该例子中,针对登记于特征量名2173的特征量,定义有重要度2174。例如,在分析对象“护理设施”中相对于特征量B而言特征量A一方被设为更高的重要度(知识ID1、2),在缩减要测量的特征量的情况下,能够从重要度的值小的特征量起从计算对象中依次去除。在该例子中,定义了各特征量的重要度,但也可以定义每个被测量者层的各特征量的重要度的排序。
使用图6,说明测量者610利用作为数据分析装置100的PC600对被测量者620的步行形态进行分析的处理流程。PC600设置于被定义为分析对象的特定的场所(护理设施、健身中心、医疗设施等),处于以满足在上述分析设定数据213中定义的针对设置场所设定的性能要件和制约要件的方式构筑集成模型并且所构筑的集成模型所需的特征量数据被选择的状态。
在被测量者620对测量者610进行测量委托(S600)时,测量者610针对用户输入输出处理部201进行测量开始操作(S601)。用户输入输出处理部201首先向数据测量处理部202输出测量开始请求(S602)。数据测量处理部202使用传感器111来测量被测量者620的步行(S603),将所得到的测量数据储存到存储设备105(S604)。图7示出测量数据211的数据构造。
测量数据211是被测量者的测量点的三维空间的轨迹,储存有在时间戳2113中示出的每个时间的各测量点的(X,Y,Z)坐标2114。作为测量点,设定影响步行形态的关节等。数据ID2111是与包含于测量数据211的各个记录项对应地附加的ID,测量ID2112是与被测量者620的测量委托分别对应地附加的ID。
在被测量者620的步行的测量结束时,用户输入输出处理部201向特征量计算处理部203输出特征量计算请求(S605)。特征量计算处理部203接受指定在集成模型中使用的特征量的选择特征量数据216以及被测量者620的测量数据211的输入(S606、607),计算由选择特征量数据216指定的特征量数据212,将所得到的特征量数据储存到存储设备105(S608)。图8示出特征量数据212的数据构造。在特征量数据212中,针对每个测量ID2112,储存有由选择特征量数据216指定的特征量2122。
在由选择特征量数据216选择的特征量的计算结束时,用户输入输出处理部201向集成分析处理部205输出分析请求(S610)。集成分析处理部205接受集成模型数据218以及特征量数据212的输入(S611、S612),进行使用集成模型的分析,将预测结果数据214(例如在图3的例子中是健康者步行度或者基于其的步行是否为健康的判定结果)储存到存储设备105(S613),并且显示于显示器等,从而向被测量者620提示结果(S614)。图9示出预测结果数据214的数据构造。在预测结果数据214中储存每个测量ID2112的预测结果2143。
此外,图6是示出PC600在预定的性能要件以及制约要件下分析步行形态的处理流程的图,例如也可以预先设定如营业时间外那样不受制约的时间段,在该时间段中关于在选择特征量数据216中未指定的特征量也进行计算,通过使用不同的模型(弱识别器)的集成模型进行分析。或者,也可以向其它数据分析装置100传送测量数据211,在无制约的状态下进行步行形态的分析。而且,在测量者610能够诊断被测量者620的步行形态的情况下,将测量者610诊断的关于被测量者620的步行形态的诊断结果作为教师数据,对测量数据211或者根据测量数据211计算出的全部特征量数据附加标签。由此,能够将被测量者的测量数据作为学习数据而用于模型的再学习。
在执行图6的处理流程之前,以满足分析设定数据213的定义的方式,进行集成模型的构筑、计算的特征量的选择。以下,说明其过程。
图10是构成集成模型的模型(弱识别器)的评价流程。在图3所示的集成模型300的情况下,针对健康步行模型群301、第1异常步行模型群302、第2异常步行模型群303所包含的模型1~6分别执行图10所示的评价流程。每当实施针对各模型的学习时,执行该评价流程。例如,优选为每当数据分析装置100进行模型的学习时,执行图10的评价流程并将评价结果与模型一起储存。
分析者1000针对用户输入输出处理部201进行模型评价开始操作(S1001)。用户输入输出处理部201首先向特征量计算处理部203输出特征量计算请求(S1002)。特征量计算处理部203接受储存于存储设备105的测量数据211的输入(S1003),计算全部特征量数据220(S1004)。作为测量数据211,使用任意的测量数据即可,例如使用在模型的学习中使用的测量数据即可。全部特征量数据220包括成为作为评价对象的集成模型的选项的模型(弱识别器)所使用的全部特征量。在计算出全部特征量数据220时,用户输入输出处理部201向模型评价部204输出模型的评价请求(S1005)。模型评价部204接受全部特征量数据220的输入(S1006),执行各模型的评价,将包括评价结果的模型数据215储存到存储设备105(S1007)。图11示出模型数据215的数据构造。
模型ID2151是确定构成集成模型的模型(弱识别器)的ID。在算法2152中储存有在各个模型中使用的算法,在目标变量2153中储存有模型的目标变量(例如在图3的例子中是健康步行、异常步行1、异常步行2),在模型数据2154中储存有模型的二进制数据。模型评价部204评价的结果被储存到处理速度2155、性能指标2156。处理速度2155表示从向各模型输入特征量至输出识别结果为止的时间。另外,在性能指标2156中,储存有为了定义集成模型的性能要件而使用的每个性能指标(在分析设定数据213中示出的性能指标)的评价结果。
图12是在集成模型中使用的模型(弱识别器)的选择以及计算的特征量的选择流程。图12的流程优选为由进行实际的分析的信息处理装置、即在本实施例中执行图6的处理流程的PC600进行。根据信息处理装置的运算性能、状态,特征量的计算、基于模型的识别所需的时间不同。因此,通过由进行实际的分析的信息处理装置进行集成模型的构筑以及计算的特征量的选择,能够提高集成模型的性能、制约的事先评价结果的可靠性。
分析者1000针对用户输入输出处理部201进行集成模型制作操作(S1201)。用户输入输出处理部201向集成模型制作处理部207输出集成模型制作请求(S1202)。集成模型制作处理部207接受储存于存储设备105的分析设定数据213、测量数据211、模型数据215、域知识数据217的输入(S1203~S1206),制作确定构成满足预定的性能要件以及制约要件的集成模型的模型的集成模型数据218以及指定为了该集成模型而需要计算的特征量的选择特征量数据216,并储存到存储设备105(S1207~S1208)。
图13示出集成模型制作处理部207执行的集成模型决定流程。首先,PC600接受关于所使用的分析对象(被测量者层)的选择(S1301)。通过比对所输入的分析对象(被测量者层)和分析设定数据213,能够得到集成模型所要求的性能要件和制约要件。
接下来,选择在集成模型中使用的模型(弱识别器)候选(S1302)。在此,根据储存于模型数据215的处理速度2155以及性能指标2156,选择成为在集成模型中使用的候选的模型。在选择时,以使被指定为性能要件的性能指标变得最高的方式进行选择。此时,也可以选择多个候选。
接下来,关于应用了所选择的模型(弱识别器)候选的集成模型,评价基于实机的性能和分析时间(S1303)。在性能评价中,计算被指定为性能要件的性能指标。在评价的分析时间中,包括用于根据测量数据计算特征量数据而所需的时间以及用于根据特征量数据通过集成模型进行分析而所需的时间。此处的特征量数据的计算时间是为了计算利用由作为候选的模型构成的集成模型实施的分析所需的特征量而所需的时间。储存于模型数据215的处理速度2155不限于由PC600评价的处理速度,所以通过根据实际的测量数据211而使PC600进行分析,能够推测为了利用更准确的集成模型进行分析而所需的时间。在分析时间评价中使用的测量数据既可以是在模型的学习中使用的测量数据,也可以是PC600过去进行测量的测量数据,能够使用任意的测量数据。
如果基于实机的分析时间评价(S1303)满足分析对象的时间制约2135(参照图4)(在S1304中“是”),则将使用所选择的模型(弱识别器)的集成模型的性能信息显示于显示器等(S1307)。如果有多个候选,则分别与性能信息一起显示。分析者1000确认性能信息,从提示的模型的候选,决定在集成模型中使用的模型(弱识别器)(S1308)。
在基于实机的分析时间评价(S1303)不满足分析对象的时间制约2135的情况下(在S1304中“否”),根据被指定为性能要件的性能指标、在S1303中评价的分析时间以及作为制约要件的时间制约的偏离,以使被指定为性能要件的性能指标尽可能变高的方式选择模型候选(S1305)。
此时,进而也可以根据特征量的重要度、在S1303中评价的分析时间以及作为制约要件的时间制约的偏离,以限制计算的特征量的方式进行选择(S1306)。作为特征量的重要度,考虑分析算法上的重要度和分析结果的向被测量者说明的重要度这双方。前者能够根据模型数据2154的二进制数据来判断,后者能够根据域知识数据217来判断。通过针对构成集成模型的至少1个模型,省略分析结果或者向其说明的影响小的特征量的计算(将这个状态称为“输入限制状态”),从而能够期待一边极力防止性能的下降,一边削减特征量的计算所需的时间。在S1305、S1306中也能够选择多个候选。
根据所选择的模型候选以及特征量候选,再次进行基于实机的性能以及分析时间的评价(S1303),直至得到满足时间制约的模型候选以及特征量候选为止,一边改变构成集成模型的模型(弱识别器)的组合、特征量的选择,一边反复进行选择和基于实机的集成模型评价。
图14是集成模型制作处理部207输出的集成模型数据218的数据构造。关于被登记为模型数据215的各个模型(弱识别器),登记有向集成模型的采用/不采用。
图15是集成模型制作处理部207输出的选择特征量数据216的数据构造。关于数据分析装置100能够计算的各个特征量,登记有向集成模型的采用/不采用。
以上,根据实施方式具体地说明了由本发明者完成的发明,但不限于此,能够在不脱离其要旨的范围中进行各种变更。在本实施例中以进行被测量者的步行形态的分析的步行形态分析装置为例而进行了说明,但能够广泛地应用于使用集成模型进行数据分析的装置、系统、方法、程序。
Claims (15)
1.一种数据分析装置,使用合并基于第1~第n模型的推理而进行推理的集成模型来进行数据分析,其中,
所述数据分析装置具有:
处理器;
存储器;
存储设备;以及
数据分析程序,被读入到所述存储器,并由所述处理器执行,
所述存储设备储存登记有分别包括1个以上的模型的第1~第n模型群的模型数据,从所述模型数据的第i模型群选择构成集成模型的第i模型(1≤i≤n),所述第1~第n模型群的至少1个模型群包括多个模型,
所述数据分析程序具有:
集成模型制作处理部,分别从所述第1~第n模型群,提示能够构成满足针对所述数据分析的性能要件以及针对所述数据分析所需的时间的制约要件的集成模型的所述第1~第n模型的选项;以及
集成分析处理部,接受所提示的所述第1~第n模型的选项的选择,利用使用所选择的所述第1~第n模型的集成模型进行推理。
2.根据权利要求1所述的数据分析装置,其中,
所述存储设备储存对多个分析对象的每个分析对象的所述性能要件以及所述制约要件进行设定的分析设定数据,
所述集成模型制作处理部提示能够构成满足所述多个分析对象之中的所述数据分析视为对象的分析对象的所述性能要件以及所述制约要件的集成模型的所述第1~第n模型的选项。
3.根据权利要求2所述的数据分析装置,其中,
由性能指标和所述性能指标的阈值定义所述性能要件,
设定与所述多个分析对象对应的指标作为所述性能指标。
4.根据权利要求2所述的数据分析装置,其中,
所述制约要件被设置为分析时间的上限,该分析时间包括用于根据测量数据计算特征量数据而所需的时间以及用于根据特征量数据使用集成模型进行所述数据分析而所需的时间。
5.根据权利要求4所述的数据分析装置,其中,
所述集成模型制作处理部设为在向提示的所述第1~第n模型的选项之中的至少1个模型输入的特征量被选择的输入限制状态下进行推理,提示能够构成在所述输入限制状态下满足所述性能要件以及所述制约要件的集成模型的所述第1~第n模型的选项。
6.根据权利要求5所述的数据分析装置,其中,
所述存储设备具有表示所述数据分析视为对象的分析对象中的特征量的重要性的域知识数据,
所述集成模型制作处理部根据所述域知识数据以及模型中的该特征量的重要性,选择向所述输入限制状态下的集成模型输入的特征量。
7.根据权利要求5所述的数据分析装置,其中,
所述集成模型制作处理部接受所提示的所述第1~第n模型的选项的选择,将指定在所述集成分析处理部所使用的集成模型中使用的所述第1~第n模型的集成模型数据以及指定作为向所述集成分析处理部所使用的集成模型输入的特征量而被选择的特征量的选择特征量数据,储存到所述存储设备。
8.根据权利要求7所述的数据分析装置,其中,
所述数据分析程序具有特征量计算处理部,该特征量计算处理部根据测量数据计算特征量数据,
所述特征量计算处理部关于在所述选择特征量数据中指定的特征量,根据所述测量数据计算所述特征量数据,
所述集成分析处理部向使用了在所述集成模型数据中指定的所述第1~第n模型的集成模型输入所述特征量计算处理部计算出的所述特征量数据而进行推理。
9.根据权利要求8所述的数据分析装置,其中,
所述特征量计算处理部在预先决定的时间段中,关于在所述选择特征量数据中未指定的特征量,根据所述测量数据计算所述特征量数据。
10.根据权利要求9所述的数据分析装置,其中,
将所述特征量计算处理部根据所述测量数据计算出的所述特征量数据利用于在所述存储设备中储存的模型的学习。
11.一种数据分析方法,使用合并基于第1~第n模型的推理而进行推理的集成模型来进行数据分析,其中,
预先存储登记有分别包括1个以上的模型的第1~第n模型群的模型数据,从所述模型数据的第i模型群选择构成集成模型的第i模型(1≤i≤n),所述第1~第n模型群的至少1个模型群包括多个模型,
分别从所述第1~第n模型群,提示能够构成满足针对所述数据分析的性能要件以及针对所述数据分析所需的时间的制约要件的集成模型的所述第1~第n模型的选项,
接受所提示的所述第1~第n模型的选项的选择,利用使用所选择的所述第1~第n模型的集成模型进行推理。
12.根据权利要求11所述的数据分析方法,其中,
设为在向提示的所述第1~第n模型的选项之中的至少1个模型输入的特征量被选择的输入限制状态下进行推理,提示能够构成在所述输入限制状态下满足所述性能要件以及所述制约要件的集成模型的所述第1~第n模型的选项。
13.根据权利要求12所述的数据分析方法,其中,
关于向进行所述数据分析的集成模型输入的第1特征量,根据测量数据计算第1特征量数据,
向进行所述数据分析的集成模型输入计算出的所述第1特征量数据而进行推理。
14.根据权利要求13所述的数据分析方法,其中,
在预先决定的时间段中,关于所述第1特征量以外的第2特征量,根据所述测量数据计算第2特征量数据。
15.一种数据分析程序,在存储登记有分别包括1个以上的模型的第1~第n模型群的模型数据的信息处理装置上使用合并基于第1~第n模型的推理而进行推理的集成模型来进行数据分析,其中,
从所述模型数据的第i模型群选择构成集成模型的第i模型(1≤i≤n),所述第1~第n模型群的至少1个模型群包括多个模型,
所述数据分析程序具有:
第1工序,分别从所述第1~第n模型群,提示能够构成满足针对所述数据分析的性能要件以及针对所述数据分析所需的时间的制约要件的集成模型的所述第1~第n模型的选项;以及
第2工序,接受所提示的所述第1~第n模型的选项的选择,利用使用所选择的所述第1~第n模型的集成模型进行推理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-132543 | 2019-07-18 | ||
JP2019132543A JP7269122B2 (ja) | 2019-07-18 | 2019-07-18 | データ分析装置、データ分析方法及びデータ分析プログラム |
PCT/JP2020/024353 WO2021010093A1 (ja) | 2019-07-18 | 2020-06-22 | データ分析装置、データ分析方法及びデータ分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114041152A true CN114041152A (zh) | 2022-02-11 |
Family
ID=74209800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080048103.9A Pending CN114041152A (zh) | 2019-07-18 | 2020-06-22 | 数据分析装置、数据分析方法以及数据分析程序 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220246302A1 (zh) |
EP (1) | EP4002232A4 (zh) |
JP (1) | JP7269122B2 (zh) |
CN (1) | CN114041152A (zh) |
TW (1) | TWI755782B (zh) |
WO (1) | WO2021010093A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022139417A (ja) * | 2021-03-12 | 2022-09-26 | オムロン株式会社 | 統合モデルの生成方法、画像検査システム、画像検査用モデルの生成装置、画像検査用モデルの生成プログラム及び画像検査装置 |
EP4343620A1 (en) * | 2021-05-18 | 2024-03-27 | Resonac Corporation | Prediction device, learning device, prediction method, learning method, prediction program, and learning program |
TWI780735B (zh) * | 2021-05-28 | 2022-10-11 | 長庚大學 | 影像分析之方法 |
CN118313342B (zh) * | 2024-06-11 | 2024-08-06 | 鲁欧智造(山东)数字科技有限公司 | 一种用于电子器件的热仿真方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3224822A1 (de) | 1982-07-02 | 1984-01-05 | Siemens AG, 1000 Berlin und 8000 München | Schalter mit lichtbogenloeschung |
EP3865875A1 (en) * | 2011-09-25 | 2021-08-18 | Labrador Diagnostics LLC | Systems and methods for multi-analysis |
US20140188768A1 (en) * | 2012-12-28 | 2014-07-03 | General Electric Company | System and Method For Creating Customized Model Ensembles On Demand |
JP6208018B2 (ja) * | 2014-01-08 | 2017-10-04 | 株式会社東芝 | 画像認識アルゴリズム組合せ選択装置 |
US9489630B2 (en) * | 2014-05-23 | 2016-11-08 | DataRobot, Inc. | Systems and techniques for predictive data analytics |
JP5906556B1 (ja) * | 2014-10-17 | 2016-04-20 | パナソニックIpマネジメント株式会社 | モニタリング装置、モニタリングシステムおよびモニタリング方法 |
EP3238611B1 (en) * | 2016-04-29 | 2021-11-17 | Stichting IMEC Nederland | A method and device for estimating a condition of a person |
WO2019005098A1 (en) * | 2017-06-30 | 2019-01-03 | Go Logic Decision Time, Llc | METHODS AND SYSTEMS FOR PROJECTIVE ASSERTION SIMULATION |
US20190110754A1 (en) * | 2017-10-17 | 2019-04-18 | Satish Rao | Machine learning based system for identifying and monitoring neurological disorders |
JP6992475B2 (ja) * | 2017-12-14 | 2022-01-13 | オムロン株式会社 | 情報処理装置、識別システム、設定方法及びプログラム |
-
2019
- 2019-07-18 JP JP2019132543A patent/JP7269122B2/ja active Active
-
2020
- 2020-06-22 EP EP20841123.1A patent/EP4002232A4/en active Pending
- 2020-06-22 CN CN202080048103.9A patent/CN114041152A/zh active Pending
- 2020-06-22 US US17/621,884 patent/US20220246302A1/en active Pending
- 2020-06-22 WO PCT/JP2020/024353 patent/WO2021010093A1/ja unknown
- 2020-07-06 TW TW109122708A patent/TWI755782B/zh active
Also Published As
Publication number | Publication date |
---|---|
EP4002232A4 (en) | 2023-08-09 |
EP4002232A1 (en) | 2022-05-25 |
TW202103635A (zh) | 2021-02-01 |
JP7269122B2 (ja) | 2023-05-08 |
WO2021010093A1 (ja) | 2021-01-21 |
JP2021018508A (ja) | 2021-02-15 |
US20220246302A1 (en) | 2022-08-04 |
TWI755782B (zh) | 2022-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114041152A (zh) | 数据分析装置、数据分析方法以及数据分析程序 | |
US11883225B2 (en) | Systems and methods for estimating healthy lumen diameter and stenosis quantification in coronary arteries | |
KR102216689B1 (ko) | 시계열 의료 데이터를 통한 질병 예후 예측을 위한 딥 뉴럴 네트워크의 분류 결과 시각화 방법 및 시스템 | |
Zhao et al. | Applying incremental Deep Neural Networks-based posture recognition model for ergonomics risk assessment in construction | |
CN112164448B (zh) | 免疫治疗疗效预测模型训练方法、预测系统及方法和介质 | |
CN115699204A (zh) | 基于多个机器学习模型的临床预测因子 | |
CN109858212A (zh) | 用于数字密码软键盘的身份识别方法、装置和终端 | |
CN117038055B (zh) | 一种基于多专家模型的疼痛评估方法、系统、装置及介质 | |
JP2023532292A (ja) | 機械学習ベースの医療データチェッカ | |
CN113674862A (zh) | 一种基于机器学习的急性肾功能损伤发病预测方法 | |
Jain et al. | Early detection of brain tumor and survival prediction using deep learning and an ensemble learning from radiomics images | |
US11564634B2 (en) | Determining health state of individuals | |
US20220319002A1 (en) | Tumor cell isolines | |
KR102417602B1 (ko) | 인공 지능 모델 기반 종양 관리 장치 및 방법 | |
CN115171906A (zh) | 一种基于机器学习的前列腺癌筛查和诊断方法 | |
US11742081B2 (en) | Data model processing in machine learning employing feature selection using sub-population analysis | |
Raheem et al. | Developing a predictive health care system for diabetes diagnosis as a machine learning-based web service | |
Kortum et al. | Improving the decision support in diagnostic systems using classifier probability calibration | |
CN113688853A (zh) | 感测数据智能检测方法与系统 | |
CN116052889B (zh) | 一种基于血液常规指标检测的sFLC预测系统 | |
US20240221940A1 (en) | Apparatus and method for exploring optimized treatment pathway through model-based reinforcement learning based on similar episode sampling | |
US20230368920A1 (en) | Learning apparatus, mental state sequence prediction apparatus, learning method, mental state sequence prediction method and program | |
US20240160947A1 (en) | Learning device, learning method, and storage medium | |
Romo et al. | Industry 4.0 in the Health Sector: System for Melanoma Detection | |
Adebiyi et al. | Systemic Lupus Erythematosus (SLE) Detection Using Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |