CN107851295A - 数据分析设备、数据分析方法和存储数据分析程序的存储介质 - Google Patents

数据分析设备、数据分析方法和存储数据分析程序的存储介质 Download PDF

Info

Publication number
CN107851295A
CN107851295A CN201680041982.6A CN201680041982A CN107851295A CN 107851295 A CN107851295 A CN 107851295A CN 201680041982 A CN201680041982 A CN 201680041982A CN 107851295 A CN107851295 A CN 107851295A
Authority
CN
China
Prior art keywords
data
field
attribute
employee
health status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680041982.6A
Other languages
English (en)
Other versions
CN107851295B (zh
Inventor
小阪勇气
福西广晃
田中博典
中道将司
冈本悠佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Publication of CN107851295A publication Critical patent/CN107851295A/zh
Application granted granted Critical
Publication of CN107851295B publication Critical patent/CN107851295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • G06Q10/1091Recording time for administrative or management purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06398Performance of employee with respect to a job function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Development Economics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

根据本发明,信息关于与建议者已经聚焦于的任意地定义的项目有关的具体字段被提供,并且被包括在包括出勤数据的与雇员的健康状况有关的数据中。这一数据分析设备被提供有:数据获取装置51,其获取两个或者更多个雇员的健康状况数据和出勤数据;属性数据生成装置52,其针对雇员中的每个雇员,通过使用预定时间分辨率、预定时间范围和预定聚合方法来生成出勤数据的预定字段的属性数据;模型学习装置53,其使用指定的目标字段作为对象变量并且使用属性数据的字段中的每个字段作为说明变量来学习由多项式表达式表达的模型;有关字段提取装置54,其基于学习的模型来提取与目标字段有关的属性数据的字段;以及概括装置55,其基于关于提取的字段的信息来概括和输出指定的雇员的出勤数据。

Description

数据分析设备、数据分析方法和存储数据分析程序的存储 介质
技术领域
公开的主题内容涉及一种数据分析设备、数据分析方法和存储用于支持对公司等的健康指导的数据分析程序的存储介质。
背景技术
维持或者促进属于用于开展业务的组织的雇员或者个人(下文被简称为“雇员”)的健康对于管理组织的雇主或者个人(下文被简称为“雇主”)是很重要的作用之一。鉴于上述,雇主提供保健工作者(比如行业医师和公共健康护士),并且实施与用于雇员的体检或者健康指导有关的许多措施。
保健工作者基于雇员的与生活方式习惯(比如饮食、锻炼习惯、睡眠习惯和吸烟习惯)有关的体检结果或者面试结果来向雇员提供用于健康促进的意见作为健康指导。
已经出于由保健工作者为雇员执行的健康指导的效率而开发了设备。该设备从雇员的与生活方式习惯有关的体检结果或者面试结果提取关于雇员的健康和生活方式习惯的特征。
例如,PTL 1描述了一种健康支持系统,其中基于个体的关于生活方式习惯的体检结果和面试结果对寻求意见的多个个体分组,并且基于为每组提取的关于健康状况和生活方式习惯的特征来提供用于健康维护/促进的建议。
例如,使用在PTL 1中描述的技术使得有可能提供设备以使得属于其中血压与其它组相比为高的组的个体从医学观点来看需要摄入少盐饮食以便降低血压。
[引用列表]
[专利文献]
[PTL 1]日本待审专利公开号2010-170534
发明内容
[技术问题]
雇员的健康状况在许多情况下依赖于生活方式习惯。因此,掌握生活方式习惯的退化因素以便执行有效健康指导是重要的。
作为生活方式习惯的退化因素,以在雇员的日常生活中的基本事项(主要地是与生活状况有关的事项)(比如饮食、锻炼和睡眠)的退化为例。然而,在办公室加班(比如长久工作小时或者不规律换班)可以与生活方式习惯的退化有关。例如,雇员的身体可能无意识地遭受由在工作时或者在办公环境中的精神压力触发的严重疾病。
鉴于以上内容,为了有效地向雇员提供建议,除了雇员的与生活方式习惯(比如饮食、锻炼和睡眠)有关的体检结果或者面试结果之外,还准确地掌握/了解工作情形(比如日常加班小时、休假的频率和假期工作)的频率是重要的。
情况经常是建议者(比如执行健康指导的护理工作者)利用出勤数据作为用于检查雇员的工作情形的重要信息源。出勤数据是如下信息,其中以时序方式排列与每个雇员的工作情形有关的事项(比如日常到达时间、日常离开时间、存在或者不存在工作、存在或者不存在休假和加班小时)。
一般地,出勤数据包括数十个字段。另外,在许多字段中,数据被记录并且以每天添加一个记录这样的方式增加。除了字段数目之外,出勤数据记录数目往往也增加,但是用于每个雇员的健康指导时间有限。因此,建议者难以在有限时间内检查所有这些多条信息。
如以上描述的那样,存在如下问题,即建议者可能不容易从出勤数据获得与健康状况关联的具体工作情形(例如,存在或者不存在加班、不规律换班等或者其程度),因为待检查的出勤数据数量大。
PTL 1描述通过从与健康状况及其管理有关的数据的协方差结构分析来生成多个健康状况组,并且向属于这些健康状况组的个人呈现特征特性作为用于在留在组中或者移向另一组时使用的推荐的项目数据。根据前述配置,健康指引者能够基于呈现的推荐的项目数据来提供建议(比如呈现推荐的行为信息)。
然而,在PTL 1中描述的方法仅提取指示属于每组的特征特性的项目,而无法提取对于建议者的意图、项目的相关程度等而言适合的项目。例如,假设建议者聚焦于某个症状并且希望在出勤数据之中没有呈现除了与症状具体地关联的字段之外的字段。在这一情况下,没有确保根据存在或者不存在症状或者症状的程度来执行分组,即使在应用在PTL 1中描述的方法时。另外,建议者可以在另一定时聚焦于另一症状,并且可以希望在出勤数据之中没有呈现除了与症状具体地关联的字段之外的字段。然而,PLT 1完全没有描述用于根据建议者的意图来适当地概括(比如选择和处理信息)和呈现出勤数据的方法。
鉴于上述内容,公开的主题内容的目的是提供一种允许建议者容易地获得被包括在与雇员的健康状况关联的数据(包括与建议者聚焦的任何项目关联的出勤数据)中的具体字段信息的数据分析设备、数据分析方法和数据分析程序。
[问题解决方案]
根据公开的主题内容的一个方面,一种数据分析设备包括:数据获取装置,用于至少获取对目标字段的指明以及两个或者更多个雇员的健康状况数据和出勤数据,目标字段是来自被包括在健康状况数据中的字段之中的、要从其提取相关性的字段,健康状况数据是与雇员的健康状况有关的信息,出勤数据是与工作状况有关的信息;属性数据生成装置,用于通过使用预定时间分辨率、时间范围和聚合方法来关于被包括在雇员的每个雇员的出勤数据中的预定字段执行聚合,并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段;模型学习装置,用于通过使用两个或者更多个雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型,在模型中,目标字段是对象变量,并且被包括在属性数据中的属性字段中的每个属性字段是说明变量,模型由多项式表示;有关字段提取装置,用于提取由学习的模型表示并且与目标字段关联的属性字段;以及概括装置,用于基于关于提取的属性字段的信息来概括和输出指明的雇员的出勤数据。
根据公开的主题内容的一个方面,一种数据分析方法包括:使得信息处理设备至少获取对目标字段的指明以及两个或者更多个雇员的健康状况数据和出勤数据,目标字段是来自被包括在健康状况数据中的字段之中的、要从其提取相关性的字段,健康状况数据是与雇员的健康状况有关的信息,出勤数据是与工作状况有关的信息;使得信息处理设备通过使用预定时间分辨率、时间范围和聚合方法来关于被包括在雇员的每个雇员的出勤数据中的预定字段执行聚合,并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段;使得信息处理设备通过使用两个或者更多个雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型,在模型中,目标字段是对象变量,并且被包括在属性数据中的属性字段中的每个属性字段是说明变量,模型由多项式表示;使得信息处理设备提取由学习的模型表示并且与目标字段关联的属性字段;以及使得信息处理设备基于关于提取的属性字段的信息来概括和输出指明的雇员的出勤数据。
根据公开的主题内容的一个方面,一种存储数据分析程序的存储介质,该数据分析程序使得计算机执行:至少获取对目标字段的指明以及两个或者更多个雇员的健康状况数据和出勤数据的处理,目标字段是来自被包括在健康状况数据中的字段之中的、要从其提取相关性的字段,健康状况数据是与雇员的健康状况有关的信息,出勤数据是与工作状况有关的信息;通过使用预定时间分辨率、时间范围和聚合方法来关于被包括在雇员的每个雇员的出勤数据中的预定字段执行聚合并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段的处理;通过使用两个或者更多个雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型的处理,在模型中,目标字段是对象变量,并且被包括在属性数据中的属性字段中的每个属性字段是说明变量,模型由多项式表示;提取由学习的模型表示并且与目标字段关联的属性字段的处理;以及基于关于提取的属性字段的信息来概括和输出指明的雇员的出勤数据的处理。
[发明的有利效果]
根据公开的主题内容,建议者能够容易地获得被包括在与雇员的健康状况关联的数据(包括与建议者聚焦的任何项目关联的出勤数据)中的具体字段信息。
附图说明
图1是图示第一示例实施例中的数据分析设备的配置示例的框图;
图2是图示数据分析设备10的硬件配置的示例的配置图;
图3是图示第一示例实施例中的数据分析设备10的操作的示例的流程图;
图4是图示在出勤数据与关于出勤数据的时间分辨率之间的时序关系的说明图;
图5是图示出勤数据的示例的说明图;
图6是图示属性数据设置信息的示例的说明图;
图7是图示属性数据的示例的说明图;
图8是图示包括作为学习的结果被获得的模型参数的属性表的示例的说明图;
图9是图示出勤数据的概括结果的示例的说明图;
图10是图示第一修改示例中的出勤数据的示例的说明图;
图11是图示第一修改示例中的出勤数据的另一示例的说明图;
图12是图示第二修改示例中的数据分析设备的配置示例的框图;
图13是图示第二修改示例中的数据分析设备的操作的示例的流程图;
图14是图示第三修改示例中的属性数据设置信息的示例的说明图;
图15是图示第三修改示例中的属性数据的示例的说明图;
图16是图示属性表的另一示例的说明图;
图17是图示出勤数据和体检数据的概括结果的示例的说明图;
图18是图示第三修改示例中的在出勤数据与体检日之间的关系的说明图;
图19是图示第四修改示例中的数据分析设备的配置示例的框图;
图20是图示第四修改示例中的分组示例的说明图;以及
图21是图示根据公开的主题内容的数据分析设备的概括的框图。
具体实施方式
第一示例实施例
在下文中,参照附图描述公开的主题内容的示例实施例。图1是图示公开的主题内容的第一示例实施例中的数据分析设备的配置示例的框图。
图1中所示的数据分析设备10包括数据输入单元11、属性数据生成单元12、模型学习单元13、有关字段提取单元14和概括单元15。
数据输入单元11接收对于数据分析设备10的每个处理单元而言必需的信息。
输入信息可以例如包括对目标字段的指明、以往和出勤数据中的健康状况数据等。对目标字段的指明是来自被包括在作为与雇员的健康状况有关的数据的健康状况数据中的字段之中的、要从其提取相关性的字段。出勤数据包括用于比数据测量日更早的预定时段的数据,该数据测量日是在测量健康状况数据时的日子。
在下文中,通过使用示例来描述如下情况,其中健康状况数据是指示与雇员的健康有关的体检(检查)或者面试的结果的体检数据,并且数据测量日是体检日(在有多个日子时为这些日子之一),该体检日是在获取体检数据时的日子。健康状况数据和数据测量日不限于这些。另外,在广义上在健康状况数据中也包括出勤数据。
例如,数据输入单元11除了前述信息之外还可以接收指示如后文将描述的属性数据生成方法的信息。
目标字段可以是被包括在健康状况数据中的字段中的任何字段,并且也可以是多个字段。
属性数据生成单元12基于接收的出勤数据来生成属性数据,该属性数据指示关于每个雇员的工作状况的各种特征。更具体地,属性数据生成单元12生成通过在预定时间分辨率(比如每个月、一年的每个季度、每半年或者每年)为出勤数据的每个字段在每个雇员的各种时间范围中聚合信息而获得的属性数据。聚合方法(具体为用于在聚合时使用的计算方法)不限于一种,并且可以使用多种计算方法。另外,优选通过关于一个出勤字段使用多个时间分辨率和时间范围来执行聚合。
模型学习单元13通过使用多个雇员的接收的体检数据和接收的出勤数据来学习用于在从每个说明变量的值计算对象变量的值时使用的、由多项式表示的模型。对象变量、目标字段和说明变量是属性数据的每个字段(下文被称为属性字段)。模型学习单元13具体地学习多项式中的每个说明变量的系数。
有关字段提取单元14提取由学习的模型表示并且与目标字段关联的属性字段。有关字段提取单元14可以具体地提取与具有除了零之外的系数值的说明变量关联的属性字段。有关字段提取单元14可以提取与在生成属性字段时使用的出勤字段和关于该字段的概括方法有关的信息作为提取的属性字段信息(比如关于出勤字段的时间分辨率、时间范围和聚合方法)。除了上述内容之外,有关字段提取单元14还可以提取系数值作为指示相关程度的信息。
概括单元15基于由有关字段提取单元14的提取结果来概括和输出出勤数据。例如,概括单元15可以通过排除在从指明的雇员的出勤数据生成提取的属性字段时使用的、除了出勤字段之外的字段来输出。例如,概括单元15可以通过与系数值一起使用提取的时间分辨率、提取的时间范围和提取的聚合方法、关于来自指明的雇员的出勤数据之中的、在生成提取的属性字段时使用的出勤字段来输出聚合结果。
注意,在时间分辨率是一天等时,假设在“聚合”中包括其中原样输出原始数据的情况。另外,可以已经保持聚合结果作为属性字段的属性值。在这一情况下,概括单元15可以省略聚合处理。
另外,图2是图示数据分析设备10的硬件配置的示例的配置图。图2中所示的数据分析设备10包括中央处理单元(CPU)1001、存储器1002、输出设备1003、输入设备1004和网络接口1005。
存储器1002例如是随机存取存储器(RAM)、只读存储器(ROM)、辅助存储设备(比如硬盘)等。输出设备1003例如是用于输出信息的设备(比如显示设备或者打印机)。输入设备1004例如是用于接收用户操作的输入的设备(比如键盘或者鼠标)。网络接口1005例如是待连接到由因特网、局域网(LAN)、公共网络、无线通信网络、这些网络的组合等的接口。
例如,图1中所示的数据分析设备10的前述功能块中的每个功能块由通过读取来执行被存储在存储器1002中的计算机程序并且控制其它单元中的每个单元的CPU 1001配置。注意,数据分析设备10及其每个功能块的硬件配置不限于前述配置。
注意,数据输入单元11除了从外界接收之外还可以从存储器1002读取前述输入信息。
接着描述本示例实施例的操作。图3是图示本示例实施例的数据分析设备10的操作的示例的流程图。在图3中所示示例中,首先,数据输入单元11指明目标字段并且接收每个雇员的体检数据和出勤数据(步骤S11)。
图4是图示在作为输入信息的出勤数据与关于出勤数据的时间分辨率之间的时序关系的说明图。如图4(a)中所示,出勤数据可以包括用于比在确定时间(例如,在提供建议时的时间点)之前的最晚体检日更早的预定时段(例如,一年)的记录。注意,图4(a)图示如下示例,其中前述预定时段的最后一天是体检日。可以在用作出勤数据收集时段的预定时段与体检日之间提供任何数目的日子。例如,如图4(b)中所示,通过假设比最晚体检日更早的任何时间点(例如,年末)是第一时间点,出勤数据可以包括用于在第一时间点之前的预定时段的记录。另外,体检日不限于最晚日子。换而言之,出勤数据可以包括在包括预定时段的时间范围中的记录,只要时间范围没有超过在获取要从其提取相关性的目标字段的内容时的日子(体检日)。另外,没有具体地限制用于在生成属性数据时使用的时间分辨率,只要时间分辨率是比整个出勤数据的时间范围更短的时段。
另外,图5是图示出勤数据的配置示例的说明图。如图5中所示,出勤数据可以是如下信息,其中以时序方式排列与每个雇员的工作状况有关的事项(比如日常到达时间、日常离开时间、存在或者不存在工作、存在或者不存在休假和加班小时)。在本示例实施例中,被包括在出勤数据中的、与工作状况有关的每个事项被称为字段,具体为出勤字段。另外,被包括在出勤数据中的、在某个时间点的每个出勤字段的值集合被称为出勤数据记录。注意,图5图示具有雇员编号=10的雇员的出勤数据的示例。以与以上描述相同的方式输入其他雇员的出勤数据。
接着,属性数据生成单元12通过使用任何时间分辨率、任何时间范围和任何聚合方法来关于被包括在出勤数据中的预定字段执行聚合;并且生成属性数据(步骤S12)。
图6是图示属性数据设置信息的示例的说明图。属性数据生成单元12可以例如如图6中所示根据指示属性数据生成方法的属性数据设置信息、关于出勤字段来执行聚合处理,并且可以生成属性数据。图6图示用于每个属性字段的属性数据设置信息的示例,该属性数据设置信息包括标识符、概括、用于聚合的出勤字段、出勤字段的时间分辨率、出勤字段的时间范围和关于出勤字段的聚合方法。属性数据生成单元12可以基于由这样的属性数据设置信息指示的时间分辨率、时间范围和聚合方法、关于指明的出勤字段来执行聚合处理,并且可以生成包括每个聚合结果的属性数据作为属性字段。这里,一个属性字段的值可以通过使用多个出勤字段被计算。作为示例,以将通过使用多个出勤字段的值来计算的比值为例。在这一情况下,在属性数据设置信息中登记多个出勤字段作为用于聚合的出勤字段。
图7是图示属性数据的示例的说明图。如图7中所示,属性数据生成单元12可以生成指示每个属性字段的值的属性数据(聚合结果)作为用于每个雇员的属性值。
接着,模型学习单元13通过使用多个雇员的体检数据(具体为目标字段的值)和属性数据(具体为每个属性字段的值)来学习由多项式构成的模型,其中目标字段是对象变量,并且被包括在在步骤S12中生成的属性数据中的属性字段中的每个属性字段是说明变量(步骤S13)。
接着,有关字段提取单元14提取由在步骤S13中学习的模型表示并且与目标字段关联的属性字段(步骤S14)。这里,有关字段提取单元14例如可以提取与说明变量关联的字段信息,从而使得模型参数(多项式的系数)具有除了零之外的值。
接着,概括单元15基于在步骤S14中提取的信息来概括指明的雇员的出勤数据,并且输出概括的出勤数据作为与指明的目标字段关联的出勤数据信息(步骤S15)。这里,对雇员的指明不限于一个人,并且可以指明多个雇员(包括所有雇员)。在这一情况下,概括单元15可以概括指明的雇员中的每个指明的雇员的出勤数据,并且可以输出概括的出勤数据作为与指明的目标字段关联的出勤数据信息。
注意,在设置多个目标字段时,可以对于目标字段中的每个目标字段重复步骤S13至步骤S15的操作。
随后更具体地描述步骤S12至步骤S15的操作。
(1)属性数据生成阶段(步骤S12)的操作的更具体示例。
在本示例中,假设接收N个雇员的出勤数据。注意,N是整数1或者更大。另外,第n雇员的属性数据被表达为X_n。这里,n=1,…,N。本示例的属性数据X_n被表达为由多个元素构成的矢量。例如,假设属性数据的元素数目(字段数目)是七。在这一情况下,属性数据生成单元12可以生成被表达为X_1=(0,0,3,2,1,0,0)的数据作为第一雇员的属性数据。这意味着关于第一雇员,第一属性字段的值是0,第二属性字段的值是0,第三属性字段的值是3,第四属性字段的值是2,第五属性字段的值是1,第六属性字段的值是0,并且第七属性字段的值是0。属性数据生成单元12生成每个雇员的属性数据,并且在存储器1002中存储生成的属性数据。
例如,在图6中所示的示例的情况下,在第一属性字段的元素(属性值)中接收对在从2014年一月一号到2014年一月三十一号的时段期间雇员的休假次数进行计数的结果,更具体为通过对在指明的一个月的时间范围中出勤字段=“休假”的值求和而获得的结果值。注意,从图7清楚的是在雇员:雇员编号=1的属性数据中的属性值是1。
这里,某个雇员的属性数据的元素(属性字段)之一可以是已经经历通过使用关于某个雇员的出勤数据的任何时间分辨率的聚合处理的休假次数、工作小时、连续休假次数、迟到次数等。例如,在每月休假次数的情况下,计算在雇员在该月内休假时的总天数作为属性字段的属性值。另外,在每月平均工作小时的情况下,计算(该月的总工作小时除以该月的工作天数)作为属性字段的属性值。注意,图7图示如下示例作为属性数据的元素,该示例至少包括关于雇员:雇员编号=1的每月休假次数、当年季度平均休假次数、半年平均休假次数、一年平均休假次数和每月平均工作小时。
(2)模型学习阶段(步骤S13)的操作的更具体示例
在下文中,雇员n的属性数据的第j元素被表达为X_nj。这里,j=1,…,M(M是属性数据的元素数目)。另外,在雇员n的体检数据之中的目标字段的值被表达为Y_n。下式(1)是表达在Y_n与X_n之间的关系的等式。
Y_n=f(X_n)…(1)
模型学习单元13学习为了表达由前式(1)指示的函数f()而必需的参数。在本示例中,假设f()是由多项式表达的函数,该多项式由说明变量和用于每个说明变量的系数构成。
这里假设X_n是与属性数据关联的在M个维度中的说明变量,并且Y_n是数值。另外,在假设W是在M个维度中的权值矢量时,前式(1)被表达为式(2)。注意,用于表达多项式的片段的一个维度可以与在M阶矢量中的W相加,并且可以设置第(M+1)阶权值矢量。在下文中,权值矢量W被视为第M阶矢量,只要权值矢量不限于第M阶矢量和第(M+1)阶矢量之一。
[式1]
Y_n=WTX_n…(2)
这里,上标T指明矢量的转置。
例如,假设为多个雇员给定目标字段的值和属性数据的集合,具体为{X_n,Y_n}(n=1,…,N)。在这一情况下,有可能通过优化下式(3)的对象函数来计算参数W的值。
[式2]
这里,λ是用于调整在平方求和(右侧第一项)的误差与惩罚项(右侧第二项)之间的平衡的参数。另外,||W||是W的范数。通常地,使用L1范数或者L2范数。另外,L(W)是与W有关的凸函数。有可能通过按照梯度方法的方法使L(W)最大化。
模型学习单元13例如可以获得使前式(3)的L(W)最大的参数W的值作为模型学习处理。在下文中,这里获得的参数W的值可以被表达为Wc。模型学习单元13在存储器1002中存储获得的Wc
图8是图示属性表的示例的说明图,该属性表包括作为学习的结果而被获得的模型参数Wc。图8图示如下示例,其中与第14和第20属性字段的系数对应的参数Wc_14和Wc_20具有除了零之外的值,并且参数Wc_1至Wc_13、Wc_15至Wc_19和Wc_21以及除了前述参数之外的随后参数具有零值。模型学习单元13可以在存储器1002中存储属性表,其中例如如图8中所示,属性字段的标识符和作为属性字段的系数而被获得的参数Wc_j相互关联。
(3)有关字段提取阶段的操作的更具体示例(步骤S14)
有关字段提取单元14例如从被存储在存储器1002中的属性表读取与多项式的系数对应的每个模型参数Wc_j(j=1,…,M)的值。
另外,有关字段提取单元14可以提取与在读取的Wc_j之中的具有除了零之外的值的Wc_j关联的属性字段的标识符。另外,有关字段提取单元14可以基于提取的标识符来提取在生成属性字段时使用的出勤字段、时间分辨率、时间范围和聚合方法的集合。
例如,有关字段提取单元14可以基于属性数据设置信息来提取在生成第j属性字段时使用的出勤字段以及关于出勤字段的时间分辨率、时间范围和聚合方法的集合,关于j具有在Wc_j(j=1,…,M)之中的是大于零的绝对值的|Wc_j|值。
这里,其中Wc_j具有负值的情况意味着有在目标字段与第j属性字段之间的负相关。另外,其中Wc_j具有正值的情况意味着有在目标字段与第j属性字段之间的正相关。注意,其中Wc_j是零的情况意味着在目标字段与第j属性字段之间不存在相关。
有关字段提取单元14可以关于与具有除了零之外的值的Wc_j关联的所有属性字段提取出勤字段以及关于出勤字段的时间分辨率、时间范围和聚合方法的集合作为由模型学习单元13的模型学习的结果。另外,有关字段提取单元14可以在存储器1002中存储提取的信息。
例如,在图8中所示的属性表的示例的情况下,由于与第14和第20属性字段的系数对应的参数Wc_14和Wc_20具有除了零之外的值,所以关于第14和第20属性字段,提取和在存储器1002中存储出勤字段以及关于出勤字段的时间分辨率、时间范围和聚合方法的集合。
(4)概括阶段的操作的更具体示例(步骤S15)
概括单元15从存储器1002读取作为与目标字段关联的属性字段信息而被存储的出勤字段、时间分辨率、时间范围和聚合方法的集合。另外,概括单元15基于读取的信息来概括指明的雇员的出勤数据,并且输出概括的结果。输出目的地可以是存储器1002、输出设备1003、将经由网络接口1005被连接的另一设备等。
图9是图示将由概括单元15输出的出勤数据的概括结果的示例的说明图。如图9中所示,概括单元15可以关于具有与目标字段的正或者负相关的所有属性字段、与出勤字段的概括、在生成时使用的出勤字段和正/负相关程度一起输出指明的雇员的属性值。这里,属性值与雇员的出勤数据的概括结果对应。另外,模型参数Wc_j与指示正/负相关程度的信息对应。注意,图9图示如下示例,其中除了前述信息之外也输出所有雇员的属性值的平均值。另外,虽然在图9中省略了图示,但是也可以输出关于概括方法的信息(比如时间分辨率、时间范围和聚合方法)。
例如,通过输出所有雇员的属性值的平均值,建议者能够容易地了解待指导的雇员(在这一情况下为雇员:雇员编号=1)的属性值是否大于或者小于其他雇员的属性值。这在健康指导中有帮助。
例如,在图9中所示的示例中,关于雇员:雇员编号=1,在出勤数据收集时段期间在一年的第二季度中的平均休假次数是2.7次,这大于所有雇员的平均次数(即2.3次)。另外,从模型参数Wc_j的值是属性字段的系数清楚的是属性字段的属性值,具体为在一年的第二季度中的平均休假次数具有与目标字段的正相关。这可以被解释为属性值越大,目标字段的值就越大。例如,作为具体示例,在假设目标字段是血糖水平时,属性字段的属性值越大,血糖水平的值就越大。建议者例如可以指出在一年的第二季度中的平均休假次数大作为雇员的目标字段的值高的因素之一。注意,关于一月平均工作小时也给出与以上描述相同的判断。
如以上描述的那样,容易地和具体地了解在目标字段与出勤数据之间的相关。因此,建议者能够提供适当建议。根据前述示例,建议者能够通过聚焦于在一年的第二季度中的平均休假次数和一月平均工作小时来从健康促进方面向雇员:雇员编号=1提供与工作状况有关的建议。
如以上描述的那样,本示例实施例不仅能够呈现与任何指明的体检字段关联的出勤字段,而且能够为建议者关于出勤字段和由这些方法实际地概括的出勤数据提供关于时间分辨率、时间范围、聚合方法等的准确信息。因此,建议者能够基于这些多条信息来提供适当建议。另外,建议者不仅能够概括和呈现出勤数据,而且能够提供被包括在概括的出勤数据中的出勤字段关于目标字段具有什么相关性及其程度(正或者负相关程度)。因此,建议者能够基于这些多条信息来提供更适当建议。
接着描述本示例实施例的一些修改示例。
[第一修改示例]
出于允许建议者从出勤数据容易地掌握了解在确定时间存在或者不存在与雇员的健康状况关联的工作状况等的目的而做出图1中所示数据分析设备。鉴于上述内容,数据分析设备表达在确定时间之前的体检数据与用于在比在通过多项式模型的系数获得体检数据时的体检日更早的预定时段的出勤数据之间的相关性,并且基于将通过学习模型而获得的每个系数的值来输出用于前述预定时段的每个雇员的出勤数据。
在另一方面,例如,对于建议者不仅出于在确定时间维持/促进雇员的健康状况的目的而执行健康指导,而且出于将来(比如在没有获得体检数据时之后的半年、一年或者三年)维持/促进雇员的健康状况的目的而在及早阶段将来执行用于健康促进的健康指导也是重要的。
鉴于上述内容,在第一修改示例中,有可能输出与在将来时间点与目标字段关联并且在当前时间点已经获取的出勤数据信息。
更具体地,向输入信息添加以下信息。也就是说,接收用于在学习时使用的第一出勤数据和用于在将来时间点呈现与目标字段的相关性时使用的第二出勤数据作为出勤数据。
图10是图示将在第一修改示例中接收的出勤数据的示例的说明图。如图10中所示,在本示例中的数据输入单元11可以例如接收第一出勤数据和第二出勤数据作为出勤数据,该第一出勤数据包括用于在比确定时间更早的预定第一时间点之前的第一时段的记录,该第二出勤数据包括用于在第二时间点之前的第一时段的记录,该第二时间点是从最晚体检日(第一体检日)回溯预定第二时段或者更长的预定时间点。注意,在图10中所示的示例中,第一体检日被图示为比第一时间点更晚的日子。在第一体检日与第一时间点之间的关系不限于以上关系。具体地,第一体检日可以比第一时间点更早(见随后将描述的图11)。
在本示例中,通过使用在第一体检日的体检数据的目标字段的内容作为对象变量并且通过使用将通过使用第二出勤数据而被生成的第二属性数据的属性字段中的每个属性字段的内容作为说明变量来执行学习。另外,基于学习的内容来呈现在将通过使用第一出勤数据而被生成的每条第一属性数据的内容与在作为将来时间点的预测的时间点的目标字段的内容之间的相关性。换而言之,在第二时间点之前的第一时段被设置为用于在学习时使用的时段,并且在第一时间点之前的第一时段被设置为用于在预测时使用的时段。更具体地,使用第一出勤数据作为如下对象,从该对象推导在预测的时间点与目标字段的相关性,也就是说,作为用于在预测时使用的出勤数据;并且使用第二出勤数据作为用于在为了预测而学习时使用的出勤数据。
另外,图11是图示将在第一修改示例中接收的出勤数据的另一示例的说明图。例如,如图11中所示,数据输入单元11可以通过假设从预测的时间点回溯第二时段或者更长的预定时间点是第一时间点来接收包括用于在第一时间点之前的第一时段的记录的第一出勤数据,并且可以通过假设从比确定时间更早的最晚体检日(图11中所示第一体检日)回溯第二时段或者更长的预定时间点是第二时间点来接收包括用于在第二时间点之前的第一时段的记录的第二出勤数据。在这一情况下,预测的时间点可以是比确定时间早第二时段的任何第一时间点更晚的将来时间点。注意,在本示例中,第一时间点可以是比确定时间更早的任何时间点,并且可以未必地比第一体检日更早。另外,第二时间点可以是从比确定时间早的第一体检日回溯第二时段或者更长的任何日子。注意,第一出勤数据收集时段和第二出勤数据收集时段可以未必连续或者可以未必相互重叠。具体地,可以在第一出勤数据收集时段与第二出勤数据收集时段之间提供任何数目的日子。
下文可以将在确定时间之前的最晚体检数据称为第一体检数据。另外,下文可以将第一时段称为收集时段,并且可以将第二时段称为回溯时段。注意,可以可选地设置第二时段,只要在第一体检日与第二时间点之间的时段是某个时段或者更长,更具体地是与从第一时间点到既定的预测的时间点的时段相等或者更长的时段。第二时段是否比第一时段更长或者更短并不特别地要紧。具体地,第二时段可以等于第一时段或者可以比第一时段更短或者更长。注意,没有具体地区分第一出勤数据和第二出勤数据。可以接收包括用于如下时段的记录的一条出勤数据,该时段包括两个时段,即,第一出勤数据收集时段和第二出勤数据收集时段。即使在这样的情况下,在下文中,为了便于说明,以区分方式表达第一出勤数据和第二出勤数据。
本修改示例的配置与图1中所示的第一示例实施例的配置基本上相同。
在本修改示例中,数据输入单元11除了在前述第一示例实施例中的输入信息之外还接收每个雇员的第二出勤数据。
另外,属性数据生成单元12基于每个雇员的接收的第二出勤数据来生成属性数据。注意,属性数据生成方法可以与在第一示例实施例中相同。下文可以将通过使用出勤数据而被生成的属性数据称为第二属性数据,并且可以将通过使用第一出勤数据而被生成的属性数据称为第一属性数据。属性数据生成单元12除了第二属性数据之外还可以生成第一属性数据。
注意,在图6中所示的属性数据设置信息的示例中,按照具体日期等来图示时间范围。然而,在本示例中的属性数据设置信息的时间范围中,假设内容(比如“在开始时间用于当年一月的数据”)基于在收集用于聚合的出勤数据时的时间点(例如,从第二体检日回溯第一时段的时间点)被设置。
另外,模型学习单元13通过使用多个雇员的第一体检数据和第二属性数据来学习多项式模型,其中第一体检数据的目标字段是对象变量,并且第二属性数据的属性字段中的每个属性字段是说明变量。注意,本示例与前述第一示例实施例不同在于使用第二属性数据而不是第一属性数据。模型被视为如下模型,该模型表示在从第一体检日回溯第二时段或者更长的时间点(第二时间点)之前的出勤数据对将在第一体检日获取的目标字段的值的影响。
有关字段提取单元14可以与在前述第一示例实施例中相同。具体地,有关字段提取单元14提取由学习的模型表示并且与目标字段关联的属性字段。
概括单元15例如基于由有关字段提取单元14提取的信息来概括和输出第一出勤数据。概括处理可以与在第一示例实施例中相同。概括单元15例如可以关于其中通过模型学习来识别与目标字段的相关的所有属性字段、与关于属性字段的信息(比如出勤字段、概括方法和相关程度)一起输出指明的雇员的第一属性数据的属性值。另外,概括单元15也能够在已经生成第一属性数据时通过省略概括处理来使用第一属性数据的属性值。
根据前述配置,建议者能够在预测的时间点获得与目标字段关联的出勤数据信息。建议者例如能够基于如以上描述的那样概括的第一出勤数据容易地掌握/了解存在或者不存在工作状况等,这被预测以影响用于每个雇员的在比第一体检日晚第二时段或者更长(例如,半年后或者一年后)的时间点的体检数据的目标字段的值。
这里通过使用比确定时间更早的数据(更具体地通过使用在第一体检日的体检数据作为对象变量并且通过使用将从在从第一体检日回溯第二时段或者更长的第二时间点可收集的第二出勤数据而被生成的属性字段的每个属性字段)作为说明变量来获得由有关字段提取单元14提取的信息指示的、在第一体检数据的目标字段与第二出勤数据之间的相关性。因此,没有为每个雇员直接地获得在将来的预测的时间点的体检数据与在从将来的预测的时间点回溯第二时段或者更长的第一时间点可收集的第一出勤数据之间的相关性。然而,在本修改示例中,假设没有在比确定时间更早的第一体检日的目标字段的值与第二出勤数据之间的相关性与在比确定时间更晚的预测的时间点的目标字段的值与第一出勤数据之间的相关性之间生成的大改变。因此,建议者能够基于通过将由如下模型指定的概括方法而概括的第一出勤数据容易地掌握/了解对于任何雇员在用作预测的时间点的将来体检日存在或者不存在与目标字段关联的加班或者不规律换班,该模型通过使用将从第二出勤数据生成的第二属性数据作为学习数据而被学习。
[第二修改示例]
在本修改示例中,除了第一修改示例的功能之外还向建议者提供在将来时间点的体检数据的目标字段的预测的值。
图12是图示本修改示例的数据分析设备的配置示例的框图。图12中所示的数据分析设备10除了第一修改示例的配置之外还包括预测单元16。
注意,数据输入单元11、属性数据生成单元12、模型学习单元13和有关字段提取单元14可以与在第一修改示例中相同。
预测单元16通过使用学习的模型和指明的雇员的第一属性数据来预测在预定的预测时间点的目标字段的值。
例如,预测单元16通过使用学习的模型的参数Wc和第一属性数据按照下式(4)计算在预测的时间点的目标字段的值。注意,在本修改示例中,用于在预测时使用的指明的雇员的第一属性数据被表达为X’_n。这里,预测的时间点可以是比第一体检日晚第二时段或者更长的最晚体检日。
Y’_n=Wc T·X’_n…(4)
预测单元16在存储器1002中存储计算的Y’_n。这里,Y’_n表示用于雇员n的、在预测的时间点的目标字段的预测的值。
概括单元15例如除了在第一修改示例中的概括单元15的功能之外还输出由预测单元16预测的目标字段的预测的值。
图13是图示本修改示例的数据分析设备的操作的示例的流程图。在图13中所示的示例中,首先,数据输入单元11接收必需信息(步骤S21)。在本示例中,数据输入单元11接收对目标字段的指明、每个雇员的第一体检数据、第一出勤数据和第二出勤数据。
随后,属性数据生成单元12基于第二出勤数据来生成第二属性数据(步骤S22)。
随后,模型学习单元13通过使用第一体检数据的目标字段的值和多个雇员的第二出勤数据的内容来学习模型(步骤S23)。
随后,有关字段提取单元14提取由学习的模型表示并且与目标字段关联的属性字段信息(步骤S24)。
随后,预测单元16通过使用学习的模型和指明的雇员的第一属性数据来计算在预测的时间点的指明的雇员的目标字段的预测值(步骤S25)。
最后,概括单元15基于在步骤S24中提取的信息来概括指明的雇员的第一出勤数据,并且与概括结果一起输出在步骤S25中计算的预测的值(步骤S26)。
这允许建议者在掌握/了解与任何聚焦的雇员的将来体检结果等关联的、在当前阶段存在或者不存在加班或者不规律换班之时基于关于将来体检结果是好还是坏的确定向雇员提供用于健康促进的建议。
例如,假设保证用于健康指导的更长时间或者向在异常范围中将来具有预测的体检值的雇员提供用于改进工作状况的更严格建议以便提供对加班或者不规律换班的改进,这在预测的时间点与项目关联。
[第三修改示例]
在本修改示例中,在生成属性数据时除了出勤数据之外也使用体检数据。
属性数据生成单元12可以例如在属性数据的属性字段中包括通过使用预定方法关于体检数据的预定体检字段的值(例如,血压、血糖水平(比如HbA1c)、脂质(比如HDL和LDL)、身高、体重、面试结果的值(比如对与吸烟习惯、睡眠习惯和饮食习惯有关的问题的回答))执行聚合处理而被获得的结果。
例如,在前述示例实施例中和在修改示例的每个修改示例中,属性数据生成单元12可以通过包括雇员n的体检数据的体检字段来设置X_nj(j=1,…,M+K)。这里,K表示将与X_nj相加的体检字段的数目。注意,在K中没有包括目标字段。注意,在获得在将来时间点与目标字段的相关性时,可以在K中包括现有体检数据的目标字段。下文将从其实际地提取相关性的、体检数据的目标字段称为“目标字段”。
图14是图示本修改示例中的属性数据设置信息的示例的说明图。如图14中所示,属性数据生成单元12例如可以预先存储指示属性数据生成方法的属性数据设置信息作为除了出勤数据之外还包括体检数据的输入信息。图14图示如下示例,其中使用血糖水平(HbA1c)、体重和脂质(HDL)的值作为属性数据的元素,具体作为在体检数据的字段之中的属性字段。
注意,在图14中所示示例中,有可能除了出勤数据之外还将体检结果数据指明为数据字段。例如,在图14中,数据字段=“工作_休假”表示用于聚合的字段是出勤数据中的休假字段。另外,例如,数据字段=“健康_血糖水平”表示用于聚合的数据字段是体检数据中的血糖水平字段。此外,聚合方法=“无”表示原样使用值。
另外,图15是图示将基于图14中所示的属性数据设置信息而被生成的属性数据的示例的说明图。在图15中所示的示例中,至少第50至第52属性字段的值被设置为体检字段的值。
注意,随着属性字段数目增加,模型参数W_j增加。
例如,假设本修改示例与前述第一示例实施例组合。在这一情况下,属性数据生成单元12基于属性数据设置信息,从接收的出勤数据和接收的体检数据生成每个雇员的属性数据。
另外,有关字段提取单元14可以提取与在生成时使用的出勤字段和体检字段的标识符和概括等的至少一项有关的信息作为由学习的模型表示并且与目标字段关联的属性字段信息。
另外,概括单元15基于由有关字段提取单元14提取的信息来概括和输出出勤数据和体检数据。
图16是图示属性表的另一示例的说明图。从图16清楚的是与第14、第20和第50属性字段的系数对应的参数Wc_14、Wc_20和Wc_50具有除了零之外的值作为模型学习的结果。
另外,图17是图示将由概括单元15输出的出勤数据和体检数据的概括结果的示例。如图17中所示,概括结果可以包括属性字段的标识符、概括、原始出勤数据或者体检数据的字段名称、时间范围、相关程度(模型参数Wc_j)、平均值和聚合结果(属性值)。除了以上内容之外,概括结果还可以包括关于时间分辨率和聚合方法的信息。
另外,例如,假设本修改示例与前述第二修改示例组合。在这一情况下,数据输入单元11除了对目标字段的指明以及每个雇员的第一体检数据、第一出勤数据和第二出勤数据之外还接收被包括在第二出勤数据收集时段中或者在从收集时段起的预定数目的日子(例如,直至在预定数目的日子流逝时的时间点)内收集的第二体检数据。
图18是图示在本修改示例中的在出勤数据与体检数据(更具体为体检日)之间的关系的说明图。如图18(a)中所示,数据输入单元11例如可以通过假设比第一出勤数据收集时段的最后日子更晚的最晚体检日是第一体检日来接收在第一体检日的体检数据作为第一体检数据;并且可以通过假设比第二体检数据收集时段的最后日子更晚的最晚体检日是第二体检日来接收在第二体检日的体检数据作为第二体检数据。另外,例如,如图18(b)中所示,数据输入单元11例如可以通过假设在第一出勤数据收集时段内的体检日是第一体检日来接收在第一体检日的体检数据作为第一体检数据,并且可以通过假设在第二出勤数据收集时段内的体检日是第二体检日来接收在第二体检日的第二体检数据作为第二体检数据。
属性数据生成单元12基于属性数据设置信息,从接收的第二出勤数据和接收的第二体检数据生成每个雇员的第二属性数据。另外,属性数据生成单元12还可以从接收的第一出勤数据和接收的第二体检数据生成每个雇员的第一属性数据。
模型学习单元13学习如下模型,其中在第一体检数据中的目标字段是对象变量,并且通过使用第二属性数据来计算对象变量的值。
有关字段提取单元14可以提取与在生成时使用的出勤字段和体检字段的标识符和概括等的至少一项有关的信息作为由学习的模型表示并且与目标字段关联的属性字段信息。
预测单元16通过使用学习的模型和指明的雇员的第一属性数据来预测在预测的时间点的目标字段的值。
概括单元15基于由有关字段提取单元14提取的信息来概括第一出勤数据和第一体检数据,并且与概括结果一起输出目标字段的预测的值。
根据本修改示例,建议者不仅能够容易地掌握/了解存在或者不存在加班、不规律换班等(这和与聚焦的健康状况有关的任何项目关联),而且能够容易地掌握/了解另一检查值或者存在或者不存在与项目关联的面试结果等。这使得有可能提供进一步高效健康指导。
[第四修改示例]
接着描述第四修改示例。在健康指导中,要求根据每个雇员的特性、考虑雇员的职业和每个办公室的特征来提供适当提前。例如,在具有不同职业或者在不同办公室中工作的雇员之中,到达时间可以不同,休息时间可以不同,或者平均加班小时可以不同。
鉴于上述内容,可以将雇员分类成组,并且可以通过考虑雇员的职业不同、办公室不同等来为每组执行前述示例实施例或者每个修改示例的处理。
具体地,在本修改示例中,执行为每组学习模型并且提取与目标字段关联的属性字段信息的处理。另外,在执行概括时,基于为指明的雇员属于的每组而提取的属性字段信息来概括如必需的出勤数据和体检数据等。此外,也在计算目标字段的预测的值时,通过为指明的雇员属于的每组使用模型来执行计算。
作为一种用于将雇员分类成组的方法,可以预先做出确定每个雇员属于哪一组,或者可以基于预定条件将雇员分类成组。另外,可以基于由属性数据生成单元12生成的属性数据来将雇员分类成组。此外,也有可能基于体检数据来将雇员分类成组。
图19是图示本修改示例中的数据分析设备的配置示例的框图。图19图示配置示例,其中第四修改示例与第三修改示例组合。图19中所示的数据分析设备10除了第三修改示例的配置之外还包括分组单元17。
例如,在基于预定条件将雇员分类成组时,分组单元17例如可以通过使用项目(比如雇员的办公室、部门、职业、世代、性别等)来将具有相同或者相似内容的雇员分类成相同组。
另外,例如,在通过使用每个雇员的属性数据来执行分组时,分组单元17可以通过使用一般分组方法(比如K均值聚类计数)来将具有相似属性数据的雇员分类成相同组。
另外,如图20(a)中所示,分组单元17可以基于由属性数据的值表达的预定条件或者由建议者指明的条件来将雇员分类成组。
在对雇员进行分组时,提供用于为每组计算目标字段的预测的值的预测等式(见图20(b))。注意,在图20(b)中,α1至α4表示相应预测等式的片段。
在这样的情况下,预测单元16可以不仅通过使用雇员属于的组的预测等式来计算雇员的目标字段的预测的值,而且通过使用另一组的预测等式来计算雇员的目标字段的预测的值。这允许建议者基于每组的目标字段的预测的值和用于在分组时使用的条件从其中在目标范围中包括目标字段的预测的值的组之中容易地识别雇员可能属于的组。这在指出待改进的项目(比如工作状况)时有帮助。注意,预测单元16即使在使用另一分组方法时仍然可以执行计算每组的目标字段的预测的值的处理。
另外,在通过使用每个雇员的体检数据来执行分组时,分组单元17例如可以通过使用一般分组方法(比如K均值聚类计数)来将具有体检数据的相似内容的雇员分类成相同组。此外,例如,如第一修改示例举例的那样,在两个类型的体检数据存在时,可以通过获得在每个雇员的第一体检数据与第二体检数据之间的差值来将具有相似差值量值的雇员分类成相同组。
接着描述公开的主题内容的概括。图21是图示根据公开的主题内容的数据分析设备的概括的框图。如图21中所示,根据公开的主题内容的数据分析设备50包括数据获取装置51、属性数据生成装置52、模型学习装置53、有关字段提取装置54和概括装置55。
数据获取装置51(例如,数据输入单元11)至少获取对目标字段的指明、两个或者更多个雇员的健康状况数据和出勤数据,该目标字段是来自被包括在健康状况数据中的字段之中的、要从其提取相关性的字段,该健康状况数据是与雇员的健康状况有关的信息,该出勤数据是与工作状况有关的信息。
属性数据生成装置52(例如,属性数据生成单元12)通过使用预定时间分辨率、预定时间范围和预定聚合方法来关于被包括在每个雇员的出勤数据中的预定字段执行聚合,并且生成包括聚合结果的每个聚合结果的属性数据作为属性字段。
模型学习装置53(例如,模型学习单元13)通过使用两个或者更多个雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型,其中目标字段是对象变量,并且被包括在属性数据中的属性字段的每个属性字段是说明变量,该模型由多项式表示。
有关字段提取装置54(例如,有关字段提取单元14)提取由学习的模型表示并且与目标字段关联的属性字段。
概括装置55(例如,概括单元15)基于关于提取的属性字段的信息来概括和输出指明的雇员的出勤数据。
根据前述配置,有可能获得与指明的字段关联的具体字段信息而没有关于在初期数据内的字段具体地指明适当时间分辨率、适当时间范围和适当聚合方法。
另外,模型学习装置可以学习被包括在多项式中的说明变量的每个说明变量的系数作为模型参数;并且有关字段提取装置可以提取与具有除了零之外的系数的值的说明变量关联的属性字段作为与目标字段关联的属性字段。
另外,属性数据生成装置可以通过使用多个时间分辨率、多个时间范围或者多种聚合方法来关于出勤数据的一个字段执行聚合。
数据获取装置可以获取对两个或者更多个目标字段的指明,并且模型学习装置可以关于两个或者更多个指明的目标字段的每个目标字段、通过使用两个或者更多个雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型,其中目标字段是对象变量,并且被包括在属性数据中的属性字段的每个属性字段是说明变量,该模型由多项式表示。
另外,出勤数据可以包括用于在第一时间点之前的第一时段的记录和用于在第二时间点之前的第一时段的记录,该第一时间点是从作为预定将来时间点的预测的时间点回溯预定第二时段的预定时间点,该第二时间点是从在获取最晚健康状况数据时的日子回溯第二时段或者更长的预定时间点。属性数据生成装置可以通过使用预定时间分辨率、预定时间范围和预定聚合方法来为雇员的每个雇员关于被包括在由用于在第二时间点之前的第一时段的记录构成的第二出勤数据中的预定字段执行聚合;并且可以生成包括聚合结果的每个聚合结果的第二属性数据作为属性字段。模型学习装置可以通过使用两个或者更多个雇员的最晚健康状况数据的目标字段的内容和第二属性数据的内容来学习模型,其中最晚健康状况数据的目标字段是对象变量,并且被包括在第二属性数据中的属性字段的每个属性字段是说明变量,该模型由多项式表示。概括装置可以基于提取的属性字段信息来概括由指明的雇员的用于在第一时间点之前的第一时段的记录构成的第一出勤数据,并且可以输出概括结果作为在预测的时间点与目标字段关联的出勤数据信息。
另外,数据分析设备50还可以包括用于基于学习的模型和第一属性数据来预测指明的雇员的在预测的时间点的目标字段的值的预测装置(未图示,例如,预测单元16),该第一属性数据是通过使用雇员的第一出勤数据而生成的属性数据。
另外,数据分析设备50还可以包括用于基于预定条件、健康状况数据、出勤数据或者属性数据对雇员进行分组的分组装置(未图示,例如,分组单元17)。模型学习装置可以为雇员的每组通过使用属于该组的雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型。
另外,在数据分析设备50中,属性数据可以包括属性字段,该属性字段是被包括在健康状况数据中的字段,并且其中登记关于除了目标字段之外的预定字段的聚合结果。在这样的情况下,属性数据生成装置可以通过使用预定时间分辨率、预定时间范围和预定聚合方法为雇员的每个雇员关于被包括在出勤数据中的预定字段和如下预定字段执行聚合,该预定字段是被包括在健康状况数据中的并且除了目标字段之外的字段;并且可以生成包括聚合结果的每个聚合结果的属性数据作为属性字段。概括装置可以基于提取的属性字段信息来概括和输出指明的雇员的出勤数据和健康状况数据。
如以上描述的那样,参照示例实施例和示例描述了公开的主题内容。然而,公开的主题内容不限于前述示例实施例和示例。可以在公开的主题内容的范围以本领域技术人员可了解的各种方式修改公开的主题内容的配置和细节。
[工业实用性]
公开的主题内容不限于出于健康指导的目的而在出勤数据中提供与任何体检结果关联的字段信息,并且有利地适用于分析在包括许多字段和记录的数据与任何项目之间的相关性。
本申请要求基于提交于2015年7月16日的日本专利申请号2015-142404的优先权,这里并入其全部公开内容。
[标号列表]
10 数据分析设备
11 数据输入单元
12 属性数据生成单元
13 模型学习单元
14 有关字段提取单元
15 概括单元
16 预测单元
17 分组单元
50 数据分析设备
51 数据获取装置
52 属性数据生成装置
53 模型学习装置
54 有关字段提取装置
55 概括装置
1001 CPU
1002 存储器
1003 输出设备
1004 输入设备
1005 网络接口

Claims (10)

1.一种数据分析设备,包括:
数据获取装置,用于至少获取对目标字段的指明以及两个或者更多个雇员的健康状况数据和出勤数据,所述目标字段是来自被包括在所述健康状况数据中的字段之中的、要从其提取相关性的字段,所述健康状况数据是与雇员的健康状况有关的信息,所述出勤数据是与工作状况有关的信息;
属性数据生成装置,用于通过使用预定时间分辨率、时间范围和聚合方法来关于被包括在所述雇员中的每个雇员的所述出勤数据中的预定字段执行聚合,并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段;
模型学习装置,用于通过使用所述两个或者更多个雇员的所述健康状况数据的所述目标字段的内容和所述属性数据的内容来学习模型,在所述模型中,所述目标字段是对象变量,并且被包括在所述属性数据中的属性字段中的每个属性字段是说明变量,所述模型由多项式表示;
有关字段提取装置,用于提取由学习的模型表示并且与所述目标字段关联的属性字段;以及
概括装置,用于基于关于提取的所述属性字段的信息来概括和输出指明的雇员的出勤数据。
2.根据权利要求1所述的数据分析设备,其中:
所述模型学习装置学习被包括在所述多项式中的说明变量中的每个说明变量的系数作为模型参数,并且
所述有关字段提取装置提取与具有所述系数的除了零之外的值的说明变量关联的属性字段作为与所述目标字段关联的属性字段。
3.根据权利要求1或者2所述的数据分析设备,其中:
所述属性数据生成装置通过使用多个时间分辨率、多个时间范围或者多个聚合方法来关于所述出勤数据的一个字段执行聚合。
4.根据权利要求1至3中的任一权利要求所述的数据分析设备,其中:
所述数据获取装置获取对两个或者更多个目标字段的指明,并且
所述模型学习装置关于两个或者更多个指明的目标字段中的每个指明的目标字段、通过使用所述两个或者更多个雇员的健康状况数据的所述目标字段的内容和所述属性数据的内容来学习模型,在所述模型中,所述目标字段是对象变量,并且被包括在所述属性数据中的所述属性字段中的每个属性字段是说明变量,所述模型由多项式表示。
5.根据权利要求1至4中的任一权利要求所述的数据分析设备,其中:
所述出勤数据包括用于在第一时间点之前的第一时段的记录和用于在第二时间点之前的第一时段的记录,所述第一时间点是从作为预定将来时间点的预测的时间点回溯预定第二时段的预定时间点,所述第二时间点是从在最晚健康状况数据被获取时的日子回溯所述第二时段或者更长的预定时间点,
所述属性数据生成装置通过使用预定时间分辨率、时间范围和聚合方法来针对所述雇员中的每个雇员、关于被包括在由用于在所述第二时间点之前的第一时段的记录构成的第二出勤数据中的预定字段执行聚合,并且生成包括聚合结果中的每个聚合结果的第二属性数据作为属性字段,
所述模型学习装置通过使用所述两个或者更多个雇员的所述最晚健康状况数据的目标字段的内容和所述第二属性数据的内容来学习模型,在所述模型中,所述最晚健康状况数据的目标字段是对象变量,并且被包括在所述第二属性数据中的属性字段中的每个属性字段是说明变量,所述模型由多项式表示,并且
所述概括装置基于提取的属性字段信息来概括由指明的雇员的用于在第一时间点之前的第一时段的记录构成的第一出勤数据,并且输出概括结果作为在所述预测的时间点与目标字段关联的出勤数据信息。
6.根据权利要求5所述的数据分析设备,还包括:
预测装置,用于基于学习的所述模型和第一属性数据来预测指明的雇员的在预测的时间点的目标字段的值,所述第一属性数据是通过使用所述雇员的第一出勤数据被生成的属性数据。
7.根据权利要求1至6中的任一权利要求所述的数据分析设备,还包括:
分组装置,用于基于预定条件、健康状况数据、出勤数据或者属性数据来对所述雇员分组,其中:
所述模型学习装置针对所述雇员的每组、通过使用属于所述组的所述雇员的健康状况数据的目标字段的内容和属性数据的内容来学习模型。
8.根据权利要求1至7中的任一权利要求所述的数据分析设备,其中:
所述属性数据包括属性字段,所述属性字段是被包括在健康状况数据中的字段,在所述属性字段中,关于除了目标字段之外的预定字段的聚合结果被登记,
所述属性数据生成装置通过使用预定时间分辨率、时间范围和聚合方法来针对所述雇员中的每个雇员、关于被包括在所述出勤数据中的预定字段和如下预定字段执行聚合,所述预定字段是被包括在所述健康状况数据中并且除了目标字段之外的字段,并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段,并且
所述概括装置基于提取的属性字段信息来概括和输出所述指明的雇员的出勤数据和所述健康状况数据。
9.一种数据分析方法,包括:
使得信息处理设备至少获取对目标字段的指明以及两个或者更多个雇员的健康状况数据和出勤数据,所述目标字段是来自被包括在所述健康状况数据中的字段之中的、要从其提取相关性的字段,所述健康状况数据是与雇员的健康状况有关的信息,所述出勤数据是与工作状况有关的信息;
使得所述信息处理设备通过使用预定时间分辨率、时间范围和聚合方法来关于被包括在所述雇员中的每个雇员的所述出勤数据中的预定字段执行聚合,并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段;
使得所述信息处理设备通过使用所述两个或者更多个雇员的所述健康状况数据的所述目标字段的内容和所述属性数据的内容来学习模型,在所述模型中,所述目标字段是对象变量,并且被包括在所述属性数据中的属性字段中的每个属性字段是说明变量,所述模型由多项式表示;
使得所述信息处理设备提取由学习的模型表示并且与所述目标字段关联的属性字段;以及
使得所述信息处理设备基于关于提取的所述属性字段的信息来概括和输出指明的雇员的出勤数据。
10.一种存储数据分析程序的存储介质,所述数据分析程序使得计算执行:
至少获取对目标字段的指明以及两个或者更多个雇员的健康状况数据和出勤数据的处理,所述目标字段是来自被包括在所述健康状况数据中的字段之中的、要从其提取相关性的字段,所述健康状况数据是与雇员的健康状况有关的信息,所述出勤数据是与工作状况有关的信息;
通过使用预定时间分辨率、时间范围和聚合方法来关于被包括在所述雇员中的每个雇员的所述出勤数据中的预定字段执行聚合并且生成包括聚合结果中的每个聚合结果的属性数据作为属性字段的处理;
通过使用所述两个或者更多个雇员的所述健康状况数据的所述目标字段的内容和所述属性数据的内容来学习模型的处理,在所述模型中,所述目标字段是对象变量,并且被包括在所述属性数据中的属性字段中的每个属性字段是说明变量,所述模型由多项式表示;
提取由学习的模型表示并且与所述目标字段关联的属性字段的处理;以及
基于关于提取的所述属性字段的信息来概括和输出指明的雇员的出勤数据的处理。
CN201680041982.6A 2015-07-16 2016-07-14 数据分析设备、数据分析方法和存储数据分析程序的存储介质 Active CN107851295B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015-142404 2015-07-16
JP2015142404 2015-07-16
PCT/JP2016/003332 WO2017010103A1 (ja) 2015-07-16 2016-07-14 データ分析装置、データ分析方法、およびデータ分析プログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
CN107851295A true CN107851295A (zh) 2018-03-27
CN107851295B CN107851295B (zh) 2022-02-25

Family

ID=57757273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680041982.6A Active CN107851295B (zh) 2015-07-16 2016-07-14 数据分析设备、数据分析方法和存储数据分析程序的存储介质

Country Status (4)

Country Link
US (1) US20180225634A1 (zh)
JP (1) JP6105825B1 (zh)
CN (1) CN107851295B (zh)
WO (1) WO2017010103A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462910A (zh) * 2020-03-31 2020-07-28 上海商汤智能科技有限公司 项目的匹配方法及装置、电子设备和存储介质

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7067235B2 (ja) * 2018-04-20 2022-05-16 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP6481794B1 (ja) * 2018-04-20 2019-03-13 富士通株式会社 学習用データ生成方法、学習用データ生成プログラム
JP6562121B1 (ja) * 2018-06-07 2019-08-21 富士通株式会社 学習用データ生成プログラムおよび学習用データ生成方法
JP7224618B2 (ja) * 2018-09-03 2023-02-20 孝文 栢 行動推奨装置及び行動推奨システム
JP6983145B2 (ja) * 2018-12-12 2021-12-17 株式会社日立ソリューションズ データ処理システム、方法、およびプログラム
JP6679010B1 (ja) * 2019-05-17 2020-04-15 株式会社エンジョイ ユーザストレス対処システム、ユーザストレス対処方法及びユーザストレス対処プログラム
JP7392717B2 (ja) * 2019-06-17 2023-12-06 日本電気株式会社 リスク推定装置、リスク推定方法、コンピュータプログラム及び記録媒体
JP7534749B2 (ja) 2020-11-17 2024-08-15 勤次郎株式会社 ヘルスケアシステム、および、ヘルスケアプログラム
JP7198296B2 (ja) * 2021-01-21 2022-12-28 Tis株式会社 職域改善装置、職域改善方法、および職域改善プログラム
JP2022112435A (ja) * 2021-01-21 2022-08-02 Tis株式会社 職域改善装置、職域改善方法、および職域改善プログラム
WO2024210083A1 (ja) * 2023-04-06 2024-10-10 塩野義製薬株式会社 予測システム、予測方法およびプログラム
CN117196560B (zh) * 2023-11-07 2024-02-13 深圳市慧云智跑网络科技有限公司 一种基于物联网的打卡设备数据采集方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1745392A (zh) * 2002-12-10 2006-03-08 通乐宝公司 内容创建、分发、交互和监视系统
CN1991886A (zh) * 2005-12-26 2007-07-04 国际商业机器公司 用于调整工作日程安排的系统和方法
US7403901B1 (en) * 2000-04-13 2008-07-22 Accenture Llp Error and load summary reporting in a health care solution environment
JP2010262384A (ja) * 2009-04-30 2010-11-18 Ricoh Co Ltd 健康管理システム、健康管理方法及び健康管理プログラム
US20140278455A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Providing Feedback Pertaining to Communication Style
WO2015009287A1 (en) * 2013-07-16 2015-01-22 Wright Beth Ann Learning model for competency based performance
JP2015056150A (ja) * 2013-09-13 2015-03-23 株式会社東芝 脅威分析システムおよび情報処理装置
CN104636889A (zh) * 2015-03-10 2015-05-20 刘升 一种人员信息综合管理系统
US20150186817A1 (en) * 2013-12-28 2015-07-02 Evolv Inc. Employee Value-Retention Risk Calculator

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256578A (ja) * 2002-03-05 2003-09-12 Kobe Steel Ltd 健康管理システム
JP5572752B2 (ja) * 2012-11-29 2014-08-13 株式会社エクスブレーン メンタルヘルス管理システム、メンタルヘルス管理プログラム及びメンタルヘルス管理方法
EP2889822A1 (en) * 2013-12-28 2015-07-01 Evolv Inc. Employee value-retention risk calculator
EP3051483A1 (en) * 2015-01-30 2016-08-03 Ricoh Company, Ltd. Information processing apparatus, and non-transitory recording medium

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7403901B1 (en) * 2000-04-13 2008-07-22 Accenture Llp Error and load summary reporting in a health care solution environment
CN1745392A (zh) * 2002-12-10 2006-03-08 通乐宝公司 内容创建、分发、交互和监视系统
CN1991886A (zh) * 2005-12-26 2007-07-04 国际商业机器公司 用于调整工作日程安排的系统和方法
JP2010262384A (ja) * 2009-04-30 2010-11-18 Ricoh Co Ltd 健康管理システム、健康管理方法及び健康管理プログラム
US20140278455A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Providing Feedback Pertaining to Communication Style
WO2015009287A1 (en) * 2013-07-16 2015-01-22 Wright Beth Ann Learning model for competency based performance
JP2015056150A (ja) * 2013-09-13 2015-03-23 株式会社東芝 脅威分析システムおよび情報処理装置
US20150186817A1 (en) * 2013-12-28 2015-07-02 Evolv Inc. Employee Value-Retention Risk Calculator
CN104636889A (zh) * 2015-03-10 2015-05-20 刘升 一种人员信息综合管理系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462910A (zh) * 2020-03-31 2020-07-28 上海商汤智能科技有限公司 项目的匹配方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
JP6105825B1 (ja) 2017-03-29
CN107851295B (zh) 2022-02-25
JPWO2017010103A1 (ja) 2017-07-13
US20180225634A1 (en) 2018-08-09
WO2017010103A1 (ja) 2017-01-19

Similar Documents

Publication Publication Date Title
CN107851295A (zh) 数据分析设备、数据分析方法和存储数据分析程序的存储介质
Nestor et al. Feature robustness in non-stationary health records: caveats to deployable model performance in common clinical machine learning tasks
Young et al. A survey of methodologies for the treatment of missing values within datasets: Limitations and benefits
Einav et al. Selection on moral hazard in health insurance
JP7003880B2 (ja) 予測装置、方法およびプログラム
WO2020224433A1 (zh) 基于机器学习的目标对象属性预测方法及相关设备
CN107180152A (zh) 疾病预测系统及方法
CN110428903A (zh) 体检方案自动生成方法、装置、计算机设备及存储介质
Gui et al. Depression detection on social media with reinforcement learning
CN112489740A (zh) 病历检测方法及相关模型的训练方法和相关设备、装置
CA3110455A1 (en) Visualization of social determinants of health
CN109784645A (zh) 一种医院科室绩效排名方法及装置
Mancini et al. Marked point process models for the admissions of heart failure patients
Qudsi et al. Predictive data mining of chronic diseases using decision tree: A case study of health insurance company in Indonesia
Baghaei et al. Sepsis prediction: an attention-based interpretable approach
Qinghua Data mining and management system design and application for college student mental health
CN102918522A (zh) 用于生成统计研究信息的系统、方法以及逻辑
CN111815487A (zh) 基于深度学习的健康教育评估方法、装置及介质
Barnett et al. The effects of training on performance and performance-related states in individual elite athletes: a dynamic approach
Hallgrímsson et al. Learning individualized cardiovascular responses from large-scale wearable sensors data
Hegerty Principal component measures of exchange market pressure: Comparisons with variance-weighted measures
Rahman et al. Grading system prediction of educational performance analysis using data mining approach
Sreenivasu et al. Carbohydrate Recommendation for Type-1 Diabetics Patient Using Machine Learning
CN112465277A (zh) 一种在校学生挂科学分预测方法、系统、装置及存储介质
Shen et al. Design and application of tumor prediction model based on statistical method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant