CN111540471A - 一种基于用户健康数据的健康状态跟踪及预警方法和系统 - Google Patents

一种基于用户健康数据的健康状态跟踪及预警方法和系统 Download PDF

Info

Publication number
CN111540471A
CN111540471A CN202010395523.6A CN202010395523A CN111540471A CN 111540471 A CN111540471 A CN 111540471A CN 202010395523 A CN202010395523 A CN 202010395523A CN 111540471 A CN111540471 A CN 111540471A
Authority
CN
China
Prior art keywords
user
health
data
physical examination
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010395523.6A
Other languages
English (en)
Other versions
CN111540471B (zh
Inventor
王宁
张靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Medical College of Xian Jiaotong University
Original Assignee
First Affiliated Hospital of Medical College of Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Medical College of Xian Jiaotong University filed Critical First Affiliated Hospital of Medical College of Xian Jiaotong University
Priority to CN202010395523.6A priority Critical patent/CN111540471B/zh
Publication of CN111540471A publication Critical patent/CN111540471A/zh
Application granted granted Critical
Publication of CN111540471B publication Critical patent/CN111540471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

一种基于用户健康数据的健康状态跟踪方法,从可穿戴设备中提取用户健康数据;从用户健康数据中提取健康指标特征,并对特征进行预处理;基于决策树算法,使用用户历史健康指标特征集训练用户健康状态分类器;根据分类器模型对用户实时健康指标特征进行判别以获得用户健康状态标记序列,并用以计算用户每日健康指数;进一步地,可参考用户每日健康指数正常/异常,选择是否向用户发出体检提醒;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取低维度的历史/实时数据特征向量,然后基于历史体检数据特征训练用户健康判别分类器,根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警,本发明还提供了相应的系统。

Description

一种基于用户健康数据的健康状态跟踪及预警方法和系统
技术领域
本发明属于数据挖掘技术领域,特别涉及一种基于用户健康数据的健康状态跟踪及预警方法和系统。
背景技术
随着各类新型传感器设备制造技术的发展以及各种智能终端的不断普及,更多的用户选择使用诸如智能手表、运动手环等可穿戴设备来实现对个人健康状态的监控以及运动数据的记录与处理。但这些设备受制于搭载硬件的计算性能以及软件的复杂度,大多数只能实现对用户健康数据的简单记录与显示,而无法实现对数据的进一步处理与分析。因此,这就造成数据资源的浪费,且无法给用户对个人健康状态的评估提供有价值的参照
虽然诸如此类的可穿戴设备无法直接进行较可靠的健康监控,但可以较为全面的记录用户的各种健康数据。通过这些数据我们可以利用技术手段提取出用户的一些健康指标特征,从而尝试对用户健康状态进行跟踪并对异常状态进行识别。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于用户健康数据的健康状态跟踪及预警方法和系统,从可穿戴设备获取用户健康数据,然后通过统计大量用户健康数据提取用户的心率类、血氧类、体温类、呼吸类等健康指标特征;使用决策树算法建立针对每位用户的健康状态跟踪分类器;通过使用分类器对用户实时健康指标特征进行分类从而获取用户的一系列健康状态标记,并根据健康状态标记计算用户每日健康指数;此外,获取用户历史体检数据并通过人工神经网络方法提取数据特征,使用历史特征训练基于决策树算法的用户健康判别分类器,并根据用户每日健康指数决定是否向用户发送体检提醒。若用户进行体检则提取实时体检数据的特征并输入健康判别分类器进行判别,并根据判别结果决定是否发出疾病预警。本发明不仅考虑了用户的历史健康数据,同时也考虑了用户的当前数据,具有获取成本低、信息内容丰富、覆盖用户广、针对用户的健康模型更精准等优点,使得本申请与传统的方法和系统相比,具有明显优势。
为了实现上述目的,本发明采用的技术方案是:
一种基于用户健康数据的健康状态跟踪方法,包括如下步骤:
步骤1,以可穿戴设备记录的传感器数据为数据源,获取所需的用户健康数据。
步骤2,从一段时间内的用户历史健康数据中提取历史健康指标特征,将提取到的全部特征作为历史特征集用于下一步的模型训练。
其中,历史健康数据是指用户在健康状态下的一段稳定使用期内的可穿戴设备健康数据,从四类传感器数据中采样获取,包括:心率数据、体温数据、血氧数据以及呼吸频率数据,历史健康指标特征是指从历史健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,一般共计24个。
步骤2具体包括:
步骤2.1,依据健康数据中的心率数据提取心率类特征:计算每个时间窗内用户心率数据的极大值、极小值、均值、方差、离散度以及一般心率水平,时间窗是指计算一组健康指标特征所用的健康数据的时间范围,一般可设为10分钟,可穿戴设备的数据测量频率均为4次/分钟,则所述离散度的具体计算方法是:
首先将用户心率值设置为50—150次/分钟,并划分为[50,60),[60,70),…,[130,140),[140,150]共10个子区间,然后使用所述一个时间窗内的所有心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率,之后根据信息熵计算公式计算心率数据的离散度:
Figure BDA0002487352720000031
H即为心率数据的离散度,表征了心率数据在一般范围内的离散程度,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;
步骤2.2,依据健康数据中的体温数据提取体温类特征:计算每个时间窗内用户体温数据的极大值、极小值、均值、方差、离散度以及一般体温水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;
步骤2.3,依据健康数据中的心率血氧数据提取血氧类特征:计算每个时间窗内用户血氧数据的极大值、极小值、均值、方差、离散度以及一般血氧水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;
步骤2.4,依据健康数据中的呼吸频率数据提取呼吸类特征:计算每个时间窗内用户呼吸数据的极大值、极小值、均值、方差、离散度以及一般呼吸水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。
步骤3,使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;具体包括:
步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2
步骤3.2,对全部特征值x使用公式
Figure BDA0002487352720000032
进行换算,x*即为标准化后的特征值。
步骤4,基于决策树算法,使用步骤3中标准化后的历史健康指标特征训练针对用户本人的健康状态分类器,得到用以预测用户健康状态的分类器模型;具体包括:
步骤4.1,将步骤3中得到的标准化后的历史健康指标特征标记为正样本;
步骤4.2,使用全部正样本并基于决策树(CART分类树)训练针对每位用户本人的健康状态分类器。
步骤5,从可穿戴设备获取用户实时健康数据并提取实时健康指标特征,使用步骤3中的预处理方法对实时健康指标特征进行标准化,然后基于步骤4训练得到的健康状态分类器,输入标准化后的实时健康指标特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数。具体包括:
步骤5.1,使用获取到的实时健康数据提取实时健康指标特征;其中,实时健康数据是指用户实时的可穿戴设备健康数据,同样从上述四类传感器数据中采样获取,实时健康指标特征是指从实时健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,其提取方法同步骤2的历史健康指标特征提取方法一致;
步骤5.2,对实时健康指标特征进行标准化处理,且标准化参数均值μ与方差σ2使用与所述历史健康指标特征的标准化参数相同的值;
步骤5.3,将标准化后的实时健康指标特征输入用户健康状态分类器,获得用户健康状态预测标记,健康标记为1,非健康标记为-1;
步骤5.4,待获得用户单日内全部健康状态预测标记后,计算全部标记总和的值作为用户的每日健康指数,该值取值范围为[-144,144],当该值小于50时,认为用户健康存在较大风险,需要做出体检提醒。
在此基础上,还可进一步获取一种健康状态的预警方法,即在上述步骤1-5之后,继续执行:
步骤6,根据用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取历史/实时数据特征,然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。具体包括:
步骤6.1,获取用户历史体检数据;体检数据是指用户通过正规医疗机构进行体检后获取的一系列身体化验指标数值,包括但不限于:身高、体重、肺活量、血压、血糖、血蛋白类、尿蛋白类、红细胞水平以及白细胞水平;
步骤6.2,获取用户被提醒后进行体检所得的实时体检数据;
步骤6.3,基于AAE(Adversarial Auto Encoder,对抗自编码器)将高维体检数据提取为低维度体检特征;
步骤6.4,基于CART分类树,使用历史体检数据特征训练用户健康判别分类器,然后输入实时体检数据特征进行判别,若判别结果为-1,则向用户发出疾病预警。
本发明中,用户历史健康数据是指来自用户在健康状态下的一段稳定使用期内(即步骤2所述的一段时间内)的可穿戴设备健康数据,该段时间的用户历史健康数据的获取时间范围由人工设定,一般使用一个月内的全部用户健康数据;所述步骤6中所述获取的用户历史体检数据由用户本人所拥有的数量决定,一般不少于30次记录;所述高维体检数据为包含50项以上指标的体检数据,所述低维度体检特征为高维体检数据经过特征提取算法后获取的维度降低的特征向量,该维度由人为设定,本方法中设置为6维。
进一步,本发明中可穿戴设备记录的健康数据是指,例如运动手环上通过搭载的光电传感器得到的使用者的心率、体温等信息的采样数据。
进一步,本发明中所提到决策树算法是指CART分类树(Classification andRegression Tree),是一种有监督机器学习算法。其核心思想就是通过建立一种树形结构并使用已有数据对其参数进行迭代,其中每个内部节点表示一个特征属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。
进一步,本发明中所提到的AAE算法是指对抗自编码器算法(Adversarial AutoEncoder),是一种深度学习算法。它通过组合一个对抗网络与自编码器的人工神经网络系统从而实现对原输入数据的还原,而在这过程中原数据会先通过编码器生成一种维度远低于原数据的原数据在低维流形上的映射(通常也是一组向量),这种低维数据就是所谓原数据的“编码”,其可以通过神经网络的后续部分再次“生成”与原数据同维的数据。通过对抗网络的对抗训练,生成的数据会逐渐接近乃至基本还原至原数据,那么此时,低维的“编码”数据也就可以认为是保留了原数据特性的一种低维特征。
本发明还提供了一种基于用户健康数据的健康状态跟踪系统,包括:
数据获取模块,从可穿戴设备获取用户健康数据,从用户本人获取用户体检数据;
特征提取模块,从用户健康数据提取用户健康指标相关的心率类特征、体温类特征、血氧类特征、呼吸类特征;从用户体检数据中基于对抗自编码器方法获取由神经网络自动学习输出的低维度体检特征;
健康状态跟踪模块,基于特征提取模块得到的用户健康指标特征,基于决策树算法使用历史健康指标特征训练针对用户本人的健康状态分类器,然后根据输入的实时健康指标特征获得用户的健康状态标记,根据标记对用户健康状态进行跟踪记录,并使用单日内用户健康标记计算用户每日健康指数。
相应地,本发明亦可提供一种健康状态预警系统,即在上述健康状态跟踪系统的基础上,还包括:
健康模型建立模块,根据从用户历史体检数据提取出的体检特征训练用户健康判别分类器;
预警模块,根据用户每日健康指数决定是否向用户发出体检提醒,提醒并获取实时体检数据后,提取出实时体检特征,输入用户健康判别分类器,根据判别结果做出是否向用户发出疾病预警的决策。
与现有技术相比,本发明的有益效果是:
1.在用户健康状态跟踪和判别模型建立过程中,只需要可穿戴设备上自动记录的数据以及用户提供的体检数据,不需要其他专门产生的数据。且用户在健康状态下产生的数据已经得到医院的判别,不需要再进行人工标记,从而该方法具有很低的人力和财力的花销。
2.使用的单类分类器的本身结构决定该算法简单容易实现,同时具有低的时间复杂度,降低了计算开销。
3.实现了对用户健康状态的直观性识别,通过分类器分类结果可以对用户的健康指数以及是否健康进行简单明了的判断,大大降低了决策环节的实现难度。
附图说明
图1是本发明的基于用户健康数据的健康状态跟踪及预警方法框图。
图2是本发明的基于用户健康数据的健康状态跟踪及预警系统框架图。
具体实施方式
本发明中的方法将分为离线建模和在线分析两部分说明,具体包括数据获取过程、特征提取过程、健康模型建立过程、在线健康状态跟踪与预警过程。图1是本发明的基于用户健康数据的健康状态跟踪及预警方法框图。本发明中的系统以框图形式予以说明。图2是本发明的基于用户健康数据的健康状态跟踪及预警系统框架图。
数据获取具体过程如下:
(1)通过无线通讯协议,以固定格式固定频率从可穿戴设备下载所需的用户健康数据;或者将可穿戴设备的数据通过其它方式导入,其中可穿戴设备的数据测量频率本实施例中设置为4次/分钟。获取的可穿戴设备用户健康数据实例如表1。
(2)通过设备端手动输入或表格批量载入,根据需要添加用户体检数据。或者,在获取用户以及体检机构授权的情况下,从体检机构的系统中直接导入体检数据。获取的用户体检数据实例(血常规部分数据)如表2。
表1可穿戴设备用户健康数据实例。
Figure BDA0002487352720000071
Figure BDA0002487352720000081
表2用户体检数据实例(血常规部分数据)
Figure BDA0002487352720000082
Figure BDA0002487352720000091
特征提取过程
通过批量数据处理和文本挖掘等技术,对用户健康数据进行特征提取。具体特征提取过程如下:
(1)依据健康数据中的心率数据提取心率类特征:计算10分钟内用户心率数据的极大值、极小值、均值、方差、离散度、一般心率水平。离散度的具体计算方法是:
首先将用户心率值按一般范围设置为50—150次/分钟的区间,并将该区间划分为[50,60),[60,70),…,[130,140),[140,150]这10个子区间。然后使用用户10分钟内的40组心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率。之后根据信息熵计算公式:
Figure BDA0002487352720000092
H即为心率数据的离散度,表征了心率数据在一般范围内的离散程度。
此外,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;
(2)依据健康数据中的体温数据提取体温类特征:计算10分钟内用户体温数据的极大值、极小值、均值、方差、离散度、一般体温水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;
(3)依据健康数据中的心率血氧数据提取血氧类特征:计算10分钟内用户血氧数据的极大值、极小值、均值、方差、离散度、一般血氧水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;
(4)依据健康数据中的呼吸频率数据提取呼吸类特征:计算10分钟内用户呼吸数据的极大值、极小值、均值、方差、离散度、一般呼吸水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。
特征标准化预处理过程
使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;具体包括:
步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2
步骤3.2,对全部特征值x使用公式
Figure BDA0002487352720000101
进行换算,x*即为标准化后的特征值。
健康模型建立过程
具体建立过程如下:
(1)将表3所示标准化后的用户历史健康指标特征向量标记为正样本;
(2)使用全部正样本并基于决策树(CART分类树)训练针对每位用户本人的健康状态分类器。
表3标准化后的用户历史健康指标特征
心率极大值 心率极小值 心率均值 心率方差 心率离散度 心率一般水平
-0.22834 -0.28261 -0.29367 -0.19553 2.041101 -0.1778
0.780835 0.321617 0.657325 -0.19553 0.121386 -0.46099
0.042275 0.305799 0.190311 0.110797 0.793286 1.190996
-0.47865 -0.29526 -0.48626 -0.19553 -0.00659 0.483
-0.46408 -0.26046 -0.46431 -0.19553 -0.45453 -0.46099
0.158378 -0.29526 -0.00627 -0.19553 1.273215 0.671799
1.453619 0.144463 1.108373 -0.19553 4.920673 0.954998
0.626262 0.820992 0.806011 1.347606 1.54746 -0.46099
-0.48659 -0.09912 -0.43038 -0.19553 1.657158 -0.46099
-0.36939 -0.29526 -0.40393 -0.19553 0.313358 0.954998
-0.20825 -0.29526 -0.24876 -0.00408 1.273215 -0.46099
0.530087 0.121264 0.504648 0.547318 -0.32655 -0.46099
-0.11179 -0.16556 -0.16893 -0.19553 -0.6465 -0.46099
-0.01417 0.739646 0.214261 0.88811 -0.6465 -0.46099
在线健康状态跟踪与预警过程
(1)从可穿戴设备获取用户实时健康数据,提取健康指标特征并对实时特征进行标准化,然后基于模型建立过程得到的健康状态分类器,输入实时特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数
(2)根据用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取历史/实时数据特征向量(如表4所示),然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。
表4从用户历史/实时体检数据中提取的数据特征向量
AEE特征1 AEE特征2 AEE特征3 AEE特征4 AEE特征5 AEE特征6
0.217085 -0.40907 -0.67304 -0.22404 1.037399 -0.14071
1.070773 0.478028 -0.56157 -0.15807 -0.31802 -0.14071
-0.01056 1.239752 0.447243 0.179638 -0.76831 -0.14071
-0.57969 -0.83405 -0.73683 -0.22404 -1.26834 -0.14071
-0.50855 0.873185 -0.09213 -0.22404 1.010061 -0.14071
0.046348 -0.72762 0.780635 0.061575 1.290788 -0.14071
4.656261 -0.59184 -0.20181 -0.1757 -0.2985 -0.14071
3.302556 0.133369 -0.60551 -0.22404 -0.10105 6.246664
0.003663 1.262798 1.117777 -0.22404 -1.07348 -0.14071
0.131716 0.702619 0.309636 0.957746 1.179158 -0.14071
0.345138 0.739825 1.871177 -0.22404 -0.46903 -0.14071
0.025005 0.680359 -0.32378 -0.15494 0.783951 -0.14071
表5是某用户的健康状态跟踪和预警在计算机上在线运行的可视化结果,健康状态被标记为“abnormal”的日期表明当日健康指数不正常;健康判别标记为“negative”则表面最终的体检数据判别为具有潜在疾病风险,需发出预警。
表5用户单日内健康状态跟踪的判断结果
Figure BDA0002487352720000111
Figure BDA0002487352720000121
上述的跟踪与预警过程,可仅限于跟踪获取健康指数,也可进一步向用户发出疾病预警。
综上,本发明所公开的基于用户健康数据的健康状态跟踪及预警方法和系统,实现简便、系统适应性强,功能完备,可以直接转化为轻量级程序搭载在智能手机或个人计算机上,有效减少用户的计算资源开销,仅需要接收通过网络传输的可穿戴设备数据或手动导入的体检数据,具有实际应用的优势,提供了针对用户个人健康状况的建模化跟踪分析方法,同时对用户是否存在威胁生命健康的疾病风险进行了决策性判断。

Claims (10)

1.一种基于用户健康数据的健康状态跟踪方法,其特征在于,包括如下步骤:
步骤1,以可穿戴设备记录的传感器数据为数据源,获取所需的用户健康数据;
步骤2,从一段时间内的用户历史健康数据中提取历史健康指标特征,将提取到的全部特征作为历史特征集用于下一步的模型训练;
步骤3,使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;
步骤4,基于决策树算法,使用步骤3中标准化后的历史健康指标特征训练针对用户本人的健康状态分类器,得到用以预测用户健康状态的分类器模型;
步骤5,从可穿戴设备获取用户实时健康数据并提取实时健康指标特征,使用步骤3中的预处理方法对实时健康指标特征进行标准化,然后基于步骤4训练得到的健康状态分类器,输入标准化后的实时健康指标特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数。
2.根据权利要求1所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述历史健康数据是指用户在健康状态下的一段稳定使用期内的可穿戴设备健康数据,实时健康数据是指用户实时的可穿戴设备健康数据,均从四类传感器数据中采样获取,包括:心率数据、体温数据、血氧数据以及呼吸频率数据,所述历史健康指标特征、实时健康指标特征是指分别从历史健康数据、实时健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,所述体检数据是指用户通过正规医疗机构进行体检后获取的一系列身体化验指标数值,包括:身高、体重、肺活量、血压、血糖、血蛋白类、尿蛋白类、红细胞水平以及白细胞水平,所述步骤2中一段时间内的用户历史健康数据的获取时间范围由人工设定。
3.根据权利要求2所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述步骤2和步骤5中,历史健康指标特征和实时健康指标特征提取包括:
(1)依据健康数据中的心率数据提取心率类特征:计算每个时间窗内用户心率数据的极大值、极小值、均值、方差、离散度以及一般心率水平,所述时间窗是指计算一组健康指标特征所用的健康数据的时间范围,所述离散度的具体计算方法是:
首先将用户心率值设置为50—150次/分钟,并划分为[50,60),[60,70),…,[130,140),[140,150]共10个子区间,然后使用所述一个时间窗内的所有心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率,之后根据信息熵计算公式计算心率数据的离散度:
Figure FDA0002487352710000021
H即为心率数据的离散度,表征了心率数据在一般范围内的离散程度,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;
(2)依据健康数据中的体温数据提取体温类特征:计算每个时间窗内用户体温数据的极大值、极小值、均值、方差、离散度以及一般体温水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;
(3)依据健康数据中的心率血氧数据提取血氧类特征:计算每个时间窗内用户血氧数据的极大值、极小值、均值、方差、离散度以及一般血氧水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;
(4)依据健康数据中的呼吸频率数据提取呼吸类特征:计算每个时间窗内用户呼吸数据的极大值、极小值、均值、方差、离散度以及一般呼吸水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。
4.根据权利要求1所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述步骤3中,历史健康指标特征的标准化具体包括:
步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2
步骤3.2,对全部特征值x使用公式
Figure FDA0002487352710000031
进行换算,x*即为标准化后的特征值。
5.根据权利要求1所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述步骤4具体包括:
步骤4.1,将步骤3中得到的标准化后的历史健康指标特征标记为正样本;
步骤4.2,使用全部正样本并基于CART分类树训练针对每位用户本人的健康状态分类器;
所述步骤5中从可穿戴设备获取数据的数据传输频率和特征提取的时间区间同步,所述步骤5具体包括:
步骤5.1,使用获取到的实时健康数据提取实时健康指标特征;
步骤5.2,对实时健康指标特征进行标准化处理,且标准化参数均值μ与方差σ2使用与所述历史健康指标特征的标准化参数相同的值;
步骤5.3,将标准化后的实时健康指标特征输入用户健康状态分类器,获得用户健康状态预测标记,健康标记为1,非健康标记为-1;
步骤5.4,待获得用户单日内全部健康状态预测标记后,计算全部标记总和的值作为用户的每日健康指数,该值取值范围为[-144,144],当该值小于50时,认为用户健康存在较大风险,需要做出体检提醒。
6.一种基于用户健康数据的健康状态预警方法,根据权利要求1所述健康状态跟踪方法获取的用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取历史/实时数据特征,然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。
7.根据权利要求6所述基于用户健康数据的健康状态预警方法,其特征在于,具体包括:
步骤6.1,获取用户历史体检数据;
步骤6.2,获取用户被提醒后进行体检所得的实时体检数据;
步骤6.3,基于AAE(Adversarial Auto Encoder,对抗自编码器)将高维体检数据提取为低维度体检特征;
步骤6.4,基于CART分类树,使用历史体检数据特征训练用户健康判别分类器,然后输入实时体检数据特征进行判别,若判别结果为-1,则向用户发出疾病预警。
8.根据权利要求7所述基于用户健康数据的健康状态预警方法,其特征在于,所述获取的用户历史体检数据由用户本人所拥有的数量决定;所述高维体检数据为包含50项以上指标的体检数据,所述低维度体检特征为高维体检数据经过特征提取算法后获取的维度降低的特征向量,该维度由人为设定。
9.一种基于用户健康数据的健康状态跟踪系统,其特征在于,包括:
数据获取模块,从可穿戴设备获取用户健康数据,从用户本人获取用户体检数据;
特征提取模块,从用户健康数据提取用户健康指标相关的心率类特征、体温类特征、血氧类特征、呼吸类特征;从用户体检数据中基于对抗自编码器方法获取由神经网络自动学习输出的低维度体检特征;
健康状态跟踪模块,基于特征提取模块得到的用户健康指标特征,基于决策树算法使用历史健康指标特征训练针对用户本人的健康状态分类器,然后根据输入的实时健康指标特征获得用户的健康状态标记,根据标记对用户健康状态进行跟踪记录,并使用单日内用户健康标记计算用户每日健康指数。
10.一种基于用户健康数据的健康状态预警系统,其特征在于,在权利要求9所述基于用户健康数据的健康状态跟踪系统的基础上,还包括:
健康模型建立模块,根据从用户历史体检数据提取出的体检特征训练用户健康判别分类器;
预警模块,根据用户每日健康指数决定是否向用户发出体检提醒,提醒并获取实时体检数据后,提取出实时体检特征,输入用户健康判别分类器,根据判别结果做出是否向用户发出疾病预警的决策。
CN202010395523.6A 2020-05-12 2020-05-12 一种基于用户健康数据的健康状态跟踪及预警方法和系统 Active CN111540471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010395523.6A CN111540471B (zh) 2020-05-12 2020-05-12 一种基于用户健康数据的健康状态跟踪及预警方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010395523.6A CN111540471B (zh) 2020-05-12 2020-05-12 一种基于用户健康数据的健康状态跟踪及预警方法和系统

Publications (2)

Publication Number Publication Date
CN111540471A true CN111540471A (zh) 2020-08-14
CN111540471B CN111540471B (zh) 2024-01-26

Family

ID=71979360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010395523.6A Active CN111540471B (zh) 2020-05-12 2020-05-12 一种基于用户健康数据的健康状态跟踪及预警方法和系统

Country Status (1)

Country Link
CN (1) CN111540471B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182412A (zh) * 2020-11-26 2021-01-05 南京吉拉福网络科技有限公司 用于推荐体检项目的方法、计算设备和计算机存储介质
CN112270994A (zh) * 2020-10-14 2021-01-26 中国医学科学院阜外医院 一种风险预测模型的构建方法、设备、终端及存储介质
CN112509696A (zh) * 2020-11-04 2021-03-16 江南大学 基于卷积自编码器高斯混合模型的健康数据检测方法
WO2022125312A1 (en) * 2020-12-07 2022-06-16 Mark Newton Identification and tracking of infection in humans
CN114898877A (zh) * 2022-05-06 2022-08-12 上海铂桐医疗科技有限公司 适用于多维度健康数据的处理方法及系统
EP4091945A1 (en) * 2021-05-18 2022-11-23 Leonardo S.p.a. Method and system for detecting anomalies relating to components of a transmission system of an aircraft, in particular a helicopter
CN116564527A (zh) * 2023-07-11 2023-08-08 南京裕隆生物医学发展有限公司 一种基于生理特征深度学习的呼吸健康分析方法
CN116665894A (zh) * 2023-04-24 2023-08-29 南方医科大学南方医院 骨龄监测系统、方法、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147949A (zh) * 2018-08-16 2019-01-04 辽宁大学 一种基于分类回归树来用于检测教师亚健康状态的方法
WO2019071201A1 (en) * 2017-10-06 2019-04-11 Alivecor, Inc. CONTINUOUS MONITORING OF THE HEALTH OF A USER WITH A MOBILE DEVICE
CN109712711A (zh) * 2018-12-12 2019-05-03 平安科技(深圳)有限公司 基于机器学习的健康评估方法、装置、电子设备及介质
CN109767836A (zh) * 2018-12-29 2019-05-17 上海亲看慧智能科技有限公司 一种医学诊断人工智能系统、装置及其自我学习方法
CN110136822A (zh) * 2019-04-11 2019-08-16 周凡 一种家用可穿戴设备的社区医疗智能管控方法
US20190336824A1 (en) * 2012-08-31 2019-11-07 Blue Goji Llc System and method for predictive health monitoring

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190336824A1 (en) * 2012-08-31 2019-11-07 Blue Goji Llc System and method for predictive health monitoring
WO2019071201A1 (en) * 2017-10-06 2019-04-11 Alivecor, Inc. CONTINUOUS MONITORING OF THE HEALTH OF A USER WITH A MOBILE DEVICE
CN109147949A (zh) * 2018-08-16 2019-01-04 辽宁大学 一种基于分类回归树来用于检测教师亚健康状态的方法
CN109712711A (zh) * 2018-12-12 2019-05-03 平安科技(深圳)有限公司 基于机器学习的健康评估方法、装置、电子设备及介质
CN109767836A (zh) * 2018-12-29 2019-05-17 上海亲看慧智能科技有限公司 一种医学诊断人工智能系统、装置及其自我学习方法
CN110136822A (zh) * 2019-04-11 2019-08-16 周凡 一种家用可穿戴设备的社区医疗智能管控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
钟昕孜 等: "基于自编码器的语音情感识别方法研究", 《电子设计工程》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270994A (zh) * 2020-10-14 2021-01-26 中国医学科学院阜外医院 一种风险预测模型的构建方法、设备、终端及存储介质
CN112509696A (zh) * 2020-11-04 2021-03-16 江南大学 基于卷积自编码器高斯混合模型的健康数据检测方法
CN112182412A (zh) * 2020-11-26 2021-01-05 南京吉拉福网络科技有限公司 用于推荐体检项目的方法、计算设备和计算机存储介质
CN112182412B (zh) * 2020-11-26 2021-04-02 南京吉拉福网络科技有限公司 用于推荐体检项目的方法、计算设备和计算机存储介质
WO2022125312A1 (en) * 2020-12-07 2022-06-16 Mark Newton Identification and tracking of infection in humans
EP4091945A1 (en) * 2021-05-18 2022-11-23 Leonardo S.p.a. Method and system for detecting anomalies relating to components of a transmission system of an aircraft, in particular a helicopter
WO2022243764A1 (en) * 2021-05-18 2022-11-24 LEONARDO S.p.A Method and system for detecting anomalies relating to components of a transmission system of an aircraft, in particular a helicopter
CN114898877A (zh) * 2022-05-06 2022-08-12 上海铂桐医疗科技有限公司 适用于多维度健康数据的处理方法及系统
CN114898877B (zh) * 2022-05-06 2023-07-04 上海铂桐医疗科技有限公司 适用于多维度健康数据的处理方法及系统
CN116665894A (zh) * 2023-04-24 2023-08-29 南方医科大学南方医院 骨龄监测系统、方法、电子设备及存储介质
CN116564527A (zh) * 2023-07-11 2023-08-08 南京裕隆生物医学发展有限公司 一种基于生理特征深度学习的呼吸健康分析方法
CN116564527B (zh) * 2023-07-11 2023-09-15 南京裕隆生物医学发展有限公司 一种基于生理特征深度学习的呼吸健康分析方法

Also Published As

Publication number Publication date
CN111540471B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN111540471B (zh) 一种基于用户健康数据的健康状态跟踪及预警方法和系统
CN110263846B (zh) 基于故障数据深度挖掘及学习的故障诊断方法
CN116705337B (zh) 一种健康数据采集及智能分析方法
CN107506602A (zh) 一种大数据健康预测系统
CN105595990A (zh) 一种用于心电信号质量评估判别的智能终端设备
CN109009017B (zh) 一种智能健康监测系统及其数据处理方法
US20210225510A1 (en) Human body health assessment method and system based on sleep big data
CN108717668A (zh) 一种奶牛行为与生理特征物联网系统及其工作方法
CN108090515B (zh) 一种基于数据融合的环境等级评估方法
CN107609477A (zh) 一种基于深度学习与智能手环相结合的摔倒检测方法
CN112331349B (zh) 一种脑卒中复发监测系统
CN107766898A (zh) 基于svm的三分类情绪概率判断方法
CN105726013A (zh) 一种具有心电信号质量判别功能的心电监测系统
CN110974219A (zh) 一种基于侵入式bci的人脑意念识别系统
CN115876258A (zh) 基于多源数据的畜禽养殖环境异常监测及报警系统
CN112244871A (zh) 一种基于机器学习的振幅整合脑电图分类识读系统
CN115760525A (zh) 一种基于物联网智慧养老系统及方法
CN117476214A (zh) 一种基于医院信息的数据治理方法和系统
CN116978510A (zh) 一种居家脑卒中患者的护理分级评估系统
CN112826507A (zh) 一种感音神经性耳聋的脑功能网络演化建模方法
CN109620263B (zh) 一种企事业单位上岗人员体征安全分析方法
CN116189866A (zh) 一种基于数据分析的远程医用护理分析系统
CN108846327A (zh) 一种色素痣与黑素瘤的智能判别系统及方法
CN114464319A (zh) 一种基于慢特征分析和深度神经网络的ams易感性评估系统
CN112365992A (zh) 一种基于nrs-lda的医疗体检数据识别分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant