CN111540471A - 一种基于用户健康数据的健康状态跟踪及预警方法和系统 - Google Patents
一种基于用户健康数据的健康状态跟踪及预警方法和系统 Download PDFInfo
- Publication number
- CN111540471A CN111540471A CN202010395523.6A CN202010395523A CN111540471A CN 111540471 A CN111540471 A CN 111540471A CN 202010395523 A CN202010395523 A CN 202010395523A CN 111540471 A CN111540471 A CN 111540471A
- Authority
- CN
- China
- Prior art keywords
- user
- health
- data
- physical examination
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000036541 health Effects 0.000 title claims abstract description 233
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 20
- 201000010099 disease Diseases 0.000 claims abstract description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 12
- 238000003066 decision tree Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims abstract description 7
- 230000036760 body temperature Effects 0.000 claims description 34
- 239000006185 dispersion Substances 0.000 claims description 32
- 210000004369 blood Anatomy 0.000 claims description 28
- 239000008280 blood Substances 0.000 claims description 28
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 23
- 229910052760 oxygen Inorganic materials 0.000 claims description 23
- 239000001301 oxygen Substances 0.000 claims description 23
- 230000003862 health status Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 13
- 230000029058 respiratory gaseous exchange Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000000241 respiratory effect Effects 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000036391 respiratory frequency Effects 0.000 claims description 4
- 102000004506 Blood Proteins Human genes 0.000 claims description 2
- 108010017384 Blood Proteins Proteins 0.000 claims description 2
- 230000036772 blood pressure Effects 0.000 claims description 2
- 210000003743 erythrocyte Anatomy 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 210000000265 leukocyte Anatomy 0.000 claims description 2
- 210000004072 lung Anatomy 0.000 claims description 2
- 102000004169 proteins and genes Human genes 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 claims description 2
- 230000036387 respiratory rate Effects 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 150000002926 oxygen Chemical class 0.000 claims 1
- 239000000126 substance Substances 0.000 claims 1
- 230000001360 synchronised effect Effects 0.000 claims 1
- 230000002159 abnormal effect Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
一种基于用户健康数据的健康状态跟踪方法,从可穿戴设备中提取用户健康数据;从用户健康数据中提取健康指标特征,并对特征进行预处理;基于决策树算法,使用用户历史健康指标特征集训练用户健康状态分类器;根据分类器模型对用户实时健康指标特征进行判别以获得用户健康状态标记序列,并用以计算用户每日健康指数;进一步地,可参考用户每日健康指数正常/异常,选择是否向用户发出体检提醒;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取低维度的历史/实时数据特征向量,然后基于历史体检数据特征训练用户健康判别分类器,根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警,本发明还提供了相应的系统。
Description
技术领域
本发明属于数据挖掘技术领域,特别涉及一种基于用户健康数据的健康状态跟踪及预警方法和系统。
背景技术
随着各类新型传感器设备制造技术的发展以及各种智能终端的不断普及,更多的用户选择使用诸如智能手表、运动手环等可穿戴设备来实现对个人健康状态的监控以及运动数据的记录与处理。但这些设备受制于搭载硬件的计算性能以及软件的复杂度,大多数只能实现对用户健康数据的简单记录与显示,而无法实现对数据的进一步处理与分析。因此,这就造成数据资源的浪费,且无法给用户对个人健康状态的评估提供有价值的参照
虽然诸如此类的可穿戴设备无法直接进行较可靠的健康监控,但可以较为全面的记录用户的各种健康数据。通过这些数据我们可以利用技术手段提取出用户的一些健康指标特征,从而尝试对用户健康状态进行跟踪并对异常状态进行识别。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于用户健康数据的健康状态跟踪及预警方法和系统,从可穿戴设备获取用户健康数据,然后通过统计大量用户健康数据提取用户的心率类、血氧类、体温类、呼吸类等健康指标特征;使用决策树算法建立针对每位用户的健康状态跟踪分类器;通过使用分类器对用户实时健康指标特征进行分类从而获取用户的一系列健康状态标记,并根据健康状态标记计算用户每日健康指数;此外,获取用户历史体检数据并通过人工神经网络方法提取数据特征,使用历史特征训练基于决策树算法的用户健康判别分类器,并根据用户每日健康指数决定是否向用户发送体检提醒。若用户进行体检则提取实时体检数据的特征并输入健康判别分类器进行判别,并根据判别结果决定是否发出疾病预警。本发明不仅考虑了用户的历史健康数据,同时也考虑了用户的当前数据,具有获取成本低、信息内容丰富、覆盖用户广、针对用户的健康模型更精准等优点,使得本申请与传统的方法和系统相比,具有明显优势。
为了实现上述目的,本发明采用的技术方案是:
一种基于用户健康数据的健康状态跟踪方法,包括如下步骤:
步骤1,以可穿戴设备记录的传感器数据为数据源,获取所需的用户健康数据。
步骤2,从一段时间内的用户历史健康数据中提取历史健康指标特征,将提取到的全部特征作为历史特征集用于下一步的模型训练。
其中,历史健康数据是指用户在健康状态下的一段稳定使用期内的可穿戴设备健康数据,从四类传感器数据中采样获取,包括:心率数据、体温数据、血氧数据以及呼吸频率数据,历史健康指标特征是指从历史健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,一般共计24个。
步骤2具体包括:
步骤2.1,依据健康数据中的心率数据提取心率类特征:计算每个时间窗内用户心率数据的极大值、极小值、均值、方差、离散度以及一般心率水平,时间窗是指计算一组健康指标特征所用的健康数据的时间范围,一般可设为10分钟,可穿戴设备的数据测量频率均为4次/分钟,则所述离散度的具体计算方法是:
首先将用户心率值设置为50—150次/分钟,并划分为[50,60),[60,70),…,[130,140),[140,150]共10个子区间,然后使用所述一个时间窗内的所有心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率,之后根据信息熵计算公式计算心率数据的离散度:
H即为心率数据的离散度,表征了心率数据在一般范围内的离散程度,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;
步骤2.2,依据健康数据中的体温数据提取体温类特征:计算每个时间窗内用户体温数据的极大值、极小值、均值、方差、离散度以及一般体温水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;
步骤2.3,依据健康数据中的心率血氧数据提取血氧类特征:计算每个时间窗内用户血氧数据的极大值、极小值、均值、方差、离散度以及一般血氧水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;
步骤2.4,依据健康数据中的呼吸频率数据提取呼吸类特征:计算每个时间窗内用户呼吸数据的极大值、极小值、均值、方差、离散度以及一般呼吸水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。
步骤3,使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;具体包括:
步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2;
步骤4,基于决策树算法,使用步骤3中标准化后的历史健康指标特征训练针对用户本人的健康状态分类器,得到用以预测用户健康状态的分类器模型;具体包括:
步骤4.1,将步骤3中得到的标准化后的历史健康指标特征标记为正样本;
步骤4.2,使用全部正样本并基于决策树(CART分类树)训练针对每位用户本人的健康状态分类器。
步骤5,从可穿戴设备获取用户实时健康数据并提取实时健康指标特征,使用步骤3中的预处理方法对实时健康指标特征进行标准化,然后基于步骤4训练得到的健康状态分类器,输入标准化后的实时健康指标特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数。具体包括:
步骤5.1,使用获取到的实时健康数据提取实时健康指标特征;其中,实时健康数据是指用户实时的可穿戴设备健康数据,同样从上述四类传感器数据中采样获取,实时健康指标特征是指从实时健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,其提取方法同步骤2的历史健康指标特征提取方法一致;
步骤5.2,对实时健康指标特征进行标准化处理,且标准化参数均值μ与方差σ2使用与所述历史健康指标特征的标准化参数相同的值;
步骤5.3,将标准化后的实时健康指标特征输入用户健康状态分类器,获得用户健康状态预测标记,健康标记为1,非健康标记为-1;
步骤5.4,待获得用户单日内全部健康状态预测标记后,计算全部标记总和的值作为用户的每日健康指数,该值取值范围为[-144,144],当该值小于50时,认为用户健康存在较大风险,需要做出体检提醒。
在此基础上,还可进一步获取一种健康状态的预警方法,即在上述步骤1-5之后,继续执行:
步骤6,根据用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取历史/实时数据特征,然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。具体包括:
步骤6.1,获取用户历史体检数据;体检数据是指用户通过正规医疗机构进行体检后获取的一系列身体化验指标数值,包括但不限于:身高、体重、肺活量、血压、血糖、血蛋白类、尿蛋白类、红细胞水平以及白细胞水平;
步骤6.2,获取用户被提醒后进行体检所得的实时体检数据;
步骤6.3,基于AAE(Adversarial Auto Encoder,对抗自编码器)将高维体检数据提取为低维度体检特征;
步骤6.4,基于CART分类树,使用历史体检数据特征训练用户健康判别分类器,然后输入实时体检数据特征进行判别,若判别结果为-1,则向用户发出疾病预警。
本发明中,用户历史健康数据是指来自用户在健康状态下的一段稳定使用期内(即步骤2所述的一段时间内)的可穿戴设备健康数据,该段时间的用户历史健康数据的获取时间范围由人工设定,一般使用一个月内的全部用户健康数据;所述步骤6中所述获取的用户历史体检数据由用户本人所拥有的数量决定,一般不少于30次记录;所述高维体检数据为包含50项以上指标的体检数据,所述低维度体检特征为高维体检数据经过特征提取算法后获取的维度降低的特征向量,该维度由人为设定,本方法中设置为6维。
进一步,本发明中可穿戴设备记录的健康数据是指,例如运动手环上通过搭载的光电传感器得到的使用者的心率、体温等信息的采样数据。
进一步,本发明中所提到决策树算法是指CART分类树(Classification andRegression Tree),是一种有监督机器学习算法。其核心思想就是通过建立一种树形结构并使用已有数据对其参数进行迭代,其中每个内部节点表示一个特征属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。
进一步,本发明中所提到的AAE算法是指对抗自编码器算法(Adversarial AutoEncoder),是一种深度学习算法。它通过组合一个对抗网络与自编码器的人工神经网络系统从而实现对原输入数据的还原,而在这过程中原数据会先通过编码器生成一种维度远低于原数据的原数据在低维流形上的映射(通常也是一组向量),这种低维数据就是所谓原数据的“编码”,其可以通过神经网络的后续部分再次“生成”与原数据同维的数据。通过对抗网络的对抗训练,生成的数据会逐渐接近乃至基本还原至原数据,那么此时,低维的“编码”数据也就可以认为是保留了原数据特性的一种低维特征。
本发明还提供了一种基于用户健康数据的健康状态跟踪系统,包括:
数据获取模块,从可穿戴设备获取用户健康数据,从用户本人获取用户体检数据;
特征提取模块,从用户健康数据提取用户健康指标相关的心率类特征、体温类特征、血氧类特征、呼吸类特征;从用户体检数据中基于对抗自编码器方法获取由神经网络自动学习输出的低维度体检特征;
健康状态跟踪模块,基于特征提取模块得到的用户健康指标特征,基于决策树算法使用历史健康指标特征训练针对用户本人的健康状态分类器,然后根据输入的实时健康指标特征获得用户的健康状态标记,根据标记对用户健康状态进行跟踪记录,并使用单日内用户健康标记计算用户每日健康指数。
相应地,本发明亦可提供一种健康状态预警系统,即在上述健康状态跟踪系统的基础上,还包括:
健康模型建立模块,根据从用户历史体检数据提取出的体检特征训练用户健康判别分类器;
预警模块,根据用户每日健康指数决定是否向用户发出体检提醒,提醒并获取实时体检数据后,提取出实时体检特征,输入用户健康判别分类器,根据判别结果做出是否向用户发出疾病预警的决策。
与现有技术相比,本发明的有益效果是:
1.在用户健康状态跟踪和判别模型建立过程中,只需要可穿戴设备上自动记录的数据以及用户提供的体检数据,不需要其他专门产生的数据。且用户在健康状态下产生的数据已经得到医院的判别,不需要再进行人工标记,从而该方法具有很低的人力和财力的花销。
2.使用的单类分类器的本身结构决定该算法简单容易实现,同时具有低的时间复杂度,降低了计算开销。
3.实现了对用户健康状态的直观性识别,通过分类器分类结果可以对用户的健康指数以及是否健康进行简单明了的判断,大大降低了决策环节的实现难度。
附图说明
图1是本发明的基于用户健康数据的健康状态跟踪及预警方法框图。
图2是本发明的基于用户健康数据的健康状态跟踪及预警系统框架图。
具体实施方式
本发明中的方法将分为离线建模和在线分析两部分说明,具体包括数据获取过程、特征提取过程、健康模型建立过程、在线健康状态跟踪与预警过程。图1是本发明的基于用户健康数据的健康状态跟踪及预警方法框图。本发明中的系统以框图形式予以说明。图2是本发明的基于用户健康数据的健康状态跟踪及预警系统框架图。
数据获取具体过程如下:
(1)通过无线通讯协议,以固定格式固定频率从可穿戴设备下载所需的用户健康数据;或者将可穿戴设备的数据通过其它方式导入,其中可穿戴设备的数据测量频率本实施例中设置为4次/分钟。获取的可穿戴设备用户健康数据实例如表1。
(2)通过设备端手动输入或表格批量载入,根据需要添加用户体检数据。或者,在获取用户以及体检机构授权的情况下,从体检机构的系统中直接导入体检数据。获取的用户体检数据实例(血常规部分数据)如表2。
表1可穿戴设备用户健康数据实例。
表2用户体检数据实例(血常规部分数据)
特征提取过程
通过批量数据处理和文本挖掘等技术,对用户健康数据进行特征提取。具体特征提取过程如下:
(1)依据健康数据中的心率数据提取心率类特征:计算10分钟内用户心率数据的极大值、极小值、均值、方差、离散度、一般心率水平。离散度的具体计算方法是:
首先将用户心率值按一般范围设置为50—150次/分钟的区间,并将该区间划分为[50,60),[60,70),…,[130,140),[140,150]这10个子区间。然后使用用户10分钟内的40组心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率。之后根据信息熵计算公式:
H即为心率数据的离散度,表征了心率数据在一般范围内的离散程度。
此外,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;
(2)依据健康数据中的体温数据提取体温类特征:计算10分钟内用户体温数据的极大值、极小值、均值、方差、离散度、一般体温水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;
(3)依据健康数据中的心率血氧数据提取血氧类特征:计算10分钟内用户血氧数据的极大值、极小值、均值、方差、离散度、一般血氧水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;
(4)依据健康数据中的呼吸频率数据提取呼吸类特征:计算10分钟内用户呼吸数据的极大值、极小值、均值、方差、离散度、一般呼吸水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。
特征标准化预处理过程
使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;具体包括:
步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2;
健康模型建立过程
具体建立过程如下:
(1)将表3所示标准化后的用户历史健康指标特征向量标记为正样本;
(2)使用全部正样本并基于决策树(CART分类树)训练针对每位用户本人的健康状态分类器。
表3标准化后的用户历史健康指标特征
心率极大值 | 心率极小值 | 心率均值 | 心率方差 | 心率离散度 | 心率一般水平 |
-0.22834 | -0.28261 | -0.29367 | -0.19553 | 2.041101 | -0.1778 |
0.780835 | 0.321617 | 0.657325 | -0.19553 | 0.121386 | -0.46099 |
0.042275 | 0.305799 | 0.190311 | 0.110797 | 0.793286 | 1.190996 |
-0.47865 | -0.29526 | -0.48626 | -0.19553 | -0.00659 | 0.483 |
-0.46408 | -0.26046 | -0.46431 | -0.19553 | -0.45453 | -0.46099 |
0.158378 | -0.29526 | -0.00627 | -0.19553 | 1.273215 | 0.671799 |
1.453619 | 0.144463 | 1.108373 | -0.19553 | 4.920673 | 0.954998 |
0.626262 | 0.820992 | 0.806011 | 1.347606 | 1.54746 | -0.46099 |
-0.48659 | -0.09912 | -0.43038 | -0.19553 | 1.657158 | -0.46099 |
-0.36939 | -0.29526 | -0.40393 | -0.19553 | 0.313358 | 0.954998 |
-0.20825 | -0.29526 | -0.24876 | -0.00408 | 1.273215 | -0.46099 |
0.530087 | 0.121264 | 0.504648 | 0.547318 | -0.32655 | -0.46099 |
-0.11179 | -0.16556 | -0.16893 | -0.19553 | -0.6465 | -0.46099 |
-0.01417 | 0.739646 | 0.214261 | 0.88811 | -0.6465 | -0.46099 |
在线健康状态跟踪与预警过程
(1)从可穿戴设备获取用户实时健康数据,提取健康指标特征并对实时特征进行标准化,然后基于模型建立过程得到的健康状态分类器,输入实时特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数
(2)根据用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取历史/实时数据特征向量(如表4所示),然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。
表4从用户历史/实时体检数据中提取的数据特征向量
AEE特征1 | AEE特征2 | AEE特征3 | AEE特征4 | AEE特征5 | AEE特征6 |
0.217085 | -0.40907 | -0.67304 | -0.22404 | 1.037399 | -0.14071 |
1.070773 | 0.478028 | -0.56157 | -0.15807 | -0.31802 | -0.14071 |
-0.01056 | 1.239752 | 0.447243 | 0.179638 | -0.76831 | -0.14071 |
-0.57969 | -0.83405 | -0.73683 | -0.22404 | -1.26834 | -0.14071 |
-0.50855 | 0.873185 | -0.09213 | -0.22404 | 1.010061 | -0.14071 |
0.046348 | -0.72762 | 0.780635 | 0.061575 | 1.290788 | -0.14071 |
4.656261 | -0.59184 | -0.20181 | -0.1757 | -0.2985 | -0.14071 |
3.302556 | 0.133369 | -0.60551 | -0.22404 | -0.10105 | 6.246664 |
0.003663 | 1.262798 | 1.117777 | -0.22404 | -1.07348 | -0.14071 |
0.131716 | 0.702619 | 0.309636 | 0.957746 | 1.179158 | -0.14071 |
0.345138 | 0.739825 | 1.871177 | -0.22404 | -0.46903 | -0.14071 |
0.025005 | 0.680359 | -0.32378 | -0.15494 | 0.783951 | -0.14071 |
表5是某用户的健康状态跟踪和预警在计算机上在线运行的可视化结果,健康状态被标记为“abnormal”的日期表明当日健康指数不正常;健康判别标记为“negative”则表面最终的体检数据判别为具有潜在疾病风险,需发出预警。
表5用户单日内健康状态跟踪的判断结果
上述的跟踪与预警过程,可仅限于跟踪获取健康指数,也可进一步向用户发出疾病预警。
综上,本发明所公开的基于用户健康数据的健康状态跟踪及预警方法和系统,实现简便、系统适应性强,功能完备,可以直接转化为轻量级程序搭载在智能手机或个人计算机上,有效减少用户的计算资源开销,仅需要接收通过网络传输的可穿戴设备数据或手动导入的体检数据,具有实际应用的优势,提供了针对用户个人健康状况的建模化跟踪分析方法,同时对用户是否存在威胁生命健康的疾病风险进行了决策性判断。
Claims (10)
1.一种基于用户健康数据的健康状态跟踪方法,其特征在于,包括如下步骤:
步骤1,以可穿戴设备记录的传感器数据为数据源,获取所需的用户健康数据;
步骤2,从一段时间内的用户历史健康数据中提取历史健康指标特征,将提取到的全部特征作为历史特征集用于下一步的模型训练;
步骤3,使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;
步骤4,基于决策树算法,使用步骤3中标准化后的历史健康指标特征训练针对用户本人的健康状态分类器,得到用以预测用户健康状态的分类器模型;
步骤5,从可穿戴设备获取用户实时健康数据并提取实时健康指标特征,使用步骤3中的预处理方法对实时健康指标特征进行标准化,然后基于步骤4训练得到的健康状态分类器,输入标准化后的实时健康指标特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数。
2.根据权利要求1所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述历史健康数据是指用户在健康状态下的一段稳定使用期内的可穿戴设备健康数据,实时健康数据是指用户实时的可穿戴设备健康数据,均从四类传感器数据中采样获取,包括:心率数据、体温数据、血氧数据以及呼吸频率数据,所述历史健康指标特征、实时健康指标特征是指分别从历史健康数据、实时健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,所述体检数据是指用户通过正规医疗机构进行体检后获取的一系列身体化验指标数值,包括:身高、体重、肺活量、血压、血糖、血蛋白类、尿蛋白类、红细胞水平以及白细胞水平,所述步骤2中一段时间内的用户历史健康数据的获取时间范围由人工设定。
3.根据权利要求2所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述步骤2和步骤5中,历史健康指标特征和实时健康指标特征提取包括:
(1)依据健康数据中的心率数据提取心率类特征:计算每个时间窗内用户心率数据的极大值、极小值、均值、方差、离散度以及一般心率水平,所述时间窗是指计算一组健康指标特征所用的健康数据的时间范围,所述离散度的具体计算方法是:
首先将用户心率值设置为50—150次/分钟,并划分为[50,60),[60,70),…,[130,140),[140,150]共10个子区间,然后使用所述一个时间窗内的所有心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率,之后根据信息熵计算公式计算心率数据的离散度:
H即为心率数据的离散度,表征了心率数据在一般范围内的离散程度,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;
(2)依据健康数据中的体温数据提取体温类特征:计算每个时间窗内用户体温数据的极大值、极小值、均值、方差、离散度以及一般体温水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;
(3)依据健康数据中的心率血氧数据提取血氧类特征:计算每个时间窗内用户血氧数据的极大值、极小值、均值、方差、离散度以及一般血氧水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;
(4)依据健康数据中的呼吸频率数据提取呼吸类特征:计算每个时间窗内用户呼吸数据的极大值、极小值、均值、方差、离散度以及一般呼吸水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。
5.根据权利要求1所述基于用户健康数据的健康状态跟踪方法,其特征在于,所述步骤4具体包括:
步骤4.1,将步骤3中得到的标准化后的历史健康指标特征标记为正样本;
步骤4.2,使用全部正样本并基于CART分类树训练针对每位用户本人的健康状态分类器;
所述步骤5中从可穿戴设备获取数据的数据传输频率和特征提取的时间区间同步,所述步骤5具体包括:
步骤5.1,使用获取到的实时健康数据提取实时健康指标特征;
步骤5.2,对实时健康指标特征进行标准化处理,且标准化参数均值μ与方差σ2使用与所述历史健康指标特征的标准化参数相同的值;
步骤5.3,将标准化后的实时健康指标特征输入用户健康状态分类器,获得用户健康状态预测标记,健康标记为1,非健康标记为-1;
步骤5.4,待获得用户单日内全部健康状态预测标记后,计算全部标记总和的值作为用户的每日健康指数,该值取值范围为[-144,144],当该值小于50时,认为用户健康存在较大风险,需要做出体检提醒。
6.一种基于用户健康数据的健康状态预警方法,根据权利要求1所述健康状态跟踪方法获取的用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于AAE算法从用户历史/实时体检数据中提取历史/实时数据特征,然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。
7.根据权利要求6所述基于用户健康数据的健康状态预警方法,其特征在于,具体包括:
步骤6.1,获取用户历史体检数据;
步骤6.2,获取用户被提醒后进行体检所得的实时体检数据;
步骤6.3,基于AAE(Adversarial Auto Encoder,对抗自编码器)将高维体检数据提取为低维度体检特征;
步骤6.4,基于CART分类树,使用历史体检数据特征训练用户健康判别分类器,然后输入实时体检数据特征进行判别,若判别结果为-1,则向用户发出疾病预警。
8.根据权利要求7所述基于用户健康数据的健康状态预警方法,其特征在于,所述获取的用户历史体检数据由用户本人所拥有的数量决定;所述高维体检数据为包含50项以上指标的体检数据,所述低维度体检特征为高维体检数据经过特征提取算法后获取的维度降低的特征向量,该维度由人为设定。
9.一种基于用户健康数据的健康状态跟踪系统,其特征在于,包括:
数据获取模块,从可穿戴设备获取用户健康数据,从用户本人获取用户体检数据;
特征提取模块,从用户健康数据提取用户健康指标相关的心率类特征、体温类特征、血氧类特征、呼吸类特征;从用户体检数据中基于对抗自编码器方法获取由神经网络自动学习输出的低维度体检特征;
健康状态跟踪模块,基于特征提取模块得到的用户健康指标特征,基于决策树算法使用历史健康指标特征训练针对用户本人的健康状态分类器,然后根据输入的实时健康指标特征获得用户的健康状态标记,根据标记对用户健康状态进行跟踪记录,并使用单日内用户健康标记计算用户每日健康指数。
10.一种基于用户健康数据的健康状态预警系统,其特征在于,在权利要求9所述基于用户健康数据的健康状态跟踪系统的基础上,还包括:
健康模型建立模块,根据从用户历史体检数据提取出的体检特征训练用户健康判别分类器;
预警模块,根据用户每日健康指数决定是否向用户发出体检提醒,提醒并获取实时体检数据后,提取出实时体检特征,输入用户健康判别分类器,根据判别结果做出是否向用户发出疾病预警的决策。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010395523.6A CN111540471B (zh) | 2020-05-12 | 2020-05-12 | 一种基于用户健康数据的健康状态跟踪及预警方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010395523.6A CN111540471B (zh) | 2020-05-12 | 2020-05-12 | 一种基于用户健康数据的健康状态跟踪及预警方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111540471A true CN111540471A (zh) | 2020-08-14 |
CN111540471B CN111540471B (zh) | 2024-01-26 |
Family
ID=71979360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010395523.6A Active CN111540471B (zh) | 2020-05-12 | 2020-05-12 | 一种基于用户健康数据的健康状态跟踪及预警方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111540471B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182412A (zh) * | 2020-11-26 | 2021-01-05 | 南京吉拉福网络科技有限公司 | 用于推荐体检项目的方法、计算设备和计算机存储介质 |
CN112270994A (zh) * | 2020-10-14 | 2021-01-26 | 中国医学科学院阜外医院 | 一种风险预测模型的构建方法、设备、终端及存储介质 |
CN112509696A (zh) * | 2020-11-04 | 2021-03-16 | 江南大学 | 基于卷积自编码器高斯混合模型的健康数据检测方法 |
WO2022125312A1 (en) * | 2020-12-07 | 2022-06-16 | Mark Newton | Identification and tracking of infection in humans |
CN114898877A (zh) * | 2022-05-06 | 2022-08-12 | 上海铂桐医疗科技有限公司 | 适用于多维度健康数据的处理方法及系统 |
EP4091945A1 (en) * | 2021-05-18 | 2022-11-23 | Leonardo S.p.a. | Method and system for detecting anomalies relating to components of a transmission system of an aircraft, in particular a helicopter |
CN116564527A (zh) * | 2023-07-11 | 2023-08-08 | 南京裕隆生物医学发展有限公司 | 一种基于生理特征深度学习的呼吸健康分析方法 |
CN116665894A (zh) * | 2023-04-24 | 2023-08-29 | 南方医科大学南方医院 | 骨龄监测系统、方法、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109147949A (zh) * | 2018-08-16 | 2019-01-04 | 辽宁大学 | 一种基于分类回归树来用于检测教师亚健康状态的方法 |
WO2019071201A1 (en) * | 2017-10-06 | 2019-04-11 | Alivecor, Inc. | CONTINUOUS MONITORING OF THE HEALTH OF A USER WITH A MOBILE DEVICE |
CN109712711A (zh) * | 2018-12-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 基于机器学习的健康评估方法、装置、电子设备及介质 |
CN109767836A (zh) * | 2018-12-29 | 2019-05-17 | 上海亲看慧智能科技有限公司 | 一种医学诊断人工智能系统、装置及其自我学习方法 |
CN110136822A (zh) * | 2019-04-11 | 2019-08-16 | 周凡 | 一种家用可穿戴设备的社区医疗智能管控方法 |
US20190336824A1 (en) * | 2012-08-31 | 2019-11-07 | Blue Goji Llc | System and method for predictive health monitoring |
-
2020
- 2020-05-12 CN CN202010395523.6A patent/CN111540471B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190336824A1 (en) * | 2012-08-31 | 2019-11-07 | Blue Goji Llc | System and method for predictive health monitoring |
WO2019071201A1 (en) * | 2017-10-06 | 2019-04-11 | Alivecor, Inc. | CONTINUOUS MONITORING OF THE HEALTH OF A USER WITH A MOBILE DEVICE |
CN109147949A (zh) * | 2018-08-16 | 2019-01-04 | 辽宁大学 | 一种基于分类回归树来用于检测教师亚健康状态的方法 |
CN109712711A (zh) * | 2018-12-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 基于机器学习的健康评估方法、装置、电子设备及介质 |
CN109767836A (zh) * | 2018-12-29 | 2019-05-17 | 上海亲看慧智能科技有限公司 | 一种医学诊断人工智能系统、装置及其自我学习方法 |
CN110136822A (zh) * | 2019-04-11 | 2019-08-16 | 周凡 | 一种家用可穿戴设备的社区医疗智能管控方法 |
Non-Patent Citations (1)
Title |
---|
钟昕孜 等: "基于自编码器的语音情感识别方法研究", 《电子设计工程》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270994A (zh) * | 2020-10-14 | 2021-01-26 | 中国医学科学院阜外医院 | 一种风险预测模型的构建方法、设备、终端及存储介质 |
CN112509696A (zh) * | 2020-11-04 | 2021-03-16 | 江南大学 | 基于卷积自编码器高斯混合模型的健康数据检测方法 |
CN112182412A (zh) * | 2020-11-26 | 2021-01-05 | 南京吉拉福网络科技有限公司 | 用于推荐体检项目的方法、计算设备和计算机存储介质 |
CN112182412B (zh) * | 2020-11-26 | 2021-04-02 | 南京吉拉福网络科技有限公司 | 用于推荐体检项目的方法、计算设备和计算机存储介质 |
WO2022125312A1 (en) * | 2020-12-07 | 2022-06-16 | Mark Newton | Identification and tracking of infection in humans |
EP4091945A1 (en) * | 2021-05-18 | 2022-11-23 | Leonardo S.p.a. | Method and system for detecting anomalies relating to components of a transmission system of an aircraft, in particular a helicopter |
WO2022243764A1 (en) * | 2021-05-18 | 2022-11-24 | LEONARDO S.p.A | Method and system for detecting anomalies relating to components of a transmission system of an aircraft, in particular a helicopter |
CN114898877A (zh) * | 2022-05-06 | 2022-08-12 | 上海铂桐医疗科技有限公司 | 适用于多维度健康数据的处理方法及系统 |
CN114898877B (zh) * | 2022-05-06 | 2023-07-04 | 上海铂桐医疗科技有限公司 | 适用于多维度健康数据的处理方法及系统 |
CN116665894A (zh) * | 2023-04-24 | 2023-08-29 | 南方医科大学南方医院 | 骨龄监测系统、方法、电子设备及存储介质 |
CN116564527A (zh) * | 2023-07-11 | 2023-08-08 | 南京裕隆生物医学发展有限公司 | 一种基于生理特征深度学习的呼吸健康分析方法 |
CN116564527B (zh) * | 2023-07-11 | 2023-09-15 | 南京裕隆生物医学发展有限公司 | 一种基于生理特征深度学习的呼吸健康分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111540471B (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111540471B (zh) | 一种基于用户健康数据的健康状态跟踪及预警方法和系统 | |
CN110263846B (zh) | 基于故障数据深度挖掘及学习的故障诊断方法 | |
CN116705337B (zh) | 一种健康数据采集及智能分析方法 | |
CN107506602A (zh) | 一种大数据健康预测系统 | |
CN105595990A (zh) | 一种用于心电信号质量评估判别的智能终端设备 | |
CN109009017B (zh) | 一种智能健康监测系统及其数据处理方法 | |
US20210225510A1 (en) | Human body health assessment method and system based on sleep big data | |
CN108717668A (zh) | 一种奶牛行为与生理特征物联网系统及其工作方法 | |
CN108090515B (zh) | 一种基于数据融合的环境等级评估方法 | |
CN107609477A (zh) | 一种基于深度学习与智能手环相结合的摔倒检测方法 | |
CN112331349B (zh) | 一种脑卒中复发监测系统 | |
CN107766898A (zh) | 基于svm的三分类情绪概率判断方法 | |
CN105726013A (zh) | 一种具有心电信号质量判别功能的心电监测系统 | |
CN110974219A (zh) | 一种基于侵入式bci的人脑意念识别系统 | |
CN115876258A (zh) | 基于多源数据的畜禽养殖环境异常监测及报警系统 | |
CN112244871A (zh) | 一种基于机器学习的振幅整合脑电图分类识读系统 | |
CN115760525A (zh) | 一种基于物联网智慧养老系统及方法 | |
CN117476214A (zh) | 一种基于医院信息的数据治理方法和系统 | |
CN116978510A (zh) | 一种居家脑卒中患者的护理分级评估系统 | |
CN112826507A (zh) | 一种感音神经性耳聋的脑功能网络演化建模方法 | |
CN109620263B (zh) | 一种企事业单位上岗人员体征安全分析方法 | |
CN116189866A (zh) | 一种基于数据分析的远程医用护理分析系统 | |
CN108846327A (zh) | 一种色素痣与黑素瘤的智能判别系统及方法 | |
CN114464319A (zh) | 一种基于慢特征分析和深度神经网络的ams易感性评估系统 | |
CN112365992A (zh) | 一种基于nrs-lda的医疗体检数据识别分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |