CN117877736B - 基于机器学习的智能戒指异常健康数据预警方法 - Google Patents

基于机器学习的智能戒指异常健康数据预警方法 Download PDF

Info

Publication number
CN117877736B
CN117877736B CN202410275598.9A CN202410275598A CN117877736B CN 117877736 B CN117877736 B CN 117877736B CN 202410275598 A CN202410275598 A CN 202410275598A CN 117877736 B CN117877736 B CN 117877736B
Authority
CN
China
Prior art keywords
feature
cluster
index
abnormality
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410275598.9A
Other languages
English (en)
Other versions
CN117877736A (zh
Inventor
邓白涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Moyang Technology Co ltd
Original Assignee
Shenzhen Moyang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Moyang Technology Co ltd filed Critical Shenzhen Moyang Technology Co ltd
Priority to CN202410275598.9A priority Critical patent/CN117877736B/zh
Publication of CN117877736A publication Critical patent/CN117877736A/zh
Application granted granted Critical
Publication of CN117877736B publication Critical patent/CN117877736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及异常数据预警技术领域,具体涉及基于机器学习的智能戒指异常健康数据预警方法,该方法包括:采集用户健康数据;根据用户健康异常指数以及特征之间的差异构建每个特征与用户健康异常指数之间的整体相关性;根据每个特征与用户健康异常指数之间的相关性以及特征值差异构建任意两个特征之间的相关性;根据所有任意两个特征之间的相关性以及每个特征与用户健康异常指数之间的相关性构建每个特征的特征修正因子;根据整体相关性、特征重要性以及特征修正因子获取关键特征项,采用异常检测算法评估用户健康异常情况。本发明提高了识别用户健康数据中关键特征项的精准性,提高了用户健康数据的监测准确性。

Description

基于机器学习的智能戒指异常健康数据预警方法
技术领域
本申请涉及异常数据预警技术领域,具体涉及基于机器学习的智能戒指异常健康数据预警方法。
背景技术
随着人们对生活质量及健康的日益关注,便捷且精准的健康管理解决方案需求不断增加。尤其在慢性病管理、疾病预防以及提升健康素养等方面,实时监测和早期干预变得越来越重要。预防医学理念强调疾病的预防优于治疗,利用智能戒指等设备提前发现健康隐患,能够有效减少严重疾病的发生,减轻医疗系统的压力,同时节省社会资源。近年来,可穿戴设备技术取得了飞速进步,智能戒指作为小巧而功能强大的可穿戴设备,其内置的微型传感器能够实时、连续地收集人体生理数据,为实现健康监测提供了硬件基础。
在使用孤立森林算法对多维数据进行异常检测时,由于每次构建的数据空间都是随机选取一个维度,建完树后仍然有大量的维度信息没有被使用,导致算法可靠性降低。而高维空间还可能存在大量噪音维度或无关维度,影响树的构建,进而可能导致最终获取的异常检测结果并不可靠。
发明内容
为了解决上述技术问题,本发明提供基于机器学习的智能戒指异常健康数据预警方法,以解决现有的问题。
本发明的基于机器学习的智能戒指异常健康数据预警方法采用如下技术方案:
本发明一个实施例提供了基于机器学习的智能戒指异常健康数据预警方法,该方法包括以下步骤:
采集用户健康数据,包括各项特征值以及人为标注的用户健康异常指数;
根据各用户健康异常指数以及特征值获取各异常指数聚类簇内每个特征的各特征聚类簇;根据异常指数聚类簇内每个特征的特征聚类簇构建异常指数聚类簇内每个特征的混乱因子;根据异常指数聚类簇内每个特征与整体特征之间的数据差异以及混乱因子构建异常指数聚类簇内每个特征与用户健康异常指数之间的相关性;根据不同异常指数聚类簇内每个特征与用户健康异常指数之间的相关性获取每个特征与用户健康异常指数之间的整体相关性;
根据异常指数聚类簇内每个特征与用户健康异常指数之间的相关性以及特征值差异构建异常指数聚类簇内任意两个特征之间的相关性;根据异常指数聚类簇内所有任意两个特征之间的相关性以及每个特征与用户健康异常指数之间的相关性,构建异常指数聚类簇内每个特征的特征重要性;基于特征之间的特征重要性的趋势分布相似情况构建每个特征的特征修正因子;根据每个特征与用户健康异常指数之间的整体相关性、特征重要性以及特征修正因子构建每个特征的显著性;
基于显著性获取关键特征项,采用异常检测算法评估用户健康异常情况。
优选的,所述根据各用户健康异常指数以及特征值获取各异常指数聚类簇内每个特征的各特征聚类簇,包括:
对所有用户的用户健康异常指数采用聚类算法获取各聚类簇,记为各异常指数聚类簇;
将各异常指数聚类簇内每个特征在所有用户的特征值进行聚类得到各聚类簇,记为各异常指数聚类簇内每个特征的各特征聚类簇。
优选的,所述根据异常指数聚类簇内每个特征的特征聚类簇构建异常指数聚类簇内每个特征的混乱因子,包括:
对于异常指数聚类簇内每个特征的特征聚类簇,获取任意两个特征聚类簇之间的元素数量的差值绝对值、所有元素平均特征值的差值绝对值;
获取异常指数聚类簇内每个特征的特征聚类簇数量;计算异常指数聚类簇内每个特征中所有任意两个特征聚类簇之间的,元素数量的差值绝对值与所有元素平均特征值的差值绝对值的乘积的和值,将所述和值与所述特征聚类簇数量的乘积作为异常指数聚类簇内每个特征的混乱因子。
优选的,所述根据异常指数聚类簇内每个特征与整体特征之间的数据差异以及混乱因子构建异常指数聚类簇内每个特征与用户健康异常指数之间的相关性,包括:
对于异常指数聚类簇内各用户,计算各用户在每个特征的特征值与各用户的用户健康异常指数的比值;计算所有用户在每个特征的平均特征值与所有用户的用户健康异常指数均值的比值;
获取异常指数聚类簇内每个特征的混乱因子;将异常指数聚类簇内所有用户的两个比值之间的差值绝对值的和值,乘以所述混乱因子得到异常指数聚类簇内每个特征与用户健康异常指数之间的相关性。
优选的,所述根据不同异常指数聚类簇内每个特征与用户健康异常指数之间的相关性获取每个特征与用户健康异常指数之间的整体相关性,包括:
计算所有异常指数聚类簇在每个特征与用户健康异常指数之间的相关性的和值的归一化值,将数字1与所述归一化值的差值作为每个特征与用户健康异常指数之间的整体相关性。
优选的,所述根据异常指数聚类簇内每个特征与用户健康异常指数之间的相关性以及特征值差异构建异常指数聚类簇内任意两个特征之间的相关性,表达式为:
其中,表示异常指数聚类簇i内特征o与特征s之间的相关性,exp()表示以自然常数为底数的指数函数, />、/>分别表示异常指数聚类簇i内特征o、特征s与用户健康异常指数之间的相关性,/>表示异常指数聚类簇i内的元素数量,/>分别表示异常指数聚类簇i内第j个用户的特征o、特征s的特征值,/>、/>分别表示异常指数聚类簇i内所有用户的特征o、特征s的平均特征值。
优选的,所述根据异常指数聚类簇内所有任意两个特征之间的相关性以及每个特征与用户健康异常指数之间的相关性,构建异常指数聚类簇内每个特征的特征重要性,包括:
对于异常指数聚类簇内的每个特征,计算异常指数聚类簇内每个特征与剩余所有特征之间的相关性的和值;将所述和值与异常指数聚类簇内每个特征与用户健康异常指数之间的相关性的比值,作为异常指数聚类簇内每个特征的特征重要性。
优选的,所述基于特征之间的特征重要性的趋势分布相似情况构建每个特征的特征修正因子,包括:
基于每个特征在各异常指数聚类簇内的特征重要性组成每个特征的特征曲线图;
计算每个特征与其他所有特征的特征曲线图拟合后的曲线之间的相似度的和值,将数字1与所述和值的归一化值的差值作为每个特征的特征修正因子;所述相似度通过形状上下文算法计算得到。
优选的,所述根据每个特征与用户健康异常指数之间的整体相关性、特征重要性以及特征修正因子构建每个特征的显著性,包括:
计算每个特征的特征修正因子与数字1的和值;获取每个特征在所有异常指数聚类簇内的特征重要性均值;将所述和值、所述特征重要性均值以及每个特征与用户健康异常指数之间的整体相关性的乘积,作为每个特征的显著性。
优选的,所述基于显著性获取关键特征项,采用异常检测算法评估用户健康异常,包括:
将所有特征的显著性作为大津阈值法的输入,得到大津阈值,将大于大津阈值的显著性对应的特征作为关键特征项;
对各用户的所有关键特征项的特征数据采用孤立森林算法,获取各用户的异常分数;对大于预设阈值的异常分数的用户进行健康预警。
本发明至少具有如下有益效果:
本发明通过对采集所得多维数据进行分析,计算在用户健康异常指数所在的同一个异常指数聚类簇内特征项的混乱指数,基于混乱指数反映特征与用户健康异常指数之间的相关性,从而用于评价特征项与用户健康数据存在的健康规律性关系;同时,通过计算在同一用户健康异常聚类簇中不同特征之间的相关性,进而结合特征数据与用户健康异常指数之间的相关关系获取特征的特征重要性,从整体与内部两个角度对特征的重要程度进行分析,规避重要特征信息被忽略的风险,使得分析的更加全面;
进一步根据在不同特征项的特征性随用户健康异常指数变化的趋势情况,挖掘任意两个特征的趋势相似度,构建特征的特征修正因子,从而最终获取特征的显著性,并根据特征数据的显著性提取关键特征项,进而将各关键特征项数据用于表征用户健康的特征程度,从而根据所得特征值进行筛选,减少特征数据的数量;使用孤立森林算法得到用户健康的异常分数,完成对用户健康异常的监测。本发明通过减少采集数据的维度,选择关键特征项,大大提高孤立森林算法所得异常值的可靠性,极大的增加了对用户健康数据监测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的基于机器学习的智能戒指异常健康数据预警方法的流程图;
图2为用户健康异常分数的指标构建流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于机器学习的智能戒指异常健康数据预警方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于机器学习的智能戒指异常健康数据预警方法的具体方案。
本发明一个实施例提供的基于机器学习的智能戒指异常健康数据预警方法。
具体的,提供了如下的基于机器学习的智能戒指异常健康数据预警方法,请参阅图1,该方法包括以下步骤:
步骤S001,用户健康数据采集。
本实施例使用智能戒指采集用户健康数据信息,其中用户健康数据信息包括用户心率信息、用户皮肤表面温度湿度信息、血氧饱和度、用户活动的步数、距离、活动时间和消耗的卡路里、用户睡眠时长、深度和质量等各项特征值。使用人为标注的方法,对所得各用户的用户健康数据的用户健康异常指数进行人为标注,用户健康异常指数F的取值大小为[0,1],即该值越大,说明该用户的健康状况越异常。
将所得各用户的健康数据信息记为向量R=[B,F,t],B表示使用智能戒指采集获取的用户健康数据,F表示人为标注的用户健康异常指数,t表示智能戒指采集数据的时间。
至此,可通过上述方法完成用户健康数据采集。
步骤S002,基于用户健康异常指数的分类构建聚类簇内特征的混乱程度,基于特征与用户健康异常指数之间的相关性、数据特征之间的相关性分析特征重要性。
通过对用户各个特征信息进行特征筛选,进而获取与用户健康较为相关的特征,在使用孤立森林算法对这些特征进行异常检测,从而获取用户健康异常程度。
由于不同用户的基本信息与智能戒指实时采集的数据信息较多,其中可能存在与用户健康异常评估指标相关性较低的特征数据,而在使用随机森林算法对用户数据进行健康异常指数的评估时,可能导致由于随机选择相关性较小的特征数据构建的孤立树过多,进而导致最终对用户健康异常指数的结果不准确,故本实施例通过基于用户测试数据与人为标注用户健康异常指数的方法,对用户特征进行提取,进而避免上述问题的发生。
本实施例通过对用户的智能戒指采集获取的各项特征数据进行分析,从而确定在用户数据采集时,各项特征数据与用户健康异常指数的相关性以及各项特征之间的相关性,进而分析各项数据特征表征用户健康的特征程度,从而根据所得特征值的特征程度进行筛选,减少特征数据的数量。
本实施例首先对每次采集所得用户健康数据对应人工标注的用户健康异常指数进行聚类分析,通过分析每个相近用户健康指数所在聚类簇内对应用户实时采集的各项特征数据之间的差异,从而确定各项特征数据与用户健康异常指数的相关性,其中聚类算法使用DBSCAN聚类算法,聚类参数r=5,minpts=5,聚类距离为用户健康异常指数之间的差值绝对值,并将所得聚类簇的数量记为K,将所得聚类簇记为异常指数聚类簇。其中,DBSCAN聚类算法为公知技术,本实施例不再赘述。
本实施例通过对聚类簇内各项特征数据的特征值进行处理,分析在用户健康异常指数所在的同一个异常指数聚类簇内特征项的混乱指数,根据所得混乱指数评价反映特征与用户健康异常指数之间的相关性。
其中,异常指数聚类簇内各个数据特征的混乱指数的方法如下:对异常指数聚类簇中特征o的特征值进行聚类,其中聚类算法同样使用DBSCAN聚类算法,聚类参数r=5,minpts=5,聚类距离为特征o的特征值,将所得聚类簇的数量记为H,将聚类簇记为特征聚类簇。以异常指数聚类簇i为例,异常指数聚类簇i内特征o的混乱程度的计算方法如下:
其中,表示异常指数聚类簇i内特征o的混乱因子,H表示异常指数聚类簇i中的特征聚类簇的数量,/>表示异常指数聚类簇i内特征聚类簇u与v的簇内元素数量的差值绝对值,/>表示异常指数聚类簇i内特征聚类簇u与v的簇内元素特征o的平均特征值的差值绝对值。
需要说明的是,当所求异常指数聚类簇i中根据特征o的特征值进行聚类所得特征聚类簇的数量越多,同时各个特征聚类簇内元素数量的差异越大,且各个特征聚类簇内元素的特征值的平均值的差异也越大,则说明当前异常指数聚类簇i内特征o的混乱因子越大。
其中,表示异常指数聚类簇i内特征o与用户健康异常指数之间的相关性,表示异常指数聚类簇i内特征o的混乱因子,/>表示异常指数聚类簇i内的元素数量;/>表示异常指数聚类簇i内第j个用户的特征o的特征值;/>表示异常指数聚类簇i内第j个用户的用户健康异常指数,/>表示异常指数聚类簇i内所有用户的特征o的平均特征值;/>表示异常指数聚类簇i内所有用户的用户健康异常指数均值。
需要说明的是,当所求在异常指数聚类簇i中,异常指数聚类簇i内特征o的混乱因子越大,各用户对应特征o的特征值与对应用户健康异常指数的比值,与该异常指数聚类簇i内所有用户的特征o的平均特征值与所有用户的用户健康指数均值的比值,之间的差异越大,则说明异常指数聚类簇i内特征o的混乱程度越大,即所求异常指数聚类簇i对特征o的混乱指数越大。
同时根据不同异常指数聚类簇获取特征o与用户健康异常指数之间的整体相关性。
其中,表示特征o与用户健康异常指数之间的整体相关性,norm()表示归一化函数,K表示异常指数聚类簇数量,/>表示异常指数聚类簇i内特征o与用户健康异常指数之间的相关性。
需要说明的是,当所求在根据用户健康异常指数所得各个异常指数聚类簇中,特征o的混乱指数越大,则说明特征o与用户健康异常指数之间的整体相关性越弱。
由于在根据上述方法进行分析获取特征与用户健康异常指数之间的整体相关性时,仅从整体上进行分析所得,并没有考虑到如果在某个用户健康异常指数类别中,特征之间的相关性较强,而导致忽略该特征的特征信息,进而导致最终进行特征提取时,将该特征筛选掉,导致根据所得特征进行异常监测的结果不准确,故需要对所得特征与用户健康异常指数进行进一步修正。
由于在根据用户健康异常指数进行聚类时,可以获取异常指数聚类簇内不同特征数据特征值的混乱指数,故可以进一步分析在不同用户健康异常指数,各项特征数据之间的相关性,从而更好的获取分析各项特征数据对用户健康异常指数的贡献程度。
对于同一聚类簇中任意两个特征数据之间的相关性方法如下:
其中,表示异常指数聚类簇i内特征o与特征s之间的相关性,exp()表示以自然常数e为底数的指数函数, />、/>分别表示异常指数聚类簇i内特征o、特征s与用户健康异常指数之间的相关性,/>表示异常指数聚类簇i内的元素数量,/>分别表示异常指数聚类簇i内第j个用户的特征o、特征s的特征值,/>、/>分别表示异常指数聚类簇i内所有用户的特征o、特征s的平均特征值。
需要说明的是,当所求在异常指数聚类簇i内的两个特征参数o、s分别与用户健康异常指数之间的相关性差异越小,且对应在该异常指数聚类簇内两个特征参数的特征值的比值与两个特征参数在该异常指数聚类簇内平均值的比值的差异也越小,则说明这两个特征参数在异常指数聚类簇i中的相关性越强。
对异常指数聚类簇i内的所有特征与特征o的特征计算其相关性,进而分析该异常指数聚类簇内特征o的重要性,则对应的特征o的重要性的计算方法如下:
其中,表示异常指数聚类簇i内特征o的特征重要性,L表示特征数据种类,表示异常指数聚类簇i内特征o与特征s之间的相关性,/>表示异常指数聚类簇i内特征o与用户健康异常指数之间的相关性。
需要说明的是,当所求在异常指数聚类簇i中,特征o与其他特征的相关性越小,且特征o在异常指数聚类簇i中的混乱指数越大,则说明特征o的重要性越小。
使用上述方法,可以得到每个异常指数聚类簇内各项特征的重要性,将各项特征在所有异常指数聚类簇下的数值绘制成特征曲线图,其中横坐标为各异常指数聚类簇,纵坐标表示各项特征在对应的异常指数聚类簇内的特征重要性,特征曲线图中的数据点(r,k)表示特征r在异常指数聚类簇k的特征重要性。
对各项特征的特征曲线图进行分析,分析特征o的特征性随用户健康异常指数变化的变化趋势,进而通过比较特征o的特征性与其他特征随用户健康指数的特征曲线图的差异,获取特征o的特征程度,进而最终根据所得特征程度进行分析,提取特征参数。其中根据其他特征的特征曲线图与当前特征的特征曲线图分析的当前特征的特征修正因子的计算方法如下:
其中,表示特征o的特征修正因子,/>表示归一化函数,L表示特征数据种类,/>表示特征o与特征s的特征曲线图拟合之后,使用形状上下文算法计算所得两条拟合曲线的相似度。其中,形状上下文算法为公知技术,本实施例不再赘述。
需要说明的是,当所求特征o对应特征曲线图的拟合曲线与其他特征对应特征曲线图的拟合曲线之间的相似度越小,则说明当前特征o对应特征修正因子就越大。
则对应特征o的显著性计算方法如下:
其中,表示特征o的显著性,/>表示特征o与用户健康异常性指标之间的整体相关性,/>表示特征o在所有异常指数聚类簇内的特征重要性均值,/>表示特征o的特征修正因子。
需要说明的是,但所求特征o与用户健康异常性指标之间的整体相关性越强,且特征o在所有异常指数聚类簇内的特征重要性均值越强,且特征o的特征修正因子也越强,则说明当前特征o的特征显著性越大,即越大,该特征数据越符合用户健康数据中的关键特征数据。
步骤S003,采用孤立森林算法对基于显著性筛选后的特征项进行异常检测,获取用户健康异常的评估。
通过上述步骤可以获取每个特征的显著性,使用大津阈值法对每个特征的显著性进行划分,将显著性大于大津阈值的特征作为关键特征项。其中,大津阈值法为公知技术,本实施例不再赘述。
根据上述方法对所得用户的各个关键特征项进行特征提取,选择优选参数,使用孤立森林算法获取每个时刻用户的异常分数,用户健康异常分数的指标构建流程图如图2所示,对大于预设阈值的异常分数的用户进行健康预警,完成对用户健康的异常评估。其中,预设阈值由实施者根据实际情况自行设定,本实施例取值0.7,孤立森林算法为公知技术,本实施例不再赘述。
综上所述,本发明实施例通过对采集所得多维数据进行分析,计算在用户健康异常指数所在的同一个异常指数聚类簇内特征项的混乱指数,基于混乱指数反映特征与用户健康异常指数之间的相关性,从而用于评价特征项与用户健康数据存在的健康规律性关系;同时,通过计算在同一用户健康异常聚类簇中不同特征之间的相关性,进而结合特征数据与用户健康异常指数之间的相关关系获取特征的特征重要性,从整体与内部两个角度对特征的重要程度进行分析,规避重要特征信息被忽略的风险,使得分析的更加全面;
进一步根据在不同特征项的特征性随用户健康异常指数变化的趋势情况,挖掘任意两个特征的趋势相似度,构建特征的特征修正因子,从而最终获取特征的显著性,并根据特征数据的显著性提取关键特征项,进而将各关键特征项数据用于表征用户健康的特征程度,从而根据所得特征值进行筛选,减少特征数据的数量;使用孤立森林算法得到用户健康的异常分数,完成对用户健康异常的监测。本发明实施例通过减少采集数据的维度,选择关键特征项,大大提高孤立森林算法所得异常值的可靠性,极大的增加了对用户健康数据监测的准确性。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。

Claims (3)

1.基于机器学习的智能戒指异常健康数据预警方法,其特征在于,该方法包括以下步骤:
采集用户健康数据,包括各项特征值以及人为标注的用户健康异常指数;
根据各用户健康异常指数以及特征值获取各异常指数聚类簇内每个特征的各特征聚类簇;根据异常指数聚类簇内每个特征的特征聚类簇构建异常指数聚类簇内每个特征的混乱因子;根据异常指数聚类簇内每个特征与整体特征之间的数据差异以及混乱因子构建异常指数聚类簇内每个特征与用户健康异常指数之间的相关性;根据不同异常指数聚类簇内每个特征与用户健康异常指数之间的相关性获取每个特征与用户健康异常指数之间的整体相关性;
根据异常指数聚类簇内每个特征与用户健康异常指数之间的相关性以及特征值差异构建异常指数聚类簇内任意两个特征之间的相关性;根据异常指数聚类簇内所有任意两个特征之间的相关性以及每个特征与用户健康异常指数之间的相关性,构建异常指数聚类簇内每个特征的特征重要性;基于特征之间的特征重要性的趋势分布相似情况构建每个特征的特征修正因子;根据每个特征与用户健康异常指数之间的整体相关性、特征重要性以及特征修正因子构建每个特征的显著性;
基于显著性获取关键特征项,采用异常检测算法评估用户健康异常情况;
所述根据异常指数聚类簇内每个特征的特征聚类簇构建异常指数聚类簇内每个特征的混乱因子,包括:
对于异常指数聚类簇内每个特征的特征聚类簇,获取任意两个特征聚类簇之间的元素数量的差值绝对值、所有元素平均特征值的差值绝对值;
获取异常指数聚类簇内每个特征的特征聚类簇数量;计算异常指数聚类簇内每个特征中所有任意两个特征聚类簇之间的,元素数量的差值绝对值与所有元素平均特征值的差值绝对值的乘积的和值记为第一和值,将所述第一和值与所述特征聚类簇数量的乘积作为异常指数聚类簇内每个特征的混乱因子;
所述根据不同异常指数聚类簇内每个特征与用户健康异常指数之间的相关性获取每个特征与用户健康异常指数之间的整体相关性,包括:
计算所有异常指数聚类簇在每个特征与用户健康异常指数之间的相关性的和值的归一化值,将数字1与所述归一化值的差值作为每个特征与用户健康异常指数之间的整体相关性;
所述根据异常指数聚类簇内每个特征与用户健康异常指数之间的相关性以及特征值差异构建异常指数聚类簇内任意两个特征之间的相关性,表达式为:
其中,表示异常指数聚类簇i内特征o与特征s之间的相关性,/>表示以自然常数为底数的指数函数,/>、/>分别表示异常指数聚类簇i内特征o、特征s与用户健康异常指数之间的相关性,/>表示异常指数聚类簇i内的元素数量,/>、/>分别表示异常指数聚类簇i内第j个用户的特征o、特征s的特征值,/>、/>分别表示异常指数聚类簇i内所有用户的特征o、特征s的平均特征值;
所述根据异常指数聚类簇内所有任意两个特征之间的相关性以及每个特征与用户健康异常指数之间的相关性,构建异常指数聚类簇内每个特征的特征重要性,包括:
对于异常指数聚类簇内的每个特征,计算异常指数聚类簇内每个特征与剩余所有特征之间的相关性的和值记为第二和值;将所述第二和值与异常指数聚类簇内每个特征与用户健康异常指数之间的相关性的比值,作为异常指数聚类簇内每个特征的特征重要性;
所述基于特征之间的特征重要性的趋势分布相似情况构建每个特征的特征修正因子,包括:
基于每个特征在各异常指数聚类簇内的特征重要性组成每个特征的特征曲线图;
计算每个特征与其他所有特征的特征曲线图拟合后的曲线之间的相似度的和值记为第三和值,将数字1与所述第三和值的归一化值的差值作为每个特征的特征修正因子;所述相似度通过形状上下文算法计算得到;
所述根据每个特征与用户健康异常指数之间的整体相关性、特征重要性以及特征修正因子构建每个特征的显著性,包括:
计算每个特征的特征修正因子与数字1的和值记为第四和值;获取每个特征在所有异常指数聚类簇内的特征重要性均值;将所述第四和值、所述特征重要性均值以及每个特征与用户健康异常指数之间的整体相关性的乘积,作为每个特征的显著性;
所述基于显著性获取关键特征项,采用异常检测算法评估用户健康异常,包括:
将所有特征的显著性作为大津阈值法的输入,得到大津阈值,将大于大津阈值的显著性对应的特征作为关键特征项;
对各用户的所有关键特征项的特征数据采用孤立森林算法,获取各用户的异常分数;对大于预设阈值的异常分数的用户进行健康预警。
2.如权利要求1所述的基于机器学习的智能戒指异常健康数据预警方法,其特征在于,所述根据各用户健康异常指数以及特征值获取各异常指数聚类簇内每个特征的各特征聚类簇,包括:
对所有用户的用户健康异常指数采用聚类算法获取各聚类簇,记为各异常指数聚类簇;
将各异常指数聚类簇内每个特征在所有用户的特征值进行聚类得到各聚类簇,记为各异常指数聚类簇内每个特征的各特征聚类簇。
3.如权利要求1所述的基于机器学习的智能戒指异常健康数据预警方法,其特征在于,所述根据异常指数聚类簇内每个特征与整体特征之间的数据差异以及混乱因子构建异常指数聚类簇内每个特征与用户健康异常指数之间的相关性,包括:
对于异常指数聚类簇内各用户,计算各用户在每个特征的特征值与各用户的用户健康异常指数的比值;计算所有用户在每个特征的平均特征值与所有用户的用户健康异常指数均值的比值;
获取异常指数聚类簇内每个特征的混乱因子;将异常指数聚类簇内所有用户的两个比值之间的差值绝对值的和值,乘以所述混乱因子得到异常指数聚类簇内每个特征与用户健康异常指数之间的相关性。
CN202410275598.9A 2024-03-12 2024-03-12 基于机器学习的智能戒指异常健康数据预警方法 Active CN117877736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410275598.9A CN117877736B (zh) 2024-03-12 2024-03-12 基于机器学习的智能戒指异常健康数据预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410275598.9A CN117877736B (zh) 2024-03-12 2024-03-12 基于机器学习的智能戒指异常健康数据预警方法

Publications (2)

Publication Number Publication Date
CN117877736A CN117877736A (zh) 2024-04-12
CN117877736B true CN117877736B (zh) 2024-05-24

Family

ID=90595224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410275598.9A Active CN117877736B (zh) 2024-03-12 2024-03-12 基于机器学习的智能戒指异常健康数据预警方法

Country Status (1)

Country Link
CN (1) CN117877736B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020038353A1 (zh) * 2018-08-21 2020-02-27 瀚思安信(北京)软件技术有限公司 异常行为检测方法及系统
CN113657549A (zh) * 2021-08-31 2021-11-16 平安医疗健康管理股份有限公司 医疗数据审核方法、装置、设备以及存储介质
CN116484307A (zh) * 2023-06-21 2023-07-25 深圳市魔样科技有限公司 基于云计算智能戒指远程控制方法
CN116628617A (zh) * 2023-07-25 2023-08-22 值数科技(北京)有限公司 一种基于纳米复合材料实现微型应变监测的方法
CN116735807A (zh) * 2023-08-09 2023-09-12 山东优控智能技术有限公司 基于多传感器数据的空气质量检测评估方法
CN116933046A (zh) * 2023-09-19 2023-10-24 山东大学 基于深度学习的多模态健康管理方案生成方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373065B2 (en) * 2013-03-08 2019-08-06 Oracle International Corporation Generating database cluster health alerts using machine learning
US20230419402A1 (en) * 2022-06-23 2023-12-28 The Toronto-Dominion Bank Systems and methods of optimizing machine learning models for automated anomaly detection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020038353A1 (zh) * 2018-08-21 2020-02-27 瀚思安信(北京)软件技术有限公司 异常行为检测方法及系统
CN113657549A (zh) * 2021-08-31 2021-11-16 平安医疗健康管理股份有限公司 医疗数据审核方法、装置、设备以及存储介质
CN116484307A (zh) * 2023-06-21 2023-07-25 深圳市魔样科技有限公司 基于云计算智能戒指远程控制方法
CN116628617A (zh) * 2023-07-25 2023-08-22 值数科技(北京)有限公司 一种基于纳米复合材料实现微型应变监测的方法
CN116735807A (zh) * 2023-08-09 2023-09-12 山东优控智能技术有限公司 基于多传感器数据的空气质量检测评估方法
CN116933046A (zh) * 2023-09-19 2023-10-24 山东大学 基于深度学习的多模态健康管理方案生成方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yilong Shi ; Yirong Liu ; Xiang Gao.Study of Wind Turbine Fault Diagnosis and Early Warning Based on SCADA Data.IEEE Access.2021,124600-124615. *
基于可穿戴设备和服务机器人的血糖预测方法;刘赛赛;中国硕士论文库;20221215;1-67 *

Also Published As

Publication number Publication date
CN117877736A (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
CN116705337B (zh) 一种健康数据采集及智能分析方法
CN109009017B (zh) 一种智能健康监测系统及其数据处理方法
CN109864736A (zh) 心电信号的处理方法、装置、终端设备及介质
CN111009321A (zh) 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
CN110289061B (zh) 一种创伤失血性休克伤情的时间序列预测方法
CN112641451B (zh) 基于单通道脑电信号多尺度残差网络睡眠分期方法及系统
Cömert et al. Evaluation of fetal distress diagnosis during delivery stages based on linear and nonlinear features of fetal heart rate for neural network community
CN108877949A (zh) 基于孤立森林算法和投票机制的唐氏综合症筛查方法
CN112043252B (zh) 基于脉搏信号中呼吸成分的情绪识别系统及方法
CN117786429B (zh) 基于可穿戴设备的老人健康监测数据处理方法
Baghizadeh et al. A new emotion detection algorithm using extracted features of the different time-series generated from ST intervals Poincaré map
CN113499035B (zh) 一种基于置信区间融合阈值判据的疼痛识别系统
CN118380160B (zh) 基于大数据的口腔癌病历数据分析方法
CN111370124A (zh) 一种基于面手部识别和大数据的健康分析系统及方法
WO2023097780A1 (zh) 机械通气过程中人机异步现象的分类方法和分类装置
Hidayat et al. Comparison of K-Nearest Neighbor and Decision Tree Methods using Principal Component Analysis Technique in Heart Disease Classification
CN114464319A (zh) 一种基于慢特征分析和深度神经网络的ams易感性评估系统
CN116864062B (zh) 一种基于互联网的健康体检报告数据分析管理系统
CN117877736B (zh) 基于机器学习的智能戒指异常健康数据预警方法
CN113111918A (zh) 基于异常样本检测和多维信息输出的脑卒中风险筛查方法
CN117116475A (zh) 缺血性脑卒中的风险预测方法、系统、终端及存储介质
Yeh An Analysis of ECG for Determining Heartbeat Case by Using the Principal Component Analysis and Fuzzy Logic.
CN113349746A (zh) 一种生命体征监测报警系统
Li et al. A dirichlet process mixture model for autonomous sleep apnea detection using oxygen saturation data
CN112507959A (zh) 一种基于视频中个体面部分析的情绪感知模型的建立方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: China

Address after: 518000 1st, 2nd, 4th, 5th and 6th floors of Qiufen (10A) Building, Taihua wutong Industrial Park, Sanwei Community, Hangcheng Street, Bao'an District, Shenzhen, Guangdong

Applicant after: Shenzhen Moyang Technology Co.,Ltd.

Address before: 518000 1st, 2nd, 4th, 5th and 6th floors of Qiufen (10A) Building, Taihua wutong Industrial Park, Sanwei Community, Hangcheng Street, Bao'an District, Shenzhen, Guangdong

Applicant before: SHENZHEN MOYOUNG TECHNOLOGY CO.,LTD.

Country or region before: China

GR01 Patent grant
GR01 Patent grant