CN118039135B - 基于机器学习的健康监测数据处理方法及系统 - Google Patents

基于机器学习的健康监测数据处理方法及系统 Download PDF

Info

Publication number
CN118039135B
CN118039135B CN202410431226.0A CN202410431226A CN118039135B CN 118039135 B CN118039135 B CN 118039135B CN 202410431226 A CN202410431226 A CN 202410431226A CN 118039135 B CN118039135 B CN 118039135B
Authority
CN
China
Prior art keywords
data
difference
characteristic
segment
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410431226.0A
Other languages
English (en)
Other versions
CN118039135A (zh
Inventor
张德滨
陈慧蓉
周莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Aidi Pharmaceutical Technology Co ltd
Original Assignee
Shenzhen Aidi Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Aidi Pharmaceutical Technology Co ltd filed Critical Shenzhen Aidi Pharmaceutical Technology Co ltd
Priority to CN202410431226.0A priority Critical patent/CN118039135B/zh
Publication of CN118039135A publication Critical patent/CN118039135A/zh
Application granted granted Critical
Publication of CN118039135B publication Critical patent/CN118039135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/024Detecting, measuring or recording pulse rate or heart rate
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4806Sleep evaluation
    • A61B5/4812Detecting sleep stages or cycles
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Surgery (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Cardiology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Psychiatry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

本发明涉及数据分析技术领域,具体涉及基于机器学习的健康监测数据处理方法及系统,包括:采集心率数据;根据心率数据划分数据的局部范围;根据数据的局部范围进行预测获取对比数据段;根据对比数据段,获取对比数据段对应的实际数据段,计算对比数据段的差异程度;根据对比数据段的差异程度,获取特征数据段与非特征数据段;根据特征数据段与非特征数据段,获取差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。本发明通过对数据进行预测,得到预测数据,再通过对比预测数据与实际数据之间的差异,对数据进行分段,最后单独对每个数据段进行分析,即可检测出异常数据。

Description

基于机器学习的健康监测数据处理方法及系统
技术领域
本发明涉及数据分析技术领域,具体涉及基于机器学习的健康监测数据处理方法及系统。
背景技术
人睡眠时的各项身体数据能够反应出身体的健康程度,但人在睡眠时存在浅睡期、熟睡期、沉睡期以及快速眼动期这4个不同的睡眠状态,由于在同一睡眠状态内的数据存在一定规律,而不同睡眠状态的数据的规律不同,因此传统的判断健康数据是否异常的方法则会产生误判的可能,即传统的判断健康数据是否异常的方法无法准确判断入睡时的健康数据是否异常。
发明内容
本发明提供基于机器学习的健康监测数据处理方法及系统,以解决现有的问题:传统的判断健康数据是否异常的方法无法准确判断入睡时的健康数据是否异常。
本发明的基于机器学习的健康监测数据处理方法及系统采用如下技术方案:
本发明一个实施例提供了基于机器学习的健康监测数据处理方法,该方法包括以下步骤:
采集心率数据;
根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段;
根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子;根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度;
预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段;对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值;根据差异程度阈值,得到差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。
优选的,所述采集心率数据,包括的具体方法为:
通过心率带实时检测人入睡时的心率数据,得到心率数据。
优选的,所述根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段,包括的具体方法为:
预设一个局部范围阈值,对于心率数据中的第个数据,将第个数据前个数据作为第个数据的局部范围;
利用ARIMA算法根据第个数据的局部范围内的数据进行预测,得到第个数据的预测结果,将第个数据的预测结果中前个数据,作为第个数据的对比数据段。
优选的,所述根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子,包括的具体方法为:
对于计算第个对比数据段的第一差异因子,首先将心率数据中第个到第个数据,作为第个实际数据段,为预设的局部范围阈值;根据第个对比数据段内的数据以及第个实际数据段内的数据,获取第个对比数据段与第个实际数据段之间整体上的差异,记为第个对比数据段的第一差异因子,其具体的计算公式为:
式中,表示第个对比数据段的第一差异因子;表示第个实际数据段中所有数据的均值;表示第个对比数据段中所有数据的均值;表示线性归一化函数;表示绝对值运算;
根据第个对比数据段内的数据以及第个实际数据段内的数据,获取第个对比数据段以及第个实际数据段内所有数据的标准差,根据第个对比数据段以及第个实际数据段内所有数据的标准差与均值,计算第个对比数据段的第二差异因子,其具体的计算公式为:
式中,表示第个对比数据段的第二差异因子;表示第个实际数据段中所有数据的标准差;表示第个对比数据段中所有数据的标准差;表示绝对值运算。
优选的,所述根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度,包括的具体计算方法为:
首先计算第个对比数据段与第个实际数据段之间的皮尔逊相关系数,得到第个对比数据段与第个实际数据段之间的皮尔逊相关系数,根据第个对比数据段与第个实际数据段之间的皮尔逊相关系数,结合第个对比数据段的第一差异因子与第个对比数据段的第二差异因子,获取第个对比数据段与第个实际数据段之间的差异程度,记为第个对比数据段的差异程度,其具体的计算公式为:
式中,表示第个对比数据段的差异程度;表示第个对比数据段的第一差异因子;表示第个对比数据段的第二差异因子;表示第个对比数据段与第个实际数据段之间的皮尔逊相关系数;表示以自然常数为底数的指数函数;表示绝对值运算。
优选的,所述预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段,包括的具体方法为:
将心率数据中差异程度大于的对比数据段记为目标数据段,将每个目标数据段中的第一个数据作为每个目标数据段的起始数据,获取每个起始数据所对应的时刻记为特征时刻,将心率数据中所有特征时刻下的数据记为特征数据,将心率数据中时序相邻的特征数据归为同一特征数据段,得到若干特征数据段,并将心率数据中不是特征数据段的数据段记为非特征数据段。
优选的,所述对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值,包括的具体方法为:
若两个非特征数据段之间存在一个特征数据段,则将两个非特征数据段归为一组,得到若干非特征数据组;并将非特征数据组中两个非特征数据段之间的特征数据段记为非特征数据组的特征数据段;
计算每组非特征数据组内两个非特征数据段之间的差异程度,记为每组非特征数据组内的差异程度;以及每组非特征数据组的特征数据段内所有数据的对比数据段的差异程度均值,记为每组非特征数据组的特征值;
然后,利用k-means聚类算法,根据每个非特征数据段中的数据,将每个非特征数据段分成两个类簇;分别获取所有非特征数据段的每个类簇中所有数据的均值,根据所有非特征数据段的每个类簇中所有数据的均值,结合每组非特征数据组内的差异程度以及非特征数据组的特征值,对初始差异程度阈值进行修正,得到差异程度阈值,其具体的计算过程为:
式中,表示差异程度阈值;表示预设的初始差异程度阈值;表示非特征数据组的数量;表示第组非特征数据组内的差异程度;表示第组非特征数据组的特征值;表示非特征数据段的数量;表示第个非特征数据段的第1个类簇中所有数据的均值;表示第个非特征数据段的第2个类簇中所有数据的均值;表示绝对值运算;表示激活函数。
优选的,所述根据差异程度阈值,得到差异数据段,包括的具体方法为:
将心率数据中差异程度大于的对比数据段记为基准数据段,将每个基准数据段中的第一个数据作为每个基准数据段的初始数据,获取每个初始数据所对应的时刻记为差异时刻,将心率数据中所有差异时刻下的数据记为差异数据,将心率数据中时序相邻的差异数据归为同一差异数据段,得到若干差异数据段。
优选的,所述根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据,包括的具体方法为:
对于第个差异数据段,获取第个差异数据段中每个数据的对比数据段的差异程度,将差异程度最大的对比数据段所对应的数据,作为第个差异数据段的分段点;获取每个特征段中的分段点,根据每个特征数据段中的分段点对心率数据进行分段,得到若干段心率数据。
本发明的实施例提供了基于机器学习的健康监测数据处理系统,该系统包括数据采集模块、数据预测模块、数据对比模块以及数据分段模块,其中:
数据采集模块,用于采集心率数据;
数据预测模块,用于根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段;
数据对比模块,用于根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子;根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度;
数据分段模块,用于预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段;对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值;根据差异程度阈值,得到差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。
本发明的技术方案的有益效果是:本申请首先通过对数据进行划分,得到数据的局部范围;根据数据的局部范围进行预测得到对比数据段,由于对比数据段是由数据的局部范围得到的,因此当对比数据段与对应的实际数据段之间的差异越大,此时睡眠状态的越有可能发生改变,以此为依据对数据进行分段,得到不同睡眠状态下的数据,最后单独对不同睡眠状态的下数据进行分析,即可准确的判断数据是否异常。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于机器学习的健康监测数据处理方法的步骤流程图;
图2为本发明的基于机器学习的健康监测数据处理系统的结构框图;
图3为本发明的特征数据段与非特征数据段示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于机器学习的健康监测数据处理方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于机器学习的健康监测数据处理方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于机器学习的健康监测数据处理方法的步骤流程图,该方法包括以下步骤:
步骤S001:采集心率数据。
需要说明的是,人在入睡时首先会进入浅睡期、然后由浅睡期进入熟睡期、再由睡熟期进入沉睡期、接着由沉睡期进入快速眼动期、最后再由快速眼动期进入浅睡期,如此循环的,而在不同的时期中人体的各项身体数据存在的差异大,因此传统的判断健康数据是否异常的方法则会产生误判的可能,即传统的判断健康数据是否异常的方法无法准确判断入睡时的健康数据是否异常。因此本实施例提出了一种基于机器学习的健康监测数据处理方法及系统,其目的是为了能够准确的识别出各个时期中的异常数据;由于判断各项身体数据是否异常的过程一致,因此本实施例以判断心率数据中的异常数据为例进行叙述,因此首先需要采集人入睡时的心率数据。
具体的,通过心率带实时检测人入睡时的心率数据,得到心率数据。
步骤S002:根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段。
需要说明的是,本实施例作为一种基于机器学习的健康监测数据处理方法,其目的是能够准确的识别出各个时期中的异常数据,由于心率数据在不同的时期存在的差异大,因此需要将心率数据分解成若干段,得到若干个数据段,通过对每个数据单独进行分析,即可准确的获取每个数据段中的异常数据;为了能够更加清楚的对本实施例进行叙述,在本实施例中将浅睡期、熟睡期、沉睡期以及快速眼动期称为睡眠状态。
需要进一步说明的是,ARIMA算法作为一种通过历史数据模拟未来数据的算法,即可以通过历史数据模拟出与实际数据接近的模拟数据,而在睡眠时由于每个时期内的心率数据差异大,利用ARIMA算法对某段心率数据进行预测,获取该段数据的预测结果,根据该段数据的预测结果与实际的心率数据之间的差异,判断该段数据是否与历史数据处于相同的睡眠状态,从而达到对心率数据进行分段的目的;因此首先需要对心率数据进行预测。
具体的,预设一个局部范围阈值的具体取值可结合实际情况自行设置本实施例不做硬性要求在本实施例中以进行叙述,对于心率数据中的第个数据,将第个数据前个数据作为第个数据的局部范围;
利用ARIMA算法根据第个数据的局部范围内的数据进行预测,得到第个数据的预测结果,将第个数据的预测结果中前个数据,作为第个数据的对比数据段;由于利用ARIMA算法预测数据作为一种公知的现有技术,故在本实施例中不再进行赘述。
至此,得到第个数据的对比数据段,同理获取每个数据的对比数据段。
步骤S003:根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子;根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度。
需要说明的是,同一睡眠状态内的心率数据存在一定规律,而不同睡眠状态的心率数据的规律不同,故可以以此为依据,将预测的数据与实际的数据进行对比,获取预测的数据与实际的数据之间的差异,根据预测的数据与实际的数据之间的差异,对心率数据进行分段。
具体的,对于计算第个对比数据段,首先将心率数据中第个到第个数据,作为第个实际数据段,为预设的局部范围阈值;根据第个对比数据段内的数据以及第个实际数据段内的数据,获取第个对比数据段与第个实际数据段之间整体上的差异,记为第个对比数据段的第一差异因子,其具体的计算公式为:
式中,表示第个对比数据段的第一差异因子;表示第个实际数据段中所有数据的均值;表示第个对比数据段中所有数据的均值;表示线性归一化函数;表示绝对值运算。
需要说明的是,表示的是第个实际数据段中所有数据的均值与第个对比数据段中所有数据的均值之间的差异;因此的值越大,则说明第个对比数据段与第个实际数据段之间整体上的差异就越大,所以的值越大,第个对比数据段与第个实际数据段之间的差异就越大。
需要进一步说明的是,由于第个对比数据段的第一差异因子,仅说明第个对比数据段与第个实际数据段之间整体上的差异,并不能表示第个对比数据段与第个实际数据段之间波动上的差异,而为了能够准确的对心率数据进行分段,还需要计算对比数据段与实际数据段之间波动上的差异,记为第个对比数据段的第二差异因子。
具体的,其具体的计算公式为:
式中,表示第个对比数据段的第二差异因子;表示第个实际数据段中所有数据的标准差;表示第个对比数据段中所有数据的标准差;表示第个实际数据段中所有数据的均值;表示第个对比数据段中所有数据的均值;表示绝对值运算。
需要说明的是,表示的是第个实际数据段的波动程度;表示的是第个对比数据段的波动程度;因此的值越大,则说明第个对比数据段与第个实际数据段之间波动上的差异就越大;所以的值越大第个对比数据段与第个实际数据段之间的差异就越大。
需要进一步说明的是,对比数据段的第一差异因子与对比数据段的第二差异因子,分别能够表示对比数据段与实际数据段之间整体上的差异与波动上的差异,但通过数据段之间整体上的差异与波动上的差异还不足以表示出数据段之间的所有差异,最后还缺少数据段之间变化趋势的差异;再通过数据段之间变化趋势上的差异,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度。
具体的,首先计算第个对比数据段与第个实际数据段之间的皮尔逊相关系数,由于计算两个数据段之间的皮尔逊相关系数作为一种公知的现有技术,故在本实施例中不再进行赘述,得到第个对比数据段与第个实际数据段之间的皮尔逊相关系数,将第个对比数据段与第个实际数据段之间的皮尔逊相关系数,记为第个对比数据段与第个实际数据段之间变化趋势的差异,结合第个对比数据段的第一差异因子与第个对比数据段的第二差异因子,获取第个对比数据段与第个实际数据段之间的差异程度,记为第个对比数据段的差异程度,其具体的计算公式为:
式中,表示第个对比数据段的差异程度;表示第个对比数据段的第一差异因子;表示第个对比数据段的第二差异因子;表示第个对比数据段与第个实际数据段之间的皮尔逊相关系数;表示以自然常数为底数的指数函数;表示绝对值运算。
需要说明的是,以及的值越大,则第个对比数据段与第个实际数据段之间的差异就越大,因此的值越大,则说明个对比数据段与第个实际数据段之间的差异就越大。
至此,得到对比数据段的差异程度。
步骤S004:预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段;对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值;根据差异程度阈值,得到差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。
需要说明的是,由于本实施例是基于ARIMA算法对数据进行预测,通过预测的数据与实际的数据之间的差异,对心率数据进行分段的,在通过步骤S003得到对比数据段与实际数据之间的差异程度后,即可根据对比数据段的差异程度对心率数据进行分段。
需要进一步说明的是,由于在同一睡眠状态内的心率数据存在一定规律,而不同睡眠状态的心率数据的规律不同,因此根据某一个睡眠状态内的心率数据仅能准确地预测出同一睡眠状态内的心率数据,而不能准确预测出其他睡眠状态内的心率数据,因此当预测数据与实际的数据出现的差异越大时,则此时越有可能是睡眠状态发生了改变,故可以以此为依据对心率数据进行分段。
具体的,预设一个初始差异程度阈值的具体取值可结合实际情况自行设置,本实施例不做硬性要求,在本实施例中以进行叙述;将心率数据中差异程度大于的对比数据段记为目标数据段,将每个目标数据段中的第一个数据作为每个目标数据段的起始数据,获取每个起始数据所对应的时刻记为特征时刻,将心率数据中所有特征时刻下的数据记为特征数据,将心率数据中时序相邻的特征数据归为同一特征数据段,得到若干特征数据段,并将心率数据中不是特征数据段的数据段记为非特征数据段。
需要说明的是,当差异程度阈值过大时,会导致某些睡眠状态变化的时刻不处于特征数据段中,从而无法根据特征数据段对心率数据进行准确的分段,最终使得心率数据的分段结果不准确;而当差异阈值过小时,会导致某些特征数据段中不存在睡眠状态变化的时刻,从而无法根据特征数据段对心率数据进行准确的分段,同样会导致心率数据的分段结果不准确,因此需要对初始差异程度阈值进行调整。
具体的,若两个非特征数据段之间存在一个特征数据段,则将两个非特征数据段归为一组,得到若干非特征数据组;并将非特征数据组中两个非特征数据段之间的特征数据段记为非特征数据组的特征数据段;分别计算每组非特征数据组内两个非特征数据段之间的差异程度,记为每组非特征数据组内的差异程度;以及每组非特征数据组的特征数据段内所有数据的对比数据段的差异程度均值,记为每组非特征数据组的特征值;
例如图3所示:在图3中,“2”、“4”、“6”、“8”为非特征数据段,“1”、“3”、“5”、“7”、“9”为特征数据段;图3中共有“2”和“4”、“4”和“6”以及“6”和“8”三组非特征数据组;而“3”为非特征数据组“2”和“4”的特征数据段,“5”为非特征数据组“4”和“6”的特征数据段,“7”为非特征数据组“6”和“8”的特征数据段。
需要说明的是,每组非特征数据组内的差异程度的具体计算过程,与步骤S003计算对比数据段与实际数据段之间的差异程度相同,即与得到对比数据段的差异程度相同,因此在本实施例中不再进行赘述。
然后,利用k-means聚类算法,根据每个非特征数据段中的数据,将每个非特征数据段分成两个类簇,由于k-means聚类算法作为一种公知的现有技术,故在本实施例中不在进行过赘述;分别获取所有非特征数据段的每个类簇中所有数据的均值,根据所有非特征数据段的每个类簇中所有数据的均值,结合每组非特征数据组内的差异程度以及非特征数据组的特征值,对初始差异程度阈值进行修正,得到差异程度阈值,其具体的计算过程为:
式中,表示差异程度阈值;表示预设的初始差异程度阈值;表示非特征数据组的数量;表示第组非特征数据组内的差异程度;表示第组非特征数据组的特征值;表示非特征数据段的数量;表示第个非特征数据段的第1个类簇中所有数据的均值;表示第个非特征数据段的第2个类簇中所有数据的均值;表示绝对值运算;表示激活函数,在本实施例中用于归一化。
需要说明的是,而当差异阈值过小时,会导致某些特征数据段中不存在睡眠状态变化的时刻,即该特征数据段相邻的两个非特征数据段处于同一睡眠状态中,此时特征数据段相邻的两个非特征数据段之间的差异程度低,同时该特征数据段内所有数据的对比数据段的差异程度低,因此每组非特征数据组内的差异程度以及特征值越小,则越需要增大初始差异程度阈值;即的值越大,则越需要增大初始差异阈值;而当差异阈值过大时,则会导致某些睡眠状态变化的时刻处于非特征数据段中,即在一个非特征数据段中存在两种睡眠状态的数据,因此可通过k-means聚类算法,将非特征数据段中的数据分为两个类簇,若两个类簇之间的差异越大,则非特征数据段中就越可能存在睡眠状态变化的时刻,即的值越大,则越应该减小初始差异程度阈值。
在得到差异程度阈值后,即可将心率数据中差异程度大于的对比数据段记为基准数据段,将每个基准数据段中的第一个数据作为每个基准数据段的初始数据,获取每个初始数据所对应的时刻记为差异时刻,将心率数据中所有差异时刻下的数据记为差异数据,将心率数据中时序相邻的差异数据归为同一差异数据段,得到若干差异数据段。
需要说明的是,由于预测得到的对比数据段存在一定的长度,而当对比数据段与睡眠状态发生改变的时刻接触时,对比数据段的差异程度就会变大,且睡眠状态发生改变的时刻处于对比数据段的位置越靠前,则对比数据段的差异程度就会越大,当睡眠状态发生改变的时刻处于对比数据段中第一个数据的时刻时,对比数据段的差异程度达到最大,故可以以此为依据区分睡眠状态。
具体的于第个差异数据段,获取第个差异数据段中每个数据的对比数据段的差异程度,将差异程度最大的对比数据段所对应的数据,作为第个差异数据段的分段点;获取每个特征段中的分段点,根据每个特征数据段中的分段点对心率数据进行分段,得到若干段心率数据。
最后,利用DBSCAN聚类算法对每段心率数据单独进行聚类运算,即可得到心率数据中的异常数据,由于DBSCAN聚类算法作为一种公知的现有技术故在本实施例中不再进行赘述,标记异常数据。
至此本实施例完成。
请参阅图2,其示出了本发明一个实施例提供的基于机器学习的健康监测数据处理系统的结构框图,该系统包括以下模块:
数据采集模块,用于采集心率数据;
数据预测模块,用于根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段;
数据对比模块,用于根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子;根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度;
数据分段模块,用于预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段;对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值;根据差异程度阈值,得到差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。
本申请首先通过对数据进行划分,得到数据的局部范围;根据数据的局部范围进行预测得到对比数据段,由于对比数据段是由数据的局部范围得到的,因此当对比数据段与对应的实际数据段之间的差异越大,此时睡眠状态的越有可能发生改变,以此为依据对数据进行分段,得到不同睡眠状态下的数据,最后单独对不同睡眠状态下的数据进行分析,即可准确的判断数据是否异常。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于机器学习的健康监测数据处理方法,其特征在于,该方法包括以下步骤:
采集心率数据;
根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段;
根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子;根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度;
所述根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度,包括的具体计算方法为:
首先计算第个对比数据段与第个实际数据段之间的皮尔逊相关系数,得到第个对比数据段与第个实际数据段之间的皮尔逊相关系数,根据第个对比数据段与第个实际数据段之间的皮尔逊相关系数,结合第个对比数据段的第一差异因子与第个对比数据段的第二差异因子,获取第个对比数据段与第个实际数据段之间的差异程度,记为第个对比数据段的差异程度,其具体的计算公式为:
式中,表示第个对比数据段的差异程度;表示第个对比数据段的第一差异因子;表示第个对比数据段的第二差异因子;表示第个对比数据段与第个实际数据段之间的皮尔逊相关系数;表示以自然常数为底数的指数函数;表示绝对值运算;
预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段;对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值;
所述对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值,包括的具体方法为:
若两个非特征数据段之间存在一个特征数据段,则将两个非特征数据段归为一组,得到若干非特征数据组;并将非特征数据组中两个非特征数据段之间的特征数据段记为非特征数据组的特征数据段;
计算每组非特征数据组内两个非特征数据段之间的差异程度,记为每组非特征数据组内的差异程度;以及每组非特征数据组的特征数据段内所有数据的对比数据段的差异程度均值,记为每组非特征数据组的特征值;
然后,利用k-means聚类算法,根据每个非特征数据段中的数据,将每个非特征数据段分成两个类簇;分别获取所有非特征数据段的每个类簇中所有数据的均值,根据所有非特征数据段的每个类簇中所有数据的均值,结合每组非特征数据组内的差异程度以及非特征数据组的特征值,对初始差异程度阈值进行修正,得到差异程度阈值,其具体的计算过程为:
式中,表示差异程度阈值;表示预设的初始差异程度阈值;表示非特征数据组的数量;表示第组非特征数据组内的差异程度;表示第组非特征数据组的特征值;表示非特征数据段的数量;表示第个非特征数据段的第1个类簇中所有数据的均值;表示第个非特征数据段的第2个类簇中所有数据的均值;表示绝对值运算;表示激活函数;
根据差异程度阈值,得到差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。
2.根据权利要求1所述基于机器学习的健康监测数据处理方法,其特征在于,所述采集心率数据,包括的具体方法为:
通过心率带实时检测人入睡时的心率数据,得到心率数据。
3.根据权利要求1所述基于机器学习的健康监测数据处理方法,其特征在于,所述根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段,包括的具体方法为:
预设一个局部范围阈值,对于心率数据中的第个数据,将第个数据前个数据作为第个数据的局部范围;
利用ARIMA算法根据第个数据的局部范围内的数据进行预测,得到第个数据的预测结果,将第个数据的预测结果中前个数据,作为第个数据的对比数据段。
4.根据权利要求1所述基于机器学习的健康监测数据处理方法,其特征在于,所述根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子,包括的具体方法为:
对于计算第个对比数据段的第一差异因子,首先将心率数据中第个到第个数据,作为第个实际数据段,为预设的局部范围阈值;根据第个对比数据段内的数据以及第个实际数据段内的数据,获取第个对比数据段与第个实际数据段之间整体上的差异,记为第个对比数据段的第一差异因子,其具体的计算公式为:
式中,表示第个对比数据段的第一差异因子;表示第个实际数据段中所有数据的均值;表示第个对比数据段中所有数据的均值;表示线性归一化函数;表示绝对值运算;
根据第个对比数据段内的数据以及第个实际数据段内的数据,获取第个对比数据段以及第个实际数据段内所有数据的标准差,根据第个对比数据段以及第个实际数据段内所有数据的标准差与均值,计算第个对比数据段的第二差异因子,其具体的计算公式为:
式中,表示第个对比数据段的第二差异因子;表示第个实际数据段中所有数据的标准差;表示第个对比数据段中所有数据的标准差;表示绝对值运算。
5.根据权利要求1所述基于机器学习的健康监测数据处理方法,其特征在于,所述预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段,包括的具体方法为:
将心率数据中差异程度大于的对比数据段记为目标数据段,将每个目标数据段中的第一个数据作为每个目标数据段的起始数据,获取每个起始数据所对应的时刻记为特征时刻,将心率数据中所有特征时刻下的数据记为特征数据,将心率数据中时序相邻的特征数据归为同一特征数据段,得到若干特征数据段,并将心率数据中不是特征数据段的数据段记为非特征数据段。
6.根据权利要求1所述基于机器学习的健康监测数据处理方法,其特征在于,所述根据差异程度阈值,得到差异数据段,包括的具体方法为:
将心率数据中差异程度大于的对比数据段记为基准数据段,将每个基准数据段中的第一个数据作为每个基准数据段的初始数据,获取每个初始数据所对应的时刻记为差异时刻,将心率数据中所有差异时刻下的数据记为差异数据,将心率数据中时序相邻的差异数据归为同一差异数据段,得到若干差异数据段。
7.根据权利要求1所述基于机器学习的健康监测数据处理方法,其特征在于,所述根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据,包括的具体方法为:
对于第个差异数据段,获取第个差异数据段中每个数据的对比数据段的差异程度,将差异程度最大的对比数据段所对应的数据,作为第个差异数据段的分段点;获取每个特征段中的分段点,根据每个特征数据段中的分段点对心率数据进行分段,得到若干段心率数据。
8.基于机器学习的健康监测数据处理系统,其特征在于,该系统包括以下模块:
数据采集模块,用于采集心率数据;
数据预测模块,用于根据心率数据划分数据的局部范围,根据数据的局部范围进行预测得到预测结果,根据预测结果获取对比数据段;
数据对比模块,用于根据对比数据段获取对比数据段对应的实际数据段,根据对比数据段与对比数据段对应的实际数据段中所有数据的幅值均值与标准差,获取对比数据段的第一差异因子与对比数据段的第二差异因子;根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度;
所述根据对比数据段与对比数据段对应的实际数据段之间的相关性,结合对比数据段的第一差异因子与对比数据段的第二差异因子,获取对比数据段的差异程度,包括的具体计算方法为:
首先计算第个对比数据段与第个实际数据段之间的皮尔逊相关系数,得到第个对比数据段与第个实际数据段之间的皮尔逊相关系数,根据第个对比数据段与第个实际数据段之间的皮尔逊相关系数,结合第个对比数据段的第一差异因子与第个对比数据段的第二差异因子,获取第个对比数据段与第个实际数据段之间的差异程度,记为第个对比数据段的差异程度,其具体的计算公式为:
式中,表示第个对比数据段的差异程度;表示第个对比数据段的第一差异因子;表示第个对比数据段的第二差异因子;表示第个对比数据段与第个实际数据段之间的皮尔逊相关系数;表示以自然常数为底数的指数函数;表示绝对值运算;
数据分段模块,用于预设一个初始差异程度阈值;利用初始差异程度阈值结合对比数据段的差异程度,得到特征数据段与非特征数据段;对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值;
所述对非特征数据段进行分组,得到若干非特征数据组以及非特征数据组的特征数据段,根据若干非特征数据组以及非特征数据组的特征数据段,结合特征数据段中的数据,修正初始差异程度阈值,得到差异程度阈值,包括的具体方法为:
若两个非特征数据段之间存在一个特征数据段,则将两个非特征数据段归为一组,得到若干非特征数据组;并将非特征数据组中两个非特征数据段之间的特征数据段记为非特征数据组的特征数据段;
计算每组非特征数据组内两个非特征数据段之间的差异程度,记为每组非特征数据组内的差异程度;以及每组非特征数据组的特征数据段内所有数据的对比数据段的差异程度均值,记为每组非特征数据组的特征值;
然后,利用k-means聚类算法,根据每个非特征数据段中的数据,将每个非特征数据段分成两个类簇;分别获取所有非特征数据段的每个类簇中所有数据的均值,根据所有非特征数据段的每个类簇中所有数据的均值,结合每组非特征数据组内的差异程度以及非特征数据组的特征值,对初始差异程度阈值进行修正,得到差异程度阈值,其具体的计算过程为:
式中,表示差异程度阈值;表示预设的初始差异程度阈值;表示非特征数据组的数量;表示第组非特征数据组内的差异程度;表示第组非特征数据组的特征值;表示非特征数据段的数量;表示第个非特征数据段的第1个类簇中所有数据的均值;表示第个非特征数据段的第2个类簇中所有数据的均值;表示绝对值运算;表示激活函数;
根据差异程度阈值,得到差异数据段;根据差异数据段获取分段点,根据分段点对心率数据进行分段,得到若干段心率数据。
CN202410431226.0A 2024-04-11 2024-04-11 基于机器学习的健康监测数据处理方法及系统 Active CN118039135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410431226.0A CN118039135B (zh) 2024-04-11 2024-04-11 基于机器学习的健康监测数据处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410431226.0A CN118039135B (zh) 2024-04-11 2024-04-11 基于机器学习的健康监测数据处理方法及系统

Publications (2)

Publication Number Publication Date
CN118039135A CN118039135A (zh) 2024-05-14
CN118039135B true CN118039135B (zh) 2024-07-05

Family

ID=90989678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410431226.0A Active CN118039135B (zh) 2024-04-11 2024-04-11 基于机器学习的健康监测数据处理方法及系统

Country Status (1)

Country Link
CN (1) CN118039135B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114966845A (zh) * 2022-06-16 2022-08-30 河南省地震局 一种无监督聚类的地震波形实时分类检测方法
CN116473569A (zh) * 2023-05-05 2023-07-25 郑州大学第一附属医院 一种心电图数据处理方法、系统及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237242B (zh) * 2023-11-16 2024-02-27 深圳爱递医药科技有限公司 基于结构光数据的口腔颌面外科术后护理系统
CN117828511B (zh) * 2024-03-04 2024-05-10 中国中医科学院广安门医院 一种麻醉深度脑电信号数据处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114966845A (zh) * 2022-06-16 2022-08-30 河南省地震局 一种无监督聚类的地震波形实时分类检测方法
CN116473569A (zh) * 2023-05-05 2023-07-25 郑州大学第一附属医院 一种心电图数据处理方法、系统及存储介质

Also Published As

Publication number Publication date
CN118039135A (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
CN110263846B (zh) 基于故障数据深度挖掘及学习的故障诊断方法
CN108537215B (zh) 一种基于图像目标检测的火焰检测方法
CN107092582B (zh) 一种基于残差后验的异常值在线检测及置信度评估方法
CN107682319B (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN111666169B (zh) 一种基于改进的孤立森林算法和高斯分布的联合数据异常检测方法
CN110399927B (zh) 识别模型训练方法、目标识别方法及装置
CN109873779B (zh) 一种基于lstm的分级式无线信号调制类型识别方法
EP3364157A1 (en) Method and system of outlier detection in energy metering data
CN109902564B (zh) 一种基于结构相似性稀疏自编码网络的异常事件检测方法
CN103473540B (zh) 智能交通系统车辆轨迹增量式建模与在线异常检测方法
CN113887616A (zh) 一种epg连接数的实时异常检测系统及方法
CN116992322B (zh) 一种智慧城市数据中心管理系统
CN113568774B (zh) 使用无监督深度神经网络的多维时序数据实时异常检测方法
CN112288034A (zh) 一种无线传感器网络半监督在线异常检测方法
CN117155706B (zh) 网络异常行为检测方法及其系统
CN113204914B (zh) 一种基于多架次飞行数据表征建模的飞行数据异常判读方法
CN108875532A (zh) 一种基于稀疏编码和长度后验概率的视频动作检测方法
CN116308963B (zh) 一种政务数据分析方法及系统
CN116956189A (zh) 一种电流异常检测系统、方法、电子设备及介质
CN118133189B (zh) 一种桥梁结构健康状态实时监测方法及系统
CN118211082B (zh) 基于数据分析的油液滤芯剩余寿命预测方法及系统
CN113053536B (zh) 一种基于隐马尔科夫模型的传染病预测方法、系统和介质
CN118039135B (zh) 基于机器学习的健康监测数据处理方法及系统
CN113254485A (zh) 实时数据流异常检测方法及系统
CN117056842A (zh) 构建设备异常监测模型的方法、装置、设备、介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant