CN115798724B - 一种基于人体无创采集数据的人体指标异常分析方法 - Google Patents
一种基于人体无创采集数据的人体指标异常分析方法 Download PDFInfo
- Publication number
- CN115798724B CN115798724B CN202310102057.1A CN202310102057A CN115798724B CN 115798724 B CN115798724 B CN 115798724B CN 202310102057 A CN202310102057 A CN 202310102057A CN 115798724 B CN115798724 B CN 115798724B
- Authority
- CN
- China
- Prior art keywords
- cluster
- data
- abnormal
- initial
- data point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明涉及数据异常识别技术领域,具体涉及一种基于人体无创采集数据的人体指标异常分析方法,包括:获取人体阻抗数据的初始聚簇,对初始聚簇进行收缩更新操作,根据每次收缩更新操作中每个初始聚簇包含的数据点的数量,获取每个初始聚簇的异常指标以及每个数据点在对应初始聚簇中的异常程度;对初始聚簇进行分散合并更新操作得到目标聚簇,根据初始聚簇与目标聚簇的异常指标以及数据点在初始聚簇中的异常程度与在目标聚簇中的异常程度获取数据点的异常水平,通过多次迭代获取数据点的多个异常水平,进一步得到异常特征值,从而筛选出异常数据。本发明避免了聚簇大小对异常特征值的影响,使得根据异常特征值筛选出的异常数据更加可信。
Description
技术领域
本发明涉数据异常识别技术领域,具体涉及一种基于人体无创采集数据的人体指标异常分析方法。
背景技术
随着医疗水平的发展,越来越多的人体监测技术应用到人体指标分析中,其中包括人体电阻抗分析技术,该技术通过低压电流通过人体,反应人体的健康指标,因其无创、便捷的特点,使其能够得到广泛的应用。人体电阻抗分析通过采集通过人体的低压电流强度分析人体阻抗,但是低压电流常常受静电与电力障碍,导致所测定的电流强度存在异常(粗差),从而导致人体阻抗分析不准确,所以一般在测定电流强度后,首先需要对测定数据进行异常识别,然后剔除异常数据,以便更准确的进行人体电阻抗分析。
对于数据的异常识别主要依据数据的离群特点,即数据之间的聚集关系,目前常常利用数据的聚类来识别异常数据,比如现有的CURE算法进行聚类分析,通过聚簇收缩判断聚簇的异常,但是现有的CURE算法仅针对聚簇本身进行异常分析,分析结果受聚簇本身大小的影响,且不能很好的反应出聚簇中数据点的异常。因此本发明在CURE算法的基础上,利用聚簇的分散与合并,反应数据点与所在聚簇之间的关系,从而识别数据点的异常水平,同时利用多次聚簇的分散与合并,减少异常结果对聚簇大小的依赖性,提高数据点异常检测的可信度。
发明内容
本发明提供一种基于人体无创采集数据的人体指标异常分析方法,以解决现有的问题。
本发明的一种基于人体无创采集数据的人体指标异常分析方法采用如下技术方案:
本发明一个实施例提供了一种基于人体无创采集数据的人体指标异常分析方法,该方法包括以下步骤:
S1:采集人体阻抗数据;对人体阻抗数据进行聚类,得到多个聚簇,记为初始聚簇;
S2:对所有初始聚簇进行收缩更新操作,包括:获取每个初始聚簇的代表点,对每个初始聚簇的代表点进行收缩,根据收缩后的代表点进行初始聚簇的更新;
S3:重复S2直到达到第一预设次数时停止,根据每次收缩更新操作中每个初始聚簇包含的数据点的数量,获取每个初始聚簇的异常指标;根据每个初始聚簇的异常指标获取每个数据点在对应初始聚簇中的异常程度;
S4:对所有初始聚簇进行分散合并更新操作,包括:将数据点数量小于第一预设阈值的初始聚簇中的数据点合并到其他初始聚簇中,将数据点数量大于第二预设阈值的初始聚簇分成两个初始聚簇;
S5:将分散合并更新操作后的初始聚簇作为目标聚簇,对目标聚簇执行步骤S2-S3,得到每个目标聚簇的异常指标以及每个数据点在对应目标聚簇中的异常程度;根据每个初始聚簇的异常指标、每个目标聚簇的异常指标、每个数据点在对应初始聚簇中的异常程度以及每个数据点在对应目标聚簇中的异常程度获取每个数据点的异常水平;
S6:将目标聚簇作为新的初始聚簇,重复S4-S5直到达到第二预设次数时停止迭代,每个数据点在每次迭代过程中均得到一个异常水平;
S7:根据每个数据点的所有异常水平获取每个数据点的异常特征值,根据异常特征值获取异常数据。
优选的,所述获取每个初始聚簇的代表点,对每个初始聚簇的代表点进行收缩,根据收缩后的代表点进行初始聚簇的更新包括:
选择初始聚簇中距离质心最远的数据点作为第一个点,然后依次选择距离已选到的数据点最远的数据点,直到选到预设数量个数据点时停止,将选择的所有数据点作为代表点,将每个代表点向初始聚簇质心按照预设比例进行收缩;将其余每个数据点分配给距离所述其余每个数据点最近的代表点所在的初始聚簇。
优选的,所述每个初始聚簇的异常指标的表达式为:
优选的,所述每个数据点在对应初始聚簇中的异常程度的表达式为:
其中为第个数据点在对应初始聚簇中的异常程度;第为第个数据点所在的初始聚簇的异常指标;为第个数据点到其所在的初始聚簇的质心的距离;为第一预设次数;为收缩更新操作的序号;为第个数据点所在的初始聚簇中所有数据点对应的时间区间;为第个数据点的时间点;为到的距离。
优选的,所述将数据点数量小于第一预设阈值的初始聚簇中的数据点合并到其他初始聚簇中,将数据点数量大于第二预设阈值的初始聚簇分成两个初始聚簇包括:
将数据点数量小于第一预设阈值的初始聚簇作为第一聚簇,将数据点数量大于或等于第一预设阈值的初始聚簇作为第二聚簇,将第一聚簇中的每个数据点合并到距离所述每个数据点最近的第二聚簇中;将大于第二预设阈值的聚簇作为第三聚簇,对每个第三聚簇中的所有数据点进行聚类,将每个第三聚簇分成两个初始聚簇。
优选的,所述每个数据点的异常水平的表达式为:
优选的,所述每个数据点的异常特征值的表达式为:
其中为为第个数据点的异常特征值;为第次迭代时第个数据点的异常水平;为第次迭代时第个数据点所在的初始聚簇中数据点的集合;为第次迭代时第个数据点所在的目标聚簇中数据点的集合;为交集符号;为与的交集中包含的数据点的数量;为中包含的数据点的数量;为第二预设次数。
本发明的技术方案的有益效果是:本发明在聚簇收缩更新操作过程中根据收缩次序设置权值获取聚簇的异常指标,使得聚簇的异常指标在反应聚簇整体的异常情况时,同时能够体现引起聚簇异常的数据点的存在,从而便于聚簇中异常数据点的识别;聚簇大小对聚簇中数据点的异常识别有一定程度的影响,本发明通过分析聚簇分散合并更新操作过程中同一数据点所在不同聚簇之间的关系,根据聚簇分散合并更新操作过程中聚簇的变化所反映的聚簇稳定性,获取对应数据点的异常水平,避免了聚簇大小对聚簇中数据点异常识别的影响;本发明在计算数据点在对应的聚簇中的异常程度时,考虑了聚簇本身的聚集特点的同时引入数据点的时间序列相关性,加强了人体阻抗数据在时间序列上的关系对数据异常的影响,使得结果更加准确;本发明通过多次聚簇分散合并更新操作以及聚簇收缩更新操作,根据数据点在每次迭代过程中所在初始聚簇与目标聚簇包含的数据点的差异以及数据点在每次迭代过程中的异常水平获取数据点的异常特征值,避免了单次迭代得到的异常水平对聚簇大小的依赖性,通过多次迭代反应出数据点与聚簇的聚集关系,从而使得数据点的异常特征值更加准确,进一步使得根据异常特征值筛选出的异常数据更加可信,进一步使得人体电阻抗分析的结果更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种基于人体无创采集数据的人体指标异常分析方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于人体无创采集数据的人体指标异常分析方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于人体无创采集数据的人体指标异常分析方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于人体无创采集数据的人体指标异常分析方法的步骤流程图,该方法包括以下步骤:
S001.采集人体阻抗数据,对人体阻抗数据进行聚类,得到多个初始聚簇。
需要说明的是,在利用人体电阻抗分析确定人体的指标异常时,首先需要采集人体电阻抗分析所需的数据,人体电阻抗分析是通过皮肤和触觉电极之间的低压电流横穿人体的细胞质,评估人体局部和全身的电流传导后分布情况。人体电阻抗分析仪由双手检测电极板、双脚检测电极板、头部检测电机板、电极连线、标准USB连线、电阻抗分析软件组成。首先连接头部检测电机板与人体额头,由头部检测电机板发射低压电流,然后由双手检测电极板与双脚检测电极板检测电流,将检测电极板的电流数据传输到PC端利用电阻抗分析软件进行分析。
在本实施例中,通过人体电阻抗分析仪采集人体电阻抗分析所需的数据,并将其称为人体阻抗数据。
需要说明的是,人体电阻抗分析通过采集通过人体的低压电流强度分析人体阻抗,但是低压电流常常受静电与电力障碍,导致所测定的电流强度存在异常(粗差),从而导致人体阻抗分析不准确,所以在获得人体阻抗数据后,首先需要对人体阻抗数据进行异常识别,然后剔除异常数据,以便更准确的进行人体电阻抗分析。异常数据常常表现为数据集中的离群数据,因此需要分析人体阻抗数据的分布特点,根据数据分布关系来识别异常数据。而聚类可体现出数据的分布特点。
在本实施例中,利用均值漂移聚类算法对人体阻抗数据进行聚类,将人体阻抗数据分成多个聚簇。为便于后续分析,将每个聚簇作为初始聚簇。
至此,获取了多个初始聚簇。
S002.对初始聚簇进行收缩更新操作,获取初始聚簇的异常指标以及数据点在对应初始聚簇中的异常程度。
需要说明的是,由于数据的分布存在差异,因此步骤S001得到的初始聚簇之间的大小以及形状同样存在差异,为了在不同大小不同形状的初始聚簇中进行异常数据的识别,本实施例采用CURE算法进一步分析不同初始聚簇,从而实现异常数据的识别。
CURE算法可以对不同形状不同大小的聚簇进行异常数据的分析,其本质思想为采用聚簇中的多个代表点来表示一个簇,将多个代表点向聚簇的质心收缩,通过收缩区域的变化,来反应聚簇的异常。
在本实施例中,结合CURE算法的思想对初始聚簇进行收缩更新操作,具体为:
选择初始聚簇中距离质心最远的数据点作为第一个点,然后依次选择距离已选到的数据点最远的数据点,直到选到个数据点时停止,将选择的所有数据点作为代表点,如此得到了个代表点,这些代表点捕获了初始聚簇的形状和大小。将每个代表度按照预设比例向初始聚簇的质心移动一段距离,实现每个代表度的收缩。将除代表点之外的每个数据点分配给距离该数据点最近的代表点所在的初始聚簇。
此时,可根据每次收缩更新操作过程中每个初始聚簇包含的数据点的数量,来获取每个初始聚簇的异常指标。初始聚簇的异常指标的表达式如下:
其中为初始聚簇的异常指标;为收缩更新操作的序号;为第次收缩更新操作前后初始聚簇中包含的数据点的数量差异;为第次收缩更新操作前后初始聚簇中包含的数据点的数量差异;为第一预设次数;越小,第次收缩更新操作前后初始聚簇中包含的数据点的数量差异越小,说明代表点的收缩对初始聚簇的影响较小,此时代表点分布越稀疏,而代表点代表了初始聚簇的形状和大小,则对应的初始聚簇中的数据点分布也越稀疏,此时初始聚簇异常的可能性越大;随着收缩更新操作的重复迭代,每次收缩更新操作中的代表点越靠近初始聚簇的质心,此时可反应的数据点的稀疏程度越小,即可反应的初始聚簇的异常情况越小,因此将收缩更新操作的序号的倒数作为的权重,使得多次收缩更新操作过程对应初始聚簇中数据点数量的变化更能够体现初始聚簇外围分散点引起的聚簇异常。为多次收缩更新操作过程初始聚簇的异常情况。表示相邻两次收缩更新操作和的差异,越大,初始聚簇的分布越不均匀,初始聚簇异常的可能性越大。
至此,获取了初始聚簇的异常指标。需要说明的是,本实施例在聚簇收缩更新操作过程中根据收缩次序设置权值获取聚簇的异常指标,使得聚簇的异常指标在反应聚簇整体的异常情况时,同时能够体现引起聚簇异常的数据点的存在,从而便于聚簇中异常数据点的识别。
步骤S001采集的人体阻抗数据,每条数据对应一个时间点,则对应的每个初始聚簇中每个数据点对应一个时间点。获取每个初始聚簇中所有数据点的时间点,将其中时间点的最大值与最小值组成该初始聚簇的时间区间,用来表示。将第个数据点的时间点用来表示,则第个数据点在对应初始聚簇中的异常程度的计算表达式为:
其中为第个数据点在对应初始聚簇中的异常程度;第为第个数据点所在的初始聚簇的异常指标,越大,初始聚簇的异常指标越大,对应初始聚簇中数据点的异常程度越大;为第个数据点到其所在的初始聚簇的质心的距离,越大,对应数据点异常程度越大;为第一预设次数;为收缩更新操作的序号;为第个数据点所在的初始聚簇的时间区间;为第个数据点的时间点;为到的距离,当时,,当时,为到的左边界的距离和到右边界的距离中的最小值,反应第个数据点与其所在的初始聚簇中所有数据点在时间序列上的相关性,越大,第个数据点与第次收缩更新操作时第个数据点所在的初始聚簇中所有数据点在时间序列上相关性越小,第个数据点异常的可能性越大;即表示在多次收缩更新操作过程中第个数据点与其所在的初始聚类中所有数据点在时间序列上的相关性,其中为计算稳定常数,防止导致整个计算式为0。
至此,获取了每个数据点在对应初始聚簇中的异常程度。需要说明的是,本实施例在计算数据点在对应的聚簇中的异常程度时,考虑了聚簇本身的聚集特点的同时引入数据点的时间序列相关性,加强了人体阻抗数据在时间序列上的关系对数据异常的影响,使得结果更加准确。
S003.对初始聚簇进行分散合并更新操作。
需要说明的是,步骤S002对每个初始聚簇进行收缩更新操作,获取了每个初始聚簇的异常指标,以及每个数据点在对应初始聚簇中的异常程度。但以上结果对每个初始聚簇中数据点的数量的依赖性过高,导致不同大小的初始聚簇所获得的异常指标存在较大差异,进一步使得每个数据点在对应初始聚簇中的异常程度不准确,所以需要通过对初始聚簇进行分散合并更新操作,以便后续获得更加准确的聚簇的异常指标以及数据点的异常程度。
在本实施例中,对包含的数据点数量过多的初始聚簇进行分散,对包含的数据点数量过少的初始聚簇进行合并。对初始聚簇进行分散合并更新操作的过程具体为:
将数据点数量小于第一预设阈值的初始聚簇作为第一聚簇,将数据点数量大于或等于第一预设阈值的初始聚簇作为第二聚簇,将第一聚簇中的每个数据点合并到距离第一聚簇中每个数据点最近的第二聚簇中;将大于第二预设阈值的初始聚簇作为第三聚簇,对每个第三聚簇中的所有数据点进行聚类,将每个第三聚簇分成两个初始聚簇。
需要说明的是,距离第一聚簇中每个数据点最近的第二聚簇的获取方法为,计算第一聚簇中一个数据点到所有第二聚簇的质心的距离,将其中最小的距离对应的第二聚簇作为距离该数据点最近的第二聚簇。
特征地,在对初始聚簇进行分散合并更新操作的过程中,先进行所有第一聚簇中数据点到第二聚簇的合并,再获取所有第三聚簇,将每个第三聚簇分成两个初始聚簇。
至此,实现了对初始聚簇的分散合并更新操作。
S004.获取数据点的异常水平。
将经过分散合并更新操作之后的初始聚簇作为目标聚簇,利用步骤S002中的方法对目标聚簇进行收缩更新操作,获取每个目标聚簇的异常指标以及每个数据点在对应目标聚簇中的异常程度。
需要说明的是,对于一个数据点来说,同一个数据点所在初始聚簇和目标聚簇可能不同,或同一个数据点所在的初始聚簇与目标聚簇相同,但对应的初始聚簇的异常指标与目标聚簇的异常指标不同,进一步使得该数据点在对应初始聚簇中的异常程度与该数据点在对应目标聚簇中的异常程度不同。初始聚簇的异常指标与目标聚簇的异常指标之间的关系,以及数据点在对应初始聚簇中的异常程度与该数据点在对应目标聚簇中的异常程度之间的关系反应了数据点的整体的异常水平。
在本实施例中,数据点的异常水平的表达式为:
其中为第个数据点的异常水平;为第个数据点所在的初始聚簇的异常指标;为第个数据点所在的目标聚簇的异常指标;为第个数据点在对应初始聚簇中的异常程度;为第个数据点在对应目标聚簇中的异常程度;表示第个数据点所在的初始聚簇的异常指标与目标聚簇的异常指标之间的差异,越大,表示第个数据点在聚簇中越不稳定,此时第个数据点的异常水平越大。
至此,获取了数据点的异常水平。需要说明的是,本实施例通过分析聚簇分散合并更新操作过程中同一数据点所在不同聚簇之间的关系,根据聚簇分散合并更新操作过程中聚簇的变化所反映的聚簇稳定性,获取对应数据点的异常水平,避免了聚簇大小对聚簇中数据点异常识别的影响。
S005.获取每个数据点的异常特征值,根据异常特征值获取异常数据。
需要说明的是,为了进一步分析分散合并更新操作对数据点异常水平的影响,需要进行多次迭代操作。
在本实施例中,将目标聚簇作为新的初始聚簇,对新的初始聚簇重复步骤S003、S004直到达到第二预设次数时停止迭代,每个数据点在每次迭代过程中均得到一个异常水平。在本实施例中,第二预设次数,在其他实施例中,实施人员可根据需要设置的值。
根据每个数据点的所有异常水平获取每个数据点的异常特征值。数据点的异常特征值的表达式为:
其中为为第个数据点的异常特征值;为第次迭代时第个数据点的异常水平;为第次迭代时第个数据点所在的初始聚簇中数据点的集合;为第次迭代时第个数据点所在的目标聚簇中数据点的集合;为交集符号;为中包含的数据点的数量;为第二预设次数;为与的交集中包含的数据点的数量,即第次迭代时第个数据点所在目标聚簇中包含的第个数据点所在初始聚簇中数据点的数量;所以表示第次迭代时第个数据点所在目标聚簇保持第个数据点所在初始聚簇的程度,越大,表示第次迭代对第个数据点所在的聚簇的影响越小,说明第个数据点与所在的聚簇的聚集关系越强,因此第次迭代时第个数据点异常水平的可信度较低,此时将作为的权重,表示第次迭代时第个数据点的异常特征值,则表示次迭代之后第个数据点的总的异常特征值,即对应第个数据点的异常特征值。
至此,获取了每个数据点的异常特征值。需要说明的是,本实施例通过多次聚簇分散合并更新操作以及聚簇收缩更新操作,根据数据点在每次迭代过程中所在初始聚簇与目标聚簇包含的数据点的差异以及数据点在每次迭代过程中的异常水平获取数据点的异常特征值,避免了单次迭代得到的异常水平对聚簇大小的依赖性,通过多次迭代反应出数据点与聚簇的聚集关系,从而使得数据点的异常特征值更加准确,进一步使得后续根据异常特征值筛选出的异常数据更加可信。
根据数据点的异常特征值识别人体阻抗数据中的异常数据,具体过程为:
首先将所有数据点的异常特征值利用最大值最小值归一化的方法进行归一化,得到每个数据点归一化后的异常特征值。当数据点归一化后的异常特征值大于第三预设阈值时,该数据点为异常数据;当数据点归一化后的异常特征值小于或等于第三预设阈值时,该数据点非异常数据。在本实施例中,在其他实施例中实施人员可根据需要设置的值。
至此,完成了人体阻抗数据中异常数据的识别。
需要说明的是,人体阻抗数据为人体电阻抗分析所需的数据,即测定的电流强度数据。此时为了利用电流强度数据准确的对人体电阻抗进行分析,需要排除异常值(粗差)的影响,在实施例中直接剔除所识别到的异常数据,然后利用剩余的正常数据进行人体电阻抗分析,进而根据人体电阻抗进行人体指标异常分析。
通过以上步骤,完成了人体阻抗数据的异常识别。
本发明实施例通过在聚簇收缩更新操作过程中根据收缩次序设置权值获取聚簇的异常指标,使得聚簇的异常指标在反应聚簇整体的异常情况时,同时能够体现引起聚簇异常的数据点的存在,从而便于聚簇中异常数据点的识别;聚簇大小对聚簇中数据点的异常识别有一定程度的影响,本发明通过分析聚簇分散合并更新操作过程中同一数据点所在不同聚簇之间的关系,根据聚簇分散合并更新操作过程中聚簇的变化所反映的聚簇稳定性,获取对应数据点的异常水平,避免了聚簇大小对聚簇中数据点异常识别的影响;本发明在计算数据点在对应的聚簇中的异常程度时,考虑了聚簇本身的聚集特点的同时引入数据点的时间序列相关性,加强了人体阻抗数据在时间序列上的关系对数据异常的影响,使得结果更加准确;本发明通过多次聚簇分散合并更新操作以及聚簇收缩更新操作,根据数据点在每次迭代过程中所在初始聚簇与目标聚簇包含的数据点的差异以及数据点在每次迭代过程中的异常水平获取数据点的异常特征值,避免了单次迭代得到的异常水平对聚簇大小的依赖性,通过多次迭代反应出数据点与聚簇的聚集关系,从而使得数据点的异常特征值更加准确,进一步使得根据异常特征值筛选出的异常数据更加可信,进一步使得人体电阻抗分析的结果更加准确。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于人体无创采集数据的人体指标异常分析方法,其特征在于,该方法包括以下步骤:
S1:采集人体阻抗数据;对人体阻抗数据进行聚类,得到多个聚簇,记为初始聚簇;
S2:对所有初始聚簇进行收缩更新操作,包括:获取每个初始聚簇的代表点,对每个初始聚簇的代表点进行收缩,根据收缩后的代表点进行初始聚簇的更新;
S3:重复S2直到达到第一预设次数时停止,根据每次收缩更新操作中每个初始聚簇包含的数据点的数量,获取每个初始聚簇的异常指标;根据每个初始聚簇的异常指标获取每个数据点在对应初始聚簇中的异常程度;
S4:对所有初始聚簇进行分散合并更新操作,包括:将数据点数量小于第一预设阈值的初始聚簇中的数据点合并到其他初始聚簇中,将数据点数量大于第二预设阈值的初始聚簇分成两个初始聚簇;
S5:将分散合并更新操作后的初始聚簇作为目标聚簇,对目标聚簇执行步骤S2-S3,得到每个目标聚簇的异常指标以及每个数据点在对应目标聚簇中的异常程度;根据每个初始聚簇的异常指标、每个目标聚簇的异常指标、每个数据点在对应初始聚簇中的异常程度以及每个数据点在对应目标聚簇中的异常程度获取每个数据点的异常水平;
S6:将目标聚簇作为新的初始聚簇,对新的初始聚簇重复S4-S5直到达到第二预设次数时停止迭代,每个数据点在每次迭代过程中均得到一个异常水平;
S7:根据每个数据点的所有异常水平获取每个数据点的异常特征值,根据异常特征值获取异常数据。
2.根据权利要求1所述的一种基于人体无创采集数据的人体指标异常分析方法,其特征在于,所述获取每个初始聚簇的代表点,对每个初始聚簇的代表点进行收缩,根据收缩后的代表点进行初始聚簇的更新包括:
选择初始聚簇中距离质心最远的数据点作为第一个点,然后依次选择距离已选到的数据点最远的数据点,直到选到预设数量个数据点时停止,将选择的所有数据点作为代表点,将每个代表点向初始聚簇质心按照预设比例进行收缩;将其余每个数据点分配给距离所述其余每个数据点最近的代表点所在的初始聚簇。
5.根据权利要求1所述的一种基于人体无创采集数据的人体指标异常分析方法,其特征在于,所述将数据点数量小于第一预设阈值的初始聚簇中的数据点合并到其他初始聚簇中,将数据点数量大于第二预设阈值的初始聚簇分成两个初始聚簇包括:
将数据点数量小于第一预设阈值的初始聚簇作为第一聚簇,将数据点数量大于或等于第一预设阈值的初始聚簇作为第二聚簇,将第一聚簇中的每个数据点合并到距离所述每个数据点最近的第二聚簇中;将大于第二预设阈值的聚簇作为第三聚簇,对每个第三聚簇中的所有数据点进行聚类,将每个第三聚簇分成两个初始聚簇。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310102057.1A CN115798724B (zh) | 2023-02-13 | 2023-02-13 | 一种基于人体无创采集数据的人体指标异常分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310102057.1A CN115798724B (zh) | 2023-02-13 | 2023-02-13 | 一种基于人体无创采集数据的人体指标异常分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115798724A CN115798724A (zh) | 2023-03-14 |
CN115798724B true CN115798724B (zh) | 2023-04-11 |
Family
ID=85430931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310102057.1A Active CN115798724B (zh) | 2023-02-13 | 2023-02-13 | 一种基于人体无创采集数据的人体指标异常分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115798724B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116597187B (zh) * | 2023-07-17 | 2023-09-08 | 山东宇信铸业有限公司 | 一种高纯生铁制备过程的数据分析方法 |
CN116628289B (zh) * | 2023-07-25 | 2023-12-01 | 泰能天然气有限公司 | 一种供暖系统运行数据处理方法及策略优化系统 |
CN116705337B (zh) * | 2023-08-07 | 2023-10-27 | 山东第一医科大学第一附属医院(山东省千佛山医院) | 一种健康数据采集及智能分析方法 |
CN116882850B (zh) * | 2023-09-08 | 2023-12-12 | 山东科技大学 | 一种基于大数据的园林数据智能管理方法以及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6049797A (en) * | 1998-04-07 | 2000-04-11 | Lucent Technologies, Inc. | Method, apparatus and programmed medium for clustering databases with categorical attributes |
CN111198979A (zh) * | 2019-12-31 | 2020-05-26 | 中国电力科学研究院有限公司 | 一种用于对输变电可靠性评估大数据进行清洗的方法及系统 |
WO2021077761A1 (zh) * | 2019-10-23 | 2021-04-29 | 江苏智通交通科技有限公司 | 基于层次聚类的路口异常车辆轨迹识别分析方法 |
CN112783725A (zh) * | 2021-01-26 | 2021-05-11 | 中国工商银行股份有限公司 | 指标采集方法及装置 |
CN113850305A (zh) * | 2021-09-10 | 2021-12-28 | 广东核电合营有限公司 | 一种发电机故障诊断与健康状态评估方法和电子设备 |
CN115454779A (zh) * | 2022-09-28 | 2022-12-09 | 建信金融科技有限责任公司 | 基于聚类分析的云监控流数据检测方法、装置及存储介质 |
CN115662625A (zh) * | 2022-09-19 | 2023-01-31 | 国民康源科技有限公司 | 基于app的多参数生命特征监测管理方法及监测仪 |
-
2023
- 2023-02-13 CN CN202310102057.1A patent/CN115798724B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6049797A (en) * | 1998-04-07 | 2000-04-11 | Lucent Technologies, Inc. | Method, apparatus and programmed medium for clustering databases with categorical attributes |
WO2021077761A1 (zh) * | 2019-10-23 | 2021-04-29 | 江苏智通交通科技有限公司 | 基于层次聚类的路口异常车辆轨迹识别分析方法 |
CN111198979A (zh) * | 2019-12-31 | 2020-05-26 | 中国电力科学研究院有限公司 | 一种用于对输变电可靠性评估大数据进行清洗的方法及系统 |
CN112783725A (zh) * | 2021-01-26 | 2021-05-11 | 中国工商银行股份有限公司 | 指标采集方法及装置 |
CN113850305A (zh) * | 2021-09-10 | 2021-12-28 | 广东核电合营有限公司 | 一种发电机故障诊断与健康状态评估方法和电子设备 |
CN115662625A (zh) * | 2022-09-19 | 2023-01-31 | 国民康源科技有限公司 | 基于app的多参数生命特征监测管理方法及监测仪 |
CN115454779A (zh) * | 2022-09-28 | 2022-12-09 | 建信金融科技有限责任公司 | 基于聚类分析的云监控流数据检测方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115798724A (zh) | 2023-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115798724B (zh) | 一种基于人体无创采集数据的人体指标异常分析方法 | |
WO2022110557A1 (zh) | 一种台区户变关系异常诊断方法及装置 | |
WO2021226778A1 (zh) | 一种基于层次图卷积神经网络的癫痫脑电识别系统、终端及存储介质 | |
CN108073158A (zh) | 基于pca和knn密度算法风电机组轴承故障诊断方法 | |
CN105260598A (zh) | 口腔诊疗决策支持系统及决策方法 | |
CN111553127A (zh) | 一种多标记的文本类数据特征选择方法及装置 | |
WO2017101529A1 (zh) | 心电导联智能选择方法和系统 | |
CN113112374A (zh) | 一种基于机器学习算法的空巢用户用电异常检测方法 | |
CN112426160A (zh) | 一种心电信号类型识别方法及装置 | |
CN110141220A (zh) | 基于多模态融合神经网络的心肌梗死自动检测方法 | |
CN112911627B (zh) | 无线网络性能检测方法、装置以及存储介质 | |
CN112732748B (zh) | 一种基于自适应特征选择的非侵入式家电负荷识别方法 | |
CN117077044B (zh) | 一种发电机用真空断路器故障判别方法及装置 | |
CN116148656B (zh) | 一种便携式模拟断路器故障检测方法 | |
CN115015683B (zh) | 电缆生产的性能测试方法、装置、设备及存储介质 | |
CN107480426B (zh) | 自迭代病历档案聚类分析系统 | |
CN116564409A (zh) | 基于机器学习的转移性乳腺癌转录组测序数据识别方法 | |
CN113125903A (zh) | 线损异常检测方法、装置、设备及计算机可读存储介质 | |
CN116313132A (zh) | 一种慢性疾病医疗管理系统 | |
CN116404186A (zh) | 一种功率型锂锰电池生产系统 | |
CN116520068B (zh) | 一种电力数据的诊断方法、装置、设备及存储介质 | |
CN116975672B (zh) | 一种煤矿皮带输送电机温度监测方法及系统 | |
CN110974220A (zh) | 一种脑电波骨髓细胞分类计数系统及方法 | |
CN116664585A (zh) | 基于深度学习的头皮健康状况检测方法及相关装置 | |
JP2015032013A (ja) | 数値データ解析装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |