CN117747094A - 一种妇科疾病临床体征数据的异常检测方法 - Google Patents
一种妇科疾病临床体征数据的异常检测方法 Download PDFInfo
- Publication number
- CN117747094A CN117747094A CN202410191023.9A CN202410191023A CN117747094A CN 117747094 A CN117747094 A CN 117747094A CN 202410191023 A CN202410191023 A CN 202410191023A CN 117747094 A CN117747094 A CN 117747094A
- Authority
- CN
- China
- Prior art keywords
- sign data
- data
- local
- abnormality
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 106
- 238000001514 detection method Methods 0.000 title claims abstract description 46
- 201000010099 disease Diseases 0.000 title claims abstract description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 19
- 230000005856 abnormality Effects 0.000 claims abstract description 111
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000008569 process Effects 0.000 claims description 7
- 238000002955 isolation Methods 0.000 description 7
- 230000036541 health Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013399 early diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Complex Calculations (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种妇科疾病临床体征数据的异常检测方法,包括:确定每个体征数据在每个局部范围内的局部波动程度,确定每个体征数据在数值孤立森林中的异常得分和在每个局部范围的异常得分,根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,根据每个体征数据在数值孤立森林中的异常得分和在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率,进而确定所有体征数据中的异常数据和正常数据。本发明能够确保获得的异常数据包括在数值层面上存在异常的数据和在局部波动程度层面存在异常的数据,进而提高体征数据的异常检测结果的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种妇科疾病临床体征数据的异常检测方法。
背景技术
对妇科疾病的临床体征数据进行异常检测有助于实现早期诊断、个性化治疗、监测病情、防止并发症,并提高医疗效率,对于改善患者的生活质量、提高治疗成功率以及减轻医疗系统的负担都具有积极的影响。
常规对体征数据进行异常检测是通过设置体征数据的上下限,将超出上下限的体征数据作为异常数据,此时获得的异常数据只能体现体征数据在数值层面上的异常情况,导致异常检测结果不准确。
综上,亟需一种新的妇科疾病临床体征数据的异常检测方法。
发明内容
有鉴于此,本发明实施例提供了一种妇科疾病临床体征数据的异常检测方法,以解决通过设置体征数据的上下限进行异常检测时,只能体现体征数据在数值层面上的异常情况,导致异常检测结果不准确的问题。
本发明实施例中提供了一种妇科疾病临床体征数据的异常检测方法,所述异常检测方法包括:
采集妇科患者的体征数据序列,所述体征数据序列包括每个时刻的体征数据;
获取每个体征数据的多个局部范围,根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度;
将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,获得数值孤立森林,确定每个体征数据在数值孤立森林中的异常得分;
将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,获得每个局部范围内的局部波动程度孤立森林,确定每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分,记为每个体征数据在每个局部范围的异常得分;
根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分;
根据每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率;
根据体征数据是异常数据的概率,确定所有体征数据中的异常数据和正常数据。
进一步地,所述获取每个体征数据的多个局部范围,包括:
对于每个体征数据,将该体征数据以及与该体征数据相邻的2k个体征数据,组成该体征数据的第k个局部范围,其中,k取遍预设范围内的所有整数,预设范围为[1,K],K表示预设数值。
进一步地,所述根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度,包括:
式中,表示第i个体征数据在第k个局部范围内的局部波动程度,/>表示第i个体征数据的第k个局部范围内所有体征数据的最大值,/>表示第i个体征数据的第k个局部范围内所有体征数据的最小值,/>表示第i个体征数据,/>表示第i个体征数据的第k个局部范围内所有体征数据的均值,/>表示第i个体征数据的第k个局部范围内所有体征数据的方差。
进一步地,所述将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,获得数值孤立森林,确定每个体征数据在数值孤立森林中的异常得分,包括:
将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,通过随机选取阈值生成多个孤立树,记为数值孤立树,将生成的所有数值孤立树组成的孤立森林记为数值孤立森林,获得每个体征数据在每个数值孤立树上的异常得分,将每个体征数据在所有数值孤立树上的异常得分的平均值,记为每个体征数据在数值孤立森林中的异常得分。
进一步地,所述将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,获得每个局部范围内的局部波动程度孤立森林,包括:
将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,通过随机选取阈值生成每个局部范围的多个孤立树,记为每个局部范围内的局部波动程度孤立树,将每个局部范围的所有局部波动程度孤立树组成的孤立森林,记为每个局部范围内的局部波动程度孤立森林。
进一步地,所述确定每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分,包括:
获取每个体征数据在每个局部范围的每个局部波动程度孤立树上的异常得分,将每个体征数据在每个局部范围的所有局部波动程度孤立树上的异常得分的平均值,作为每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分。
进一步地,所述根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,包括:
式中,表示第i个体征数据在局部波动程度孤立森林中的异常得分,k表示第k个局部范围的序号,/>表示第k个局部范围的大小,/>表示第i个体征数据在第k个局部范围的异常得分,K表示预设数值,/>表示第i个体征数据在第k个局部范围调整后的异常得分。
进一步地,所述根据每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率,包括:
将每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分中的最大值,作为每个体征数据是异常数据的概率。
进一步地,所述根据体征数据是异常数据的概率,确定所有体征数据中的异常数据和正常数据,包括:
若体征数据是异常数据的概率大于预设阈值Y,则该体征数据是异常数据;
若体征数据是异常数据的概率小于或者等于预设阈值Y,则该体征数据是正常数据。
本发明实施例至少具有如下有益效果:本发明根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度,确定每个体征数据在数值孤立森林中的异常得分和在每个局部范围的异常得分,根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,体征数据在数值孤立森林中的异常得分和在局部波动程度孤立森林中的异常得分,表征体征数据在数值层面的异常程度和在局部波动程度层面的异常程度,根据体征数据在数值孤立森林中的异常得分和在局部波动程度孤立森林中的异常得分确定每个体征数据是异常数据的概率,能够确保根据体征数据是异常数据的概率检测出的异常数据,包括在数值层面上存在异常的数据和在局部波动程度层面存在异常的数据,即包括超出正常范围和不稳定的异常体征数据,进而提高体征数据的异常检测结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明实施例提供的一种妇科疾病临床体征数据的异常检测方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种妇科疾病临床体征数据的异常检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种妇科疾病临床体征数据的异常检测方法的具体方案。
人体状态处于健康时,人体的体征数据正常,因此,可以通过判断体征数据是否异常,来判断人体是否健康。常规对体征数据进行异常检测是通过判断体征数据是否超出正常范围,主要通过设置体征数据的上限和下限,将大于上限和小于下限的体征数据作为异常数据;这种方法获得的异常数据只能体现体征数据在数值层面上的异常情况,而体征数据属于时序数据,对于某些时刻的体征数据,虽然该体征数据在数值层面上并没有超出上下限,但是该体征数据的局部范围内体征数据的波动程度很大,此时人体的体征数据不稳定,说明人体状态存在异常,此时该体征数据也属于异常数据;因此,只通过设置体征数据的上下限来获取异常数据,会导致在局部范围的波动程度存在异常的体征数据被错误的识别为正常数据,导致体征数据的异常检测结果不准确,进而导致无法准确判断人体的健康状态。
因此,本实施例根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度,根据体征数据的数值确定每个体征数据在数值层面的异常程度,根据体征数据在每个局部范围内的局部波动程度,确定每个体征数据在局部波动程度层面的异常程度,根据体征数据在数值层面的异常程度和在局部波动程度层面的异常程度,确定每个体征数据是异常数据的概率,能够确保根据体征数据是异常数据的概率检测出异常数据,既包括在数值层面上存在异常的数据,也包括在局部波动程度层面存在异常的数据,进而提高体征数据的异常检测结果的准确性。
请参阅图1,其示出了本发明一个实施例提供的一种妇科疾病临床体征数据的异常检测方法的步骤流程图,该方法包括以下步骤:
步骤S001、采集妇科患者的体征数据序列。
在一些实现中,人体状态处于健康时,人体的体征数据正常,因此,可以通过判断体征数据是否异常,来判断人体是否健康。对妇科疾病的临床体征数据进行异常检测有助于实现早期诊断、个性化治疗、监测病情、防止并发症,并提高医疗效率,对于改善患者的生活质量、提高治疗成功率以及减轻医疗系统的负担都具有积极的影响。
具体的,通过监测仪采集妇科患者在每个时刻的体征数据,所有时刻的体征数据组成体征数据序列,所述体征数据序列包括每个时刻的体征数据;体征数据包括但不限于血压数据、体温数据、心率数据等。
采样频率为每5秒采集一次,采样周期为10分钟。
步骤S002、根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度。
在一些实现中,由于人体体征在短时间内的相对稳定,因此,正常情况下,每个体征数据与该体征数据的局部范围内的其他体征数据接近,即每个体征数据与该体征数据的局部范围内的其他体征数据的差异较小;如果某个体征数据与该体征数据的局部范围内的其他体征数据的差异较大,此时人体体征在短时间内的不稳定,局部范围内体征数据的波动程度较大,则说明该体征数据为异常数据;因此,本实施例通过每个体征数据与每个体征数据的局部范围内所有体征数据的均值的差异,以及每个体征数据的局部范围内所有体征数据的分布的波动情况,确定个体征数据的局部波动程度,后续通过局部波动程度来判断体征数据在局部范围层面是否为异常数据。
在一些实现中,在确定体征数据的局部波动程度时,体征数据的局部范围的大小不同,则体征数据的局部波动程度所反映的体征数据的异常程度不同,因此,本实施例获取在体征数据在不同大小的局部范围的局部波动程度。
具体的,对于每个体征数据,将该体征数据以及与该体征数据相邻的2k个体征数据,组成该体征数据的第k个局部范围,其中,k取遍预设范围内的所有整数,预设范围为[1,K],K表示预设数值,实施人员可根据实际实施情况设置数值K,例如K=15。
进一步,根据每个体征数据的每个局部范围内,所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度,具体计算公式为:
式中,表示第i个体征数据在第k个局部范围内的局部波动程度,/>表示第i个体征数据的第k个局部范围内所有体征数据的最大值,/>表示第i个体征数据的第k个局部范围内所有体征数据的最小值,/>表示第i个体征数据,/>表示第i个体征数据的第k个局部范围内所有体征数据的均值,/>表示第i个体征数据的第k个局部范围内所有体征数据的方差。
可以理解的是,代表了第i个体征数据的第k个局部范围内所有体征数据的分布范围,该值越大,则分布范围越大,此时第i个体征数据在第k个局部范围内的局部波动程度越大;/>代表第i个体征数据与第i个体征数据的第k个局部范围内所有体征数据的均值的差异,该值越大,则第i个体征数据的第k个局部范围内的数据分布越离散,此时第i个体征数据在第k个局部范围内的局部波动程度越大;第i个体征数据的第k个局部范围内所有体征数据的方差代表了第i个体征数据的第k个局部范围内所有体征数据的分布差异,该值越大,此时第i个体征数据在第k个局部范围内的局部波动程度越大。
步骤S003、确定每个体征数据在数值孤立森林中的异常得分和在每个局部范围的异常得分,根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,根据每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率。
在一些实现中,由于人体的体征数据正常表现在两个方面,分别为:人体体征在正常范围内且在短时间内的相对稳定,因此,判断体征数据是否为异常数据也要从两个方面来判断,分别为:人体体征是否超出正常范围,以及体征数据在短时间内的波动程度是否较大;只通过设置体征数据的上下限来获取异常数据,会导致在局部范围的波动程度存在异常的体征数据被错误的识别为正常数据,导致体征数据的异常检测结果不准确,进而导致无法准确判断人体的健康状态。因此,本实施例分别根据体征数据的数值以及体征数据在多个局部范围内的局部波动程度作为孤立森林异常检测算法的样本,分别获得体征数据在数值层面的异常程度和体征数据在局部波动程度层面的异常程度,根据体征数据在数值方面的异常程度和体征数据在局部波动程度方面的异常程度获得异常数据,检测出在数值层面和局部波动程度层面存在异常的异常数据,提高体征数据的异常检测结果的准确性。
1、将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,确定每个体征数据在数值孤立森林中的异常得分。
具体的,将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,通过随机选取阈值生成多个孤立树,记为数值孤立树,将生成的所有数值孤立树组成的孤立森林记为数值孤立森林,获得每个体征数据在每个数值孤立树上的异常得分,将每个体征数据在所有数值孤立树上的异常得分的平均值,记为每个体征数据在数值孤立森林中的异常得分。
需要说明的是,孤立森林异常检测算法为公知技术,通过随机选取阈值生成多个孤立树和获得体征数据在孤立树上的异常得分,均为孤立森林异常检测算法中的公知步骤,此处不再进行赘述。
在一些实现中,体征数据在数值孤立森林中的异常得分代表了体征数据在数值方面的异常程度。
2、将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,确定每个体征数据在每个局部范围的异常得分,根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分。
在一些实现中,虽然人体体征在短时间内的相对稳定,但是人的某些正常行为会导致体征数据产生波动,正常行为导致的波动会持续一段时间;而人体健康状况异常导致的数据波动时突发性的,因此,健康状况异常导致的数据波动的特征为:较短的时间内出现较大的波动;因此,体征数据在不同局部范围的局部波动程度反映的异常程度不同;为了使体征数据在不同局部范围的异常得分能够准确反映体征数据在不同局部范围的异常程度,需要通过局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,最终根据调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,即体征数据在局部波动程度层面的异常程度。
具体的,将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,通过随机选取阈值生成每个局部范围的多个孤立树,记为每个局部范围内的局部波动程度孤立树,将每个局部范围的所有局部波动程度孤立树组成的孤立森林,记为每个局部范围内的局部波动程度孤立森林。
进一步,获取每个体征数据在每个局部范围的每个局部波动程度孤立树上的异常得分,将每个体征数据在每个局部范围的所有局部波动程度孤立树上的异常得分的平均值,作为每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分,记为每个体征数据在每个局部范围的异常得分。
进一步,根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,具体计算公式为:
式中,表示第i个体征数据在局部波动程度孤立森林中的异常得分,k表示第k个局部范围的序号,/>表示第k个局部范围的大小,/>表示第i个体征数据在第k个局部范围的异常得分,K表示预设数值,共有K个局部范围,/>表示第i个体征数据在第k个局部范围调整后的异常得分。
可以理解的是,由于人的某些正常行为会导致体征数据在较长的一段时间内产生波动,此时体征数据的波动程度虽然较大,但是人体并没有出现异常,因此体征数据人为正常数据;为了使体征数据在不同局部范围的异常得分能够准确反映体征数据在不同局部范围的异常程度,通过局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,当局部范围较大时,体征数据在该局部范围的局部波动程度虽然较大,但是并不是由于数据异常导致的,因此,需要将体征数据在该局部范围的异常得分调整的较小,此时,本实施例通过将伽马变换对体征数据在该局部范围的异常得分进行调整,将局部范围的大小作为伽马系数,由于体征数据在每个局部范围的异常得分在[0,1]范围内,此时伽马系数越大,则通过伽马变化调整后的异常得分/>越小。
3、根据每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率。
在一些实现中,体征数据在数值孤立森林中的异常得分代表了体征数据在数值层面的异常程度,体征数据在局部波动程度孤立森林中的异常得分代表了体征数据在局部波动程度层面的异常程度;通过选取体征数据在数值层面的异常程度和在局部波动程度层面的异常程度中的最大值,作为体征数据是异常数据的概率,能够确保根据体征数据是异常数据的概率检测出的异常数据,既包括在数值层面上存在异常的数据,也包括在局部波动程度层面存在异常的数据,进而提高体征数据的异常检测结果的准确性。
具体的,将每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分中的最大值,作为每个体征数据是异常数据的概率,具体计算公式为:
式中,表示第i个体征数据是异常数据的概率,/>表示第i个体征数据在数值孤立森林中的异常得分,/>表示第i个体征数据在局部波动程度孤立森林中的异常得分,/>表示取最大值函数。
步骤S004、根据体征数据是异常数据的概率,确定所有体征数据中的异常数据和正常数据。
具体的,若体征数据是异常数据的概率大于预设阈值Y,则该体征数据是异常数据,若体征数据是异常数据的概率小于或者等于预设阈值Y,则该体征数据是正常数据,实施人员可根据实际实施情况设置阈值Y,例如Y=0.75。
进一步,若连续的异常数据的数量大于预设数量S,说明在较长一段时间内,人体的体征数据一直存在异常,则人体的健康状态较差,若连续的异常数据的数量小于或者等于预设数量,说明人体的体征数据发生异常的时间较短,则人体的健康状态良好,实施人员可根据实际实施情况设置数量S,例如S=20。
综上所述,本发明根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度,确定每个体征数据在数值孤立森林中的异常得分和在每个局部范围的异常得分,根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,体征数据在数值孤立森林中的异常得分和在局部波动程度孤立森林中的异常得分,表征体征数据在数值层面的异常程度和在局部波动程度层面的异常程度,根据体征数据在数值孤立森林中的异常得分和在局部波动程度孤立森林中的异常得分确定每个体征数据是异常数据的概率,能够确保根据体征数据是异常数据的概率检测出的异常数据,包括在数值层面上存在异常的数据和在局部波动程度层面存在异常的数据,即包括超出正常范围和不稳定的异常体征数据,进而提高体征数据的异常检测结果的准确性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述方法包括:
采集妇科患者的体征数据序列,所述体征数据序列包括每个时刻的体征数据;
获取每个体征数据的多个局部范围,根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度;
将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,获得数值孤立森林,确定每个体征数据在数值孤立森林中的异常得分;
将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,获得每个局部范围内的局部波动程度孤立森林,确定每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分,记为每个体征数据在每个局部范围的异常得分;
根据每个局部范围的大小对每个体征数据在每个局部范围的异常得分进行调整,根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分;
根据每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率;
根据体征数据是异常数据的概率,确定所有体征数据中的异常数据和正常数据。
2.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述获取每个体征数据的多个局部范围,包括:
对于每个体征数据,将该体征数据以及与该体征数据相邻的2k个体征数据,组成该体征数据的第k个局部范围,其中,k取遍预设范围内的所有整数,预设范围为[1,K],K表示预设数值。
3.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述根据每个体征数据的每个局部范围内所有体征数据的分布情况以及所有体征数据之间的差异,确定每个体征数据在每个局部范围内的局部波动程度,包括:
式中,表示第i个体征数据在第k个局部范围内的局部波动程度,/>表示第i个体征数据的第k个局部范围内所有体征数据的最大值,/>表示第i个体征数据的第k个局部范围内所有体征数据的最小值,/>表示第i个体征数据,/>表示第i个体征数据的第k个局部范围内所有体征数据的均值,/>表示第i个体征数据的第k个局部范围内所有体征数据的方差。
4.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,获得数值孤立森林,确定每个体征数据在数值孤立森林中的异常得分,包括:
将所有体征数据的数值作为样本输入到孤立森林异常检测算法中,通过随机选取阈值生成多个孤立树,记为数值孤立树,将生成的所有数值孤立树组成的孤立森林记为数值孤立森林,获得每个体征数据在每个数值孤立树上的异常得分,将每个体征数据在所有数值孤立树上的异常得分的平均值,记为每个体征数据在数值孤立森林中的异常得分。
5.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,获得每个局部范围内的局部波动程度孤立森林,包括:
将所有体征数据在每个局部范围内的局部波动程度作为样本输入到孤立森林异常检测算法中,通过随机选取阈值生成每个局部范围的多个孤立树,记为每个局部范围内的局部波动程度孤立树,将每个局部范围的所有局部波动程度孤立树组成的孤立森林,记为每个局部范围内的局部波动程度孤立森林。
6.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述确定每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分,包括:
获取每个体征数据在每个局部范围的每个局部波动程度孤立树上的异常得分,将每个体征数据在每个局部范围的所有局部波动程度孤立树上的异常得分的平均值,作为每个体征数据在每个局部范围内的局部波动程度孤立森林中的异常得分。
7.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述根据每个体征数据在每个局部范围调整后的异常得分,获得每个体征数据在局部波动程度孤立森林中的异常得分,包括:
式中,表示第i个体征数据在局部波动程度孤立森林中的异常得分,k表示第k个局部范围的序号,/>表示第k个局部范围的大小,/>表示第i个体征数据在第k个局部范围的异常得分,K表示预设数值,/>表示第i个体征数据在第k个局部范围调整后的异常得分。
8.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述根据每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分,确定每个体征数据是异常数据的概率,包括:
将每个体征数据在数值孤立森林中的异常得分和每个体征数据在局部波动程度孤立森林中的异常得分中的最大值,作为每个体征数据是异常数据的概率。
9.根据权利要求1所述的一种妇科疾病临床体征数据的异常检测方法,其特征在于,所述根据体征数据是异常数据的概率,确定所有体征数据中的异常数据和正常数据,包括:
若体征数据是异常数据的概率大于预设阈值Y,则该体征数据是异常数据;
若体征数据是异常数据的概率小于或者等于预设阈值Y,则该体征数据是正常数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410191023.9A CN117747094A (zh) | 2024-02-21 | 2024-02-21 | 一种妇科疾病临床体征数据的异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410191023.9A CN117747094A (zh) | 2024-02-21 | 2024-02-21 | 一种妇科疾病临床体征数据的异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117747094A true CN117747094A (zh) | 2024-03-22 |
Family
ID=90259565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410191023.9A Withdrawn CN117747094A (zh) | 2024-02-21 | 2024-02-21 | 一种妇科疾病临床体征数据的异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117747094A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118568649A (zh) * | 2024-08-02 | 2024-08-30 | 陕西新能选煤技术有限公司 | 一种基于物联网的选煤厂供电能耗监测方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046665A (zh) * | 2019-04-17 | 2019-07-23 | 成都信息工程大学 | 基于孤立森林二分类异常点检测方法、信息数据处理终端 |
CN113724885A (zh) * | 2021-09-27 | 2021-11-30 | 厦门市易联众易惠科技有限公司 | 一种异常体征的识别方法、装置、设备和存储介质 |
CN115510931A (zh) * | 2021-06-07 | 2022-12-23 | 中移(成都)信息通信科技有限公司 | 生成异常检测模型的方法、异常检测方法及电子设备 |
CN115577275A (zh) * | 2022-11-11 | 2023-01-06 | 山东产业技术研究院智能计算研究院 | 一种基于lof和孤立森林的时序数据异常监测系统及方法 |
CN117195139A (zh) * | 2023-11-08 | 2023-12-08 | 北京珺安惠尔健康科技有限公司 | 基于机器学习的慢性病健康数据动态监测方法 |
CN117312997A (zh) * | 2023-11-21 | 2023-12-29 | 乾程电力有限公司 | 一种电力管理系统智能诊断方法及系统 |
-
2024
- 2024-02-21 CN CN202410191023.9A patent/CN117747094A/zh not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046665A (zh) * | 2019-04-17 | 2019-07-23 | 成都信息工程大学 | 基于孤立森林二分类异常点检测方法、信息数据处理终端 |
CN115510931A (zh) * | 2021-06-07 | 2022-12-23 | 中移(成都)信息通信科技有限公司 | 生成异常检测模型的方法、异常检测方法及电子设备 |
CN113724885A (zh) * | 2021-09-27 | 2021-11-30 | 厦门市易联众易惠科技有限公司 | 一种异常体征的识别方法、装置、设备和存储介质 |
CN115577275A (zh) * | 2022-11-11 | 2023-01-06 | 山东产业技术研究院智能计算研究院 | 一种基于lof和孤立森林的时序数据异常监测系统及方法 |
CN117195139A (zh) * | 2023-11-08 | 2023-12-08 | 北京珺安惠尔健康科技有限公司 | 基于机器学习的慢性病健康数据动态监测方法 |
CN117312997A (zh) * | 2023-11-21 | 2023-12-29 | 乾程电力有限公司 | 一种电力管理系统智能诊断方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118568649A (zh) * | 2024-08-02 | 2024-08-30 | 陕西新能选煤技术有限公司 | 一种基于物联网的选煤厂供电能耗监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117747094A (zh) | 一种妇科疾病临床体征数据的异常检测方法 | |
US9357953B2 (en) | System and method for diagnosing sleep apnea | |
US8781753B2 (en) | System and method for evaluating physiological parameter data | |
CN111166294B (zh) | 一种基于心跳间期的睡眠呼吸暂停自动检测方法及装置 | |
CN117786429B (zh) | 基于可穿戴设备的老人健康监测数据处理方法 | |
CN117958835B (zh) | 用于患者术后康复的心电图分析方法 | |
CN117457229A (zh) | 基于人工智能的麻醉深度监测系统及方法 | |
WO2024148726A1 (zh) | 心脏检测评估方法、系统、存储介质及装置 | |
CN113409941A (zh) | Osahs识别方法、模型、模型建立方法、及装置 | |
WO2021184802A1 (zh) | 一种血压分类预测方法和装置 | |
CN118236072A (zh) | 一种用于麻醉过程的患者体征状态监测方法 | |
CN113744865A (zh) | 基于回归分析的压力性损伤风险预测模型校正方法 | |
CN113223713A (zh) | 基于风险评估的动态监护方法、系统以及存储介质 | |
CN111227793B (zh) | 呼吸暂停的识别方法、系统、电子设备及存储介质 | |
CN118571490B (zh) | 基于大数据分析的孕妇孕期健康状态监测方法 | |
CN111956195A (zh) | 一种急性高原病ams智能分析监测装置 | |
CN118197522B (zh) | 一种急诊重症患者生命体征实时监控预警方法及系统 | |
CN117747116B (zh) | 一种产科助产的生理指标智慧预警方法 | |
KR102418339B1 (ko) | 연속혈당 데이터를 이용한 혈당 수치 추출 장치 및 그 방법 | |
CN118299055B (zh) | 一种肝脏护理的健康程度评估方法及系统 | |
CN118471515B (zh) | 一种心脏动态监测与分析方法及监测系统 | |
CN118749932B (zh) | 一种血液透析过程中患者健康数据监测方法及系统 | |
CN116570293B (zh) | 一种房颤消融术后晚期复发风险预测设备、系统及可存储介质 | |
CN117877736B (zh) | 基于机器学习的智能戒指异常健康数据预警方法 | |
CN113951826B (zh) | 一种用于评估睡眠状况的方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20240322 |