CN117542536B

CN117542536B - 一种基于体检数据的智能护理方法及系统

Info

Publication number: CN117542536B
Application number: CN202410033560.0A
Authority: CN
Inventors: 吕美娜; 郗洋; 刘书锋
Original assignee: People's Liberation Army Navy Navy Qingdao Special Service Sanatorium
Current assignee: People's Liberation Army Navy Navy Qingdao Special Service Sanatorium
Priority date: 2024-01-10
Filing date: 2024-01-10
Publication date: 2024-04-12
Anticipated expiration: 2044-01-10
Also published as: CN117542536A

Abstract

本发明涉及聚类算法优化技术领域，具体涉及一种基于体检数据的智能护理方法及系统，包括：获取患者的各项生理指标序列，将生理指标序列均分为多个区域，确定每个区域的数据稳定性；根据每个区域的指标数据均值和数据稳定性确定数据异常度，利用数据异常度差异设置每个区域的权重值；根据每个区域内各个指标数据和权重值确定特征值，进而确定特征相似度；根据特征相似程度自适应确定上限阈值，进而利用Canopy聚类对所有患者进行聚类，获得各个患者聚类簇，并为每个患者制定合适的护理方案。本发明通过自适应确定上限阈值提高了聚类结果的准确性，提升了基于聚类结果为每个患者制定的护理方案的合理性。

Description

一种基于体检数据的智能护理方法及系统

技术领域

本发明涉及聚类算法优化技术领域，具体涉及一种基于体检数据的智能护理方法及系统。

背景技术

目前对护理服务的需求日益增加，传统的护理方法已经无法满足现代社会对个性化、精准化护理的需求，因此，智能护理方法及系统应运而生，成为护理事业发展的重要方向。智能护理是指利用现代科技手段，如物联网、云计算、大数据等，对患者的生理、心理、社会等方面的数据进行收集、分析和处理，为后续的护理工作提供准确、及时、全面的信息支持。例如，根据患者的生理参数、病情变化、用药情况等因素，自动调整护理方案，提高护理效果。

在护理机构中，患者的体检数据包括各种体检指标，如血压、心率、血糖、血脂、肝功能、肾功能等，这些指标可以从不同的角度反映人员的健康状况。根据体检数据反映出的健康状况，可以相应制定合适的护理方案，通常根据所有患者的体检数据对患者进行聚类，以便于将具有相似体检数据特征的患者聚为一类，并为其安排合适的护理方案。现有通常利用Canopy算法进行聚类处理，具体通过人为设置的两个经验值阈值和/>来实现聚类。阈值/>用于确定一个数据是否可以被看作是一个新的聚类中心，人为设置的阈值/>准确度较差，其将导致聚类结果中的聚簇类别数出现偏差，造成聚簇结果准确性低下，进而影响制定的护理方案的合理性。

发明内容

为了解决上述聚类过程中人为设置的阈值准确度较差，导致制定的护理方案合理性低下的技术问题，本发明的目的在于提供一种基于体检数据的智能护理方法及系统，所采用的技术方案具体如下：

本发明一个实施例提供了一种基于体检数据的智能护理方法，该方法包括以下步骤：

获取护理机构中所有患者在预设时段内的各项生理指标序列；

对于任一患者的任一项生理指标序列，将生理指标序列均分为第一预设数目个区域，根据每个区域内各个指标数据确定每个区域的数据稳定性；

根据每个区域的指标数据均值和数据稳定性确定每个区域的数据异常度；

根据相邻区域之间的数据异常度差异设置每个区域的权重值；根据每个区域内各个指标数据和每个区域的权重值，确定患者的生理指标序列的特征值；

获取患者的各项生理指标序列的特征值组成特征值数组；根据各个特征值数组确定每个患者的特征相似程度；

根据每个患者的特征相似程度确定Canopy聚类算法中的上限阈值；设置下限阈值，根据上限阈值和下限阈值，利用Canopy聚类对所有患者进行聚类，获得各个患者聚类簇；

根据各个患者聚类簇为每个患者制定合适的护理方案。

进一步地，根据每个区域内各个指标数据确定每个区域的数据稳定性，包括：

对于任一区域，计算区域内的最后一个指标数据和第一个指标数据之间的差值，对差值进行归一化处理，将归一化后的差值与超参数相加后的数值确定为第一稳定因子；计算区域内相邻两个指标数据之间的差值绝对值，将各个差值绝对值的平均值确定为第二稳定因子；对第一稳定因子和第二稳定因子的乘积进行取反操作，将两个稳定因子的乘积的反比例值作为区域的数据稳定性。

进一步地，根据每个区域的指标数据均值和数据稳定性确定每个区域的数据异常度，包括：

根据每个区域内各个指标数据计算每个区域的指标数据均值，选取最小的指标数据均值；根据每个区域的数据稳定性，选取最小的数据稳定性；

对于任一区域，计算区域的指标数据均值与最小的指标数据均值的差值为第一差值，将第一差值与超参数相加后的数值确定为第一数据异常因子；计算区域的数据稳定性与最小的数据稳定性的差值为第二差值，对第二差值与超参数相加后的数值进行取反处理，将反比例值作为第二数据异常因子；将第一数据异常因子和第二数据异常因子的乘积作为区域的数据异常度。

进一步地，根据相邻区域之间的数据异常度差异设置每个区域的权重值，包括：

根据每个区域的数据异常度计算相邻区域之间的数据异常度差值，获得各个数据异常度差值；根据各个数据异常度差值的正负情况，设置每个区域的权重值。

进一步地，根据各个数据异常度差值的正负情况，设置每个区域的权重值，包括：

当各个数据异常度差值全部为负数时，设置各个区域的权重值按照时间顺序从后往前依次减小；当各个数据异常度差值并非全部为负数时，设置各个区域的权重值按照数据异常度差值大小顺序从大到小依次减小，对于任一数据异常度差值对应的两个区域的权重值，该两个区域中距离最后一个区域最近的区域的权重值较高。

进一步地，根据每个区域内各个指标数据和每个区域的权重值，确定患者的生理指标序列的特征值，包括：

根据每个区域内各个指标数据和每个区域的权重值，将各个指标数据与其对应权重值相乘，将所有相乘后的数值的平均值作为患者的生理指标序列的特征值。

进一步地，根据各个特征值数组确定每个患者的特征相似程度，包括：

对于任一患者，计算患者的特征值数组与除其本身以外的其他各个患者的特征值数组之间的距离，将所有距离的平均值作为患者的特征相似程度。

进一步地，根据每个患者的特征相似程度确定Canopy聚类算法中的上限阈值，包括：

根据每个患者的特征相似程度设置各个相似级别；统计各个相似级别在所有特征相似程度中的出现频率，构建频率分布直方图；其中，频率分布直方图的横轴为相似级别，纵轴为相似级别的出现频率；

计算所有特征相似程度的平均值，在频率分布直方图中，选取和所有特征相似程度的平均值最接近的相似级别作为目标相似级别；在频率分布直方图中，将目标相似级别右侧、第一个出现频率大于目标相似级别的出现频率的相似级别的中位数作为Canopy聚类算法中的上限阈值。

进一步地，根据每个患者的特征相似程度设置各个相似级别，包括：

根据每个患者的特征相似程度确定特征相似程度的最大值和最小值，将最小值到最大值的取值范围均分为第二预设数目个子范围，将子范围确定为相似级别，获得各个相似级别。

本发明一个实施例还提供了一种基于体检数据的智能护理系统，包括处理器和存储器，所述处理器用于处理存储在所述存储器中的指令，以实现一种基于体检数据的智能护理方法。

本发明具有如下有益效果：

本发明提供了一种基于体检数据的智能护理方法及系统，获取患者的各项生理指标序列，为了便于分析不同时段的生理指标数据的控制状况，将生理指标序列均分为多个区域，确定每个区域的数据稳定性，数据稳定性可以反映区域内生理指标数据的波动情况，有利于后续计算数据异常度；根据每个区域内各个指标数据均值和数据稳定性确定数据异常度，在确定数据异常度时，不仅考虑到区域的生理指标数据相对于整体的数值大小水平，还考虑到区域的生理指标数据的波动程度，其有助于提高数据异常度的精确度，便于后续获得可以更准确体现数据特征的特征值；根据相邻区域之间的数据异常度差异设置每个区域的权重值，权重值可以很好的量化患者在不同时段对应的区域内指标数据在分析数据特征时的重要程度，通过确定每个区域的权重值有助于提高确定的患者的每项生理指标的特征值的可靠程度，促使确定的特征值可以更精准地体现患者生理指标数据的数据特征；基于患者对应的特征值数组量化不同患者之间的特征相似程度，其有助于后续自适应确定Canopy聚类算法中的上限阈值，相比传统人为经验设定上限阈值，自适应上限阈值有助于提高聚类结果的准确性，通过准确性更好的聚类结果，有助于为患者制定更合适、更合理的护理方案。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为本发明一种基于体检数据的智能护理方法的流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例。此外，一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

本发明所针对的应用场景可以为：在护理机构中，患者的体检数据包括各项生理指标，为了统一管理护理机构中的所有患者，现有通常根据所有患者的体检数据之间的距离，使用聚类方法对所有患者进行聚类，将具有相似体检数据特征的患者聚为一类，并为其制定合适的护理方案。

为了提高聚类结果的准确性，进而提升患者护理方案制定的合理性，自适应确定聚类算法中用于判断数据是否可以被看作是一个新的聚类中心的上限阈值，具体，本实施例提供了一种基于体检数据的智能护理方法，如图1所示，包括以下步骤：

S1，获取护理机构中所有患者在预设时段内的各项生理指标序列。

在本实施例中，对于某家护理机构而言，分析护理机构内所有患者的生理指标数据，将数据特征相似的患者聚为一类，根据同一聚类簇内患者体检数据反映出的健康状况，统一制定护理方案。患者的体检数据包括各种生理指标，如血压、心率、血糖、血脂、肝功能、肾功能等，这些生理指标可以从不同的角度反映人员的健康状况。

通常人的身体状况会随着时间的变化而发生变化，故需要获取护理机构中每个患者在预设时段内的体检数据，预设时段可以设置为一年；由于护理机构通常需要对患者的健康状况进行日常监测，每个患者可以半个月进行一次常规体检，故每个患者的体检记录数据中包含了24次的常规体检数据，每次的常规体检数据中包含了血压、心率、血糖、血脂、肝功能、肾功能等多项指标数据；将患者在过去一年内的每项指标数据组成序列，可以获得患者对应的各项生理指标序列，例如，血压指标序列、心率指标序列、血糖指标序列等。

其中，体检数据的采集预设时段和采集频率可以由实施者根据具体实际情况设置，这里不做具体限定。

至此，本实施例获得了每个患者对应的各项生理指标序列。

需要说明的是，每个患者的病情以及健康状况不同，各项生理指标的变化情况不同，故可以根据各项生理指标分析每个患者的各项生理指标的特征值，以便于后续根据患者之间的特征相似状况计算Canopy聚类方法中的上限阈值，通过自适应上限阈值对所有患者进行聚类，获得聚类结果，以便于进行合适护理方案的制定。

S2，将生理指标序列均分为第一预设数目个区域，根据每个区域内各个指标数据确定每个区域的数据稳定性。

在本实施例中，以任意一个患者的任意一项生理指标为例确定特征值，由于后续在计算异常度时需要根据生理指标数据的波动情况进行分析，故需要将生理指标序列按照预设周期均分为局部区域，根据局部区域内指标数据波动情况，量化局部区域的数据稳定程度，即确定每个区域的数据稳定性。

任一项生理指标序列可以是血糖指标，根据生理指标序列构建指标波动曲线，按照三个月为一个周期将指标波动曲线划分为四个区域，将预设周期设置为三个月，实施者可以根据具体实际情况设置预设周期确定区域的第一预设数目，这里不做具体限定。根据每个区域内各个指标数据确定每个区域的数据稳定性，具体实现步骤可以包括：

作为示例，计算第i个区域的数据稳定性的计算公式可以为：

；式中，/>为第i个区域的数据稳定性，exp为自然常数为底的指数函数，norm为归一化函数，/>为第i个区域内第/>个指标数据，/>为第i个区域内指标数据的个数，/>为第i个区域内第1个指标数据，超参数为1，/>为第一稳定因子，/>为第i个区域内第/>个指标数据，/>为第i个区域内第j个指标数据，/>为取绝对值函数，/>为第二稳定因子。

在数据稳定性的计算公式中，可以表征第i个区域内患者的最后一个的指标数据与初始的指标数据之间的差异度，差异度越小，说明第i个区域内患者的生理指标数据控制情况相对趋于良好，第i个区域的数据稳定性越大；当/>为负数时，说明第i个区域生理指标数据的最后一个指标数值小于第一个指标数值，也就是第i个区域的生理指标数据的控制效果比较好，数据稳定性越强，故此处添加归一化函数；超参数1是为了防止第i个区域的第1个指标数据等于第/>个指标数据，导致数据稳定性的数值为0；越小，说明第i个区域内两两指标数据之间的差异度越低，在第i个区域中指标数据相对越稳定，/>越小，数据稳定性/>越大；数据稳定性越大，第i个区域的指标数据稳定性越好；参考第i个区域的数据稳定性的计算过程，可以获得每个区域的数据稳定性。

至此，本实施例确定了任一患者的任一生理指标序列对应的每个区域的数据稳定性。

S3，根据每个区域的指标数据均值和数据稳定性确定每个区域的数据异常度。

数据异常度可以表征指标数据变化的异常程度，例如，某个区域的生理指标数据相比其他区域的生理指标数据呈现数值高水平且波动变化较小，其说明该区域内的指标数据较为异常，该生理指标数据在该区域时段时的控制效果较差。因此，通过分析区域的指标数据的数值水平和波动变化程度，量化区域的数据异常度，具体实现步骤可以包括：

第一步，根据每个区域内各个指标数据计算每个区域的指标数据均值，选取最小的指标数据均值；根据每个区域的数据稳定性，选取最小的数据稳定性。

在本实施例中，为了衡量不同区域的指标数据的数值水平、波动变化程度相对于整个生理指标序列的高低程度，需要确定最小的指标数据均值和最小的数据稳定性，以便于后续计算每个区域的数据异常度。

第二步，计算每个区域的数据异常度。

作为示例，第i个区域的数据异常度的计算公式可以为：

；式中，/>为第i个区域的数据异常度，/>为第i个区域的指标数据均值，/>为最小的指标数据均值，/>为第一差值，为第一数据异常因子，/>为第i个区域的数据稳定性，/>为最小的数据稳定性，/>为第二差值，/>为第二数据异常因子，超参数为1。

在数据异常度的计算公式中，当第一差值越大时，说明第i个区域的指标数据相对整体序列来讲的数值水平越高，并且此时第二差值/>越大时，说明第i区域的指标数据波动变化越大，也就是第i个区域的指标数据的数值水平存在时高时低的情况；结合此时的第一差值和第二差值可知，第i个区域的指标数据的数值水平高且波动变化大，其表示第i个区域的指标数据的控制效果时好时差；当第一差值/>越大，但第二差值/>越小时，第i个区域的指标数据的数值水平高且波动变化小，其表示第i个区域的指标数据的控制效果越差，第i个区域的数据异常度越高。在第一差值和第二差值后加超参数，是为了避免两个差值为0的特殊情况，实施者可以根据具体实际情况设置超参数的大小，这里不做具体限定；参考第i个区域的数据异常度的计算过程，可以获得每个区域的数据异常度。

至此，本实施例通过分析区域内指标数据的数值水平高低和波动程度，确定了每个区域的数据异常度。

S4，根据相邻区域之间的数据异常度差异设置每个区域的权重值；根据每个区域内各个指标数据和每个区域的权重值，确定患者的生理指标序列的特征值。

第一步，根据相邻区域之间的数据异常度差异设置每个区域的权重值。

需要说明的是，权重值可以用于衡量不同区域内指标数据在分析数据特征时的重要程度，当区域内的指标数据的异常度越大，并且区域的指标数据越接近目前的指标状况时，则说明该区域在计算特征值时的参考价值越大、重要程度越高，该区域对应的权重值也就应越大。基于上述对权重值的分析理解可知，设置每个区域的权重值的具体实现步骤可以包括：

第一子步骤，根据每个区域的数据异常度计算相邻区域之间的数据异常度差值，获得各个数据异常度差值。

作为示例，第i个区域与第i+1个区域之间的数据异常度差值的计算公式可以为：

；式中，/>为第i个区域与第i+1个区域之间的数据异常度差值，/>为第i+1个区域的数据异常度，/>为第i个区域的数据异常度。

在数据异常度差值的计算公式中，数据异常度差值可以用于分析两个时间相邻的区域的数据异常度大小比较情况，其可以表征第i+1个区域的指标数据异常度相比第i个区域的指标数据异常度的偏离程度，偏离程度为负数时，说明第i+1个区域的数据异常度小于第i个区域的数据异常度，/>越小，说明第i+1个区域相对于第i个区域的指标数据控制的越好；偏离程度为正数时，说明第i+1个区域的数据异常度大于第i个区域的数据异常度，/>越大，说明第i+1个区域相对于第i个区域的指标数据控制的越差；偏离程度为零时，说明第i+1个区域的数据异常度等于第i个区域的数据异常度，/>等于0，说明第i+1个区域相对于第i个区域的指标数据控制没有发生变化。

第二子步骤，根据各个数据异常度差值的正负情况，设置每个区域的权重值。

在本实施例中，生理指标序列对应四个区域，当四个区域对应的三个数据异常度差值全部为负数时，说明生理指标在预设时段一年内的控制状况良好，此时可以按照各个区域的时间顺序设置四个区域的权重值，越靠近当前时间的区域的权重值越大，四个区域的权重值从后往前依次减小。其中，第四个区域的权重值可以设置为0.4，第三个区域的权重值可以设置为0.3，第二个区域的权重值可以设置为0.2，第一个区域的权重值可以设置为0.1。需要说明的是，实施者可以根据具体实际情况设置每个区域的权重值大小，此处不做具体限定。

当四个区域对应的三个数据异常度差值并非全部为负数时，存在两种情况，分别为：

第一种情况，三个数据异常度差值既有正数又有负数，其说明生理指标在预设时段一年内的控制状况时好时坏，设置各个区域的权重值按照数据异常度差值大小顺序从大到小依次减小，最大正数对应的两个区域的权重值最高，并且两个区域中距离第四个区域较近的权重值较高，由此基于每个区域的权重值大小关系的排序情况，权重值排序越靠前的区域的权重值越大，分别对应设置区域的权重值为0.4、0.3、0.2、0.1；假设四个区域的权重值从大到小的排列顺序为第三个区域、第二个区域、第四个区域、第一个区域，那么第三个区域的权重值为0.4，第二个区域的权重值为0.3，第四个区域的权重值为0.2，第一个区域的权重值为0.1；

第二种情况，三个数据异常度差值全部为正数，其说明生理指标在预设时段一年内的控制状况较差，先基于三个数据异常度差值大小情况对各个区域的权重值进行大小排序，即设置各个区域的权重值按照数据异常度差值大小顺序从大到小依次减小，再基于每个区域的权重值大小关系的排序情况，具体设置区域对应权重值为0.4、0.3、0.2、0.1。

需要说明的是，对于三个数据异常度差值并非全部为负数的情况，在任一数据异常度差值对应的两个区域的权重值中，距离第四个区域最近的区域的权重值较高。

第二步，根据每个区域内各个指标数据和每个区域的权重值，确定患者的生理指标序列的特征值。

需要说明的是，特征值可以用于表征患者在该项生理指标上的数据表现特征情况。在后续使用Canopy方法进行聚类的过程中，可以使用每个患者对应的各个特征值进行聚类，其有助于更准确地将相似健康状况的患者归为一类，进而得到更精准、合理的护理方案。

在本实施例中，由于同一区域内的各个指标数据对应的权重值相同，可以获得每个区域内各个指标数据的权重值，进而执行指数加权平均，获得特征值。具体为：计算各个指标数据与其对应的权重值的乘积，得到各个乘积，将各个乘积的平均值作为患者的生理指标序列的特征值。

至此，本实施例获得了患者的任一项生理指标序列的特征值。

S5，获取患者的各项生理指标序列的特征值组成特征值数组；根据各个特征值数组确定每个患者的特征相似程度。

第一步，获取每个患者对应的特征值数组。

在本实施例中，参考步骤S2至步骤S4确定任一患者的任一项生理指标序列的特征值的计算过程，可以获得患者的各项生理指标序列的特征值。为了便于后续分析不同患者之间的数据特征相似程度，将患者的各个特征值组成特征值数组，得到患者对应的特征值数组。参考任一患者对应的特征值数组的计算过程，可以确定每个患者对应的特征值数组，即获得各个特征值数组。

第二步，根据各个特征值数组确定每个患者的特征相似程度。

作为示例，第k个患者的特征相似度的计算公式可以为：

；式中，/>为第k个患者的特征相似度，K为护理机构内所有患者的人数，/>为第k个患者的特征值数组与第b个患者的特征值数组之间的距离。

在特征相似度的计算公式中，距离可以为通过余弦相似度算法计算获得，对于距离的确定方式，此处不做具体限定；余弦相似度越大，第k个患者与其他患者之间的特征相似度越大，反之，则第k个患者与其他患者之间的特征相似度越小；；参考第k个患者的特征相似度的计算过程，可以获得每个患者的特征相似度。

至此，本实施例获得了可以用于计算上限阈值的特征相似度。

S6，根据每个患者的特征相似程度确定Canopy聚类算法中的上限阈值；设置下限阈值，根据上限阈值和下限阈值，利用Canopy聚类对所有患者进行聚类，获得各个患者聚类簇。

需要说明的是，Canopy聚类方法通过人工经验设定上、下限阈值对数据进行聚类，其中，上限阈值用来确定一个数据是否可以被看作是一个新的聚类中心，上限阈值越小，生成的聚类中心数量越多，反之则生成的聚类中心数量越少。本实施例需要根据体检数据对患者进行聚类，若上限阈值设置不准确，则导致聚类结果中的聚类类别数目不准确，影响后续根据类别数目制定护理方案的合理性，因此，本实施例通过自适应上限阈值在一定程度上消除上限阈值设置不准确的影响。

第一步，根据每个患者的特征相似程度确定Canopy聚类算法中的上限阈值。

在本实施例中，特征相似度可以准确表现出不同患者的体检数据特征之间的相似程度，有助于减小聚类过程中的计算量，基于特征相似度可以获得准确度更高的上限阈值。

第一子步骤，根据每个患者的特征相似程度设置各个相似级别；统计各个相似级别在所有特征相似程度中的出现频率，构建频率分布直方图。

首先，根据每个患者的特征相似程度确定特征相似程度的最大值和最小值，将最小值到最大值的取值范围均分为第二预设数目个子范围，将子范围确定为相似级别，获得各个相似级别。其中，第二预设数目可以设置为10，第二预设数目的数值大小具体需要根据相似级别的数值间隔确定，不做具体限定。

例如，假设特征相似程度的最大值为A，最小值为G，最小值到最大值的取值范围为[A,G]，若相似级别的数值间隔为2，则可以将[A,G]均分为各个子范围，具体为：[A,A+2]、(A+2,A+4]、(A+4,A+6]……(G-2,G]，此时均分获得的各个子范围即为相似级别。

然后，统计各个相似级别对应的患者个数，即相似级别在所有患者的特征相似程度中的出现频率，构建频率分布直方图，频率分布直方图的横轴为相似级别，纵轴为相似级别的出现频率。

关于相似级别的出现频率，出现频率是指所有患者的特征相似程度中位于对应数值范围的相似级别的患者个数，例如，多个患者的特征相似程度分别为A、A+1，A+3，A+5，则位于相似级别[A,A+2]的患者个数为2，位于相似级别(A+2,A+4]的患者个数为1，位于相似级别(A+4,A+6]的患者个数为也为1。

当然，实施者也可以根据其他方式构建频率直方图，例如，对每个患者的特征相似程度进行向上取整，然后绘制所有取整后的特征相似程度的频率直方图，其横轴为取整后的特征相似程度，纵轴为取整后的特征相似程度的频率值。

第二子步骤，根据频率分布直方图确定上限阈值。

在本实施例中，上限阈值通常用于确定一个数据是否可以被看作是一个新的聚类中心的阈值，其值大于数据点之间的平均距离，故上限阈值在本实施例中应是大于所有特征相似程度的平均值，所以需要在频率分布直方图中确定与所有特征相似程度最为接近的直方块，将该直方块对应的相似级别记为目标相似级别，确定目标相似级别的出现频率。为了尽可能为患者制定合适的护理方案，聚类簇数目应尽可能大些，即对应的聚类簇中心的数量要多一点。因此，在频率分布直方图中，将目标相似级别右侧中第一个大于目标相似级别的出现频率的相似级别的中位数作为上限阈值。

需要说明的是，出现频率高于目标相似级别的出现频率可以表示患者的常规体检数据的特征值之间的相似度相对于目标相似级别越大，说明出现频率高于目标相似级别的出现频率的相似级别的特征相似表征值为聚类簇中心的阈值的可能性越大，因此，将目标相似级别右侧中第一个大于目标相似级别的出现频率的相似级别的中位数作为上限阈值。其中，特征相似表征值可以是所选取相似级别的中位数，也可以是所选取的相似级别对应的最大值和最小值的平均值，这里不做具体限定。

值得说明的是，若目标相似级别右侧没有出现频率大于目标相似级别的出现频率的相似级别，则以最接近目标相似级别对应的出现频率的相似级别为准，确定上限阈值。

第二步，设置下限阈值，根据上限阈值和下限阈值，利用Canopy聚类对所有患者进行聚类，获得各个患者聚类簇。

在获得自适应上限阈值后，基于患者对应的特征值数组，使用Canopy方法对所有患者进行聚类，生成各个患者聚类簇。其中，下限阈值根据经验设置为所有患者的特征相似程度的最小值，每个患者聚类簇中均包含多个患者。

至此，本实施例获得了所有患者的最终聚类结果。

S7，根据各个患者聚类簇为每个患者制定合适的护理方案。

在本实施例中，同一个患者聚类簇内患者的常规体检数据的特征值是比较相似的，因此护理结构可以根据各个患者聚类簇内所有患者对应的特征值数组，对各个患者聚类簇中的患者制定并分配相应的护理方案。为患者制定护理方案的实现过程为现有技术，不在本发明保护范围内，此处不再进行详细阐述。需要说明的是，通过自适应确定的上限阈值能够获得更准确的聚类类别数，进而为每个患者制定更合理、更合适的护理方案。

本发明还提供了一种基于体检数据的智能护理系统，包括处理器和存储器，所述处理器用于处理存储在所述存储器中的指令，以实现一种基于体检数据的智能护理方法。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，均应包含在本发明的保护范围之内。

Claims

1.一种基于体检数据的智能护理方法，其特征在于，包括以下步骤：

根据各个患者聚类簇为每个患者制定合适的护理方案；

根据每个区域内各个指标数据确定每个区域的数据稳定性，包括：

对于任一区域，计算区域内的最后一个指标数据和第一个指标数据之间的差值，对差值进行归一化处理，将归一化后的差值与超参数相加后的数值确定为第一稳定因子；计算区域内相邻两个指标数据之间的差值绝对值，将各个差值绝对值的平均值确定为第二稳定因子；对第一稳定因子和第二稳定因子的乘积进行取反操作，将两个稳定因子的乘积的反比例值作为区域的数据稳定性；

计算第i个区域的数据稳定性的计算公式为：

；式中，/>为第i个区域的数据稳定性，exp为自然常数为底的指数函数，norm为归一化函数，/>为第i个区域内第个指标数据，/>为第i个区域内指标数据的个数，/>为第i个区域内第1个指标数据，超参数为1，/>为第一稳定因子，/>为第i个区域内第/>个指标数据，/>为第i个区域内第j个指标数据，/>为取绝对值函数，/>为第二稳定因子；

根据每个区域的指标数据均值和数据稳定性确定每个区域的数据异常度，包括：

对于任一区域，计算区域的指标数据均值与最小的指标数据均值的差值为第一差值，将第一差值与超参数相加后的数值确定为第一数据异常因子；计算区域的数据稳定性与最小的数据稳定性的差值为第二差值，对第二差值与超参数相加后的数值进行取反处理，将反比例值作为第二数据异常因子；将第一数据异常因子和第二数据异常因子的乘积作为区域的数据异常度；

第i个区域的数据异常度的计算公式为：

；式中，/>为第i个区域的数据异常度，/>为第i个区域的指标数据均值，/>为最小的指标数据均值，/>为第一差值，为第一数据异常因子，/>为第i个区域的数据稳定性，/>为最小的数据稳定性，/>为第二差值，/>为第二数据异常因子，超参数为1；

根据各个特征值数组确定每个患者的特征相似程度，包括：

对于任一患者，计算患者的特征值数组与除其本身以外的其他各个患者的特征值数组之间的距离，将所有距离的平均值作为患者的特征相似程度；

根据每个患者的特征相似程度确定Canopy聚类算法中的上限阈值，包括：

2.根据权利要求1所述的一种基于体检数据的智能护理方法，其特征在于，根据相邻区域之间的数据异常度差异设置每个区域的权重值，包括：

3.根据权利要求2所述的一种基于体检数据的智能护理方法，其特征在于，根据各个数据异常度差值的正负情况，设置每个区域的权重值，包括：

4.根据权利要求1所述的一种基于体检数据的智能护理方法，其特征在于，根据每个区域内各个指标数据和每个区域的权重值，确定患者的生理指标序列的特征值，包括：

5.根据权利要求1所述的一种基于体检数据的智能护理方法，其特征在于，根据每个患者的特征相似程度设置各个相似级别，包括：

6.一种基于体检数据的智能护理系统，其特征在于，包括处理器和存储器，所述处理器用于处理存储在所述存储器中的指令，以实现如权利要求1-5中任一项所述的一种基于体检数据的智能护理方法。