CN118012876B - 一种残疾儿童康复信息平台数据的智慧存储方法 - Google Patents

一种残疾儿童康复信息平台数据的智慧存储方法 Download PDF

Info

Publication number
CN118012876B
CN118012876B CN202410427739.4A CN202410427739A CN118012876B CN 118012876 B CN118012876 B CN 118012876B CN 202410427739 A CN202410427739 A CN 202410427739A CN 118012876 B CN118012876 B CN 118012876B
Authority
CN
China
Prior art keywords
data
treatment
local window
data point
scoring time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410427739.4A
Other languages
English (en)
Other versions
CN118012876A (zh
Inventor
张茂利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shuojie Medical Technology Co ltd
Original Assignee
Shandong Shuojie Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shuojie Medical Technology Co ltd filed Critical Shandong Shuojie Medical Technology Co ltd
Priority to CN202410427739.4A priority Critical patent/CN118012876B/zh
Publication of CN118012876A publication Critical patent/CN118012876A/zh
Application granted granted Critical
Publication of CN118012876B publication Critical patent/CN118012876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,尤其涉及一种残疾儿童康复信息平台数据的智慧存储方法,该方法获取任一残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据;分别获取两个治疗评分时序数据之间的任意两个数据点的差异优化因子,以对两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,基于每两个治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果;根据聚类结果对残疾类型下的每个儿童的康复信息数据进行分类存储,避免了治疗评分时序数据之间的时间戳差异带来的DTW距离误差,使得聚类结果更加严谨。

Description

一种残疾儿童康复信息平台数据的智慧存储方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种残疾儿童康复信息平台数据的智慧存储方法。
背景技术
在对残疾儿童的康复信息数据存储之前,需要对康复信息数据进行聚类分析,根据康复信息数据的样本数据信息特征进行分类,以求发现在残疾儿童的康复治疗过程中较优的康复路线和需要重点关注的康复样本信息,从而提高残疾儿童的康复治疗效果。
现有技术中,通过DBSCAN聚类算法对康复信息数据进行聚类分析,利用设定的邻域密度半径进行样本空间中的每个数据点的邻域密度判断,从而将具有同样残疾情况和康复需求的康复信息数据划分为一类。但是在聚类分析过程中,康复信息数据为每个残疾儿童在治疗过程中的评分时序数据,由于每个残疾儿童的康复信息数据中的数据点的时间戳间隔不同,所以导致对应的评分时序数据不同,进而在聚类分析过程中,会存在着评分时序数据之间的数据点对应关系错误所导致的样本点之间的距离评估出现差异,使得DBSCAN聚类算法对康复信息数据进行聚类分析得到的聚类结果不准确,进而难以根据治疗路径对康复信息数据进行准确的康复模式划分和分类存储。
因此,如何提高利用DBSCAN聚类算法对康复信息数据进行聚类分析所得到的聚类结果的准确性,以保证康复信息数据的分类存储更加符合实际成为亟需解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种残疾儿童康复信息平台数据的智慧存储方法,以解决如何提高利用DBSCAN聚类算法对康复信息数据进行聚类分析所得到的聚类结果的准确性,以保证康复信息数据的分类存储更加符合实际的问题。
本发明实施例中提供了一种残疾儿童康复信息平台数据的智慧存储方法,该方法包括以下步骤:
在残疾儿童康复信息平台数据中获取任一残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据;
获取每个所述治疗评分时序数据中的每个数据点的局部窗口,根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,针对任一两个治疗评分时序数据,根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子;
根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,基于每两个所述治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果;
根据所述聚类结果对所述残疾类型下的每个儿童的康复信息数据进行分类存储,其中,所述康复信息数据包括所述治疗评分时序数据。
优选的,所述根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,包括:
针对任一治疗评分时序数据中的任一数据点,将除所述治疗评分时序数据之外的每个治疗评分时序数据中的每个数据点的局部窗口作为目标局部窗口;
针对任一目标局部窗口,计算所述数据点的局部窗口和所述目标局部窗口之间的相同位置处的两个数据点之间的差值绝对值,得到差值绝对值之和,将所述数据点的局部窗口与每个所述目标局部窗口之间的差值绝对值之和进行从小到大的排序,取排序后的前K个差值绝对值之和所对应的目标局部窗口组成所述数据点的近邻局部窗口集合,K为正整数。
优选的,所述获取每个所述治疗评分时序数据中的每个数据点的局部窗口,包括:
将任一数据点作为局部窗口的第一个数据点,并在所述数据点所属的治疗评分时序数据中得到预设长度的局部窗口,若所述数据点在所属的治疗评分时序数据中的局部窗口的长度不满足所述预设长度,则按照所述数据点的局部窗口中的最后一个数值进行补值操作,直至所述数据点的局部窗口的长度满足所述预设长度。
优选的,所述根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,包括:
针对所述两个治疗评分时序数据之间的任一两个数据点,在所述两个数据点的近邻局部窗口集合中,统计相同局部窗口的第一数量,计算所述第一数量与所述近邻局部窗口集合中的局部窗口总数量之间的比值,获取常数1与所述比值之间的第一差值;其中,所述相同局部窗口是指两个局部窗口中的数据点的数值完全相同;
取所述两个数据点中的任一数据点为目标数据点,对所述目标数据点的近邻局部窗口集合中所包含的数据点构建二维平面,所述二维平面的横轴为时间戳,所述二维平面的纵轴为数据点对应的数值,对所述二维平面上的所有数据点进行线性拟合,得到对应的线性拟合函数;
根据所述线性拟合函数获取所述目标数据点的局部窗口中的每个数据点的拟合值,计算所述目标数据点的局部窗口中的每个数据点的数值与对应的拟合值之间的第一差值绝对值,得到差值绝对值总和,获取所述两个数据点的差值绝对值总和之间的第二差值绝对值,将所述第二差值绝对值的相反数代入以自然常数为底数的指数函数中,得到对应的指数函数结果;
获取常数1与所述指数函数结果之间的第二差值,将所述第一差值与所述第二差值之间的乘积作为所述两个数据点的差异优化因子。
优选的,所述根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,包括:
针对所述两个治疗评分时序数据之间的任一两个数据点,将所述两个数据点分别记为第一数据点和第二数据点,根据所述第一数据点的时间戳在所述第二数据点对应的线性拟合函数中获取对应的第一拟合值,计算所述第一数据点的数值和所述第一拟合值之间的第三差值绝对值;
根据所述第二数据点的时间戳在所述第一数据点对应的线性拟合函数中获取对应的第二拟合值,计算所述第二数据点的数值和所述第二拟合值之间的第四差值绝对值,获取所述第三差值绝对值和所述第四差值绝对值的均值;
将所述均值和所述两个数据点的差异优化因子之间的乘积作为对所述两个治疗评分时序数据进行动态时间规整过程中的所述两个数据点之间的优化距离;
根据所述两个治疗评分时序数据进行动态时间规整过程中的每两个数据点之间的优化距离,获取所述两个治疗评分时序数据之间的优化后的DTW距离。
优选的,所述基于每两个所述治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果,包括:
将所有治疗评分时序数据映射在样本空间中,得到每个所述治疗评分时序数据对应的一个样本点,在所述样本空间中获取每个所述样本点的k-距离,统计每种k-距离的数量,构建k-距离的数量变化曲线,获取所述数量变化曲线中的拐点,将所述拐点对应的k-距离的k取值作为DBSCAN聚类算法中的聚类半径;
基于每两个所述治疗评分时序数据之间的优化后的DTW距离,利用所述聚类半径和预设的邻域密度阈值对所有治疗评分时序数据进行DBSCAN聚类,得到对应的聚类结果。
本发明实施例与现有技术相比存在的有益效果是:
本发明在残疾儿童康复信息平台数据中获取任一残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据;获取每个所述治疗评分时序数据中的每个数据点的局部窗口,根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,针对任一两个治疗评分时序数据,根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子;根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,基于每两个所述治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果;根据所述聚类结果对所述残疾类型下的每个儿童的康复信息数据进行分类存储,其中,所述康复信息数据包括所述治疗评分时序数据。其中,在对任意两个治疗评分时序数据进行DTW距离分析的过程中,考虑到治疗评分时序数据之间的治疗时间和治疗间隔不同,在进行DTW距离的度量过程中会出现数据点对应关系的偏差,因此,根据治疗平时序数据中的每个数据点的近邻关系的拟合和局部信息变化进行两个数据点之间的距离优化,从而优化两个治疗评分时序数据的DTW距离,以避免治疗评分时序数据之间的时间戳差异带来的DTW距离误差,使得基于DTW距离对所有治疗评分时序数据进行聚类得到的聚类结果更加严谨,以保证康复信息数据所对应的康复模式的分类存储更加精细。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种残疾儿童康复信息平台数据的智慧存储方法的方法流程图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
需要说明的是,本公开的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与本公开的一些方面相一致的装置和方法的例子。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明所针对的具体场景为:在对同一残疾类型的每个儿童的康复信息数据按照康复模式进行分类存储的过程中,由于每个儿童的康复信息数据中的治疗评分时序数据所记录的治疗时间和时间间隔存在差异,导致通过对所有儿童的治疗评分时序数据进行聚类划分时的任意两个治疗评分时序数据之间的距离衡量出现误差,因此,本发明在对所有儿童的治疗评分时序数据进行聚类划分时,对任意两个治疗评分时序数据之间的距离衡量进行优化,以聚类划分结果的准确性。
参见图1,是本发明实施例一提供的一种残疾儿童康复信息平台数据的智慧存储方法的方法流程图,如图1所示,该方法可以包括:
步骤S101,在残疾儿童康复信息平台数据中获取任一残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据。
残疾儿童康复信息平台数据用于存储各种残疾儿童在治疗康复过程中的康复信息数据,其中,康复信息数据包括但不限于姓名、性别、年龄、残疾类型及程度、疾病诊断、治疗过程、康复情况(每次治疗之后的治疗评分)以及治疗地点等。所述治疗评分是指每次治疗后的康复评价指标,例如:某儿童的自闭症康复程度为60%或70%。因此,本发明实施例,在残疾儿童康复信息平台数据中,针对任一残疾类型,获取该残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据,治疗评分时序数据中的每个数据点的时间戳为治疗时间,每个数据点的数值为每个治疗时间对应的治疗评分,至此得到治疗结束下的所有儿童的治疗评分时序数据。
步骤S102,获取每个治疗评分时序数据中的每个数据点的局部窗口,根据每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,针对任一两个治疗评分时序数据,根据每个数据点的局部窗口和近邻局部窗口集合,分别获取两个治疗评分时序数据之间的任意两个数据点的差异优化因子。
在得到每个儿童的治疗评分时序数据之后,通常将每个治疗评分时序数据映射在样本空间中成为一个样本点,并在样本空间中根据样本点间的距离进行DBSCAN聚类,得到对应的聚类划分结果,但是在对样本空间中的样本点间的距离进行衡量过程中,由于每个样本点的治疗时间不同、治疗时间间隔不同以及治疗时长不同,从而导致利用DTW算法获取任意两个治疗评分时序数据(两个样本点)之间的距离时,会出现动态时间规整后的数据点对应关系差异的情况。其中,动态时间规整后的数据点对应关系差异是指样本点对应的治疗评分时序数据之间进行DTW动态规整过程中因为样本点的初始评分不同导致的对应的治疗评分时序数据的初始状态不同,并且在这个过程中还会因为两个样本点的治疗间隔不同而出现时间戳的差异,其次因为治疗过程中治疗评分的变化无法认定为线性变化(也就是时间间隔与评分变化呈相关关系),所以对于时间戳差异还需要通过对治疗评分的变化信息进行近邻关系的拟合,从而通过共享近邻相似程度进行治疗评分差异的优化,从而优化DBSCAN聚类过程中的每两个样本点之间的DTW距离,得到更加准确的聚类划分结果。
治疗评分时序数据的记录是通过对每个儿童进行治疗所获取到的康复评分,这个过程中每个治疗评分时序数据中的治疗评分对应的获取时间间隔是不同的,也就是治疗评分时序数据中的时间戳不是统一的,例如:对于样本点m,第一次治疗下的治疗评分是在1月1日,第二次是在2月10日,而对于样本点n,第一次治疗下的治疗评分是在1月5日,第二次是在3月1日,那么在对治疗评分时序数据之间的DTW距离度量过程中,需要通过治疗评分的变化率进行差异评估,但是因为对于不同的样本点其在治疗过程中存在着不同的康复模式,所以需要通过残疾儿童康复信息平台数据中的全部样本点进行每一个治疗评分时序数据中的每个数据点的局部窗口之间的近邻关系的确定,因此,本发明实施例中,首先获取每个治疗评分时序数据中的每个数据点的局部窗口,包括:
将任一数据点作为局部窗口的第一个数据点,并在所述数据点所属的治疗评分时序数据中得到预设长度的局部窗口,若所述数据点在所属的治疗评分时序数据中的局部窗口的长度不满足所述预设长度,则按照所述数据点的局部窗口中的最后一个数值进行补值操作,直至所述数据点的局部窗口的长度满足所述预设长度。
在一实施方式中,以第m个治疗评分时序数据中的第i个数据点为例,将第i个数据点作为局部窗口的第一个数据点,在第m个治疗评分时序数据中获取预设长度L=10的局部窗口。由于第m个治疗评分时序数据中的倒数第9个数据点的局部窗口中的数据量无法满足10个,因此,获取倒数第9个数据点的局部窗口中的最后一个数据点的数值,并利用最后一个数据点的数值将倒数第9个数据点的局部窗口中的所有数据点补充完整。举例说明:第m个治疗评分时序数据为{1、2、3、4、5、6、7、8、9、10、11、12},针对该治疗评分时序数据中的第8个数据点,局部窗口的长度为6,以数值8为局部窗口的第一个数据点,此时局部窗口中的数据点只有8、9、10、11、12,不满足6个数据点,进而将最后一个数据点12作为补充值,将数值8的局部窗口补充完整,则数值8的局部窗口中的数据点为8、9、10、11、12、12。
然后,根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,包括:
针对任一治疗评分时序数据中的任一数据点,将除所述治疗评分时序数据之外的每个治疗评分时序数据中的每个数据点的局部窗口作为目标局部窗口;
针对任一目标局部窗口,计算所述数据点的局部窗口和所述目标局部窗口之间的相同位置处的两个数据点之间的差值绝对值,得到差值绝对值之和,将所述数据点的局部窗口与每个所述目标局部窗口之间的差值绝对值之和进行从小到大的排序,取排序后的前K个差值绝对值之和所对应的目标局部窗口组成所述数据点的近邻局部窗口集合,K为正整数。
在一实施方式中,K=20,以第m个治疗评分时序数据中的第i个数据点为例,在得到第i个数据点的局部窗口之后,将第i个数据点的局部窗口与每个其他治疗评分时序数据中的每个数据点的局部窗口进行差异对比,以获取第i个数据点的近邻局部窗口集合,具体的,获取第n个治疗评分时序数据中的第j个数据点的局部窗口,由于局部窗口的长度一样,则获取第i个数据点的局部窗口与第j个数据点的局部窗口之间的每个相同位置处的两个数据点之间的差值绝对值,能够得到10个差值绝对值,进而计算10个差值绝对值的相加总和。第i个数据点的局部窗口与每个其他治疗评分时序数据中的每个数据点的局部窗口之间都有一个由10个差值绝对值计算的相加总和,因此,将所有相加总和按照从小到大排序,将排序后的前20个其他治疗评分时序数据中的数据点的局部窗口组成第i个数据点的近邻局部窗口集合。同理,能够获取每个治疗评分时序数据中的每个数据点的近邻局部窗口集合。
最后,在得到每个治疗评分时序数据中的每个数据点的近邻局部窗口集合之后,即可根据每个数据点的近邻局部窗口集合中的窗口数据变化进行线性拟合,用于分析每个治疗评分时序数据中呈现的治疗评分变化信息,从而根据治疗评分变化信息获取任意两个治疗评分时序数据之间的任意两个数据点的差异优化因子,以在后续优化任意两个治疗评分时序数据之间的DTW距离,因此,针对任一两个治疗评分时序数据,根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,包括:
针对所述两个治疗评分时序数据之间的任一两个数据点,在所述两个数据点的近邻局部窗口集合中,统计相同局部窗口的第一数量,计算所述第一数量与所述近邻局部窗口集合中的局部窗口总数量之间的比值,获取常数1与所述比值之间的第一差值;其中,所述相同局部窗口是指两个局部窗口中的数据点的数值完全相同;
取所述两个数据点中的任一数据点为目标数据点,对所述目标数据点的近邻局部窗口集合中所包含的数据点构建二维平面,所述二维平面的横轴为时间戳,所述二维平面的纵轴为数据点对应的治疗评分,对所述二维平面上的所有数据点进行线性拟合,得到对应的线性拟合函数;
根据所述线性拟合函数获取所述目标数据点的局部窗口中的每个数据点的拟合值,计算所述目标数据点的局部窗口中的每个数据点的数值与对应的拟合值之间的第一差值绝对值,得到差值绝对值总和,获取所述两个数据点的差值绝对值总和之间的第二差值绝对值,将所述第二差值绝对值的相反数代入以自然常数为底数的指数函数中,得到对应的指数函数结果;
获取常数1与所述指数函数结果之间的第二差值,将所述第一差值与所述第二差值之间的乘积作为所述两个数据点的差异优化因子。
在一实施方式中,以第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点为例,针对第t个数据点的近邻局部窗口集合,由于近邻局部窗口集合中的每个局部窗口中的每个数据点都有一个时间戳(治疗时间),因此,以时间戳为横轴、数据点对应的治疗评分为纵轴,构建近邻局部窗口集合中所有数据点的二维平面,对二维平面上的所有数据点进行最小二乘法,得到对应的线性拟合函数。针对第t个数据点的局部窗口,将局部窗口中的每个数据点的时间戳代入线性拟合函数中,得到对应数据点的拟合值,分别计算局部窗口中的每个数据点的数值与对应拟合值之间的差值绝对值,得到差值绝对值总和,记为,同理,获取第q个数据点对应的差值绝对值总和,记为/>
统计第t个数据点的近邻局部窗口集合和第q个数据点的近邻局部窗口集合之间存在的相同局部窗口的数量,记为,例如:第t个数据点的近邻局部窗口集合包括一窗口:1234、二窗口:2345、三窗口:4567,第q个数据点的近邻局部窗口集合包括一窗口:1234、二窗口:2345、三窗口:3456,此时相同局部窗口的数量为2,也即是一窗口:1234、二窗口:2345。因此,根据第t个数据点的近邻局部窗口集合和第q个数据点的近邻局部窗口集合之间存在的相同局部窗口的数量,以及近邻局部窗口集合的线性拟合结果,获取第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点的差异优化因子,则差异优化因子的计算表达式为:
其中,表示第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点的差异优化因子,1表示常数,/>表示第t个数据点的近邻局部窗口集合和第q个数据点的近邻局部窗口集合之间存在的相同局部窗口的数量,K表示近邻局部窗口集合中包含的局部窗口的数量,/>表示第m个治疗评分时序数据中的第t个数据点的近邻局部窗口集合所对应的差值绝对值总和,/>表示第n个治疗评分时序数据中的第q个数据点的近邻局部窗口集合所对应的差值绝对值总和,| |表示绝对值符号,e表示自然常数。
需要说明的是,在对第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点进行距离衡量的过程中,需要通过两个数据点的近邻局部窗口集合获取到的线性拟合函数进行时间戳的统一,从而进行这两个数据点的距离衡量,但是在这个过程中,因为存在着两个数据点的近邻局部窗口集合之间的差异,近邻局部窗口集合的确定过程中由于局部窗口之间的距离存在着儿童康复模式不同而呈现出的样本空间中的分布不均匀,那么在这个过程中近邻局部窗口集合的紧密与否会呈现出不同的拟合效果可信度,所以需要通过第m个治疗评分时序数据中的第t个数据点的近邻局部窗口集合进行线性拟合之后,根据线性拟合函数获取到第t个数据点的局部窗口中的所有数据点的整体拟合差异,通过第n个治疗评分时序数据中的第q个数据点的近邻局部窗口集合进行线性拟合之后,根据线性拟合函数获取到第q个数据点的局部窗口中的所有数据点的整体拟合差异/>,进而利用/>进行第t个数据点和第q个数据点之间的距离度量优化,的值越大,差异优化因子越大。由于线性拟合函数是通过近邻局部窗口集合获取的,那么当两个数据点的近邻局部窗口集合中存在交集,也就是相同局部窗口,那么可以避免拟合过程中出现的拟合偏差,所以当两个数据点的近邻局部窗口集合中的交集数量越多,则说明两个数据点的距离越小,即/>,差异优化因子越小。
至此,能够获取第m个治疗评分时序数据和第n个治疗评分时序数据之间的任意两个数据点的差异优化因子。
步骤S103,根据两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,基于每两个治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果。
本发明实施例利用两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对两个治疗评分时序数据进行动态时间过程中的任意两个数据点的距离进行优化,从而能够得到两个治疗评分时序数据之间优化后的DTW距离,因此,根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,包括:
针对所述两个治疗评分时序数据之间的任一两个数据点,将所述两个数据点分别记为第一数据点和第二数据点,根据所述第一数据点的时间戳在所述第二数据点对应的线性拟合函数中获取对应的第一拟合值,计算所述第一数据点的数值和所述第一拟合值之间的第三差值绝对值;
根据所述第二数据点的时间戳在所述第一数据点对应的线性拟合函数中获取对应的第二拟合值,计算所述第二数据点的数值和所述第二拟合值之间的第四差值绝对值,获取所述第三差值绝对值和所述第四差值绝对值的均值;
将所述均值和所述两个数据点的差异优化因子之间的乘积作为对所述两个治疗评分时序数据进行动态时间规整过程中的所述两个数据点之间的优化距离;
根据所述两个治疗评分时序数据进行动态时间规整过程中的每两个数据点之间的优化距离,获取所述两个治疗评分时序数据之间的优化后的DTW距离。
在一实施方式中,针对第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点之间的优化距离的计算表达式为:
其中,表示第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点之间的优化距离,/>表示第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点的差异优化因子,/>表示将第n个治疗评分时序数据中的第q个数据点的时间戳代入第m个治疗评分时序数据中的第t个数据点对应的线性拟合函数中得到的拟合值,/>表示第n个治疗评分时序数据中的第q个数据点的数值,/>表示将第m个治疗评分时序数据中的第t个数据点的时间戳代入第n个治疗评分时序数据中的第q个数据点对应的线性拟合函数中得到的拟合值,/>表示第m个治疗评分时序数据中的第t个数据点的数值,| |表示绝对值符号。
需要说明的是,在获取第m个治疗评分时序数据和第n个治疗评分时序数据之间的DTW距离时,需要通过两个治疗评分时序数据对应的距离矩阵进行两个治疗评分时序数据中的数据点对应关系的判断,在距离矩阵中,需要计算两个治疗评分时序数据之间任意两个数据点之间的距离,为解决治疗评分时序数据的时间戳不一致问题,对于第m个治疗评分时序数据中的第t个数据点和第n个治疗评分时序数据中的第q个数据点之间的距离,可通过各自拟合结果进行各自时间戳的统一结果的均值,即,并在此基础上通过差异优化因子进行距离优化。
至此,能够获取第m个治疗评分时序数据和第n个治疗评分时序数据之间的任意两个数据点的优化距离,进而根据优化距离进行动态时间规整,得到第m个治疗评分时序数据和第n个治疗评分时序数据之间DTW距离,也即是优化后的DTW距离,值得说明的是,对两个时序数据之间的任意两个数据点之间的距离获取两个时序数据之间的DTW距离属于现有技术,此处不再详细赘述。
进一步的,利用上述优化后的DTW距离的获取方法,能够获取每两个治疗评分时序数据之间的优化后的DTW距离。进而基于优化后的DTW距离,对所有治疗评分时序数据进行聚类,以获取到对应的聚类结果,其中,基于每两个治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果,包括:
将所有治疗评分时序数据映射在样本空间中,得到每个所述治疗评分时序数据对应的一个样本点,在所述样本空间中获取每个所述样本点的k-距离,统计每种k-距离的数量,构建k-距离的数量变化曲线,获取所述数量变化曲线中的拐点,将所述拐点对应的k-距离的k取值作为DBSCAN聚类算法中的聚类半径;
基于每两个所述治疗评分时序数据之间的优化后的DTW距离,利用所述聚类半径和预设的邻域密度阈值对所有治疗评分时序数据进行DBSCAN聚类,得到对应的聚类结果。
在一实施方式中,设置k为5,邻域密度阈值设定为,聚类过程参数可以根据实际场景进行调整。通过样本空间中的全部样本点获取k-距离图的拐点作为聚类半径,具体的:在样本空间中,对于每个样本点,计算它与其他所有样本点的距离,然后选择距离最近的k个样本点,对每个样本点,将其第k近的距离绘制成变化曲线图,变化曲线图中通常出现一个“拐点”即k-距离快速增长的点,则将拐点对应的k-距离的k取值作为DBSCAN聚类算法中的聚类半径。需要说明的是,k-距离图的拐点的获取方法属于现有技术,此处不再详细赘述。进而利用聚类半径和邻域密度阈值对所有治疗评分时序数据进行DBSCAN聚类,得到对应的聚类结果,DBSCAN聚类属于现有技术,此处不再赘述。
需要说明的是,在完成对于现有的治疗评分时序数据的聚类分析后,由于儿童的康复治疗是持续的过程,在之后的时间节点中还需要进行后续的治疗,也就是说,在聚类中的部分治疗评分时序数据的路径还有扩展的需求,并且聚类中还有添加新治疗评分时序数据的需要,那么需要对于治疗评分时序数据的更新数据进行判断后进行局部聚类更新。
步骤S104,根据聚类结果对残疾类型下的每个儿童的康复信息数据进行分类存储。
在通过步骤S103获取到聚类结果之后,即可根据聚类结果对残疾类型下的每个儿童的康复信息数据进行分类存储,以实现对残疾儿童康复信息平台数据的智慧存储,其中分类存储的步骤如下:
1.根据聚类分析后得到的不同康复路径模式和群体类别,设计一个多层级的数据库结构,每一层代表一个聚类类别,每个聚类类别下设立多个子表,用于存储属于该聚类类别的所有儿童的康复信息数据。
2.为每个儿童的康复信息数据添加一个聚类标签字段,标明其所属的聚类类别,便于后期快速检索和分析,按照聚类结果,将每个儿童的康复信息数据分别存储到对应的类别子表中。
3.对于离散的治疗评分时序数据,依据其对应儿童的康复信息数据的不同疾病编码进行标记并储存到单独的表中,以便后续研究者或管理人员能够快速识别并针对性地进行深入分析。
综上所述,本发明实施例在残疾儿童康复信息平台数据中获取任一残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据;获取每个所述治疗评分时序数据中的每个数据点的局部窗口,根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,针对任一两个治疗评分时序数据,根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子;根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,基于每两个所述治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果;根据所述聚类结果对所述残疾类型下的每个儿童的康复信息数据进行分类存储,其中,所述康复信息数据包括所述治疗评分时序数据。其中,在对任意两个治疗评分时序数据进行DTW距离分析的过程中,考虑到治疗评分时序数据之间的治疗时间和治疗间隔不同,在进行DTW距离的度量过程中会出现数据点对应关系的偏差,因此,根据治疗平时序数据中的每个数据点的近邻关系的拟合和局部信息变化进行两个数据点之间的差异优化,从而优化两个治疗评分时序数据的DTW距离,以避免治疗评分时序数据之间的时间戳差异带来的DTW距离误差,使得基于DTW距离对所有治疗评分时序数据进行聚类得到的聚类结果更加严谨,以保证康复信息数据所对应的康复模式的分类存储更加精细。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (4)

1.一种残疾儿童康复信息平台数据的智慧存储方法,其特征在于,所述一种残疾儿童康复信息平台数据的智慧存储方法包括:
在残疾儿童康复信息平台数据中获取任一残疾类型下的每个儿童在完整治疗过程中的治疗评分时序数据;
获取每个所述治疗评分时序数据中的每个数据点的局部窗口,根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,针对任一两个治疗评分时序数据,根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子;
根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,基于每两个所述治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果;
根据所述聚类结果对所述残疾类型下的每个儿童的康复信息数据进行分类存储,其中,所述康复信息数据包括所述治疗评分时序数据;
所述根据每个所述数据点的局部窗口和近邻局部窗口集合,分别获取所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,包括:
针对所述两个治疗评分时序数据之间的任一两个数据点,在所述两个数据点的近邻局部窗口集合中,统计相同局部窗口的第一数量,计算所述第一数量与所述近邻局部窗口集合中的局部窗口总数量之间的比值,获取常数1与所述比值之间的第一差值;其中,所述相同局部窗口是指两个局部窗口中的数据点的数值完全相同;
取所述两个数据点中的任一数据点为目标数据点,对所述目标数据点的近邻局部窗口集合中所包含的数据点构建二维平面,所述二维平面的横轴为时间戳,所述二维平面的纵轴为数据点对应的数值,对所述二维平面上的所有数据点进行线性拟合,得到对应的线性拟合函数;
根据所述线性拟合函数获取所述目标数据点的局部窗口中的每个数据点的拟合值,计算所述目标数据点的局部窗口中的每个数据点的数值与对应的拟合值之间的第一差值绝对值,得到差值绝对值总和,获取所述两个数据点的差值绝对值总和之间的第二差值绝对值,将所述第二差值绝对值的相反数代入以自然常数为底数的指数函数中,得到对应的指数函数结果;
获取常数1与所述指数函数结果之间的第二差值,将所述第一差值与所述第二差值之间的乘积作为所述两个数据点的差异优化因子;
所述根据所述两个治疗评分时序数据之间的任意两个数据点的差异优化因子,对所述两个治疗评分时序数据之间的DTW距离进行优化,得到优化后的DTW距离,包括:
针对所述两个治疗评分时序数据之间的任一两个数据点,将所述两个数据点分别记为第一数据点和第二数据点,根据所述第一数据点的时间戳在所述第二数据点对应的线性拟合函数中获取对应的第一拟合值,计算所述第一数据点的数值和所述第一拟合值之间的第三差值绝对值;
根据所述第二数据点的时间戳在所述第一数据点对应的线性拟合函数中获取对应的第二拟合值,计算所述第二数据点的数值和所述第二拟合值之间的第四差值绝对值,获取所述第三差值绝对值和所述第四差值绝对值的均值;
将所述均值和所述两个数据点的差异优化因子之间的乘积作为对所述两个治疗评分时序数据进行动态时间规整过程中的所述两个数据点之间的优化距离;
根据所述两个治疗评分时序数据进行动态时间规整过程中的每两个数据点之间的优化距离,获取所述两个治疗评分时序数据之间的优化后的DTW距离。
2.根据权利要求1所述的一种残疾儿童康复信息平台数据的智慧存储方法,其特征在于,所述根据所述每个数据点的局部窗口中的数据变化分别获取对应数据点的近邻局部窗口集合,包括:
针对任一治疗评分时序数据中的任一数据点,将除所述治疗评分时序数据之外的每个治疗评分时序数据中的每个数据点的局部窗口作为目标局部窗口;
针对任一目标局部窗口,计算所述数据点的局部窗口和所述目标局部窗口之间的相同位置处的两个数据点之间的差值绝对值,得到差值绝对值之和,将所述数据点的局部窗口与每个所述目标局部窗口之间的差值绝对值之和进行从小到大的排序,取排序后的前K个差值绝对值之和所对应的目标局部窗口组成所述数据点的近邻局部窗口集合,K为正整数。
3.根据权利要求1所述的一种残疾儿童康复信息平台数据的智慧存储方法,其特征在于,所述获取每个所述治疗评分时序数据中的每个数据点的局部窗口,包括:
将任一数据点作为局部窗口的第一个数据点,并在所述数据点所属的治疗评分时序数据中得到预设长度的局部窗口,若所述数据点在所属的治疗评分时序数据中的局部窗口的长度不满足所述预设长度,则按照所述数据点的局部窗口中的最后一个数值进行补值操作,直至所述数据点的局部窗口的长度满足所述预设长度。
4.根据权利要求1所述的一种残疾儿童康复信息平台数据的智慧存储方法,其特征在于,所述基于每两个所述治疗评分时序数据之间的优化后的DTW距离,对所有治疗评分时序数据进行聚类,得到对应的聚类结果,包括:
将所有治疗评分时序数据映射在样本空间中,得到每个所述治疗评分时序数据对应的一个样本点,在所述样本空间中获取每个所述样本点的k-距离,统计每种k-距离的数量,构建k-距离的数量变化曲线,获取所述数量变化曲线中的拐点,将所述拐点对应的k-距离的k取值作为DBSCAN聚类算法中的聚类半径;
基于每两个所述治疗评分时序数据之间的优化后的DTW距离,利用所述聚类半径和预设的邻域密度阈值对所有治疗评分时序数据进行DBSCAN聚类,得到对应的聚类结果。
CN202410427739.4A 2024-04-10 2024-04-10 一种残疾儿童康复信息平台数据的智慧存储方法 Active CN118012876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410427739.4A CN118012876B (zh) 2024-04-10 2024-04-10 一种残疾儿童康复信息平台数据的智慧存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410427739.4A CN118012876B (zh) 2024-04-10 2024-04-10 一种残疾儿童康复信息平台数据的智慧存储方法

Publications (2)

Publication Number Publication Date
CN118012876A CN118012876A (zh) 2024-05-10
CN118012876B true CN118012876B (zh) 2024-06-11

Family

ID=90944987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410427739.4A Active CN118012876B (zh) 2024-04-10 2024-04-10 一种残疾儿童康复信息平台数据的智慧存储方法

Country Status (1)

Country Link
CN (1) CN118012876B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020147317A1 (zh) * 2019-01-18 2020-07-23 郑州云海信息技术有限公司 一种网络异常行为确定方法、装置、设备及可读存储介质
WO2022126971A1 (zh) * 2020-12-16 2022-06-23 平安科技(深圳)有限公司 基于密度的文本聚类方法、装置、设备及存储介质
CN114860802A (zh) * 2022-04-26 2022-08-05 上海分泽时代软件技术有限公司 时序人流量数据和标量标签数的融合方法及系统
CN116521764A (zh) * 2023-07-05 2023-08-01 武昌理工学院 基于人工智能的环境设计数据处理方法
CN116597996A (zh) * 2023-05-18 2023-08-15 西安交通大学 基于自适应近邻传播自聚类模型的婴儿脑发育量化评估系统
CN117220441A (zh) * 2023-09-20 2023-12-12 北京中电普华信息技术有限公司 基于全景监控下的信息监测智能预警方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292850A (zh) * 2020-01-22 2020-06-16 福建中医药大学 一种adhd儿童注意力智能康复系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020147317A1 (zh) * 2019-01-18 2020-07-23 郑州云海信息技术有限公司 一种网络异常行为确定方法、装置、设备及可读存储介质
WO2022126971A1 (zh) * 2020-12-16 2022-06-23 平安科技(深圳)有限公司 基于密度的文本聚类方法、装置、设备及存储介质
CN114860802A (zh) * 2022-04-26 2022-08-05 上海分泽时代软件技术有限公司 时序人流量数据和标量标签数的融合方法及系统
CN116597996A (zh) * 2023-05-18 2023-08-15 西安交通大学 基于自适应近邻传播自聚类模型的婴儿脑发育量化评估系统
CN116521764A (zh) * 2023-07-05 2023-08-01 武昌理工学院 基于人工智能的环境设计数据处理方法
CN117220441A (zh) * 2023-09-20 2023-12-12 北京中电普华信息技术有限公司 基于全景监控下的信息监测智能预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Adaptively constrained dynamic time warping for time series classification and clustering";Huanhuan Li等;《Information Sciences》;20201231;第534卷;第97-116页 *
基于DTW度量和局部紧邻图的序列聚类设计;汤敏;刘雅婷;王永程;杨帆;;计算机仿真;20180415(第04期);全文 *

Also Published As

Publication number Publication date
CN118012876A (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
CN106919957B (zh) 处理数据的方法及装置
CN104573130A (zh) 基于群体计算的实体解析方法及装置
CN106934254A (zh) 一种开源许可证的分析方法及装置
CN110737805B (zh) 图模型数据的处理方法、装置和终端设备
CN111026877A (zh) 基于概率软逻辑的知识验证模型构建与分析方法
CN117391258B (zh) 一种负碳排放的预测方法、装置、设备及存储介质
CN112084330A (zh) 一种基于课程规划元学习的增量关系抽取方法
CN112149922A (zh) 高速公路隧道下行线出入口区域事故严重程度预测方法
CN105786898A (zh) 一种领域本体的构建方法和装置
Plaue Data science
Maram et al. A framework for performance analysis on machine learning algorithms using covid-19 dataset
CN108564110A (zh) 一种基于聚类算法的空气质量预测方法
CN118012876B (zh) 一种残疾儿童康复信息平台数据的智慧存储方法
CN115687429A (zh) 一种社交媒体用户行为模式挖掘方法
CN113240209A (zh) 一种基于图神经网络的城市产业集群发展路径预测方法
CN113034284A (zh) 基于算法,大数据和区块链的股票走势分析及预警系统
CN109543712B (zh) 时态数据集上的实体识别方法
CN114048320B (zh) 一种基于课程学习的多标签国际疾病分类训练方法
CN112506930B (zh) 一种基于机器学习技术的数据洞察系统
CN110265151B (zh) 一种基于ehr中异构时态数据的学习方法
CN114218859A (zh) 一种基于人工神经网络的装配约束智能重建方法
CN113377630A (zh) 一种通用的kpi异常检测框架实现方法
CN108764537B (zh) 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法
CN112802567A (zh) 一种融合贝叶斯网络与回归分析的治疗费用预测方法
CN116881738B (zh) 一种应用于电网行业的项目申报文档的相似度检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant