CN116961675A - 一种医疗护理数据智能处理方法 - Google Patents
一种医疗护理数据智能处理方法 Download PDFInfo
- Publication number
- CN116961675A CN116961675A CN202311210790.1A CN202311210790A CN116961675A CN 116961675 A CN116961675 A CN 116961675A CN 202311210790 A CN202311210790 A CN 202311210790A CN 116961675 A CN116961675 A CN 116961675A
- Authority
- CN
- China
- Prior art keywords
- character
- data
- type
- acquiring
- medical care
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000009825 accumulation Methods 0.000 claims abstract description 61
- 230000009467 reduction Effects 0.000 claims abstract description 23
- 230000006835 compression Effects 0.000 claims abstract description 22
- 238000007906 compression Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 19
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 230000000737 periodic effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 6
- 230000000474 nursing effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种医疗护理数据智能处理方法,包括:获取每类字符的初始概率;获取近期历史数据中每类字符的索引序列,获取每类字符的目标数据段,获取每类字符的目标数据段的四等分点;获取每类字符的实际偏差;获取每类字符索引序列的均匀程度;获取每类字符索引序列的周期削减因子;根据每类字符的周期削减因子获取每类字符归一化后的出现概率;根据每类字符在分布累计表中的对应长度对分布累计表进行更新,获取更新后的分布累计表,对待处理的医疗护理数据进行编码压缩,得到压缩后的数据,将压缩后的数据进行存储。本发明通过实时更新分布累计表,令每个字符的压缩效果尽可能好,从而达到提高压缩效果的目的。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种医疗护理数据智能处理方法。
背景技术
在医疗护理数据处理领域,医疗护理数据通常具有大规模和实时更新的特点,为了提高数据处理的效率和准确性,需要一种对医疗护理数据进行智能处理的方法。
现有技术通过编码进行医疗护理数据的压缩,/>编码是一种无损压缩算法,压缩率高且实现简单。对医疗护理数据这样重复率高、数据量大的数据有着较好的压缩效果。/>编码通过实现统计数据中各类字符的出现频率,根据字符频率构建分布累计表,使出现频率较大的字符对应累计分布表中的长度较大以达到接近数据信息熵的理想压缩率。然而医疗护理数据中存在大量诸如患者手术记录、患者病情观察等的数据需要进行实时更新,传统的/>编码对于更新数据需要对历史数据解压后将更新数据添加到历史数据中并重新压缩,需要巨大的计算量和内存占用,而如果直接根据历史数据的分布累计表进行压缩会导致编码压缩率偏低。
发明内容
本发明提供一种医疗护理数据智能处理方法,以解决现有的问题。
本发明的一种医疗护理数据智能处理方法采用如下技术方案:
本发明一个实施例提供了一种医疗护理数据智能处理方法,该方法包括以下步骤:
获取历史医疗护理数据,根据历史医疗护理数据中字符类型获取近期历史数据;
根据近期历史数据中每类字符频率获取近期历史数据中每类字符的平均周期,获取每类字符的索引序列,根据每类字符索引序列中最后一个坐标索引与近期历史数据中最后一个字符的坐标索引差值获取每类字符的等待长度,根据每类字符的等待长度与平均周期获取每类字符的初始概率;
根据每类字符的索引序列获取每类字符的目标数据段,获取每类字符的目标数据段的四等分点;通过对等分点进行聚类获取簇类中心与聚类边界;根据每类字符的簇类中心点、聚类边界点以及每类字符索引序列的四等分点的加权差异获取每类字符的实际偏差;根据每类字符索引序列的实际偏差与每类字符索引序列极差间的差异获取每类字符索引序列的均匀程度;根据每类字符索引序列的均匀程度获取每类字符索引序列的周期削减因子;根据每类字符的周期削减因子对每类字符的初始概率进行调整,获取每类字符归一化后的出现概率;
根据每类字符归一化后的出现概率获取每类字符在分布累计表中的对应长度;根据每类字符在分布累计表中的对应长度对分布累计表进行更新,获取更新后的分布累计表,获取待处理的医疗护理数据,利用更新后的分布累计表对待处理的医疗护理数据进行编码压缩,得到压缩后的数据,将压缩后的数据进行存储。
优选的,所述根据近期历史数据中每类字符频率获取近期历史数据中每类字符的平均周期,包括的具体步骤如下:
统计近期历史数据中各类字符的频率,每类字符的平均周期的获取方法为:
其中,为近期历史数据中字符种类索引,/>为第/>类字符在近期历史数据中出现的平均周期,/>为第/>类字符在近期历史数据中的出现频率。
优选的,所述根据每类字符的等待长度与平均周期获取每类字符的初始概率,包括的具体步骤如下:
每类字符的初始概率的获取方法为:
其中,为近期历史数据中字符种类的索引,/>为第/>类字符的初始概率,/>为自然常数,/>为近期历史数据中最后一个字符的索引值,/>为第/>类字符在近期历史数据中最后出现位置的索引,/>为第/>类字符在近期历史数据中出现的平均周期。
优选的,所述根据每类字符的索引序列获取每类字符的目标数据段,获取每类字符的目标数据段的四等分点,包括的具体步骤如下:
获取第类字符的索引序列中的最大时间索引值与最小时间索引值,分别记为,/>表示第/>类字符在近期历史数据中的时间索引值,第/>类字符的索引序列中的最大时间索引值与最小时间索引值做差获取第/>类字符索引序列的极差,记为/>,近期历史数据中第/>个字符至第/>个字符之间的所有字符构成的数据段记为第/>类字符的目标数据段,获取第/>类字符的目标数据段的四等分点,即:
其中,为近期历史数据中第/>类字符索引序列的第/>个四等分点,四等分点一共有三个,/>为第/>类字符的索引序列中的最小时间索引值,/>为第/>类字符索引序列极差。
优选的,所述根据每类字符的簇类中心点、聚类边界点以及每类字符索引序列的四等分点的加权差异获取每类字符的实际偏差,包括的具体步骤如下:
实际偏差获取的方法为:
式中为第/>类字符索引序列的实际偏差,/>分别为近期历史数据中第/>类字符索引序列的第1、2、3个四等分点,/>表示第/>类字符的索引序列中的最大时间索引值与最小时间索引值,/>表示第/>类字符的聚类边界,/>表示第/>类字符索引序列极差,/>分别表示权重。
优选的,所述根据历史医疗护理数据中字符类型获取近期历史数据,包括的具体步骤如下:
根据历史医疗护理数据中的字符类型选择近期历史数据,其中近期历史数据的位数为,其中/>表示近期历史数据的位数,/>表示原历史数据中字符种类,从采集获取的历史医疗护理数据的最后一位开始,前/>位医疗护理数据构成近期历史数据。
优选的,所述根据每类字符索引序列的均匀程度获取每类字符索引序列的周期削减因子,包括的具体步骤如下:
削减因子的获取方法为:
其中,表示第/>类字符的周期削减因子,/>表示第/>类字符的索引序列的均匀程度,/>为自然常数。
优选的,所述获取每类字符归一化后的出现概率,包括的具体步骤如下:
每类字符归一化后的出现概率的获取方法为:
其中,表示第/>类字符归一化后的出现概率,/>表示第/>类字符第一次更新后的概率,/>表示近期历史数据中字符的种类数。
优选的,所述根据每类字符在分布累计表中的对应长度对分布累计表进行更新,包括的具体步骤如下:
将近期历史数据中各类型字符在第一次更新后的分布累计表中的对应长度按照从大到小的顺序进行排序,排序完成后得到第一次更新后的长度序列,每一个长度值对应一类字符,将长度序列中对应的各个类型的字符进行排序,排序方式按长度序列出现的顺序进行排列,得到对应的字符序列,根据第一次更新后的长度序列与对应的字符序列构建分布累计表,将该分布累计表记为第一分布累计表;此时采集待压缩处理的医疗护理数据,将采集的待压缩处理的医疗护理数据记为待处理数据,读取待处理数据中的第一位,利用第一分布累计表对待处理数据中的第一位进行压缩处理,完成待处理数据中第一位数据的压缩处理,此时将待处理数据中的第一位数据置为近期历史数据的最后一位,原近期历史数据中的第一位舍弃,完成后得到第一更新近期历史数据,此时根据第一更新近期历史数据继续计算获取第二分布累计表,读取待处理数据中的第二位,利用第二分布累计表对待处理数据中的第二位进行压缩处理,完成待处理数据中第二位数据的压缩处理,继续更新近期历史数据,将待处理数据中的第二位数据置为第一更新近期历史数据的最后一位,第一更新近期历史数据中的第一位舍弃,完成后得到第二更新近期历史数据,以此类推,完成待处理数据中所有数据的编码压缩后迭代停止,得到更新后的分布累计表。
优选的,所述利用更新后的分布累计表对待处理的医疗护理数据进行编码压缩,得到压缩后的数据,将压缩后的数据进行存储,包括的具体步骤如下:
通过更新后的分布累计表,对待压缩处理的医疗护理数据利用编码进行编码压缩,得到压缩后的数据,将压缩后的数据传输存储到对应的存储单元。
本发明的技术方案的有益效果是:本方案通过对医疗护理数据中每类字符进行分析,根据字符在数据中的出现频率获取字符的平均周期,根据字符的平均周期获取字符在后续数据流中的出现概率;对字符在医疗护理数据中的出现索引进行聚类,将聚类边界、两个聚类中心与字符在医疗护理数据中出现索引最大最小值内的四等分点进行比较获取字符的周期贴切程度,以使对字符在后续数据中出现概率的预测结果更加准确;根据字符的周期贴切程度对该字符的出现概率进行加权获取字符的加权概率用来确定字符在分布累计表中的长度,在节省计算量的同时尽可能准确的预测字符的出现概率,使其达到更好地压缩效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种医疗护理数据智能处理方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种医疗护理数据智能处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种医疗护理数据智能处理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种医疗护理数据智能处理方法的步骤流程图,该方法包括以下步骤:
S001.采集历史医疗护理数据。
通过医院信息系统采集历史医疗护理数据,其中历史医疗护理数据包括就诊记录、手术记录、检查报告、化验结果、用药记录、手术操作记录;患者体温、脉搏、呼吸、血压等生命体征数据、实施的护理措施、护理记录、患者的病情观察、病情变化记录等数据。将采集得到的历史医疗护理数据记为原历史数据,统计原历史数据中字符种类,将字符种类记为,并统计原历史数据中每类字符出现的频率,将原历史数据中第/>类字符出现的频率记为/>。
S002.获取原历史数据中每类字符的平均周期,根据每类字符的平均周期获取每类字符的初始概率。
需要说明的是:传统的熵编码需要通过数据中各类字符的出现频率获取其在分布累计表中对应的长度,而医疗护理数据中的护理记录、患者生命体征数据等大量数据都有实时更新的需求。在数据进行实时更新时,/>编码通过将原有数据解压并重新对更新后对全部数据进行压缩或按照原有分布累计表对更新数据进行压缩,会造成计算量或压缩率的损失。而医疗护理数据中的各项实时更新数据往往具有周期性,诸如护理记录、患者生命体征数据需要经过一定的时间进行一次记录,故通过历史数据中各类字符出现的平均周期以及出现位置是否满足周期性对字符的后续出现概率进行预测,根据出现概率动态更新编码的分布累计表。
采集的医疗护理原历史数据的数据量较大,同时患者在医疗护理的逐渐进行过程中,身体状况会逐渐趋于稳定,故在选择历史数据作为参考时,根据原历史数据中的字符类型选择近期历史数据,其中近期历史数据的位数为:,其中/>表示近期历史数据的位数,/>表示原历史数据中字符种类,从采集获取的历史医疗护理数据的最后一位开始,前位医疗护理数据构成近期历史数据。统计近期历史数据中各类字符的频率,根据近期历史数据中每类字符的频率获取每类字符的平均周期,即:
其中,为近期历史数据中字符种类索引,/>为第/>类字符在近期历史数据中出现的平均周期,/>为第/>类字符在近期历史数据中的出现频率,计算获取近期历史数据中每一类字符的平均周期。由于医疗护理数据中各类字符的出现具有一定的周期性,通过获取字符的平均周期,根据字符上一次出现的位置索引预测该字符下一次出现的索引位置,当该类字符出现的字符索引间的距离接近一个周期时,该类字符出现的概率将逐渐变大。
获取近期历史数据中第类字符的索引序列,根据索引序列中最后一个坐标索引与近期历史数据中最后一个字符的坐标索引获取索引差值,将获取的索引差值记为第/>类字符的等待长度,根据每类字符的等待长度与平均周期获取每类字符的初始概率,每类字符的初始概率的获取方法为:
其中,i为近期历史数据中字符种类的索引,为第/>类字符的初始概率,/>为自然常数,/>为近期历史数据中最后一个字符的索引值,/>为第/>类字符在近期历史数据中最后出现位置的索引;由此获取近期历史数据中所有字符类型的初始概率。
需要说明的是:初始概率是在字符出现均具有周期性的条件下获取的字符出现概率。根据字符频率获取其出现周期后,根据字符出现的周期性可以认定字符下一次出现在周期索引处的概率最大。在到达周期索引之前,由于字符的等待长度越来越接近周期,字符的出现概率是逐渐增大的;在字符等待长度达到周期时,此时的字符出现概率最大,根据字符的周期性将其初始概率设置为一;如果字符等待长度超过字符的出现周期,认为字符可能不会再出现,故其概率缓慢下降,但并不会变为零,只会随着等待长度的逐渐增大慢慢趋近于零。
S003.获取近期历史数据中各类字符的周期性,根据周期性获取削减因子,根据削减因子获取加权概率。
需要说明的是:根据字符在近期历史数据中的出现索引可以判断该字符的出现是否符合周期性,对于越符合周期性的字符,其初始概率就越可信,而字符出现如果不很符合周期性,则将其视为周期性较弱字符。根据字符出现的周期特性获取周期削减因子对初始概率及逆行加权即可获取字符的后续出现概率。
遍历近期历史数据中的每一类字符,获取近期历史数据中每类字符的位置索引,按数据采集的时间顺序获取每类字符的索引序列,将第类字符的索引序列记为/>,其中索引序列/>的表现形式为:/>,其中/>表示第/>类字符,/>表示第/>类字符在近期历史数据中的时间索引值,/>表示第/>类字符的个数,/>表示第/>类字符的索引序列中,第/>个第/>类字符在近期历史数据中的时间索引值;根据每类字符的索引序列获取每类字符的周期削减因子,其中周期削减因子的获取方法为:
首先获取第类字符的索引序列中的最大时间索引值与最小时间索引值,分别记为/>,其中/>,/>,第/>类字符的索引序列中的最大时间索引值与最小时间索引值做差获取第/>类字符索引序列的极差,记为/>,近期历史数据中第字符至第/>字符之间的所有字符构成的数据段记为第/>类字符的目标数据段,其中目标数据段中包含/>,记为第/>类字符的目标数据段,获取第/>类字符的目标数据段的四等分点,即:
其中,为近期历史数据中第/>类字符索引序列的第/>个四等分点,四等分点一共有三个,/>为第/>类字符的索引序列中的最小时间索引值,/>为第/>类字符索引序列极差。
以类字符的索引序列中的最大时间索引值在近期历史数据中的位置与最小时间索引值在近期历史数据中的位置为聚类起始点,采用/>聚类算法进行聚类,聚类获取两个类簇,根据聚类结果,分别获取以最大时间索引值在近期历史数据中的位置为聚类起始点,对应聚类簇类中的最小值,和以最小时间索引值在近期历史数据中的位置为聚类起始点,对应聚类簇类中的最大值,将聚类簇类中的最大值与最小值求均值,将均值记为,将均值/>作为第/>类字符的聚类边界,聚类边界隶属于第/>类字符索引序列,其为第/>类字符索引序列索引范围中的一个索引值。
需要说明的是:医疗护理数据中存在大量周期性数据,对于周期性的数据,通过聚类获取的两簇中心与聚类边界应均匀分布在数据中;故将两簇中心、聚类边界与索引序列的四等分点作比较,该差距越大说明数据的出现周期性弱,该实际差距用来衡量数据出现的周期特性。但医疗护理数据中的数据存在周期性不明显的情况,故此处通过医疗护理数据中第类字符的索引分布与理想条件下数据均匀分布的索引的差异获取第/>类字符的周期性,该类字符的周期性越强,说明其计算的初始概率就越可信,反之,字符出现不严格满足周期性,说明计算的初始概率可信度不高。此处,计算四等分点的目的是获取理想状态(即数据完全符合周期性)下医疗护理数据按照周期均匀的索引分布,而获取的两聚类中心以及聚类边界反映了该类字符实际上的索引分布情况,通过两者的对比衡量字符出现是否严格满足周期性。
根据第类字符的簇类中心点、聚类边界点与第/>类字符索引序列的四等分点的加权差异作为第/>类字符的实际偏差,即:
式中为第/>类字符索引序列的实际偏差,/>分别为近期历史数据中第/>类字符索引序列的第1、2、3个四等分点,/>表示第/>类字符的索引序列中的最大时间索引值与最小时间索引值,/>表示第/>类字符的聚类边界,/>表示第/>类字符索引序列极差,/>分别表示权重,本实施例以/>为例进行叙述;当字符索引序列的聚类边界小于第一个四等分点或大于第三个四等分点的时候,该索引序列极度不均匀,故直接将实际偏差调大,置为极差。
根据第类字符索引序列的实际偏差与第/>类字符索引序列极差间的差异获取第/>类字符索引序列的均匀程度,即:
其中,表示第/>类字符索引序列的均匀程度,/>表示第/>类字符索引序列的实际偏差,/>表示第/>类字符索引序列极差;均匀程度越小,说明索引序列分布越均匀;当均匀程度为1时,说明索引序列分布较为杂乱,当索引序列均匀程度为0时,说明索引序列分布及其均匀。
根据第类字符索引序列的均匀程度获取第/>类字符索引序列的周期削减因子,即:
其中,表示第/>类字符的周期削减因子,/>表示第/>类字符的索引序列的均匀程度,/>为自然常数;均匀程度反映了字符在近期历史数据中的出现索引分布均匀情况,当字符索引序列分布及其均匀时,周期削减因子为1,不对初始概率进行削减;当字符分布不够均匀时,周期削减因子调整为极小,对初始概率进行较大调整。
根据第类字符的周期削减因子对第/>类字符的初始概率进行调整:
其中,表示第/>类字符第一次更新后的概率,记为第一更新概率,/>表示第/>类字符的周期削减因子,/>表示第/>类字符的初始概率;根据周期削减因子对初始概率进行调整,令符合周期性的字符在其周期到来的时候有更高的出现概率,而不符合周期性的字符在其平均周期到来的时候出现概率较低,由此预测医疗护理数据中后续出现各类字符的概率;同理获取近期历史数据中所有类型字符第一次更新后的概率。
S004.根据第一更新概率调整分布累计表,获取第一更新分布累计表。
根据近期历史数据中各类字符的第一更新概率,将近期历史数据中所有字符的第一更新概率进行归一化,即:
其中,表示第/>类字符归一化后的出现概率,/>表示第/>类字符第一次更新后的概率,/>表示近期历史数据中字符的种类数;通过第一次更新后各类字符归一化的出现概率对分布累计表进行更新,获取第一次更新后各类型字符在分布累计表中的对应长度:
其中,表示第/>类字符第一次更新后在分布累计表中的对应长度,/>为近期历史数据中字符的种类数,/>表示第/>类字符归一化后的出现概率,/>表示四舍五入;同理计算获取近期历史数据中所有类型字符第一次更新后在分布累计表中的对应长度。
将近期历史数据中各类型字符在第一次更新后的分布累计表中的对应长度按照从大到小的顺序进行排序,排序完成后得到第一次更新后的长度序列,每一个长度值对应一类字符,将长度序列中对应的各个类型的字符进行排序,排序方式按长度序列出现的顺序进行排列,得到对应的字符序列,例如有四类字符,其中/>的长度分别为/>,且/>,则长度序列为,则对应的字符序列为:/>,根据获取得到的第一次更新后的长度序列与对应的字符序列构建分布累计表,将该分布累计表记为第一分布累计表,其中分布累计表的构建方式与传统/>编码的构建方式相同,本实施例不再进行赘述。
第一次更新完成后,获取得到第一分布累计表,此时采集待压缩处理的医疗护理数据,将采集的待压缩处理的医疗护理数据记为待处理数据,读取待处理数据中的第一位,利用第一分布累计表对待处理数据中的第一位进行压缩处理,完成待处理数据中第一位数据的压缩处理,此时更新近期历史数据,此时将待处理数据中的第一位数据置为近期历史数据的最后一位,原近期历史数据中的第一位舍弃,完成后得到第一更新近期历史数据,此时根据第一更新近期历史数据继续计算获取第二分布累计表,读取待处理数据中的第二位,利用第二分布累计表对待处理数据中的第二位进行压缩处理,完成待处理数据中第二位数据的压缩处理,继续更新近期历史数据,将待处理数据中的第二位数据置为第一更新近期历史数据的最后一位,第一更新近期历史数据中的第一位舍弃,完成后得到第二更新近期历史数据,以此类推,完成待处理数据中所有数据的编码压缩后迭代停止。
S005.将压缩编码后的数据进行传输存储,接收端进行解压获取目标数据。
通过自适应生成的分布累计表,对待进行编码处理的医疗护理数据利用编码进行编码压缩,得到压缩后的数据,将压缩后的数据传输存储到对应的存储单元,当需要调取对应的医疗护理数据时,通过调取对应的压缩文件,利用解压单元进行解压获取原始的医疗护理数据。
通过以上步骤,完成了一种医疗护理数据智能处理方法。
本发明实施例通过对医疗护理数据中每类字符进行分析,根据字符在数据中的出现频率获取字符的平均周期,根据字符的平均周期获取字符在后续数据流中的出现概率;对字符在医疗护理数据中的出现索引进行聚类,将聚类边界、两个聚类中心与字符在医疗护理数据中出现索引最大最小值内的四等分点进行比较获取字符的周期贴切程度,以使对字符在后续数据中出现概率的预测结果更加准确;根据字符的周期贴切程度对该字符的出现概率进行加权获取字符的加权概率用来确定字符在分布累计表中的长度,在节省计算量的同时尽可能准确的预测字符的出现概率,使其达到更好地压缩效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种医疗护理数据智能处理方法,其特征在于,该方法包括以下步骤:
获取历史医疗护理数据,根据历史医疗护理数据中字符类型获取近期历史数据;
根据近期历史数据中每类字符频率获取近期历史数据中每类字符的平均周期,获取每类字符的索引序列,根据每类字符索引序列中最后一个坐标索引与近期历史数据中最后一个字符的坐标索引差值获取每类字符的等待长度,根据每类字符的等待长度与平均周期获取每类字符的初始概率;
根据每类字符的索引序列获取每类字符的目标数据段,获取每类字符的目标数据段的四等分点;通过对等分点进行聚类获取簇类中心与聚类边界;根据每类字符的簇类中心点、聚类边界点以及每类字符索引序列的四等分点的加权差异获取每类字符的实际偏差;根据每类字符索引序列的实际偏差与每类字符索引序列极差间的差异获取每类字符索引序列的均匀程度;根据每类字符索引序列的均匀程度获取每类字符索引序列的周期削减因子;根据每类字符的周期削减因子对每类字符的初始概率进行调整,获取每类字符归一化后的出现概率;
根据每类字符归一化后的出现概率获取每类字符在分布累计表中的对应长度;根据每类字符在分布累计表中的对应长度对分布累计表进行更新,获取更新后的分布累计表,获取待处理的医疗护理数据,利用更新后的分布累计表对待处理的医疗护理数据进行编码压缩,得到压缩后的数据,将压缩后的数据进行存储。
2.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据近期历史数据中每类字符频率获取近期历史数据中每类字符的平均周期,包括的具体步骤如下:
统计近期历史数据中各类字符的频率,每类字符的平均周期的获取方法为:
其中,为近期历史数据中字符种类索引,/>为第/>类字符在近期历史数据中出现的平均周期,/>为第/>类字符在近期历史数据中的出现频率。
3.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据每类字符的等待长度与平均周期获取每类字符的初始概率,包括的具体步骤如下:
每类字符的初始概率的获取方法为:
其中,为近期历史数据中字符种类的索引,/>为第/>类字符的初始概率,/>为自然常数,/>为近期历史数据中最后一个字符的索引值,/>为第/>类字符在近期历史数据中最后出现位置的索引,/>为第/>类字符在近期历史数据中出现的平均周期。
4.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据每类字符的索引序列获取每类字符的目标数据段,获取每类字符的目标数据段的四等分点,包括的具体步骤如下:
获取第类字符的索引序列中的最大时间索引值与最小时间索引值,分别记为,/>表示第/>类字符在近期历史数据中的时间索引值,第/>类字符的索引序列中的最大时间索引值与最小时间索引值做差获取第/>类字符索引序列的极差,记为/>,近期历史数据中第/>个字符至第/>个字符之间的所有字符构成的数据段记为第/>类字符的目标数据段,获取第/>类字符的目标数据段的四等分点,即:
其中,为近期历史数据中第/>类字符索引序列的第/>个四等分点,四等分点一共有三个,/>为第/>类字符的索引序列中的最小时间索引值,/>为第/>类字符索引序列极差。
5.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据每类字符的簇类中心点、聚类边界点以及每类字符索引序列的四等分点的加权差异获取每类字符的实际偏差,包括的具体步骤如下:
实际偏差获取的方法为:
式中为第/>类字符索引序列的实际偏差,/>分别为近期历史数据中第/>类字符索引序列的第1、2、3个四等分点,/>表示第/>类字符的索引序列中的最大时间索引值与最小时间索引值,/>表示第/>类字符的聚类边界,/>表示第/>类字符索引序列极差,/>分别表示权重。
6.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据历史医疗护理数据中字符类型获取近期历史数据,包括的具体步骤如下:
根据历史医疗护理数据中的字符类型选择近期历史数据,其中近期历史数据的位数为,其中/>表示近期历史数据的位数,/>表示原历史数据中字符种类,从采集获取的历史医疗护理数据的最后一位开始,前/>位医疗护理数据构成近期历史数据。
7.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据每类字符索引序列的均匀程度获取每类字符索引序列的周期削减因子,包括的具体步骤如下:
削减因子的获取方法为:
其中,表示第/>类字符的周期削减因子,/>表示第/>类字符的索引序列的均匀程度,/>为自然常数。
8.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述获取每类字符归一化后的出现概率,包括的具体步骤如下:
每类字符归一化后的出现概率的获取方法为:
其中,表示第/>类字符归一化后的出现概率,/>表示第/>类字符第一次更新后的概率,/>表示近期历史数据中字符的种类数。
9.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述根据每类字符在分布累计表中的对应长度对分布累计表进行更新,包括的具体步骤如下:
将近期历史数据中各类型字符在第一次更新后的分布累计表中的对应长度按照从大到小的顺序进行排序,排序完成后得到第一次更新后的长度序列,每一个长度值对应一类字符,将长度序列中对应的各个类型的字符进行排序,排序方式按长度序列出现的顺序进行排列,得到对应的字符序列,根据第一次更新后的长度序列与对应的字符序列构建分布累计表,将该分布累计表记为第一分布累计表;此时采集待压缩处理的医疗护理数据,将采集的待压缩处理的医疗护理数据记为待处理数据,读取待处理数据中的第一位,利用第一分布累计表对待处理数据中的第一位进行压缩处理,完成待处理数据中第一位数据的压缩处理,此时将待处理数据中的第一位数据置为近期历史数据的最后一位,原近期历史数据中的第一位舍弃,完成后得到第一更新近期历史数据,此时根据第一更新近期历史数据继续计算获取第二分布累计表,读取待处理数据中的第二位,利用第二分布累计表对待处理数据中的第二位进行压缩处理,完成待处理数据中第二位数据的压缩处理,继续更新近期历史数据,将待处理数据中的第二位数据置为第一更新近期历史数据的最后一位,第一更新近期历史数据中的第一位舍弃,完成后得到第二更新近期历史数据,以此类推,完成待处理数据中所有数据的编码压缩后迭代停止,得到更新后的分布累计表。
10.根据权利要求1所述的一种医疗护理数据智能处理方法,其特征在于,所述利用更新后的分布累计表对待处理的医疗护理数据进行编码压缩,得到压缩后的数据,将压缩后的数据进行存储,包括的具体步骤如下:
通过更新后的分布累计表,对待压缩处理的医疗护理数据利用编码进行编码压缩,得到压缩后的数据,将压缩后的数据传输存储到对应的存储单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311210790.1A CN116961675B (zh) | 2023-09-20 | 2023-09-20 | 一种医疗护理数据智能处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311210790.1A CN116961675B (zh) | 2023-09-20 | 2023-09-20 | 一种医疗护理数据智能处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116961675A true CN116961675A (zh) | 2023-10-27 |
CN116961675B CN116961675B (zh) | 2023-11-28 |
Family
ID=88447711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311210790.1A Active CN116961675B (zh) | 2023-09-20 | 2023-09-20 | 一种医疗护理数据智能处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116961675B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117171399A (zh) * | 2023-11-02 | 2023-12-05 | 吉林省有继科技有限公司 | 基于云平台的新能源数据优化存储方法 |
CN117176178A (zh) * | 2023-11-03 | 2023-12-05 | 深圳市华宜达通信设备有限公司 | 一种光电通信系统的数据处理方法 |
CN117254819A (zh) * | 2023-11-20 | 2023-12-19 | 深圳市瑞健医信科技有限公司 | 一种医疗废物智能监管系统 |
CN117373677A (zh) * | 2023-12-07 | 2024-01-09 | 深圳问止中医健康科技有限公司 | 基于数字化医疗档案管理的智能健康监护系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160248440A1 (en) * | 2015-02-11 | 2016-08-25 | Daniel Greenfield | System and method for compressing data using asymmetric numeral systems with probability distributions |
CN112107432A (zh) * | 2019-06-21 | 2020-12-22 | 尤妮佳股份有限公司 | 信息处理装置、信息处理方法、信息处理系统及存储介质 |
US20200413106A1 (en) * | 2019-06-28 | 2020-12-31 | Microsoft Technology Licensing, Llc | Features of range asymmetric number system encoding and decoding |
CN114520659A (zh) * | 2022-02-21 | 2022-05-20 | 上海大学 | 结合rANS和LZ4编码的数据无损压缩、解码方法 |
CN115459782A (zh) * | 2022-08-29 | 2022-12-09 | 北京思维实创科技有限公司 | 基于时序分割和聚类的工业物联网高频数据压缩方法 |
CN116346289A (zh) * | 2023-05-30 | 2023-06-27 | 泰山学院 | 一种用于计算机网络中心的数据处理方法 |
-
2023
- 2023-09-20 CN CN202311210790.1A patent/CN116961675B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160248440A1 (en) * | 2015-02-11 | 2016-08-25 | Daniel Greenfield | System and method for compressing data using asymmetric numeral systems with probability distributions |
CN112107432A (zh) * | 2019-06-21 | 2020-12-22 | 尤妮佳股份有限公司 | 信息处理装置、信息处理方法、信息处理系统及存储介质 |
US20200413106A1 (en) * | 2019-06-28 | 2020-12-31 | Microsoft Technology Licensing, Llc | Features of range asymmetric number system encoding and decoding |
CN114520659A (zh) * | 2022-02-21 | 2022-05-20 | 上海大学 | 结合rANS和LZ4编码的数据无损压缩、解码方法 |
CN115459782A (zh) * | 2022-08-29 | 2022-12-09 | 北京思维实创科技有限公司 | 基于时序分割和聚类的工业物联网高频数据压缩方法 |
CN116346289A (zh) * | 2023-05-30 | 2023-06-27 | 泰山学院 | 一种用于计算机网络中心的数据处理方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117171399A (zh) * | 2023-11-02 | 2023-12-05 | 吉林省有继科技有限公司 | 基于云平台的新能源数据优化存储方法 |
CN117176178A (zh) * | 2023-11-03 | 2023-12-05 | 深圳市华宜达通信设备有限公司 | 一种光电通信系统的数据处理方法 |
CN117176178B (zh) * | 2023-11-03 | 2024-04-12 | 深圳市华宜达通信设备有限公司 | 一种光电通信系统的数据处理方法 |
CN117254819A (zh) * | 2023-11-20 | 2023-12-19 | 深圳市瑞健医信科技有限公司 | 一种医疗废物智能监管系统 |
CN117254819B (zh) * | 2023-11-20 | 2024-02-27 | 深圳市瑞健医信科技有限公司 | 一种医疗废物智能监管系统 |
CN117373677A (zh) * | 2023-12-07 | 2024-01-09 | 深圳问止中医健康科技有限公司 | 基于数字化医疗档案管理的智能健康监护系统 |
CN117373677B (zh) * | 2023-12-07 | 2024-03-08 | 深圳问止中医健康科技有限公司 | 基于数字化医疗档案管理的智能健康监护系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116961675B (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116961675B (zh) | 一种医疗护理数据智能处理方法 | |
Choi et al. | Towards the limit of network quantization | |
CN115670418B (zh) | 一种基于智能手表用户信息的数据存储方法 | |
CN116153452B (zh) | 基于人工智能的医疗电子病历存储系统 | |
WO2021139241A1 (zh) | 基于人工智能的患者分群方法、装置、设备及存储介质 | |
CN116388767B (zh) | 用于软件开发数据的安全管理方法 | |
CN115882868B (zh) | 一种气体监测数据智能存储方法 | |
CN116153453B (zh) | 基于云边协同的智能戒指信息管理方法及系统 | |
CN117290364B (zh) | 一种市场调查数据智能存储方法 | |
CN116170027B (zh) | 一种毒检设备数据管理系统及处理方法 | |
CN117155407B (zh) | 一种智慧镜柜消毒日志数据优化存储方法 | |
CN117316301B (zh) | 一种基因检测数据智能压缩处理方法 | |
CN115868941A (zh) | 用于智能戒指的信息管理方法 | |
CN116700630A (zh) | 基于物联网的有机无机复混肥料生产数据优化存储方法 | |
Raju et al. | Compression of wearable body sensor network data using improved two-threshold-two-divisor data chunking algorithms | |
CN117112718A (zh) | 一种车载电脑系统数据快速存储方法 | |
CN117481628A (zh) | 一种可穿戴式多参数无创血流动力学监测方法及系统 | |
CN117014519A (zh) | 一种数据传输方法及医院智能传输系统 | |
CN116631563B (zh) | 一种医药行业大数据存储及智能匹配方法 | |
CN117373600A (zh) | 一种医疗检测车数据优化存储方法 | |
Kim et al. | A low cost quadratic level ECG compression algorithm and its hardware optimization for body sensor network system | |
CN117076408A (zh) | 一种温度监测大数据传输方法 | |
CN115964347B (zh) | 一种市场监管监测中心数据的智能存储方法 | |
CN117376430A (zh) | 基于dcs的工业数据快速传输方法及系统 | |
CN115695564B (zh) | 一种物联网数据的高效传输方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |