CN112863653A - 一种心电数据压缩方法及装置 - Google Patents
一种心电数据压缩方法及装置 Download PDFInfo
- Publication number
- CN112863653A CN112863653A CN202110224551.6A CN202110224551A CN112863653A CN 112863653 A CN112863653 A CN 112863653A CN 202110224551 A CN202110224551 A CN 202110224551A CN 112863653 A CN112863653 A CN 112863653A
- Authority
- CN
- China
- Prior art keywords
- data
- compression
- compression scheme
- electrocardiogram
- electrocardiographic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000013144 data compression Methods 0.000 title claims abstract description 64
- 238000007906 compression Methods 0.000 claims abstract description 197
- 230000006835 compression Effects 0.000 claims abstract description 190
- 230000002787 reinforcement Effects 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000005070 sampling Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000002565 electrocardiography Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 206010042600 Supraventricular arrhythmias Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000718 qrs complex Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/04—Protocols for data compression, e.g. ROHC
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明涉及一种心电数据压缩方法,包括以下步骤:收集心电数据样本建立心电数据样本集,基于心电数据特征建立备选压缩方案空间;基于所述心电数据段样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型;将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案;基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩。本发明提供的心电数据压缩方法充分考虑了心电数据的特征,适应性强,压缩比高。
Description
技术领域
本发明涉及心电数据压缩技术领域,尤其涉及一种心电数据压缩方法、装置及计算机存储介质。
背景技术
心电图检查早已成为临床医学的常规检查技术之一。凡是有医疗活动的地方,都有心电图。据美国心脏协会(AHA)的要求,一条心电图信号必须由3条单独的导联组成,ADC的分辨率为10位,每秒需记录500个样本。某些特别的心电图检查,如动态心电图可能需要12个导联,ADC的分辨率为11位,每秒记录1000个样本,持续记录时长超过24小时。如果将该心电信号转换为数字格式,单条心电图记录所需的计算机存储空间将超过1.32GB。
在美国,出于比较和分析的目的,每年需要记录的心电图超过1000万条。在中国,据报道,每年有3500万人次做动态心电图检查。此外,近几年来,各大医院都已着手配备或已经配备了远程心电监测系统。如此海量的心电图数据传输和存储需求,对有效的心电图数据压缩方法提出了更高的要求。
目前,用于心电图数据压缩的方法主要有:转折点法和AZTEC法。
转折点法是通过分析采样点的趋势并将原始信号中每两个数据点减少为编码信号中的一个数据点来实现对原始数据压缩的。“转折点法”也因为保留了信号中所有的转折点(信号斜率正负符号发生改变的点)而得名。转折点法有两个主要优点:①简单易实现;②对低信息量区和高信息量区具有同等的数据压缩,低信息量区如等电位区、低频的P波和T波。转折点法的缺点为:①必须使用两次该算法来压缩原始数据,转折点法在应用一次以后仍然能保持QRS复合波的分辨率,但在第2次以后就会产生相应的畸变;②由于保存点的时间间隔不相等,会引起短期的时间失真。
AZTEC,全称Amplitude Zone Time Epoch Coding,它主要是通过将原始心电数据转化成较短的直线和斜线来处理。处理流程一般包括三个部分:生成水平线、生成斜线、曲线平滑化,其中曲线平滑化基于抛物线拟合实现。该方法的优点在于数据压缩率大,且编码格式与信号区间的特征相符,同时还能在一定程度上消除基线噪声;缺点在于存在一定程度的信号失真,经过算法处理后的波形与医生习惯看到的波形会不一样。目前,AZTEC数据压缩算法,已被广泛应用于心电监护仪和数据库的数据压缩领域。
此外,也有直接将一般的数据压缩方法,比如静态的霍夫曼编码、自适应或动态的霍夫曼编码等,应用到心电图数据压缩的。
总结来看,一般用途的数据压缩方法,无论是静态方法,还是自适应的方法,都存在如下不足:①一方面在数据压缩的易错性方面存在缺陷;②另一方面因为没有充分利用心电数据的独特特点,压缩率难以提高。至于转折点法和AZTEC法,则存在信号失真的问题。
发明内容
有鉴于此,有必要提供一种心电数据压缩方法、装置及计算机存储介质,用以解决目前的心电数据压缩方案所存在的心电数据特点利用不充分,适应性差,和压缩率低的问题。
本发明提供一种心电数据压缩方法,包括以下步骤:
收集心电数据样本建立心电数据样本集,基于心电数据特征建立备选压缩方案空间;
基于所述心电数据样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型;
将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案;
基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩。
进一步的,收集心电数据段样本建立心电数据段样本集,具体为:
收集长度不同的多段心电数据样本,并将每一所述心电数据样本复制多份,得到所述心电数据样本集。
进一步的,基于心电数据特征建立备选压缩方案空间,具体为:
基于心电数据的不同局部特征建立不同的主压缩方案集合,每一所述主压缩方案集合均包含多个针对数据点进行压缩的子压缩方案,结合多个所述主压缩方案集合得到所述备选压缩方案空间。
进一步的,基于所述心电数据样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型,具体为:
将所述心电数据段样本输入所述深度强化学习网络,得到多个备选压缩方案;
采用归一化函数计算每一所述备选压缩方案中各控制参数的可选值的概率,按照概率对各控制参数的可选值进行抽样,得到各控制参数的实际值;
基于各控制参数的实际值确定输出压缩方案;
采用所述输出压缩方案对所述心电数据段样本进行实际压缩,并计算输出压缩方案进行压缩的损失值;
根据所述损失值对所述深度强化学习网络进行修正;
判断是否满足终止条件,如果是,则输出当前深度强化学习网络模型作为所述压缩方案选择模型,否则采用下一个心电数据段样本进行深度强化学习网络的训练。
进一步的,所述深度强化学习网络包括空间金字塔层以及全连接层。
进一步的,将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案,具体为:
将待压缩心电数据划分为多段,并输入所述压缩方案选择模型,得到每一条数据段的控制参数的概率,选择所有数据段中概率值最大的控制参数作为待压缩心电数据的最终控制参数,基于最终控制参数确定所述匹配压缩方案。
进一步的,将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案之前,还包括:
对所述待压缩心电数据进行delta编码,得到相邻两个数据点之间的差值,判断所有差值是否相等,如果是,则采用等差数列对所述待压缩心电数据进行建模及数据压缩,否则将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案。
进一步的,基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩,具体为:
所述待压缩心电数据包括电压值数据和时间戳数据;
针对时间戳数据的特征设置针对时间戳数据的固定压缩方案;
采用所述固定压缩方案对所述时间戳数据进行数据压缩;
基于所述匹配压缩方案对所述电压值数据进行数据压缩。
本发明还提供一种心电数据压缩装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述心电数据压缩方法。
本发明还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述心电数据压缩方法。
有益效果:本发明首先基于心电数据特征建立备选压缩方案空间,然后基于深度强化学习的方法,从备选的压缩方案空间中,为每个数据点选择最合适的压缩方案。相比传统的基于先验知识手工构建特征的数据压缩而言,由于本方法是通过自动挖掘心电数据的内在特征而建立备选压缩方案空间,进而选取最适合的压缩方案,因此其自适应性更强;本方法将压缩方案的选择问题,转换为了一个多标签的分类问题,使用了深度学习,借助深度学习的数据挖掘和重构能力,能够更好的保持心电数据的特征、保证编码效果,同时获得较高的数据压缩比。同时,由于引入深度强化学习技术,在没有标签的情况下,即可生成输入心电数据的合适的压缩方案参数。
附图说明
图1为本发明提供的心电数据压缩方法第一实施例的方法流程图;
图2a为包含多种数据分布模式的心电数据示意图;
图2b为心电数据不同的数据分布模式的特征示意图;
图3本发明提供的心电数据压缩方法第一实施例的压缩方案选择阶段划分示意图;
图4为本发明提供的心电数据压缩方法第一实施例的深度强化学习网络训练示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
如图1所示,本发明的实施例1提供了心电数据压缩方法,以下简称本方法,包括以下步骤:
S1、收集心电数据样本建立心电数据样本集,基于心电数据特征建立备选压缩方案空间;
S2、基于所述心电数据样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型;
S3、将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案;
S4、基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩。
本实施例首先基于心电数据特征建立备选压缩方案空间,然后基于深度强化学习的方法,从备选的压缩方案空间中,为每个数据点选择最合适的压缩方案。相比传统的基于先验知识手工构建特征的数据压缩而言,由于本方法是通过自动挖掘心电数据的内在特征而建立备选压缩方案空间,进而选取最适合的压缩方案,因此其自适应性更强;本方法将压缩方案的选择问题,转换为了一个多标签的分类问题,使用了深度学习,借助深度学习的数据挖掘和重构能力,能够更好的保持心电数据的特征、保证编码效果,同时获得较高的数据压缩比。同时,由于引入深度强化学习技术,在没有标签的情况下,即可生成输入心电数据的合适的压缩方案参数。
优选的,收集心电数据段样本建立心电数据段样本集,具体为:
收集长度不同的多段心电数据样本,并将每一所述心电数据样本复制多份,得到所述心电数据样本集。
收集M个心电数据样本,长短不一定相同,并将每个心电数据样本复制N份,构建心电数据样本集。
优选的,基于心电数据特征建立备选压缩方案空间,具体为:
基于心电数据的不同局部特征建立不同的主压缩方案集合,每一所述主压缩方案集合均包含多个针对数据点进行压缩的子压缩方案,结合多个所述主压缩方案集合得到所述备选压缩方案空间。
压缩算法实际上是指两种算法:
压缩算法:将输入的数据χ,生成一种需要较少二进制位的表示χc;
重构算法:对压缩后的数据表示χc执行操作,生成重构结果y。
如果重构结果y与输入的数据χ相同,则为无损压缩。如果重构结果y与输入的数据χ不同,则为有损压缩。按照惯例,通常将压缩算法和重构算法合在一起,称为压缩算法。
通常,我们将针对特定数据的压缩算法开发分为两个阶段:建模阶段和编码阶段。
建模阶段:通过分析数据的内在特点,主要是数据的冗余情况,并用一个模型来加以描述。比如差分编码方法(delta、delta-of-delta)就可以用来对相邻值比较接近的序列数据建模。
编码阶段:以编码方式来描述该模型,以及描述数据与模型之间的差别,即残差,通常采用二进制符号系统。
经上述两阶段处理后,我们只需要传输和储存模型的参数与残差序列就能实现压缩。
对于心电数据,我们通过实际观察发现,它有如下几个重要的特征:
1、时间相关性和测量值相近性。
心电图数据往往是以相对固定的时间间隔去收集的,时间间隔也称为采样间隔。这种方式将导致:
a.所记录的数据中,时间戳是以一个相对固定的值稳定递增的;
b.连续时间戳上所获得的测量值比较接近。
表1为MIT-BIH室上性心律失常数据集,简称SVDB数据集中记录号为801的部分心电信号记录。
表1、SVDB数据集中记录号为801的部分信号记录值
从表1中可以看到,该条心电图的时间戳以大致8ms(有些为7ms)的固定间隔递增,其中从00:00:31.320到00:00:31.375所记录的心电图信号值比较接近。
2、数据分布模式的多样性。
图2a为实际采集的一份心电图数据,从图2中可以看到该份心电图,至少表现出了四种不同的局部数据分布模式,分别为:模式A、模式B、模式C以及模式D。实际心电图中,这类情况也十分常见。
3、数据子段偏好方案的多样性。
如图2b所示,图2b中示出了三个不同数据分布模式的数据子段,分别为:A区域、B区域以及C区域。对于A 区域和B区域的测量值,更适合通过一阶或二阶差分的方式去建模,这样可以保留相邻两个采样点之间的联系或相邻三个采样点之间的动态关系。而对于C点区域,因为是峰点/谷点区域,该点两边的数据有些情况下是对称的,比较相近,可以通过异或运算压缩数据,去掉冗余的数据,只留下不同的数据。
以上特征对于指导实际工作中如何设计或选择有效的数据压缩算法至关重要。
根据心电图电压值数据中的结构类型(冗余)特点,这里,我们定义了4种适合对此类冗余进行建模的方法,如表2所示。
表2、四种数据冗余建模方法
表2中,vi为i采样时刻的电压值,vi-1为i-1采样时刻的电压值,vi-2为i-2采样时刻的电压值,i-1为i的前一采样时刻,i-2为i-1的前一采样时刻。
适合于对上述建模模型与原始心电输入数据之间的差别进行编码的方法如表3所示。
表3、三种模型和残差编码方法
接下来,就是备选压缩方法空间S的构建了。理论上,我们随机的从表2中选取一种建模方法与表3中的一种编码方法进行组合,就可以得到一种压缩方案。两个表中所有方法的不同组合就构成了备选压缩方法空间S。但是这种操作弊端在于需要在编码的结果中增加模式选择(5比特)和对应参数(2比特)的控制信息位。如表4所示,很容易计算出,控制信息位占原始数据编码所需比特数的比值接近50%。
表2、压缩方案空间S的参数化表示
表3中6类编码方法具体指:偏移编码的两类,位掩码编码的三类以及尾0编码的一类。偏移编码的两类对应两种输出格式,位掩码编码的三类对应两种输出格式,“1个值”的输出模式中,至多2位掩码,因此有两种情况:1位掩码编码和2位掩码;“2个值”的情况下,只用了2位掩码;因此,位掩码编码的两种输出格式总共是三类。位掩码编码三类,偏移编码两类,尾0编码一类。总共2+3+1=6类。
针对上述问题,我们将每个数据点的压缩方案选择分为两个阶段:把从大量备选压缩方案中选择最合适的方案问题,转化成了一个先主后副的两阶段选择问题:先选择适合包含数据点的数据段的主方案;对具体的数据点,遍历子方案中选择最优压缩方案。具体的,如图3所示:
第一阶段,针对心电数据片段提取全局特征,基于全局特征选择合适的主压缩方案。本实施例中的主压缩方案是根据编码方法进行划分的,包括以掩码编码为主的方案、以偏移编码为主的方案以及掩饰码编码和偏移编码相组合的混合编码三类方案,如表5所示。然后从表2中选择数据冗余建模方法,可能要对数据进行多次冗余建模,比如先对数据进行一阶编码操作,然后对得到的数据继续进行异或运算,再进行一阶差分运算等等,直到数据中的冗余降到很低。为了降到运算的复杂度,这里我们最多进行四次冗余建模,即冗余建模方法1,冗余建模方法2,冗余建模方法3,冗余建模方法4,再加上offByteShift和maskByteShift两个参数,一起构成了备选压缩方案的参数空间;
第二阶段,处理心电数据片段中的每个数据点,遍历相应主压缩方案下的所有子压缩方案,从中选择出最好的那一种子压缩方案进行压缩。
经上述处理后,控制信息位只需2比特。
具体的,本实施例选取的三类适合心电数据的主压缩方案,如表5所示。
表3、三类主压缩方案
将压缩方案空间S参数化表示进一步细化,如表6所示。
表6、参数化的压缩方案空间
其中,压缩方案为压缩单个数据点的基本单元,可表示为一个四元组其中χ为输入的待压缩数据点值,χc为压缩后的数据点表示,λχ和分别为χ和χc对应的参数。压缩方案空间指的是由一系列压缩方案组合的集合,用S={s1,s2,...,sn}表示。每个数据点都有一个适合它的单一的压缩方案空间且将通过该方案空间中的一个特定的压缩方案sj∈Si进行压缩存储。
优选的,所述深度强化学习网络包括空间金字塔层以及全连接层。
考虑到空间金字塔池化网络结构能够表现出结构类型信息的冗余结构,冗余结构即结构类型信息所需的最小数据段长度不一样,因此本实施例在深度强化学习网络中加入了空间金字塔池化网络结构,即空间金字塔层。
具体的,如图4所示,本实施例构建的神经网络模型,包括空间金字塔层、全连接层1、全连接层2以及全连接层3。
优选的,基于所述心电数据样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型,具体为:
将所述心电数据段样本输入所述深度强化学习网络,得到多个备选压缩方案;
采用归一化函数计算每一所述备选压缩方案中各控制参数的可选值的概率,按照概率对各控制参数的可选值进行抽样,得到各控制参数的实际值;
基于各控制参数的实际值确定输出压缩方案;
采用所述输出压缩方案对所述心电数据段样本进行实际压缩,并计算输出压缩方案进行压缩的损失值;
根据所述损失值对所述深度强化学习网络进行修正;
判断是否满足终止条件,如果是,则输出当前深度强化学习网络模型作为所述压缩方案选择模型,否则采用下一个心电数据段样本进行深度强化学习网络的训练。
将压缩方案的匹配划分为两个阶段后,第一阶段的压缩方案选择问题,可以看作是一个多标签分类问题,标签为所有控制参数的可选值,本实施例中控制参数共23个,即表6中“取值范围”的23个值。由于没有带标签的训练样本,因此使用强化学习来训练获得上述几个控制参数。
如图4所示,具体训练流程如下:
随机选择M个心电数据段样本(长短不一定相同),并将每个心电数据段样本复制N份,输入空间金字塔层,然后输入到有3个隐含层的全连接网络中,三个隐含层即如4中全连接层1、全连接层2以及全连接层3。心电数据段样本经过深度强化学习网络后,将得到M*N个备选压缩方案的控制参数cop,M*N个备选压缩方案对应M*N个心电数据段样本;用归一化函数region softmax计算得到每一个备选压缩方案copi中每个控制参数的可选值的概率,然后按照该概率去采样选择相应控制参数的实际参数值,计算得到copi中每个控制参数的实际的参数值后,将copi输入到底层的压缩算法进行实际压缩并得到压缩率f(copi),并计算出损失值,并依此进行深度强化学习网络参数的更新和反向传播,实现深度强化学习网络的训练。
按照上述步骤依次针对每一个心电数据样本进行训练,直到达到终止条件,例如达到最大次数,则停止训练,输出深度强化学习网络模型,得到压缩方案选择模型。
优选的,计算备选压缩方案进行压缩的损失值,具体为:
其中,loss为损失值;M为收集的长度不一的心电数据段样本的数量,N为心电数据段样本复制的份数;f(cop)为奖赏函数,即在选用备选压缩方案cop的条件下,心电数据段样本的压缩率;fn(cop)为归一化后的奖赏函数,判断选用备选压缩方案cop下的心电数据段样本的压缩率是否比N份心电数据段样本(同一数据段的N次不同采样)的平均压缩率高,如果是,则正反馈,否则负反馈,归一化后的奖赏函数用来描述心电数据段样本的压缩效果;fn(copi)为第i个心电数据段样本的奖赏函数值,即压缩率值;Hcs(copi)为第i个心电数据段样本的总交叉熵;λ为正则化常数,λ取值0.01或0.001;H(cop)为所有用作熵正则化的备选压缩方案的平均熵,用于避免网络陷入局部最优;cop={op1,op2,L,op7}为备选压缩方案的控制参数集合,opi为备选压缩方案的第i个控制参数的值,copi表示第i个心电数据段样本的控制参数集合。
优选的,将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案,具体为:
将待压缩心电数据划分为多段,并输入所述压缩方案选择模型,得到每一条数据段的控制参数的概率,选择所有数据段中概率值最大的控制参数作为待压缩心电数据的最终控制参数,基于最终控制参数确定所述匹配压缩方案。
在进行压缩方案匹配时,可以把整条待压缩心电数据或待压缩心电数据的局部数据段输入到压缩方案选择模型中,得到每一数据段的控制参数的概率,选择所有数据段中概率值最大的作为该输入数据的最终控制参数。
优选的,将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案之前,还包括:
对所述待压缩心电数据进行delta编码,得到相邻两个数据点之间的差值,判断所有差值是否相等,如果是,则采用等差数列对所述待压缩心电数据进行建模及数据压缩,否则将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案。
本实施例在对待压缩心电数据进行压缩编码时,首先判断待压缩心电数据是否为差值相等的等差数列,如果是,则直接选用等差数列进行建模以及数据压缩,不需要再进行压缩方案的匹配,因为对于差值相等的心电数据来说,采用等差数列建模就是一个适合的方式。
具体的,本实施例对待压缩心电数据中电压值数据进行压缩编码的流程如下:
对电压值进行delta编码,第一个值不变,从第二个值开始,计算其delta值,即d=vi-vi-1。
如果所有的d都相等,可以使用等差数列建模该电压值数据,只记录第一个值、delta值以及数量,第一个值即等差数列的初始值,delta值即等差数列的公差,数量即等差数列的数据长度;
如果d值不全相等,则:使用zig-zag方法,将有符号的值转换成无符号的值d';然后对于每一个d'值,采用压缩方案选择模型在可用的备选压缩方案空间中,遍历所有的压缩方案,分别去压缩和存储数据d',并计算出对应的压缩率;最后从中选出压缩率最大的方案,用于数值d'的压缩。
zig-zag编码:zig-zag是针对有符号数字的变长编码,主要是通过将符号位移动到最低位,这样绝对值小的数将占用更少的编码位。
优选的,基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩,具体为:
所述待压缩心电数据包括电压值数据和时间戳数据;
针对时间戳数据的特征设置针对时间戳数据的固定压缩方案;
采用所述固定压缩方案对所述时间戳数据进行数据压缩;
基于所述匹配压缩方案对所述电压值数据进行数据压缩。
心电数据包含如下三个主要属性:时间戳、电压值以及其它信息。时间戳用于记录该数据采集的时刻,电压值一般不会超过±5mV,其它信息包括采集自哪个导联、ADC值、AD分辨率、增益等。对于同一条心电数据,每个采样点的其它信息相同,通常会使用单独的文件进行存储,因此其它信息不存在冗余,无需建模。心电数据的冗余主要在于时间戳和电压值上,或者说心电数据的压缩主要分为时间戳的压缩和电压值的压缩。
由于时间戳数据的特征基本一致,因此本实施例直接选用固定的压缩方案对其进行压缩。而压缩方案选择模型主要用于为电压值数据选择匹配压缩方案,进而实现电压值数据的压缩。
本实施例选用的对时间戳数据进行压缩的固定压缩方案具体阐述如下。
时间戳数据所表现出来的数值递增性,使得其十分适合使用差分编码的方式进行建模。
记心电数据的时间戳数据集为T={T1,T2,…,Tn},其中,Ti={ti1,ti2,…,tik}为T的子集,Ti表示时间戳数据的第i个时间块,i=1,2,…,n,tij为时间块Ti上的第j个时间戳,j=1,2,…,k,所有时间戳数据均用8个字节表示。时间戳数据的压缩过程如下:
S100:首先,进行二阶差分编码,即delta-of-delta编码。保持第一个和第二个数据不变,从第3个数据开始,计算差值Dj=(tij-ti(j-1))-(ti(j-1)-ti(j-2)),len(Ti)≥2,得到差值集合D={D1,D2,…,Dk},k=len(Ti)-2。
S200:如果差值集合D中各差值都相同,则可以仅使用等差数列建模时间戳数据。等差数列建模具体为:只记录第一个值、delta值以及数量,第一个值即等差数列的初始值,delta值即等差数列的公差,数量即等差数列的数据长度。在编码阶段,对模型,只需根据上述三个值的特点,选择合适的编码方式,例如offset、bitmask、trailing zero,编码后直接存储即可。对于数据与模型之间的差别,即残差,因为其值全为0,使用1比特表示即可。
S300:如果差值集合D中各差值不全相同,则采用如下方式编码。如果Dj=0,则仅在编码的标头部分header中存储0。如果-3≤Dj≤4,那么在编码的标头部分header中存储“0b1”,占1个比特;在编码的数据部分data中存储Dj的值,占3个比特),共占4个bit。最后返回header,data列表。
以表1中的时间戳数据为例,前六个时间戳数据为:
00:00:31.320;
00:00:31.328;
00:00:31.335;
00:00:31.343;
00:00:31.351;
00:00:31.359;
经过delta-of-delta操作后,输出如表7所示:
表7、delta-of-delta操作输出编码
Delta-of-delta值D<sub>j</sub> | 输出的编码 |
-1 | 0b1||0b101 |
1 | 0b1||0b001 |
0 | 0b0 |
0 | 0b0 |
初始时间戳为(00:00:31.320,00:00:31.328)。编码格式(0x7A59,0x7A60,),原始编码为(1100||0b101 001)。原始的时间戳需要6*8字节=48字节=384比特。经过压缩处理后,只需2*8*8+4+6=138比特。大大节省了存储空间。可以理解的,在时间戳数据的数量较大时,压缩后存储空间的节省效果也就更明显了。
实施例2
本发明的实施例2提供了心电数据压缩装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现实施例1提供的心电数据压缩方法。
本发明实施例提供的心电数据压缩装置,用于实现心电数据压缩方法,因此,心电数据压缩方法所具备的技术效果,心电数据压缩装置同样具备,在此不再赘述。
实施例3
本发明的实施例3提供了计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现实施例1提供的心电数据压缩方法。
本发明实施例提供的计算机存储介质,用于实现心电数据压缩方法,因此,心电数据压缩方法所具备的技术效果,计算机存储介质同样具备,在此不再赘述。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种心电数据压缩方法,其特征在于,包括以下步骤:
收集心电数据样本建立心电数据样本集,基于心电数据特征建立备选压缩方案空间;
基于所述心电数据样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型;
将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案;
基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩。
2.根据权利要求1所述的心电数据压缩方法,其特征在于,收集心电数据段样本建立心电数据段样本集,具体为:
收集长度不同的多段心电数据样本,并将每一所述心电数据样本复制多份,得到所述心电数据样本集。
3.根据权利要求1所述的心电数据压缩方法,其特征在于,基于心电数据特征建立备选压缩方案空间,具体为:
基于心电数据的不同局部特征建立不同的主压缩方案集合,每一所述主压缩方案集合均包含多个针对数据点进行压缩的子压缩方案,结合多个所述主压缩方案集合得到所述备选压缩方案空间。
4.根据权利要求1所述的心电数据压缩方法,其特征在于,基于所述心电数据样本集以及备选压缩方案空间,进行深度强化学习网络训练,得到压缩方案选择模型,具体为:
将所述心电数据段样本输入所述深度强化学习网络,得到多个备选压缩方案;
采用归一化函数计算每一所述备选压缩方案中各控制参数的可选值的概率,按照概率对各控制参数的可选值进行抽样,得到各控制参数的实际值;
基于各控制参数的实际值确定输出压缩方案;
采用所述输出压缩方案对所述心电数据段样本进行实际压缩,并计算输出压缩方案进行压缩的损失值;
根据所述损失值对所述深度强化学习网络进行修正;
判断是否满足终止条件,如果是,则输出当前深度强化学习网络模型作为所述压缩方案选择模型,否则采用下一个心电数据段样本进行深度强化学习网络的训练。
5.根据权利要求1所述的心电数据压缩方法,其特征在于,所述深度强化学习网络包括空间金字塔层以及全连接层。
6.根据权利要求1所述的心电数据压缩方法,其特征在于,将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案,具体为:
将待压缩心电数据划分为多段,并输入所述压缩方案选择模型,得到每一条数据段的控制参数的概率,选择所有数据段中概率值最大的控制参数作为待压缩心电数据的最终控制参数,基于最终控制参数确定所述匹配压缩方案。
7.根据权利要求1所述的心电数据压缩方法,其特征在于,将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案之前,还包括:
对所述待压缩心电数据进行delta编码,得到相邻两个数据点之间的差值,判断所有差值是否相等,如果是,则采用等差数列对所述待压缩心电数据进行建模及数据压缩,否则将待压缩心电数据输入所述压缩方案选择模型,得到匹配压缩方案。
8.根据权利要求1所述的心电数据压缩方法,其特征在于,基于所述匹配压缩方案对所述待压缩心电数据进行数据压缩,具体为:
所述待压缩心电数据包括电压值数据和时间戳数据;
针对时间戳数据的特征设置针对时间戳数据的固定压缩方案;
采用所述固定压缩方案对所述时间戳数据进行数据压缩;
基于所述匹配压缩方案对所述电压值数据进行数据压缩。
9.一种心电数据压缩装置,其特征在于,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1-8任一项所述的心电数据压缩方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机该程序被处理器执行时,实现如权利要求1-8任一项所述的心电数据压缩方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110224551.6A CN112863653A (zh) | 2021-03-01 | 2021-03-01 | 一种心电数据压缩方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110224551.6A CN112863653A (zh) | 2021-03-01 | 2021-03-01 | 一种心电数据压缩方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112863653A true CN112863653A (zh) | 2021-05-28 |
Family
ID=75990552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110224551.6A Pending CN112863653A (zh) | 2021-03-01 | 2021-03-01 | 一种心电数据压缩方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112863653A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114679759A (zh) * | 2022-03-29 | 2022-06-28 | 西北工业大学宁波研究院 | 一种基于强化学习的可穿戴心电监测网络切换方法 |
CN115833843A (zh) * | 2023-02-14 | 2023-03-21 | 临沂云斗电子科技有限公司 | 一种车辆运行监控数据存储优化方法及管理平台 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104739509A (zh) * | 2013-12-31 | 2015-07-01 | 深圳迈瑞生物医疗电子股份有限公司 | 一种生理信号压缩方法、系统及医疗设备 |
CN109978135A (zh) * | 2019-03-04 | 2019-07-05 | 清华大学 | 基于量化的神经网络压缩方法及系统 |
CN110210548A (zh) * | 2019-05-27 | 2019-09-06 | 清华大学深圳研究生院 | 一种基于强化学习的图片动态自适应压缩方法 |
-
2021
- 2021-03-01 CN CN202110224551.6A patent/CN112863653A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104739509A (zh) * | 2013-12-31 | 2015-07-01 | 深圳迈瑞生物医疗电子股份有限公司 | 一种生理信号压缩方法、系统及医疗设备 |
CN109978135A (zh) * | 2019-03-04 | 2019-07-05 | 清华大学 | 基于量化的神经网络压缩方法及系统 |
CN110210548A (zh) * | 2019-05-27 | 2019-09-06 | 清华大学深圳研究生院 | 一种基于强化学习的图片动态自适应压缩方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114679759A (zh) * | 2022-03-29 | 2022-06-28 | 西北工业大学宁波研究院 | 一种基于强化学习的可穿戴心电监测网络切换方法 |
CN114679759B (zh) * | 2022-03-29 | 2023-06-09 | 西北工业大学宁波研究院 | 一种基于强化学习的可穿戴心电监测网络切换方法 |
CN115833843A (zh) * | 2023-02-14 | 2023-03-21 | 临沂云斗电子科技有限公司 | 一种车辆运行监控数据存储优化方法及管理平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111461983B (zh) | 一种基于不同频度信息的图像超分辨率重建模型及方法 | |
Kumar et al. | Hybrid method based on singular value decomposition and embedded zero tree wavelet technique for ECG signal compression | |
Sunil Kumar et al. | Bio-signals Compression Using Auto Encoder | |
CN112863653A (zh) | 一种心电数据压缩方法及装置 | |
CN116705337A (zh) | 一种健康数据采集及智能分析方法 | |
Fira et al. | ECG compressed sensing based on classification in compressed space and specified dictionaries | |
CN109431497A (zh) | 一种脑电信号处理方法及癫痫检测系统 | |
CN101099669A (zh) | 基于最优时频空间结构码的心电数据压缩方法和解码方法 | |
Manikandan et al. | Wavelet threshold based TDL and TDR algorithms for real-time ECG signal compression | |
CN114648048B (zh) | 基于变分自编码和PixelCNN模型的心电信号降噪方法 | |
Kovács et al. | Generalized rational variable projection with application in ECG compression | |
CN108062779B (zh) | 一种用于胸部断层扫描放射影像的无损压缩方法 | |
Titus et al. | A simple but efficient EEG data compression algorithm for neuromorphic applications | |
CN114224288B (zh) | 检测癫痫脑电信号的微型胶囊神经网络训练方法及设备 | |
Liu et al. | Self-training dictionary based approximated ℓ0 norm constraint reconstruction for compressed ECG | |
CN114821259A (zh) | 一种基于孪生卷积神经网络的零学习医学图像融合方法 | |
Pathok et al. | Data compression of ECG signals using error back propagation (EBP) algorithm | |
Nguyen et al. | Wavelet transform and adaptive arithmetic coding techniques for EEG lossy compression | |
Pandey | ECG data compression using the formation of QRS-complex segment bank and integer DCT-based plateau region processing | |
CN112560784B (zh) | 一种基于动态多尺度卷积神经网络的心电图分类方法 | |
CN113537412B (zh) | 基于卷积神经网络的肺病听诊系统、信号处理方法及设备 | |
KR102373778B1 (ko) | 심전도 데이터로부터 광용적맥파 데이터를 생성하는 장치 및 방법 | |
Lee et al. | A real-time ECG data compression algorithm for a digital holter system | |
Huang et al. | ECG signal compression for low-power sensor nodes using sparse frequency spectrum features | |
Singh et al. | Distributed compressive sensing for multichannel ECG signals over learned dictionaries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |