CN104506198A - 基于重复性特征的心音信号压缩算法 - Google Patents

基于重复性特征的心音信号压缩算法 Download PDF

Info

Publication number
CN104506198A
CN104506198A CN201410842744.8A CN201410842744A CN104506198A CN 104506198 A CN104506198 A CN 104506198A CN 201410842744 A CN201410842744 A CN 201410842744A CN 104506198 A CN104506198 A CN 104506198A
Authority
CN
China
Prior art keywords
vector
compression
dictionary
signal
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410842744.8A
Other languages
English (en)
Other versions
CN104506198B (zh
Inventor
唐洪
孙建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201410842744.8A priority Critical patent/CN104506198B/zh
Publication of CN104506198A publication Critical patent/CN104506198A/zh
Application granted granted Critical
Publication of CN104506198B publication Critical patent/CN104506198B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

一种基于重复性特征的心音信号压缩算法,利用心音的高度重复性特征,去除心音信号的冗余,实现心音信号的压缩存储。本发明将心音分解成若干时频分量,鉴于心音是重复产生的,那么心音的各时频分量也存在着重复性。将非重复的心音时频分量的参数归纳成一个字典。对于待压缩的心音信号,只需从字典中找出最匹配的参数组重构时频分量,并记录参数组的字典索引和时频分量的发生时刻。这样,幅度较大的信号被保留下来,剩下的信号称为残余信号。对残余信号,进一步利用矢量量化技术压缩。本发明能以任意预先指定的失真度进行压缩,并获得较高的压缩比。

Description

基于重复性特征的心音信号压缩算法
技术领域
本发明涉及一种基于重复性特征的心音信号压缩算法。基于心音的重复性特征,利用参数字典和矢量量化技术对心音信号进行压缩。利用心音重复性特征减少存储量,对残余信号采用矢量量化,可预先指定失真程度,实现心音信号的压缩存储。
背景技术
在长期监测心音时,有必要对心音信号进行压缩,以降低存储量。心音是一种机械振动信号。理论上,任何一种一维信号的压缩算法均适用于心音信号压缩。但是,心音具有临床的诊断价值,要求恢复信号的失真度小。因此,只有针对心音独有的特性,才能开发出失真度小、压缩比高的压缩算法。当前的心音压缩算法,一般以变换域编码为主,尚未充分利用心音的特殊性质,在失真度和压缩比之间未达到更好的平衡。本发明充分利用了心音的重复性特征,结合矢量量化技术,显著地降低了心音信号的存储量。本发明能够以指定的失真度进行压缩,可根据需要选择恰当的失真度,从而实现压缩性能的最佳平衡。
发明内容
心音信号是需要长时间采集的生物医学信号,相关的压缩存储算法需要较高的压缩比,并且不允许有较大失真。本发明基于心音的重复性特征,利用参数字典和矢量量化对心音信号进行压缩,能够在失真度较低的情况下达到较高的压缩比,使心音信号的长时间采集记录不再占用大量的存储空间。
一种基于重复性特征的心音信号压缩算法,步骤如下:
1)构造心音信号的参数字典,用于存放心音中非重复的分量。从待压缩的目标心音信号中分割一部分用于构造字典。鉴于心音有高度重复性,构造字典没有必要用到全部信号,可减少计算量。
将分割出的心音信号表达成K个时频分量和残余信号r(t)之和,表达方式如下
h ( t ) = Σ i = 1 K a i e - ( t - t i ) 2 / ( 2 σ 2 ) cos ( 2 π f i t + β i ) + r ( t ) - - - ( 1 )
其中ai是第i个分量的幅度,ti是相对于心音分割开始时刻的时间延迟,σi是第i个分量的时间支撑区间,fi是第i个分量的频率,βi是第i个分量的相位。K值应使残余信号r(t)满足如下表达式
∫ r 2 ( t ) dt ∫ h 2 ( t ) dt ≤ 0.005 - - - ( 2 )
将上述每个时频分量中的a、β、f和σ四参数组成一个向量。通过聚类,将K个向量划分成M个聚类,以聚类中心代表该类,则形成M个非重复的相应向量。此M个不重复的向量构成一个字典,向量在字典中的位置序号称为索引。
2)压缩步骤1:该步骤通过字典压缩时频分量。根据待压缩的目标心音信号,从字典中找出最匹配的参数向量,用当前信号减去参数向量重构的时频分量,记录该向量的发生时刻和字典中的索引。重复上述步骤,直到残余信号的能量小于门限P时为止。门限P由心音-杂音能量比R确定。心音能量集中在20-200Hz范围内,而杂音的能量范围在200-600Hz范围内。因此,R定义为
R = ∫ 20 200 | X ( f ) | 2 df ∫ 200 600 | X ( f ) | 2 df . - - - ( 3 )
其中X(f)是心音h(t)的傅里叶变换
X ( f ) = ∫ - ∞ + ∞ h ( t ) e - 2 πft dt - - - ( 4 )
门限P与R的关系表示如下
P = 0.08 R + 0.002,0 &le; R < 0.6 0.05 , R &GreaterEqual; 0.6 - - - ( 5 )
3)压缩步骤2:该步骤通过矢量量化技术压缩残余信号。首先将残余信号中的一部分划分出来,用于矢量量化的码书及相关参数的训练。需要训练的内容包括矢量维数k、码书大小N和码书本身。训练完成后,对待压缩的残余信号依据参数进行矢量量化,获得码书索引并存储下来。
残余信号的矢量量化压缩效果受维数k、码书大小N的影响,其规律性为随着k的增大,失真度增大,压缩比增大;随着N的增大,失真度减小,压缩比减小,如表1所示。由以上规律,可设计一种搜索算法,用于获得最适合的k和N参数。其步骤为:(1)预设最大的失真度;(2)以表1中任意一组k、N进行码书训练并矢量量化,获得实际的失真度与压缩比;(3)若实际的失真度大于预设的失真度,则按照失真度更小的方向选择下一组k、N;(4)若实际的失真度小于预设的失真度,则比较压缩比,按照压缩比更大的方向选择下一组k、N;(5)重复(3)-(4)步骤,若在预设失真度条件下无法获得更高的压缩比,那么此时的k、N即为最佳值。
心音信号压缩后,需要存储的信息包括时频分量的发生时间、参数向量的字典索引和矢量量化的码书索引。心音信号的解压缩过程即为根据上述三种信息重构信号。
表1矢量量化效果与压缩参数的规律
4)评价心音信号压缩性能的指标:压缩比CR和标准均方根误差百分比PRD。压缩比CR用来衡量信号的压缩程度,定义为
CR=b*L/C   (6)
其中b是采集心音时样本的量化位数,L是待压缩信号的样本数。C是心音信号压缩后的码长。在本发明中,C是Ci、Ct、Cq的总和。Ci是余量信号矢量量化后码书索引的码长,Ct是时频分量发生时刻的码长,Cq是时频分量索引的码长。
PRD用来衡量信号的失真度,定义为
PRD = &Sigma; i = 1 L ( x ( i ) - y ( i ) ) 2 &Sigma; i = 1 L ( x ( i ) - &mu; x ) 2 - - - ( 7 )
其中x(i)是待压缩信号,μx是均值,y(i)是恢复信号。CR和PRD不仅是评价心音信号压缩效果的指标,也是搜索算法中确定参数的约束条件。
本发明的有益效果:本发明在失真度PRD和压缩比CR两项指标中取得了较好的效果,失真度PRD可控制在预先制定的数值范围内,防止影响诊断结果。压缩比CR较高,使得需要存储的数据量大为减少。
附图说明
图1为待压缩的目标心音信号。
图2为心音信号的时频分量部分,该部分具有重复性,通过字典压缩。
图3为时频分量之外的残余信号,该部分通过矢量量化压缩。
具体实施方式
以下结合附图和技术方案,进一步说明本发明的具体实施方式。
1)图1为一例待压缩的16bit精度,4KHz的正常心音信号。从目标心音信号中划分出包含10个以上周期的任意一段,按照公式(1)分解,得到充分多的时频分量。对时频分量的a、β、f和σ四类参数,利用SOM神经网络进行聚类,建立一个大小为512的参数字典。
2)根据字典压缩信号的时频分量部分,该部分如图2所示。对待压缩的心音信号,计算心音-杂音能量比R,根据R的数值,从公式(4)中选择门限P。由于信号的具体情况不同,门限P可分布于1%-5%之间。用字典中最匹配的参数向量重构心音信号的时频分量,并从当前信号中减去该分量,直到残余信号的能量小于门限P为止。利用短时傅里叶变换求得分量的发生时刻。记录发生时刻和每个参数向量的字典索引。
3)此时的残余信号近似于随机信号,如图3所示。划分出残余信号中一部分(约20个心动周期),构成矢量量化压缩步骤的训练序列。
4)预设允许失真度PRD为5%,在该约束条件下执行搜索算法,获得k,N参数,利用SOM神经网络进行聚类生成码书。对残余信号进行矢量量化,记录对应矢量的码书索引。
5)根据时频分量的发生时刻、参数向量的字典索引和残余信号矢量量化的码书索引,可恢复出解压缩信号。对比目标信号压缩前后的存储量,压缩比CR为22.3:1;对比目标信号压缩前后的失真程度,PRD为5.24%,实现了失真度可控条件下的高压缩比。

Claims (1)

1.一种基于重复性特征的心音信号压缩算法,其特征在于,步骤如下:
1)构造心音信号的参数字典,用于存放心音信号中非重复的分量;从待压缩的目标心音信号中分割一部分用于构造字典;
将分割出的心音信号表达成K个时频分量和残余信号r(t)之和,表达方式如下:
h ( t ) = &Sigma; i = 1 K a i e - ( t - t i ) 2 / ( 2 &sigma; 2 ) cos ( 2 &pi; f i t + &beta; i ) + r ( t ) - - - ( 1 )
其中ai是第i个分量的幅度,ti是相对于心音分割开始时刻的时间延迟,σi是第i个分量的时间支撑区间,fi是第i个分量的频率,βi是第i个分量的相位;K值使残余信号r(t)满足如下表达式
&Integral; r 2 ( t ) dt &Integral; h 2 ( t ) dt &le; 0.005 - - - ( 2 )
将上述每个时频分量中的a、β、f和σ四参数组成一个向量,即形成K个向量;通过聚类,将K个向量划分成M个聚类,以聚类中心代表该类,形成M个不重复的相应向量;M个不重复的向量即为字典,向量在字典中的位置序号称为索引;
2)压缩步骤1:通过字典压缩时频分量;根据待压缩的目标心音信号,从字典中找出最匹配的参数向量,用当前信号减去参数向量重构的时频分量,记录该向量的发生时刻和字典中的索引;重复上述步骤,直到残余信号的能量小于门限P时为止;门限P由心音-杂音能量比R确定;心音能量集中在20-200Hz范围内,杂音的能量范围在200-600Hz范围内;R定义为
R = &Integral; 20 200 | X ( f ) | 2 df &Integral; 200 600 | X ( f ) | 2 df - - - ( 3 )
其中X(f)是心音h(t)的傅里叶变换
X ( f ) = &Integral; - &infin; + &infin; h ( t ) e - 2 &pi;ft dt - - - ( 4 ) 门限P与R的关系表示如下
P = 0.08 R + 0.002 , 0 &le; R &le; 0.6 0.05 , R &GreaterEqual; 0.6 - - - ( 5 )
3)压缩步骤2:通过矢量量化技术压缩残余信号;首先将残余信号中的一部分划分出来,用于矢量量化的码书及相关参数的训练;需要训练的内容包括矢量维数k、码书大小N和码书本身;训练完成后,对待压缩的残余信号依据参数进行矢量量化,获得码书索引并存储下来;
残余信号的矢量量化压缩受维数k和码书大小N的影响,其规律性如下所示:随着k的增大,失真度增大,压缩比增大;随着N的增大,失真度减小,压缩比减小;获得最适合的k和N参数的搜索算法的步骤为:(1)预设最大的失真度;(2)任意一组k、N进行码书训练并矢量量化,获得实际的失真度与压缩比;(3)若实际的失真度大于预设的失真度,则按照失真度更小的方向选择下一组k、N;(4)若实际的失真度小于预设的失真度,则比较压缩比,按照压缩比更大的方向选择下一组k、N;(5)重复(3)-(4)步骤,若在预设失真度条件下无法获得更高的压缩比,那么此时的k、N即为最佳值;
心音信号压缩后,需要存储的信息包括时频分量的发生时间、参数向量的字典索引和矢量量化的码书索引;心音信号的解压缩过程为根据时频分量的发生时间、参数向量的字典索引和矢量量化的码书索引重构信号;
4)评价心音信号压缩性能的指标:压缩比CR和标准均方根误差百分比PRD;压缩比CR用来衡量信号的压缩程度,定义为
CR=b*L/C                       (6)
其中b是采集心音时样本的量化位数,L是待压缩信号的样本数;C是心音信号压缩后的码长;C是Ci、Ct、Cq的总和;Ci是余量信号矢量量化后码书索引的码长,Ct是时频分量发生时刻的码长,Cq是时频分量索引的码长;
PRD用来衡量信号的失真度,定义为
PRD = &Sigma; i = 1 L ( x ( i ) - y ( i ) ) 2 &Sigma; i = 1 L ( x ( i ) - &mu; x ) 2 - - - ( 7 )
其中x(i)是待压缩信号,μx是均值,y(i)是恢复信号;CR和PRD是评价心音信号压缩效果的指标,也是搜索算法中确定参数的约束条件。
CN201410842744.8A 2014-12-30 2014-12-30 基于重复性特征的心音信号压缩算法 Expired - Fee Related CN104506198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410842744.8A CN104506198B (zh) 2014-12-30 2014-12-30 基于重复性特征的心音信号压缩算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410842744.8A CN104506198B (zh) 2014-12-30 2014-12-30 基于重复性特征的心音信号压缩算法

Publications (2)

Publication Number Publication Date
CN104506198A true CN104506198A (zh) 2015-04-08
CN104506198B CN104506198B (zh) 2017-08-01

Family

ID=52947922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410842744.8A Expired - Fee Related CN104506198B (zh) 2014-12-30 2014-12-30 基于重复性特征的心音信号压缩算法

Country Status (1)

Country Link
CN (1) CN104506198B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1362485A1 (en) * 2001-02-12 2003-11-19 Koninklijke Philips Electronics N.V. Generating and matching hashes of multimedia content
CN103778919A (zh) * 2014-01-21 2014-05-07 南京邮电大学 基于压缩感知和稀疏表示的语音编码方法
CN103995973A (zh) * 2014-05-27 2014-08-20 哈尔滨工业大学 一种基于过完备字典集合划分的信号稀疏分解方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1362485A1 (en) * 2001-02-12 2003-11-19 Koninklijke Philips Electronics N.V. Generating and matching hashes of multimedia content
CN103778919A (zh) * 2014-01-21 2014-05-07 南京邮电大学 基于压缩感知和稀疏表示的语音编码方法
CN103995973A (zh) * 2014-05-27 2014-08-20 哈尔滨工业大学 一种基于过完备字典集合划分的信号稀疏分解方法

Also Published As

Publication number Publication date
CN104506198B (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
US8917779B2 (en) Electrocardiogram signal compression and de-compression system
CN102035200B (zh) 一种信号处理的方法和装置
CN105512120B (zh) 一种地震数据压缩方法、压缩存储方法及随机访问方法
Ranjeet et al. ECG signal compression using optimum wavelet filter bank based on kaiser window
CN101521010B (zh) 一种音频信号的编解码方法和装置
Fira et al. ECG compressed sensing based on classification in compressed space and specified dictionaries
CN102881293A (zh) 一种适用于语音压缩感知的过完备字典构造方法
Tun et al. Analysis on ECG data compression using wavelet transform technique
CN101669819B (zh) 基于pt变换与线性预测结合的心电图信号无损压缩方法
CN108776818A (zh) 轴承特征提取方法、轴承剩余寿命预测方法和装置
CN101266795B (zh) 一种格矢量量化编解码的实现方法及装置
CN104506198A (zh) 基于重复性特征的心音信号压缩算法
CN109194667A (zh) 基于频域检测的实现iq数据信号数据压缩与传输功能的装置
CN116257737A (zh) 基于自动编码器的新型输电线路高频故障信号降噪方法
Rajankar et al. An optimized transform for ecg signal compression
Singh et al. An improved ASCII character encoding method for lossless ECG compression
Wang et al. A 2-D ECG compression algorithm based on modified SPIHT
Abo-Zahhad et al. Electrocardiogram data compression algorithm based on the linear prediction of the wavelet coefficients
Ahmed et al. ECG signal compression using combined modified discrete cosine and discrete wavelet transforms
CN108061917B (zh) 一种一维地震信号压缩采集方法
Padmashree et al. Comparative analysis of quad-tree partitioned iterated function systems for medical images
Al-Busaidi et al. Packet-size-controlled ECG compression algorithm based on discrete wavelet transform and running length encoding
Soraghan et al. ECG signal compression using classified gain-shape vector quantisation in the wavelet transform domain
Guilhon et al. Ecg data compression by independent component analysis
CN115001506A (zh) 一种电力系统波形数据的压缩方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170801

Termination date: 20201230

CF01 Termination of patent right due to non-payment of annual fee