CN1750122A - 基于极值点的可伸缩语音压缩恢复技术 - Google Patents

基于极值点的可伸缩语音压缩恢复技术 Download PDF

Info

Publication number
CN1750122A
CN1750122A CNA2005101177029A CN200510117702A CN1750122A CN 1750122 A CN1750122 A CN 1750122A CN A2005101177029 A CNA2005101177029 A CN A2005101177029A CN 200510117702 A CN200510117702 A CN 200510117702A CN 1750122 A CN1750122 A CN 1750122A
Authority
CN
China
Prior art keywords
voice signal
extreme point
little
planted
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005101177029A
Other languages
English (en)
Inventor
章森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA2005101177029A priority Critical patent/CN1750122A/zh
Publication of CN1750122A publication Critical patent/CN1750122A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种基于时域的对语音信号的压缩和恢复的技术,压缩倍数可以调节,恢复后的语音质量较好,计算量也较小。试验证明,对原始的语音信号的PCM格式的数据压缩倍数在10倍左右时,恢复后的语音质量仍然很好。该项技术可应用于通信和多媒体等领域。

Description

基于极值点的可伸缩语音压缩恢复技术
所属技术领域
本发明涉及一种语音信号的压缩和恢复技术,属于语音信号通信技术领域。
背景技术
目前,数字化的语音信号的压缩与恢复技术被广泛应用于通信和多媒体领域。为此,国际电信联盟ITU,国际标准化组织ISO,国际电报电话咨询委员会CCITT以及世界各国的技术标准管理部门都语音信号的压缩与恢复制定一系列的标准,目的就是为了促进语音信号技术的进一步发展和更广泛的应用。在通信领域存在带宽的限制,在多媒体领域存在存储介质容量的限制,因此,语音信号在传输或存储之前一般要经过压缩处理,以节省通讯带宽和存储空间。一般地说,语音信号的压缩倍数与其恢复后的语音质量成反比。因此,对于具体的应用领域,要根据具体需求,在语音信号的压缩倍数与其恢复后的语音质量之间需求一个平衡点,使得语音信号的压缩倍数与其恢复后的语音质量都能够满足要求。目前,对于语音信号的压缩主要有3类实现技术:一类是时域的预测编码压缩技术。该类技术的优点是恢复后的语音质量一般较好,计算量较小,但压缩的倍数一般不能太大,否则失真严重。另一类是基于参数分析的压缩技术。该类技术的优点是压缩的倍数可以较大,但恢复后的语音质量一般不高,计算量也较大。第三类是基于听觉特性的压缩技术。该类技术的优点是恢复后的语音质量一般较好,压缩的倍数一般也可以较大,但计算量较大,需要对语音信号做频域特征分析和频域与时域之间的相互转换。因此,综合考虑对语音信号的压缩倍数、恢复后的语音质量、计算量等因素是目前语音压缩与恢复技术的发展趋势。
发明内容
本发明是一种基于时域的对语音信号的压缩和恢复的技术,压缩倍数可以调节,恢复后的语音质量较好,计算量也较小。试验证明,对原始的语音信号的PCM格式的数据压缩倍数在10倍左右时,恢复后的语音质量仍然很好。
本发明所采用的技术方案是:数字化后的语音信号用一个有限序列{x(n)}表示,其中n表示语音样本的序号,x(n)表示第n个样本点的取值。数字化后的语音信号的局部极植点包括两类:一类是正极植点,另一类是负极值点。正极植点是指:对于第n个样本点x(n),如果它满足:x(n-1)<x(n)且x(n)>x(n+1),则称x(n)为一个正极植点;负极植点是指:对于第n个样本点x(n),如果它满足:x(n-1)>x(n)且x(n)<x(n+1),则称x(n)为一个负极植点。
首先对数字化后的语音信号计算所有的局部极值点,包括正极值点和负极值点,然后计算相邻的局部极值点的相对差,相对差的定义为:假设y(k)和y(k+1)是语音信号x(n)的两个局部极值点,那么,y(k)关于y(k+1)的相对差是:abs[y(k)-y(k+1)]/abs[y(k)],其中,abs[*]表示对括号[]内的表达式*取绝对值运算。根据伸缩系数(对应于压缩系数)的要求,对于相对差小于某个阈值的极值点不作为极值点处理。伸缩系数与阈值是正比例关系。这时,假设{y(k)}是语音信号{x(n)}的局部极值点的有限序列,那么,对语音信号{x(n)}的压缩存储是{(y(k),c(k))},其中y(k)表示语音信号{x(n)}的第k个极值点的样本值,c(k)表示第k个极值点y(k)到第k+1个极值点y(k+1)之间的语音信号{x(n)}的样本个数。
对按照上述方案压缩后的语音信号,再进行恢复的过程如下:首先读取相邻的2个数据对(y(k),c(k))及(y(k+1),c(k+1)),根据c(k)的大小,在极值点y(k)和y(k+1)上进行一次或高次多项式插值,计算出y(k)和y(k+1)之间的c(k)个语音样本点,然后再对数据对(y(k+1),c(k+1))及(y(k+2),c(k+2))做类似的插值计算和处理,直到所有的(y(k),c(k))都处理完毕。这时,从压缩过的语音信号中就恢复了需要的语音信号。

Claims (4)

1.本发明涉及一种基于极值点的可伸缩语音压缩恢复技术,其特征是:对数字化后的语音信号先计算其局部极植点,然后基于局部极植点分别进行语音信号的压缩和恢复。数字化后的语音信号用一个有限序列{x(n)}表示,其中n表示语音样本的序号,x(n)表示第n个样本点的取值。
2.根据权利要求1,局部极植点包括两类:一类是正极植点,另一类是负极值点。正极植点是指:对于第n个样本点x(n),如果它满足:x(n-1)<x(n)且x(n)>x(n+1),则称x(n)为一个正极植点;负极植点是指:对于第n个样本点x(n),如果它满足:x(n-1)>x(n)且x(n)<x(n+1),则称x(n)为一个负极植点。
3.根据权利要求1,对数字化后的语音信号进行压缩的技术特征是:首先计算所有的局部极值点,包括正极值点和负极值点,然后计算相邻的局部极值点的相对差,相对差的定义为:假设y(k)和y(k+1)是语音信号x(n)的两个局部极值点,那么,y㈦关于y(k+1)的相对差是:abs[y(k)-y(k+1)]/abs[y(k)],其中,abs[*]表示对括号
Figure A2005101177020002C1
内的表达式*取绝对值运算。
根据伸缩系数(对应于压缩系数)的要求,对于相对差小于某个阈值的极值点不作为极值点处理。伸缩系数与阈值是正比例关系。这时,假设{y(k)}是语音信号{x(n))的局部极值点的有限序列,那么,对语音信号{x(n)}的压缩存储是{(y(k),c(k))},其中y(k)表示语音信号{x(n)}的第k个极值点的样本值,c(k)表示第k个极值点y(k)到第k+1个极值点y(k+1)之间的语音信号{x(n))的样本个数。
4.根据权利要求1,对按照上述权利要求3所述的方法进行压缩后的语音信号,再进行恢复的技术特征是:首先读取相邻的2个数据对(y(k),c(k))及(y(k+1),c(k+1)),根据c(k)的大小,在极值点y(k)和y(k+1)上进行一次或高次多项式插值,计算出y(k)和y(k+1)之间的c(k)个语音样本点,然后再对数据对(y(k+1),c(k+1))及(y(k+2),c(k+2))做类似的插值计算和处理,直到所有的(y(k),c(k))都处理完毕。这时,从压缩过的语音信号中就恢复了需要的语音信号。
CNA2005101177029A 2005-11-07 2005-11-07 基于极值点的可伸缩语音压缩恢复技术 Pending CN1750122A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2005101177029A CN1750122A (zh) 2005-11-07 2005-11-07 基于极值点的可伸缩语音压缩恢复技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2005101177029A CN1750122A (zh) 2005-11-07 2005-11-07 基于极值点的可伸缩语音压缩恢复技术

Publications (1)

Publication Number Publication Date
CN1750122A true CN1750122A (zh) 2006-03-22

Family

ID=36605531

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005101177029A Pending CN1750122A (zh) 2005-11-07 2005-11-07 基于极值点的可伸缩语音压缩恢复技术

Country Status (1)

Country Link
CN (1) CN1750122A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881099A (zh) * 2012-09-25 2013-01-16 北京声迅电子股份有限公司 应用于atm机的防盗报警方法及装置
CN107305767A (zh) * 2016-04-15 2017-10-31 中国科学院声学研究所 一种应用于语种识别的短时语音时长扩展方法
CN113450807A (zh) * 2020-03-25 2021-09-28 大唐移动通信设备有限公司 一种语音数字信号的压缩方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881099A (zh) * 2012-09-25 2013-01-16 北京声迅电子股份有限公司 应用于atm机的防盗报警方法及装置
CN107305767A (zh) * 2016-04-15 2017-10-31 中国科学院声学研究所 一种应用于语种识别的短时语音时长扩展方法
CN107305767B (zh) * 2016-04-15 2020-03-17 中国科学院声学研究所 一种应用于语种识别的短时语音时长扩展方法
CN113450807A (zh) * 2020-03-25 2021-09-28 大唐移动通信设备有限公司 一种语音数字信号的压缩方法及装置
CN113450807B (zh) * 2020-03-25 2023-03-17 大唐移动通信设备有限公司 一种语音数字信号的压缩方法及装置

Similar Documents

Publication Publication Date Title
CN111091876A (zh) 一种dna存储方法、系统及电子设备
CN102449689B (zh) 编码方法、编码装置、编码程序、以及它们的记录介质
CN105868194A (zh) 文本数据压缩、解压方法及装置
CN1750122A (zh) 基于极值点的可伸缩语音压缩恢复技术
KR100804640B1 (ko) 서브밴드 합성 필터링 방법 및 장치
EP0935403A3 (en) ATM communication apparatus and recording medium therefor
CN101650946A (zh) 应用于航行数据记录仪的音频采集卡的音频压缩方法
JP2000504549A (ja) Pcmモデム用直流成分の抑制
CN110222011B (zh) 一种人体运动数据文件压缩方法
JP2002258894A (ja) 音声データ圧縮・解凍装置及び方法
CN102572426A (zh) 一种数据处理的方法和装置
CA2463324A1 (en) Method of compressing digital ink
CN101741391B (zh) 在定点dsp进行mp3音频解码时优化内存空间的方法
CN107343203B (zh) 基于open-exr图像的jpeg无损压缩方法
CN101828221B (zh) 用于编码和解码增强层的设备和方法
AU716880B2 (en) Method for compressing an analog signal
CN105704215B (zh) 文件共享系统及相应的文件发送方法及装置
CN102047662B (zh) 编码器
CN105072444A (zh) 一种不同量化参数下的hevc视频二次压缩检测方法
CN112506876B (zh) 一种支持sql查询的无损压缩查询方法
CN104113394B (zh) 通信调制信号的压缩及解压方法
CN206181271U (zh) 视频压缩系统
CN114024952A (zh) 一种基于dl/t 698.45-2007协议的文件压缩传输方法
CN116982082A (zh) 图像编解码方法、编码器、解码器及存储介质
CN105049055A (zh) 一种数据压缩方法和数据解压方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication