CN112908345B - 一种物联网语音压缩与解压方法 - Google Patents
一种物联网语音压缩与解压方法 Download PDFInfo
- Publication number
- CN112908345B CN112908345B CN202011152530.XA CN202011152530A CN112908345B CN 112908345 B CN112908345 B CN 112908345B CN 202011152530 A CN202011152530 A CN 202011152530A CN 112908345 B CN112908345 B CN 112908345B
- Authority
- CN
- China
- Prior art keywords
- voice
- data
- amplitude
- harmonic
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims abstract description 75
- 230000006835 compression Effects 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000006837 decompression Effects 0.000 title claims abstract description 40
- 230000005540 biological transmission Effects 0.000 claims abstract description 49
- 238000001228 spectrum Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 4
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 2
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000011161 development Methods 0.000 description 3
- 208000030979 Language Development disease Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003631 expected effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种物联网语音压缩与解压方法,属于语音数据领域,其压缩方法包括:连续实时截取总时长为t的语音数据,然后按t/2n的间隔时间对语音数据取点,取够2n个点作为第N帧数据;将第N帧数据进行高频预加重,时域数据转成频域数据,求模计算功率谱得到频谱在频谱中选取各次谐波幅值,并用各次谐波幅值计算得到总衰减系数;将各次谐波幅值与总衰减系数相除得到各次谐波幅度比;将第N帧数据和频谱结合进行基波分析得到基波频率值;将基波频率值、各次谐波幅度比和总衰减系数排列生成传输序码列;语音压缩的方法实时性强,压缩率高,能够近似于打电话的通信效果。
Description
本申请是申请日为2019年01月29日、名称为“用于窄带物联网的实时语音压缩和解压的方法”、申请号为201910086356.4的发明专利申请的分案申请。
技术领域
本发明涉及在窄带物联网中语音通信的技术领域,更具体地说,涉及一种物联网语音压缩与解压方法,以及在对讲机中的应用。
背景技术
随着信息技术的爆炸性发展,当今的世界已经进入万物互联的时代,各种物联网技术层出不穷。但是,由于窄带物联网固有的带宽窄,传输速率低,时延较长等特点。导致使用Zigbee、LoRa以及NB-IOT等通信方式在传输语音信号时存在较大的困难,如何有效利用窄带物联网有限的带宽资源,实现数据量为22KB/s以上的语音收发,已经成为迫切需要解决的问题。
1、以LoRa为例:在用LoRa技术传输数据时,如果传输的码速率小于8B/s时,传输距离可达到25公里(空旷场地),而当码速率达到960B/s时,同等条件下的传输距离已下降至1Km以下,而一般的语音通信的数据量达到22KB/s,在未压缩的情况下,基本上无法通过LoRa的方式传输。
2、Zigbee的理论带宽为256KB/s,但其所传输的数据中各种协议的数据包实际占有很大比重,能够留给语音通信用的带宽十分有限,如果不对高达22KB/s的语音数据进行压缩,即使Zigbee可以勉强传输,也会带来很大的时延。
3、现有最常用的语音压缩技术为MPEG2,此技术已经非常成熟,但如果直接用于窄带无线通信时,会有以下缺陷:
(1)实时性不强:MPEG2至少需要采样够一个完整的语音音节的数据后,压缩成的数据才足以保证通话质量,而一个完整的音节至少时长为0.4~0.7s,再加上通话时延,通常总通话时延至少在1s以上,而我们的实时语音压缩技术每50ms完成一帧压缩,因此在通话的实时性上远强于MPEG2。
(2)压缩比不足:MPEG2的压缩率是12:1--10:1,压缩比不足无法在窄带物联网中实时语音传输技术。对22KB/s速度的语音数据,在每次截取压缩总时长为20ms的语音数据时,我们的实时语音功率谱压缩技术可达40:1,甚至更高的压缩比,22KB/s能压缩在0.6KB/s以内,可实现窄带物联网的语音实时通畅通信。
发明内容
本发明的一个目的是解决至少上述缺陷,并提供至少后面将说明的优点。
为了实现根据本发明的这些目的和其它优点,本发明提供一种物联网语音压缩与解压方法,其特征在于,
语音压缩的过程为:连续实时截取总时长为t的语音数据,然后按t/2n的间隔时间对所述语音数据取点,当取够2n个点时作为第N帧数据;将所述第N帧数据进行高频预加重,将高频预加重后的时域数据转成频域数据,再将频域数据求模计算功率谱得到频谱,以及在所述频谱中选取各次谐波幅值,并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数;将各次谐波幅值与总衰减系数相除得到4位量化的各次谐波幅度比;将所述第N帧数据和所述频谱结合进行基波分析得到基波频率值;将所述基波频率值、各次谐波幅度比和总衰减系数按照数据传输协议的帧数据格式排列生成第N帧数据的传输序码列,其中,t取20ms-60ms,n=7、8、9;N为正整数;
语音解压的过程为:对窄带物联网发送过来的传输序码列进行连续实时接收,接收的传输序码列与压缩方法中的数据传输协议的帧数据格式相同;将接收的传输序码列按数据传输协议的帧数据格式分离出第N帧数据的基波频率值、各次谐波幅度比以及总衰减系数;将各次谐波幅度比与总衰减系数相乘后得到各次谐波幅值;将各次谐波幅值与基波频率值进行反傅里叶变换,生成时域上的语音数据;将语音数据去高频预加重,再D/A转化后得到语音信号。
进一步地,语音压缩的过程中,时域数据转成频域数据的具体方式为通过傅里叶变换得到;所述基波分析具体方式为将第N帧数据和所述频谱采用最小二乘法计算每次谐波的标准间隔;所述的传输序码列通过窄带物联网传输。
进一步地,语音压缩的过程中,频谱中选取各次谐波幅值具体为:在20-2000Hz的频段中选取14个峰值点,得到第1~14次谐波的幅值,在2200—2600Hz频段中取最高幅值为第15次谐波幅值,3000-3600Hz频段取最高幅值为第16次谐波幅值,总共得到第1~16次谐波幅值;将第1~16次谐波幅值与总衰减系数相除得到4位量化的第1~16次谐波幅度比;其中,总衰减系数为取1~16次谐波幅值中的最大幅值除以16得到。
进一步地,语音压缩的过程中,当t=50ms,n=8时,对所述语音数据取点的间隔时间为t/2n=50/256ms,所述传输序码列的长度为12个字节,第1个字节作为起始码,最后1个字节作为结束码,第2个字节作为基波频率值,第3至10个字节依次作为第1~16次谐波幅度比,第11个字节作为总衰减系数。
进一步地,语音压缩的过程中,在连续实时截取总时长为t的语音数据之前,还包括将拾音器传输过来的语音信号进行预处理、增益放大、A/D转化后得到语音数据,并将语音数据存入内存,便于连续实时帧截取。
进一步地,将D/A转化后的语音信号经过功率放大后,传输给语音播放器发声。
本发明至少包括以下有益效果:本发明的实时语音压缩技术,可以将22KB/s、44KB/s以上的语音数据实时压缩成0.6KB/s甚至更低。相比于现有的MPEG标准的压缩技术,无需等待一段语音结束后再进行压缩处理,而是将语音信号分段实时压缩,无需等待漫长时延,在实现实时性通信的同时也极大地保留了语音的质量。相较于MPEG格式压缩率更高,更加适合在窄带物联网的极低速率下传输。
(1)实时性强
当前基于窄带物联网的语音技术停留在通过对人声的语音识别,直接将语音信号转换成数据指令传送给终端,终端通过这些指令信号作出相应反应来实现人机交互。其本质并不是通过窄带物联网真正传输语音信号,因此只能实现人机交互,无法真正实现语音交流,更谈不上实时性。然而本发明通过将数据量较大的语音信号分段实时压缩并发送使窄带物联网可以直接收发语音信号,并且通信延时极小,可以实现近似于打电话的通信效果,让窄带物联网真正实现语音互联。
(2)压缩率高,通信质量佳
语音信号在经过40倍甚至更高的极高压缩率下,不仅可以实现通话的实时性,更突破性的极大保留了通话时的语音质量,给您更好的通话体验。
(3)兼容性强
因为本发明的实时语音压缩技术在保证实时性的同时拥有着40倍甚至更高的压缩率,可以将22KB/s到44KB/s的语音信号压缩到0.6KB/s以下甚至更小。所以我们的技术对于模块传输速率的硬件要求极低。可广泛适用于zigbee、LoRa等现有窄带物联网模块当中并实现完美融合。可基于用户已经组好的窄带网络,无需更换已有设备,即插即用、方便实惠。
通过利用本发明的语音压缩和解压方法应用到对讲机上,可以做成单模块数据处理的对讲机系统和双模块数据处理的对讲机系统。单模块数据处理的对讲机系统结构紧凑,成本较低,但由于压缩和解压的都由一个ISD9160芯片实现,并且共用一个LoRa无线模块实现信号的发送和接收,所以通话质量较双模块方式差,且在其基础上进行二次开发的难度也较大。双模块数据处理的对讲机系统通话质量更好,在其基础上进行二次开发的难度小,有利于其他功能的进一步扩展。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明所述的用于窄带物联网的实时语音压缩的方法的流程图;
图2为本发明在窄带物联网中有助于连续实时帧截取语音数据的语音压缩的方法流程图;
图3为本发明压缩第N帧数据的传输序码列格式;
图4为本发明所述用于窄带物联网的实时语音解压方法的流程图;
图5为使用本发明的压缩和解压方法的单模块数据处理的对讲机系统模块连接图;
图6为使用本发明的压缩和解压方法的双模块数据处理的对讲机系统模块连接图;
图7为单模块数据处理的对讲机系统的电路图;
图8为双模块数据处理的对讲机系统电路图;
图9为某一人声在时域上的波形图;
图10为图9中a段生成的频谱图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,一种物联网语音压缩与解压方法,语音压缩包括:
在步骤101中,连续实时截取总时长为t的语音数据,然后按t/2n的间隔时间对所述语音数据取点,当取够2n个点时作为第N帧数据;
在步骤102中,将所述第N帧数据进行高频预加重,将高频预加重后的时域数据经过步骤103转成频域数据,再将频域数据经过步骤104求模计算功率谱得到频谱,以及在所述频谱中选取各次谐波幅值,并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数;
将各次谐波幅值与总衰减系数经过步骤106的相除得到步骤107的4位量化后的各次谐波幅度比;
在步骤105中,将所述第N帧数据和所述频谱结合进行基波分析得到基波频率值;
将所述基波频率值、各次谐波幅度比和总衰减系数按照数据传输协议的帧数据格式排列生成步骤108的第N帧数据的传输序码列;
其中,t取20ms-60ms,n=7、8、9;N为正整数。
在步骤103中,所述时域数据转成频域数据的具体方式为通过傅里叶变换得到;在步骤105中,所述基波分析具体方式为将第N帧数据和所述频谱采用最小二乘法计算每次谐波的标准间隔;所述的传输序码列可以通过在步骤109的窄带物联网传输。
在步骤104中求模计算功率谱得到的频谱中选取各次谐波幅值具体为:在20-2000Hz的频段中选取14个峰值点,得到第1~14次谐波的幅值,在2200—2600Hz频段中取最高幅值为第15次谐波幅值,3000-3600Hz频段取最高幅值为第16次谐波幅值,总共得到第1~16次谐波幅值;将第1~16次谐波幅值与总衰减系数相除得到4位量化的第1~16次谐波幅度比,这样得到的第1~16次谐波幅度比更能保证通话质量;其中,总衰减系数为取1~16次谐波幅值中的最大幅值除以16得到。
在步骤101中,当t=50ms,n=8时,对所述语音数据取点的间隔时间为t/2n=50/256ms=0.1953125ms,所述传输序码列的长度为12个字节,第1个字节作为起始码,最后1个字节作为结束码,第2个字节作为基波频率值,第3至10个字节依次作为第1~16次谐波幅度比,第11个字节作为总衰减系数,具体参见图3所示的一种传输序码列格式。
如图2所示,在步骤101连续实时截取总时长为t的语音数据之前,还包括将拾音器传输过来的语音信号进行步骤201预处理、步骤202增益放大、步骤203的A/D转化后得到语音数据,并将语音数据存入步骤204的DMA内存,便于步骤101中的连续实时帧截取。
本发明人以22k/s速率的声音数据处理为例,连续实时截取总时长为0.02s的语音数据进行压缩的具体实验为:
ISD9160芯片以22k/s的速率对声音数据进行实时采样,存入DMA,每存满数据量为22k/s×20ms=440Byte的数据,截取总时长为0.02s的440Byte语音数据进行压缩处理,同时马上进入下一个0.02s时段声音数据的采样和存贮。图9时域上的波形图中的a段即为实时采样并存入DMA的时长0.02s的数据。
将440Byte数据以每间隔0.02/256s取一个点的方式,每截取够256点即可作为一帧数据分别进行高频预加重和基波分析,高频预加重后的数据通过快速傅里叶变换(FFT),生成如图10的频谱图,在频谱中选取各次谐波幅值,并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数;将各次谐波幅值与总衰减系数相除得到4位量化的各次谐波幅度比;将截取够256点的一帧数据和所述频谱结合进行基波分析得到基波频率值;将所述基波频率值、各次谐波幅度比和总衰减系数按照图3的格式生成12Byte的传输序码列,压缩率约等于40:1,如果将截取总时长增长到0.05s,可以将压缩率提高到90:1。如图4所示,语音解压的方法,其包括:
在步骤401中,对窄带物联网发送过来的传输序码列进行连续实时接收,接收的传输序码列与压缩方法中的数据传输协议的帧数据格式相同;
将接收的传输序码列按数据传输协议的帧数据格式分离出第N帧数据的基波频率值、各次谐波幅度比以及总衰减系数;
在步骤402中,将各次谐波幅度比与总衰减系数相乘后得到各次谐波幅值;
在步骤403中,将各次谐波幅值与基波频率值进行反傅里叶变换(IFFT),生成时域上的语音数据;
在步骤404中,将语音数据去高频预加重,再到步骤405的D/A转化后得到语音信号。
还可以包括步骤406将D/A转化后的语音信号经过功率放大后,传输给语音播放器发声。
如图5所示,本发明通过使用上述的语音压缩与解压的方法,提供一种单模块数据处理的对讲机系统,其包括:
选择匹配对讲机模块,其用于选定需要语音通讯的其他对讲机;
拾音器,其用于将声音振动转换成模拟语音信号;
共用ISD9160芯片的压缩和解压模块,其用于实时接收拾音器传输过来的模拟语音信号,并将模拟语音信号AD转化为语音数据,然后将语音数据进行压缩得到传输序码列,以及用于实时采样LoRa无线模块接收的其他对讲机的传输序码列进行解压;
LoRa无线模块,其用于将压缩和解压模块的传输序码列无线发送给窄带物联网传输,传输给其他对讲机接收,以及用于将从窄带物联网传输过来的其他对讲机的传输序码列无线接受给压缩和解压模块;
切换收发模块,其用于选择LoRa无线模块处于无线发送状态还是无线接收状态;
语音播放器,其用于将压缩和解压模块解压后的语音信号播放发声;
稳压电源模块,其用于给对讲机系统提供电源。
单模块数据处理的对讲机系统的具体实施电路图如图7所示,拾音器MK1通过管脚MIC+、MIC-和MICBIAS与压缩和解压模块ISD9160电连接;语音播放器LS1通过管脚SPK+和SPK-与压缩和解压模块ISD9160电连接;选择匹配对讲机模块由按键S1-S4组成,其通过管脚PA.11、PA.10、PA.0、PA.1与压缩和解压模块ISD9160电连接;切换收发模块为按键S5,其通过管脚PA.2与压缩和解压模块ISD9160电连接;LoRa无线模块通过管脚PB.3、PB.4、PB.5、PB.6和PB.7与压缩和解压模块ISD9160电连接;稳压电源模块3V3通过管脚VSSD、VDD33、VCCD、VCCSPK和VCCA与压缩和解压模块ISD9160电连接;压缩和解压模块ISD9160的管脚VSSA、VSSSPK、VREG、VCCLDO接地。
如图6所示,本发明通过使用上述的语音压缩和解压的方法,提供一种双模块数据处理的对讲机系统,其包括:
选择匹配对讲机模块,其用于选定需要语音通讯的其他对讲机;
拾音器,其用于将声音振动转换成模拟语音信号;
压缩模块,其用于实时接收拾音器传输过来的模拟语音信号,并将模拟语音信号AD转化为语音数据,然后将语音数据进行压缩得到传输序码列;
LoRa无线发送模块,其用于将压缩模块的传输序码列无线发送给窄带物联网,传输给其他对讲机接收;
LoRa无线接收模块,其用于将从窄带物联网传输过来的其他对讲机的传输序码列无线接受给解压模块;
解压模块,其用于实时接受LoRa无线接收模块传输的其他对讲机的传输序码列进行解压;
语音播放器,其用于将解压模块解压后的语音信号播放发声;
稳压电源模块,其用于给对讲机系统提供电源。
双模块数据处理的对讲机系统的具体实施电路图如图8所示,压缩模块U2和解压模块U1分别用ISD9160芯片,并且通过管脚PA.7和PB.2并联,拾音器MK1通过管脚MIC+、MIC-和MICBIAS与压缩模块U2电连接;语音播放器LS1通过管脚SPK+和SPK-与解压模块U1电连接;选择匹配对讲机模块由按键S1-S5组成,其通过管脚PA.11、PA.10、PA.0、PA.1、PA.2与压缩模块U2电连接;LoRa无线发送模块通过管脚PB.3、PB.4、PB.5、PB.6和PB.7与压缩模块U2电连接;LoRa无线接收模块通过管脚PB.3、PB.4、PB.5、PB.6和PB.7与解压模块U1电连接;稳压电源模块3V3通过管脚VSSD、VDD33、VCCD、VCCSPK和VCCA与压缩模块U2和解压模块U1电连接;压缩模块U2和解压模块U1的管脚VSSA、VSSSPK、VREG、VCCLDO接地。
按照上述的电路图做出电路板,并对应焊接上元器件,烧入程序,进行模拟实验,在20公里范围内进行模拟实验能够达到预期效果,实时性强,能够近似于打电话的通信效果,压缩率高,通信质量佳。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用。它完全可以被适用于各种适合本发明的领域。对于熟悉本领域的人员而言,可容易地实现另外的修改。因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (6)
1.一种物联网语音压缩与解压方法,其特征在于,
语音压缩的过程为:连续实时截取总时长为t的语音数据,然后按t/2n的间隔时间对所述语音数据取点,当取够2n个点时作为第N帧数据;将所述第N帧数据进行高频预加重,将高频预加重后的时域数据转成频域数据,再将频域数据求模计算功率谱得到频谱,以及在所述频谱中选取各次谐波幅值,并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数;将各次谐波幅值与总衰减系数相除得到4位量化的各次谐波幅度比;将所述第N帧数据和所述频谱结合进行基波分析得到基波频率值;将所述基波频率值、各次谐波幅度比和总衰减系数按照数据传输协议的帧数据格式排列生成第N帧数据的传输序码列,其中,t取20ms-60ms,n=7、8、9;N为正整数;
语音解压的过程为:对窄带物联网发送过来的传输序码列进行连续实时接收,接收的传输序码列与压缩方法中的数据传输协议的帧数据格式相同;将接收的传输序码列按数据传输协议的帧数据格式分离出第N帧数据的基波频率值、各次谐波幅度比以及总衰减系数;将各次谐波幅度比与总衰减系数相乘后得到各次谐波幅值;将各次谐波幅值与基波频率值进行反傅里叶变换,生成时域上的语音数据;将语音数据去高频预加重,再D/A转化后得到语音信号。
2.根据权利要求1所述的一种物联网语音压缩与解压方法,其特征在于,语音压缩的过程中,时域数据转成频域数据的具体方式为通过傅里叶变换得到;所述基波分析具体方式为将第N帧数据和所述频谱采用最小二乘法计算每次谐波的标准间隔;所述的传输序码列通过窄带物联网传输。
3.根据权利要求2所述的一种物联网语音压缩与解压方法,其特征在于,语音压缩的过程中,频谱中选取各次谐波幅值具体为:在20-2000Hz的频段中选取14个峰值点,得到第1~14次谐波的幅值,在2200—2600Hz频段中取最高幅值为第15次谐波幅值,3000-3600Hz频段取最高幅值为第16次谐波幅值,总共得到第1~16次谐波幅值;将第1~16次谐波幅值与总衰减系数相除得到4位量化的第1~16次谐波幅度比;其中,总衰减系数为取1~16次谐波幅值中的最大幅值除以16得到。
4.根据权利要求3所述的一种物联网语音压缩与解压方法,其特征在于,语音压缩的过程中,当t=50ms,n=8时,对所述语音数据取点的间隔时间为t/2n=50/256ms,所述传输序码列的长度为12个字节,第1个字节作为起始码,最后1个字节作为结束码,第2个字节作为基波频率值,第3至10个字节依次作为第1~16次谐波幅度比,第11个字节作为总衰减系数。
5.根据权利要求4所述的一种物联网语音压缩与解压方法,其特征在于,语音压缩的过程中,在连续实时截取总时长为t的语音数据之前,还包括将拾音器传输过来的语音信号进行预处理、增益放大、A/D转化后得到语音数据,并将语音数据存入内存,便于连续实时帧截取。
6.根据权利要求1所述的一种物联网语音压缩与解压方法,其特征在于,将D/A转化后的语音信号经过功率放大后,传输给语音播放器发声。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011152530.XA CN112908345B (zh) | 2019-01-29 | 2019-01-29 | 一种物联网语音压缩与解压方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910086356.4A CN109741757B (zh) | 2019-01-29 | 2019-01-29 | 用于窄带物联网的实时语音压缩和解压的方法 |
CN202011152530.XA CN112908345B (zh) | 2019-01-29 | 2019-01-29 | 一种物联网语音压缩与解压方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910086356.4A Division CN109741757B (zh) | 2019-01-29 | 2019-01-29 | 用于窄带物联网的实时语音压缩和解压的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112908345A CN112908345A (zh) | 2021-06-04 |
CN112908345B true CN112908345B (zh) | 2022-05-31 |
Family
ID=66366627
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011151515.3A Pending CN114038473A (zh) | 2019-01-29 | 2019-01-29 | 一种单模块数据处理的对讲机系统 |
CN202011151514.9A Active CN113393849B (zh) | 2019-01-29 | 2019-01-29 | 一种双模块数据处理的对讲机系统 |
CN202011152530.XA Active CN112908345B (zh) | 2019-01-29 | 2019-01-29 | 一种物联网语音压缩与解压方法 |
CN201910086356.4A Active CN109741757B (zh) | 2019-01-29 | 2019-01-29 | 用于窄带物联网的实时语音压缩和解压的方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011151515.3A Pending CN114038473A (zh) | 2019-01-29 | 2019-01-29 | 一种单模块数据处理的对讲机系统 |
CN202011151514.9A Active CN113393849B (zh) | 2019-01-29 | 2019-01-29 | 一种双模块数据处理的对讲机系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910086356.4A Active CN109741757B (zh) | 2019-01-29 | 2019-01-29 | 用于窄带物联网的实时语音压缩和解压的方法 |
Country Status (1)
Country | Link |
---|---|
CN (4) | CN114038473A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114038473A (zh) * | 2019-01-29 | 2022-02-11 | 桂林理工大学南宁分校 | 一种单模块数据处理的对讲机系统 |
US11342932B2 (en) * | 2020-05-13 | 2022-05-24 | Computational Systems, Inc. | Machine spectral data compression |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0659700A (ja) * | 1992-01-21 | 1994-03-04 | Yamaha Corp | 音声データ圧縮装置 |
JP2007108440A (ja) * | 2005-10-13 | 2007-04-26 | Kenwood Corp | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
DE102010041644A1 (de) * | 2010-09-29 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zur Frequenzkompression mit harmonischer Korrektur und Vorrichtung |
WO2015140291A1 (en) * | 2014-03-21 | 2015-09-24 | Thomson Licensing | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal |
CN109741757A (zh) * | 2019-01-29 | 2019-05-10 | 桂林理工大学南宁分校 | 用于窄带物联网的实时语音压缩和解压的方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
FR2768546B1 (fr) * | 1997-09-18 | 2000-07-21 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
US6253171B1 (en) * | 1999-02-23 | 2001-06-26 | Comsat Corporation | Method of determining the voicing probability of speech signals |
US6741966B2 (en) * | 2001-01-22 | 2004-05-25 | Telefonaktiebolaget L.M. Ericsson | Methods, devices and computer program products for compressing an audio signal |
US20070005351A1 (en) * | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
US20140019125A1 (en) * | 2011-03-31 | 2014-01-16 | Nokia Corporation | Low band bandwidth extended |
CN103763736A (zh) * | 2014-01-15 | 2014-04-30 | 中煤矿山建设集团有限责任公司 | 一种基于ZigBee技术的无线实时语音高品质传输装置和方法 |
CN105137185B (zh) * | 2015-07-23 | 2017-09-22 | 河海大学 | 一种基于离散傅里叶变换的频域插值电力谐波分析方法 |
CN106330237A (zh) * | 2016-10-18 | 2017-01-11 | 深圳市大语科技有限公司 | 一种窄带无线数字语音时分双工对讲系统 |
CN106658433A (zh) * | 2016-12-27 | 2017-05-10 | 陈君华 | 一种实现基于LoRa技术的数字集群对讲机的方法及对讲机 |
CN107147415B (zh) * | 2017-04-05 | 2019-12-10 | 深圳市亿兆互联技术有限公司 | 一种基于lora技术的语音对讲装置及方法 |
CN107396211A (zh) * | 2017-08-31 | 2017-11-24 | 武汉中电物联科技有限公司 | 无线语音发送端、接收端以及系统 |
-
2019
- 2019-01-29 CN CN202011151515.3A patent/CN114038473A/zh active Pending
- 2019-01-29 CN CN202011151514.9A patent/CN113393849B/zh active Active
- 2019-01-29 CN CN202011152530.XA patent/CN112908345B/zh active Active
- 2019-01-29 CN CN201910086356.4A patent/CN109741757B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0659700A (ja) * | 1992-01-21 | 1994-03-04 | Yamaha Corp | 音声データ圧縮装置 |
JP2007108440A (ja) * | 2005-10-13 | 2007-04-26 | Kenwood Corp | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
DE102010041644A1 (de) * | 2010-09-29 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zur Frequenzkompression mit harmonischer Korrektur und Vorrichtung |
WO2015140291A1 (en) * | 2014-03-21 | 2015-09-24 | Thomson Licensing | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal |
CN109741757A (zh) * | 2019-01-29 | 2019-05-10 | 桂林理工大学南宁分校 | 用于窄带物联网的实时语音压缩和解压的方法 |
CN113393849A (zh) * | 2019-01-29 | 2021-09-14 | 桂林理工大学南宁分校 | 一种双模块数据处理的对讲机系统 |
Non-Patent Citations (3)
Title |
---|
Michael Moskovitz."Improvement of a parametric model for audio signal compression at a low bit rates".《Congerence:Electrical and Electronics Engineers》.2004, * |
宋少鹏."基于正弦+噪声模型的宽带音频信号的表示与压缩".《中国优秀硕士学位论文全文数据库(信息科技辑)》.2005, * |
田春环."混合激励参数提取量化编码新算法及其应用".《中国优秀硕士学位论文全文数据库(信息科技辑)》.2017, * |
Also Published As
Publication number | Publication date |
---|---|
CN112908345A (zh) | 2021-06-04 |
CN114038473A (zh) | 2022-02-11 |
CN109741757B (zh) | 2020-10-23 |
CN113393849B (zh) | 2022-07-12 |
CN109741757A (zh) | 2019-05-10 |
CN113393849A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101399568B (zh) | 移动终端作为计算机输入输出设备的设备及其系统、方法 | |
US20200107107A1 (en) | Data transmission method and system, and bluetooth headphone | |
CN112908345B (zh) | 一种物联网语音压缩与解压方法 | |
JPS59149438A (ja) | デイジタル化音声信号の圧縮及び伸長方法 | |
WO2002019666A3 (en) | A communications terminal, a system and a method for internet/network telephony | |
CN108964787A (zh) | 一种基于超声波的信息广播方法 | |
CN106331306A (zh) | 用于通话时的录音方法、用于录屏时的录音方法及装置 | |
CN102334977A (zh) | 测量装置、移动设备和人体生理参数测量系统及测量数据无线传输方法 | |
CN109743668B (zh) | 一种音频测试方法和设备 | |
CN213906675U (zh) | 一种便携式无线蓝牙录音设备 | |
CN105024764A (zh) | 一种基于音频格式的文件传输方法及系统 | |
CN111885412A (zh) | Hdmi信号传屏方法及无线传屏器 | |
CN112637703B (zh) | 一种web端实时对讲系统及对讲方法 | |
CN104540084A (zh) | 一种立体声语音通信方法及系统 | |
CN102984661A (zh) | 基于移动通信网络的群组呼叫方法、终端及服务器 | |
CN101442575A (zh) | 一种网络语音系统的实现方法 | |
US11545161B2 (en) | Wireless communication device, and method and apparatus for processing voice data | |
CN105491302A (zh) | 音频信号输出方法、装置、终端及系统 | |
WO2019000619A1 (zh) | 翻译方法、翻译设备及翻译系统 | |
CN101800608B (zh) | 可适性差分脉冲码调变-解调变系统与方法 | |
CN101930745B (zh) | 一种在ip语音通信中消除回声的方法和设备 | |
CN109874083A (zh) | 一种带监控装置的新闻录音设备 | |
CN102685332A (zh) | 一种通过移动终端通话信道提供信息的方法和系统 | |
RU2144222C1 (ru) | Способ сжатия звуковой информации и система для его реализации | |
CN202267526U (zh) | 电子秤、移动设备和体重测量系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |