CN111816196A - 一种声波信息的解码方法及装置 - Google Patents

一种声波信息的解码方法及装置 Download PDF

Info

Publication number
CN111816196A
CN111816196A CN202010480109.5A CN202010480109A CN111816196A CN 111816196 A CN111816196 A CN 111816196A CN 202010480109 A CN202010480109 A CN 202010480109A CN 111816196 A CN111816196 A CN 111816196A
Authority
CN
China
Prior art keywords
data
decoding
quantized
sound wave
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010480109.5A
Other languages
English (en)
Inventor
唐鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sound Internet Information Technology Co ltd
Original Assignee
Beijing Sound Internet Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sound Internet Information Technology Co ltd filed Critical Beijing Sound Internet Information Technology Co ltd
Priority to CN202010480109.5A priority Critical patent/CN111816196A/zh
Publication of CN111816196A publication Critical patent/CN111816196A/zh
Priority to PCT/CN2021/096642 priority patent/WO2021249205A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Abstract

本发明公开了一种声波信息的解码方法及装置,其中,该解码方法包括:对待解码的音频量化压缩数据流进行实时解压缩处理,以生成一个或多个连续的量化数据块Zx;从每个所述量化数据块Zx中分别选取与所述n个位元信号频率对应相同频率或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure DDA0002517028670000011
并对每个所述量化数据
Figure DDA0002517028670000012
进行量化还原,以获得对应的能量数据
Figure DDA0002517028670000013
对每个所述能量数据
Figure DDA0002517028670000014
进行离散余弦逆变换处理,以获得幅值数据
Figure DDA0002517028670000015
对所述幅值数据
Figure DDA0002517028670000016
进行声波信号解码,以获得对应的声波数据。利用本发明,能够显著提高解释型语言对音频量化压缩数据流进行声波解码的运算速度。

Description

一种声波信息的解码方法及装置
技术领域
本发明涉及通信编码技术领域,特别涉及一种声波信号解码的方法及装置。
背景技术
音频量化压缩是采用音频量化处理的音频压缩技术。量化是指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的) 离散值的过程,即,通过四舍五入的方法将采样后的模拟信号转换成一种数字信号的过程;音频压缩是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码,其中,音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。
声波信号是一种叠加在声波或音频中的通讯信号或标识信号,现有的声波解码技术为:
一、对原始数字音频信号流直接进行声波信号解码以得到声波信号;
二、将音频压缩数据流还原成原始数字音频信号流,并对该原始数字音频信号流进行傅里叶变换,然后对经过傅里叶变换的音频信号进行声波信号解码,以获得声波信号。将经过音频压缩的数据流还原成原始数字音频信号流时,需要经过一系列的复杂运算。
在运用解释型语言(如Python/JavaScript/Perl/Shell等)对音频量化压缩的数据流进行声波解码时,因程序在运行时,要先翻译成中间代码,再由解释器对中间代码进行解释运行,每执行一次都要翻译一次,运算速度较低,耗时较长。
发明内容
有鉴于此,本发明提供一种声波信息的解码方法及装置,能够显著提高解释型语言对音频量化压缩数据流进行声波解码的运算速度,以解决上述问题。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种声波信号解码方法,所述方法包括:对待解码的音频量化压缩数据流进行实时解压缩处理,以生成一个或多个连续的量化数据块Zx;其中,x为数据块的序号,x=1、2、3、……;原始音频信号通过量化处理和压缩处理以生成所述音频量化压缩数据流,所述原始音频信号预先叠加一个或多个声波信号,每个所述声波信号由m个单元信号分别在连续的m个时序上拼接组成,每个所述单元信号由n个位元信号在同一个时序上叠加组成,m、n均为预设的自然数;从每个所述量化数据块Zx中分别选取与所述n个位元信号频率对应相同频率或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure BDA0002517028650000021
并对每个所述量化数据
Figure BDA0002517028650000022
进行量化还原,以获得对应的能量数据
Figure BDA0002517028650000023
其中,y为位元信号的标识号,且,y=1、2、3、……n;对每个所述能量数据
Figure BDA0002517028650000024
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000025
其中,z为时序的序号,z=1、2、 3、……;对所述幅值数据
Figure BDA0002517028650000026
进行声波信号解码,以获得对应的声波数据。
其中,所述对每个所述能量数据
Figure BDA0002517028650000027
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000028
具体包括:利用公式(1)对每个所述能量数据
Figure BDA0002517028650000029
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA00025170286500000210
Figure BDA00025170286500000211
其中,T=18,t=0、1、2、……T-1,z=T(x-1)+t+1,Fy为所述音频量化压缩数据流所预定义的能量数据
Figure BDA00025170286500000212
的编码常量。
其中,所述对所述幅值数据
Figure BDA00025170286500000213
进行声波信号解码,以获得对应的声波数据,具体包括:从幅值数据
Figure BDA00025170286500000214
中选取连续m个时序的幅值数据
Figure BDA00025170286500000215
进行单元解码,以获得与所述m个时序对应的单元数据d1、d2、d3、……dm;其中,i≥0,i为连续m个时序中的第i个时序在
Figure BDA0002517028650000031
中的绝对序号;j为连续m个时序的相对序号,j=1、2、3、……m;对所述单元数据d1、d2、d3、……dm进行合成解码,以获得声波数据。
其中,所述从幅值数据
Figure BDA0002517028650000032
中选取连续m个时序的幅值数据
Figure BDA0002517028650000033
进行单元解码,具体包括:根据所述幅值数据
Figure BDA0002517028650000034
通过对比各时序中幅值
Figure BDA0002517028650000035
Figure BDA0002517028650000036
的大小,以确定位元数据bk的数值,并将确定的位元数据b1、b3、b5、……、bk、……、bn-1组成二进制数,以获得对应的单元数据dj的数值;其中,k为一个单元信号所包含的n个位元信号的序号,k=1、3、5、……、n-1。
其中,所述从幅值数据
Figure BDA0002517028650000037
中选取连续m个时序的幅值数据
Figure BDA0002517028650000038
进行单元解码,具体包括:根据所述幅值数据
Figure BDA0002517028650000039
选取各时序中幅值最大的k个频率组成频率集合,通过比对所述频率集合在预设的l个k 元频率集合组成的序列中零起始的位序号,以确定对应的单元数据dj的数值;其中,0≤dj≤l,k、l均为预设自然数。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种声波信号解码装置,所述装置包括:解压缩处理模块,用于对待解码的音频量化压缩数据流进行实时解压缩处理,以生成一个或多个连续的量化数据块Zx;其中,x为数据块的序号,x=1、2、3、……;原始音频信号通过量化处理和压缩处理以生成所述音频量化压缩数据流,所述原始音频信号预先叠加一个或多个声波信号,每个所述声波信号由m个单元信号分别在连续的m个时序上拼接组成,每个所述单元信号由n个位元信号在同一个时序上叠加组成,m、n均为预设的自然数;筛选模块,用于从每个所述量化数据块Zx中分别选取与所述n个位元信号频率对应相同频率或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure BDA00025170286500000310
并对每个所述量化数据
Figure BDA00025170286500000311
进行量化还原,以获得对应的能量数据
Figure BDA00025170286500000312
其中,y为位元信号的标识号,且,y=1、2、3、…… n;离散余弦逆变换处理模块,用于对每个所述能量数据
Figure BDA00025170286500000313
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA00025170286500000314
其中,z为时序的序号,z=1、2、3、……;以及解码模块,用于对所述幅值数据
Figure BDA0002517028650000041
进行声波信号解码,以获得对应的声波数据。
其中,所述离散余弦逆变换处理模块用于利用公式(1)对每个所述能量数据
Figure BDA0002517028650000042
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000043
Figure BDA0002517028650000044
其中,T=18,t=0、1、2、……T-1,z=T(x-1)+t+1,Fy为所述音频量化压缩数据流所预定义的能量数据
Figure BDA0002517028650000045
的编码常量。
其中,所述解码模块体包括:单元解码子模块,用于从所述幅值数据
Figure BDA0002517028650000046
中选取连续m个时序的幅值数据
Figure BDA0002517028650000047
进行单元解码,以获得与所述m个时序对应的单元数据d1、d2、d3、……dm;其中,i≥0,i为连续m个时序中的第i个时序在
Figure BDA0002517028650000048
中的绝对序号;j为连续m个时序的相对序号,j=1、2、3、……m;合成解码子模块,用于对所述单元数据 d1、d2、d3、……dm进行合成解码,以获得声波数据。
其中,所述单元解码子模块用于根据所述幅值数据
Figure BDA0002517028650000049
通过对比各时序中幅值
Figure BDA00025170286500000410
Figure BDA00025170286500000411
的大小,以确定位元数据bk的数值,并将确定的位元数据b1、b3、b5、……、bk、……、bn-1组成二进制数,以获得对应的单元数据dj的数值;其中,k为一个单元信号所包含的n 个位元信号的序号,k=1、3、5、……、n-1。
其中,所述单元解码子模块用于根据所述幅值数据
Figure BDA00025170286500000412
选取各时序中幅值最大的k个频率组成频率集合,通过比对所述频率集合在预设的l个k元频率集合组成的序列中零起始的位序号,以确定对应的单元数据dj的数值;其中,0≤dj≤l,k、l均为预设自然数。
本发明实施方式提供的一种声波信号解码的方法及装置,通过声波信号的信号频率确定与其相关的音频压缩数据流的能量数据,并针对选取的能量数据进行量化还原处理以得到局部量化还原的声波能量数据块,以及通过对该声波能量数据库进行离散余弦逆变换处理,从而省略了量化还原之后所进行的重新排序、消除混叠、加窗合成滤波、相位修正以及多相合成滤波这些运算过程,从而减少运算量;进一步地,经过离散余弦逆变换处理得到的能量数据可以直接进行声波解码,从而省去声波解码通常都会用到的傅里叶运算;从而减少原有声波信号解码过程中的运算步骤和运算量,提升解释型语音对声波解码的速度。
附图说明
图1是本发明第一实施方式中的一种声波信号解码方法的流程示意图;
图2是本发明第二实施方式中的一种声波信号解码方法的流程示意图
图3是本发明实施方式中的一种声波信号解码装置的结构示意图;
图4是图3中解码模块的结构示意图。
具体实施方式
请参阅图1,为本发明实施方式中的一种声波信号解码方法的流程示意图,该方法包括:
步骤S10,对待解码的音频量化压缩数据流进行实时解压缩处理,以生成一个或多个连续的量化数据块Zx。其中,x为数据块的序号,且 x=1、2、3、……。原始音频信号通过量化处理和压缩处理生成该音频量化压缩数据流,该原始音频信号预先叠加一个或多个声波信号,每个声波信号由m个单元信号分别在连续的m个时序上拼接组成,每个单元信号由n个位元信号在同一个时序上叠加组成,m、n均为预设的自然数。
通过不同编码算法对原始音频信号进行量化处理和压缩处理以得到对应的音频量化压缩数据流,因此需要通过相应的解压缩算法对该音频量化压缩数据流进行解压缩处理。该编码算法可以是AAC(Advanced Audio Coding,高级音频编码)压缩算法、MP3压缩算法、霍夫曼压缩算法等;例如,当该音频量化压缩数据流是基于AAC压缩算法得到的,则通过AAC解压缩算法对该音频量化压缩数据流进行解压缩处理,以得到量化数据块。在本实施方式中,原始音频信号经过霍夫曼压缩算法进行压缩处理以得到该音频量化压缩数据流,因此利用相应的霍夫曼解压缩算法对该音频量化压缩数据流进行解压缩处理。
具体地,对该待解码的音频量化压缩数据流进行解压缩处理,以从该音频量化压缩数据流中选取一个或多个连续的压缩数据帧,对每个压缩数据帧进行解压缩处理,以生成一个或多个连续的量化数据块Zx。其中,该待解码的音频量化压缩数据流是由连续的多个压缩数据帧组成,每个压缩数据帧都有既定的格式。根据音频量化压缩数据流所采用的编码算法,通过对数据流的逐个字节的实时比对与校验,获得一个或多个连续的压缩数据帧,并根据音频量化压缩数据流的编码算法从每个压缩数据帧中获取对应的压缩数据块、解压缩参数以及量化还原参数,以及通过相应的解压缩算法对每个压缩数据块进行解压缩处理,以得到对应的量化数据块Zx。其中,根据编码算法可以从多个压缩数据帧中获取一个压缩数据块。
例如,该待解码的音频量化压缩数据流的参数如下:
时间长度 13.609秒
采样频率 44100Hz
采样数据 32位(1字节)记录
单声道
格式 MPEG-1Layer III(MP3)
常数比特率 192kbps
通过步骤S10,对该待解码的音频量化压缩数据流进行解压缩处理,以生成多个量化数据块,即,x=1、2、3、……。每个量化数据块包含 576个量化数值,所述576个量化数值所代表的频率区间依次是频率范围0-22050Hz中平均分布的由低到高的频率区间。每个量化数据块是由多个数量化据组成,x是由所述音频压缩流决定的。每个音频量化压缩数据流由多个量化数据块组成,因此x值不是定数,音频量化压缩数据流的时间越长x越大。
在本实施方式中,该声波信号由12个单元信号分别在连续的12个时序上拼接组成,每个单元信号由8个位元信号在同一个时序上叠加而成;其中,这8个位元信号的频率分别是18001.76Hz、18174.02Hz、 18518.55Hz、18690.82Hz、19035.35Hz、19207.62Hz、19552.15Hz、 19724.41Hz,即,m=12,n=8。
步骤S11,从每个量化数据块Zx中分别选取与所述n个位元信号频率对应相同频率或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure BDA0002517028650000071
并对每个所述量化数据
Figure BDA0002517028650000072
进行量化还原,以获得对应的能量数据
Figure BDA0002517028650000073
其中,y为位元信号的标识号,且,y=1、2、 3、……n。
在本实施方式中,从每个量化数据块中选取与第i个声波信号频率范围相同的n个量化数值。在其他实施方式中,还可以从每个量化数据块中选取与第i个声波信号频率相邻频率的量化数据块;其中,相邻频率被预先定义为与声波信号频率不同,且差异值最小的频率值。
由于,对原始音频量化压缩数据流进行音频量化压缩处理时,通过傅里叶变换处理原始音频数据流会产生频谱泄露,因此通过上述基于近似频率选择量化数据块的方法,可以有效弥补频谱泄露而产生的频率偏移。
例如,当x=1,n=8时,从第一个量化数据块Z1中选取与所述声波信号的8个位元信号频率对应相同频率的8个量化数据块,即,第470、 474、483、488、497、501、510、515个量化数据块
Figure BDA0002517028650000074
Figure BDA0002517028650000075
以组成量化数据
Figure BDA0002517028650000076
Figure BDA0002517028650000077
其中,
Figure BDA0002517028650000078
对应的频率为18001.76Hz,
Figure BDA0002517028650000079
对应的频率为18174.02Hz,
Figure BDA00025170286500000710
对应的频率为18518.55Hz,
Figure BDA00025170286500000711
对应的频率为18690.82Hz,
Figure BDA00025170286500000712
对应的频率为19035.35Hz,
Figure BDA00025170286500000713
对应的频率为19207.62Hz,
Figure BDA00025170286500000714
对应的频率为 19552.15Hz,
Figure BDA00025170286500000715
对应的频率为19724.41Hz。然后,对上述的8个量化数据进行量化还原,以得到8个对应的能量数据,分别为
Figure BDA00025170286500000716
Figure BDA00025170286500000717
如上所述,通过步骤S11对所述量化数据进行量化还原,以得到能量数据,量化还原的运算量由现有技术的声波信息编码所需的576次的全局量化降为8次的局部量化。
量化数据是指音频量化压缩数据流在原始编码过程中,对原始信号的能量进行量化处理后得到的数据;量化数据并不能直接当作信号的能量,而是需要通过量化还原处理后,才能获得信号的能量。在步骤S11 中,并未对量化数据块中的所有量化数据进行量化还原处理,而是仅仅对量化数据块中选取的与声波信号的位元信号对应的相同频率或近似频率对应的量化数据进行量化还原处理,即,通过局部量化还原的方法,提升量化数据的处理速度。
进一步地,根据原始音频量化压缩数据流的编码格式,量化数据块还可以是以一种短块形式存在的数据,但其局部量化还原的方法和原理是一致的。例如,短块形式的量化数据也是一个由576个数值组成的序列,这576个数值依序每3个数值为一组,每组所代表的频率区间依次分别是频率范围0-22050Hz中平均分布的由低到高的192个频率区间。根据声波信号的8个位元信号频率进行筛选,对这个192组量化数据中的(零起始序列开始)的第156、158、161、162、165、167、170、171 共8组量化数据进行量化还原,得到8个对应的能量数据。
同样地,对于短块形式的量化数据的选取,也可以基于近似频率区间的选取方法。
步骤S12,对每个能量数据
Figure BDA0002517028650000081
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000082
其中,z为时序的序号,z=1、2、3、……。
在本实施方式中,利用公式(1)对每个能量数据
Figure BDA0002517028650000083
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000084
Figure BDA0002517028650000085
其中,T=18,t=0、1、2、……T-1,z=T(x-1)+t+1,Fy为所述音频量化压缩数据流所预定义的能量数据
Figure BDA0002517028650000086
的编码常量。
例如,对得到的8个能量数据
Figure BDA0002517028650000087
Figure BDA0002517028650000088
分别进行离散余弦逆变换处理,以得到对应的幅值数据。
对能量数据
Figure BDA0002517028650000089
进行离散余弦逆变换处理时,即,x=29,y=1,具体地:
当t=0时,根据公式(1)得到,z=505,
Figure BDA0002517028650000091
当t=4时,根据公式(1)得到,z=509,
Figure BDA0002517028650000092
……
当t=15时,根据公式(1)得到,z=520,
Figure BDA0002517028650000093
当t=16时,根据公式(1)得到,z=521,
Figure BDA0002517028650000094
当t=17时,根据公式(1)得到,z=522,
Figure BDA0002517028650000095
对能量数据
Figure BDA0002517028650000096
进行离散余弦逆变换处理时,即,x=29,y=2,具体地:
当t=2时,根据公式(1)得到,z=507,
Figure BDA0002517028650000097
当t=3时,根据公式(1)得到,z=508,
Figure BDA0002517028650000098
当t=4时,根据公式(1)得到,z=509,
Figure BDA0002517028650000099
……
以此类推,分别对与所述8个声波信号频率分别相同(或最相似) 的8个能量数据
Figure BDA00025170286500000910
分别进行离散余弦逆变换处理,得到这8个能量数据音频在时间轴上分布的18 个时间区间的各自频率幅值,如下图表1所示。
Figure BDA00025170286500000911
图表1(注:表中数据为仅为示意)
其中,空白单元格是为了示意而省去了具体数值,幅值数据为示意数据。图表1中的频率1、频率2、……频率8分别代表选取的8个能量数据的频率。
在现有技术中,对于音频量化压缩数据流进行的声波信号解码,在进行全局量化还原处理之后,还需要进行重新排序、消除混叠、加窗滤波、相位修正、多相合成滤波以及傅里叶变换这些运算,而其中多相合成滤波的运算尤其耗时。
通过如上步骤S11和步骤S12的处理,不仅将全局量化还原处理简化为局部量化还原处理,同时避免了不必要的重新排序、消除混叠、加窗滤波、相位修正、多相合成滤波等运算步骤,并进一步省去声波解码通常都会用到的傅里叶变换运算。从而,缩减了原有声波信号解码过程中的运算步骤和运算量,因此极为显著地提升了解释型语言的声波信号解码速度。
例如,基于解释型编程语言JavaScript,结合现有技术的声波信号解码,分别构建三个声波解码方案的计算机仿真程序,每个计算机仿真程序都用于对实验样本(如上举例所述的待解码音频量化压缩数据流)进行连续重复8次的声波解码运算,并记录各个流程步骤的运算时间,具体如下图表所示:
流程步骤 现有技术A方案 现有技术B方案 本发明
1.霍夫曼解码 341.79 342.74 325.24
2.量化还原 397.75 48.88 27.85
3.重排序 1.07 0.39 -
4.消混叠 18.82 6.94 -
5.加窗混合滤波 539.55 87.35 -
6.相位修正 7.28 5.17 -
7.多相合成滤波 1414.28 857.35 -
8.傅里叶变换 389.93 387.70 -
9.声码解码 15.10 15.63 36.02
总运算时间 2895.18 1522.68 385.40
图表2
备注:数值单位为毫秒。“总运算时间”为实测值,其余为参考实测值。
现有技术A方案为:将音频压缩数据流还原成原始数字音频信号流;对前述的原始数字音频信号流,通过傅里叶变换之后,进行声波信号的解码,取得声波信号。
现有技术B方案为:将音频压缩数据流还原成局部频带的原始数字音频信号流;对前述的原始数字音频信号流,通过傅里叶变换之后,进行声波信号的解码,取得声波信号。其中,所述局部频带为与声波信号频率相同(或最近似频率)的频带。
经过如上所述的3个计算机仿真程序进行声波信号解码的模拟运算,可以明显知道,本发明由于局部量化还原而节省了大量运算时间,同时通过省去重新排序、消除混叠、加窗滤波、相位修正、多相合成滤波以及傅里叶变换,而使得整个解码过程所做的运算量大幅减少,总运算时间也相应地得到大幅的减少,明显提高了解码运算效率。
步骤S13,对所述幅值数据
Figure BDA0002517028650000111
进行声波信号解码,以获得对应的声波数据。
请同时参阅图2,步骤S13,对幅值数据
Figure BDA0002517028650000112
进行声波信号解码,以获得对应的声波数据,具体通过如下步骤实现:
步骤S131,从幅值数据
Figure BDA0002517028650000113
中选取连续m个时序的幅值数据
Figure BDA0002517028650000114
进行单元解码,以得到与所述m个时序对应的单元数据d1、d2、d3、…… dm。其中,i≥0,i为连续m个时序中的第i个时序在
Figure BDA0002517028650000115
中的绝对序号; j为连续m个时序的相对序号,j=1、2、3、……m。
在本实施方式中,从幅值数据
Figure BDA0002517028650000116
中选取连续m个时序的幅值数据
Figure BDA0002517028650000117
进行单元解码,具体包括:根据幅值数据
Figure BDA0002517028650000118
通过对比各时序中幅值
Figure BDA0002517028650000119
Figure BDA00025170286500001110
的大小,以确定位元数据bk的数值,并将确定的位元数据b1、b3、b5、……、bk、……、bn-1组成二进制数,以获得对应的单元数据dj的数值。其中,k为一个单元信号所包含的n个位元信号的序号,k=1、3、5、……n-1。在本实施方式中,通过对比同一时序的两个相邻频率的幅值数据的大小,并根据较大的幅值数据的信号频率,以确定对应的位元数据的数值。
根据如上所述得到的幅值数据,比对每个时序中相邻两个幅值数据的大小,例如,当时序z=1时,确定该时序中的幅值数据包含
Figure BDA00025170286500001111
Figure BDA0002517028650000121
通过比对相邻的两个幅值数据
Figure BDA0002517028650000122
的大小,以确定位元数据b1的数值;通过比对幅值数据
Figure BDA0002517028650000123
的大小,以确定位元数据b3的数值;通过比对幅值数据
Figure BDA0002517028650000124
的大小,以确定位元数据b5的数值;通过比对幅值数据
Figure BDA0002517028650000125
的大小,以确定位元数据b7的数值;然后,将确定的位元数据b1、b3、b5、b7组成二进制数,以获得对应的单元数据d1。同理,获得后续时序所对应的单元数据d2、d3、d4、d5、……、 d12
在另一实施方式中,从幅值数据
Figure BDA0002517028650000126
中选取连续m个时序的幅值数据
Figure BDA0002517028650000127
进行单元解码,具体包括:根据幅值数据
Figure BDA0002517028650000128
选取各时序中幅值最大的k个频率组成频率集合,通过比对该频率集合在预设的l 个k元频率集合组成的序列中,以零起始的位序号,以确定对应的单元数据dj的数值。其中,0≤dj≤l,k、l均为预设自然数。
例如,当z=1时,确定该时序中的幅值数据包含
Figure BDA0002517028650000129
从该时序中选择幅值最大的4个幅值数据,并将这4个幅值数据对应的频率组成频率集合,如,a0={18.1kHz,18.2kHz,18.3kHz,18.7kHz},即, k=4;
预设8个4元频率集合如下,即,k=4,l=8:
r0={18.1kHz,18.2kHz,18.3kHz,18.4kHz},
r1={18.1kHz,18.2kHz,18.3kHz,18.5kHz},
r2={18.1kHz,18.2kHz,18.3kHz,18.6kHz},
r3={18.1kHz,18.2kHz,18.3kHz,18.7kHz},
r4={18.1kHz,18.2kHz,18.3kHz,18.8kHz},
r5={18.1kHz,18.3kHz,18.5kHz,18.7kHz},
r6={18.2kHz,18.4kHz,18.6kHz,18.8kHz},
r7={18.2kHz,18.3kHz,18.5kHz,18.6kHz};
上述8个预设频率集合组成的序列中,通过将筛选出来的频率集合 a0与上述8个预设频率集合进行对比,从而确定该频率集合a0位于上述 8个预设频率集合组成的序列中位序号为3,即,a0=r3,因此,对应的单元数据d1的数值为3。
同理,对每个时序中的幅值数据进行如上所述的筛选和比对,以获得对应的单元数据d2、d3、d4、d5、……、d12
步骤S132,对该单元数据d1、d2、d3、……dm进行合成解码,以得到声波数据。
具体地,根据声波编码算法,由d1、d2、d3、……dm所组成的多进制数据,即为声波数据。
请参阅图3,为本发明实施方式中的一种声波信号的解码装置的结构示意图。该装置20包括解压缩处理模块21、筛选模块22、离散余弦逆变换处理模块23以及解码模块24。
该解压缩处理模块21用于对待解码的音频量化压缩数据流进行解压缩处理,以生成一个或多个连续的量化数据块Zx。其中,x为数据块的序号,且x=1、2、3、……。原始音频信号通过量化处理和压缩处理生成该音频量化压缩数据流,该原始音频信号预先叠加一个或多个声波信号,每个声波信号由m个单元信号分别在连续的m个时序上拼接组成,每个单元信号由n个位元信号在同一个时序上叠加组成,m、n均为预设的自然数。
具体地,该解压缩处理模块21对待解码的音频量化压缩数据流进行解压缩处理,以从该音频量化压缩数据流中选取一个或多个连续的压缩数据帧,对每个压缩数据帧进行解压缩处理,以生成一个或多个连续的量化数据块Zx。其中,该待解码的音频量化压缩数据流是由连续的多个压缩数据帧组成,每个压缩数据帧都有既定的格式。
该解压缩处理模块21根据音频量化压缩数据流所采用的编码算法,通过对数据流的逐个字节的实时比对与校验,获得一个或多个连续的压缩数据帧,并根据音频量化压缩数据流的编码算法从每个压缩数据帧中获取对应的压缩数据块、解压缩参数以及量化还原参数,以及通过相应的解压缩算法对每个压缩数据块进行解压缩处理,以得到对应的量化数据块Zx。其中,根据编码算法可以从多个压缩数据帧中获取一个压缩数据块。
在本实施方式中,该声波信号由12个单元信号分别在连续的12个时序上拼接组成,每个单元信号由8个位元信号在同一个时序上叠加而成。
该筛选模块22用于从每个量化数据块Zx中分别选取与n个位元信号频率对应相同或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure BDA0002517028650000141
并对每个量化数据
Figure BDA0002517028650000142
进行量化还原,以获得对应的能量数据
Figure BDA0002517028650000143
其中,y为位元信号的标识号,且,y=1、2、3、…… n。
在本实施方式中,该筛选模块22从每个量化数据块中选取与第i 个声波信号频率范围相同的n个量化数值。在其他实施方式中,该筛选模块22还可以从每个量化数据块中选取与第i个声波信号频率相邻频率的量化数据块;其中,相邻频率被预先定义为与声波信号频率不同,且差异值最小的频率值。
该离散余弦逆变换处理模块23用于对每个能量数据
Figure BDA0002517028650000144
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000145
其中,z为时序的序号,z=1、2、 3、……。
具体地,该离散余弦逆变换处理模块23利用公式(1)对每个能量数据
Figure BDA0002517028650000146
进行离散余弦逆变换处理,以获得幅值数据
Figure BDA0002517028650000147
Figure BDA0002517028650000148
其中,T=18,t=0、1、2、……T-1,z=T(x-1)+t+1,Fy为所述音频量化压缩数据流所预定义的能量数据
Figure BDA0002517028650000149
的编码常量。
该解码模块24用于对所述幅值数据
Figure BDA00025170286500001410
进行声波信号解码,以获得对应的声波数据。
请同时参阅图4,该解码模块24具体包括:
单元解码子模块241,用于从幅值数据
Figure BDA00025170286500001411
中选取连续m个时序的幅值数据
Figure BDA00025170286500001412
进行单元解码,以得到与所述m个时序对应的单元数据d1、 d2、d3、……dm。其中,i≥0,i为连续m个时序中的第i个时序在
Figure BDA00025170286500001413
中的绝对序号;j为连续m个时序的相对序号,j=1、2、3、……m。
在本实施方式中,该单元解码子模块241根据幅值数据
Figure BDA0002517028650000151
通过对比各时序中幅值
Figure BDA0002517028650000152
Figure BDA0002517028650000153
的大小,以确定位元数据bk的数值,并将确定的位元数据b1、b3、b5、……、bk、……、bn-1组成二进制数,以获得对应的单元数据dj的数值。其中,k为一个单元信号所包含的n个位元信号的序号,k=1、3、5、……n-1。
在本实施方式中,该单元解码子模块241通过对比同一时序的两个相邻频率的幅值数据的大小,并根据较大的幅值数据的信号频率,以确定对应的位元数据的数值。
在另一实施方式中,该单元解码子模块241根据幅值数据
Figure BDA0002517028650000154
选取各时序中幅值最大的k个频率组成频率集合,通过比对该频率集合在预设的l个k元频率集合组成的序列中,以零起始的位序号,以确定对应的单元数据dj的数值。其中,0≤dj≤l,k、l均为预设自然数。
合成解码子模块242,用于对该单元数据d1、d2、d3、……dm进行合成解码,以得到声波数据。
具体地,该合成解码子模块242根据声波编码算法,由d1、d2、d3、…… dm所组成的多进制数据,即为声波数据。
本发明实施方式提供的一种声波信号解码的方法及装置,通过声波信号的信号频率确定与其相关的音频压缩数据流的能量数据,并针对选取的能量数据进行量化还原处理以得到局部量化还原的声波能量数据块,以及通过对该声波能量数据库进行离散余弦逆变换处理,从而省略了量化还原之后所进行的重新排序、消除混叠、加窗合成滤波、相位修正以及多相合成滤波这些运算过程,从而减少运算量;进一步地,经过离散余弦逆变换处理得到的能量数据可以直接进行声波解码,从而省去声波解码通常都会用到的傅里叶运算;从而减少原有声波信号解码过程中的运算步骤和运算量,提升解释型语音对声波解码的速度。
在本发明所提供的实施方式中,所揭露的系统、终端和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例是示意性的,所述单元的划分,为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器 (Read-Only Memory,ROM)、随机存取存储器 (Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本发明的说明书及其附图中给出了本发明的较佳的实施方式,但是,本发明可以通过许多不同的形式来实现,并不限于本说明书所描述的实施方式,这些实施方式不作为对本发明内容的额外限制,提供这些实施方式的目的是使对本发明的公开内容的理解更加透彻全面。并且,上述各技术特征继续相互组合,形成未在上面列举的各种实施方式,均视为本发明说明书记载的范围;进一步地,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种声波信号解码方法,其特征在于,所述方法包括:
对待解码的音频量化压缩数据流进行实时解压缩处理,以生成一个或多个连续的量化数据块Zx;其中,x为数据块的序号,x=1、2、3、……;原始音频信号通过量化处理和压缩处理以生成所述音频量化压缩数据流,所述原始音频信号预先叠加一个或多个声波信号,每个所述声波信号由m个单元信号分别在连续的m个时序上拼接组成,每个所述单元信号由n个位元信号在同一个时序上叠加组成,m、n均为预设的自然数;
从每个所述量化数据块Zx中分别选取与所述n个位元信号频率对应相同频率或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure FDA0002517028640000012
并对每个所述量化数据
Figure FDA0002517028640000013
进行量化还原,以获得对应的能量数据
Figure FDA0002517028640000014
其中,y为位元信号的标识号,且,y=1、2、3、……n;
对每个所述能量数据
Figure FDA0002517028640000015
进行离散余弦逆变换处理,以获得幅值数据
Figure FDA0002517028640000016
其中,z为时序的序号,z=1、2、3、……;
对所述幅值数据
Figure FDA0002517028640000017
进行声波信号解码,以获得对应的声波数据。
2.根据权利要求1所述的声波信号解码方法,其特征在于,所述对每个所述能量数据
Figure FDA0002517028640000018
进行离散余弦逆变换处理,以获得幅值数据
Figure FDA0002517028640000019
具体包括:
利用公式(1)对每个所述能量数据
Figure FDA00025170286400000110
进行离散余弦逆变换处理,以获得幅值数据
Figure FDA00025170286400000111
Figure FDA0002517028640000011
其中,T=18,t=0、1、2、……T-1,z=T(x-1)+t+1,Fy为所述音频量化压缩数据流所预定义的能量数据
Figure FDA00025170286400000112
的编码常量。
3.根据权利要求1所述的声波信号解码方法,其特征在于,所述对所述幅值数据
Figure FDA00025170286400000113
进行声波信号解码,以获得对应的声波数据,具体包括:
从幅值数据
Figure FDA0002517028640000021
中选取连续m个时序的幅值数据
Figure FDA0002517028640000022
进行单元解码,以获得与所述m个时序对应的单元数据d1、d2、d3、……dm;其中,i≥0,i为连续m个时序中的第i个时序在
Figure FDA0002517028640000023
中的绝对序号;j为连续m个时序中的相对序号,j=1、2、3、……m;
对所述单元数据d1、d2、d3、……dm进行合成解码,以获得声波数据。
4.根据权利要求3所述的声波信号解码方法,其特征在于,所述从幅值数据
Figure FDA0002517028640000024
中选取连续m个时序的幅值数据
Figure FDA0002517028640000025
进行单元解码,具体包括:
根据所述幅值数据
Figure FDA0002517028640000026
通过对比各时序中幅值
Figure FDA0002517028640000027
Figure FDA0002517028640000028
的大小,以确定位元数据bk的数值,并将确定的位元数据b1、b3、b5、……、bk、……、bn-1组成二进制数,以获得对应的单元数据dj的数值;其中,k为一个单元信号所包含的n个位元信号的序号,k=1、3、5、……、n-1。
5.根据权利要求3所述的声波信号解码方法,其特征在于,所述从幅值数据
Figure FDA0002517028640000029
中选取连续m个时序的幅值数据
Figure FDA00025170286400000210
进行单元解码,具体包括:
根据所述幅值数据
Figure FDA00025170286400000211
选取各时序中幅值最大的k个频率组成频率集合,通过比对所述频率集合在预设的l个k元频率集合组成的序列中零起始的位序号,以确定对应的单元数据dj的数值;其中,0≤dj≤l,k、l均为预设自然数。
6.一种声波信号解码装置,其特征在于,所述装置包括:
解压缩处理模块,用于对待解码的音频量化压缩数据流进行实时解压缩处理,以生成一个或多个连续的量化数据块Zx;其中,x为数据块的序号,x=1、2、3、……;原始音频信号通过量化处理和压缩处理以生成所述音频量化压缩数据流,所述原始音频信号预先叠加一个或多个声波信号,每个所述声波信号由m个单元信号分别在连续的m个时序上拼接组成,每个所述单元信号由n个位元信号在同一个时序上叠加组成,m、n均为预设的自然数;
筛选模块,用于从每个所述量化数据块Zx中分别选取与所述n个位元信号频率对应相同频率或最近似频率的n个量化数值,将获得的n*x个所述量化数值组成量化数据
Figure FDA0002517028640000032
并对每个所述量化数据
Figure FDA0002517028640000033
进行量化还原,以获得对应的能量数据
Figure FDA0002517028640000034
其中,y为位元信号的标识号,且,y=1、2、3、……n;
离散余弦逆变换处理模块,用于对每个所述能量数据
Figure FDA0002517028640000035
进行离散余弦逆变换处理,以获得幅值数据
Figure FDA0002517028640000036
其中,z为时序的序号,z=1、2、3、……;以及
解码模块,用于对所述幅值数据
Figure FDA0002517028640000037
进行声波信号解码,以获得对应的声波数据。
7.根据权利要求6所述的声波信号解码装置,其特征在于,所述离散余弦逆变换处理模块用于利用公式(1)对每个所述能量数据
Figure FDA0002517028640000038
进行离散余弦逆变换处理,以获得幅值数据
Figure FDA0002517028640000039
Figure FDA0002517028640000031
其中,T=18,t=0、1、2、……T-1,z=T(x-1)+t+1,Fy为所述音频量化压缩数据流所预定义的能量数据
Figure FDA00025170286400000310
的编码常量。
8.根据权利要求7所述的声波信号解码装置,其特征在于,所述解码模块体包括:
单元解码子模块,用于从所述幅值数据
Figure FDA00025170286400000311
中选取连续m个时序的幅值数据
Figure FDA00025170286400000312
进行单元解码,以获得与所述m个时序对应的单元数据d1、d2、d3、……dm;其中,i≥0,i为连续m个时序中的第i个时序在
Figure FDA00025170286400000313
中的绝对序号;j为连续m个时序的相对序号,j=1、2、3、……m;
合成解码子模块,用于对所述单元数据d1、d2、d3、……dm进行合成解码,以获得声波数据。
9.根据权利要求8所述的声波信号解码装置,其特征在于,所述单元解码子模块用于根据所述幅值数据
Figure FDA00025170286400000314
通过对比各时序中幅值
Figure FDA00025170286400000315
Figure FDA00025170286400000316
的大小,以确定位元数据bk的数值,并将确定的位元数据b1、b3、b5、……、bk、……、bn-1组成二进制数,以获得对应的单元数据dj的数值;其中,k为一个单元信号所包含的n个位元信号的序号,k=1、3、5、……n-1。
10.根据权利要求8所述的声波信号解码装置,其特征在于,所述单元解码子模块用于根据所述幅值数据
Figure FDA0002517028640000041
选取各时序中幅值最大的k个频率组成频率集合,通过比对所述频率集合在预设的l个k元频率集合组成的序列中零起始的位序号,以确定对应的单元数据dj的数值;其中,0≤dj≤l,k、l均为预设自然数。
CN202010480109.5A 2020-05-30 2020-05-30 一种声波信息的解码方法及装置 Pending CN111816196A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010480109.5A CN111816196A (zh) 2020-05-30 2020-05-30 一种声波信息的解码方法及装置
PCT/CN2021/096642 WO2021249205A1 (zh) 2020-05-30 2021-05-28 一种声波信号解码的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010480109.5A CN111816196A (zh) 2020-05-30 2020-05-30 一种声波信息的解码方法及装置

Publications (1)

Publication Number Publication Date
CN111816196A true CN111816196A (zh) 2020-10-23

Family

ID=72848436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010480109.5A Pending CN111816196A (zh) 2020-05-30 2020-05-30 一种声波信息的解码方法及装置

Country Status (2)

Country Link
CN (1) CN111816196A (zh)
WO (1) WO2021249205A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021249205A1 (zh) * 2020-05-30 2021-12-16 北京声连网信息科技有限公司 一种声波信号解码的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5319735A (en) * 1991-12-17 1994-06-07 Bolt Beranek And Newman Inc. Embedded signalling
US5687191A (en) * 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US9620133B2 (en) * 2013-12-04 2017-04-11 Vixs Systems Inc. Watermark insertion in frequency domain for audio encoding/decoding/transcoding
CN108964786B (zh) * 2018-06-13 2020-10-02 厦门声连网信息科技有限公司 一种声波信号编码、解码的方法及装置
CN110011760B (zh) * 2019-04-10 2020-07-24 中山大学 一种基于声波的全双工多载波近场通信方法
CN111816196A (zh) * 2020-05-30 2020-10-23 北京声连网信息科技有限公司 一种声波信息的解码方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021249205A1 (zh) * 2020-05-30 2021-12-16 北京声连网信息科技有限公司 一种声波信号解码的方法及装置

Also Published As

Publication number Publication date
WO2021249205A1 (zh) 2021-12-16

Similar Documents

Publication Publication Date Title
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
CA2853987C (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
CN100578621C (zh) 信号处理设备和方法
US5832443A (en) Method and apparatus for adaptive audio compression and decompression
JP4272897B2 (ja) 符号化装置、復号化装置およびその方法
WO2007088853A1 (ja) 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
WO1995021490A1 (fr) Procede et dispositif de codage de l'information et procede et dispositif de decodage de l'information
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JPWO2009125588A1 (ja) 符号化装置および符号化方法
CN111816196A (zh) 一种声波信息的解码方法及装置
KR20060036724A (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
WO1999017279A1 (en) A method of encoding a speech signal
WO2021244409A1 (zh) 一种声波信号解码的方法及装置
JPH09127985A (ja) 信号符号化方法及び装置
JPH09127987A (ja) 信号符号化方法及び装置
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JP5491193B2 (ja) 音声コード化の方法および装置
CN110291583B (zh) 用于音频编解码器中的长期预测的系统和方法
US20170206905A1 (en) Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model
JPH09127998A (ja) 信号量子化方法及び信号符号化装置
JP3384523B2 (ja) 音響信号処理方法
AU2011205144B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
EP2355094B1 (en) Sub-band processing complexity reduction
Gunjal et al. Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination