CN1926606A - 基于模板匹配和多分辨率分析的编/解码方法 - Google Patents
基于模板匹配和多分辨率分析的编/解码方法 Download PDFInfo
- Publication number
- CN1926606A CN1926606A CNA2004800422807A CN200480042280A CN1926606A CN 1926606 A CN1926606 A CN 1926606A CN A2004800422807 A CNA2004800422807 A CN A2004800422807A CN 200480042280 A CN200480042280 A CN 200480042280A CN 1926606 A CN1926606 A CN 1926606A
- Authority
- CN
- China
- Prior art keywords
- template matches
- frequency
- time point
- analysis
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Abstract
一种基于模板匹配和多分辨率分析的编/解码方法,对输入的音频信号按照信号特性分为缓变信号和快变信号,如果所述的音频信号是快变信号,则确定多分辨分析的时间-频率分辨率,并根据该时间-频率分辨率选择需进行模板匹配的时间点及频率范围,对所选择的时间点上沿频率方向的系数,进行线性预测并判断是否需要进行多分辨率分析模板匹配,进行多分辨率模板匹配、残差编码,并将边信息写入到比特流中后输出压缩比特流。本发明利用模板匹配的方法,对这些能量聚集方向的系数,获得表示对应模板的参数进行量化编码,而残差可以进一步进行感知量化编码;对快变类信号,可以获得较高的编码增益,而且对克服预回声现象非常有效。
Description
基于模板匹配和多分辨率分析的编 /解码方法 技术领域
本发明涉及一种音频帧编解码的方法, 特别是一种基于模板匹配
(templete matching) , 消除预回声现象, 提高编解码效率的多分辨率分析 编码方法, 属于音视频编码技术领域。
背景技术
在音频信号的感知编 /解码器中, 根据测不准原理, 由谱信号分解做量 化和编码所引起的量化误差, 经合成滤波器重构后会在时域中扩散。 对常用 的滤波器设计, 如 1024点的余弦调制滤波, 这会引起量化误差在时域传播, 如果在分析窗内信号较强的能量主要只集中在很小一部分,量化噪声就会扩 散到信号出现前; 极端情况下, 在某些时间段, 它甚至会高于原始的信号能 量级, 产生 "预回声,, 现象。
根据人耳特性, 如果编码噪声出现在信号开始前较短时间, 预回声会被 后向掩蔽效应掩蔽, 人耳感知不到, 否则, 编码噪声会被人耳察觉, 产生预 回声现象。预回声现象是在较低码率下对快变类信号编码所面临的主要困难 之一。 为了克服量化引入的人为噪声因素, 设计编码器时就要考虑量化噪声 的时域特性, 保证满足时域掩蔽条件。 因此, 音频信号的透明编码, 既要求 满足频域掩蔽条件、 又要求满足时域掩蔽条件, 但在实际的实现中, 这个要 求对感知编码器来说并不容易实现。
目前, 在音频编码中处理预回声的技术大致可以分为如下几种技术:
1、 比特池技术: 对滤波器组覆盖快变段窗内的谱系数, 增加编码精度。 运动图象专家组(Mot ion Picture Experts Group, 简称 MPEG)的 MPEG-1标 准所采用的就是比特池方法。该方法的缺点是:如果遇到变化非常快的信号, 编码时所需的比特池的大小会大得不合理。
2、 长短块切换技术: 根据输入信号的特性, 自适应的调整滤波器组窗 的大小; 对稳态部分或緩变部分采用长时窗, 而对快变信号部分则采用短时
窗进行编码。 窗切换的方法显著地增加了编码器结构的复杂度。 此外, 在采 用交叠相加结构滤波器组时, 窗切换判断需要编码器额外的緩冲和延迟, 这 会导致更大的端对端的延迟。 最后, 虽然长窗和短窗具有较好的时频局部特 性, 但是, 在开始窗和结束窗中却会引入较大的低效编码。
3、 增益自适应技术: 将输入信号的动态范围通过一个乘积性预处理器 进行降低, 然后再输入到编码器进行编码, 这使得信号的 "峰值" 在编码前 得到消弱。 为了能对大多数信号都能有效地处理, 非常重要的是: 要让增益 修正过程能独立地应用于音频信号谱的不同部分; 这是因为: 快变信号时间 一般只在部分谱上占主导, 而且, 通常并不希望扩宽滤波器组的低通滤波通 道的频率响应, 因为这样会增大临界带宽的不匹配性。
4、 时域噪声形状控制技术(Time- doma in Noi se Shaping, 简称 TNS ) : 在频域上对滤波器系数进行线性预测分析,然后依据该分析来控制噪声在时 域上的形状。 但是, 由于 TNS以固定的分辨率, 通过开环线性预测的方法来 控制预回声, 并且, 预测器参数通过反射系数直接量化编码, 因此, 精度和 效率都难以达到较优。 为了处理预回声现象,需要对信号的谱结构和特性进行分析。实验证明, 突变帧的^ ί氐频成分对预回声的产生影响小,而中高频成分则是预回声产生的 主要原因。 因此, 可以将低频成分和中高频成分在不同的时间分辨率下进行 滤波处理。
根据测不准原理, 较高的时间分辨率必然对应较低的频率分辨率。 同时 考虑到人耳的临界子带划分的非线性,多分辨率的滤波结构将有助于提高音 频信号的编码效率, 特别是突变帧的编码。 这就是多分辨率分析技术主要思 想。
参见图 1、 2、 3, 在多分辨率分析划分的时间-频率平面上, 如果对滤 波器的结构进行相应地设计, 就可以使信号能量呈现不同的聚集特性。 大致
可以做三种筒单的划分:
1、 沿频率方向聚集: 对某些信号, 其能量会主要聚集在某些时间点或 时间段内, 而在远离该时间点的区域里则只有少量的能量。 从时间-频率平 面上看, 在这些时间点或时间段上, 当频率从小到大变化时, 信号能量大致 均句的分布在不同的频率成分上, 因此, 称这种分布为沿频率方向的聚集。 典型的信号如冲击信号, 其信号能量主要集中在冲击发生的时刻点, 而在在 时间-频率平面上,此时间点对应的频率成分在各个频段上都有。
2、 沿时间方向聚集: 对某些信号, 其能量会主要聚集在某些频段内, 而在远离该频带点的区域里则只有少量的能量。 从时间-频率平面上看, 在 这些频带上, 当时间变化时, 信号能量大致均匀的分布在各个时间段上, 因 此, 称这种分布为沿时间方向的聚集。 典型信号有纯正弦信号,信号能量主 要集中在对应正弦频率的频率点,而在时间-频率平面上,该频率点在所有的 时间点上都有较强的能量。
3、 时频区域聚集: 在时间-频率平面的某些区域, 该区域的信号能量明 显高于它周围的其他区域, 但它并没有明显的时间方向或频率方向特性, 称 这种方式为区域聚集方式。 一般的, 时域噪声信号这种现象比较明显。
从上述的分布特性可知: 对产生容易产生预回声现象的快变信号, 如果 在保证编码效率的同时能够提高它的时间分辨率,那么就能有效地控制时域 的掩蔽效应, 使得噪声能量扩散范围控制在掩蔽时效之内。 发明内容
本发明的主要目的在于提供一种基于模板匹配和多分辨率分析的编 /解 码方法,对于快变信号,可以获得较高的编码增益,有效地克服预回声现象, 减少编解码对于存储资源的需求, 提高对音频帧的编码效率。
本发明的另一目的在于提供一种基于模板匹配和多分辨率分析的编 /解 码方法, 以可变的分辨率, 在频域上对滤波器系数进行线性预测分析, 使编
解码的精度和效率达到较优。
本发明的又一目的在于提供一种基于模板匹配和多分辨率分析的编 /解 码方法, 使增益修正过程能独立地应用于音频信号谱的不同部分, 从而最大 限度地降低在编码过程中所造成的临界带宽的不匹配性现象。
本发明的目的是这样实现的:
对输入的音频信号按照信号特性分为緩变信号和快变信号,如果所述的 音频信号是快变信号, 则确定多分辨分析的时间-频率分辨率, 并根据该时 间 -频率分辨率选择需进行模板匹配的时间点及频率范围, 对所选择的时间 点上沿频率方向的系数,进行线性预测并判断是否需要进行多分辨率分析模 板匹配, 进行多分辨率模板匹配、 残差编码, 并将边信息写入到比特流中后 输出压缩比特流。
由上述的技术方案可知, 本发明具有如下优点:
1、通过模板的应用, 大大地降低了快变信号在编码时所需的存储空间, 使得编码的效率和码流的大小得以有效的控制。
2、 本发明采用矢量量化建立模板的码本, 使增益修正过程能独立地应 用于音频信号谱的不同部分,从而最大限度地降低了在编码过程中所造成的 临界带宽的不匹配性现象。
3、 本发明以非固定的分辨率, 在频域上对滤波器系数进行线性预测分 析, 使得编解码的精度和效率都达到了较优。
附图说明
图 1为多分辨率分析后能量沿时间方向聚集的示意图;
图 2为多分辨率分析后能量沿频率方向聚集的示意图;
图 3为多分辨率分析后能量区域式聚集的示意图;
图 4 基于多分辨率分析模板匹配编码技术的音频编码器结构示意图; 图 5 基于多分辨率分析模板匹配编码技术的音频解码器结构示意图; 图 6为本发明多分辨模板匹配的流程图;
图 7为本发明模板匹配过程流程图;
图 8为本发明一个具体的时间点选择的流程图;
图 9为本发明码本训练过程流程图;
图 10为本发明编码器端多分辨率模板匹配的一个实施例流程图; 图 11为图 1 0中模板匹配的一个实施例流程图;
图 12 为本发明解码器中多分辨率模板匹配的一个实施例流程图。
具体实施方式
以下结合附图和具体的实施例对本发明作进一步的详细说明:
参见图 1、 2、 3, 在快变信号多分辨率分析时间-频率平面上, 在某些 时间点上, 沿频率方向的能量聚集现象比较明显。 这种能量聚集的结果, 使 得沿着这些时间点的各频率分量, 在时频平面上呈緩变的特性。 在编码时, 如果在量化过程中对这些緩变的成分用较高的量化精度来量化,则会使这种 沿频率方向能量聚集的时频精细结构在解码端得到的时间-频率平面上能够 更精确地保留下来。 在可调的时间分辨率之下, 单独对较高能量的时间点按 频率方式编码, 使得不同时间点上的编码噪声尽量不相关, 就能减少噪声能 量在时间方向的扩散, 表现在时域上, 就是使得噪声的形状和信号时域的形 状相关。 因此, 在多分辨率的时间-频率平面上, 按频率方向的量化编码, 具有有效消除和抑制预回声现象的特性。 这是本发明的基本思想。
为了提高时间-频率平面上频率方向的分量的编码效率, 采用基于模板 匹配思想, 建立频率方向系数的多个 "模板" , 每个模板用来对应一个频率 系数序列的一种结构, 在编码时, 从已有的模板库中挑选最恰当的模板进行 匹配, 使得用该模板表示当前频率方向的系数所获得编码增益最大。 经所述 的模板匹配后, 时间 -频率平面上该频率方向的分量, 则用编码误差所代替, 然后, 进一步执行常规的量化 /编码操作。
图 4为基于多分辨率分析模板匹配编码技术的音频编码器结构示意图, 输入音频编码器的音频信号首先进行多分辨率时频分析,然后进行时频平面
模板匹配编码, 使得用该模板表示当前频率方向的系数所获得编码增益最 大, 而后执行常规的量化 /熵编码操作, 从音频编码器输出编码码流。
采用上述方法进行的编码, 对应地, 采用的相应的逆过程实施解码, 图
5 则具体地揭示了这种解码器的结构。 输入解码器的码流首先进行熵解码 / 解量化, 然后进行时频平面模板解码, 再进行逆多分辨率分析时频映射, 这 样重构出音频信号。
参见图 6 , 为本发明多分辨模板匹配的流程, 首先判断信号类型, 然后 根据不同的信号类型调整时频分辨率, 之后进行进频多分辨分析, 然后在频 率方向上模板匹配。 具体的说, 在多分辨率时频分析模板匹配过程中, 在多 分辨分析之前, 需要根据当前信号类型确定时间-频率适当的分辨率。 对于 快变信号, 为了获得较高的编码增益, 需要较高的时间分辨率。 具体而言, 就是使得多分辨率时间-频率平面的时间分辨率小于或等于人耳后向掩蔽时 效(约 2-3毫秒)。有关时域掩蔽分析的内容请参见中国专利申请 01134556. X 以及中国专利 ZL 01144568. 80 在此基础上, 经多分辨时频分析对时频平面 的重新划分之后, 在对应信号快变时间点上, 沿频率方向的能量会比原来更 聚集, 其统计特性具有緩变性质。 用模板匹配的方法, 只要选取的模板足够 多, 就可以保证较高的量化精度, 也可以获得较高的增益。
考虑到时频测不准原理的限制, 在调整时频分辨率时, 在尽可能地满足 时间分辨率的前提下, 考虑到模板匹配所需的频率成分不能太少, 需要在时 频之间取得均衡。
假设: 一个时频平面上的总系数为 N, 可以将时频平面划分为 N=FxT, 其中: F为频率方向分辨率, T为时间方向分辨率。 模板匹配法就是在时频 平面上对于确定的时间点, 对与其相应的 F个系数进行统一处理。
如果 T=l , 则 F=N, 那么模板匹配就退化为在整个频域上滤波系数的处 理。 特别的, 如果不采用模板, 而直接用线性预测在频域进行预测, 并且对 预测结果进行直接编码5 那么, 它就退化为 TNS技术; 如果对预测的结果即
滤波器的系数进行矢量量化, 称之为频域线性预测分析矢量量化技术
( Frequency-doma in Linear Predict Vector Quant izat ion, 筒称 FLPVQ ) 参见图 7 , 为一个模板匹配的流程, 图 8为图 7—个具体的时间点选择 的流程, 具体的过程如下:
首先, 确定时频平面上需进行模板匹配的时间点及其数量。 可以根据能 量、 方差等准则确定进行模板匹配的时间点。 本实施例为采用能量选择的方 法。 确定方法是: 计算每个时间点上, 沿频率方向所有系数的总能量, 然后 按能量大小对全部时间点上的能量排序, 最后选择其中的前多个时间点, 使 得这些时间点的能量之和占总能量的 15%到 100%范围。
采用方差的选择方法是: 计算每个时间点对应频率系数的方差, 由于快 变信号在能量集中的时间点上, 其沿频率方向的系数具有緩变特性, 按照方 差从小到大的顺序排列多个时间子窗, 选择前面若干个子窗作为选定时间 点,或者选择方差平均幅度比小于设定阈值的那些时间点作为模板匹配的时 间点。
上述的第一个方案具体地是:按照方差从小到大的顺序排列 T个时间子 窗, 选择前面 τι=<τ个子窗作为选定时间点。 第二个方案则是: 先计算方差 的平均幅度, 再将各时间点上的方差值与该平均幅度相比, 其比值小于一设 定阈值(例如:可选择小于 1的那些点作为设定的阈值)的那些时间点作为模 板匹配的时间点。
其次, 根据 T、 F确定模板匹配时的频率范围, 由于低频成分对预回声 的影响小于中高频成分, 可以把模板匹配的范围限定在中高频成分, 根据时 频平面不同的划分, 在 T*F=N (其中 Τ为时间子窗个数, F为每个时间子窗 内的频率系数个数)的约束条件下, 最小频率从某个设定的低频(包括 0频 率) 开始,最大频率不超过一设定的最高频率, 可以得到对应的频率范围。 匹配过程中, 依次对所选定的时间点上频率方向的系数处理, 即在当前频率 方向上进行系数匹配, 然后从时频平面上减去匹配的模板。
对于模板的选择, 则依照如下的技术方案实现:
选定时间 -频率平面上的时间点后, 用模板匹配方法, 对各时间点上沿 频率方向的系数处理。由于时频平面的划分为 TxF (其中 T为时间子窗个数, F为每个时间子窗内的频率系数个数) , 并可以随信号类型的变化而变化, 所以, 不同的划分结果会导致沿频率方向系数的数量也变化。 处理的一种办 法是设计多个不同长度的模板, 这会导致空间浪费; 较好的做法是设计长度 固定的模板, 这种长度固定的模板可以通过大量训练样本简单获得。
在运用模板进行匹配时, 采用动态规划方式,做动态时间弯折(Dynamic Time Warp , 简称 DTW)处理, 可以对齐不同长度的序列, 计算得到两个不同 序列之间的 "距离" 。 这种模板的选择, 直接基于时间 -频率平面上的系数 进行, 与系数的直接矢量量化有一定相似性。
实际上, 模板的选择可以通过进一步变换时频系数进行。在不考虑频率 方向系数具体含义的情况下, 总可以把这些系数看作为一个数值的序列, 再 根据该序列的特点用合适的模型来表达, 如果模型选择的恰当, 那么用模型 参数作为模板, 就可以获得高效的编码效果。 这种模型的选择不是唯一的, 可以有各种不同的形式。 考虑到快变信号频率方向上系数分布的緩变特点, 作为本发明一个具体的实施例采用全极点模型作为模板的实现过程。
其中: H (z)为全极点的线性预测信号模型, G为预测增益, a i为预测器 的系数, p为预测器阶数。
由信号分析理论可知, 该模型对应的预测误差滤波器为:
^( ) = 1 + ^α,2-' ( 2 ) 因此, 多分辨分析的时频平面上某个时间点上频率方向的系数序列可以 用式(1)来表示其 "模板 " , 采用公式(2)则可以作为误差预测器对该序列滤
波。 用信号模型的预测器参数加上预测残差就可以恢复原序列。 在这里, 预 测器参数就构成了信号的模板。 这些模板可以通过预先的训练得到, 形成一 个模板库。 在实现时, 通过对滤波器系数构成的矢量进行矢量量化, 存储为 相应的码本, 在编码器和解码器端都同时保存一组相同的码本。 编码端根据 编码增益选择不同的模板来匹配当前时间点上的频率序列,解码端则根据矢 量量化后的索引来挑选码字, 再根据公式 (1 ) , 通过残差序列的滤波, 重 构对应的频率系数序列。
参见图 9,为本发明码本训练过程流程,采用矢量量化建立模板的码本, 需要量化的是模型的系数。 由线谱对(Line Spectral Pai r , LSP)分析可知, 上述的参数 a;的等价参数线语对(Line Spectral frequency, LSF)有较好的 量化性能, 能保证滤波器的稳定, 因此, 采用线谱对的量化代替模型参数的 直接量化。 矢量量化的过程如下:
首先, 对音频数据进行预处理和分帧, 之后进行多分辨率分析, 得到时 间-频率平面上的系数值, 确定有效的时间点, 训练过程只选取这些时间点 对应的频率方向的系数作为训练序列。用线性预测分析技术得到每个序列的 模型参数 ai和预测增益 G, 如果增益值小于预先确定的一个预定的阈值, 则 放弃该序列, 否则继续将预测系数转换为线谱频率系数, 运用码本训练的广 义 Llyod ( General ized Lloyd Algor i thm, 筒称 GLA ) 算法, 得到相应的码 本。 最后对码本进行优化以改进其性能, 即对训练后所获得的码本中只包含 少数训练矢量的码字, 进行合并或删除。 具体而言就是: 对训练后所获得的 码本中只包含少数训练矢量的码字, 根据码本的大小 (典型的码本大小为 32、 64、 128、 256……等 2的冪次方) , 对训练矢量进行合并和 /或删除。
为了在码本尺寸和性能之间取得均衡, 可以采用多码本、 分级量化的策 略,即:第一级量化的残差作为第二级码本训练的输入序列训练第二级码本, 第二级量化的残差作为第三级码本训练的输入序列训练第三级码本,依此类 推。 各级码本一起构成一个分级量化的多码本矢量量化器的码本。
参见图 10、 11 , 其为本发明编码器端的一个实施例。 首先对信号的类 型做出判断, 根据不同的信号类型, 设定多分辨率分析的时间-频率分辨率, 进行多分辨分析。 在新的时间-频率平面上, 确定有效的时间点, 对有效时 间点上沿频率方向的系数,进行线性预测并判断是否需要进行多分辨率分析 模板匹配, 如果需要, 则将预测器参数转换为线谱频率参数后, 搜索码本选 择距离最近的码字,作为最匹配模板序号来编码。其中,所述的边信息包括: 多分辨分析模板匹配打开标记、 时间点信息、 多码本索引。 当多级码本的索 引都确定之后, 编码端用已得到的信息重构各时间点上频率方向系数, 与原 始数据的差构成残差, 作为进一步编码的数据由后级模块处理。
参见图 12 , 其为本发明解码器端多分辨模板匹配的一个实施例。 解码 器从码流中解复用得到相应的边信息后, 对当前帧解码时, 判断模板匹配的 标记位是否设置, 如果设置, 就表示当前帧含有模板匹配的边信息, 进一步 从码流中解出每个时间点的信息, 主要是多码本结构的多级量化索引, 根据 这些索引, 从码本中重构出相应的预测器参数, 把它们从 LSF参数转化为预 测参数, 然后对当前时间点对应的残差序列滤波, 就可以重构出模板匹配前 的多分辨时频分析前的时频平面上的系数, 重复上述过程, 一直到所有的时 间点都重构完成, 最后的结果继续送逆多分辨分析过程进一步处理。 这里所 述的逆多分辨分析过程与上述的多分辨分析过程相对应, 但并不仅限于此, 与此相关的技术申请人已做了专利申请, 由于涉及的篇幅较多, 在此不再赘 述。 也可以采用业界已公知的各种方法进行这一处理。
最后应说明的是: 以上实施例仅用以说明本发明而并非限制本发明所描 述的技术方案; 因此, 尽管本说明书参照上述的各个实施例对本发明已进行 了详细的说明, 但是, 本领域的普通技术人员应当理解, 仍然可以对本发明 进行修改或者等同替换; 而一切不脱离本发明的精神和范围的技术方案及其 改进, 其均应涵盖在本发明的权利要求范围当中。
Claims (8)
- 权利要求书1、 一种基于模板匹配和多分辨率分析的编码方法, 其特征在于: 对输 入音频信号的频谱结构和特性进行分析,将低频成分和中高频成分在不同的 时间分辨率下进行滤波处理; 具体包括:步骤 10: 对输入的音频信号进行分析, 若判断为緩变信号, 执行步骤15;步骤 11 : 如果所述的音频信号是快变信号, 则确定多分辨分析的时间- 频率分辨率, 使得多分辨率时间-频率平面的时间分辨率小于或等于人耳后 向掩蔽时效, 并选择需进行模板匹配的时间点及其数量;步骤 12 : 对所选择的时间点上沿频率方向的系数, 进行线性预测, 并 判断是否需要进行多分辨率分析模板匹配, 如果不需要, 则执行步骤 15 ; 步骤 13: 进行多分辨率模板匹配;步骤 14: 进行残差编码, 将边信息写入到比特流中;步骤 15 : 输出压缩比特流。
- 2、 根据权利要求 1所述的基于模板匹配和多分辨率分析的编码方法, 其特征在于: 步骤 11 中确定需进行模板匹配的时间点及其数量的具体步骤 是: 计算每个时间点上, 沿频率方向所有系数的总能量, 然后按能量大小对 全部时间点上的能量排序, 最后选择其中的前多个时间点, 使得这些时间点 的能量之和占总能量的 15%到 100%范围, 作为模板匹配的时间点。
- 3、 根据权利要求 1所述的基于模板匹配和多分辨率分析的编码方法, 其特征在于: 步骤 11中确定进行模板匹配时间点的具体方法是:计算每个时 间点对应频率系数的方差, 选择有较小方差的时间点作为模板匹配的时间 点。
- 4、 根据权利要求 1所述的基于模板匹配和多分辨率分析的编码方法, 其特征在于: 步骤 13中所述的多分辨率模板匹配具体包括:步骤 131 : 将预测器参数转换为线谱频率参数; 步骤 132: 搜索码本, 选择距离最近的码字, 作为最匹配模板序号来编 码;步骤 133: 进行边信息编码;步骤 134 : 用已得到的信息重构各时间点上频率方向系数, 与原始 数据的差构成残差, 作为后级进一步处理的编码数据。
- 5、 根据权利要求 1-4任一所述的基于模板匹配和多分辨率分析的编码 方法,其特征在于:所述的边信息至少包括: 多分辨分析模板匹配打开标记、 时间点信息、 多码本索引。
- 6、 根据权利要求 1所述的基于模板匹配和多分辨率分析的编码方法, 其特征在于: 所述的多分辨模板采用固定的长度, 具体通过如下的训练步骤 获得:步骤 A: 对用于训练的音频数据进行预处理和分帧;步骤 B: 进行多分辨率分析, 得到时间-频率平面上的系数值; 步骤 C: 确定需要模板匹配的时间点;步骤 D: 选取所述时间点所对应频率方向上的系数作为训练序列; 步骤 E: 通过线性预测分析得到每个序列的模型参数和预测增益值; 步骤 F: 如果增益值小于预先确定的一个阈值, 则放弃该序列, 执行步 骤 J;步骤 G: 将预测系数转换为线谱频率系数;步骤 H: 运用码本训练的广义 Lloyd算法, 得到相应的码本;步驟 J: 训练结束
- 7、 根据权利要求 6所述的基于模板匹配和多分辨率分析的编码方法, 其特征在于: 所述的步骤 H之后还进一步包括: 根据码本的大小对训练矢量 进行合并和 /或删除, 使得训练后所获得的码本中只包含少数训练矢量的码 字。该模型对应的预测误差滤波器为:A(z) = l + fj aiz-i=1其中: H (z)为一全极点线性预测信号模型: A (z)为 H (z)对应的预测误 差滤波器模型: G为预测增益, a;为预测器的系数, p为预测器的阶数。
- 9、 一种基于模板匹配和多分辨率分析的解码方法, 其特征在于: 对于 由权利要求 1-8所述的任一方法所获得的编码, 通过如下的步骤进行解码: 步骤 20: 从码流中解复用得到相应的边信息;步骤 21 : 判断当前帧的模板匹配标记位是否设置, 如果没有设置, 则 执行步骤 26;步骤 22 : 进一步从码流中解码出每个时间点的多码本结构的多级量化 的码字索引信息;步骤 23: 根据所述的索引信息, 从码本中重构并转化为相应的预测参 数;步骤 24: 然后对当前时间点对应的残差序列滤波, 重构出模板匹配前 的多分辨时频分析前的时频平面上的系数;步骤 25 : 如果所有的时间点尚未重构完成, 则执行步骤 22 ;步骤 26 : 进行逆多分辨分析过程进一步处理。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2004/000162 WO2005086137A1 (fr) | 2004-03-02 | 2004-03-02 | Procede de codage/decodage fonde sur la mise en correspondance de modeles et sur l'analyse multi-distinguabilite |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1926606A true CN1926606A (zh) | 2007-03-07 |
Family
ID=34916988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800422807A Pending CN1926606A (zh) | 2004-03-02 | 2004-03-02 | 基于模板匹配和多分辨率分析的编/解码方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN1926606A (zh) |
WO (1) | WO2005086137A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
CN101436406B (zh) * | 2008-12-22 | 2011-08-24 | 西安电子科技大学 | 音频编解码器 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111832571B (zh) * | 2020-07-09 | 2021-03-05 | 哈尔滨市科佳通用机电股份有限公司 | 一种货车制动梁支柱故障自动检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08179794A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | サブバンド符号化方法及び装置 |
JP3529648B2 (ja) * | 1998-12-24 | 2004-05-24 | 日本電信電話株式会社 | オーディオ信号符号化方法 |
JP2001077698A (ja) * | 1999-09-08 | 2001-03-23 | Matsushita Electric Ind Co Ltd | オーディオ符号化アプリケーションに対するブロックサイズ決定方法 |
CN1165036C (zh) * | 2001-11-02 | 2004-09-01 | 北京阜国数字技术有限公司 | 一种基于自适应阀值和典型样本预测的块长选择方法 |
-
2004
- 2004-03-02 WO PCT/CN2004/000162 patent/WO2005086137A1/zh active Application Filing
- 2004-03-02 CN CNA2004800422807A patent/CN1926606A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
CN101436406B (zh) * | 2008-12-22 | 2011-08-24 | 西安电子科技大学 | 音频编解码器 |
Also Published As
Publication number | Publication date |
---|---|
WO2005086137A1 (fr) | 2005-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7171355B1 (en) | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals | |
AU763471B2 (en) | A method and device for adaptive bandwidth pitch search in coding wideband signals | |
CN1244907C (zh) | 宽带语音编解码器中的高频增强层编码方法和装置 | |
AU714752B2 (en) | Speech coder | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
CN1735927B (zh) | 用于高质量语音编码转换的方法和装置 | |
CN102985969B (zh) | 编码装置、解码装置和编码方法、解码方法 | |
Vos et al. | Voice coding with Opus | |
CN103187065B (zh) | 音频数据的处理方法、装置和系统 | |
KR102132798B1 (ko) | 노이즈 신호 처리 및 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템 | |
CN103503062B (zh) | 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法 | |
CA2778240A1 (en) | Multi-mode audio codec and celp coding adapted therefore | |
EP2543036A1 (en) | Encoder for audio signal including generic audio and speech frames | |
WO2013066238A2 (en) | Generation of a high band extension of a bandwidth extended audio signal | |
JP2002055699A (ja) | 音声符号化装置および音声符号化方法 | |
JP2005241761A (ja) | 通信装置及び信号符号化/復号化方法 | |
CN1926606A (zh) | 基于模板匹配和多分辨率分析的编/解码方法 | |
JP3905706B2 (ja) | 音声符号化装置、音声処理装置及び音声処理方法 | |
CN101533639B (zh) | 语音信号处理方法及装置 | |
JPWO2008018464A1 (ja) | 音声符号化装置および音声符号化方法 | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
CN105122358A (zh) | 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法 | |
JP3232728B2 (ja) | 音声符号化方法 | |
WO2005045808A1 (en) | Harmonic noise weighting in digital speech coders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070307 |