CN110164457B - 音频信号处理装置、音频信号处理方法 - Google Patents
音频信号处理装置、音频信号处理方法 Download PDFInfo
- Publication number
- CN110164457B CN110164457B CN201910588571.4A CN201910588571A CN110164457B CN 110164457 B CN110164457 B CN 110164457B CN 201910588571 A CN201910588571 A CN 201910588571A CN 110164457 B CN110164457 B CN 110164457B
- Authority
- CN
- China
- Prior art keywords
- isf
- audio
- audio signal
- discontinuity
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 146
- 230000005236 sound signal Effects 0.000 title claims abstract description 116
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 239000003607 modifier Substances 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 82
- 238000004364 calculation method Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 34
- 230000005284 excitation Effects 0.000 claims description 30
- 230000003595 spectral effect Effects 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 17
- 230000000116 mitigating effect Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 description 44
- 239000013598 vector Substances 0.000 description 39
- 238000006243 chemical reaction Methods 0.000 description 30
- 238000010586 diagram Methods 0.000 description 24
- 230000003044 adaptive effect Effects 0.000 description 22
- 238000004458 analytical method Methods 0.000 description 22
- 238000013139 quantization Methods 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 15
- 238000013461 design Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006641 stabilisation Effects 0.000 description 4
- 238000011105 stabilization Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/0078—Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
- H04L1/0085—Formatting with cells
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereo-Broadcasting Methods (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Circuits Of Receivers In General (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
本发明提供音频信号处理装置、音频信号处理方法。音频信号处理装置具有:不连续估计器,其对在产生分组丢失后第一个正常接收到的音频分组,估计由于音频分组解码的结果所得到的解码音频的振幅急剧增大而产生的不连续性;以及不连续修正器,其修正解码音频的不连续性。
Description
本申请是申请号为201480041188.2的发明专利申请(国际申请号:PCT/JP2014/077215,申请日:2014年10月10日,发明名称:音频信号处理装置、音频信号处理方法及音频信号处理程序)的分案申请。
技术领域
本发明涉及对音频信号进行处理的音频信号处理装置、及音频信号处理方法。
背景技术
在如IP(Internet Protocol)电话那样将音频信号进行编码及分组化并在互联网中传输时,由于网络拥挤等原因,有时分组丢失(以下将该现象称为“分组丢失(packetloss)”)。在发生分组丢失时,由于必需的音频码丢失而不能进行音频解码,产生声音中断。作为防止因分组丢失而产生的声音中断的技术有音频分组丢失隐藏技术。音频分组丢失隐藏技术用于检测分组丢失,并生成与丢失的分组对应的准音频信号(以下称为“隐藏信号”)。
在作为音频编码方法采用更新编码器/解码器的内部状态的同时进行音频编码的方法的情况下,将不能得到本来应该接收的编码参数,因而音频分组丢失隐藏技术也利用模拟地生成的参数进行解码器的内部状态更新。
作为更新编码器/解码器的内部状态进行音频编码的方法,广泛采用CELP(CodeExcited Linear Prediction)编码。在CELP编码中,假定自回归模型,经由全极型合成滤波器a(i)对激励信号e(n)进行滤波,由此将音频信号合成。即,按照下式来合成音频信号s(n)。a(i)表示线性预测系数(LP(Linear Prediction)系数),作为次数采用P=16等值。
[数式1]
在CELP编码中,将对线性预测系数进行数学上的等效而表述的ISF(ImmittanceSpectral Frequency,导抗谱频率)参数、和过去的激励信号作为内部状态。在产生了分组丢失的情况下,模拟地生成这些参数和信号,因而与本来应该通过解码得到的参数之间产生偏差。由于参数的偏差而引起的合成声音的不匹配,被视听者认为是噪声,大大破坏了主观上的品质。
下面,以音频编码方法采用CELP编码的情况为例,对进行音频分组丢失隐藏的音频解码器的结构及动作进行说明。
音频解码器的结构图及动作如图1、图2所示。如图1所示,音频解码器1具有分组丢失检测部11、音频码解码部12、隐藏信号生成部13和内部状态缓存器14。
分组丢失检测部11在正常接收到音频分组的情况下,向音频码解码部12发送控制信号、及音频分组中包含的音频码(正常接收:在图2的步骤S100为“是”的情况)。然后,音频码解码部12按照后面所述进行音频码的解码及内部状态更新(图2的步骤S200、S400)。另一方面,在不能正常接收到音频分组的情况下,分组丢失检测部11向隐藏信号生成部13发送控制信号(分组丢失:在图2的步骤S100为“否”的情况)。然后,隐藏信号生成部13按照后面所述进行隐藏信号的生成及内部状态更新(图2的步骤S200、S400)。反复图2的步骤S100~S400的处理一直到通信结束为止(一直到在步骤S500判定为“是”为止)。
音频码至少包括被编码后的数式2所示的ISF参数,
[数式2]
被编码后的第一~第四子帧的基音滞后Tj p、第一~第四子帧的被编码后的自适应码本增益gj p、第一~第四子帧的被编码后的固定码本增益gj c、第一~第四子帧的被编码后的固定码本向量cj(n)。也可以使用数学上的等效的表述即LSF(Line spectralfrequency)参数来取代ISF参数。在下面的讨论中进行使用了ISF参数的说明,但该讨论对使用LSF参数的情况也成立。
在内部状态缓存器中包括数式3所示的过去的ISF参数
[数式3]
以及数式4所示的
[数式4]
的等效表述即ISP(Immittance Spectral Pair)参数
[数式5]
ISF残差参数
[数式6]
过去的基音滞后Tj p、过去的自适应码本增益gj p、过去的固定码本增益gj c、自适应码本u(n)。分别包含过去几个子帧的量的参数取决于设计方针。在本说明书中,假定1帧包括4个子帧,但也可以按照设计方针设为其它的值。
<正常接收的情况>
图3示出音频码解码部12的功能结构例。如该图3所示,音频码解码部12具有ISF解码部120、稳定性处理部121、LP系数计算部122、自适应码本计算部123、固定码本解码部124、增益解码部125、激励向量合成部126、主滤波器127、和合成滤波器128。但是,主滤波器127不是必须的构成要素。另外,在图3中,为了便于说明,在音频码解码部12内用双点划线示出了内部状态缓存器14,但该内部状态缓存器14也可以不包含在音频码解码部12的内部,而是图1所示的内部状态缓存器14。对于以后的音频码解码部的结构图也一样。
LP系数计算部122的结构图如图4所示,根据被编码后的ISF参数计算LP系数的处理流程如图5所示。如图4所示,LP系数计算部122具有ISP-ISP变换部122A、ISP插值部122B、和ISP-LPC变换部122C。
首先,说明与根据被编码后的ISF参数计算LP系数的处理(图5)相关联的功能结构及动作。
ISF解码部120对被编码后的ISF参数进行解码,求出数式7所示的ISF残差参数,
[数式7]
按照数式9计算数式8所示的ISF参数(图5的步骤S1)。其中,meani表示事前通过学习等求出的平均向量。
[数式8]
[数式9]
另外,在此对使用MA预测进行ISF参数的计算的示例进行了说明,但也可以是如下所述使用AR预测进行ISF参数的计算的结构。在此,紧前面的帧的ISF参数表示为数式10,将AR预测的加权系数设为ρi。
[数式10]
[数式11]
稳定性处理部121进行基于数式12的处理,以使ISF参数的各要素之间隔开50Hz以上的间隔,从而确保滤波器的稳定性(图5的步骤S2)。ISF参数是用线谱表述音频频谱包络的形状的参数,彼此的距离越近,频谱的峰值就越大并产生共振。因此,需要确保稳定性的处理,使得在频谱的峰值时的增益不会过大。其中,min_dist表示最小的ISF间隔,isf_min表示确保min_dist的间隔所需要的ISF的最小值。isf_min通过将相邻的ISF的值与min_dist的间隔相加而依次进行更新。另一方面,isf_max表示确保min_dist的间隔所需要的ISF的最大值。isf_max通过从相邻的ISF的值减去min_dist的间隔而依次进行更新。
[数式12]
LP系数计算部122内的ISF-ISP变换部122A按照数式15将数式13所示的项变换为数式14所示的ISP参数(图5的步骤S3)。其中,C表示事前设定的常数。
[数式13]
[数式14]
[数式15]
ISP插值部122B根据内部状态缓存器14中包含的数式16所示的过去的ISP参数和数式17所示的上述ISP参数,按照数式18计算每个子帧的ISP参数(图5的步骤S4)。在进行插值时也可以使用其它系数。
[数式16]
[数式17]
[数式18]
ISP-LPC变换部122C将每个子帧的ISP参数变换为数式19所示的LP系数(图5的步骤S5)。作为具体的变换步骤,能够使用非专利文献1记载的处理步骤。在此,将先行信号(先読み信号)中包含的子帧的数量设为4,但也可以按照设计方针变更子帧的数量。
[数式19]
下面,说明音频码解码部12的其它结构及动作。
自适应码本计算部123对被编码后的基音滞后(pitch lag)进行解码,计算第一~第四子帧的基音滞后Tj p。然后,自适应码本计算部123使用自适应码本u(n),按照数式20对每个子帧计算自适应码本向量。通过利用FIR滤波器Int(i)对自适应码本u(n)进行插值,计算出自适应码本向量。在此,将自适应码本的长度设为Nadapt。在插值中使用的滤波器Int(i)是事前设定的长度2l+1的FIR滤波器,L’表示子帧的采样数。通过使用插值滤波器Int(i),能够以小数点以下的精度利用基音滞后。关于插值滤波器的详细情况,能够使用非专利文献1记载的方法。
[数式20]
固定码本解码部124对被编码后的固定码本向量进行解码,取得第一~第四子帧的固定码本向量cj(n)。
增益解码部125对被编码后的自适应码本增益及被编码后的固定码本增益进行解码,取得第一~第四子帧的自适应码本增益及固定码本增益。例如,能够利用非专利文献1记载的如下的方法进行自适应码本增益及固定码本增益的解码。根据利用非专利文献1记载的如下的方法,不必像AMR-WB的增益编码那样使用帧间预测,因而能够提高抗分组丢失性。
例如,增益解码部125按照以下的处理流程取得固定码本增益。
首先,增益解码部125计算固定码本向量的功率。在此,将子帧的长度设为Ns。
[数式21]
然后,增益解码部125对被向量量化后的增益参数进行解码,得到数式22所示的自适应码本增益和数式23所示的量化固定码本增益。根据量化固定码本增益和上述固定码本向量的功率计算如下数式24所示的预测固定码本增益。
[数式22]
[数式23]
[数式24]
最后,增益解码部125对数式25所示的预测系数进行解码,并与预测增益相乘,由此得到数式26所示的固定码本增益。
[数式25]
[数式26]
激励向量合成部126按照数式27所示将自适应码本向量与自适应码本增益相乘,并且将固定码本向量与固定码本增益相乘,再求出乘积之和,由此取得激励信号。
[数式27]
主滤波器127对激励信号向量进行例如基音强调、噪声强调、低频强调这样的后处理。基音强调、噪声强调、低频强调能够使用非专利文献1记载的方法。
合成滤波器128通过线性预测逆向滤波,将以激励信号为驱动音源的解码信号合成。
[数式28]
另外,当在编码器中进行了预加重(pre-emphasis)的情况下,进行去加重(de-emphasis)。
[数式29]
另一方面,当在编码器中未进行预加重的情况下,不进行去加重。
下面,说明有关内部状态更新的动作。
LP系数计算部122利用根据数式30计算的向量更新ISF参数的内部状态,以便进行分组丢失时的参数插值。
[数式30]
其中,ωi (-j)表示被存储在缓存器中的第j帧前的ISF参数。ωi c表示事前通过学习等求出的讲话区间的ISF参数。β表示常数,例如能够取值如0.75,但不限于此。ωi c、β例如也可以如非专利文献1记载的ISF隐藏(コンシールメント)那样根据表示编码对象帧的性质的索引而变化。
另外,LP系数计算部122也按照下式更新ISF残差参数的内部状态。
[数式31]
激励向量合成部126按照下式利用激励信号向量更新内部状态。
[数式32]
u(n)=u(n+L) (0≤n<N-L)
u(n+N-L+jL′)=ej(n) (0≤n<L′)
另外,激励向量合成部126按照下式更新增益参数的内部状态。
[数式33]
自适应码本计算部123按照下式更新基音滞后的参数的内部状态。
[数式34]
另外,在此是设为(-2≤j<Mla),但关于j的范围,也可以根据设计方针选择不同的值。
<分组丢失的情况>
图6示出隐藏信号生成部13的功能结构例。如该图6所示,隐藏信号生成部13具有LP系数插值部130、基音滞后插值部131、增益插值部132、噪声信号生成部133、主滤波器134、合成滤波器135、自适应码本计算部136、和激励向量合成部137。其中,主滤波器134不是必须的构成要素。
LP系数插值部130按照数式36来计算数式35表示的内容。另外,ωi (-j)表示被存储在缓存器中的第j帧前的ISF参数。
[数式35]
[数式36]
其中,数式37表示在正常接收到分组时计算出的ISF参数的内部状态。α也表示常数,能够取值如0.9,但不限于此。α例如也可以如非专利文献1记载的ISF隐藏那样根据表示编码对象帧的性质的索引而变化。
[数式37]
从ISF参数得到LP系数的步骤与正常接收到分组时一样。
基音滞后插值部131使用数式38所示的有关基音滞后的内部状态参数,计算数式39所示的基音滞后的预测值。具体的处理步骤能够使用非专利文献1的方法。
[数式38]
[数式39]
增益插值部132能够使用基于非专利文献1记载的数式40所示的方法进行固定码本增益的插值。
[数式40]
噪声信号生成部133生成与固定码本向量相同长度的白色噪声,取代固定码本向量使用。
主滤波器134、合成滤波器135、自适应码本计算部136以及激励向量合成部137的动作,与前述的正常接收到分组时的动作一样。
关于内部状态更新,除了ISF残差参数以外,其它与正常接收到分组时一样。ISF残差参数的更新由LP系数插值部130按照下式进行。
[数式41]
现有技术文献
专利文献
专利文献1:国际公开2002/035520号公报
专利文献2:国际公开2008/108080号公报
非专利文献
非专利文献1:ITU-T Recommendation G.718,2008年6月
发明内容
发明要解决的问题
如上所述,CELP编码具有内部状态,因而由于在分组丢失时通过插值而得到的参数与本来应该在解码中使用的参数的偏差,产生音质的劣化。尤其是ISF参数被实施帧内/帧间的预测编码,因而存在分组丢失的影响在分组丢失恢复后仍继续的问题。
更具体地讲,在从在音频的开始部分附近产生的分组丢失恢复的第一个帧中,确认到功率急剧上升的问题。这在激励信号的功率升高的音频的开始部分中,根据通过分组丢失时的插值处理而得到的ISF系数计算出的LP系数的脉冲响应,被认为是由于具有比本来解码器假定的值高的增益而产生的、主观品质上不舒适的不连续声音。
专利文献1的方法生成对所丢失的帧进行插值得到的ISF系数,对于从丢失恢复的第一个帧,通过通常的解码而生成ISF参数,因而不能抑制上述急剧的功率的上升。
另一方面,在专利文献2的方法中,通过传输在编码侧求出的增益调整用参数(归一化预测残差功率),并在解码侧的功率调整中使用,能够抑制分组丢失后的帧的激励信号的功率,防止急剧的功率的上升。
图7示出与专利文献2的技术相当的音频解码器1X的功能结构例,图8示出隐藏信号生成部13X的功能结构例。在专利文献2中,音频分组除在现行方法中叙述的参数以外,至少包括归一化预测残差功率的辅助信息。
音频信号生成部1X具有的归一化预测残差功率解码部15从音频分组中解码出归一化预测残差功率的辅助信息,计算参照归一化预测残差功率,输出给隐藏信号生成部13X。
隐藏信号生成部13X的构成要素中除归一化预测残差调整部138以外的构成要素与前述的现有技术相同,因而下面仅对归一化预测残差调整部138进行说明。
归一化预测残差调整部138根据LP系数插值部130输出的LP系数计算归一化预测残差功率。然后,归一化预测残差调整部138使用归一化预测残差功率和参照归一化预测残差功率,计算合成滤波器增益调整系数。最后,归一化预测残差调整部138将合成滤波器增益调整系数与激励信号相乘,输出给合成滤波器135。
根据上述的专利文献2的技术,虽然能够与正常接收时一样抑制分组丢失时的隐藏信号的功率,但是在低比特速率音频编码中,难以确保上述增益调整用参数的传输所需要的比特速率。并且,由于是在隐藏信号生成部中的处理,因而难以应对在恢复帧中由于ISF参数的不一致而产生的功率的急剧变化。
因此,本发明的目的在于,降低在从音频开始时刻的分组丢失恢复时产生的不连续声音,改善主观品质。
用于解决问题的手段
本发明的一实施方式的音频信号处理装置具有:不连续估计器,其对在产生分组丢失后第一个正常接收到的音频分组,估计由于音频分组解码的结果所得到的解码音频的振幅急剧增大而产生的不连续性;以及不连续修正器,其修正解码音频的不连续性。
也可以是,上述的不连续估计器根据激励信号的功率估计解码音频的不连续性。
另外,也可以是,上述的不连续估计器根据在激励信号计算中使用的被量化后的码本增益,估计解码音频的不连续性。
也可以是,上述的音频信号处理装置还具有对从编码器传输的有关不连续性的辅助信息进行解码的辅助信息解码器,上述的不连续估计器使用辅助信息解码器对辅助信息码进行解码而输出的有关不连续性的辅助信息,估计解码音频的不连续性。
也可以是,上述的不连续修正器按照不连续性的估计结果修正ISF参数或者LSF参数(以下表述为“ISF/LSF参数”)。
更具体地讲,也可以是,上述的不连续修正器按照不连续性的估计结果,改变为保证合成滤波器的稳定性而赋予的ISF/LSF参数的各要素间的间隔。
此时,也可以是,上述的不连续修正器赋予比通常为保证稳定性而赋予的间隔更大的间隔,作为为保证合成滤波器的稳定性而赋予的ISF/LSF参数的各要素间的间隔。
另外,也可以是,上述的不连续修正器使用将截止到预先设定的维数的ISF/LSF参数进行等分得到的间隔,作为为保证合成滤波器的稳定性而赋予的ISF/LSF参数的各要素间的间隔。
另外,也可以是,上述的不连续修正器利用预先设定的向量置换ISF/LSF参数的一部分或者全部。
本发明的一实施方式的音频信号处理装置具有:ISF/LSF量化器,其对ISF/LSF参数进行量化;ISF/LSF隐藏器,其生成有关ISF/LSF参数的隐藏信息即隐藏ISF/LSF参数;不连续估计器,其使用在所述ISF/LSF量化器的量化过程中得到的量化ISF/LSF参数、与所述ISF/LSF隐藏器生成的隐藏ISF/LSF参数之间的距离,估计在产生分组丢失后第一个正常接收到的音频分组中产生的不连续性;以及辅助信息编码器,其对有关不连续性的辅助信息进行编码。
本发明的一实施方式的音频信号处理装置具有:不连续估计器,其估计在产生分组丢失后第一个正常接收到的音频分组中产生的不连续性;辅助信息编码器,其对有关不连续性的辅助信息进行编码;以及ISF/LSF量化器,其在所述不连续估计器未估计出不连续性时,在相应帧的ISF/LSF量化中使用过去的量化ISF/LSF残差参数,在所述不连续估计器估计出不连续性时,避免在该帧的ISF/LSF量化中使用过去的量化ISF/LSF残差参数。
本发明的一实施方式的音频信号处理装置具有:辅助信息解码器,其对与产生分组丢失后第一个正常接收到的音频分组中产生的不连续性有关的辅助信息进行解码并输出;不连续修正器,其修正解码音频的不连续性;以及ISF/LSF解码器,其在根据所述辅助信息解码器的输出未估计出不连续性时,在该帧的ISF/LSF计算中使用过去的量化ISF/LSF残差参数,在根据所述辅助信息解码器的输出估计出不连续性时,避免在该帧的ISF/LSF计算中使用过去的量化ISF/LSF残差参数。
也可以是,音频信号处理装置还具有判定过去的规定数量的帧的分组接收状态的接收状态判定部,不连续修正器采用根据不连续性的估计结果以及分组接收状态的判定结果,进行不连续性的修正的结构。
另外,本发明的一实施方式的音频信号处理装置也能够作为有关音频信号处理方法的发明、有关音频信号处理程序的发明,并能够记述如下。
本发明的一实施方式的音频信号处理方法由音频信号处理装置执行,该音频信号处理方法包括以下步骤:对在产生分组丢失后第一个正常接收到的音频分组,估计由于音频分组解码的结果所得到的解码音频的振幅急剧增大而产生的不连续性;修正解码音频的不连续性。
本发明的一实施方式的音频信号处理方法由音频信号处理装置执行,该音频信号处理方法包括以下步骤:对ISF/LSF参数进行量化;生成有关ISF/LSF参数的隐藏信息即隐藏ISF/LSF参数;使用在所述ISF/LSF参数的量化过程中得到的量化ISF/LSF参数、与所生成的隐藏ISF/LSF参数之间的距离,估计在产生分组丢失后第一个正常接收到的音频分组中产生的不连续性;对有关不连续性的辅助信息进行编码。
本发明的一实施方式的音频信号处理方法由音频信号处理装置执行,该音频信号处理方法包括以下步骤:估计在产生分组丢失后第一个正常接收到的音频分组中产生的不连续性;对有关不连续性的辅助信息进行编码;在未估计出不连续性时,在该帧的ISF/LSF量化中使用过去的量化ISF/LSF残差参数,在估计出不连续性时,避免在该帧的ISF/LSF量化中使用过去的量化ISF/LSF残差参数。
本发明的一实施方式的音频信号处理方法由音频信号处理装置执行,该音频信号处理方法包括以下步骤:对与产生分组丢失后第一个正常接收到的音频分组中产生的不连续性有关的辅助信息进行解码并输出;修正解码音频的不连续性;在所述辅助信息表示未估计出不连续性时,在该帧的ISF/LSF计算中使用过去的量化ISF/LSF残差参数,在所述辅助信息表示估计出不连续性时,避免在该帧的ISF/LSF计算中使用过去的量化ISF/LSF残差参数。
本发明的一实施方式的音频信号处理程序用于使计算机作为以下要素进行动作:不连续估计器,其对在产生分组丢失后第一个正常接收到的音频分组,估计由于音频分组解码的结果所得到的解码音频的振幅急剧增大而产生的不连续性;以及不连续修正器,其修正解码音频的不连续性。
本发明的一实施方式的音频信号处理程序用于使计算机作为以下要素进行动作:ISF/LSF量化器,其对ISF/LSF参数进行量化;ISF/LSF隐藏器,其生成有关ISF/LSF参数的隐藏信息即隐藏ISF/LSF参数;不连续估计器,其使用在所述ISF/LSF量化器的量化过程中得到的量化ISF/LSF参数、与所述ISF/LSF隐藏器生成的隐藏ISF/LSF参数之间的距离,估计在产生分组丢失后第一个正常接收到的音频分组中产生的不连续性;以及辅助信息编码器,其对有关不连续性的辅助信息进行编码。
本发明的一实施方式的音频信号处理程序用于使计算机作为以下要素进行动作:不连续估计器,其估计在产生分组丢失后第一个正常接收到的音频分组中产生的不连续性;辅助信息编码器,其对有关不连续性的辅助信息进行编码;以及ISF/LSF量化器,其在所述不连续估计器未估计出不连续性时,在该帧的ISF/LSF量化中使用过去的量化ISF/LSF残差参数,在所述不连续估计器估计出不连续性时,避免在该帧的ISF/LSF量化中使用过去的量化ISF/LSF残差参数。
本发明的一实施方式的音频信号处理程序用于使计算机作为以下要素进行动作:辅助信息解码器,其对与产生分组丢失后第一个正常接收到的音频分组中产生的不连续性有关的辅助信息进行解码并输出;不连续修正器,其修正解码音频的不连续性;以及ISF/LSF解码器,其在根据所述辅助信息解码器的输出未估计出不连续性时,在该帧的ISF/LSF计算中使用过去的量化ISF/LSF残差参数,在根据所述辅助信息解码器的输出估计出不连续性时,避免在该帧的ISF/LSF计算中使用过去的量化ISF/LSF残差参数。
本发明提供一种由音频信号处理装置执行的音频信号处理方法,该音频信号处理方法包括以下步骤:
由所述音频信号处理装置对音频分组进行解码以获得解码音频和导抗谱频率ISF/线谱频率LSF参数;
由所述音频信号处理装置估计所述解码音频的振幅的急剧增大,所述音频分组是在产生分组丢失后第一个正常接收到的音频分组;以及
由所述音频信号处理装置对所述解码音频的振幅的急剧增大进行缓解,其中,
缓解所述解码音频的振幅的急剧增大的步骤包括:改变所述ISF/LSF参数的各要素间的间隔。
本发明提供一种音频信号处理装置,其包括:
中央处理单元;
由所述中央处理单元执行的不连续估计器,其估计解码音频的振幅的急剧增大,所述解码音频是对在产生分组丢失后第一个正常接收到的音频分组进行解码而得到的;以及
由所述中央处理单元执行的不连续修正器,其对所述解码音频的振幅的急剧增大进行缓解,其中,
所述不连续修正器还进一步由所述中央处理单元执行,以根据振幅的急剧增大的估计结果来改变通过对所述第一个正常接收到的音频分组进行解码而获得的导抗谱频率ISF/线谱频率LSF参数的各要素间的距离。
本发明提供一种由音频信号处理装置执行的音频信号处理方法,该音频信号处理方法包括以下步骤:
在对音频信号编码的过程中对导抗谱频率ISF/线谱频率LSF参数进行量化以获得量化ISF/LSF参数;
生成隐藏ISF/LSF参数,所述隐藏ISF/LSF参数是有关所述ISF/LSF参数的隐藏信息;
估计所述音频信号的振幅的急剧增大,所述振幅的急剧增大出现在产生分组丢失后第一个正常接收到的音频分组中,其中,估计所述音频信号的振幅的急剧增大包括:使用量化ISF/LSF参数与生成的隐藏ISF/LSF参数之间的距离来估计所述音频信号的振幅的急剧增大;以及
对辅助信息进行编码,所述辅助信息表示所述音频信号的振幅的急剧增大的估计。
本发明提供一种音频信号处理装置,其包括:
导抗谱频率ISF/线谱频率LSF量化器,其对音频信号的ISF/LSF参数进行量化以生成量化ISF/LSF参数;
ISF/LSF隐藏器,其生成隐藏ISF/LSF参数,所述隐藏ISF/LSF参数是有关ISF/LSF参数的隐藏信息;
不连续估计器,其估计所述音频信号的振幅的急剧增大,所述振幅的急剧增大出现在产生分组丢失后第一个正常接收到的音频分组中,所述不连续估计器使用量化ISF/LSF参数与由所述ISF/LSF隐藏器生成的隐藏ISF/LSF参数之间的距离来估计所述音频信号的振幅的急剧增大;以及
辅助信息编码器,其对辅助信息进行编码,所述辅助信息表示所述音频信号的振幅的急剧增大的估计。
发明效果
根据如上所述的本发明,能够降低在从音频开始时刻的分组丢失恢复时产生的所述不连续声音,改善主观品质。
附图说明
图1是音频解码器的结构图。
图2是音频解码器的处理流程。
图3是音频码解码部的功能结构图。
图4是LP系数计算部的功能结构图。
图5是计算LP系数的处理流程。
图6是隐藏信号生成部的功能结构图。
图7是专利文献2的音频解码器的结构图。
图8是专利文献2的隐藏信号生成部的功能结构图。
图9是第1实施方式的音频码解码部的功能结构图。
图10是第1实施方式的LP系数计算部的处理流程。
图11是第1实施方式的音频码解码部的功能结构图。
图12是第1实施方式的变形例1的第2稳定性处理部的处理流程。
图13是第2实施方式的音频码解码部的功能结构图。
图14是第2实施方式的LP系数计算部的功能结构图。
图15是第2实施方式的LP系数计算的处理流程。
图16是第4实施方式的音频编码器的结构图。
图17是第4实施方式的音频编码器的结构图。
图18是第4实施方式的LP分析/编码器的结构图。
图19是第4实施方式的LP分析/编码器的处理流程。
图20是第4实施方式的音频码解码部的功能结构图。
图21是第4实施方式的LP系数计算部的处理流程。
图22是第5实施方式的LP分析/编码器的结构图。
图23是第5实施方式的LP分析/编码器的处理流程。
图24是第4实施方式的音频码解码部的功能结构图。
图25是第5实施方式的LP系数计算部的处理流程。
图26是第7实施方式的音频解码器的结构图。
图27是第7实施方式的音频解码器的处理流程。
图28是第7实施方式的音频码解码部的功能结构图。
图29是第7实施方式的LP系数计算的处理流程。
图30是示出计算机的硬件结构例的图。
图31是计算机的外观图。
图32的(a)、(b)、(c)及(d)是示出音频信号处理程序的各种结构例的图。
具体实施方式
下面,使用附图详细说明本发明的音频信号处理装置、音频信号处理方法及音频信号处理程序的优选的实施方式。另外,在附图的说明中对相同要素标注相同的标号,并省略重复说明。
[第1实施方式]
第1实施方式的音频信号处理装置具有与前述的图1的音频解码器1相同的结构,其特征在于音频码解码部,下面对音频码解码部进行说明。
图9示出第1实施方式的音频码解码部12A的功能结构图,图10示出LP系数计算处理的流程图。图9的音频码解码部12A相对于前述的图3的结构追加了不连续检测部129。与现有技术的不同仅在于LP系数计算处理,因而在此对有关LP系数计算处理的各个部分的动作进行说明。
不连续检测部129参照解码得到的固定码本增益gc 0及内部状态中包含的固定码本增益gc -1,按照下式比较增益的变化与阈值(图10的步骤S11)。
[数式42]
在增益的变化超过阈值的情况下,检测为发生不连续(以下,也简称为“检测出不连续”),向稳定性处理部121输出有关发生不连续的检测结果的控制信号。
另外,在进行增益的变化与阈值的比较时,也可以使用下式。
[数式43]
另外,也可以是,将当前帧中包含的第一~第四子帧的固定码本增益中的最大者设为gc (c),将内部状态中包含的固定码本增益中的最小者设为gc (p),按照下式进行增益的变化与阈值的比较。
[数式44]
当然,也可以使用下式。
[数式45]
在第1实施方式的上述示例中,示出了使用紧前面一帧(丢失帧)的第四子帧的固定码本增益gc -1、和当前帧的第一子帧的固定码本增益gc 0进行不连续检测的例子,但也可以是,在对内部状态中包含的固定码本增益及当前帧中包含的固定码本增益分别计算出平均值后,进行增益的变化与阈值的比较。
ISF解码部120进行与现有技术相同的动作(图10的步骤S12)。
在不连续检测部129检测出不连续的情况下,稳定性处理部121通过以下的处理来修正ISF参数(图10的步骤S13)。
首先,稳定性处理部121对于被存储在内部状态缓存器14中的数式46所示的ISF参数,进行使各要素之间隔开是通常的M-1倍的间隔的处理。通过赋予比通常大非常多的间隔,实现抑制频谱包络中的过大的峰值和谷值的效果。其中,min_dist表示最小的ISF间隔,isf_min表示确保min_dist的间隔所需要的ISF的最小值。isf_min通过将相邻的ISF的值与min_dist的间隔相加而依次进行更新。另一方面,isf_max表示确保min_dist的间隔所需要的ISF的最大值。isf_max通过从相邻的ISF的值中减去min_dist的间隔而依次进行更新。
[数式46]
[数式47]
然后,稳定性处理部121对于当前帧的ISF参数,进行使各要素之间隔开是通常的M0倍的间隔的处理。在此,设为1<M0<M-1,但也可以将M-1或者M0任意一方设定为1,将另一方设定为大于1的值。
[数式48]
另外,在不连续检测器未检测出不连续的情况下,稳定性处理部121进行与在通常的解码过程中实施的处理一样的以下处理。
[数式49]
也可以是,检测出不连续时的要素之间的最小间隔按照ISF的频率而变化。检测出不连续时的要素之间的最小间隔只要与通常的解码处理的最小的要素之间的间隔不同即可。
LP系数计算部122内的ISF-ISP变换部122A按照数式52,将数式50所示的ISF参数分别变换为数式51所示的ISP参数(图10的步骤S14)。其中,C表示事前设定的常数。
[数式50]
[数式51]
[数式52]
ISP插值部122B根据数式53所示的过去的ISP参数和数式54所示的上述ISP参数,按照数式55计算每个子帧的ISP参数(图10的步骤S15)。也可以使用其它的系数进行插值。
[数式53]
[数式54]
[数式55]
ISP-LPC变换部122C将每个子帧的ISP参数变换为数式56所示的LP系数(图10的步骤S16)。在此,将先行信号中包含的子帧的数量设为4,但也可以按照设计方针变更子帧的数量。作为具体的变换步骤,能够采用非专利文献1记载的处理步骤。
[数式56]
另外,ISF-ISP变换部122A将被存储在内部状态缓存器14中的数式57所示的ISF参数,按照数式58进行更新。
[数式57]
[数式58]
此时,即使在检测出不连续的情况下,ISF-ISP变换部122A也可以通过执行以下的步骤,使用ISF参数的计算结果更新被存储在内部状态缓存器中的数式59所示的ISF参数。
[数式59]
[数式60]
如以上的第1实施方式那样,能够根据在计算激励信号时使用的被量化的码本增益,估计解码音频的不连续性,并且能够按照不连续性的估计结果,修正ISF/LSF参数(例如为保证合成滤波器的稳定性而赋予的ISF/LSF参数的各要素之间的间隔)。因此,能够降低在从音频开始时刻的分组丢失恢复时产生的不连续声音,改善主观品质。
[第1实施方式的变形例]
图11示出第1实施方式的变形例的音频码解码部12S的功能结构图。与图3的现有技术的结构的不同仅在于不连续检测部129和第2稳定性处理部121S,因而对这两个要素的动作进行说明。第2稳定性处理部121S具有增益调整部121X和增益相乘部121Y,第2稳定性处理部121S的处理流程如图12所示。
不连续检测部129与第1实施方式的不连续检测部129一样,参照进行解码而得到的固定码本增益gc 0及内部状态中包含的固定码本增益gc -1,将增益的变化与阈值进行比较。并且,不连续检测部129将包括有关增益的变化是否超过阈值的信息的控制信号发送给增益调整部121X。
增益调整部121X从控制信号读出有关增益的变化是否超过阈值的信息,在增益的变化超过阈值的情况下,将事前设定的增益gon输出给增益相乘部121Y。另一方面,增益调整部121X在增益的变化未超过阈值的情况下,将事前设定的增益goff输出给增益相乘部121Y。这样的增益调整部121X的动作对应于图12的步骤S18。
增益相乘部121Y将合成滤波器128输出的合成信号与上述增益gon或者增益goff相乘(图12的步骤S19),并输出所得到的解码信号。
在此,也可以构成为从LP系数计算部122输出LP系数或者ISF参数,并输入第2稳定性处理部121S(在图11中示出从LP系数计算部122向增益调整部121X的用虚线示出的结构)。在这种情况下,应该相乘的增益是使用由LP系数计算部122计算出的LP系数或者ISF参数决定的。
如以上的变形例那样,通过在音频码解码部12S中追加第2稳定性处理部121S,并按照增益的变化是否超过阈值来调整增益,能够得到适当的解码信号。
另外,也可以是,第2稳定性处理部121S将上述计算出的增益与激励信号相乘,并输出给合成滤波器128。
[第2实施方式]
第2实施方式的音频信号处理装置具有与前述的图1的音频解码器1相同的结构,其特征在于音频码解码部,下面对音频码解码部进行说明。图13示出音频码解码部12B的功能结构例,图14示出有关LP系数的计算处理的功能结构例,图15示出LP系数的计算处理的流程。图13的音频码解码部12B相对于前述的图3的结构追加了不连续检测部129。
ISF解码部120与现有技术一样地计算ISF参数(图15的步骤S21)。
稳定性处理部121与现有技术一样地,进行使数式61所示的ISF参数的各要素之间隔开50Hz以上的间隔的处理,以便确保滤波器的稳定性(图15的步骤S22)。
[数式61]
ISF-ISP变换部122A与第1实施方式一样地,将稳定性处理部121输出的ISF参数变换为ISP参数(图15的步骤S23)。
ISP插值部122B与第1实施方式一样地,根据数式62所示的过去的ISP参数和通过ISF-ISP变换部122A的变换而得到的数式63所示的ISP参数,计算每个子帧的ISP参数(图15的步骤S24)。
[数式62]
[数式63]
ISP-LPC变换部122C与第1实施方式一样地,将每个子帧的ISP参数变换为数式64所示的LP系数(图15的步骤S25)。在此,将先行信号中包含的子帧的数量设为4,但也可以根据设计方针变更子帧的数量。
[数式64]
内部状态缓存器14利用新的ISF参数更新过去存储的ISF参数。
不连续检测部129从内部状态缓存器14读出分组丢失的帧中的第四子帧的LP系数,并计算分组丢失的帧中的第四子帧的LP系数的脉冲响应的功率。分组丢失的帧中的第四子帧的LP系数能够使用在分组丢失时图6的隐藏信号生成部13中包含的LP系数插值部130输出而蓄积在内部状态缓存器14中的数式65所示的系数。
[数式65]
并且,不连续检测部129例如根据数式66检测不连续(图15的步骤S26)。
[数式66]
E0-E-l>Thres
在增益的变化未超过阈值的情况下(图15的步骤S27为否的情况下),不连续检测部129未检测出发生不连续,从ISP-LPC变换部122C输出LP系数而结束处理。另一方面,在增益的变化超过阈值的情况下(图15的步骤S27为“是”的情况下),不连续检测部129检测出发生不连续,向稳定性处理部121发送有关发生不连续的检测结果的控制信号。在接收到控制信号的情况下,稳定性处理部121与第1实施方式一样地修正ISF参数(图15的步骤S28)。以后,ISF-ISP变换部122A、ISP插值部122B及ISP-LPC变换部122C的动作(图15的步骤S29、S2A、S2B)与上述情况相同。
如以上的第2实施方式那样,能够根据激励信号的功率估计解码信号的不连续性,能够与第1实施方式一样地降低不连续声音、改善主观品质。
[第3实施方式]
在检测出不连续时,也可以利用其它的方法修正ISF参数。在第3实施方式中,只有稳定性处理部121与第1实施方式不同,因而仅对稳定性处理部121的动作进行说明。
在不连续检测部129检测出不连续的情况下,稳定性处理部121进行以下的处理来修正ISF参数。
对于被存储在内部状态缓存器14中的数式67所示的ISF参数,稳定性处理部121根据下式来置换截止到低次P’维数(0<P’≦P)的ISF参数。在此设为如数式68、数式69所示。
[数式67]
[数式68]
[数式69]
另外,也可以是,稳定性处理部121利用如下所示事前通过学习而得到的P’维向量覆盖低次P’维的ISF参数。
[数式70]
然后,对于当前帧的ISF参数,稳定性处理部121既可以如第1实施方式那样进行使各要素之间隔开是通常的M0倍的间隔的处理,也可以按照下式来决定。在此设为如数式71、数式72所示。
[数式71]
[数式72]
另外,稳定性处理部121也可以用事前学习得到的P’维向量覆盖。
[数式73]
另外,上述P’维向量也可以是在解码过程中学习得到的,例如也可以设为如数式74所示。但是,也可以在解码开始时的帧中将ωi -1设为预先设定的P’维向量ωi init。
[数式74]
内部状态缓存器14利用新的ISF参数更新过去存储的ISF参数。
如以上的第3实施方式那样,能够使用将截止到预先设定的维数的ISF/LSF参数进行等分得到的间隔,作为为保证合成滤波器的稳定性而赋予的ISF/LSF参数的各要素间的间隔,与第1、第2实施方式一样,能够降低不连续声音、改善主观品质。
[第4实施方式]
在第4实施方式中说明这样的实施方式,编码侧检测不连续的发生,将不连续判定码(表示检测结果的码)包含在音频码中传输给解码侧,解码侧根据音频码中包含的不连续判定码决定稳定性处理的处理内容。
(关于编码侧)
图16示出编码器2的功能结构例,图17示出编码器2的处理的流程图。如图16所示,编码器2具有LP分析/编码部21、残差编码部22和码复用部23。
其中,LP分析/编码部21的功能结构例如图18所示,LP分析/编码部21的处理的流程图如图19所示。如图18所示,LP分析/编码部21具有LP分析部210、LP-ISF变换部211、ISF编码部212、不连续判定部213、ISF隐藏部214、ISF-LP变换部215、和ISF缓存器216。
在LP分析/编码部21中,LP分析部210对输入信号进行线性预测分析,并求出线性预测系数(图17的步骤T41、图18的步骤U41)。在计算线性预测系数时,在根据音频信号计算出自相关函数后,能够采用莱文森-杜宾(Levinson-Durbin)算法等。
LP-ISF变换部211与第1实施方式一样将计算出的线性预测系数变换为ISF参数(步骤T42、U42)。从线性预测系数向ISF参数的变换也可以采用非专利文献记载的方法。
ISF编码部212利用事前设定的方法对ISF参数进行编码来计算出ISF码(步骤T43、U43),将在编码的过程中得到的量化ISF参数输出给不连续判定部213、ISF隐藏部214和ISF-LP变换部215(步骤U47)。在此,量化ISF参数与对ISF码进行逆量化得到的ISF参数相同。作为编码的方法,也可以采用向量编码、或利用向量量化等对紧前面一帧的ISF以及与事前通过学习而设定的平均向量之间的误差向量进行编码。
不连续判定部213对在不连续判定部213内置的内部缓存器(未图示)中存储的不连续判定标志进行编码,并输出所得到的不连续判定码(步骤U47)。另外,不连续判定部213使用从ISF缓存器216读出的数式75所示的隐藏ISF参数和数式76所示的量化ISF参数,按照数式77进行不连续的判定(步骤T44、U46),将其判定结果存储在不连续判定部213的内部缓存器中。其中,Thresω表示事前设定的阈值,P’表示满足下式的整数(0<P’≦P)。
[数式75]
[数式76]
[数式77]
在此,说明了使用ISF参数彼此间的欧几里得距离进行不连续判定的示例,但也可以利用其它的方法进行不连续判定。
ISF隐藏部214通过与解码器侧的ISF隐藏部一样的处理,根据量化ISF参数计算隐藏ISF参数,将得到的隐藏ISF参数输出给ISF缓存器216(步骤U44、U45)。ISF隐藏处理的处理步骤如果是与解码器侧的分组丢失隐藏部相同的处理,则可以是任何方法。
ISF-LP变换部215对上述量化ISF参数进行变换并计算量化线性预测系数,将得到的量化线性预测系数向残差编码部22输出(步骤T45)。关于将ISF参数变换为量化线性预测系数的方法,也可以采用非专利文献记载的方法。
残差编码部22使用量化线性预测系数对音频信号进行滤波,并计算残差信号(步骤T46)。
然后,残差编码部22通过使用CELP或者TCX(Transform Coded Excitation)的编码单元、切换使用CELP和TCX的编码单元等,对残差信号进行编码,并输出残差码(步骤T47)。残差编码部22的处理与本发明的关联性较低,因而省略说明。
编码复用部23按照规定的顺序将ISF码、便利性判定码及残差码合并,并输出所得到的音频码(步骤T48)。
(关于解码侧)
第4实施方式的音频信号处理装置具有与前述的图1的音频解码器1相同的结构,其特征在于音频码解码部,下面对音频码解码部进行说明。图20示出音频码解码部12D的功能结构例,图21示出LP系数的计算处理的流程。图20的音频码解码部12D相对于前述的图3的结构追加了不连续检测部129。
ISF解码部120对ISF码进行解码,输出给稳定性处理部121和内部状态缓存器14(图21的步骤S41)。
不连续检测部129对不连续判定码进行解码,将得到的不连续检测结果输出给稳定性处理部121(图21的步骤S42)。
稳定性处理部121进行与不连续检测结果对应的稳定性处理(图21的步骤S43)。稳定性处理部的处理步骤能够使用与第1实施方式及第3实施方式相同的方法。
另外,也可以是,稳定性处理部121根据从不连续判定码得到的不连续检测结果、以及音频码中包含的其它的参数,按照下面所述进行稳定性处理。例如,也可以构成为,稳定性处理部121按照下式计算ISF稳定度stab,在ISF稳定度stab超过阈值的情况下,即使是得到了表示从不连续判定码检测出不连续的不连续检测结果时,也进行如同未检测出不连续那样的稳定性处理。其中,C表示事前设定的常数。
[数式78]
LP系数计算部122内的ISF-ISP变换部122A通过与第1实施方式一样的处理步骤,将ISF参数变换为ISP参数(图21的步骤S44)。
ISP插值部122B通过与第1实施方式一样的处理步骤,计算每个子帧的ISP参数(图21的步骤S45)。
ISP-LPC变换部122C通过与第1实施方式一样的处理步骤,将对每个子帧计算出的ISP参数变换为LPC参数(图21的步骤S46)。
在如上所述的第4实施方式中,在编码侧进行不连续判定(作为一例,使用了隐藏ISF参数和量化ISF参数彼此间的欧几里得距离的不连续判定),对有关其判定结果的辅助信息进行编码而向解码侧输出,在解码侧使用解码得到的辅助信息进行不连续性的估计。通过这样在编码侧和解码侧进行协作,能够执行与在编码侧的不连续判定结果对应的合适的处理。
[第5实施方式]
(关于编码侧)
编码器的功能结构与第4实施方式的图16的功能结构相同,编码器的处理流程与第4实施方式的图17的处理流程相同。在此,对与第4实施方式不同的第5实施方式的LP分析/编码部进行说明。
图22示出LP分析/编码部的功能结构例,图23示出LP分析/编码部的处理的流程图。如图22所示,LP分析/编码部21S具有LP分析部210、LP-ISF变换部211、ISF编码部212、不连续判定部213、ISF隐藏部214、ISF-LP变换部215、和ISF缓存器216。
在这样的LP分析/编码部21S中,LP分析部210通过与第4实施方式一样的处理,对输入信号进行线性预测分析,并求出线性预测系数(图23的步骤U51)。
LP-ISF变换部211通过与第4实施方式一样的处理,将计算出的线性预测系数变换为ISF参数(图23的U52)。从线性预测系数至ISF参数的变换也可以采用非专利文献记载的方法。
ISF编码部212读出在不连续判定部213的内部缓存器(未图示)中存储的不连续判定标志(图23的U53)。
<不连续判定标志表示检测出不连续的情况>
ISF编码部212对按照数式79计算出的ISF残差参数ri进行向量量化来计算ISF码(图23的U54)。在此,将LP-ISF变换部计算出的ISF参数设为ωi,将事前通过学习而求出的平均向量设为meani。
[数式79]
ri=ωi-meani
然后,ISF编码部212使用对ISF残差参数ri进行量化得到的数式80所示的量化ISF残差参数,按照数式81所示更新ISF残差参数缓存器(图23的U55)。
[数式80]
[数式81]
<不连续判定标志表示未检测出不连续的情况>
ISF编码部212对按照数式83计算出的ISF残差参数ri进行向量量化来计算ISF码(图23的U54)。在此,将在紧前面一帧中通过解码而得到的ISF残差参数设为数式82所示。
[数式82]
[数式83]
然后,ISF编码部212使用对ISF残差参数ri进行量化得到的数式84所示的量化ISF残差参数,按照数式85所示更新ISF残差参数缓存器(图23的U55)。
[数式84]
[数式85]
通过以上的步骤,ISF编码部212计算出ISF码,将在编码的过程中得到的量化ISF参数输出给不连续判定部213、ISF隐藏部214和ISF-LP变换部215。
ISF隐藏部214与第4实施方式一样地,通过与解码器侧的ISF隐藏部一样的处理,根据量化ISF参数计算隐藏ISF参数,并输出给ISF缓存器216(图23的步骤U56、U58)。ISF隐藏处理的处理步骤如果是与解码器侧的分组丢失隐藏部相同的处理,则可以是任何方法。
不连续判定部213通过与第4实施方式一样的处理进行不连续的判定,将判定结果存储在不连续判定部213的内部缓存器(未图示)中(图23的步骤U57)。
ISF-LP变换部215与第4实施方式一样地,对上述量化ISF参数进行变换,计算量化线性预测系数,并向残差编码部22(图16)输出(图23的步骤U58)。
(关于解码侧)
第5实施方式的音频信号处理装置具有与前述的图1的音频解码器1相同的结构,其特征在于音频码解码部,下面对音频码解码部进行说明。图24示出音频码解码部12E的功能结构例,图25示出LP系数的计算处理的流程。图24的音频码解码部12E相对于前述的图3的结构追加了不连续检测部129。
不连续检测部129对不连续判定码进行解码,将得到的不连续判定标志输出给ISF解码部120(图25的步骤S51)。
ISF解码部120根据不连续判定标志的值,按照下面所述计算ISF参数,将ISF参数输出给稳定性处理部121和内部状态缓存器14(图25的步骤S52)。
<不连续判定标志表示检测出不连续的情况>
ISF解码部120将对ISF码进行解码得到的量化ISF残差参数设为数式86,将事前通过学习而求出的平均向量设为meani,按照数式88求出量化ISF参数。
[数式86]
[数式87]
[数式88]
然后,ISF解码部120按照下式更新被存储在内部状态缓存器14中的ISF残差参数。
[数式89]
<不连续判定标志表示未检测出不连续的情况>
ISF解码部120从内部状态缓存器14读出在紧前面一帧中通过解码而得到的数式90所示的ISF残差参数,根据所得到的数式91所示的ISF残差参数、事前通过学习而求出的平均向量meani、以及对ISF码进行解码得到的数式92所示的量化ISF残差参数,按照数式94求出数式93所示的量化ISF参数。
[数式90]
[数式91]
[数式92]
[数式93]
[数式94]
然后,ISF解码部120按照下式更新被存储在内部状态缓存器14中的ISF残差参数。
[数式95]
稳定性处理部121进行与在第1实施方式中说明的未检测出不连续的情况一样的处理(图25的步骤S53)。
LP系数计算部122内的ISF-ISP变换部122A通过与第1实施方式一样的处理步骤,将ISF参数变换为ISP参数(图25的步骤S54)。
ISP插值部122B通过与第1实施方式一样的处理步骤,计算每个子帧的ISP参数(图25的步骤S55)。
ISP-LPC变换部122C通过与第1实施方式一样的处理步骤,将对每个子帧计算出的ISP参数变换为LPC参数(图25的步骤S56)。
在如上所述的第5实施方式中,在编码侧,在不连续判定标志表示未检测出不连续的情况下,使用在紧前面的一帧中通过解码而得到的ISF残差参数进行ISF残差参数的向量量化,而在不连续判定标志表示检测出不连续的情况下,避免使用在紧前面一帧中通过解码而得到的ISF残差参数。同样,在解码侧,在不连续判定标志表示未检测出不连续的情况下,使用在紧前面一帧中通过解码而得到的ISF残差参数计算量化ISF参数,而在不连续判定标志表示检测出不连续的情况下,避免使用在紧前面一帧中通过解码而得到的ISF残差参数。这样通过在编码侧和解码侧进行协作,能够执行与不连续判定结果对应的合适的处理。
[第6实施方式]
也可以将上述第1~第5实施方式进行组合。例如,也可以如第4实施方式记载的那样,在解码侧,对来自编码侧的音频码中包含的不连续判定码进行解码来检测不连续,在检测出不连续的情况下执行以下所述的步骤。
对于被存储在内部状态缓存器中的数式96所示的ISF参数,按照第3实施方式所述,利用数式97置换截止到低次P’维(0<P’≦P)的ISF参数。
[数式96]
[数式97]
另一方面,对于当前帧的ISF参数,按照第5实施方式所述根据下式进行计算。
[数式98]
以后,使用通过上述步骤求出的ISF参数,与第1实施方式一样地,通过ISF-ISP变换部122A、ISP插值部122B、ISP-LPC变换部122C的处理来求出LP系数。
如上所述,将第1~第5实施方式进行任意组合得到的方式也是有效的。
[第7实施方式]
在上述第1~第6实施方式及变形例中,也可以考虑解码侧的帧丢失的情况(例如,一个帧丢失或者连续帧丢失的情况)。另外,在第7实施方式中,对于不连续检测,例如可以使用对音频码中包含的不连续判定码进行解码的结果进行不连续检测,其方法不限于上述方法。
第7实施方式的音频信号处理装置具有与前述的图1的音频解码器1相同的结构,其特征在于音频码解码部,因而下面对音频码解码部进行说明。
图26示出第7实施方式的音频解码器1S的结构例,图27示出音频解码器的处理的流程图。如图26所示,音频解码器1S除了前述的音频码解码部12G、隐藏信号生成部13及内部状态缓存器14以外,还具有判定过去数帧中的分组接收状态并存储分组丢失履历的接收状态判定部16。
接收状态判定部16判定分组接收状态,根据判定结果更新分组丢失履历信息(图27的步骤S50)。
在检测出分组丢失的情况下(在步骤S100为“否”的情况下),接收状态判定部16将该帧的分组丢失检测结果输出给隐藏信号生成部13,隐藏信号生成部13进行前述的隐藏信号的生成及内部状态的更新(步骤S300、S400)。另外,隐藏信号生成部13也可以将分组丢失履历信息用于参数的插值等。
另一方面,在未检测出分组丢失的情况下(在步骤S100为“是”的情况下),接收状态判定部16将包括该帧的分组丢失检测结果的分组丢失履历信息、和接收分组中包含的音频码,输出给音频码解码部12,音频码解码部12进行前述的音频码的解码及内部状态的更新(步骤S200、S400)。
以后,反复步骤S50~S400的处理一直到通信结束为止(一直到在步骤S500判定为是为止)。
图28示出音频码解码部12G的功能结构例,图29示出LP系数的计算处理的流程。在此,对仅在LP系数计算部122使用分组丢失履历信息的示例进行说明,但也可以构成为将分组丢失履历信息输入其它的构成要素并使用。
在音频码解码部12G中,除了有关LP系数的计算处理的结构以外,其它结构与第1实施方式相同,因而下面说明有关LP系数的计算处理的结构及动作。
ISF解码部120与第1实施方式一样地对ISF码进行解码,并向稳定性处理部121输出ISF参数(图29的步骤S71)。
不连续检测部129参照分组丢失履历信息判定接收状态(步骤S72)。例如也可以是,不连续检测部129预先存储诸如3帧前为分组丢失、2帧前为正常接收、1帧前为分组丢失这样特定的接收模式,在出现了相应的接收模式的情况下,将接收状态标志设为OFF,在除此以外的情况时将接收状态标志设为ON。
另外,不连续检测部129与前述的第1~第6实施方式中任意一个方式的方法一样地进行不连续检测。
并且,稳定性处理部121例如按照以下所述,按照接收状态标志及不连续检测的结果进行稳定性处理(步骤S73)。
在接收状态标志为OFF的情况下,无论不连续检测的结果怎样,稳定性处理部121都进行与未检测出不连续时一样的处理。
另一方面,在接收状态标志为ON、而且不连续检测的结果是未检测出不连续的情况下,稳定性处理部121进行与未检测出不连续时一样的处理。
另外,在接收状态标志为ON、而且不连续检测的结果是检测出不连续的情况下,稳定性处理部121进行与检测出不连续时一样的处理。
以后,LP系数计算部122内的ISF-ISP变换部122A、ISP插值部122B及ISP-LPC变换部122C的动作(步骤S74~S76)与第1实施方式一样。
在如上所述的第7实施方式中,通过进行与不连续检测的结果和接收状态标志的状态对应的稳定性处理,能够执行考虑了帧丢失的状况(例如一个帧丢失或者连续帧丢失的情况)的精度更加良好的处理。
[关于音频信号处理程序]
下面,对使计算机作为本发明的音频信号处理装置进行动作的音频信号处理程序进行说明。
图32是示出音频信号处理程序的各种结构例的图。图30是示出计算机的硬件结构例的图,图31是计算机的外观图。在图32的(a)~(d)分别示出的音频信号处理程序P1~P4(以下统称为“音频信号处理程序P”)能够使图31和图32所示的计算机C10作为音频信号处理装置进行动作。另外,在本说明书中说明的音频信号处理程序P不限于如图31和图32所示的计算机,也能够使移动电话、便携信息终端、便携式个人电脑这样任意的信息处理装置按照该音频信号处理程序P进行动作。
音频信号处理程序P被存储在记录介质M中进行提供。另外,作为记录介质M,示例了软盘、CD-ROM、DVD、或者ROM等记录介质、或者半导体存储器等。
如图30所示,计算机C10具有软盘驱动装置、CD-ROM驱动装置、DVD驱动装置等的读取装置C12、作业用存储器(RAM)C14、存储在记录介质M中存储的程序的存储器C16、显示器C18、作为输入装置的鼠标C20及键盘C22、用于进行数据等的发送接收的通信装置C24、控制程序的执行的中央运算部(CPU)C26。
在记录介质M被插入读取装置C12时,计算机C10能够从读取装置C12访问被存储在记录介质M中的音频信号处理程序P,通过音频信号处理程序P能够作为音频信号处理装置进行动作。
音频信号处理程序P也可以如图31所示作为被叠加在载波中的计算机数据信号W经由网络进行提供。在这种情况下,计算机C10将通过通信装置C24接收到的音频信号处理程序P存储在存储器C16中,并能够执行音频信号处理程序P。
音频信号处理程序P能够采用图32的(a)~(d)所示的各种结构。这些结构分别对应于在权利要求书中记载的有关音频信号处理程序P的权利要求18~21的结构。例如,图32(a)所示的音频信号处理程序P1具有不连续估计模块P11和不连续修正模块P12。图32(b)所示的音频信号处理程序P2具有ISF/LSF量化模块P21、ISF/LSF隐藏模块P22、不连续估计模块P23和辅助信息编码模块P24。图32(c)所示的音频信号处理程序P3具有不连续估计模块P31、辅助信息编码模块P32和ISF/LSF量化模块P33。图32(d)所示的音频信号处理程序P4具有辅助信息解码模块P41、不连续修正模块P42和ISF/LSF解码模块P43。
根据以上说明的各种实施方式,能够降低在从音频开始时刻的分组丢失恢复时产生的不连续声音,改善主观品质。
作为发明的第一个特征的稳定性处理部,当在分组丢失后第一个正常接收到的分组中检测出不连续的情况下,例如通过使对ISF参数的各要素之间赋予的间隔大于通常情况时,能够防止LP系数的增益过大。由于能够防止LP系数的增益和激励信号的功率都增加,因而能够减少合成信号的不连续,降低主观品质劣化。另外,也可以是,稳定性处理部将利用LP系数等计算出的增益与合成信号相乘,由此减少合成信号的不连续。
另外,作为发明的第二个特征的不连续检测器监视在分组丢失后第一个正常接收到的分组中包含的激励信号的增益,对于在激励信号的增益中产生了固定值以上的增加的分组估计不连续性。
标号说明
1、1S、1X音频解码器;11分组丢失检测部;12、12A、12B、12C、12D、12E、12G、12S音频码解码部;13、13X隐藏信号生成部;14内部状态缓存器;15归一化预测误差功率解码部;16接收状态判定部;21、21S分析/编码部;22残差编码部;23码复用部;120ISF解码部;121、121S稳定性处理部;121X增益调整部;121Y增益相乘部;122LP系数计算部;122A ISF-ISP变换部;122B ISP插值部;122CISP-LPC变换部;123自适应码本计算部;124固定码本解码部;125增益解码部;126激励向量合成部;127主滤波器;128合成滤波器;129不连续检测部;130LP系数插值部;131基音滞后插值部;132增益插值部;133噪声信号生成部;134主滤波器;135合成滤波器;136自适应码本计算部;137激励向量合成部;138归一化预测残差调整部;210LP分析部;211LP-ISF变换部;212ISF编码部;213不连续判定部;214ISF隐藏部;215ISF-LP变换部;216ISF缓存器;C10计算机;C12读取装置;C14作业用存储器;C16存储器;C18显示器;C20鼠标;C22键盘;C24通信装置;C26 CPU;M记录介质;P1~P4音频信号处理程序;P11不连续估计模块;P12不连续修正模块;P21 ISF/LSF量化模块;P22 ISF/LSF隐藏模块;P23不连续估计模块;P24辅助信息编码模块;P31不连续估计模块;P32辅助信息编码模块;P33 ISF/LSF量化模块;P41辅助信息解码模块;P42不连续修正模块;P43 ISF/LSF解码模块。
Claims (8)
1.一种由音频信号处理装置执行的音频信号处理方法,该音频信号处理方法包括以下步骤:
由所述音频信号处理装置对音频分组进行解码以获得解码音频和导抗谱频率ISF/线谱频率LSF参数;
由所述音频信号处理装置估计所述解码音频的振幅的急剧增大,所述音频分组是在产生分组丢失后第一个正常接收到的音频分组;以及
由所述音频信号处理装置对所述解码音频的振幅的急剧增大进行缓解,其中,
缓解所述解码音频的振幅的急剧增大的步骤包括:改变所述ISF/LSF参数的各要素间的间隔。
2.根据权利要求1所述的音频信号处理方法,其中,
估计所述解码音频的振幅的急剧增大包括:
根据所述解码音频的激励信号的功率估计所述解码音频的振幅的急剧增大。
3.根据权利要求1所述的音频信号处理方法,其中,
估计所述解码音频的振幅的急剧增大包括:
根据在所述解码音频的激励信号的计算中使用的被量化后的码本增益来估计所述解码音频的振幅的急剧增大。
4.根据权利要求1所述的音频信号处理方法,其中,
估计所述解码音频的振幅的急剧增大包括:
根据所述解码音频的激励信号的增益的增大超过预定水平来估计所述解码音频的振幅的急剧增大。
5.根据权利要求1所述的音频信号处理方法,其中,
估计所述解码音频的振幅的急剧增大包括:
对所述音频分组中包含的辅助信息进行解码,所述辅助信息包含所述解码音频的振幅的急剧增大的估计。
6.一种音频信号处理装置,其包括:
中央处理单元;
由所述中央处理单元执行的不连续估计器,其估计解码音频的振幅的急剧增大,所述解码音频是对在产生分组丢失后第一个正常接收到的音频分组进行解码而得到的;以及
由所述中央处理单元执行的不连续修正器,其对所述解码音频的振幅的急剧增大进行缓解,其中,
所述不连续修正器还进一步由所述中央处理单元执行,以根据振幅的急剧增大的估计结果来改变通过对所述第一个正常接收到的音频分组进行解码而获得的导抗谱频率ISF/线谱频率LSF参数的各要素间的距离。
7.一种由音频信号处理装置执行的音频信号处理方法,该音频信号处理方法包括以下步骤:
在对音频信号编码的过程中对导抗谱频率ISF/线谱频率LSF参数进行量化以获得量化ISF/LSF参数;
生成隐藏ISF/LSF参数,所述隐藏ISF/LSF参数是有关所述ISF/LSF参数的隐藏信息;
估计所述音频信号的振幅的急剧增大,所述振幅的急剧增大出现在产生分组丢失后第一个正常接收到的音频分组中,其中,估计所述音频信号的振幅的急剧增大包括:使用量化ISF/LSF参数与生成的隐藏ISF/LSF参数之间的距离来估计所述音频信号的振幅的急剧增大;以及
对辅助信息进行编码,所述辅助信息表示所述音频信号的振幅的急剧增大的估计。
8.一种音频信号处理装置,其包括:
导抗谱频率ISF/线谱频率LSF量化器,其对音频信号的ISF/LSF参数进行量化以生成量化ISF/LSF参数;
ISF/LSF隐藏器,其生成隐藏ISF/LSF参数,所述隐藏ISF/LSF参数是有关ISF/LSF参数的隐藏信息;
不连续估计器,其估计所述音频信号的振幅的急剧增大,所述振幅的急剧增大出现在产生分组丢失后第一个正常接收到的音频分组中,所述不连续估计器使用量化ISF/LSF参数与由所述ISF/LSF隐藏器生成的隐藏ISF/LSF参数之间的距离来估计所述音频信号的振幅的急剧增大;以及
辅助信息编码器,其对辅助信息进行编码,所述辅助信息表示所述音频信号的振幅的急剧增大的估计。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013224120A JP5981408B2 (ja) | 2013-10-29 | 2013-10-29 | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
JPJP2013-224120 | 2013-10-29 | ||
PCT/JP2014/077215 WO2015064346A1 (ja) | 2013-10-29 | 2014-10-10 | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
CN201480041188.2A CN105393303B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法及音频信号处理程序 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480041188.2A Division CN105393303B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法及音频信号处理程序 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110164457A CN110164457A (zh) | 2019-08-23 |
CN110164457B true CN110164457B (zh) | 2023-01-03 |
Family
ID=53003956
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910588808.9A Active CN110176239B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法 |
CN201910588571.4A Active CN110164457B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法 |
CN201480041188.2A Active CN105393303B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法及音频信号处理程序 |
CN201910588809.3A Pending CN110164458A (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置以及音频信号处理方法 |
CN201910588824.8A Active CN110265045B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置 |
CN201910588565.9A Active CN110164456B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法及存储介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910588808.9A Active CN110176239B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480041188.2A Active CN105393303B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法及音频信号处理程序 |
CN201910588809.3A Pending CN110164458A (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置以及音频信号处理方法 |
CN201910588824.8A Active CN110265045B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置 |
CN201910588565.9A Active CN110164456B (zh) | 2013-10-29 | 2014-10-10 | 音频信号处理装置、音频信号处理方法及存储介质 |
Country Status (21)
Country | Link |
---|---|
US (5) | US9799344B2 (zh) |
EP (5) | EP3065134B1 (zh) |
JP (1) | JP5981408B2 (zh) |
KR (5) | KR102036704B1 (zh) |
CN (6) | CN110176239B (zh) |
AU (5) | AU2014341476B2 (zh) |
BR (2) | BR122017020760B1 (zh) |
CA (4) | CA3081225C (zh) |
DK (3) | DK3528247T3 (zh) |
ES (2) | ES2732440T3 (zh) |
FI (2) | FI3528247T3 (zh) |
HK (1) | HK1223188A1 (zh) |
HU (1) | HUE063871T2 (zh) |
MX (1) | MX347234B (zh) |
MY (3) | MY179197A (zh) |
PL (2) | PL3065134T3 (zh) |
PT (3) | PT3065134T (zh) |
RU (5) | RU2651234C2 (zh) |
SG (1) | SG11201600542VA (zh) |
TR (1) | TR201909126T4 (zh) |
WO (1) | WO2015064346A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
JP6914390B2 (ja) * | 2018-06-06 | 2021-08-04 | 株式会社Nttドコモ | 音声信号処理方法 |
CN110111805B (zh) * | 2019-04-29 | 2021-10-29 | 北京声智科技有限公司 | 远场语音交互中的自动增益控制方法、装置及可读存储介质 |
FR3100061B1 (fr) * | 2019-08-22 | 2021-07-30 | Thales Sa | Procede de determination d'une distance de vol d'un aeronef sur un segment de discontinuite, procede de determination d'une trajectoire, produit programme d'ordinateur et module de determination associes |
CN114613372B (zh) * | 2022-02-21 | 2022-10-18 | 北京富通亚讯网络信息技术有限公司 | 一种音频传输抗丢包的错误隐藏技术方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659625A (zh) * | 2002-05-31 | 2005-08-24 | 沃伊斯亚吉公司 | 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件 |
WO2008056775A1 (fr) * | 2006-11-10 | 2008-05-15 | Panasonic Corporation | Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre |
CN102947881A (zh) * | 2010-06-21 | 2013-02-27 | 松下电器产业株式会社 | 解码装置、编码装置和解码方法、编码方法 |
CN103229234A (zh) * | 2010-11-22 | 2013-07-31 | 株式会社Ntt都科摩 | 音频编码装置、方法和程序以及音频解码装置、方法和程序 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970011728B1 (ko) * | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
US6178317B1 (en) * | 1997-10-09 | 2001-01-23 | Ibiquity Digital Corporation | System and method for mitigating intermittent interruptions in an audio radio broadcast system |
US6775649B1 (en) * | 1999-09-01 | 2004-08-10 | Texas Instruments Incorporated | Concealment of frame erasures for speech transmission and storage system and method |
AU7486200A (en) * | 1999-09-22 | 2001-04-24 | Conexant Systems, Inc. | Multimode speech encoder |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
JP2001228896A (ja) * | 2000-02-14 | 2001-08-24 | Iwatsu Electric Co Ltd | 欠落音声パケットの代替置換方式 |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
US7031926B2 (en) | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
US7590525B2 (en) * | 2001-08-17 | 2009-09-15 | Broadcom Corporation | Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
JP4445328B2 (ja) * | 2004-05-24 | 2010-04-07 | パナソニック株式会社 | 音声・楽音復号化装置および音声・楽音復号化方法 |
KR100723409B1 (ko) * | 2005-07-27 | 2007-05-30 | 삼성전자주식회사 | 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치 |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8798172B2 (en) * | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
TWI467979B (zh) * | 2006-07-31 | 2015-01-01 | Qualcomm Inc | 用於信號改變偵測之系統、方法及裝置 |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US7796626B2 (en) * | 2006-09-26 | 2010-09-14 | Nokia Corporation | Supporting a decoding of frames |
KR100862662B1 (ko) * | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
KR101291193B1 (ko) * | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
BRPI0808200A8 (pt) | 2007-03-02 | 2017-09-12 | Panasonic Corp | Dispositivo de codificação de áudio e dispositivo de decodificação de áudio |
CN101542593B (zh) * | 2007-03-12 | 2013-04-17 | 富士通株式会社 | 语音波形内插装置及方法 |
JP5021809B2 (ja) * | 2007-06-08 | 2012-09-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | アンビエンス信号成分とマトリックスデコードされた信号成分とを制御可能に結合することによるサラウンドサウンドオーディオチャンネルのハイブリッド導出 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
CN101894558A (zh) * | 2010-08-04 | 2010-11-24 | 华为技术有限公司 | 丢帧恢复方法、设备以及语音增强方法、设备和系统 |
JP5694745B2 (ja) * | 2010-11-26 | 2015-04-01 | 株式会社Nttドコモ | 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
-
2013
- 2013-10-29 JP JP2013224120A patent/JP5981408B2/ja active Active
-
2014
- 2014-10-10 CN CN201910588808.9A patent/CN110176239B/zh active Active
- 2014-10-10 HU HUE19167229A patent/HUE063871T2/hu unknown
- 2014-10-10 CN CN201910588571.4A patent/CN110164457B/zh active Active
- 2014-10-10 WO PCT/JP2014/077215 patent/WO2015064346A1/ja active Application Filing
- 2014-10-10 FI FIEP19167229.4T patent/FI3528247T3/fi active
- 2014-10-10 TR TR2019/09126T patent/TR201909126T4/tr unknown
- 2014-10-10 KR KR1020197009868A patent/KR102036704B1/ko active IP Right Grant
- 2014-10-10 ES ES14857728T patent/ES2732440T3/es active Active
- 2014-10-10 DK DK19167229.4T patent/DK3528247T3/da active
- 2014-10-10 KR KR1020197030949A patent/KR102155618B1/ko active IP Right Grant
- 2014-10-10 RU RU2016120629A patent/RU2651234C2/ru active
- 2014-10-10 EP EP14857728.1A patent/EP3065134B1/en active Active
- 2014-10-10 PL PL14857728T patent/PL3065134T3/pl unknown
- 2014-10-10 AU AU2014341476A patent/AU2014341476B2/en active Active
- 2014-10-10 EP EP19167220.3A patent/EP3528246A1/en active Pending
- 2014-10-10 CN CN201480041188.2A patent/CN105393303B/zh active Active
- 2014-10-10 EP EP24178190.5A patent/EP4398504A3/en active Pending
- 2014-10-10 CA CA3081225A patent/CA3081225C/en active Active
- 2014-10-10 FI FIEP19167283.1T patent/FI3528248T3/fi active
- 2014-10-10 KR KR1020177032708A patent/KR101978997B1/ko active IP Right Grant
- 2014-10-10 EP EP19167229.4A patent/EP3528247B1/en active Active
- 2014-10-10 DK DK14857728.1T patent/DK3065134T3/da active
- 2014-10-10 PT PT14857728T patent/PT3065134T/pt unknown
- 2014-10-10 BR BR122017020760-1A patent/BR122017020760B1/pt active IP Right Grant
- 2014-10-10 KR KR1020177020417A patent/KR101798635B1/ko active IP Right Grant
- 2014-10-10 ES ES19167229T patent/ES2959667T3/es active Active
- 2014-10-10 CA CA3002931A patent/CA3002931C/en active Active
- 2014-10-10 CA CA2918715A patent/CA2918715C/en active Active
- 2014-10-10 BR BR112016003291-8A patent/BR112016003291B1/pt active IP Right Grant
- 2014-10-10 PT PT191672294T patent/PT3528247T/pt unknown
- 2014-10-10 MX MX2016005162A patent/MX347234B/es active IP Right Grant
- 2014-10-10 CN CN201910588809.3A patent/CN110164458A/zh active Pending
- 2014-10-10 DK DK19167283.1T patent/DK3528248T3/da active
- 2014-10-10 RU RU2018112250A patent/RU2682927C2/ru active
- 2014-10-10 SG SG11201600542VA patent/SG11201600542VA/en unknown
- 2014-10-10 CN CN201910588824.8A patent/CN110265045B/zh active Active
- 2014-10-10 PL PL19167229.4T patent/PL3528247T3/pl unknown
- 2014-10-10 CA CA3168576A patent/CA3168576A1/en active Pending
- 2014-10-10 RU RU2018112249A patent/RU2680748C1/ru active
- 2014-10-10 MY MYPI2016700196A patent/MY179197A/en unknown
- 2014-10-10 CN CN201910588565.9A patent/CN110164456B/zh active Active
- 2014-10-10 PT PT191672831T patent/PT3528248T/pt unknown
- 2014-10-10 KR KR1020167002244A patent/KR101764234B1/ko active Application Filing
- 2014-10-10 EP EP19167283.1A patent/EP3528248B8/en active Active
-
2016
- 2016-01-19 MY MYPI2018702836A patent/MY191134A/en unknown
- 2016-01-19 MY MYPI2018702837A patent/MY191135A/en unknown
- 2016-04-28 US US15/141,346 patent/US9799344B2/en active Active
- 2016-09-23 HK HK16111241.6A patent/HK1223188A1/zh unknown
-
2017
- 2017-07-06 AU AU2017204606A patent/AU2017204606B2/en active Active
- 2017-09-15 US US15/706,474 patent/US10152982B2/en active Active
-
2018
- 2018-10-17 US US16/163,118 patent/US10621999B2/en active Active
- 2018-12-04 AU AU2018274861A patent/AU2018274861B2/en active Active
-
2019
- 2019-02-11 RU RU2019103676A patent/RU2701075C1/ru active
- 2019-03-14 RU RU2019107149A patent/RU2707727C1/ru active
-
2020
- 2020-04-09 US US16/844,653 patent/US11270715B2/en active Active
- 2020-12-24 AU AU2020294314A patent/AU2020294314B2/en active Active
-
2021
- 2021-12-29 AU AU2021290404A patent/AU2021290404B2/en active Active
-
2022
- 2022-01-13 US US17/575,321 patent/US11749291B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659625A (zh) * | 2002-05-31 | 2005-08-24 | 沃伊斯亚吉公司 | 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件 |
WO2008056775A1 (fr) * | 2006-11-10 | 2008-05-15 | Panasonic Corporation | Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre |
CN102947881A (zh) * | 2010-06-21 | 2013-02-27 | 松下电器产业株式会社 | 解码装置、编码装置和解码方法、编码方法 |
CN103229234A (zh) * | 2010-11-22 | 2013-07-31 | 株式会社Ntt都科摩 | 音频编码装置、方法和程序以及音频解码装置、方法和程序 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2701075C1 (ru) | Устройство обработки аудиосигнала, способ обработки аудиосигнала и программа обработки аудиосигнала | |
JP6914390B2 (ja) | 音声信号処理方法 | |
JP6691169B2 (ja) | 音声信号処理方法及び音声信号処理装置 | |
JP6133454B2 (ja) | 音声信号処理方法及び音声信号処理装置 | |
JP6352487B2 (ja) | 音声信号処理方法及び音声信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |