CN106575507A - 用于处理音频信号的方法和装置,音频解码器和音频编码器 - Google Patents
用于处理音频信号的方法和装置,音频解码器和音频编码器 Download PDFInfo
- Publication number
- CN106575507A CN106575507A CN201580040572.5A CN201580040572A CN106575507A CN 106575507 A CN106575507 A CN 106575507A CN 201580040572 A CN201580040572 A CN 201580040572A CN 106575507 A CN106575507 A CN 106575507A
- Authority
- CN
- China
- Prior art keywords
- filtered
- filter
- frame
- present frame
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 230000005236 sound signal Effects 0.000 title claims abstract description 76
- 238000012545 processing Methods 0.000 title claims description 30
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000001914 filtration Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 230000007423 decrease Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 230000001052 transient effect Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000007774 longterm Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
- H04B1/1027—Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Stereophonic System (AREA)
Abstract
描述了一种处理音频信号(100)的方法,使用线性预测滤波(102、110、112)来去除音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性。
Description
技术领域
本发明涉及音频信号领域,更具体地涉及用于处理包括多个音频帧的音频信号的方法,其中减少或省略了相继的经滤波的音频帧之间的不连续性。
背景技术
在音频信号处理的领域中,可以出于各种原因来对音频信号进行滤波,例如,可以在音频信号编码器中使用长期预测滤波器,以衰减或甚至完全抑制音频信号中的一组谐波。
音频信号包括多个音频帧,并且使用长期预测滤波器对帧进行滤波。当考虑音频信号的两个相继帧,过去帧和当前帧时,使用具有一组参数c的线性滤波器H(z)来对音频信号进行滤波。更具体地,使用第一组参数c0,用滤波器H(z)对过去帧进行滤波,这将产生所谓的经滤波的过去帧。使用一组参数c1,用滤波器H(z)对当前帧进行滤波,这将产生经滤波的当前帧。图1示出了根据已知方法处理音频信号的相继帧的框图。提供了包括多个音频帧的音频信号100。音频信号100被供应给滤波器块102,并且音频信号100的当前帧n被滤波。滤波器块除了音频信号100之外还接收用于音频信号的当前帧的一组滤波器参数cn。滤波器块102对音频信号的当前帧n进行滤波,并输出包括相继的经滤波的帧在内的经滤波的音频信号104。在图1,示意性地描绘了经滤波的当前帧n、经滤波的过去帧n-1和经滤波的倒数第二帧n-2。在图1中示意性地表示了经滤波的帧,其间具有相应的间隙,用于示意性地指示可能由于滤波处理而在经滤波的帧之间引入的不连续性106a、106b。滤波器块102引起使用用于过去帧n-1和当前帧n的相应滤波器参数c0和c1对音频信号的帧的滤波。通常,滤波器块102可以是线性滤波器H(z),并且这种线性滤波器H(z)的一个示例是上述长期预测滤波器。
H(z)=1-g·z-T
其中滤波器参数是增益“g”和音调滞后“T”。在更一般的形式中,长期预测滤波器可以描述如下:
H(z)=1-g·A(z)·z-T
其中A(z)是FIR滤波器。长期预测滤波器可以用于衰减或甚至完全抑制音频信号中的一组谐波。然而,当使用这样的长期预测滤波器时,以及当过去帧滤波器参数c0不同于当前帧滤波器参数c1时,很有可能在经滤波的过去帧n-1和经滤波的当前帧n之间引入不连续性106a、106b(见图1)。这种不连续性可能在经滤波的音频信号104中产生伪像,例如“滴答声(click)”。
因此,考虑到上述的对相继帧的滤波导致不连续性,而不连续性进而可能产生不期望的伪像的问题,需要去除可能的不连续性的技术。涉及去除音频信号的经滤波的帧的不连续性的几种现有技术方法在本领域中是已知的。
在线性滤波器H(z)是FIR滤波器的情况下,用当前帧的滤波器参数c1来对当前帧进行滤波,以产生经滤波的当前帧。另外,利用过去帧的滤波器参数c0对当前帧的开始部分进行滤波以产生经滤波的帧部分,然后相对于经滤波的当前帧的开始部分和经滤波的帧部分执行重叠相加(overlap-add)或交叉淡化(cross-fade)操作。图2示出了用于处理相继音频帧以去除不连续性的这种常规方法的框图。与图1相比,滤波器块102包括用于执行重叠相加或交叉淡出操作的另一处理块108。在经滤波的音频信号104中,相继的经滤波的帧之间的不连续性将不存在或减少,如图2中示意性所示,图2示出了相继的经滤波的帧n、n-1和n-2,而且没有图1的间隙。
在其他现有技术方法中,滤波器H(z)可以是具有递归部的滤波器,例如IIR滤波器。在这种情况下,在逐个样本的基础上应用上面关于图2描述的方法。在第一步骤中,处理始于利用过去帧n-1的滤波器参数c0对当前帧n的开始部分的第一个样本进行滤波,产生第一经滤波样本。该样本还利用当前帧n的滤波器参数c1来进行滤波,产生第二经滤波样本。然后,基于第一和第二经滤波样本来执行重叠相加或交叉淡出操作,这产生经滤波的当前帧n的对应样本。然后,处理下一个样本,并且重复上述步骤,直到当前帧n的开始部分的最后一个样本已经被处理为止。用当前帧n的滤波器参数c1对当前帧n的剩余样本进行滤波。
用于从相继经滤波的帧中去除不连续性的上述已知方法的示例例如在US 5,012,517 A中在变换编码器的上下文中描述,在EP 0732687 A2中在语音带宽扩展器的上下文中描述,在US 5,999,899 A中在变换音频编码器的上下文中描述,或在US 7,353,168 B2中在解码语音后置滤波器的上下文中描述。
虽然上述方法对于去除不期望的信号不连续性是有效的,但是由于这些方法为了有效起见对当前帧的特定部分即开始部分进行操作,该帧部分的长度必须足够长,例如在帧长度为20ms的情况下,该帧部分或开始部分长度可以长达5ms。在某些情况下,这可能太长了,特别是在过去帧滤波器参数c0将不能很好地应用于当前帧的情况下,并且这可能导致附加的伪像。一个示例是音调(pitch)快速改变的谐波音频信号,以及被设计为减小谐波的幅度的长期预测滤波器。在这种情况下,音调滞后(pitch-lag)从一帧到下一帧是不同的。具有在当前帧中估计的音调的长期预测滤波器将有效地减小当前帧中的谐波的幅度,但是如果在另一帧(例如,下一帧的开始部分)(音频信号的音调将不同)中使用,则它将不会减小谐波的幅度。这可能减小信号中非谐波相关分量的幅度,在信号中引入失真,从而甚至使情况更糟。
发明内容
本发明的目的是提供一种用于去除经滤波的音频帧之中的不连续性而不在经滤波的音频信号中产生任何潜在失真的改进方法。
该目的通过根据独立权利要求的方法和装置来实现。
本发明提供一种用于处理音频信号的方法,所述方法包括使用线性预测滤波去除所述音频信号的经滤波的过去帧与经滤波的当前帧之间的不连续性。
线性预测滤波器可以定义为
其中M是滤波器阶数,并且am是滤波器系数(其中a0=1)。这种滤波器也被称为线性预测编码(LPC)。
根据实施例,所述方法包括:对所述音频信号的当前帧进行滤波,并且通过用以下信号修改经滤波的当前帧的开始部分来去除不连续性,所述信号通过对预定义信号进行线性预测滤波来获得,其中线性预测编码滤波器的初始状态基于过去帧的最后部分来定义。
根据实施例,所述线性预测滤波器的初始状态基于未经滤波的过去帧的最后部分来定义,其中,对所述未经滤波的过去帧的最后部分使用用于对当前帧进行滤波的滤波器参数集合来滤波。
根据实施例,所述方法包括在经滤波或未滤波的音频信号上估计线性预测滤波器。
根据实施例,估计线性预测滤波器包括使用Levinson-Durbin算法,基于音频信号的过去经滤波的帧或基于音频信号的过去帧或当前帧来估计滤波器。
根据实施例,线性预测滤波器包括音频编解码器的线性预测滤波器。
根据实施例,去除所述不连续性包括处理所述经滤波的当前帧的开始部分,其中,所述当前帧的开始部分具有小于或等于所述当前帧的样本总数的预定义数量的样本,并且其中,处理所述当前帧的开始部分包括从所述经滤波的当前帧的开始部分中减去零输入响应(ZIR)的开始部分。
根据实施例,所述方法包括使用非递归滤波器(如FIR滤波器)对音频信号的当前帧进行滤波,以产生经滤波的当前帧。
根据实施例,所述方法包括使用如IIR滤波器的递归滤波器逐样本地处理音频信号的未经滤波的当前帧,并且其中,处理当前帧的开始部分的样本包括:
使用递归滤波器,用当前帧的滤波器参数对样本进行滤波以产生经滤波的样本,以及
从经滤波的样本中减去对应的ZIR样本,以产生经滤波的当前帧的对应样本。
根据实施例,重复滤波和减去,直到处理了当前帧的开始部分中的最后一个样本为止,并且其中所述方法还包括使用递归滤波器,用当前帧的滤波器参数对当前帧中的剩余样本进行滤波。
根据实施例,所述方法包括生成ZIR,其中生成ZIR包括:
利用滤波器和用于对当前帧进行滤波的滤波器参数对未经滤波的过去帧的最后M个样本进行滤波,以产生经滤波的信号的第一部分,其中M是线性预测滤波器阶数,
从经滤波的信号的第一部分中减去使用过去帧的滤波器参数滤波的经滤波的过去帧的最后M个样本,以生成经滤波信号的第二部分,以及
通过用线性预测滤波器和等于经滤波信号的第二部分的初始状态对零样本的帧进行滤波来生成线性预测滤波器的ZIR。
根据实施例,所述方法包括对ZIR进行加窗,使得其幅度更快地降低到零。
本发明基于发明人的以下发现:在去除信号不连续性并导致上述附加的不想要的失真的常规方法中认识到的问题主要是因为基于过去帧的滤波器参数对当前帧或当前帧的至少一部分进行处理。根据本发明的方法,这被避免,即本发明的方法不用过去帧的滤波器参数来对当前帧的一部分进行滤波,从而避免了上述问题。根据实施例,为了去除不连续性,使用LPC滤波器(线性预测滤波器)来去除不连续性。LPC滤波器可以在音频信号上估计,因此它是音频信号的频谱形状的良好模型,使得当使用LPC滤波器时,音频信号的频谱形状将掩蔽不连续性。在实施例中,可以基于未经滤波的音频信号或基于已经由上述线性滤波器H(z)滤波的音频信号来估计LPC滤波器。根据实施例,可以通过使用音频信号(例如当前帧和/或过去帧)和Levinson-Durbin算法来估计LPC滤波器。它也可以使用Levinson-Durbin算法仅基于过去的经滤波的帧信号来计算。
在其它实施例中,用于处理音频信号的音频编解码器可以使用线性滤波器H(z),并且还可以使用量化或未量化的LPC滤波器,例如以在基于变换的音频编解码器中整形量化噪声。在这样的实施例中,这种现有LPC滤波器可以直接用于平滑不连续性,而没有估计新的LPC滤波器所需的附加复杂度。
附图说明
在下文中,将参照附图描述本发明的实施例,在附图中:
图1示出了根据常规方法处理音频信号的相继帧的框图,
图2示出了用于处理相继音频帧以去除不连续性的另一常规方法的框图,
图3示出了用于发送音频信号的系统的简化框图,其实现在编码器侧和/或在解码器侧的用于去除音频信号的相继帧之间的不连续性的本发明方法,
图4示出了描绘根据实施例的用于去除音频信号的相继帧之间的不连续性的本发明方法的流程图,
图5示出了根据本发明实施例的用于处理当前音频帧的示意性框图,其避免了输出信号中的不期望的失真,尽管去除了不连续性,
图6示出了表示图5中用于生成ZIR的块的功能的流程图,
图7示出了表示用于在滤波器块包括如MR滤波器的递归滤波器的情况下处理经滤波的当前帧的开始部分的图5中的块的功能的流程图,
图8示出了表示用于在滤波器块包括如FIR滤波器的非递归滤波器的情况下处理经滤波的当前帧的开始部分的图5中的块的功能的流程图。
具体实施方式
在下文中,将更详细地描述本发明方法的实施例,并且注意,在附图中,具有相同或类似功能的元件由相同的附图标记表示。
图3示出了用于在编码器侧和/或在解码器侧发送实现本发明方法的音频信号的系统的简化框图。图3的系统包括在输入202处接收音频信号204的编码器200。编码器包括编码处理器206,其接收音频信号204并生成在编码器的输出208处提供的经编码的音频信号。编码处理器可以被编程或构建为实现本发明的用于处理接收的音频信号的相继音频帧以避免不连续性的方法。然而,在其他实施例中,编码器不必是传输系统的一部分,它可以是生成经编码的音频信号的独立设备,或者它可以是音频信号发送器的一部分。根据实施例,编码器200可以包括天线210,以允许音频信号的无线传输,如212所示。在其他实施例中,编码器200可以使用有线连接线路输出在输出208处提供的经编码的音频信号,例如如附图标记214所示。
图3的系统还包括解码器250,所述解码器具有例如经由有线线路214或经由天线254接收要由编码器250处理的经编码的音频信号的输入252。编码器250包括对经编码的信号进行操作并在输出260处提供经解码的音频信号258的解码处理器256。解码处理器256可以被实现为根据本发明的方法对相继帧进行操作,所述相继帧以避免不连续性的方式被滤波。在其他实施例中,解码器不必是传输系统的一部分,相反,可以是用于对经编码的音频信号进行解码的独立设备,或者可以是音频信号接收器的一部分。
在下文中,将更详细地描述可以在编码处理器206和解码处理器256中的至少一个中实现的本发明方法的实施例。图4示出了根据本发明方法的实施例的用于处理音频信号的当前帧的流程图。将描述当前帧的处理,并且假设过去帧已经用下面描述的相同技术处理。根据本发明,在步骤S100中,接收音频信号的当前帧。在步骤S102中,以例如上面参照图1和2所述的方式(见滤波块102)对当前帧进行滤波。根据本发明的方法,将使用如在步骤S104处所示的线性预测滤波来去除经滤波的过去帧n-1和经滤波的当前帧n(见图1或2)之间的不连续性。根据实施例,线性预测滤波器可以定义为
其中,M是滤波器阶数,am是滤波器系数(其中a0=1)。这种滤波器也被称为线性预测编码(LPC)。根据实施例,通过对经滤波的当前帧的至少一部分应用线性预测滤波来处理经滤波的当前帧。可以通过用以下信号修改经滤波的当前帧的开始部分来去除不连续性,所述信号通过对预定义信号进行线性预测滤波来获得,其中线性预测编码滤波器的初始状态基于过去帧的最后部分来定义。线性预测编码滤波器的初始状态可以基于使用用于当前帧的滤波器参数集合进行滤波的过去帧的最后部分来定义。本发明的方法是有利的,因为其不需要用用于过去帧的滤波器系数对音频信号的当前帧进行滤波,从而避免了因用于当前帧的滤波器参数和用于过去帧的滤波器参数的不匹配而产生的问题,在上面参考图2描述的现有技术方法中经历了该问题。
图5示出了根据本发明的实施例的用于处理音频信号的当前音频帧的示意性框图,其避免了输出信号中的不期望的失真,尽管去除了不连续性。在图5中,使用了和图1和2中相同的附图标记。接收音频信号100的当前帧n,音频信号100的每一个帧具有多个样本。音频信号100的当前帧n由滤波器块102处理。与图1和图2的现有技术方法相比,根据参照图5描述的实施例,基于ZIR样本进一步处理经滤波的当前帧,如框110示意性所示。根据实施例,基于过去帧n-1并且基于LPC滤波器,产生ZIR样本,如框112示意性地所示。
现在将更详细地描述处理块110和112的功能。图6示出了表示用于生成ZIR样本的处理块112的功能的流程图。如上所述,使用针对相应帧选择或确定的滤波器参数c,用线性滤波器H(z)对音频信号100的帧进行滤波。滤波器H(z)可以是递归滤波器,例如IIR滤波器,或者它可以是非递归滤波器,例如FIR滤波器。在处理块112中,使用可以量化或可以不被量化的LPC滤波器。LPC滤波器具有阶数M,并且可以在经滤波或未滤波的音频信号上估计,或者可以是也在音频编解码器中使用的LPC滤波器。在第一步骤S200中,用滤波器H(z)但使用当前帧n的滤波器参数或系数c1来对过去帧n-1的最后M(M=LPC滤波器的阶数)个样本进行滤波。从而步骤S200产生经滤波的信号的第一部分。在步骤S202中,从步骤S200提供的经滤波的信号的第一部分中减去经滤波的过去帧n-1的最后M个样本(使用过去帧n-1的滤波器参数或系数c0进行滤波的过去帧的最后M个样本),从而产生经滤波的信号的第二部分。在步骤S204中,应用具有阶数M的LPC滤波器,更具体地,在步骤S204中通过对零样本的帧进行滤波来生成LPC滤波器的零输入响应(ZIR),其中,滤波器的初始状态等于经滤波的信号的第二部分,从而生成ZIR。根据实施例,可以对ZIR进行加窗(windowed),使得其幅度更快地降低到0。
如上面参照图5所描述的ZIR被施加在处理块110中,参考图7的流程图来描述处理框110的功能,图7是将递归滤波器(如IIR滤波器)用作线性滤波器H(z)的情况。根据参照图5描述的实施例,为了去除当前帧和过去帧之间的不连续性,同时避免不期望的失真,对当前帧n进行滤波包括逐样本地处理(滤波)当前帧n,其中,根据本发明的方法处理开始部分的样本。更具体地,处理当前帧n的开始部分的M个样本,并且在第一步骤S300处,将变量m设置为0。在下一步骤S302中,使用滤波器H(z)和用于当前帧n的滤波器系数或参数c1来对当前帧n的样本m进行滤波。因此,与常规方法不同,根据本发明方法,不使用来自过去帧的系数而是仅使用来自当前帧的系数对当前帧进行滤波,因此尽管事实上去除了不连续性,但避免了常规方法中存在的不期望的失真。步骤S302产生了经滤波的样本m,且在步骤S304中,从经滤波的样本m中减去对应于样本m的ZIR样本,产生经滤波的当前帧n的对应样本。在步骤S306中,确定是否处理了当前帧n的开始部分的最后一个样本M。在没有处理完开始部分的所有M个样本的情况下,使变量m递增,并且针对当前帧n的下一个样本重复方法步骤S302至S306。一旦开始部分的所有M个样本都己被处理,则在步骤S308处,使用当前帧的滤波器参数c1对当前帧n的剩余样本进行滤波,从而提供根据本发明的方法进行处理的经滤波的当前帧n,在去除相继帧之间的不连续时避免了不期望的失真。
根据另一个实施例,线性滤波器H(z)是非递归滤波器,如FIR滤波器,并且如上面参照图5所述的ZIR被施加在处理块110中。参考图8的流程图描述该实施例的功能。在步骤S400处,使用滤波器H(z),用当前帧的滤波器系数或参数c1对当前帧n进行滤波。因此,与常规方法不同,根据本发明方法,不使用来自过去帧的系数而是仅使用来自当前帧的系数对当前帧进行滤波,因此尽管事实上去除了不连续性,但避免了常规方法中存在的不期望的失真。在步骤S402中,从经滤波的当前帧的对应开始部分中减去ZIR的开始部分,从而提供具有根据本发明方法滤波/处理的开始部分和仅使用用于当前帧的滤波器系数或参数c1滤波的剩余部分的经滤波的当前帧n,从而在去除相继帧之间的不连续性时避免不期望的失真。
本发明的方法可以应用于如上所述的对音频信号进行滤波时的情况。根据实施例,例如,当使用音频编解码器后置滤波器来降低信号谐波之间的编码噪声的水平时,本发明的方法也可以应用于解码器侧。为了在解码器处处理音频帧,根据实施例,后置滤波器可以如下:
H(z)=(1-B(z))/(1-A(z)·z-T)
其中,B(z)和A(z)是两个FIR滤波器,并且H(z)滤波器参数是FIR滤波器B(z)和A(z)的系数,并且T表示音调滞后。在这种情景下,例如当过去滤波器帧参数c0不同于当前帧滤波器参数c1时,滤波器还可能在两个经滤波的帧之间引入不连续性,并且这种不连续性可能在经滤波的音频信号104中产生伪像,例如“滴答声”。如上面详细所述,通过处理经滤波的当前帧来去除该不连续性。
虽然已经在装置的上下文中描述了所描述构思的一些方面,但是将清楚的是,这些方面还表示对对应方法的描述,其中,块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对对应块或者对应装置的项或特征的描述。
取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)来予以实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。
因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另一实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解,本领域其他技术人员将清楚对于本文所述的布置和细节的修改和变形。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文实施例的描述和解释所给出的具体细节来限制。
Claims (17)
1.一种用于处理音频信号(100)的方法,所述方法包括:使用线性预测滤波去除(S102、S104、S300-S308、S400-S402)所述音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性(106a、106b)。
2.根据权利要求1所述的方法,包括:对所述音频信号的当前帧进行滤波,并且通过以下信号修改经滤波的当前帧的开始部分来去除所述不连续性,所述信号通过对预定义信号进行线性预测滤波来获得,其中线性预测滤波器的初始状态基于过去帧的最后部分来定义。
3.根据权利要求2所述的方法,其中,所述线性预测滤波器的初始状态基于未经滤波的过去帧的最后部分的滤波来定义,其中,对所述未经滤波的过去帧的最后部分使用用于对当前帧进行滤波的滤波器参数集合来滤波。
4.根据权利要求1至3中的一项所述的方法,还包括:在经滤波或未滤波的音频信号(100)上估计所述线性预测滤波器。
5.根据权利要求4所述的方法,其中,估计所述线性预测滤波器包括:使用Levinson-Durbin算法,基于所述音频信号(100)的过去帧和/或当前帧或者基于所述音频信号(100)的过去的经滤波的帧来估计滤波器。
6.根据权利要求1至3中的一项所述的方法,其中,所述线性预测滤波器包括音频编解码器的线性预测滤波器。
7.根据权利要求1至6中的一项所述的方法,其中,去除所述不连续性包括处理所述经滤波的当前帧的开始部分,其中,所述当前帧的开始部分具有小于或等于所述当前帧的样本总数的预定义数量的样本,并且其中,处理所述当前帧的开始部分包括从所述经滤波的当前帧的开始部分中减去(S304、S402)零输入响应(ZIR)的开始部分。
8.根据权利要求7所述的方法,包括使用如FIR滤波器的非递归滤波器对所述音频信号的当前帧进行滤波(S400),以产生经滤波的当前帧。
9.根据权利要求7所述的方法,包括:使用如IIR滤波器的递归滤波器逐样本地处理所述音频信号的未经滤波的当前帧,并且其中,处理所述当前帧的开始部分的样本包括:使用所述递归滤波器,用所述当前帧的滤波器参数对所述样本进行滤波(S302),以产生经滤波的样本,以及从经滤波的样本中减去(S304)对应的ZIR样本,以产生经滤波的当前帧的对应样本。
10.根据权利要求9所述的方法,其中,重复滤波(S302)和减去(S304),直到处理了当前帧的开始部分中的最后一个样本为止,并且其中所述方法还包括:使用递归滤波器,用当前帧的滤波器参数对当前帧中的剩余样本进行滤波(S306)。
11.根据权利要求7至10中的一项所述的方法,包括生成所述ZIR,其中生成所述ZIR包括:用所述滤波器和用于对所述当前帧进行滤波的滤波器参数对未经滤波的过去帧的最后M个样本进行滤波(S200),以产生经滤波的信号的第一部分,其中M是所述线性预测滤波器的阶数;从经滤波的信号的第一部分中减去(S202)使用所述过去帧的滤波器参数进行滤波的经滤波的过去帧的最后M个样本,以生成经滤波的信号的第二部分;以及通过用线性预测滤波器和等于经滤波的信号的第二部分的初始状态对零样本的帧进行滤波来生成(S204)线性预测滤波器的ZIR。
12.根据权利要求11所述的方法,包括对所述ZIR进行加窗,使得其幅度更快地降低到零。
13.一种非瞬时性计算机程序产品,包括存储指令的计算机可读介质,所述指令当在计算机上执行时执行权利要求1至12中的一项所述的方法。
14.一种用于处理音频信号(100)的装置,所述装置包括:处理器(102、110、112),用于使用线性预测滤波来去除所述音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性。
15.一种用于处理音频信号(100)的装置,所述装置被配置为根据权利要求1至12中的一项所述的方法进行操作。
16.一种音频解码器(250),包括权利要求14或15所述的装置。
17.一种音频编码器(200),包括权利要求14或15所述的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110100360.9A CN113012704B (zh) | 2014-07-28 | 2015-07-03 | 处理音频信号的方法和装置,音频解码器和音频编码器 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178821.6 | 2014-07-28 | ||
EP14178821.6A EP2980796A1 (en) | 2014-07-28 | 2014-07-28 | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
PCT/EP2015/065219 WO2016015950A1 (en) | 2014-07-28 | 2015-07-03 | Method and apparatus for precessing an audio signal, audio decoder, and audio encoder |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110100360.9A Division CN113012704B (zh) | 2014-07-28 | 2015-07-03 | 处理音频信号的方法和装置,音频解码器和音频编码器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106575507A true CN106575507A (zh) | 2017-04-19 |
CN106575507B CN106575507B (zh) | 2021-02-02 |
Family
ID=51224879
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580040572.5A Active CN106575507B (zh) | 2014-07-28 | 2015-07-03 | 用于处理音频信号的方法和装置,音频解码器和音频编码器 |
CN202110100360.9A Active CN113012704B (zh) | 2014-07-28 | 2015-07-03 | 处理音频信号的方法和装置,音频解码器和音频编码器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110100360.9A Active CN113012704B (zh) | 2014-07-28 | 2015-07-03 | 处理音频信号的方法和装置,音频解码器和音频编码器 |
Country Status (18)
Country | Link |
---|---|
US (5) | US20170133028A1 (zh) |
EP (7) | EP2980796A1 (zh) |
JP (5) | JP6503051B2 (zh) |
KR (5) | KR102304326B1 (zh) |
CN (2) | CN106575507B (zh) |
AR (1) | AR101287A1 (zh) |
AU (1) | AU2015295709B2 (zh) |
CA (6) | CA3193319A1 (zh) |
ES (4) | ES2914632T3 (zh) |
HK (1) | HK1259289A1 (zh) |
MX (1) | MX362737B (zh) |
MY (1) | MY179016A (zh) |
PL (4) | PL3407351T3 (zh) |
PT (3) | PT3407351T (zh) |
RU (1) | RU2665282C1 (zh) |
SG (1) | SG11201700684YA (zh) |
TW (1) | TWI595480B (zh) |
WO (1) | WO2016015950A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117040487A (zh) * | 2023-10-08 | 2023-11-10 | 武汉海微科技有限公司 | 音频信号处理的滤波方法、装置、设备及存储介质 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1159639A (zh) * | 1991-06-11 | 1997-09-17 | 夸尔柯姆股份有限公司 | 可变速率声码器 |
CN1229501A (zh) * | 1997-04-16 | 1999-09-22 | 法国电信局 | 用前向和反向线性预测编码分析编码音频信号的方法和装置 |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
CN1512486A (zh) * | 1994-02-16 | 2004-07-14 | ��ķ�ɷ�����˾ | 声码器特殊应用集成电路 |
CN1525439A (zh) * | 2002-11-14 | 2004-09-01 | �ž������� | 广义综合分析语音编码方法和实施该方法的编码器 |
CN1708908A (zh) * | 2002-11-21 | 2005-12-14 | 日本电信电话株式会社 | 数字信号处理方法、处理器、程序及存储了该程序的记录介质 |
CN1901383A (zh) * | 2005-07-19 | 2007-01-24 | 三洋电机株式会社 | 噪声消除器 |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
CN101231850A (zh) * | 2007-01-23 | 2008-07-30 | 华为技术有限公司 | 编解码方法及装置 |
US20090083047A1 (en) * | 2007-09-25 | 2009-03-26 | Apple Inc. | Zero-gap playback using predictive mixing |
CN101527138A (zh) * | 2008-03-05 | 2009-09-09 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
CN102089812A (zh) * | 2008-07-11 | 2011-06-08 | 弗劳恩霍夫应用研究促进协会 | 用以使用混叠切换方案将音频信号编码/解码的装置与方法 |
US20110153333A1 (en) * | 2009-06-23 | 2011-06-23 | Bruno Bessette | Forward Time-Domain Aliasing Cancellation with Application in Weighted or Original Signal Domain |
WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
US20110218797A1 (en) * | 2010-03-05 | 2011-09-08 | Motorola, Inc. | Encoder for audio signal including generic audio and speech frames |
CN102368385A (zh) * | 2011-09-07 | 2012-03-07 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
US20120271644A1 (en) * | 2009-10-20 | 2012-10-25 | Bruno Bessette | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
CN103109318A (zh) * | 2010-07-08 | 2013-05-15 | 弗兰霍菲尔运输应用研究公司 | 利用前向混迭消除技术的编码器 |
CN103187066A (zh) * | 2012-01-03 | 2013-07-03 | 摩托罗拉移动有限责任公司 | 处理音频帧以在不同编解码器之间转变的方法和装置 |
CN103384900A (zh) * | 2010-12-23 | 2013-11-06 | 法国电信公司 | 在预测编码与变换编码之间交替的低延迟声音编码 |
CN103548080A (zh) * | 2012-05-11 | 2014-01-29 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
CN103703512A (zh) * | 2011-07-26 | 2014-04-02 | 摩托罗拉移动有限责任公司 | 用于音频编码和解码的方法和装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US7512535B2 (en) | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
JP2009539132A (ja) * | 2006-05-30 | 2009-11-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号の線形予測符号化 |
US8000969B2 (en) * | 2006-12-19 | 2011-08-16 | Nuance Communications, Inc. | Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
EP2311034B1 (en) * | 2008-07-11 | 2015-11-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
KR20100007738A (ko) | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
CN101355692B (zh) * | 2008-07-30 | 2013-03-20 | 浙江大学 | 一种实时跟踪运动目标区域的智能监控装置 |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
KR101734948B1 (ko) | 2009-10-09 | 2017-05-12 | 삼성전자주식회사 | 파워 헤드룸 보고, 자원 할당 및 전력 제어 방법 |
CN101976566B (zh) * | 2010-07-09 | 2012-05-02 | 瑞声声学科技(深圳)有限公司 | 语音增强方法及应用该方法的装置 |
US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
-
2014
- 2014-07-28 EP EP14178821.6A patent/EP2980796A1/en not_active Withdrawn
-
2015
- 2015-07-03 EP EP15732290.0A patent/EP3175452B1/en active Active
- 2015-07-03 ES ES19209351T patent/ES2914632T3/es active Active
- 2015-07-03 EP EP19209351.6A patent/EP3654333B1/en active Active
- 2015-07-03 AU AU2015295709A patent/AU2015295709B2/en active Active
- 2015-07-03 PT PT181827858T patent/PT3407351T/pt unknown
- 2015-07-03 CA CA3193319A patent/CA3193319A1/en active Pending
- 2015-07-03 KR KR1020197018895A patent/KR102304326B1/ko active IP Right Grant
- 2015-07-03 EP EP24198100.0A patent/EP4447048A3/en active Pending
- 2015-07-03 KR KR1020177005450A patent/KR101997006B1/ko active IP Right Grant
- 2015-07-03 SG SG11201700684YA patent/SG11201700684YA/en unknown
- 2015-07-03 RU RU2017105447A patent/RU2665282C1/ru active
- 2015-07-03 PL PL18182785T patent/PL3407351T3/pl unknown
- 2015-07-03 CA CA3193316A patent/CA3193316A1/en active Pending
- 2015-07-03 KR KR1020237043141A patent/KR20230173744A/ko active Application Filing
- 2015-07-03 EP EP22160064.6A patent/EP4030426B1/en active Active
- 2015-07-03 CN CN201580040572.5A patent/CN106575507B/zh active Active
- 2015-07-03 ES ES15732290.0T patent/ES2685984T3/es active Active
- 2015-07-03 CN CN202110100360.9A patent/CN113012704B/zh active Active
- 2015-07-03 PL PL15732290T patent/PL3175452T3/pl unknown
- 2015-07-03 PL PL19209351T patent/PL3654333T3/pl unknown
- 2015-07-03 WO PCT/EP2015/065219 patent/WO2016015950A1/en active Application Filing
- 2015-07-03 ES ES22160064T patent/ES2960422T3/es active Active
- 2015-07-03 PT PT192093516T patent/PT3654333T/pt unknown
- 2015-07-03 MY MYPI2017000131A patent/MY179016A/en unknown
- 2015-07-03 CA CA3193306A patent/CA3193306A1/en active Pending
- 2015-07-03 EP EP18182785.8A patent/EP3407351B1/en active Active
- 2015-07-03 JP JP2017504689A patent/JP6503051B2/ja active Active
- 2015-07-03 CA CA3193309A patent/CA3193309A1/en active Pending
- 2015-07-03 PL PL22160064.6T patent/PL4030426T3/pl unknown
- 2015-07-03 EP EP23179786.1A patent/EP4235667B1/en active Active
- 2015-07-03 MX MX2017001245A patent/MX362737B/es active IP Right Grant
- 2015-07-03 PT PT15732290T patent/PT3175452T/pt unknown
- 2015-07-03 KR KR1020227036973A patent/KR102615475B1/ko active IP Right Grant
- 2015-07-03 CA CA3193302A patent/CA3193302A1/en active Pending
- 2015-07-03 CA CA2955674A patent/CA2955674C/en active Active
- 2015-07-03 ES ES18182785T patent/ES2773690T3/es active Active
- 2015-07-03 KR KR1020217029645A patent/KR102459857B1/ko active IP Right Grant
- 2015-07-13 TW TW104122578A patent/TWI595480B/zh active
- 2015-07-23 AR ARP150102337A patent/AR101287A1/es active IP Right Grant
-
2017
- 2017-01-23 US US15/412,920 patent/US20170133028A1/en active Granted
-
2019
- 2019-01-30 HK HK19101650.8A patent/HK1259289A1/zh unknown
- 2019-03-22 JP JP2019054137A patent/JP6864382B2/ja active Active
-
2021
- 2021-03-26 JP JP2021052578A patent/JP7202545B2/ja active Active
-
2022
- 2022-01-20 US US17/580,578 patent/US12014746B2/en active Active
- 2022-02-03 US US17/592,423 patent/US11869525B2/en active Active
- 2022-12-08 JP JP2022196100A patent/JP7509859B2/ja active Active
-
2023
- 2023-06-22 US US18/339,915 patent/US12033648B2/en active Active
- 2023-12-12 US US18/537,655 patent/US20240135943A1/en active Pending
-
2024
- 2024-06-20 JP JP2024099693A patent/JP2024138295A/ja active Pending
Patent Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1159639A (zh) * | 1991-06-11 | 1997-09-17 | 夸尔柯姆股份有限公司 | 可变速率声码器 |
CN1512486A (zh) * | 1994-02-16 | 2004-07-14 | ��ķ�ɷ�����˾ | 声码器特殊应用集成电路 |
CN1229501A (zh) * | 1997-04-16 | 1999-09-22 | 法国电信局 | 用前向和反向线性预测编码分析编码音频信号的方法和装置 |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
CN1525439A (zh) * | 2002-11-14 | 2004-09-01 | �ž������� | 广义综合分析语音编码方法和实施该方法的编码器 |
CN1708908A (zh) * | 2002-11-21 | 2005-12-14 | 日本电信电话株式会社 | 数字信号处理方法、处理器、程序及存储了该程序的记录介质 |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
CN1901383A (zh) * | 2005-07-19 | 2007-01-24 | 三洋电机株式会社 | 噪声消除器 |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
CN101231850A (zh) * | 2007-01-23 | 2008-07-30 | 华为技术有限公司 | 编解码方法及装置 |
US20090083047A1 (en) * | 2007-09-25 | 2009-03-26 | Apple Inc. | Zero-gap playback using predictive mixing |
CN101527138A (zh) * | 2008-03-05 | 2009-09-09 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
CN102089812A (zh) * | 2008-07-11 | 2011-06-08 | 弗劳恩霍夫应用研究促进协会 | 用以使用混叠切换方案将音频信号编码/解码的装置与方法 |
US20110153333A1 (en) * | 2009-06-23 | 2011-06-23 | Bruno Bessette | Forward Time-Domain Aliasing Cancellation with Application in Weighted or Original Signal Domain |
US20120271644A1 (en) * | 2009-10-20 | 2012-10-25 | Bruno Bessette | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
CN102884574A (zh) * | 2009-10-20 | 2013-01-16 | 弗兰霍菲尔运输应用研究公司 | 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法 |
WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
US20110218797A1 (en) * | 2010-03-05 | 2011-09-08 | Motorola, Inc. | Encoder for audio signal including generic audio and speech frames |
CN103109318A (zh) * | 2010-07-08 | 2013-05-15 | 弗兰霍菲尔运输应用研究公司 | 利用前向混迭消除技术的编码器 |
US20130124215A1 (en) * | 2010-07-08 | 2013-05-16 | Fraunhofer-Gesellschaft Zur Foerderung der angewanen Forschung e.V. | Coder using forward aliasing cancellation |
CN103384900A (zh) * | 2010-12-23 | 2013-11-06 | 法国电信公司 | 在预测编码与变换编码之间交替的低延迟声音编码 |
CN103703512A (zh) * | 2011-07-26 | 2014-04-02 | 摩托罗拉移动有限责任公司 | 用于音频编码和解码的方法和装置 |
CN102368385A (zh) * | 2011-09-07 | 2012-03-07 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
CN103187066A (zh) * | 2012-01-03 | 2013-07-03 | 摩托罗拉移动有限责任公司 | 处理音频帧以在不同编解码器之间转变的方法和装置 |
CN103548080A (zh) * | 2012-05-11 | 2014-01-29 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
Non-Patent Citations (1)
Title |
---|
J.E. MUÑOZ-EXPÓSITO ET AL: "Speech/music discrimination using awarped LPC-based feature and a fuzzy expert system for intelligent audio coding", 《2006 14TH EUROPEAN SIGNAL PROCESSING CONFERENCE》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117040487A (zh) * | 2023-10-08 | 2023-11-10 | 武汉海微科技有限公司 | 音频信号处理的滤波方法、装置、设备及存储介质 |
CN117040487B (zh) * | 2023-10-08 | 2024-01-02 | 武汉海微科技有限公司 | 音频信号处理的滤波方法、装置、设备及存储介质 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106575507A (zh) | 用于处理音频信号的方法和装置,音频解码器和音频编码器 | |
CN106663444A (zh) | 用于使用谐波后置滤波器来处理音频信号的装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |