CN1134581A - 音响信号的误差隐匿方法及其装置 - Google Patents
音响信号的误差隐匿方法及其装置 Download PDFInfo
- Publication number
- CN1134581A CN1134581A CN95113141A CN95113141A CN1134581A CN 1134581 A CN1134581 A CN 1134581A CN 95113141 A CN95113141 A CN 95113141A CN 95113141 A CN95113141 A CN 95113141A CN 1134581 A CN1134581 A CN 1134581A
- Authority
- CN
- China
- Prior art keywords
- frame
- error
- coefficient
- frequency
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000005236 sound signal Effects 0.000 claims description 28
- 238000011084 recovery Methods 0.000 claims description 14
- 230000007704 transition Effects 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000005070 sampling Methods 0.000 description 12
- 230000006835 compression Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 9
- 239000002131 composite material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000001172 regenerating effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 1
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99948—Application of database or data structure, e.g. distributed, multimedia, or image
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Error Detection And Correction (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
音响信号误差隐匿方法及装置,在压缩音响信号特定帧因误差消失时,用其相邻帧音响信号进行隐匿。为以纠错的帧为单位隐匿频分编码/变换编码的数字音响信号的误差发生帧,装置包括输入代表编码音响信号的频率系数在各帧检测误差是否发生的误差检测装置;输入频率系数在音响信号频率区域各子频带对频率系数译码和译码装置;存储译码装置译码的频率系数的缓冲器;频率系数复原装置,按与编码相同顺序变换成时域音响信号的合成滤波器组。
Description
本发明涉及一种对压缩的音响信号进行译码的数字音频接收装置,特别是涉及在因误差使压缩的音响信号的特定帧消失的情况下可使用与其相邻的1帧或多帧的音响信号来进行隐匿的音响信号的误差隐匿方法及其装置。
通常,为了音响信号的压缩扩展处理而使用频分编码和变换编码。图1简要地表示出使用频分编码的现有数字音响信号编码/译码装置。
在图1中,编码器1中的分析滤波器数据库1A把输入音响信号分割成K个频带。下取样单元1B把分割了频带的信号按照输入信号具有的取样频率的1/K倍进行下取样或十取一取样。量化单元1C把取样信号进行量化。量化信号以帧为单位被传送到接收侧。这样一来,接收侧的译码器2通过由编码器1所进行的信号处理的逆过程来再生原来的音响信号。
图1这种装置以帧为单位处理音响信号。帧是在压缩音响信号传送时可以从该音响信号检测误差发生的最小单位。在音响信号的1帧取样数为N时,分析滤波器数据库1A把1帧的取样分割成K个子频带,各个下取样单元1B把各子频带的信号按1/K倍的取样频率进行下取样(或十取一取样),因而对一个子频带而言,每帧总共有m(=N/K)个取样(或频率系数)。如果把同一视觉的全部频率系数集合定义为″区段″,则1帧由m个区段S1~Sm所构成,各区段的频率系数为K个,图2表示出对应于连续的3帧F1、F2、F3的区段S1~Sm。
各区段的频率系数在经过译码器2的逆量化单元2A和把各子频带信号按K倍的取样频率进行上取样的上取样单元2B之后,输入合成滤波器数据库2C。合成滤波器数据库2C把输入的频率系数逆变换成时域信号之后,同所提供的窗函数进行相乘运算。由此,在任意时刻由从该时刻的全部区段逆变换的信号和窗函数相乘值的总和求出复原的时域音响信号。其中,为了减小连续帧的边缘间的不连续性而使用窗函数。图2表示出窗函数的一个例子。通过使用该窗函数而复原的1帧的音响信号受到以前帧和以后帧的各区段频率成分系数的影响。
图3表示出现有的用于在任意1帧中产生误差而使信号消失时的误差隐匿装置。图3的装置对由频分编码器或变换编码器所压缩的音响信号进行误差隐匿。根据图4A~图4C来说明图3装置的工作。
译码器20对所接收的压缩音响信号进行译码,误差检测部10以帧为单位进行误差检测。译码器20与上述图1的译码器2相同,由逆量化、上取样和合成滤波器数据库所构成。从该译码器20所输出的音响信号施加给开关30,在帧缓冲器40中所存储的以前帧的音响信号也施加给开关30,开关30根据来自误差检测部10的控制信号选择来自译码器20或帧缓冲器40的信号以提供给帧缓冲器40。在未检测到误差帧的情况下,误差检测部10控制开关30把信号从译码器20施加给帧缓冲器40。另一方面,在检测到误差的情况下,误差检测部10控制开关30把从帧缓冲器40反馈的信号提供给帧缓冲器40。例如,在图4A所示的三个帧F1、F2、F3中的帧F2的没有正确复原的情况下,误差检测部10控制开关30把从帧缓冲器40反馈的音响信号再次施加给帧缓冲器40。从帧缓冲器40所输出的音响信号由D/A变换器50变换成模拟信号。
图4B表示出:在误差发生的情况下和误差未发生的情况下,由图3的误差隐匿装置最终再生的信号。通过使用图4C所示的窗函数而在相邻的帧之间保持连续性,因而在帧F2正常复原的情况下,在图4B的帧F2和F3中,由虚线表示的信号为最终再生的信号。另一方面,在帧F2因误差而没有正常复原的情况下,帧F2由图4B所示的以前帧F1的音响信号所替代。在帧F2中最终决定的信号由图4B的实线表示。在由图4可知,即使在帧F3中误差未发生,该音响信号也受到发生了误差的帧F2的影响。这是因为:译码器20在发生了误差的帧F2的音响信号中使用用于由图4C的虚线表示的帧F2的窗函数,来处理帧F3的压缩音响信号以保持由该方式译码的帧F2的音响信号和下一帧F3的音响信号之间的连续性。这样,帧F3的再生音响信号为图4B中实线表示的信号。该信号显示出同由虚线表示的波形即在帧F2中误差未发生情况下的帧F3的再生信号显著不同。这样,仅由以前帧F2来复制和使用因误差发生没有复原的帧F2的信号是不合适的。而且,当帧F2的音响信号变化成与帧F1大不相同时,帧全部的信号复制也是不合适的。
为了解决上述问题,本发明的目的是提供一种音响信号的误差隐匿方法,可以把发生误差的帧的频率成分系数用相邻的帧或多帧的频率成分系数有效地复原。
本发明的另一个目的是提供一种实现上述方法的装置。
为了实现上述本发明的目的,用于以能纠错的帧为单位隐匿经频分编码/变换编码的数字信号发生了误差的1帧或多帧的方法,包括:输入代表编码数字音响信号的频率系数(步骤a);对所输入的频率系数检测每帧中误差是否发生(步骤b);对于所输入的频率系数,在构成全部音响信号频域的各子频带中把频率系数进行译码(步骤c);存储由上述步骤(c)所译码的频率系数(步骤d);根据由上述步骤(b)所得到的误差检测结果用已设定的加权值和与发生了误差的帧相邻接的帧或多帧的频率系数复原发生了误差的一帧或多帧的频率系数(步骤e);用由上述步骤(e)所复原的频率系数来代替由上述译码步骤(c)所译码并由上述步骤(d)所存储的误差发生帧的频率系数(步骤f);把由上述步骤(f)的结果所得到的频率系数以与在上述步骤(c)中进行译码的顺序相同的顺序变换成时域音响信号(步骤g)。
为了实现上述的本发明的另一个目的,数字音响信号的误差隐匿装置,即用于以能纠错的帧为单位隐匿被频分编码/变换编码的数字音响信号误差发生的帧的装置,包括:误差检测装置,该装置输入代表编码数字音响信号的频率系数,检测每帧中误差是否发生;译码装置,该装置输入上述频率系数,在构成全部音响信号频域的各子频域中对频率系数进行译码;存储由上述译码装置译码的频率系数的缓冲器;频率系数复原装置,该装置根据由上述误差检测装置所得到的误差检测结果用已设定的加权值和存储在上述缓冲器中并属于同误差发生的帧相邻的帧的频率系数中的,同误差发生的帧相邻的各子频域的频率系数来复原发生误差的帧的频率系数,用所复原的频率系数来更新由上述译码装置译码并存储在上述缓冲器中的误差发生帧的频率系数;施加存储在上述缓冲器中的频率系数,并以与进行译码的顺序相同的顺序变换成时域音响信号的合成滤波器组。
图1是简要表示使用频分编码的现有数字音响编码/译码装置的图;
图2是用于说明数字音响信号的图;
图3是表示用于数字音响信号的现有误差隐匿装置的构成图;
图4A~图4C是用于说明图3装置的误差隐匿的信号波形图;
图5是表示由本发明所推荐的一个实施例的数字音响信号的误差隐匿装置的构成图;
图6A~图6B是用于说明按照本发明的误差隐匿方法得到的频率系数复原部的信号处理的示意图;
图7是表示同频率系数相乘的加权值α1的一个例子的曲线图;
图8A~图8B是用于说明按照本发明的另一个误差隐匿方法得到的频率系数复原部的信号处理的示意图。
下面根据附图5至8B来更详细地描述实现本发明的实施例。
图5的装置复原由用于数字音响信号的图1编码器这类装置所压缩的音响信号。压缩的音响信号被加到误差检测器10和译码器100上。误差检测器10对所输入的压缩音响信号的每帧检测误差是否发生,产生表示因误差而未复原的帧的误差帧显示信号。译码器100按频域对压缩的音响信号进行译码。对于由图1的编码器1所压缩的音响信号,输入译码器100的信号为各子频带的频率系数。在此情况下,译码器100产生被逆量化的频率系数。译码器100的输出信号提供给缓冲器70。缓冲器70存储频率系数。通过与图6A~6B和图8A~8B相关连而描述的方法中任一个误差隐匿方法来设计图5的装置,据此决定缓冲器70的数据存储容量。频率系数复原部60根据来自误差检测器10的误差帧显示信号来读出存储在缓冲器70中的信号,由下述方法来复原误差发生帧的频率系数。由此,误差发生帧的频率系数由频率系数复原部60复原。复原的频率系数被加到缓冲器70,在缓冲器70内用由频率系数复原部60所复原的对应频率系数来代替由译码器100所译码的误差发生帧的频率系数。把缓冲器70存储的频率系数按帧的顺序依次输出给合成滤波器组80。合成滤波器组80把窗函数同由缓冲器70所供给的各帧频率系数相乘,把其结果变换成时域信号。D/A变换器90把由合成滤波器数据库80所施加的信号变换成模拟信号。这样,D/A变换器的输出信号为隐匿了所发生的误差的再生音响信号。
根据图6A~图6B来说明按照本发明的方法得到的频率系数复原部60的工作。
图6A~图6B表示的误差隐匿方法是用以前帧的最后区段的频率系数来复原误差发生帧的各区段的频率系数。对于被频分编码的音响信号,频率系数复原部60在各子频带中复原误差发生帧的频率系数。图6A是一帧F2因误差而未被译码的情况。此时,该帧F2的第一帧S1的频率系数值为加权值α1同帧F1的最后区段的第M区段Sm的系数值相乘的值。第二区段S2的系数是用加权值α2乘以第一区段S1的系数而求出的。用相同的方式处理第三区段以后的区段S3~Sm。这样,属于误差发生帧F2的全部区段S1~Sm的频率系数被复原了。其中,加权值α1、 α2…αm是一般的小于或等于1的正数,使用者可任意决定。作为它的一个例子,如果α1=α2=、…、αm=α<1.0,则以帧F2内的各区段S1~Sm的系数值求出如下:
系数(S1、F2)←α×(Sm、F1)
系数(S2、F2)←α2×(Sm、F1)
系数(Sm、F2)←αm×(Sm、F1)
其中,系数(Sj、Fi)表示属于第i帧的第j区段的频率系数。此时,由于加权值为小于1的值,1帧内位于后侧的各区段的系数值急剧变小。图7表示出其一个例子。
如图6B所示,在以相邻的多帧EF1、…EFn连续并发生误差的情况下,为了使位于其后的误差发生的全部帧EF1、…、EFn的频率系数复原,而使用误差未发生的帧F1的最后区段的频率系数。为了使帧EF1、…、EFn的频率系数复原,使用与图6A相关而说明的方法相类似的方法。其结果,最后的误差帧EFn的第m区段Sm的频率系数为把全部误差帧以前的加权值全部相乘的值。最好,在此情况下,在各个误差发生帧EF1~EFn使用不同的加权值。下面列出其例子:
EF1←α1=0.9、α2…=αm=1
EF2←α1=0.8、α2…=αm=1
EF3←α1=0.6、α2…=αm=1
… … … …
EF(n-1)←α1=0.1、α2……=αm=1
EFn←α1=α2=…=αm=0
在用相应的式提供加权值的情况下,把加权值α1(=0.9)同以前帧F1的第m区段Sm的系数值相乘而求出图6B所示的第一误差帧EF1的第一区段S1的频率系数。同样,把加权值α2同第一系数值相乘而求出第一误差帧EF1的第二区段S2的频率系数值。由此,直到第(n-1)误差帧EF1~EF(n-1),使用以前帧的复原频率成分系数来形成再生信号。但是,由于第n误差帧EFn的加权值全部为0,则该区间为声音消去状态。即,如果用相应式适当地调节加权值,就可以从任意帧实现声音消去。
虽然上述的本发明方法为了易于描述而使用误差发生之前帧的最后区段来使误差复原,但也可以使用位于以前帧或以后帧的最后区段附近的其他区段的系数。
图8A~图8B是用于说明从图6A~图6B所述的误差隐匿方法变形的新的误差隐匿方法。
与图8A~图8B相对应的误差隐匿方法,通过使用误差发生帧的以前帧的频率系数和误差发生帧的以后帧的频率系数的插入,来算出误差发生帧的频率系数。下面描述计算误差发生帧F2的频率系数的方法。
在图8A的情况下,把加权值β1乘以第一帧F1的第m区段Sm的系数值所得到的值同加权值1-β1乘以第三帧F3的第1区段S1的系数值所得到的值相加而求出帧F2的第一区段S1的频率系数。下面表示出对应于属于帧F2的全部区域的一般状态。
系数(Si、F2)←β1×系数(Sm、F1)+(1-βi)×系数(S1、F3)
图8B表示出在相邻的多帧中发生误差的情况下适用于图8A的方法的例子。由于图8B所示方法是本领域普通技术人员能够通过上述内容和图8B理解,则省略具体说明。
通过计算而求出图6A~图6B和图8A~图8B涉及的加权值{αi}和{βi},可以在预先存储到查找表中之后来使用。
如上述那样,本发明的误差隐匿方法及装置使用与其相邻的帧或多帧的频率系数来使误差发生帧的频率系数复原,由此误差发生帧可以使波及其后帧的影响最小。
Claims (19)
1.数字音响信号的误差隐匿装置,用于以能纠错的帧为单位隐匿被频分编码/变换编码的数字音响信号的误差发生的一帧或多帧,其特征在于,包括:
输入代表编码数字音响信号的频率系数,检测在每帧中误差是否发生的误差检测装置;
输入上述频率系数,在构成全部音响信号的频率区域的各子频带中对频率系数进行译码的译码装置;
存储由上述译码装置译码的频率系数的缓冲器;
频率系数复原装置,该装置根据由上述误差检测装置所得到的误差检测结果用已设定的加权值和存储在上述缓冲器中并属于同误差发生的一帧或多帧相邻的帧的频率系数中的,同误差发生帧相邻的各子频带的频率系数来复原发生误差的一帧或多帧的频率系数,用所复原的频率系数来更新由上述译码装置译码并存储在上述缓冲器中的误差发生帧的频率系数;
施加存储在上述缓冲器中的频率系数,以与进行译码的顺序相同的顺序变换成时间区域的音响信号的滤波器组。
2.根据权利要求1所述的数字音响信号的误差隐匿装置,其特征在于,上述频率系数复原装置为了使误差发生帧的各子频带的频率系数复原而使用存在误差发生帧之前的帧中并同误差发生帧相邻的各子频带的频率系数。
3.根据权利要求2所述的数字音响信号的误差隐匿装置,其特征在于,在复原中所使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段。
4.根据权利要求2所述的数字音响信号的误差隐匿装置,其特征在于,上述频率系数复原装置把预先设定的加权值同属于各子频带中的上述之前帧并与误差发生帧相邻的频率系数相乘,来计算出对应于误差发生帧的各子频带的全部频率系数。
5.根据权利要求4所述的数字音响信号的误差隐匿装置,其特征在于,上述已设定的加权值具有″1″以下的值。
6.根据权利要求1所述的数字音响信号的误差隐匿装置,其特征在于,上述频率系数复原装置为了使误差发生帧的各子频带的频率系数复原,而使用存在误差发生帧之前的帧和之后的帧中并同误差发生帧相邻的频率系数。
7.根据权利要求6所述的数字音响信号的误差隐匿装置,其特征在于,在复原中所使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段和位于误差发生帧之后的帧的第一区段。
8.根据权利要求6所述的数字音响信号的误差隐匿装置,其特征在于,上述频率系数复原装置,把已设定的第一加权值同属于各子频带中的上述之前帧并与误差发生帧相邻的频率系数相乘,把已设定的第二加权值同属于上述之后帧并与误差发生帧相邻的频率系数相乘,把两个相乘的结果相加来计算出对应于误差发生帧的各子频带的全部频率系数。
9.根据权利要求8所述的数字音响信号的误差隐匿装置,其特征在于,上述第一和第二加权值具有″1″以下的值。
10.数字音响信号的误差隐匿方法,用于以能纠错的帧为单位隐匿被频分编码/变换编码的数字音响信号的误差发生的1。帧或多帧,其特征在于,包括:
输入代表编码数字音响信号的频率系数的步骤(a);
对所输入的频率系数检测每帧中误差是否发生的步骤(b);
对于所输入的频率系数,在构成全部音响信号频域的各子频带中把频率系数进行译码的步骤(c);
把由上述步骤(c)所译码的频率系数进行存储的步骤(d);
根据由上述步骤(b)所得到的误差检测结果用已设定的加权值和属于与误差发生帧相邻帧的频率系数中与误差发生帧相邻的各子频带的频率系数来复原误差发生的1帧或多帧频率系数的步骤(e);
用由上述步骤(e)所复原的频率系数来代替由上述译码步骤(c)所译码并由上述步骤(d)所存储的误差发生帧的频率系数的步骤(f);
把由上述步骤(f)的结果所得到的频率系数以与上述步骤(c)中进行译码的顺序相同的顺序变换成时域音响信号的步骤(g)。
11.根据权利要求10所述的数字音响信号的误差隐匿方法,其特征在于,上述步骤(e)为了使误差发生帧的各子频带的频率系数复原而使用存在误差发生帧之前的帧中并同误差发生帧相邻的各子频带的频率系数。
12.根据权利要求11所述的数字音响信号的信号隐匿方法,其特征在于,在复原中使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段。
13.根据权利要求11所述的数字音响信号的误差隐匿方法,其特征在于,上述步骤(e)把已设定的加权值同各子频带中属于上述之前帧并与误差发生帧相邻的频率系数相乘,来计算出对应于误差发生帧的各子频带的全部频率系数。
14.根据权利要求13所述的数字音响信号的误差隐匿方法,其特征在于,上述预先设定的加权值具有″1″以下的值。
15.根据权利要求10所述的数字音响信号的误差隐匿方法,其特征在于,上述步骤(e)为了使误差发生帧的各子频带的频率系数复原而使用存在误差发生帧之前帧和之后帧中并同误差发生帧相邻的各子频带的频率系数。
16.根据权利要求15所述的数字音响信号的误差隐匿方法,其特征在于,在复原中使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段和位于误差发生帧之后的帧的第一区段。
17.根据权利要求15所述的数字音响信号的误差隐匿方法,其特征在于,上述步骤(e)把预先设定的第1加权值同各子频带属于上述之前帧并与频率发生帧相邻的频率系数相乘,把预先设定的第2加权值同属于上述之后帧并与误差发生帧相邻的频率系数相乘,把两个相乘结果相加而计算出对应于误差发生帧的各子频带的全部频率系数。
18.根据权利要求17所述的数字音响信号的误差隐匿方法,其特征在于,上述第1和第2加权值具有″1″以下的值。
19.根据权利要求10所述的数字音响信号的误差隐匿方法,其特征在于,上述步骤(e)中,如果误差发生帧的连续个数为预定个数以上,则为了声音消去而用″0″值来代替上述预先设定的加权值。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940035702A KR970011728B1 (ko) | 1994-12-21 | 1994-12-21 | 음향신호의 에러은닉방법 및 그 장치 |
KR35702/94 | 1994-12-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1134581A true CN1134581A (zh) | 1996-10-30 |
Family
ID=19402727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95113141A Pending CN1134581A (zh) | 1994-12-21 | 1995-12-21 | 音响信号的误差隐匿方法及其装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5673363A (zh) |
EP (1) | EP0718982A3 (zh) |
JP (1) | JPH08286698A (zh) |
KR (1) | KR970011728B1 (zh) |
CN (1) | CN1134581A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008067763A1 (fr) * | 2006-12-04 | 2008-06-12 | Huawei Technologies Co., Ltd. | Procédé et dispositif de décodage |
WO2008089696A1 (fr) * | 2007-01-19 | 2008-07-31 | Huawei Technologies Co., Ltd. | Procédé et dispositif destinés au décodage de la parole dans un décodeur de parole |
CN101399040B (zh) * | 2007-09-27 | 2011-08-10 | 中兴通讯股份有限公司 | 一种帧错误隐藏的谱参数替换方法 |
CN1898722B (zh) * | 2003-12-19 | 2011-08-10 | 艾利森电话股份有限公司 | 经改善的频域误码掩蔽 |
CN102158783A (zh) * | 2010-01-29 | 2011-08-17 | 宝利通公司 | 通过变换插值进行音频分组丢失隐藏 |
CN105359210A (zh) * | 2013-06-21 | 2016-02-24 | 弗朗霍夫应用科学研究促进协会 | Fdns应用前实现将mdct频谱衰落到白噪声的装置及方法 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI963870A (fi) * | 1996-09-27 | 1998-03-28 | Nokia Oy Ab | Virheiden piilottaminen digitaalisessa audiovastaanottimessa |
US6456719B1 (en) * | 1998-01-16 | 2002-09-24 | Winbond Electronics Corp. | Compressed audio error concealment apparatus and method |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
CN1126076C (zh) * | 1998-05-27 | 2003-10-29 | Ntt移动通信网株式会社 | 语音译码器和语音译码方法 |
EP0999708A1 (en) | 1998-11-06 | 2000-05-10 | TELEFONAKTIEBOLAGET L M ERICSSON (publ) | Channel error correction apparatus and method |
GB2343777B (en) * | 1998-11-13 | 2003-07-02 | Motorola Ltd | Mitigating errors in a distributed speech recognition process |
US6226299B1 (en) * | 1999-01-20 | 2001-05-01 | Emulex Corporation | Sanitizing fibre channel frames |
US6327689B1 (en) | 1999-04-23 | 2001-12-04 | Cirrus Logic, Inc. | ECC scheme for wireless digital audio signal transmission |
US6597961B1 (en) * | 1999-04-27 | 2003-07-22 | Realnetworks, Inc. | System and method for concealing errors in an audio transmission |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
DE19959037B4 (de) * | 1999-12-08 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Dekodierung von digitalen Audiodaten |
US6662329B1 (en) * | 2000-03-23 | 2003-12-09 | International Business Machines Corporation | Processing errors in MPEG data as it is sent to a fixed storage device |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
ATE319162T1 (de) * | 2001-01-19 | 2006-03-15 | Koninkl Philips Electronics Nv | Breitband-signalübertragungssystem |
US7447639B2 (en) | 2001-01-24 | 2008-11-04 | Nokia Corporation | System and method for error concealment in digital audio transmission |
US7069208B2 (en) | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
WO2002091202A1 (en) * | 2001-05-04 | 2002-11-14 | Globespan Virata Incorporated | System and method for distributed processing of packet data containing audio information |
US6661880B1 (en) | 2001-06-12 | 2003-12-09 | 3Com Corporation | System and method for embedding digital information in a dial tone signal |
WO2003017561A1 (en) * | 2001-08-16 | 2003-02-27 | Globespan Virata Incorporated | Apparatus and method for concealing the loss of audio samples |
US7706402B2 (en) * | 2002-05-06 | 2010-04-27 | Ikanos Communications, Inc. | System and method for distributed processing of packet data containing audio information |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
SE527669C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Förbättrad felmaskering i frekvensdomänen |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
JP4539180B2 (ja) * | 2004-06-07 | 2010-09-08 | ソニー株式会社 | 音響復号装置及び音響復号方法 |
US7443920B2 (en) * | 2004-09-30 | 2008-10-28 | Viasat, Inc. | Frame-based carrier frequency and phase recovery system and method |
KR100612889B1 (ko) | 2005-02-05 | 2006-08-14 | 삼성전자주식회사 | 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 |
US8620644B2 (en) | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
KR101291193B1 (ko) | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
KR20080075050A (ko) * | 2007-02-10 | 2008-08-14 | 삼성전자주식회사 | 오류 프레임의 파라미터 갱신 방법 및 장치 |
US20080215318A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Event recognition |
US8095856B2 (en) * | 2007-09-14 | 2012-01-10 | Industrial Technology Research Institute | Method and apparatus for mitigating memory requirements of erasure decoding processing |
CN102057423B (zh) * | 2008-06-10 | 2013-04-03 | 杜比实验室特许公司 | 用于隐藏音频伪迹的方法、系统、计算机系统用途 |
RU2562384C2 (ru) | 2010-10-06 | 2015-09-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac) |
EP2458585B1 (en) | 2010-11-29 | 2013-07-17 | Nxp B.V. | Error concealment for sub-band coded audio signals |
TWI610296B (zh) | 2011-10-21 | 2018-01-01 | 三星電子股份有限公司 | 訊框錯誤修補裝置及音訊解碼裝置 |
US9184719B2 (en) * | 2012-07-31 | 2015-11-10 | Hewlett-Packard Development Company, L.P. | Identifying a change to adjust audio data |
CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
US10803876B2 (en) * | 2018-12-21 | 2020-10-13 | Microsoft Technology Licensing, Llc | Combined forward and backward extrapolation of lost network data |
US10784988B2 (en) | 2018-12-21 | 2020-09-22 | Microsoft Technology Licensing, Llc | Conditional forward error correction for network data |
JP7178506B2 (ja) | 2019-02-21 | 2022-11-25 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 位相ecu f0補間スプリットのための方法および関係するコントローラ |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5148487A (en) * | 1990-02-26 | 1992-09-15 | Matsushita Electric Industrial Co., Ltd. | Audio subband encoded signal decoder |
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
JPH05344101A (ja) * | 1992-06-09 | 1993-12-24 | Canon Inc | データ再生装置 |
DE4234015A1 (de) * | 1992-10-09 | 1994-04-14 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Wiedergabe eines Audiosignals |
-
1994
- 1994-12-21 KR KR1019940035702A patent/KR970011728B1/ko not_active IP Right Cessation
-
1995
- 1995-12-20 US US08/575,522 patent/US5673363A/en not_active Expired - Lifetime
- 1995-12-20 EP EP95309269A patent/EP0718982A3/en not_active Withdrawn
- 1995-12-20 JP JP7332342A patent/JPH08286698A/ja active Pending
- 1995-12-21 CN CN95113141A patent/CN1134581A/zh active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1898722B (zh) * | 2003-12-19 | 2011-08-10 | 艾利森电话股份有限公司 | 经改善的频域误码掩蔽 |
US8447622B2 (en) | 2006-12-04 | 2013-05-21 | Huawei Technologies Co., Ltd. | Decoding method and device |
WO2008067763A1 (fr) * | 2006-12-04 | 2008-06-12 | Huawei Technologies Co., Ltd. | Procédé et dispositif de décodage |
WO2008089696A1 (fr) * | 2007-01-19 | 2008-07-31 | Huawei Technologies Co., Ltd. | Procédé et dispositif destinés au décodage de la parole dans un décodeur de parole |
US8145480B2 (en) | 2007-01-19 | 2012-03-27 | Huawei Technologies Co., Ltd. | Method and apparatus for implementing speech decoding in speech decoder field of the invention |
CN101399040B (zh) * | 2007-09-27 | 2011-08-10 | 中兴通讯股份有限公司 | 一种帧错误隐藏的谱参数替换方法 |
CN105895107A (zh) * | 2010-01-29 | 2016-08-24 | 宝利通公司 | 通过变换插值进行音频分组丢失隐藏 |
CN102158783A (zh) * | 2010-01-29 | 2011-08-17 | 宝利通公司 | 通过变换插值进行音频分组丢失隐藏 |
CN105359210A (zh) * | 2013-06-21 | 2016-02-24 | 弗朗霍夫应用科学研究促进协会 | Fdns应用前实现将mdct频谱衰落到白噪声的装置及方法 |
CN105359210B (zh) * | 2013-06-21 | 2019-06-14 | 弗朗霍夫应用科学研究促进协会 | Fdns应用前实现将mdct频谱衰落到白噪声的装置及方法 |
US10607614B2 (en) | 2013-06-21 | 2020-03-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application |
US10672404B2 (en) | 2013-06-21 | 2020-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an adaptive spectral shape of comfort noise |
US10679632B2 (en) | 2013-06-21 | 2020-06-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved signal fade out for switched audio coding systems during error concealment |
US10854208B2 (en) | 2013-06-21 | 2020-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method realizing improved concepts for TCX LTP |
US10867613B2 (en) | 2013-06-21 | 2020-12-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved signal fade out in different domains during error concealment |
US11462221B2 (en) | 2013-06-21 | 2022-10-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an adaptive spectral shape of comfort noise |
US11501783B2 (en) | 2013-06-21 | 2022-11-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application |
US11776551B2 (en) | 2013-06-21 | 2023-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved signal fade out in different domains during error concealment |
US11869514B2 (en) | 2013-06-21 | 2024-01-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved signal fade out for switched audio coding systems during error concealment |
Also Published As
Publication number | Publication date |
---|---|
US5673363A (en) | 1997-09-30 |
JPH08286698A (ja) | 1996-11-01 |
KR970011728B1 (ko) | 1997-07-14 |
KR960027375A (ko) | 1996-07-22 |
EP0718982A3 (en) | 2000-06-21 |
EP0718982A2 (en) | 1996-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1134581A (zh) | 音响信号的误差隐匿方法及其装置 | |
US5845243A (en) | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of audio information | |
EP1396843B1 (en) | Mixed lossless audio compression | |
KR101292771B1 (ko) | 오디오 신호의 오류은폐방법 및 장치 | |
US7328150B2 (en) | Innovations in pure lossless audio compression | |
EP1396844B1 (en) | Unified lossy and lossless audio compression | |
KR101246991B1 (ko) | 오디오 신호 처리 방법 | |
US7003448B1 (en) | Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal | |
JP3154482B2 (ja) | 音信号を伝送しまたは記憶する方法 | |
JP2001184080A (ja) | 圧縮オーディオデータへの電子透かし方法およびそのシステム | |
JP7472154B2 (ja) | 完全フレーム損失隠蔽および部分的フレーム損失隠蔽を含む、lc3隠蔽のためのデコーダおよび復号方法 | |
US9325544B2 (en) | Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame | |
CN1481546A (zh) | 通过自适应变换改进源编码系统 | |
CN102479513B (zh) | 解码器及对比特错误加以隐藏的方法 | |
RU2328775C2 (ru) | Улучшенное маскирование ошибки в области частот | |
JPH0590974A (ja) | 前反響処理方法およびその装置 | |
De Martin et al. | Improved frame erasure concealment for CELP-based coders | |
KR101589709B1 (ko) | 여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치 | |
US20020040299A1 (en) | Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data | |
KR100686174B1 (ko) | 오디오 에러 은닉 방법 | |
CN1898722B (zh) | 经改善的频域误码掩蔽 | |
EP2355094B1 (en) | Sub-band processing complexity reduction | |
CN1145929C (zh) | 具有改进的编码器和解码器的传输系统 | |
JPH06259098A (ja) | 適応ブロック長変換符号化のブロック長選択装置 | |
CN1127054C (zh) | 用于知觉音频编码的信号处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |