TWI466102B - 用以使經編碼音訊資料之錯誤消隱的方法和裝置 - Google Patents

用以使經編碼音訊資料之錯誤消隱的方法和裝置 Download PDF

Info

Publication number
TWI466102B
TWI466102B TW098118917A TW98118917A TWI466102B TW I466102 B TWI466102 B TW I466102B TW 098118917 A TW098118917 A TW 098118917A TW 98118917 A TW98118917 A TW 98118917A TW I466102 B TWI466102 B TW I466102B
Authority
TW
Taiwan
Prior art keywords
parameters
frame
parameter value
value
sin
Prior art date
Application number
TW098118917A
Other languages
English (en)
Other versions
TW201005730A (en
Inventor
Lasse Laaksonen
Mikko Tammi
Adriana Vasilache
Anssi Ramo
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of TW201005730A publication Critical patent/TW201005730A/zh
Application granted granted Critical
Publication of TWI466102B publication Critical patent/TWI466102B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Description

用以使經編碼音訊資料之錯誤消隱的方法和裝置 發明領域
本發明與音訊資料的編碼及解碼有關。特別地,本發明與經編碼音訊資料中的錯誤消隱有關。
發明背景
本節意欲為在申請專利範圍中所述的本發明提供背景或脈絡。這裡所描述的可包括可推行的概念,但未必是先前已構思或已推行的概念。因此,除非於此另有指出,否則在本節中所描述的不會成為本申請案中之描述及申請專利範圍的先前技術,且不因為包含在本節中而被承認為先前技術。
也被稱為分層式編碼的嵌式可變速率編碼一般是指產生一位元串流,以使該位元串流的一子集可在具有良好品質下解碼的一語音編碼演算法。典型地,一核心編解碼器以一低位元率操作,且多個層在該核心之上使用,以提高輸出品質(包括例如可能地延伸頻寬或提高編碼的粒化)。在解碼器處,只有與該核心編碼解碼器相對應的位元串流部分,或者與該核心上的一個或多個層相對應的整個位元串流的額外部分或整個位元串流可獲解碼,以產生輸出信號。
國際電信聯盟電信標準化部門(ITU-T)處於開發G.718(被稱為EV-VBR)及G.729.1嵌式可變速率語音編碼解碼器的超寬頻(SWB)及立體聲擴展的過程中。從7kHz到14kHz擴展EV-VBR編碼解碼器之頻寬的SWB擴展及將被標準化的立體聲擴展橋接了語音與音訊編碼之間的間距。該G.718與G.729.1是其上可施加擴展之核心編碼解碼器的例子。
通道錯誤在無線通訊網路及封包網路中發生。這些錯誤可能造成到達接收器之資料區段中的一些損毀(例如受位元錯誤污染),而一些資料區段可能完全丟失或消除。例如,在G.718與G.729.1編碼解碼器的情況下,通道錯誤導致需要去處理訊框消除。存在於SWB(及立體聲)擴展中提供通道抗錯強健性的需要,特別是從G.718的角度來看。
發明概要
在本發明的一層面,一種經編碼音訊資料中之訊框錯誤消隱的方法包含以下步驟:接收多個訊框中的經編碼音訊資料;以及使用來自一個或多個先前訊框的已保存的一個或多個參數值,以重建具有訊框錯誤的訊框。使用該等已保存的一個或多個參數值之步驟包含至少部分基於該等已保存的一個或多個參數值得出參數值及將該等所得出的值施加到具有訊框錯誤的訊框。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存的參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與具有錯誤之一先前重建訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。該等MDCT頻譜值可針對整個較高頻率範圍,根據以下來縮放:
for k =0;k <L highspeCtrum k ++
m (k +L lowspectrum )=m prev (k)*fa e spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。該等正弦曲線分量值可根據以下來縮放:
for k =0;k <N sin k ++
m (pos sin (k )+L lowspectrum )=m p rev (pos sin (k))*fac sin
在一實施例中,該縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
在本發明的另一層面,一裝置包含受組配以接收多個訊框中的經編碼音訊資料的一解碼器;且該解碼器使用來自一先前訊框的已保存參數值,以重建具有訊框錯誤的訊框。使用該等已保存參數值之步驟包括縮放該等已保存參數值及將該等已縮放值施加到具有訊框錯誤的訊框。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與具有錯誤之一先前重建訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。該等MDCT頻譜值可針對整個較高頻率範圍,根據以下來縮放:
for k =0;k <L highspectrum k ++
m (k +L low spectru m )=mprev (k)*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。該等正弦曲線分量值可根據以下來縮放:
for k =0;k <N sin k ++
m (pos sin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin
在一實施例中,該縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
在另一層面,本發明與一裝置有關,該裝置包含一處理器及通訊連接到該處理器的一記憶體單元。該記憶體單元包括用於接收多個訊框中的經編碼音訊資料的電腦程式碼;以及用於使用來自一先前訊框的已保存參數值,以重建具有訊框錯誤之一訊框的電腦程式碼。用於使用該等已保存參數值的電腦程式碼包括用於縮放該等已保存參數值及將該等已縮放值施加到具有訊框錯誤之該訊框的電腦程式碼。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與先前所重建具有錯誤之訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。用於縮放的電腦程式碼可受組配以針對整個較高頻率範圍,根據以下縮放MDCT頻譜值:
for k =0;k <L highspectrum k ++
m (k +L lowspectrum )=m prev (k )*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。用於縮放的電腦程式碼可受組配以根據以下縮放正弦曲線分量值:
for k =0;k <N sink ++
m (pos sin (k )+L lowspectrum )=m prev (possin (k ))*fac sin
在一實施例中,該電腦程式碼縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
在另一層面,在一電腦可讀媒體上實現的電腦程式產品包含用於接收多個訊框中的經編碼音訊資料的電腦程式碼;以及用於使用來自一先前訊框的已保存參數值,以重建具有訊框錯誤之一訊框的電腦程式碼。用於使用該等已保存參數值的電腦程式碼包括用於縮放該等已保存參數值及將該等已縮放值施加到具有訊框錯誤之該訊框的電腦程式碼。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與先前所重建具有錯誤之訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。用於縮放的電腦程式碼可受組配以針對整個較高頻率範圍,根據以下來縮放MDCT頻譜值:
for k =0;k <L highspectrum k ++
m (k +L lowspectrum )=m prev (k )*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。用於縮放的電腦程式碼可受組配以根據以下縮放正弦曲線分量值:
for k =0;k <N si n;k ++
m (possin (k )+L lowspectrum )=m prev (pos sin (k))*fac sin
在一實施例中,該電腦程式碼縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
當結合所附圖式來理解時,本發明之各種實施例的這些及其他優點和特徵,連同其操作的安排和方式將從以下詳細描述變得清楚。
圖式簡單說明
本發明的示範性實施例透過參考所附圖式予以描述,其中:第1圖是說明根據本發明之一實施例的示範性訊框錯誤消隱方法的流程圖;第2A圖及第2B圖說明根據本發明之一實施例的訊框錯誤消隱方法對一通用訊框的應用;第3A圖及第3B圖說明根據本發明之一實施例的訊框錯誤消隱方法對一音調訊框的應用;第4圖是一系統的概要圖,其中本發明的各種實施例可在該系統中實施;第5圖說明一示範性電子裝置的透視圖,該電子裝置可根據本發明的各種實施例來使用;第6圖是電路的概要表示,該電路可包括在第5圖的電子裝置中;以及第7圖是一通用多媒體通訊系統的圖解表示,其中各種實施例可在該通用多媒體通訊系統中獲實施。
較佳實施例之詳細說明
在以下描述中,為了達到解釋而非限制的目的,提出了細節及描述,以提供對本發明的透徹理解。然而,對本技術領域中的那些具有通常知識者而言,將顯而易見的是,本發明可在脫離這些細節及描述的其他實施例中獲得實施。
訊框消除可能使核心編碼解碼器輸出失真。儘管訊框消除的知覺效應已透過用在編碼解碼器(諸如G.718)中的現存機制獲得最小化,但是時域與頻域兩者中的信號形狀可能受到相當大的影響,特別是在大量訊框損失之情況下。用於擴展編碼之方法的一個例子是將較低頻率成分映射到較高頻率。在這種方法中,在較低頻率成分上的訊框消除也可能影響較高頻率上的信號品質。這可能在已重建的輸出信號中導致聽覺及擾動失真。
用於一核心編碼解碼器(諸如上述G.718及G.729.1編碼解碼器)之擴展編碼架構的一示範性實施例可利用兩種模式。一種模式可能是較佳用於處理顯示出一週期性較高頻率範圍之音調信號的音調編碼模式。第二模式可能是處理其他類型訊框的一通用編碼模式。擴展編碼可在例如經修改離散餘弦轉換(MDCT)域中操作。在其他實施例中,諸如快速傅立葉轉換(FFT)的其他轉換可被使用。在音調編碼模式中,接近知覺上最相關信號分量的正弦曲線遭插入到該轉換域頻譜(例如MDCT頻譜)中。在通用編碼模式中,較高頻率範圍被分成一個或多個頻率帶,及在每一頻帶中最類似較高頻率成分的低頻率區域使用一組增益因數(例如兩個獨立的增益因數)遭映射到較高頻率。該技術的這種變化一般被稱為“頻寬擴展”。
針對訊框錯誤消隱,本發明之實施例利用使用通用及音調編碼模式的上述示範性架構(即一架構)的擴展編碼參數,以使擾動人工因素的數量最小化以及在訊框錯誤期間保持擴展部分的知覺信號特性。
在一實施例中,錯誤消隱被實施為一擴展編碼架構的一部分,該擴展編碼架構包括以訊框為基礎的分類、具有透過將較低頻率映射到較高頻率而遭構建的較高頻率範圍的一通用編碼模式(例如頻寬擴展模式),及透過插入多個正弦曲線分量訊框遭編碼的一音調編碼模式。在另一實施例中,錯誤消隱被實施為一擴展編碼架構的一部分,其中該擴展編碼架構針對不具有分類步驟的所有訊框使用這些方法的一組合(即用於該通用編碼模式及該音調編碼模式之機制的組合)。在又一實施例中,除通用模式及音調模式之外的額外的編碼模式可獲使用。
結合某一核心編碼(例如G.718核心編碼解碼器)使用的擴展編碼提供可用於訊框錯誤消隱的各種參數。擴展編碼架構中的可用參數可包含:核心編碼解碼器編碼模式、擴展編碼模式、通用編碼模式參數(例如用於頻帶的滯後索引、符號、用於頻帶映射的一組增益、時域能量調整參數、及如用於音調模式的類似參數)、以及音調模式參數(正弦曲線位置、符號、及振幅)。此外,經處理信號可由單一通道或多個通道(例如立體聲或雙耳信號)組成。
當針對較長錯誤叢發斜降(ramp)能量時,本發明的實施例允許針對個別訊框錯誤使較高頻率獲保持與先前訊框中知覺類似。因此,本發明的實施例也可用於從包括擴展成分的信號(例如一SWB信號)切換到只由核心編碼解碼器輸出組成的信號(例如WB信號),這可例如於位元流在解碼前遭截斷時,在嵌式可縮放編碼或傳輸中發生。
因為音調模式一般用於在較高頻率具有週期性質之信號的多個部分,本發明的某些實施例使用這些品質應也在訊框錯誤期間在信號中受保持,而非產生一不連續點之假設。儘管突然改變一些訊框中的能量位準可能產生知覺惱人效果,但是在通用訊框中目的可能是衰減錯誤輸出。根據本發明的某些實施例,能量的斜降相當緩慢地完成,因此針對單一訊框錯誤保持一個或多個先前訊框的知覺特性。在這方面,本發明的實施例可用於從擴展編碼解碼器輸出切換到核心編碼解碼器唯一輸出(例如當SWB層遭截斷時,從SWB到WB)。由於MDCT的重疊相加性質,來自先前(有效)訊框的成分影響第一已消除訊框(或者緊接在位元流截斷之後的訊框),以及能量之緩慢斜降與插入由具有零值取樣組成之訊框之間的差異對於一些信號而言可能未必是明顯的。
現參考第1圖,第1圖根據本發明之一實施例說明用於錯誤消隱的一示範性流程200。為了實施本發明的各種實施例,來自一個或多個先前訊框的較高層的MDCT頻譜及有關正弦曲線分量的資訊(例如位置、符號及振幅)可保持在記憶體中,以用於應該有一訊框錯誤的下一訊框(方塊202)。在方塊204,流程進入下一訊框且決定一訊框錯誤是否存在(方塊206)。若錯誤不存在,則流程返回到方塊202且保存上述參數。在一訊框錯誤期間,一個或多個先前訊框的MDCT頻譜從而是可得的且可受處理,例如遭縮小及遭傳遞作為目前訊框的高頻率成分。此外,有關正弦曲線分量的資訊(例如位置、符號及振幅)在MDCT頻譜中也是已知的。因此,一重建訊框可被產生(方塊208)。
第2A圖、第2B圖、第3A圖及第3B圖根據本發明的實施例說明訊框錯誤消隱的示範性實施。第2A圖及第2B圖說明將一訊框錯誤消隱施加到一通用訊框的結果。在這方面,第2A圖說明不具有訊框錯誤的一有效訊框210的頻譜。如上所述,來自一個或多個先前有效訊框210的較高層MDCT頻譜及正弦曲線分量資訊可被保存。第2B圖根據本發明的實施例說明在施加訊框錯誤消隱後取代一丟失訊框的一重建訊框220的一頻譜實例。如從第2A圖及第2B圖可注意到的是,當在正弦曲線分量212、214、222、224處施加一較弱衰減時,從一個(多個)先前訊框得出之成分的能量較強烈地衰減。
第3A圖及第3B圖說明一訊框錯誤消隱對一音調訊框的施加。在這方面,第3A圖說明不具有訊框錯誤的一有效訊框230,及第3B圖根據本發明的實施例說明在施加該訊框錯誤消隱後用來取代一丟失訊框的一重建訊框240。對於音調訊框230、240而言,甚至較第2A圖及第2B圖中之通用信號的正弦曲線分量212、214、222、224還弱的衰減被施加。
因此,根據本發明的實施例,處理MDCT頻譜可描述如下。針對整個較高頻率範圍,一第一縮放被執行:
for k =0;k <L highspectrum k ++
m (k +L lowspectrum )=m prev (k )*fac spect
針對正弦曲線分量,施加一第二縮放如下:
for k =0;k <N sink ++
m (possin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin
在其他實施例中,不是將一恆定縮放因數施加到所有頻率分量,而是使用一縮放函數也是可能的,其中該縮放函數例如衰減高頻率範圍的較高部分多於較低部分。
根據本發明的實施例,縮放因數值可基於資訊(諸如用於錯誤消隱處理之先前訊框的類型)來決定。在一實施例中,只是先前有效訊框的擴展編碼模式(例如SWB模式)被考慮。若其是一通用訊框,則例如0.5及0.6的縮放因數被使用。對於一音調訊框而言,針對正弦曲線分量的振幅,一縮放因數0.9可被使用。因此,在該實施例中,在音調訊框中的MDCT頻譜中,除正弦曲線分量以外不存在其他成分,且獲得目前訊框之MDCT頻譜m (k )的過程因此可大大簡化。在其他實施例中,可能存在正弦曲線以外的成分,其中可被認為是音調模式。
值得注意的是,在某些實施例中,來自先前訊框中的一個以上訊框的資料可被考慮。再者,一些實施例可使用例如來自最近訊框以外的一單一先前訊框的資料。在又一實施例中,來自一個或多個另外訊框的資料可被考慮。
在丟失訊框的MDCT頻譜重建後,其可以類似於有效訊框的方式來處理。因此,一反轉換可被施加,以獲得時域信號。在某些實施例中,來自該丟失訊框的MDCT頻譜也可被保存以用於下一訊框,在該下一訊框也將丟失及錯誤消隱處理需要被喚起的情況下。
在本發明的某些實施例中,現在時域中的另外縮放可施加到信號。在可例如結合G.718或G.729.1編碼解碼器使用的於此用作一範例的架構中,信號縮小(downscaling)可在時域中執行,例如以逐個子訊框為基礎,每一訊框中多於8個子訊框,假設這在編碼器端被認為是必要的。根據本發明的實施例,為了避免在較高頻率引入不必要的強能量成分,可用來避免這一點的量測的兩個例子接下來將介紹。
首先,在先前有效訊框是通用編碼之情況下,逐個子訊框縮小可獲實施。其可利用例如先前有效訊框的縮放值或設計用於訊框消除的一特定縮放方案。後者可以是例如目前訊框之高頻率能量的一簡單斜降。
其次,較高頻帶中的成分可利用一個或多個丟失(已重建)訊框上的一平滑窗來斜降。在各種實施例中,除先前時域縮放以外或它們的代替,這一動作可被執行。
用於該縮放方案的決策邏輯元件在本發明的不同實施例中可能較複雜或較不複雜。特別地,在一些實施例中,核心編碼解碼器編碼模式可被認為是伴隨擴展編碼模式。在一些實施例中,核心編碼解碼器的一些參數可被考慮。在一實施例中,在第一丟失訊框後音調模式旗標被切換為零,以在訊框消除狀態長於一個訊框之情況下使正弦曲線分量較快地縮減。
因此,本發明之實施例在訊框消除期間提供提高的性能,而不引入任何惱人人工因素。
第4圖顯示一系統10,其中本發明的各種實施例可用在該系統中,該系統10包含可透過一個或多個網路通訊的多個通訊裝置。該系統10可包含有線或無線網路的任一組合,該等有線或無線網路包括但不限於一行動電話網路、一無線區域網路(LAN)、一藍牙個人區域網路、一乙太網路LAN、一訊標環LAN、一廣域網路、網際網路等。該系統10可包括有線及無線通訊裝置兩者。
作為例證,在第4圖中所顯示的系統10包括一行動電話網路11及網際網路28。與網際網路28的連接可包括但不限於:遠端無線連接體、短程無線連接體、及包括但不限於電話線、電纜線、電力線及諸如此類的各種有線連接。
系統10的示範通訊裝置可包括但不限於:以行動電話形式的一電子裝置12、一個人數位助理(PDA)與行動電話之組合14、一PDA 16、一整合傳訊裝置(IMD)18、一桌上型電腦20、一筆記型電腦22等。當該等通訊裝置被一移動個體所攜帶時,其等可能是固定的或行動的。該等通訊裝置也可以設置處於運輸模式,包括但不限於汽車、卡車、計程車、公車、火車、輪船、飛機、自行車、摩托車等。該等通訊裝置中的一些或全部可發送及接收呼叫及訊息,以及透過無線連接25到基地台24與服務提供商通訊。該基地台24可連接到允許行動電話網路11與網際網路28之間的通訊的網路伺服器26。該系統10可包括額外的通訊裝置及不同類型的通訊裝置。
該等通訊裝置可使用各種傳輸技術通訊,包括但不限於分碼多重接取(CDMA)、全球行動通信系統(GSM)、通用移動電信系統(UMTS)、分時多重接取(TDMA)、分頻多重接取(FDMA)、傳輸控制協定/網際網路協定(TCP/IP)、短消息服務(SMS)、多媒體傳訊服務(MMS)、電子郵件、即時傳訊服務(IMS)、藍牙(Bluetooth)、IEEE 802.11等。涉及實施本發明之各種實施例的通訊裝置可使用各種媒體通訊,包括但不限於無線電、紅外線、雷射、電纜連接體及諸如此類的媒體。
第5圖及第6圖顯示根據本發明之各種實施例的可用作一網路節點的一代表性電子裝置28。然而,應理解的是,本發明的範圍不意欲限於一特定類型的裝置。第5圖及第6圖的電子裝置28包括一外殼30、以液晶顯示器形式的一顯示器32、一鍵盤34、一麥克風36、一耳機38、一電池40、一紅外線埠42、一天線44、根據一實施例以UICC形式的一智慧卡46、一讀卡機48、無線電介面電路52、編碼解碼器電路54、一控制器56及一記憶體58。根據本發明的各種實施例,上述元件使電子裝置28向可能存在於一網路上的其他裝置發送或從該等其他裝置接收各種訊息。個別電路及元件全部屬於本技術領域中的一所熟知類型,例如是諾基亞(Nokia)系列的行動電話。
第7圖是一通用多媒體通訊系統的圖解表示,各種實施例可在該通用多媒體通訊系統中獲實施。如在第7圖中所示,一資料來源100以一類比、未壓縮數位、或壓縮數位格式、或這些格式之任一組合提供一源信號。編碼器110將該源信號編碼成經編碼媒體位元流。應注意的是,一將解碼的位元流可直接或間接地從設置在幾乎任一類型網路中的一遠端裝置接收。此外,位元流可從本地硬體或軟體接收。編碼器110可能能夠編碼一種以上的媒體類型(諸如音訊及視訊),或者一個以上的編碼器110可能被需要以編碼不同媒體類型的源信號。該編碼器110也可獲得合成產生的輸入(諸如圖形與文本),或者其可能能夠產生合成媒體的編碼位元流。在下文中,只有一種媒體類型的經編碼媒體位元流的處理被考慮,以簡化該描述。然而,應注意的是,通常即時廣播服務包含若干串流(通常至少一個音訊、視訊及本文子標題串流)。也應注意的是,系統可包括許多編碼器,但是在第7圖中,只表示了一個編碼器110,以在不缺乏一般性的情況下簡化描述。應進一步理解的是,儘管於此所包含的本文及實例可特別描述一編碼過程,但是在本技術領域中的具有通常知識者將理解的是,相同的概念及原理也可應用到相對應的解碼過程,反之亦然。
經編碼媒體位元流遭傳送到儲存器120。該儲存器120可包含用以儲存經編碼媒體位元流的任一類型的大量記憶體。在儲存器120中的經編碼媒體位元流的格式可能是基本的自包含位元流格式,或者一個或多個經編碼媒體位元流可遭包封到一容器檔案中。一些系統“實況”操作,即忽略儲存且從編碼器110直接向發送器130傳送經編碼媒體位元流。然後該經編碼媒體位元流遭傳送到根據需要也被稱為伺服器的發送器130。在該傳輸中所使用的格式可以是一基本的自包含位元流格式、一封包串流格式,或者一個或多個經編碼媒體位元流可遭包封到一容器檔案中。編碼器110、儲存器120、及伺服器130可存在於同一實體裝置中,或者其等可包括在獨立的裝置中。編碼器110及伺服器130可用實況即時內容操作,在這種情況下,已編碼媒體位元流通常不永久地儲存,而是在內容編碼器110及/或伺服器130中緩衝多個小的時間週期,以消除處理延遲、傳送延遲、及經編碼媒體位元率中的變化。
伺服器130使用一通訊協定堆疊發送經編碼媒體位元流。該堆疊可包括但不限於即時傳送協定(RTP)、使用者資料報協定(UDP)、及網際網路協定(IP)。當該通訊協定堆疊是封包導向時,伺服器130將經編碼媒體位元流包封成封包。例如,當RTP被使用時,伺服器130根據RTP有效負載的格式將經編碼媒體位元流包封成RTP封包。典型地,每一媒體類型具有一專用RTP有效負載格式。再次應注意的是,系統可包含一個以上的伺服器130,但是為了簡化起見,以下描述只考慮一個伺服器130。
伺服器130可能或可能不透過一通訊網路連接到閘道器140。該閘道器140可執行不同類型的功能,諸如轉譯根據一通訊協定堆疊之封包串流到另一通訊協定堆疊、合併及分支資料串流、及根據下行鏈路及/或接收器能力處理資料串流,諸如根據主要下行鏈路網路狀態控制受轉發串流的位元率。閘道器140的例子包括MCU、電路交換與封包交換視訊電話之間的閘道器、蜂巢式按鈕通話(PoC)伺服器、數位視訊手持廣播(DVB-H)系統中的IP包封器、或者將廣播傳輸本地轉發到家庭無線網路的視訊盒。當RTP被使用時,閘道器140被稱為RTP混合器或RTP轉譯器,且典型地作為一RTP連接體的端點。
該系統包括一個或多個接收器150,其(等)通常能夠接收、解調變、及將所傳送信號解包封成經編碼媒體位元流。經編碼媒體位元流遭傳送到一記錄儲存器155。該記錄儲存器155可包含任何類型的大量記憶體,用以儲存經編碼媒體位元流。該記錄儲存器155可選擇性地或額外地包含諸如隨機存取記憶體的計算記憶體。在記錄儲存器155中的經編碼媒體位元流的格式可以是基本的自包含位元流格式,或者一個或多個經編碼媒體位元流可遭包封成一容器檔案。若存在多個經編碼媒體位元流,諸如彼此相關聯的一音訊串流與一視訊串流,則一容器檔案通常被使用,且接收器150包含或遭附接到從輸入串流產生容器檔案的一容器檔案產生器。一些系統“實況”操作,即忽略記錄儲存器155且從接收器150直接向解碼器160傳送經編碼媒體位元流。在一些系統中,只是所記錄串流的最近部分(例如該所記錄串流的最近10分鐘選錄(excerption))在記錄儲存器155中獲保持,而任何較早記錄的資料從記錄儲存器155中遭丟棄。
已編碼媒體位元流從記錄儲存器155遭傳送到解碼器160。若存在許多已編碼媒體位元流,諸如彼此相關聯且遭包封到一容器檔案中的一音訊串流與一視訊串流,則一檔案剖析器(在該圖中沒有顯示)用來從該容器檔案解包封每一已編碼媒體位元流。該記錄儲存器155或解碼器160可包含該檔案剖析器,或者該檔案剖析器遭附接到記錄儲存器155或解碼器160。
已編碼媒體位元流通常進一步受解碼器160處理,解碼器160的輸出是一個或多個未壓縮媒體串流。最後,一呈現器(renderer)170可用例如一揚聲器或一顯示器再現該等未壓縮媒體串流。接收器150、記錄儲存器155、解碼器160、及呈現器170可存在於同一實體裝置中或者它們可包括在多個獨立裝置中。
根據各種實施例的發送器130可受組配以由於多個原因,諸如根據接收器150的請求或傳送位元流之網路的主要狀態,選擇所傳送層。來自接收器的請求可能是,例如改變用於顯示器的層及改變較先前的具有不同能力的呈現裝置。
於此描述的各種實施例是在方法步驟或流程的一般脈絡中予以描述的,該等方法步驟或流程可透過一電腦程式產品在一個實施例中實施,該電腦程式產品在一電腦可讀媒體中獲實現且包括在網路環境中由電腦執行之電腦可執行指令(諸如程式碼)。電腦可讀媒體可包括可移式及非可移式儲存裝置,包括但不限於唯讀記憶體(ROM)、隨機存取記憶體(RAM)、光碟(CD)、數位多樣化碟片(DVD)等。一般地,程式模組可包括執行特定任務或實施特定抽象資料類型的例行程序、程式、物件、組件、資料結構等。與資料結構相關聯的電腦可執行指令及程式模組表示用於執行於此所揭露之方法之步驟的程式碼的例子。這些可執行指令或相關聯資料結構的特定順序表示用於實施在這些步驟或流程中所述之功能的相對應動作的例子。
本發明的實施例可在軟體、硬體、應用程式邏輯元件或軟體、硬體及應用程式邏輯元件的一組合中實施。該等軟體、應用程式邏輯元件及/或硬體可存在於例如一晶片組、一行動裝置、一桌上型電腦、一膝上型電腦或一伺服器上。各種實施例的軟體及網路實施可用具有基於規則之邏輯元件及其他邏輯元件的多個標準規劃技術實現,用以實現各種資料庫搜尋步驟或流程、相關步驟或流程、比較步驟或流程及決策步驟或流程。各種實施例也可完全或部分地在網路元件或模組中實施。應注意的是,如於此所使用且在下面申請專利範圍中的詞“元件”及“模組”意欲包含使用一行或多行軟體程式碼的實施、及/或硬體實施、及/或用於接收手動輸入的設備。
實施例的上述描述已出於說明與描述的目的提出。上述描述不意欲是詳盡無遺的或將本發明的實施例限制於所揭露的確切形式,而是鑒於以上教示,修改與變化是可能的,或者可從各種實施例的實施獲得。於此所討論的實施例被選擇與描述,以解釋各種實施例的原理與性質及其實際應用,以使本技術領域中具有通常知識者在各種實施例中利用本發明,且其中各種修改對於所設想的特定用途是合適的。於此所述實施例的特徵可包含在方法、裝置、模組、系統及電腦程式產品的所有可能組合中。
在本發明的一層面,一種經編碼音訊資料中的訊框錯誤消隱方法包含以下步驟:接收多個訊框中的經編碼音訊資料;以及使用來自一個或多個先前訊框的已保存的一個或多個參數值,以重建具有訊框錯誤的一訊框。使用該等已保存的一個或多個參數值之步驟包含至少部分基於該等已保存的一個或多個參數值得出參數值及將該等所得出的值施加到具有訊框錯誤的該訊框。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與先前所重建的具有錯誤的訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。該等MDCT頻譜值可針對整個較高頻率範圍根據以下來縮放:
for k =0;k <L highspectrum k ++
m (k +L lowspectrum )=m prev (k )*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。該等正弦曲線分量值可根據以下來縮放:
for k =0;k <N sink ++
m (pos sin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin
在一實施例中,該縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
在本發明的另一層面,一裝置包含受組配以接收多個訊框中的經編碼音訊資料的一解碼器;以及使用來自一先前訊框的已保存參數值,以重建具有訊框錯誤的一訊框。使用該等已保存參數值之步驟包括縮放該等已保存參數值及將該等已縮放參數值施加到具有訊框錯誤的該訊框。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與先前所重建的具有錯誤的訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。該等MDCT頻譜值可針對整個較高頻率範圍根據以下來縮放:
for k =0;k <L highspectrum k ++
m (k +L lowspect rum )=m prev (k )*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。該等正弦曲線分量值可根據以下來縮放:
for k =0;k <N sink ++
m (possin (k )+L lowspect rum )=mp rev (possin (k ))*fac sin
在一實施例中,該縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
在另一層面,本發明與一裝置有關,該裝置包含一處理器及通訊連接到該處理器的一記憶體單元。該記憶體單元包括用於接收多個訊框中的經編碼音訊資料的電腦程式碼;以及用於使用來自一先前訊框的已保存參數值,以重建具有訊框錯誤之一訊框的電腦程式碼。用於使用該等已保存參數值的電腦程式碼包括用於縮放該等已保存參數值及將該等已縮放值施加到具有訊框錯誤之該訊框的電腦程式碼。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與先前所重建的具有錯誤訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。用於縮放的電腦程式碼可受組配以針對整個較高頻率範圍根據以下縮放MDCT頻譜值:
for k =0;k <L highspectrum k ++
m (k +L lowspectrum )=m prev (k )*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。用於縮放的電腦程式碼可受組配以根據以下來縮放正弦曲線分量值:
for k =0;k <N sink ++
m (pos sin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin
在一實施例中,該電腦程式碼縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
在另一層面,在一電腦可讀媒體上實現的電腦程式產品包含用於接收多個訊框中的經編碼音訊資料的電腦程式碼;以及用於使用來自一先前訊框的已保存參數值,以重建具有訊框錯誤之一訊框的電腦程式碼。用於使用該等已保存參數值的電腦程式碼包括用於縮放該等已保存參數值及將該等已縮放值施加到具有訊框錯誤之該訊框的電腦程式碼。
在一實施例中,該等已保存參數值與不具有錯誤之一個或多個先前訊框的參數值相對應。在一實施例中,該等已保存參數值與不具有錯誤之最近的先前訊框的參數值相對應。在一實施例中,該等已保存參數值與先前所重建的具有錯誤訊框的參數值相對應。
在一實施例中,該等已保存參數值遭縮放,以使週期分量保持在較高頻率。
在一實施例中,該等已保存參數值包括經修改離散餘弦轉換(MDCT)頻譜值。用於縮放的電腦程式碼可受組配以針對整個較高頻率範圍根據以下來縮放MDCT頻譜值:
for k =0;k <L highspec t rum k ++
m (k +L lowspectrum )=m prev (k )*fac spect
在一實施例中,該等已保存參數值包括正弦曲線分量值。用於縮放的電腦程式碼可受組配以根據以下來縮放正弦曲線分量值:
for k =0;k <N sink ++
m (possin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin
在一實施例中,該電腦程式碼縮放受組配以針對較長的錯誤叢發逐漸地斜降能量。
10...系統
11...行動電話網路
12...電子裝置
14...個人數位助理(PDA)與行動電話的組合
16...個人數位助理(PDA)
18...整合傳訊裝置(IMD)
20...桌上型電腦
22...筆記型電腦
24...基地台
25...無線連接體
26...網路伺服器
28...網際網路
30...外殼
32...液晶顯示器
34...鍵盤
36...麥克風
38...耳機
40...電池
42...紅外線埠
44...天線
46...UICC形式一智慧卡
48...讀卡機
52...無線電介面電路
54...編碼解碼器電路
56...控制器
58...記憶體
100...資料來源
110...編碼器
120...儲存器
130...發送器/伺服器
140...閘道器
150...接收器
160...解碼器
170...呈現器
200...流程
202~208...流程步驟
210、230...有效訊框
212、214...正弦曲線分量
222、224...正弦曲線分量
220、240...重建訊框/音調訊框
第1圖是說明根據本發明之一實施例的示範性訊框錯誤消隱方法的流程圖;第2A圖及第2B圖說明根據本發明之一實施例的訊框錯誤消隱方法對一通用訊框的應用;第3A圖及第3B圖說明根據本發明之一實施例的訊框錯誤消隱方法對一音調訊框的應用;第4圖是一系統的概要圖,其中本發明的各種實施例可在該系統中實施;第5圖說明一示範性電子裝置的透視圖,該電子裝置可根據本發明的各種實施例來使用;第6圖是電路的概要表示,該電路可包括在第5圖的電子裝置中;以及第7圖是一通用多媒體通訊系統的圖解表示,其中各種實施例可在該通用多媒體通訊系統中獲實施。
200...流程
202~208...流程步驟

Claims (24)

  1. 一種用於經編碼音訊資料中之訊框錯誤消隱的方法,其包含以下步驟:接收多個訊框中的經編碼音訊資料;以及基於來自該等多個訊框中的至少一個其他訊框的至少一個已保存參數值,針對具有訊框錯誤的一訊框重建至少一個參數,其中重建至少一個參數之步驟包含以下步驟:使用一第一方法至少部分基於該至少一個已保存參數值得出一第一組參數的值;使用一第二方法至少部分基於該至少一個已保存參數值得出一第二組參數的值;將該等針對該等第一組參數及第二組參數所得出的值施加到具有訊框錯誤的該訊框,其中該第一組參數包含經修改離散餘弦轉換頻譜值,且該第二組參數包含插入於該經修改離散餘弦轉換頻譜中的正弦分量。
  2. 如申請專利範圍第1項所述之方法,其中該至少一個已保存參數值包含以下中的至少一個:不具有錯誤之至少一個先前訊框的至少一個參數值;不具有錯誤之最近的先前訊框的至少一個參數值;具有錯誤之至少一個先前所重建訊框的至少一個 參數值;以及至少一個將來訊框的至少一個參數值。
  3. 如申請專利範圍第1項所述之方法,其中該使用該第一方法得出值之步驟包含用一第一組縮放因子縮放該至少一個已保存參數值,且該使用該第二方法得出值之步驟包含用一第二組縮放因子縮放該至少一個已保存參數值。
  4. 如申請專利範圍第1項所述之方法,其中該第一組參數包含用於一高頻率範圍的參數。
  5. 如申請專利範圍第1項所述之方法,其中該第二組參數包含該第一組參數的一子集。
  6. 如申請專利範圍第1項所述之方法,其中該第一方法包含針對該第一組參數根據以下來得出參數值mfor k =0;k <L highspectrum k ++m (k +L lowspectrum )=m prev (k )*fac spect 其中m prev 表示該至少一個已保存參數值,且fac spect 表示各自的縮放因子。
  7. 如申請專利範圍第1項所述之方法,其中該第二方法包含針對該第二組參數根據以下來得出該等參數值mfor k =0;k <N sink ++m (pos sin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin 其中m prev 表示該至少一個已保存參數值,fac sin 表示各自的縮放因子,且pos sin mm prev 中的該第二組參數之位 置的一變數描述。
  8. 如申請專利範圍第1項所述之方法,其中得出參數值之步驟包含逐漸地斜降信號能量。
  9. 一種用於經編碼音訊資料中之訊框錯誤消隱的裝置,其包含:至少一處理器;包括電腦程式碼之至少一記憶體,其中該至少一記憶體及該電腦程式碼經組配以該至少一處理器致使該裝置至少進行以下動作:接收多個訊框中的經編碼音訊資料;以及基於來自該等多個訊框中的至少一個其他訊框的至少一個已保存參數值,針對具有訊框錯誤的一訊框重建至少一個參數,其中重建至少一個參數之步驟包含以下步驟:使用一第一方法至少部分基於該至少一個已保存參數值得出一第一組參數的值;使用一第二方法至少部分基於該至少一個已保存參數值得出一第二組參數的值;以及將該等針對該等第一組參數及第二組參數所得出的值施加到具有訊框錯誤的該訊框,其中該第一組參數包含經修改離散餘弦轉換頻譜值,且該第二組參數包含插入於該經修改離散餘弦轉換頻譜中的正弦分量。
  10. 如申請專利範圍第9項所述之裝置,其中該至少一個已保存參數值包含以下中的至少一個:不具有錯誤之至少一個先前訊框的至少一個參數值;不具有錯誤之最近的先前訊框的至少一個參數值;具有錯誤之至少一個先前所重建訊框的至少一個參數值;以及至少一個將來訊框的至少一個參數值。
  11. 如申請專利範圍第9項所述之裝置,其中包括該電腦程式碼之該至少一記憶體經組配以該至少一處理器致使該裝置使用該第一方法得出值之動作包含用一第一組縮放因子縮放該至少一個已保存參數值,且該使用該第二方法得出值之動作包含用一第二組縮放因子縮放該至少一個已保存參數值。
  12. 如申請專利範圍第9項所述之裝置,其中該第一組參數包含用於一高頻率範圍的參數。
  13. 如申請專利範圍第9項所述之裝置,其中該第二組參數包含該第一組參數的一子集。
  14. 如申請專利範圍第9項所述之裝置,其中該第一方法包含針對該第一組參數根據以下來得出參數值mfor k =0;k <L highspectrum k ++m (k +L lowspectrum )=m prev (k )*fac spect 其中m prev 表示該至少一個已保存參數值,且fac spect 表示 各自的縮放因子。
  15. 如申請專利範圍第9項所述之裝置,其中該第二方法包含針對該第二組參數根據以下來得出該等參數值mfor k =0;k <N sink ++m (pos sin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin 其中m prev 表示該至少一個已保存參數值,fac sin 表示各自的縮放因子,且pos sin mm prev 中的該第二組參數之位置的一變數描述。
  16. 如申請專利範圍第9項所述之裝置,其中得出參數值之步驟包含逐漸地斜降信號能量。
  17. 一種電腦可讀記憶體,該電腦可讀記憶體儲存收錄在其中以一裝置而使用的電腦程式碼,該電腦程式碼藉由至少一處理器以致使該裝置執行包含下列之作業:接收多個訊框中的經編碼音訊資料;以及基於來自該等多個訊框中的至少一個其他訊框的至少一個已保存參數值,針對具有訊框錯誤的一訊框重建至少一個參數,其中重建至少一個參數包含:使用一第一方法至少部分基於該至少一個已保存參數值得出一第一組參數之值;使用一第二方法至少部分基於該至少一個已保存參數值得出一第二組參數之值;以及將該等針對該等第一組參數及第二組參數所 得出的值施加到具有訊框錯誤的該訊框,其中該第一組參數包含經修改離散餘弦轉換頻譜值,且該第二組參數包含插入於該經修改離散餘弦轉換頻譜中的正弦分量。
  18. 如申請專利範圍第17項所述之電腦可讀記憶體,其中該至少一個已保存參數值包含以下中的至少一個:不具有錯誤之至少一個先前訊框的至少一個參數值;不具有錯誤之最近的先前訊框的至少一個參數值;具有錯誤之至少一個先前所重建訊框的至少一個參數值;以及至少一個將來訊框的至少一個參數值。
  19. 如申請專利範圍第17項所述之電腦可讀記憶體,其中該使用該第一方法得出值之動作包含用一第一組縮放因子縮放該至少一個已保存參數值,且該使用該第二方法得出值之動作包含用一第二組縮放因子縮放該至少一個已保存參數值。
  20. 如申請專利範圍第17項所述之電腦可讀記憶體,其中該第一組參數包含用於一高頻率範圍的參數。
  21. 如申請專利範圍第17項所述之電腦可讀記憶體,其中該第二組參數包含該第一組參數的一子集。
  22. 如申請專利範圍第17項所述之電腦可讀記憶體,其中該第一方法包含針對該第一組參數根據以下來得出參數 值mfor k =0;k <L highspectrum k ++m (k +L lowspectrum )=m prev (k )*fac spect 其中m prev 表示該至少一個已保存參數值,且fac spect 表示各自的縮放因子。
  23. 如申請專利範圍第17項所述之電腦可讀記憶體,其中該第二方法包含針對該第二組參數根據以下來得出該等參數值mfor k =0;k <N sink ++m (pos sin (k )+L lowspectrum )=m prev (pos sin (k ))*fac sin 其中m prev 表示該至少一個已保存參數值,fac sin 表示各自的縮放因子,且pos sin mm prev 中的該第二組參數之位置的一變數描述。
  24. 如申請專利範圍第17項所述之電腦可讀記憶體,其中得出參數值之動作包含逐漸地斜降信號能量。
TW098118917A 2008-06-13 2009-06-06 用以使經編碼音訊資料之錯誤消隱的方法和裝置 TWI466102B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US6157208P 2008-06-13 2008-06-13

Publications (2)

Publication Number Publication Date
TW201005730A TW201005730A (en) 2010-02-01
TWI466102B true TWI466102B (zh) 2014-12-21

Family

ID=41416403

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098118917A TWI466102B (zh) 2008-06-13 2009-06-06 用以使經編碼音訊資料之錯誤消隱的方法和裝置

Country Status (10)

Country Link
US (1) US8397117B2 (zh)
EP (1) EP2301015B1 (zh)
KR (1) KR101228165B1 (zh)
CN (1) CN102057424B (zh)
AU (1) AU2009256551B2 (zh)
BR (1) BRPI0915358B1 (zh)
RU (1) RU2475868C2 (zh)
TW (1) TWI466102B (zh)
WO (1) WO2009150290A1 (zh)
ZA (1) ZA201100279B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI797441B (zh) * 2019-04-11 2023-04-01 弗勞恩霍夫爾協會 音訊解碼器、用以決定定義濾波器特性之一組值之裝置、用以提供經解碼音訊表示型態之方法、用以決定定義濾波器特性之一組值之方法、及電腦程式

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
WO2012070370A1 (ja) 2010-11-22 2012-05-31 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置、方法およびプログラム、並びに、音声復号装置、方法およびプログラム
US20130144632A1 (en) * 2011-10-21 2013-06-06 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
CN104718570B (zh) * 2012-09-13 2017-07-18 Lg电子株式会社 帧丢失恢复方法,和音频解码方法以及使用其的设备
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
WO2014108738A1 (en) 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder
PL2956932T3 (pl) * 2013-02-13 2017-01-31 Telefonaktiebolaget Lm Ericsson (Publ) Ukrycie błędu klatki
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
RU2665253C2 (ru) 2013-06-21 2018-08-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона
PT3011555T (pt) 2013-06-21 2018-07-04 Fraunhofer Ges Forschung Reconstrução de uma estrutura de discurso
CN103646647B (zh) * 2013-12-13 2016-03-16 武汉大学 混合音频解码器中帧差错隐藏的谱参数代替方法及系统
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
US9911423B2 (en) 2014-01-13 2018-03-06 Nokia Technologies Oy Multi-channel audio signal classifier
CN104934035B (zh) 2014-03-21 2017-09-26 华为技术有限公司 语音频码流的解码方法及装置
CN105374367B (zh) * 2014-07-29 2019-04-05 华为技术有限公司 异常帧检测方法和装置
BR112017010911B1 (pt) 2014-12-09 2023-11-21 Dolby International Ab Método e sistema de decodificação para ocultar erros em pacotes de dados que devem ser decodificados em um decodificador de áudio baseado em transformação de cosseno discreto modificado
CA3016949C (en) * 2016-03-07 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
JP6883047B2 (ja) 2016-03-07 2021-06-02 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 適切に復号されたオーディオフレームの復号化表現の特性を使用する誤り隠蔽ユニット、オーディオデコーダ、および関連する方法およびコンピュータプログラム
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2020164753A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method selecting an error concealment mode, and encoder and encoding method
WO2020165260A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode channel coding with mode specific coloration sequences
CN117354585A (zh) * 2023-12-06 2024-01-05 深圳感臻智能股份有限公司 一种针对视频网络丢包的优化方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148487A (en) * 1990-02-26 1992-09-15 Matsushita Electric Industrial Co., Ltd. Audio subband encoded signal decoder
TW530296B (en) * 1999-10-28 2003-05-01 Qualcomm Inc Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US20040128128A1 (en) * 2002-12-31 2004-07-01 Nokia Corporation Method and device for compressed-domain packet loss concealment
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
TW200534612A (en) * 2003-12-19 2005-10-16 Nokia Corp Codec-assisted capacity enhancement of wireless voip
US20060093048A9 (en) * 2003-12-19 2006-05-04 Anisse Taleb Partial Spectral Loss Concealment In Transform Codecs

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144671A (en) 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
TW241350B (zh) * 1991-11-07 1995-02-21 Rca Thomson Licensing Corp
JP3085606B2 (ja) * 1992-07-16 2000-09-11 ヤマハ株式会社 ディジタルデータの誤り補正方法
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
SE504397C2 (sv) 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US5797121A (en) 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
US5825320A (en) 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
FI106325B (fi) 1998-11-12 2001-01-15 Nokia Networks Oy Menetelmä ja laite tehonsäädön ohjaamiseksi
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
US7047187B2 (en) * 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
EP1589330B1 (en) * 2003-01-30 2009-04-22 Fujitsu Limited Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
WO2005104094A1 (ja) 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
WO2006001841A1 (en) * 2004-06-10 2006-01-05 Imerys Kaolin, Inc. Ultra-low residue, high solids, wet cake products and methods of making same
JP5202960B2 (ja) * 2005-01-31 2013-06-05 スカイプ 通信システムにおけるフレームの連結方法
US20060184363A1 (en) 2005-02-17 2006-08-17 Mccree Alan Noise suppression
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
EP1943643B1 (en) 2005-11-04 2019-10-09 Nokia Technologies Oy Audio compression
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
KR101292771B1 (ko) 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
US20100274555A1 (en) 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148487A (en) * 1990-02-26 1992-09-15 Matsushita Electric Industrial Co., Ltd. Audio subband encoded signal decoder
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
TW530296B (en) * 1999-10-28 2003-05-01 Qualcomm Inc Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US20040128128A1 (en) * 2002-12-31 2004-07-01 Nokia Corporation Method and device for compressed-domain packet loss concealment
TW200534612A (en) * 2003-12-19 2005-10-16 Nokia Corp Codec-assisted capacity enhancement of wireless voip
US20060093048A9 (en) * 2003-12-19 2006-05-04 Anisse Taleb Partial Spectral Loss Concealment In Transform Codecs

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI797441B (zh) * 2019-04-11 2023-04-01 弗勞恩霍夫爾協會 音訊解碼器、用以決定定義濾波器特性之一組值之裝置、用以提供經解碼音訊表示型態之方法、用以決定定義濾波器特性之一組值之方法、及電腦程式

Also Published As

Publication number Publication date
WO2009150290A1 (en) 2009-12-17
EP2301015A1 (en) 2011-03-30
EP2301015A4 (en) 2016-04-13
KR101228165B1 (ko) 2013-01-30
EP2301015B1 (en) 2019-09-04
AU2009256551A1 (en) 2009-12-17
ZA201100279B (en) 2012-06-27
AU2009256551B2 (en) 2015-08-13
KR20110040835A (ko) 2011-04-20
RU2475868C2 (ru) 2013-02-20
US20100115370A1 (en) 2010-05-06
US8397117B2 (en) 2013-03-12
TW201005730A (en) 2010-02-01
CN102057424B (zh) 2015-06-17
RU2010154191A (ru) 2012-07-20
BRPI0915358B1 (pt) 2020-04-22
CN102057424A (zh) 2011-05-11
BRPI0915358A2 (pt) 2015-11-03

Similar Documents

Publication Publication Date Title
TWI466102B (zh) 用以使經編碼音訊資料之錯誤消隱的方法和裝置
JP5301471B2 (ja) 音声符号化システム及び方法
JP2015092254A (ja) 帯域幅拡張のためのスペクトル平坦性制御
KR101548846B1 (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
Hwang Multimedia networking: From theory to practice
JPWO2006046546A1 (ja) 音声符号化装置および音声符号化方法
KR102019617B1 (ko) 프레임간 시간 시프트 변동들에 대한 채널 조정
US9767822B2 (en) Devices for encoding and decoding a watermarked signal
US20060047522A1 (en) Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system
CN1622593B (zh) 用于实现信噪比可伸缩性的视频处理的装置和方法
US20230137053A1 (en) Audio Coding Method and Apparatus
CN113539281A (zh) 音频信号编码方法和装置
WO2022258036A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序
JP4486387B2 (ja) エラー補償装置およびエラー補償方法
WO2022267754A1 (zh) 语音编码、语音解码方法、装置、计算机设备和存储介质
WO2023051370A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序
Cheng et al. Multiple description error mitigation techniques for streaming compressed audio over a 802.11 wireless network
Arora et al. Speech compression analysis using matlab
CN115410585A (zh) 音频数据编解码方法和相关装置及计算机可读存储介质
CN114303190A (zh) 用于生成和处理经修改的音频比特流的方法和设备
Ehret et al. Evaluation of real-time transport protocol configurations using aacPlus
Smyth A lossless/near-lossless audio codec for low latency streaming applications on embedded devices
JPWO2007138825A1 (ja) デジタル音声データ処理装置及び処理方法