TW201521016A - 用以使用基於時域激勵信號之錯誤隱藏提供解碼音訊資訊之音訊解碼器及方法 - Google Patents
用以使用基於時域激勵信號之錯誤隱藏提供解碼音訊資訊之音訊解碼器及方法 Download PDFInfo
- Publication number
- TW201521016A TW201521016A TW103137626A TW103137626A TW201521016A TW 201521016 A TW201521016 A TW 201521016A TW 103137626 A TW103137626 A TW 103137626A TW 103137626 A TW103137626 A TW 103137626A TW 201521016 A TW201521016 A TW 201521016A
- Authority
- TW
- Taiwan
- Prior art keywords
- audio
- time domain
- excitation signal
- error concealment
- signal
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Abstract
一種用於基於編碼音訊資訊來提供解碼音訊資訊的音訊解碼器包含錯誤隱藏,該錯誤隱藏經組配來使用時域激勵信號來提供用於隱藏以頻域表示編碼的音訊框之後的音訊框之丟失的錯誤隱藏音訊資訊。
Description
根據本發明之實施例創造用於基於編碼音訊資訊來提供解碼音訊資訊的音訊解碼器。
根據本發明之一些實施例創造用於基於編碼音訊資訊來提供解碼音訊資訊的方法。
根據本發明之一些實施例創造用於執行該等方法之一的電腦程式。
根據本發明之一些實施例係關於用於變換域編解碼器的時域隱藏。
近年來,對音訊內容之數位傳輸及儲存的需求日益增加。然而,音訊內容通常經由不可靠通道傳輸,此狀況帶來包含一或多個音訊框(例如,以編碼表示形式,該編碼表示如(例如)編碼頻域表示或編碼時域表示)的資料單元
(例如,封包)丟失的風險。在一些情形下,將可能請求丟失的音訊框(或包含一或多個丟失音訊框的資料單元,如封包)之重複(重新發送)。然而,此舉將通常帶來大量延遲,且將因此需要音訊框之廣泛緩衝。在其他狀況下,幾乎不可能請求丟失的音訊框之重複。
為了獲得良好的或至少可接受的音訊品質,考慮
到音訊框丟失而未提供廣泛緩衝(此將消耗大量記憶體且將亦大體上使音訊編碼之即時能力降級)的狀況,需要具有用以處理一或多個音訊框之丟失的概念。尤其是,希望具有甚至在音訊框丟失的狀況下帶來良好的音訊品質或至少一可接受的音訊品質的概念。
過去,已發展一些錯誤隱藏概念,該等一些錯誤
隱藏概念可使用於不同音訊編碼概念中。
在下文中,將描述習知音訊編碼概念。
在3gpp標準TS 26.290中,解釋使用錯誤隱藏的
變換編碼激勵解碼(TCX解碼)。在下文中,將提供一些解釋,該等一些解釋基於參考文獻[1]中的章節「TCX mode decoding and signal synthesis」。
圖7及圖8中展示根據國際標準3gpp TS 26.290的
TCX解碼器,其中圖7和圖8展示TCX解碼器的方塊圖。然而,圖7展示在正常操作或部分封包丟失的狀況下的TCX解碼有關的該等功能方塊。相反,圖8展示在TCX-256封包抹除隱藏的狀況下的TCX解碼之有關處理。
不同而言,圖7及圖8展示包括遵循以下狀況的
TCX解碼器之方塊圖:狀況1(圖8):當TCX框長度為256個樣本且有關封包丟失時TCX-256中的封包抹除隱藏,亦即,BFI_TCX=(1);以及狀況2(圖7):正常TCX解碼,可能具有部分封包丟失。在下文中,將提供關於圖7及圖8的一些解釋。
如所提及,圖7展示在正常操作中或在部分封包丟失的狀況下執行TCX解碼的TCX解碼器的方塊圖。根據圖7之TCX解碼器700接收TCX特定的參數710,且基於該TCX特定的參數來提供解碼音訊資訊712、714。
音訊解碼器700包含多工解訊器「DEMUX TCX 720」,該多工解訊器經組配來接收TCX特定的參數710及資訊「BFI_TCX」。多工解訊器720分離TCX特定的參數710,且提供編碼激勵資訊722、編碼雜訊填入(fill-in)資訊724及編碼全域增益資訊726。音訊解碼器700包含激勵解碼器730,該激勵解碼器經組配來接收編碼激勵資訊722、編碼雜訊填入資訊724及編碼全域增益資訊726,以及一些額外資訊(如,例如,位元率旗標「bit_rate_flag」、資訊「BFI_TCX」及TCX框長度資訊。激勵解碼器730基於上述各者來提供時域激勵信號728(亦以「x」指定)。激勵解碼器730包含激勵資訊處理器732,該激勵資訊處理器多工解訊編碼激勵資訊722且解碼代數向量量化參數。激勵資訊處理器732提供中間激勵信號734,該中間激勵信號通常處於頻域表示中,且該中間激勵信號以Y指定。激勵編碼器730亦
包含雜訊注入器736,該雜訊注入器經組配來在非量化子帶中注入雜訊,以自中間激勵信號734導出雜訊填充的激勵信號738。雜訊填充的激勵信號738通常處於頻域中,且以Z指定。雜訊注入器736自雜訊填入位準解碼器740接收雜訊強度資訊742。激勵解碼器亦包含適應性的低頻率解強744,該適應性的低頻率解強經組配來基於雜訊填充的激勵信號738執行低頻率解強操作,以藉此獲得處理後激勵信號746,該處理後激勵信號仍然處於頻域中,且該處理後激勵信號以X’指定。激勵解碼器730亦包含頻域至時域變換器748,該頻域至時域變換器經組配來接收處理後激勵信號746,且基於該處理後激勵信號來提供時域激勵信號750,該時域激勵信號與由一組頻域激勵參數(例如,處理後激勵信號746之一組頻域激勵參數)表示的一定時間部分相關聯。激勵解碼器730亦包含定標器752,該定標器經組配來對時域激勵信號750進行定標以藉此獲得定標時域激勵信號754。定標器752自全域增益解碼器758接收全域增益資訊756,其中作為回覆,全域增益解碼器758接收編碼全域增益資訊726。激勵解碼器730亦包含重疊-相加合成760,該重疊-相加合成接收與多個時間部分相關聯的定標時域激勵信號754。重疊-相加合成760基於定標時域激勵信號754來執行重疊及相加操作(該重疊及相加操作可包括開視窗操作),以針對較長時間週期(相較於提供單獨時域激勵信號750、754的時間週期的較長的時間週期)獲得時序上組合的時域激勵信號728。
音訊解碼器700亦包含LPC合成770,該LPC合成
接收由重疊-相加合成760提供的時域激勵信號728及定義LPC合成濾波函數772的一或多個LPC係數。LPC合成770可例如包含第一濾波器774,該第一濾波器可例如對時域激勵信號728進行合成濾波,以藉此獲得解碼音訊信號712。選擇性地,LPC合成770可亦包含第二合成濾波器772,該第二合成濾波器經組配來使用另一合成濾波函數對第一濾波器774之輸出信號進行合成濾波,以進而獲得解碼音訊資訊714。
在下文中,將在TCX-256封包抹除隱藏的狀況下
描述TCX解碼。圖8展示在此狀況下的TCX解碼器的方塊圖。
封包抹除隱藏800接收基頻資訊810,該基頻資訊
亦以「pitch_tcx」指定,且該基頻資訊係自先前解碼TCX框獲得。例如,可在激勵解碼器730中(在「正常」解碼期間)使用主基頻估計器747自處理後激勵信號746獲得基頻資訊810。此外,封包抹除隱藏800接收LPC參數812,該等LPC參數可表示LPC合成濾波函數。LPC參數812可例如與LPC參數772相同。因此,封包抹除隱藏800可經組配來基於基頻資訊810及LPC參數812來提供錯誤隱藏信號814,該錯誤隱藏信號可被視為錯誤隱藏音訊資訊。封包抹除隱藏800包含激勵緩衝器820,該激勵緩衝器可例如緩衝先前激勵。激勵緩衝器820可例如利用ACELP之適應性的碼簿,且可提供激勵信號822。封包抹除隱藏800可進一步包含第一
濾波器824,該第一濾波器之濾波函數可如圖8中所示而定義。因此,第一濾波器824可基於LPC參數812來濾波激勵信號822,以獲得激勵信號822之濾波後版本826。封包抹除隱藏亦包含振幅限制器828,該振幅限制器可基於目標資訊或位準資訊rmswsyn來限制濾波後激勵信號826之振幅。此外,封包抹除隱藏800可包含第二濾波器832,該第二濾波器可經組配來自振幅限制器822接收振幅受限的濾波後激勵信號830,且基於該振幅受限的濾波後激勵信號來提供錯誤隱藏信號814。第二濾波器832之濾波函數可例如如圖8中所示而定義。
在下文中,將描述關於解碼及錯誤隱藏的一些細
節。
在狀況1(TCX-256中的封包抹除隱藏)中,無資訊可利用來解碼256樣本TCX框。藉由處理延遲了T的過去激勵來找到TCX合成,其中T=pitch_tcx為由大致上等效於1/(z)的非線性濾波器在先前解碼TCX框中估計的基頻滯後。使用非線性濾波器而非1/(z),以避免合成中的卡嗒聲。此濾波器分解為3步驟:
步驟1:藉由濾波,以將延遲了T的激勵
映射至TCX目標域中;步驟2:施加限制器(量級限於±rms wsyn)
步驟3:藉由濾波,以找到合成。請注意,緩
衝器OVLP_TCX在此狀況下設定為零。
代數VQ參數之解碼
在狀況2中,TCX解碼涉及解碼描述定標頻譜X'之每一量化方塊的代數VQ參數,其中X'如3gpp TS 26.290之第5.3.5.7章之第2步中所述。回憶起 X' 具有維度N,其中N對於TCX-256、TCX-512及TCX-1024分別等於288、576及1152,且每一方塊B' k 具有維度8。方塊B' k 之數目K因此對於TCX-256、TCX-512及TCX-1024分別為36、72及144。用於每一方塊B' k 之代數VQ參數描述於第5.3.5.7章第5步中。對於每一方塊B' k ,由編碼器發送三組二進制索引:a)碼簿索引n k ,如第5.3.5.7章之第5步中所述以一元碼傳輸;b)所謂的基本碼簿中的選定的格點c之秩I k ,該基本碼簿指示必須將何置換施加於特定首部(參見第5.3.5.7章之第5步)以獲得格點 c ;c)以及,若量化方塊(格點)並未處於基本碼簿中,則在章節中的第5步之子步驟V1中計算的Voronoi擴展索引向量 k 之8個索引;自Voronoi擴展索引,可如3gpp TS 26.290之參考文獻[1]中計算擴展向量 z 。索引向量 k 之每一分量中的位元之數目由擴展階r給出,該擴展階可自索引n k 之一元碼值獲得。Voronoi擴展之定標因數M由M=2 r 給出。
隨後,自定標因數M、Voronoi擴展向量 z (RE 8 中的格點)及基本碼簿中的格點 c (亦為RE 8 中的格點),每一量化定標方塊可計算為:
當不存在Voronoi擴展(亦即,n k <5,M=1且z=0)時,基本碼簿為來自3gpp TS 26.290之參考文獻[1]的碼簿Q 0、Q 2、Q 3或Q 4。隨後不需要位元來傳輸向量 k 。另外,當因為足夠大而使用Voronoi擴展時,側僅將來自參考文獻[1]的Q 3或Q 4用作基本碼簿。Q 3或Q 4之選擇隱含於碼簿索引值n k 中,如第5.3.5.7章第5步中所述。
主基頻值之估計
執行主基頻之估計,使得若將要解碼的下一個框對應於TCX-256且若有關封包丟失,則可適當地外插該下一個框。此估計基於TCX目標之頻譜中的最大量級之峰值對應於主基頻的假定。對最大M之搜尋限於低於Fs/64kHz的頻率M=maxi=1..N/32(X'2i)2+(X'2i+1)2且最小索引1 i max N/32,使得亦找到(X' 2i)2+(X' 2i+1)2=M。隨後,主基頻以樣本之數目估計為T est=N/i max(此值可並非整數)。回想到針對TCX-256中的封包抹除隱藏計算主基頻。為避免緩衝問題(激勵緩衝器限於256個樣本),若T est>256個樣本,則將pitch_tcx設定為256;否則,若T est 256,則藉由將pitch_tcx設定為如下來避免256個樣本中的多個基頻週期:pitch_tcx=max{n T est | n整數>0且n T est 256}其中.表示朝向-∞捨入至最近的整數。
在下文中,將簡要地論述一些進一步習知概念。
在ISO_IEC_DIS_23003-3(參考文獻[3])中,在統
一語音及音訊編解碼器之上下文中解釋使用MDCT的TCX解碼。
在AAC最新技術(參看,例如,參考文獻[4])中,
僅描述內插模式。根據參考文獻[4],AAC核心解碼器包括隱藏函數,該隱藏函數使解碼器之延遲增加一個框。
在歐洲專利EP 1207519 B1(參考文獻[5])中,描
述該歐洲專利以提供一種語音解碼器及錯誤補償方法,該語音解碼器及錯誤補償方法能夠針對錯誤經偵測的框中之解碼語音達成進一步改良。根據該專利,語音編碼參數包括模式資訊,該模式資訊表達語音之每一短分段(框)之特徵。語言編碼器根據模式資訊來適應性地計算用於語音解碼的滯後參數及增益參數。此外,語音解碼器根據模式資訊來適應性地控制適應性的激勵增益與固定增益激勵增益之比率。此外,根據該專利之概念包含根據無錯誤經偵測的正常解碼單元中的解碼增益參數之值來適應性地控制用於語音解碼的適應性的激勵增益參數及固定激勵增益參數,該適應性地控制係在編碼資料經偵測為含有錯誤的解碼單元之後立即進行。
鑒於先前技術,需要提供更好的聽覺印象的錯誤
隱藏之額外改良。
根據本發明之一實施例創造一種用於基於編碼
音訊資訊來提供解碼音訊資訊的音訊解碼器。該音訊解碼器包含錯誤隱藏,該錯誤隱藏經組配來使用時域激勵信號提供用於隱藏以頻域表示編碼的音訊框之後的音訊框之一丟失(或多於一個框丟失)的錯誤隱藏音訊資訊。
根據本發明之此實施例係基於發現即使丟失音
訊框之前的音訊框係以頻域表示編碼亦可藉由基於時域激勵信號來提供錯誤隱藏音訊資訊來獲得改良的錯誤隱藏。
換言之,已認識到,在與在頻域中執行的錯誤隱藏相比時,若錯誤隱藏係基於時域激勵信號來執行,則錯誤隱藏之品質通常更好,使得即使丟失音訊框之前的音訊內容係在頻域中(亦即,以頻域表示)編碼,亦值得使用時域激勵信號來切換至時域錯誤隱藏。此例如對於單音信號且主要對於語音適用。
因此,即使丟失音訊框之前的音訊框係在頻域中
(亦即,以頻域表示)編碼,本發明亦允許獲得良好的錯誤隱藏。
在一較佳實施例中,頻域表示包含多個頻譜值之
編碼表示及用於定標頻譜值的多個比例因數之編碼表示,或音訊解碼器經組配來自LPC參數之編碼表示導出用於定標頻譜值的多個比例因數。該導出可藉由使用FDNS(頻域雜訊成形)來進行。然而,已發現,即使丟失音訊框之前的音訊框最初以包含實質上不同的資訊的頻域表示(亦即,在用於定標頻譜值的多個比例因數之編碼表示中的多個頻譜值之編碼表示)編碼,亦值得導出時域激勵信號(該時域激勵
信號可充當用於LPC合成的激勵)。例如,在TCX之狀況下,我們不發送比例因數(自編碼器發送至解碼器)但是發送LPC,且隨後在解碼器中我們將LPC變換成用於MDCT頻格的比例因數表示。不同而言,在TCX之狀況下,我們發送LPC係數,且隨後在解碼器中我們將該等LPC係數變換成用於在USAC中或在AMR-WB+中的TCX的比例因數表示,在USAC中或在AMR-WB+中完全不存在比例因數。
在一較佳實施例中,音訊解碼器包含頻域解碼器
核心,該頻域解碼器核心經組配來將基於比例因數的定標施加於自頻域表示導出的多個頻譜值。在此狀況下,錯誤隱藏經組配來使用自頻域表示導出的時域激勵信號,來提供用於隱藏以包含多個編碼比例因數的頻域表示編碼的音訊框之後的音訊框之丟失的錯誤隱藏音訊資訊。根據本發明之此實施例係基於發現時域激勵信號自以上提及的頻域表示的導出在與直接在頻域中執行的錯誤隱藏相比時通常提供更好的錯誤隱藏結果。例如,激勵信號係基於先前框之合成來創建,則無論先前框為頻域(MDCT、FFT...)框或是時域框皆無關係。然而,若先前框為頻域,則可觀察到特定的優點。此外,應注意,例如對於單音信號類語音達成尤其良好的結果。作為另一實例,比例因數可作為例如使用多項式表示的LPC係數傳輸,該多項式表示隨後在解碼器側轉換成比例因數。
在一較佳實施例中,音訊解碼器包含頻域解碼器
核心,該頻域解碼器核心經組配來自頻域表示導出時域音
訊信號表示,而未將時域激勵信號用作用於以頻域表示編碼的音訊框的中間量。換言之,已發現,即使丟失音訊框之前的音訊框係在不使用任何時域激勵信號作為中間量(且因此並不基於LPC合成)的「真實的」頻率模式中編碼,時域激勵信號對於錯誤隱藏的用法亦為有利的。
在一較佳實施例中,錯誤隱藏經組配來基於丟失
音訊框之前的以頻域表示編碼的音訊框來獲得時域激勵信號。在此狀況下,錯誤隱藏經組配來使用該時域激勵信號來提供用於隱藏丟失音訊框的錯誤隱藏音訊資訊。換言之,已認識到,用於錯誤隱藏的時域激勵信號應自丟失音訊框之前的以頻域表示編碼的音訊框導出,因為自丟失音訊框之前的以頻域表示編碼的音訊框導出的此時域激勵信號提供了丟失音訊框之前的音訊框之音訊內容的良好的表示,使得錯誤隱藏可以適度的努力及良好的準確度執行。
在一較佳實施例中,錯誤隱藏經組配來基於丟失
音訊框之前的以頻域表示編碼的音訊框來執行LPC分析,以獲得一組線性預測編碼參數及時域激勵信號,該時域激勵信號表示丟失音訊框之前的以頻域表示編碼的音訊框之音訊內容。已發現,即使丟失音訊框之前的音訊框係以頻域表示(該頻域表示不含有任何線性預測編碼參數且無時域激勵信號之表示)編碼,亦值得努力執行LPC分析,以導出線性預測編碼參數及時域激勵信號,因為可基於該時域激勵信號獲得用於許多輸入音訊信號的品質良好的錯誤隱藏音訊資訊。或者,錯誤隱藏可經組配來基於丟失音訊框
之前的以頻域表示編碼的音訊框來執行LPC分析,以獲得時域激勵信號,該時域激勵信號表示丟失音訊框之前的以頻域表示編碼的音訊框之音訊內容。進一步或者,音訊解碼器可經組配來使用線性預測編碼參數估計獲得一組線性預測編碼參數,或音訊解碼器可經組配來使用變換基於一組比例因數來獲得一組線性預測編碼參數。不同而言,可使用LPC參數估計來獲得LPC參數。該獲得可藉由基於以頻域表示編碼的音訊框的windowing/autocorr/levinson durbin或藉由自先前比例因數直接至LPC表示的變換來進行。
在一較佳實施例中,錯誤隱藏經組配來獲得描述
丟失音訊框之前的在頻域中編碼的音訊框之基頻的基頻(或滯後)資訊,且依賴於該基頻資訊而提供錯誤隱藏音訊資訊。藉由考慮到基頻資訊,可達成錯誤隱藏音訊資訊(該錯誤隱藏音訊資訊通常為覆蓋至少一丟失音訊框之時序持續時間的錯誤隱藏音訊信號)極其適於實際音訊內容。
在一較佳實施例中,錯誤隱藏經組配來基於自丟
失音訊框之前的以頻域表示編碼的音訊框導出的時域激勵信號來獲得基頻資訊。已發現,基頻資訊自時域激勵信號的導出帶來高準確度。此外,已發現,若基頻資訊極其適於時域激勵信號,則該導出為有利的,因為基頻資訊用於時域激勵信號之修改。藉由自時域激勵信號導出基頻資訊,可達成此密切關係。
在一較佳實施例中,錯誤隱藏經組配來估計時域
激勵信號之交叉相關,以決定粗略的基頻資訊。此外,錯
誤隱藏可經組配來使用圍繞藉由該粗略的基頻資訊決定的基頻的閉迴路搜尋來細化粗略的基頻資訊。因此,可使用適度的計算工作量達成高度準確的基頻資訊。
在一較佳實施例中,音訊解碼器,錯誤隱藏可經組配來基於編碼音訊資訊之旁資訊來獲得基頻資訊。
在一較佳實施例中,錯誤隱藏可經組配來基於可利用於先前解碼的音訊框的基頻資訊來獲得基頻資訊。
在一較佳實施例中,錯誤隱藏經組配來基於對時域信號或對殘餘信號執行的基頻搜尋來獲得基頻資訊。
不同而言,基頻可作為旁資訊傳輸,或若存在例如LTP,則該基頻亦可來自先前框。若基頻資訊在編碼器處可利用,則亦可在位元串流中傳輸。我們可選擇性地直接在時域信號上或在殘餘上進行基頻搜尋,在殘餘上得出通常更好的結果(時域激勵信號)。
在一較佳實施例中,錯誤隱藏經組配來將自丟失音訊框之前的以頻域表示編碼的音訊框導出的時域激勵信號之基頻週期複製一次或多次,以便獲得用於錯誤隱藏音訊信號之合成的激勵信號。藉由將時域激勵信號複製一次或多次,可達成錯誤隱藏音訊資訊之確定性的(亦即,大體上週期性的)分量以良好的準確度獲得,且為丟失音訊框之前的音訊框之音訊內容之確定性的(例如大體上週期性的)分量的良好的延續。
在一較佳實施例中,錯誤隱藏經組配來使用抽樣速率相依的濾波器來低通濾波自丟失音訊框之前的以頻域
表示編碼的音訊框之頻域表示導出的時域激勵信號之基頻週期,該抽樣速率相依的濾波器之頻寬取決於以頻域表示編碼的音訊框之抽樣速率。因此,時域激勵信號可適於可利用的音訊頻寬,該可利用的音訊頻寬導致錯誤隱藏音訊資訊之良好的聽覺印象。例如,較佳地僅在第一丟失框上進行低通濾波,且較佳地,只要信號並非100%穩定的,我們亦進行低通濾波。然而,應注意,低通濾波為選擇性的,且可僅在第一基頻週期上執行。例如,濾波器可為抽樣速率相依的,使得截止頻率不依賴於頻寬。
在一較佳實施例中,錯誤隱藏經組配來預測在丟
失框結束時的基頻,以使時域激勵信號或該時域激勵信號之一或多個複本適於預測的基頻。因此,可考慮丟失音訊框期間的預期基頻變化。因此,避免(或至少減少,因為該基頻僅為預測基頻而非真實基頻)在錯誤隱藏音訊資訊與一或多個丟失音訊框之後的適當地解碼的框之音訊資訊之間的過渡處的人工因素。例如,調適自最後良好的基頻開始至預測的基頻為止。該調適藉由脈衝再同步[7]來進行。
在一較佳實施例中,錯誤隱藏經組配來組合外插
時域激勵信號及雜訊信號,以便獲得用於LPC合成的輸入信號。在此狀況下,錯誤隱藏經組配來執行LPC合成,其中LPC合成經組配來依賴於線性預測編碼參數而濾波LPC合成之輸入信號,以便獲得錯誤隱藏音訊資訊。因此,可考慮音訊內容之確定性的(例如,近似週期性的)分量及音訊內容之雜訊類分量兩者。因此,達成錯誤隱藏音訊資訊包
含「自然的」聽覺印象。
在一較佳實施例中,錯誤隱藏經組配來使用時域
中的相關來計算外插時域激勵信號之增益,該外插時域激勵信號用以獲得用於LPC合成的輸入信號,該相關係基於丟失音訊框之前的以頻域編碼的音訊框之時域表示來執行,其中相關滯後係依賴於基於時域激勵信號獲得的基頻資訊而設定。換言之,決定丟失音訊框之前的音訊框內的週期性的分量之強度,且將週期性的分量之此所決定的強度用來獲得錯誤隱藏音訊資訊。然而,已發現,以上提及的週期分量之強度之計算提供尤其良好的結果,因為考慮了丟失音訊框之前的音訊框之實際時域音訊信號。或者,激勵域中或直接在時域中的相關可用以獲得基頻資訊。然而,亦存在不同的可能性,此取決於使用哪一個實施例。
在一實施例中,基頻資訊可僅為自最後框之ltp獲得的基頻,或作為旁資訊傳輸的基頻,可所計算的一基頻。
在一較佳實施例中,錯誤隱藏經組配來高通濾波
雜訊信號,該雜訊信號與外插時域激勵信號組合。已發現,高通濾波雜訊信號(該雜訊信號通常輸入至LPC合成中)導致自然的聽覺印象。例如,高通特性可隨著丟失的框之量而改變,在一定量的框丟失之後可不再存在高通。高通特性可亦依賴於解碼器運行的抽樣速率。例如,高通為抽樣速率相依的,且濾波特性可隨時間推移(隨連序框丟失)而改變。高通特性可亦選擇性地隨連序框丟失而改變,使得在一定量的框丟失之後不再存在用以僅獲取滿帶成形雜訊的
濾波來獲取最接近於背景雜訊的良好的舒適雜訊。
在一較佳實施例中,錯誤隱藏經組配來使用預加
強濾波器來選擇性地改變雜訊信號(562)之頻譜形狀,其中若丟失音訊框之前的以頻域表示編碼的音訊框為語音音訊框或包含啟始,則使雜訊信號與外插時域激勵信號組合。
已發現,錯誤隱藏音訊資訊之聽覺印象可藉由此概念改良。例如,在一些狀況下較佳地減少增益及形狀,在一些地方較佳地增加增益及形狀。
在一較佳實施例中,錯誤隱藏經組配來依賴於時
域中的相關而計算雜訊信號之增益,該相關係基於丟失音訊框之前的以頻域表示編碼的音訊框之時域表示來執行。
已發現,雜訊信號之增益之此決定提供尤其準確的結果,因為可考慮與丟失音訊框之前的音訊框相關聯的實際時域音訊信號。使用此概念,可能能夠獲取隱藏框之能量,該能量接近於先前良好的框之能量。例如,可藉由量測結果:輸入信號之激勵一一所產生的基於基頻的激勵之能量來產生用於雜訊信號的增益。
在一較佳實施例中,錯誤隱藏經組配來修改基於
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號,以便獲得錯誤隱藏音訊資訊。已發現,時域激勵信號之修改允許使時域激勵信號適於所要的時序演進。例如,時域激勵信號之修改允許使錯誤隱藏音訊資訊中的音訊內容之確定性的(例如,大體上週期性的)分量衰退。此外,時域激勵信號之修改亦允許使時域激勵信號適於(估計的或預期
的)基頻變化。此允許隨時間推移而調整錯誤隱藏音訊資訊之特性。
在一較佳實施例中,錯誤隱藏經組配來使用基於
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號之一或多個修改後複本,以便獲得錯誤隱藏資訊。時域激勵信號之修改後複本可以適度的努力獲得,且修改可使用單個演算法來執行。因此,可以適度的努力達成錯誤隱藏音訊資訊之所要的特性。
在一較佳實施例中,錯誤隱藏經組配來修改基於
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本,以藉此隨時間推移而減少錯誤隱藏音訊資訊之週期性的分量。因此,我們可認為,丟失音訊框之前的音訊框之音訊內容與一或多個丟失音訊框之音訊內容之間的相關隨時間推移而下降。另外,可避免不自然的聽覺印象由錯誤隱藏音訊資訊之週期性的分量之較長保留引起。
在一較佳實施例中,錯誤隱藏經組配來定標基於
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本,以藉此修改時域激勵信號。已發現,定標操作可以極少的努力執行,其中定標時域激勵信號通常提供良好的錯誤隱藏音訊資訊。
在一較佳實施例中,錯誤隱藏經組配來逐漸減少
施加來定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益。
因此,可達成錯誤隱藏音訊資訊內的週期性的分量之衰退。
在一較佳實施例中,錯誤隱藏經組配來依賴於丟
失音訊框之前的一或多個音訊框之一或多個參數,且/或依賴於連序丟失音訊框之數目,而調整用以逐漸減少施加來定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益的速度。
因此,可能調整使錯誤隱藏音訊資訊中的確定性的(例如,至少近似週期性的)分量衰退的速度。衰退速度可適於音訊內容之特定特性,該等特定特性可通常自丟失音訊框之前的一或多個音訊框之一或多個參數看出。替代地或另外,當決定用以使錯誤隱藏音訊資訊之確定性的(例如,至少近似週期性的)分量衰退的速度時,可考慮連序丟失音訊框之數目,此有助於使錯誤隱藏適於特定情形。例如,可使音調部分之增益及雜訊部分之增益單獨地衰退。音調部分之增益可在一定量的框丟失之後收斂至零,而雜訊之增益可收斂至決定來達到某一舒適雜訊的增益。
在一較佳實施例中,錯誤隱藏經組配來依賴於時
域激勵信號之基頻週期之長度,而調整用以逐漸減少施加來定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益的速度,使得輸入至LPC合成中的時域激勵信號對於具有基頻週期之較短長度的信號在與具有基頻週期之較大長度的信號相比時衰退得更快。因此,可避免具有基頻週期之較短長度的信號以高強度重複得過於頻繁,因為此將通常導致
不自然的聽覺印象。因此,可改良錯誤隱藏音訊資訊之整體品質。
在一較佳實施例中,錯誤隱藏經組配來依賴於基
頻分析或基頻預測之結果,而調整用以逐漸減少施加來定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益的速度,使得輸入至LPC合成中的時域激勵信號之確定性的分量對於具有每時間單位較大的基頻變化的信號在與具有每時間單位較小的基頻變化的信號相比時衰退得更快,且/或使得輸入至LPC合成中的時域激勵信號之確定性的分量對於基頻預測失敗的信號在與基頻預測成功的信號相比時衰退得更快。因此,衰退對於存在基頻之大不確定性的信號在與存在基頻之較小不確定性的信號相比時可進行得更快。然而,藉由使確定性的分量對於包含基頻之相對大的不確定性的信號衰退得更快,可避免或至少大體上減少可聞人工因素。
在一較佳實施例中,錯誤隱藏經組配來依賴於用
於一或多個丟失音訊框之時間的基頻之預測,而時間定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本。因此,時域激勵信號可適於變化的基頻,使得錯誤隱藏音訊資訊包含更自然的聽覺印象。
在一較佳實施例中,錯誤隱藏經組配來提供錯誤
隱藏音訊資訊達一時間,該時間比一或多個丟失音訊框之
時序持續時間更長。因此,可能基於錯誤隱藏音訊資訊來執行重疊及相加操作,此有助於減少編塊人工因素。
在一較佳實施例中,錯誤隱藏經組配來執行錯誤
隱藏音訊資訊及一或多個丟失音訊框之後的一或多個適當地接收的音訊框之時域表示的重疊及相加。因此,可能避免(或至少減少)編塊人工因素。
在一較佳實施例中,錯誤隱藏經組配來基於丟失
音訊框或丟失視窗之前的至少三個部分重疊的框或視窗來導出錯誤隱藏音訊資訊。因此,錯誤隱藏音訊資訊可甚至對於多於兩個框(開視窗)重疊(其中此類重疊可有助於減少延遲)的編碼模式亦以良好的準確度獲得。
根據本發明之另一實施例創造用於基於編碼音
訊資訊來提供解碼音訊資訊的方法。方法包含使用時域激勵信號來提供用於隱藏以頻域表示編碼的音訊框之後的音訊框之丟失的錯誤隱藏音訊資訊。此方法係基於與以上提及的音訊解碼器相同的考慮。
根據本發明之又一實施例創造一種電腦程式,當該電腦程式在電腦上運行時,該電腦程式用於執行該方法。
根據本發明之另一實施例創造用於基於編碼音訊資訊來提供解碼音訊資訊的音訊解碼器。音訊解碼器包含錯誤隱藏,該錯誤隱藏經組配來提供用於隱藏音訊框之丟失的錯誤隱藏音訊資訊。錯誤隱藏經組配來修改基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號,以便獲得錯誤隱藏音訊資訊。
根據本發明之此實施例係基於可基於時域激勵
信號來獲得具有良好的音訊品質的錯誤隱藏的觀念,其中基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號之修改允許錯誤隱藏音訊資訊適於丟失框期間的音訊內容之預期(或預測)變化。因此,可避免人工因素及(尤其)不自然的聽覺印象,該不自然的聽覺印象將由時域激勵信號之不變用法引用。因此,達成錯誤隱藏音訊資訊之改良的提供,使得可在具有改良的結果的情況下隱藏丟失音訊框。
在一較佳實施例中,錯誤隱藏經組配來使用針對
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號之一或多個修改後複本,以便獲得誤隱藏資訊。藉由使用針對丟失音訊框之前的一或多個音訊框獲得的時域激勵信號之一或多個修改後複本,可以極少的計算工作量達成錯誤隱藏音訊資訊之良好的品質。
在一較佳實施例中,錯誤隱藏經組配來修改針對
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本,以藉此隨時間推移而減少錯誤隱藏音訊資訊之週期性的分量。藉由隨時間推移而減少錯誤隱藏音訊資訊之週期性的分量,可避免確定性的(例如,近似週期性的)聲音之不自然地長的保留,此有助於使錯誤隱藏音訊資訊聽起來自然。
在一較佳實施例中,錯誤隱藏經組配來定標基於
丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本,以藉此修改時域激勵信
號。時域激勵信號之定標構成用以隨時間推移而改變錯誤隱藏音訊資訊的尤其有效的方式。
在一較佳實施例中,錯誤隱藏經組配來逐漸減少
施加來定標針對丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益。
已發現,逐漸減少施加來定標針對丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益,允許獲得用於錯誤隱藏音訊資訊之提供的時域激勵信號,使得確定性的分量(例如,至少近似週期性的分量)衰退。例如,可存在不僅一個增益。例如,我們可具有用於音調部分(亦稱為近似週期性的部分)的一個增益,及用於雜訊部分的一個增益。兩個激勵(或激勵分量)可以不同的速度因數單獨地衰減,且隨後兩個所得激勵(或激勵分量)可在饋送至LPC用於合成之前經組合。在我們不具有任何背景雜訊估計的狀況下,用於雜訊及用於音調部分的衰退因數可為類似的,且隨後我們可僅使一個衰退施加於兩個激勵與該兩個激勵的自有增益相乘且組合在一起的結果上。
因此,可避免錯誤隱藏音訊資訊包含時序上擴展
的確定性的(例如,至少近似週期性的)音訊分量,此將通常提供不自然的聽覺印象。
在一較佳實施例中,錯誤隱藏經組配來依賴於丟
失音訊框之前的一或多個音訊框之一或多個參數,且/或依賴於連序丟失音訊框之數目,而調整用以逐漸減少施加來
定標針對丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益的速度。
因此,錯誤隱藏音訊資訊中的確定性的(例如,至少近似週期性的)分量之衰退速度可適於具有適度的計算工作量的特定情形。因為用於錯誤隱藏音訊資訊之提供的時域激勵信號通常為針對丟失音訊框之前的一或多個音訊框獲得的時域激勵信號之定標版本(使用以上提及的增益定標的版本),所以該增益(用以導出用於錯誤隱藏音訊資訊之提供的時域激勵信號)之變化構成用以使錯誤隱藏音訊資訊適於特定需求的簡單但有效的方法。然而,衰退速度亦可以極少的努力來控制。
在一較佳實施例中,錯誤隱藏經組配來依賴於時
域激勵信號之基頻週期之長度,而調整用以逐漸減少施加來定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益的速度,使得輸入至LPC合成中的時域激勵信號對於具有基頻週期之較短長度的信號在與具有基頻週期之較大長度的信號相比時衰退得更快。因此,衰退對於具有基頻週期之較短長度的信號執行得更快,此避免使基頻週期複製過多次(此將通常導致不自然的聽覺印象)。
在一較佳實施例中,錯誤隱藏經組配來依賴於基
頻分析或基頻預測之結果,而調整用以逐漸減少施加來定標針對丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本的增益的速度,使
得輸入至LPC合成中的時域激勵信號之確定性的分量對於具有每時間單位較大的基頻變化的信號在與具有每時間單位較小的基頻變化的信號相比時衰退得更快,且/或使得輸入至LPC合成中的時域激勵信號之確定性的分量對於基頻預測失敗的信號在與基頻預測成功的信號相比時衰退得更快。因此,確定性的(例如,至少近似週期性的)分量對於存在基頻之較大不確定性的信號衰退得更快(其中,每時間單位較大的基頻變化或甚至基頻預測之失敗指示基頻之相對大的不確定性)。因此,可避免人工因素,該等人工因素將起因於在實際基頻不確定的情形下的高度確定性的錯誤隱藏音訊資訊之提供。
在一較佳實施例中,錯誤隱藏經組配來依賴於用
於一或多個丟失音訊框之時間的基頻之預測,而時間定標針對(或基於)丟失音訊框之前的一或多個音訊框獲得的時域激勵信號或該時域激勵信號之一或多個複本。因此,用於錯誤隱藏音訊資訊之提供的時域激勵信號經修改(在與針對(或基於)丟失音訊框之前的一或多個音訊框獲得的時域激勵信號相比時),使得時域激勵信號之基頻遵循丟失音訊框之時間週期要求。因此,可改良可藉由錯誤隱藏音訊資訊達成的聽覺印象。
在一較佳實施例中,錯誤隱藏經組配來獲得已用
以解碼丟失音訊框之前的一或多個音訊框的時域激勵信號,且修改已用以解碼丟失音訊框之前的一或多個音訊框的該時域激勵信號,以獲得修改後時域激勵信號。在此狀
況下,時域隱藏經組配來基於修改後時域音訊信號來提供錯誤隱藏音訊資訊。因此,可能重新使用已經用以解碼丟失音訊框之前的一或多個音訊框的時域激勵信號。因此,若時域激勵信號已經獲取來用於解碼丟失音訊框之前的一或多個音訊框,則計算工作量可保持極小。
在一較佳實施例中,錯誤隱藏經組配來獲得基頻資訊,該基頻資訊已用以解碼丟失音訊框之前的一或多個音訊框。在此狀況下,錯誤隱藏亦經組配來依賴於該基頻資訊而提供錯誤隱藏音訊資訊。因此,可重新使用先前使用的基頻資訊,此避免了用於基頻資訊之新計算的計算工作量。因此,錯誤隱藏為尤其計算有效的。例如,在ACELP的狀況下,我們具有每框4個基頻滯後及增益。我們可使用最後二個框以便能夠預測在框結束時的我們必須隱藏的基頻。
隨後,與導出每框僅一個或兩個基頻(我們可具
有多於兩個但該狀況對於不多的品質增益卻增添許多複雜性)的先前描述的頻域編解碼器相比。在例如ACELP-FD-丟失的切換式編解碼器的狀況下,則我們具有好得多的基頻精度,因為基頻係在位元串流中傳輸且係基於原始輸入信號(而非基於如在解碼器中進行的解碼信號)。在例如高位元率的狀況下,我們可亦發送每頻域編碼框一個基頻滯後及增益資訊,或LTP資訊。
在一較佳實施例中,音訊解碼器,錯誤隱藏可經
組配來基於編碼音訊資訊之旁資訊來獲得基頻資訊。
在一較佳實施例中,錯誤隱藏可經組配來基於可利用於先前解碼的音訊框的基頻資訊來獲得基頻資訊。
在一較佳實施例中,錯誤隱藏經組配來基於對時域信號或對殘餘信號執行的基頻搜尋來獲得基頻資訊。
不同而言,基頻可作為旁資訊傳輸,或若存在例如LTP,則該基頻可亦來自先前框。若基頻資訊在編碼器處可利用,則亦可在位元串流中傳輸。我們可選擇性地直接在時域信號上或在殘餘上進行基頻搜尋,在殘餘上得出通常更好的結果(時域激勵信號)。
在一較佳實施例中,錯誤隱藏經組配來獲得一組線性預測係數,該組線性預測係數已用以解碼丟失音訊框之前的一或多個音訊框。在此狀況下,錯誤隱藏經組配來依賴於該組線性預測係數而提供錯誤隱藏音訊資訊。因此,藉由重新使用先前產生的(或先前解碼的)資訊(如例如先前使用的一組線性預測係數)來提高錯誤隱藏之效率。因此,避免了不必要地高的計算複雜性。
在一較佳實施例中,錯誤隱藏經組配來基於該組線性預測係數來外插一組新的線性預測係數,該組線性預測係數已用以解碼丟失音訊框之前的一或多個音訊框。在此狀況下,錯誤隱藏經組配來使用該組新的線性預測係數來提供錯誤隱藏資訊。藉由使用外插自一組先前使用的線性預測係數導出用以提供錯誤隱藏音訊資訊的該組新的線性預測係數,可避免線性預測係數之完全重新計算,此有助於使計算工作量保持合理地小。此外,藉由基於該組先
前使用的線性預測係數來執行外插,可確保該組新的線性預測係數至少類似於該組先前使用的線性預測係數,此有助於避免提供錯誤隱藏資訊時的不連續性。例如,在一定量的框丟失之後,我們傾向於估計背景雜訊LPC形狀。此收斂之速度可例如取決於信號特性。
在一較佳實施例中,錯誤隱藏經組配來獲得關於
丟失音訊框之前的一或多個音訊框中的確定性的信號分量之強度的資訊。在此狀況下,錯誤隱藏經組配來將關於丟失音訊框之前的一或多個音訊框中的確定性的信號分量之強度的資訊與臨限值進行比較,以決定是否將時域激勵信號之確定性的分量輸入至LPC合成(基於線性預測係數的合成)中,或是否僅將時域激勵信號之雜訊分量輸入至LPC合成中。因此,在於丟失音訊框之前的一或多個框內僅存在小的確定性的信號貢獻的狀況下,可能省略錯誤隱藏音訊資訊之確定性的(例如,至少近似週期性的)分量之提供。已發現,此有助於獲得良好的聽覺印象。
在一較佳實施例中,錯誤隱藏經組配來獲得描述
丟失音訊框之前的音訊框之基頻的基頻資訊,且依賴於該基頻資訊而提供錯誤隱藏音訊資訊。因此,可能使錯誤隱藏資訊之基頻適於丟失音訊框之前的音訊框之基頻。因此,避免不連續性且可達成自然的聽覺印象。
在一較佳實施例中,錯誤隱藏經組配來基於與丟
失音訊框之前的音訊框相關聯的時域激勵信號來獲得基頻資訊。已發現,基於時域激勵信號獲得的基頻資訊為尤其
可靠的,且亦極好地適於時域激勵信號之處理。
在一較佳實施例中,錯誤隱藏經組配來估計時域
激勵信號(或替代地時域音訊信號)之交叉相關,以決定粗略的基頻資訊,且使用圍繞藉由粗略的基頻資訊決定(或描述)的基頻的閉迴路搜尋來細化粗略的基頻資訊。已發現,此概念允許以適度的計算工作量獲得極精確的基頻資訊。換言之,在一些編解碼器中,我們直接在時域信號上進行基頻搜尋,而在一些其他編解碼器中,我們在時域激勵信號上進行基頻搜尋。
在一較佳實施例中,錯誤隱藏經組配來基於先前
計算的基頻資訊且基於時域激勵信號之交叉相關之估計來獲得用於錯誤隱藏音訊資訊之提供的基頻資訊,該先前計算的基頻資訊用於丟失音訊框之前的一或多個音訊框之解碼,該時域激勵信號經修改以便獲得用於錯誤隱藏音訊資訊之提供的修改後時域激勵信號。已發現,考慮先前計算的基頻資訊及基於時域激勵信號(使用交叉相關)獲得的基頻資訊兩者改良基頻資訊之可靠性,且因此有助於避免人工因素及/或不連續性。
在一較佳實施例中,錯誤隱藏經組配來依賴於先
前計算的基頻資訊而自交叉相關之多個峰值中選擇交叉相關之一峰值,作為表示基頻的峰值,使得選取表示最接近於由先前計算的基頻資訊表示的基頻的基頻的峰值。因此,可克服交叉相關之可能的歧義,該等可能的歧義可例如導致多個峰值。先前計算的基頻資訊藉此用以選擇交叉
相關之「適當」峰值,此有助於大體上提高可靠性。另一方面,主要針對基頻決定考慮實際時域激勵信號,此舉提供良好的準確度(該良好的準確度大體上比可僅基於先前計算的基頻資訊獲得的準確度更好)。
在一較佳實施例中,音訊解碼器,錯誤隱藏可經組配來基於編碼音訊資訊之旁資訊來獲得基頻資訊。
在一較佳實施例中,錯誤隱藏可經組配來基於可利用於先前解碼的音訊框的基頻資訊來獲得基頻資訊。
在一較佳實施例中,錯誤隱藏經組配來基於對時域信號或對殘餘信號執行的基頻搜尋來獲得基頻資訊。
不同而言,基頻可作為旁資訊傳輸,或若存在例如LTP,則該基頻可亦來自先前框。若基頻資訊在編碼器處可利用,則亦可在位元串流中傳輸。我們可選擇性地直接在時域信號上或在殘餘上進行基頻搜尋,在殘餘上得出通常更好的結果(時域激勵信號)。
在一較佳實施例中,錯誤隱藏經組配來將與丟失音訊框之前的音訊框相關聯的時域激勵信號之基頻週期複製一次或多次,以便獲得用於錯誤隱藏音訊資訊之合成的激勵信號(或至少該激勵信號之確定性的分量)。藉由將與丟失音訊框之前的音訊框相關聯的時域激勵信號之基頻週期複製一次或多次,且藉由使用相對簡單的修改演算法來修改該一或多個複本,可以極少的計算工作量獲得用於錯誤隱藏音訊資訊之合成的激勵信號(或至少該激勵信號之確定性的分量)。然而,重新使用與丟失音訊框之前的音訊框
相關聯的時域激勵信號(藉由複製該時域激勵信號)避免可聞的不連續性。
在一較佳實施例中,錯誤隱藏經組配來使用抽樣
速率相依的濾波器低通濾波與丟失音訊框之前的音訊框相關聯的時域激勵信號之基頻週期,該抽樣速率相依的濾波器之頻寬取決於以頻域表示編碼的音訊框之抽樣速率。因此,時域激勵信號適於音訊解碼器之信號頻寬,此導致音訊內容之良好的重現。關於細節及選擇性的改良,參考例如以上解釋。
例如,較佳地僅在第一丟失框上進行低通,且較
佳地,只要信號並非無聲的,我們亦進行低通。然而,應注意,低通濾波為選擇性的。此外,濾波器可為抽樣速率相依的,使得截止頻率不依賴於頻寬。
在一較佳實施例中,錯誤隱藏經組配來預測丟失
框結束時的基頻。在此狀況下,錯誤隱藏經組配來使時域激勵信號或該時域激勵信號之一或多個複本適於預測的基頻。藉由修改時域激勵信號,使得相對於與丟失音訊框之前的音訊框相關聯的時域激勵信號修改事實上用於錯誤隱藏音訊資訊之提供的時域激勵信號,可考慮丟失音訊框期間的預期的(或預測的)基頻變化,使得錯誤隱藏音訊資訊極其適於音訊內容之實際演進(或至少適於預期的或預測的演進)。例如,調適自最後良好的基頻開始至預測的基頻為止。該調適藉由脈衝再同步[7]來進行。
在一較佳實施例中,錯誤隱藏經組配來組合外插
時域激勵信號及雜訊信號,以便獲得用於LPC合成的輸入信號。在此狀況下,錯誤隱藏經組配來執行LPC合成,其中LPC合成經組配來依賴於線性預測編碼參數而濾波LPC合成之輸入信號,以便獲得錯誤隱藏音訊資訊。藉由組合外插時域激勵信號(該外插時域激勵信號通常為針對丟失音訊框之前的一或多個音訊框導出的時域激勵信號之修改後版本)及雜訊信號,在錯誤隱藏中考慮音訊內容之確定性的(例如,近似週期性的)分量及雜訊分量兩者。因此,可完成錯誤隱藏音訊資訊提供類似於由丟失框之前的框提供的聽覺印象的聽覺印象。
另外,藉由組合時域激勵信號及雜訊信號,以便
獲得用於LPC合成的輸入信號(該輸入信號可被視為組合時域激勵信號),可能改變用於LPC合成的輸入音訊信號之確定性的分量之百分比同時維持(LPC合成之輸入信號的,或甚至LPC合成之輸出信號的)能量。因此,可能變化錯誤隱藏音訊資訊之特性(例如,音調特性)而大體上不改變錯誤隱藏音訊信號之能量或響度,使得可能修改時域激勵信號而不引起不可接受的可聞失真。
根據本發明之一實施例創造一種用於基於編碼
音訊資訊來提供解碼音訊資訊的方法。方法包含提供用於隱藏音訊框之丟失的錯誤隱藏音訊資訊。提供錯誤隱藏音訊資訊包含修改基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號,以便獲得錯誤隱藏音訊資訊。
此方法係基於以上描述的音訊解碼器的相同的
考慮。
根據本發明之又一實施例創造一種電腦程式,當該電腦程式在電腦上運行時,該電腦程式用於執行該方法。
100、200、300、400、1100‧‧‧音訊解碼器
110、210、310、410、1110‧‧‧編碼音訊資訊
112、220、232、312、412、712、714、1112‧‧‧解碼音訊資訊
120‧‧‧解碼/處理/頻域解碼器核心
122‧‧‧解碼音訊資訊/時域音訊信號表示/錯誤隱藏音訊資訊
130、240、380、480、500‧‧‧錯誤隱藏
132、242、382、512、612、1182‧‧‧錯誤隱藏音訊資訊
230‧‧‧解碼/處理
320、420、1120‧‧‧位元串流分析器
322、422‧‧‧頻域表示
324‧‧‧控制資訊
326‧‧‧編碼頻譜值/編碼表示
328‧‧‧編碼比例因數/編碼表示
330‧‧‧額外旁資訊
340‧‧‧頻譜值解碼/頻域解碼器核心
342‧‧‧解碼頻譜值/頻譜值
350‧‧‧比例因數解碼/頻域解碼器核心
352‧‧‧解碼比例因數/定標因數
354‧‧‧LPC至比例因數轉換
360‧‧‧定標器/頻域解碼器核心/基於比例因數的定標
362、1152‧‧‧定標解碼頻譜值
366‧‧‧選擇性的處理/頻域解碼器核心
368‧‧‧定標解碼頻譜值之處理後版本/處理後定標解碼頻譜值
370‧‧‧頻域至時域變換/頻域解碼器核心
372‧‧‧時域表示/解碼時域音訊信號/信號/時域音訊信號
376、474‧‧‧後處理
378‧‧‧後處理版本/後處理時域表示/信號/時域音訊信號/時域表示
390‧‧‧信號組合/重疊及相加
424‧‧‧線性預測編碼域表示
426‧‧‧編碼激勵
428‧‧‧編碼線性預測係數/輸入資訊
430‧‧‧頻域解碼路徑/解碼路徑
440‧‧‧線性預測域解碼路徑/解碼路徑
450‧‧‧激勵解碼
452‧‧‧解碼激勵/解碼時域激勵信號/時域激勵信號
454、464、1160‧‧‧處理
456‧‧‧處理後時域激勵信號/解碼激勵之處理後版本
460‧‧‧線性預測係數解碼
462‧‧‧解碼線性預測係數/輸出資訊
466‧‧‧解碼線性預測係數之處理後版本
470‧‧‧LPC合成/線性預測編碼合成
472‧‧‧解碼時域音訊信號/信號
476‧‧‧解碼時域音訊信號之後處理版本/信號
482‧‧‧錯誤隱藏音訊資訊/信號
490‧‧‧信號組合/信號組合器
510‧‧‧時域音訊信號/時域表示
520‧‧‧預加強
522‧‧‧加強時域音訊信號/時域音訊信號之預加強版本/預加強時域信號/預加強時域音訊信號/時域信號
530、1184‧‧‧LPC分析
532‧‧‧LPC資訊/LPC參數/時域激勵信號/輸出
540‧‧‧基頻搜尋/方塊/預測/基頻分析
542‧‧‧基頻資訊/輸出資訊
550‧‧‧外插/方塊
552‧‧‧外插時域激勵信號/時域激勵信號
560‧‧‧雜訊產生/雜訊產生器/方塊
562‧‧‧雜訊信號/雜訊
570‧‧‧組合器/衰減器/方塊/組合/衰退/定標器/衰減器
572‧‧‧組合時域激勵信號/輸入信號/信號/激勵信號
580‧‧‧LPC合成/方塊
582‧‧‧時域音訊信號/輸出信號/信號
584‧‧‧解強/方塊
586‧‧‧解強錯誤隱藏時域音訊信號
590、690‧‧‧重疊及相加
600‧‧‧時域隱藏/錯誤隱藏
610‧‧‧過去激勵/過去激勵資訊/時域激勵信號
640‧‧‧過去基頻資訊/方塊
650‧‧‧方塊/外插
652‧‧‧外插時域激勵信號/時域激勵信號/音調部分
660‧‧‧雜訊產生器/方塊
662‧‧‧雜訊信號/雜訊部分/外插時域激勵信號
670‧‧‧組合器/衰減器/方塊
672‧‧‧輸入信號/組合時域激勵信號
680‧‧‧LPC合成/方塊
682‧‧‧時域音訊信號/輸出信號
684‧‧‧解強/方塊
686‧‧‧解強錯誤隱藏時域音訊信號/輸出信號
700‧‧‧TCX解碼器/音訊解碼器
710‧‧‧TCX特定的參數
720‧‧‧多工解訊器/DEMUX TCX
722‧‧‧編碼激勵資訊
724‧‧‧編碼雜訊填入資訊
726‧‧‧編碼全域增益資訊
728‧‧‧時域激勵信號
730‧‧‧激勵解碼器/激勵編碼器
732‧‧‧激勵資訊處理器
734‧‧‧中間激勵信號
736‧‧‧雜訊注入器
738‧‧‧雜訊填充的激勵信號
740‧‧‧雜訊填入位準解碼器
742‧‧‧雜訊強度資訊
744‧‧‧應性的低頻率解強
746‧‧‧處理後激勵信號
747‧‧‧主基頻估計器
748‧‧‧頻域至時域變換器
750‧‧‧時域激勵信號
752‧‧‧定標器
754‧‧‧定標時域激勵信號/時域激勵信號
756‧‧‧全域增益資訊
758‧‧‧全域增益解碼器
760‧‧‧重疊-相加合成
770‧‧‧LPC合成
772‧‧‧LPC合成濾波函數/第二合成濾波器/LPC參數
774、824‧‧‧第一濾波器
800‧‧‧封包抹除隱藏
810‧‧‧基頻資訊
812‧‧‧LPC參數
820‧‧‧激勵緩衝器
822‧‧‧激勵信號
826‧‧‧激勵信號之濾波後版本/濾波後激勵信號
828‧‧‧振幅限制器
830‧‧‧振幅受限的濾波後激勵信號
832‧‧‧第二濾波器
900、1000‧‧‧方法
910、1010‧‧‧步驟
1122‧‧‧編碼表示/編碼頻譜係數
1124‧‧‧線性預測編碼係數/線性預測編碼係數之編碼表示/LPC係數
1130‧‧‧頻譜值解碼
1132‧‧‧解碼頻譜值
1140‧‧‧線性預測編碼係數至比例因數轉換
1142‧‧‧比例因數
1150‧‧‧純量
1162‧‧‧處理後定標解碼頻譜值
1170‧‧‧頻域至時域變換
1172‧‧‧時域表示/時域音訊表示
1178‧‧‧第二後處理
1179‧‧‧後處理版本
1180‧‧‧錯誤隱藏方塊
1186‧‧‧時域激勵信號
1188‧‧‧錯誤隱藏/錯誤隱藏方塊
1190‧‧‧信號組合
隨後將參考隨附諸圖來描述本發明之實施例,在該等圖中:圖1展示根據本發明之一實施例的音訊解碼器的方塊示意圖;圖2展示根據本發明之另一實施例的音訊解碼器的方塊示意圖;圖3展示根據本發明之另一實施例的音訊解碼器的方塊示意圖;圖4展示根據本發明之另一實施例的音訊解碼器的方塊示意圖;圖5展示用於變換編碼器的時域隱藏的方塊示意圖;圖6展示用於切換式編解碼器的時域隱藏的方塊示意圖;圖7展示在正常操作中或在部分封包丟失之狀況下執行TCX解碼的TCX解碼器的方塊圖;圖8展示在TCX-256封包抹除隱藏的狀況下執行TCX解碼的TCX解碼器的方塊示意圖;圖9展示根據本發明之一實施例的用於基於編碼音訊資訊來提供解碼音訊資訊的方法的流程圖;以及圖10展示根據本發明之另一實施例的用於基於編碼音
訊資訊來提供解碼音訊資訊的方法的流程圖;圖11展示根據本發明之另一實施例的音訊解碼器的方塊示意圖。
1.根據圖1之音訊解碼器
圖1展示根據本發明之一實施例的音訊解碼器100的方塊示意圖。音訊解碼器100接收編碼音訊資訊110,該編碼音訊資訊可例如包含以頻域表示編碼的音訊框。可例如經由不可靠通道接收編碼音訊資訊,使得框丟失時有發生。音訊解碼器100進一步基於編碼音訊資訊110來提供解碼音訊資訊112。
音訊解碼器100可包含解碼/處理120,該解碼/處理在不存在框丟失的情況下基於編碼音訊資訊來提供解碼音訊資訊。
音訊解碼器100進一步包含錯誤隱藏130,該錯誤隱藏提供錯誤隱藏音訊資訊。錯誤隱藏130經組配來使用時域激勵信號提供用於隱藏以頻域表示編碼的音訊框之後的音訊框之丟失的錯誤隱藏音訊資訊132。
換言之,解碼/處理120可提供以頻域表示之形式編碼的(亦即,以編碼表示之形式的)音訊框之解碼音訊資訊122,該等音訊框之編碼值描述不同頻格中的強度。不同而言,解碼/處理120可例如包含頻域音訊解碼器,該頻域音訊解碼器自編碼音訊資訊110導出一組頻譜值且執行頻域
至時域變換以藉此導出時域表示,該時域表示構成解碼音訊資訊122或該時域表示形成用於在存在額外後處理的狀況下提供解碼音訊資訊122之基礎。
然而,錯誤隱藏130不執行頻域中的錯誤隱藏而
是使用時域激勵信號,該時域激勵信號可例如用來激勵合成濾波器,如例如LPC合成濾波器,該合成濾波器基於時域激勵信號且亦基於LPC濾波係數(線性預測編碼濾波係數)來提供音訊信號之時域表示(例如,錯誤隱藏音訊資訊)。
因此,錯誤隱藏130提供用於丟失音訊框的錯誤
隱藏音訊資訊132,該錯誤隱藏音訊資訊可例如為時域音訊信號,其中由錯誤隱藏130使用的時域激勵信號可基於一或多個先前的、適當地接收的音訊框(在丟失音訊框之前)或自該一或多個先前的、適當地接收的音訊框導出,該等音訊框以頻域表示之形式編碼。總之,音訊解碼器100可執行錯誤隱藏(亦即,提供錯誤隱藏音訊資訊132),該錯誤隱藏基於編碼音訊資訊來減少音訊品質由於音訊框之丟失而降級,在該編碼音訊資訊中至少一些音訊框以頻域表示編碼。已發現,即使以頻域表示編碼的適當地接收的音訊框之後的框丟失亦使用時域激勵信號來執行錯誤隱藏在與頻域中(例如,使用在丟失音訊框之前的以頻域表示編碼的音訊框之頻域表示)執行的錯誤隱藏相比時,帶來改良的音訊品質。此歸因於與丟失音訊框之前的適當地接收的音訊框相關聯的解碼音訊資訊和與丟失音訊框相關聯的錯誤隱藏音訊資訊之間的平滑過渡可使用時域激勵信號來達成之事
實,因為通常基於時域激勵信號執行的信號合成有助於避免不連續。因此,即使在以頻域表示編碼的適當地接收的音訊框之後的音訊框丟失,亦可使用音訊解碼器100達成良好的(或至少可接受的)聽覺印象。例如,時域方法帶來對單音信號(如語音)之改良,因為該時域方法更接近於在語音編解碼器隱藏之狀況中所進行的操作。LPC之使用有助於避免不連續且給出框之更好的成形。
此外,應注意,音訊解碼器100可由下文中所述
之任何特徵及功能單獨地或以組合方式進行補充。
2.根據圖2之音訊解碼器
圖2展示根據本發明之一實施例的音訊解碼器200的方塊示意圖。音訊解碼器200經組配來接收編碼音訊資訊210,且基於該編碼音訊資訊來提供解碼音訊資訊220。編碼音訊資訊210可例如採取以時域表示編碼、以頻域表示編碼或以時域表示及頻域表示兩者編碼的音訊框之序列的形式。不同而言,編碼音訊資訊210之所有框可以頻域表示編碼,或編碼音訊資訊210之所有框可以時域表示編碼(例如,以編碼時域激勵信號及編碼信號合成參數(如,例如,LPC參數)之形式)。或者,編碼音訊資訊之一些框可以頻域表示編碼,且編碼音訊資訊之一些其他框可以時域表示編碼,例如,若音訊解碼器200為可在不同解碼模式之間切換的切換式音訊解碼器。解碼音訊資訊220可例如為一或多個音訊通道之時域表示。
音訊解碼器200可通常包含解碼/處理220,該解
碼/處理可例如提供用於適當地接收的音訊框之解碼音訊資訊232。換言之,解碼/處理230可基於以頻域表示編碼的一或多個編碼音訊框來執行頻域解碼(例如,AAC型解碼等)。替代地或另外,解碼/處理230可經組配來基於以時域表示(或,換言之,以線性預測域表示)編碼的一或多個編碼音訊框來執行時域解碼(或線性預測域解碼),如,例如,TCX激勵線性預測解碼(TCX=變換編碼激勵)或ACELP解碼(代數碼簿激勵線性預測解碼)。選擇性地,解碼/處理230可經組配來在不同解碼模式之間切換。
音訊解碼器200進一步包含錯誤隱藏240,該錯誤
隱藏經組配來提供用於一或多個丟失音訊框之錯誤隱藏音訊資訊242。錯誤隱藏240經組配來提供用於隱藏音訊框之丟失(或甚至多個音訊框之丟失)的錯誤隱藏音訊資訊242。
錯誤隱藏240經組配來修改基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號,以便獲得錯誤隱藏音訊資訊242。不同而言,錯誤隱藏240可獲得(或導出)用於(或基於)丟失音訊框之前的一或多個編碼音訊框的時域激勵信號,且可修改針對(或基於)丟失音訊框之前的一或多個適當地接收的音訊框的該時域激勵信號,以藉此獲得(藉由修改)用於提供錯誤隱藏音訊資訊242的時域激勵信號。換言之,可將修改後時域激勵信號用作與丟失音訊框(或甚至與多個丟失音訊框)相關聯的錯誤隱藏音訊資訊之合成(例如,LPC合成)的輸入(或用作輸入之分量)。藉由基於以丟失音訊框之前的一或多個適當地接收的音訊框為基礎獲得的時
域激勵信號來提供錯誤隱藏音訊資訊242,可避免可聞不連續。另一方面,藉由修改針對(或自)丟失音訊框之前的一或多個音訊框導出的時域激勵信號,且藉由基於修改後時域激勵信號來提供錯誤隱藏音訊資訊,可能考慮音訊內容之變化的特性(例如,基頻變化),且亦可能避免不自然的聽覺印象(例如,藉由使確定性的(例如,至少近似週期性的)信號分量「衰退」)。因此,可達成錯誤隱藏音訊資訊242包含與解碼音訊資訊232的一些相似性,該解碼音訊資訊係基於丟失音訊框之前的適當地解碼的音訊框獲得,且藉由稍微修改時域激勵信號仍可達成錯誤隱藏音訊資訊242包含在與解碼音訊資訊232相比時稍有不同的音訊內容,該解碼音訊資訊與丟失音訊框之前的音訊框相關聯。用於提供(與丟失音訊框相關聯的)錯誤隱藏音訊資訊的時域激勵信號之修改可例如包含振幅定標或時間定標。然而,其他類型之修改(或甚至振幅定標及時間定標之組合)為可能的,其中較佳地,藉由錯誤隱藏獲得(作為輸入資訊)的時域激勵信號與修改後時域激勵信號之間的一定程度的關係應保留。
總之,音訊解碼器200允許提供錯誤隱藏音訊資
訊242,使得錯誤隱藏音訊資訊甚至在一或多個音訊框丟失的狀況下亦提供良好的聽覺印象。基於時域激勵信號執行錯誤隱藏,其中藉由修改基於丟失音訊框之前的一多個音訊框獲得的時域激勵信號,來考慮音訊內容之信號特性在丟失音訊框期間的變化。
此外,應注意,音訊解碼器200可由本文所述之
任何特徵及功能單獨地或以組合方式補充。
3.根據圖3之音訊解碼器
圖3展示根據本發明之另一實施例的音訊解碼器300的方塊示意圖。
音訊解碼器300經組配來接收編碼音訊資訊310,且基於該編碼音訊資訊來提供解碼音訊資訊312。音訊解碼器300包含位元串流分析器320,該位元串流分析器可亦指定為「位元串流變形器(deformatter)」或「位元串流剖析器」。位元串流分析器320接收編碼音訊資訊310,且基於該編碼音訊資訊來提供頻域表示322及可能額外的控制資訊324。頻域表示322可例如包含編碼頻譜值326、編碼比例因數328及(選擇性地)額外旁資訊330,該額外旁資訊可例如控制特定處理步驟,如,例如,雜訊填充、中間處理或後處理。音訊解碼器300亦包含頻譜值解碼340,該頻譜值解碼經組配來接收編碼頻譜值326,且基於該編碼頻譜值來提供一組解碼頻譜值342。音訊解碼器300可亦包含比例因數解碼350,該比例因數解碼可經組配來接收編碼比例因數328,且基於該編碼比例因數來提供一組解碼比例因數352。
作為比例因數解碼的替代,可例如在編碼音訊資訊包含編碼LPC資訊而非比例因數資訊的狀況下使用LPC至比例因數轉換354。然而,在一些編碼模式中(例如,在USAC音訊解碼器之TCX解碼模式中或在EVS音訊解碼器中),一組LPC係數可用來在音訊解碼器之側導出一組比例因數。此功能可由LPC至比例因數轉換354達到。
音訊解碼器300可亦包含定標器360,該定標器可
經組配來將該組定標因數352施加於該組頻譜值342,以藉此獲得一組定標解碼頻譜值362。例如,可使用第一比例因數來定標包含多個解碼頻譜值342的第一頻帶,且可使用第二比例因數來定標包含多個解碼頻譜值342的第二頻帶。因此,獲得該組定標解碼頻譜值362。音訊解碼器300可進一步包含選擇性的處理366,該選擇性的處理可將一些處理施加於定標解碼頻譜值362。例如,選擇性的處理366可包含雜訊填充或一些其他操作。
音訊解碼器300亦包含頻域至時域變換370,該頻
域至時域變換經組配來接收定標解碼頻譜值362或該定標解碼頻譜值之處理後版本368,且提供與一組定標解碼頻譜值362相關聯的時域表示372。例如,頻域至時域變換370可提供時域表示372,該時域表示與音訊內容之框或子框相關聯。例如,頻域至時域變換可接收一組MDCT係數(該組MDCT係數可被視為定標解碼頻譜值),且基於該組MDCT係數來提供一塊時域樣本,該等時域樣本可形成時域表示372。
音訊解碼器300可選擇性地包含後處理376,該後
處理可接收時域表示372且稍微修改時域表示372,以藉此獲得時域表示372之後處理版本378。
音訊解碼器300亦包含錯誤隱藏380,該錯誤隱藏
可例如自頻域至時域變換370接收時域表示372,且該錯誤隱藏可例如提供用於一或多個丟失音訊框的錯誤隱藏音訊
資訊382。換言之,若音訊框丟失,使得例如無編碼頻譜值326可利用於該音訊框(或音訊子框),則錯誤隱藏380可基於與丟失音訊框之前的一或多個音訊框相關聯的時域表示372來提供錯誤隱藏音訊資訊。錯誤隱藏音訊資訊可通常為音訊內容之時域表示。
應注意,錯誤隱藏380可例如執行以上所述之錯
誤隱藏130之功能。另外,錯誤隱藏380可例如包含參考圖5所述之錯誤隱藏500之功能。然而,一般而言,錯誤隱藏380可包含本文關於錯誤隱藏所述之任何特徵及功能。
關於錯誤隱藏,應注意,錯誤隱藏並未在框解碼
之相同時間發生。例如,若框n為良好的則我們進行正常解碼,且最後我們保存將在我們必須隱藏下一個框的情況下有幫助的一些變數,隨後若n+1丟失則我們呼叫隱藏函數,該隱藏函數給出來自先前良好的框的變數。我們將亦更新一些變數以對下一個框丟失有幫助或促進至下一個良好的框的恢復。
音訊解碼器300亦包含信號組合390,該信號組合
經組配來接收時域表示372(或在存在後處理376的狀況下接收後處理時域表示378)。此外,信號組合390可接收錯誤隱藏音訊資訊382,該錯誤隱藏音訊資訊通常亦為針對丟失音訊框提供的錯誤隱藏音訊信號之時域表示。信號組合390可例如組合與後續音訊框相關聯的時域表示。在存在後續適當地解碼的音訊框的狀況下,信號組合390可組合(例如,重疊及相加)與此等後續適當地解碼的音訊框相關聯的
時域表示。然而,若音訊框丟失,則信號組合390可組合(例如,重疊及相加)與丟失音訊框之前的適當地解碼的音訊框相關聯的時域表示及與丟失音訊框相關聯的錯誤隱藏音訊資訊,以藉此具有適當地接收的音訊框與丟失音訊框之間的平滑過渡。類似地,信號組合390可經組配來組合(例如,重疊及相加)與丟失音訊框相關聯的錯誤隱藏音訊資訊及與丟失音訊框之後的另一適當地解碼的音訊框相關聯的時域表示(或在多個連續音訊框丟失的狀況下,與另一丟失音訊框相關聯的另一錯誤隱藏音訊資訊)。
因此,信號組合390可提供解碼音訊資訊312,使
得為適當地解碼的音訊框提供時域表示372或該時域表示之後處理版本378,且使得為丟失音訊框提供錯誤隱藏音訊資訊382,其中重疊及相加操作通常在後續音訊框之音訊資訊之間執行(不管該音訊資訊是由頻域至時域變換370或是由錯誤隱藏380提供)。因為一些編解碼器在需要被隱藏的重疊及相加部分上具有一些混疊,所以選擇性地我們可在我們已創建來執行重疊相加的半個框上創建一些人工混疊。
應注意,音訊解碼器300之功能類似於根據圖1
之音訊解碼器100之功能,其中在圖3中展示額外細節。此外,應注意,根據圖3之音訊解碼器300可由本文所述之任何特徵及功能補充。尤其,錯誤隱藏380可由本文關於錯誤隱藏所述之任何特徵及功能補充。
4.根據圖4之音訊解碼器400
圖4展示根據本發明之另一實施例的音訊解碼器
400。音訊解碼器400經組配來接收編碼音訊資訊,且基於該編碼音訊資訊來提供解碼音訊資訊412。音訊解碼器400可例如經組配來接收編碼音訊資訊410,其中使用不同編碼模式來編碼不同音訊框。例如,音訊解碼器400可被視為多模式音訊解碼器或「切換式」音訊解碼器。例如,可使用頻域表示來編碼音訊框中之一些,其中編碼音訊資訊包含頻譜值(例如,FFT值或MDCT值)之編碼表示及表示不同頻帶之定標的比例因數。此外,編碼音訊資訊410可亦包含音訊框之「時域表示」或多個音訊框之「線性預測編碼域表示」。「線性預測編碼域表示」(亦簡要地指定為「LPC表示」)可例如包含激勵信號之編碼表示及LPC參數(線性預測編碼參數)之編碼表示,其中線性預測編碼參數描述例如線性預測編碼合成濾波器,該線性預測編碼合成濾波器用以基於時域激勵信號來重建音訊信號。
在下文中,將描述音訊解碼器400之一些細節。
音訊解碼器400包含位元串流分析器420,該位元
串流分析器可例如分析編碼音訊資訊410,且自編碼音訊資訊410擷取頻域表示422,該頻域表示包含例如編碼頻譜值、編碼比例因數及(選擇性地)額外旁資訊。位元串流分析器420可亦經組配來擷取線性預測編碼域表示424,該線性預測編碼域表示可例如包含編碼激勵426及編碼線性預測係數428(該等編碼線性預測係數可亦被視為編碼線性預測參數)。此外,位元串流分析器可選擇性地自編碼音訊資訊
擷取額外旁資訊,該額外旁資訊可用於控制額外處理步驟。
音訊解碼器400包含頻域解碼路徑430,該頻域解
碼路徑可例如大體上與根據圖3之音訊解碼器300之解碼路徑相同。換言之,頻域解碼路徑430可包含頻譜值解碼340、比例因數解碼350、定標器360、選擇性的處理366、頻域至時域變換370、選擇性的後處理376及錯誤隱藏380,如以上參考圖3所述。
音訊解碼器400可亦包含線性預測域解碼路徑
440(該線性預測域解碼路徑可亦被視為時域解碼路徑,因為LPC合成係在時域中執行)。線性預測域解碼路徑包含激勵解碼450,該激勵解碼接收由位元串流分析器420提供的編碼激勵426,且基於該編碼激勵來提供解碼激勵452(該解碼激勵可採取解碼時域激勵信號之形式)。例如,激勵解碼450可接收編碼變換編碼激勵資訊,且可基於該編碼變換編碼激勵資訊來提供解碼時域激勵信號。因此,激勵解碼450可例如執行由參考圖7所述之激勵解碼器730執行的功能。
然而,替代地或另外,激勵解碼450可接收編碼ACELP激勵,且可基於該編碼ACELP激勵資訊來提供解碼時域激勵信號452。
應注意,存在用於激勵解碼之不同選項。參考例
如定義CELP編碼概念、ACELP編碼概念、CELP編碼概念及ACELP編碼概念之修改以及TCX編碼概念的有關標準及出版品。
線性預測域解碼路徑440選擇性地包含處理
454,其中自時域激勵信號452導出處理後時域激勵信號456。
線性預測域解碼路徑440亦包含線性預測係數解
碼460,該線性預測係數解碼經組配來接收編碼線性預測係數,且基於該編碼線性預測係數來提供解碼線性預測係數462。線性預測係數解碼460使用線性預測係數之不同表示作為輸入資訊428,且可提供解碼線性預測係數之不同表示作為輸出資訊462。關於細節,參考描述線性預測係數之編碼及/或解碼的不同標準文件。
線性預測域解碼路徑440選擇性地包含處理
464,該處理可處理解碼線性預測係數且提供該等解碼線性預測係數之處理後版本466。
線性預測域解碼路徑440亦包含LPC合成(線性
預測編碼合成)470,該LPC合成經組配來接收解碼激勵452或該解碼激勵之處理後版本456以及解碼線性預測係數462或該解碼線性預測係數之處理後版本466,且提供解碼時域音訊信號472。例如,LPC合成470可經組配來將由解碼線性預測係數462(或該解碼線性預測係數之處理後版本466)定義的濾波施加至解碼時域激勵信號452或該解碼時域激勵信號之處理後版本,使得藉由濾波(合成濾波)時域激勵信號452(或處理後版本456)來獲得解碼時域音訊信號472。線性預測域解碼路徑440可選擇性地包含後處理474,該後處理可用來細化或調整解碼時域音訊信號472之特性。
線性預測域解碼路徑440亦包含錯誤隱藏480,該
錯誤隱藏經組配來接收解碼線性預測係數462(或該解碼線性預測係數之處理後版本466)及解碼時域激勵信號452(或該解碼時域激勵信號之處理後版本456)。錯誤隱藏480可選擇性地接收額外資訊,如例如基頻資訊。錯誤隱藏480可因此在編碼音訊資訊410之框(或子框)丟失的狀況下提供錯誤隱藏音訊資訊,該錯誤隱藏音訊資訊可以時域音訊信號之形式。因此,錯誤隱藏480可提供錯誤隱藏音訊資訊482,使得錯誤隱藏音訊資訊482之特性大體上適於丟失音訊框之前的最後適當地解碼的音訊框之特性。應注意,錯誤隱藏480可包含關於錯誤隱藏240所述之任何特徵及功能。另外,應注意,錯誤隱藏480可亦包含關於圖6之時域隱藏所述之任何特徵及功能。
音訊解碼器400亦包含信號組合器(或信號組合
490),該信號組合器經組配來接收解碼時域音訊信號372(或該解碼時域音訊信號之後處理版本378)、由錯誤隱藏380提供的錯誤隱藏音訊資訊382、解碼時域音訊信號472(或該解碼時域音訊信號之後處理版本476)及由錯誤隱藏480提供的錯誤隱藏音訊資訊482。信號組合器490可經組配來組合該等信號372(或378)、382、472(或476)及482,以藉此獲得解碼音訊資訊412。尤其,可由信號組合器490施加重疊及相加操作。因此,信號組合器490可提供後續音訊框之間的平滑過渡,由不同實體(例如,由不同解碼路徑430、440)為該等後續音訊框提供時域音訊信號。然而,若由相同實體(例如,頻域至時域變換370或LPC合成470)為後續框提供
時域音訊信號,則信號組合器490可亦提供平滑過渡。因為一些編解碼器在需要被隱藏的重疊及相加部分上具有一些混疊,所以選擇性地我們可在我們已創建來執行重疊相加的半個框上創建一些人工混疊。換言之,可選擇性地使用人工時域混疊補償(TDAC)。
另外,信號組合器490可提供到達框及離開該等
框的平滑過渡,針對該等框提供錯誤隱藏音訊資訊(該錯誤隱藏音訊資訊通常亦為時域音訊信號)。
簡而言之,音訊解碼器400允許解碼在頻域中編
碼的音訊框及在線性預測域中編碼的音訊框。尤其,可能依賴於信號特性(例如,使用由音訊編碼器提供的發信號資訊)而在頻域解碼路徑之使用與線性預測域解碼路徑之使用之間切換。不同類型之錯誤隱藏可用於在框丟失的狀況下提供錯誤隱藏音訊資訊,取決於最後適當地解碼的音訊框是在頻域中(或等效地以頻域表示)還是在時域中(或等效地以時域表示,或等效地以線性預測域,或等效地以線性預測域表示)編碼。
5.根據圖5之時域隱藏
圖5展示根據本發明之一實施例的錯誤隱藏的方塊示意圖。根據圖5之錯誤隱藏全部指定為500。
錯誤隱藏500經組配來接收時域音訊信號510,且基於該時域音訊信號來提供錯誤隱藏音訊資訊512,該錯誤隱藏音訊資訊可例如採取時域音訊信號之形式。
應注意,錯誤隱藏500可例如代替錯誤隱藏130,
使得錯誤隱藏音訊資訊512可對應於錯誤隱藏音訊資訊132。此外,應注意,錯誤隱藏500可代替錯誤隱藏380,使得時域音訊信號510可對應於時域音訊信號372(或對應於時域音訊信號378),且使得錯誤隱藏音訊資訊512可對應於錯誤隱藏音訊資訊382。
錯誤隱藏500包含預加強520,該預加強可被視為
選擇性的。預加強接收時域音訊信號,且基於該時域音訊信號來提供預加強時域音訊信號522。
錯誤隱藏500亦包含LPC分析530,該LPC分析經
組配來接收時域音訊信號510或該時域音訊信號之預加強版本522,且獲得LPC資訊532,該LPC資訊可包含一組LPC參數532。例如,LPC資訊可包含一組LPC濾波係數(或該組LPC濾波係數之表示)及時域激勵信號(該時域激勵信號適於根據LPC濾波係數組配的LPC合成濾波器之激勵,以至少近似地重建LPC分析之輸入信號)。
錯誤隱藏500亦包含基頻搜尋540,該基頻搜尋經
組配來例如基於先前解碼的音訊框獲得基頻資訊542。
錯誤隱藏500亦包含外插550,該外插可經組配來
基於LPC分析之結果(例如,基於由LPC分析決定的時域激勵信號)且可能基於基頻搜尋之結果獲得外插時域激勵信號。
錯誤隱藏500亦包含雜訊產生560,該雜訊產生提
供雜訊信號562。錯誤隱藏500亦包含組合器/衰減器570,該組合器/衰減器經組配來接收外插時域激勵信號552及雜
訊信號562,且基於該外插時域激勵信號及該雜訊信號來提供組合時域激勵信號572。組合器/衰減器570可經組配來組合外插時域激勵信號552及雜訊信號562,其中可執行衰退,使得外插時域激勵信號552(該外插時域激勵信號決定LPC合成之輸入信號之確定性的分量)之相對貢獻隨時間推移而減少,而雜訊信號562之相對貢獻隨時間推移而增加。
然而,組合器/衰減器之不同功能亦為可能的。另外,參考以下描述。
錯誤隱藏500亦包含LPC合成580,該LPC合成接
收組合時域激勵信號572且該LPC合成基於該組合時域激勵信號來提供時域音訊信號582。例如,LPC合成可亦接收描述施加於組合時域激勵信號572的LPC成形濾波器的LPC濾波係數,以導出時域音訊信號582。LPC合成580可例如使用基於一或多個先前解碼的音訊框獲得的(例如,由LPC分析530提供的)LPC係數。
錯誤隱藏500亦包含解強584,該解強可被視為選擇性的。解強584可提供解強錯誤隱藏時域音訊信號586。
錯誤隱藏500亦選擇性地包含重疊及相加590,該重疊及相加執行與後續框(或子框)相關聯的時域音訊信號之重疊及相加操作。然而,應注意,重疊及相加590應被視為選擇性的,因為錯誤隱藏可亦使用已在音訊解碼器環境中提供的信號組合。例如,重疊及相加590在一些實施例中可由音訊解碼器300中的信號組合390替代。
在下文中,將描述關於錯誤隱藏500的一些進一
步細節。
根據圖5之錯誤隱藏500涵蓋如AAC_LC或
AAC_ELD的變換域編解碼器之情境。不同而言,錯誤隱藏500極其適於在此變換域編解碼器中(且尤其在此變換域音訊解碼器中)的使用。在僅變換編解碼器的狀況下(例如,在無線性預測域解碼路徑的情況下)將來自最後框的輸出信號用作起始點。例如,可將時域音訊信號372用作錯誤隱藏之起始點。較佳地,無激勵信號為可利用的,僅來自(一或多個)先前框的輸出時間域信號(如,例如,時域音訊信號372)為可利用的。
在下文中,將更詳細地描述錯誤隱藏500之子單
元及功能。
5.1.LPC分析
在根據圖5之實施例中,在激勵域中進行所有隱藏以獲取連序框之間的更平滑過渡。因此,有必要首先找到(或,更一般而言,獲得)適當的一組LPC參數。在根據圖5之實施例中,在過去預加強時域信號522上進行LPC分析530LPC參數(或LPC濾波係數)用來(例如,基於時域音訊信號510或基於預加強時域音訊信號522)執行過去合成信號之LPC分析,以獲取激勵信號(例如,時域激勵信號)。
5.2.基頻搜尋
存在用以獲取用於構建新信號(例如,錯誤隱藏音訊資訊)的基頻的不同方法。
在使用LTP濾波器(長期預測濾波器)(如
AAC-LTP)的編解碼器之情境下,若最後框為具有LTP的AAC,則我們使用此最後接收的LTP基頻滯後及對應增益來產生諧波部分。在此狀況下,增益用來決定是否構建信號中的諧波部分。例如,若LTP增益比0.6(或任何其他預定值)更高,則使用LTP資訊來構建諧波部分。
若不存在可得自先前框的任何基頻資訊,則存在
例如將在下文中描述的兩種解決方案。
例如,可能在編碼器處進行基頻搜尋且在位元串
流中傳輸基頻滯後及增益。此類似於LTP,但不施加任何濾波(在清潔通道中亦無LTP濾波)。
或者,可能在解碼器中執行基頻搜尋。在FFT域
中進行TCX狀況下的AMR-WB基頻搜尋。在ELD中,例如,若使用MDCT域,則將遺漏該等階段。因此,基頻搜尋較佳地直接在激勵域中進行。此舉給出比在合成域中進行基頻搜尋更好的結果。首先藉由正規化的交叉相關以開迴路來進行激勵域中的基頻搜尋。隨後,選擇性地,我們藉由以一定差量圍繞開迴路基頻進行閉迴路搜尋來細化基頻搜尋。由於ELD開視窗限制,可找到錯誤的基頻,因此我們亦驗證所找到的基頻為正確的或否則丟棄該基頻。
總之,當提供錯誤隱藏音訊資訊時,可考慮丟失
音訊框之前的最後適當地解碼的音訊框之基頻。在一些狀況下,存在可得自先前框(亦即,丟失音訊框之前的最後框)之解碼的基頻資訊。在此狀況下,可重新使用此基頻(可能具有一些外插及隨時間推移的基頻變化的考慮)。我們亦可
選擇性地重新使用多於一個過去框之基頻,以試圖外插我們在我們的隱藏框之結束時需要的基頻。
另外,若存在描述確定性的(例如,至少近似週
期性的)信號分量之強度(或相對強度)的可利用的資訊(例如,指定為長期預測增益),則此值可用以決定是否應將確定性的(或諧波)分量包括至錯誤隱藏音訊資訊中。換言之,藉由將該值(例如,LTP增益)與預定臨限值進行比較,可決定對於錯誤隱藏音訊資訊之提供是否應考慮自先前解碼的音訊框導出的時域激勵信號。
若不存在可得自先前框(或,更確切地,得自先
前框之解碼)的基頻資訊,則存在不同的選項。可將基頻資訊自音訊編碼器傳輸至音訊解碼器,此將簡化音訊解碼器但產生位元率管理負擔。或者,可在音訊解碼器中(例如,在激勵域中,亦即,基於時域激勵信號)決定基頻資訊。例如,可估計自先前的、適當地解碼的音訊框導出的時域激勵信號,以識別將用於提供錯誤隱藏音訊資訊的基頻資訊。
5.3.激勵之外插或諧波部分之創建
自先前框獲得的(剛剛針對丟失框計算的或已針對多個框丟失保存在先前丟失框中的)激勵(例如,時域激勵信號)用以藉由將最後基頻週期複製獲取一個半框所需的次數,來構建激勵中的(例如,LPC合成之輸入信號中的)諧波部分(亦指定為確定性的分量或近似週期性的分量)。為節省複雜性,我們亦可僅針對第一丟失框創建一個半框,且隨後使用於後續框丟失的處理移位半個框且各自創建僅
一個框。隨後我們始終可以使用半個框的重疊。
在良好框(亦即,適當地解碼的框)之後的第一丟
失框的狀況下,第一基頻週期(例如,基於丟失音訊框之前的最後適當地解碼的音訊框獲得的時域激勵信號的第一基頻週期)以抽樣速率相依的濾波器予以低通濾波(因為ELD涵蓋實際上寬廣的抽樣率組合--自AAC-ELD核心至具有SBR的AAC-ELD或AAC-ELD雙重速率SBR)。
語音信號中的基頻幾乎始終在改變。因此,以上
呈現的隱藏傾向於在恢復時產生一些問題(或至少失真),因為隱藏信號結束時(亦即,錯誤隱藏音訊資訊結束時)的基頻通常不匹配第一良好框之基頻。因此,選擇性地,在一些實施例中,試圖預測隱藏框結束時的基頻以匹配恢復框開始時的基頻。例如,預測丟失框(該丟失框被視為隱藏框)結束時的基頻,其中預測之目標為將丟失框(隱藏框)結束時的基頻設定為近似於一或多個丟失框之後的第一適當地解碼的框(該第一適當地解碼的框亦稱為「恢復框」)開始時的基頻。此舉可在框丟失期間或在第一良好框期間(亦即,在第一適當地接收的框期間)進行。為獲取甚至更好的結果,可能選擇性地重新使用一些習知工具且調適該等習知工具,該等習知工具諸如基頻預測及脈衝再同步。關於細節,參考例如參考文獻[6]及[7]。
若在頻域編解碼器中使用長期預測(LTP),則可
能將滯後用作關於基頻的起始資訊。然而,在一些實施例中,亦希望具有更好的粒度以便能夠更好地追蹤基頻曲
線。因此,較佳地在最後良好的(適當地解碼的)框開始時且在該最後良好的框結束時進行基頻搜尋。為使信號適於移動的基頻,希望使用最新技術中存在的脈衝再同步。
5.4.基頻之增益
在一些實施例中,較佳地在先前獲得的激勵上施加增益以便達到所要的位準。「基頻之增益」(例如,時域激勵信號之確定性的分量之增益,亦即,施加至自先前解碼的音訊框導出的時域激勵信號以便獲得LPC合成之輸入信號的增益)可例如藉由在最後良好的(例如,適當地解碼的)框結束時於時域中進行正規化的相關來獲得。相關之長度可等於兩個子框長度,或可適應性地改變。延遲等於用於諧波部分之創建的基頻滯後。我們亦可選擇性地僅對第一丟失框執行增益計算,且隨後施加衰退(減少的增益)以用於後繼連序框丟失。
「基頻之增益」將決定將要創建的音調之量(或確定性的、至少近似週期性的信號分量之量)。然而,希望增添一些成形雜訊以便並非具有僅一人工音調。若我們獲取極低的基頻之增益,則我們構造僅由成形雜訊組成的信號。
總之,在一些狀況下,依賴於增益來定標例如基於先前解碼的音訊框獲得的時域激勵信號(例如,以獲得用於LPC分析的輸入信號)。因此,因為時域激勵信號決定確定性的(至少近似週期性的)信號分量,所以增益可決定錯誤隱藏音訊資訊中的該等確定性的(至少近似週期性的)信號
分量之相對強度。另外,錯誤隱藏音訊資訊可基於雜訊,該雜訊亦由LPC合成成形,使得錯誤隱藏音訊資訊之總能量至少在一些程度上適於丟失音訊框之前的適當地解碼的音訊框,且理想地亦適於一或多個丟失音訊框之後的適當地解碼的音訊框。
5.5.雜訊部分之創建
「革新」由隨機雜訊產生器創建。此雜訊選擇性地進一步經高通濾波,且選擇性地針對語音及肇始框預加強。至於諧波部分之低通,此濾波器(例如,高通濾波器)為抽樣速率相依的。此雜訊(其例如由雜訊產生560提供)將由LPC(例如,由LPC合成580)成形,以盡可能地接近背景雜訊。高通特性亦選擇性地隨連序框丟失而改變,使得斷言一定量的框丟失,不再存在用以僅獲取滿帶成形的雜訊的濾波來獲取最接近於背景雜訊的舒適雜訊。
革新增益(其可例如決定組合/衰退570中的雜訊562之增益,亦即,使用來將雜訊信號562包括至LPC合成之輸入信號572中的增益)係例如藉由移除基頻(例如,基於丟失音訊框之前的最後適當地解碼的音訊框獲得的時域激勵信號之使用「基頻之增益」定標的定標版本)之先前計算的貢獻(若該貢獻存在)且在最後良好的框結束時進行相關來計算。至於基頻增益,此舉可選擇性地僅對第一丟失框進行且隨後衰退,但在此狀況下,該衰退可變為導致完全靜音的0,或變為存在於背景中的估計雜訊位準。相關之長度為例如相當於兩個子框長度,且延遲等於用於諧波部分
之創建的基頻滯後。
選擇性地,若基頻之增益並非一,則使此增益亦
乘以(1-「基頻之增益」)以在雜訊上施加同樣多的增益以達到能量遺漏。選擇性地,使此增益亦乘以雜訊因數。此雜訊因數來自例如先前有效框(例如,來自丟失音訊框之前的最後適當地解碼的音訊框)。
5.6.衰退
衰退主要用於多個框丟失。然而,衰退可亦使用於僅單個音訊框丟失的狀況下。
在多個框丟失的狀況下,並不重新計算LPC參數。或者,保留最後計算的一個LPC參數,或者藉由收斂至背景形狀來進行LPC隱藏。在此狀況下,信號之週期性收斂至零。例如,基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號502仍使用隨時間推移逐漸減少的增益,而雜訊信號562保持恆定或使用隨時間推移逐漸增加的增益予以定標,使得時域激勵信號552之相對權重在與雜訊信號562之相對權重相比時隨時間推移減少。因此,LPC合成580之輸入信號572變得愈來愈「類似雜訊」。因此,「週期性」(或,更確切而言,LPC合成580之輸出信號582之確定性的或至少近似週期性的分量)隨時間推移減少。
信號572之週期性及/或信號582之週期性收斂至0所依據的收斂速度取決於最後正確地接收的(或適當地解碼的)框之參數及/或連序抹除的框之數目,且由衰減因數α控制。因數α進一步取決於LP濾波器之穩定性。選擇性地,
可能隨著基頻長度在比率方面改變因數α。若基頻(例如,與基頻相關聯的週期長度)實際上較長,則我們使α保持「正常」,但若基頻實際上較短,則通常必須將過去激勵之相同部分複製許多次。此將迅速地聽起來過於人工,且因此較佳地使此信號衰退得更快。
進一步選擇性地,若基頻預測輸出為可利用的,
則我們可考慮該基頻預測輸出。若基頻經預測,則此意味著基頻在先前框中已改變,且隨後我們丟失愈多的框我們距真實愈遠。因此,較佳地在此狀況下使音調部分之衰退加速一位元。
若基頻預測因為基頻改變得過多而失敗,則此意
味著基頻值並非實際上可靠的或信號為實際上不可預測的。因此,再一次,較佳地衰退得更快(例如,使基於一或多個丟失音訊框之前的一或多個適當地解碼的音訊框獲得的時域激勵信號552衰退得更快)。
5.7.LPC合成
為回至時域,較佳地對兩個激勵(音調部分及雜訊部分)之總和執行LPC合成580,然後進行解強。不同而言,較佳地以基於丟失音訊框(音調部分)之前的一或多個適當地解碼的音訊框獲得的時域激勵信號552及雜訊信號562(雜訊部分)之加權組合為基礎而執行LPC合成580。如以上所提及,時域激勵信號552在與藉由LPC分析530獲得的時域激勵信號532相比時(除了描述用於LPC合成580的LPC合成濾波器之特性的LPC係數之外)可經修改。例如,時域
激勵信號552可為藉由LPC分析530獲得的時域激勵信號532之時間定標複本,其中時間定標可用來使時域激勵信號552之基頻適於所要的基頻。
5.8.重疊及相加
在僅變換編解碼器的狀況下,為獲取較好的重疊-相加,我們針對比隱藏框多的半個框創建人工信號,且我們在該人工信號上創建人工混疊。然而,可應用不同的重疊-相加概念。
在規則的AAC或TCX之情境下,將重疊及相加應用於來自隱藏的額外半個框與第一良好的框之第一部分(對於比AAC-LD更低延遲的視窗可為一半或更少)之間。
在ELD(額外低延遲)之特殊狀況下,對於第一丟失框,較佳地使分析運行三次以獲取來自最後三個視窗的適當貢獻,且隨後對於第一隱藏框及所有以後的框使分析再運行一次。隨後,進行一個ELD合成以回到時域中,其中所有適當記憶體用於MDCT域中的以後框。
總之,可使LPC合成580之輸入信號572(及/或時域激勵信號552)提供達一時序持續時間,該時序持續時間比丟失音訊框之持續時間更長。因此,亦可使LPC合成580之輸出信號582提供達比丟失音訊框更長的時間週期。因此,可在錯誤隱藏音訊資訊(該錯誤隱藏音訊資訊因此為針對比丟失音訊框之時序擴展更長的時間週期獲得的)與針對一或多個丟失音訊框之後的適當地解碼的音訊框提供的解碼音訊資訊之間執行重疊及相加。
簡而言之,錯誤隱藏500極其適於音訊框在頻域
中經編碼的狀況。儘管音訊框在頻域中經編碼,但是錯誤隱藏音訊資訊之提供係基於時域激勵信號來執行。將不同的修改應用於基於丟失音訊框之前的一或多個適當地解碼的音訊框獲得的時域激勵信號。例如,藉由LPC分析530提供的時域激勵信號適於基頻變化,例如,使用時間定標。
此外,由LPC分析530提供的時域激勵信號亦藉由定標(增益之施加)修改,其中確定性的(或音調或至少近似週期性的)分量之衰退可藉由定標器/衰減器570執行,使得LPC合成580之輸入信號572包含自藉由LPC分析獲得的時域激勵信號導出的分量及基於雜訊信號562的雜訊分量兩者。然而,通常相對於由LPC分析530提供的時域激勵信號來修改(例如,時間定標且/或振幅定標)LPC合成580之輸入信號572之確定性的分量。
因此,時域激勵信號可適於需求,且避免不自然
的聽覺印象。
6.根據圖6之時域隱藏
圖6展示可用於切換式編解碼器的時域隱藏的方塊示意圖。例如,根據圖6之時域隱藏600可例如代替錯誤隱藏240或代替錯誤隱藏480。
此外,應注意的是,根據圖6之實施例涵蓋使用組合時域及頻域的切換式編解碼器(諸如USAC(MPEG-D/MPEG-H)或EVS(3GPP))的情境(可用於該情境下)。換言之,時域隱藏600可用於存在頻域解碼與時間解
碼(或,等效地,基於的線性預測係數解碼)之間的切換的音訊解碼器中。
然而,應注意,根據圖6之錯誤隱藏600可亦用於
僅在時域(或等效地,在線性預測係數域中)中執行解碼的音訊解碼器中。
在切換式編解碼器的狀況下(且甚至在僅在線性
預測係數域中執行解碼的編解碼器的狀況下),我們通常已具有來自先前框(例如,丟失音訊框之前的適當地解碼的音訊框)的激勵信號(例如,時域激勵信號)。否則(例如,若時域激勵信號不可利用),則可能如根據圖5之實施例中所解釋地進行,亦即,可能執行LPC分析。若先前框類似ACELP,則我們亦已具有最後框中的子框之基頻資訊。若最後框為具有LTP(長期預測)的TCX(變換編碼激勵),則我們亦具有來自長期預測的滯後資訊。且若最後框在頻域中而無長期預測(LTP),則較佳地直接在激勵域中(例如,基於藉由LPC分析提供的時域激勵信號)進行基頻搜尋。
若解碼器已使用時域中的一些LPC參數,則我們
重新使用該等LPC參數且外插一組新的LPC參數。若DTX(不連續傳輸)存在於編解碼器中,則LPC參數之外插係基於過去LPC,例如最後三個框之均值及(選擇性地)在DTX雜訊估計期間導出的LPC形狀。
所有隱藏皆在激勵域中進行以獲取連序框之間
的較平滑過渡。
在下文中,將更詳細地描述根據圖6之錯誤隱藏
600。
錯誤隱藏600接收過去激勵610及過去基頻資訊
640。此外,錯誤隱藏600提供錯誤隱藏音訊資訊612。
應注意,由錯誤隱藏600接收的過去激勵610可例
如對應於LPC分析530之輸出532。此外,過去基頻資訊640可例如對應於基頻搜尋540之輸出資訊542。
錯誤隱藏600進一步包含外插650,該外插對應於
外插550,使得參考以上論述。
此外,錯誤隱藏包含雜訊產生器660,該雜訊產
生器可對應於雜訊產生器560,使得參考以上論述。
外插650提供外插時域激勵信號652,該外插時域
激勵信號可對應於外插時域激勵信號552。雜訊產生器660提供雜訊信號662,該雜訊信號對應於雜訊信號562。
錯誤隱藏600亦包含組合器/衰減器670,該組合
器/衰減器接收外插時域激勵信號652及雜訊信號662,且基於該外插時域激勵信號及該雜訊信號來為LPC合成680提供輸入信號672,其中LPC合成680可對應於LPC合成580,使得以上解釋亦適用。LPC合成680提供時域音訊信號682,該時域音訊信號可對應於時域音訊信號582。錯誤隱藏亦包含(選擇性地)解強684,該解強可對應於解強584且該解強提供解強錯誤隱藏時域音訊信號686。錯誤隱藏600選擇性地包含重疊及相加690,該重疊及相加可對應於重疊及相加590。然而,以上關於重疊及相加590的解釋亦適用於重疊及相加690。換言之,重疊及相加690可亦由音訊解碼
器之整個重疊及相加替代,使得LPC合成之輸出信號682或解強之輸出信號686可被視為錯誤隱藏音訊資訊。
總之,錯誤隱藏600實質上不同於錯誤隱藏500,
因為錯誤隱藏600直接自一或多個先前解碼的音訊框直接獲得過去激勵資訊610及過去基頻資訊640,而無需執行LPC分析及/或基頻分析。然而,應注意錯誤隱藏600可選擇性地包含LPC分析及/或基頻分析(基頻搜尋)。
在下文中,將更詳細地描述錯誤隱藏600之一些
細節。然而,應注意,特定細節應被視為實例,而非視為基本特徵。
6.1.基頻搜尋之過去基頻
存在用以獲取用於構建新信號的基頻的不同方法。
在使用LTP濾波器的編解碼器(如AAC-LTP)的情境下,若(失去框之前的)最後框為具有LTP的AAC,則我們具有來自最後LTP基頻滯後的基頻資訊及對應增益。在此狀況下,我們使用增益來決定我們是否想要構建信號中的諧波部分。例如,若LTP增益比0.6更高,則我們使用LTP資訊來構建諧波部分。
若我們不具有可得自先前框的任何基頻資訊,則存在例如兩種其他解決方案。
一解決方案將在編碼器處進行基頻搜尋且在位元串流中傳輸基頻滯後及增益。此類似於長期預測(LTP),但我們不施加任何濾波(在清潔通道中亦無LTP濾波)。
另一解決方案將在解碼器中執行基頻搜尋。在
FFT域中進行在TCX狀況下的AMR-WB基頻搜尋。在例如TCX中,我們使用MDCT域,隨後我們遺漏該等階段。因此,在一較佳實施例中,直接在激勵域中(例如,基於用作LPC合成之輸入或用以導出用於LPC合成之輸入的時域激勵信號)進行基頻搜尋。此通常得出比在合成域中(例如,基於全解碼時域音訊信號)進行基頻搜尋更好的結果。
首先藉由正規化的交叉相關以開迴路來進行激
勵域中(例如,基於時域激勵信號)的基頻搜尋。隨後,選擇性地,可藉由以一定差量圍繞開迴路基頻進行閉迴路搜尋來細化基頻搜尋。
在較佳實施例中,我們不僅僅考慮相關之一最大
值。若我們具有來自非易出錯先前框的基頻資訊,則我們選擇對應於正規化的交叉相關域中的五個最高值之一但最接近於先前框基頻的基頻。隨後,亦驗證所找到的最大值由於視窗限制而並非錯誤的最大值。
總之,存在用以決定基頻的不同概念,其中考慮
過去基頻(亦即,與先前解碼的音訊框相關聯的基頻)為計算上有效的。或者,可將基頻資訊自音訊編碼器傳輸至音訊解碼器。作為另一替選方案,可在音訊解碼器之側執行基頻搜尋,其中較佳地基於時域激勵信號(亦即,在激勵域中)來執行基頻決定。可執行包含開迴路搜尋及閉迴路搜尋的兩級段基頻搜尋,以便獲得尤其可靠的且精確的基頻資訊。替代地或另外,可使用來自先前解碼的音訊框的基頻
資訊,以便確保基頻搜尋提供可靠的結果。
6.2.激勵之外插或諧波部分之創建
自先前框獲得的(剛剛針對丟失框計算的或已針對多個框丟失保存在先前丟失框中的)激勵(例如,以時域激勵信號之形式)用以藉由將最後基頻週期(例如,時域激勵信號610之一部分,該時域激勵信號之時序持續時間等於基頻之週期持續時間)複製獲取(例如)一個半(丟失)框所需的次數,來構建激勵(例如,外插時域激勵信號662)中的諧波部分。
為獲取甚至更好的結果,選擇性地可能重新使用自最新技術已知的一些工具且調適該等工具。關於細節,參考例如參考文獻[6]及[7]。
已發現,語音信號中的基頻幾乎始終在變化。因此,已發現,以上呈現的隱藏傾向於在恢復時產生一些問題,因為在隱藏信號結束時的基頻通常不匹配第一良好的框之基頻。因此,選擇性地,試圖預測隱藏框結束時的基頻以匹配恢復框開始時的基頻。此功能將例如藉由外插650來執行。
若使用TCX中的LTP,則可將滯後用作關於基頻的起始資訊。然而,希望具有更好的粒度以便能夠更好地追蹤基頻曲線。因此,選擇性地在最後良好的框開始時且在該最後良好的框結束時進行基頻搜尋。為使信號適於移動的基頻,可使用最新技術中存在的脈衝再同步。
總之,外插(例如,與丟失框之前的最後適當地
解碼的音訊框相關聯或基於該最後適當地解碼的音訊框獲得的時域激勵信號之外插)可包含複製與先前音訊框相關聯的該時域激勵信號之一時間部分,其中該複製的時間部分可依賴於丟失音訊框期間的(預期)基頻變化之計算或估計而經修改。不同的概念可利用於決定基頻變化。
6.3.基頻之增益
在根據圖6之實施例中,將增益施加於先前獲得的激勵上以便達到所要的位準。基頻之增益係例如藉由在最後良好的框結束時於時域中進行正規化的相關來獲得。例如,相關之長度可等於兩個子框長度,且延遲可等於用於諧波部分之創建的(例如,用於複製時域激勵信號的)基頻滯後。已發現,在時域中進行增益計算得出比在激勵域中進行增益計算可靠得多的增益。LPC正在改變每個框,且隨後將在先前框上計算的增益施加於將由其他LPC集合處理的激勵信號上將不會在時域中得出預期能量。
基頻之增益決定將創建的音調之量,但將亦增添一些成形雜訊以便不僅具有人工音調。若獲得極低的基頻之增益,則可構造僅由成形雜訊組成的信號。
總之,施加來定標基於先前框獲得的時域激勵信號(或針對先前解碼的框獲得的時域激勵信號,或與先前解碼的框相關聯的時域激勵信號)的增益經調整,以藉此決定在LPC合成680之輸入信號內及因此在錯誤隱藏音訊資訊內的音調(或確定性的或至少近似週期性的)分量之加權。該增益可基於相關來決定,該相關經施加於藉由先前解碼的
框之解碼獲得的時域音訊信號(其中該時域音訊信號可使用在解碼過程中執行的LPC合成來獲得)。
6.4.雜訊部分之創建
革新由隨機雜訊產生器660創建。此雜訊進一步經高通濾波,且選擇性地針對語音及肇始框預加強。可選擇性地針對語音及啟始框執行的高通濾波及預加強在圖6中並未明確地示出,但可例如在雜訊產生器660內或在組合器/衰減器670內執行。
雜訊將由LPC成形(例如,在與藉由外插650獲得的時域激勵信號652組合之後)以變得盡可能接近背景雜訊。
例如,革新增益可藉由移除基頻之先前計算的貢獻(若該貢獻存在)且在最後良好的框結束時進行相關來計算。相關之長度可等於兩個子框長度,且延遲可等於用於諧波部分之創建的基頻滯後。
選擇性地,若基頻之增益並非一,則此增益可亦乘以(1-基頻之增益)以在雜訊上施加同樣多的增益以達到能量遺漏。選擇性地,亦使此增益乘以雜訊因數。此雜訊因數可來自先前有效的框。
總之,使用LPC合成680(及可能地,解強684)藉由成形由雜訊產生器660提供的雜訊來獲得錯誤隱藏音訊資訊之雜訊分量。另外,可施加額外高通濾波及/或預加強。可基於丟失音訊框之前的最後適當地解碼的音訊框來計算對LPC合成680之輸入信號672的雜訊貢獻之增益(亦指
定為「革新增益」),其中確定性的(或至少近似週期性的)分量可自丟失音訊框之前的音訊框移除,且其中相關可隨後執行來決定在丟失音訊框之前的音訊框之解碼時域信號內的雜訊分量之強度(或增益)。
選擇性地,可將一些額外修改施加於雜訊分量之
增益。
6.5.衰退
衰退主要用於多個框丟失。然而,衰退可亦使用於僅單個音訊框丟失的狀況下。
在多個框丟失的狀況下,並不重新計算LPC參數。或者保留最後計算的一個LPC參數或如者以上所解釋執行LPC隱藏。
信號之週期性收斂至零。收斂速度取決於最後正確地接收的(正確地解碼的)框之參數及連序抹除(或丟失)框之數目,且由衰減因數α控制。因數α進一步取決於LP濾波器之穩定性。選擇性地,可隨著基頻長度在比率方面改變因數α。例如,若基頻實際上較長,則α可保持正常,但若基頻實際上較短,則可能需要(或必須)將過去激勵之相同部分複製許多次。因為已發現此將迅速地聽起來過於人工,因此使信號衰退得更快。
此外,選擇性地,可能考慮基頻預測輸出。若基頻經預測,則意味著基頻在先前框中已改變,且隨後框丟失得愈多我們距真實愈遠。因此,在此狀況下需要使音調部分之衰退加速一位元。
若基頻預測因為基頻改變得過多而失敗,則此意
味著基頻值並非實際上可靠的或信號為實際上不可預測的。因此,再次我們應衰退得更快。
總之,外插時域激勵信號652對LPC合成680之輸
入信號672的貢獻通常隨時間推移減少。此可例如藉由隨時間推移減少施加至外插時域激勵信號652的增益值來達成。依賴於一或多個音訊框之一或多個參數(且/或依賴於連序丟失音訊框之數目)而調整用以逐漸減少增益的速度,該增益係施加來定標基於丟失音訊框之前的一或多個音訊框獲得的時域激勵信號552(或該時域激勵信號之一或多個複本)。尤其,基頻長度及/或基頻隨時間推移而改變的速率,及/或基頻預測是失敗或是成功之問題可用以調整該速度。
6.6.LPC合成
為回至時域,對兩個激勵(音調部分652及雜訊部分662)之總和(或通常,加權組合)執行LPC合成680,然後進行解強684。
換言之,外插時域激勵信號652及雜訊信號662之加權(衰退)組合的結果形成組合時域激勵信號且輸入至LPC合成680中,該LPC合成可例如依賴於描述合成濾波器的LPC係數而基於該組合時域激勵信號672來執行合成濾波。
6.7.重疊及相加
因為在隱藏期間不知道將出現的下一個框之模式(例如,ACELP、TCX或FD)為何,所以較佳地預先準備
不同的重疊。為獲取最佳的重疊及相加,若下一個框在變換域(TCX或FD)中,則可例如針對比隱藏(丟失)框多的半個框創建人工信號(例如,錯誤隱藏音訊資訊)。此外,可在該人工信號上創建人工混疊(其中人工混疊可例如適於MDCT重疊及相加)。
為獲取良好的重疊及相加及時域(ACELP)中的未來框無不連續性,我們如以上所述進行但無混疊,以便能夠施加長重疊相加視窗,或若我們想要使用矩形視窗,則在合成緩衝結束時計算零輸入回應(ZIR)。
總之,在切換式音訊解碼器(該切換式音訊解碼
器可例如在ACELP解碼、TCX解碼與頻域解碼(FD解碼)之間切換)中,可在主要針對丟失音訊框且亦針對丟失音訊框之後的一定時間部分提供的錯誤隱藏音訊資訊與針對一或多個丟失音訊框之序列之後的第一適當地解碼的音訊框提供的解碼音訊資訊之間執行重疊及相加。為了甚至對於在後續音訊框之間的過渡時帶來時域混疊的解碼模式亦獲得適當的重疊及相加,可提供混疊相消資訊(例如,指定為人工混疊)。因此,錯誤隱藏音訊資訊與基於丟失音訊框之後的第一適當地解碼的音訊框獲得的時域音訊資訊之間的重疊及相加導致混疊之相消。
若一或多個丟失音訊框之序列之後的第一適當
地解碼的音訊框係在ACELP模式中編碼,則可計算特定的重疊資訊,該計算可基於LPC濾波器之零輸入回應(ZIR)。
總之,錯誤隱藏600極其適合於在切換式音訊編
解碼器中的用法。然而,錯誤隱藏600可亦使用於僅解碼在TCX模式中或在ACELP模式中編碼的音訊內容的音訊編解碼器中。
6.8.結論
應注意,藉由以上提及的概念達成尤其良好的錯誤隱藏,以外插時域激勵信號,以便使用衰退(例如,交叉衰退)使外插之結果與雜訊信號組合且基於交叉衰退之結果來執行LPC合成。
7.根據圖11之音訊解碼器
圖11展示根據本發明之一實施例的音訊解碼器1100的方塊示意圖。
應注意,音訊解碼器1100可為切換式音訊解碼器之一部分。例如,音訊解碼器1100可替換音訊解碼器400中的線性預測域解碼路徑440。
音訊解碼器1100經組配來接收編碼音訊資訊1110,且基於該編碼音訊資訊來提供解碼音訊資訊1112。編碼音訊資訊1110可例如對應於編碼音訊資訊410,且解碼音訊資訊1112可例如對應於解碼音訊資訊412。
音訊解碼器1100包含位元串流分析器1120,該位元串流分析器經組配來自編碼音訊資訊1110擷取一組頻譜係數之編碼表示1122及線性預測編碼係數1124之編碼表示。然而,位元串流分析器1120可選擇性地自編碼音訊資訊1110擷取額外資訊。
音訊解碼器1100亦包含頻譜值解碼1130,該頻譜
值解碼經組配來基於編碼頻譜係數1122提供一組解碼頻譜值1132。可使用用於解碼頻譜係數的任何已知解碼概念。
音訊解碼器1100亦包含線性預測編碼係數至比
例因數轉換1140,該線性預測編碼係數至比例因數轉換經組配來基於線性預測編碼係數之編碼表示1124提供一組比例因數1142。例如,線性預測編碼係數至比例因數轉換1142可執行在USAC標準中描述的功能。例如,線性預測編碼係數之編碼表示1124可包含多項式表示,該多項式表示藉由線性預測編碼係數至比例因數轉換1142解碼且轉換成一組比例因數。
音訊解碼器1100亦包含純量1150,該純量經組配
來將比例因數1142施加於解碼頻譜值1132,以藉此獲得定標解碼頻譜值1152。此外,音訊解碼器1100選擇性地包含處理1160,該處理可例如對應於以上所述的處理366,其中處理後定標解碼頻譜值1162係藉由選擇性的處理1160獲得。音訊解碼器1100亦包含頻域至時域變換1170,該頻域至時域變換經組配來接收定標解碼頻譜值1152(該定標解碼頻譜值可對應於定標解碼頻譜值362)或處理後定標解碼頻譜值1162(該處理後定標解碼頻譜值可對應於處理後定標解碼頻譜值368),且基於該定標解碼頻譜值及該處理後定標解碼頻譜值來提供時域表示1172,該時域表示可對應於以上所述的時域表示372。音訊解碼器1100亦包含選擇性的第一後處理1174,及選擇性的第二後處理1178,該選擇性的第一後處理及該選擇性的第二後處理可例如至少部分
對應於以上提及的選擇性的後處理376。因此,音訊解碼器1110獲得(選擇性地)時域音訊表示1172之後處理版本1179。
音訊解碼器1100亦包含錯誤隱藏方塊1180,該錯
誤隱藏方塊經組配來接收時域音訊表示1172或該時域音訊表示之後處理版本及線性預測編碼係數(以編碼形式或以解碼形式),且基於該時域音訊表示或該時域音訊表示之後處理版本及該等線性預測編碼係數來提供錯誤隱藏音訊資訊1182。
錯誤隱藏方塊1180經組配來使用時域激勵信號
提供用於隱藏以頻域表示編碼的音訊框之後的音訊框之丟失的錯誤隱藏音訊資訊1182,且因此類似於錯誤隱藏380且類似於錯誤隱藏480,且亦類似於錯誤隱藏500且類似於錯誤隱藏600。
然而,錯誤隱藏方塊1180包含LPC分析1184,該
LPC分析大體上與LPC分析530相同。然而,LPC分析1184可選擇性地使用LPC係數1124以促進分析(當與LPC分析530相比時)。LPC分析1134提供時域激勵信號1186,該時域激勵信號大體上與時域激勵信號532相同(且亦與時域激勵信號610相同)。此外,錯誤隱藏方塊1180包含錯誤隱藏1188,該錯誤隱藏可例如執行錯誤隱藏500之方塊540、550、560、570、580、584之功能,或該錯誤隱藏可例如執行錯誤隱藏600之方塊640、650、660、670、680、684之功能。然而,錯誤隱藏方塊1180稍微不同於錯誤隱藏500且亦稍微不同於錯誤隱藏600。例如,錯誤隱藏方塊1180(包含
LPC分析1184)不同於錯誤隱藏500,因為(用於LPC合成580的)LPC係數並非由LPC分析530決定,而是(選擇性地)自位元串流接收。此外,包含LPC分析1184的錯誤隱藏方塊1188不同於錯誤隱藏600,因為「過去激勵」610係藉由LPC分析1184獲得,而非直接可利用的。
音訊解碼器1100亦包含信號組合1190,該信號組
合經組配來接收時域音訊表示1172或該時域音訊表示之後處理版本,以及(自然地,用於後續音訊框的)錯誤隱藏音訊資訊1182,且較佳地使用重疊及相加操作來組合該等信號,以藉此獲得解碼音訊資訊1112。
關於進一步細節,參考以上解釋。
8.根據圖9之方法
圖9展示用於基於編碼音訊資訊來提供解碼音訊資訊的方法的流程圖。根據圖9之方法900包含使用時域激勵信號來提供910用於隱藏以頻域表示編碼的音訊框之後的音訊框之丟失的錯誤隱藏音訊資訊。根據圖9之方法900係基於與根據圖1之音訊解碼器相同的考慮。此外,應注意,方法900可由本文所述之任何特徵及功能單獨地或以組合方式補充。
9.根據圖10之方法
圖10展示用於基於編碼音訊資訊來提供解碼音訊資訊的方法的流程圖。方法1000包含提供1010用於隱藏音訊框之丟失的錯誤隱藏音訊資訊,其中針對(或基於)丟失音訊框之前的一或多個音訊框獲得的時域激勵信號經修改
以便獲得錯誤隱藏音訊資訊。
根據圖10之方法1000係基於與以上提及的根據
圖2之音訊解碼器相同的考慮。
此外,應注意,根據圖10之方法可由本文所述之
任何特徵及功能單獨地或以組合方式補充。
10.額外備註
在以上所述的實施例中,可以不同方式處置多個框丟失。例如,兩個或兩個以上框丟失,則用於第二丟失框的時域激勵信號之週期性部分可自與第一丟失框相關聯的時域激勵信號之音調部分之複本導出(或等於該複本)。或者,用於第二丟失框的時域激勵信號可基於先前丟失框之合成信號之LPC分析。例如,在編解碼器中,LPC可改變每個丟失框,隨後使得針對每個丟失框重新進行分析有意義。
11.實行方案替選方案
雖然在設備的上下文中已描述一些態樣,但是明顯地,此等態樣亦表示對應的方法之描述,其中方塊或裝置對應於方法步驟或方法步驟之特徵。類似地,在方法步驟之上下文中所述的態樣亦表示對應的設備之對應的方塊或項或特徵之描述。方法步驟中之一些或全部可由(使用)硬體設備來執行,該硬體設備如例如微處理器、可規劃電腦或電子電路。在一些實施例中,最重要的方法步驟中之某一或多個可由此設備來執行。
取決於某些實施要求,本發明之實施例可實施於硬體中或軟體中。實行方案可使用數位儲存媒體來執行,
該數位儲存媒體例如軟碟片、DVD、藍光、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該數位儲存媒體上儲存有電子可讀的控制信號,該等電子可讀的控制信號與可規劃電腦系統合作(或能夠與可規劃電腦系統合作),使得執行個別方法。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含具有電子可讀的
控制信號的資料載體,該等電子可讀的控制信號能夠與可規劃電腦系統合作,使得執行本文所述方法之一。
通常,本發明之實施例可實行為具有程式碼的電
腦程式產品,當電腦程式產品在電腦上運行時,該程式碼為操作性的,以用於執行方法之一。程式碼可例如儲存在機器可讀載體上。
其他實施例包含用於執行本文所述方法之一的
電腦程式,該電腦程式儲存在機器可讀載體上。
換言之,發明性方法之一實施例因此為電腦程
式,該電腦程式具有電腦程式在電腦上運行時用於執行本文所述方法之一的程式碼。
發明性方法之另一實施例因此為資料載體(或數
位儲存媒體,或電腦可讀媒體),該資料載體包含記錄在該資料載體上的用於執行本文所述方法之一的電腦程式。資料載體、數位儲存媒體或記錄媒體通常為有形的及/或非過渡性的。
發明性方法之又一實施例因此為表示用於執行
本文所述方法之一的電腦程式的資料串流或信號序列。資料串流或信號序列可例如經組配來經由資料通訊連接(例如經由網際網路)傳送。
另一實施例包含處理構件,例如電腦或可規劃邏
輯裝置,該處理構件經組配或經調適來執行本文所述方法之一。
另一實施例包含電腦,該電腦上安裝有用於執行
本文所述方法之一的電腦程式。
根據本發明之又一實施例包含設備或系統,該設
備或系統經組配來將用於執行本文所述方法之一的電腦程式傳遞(例如,電子地或光學地)至接收器。接收器可例如為電腦、行動裝置、記憶體裝置等。設備或系統可例如包含用於將電腦程式傳遞至接收器的檔案伺服器。
在一些實施例中,可規劃邏輯裝置(例如現場可
規劃閘陣列)可用來執行本文所述方法之功能中之一些或全部。在一些實施例中,現場可規劃閘陣列可與微處理器合作,以便執行本文所述方法之一。通常,方法較佳地由任何硬體設備執行。
本文所述的裝置可使用硬體設備,或使用電腦,或使用硬體設備及電腦之組合來實行。
本文所述的方法可使用硬體設備,或使用電腦,或使用硬體設備及電腦之組合來執行。
以上所述實施例對於本發明之原理僅為例示性的。將理解,熟習此項技術者將顯而易見本文所述佈置及
細節之修改及變化。因此,意圖為僅受即將出現的專利請求項之範疇且不受藉由本文實施例之描述及解釋呈現的特定細節限制。
12.結論
總之,雖然在領域中已描述了用於變換域編解碼器的一些隱藏,但是根據本發明之實施例勝過習知編解碼器(或解碼器)。根據本發明之實施例將域變化用於隱藏(頻域至時域或激勵域)。因此,根據本發明之實施例創造用於變換域解碼器的高品質語音隱藏。
變換編碼模式類似於USAC中的編碼模式(參看例如參考文獻[3])。變換編碼模式使用修改離散餘弦變換(MDCT)作為變換,且藉由在頻域中施加加權LPC頻譜包絡線來達成頻譜雜訊成形(亦稱為FDNS「頻域雜訊成形」)。不同而言,根據本發明之實施例可使用於音訊解碼器中,該音訊解碼器使用USAC標準中所述的解碼概念。然而,本文揭示的錯誤隱藏概念可亦使用於具有類似或在任何AAC族編解碼器(或解碼器)中的「AAC」的音訊解碼器中。
根據本發明之概念適用於切換式編解碼器諸如USAC且適用於純頻域編解碼器。在兩者狀況下,隱藏皆在時域中或在激勵域中執行。
在下文中,將描述時域隱藏的(或激勵域隱藏的)一些優點及特徵。
如例如參考圖7及圖8所述的習知TCX隱藏(亦稱為雜訊替代)並不適合於語音類信號或甚至音調信號。根據
本發明之實施例創造用於在時域(或線性預測編碼解碼器之激勵域)中適用的變換域編解碼器的新隱藏。該新隱藏類似於ACELP類隱藏且提高隱藏品質。已發現,基頻資訊對於ACELP類隱藏為有利的(或甚至在一些狀況下為必要的)。因此,根據本發明之實施例經組配來找到用於在頻域中編碼的先前框的可靠基頻值。
以上已例如基於根據圖5及圖6之實施例解釋了
不同部分及細節。
總之,根據本發明之實施例創造勝過習知解決方
案的錯誤隱藏。
參考資料:
[1] 3GPP,「Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions」,2009年,3GPP TS 26.290。
[2] 「MDCT-BASED CODER FOR HIGHLY ADAPTIVE SPEECH AND AUDIO CODING」;Guillaume Fuchs & al.;EUSIPCO 2009。
[3] ISO_IEC_DIS_23003-3_(E);Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding。
[4] 3GPP,「General Audio Codec audio processing functions; Enhanced aacPlus general audio codec; Additional decoder tools」,2009年,3GPP TS 26.402。
[5] 「Audio decoder and coding error
compensating method」,2000年,EP 1207519 B1
[6] 「Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation」,2014年,PCT/EP2014/062589
[7] 「Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization」,2014年,PCT/EP2014/062578
100‧‧‧音訊解碼器
110‧‧‧編碼音訊資訊
112‧‧‧解碼音訊資訊
120‧‧‧解碼/處理/頻域解碼器核心
122‧‧‧解碼音訊資訊/時域音訊信號表示/錯誤隱藏音訊資訊
130‧‧‧錯誤隱藏
132‧‧‧錯誤隱藏音訊資訊
Claims (34)
- 一種用於基於一編碼音訊資訊來提供一解碼音訊資訊的音訊解碼器,該音訊解碼器包含:一錯誤隱藏,其經組配來使用一時域激勵信號來提供用於隱藏以一頻域表示編碼的一音訊框之後的一音訊框之一丟失的一錯誤隱藏音訊資訊。
- 如請求項1之音訊解碼器,其中該音訊解碼器包含一頻域解碼器核心,該頻域解碼器核心經組配來將一基於比例因數的定標施加於多個頻譜值,該等多個頻譜值自該頻域表示導出,且其中該錯誤隱藏經組配來使用自該頻域表示導出的一時域激勵信號,來提供用於隱藏以包含多個編碼比例因數的一頻域表示編碼的一音訊框之後的一音訊框之一丟失的該錯誤隱藏音訊資訊。
- 如請求項1或請求項2之音訊解碼器,其中該頻域表示包含多個頻譜值之一編碼表示及用於定標該等頻譜值的多個比例因數之編碼表示,其中該音訊解碼器經組配來自LPC參數之一編碼表示導出用於定標該等頻譜值的多個比例因數。
- 如請求項1至3中一項之音訊解碼器,其中該音訊解碼器包含一頻域解碼器核心,該頻域解碼器核心經組配來自該頻域表示導出一時域音訊信號表示而未將一時域激勵信號用作用於以該頻域表示編碼的該音訊框的一中 間量。
- 如請求項1至4中一項之音訊解碼器,其中該錯誤隱藏經組配來基於一丟失音訊框之前的以該頻域表示編碼的該音訊框來獲得該時域激勵信號,且其中該錯誤隱藏經組配來使用該時域激勵信號提供用於隱藏該丟失音訊框的該錯誤隱藏音訊資訊。
- 如請求項1至5中一項之音訊解碼器,其中該錯誤隱藏經組配來基於該丟失音訊框之前的以該頻域表示編碼的該音訊框來執行一LPC分析,以獲得一組線性預測編碼參數及該時域激勵信號,該時域激勵信號表示該丟失音訊框之前的以該頻域表示編碼的該音訊框之一音訊內容;或其中該錯誤隱藏經組配來基於該丟失音訊框之前的以該頻域表示編碼的該音訊框來執行一LPC分析,以獲得該時域激勵信號,該時域激勵信號表示該丟失音訊框之前的以該頻域表示編碼的該音訊框之一音訊內容;或其中該音訊解碼器經組配來使用一線性預測編碼參數估計獲得一組線性預測編碼參數;或其中該音訊解碼器經組配來使用一變換基於一組比例因數來獲得一組線性預測編碼參數。
- 如請求項1至6中一項之音訊解碼器,其中該錯誤隱藏經組配來獲得描述該丟失音訊框之前以該頻域表示編碼的該音訊框之一基頻的一基頻資訊,且依賴於該基頻資 訊而提供該錯誤隱藏音訊資訊。
- 如請求項7之音訊解碼器,其中該錯誤隱藏經組配來基於該時域激勵信號來獲得該基頻資訊,該時域激勵信號自該丟失音訊框之前的以該頻域表示編碼的該音訊框導出。
- 如請求項8之音訊解碼器,其中該錯誤隱藏經組配來估計該時域激勵信號或該時域信號之一交叉相關,以決定一粗略的基頻資訊,且其中該錯誤隱藏經組配來使用圍繞一基頻的一閉迴路搜尋來細化該粗略的基頻資訊,該基頻係藉由該粗略的基頻資訊決定。
- 如請求項1至6項中一項之音訊解碼器,其中該錯誤隱藏經組配來基於該編碼音訊資訊之一旁資訊來獲得一基頻資訊。
- 如請求項1至6中一項之音訊解碼器,其中該錯誤隱藏經組配來基於可利用於一先前解碼的音訊框的一基頻資訊來獲得一基頻資訊。
- 如請求項1至6中一項之音訊解碼器,其中該錯誤隱藏經組配來基於對一時域信號或對一殘餘信號執行的一基頻搜尋來獲得一基頻資訊。
- 如請求項1至12中一項之音訊解碼器,其中該錯誤隱藏經組配來將自該丟失音訊框之前的以該頻域表示編碼的該音訊框導出的該時域激勵信號之一基頻週期複製一次或多次,以便獲得用於該錯誤隱藏音訊資訊之一合 成的一激勵信號。
- 如請求項13之音訊解碼器,其中該錯誤隱藏經組配來使用一抽樣速率相依的濾波器來低通濾波自該丟失音訊框之前的以該頻域表示編碼的該音訊框之該時域表示導出的該時域激勵信號之該基頻週期,該抽樣速率相依的濾波器之頻寬取決於以一頻域表示編碼的該音訊框之一抽樣速率。
- 如請求項1至14中一項之音訊解碼器,其中該錯誤隱藏經組配來預測在一丟失框結束時的一基頻,且其中該錯誤隱藏經組配來使該時域激勵信號或該時域激勵信號之一或多個複本適於該預測的基頻,以便獲得用於一LPC合成的一輸入信號。
- 如請求項1至15中一項之音訊解碼器,其中該錯誤隱藏經組配來組合一外插時域激勵信號及一雜訊信號,以便獲得用於一LPC合成的一輸入信號,且其中該錯誤隱藏經組配來執行該LPC合成,其中該LPC合成經組配來依賴於線性預測編碼參數而濾波該LPC合成之該輸入信號,以便獲得該錯誤隱藏音訊資訊。
- 如請求項16之音訊解碼器,其中該錯誤隱藏經組配來在使用該時域中的一相關來計算該外插時域激勵信號之一增益,該外插時域激勵信號用以獲得用於該LPC合成的該輸入信號,該相關係基於該丟失音訊框之前的以該頻域表示編碼的該音訊框之一時域表示而執行,其中一 相關滯後係依賴於基於該時域激勵信號獲得的一基頻資訊或使用該激勵域中的一相關而設定。
- 如請求項16或17中一項之音訊解碼器,該錯誤隱藏經組配來高通濾波該雜訊信號,該雜訊信號與該外插時域激勵信號組合。
- 如請求項13至15中一項之音訊解碼器,其中該錯誤隱藏經組配來使用預加強濾波器改變該雜訊信號之頻譜形狀,其中若該丟失音訊框之前的以一頻域表示編碼的該音訊框為一語音音訊框或包含一啟始,則使該雜訊信號與該外插時域激勵信號組合。
- 如請求項1至19中一項之音訊解碼器,其中該錯誤隱藏經組配來依賴於該時域中之一相關而計算該雜訊信號之一增益,該相關係基於該丟失音訊框之前的以該頻域表示編碼的該音訊框之一時域表示而執行。
- 如請求項1至20中一項之音訊解碼器,其中該錯誤隱藏經組配來修改基於一丟失音訊框之前的一或多個音訊框獲得的一時域激勵信號,以便獲得該錯誤隱藏音訊資訊。
- 如請求項21之音訊解碼器,其中該錯誤隱藏經組配來使用基於一丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號之一或多個修改後複本,以便獲得該錯誤隱藏資訊。
- 如請求項21或22中一項之音訊解碼器,其中該錯誤隱藏經組配來修改基於一丟失音訊框之前的一或多個音訊 框獲得的該時域激勵信號或該時域激勵信號之一或多個複本,以藉此隨時間推移而減少該錯誤隱藏音訊資訊之週期性的分量。
- 如請求項21至23中一項之音訊解碼器,其中該錯誤隱藏經組配來定標基於該丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號或該時域激勵信號之一或多個複本,以藉此修改該時域激勵信號。
- 如請求項23或24之音訊解碼器,其中該錯誤隱藏經組配來逐漸減少施加來定標基於一丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號或該時域激勵信號之該一或多個複本的一增益。
- 如請求項23至25中一項之音訊解碼器,其中該錯誤隱藏經組配來依賴於一丟失音訊框之前的一或多個音訊框之一或多個參數,且/或依賴於連序丟失音訊框之一數目,而調整用以逐漸減少施加來定標基於該丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號或該時域激勵信號之該一或多個複本的一增益的一速度。
- 如請求項25或26之音訊解碼器,其中該錯誤隱藏經組配來依賴於該時域激勵信號之一基頻週期之一長度,而調整用以逐漸減少施加來定標基於一丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號或該時域激勵信號之該一或多個複本的一增益的該速度,使得輸入至一LPC合成中的一時域激勵信號對於具有該基頻週期之一較短長度的信號在與具有該基頻週期之一較大長 度的信號相比時衰退得更快。
- 如請求項25至27中一項之音訊解碼器,其中該錯誤隱藏經組配來依賴於一基頻分析或一基頻預測之一結果,而調整用以逐漸減少施加來定標基於一丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號或該時域激勵信號之該一或多個複本的一增益的該速度,使得輸入至一LPC合成中的一時域激勵信號之一確定性的分量對於具有一每時間單位較大的基頻變化的信號在與具有一每時間單位較小的基頻變化的信號相比時衰退得更快,且/或使得輸入至一LPC合成中的一時域激勵信號之一確定性的分量對於一基頻預測失敗的信號在與該基頻預測成功的信號相比時衰退得更快。
- 如請求項21至28中一項之音訊解碼器,其中該錯誤隱藏經組配來依賴於用於該一或多個丟失音訊框之時間的一基頻之一預測,而時間定標基於一丟失音訊框之前的一或多個音訊框獲得的該時域激勵信號或該時域激勵信號之該一或多個複本。
- 如請求項1至29中一項之音訊解碼器,其中該錯誤隱藏經組配來提供該錯誤隱藏音訊資訊達一時間,該時間比該一或多個丟失音訊框之一時序持續時間更長。
- 如請求項30之音訊解碼器,其中該錯誤隱藏經組配來執行該錯誤隱藏音訊資訊及該一或多個丟失音訊框之後的一或多個適當地接收的音訊框之一時域表示的一重 疊及相加。
- 如請求項1至31中一項之音訊解碼器,其中該錯誤隱藏經組配來基於一丟失音訊框或一丟失視窗之前的至少三個部分重疊的框或視窗來導出該錯誤隱藏音訊資訊。
- 一種用於基於一編碼音訊資訊來提供一解碼音訊資訊的方法,該方法包含:使用一時域激勵信號來提供用於隱藏以一頻域表示編碼的一音訊框之後的一音訊框之一丟失的一錯誤隱藏音訊資訊。
- 一種電腦程式,當該電腦程式在一電腦上運行時,該電腦程式用於執行如請求項33之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13191133 | 2013-10-31 | ||
EP14178824 | 2014-07-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201521016A true TW201521016A (zh) | 2015-06-01 |
TWI569261B TWI569261B (zh) | 2017-02-01 |
Family
ID=51830301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103137626A TWI569261B (zh) | 2013-10-31 | 2014-10-30 | 用以使用基於時域激勵信號之錯誤隱藏提供解碼音訊資訊之音訊解碼器及方法 |
Country Status (20)
Country | Link |
---|---|
US (6) | US10381012B2 (zh) |
EP (5) | EP3285254B1 (zh) |
JP (1) | JP6306175B2 (zh) |
KR (4) | KR101981548B1 (zh) |
CN (1) | CN105765651B (zh) |
AU (5) | AU2014343904B2 (zh) |
BR (1) | BR112016009819B1 (zh) |
CA (5) | CA2929012C (zh) |
ES (5) | ES2805744T3 (zh) |
HK (3) | HK1251710A1 (zh) |
MX (1) | MX356334B (zh) |
MY (1) | MY178139A (zh) |
PL (5) | PL3288026T3 (zh) |
PT (5) | PT3063760T (zh) |
RU (1) | RU2678473C2 (zh) |
SG (3) | SG11201603429SA (zh) |
TR (1) | TR201802808T4 (zh) |
TW (1) | TWI569261B (zh) |
WO (1) | WO2015063044A1 (zh) |
ZA (1) | ZA201603528B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI748339B (zh) * | 2019-02-13 | 2021-12-01 | 弗勞恩霍夫爾協會 | 用於包括全訊框丟失隱匿及部分訊框丟失隱匿的lc3隱匿之解碼器及解碼方法 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3336840B1 (en) | 2013-10-31 | 2019-09-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
KR101981548B1 (ko) | 2013-10-31 | 2019-05-23 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10504525B2 (en) * | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
MX2018010754A (es) | 2016-03-07 | 2019-01-14 | Fraunhofer Ges Forschung | Unidad de ocultamiento de error, decodificador de audio y método relacionado y programa de computadora que desaparece una trama de audio ocultada de acuerdo con factores de amortiguamiento diferentes para bandas de frecuencia diferentes. |
CA3016837C (en) | 2016-03-07 | 2021-09-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Hybrid concealment method: combination of frequency and time domain packet loss concealment in audio codecs |
WO2017153300A1 (en) | 2016-03-07 | 2017-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Error concealment unit, audio decoder, and related method and computer program using characteristics of a decoded representation of a properly decoded audio frame |
CN107248411B (zh) | 2016-03-29 | 2020-08-07 | 华为技术有限公司 | 丢帧补偿处理方法和装置 |
CN108922551B (zh) * | 2017-05-16 | 2021-02-05 | 博通集成电路(上海)股份有限公司 | 用于补偿丢失帧的电路及方法 |
WO2019091573A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US10278034B1 (en) | 2018-03-20 | 2019-04-30 | Honeywell International Inc. | Audio processing system and method using push to talk (PTT) audio attributes |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN113763973A (zh) * | 2021-04-30 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 音频信号增强方法、装置、计算机设备和存储介质 |
CN112992160B (zh) * | 2021-05-08 | 2021-07-27 | 北京百瑞互联技术有限公司 | 一种音频错误隐藏方法及装置 |
CN114613372B (zh) * | 2022-02-21 | 2022-10-18 | 北京富通亚讯网络信息技术有限公司 | 一种音频传输抗丢包的错误隐藏技术方法 |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5615298A (en) | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
EP1095370A1 (en) | 1999-04-05 | 2001-05-02 | Hughes Electronics Corporation | Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
JP4464488B2 (ja) | 1999-06-30 | 2010-05-19 | パナソニック株式会社 | 音声復号化装置及び符号誤り補償方法、音声復号化方法 |
JP3804902B2 (ja) | 1999-09-27 | 2006-08-02 | パイオニア株式会社 | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002014697A (ja) | 2000-06-30 | 2002-01-18 | Hitachi Ltd | ディジタルオーディオ装置 |
FR2813722B1 (fr) * | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US7447639B2 (en) | 2001-01-24 | 2008-11-04 | Nokia Corporation | System and method for error concealment in digital audio transmission |
US7308406B2 (en) | 2001-08-17 | 2007-12-11 | Broadcom Corporation | Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
FR2846179B1 (fr) | 2002-10-21 | 2005-02-04 | Medialive | Embrouillage adaptatif et progressif de flux audio |
US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
JP2004361731A (ja) | 2003-06-05 | 2004-12-24 | Nec Corp | オーディオ復号装置及びオーディオ復号方法 |
CN1839426A (zh) | 2003-09-17 | 2006-09-27 | 北京阜国数字技术有限公司 | 多分辨率矢量量化的音频编解码方法及装置 |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
CN1989548B (zh) * | 2004-07-20 | 2010-12-08 | 松下电器产业株式会社 | 语音解码装置及补偿帧生成方法 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8798172B2 (en) | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
US20090248404A1 (en) | 2006-07-12 | 2009-10-01 | Panasonic Corporation | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus |
US8000960B2 (en) | 2006-08-15 | 2011-08-16 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of sub-band audio waveforms |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
EP2080194B1 (fr) | 2006-10-20 | 2011-12-07 | France Telecom | Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information |
FR2907586A1 (fr) | 2006-10-20 | 2008-04-25 | France Telecom | Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch. |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
KR100862662B1 (ko) | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
CN101207468B (zh) | 2006-12-19 | 2010-07-21 | 华为技术有限公司 | 丢帧隐藏方法、系统和装置 |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101399040B (zh) * | 2007-09-27 | 2011-08-10 | 中兴通讯股份有限公司 | 一种帧错误隐藏的谱参数替换方法 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
KR100998396B1 (ko) | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
CN101588341B (zh) * | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
MX2011000382A (es) | 2008-07-11 | 2011-02-25 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion. |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
DE102008042579B4 (de) * | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
US8706479B2 (en) | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US9076439B2 (en) | 2009-10-23 | 2015-07-07 | Broadcom Corporation | Bit error management and mitigation for sub-band coding |
US8321216B2 (en) * | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
US9263049B2 (en) * | 2010-10-25 | 2016-02-16 | Polycom, Inc. | Artifact reduction in packet loss concealment |
PL2661745T3 (pl) | 2011-02-14 | 2015-09-30 | Fraunhofer Ges Forschung | Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio |
WO2013186345A1 (en) | 2012-06-14 | 2013-12-19 | Dolby International Ab | Error concealment strategy in a decoding system |
US9830920B2 (en) | 2012-08-19 | 2017-11-28 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
WO2014202535A1 (en) | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pulse resynchronization |
MX371425B (es) | 2013-06-21 | 2020-01-29 | Fraunhofer Ges Forschung | Aparato y metodo para la ocultacion mejorada del libro de codigo adaptativo en la ocultacion similar a acelp mediante la utilizacion de una estimacion mejorada del retardo de tono. |
CN104282309A (zh) * | 2013-07-05 | 2015-01-14 | 杜比实验室特许公司 | 丢包掩蔽装置和方法以及音频处理系统 |
KR101981548B1 (ko) | 2013-10-31 | 2019-05-23 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
EP3336840B1 (en) | 2013-10-31 | 2019-09-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
CN112967727A (zh) | 2014-12-09 | 2021-06-15 | 杜比国际公司 | Mdct域错误掩盖 |
-
2014
- 2014-10-27 KR KR1020187005569A patent/KR101981548B1/ko active IP Right Grant
- 2014-10-27 BR BR112016009819-6A patent/BR112016009819B1/pt active IP Right Grant
- 2014-10-27 CA CA2929012A patent/CA2929012C/en active Active
- 2014-10-27 TR TR2018/02808T patent/TR201802808T4/tr unknown
- 2014-10-27 PT PT147900732T patent/PT3063760T/pt unknown
- 2014-10-27 EP EP17191502.8A patent/EP3285254B1/en active Active
- 2014-10-27 MX MX2016005535A patent/MX356334B/es active IP Right Grant
- 2014-10-27 EP EP17191506.9A patent/EP3285256B1/en active Active
- 2014-10-27 PL PL17191503T patent/PL3288026T3/pl unknown
- 2014-10-27 MY MYPI2016000749A patent/MY178139A/en unknown
- 2014-10-27 CA CA2984573A patent/CA2984573C/en active Active
- 2014-10-27 CA CA2984535A patent/CA2984535C/en active Active
- 2014-10-27 KR KR1020187005572A patent/KR101957906B1/ko active IP Right Grant
- 2014-10-27 SG SG11201603429SA patent/SG11201603429SA/en unknown
- 2014-10-27 ES ES17191503T patent/ES2805744T3/es active Active
- 2014-10-27 PT PT17191506T patent/PT3285256T/pt unknown
- 2014-10-27 KR KR1020167014227A patent/KR101854297B1/ko active IP Right Grant
- 2014-10-27 SG SG10201609235UA patent/SG10201609235UA/en unknown
- 2014-10-27 JP JP2016527210A patent/JP6306175B2/ja active Active
- 2014-10-27 WO PCT/EP2014/073035 patent/WO2015063044A1/en active Application Filing
- 2014-10-27 PL PL14790073T patent/PL3063760T3/pl unknown
- 2014-10-27 EP EP14790073.2A patent/EP3063760B1/en active Active
- 2014-10-27 PL PL17191505T patent/PL3285255T3/pl unknown
- 2014-10-27 ES ES17191506T patent/ES2746034T3/es active Active
- 2014-10-27 PL PL17191506T patent/PL3285256T3/pl unknown
- 2014-10-27 AU AU2014343904A patent/AU2014343904B2/en active Active
- 2014-10-27 PT PT17191505T patent/PT3285255T/pt unknown
- 2014-10-27 ES ES14790073.2T patent/ES2659838T3/es active Active
- 2014-10-27 PL PL17191502T patent/PL3285254T3/pl unknown
- 2014-10-27 ES ES17191505T patent/ES2739477T3/es active Active
- 2014-10-27 EP EP17191505.1A patent/EP3285255B1/en active Active
- 2014-10-27 PT PT17191502T patent/PT3285254T/pt unknown
- 2014-10-27 PT PT171915036T patent/PT3288026T/pt unknown
- 2014-10-27 CA CA2984562A patent/CA2984562C/en active Active
- 2014-10-27 SG SG10201609234QA patent/SG10201609234QA/en unknown
- 2014-10-27 KR KR1020187005570A patent/KR101957905B1/ko active IP Right Grant
- 2014-10-27 ES ES17191502T patent/ES2732952T3/es active Active
- 2014-10-27 EP EP17191503.6A patent/EP3288026B1/en active Active
- 2014-10-27 CN CN201480060303.0A patent/CN105765651B/zh active Active
- 2014-10-27 CA CA2984532A patent/CA2984532C/en active Active
- 2014-10-27 RU RU2016121172A patent/RU2678473C2/ru active
- 2014-10-30 TW TW103137626A patent/TWI569261B/zh active
-
2016
- 2016-04-29 US US15/142,547 patent/US10381012B2/en active Active
- 2016-05-24 ZA ZA2016/03528A patent/ZA201603528B/en unknown
- 2016-09-09 US US15/261,443 patent/US10283124B2/en active Active
- 2016-09-09 US US15/261,341 patent/US10269358B2/en active Active
- 2016-09-09 US US15/261,517 patent/US10373621B2/en active Active
- 2016-09-09 US US15/261,380 patent/US10262662B2/en active Active
-
2017
- 2017-02-03 HK HK18110937.5A patent/HK1251710A1/zh unknown
- 2017-11-21 AU AU2017265038A patent/AU2017265038B2/en active Active
- 2017-11-21 AU AU2017265032A patent/AU2017265032B2/en active Active
- 2017-11-22 AU AU2017265062A patent/AU2017265062B2/en active Active
- 2017-11-22 AU AU2017265060A patent/AU2017265060B2/en active Active
- 2017-12-21 US US15/851,247 patent/US10269359B2/en active Active
-
2018
- 2018-08-21 HK HK18110734.0A patent/HK1251349B/zh unknown
- 2018-08-21 HK HK18110733.1A patent/HK1251348B/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI748339B (zh) * | 2019-02-13 | 2021-12-01 | 弗勞恩霍夫爾協會 | 用於包括全訊框丟失隱匿及部分訊框丟失隱匿的lc3隱匿之解碼器及解碼方法 |
US11875806B2 (en) | 2019-02-13 | 2024-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode channel coding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI569261B (zh) | 用以使用基於時域激勵信號之錯誤隱藏提供解碼音訊資訊之音訊解碼器及方法 | |
TWI571864B (zh) | 用以使用修改時域激勵信號之錯誤隱藏提供解碼音訊資訊之音訊解碼器及方法 |