TW201506908A - 用以取得對於音訊信號替換訊框的頻譜係數之方法及裝置、音訊解碼器、音訊接收器、以及用以發送音訊信號之系統 - Google Patents
用以取得對於音訊信號替換訊框的頻譜係數之方法及裝置、音訊解碼器、音訊接收器、以及用以發送音訊信號之系統 Download PDFInfo
- Publication number
- TW201506908A TW201506908A TW103121600A TW103121600A TW201506908A TW 201506908 A TW201506908 A TW 201506908A TW 103121600 A TW103121600 A TW 103121600A TW 103121600 A TW103121600 A TW 103121600A TW 201506908 A TW201506908 A TW 201506908A
- Authority
- TW
- Taiwan
- Prior art keywords
- frame
- replacement
- peak
- spectrum
- replacement frame
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 158
- 230000005236 sound signal Effects 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims description 133
- 230000003595 spectral effect Effects 0.000 claims description 108
- 230000010363 phase shift Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 10
- 230000006872 improvement Effects 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000013459 approach Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000013213 extrapolation Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
本發明描述一方法,其取得一音訊信號之一替換訊框的頻譜係數。基於存在於在一替換訊框前面的訊框之頻譜中的一峰值來偵測一音訊信號之一頻譜之一音調分量。對於該頻譜之該音調分量,預測該替換訊框之該頻譜中的該峰值及其周圍部分之頻譜係數,且對於該頻譜之該非音調分量,使用該替換訊框之一非預測頻譜係數或在該替換訊框前面的一訊框之一對應頻譜係數。
Description
本發明係關於編碼音訊信號之發送的領域,更具體言之,係關於用以取得音訊信號之替換訊框的頻譜係數之方法及裝置,係關於音訊解碼器、音訊接收器,以及用以發送音訊信號之系統。實施例係關於用以基於先前接收之訊框來建構替換訊框之頻譜的方法。
在先前技術中,描述了處理音訊接收器處的訊框丟失(frame-loss)之若干方法。舉例而言,當訊框在音訊或語音編碼解碼器之接收器側上丟失時,可使用如參考文獻[1]中所描述的用於訊框丟失隱蔽(frame-loss-concealment)
之簡單方法,諸如:‧重複上一個接收之訊框,‧使丟失訊框靜音,或‧正負號加擾(sign scrambling)。
另外,在參考文獻[1]中,提出使用子頻帶中的預測器之進階技術。接著將該預測器技術與正負號加擾組合,且使用預測增益作為逐子頻帶決策準則,以判定將哪個方法用於此子頻帶之頻譜係數。
在參考文獻[2]中,將時域中之波形信號外插用於MDCT(修改型離散餘弦變換,Modified Discrete Cosine Transform)域編碼解碼器。此類方法對於包括語音之單音信號可能較好。
若允許一個訊框延遲,則可將周圍訊框之內插用於建構丟失之訊框。此方法係在參考文獻[3]中描述,其中使用編索引為m-1及m+1的相鄰訊框來內插具有索引m之丟失訊框中的音調分量之量值。定義用於音調分量之MDCT係數正負號的旁側資訊係在位元串流中發送。正負號加擾係用於其他非音調MDCT係數。該等音調分量經判定為具有最高量值之預定固定數目個頻譜係數。此方法選擇具有最高量值之n個頻譜係數作為音調分量。
C m+1(k)
圖7展示表示不具有所發送之旁側資訊的內插方
法(如例如參考文獻[4]中所描述)的方塊圖。該內插方法基於使用MDCT(修改型離散餘弦變換)在頻域中編碼之音訊訊框而操作。訊框內插區塊700接收在丟失訊框前面的一訊框及在丟失訊框後面的一訊框之MDCT係數,更具體言之,在關於圖7所描述之方法中,在訊框內插區塊700處接收在前面的訊框之MDCT係數C m-1(k)及在後訊框之MDCT係數C m+1(k)。訊框內插區塊700產生當前訊框之內插MDCT係數(k),該當前訊框已在接收器處丟失或由於其他原因(例如,歸因於所接收資料中之錯誤或其類似者)而不能在接收器處進行處理。將由訊框內插區塊700輸出的內插MDCT係數(k)應用至導致標度因子頻帶中之量值定標的區塊702及導致具有一索引集合之量值定標的區塊704,且各別區塊702及704分別輸出按因子(k)及(k)定標的MDCT係數(k)。區塊702之輸出信號被輸入至基於接收的輸入信號來產生偽頻譜(k)之偽頻譜區塊706中,該偽頻譜被輸入至產生指示偵測到的峰值之信號的峰值偵測區塊708中。由區塊702提供之信號亦被施加至隨機正負號改變區塊712,該區塊回應於由區塊708產生之峰值偵測信號而造成所接收信號之正負號改變且將經修改MDCT係數(k)輸出至頻譜組成區塊710。由區塊704提供之經定標信號被施加至正負號校正區塊714,該正負號校正區塊回應於由區塊708提供之峰值偵測信號產生由區塊704提供之經定標信號的正負號校正,且將經修改MDCT係數(k)輸出至頻譜組成區塊710,該頻譜組成區塊基於所接收信號而產生由頻譜組成區
塊710輸出之內插MDCT係數(k)。如圖7所示,由區塊708提供之峰值偵測信號亦被提供至產生經定標MDCT係數之區塊704。
圖7在區塊714之輸出端產生丟失訊框的相關聯於音調分量之頻譜係數(k),且在區塊712之輸出端,提供用於非音調分量之頻譜係數(k),使得在頻譜組成區塊710處,基於針對音調分量及非音調分量而接收之該等頻譜係數,提供相關聯於丟失訊框之頻譜的頻譜係數。
現將更詳細地描述圖7之方塊圖中所描述的FLC(訊框丟失隱蔽)技術之操作。
在圖7中,基本上,可區分四個模組:‧成形雜訊插入模組(包括訊框內插700、標度因子頻帶內之量值定標702及隨機正負號改變712),‧MDCT頻率區間分類模組(包括偽頻譜706及峰值偵測708),‧音調隱蔽操作模組(包括索引集合內之量值定標704及正負號校正714),及‧頻譜組成710。
該方法係基於以下通式:
(k)係藉由逐頻率區間內插(參見區塊700「訊框內插」)而導出
α*(k)係藉由使用以下幾何平均值之能量內插而導出:‧所有分量之逐標度因子頻帶幾何平均值,(參見區塊702「標度因子頻帶中之量值定標」)及‧音調分量之逐索引子集幾何平均值(參見區塊704「索引集合內之量值定標」):
‧對於音調分量,其可展示為α=cos(πf l ),其中fl為音調分量之頻率。
能量E係基於藉由簡單平滑運算導出之偽功率譜而導出:
s*(k)係對於非音調分量隨機設定為±1(參見區塊712「隨機正負號改變」),且對於音調分量隨機設定為+1或-1(參見區塊714「正負號校正」)。
將該峰值偵測執行為搜尋偽功率譜中之區域最大值以偵測對應於下伏正弦曲線之頻譜峰值之確切位置。峰值偵測係基於參考文獻[5]中所描述之MPEG-1音質模型中所採用的音調識別程序(tone identification process)。在此之外,定義一索引子集,其頻寬為依據MDCT頻率區間的分析窗口之主瓣且偵測峰值在其中心。將彼等頻率區間視為正弦曲線之音調為主的MDCT頻率區間,且將索引子集視為個別音調分量。
正負號校正s*(k)使某一音調分量之所有頻率區
間之正負號翻轉,抑或皆不翻轉。使用藉由合成法之分析來執行該判定,亦即,針對兩個版本導出SFM,且選擇具有較低SFM之版本。關於SFM導出,需要功率譜,功率譜又需要MDST(修改型離散正弦變換,Modified Discrete Sine Transform)係數。為了使複雜性可管理,僅導出音調分量之MDST係數(亦僅使用此音調分量之MDCT係數)。
圖8展示總FLC技術之方塊圖,與圖7之方法相比,該總FLC技術經改進且在參考文獻[6]中加以描述。在圖8中,在MDCT頻率區間分類區塊800處接收在丟失訊框前面的上一訊框及在丟失訊框後面的第一訊框之MDCT係數C m-1及C m+1。此等係數亦被提供至形狀雜訊插入區塊802及音調分量之MDCT估計區塊804。在區塊804,亦接收由分類區塊800提供之輸出信號,以及分別接收在丟失訊框前面的再上一個訊框及在丟失訊框後面的第二訊框之MDCT係數C m-2及C m+2。區塊804產生丟失訊框之音調分量的MDCT係數C m ,且形狀雜訊插入區塊802產生丟失訊框之非音調分量的MDCT頻譜係數。此等係數被供應至頻譜組成區塊806,其在輸出端產生用於丟失訊框之頻譜係數。形狀雜訊插入區塊802回應於由估計區塊804產生之系統I T 而操作。
關於參考文獻[4],對以下修改感興趣:
‧用於峰值偵測之偽功率譜經導出為
‧為了消除感覺上不相關或虛假峰值,將峰值偵測僅
應用於有限頻譜範圍,且僅考慮超過相對於偽功率譜之絕對最大值之相對臨限值的區域最大值。將剩餘峰值按其量值之遞降次序來排序,且將預先規定數目之最高順位最大值分類為音調峰值。
‧該方法係基於以下通式(其中α此次帶有正負號):
‧(k)係如上所述地導出,但α之導出變得更高級,遵循以下方法
用以下各者來取代E m 、E m-1及E m+1:
而
產生α為二次之陳述式。因此,對於給定MDCT估計,存在乘法校正因子的兩個候選者(具有相反正負號)(A1、A2、A3為變換矩陣)。類似於參考文獻[4]中所描述的,執行較佳估計之選擇。
‧此進階方法需要在訊框丟失之前及之後的兩個訊框,以便導出先前及後續訊框之MDST係數。
在參考文獻[7]中建議此方法之具有較少延遲的版本:
‧作為開始點,重新使用內插公式
,但對於訊框m-1應用該內插公式,從而產生:
‧接著,內插結果被真實估計替換(此處,因子2變為校正因子之部分:α=2 cos(πf l )),該替換產生
‧校正因子係藉由觀察兩個先前訊框之能量來判定。根據能量計算,將先前訊框之MDST係數近似為
‧接著,將正弦能量計算為
‧類似地,計算訊框m-2之正弦能量且用獨立於α之E m-2來表示。
‧使用能量要求E m-1(α)=E m-2
再次產生α為二次之陳述式。
‧如前所述地執行針對計算出的候選者之選擇程序,但決策規則僅考慮先前訊框之功率譜。
在參考文獻[8]中描述了頻域中之另一具有較少延遲的訊框丟失隱蔽。在不失一般性之情況下,參考文獻[8]之教示可簡化為:
‧使用時間信號之DFT的預測:
(a)自對應於接收的編碼頻域係數C m 之經解碼時域信號獲得DFT頻譜。
(b)假設線性相位改變,調變DFT量值以預測下一訊框中之遺漏頻域係數C m+1
‧使用來自接收之頻率頻譜之量值估計的預測:
(a)使用Cm作為輸入來找出及,以使得
其中Qm(k)為對應於Cm(k)之DFT係數之量值
(b)計算:
(c)執行量值及相位之線性外插:
Q m+1(k)=2Q m (k)-Q m-1(k)
φ m+1(k)=2φ m (k)-φ m-1(k)
C m+1(k)=Q m+1(k)cos(φ m+1(k))
‧使用濾波器而自Cm計算及且接著如上所述地繼續以得到Cm+1(k)
‧使用適應性濾波器以計算Cm+1(k):
待預測之頻譜係數之選擇係在參考文獻[8]中提及,但未加以詳細描述。
在參考文獻[9]中,已認識到,對於準靜止信號,連續訊框之間的相位差係幾乎恆定的,且僅取決於分頻(fractional frequency)。然而,僅使用來自上兩個複頻譜之線性外插。
在AMR-WB+(參見參考文獻[10])中,使用參考文獻[11]中所描述之方法。在假設僅當前訊框之一部分丟失,參考文獻[11]中之該方法亦使用當前訊框之可用頻譜係數之意義下,該方法係參考文獻[8]中所描述之方法之擴展。然而,在參考文獻[11]中未考慮訊框之完全丟失的情形。
在參考文獻[12]中描述了MDCT域中之另一具有較少延遲的訊框丟失隱蔽。在參考文獻[12]中,首先判定丟失的第P個訊框是否為多諧波訊框。若第P個訊框之前的K個訊框中之K0個以上訊框具有小於一臨限值之頻譜平坦度,則丟失的第P個訊框為多諧波訊框。若丟失的第P個訊框為多諧波訊框,則使用MDCT-MDST域中之第(P-K)個至第(P-2)個訊框來預測丟失的第P個訊框。若一頻譜係數之功率譜大於兩個鄰近功率譜係數,則該頻譜係數係峰值。將如參考文獻[13]中所描述之偽頻譜用於第(P-1)個訊框。
如下所述地自L1個功率譜訊框建構頻譜係數之一集合Sc:取得由L1個訊框中之每一者中之峰值組成的L1個集合S1、......、SL1,每一集合中之峰值之數目分別為N1、......、NL1。自該L1個集合S1、......、SL1選擇一集合Si。對於集合S1中之每一峰值係數mj(j=1...Ni),判斷mj、mj±1、......、mj±k中是否存在屬於所有其他峰值集合之任何頻率係數。若存在任一者,則將所有頻率mj、mj±1、......、mj±k放入頻率集合SC中。若不存在屬於所有其他峰值集合之頻率係數,則直接將一訊框中之所有頻率係數放入頻率集合SC中。該k
係非負整數。對於集合SC中之所有頻譜係數,使用第(P-K)個至第(P-2)個MDCT-MDST訊框中的L2個訊框來預測相位。使用線性外插(當L2=2時)或線性擬合(當L2>2時)來進行預測。對於線性外插:
其中p、t1及t2為訊框索引。
使用第(P-1)個訊框之前的複數個訊框來取得不在集合SC中之頻譜係數,不特別解釋取得之方式。
本發明之一目標為提供一種用以取得一音訊信號之一替換訊框的頻譜係數之經改良方法。
此目標係藉由技術方案1之方法、技術方案34之非暫時性電腦程式產品、技術方案35或技術方案36之裝置、技術方案37之音訊編碼器、技術方案38之音訊接收器以及技術方案39的用以發送音訊信號之系統而達成。
本發明提供一種用以取得一音訊信號之一替換訊框的頻譜係數之方法,該方法包含:基於存在於在一替換訊框前面的訊框之頻譜中的一峰值來偵測一音訊信號之一頻譜之一音調分量;對於該頻譜之該音調分量,預測該替換訊框之該頻譜中的該峰值及其周圍部分之頻譜係數;以及對於該頻譜之該非音調分量,使用該替換訊框之一非預測頻譜係數或在該替換訊框前面的一訊框之一對應頻譜
係數。
本發明提供一種用以取得一音訊信號之一替換訊框的頻譜係數之裝置,該裝置包含:一偵測器,其組配以基於存在於在一替換訊框前面的訊框之頻譜中的一峰值來偵測一音訊信號之一頻譜之一音調分量;以及一預測器,其經組配以對於該頻譜之該音調分量,預測該替換訊框之該頻譜中的該峰值及其周圍部分之頻譜係數;其中對於該頻譜之該非音調分量,使用該替換訊框之一非預測頻譜係數或在該替換訊框前面的一訊框之一對應頻譜係數。
本發明提供一種用以取得一音訊信號之一替換訊框的頻譜係數之裝置,該裝置經組配以根據用以取得一音訊信號之一替換訊框的頻譜係數之本發明方法而操作。
本發明提供一種音訊解碼器,其包含本發明的一種用以取得一音訊信號之一替換訊框的頻譜係數之裝置。
本發明提供一種音訊接收器,其包含本發明之音訊解碼器。
本發明提供一種用以發送音訊信號之系統,該系統包含:一編碼器,其經組配以產生編碼音訊信號;以及本發明解碼器,其經組配以接收該編碼音訊信號且解碼該編碼音訊信號。
本發明提供一種包含一電腦可讀媒體之非暫時性電腦程式產品,該電腦可讀媒體儲存指令,該等指令在於一電腦上執行時進行用以取得一音訊信號之一替換訊框的頻譜係數之本發明方法。
本發明方法係有利的,因為該方法提供具有良好品質而不引入任何額外延遲的音調信號之良好訊框丟失隱蔽。本發明之低延遲編碼解碼器係有利的,因為該低延遲編碼解碼器對語音信號及音訊信號兩者皆很好地執行,且(例如)在容易出錯之環境中受益於特別針對靜止音調信號所達成之良好訊框丟失隱蔽。提議單音及多音信號之具有較少延遲的訊框丟失隱蔽,其提供音調信號之良好結果而不使非音調信號降級。
根據本發明之實施例,提供MDCT域中的音調分量之經改良隱蔽。實施例係關於併有頻域編碼解碼器或交換式語音/頻域編碼解碼器之音訊及語音編碼,詳言之係關於MDCT(修改型離散餘弦變換)域中的訊框丟失隱蔽。根據實施例,本發明提議用以基於先前接收之訊框來建構丟失訊框之MDCT頻譜之具有較少延遲的方法,其中上一個接收之訊框係使用MDCT在頻域中編碼。
根據較佳實施例,本發明方法包括偵測頻譜之係音調之部分,例如,使用再上一個複頻譜來得到峰值之正確位置或地點、使用上一個實頻譜來改進決策(若頻率區間係音調的),及使用音高(pitch)資訊以較好地偵測音調開始或偏移中之任一者,其中該音高資訊已存在於該位元串流
中或於該解碼器側導出。此外,本發明方法包括提供待隱蔽之諧波的信號適應性寬度。亦提供為諧波之部分的每一頻譜係數之訊框之間的相移或相位差的計算,其中此計算係基於上一個可用頻譜(例如,CMDCT頻譜),而不需要再上一個CMDCT。根據實施例,使用上一個接收之MDCT頻譜來改進該相位差,且視連續丟失的訊框之數目而定,該改進可為適應性的。CMDCT頻譜可自經解碼時域信號建構,此係有利的,因為其避免了需要與編碼解碼器訊框設定進行任何對準,且該信號允許藉由利用低重疊窗口之性質來建構儘可能地接近丟失訊框的複頻譜。本發明之實施例提供使用時域抑或頻域隱蔽的每訊框決策。
本發明方法係有利的,因為該方法完全基於在判定一訊框已丟失或需要替換時在接收器側已可得到之資訊而操作,且不需要必須進行接收之額外旁側資訊,使得亦不存在在先前技術方法中出現的額外延遲來源(考慮到接收額外旁側資訊或自手頭現有資訊來導出額外旁側資訊的必要性)。
本發明方法在與上文所描述之先前技術方法相比時係有利的,因為當應用本發明方法時,避免了此等先前技術方法的被本發明之發明者認識到的隨後概述之缺點。
對於音調信號,參考文獻[1]中所描述的用於訊框丟失隱蔽之該等方法不夠穩健且不產生足夠良好之結果。
如參考文獻[2]中所描述的時域中之波形信號外插不能處置多音信號,且需要增加之複雜性以用於極靜止的音調信號之隱蔽,因為必須判定精確的音高滯後。
在參考文獻[3]中,引入了額外延遲且需要大量旁側資訊。音調分量選擇極其簡單且將選擇非音調分量中之許多峰值。
參考文獻[4]中所描述之方法需要解碼器側上之預看(look-ahead),且因此引入一個訊框之額外延遲。將平滑之偽功率譜用於峰值偵測降低了峰值定位之精度。其亦降低該偵測之可靠性,因為其會由於僅在一個訊框中出現的雜訊而偵測到峰值。
參考文獻[6]中所描述之方法需要解碼器側上之預看,且因此引入兩個訊框之額外延遲。音調分量選擇並不分開地檢查兩個訊框中之音調分量,而是依賴於平均頻譜,且因此,音調分量選擇將具有過多的誤肯定(false positive)抑或誤否定(false negative),而使得調諧峰值偵測臨限值變得不可能。因為使用了偽功率譜,所以峰值之定位將不精確。用於峰值搜尋之有限頻譜範圍就像是因為使用偽功率譜而出現的所述問題之規避方案。
參考文獻[7]中所描述之方法係基於參考文獻[6]中所描述之方法,且因此具有相同缺點;該方法僅克服額外延遲。
在參考文獻[8]中,沒有關於對頻譜係數是否屬於信號之音調部分之決策的詳細描述。然而,音調頻譜係
數偵測與隱蔽之間的協同作用係重要的,且因此,對音調分量之良好偵測係重要的。此外,使用依賴於C m 及C m-1(即,C m 、C m-1、及S m-1 ,因為當C m 及C m-1 可用時,可計算S m-1)兩者之濾波器來計算C m 及S m 尚未被認可。使用計算未對準至編碼信號訊框設定(其被給定低重疊窗口)之複頻譜的可能性亦未得到認可。另外,使用僅基於再上一個複頻譜來計算訊框之間的相位差的可能性未得到認可。
在參考文獻[12]中,至少三個先前訊框必須儲存於記憶體中,藉此顯著增加記憶體需求。是否使用音調隱蔽之決策可能錯誤,且可將具有一或多個諧波之訊框分類為不具多個諧波之訊框。上一個接收到的MDCT訊框並未被直接用以改良丟失MDCT頻譜之預測,而只在音調分量之搜尋中使用。諧波的待隱蔽之MDCT係數之數目係固定的,然而,視雜訊位準而定,希望具有構成一個諧波的可變數目個MDCT係數。
100‧‧‧編碼器
102、122‧‧‧輸入端
104‧‧‧音訊信號
106、130‧‧‧輸出端
108、124‧‧‧天線
110‧‧‧無線發送
112‧‧‧有線發送
120‧‧‧解碼器
126‧‧‧偵測器
128‧‧‧解碼區塊
132‧‧‧經解碼音訊訊框或經解碼音訊信號之串流
134‧‧‧音調偵測器
136‧‧‧雜訊產生/記憶體區塊
138‧‧‧預測器
140‧‧‧用以取得替換訊框的頻譜係數之裝置
S200、S202、S204、S206、S208、S210、S212、S214、S216、S400、S402、S404‧‧‧步驟
300‧‧‧重疊區
500‧‧‧包絡
502、504、506‧‧‧峰值
508‧‧‧左最下部
510‧‧‧右最下部
600‧‧‧上一個訊框
602‧‧‧再上一個訊框
604‧‧‧中間訊框
606、608、610‧‧‧MDCT窗口
700‧‧‧訊框內插區塊
702、704‧‧‧區塊
706‧‧‧偽頻譜區塊
708‧‧‧峰值偵測區塊
712‧‧‧隨機正負號改變區塊
714‧‧‧正負號校正區塊
800‧‧‧MDCT頻率區間分類區塊
802‧‧‧形狀雜訊插入區塊
804‧‧‧音調分量區塊
806、710‧‧‧頻譜組成區塊
在下文中,將參看附圖更詳細地描述本發明之實施例,其中:圖1展示在解碼器側實施本發明方法的用以發送音訊信號之系統的簡化方塊圖,圖2根據一實施例展示本發明方法之流程圖,圖3為相鄰訊框之重疊MDCT窗口的示意表示,圖4根據一實施例展示表示用以挑選峰值之步驟的流程圖,
圖5為訊框之功率譜的示意表示,自該功率譜偵測一或多個峰值,圖6展示「中間訊框」之一實例,圖7展示表示不具有已發送旁側資訊之內插方法的方塊圖,且圖8展示與圖7相比經改進的總FLC技術的方塊圖。
在下文中,將較詳細地描述本發明方法之實施例,且請注意,在附圖中,具有相同或類似功能性之元件係由相同參考符號來表示。在下文中,將描述本發明方法之實施例,根據該等實施例,僅當上兩個接收的訊框係使用MDCT編碼時,才在頻域中進行隱蔽。亦將描述關於是否對在接收兩個MDCT訊框之後丟失的訊框使用時域或頻域隱蔽的決策之細節。關於下文中所描述之實施例,請注意,對於在頻域中編碼上兩個訊框的需求並未降低本發明方法之適用性,因為在交換式編碼解碼器中,頻域將被用於靜止音調信號。
圖1展示在解碼器側實施本發明方法的用以發送音訊信號之系統的簡化方塊圖。該系統包含在輸入端102接收音訊信號104的編碼器100。該編碼器經組配以基於接收的音訊信號104來產生在編碼器100之輸出端106提供的經編碼音訊信號。該編碼器可提供經編碼音訊信號,以使得音訊信號之訊框係使用MDCT來編碼。根據一實施例,編
碼器100包含用以允許音訊信號之無線發送(如以參考符號110來指示)的天線108。在其他實施例中,該編碼器可經由有線連接線輸出在輸出端106提供的經編碼音訊信號,如例如以參考符號112來指示。
該系統進一步包含具有輸入端122之解碼器120,在該輸入端處接收由編碼器106提供之經編碼音訊信號。根據一實施例,編碼器120可包含用以自編碼器100接收無線發送110之天線124。在另一實施例中,輸入端122可提供至有線發送112之連接以用於接收經編碼音訊信號。在解碼器120之輸入端122處接收的音訊信號被施加至偵測器126,該偵測器判定將由解碼器120解碼的所接收音訊信號之經編碼訊框是否需要被替換。舉例而言,根據實施例,此可為當偵測器126判定在解碼器處未接收到應跟在一先前訊框後的一訊框時或當判定所接收訊框具有避免在解碼器側120解碼該訊框的錯誤時的情況。在於偵測器126處判定為了解碼而提供之一訊框可用的情況下,該訊框將被轉發至解碼區塊128(經編碼訊框之解碼將在該解碼區塊中進行),使得在解碼器之輸出端130,可輸出解碼音訊訊框或解碼音訊信號之串流132。
在於區塊126處判定目前待處理之訊框需要替換的情況下,將在需要替換之當前訊框前面且可在偵測器電路系統126中緩衝的訊框提供至判定替換之頻率是否包括音調分量之音調偵測器134。在不提供音調分量的情況下,向產生頻譜係數之雜訊產生器/記憶體區塊136指示此情
況,該等頻譜係數為可藉由使用雜訊產生器或另一習知雜訊產生方法(例如,正負號加擾或其類似者)產生的非預測性係數。替代地,亦可自一記憶體(例如,一查找表)取得頻譜之非音調分量的預定義頻譜係數。替代地,當判定頻譜不包括音調分量時,可選擇在替換前面的訊框中之一者之對應頻譜特性,而非產生非預測頻譜係數。
在音調偵測器134偵測到頻譜包括音調分量的情況下,向預測器138指示各別信號,該預測器根據稍後將描述的本發明之實施例預測替換訊框的頻譜係數。將關於替換訊框判定之各別係數提供至解碼區塊128,在該解碼區塊中基於此等頻譜係數進行丟失或替換訊框之解碼。
如圖1所示,音調偵測器134、雜訊產生器136及預測器138界定解碼器120中的用以取得替換訊框之頻譜係數之裝置140。該等所描繪元件可使用硬體及/或軟體組件(例如,經適當程式化之處理單元)來實施。
圖2根據一實施例展示本發明方法之流程圖。在第一步驟S200中,例如在解碼器120處接收經編碼音訊信號,如在圖1中描繪。接收到的音訊信號可為使用MDCT編碼的各別音訊訊框之形式。
在步驟S202中,判定將由解碼器120處理之當前訊框是否需要替換。舉例而言,在訊框由於所接收資料中之錯誤或類似原因而不能被處理的情況下,或在訊框在向接收器/解碼器120之發送期間丟失的情況下,或在訊框(例如)由於訊框自編碼器側向解碼器側之發送期間的延遲而
未及時地在音訊信號接收器120處接收的情況下,在解碼器側可有必要使用替換訊框。
在於步驟S202中判定(例如,藉由解碼器120中之偵測器126)當前待由解碼器120處理之訊框需要替換的情況下,該方法進行至步驟S204,在該步驟進行關於是否需要頻域隱蔽的另一判定。根據一實施例,若具有上兩個接收到的訊框之音高資訊且若音高不改變,則在步驟S204判定需要頻域隱蔽。否則,判定應該應用時域隱蔽。在一替代實施例中,可使用解碼信號基於子訊框來計算音高,且再次使用以下決策:在音高存在的情況下且在音高在子訊框中恆定的情況下,使用頻域隱蔽,否則,應用時域隱蔽。
在本發明之又一實施例中,可提供一偵測器(例如,解碼器120中之偵測器126),且該偵測器可經組配,使得其額外分析在替換訊框前面的再上一個訊框或上一個訊框或此等訊框兩者之頻譜且基於所發現之峰值來決定信號係單音抑或多音的。在信號係多音的之情況下,將使用頻域隱蔽,不論音高資訊是否存在。替代地,解碼器120中之偵測器126可經組配,使得其額外分析在替換訊框前面的一或多個訊框以便指示信號中之音調分量之數目是否超過預定義臨限值。在信號中之音調分量之數目超過臨限值之情況下,將使用頻域隱蔽。
在例如藉由應用上文提及之準則而於步驟S204中判定將使用頻域隱蔽的情況下,該方法進行至步驟S206,在該步驟中,基於存在於在前面的訊框之頻譜中的
一或多個峰值(即,存在於在替換訊框前面的再上一個訊框之頻譜及上一個訊框之頻譜中的實質上相同之位置處的一或多個峰值)來偵測音訊信號之頻譜之音調部分或音調分量。在步驟S208中,判定是否存在頻譜之音調部分。在存在頻譜之音調部分的情況下,該方法進行至步驟S210,在該步驟中,(例如)基於可自在前面的訊框(即,再上一個訊框及上一個訊框)導出之資訊來預測替換訊框之頻譜中之一或多個峰值及其周圍部分的一或多個頻譜係數。將在步驟S210中預測之頻譜係數轉發(例如)至圖1所示之解碼區塊128,使得,如步驟212處所示,可執行基於來自步驟210之頻譜係數的對經編碼音訊信號之訊框之解碼。
在於步驟S208中判定不存在頻譜之音調部分的情況下,該方法進行至步驟S214,使用替換訊框之一非預測頻譜係數或在替換訊框前面的訊框之一對應頻譜係數,該等頻譜係數被提供至步驟S212以用於解碼訊框。
在於步驟S204中判定不需要頻域隱蔽的情況下,該方法進行至步驟S216,在該步驟中,執行對待替換之訊框的習知時域隱蔽,且基於在步驟S216中藉由該程序產生之頻譜係數,在步驟S212中解碼經編碼信號之訊框。
在於步驟S202中判定當前處理之音訊信號中不存在替換訊框(亦即當前處理之訊框可使用習知方法完全解碼)的情況下,該方法直接進行至步驟S212以用於解碼經編碼音訊信號之訊框。
在下文中,將描述根據本發明之實施例的其他細
節。
功率譜計算
對於索引為m-2的再上一個訊框,直接自解碼時域信號來計算MDST係數S m-2。
對於上一個訊框,使用估計MDST頻譜,該頻譜係自上一個接收之訊框之MDCT係數C m-1 計算(參見例如參考文獻[13]):|S m-1(k)|=|C m-1(k+1)-C m-1(k-1)|
訊框m-2及m-1之功率譜係如下所述地計算:P m-2(k)=|S m-2(k)|2+|C m-2(k)|2
P m-1(k)=|S m-1(k)|2+|C m-1(k)|2
其中:S m-1(k)為訊框m-1中之MDST係數,C m-1(k)為訊框m-1中之MDCT係數,Sm-2(k)為訊框m-2中之MDST係數,及Cm-2(k)為訊框m-2中之MDCT係數。
所取得功率譜係如下所述地進行平滑:Psmoothed m-2(k)=0.75.P m-2(k-1)+P m-2(k)+0.75.P m-2(k+1)
Psmoothed m-1(k)=0.75.P m-1(k-1)+P m-1(k)+0.75.P m-1(k+1)
音調分量之偵測
將存在於上兩個訊框(m-2及m-1)中之峰值視為音調分量之代表。峰值之連續存在允許區分音調分量與有雜訊信號中之隨機出現之峰值。
音高資訊
假設音高資訊可用:‧係在編碼器側上計算且在位元串流中可用,或‧在解碼器側上計算。
僅當滿足全部以下條件時才使用音高資訊:
‧音高增益大於零
‧音高滯後在上兩個訊框中係恆定的
‧基頻大於100Hz。
基頻係自音高滯後計算:
若存在=n.F 0(其中,N>5個諧波係頻譜中最強的),則將F 0設定為。若在諧波n.F 0之位置處不存在足夠的強峰值,則F 0不可靠。
根據一實施例,基於對準至圖3所示之MDCT窗口之右邊界的訊框設定而計算的音高資訊。此對準對信號之音調部分的外插而言有益,因為作為需要隱蔽之部分的重疊區300亦被用於音高滯後計算。
在另一實施例中,音高資訊可在位元串流中傳送且在空白頻道中由編碼解碼器使用,且因此音高資訊不會對隱蔽造成額外成本。
包絡
在下文中,描述用以取得頻譜包絡之程序,該頻譜包絡係稍後所描述之峰值挑選所需的。
使用長度為L之移動平均濾波器來計算上兩個訊
框中之每一功率譜的包絡:
濾波器長度取決於基頻(且可限於範圍[7,23]):
L與F0之間的此聯繫類似於參考文獻[14]中所描述之程序,然而,在本發明中,使用來自當前訊框的包括預看的音高資訊,其中參考文獻[14]使用特定針對講話者之平均音高。若基頻不可用或不可靠,則將濾波器長度L設定為15。
峰值挑選
首先基於預定義臨限值在訊框m-1之功率譜中搜尋峰值。基於該等峰值在訊框m-1中之位置,調適用於在訊框m-2之功率譜中進行之搜尋的臨限值。因此,發現存在於兩個訊框(m-1及m-2)中之峰值,但確切位置係基於訊框m-2中之功率譜。此次序係重要的,因為訊框m-1中之功率譜係僅使用估計MDST而計算,且因此,峰值之位置並非精確的。使用訊框m-1之MDCT亦很重要,因為不希望用僅存在於訊框m-2中而不存在於訊框m-1中的音調繼續。圖4根據一實施例展示表示以上用以挑選峰值之步驟的流程圖。在步驟S400中,基於一或多個預定義臨限值而在在替換訊框前面之上一個訊框m-1之功率譜中搜尋峰值。在步驟S402中,調適該一或多個臨限值。在步驟S404中,基於一或多個經
調適臨限值而在在替換訊框前面之再上一個訊框m-2之功率譜中搜尋峰值。
圖5為訊框之功率譜的示意表示,自該功率譜偵測一或多個峰值。在圖5中,展示包絡500,其可如上所概述地判定或可藉由其他已知方法來判定。在圖5中展示了藉由圓圈表示的數個峰值候選者。將在下文較詳細地描述在峰值候選者中發現峰值。圖5展示被發現之峰值502,以及假峰值504及表示雜訊之峰值506。另外,展示頻譜係數之左最下部(left foot)508及右最下部(right foot)510。
根據一實施例,使用以下步驟(圖4中之步驟S400)來進行在在替換訊框前面之上一個訊框m-1之功率譜P m-1中發現峰值:‧若所有以下準則得到滿足,則將頻譜係數分類為音調峰值候選者:○經平滑功率譜與包絡500之間的比大於某一臨限值:
○平滑功率譜與包絡500之間的比大於峰值候選者之周圍鄰近者,意謂著該峰值候選者係區域最大值,‧藉由發現頻譜係數k之左最下部508及右最下部510及藉由發現左最下部508與右最下部510之間的最大值來判定區域最大值。如圖4中可見,需要此步驟,其中假峰值504可由旁瓣或由量化雜訊造成。
如下所述地設定用於在再上一個訊框m-2之功率
譜P m-2中進行峰值搜尋的臨限值(圖4中之步驟S402):‧在P m-1 中的具有索引i之峰值周圍的頻譜係數k [i-1,i+1]中:臨限值(k)=(Psmoothed m-1(k)>包絡 m-1(k))?9.21dB:10.56dB,‧若F 0 可用且可靠,則對於每一n [1,N],設定及frac=n.F 0-k:臨限值(k)=8.8dB+10.log10(0.35)
臨限值(k-1)=8.8dB+10.log10(0.35+2.frac)
臨限值(k+1)=8.8dB+10.log10(0.35+2.(1-frac)),若在P m-1 中的索引i處之峰值周圍k [i-1,i+1],則覆寫在該第一步驟設定之臨限值,‧對於所有其他索引:臨限值(k)=20.8dB
藉由以下步驟在再上一個訊框m-2之功率譜P m-2 中發現音調峰值(圖4中之步驟S404):‧在以下情況下將頻譜係數分類為音調峰值:○功率譜與包絡之間的比大於臨限值:
○功率譜與包絡之間的比大於峰值之周圍鄰近者,意謂著該峰值係區域最大值,‧藉由發現頻譜係數k之左最下部508及右最下部510及藉由發現左最下部508與右最下部510之間的最大值來判定區域最大值,
‧左最下部508及右最下部510亦界定音調峰值502之周圍部分,亦即,音調隱蔽方法將被用於的音調分量之頻譜頻率區間。
藉由使用上述方法,揭露了圖4中之右峰值506僅存在於訊框中之一者中,亦即,該峰值不存在於訊框m-1或m-2兩者中。因此,將此峰值標記為雜訊且不選擇其作為音調分量。
正弦參數提取
對於正弦信號,N/2(MDCT跳躍大小)之移位產生信號
因此,存在相移Δφ=π.(l+Δl),其中l為峰值之索引。因此,對於奇數頻譜係數,相移取決於輸入頻率之分數部分加上額外添加的π。
頻率之分數部分Δl可使用(例如)參考文獻(Ferreira,2001)中所描述之方法來導出:‧假定子頻帶k=l中的信號之量值為區域最大值,可藉由計算子頻帶k=l-1及k=l+1中的信號之量值之間的比(亦即,藉由評估下式)來判定Δl:
其中使用了窗口之量值回應的近似:
其中b為主瓣之寬度。此陳述式中之常數G已調整至27.4/20.0以便將估計之最大絕對誤差減至最小。
‧代入近似頻率回應,且令
b'=2.b
導致:
MDCT預測
對於所發現之所有頻譜峰值及其周圍部分,使用MDCT預測。對於所有其他頻譜係數,可使用正負號加擾或類似雜訊產生方法。
屬於已發現峰值及其周圍部分之所有頻譜係數皆屬於經表示為K之集合。舉例而言,在圖5中,峰值502經識別為表示音調分量之峰值。峰值502之周圍部分可藉由預定義數目個相鄰頻譜係數(例如,藉由左最下部508與右最下部510之間的頻譜係數加上最下部508、510之係數)來表示。
根據實施例,峰值之周圍部分係藉由峰值502周圍的預定義數目個係數界定。峰值之周圍部分可包含在峰值502左邊的第一數目個係數及在峰值502右邊的第二數目個係數。在峰值502左邊的係數之第一數目及在峰值502右邊的係數之第二數目可相等或不同。
根據應用EVS標準之實施例,該預定義數目個相鄰係數可在第一步驟中(例如,在偵測音調分量之前)加以設定或固定。在EVS標準中,可使用在峰值502左邊的三個係數、在右邊的三個係數及峰值502,亦即,總共七個係數(處於複雜性原因而選擇此數目,然而任何其他數目亦可行)。
根據實施例,峰值之周圍部分之大小係適應性的。可修改經識別為音調分量的峰值之周圍部分,以使得兩個峰值周圍的周圍部分不重疊。根據實施例,峰值始終僅與其周圍部分一起被考慮,且該兩者一起界定音調分量。
對於丟失訊框中之MDCT係數的預測,使用再上一個訊框中之功率譜(複頻譜之量值):
將替換訊框中之丟失MDCT係數估計為:C m (k)=Q m-2(k).cos(φ m (k))。
在下文中,將描述根據一實施例的用以計算相位φ m (k)之方法。
相位預測
對於所發現的每一個頻譜峰值,如上所述地計算
分頻Δl,且相移為:Δφ=π.(l+Δl)。
Δφ係訊框之間的相移。對於峰值及其周圍部分中之係數,該相移係相等的。
使用以下陳述式在再上一個所接收訊框中計算峰值位置及其周圍部分(k K)處的每一頻譜係數之相位。
將丟失訊框中之相位預測為:
φ m (k)=φ m-2(k)+2Δφ
根據一實施例,可使用改進的相移。使用峰值位置及其周圍部分處的每一頻譜係數之所計算相位φ m-2(k)允許估計訊框m-1中之MDST,其可如下所述地導出:S m-1(k)=Q m-2(k).sin(φ m-2(k)+Δφ(k))
其中:Q m-2(k)為訊框m-2中之功率譜(複頻譜之量值)。
自此MDST估計及自接收到的MDCT,導出訊框m-1中之相位之估計:
將所估計相位用以改進相移:Δφ(k)=φ m-1(k)-φ m-2(k)
其中:φ m-1(k)為訊框m-1中之複頻譜之相位,及
φ m-2(k)為訊框m-2中之複頻譜之相位。
將丟失訊框中之相位預測為:φ m (k)=φ m-1(k)+Δφ(k)。
根據此實施例之相移改進改良了在存在背景雜訊之情況下或在正弦曲線之頻率改變之情況下對正弦曲線之預測。對於具有恆定頻率且不具背景雜訊的非重疊正弦曲線,對圍繞峰值之所有MDCT係數而言,相移相同。
所使用的隱蔽可具有用於音調部分及用於雜訊部分的不同衰落速度。若用於信號之音調部分之衰落速度較慢,則在多個訊框丟失之後,音調部分變得佔優勢。正弦曲線中的由正弦曲線分量之不同相移引起的波動產生令人不快之偽訊。
為了克服此問題,根據實施例,自第三丟失訊框開始,將峰值(具有索引k)之相位差用於在該峰值周圍的所有頻譜係數(k-l為左最下部之索引,且k+u為右最下部之索引):
根據其他實施例,提供轉變。第二丟失訊框中的具有高衰減之頻譜係數使用峰值之相位差,且具有低衰減之係數使用經校正相位差:
量值改進
根據其他實施例,可應用使用量值改進之另一方法,而非應用上文所描述之相移改進:
C m (k)=Q m-1(k).cos(φ m-2(k)+2Δφ(k))
其中l為峰值之索引,分頻Δl係如上所述地計算。相移為:Δφ=π.(l+Δl)
為了避免能量之增加,根據其他實施例,經改進量值可由來自再上一個訊框之量值來限制:Q m-1(k)=max(Q m-1(k),Q m-2(k))
此外,根據又一實施例,量值之減小可用以使其衰落:
使用「中間訊框」之相位預測
根據其他實施例,替代將頻譜係數之預測基於在替換訊框前面的訊框,相位預測可使用「中間訊框」(亦被稱為「中間」訊框)。圖6展示「中間訊框」之一實例。在圖6中,在替換訊框前面的上一個訊框600(m-1)、在替換訊框前面的再上一個訊框602(m-2)及中間訊框604(m-1,5)係與相關聯MDCT窗口606至610一起展示。
若MDCT窗口重疊小於50%,則可能使CMDCT頻譜較接近丟失訊框。在圖6中,描繪了具有25%之MDCT窗口重疊之一實例。此允許使用虛線窗口610取得中間訊框
604(m-1,5)之CMDCT頻譜,該虛線窗口等於MDCT窗口606或608,但具有相對於編碼解碼器訊框設定的一半訊框長度之移位。由於中間訊框604(m-1,5)在時間上較接近丟失訊框(m),故中間訊框之頻譜特性將比再上一個訊框602(m-2)與丟失訊框(m)之間的頻譜特性更類似於丟失訊框(m)之頻譜特性。
在此實施例中,MDST係數S m-1,5及MDCT係數C m-1,5兩者之計算係直接根據經解碼時域信號進行,其中MDST及MDCT構成CMDCT。替代地,可使用矩陣運算自相鄰之現有MDCT係數導出CMDCT。
功率譜計算係如上所述地進行,且對音調分量之偵測係如上所述地進行,其中第m-2個訊框被第m-1.5個訊框替換。
對於正弦信號,N/4(MDCT跳躍大小)之移位產生信號
此產生相移。因此,相移取決於
輸入頻率之分數部分加上額外添加的,其中l為峰值之索引。對分頻之偵測係如上所述地進行。
對於丟失訊框中之MDCT係數之預測,使用來自m-1.5訊框之量值:
丟失之MDCT係數經估計為:C m (k)=Q m-1.5(k).cos(φ m (k))。
相位φ m (k)可使用下式來計算:
φ m (k)=φ m-1.5(k)+3Δφ 0.5(k)
此外,根據實施例,可應用上述的相移改進:S m-1(k)=Q m-1.5(k).sin(φ m-1.5(k)+Δφ 0.5(k))
Δφ 0.5(k)=φ m-1(k)-φ m-1.5(k)
φ m (k)=φ m-1(k)+2Δφ 0.5(k)。
此外,可如上所述地使用峰值周圍的所有頻譜係數之相移向峰值之相移的收斂性。
雖然已在裝置之上下文中描述了所描述概念之一些態樣,但顯然,此等態樣亦表示對應方法之描述,其中區塊或器件對應於方法步驟或方法步驟之特徵。類似地,在方法步驟之上下文中描述之態樣亦表示對應裝置之對應區塊或項目或特徵之描述。
視特定實施要求而定,本發明之實施例可以硬體或以軟體來實施。實施可使用數位儲存媒體來執行,數位儲存媒體例如上面儲存有電子可讀控制信號之軟碟、DVD、Blue-Ray、CD、ROM、PROM、EPROM、EEPROM
或FLASH記憶體,該等控制信號與可程式化電腦系統合作(或能夠與之合作),以使得執行各別方法。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可程式化電腦系統合作,以使得執行本文中所描述之方法中之一者。
通常,本發明之實施例可實施為具有程式碼之電腦程式產品,該程式碼可操作而用以在電腦程式產品在電腦上執行時執行該等方法中之一者。該程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含儲存於記憶體可讀載體上的用以執行本文中所描述之方法中之一者之電腦程式。
換言之,本發明方法之實施例因此為電腦程式,其具有程式碼,以用以在電腦程式在電腦上執行時執行本文中所描述之方法中之一者。
因此,本發明方法之另一實施例為資料載體(或數位儲存媒體,或電腦可讀媒體),該資料載體包含(記錄於其上)用以執行本文中所描述之方法中之一者的電腦程式。
因此,本發明方法之另一實施例為表示電腦程式的資料串流或信號之序列,該電腦程式用以執行本文中所描述之方法中之一者。資料串流或信號之序列可(例如)經組配以經由資料通訊連接(例如,經由網際網路)來傳送。
另一實施例包含經組配或經調適以執行本文
中所描述之方法中之一者的處理構件,例如,電腦或可程式化邏輯器件。
另一實施例包含電腦,其上安裝有用以執行本文中所描述之方法中之一者的電腦程式。
在一些實施例中,可程式化邏輯器件(例如,場可程式化閘陣列)可用以執行本文中所描述之方法之功能性之一些或全部。在一些實施例中,場可程式化閘陣列可與微處理器合作以便執行本文中所描述之方法中之一者。通常,該等方法較佳由任何硬體裝置來執行。
上述實施例僅例示了本發明之原理。應理解,本文中所描述之配置以及細節之修改及改變係熟習此項技術者顯而易見的。因此,目的為僅受隨附申請專利範圍之範疇限制,而不受以描述及解釋本文中之實施例的方式呈現的特定細節限制。
[1] P. Lauber and R. Sperschneider, "Error Concealment for Compressed Digital Audio," in AES 111th Convention, New York, USA, 2001.
[2] C. J. Hwey, "Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment". Patent US 6,351,730 B2, 2002.
[3] S. K. Gupta, E. Choy and S.-U. Ryu, "Encoder-assisted frame loss concealment techniques for
audio coding". Patent US 2007/094009 A1.
[4] S.-U. Ryu and K. Rose, "A Frame Loss Concealment Technique for MPEG-AAC," in 120th AES Convention, Paris, France, 2006.
[5] I SO/IEC JTC1 /SC29/WG11, Information technology-Coding of moving pictures and associated, International Organization for Standardization, 1993.
[6] S.-U. Ryu and R. Kenneth, An MDCT domain frame-loss concealment technique for MPEG Advanced Audio Coding, Department od Electrical and Computer Engineering, University of California, 2007.
[7] S.-U. Ryu, Source Modeling Approaches to Enhanced Decoding in Lossy Audio Compression and Communication, UNIVERSITY of CALIFORNIA Santa Barbara, 2006.
[8] M. Yannick, "Method and apparatus for transmission error concealment of frequency transform coded digital audio signals". Patent EP 0574288 B1, 1993.
[9] Y. Mahieux, J.-P. Petit and A. Charbonnier, "Transform coding of audio signals using correlation between successive transform blocks," in Acoustics, Speech, and Signal Processing, 1989. ICASSP-89., 1989.
[10] 3GPP; Technical Specification Group Services and System Aspects, Extended Adaptive Multi-Rate-Wideband (AMR-WB+) codec, 2009.
[11] A. Taleb, "Partial Spectral Loss Concealment in Transform Codecs". Patent US 7,356,748 B2.
[12] C. Guoming, D. Zheng, H. Yuan, J. Li, J. Lu, K. Liu, K. Peng, L. Zhibin, M. Wu and Q. Xiaojun, "Compensator and Compensation Method for Audio Frame Loss in Modified Discrete Cosine Transform Domain". Patent US 2012/109659 A1.
[13] L. S. M. Dauder, "MDCT Analysis of Sinusoids: Exact Results and Applications to Coding Artifacts Reduction," IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, pp. 302-312, 2004.
[14] D. B. Paul, "The Spectral Envelope Estimation Vocoder," IEEE Transactions on Acoustics, Speech, and Signal Processing, pp. 786-794, 1981.
[15] A. Ferreira, "Accurate estimation in the ODFT domain of the frequency, phase and magnitude of stationary sinusoids," 2001 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, pp. 47-50, 2001.
100‧‧‧編碼器
102、122‧‧‧輸入端
104‧‧‧音訊信號
106、130‧‧‧輸出端
108、124‧‧‧天線
110‧‧‧無線發送
112‧‧‧有線發送
120‧‧‧解碼器
126‧‧‧偵測器
128‧‧‧解碼區塊
132‧‧‧經解碼音訊訊框或經解碼音訊信號之串流
134‧‧‧音調偵測器
136‧‧‧雜訊產生/記憶體區塊
138‧‧‧預測器
140‧‧‧用以取得替換訊框的頻譜係數之裝置
Claims (39)
- 一種用以取得音訊信號之替換訊框的頻譜係數之方法,該方法包含:基於存在於在一替換訊框(m)前面的訊框(m-1,m-2)之頻譜中的一峰值來偵測一音訊信號之一頻譜之一音調分量;對於該頻譜之該音調分量,預測該替換訊框(m)之該頻譜中的該峰值及其周圍部分之頻譜係數;以及對於該頻譜之非音調分量,使用該替換訊框(m)之一非預測頻譜係數或在該替換訊框(m)前面的一訊框之一對應頻譜係數。
- 如請求項1之方法,其中該替換訊框(m)之該頻譜中的該峰值及其周圍部分的該等頻譜係數係基於在該替換訊框(m)前面的一訊框(m-2)之複頻譜之一量值及該替換訊框(m)之複頻譜之一預測相位而預測,且該替換訊框(m)之複頻譜之相位係基於在該替換訊框(m)前面的一訊框(m-2)之複頻譜之相位及在該替換訊框(m)前面的該等訊框(m-1,m-2)之間的一相移而預測。
- 如請求項2之方法,其中該替換訊框(m)之該頻譜中的該峰值及其周圍部分的該等頻譜係數係基於在該替換訊框(m)前面的再上一個訊框(m-2)之複頻譜之該量值及該替換訊框(m)之複頻 譜之該預測相位而預測,且該替換訊框(m)之複頻譜之相位係基於在該替換訊框(m)前面的再上一個訊框(m-2)之複頻譜而預測。
- 如請求項2或3之方法,其中該替換訊框(m)之複頻譜之相位係基於在該替換訊框(m)前面的該訊框(m-2)中的該峰值及其周圍部分處之每一頻譜係數的一相位而預測。
- 如請求項2至4中任一項之方法,其中對於該等各別訊框中之該峰值及其周圍部分處之每一頻譜係數,在該替換訊框(m)前面的該等訊框(m-1,m-2)之間的該相移係相等的。
- 如請求項1至5中任一項之方法,其中該音調分量係藉由該峰值及其周圍部分界定。
- 如請求項1至6中任一項之方法,其中該峰值之該周圍部分係藉由該峰值周圍的預定義數目個係數界定。
- 如請求項1至7中任一項之方法,其中該峰值之該周圍部分包含在該峰值左邊的第一數目個係數及在該峰值右邊的第二數目個係數。
- 如請求項8之方法,其中該第一數目個係數包含在一左最下部與該峰值之間的係數加上該左最下部之係數,且其中該第二數目個係數包含在一右最下部與該峰值之間的係數加上該右最下部之係數。
- 如請求項8或9之方法,其中在該峰值左邊的係數之該第一數目及在該峰值右邊的係數之該第二數目係相等或不同的。
- 如請求項10之方法,其中在該峰值左邊的係數之該第一數目為三,且在該峰值右邊的係數之該第二數目為三。
- 如請求項6至11中任一項之方法,其中該峰值周圍的係數之該預定義數目係在偵測該音調分量之該步驟之前設定。
- 如請求項1至12中任一項之方法,其中該峰值之該周圍部分之大小係適應性的。
- 如請求項13之方法,其中選擇該峰值之該周圍部分,以使得兩個峰值周圍的周圍部分不重疊。
- 如請求項2之方法,其中該替換訊框(m)之該頻譜中的該峰值及其周圍部分的該頻譜係數係基於在該替換訊框(m)前面的該再上一個訊框(m-2)之該複頻譜之該量值及該替換訊框(m)之該複頻譜之該預測相位而預測,該替換訊框(m)之該複頻譜之該相位係基於在該替換訊框(m)前面的該上一個訊框(m-1)之該複頻譜之該相位及在該替換訊框(m)前面的該上一個訊框(m-1)與該再上一個訊框(m-2)之間的一改進相移而預測,在該替換訊框(m)前面的該上一個訊框(m-1)之該複頻譜之該相位係基於以下各者而判定:在該替換訊框(m)前面的該再上一個訊框(m-2)之該複頻譜之該量值、在該替換訊框(m)前面的該再上一個訊框(m-2)之該複頻譜之該相位、在該替換訊框(m)前面的該上一個訊框(m-1)及該再上一個訊框(m-2)之間的該相移以及該上一個訊 框(m-1)之實頻譜,且該改進相移係基於以下各者而判定:在該替換訊框(m)前面的該上一個訊框(m-1)之該複頻譜之該相位及在該替換訊框(m)前面的該再上一個訊框(m-2)之該複頻譜之該相位。
- 如請求項15之方法,其中基於連續丟失之訊框之數目,該相移之該改進為適應性的。
- 如請求項16之方法,其中自一第三丟失訊框開始,針對一峰值判定之一相移被用於預測該峰值周圍的該等頻譜係數。
- 如請求項17之方法,其中對於預測一第二丟失訊框中之頻譜係數,當在該替換訊框(m)前面的上一個訊框(m-1)中之相移等於或低於一預定義臨限值時,將對於該峰值判定之一相移用於預測該等周圍頻譜係數的該等頻譜係數,且當在該替換訊框(m)前面的上一個訊框(m-1)中之相移高於該預定義臨限值時,將對於該等各別周圍頻譜係數判定之一相移用於預測該等周圍頻譜係數的該等頻譜係數。
- 如請求項2之方法,其中該替換訊框(m)之該頻譜中的該峰值及其周圍部分的該頻譜係數係基於在該替換訊框(m)前面的上一個訊框(m-1)之複頻譜之一改進量值及該替換訊框(m)之複頻譜之該預測相位而預測,且該替換訊框(m)之複頻譜之相位係基於在該替換訊 框(m)前面的再上一個訊框(m-2)之複頻譜之相位及在該替換訊框(m)前面的上一個訊框(m-1)與再上一個訊框(m-2)之間的相移之兩倍而預測。
- 如請求項19之方法,其中在該替換訊框(m)前面的上一個訊框(m-1)之複頻譜之該改進量值係基於以下各者而判定:在該替換訊框(m)前面的上一個訊框(m-1)之實頻譜的一實頻譜係數、在該替換訊框(m)前面的再上一個訊框(m-2)之複頻譜之相位,及在該替換訊框(m)前面的上一個訊框(m-1)與再上一個訊框(m-2)之間的相移。
- 如請求項19或20之方法,其中在該替換訊框(m)前面的上一個訊框(m-1)之複頻譜之該改進量值係由在該替換訊框(m)前面的再上一個訊框(m-2)之複頻譜之量值來限制。
- 如請求項2之方法,其中該替換訊框(m)之頻譜中的該峰值及其周圍部分的該頻譜係數係基於在該替換訊框(m)前面的上一個訊框(m-1)與再上一個訊框(m-2)之間的一中間訊框之複頻譜之量值及該替換訊框(m)之複頻譜之該預測相位而預測。
- 如請求項22之方法,其中該替換訊框(m)之複頻譜之相位係基於在該替換訊框(m)前面的該中間訊框之複頻譜之相位及在該替換訊框(m)前面的中間訊框之間的一相移而預測,或該替換訊框(m)之複頻譜之相位係基於在該替換訊 框(m)前面的上一個訊框(m-1)之複頻譜之相位及在該替換訊框(m)前面的中間訊框之間的一改進相移而預測,該改進相移係基於以下各者而判定:在該替換訊框(m)前面的上一個訊框(m-1)之複頻譜之相位及在該替換訊框(m)前面的該中間訊框之複頻譜之相位。
- 如請求項1至23中任一項之方法,其中偵測該音訊信號之該頻譜之一音調分量包含:基於一或多個預定義臨限值而在該替換訊框(m)前面的上一個訊框(m-1)之頻譜中搜尋峰值;調適該一或多個臨限值;以及基於一或多個經調適臨限值而在該替換訊框(m)前面的再上一個訊框(m-2)之頻譜中搜尋峰值。
- 如請求項24之方法,其中調適該一或多個臨限值包含基於在該替換訊框(m)前面的上一個訊框(m-1)之該頻譜及一頻譜包絡或基於基頻來設定用於在該替換訊框(m)前面的上一個訊框(m-1)中發現的峰值周圍之一區域中搜尋在該替換訊框(m)前面的再上一個訊框(m-2)中的一峰值的該一或多個臨限值。
- 如請求項25之方法,其中該基頻係對於包括在該替換訊框(m)前面的該上一個訊框(m-1)及在該替換訊框(m)前面的該上一個訊框(m-1)之預看的信號。
- 如請求項26之方法,其中在該替換訊框(m)前面的該上一個訊框(m-1)之該預看係在編碼器側上使用該預看加以計算。
- 如請求項24至27中任一項之方法,其中調適該一或多個臨限值包含將用於在不在該替換訊框(m)前面的上一個訊框(m-1)中的峰值周圍之一區域中搜尋在該替換訊框(m)前面的再上一個訊框(m-2)中發現的一峰值的該一或多個臨限值設定為一預定義臨限值。
- 如請求項1至28中任一項之方法,其包含:使用用於該音訊信號之音調分量的頻譜係數之預測而對於該替換訊框(m)判定是應用一時域隱蔽抑或一頻域隱蔽。
- 如請求項29之方法,其中在該替換訊框(m)前面的上一個訊框(m-1)及在該替換訊框(m)前面的再上一個訊框(m-2)具有一恆定音高,或對在該替換訊框(m)前面的一或多個訊框之一分析指示該信號中之音調分量之一數目超過一預定義臨限值的情況下,應用該頻域隱蔽。
- 如請求項1至30中任一項之方法,其中該音訊信號之該等訊框係使用MDCT來編碼。
- 如請求項1至31中任一項之方法,其中一替換訊框(m)包含例如歸因於所接收資料中之一錯誤而不能在一音訊信號接收器處進行處理的一訊框,或在發送至該音訊信號接收器期間丟失的一訊框,或未在該音訊信號接收器處及時接收的一訊框。
- 如請求項1至32中任一項之方法,其中一非預測頻譜係數係使用例如正負號加擾的一雜訊產生方法或使用來自例如一查找表之一記憶體的一預定義頻譜係數而產 生。
- 一種包含電腦可讀媒體之非暫時性電腦程式產品,該電腦可讀媒體儲存指令,該等指令在於一電腦上執行時進行如請求項1至33中任一項之方法。
- 一種用以取得音訊信號之替換訊框(m)的頻譜係數之裝置,該裝置包含:一偵測器,其組配以基於存在於在一替換訊框(m)前面的訊框之頻譜中的一峰值來偵測一音訊信號之一頻譜之一音調分量;以及一預測器,其經組配以對於該頻譜之該音調分量,預測該替換訊框(m)之該頻譜中的該峰值及其周圍部分之該等頻譜係數;其中對於該頻譜之非音調分量,使用該替換訊框(m)之一非預測頻譜係數或在該替換訊框(m)前面的一訊框之一對應頻譜係數。
- 一種用以取得音訊信號之替換訊框(m)的頻譜係數之裝置,該裝置經組配以根據如請求項1至33中任一項之方法進行操作。
- 一種音訊解碼器,其包含如請求項35或36之裝置。
- 一種音訊接收器,其包含如請求項37之音訊解碼器。
- 一種用以發送音訊信號之系統,該系統包含:一編碼器,其經組配以產生編碼音訊信號;以及如請求項37之解碼器,其經組配以接收該編碼音訊信號且解碼該編碼音訊信號。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13173161 | 2013-06-21 | ||
EP14167072 | 2014-05-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201506908A true TW201506908A (zh) | 2015-02-16 |
TWI562135B TWI562135B (en) | 2016-12-11 |
Family
ID=50980298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103121600A TWI562135B (en) | 2013-06-21 | 2014-06-23 | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, related computer program product, audio decoder, audio receiver and system for transmitting audio signals |
Country Status (18)
Country | Link |
---|---|
US (3) | US9916834B2 (zh) |
EP (1) | EP3011556B1 (zh) |
JP (1) | JP6248190B2 (zh) |
KR (1) | KR101757338B1 (zh) |
CN (2) | CN105408956B (zh) |
AU (1) | AU2014283180B2 (zh) |
BR (1) | BR112015032013B1 (zh) |
CA (1) | CA2915437C (zh) |
ES (1) | ES2633968T3 (zh) |
HK (1) | HK1224075A1 (zh) |
MX (1) | MX352099B (zh) |
MY (1) | MY169132A (zh) |
PL (1) | PL3011556T3 (zh) |
PT (1) | PT3011556T (zh) |
RU (1) | RU2632585C2 (zh) |
SG (1) | SG11201510513WA (zh) |
TW (1) | TWI562135B (zh) |
WO (1) | WO2014202770A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI613644B (zh) * | 2015-03-09 | 2018-02-01 | 弗勞恩霍夫爾協會 | 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、用以解碼經編碼音訊信號之方法、及相關電腦程式 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112015032013B1 (pt) * | 2013-06-21 | 2021-02-23 | Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. | Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio |
CN107004417B (zh) * | 2014-12-09 | 2021-05-07 | 杜比国际公司 | Mdct域错误掩盖 |
TWI576834B (zh) * | 2015-03-02 | 2017-04-01 | 聯詠科技股份有限公司 | 聲頻訊號的雜訊偵測方法與裝置 |
US10504525B2 (en) | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
EP3246923A1 (en) | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
CN106101925B (zh) * | 2016-06-27 | 2020-02-21 | 联想(北京)有限公司 | 一种控制方法及电子设备 |
US11380340B2 (en) | 2016-09-09 | 2022-07-05 | Dts, Inc. | System and method for long term prediction in audio codecs |
RU2652434C2 (ru) * | 2016-10-03 | 2018-04-26 | Виктор Петрович Шилов | Способ приемопередачи дискретных информационных сигналов |
CN106533394B (zh) * | 2016-11-11 | 2019-01-04 | 江西师范大学 | 一种基于自适应滤波器幅频响应的高精度频率估计方法 |
EP3454336B1 (en) * | 2017-09-12 | 2020-11-04 | Dolby Laboratories Licensing Corporation | Packet loss concealment for critically-sampled filter bank-based codecs using multi-sinusoidal detection |
JP6907859B2 (ja) * | 2017-09-25 | 2021-07-21 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
CN108055087B (zh) * | 2017-12-30 | 2024-04-02 | 天津大学 | 利用长肢领航鲸叫声谐波数量进行编码的通信方法及装置 |
US10186247B1 (en) | 2018-03-13 | 2019-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to extract a pitch-independent timbre attribute from a media signal |
WO2020169754A1 (en) * | 2019-02-21 | 2020-08-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods for phase ecu f0 interpolation split and related controller |
CN113129910A (zh) * | 2019-12-31 | 2021-07-16 | 华为技术有限公司 | 音频信号的编解码方法和编解码装置 |
CN113111618B (zh) * | 2021-03-09 | 2022-10-18 | 电子科技大学 | 一种基于改进的经验小波变换的模拟电路故障诊断方法 |
CN113655529B (zh) * | 2021-08-17 | 2022-11-29 | 南京航空航天大学 | 一种针对高采样率的被动磁信号优化提取和检测方法 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2130952A5 (zh) * | 1971-03-26 | 1972-11-10 | Thomson Csf | |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
FR2692091B1 (fr) | 1992-06-03 | 1995-04-14 | France Telecom | Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle. |
JP3328532B2 (ja) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6496797B1 (en) * | 1999-04-01 | 2002-12-17 | Lg Electronics Inc. | Apparatus and method of speech coding and decoding using multiple frames |
US6418408B1 (en) * | 1999-04-05 | 2002-07-09 | Hughes Electronics Corporation | Frequency domain interpolative speech codec system |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
US7447639B2 (en) * | 2001-01-24 | 2008-11-04 | Nokia Corporation | System and method for error concealment in digital audio transmission |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7356748B2 (en) | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
JP4744438B2 (ja) * | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
US8725501B2 (en) * | 2004-07-20 | 2014-05-13 | Panasonic Corporation | Audio decoding device and compensation frame generation method |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
KR100788706B1 (ko) * | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
KR101291193B1 (ko) * | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
US8935158B2 (en) * | 2006-12-13 | 2015-01-13 | Samsung Electronics Co., Ltd. | Apparatus and method for comparing frames using spectral information of audio signal |
CA2690433C (en) * | 2007-06-22 | 2016-01-19 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8489396B2 (en) * | 2007-07-25 | 2013-07-16 | Qnx Software Systems Limited | Noise reduction with integrated tonal noise reduction |
US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
MX2011000382A (es) * | 2008-07-11 | 2011-02-25 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion. |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
CN101521012B (zh) * | 2009-04-08 | 2011-12-28 | 武汉大学 | Mdct域信号能量与相位补偿方法及其装置 |
CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
MX2012004648A (es) * | 2009-10-20 | 2012-05-29 | Fraunhofer Ges Forschung | Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing. |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
CN103493130B (zh) * | 2012-01-20 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 用以利用正弦代换进行音频编码及译码的装置和方法 |
WO2013183977A1 (ko) * | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
CN104718570B (zh) * | 2012-09-13 | 2017-07-18 | Lg电子株式会社 | 帧丢失恢复方法,和音频解码方法以及使用其的设备 |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9478221B2 (en) * | 2013-02-05 | 2016-10-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced audio frame loss concealment |
ES2603266T3 (es) * | 2013-02-13 | 2017-02-24 | Telefonaktiebolaget L M Ericsson (Publ) | Ocultación de errores de trama |
BR112015032013B1 (pt) * | 2013-06-21 | 2021-02-23 | Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. | Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio |
-
2014
- 2014-06-20 BR BR112015032013-9A patent/BR112015032013B1/pt active IP Right Grant
- 2014-06-20 CN CN201480035489.4A patent/CN105408956B/zh active Active
- 2014-06-20 PL PL14731961T patent/PL3011556T3/pl unknown
- 2014-06-20 ES ES14731961.0T patent/ES2633968T3/es active Active
- 2014-06-20 KR KR1020167001006A patent/KR101757338B1/ko active IP Right Grant
- 2014-06-20 MX MX2015017369A patent/MX352099B/es active IP Right Grant
- 2014-06-20 CA CA2915437A patent/CA2915437C/en active Active
- 2014-06-20 SG SG11201510513WA patent/SG11201510513WA/en unknown
- 2014-06-20 AU AU2014283180A patent/AU2014283180B2/en active Active
- 2014-06-20 EP EP14731961.0A patent/EP3011556B1/en active Active
- 2014-06-20 JP JP2016520514A patent/JP6248190B2/ja active Active
- 2014-06-20 RU RU2016101336A patent/RU2632585C2/ru active
- 2014-06-20 CN CN202010135748.8A patent/CN111627451B/zh active Active
- 2014-06-20 PT PT147319610T patent/PT3011556T/pt unknown
- 2014-06-20 MY MYPI2015002991A patent/MY169132A/en unknown
- 2014-06-20 WO PCT/EP2014/063058 patent/WO2014202770A1/en active Application Filing
- 2014-06-23 TW TW103121600A patent/TWI562135B/zh active
-
2015
- 2015-12-21 US US14/977,207 patent/US9916834B2/en active Active
-
2016
- 2016-10-26 HK HK16112303.9A patent/HK1224075A1/zh unknown
-
2017
- 2017-12-15 US US15/844,004 patent/US10475455B2/en active Active
-
2019
- 2019-09-26 US US16/584,645 patent/US11282529B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI613644B (zh) * | 2015-03-09 | 2018-02-01 | 弗勞恩霍夫爾協會 | 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、用以解碼經編碼音訊信號之方法、及相關電腦程式 |
US10600428B2 (en) | 2015-03-09 | 2020-03-24 | Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschug e.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201506908A (zh) | 用以取得對於音訊信號替換訊框的頻譜係數之方法及裝置、音訊解碼器、音訊接收器、以及用以發送音訊信號之系統 | |
US10847166B2 (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
AU2018260843B2 (en) | Audio encoder and decoder | |
KR100979090B1 (ko) | 피치 지연 윤곽부 조절을 사용하여 정보 신호를 코딩하기위한 방법 및 장치 | |
WO2007052612A1 (ja) | ステレオ符号化装置およびステレオ信号予測方法 | |
KR20130126695A (ko) | 오디오 신호 코딩 방법 및 장치 | |
KR20070083856A (ko) | 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법 | |
US9093068B2 (en) | Method and apparatus for processing an audio signal | |
Sperschneider et al. | Delay-less frequency domain packet-loss concealment for tonal audio signals | |
JP5182112B2 (ja) | デコード装置および音声符号化方式推定方法 | |
Nanjundaswamy et al. | Cascaded long term prediction for enhanced compression of polyphonic audio signals |