TWI553629B - 用以在低位元速率下模型化背景雜訊之舒緩雜訊添加技術 - Google Patents
用以在低位元速率下模型化背景雜訊之舒緩雜訊添加技術 Download PDFInfo
- Publication number
- TWI553629B TWI553629B TW102147458A TW102147458A TWI553629B TW I553629 B TWI553629 B TW I553629B TW 102147458 A TW102147458 A TW 102147458A TW 102147458 A TW102147458 A TW 102147458A TW I553629 B TWI553629 B TW I553629B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- noise
- decoder
- bit stream
- audio
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims description 115
- 238000000034 method Methods 0.000 claims description 58
- 230000009467 reduction Effects 0.000 claims description 52
- 230000009471 action Effects 0.000 claims description 42
- 238000001228 spectrum Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 10
- 238000010183 spectrum analysis Methods 0.000 claims description 10
- 239000008186 active pharmaceutical agent Substances 0.000 description 32
- 230000000694 effects Effects 0.000 description 19
- 230000007774 longterm Effects 0.000 description 15
- 230000007246 mechanism Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- LQIAZOCLNBBZQK-UHFFFAOYSA-N 1-(1,2-Diphosphanylethyl)pyrrolidin-2-one Chemical compound PCC(P)N1CCCC1=O LQIAZOCLNBBZQK-UHFFFAOYSA-N 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000000059 patterning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
Description
本發明係有關於用以在低位元速率下模型化背景雜訊之舒緩雜訊添加技術。
本發明係關於音訊信號處理,並且,尤其是關於带噪語音編碼以及音訊信號舒緩雜訊添加技術。
舒緩雜訊產生器一般被使用於音訊信號的不連續發送(DTX),尤其是包含語音之音訊信號。於此一模式中音訊信號首先藉由一聲音活動檢測器(VAD)被分類成作用以及不作用訊框。一VAD範例可被發現於[1]。依據VAD結果,僅作用語音訊框被編碼且以標稱位元速率被發送。在長暫停期間,其中僅背景雜訊呈現,位元速率降低或零值化且背景雜訊系列片段式且參數式被編碼。平均位元速率接著顯著地減低。該雜訊在不作用訊框期間在解碼器側端由一舒緩雜訊產生器(CNG)產生。例如,語音編碼器AMR-WB[2]及ITU G.718[1]具有進行於DTX模式之可能
性。
低位元速率語音及尤其是带噪語音編碼是易於有人造物。語音編碼器通常以一語音產生模式為基礎,其不適於背景雜訊存在情況。因此,編碼效率下降且被解碼音訊信號品質減低。此外,當處理带噪語音時,某些語音編碼特性可能變動。事實上在低位元速率,編碼參數的粗糙量化產生一些隨著時間推移的波動,當在靜態背景雜訊編碼語音時該波動在感知上會惱人。
雜訊減低是用於提高語音的可懂度及改善背景
雜訊存在的通訊之一習知技術。其同時也被採用於語音編碼。例如,G.718編碼器使用雜訊減低技術推導一些編碼參數,諸如語音音調。其同時也具有編碼增強信號以取代原始信號之可能性。比較於被解碼信號中雜訊位準該語音接著更具主導地位。然而,它通常聽起來更惡化或不自然,因噪聲降低可能扭曲語音成分而引起除了編碼失真外之可聽音樂式噪聲人造物。
本發明目的是提供音訊信號處理之改進概念。本發明目的藉由依據請求項1之一解碼器、藉由依據請求項18之一編碼器,藉由依據請求項19之一系統、藉由依據請求項20或21之一方法、藉由依據請求項22之一位元流以及藉由依據請求項15之一電腦程式而達成。
於一個論點中,本發明提供一種解碼器,其被組
態以處理一被編碼音訊位元流,其中該解碼器包含:一位元流解碼器,其被組態以自該位元流推導出一被解碼音訊信號,其中該被解碼音訊信號包含至少一個被解碼訊框;一雜訊估算裝置,其被組態以產生包含該被解碼音訊信號中雜訊之位準及/或頻譜形狀估算之一雜訊估算信號;一舒緩雜訊產生裝置,其被組態以自該雜訊估算信號推導出一舒緩雜訊信號;以及一組合器,其被組態以組合該被解碼音訊信號以及該舒緩雜訊信號之被解碼訊框以得到一音訊輸出信號。
位元流解碼器可以是一裝置或一電腦程式,其能夠解碼一音訊位元流,其是包含音訊資訊之數位資料串流。解碼處理程序產生一數位被解碼音訊信號,其被饋送至一A/D轉換器以產生一類比音訊信號,其接著被饋送至一擴音機,以便產生一可聽見的信號。
被解碼音訊信號被分割成為所謂之訊框,其中這些訊框各包含關於某些時間區間之音訊資訊。此訊框可以分類成為作用訊框以及不作用訊框,其中一作用訊框是一訊框,其包含音訊資訊之所需成分,例如語音或音樂,而一不作用訊框是一訊框,其不包含音訊資訊之任何所需成分。不作用訊框通常發生在暫停期間,其中沒有呈現所需成分,例如音樂或語音。因此,不作用訊框通常包含單一背景雜訊。
於音訊信號的不連續發送(DTX),僅被解碼音
訊信號之作用訊框解碼位元流被得到,因在不作用訊框期間該編碼器不發送音訊信號在位元流之內。
於音訊信號之非不連續發送(非DTX),作用訊框以及不作用訊框藉由解碼位元流被得到。
藉由位元流解碼器解碼位元流得到之訊框稱為被解碼訊框。
雜訊估算裝置被組態以產生一雜訊估算信號,其包含被解碼音訊信號中雜訊之位準及/或頻譜形狀之一估算。進一步地,舒緩雜訊產生裝置被組態以自雜訊估算信號推導出一舒緩雜訊信號。該雜訊估算信號可以是一信號,其包含以參數形式含於被解碼音訊信號中關於雜訊特性之資訊。舒緩雜訊信號是一人造音訊信號,其對應至含於該被解碼音訊信號之雜訊。這些特點允許該舒緩雜訊聽起來類似於實際背景雜訊而不需要關於背景雜訊之任何側資訊於位元流。
組合器被組態以組合被解碼音訊信號以及舒緩雜訊信號之被解碼訊框以便得到一音訊輸出信號。因而,音訊輸出信號包含被解碼訊框,其包含人造雜訊。被解碼訊框之人造雜訊允許遮罩音訊輸出信號之人造物,尤其是當該位元流以低位元速率被發送時。其平緩通常察覺之浮動並且同時遮罩主要的編碼人造物。
相對於先前技術,本發明應用添加人造舒緩雜訊至被解碼訊框之原理。本發明概念可以被應用於DTX及非DTX模式兩者。
本發明提供一種強化以低位元速率被編碼並且被發送之带噪語音品質之方法。以低位元速率,带噪語音,亦即,被記錄有背景雜訊之語音,之編碼通常不如乾淨語音編碼一般有效率。被解碼之合成者通常易於有人造物。兩種不同類的來源,雜訊以及語音,無法藉由依賴一單一來源模式的編碼機構有效地被編碼。本發明提供在解碼器側端用以模式化並且合成背景雜訊之概念並且只需要非常少或沒有側資訊。這藉由在解碼器側端估算背景雜訊之位準及頻譜形狀、以及藉由人造產生一舒緩雜訊而達成。所產生雜訊與被解碼音訊信號組合並且允許遮罩編碼人造物。
進一步地,該概念可與被應用在編碼器側端之一雜訊減低機構被組合。雜訊減低提高信號雜訊比(SNR)位準,並且改進依序音訊編碼的性能。被解碼音訊信號中雜訊缺失的數量接著藉由在解碼器側端之舒緩雜訊被補償。但是,其通常聽起來更惡化或較不自然,因雜訊減低可能扭曲音訊成分並且導致除了編碼人造物之外的可聽見音樂式雜訊人造物。本發明之一個論點是藉由在解碼器側端添加一舒緩雜訊而遮罩此等不悅失真。當使用一雜訊減低機構時,舒緩雜訊之添加不降低SNR。此外,舒緩雜訊抵消一般雜訊減低技術的大部份惱人音樂式雜訊。
於本發明較佳實施例中,該被解碼訊框是一作用訊框。這特點延伸舒緩雜訊添加原理至被解碼作用訊框。
於本發明較佳實施例中,被解碼訊框是一作用訊框。這特點延伸舒緩雜訊添加原理至被解碼不作用訊框。
於本發明較佳實施例中,該雜訊估算裝置包含被組態以產生包含該被解碼音訊信號中雜訊之位準及/或頻譜形狀之一分析信號之一頻譜分析裝置以及被組態以依該分析信號為基礎而產生該雜訊估算信號之一雜訊估算產生裝置。
於本發明較佳實施例中,該舒緩雜訊產生裝置包含被組態以依該雜訊估算信號為基礎而產生一頻率域舒緩雜訊信號之一雜訊產生器以及被組態以依該頻率域舒緩雜訊信號為基礎而產生該舒緩雜訊信號之一頻譜合成器。
於本發明較佳實施例中,該解碼器包含被組態以交互地切換該解碼器至一第一操作模式或至一第二操作模式之一切換裝置,其中於該第一操作模式中該舒緩雜訊信號被饋送至該組合器,而於該第二操作模式中該舒緩雜訊信號不被饋送至該組合器。這些特點允許於不需要的情況中停止使用人造舒緩雜訊。
於本發明較佳實施例中,該解碼器包含被組態以自動地控制該切換裝置之一控制裝置,其中該控制裝置包含一雜訊檢測器並且被組態以取決於該被解碼音訊信號之一信號雜訊比而控制該切換裝置,其中在低信號雜訊比情況之下該解碼器被切換至該第一操作模式並且在高信號雜訊比情況之下該解碼器被切換至該第二操作模式。藉由
這些特點,舒緩雜訊只在带噪語音情節中被觸發,亦即,不是在乾淨語音或乾淨音樂情況。為了在低信號雜訊比情況以及高信號雜訊比情況之間區別,對於信號雜訊比之一臨限可以被界定及被使用。
於本發明較佳實施例中,該控制裝置包含被組態以接收含於對應至被解碼音訊信號之信號雜訊比的位元流之側資訊之一側資訊接收器,並且被組態以產生一雜訊檢測信號,其中該雜訊檢測器取決於該雜訊檢測信號而切換該切換裝置。這些特點允許藉由產生及/或處理所接收位元流之外部裝置完成的信號分析為基礎而控制切換裝置。該外部裝置可以是產生位元流之一編碼器。
於本發明較佳實施例中,對應至該被解碼音訊信號之信號雜訊比的側資訊由該位元流中至少一個專用位元所構成。一專用位元大體上是一種位元,其包含,單獨或與其他的專用位元一起,被界定資訊。此處,該專用位元指示,信號雜訊比是在一預定臨限之上或之下。
於本發明較佳實施例中,該控制裝置包含被組態以決定該被解碼音訊信號之一所需信號的能量之一所需信號能量估算器、被組態以決定該被解碼音訊信號之雜訊的能量之一雜訊能量估算器、以及被組態以依該所需信號之能量為基礎並且以該雜訊之能量為基礎而決定該被解碼音訊信號之信號雜訊比之一信號雜訊比估算器,其中該切換裝置取決於利用控制裝置所決定之信號雜訊比而被切換。於此情況中,位元流中是不需側資訊。因所需信號能
量通常超出被解碼信號之雜訊能量,被解碼音訊信號總能量,包含所需信號能量以及雜訊能量,給予被解碼音訊信號之所需信號能量之粗略估算。因此,該信號雜訊比可以利用被解碼音訊信號總能量除以被解碼信號雜訊能量之近似量被計算。
於本發明較佳實施例中,該位元流包含作用訊框以及不作用訊框,其中該控制裝置被組態以決定在作用訊框期間該被解碼音訊信號之所需信號的能量並且決定在不作用訊框期間該被解碼音訊信號之雜訊的能量。藉由這點,估算信號雜訊比之高精確度可以容易地達成。
於本發明較佳實施例中,該位元流包含作用訊框以及不作用訊框,其中該解碼器包含被組態以依該位元流中指示目前訊框是作用或不作用之側資訊為基礎而在作用訊框以及不作用訊框之間區別之一側資訊接收器。藉由這特點,作用訊框或不作用訊框可以分別地被辨識而不需計算力。
於本發明較佳實施例中,指示目前訊框是作用或不作用的側資訊由該位元流BS中至少一個專用位元所構成。
於本發明較佳實施例中,該控制裝置被組態以依該分析信號為基礎而決定該被解碼音訊信號之所需信號的能量。於此情況中,分析信號,其通常需針對雜訊估算用途被計算,可以再使用,因而複雜性可以被減低。
於本發明較佳實施例中,該控制裝置被組態以
依該雜訊估算信號為基礎而決定該被解碼音訊信號之雜訊的能量。於此一實施例,雜訊估算信號,其通常需針對舒緩雜訊產生用途被計算,可以再使用,因而複雜性可以進一步被減低。
於本發明較佳實施例中,該舒緩雜訊產生裝置被組態以依一目標舒緩雜訊位準信號為基礎而產生該舒緩雜訊信號。所添加舒緩雜訊位準應該受限制以維持可懂度以及品質。這可以藉由調整使用指示一預定目標雜訊位準之一目標雜訊信號之舒緩雜訊被達成。
於本發明較佳實施例中,該目標舒緩雜訊位準信號取決於該位元流。一般,被解碼音訊信號展示比原始輸入信號較高的信號雜訊比,尤其是在其中編碼人造物最嚴重之低位元速率。這語音編碼雜訊位準之衰減是來自來源模式範例,其預期具有語音作為輸入。否則,該來源模式編碼是完全不適當並且將不能夠重現非語音成分之整體能量。因此,該目標舒緩雜訊位準信號可以取決於位元速率而被調整以粗略地補償藉由編碼程序固有地引介之雜訊衰減。
於本發明較佳實施例中,該目標舒緩雜訊位準信號取決於藉由被應用至該位元流之一雜訊減低方法所導致之雜訊衰減位準而被調整。藉由這些特點,藉由一編碼器中之一雜訊減低模組導致之雜訊衰減可以被補償。
於本發明較佳實施例中,隨機雜訊w(k)之頻率域舒緩雜訊信號之能量,對於各頻帶k,取決於該目標舒
緩雜訊位準信號,其指示一目標舒緩雜訊位準g tar,而被調整如E W(k)=max{(g tar-1)(k);0},其中(k)指示在頻帶k之被解碼音訊信號之雜訊的能量估算,如藉由雜訊估算產生裝置所傳送。藉由這些特點,輸出信號之可懂度及品質可以被增強。
於本發明較佳實施例中,其中該解碼器包含一進一步的位元流解碼器,其中該位元流解碼器以及該進一步的位元流解碼器是不同的型式,其中該解碼器包含一開關,該開關被組態以饋送來自該位元流解碼器之被解碼信號或來自該進一步的位元流解碼器之被解碼信號至該雜訊估算裝置以及至該組合器。因當使用位元流解碼器時以及當使用進一步的位元流解碼器時舒緩雜訊添加完成,當在位元流解碼器及進一步的位元流解碼器之間切換時轉移人造物可以最小化。例如,位元流解碼器可以是一代數式數碼激勵線性預測(ACELP)位元流解碼器,因而進一步的位元流解碼器可以是一轉換-為主核心(TCX)位元流解碼器。
本發明進一步地提供一種音訊信號處理編碼器,其被組態以產生一音訊位元流,其中該編碼器包含:一位元流編碼器,其被組態以產生對應至一音訊輸入信號之一被編碼音訊信號並且自該被編碼音訊信號推導出該位元流;一信號分析器,其具有被組態以依藉由所需信號能量估算器決定之該音訊輸入信號之一所需信號的能量為基礎以及藉由雜訊能量估算器決定之該音訊輸入信號之一雜訊
的能量為基礎而決定該音訊輸入信號之信號雜訊比之信號雜訊比估算器;一雜訊減低裝置,其被組態以產生一雜訊減低音訊信號;以及一切換裝置,其被組態以取決於該音訊輸入信號之被決定信號雜訊比,而饋送音訊輸入信號或雜訊減低音訊信號至該位元流編碼器以供用於編碼該等分別的信號,其中該位元流編碼器被組態以在該位元流之內發送一側資訊,其指示該音訊輸入信號或該雜訊減低音訊信號被編碼。
位元流編碼器可以是能夠編碼一音訊信號之一裝置或一電腦程式,該音訊信號是包含音訊資訊之一數位資料信號。該編碼處理程序產生一數位位元流,其可在一數位資料鏈路之上被發送至在遠處位置之一解碼器。
音訊輸入信號藉由位元流編碼器直接地被編碼。該位元流編碼器可以是一語音編碼器或在一語音編碼器ACELP及一轉換-為主音訊編碼器TCX之間切換的一低延遲機構。該位元流編碼器是負責任編碼音訊輸入信號並且產生解碼音訊信號所需要的位元流。平行地,輸入信號藉由稱為信號分析器之任何模組被分析。於一較佳實施例中,該信號分析是相同於G.718所使用者。其包含一頻譜分析裝置,隨後接著雜訊估算產生裝置。原始信號及估算雜訊兩者的頻譜輸入於雜訊減低模組。該雜訊減低技術在頻率域衰減背景雜訊位準。減少數量由目標衰減位準所給予。增強之時間域信號(雜訊減低音訊信號)在頻譜合成之
後被產生。該信號被使用以導出一些特點,類似語調穩定性,其接著利用VAD被分析以在作用及不作用訊框之間區別。該分類結果可進一步地被編碼器模組使用。於一較佳實施例,一特定編碼模式被使用以處理不作用訊框。以這方式,解碼器可自位元流導出VAD旗標而不需要一專用位元。
為避免無雜訊情況(乾淨語音或乾淨音樂)中不必要的失真,雜訊減低僅被應用於带噪語音情況且此外被旁通。在带噪及無雜訊信號之間的區分藉由估算雜訊及所需信號(語音或音樂)的長期能量被達成。該長期能量藉由一階自回歸過濾輸入訊框能量(在作用訊框期間)或使用雜訊估算模組輸出(在不作用訊框期間)被計算。以此方式一信號雜訊比估算可被計算,其被界定為語音或音樂長期能量對於雜訊長期能量之比率。如果信號雜訊比是在一預定臨限之下,則該訊框被考慮為带噪語音否則其被分類為乾淨語音。因位元流編碼器被組態以在位元流之內發送側資訊,其指示音訊輸入信號或雜訊減低音訊信號是否被編碼,該解碼器可以自動地調整目標舒緩雜訊位準信號至編碼器操作模式。
本發明較佳實施例中,在作用訊框期間,僅長期語音/音樂能量估算被更動。在不作用訊框期間,僅雜訊能量估算被更動。
本發明進一步地提供一種系統,其包括一音訊信號處理解碼器以及一音訊信號處理編碼器,其中該解碼
器是依據申請專利之發明被設計及/或該編碼器是依據申請專利之發明被設計。
於本發明另一論點中,提供一種解碼一音訊位元流之方法,其中該方法包含:從該位元流推導出一被解碼音訊信號,其中該被解碼音訊信號包含至少一個被解碼訊框;產生包含該被解碼音訊信號中雜訊之位準及/或頻譜形狀的估算之一雜訊估算信號;從該雜訊估算信號推導出一舒緩雜訊信號;以及組合該被解碼音訊信號以及該舒緩雜訊信號之被解碼訊框以得到一音訊輸出信號。
本發明進一步地提供一種用以產生一音訊位元流之音訊信號編碼方法,其中該方法包含:依一音訊輸入信號之一所需信號的決定能量以及該音訊輸入信號之一雜訊的決定能量為基礎而決定該音訊輸入信號之信號雜訊比;產生一雜訊減低音訊信號;產生對應至該音訊輸入信號之一被編碼音訊信號,其中,取決於該音訊輸入信號之被決定信號雜訊比,該音訊輸入信號或該雜訊減低音訊信號被編碼;從該被編碼音訊信號推導出該位元流;以及在該位元流之內發送一側資訊,其指示該音訊輸入信號或該雜訊減低音訊信號被編碼。
本發明進一步地提供一種依據上述方法被產生
之位元流。該申請專利位元流包含側資訊,其指示該音訊輸入信號或該雜訊減低音訊信號被編碼。
一進一步的論點,本發明提供一種電腦程式,當執行於一電腦或一處理器時,其進行本發明之方法。
1‧‧‧解碼器
2‧‧‧位元流解碼器
3‧‧‧雜訊估算裝置
4‧‧‧舒緩雜訊產生裝置
5‧‧‧組合器
6‧‧‧頻譜分析裝置
7‧‧‧雜訊估算產生裝置
8‧‧‧雜訊產生器
9‧‧‧頻譜合成器
10‧‧‧切換裝置
11‧‧‧控制裝置
12‧‧‧雜訊檢測器
13‧‧‧側資訊接收器
14‧‧‧信號能量估算器
15‧‧‧雜訊能量估算器
16‧‧‧信號雜訊比估算器
17‧‧‧側資訊接收器
17a‧‧‧開關
18‧‧‧編碼器
19‧‧‧信號分析器
20‧‧‧位元流編碼器
21‧‧‧信號編碼器
22‧‧‧位元流產生器
23‧‧‧信號分析器
24‧‧‧雜訊估算裝置
25‧‧‧頻譜分析裝置
26‧‧‧雜訊估算產生裝置
27‧‧‧雜訊減低模組
28‧‧‧頻譜合成綜合裝置
29‧‧‧信號活動檢測器
30‧‧‧信號分析器
31‧‧‧信號能量估算器
32‧‧‧雜訊能量估算器
33‧‧‧信號雜訊比估算器
34‧‧‧雜訊檢測器
35‧‧‧開關
36‧‧‧信號活動檢測器
37‧‧‧開關
BS‧‧‧編碼音訊位元流
DS‧‧‧解碼音訊信號
NE‧‧‧雜訊估算信號
CN‧‧‧舒緩雜訊信號
OS‧‧‧音訊輸出信號
FD‧‧‧頻率域舒緩雜訊信號
ND‧‧‧雜訊檢測信號
TNL‧‧‧目標舒緩雜訊位準
IS‧‧‧輸入信號
ES‧‧‧編碼信號
OW‧‧‧信號能量估算器輸出信號
ON‧‧‧雜訊能量估算器輸出信號
SI‧‧‧輸入信號頻譜信號
NI‧‧‧輸入信號雜訊估算信號
TAS‧‧‧目標衰減信號
FS‧‧‧增強頻率域信號
TS‧‧‧雜訊減低音訊信號
AD‧‧‧活動檢測器信號
WE‧‧‧所需信號能量信號
EN‧‧‧雜訊能量信號
RS‧‧‧信號雜訊比信號
NF‧‧‧雜訊旗標
SA‧‧‧信號活動信號
FF‧‧‧訊框格式
SV‧‧‧信號向量
AF‧‧‧活動旗標
NF‧‧‧雜訊旗標信號
PB‧‧‧填充位元
本發明較佳實施例依序地參考附圖被討論,於其中:圖1展示依據本發明解碼器之第一實施例;圖2展示依據本發明解碼器之第二實施例;圖3展示依據先前技術之編碼器;圖4展示依據本發明編碼器之第一實施例;圖5展示依據本發明編碼器之第二實施例;以及圖6展示依據本發明位元流訊框格式之一實施例。
圖1展示依據本發明之一解碼器1的第一實施例。該解碼器1被組態以處理一被編碼音訊位元流BS,其中該解碼器1包含:一位元流解碼器2,其被組態以自該位元流BS推導出一被解碼音訊信號DS,其中該被解碼音訊信號DS包含至少一個被解碼訊框;一雜訊估算裝置3,其被組態以產生包含該被解碼音訊信號DS中雜訊N之位準及/或頻譜形狀估算之一雜訊估算信號NE;
一舒緩雜訊產生裝置4,其被組態以自該雜訊估算信號NE推導出一舒緩雜訊信號CN;以及一組合器5,其被組態以組合該被解碼音訊信號DS以及該舒緩雜訊信號CN之被解碼訊框以得到一音訊輸出信號OS。
位元流解碼器2可以是能夠解碼一音訊位元流BS之一裝置或一電腦程式,其是包含音訊資訊之一數位資料串流。該解碼處理程序產生一數位被解碼音訊信號DS,其被饋送至一A/D轉換器以產生一類比音訊信號,其接著被饋送至一擴音機,以便產生一可聽見的信號。
被解碼音訊信號DS包含所謂之訊框,其中這些訊框各包含參考至某些時間之音訊資訊。此等訊框可以被分類成為作用訊框及不作用訊框,其中一作用訊框是一訊框,其包含音訊資訊之所需成分WS,同時也被稱為所需信號WS,例如語音或音樂,而一不作用訊框是一訊框,其不包含音訊資訊之任何所需成分。不作用訊框通常發生在暫停期間,其中沒有呈現所需成分,例如音樂或語音。因此,不作用訊框通常包含單一背景雜訊N。
雜訊估算裝置3被組態以產生包含該被解碼音訊信號DS中雜訊之位準及/或頻譜形狀估算之一雜訊估算信號NE。進一步地,舒緩雜訊產生裝置4被組態以自該雜訊估算信號NE推導出一舒緩雜訊信號CN。雜訊估算信號NE可以是一信號,其包含關於以參數形式含於被解碼音訊信號DS中雜訊N之特性資訊。該舒緩雜訊信號CN是一人造
音訊信號,其對應至含於被解碼音訊信號DS之雜訊N。這些特點允許舒緩雜訊CN聽起來類似於實際背景雜訊N而不需要於位元流BS中有關於背景雜訊N之任何側資訊。
組合器5被組態以組合該被解碼音訊信號DS以及該舒緩雜訊信號CN之被解碼訊框以得到一音訊輸出信號OS。因而音訊輸出信號OS包含被解碼訊框,其包含人造雜訊CN。被解碼訊框之人造雜訊CN允許遮罩音訊輸出信號OS之人造物,尤其是當位元流BS以低位元速率被發送時。
相對於先前技術,本發明應用添加人造舒緩雜訊至被解碼訊框之原理。本發明概念可以被應用於DTX及非DTX模式兩者。
本發明提供一種強化以低位元速率被編碼並且被發送之带噪語音品質之方法。以低位元速率,带噪語音,亦即,被記錄有背景雜訊N之語音,之編碼通常不如乾淨語音WS編碼一般有效率。被解碼之合成者通常易於有人造物。兩種不同類的來源,雜訊N以及語音WS,無法藉由依賴一單一來源模式的編碼機構有效地被編碼。本發明提供在解碼器側端用以模式化並且合成背景雜訊N之概念並且只需要非常少或沒有側資訊。這藉由在解碼器側端估算背景雜訊N之位準及頻譜形狀,以及藉由人造產生一舒緩雜訊CN而達成。所產生雜訊CN與被解碼音訊信號DS組合並且允許遮罩在被解碼訊框期間之編碼人造物。
進一步地,該概念可與被應用在編碼器側端之
一雜訊減低機構被組合。雜訊減低提高信號雜訊比(SNR)位準,並且改進依序音訊編碼的性能。被解碼音訊信號DS中雜訊缺失的數量接著藉由在解碼器側端之舒緩雜訊CN被補償。但是,其通常聽起來更惡化或較不自然,因雜訊減低可能扭曲音訊成分並且導致除了編碼人造物之外的可聽見音樂式雜訊人造物。本發明之一個論點是藉由在解碼器側端添加一舒緩雜訊CN而遮罩此等不悅失真。當使用一雜訊減低機構時,舒緩雜訊之添加不降低SNR。此外,舒緩雜訊抵消一般雜訊減低技術的大部份惱人音樂式雜訊。
於本發明較佳實施例中,該被解碼訊框是一作用訊框。這特點延伸舒緩雜訊添加原理至被解碼作用訊框。
於本發明較佳實施例中,被解碼訊框是一作用訊框。這特點延伸舒緩雜訊添加原理至被解碼不作用訊框。
於本發明較佳實施例中,該雜訊估算裝置4包含被組態以產生包含該被解碼音訊信號DS中雜訊之位準及/或頻譜形狀之一分析信號之一頻譜分析裝置6以及被組態以依該分析信號AS為基礎而產生該雜訊估算信號NE之一雜訊估算產生裝置7。
於本發明較佳實施例中,該舒緩雜訊產生裝置包含被組態以依該雜訊估算信號NE為基礎而產生一頻率域舒緩雜訊信號FD之一雜訊產生器8以及被組態以依該頻
率域舒緩雜訊信號FD為基礎而產生該舒緩雜訊信號CN之一頻譜合成器9。
於本發明較佳實施例中,該解碼器1包含被組態以交互地切換該解碼器1至一第一操作模式或至一第二操作模式之一切換裝置,其中於該第一操作模式中該舒緩雜訊信號CN被饋送至該組合器,而於該第二操作模式中該舒緩雜訊信號CN不被饋送至該組合器。這些特點允許於不需要的情況中停止使用人造舒緩雜訊CN。
於本發明較佳實施例中,該解碼器1包含被組態以自動地控制該切換裝置10之一控制裝置11,其中該控制裝置10包含一雜訊檢測器12並且被組態以取決於該被解碼音訊信號DS之一信號雜訊比而控制該切換裝置10,其中在低信號雜訊比情況之下該解碼器被切換至該第一操作模式並且在高信號雜訊比情況之下該解碼器被切換至該第二操作模式。藉由這些特點,舒緩雜訊CN只在带噪語音情節中被觸發,亦即,不是在乾淨語音或乾淨音樂情況。為了在低信號雜訊比情況以及高信號雜訊比情況之間區別,對於信號雜訊比之一臨限可以被界定及被使用。
於本發明較佳實施例中,該控制裝置11包含被組態以接收含於對應至被解碼音訊信號DS之信號雜訊比的位元流BS之側資訊之一側資訊接收器13,並且被組態以產生一雜訊檢測信號ND,其中該雜訊檢測器取決於該雜訊檢測信號ND而切換該切換裝置11。這些特點允許藉由產生及/或處理所接收位元流BS之外部裝置完成的信號分析
為基礎而控制切換裝置10。該外部裝置可以是產生位元流BS之一編碼器。
於本發明較佳實施例中,對應至該被解碼音訊信號DS之信號雜訊比的側資訊由該位元流BS中至少一個專用位元所構成。一專用位元大體上是一種位元,其包含,單獨或與其他的專用位元一起,被界定資訊。此處,該專用位元指示,信號雜訊比是在一預定臨限之上或之下。
於本發明較佳實施例中,該舒緩雜訊產生裝置4被組態以依一目標舒緩雜訊位準信號TNL為基礎而產生該舒緩雜訊信號CN。所添加舒緩雜訊CN位準應該受限制以維持可懂度以及品質。這可以藉由調整使用指示一預定目標雜訊位準之一目標雜訊信號TNL之舒緩雜訊CN被達成。
於本發明較佳實施例中,該目標舒緩雜訊位準信號TNL取決於該位元流BS之位元速率而被調整。一般,被解碼音訊信號DS展示比原始輸入信號較高的信號雜訊比,尤其是在其中編碼人造物最嚴重之低位元速率。這語音編碼雜訊位準之衰減是來自來源模式範例,其預期具有語音作為輸入。否則,該來源模式編碼是完全不適當並且將不能夠重現非語音成分之整體能量。因此,該目標舒緩雜訊位準信號TNL可以取決於位元速率而被調整以粗略地補償藉由編碼程序固有地引介之雜訊衰減。
於本發明較佳實施例中,該目標舒緩雜訊位準信號TNL取決於藉由被應用至該位元流BS之一雜訊減低方
法所導致之雜訊衰減位準而被調整。藉由這些特點,藉由一編碼器中之一雜訊減低模組導致之雜訊衰減可以被補償。
於本發明較佳實施例中,隨機雜訊w(k)之頻率域舒緩雜訊信號(FD)之頻帶k的能量E w(k),對於各頻帶k,取決於該目標舒緩雜訊位準信號TNL,其指示一目標舒緩雜訊位準g tar,而被調整如E W (k)=max{(g tar-1)(k);0},其中(k)指示在頻帶k之被解碼音訊信號DS之雜訊N的能量估算,如藉由雜訊估算產生裝置7所傳送。藉由這些特點,輸出信號OS之可懂度及品質可以被增強。
圖2展示依據本發明之解碼器1的第二實施例。該解碼器1之第二實施例以第一實施例之解碼器1為基礎。下面說明中僅異於第一實施例之不同處被討論及說明。
於本發明較佳實施例中,該控制裝置包含被組態以決定該被解碼音訊信號DS之一所需信號WS的能量之一所需信號能量估算器14、被組態以決定該被解碼音訊信號DS之雜訊N的能量之一雜訊能量估算器15、以及被組態以依該所需信號WS之能量為基礎並且以該雜訊N之能量為基礎而決定該被解碼音訊信號DS之信號雜訊比之一信號雜訊比估算器16,其中該切換裝置10取決於利用控制裝置11所決定之信號雜訊比而被切換。於此情況中,位元流中是不需關於信號雜訊比之側資訊。因此,第一實施例之側資訊接收器13也不是必需的。
於本發明較佳實施例中,該位元流BS包含作用訊框以及不作用訊框,其中該控制裝置11被組態以決定在作用訊框期間該被解碼音訊信號DS之所需信號WS的能量並且決定在不作用訊框期間該被解碼音訊信號DS之雜訊N的能量。藉由這點,估算信號雜訊比之高精確度可以容易地達成。
於本發明較佳實施例中,該位元流BS包含作用訊框以及不作用訊框,其中該解碼器1包含被組態以依該位元流(BS)中指示目前訊框是作用或不作用之側資訊為基礎而在作用訊框以及不作用訊框之間區別之一側資訊接收器17。藉由這特點,作用訊框或不作用訊框可以分別地被辨識而不需計算力。
於本發明之較佳實施例中,側資訊接收器17可以被組態以控制一開關17a,其交互地饋送所需信號能量估算器14之一輸出信號OW或雜訊能量估算器15之一輸出信號ON至信號雜訊比估算器16,其中所需信號能量估算器14之輸出信號OW在作用訊框期間被饋送至信號雜訊比估算器16並且其中雜訊能量估算器15之輸出信號ON在不作用訊框期間被饋送至信號雜訊比估算器16。藉由利用這些特點,信號雜訊比可以用容易且精確方式被計算。
於本發明較佳實施例中,該控制裝置11被組態以依該分析信號AS為基礎而決定該被解碼音訊信號之所需信號的能量。於此情況中,分析信號AS,其通常需針對雜訊估算用途被計算,可以再使用,因而複雜性可以被減
低。
於本發明較佳實施例中,該控制裝置11被組態以依該雜訊估算信號NE為基礎而決定該被解碼音訊信號DS之雜訊N。於此一實施例,雜訊估算信號NE,其通常需針對舒緩雜訊產生用途被計算,可以再使用,因而複雜性可以進一步被減低。
於本發明較佳實施例中,解碼器1包含一進一步的位元流解碼器(未被展示於圖中),其中該位元流解碼器2以及該進一步的位元流解碼器是不同的型式,其中該解碼器1包含一開關(未被展示於圖中),該開關被組態以饋送來自該位元流解碼器2之被解碼信號DS或來自該進一步的位元流解碼器之被解碼信號至該雜訊估算裝置3以及至該組合器5。因當使用位元流解碼器2時以及當使用進一步的位元流解碼器時舒緩雜訊添加完成,當在位元流解碼器2及進一步的位元流解碼器之間切換時轉移人造物可以最小化。例如,位元流解碼器2可以是一代數式數碼激勵線性預測(ACELP)位元流解碼器,因而進一步的位元流解碼器可以是一轉換-為主核心(TCX)位元流解碼器。
本發明解碼器1被說明於圖1及2,其中舒緩雜訊添加是盲目地於頻率域完成。為了具有一舒緩雜訊CN,其類似於實際背景雜訊N,一雜訊估算裝置3被使用於解碼器1以決定背景雜訊之位準及頻譜形狀N,而不需要任何側資訊。
舒緩雜訊產生裝置4只在带噪語音情節中被觸
發,亦即,不是在乾淨語音或乾淨音樂情況。區別可以依編碼器中進行之檢測為基礎。於此情況中,該決定應該使用一專用位元被發送。於一較佳實施例中,相對地,一雜訊估算產生裝置7被應用,其相似於被使用於編碼器中之雜訊估算裝置。其包含藉由取決於VAD決定而分別地調適雜訊N能量或所需信號WS能量,例如語音及/或音樂,的長期估算而估算長期信號雜訊比。後者可以直接地自ACELP及TCX模式之指標而導出。實際上,當信號是不作用語音/音樂訊框時,亦即,僅具背景雜訊之訊框,TCX及ACELP可分別地以所謂之TCX-NA及ACELP-NA特定模式進行。所有的其他ACELP及TCX模式關聯於作用訊框。因此,位元流中專用VAD位元之存在可被避免。
所添加舒緩雜訊位準應該受限制以維持可懂度以及品質。該舒緩雜訊因此被調整以達到一預定目標雜訊位準。如果g tar指示在舒緩雜訊添加之後的目標雜訊放大位準,對於各頻率k之隨機雜訊w(k)之能量E W被調整如
其中(k)指示在頻帶k呈現於被解碼音訊輸出之雜訊能量估算,如藉由雜訊估算模組所傳送。
一般,被解碼音訊信號DS展示原始輸入信號較高的信號雜訊比,尤其是在其中編碼人造物最嚴重之低位元速率。這語音編碼雜訊位準之衰減是來自來源模式範例,其預期具有語音作為輸入。否則,該來源模式編碼是完全不適當並且將不能夠重現非語音成分之整體能量。因
此,對於使用展示於圖3中編碼器之本發明第一論點,該目標舒緩雜訊位準信號可以取決於位元速率而被調整以粗略地補償藉由編碼程序固有地引介之雜訊衰減。
對於使用編碼器之本發明第二論點展示於圖4及5,目標舒緩雜訊位準g tar,此外地,說明藉由編碼器中雜訊減低模組導致之雜訊衰減。
進一步地,此處說明之舒緩雜訊添加藉由均勻地添加一舒緩雜訊於所有的訊框而允許平緩在一個編碼型式(例如)至另一個(例如TCX)之間的轉移人造物。
圖3展示依據先前技術之一編碼器,其可被使用以組合於圖1及2展示之解碼器。
音訊輸入信號IS藉由位元流編碼器20直接地被編碼。該位元流編碼器20可以是一語音編碼器或在一語音編碼器ACELP及一轉換-為主音訊編碼器TCX之間切換的一低延遲機構。該位元流編碼器20包含用以編碼信號IS之一信號編碼器21及用以產生在解碼器1產生被解碼信號DS所需要之位元流BS的位元流產生器22。平行地,輸入信號IS藉由稱為信號分析器23之任何模組被分析,其包含一雜訊估算裝置24。於一較佳實施例中,該雜訊估算裝置24是相同於G.718所使用者。其包含一頻譜分析裝置25,隨後接著雜訊估算產生裝置26。原始信號IS之頻譜SI及估算雜訊之頻譜NI輸入於雜訊減低模組27。該雜訊減低模組27衰減在增強頻率域信號FS之背景雜訊位準。減少數量由目標衰減位準信號TAS所給予。增強之時間域信號(雜訊減低音
訊信號)TS在藉由頻譜合成裝置28之頻譜合成之後被產生。該信號TS被使用以導出一些特點,類似語調穩定性,其接著利用信號活動檢測器29被分析以在作用及不作用訊框之間區別。該分類結果可進一步地被編碼器模組18使用。於一較佳實施例,一特定編碼模式被使用以處理不作用訊框。以這方式,解碼器可自位元流導出信號活動旗標(VAD旗標)而不需要一專用位元。
圖4展示依據本發明編碼器18之第一實施例。展示於圖4中的編碼器18是以被展示於圖3中之編碼器18為基礎。
圖4中被展示之編碼器18被組態以產生一音訊位元流BS,其中該編碼器18包含:一位元流編碼器20,其被組態以產生對應至一音訊輸入信號IS之一被編碼音訊信號ES並且自該被編碼音訊信號ES推導出該位元流BS;一信號分析器19,其具有被組態以依藉由所需信號能量估算器31決定之該音訊輸入信號IS之一所需信號WS的能量為基礎以及藉由雜訊能量估算器32決定之該音訊輸入信號IS之一雜訊N的能量為基礎而決定該音訊輸入信號IS之信號雜訊比之信號雜訊比估算器33;一雜訊減低裝置27,28,其被組態以產生一雜訊減低音訊信號TS;以及一切換裝置35,其被組態以取決於該音訊輸入信號IS之被決定信號雜訊比,而饋送音訊輸入信號IS或雜訊減低
音訊信號TS至該位元流編碼器20以供用於編碼該等分別的信號IS,TS,其中該位元流編碼器20被組態以在該位元流BS之內發送一側資訊NF,其指示該音訊輸入信號IS或該雜訊減低音訊信號TS被編碼。
位元流編碼器20可以是能夠編碼一音訊信號之一裝置或一電腦程式,該音訊信號是包含音訊資訊之一數位資料信號。該編碼處理程序產生一數位位元流,其可在一數位資料鏈路之上被發送至在遠處位置之一解碼器。
本發明一實施例之編碼器部份給予於圖4。比較於圖3之主要差異是這時,其編碼雜訊減低輸出,亦即,增強信號TS。為避免無雜訊情況(乾淨語音或乾淨音樂)中不必要的失真,雜訊減低僅被應用於带噪語音情況且此外被旁通。在带噪及無雜訊信號之間的區分藉由估算雜訊及所需信號WS(語音或音樂)的長期能量被達成。該長期能量藉由一階自回歸過濾輸入訊框能量(在作用訊框期間)或使用雜訊估算模組輸出(在不作用訊框期間)被計算。在带噪及無雜訊信號之間的區分藉由利用所需信號能量估算器31估算所需信號WS(語音或音樂)之長期能量及藉由利用雜訊能量估算器32估算雜訊N之長期能量被達成。為這目的所需信號能量估算器31接收藉由頻譜分析裝置25被提供之頻譜SI信號作為輸入信號IS。進一步地,雜訊能量估算器接收藉由雜訊估算產生裝置26被提供之雜訊估算信號NI作為輸入信號IS。在作用訊框期間,僅長期語音/音樂能量估算WE被更動。在不作用訊框期間,僅雜訊能量估算NE被更
動。該長期能量藉由一階自回歸過濾輸入訊框能量(在作用訊框期間)或使用雜訊估算模組輸出(在不作用訊框期間)被計算。以此方式一信號雜訊比信號RS可藉由信號雜訊比估算器33被計算,其包含語音或音樂WS長期能量對於雜訊N長期能量之比率。該信號雜訊比信號RS被饋送至一雜訊檢測器34,其決定目前訊框是否包含一带噪音訊信號或一乾淨音訊信號,如果信號雜訊比RS是在一預定臨限之下,則該訊框被考慮為带噪語音否則其被分類為乾淨語音。
分類結果被輸出作為一雜訊旗標信號NF,其被使用以控制開關35。進一步地,該雜訊旗標信號NF被饋送至位元流編碼器20。位元流編碼器20被組態以依雜訊旗標信號NF為基礎在位元流之內產生且發送一側資訊,其指示音訊輸入信號IS或雜訊減低音訊信號TS是否被編碼。藉由解碼這旗標,一解碼器可以自動地調整目標雜訊位準而不必將被解碼信號DS分類為带噪或乾淨。
圖5展示依據本發明編碼器18之第二實施例。展示於圖5中之編碼器18是以被展示於圖4之編碼器為基礎。下面,另外的特點被說明。圖4中信號分析器30包含一信號活動檢測器36,其接收對於輸入信號IS及雜訊估算信號NI之頻譜信號SI。信號活動檢測器36被組態以這二組信號為基礎以在作用訊框及不作用訊框之間區別。信號活動檢測器產生一信號活動信號SA,其一個方面為了調適位元流BS至信號活動而被發送至位元流編碼器20且另一方面被使
用以切換開關37,其被組態以交互地饋送所需信號能量信號WE或雜訊能量信號EN至信號雜訊比估算器33。
圖6展示依據本發明位元流BS之訊框格式FF之
一實施例。依據訊框格式FF之訊框包含具有複數個位元安置於自0至n位置之一信號向量SV。在位置n+1之一位元是安置一活動旗標AF,其指示訊框是作用訊框及不作用訊框。進一步地,位置n+2之一位元是雜訊旗標NF,其指示訊框包含一带噪信號或一團隊信號。位置n+3被配置之一位元是填充位元PB。
於本發明較佳實施例中,指示目前訊框是作用或不作用的側資訊由該位元流(BS)中至少一個專用位元所構成。
概要而言,本發明一個論點,原始信號被編碼且在被添加至一人造地產生舒緩雜訊CN之前在解碼器1被解碼。舒緩雜訊產生裝置4需要沒有或非常小數量的側資訊。於一第一實施例,舒緩雜訊產生裝置4不需要側資訊且所有的處理程序盲目地完成。於較佳實施例中,舒緩雜訊產生裝置4需要自位元流BS回復VAD資訊(作用及不作用訊框分類結果),其可先前已經呈現於位元流且被使用於其他的用途。於第三實施例中,舒緩雜訊產生裝置4需要來自編碼器18之一带噪語音旗標,其在乾淨及带噪語音之間區分。吾人同時也可想像任何類參數式被編碼資訊,其可助以驅動舒緩雜訊產生裝置4。
於本發明另一論點中,雜訊減低技術首先被應
用至原始信號IS且一增強信號TS被傳送至位元流編碼器20,被編碼,並且被發送。在解碼端,一人造地-產生之舒緩雜訊CN接著被添加至被解碼(增強)信號DS。在編碼器被使用於雜訊減低之目標衰減位準是與在解碼器之CNG模組共用之靜態數值。因此,目標衰減位準不需要另外被發送。
雖然一些論點已依設備脈絡被說明,應清楚,這些論點同時也代表對應方法的說明,其中一區塊或裝置對應至一方法步驟或一方法步驟特點。類似地,依方法步驟脈絡被說明之論點同時也代表一對應的區塊或項目或一對應設備的特點之說明。一些或所有的方法步驟可以藉由(或利用)一硬體設備被執行,其類似於例如,一微處理機,一可編程序電腦或一電子式電路。於一些實施例中,某一個或多個最重要方法步驟可以藉由此一設備被執行。
取決於某些製作需要,本發明實施例可以硬體或軟體被製作。該製作可使用一非暫態儲存媒體被進行,例如一數位儲存部媒體,例如一軟碟、一DVD、一藍光、一CD、一ROM、一PROM、一EPROM、一EEPROM或一快閃記憶體,其具有電子式可讀取控制信號儲存於其上,其配合(或是能夠配合)於一可編程序電腦系統以至於該分別的方法被進行。因此,該數位儲存媒體可以是電腦可讀取。
依據本發明之一些實施例包含具有電子式可讀取控制信號之一資料攜載器,其是能夠配合於一可編程序
電腦系統,以至於此處說明之該等方法之一被進行。
通常,本發明實施例可被製作如具有一程式碼之一電腦程式產品,當該電腦程式產品執行於一電腦時,該程式碼可操作以進行該等方法之一。該程式碼,例如,可以是儲存於一機器可讀取攜載器上。
其他的實施例包含電腦程式,其用以進行此處說明之該等方法之一,其儲存於一機器可讀取攜載器上。
換言之,本發明方法之一實施例,因此,是一電腦程式,其具有程式碼用以當該電腦程式執行於一電腦時,進行此處說明之該等方法之一。
本發明方法之進一步的實施例,因此,是一資料攜載器(或一數位儲存部媒體,或一電腦可讀取媒體),其包含,被記錄於其上,用以進行此處說明之該等方法之一的電腦程式。該資料攜載器、該數位儲存媒體或該被記錄媒體是一般有形體的及/或非暫態的。
本發明方法之進一步的實施例,因此,是一資料串流或一信號序列,其代表用以進行此處說明之該等方法之一的電腦程式。該資料串流或該信號序列,例如,可以是被組態以經由一資料通訊連接,例如,經由網際網路,而被傳送。
一進一步的實施例包含一處理構件,例如,一電腦或一可編程序邏輯裝置,其被組態以便,或適用於,進行此處說明之該等方法之一。
一進一步的實施例包含一電腦,其具有電腦程
式安裝在其上而用以進行此處說明之該等方法之一。
依據本發明之一進一步的實施例包含一設備或一系統,其被組態以轉移(例如,電子式或光學式)用以進行此處說明之該等方法之一之電腦程式至一接收器。該接收器,例如,可以是一電腦、一移動式裝置、一記憶體裝置或其類似者。該設備或系統,例如,可包含用以傳送該電腦程式至該接收器之一檔案伺服器。
一些實施例中,一可編程序邏輯裝置(例如,一場式可程控閘陣列)可以被使用以進行此處說明方法之一些或所有的功能。於一些實施例中,一場式可程控閘陣列可以配合於一微處理機以便進行此處說明之該等方法之一。通常,該等方法最好是利用任何硬體設備被進行。
在上面被說明實施例僅是本發明原理的展示。應了解,此處說明之配置和細節的修改和變化對於熟習本技術之其他者應是明顯的。因此,本發明是僅受限於待決專利申請專利範圍之範疇而非此處實施例之說明和表述所呈現之特定細節。
參考符號:
1 解碼器
2 位元流解碼器
3 雜訊估算裝置
4 舒緩雜訊產生裝置
5 組合器
6 頻譜分析裝置
7 雜訊估算產生裝置
8 雜訊產生器
9 頻譜合成器
10 切換裝置
11 控制裝置
12 雜訊檢測器
13 側資訊接收器
14 所需信號能量估算器
15 雜訊能量估算器
16 信號雜訊比估算器
17 側資訊接收器
17a 開關
18 編碼器
19 信號分析器
20 位元流編碼器
21 信號編碼器
22 位元流產生器
23 信號分析器
24 雜訊估算裝置
25 頻譜分析裝置
26 雜訊估算產生裝置
27 雜訊減低模組
28 頻譜合成綜合裝置
29 信號活動檢測器
30 信號分析器
31 所需信號能量估算器
32 雜訊能量估算器
33 信號雜訊比估算器
34 雜訊檢測器
35 開關
36 信號活動檢測器
37 開關
BS 被編碼音訊位元流
DS 被解碼音訊信號
NE 雜訊估算信號
N 雜訊
CN 舒緩雜訊信號
OS 音訊輸出信號
AS 分析信號
FD 頻率域舒緩雜訊信號
ND 雜訊檢測信號
TNL 目標舒緩雜訊位準
IS 輸入信號
ES 被編碼信號
OW 所需信號能量估算器輸出信號
ON 雜訊能量估算器輸出信號
SI 輸入信號頻譜信號
NI 輸入信號雜訊估算信號
TAS 目標衰減信號
FS 增強頻率域信號
TS 雜訊減低音訊信號
AD 活動檢測器信號
WE 所需信號能量信號
EN 雜訊能量信號
RS 信號雜訊比信號
NF 雜訊旗標
SA 信號活動信號
FF 訊框格式
SV 信號向量
AF 活動旗標
NF 雜訊旗標信號
PB 填充位元
[1] Recommendation ITU-T G.718: “Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s”.
[2] 3GPP TS 26.190 “Adaptive Multi-Rate wideband speech transcoding,” 3GPP Technical Specification.
1‧‧‧解碼器
2‧‧‧位元流解碼器
3‧‧‧雜訊估算裝置
4‧‧‧舒緩雜訊產生裝置
5‧‧‧組合器
6‧‧‧頻譜分析裝置
7‧‧‧雜訊估算產生裝置
8‧‧‧雜訊產生器
9‧‧‧頻譜合成器
10‧‧‧切換裝置
11‧‧‧控制裝置
12‧‧‧雜訊檢測器
13‧‧‧側資訊接收器
AS‧‧‧分析信號
BS‧‧‧位元流
CN‧‧‧舒緩雜訊信號
DS‧‧‧被解碼音訊信號
NE‧‧‧雜訊估算信號
N‧‧‧雜訊
ND‧‧‧雜訊檢測信號
OS‧‧‧輸出信號
TNL‧‧‧目標舒緩雜訊位準
WS‧‧‧所需信號
Claims (25)
- 一種解碼器,組配來處理一被編碼音訊位元串流(BS),其中該解碼器包含:一位元串流解碼器,組配來自該位元串流(BS)推導出一被解碼音訊信號(DS),其中該被解碼音訊信號(DS)包含至少一個被解碼訊框;一雜訊估算裝置,組配來產生包含該被解碼音訊信號(DS)中雜訊(N)之位準及/或頻譜形狀的估算之一雜訊估算信號(NE);一舒緩雜訊產生裝置,組配來自該雜訊估算信號(NE)推導出一舒緩雜訊信號(CN);以及一組合器,組配來組合該被解碼音訊信號(DS)之被解碼訊框以及該舒緩雜訊信號(CN)以得到一音訊輸出信號(OS),其組合係採使得該音訊輸出信號(OS)中之被解碼訊框包含人工雜訊之方式。
- 依據請求項1之解碼器,其中該被解碼訊框是一作用訊框。
- 依據請求項1之解碼器,其中該被解碼訊框是一不作用訊框。
- 依據請求項1之解碼器,其中該雜訊估算裝置包含:組配來產生包含該被解碼音訊信號(DS)中該雜訊(N)之位準及/或頻譜形狀之一分析信號(AS)之一頻譜分析裝置、以及組配來依該分析信號(AS)為基礎而產生該雜訊估算信號(NE)之一雜訊估算產生裝置。
- 依據請求項1之解碼器,其中該舒緩雜訊產生裝置包含:組配來依該雜訊估算信號(NE)為基礎而產生一頻率域舒緩雜訊信號(FD)之一雜訊產生器、以及組配來依該頻率域舒緩雜訊信號(FD)為基礎而產生該舒緩雜訊信號(CN)之一頻譜合成器。
- 依據請求項1之解碼器,其中該解碼器包含組配來交互地切換該解碼器至一第一操作模式或至一第二操作模式之一切換裝置,其中於該第一操作模式中該舒緩雜訊信號(CN)被饋送至該組合器,而於該第二操作模式中該舒緩雜訊信號(CN)不被饋送至該組合器。
- 依據請求項6之解碼器,其中該解碼器包含組配來自動地控制該切換裝置之一控制裝置,其中該控制裝置包含一雜訊檢測器並且組配來取決於該被解碼音訊信號(DS)之一信號對雜訊比來控制該切換裝置,其中在低信號對雜訊比情況之下,該解碼器被切換至該第一操作模式,而在高信號對雜訊比情況之下,該解碼器被切換至該第二操作模式。
- 依據請求項7之解碼器,其中該控制裝置包含一旁側資訊接收器,該旁側資訊接收器組配來接收含於對應於該被解碼音訊信號(DS)之信號對雜訊比的該位元串流(BS)中之旁側資訊,並且組配來產生一雜訊檢測信號(ND),其中該雜訊檢測器取決於該雜訊檢測信號(ND)來切換該切換裝置。
- 依據請求項8之解碼器,其中對應於該被解碼音訊信號 (DS)之該信號對雜訊比的該旁側資訊由該位元串流(BS)中至少一個專用位元所構成。
- 依據請求項7之解碼器,其中該控制裝置包含:組配來決定該被解碼音訊信號(DS)之一所需信號(WS)的能量之一所需信號能量估算器、組配來決定該被解碼音訊信號(DS)之雜訊(N)的能量之一雜訊能量估算器、以及組配來依該所需信號(WS)之能量為基礎並且以該雜訊(N)之能量為基礎而決定該被解碼音訊信號(DS)之信號對雜訊比之一信號對雜訊比估算器,其中該切換裝置取決於該控制裝置所決定之該信號對雜訊比而被切換。
- 依據請求項7之解碼器,其中該位元串流包含作用訊框以及不作用訊框,其中該控制裝置組配來決定在作用訊框期間該被解碼音訊信號(DS)之所需信號(WS)的能量,並且決定在不作用訊框期間該被解碼音訊信號(DS)之雜訊(N)的能量。
- 依據請求項1之解碼器,其中該位元串流包含作用訊框以及不作用訊框,其中該解碼器包含組配來依該位元串流(BS)中指出目前訊框是作用或不作用之旁側資訊為基礎而將該等作用訊框與該等不作用訊框二者之間予以區別之一旁側資訊接收器。
- 依據請求項12之解碼器,其中指出該目前訊框是作用或不作用的該旁側資訊由該位元串流(BS)中至少一個專用位元所構成。
- 依據請求項4之解碼器,其中該控制裝置組配來依該分 析信號(AS)為基礎而決定該被解碼音訊信號(DS)之所需信號(WS)的能量。
- 依據請求項7之解碼器,其中該控制裝置組配來依該雜訊估算信號(NE)為基礎而決定該被解碼音訊信號(DS)之雜訊(N)的能量。
- 依據請求項1之解碼器,其中該舒緩雜訊產生裝置組配來依一目標舒緩雜訊位準信號(TNL)為基礎而產生該舒緩雜訊信號(CN)。
- 依據請求項16之解碼器,其中該目標舒緩雜訊位準信號(TNL)取決於該位元串流(BS)之位元速率而被調整。
- 依據請求項15之解碼器,其中該目標舒緩雜訊位準信號(TNL)取決於由應用於該位元串流(BS)之一雜訊減低方法所導致之雜訊衰減位準而被調整。
- 依據請求項16之解碼器,其中頻率域舒緩雜訊信號(FD)之頻帶k的能量E W(k)係針對各頻帶k,取決於指出一目標舒緩雜訊位準g tar的該目標舒緩雜訊位準信號(TNL),而被調整如,其中意指如藉由雜訊估算產生裝置所傳送之在頻帶k之被解碼音訊信號(DS)之雜訊(N)的能量估算。
- 依據請求項1之解碼器,其中該解碼器包含一另一位元串流解碼器,其中該位元串流解碼器以及該另一位元串流解碼器是不同的型式,其中該解碼器包含一開關,該開關組配來饋送來自該位元串流解碼器之被解碼信號(DS)或來自該另一位元串流解碼器之一被解碼信號至 該雜訊估算裝置以及至該組合器。
- 一種編碼器,組配來產生一音訊位元串流(BS),其中該編碼器包含:一位元串流編碼器,組配來產生對應於一音訊輸入信號(IS)之一被編碼音訊信號(ES),並且自該被編碼音訊信號(ES)推導出該位元串流(BS);一信號分析器,其具有一信號對雜訊比估算器,該信號對雜訊比估算器組配來依由一所需信號能量估算器決定之該音訊輸入信號(IS)之一所需信號(WS)的能量為基礎以及以由雜訊能量估算器決定之該音訊輸入信號(IS)之一雜訊(N)的能量為基礎,而決定該音訊輸入信號(IS)之信號對雜訊比;一雜訊減低裝置,組配來產生一雜訊減低音訊信號(TS);以及一切換裝置,組配來取決於該音訊輸入信號(IS)之被決定信號對雜訊比,而將該音訊輸入信號(IS)或該雜訊減低音訊信號(TS)饋送至該位元串流編碼器以供用於編碼個別信號(IS,TS),其中該位元串流編碼器組配來在該位元串流(BS)之內發送一旁側資訊(NF),該旁側資訊(NF)指出該音訊輸入信號(IS)或該雜訊減低音訊信號(TS)被編碼。
- 一種包括解碼器及編碼器之系統,其中該解碼器是依據請求項1至19中任一項來設計,及/或該編碼器是依據請求項21來設計。
- 一種解碼音訊位元串流(BS)之方法,其中該方法包含下列步驟:從該位元串流(BS)推導出一被解碼音訊信號(DS),其中該被解碼音訊信號(DS)包含至少一個被解碼訊框;產生包含該被解碼音訊信號(DS)中雜訊(N)之位準及/或頻譜形狀的估算之一雜訊估算信號(NE);從該雜訊估算信號(NE)推導出一舒緩雜訊信號(CN);以及組合該被解碼音訊信號(DS)之被解碼訊框以及該舒緩雜訊信號(CN)以得到一音訊輸出信號(OS),其組合係採使得該音訊輸出信號(OS)中之該被解碼訊框包含人工雜訊之方式。
- 一種用以產生音訊位元串流(BS)之音訊信號編碼方法,其中該方法包含下列步驟:依一音訊輸入信號(IS)之一所需信號(WS)的決定能量以及該音訊輸入信號(IS)之一雜訊(N)的決定能量為基礎而決定該音訊輸入信號(IS)之信號對雜訊比;產生一雜訊減低音訊信號(TS);產生對應於該音訊輸入信號(IS)之一被編碼音訊信號(ES),其中,取決於該音訊輸入信號(IS)之被決定信號對雜訊比,該音訊輸入信號(IS)或該雜訊減低音訊信號(TS)被編碼;從該被編碼音訊信號(ES)推導出該位元串流 (BS);以及在該位元串流(BS)之內發送一旁側資訊(NF),該旁側資訊(NF)指出該音訊輸入信號(IS)或該雜訊減低音訊信號(TS)被編碼。
- 一種電腦程式,其於一電腦或一處理器上運行時,用以進行請求項23或24之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261740883P | 2012-12-21 | 2012-12-21 | |
PCT/EP2013/077527 WO2014096280A1 (en) | 2012-12-21 | 2013-12-19 | Comfort noise addition for modeling background noise at low bit-rates |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201432671A TW201432671A (zh) | 2014-08-16 |
TWI553629B true TWI553629B (zh) | 2016-10-11 |
Family
ID=49883094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102147458A TWI553629B (zh) | 2012-12-21 | 2013-12-20 | 用以在低位元速率下模型化背景雜訊之舒緩雜訊添加技術 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10147432B2 (zh) |
EP (1) | EP2936486B1 (zh) |
JP (3) | JP6335190B2 (zh) |
KR (2) | KR102167541B1 (zh) |
CN (2) | CN111145767B (zh) |
AR (1) | AR094279A1 (zh) |
AU (1) | AU2013366552B2 (zh) |
BR (1) | BR112015014217B1 (zh) |
CA (2) | CA2895391C (zh) |
ES (1) | ES2688021T3 (zh) |
HK (1) | HK1217244A1 (zh) |
MX (1) | MX366279B (zh) |
MY (1) | MY178710A (zh) |
PL (1) | PL2936486T3 (zh) |
PT (1) | PT2936486T (zh) |
RU (1) | RU2633107C2 (zh) |
SG (1) | SG11201504899XA (zh) |
TW (1) | TWI553629B (zh) |
WO (1) | WO2014096280A1 (zh) |
ZA (1) | ZA201505191B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY178710A (en) | 2012-12-21 | 2020-10-20 | Fraunhofer Ges Forschung | Comfort noise addition for modeling background noise at low bit-rates |
EP2980790A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
US10958695B2 (en) * | 2016-06-21 | 2021-03-23 | Google Llc | Methods, systems, and media for recommending content based on network conditions |
CN108012148B (zh) * | 2018-01-16 | 2023-12-22 | 吉林省广播电视研究所(吉林省新闻出版广电局科技信息中心) | 广播电视音频质量实时监测并自动切换的装置及方法 |
KR20210151831A (ko) * | 2019-04-15 | 2021-12-14 | 돌비 인터네셔널 에이비 | 오디오 코덱에서의 대화 향상 |
US11146607B1 (en) * | 2019-05-31 | 2021-10-12 | Dialpad, Inc. | Smart noise cancellation |
CA3145047A1 (en) * | 2019-07-08 | 2021-01-14 | Voiceage Corporation | Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding |
GB2596138A (en) * | 2020-06-19 | 2021-12-22 | Nokia Technologies Oy | Decoder spatial comfort noise generation for discontinuous transmission operation |
EP4330963A1 (en) * | 2021-04-29 | 2024-03-06 | VoiceAge Corporation | Method and device for multi-channel comfort noise injection in a decoded sound signal |
US11915698B1 (en) * | 2021-09-29 | 2024-02-27 | Amazon Technologies, Inc. | Sound source localization |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002101724A1 (en) * | 2001-06-12 | 2002-12-19 | Globespan Virata Incorporated | Method and system for implementing a low complexity spectrum estimation technique for comfort noise generation |
WO2010003618A2 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
Family Cites Families (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537509A (en) | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
US5630016A (en) | 1992-05-28 | 1997-05-13 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5657422A (en) * | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
FI101439B1 (fi) | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
EP0756267A1 (en) | 1995-07-24 | 1997-01-29 | International Business Machines Corporation | Method and system for silence removal in voice communication |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
JP3252782B2 (ja) * | 1998-01-13 | 2002-02-04 | 日本電気株式会社 | モデム信号対応音声符号化復号化装置 |
US6122611A (en) | 1998-05-11 | 2000-09-19 | Conexant Systems, Inc. | Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise |
US6424938B1 (en) * | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
RU2237296C2 (ru) | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
US8583427B2 (en) * | 1999-11-18 | 2013-11-12 | Broadcom Corporation | Voice and data exchange over a packet based network with voice detection |
US20070110042A1 (en) | 1999-12-09 | 2007-05-17 | Henry Li | Voice and data exchange over a packet based network |
JP2001318694A (ja) * | 2000-05-10 | 2001-11-16 | Toshiba Corp | 信号処理装置、信号処理方法および記録媒体 |
US6873604B1 (en) | 2000-07-31 | 2005-03-29 | Cisco Technology, Inc. | Method and apparatus for transitioning comfort noise in an IP-based telephony system |
US6615169B1 (en) | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6807525B1 (en) | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
CN100393085C (zh) * | 2000-12-29 | 2008-06-04 | 诺基亚公司 | 数字网络中的音频信号质量增强 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
JP4089347B2 (ja) * | 2002-08-21 | 2008-05-28 | 沖電気工業株式会社 | 音声復号装置 |
CN1703736A (zh) | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
JP4311541B2 (ja) * | 2003-10-06 | 2009-08-12 | アルパイン株式会社 | オーディオ信号圧縮装置 |
GB0326263D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US7454010B1 (en) | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
WO2006136901A2 (en) | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
DE602006018618D1 (de) * | 2005-07-22 | 2011-01-13 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US20070064681A1 (en) * | 2005-09-22 | 2007-03-22 | Motorola, Inc. | Method and system for monitoring a data channel for discontinuous transmission activity |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8744844B2 (en) * | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8032370B2 (en) * | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
EP2054876B1 (en) * | 2006-08-15 | 2011-10-26 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform |
CN101149921B (zh) * | 2006-09-21 | 2011-08-10 | 展讯通信(上海)有限公司 | 一种静音检测方法和装置 |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
WO2008108721A1 (en) * | 2007-03-05 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for controlling smoothing of stationary background noise |
US8990073B2 (en) * | 2007-06-22 | 2015-03-24 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8090588B2 (en) * | 2007-08-31 | 2012-01-03 | Nokia Corporation | System and method for providing AMR-WB DTX synchronization |
US8139777B2 (en) | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
EP2597809A1 (en) * | 2008-01-04 | 2013-05-29 | InterDigital Patent Holdings, Inc. | Method for controlling the data rate of a circuit switched voice application in an evolved wireless system |
US8483854B2 (en) * | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
DE102008009719A1 (de) | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
US20090222268A1 (en) | 2008-03-03 | 2009-09-03 | Qnx Software Systems (Wavemakers), Inc. | Speech synthesis system having artificial excitation signal |
CN101483495B (zh) * | 2008-03-20 | 2012-02-15 | 华为技术有限公司 | 一种背景噪声生成方法以及噪声处理装置 |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
US8930197B2 (en) * | 2008-05-09 | 2015-01-06 | Nokia Corporation | Apparatus and method for encoding and reproduction of speech and audio signals |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
CN102177426B (zh) | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
EP3764356A1 (en) | 2009-06-23 | 2021-01-13 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
PT2491559E (pt) * | 2009-10-19 | 2015-05-07 | Ericsson Telefon Ab L M | Método e estimador de fundo para a detecção de actividade de voz |
WO2011049515A1 (en) * | 2009-10-19 | 2011-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and voice activity detector for a speech encoder |
WO2011048117A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
CN102063905A (zh) * | 2009-11-13 | 2011-05-18 | 数维科技(北京)有限公司 | 一种用于音频解码的盲噪声填充方法及其装置 |
US20110234200A1 (en) * | 2010-03-24 | 2011-09-29 | Kishan Shenoi | Adaptive slip double buffer |
SI3239979T1 (sl) * | 2010-10-25 | 2024-09-30 | Voiceage Evs Llc | Kodiranje generičnih zvočnih signalov pri nizkih bitnih hitrostih in majhni zakasnitvi |
EP3493205B1 (en) * | 2010-12-24 | 2020-12-23 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting a voice activity in an input audio signal |
CN102136271B (zh) * | 2011-02-09 | 2012-07-04 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
EP3373296A1 (en) | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
US20120237048A1 (en) * | 2011-03-14 | 2012-09-20 | Continental Automotive Systems, Inc. | Apparatus and method for echo suppression |
JP5986565B2 (ja) * | 2011-06-09 | 2016-09-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
CN107195313B (zh) * | 2012-08-31 | 2021-02-09 | 瑞典爱立信有限公司 | 用于语音活动性检测的方法和设备 |
MY178710A (en) * | 2012-12-21 | 2020-10-20 | Fraunhofer Ges Forschung | Comfort noise addition for modeling background noise at low bit-rates |
CA2894625C (en) * | 2012-12-21 | 2017-11-07 | Anthony LOMBARD | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
US9106196B2 (en) * | 2013-06-20 | 2015-08-11 | 2236008 Ontario Inc. | Sound field spatial stabilizer with echo spectral coherence compensation |
-
2013
- 2013-12-19 MY MYPI2015001587A patent/MY178710A/en unknown
- 2013-12-19 PT PT13814127T patent/PT2936486T/pt unknown
- 2013-12-19 ES ES13814127.0T patent/ES2688021T3/es active Active
- 2013-12-19 WO PCT/EP2013/077527 patent/WO2014096280A1/en active Application Filing
- 2013-12-19 PL PL13814127T patent/PL2936486T3/pl unknown
- 2013-12-19 CA CA2895391A patent/CA2895391C/en active Active
- 2013-12-19 CN CN202010005379.0A patent/CN111145767B/zh active Active
- 2013-12-19 CA CA2948015A patent/CA2948015C/en active Active
- 2013-12-19 JP JP2015548606A patent/JP6335190B2/ja active Active
- 2013-12-19 CN CN201380073660.6A patent/CN105210148B/zh active Active
- 2013-12-19 RU RU2015129782A patent/RU2633107C2/ru active
- 2013-12-19 MX MX2015007854A patent/MX366279B/es active IP Right Grant
- 2013-12-19 AU AU2013366552A patent/AU2013366552B2/en active Active
- 2013-12-19 SG SG11201504899XA patent/SG11201504899XA/en unknown
- 2013-12-19 EP EP13814127.0A patent/EP2936486B1/en active Active
- 2013-12-19 BR BR112015014217-6A patent/BR112015014217B1/pt active IP Right Grant
- 2013-12-20 TW TW102147458A patent/TWI553629B/zh active
- 2013-12-20 AR ARP130105027A patent/AR094279A1/es active IP Right Grant
-
2014
- 2014-01-23 KR KR1020167036572A patent/KR102167541B1/ko active IP Right Grant
- 2014-01-23 KR KR1020157019064A patent/KR101692659B1/ko active IP Right Grant
-
2015
- 2015-06-19 US US14/744,788 patent/US10147432B2/en active Active
- 2015-07-20 ZA ZA2015/05191A patent/ZA201505191B/en unknown
-
2016
- 2016-04-28 HK HK16104874.5A patent/HK1217244A1/zh unknown
-
2018
- 2018-01-04 JP JP2018000043A patent/JP6849619B2/ja active Active
- 2018-08-02 US US16/053,525 patent/US10339941B2/en active Active
-
2019
- 2019-06-21 US US16/448,291 patent/US10789963B2/en active Active
-
2021
- 2021-03-04 JP JP2021034012A patent/JP7297803B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002101724A1 (en) * | 2001-06-12 | 2002-12-19 | Globespan Virata Incorporated | Method and system for implementing a low complexity spectrum estimation technique for comfort noise generation |
WO2010003618A2 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI553629B (zh) | 用以在低位元速率下模型化背景雜訊之舒緩雜訊添加技術 | |
US10249310B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
US10262662B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
JP6180544B2 (ja) | オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 | |
JP2010503881A (ja) | 音声・音響送信器及び受信器のための方法及び装置 | |
JP6181773B2 (ja) | Celp状コーダのためのサイド情報を用いないノイズ充填 | |
JP6228298B2 (ja) | エネルギー調整モジュールを備えた帯域幅拡大モジュールを有するオーディオ復号器 |