TWI587287B - 柔和噪音產生模式選擇之裝置與方法 - Google Patents
柔和噪音產生模式選擇之裝置與方法 Download PDFInfo
- Publication number
- TWI587287B TWI587287B TW104123733A TW104123733A TWI587287B TW I587287 B TWI587287 B TW I587287B TW 104123733 A TW104123733 A TW 104123733A TW 104123733 A TW104123733 A TW 104123733A TW I587287 B TWI587287 B TW I587287B
- Authority
- TW
- Taiwan
- Prior art keywords
- noise
- soft
- frequency
- mode
- soft noise
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000007774 longterm Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 238000007493 shaping process Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
本發明係關於一種音訊編碼、處理及解碼,特別關於一種柔和噪音產生模式選擇之裝置及方法。
通訊語音及音訊編解碼器(例如AMR-WB,G.718)一般包含一非連續傳輸技術(discontinuous transmission,DTX)以及一柔和噪音產生(comfort noise generation,CNG)演算法。DTX/CNG操作係藉由在無作用訊號期間模擬背景噪音而用以降低傳輸率。
CNG可例如由一些方法來實施。
最常用在編解碼器(例如AMR-WB(ITU-T G.722.2 Annex A)以及G.718(ITU-T G.718 Sec.6.12 and 7.12))的方法係基於激勵線性預測(excitation+linear+prediction(LP))模型。首先產生一隨機激勵訊號,然後使其乘上一增益,最後使用一線性反向濾波器而合成,以產生時域CNG訊號。兩個被傳輸的主要參數係為激勵能量以及線性預測常數(一般使用線性頻譜率(linear spectral frequencies)或導抗頻譜率(immittance spectral frequencies)來表現)。此方法在此視為LP-CNG。
另外還有一方法,最近提出並描述在例如申請專利WO2014/096279(具有高時頻解析度之柔和噪音在音訊之非連續傳輸中之產生)中,其係基於一背景噪音的頻域(frequency-domain,FD)表現。隨機噪音係在一頻域(例如快速傅利葉轉換(FFT)、改進的離散餘弦轉換(MDCT)、正交鏡像濾波(QMF))中產生,然後使用背景噪音之一頻域表現來形塑(shaped),最後從頻率轉換到時域,以產生時域CNG訊號。兩個被傳輸之主要參數係為一全域增益以及一組頻帶噪音等級。此方法於此可視為FD-
CNG。
本發明之一目的在於提供關於柔和噪音之產生的改善觀念,其係藉由依據請求項1之一裝置、依據請求項10之一裝置、依據請求項13之一系統、依據請求項14之一方法、依據請求項15之一方法或依據請求項16之一電腦程式來達成。
本發明係提供編碼聲音資訊之一裝置。該裝置係包含一選擇器以及一編碼單元。選擇器係依據一聲音輸入訊號之一背景噪音特性而從至少二柔和噪音產生模式中選擇一柔和噪音產生模式。編碼單元係用以編碼聲音資訊,其中該聲音資訊係包含指出被選擇之柔和噪音產生模式之模式資訊。
特別地,在實施例中發現FD-CNG在高傾(high-tilt)背景噪音訊號(例如汽車噪音)上可得到較佳品質,同時LP-CNG在頻譜較平的背景噪音(例如辦公室噪音)可得到較佳品質。
為得到DTX/CNG系統之最佳品質,依據本發明實施例,上述兩個CNG方法皆被使用,並且依據背景噪音特性而選擇二者其中之一。
實施例係提供一選擇器,其係決定哪一個CNG模式會被使用,例如,LP-CNG或FD-CNG。
依據一實施例,選擇器可例如將聲音輸入訊號之背景噪音之一傾斜(tilt)決定為背景噪音特性。選擇器可例如依據上述之傾斜而從至少二柔和噪音產生模式中選擇該柔和噪音產生模式。
在一實施例中,裝置可例如更包含一噪音估計器,用以為各頻帶估計背景噪音之一各頻帶估計。選擇器可例如依據該等頻帶之該被估計背景噪音而決定該傾斜。
依據一實施例,噪音估計器可例如藉由估計各該等頻帶之背景噪音之一能量而估計該背景噪音之一各頻帶估計。
在一實施例中,噪音估計器可例如依據一第一組頻帶之各頻帶之背景噪音之該各頻帶估計而決定該第一組頻帶之一低頻背景噪音值,
該低頻背景噪音值係指出一第一背景噪音能量。
在上述實施例中,噪音估計器可例如依據一第二組頻帶之各頻帶之背景噪音之該各頻帶估計而決定該第二組頻帶之一高頻背景噪音值,該高頻背景噪音值係指出一第二背景噪音能量。相較於第二組之至少一頻帶之一中心頻率,第一組之至少一頻帶可例如具有一較低的中心頻率。在一實施例中,相較於第二組之各頻帶之一中心頻率,第一組之各頻帶可例如具有一較低的中心頻率。
此外,選擇器可例如依據低頻背景噪音值以及高頻背景噪音值而決定該傾斜。
依據一實施例,噪音估計器可例如依據下式而決定低頻背景噪音值L。
其中,i表示第一組頻帶之第i個頻帶,I1表示該等頻帶之第一個頻帶,I2表示該等頻帶之第二個頻帶,N[i]表示第i個頻帶之背景噪音能量之能量估計。
在一實施例中,噪音估計器可例如依據下式而決定高頻背景噪音值H。
其中,i表示第二組頻帶之第i個頻帶,I3表示該等頻帶之第三個頻帶,I4表示該等頻帶之第四個頻帶,N[i]表示第i個頻帶之背景噪音能量之能量估計。
依據一實施例,選擇器可例如依據低頻背景噪音值L以及高頻背景噪音值H而決定傾斜T,就如下式:
或依據下式:
或依據下式:T=L-H
或依據下式:T=H-L
在一實施例中,選擇器可例如將傾斜決定為一現行短期傾斜值。此外,選擇器可例如依據現行短期傾斜值以及一先前長期傾斜值而決定一現行長期傾斜值。此外,選擇器可例如依據現行長期傾斜值而選擇該等柔和噪音產品模式之其中之一。
依據一實施例,選擇器可例如依據下式而決定現行長期傾斜值TcLT。
TcLT=α TpLT+(1-α)T
其中,T係為現行短期傾斜值,TpLT係為該先前長期傾斜值,α係為介於0與1之間的實數(0<α<1)。
在一實施例中,該等柔和噪音產生模式之第一個係例如為一頻域柔和噪音產生模式。此外,該等柔和噪音產生模式之第二個係例如為一線性預測域柔和噪音產生模式。此外,假如一先前被選擇之產生模式(由選擇器所選擇)係為線性預測域柔和噪音產生模式並且現行長期傾斜值大於一第一閥值,則選擇器可例如選擇頻域柔和噪音產生模式。此外,假如先前被選擇之產生模式(由選擇器所選擇)係為頻域柔和噪音產生模式並且現行長期傾斜值小於一第二閥值,則選擇器可例如選擇線性預測域柔和噪音產生模式。
此外,本發明係提供一種裝置,其係依據所接收之編碼聲音資訊而產生一聲音輸出訊號。該裝置包含一解碼單元,其係對編碼聲音資訊進行解碼以得到模式資訊(模式資訊係被編碼於被編碼聲音資訊內),其中,該模式資訊係指出該等柔和噪音產生模式之一被指出柔和噪音產生模式。此外,裝置包含一訊號處理器,其係藉由依據被指出之柔和噪音產生模式而
產生柔和噪音而產生該聲音輸出訊號。
依據一實施例,該等柔和噪音產生模式之第一個係例如為一頻域柔和噪音產生模式。假如該被指出之柔和噪音產生模式係為頻域柔和噪音產生模式,訊號處理器可例如在一頻域並藉由實施柔和噪音(其係在頻域中產生)之一頻時轉換而產生柔和噪音。舉例來說,在一實施例中,假如該被指出之柔和噪音產生模式係為頻域柔和噪音產生模式,則訊號處理器可例如藉由在一頻域產生隨機噪音、藉由在頻域形塑該隨機噪音以得到被形塑噪音,並藉由將該被形塑噪音從頻域轉換至時域,而產生柔和噪音。
在一實施例中,該等柔和噪音產生模式之第二個係例如為一線性預測域柔和噪音產生模式。假如該被指出之柔和噪音產生模式係為線性預測域柔和噪音產生模式,訊號處理器可例如藉由使用一線性預測濾波器而產生柔和噪音。舉例來說,在一實施例中,假如該被指出之柔和噪音產生模式係為線性預測域柔和噪音產生模式,則訊號處理器可例如藉由產生一隨機激勵訊號、藉由縮放該隨機激勵訊號以得到一被縮放(scaled)激勵訊號、並藉由使用一LP反向濾波器合成該被縮放激勵訊號,而產生柔和噪音。
此外,本發明係提供一系統。該系統包含二裝置,其中一裝置係依據上述實施例之其中之一而編碼聲音資訊,另一裝置係依據所接收之編碼聲音資訊並依據上述實施例之其中之一而產生一聲音輸出訊號。編碼聲音資訊之裝置之選擇器係依據一聲音輸入訊號之一背景噪音特性而從該等柔和噪音產生模式中選擇一柔和噪音產生模式。用以編碼聲音資訊之裝置的編碼單元係可編碼聲音資訊,聲音資訊包含模式資訊(其係指出被選擇之柔和噪音產生模式為一被指出之柔和噪音產生模式)以得到被編碼之聲音資訊。此外,用以產生一聲音輸出訊號之裝置的解碼單元係可接收被編碼之聲音資訊,並且可解碼被編碼之聲音資訊以得到模式資訊(其係被編碼於被編碼之聲音資訊內)。用於產生一聲音輸出訊號之裝置的訊號處理器係可藉由產生柔和噪音(其係依據被指出之柔和噪音產生模式而產生)而產生該聲音輸出訊號。
此外,本發明係提供一種可編碼聲音資訊的方法。該方法包
含:依據一聲音輸入訊號之一背景噪音特性從至少二柔和噪音產生模式中選擇一柔和噪音產生模式;以及編碼該聲音資訊,其中聲音資訊包含指出被選擇之柔和噪音產生模式之模式資訊。
此外,本發明係提供根據所接收之被編碼聲音資訊而產生一聲音輸出訊號之一方法。該方法包含:對被編碼聲音資訊進行解碼以得到模式資訊(其係被編碼於被編碼聲音資訊內),其中該模式資訊指出至少二柔和噪音產生模式之一被指出之柔和噪音產生模式;以及藉由產生柔和噪音(其係依據被指出之柔和噪音產生模式而產生)而產生該聲音輸出訊號。
此外,本發明係提供一種電腦程式,當其被執行在一電腦或訊號處理器上時,可實施上述方法。
因此,在一些實施例中,被提出的選擇器可例如主要基於背景噪音之傾斜。舉例來說,假如背景噪音之傾斜為高,則選擇FD-CNG,否則就選擇LP-CNG。
一種背景噪音傾斜之平滑化版以及一滯後(hysteresis)可例如被使用以避免模式之間的頻繁切換。
背景噪音之傾斜可例如藉由使用在低頻中的背景噪音能量率以及在高頻中的背景噪音能量來估計。
背景噪音能量可例如藉由使用一噪音估計器而在頻域中來估計。
100、200‧‧‧裝置
105‧‧‧噪音估計器
110‧‧‧選擇器
120‧‧‧編碼單元
210‧‧‧解碼單元
220‧‧‧訊號處理器
310~360‧‧‧步驟
圖1為本發明一實施例之用以編碼聲音資訊之一裝置的示意圖。
圖2為本發明另一實施例之用以編碼聲音資訊之一裝置的示意圖。
圖3為本發明一實施例之用以選擇一柔和噪音產生模式之方法的流程
圖。
圖4為本發明一實施例之基於所接收之被編碼聲音資訊而產生一聲音輸出訊號之一裝置的示意圖。
圖5為本發明一實施例之一系統的示意圖。
以下將參照相關圖式,說明依本發明較佳實施例之一種柔和噪音產生模式選擇之裝置與方法,其中相同的元件將以相同的參照符號加以說明。
圖1為本發明一實施例之用以編碼聲音資訊之一裝置的示意圖。
用以編碼聲音資訊之裝置係包含一選擇器110,其係依據一聲音輸入訊號之一背景噪音特性而從至少二柔和噪音產生模式中選擇一柔和噪音產生模式。
此外,該裝置包含一編碼單元120,其係編碼聲音資訊。其中,聲音資訊包含指出被選擇之柔和噪音產生模式之模式資訊。
舉例來說,該等柔和噪音產生模式之其中第一個可例如為一頻域柔和噪音產生模式。以及/或者,舉例來說,該等產生模式之其中第二個可例如為一線性預測域柔和噪音產生模式。
舉例來說,假如被編碼聲音資訊在一解碼器這邊被接收,其中該模式資訊(被編碼於被編碼聲音資訊內)指出被選擇之柔和噪音產生模式為頻域柔和噪音產生模式,則在解碼器這邊之一訊號處理器可例如藉由在一頻域中產生隨機噪音、藉由在頻域中形塑該隨機噪音以得到被形塑噪音、以及藉由將該被形塑噪音從頻域轉至時域,而產生該柔和噪音。
然而,舉例來說,假如模式資訊(被編碼於被編碼聲音資訊內)指出被選擇之柔和噪音產生模式為線性預測域柔和噪音產生模式,則在解碼器這邊的訊號處理器可例如藉由產生一隨機激勵訊號、藉由縮放該隨機激勵訊號以得到一被縮放(scaled)激勵訊號、並藉由使用一LP反向濾
波器合成該被縮放激勵訊號,而產生柔和噪音。
在被編碼聲音資訊中,不僅柔和噪音產生模式上的資訊而且額外的資訊皆可被編碼。舉例來說,頻帶特定(frequency-band specific)增益因數亦可被編碼,例如是各頻帶之一增益因數。或者,舉例來說,至少一LP濾波器係數、或線性頻譜率(LSF)係數、或導抗頻譜率(ISF)係數可例如被編碼於被編碼聲音資訊內。然後,被編碼於被編碼聲音資訊內之柔和噪音產生模式上的資訊以及額外的資訊可例如被傳送至一解碼器這邊,例如是在一無聲插入描述框(Silence Insertion Descriptor(SID)frame)之內。
在被選擇之柔和噪音產生模式上的資訊可被外顯地或內隱地編碼。
當外顯地編碼被選擇之柔和噪音產生模式時,至少一位元可例如被使用來指出在該等柔和噪音產生模式中,哪一個是被選擇之柔和噪音產生模式。在這個實施例中,該位元係為被編碼之模式資訊。
然而,在其他實施例中,被選擇之柔和噪音產生模式係被內隱地編碼於聲音資訊中。舉例來說,在上述例子中,頻帶特別增益因數以及LP(或LSF或ISF)係數可例如具有不同的資料格式或具有不同的位元長度。舉例來說,假如頻帶特別增益因數被編碼於聲音資訊中,這可例如指出頻域柔和噪音產生模式係為被選擇之柔和噪音產生模式。然而,假如LP(或LSF或ISF)係數被編碼於聲音資訊,這可例如指出線性預測域柔和噪音產生模式係為被選擇之柔和噪音產生模式。當這樣的內隱編碼被使用時,頻帶特別增益因數或LP(或LSF或ISF)係數代表模式資訊(其係被編碼於被編碼之聲音訊號),其中,該模式資訊指出被選擇之柔和噪音產生模式。
依據一實施例,選擇器110可例如將聲音輸入訊號之一背景噪音之一傾斜決定為背景噪音特性。選擇器110可例如依據所決定之傾斜而從該等柔和噪音產生模式中選擇該柔和噪音產生模式。
舉例來說,一低頻背景噪音值以及一高頻背景噪音值可被使用,並且背景噪音之傾斜可例如依據低頻背景噪音值以及高頻背景噪音值來計算。
圖2為本發明另一實施例之用以編碼聲音資訊之一裝置的
示意圖。圖2之裝置更包含一噪音估計器105,用以為各頻帶估計背景噪音之一各頻帶估計。選擇器110可例如依據該等頻帶之該被估計之背景噪音而決定該傾斜。
依據一實施例,噪音估計器105可例如藉由估計各該等頻帶之背景噪音之一能量而估計該背景噪音之一各頻帶估計。
在一實施例中,噪音估計器105可例如依據一第一組頻帶之各頻帶之背景噪音之該各頻帶估計而決定該第一組頻帶之一低頻背景噪音值,該低頻背景噪音值係指出一第一背景噪音能量。
此外,噪音估計器105可例如依據一第二組頻帶之各頻帶之背景噪音之該各頻帶估計而決定該第二組頻帶之一高頻背景噪音值,該高頻背景噪音值係指出一第二背景噪音能量。相較於第二組之至少一頻帶之一中心頻率,第一組之至少一頻帶可例如具有一較低的中心頻率。在一實施例中,相較於第二組之各頻帶之一中心頻率,第一組之各頻帶可例如具有一較低的中心頻率。
此外,選擇器110可例如依據低頻背景噪音值以及高頻背景噪音值而決定該傾斜。
依據一實施例,噪音估計器105可例如依據下式而決定低頻背景噪音值L。
其中,i表示第一組頻帶之第i個頻帶,I1表示該等頻帶之第一個頻帶,I2表示該等頻帶之第二個頻帶,N[i]表示第i個頻帶之背景噪音能量之能量估計。
相似地,在一實施例中,噪音估計器105可例如依據下式而決定高頻背景噪音值H。
其中,i表示第二組頻帶之第i個頻帶,I3表示該等頻帶之第三個頻帶,I4表示該等頻帶之第四個頻帶,N[i]表示第i個頻帶之背景噪音能量之能量估計。
依據一實施例,選擇器可例如依據低頻背景噪音值L以及高頻背景噪音值H而決定傾斜T,就如下式:
或依據下式:
或依據下式:T=L-H
或依據下式:T=H-L
舉例來說,當L與H表示於一對數域時,該等減法公式(T=L-H或T=H-L)之其中之一可被使用。
在一實施例中,選擇器110可例如將傾斜決定為一現行短期傾斜值。此外,選擇器110可例如依據現行短期傾斜值以及一先前長期傾斜值而決定一現行長期傾斜值。此外,選擇器110可例如依據現行長期傾斜值而選擇該等柔和噪音產品模式之其中之一。
依據一實施例,選擇器110可例如依據下式而決定現行長期傾斜值TcLT。
TcLT=α TpLT+(1-α)T
其中,T係為現行短期傾斜值,TpLT係為該先前長期傾斜值,α係為介於0與1之間的實數(0<α<1)。
在一實施例中,該等柔和噪音產生模式之第一個係例如為一頻域柔和噪音產生模式FD_CNG。此外,該等柔和噪音產生模式之第二個係例如為一線性預測域柔和噪音產生模式LP_CNG。此外,假如一先前被選擇之產生模式cng_mode_prev(由選擇器110所選擇)係為線性預測域柔
和噪音產生模式LP_CNG並且現行長期傾斜值大於一第一閥值thr1,則選擇器110可例如選擇頻域柔和噪音產生模式FD_CNG。此外,假如先前被選擇之產生模式cng_mode_prev(由選擇器110所選擇)係為頻域柔和噪音產生模式FD_CNG並且現行長期傾斜值小於一第二閥值thr2,則選擇器110可例如選擇線性預測域柔和噪音產生模式LP_CNG。
在一些實施例中,第一閥值係等於第二閥值。然而,在一些其他實施例中,第一閥值係不同於第二閥值。
圖4為本發明一實施例之基於所接收之被編碼聲音資訊而產生一聲音輸出訊號之一裝置的示意圖。
裝置包含一解碼單元210,其係對編碼聲音資訊進行解碼以得到模式資訊(模式資訊係被編碼於被編碼聲音資訊內)。模式資訊係指出至少二柔和噪音產生模式之一被指出之柔和噪音產生模式。
此外,裝置包含一訊號處理器220,其係藉由產生柔和噪音(依據被指出之柔和噪音產生模式而產生)而產生該聲音輸出訊號。
依據一實施例,該等柔和噪音產生模式之第一個係例如為一頻域柔和噪音產生模式。假如該被指出之柔和噪音產生模式係為頻域柔和噪音產生模式,訊號處理器220可例如在一頻域並藉由實施柔和噪音(其係在頻域中產生)之一頻時轉換而產生柔和噪音。舉例來說,在一實施例中,假如該被指出之柔和噪音產生模式係為頻域柔和噪音產生模式,則訊號處理器可例如藉由在一頻域產生隨機噪音、藉由在頻域形塑該隨機噪音以得到被形塑噪音,並藉由將該被形塑噪音從頻域轉換至時域,而產生柔和噪音。
舉例來說在申請專利WO 2014/096279 A1中所描述的概念可被使用。
舉例來說,一隨機產生器可被應用來藉著產生至少一隨機序列而激活(excite)在快速傅利葉轉換(FFT)域及/或正交鏡像濾波(QMF)域中的各頻譜帶。隨機噪音之塑形可藉由計算出各頻帶中的隨機序列之振幅而被實行,以致被產生之柔和噪音之頻譜可表現出像似實際背景噪音的頻譜。實際背景噪音的頻譜例如是在一位元流中,位元流例如包含一聲音輸入訊號。然後,舉例來說,計算出來的振幅可例如被應用在隨機序列上,例如是
藉由將隨機序列乘上各頻帶所計算出來的振幅。然後,將被塑形的噪音從頻域轉換至時域。
在一實施例中,該等柔和噪音產生模式之第二個係例如為一線性預測域柔和噪音產生模式。假如該被指出之柔和噪音產生模式係為線性預測域柔和噪音產生模式,訊號處理器220可例如藉由使用一線性預測濾波器而產生柔和噪音。舉例來說,在一實施例中,假如該被指出之柔和噪音產生模式係為線性預測域柔和噪音產生模式,則訊號處理器可例如藉由產生一隨機激勵訊號、藉由縮放該隨機激勵訊號以得到一被縮放(scaled)激勵訊號、並藉由使用一LP反向濾波器合成該被縮放激勵訊號,而產生柔和噪音。
舉例來說,本實施例可使用就如G.722.2(請參照ITU-T G.722.2 Annex A)及/或G.718(請參照ITU-T G.718 Sec.6.12 and 7.12)中所描述的柔和噪音產生。藉由縮放一隨機激勵訊號以得到一被縮放(scaled)激勵訊號、並藉由使用一LP反向濾波器合成該被縮放激勵訊號,可產生在一隨機激勵域中的上述柔和噪音,而這技術係由習知技術者所熟知。
圖5為本發明一實施例之一系統的示意圖。該系統包含二裝置100、200。其中裝置100係依據上述實施例之其中之一而編碼聲音資訊,裝置200係依據所接收之編碼聲音資訊並依據上述實施例之其中之一而產生一聲音輸出訊號。
編碼聲音資訊之裝置100之選擇器110係依據一聲音輸入訊號之一背景噪音特性而從至少二柔和噪音產生模式中選擇一柔和噪音產生模式。用以編碼聲音資訊之裝置100的編碼單元120係可編碼聲音資訊,聲音資訊包含模式資訊(其係指出被選擇之柔和噪音產生模式為一被指出之柔和噪音產生模式),以得到被編碼之聲音資訊。此外,用以產生一聲音輸出訊號之裝置的解碼單元係可接收被編碼之聲音資訊,並且可解碼被編碼之聲音資訊以得到模式資訊(其係被編碼於被編碼之聲音資訊內)。用於產生一聲音輸出訊號之裝置的訊號處理器係可藉由產生柔和噪音(其係依據被指出之柔和噪音產生模式而產生)而產生該聲音輸出訊號。
此外,裝置200之解碼單元210係用以產生一聲音輸出訊
號並可接收被編碼之聲音資訊,並且可對編碼聲音資訊進行解碼以得到模式資訊(模式資訊係被編碼於被編碼聲音資訊內)。裝置200之訊號處理器220係用以產生一聲音輸出訊號,並可藉由產生柔和噪音(依據被指出之柔和噪音產生模式而產生)而產生該聲音輸出訊號。
圖3為本發明一實施例之用以選擇一柔和噪音產生模式之方法的流程圖。
在步驟310中,一噪音估計器被使用來估計在頻域中之背景噪音能量。這一般是基於各頻帶來作以產生各頻帶之一能量估計。
N[i] with 0≦i<N and N the number of bands (e.g. N=20)
任何可產生背景噪音能量之一各頻帶估計之噪音估計器皆可被使用。其中一個例子係為使用在G.718(ITU-T G.718 Sec.6.7)中的噪音估計器。
在步驟320,低頻之背景噪音能量係使用下式計算。
其中I1及I2可視訊號帶寬而定,例如I1=1,I2=9(對窄頻來說),以及I1=0,I2=10(對寬頻來說)。
L可被視為如上所述的一低頻背景噪音值。
在步驟330,高頻之背景噪音能量可藉由使用下式計算。
其中I3及I4可視訊號帶寬而定,例如I3=16,I4=17(對窄頻來說),以及I3=19,I4=20(對寬頻來說)。
H可被視為如上所述的一高頻背景噪音值。
步驟320、330可例如接續或獨立實施。
在步驟340,背景噪音傾斜可藉由下式來計算:T=L/H
一些實施例可例如依據步驟350來進行。在步驟350中,背景噪音傾斜係被平滑化,以產生背景噪音傾斜之一長期版(long-term version)。
TLT=αT LT+(1-α)T
其中,α例如為0.9。在這個遞歸方程式中,等號左邊項TLT係為如上所述之現行長期傾斜值TcLT,而等號右邊項TLT係為如上所述之先前長期傾斜值TpLT。
在步驟360中,CNG模式藉由使用下列分類器和滯後而最後被選擇。
If (cng_mode_prev == LP_CNG and TLT>thr1) then cng_mode = FD_CNG
If (cng_mode_prev == FD_CNG and TLT<thr2) then cng_mode = LP_CNG
其中,thr1與thr2可視頻寬而定,例如thr1=9,thr2=2(對窄頻而言)以及thr1=45,thr2=10(對寬頻而言)。
Cng_mode係為由選擇器110(現時)所選擇之柔和噪音產生模式。
Cng_mode_prev係為由選擇器110在先前所選擇之一先前被選擇之(柔和噪音)產生模式。
當上述步驟360之條件皆未被滿足時,所發生的情況會視實施方式而定。在一實施例中,舉例來說,假如步驟360之兩個條件皆未被滿足,則CNG模式可維持一樣,也就是cng_mode=cng_mode_prev。
其他實施例可實施其他選擇策略。
在圖3的實施例中,thr1係不同於thr2,但在一些其他實施例中,thr1等於thr2。
雖然一些方面已被描述於一裝置的內容中,但清楚地,這些方面也代表對應方法的描述,其中一方塊或裝置係對應一方法步驟或一方
法步驟之一特徵。可類比的,在一方法步驟的內容中所描述的方面也代表一對應方塊、項目或一對應裝置之特徵的描述。
具有創造力的分解訊號可被儲存於一數位儲存媒介上或在一傳輸媒介上傳輸,傳輸媒介例如為一無線傳輸媒介或一有線傳輸媒介,例如網際網路。
依據某些實施需求,本發明的實施例可以硬體或軟體來實施。實施態樣可使用一數位儲存媒介來實行,數位儲存媒介例如一軟碟、一DVD、一CD、一唯讀記憶體(ROM)、一可編程唯讀記憶體(PROM)、一可擦除可編程唯讀記憶體(EPROM)、一電子可擦除可編程唯讀記憶體(EPROM)或一快閃記憶體,數位儲存媒介儲存電子式可讀控制訊號,並與一可編程電腦合作以執行各別的方法。
依據本發明之一些實施例包含一非暫態資料載體,其係儲存電子式可讀控制訊號,並與一可編程電腦合作以執行本發明之方法之其中之一。
一般而言,本發明的實施例可以一電腦程式產品加上一程式碼來實施。當電腦程式產品在一電腦上執行時,程式碼係可執行該等方法之一。程式碼可例如儲存於一機械可讀載體上。
其他實施例包含可執行該等方法之一的電腦程式,電腦程式可儲存於一機械可讀載體。
換言之,當電腦程式在一電腦上執行時,本發明之一實施例係為具有一程式碼之一電腦程式,可用以執行該等方法之一。
本發明之另一實施例係為一資料載體(或一數位儲存媒介或一電腦可讀媒介),其係包含(記錄於其上)可執行該等方法之一之電腦程式。
本發明之另一實施例係為一資料流或一訊號序列,其係代表可執行該等方法之一之電腦程式。資料流或訊號序列可例如經由一資料通訊連接(例如網際網路)來傳送。
另一實施例包含一處理手段,例如一電腦或一可編程邏輯裝置,可用以執行該等方法之一。
另一實施例包含一電腦,電腦程式安裝於電腦上以執行該等方法之一。
在一些實施例中,一可編程邏輯裝置(例如一現場可編程邏輯閘陣列(field programmable gate array))可用以實行該等方法之一些或全部的功能性。在一些實施例中,一現場可編程邏輯閘陣列可與一微處理器合作以執行該等方法之一。一般而言,較佳者,該等方法係藉由任何硬體裝置來實行。
以上所述僅為舉例性,而非為限制性者。任何未脫離本發明之精神與範疇,而對其進行之等效修改或變更,均應包含於後附之申請專利範圍中。
110‧‧‧選擇器
120‧‧‧編碼單元
Claims (15)
- 一種編碼聲音資訊之裝置,包含:一選擇器(110)係依據一聲音輸入訊號之一背景噪音特性而從至少二柔和噪音產生模式中選擇一柔和噪音產生模式;以及一編碼單元(120)係用以編碼該聲音資訊,其中該聲音資訊係包含指出被選擇之該柔和噪音產生模式之模式資訊,其中該等柔和噪音產生模式之第一個係為一頻域柔和噪音產生模式,並且其中該頻域柔和噪音產生模式係指出該柔和噪音係在一頻域而被產生以及在該頻域被產生之該柔和噪音係被頻時轉換。
- 如申請專利範圍第1項所述之裝置,其中該選擇器(110)係將該聲音輸入訊號之一背景噪音之一傾斜決定為該背景噪音特性;以及其中該選擇器(110)係依據該傾斜而從至少二柔和噪音產生模式中選擇該柔和噪音產生模式。
- 如申請專利範圍第2項所述之裝置,其中該裝置更包含一噪音估計器(105),其係用以為各頻帶估計該背景噪音之一各頻帶估計;以及其中該選擇器(110)係依據該等頻帶之該被估計背景噪音而決定該傾斜。
- 如申請專利範圍第3項所述之裝置,其中該噪音估計器(105)係依據一第一組頻帶之各頻帶之該背景噪音之該各頻帶估計而決定該第一組頻帶之一低頻背景噪音值,該低頻背景噪音值係指出一第一背景噪音能量;其中該噪音估計器(105)係依據一第二組頻帶之各頻帶之該背景噪音之該各頻帶估計而決定該第二組頻帶之一高頻背景噪音值,該高頻背景噪音值係指出一第二背景噪音能量,相較於該第二組頻帶之至少一頻帶之一中心頻率,該第一組頻帶之至少一頻帶具有一較低的中心頻率;以及 其中該選擇器(110)係依據該低頻背景噪音值以及該高頻背景噪音值而決定該傾斜。
- 如申請專利範圍第4項所述之裝置,其中該噪音估計器(105)係依據下式而決定該低頻背景噪音值L,
- 如申請專利範圍第4項所述之裝置,其中該選擇器(110)係依據低頻背景噪音值L以及高頻背景噪音值H而決定傾斜T,就如下式:
- 如申請專利範圍第2項所述之裝置, 其中該選擇器(110)係將該傾斜決定為一現行短期傾斜值(T);其中該選擇器(110)係依據該現行短期傾斜值以及一先前長期傾斜值而決定一現行長期傾斜值;其中該選擇器(110)係依據該現行長期傾斜值而選擇至少二柔和噪音產品模式之其中之一。
- 如申請專利範圍第7項所述之裝置,其中該選擇器(110)係依據下式而決定現行長期傾斜值TcLT,TcLT=α TpLT+(1-α)T;其中T為現行短期傾斜值,TpLT係為該先前長期傾斜值;以及其中α係為介於0與1之間的實數,0<α<1。
- 如申請專利範圍第7項所述之裝置,其中該等柔和噪音產生模式之第一個係為該頻域柔和噪音產生模式;其中該等柔和噪音產生模式之第二個係為一線性預測域柔和噪音產生模式;其中假如一先前由該選擇器110所選擇之產生模式係為線性預測域柔和噪音產生模式並且現行長期傾斜值大於一第一閥值,則選擇器(110)係選擇頻域柔和噪音產生模式;以及假如先前由選擇器(110)所選擇之產生模式係為頻域柔和噪音產生模式並且現行長期傾斜值小於一第二閥值,則選擇器(110)係選擇線性預測域柔和噪音產生模式。
- 一種依據所接收之被編碼聲音資訊而產生一聲音輸出訊號之裝置,包含:一解碼單元(210),其係對該被編碼聲音資訊進行解碼以得到被編碼於該被編碼聲音資訊內之模式資訊,其中該模式資訊係指出至少二柔和噪音產生模式之一被指出柔和噪音產生模式;以及一訊號處理器(220),其係藉由依據該被指出之柔和噪音產生模式而產生柔和噪音而產生該聲音輸出訊號,其中該等柔和噪音產生模式之第一個係為一頻域柔和噪音產生模式, 以及其中假如該被指出之柔和噪音產生模式係為頻域柔和噪音產生模式,該訊號處理器係在一頻域並藉由實施在該頻域中被產生之該柔和噪音之一頻時轉換而產生該柔和噪音。
- 如申請專利範圍第10項所述之裝置,其中該等柔和噪音產生模式之第二個係為一線性預測域柔和噪音產生模式;以及其中假如該被指出之柔和噪音產生模式係為該線性預測域柔和噪音產生模式,則訊號處理器(220)係藉由使用一線性預測濾波器而產生該柔和噪音。
- 一種用以產生聲音輸出訊號之系統,包含:如申請專利範圍第1至9項其中一項所述之一裝置(100)供編碼聲音資訊;以及如申請專利範圍第10項或第11項所述之一裝置(200)供依據所接收之被編碼聲音資訊而產生一聲音輸出訊號;其中如申請專利範圍第1至9項其中一項所述之該裝置(100)之該選擇器(110)係依據一聲音輸入訊號之一背景噪音特性而從至少二柔和噪音產生模式中選擇一柔和噪音產生模式;其中如申請專利範圍第1至9項其中一項所述之該裝置(100)之該編碼單元(120)係編碼該聲音資訊以得到被編碼之聲音資訊,該聲音資訊包含模式資訊,該模式資訊係指出被選擇之該柔和噪音產生模式為一被指出之柔和噪音產生模式;其中如申請專利範圍第10項或第11項所述之該裝置(200)之該解碼單元(210)係接收該被編碼之聲音資訊,並且更解碼該被編碼之聲音資訊以得到模式資訊,該模式資訊係被編碼於該被編碼之聲音資訊內;以及其中如申請專利範圍第10項或第11項所述之該裝置(200)之該訊號處理器(220)係藉由依據該被指出之柔和噪音產生模式而產生柔和噪音 而產生該聲音輸出訊號。
- 一種編碼聲音資訊的方法,包含:依據一聲音輸入訊號之一背景噪音特性從至少二柔和噪音產生模式中選擇一柔和噪音產生模式;以及編碼該聲音資訊,其中該聲音資訊包含指出被選擇之柔和噪音產生模式之模式資訊,其中該等柔和噪音產生模式之第一個係為一頻域柔和噪音產生模式,並且其中該頻域柔和噪音產生模式係指出該柔和噪音係在一頻域而被產生以及在該頻域被產生之該柔和噪音係被頻時轉換。
- 一種根據所接收之被編碼聲音資訊而產生一聲音輸出訊號之方法,包含:對被編碼聲音資訊進行解碼以得到被編碼於該被編碼聲音資訊內之模式資訊,其中該模式資訊指出至少二柔和噪音產生模式之一被指出之柔和噪音產生模式;以及藉由依據被指出之該柔和噪音產生模式而產生柔和噪音而產生該聲音輸出訊號,其中該等柔和噪音產生模式之第一個係為一頻域柔和噪音產生模式,以及其中假如該被指出之柔和噪音產生模式係為該頻域柔和噪音產生模式,在柔和噪音係在一頻域被產生並且在該頻域中被產生之該柔和噪音之一頻時轉換係被實施。
- 一種當其被執行在一電腦或訊號處理器上時,供實施申請專利範圍第13或14項之方法之電腦程式。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178782.0A EP2980790A1 (en) | 2014-07-28 | 2014-07-28 | Apparatus and method for comfort noise generation mode selection |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201606752A TW201606752A (zh) | 2016-02-16 |
TWI587287B true TWI587287B (zh) | 2017-06-11 |
Family
ID=51224868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104123733A TWI587287B (zh) | 2014-07-28 | 2015-07-22 | 柔和噪音產生模式選擇之裝置與方法 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10089993B2 (zh) |
EP (3) | EP2980790A1 (zh) |
JP (3) | JP6494740B2 (zh) |
KR (1) | KR102008488B1 (zh) |
CN (2) | CN113140224B (zh) |
AR (1) | AR101342A1 (zh) |
AU (1) | AU2015295679B2 (zh) |
CA (1) | CA2955757C (zh) |
ES (1) | ES2802373T3 (zh) |
MX (1) | MX360556B (zh) |
MY (1) | MY181456A (zh) |
PL (1) | PL3175447T3 (zh) |
PT (1) | PT3175447T (zh) |
RU (1) | RU2696466C2 (zh) |
SG (1) | SG11201700688RA (zh) |
TW (1) | TWI587287B (zh) |
WO (1) | WO2016016013A1 (zh) |
ZA (1) | ZA201701285B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424942B1 (en) * | 1998-10-26 | 2002-07-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications system |
TW200912896A (en) * | 2007-06-11 | 2009-03-16 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3989897A (en) * | 1974-10-25 | 1976-11-02 | Carver R W | Method and apparatus for reducing noise content in audio signals |
FI110826B (fi) * | 1995-06-08 | 2003-03-31 | Nokia Corp | Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä |
EP0856185B1 (en) | 1995-10-20 | 2003-08-13 | America Online, Inc. | Repetitive sound compression system |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
US5903819A (en) * | 1996-03-13 | 1999-05-11 | Ericsson Inc. | Noise suppressor circuit and associated method for suppressing periodic interference component portions of a communication signal |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6163608A (en) * | 1998-01-09 | 2000-12-19 | Ericsson Inc. | Methods and apparatus for providing comfort noise in communications systems |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
US6510409B1 (en) * | 2000-01-18 | 2003-01-21 | Conexant Systems, Inc. | Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders |
US6615169B1 (en) | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6662155B2 (en) * | 2000-11-27 | 2003-12-09 | Nokia Corporation | Method and system for comfort noise generation in speech communication |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
US6832195B2 (en) * | 2002-07-03 | 2004-12-14 | Sony Ericsson Mobile Communications Ab | System and method for robustly detecting voice and DTX modes |
CN1703736A (zh) * | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
JP2004078235A (ja) * | 2003-09-11 | 2004-03-11 | Nec Corp | 複数レートで動作する無音声符号化を含む音声符号化・復号装置 |
US8767974B1 (en) * | 2005-06-15 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | System and method for generating comfort noise |
WO2006136901A2 (en) * | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US8032370B2 (en) * | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
CN101087319B (zh) * | 2006-06-05 | 2012-01-04 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US20080208575A1 (en) * | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
CN101394225B (zh) * | 2007-09-17 | 2013-06-05 | 华为技术有限公司 | 一种话音传输的方法和装置 |
CN101335003B (zh) * | 2007-09-28 | 2010-07-07 | 华为技术有限公司 | 噪声生成装置、及方法 |
US8139777B2 (en) * | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
CN101430880A (zh) * | 2007-11-07 | 2009-05-13 | 华为技术有限公司 | 一种背景噪声的编解码方法和装置 |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN101483495B (zh) * | 2008-03-20 | 2012-02-15 | 华为技术有限公司 | 一种背景噪声生成方法以及噪声处理装置 |
CN102136271B (zh) * | 2011-02-09 | 2012-07-04 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
PL2676264T3 (pl) | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
KR101551046B1 (ko) | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
TWI488176B (zh) * | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
EP3373296A1 (en) * | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
US20120237048A1 (en) * | 2011-03-14 | 2012-09-20 | Continental Automotive Systems, Inc. | Apparatus and method for echo suppression |
CN102903364B (zh) * | 2011-07-29 | 2017-04-12 | 中兴通讯股份有限公司 | 一种进行语音自适应非连续传输的方法及装置 |
CN103093756B (zh) * | 2011-11-01 | 2015-08-12 | 联芯科技有限公司 | 舒适噪声生成方法及舒适噪声生成器 |
CN103137133B (zh) * | 2011-11-29 | 2017-06-06 | 南京中兴软件有限责任公司 | 非激活音信号参数估计方法及舒适噪声产生方法及系统 |
CA2894625C (en) | 2012-12-21 | 2017-11-07 | Anthony LOMBARD | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
MY178710A (en) * | 2012-12-21 | 2020-10-20 | Fraunhofer Ges Forschung | Comfort noise addition for modeling background noise at low bit-rates |
CN103680509B (zh) * | 2013-12-16 | 2016-04-06 | 重庆邮电大学 | 一种语音信号非连续传输及背景噪声生成方法 |
-
2014
- 2014-07-28 EP EP14178782.0A patent/EP2980790A1/en not_active Withdrawn
-
2015
- 2015-07-16 RU RU2017105449A patent/RU2696466C2/ru active
- 2015-07-16 KR KR1020177005524A patent/KR102008488B1/ko active IP Right Grant
- 2015-07-16 SG SG11201700688RA patent/SG11201700688RA/en unknown
- 2015-07-16 CA CA2955757A patent/CA2955757C/en active Active
- 2015-07-16 WO PCT/EP2015/066323 patent/WO2016016013A1/en active Application Filing
- 2015-07-16 MX MX2017001237A patent/MX360556B/es active IP Right Grant
- 2015-07-16 ES ES15738365T patent/ES2802373T3/es active Active
- 2015-07-16 MY MYPI2017000134A patent/MY181456A/en unknown
- 2015-07-16 EP EP20172529.8A patent/EP3706120A1/en active Pending
- 2015-07-16 EP EP15738365.4A patent/EP3175447B1/en active Active
- 2015-07-16 CN CN202110274103.7A patent/CN113140224B/zh active Active
- 2015-07-16 AU AU2015295679A patent/AU2015295679B2/en active Active
- 2015-07-16 JP JP2017504787A patent/JP6494740B2/ja active Active
- 2015-07-16 PL PL15738365T patent/PL3175447T3/pl unknown
- 2015-07-16 PT PT157383654T patent/PT3175447T/pt unknown
- 2015-07-16 CN CN201580040583.3A patent/CN106663436B/zh active Active
- 2015-07-22 TW TW104123733A patent/TWI587287B/zh active
- 2015-07-28 AR ARP150102396A patent/AR101342A1/es active IP Right Grant
-
2017
- 2017-01-27 US US15/417,228 patent/US10089993B2/en active Active
- 2017-02-21 ZA ZA2017/01285A patent/ZA201701285B/en unknown
-
2018
- 2018-09-25 US US16/141,115 patent/US11250864B2/en active Active
-
2019
- 2019-03-05 JP JP2019039146A patent/JP6859379B2/ja active Active
-
2021
- 2021-03-25 JP JP2021051567A patent/JP7258936B2/ja active Active
-
2022
- 2022-01-04 US US17/568,498 patent/US12009000B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424942B1 (en) * | 1998-10-26 | 2002-07-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications system |
TW200912896A (en) * | 2007-06-11 | 2009-03-16 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
CN101743586A (zh) * | 2007-06-11 | 2010-06-16 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法以及经编码的音频信号 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10734003B2 (en) | Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system | |
US20210166704A1 (en) | Generation of Comfort Noise | |
RU2630887C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
RU2612589C2 (ru) | Низкочастотное акцентирование для основанного на lpc кодирования в частотной области | |
US20180166085A1 (en) | Bandwidth Extension Audio Decoding Method and Device for Predicting Spectral Envelope | |
JP2009530685A (ja) | Mdct係数を使用する音声後処理 | |
JP6180544B2 (ja) | オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 | |
RU2763848C2 (ru) | Улучшенное расширение диапазона частот в декодере звукового сигнала | |
JP6181773B2 (ja) | Celp状コーダのためのサイド情報を用いないノイズ充填 | |
WO2024051412A1 (zh) | 语音编码、解码方法、装置、计算机设备和存储介质 | |
US20200273475A1 (en) | Selecting pitch lag | |
JP6626123B2 (ja) | オーディオ信号を符号化するためのオーディオエンコーダー及び方法 | |
TWI587287B (zh) | 柔和噪音產生模式選擇之裝置與方法 |