TW454167B - Speech coding with improved background noise reproduction - Google Patents

Speech coding with improved background noise reproduction Download PDF

Info

Publication number
TW454167B
TW454167B TW088113970A TW88113970A TW454167B TW 454167 B TW454167 B TW 454167B TW 088113970 A TW088113970 A TW 088113970A TW 88113970 A TW88113970 A TW 88113970A TW 454167 B TW454167 B TW 454167B
Authority
TW
Taiwan
Prior art keywords
parameter
current
patent application
parameters
item
Prior art date
Application number
TW088113970A
Other languages
English (en)
Inventor
Ingemar Johansson
Jonas Svedberg
Anders Uvliden
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22551052&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TW454167(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Application granted granted Critical
Publication of TW454167B publication Critical patent/TW454167B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

454167 五、發明說明(1) 發明領域 概略而言,本發明係關於語音編 碼中背景雜訊的再生。 、’ ‘焉’特別係關於語音編 發明背景 於線性.預測型語音編碼器例如碼 音編碼器中,輸入的原音信號典勵線性預測(_語 典型幀長度為20毫秒或i 6〇樣本,破劃分為多塊稱作巾貞。 知電話頻寬蜂巢式用途。幀典型再^幀長度常用於例如習 幀通常長5毫秒或4 0樣本。 追一步劃分為小幀,小 例如前述習知語音編碼器中, 點的參數於語音編碼過程二述音軌、音高.及其它特 緩慢的參數係以逐幀基準 :信號中被提取出。改變 謂之短期預測器(STP)參數/1 °明_慢改變的參數例包括所 預測語音編碼器之合成溏波、曰執。STP參數定義線性 :參數,例如音高及‘狀系數。較為快速改變 各小幀運算。 啊办狀及創新增益參數典型則對每. 於參數運算後將其量 化的表示值,例如線譜頻率/ f常被轉成遠更適合量 LSF表示值為業界眾所周知。 表不值。STP參數轉換成 一旦參數已經被量化 。 入其中隨後交織及調控夂::^控:碼及檢查和資訊被加 頻道傳輪至接收器,其數資訊跨越通訊 音編碼程序反向的程序,二二2,器基本上執行與前述語 原音信號。語音解碼器:用:音仏號其密切近似 中’吊應用後遽波至被合成的語音 第5頁
發明說明(2) 信號來增進接收得的信號品質。 使用線性預測模# Γ 4 慎調整適應語音喝;= ”編碼器典型極為審 再生例如背景雜碼15之非語音信號的合成或 化參數資訊由頻:直t不良通訊情況下例如當量 加低劣。即使於;雜訊的再生甚至更 於接收器察覺為起伏波^不者景雜訊仍常由聆聽者 此項問題的理由主要在於習用於逐人成器中, ,差(MSE)準則,結合目標與^成^路分析的平均平 良。於不良頻道條件下, 或以間之父互關係不 為背景雜訊準位起伏不定。聆^去^題甚至更惡化,原因 預期背景雜訊準位應該變化極其、緩:覺極其惱A,原因為 改良於清靜和吵雜頻道條件下察二 :之運之-包括使用語音活性偵:J的背景雜訊品質的解 :的:號是否為語音或非語音做’其對正在編 疋。基於硬式決定,不同 =式(例如是或否)決 定為非語音,則解瑪器可應用於解妈器。例 背景雜訊之頻錯變化變ii信號為背景雜訊且 缺點為跨聽者可聽到解;ΐ:順。但此種硬式決 非&曰處理動作間的切換。馬為;丨於語音處理動作鱼 除了前述問題外,背景雜 少、 如低於8千位元/秒)時甚。的劣再生於較低位元 條件τ,背景雜^V:。於較低位元 主又支化不自然5丨起的撲動欵應。、、到由於解碼背景雜訊
4541 6 五、發明說明(3) 望提供於線性預測語音解瑪器如 景:汛,㈣避免前述聆聽者 二^再生背 式)增減能量夕卜摩而使正在重構可逐漸(或軟 平順化能量外廓而無可察覺的t θ。该千順。如此經由 解除作動之缺點·^ M 2 4 置卜廓平順過程之作動/ 圖式之簡單解決月景雜訊再生問題。 圖1况明習知線性預測語音解 圖2句昍4Θ站丄 π 益 < 相關部分〇 分。叫艮據本發明之線性預測語音解碼器之相關部 圖3說明圖2之修飾器之進一步細節。 範程圖格式說明可藉圖2及3之語音解碼器執行的 圖5說明根據本發明之通訊系統。 關圖解說明根據本發明之混合因數與固定度測量間之 圖7說明圖2及3之語音重構器之部分細 砰細說明 1 瑪Ξ =圖式"?f知線性預測語音解碼器如celp解 部^中,瞭解本發明°圖1之習知解碼器 道,i :、疋器11由語音編碼器(透過習知通訊頻 能接Hi顯示)接收可指示將由解碼器用於重構而儘可 ,、原曰信號之參數資訊。參數決定器丨丨由編 ’、定能量參數及其它目前小幀或巾貞參數。量參數;二/
4 5 4 1 6 7 五、發明說明(4) -- 標示為EnPar(i),其它參數(指示於13)標示為
OtherParCi) ’ i為目前小幀(或幀)之小幀(或幀)指數。參 數輸入語音重構器15,其由能量參數及其它參數合成或重 構原音之近似及背景雜訊。 ° 一 習知能量參數EnPar(i )之例包括用於CELP模式之習知固 定編碼薄增益,長期預測器增益,及幀能量參數。其它表 數〇1±6^&1'(;[)之習知例包括前述31'1>參數之1^以表示值/ 能量參數及其它參教輸入圖i之語音重構器15為業界人士 眾所周知。 圖2圖解說明根據本發明之範例線性預測解碼器如CELp 解碼器之相關部分。圖2解碼器包括習知圖丨之參數決定器 11及語音重構器25。但於圖2由參數決定器11輸出的能量1 參數EnPar(i)係輸入能量參數修飾器21,而其又輸出修飾 ,的能量參數EnPar(i)mc)d,修飾後的能量參數連同參^決 疋器11產生的參數EnPar(i)及OtherPar(i) —起輪入語音 重構器2 5。 °°曰 能量參數修飾器21接收由參數決定器11輸出的其它參數 之控制輪入2 3 ’也接收可預測頻道情況的控制輪入。響應 此等控制輸入,能量參數修飾器選擇性修飾能量參數 E.nPar(i)及輸出修飾後的能量參數。修飾後的 月匕量參數提供改良之背景雜訊再生,而無前述習知解碼器 粉聽者可察覺背景雜訊再生關聯的缺點,如圖1說明。 本發明之一範例實施例中,能量參數修飾器2 1嘗試僅平 順化靜態背景雜訊之能量外廓。靜態背景雜訊表示大致穩
45 4 1 6 7 五、發明說明(5) 定的背景雜訊,例如於行進中的汽車使用蜂巢式電話呈現 的背景雜訊。一範例實施例中,本發明利用目前及先前短 期合成濾波器係數(STP參數)來獲得信號靜態程度測量 值。此等參數典型受良好保護避免頻道誤差。使用目前及 先前短期濾波器係數測量靜態程度之一例列舉如後: diff =Σ I - lsfj \/lsfAverj -(式 1) 如上式1中,1 s q表示與目前小幀關聯的短期濾波器係 數之線譜頻率表示值中之第j線譜頻率係數。又式1中, 1 s f Ave rj表示得自先前N幀之第j短期濾波器係數之1 s f表 示平均,此處N例如設定為8。如此對式1右侧加總信號的 計算對短期濾波器係數之各線譜頻率表示進行加總。舉例 言之,典型有1 0個短期濾波器係數(對應於第1 0級合成濾 波器),因而有1 0個對應之線譜頻率表示值,故j將索引 1 s f由1至1 0。本例中對各小幀而言,將於式1計算1 0個值 (一者用於短期濾波器係數),然後1 0個值加總而對該小幀 提供固定程度測量值diff。 注意式1係以小幀基準應用,即使短期濾波器係數及對 應之線譜頻率表示值僅每幀更新一次亦如此。此點為可 能,原因為習知解碼器對各小幀内插各線譜頻率值1 s f。 如此於習知CELP解碼作業中,各小幀被指定一組内插所得 1 s f值。使用前述例,各小幀被指定1 0個内插所得1 s f值。
第9頁 454 1 6 7
五、發明說明(6) 式1之1 s f A veγ】·項於1 s f值之小幀内插時可考慮但不.一定 必要。例如1 sf A veq項表示N個先前1 s f值之平均,N個先 前幀各有一個平均;或表示4N先前lsf值之平均,對N個先 前幀個別的4個小幀各有一個平均(使用内插所得1 s f值)。 式1中’ lsf之跨距典型為〇- 7Γ,此處7Γ為抽樣頻率之半。 §十鼻式1 1 s f A v e 項之替代之道如後: lsfAverj(i) = Al · lsfAverj(i-l)+ A2 · lsf^i) (式U) 第 Is (二 A1 比 此處1sfAverj(i) & Averj(i-1)項分別對應於 α-:〇幀之第i lsf表示值,及lsfj(i)為第丄幀1幀及 f表不值。對第—幀而言,當i = l時可對lsfAVerr . J個 D項選擇適當(例如經由實驗決定的;/ 1 ) =之範例值包括Α1 = 〇.8“Α2 = 〇.16。如::)初值。 别述8巾貞平均範例較為不複雜。 气1Α之運算 式1之固定度測量# , A . i J; 表示目前小巾貞之譜與 信號能量之強力變均错之差別如何。譜形狀差 語音的背景雜訊類型而言,d⑴極低: 對難以編石馬之作啤 。現例如背景雜訊而言,較佳旦 式=定程度測量之替代式中 的u 1 si〗替代。 項可由 a 與 點 生 J里平順.
五、發明說明(7) 里夕卜靡而非热 一 ~ ~ " " 用办、 難以達成的確+ 二决定能量外廓需要如刀波形四配。固定度測量值d i f f 作器處理過程中軟式W ,平順。能量外廓的平順可於解 =業的作動/解除作動。或去除:以防聽覺可察覺的平順 k,範例方程式表示為此d 1 f f測量值用於定義混合因 K,))/^ (式 2) -因數k對有發生語音大半等於 1 (未經能量外廓平順) (全能量外廓平順)β κ (K2, max(〇, diff 此處Kl及1經選擇而使 以及對靜態背景雜訊大半等於零 圖6以線圖說明對述及=之適例為K 4G及1(2 = 0, 25。 因數k間之關孫士步r 之固定度測量值心行與混合 + ^1.“、係’此處1(1 = 0.4。及1 = 0.25。混合因數1^可列 ,二? ^則$值之任何其它適當函數F,k = F(diff)。 /之症量參數修飾器21也使用與先前小幀關聯的能量 參數,產生經修飾的能量參數EnParU)—。例如修飾器21 <運鼻圖2習知接收的能量參數EnP a r(i)之時間平均值。 時間平均值例如計算如後: M-\ (式3)
EnPar{i)av^- ^ b( EnPar(i-m) 此處bi用於表示能量參數之加權和。例如bi值可設定為1 /Μ 來由過去Μ個小幀獲得能量參數值之真正平均值。式3之平
第11頁 454167 五、發明說明(8) 〜---—- 均值無需以單一小幀基準計算而可對Μ個幀進行。平均其 準隨被求平均的能量參數以及希望的處理類型而定。 一已經使用式3算出能量參數EnPar (i )avg之時間平均 值版本’則混合因數k用於控制介於使用接收得之能量參 數肋1^1^1)與使用平均能量參數值EnPar(i )avg間之軟式或 漸進切換。應甩混合因數k之範例方程式如後:
EnPar (i )m〇d = k . EnPar (i ) + (1-k ) · EnPar(i)avg ' (式 4) =j4顯然易知當k為低時(固定背景雜訊)則主要使用平 均能量f數來平順能量外廓。它方面,當k高時,則主要 伏I目别參數來平順能量外廓。對中間值k而言,將計算 1 :t數與平均參數之混合值。也注意式3及4之作業可應 、 何所需能量參數,應用於儘量多個能量參數,以及 應用於任何預定能量參數的組合。 产現在參照輸入圖2之能量參數修飾器21之頻道條件,此 等頻道條件習知可用於線性預測解碼器如CELP解碼器,例 如以,道解碼資訊及CRC檢查和形式使用。例如若無CRC檢 查和誤差,則表示好頻道,但若於指定小幀序列有、’過多 CRC檢查和誤差,則表示編碼器與解碼器間之内部狀態不 四配。最後,若指定幀具有CRC檢查和誤差,則表示g傾 2 = 土賴。前述良好頻道案例中,能量參數修舞器例X如採 用保寸辦法,於式3設定Μ等於4或5。於前述懷疑編碼器/
第12頁 454167 五、發明說明(9) 解碼器内部狀態不匹配之案例,圖2之能量參數2 1,例如 可經由增加式2 &值由〇. 4至例如0. 5 5而改變漫合因數k 由式4及圖6可知,&值增加將使混合因數k對較為寬廣的 dj f f值保持為零(全然平順),如此提高式4之時間平^能 量參數項EnPar( i)avg的影響。若頻道情況資訊指示為不& 巾貞,則圖2之能量參數修飾器2 1例如可提高式2 K ' w ( 也增加式3 Μ值。 1 ^ ^ 圖3圖解說明圖2之能量參數修飾器21之實施例。圖3 ,EnPar(1)及目前傾之lsf值標示為Uf(i)被接 f並儲存於記憶體31。固定度測定器33由記憶體31獲卩 丽及先前lsf值,並執行上式i來決定固定度測量值 然後固定度決定器提供diff至混合因數決定器35,其執三 上式4來決定混合因數k。然後混合因數二 = 數k至混合邏輯37。 益杈仏此合因 能量參數平均器39由記憶體31獲得目前及 =運算上式3。然後能量參數平均器提供EnPa;_d) :;J輯37,該邏輯也接收到目前能量參數Enp 二: 口,=37運算上式4而產生EnPar(i)_,然後Enpar(i)叱 同=^參數EnPar(i)及0therPar(i)輸入語音重構器_ 25。=合因數決定器35及能量參數平均器39各自接收 :利用:頻道條件資訊作為對照輸入,且響應各種 : 件’被作動而執行前述適當動作。 條 圖4二明圖2及3之範例線性預測解碼器裝置之範例作 ^ ,參數決定器1 1由編碼器資訊決定語音參數。隨
454167 五、發明說明(ίο) 後於43 ’固定度決定器33決定背景雜訊之固定度測量值。 於45,混合因數決定器35基於固定度測量值及頻道條件資 訊決定混合因數k。於4 7,能量參數平均器3 9測定時間平 均能量參數EnPar( i )avg。於49 ’混合邏輯37應用混合因數 k至目前能量參數EnPar( i )及平均能量參數EnPar(i )avg來 決定修飾後之能量參數EnPar(i)mQd。於40,修飾後之能量 參數EnPar(i )_連同參數EnPar(i)及OtherPar( i )供應語 音重構器,且由該睿參數重構原音包括背景雜訊的近似 值。 圖7說明圖2及3之語音重構器2 5之部分實施例。圖7說明 參數EnPar(i )及EnPar(i )m(3d如何由語音重構器25用於習知 涉及能量參數的運算。重構器25使用參數Enpar(i )於習知 能量參數計弄’影響解碼器之内部狀態,該狀態較佳匹配 編碼器之對應内部狀態,例如音高史。重構器2 5將修改後 的參數EnPar (i)_用於所有其它習知能量參數運算。相反 地,圖1之習知重構器1 5將EnPar ( i )用於全部圖7舉例說明 之習知能量參數運算。參數Other Par (i )(圖2及3)可以習 知用於習見重構器15的相同方式而用於重構器25。 圖5為根據本發明之範例通訊系統之方塊圖。於圖5 ,根 據本發明之解碼器52係於收發器(XCVR)53提供,收發器透 過通訊頻道55與收發器54通訊。解碼器52透過頻道55接收 收發|§54之來自編碼|§56的參數資訊,並於收發哭53提4丘 重構後的§吾音及背景雜訊給跨聽者。舉例言之,圖5之收 發器53及54可為蜂巢式電話’而頻道55為透過蜂巢式電話
第14頁 5416 7 五、發明說明(11) 網路的通訊頻道。本發明之語音解碼器5 2之其它應用相當 多且方便易得。 業界人士顯然易知根據本發明之語音解碼器可使用例如 適當程式化數位信號處理器(DSP )或其它資料處理裝置或 單獨或合併外部支援邏輯執行。 前述根據本發明之語音解碼可改良再生背景雜訊的能 力,包括於不含誤差條件或於不良頻道條件皆改良背景雜 訊而未無法接受地劣化語音性能。本發明之混合因數提供 可平順作動及解除作動能量平順作業,因此再生語音信號 並無由於作動/解除作動能量平順作業造成的可察覺的劣 化。又因能量平順作業中使用的先前參數資訊量相當小, 故極少有使再生的語音信號劣化的風險。 雖然前文已經詳細說明本發明之範例具體例,但其並未 囿限本發明之範圍,而可於多種具體例實施。
第15頁

Claims (1)

  1. 5 4 16 7 7、申請專利範圍 1. 一種由有關原音信號之編碼資訊產生原音信號之近似 值之方法,包含: 由編碼資料決定與原音信號之目前節段關聯的目前參 數;以及 對其中至少一個目前參數,使用該目前參數以及關聯 原音信號先前節段之個別對應先前參數來產生一經修飾的 參數,且使用該修飾後的參數來產生原音信號之目前節段 之近似值。 2. 如申請專利範圍第1項之方法,其中該修飾後之參數 係與目前參數不同。 3. 如申請專利範圍第1項之方法,其中該目前參數為指 示原音信號目前節段之信號能量之參數。 4. 如申請專利範圍第3項之方法,其中該使用目前參數 及先前參數之步驟包括使用先前參數於平均作業來產生平 均參數,以及使用平均參數連同目前參數來產生經修飾的 參數。 5. 如申請專利範圍第4項之方法,其中該使用目前參數 及先前參數之步驟包括決定一混合因數可指示目前參數與 平均參數用於產生修飾後參數之相對重要性。 6. 如申請專利範圍第5項之方法,其中該決定一混合因 數之步驟包括決定一固定度測量值,其可指示與原音信號 之目前節段關聯的雜訊成分之固定度特徵,以及決定該混 合因數為固定度測量值之一種函數。 7. 如申請專利範圍第6項之方法,其中該決定固定度測
    第16頁 54167 六、申請專利範圍 量值之步驟包括對目前參數之至少另一參數,使用目前參 數及分別關聯原音信號先前節段之對應先前參數來決定固 定度測量值。 8. 如申請專利範圍第7項之方法,其中該後述使用目前 及先前參數之步驟包括應用平均作業至先前參數來產生一 平均參數,及使用該平均參數連同目前參數來決定固定度 測量值。 9. 如申請專利範圍第7項之方法,其中該另一目前參數 為用於產生原音信號近似值的一合成濾波器之一濾波係 數。 1 0.如申請專利範圍第5項之方法,其中該使用目前參數 及平均參數之步驟包括由混合因數決定與目前參數及平均 參數分別關聯的進一步參數,以及以個別進一步參數乘以 目前參數及平均參數。 1 1.如申請專利範圍第4項之方法,其中該使用先前參數 於平均作業之步驟包括響應使用的通訊頻道情況選擇性改 變平均作業來提供編碼資訊。 1 2.如申請專利範圍第3項之方法,其中該使用目前參數 及先前參數之步驟包括決定一混合因數其可指示先前參數 相當於目前參數用於產生修飾後參數之相對重要性。 1 3.如申請專利範圍第1 2項之方法,其中該決定混合因 數之步驟包括決定一固定度測量值其可指示與原音信號之 目前節段關聯的雜訊成分之固定度特徵,以及決定混合因 數為固定度測量值之函數。
    第17頁 454167 六、申請專利範圍 1 4.如申請專利範圍第1 2項之方法,其中該決定混合因 數之步驟包括響應用於提供編碼資訊之通訊頻道情況選擇 性改變混合因數。 1 5.如申請專利範圍第3項之方法,其中該目前參數為用 於執行碼激勵線性預測語音解碼過程之固定編碼薄增益。 1 6. —種語音解碼裝置,包含: 一輸入用於接收編碼資訊,由此資訊待產生一原音信 號近似值; 一輸出用於輸出該近似值; 一參數決定器耦合至該輸入用於由編碼資訊決定目前; 參數,該目前參數將用於產生原音信號之目前節段之近似 值; 一重構器耦合於參數決定器與輸出間用於產生原音信 號近似值;以及 一修飾器耦合於參數決定器與重構器間,用於使用至 少一目前參數及對應關聯原音信號先前節段之個別先前參 數來產生修飾後之參數,該修飾器進一步提供修飾後之參 數給重構器用於產生原音信號之目前節段之近似值。 1 7.如申請專利範圍苐1 6項之裝置,其中該經修飾的參 數係與目前參數不同。 1 8.如申請專利範圍第1 6項之裝置,其中該目前參數為 指示原音信號之目前節段之信號能之參數。 1 9.如申請專利範圍第1 8項之裝置,其中該修飾器包括 •一平均器,用於使用先前參數於平均作業來產生一平均參
    第18頁 454167 六、申請專利範圍 數,該修飾器可操作而使用平均參數連同目前參數來產生 修飾後之參數。 2 〇.如申請專利範圍第1 9項之裝置,其中該修飾器包括 一混合因數決定器,用於決定一混合因數其可指示目前參 數及平均參數用於產生修飾後參數之相對重要性。 2 1.如申請專利範圍第2 0項之裝置,其中該修飾器包括 一固定度決定器耦合介於該參數決定器與混合因數決定器 間,用於決定一固定度測量值,其可指示目前節段之雜訊 成分之固定度特徵,該混合因數決定器可操作而決定混合 因數為固定度測量值之函數。 2 2.如申請專利範圍第2 1項之裝置,其中該固定度決定 器可操作而使用至少另一目前參數以及對應之分別關聯原 音信號先前節段之先前參數來決定固定度測量值。 2 3.如申請專利範圍第2 2項之裝置,其中該固定度決定 器進一步可操作而應用一平均作業至對應於至少另一目前 參數的先前參數來產生進一步平均參數,以及使用該進一 步平均參數連同另一目前參數來決定固定度測量值。 2 4.如申請專利範圍第22項之裝置,其中該另一目前參 數為由重構器執行用於產生原音信號近似值的合成濾波器 之濾波係數。 2 5.如申請專利範圍第2 0項之裝置,其中該修飾器包括 混合邏輯耦合介於混合因數決定器與重構器間用於由混合 因數決定分別關聯該目前參數及平均參數之進一步因數, 以及用於以個別進一步因數乘目前參數及平均參數來產生
    第19頁 α541 6 7 六、申請專利範圍 個別積,該混合邏輯進一步可操作而響應該積產生經修飾 之參數。 2 6.如申請專利範圍第19項之裝置,其中該平 一輸入用於接收資訊,該資訊可指示提供編碼資訊之頻道 情況,該平均器響應該資訊用以選擇性改變平均作業。 27. 如申請專利範圍第18項之裳置,其中該修錦写包括 -混合因數決;til,=決定-現合因數其可指4 數相對於目前參數用於產生修飾後參數之相對重 28. 如申請專利範圍第27項之裝置,其中該修 •固定度決定器耦合於參數決定考盥、、3 匕祜 用於決定-固定度測量值其可;數決定器間, 之固定度特徵,該混合因數決定 月二又之雜讯成分 為固定度測量值之函數。 疋1^可知作而決定混合因數 29. 如申請專利範圍第27項之奘甚 #丄 定器包括一輸入用於接收資訊,^ ” °亥_扣合因數決 訊之頻道情況,該混合因數決^ 可指不提供編碼資 性改變混合因數。 °可a應該資訊用於選擇 30. 如申請專利範圍苐18項之 用於碼激勵線性預測語音解 ^ ,其中該目前參數為 31. 如申請專利範圍第16項之裝'置之'定編碼薄增益。 置包括一碼激勵線性預測語音解W /、中该s吾音解瑪裝 3 2. —種用於通訊系統之收發器裝置,包含: 輸入用於接收透過一通訊頻道來自一發送器之資 訊; Π〇 、
    ΙΗ 第20頁 4167________ 六、申請專利範圍 一輸出用於提供一輸出至收發器的使用者; 一 S吾音解碼裝置,其具有一輸入係搞合至該收發器輸 入及具有一輸出係耦合至該收發器輸出,該語音解碼裝置 之輸入係用於由收發器接收輸入编碼資訊,由該資訊將產 生原音信號之近似值,該語音解碼裝置之輪出係用於提供 該近似值至收發器輸出;以及 該語音解碼裝置進一步包括一參數決定器,其係耦合 至語音解碼裝置之輸入用於由編碼資訊決定待用於產生原 音心號目前節段近似值之目前參數,一重構器耦合於參數 偵測器與語音解碼裝置之輸出間’用於產生原音信號近似 值’及一修飾器耦合於參數偵測器與重構器間,用於使用 至少一個目前參數及對應之個別關聯原音信號先前節段之 先前參數來產生一修飾後之參數,該修飾器進—步提供修 錦後之參數給重構器用於產生原音信號目前節段之近似 值。 3 3,如申請專利範圍第32項之裝置’其中該收 構成蜂巢式電話之一部分。 °裝置
    第21頁
TW088113970A 1998-09-16 1999-08-16 Speech coding with improved background noise reproduction TW454167B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/154,361 US6275798B1 (en) 1998-09-16 1998-09-16 Speech coding with improved background noise reproduction

Publications (1)

Publication Number Publication Date
TW454167B true TW454167B (en) 2001-09-11

Family

ID=22551052

Family Applications (1)

Application Number Title Priority Date Filing Date
TW088113970A TW454167B (en) 1998-09-16 1999-08-16 Speech coding with improved background noise reproduction

Country Status (15)

Country Link
US (1) US6275798B1 (zh)
EP (2) EP1879176B1 (zh)
JP (1) JP4309060B2 (zh)
KR (1) KR100688069B1 (zh)
CN (1) CN1244090C (zh)
AU (1) AU6377499A (zh)
BR (1) BR9913754A (zh)
CA (1) CA2340160C (zh)
DE (2) DE69942288D1 (zh)
HK (1) HK1117629A1 (zh)
MY (1) MY126550A (zh)
RU (1) RU2001110168A (zh)
TW (1) TW454167B (zh)
WO (1) WO2000016313A1 (zh)
ZA (1) ZA200101222B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
JP2000172283A (ja) * 1998-12-01 2000-06-23 Nec Corp 有音検出方式及び方法
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP4464707B2 (ja) * 2004-02-24 2010-05-19 パナソニック株式会社 通信装置
US8566086B2 (en) * 2005-06-28 2013-10-22 Qnx Software Systems Limited System for adaptive enhancement of speech signals
EP3629328A1 (en) 2007-03-05 2020-04-01 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
PL2118889T3 (pl) 2007-03-05 2013-03-29 Ericsson Telefon Ab L M Sposób i sterownik do wygładzania stacjonarnego szumu tła
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN102667927B (zh) * 2009-10-19 2013-05-08 瑞典爱立信有限公司 语音活动检测的方法和背景估计器
JP5840075B2 (ja) * 2012-06-01 2016-01-06 日本電信電話株式会社 音声波形データベース生成装置、方法、プログラム
DE102017207943A1 (de) * 2017-05-11 2018-11-15 Robert Bosch Gmbh Signalbearbeitungsvorrichtung für ein insbesondere in ein Batteriesystem einsetzbares Kommunikationssystem

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5008941A (en) * 1989-03-31 1991-04-16 Kurzweil Applied Intelligence, Inc. Method and apparatus for automatically updating estimates of undesirable components of the speech signal in a speech recognition system
US5148489A (en) * 1990-02-28 1992-09-15 Sri International Method for spectral estimation to improve noise robustness for speech recognition
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
WO1996034382A1 (en) 1995-04-28 1996-10-31 Northern Telecom Limited Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
US5794199A (en) 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission

Also Published As

Publication number Publication date
WO2000016313A1 (en) 2000-03-23
DE69935233D1 (de) 2007-04-05
JP2002525665A (ja) 2002-08-13
EP1112568A1 (en) 2001-07-04
CN1318187A (zh) 2001-10-17
CA2340160C (en) 2010-11-30
CA2340160A1 (en) 2000-03-23
EP1879176B1 (en) 2010-04-21
HK1117629A1 (en) 2009-01-16
US6275798B1 (en) 2001-08-14
BR9913754A (pt) 2001-06-12
MY126550A (en) 2006-10-31
CN1244090C (zh) 2006-03-01
KR20010090438A (ko) 2001-10-18
KR100688069B1 (ko) 2007-02-28
EP1112568B1 (en) 2007-02-21
ZA200101222B (en) 2001-08-16
AU6377499A (en) 2000-04-03
JP4309060B2 (ja) 2009-08-05
EP1879176A2 (en) 2008-01-16
EP1879176A3 (en) 2008-09-10
RU2001110168A (ru) 2003-03-10
DE69942288D1 (de) 2010-06-02
DE69935233T2 (de) 2007-10-31

Similar Documents

Publication Publication Date Title
RU2305870C2 (ru) Оптимизированное по точности кодирование с переменной длиной кадра
JP4112027B2 (ja) 再生成位相情報を用いた音声合成
RU2764287C1 (ru) Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
JP3490685B2 (ja) 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置
EP2981956B1 (en) Audio processing system
US5752222A (en) Speech decoding method and apparatus
JP3842821B2 (ja) 通信システムにおいて雑音を抑圧する方法および装置
EP0998741B1 (en) Speech encoder and speech decoder
CA2179228C (en) Method and apparatus for reproducing speech signals and method for transmitting same
JP4659216B2 (ja) 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化
US20040039464A1 (en) Enhanced error concealment for spatial audio
US20050071153A1 (en) Signal modification method for efficient coding of speech signals
MXPA06012617A (es) Codificacion de audio con diferentes longitudes de cuadro de codificacion.
TW454167B (en) Speech coding with improved background noise reproduction
JP2002533963A (ja) 符号化通信信号の性能改良のための符号化された改良特性
EP0922278B1 (en) Variable bitrate speech transmission system
US20230282220A1 (en) Comfort noise generation for multi-mode spatial audio coding
TW202215417A (zh) 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法
Fatus Parametric coding for spatial audio
Yoon et al. Transcoding Algorithm for G. 723.1 and AMR Speech Coders: for Interoperability between VoIP and Mobile Networks1
JP2003526109A (ja) チャネル利得修正システムと、音声通信における雑音低減方法
MXPA01002332A (en) Speech coding with background noise reproduction

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees