TW440812B

TW440812B - An adaptive criterion for speech coding

Info

Publication number: TW440812B
Application number: TW088113965A
Authority: TW
Inventors: Erik Ekudden; Roar Hagen
Original assignee: Ericsson Telefon Ab L M
Priority date: 1998-09-01
Filing date: 1999-08-16
Publication date: 2001-06-16
Also published as: AU774998B2; MY123316A; DE69906330T2; WO2000013174A1; JP2002524760A; DE69906330D1; RU2223555C2; JP3483853B2; CA2342353C; KR20010073069A; CN1325529A; BR9913292A; ZA200101666B; CN1192357C; AR027812A1; US6192335B1; EP1114414A1; BR9913292B1; KR100421648B1; CA2342353A1

Description

44 08 12 五、發明說明（1) 發明領域概略而言，本發明係關於語音編碼，特別係關於適合較低位7L速率之仿雜訊信號之改良編碼準則3 發明背景 >大半近代語音編碉器係基於某種模式用於產生編碼語音，號。該模式之參數及信號被量化，及描述該等參數及信號之資訊被傳輸於頻道β蜂巢式電話用途之主要編碼器模式為碼激勵線性預測（CE LP )技術。習知CELP解碼器說明於圖1。編碼語音係由激勵信號饋送通過具有典型順序之全極合成濾波器丨〇產生。激勵信號也成為兩種彳g说c a及c f之和，c a及c f係拾取自個別的編碼部（一者為固定及一者為調適）及隨後乘以適當增益因數ga 及g f。編碼部信號之典型長度5毫秒（一小幀），而合成濾波器典型每2 0毫秒（一幀）更新一次。CELP模式關聯參數為合成濾波器係數、編碼部載入及增益因數》圖2說明習知CELP編碼器。CELP解碼器（圖1)之複製用於對各小楨產生候選編碼信號。編碼信號比較未編碼（數位化）信號於2 1 ’及加權誤差信號闬於控制編碼過程。合成 ’慮波器係使用線性預測（L P)決定。習知編碼程序稱作線性預剛藉合成分析（LPAS)。由前文說明瞭解，LP A S編碼器採用波形匹配加權語音領域’亦即誤差信號以加權濾波器濾波。可表示為如下減低平方差準則：

第5頁 ogi ^ 〇 I £ 五、發明說明（2)

Dw= II ST-CSW [|2= II W · S-W · Η · (ga · ca + gf · cf) ||2 C式1) 此處S為含有未編碼語音樣本之一小幀之向量，ST表示s乘一加權濾波器，c a及c f為分別得自調適及固定編碼部之編碼向量，為進行加權濾波作業之矩陣，Η為進行合成濾波作業之矩陣及CSff為編碼信號乘以加權濾波器W。習知減少式1準則之编碼作業係根據下列步驟進行：步驟1.藉線性預測計算合成濾波器及量化濾波器係數。加權濾波器係由線性預測濾波器係數計算而得。步驟2.碼向量ca之尋找方式係經由搜尋調適編碼部來減低式1 D,，假設gf為零及ga等於最佳值。由於各碼向量ca 具有習知關聯的最佳值g a，故搜尋之進行方式係將各碼向量c a連同期關聯之最佳g a值帶入式1 。步驟3.碼向量c f之尋找方式係經由使用步驟2找到的碼向量ca及增益ga，搜尋固定編碼部來使Dw減至最低。固定增益ga假定等最佳值。步驟4.增益因數g a及g f經量化。注意若使用純量量化器，則於步驟2後ga可被量化。前述波形匹配程序已知效果良好，至少對約8千位元/秒或以上之位元速率工作良好。但當降低位元速率時，則非週期性、仿雜訊信號例如未發聲之語音及背景雜訊的波形匹配能力不良。對於有聲語音節段，波形巴配準則效果仍然良好，但對仿雜訊信號則波形匹配能力不良，結果導致

五、發明說明（3) 編碼信號準位經常過低以及惱人的變化特徵（稱作渦狀打轉）。用於仿雜訊信號，業界眾所周知較佳匹配信號之光譜特性且具有良好信號準位（增益匹配）。因線性預測合成濾波器可提供信號之光譜特徵，故上式1之替代準則可用於仿雜訊信號： DE:(/Tcs)2 (式 2) 此處Es為未編碼語音信號能量，及Ees為編碼信號能量 CS=H，（ga -ca+gf .cf)。式2暗示能量匹配係與式1波形匹配相反。此項準則也可經由含括加權渡波器W用於加權語音領域。注意平方根作業含括於式2僅在於其準則係於式1之相同領域；此非必要也非限制性。也有其他可能之能量巴配準則例如DE = | Es〜Ees | 。準則可用於其餘領域列式如後：

De = ( AEr^ v^Ex)2 (式3) 此處為經由通過合成濾波器之倒數（Η—1 )濾波S所得殘餘信號r能量，及£,為激勵信號能量，由x = ga -ca + gf - cf 表示。如上不同準則用於習知多模編碼，此處不同編碼模（例如能量匹配）用於未發聲語音及背景雜訊。此等模中使用

第7頁豸4 1 2 五、發明說明（4) 如式2及3之能量匹配準則。此種辦法的缺點為需要做模決定，例如對發聲語音選擇波形匹配模（式1 )，及對仿雜訊信號例如未發聲語音及背景雜訊選擇能量匹配碼（式2及 3) °模之決策敏感，當有錯時引起惱人的缺陷。又各模間編碼策略激烈改變可能產生非期望的聲音。因此希望於較低位元速率提供仿雜訊信號之改良之編碼而又不含前述多模編碼之缺點。丄本發明較佳組合波形匹配與能量匹配準則來改良仿雜訊號於較低位元速率編碼而無多模編瑪之缺點。 ®式之簡單說明圖1圏解說明習知CELP解碼器。圖2圖解說明習知CELP編碼器。圖3以線圖說明根據本發明之平衡因數。圖4以線圖說明圖3之平衡因數之特例》圖5圖解說明根據本發明之範例CE Lp編碼器之相關部分。圖6為流程圖，其說明圖5 CELP編碼器部分之範例作業。 μ圖7圖解說明根據本發明之通訊系統。詳細說明 ΰ本發明將波形匹配與能量匹配準則組合成為單一準則 n。波形匹配與能量匹配間之平衡可藉加權因數軟性調適：

第8頁 4408 1 2 五、發明說明（5)

Dk = K Dw + L . (式 4) 此處K及L為加權因數，決定波形匹配失真D,.與能量匹配失真D£間之相對權值。加權因數K及L分別設定為等於1 - α及 α如後： DWE = ( 1 - a ) * Dw + α » De (式 5 ) 此處α為平衡因數具有0至1之值來提供準則之波形匹配部分Dw與能量匹配部ADE間之平衡。α值與目前語音節段較佳為聲音準位或週期性的函數，¢2 = α(ν)，此處ν為聲音索引。α(ν)函數之草圖範例示於圖3。於聲音準位低於 a，a=d ;於聲音準位高於b，a=c ;及於聲音準位介於 a與b之間，α由d漸漸降低至c。特定式中，式5準位可表示為： = ( 1 _ ^ ' I! SW-CSW II2 + 〇: · ( /^Es^_ Z^csw )2 (式 6 ) 此處ESij.為信號Sw之能量&Eesw為信號Csw之能量。雖然如上式6準則或其變化式可優異地用於CELP編碼器之整個編碼過程，但當僅用於增益量化部分時（亦即前述編碼方法之步驟4)可獲得顯著改良結果。雖然此處詳細說明式6準則應用於增益量化，但可以類似方式用於搜尋c a 及c f編碼部。

4408 1 2 五、發明說明（6) 注意式6之Ecs*可表示為〆

Ecsw = II CSW I!2 (式Ό 故式6可改寫為： D,e =(1- α ) · I! SW-CSW [|2 + α ( /Tsw- / II CS, F)2。 (式8) 由式1可知： CSw=W *H *(ga -ca + gf -cf)。（式 9) 一旦決定碼向量ca及c f，例如使用如上式1及步騍卜3決定，則其任務係找出對應量化增益值==用於向量量化，此等量化增益值係以得自向量量化器編碼部之載入表示。編碼部包括多個載入，各個載入包括一對量化增益值及。將得自向量量化器編碼部之各對量化增益值g aQ及g fQ帶入式9，然後將所得CSW帶入式8，可算出式8全部可能Dh 值。得自向量量化器編碼部獲得最小D,a e值之增益值對係對量化增益值選出。若干近代編碼器使用預測量化用於增益值 > 或至少用於固定編碼部增益值。此乃直接結合於式9，原因為預測係

第10頁 4408 1 2 五、發明說明（7) 於搜尋之前進行。替代將編碼部增益值插入式9，可將編碼部增益值乘以預測的增益值插入式9。然後所得C S,.帶入如上式8。用於增益因數之純量量化，常使用單純準則，此處最佳增益直接量化，亦即使用準則例如：

Dsgq = (g〇PT^g)2 (式1 〇 ) 此處DSGQ為純量增益量化準則，g0PT為習知於如上步驟2 或3決定之最佳增益（gaQPT或g fQPT)，及g為得自ga或gf純量量化器編碼部之量化增益值。選擇可獲得最小DseQ之量化增益值。量化增益因數時，若有所需能量匹配項較佳僅用於固定編碼部增益，原因為調適編碼部通常對仿雜訊語音段扮演次要角色。如此式1 0準則可用於量化編碼部增益，而新準則DsfQ用於量化固定編碼部增益，亦即：化.-〇= (1-α) '[ f cf\ 12- ( gf〇^-gf) 2 -a- (^-^1 [ qa^ca-gf-cf\|2) 2 ’ ' (式 11) 此處gf0PT為由如上步驟3決定之最佳gf值，及ga3為使用式1 0決定之量化調適編碼部增益。所有得自g f純量量化器編碼部之量化增益值皆插入式1 1作為g f，以及選擇可獲得最小低DgfQ之量化增益值。

第11頁五、發明說明（8) 平銜因數α之調整始因為使用新準則獲得良好性能關鍵，如前述α較佳為聲音準位之函數。調適編碼部之编碼增益為聲音準位之良好索引之一例。如此聲音準位之測定例包括： vv = 1 0 1 og10 ( II r |i V || r-ga0PT ca || 2) (式1 2) vs ^ 1 0 1 ogi0 ( II r || 2/ || r-gaQ · ca |j 2) (式 1 3 ) 此處vv為用於向量量化之聲音準位測量值，vs為用於純量量化之聲音準位測量值，且r為前文定義之殘餘信號。雖然聲音準位係使用式1 2及式1 3於殘餘領域決定，但聲音準位也可藉由於式1 2及式1 3使用Sw取代r於加權語音領域決定，及藉W . Η乘以式1 2及1 3之g a ca項於加權語音領域決定。為了防止v值的局部起伏不定，v於映射至α領域前可被滤波。例如目前值及先前4小Ί1貞值之中間值滤波器使用如後： νη=中間值（V 、V叫、ν_2、ν_3 ' ν_4) (式 14) 此處ν_,、ν_2 ' ν—3、ν_4為先前4小幀之ν值。圖4所示函數說明由聲音索引vm映射至平衡因數α之一例。本函數可以數學式表示為

O:\59\59SI1.PTD 苐12頁 44 08 1 2 五、發明說明（9) Ci (vj

'Ο . 5 0.5 - 0-25 D v.sO 0 <v_< 2 . 0 v,-,>2 . 〇 (式 15) 注意α最大值小於1 ，表示未曾出現全然能量匹配，準則中仍保留若干波形匹紀（參考式5 )。於語音起點，當信號能量遽增時，調適編碼部之編碼增益經常小，原因為調適編碼部不含相關信號故。但波形匹配於開始時相當要緊，因此若偵測得起點則α被強迫移至零。基於最佳固定編碼部增益之簡單起點偵測使用如後： a (vm) ^ 0 若gf0PT>2, 0 . gf·」（式16) 此處gfQP1M為如上步驟3對前一小幀測得之最佳固定編碼步驟。 * 也較佳於前一小巾貞為零時限制α值的增加。可藉由單純，以α值除以適當數目例如2. 0 (前以α值為零時）實施。如此可避免由純波形匹配引動至較為能量匹配造成的缺陷。又一旦使用式1 5及1 6決定平衡因數a ，則可較佳例如使闬先前小幀之α值求平均而濾波。如前述，式6(如此式8及9)也可用於選擇調適及固定編碼部向量c a及c f。因調適編碼部向量尚未知，故無法計算式1 2及1 3之聲音測量值1故無法計算式1 5之平衡因數α 。如此為了使用式8及9搜尋固定及調適編碼部，平衡因數α

13頁 440812 五、發明說明（ίο) 較佳設定為實驗上決定可獲得仿雜訊信號之預定結果之值。一旦經由實驗決定平衡因數，則固定及調適編碼部搜尋可以如上步驟1- 4陳述之方式但使用式8及9之準則進行。另外於步驟2已經使用實驗決定的α值而決定ca及ga 後，式1 2 - 1 5可視需要於步驟3搜尋固定編碼部期間用於決定式8使用之α值。圖5為根據本發明之CELP語音編碼器範例部分之方塊代表圖。圖5之编碼器部分包括一準則控制器5 1有一輸入用於接收未編碼之語音信號，也耦合用於與固定及調適編碼部6 1及6 2通訊以及與增益量化器編碼部5 Q、5 4及6 0通訊。準則控制器5 1可進行全部與圖2 CELΡ編碼器設計關聯的習知作業，包括實施如上式1 - 3及1 0表示之習知準則，以及進行如上步驟卜4所述習知作業。除了前述習知作業外，準則控制器5 1也可實施如上式 4 - 9及丨1 - 1 6所述之作業。準則控制器5 1提供聲音決定器 5 3 1附有如上步驟2決定之c a及執行如上步驟1 - 4決定之 g aQPT (或g aQ，若使用純量量化器）。準則控制器進一步應用反相合成濾波器H—1至未編碼之語音信號藉此決定殘餘信號 r，其亦輸入聲音決定器53。聲音決定器5 3響應前述輸入根據式1 2 (向量量化）或式 1 3 (純量量化）決定聲音準位索引v。聲音索引準位v提供給濾波器5 5之輸入，濾波器使聲音準位索引v接收濾波操作 (例如前述中間值i慮波），因而產生一經過渡波的聲音準位索引為輸出。用於中間值濾波，濾波器5 5可包括如所示

第U頁 44081t 五、發明說明（11) 之記憶體部分5 6用於儲存先前各小幀之聲音準位索引= 由濾波器5 5輸出的經過濾波的準位索引vf輸入平衡因數決定器5 7。平衡因數決定器5 7使用經過濾波的聲音準位索引vf來決定平衡因數α ，例如以前文就式1 5 (此處νκ表示圖 5 vf之特例）及圖4所述方式決定。準則控制器5 1將目前小幀之g fQPT輸入平衡因數決定器57，此值儲存於平衡因數決定器57之記憶體58用於執行式16。平衡因數決定器也包括記憶體5 9用於儲存各小幀之α值（或至少零之α值）俾便許可當關聯前一小幀之α值為零時*許可平衡因數決定器5 7 限制α值的增力^。一旦準則控制器5 1獲得合成濾波器係數，且應用預定準則來決定編碼部向量及關聯量化增益值，然後指示此等參數資訊由準則控制器於5 2輸出而跨越通訊頻道傳送。圖5也於構想方面說明向量量化器編碼部5 0，及對調適編碼部增益值ga及固定編碼部增益值gf之各別純量量化器 54及60。如前述，向量量化器編碼部50包括複數載入，各載入包括一對量化增益值g 及g fQ。純量量化器編碼部5 4 及60對每個載入包括量化增益值。圖6以流程圖格式說明圖5之範例編碼器部分之範例作業 (詳述如前）。當於6 3接收未編碼語音之新小幀時，於6 4根據如上準則執行如上步驟1 - 4來決定c a、g a、c f及g f。隨後於6 5，決定聲音測量值v，隨後於6 6決定平衡因數α 。然後於6 7，平衡因數用於就波形匹配及能量匹配兩方面定義增益因數量化準則。若於6 8使用向量量化，則波形匹

第15頁 44 DB1 2 五、發明說明（丨— 一 ~ 画己/ 犯复匹配合併準則DiE於6 9用於量化二增益因數5若使用純量I /μ α , 重化’則於70，調適編碼部增益ga使用式1 o DSGq量 β 及於71 ’固定編碼部增益g f使用式1 1之波形匹配/能酉己σ併準則Dgf<}量化。於增益因數被量化後，於63等候次一小rj)貞。圖7為根據本發明之包括語音編碼器之範例通訊系統之方塊圖。圖7中’根據本發明之編碼器7 2於收發器7 3提供’該故發器透過通訊頻道7 5與收發器7 4通訊。編碼器7 2 接收未編碼之語音信號並提供資訊給頻道7 5，由該資訊，收發器7 4之習知解碼器7 6 (例如前文就圖1所述）可重構原音信號。舉例言之，圖7之收發器73及74可為蜂巢式電話及頻道7 5可為蜂巢式電話網路之通訊頻道。本發明之語音編碼器7 2之其他應用相當多且顯然易知。業界人士顯然易知根據本發明之語音編媽器方便使用例如適當程式規劃數位信號處理器（DSP)或其他資料處理裝置或單獨或組合外部資源邏輯實施。新語音編碼準則軟性組合波形匹配與能量匹配。因此可避免使用另一者或任一者的需求’反而可使用適當混合準則。可避免介於準則間模決定錯誤的問題。準則之調適性質使其可順利調整波形匹配與能量匹配間之平衡。因此可控制由於準則激烈變化造成的缺陷。若干波形匹配經常性維持於新準則。如此可避免完全不適當之信號附有高準位聲音類似雜訊叢發問題= 雖然前文已經詳細說明本發明之範例具體例，但並非限

第16頁 ^40812

第17頁

Claims

•4408 1 2 六、申請專利範圍 1. 一種由一原音信號產生複數參數之方法，由該等參數可重構一近似原音信號，該方法包含：響應原音信號產生一進一步信號其意圖代表該原音信號；決定原音信號關聯波形與進一步信號關聯波形間之第一差異；決定由原音信號導出之能量參數及對應與進一步信號關聯的能量參數間之第二差異；以及使用該第一及第二差異來決定該等參數中之至少一者，由該參數可重構近似原音信號。 2. 如申請專利範圍第1項之方法，其中該使用步驟包括對第一及第二差異指定其用於決定至少一參數之相對重要性程度。 3. 如申請專利範圍第2項之方法，其中該指定步驟包括計算一平衡因數其可指示第一及第二差異之相對重要性程度。‘ 4. 如申請專利範圍第3項之方法，其包括使用該平衡因數來決定分別關聯第一及第二差異之第一及第二加權因數，該使用第一及第二差異之步驟包括分別藉第一及第二加權因數乘以第一及第二差異。 5. 如申請專利範圍第4項之方法，其中該使用平衡因數決定苐一及第二加權因數之步驟包括選擇性設定加權因數之一為零。 6. 如申請專利範圍第5項之方法，其中該選擇性設定加

第18頁

六、申請專利範圍權因數之一為零之步驟包括偵測原音信號之語音起點，及響應偵測得語音起點，設定第二加權因數為零。 7. 如申請專利範圍第3項之方法，其中該計算平衡因數之步驟包括基於至少一先前算出的平衡因數計算該平衡因數。 8. 如申請專利範圍第7項之方法，其中該基於先前算出之平衡因數計算平衡因數之步驟包括響應先前算出之具有預定幅度之平衡因數限制平衡因數之幅度。 9. 如申請專利範圍第3項之方法 > 其中該計算平衡因數之步驟包括決定與原音信號關聯之聲音準位，以及計算平衡因數呈聲音準位之函數。 1 0.如申請專利範圍第9項之方法，其中該決定聲音準位之步驟包括應用濾波作業至聲音準位而產生經濾波的聲音準位，該計算步驟包括計算平衡因數呈經過濾波之聲音準位之函數。 1 1.如申請專利範圍第1 0項之方法，其中該應用濾波作業之步騍包括應用中間值濾波作業，包括由一組聲音準位中決定一聲音準位中間值，該組聲音準位包括應用濾波作業之聲音準位及複數先前決定與原音信號關聯的聲音準位。 1 2.如申請專利範圍第2項之方法，其中該指定步騍包括決定與苐一及第二差異關聯的第一及第二加權因數，包括決定與原音信號關聯的聲音準位，及決定加權因數為聲音準位之函數。

第19頁 440B t 2_ 六、申請專利範圍 1 3.如申請專利範圍第1 2項之方法，其中該決定第一及第二加權因數為聲音準位之函數之步驟包括響應一第一聲音準位，使第一加權因數大於第二加權因數，及響應一第二聲音準位其係低於第一聲音準位，使第二加權因數大於第一加權因數。 1 4.如申請專利範圍第1項之方法，其中該使用步驟包括使用第一及第二差異來決定量化增益值，該值用於根據碼激勵線性預測語音編碼程序重構原音信號= 1 5 . —種語音編碼裝置，包含：一輸入用於接收一原音信號；一輸出用於提供資訊其可指示參數而由此等參數可重構近似該原音信號；以及一控制器耦合於該輸入與輸出間，用於響應原音信號提供一進一步信號意圖用於表示原音信號，該控制器進一步基於原音信號與進一步信號間之第一及第二差異決定參數中之至少一者，其中該第一差異為原音信號關聯波形與進一步信號關聯波形間之差異，及其中該第二差異為原音信號導出之能量參數與對應進一步信號關聯之能量參數間之差異。 1 6.如申請專利範圍第1 5項之裝置，其包括一平衡因數決定器用於計算一平衡因數可指示該第一及第二差異用於決定至少一參數時之相對重要性程度，該平衡因數決定器具有輸出耦合至控制器用於提供平衡因數之控制器同於決定至少一參數。

第20頁 440812 六、申請專利範圍 1 7.如申請專利範圍第1 6項之裝置，其包括一聲音準位決定器耦合至該輸入用於決定原音信號之聲音準位，該聲音準位決定器具有一輸出耦合至平衡因數決定器輸入，用於提供聲音準位之平衡因數決定器，該平衡因數決定器可工作而響應聲音準位資訊決定平衡因數。 1 8.如申請專利範圍第1 7項之裝置，其包括一濾波器耦合於聲音準位決定器之輸出與平衡因數決定器之輸入間用於接收來自聲音準位決定器之聲音準位，以及對平衡因數決定器提供一經濾波的聲音準位。 1 9.如申請專利範圍第1 8項之裝置，其中該濾波器為中間值遽波器。 2 0,如申請專利範圍第1 6項之裝置，其中該控制器可響應平衡因數用於決定分別關聯第一及第二差異之第一及第二加權因數。 2 1.如申請專利範圍第2 0項之裝置，其中該控制器可工作而分別藉第一及第二加權因數乘以第一及第二差異用於決定該至少一參數。 2 2.如申請專利範圍第2 1項之裝置，其中該控制器可工作而響應原音信號的語音起點設定第二差異為零。 2 3,如申請專利範圍第1 6項之裝置，其中該平衡因數決定器可工作而基於至少一先前算出的平衡因數計算該平衡因數》 2 4.如申請專利範圍第2 3項之裝置，其中該平街因數決定器可工作而響應先前計算的具有預定幅度之平衡因數限

第21頁 4408 1 2 六、申請專利範圍制該平衡因數之幅度。 2 5.如申請專利範圍第1 5項之裝置，其中該語音編碼裝置包括一碼激勵線性預測語音編碼器1及其中該至少一參數為量化增益值。 2 6, —種用於通訊系統之收發器裝置，包含：一輸入用於接收一使用者輸入刺激；一輸出用於提供一輸出信號至一通訊頻道用於通過該通訊頻道傳輸至一接收器；以及一語音編碼裝置其具有一輸入耦合至該收發器輸入，及具有一輸出耦合至該收發器輸出，該語音編碼裝置之輸入係用於接收來自收發器輸入之原音信號，該語音編碼器之輸出及用於可對收發器輸出提供資訊指示參數1由該等參數可於收發器重構近似原音信號，該語音編碼裝置包括一控制器耦合於其輸入與輸出間用於響應原音信號提供進 —步信號，其意圖用於表示該原音信號，該控制器進一步用於基於原音信號與進一步信號間之第一及第二差異決定參數中之至少一者，其中該第一差異為原音信號關聯波形與進一步信號關聯波形間之差異，及其中該第二差異為原音信號導出之能量參數與對應進一步信號關聯之能量參數間之差異。 2 7.如申請專利範圍第2 6項之裝置，其中該收發器裝置構成蜂巢式電話之一部份。

第22頁