TW454167B

TW454167B - Speech coding with improved background noise reproduction

Info

Publication number: TW454167B
Application number: TW088113970A
Authority: TW
Inventors: Ingemar Johansson; Jonas Svedberg; Anders Uvliden
Original assignee: Ericsson Telefon Ab L M
Priority date: 1998-09-16
Filing date: 1999-08-16
Publication date: 2001-09-11
Also published as: WO2000016313A1; DE69935233D1; JP2002525665A; EP1112568A1; CN1318187A; CA2340160C; CA2340160A1; EP1879176B1; HK1117629A1; US6275798B1; BR9913754A; MY126550A; CN1244090C; KR20010090438A; KR100688069B1; EP1112568B1; ZA200101222B; AU6377499A; JP4309060B2; EP1879176A2

Description

454167 五、發明說明（1) 發明領域概略而言，本發明係關於語音編碼中背景雜訊的再生。、’ ‘焉’特別係關於語音編發明背景於線性.預測型語音編碼器例如碼音編碼器中，輸入的原音信號典勵線性預測(_語典型幀長度為20毫秒或i 6〇樣本，破劃分為多塊稱作巾貞。知電話頻寬蜂巢式用途。幀典型再^幀長度常用於例如習幀通常長5毫秒或4 0樣本。追一步劃分為小幀，小例如前述習知語音編碼器中，點的參數於語音編碼過程二述音軌、音高.及其它特緩慢的參數係以逐幀基準 :信號中被提取出。改變謂之短期預測器（STP)參數/1 °明_慢改變的參數例包括所預測語音編碼器之合成溏波、曰執。STP參數定義線性 :參數，例如音高及‘狀系數。較為快速改變各小幀運算。啊办狀及創新增益參數典型則對每. 於參數運算後將其量化的表示值，例如線譜頻率/ f常被轉成遠更適合量 LSF表示值為業界眾所周知。表不值。STP參數轉換成一旦參數已經被量化。入其中隨後交織及調控夂：：^控：碼及檢查和資訊被加頻道傳輪至接收器，其數資訊跨越通訊音編碼程序反向的程序，二二2，器基本上執行與前述語原音信號。語音解碼器：用：音仏號其密切近似中’吊應用後遽波至被合成的語音第5頁

發明說明（2) 信號來增進接收得的信號品質。使用線性預測模# Γ 4 慎調整適應語音喝；= ”編碼器典型極為審再生例如背景雜碼15之非語音信號的合成或化參數資訊由頻：直t不良通訊情況下例如當量加低劣。即使於；雜訊的再生甚至更於接收器察覺為起伏波^不者景雜訊仍常由聆聽者此項問題的理由主要在於習用於逐人成器中，，差（MSE)準則，結合目標與^成^路分析的平均平良。於不良頻道條件下，或以間之父互關係不為背景雜訊準位起伏不定。聆^去^題甚至更惡化，原因預期背景雜訊準位應該變化極其、緩：覺極其惱A，原因為改良於清靜和吵雜頻道條件下察二 :之運之-包括使用語音活性偵：J的背景雜訊品質的解 :的：號是否為語音或非語音做’其對正在編疋。基於硬式決定，不同 =式（例如是或否）決定為非語音，則解瑪器可應用於解妈器。例背景雜訊之頻錯變化變ii信號為背景雜訊且缺點為跨聽者可聽到解；ΐ:順。但此種硬式決非&曰處理動作間的切換。馬為；丨於語音處理動作鱼除了前述問題外，背景雜少、如低於8千位元/秒）時甚。的劣再生於較低位元條件τ，背景雜^V:。於較低位元主又支化不自然5丨起的撲動欵應。、、到由於解碼背景雜訊

4541 6 五、發明說明（3) 望提供於線性預測語音解瑪器如景：汛，㈣避免前述聆聽者二^再生背式）增減能量夕卜摩而使正在重構可逐漸（或軟平順化能量外廓而無可察覺的t θ。该千順。如此經由解除作動之缺點·^ M 2 4 置卜廓平順過程之作動/ 圖式之簡單解決月景雜訊再生問題。圖1况明習知線性預測語音解圖2句昍4Θ站丄 π 益 < 相關部分〇分。叫艮據本發明之線性預測語音解碼器之相關部圖3說明圖2之修飾器之進一步細節。範程圖格式說明可藉圖2及3之語音解碼器執行的圖5說明根據本發明之通訊系統。關圖解說明根據本發明之混合因數與固定度測量間之圖7說明圖2及3之語音重構器之部分細砰細說明 1 瑪Ξ =圖式"?f知線性預測語音解碼器如celp解部^中，瞭解本發明°圖1之習知解碼器道，i :、疋器11由語音編碼器（透過習知通訊頻能接Hi顯示)接收可指示將由解碼器用於重構而儘可，、原曰信號之參數資訊。參數決定器丨丨由編 ’、定能量參數及其它目前小幀或巾貞參數。量參數；二/

4 5 4 1 6 7 五、發明說明（4) -- 標示為EnPar(i)，其它參數（指示於13)標示為

OtherParCi) ’ i為目前小幀（或幀）之小幀（或幀）指數。參數輸入語音重構器15，其由能量參數及其它參數合成或重構原音之近似及背景雜訊。 ° 一習知能量參數EnPar(i )之例包括用於CELP模式之習知固定編碼薄增益，長期預測器增益，及幀能量參數。其它表數〇1±6^&1'(;[)之習知例包括前述31'1>參數之1^以表示值/ 能量參數及其它參教輸入圖i之語音重構器15為業界人士眾所周知。圖2圖解說明根據本發明之範例線性預測解碼器如CELp 解碼器之相關部分。圖2解碼器包括習知圖丨之參數決定器 11及語音重構器25。但於圖2由參數決定器11輸出的能量1 參數EnPar(i)係輸入能量參數修飾器21，而其又輸出修飾，的能量參數EnPar(i)mc)d，修飾後的能量參數連同參^決疋器11產生的參數EnPar(i)及OtherPar(i) —起輪入語音重構器2 5。 °°曰能量參數修飾器21接收由參數決定器11輸出的其它參數之控制輪入2 3 ’也接收可預測頻道情況的控制輪入。響應此等控制輸入，能量參數修飾器選擇性修飾能量參數 E.nPar(i)及輸出修飾後的能量參數。修飾後的月匕量參數提供改良之背景雜訊再生，而無前述習知解碼器粉聽者可察覺背景雜訊再生關聯的缺點，如圖1說明。本發明之一範例實施例中，能量參數修飾器2 1嘗試僅平順化靜態背景雜訊之能量外廓。靜態背景雜訊表示大致穩

45 4 1 6 7 五、發明說明（5) 定的背景雜訊，例如於行進中的汽車使用蜂巢式電話呈現的背景雜訊。一範例實施例中，本發明利用目前及先前短期合成濾波器係數（STP參數）來獲得信號靜態程度測量值。此等參數典型受良好保護避免頻道誤差。使用目前及先前短期濾波器係數測量靜態程度之一例列舉如後： diff =Σ I - lsfj \/lsfAverj -(式 1) 如上式1中，1 s q表示與目前小幀關聯的短期濾波器係數之線譜頻率表示值中之第j線譜頻率係數。又式1中， 1 s f Ave rj表示得自先前N幀之第j短期濾波器係數之1 s f表示平均，此處N例如設定為8。如此對式1右侧加總信號的計算對短期濾波器係數之各線譜頻率表示進行加總。舉例言之，典型有1 0個短期濾波器係數（對應於第1 0級合成濾波器），因而有1 0個對應之線譜頻率表示值，故j將索引 1 s f由1至1 0。本例中對各小幀而言，將於式1計算1 0個值 (一者用於短期濾波器係數），然後1 0個值加總而對該小幀提供固定程度測量值diff。注意式1係以小幀基準應用，即使短期濾波器係數及對應之線譜頻率表示值僅每幀更新一次亦如此。此點為可能，原因為習知解碼器對各小幀内插各線譜頻率值1 s f。如此於習知CELP解碼作業中，各小幀被指定一組内插所得 1 s f值。使用前述例，各小幀被指定1 0個内插所得1 s f值。

第9頁 454 1 6 7

五、發明說明（6) 式1之1 s f A veγ】·項於1 s f值之小幀内插時可考慮但不.一定必要。例如1 sf A veq項表示N個先前1 s f值之平均，N個先前幀各有一個平均；或表示4N先前lsf值之平均，對N個先前幀個別的4個小幀各有一個平均（使用内插所得1 s f值）。式1中’ lsf之跨距典型為〇- 7Γ，此處7Γ為抽樣頻率之半。 §十鼻式1 1 s f A v e 項之替代之道如後： lsfAverj(i) = Al · lsfAverj(i-l)+ A2 · lsf^i) (式U) 第 Is (二 A1 比此處1sfAverj(i) & Averj(i-1)項分別對應於 α-：〇幀之第i lsf表示值，及lsfj(i)為第丄幀1幀及 f表不值。對第—幀而言，當i = l時可對lsfAVerr . J個 D項選擇適當（例如經由實驗決定的;/ 1 ) =之範例值包括Α1 = 〇.8“Α2 = 〇.16。如：：)初值。别述8巾貞平均範例較為不複雜。气1Α之運算式1之固定度測量# , A . i J; 表示目前小巾貞之譜與信號能量之強力變均错之差別如何。譜形狀差語音的背景雜訊類型而言，d⑴極低：對難以編石馬之作啤。現例如背景雜訊而言，較佳旦式=定程度測量之替代式中的u 1 si〗替代。項可由 a 與點生 J里平順.

五、發明說明（7) 里夕卜靡而非热一 ~ ~ " " 用办、難以達成的確+ 二决定能量外廓需要如刀波形四配。固定度測量值d i f f 作器處理過程中軟式W ，平順。能量外廓的平順可於解 =業的作動/解除作動。或去除：以防聽覺可察覺的平順 k，範例方程式表示為此d 1 f f測量值用於定義混合因 K,))/^ (式 2) -因數k對有發生語音大半等於 1 (未經能量外廓平順） (全能量外廓平順）β κ (K2, max(〇, diff 此處Kl及1經選擇而使以及對靜態背景雜訊大半等於零圖6以線圖說明對述及=之適例為K 4G及1(2 = 0, 25。因數k間之關孫士步r 之固定度測量值心行與混合 + ^1.“、係’此處1(1 = 0.4。及1 = 0.25。混合因數1^可列，二？ ^則$值之任何其它適當函數F，k = F(diff)。 /之症量參數修飾器21也使用與先前小幀關聯的能量參數，產生經修飾的能量參數EnParU)—。例如修飾器21 <運鼻圖2習知接收的能量參數EnP a r(i)之時間平均值。時間平均值例如計算如後： M-\ (式3)

EnPar{i)av^- ^ b( EnPar(i-m) 此處bi用於表示能量參數之加權和。例如bi值可設定為1 /Μ 來由過去Μ個小幀獲得能量參數值之真正平均值。式3之平

第11頁 454167 五、發明說明（8) 〜---—- 均值無需以單一小幀基準計算而可對Μ個幀進行。平均其準隨被求平均的能量參數以及希望的處理類型而定。一已經使用式3算出能量參數EnPar (i )avg之時間平均值版本’則混合因數k用於控制介於使用接收得之能量參數肋1^1^1)與使用平均能量參數值EnPar(i )avg間之軟式或漸進切換。應甩混合因數k之範例方程式如後：

EnPar (i )m〇d = k . EnPar (i ) + (1-k ) · EnPar(i)avg ' (式 4) =j4顯然易知當k為低時（固定背景雜訊）則主要使用平均能量f數來平順能量外廓。它方面，當k高時，則主要伏I目别參數來平順能量外廓。對中間值k而言，將計算 1 :t數與平均參數之混合值。也注意式3及4之作業可應、何所需能量參數，應用於儘量多個能量參數，以及應用於任何預定能量參數的組合。产現在參照輸入圖2之能量參數修飾器21之頻道條件，此等頻道條件習知可用於線性預測解碼器如CELP解碼器，例如以，道解碼資訊及CRC檢查和形式使用。例如若無CRC檢查和誤差，則表示好頻道，但若於指定小幀序列有、’過多 CRC檢查和誤差，則表示編碼器與解碼器間之内部狀態不四配。最後，若指定幀具有CRC檢查和誤差，則表示g傾 2 = 土賴。前述良好頻道案例中，能量參數修舞器例X如採用保寸辦法，於式3設定Μ等於4或5。於前述懷疑編碼器/

第12頁 454167 五、發明說明（9) 解碼器内部狀態不匹配之案例，圖2之能量參數2 1，例如可經由增加式2 &值由〇. 4至例如0. 5 5而改變漫合因數k 由式4及圖6可知，&值增加將使混合因數k對較為寬廣的 dj f f值保持為零（全然平順），如此提高式4之時間平^能量參數項EnPar( i)avg的影響。若頻道情況資訊指示為不& 巾貞，則圖2之能量參數修飾器2 1例如可提高式2 K ' w ( 也增加式3 Μ值。 1 ^ ^ 圖3圖解說明圖2之能量參數修飾器21之實施例。圖3 ，EnPar(1)及目前傾之lsf值標示為Uf(i)被接 f並儲存於記憶體31。固定度測定器33由記憶體31獲卩丽及先前lsf值，並執行上式i來決定固定度測量值然後固定度決定器提供diff至混合因數決定器35，其執三上式4來決定混合因數k。然後混合因數二 = 數k至混合邏輯37。益杈仏此合因能量參數平均器39由記憶體31獲得目前及 =運算上式3。然後能量參數平均器提供EnPa；_d) :;J輯37，該邏輯也接收到目前能量參數Enp 二：口，=37運算上式4而產生EnPar(i)_，然後Enpar(i)叱同=^參數EnPar(i)及0therPar(i)輸入語音重構器_ 25。=合因數決定器35及能量參數平均器39各自接收 :利用:頻道條件資訊作為對照輸入，且響應各種：件’被作動而執行前述適當動作。條圖4二明圖2及3之範例線性預測解碼器裝置之範例作 ^ ，參數決定器1 1由編碼器資訊決定語音參數。隨

454167 五、發明說明（ίο) 後於43 ’固定度決定器33決定背景雜訊之固定度測量值。於45，混合因數決定器35基於固定度測量值及頻道條件資訊決定混合因數k。於4 7，能量參數平均器3 9測定時間平均能量參數EnPar( i )avg。於49 ’混合邏輯37應用混合因數 k至目前能量參數EnPar( i )及平均能量參數EnPar(i )avg來決定修飾後之能量參數EnPar(i)mQd。於40，修飾後之能量參數EnPar(i )_連同參數EnPar(i)及OtherPar( i )供應語音重構器，且由該睿參數重構原音包括背景雜訊的近似值。圖7說明圖2及3之語音重構器2 5之部分實施例。圖7說明參數EnPar(i )及EnPar(i )m(3d如何由語音重構器25用於習知涉及能量參數的運算。重構器25使用參數Enpar(i )於習知能量參數計弄’影響解碼器之内部狀態，該狀態較佳匹配編碼器之對應内部狀態，例如音高史。重構器2 5將修改後的參數EnPar (i)_用於所有其它習知能量參數運算。相反地，圖1之習知重構器1 5將EnPar ( i )用於全部圖7舉例說明之習知能量參數運算。參數Other Par (i )(圖2及3)可以習知用於習見重構器15的相同方式而用於重構器25。圖5為根據本發明之範例通訊系統之方塊圖。於圖5 ,根據本發明之解碼器52係於收發器（XCVR)53提供，收發器透過通訊頻道55與收發器54通訊。解碼器52透過頻道55接收收發|§54之來自編碼|§56的參數資訊，並於收發哭53提4丘重構後的§吾音及背景雜訊給跨聽者。舉例言之，圖5之收發器53及54可為蜂巢式電話’而頻道55為透過蜂巢式電話

第14頁 5416 7 五、發明說明（11) 網路的通訊頻道。本發明之語音解碼器5 2之其它應用相當多且方便易得。業界人士顯然易知根據本發明之語音解碼器可使用例如適當程式化數位信號處理器（DSP )或其它資料處理裝置或單獨或合併外部支援邏輯執行。前述根據本發明之語音解碼可改良再生背景雜訊的能力，包括於不含誤差條件或於不良頻道條件皆改良背景雜訊而未無法接受地劣化語音性能。本發明之混合因數提供可平順作動及解除作動能量平順作業，因此再生語音信號並無由於作動/解除作動能量平順作業造成的可察覺的劣化。又因能量平順作業中使用的先前參數資訊量相當小，故極少有使再生的語音信號劣化的風險。雖然前文已經詳細說明本發明之範例具體例，但其並未囿限本發明之範圍，而可於多種具體例實施。

第15頁

Claims

5 4 16 7 7、申請專利範圍 1. 一種由有關原音信號之編碼資訊產生原音信號之近似值之方法，包含：由編碼資料決定與原音信號之目前節段關聯的目前參數；以及對其中至少一個目前參數，使用該目前參數以及關聯原音信號先前節段之個別對應先前參數來產生一經修飾的參數，且使用該修飾後的參數來產生原音信號之目前節段之近似值。 2. 如申請專利範圍第1項之方法，其中該修飾後之參數係與目前參數不同。 3. 如申請專利範圍第1項之方法，其中該目前參數為指示原音信號目前節段之信號能量之參數。 4. 如申請專利範圍第3項之方法，其中該使用目前參數及先前參數之步驟包括使用先前參數於平均作業來產生平均參數，以及使用平均參數連同目前參數來產生經修飾的參數。 5. 如申請專利範圍第4項之方法，其中該使用目前參數及先前參數之步驟包括決定一混合因數可指示目前參數與平均參數用於產生修飾後參數之相對重要性。 6. 如申請專利範圍第5項之方法，其中該決定一混合因數之步驟包括決定一固定度測量值，其可指示與原音信號之目前節段關聯的雜訊成分之固定度特徵，以及決定該混合因數為固定度測量值之一種函數。 7. 如申請專利範圍第6項之方法，其中該決定固定度測

第16頁 54167 六、申請專利範圍量值之步驟包括對目前參數之至少另一參數，使用目前參數及分別關聯原音信號先前節段之對應先前參數來決定固定度測量值。 8. 如申請專利範圍第7項之方法，其中該後述使用目前及先前參數之步驟包括應用平均作業至先前參數來產生一平均參數，及使用該平均參數連同目前參數來決定固定度測量值。 9. 如申請專利範圍第7項之方法，其中該另一目前參數為用於產生原音信號近似值的一合成濾波器之一濾波係數。 1 0.如申請專利範圍第5項之方法，其中該使用目前參數及平均參數之步驟包括由混合因數決定與目前參數及平均參數分別關聯的進一步參數，以及以個別進一步參數乘以目前參數及平均參數。 1 1.如申請專利範圍第4項之方法，其中該使用先前參數於平均作業之步驟包括響應使用的通訊頻道情況選擇性改變平均作業來提供編碼資訊。 1 2.如申請專利範圍第3項之方法，其中該使用目前參數及先前參數之步驟包括決定一混合因數其可指示先前參數相當於目前參數用於產生修飾後參數之相對重要性。 1 3.如申請專利範圍第1 2項之方法，其中該決定混合因數之步驟包括決定一固定度測量值其可指示與原音信號之目前節段關聯的雜訊成分之固定度特徵，以及決定混合因數為固定度測量值之函數。

第17頁 454167 六、申請專利範圍 1 4.如申請專利範圍第1 2項之方法，其中該決定混合因數之步驟包括響應用於提供編碼資訊之通訊頻道情況選擇性改變混合因數。 1 5.如申請專利範圍第3項之方法，其中該目前參數為用於執行碼激勵線性預測語音解碼過程之固定編碼薄增益。 1 6. —種語音解碼裝置，包含：一輸入用於接收編碼資訊，由此資訊待產生一原音信號近似值；一輸出用於輸出該近似值；一參數決定器耦合至該輸入用於由編碼資訊決定目前；參數，該目前參數將用於產生原音信號之目前節段之近似值；一重構器耦合於參數決定器與輸出間用於產生原音信號近似值；以及一修飾器耦合於參數決定器與重構器間，用於使用至少一目前參數及對應關聯原音信號先前節段之個別先前參數來產生修飾後之參數，該修飾器進一步提供修飾後之參數給重構器用於產生原音信號之目前節段之近似值。 1 7.如申請專利範圍苐1 6項之裝置，其中該經修飾的參數係與目前參數不同。 1 8.如申請專利範圍第1 6項之裝置，其中該目前參數為指示原音信號之目前節段之信號能之參數。 1 9.如申請專利範圍第1 8項之裝置，其中該修飾器包括 •一平均器，用於使用先前參數於平均作業來產生一平均參

第18頁 454167 六、申請專利範圍數，該修飾器可操作而使用平均參數連同目前參數來產生修飾後之參數。 2 〇.如申請專利範圍第1 9項之裝置，其中該修飾器包括一混合因數決定器，用於決定一混合因數其可指示目前參數及平均參數用於產生修飾後參數之相對重要性。 2 1.如申請專利範圍第2 0項之裝置，其中該修飾器包括一固定度決定器耦合介於該參數決定器與混合因數決定器間，用於決定一固定度測量值，其可指示目前節段之雜訊成分之固定度特徵，該混合因數決定器可操作而決定混合因數為固定度測量值之函數。 2 2.如申請專利範圍第2 1項之裝置，其中該固定度決定器可操作而使用至少另一目前參數以及對應之分別關聯原音信號先前節段之先前參數來決定固定度測量值。 2 3.如申請專利範圍第2 2項之裝置，其中該固定度決定器進一步可操作而應用一平均作業至對應於至少另一目前參數的先前參數來產生進一步平均參數，以及使用該進一步平均參數連同另一目前參數來決定固定度測量值。 2 4.如申請專利範圍第22項之裝置，其中該另一目前參數為由重構器執行用於產生原音信號近似值的合成濾波器之濾波係數。 2 5.如申請專利範圍第2 0項之裝置，其中該修飾器包括混合邏輯耦合介於混合因數決定器與重構器間用於由混合因數決定分別關聯該目前參數及平均參數之進一步因數，以及用於以個別進一步因數乘目前參數及平均參數來產生

第19頁 α541 6 7 六、申請專利範圍個別積，該混合邏輯進一步可操作而響應該積產生經修飾之參數。 2 6.如申請專利範圍第19項之裝置，其中該平一輸入用於接收資訊，該資訊可指示提供編碼資訊之頻道情況，該平均器響應該資訊用以選擇性改變平均作業。 27. 如申請專利範圍第18項之裳置，其中該修錦写包括 -混合因數決；til，=決定-現合因數其可指4 數相對於目前參數用於產生修飾後參數之相對重 28. 如申請專利範圍第27項之裝置，其中該修 •固定度決定器耦合於參數決定考盥、、3 匕祜用於決定-固定度測量值其可；數決定器間，之固定度特徵，該混合因數決定月二又之雜讯成分為固定度測量值之函數。疋1^可知作而決定混合因數 29. 如申請專利範圍第27項之奘甚 #丄定器包括一輸入用於接收資訊，^ ” °亥_扣合因數決訊之頻道情況，該混合因數決^ 可指不提供編碼資性改變混合因數。 °可a應該資訊用於選擇 30. 如申請專利範圍苐18項之用於碼激勵線性預測語音解 ^ ，其中該目前參數為 31. 如申請專利範圍第16項之裝'置之'定編碼薄增益。置包括一碼激勵線性預測語音解W /、中该s吾音解瑪裝 3 2. —種用於通訊系統之收發器裝置，包含：輸入用於接收透過一通訊頻道來自一發送器之資訊； Π〇、

ΙΗ 第20頁 4167________ 六、申請專利範圍一輸出用於提供一輸出至收發器的使用者；一 S吾音解碼裝置，其具有一輸入係搞合至該收發器輸入及具有一輸出係耦合至該收發器輸出，該語音解碼裝置之輸入係用於由收發器接收輸入编碼資訊，由該資訊將產生原音信號之近似值，該語音解碼裝置之輪出係用於提供該近似值至收發器輸出；以及該語音解碼裝置進一步包括一參數決定器，其係耦合至語音解碼裝置之輸入用於由編碼資訊決定待用於產生原音心號目前節段近似值之目前參數，一重構器耦合於參數偵測器與語音解碼裝置之輸出間’用於產生原音信號近似值’及一修飾器耦合於參數偵測器與重構器間，用於使用至少一個目前參數及對應之個別關聯原音信號先前節段之先前參數來產生一修飾後之參數，該修飾器進—步提供修錦後之參數給重構器用於產生原音信號目前節段之近似值。 3 3,如申請專利範圍第32項之裝置’其中該收構成蜂巢式電話之一部分。 °裝置

第21頁