TW440812B - An adaptive criterion for speech coding - Google Patents

An adaptive criterion for speech coding Download PDF

Info

Publication number
TW440812B
TW440812B TW088113965A TW88113965A TW440812B TW 440812 B TW440812 B TW 440812B TW 088113965 A TW088113965 A TW 088113965A TW 88113965 A TW88113965 A TW 88113965A TW 440812 B TW440812 B TW 440812B
Authority
TW
Taiwan
Prior art keywords
patent application
signal
balance factor
sound signal
original sound
Prior art date
Application number
TW088113965A
Other languages
English (en)
Inventor
Erik Ekudden
Roar Hagen
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22510960&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TW440812(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Application granted granted Critical
Publication of TW440812B publication Critical patent/TW440812B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0003Backward prediction of gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/935Mixed voiced class; Transitions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

44 08 12 五、發明說明(1) 發明領域 概略而言,本發明係關於語音編碼,特別係關於適合較 低位7L速率之仿雜訊信號之改良編碼準則3 發明背景 >大半近代語音編碉器係基於某種模式用於產生編碼語音 ,號。該模式之參數及信號被量化,及描述該等參數及信 號之資訊被傳輸於頻道β蜂巢式電話用途之主要編碼器模 式為碼激勵線性預測(CE LP )技術。 習知CELP解碼器說明於圖1。編碼語音係由激勵信號饋 送通過具有典型順序之全極合成濾波器丨〇產生。激勵信號 也成為兩種彳g说c a及c f之和,c a及c f係拾取自個別的編碼 部(一者為固定及一者為調適)及隨後乘以適當增益因數ga 及g f。編碼部信號之典型長度5毫秒(一小幀),而合成濾 波器典型每2 0毫秒(一幀)更新一次。CELP模式關聯參數為 合成濾波器係數、編碼部載入及增益因數》 圖2說明習知CELP編碼器。CELP解碼器(圖1)之複製用於 對各小楨產生候選編碼信號。編碼信號比較未編碼(數位 化)信號於2 1 ’及加權誤差信號闬於控制編碼過程。合成 ’慮波器係使用線性預測(L P)決定。習知編碼程序稱作線性 預剛藉合成分析(LPAS)。 由前文說明瞭解,LP A S編碼器採用波形匹配加權語音領 域’亦即誤差信號以加權濾波器濾波。可表示為如下減低 平方差準則:
第5頁 ogi ^ 〇 I £ 五、發明說明(2)
Dw= II ST-CSW [|2= II W · S-W · Η · (ga · ca + gf · cf) ||2 C式1) 此處S為含有未編碼語音樣本之一小幀之向量,ST表示s乘 一加權濾波器,c a及c f為分別得自調適及固定編碼部之 編碼向量,為進行加權濾波作業之矩陣,Η為進行合成濾 波作業之矩陣及CSff為編碼信號乘以加權濾波器W。習知減 少式1準則之编碼作業係根據下列步驟進行: 步驟1.藉線性預測計算合成濾波器及量化濾波器係數。 加權濾波器係由線性預測濾波器係數計算而得。 步驟2.碼向量ca之尋找方式係經由搜尋調適編碼部來減 低式1 D,,假設gf為零及ga等於最佳值。由於各碼向量ca 具有習知關聯的最佳值g a,故搜尋之進行方式係將各碼向 量c a連同期關聯之最佳g a值帶入式1 。 步驟3.碼向量c f之尋找方式係經由使用步驟2找到的碼 向量ca及增益ga,搜尋固定編碼部來使Dw減至最低。固定 增益ga假定等最佳值。 步驟4.增益因數g a及g f經量化。注意若使用純量量化 器,則於步驟2後ga可被量化。 前述波形匹配程序已知效果良好,至少對約8千位元/秒 或以上之位元速率工作良好。但當降低位元速率時,則非 週期性、仿雜訊信號例如未發聲之語音及背景雜訊的波形 匹配能力不良。對於有聲語音節段,波形巴配準則效果仍 然良好,但對仿雜訊信號則波形匹配能力不良,結果導致
五、發明說明(3) 編碼信號準位經常過低以及惱人的變化特徵(稱作渦狀打 轉)。 用於仿雜訊信號,業界眾所周知較佳匹配信號之光譜特 性且具有良好信號準位(增益匹配)。因線性預測合成濾波 器可提供信號之光譜特徵,故上式1之替代準則可用於仿 雜訊信號: DE:(/Tcs)2 (式 2) 此處Es為未編碼語音信號能量,及Ees為編碼信號能量 CS=H,(ga -ca+gf .cf)。式2暗示能量匹配係與式1波形 匹配相反。此項準則也可經由含括加權渡波器W用於加權 語音領域。注意平方根作業含括於式2僅在於其準則係於 式1之相同領域;此非必要也非限制性。也有其他可能之 能量巴配準則例如DE = | Es〜Ees | 。 準則可用於其餘領域列式如後:
De = ( AEr^ v^Ex)2 (式3) 此處為經由通過合成濾波器之倒數(Η—1 )濾波S所得殘餘 信號r能量,及£,為激勵信號能量,由x = ga -ca + gf - cf 表示。 如上不同準則用於習知多模編碼,此處不同編碼模(例 如能量匹配)用於未發聲語音及背景雜訊。此等模中使用
第7頁 豸4 1 2 五、發明說明(4) 如式2及3之能量匹配準則。此種辦法的缺點為需要做模決 定,例如對發聲語音選擇波形匹配模(式1 ),及對仿雜訊 信號例如未發聲語音及背景雜訊選擇能量匹配碼(式2及 3) °模之決策敏感,當有錯時引起惱人的缺陷。又各模間 編碼策略激烈改變可能產生非期望的聲音。 因此希望於較低位元速率提供仿雜訊信號之改良之編碼 而又不含前述多模編碼之缺點。 丄本發明較佳組合波形匹配與能量匹配準則來改良仿雜訊 號於較低位元速率編碼而無多模編瑪之缺點。 ®式之簡單說明 圖1圏解說明習知CELP解碼器。 圖2圖解說明習知CELP編碼器。 圖3以線圖說明根據本發明之平衡因數。 圖4以線圖說明圖3之平衡因數之特例》 圖5圖解說明根據本發明之範例CE Lp編碼器之相關部 分。 圖6為流程圖,其說明圖5 CELP編碼器部分之範例作 業。 μ圖7圖解說明根據本發明之通訊系統。 詳細說明 ΰ本發明將波形匹配與能量匹配準則組合成為單一準則 n。波形匹配與能量匹配間之平衡可藉加權因數軟性調 適:
第8頁 4408 1 2 五、發明說明(5)
Dk = K Dw + L . (式 4) 此處K及L為加權因數,決定波形匹配失真D,.與能量匹配失 真D£間之相對權值。加權因數K及L分別設定為等於1 - α及 α如後: DWE = ( 1 - a ) * Dw + α » De (式 5 ) 此處α為平衡因數具有0至1之值來提供準則之波形匹配部 分Dw與能量匹配部ADE間之平衡。α值與目前語音節段較 佳為聲音準位或週期性的函數,¢2 = α(ν),此處ν為聲音 索引。α(ν)函數之草圖範例示於圖3。於聲音準位低於 a,a=d ;於聲音準位高於b,a=c ;及於聲音準位介於 a與b之間,α由d漸漸降低至c。 特定式中,式5準位可表示為: = ( 1 _ ^ ' I! SW-CSW II2 + 〇: · ( /^Es^_ Z^csw )2 (式 6 ) 此處ESij.為信號Sw之能量&Eesw為信號Csw之能量。 雖然如上式6準則或其變化式可優異地用於CELP編碼器 之整個編碼過程,但當僅用於增益量化部分時(亦即前述 編碼方法之步驟4)可獲得顯著改良結果。雖然此處詳細說 明式6準則應用於增益量化,但可以類似方式用於搜尋c a 及c f編碼部。
4408 1 2 五、發明說明(6) 注意式6之Ecs*可表示為〆
Ecsw = II CSW I!2 (式Ό 故式6可改寫為: D,e =(1- α ) · I! SW-CSW [|2 + α ( /Tsw- / II CS, F)2。 (式8) 由式1可知: CSw=W *H *(ga -ca + gf -cf)。 (式 9) 一旦決定碼向量ca及c f,例如使用如上式1及步騍卜3決 定,則其任務係找出對應量化增益值==用於向量量化,此 等量化增益值係以得自向量量化器編碼部之載入表示。編 碼部包括多個載入,各個載入包括一對量化增益值及 。 將得自向量量化器編碼部之各對量化增益值g aQ及g fQ帶 入式9,然後將所得CSW帶入式8,可算出式8全部可能Dh 值。得自向量量化器編碼部獲得最小D,a e值之增益值對係對 量化增益值選出。 若干近代編碼器使用預測量化用於增益值 > 或至少用於 固定編碼部增益值。此乃直接結合於式9,原因為預測係
第10頁 4408 1 2 五、發明說明(7) 於搜尋之前進行。替代將編碼部增益值插入式9,可將編 碼部增益值乘以預測的增益值插入式9。然後所得C S,.帶入 如上式8。 用於增益因數之純量量化,常使用單純準則,此處最佳 增益直接量化,亦即使用準則例如:
Dsgq = (g〇PT^g)2 (式1 〇 ) 此處DSGQ為純量增益量化準則,g0PT為習知於如上步驟2 或3決定之最佳增益(gaQPT或g fQPT),及g為得自ga或gf純量 量化器編碼部之量化增益值。選擇可獲得最小DseQ之量化 增益值。 量化增益因數時,若有所需能量匹配項較佳僅用於固定 編碼部增益,原因為調適編碼部通常對仿雜訊語音段扮演 次要角色。如此式1 0準則可用於量化編碼部增益,而新準 則DsfQ用於量化固定編碼部增益,亦即: 化.-〇= (1-α) '[ f cf\ 12- ( gf〇^-gf) 2 -a- (^-^1 [ qa^ca-gf-cf\|2) 2 ’ ' (式 11) 此處gf0PT為由如上步驟3決定之最佳gf值,及ga3為使用 式1 0決定之量化調適編碼部增益。所有得自g f純量量化器 編碼部之量化增益值皆插入式1 1作為g f,以及選擇可獲得 最小低DgfQ之量化增益值。
第11頁 五、發明說明(8) 平銜因數α之調整始因為使用新準則獲得良好性能關 鍵,如前述α較佳為聲音準位之函數。調適編碼部之编碼 增益為聲音準位之良好索引之一例。如此聲音準位之測定 例包括: vv = 1 0 1 og10 ( II r |i V || r-ga0PT ca || 2) (式1 2) vs ^ 1 0 1 ogi0 ( II r || 2/ || r-gaQ · ca |j 2) (式 1 3 ) 此處vv為用於向量量化之聲音準位測量值,vs為用於純量 量化之聲音準位測量值,且r為前文定義之殘餘信號。 雖然聲音準位係使用式1 2及式1 3於殘餘領域決定,但聲 音準位也可藉由於式1 2及式1 3使用Sw取代r於加權語音領 域決定,及藉W . Η乘以式1 2及1 3之g a ca項於加權語音領 域決定。 為了防止v值的局部起伏不定,v於映射至α領域前可被 滤波。例如目前值及先前4小Ί1貞值之中間值滤波器使用如 後: νη=中間值(V 、V叫、ν_2、ν_3 ' ν_4) (式 14) 此處ν_,、ν_2 ' ν—3、ν_4為先前4小幀之ν值。 圖4所示函數說明由聲音索引vm映射至平衡因數α之一 例。本函數可以數學式表示為
O:\59\59SI1.PTD 苐12頁 44 08 1 2 五、發明說明(9) Ci (vj
'Ο . 5 0.5 - 0-25 D v.sO 0 <v_< 2 . 0 v,-,>2 . 〇 (式 15) 注意α最大值小於1 ,表示未曾出現全然能量匹配,準則 中仍保留若干波形匹紀(參考式5 )。 於語音起點,當信號能量遽增時,調適編碼部之編碼增 益經常小,原因為調適編碼部不含相關信號故。但波形匹 配於開始時相當要緊,因此若偵測得起點則α被強迫移至 零。基於最佳固定編碼部增益之簡單起點偵測使用如後: a (vm) ^ 0 若gf0PT>2, 0 . gf·」 (式16) 此處gfQP1M為如上步驟3對前一小幀測得之最佳固定編碼步 驟。 * 也較佳於前一小巾貞為零時限制α值的增加。可藉由單純, 以α值除以適當數目例如2. 0 (前以α值為零時)實施。如 此可避免由純波形匹配引動至較為能量匹配造成的缺陷。 又一旦使用式1 5及1 6決定平衡因數a ,則可較佳例如使 闬先前小幀之α值求平均而濾波。 如前述,式6(如此式8及9)也可用於選擇調適及固定編 碼部向量c a及c f。因調適編碼部向量尚未知,故無法計算 式1 2及1 3之聲音測量值1故無法計算式1 5之平衡因數α 。 如此為了使用式8及9搜尋固定及調適編碼部,平衡因數α
13頁 440812 五、發明說明(ίο) 較佳設定為實驗上決定可獲得仿雜訊信號之預定結果之 值。一旦經由實驗決定平衡因數,則固定及調適編碼部搜 尋可以如上步驟1- 4陳述之方式但使用式8及9之準則進 行。另外於步驟2已經使用實驗決定的α值而決定ca及ga 後,式1 2 - 1 5可視需要於步驟3搜尋固定編碼部期間用於決 定式8使用之α值。 圖5為根據本發明之CELP語音編碼器範例部分之方塊代 表圖。圖5之编碼器部分包括一準則控制器5 1有一輸入用 於接收未編碼之語音信號,也耦合用於與固定及調適編碼 部6 1及6 2通訊以及與增益量化器編碼部5 Q、5 4及6 0通訊。 準則控制器5 1可進行全部與圖2 CELΡ編碼器設計關聯的習 知作業,包括實施如上式1 - 3及1 0表示之習知準則,以及 進行如上步驟卜4所述習知作業。 除了前述習知作業外,準則控制器5 1也可實施如上式 4 - 9及丨1 - 1 6所述之作業。準則控制器5 1提供聲音決定器 5 3 1附有如上步驟2決定之c a及執行如上步驟1 - 4決定之 g aQPT (或g aQ,若使用純量量化器)。準則控制器進一步應用 反相合成濾波器H—1至未編碼之語音信號藉此決定殘餘信號 r,其亦輸入聲音決定器53。 聲音決定器5 3響應前述輸入根據式1 2 (向量量化)或式 1 3 (純量量化)決定聲音準位索引v。聲音索引準位v提供給 濾波器5 5之輸入,濾波器使聲音準位索引v接收濾波操作 (例如前述中間值i慮波),因而產生一經過渡波的聲音準位 索引為輸出。用於中間值濾波,濾波器5 5可包括如所示
第U頁 44081t 五、發明說明(11) 之記憶體部分5 6用於儲存先前各小幀之聲音準位索引= 由濾波器5 5輸出的經過濾波的準位索引vf輸入平衡因數 決定器5 7。平衡因數決定器5 7使用經過濾波的聲音準位索 引vf來決定平衡因數α ,例如以前文就式1 5 (此處νκ表示圖 5 vf之特例)及圖4所述方式決定。準則控制器5 1將目前小 幀之g fQPT輸入平衡因數決定器57,此值儲存於平衡因數決 定器57之記憶體58用於執行式16。平衡因數決定器也包括 記憶體5 9用於儲存各小幀之α值(或至少零之α值)俾便許 可當關聯前一小幀之α值為零時*許可平衡因數決定器5 7 限制α值的增力^。 一旦準則控制器5 1獲得合成濾波器係數,且應用預定準 則來決定編碼部向量及關聯量化增益值,然後指示此等參 數資訊由準則控制器於5 2輸出而跨越通訊頻道傳送。 圖5也於構想方面說明向量量化器編碼部5 0,及對調適 編碼部增益值ga及固定編碼部增益值gf之各別純量量化器 54及60。如前述,向量量化器編碼部50包括複數載入,各 載入包括一對量化增益值g 及g fQ。純量量化器編碼部5 4 及60對每個載入包括量化增益值。 圖6以流程圖格式說明圖5之範例編碼器部分之範例作業 (詳述如前)。當於6 3接收未編碼語音之新小幀時,於6 4根 據如上準則執行如上步驟1 - 4來決定c a、g a、c f及g f。隨 後於6 5,決定聲音測量值v,隨後於6 6決定平衡因數α 。 然後於6 7,平衡因數用於就波形匹配及能量匹配兩方面定 義增益因數量化準則。若於6 8使用向量量化,則波形匹
第15頁 44 DB1 2 五、發明說明(丨— 一 ~ 画己/ 犯复匹配合併準則DiE於6 9用於量化二增益因數5若使 用純量I /μ α , 重化’則於70,調適編碼部增益ga使用式1 o DSGq量 β 及於71 ’固定編碼部增益g f使用式1 1之波形匹配/能 酉己σ併準則Dgf<}量化。於增益因數被量化後,於63等 候次一小rj)貞。 圖7為根據本發明之包括語音編碼器之範例通訊系統之 方塊圖。圖7中’根據本發明之編碼器7 2於收發器7 3提 供’該故發器透過通訊頻道7 5與收發器7 4通訊。編碼器7 2 接收未編碼之語音信號並提供資訊給頻道7 5,由該資訊, 收發器7 4之習知解碼器7 6 (例如前文就圖1所述)可重構原 音信號。舉例言之,圖7之收發器73及74可為蜂巢式電話 及頻道7 5可為蜂巢式電話網路之通訊頻道。本發明之語音 編碼器7 2之其他應用相當多且顯然易知。 業界人士顯然易知根據本發明之語音編媽器方便使用例 如適當程式規劃數位信號處理器(DSP)或其他資料處理裝 置或單獨或組合外部資源邏輯實施。 新語音編碼準則軟性組合波形匹配與能量匹配。因此可 避免使用另一者或任一者的需求’反而可使用適當混合準 則。可避免介於準則間模決定錯誤的問題。準則之調適性 質使其可順利調整波形匹配與能量匹配間之平衡。因此可 控制由於準則激烈變化造成的缺陷。 若干波形匹配經常性維持於新準則。如此可避免完全不 適當之信號附有高準位聲音類似雜訊叢發問題= 雖然前文已經詳細說明本發明之範例具體例,但並非限
第16頁 ^40812
第17頁

Claims (1)

  1. •4408 1 2 六、申請專利範圍 1. 一種由一原音信號產生複數參數之方法,由該等參數 可重構一近似原音信號,該方法包含: 響應原音信號產生一進一步信號其意圖代表該原音信 號; 決定原音信號關聯波形與進一步信號關聯波形間之第 一差異; 決定由原音信號導出之能量參數及對應與進一步信號 關聯的能量參數間之第二差異;以及 使用該第一及第二差異來決定該等參數中之至少一 者,由該參數可重構近似原音信號。 2. 如申請專利範圍第1項之方法,其中該使用步驟包括 對第一及第二差異指定其用於決定至少一參數之相對重要 性程度。 3. 如申請專利範圍第2項之方法,其中該指定步驟包括 計算一平衡因數其可指示第一及第二差異之相對重要性程 度。‘ 4. 如申請專利範圍第3項之方法,其包括使用該平衡因 數來決定分別關聯第一及第二差異之第一及第二加權因 數,該使用第一及第二差異之步驟包括分別藉第一及第二 加權因數乘以第一及第二差異。 5. 如申請專利範圍第4項之方法,其中該使用平衡因數 決定苐一及第二加權因數之步驟包括選擇性設定加權因數 之一為零。 6. 如申請專利範圍第5項之方法,其中該選擇性設定加
    第18頁
    六、申請專利範圍 權因數之一為零之步驟包括偵測原音信號之語音起點,及 響應偵測得語音起點,設定第二加權因數為零。 7. 如申請專利範圍第3項之方法,其中該計算平衡因數 之步驟包括基於至少一先前算出的平衡因數計算該平衡因 數。 8. 如申請專利範圍第7項之方法,其中該基於先前算出 之平衡因數計算平衡因數之步驟包括響應先前算出之具有 預定幅度之平衡因數限制平衡因數之幅度。 9. 如申請專利範圍第3項之方法 > 其中該計算平衡因數 之步驟包括決定與原音信號關聯之聲音準位,以及計算平 衡因數呈聲音準位之函數。 1 0.如申請專利範圍第9項之方法,其中該決定聲音準位 之步驟包括應用濾波作業至聲音準位而產生經濾波的聲音 準位,該計算步驟包括計算平衡因數呈經過濾波之聲音準 位之函數。 1 1.如申請專利範圍第1 0項之方法,其中該應用濾波作 業之步騍包括應用中間值濾波作業,包括由一組聲音準位 中決定一聲音準位中間值,該組聲音準位包括應用濾波作 業之聲音準位及複數先前決定與原音信號關聯的聲音準 位。 1 2.如申請專利範圍第2項之方法,其中該指定步騍包括 決定與苐一及第二差異關聯的第一及第二加權因數,包括 決定與原音信號關聯的聲音準位,及決定加權因數為聲音 準位之函數。
    第19頁 440B t 2_ 六、申請專利範圍 1 3.如申請專利範圍第1 2項之方法,其中該決定第一及 第二加權因數為聲音準位之函數之步驟包括響應一第一聲 音準位,使第一加權因數大於第二加權因數,及響應一第 二聲音準位其係低於第一聲音準位,使第二加權因數大於 第一加權因數。 1 4.如申請專利範圍第1項之方法,其中該使用步驟包括 使用第一及第二差異來決定量化增益值,該值用於根據碼 激勵線性預測語音編碼程序重構原音信號= 1 5 . —種語音編碼裝置,包含: 一輸入用於接收一原音信號; 一輸出用於提供資訊其可指示參數而由此等參數可重 構近似該原音信號;以及 一控制器耦合於該輸入與輸出間,用於響應原音信號 提供一進一步信號意圖用於表示原音信號,該控制器進一 步基於原音信號與進一步信號間之第一及第二差異決定參 數中之至少一者,其中該第一差異為原音信號關聯波形與 進一步信號關聯波形間之差異,及其中該第二差異為原音 信號導出之能量參數與對應進一步信號關聯之能量參數間 之差異。 1 6.如申請專利範圍第1 5項之裝置,其包括一平衡因數 決定器用於計算一平衡因數可指示該第一及第二差異用於 決定至少一參數時之相對重要性程度,該平衡因數決定器 具有輸出耦合至控制器用於提供平衡因數之控制器同於決 定至少一參數。
    第20頁 440812 六、申請專利範圍 1 7.如申請專利範圍第1 6項之裝置,其包括一聲音準位 決定器耦合至該輸入用於決定原音信號之聲音準位,該聲 音準位決定器具有一輸出耦合至平衡因數決定器輸入,用 於提供聲音準位之平衡因數決定器,該平衡因數決定器可 工作而響應聲音準位資訊決定平衡因數。 1 8.如申請專利範圍第1 7項之裝置,其包括一濾波器耦 合於聲音準位決定器之輸出與平衡因數決定器之輸入間用 於接收來自聲音準位決定器之聲音準位,以及對平衡因數 決定器提供一經濾波的聲音準位。 1 9.如申請專利範圍第1 8項之裝置,其中該濾波器為中 間值遽波器。 2 0,如申請專利範圍第1 6項之裝置,其中該控制器可響 應平衡因數用於決定分別關聯第一及第二差異之第一及第 二加權因數。 2 1.如申請專利範圍第2 0項之裝置,其中該控制器可工 作而分別藉第一及第二加權因數乘以第一及第二差異用於 決定該至少一參數。 2 2.如申請專利範圍第2 1項之裝置,其中該控制器可工 作而響應原音信號的語音起點設定第二差異為零。 2 3,如申請專利範圍第1 6項之裝置,其中該平衡因數決 定器可工作而基於至少一先前算出的平衡因數計算該平衡 因數》 2 4.如申請專利範圍第2 3項之裝置,其中該平街因數決 定器可工作而響應先前計算的具有預定幅度之平衡因數限
    第21頁 4408 1 2 六、申請專利範圍 制該平衡因數之幅度。 2 5.如申請專利範圍第1 5項之裝置,其中該語音編碼裝 置包括一碼激勵線性預測語音編碼器1及其中該至少一參 數為量化增益值。 2 6, —種用於通訊系統之收發器裝置,包含: 一輸入用於接收一使用者輸入刺激; 一輸出用於提供一輸出信號至一通訊頻道用於通過該 通訊頻道傳輸至一接收器;以及 一語音編碼裝置其具有一輸入耦合至該收發器輸入, 及具有一輸出耦合至該收發器輸出,該語音編碼裝置之輸 入係用於接收來自收發器輸入之原音信號,該語音編碼器 之輸出及用於可對收發器輸出提供資訊指示參數1由該等 參數可於收發器重構近似原音信號,該語音編碼裝置包括 一控制器耦合於其輸入與輸出間用於響應原音信號提供進 —步信號,其意圖用於表示該原音信號,該控制器進一步 用於基於原音信號與進一步信號間之第一及第二差異決定 參數中之至少一者,其中該第一差異為原音信號關聯波形 與進一步信號關聯波形間之差異,及其中該第二差異為原 音信號導出之能量參數與對應進一步信號關聯之能量參數 間之差異。 2 7.如申請專利範圍第2 6項之裝置,其中該收發器裝置 構成蜂巢式電話之一部份。
    第22頁
TW088113965A 1998-09-01 1999-08-16 An adaptive criterion for speech coding TW440812B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/144,961 US6192335B1 (en) 1998-09-01 1998-09-01 Adaptive combining of multi-mode coding for voiced speech and noise-like signals

Publications (1)

Publication Number Publication Date
TW440812B true TW440812B (en) 2001-06-16

Family

ID=22510960

Family Applications (1)

Application Number Title Priority Date Filing Date
TW088113965A TW440812B (en) 1998-09-01 1999-08-16 An adaptive criterion for speech coding

Country Status (15)

Country Link
US (1) US6192335B1 (zh)
EP (1) EP1114414B1 (zh)
JP (1) JP3483853B2 (zh)
KR (1) KR100421648B1 (zh)
CN (1) CN1192357C (zh)
AR (1) AR027812A1 (zh)
AU (1) AU774998B2 (zh)
BR (1) BR9913292B1 (zh)
CA (1) CA2342353C (zh)
DE (1) DE69906330T2 (zh)
MY (1) MY123316A (zh)
RU (1) RU2223555C2 (zh)
TW (1) TW440812B (zh)
WO (1) WO2000013174A1 (zh)
ZA (1) ZA200101666B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0005515D0 (en) * 2000-03-08 2000-04-26 Univ Glasgow Improved vector quantization of images
WO2001084536A1 (de) 2000-04-28 2001-11-08 Deutsche Telekom Ag Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector)
DE10026904A1 (de) * 2000-04-28 2002-01-03 Deutsche Telekom Ag Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
CN100358534C (zh) * 2005-11-21 2008-01-02 北京百林康源生物技术有限责任公司 错位双链寡核苷酸在制备治疗禽流感病毒感染的药物中的应用
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
DK2102619T3 (en) * 2006-10-24 2017-05-15 Voiceage Corp METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS
CN101192411B (zh) * 2007-12-27 2010-06-02 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统
JP5425067B2 (ja) * 2008-06-27 2014-02-26 パナソニック株式会社 音響信号復号装置および音響信号復号装置におけるバランス調整方法
JP5701299B2 (ja) * 2009-09-02 2015-04-15 アップル インコーポレイテッド コードワードのインデックスを送信する方法及び装置
JP6073215B2 (ja) * 2010-04-14 2017-02-01 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
EP3058568B1 (en) 2013-10-18 2021-01-13 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
SG11201603041YA (en) 2013-10-18 2016-05-30 Fraunhofer Ges Forschung Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969193A (en) * 1985-08-29 1990-11-06 Scott Instruments Corporation Method and apparatus for generating a signal transformation and the use thereof in signal processing
US5060269A (en) 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US5255339A (en) 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
US5657418A (en) 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
WO1994025959A1 (en) 1993-04-29 1994-11-10 Unisearch Limited Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems
DE69430872T2 (de) * 1993-12-16 2003-02-20 Voice Compression Technologies System und verfahren zur sprachkompression
US5517595A (en) * 1994-02-08 1996-05-14 At&T Corp. Decomposition in noise and periodic signal waveforms in waveform interpolation
US5715365A (en) * 1994-04-04 1998-02-03 Digital Voice Systems, Inc. Estimation of excitation parameters
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
US5649051A (en) * 1995-06-01 1997-07-15 Rothweiler; Joseph Harvey Constant data rate speech encoder for limited bandwidth path
US5668925A (en) * 1995-06-01 1997-09-16 Martin Marietta Corporation Low data rate speech encoder with mixed excitation
FR2739995B1 (fr) 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5819224A (en) * 1996-04-01 1998-10-06 The Victoria University Of Manchester Split matrix quantization
JPH10105195A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
US6148282A (en) 1997-01-02 2000-11-14 Texas Instruments Incorporated Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure

Also Published As

Publication number Publication date
AU774998B2 (en) 2004-07-15
BR9913292B1 (pt) 2013-04-09
BR9913292A (pt) 2001-09-25
US6192335B1 (en) 2001-02-20
RU2223555C2 (ru) 2004-02-10
JP3483853B2 (ja) 2004-01-06
DE69906330D1 (de) 2003-04-30
CN1325529A (zh) 2001-12-05
MY123316A (en) 2006-05-31
EP1114414B1 (en) 2003-03-26
CN1192357C (zh) 2005-03-09
AR027812A1 (es) 2003-04-16
JP2002524760A (ja) 2002-08-06
KR20010073069A (ko) 2001-07-31
CA2342353C (en) 2009-10-20
WO2000013174A1 (en) 2000-03-09
DE69906330T2 (de) 2003-11-27
AU5888799A (en) 2000-03-21
EP1114414A1 (en) 2001-07-11
CA2342353A1 (en) 2000-03-09
KR100421648B1 (ko) 2004-03-11
ZA200101666B (en) 2001-09-25

Similar Documents

Publication Publication Date Title
US10418043B2 (en) Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
US9715883B2 (en) Multi-mode audio codec and CELP coding adapted therefore
TW440812B (en) An adaptive criterion for speech coding
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3483891B2 (ja) スピーチコーダ
CN108831501B (zh) 用于带宽扩展的高频编码/高频解码方法和设备
KR100546444B1 (ko) 씨이엘피 음성코더를 위한 이득양자화
JP3481390B2 (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
TW448417B (en) Speech encoder adaptively applying pitch preprocessing with continuous warping
KR100488080B1 (ko) 멀티모드 음성 인코더
WO2009117967A1 (zh) 编码、解码的方法及装置
KR20010099763A (ko) 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법
JP3616432B2 (ja) 音声符号化装置
KR20050006883A (ko) 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4820954B2 (ja) デジタル音声符号器における高調波ノイズ重み付け
JP3153075B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
KR20220084294A (ko) 생성 모델을 사용한 오디오 신호의 파형 코딩 방법 및 시스템
MXPA01002144A (es) Un criterio adaptable para codificacion de voz
JPH05341800A (ja) 音声符号化装置
JPH0675597A (ja) 音声符号化装置
JPH10313250A (ja) 量子化装置、逆量子化装置及び量子化逆量子化装置

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MK4A Expiration of patent term of an invention patent