TW200830278A - Systems, methods, and apparatus for wideband encoding and decoding of active frames - Google Patents

Systems, methods, and apparatus for wideband encoding and decoding of active frames Download PDF

Info

Publication number
TW200830278A
TW200830278A TW96128123A TW96128123A TW200830278A TW 200830278 A TW200830278 A TW 200830278A TW 96128123 A TW96128123 A TW 96128123A TW 96128123 A TW96128123 A TW 96128123A TW 200830278 A TW200830278 A TW 200830278A
Authority
TW
Taiwan
Prior art keywords
frame
frequency band
voice
description
signal
Prior art date
Application number
TW96128123A
Other languages
English (en)
Other versions
TWI343560B (en
Inventor
Vivek Rajendran
Ananthapadmanabhan Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Priority to TW96128123A priority Critical patent/TWI343560B/zh
Publication of TW200830278A publication Critical patent/TW200830278A/zh
Application granted granted Critical
Publication of TWI343560B publication Critical patent/TWI343560B/zh

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

200830278 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於對語音信號之處理。 【先前技術】 猎由數位技術進行的話音之傳輸已變得較為普遍,尤盆 在長距離電話、諸如IP話音(亦稱作ν〇ιρ,其中1?表示網二 之封包交換電話及諸如蜂巢式電話之數喝 二活中。該擴散化已使得產生了對減少心在傳輸通道 質音通信的資訊之量同時保持重建之語音之感知品 將經組態以藉由提取與人類語音產生之模型相關之表數 而I…之設傷稱作"語音編碼裝置,,。語音編碼 稱作語音編解石馬器或聲碼器)一般包括語音編碼器h立 :早碼益。語音編碼器通常將進入之語音信號(表示音訊資 狀數位k5虎)劃分為稱作"訊框"之時間片段,分析每—訊 =提取特定的相關參數且將參數量化為經編碼之訊框。 在傳輸通道(亦即’有線或無線網路連接)上將經編碼之訊 框傳輸至包括語音解碼哭妓 戰碼之訊框,:=二音解碼器接收並處 θ 對其進仃解夏化以產生參數,且使用狹 解1化之參數來重建語音訊框。 、二 ::編碼器通常經組態以辨別含有語音之語音信號訊框 …”)與僅含有靜默或背景雜訊之語音信 (無效訊框,。扭立絶_ ,一, ),曰編碼-可經組態以使用不同編碼模式 只k w Α對有效及無效訊框進行編碼。舉例而言,語 123360.doc 200830278 音編碼器通常㈣態歧用比對有效訊框進行編碼所使用 之位元少的位元來對無效訊框進行編碼。語音編碼裝置可 對於無效訊框使用較低位元速率且/或對於不同類型之有 效訊框使用不同位元速率從而支援以較低平均位㈣率進 行的語音錢之傳送(存在極少或毫無品f之感知損失)。 傳統上已在頻寬方面將公眾交換電話網路(pstn)上之話 音通信限於300-3400千赫(kHz)之頻率範圍。較新近之用於 話音通信之網路(諸如使用蜂巢式電話及/4V〇ip之網路)可 能並無相同的頻寬限制,且對於使用該等網路之裝置而言 可能需要具有發射及接收包括寬頻頻率範 能力。舉例而言,對於該裝置而言可能需要支援下延日至^ 且/或上延至7 kHz或8 kHz之音訊頻率範圍。對於該裝置而 言亦可能需要支援其他應用,諸如高品f音訊或音訊/視 訊會議、諸如音樂及/或電視之多媒體服務之傳送等等, 該等應用彳具有在傳統PSTN界限以外t範圍巾#音訊語 音内容。 ° 由語音編碼裝置所支援的範圍向較高頻率中之延伸可改 良清晰度。舉例而言,語音信號中區別諸如"s"及"f"之摩 擦音之資訊主要處於較高頻率卜高頻延伸亦可改良經解 碼之語音信號之其他品質,諸如真實感。舉例而言,甚至 有聲母音亦可能具有遠高於pSTN頻率範圍之頻譜能量。 【發明内容】 根據一組態之處理語音信號之方法包括基於該語音信號 之第一有效訊框產生第一語音封包,該第一語音封包包括 123360.doc 200830278 對語音信號的包括第一有效訊框之一部分在(A)第一頻帶 及(B)在第一頻帶上方延伸之第二頻帶上之頻譜包絡的插 述。此方法亦包括基於語音信號之第二有效訊框產生第二 語音封包,該第二語音封包包括對語音信號之包括第二有 效訊框之一部分在第一頻帶上的頻譜包絡之描述。在此方 法中’第二語音封包不包括對在第二頻帶上之頻譜包絡之 描述。 根據另一組悲之語音編碼器包括一封包編碼器及一訊樞 格式化器。封包編碼器經組態以基於語音信號之 訊框且回應於速率控制信號之第一狀態而產生第一語音封 包,其包括對在(1)第一頻帶及(2)在第一頻帶上方延伸之 第二頻帶上的頻譜包絡之描述。封包編碼器亦經組態以美 於語音信號之第二有效訊框且回應於速率控制信號之—不 同於第一狀態之第二狀態而產生第二語音封包,其包括對 在第—頻帶上的頻譜包絡之描述。訊框格式化器經配置以 接收第一及第二語音封包。訊框格式化器經組態以回應於 模糊化控制信號之第一狀態而產生含有第—語音封包=第 一經編碼之訊框。訊框格式化器亦經組態以回應於模糊化 控制信號之不同於第一狀態之第二狀態而產生含有第二注 音封包及與語音信號分離的資訊信號之叢發之第二經編碼 之訊框。在此編碼器中,第一及第二經編碼之訊框具有相 同長度,第一語音封包占該第一經編碼之訊框的至少百八 之八十,第二語音封包占第二經編碼之訊框之不超過— 半,且第二有效訊框在語音信號中緊隨第—有效訊框之 123360.doc 200830278 而出現。 根據另-組態之處理語音封包之方法包括基於來自一來 扁馬之扣音#唬的第—語音封包的資訊而獲得對語音 信號=第一訊框在(Α)第一頻帶及(Β)不同於第一頻帶之第 二頻帶上之頻譜包絡的描述。此方法亦包括基於來自一來 >。爲馬之9 “號之第二語音封包的資訊而獲得對語音 仏號之弟二訊框在第—頻帶上的頻譜包絡之描述。此方法 ”括:於來自第一語音封包之資訊而獲得對第二訊框在 弟一頻帶上之頻譜包絡之描述。此方法亦包括基於來自第 二語音封包之資訊而獲得與第二訊框關於第一頻帶之音高 分量相關之資訊。 二根據另一組態之語音解碼器經組態以基於經編碼之語音 2號計算_碼之語音信號。語音解碼ϋ包括控制邏輯及 封包解碼裔。控制邏輯經組態以產生包含值之序列之控 制虎及序列基於來自經編碼之語音信號之語音封包< 修編碼索引,該序列之每一值對應於經解碼的語音信號之一 :杧週功封包解碼器經組態以回應於該控制信號之具有 第:狀態之值而基於對經解碼之訊框在(1)第一頻帶及^ 在第’上方延伸的第二頻帶上之頻譜包絡之描述計算 該相應經解碼之訊框,該描述係基於來自一來自經編碼: 。曰U之m音封包之資訊。封包解碼器亦經組態以回應 於該控制信號之-具有一不同於該第一狀態之第二狀態之 值而基於⑴對-經解碼之訊框在該第一頻帶上之一頻譜包 絡之一描述,該描述係基於來自一來自該經編碼的語^信 123360.doc 200830278 號之語音封包之資訊,及(2)對該經解碼的訊框在該第二頻 帶上之一頻譜包絡之一描述,該描述係基於來自在該經編 碼的語音信號中出現於該語音封包之前之至少一語音封包 之資訊,而計算該相應的經解碼之訊框。 【實施方式】
下文描述之組態駐存於經組態以使用CDMA無線介面之 無線電話通信系統中。然而,熟習此項技術者將瞭解具有 如本文所述之特徵之方法及裝置可駐存於使用熟習此項技 術者已知的寬廣範圍之技術之各種通信系統中之任一者 中’諸如在有線及/或無線(例如CDMA、TDMA、FDMA及/ 或TD-SCDMA)傳輸通道上使用IP話音(v〇Ip)之系統。明確 地預期且由此揭示該等組態可經調適用於封包交換之網路 (例如,經配置以根據諸如v〇Ip之協定而載運話音傳輸之 有線及/或無線網路)及/或電路交換之網路中。 可將本文描述之組態應用於寬頻語音編碼系統中以支援 有效訊框之模糊化。舉例而言,可應用該等組態以支援將 模糊-叢發技術用於在寬頻語音編碼系統中傳送信號及/或 次要訊務資訊。 除非明確地受上下文限制’否則在本文中使用術語"計 算”以指示其通常意義中之任一者,諸如運算、評估、產 及/或自’组值選擇。除非明確地受上下文限制,否則 使用術語"獲得”以指示其通常意義中之任-者,諸如計 异、導出、接收(例如,自外部設備)及/或擁取(例如,自 :存7L件之陣列)。在於當前描述及申請專利範圍中使用 123360.doc 200830278 ΓΓ包含”時’其不排除其他元件或操作。術語”絲於B” 糸用以指不其通常意義中之任
5 ,κ « 包括以下情況:(i)”A 的)於『及⑻I等於在特^上下文中為適當 =行指示,否則對具有特定特徵之語音編碼壬 ==容亦明確地意欲揭示具有類似特徵之語音編碼的 法(且對具有特定特徵之語音 六介+ 扁碼之方法的任何揭示内 奋’、確地意欲揭示具有類似特 $立 扭祕从a 文之5口曰編碼器)’且對 根據特疋組態之語音編碼器 揭-#缺, 仕仃揭不内容亦明確地意欲 揭不根據類似組態之語音編碼的方法 ^ 之語音編碼之方法的任何揭 、I 、疋組怨 類似έ日& 内谷亦明確地意欲揭示根據 ^ :…音編碼器Ρ除非另行指示,否則對具有特 定特徵之語音解碼器之任何揭 ^ 、 門谷亦明確地意欲揭示具 解:之語音解碼的方法(且對具有特定特徵之語音 法的任何揭示内容亦明確地意欲揭示具有類似特 :§吾音解碼器)’且對根據特定組態之語音解碼器之任 士 + 也w奴揭不根據類似組態之語音解碼的 且對根Jt敎組態之語音解碼之方法的任何揭示内 一明確&意欲揭示根據類似組態之語音解碼器)。 如圖1中所說明,CDMA無線電話系統一般包括經組離 =無線電存取網路以無線方式進行通信之複數個行動;、 D 4無線f存取網路包括複數個基地台12及一咬 二個基地台控制器(BSC)14。該系統一般亦包括麵接至 SC 14之行動交換中心(MSC)16,其經組態以使無線電存 123360.doc 200830278 取網路與習知公眾交換電話網路(pSTN)18介接(可能經由 媒體閘道器)。BSC 14經由回程線路而耦接至基地台12。 回程線路可經組態以支援包括(例如)E1/T1、非同步傳輸模 式(ATM)、網際網路協定(IP)、點對點協定(PPP)、訊框中 繼、高速率數位用戶線(HDSL)、非對稱數位用戶線 (ADSL)或xDSL之若干已知介面中之任一者。 母一基地台12有利地包括至少一扇區(未圖示),每一扇 區包含一全向天線或一指向徑向遠離基地台12之特定方向 之天線。或者,每一扇區可包含兩個天線以進行分集接 收。每一基地台12可有利地經設計以支援複數個頻率分 配。可將扇區與頻率分配之交集稱作CDMA通道。基地台 12亦可被稱為基地台收發器子系統(BTS)12。或者,在業 界可使用’’基地台’’來統稱BSC 14及一或多個BTS 12。亦可 將BTS 12表示為,,蜂巢細胞基地台,,12。或者,可將給定 BTS 12之個別扇區稱作蜂巢細胞基地台。行動用戶單元1 〇 通常為蜂巢式或個人通信服務(PCS)電話1〇。該系統可經 組態以根據IS-95標準之一或多個版本(例如,如由電信工 業聯盟,Arlington, VA發布之 IS-95、IS_95A、IS-95B、 cdma2000)而使用。 在蜂巢式電話系統之典型操作期間’基地台12自行動用 戶單元10之集合接收反向鏈路信號之集合。行動用戶單元 10進行電話呼叫或其他通信。由給定基地台12接收到之^ -反向鏈路信號在彼基地台12中得到處理。將所得資料轉 發至BSC丨4。BSC 14提供,m配置及行動性管理功能 123360.doc -12- 200830278 性,包括對基地台12之間的軟交# , r又遞之控制。BSC 14亦將所 接收之貪料路由至Msc 以用於射s™ 18介接。❹Γ 供額外路由服務 颁似地,PSTN 18與MSC 16介 接’且MSC 16 與 BSC 14 介接,Bsr ^ ^ 接BSC 14又控制基地台12以 將别向鏈路信號之集合傳輸至行動用戶單元此集合。 如圖1所示之蜂巢式電話系 封包g π 、、先之兀件亦可經組態以支援 接至圖2所示’―般藉由使用㈣至連 (pdsn)2科網路之閉道器路由器的封包資料服務節點 以6 動用戶單元10與外部封包資料網路(例如, ,DT,C J路)之間對封包資料訊務進行路 由。PDSN又將資料路由至每一 甘 t服矛力—或多個BSC之一
或夕個封包控制功能(PCF
電存取網路之間的鏈路。”统可:“料網路與無線 〇 °亥系統可經組態以不進入PSTN ^同無線電存取網路上之行動用戶單元之間將電話呼 諸如ν、Γ通仏作為封包資料訊務而進行載運(例如,經由 诸如VoIP之一或多個協定)。 化二A:二弟一語音編碼器3〇a,其經配置以接收經數位 之語音㈣Sl(n)且對該信號進行編碼以在通信通道5〇上 (例如’越過傳輸媒體)傳輸至第―語音解碼器術。第— =碼器術經配置以對經編碼之語音信號進行解碼且合 鳩則,1=音信號SSYN_THi(n)。圖化展示第二語音編碼器 在:、二配置以對經數位化之語音信號咖進行編碼以 ^^60上(例如’越過相同或不同傳輸媒體)在相反 方向上傳輸至第二語w。語切碼器他經配置 123360.doc 200830278 以對此經編碼之語音信號進行解碼,產生合成之輸出語音 信號sSYNTH2(n)。第一語音編碼器3〇a及第二語音解碼器 40b(x員似地,第二語音編碼器3〇b及第一語音解碼器仙幻可 一同使用於任一用於發射及接收語音信號之通信設備中, 包括(例如)上文參看圖i及圖2而描述之用戶單元、bts或 BSC。 / °。s L號s〗(η)及S2(n)表示已根據此項技術中已知之各種 方法(諸如脈衝碼調變(PCM)、擴展μ•法貝4或A_法則)中之 任一者而經數位化及量化的類比信號。如此項技術中已 知’語音編*器接收作為輸入資料之訊框的語音信號之數 位樣本’纟中每—訊框包含預定數目之樣本。語音信號之 减通*足夠紐以使得可預期信號之頻譜包絡在訊框中保 持相對靜止。—典型訊框長度為二十毫秒,但可使用被視 .為適於料制之任—訊框長度。二十毫秒之訊框長度對 ;千赫(kHz)之取樣速率而言對應於_個樣本,對於8 册之取樣速率而言對應於⑽個樣本,且對於16他之取 樣速率而謂應於咖個樣本,但可使㈣ 制之任-取樣速率。可用於語音編碼之取樣速率之I: 貫例為12.8 kHz,日甘从念 範圍内之其他速率。為例包括在12·_Ζ至38.4他之 述;:!=之所有訊框均具有相同長度,且在本文描 期且!設—致的訊框長度,,亦明確地預 使用不—致之訊框長度。在-些應用中, j為不重豐的’但在其他應用中,使用重疊訊框機制。 I23360.doc 14 200830278 舉例而言,對於語音編碼裝置 框機制且在解瑪器處使用 田δ編石馬器處使用重疊訊 編碼器而言對不同任務使用=訊框機制為普遍的。對於 例而言,語音編碼器或==機制亦為可能的。舉 機制來對於對訊框之頻雄炊 &可使用-重疊訊框 頌μ包絡之描述進 同的重疊訊框機制來對於 ' 使用一不 碼。 “框之時間資訊之描述進行編 可能需要料l馬器進行㈣ 對::訊框與無效訊框進行編竭。對於語=:=來 可㈣要使用不同位元速率來對 。亦 編碼。在該等愔π τ ^ 1 i之有效訊框進行 …下’可選擇性地對於含有相對較少之任 …K之訊框使用較低位元速率 之- 進行編碼之位元速率之實例包括每訊框171個位^效純 =元及每訊框4。個位元;且通常使用以對無效 迷羊的貫例包括每訊框16個位元。在蜂巢 式%活糸統(尤其為服從如由
發布之暫用標準⑽95卞心 協會,Arllngt〇n,VA 由,介八 叫95或類似工業標準之系統)之環境 〜別將此等四個位元速率稱作" "四分之-速率"及"八分之一速率"。 +速率、 不=要:語音信號之有效訊框中之每-者分類為若干 ,二—者。此等不同類型可包括有聲語音(例 任之P;:母曰聲之語音)之訊框、過渡訊框(例如,表示詞 :立“或結束的訊框)及無聲語音(例如,表示摩擦音之 )訊框可能需要對語音編碼器進行組態以使用不 123360.doc 15. 200830278 同編碼模致、步π ^ 言,有聲m之之語音訊框進行編碼。舉例而 耳^之訊框傾向於具有長期(亦 ==,相關之週期性結構,且藉由使::; 訊框(或有特奴描述進行編碼之編碼模式來對有聲 碼模式之^ 序列)進行編碼通常較為有效。該等編 (p。f ]包括碼激勵線性預測(celp)及原型音高週期 另彳面’無聲訊框及無效訊框通常沒有任何顯 者的長期頻譜特徵,且彳五立 w " (且一爲碼盗可經組態以藉由使用不 玄特徵之編碼模式來對此等訊 激勵線性預測⑽LP)為該編碼模式之—實例。 雜成 語音編μ或語音編碼方法可經組態以在位 碼模式(亦稱作”结1派毺座丨I,、七 ^ 一 y粞作編碼機制”)之不同組合中進行選擇。舉例 而吕,語音編碼器可經組態以對於含有有聲語音之訊框及 過渡訊框使用全料CELP機制,對於含有無聲語音的訊 框使用半速率NELP_,i對於無效純使^分之— 速率概P機制。或者,該語音編碼器可經組態以對於含 有有聲語音之訊框使用全速率PPP機制。 語音編碼器亦可經組態以支援用於一或多個編碼機制的 多個編竭速率’諸如全速率與半速率CELP機制及/或全逮 率與四分之一速率ppp機制。舉例而言,纟包括穩定有聲 -曰之B守期的序列中之訊框傾向於在很大程度上重複,使 得可以小於全速率之速率對其中至少一些進行編碼而無知 覺品質之顯著損失。 多機制語音編碼裝置(包括支援多個編碼速率及/或編石馬 123360.doc 200830278 模式之έ吾音編碼裝置)诵登 ^ )通书提供以較低位元速率進行之有 效§吾音編碼。熟練技工蔣切 將^ 4到增加編碼機制之數目將允 許在選擇編碼機制時之鮫 + 一、 杈大筮活性,此可導致較低平均位 元速率。然而,在編碼 ^ 之數目上的增加將相應地提高 整個系統中之複雜性。用 於任一給定系統中之可用機制之 特定組合將由可用系统眘 原及特疋信號環境指定。多機制 編碼技術之實例描述於η 、(ϋ 如)趕為’’variable rate SPEECH CODING,,之慕固奄 1 一 、國專利弟6,69l,〇84號中及題為 ARBITRARY AVERAGE data χ>λ^ data rates for variable RATE CODERS”之美國蚩…丄 、国專利申請案第ll/625,788號 (Manjunath等人)中。 多機制語音編碼器通常包衽 爷包括才双查輸入語音訊框且進行關 於對訊框應用哪一編碼機制 ^ a 钺制之決朿的開路決策模組。此模 組通常經組態以將訊框分類為 q巧双A無效,且亦可經組態 以將有效訊框分類為兩種戋 ^ 次兩種以上不同類型(諸如有 聲、無聲或過渡)中之一老。兮4 . ^ ,π . °王/刀類可基於當前訊框及/ 或一或多個先W訊框之一或冬伽姓 次夕個特被,諸如總訊框能量、 在兩個或兩個以上不同頻帶中 <母一者中的訊框能量、信 雜比(SNR)、週期性及越零率。該分類可包括將該因素之 值或量值與臨限值進行比較及/或將該因素之改變的量值 與臨限值進行比較。 圖4展示開路決策模組可使用 之用以廷擇一位元速率之決策 樹之一實例,根據特定訊框所含有立 令t曰的類型來以該位 70速率對該框進行編碼。在直他产 一他^况下,對於特定訊框所 123360.doc 200830278 &擇之位元速率亦可視諸如 Λ A t #要千均位疋速率、位元速率 在一系列訊框上之所要圖案(1 、古办、 1八J用Μ支援所要平均位开 t率)及/或對於先前訊框而選 夕 & I释之位兀速率的標準而定。 夕機制語音編碼器亦可#耔 使用…,… 碼決策,其中在藉由 便用開路所選之位元速率& ^ 元王或部分編碼之後#得 :广效能之一或多個量測。可在閉路測試中考,之效能
=預:?測誤差量化量化、相位量化辰 化SNR、知覺SNR及作 里 ^ α U生的里測之在當前與過去 訊框之間的標準化交又相關。 旦 ^ 效恥1測結果低於臨限 值’則可將編碼速率及/或樵十 及次杈式改變為預期會給出較佳品 貝之者。可用以維持可變速率言五音飨im 改八相祕^ 遇手π曰編碼裝置之品質之閉 路刀類機制之實例描述於在 〜〜r 平11月U日申請的題為
CLOSED-LOOP VARIABLE.RATE
predictive spbbch coder?! ' MULTIM〇DE R之吳國專利申請案第No. 9/191,643號巾及美國專㈣6,33G,532號中。 =音編Μ通常㈣態以將語音信號之訊框編碼為語音 其中s吾音封包之大小及格式對應於為彼訊框所選擇 之特疋編碼機制。語音封包通常含有—乡且語音參數,可由 =重建語音信號之相應訊框。此組語音參數通常包 …’諸如對訊框内的在頻譜上之能量分布之描述。亦 將能量之該分布稱作訊框之"頻率包絡"或”頻譜包絡,,。對 ⑽之頻t晋包絡之描述可視用以對相應訊框進行編碼之特 疋編碼機制而具有不同形式及/或長度。 123360.doc -18- 200830278 瞀::、、爲:益通常經組態以將對訊框之頻譜包絡之描述計 右:床序序列。在-些情況下,語音編碼器經組態以 叶异有序序列,柿;^ 1 ^ |θ示信號在相應頻率處或在相 應頻。晋£域上之据Φ5十旦 田5里值。該描述之一實例為傅立葉變 換係數之有序序列。 在其他情况下,今五立姐 ρ σ ^ " 9、扁碼态經組態以將對頻譜包絡之描 述口十异為編碼模型之參數之值(諸如線性預測編碼(LPC)分
析之-組系數值)的有序序列。通常將Lpc系數值之有序序 列配置為一或多個向量,且可實施語音編碼器以計算此等 值作為遽波器係數或作為反射係數。亦將集合中系數值之 數目稱作LPC分析之,,階,,,且由通信設備(諸如蜂巢式電 話)之語音編碼器執行的Lpc分析之典型階的實例包括4、 6 8 、 1〇 、 12 、 16 、 20 、 24 、 28及32 。 語音編碼器通常經組態從而以量化形式跨越傳輸通道而 傳輸對頻ft包絡之描述(例如,作為至相應查找表或”碼薄, ,一或多個索引)。因此,對於語音編碼器而言可能需要 什异呈可受到有效量化之形式的Lpc系數值之集合,諸如 線譜對(LSP)、線譜頻率(LSF)、導抗譜對(Isp)、導抗譜頻 率(ISF)、倒譜系數或對數面積比之值之集合。語音編瑪哭 亦可經組態以在轉換及/或量化之前對值之有序序列執^ 其他操作,諸如知覺加權。 在一些情況下,對訊框之頻譜包絡之描述亦包括對訊框 之時間資訊的描述(例如,以傅立葉變換係數之有序序列 之形式)。在其他情況下,語音封包之語音參數之集人亦 123360.doc -19- 200830278 了包括对訊框日〜 jl、 守間賢訊的描述。對娃网-欠〜 式可視用以對間一貝訊之描述之形 些編碼模式 、扁碼杈式而定。對於一 之描述可包括Μ f於C E L ρ編碼杈式),對時間資訊 匕括對待由語音解 如,如由對㈣h 4 讀勵LPC模型(例 對激勵信號 )之激勵尨唬的描述。 薄之一或多個帝引、山 如作為至相應碼 1U緊引)而出現於語音封向 描述亦可包括Ms θ #包中。對時間資訊之
匕括吳激勵信號之至少一音古八旦 對於pppiMi模式mU相關之資訊。 對待由語音解碼哭# <才間貝矾可包括 的描述。對鱼立古νθ 現之曰阿分Ϊ之原型 《料曰面分量相關之資訊之描述通 (例如,作為至相應碼薄之一或多 屯式 包中。 又夕1u家引)而出現於語音封 資::==式(例如,對於咖編碼模式),物 …包括對訊框之時間包絡(亦稱作訊框之”能; 包絡"或”增益包絡”)的描述。對時間包絡之描述可包括: :訊框之平均能量之值。通常將該值作為待於解碼期間: 用於訊框之增益值而提出且亦將其稱作"增益框竿"。在 些情況下’增益框架為基於㈧原始訊框之能量E—血⑺ 由語音封包之其他參數(例如’包括對頻譜包絡之描述h 合成的訊框之能量Esynth之間的比率之標準化因數。舉例雨 s,可將i冒匡架表達為E〇rig/Esynti^表達為E〇r丨g/E_h之 平方根。增《架或時間包絡之其他態樣更為詳細地描封 於(例如)發布於2006年12月丨4日之美國專利申請公開案 123360.doc -20- 200830278 2006/0282262 號(V〇s 等人)”SYSTEMS,则㈣⑽,娜 APPARATUS F0R GAIN FACT〇R ATTEND·"中。 替代或額外地’料間包絡之描述可包括訊框之許多子 訊框中之每一者的相掛能吾你 ^ ^此里值。通常將該等值作為待於解 碼期間應用於各別子訊框之增益值而提出絲其統稱作 ”增益輪廟”或”增益形狀”。在一些情況下,增益形狀值為 各自基於⑷原始子訊框i之能量」與(b)自經編碼之$ 框之其他參數(例如’包括對頻譜包絡之描述)合成的訊框 之相應子訊框i之能景p . 09 里synth.i之間的比率之標準化因數。在 該等情況下’可使用能量Esynthi來使能標準化。舉 例而言’可將增益形狀值表達為^/E咖或表達為 E〇rig.i/Esynthii平方根。對時間包絡之描述之一實例包括 增益框架及增益形狀,#中增益形狀包括二十毫秒之、杧 毫秒的子訊框中之每—者之值。可在線性標^ 對數(例如’分貝)標度上表達增益值。該等特徵較為詳細 地“返於(例上文引用之美國專利申請公開 2006/0282262號中。 ”弟 在計算增益框架之值(或增益形狀之值)中,可 用與鄰近訊框(或子訊框)重疊之窗函數。以此方 - 增益值通常以重疊相加之方式應用於語音解碼ϋ處,此= 有助於減少或避免訊框或子訊框之間的不連續性。展 :可用以計算增益形狀值中之每一者之梯形窗函數的曲 線。在此實例中’窗與兩個鄰近子訊框中之每一者重最一 宅秒。圖5Β展示將此窗函數應用於二十毫秒之訊框^ 123360.doc 21 200830278 時期及2母一者。窗函數之其他實例包括具有不同重疊 ::戈可為對稱或不對稱之不同窗形狀(例如,矩形窗 =仏函數。亦有可能藉由對不同子訊框應用不同 ^及/或藉由計算在具有不同長度之子訊框上的增益 形狀之不同值而計算增益形狀之值。
包括對時間包絡之描述的語音封包通常包括諸如至相應 ;’、、溥之—或多個索引之量化形式之描述,但在一些情況下 可使用—演算法來在不使用碼薄的情況下量化及/或解量 化增益框架及/或增益形狀。對時間包絡之描述之一實例 ^括具有八至十二個位元之量化指標,其規定訊框之五個 增益形狀值(例如,五個連續子訊框中之每一者一增益形 '值)°亥彳田述亦可包括規定訊框之增益框架值之另一量 化指標。 上文所提及,可能需要發射及接收具有超過300-3400 kHz之PSTN頻率範圍之頻率範圍的語音信號。對該信號進 订編碼之一方法為將整個延伸之頻率範圍作為單一頻帶而 進行編碼。可藉由按比例調節窄頻語音編碼技術(例如, 經組態以對諸如〇_4Hz之”丁^^品質頻率範 圍進行編碼之技術)而實施該方法以覆蓋諸如0-8 kHz之寬 頻頻率fe圍。舉例而言,該方法可包括(A)以較高速率對 浯音“號進行取樣以包括高頻率之分量及(B)對窄頻編碼 技術進行重組態以在所要準確性程度上表現此寬頻信號。 重組憑窄頻編碼技術之一該方法為使用較高階之Lpc分析 (亦即’產生具有較多值之係數向量)。將寬頻信號作為單 123360.doc -22- 200830278 —頻帶而進行編碼之寬頻語音編碼裝置亦被稱作"全 編碼裝置。 、 可此而要實施寬頻語音編碼裝置以使得可經由窄頻通道 (諸如PSTN通道)發送經編碼之信號之至少—窄頻部分而無 需譯碼或另外顯著地修改經編碼之信號。該特徵可促進與 僅識別乍頻^ f虎之網路及/或裝置之回溯相容性。可能亦 需要實施對於語音錢之;^同頻帶㈣不同編碼模式及/ 或速率之見頻語音編碼裝置。可使用該特徵以支援提高之 :碼效率及/或知覺品f。經組態以產生具有表示寬頻語 γ L唬之不同頻帶之部分(例如,語音參數之單獨的集 口每一集合表不寬頻語音信號之不同頻帶)的語音封包 之寬頻語音編碼裝置亦被稱作”分離頻帶”編碼裝置。 圖6A展示不重疊頻帶機制之-實例,其可由分離頻帶語 音編碼器使用以對跨越G出至8他之範圍之寬頻語音内 容進行編石馬。此機制包括自〇 Hz延伸至4 kHz之第一頻帶 (亦稱作乍頻辄圍)及自4 kHz延伸至8跑之第二頻帶(亦稱 乍k伸上邛或问頻範圍)。圖6B展示重疊頻帶機制之一 貝」a可由刀離頻贡語音編碼器使用以對跨越〇 Hz至7 kHz之fe圍之寬頻語音内容進行編碼。此機制包括自〇 Hz 延伸至4 kHZ之第一頻帶(窄頻範圍)及自3.5 kHz延伸至7 kHz之第二頻帶(延伸、上部或高頻範圍)。 頻V機制之其他實例包括窄頻範圍僅下延至約则Hz之 貝例4機制亦可包括覆蓋自約〇沿或Hz直至約3〇〇 Hz或350 &之低頻範圍之另一頻帶。分離頻帶語音編碼器 123360.doc -23· 200830278 之-特定實例經組態以執行對窄頻範圍之十· 對高頻範圍之六階LPC分析。 藉由使用全頻帶編碼機制而編碼之語音 越過整個寬頻頻率範圍之單一頻譜包絡的描迷,= 用分離頻帶編碼機制而編碼之語音封包具有表示寬頻扭音 信號之不同頻帶(例如’窄頻範圍與高頻範圍)中的資訊之 Γ或兩個以上之單獨部分。舉例而言,通常,經分離頻 ,編碼之語音封包之此等單獨的部分中之每一者含有對扭 音信號之在相應頻帶上的頻譜包絡之描述。經分離頻㈣ 碼2語音封包可含有對訊框之關於整個寬頻頻率範圍的時 資s 描述,或者經分離頻帶編碼之語音封包之單獨 4刀中的母一者可含有對語音信號之關於相應頻帶之時間 資訊之描述。 語音編碼器通常經組態以產生一系列經編碼之訊框,每 -經編碼之訊框包括—語音封包及(可能地)_或多個相關 聯之位元。圖7八說明具有192位元之長度的經編碼之訊框 之格式之f例。在此實例中’經編碼之訊框包括表示語 曰U(亦即’主要訊務)之一訊框的171位元之全速率語音 封包。經編碼之訊框亦可包括一或多個檢查位元。在此實 例中,經編碼之翊拖#权丄 ^ 一 、 ’又m框包括十二位兀之訊框品質指示符F, 其可包括同位檢查位元或循環冗餘檢查(CRC)位元,以及 尾位元y的八位元之集合,其可用以終止及初始化產生 CRC位兀之回旋瑪。經編碼之訊框亦可包括指示除語音封 包以外的資料(例如,資訊叢發)之存在之一或多個位元。 123360.doc -24- 200830278 在此實例中,經編碼之却士 L ^ ^ 11忙包括混合模式之位元MM,盆 在此情況中經清零(亦即,具有零值)。 可能需要偶爾或週期性妯力統Μ 在、、、二、、扁碼之訊框内包括不為語 音#號之部分之資訊。舉 H ^ t 了此需要經編碼之訊框 載運在仃動台與網路中另一者 灵體(诸如 BTS、BSC、MSC、 PCF或PDSN)之間的信號傳輸 業鉻钚# t m、 叢發。信號傳輸資訊 叢务可载運用以執行一動作一 ...,、胃 (堵如緹鬲傳輸功率或量測參
曰 ㈢扒飞對邊,求之回應(例如,所 買測侍之參數值)之至少邱八 ^ ^ P刀。與無線電存取網路内之交 遞或自一無線電存取網路至另一 ψ ^ ψ ^ ^ ^ 者之父遞相關之信號傳輸 貝戒叢舍可包括更新的網路 / 貝δί1,诸如網路識別符 NID) ^ ^ # (SID)^ /4 ^ ^ ^ ^ ^ 參數值中些^兄Γ ’信號傳輸資訊叢發包括含有此等交遞 々 t-或多者的系統内訊務參數訊息之至少部分。 要能需要經編碼之訊框載運次要訊務之叢發。次 要讯备叢發可包括偶爾更新 、貝Λ ’诸如地理位置資邻 (例如,全球定位系統或GPS資 、 貝Λ )更新之至少部分。在另 一情況下,次要訊務叢發可 卜 匕括低位凡逮率資料傳輸(諸 ^呼m訊服務⑽㈣息或電子郵件訊息)之至少 部分。 社该寺情況下,可能需要言五立 > 赘口9編碼益對經編碼之訊框進 订、、且態以使得一些位元可用 用於載運其他貧訊。舉例而言, 對於語音編碼器而言可能需要藉 積田便用比由速率選擇機構 W知不之位元速率低的位元速 几迷羊爪將矾框編碼為較小語音 I23360.d〇c •25 - 200830278 封包。將該操作稱作"模糊化"或"源級模糊化"。在源級模 相化之纟型Λ例中,迫使語音編碼器使用半速率機制來 對一訊框(原本已針對該訊框選擇全速率機制)進行編碼, 但源級模糊化_般而言可包括任何速率減小。可變速率語 音編碼器可經組態以執行模糊_叢發技術來產生包括經模 糊之語音封包及其他資訊之叢發的經編碼之訊框。可在 (例如)美國專利第5,5〇4,773號(Padovani等人)中找到對該 等技術之描述。 藉由使用模糊·叢發技術而產生之經編碼之訊框可包括 指不其是否包括信號傳輸資訊或次要訊務之一或多個位 元。圖7B展示經編碼之訊框之一格式,模糊·叢發技術可 使用其以包括·主要訊務之半速率語音封包(8〇個位元)及86 個位元的信號傳輸資訊之叢發。此訊框包括指示使用模 糊-叢發或空白-叢發格式之叢發格式位元Bjp、指示叢發含 有信號傳輸訊務或次要訊務之訊務類型位元ττ、及可用以 才曰示關於主要訊務及/或關於信號傳輸或次要訊務的位元 之不同數目之兩個訊務模式位元TM,該等位元之所有在 此情況下均經清零。訊框亦包括訊息起始位元s〇M,其指 示下一位元是否為信號傳輸訊息之第一個位元。圖7c展示 經編碼之訊框之一格式,模糊-叢發技術可使用其以包括 語音信號之半速率封包及87個位元的次要訊務之叢發。在 此情況下,訊框格式不包括訊息起始位元,且訊務類型位 元TT經設定。 模糊化之過度使用可能引起經編碼之語音信號之品質的 1233 60. doc -26- 200830278 降級。一般而言,將模糊化之使用限於不超過全速率訊框 之百分之五,但更通常地對不超過該等訊框之百分之一或 (可能地)百分之二進行模糊化。在一些情況下,語音編碼 器經組態以根據二進位遮罩檔案來選擇待經模糊之訊框, 其中遮罩檔案之每一位元對應於一訊框且該位元之狀態指 示該訊框是否待經模糊。在其他情況下,語音編碼器經組 態以在可能之情況下藉由等待直至半速率訊框經排程而避 免模糊化。 可能需要貫施寬頻編碼系統作為對現有窄頻編碼系統之 升級舉例而s,可能需要藉由使用相同位元速率及封包 大小,藉由額外封包格式來支援額外寬頻編碼機制而最小 化對網路之改變。如圖7A至圖7C所示使用服從is_95之訊 框格式的一現有類型之窄頻語音編解碼器為如可在線於 3gpp2.org獲得之第三代合作夥伴計劃2(3Gpp2)文件 C,S0014-B幻.0(2006年5月)中所描述之增強型可變速率編 解碼器,版本B(EVRC-B)。可能需要將支援evrc_b之系 統升級為亦支援如亦可在線於3gpp2〇rg獲得之3Gpp2文件 C.S00H-C吐⑽⑻叫月)中所描述之增強型可變速率編 解碼為’版本C(EVRC-C,亦稱作EVRC-WB)。 如上文所提及,現有窄頻編碼系統支援模糊-叢發技術 之使用。可能需要在寬頻編碼系統中支援模糊-叢發技 術。寬頻訊框之模糊化之-方法涉及設計並實施較低位元 速率(例如,半速率)之寬頻編碼機制來與模糊訊框一同使 用。寬頻語音編碼器可經組態以根據該機制對模糊訊框進 123360.doc -27· 200830278 行編碼,或替代地藉由偵古 β 較尚位凡速率寬頻編碼機制 立扁:的語音封包之所選位元來產生具有該機制之格式的語 。然而’無論㈣—種情況下’設計較低位元速率 見頻編碼機制來具有可接受之知覺品質均將為昂貴的。· :該編碼機制亦將可能、;肖耗語音編碼器之較多資源,諸二 處理循環及儲存。實施額外編碼機制亦將提高系
t頻訊框之模糊化之另—方法為使用較低位元速率窄頻 編,機制來對經模糊之寬頻純進行編n㈣方法= 及向頻資訊之損失’但在對現有f頻m頻升級中者 施可能較為容易’因為其可經組態以使用現有窄頻編碼: 制(例如,半速率CELP)。相應語音解碼器可經組態以自— 或多個先前訊框之高頻資訊重建丟失之高頻資訊。 圖8A展示根據通用組態之方法M1〇〇i流程圖,該方法 包括任務τ110、T120、丁130及丁140。任務丁11〇經組態以 基於語音信號之第一有效訊框產生第一語音封包。第一噂 曰封包包括對在(Α)第一頻帶及(Β)於第一頻帶以上延伸 第=頻帶上的頻譜包絡之描述。此描述可為延伸越過兩= 頻帶之單一描述,或者其可包括各自延伸越過頻帶中之各 別一者之單獨描述。任務τ 11 0亦可經組態以產生第一 +五立 封包以含有對在第一及第二頻帶上之時間包絡之描述。此 描述可為延伸越過兩個頻帶之單一描述,或者其可包括各 自延伸越過頻帶中之各別一者之單獨描述。應清楚地瞭 解,方法Μ100之實施之範圍亦包括任務T11〇經組態以義 123360.doc -28- 200830278 於語音信號之無效訊框產生第—語音封包的實施。
任務⑽經組態以基於在語音信號中出現於第―有效訊 框之後的δ吾音仏號之第二有效訊框(例如,緊隨第一有效 訊框之有效訊框,或藉由—或多個其他有效訊框與第一有 效訊框隔開之有效訊框)而產生第二語音封&。第二語音 封包包括對在第-頻帶上之頻譜包絡之描述。任務丁12〇亦 可絰組恶以產生第二語音封包以含有對關於第一頻帶之時 間^訊之描述。任務T13G經組態以產生含有第—語音封包 之第一經編碼之訊框,且任務丁14〇經組態以產生含有第二 語音封包及與語音信號隔開的資訊信號之叢發之第二經編 碼之戒框。第-及第二語音封包亦可包括基於各別訊框的 對時間資訊之描述。圖9說明方法]^[100之應用。 任務丁130及丁140經組態以產生第一及第二經編碼之訊框 以具有相同大小(例如,192個位元)。任務丁11〇可經組態 以產生第一語音封包以具有大於第一經編碼之訊框之長度 之一半的長度。舉例而言,任務TU〇可經組態以產生第一 語音封包以具有第一經編碼之訊框之長度的至少百分之六 :、七十、七十五、八十或八十五之長度。在一特定此類 實例中,任務Τ110經組態以產生第一語音封包以具有171 位元之長度。或者,任務Τ1丨0可經組態以產生第一語音封 包以具有不超過第一經編碼之訊框之長度的百分之五十、 四十五或四十二之長度。在一特定此類實例中,任務T11〇 經組態以產生第一語音封包以具有8〇位元之長度。 任務T120經組態以產生第二語音封包以具有不大於第 123360.doc -29- 200830278 經編碼之訊框之長度的百分之六十之長度。舉例而^ 務⑽可經組態以產生第二語音封包以具有 ;::壬 編碼之訊框之長度的百分之五十、 ° —、、二 w 丁五或四十二之 度。在一特定實例中,任務T120經組態以產生第二誶立〜 包以具有80位元之長度。任務T12G亦可經組態以使=封 語音封包不包括對在第:頻帶上之頻譜包絡之描述及^ 對關於第二頻帶之時間資訊的描述。 5
―通常將方法MHH)料語音編碼之較大方法之部 預期亚由此揭示經組態以執行方法M100的 使用與第-經編碼之訊框相同之格式或== ::ΓΓ格式對語音信號中跟隨第二訊框之有效= 訊框之有效訊框,或藉由-或多個其他
汛c共弟一訊框隔開之有效訊框)進行編碼。或者, 該編碼器或方法可瘦細能你田 T 第二…, 不同的編碼機制對跟隨
…聲或無效訊框進行編碼。相應語音解碼哭 經組態以使用Ρ由结 ,一 ^ J 來自… 之訊框解碼之資訊來補充對 的另的語音信號中出現於第—經編碼之訊框之後 …扁馬之訊框之有效訊框的解碼。在此描述中之別 :=示語音解碼^對語音㈣之訊框進行解碼的方 --編碼對—或多個後續有效訊框進行解碼中使用已自第 、、二、扁碼之訊框解碼之資訊。 包終:210及T120中之一者或兩者可經組態以計算對頻譜 、、’°別描述。圖10展示任務Τ110之該實施之子任務 123360.doc -30- 200830278 TU2的應用’該子任務TU2經組態以基於第一訊框計算對 在第-及第二頻帶上之頻譜包絡之描述。圖1〇亦展示任務 ⑽之該實施之子任務Τ122的應 1,該子任務經组 態以基Μ二訊框計算對在第—頻帶上之頻譜包絡之描 述。任務丁11〇及丁120亦可經組態以基於各別訊框計算對時 間貧訊之描述’該#描述可包括於各料音封包中。 任務TU0及T12G可經組態以使得第二語音封包包括對在 第-頻帶上之頻譜包絡之描述…該描述之長度不小於 包括於第—語音封包中的對在第—及第二頻帶上之頻譜包 絡之描述的長度之-半。舉例而言,任務T110及T120可經 組態以使得第二語音封包中之對在第—頻帶上之頻譜包故 之描述的長度至少為包括於第一語音封包中之對在第—及 第二頻帶上之頻譜包絡之描述的長度之百分之五十五或六 十在肖疋貫例中,第二語音封包中之對在第_頻帶上 之頻譜包絡之描述的長度為二十二位元,I包括於第—語 曰封包中之對在第一及第二頻帶上之頻譜包絡之描 度為三十六位元。 ^ 弟二頻帶不同於第一頻帶,但方法Μ110可經組能 得兩個頻帶重疊。第-頻帶之下限之實例包括〇:5〇、 1⑽、300及500 Ηζ,且第一頻帶的上限之實例包括3、 3·5、4、4.5及5 kHz。第二頻帶之下限之實例包括η、 3、3.5、4及4.5 kHz,且第二頻帶的上限之實例包括 入5、8及8.5 kHz。明確地預期且由此揭示上述界限之所有 五百個可能的組合,且亦明確地預期且由此揭示 孩組 123360.doc .31 · 200830278 合對方法M110之任一實施之應用。在一特定實例中,第 一頻帶包括約50 Hz至約4 kHz之範圍且第二頻帶包括約* 至約7 kHz之範圍。在另一特定實例中,第_頻帶包括約 100 Hz至約4 kHz之範圍且第二頻帶包括約3·5 Hz至約7 kHz之範圍。在又一特定實例中,第一頻帶包括約3⑽办 至約4 kHz之範圍且第二頻帶包括約35 Hz至約7匕只冗之範 圍。在此等實例中,術語"大約”指示正負百分之五,其中 各個頻帶之界限由各別3_dB點指示。 如上文所提及,對於寬頻應用,分離頻帶編碼機制可具 有勝於全頻帶編碼機制之優勢,諸如提高之編碼效率及對 於回溯相容性之支援。可能需要實施方法M1〇〇w藉由使 用分離頻帶編碼機制而非全頻帶編碼機制來產生第一經編 碼之訊框。圖8B展示方法M100之實施M110之流程圖,該 實施]\4110包括任務丁11〇之實施7114。作為任務1111〇之實 施,任務T114經組態以產生包括對在第一及第二頻帶上之 頻譜包絡之描述的第一語音封包。在此情況下,任務T丨i 4 經組態以產生第一語音封包以包括對在第一頻帶上之頻譜 包絡之描述及對在第二頻帶上的頻譜包絡之描述,使得兩 個描述彼此分離(雖然可能地在語音封包中彼此鄰近)。 任務T114可經組態以使用分離頻帶編碼機制來計算對頻 譜包絡之描述。圖11展示任務τ 114之該實施之子任務τ 11 6 的應用,其中子任務T116為子任務T112之分離頻帶實施。 子任務T116包括子任務T118a,其經組態以基於第一訊框 計异對在第一頻帶上之頻譜包絡之描述。子任務T丨丨6亦包 123360.doc -32- 200830278 括子=務T118b,其經組態以基於第一訊框而計算對在第 =頻帶j之頻譜包絡之描述。任務Τ118^τ⑽亦可經組 心以汁π對在兩個頻帶上之時間資訊之單獨描述。 、杧之頻5晋及/或時間資訊之描述的計算可基於來 自一或多個切純之資訊。在該m,制窄頻編碼 機制,對第—訊框進行編碼可降低一或多個後續訊框之編 碼效能:任務T120可包括子任務T124(未圖示),其經組態 以基於第二訊框而計算對在第二頻帶上之頻譜包絡之描述 及/或對關於第二頻帶之時間資訊的描述。舉例而言,任 務T12〇可經組態以使用寬頻編碼機制來對第二訊框進行編 碼。如±文所Μ,任務丁 120可經組態以使得第二語音封 包不包括對在第二頻帶上之頻譜包絡之描述或對關於第二 頻帶之時間資訊的描述。然而,甚至在該情況下,計算關 =第二頻帶之該資訊以使得其在編碼器處可用於在該歷史 資訊之基礎上對一或多個後續訊框進行編碼仍可比在無該 鲁資訊的情況下對彼等框進行編碼提供該等框上的較佳知覺 =質。或者,任矛务Τ120可經組態以使用窄頻編碼機制來對 =二訊框之第一頻帶進行編碼且初始化下—訊框之第二頻 帶之歷史(例如’藉由重設储存過去的頻譜及/或時間資訊 之記憶體)。在另一替代方案中,任務丁 120經組態以使用 窄頻編碼機制來對第二訊框之第一頻帶進行編碼,且藉由 使用抹除處理常規程式來估計對在第二頻帶上第二訊=之 頻譜包絡之描述(及/或對關於第二頻帶之時間資訊的描 述)。舉例而言,任務Τ120之該實施可經組態以基於來自 123360.doc -33 - 200830278 第一訊框及(可能地)來自一或多個先前訊框之資訊而估計 對在第二頻帶上第二訊框之頻譜包絡的描述(及/或對關於 第二頻帶之時間資訊之描述)。 任務T118a及T118b可經組態以計算具有相同長度的對在 兩個頻帶上之頻譜包絡之描述,或者任務T118a&TU8b* 之一者可經組態以計算長於由另一任務所計算的描述之描 述舉例而§,任務T11 8a及丁π 8b可經組態以使得如由任 務TU8b計算之在第一語音封包中之對在第二頻帶上之頻 譜包絡的描述之長度不超過如由任務711“計算之第一語 音封包中之對在第一頻帶上的頻譜包絡之描述之長度之百 刀之五十、四十或三十。在一特定實例中,第一語音封包 中之對在第-頻帶上之頻言普包絡之描㈣長度為二十八位 π,且第一語音封包中之對在第二頻帶上之頻譜包絡之描 述的長度為八位元。任務T118a&T118b亦可經組態以計算 •對兩個頻帶之時間資訊之單獨描述。 • ^任務T11 8&及Tl22可經組態以計算具有相同長度的對在 第肩τ上之頻譜包絡之描述,或者任務丁丨18a&Tl22中 之者可經組態以計算長於由另一任務所計算的描述之描 述。舉例而言’任務丁118,及1122可經組態以使得如由任 矛々τ 12 2汁异之在第二語音封包中之對在第一頻帶上之頻譜 =絡的描述之長度至少為如由任務TU8a計算之在第一: 音封包中之對在第一頻帶上的頻譜包絡之描述之長度之百 分之五十、‘ 1立 /、十、七十或七十五。在一特定實例中,第一 曰封^中之對在第一頻帶上之頻譜包絡之描述的長度為 123360.doc -34- 200830278 帶上之頻譜 一十八位元,且第二語音封包中之對在第一 包絡之描述的長度為二十二位元。 之=之^示語音編碼器可使用以執行包括方法Μ! 〇 〇 只e之6吾音編碼方法的四個不同編碼機制之—集人 =:,使用全速率寬頻CELP編碼機制('心 / 框進行編碼。此編碼機制使用153個位元來對
之乍頻邛分進行編碼且使用16個位元來對高頻部分進 # 對於乍頻,編碼機制Η吏用28個位元來對於 吻之描述進行編碼(例如,編碼為一或 Lp: 置)且使用⑵個位元來對於對激勵信號之描述 以 對於宾相 Μ <适仃‘瑪。 ㈠t、° 、扁碼機制1使用8個位元來對頻譜包絡進行編碼 歹,如,編碼為一或多個量化LSP向量)且使用8個 士 於對時間包絡之描述進行編碼。使用8個位疋來對 言if需要對編碼機制1進行組態以自窄頻激勵信號導出 Γ、’文勵m以使得不需要經編碼之訊框之位元來載運 高頻激勵作缺★ 1心促兀不載運 相對於自^石/、可能需要對編碼機制1進行組態以計算 頻帶上之^^訊框之其他參數(例如,包括對在第二 高頻時間包:匕::描述)合成的高頻信號之時間包絡之 用之美國專;;申:::特徵爾細地描述於⑼如)上文引 中%公開案第2006/0282262號中。 在根據圖1 2夕主 . 機制r… 貝例中,使用半速率窄頻CELP編碼 用Γ個Γ1Γ2")來㈣㈣料行編碼。此編碼機制使 對高頻部分進對則匡之窄頻部分進行編碼(且不使用位元 仃編碼)。編碼機制2使用22個位元來對於對 123360.doc -35- 200830278 一或多個量化LSP 號之描述進行編 頻:包絡之描述進行編碼(例如,編碼為 向量)且使用58個位元來對於對激勵信 料聲語音信㈣目比,無聲衫信號料在㈣中 〇對於§吾音理解為重要之資訊。因此與 頻部分進行編碼相比 〔之向 框之高頻部分進行編碼,甚==多位元來對無聲訊 對有聲訊框進行編& _ 、使用“整體位元速率
中广 亦是如此。在根據圖12之表之 只例中,使用半速率嘗 衣^ 對無聲訊框進行編瑪二 碼機制('編碼機制3,’)來 訊框之高頻部八進1 碼機制1所使用以對有聲 、I刀進灯編碼之1 6個仿; , 個位元來對气框之一相Α ,此編碼機制使用27 對㈣進行編碼:12個位元用以對於 LSP向曰旦匕)且田迷進行編碼(例如,編碼為一或多個量化 n里)15個位元用以對於對時間包絡之描述 (例如,編碼為量化增益框架及/或增 : 部分進行编满& 肌)馮ί對乍頻 對於機制3使用47個位元:28個位元用以 量化LSP向量)日⑻η ⑽、,扁碼為-或多個 編石… 用以對於對時間包絡之描述進行 …W ’編瑪為量化增益框架及/或增益形狀)。 二根據圖12之表之實例中,使用八分之一速率窄頻 -效:::制(”編碼機制4Ί來以每™ "、隹丁編碼’其中10個位元用以對於對頻譜包絡的 =進行編碼(例如’編碼為一或多個量化Lsp向量)且㈣ 、、守間絡之描述進行編碼(例如,編碼為 I23360.doc -36- 200830278 里化增显框架及/或增益形狀)。、編碼機制4之另一實例使用 元來對於對頻譜包絡之描述進行編碼且㈣6個位元 “對於對時間包絡之描述進行編碼。 < 康圖12之Λ例中,編碼機制2及/或編碼機制4可為 來自下層乍頰裝置之舊版編碼機制。該語音編碼哭或扭立 編碼之方法亦可經組態以支援其他舊版編碼機制及^ 編碼機制。圖13之表展示如由寬頻CELP編碼機制}之實例 所產生的全速率封包(171位元)之位元配置之集合。圖14之 表展示如由f_ELP編碼機制2之實例所產生的半速率封 ^ (80位70)之位%配置之集合。任務τ⑴之—特定實例使 用全速率CELP編碼機制(例如,根據圖以表中之編碼機 制1)來基於語音信號之有聲或過渡訊框產生第一語音封 包任務Τ11〇之另一特定實例使用半速率編碼機制 (例如’根據圖12之表中之編碼機制3)來基於 ㈣框產生第—語音封包咳務㈣之又—料實贼用、 八刀之一速率NELP編碼機制(例如,根據圖12之表中之編 碼機制4)來基於語音信號之無效訊框產生第_語音封包。 在方法M100之實施之典型應用中,邏輯元件(例如,邏 輯閘)之一陣列經組態以執行該方法之各種任務中之一 者、一者以上或甚至全部。亦可將任務中之一或多者(可 能地全部)實施為程式碼(例如’指令之一或多個集合),將 其體現於可由包括邏輯元件之陣列(例如,處理器、微處 理器、微控制器或其他有限狀態機)之機器(例如,電腦)讀 取及/或執行的電腦程式產品(例如,諸如碟片、快m 123360.doc -37- 200830278 他非揮發性記憶卡、半導體記憶體晶片等等之一或多個資 料儲存媒體)中。亦可由^一個 τ了由個M上的該I5車列或機;器來執行 方法M100之實施之任務。在此等或其他實施中,可在用 於無線通信之設備(諸如蜂巢式電話)或具有該通信能力之 另一設備内執行任務1設備可經組態以與電路交換及/ 或封包交換之網路進行通信(例如,使用諸如請之 多個協定)。舉例而古,琴κ共 口 Μ叹備可包括經組態以發射經編 碼之訊框之射頻(RF)電路。 在寬頻情況中使用模糊·叢發技術之又—方法是使用模 糊封包之高頻部分來載運資訊叢發。在此情況下,可修改 較高m速率(例如,全速率)寬頻編碼機制以使得其所產 生之每—語音封包均包括經保留用作混合模式指示符之位 2 ’且語音編碼器可經組態以設定混合模式m來指示語 音:包之高頻部分含有信號傳輸資訊或次要訊務而非通常 的咼頻語音資訊。 圖15A展示根據通用組態之語音編石馬器100之方塊圖。狂 音編碼器100包括經配置以接收語音信號及速率控制作號 之訊框的封包編碼^2G。封包編碼器12G經組態以根據由 速率控制信號指示之速率而產生語音封包。語音編碼器 ⑽亦包括訊框格式化器⑽,其經配置以接收語音封包、 貧訊叢發及模糊化控制信號。訊柩格式化器130經組態以 t據板糊化控制信號之狀態而產生經編碼之訊框。包括語 音編碼器HH)之通信設備(諸如蜂巢式電話)可經組態以在^ -編碼之说框傳輸至有線、無線或光傳輸通道中之前對其 123360.doc -38- 200830278 執仃其他處理操作,諸如誤差修正及/或冗餘編碼。 在此實例中,語音編碼器100自另一模組接收速率控制 仏號。亦可將語音編碼器100實施為包括經組態以產生速 率控制信號(例如,根據如上文所述之開路或開閉路速率 選擇演算法)之速率選擇模組。在該情況下,速率選擇模 組可經組態以控制模糊化操作(例如,根據如上文所述之 一進位遮罩檔案)且產生模糊化控制信號。或者,速率選 擇杈組可經組態以自在語音編碼器内部或外部之另一模組 接收與模糊化控制信號相關之無效信號。語音編碼器⑽ 亦可經組態以對所接收之訊框執行一或多個預處理操作, 諸如知覺加權或其他濾波操作。 封包編碼器120經組態以基於語音信號之第一有效訊框 且回應於速率控制信號之第H態而產生如上文所述包括 對在第一及第二頻帶上之頻譜包絡的描述之第一語音封 包二舉例而言,速率控制信號之第一狀態可指示根據圖12 φ之貫例之寬頻編碼機制1。封包編碼器120亦經組態以基於 2音k號之第二有效訊框且回應於速率控制信號之不同於 第狀恶的第二狀態而產生如上文所述包括對在第一頻帶 上=頻譜包絡之描述之第二語音封包。舉例而言,速率控 制L唬之第一狀悲可指不根據圖Η之實例之窄頻編碼機制 2 〇 圖15B展示封包編碼器12〇之實施122之方塊圖,該實施 122包括頻譜包絡描述計算器14〇、時間資訊描述計算器 及封包格式化器1 60。頻譜包絡描述計算器J 4〇經組態 123360.doc -39- 200830278 以汁异對待編碼之每-訊框之頻譜包絡的描述 + 描述計算器150經組態以計算對待編瑪 曰貝现 二欠1 1 母 δί1框之時間 貝汛的拖述。封包格式化器160經組態以產生包括 得之對頻譜包絡之描述及計算所得 :异所 1立h Α 彳T间貝訊的描述之 -曰封包。封包格式化請可經組態以根據所要 式(例如,如由速率控制信號之狀態所指示)而產生語音圭° 包’可能對於Μ編碼機制使用不同格心封包格二曰^ 1 6 0 了經組怨以產生語音封包以、^ °' & — 對Λ框進行編碼所根 據之頟外資訊(亦稱作”編碼索引”), ;渚如識別編碼機制或 者、、扁碼速率或模式之一或多個位元之集合。 ,譜包絡描述計算器14G經組態以根據速率控制信號之 狀態而計算對待編碼之每—訊框之頻譜包絡的描述。^ 述係基於當前訊框且亦可基於—或多個其他訊框之至^ 分。舉例而S,計算器140可經組態以應用延伸至一或多 個鄰近訊框中之窗且/或計算對兩個或兩個以上之訊框之 描述的平均值(例如,LSP向量之平均值)。 計算Η40可經組態以藉由執行諸如咖分析之頻譜分 析而汁算對訊框之頻言善句狄之> 貝曰巴、、Ό之掐述。圖15C展示頻譜包絡 描述計算器刚之實施142之方塊圖,該實施142包括Lpc 分析模組no、變換區塊及量化器19〇。分析模組賺 組態以執行對訊框之LPC分析且產生模型參數之相應集 合。舉例而言’分析模組170可經組態以產生諸如遽波係 數或反射係數之LPC係數之向量。分析模組17〇可經組態 、執行在®上之刀析’ $ _包括—或多個相鄰訊框之部 123360.doc •40- 200830278 /刀。在-些情況下,分析模組17〇經組態以使得根據由編 碼機制選擇器12G指示之編碼機制而選擇分析之階(例如, 係數向量中之元素之數目)。 變換區塊職組態以將模型參數之集合轉換為對於量 化較為有效之形式。舉例而言,變換區塊180可經組態以 將LPC係數向量轉換為Lsp之集合。在一些情況下,變換 區塊180經組態以根據由編碼機制選擇器12()指示之編碼機 制而將LPC係數之集合轉換為特定形式。 量化器190經組態以藉由量化模型參數之經轉換之集人 而產生量化形式的對頻譜包絡之描述。量化器19〇可經: 態以藉由對經轉換之隼人之分喜 、 * R木口之TL素進行截斷及/或藉由選 -或多個量化表索引來表示經轉換的集合而量化經轉換之 ^ 口:^要對里化11190進行組態以根據速率控制信 號之狀態而將經轉換之隹人旦 ° 換之集合里化為特定形式及/或長度。 舉例而言,可實施量化器190以回應於速率控制信號之第 1狀=產生_13所示之量化描述,且回應於速率控制信 唬之弟一狀恶產生如圖14所示的量化描述。 時間資訊描述計算器150經組態以計算對訊框之時間資 訊之描述。該描述同樣可基於一或多個其他訊框之至少邱 分之時間資訊。舉例而t,計算器150可經組態以計算越 多個鄰近訊框,之窗的描述且/或計算對兩 们或兩個以上之矾框之描述的平均值。 時間資訊描述計算器150 之狀態而計算具有特定开”及:::根據速率控制信號 ’孖疋形式及/或長度之對時間資訊之描 I23360.doc -41 - 200830278 述。舉例而言,計算器】5〇 m ff?r ^ ^ m ^ 、、^、且先、以根據速率控制信號 之狀也而计异對包括(A)訊框之 ^ ^ Φ ^ ^ ^ 了门匕w及(B)訊框之激勵 t唬中之一者或兩者的時間資 一立一 J貝汛之掐述,其可包括對至少 一曰南/刀置之描述(例如,音高 .^ , 曰阿延吟或滯後、音高增益及/ 或對原型之描述)。在LPC編碼裝置中, ^ , 置中通常將音高滯後計 异為取大化訊框之LPC殘差 之自相關函數的滯後值。激勵 1吕唬亦可基於J:他資郊,+ 〃他貝& 4如來自適應性碼薄(亦稱作音 雨碼溥)之值及/或來自固定碼籍 口疋碼厚(亦稱作新碼薄且可能指示 脈衝之位置)之值。 §十异器150可經組態以計算對包括訊框之時間包絡之時 間貧訊的描述(例如’增益框架值及/或增益形狀值)。舉例 而言’計算器15〇可經組態以回應於聰㈣碼機制之指示 ,出該描述。如本文所描述’計算該描述可包括:將在 —訊框或子訊框上的信號能量計算為信號樣本之平方之 和’計算在包括其他訊框及/或子訊框之部分的窗上之信 號能量,及/或量化計算所得之時間包絡。 二計算器150可經組態以計算對訊框之時間資訊之描述, 忒%間貪訊包括與訊框之音高或週期性相關的資訊。舉例 而言,計算器150可經組態以回應於CELp編碼機制之指示 而輸出包括訊框之音高資訊(諸如音高滯後或延時及/或音 高增益)的描述。在一些情況下,可自相應語音封包且亦 可自先珂語音封包獲得與訊框之音高分量相關之資訊,諸 如激勵信號,或諸如音高滯後之參數。替代或額外地,計 开器1 5 0可經組態以回應於ppp編碼機制之指示而輸出對週 123360.doc -42- 200830278 期波形(亦稱作”原型”p、+、 )之1。計算音高及/或原型資訊通 常包括自LPC殘差提取該資 ^ 參貝δΤΙ且亦可包括組合來自當前訊 框之音咼及/或原型資訊鱼來 u 一求自一或多個過去之訊框的該 資訊。計算器1 5 0亦可娘細能曰 、、二、、且恶以1化對時間資訊之該描述 (例如,量化為一或多個表索引)。 計算器15 〇可經組態 ’ 冲W對包括激勵信號的訊框之時 間資訊之描述。舉例而古 ^ s ’计异器1 5 0可經組態以回應於 C E L P編碼機制之指+品认 ’、而輸出包括激勵信號之描述。激勵 "[吕7虎亦可包括對音其八旦 刀里之描述(例如,音高延時或滯 後、音高增益及/或對焉 丁尿t之“述)。計算激勵信號通常包 括自LPC殘差導出該作辦 ——Γ . 就且亦可包括組合來自當前訊框之 激勵資訊與來自一岑各伽i > 及夕個過去之訊框的該資訊。計算器 150亦可經組態以量化對時間資訊之該描述(例如,量化為 一或多個表索引)。對於語音編碼器132支援寬鬆 CELP(RCELP)編碼機制之情況,計算器⑼可經組態以使 激勵信號規律化。 圖16A展不封包編碼器122之實施124之方塊圖,該實施 ⑶包括肖間資訊描述計算器15G之實施152。計算器152經 組態以計算對一訊框之時間資訊(例%,激勵信號、音高 及/或原型貪訊)之描述,該描述係基於如由頻譜包絡描述 汁异裔140所計算的對訊框之頻譜包絡之描述。 圖16B展示時間資訊描述計算器152之實施154之方塊 圖,该貫施1 54經組態以基於訊框之Lpc殘差而計算對時 間資Λ之“述。在此實例中,計算器154經配置以接收如 123360.doc -43- 200830278 由頻譜包絡描述計算器1 42所計算的對訊框之頻譜包絡之 描述。解量化器A1〇經組態以對描述進行解量化,且逆變 換區塊A20經組態以對經解量化之描述應用逆變換從而獲 得LPC係數之集合。白化濾波器A3〇根據Lpc係數之集合而 經組態且經配置以對語音信號進行濾波來產生Lpc殘差。 1化器A40經組態以量化對訊框的時間資訊之描述(例如, 置化為一或多個表索引),該描述係基於LPc殘差且可能亦 基於该訊框之音高資訊及/或來自一或多個過去之訊框的 籲時間資訊。 可能需要使用封包編碼器122之實施來根據分離頻帶編 碼機制而對I頻語音信號之訊框進行編碼。在該情況下, 頻譜包絡描述計算器140可經組態以連續及/或並行地且(可 能地)根據不同編碼模式及/或速率而計算對訊框在各別頻 ▼上的頻譜包絡之各種描述。時間資訊描述計算器i 5〇亦 可經組態以連續及/或並行地且(可能地)根據不同編碼模式 及/或速率而計算對訊框在各個頻帶上之時間資訊的描 W述。 圖17A展示語音編碼器100之實施1〇2之方塊圖,該實施 1 〇2經組態以根據分離頻帶編碼機制而對寬頻語音信號進 仃編碼。語音編碼器i 〇2包括濾波器組A5〇,其經組態以對 語音信號進行濾波來產生含有語音信號之在第一頻帶上之 内容之子頻帶信號(例如,窄頻信號)及含有語音信號的在 第二,帶上之内容之子頻帶信號(例如,高頻信號該等 濾波器組之特定實例描述於(例如)發布於2〇〇7年4月Η曰之 123360,doc -44- 200830278 美國專利申請公開案第2007/088558號(Vos等 人),,SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING”中。舉例而言,濾波器組 A50可包括經組態以對語音信號進行濾波來產生窄頻信號 之低通濾波器及經組態以對語音信號進行濾波來產生高頻 信號之高通濾波器。如(例如)美國專利申請公開案第 2007/088558號(Vos等人)中所描述,濾波器組A50亦可包括 經組態以根據所要各別抽取因數而降低窄頻信號及/或高 • 頻信號之取樣速率之降低取樣頻率取樣器。如發布於2007 年4月19曰之美國專利申請公開案第2007/088541號(Vos等 人)”SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND BURST SUPPRESSION” 中所描述,語音編碼 器102亦可經組態以對至少高頻信號執行諸如高頻叢發抑 制操作之雜訊抑制操作。 語音編碼器102亦包括封包編碼器120之實施126,其經 組態以根據速率控制信號之狀態而對單獨之子頻帶信號進 ^ 行編碼。圖1 7 B展示封包編碼器12 6之實施12 8之方塊圖。 封包編碼器128包括經組態以基於由濾波器組A50產生之窄 頻信號且根據如由速率控制信號之狀態所指示之編碼機制 而分別計算對頻譜包絡及時間資訊的描述之頻譜包絡計算 器140a(例如,計算器142之例子)及時間資訊計算器 15 0a(例如,計算器152或154之例子)。封包編碼器128亦包 括經組態以基於由濾波器組A50產生之高頻信號且根據如 由速率控制信號之狀態所指示之編碼機制而分別產生對頻 123360.doc -45- 200830278 曰c及時間貪訊的計算所得之描述之頻譜包絡計算器 〇b(例如,计异器142之例子)及時間資訊計算器例 如计"器152或154之例子)。封包編碼器128亦包括封包 ^式化器⑽之實施162,纟經組態以產生語音Μ包,該語 。曰封匕包括如由速率控制信號之狀態所指示窄頻及高頻信 唬中之一者或兩者的頻譜包絡及時間資訊之計算所得之描 述之。
如上文所提及’對寬頻語音信號之高頻部分的時間資訊 之描述可基於對該信號之窄頻部分的時間資訊之描述。圖 Α展不封包編碼器126之相應實施丨29之方塊圖。如同上 =所迷之封包編碼n 128 ’封包編碼器129包括經配置以計 π對頻瑨包絡之各別描述之頻譜包絡描述計算器MW及 1 _。封包編碼器i29亦包括時間資訊描述計算器! 52之例 子152a(例如’計算以54)’其經配置以基於對窄頻信號之 頻譜包絡的計算所得之描述而計算對時間資訊之描述。封 包編碼器i29亦包括時間資訊描述計算器15()之實施156。 計算器⑽里組態以計算對高頻信號之時間資訊之描述, 該描述係基於對窄頻信號之時間資訊的描述。 圖⑽展示時間描述計算器156之實施158之方塊圖。計 算器158包括高頻激勵信號產生器細,其經組態以基於如 由計算器i 5 2 a所產生之窄頻激勵信號而產生高頻激勵信 號。舉例而言,產生器A60可經組態以對窄頻激勵信號(或 其一或多個分量)執行諸如譜延伸、错波延伸、非線性延 伸、譜摺疊及/或譜轉譯之操作以產生高頻激勵信號。額 123360.doc -46- 200830278 外或減地,產生器編可經組態以執行隨機雜訊(例如, 偽隨機高斯雜訊信號)之頻譜及/或振幅整形以產生高頻激 勵信號。對於產生器A60使用偽隨機雜訊信號之情況,可 能需要同步化編碼器及解碼器對此信號之產生。高頻激勵 信號產生之該等方法及裝置更為詳細地描述於(例如)發布 於⑽7年4们9日之美料财請公㈣第胸⑽ 號(v〇s 等人)”SYS丁EMS,騰H〇DS,娜 AppAR細s FOR WIDEBAND SPEECH c〇mNG"中在圖⑽之實例 :’產生器A60經配置以接收量化窄頻激勵信號。在另一 ’產生器A60經配置以接收另—形式之窄頻激勵信 號(例如,預量化或經解量化之形式)。 古計算器158亦包括合成濾、波器A7G,其經組態以產生基於 南頻激勵信號及斟古斗g p η〜 “頻㈣之頻譜包絡之描述(例如,如 由计异器14 0 b所產;i&人4、> - 生)的a成之鬲頻信號。通常根 頻信號之頻譜包软之,㈣& 很蘇對同 、 °之描述内的一組值(例如,一或多個;τςρ 或LPC係數向量)而對濾波器Α70進行組_ # 勵信號產生合成之”广…應於囉 口风之阿頻^唬。在圖18B之 人 波器A70經配置以 巾s成滤 〜门两^現之頻譜包絡之量仆沪碲 且可相應地經組態以包括解量化里化描速 塊。在另_實例φ #、~ °。及(可此地)逆變換區 對高頻彳 、工配置Μ接彳u -形式的 之形式t虎之頻增包絡之描述(例如,預量化或經解量化 °十异益1 5 8亦包括高頻增益 基於合成㈠卜, 异器Αδ〇’其經組態以 “頻W之時間包絡而計算對高頻㈣之時間包 123360.doc -47- 200830278 絡之描述。計算器A8〇可經組態以將此描述計算為包括高 頻信號之時間包絡與合成高頻信號之時間包絡之間的一或 多個距離。舉例而言’計算器A80可經組態以將該距離計 算為增益框架值(例如,計算為兩個信號之相應訊框的能 量之量測結果之間的比率,或計算為該比率之平方根)。 額外或替代地,計算器A8〇可經組態以將許多該等距離計 异為增益形狀值(例%,計算為兩個信號之相應子訊框的 能量之量測結果之間的比率,或計算為該等比率之平方 根)。在圖18B之實例中,計算器158亦包括經組態以量化 對時間包絡之計算所得之描述(例如,量化為—或多個碼 薄索引)的量化器A90。計算器158之元件之各種特徵及實 施描述於(例如)如上文引用之美國專利中請公開案第 2007/0088542號(V〇s 等人)中。 語音編碼器100之實旆夕夂話一 ^ 貝她之各種兀件可體現於被視為適於 所欲應用之硬體、軟體及/或韌體之任一組合中。舉例而 言,可將該等元件製造為駐存於(例如)同一晶片上或者一 晶片組中之兩個或兩個以上 上之晶片中的電子及/或光學設 備。該設備之一實例為諸如雷曰 尾日日體或邏輯閘之邏輯元件之 固定或可程式化陣列,且可將 」將此寺儿件中之任何者實施為 一或多個該等陣列。可將此等 干T之任兩者或兩者以上 或甚至全部實施於相同的一. 次夕個陣列内。可將該或該等 陣列實施於一或多個晶片内r | 門(例如,包括兩個或兩個以上 晶片之晶片組内)。 亦可將如本文所述之語立姐 曰、、扁碼器100之各種實施的一或 123360.doc -48. 200830278 多個τΜ牛完全或部分地實施為經配置以執行於邏輯元 -或多個固定或可程式化陣列(諸如微處理器 理器、㈣心、數位信號處理器、場可程式化入閉= (FPGA)、特殊應用標準產品(Assp)及特殊應 (ASIC))上之指令之一.多人 、體电路 之實施的各種⑷==:=- 或夕们陣列的機益,亦稱作"處理器,,),且可將此 之任兩者或兩者以上或甚至全部實施於相同 腦内。 語音編碼器ΠΚ)之實施的各種元件可包括於諸如 電活的用於無線通信之設備或具有該通信能力之另—: 内。該設備可經組態以與電路交換及 广 、隹卜、& J二/, j匕人換之網路 進灯…例如,使用諸如㈣之一或多個協定 可經組態以對載運經編碼之訊框之信號執行操作, 錯、肖,UI(PTOing)、回旋編碼、縣修正編碼、== 多層網路協定(例如,乙太網 或 (TCP/IP)、H 。 太同路傳輸控制/網際網路協定 Γ m )之編碼、射頻(rf)調變及/或-傳 對於語音編碼器⑽之實施之—或多個元件而言,可心 用:::不與裝置之操作直接相關之任務 關的指令之其他集合(諸如與裝置所二: 糸統之另-操作相關之任務)。對於語音編巧。。 ⑽之實施之-或多個元件而言,具有共有結構(::= 123360.doc •49- 200830278 以在不同時間執行程式瑪之對應於不同元 器、叙勃;+ I刀的處理 令之:!丁:不同時間執行對應於不同元件之任務的指 :光學設備之配置)亦為可能的。在-該實例中,將:包 Γ馬器12G及鞋格式㈣⑽實施為經配置以執行於同- 處理器上之指令之隹人如 木口。在另一該實例中,將頻譜包欲 述計算器心及_實施為執行於不同時間之指令之= 集合。
圖19A展示根據通用組態而處理來自經編碼之語音信號 之语音封包的方法M·之流程圖。方法⑽⑽經組離以自ϋ 兩個語音封包(例如,自經編碼之語音信號之連續^經編 碼訊框)接收資訊且產生對語音信號之兩個相應訊框之頻 譜包絡的描述。基於來自第一語音封包(亦稱作,,參考"語音 封包)之貧訊,任務Τ210獲得對語音信號之第一訊框在第 一及第二頻帶上的頻譜包絡之描述。此描述可為延伸越過 兩個頻帶之單一描述,或者其可包括各自延伸越過頻帶二 之各別一者之單獨的描述。基於來自第二語音封包之資 汛,任務Τ220獲得對語音信號之第二訊框(亦稱作,,目桿" 汛框)在第一頻帶上的頻譜包絡之描述。基於來自參考七五 音封包之資訊,任務Τ230獲得對目標訊框在第二頻帶上= 頻譜包絡之描述。基於來自第二語音封包之資訊,任矛欠 Τ240獲彳寸對目標訊框之關於第一頻帶之音高資訊的描述。 圖20展示方法Μ200之應用。在此實例中,對頻错包絡 之描述具有LPC階,且對目標訊框在第二頻帶上之頻误包 123360.doc •50- 200830278 絡的描述之LPC階小於對目標訊框在第一頻帶上之頻譜包 絡的描述之LPC階。在一特定實例中,對目標訊框在第一 及第二頻帶上之頻譜包絡的描述之LPC階分別為十及六。 其他實例包括對目標訊框在第二頻帶上之頻譜包絡的描述 之LPC階為對目標訊框在第一頻帶上之頻譜包絡的描述之 LPC階之至少百分之五十、至少百分之六十、不超過其百 分之七十五、不超過其百分之八十、與其相等及大於其之 情況。 、
圖20亦展示一實例,其中對第一訊框在第一及第二頻帶 上之頻譜包絡的描述之LPC階相等於對目標訊框在第一及 第二頻帶上之頻譜包絡的描述之LPC階之和。在另一實例 中對第5孔框在第一及第二頻帶上之頻譜包絡的描述之 LPC階可大於或小於對目標訊框之在第一及第二頻帶上之 頻邊包絡的描述之LPC階之和。 =考語音封包可包括對在第—及第二頻帶上之頻譜包絡 之量化描述’ i第二語音封包可包括對在第—頻帶上之頻 譜包絡的量化描述。在—特定實例中’包括於參考語音 :中之對在第一及第二頻帶上之頻譜包絡之量化描述具有 三十六位元的長度’且包括於第二語音封包中之對在第— 頻帶上之頻譜包絡之量化描述具有二十二位元的長度 其:也Λ例中,包括於第二語音封包中之對在第一頻帶上之 頻譜包,之量化描述的長度不大於包括於參考語音封 之對在第-及第二頻帶上之頻譜包絡之量化描述的長度之 百分之六十五、七十、七十五或八十。 又 123360.doc -51 - 200830278 任務Τ210及T220中之每一者可經組態以包 作中之-者或兩者:剖析語音封包 ^兩個操 作#、+、· ^ Α捉取對頻譜包絡的量 化^述,轉量化㈣料絡之量化料, 之編碼模型之-組參數。任務丁21〇及丁22〇之典型^二匡 ^作中之兩者,以使得每—料處理各別語音 產組模型參數之形式的對頻譜包絡之描述(例如, 或夕個LSF、LSP、ISF、阶及/或Lpc係數向量卜在— 特定實例中’參考語音封包具有i7i位元之長度,且第二 =音封包具有曝元之長度4其他實例巾m = 匕之長度不大於參考語音封包之長度之百分之五十〜 十、七十或七十五。 ^ :考語音封包可包括對關於第一及第二頻帶之時間資訊 之=化“述,I第二語音封包可包括對關於第―頻帶之時 間資訊的量化描述。在—特定#例中,包括於參考語音封 包中之對關於第一及第二頻帶之時間資訊之量化描述:有 133位元的長度’且包括於第二語音封包中之對關於第一 頻帶之時間資訊之量化描述具有58位元的長度。在其他實 例中’包括於第二語音封包中之對關於第一頻帶之時間資 訊之量化描述的長度不大於包括於參考語音封包中之對關 於第一及第二頻帶之時間資訊之量化描述的長度之百分^ 四十五、五十或六十,或者不小於其百分之四十。 亦可實施任務T210及T220以自各別語音封包產生對時間 資訊之描述。舉例而言,此等任務中之一者或兩者可經組 態以基於來自各別語音封包之資訊而獲得對時間包絡之描 123360.doc •52- 200830278
述、對激勵信號的描述、對音高資訊之描述或對原型之描 述。如在獲得對頻譜包絡之描述中,該任務可包括剖析來 自語音封包之對時間資訊之量化描述及/或解量化對時間 貧訊的量化描述。方法M200之實施亦可經組態以使得任 務T210及/或任務丁22〇同樣基於來自一或多個其他語音封 包之貧訊(諸如來自一或多個先前經編碼之訊框之語音封 包的資訊)而獲得對頻譜包絡之描述及/或對時間資訊的描 述。舉例而言,對激勵信號之描述、對音高資訊之描述及 對原t之“述通常基於來自先前訊框的資訊。 任知T240經組態以基於來自第二語音封包之資訊而獲得 對目標訊框關於第一頻帶之音高資訊的描述。對音高資訊 之描::包括對以下内容中之一或多者之描述::高滞 後曰同增盈、原型及激勵信號。任務Τ24〇可包括剖析來 自第二語音封包之對音高資訊之量化描述及/或解量化對 音高資訊之量化描述。舉例而言,第二語音封包可包括對 關於弟-頻帶之音高資訊之量化描述,其長度為第二語音 封=之長度的至少百分之五及/或至多百分之十。在一特 定貫例中,第二語音封包具有人十位元之長度,且包括於 ^二語音封包中之對關於第一頻帶之音高資訊(例如,音 回則灸4日數)的量化描述具有七位元之長度。任務以。亦 侧態以f於來自第二語音封包之音高資訊而計算目標 ’fl框之關於第-頻帶之激勵信號。亦可能需要對任務τ_ 進行組態以如本文所述(例如,參考高頻激勵產生器Α60及 )土於目‘ σίι框的關於第一頻帶之激勵信號而計算目標 123360.doc •53 - 200830278 訊框之關於第二頻帶之激勵信號。 方法M200之實施亦可經組態以使得任務T24〇同樣基於 來自一或多個其他語音封包之資訊(諸如來自一或多個先 前經編碼之訊框之語音封包的資訊)而獲得.對音高資訊之 描述。圖22展示方法Μ200之該實施M210之應用《方法 Μ21〇包括任務丁240之實施丁242,其經組態以基於來自參 考及第二語音封包中之每—者之f訊而獲得對目標訊框的 關於第一頻帶之音高資訊之描述。舉例而言,任務DU可 經組態以基於一基於來自第二語音封包之資訊之第一音高 滯後值及-基於來自參考語音封包之f訊的第二音高滞後 值而内插目標訊框之關於第一頻帶之延時輪廓。任務丁242 亦可經組態以基於來自參考及第二語音封包中之每一者之 音高資訊而計算目標訊框之關於第—頻帶的激勵信號。 通常將方法M200作為語音解碼之較大方法之部分而執 行,且明確地預期並由此揭示經組態以執行方法M2〇〇的 #音解碼H及語音解碼之方法。語音編碼裝置可經组,離以 在編碼器處執行方法M1⑽之實施且在解碼器處^行:法 M200之實施。在該情況下,如由任務編碼之,,第 音封包”對應於向任務丁21〇及T23〇供應資訊之表考祖音封 包,且如由任務丁120'編碼之,,第二語音封包”對應於=務 Τ220及伽供應資訊的語音封包。圖21使用藉由使用方法 Μ1 0 0編碼且藉由使用方法Μ 2崎碼之—對連續訊框之杏 例來說明方法卿0與咖〇之間的此關係。亦: Μ 2 0 0以包括剖析來自各別經編碼之 =方法 如由任務 I23360.doc -54- 200830278 ΤΙ 30及T140所產生)之參考語音封包及第二語音封包或者 以其他方式自各別經編碼之訊框獲得參考語音封包及第二 語音封包的操作。 儘管有圖2 1的特定實例,但應清楚地瞭解,_般而今, 方法Ml 00之應用及方法M2〇〇之應用不限於處理連續訊框 之對。舉例而言,在方法M200之一個其他應用中,可藉 由在傳輸中失去之-或多個介人訊框(亦即,抹除訊框)將 供應由任務T210及T230處理之語音封包的經編碼之訊框與 供應由任務T220及T240處理之語音封包的經編碼之訊陪 開。 任務T 2 2 0經組態以至少主要地基於來自第二語音封包之 資訊而獲得對目標訊框在第一頻帶上的 舉㈣言,任務⑽可經組態α完全基於來自==封 包之資訊而獲得肖目標訊框纟第一涉員帶上的頻言普包絡之描 述。或者’任務Τ220可經組態以同樣基於其他資訊(諸:
來自-或多個先前經編碼之訊框之語音封包之資訊)而獲 得對目標tft框在第n的頻譜包絡之描述。在該情況 下’任務T220經組態以使對來自第二語音封包之資訊所加 ,重大於對其他資訊所加權重。舉例而言,任務τ22〇之該 實施残組態以將對目標訊框在第—頻帶上之頻譜包絡的 描述計异為來自第二語音封包之資訊與來自先前經編碼之 訊框(例如,參考經編碼訊框)的語音封包之 值,其中對來自第二語音封包之資、一 匕'^貝Λ所加榷重大於對來自 其他語音封包之資訊所加權重。同樣地,任務㈣可經組 I23360.doc -55- 200830278 態以至少主要地基於來自第二語音封包之資訊而獲得對目 標訊框之關於第一頻帶的時間資訊之描述。 基於來自參考語音封包之資訊(在本文中亦稱作,,參考頻 譜資訊Ί,任務丁230獲得對目標訊框在第二頻帶上的頻譜 包絡之描述。圖19B展示方&M2〇〇之實施M22〇之流^ 圖,該實施M220包括任務T23〇之實施Τ232。作為任務 T230之實施,任務T232基於參考頻譜資訊而獲得對目標訊 框在第二頻帶上的頻譜包絡之描述。在此情況下,泉考頻 •譜資訊包括於對語音信號之第一訊框之頻譜包絡的描述 内。圖23展示方法以22〇之應用之實例。 任務T23〇mx至少主要地基於參考頻譜資訊而獲得 對目標訊框在第二頻帶上的頻譜包絡之描述。舉例而言, 任務T230可經組態以完全基於參考頻譜資訊而獲得對目標 訊框在第二頻帶上的頻譜包絡之描述。或者,任務可 經組態以基於(Α)基於參考頻譜資訊的對在第二頻帶上之 籲頻=包絡之描述及(Β)基於來自第二語音封包之資訊的對 在第一頻帶上之頻譜包絡之描述而獲㈣目標訊框在第二 頻帶上的頻譜包絡之描述。 在该情況下,任務Τ230可經組態以使對基於參考頻譜資 訊之描述所加權重大於對基於來自第二語音封包之資訊的 祂述所加權重。舉例而言,任務Τ23〇之該實施可經組態以 將對目標訊框在第二頻帶上之頻譜包絡的描述計算為基於 多考頻褚資汛與來自第二語音封包之資訊之描述的平均 值,其中對基於參考頻譜資訊之描述所加權重大於對基於 123360.doc -56- 200830278 弟 9封包之資訊之描述所加權重。在另一情況 下’基於參考頻譜資訊之描述之LPC階可大於基於來自第 一浯音封包的資訊之描述之LPC階。舉例而言,基於來自 第二語音封包之資訊的描述之LPC階可為丨(例如,該描述 可為譜傾斜值,諸如第一反射係數之值)。同樣地,任務 丁 230可經组態以至少主要地基於參考時間資訊(例如,完 全基於參考時間資訊,或亦較小部分地基於來自第二語音 封包之資訊)而獲得對目標訊框之關於第二頻帶的時間資 響之描述。
可貝%任務T2 10以自參考語音封包獲得對頻譜包絡之描 述,其為在第-及第二頻帶兩者上的單一全頻帶表示。然 而’更為典型的是實施任務T2l〇以獲得作為對在第一頻帶 上與在第二頻帶上之頻譜包絡之單獨描述的此描述。舉例 而言,任務T21〇可經組態以自參考語音封包獲得單獨描 述,已使用如本文所述之分離頻帶編碼機制(例如,在圖 12之實例中為編碼機制1)對該參考語音封包進行編馬。。 圖19C展示方法Μ220之 務 程圖,其中將任
Τ21 〇實施為兩個子任務丁2 12:a及Τ2 12b。基於來自來考 音封包之資訊,任務T2i2a獲得對第一訊框在第—頻帶I 的頻譜包絡之描述。基於來自參考語音封包 > 、页 b >訊,任務 T212b獲得對第一訊框在第二頻帶上的頻譜包絡之描述。 任務丁212a及/或T212b可包括剖析來自各別語音封 頻譜包絡之量化描述及/或解量化對頻级 匕之對 、%匕、、谷之量化描 述0 123360.doc •57· 200830278 亦可實施任務T212a及/或T2 12b以基於來自各別語音封 包之資訊而產生對時間資訊之描述。舉例而言,此等任務 中之一者或兩者可經組態以基於來自各別語音封包之資訊 而獲得對時間包絡之描述、對激勵信號的描述及/或對音 岗資訊之描述。如在獲得對頻譜包絡之描述中,該任務可 包括剖析來自語音封包之對時間資訊之量化描述及/或解 量化對時間資訊的量化描述。
方法M230亦包括任務T232之實施丁234。作為任務丁23〇 之貫施,任務Τ234獲得對目標訊框在第二頻帶上的頻譜包 絡之描述,該描述係基於參考頻譜資訊。如同在任務τ232 中’參考頻譜資訊包括於對語音信號之第一訊框之頻譜包 、。的描述内.。在任務Τ234之特定情況中,參考頻譜資訊包 $於對第一訊框在第二頻帶上之頻譜包絡的描述内(且可 能地與)。任務Τ234亦可經組態以獲得對目標訊框 之關於第二頻帶之時間資訊的描述,該描述係基於包括於 、皆第σΤΙ框之關於第二頻帶之時間資訊的描述内(且可能 地與其相同)之資訊。 圖24展不自兩個語音封包接收資訊且產生對語音信號 兩:相應訊框之頻譜包絡的描述之方法Μ230之應用。 此:例中,對頻譜包絡之描述具有LPC階,且對第一訊 第及第一頻帶上之頻譜包絡的描述之lpc階與對目 til框在各別相:^ — 、V上之頻譜包絡的描述之LPC階相等。其 對第—訊框在第一及第二頻帶上之頻譜包絡的 或兩者大於對目標訊框在各別頻帶上之頻譜 123360.doc -58- 200830278 絡的相應描述之情況。 = Ϊ包可包括對在第―頻帶上之頻譜包絡之量化 實例中,包括於參考語立封”的里化“述。在-特定 包絡之量化描述具有二十八:元弟一頻帶上之頻譜 音封包中之對在第包括於參考語 付-μ电 之頻譜包絡之量化描述具有八 “列中,包括於參考語音封包中之對 在弟一頻帶上之頻譜、^ 、 參考語音封包中之對ρ一达的長度不大於包括於 ..^ +在弟一頻帶上之頻譜包絡之量化描述 的長度之百分之三十、四十、五十或六十。 ^ 麥考語音封包可包括對關於第-頻帶之時間資訊之量化 描述及對關於第二頻帶 、 化 %間#訊的量化描述。在一特定 “列中,包括於參考語音封 -ίί ^ ^ ^ T又對關於弟一頻帶之時間 貝化描述具有125位元的長度,且包括於參考語音 ::::對關於第二頻帶之時間資訊之量化描述具有8位 兀的長度。在其他實例中,4 _ 、 匕括於 > 考語音封包中之對關 者 h之時間資訊之量化描述的長度不大於包括於參 封包中之對關於第一頻帶之時間資訊之量 長度之百分之十、二十、二十五或三十。 第二語音封包可包括對在第—頻帶上之頻譜包絡之量化 描述及/或對關於第—頻帶的時間資訊之量化描述。在一 特定實例中,包括於第二經編碼之訊框中的對在第一頻帶 i之頻譜包絡之量化描述具有二十二位元之長度。在其他 灵例中’包括於第二語音封包中之對在第一頻帶上之頻譜 123360.doc -59- 200830278 包絡之量化描述的長度不小於包括於參考語音封包中之對 在第-頻帶上之頻譜包絡之量化描述之長度的百分之四 十 十’、十—十或七十五。在-特定實例中,包括 於第二語音封包中之對關於第一頻帶之時間資訊的量^ 述具有五十八位元之長度。在其他實例中,包括於第二: 音封包中之對關於第—頻帶之時間資訊之量化描述的長度 為包括於參考語音封包中之對在第一頻帶上之頻譜包^
量化描述的長度之至少百分之二十五、三十、四十或四十 五及/或至多百分之五十、六十或七十。 在方法M200之典型實施中,參考頻譜資訊為對在第二 頻帶上之頻譜包絡之描述。此描述可包括-組模型來數, 諸如一或多個^、咖、阶、.或咖係數向量^般 而言,此描述為如藉由任務伽自參考語音封包獲得的對 第-訊框在第二頻帶上之頻譜包絡之描述。對於參考頻譜 育訊而言亦有可能包括對(例如,第—訊框之)在卜㈣ 上及/或在另一頻帶上之頻譜包絡之描述。 圖25展示方法M200之實施M24〇之應用,該實施包括任 務丁260。任務丁260經組態以基於來自包括第二語音封包之 經編碼訊框的資訊而產生與語音信號分離之資訊信號之叢 發。舉例而言,任務丁可經組態以輸出經編碼之訊框之 特定部分作為如上文所述之信號傳輸或次要訊務信號的叢 發。該叢發可具有至少為經編碼之訊框之長度的百分之四 十、四十五或五十之以位元計之長度。替代或額外地,該 叢發可具有至少為第二語音封包之長度之百分之九十的以 123360.doc -60· 200830278
位元計之長度’或者該叢發可具有等於或長於第二語音封 包之長度之長度。在一特定實例中,叢發具有86位元(在 另一實例中’87位元)之長度1二語音封包具有⑼位元 之長度,且經編石馬之訊框具有m位元之長度。亦可實施 方法M210、M22〇及M230以包括任務T26〇。 U
㈣⑽通常包括自諸如半導體記憶體(在本文 作”緩衝器”)之儲存元件之陣列榻取參考頻譜資訊之操作二 =參考頻譜資訊包括對在第二頻帶上之頻譜包絡之描述 的情況’擷取參考頻譜資訊之動作可足以完成任務如〇。 :)者’:能需要對任務T230進行組態以計算對目標訊框在 弟-頻页上之頻譜包絡之描述(在本文中亦稱作"目栌 =)而非簡單地對其加以操取。舉例而言,任務Τ23〇= '…猎由向參考頻譜資訊添加隨機雜訊而計算目 =基於來自至少一額外語音封包之頻譜資訊(;二 =於來自-個以上參考語音封包之資訊)而計算目桿巧 =自=7,任務㈣可經組態以將目標譜_計^ 末自兩個或兩個以上參考語音封包之對 ::::描述之平均值,且該計算可包括向= 均值添加隨機雜訊。 卞 =:3。可經組態以藉由在時間上自參考頻譜 上:來自兩個或兩個以上參考語音封包之對 述。譜包絡的描述之_插”算目標譜描 代或額外地,任務T230可經組態以藉由在頻 讀框在另-頻帶上(例如’在第-頻帶上)之頻μ 123360.doc • 61 - 200830278 絡的描述外推及/或藉由在頻率上於對在其他頻帶上之頻 譜包絡之描述之間内插而計算目標譜描述。 、 通常’參考頻譜資訊及目標譜描述為譜參數值之向量 (或諳向x ”)。在一該實例中,目標及參考頻譜向量兩者 均為LSP向1。在另一實例中,目標及參考頻譜向量兩者 均為LPC係數向量。在又—實例巾,目標及參考頻譜向量 兩者均為反射係數向量。任務T23〇可經組態以根據諸如 〜VZ6{1,2, ···…之陳述式而自參考頻譜資訊複製目標 "曰描述其中〜為目標譜向量,〜為參考譜向量(其值通常 在-1至+1之範圍内),?·為向量元素指數,且η為向量〜之長 度。在此操作之變化中,任務Τ230經組態以向參考譜向量 應用加權因數(或加權因數之向量)。在此操作之另一變化 中,任務Τ230經組態以藉由根據諸如 ^匕{1,2,.",4之陳述式向參考譜向量添加隨 ;瞀 目標譜向量,其中德值之向量。在該情況下,= -元素可為隨機變數,其值分布於(例如,均勻地)所要範 零圍上。 可能需要確保目標譜描述之值受到約束(例如,在“至 +1之範圍内h在該情況下,任務T23G可經組態以根據諸 如心=心对々Vk {丨,2,…^之陳述式而計算目標譜描述,盆 中有在零與一之間的值(例如,在〇3至〇9之範圍内 之之每一元素之值分布於(例如,均勻地)自至㈠ 之範圍上。 在另一實例中,任務T230經組態以基於來自—個以上參 123360.doc -62- 200830278 考語音封包中之每一者的對名 、f^+曾", 的對在弟二頻帶上之頻譜包絡之描 述而汁异目標譜描述(例如 作為來自兩個最近之表考往 音封包中之每一者之對在 τ & 罘一頻▼上的頻譜包絡之描述之 平均值)。在該情況下,可能 對參考向量進行彼此不 同之加推(例如,可對來自較 孕乂新近之參考語音封包之向量 加以較重之權)。 可此需要將任務則執行㈣於處理㈣分離頻帶編碼 之語音封包之高頻部分之抹除的㈣—般之操作之例子。 舉例而言,語音解碼器或語音解碼之方法可經組態以在接 收至少愚頻部分經抹除(亦即,缺少或被發現具有過多誤 虽而無法被可靠地恢復)之語音封包之㈣執行該操作。 在-典型實例中’任務咖經組態以基於參考頻譜資訊 之加權版本而計算目標譜描述。權重w可為如在以下陳述 式中之純量:〜=心叫H小或者,權重W可為可 能具有不同值之元素之向量’如以下陳述式、〜 V,·e{l,2,···,”}。 對於任務T230為抹除處理讀為_般之操作之例子的情 況,可能需要將權重實施為衰減因數α。亦可能需要實施 此操作以使得衰減因數《之值隨高頻抹除之㈣序列中之 每一者而減小。舉例而言,衰減因數α對於序列中之第一 封包可具有值0.9,對㈣财之第三封包具有飢7且對 於序列中之後續封包具有值0.5。(在該情況下,可能需要 對於抹除之序列中之每一封包使用相同參考譜向量。)在 另一該實例中,任務Τ230經組態以基於相加性常數ν而計 123360.doc -63 - 200830278 算目標譜描述,該相加性常數v可為如陳 _ ^ ^ sti—asri+v
Vze{l,2, ···.,w中之純量或為如陳 ^ ^ n ^ t ΐ — CX S * "Ή · V/eU,2, ...,M中之向量。可將常數v實施為初始譜向1量 〜’如同在陳述式〜=a〜+>y〇i Vk{l,2’ ...,《}中。在該情況 下’初始譜向量〜之元素之值可為丨之函數(例如 中為常數)。在一特定實例中, We{l,2,…,心。 ,= 6/其 ^0/ = 0.048/ 亦可實施任務T230以基於(除了參考頻譜資訊)一或多個 訊框在另-頻帶上之頻譜包絡而計算目標譜描述。舉例而 言,任務Τ23〇之該實施可經組態以藉由在頻率上自當前訊 框及/或一或多個先前訊框之在另一頻帶(例如,第一頻帶) 上之頻譜包絡外推而計算目標譜描述。 任務Τ230可經組態以基於來自參考語音封包之資訊(在 =文中亦稱作"參考時間資訊")而獲得對目標訊框在第二頻 帶上之時間資訊之描述。參考時間資訊通常為對在第二頻 帶上之時間資訊之描述。此描述可包括—或多個增益框年 值、增益輪靡值、音高參數值及/或碼薄索引…般: 言’此描述為如藉由任務伽自參考語音封包獲得的對第 一訊框在第二頻帶上之時間資訊之描述。對於參考時間資 訊而言亦有可能包括對(例如,第-訊框之)在第一頻帶上 及/或在另一頻帶上之時間資訊之描述。 任務伽可經組“藉由複製參考時間f訊而獲得對目 ㈣上之時間資訊之描述(在本文中亦稱作 目^間描述")°或者’可能需要對任務T230進行细態以 123360.doc -64 - 200830278 =:¥間料(藉由基於參考時間f訊而對其進行計 二牛例而言,任務T230可經組態以藉由向參考時間資 ㈣加隨機雜訊而計算目標時間描述。任務了可娘组 ,%以基於夾白 /rn 、、工、、且 、 一個以上參考語音封包之資訊而計算目_時 間描述。舉例而丄7 4 T才目I時
外έ,任務Τ230可經組態以將目標時間描述 7:來自兩個或兩個以上參考語音封包之對在第二頻帶 /曰之^魏的描述之平均值,且該計算可包括向計算所 =均值添加隨機雜訊。如上文所述,對於任務⑽而 =需要獲得對目標訊框在第二頻帶上之時間資訊之描 ^〜用於處理經分離頻帶編碼之語音封包的高頻部分之 抹除的較為一般操作的例子之部分。 一目標時間插述及參考時間資訊可各自包括對時間包絡之 :田l如上文所提及,對時間包絡之描述可包括一增益框 未值及’或一組增益形狀值。替代或額外地,目標時間描 述及=考相資訊可各包括對激勵信號之描述。對激勵信 號之“述可包括對音高分量之描述(例如,音高滯後或延 時、音高增益及/或對原型之描述)。 T23G通H组態以將目標時間描述之增益形狀設定 為平—的舉例而§,任務Τ23〇可經組態以將目標時間描 述之增益形狀值設定為彼此相等。任務咖之—該實施經 組態以將所有增益形狀值設定為因數一(例如〇等任務 丁230之另—該實施經組態以將所有增益形狀值設定為因數 1/n’其中n為目標時間描述中增益形狀值之數目。 任務Τ230可經組態以根據諸如或之 I23360.doc -65- 200830278 陳述式而計算目標時間描述之增益框架值,其中心為來 自參考時間資訊之增益框架值,2為隨機值,且州為加權因 數。z之值之典型範圍包括0至1及“至+丨。W值之典型範圍 包括 〇.5(或 0.6)至 〇.9(或 1.0)。
在一典型實例中,任務T230經組態以基於參考時間資訊 之增益框架值之加權版本而計算目標時間描述之增益框架 值,如在陳述式= w心中。對於任務T23〇為抹除處理之 較為一般之操作之例子的情況,可能需要將權重實施為衰 減因數β。亦可能需要實施此操作以使得衰減因數β之值隨 高頻抹除之連續序列中之每一者而減小。舉例而言,衰= 因數β對於序列中之第一封包可具有值〇9,對於序列中之 第一封包具有值〇·7且對於序列中之後續封包具有值0.5。 (在該情況下,可能需要對於抹除之序列中之每—封包使 用相同參考增隸隸。)在另―該實财,任務τ2_ 組態以基於來自參考時間資訊之一或多個增益形狀值、而 如陳述式㈣令計算目標時間描述之增益框架值,其 中η為苓考語音封包中增益形狀值之數目。 任務Τ230可經組態以基於來自兩個或三個最近參考語音 ^包之增益框架值而計算目標訊框之增益框架值。在—該 實例中’任務T23G經組態以將目標時間描述之增益框竿值 計算為-根據諸如gt=^之陳述式的平均值,其中〜為 來自最近參考語音封包之增益框架值且^為來自下一最新 近參考語音封包之增益框架值。在—相關實例中,對參考 增益框架值進行彼此不同之加權(例如,可對較新近之值 123360.doc -66- 200830278 加以較重之榷)。在又一實例中,任務Τ23〇經組態以對計 算所得之平均值應用衰減因數β且/或包括基於來自參考時 間資訊之一或多個增益形狀值之因數。 乃沄MiUO之實施(包括 組態以包括將參考頻譜資訊儲存至緩衝器之操作。方法 Μ200之該實施亦可包括將參考時間資㈣存至緩衝H之
操作。或者’方法Μ200之該實施可包括將參考頻譜資气 及參考時間資訊儲存至緩衝器之操作。 、° /法^)〇之實施可經組態以在當前語音封包含有對在 弟-頻π上之頻tf包絡之描述的情況下將基於該語音 之資訊健存為參考頻譜資訊。舉例而f所示之 組編碼機制之愔況下 n 之該實施可經組態以 在〜曰封包的編碼索弓!指示編碼機制⑴中之任 即非編碼機制2或4)之情況下儲存參考頻譜資訊。更 ::二方法_之該實施可經組態以在語音封包之 、·馬索引私不寬頻編碼機制而非 存參考頻_資1 * t 編碼機制之情況下儲 号i…。方法M200之 相同標準儲存參考時間資 、,且心以根據 可能需要實施方法M2⑽ 可同時用於個 侍所儲存之參考頻譜資訊 J U时用於一個以上參五立 . 曰封包。舉例而言,任務τπο 可經組㈣計算基於來自—個 a 4» ^ jl 上$考纟吾音封包之資訊之 目軚瑨描述。在該箄愔 +孔之 士 ^ 〆下’方法Μ20Ό可緩会且能以户乂 一㈣i將來自最近參考語音封包之 /—…以在任 二近之參考纽立射勺卜 >考頻碏處訊、來自第 专口口曰封包之貧訊以及 (了施地)來自一或多個新 123360.doc -67- 200830278 近程度較低的參考語音封包之資訊保 方法亦可經組態以維護參考時 、省存衣置中。該 史。舉例而言,方法M2nn_^ 、讯之相同歷史或不同歷 方法M200可經組態以 之參考語音封包中之每一者的對頻寺來自兩個最近 最近參考語音封舍$斟士 、 、、口之插述及僅來自 取、/弓曰封包之對時間資訊之描述。 日 在方法Μ200之實施之典型應用中 輯間)之-陣列經組態以執行該::糊如,邏 者、——者以卜々甘π β t各種任務中之一 者以上或甚至全部。亦可將任務中 能全部)實施為程式碼(例 3夕(可 栌摁於τ山a 7之—或多個集合)’將苴 Γ==輯元件之陣列(例如,處理器、微處理 I/.1 1? ^ ^ 及/或執仃的電腦程式產品(例如, 非揮發性記憶卡、半導體記憶等、=或其他 ^ 日乃寻寺之一或多個資斜 儲存媒體)中。亦可由一個 、 法_之實施之任務。在此或機器來執行方 在此荨或其他實施中,可在用於 ::通信之設備(諸如蜂巢式電話)或具有該通信能力之另 叹備内執仃任務。該設備可經組態以與電路交換及/或 封包交換之網路進行通信(例如,使用諸如讀之一或多 個協疋)。舉例而言’該設備可包括經組態以接收經編碼 之訊框之RF電路。 圖20A展不根據通用組態而處理經編碼之語音信號之語 曰解碼為200的方塊圖。舉例而言,語音解碼器可經組 恶以執仃包括如本文所述之方法M2〇〇之實施的語音解碼 之方法。語音解碼器200包括經組態以產生具有值之序列 123360,doc -68- 200830278 之控制信號的控制邏輯210。語音解碼器200亦包括封包解 碼器220,其經組態以基於控制信號之值且基於經編碼之 浯音指號之相應語音封包而計算語音信號的經解碼之訊 框。 。 渚如手巢式電話的包括語音解碼器200f通信設備可經 組態以自有線、無線或光傳輸通道接收經編碼之語音信 號。該設備可經組態以對經編碼之語音信號執行預處理操 作,諸如對誤差修正及/或冗餘碼之解碼。該設備亦可包 括語音編碼器100與語音解碼器2⑽兩者之實施(例如,在 收發器中)。 控制邏輯210經組態以產生包括值之序列之控制信號, 口亥序列係基於經編碼之語音信號的語音封包之編碼索引。 序列之每一值對應於經編碼之語音信號之一語音封包(除 了在如下文所論述之經抹除之訊框的情況中)且具有複數 個狀態中之一者。在如下文所述之語音解碼器200之一些 貝施中,该序列為二進位值的(亦即,高位值與低位值之 序列)。在如下文所述之語音解碼器200之其他實施中,該 序列之值可具有兩個以上之狀態。 控制邏輯210可經組態以判定每一語音封包之編碼索 引舉例而5,控制邏輯21 〇可經組態以自語音封包讀取 編碼索引之至少部分’自諸如訊框能量之—或多個參數判 定語音封包之位元速率,且/或自語音封包的格式判定適 :編碼模式。或者,可將語音解碼器200實施為包括經組 態以判定每一語音封包之編碼索引謂其提供至控制邏輯 123360.doc •69- 200830278 210之另一元件,或者語音解碼器2〇〇可經組態以自包括語 音解碼器200的裝置之另一模組接收編碼索引。 將未如預期而接收或經接收為具有過多需恢復之誤差的 語音封包稱作訊框抹除。語音解碼器2〇〇可經組態以使得 編碼索引之-或多個狀態用以指示訊框抹除或部分訊框抹 除,諸如語音封包之載運關於第二頻帶之頻譜及時間資訊 的部分之缺少。舉例而古,狂立r任叩。 ^ J印ϋ 口口曰解碼器200可經組態以使 得已藉由使用編碼機制2(如在圖12中)而編碼之語音封包之 編碼索引指示該訊框之高頻部分的抹除。在該情況下,任 音解碼器·可經組態以將方法Μ2〇〇之實施執行為抹除處 里=Hi:之例子。語音解碼器亦可經組態以使得 已猎由使用編碼機制2及4中之任一者(如在圖12中)而編碼 之語音封包之編碼索引指示該訊框的高頻部分之抹除。
封包解碼器220經組態以基於控制信號之值且基於㈣ 碼之語音信號之相應語音封包而計算經解碼的訊框。, 制信號之值具有第一狀態時,封包解碼器220基於對在第工 -及弟二頻帶上之頻譜包絡的描述而計算經解碼之訊框, 其中該描述係基於來自相應語音封包之資訊。當控制信號 之值具▲有第二狀1時,.封包解碼器220擷取對在第二頻帶 亡之:。曰包絡之描述,並基於所擷取的描述且基於對在第 ^上之㈣包絡之描述而計算經解碼之訊框,其 在第帛帶上的描述係基於來自相應語音封包H 語音解碼器細之實施202之方塊圖…^ 〜k括封包解碼器22G之實施222,其包括第一模組 \23360.doc •70- 200830278 230及第二模組240。模組23〇及24〇經組態以計算經解碼之 訊框之各別子頻帶部分。特定言之,第一模組23〇經組態 以計算在第一頻帶上訊框之經解碼之部分(例如,窄頻信 =),且第二模組240經組態以基於控制信號之值而計算在 第二頻帶上訊框的經解碼之部分(例如,高頻信號)。 圖26C展示語音解碼器2〇〇之實施2〇4之方塊圖。剖析器 250經組態以剖析語音封包之位元從而向控制邏輯η。提供 編碼索引且向封包解碼器220提供對頻譜包絡之至少一描 ^ 在此只例中,语音解碼器204亦為語音解碼器202之實 施,使得剖析器250經組態以向模組23〇及24〇提供對在各 別頻帶(在可用時)上之頻譜包絡之描述。剖析器25〇亦可經 組態以向語音解碼器220提供對時間資訊之至少一描述。 舉例而言,可實施剖析器25〇以向模組23〇及24〇提供對關 於各別頻帶(在可用時)之時間資訊之描述。 剖析器250亦可經組態以剖析含有語音封包之經編碼之 φ 訊框之位元以產生與語音信號分離的資訊信號之叢發(例 如’如上文所論述之信號傳輸或次要訊務之叢發)。或 者’語音解碼器204或含有語音解碼器204之裝置可以其他 方式經組態以剖析經編碼之訊框來產生語音封包(例如, 作為對剖析器250之輸入)及叢發。 封包解碼器222亦包括濾波器組260,其經組態以組合在 第一與第二頻帶上訊框之經解碼之部分來產生寬頻語音信 就。該等濾波器組之特定實例描述於(例如)發布於2007年4 月19曰之美國專利申請公開案第2007/088558號(Vos等 123360.d〇e •71 - 200830278
人)nSYSTEMS,METHODS,AND APPARATUS FOR SPEECH SIGNAL FILTERING”中。舉例而言,濾波器組 260可包括經組態以對窄頻信號進行濾波來產生第一通頻 帶信號之低通濾波器及經組態以對高頻信號進行濾波來產 生第二通頻帶信號之高通濾波器。如(例如)美國專利申請 公開案第2007/088558號(Vos等人)中所描述,濾波器組26〇 亦可包括經組態以根據所要相應内插因數而提高窄頻信號 及/或高頻信號之取樣速率之提高取樣頻率取樣器。 圖27A展示第一模組23〇之實施232之方塊圖,該實施232 包括頻譜包絡描述解碼器27〇之例子27(^及時間資訊描述 解碼器280的例子28〇a。頻譜包絡描述解碼器經組態 以對於對在第-頻帶上之頻譜包絡之描述(例如,如自剖 析器250所接收)進行解碼。訊描述解碼m經组 態以解碼對關於第-頻帶之時間資訊之描述(例如,如自 剖析器繼t接收)。舉例而言,時fa1fw解碼器篇 了經組悲以對關於第—頻帶之音高資訊進行解碼。時間資 ,描述解碼n 280a亦可經組“基於經解碼之描述(且可 能地基於來自一吱客^ 次夕個先則訊框之時間資訊)而計算關於 弟 頻V之激勵作綠* A . 以產生在第1;上\^成溏波器290之例子290a經組態 幻,其係基於對碼之部分(例如,窄頻信 心W ,5#包絡及時m的經解碼之描述。 舉例而s,可根據對在 -組值(例如…, h上之頻-包絡之描述内的 或夕個LSP或LPC係數向量)而對人成_ 器290a進行組態 里㈣對口成濾波 。从回應於關於第一頻帶之激勵信號產生 123360.doc -72- 200830278 經解碼之部分。 。攻 展示頻譜包絡描述解碼器270之實施272之方塊 圖。解量化器310經組態以對描述進行解量化,且逆變換 區^ 以對經解量化之描述應用逆變換從而獲得 一組LPC係數。時間資訊描述解碼器280通常亦經組態以 包括解量化器。 圖A展不第一杈組240之實施242之方塊圖。第二模組 242g包括頻譜包絡描述解碼器270之例子270b、緩衝器3〇〇 、、擇扣340頻碏包絡描述解碼器270b經組態以解碼對 ^ :員▼上之頻瑨包絡之描述(例如,如自剖析器2 $ 〇所 接收)。緩衝器300經組態以將對在第二頻帶上之頻譜包絡 =或夕個描述儲存為參考頻譜資訊,且選擇器34〇經組 恶以根據由控制邏輯21〇產生之控制信號的相應值之狀態 而選擇來自(A)緩衝器3〇〇或(B)解碼器27〇b之對頻譜包絡 的經解碼之描述。 第一杈組242亦包括高頻激勵信號產生器33〇及合成濾波 器290之例子290b,該例子29〇b經組態以基於經由選擇器 340接收之對頻譜包絡的經解碼之描述而產生在第二頻帶 上訊框之經解碼之部分(例如,高頻信號)。高頻激勵信號 產生330經組態以基於關於第一頻帶之激勵信號(例如, 如由時間資訊描述解碼器28〇a所產生)而產生關於第二頻 τ之激勵仏號。額外或替代地,產生器33〇可經組態以執 打隨機雜訊之頻譜及/或振幅整形以產生高頻激勵信號。 可將產生③33G實施為如上文所述之高頻激勵信號產生器 123360.doc -73· 200830278 A60的一例子。根據對在第二頻帶上之頻譜包絡之描述内 的一組值(例如,一或多個Lsp或Lpc係數向量)而對合成濾 波器290b進行組態,以回應於高頻激勵信號產生在第二頻 帶上訊框之經解碼之部分。 在包括第二模組240之實施242的語音解碼器202之實施 之一貫例中,控制邏輯21〇經組態以向選擇器34〇輸出二進 位仏唬以使得序列之每一值均具有狀態A或狀態B。在 此h况下,右當前訊框之編碼索引指示其為無效的,則控 制邏輯210產生具有狀態A之值,其使得選擇器340選擇緩 衝器3〇0之輸出(亦即,選擇A)。否則,控制邏輯210產生 一有狀L B之值,其使得選擇器340選擇解碼器270b之輸出 (亦即,選擇B)。 語音解碼器202可經配置以使得控制邏輯21〇控制緩衝器 之紅作、舉例而言,緩衝器300可經配置以使得控制信 號之具有狀恕B之值使緩衝器3〇〇儲存解碼器27仳之相應輸 出可藉由向緩衝器300之寫入啟用輸入端施加控制信號 而貝%⑴工制’其中該輸入端經組態以使得狀態b對應於 其有效狀態。或者,可實施控制邏輯210以產生亦包括值 序歹』之第一控制信號來控制緩衝器300的操作,該序列 係基於經編碼之語音信號之語音封包之編碼索引。 圖28B展不第一模組24〇之實施244之方塊圖。第二模組 244包括頻瑨包絡描述解碼器27扑及時間資訊描述解碼器 册之例子280b,邊例子280b經組態以解碼對關於第二頻 T之蛉間育訊之描述(例如,如自剖析器25〇所接收卜第二 123360.doc -74· 200830278 模= 244亦包括緩衝器遍之實施3〇2,其亦經組態以㈣ j第二頻帶上之時間資訊之一或多個描述儲存為參考時間 資訊。 弟二模組244包括選擇器34〇之實施342 ’其經組態以根 據由控制邏輯210產生之控制信號的相應值之狀態而選擇 來自⑷緩衝n 3G2或⑻解碼器2鳥、纖之對頻譜包铁 的經解碼之描述及對時間資訊之經解碼之描述。: 器請之例子鹰經組態以產生在第二頻帶上純之= 焉之4刀(例如’兩頻信號),其係基於經由選擇器Μ接收 的對頻譜包絡及時間資訊之經解瑪之描述。在包括第二模 組244之語音解碼器搬之典型實施中,對時間資訊描述^ Γ士 281進行組態以產生對包括關於第二頻帶之激勵信號 ,間貝§孔之經解碼之描述,且根據對在第二頻帶上之頻 譜,絡的描述内之—組值(例如,—或多個咖或[pc㈣ =)而對合成遽波器鳩進行組態,以回應於激勵信號 在第二頻帶上訊框之經解碼之部分。 每圖28C展示包括緩衝器3〇2及選擇器⑷的第二模組如之 = 246之方塊圖。第二模組246亦包括經組態以解碼對關 :弟二頻帶之時間包絡之描述的時間資訊描述解碼器· =子職’及經組態以向在第二頻帶上訊框之經解碼之 。刀應用經由選擇器342接收的對時間包絡之描述之增益 = 4350(例如’倍增器或放大器)。對於對時間包絡之 =解碼描述包括增益形狀值的情況’增益控制元件350可 匕括經組態以向經解碼之部分之各別子訊框應用增益形狀 12336〇.d〇c -75- 200830278 值之邏輯。 圖28A至圖28C展示第二模組24〇之實施,其中緩衝器 3 00接收對頻譜包絡(及(在一些情況下)時間資訊)之經完全 解碼之描述。類似實施可經配置以使得緩衝器3〇〇接收未 經元全解碼之描述。舉例而言,可能需要藉由以量化形式 (例如、’如自剖析器250所接收)儲存描述而減小儲存需求。 在X等h况下,自緩衝益3 〇〇至選擇器34〇之信號路徑可經 組態以包括諸如解量化器及/或逆變換區塊之解碼邏輯。 可貝施控制邏輯2 10以產生單個控制信號來控制選擇器 340及緩衝裔3〇〇之操作。或者,可實施控制邏輯以產 生⑴用以控制選擇器340之操作之控制信號,其值具有至 少兩個可能狀態,及(2)用以控制緩衝器3〇〇之操作的第二 抆制仏唬,其包括基於經編碼之語音信號之經編碼訊框的 編碼2之值之序列且其值具有至少兩個可能狀態。 可i而要實;^ *音解碼器2G()以支援對窄頻及寬頻語音 U之解碼。如上文所提及,可能需要編碼裝置對於模糊 訊框使用窄頻編碼機制(例如,圖12之實例中之編碼機制 )在忒h /兄下,僅該語音封包之編碼索引可能不足以指 丁 ^曰封包將被解碼為窄頻語音或寬頻語音。若編碼裝置 經組態以對於窄楣级 / 乍領、、二、扁碼矾框亦使用模糊-叢發技術,則 甚至叢I在同一經編碼之訊框中之存在亦可能並不有助於 指示語音封包將被解碼為窄頻語音或寬頻語音。 因此^能f要對語音解碼器200之元件㈠列如,控制邏輯 2 10或頟外控制兀件)進行組態以保持具有分別對應於窄頻 123360.doc -76- 200830278 操作與寬頻操作之至少兩個狀態之操作值。該 基於操作值之當前狀態而啟用或停用第二模組; 了用;自弟一柄組24G的經解碼信號之高頻部 刀的?出:該元件可經組態以基於如下之資訊計算操作值 之狀態:資訊叢發在語音封包中的存 立产咕七 廿仕爪自經編碼之語 曰佗唬之一或多個新近語音封包之 欲ΛΑ Μ ★ 1系⑴及/或來自經 、為馬U號之-或多個後續語音封包之編碼索引。
制二該元件可經組態以在最近語音封包之編碼機 二碼機制之情況下將操作值之當前狀態設定為 才曰不見頻姻。在另—實例中,該元件 ^ A +4 ^7 ^ ΛΑ ^ ^ 、几心Μ社畐刖 封包之編竭索引指示用於寬頻模糊化之編碼機制的情 況下將操作值之當前狀能- 例中,該元件…能二讀操作。在另-實 狀能…Γ 在如下之情況下將操作值之當前 …“示I頻操作:(Α)當前語音封包之編碼旁引 指示寬頻、編碼機制或(Β)當 、,馬索引 用於寬頻模糊化的編碼機制,當 W… 叢發,且最近U封w 扁碼之机框包括資訊 少 θ 或者’兩個最近語音封包中之至 該元件亦可經組態以在如下==在又-實例中’ 用於寬頻模糊化的心::日封包之編碼索引指示可 叢發,且最… 當前經編碼之訊框包括資訊 取近b 9封包之編碼機制指 近之語音封包的心_ 抹除,且第二 匕的編碼機制指示寬頻編碼機制。 語音解碼器2〇〇之垂 具匕之各種7〇件可體現於被視為適於 123360.doc -77- 200830278 所欲應用之硬體、軟靜月/ 孕人體及/或韌體之任一組合中。舉 言,可將該等元件萝i皮盘+ 仟I仏為駐存於(例如)同一晶片上或者一 晶片組中之兩個或兩個以 丄之日曰片中的電子及/或光學設 備。該設備之一實例為諸如 7包日日體或邏輯閘之邏輯元件之 固= 可程式化陣列,且可將此等元件中之任何者實施為 -或多個該等陣列。可將此等元件中之任兩者或兩者以上 或甚至全部實施於相同的_ Is ^ — 6 一或夕個陣列内。可將該或該等 陣列貫施於一或多個曰y
曰曰内(例如,包括兩個或兩個以上 晶片之晶片組内)。 亦可將如本文所述之語音解碼器2〇〇之各種實施的一号 多個疋件完全或部分地實施為經配置以執行於邏輯元件之 或夕個固疋或可程式化陣列(諸如微處理器、嵌埋式廣 理器、IP核心、备你产咕占 數位#唬處理器、場可程式化閘陣歹, (FPGA)、特殊應用標準產品(ASSP)及特殊應用積體電聘 (ASIC))上之私令之一或多個集合。亦可將語音解碼器 之實施的各種元件中之任一者體現為一或多個電腦0 如’包括經程式化以執行指令之一或多個集合或序列之__ 或多個陣列的機器’亦稱作"處理器"),且可將此等元件中 之任兩者或兩者以上或甚至全部實施於相同的該或 腦内。 語音解碼器之實施的各種元件可包括於諸如蜂巢式 電話的用於無線通信之設備或具有該通信能力《另—設備 内。該設備可經組態以與電路交換及/或封包交換之:路 進行通信(例如,使用諸如·之—或多個協定)。該設備 123360.doc -78- 200830278
5 堵如去 或多個誤 ,乙太網 及/或RF :&以對载運經編碼之訊框之信號執行操作 , 反削弱、對一或多個回旋碼之解碼、對一 差修正碼的解踩、 解馬對一或多層網路協定(例如 路TCP/IP、cdma2〇〇〇)之解碼、射頻㈣解調 接收。 對於語音解碼器200之實施之一或多個元件而+ 用^行不與語音解竭器之操作直接相關之任務:執:能 與居音解碼器之操作直接相關的指令之其 :: •語音解碍器㈣埋於之設備或系統之另_操作 Γ丘。右對Γ吾音解石馬器200之實施之一或多個元件而言,且 不同、元如’用以在不同時間執行程式碼之對應於 ° π之部分的處理器、經執行以在不雁 於不同元件之任務的指令之隹……門執仃對應 件之栌你 …”之”或在不同時間執行不同元 古亥之電子及/或光學設備之配置)亦為可能的。在-:二’ _ ’將控制邏輯210、第一模組23〇及第二模組2的 •二“配置以執行於同一處理器上之指令之集合。在另 中’將頻諸包絡描述解碼器、及27 仃於不同時間之指令之同一集合。 力通信之設備(諸如蜂巢式電話)或具有該通信能 哭200兩:備可I組悲以包括语音編碼器1〇°及語音解碼 者之實施。在該情況下’對於語音編碼器職語 I::器2°°而言可能具有共有結構。在-該實例中,將 扁^刚及語音解碼器實施為包括經配置以執行 於同一處理器上之指令之集合。 123360.doc -79- 200830278 提供對所描述之組態之前述陳述以使得任何熟習此項技 術者能夠製作或使用該等方法及本文揭示之其他結構。、本 文展示及描述之流程圖、方塊圖、狀態圖及其他結構僅為 κ例,且此等結構之其他變體亦處於本揭示案之範疇内。 此等組態之各種修改為可能的,且本文提出之一般原理同 樣可應用於其他組態。舉例而言,本文描述之用於處理包 括在語音信號之窄頻部分的範圍以上之頻率的語音信號之 咼頻邛分之各種元件及任務可替代或額外地且以類似方式 經應用以處理包括在語音信號之窄頻部分之範圍以下的頻 率之語音信號的低頻部分。在該情況下,可使用所揭示之 用於自窄頻激勵信號導出高頻激勵信號之技術及結構來自 乍頻激勵#號導出低頻激勵信號。因此,本揭示案不欲限 於上文所示之組悲而是將與本文以任一方式所揭示(包括 在所申請之形成原始揭示案之一部分的隨附申請專利範圍 中所揭示)之原理及新奇特徵最廣泛地一致。 可與如本文所述之語音編碼器、語音編碼之方法、語音 解碼嚣及/或語音解碼之方法一同使用或者經調適成與其 一同使用的編解碼器之實例包括:如文件3GPP2 C.S0014-C版本 1.0,’’Enhanced Variable Rate Codec,Speech Service Options 3,68,and 70 for Wideband Spread Spectrum Digital Systems"(第三代合作移伴計劃 2,Arlington,VA, 2007年1月)中所描述之增強型可變速率編解碼器(EVRC); 如文件ETSI TS 126 092 V6.0.0(歐洲電信標準學會(ETSI), Sophia Antipolis Cedex,FR,2004 年 12月)中所描述之適應 123360.doc -80 - 200830278 ('生夕速率(AMR) #吾音編解碼器;及如文件etsi TS 12β 192 V6,0.0(ETSI,2004年12月)中所描述的AMR寬頻語音編解 碼器。 熟習此項技術者將瞭解可使用多種不同技藝及技術中之 任一者來表示資訊及信號。舉例而言,可由電壓、電流、 電磁波、磁場或磁粒子、光場或光粒子或其任一組合來表 示可能遍及上文之描述所引用之資料、指令、命令、資 訊、信號、位元及符號。雖然導出語音封包所源自之信號 稱作”語音信號”,且雖然將此等封包稱作”語音封包,,,但 亦預期且藉此揭示此信號可在有效訊框期間載運音樂或其 他非語音資訊内容。 熟習此項技術者將進一步瞭解可將結合本文揭示之組態 而描述之各種說明性邏輯區塊、模組、電路及操作實施^ 電子硬體、電腦軟體或兩者之組合。可藉由通用處理器、 數位信號處理II (DSP)、ASIC、FPGA或經設計以執行本文 描述之功能的其他可程式化邏輯設備、離散閘或電晶體邏 軏、離散硬體組件或其任一組合來實施或執行該等邏輯區 塊、模組、電路及操作。通用處理器可為微處理器,作在 替代方案巾,處理器可為任—習知處理器、控制器、微控 制器或狀態機。亦可將處理器實施為運算設備之組合,例 如⑽與微處理器之組合、複數個微處理器、結合DSP核 心之一或多個微處理器或任何其他該組態。 本文描述之方法及演算法之任務可直接體現於硬體、由 處理器執行之軟體模組或兩者之組合中。軟體模組可駐存 123360.doc 200830278 於RAM記憶體、快閃記憶體、ROM記憶體、EPROM記憶 體、EEPROM記憶體、暫存器、硬碟、抽取式碟片、緊密 光碟-唯讀記憶體(CD-ROM)或此項技術中已知的任何其他 形式之儲存媒體中。說明性儲存媒體耦接至處理器以使得 處理器可自儲存媒體讀取資訊或將資訊寫入至儲存媒體。 在替代方案中,儲存媒體可整合至處理器。處理器及儲存 媒體可駐存於ASIC中。ASIC可駐存於使用者終端機中。 在替代方案中,處理器及儲存媒體可作為離散組件而駐存 •於使用者終端機中。 1村+又r田返之組悲τ之每一者至少部分地實施為硬 線電路、經製造至特殊應用積體電路中之電路組態或者 載入至非揮發性儲存裝置中的韌體程式或作為機器可讀 式碼(諸如該程式碼為可由諸如微處理器或另一數位俨 處理單元之邏輯元件陣列執行的指令)而自資料儲存^ 加載或載人至資料儲存媒體中之軟體程式。資料儲存媒 可為諸如半導體記憶體(其可以無限制之方式包括動離 靜態隨機存取記憶雜)、唯龍㈣(r = RAM)或者鐵電、、磁阻、雙向、聚合或相變記憶體㈣' 凡件之陣列,或諸如磁碟或光 "軟體"理解為包括原始程式〜且體。應將術 碼、二進位碼1體、巨集碼、^^程式碼、機 做馬、可由邏輟开杜+ 列執行之指令的任-或多個集合 組合。 该荨實例之任 【圖式簡單說明】 123360.doc -82. 200830278 圖1展示與PST^接之無線電話系统之圖。 圖2展示與網際網路介接之無線電話系統之圖。 圖3展示兩個語音編碼器/解碼器對之方塊圖 圖4展示了語音編碼器或語音編竭方法可;吏用以選擇位 元速率之決策樹之一實例。 圖5A展示可用以計算増益形狀值之梯形窗函數的曲線。 圖观不將圖仏之窗函數應用於1框之五個子訊框 中之每一者。
圖6A展示可由分離頻帶編碼器使用以對寬頻語音内容進 行編碼之非重疊頻帶機制之一實例。 圖6B展示可由分離頻帶編碼器使用以對寬頻語音内容進 行編碼之重疊頻帶機制之一實例。 圖7A至圖7C展示192位元之經編碼訊框的三種不同格 式0 圖8A為根據通用組態之方&M1〇〇之流程圖。 圖8B為方法M100之實施Mll〇之流程圖。 圖9說明使用方法M1 〇〇之實施而對語音信號之兩個連續 有效訊框進行編碼之操作。 圖10說明方法M100之任務T110及T120之操作。 圖11說明方法]\4110之任務丁112及任務丁120之實施之操 作。 圖12為展示經組態以執行方法Mioo之實施之語音編竭 器可使用之四個不同編碼機制之一集合的表。 圖13為描述171位元之寬頻FCELP封包之位元配置之 123360.doc -83 - 200830278 表。 圖14為描述80位元之窄頻HCELP封包之位元配置之表。 圖15A展不根據通用組態之語音編碼器100之方塊圖。 圖158展示封包編碼器120之實施122之方塊圖。 圖15C展示頻瑨包絡描述計算器14〇之實施之方塊 圖。 圖16八展示封包編碼器120之實施124之方塊圖。 圖1 6B展示時間資訊描述計算器1 52之實施1 54之方塊 鲁圖。 圖17A展示語音編碼器ι〇〇之實施ι〇2之方塊圖,該實施 102經組態以根據分離頻帶編碼機制而對寬頻語音信號進 行編碼。 圖17B展示封包編碼器ι26之實施ι28之方塊圖。 圖18A展示封包編碼器ι26之實施129之方塊圖。 圖18B展示時間描述計算器ι56之實施158之方塊圖。 $ 圖19A展示根據通用組態之方法M200之流程圖。 圖19B展示方法]VI200之實施M220之流程圖。 圖19C展示方法M200之實施M230之流程圖。 圖20展示方法M200之應用。 圖21說明方法Ml 00與M200之間的關係。 圖22展示方法M200之實施M210之應用。 圖23展示方法M220之應用。 圖24展示方法M230之應用。 圖25展示方法M200之實施M240之應用。 123360.doc -84 - 200830278 圖26A展示根據通用組態之語音解碼器200之方塊圖。 圖26B展示語音解碼器200之實施202之方塊圖。 圖26C展示語音解碼器200之實施204之方塊圖。 圖27A展示第一模組230之實施232之方塊圖。 圖27B展示頻譜包絡描述解碼器270之實施272之方塊. 圖。 圖28A展示第二模組240之實施242之方塊圖。 圖28B展示第二模組240之實施244之方塊圖。 圖28C展示第二模組242之實施246之方塊圖。 •在該等圖式及隨附描述中,相同參考標籤指代相同或類 似之元件或信號。 【主要元件符號說明】 10 行動用戶單元/蜂巢式或個人通信服務 (PCS)電話 12 基地台/基地台收發器子系統(BTS)/蜂巢細 胞基地台 14 基地台控制器(BSC) 16 行動交換中心(MSC) 18 公眾交換電話網路(PSTN) 30a 第一語音編碼器 30b 第二語音編碼器 40a 第一語音解碼器 40b 第二語音解碼器 50 通信通道 123360.doc -85 - 200830278 60 通信通道 100 語音編碼器 102 實施/語音編碼器 120 封包編碼器/編碼機制選擇器 122 實施/封包編碼器 124 實施 126 實施/封包編碼器 128 實施/封包編碼器 129 實施/封包編碼器 130 訊框格式化器 140 頻譜包絡描述計算器 140a 頻譜包絡計算器 140b 頻譜包絡計算器 142 實施/頻譜包絡描述計算器 150 時間資訊描述計算器 150a 時間資訊計算器 150b 時間資訊計算器 152 實施/時間資訊描述計算器 152a 例子/計算器 154 實施/計算器 156 實施/時間描述計算器 158 實施/計算器 160 封包格式化器 162 實施 123360.doc •86- 200830278 170 LPC分析模組 180 變換區塊 190 量化器 200 語音解碼器 202 實施/語音解碼器 204 實施/語音解碼器 210 控制邏輯 220 封包解碼器 222 實施/封包解碼器 230 第一模組 232 實施 240 第二模組 242 實施/第二模組 244 實施/第二模組 246 實施/第二模組 250 剖析器 260 滤波器組 270a 例子/頻譜包絡描述解碼器 270 b 例子/頻譜包絡描述解碼器 272 實施 280a 例子/時間資訊描述解碼器 280b 例子/解碼器 280c 例子 290a 例子/合成濾波器 123360.doc -87- 200830278
290b 例子/合成濾波器 300 緩衝器 302 實施/緩衝器 310 解量化器 320 逆變換區塊 330 高頻激勵產生器/高頻激勵信號產生器 340 選擇器 342 實施/選擇器 350 增益控制元件 A10 解量化器 A20 逆變換區塊 A30 白化滤波裔 A40 量化器 A50 濾波器組 A60 高頻激勵信號產生器 A70 合成爐、波器 A80 高頻增益因數計算器 A90 量化器 BF 叢發格式位元 F 訊框品質指示符 M100 方法 M110 方法/實施 M200 方法 M210 實施/方法 123360.doc -88- 200830278
M220 M230 M240 MM T T110 T112 T114 T116 T118a T118b T120 TI22 T130 T140 T210 T212a 丁 212b 丁220 T230 T232 T234 T240 T242 實施/方法 實施/方法 實施 位元 尾位元 任務 子任務/任務 實施/任務 子任務 子任務/任務 子任務/任務 任務 子任務/任務 任務 任務 任務 子任務 子任務 任務 任務 實施/任務 實施/任務 任務 實施/任務 123360.doc •89- 200830278 T2 60 任 務 TM 訊 務 模 式 位 元 ττ 訊 務 類 型 位 元 si(n) 語 音 信 號 s2(n) 語 音信 號 SOM 訊 息 起 始 位 元 sSYNTH 1(n) 出 u 口 音 信 號 SsYNTH2(n) m 出 祖 音信 號
123360.doc -90-

Claims (1)

  1. 200830278 十、申請專利範圍: 1, 一種處理一語音信號之方法,該方法包含: 基於該語音信號之一第一有效訊框產生一第一語音封 包,該第一語音封包包括對該語音信號之包括該第一有 效訊框之一部分在(A)一第一頻帶及(B)一在該第一頻帶 上方延伸的第二頻帶上之—頻譜包絡之一描述;及 基於該語音信號之一第二有效訊框產生一第二語音封 包,该第二語音封包包括對該語音信號之包括該第二有 效訊框之一部分在該第一頻帶上的一頻譜包絡之一描 述, 其中遠第二語音封包不包括對在該第二頻帶上之一頻 譜包絡之一描述。 2. 3.
    如請求項1之處理-語音信號之方法,其中該第二有效 才在4 ^ g化唬中緊隨該第一有效訊框之後而出現。 月长員1之處理一語音信號之方法,其中對該語音信 说之包_有效訊框之_ ^分的—頻譜包絡之該描 ^立山單獨之第一及第二插述,其中該第一描述為對該 曰仏歲之包括該第—有效訊框的—部分在該第一頻帶 :::頻譜包絡之一描述,且其中該第二描述為對該語 曰“"之包括該第-有效訊框的-部分在該第二頻帶上 之一頻譜包絡之一描述。 4. 5. 如請求項 與該第二 如請求項 1之處理一語音信號之方法,其中該第一頻帶 頻帶重疊至少兩百赫茲。 1之處理-語音㈣之方法,其巾該方法包含 I23360.doc 200830278 產生經編碼之訊框,其含有(Α)該第二語音封包及(Β) 與该語音信號分離之一資訊信號的一叢發。 6. 8·
    如請求項1之處理一語音信號之方法,其中該叢發之長 度小於該第二語音封包的長度。 如叫求項1之處理_語音信號之方法,其中該叢發之該 長度等於該第二語音封包的該長度。 如明求項1之處理_語音信號之方法,其中該叢發之該 長度大於該第二語音封包的該長度。 一種用於處理一語音信號之裝置,該裴置包含: 用於基於該語音信號 音封包之構件,該第一 括該第一有效訊框的一 該第一頻帶上方延伸之 述;及 之一第一有效訊框產生一第一語 語音封包包括對該語音信號之包 部分在(Α)—第一頻帶及(Β) 一在 第二頻帶上之一頻譜包絡之一描 用於基於該語音信號之一筮— °就之弟一有效訊框產生-第二語 曰封ι之構件,該第二語音 括該第二有效訊框之一部分在“括““音信號的包 絡之-描述, 卩刀在4 —頻帶上之—頻譜包 其中該第二語音封包不包括 譜包絡之一描述。 /弟-頻τ上之一頻 ίο. 一種電腦程式產品,其包$ — 含: “可言買媒體,該媒體包 用於使至少-電腦基於該語音信號之一 產生一第一語音封包 有放訊米 …式碼,該第-語音封包包括I 123360.doc 200830278 該語音信號之包括該第-有效訊框的-部分在(A) 一第 頻π及在該第—頻帶上方延伸之第二頻帶上之一 讀包絡之一描述;及 用於,至少—電腦基於該語音信號之—第二有效訊框 …生-弟二語音封包之程式碼,該第二語音封包包括對 。亥-曰“虎的包括該第二有效訊框之一部分在該第 帶上之一頻譜包絡之一描述,
    其中該第二語音封包不包括對在該第 譜包絡之一描述。 上之 11·
    一種語音編碼器,該語音編碼器包含: 一封包編碼器,其經組態以(Α)基於一語音信號之一第 -有=訊框且回應於—速率控制信號之—第—狀態而產 生-第-語音封包’該第—語音封包包括對在⑴一第一 頻帶及⑺-在該第-頻帶上方延伸H帶上的—頻 譜包絡之一描述,且(Β)基於該語音信號之—第二有效气 框且回應於該速率控制信號之一不同於該第一狀態之第 一狀悲而產生一第二語音封包’該第二語音封包包括對 在該第一頻帶上的一頻譜包絡之一描述;及 一訊框格式化器,其經配置以接收該第一語音封包及 該第二語音封包,且經組態以(Α)回應於—模糊化控制信 號之一第一狀態而產生一含有該第—語音封包的第—經 編碼之訊框且(Β)回應於該模糊化控制信號之一不同於= 第一狀態之第二狀態而產生一含有該第二語音封包及與 該語音信號分離的一資訊信號之—叢發之第二經編碼之 123360.doc 200830278 訊框, 其中該第一經編碼之訊框及該第二經編碼之訊框具有 相同長度,該第一語音封包佔據該第一經編碼之訊框的 、百刀之八十,且该第一语音封包佔據該第二經編碼 之框之不超過一半,且 其中該第二有效訊框在該語音信號中緊隨該第一有效 訊框之後而出現。 12 · —種處理語音封包之方法,該方法包含: 基於來自一來自一經編碼之語音信號之第一語音封包 的資訊,而獲得對一語音信號之一第一訊框在(A)一第一 頻帶及(B)—不同於該第一頻帶的第二頻帶上之一頻譜包 絡之一描述; 基於來自一來自該經編碼之語音信號之第二語音封包 的資訊,而獲得對該語音信號之一第二訊框在該第一頻 帶上的一頻譜包絡之一描述; 基於來自該第一語音封包之資訊,而獲得對該第二訊 框在該第二頻帶上之一頻譜包絡之一描述;及 基於來自該第二語音封包之資訊,而獲得與該第二訊 框關於該第一頻帶之一音高分量相關之資訊。 13·如請求項12之處理語音封包之方法,其中對—語音信號 之一第一訊框的一頻譜包絡之該描述包含:對該第一訊 框在該第一頻帶上之一頻譜包絡之一描述及對該第一訊 框在該第二頻帶上的一頻譜包絡之一描述。 14·如請求項12之處理語音封包之方法,其中與該第二訊框 123360.doc -4- 200830278 關於該第-頻帶之一音高分量相關的該資訊包括一音高 滞後值。 15.如請求項12之處理語音封包之方法,其中該方法包含基 於與該第二訊框關於該第—頻帶之一音高分量相關的該 資訊而計算該第二訊框關於該第一頻帶之一激勵信號。 A如請求項15之處理語音封包之方法,其中該計算一激勵 信號係基於與關於該第一頻帶之一第二音高分量相關的 資訊,且 其中與一第二音高分量相關之該資訊係基於來自該第 一語音封包之資訊。 1 7 ·如請求項1 5之處理語音4 〇曰封包之方法,其中該方法包含基 t該第二訊框之關於該第—頻帶之該激勵信號而計算該 弟二訊框關於該第二頻帶的一激勵信號。 18.如請求項I2之處理語音 一 匕之方法,其中該方法包含自 石亥經編碼之語音信號的一缺 咏、 · 、、工、扁碼之訊框獲得與該語.音信 唬7刀離之一資訊信號的一叢 取心 其中該經編碼之訊框包 括该弟二語音封包。 19· 一種用於處理語音封 % 1 4裝置包含: 用於基於來自_來自一經 扁碼之語音信號之第一語音 封包的貧訊而獲得對一語音作 十 .s ^ ^ / "唬之一弟一訊框在(A)—第 一頻帶及(Β) —不同於該第一 币 、 頰▼的第二頻帶上之一頻譜 包絡之一描述之構件; 用於基於來自一來自該妳 、、二碥螞之語音信號之第二語音 封包的貝汛而獲得對該語音 。琥之一弟二訊框在該第一 123360.doc 200830278 頻f上的一頻譜包絡之一描述之構件· 用於基於來自該第-語音封包之資訊而獲得對該第二 訊框在該第二頻帶上之一頻譜包絡之一描述 ' f 用於基於來自該第二語音封包之 , 貝Λ而獲仔與該第二 訊框關於該第-頻帶之一音高分量相關之資訊的構件。 20. 如請求項19之用於處理語音封包之裝置,其中對一語音 信號之一第一訊框的一頻譜包絡之該描二二 -與第二描述,其中該第一描述為對該第一訊=弟第 -頻帶上之-頻譜包絡的—描述,且其中該第二描述為 對該第一訊框在該第二頻帶上之一頻譜包絡之一描述。 21. 如請求項19之用於處理語音封包之裝置,其中與該第二 訊框之關於該第-頻帶之—音高分量相關的該資訊包括 一音高滯後值。 22·如請求項19之用於處理語音封包之裝置,其中該裝置包 含用於基於與該第二訊框關於該第一頻帶之一音高分量 相關的瀛資汛而計算該第二訊框關於該第一頻帶之一激 勵信號之構件,且 其中該裝置包含用於基於與該第二訊框關於該第一頻 帶之該激勵信號而計算該第二訊框關於該第二頻帶的一 激勵信"5虎之構件。 23·如請求項19之用於處理語音封包之裝置,其中該裝置包 含用於基於來自該經編碼之語音信號的一經編碼之訊框 之資訊而獲得與該語音信號分離之一資訊信號的一叢發 之構件,其中該經編碼之訊框包括該第二語音封包。 123360.doc 200830278 該媒體包 24· —種電腦程式產品,其包含一電腦可讀媒體 含: 、” 用於使至少一電腦基於來自一來自_經編碼之語音信 號之第-語音封包的資訊而獲得對—語音㈣之-第- 訊:在㈧一第一頻帶及(Β)一不同於該第—頻帶的第二 頻帶上之一頻譜包絡之一描述之程式碼;
    使至少-電腦基於來自一來自該經編碼之語音信 號之第二語音封包的資訊而獲得對該語 訊框在該卜頻帶上的—頻譜包絡之-描^程式^ 用於使至少一電腦基於來自該第一語音封包之資訊而 心仔對该第二訊框在該第二頻帶上之一頻譜包絡之一描 述的程式碼;及 用於使至少一電腦基於來自該第二語音封包之資訊而 獲得與該第二訊框關於該第一頻帶之一音高分量相關之 資訊的程式碼。 25·如請求項24之電腦程式產品,其中對一語音信號之一第 一訊框之一頻譜包絡的該描述包含分離之第一與第二描 述,其中該第一描述為對該第一訊框在該第一頻帶上之 頻瑨包絡之一描述,且其中該第二描述為對該第一訊 框在該第二頻帶上的一頻譜包絡之一描述。 26·如請求項24之電腦程式產品,其中與該第二訊框關於該 第一頻帶之一音高分量相關之該資訊包括一音高滞後 值。 27·如明求項24之電腦程式產品,其中該媒體包含用於使至 123360.doc 200830278 少一電腦基於與該第二訊框關於該第一頻帶之一音高分 ϊ相關的該資訊而計算該第二訊框關於該第—頻帶之一 激勵信號之程式碼,且 、 其中該媒體包含用於使至少一電腦基於該第二訊框之 :於該第一頻帶之該激勵信號而計算該第二訊框關於該 第二頻帶的一激勵信號之程式碼。 28. 如請求項24之電腦程式產品,其中該媒體包含用於使至 少-電腦基於來自該經編碼之語音信號的—經編碼訊框 之育訊而計算與該語音信號分離之一資訊信號的一叢發 之程式碼,其中該經編碼之訊框包括該第二語音封包。 29. —種語音解碼器,其經組態以基於一經編碼之語音信號 而計异一經解碼之語音信號,該語音解碼器包含·· 控制邏輯,其經組態以產生一包含值之一序列之控制 信號,該序列係基於來自該經編碼之語音信號之語音封 包之編碼索引,該序列之每一值對應於該經解碼的語音 信號之一訊框週期;及 一封包解碼器,其經組態以 (A) 回應於該控制信號之一具有一第一狀態之值而基 於對一相應經解碼之訊框在(1) 一第一頻帶及(2) 一在該 第一頻帶上方延伸的第二頻帶上之一頻譜包絡之一描述 計算該經解碼之訊框,該描述係基於來自一來自該經編 碼的語音信號之語音封包之資訊,且 (B) 回應於該控制信號之一具有一不同於該第一狀態 之弟二狀態之值而基於以下描述計算一相應的經解碼訊 123360.doc 200830278 =⑴該經解碼之訊框在該第—頻帶上之—頻譜包絡之 述射田述係基於來自一來自該經編碼的語音信號 =語音封包之資訊,及⑺對該經解碼的訊框在該第二頻 帶上之-頻譜包絡之H該描㈣基於來自在該經 編碼的語音信號“現於該語音封包之前之至少—語音 封包之資訊。 3〇·如^求項29之語音解碼器,其中對該經解碼之訊框在⑴ 第須T及(2) 一在该第一頻帶上方延伸之第二頻帶上 的二,譜包絡之該描述包含單獨之第一及第二描述,其 中忒第一描述為對該經解碼之訊框在該第一頻帶上的一 /、9 I、、Ό之抗述,且其中該第二描述為對該經解碼之 汛框在該第二頻帶上之一頻譜包絡的一描述。 3 1 ·如明求項29之語音解碼器,其中與該第二訊框關於該第 頻π之一音局分量相關之該資訊包括一音高滯後值。 32·如明求項29之語音解碼器,其中該封包解碼器經組態以 回應於該控制信冑之一具有一第Κ態之值且基於與該 第一訊框關於該第一頻帶的一音高分量相關之該資訊而 计异4第二訊框關於該第一頻帶之一激勵信號,且 "、中4裝置包含用於基於該第二訊框之關於該第一頻 甲之忒激勵信號而計算該第二訊框關於該第二頻帶的一 激勵信號之構件。 33·如明求項16之語音解碼器,其中該裝置包含用於基於來 自该經編碼之語音信號的一經編碼之訊框之資訊而獲得 與孩5吾音信號分離之一資訊信號的一叢發之構件,其中 i23360.doc 200830278 該經編碼之訊框包括該第二語音封包。 34· 一種處理一語音信號之方法,該方法包含: 基於忒^曰f5號之一第一訊框,產生一指示一寬頻編 碼機制之速率選擇信號,· 基於來自一遮 。 皁知水之資訊’產生一模糊化控制信 號,· ° 基於對應於該第一 5凡框之該模糊化控制信號之一壯 恶,使該寬頻編碼機制I 狀 制,·及 4㈣擇無效而選擇-窄頻編碼機 根據該窄頻編碼機制 35.如請求項34之處理―;弟—机框進行編碼。 頻編碼機制對該第一訊框 法’其中該根據該窄 碼為—第—語音封包,且、’瑪包含將該第—訊框編 其中該方法包含產生'經 語音封包及與該語音信號分離之,框’其包括該第- 貝訊信號之—叢發。 I23360.doc 10·
TW96128123A 2006-07-31 2007-07-31 Systems, methods, and apparatus for wideband encoding and decoding of active frames TWI343560B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW96128123A TWI343560B (en) 2006-07-31 2007-07-31 Systems, methods, and apparatus for wideband encoding and decoding of active frames

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US83468306P 2006-07-31 2006-07-31
TW96128123A TWI343560B (en) 2006-07-31 2007-07-31 Systems, methods, and apparatus for wideband encoding and decoding of active frames

Publications (2)

Publication Number Publication Date
TW200830278A true TW200830278A (en) 2008-07-16
TWI343560B TWI343560B (en) 2011-06-11

Family

ID=40925464

Family Applications (1)

Application Number Title Priority Date Filing Date
TW96128123A TWI343560B (en) 2006-07-31 2007-07-31 Systems, methods, and apparatus for wideband encoding and decoding of active frames

Country Status (2)

Country Link
CN (1) CN101496099B (zh)
TW (1) TWI343560B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI751463B (zh) * 2018-12-21 2022-01-01 弗勞恩霍夫爾協會 使用脈衝處理用於產生一頻率增強音訊信號的音訊處理器及方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
BR112013011977A2 (pt) * 2010-12-03 2016-08-30 Ericsson Telefon Ab L M agregação de quadro adaptável de sinal de fonte
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
CN106448688B (zh) * 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI751463B (zh) * 2018-12-21 2022-01-01 弗勞恩霍夫爾協會 使用脈衝處理用於產生一頻率增強音訊信號的音訊處理器及方法
US11776554B2 (en) 2018-12-21 2023-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency enhanced audio signal using pulse processing

Also Published As

Publication number Publication date
CN101496099A (zh) 2009-07-29
TWI343560B (en) 2011-06-11
CN101496099B (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
RU2437171C1 (ru) Системы, способы и устройство для широкополосного кодирования и декодирования активных кадров
ES2406681T3 (es) Codificación de una señal de voz y procesamiento de una señal de voz codificada
US10249313B2 (en) Adaptive bandwidth extension and apparatus for the same
Dietz et al. Overview of the EVS codec architecture
RU2421828C2 (ru) Системы и способы для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом
ES2318820T3 (es) Procedimiento y aparatos de cuantificacion predictiva del habla de voces.
ES2391292T3 (es) Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta
ES2358125T3 (es) Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
US20080249766A1 (en) Scalable Decoder And Expanded Layer Disappearance Hiding Method
TW200830278A (en) Systems, methods, and apparatus for wideband encoding and decoding of active frames
JP2006510063A (ja) サブサンプルされた励起波形コードブック
Sinder et al. Recent speech coding technologies and standards
TWI353752B (en) Systems, methods, and apparatus for wideband encod
Gibson Speech coding for wireless communications
Bao et al. A 8.32 kb/s embedded wideband speech coding candidate for ITU-t EV-VBR standardization.