TWI352972B - Systems, methods, and apparatus for gain factor li - Google Patents

Systems, methods, and apparatus for gain factor li Download PDF

Info

Publication number
TWI352972B
TWI352972B TW96128124A TW96128124A TWI352972B TW I352972 B TWI352972 B TW I352972B TW 96128124 A TW96128124 A TW 96128124A TW 96128124 A TW96128124 A TW 96128124A TW I352972 B TWI352972 B TW I352972B
Authority
TW
Taiwan
Prior art keywords
signal
value
gain factor
index
quantized
Prior art date
Application number
TW96128124A
Other languages
English (en)
Other versions
TW200820219A (en
Inventor
Venkatesh Krishnan
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200820219A publication Critical patent/TW200820219A/zh
Application granted granted Critical
Publication of TWI352972B publication Critical patent/TWI352972B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

九、發明說明: 【發明所屬之技術領域】 本揭示案係關於語音編碼。 【先前技術】 經由公眾交換電話網路(PSTN)之語音通信之頻寬傳統上 限於300-3400 kHz之頻率範圍。用於語音通信之諸如行動 電話及IP語音(網際網路協定,v〇Ip)之新網路可能不具有 相同的頻寬限制,且其可能需要經由此等網路來傳輸及接 收包括一寬頻頻率範圍之語音通信。舉例而言,可能需要 支援延伸低達50 Hz及/或高達7 kHz或8 kHz之聲頻範圍。 亦可能需要支援諸如高品質音訊或音訊/視訊會議之其他 應用,其可具有在傳統PSTN限制以外之範圍内的音訊語 音内容。 一语音編碼器所支援之範圍延伸至更高頻率可改良可懂 度舉例而s,區分諸如“s”及“f”之摩擦音的資訊大多在 同頻率下。高頻延伸亦可改良語音之其他品質,諸如真實 又+例而s ’即使是一有聲元音亦可具有遠遠超出 PSTN限制之頻譜能量。 寬頻°°音編碼方法涉及按比例縮放一窄頻語音編碼技 ' (】 經組態以編碼0-4 kHz之範圍的技術)以覆蓋寬 頻頻4舉例而δ,可以一較高速率對語音信號進行取樣 、 向頻率刀量.,且一窄頻編碼技術可經重組態以使用 多慮皮器係數來表示此寬頻信號。然而,諸如CELP(碼 薄激發線性預測)之窄頻編碼技術在計算上為密集的,且 123346.doc 1352972 一寬頻CELP編碼器可能耗費過多處理循環而對許多行動 及其他嵌入式應用不實用。使用此技術將一寬頻信號之整 個頻譜編碼至—所要品f Ή料致#寬不可接受地大幅 0 此外甚至在此編碼信號之窄頻部分可被傳輸至一 僅支援窄頻編碼之系統中及/或由該系統解碼之前,亦需 要對此編碼信號進行轉換編碼。
了此需要實施寬頻語音編碼,以使得至少編碼信號之窄 頻部分可經由一窄頻通道(諸如psTN通道)發送而無需轉換 編瑪或其他顯著修改。#可能需要寬頻編碼延伸之效率, (例如)以避免顯著減少諸如經由有線及無線通道之無線行 動電話及廣播的應用中可服務之使用者的數目。 寬頻語音編碼之另一方法涉及將語音信號之窄頻及高頻 部分編碼為單獨的子頻帶。在此類型之系統中,可藉由自 已在解碼器處可用之資訊(諸如,窄頻激發信號)導出用於 高頻合成濾波器之激發來實現經增大的效率。可藉由將二
系列增益因數包括在編碼信號中來提高此系統中之品質, 該等增益隨指示原始高頻信號之位準與合成高頻信號之 位準之間的時間變化關係。 【發明内容】 一種根據一組態之語音處理方法包括:基於(a)基於一 語音信號之—第—子頻帶之—第—信號的時間之一部分與 (B)基於一自該語音信號之一第二子頻帶導出之分量的— 第二信號之時間之一相應部分之間的—關係而計算一增益 因數;及根據該增益因數值將一第一索引選擇至量化值之 I23346.doc 1352972 有序集合中。該方法包括:評估該增益因數值與一由該 第一索引所指示之量化值之間的一關係;及根據該評估之 結果來將一第二索引選擇至量化值之該有序集合中。
一種根據另一組態之用於語音處理之裝置包括:一計算 器’其經組態以基於(A)基於一語音信號之一第一子頻帶 之一第一信號的時間之一部分與(B)基於一自該語音信號 之一第二子頻帶導出之分量的一第二信號之時間之一相應 部分之間的一關係而計算一增益因數值;及一量化器,其 經組態以根據該增益因數值將一第一索引選擇至量化值之 -有序集合令。該裝置包括一限制器,該限制器經組態: (A)以評估該增益因數值與一由該第一索引所指示之量化 值之間的一關係,及(B)以根據該評估之結果來將一第二 索引選擇至量化值之該有序集合中。
一種根據另一組態之用於語音處理之裝置包括:用於基 於(A)基於一語音信號之一第一子頻帶之一第一信號的時 間之°卩分與(B)基於一自該語音信號之一第二子頻帶導 出之分ϊ @ 一第二信號之時間之一相應部分之間的一關係 而片算-增益因數值的構件;及用於根據該增益因數值將 -第-索引選擇至量化值之一有序集合中的構件。該裝置 包括用於評估該增益因數值與—由該第—索引所指示之量 化值之間的—關係及用於根據該評估之結果來將一第二索 引選擇至量化值之該有序集合中的構件。 【實施方式】 可聞假影可出現於(例如 )經解碼之信號之子頻帶之中的 123346.doc 1352972 能董分布不準確時。此假影可顯著地使得使用者不愉快且 因此可能降低編碼器之感覺品質。 除非由上下文明確限制,否則術語"計算,,在本文中用於 指示其通常意義中的任一者,諸如計算、產生一列值及自 一列值中進行選擇。在本描述及申請專利範圍中使用術語 匕3時其並不排除其他元件或操作。術語"a基於B"係 用於指示其通常意義中的任一者,包括如下情況:⑴"A等 於B及(η) A基於至少B” ^術語"網際網路協定"包括如在 IETF(網際網路工程工作小組)RFC(意見請求)79丨中所描述 之版本4,及後續版本(諸如,版本6)。 圖1 a展示可經組態以執行本文所描述之方法的寬頻語音 編碼器A100的方塊圖。濾波器組A110經組態以濾波一寬 頻語音信號S1〇以產生一窄頻信號S20及一高頻信號S3〇e 窄頻編碼器A120經組態以編碼窄頻信號S2〇以產生窄頻 (NB)濾波器參數S4〇及一窄頻殘餘信號s5〇。如本文進一步 詳,田拖述,乍頻編碼器A12〇通常經組態以產生作為碼薄索 引或為另一量化形式之窄頻濾波器參數S4〇及編碼窄頻激 紅號S5G。尚頻編碼n A2G()經組態以根據編碼窄頻激發 仏號S50中之資訊而編碼高頻信號s3〇以產生高頻編碼參數 如本文進一步詳細描述,高頻編碼器A2〇〇通常經組 〜、產生作為碼薄索弓I或為另一量化形式之高頻編碼參數 S60寬•頻6吾音編碼器幻⑽之__特定實例經組態而以約 8.55 千位元每秒)之速率來編碼寬頻語音信號Sl0, 其中約7·55心用於窄頻錢ϋ參數S4G及編碼窄頻激發 123346.doc L號S50,且約i kbps用於高頻編碼參數S6〇。 士可能需要將編碼窄頻信號與高頻信號組合為-單-位元 机舉例而吕,彳㊣需要將該等編碼信號一起多工以作為 -編碼寬頻語音信號而進行傳輸(例如,㈣一有線、光 學或無線傳輸通道)或儲存。圖11?展示寬頻語音編碼器 A100之—實施八1〇2的方塊圖,其包括一經組態以將窄頻 濾波益參數S40、編碼窄頻激發信號S5〇及高頻濾波器參數 S60組合為一多工信號S7〇的多工器Ai3〇。 u括編碼器A1 02之裝置亦可包括電路,該電路經組態 以將多工信號S70傳輸至諸如有線、光學或無線通道之傳 輸通道中。此裝置亦可經組態以對信號執行一或多個通道 編碼操作(諸如誤差校正編碼(例如,速率相容卷積編碼)及/ 或誤差偵測編碼(例如,循環冗餘編碼)),及/或一或多層 網路協定編碼(例如,乙太網路、TCp/Ip、cdma2〇〇〇)。 可能需要組態多工器A130以嵌入編碼窄頻信號(包括窄 頻濾波器參數S40及編碼窄頻激發信號S5〇)作為多工信號 S 7 0之可刀子流’以使得編碼窄頻信號可獨立於多工信 號S70之另一部分(諸如高頻及/或低頻信號)而經恢復並解 碼。舉例而言,多工信號S70可經配置,以使得編碼窄頻 k號可藉由去除高頻滤波器參數S60而得以恢復。此特徵 之一潛在優勢在於避免對在將編碼寬頻信號傳遞至一支援 窄頻信號之解碼但不支援高頻部分之解碼的系統之前對其 進行編碼轉換的需要。 圖2a為寬頻語音解碼器B100之方塊圖,其可用於解碼由 123346.doc • 10- 1352972 寬頻語音編碼器A100所編碼之信號。窄頻解碼器Bn〇經 組態以解碼窄頻濾波器參數S4〇及編碼窄頻激發信號S5〇以 產生一窄頻信號S90。高頻解碼器B2〇〇經組態以根據一窄 頻激發信號S80基於編碼窄頻激發信號S5〇來解碼高頻編碼 參數S60,以產生一高頻信號sl〇〇。在此實例中窄頻解 碼器B110經組態以將窄頻激發信號S8〇提供至高頻解碼器 B200。濾波器組則2〇經組態以將窄頻信號S9〇與高頻信號 sioo組合’以產生一寬頻語音信號sn〇。 圖2b為寬頻語音解碼器B100之一實施B102的方塊圖, 其包括一經紕態以自多工信號S7〇產生編碼信號S4〇、S5〇 及S60之解多工器B130。一包括解碼器B102之裝置可包括 電路,該電路經組態以自諸如有線、光學或無線通道之傳 輸通道接收多工仏號S70。此裝置亦可經組態以對信號執 行一或多個通道解碼操作(諸如誤差校正解碼(例如,速率 相容卷積解碼)及/或誤差偵測解碼(例如,循環冗餘解 碼)),及/或一或多層網路協定解碼(例如,乙太網路、 TCP/IP、cdma2000)。 濾波器組A 11 0經組態以根據一頻帶分割機制濾波一輸入 k號,以產生一低頻率子頻帶及一高頻率子頻帶。視特定 應用之設計標準而定,輸出子頻帶可能具有相等或不等頻 寬且可為重疊或非重疊的。產生兩個以上子頻帶之濾波器 組AU0之組態亦為可能的,舉例而言,此濾波器組可經組 態以產生一或多個低頻信號,該等信號包括低於窄頻信號 S20之頻率範圍的頻率範圍(諸如5〇·3〇〇 HZ之範圍)内之分 123346.doc 1352972 莖。此濾波器組亦可能經組態以產生一或多個額外高頻信 號’該等信號包括高於高頻信號S30之頻率範圍的頻率範 圍(諸如14-20 kHz、16-20 kHz或16-32 kHz之範圍)内的分 畺。在此情泥下,寬頻語音編碼器A100可經實施以分別編 碼此或此等信號,且多工器A13〇可經組態以將一或多個額 外編碼信號包括於多工信號S70中(例如,作為一可分部 ' 分)。 ^ 圖3a及圖3b展示兩個不同實施實例中的寬頻語音信號 S10乍頻彳5號S20及!fj頻信號S30的相對頻寬。在此等特 定實例之兩者中,寬頻語音信號sl〇具有16 kHzi取樣率 (表示在0至8 kHz之範圍内的頻率分量),且窄頻信號S2〇具 有8 kHz之取樣率(表示〇至4 kHz之範圍内之頻率分量),但 此等比率及範圍不為本文所描述之原理的限制,可將其應 用於任何其他取樣率及/或頻率範圍β 在圖3a之實例中,在兩個子頻帶之間不存在顯著重疊。 • 可將如在此實例中之高頻信號㈣向下取樣為8 kHz的取樣 率。在圖3b之替代實例中,上子頻帶與下子頻帶具有一明 顯重疊,使得兩個子頻帶信號均描述3 5至4 kHz之區域。 •可將如在此實例中之高頻信號S3〇向下取樣為7 kHz之取樣 率。如在圖3b之實例中提供子頻帶之間的重疊可允許一編 碼系統使用在重疊區域之上具有一平滑滚落的低通及/或 高通濾波器及/或可提高重疊區域中之再生頻率分 質。 口。 在一用於電話通信之典型手機中,轉換器(亦即,麥克 123346.doc 1352972 風及耳機或揚聲Ig)中之—或多者缺乏7_8 kHz之頻率範圍 内之明顯回應。在圖几之實例令,編碼信號中不包括寬頻 語音信號SH)之在7他與8 kHz之間的部分。高通遽波器 130之其他特定實例具有3 5 7 5扭2及3 5 8 的通頻 帶。 ,·爲碼器可經組態以產生感知上類似於原始信號但實際 上顯著不同於原始信號之合成信號。舉例而言自如本文 所述之乍頻殘餘導出高頻激發之編碼器可產生此信號,因 為實際高頻殘餘可完全不存在於解碼信號中。在此等情況 下,在子頻帶之間提供重疊可支援低頻與高頻之平滑摻 合,此摻合可導致較少可聞假影及/或自一頻帶至另一頻 帶之較不顯著的過渡。 漶波器組A110及B 120之低頻及高頻路徑可經組態以具 有除兩個子頻帶之重疊以外完全無關的頻譜。將兩個子頻 帶之重疊界定為自高頻濾波器之頻率回應下降至_20 dB之 點直至低頻濾波器之頻率回應下降至_2〇 dB之點的距離。 在遽波器組A110及/或B120之各種實例中,此重疊在約2〇〇 Hz至約1 kHz的範圍内。約400 Hz至約600 Hz之範圍可表 示編碼效率與感知平滑度之間的所要折衷。在以上提及之 一特定實例中’重疊在500 Hz左右。 可能需要實施濾波器組A11 0及/或B12 0以在若干階段中 計算如圖3a及圖3b中所說明之子頻帶信號。可在v〇s等人 於2006年4月3日申請之題為"SYSTEMS,METHODS,AND APPARATUS FOR SPEECH SIGNAL FILTERING"之代理人 123346.doc 13 1352972 案號050551的美國專利申請案中的圖3a、圖扑、圖牝、圖 4d及圖33至圖39b及隨附本文(包括段落[刪69] [_87聽 找到關於濾波器組All〇&Bl?fw 4*…由 u久B120之特定實施的元件之回應 的額外描述及圖,且為了拇相^月#上 局了扶供關於濾波器組A110及/或 B 12 0之額外揭不的目的,η奸祖拉丄士 ^ J此材枓藉此在允許以引用的方式 併入之美國及任何其他管轄區域中以弓丨用的方式併人。 高頻信號S30可包括可能對於編碼不利之高能量的脈衝 (叢發)。諸如寬頻語音編碼器A1〇〇之語音編碼器可經實 施以包括一叢發抑制器(例如,如在v〇s等人於2〇〇6年4月3 曰申請之題為"SYSTEMS,METHODS,AND APPARATUS FOR HIGHBAND BURST SUPPRESSION"之代理人案號 050549的美國專利申請案中所描述)以在(例如,藉由高頻 編碼器A200)編碼之前濾波高頻信號$3 〇。 通常根據一源-濾波器模型來各自實施窄頻編碼器A丨2〇 及高頻編碼器A200,該源-濾波器模型將輸入信號編碼為 (A)描述一濾波器之一組參數及驅動所描述之濾波器產 生輸入信號之合成再生的激發信號。圖4&展示一語音信號 之頻譜包絡的一實例。表現此頻譜包絡之特徵的峰值表示 聲道之共振丘被稱為共振峰。大多數語音編碼器將至少此 粗略頻譜結構編碼為諸如濾波器係數之一組參數。 圖4b展示如應用於窄頻信號S20之頻譜包絡編碼之基本 源-滤波器配置的一實例分析模組計算表現一對應於 一時間週期(通常20毫秒(msec))之語音之濾波器的特徵之 一組參數。根據彼等濾波器參數而組態之白化濾波器(亦 123346.doc -14- 1352972 稱為分析或預測誤差濾波器)移除頻譜包絡,從而以頻譜 方式平坦化k號。所得白化信號(亦稱為殘餘)具有較少能 量,且因此具有較小變化且比原始語音信號更容易編碼。 由殘餘信號之編碼產生之誤差亦可更均勻地散布於頻譜 上。濾波器參數及殘餘通常經量化以在通道上有效傳輸。 在解碼器處,根據濾波器參數而組態之合成濾波器由一信 號基於殘餘而激發,以產生原始語音之合成版本。合成濾 波器通常經組態以具有一傳遞函數,該傳遞函數為白化濾 波器之傳遞函數的倒數。 圖5展示窄頻編碼器A120之一基本實施A122的方塊圖。 在此實例中,一線性預測編碼(Lpc)分析模組2ι〇將窄頻信 號S20之頻譜包絡編碼為一組線性預測(Lp)係數(例如,全 極濾波器之係數1/A(z))。分析模組通常將輸入信號處理為 一系列非重疊訊框,其中為每一訊框計算一組新係數。訊 框週期一般為預期信號位置固定的週期;一常見實例為2〇 毫秒(等效於8 kHz之取樣率時之16〇個樣本)。在一實例 中,LPC分析模組210經組態以計算一組十個Lp濾波器係 數來表現每一 20毫秒訊框之共振峰結構的特徵。亦可能實 施分析模組以將輸入信號處理為一系列重疊訊框。 分析模組可經組態以直接分析每一訊框之樣本,或該等 樣本可根據開視窗函數(例如,漢明窗)而先加權。亦可在 一大於訊框之視窗(諸如30 msec之視窗)之上執行分析。此 視窗可為對稱的(例如5 — 20-5,使得其在20毫秒訊框之前及 之後立即包括5毫秒)或非對稱的(例如1〇_2〇,使得其包括 123346.doc 15 1352972 别訊框之最後10毫秒)。一 LPC分析模組通常經組態以使用
Levinson-Durbin遞迴或 Leroux-Gueguen演算法來計算 LP濾 波器係數。在另一實施例中,分析模組可經組態以為每一 訊框計算一組倒頻譜係數而並非一組L p濾波器係數。 . 猎由畺化濾波器參數,編碼器A120之輸出速率可顯著降 低,對再生品質具有相對較少效應。線性預測濾波器係數 難以經有效量化且通常映射為量化及/或熵編碼之另一表 φ 不’諸如線頻譜對(LSP)或線頻譜頻率(LSF)。在圖5之實 例中,LP濾波器係數至lsf轉換220將該組LP濾波器係數 轉換為一組相應LSF。LP濾波器係數之其他一對一表示包 括°卩刀自相關係數;對數域比值;導抗頻譜對(ISP);及 導抗頻譜頻率(ISF) ’以上均用於GSM(全球行動通信系 統)AMR-WB(適應性多速率寬頻)編解碼器。通常,一組Lp 濾波器係數與一組相應LSF之間的轉換為可逆的,但組態 亦包括編碼器A120之實施,其中轉換不能無誤差地可逆。 # 篁化器230經組態以量化該組窄頻lsf(或其他係數表 不)’且窄頻編碼器A122經組態以將此量化結果作為窄頻 濾波器參數S40輸出。此量化器通常包括一將輸入向量編 碼為一表或碼薄中之相應向量項之索引的向量量化器。 圖9展示高頻編碼器A200之一實施八2〇2的方塊圖。高頻 編碼器A202之分析模組A210、轉換41〇及量化器42〇可根 據如上文所述之窄頻編碼器A122之相應元件(亦即分^ 為LPC分析模組21〇、轉換22〇及量化器23〇)來實施,但可 能需要為高頻使用較低階LPC分析。甚至可能在不同時間 123346.doc -16- 1352972 使用相同結構(例#,閘陣列)及/或指令集合(例如,多行 程式碼)實施此等低頻及高頻編碼器元件。如下文所描 述,窄魏碼器A120及高頻編碼器A2〇〇之操作關於殘餘 信號之處理而不同。 如圖5中所見,窄頻編碼器幻22亦藉由使窄頻信號s2〇 通過白㈣波11260(亦稱為分析或預測誤差濾波器)而產生 一殘餘信號,1¾白化滤波器26〇根據該組漶波器係數而經 組態。在此特定實例中’白㈣波器260經實施為一FIR遽 波器,但亦可使用IIR實施。此殘餘信號通常將含有語音 訊框之感知上重要資訊(諸如與音高相關之長期結構),其 未表示在乍頻濾波器參數S40中。量化器270經組態以計算 此殘餘信號之量化表示以作為編碼窄頻激發信號s5〇而輸 出。此量化器通常包括一將輸入向量編碼為一表或碼薄中 之相應向量項之索引的向量量化器。或者,此量化器可經 組態以發送一或多個參數,向量可在解碼器處自該或該等 參數動態產生,而並非如稀疏碼薄方法中自儲存器擷取。 此方法用於諸如代數CELP(碼薄激發線性預測)之編碼機制 中及諸如3GPP2(第三代合作夥伴計劃2)EVRC(增強型可變 速率編解碼器)之編解碼器中。 需要窄頻編碼器A120根據將可用於相應窄頻解碼器之相 同濾波器參數值而產生編碼窄頻激發信號。以此方式,所 得編碼窄頻激發信號可已在某種程度上解決彼等參數值之 非理想性,諸如量化誤差。因此,需要使用將可用於解碼 器處之相同係數值來組態白化濾波器。在如圖5所示之編 123346.doc -17- 1352972 碼器A122之基本實例中,逆量化器240去量化窄頻編嫣參 數S40 ’ LSF至LP濾波器係數轉換250將所得值映射回一組 相應LP遽波器係數’且此組係數用於組態白化濾波器26〇 以產生由量化器270量化之殘餘信號。 窄頻編碼器A120之某些實施經組態以藉由識別與殘餘信 號隶佳匹配之一組碼薄向量中之一者來計算編碼窄頻激發 杬號S50。然而’注意到,窄頻編碼器a12〇亦可經實施以 计算殘餘信號之量化表示,而實際上並不產生殘餘信號。 舉例而言,窄頻編碼器A12〇可經組態以使用多個碼薄向量 來產生相應合成信號(例如,根據一組當前濾波器參數), 且選擇與在感知加權域中與原始窄頻信號S2〇最佳匹配之 產生彳5號相關聯的碼薄向量。 即使在白化濾波器已自窄頻信號S2〇移除粗略頻譜包絡 之後,仍可保留一相當量之精密諧波結構(尤其對於有聲 δ吾音而s)。圖7a展示諸如元音之有聲信號的殘餘信號(如 可由白化濾波器產生)之一實例的頻譜曲線。此實例中可 見之週期性結構與音高相關,且由同一說話者所說之不同 有聲聲音可具有不同共振峰結構但具有類似音高結構。圖 7b展示此殘餘信號之—實例的時域曲線,其按時間展示一 音尚脈衝序列。 窄頻編碼器A12G可包括經組態以編碼窄頻信號s2〇之長 期諧波結構的一或多個模組。如圖8所示,一可使用之典 型CELP範例包括—開路Lpc分析模組,其編碼短期特徵^ 粗略頻譜包絡,之後為一閉路長期預測分析階 123346.doc 語音模式。 窄頻編碼器A122與窄頻解碼器B112之系統為一分析合 成語音編解碼器之一基本實例。碼薄激發線性預測(CELP) 編碼為一族風行的分析合成編碼,且此等編碼器之實施可 執行殘餘之波形編碼,包括諸如自固定及適應性碼薄中選 擇項、誤差最小化操作及/或感知加權操作之操作。分析 合成編碼之其他實施包括混合激發線性預測(MELP)、代 數CELP(ACELP)、鬆弛CELP(RCELP)、規貝丨J脈衝激發 (RPE)、多脈衝CELP(MPE)及向量和激發線性預測(VSELP) 編碼。相關編碼方法包括多頻帶激發(MBE)及原型波形内 插(PWI)編碼。標準化分析合成語音編解碼器之實例包 括:ETSI(歐洲電信標準學會)-GSM全速率編解碼器(GSM 06.10),其使用殘餘激發線性預測(RELP) ; GSM增強型全 速率編解碼器(ETSI-GSM 06.60) ; ITU(國際電信聯合會)標 準11.8 1^/8〇.729附錄£編碼器;用於18-136(劃時多向近接 機制)之IS(臨時標準)-641編解碼器;GSM適應性多速率 (GSM-AMR)編解碼器;及4GVTM(第四代聲碼STM)編解碼 器(QUALCOMM Incorporated,San Diego, CA)。窄頻編碼 器A120及相應解碼器B110可根據此等技術中之任一者、 或將語音信號表示為(A)描述一濾波器之一組參數及(B)用 以驅動所述濾波器以再生語音信號之激發信號的任何其他 語音編碼技術(無論已知的還是待研發的)而實施。 高頻編碼器A200經組態以根據一源-濾波器模型編碼高 頻信號S30。舉例而言,高頻編碼器A200通常經組態以執 123346.doc -20- 1352972 行高頻信號S30之LPC分析以獲取描述信號之頻譜包絡的 一組渡波器參數。如在窄頻方面,用於激發此濾波器之源 ^號可由LPC分析之殘餘導出或另外基於Lpc分析之殘 餘。然而,高頻信號S3〇通常感知上不如窄頻信號S2〇顯 著’且對於編碼語音信號包括兩個激發信號可能為高代價 的。為了減小傳遞編碼寬頻語音信號所需之位元率,對於 问頻可能需要使用一模型化激發信號。舉例而言,用於高 φ 頻濾波器之激發可基於編碼窄頻激發信號S50。 圖9展示高頻編碼器A2〇〇之一實施A2〇2的方塊圖,其經 組態以產生一連串高頻編碼參數S6(),包括高頻濾波器參 數S60a及高頻增益因數86〇1)。高頻激發產生器A3〇〇自編碼 乍頻激發信號S50導出一高頻激發信號sl2〇。分析模組 A210產生表現高頻信號S3〇之頻譜包絡之特徵的一組參數 值。在此特定實例中,分析模組A210經組態以執行Lpe分 析來產生尚頻佗號S3〇之每一訊框的一組Lp濾波器係數。 • 線性預測濾波器係數至LSF轉換410將該組LP濾波器係數 轉換為一組相應LSF。如上文參考分析模組21〇及轉換22〇 所提,分析模組A2 10及/或轉換41〇可經組態以使用其他係 數組(例如,倒頻譜係數)及/或係數表示(例如,isp)〇 一量化器420經組態以量化該組高頻LSF(或其他係數表 丁諸如ISP),且向頻編碼器八202經組態以輸出此量化結 果7為高頻濾波器參數S60a。此量化器通常包括一將輸入 向量編碼為一表或瑪薄中之相應向量項之索引的向量量化 I23346.doc 1352972 高頻編碼器A202亦包括一合成濾波器A220,該合成濾 波器A220經組態以根據高頻激發信號sl2〇及由分析模組 A210產生之編碼頻譜包絡(例如,該組lP濾波器係數)而產 生一合成高頻信號S130。合成濾波器A220通常經實施為一 IIR濾波器,但亦可使用FIR實施。在一特定實例中,合成 渡波器A220經實施為六階線性自我迴歸濾波器。 在寬頻語音編碼器A1 00之根據如圖8所示之一範例的實 鲁 施中’尚頻編碼器A200可經組態以接收如由短期分析或白 化據波器產生之窄頻激發信號。換言之,窄頻編碼器A12〇 可經組態以在編碼長期結構之前將窄頻激發信號輸出至高 頻編碼器A200。然而,需要高頻編碼器a20〇自窄頻通道 接收將由高頻解碼器B200接收之相同編碼資訊,以使得由 尚頻編碼器A200產生之編碼參數可已在某種程度上解決彼 資訊之非理想性。因此,可較佳使高頻編碼器A2〇〇自待由 寬頻語音編碼器A100輸出之相同經參數化及/或經量化之 # 編碼乍頻激發信號S50重建窄頻激發信號S80。此方法之一 潛在優勢在於更準確地計算高頻增益因數s6〇b(下文描 述)。 高頻增益因數計算器A230計算原始高頻信號S30之位準 與合成高頻信號S130之位準之間的一或多個差值來指定訊 框之增益包絡。量化器430(其可實施為一將輸入向量編碼 :表或碼薄中之相應向量項之索弓丨的向量量化器)量化指 増益包絡之一1或多個信,g古 且円頻編瑪器A202經組態以輸 出此量化結果作為高頻增益因數S6〇b。 123346.doc -22- 1352972 本文所述之元件之量化器中的一或多者(例如,量化器 230、420或430)可經組態以執行分類向量量化β舉例而 言,此量化器可經組態以基於已在窄頻通道及/或高頻通 道中之同一訊框内經編碼之資訊而選擇一組碼薄中之一 者。此技術通常以額外碼薄儲存為代價來增加編碼效率。 在如圓9中所展示之高頻編碼器Α200之一實施中,合成 濾波器Α220經配置以自分析模組Α21〇接收濾波器係數。 咼頻編碼器Α202之一替代性實施包括經組態以解碼來自高 頻濾波器參數S60a之濾波器係數的逆量化器及逆轉換,且 在此情況下,替代地,合成濾波器A220經配置以接收經解 碼之濾波器係數。此替代牲配置可支援高頻增益計算器 A23 0對增益包絡進行更準確之計算。 在一特定實例中’分析模組A210及高頻增益計算器 A230分別輸出每訊框一組六個lsf與一組五個增益值,以 使得僅以每訊框十一個額外值即可達成窄頻信號S2〇之寬 頻延伸》在另一實例中,為每一訊框添加另一增益值以僅 以每訊框十二個額外值提供寬頻延伸。耳朵傾向於對高頻 率之頻率誤差較不敏感’使得較低LPC階處之高頻編碼可 產生一具有一可與較高LPC階處之窄頻編碼相比的感知品 質的k號β高頻編碼器A200之一典型實施可經組態以輸出 每訊框8至12位元用於頻譜包絡之高品質重建,且輸出每 訊框另外8至12位元用於臨時包絡之高品質重建。在另一 特定實例中’分析模組Α210輸出每訊框一組八個lSF。 向頻編碼器Α200之某些實施經組態以藉由產生一具有高 123346.doc -23· 頻頻率分量之隨機雜訊信號並根據窄頻信號S20、窄頻激 發信號S80或高頻信號S30之時域包絡來振幅調變該雜訊信 號而產生高頻激發信號S120。在此情況下,可能需要雜訊 產生器之狀態為編碼語音信號中之其他資訊(例如,同一 訊框中之資訊,諸如窄頻濾波器參數S40或其一部分,及/ 或編碼窄頻激發信號S50或其一部分)的確定性函數,使得 編碼器及解碼器之高頻激發產生器中之相應雜訊產生器可 具有相同狀態。雖然基於雜訊之方法可對於無聲聲音產生 適當結果,然而,對於有聲聲音而言可能不為理想的,其 殘餘通常為諧波的且因此具有某週期結構。 高頻激發產生器A300經組態以獲取窄頻激發信號S80(例 如,藉由去量化編碼窄頻激發信號S50)及基於窄頻激發信 號S80產生高頻激發信號S120。舉例而言,高頻激發產生 器A300可經實施以使用窄頻激發信號S80之非線性處理來 執行一或多種技術,諸如諧波頻寬延伸、頻譜摺疊、頻譜 平移,及/或諧波合成。在一特定實例中,高頻激發產生 器A3 00經組態以藉由與延伸之信號與調變雜訊信號之適應 性混合相結合的窄頻激發信號S80之非線性頻寬延伸來產 生高頻激發信號S 120。高頻激發產生器A300亦可經組態以 執行延伸及/或混合信號的抗稀疏(anti-sparseness)濾波。 可在於2006年4月3日申請之題為"SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND EXCITATION GENERATION" 的美國專利申請案第11/397,870號(Vos等人)中,在圖11至 圖20及隨附本文(包括段落[000 112]至[000146]及[000156]) 123346.doc •24- 處找到關於高頻激發產生器A300及高頻激發信號812〇之產 生的額外描述及圖’且為了提供關於高頻激發產生器A3〇〇 及/或關於由用於另一子頻帶之編碼激發信號產生用於一 個子頻帶的激發信號的額外揭示之目的,此材料藉此在允 許以引用的方式併入之美國及任何其他管轄區域中以引用 的方式併入。 圖10展示編碼一具有一窄頻部分及一高頻部分之語音信 號的該高頻部分之方法M10的流程圖。任務XI00計算表現 高頻部分之頻譜包絡之特徵的一組濾波器參數。任務χ2〇〇 藉由將一非線性函數應用於一自窄頻部分導出之信號來計 算一頻譜延伸信號。任務χ300根據(Α)該組濾波器參數及 (Β)—基於頻譜延伸信號之高頻激發信號來產生一合成高 頻信號。任務Χ400基於(〇高頻部分之能量與(D)自窄頻部 分導出之信號之能量之間的關係來計算一增益包絡。 通常將需要一經解碼之信號之臨時特徵來使其表示之原 始h號的彼等類似。此外,對於分別編碼不同子頻帶之系 統而5,可能需要經解碼之信號中之相對臨時特徵來使得 原始k號中的彼等子頻帶之相對臨時特徵類似。對於編碼 ”。a彳5號之準確再生而言,可能需要合成寬頻語音信號 S 100之间頻部分與窄頻部分的位準之間的比類似於原始寬 頻浯曰k號s 1 〇中之比。高頻編碼器A2〇〇可經組態以包括 編碼語音信號中之描述或另外基於原始高頻信號之臨時包 絡的貝訊。對於向頻激發信號係基於來自另一子頻帶之資 訊的凊况(諸如,編碼窄頻激發信號S50),詳言之,可能 123346.doc 1352972 需要編碼參數包括描述合成高頻信號與原始高頻信號之臨 時包絡之間的差值的資訊。 除了關於尚頻信號S30之頻譜包絡之資訊(亦即,如由 LPC係數或類似參數值所描述)之外,可能需要一寬頻信號 之編碼參數包括高頻信號S30之臨時資訊。除了如由高頻 編碼參數S60a表示之頻譜包絡以外,例如,高頻編碼器 A200可經組態以藉由指定一臨時或增益包絡來表現高頻信 鲁 號S30之特徵。如圖9所示,高頻編碼器A202包括一高頻增 益因數計箅器A230 ’該高頻增益因數計算器A23〇經組態 並配置以根據高頻信號S30與合成高頻信號S13〇之間的關 係(諸如在一訊框或其某部分上兩個信號之能量之間的差 值或比)來計算一或多個增益因數。在高頻編碼器A2〇2之 其他實施中’咼頻增益計算器A230可經同樣組態但經配置 以根據高頻信號S30與窄頻激發信號S80或高頻激發信號 S120之間的比時間變化關係來計算增益包絡。 φ 窄頻激發信號S8〇與高頻信號S30之臨時包絡很可能為類 似的。因此’一基於高頻信號S30與窄頻激發信號88〇(或 自其導出之信號,諸如高頻激發信號sl2〇或合成高頻信號 S 130)之間的關係之增益包絡一般將比一僅基於高頻信號 S 3 0之增益包絡更適於編碼。 向頻編碼器A202包括一經組態以為高頻信號S30之每一 訊框計算一或多個增益因數的高頻增益因數計算器A230, 其中每一增益因數係基於合成高頻信號S130與高頻信號 S30之相應部分的臨時包絡之間的關係。舉例而言,高頻 123346.doc •26- 1^52972 增益因數計算器A230可經組態以計算每一增益因數作為信 號之振幅包絡之間的比或作為信號之能量包絡之間的比。 在典型實細*中,咼頻編碼器A202經組態以輸出為每一訊 框指定五個增益因數(例如,一個用於五個連續子訊框中 之每一者)的八至十二個位元之量化索引。在另一實施 中,高頻編碼器A202經組態以輸出為每一訊框指定一訊框 位準增益因數之額外量化索引。 可將一增益因數計算為一標準化因數,諸如原始信號之 倉b里的置測與合成彳s號之能量的量測之間的比r。可將該 比R表達為一線性值或為一對數值(例如,以一分貝尺 度高頻增益因數計算器A230可經組態以為每一訊框計 算此標準化因數。其他或另外,高頻增益因數計算器A23〇 可經組態以為每一訊框之多個子訊框中之每一者計算一系 列增益因數。在一實例中,高頻增益因數計算器A23〇經組 態以將每一訊框(及/或子訊框)之能量計算為平方的和之平 方根。 高頻增益因數計算器A 2 3 0可經組態以將增益因數計算執 行為一包括一或多個系列之子任務的任務。圖丨丨展示此任 務之一實例T200的流程圖’其根據高頻信號S3〇及合成高 頻信號S13 0之相應部分之相對能量來計算編碼高頻信號之 相應部分(例如,一訊框或子訊框)的增益值。任務22以及 220b計算各別信號之相應部分之能量。舉例而言,任務 220a及220b可經組態以將該能量計算為各別部分之樣本之 平方的和。任務丁23〇將一增益因數計算為彼等能量之比之 123346.doc •27· 1352972 平方根。在此實例中,任務T230將部分之增益因數計算為 該部分上之高頻信號S30的能量與該部分上之合成高頻信 號S130的能量之比的平方根。 可能需要高頻增益因數計算器A230經組態以根據一開視 窗函數來計算能量。圖12展示增益因數計算任務Τ2〇〇之此 實施T2 10之流程圖《任務T215a將一開視窗函數應用於高 頻信號S30 ’且任務T2 15b將同一開視窗函數應用於合成高 頻信號S130。任務220a及220b之實施222a及222b計算各別 視窗之能量,且任務T230將部分之增益因數計算為能量比 之平方根。 在為一訊框計算一增益因數的過程中,可能需要應用一 覆蓋相鄰訊框之開視窗函數。在為一子訊框計算一增益因 數的過程中,可能需要應用一覆蓋相鄰子訊框之開視窗函 數。舉例而言,一產生可以_ 覆蓋相加方式應用之增益因 數的開視®函數可幫助減小或避免子訊框之間的不連續 性》在一實例中,高頻增益因數計算器八23〇經組態以應用 ’其中視窗覆蓋兩個相鄰
不同子訊框,及/或一 訊框亦可能包括具有不同長度之子 如圖13a所示之梯形開視窗函數 子訊框中之每一者達一毫秒。β 應用於一20亳秒訊雅之τ;伽 123346.doc •28- 1352972 訊框。在一特定實施中,高頻增益因數計算器A23〇經組態 以使用如圖13a及圖13b中所展示之梯形開視窗函數計算子 訊框増益因數且亦經組態以在不使用一開視窗函數的情況 下計算一訊框位準增益因數。 在無限制的情況下,下列值呈現為特定實施之實例。假 設此等情況下使用一 20毫秒訊框,但可使用任何其他持續 時間。對於以7 kHz取樣之高頻信號而言,每一訊框具有 140個樣本。若將此訊框分成具有相等長度之五個子訊 框’則每一子訊框將具有28個樣本’且如圖i3a中所示之 視窗將為42個樣本寬。對於以8 kHz取樣之高頻信號而 言,每一訊框具有160個樣本。若將此訊框分成具有相等 長度之五個子訊框’則每一子訊框將具有32個樣本,且如 圖13a所不之視囪將為48個樣本寬。在其他實施中,可使 用具有任何寬度之子訊框,且高頻增益計算器A230之一實 施甚至可能經組態以為一訊框之每一樣本產生一不同增益 因數。 如上所述,高頻編碼器A202可包括一高頻增益因數計算 器A23 0 ’該高頻增益因數計算器A230經組態以根據高頻 信號S30與一基於窄頻信號S20之信號(諸如窄頻激發信號 S80、高頻激發信號S120或合成高頻信號S130)之間的時間 變化關係來計算一系列增益因數。圖14a展示高頻增益因 數計算器A230之一實施A232之方塊圖。高頻增益因數計 算器A232包括.包絡計算器G10之一實施G10a,其經配置 以計算一第一信號之一包絡;及包絡計算器G10之一實施 123346.doc -29- 1352972 G1 Ob’其經g己置以計算—第二信號之—包絡。包絡計算器 Gl〇a及GlOb可為等同的或可為包絡計算器G1〇之不同實施 的實例。在某些情況下,可將包絡計算器⑴⑹及⑺仳實 施為經組態以在不同時間處理不同信號的相同結構(例 如,閘陣列)及/或指令集合(例如,多行程式碼)。 包絡計算器Gl〇a及G10b可各經組態以計算—振幅包絡 (例如,根據一絕對值函數)或一能量包絡(例如,根據一平 方函數)。通常,每一包絡計算器G1〇a、G1〇b經組態以計 算相對於輸入信號而子取樣之包絡(例如,對於輸入信號 之每一訊框或子訊框具有一值之包絡)β如以上參看(例如) 圖11至圖nb所述,包絡計算器GlOa及/或GlOb可經組態以 根據一開視窗函數(其可經配置以覆蓋相鄰訊框及/或子訊 框)來計算包絡。 因數計算器G20經組態以根據隨時間之兩個包絡之間的 時間變化關係來計算一系列增益因數。在上文所述之一實 例中,因數計算器G20將每一增益因數計算為一相應子訊 框上之包絡之比的平方根。或者,因數計算器G2〇可經組 態以基於包絡之間的一距離(諸如在相應子訊框期間包絡 之間的差值或有正負號之平方差值)來計算每一增益因 數。可能需要組態因數計算器G20,從而以分貝或其他以 對數方式按比例縮放形式來輸出增益因數之計算值。舉例 而3,因數計算器G20可經組態以將兩個能量值之比之對 數計算為能量值的對數的差值。 圖14b展示一包括高頻增益因數計算器A232之一般化配 123346.doc -30- 1352972 置的方塊圖其中包絡計算器G1 Oa經配置以基於窄頻信號 S20叶算一仏號之包絡,包絡計算器G丨仙經配置以計算高 頻6號S30之&絡,且因數計算器⑽經組態以輸出高頻增 益因數S60b(例如,至量化器43〇)。在此實例中,包絡計 算器GlOa經配置以計算自中間處理ρι所接收之信號的包 絡,其可包括如本文所述之經組態以執行窄頻激發信號 S80之計算、高頻激發信號sl2〇之產生,及/或高頻信號 S 130之合成的結構及/或指令。為方便起見,假設包絡計 算器GlOa經配置以計算合成高頻信號sl3〇之包絡,但包絡 計算器GlOa經配置以計算窄頻激發信號S8〇或高頻激發信 號S120之包絡的實施被明確地涵蓋並藉此被揭示。 如上所述,可能需要以兩個或兩個以上不同時間解析度 獲取增益因數。舉例而言,可能需要高頻增益因數計算器 A230經組態以為待編碼之高頻信號S3〇之每一訊框計算訊 框位準增益因數及一系列子訊框增益因數兩者。圖15展示 高頻增益因數計算器A232之一實施A234之方塊圖,其包 括包絡计算器G10之實施GlOaf、GlOas,實施GlOaf、 GlOas經組態以分別計算一第一信號(例如,合成高頻信號 S 1 30 ’雖然包絡計算器g 1 Oaf、G1 Oas經配置以計算窄頻激 發信號S80或高頻激發信號si 20之包絡的實施被明確地涵 蓋並藉此被揭示)之訊框位準包絡及子訊框位準包絡。高 頻增益因數計舁器八234亦包括包絡計算器G1〇b之實施 GlObf、GlObs,實施GlObf、GlObs經組態以分別計算一 第二信號(例如,高頻信號S30)之訊框位準包絡及子訊框 123346.doc -31 - 1352972 位準包絡》 包絡計算器G1 Oaf及GlObf可為等同的或可為包絡計算器 G10之不同實施的實例。在某些情況下,可將包絡計算写 G1 Oaf及G1 Obf實施為經組態以在不同時間處理不同信號的 相同結構(例如,閘陣列)及/或指令集合(例如,多行程式 碼)。同樣,包絡計算器GlOas及GlObs可為等同的,可為 包絡计鼻eG10之不同實施的實例,或可被實施為相同会士 構及/或指令集合。甚至可能在不同時間將所有四個包絡 產生器GlOaf、GlOas、GlObf及GlObs實施為相同可組態結 構及/或指令集合。 如本文所描述之因數計算器G20之實施G20f、G2〇s經配 置以基於各別包絡計算訊框位準增益因數S60bf&子訊框 位準增益因數S60bs。可被實施為乘法器或除法器以適合 特定設計之正規器N10經配置以根據相應訊框位準增益因 數S60bf(例如’在量化子訊框增益因數之前)正規化每一組 子訊框增益因數S6 Ob s。在某些情況下,可能需要藉由量 化訊框位準增益因數S60bf及接著使用相應去量化值來正 規化子訊框增益因數S60bs來獲取可能更精確的結果。 圖16展示高頻增益因數計算器A232之另一實施A236之 方塊圖。在此實施中,如圖15中所展示之各種包絡及增益 計算器經重新配置,使得在計算包絡之前對第一信號執行 正規化。可將正規器N20實施為乘法器或除法器以適合特 定設計。在某些情況下,可能需要藉由量化訊框位準增益 因數S60bf及接著使用相應去量化值來正規化第一信號來 I23346.doc -32· 1352972 獲取可能更精確的結果。
量化器430可根據任何已知技術來實施或被開發以執行 被認為適用於特定設計之純量及/或向量量化之一或多個 方法。量化器430可經組態以自子訊框增益因數分別量化 訊框位準增益因數。在一實例中,使用四位元查找表量化 器量化每一訊框位準增益因數S6〇bf,且使用四個位元向 量量化每一訊框之該組子訊框增益因數S60bs。此機制用 於有聲語音訊框之E VRC-WR編碼器中(如在3 GPP2文件 ◦ 80014-(:版本0.;2之節4.18.4中所提,在评评1¥.38口?2.〇|^可 得)。在另一實例中,使用七位元純量量化器來量化每一 訊框位準增益因數S60bf,且使用每級具有四個位元之多 級向量量化器來向量量化每一訊框之該組子訊框增益因數 S60bs。此機制用於無聲語音訊框之EVRC-WB編碼器中(如 在上文所引用之3GPP2文件C.S0014_C版本〇2之節4 184中
所提在其他機制中,亦可能將每一訊框位準增益因數 與用於彼訊框之子訊框增益因數一起量化。 量化器通常經組態以將一輸入值映射至一組離散輸出值 中之一者。一有限數目之輸出值可用,使得一範圍之輸入 值破映射至一單一輸出纟。量化增加了編碼效率,此係因 為指示相應輸出值之索引可以少於原始輸人值之位元而被 傳輸。圖17展示可由-純量量化器執行之'維映射的一實 例,其中(2I1D-1V2與(2nD+1)/2之間&輸入值被映射至輸 出值nD(對於整數n)。 ,通常使 亦可將量化器實施為一 向量量化器。舉例而言 123346.doc -33 - 1352972 一向量量化器來量化每一 用 訊框之該組子訊框增益因數 圖1 8展示由— 在此實例中, 向i里化器執行之多維映射之—簡單實例。 輸入空間被分成多個ν〇Γ〇η〇ί區域(例如,根 據敢鄰近準則)。量化將每一輸入值映射至表示相應 V_n〇i區域(通常為質心)(此處展示為一點)之值。在此實 例中,輸人空間分成六個區$,以使得任何輸人值可由僅 具有六個不同狀態之索引來表示。
圖19a展示如可由一純量量化器執行之一維映射之另一 貝例在此實例中,將自某初始值a(例如,〇 dB)延伸至某 終點值b(例如’ 6 dB)之輸入空間劃分為n個區域。订個區域 中之每一者中之值由η個量化值中的相應值表 不。在-典型應用中’該組η個量化值可用於編碼器及解 碼器使%·3:化索引(〇至n])之傳輸足以將量化值自編碼 器轉移至解碼器。舉例而言,可將該組量化值健存於每一 設備内的有序清單、表或碼薄中。 儘官圖19a展示劃分為η個有相等大小的區域的輸入空 間’但可能*需要使用不同大小之區域來劃分輸入空間。可 藉由根據輸入資料之期望分布來分配量化值來獲取更精確 的平均結果係可能的。舉例而言,可能需要獲取輸入空間 之期望被更頻繁觀測之區域中的較高解析度(亦即,較小 里化區域),及其他區域之較低解析度。圖19b展示此映射 之一實例。在另一實例中,量化區域之大小隨振幅自汪增 長至Μ例如,以對數方式)而增加。不同大小之量化區域亦 可用於向量量化中(例如,如圖18中所展示)。在量化訊框 i23346.doc -34- 位準增益因數S6Gbf的過程中,量化器43Q可經組態以按需 要應用一均勻或不的6 a^s6〇b ^ 〇 :勻的映射。同樣,在量化子訊框增益 s、k程中,量化器430可經組態以按需要應用一 奴勻或不句勻的映射。量化器430可經實施以包括用於因 S^Obf及S6Gbs之獨立量化器及/或可經實施以使用相同可 ”且I、、”。構及/或指令集合來在不同時間量化不同串之增益 因數。 如上文所述’高頻增益因數議編碼原始高頻信號S3〇 ,包絡與基於窄頻激發信號_之信號(例如,合成高頻信 號S130)的包絡之間的時間變化關係。此關係可在解碼器 處經重建’使得經解碼之窄頻及高頻信號之相對位準近似 原始寬頻,吾音信號Sl〇的窄頻及高頻分量之相對位準。 在經解碼之語音信號之各種子頻帶的相對位準不準確 的情況下可出現可聞假影。舉例而言,#經解碼之高奸 戒相對於相應解Μ頻信號具有比原始語音信號中更高的 :準⑽如’更高能量)時,顯著假影可出現。可聞假影可 :有知使用者之體驗且降低編碼器之感覺品質。為了獲取 ?知良好之結|,可能需要子頻帶編碼器(例如 :器在將能量配置給合成信號的過程中為守怪的; 之可能需要使用一守恆量化方法來編碼合成信號 之増益因數值。 由位準不平衡所引起之假影可能尤其不能適宜用於對放 之子頻帶的激發係自另一子頻帶導出的情形。此假影可 生於(例如)一高頻增益因數86扑被量化成大於其原始值 123346.doc -35· 1352972 的值時。圖19e說明-增益因數值R之經量化之值大於原始 ,的-實例。該經量化之值在本文中表示為q[iR],其中^ 才曰不與值R相關聯之量化索引且q[.]指示獲取由給定索引所 識別之量化值的運算。 圖2〇a展示根據一一般實施之增益因數限制之方法MHO 的流程圖。任務TQ10為一子頻帶信號之—部分(例如,一 訊框或子訊框)之增益因數計算一值R。舉例而言,任務 TQ10可經組態以將該值R計算為原始子頻帶訊框之能量與 合成子頻帶訊框之能量的比。或者,增益因數值R可為I 比之一對數(例如,以10為底)。任務TQ1〇可由如上文所描 述之高頻增益因數計算器A230之一實施來執行。 任務T Q 2 0量化增益因數值R。此量化可由純量量化(例 如,如本文所描述)之任何方法或被認為適用於特定編碼 器设§十之任何其他方法(諸如,向量量化方法)來執行。在 一典型應用中,任務TQ20經組態以識別對應於輸入值尺之 1化索引1r。舉例而言,任務TQ20可經組態以藉由根據所 要搜尋策略(例如,最小誤差演算法)將R之值與一量化清 單、表或碼簿中之項進行比較來選擇索引。在此實例中, 假設量化表或清單係以搜尋策略之下降次序(亦即,使得 q[i-l]Sq[i])配置的。 任務TQ30評估量化增益值與原始值之間的關係。在此 實例中’任務TQ 3 0將量化增益值與原始值進行比較β若 任務TQ30發現R之量化值不大於r之輸入值,則方法Μ1〇〇 結束。然而’若任務TQ30發現R之量化值超過r之輸入 123346.doc -36 - 1352972 值,則任務TQ50執行為R選擇一不同的量化索引。舉例而 言,任務TQ50可經組態以選擇一指示小於q[iR]i量化值 的索引。 在一典型實施中,任務TQ50選擇量化清單、表或碼簿 中之下一最低值。圖20b展示包括任務TQ50之此實施TQ52 的方法M100之一實施M110的流程圖,其中任務TQ52經組 態以遞減量化索引。 在某些情況下’可能需要允許R之量化值超過R之值某 一標稱量。舉例而言,可能需要允許R之量化值超過尺之 值期望對感知品質具有可接受的低效應的某一量或比例。 圖20c展示用於方法M100之此實施M120的流程圖。方法 M120包括將R之量化值與大於r之上限進行比較的任務
TQ30之一實施TQ32。在此實例中,任務tq32將q[iR^ R 與臨限值几之乘積進行比較,其中乃具有大於但接近一 (例如,1·1或1.2)的值。若任務tq32發現量化值小於(或 者,不大於)乘積,則任務TQ50之實施執行。任務TQ3〇之 其他實施可經組態以判定R之值與R的量化值之間的差值 是否符合及/或超過一臨限值。 在某些情況下’與原始量化值相比,為R選擇一較低量 化值將引起經解碼之信號之間的較大差異為可能的。舉例 而。,此情形可發生於q[iR-l]遠小於R之值時。方法M1〇〇 之其他實施包括任務TQ50之執行或組態係視候選量化值 (例如’ q[iR-l])之測試而定的方法。 圖20d展示方&M100之此實施M13〇的流程圖。方法 123346.doc -37· 1352972 所產生之子訊框增益因數S60bs及經由限制器u〇輸出訊框 位準增益因數S60bf。 圖23a展示限制器L1〇之一實施Lu之運算圖。限制器 L12將R之預量化值與後量化值進行比較以判定仙]是否大 於^若此表達為真,則限制器L12藉由將索引&之值遞減 -來選擇另一量化索引以產生R之新量化值。否則,不改 變索引iR的值。
圖23b展示限制器L1〇之另一實施L14之運算圖。在此實 例中,將量化值與R之值與臨限值Τι之乘積進行比較其 中T〗具有大於但接近一(例如,】丨或丨2)的值。若“Μ大 於(或者,不小於)TlR,則限制器U4遞減索引^之值。 ▲圖23c展示限制器L1〇之另一實施Li6之運算圖,其經組 態以判定提議替代當前量化值的量化值是否足夠接近尺之 原始值。舉例而言’限制器L16可經組態以執行—額外比 較:判定下一最低索引量化值(例如,q[iR_l])是否在距尺之 預里化值的指定距離内’或在R之預量化值之指定比例 内在此特疋實例中,將候選量化值與R之值與臨限值凡 之乘積進行比較,纟中1具有小於但接近-(例如,〇>8或 0·9)的值。若q[iR·〗]小於(或者,不大於)TzR,則比較失 敗。若對啊及仙」]執行之比較中之任一者失敗 改變索引\之值。 增益因數之中的變化可能產生經解碼之信號的假影,且 可月匕需要組態高頻編碼器A2〇〇來執行增益因數平滑之方法 (例如’藉由應用諸如—次子取樣nR濾波器之平滑遽波 J23346.doc -39· 器)。可將此平滑應用於訊框位準增益因數S60bf及/或應用 於子訊框增益因數S60bs。在此情況下,如本文所描述之 限制器L10及/或Ml 00之一實施可經配置以將量化值iR與R 之預平滑值進行比較。可在於2006年4月21申請之題為 "SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR SMOOTHING"的美國專利申請案第11/408,390號 (Vos等人)中的圖48至圖55b及隨附本文(包括段落[000254] 至[000272])處找到關於此增益因數平滑之額外描述及圖, 且為了提供關於增益因數平滑之額外揭示的目的’此材料 藉此在允許以引用的方式併入之美國及任何其他管轄區域 中以引用的方式併入。 根據量化之輸出空間中之值之間的最小步長’若至量化 器之輸入信號非常平滑’則可能有時經量化之輸出要不平 滑得多。此效應可導致可聞假影’且可能需要為增益因數 減小此效應。在某些情況下,增益因數量化效能可藉由實 施量化器430以併有臨時雜訊成形來改良。可將此成形應 用於訊框位準增益因數S60bf及/或應用於子訊框增益因數 S60bs。可在美國專利申請案第11/408,390號中的圖48至圖 55b及隨附本文(包括段落[〇〇〇254]至[000272])處找到關於 使用臨時雜訊成形量化增益因數之額外描述及圖,且為了 提供關於使用臨時雜訊成形量化增益因數之額外揭示的目 的,此材料藉此在允許以引用的方式併入之美國及任何其 他管轄區域中以引用的方式併入。 對於高頻激發信號S120係自已被調整之激發信號導出的 123346.doc -40· 情況,可能需要根據源激發信號之時間彎曲來時間彎曲高 頻信號S30之臨時包絡《可在Vos等人於2006年4月3曰申請 之題為"SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND TFME WARPING"之代理人案號050550的美國 專利申請案令之圖25至圖29及隨附本文(包括段落[000157] 至[000187])處找到關於此時間彎曲之額外描述及圖,且為 了提供關於高頻信號S30之臨時包絡之時間彎曲的額外揭 示的目的,此材料藉此在允許以引用的方式併入之美國及 任何其他管轄區域中以引用的方式併入。 高頻信號S30與合成高頻信號S 130之間的類似程度可指 示解碼高頻信號S100與高頻信號S30相似之程度。特定言 之,高頻信號S30之臨時包絡與合成高頻信號S130之臨時 包絡之間的類似性可指示可預期解碼高頻信號S100具有一 良好聲音品質且與高頻信號S30感知上類似。可將包絡之 間在時間上的大變化認為係合成信號非常不同於原始的指 示,且在此情況下,可能需要在量化之前識別及衰減彼等 增益因數。可在Vos等人於2006年4月21申請之題為 "SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR ATTENUATION"之代理人案號050558的美國專利 申請案中之圖34至圖39及隨附本文(包括段落[000222]至 [000236])處找到關於此增益因數衰減之額外描述及圖,且 為了提供關於增益因數衰減之額外揭示的目的,此材料藉 此在允許以引用的方式併入之美國及任何其他管轄區域中 以引用的方式併入。 123346.doc 1352972 儘管將本文所揭示之原理主要描述為應用於高頻編碼, 但可將本文所揭示之原理應用於相對於語音信號之另一子 頻帶的語音信號之一子頻帶的任何編碼。舉例而言,編碼 器濾波器組可經組態以將一低頻信號輸出至—低頻編碼器 (替代或除一或多個高頻信號之外),且該低頻編碼器可經 ^態以執行該低頻信號之頻譜分析、延伸編碼窄頻激發信 號,及相對於原始低頻信號為編碼低頻信號
絡。對於此等操作中之每一者而言,明,涵蓋及藉:揭: 低頻編碼器可經組態以根據如本文所描述之全範圍之變化 中的任一者來執行此操作。
知供所描述之組態之前述表達以使得熟f此項技術者能 進行或使用本文所揭示的結構及原理。對此等組態之各 能的,且本文中所呈現之一般原理亦可應用於 連=態。舉例而言’任何組態可部分或整體實施為一硬 生製造於特殊應用積體電路中之電路組態、或載 料程式或作為機器_ 碼為可二C儲存媒體中之軟體程式,此 號處理單元)執行^叫如—微處理11或其他數位信 陣列,諸如半二 資料儲存媒體可為儲存元件之 R趙(隨機存取憶體(其可包括(無限制)動態或靜態 逭機存取記憶體)、rom _),或鐵電、磁阻、雙向、聚:J憶體)及/或快問 碟片媒體,諸如一磁碟或光碑。相變記憶體,·或- 源碼、組合語言碼、機器碼、位。軟體”應理解為包括 進位碼、韌體、宏碼、微 I23346.doc -44- 1352972 碼、可由邏輯元件之陣列執行之指令的任何一或多個集合 或序列’及此等實例之任何組合。 高頻增益因數計算器A230、高頻編碼器A2〇〇、高頻解 碼器B200、寬頻語音編碼器A1〇〇及寬頻語音解碼器Bi〇〇 之實施之各種元件可實施為駐留於(例如)同一晶片上或一 晶片組中之兩個或兩個以上晶片間的電子及/或光學設 備,但亦涵蓋不具有此限制之其他配置。此裝置之一或多 個元件(例如,高頻增益因數計算器八23〇、量化器43〇及/ 或限制器L10)可整體或部分實施為一或多組指令,該或該 等組指令經配置以執行於邏輯元件(例如,電晶體、閘)之 :或多個固定或可程式陣列,諸如微處理器、嵌入式處理 益、IP核心、數位信號處理器、FPGA(場可程式間陣列)、 ASSP(特殊應用標準產品)及ASIC(特殊應用積體電路)上。 -或多個此等元件亦可能具有共同結構(例如,一用於在 不同時間執行對應於不同元件之程式碼之部分的處理器、 經執行以在不同時間執行對應於不同元件之任務的一組指 令、或在不同時間為不同元件執行操作之電子及/或光學 設備的—配置)。此外’一或多個此等元件可能用於執行 任務或執行不與該裝置之操作直接相關之其他組指令,諸 如與裝置嵌入於其中之#锯七么 油 丹甲之5又備或系統之另一操作相關之任 務0 、’且態亦包括如本文明被媒;+ < l 文月確揭不(例如’藉由描述經組態以 仃此4方法的結構)达立 稱)之a編碼、編碼及解碼之額外方 、。此等方法中之甚一去介-T +总 每者亦可切實地具體化(例如’於以 123346.doc •45- 1352972 例。 圖19b展示輸入空間映射成不同大小之量化區域的一實 例0 圖19c說明用於一增益因數值R之經量化之值大於原始值 的一實例。 圖20a展示根據——般實施之增益因數限制之方法Ml 00 的流程圖。 圖20b展示用於方法M100之一實施M110的流程圖。
圖20c展示用於方法M100之一實施M120的流程圖。 圖20d展示用於方法M100之一實施M130的流程圖。 圖21展示高頻編碼器A202之一實施A203之方塊圖。 圖22展示高頻編碼器A203之一實施A204之方塊圖。 圖23a展示用於限制器L10之一實施L12之運算圖。 圖23b展示用於限制器L10之另一實施L14之運算圖。 圖23c展示用於限制器L10之另一實施L16之運算圖。
圖24展示高頻解碼器B200之一實施B202的方塊圖。 【主要元件符號說明】 210 線性預測編碼(LPC)分析模組 220 LP濾波器係數至LSF轉換 230 量化器 240 逆量化器 250 LSF至LP濾波器係數轉換 260 白化濾波器 270 量化器 123346.doc -48- 1352972 310 逆量化器 320 LSF至LP濾波器係數轉換 330 窄頻合成濾波器 340 逆量化器 410 線性預測濾波器係數至LSF轉換 420 量化器 430 量化器 560 逆量化器 570 LSF至LP濾波器係數轉換 580 逆量化器 590 增益控制元件 A100 寬頻語音編碼器 A102 實施/編碼器 A110 濾波器組 A120 窄頻編碼器 A122 實施/窄頻編碼器 A130 多工器 A200 局頻編碼Is A202 實施/ tfj頻編碼 A203 實施/高頻編碼器 A204 實施/高頻編碼器 A210 分析模組 A220 合成濾波器 A230 高頻增益因數計算器 123346.doc -49- 1352972
A232 實施/高頻增益因數計算器 A234 實施/高頻增益因數計算器 A236 實施/高頻增益因數計算器 A300 高頻激發產生器 B100 寬頻語音解碼器 B102 實施/解碼器 B110 窄頻解碼器 B112 實施/窄頻解碼器 B120 濾波器組 B130 解多工器 B200 高頻解碼器/高頻合成濾波器 B202 實施/高頻解碼器 B300 高頻激發產生器 G10 包絡計算器 GlOa 實施/包絡計算器 G1 Oas 實施/包絡計算器/包絡產生器 GlOaf 實施/包絡計算器/包絡產生器 GlOb 實施/包絡計算器 GlObs 包絡計算器/包絡產生器 GlObf 包絡計算器/包絡產生器 G20 因數計算器 G20s 實施/因數計算器 G20f 實施/因數計算器 L10 增益因數限制器 123346.doc -50- 1352972
L12 實施/限制器 L14 實施/限制器 L16 實施/限制器 M100 方法 MllO 實施/方法 M120 實施/方法 M130 實施/方法 N20 正規器 PI 中間處理 SIO 寬頻語音信號 S20 窄頻信號 S30 南頻信號 S40 窄頻(NB)濾波器參數/編碼信號/窄頻殘餘信號 S50 編碼窄頻激發信號/窄頻殘餘信號/編碼信號 S60 高頻編碼參數/編碼信號/高頻濾波器參數 S60a 高頻濾波器參數/高頻編碼參數 S60b 高頻增益因數 S60bf 訊框位準增益因數 S60bs 子訊框增益因數/子訊框位準增益因數 S70 多工信號 S80 窄頻激發信號 S90 窄頻信號 SlOO 高頻信號/合成寬頻語音信號 SllO 寬頻語音信號 123346.doc -51 - 1352972
S120 高頻激發信號 S130 合成高頻信號 Τι 臨限值 τ2 臨限值 Τ200 任務 Τ210 實施/任務 T215a 任務 T215b 任務 T220a 任務 T220b 任務 T222a 任務 T222b 任務 T230 任務 TQ10 任務 TQ20 任務 TQ30 任務 TQ32 任務 TQ40 任務 TQ50 任務 TQ52 任務 XlOO 任務 X200 任務 X300 任務 X400 任務 123346.doc -52-

Claims (1)

1352972 * 第096128124號專利申請案 p--- 中文申請專利範圍替換本⑽年7月) 日修正本 十、申請專利範圍: -J 1· 一種語音處理方法,該方法包含: 基於(A)基於一語音信號之一第一子頻帶之一第一信 號的時間之一部分與(B)基於一自該語音信號之一第二子 頻帶導出之分量的一第二信號之時間之一相應部分之間 的一關係,計算一增益因數值; 根據該增益因數值,將一第一索引選擇至量化值之一 有序集合中; 砰估該增益因數值與一由該第一索引所指示之量化值 之間的一關係;及 根據该評估之一結果,將一第二索引選擇至量化值之 該有序集合中, 旦其中該評估一關係包含判定由該第一索引所指示之該 i化值是否超過該增益因數值。 2·如μ求項1之語音處理方法,其中該第一信號之時間之 及。Ρ分為該第-信號的—訊框,且其中該第二信號之時 間之該相應部分為該第二信號的一訊框。 3. 如請求们之語音處理方法,其中該第一子頻帶為一高 頻信號,且 其中該第二子頻帶為一窄頻信號。 4. 如請求们之語音處理方法,其中該第一子頻帶為一高 頻信號,且 中該第_一仏號為該南頻信號之一合成版本。 5. 如請求们之語音處理方法,其中該第二信號亦基於一 123346-1000704.doc 自該第一子頻帶所導出之分 如請求項5之語音處理方法 導出之分量為該第一子頻帶 如請求項1之語音處理方法 第二子頻帶所導出之分量為 如請求項7之語音處理方法 第一子頻帶之一頻譜包絡。 如請求項1之語音處理方法 一部分與該第二信號的時間 為該第一信號之時間之該部 k號之時間的該相應部分二 係。 量。 ’其中該自該第一子頻帶所 之—頻譜包絡。 ’其中該自該語音信號之一 —編碼激發信號。 ’其中該第二信號亦基於該 ’其中該第一信號之時間之 之一相應部分之間的該關係 分的能量之一量測與該第二 匕能量之一量測之間的一關 •如Μ未項9之語音處理 ,^ 方去’其中該計算一增益因數值 包含基於該第一信號夕眭 ' 時間之該部分的能量之該量測與 s亥第二信號之時間的 茨相應部分之能量之該量測之間的 —比來計算該增益因數值。 U.如请求項1之語音處理方法,其中該選擇一第一索引包 3將4增益因數值與複數個該等量化值中之每—者進行 比較。 2.如凊求項!之語音處理方法丨中該第一索引指示該有 序集合之中最接近該増益因數值的該量化值。 13.如:求項【之語音處理方法其中該判定由該第一索引 所才曰不之該置化值是否超過該肖益因數值包含以下各項 中之至)一者.(C)判定由該第一索引所指示之該量化值 123346-1000704.doc 1352972 一特定量,及(D)判定由該第一索 否超過該増益因數值該增益因數 是否超過該增益因數值一 引所指示之該量化值是否 值之—特定比例》 .如凊求項1之語音處理方法 含遞減該第一索引。 其中該選擇一第二索引包 •如請求項1之語音處理方法 ’其中該第一索引指示玆古
序集合之中最接近該增益 F法’其中該第二索引指示該有 益因數值而不超過該增益因數值 之該量化值。 17_如:求項丨之語音處理方法其中該方法更包含使用由 5亥第-索引所指示之該量化值以正規化複數個子訊框增 益因數之每一者。 18. 如明求項丨之語音處理方法,其中該選擇一第二索引包 3判叱由該第二索引所指示之該量化值是否在該增益因 數值之一特定比例内。 19. 一種電腦可讀資料儲存媒體,其包含: 用於使至少一電腦基於(A)基於一語音信號之一第 一子頻帶之一第一信號的時間之一部分與基於一自 該語音信號之一第二子頻帶導出之分量的一第二信號 之時間之一相應部分之間的一關係來計算一增益因數 值的程式碼; 用於使至少一電腦根據該增益因數值將一第一索引 選擇至量化值之一有序集合中的程式碼; 123346-1000704.doc 叫972 用於使至少-電腦判定一由該第—索引所指示之量 化值不少於基於該增益因數值之一值的程式碼;及置 用於使至少一·電腦回應該判定來將—第二索引選擇 至量化值之該有序集合中的程式碼。 〇·種用於語音處理之裝置,該裝置包含: 一計算器,其經組態以基於(A)基於一語音信號之一 第一子頻帶之一第一信號的時間之一部分與⑻基於一自 該語音信號之一第二子頻帶導出之分量的—第二信號之 時間之一相應部分之間的一關係來計算一增益因數°值\· 一量化器,其經組態以根據該增益因數值將一第一索 弓丨選擇至量化值之一有序集合中;及 匕-限制n,其經組態:⑷以判定一由該第—索引所 指不之量化值不少於基於該增益因數值之一值及⑺)以 回應該判定來將一第二索引選擇至量化值之該有序集合 中。 σ 21·如請求項20之裝置,其中該第-信號之時間之該部分為 該第-信號的一訊框’且其中該第二信號之時間之該相 應部分為該第二信號的—訊框。 2:如請求項20之裝置’其中該第一子頻帶為一高頻信號,且 其中該第二子頻帶為—窄頻信號。 23.如請求物之裝置,纟中該自該語音信號之-第二子頻 帶所導出之分量為一編碼激發信號。 24·如請求項23之裝置,其中該第二信號亦基於㈣-子頻 帶之一頻譜包絡。 123346-1000704.doc 1352972 二求項20之裝置,其中該計算器經組態以基於該第一 信號之時間之該部分的能量之一量測與該第二信號之時 間的該相應料之能量之一量測之間的一比來計算該增 益因數值。 26.如凊求項2〇之裝置,其中該限制器經組態以藉由判定該 由該第一索引所指示之量化值超過該增益因數值來判定 一由該第-索引所指示之該量化值不少於基於該增益因 數值之一值。 7·如。月求項20之裝置,其甲該限制器經組態以藉由以下各 項中之至卜者來判定—由該第—索引所指示之該量化 值不少於基於該增益因數值之一值:(c)判定由該第一索 引所指示之該量化值超過該增益因數值一特定量,及(D) 判定由該第一索引所指示之該量化值超過該增益因數值 該增益因數值之一特定比例。 28·如請求項20之裝置,其中該第二索引指示該有序集合之 中最接近該增益因數值而不超過該增益因數值之該量化 值。 29. 如叫求項20之裝置,其中該限制器經組態以判定由該第 一索引所指示之該量化值是否在該增益因數值之一特定 比例内。 30. 如請求項20之裝置,該裝置更包含一具有一編碼器之行 動電話’該編碼器包括該計算器、該量化器及該限制 器。 31. 如請求項28之裝置,其中該第—索引指示該有序集合之 123346-1000704.doc 1352972 中最接近該增益因數值的該量化值。 一正規器,該正 之一量化值以正 32.如請求項20之裝置,其中該裝置更包含 規器經組態以使用由該第二索引所指示 規化複數個子訊框增益因數之每一者。 33· —種用於語音處理之裝置,該裝置包含 用於基於(Α)基於一語音作获夕 _ 娓之—第一子頻帶之一第 一 "is號的時間之一部分愈其私 , 刀…暴於一自該語音信號之一第 一子頻帶導出之分量的一笛-. 的第一彳s旎之時間之一相應部分 之間的一關係計算一增益因數值的構件; 用於根據該增益因數值將—笛 ^ μ双值时第一索引選擇至量化值之 一有序集合中的構件;及 用於判定一由该第一索引所指示之量化值不少於基於 該增益因數值之-值及用於回應該判定來將—第二索引 選擇至量化值之該有序集合中的構件。 34. 如印求項33之裝置,其中該自該語音信號之一第二子頻 帶所導出之分量為—編碼激發信號。 35. 如請求項34之裝置,其中該第二信號亦基於該第一子頻 帶之一頻譜包絡》 36.如吻求項33之裝置,其中該用於計算之構件經組態以基 於該第一信號之時間之該部分的能量之一量測與該第二 4。號之時間的g亥相應部分之能量之一量測之間的一比來 計算該增益因數值。 3 7.如叫求項33之裝置’其中該第一索引指示該有序集合之 中最接近該增益因數值的該量化值,且 123346-1000704.doc 其中該第二索引指示該有序集合之中最接近該増益因數 值而不超過該增益因數值之該量化值。 38. —種語音處理方法,該方法包含: 基於⑷基於一語音信號之一第—子頻帶之_第一信 號的時間之-部分與(B)基於—自該語音信號之—第二子 頻帶導出之分量的一第二信號之時間之—相應部分之間 的一關係,計算一增益因數值; 根據該增益因數值,將一第一索引選擇至量化值之一 有序集合中; 判定一由該第一索弓丨所指示之量化值不少於基於該增 益因數值之一值;及 回應該判定來將一第二索引選擇至量化值之該有序集 合中。 39. 如請求項38之語音處理方法,其中該基於該增益因數值 之該值係該增益因數值,且 其t該判定一由該第一索引所指示之量化值不少於基 於該增益因數值之一值係藉由判定一由該第一索引所指 示之量化值超過該增益因數值來執行。 40. 如請求項38之語音處理方法’其中該判定一由該第一索 引所指示之量化值不少於基於該增益因數值之一值包含 以下各項中之至少一者:(C)判定由該第一索引所指示之 該量化值是否超過該增益因數值一特定量,及(D)判定由 s亥第一索引所指示之該量化值是否超過該增益因數值該 增益因數值之一特定比例。 123346-1000704.doc 1352972 41. 如請求項38之語音處理方法,其中該第二索引指示該有 序集合之中最接近該增益因數值而不超過該增益因數值 之該量化值。 42. 如請求項38之語音處理方法,其中該方法包含使用由該 第二索引所指示之一量化值以正規化複數個子訊框增益 因數之每一者。 43. 如請求項38之語音處理方法,其中該選擇一第二索引包 含判定由該第二索引所指示之一量化值是否在該增益因 數值之一特定比例内。 123346-1000704.doc 1352972 . 第096128124號專利申請案 |---- 中文圖式替換頁(100年1月) ㈣年ί月丨/日修正替換頁
(¾撒骤 (ap) 1
123346-fig-1000114.doc 1352972 . 第096128124號專利申請案 '一— -^ 中文圖式替換頁(100年1月) 陕I月,修正替換頁
CSHii I
(zh>om-骤 le
123346-fig-1000114.doc 1352972 第096128124號專利申請案 中文圖式替換頁(100年1月)
卜I醒 123346-fig-l〇〇〇''4doc 1352972 4 第096128124號專利申請案 「 -- • 中文圖式替換頁(1〇〇年1月) (醉(月修正替換頁 • ·
123346-fig-1000114.doc -24-
TW96128124A 2006-07-31 2007-07-31 Systems, methods, and apparatus for gain factor li TWI352972B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US83465806P 2006-07-31 2006-07-31
US11/610,104 US9454974B2 (en) 2006-07-31 2006-12-13 Systems, methods, and apparatus for gain factor limiting

Publications (2)

Publication Number Publication Date
TW200820219A TW200820219A (en) 2008-05-01
TWI352972B true TWI352972B (en) 2011-11-21

Family

ID=38987459

Family Applications (1)

Application Number Title Priority Date Filing Date
TW96128124A TWI352972B (en) 2006-07-31 2007-07-31 Systems, methods, and apparatus for gain factor li

Country Status (11)

Country Link
US (1) US9454974B2 (zh)
EP (1) EP2047466B1 (zh)
JP (1) JP5290173B2 (zh)
KR (1) KR101078625B1 (zh)
CN (1) CN101496101B (zh)
BR (1) BRPI0715516B1 (zh)
CA (1) CA2657910C (zh)
ES (1) ES2460893T3 (zh)
RU (1) RU2420817C2 (zh)
TW (1) TWI352972B (zh)
WO (1) WO2008030673A2 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
CN101283407B (zh) 2005-10-14 2012-05-23 松下电器产业株式会社 变换编码装置和变换编码方法
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8326641B2 (en) * 2008-03-20 2012-12-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5544371B2 (ja) 2009-10-14 2014-07-09 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
KR101370522B1 (ko) * 2009-12-07 2014-03-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 하이브리드 변환을 사용한 다채널 오디오 엔코딩된 비트 스트림들의 디코딩
AU2011358654B2 (en) 2011-02-09 2017-01-05 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
KR101585849B1 (ko) * 2011-02-16 2016-01-22 돌비 레버러토리즈 라이쎈싱 코오포레이션 필터 계수들을 생성하고 필터들을 구성하는 방법들 및 시스템들
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN104321815B (zh) * 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
CN105551497B (zh) * 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
CN105324982B (zh) * 2013-05-06 2018-10-12 波音频有限公司 用于抑制不需要的音频信号的方法和设备
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
CN104681032B (zh) * 2013-11-28 2018-05-11 中国移动通信集团公司 一种语音通信方法和设备
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
CN105336336B (zh) * 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN105225671B (zh) * 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及系统
US9595269B2 (en) 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
US10020002B2 (en) * 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
US10499165B2 (en) * 2016-05-16 2019-12-03 Intricon Corporation Feedback reduction for high frequencies
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2893691B2 (ja) 1988-11-25 1999-05-24 ソニー株式会社 デイジタル信号処理装置
JPH0828875B2 (ja) 1989-08-21 1996-03-21 三菱電機株式会社 符号化装置および復号化装置
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
JPH08123500A (ja) 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd ベクトル量子化装置
GB2304508A (en) 1995-04-19 1997-03-19 Motorola Inc Method and apparatus for low rate coding and decoding
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3353266B2 (ja) 1996-02-22 2002-12-03 日本電信電話株式会社 音響信号変換符号化方法
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6397178B1 (en) * 1998-09-18 2002-05-28 Conexant Systems, Inc. Data organizational scheme for enhanced selection of gain parameters for speech coding
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US7260523B2 (en) 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US7406411B2 (en) * 2001-08-17 2008-07-29 Broadcom Corporation Bit error concealment methods for speech coding
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
ATE368279T1 (de) * 2003-05-01 2007-08-15 Nokia Corp Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
RU2404506C2 (ru) 2004-11-05 2010-11-20 Панасоник Корпорэйшн Устройство масштабируемого декодирования и устройство масштабируемого кодирования
WO2006116024A2 (en) 2005-04-22 2006-11-02 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Also Published As

Publication number Publication date
EP2047466A2 (en) 2009-04-15
BRPI0715516A2 (pt) 2013-07-09
RU2420817C2 (ru) 2011-06-10
KR20090025349A (ko) 2009-03-10
JP5290173B2 (ja) 2013-09-18
CN101496101A (zh) 2009-07-29
EP2047466B1 (en) 2014-03-26
JP2009545775A (ja) 2009-12-24
CA2657910A1 (en) 2008-03-13
US20080027718A1 (en) 2008-01-31
WO2008030673A3 (en) 2008-06-26
BRPI0715516B1 (pt) 2019-12-10
KR101078625B1 (ko) 2011-11-01
CA2657910C (en) 2015-04-28
WO2008030673A2 (en) 2008-03-13
CN101496101B (zh) 2013-01-23
RU2009107198A (ru) 2010-09-10
ES2460893T3 (es) 2014-05-14
TW200820219A (en) 2008-05-01
US9454974B2 (en) 2016-09-27

Similar Documents

Publication Publication Date Title
TWI352972B (en) Systems, methods, and apparatus for gain factor li
DK1875463T3 (en) SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY
AU2006232357B2 (en) Method and apparatus for vector quantizing of a spectral envelope representation
EP3174051B1 (en) Systems and methods of performing noise modulation and gain adjustment