TWI384807B - 用於在一與一語音訊號相關之封包中包含一識別符之系統及方法 - Google Patents

用於在一與一語音訊號相關之封包中包含一識別符之系統及方法 Download PDF

Info

Publication number
TWI384807B
TWI384807B TW096127832A TW96127832A TWI384807B TW I384807 B TWI384807 B TW I384807B TW 096127832 A TW096127832 A TW 096127832A TW 96127832 A TW96127832 A TW 96127832A TW I384807 B TWI384807 B TW I384807B
Authority
TW
Taiwan
Prior art keywords
signal
packet
narrowband
band
encoding
Prior art date
Application number
TW096127832A
Other languages
English (en)
Other versions
TW200816716A (en
Inventor
Vivek Rajendran
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200816716A publication Critical patent/TW200816716A/zh
Application granted granted Critical
Publication of TWI384807B publication Critical patent/TWI384807B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Description

用於在一與一語音訊號相關之封包中包含一識別符之系統及方法
本系統及方法大體上係關於語音處理技術。更特定言之,本系統及方法係關於在與語音訊號相關之封包中包含一識別符。
藉由數位技術之話音傳輸變得普遍,特定言之,在長距離及數位無線電電話應用中變得普遍。此又產生了對確定在維持重建語音之被感知品質之同時可在通道上發送之資訊之最小量的興趣。用於壓縮語音之設備可用於電信之許多領域中。電信之實例為無線通信。無線通信之領域具有許多應用,其包括(例如)無線電話、呼叫器、無線區域迴路、諸如蜂巢式及攜帶型通信系統(PCS)電話系統之無線電話、行動網際網路協定(IP)電話及衛星通信系統。特別重要之應用為用於行動用戶之無線電話。
描述一種用於在一與一語音訊號相關之封包中包含一識別符的方法。接收一訊號。將該訊號分割為複數個訊框。將該訊號之訊框編碼至一封包中。作出一將該封包編碼為一寬頻帶封包還是一窄頻帶封包之確定。基於該確定,在封包中封裝一識別符。傳輸該封包。自一N位元參數提供至少兩個非法值,其中來自該N位元參數之至少一個位元用於載運資訊。用於載運資訊之來自該N位元參數的位元數等於log2 (X),其中X為自該N位元參數提供之非法值的數目。
亦描述一種用於在一與一語音訊號相關之封包中包含一識別符的裝置。該裝置包括一處理器及與該處理器電子通信之記憶體。指令儲存於該記憶體中。可執行指令以:接收一訊號;將該訊號分割為複數個訊框;將該訊號之一訊框編碼至一封包中;確定將該封包編碼為一寬頻帶封包還是一窄頻帶封包;基於該確定,在該封包中封裝一識別符;及傳輸該封包。
亦描述一種經組態以在一與一語音訊號相關之封包中包含一識別符的系統。該系統包括一用於處理之構件及一用於接收訊號之構件。描述一用於將該訊號分割為複數個訊框之構件,及一用於將該訊號之一訊框編碼至一封包中之構件。描述用於確定將該封包編碼為一寬頻帶封包還是一窄頻帶封包之構件。描述一用於基於該確定而在該封包中封裝一識別符之構件,及一用於傳輸該封包之構件。
亦描述一種電腦可讀媒體。該媒體經組態以儲存一組指令,可執行該等指令以:接收一訊號;將該訊號分割為複數個訊框;將該訊號之一訊框編碼至一封包中;確定將該封包編碼為一寬頻帶封包還是一窄頻帶封包;基於該確定,在該封包中封裝一識別符;及傳輸該封包。
亦描述一種用於解碼一封包之方法。接收一封包。分析一在該封包中包括之識別符。確定該封包是由一寬頻帶編碼器還是由一窄頻帶編碼器所編碼。基於該確定,選擇一用於該封包之解碼模式。
亦描述一種用於解碼一封包之裝置。該裝置包括一處理器及與該處理器電子通信之記憶體。指令儲存於該記憶體中。可執行該等指令以:接收一封包;分析一在該封包中包括之識別符;確定該封包是由一寬頻帶編碼器還是由一窄頻帶編碼器所編碼;及基於該確定,選擇一用於該封包之解碼模式。
亦描述一種經組態以解碼一封包之系統。該系統包括一用於處理之構件及一用於接收一封包之構件。描述一用於分析一包括於該封包中之識別符之構件,及一用於確定該封包是由一寬頻帶編碼器還是由一窄頻帶編碼器所編碼之構件。描述了用於基於該確定而選擇一用於該封包之解碼模式的構件。
亦描述一種電腦可讀媒體。該媒體經組態以儲存一組指令,可執行該等指令以:接收一封包;分析一在該封包中包括之識別符;確定該封包是由一寬頻帶編碼器還是由一窄頻帶編碼器所編碼;及基於該確定,選擇一用於該封包之解碼模式。
現參看附圖描述系統及方法之多種組態,其中相同參考數字指示等同或功能相似之元件。通常在本文中附圖中描述及說明之本發明系統及方法的特徵可配置及設計成多種不同組態。因此,以下詳細描述並非意欲限制所主張之系統及方法之範疇,而僅為系統及方法之組態的代表。
將本文中所揭示之組態的許多特徵實施為電腦軟體、電子硬體或該兩者之組合。為清楚說明硬體及軟體之此互換性,通常依據各種組件之功能性來描述該等組件。將此功能性實施為硬體或軟體視特定應用及強加於整個系統之設計約束而定。熟練技工可對於每一特定應用以不同方式實施所描述之功能性,但不應將該等實施決策解譯為導致偏離本發明系統及方法之範疇。
在將所描述之功能性實施為電腦軟體之情況下,該軟體可包括任何類型之電腦指令或電腦可執行碼,其位於記憶體設備中及/或作為電子訊號傳輸於系統匯流排或網路上。實施與本文中所描述之組件相關之功能性的軟體可包含單一指令或許多指令,且可分散於若干不同程式碼段上、不同程式中及若干記憶體設備上。
除非明確指定,否則如本文中所使用之術語"一組態"、"組態"、"若干組態"、"該組態"、"該等組態"、"一或多個組態"、"一些組態"、"某些組態"、"一個組態"、"另一個組態"及其類似術語意謂"所揭示之系統及方法之一或多個(但無需所有)組態"。
以極其廣泛之意義來使用術語"確定"(及其文法變體)。術語"確定"涵蓋多種行為,且因此"確定"可包括計算、演算、處理、導出、調查、查找(例如,在表、資料庫及另一資料結構中查找)、確認及其類似行為。同樣地,"確定"可包括接收(例如,接收資訊)、存取(例如,存取記憶體中之資料)及其類似行為。同樣地,"確定"可包括決議、選擇、選取、建立及其類似行為。
除非明確指定,否則短語"基於"並非意謂"僅基於"。換言之,短語"基於"描述"僅基於"及"至少基於"兩種涵義。
蜂巢式網路可包括由許多小區(每一小區由固定傳輸器服務)構成之無線電網路。可將此等多個傳輸器稱為小區站點或基地台。藉由在通信通道上將語音訊號傳輸至基地台,一小區可與網路中之其他小區通信。小區可將語音訊號劃分為多個訊框(例如,20毫秒(ms)之語音訊號)。可將每一訊框編碼至封包中。封包可包括確定數量之位元,該等位元接著在通信通道上被傳輸至接收基地台或接收小區。接收基地台或接收小區可將封包解封包且解碼多種訊框以重建訊號。
可將封包編碼為全速率封包(171位元)、半速率封包(80位元)、四分之一速率封包(40位元)或八分之一速率封包(16位元)。此外,可利用窄頻帶編碼器或寬頻帶編碼器來編碼封包。由寬頻帶編碼器編碼之封包可被編碼為全速率封包、半速率封包或八分之一速率封包。由窄頻帶編碼器編碼之封包可被編碼為全速率封包、半速率封包、四分之一速率封包或八分之一速率封包。可對多種類型之封包實施寬頻帶編碼器,包括編碼激發線性預測(CELP)封包及雜訊激發線性預測(NELP)封包。可對CELP封包、原型音高週期(PPP)封包及NELP封包實施窄頻帶編碼器。
在編碼封包之後,在封包中可包括識別符以對解碼器指示該封包是由寬頻帶編碼器還是由窄頻帶編碼器所編碼。在識別符中所包括之資訊可對解碼器指示該封包應使用寬頻帶解碼器或窄頻帶解碼器予以解碼。舉例而言,第四代聲碼器(4GV)寬頻帶(WB)編碼器可編碼半速率(80位元)封包。該封包可不具有用以識別更多類型之封包的明確位元。因而,包括7位元音高滯後之無效位元樣式可用於識別包括73位元(或73位元以下)之一或多個封包。然而,4GV-WB半速率封包可需要74位元,且因而,可能無法為4GV-WB半速率封包利用7位元音高滯後識別符(因為在此實例中,可用於半速率之位元的總數目為80)。在一態樣中,7位元音高滯後識別符之兩個無效樣式(彼此相差一個位元)可用於識別4GV-WB半速率封包。(七個位元中之)六個位元可用作識別符,因此除了73位元之外,釋放了一個不同位元以由4GV-WB半速率封包使用,其產生用於4GV-WB半速率封包之74位元。
本文中所描述之組態包括可經組態以對窄頻帶語音編碼器提供擴展,以支援以約800 bps至1000 bps(位元每秒)之頻寬增量來傳輸及/或儲存寬頻帶語音訊號之系統、方法及裝置。該等實施之潛在優勢包括:用以支援與窄頻帶系統之相容性的嵌入式編碼、在窄頻帶編碼通道與高頻帶編碼通道之間的相對容易的位元分配及再分配、避免了計算密集型寬頻帶合成運算及維持待由計算密集型波形編碼常用程式處理之訊號的低取樣率。
除非上下文明確限制,否則術語"計算"在本文中用於指示其一般意義中之任一意義,諸如演算、產生一列值及自一列值選擇。在本描述及申請專利範圍中使用術語"包含"時,其並不排除其他元件或操作。術語"A基於B"用於指示其一般意義中之任一意義,包括(i)"A等同於B"及(ii)"A至少基於B"之情況。術語"網際網路協定"包括版本4(如IETF(網際網路工程工作小組)RFC(請求評論)791中所描述)及隨後版本(諸如版本6)。
圖1a展示根據一組態之寬頻帶語音編碼器A100之方塊圖。濾波器組A110經組態以過濾寬頻帶語音訊號S10,以產生窄頻帶訊號S20及高頻帶訊號S30。窄頻帶編碼器A120經組態以編碼窄頻帶訊號S20,以產生窄頻帶(NB)濾波器參數S40及窄頻帶殘餘訊號S50。如本文中進一步詳細描述,窄頻帶編碼器A120通常經組態以產生作為碼簿指數或以另一量化形式之窄頻帶濾波器參數S40及編碼窄頻帶激發訊號S50。高頻帶編碼器A200經組態以根據在編碼窄頻帶激發訊號S50中之資訊而編碼高頻帶訊號S30,以產生高頻帶編碼參數S60。如本文中進一步詳細描述,高頻帶編碼器A200通常經組態以產生作為碼簿指數或以另一量化形式之高頻帶編碼參數S60。寬頻帶語音編碼器A100之一特定實例經組態以用約8.55 kbps(千位元每秒)之速率來編碼寬頻帶語音訊號S10,其中約7.55 kbps用於窄頻帶濾波器參數S40及編碼窄頻帶激發訊號S50,且約1 kbps用於高頻帶編碼參數S60。
可需要將編碼窄頻帶訊號與編碼高頻帶訊號組合為單一位元流。舉例而言,可需要將編碼訊號多工在一起以作為編碼寬頻帶語音訊號而(例如,在有線、光學或無線傳輸通道上)傳輸或儲存。圖1b展示寬頻帶語音編碼器A100之一實施A102之方塊圖,其包括一多工器A130,該多工器A130經組態以將窄頻帶濾波器參數S40、編碼窄頻帶激發訊號S50及高頻帶濾波器參數S60組合為一多工訊號S70。
包括編碼器A102之裝置亦可包括電路,該電路經組態以將多工訊號S70傳輸至諸如有線、光學或無線通道之傳輸通道中。該裝置亦可經組態以執行對訊號之一或多個通道編碼操作,諸如誤差校正編碼(例如,速率相容卷積編碼)及/或誤差偵測編碼(例如,循環冗餘編碼)及/或一或多層網路協定編碼(例如,乙太網路、TCP/IP、cdma2000)。
可需要組態多工器A130以將編碼窄頻帶訊號(包括窄頻帶濾波器參數S40及編碼窄頻帶激發訊號S50)作為多工訊號S70之可分子流而嵌入,使得編碼窄頻帶訊號可獨立於多工訊號S70之另一部分(諸如高頻帶及/或低頻帶訊號)而被恢復及解碼。舉例而言,多工訊號S70可經配置以使編碼窄頻帶訊號可藉由去除高頻帶濾波器參數S60而得以恢復。該特徵之一潛在優勢為:避免了在將編碼寬頻帶訊號傳遞至支援窄頻帶訊號之解碼但不支援高頻帶部分之解碼的系統之前,將編碼寬頻帶訊號編碼轉換之需要。
圖2a為根據一組態之寬頻帶語音解碼器B100之方塊圖。窄頻帶解碼器B110經組態以解碼窄頻帶濾波器參數S40及編碼之窄頻帶激發訊號S50,以產生窄頻帶訊號S90。高頻帶解碼器B200經組態以根據窄頻帶激發訊號S80基於編碼窄頻帶激發訊號S50來解碼高頻帶編碼參數S60,以產生高頻帶訊號S100。在此實例中,窄頻帶解碼器B110經組態以將窄頻帶激發訊號S80提供至高頻帶解碼器B200。濾波器組B120經組態以將窄頻帶訊號S90與高頻帶訊號S100組合,以產生寬頻帶語音訊號S110。
圖2b為寬頻帶語音解碼器B100之一實施B102的方塊圖,其包括一解多工器B130,該解多工器B130經組態以自多工訊號S70產生編碼訊號S40、S50及S60。包括解碼器B102之裝置可包括電路,該電路經組態以自諸如有線、光學或無線通道之傳輸通道接收多工訊號S70。該裝置亦可經組態以執行對訊號之一或多個通道解碼操作,諸如誤差校正解碼(例如,速率相容卷積解碼)及/或誤差偵測解碼(例如,循環冗餘解碼)及/或一或多層網路協定解碼(例如,乙太網路、TCP/IP、cdma2000)。
濾波器組A110經組態以根據頻帶分割機制來過濾輸入訊號,以產生低頻率子頻帶及高頻率子頻帶。視用於特定應用之設計標準而定,輸出子頻帶可具有相等或不等頻寬且可重疊或不重疊。產生兩個以上子頻帶之濾波器組A110之組態亦係可能的。舉例而言,該濾波器組可經組態以產生一或多個低頻帶訊號,該等訊號包括在低於窄頻帶訊號S20之頻率範圍的頻率範圍(諸如50 Hz至300 Hz之範圍)內之分量。該濾波器組亦可能經組態以產生一或多個額外高頻帶訊號,該等訊號包括在高於高頻帶訊號S30之頻率範圍的頻率範圍(諸如14 kHz至20 kHz、16 kHz至20 kHz或16 kHz至32 kHz之範圍)內之分量。在該情況下,寬頻帶語音編碼器A100可經實施以單獨編碼此或此等訊號,且多工器A130可經組態以將額外編碼訊號包括於多工訊號S70中(例如,作為一可分部分)。
圖3a展示濾波器組A110之一實施A112之方塊圖,其經組態以產生具有降低取樣率之兩個子頻帶訊號。濾波器組A110經配置以接收具有高頻率(或高頻帶)部分及低頻率(或低頻帶)部分之寬頻帶語音訊號S10。濾波器組A112包括:低頻帶處理路徑,其經組態以接收寬頻帶語音訊號S10且產生窄頻帶語音訊號S20;及高頻帶處理路徑,其經組態以接收寬頻帶語音訊號S10且產生高頻帶語音訊號S30。低通濾波器110過濾寬頻帶語音訊號S10以使選定低頻率子頻帶通過,且高通濾波器130過濾寬頻帶語音訊號S10以使選定高頻率子頻帶通過。因兩個子頻帶訊號均具有比寬頻帶語音訊號S10更窄之頻寬,故其取樣率率可降低至一定程度而不會損失資訊。降取樣器120根據所要抽取因子來降低低通訊號之取樣率(例如,藉由移除訊號之樣本及/或以平均值替代樣本),且降取樣器140同樣根據另一所要抽取因子來降低高通訊號之取樣率。
圖3b展示濾波器組B120之一對應實施B122之方塊圖。升取樣器150增加窄頻帶訊號S90之取樣率(例如,藉由補零及/或藉由複製樣本),且低通濾波器160過濾升取樣訊號以使低頻帶部分通過(例如,以避免鋸齒)。同樣,升取樣器170增加高頻帶訊號S100之取樣率,且高通濾波器180過濾升取樣訊號以使高頻帶部分通過。接著將該兩個通頻帶訊號求和以形成寬頻帶語音訊號S110。在解碼器B100之一些實施中,濾波器組B120經組態以根據由高頻帶解碼器B200接收及/或計算之一或多個權來產生兩個通頻帶訊號之加權和。亦設想組合兩個以上通頻帶訊號之濾波器組B120之組態。
濾波器110、130、160、180中之每一濾波器均可實施為有限脈衝響應(FIR)濾波器或無限脈衝響應(IIR)濾波器。編碼器濾波器110及130之頻率響應可在抑止頻帶與通頻帶之間具有對稱或不同形狀之過渡區域。同樣,解碼器濾波器160及180之頻率響應可在抑止頻帶與通頻帶之間具有對稱或不同形狀之過渡區域。低通濾波器110可需要具有與低通濾波器160相同之響應,且高通濾波器130可需要具有與高通濾波器180相同之響應。在一實例中,兩個濾波器對110、130及160、180為正交鏡像濾波器(QMF)組,其中濾波器對110、130具有與濾波器對160、180相同之係數。
在一典型實例中,低通濾波器110具有包括300 Hz至3400 Hz之有限PSTN範圍之通頻帶(例如,0 kHz至4 kHz之頻帶)。圖4a及圖4b展示在兩個不同實施性實例中之寬頻帶語音訊號S10、窄頻帶訊號S20及高頻帶訊號S30之相對頻寬。在該兩個特定實例中,寬頻帶語音訊號S10均具有16 kHz之取樣率(表示頻率分量在0 kHz至8 kHz之範圍內),且窄頻帶訊號S20均具有8 kHz之取樣率(表示頻率分量在0 kHz至4 kHz之範圍內)。
在圖4a之實例中,在兩個子頻帶之間不存在顯著重疊。可使用具有4 kHz至8 kHz之通頻帶的高通濾波器130獲得此實例中所示之高頻帶訊號S30。在該情況下,可需要藉由將濾波訊號降取樣2倍來將取樣率降低至8 kHz。該操作(可預期其將顯著降低對訊號之進一步處理操作之計算複雜度)將使通頻帶能量下降至0 kHz至4 kHz之範圍內而不會損失資訊。
在圖4b之替代實例中,上子頻帶與下子頻帶具有可觀的重疊,使得兩個子頻帶訊號均描述3.5 kHz至4 kHz之區域。可使用具有3.5 kHz至7 kHz之通頻帶的高通濾波器130獲得在此實例中之高頻帶訊號S30。在該情況下,可需要藉由以16/7之因數將過濾訊號降取樣來將取樣率降低至7 kHz。該操作(可預期其將顯著降低對訊號之進一步處理操作之計算複雜度)將使通頻帶能量下降至0 kHz至3.5 kHz之範圍內而不會損失資訊。
在用於電話通信之典型手機中,轉換器(亦即,麥克風及耳機或揚聲器)中之一或多者缺乏在7 kHz至8 kHz之頻率範圍內之明顯響應。在圖4b之實例中,在編碼訊號中不包括寬頻帶語音訊號S10在7 kHz與8 kHz之間的部分。高通濾波器130之其他特定實例具有3.5 kHz至7.5 kHz及3.5 kHz至8 kHz之通頻帶。
在一些實施中,提供在子頻帶之間的重疊(如在圖4b之實例中)允許使用在重疊區域上具有平滑滾落(rolloff)之低通及/或高通濾波器。該等濾波器通常較容易設計、計算複雜度較低及/或比具有更急劇或"磚牆"響應之濾波器引入更少延遲。具有急劇過渡區域之濾波器傾向於比具有平滑滾落之類似階數之濾波器具有更高旁瓣(旁瓣可導致鋸齒)。具有急劇過渡區域之濾波器亦可具有可導致振鈴假影(ringing artifact)之長脈衝響應。對具有一或多個IIR濾波器之濾波器組實施而言,允許在重疊區域上之平滑滾落使得可使用極點遠離單位圓之一或多個濾波器,此對於確保穩定的固定點實施可係重要的。
子頻帶之重疊允許低頻帶與高頻帶之平滑摻合,此可導致較少可聽假影、減少之鋸齒及/或自一頻帶至另一頻帶之較不明顯的過渡。此外,窄頻帶編碼器A120(例如,波形編碼器)之編碼效率可隨著頻率增加而下降。舉例而言,窄頻帶編碼器之編碼品質可在低位元率處降低(尤其在存在背景雜訊之情況下)。在該等情況下,提供子頻帶之重疊可增加在重疊區域中之再生頻率分量之品質。
此外,子頻帶之重疊允許低頻帶與高頻帶之平滑摻合,此可導致較少可聽假影、減少之鋸齒、及/或自一頻帶至另一頻帶之較不明顯的過渡。該特徵可尤其合乎其中窄頻帶編碼器A120及高頻帶編碼器A200根據不同編碼方法操作之實施的需要。舉例而言,不同編碼技術可產生聽起來非常不同之訊號。編碼為碼簿指數形式之頻譜包絡的編碼器可產生一訊號,其具有與編碼振幅頻譜之編碼器產生之訊號不同的聲音。時域編碼器(例如,脈衝碼調變或PCM編碼器)可產生一訊號,其具有與頻域編碼器所產生之訊號不同的聲音。利用頻譜包絡及對應殘餘訊號之表示來編碼訊號之編碼器可產生一訊號,其具有與利用頻譜包絡之表示來編碼訊號之編碼器所產生之訊號不同的聲音。將訊號編碼為其波形之表示的編碼器可產生一輸出,其具有不同於來自正弦編碼器之輸出之聲音。在該等情況下,使用具有急劇過渡區域之濾波器來界定非重疊子頻帶可導致在合成的寬頻帶訊號中之子頻帶之間的突然且明顯可感知之過渡。
雖然具有互補重疊頻率響應之QMF濾波器組通常用於子頻帶技術中,但該等濾波器不適於本文中所描述之寬頻帶編碼實施中之至少一些實施。在編碼器處之QMF濾波器組經組態以產生顯著程度之鋸齒,該鋸齒在解碼器處之對應QMF濾波器組中被消去。該配置可能不適用於其中訊號在濾波器組之間發生顯著量之失真的應用中,此係由於失真可降低鋸齒消去性質之有效性。舉例而言,本文中所描述之應用包括經組態以用極低位元率操作之編碼實施。由於該極低位元率,故與原始訊號相比,解碼訊號可能表現出顯著失真,使得使用QMF濾波器組可導致未消去之鋸齒。使用QMF濾波器組之應用通常具有較高位元率(例如,對AMR而言超過12 kbps,對於G.722而言超過64 kbps)。
另外,編碼器可經組態以產生感知上類似於原始訊號但實際上顯著不同於原始訊號之合成訊號。舉例而言,如本文中所描述之自窄頻帶殘餘得出高頻帶激發之編碼器可產生該訊號,因為實際高頻帶殘餘可完全不存在於解碼訊號中。QMF濾波器組在該等應用中之使用可導致由未消去之鋸齒引起之顯著程度的失真。
由於鋸齒之影響限於等於子頻帶寬度之頻寬,因此若受影響之子頻帶較窄,則可降低由QMF鋸齒引起之失真量。然而,對於本文中所描述之每一子頻帶包括寬頻帶頻寬之約一半的實例而言,由未消去之鋸齒引起之失真可影響訊號之顯著部分。訊號之品質亦可受其上發生未消去之鋸齒的頻帶之位置的影響。舉例而言,在寬頻帶語音訊號之中心附近(例如,在3 kHz與4 kHz之間)產生之失真可比發生於訊號之邊緣附近(例如,超過6 kHz)之失真有害得多。
雖然QMF濾波器組之濾波器之響應嚴格地彼此相關,但濾波器組A110及B120之低頻帶路徑及高頻帶路徑可經組態以具有完全不相關之頻譜(除兩個子頻帶之重疊外)。吾人將兩個子頻帶之重疊定義為自高頻帶濾波器之頻率響應下降至-20 dB之點直至低頻帶濾波器之頻率響應下降至-20 dB之點的距離。在濾波器組A110及/或B120之多個實例中,此重疊在約200 Hz至約1 kHz之範圍內。約400 Hz至約600 Hz之範圍可表示在編碼效率與感知平滑度之間的所要取捨。在上文所提及之一特定實例中,重疊為約500 Hz。
可需要實施濾波器組A112及/或B122以在若干階段中執行圖4a及圖4b中所說明之操作。舉例而言,圖4c展示濾波器組A112之一實施A114之方塊圖,其使用一系列內插、重取樣、抽取及其他操作來執行高通濾波及降取樣操作之功能等同操作。該實施可較易於設計及/或可允許再使用邏輯及/或編碼之功能區塊。舉例而言,相同功能區塊可用於執行至14 kHz之抽取及至7 kHz之抽取的操作(如圖4c中所示)。藉由將訊號與函數e jnπ 或序列(-1) n (其值在+1與-1之間交替)相乘,可實施頻譜反轉操作。可將頻譜定形操作實施為經組態以成形訊號以獲得所要整體濾波器響應的低通濾波器。
應注意到,由於頻譜反轉操作,高頻帶訊號S30之頻譜被反轉。可相應地組態在編碼器及對應解碼器中之隨後操作。舉例而言,如本文所描述之高頻帶激發產生器A300可經組態以產生亦具有頻譜反轉形態之高頻帶激發訊號S120。
圖4d展示濾波器組B122之一實施B124之方塊圖,其使用一系列內插、重取樣及其他操作來執行升取樣及高通濾波操作之功能等同操作。濾波器組B124包括在高頻帶中之頻譜反轉操作,其反轉與(例如)在編碼器之濾波器組(諸如濾波器組A114)中執行之操作類似的操作。在此特定實例中,濾波器組B124亦包括在低頻帶及高頻帶中衰減訊號在7100 Hz處之分量的陷頻濾波器,雖然該等陷頻濾波器係可選的且無需被包括。
窄頻帶編碼器A120係根據聲源-濾波器模型而實施,其將輸入語音訊號編碼為:(A)描述濾波器之一組參數;及(B)驅動所描述濾波器產生輸入語音訊號之合成再生訊號的激發訊號。圖5a展示語音訊號之頻譜包絡之一實例。表現此頻譜包絡之特徵的峰值表示聲道之共振且被稱為共振峰。大多數語音編碼器至少將此粗略頻譜結構編碼為諸如濾波器係數之一組參數。
圖5b展示應用於窄頻帶訊號S20之頻譜包絡之編碼的基本聲源-濾波器配置的一實例。分析模組計算表現對應於一時間段(通常20 msec)上之語音之濾波器的特徵之一組參數。根據彼等濾波器參數而組態之白化濾波器(亦稱為分析或預測誤差濾波器)移除頻譜包絡,以在頻譜上平化訊號。所得白化訊號(亦稱為殘餘)具有較少能量,且因此具有較小方差,且比原始語音訊號更易於編碼。由編碼殘餘訊號產生之誤差亦可更均勻地散布於頻譜上。濾波器參數及殘餘通常經量化以在通道上有效傳輸。在解碼器處,根據濾波器參數所組態之合成濾波器由基於殘餘之訊號而激發,以產生原始語音之合成版本。合成濾波器通常經組態以具有傳送函數,其為白化濾波器之傳送函數之反函數。
圖6展示窄頻帶編碼器A120之一基本實施A122之方塊圖。在此實例中,一線性預測編碼(LPC)分析模組210將窄頻帶訊號S20之頻譜包絡編碼為一組線性預測(LP)係數(例如,全極濾波器1/A(z)之係數)。分析模組通常將輸入訊號處理為一系列非重疊訊框,其中為每一訊框計算一組新係數。訊框週期通常為在其上可預期訊號局部不變之週期;一實例為20毫秒(等於8 kHz之取樣率時之160個樣本)。在一實例中,LPC分析模組210經組態以計算一組十個LP濾波器係數,以表現每20毫秒訊框之共振峰結構的特徵。亦可能實施分析模組以將輸入訊號處理為一系列重疊訊框。
分析模組可經組態以直接分析每一訊框之樣本,或樣本可根據成窗函數(例如漢明窗)而被首先加權。亦可在大於訊框之窗(諸如30 msec之窗)內執行分析。此窗可為對稱的(例如5-20-5,使得緊接在20毫秒訊框之前及之後,其包括5毫秒)或非對稱的(例如10-20,使得其包括前一訊框之最後10毫秒)。LPC分析模組通常經組態以使用Levinson-Durbin遞歸或Leroux-Gueguen演算法來計算LP濾波器係數。在另一實施中,分析模組可經組態以為每一訊框計算一組倒頻譜系數而並非一組LP濾波器係數。
藉由量化濾波器參數,編碼器A120之輸出速率可顯著降低,同時對再生品質具有相對較少影響。線性預測濾波器係數難以有效量化且通常映射為用於量化及/或熵編碼之另一表示,諸如線頻譜對(LSP)或線頻譜頻率(LSF)。在圖6之實例中,LP濾波器係數至LSF轉換220將該組LP濾波器係數轉換為一組對應LSF。LP濾波器係數之其他一對一表示包括:部分自相關係數;對數域比值;導抗頻譜對(IPS);及導抗頻譜頻率(ISF),以上均用於GSM(全球行動通信系統)AMR-WB(適應性多速率寬頻帶)編解碼器。通常,一組LP濾波器係數與一組對應LSF之間的轉換為可逆的,但是組態亦包括實施編碼器A120,其中轉換在無誤差之情況下不可逆。
量化器230經組態以量化該組窄頻帶LSF(或其他係數表示),且窄頻帶編碼器A122經組態以將此量化結果作為窄頻帶濾波器參數S40輸出。該量化器通常包括向量量化器,其將輸入向量編碼為在表或碼簿中之對應向量輸入項之指數。
如圖6中所見,窄頻帶編碼器A122亦藉由使窄頻帶訊號S20通過一白化濾波器260(亦稱為分析或預測誤差濾波器)來產生殘餘訊號,該白化濾波器260根據該組濾波器係數而組態。在此特定實例中,雖然亦可使用IIR實施,但白化濾波器260被實施為FIR濾波器。此殘餘訊號通常含有語音訊框之感知上重要的資訊(諸如關於音高之長期結構),其未表示在窄頻帶濾波器參數S40中。量化器270經組態以計算此殘餘訊號之量化表示以作為編碼窄頻帶激發訊號S50而輸出。該量化器通常包括向量量化器,其將輸入向量編碼為在表或碼簿中之對應向量輸入項之指數。或者,該量化器可經組態以發送一或多個參數,可在解碼器處自該等參數動態產生向量,而並非如稀疏碼簿方法中那樣自儲存器擷取。該方法用於諸如代數CELP(碼簿激發線性預測)之編碼機制中及諸如3GPP2(第三代合作夥伴2)EVRC(增強型可變速率編解碼器)之編解碼器中。
需要窄頻帶編碼器A120根據可用於對應窄頻帶解碼器之相同濾波器參數值來產生編碼窄頻帶激發訊號。以此方式,所得編碼窄頻帶激發訊號可已在某種程度上解決在彼等參數值中之非理想性,諸如量化誤差。因此,需要使用可用於解碼器處之相同系數值來組態白化濾波器。在如圖6中所示之編碼器A122之基本實例中,逆量化器240將窄頻帶編碼參數S40去量化,LSF至LP濾波器係數轉換250將所得值映射回一組對應LP濾波器係數,且將此組係數用於組態白化濾波器260以產生由量化器270量化之殘餘訊號。
窄頻帶編碼器A120之一些實施經組態以藉由識別一組碼簿向量中之最匹配殘餘訊號之向量來計算編碼窄頻帶激發訊號S50。然而,注意到,窄頻帶編碼器A120亦可經實施以計算殘餘訊號之量化表示,而實際上並不產生殘餘訊號。舉例而言,窄頻帶編碼器A120可經組態以使用許多碼簿向量來產生對應合成訊號(例如,根據一組當前濾波器參數),且在感知加權域中選擇最匹配原始窄頻帶訊號S20之與產生訊號相關的碼簿向量。
圖7展示窄頻帶解碼器B110之一實施B112之方塊圖。逆量化器310將窄頻帶濾波器參數S40去量化(在此情況下,去量化為一組LSF),且LSF至LP濾波器係數轉換320將LSF轉換為一組濾波器係數(例如,如上文參看窄頻帶編碼器A122之逆量化器240及轉換250所描述)。逆量化器340將窄頻帶殘餘訊號S40去量化以產生窄頻帶激發訊號S80。基於濾波器係數及窄頻帶激發訊號S80,窄頻帶合成濾波器330合成窄頻帶訊號S90。換言之,窄頻帶合成濾波器330經組態以根據該等經去量化之濾波器係數來頻譜定形窄頻帶激發訊號S80,以產生窄頻帶訊號S90。窄頻帶解碼器B112亦將窄頻帶激發訊號S80提供至高頻帶編碼器A200,該高頻帶編碼器A200使用激發訊號S80而得出如本文中所述之高頻帶激發訊號S120。在如下文所描述之一些實施中,窄頻帶解碼器B110可經組態以將與窄頻帶訊號相關之額外資訊提供至高頻帶解碼器B200,諸如頻譜傾角、音高增益及滯後及語音模式。
窄頻帶編碼器A122及窄頻帶解碼器B112之系統為合成式分析語音編解碼器之一基本實例。碼簿激發線性預測(CELP)編碼為一類風行的合成式分析編碼,且該等編碼器之實施可執行殘餘之波形編碼,包括諸如自固定及適應性碼簿選擇輸入項,誤差最小化操作及/或感知加權操作之該等操作。合成式分析編碼之其他實施包括混合激發線性預測(MELP)、代數CELP(ACELP)、鬆弛CELP(RCELP)、規則脈衝激發(RPE)、多脈衝CELP(MPE)及向量和激發線性預測(VSELP)編碼。相關編碼方法包括多頻帶激發(MBE)及原型波形內插(PWI)編碼。標準合成式分析語音編解碼器之實例包括:ETSI(歐洲電信標準學會)-GSM全速率編解碼器(GSM 06.10),其使用殘餘激發線性預測(RELP);GSM增強型全速率編解碼器(ETSI-GSM 06.60);ITU(國際電信聯合會)標準11.8 kb/s G.729附件E編碼器;用於IS-136(分時多向接取機制)之IS(臨時標準)-641編解碼器;GSM適應性多速率(GSM-AMR)編解碼器及4GVTM(第四代聲碼器TM )編解碼器(QUALCOMM Incorporated,San Diego,CA)。可根據此等技術中之任一技術,或將語音訊號表示為(A)描述濾波器之一組參數及(B)用於驅動所描述濾波器再生語音訊號之激發訊號的任何其他語音編碼技術(無論已知的還是待研發的)來實施窄頻帶編碼器A120及對應解碼器B110。
即使在白化濾波器已自窄頻帶訊號S20移除粗略頻譜包絡之後,仍可保留相當量之精密諧波結構(尤其對有聲語音而言)。圖8a展示諸如元音之有聲訊號之殘餘訊號(可由白化濾波器產生)之一實例的頻譜曲線。在此實例中可見之週期性結構與音高相關,且由相同說話者所說之不同有聲聲音可具有不同共振峰結構但具有類似音高結構。圖8b展示該殘餘訊號之一實例之時域曲線,其按時間展示音高脈衝之序列。
可藉由使用一或多個參數值來編碼音高結構之特徵而增加編碼效率及/或語音品質。音高結構之一重要特徵為第一諧波之頻率(亦稱為基礎頻率),其通常在60 Hz至400 Hz之範圍內。通常將此特徵編碼為基礎頻率之倒數(亦稱為音高滯後)。音高滯後指示在一音高週期中的樣本數目且可被編碼為一或多個碼簿指數。來自男性說話者之語音訊號傾向於比來自女性說話者之語音訊號具有更大音高滯後。
關於音高結構之另一訊號特徵為週期性,其指示諧波結構之強度,或換言之,訊號為調和或非調和之程度。週期性之兩個典型標誌為零交叉及正規化自相關函數(NACF)。週期性亦可由音高增益來指示,音高增益被編碼為碼簿增益(例如,經量化之適應性碼簿增益)。
窄頻帶編碼器A120可包括經組態以編碼窄頻帶訊號S20之長期諧波結構的一或多個模組。如圖9中所示,一可使用之典型CELP範例包括開路LPC分析模組,其編碼短期特徵或粗略頻譜包絡,接著為閉路長期預測分析階段,其編碼精密音高或諧波結構。短期特徵被編碼為濾波器係數,且長期特徵被編碼為諸如音高滯後及音高增益之參數值。舉例而言,窄頻帶編碼器A120可經組態成以包括一或多個碼簿指數(例如,固定碼簿指數及適應性碼簿指數)及對應增益值之形式輸出編碼窄頻帶激發訊號S50。對窄頻帶殘餘訊號之此量化表示之計算(例如,由量化器270進行)可包括選擇該等指數及計算該等值。對音高結構之編碼亦可包括內插音高原型波形,此操作可包括計算在連續音高脈衝之間的差。針對對應於無聲語音(其通常似雜訊且未結構化)之訊框,可禁用對長期結構之模型化。
根據如圖9中所示之範例之頻帶解碼器B110的實施可經組態以在已恢復長期結構(音高或諧波結構)之後,將窄頻帶激發訊號S80輸出至高頻帶解碼器B200。舉例而言,該解碼器可經組態以將窄頻帶激發訊號S80輸出為編碼窄頻帶激發訊號S50之經去量化之版本。當然,亦可能實施窄頻帶解碼器B110,使高頻帶解碼器B200執行編碼窄頻帶激發訊號S50之去量化,以獲得窄頻帶激發訊號S80。
在根據如圖9中所示之一範例之寬頻帶語音編碼器A100的實施中,高頻帶編碼器A200可經組態以接收由短期分析或白化濾波器產生之窄頻帶激發訊號。換言之,窄頻帶編碼器A120可經組態以在編碼長期結構之前,將窄頻帶激發訊號輸出至高頻帶編碼器A200。然而,需要高頻帶編碼器A200自窄頻帶通道接收將由高頻帶解碼器B200接收之相同的編碼資訊,使得由高頻帶編碼器A200產生之編碼參數可以在某種程度上解決該資訊中之非理想性。因此,宜使高頻帶編碼器A200,自待由寬頻帶語音編碼器A100輸出之同樣經參數化及/或量化之編碼窄頻帶激發訊號S50,重建窄頻帶激發訊號S80。此方法之一潛在優勢在於可更準確地計算下文描述之高頻帶增益因數S60b。
除表現窄頻帶訊號S20之短期及/或長期結構之特徵的參數之外,窄頻帶編碼器A120可產生關於窄頻帶訊號S20之其他特徵之參數值。此等值(可經適當量化以由寬頻帶語音編碼器A100輸出)可包括於窄頻帶濾波器參數S40中或被單獨輸出。高頻帶編碼器A200亦可經組態以根據此等額外參數中之一或多個參數來計算高頻帶編碼參數S60(例如,在去量化之後)。在寬頻帶語音解碼器B100處,高頻帶解碼器B200可經組態以經由窄頻帶解碼器B110接收參數值(例如,在去量化之後)。或者,高頻帶解碼器B200可經組態以直接接收(或可能去量化)參數值。
在額外窄頻帶編碼參數之一實例中,窄頻帶編碼器A120產生頻譜傾角值及每一訊框之語音模式參數。頻譜傾角與通頻帶上之頻譜包絡之形狀相關,且通常由經量化之第一反射係數表示。對大多數有聲聲音而言,頻譜能量隨頻率增加而降低,使得第一反射係數為負且可接近-1。大多數無聲聲音具有為平坦(使得第一反射係數接近零)或在高頻率處具有更多能量(使得第一反射係數為正且可接近+1)之頻譜。
語音模式(亦稱為發聲模式)指示當前訊框表示有聲語音還是無聲語音。此參數可具有二進位值,該值基於訊框之週期性(例如零交叉、NACF、音高增益)及/或語音活動的一或多個量測值,諸如該量測值與臨限值之間的關係。在其他實施中,語音模式參數具有一或多個其他狀態,以指示諸如靜默或背景雜訊,或靜默與有聲語音之間的過渡的模式。
高頻帶編碼器A200經組態以根據聲源-濾波器模型來編碼高頻帶訊號S30,其中用於此濾波器之激發係基於編碼窄頻帶激發訊號。圖10展示高頻帶編碼器A200之一實施A202之方塊圖,其經組態以產生一連串高頻帶編碼參數S60,該等參數包括高頻帶濾波器參數S60a及高頻帶增益因數S60b。高頻帶激發產生器A300自編碼窄頻帶激發訊號S50得出高頻帶激發訊號S120。分析模組A210產生表現高頻帶訊號S30之頻譜包絡之特徵的一組參數值。在此特定實例中,分析模組A210經組態以執行LPC分析,以產生用於高頻帶訊號S30之每一訊框之一組LP濾波器係數。線性預測濾波器係數至LSF轉換410將該組LP濾波器係數轉換為一組對應之LSF。如上文參看分析模組210及轉換220所強調,分析模組A210及/或轉換410可經組態以使用其他係數組(例如,倒頻譜系數)及/或係數表示(例如,ISP)。
量化器420經組態以量化該組高頻帶LSF(或其他係數表示,諸如ISP),且高頻帶編碼器A202經組態以將此量化結果輸出為高頻帶濾波器參數S60a。該量化器通常包括將輸入向量編碼為在表或碼簿中之對應向量輸入項之指數的向量量化器。
高頻帶編碼器A202亦包括一合成濾波器A220,其經組態以根據高頻帶激發訊號S120及由分析模組A210產生之編碼頻譜包絡(例如,該組LP濾波器係數)來產生合成高頻帶訊號S130。雖然亦可使用FIR實施,但合成濾波器A220通常被實施為IIR濾波器。在一特定實例中,合成濾波器A220被實施為六階線性自回歸濾波器。
高頻帶增益因數計算器A230計算在原始高頻帶訊號S30之位準與合成高頻帶訊號S130之位準之間的一或多個差,以指定用於訊框之增益包絡。量化器430(其可實施為將輸入向量編碼為表或碼簿中之對應向量輸入項之指數的向量量化器)量化指定增益包絡之值,且高頻帶編碼器A202經組態以將此量化結果輸出為高頻帶增益因數S60b。
在圖10中所示之一實施中,合成濾波器A220經配置以接收來自分析模組A210之濾波器係數。高頻帶編碼器A202之另一實施包括經組態以自高頻帶濾波器參數S60a解碼濾波器係數的逆量化器及逆轉換,且在此情況下,替代地,合成濾波器A220經配置以接收經解碼之濾波器係數。該替代配置可支援高頻帶增益計算器A230對增益包絡進行更準確之計算。
在一特定實例中,分析模組A210及高頻帶增益計算器A230分別輸出每訊框一組六個LSF與一組五個增益值,使得利用每訊框11個額外值可達成窄頻帶訊號S20之寬頻帶擴展。入耳傾向於對在高頻率處之頻率誤差較不敏感,使得在較低LPC階處之高頻帶編碼可產生具有可與在較高LPC階處之窄頻帶編碼相當之感知品質的訊號。高頻帶編碼器A200之一典型實施可經組態以輸出每訊框8至12位元以用於頻譜包絡之高品質重建,且輸出每訊框另外8至12位元以用於時間包絡之高品質重建。在另一特定實例中,分析模組A210對於每訊框輸出一組8個LSF。
高頻帶編碼器A200之一些實施經組態以藉由產生具有高頻帶頻率分量之隨機雜訊訊號且根據窄頻帶訊號S20、窄頻帶激發訊號S80或高頻帶訊號S30之時域包絡來振幅調變雜訊訊號,而產生高頻帶激發訊號S120。雖然該基於雜訊之方法可對於無聲聲音產生適當結果,然而,其對於有聲聲音可並非理想的,該等有聲聲音之殘餘通常為調和的且因此具有一些週期結構。
高頻帶激發產生器A300經組態以藉由將窄頻帶激發訊號S80之頻譜擴展至高頻帶頻率範圍內來產生高頻帶激發訊號S120。圖11展示高頻帶激發產生器A300之一實施A302之方塊圖。逆量化器450經組態以將編碼窄頻帶激發訊號S50去量化以產生窄頻帶激發訊號S80。頻譜擴展器A400經組態以基於窄頻帶激發訊號S80而產生調和擴展訊號S160。組合器470經組態以組合由雜訊產生器480產生之隨機雜訊訊號及由包絡計算器460計算得之時域包絡,以產生調變雜訊訊號S170。組合器490經組態以混合調和擴展訊號S60與調變雜訊訊號S170以產生高頻帶激發訊號S120。
在一實例中,頻譜擴展器A400經組態以對窄頻帶激發訊號S80執行頻譜摺疊操作(亦稱為鏡射),以產生調和擴展訊號S160。頻譜摺疊可藉由補零激發訊號S80且接著應用高通濾波器以保留鋸齒來執行。在另一實例中,頻譜擴展器A400經組態以藉由將窄頻帶激發訊號S80頻譜轉化為高頻帶(例如,經由升取樣,接著與恆定頻率餘弦訊號相乘)來產生調和擴展訊號S160。
頻譜摺疊及轉化方法可產生頻譜擴展訊號,其調和結構與窄頻帶激發訊號S80之原始調和結構在相位及/或頻率方面不連續。舉例而言,該等方法可產生峰值通常不位於基礎頻率倍數處的訊號,此可在重建之語音訊號中導致金屬音(tinny-sounding)假影。該等方法亦傾向於產生具有非自然強音調特徵之高頻率諧波。此外,因PSTN訊號可以8 kHz取樣但頻帶限制於不超過3400 Hz,故窄頻帶激發訊號S80之上部頻譜可含有少量能量或無能量,使得根據頻譜摺疊或頻譜轉化操作而產生之擴展訊號可具有在3400 Hz之上之頻譜空洞。
產生調和擴展訊號S160之其他方法包括識別窄頻帶激發訊號S80之一或多個基礎頻率及根據該資訊產生調和音調。舉例而言,激發訊號之諧波結構之特徵可為結合振幅及相位資訊之基礎頻率。高頻帶激發產生器A300之另一實施基於基礎頻率及振幅(如例如由音高滯後及音高增益來指示)來產生調和擴展訊號S160。然而,除非調和擴展訊號與窄頻帶激發訊號S80相位相干,否則所得解碼語音之品質可能為不可接受的。
非線性函數可用於產生與窄頻帶激發相位相干且保留諧波結構而無相位不連續性之高頻帶激發訊號。非線性函數亦可在高頻率諧波之間提供增加之雜訊位準,其傾向於比由諸如頻譜摺疊及頻譜轉化之方法產生之高頻率音調諧波聽起來更自然。可由頻譜擴展器A400之多種實施應用之典型無記憶非線性函數包括絕對值函數(亦稱為全波整流)、半波整流、乘方、立方及截割。頻譜擴展器A400之其他實施可經組態以應用具有記憶之非線性函數。
圖12為頻譜擴展器A400之一實施A402之方塊圖,其經組態以應用非線性函數以擴展窄頻帶激發訊號S80之頻譜。升取樣器510經組態以升取樣窄頻帶激發訊號S80。可能需要充分升取樣該訊號以最小化在應用非線性函數時之鋸齒。在一特定實例中,升取樣器510以因數8來升取樣訊號。升取樣器510可經組態以藉由對輸入訊號補零及低通濾波該結果來執行升取樣操作。非線性函數計算器520經組態以將非線性函數應用於經升取樣之訊號。絕對值函數相比於用於頻譜擴展之其他非線性函數(諸如乘方)之潛在優勢為其不需要能量正規化。在一些實施中,藉由除去或清除每一樣本之符號位元,可有效應用絕對值函數。非線性函數計算器520亦可經組態以對經升取樣或頻譜擴展之訊號執行振幅彎曲(amplitude warping)。
降取樣器530經組態以降取樣應用非線性函數之頻譜擴展結果。可需要降取樣器530在降低取樣率之前執行帶通濾波操作以選擇頻譜擴展訊號之所要頻帶(例如,以減小或避免由不當影像造成之鋸齒或惡化)。亦可需要降取樣器530在一個以上階段中降低取樣率。
圖12a為展示在頻譜擴展操作之一實例中各點處之訊號頻譜的圖,其中頻率比例在各個曲線上相同。曲線(a)展示窄頻帶激發訊號S80之一實例之頻譜。曲線(b)展示訊號S80在以因數8升取樣之後的頻譜。曲線(c)展示在應用非線性函數之後的擴展頻譜之一實例。曲線(d)展示在低通濾波之後的頻譜。在此實例中,通頻帶擴展至高頻帶訊號S30之頻率上限(例如,7 kHz或8 kHz)。
曲線(e)展示在降取樣之第一階段之後的頻譜,其中取樣率降低四倍以獲得寬頻帶訊號。曲線(f)展示在進行高通濾波操作以選擇擴展訊號之高頻帶部分之後的頻譜,且曲線(g)展示在降取樣之第二階段之後的頻譜,其中取樣率降低兩倍。在一特定實例中,降取樣器530藉由使寬頻帶訊號通過濾波器組A112之高通濾波器130及降取樣器140(或具有相同響應之其他結構或常用程序)來執行高通濾波及降取樣之第二階段,以產生具有高頻帶訊號S30之頻率範圍及取樣率的頻譜擴展訊號。
如在曲線(g)中所見,在曲線(f)中展示之高通訊號之降取樣引起其頻譜反轉。在此實例中,降取樣器530亦經組態以對訊號執行頻譜變向操作。曲線(h)展示應用頻譜變向操作之結果,該頻譜變向操作可藉由使訊號與函數e jnπ 或序列(-1)n (其值在+1與-1之間交替)相乘而執行。該操作等同於在頻域中將訊號之數位頻譜移位π之距離。注意到,相同結果亦可藉由以不同順序應用降取樣操作及頻譜變向操作而獲得。升取樣及/或降取樣之操作亦可經組態以包括重取樣,以獲得具有高頻帶訊號S30之取樣率(例如,7 kHz)之頻譜擴展訊號。
如上文所強調,濾波器組A110及B120可經實施以使得窄頻帶訊號S20及高頻帶訊號S30中之一或兩者在濾波器組A110之輸出處具有頻譜反轉形式,以頻譜反轉形式被編碼及解碼,且在寬頻帶語音訊號S110中輸出之前再次在濾波器組B120處被頻譜反轉。當然,在該情況下,因為需要高頻帶激發訊號S120同樣具有頻譜反轉形式,故可不實施如圖12a中所示之頻譜變向操作。
由頻譜擴展器A402執行之頻譜擴展操作之升取樣及降取樣的各種任務可以許多不同方式加以組態及配置。舉例而言,圖12b為展示頻譜擴展操作之另一實例中各個點處之訊號頻譜的圖,其中頻率比例在各個曲線上相同。曲線(a)展示窄頻帶激發訊號S80之一實例之頻譜。曲線(b)展示訊號S80在以因數2升取樣之後的頻譜。曲線(c)展示在應用一非線性函數之後的擴展頻譜之一實例。在此情況下,接受可能發生於較高頻率中之鋸齒。
曲線(d)展示在頻譜反轉操作之後的頻譜。曲線(e)展示在單階段降取樣之後的頻譜,其中取樣率降低兩倍以獲得所要頻譜擴展訊號。在此實例中,訊號為頻譜反轉形式且可用於以該形式處理高頻帶訊號S30之高頻帶編碼器A200的一實施中。
由非線性函數計算器520產生之頻譜擴展訊號之振幅可能會隨著頻率增加而明顯下降。頻譜擴展器A402包括一頻譜平化器540,其經組態以對降取樣訊號執行白化操作。頻譜平化器540可經組態以執行固定白化操作或執行適應性白化操作。在適應性白化之一特定實例中,頻譜平化器540包括:一LPC分析模組,其經組態以自降取樣訊號計算一組四個濾波器係數;及一四階分析濾波器,其經組態以根據彼等係數來白化該訊號。頻譜擴展器A400之其他實施包括其中頻譜平化器540在降取樣器530之前對頻譜擴展訊號進行操作的組態。
高頻帶激發產生器A300可經實施以將調和擴展訊號S160輸出為高頻帶激發訊號S120。然而,在一些情況下,將調和擴展訊號用作高頻帶激發可導致可聽假影。語音之諧波結構在高頻帶中通常沒有在低頻帶中明顯,且在高頻帶激發訊號中使用過多諧波結構可導致嗡嗡聲。此假影可在來自女性說話者之語音訊號中尤為明顯。
組態包括經組態以將調和擴展訊號S160與雜訊訊號混合之高頻帶激發產生器A300的實施。如圖11中所示,高頻帶激發產生器A302包括一雜訊產生器480,其經組態以產生隨機雜訊訊號。在一實例中,雖然在其他實施中雜訊訊號無需白化且可具有隨頻率變化之功率密度,但雜訊產生器480經組態以產生單位方差白偽隨機雜訊訊號。可需要雜訊產生器480經組態以將雜訊訊號輸出為確定性函數,使得其狀態可在解碼器處被複製。舉例而言,雜訊產生器480可經組態以將雜訊訊號輸出為相同訊框內早先編碼之資訊(諸如窄頻帶濾波器參數S40及/或編碼窄頻帶激發訊號S50)的確定性函數。
在與調和擴展訊號S160混合之前,由雜訊產生器480產生之隨機雜訊訊號可經振幅調變以具有時域包絡,該時域包絡近似於窄頻帶訊號S20、高頻帶訊號S30、窄頻帶激發訊號S80或調和擴展訊號S160之時間上的能量分布。如圖11中所示,高頻帶激發產生器A302包括一組合器470,其經組態以根據由包絡計算器460計算出之時域包絡來振幅調變由雜訊產生器480產生的雜訊訊號。舉例而言,組合器470可被實施為乘法器,其經配置以根據由包絡計算器460計算出之時域包絡來按比例調整雜訊產生器480之輸出,以產生調變雜訊訊號S170。
在高頻帶激發產生器A302之一實施A304中(如圖13之方塊圖中所示),包絡計算器460經配置以計算調和擴展訊號S160之包絡。在高頻帶激發產生器A302之實施A306中(如圖14之方塊圖中所示),包絡計算器460經配置以計算窄頻帶激發訊號S80之包絡。高頻帶激發產生器A302之另一實施可另外經組態以根據窄頻帶音高脈衝在時間上之位置將雜訊添加至調和擴展訊號S160。
包絡計算器460可經組態以將包絡計算執行為包括一系列子任務之任務。圖15展示該任務之一實例T100之流程圖。子任務T110計算其包絡待模型化之訊號(例如,窄頻帶激發訊號S80或調和擴展訊號S160)之訊框之每一樣本的平方,以產生平方值之序列。子任務T120對該序列之平方值執行平滑操作。在一實例中,子任務T120根據以下陳述式將一階IIR低通濾波應用於該序列:y (n )=ax (n )+(1-a )y (n -1), (1)其中x為濾波器輸入,y為濾波器輸出,n為時域指數,且a為具有在0.5與1之間的值的平滑係數。平滑係數之值可為固定的,或在一替代實施中,該值根據在輸入訊號中雜訊之指示可為適應性的,使得a在存在雜訊時較接近1且在不存在雜訊時較接近0.5。子任務T130將平方根函數應用於平滑化序列之每一樣本以產生時域包絡。
包絡計算器460之此實施可經組態以用連續及/或並行方式來執行任務T100之各個子任務。在任務T100之另外實施中,子任務T110可在經組態以選擇其包絡待模型化之訊號之所要頻率部分(諸如3 kHz至4 kHz之範圍)的帶通操作之後進行。
組合器490經組態以混合調和擴展訊號S160與調變雜訊訊號S170以產生高頻帶激發訊號S120。組合器490之實施可經組態以(例如)將高頻帶激發訊號S120計算為調和擴展訊號S160與調變雜訊訊號S170之和。組合器490之該實施可經組態以在求和之前藉由將加權因數施加於調和擴展訊號S160及/或調變雜訊訊號S170來將高頻帶激發訊號S120計算為加權和。該每一加權因數可根據一或多個準則加以計算且可為固定值或者為基於逐個訊框或逐個子訊框而計算出之適應性值。
圖16展示組合器490之一實施492之方塊圖,其經組態以將高頻帶激發訊號S120計算為調和擴展訊號S160與調變雜訊訊號S170之加權和。組合器492經組態以根據調和加權因數S180來對調和擴展訊號S160加權,根據雜訊加權因數S190來對調變雜訊訊號S170加權,及將高頻帶激發訊號S120輸出為加權訊號之和。在此實例中,組合器492包括一加權因數計算器550,其經組態以計算調和加權因數S180及雜訊加權因數S190。
加權因數計算器550可經組態以根據在高頻帶激發訊號S120中諧波含量與雜訊含量之所要比率來計算加權因數S180及S190。舉例而言,可能需要組合器492產生具有類似於高頻帶訊號S30之諧波能量與雜訊能量之比率的諧波能量與雜訊能量之比率的高頻帶激發訊號S120。在加權因數計算器550之一些實施中,加權因數S180、S190係根據關於窄頻帶訊號S20或窄頻帶殘餘訊號之週期性之一或多個參數(諸如音高增益及/或語音模式)而進行計算。加權因數計算器550之該實施可經組態以對(例如)調和加權因數S180指派與音高增益成比例之值,及/或對用於無聲語音訊號之雜訊加權因數S190指派一值,該值高於用於有聲語音訊號之雜訊加權因數的值。
在其他實施中,加權因數計算器550經組態以根據高頻帶訊號S30之週期性度量來計算調和加權因數S180及/或雜訊加權因數S190之值。在該實例中,加權因數計算器550將調和加權因數S180計算為用於當前訊框或子訊框之高頻帶訊號S30之自相關係數的最大值,其中自相關在包括一個音高滯後之延遲但不包括零樣本之延遲的搜索範圍內執行。圖17展示具有n個樣本之長度的該搜索範圍之一實例,該搜索範圍以一個音高滯後之延遲為中心且具有不大於一個音高滯後之寬度。
圖17亦展示另一方法之實例,其中加權因數計算器550在若干階段中計算高頻帶訊號S30之週期性度量。在第一階段中,當前訊框被分成許多子訊框,且對於每一子訊框獨立識別自相關係數為最大值之延遲。如上所提及,自相關在包括一個音高滯後之延遲但不包括零樣本之延遲的搜索範圍內執行。
在第二階段中,延遲訊框係藉由將對應的所識別之延遲應用於每一子訊框,串連所得子訊框以建構最佳延遲訊框,且將調和加權因數S180計算為在原始訊框與最佳延遲訊框之間的相關係數而建構。在另一替代方法中,加權因數計算器550將調和加權因數S180計算為在第一階段中為每一子訊框獲得之最大自相關係數的平均值。加權因數計算器550之實施亦可經組態以按比例調整相關係數及/或將其與另一值組合以計算調和加權因數S180之值。
在以其他方式指示了在訊框中存在週期性之情況下,可需要加權因數計算器550來計算高頻帶訊號S30之週期性度量。舉例而言,加權因數計算器550可經組態以根據在當前訊框之週期性的另一指示器(諸如音高增益)與一臨限值之間的關係來計算高頻帶訊號S30之週期性度量。在一實例中,加權因數計算器550經組態以在訊框之音高增益(例如,窄頻帶殘餘之適應性碼簿增益)具有大於0.5(或至少為0.5)之值的情況下對高頻帶訊號S30執行自相關操作。在另一實例中,加權因數計算器550經組態以針對具有語音模式之特定狀態(例如,有聲訊號)的訊框而對高頻帶訊號S30執行自相關操作。在該等情形下,加權因數計算器550可經組態以對具有語音模式之其他狀態及/或更低的音高增益值的訊框指派預設加權因數。
組態包括經組態以根據不同於週期性的特徵或除週期性之額外特徵來計算加權因數的加權因數計算器550之其他實施。舉例而言,該實施可經組態以對用於具有較大音高滯後之語音訊號的雜訊增益因數S190指派一值,該值高於對用於具有較小音高滯後之語音訊號的雜訊增益因數指派之值。加權因數計算器550之該另一實施經組態以根據在基礎頻率之倍數處之訊號能量相對於在其他頻率分量處之訊號能量的度量來確定寬頻帶語音訊號S10或高頻帶訊號S30之調和性度量。
寬頻帶語音編碼器A100之一些實施經組態以基於本文中所描述之音高增益及/或另一週期性或調和性度量來輸出週期性或調和性之指示(例如,指示訊框為調和還是非調和之一位元旗標)。在一實例中,一對應寬頻帶語音解碼器B100使用此指示以組態諸如加權因數計算之操作。在另一實例中,該指示在編碼器及/或解碼器處用於計算語音模式參數值。
可需要高頻帶激發產生器A302產生高頻帶激發訊號S120,使得激發訊號之能量大體上不受加權因數S180及S190之特定值的影響。在該情形下,加權因數計算器550可經組態以計算調和加權因數S180或雜訊加權因數S190之值(或接收來自高頻帶編碼器A200之儲存器或另一元件之該值),且根據如下陳述式得出另一加權因數值:(W hamonic )2 +(W noise )2 =1, (2)其中W harmonic 表示調和加權因數S180,且W noise 表示雜訊加權因數S190。或者,加權因數計算器550可經組態以根據當前訊框或子訊框之週期性度量之值來選擇在複數對加權因數S180、S190中之一對應對,其中該等對經預先計算以滿足諸如陳述式(2)之恆定能量比。對於其中觀察到陳述式(2)之加權因數計算器550之一實施而言,調和加權因數S180之典型值在約0.7至約1.0的範圍內,且雜訊加權因數S190之典型值在約0.1至約0.7的範圍內。加權因數計算器550之其他實施可經組態以根據陳述式(2)之一版本而運作,該版本係根據在調和擴展訊號S160與調變雜訊訊號S170之間的所要基線加權而修改得出。
當將稀疏碼簿(其輸入項大多為零值)用於計算殘餘之量化表示時,在合成語音訊號中可能出現假影。碼簿稀疏尤其會在以低位元率編碼窄頻帶訊號時發生。由碼簿稀疏引起之假影通常在時間上為準週期性的,且大多發生在3 kHz以上。因人耳在較高頻率時具有較佳時間解析度,故此等假影在高頻帶中可能更顯著。
組態包括經組態以執行反稀疏濾波之高頻帶激發產生器A300之實施。圖18展示高頻帶激發產生器A302之一實施A312之方塊圖,其包括一反稀疏濾波器600,該反稀疏濾波器600經配置以過濾由逆量化器450產生之去量化窄頻帶激發訊號。圖19展示高頻帶激發產生器A302之一實施A314之方塊圖,其包括一反稀疏濾波器600,該反稀疏濾波器600經配置以過濾由頻譜擴展器A400產生之頻譜擴展訊號。圖20展示高頻帶激發產生器A302之一實施A316之方塊圖,其包括一反稀疏濾波器600,該反稀疏濾波器600經配置以過濾組合器490之輸出以產生高頻帶激發訊號S120。當然,亦預期且在本文中明確揭示將實施A304及A306中之任一者之特徵與實施A312、A314及A316中之任一者之特徵組合在一起的高頻帶激發產生器A300之實施。反稀疏濾波器600亦可配置於頻譜擴展器A400內:舉例而言,在頻譜擴展器A402中之元件510、520、530及540之任一元件之後。明確注意到,反稀疏濾波器600亦可與執行頻譜摺疊、頻譜轉換或調和擴展之頻譜擴展器A400之實施一起使用。
反稀疏濾波器600亦可經組態以改變其輸入訊號之相位。舉例而言,可需要反稀疏濾波器600經組態及配置以使得高頻帶激發訊號S120之相位在時間上被隨機化,或者被更平均地分布。亦可需要反稀疏濾波器600之響應係頻譜上平坦的,使得經過濾之訊號之量值頻譜並未明顯改變。在一實例中,反稀疏濾波器600被實施為具有根據以下陳述式之傳送函數的全通濾波器: 此濾波器之一作用在於可展開輸入訊號之能量,使得其不再集中於較少樣本中。
由碼簿稀疏性引起之假影通常對似雜訊訊號更顯著,其中殘餘包括較少音高資訊,且對背景雜訊中之語音亦如此。在激發具有長期結構之情況下,稀疏通常引起較少假影,且實際上相位修改可引起在有聲訊號中之雜訊。因此,可需要組態反稀疏濾波器600以過濾無聲訊號且使至少一些有聲訊號在不發生改變之情況下通過。無聲訊號之特徵在於低音高增益(例如,量化之窄頻帶適應性碼簿增益)及接近零或為正的頻譜傾角(例如,量化之第一反射係數),此頻譜傾角表明頻譜包絡隨頻率增加為平坦或向上傾斜的。反稀疏濾波器600之典型實施經組態以過濾無聲聲音(例如,如由頻譜傾角之值所指示),在音高增益低於臨限值(或不大於臨限值)時過濾有聲聲音,且否則使訊號在不發生改變之情況下通過。
反稀疏濾波器600之其他實施包括兩個或兩個以上濾波器,該等濾波器經組態以具有不同之最大相位修改角(例如,高達180度)。在該情況下,反稀疏濾波器600可經組態以根據音高增益(例如,量化適應性碼簿或LTP增益)之值而在此等組成濾波器中進行選擇,使得將一較大之最大相位修改角用於具有較低音高增益值之訊框。反稀疏濾波器600之一實施亦包括不同之組成濾波器,其經組態以在頻譜之或多或少之範圍內修改相位,使得將經組態以在輸入訊號之較寬頻率範圍內修改相位之濾波器用於具有較低音高增益值的訊框。
對於編碼語音訊號之準確複製而言,可需要在合成寬頻帶語音訊號S100之高頻帶部分的位準與窄頻帶部分的位準之間的比率類似於其在原始寬頻帶語音訊號S10中之比率。除了由高頻帶編碼參數S60a表示之頻譜包絡以外,高頻帶編碼器A200可經組態以藉由指定時間或增益包絡來表現高頻帶訊號S30之特徵。如圖10中所示,高頻帶編碼器A202包括一高頻帶增益因數計算器A230,其經組態及配置以根據在高頻帶訊號S30與合成高頻帶訊號S130之間的關係(諸如兩個訊號在一訊框或其某部分內之能量之間的差或比率)來計算一或多個增益因數。在高頻帶編碼器A202之其他實施中,高頻帶增益計算器A230可經類似地組態但經配置以根據在高頻帶訊號S30與窄頻帶激發訊號S80或高頻帶激發訊號S120之間的該時變關係來計算增益包絡。
窄頻帶激發訊號S80之時間包絡與高頻帶訊號S30之時間包絡可能為類似的。因此,編碼基於在高頻帶訊號S30與窄頻帶激發訊號S80(或自其得出之訊號,諸如高頻帶激發訊號S120或合成高頻帶訊號S130)之間的關係之增益包絡通常比編碼基於高頻帶訊號S30之增益包絡更有效。在一典型實施中,高頻帶編碼器A202經組態以輸出對於每一訊框指定五個增益因數之具有8至12位元之經量化指數。
高頻帶增益因數計算器A230可經組態以將增益因數計算執行為包括一或多個系列之子任務的任務。圖21展示該任務之一實例T200之流程圖,該任務根據高頻帶訊號S30與合成高頻帶訊號S130之相對能量來計算對應子訊框之增益值。任務220a及220b計算各別訊號之對應子訊框之能量。舉例而言,任務220a及220b可經組態以將該能量計算為各別子訊框之樣本之平方的和。任務T230將子訊框之增益因數計算為彼等能量之比率的平方根。在此實例中,任務T230將增益因數計算為在子訊框內高頻帶訊號S30之能量與合成高頻帶訊號S130之能量之比率的平方根。
可需要高頻帶增益因數計算器A230經組態以根據成窗函數來計算子訊框能量。圖22展示增益因數計算任務T200之該實施T210之流程圖。任務T215a將成窗函數應用於高頻帶訊號S30,且任務T215b將相同成窗函數應用於合成高頻帶訊號S130。任務220a及220b之實施222a及222b計算各別窗之能量,且任務T230將子訊框之增益因數計算為能量比率之平方根。
可需要應用覆蓋相鄰子訊框之成窗函數。舉例而言,產生可以覆蓋相加方式應用之增益因數的成窗函數可有助於減少或避免在子訊框之間的不連續性。在一實例中,高頻帶增益因數計算器A230經組態以應用如圖23a中所示之梯形成窗函數,其中該窗覆蓋兩個相鄰子訊框之中每一子訊框達1毫秒。圖23b展示將此成窗函數應用至20毫秒訊框之五個子訊框中之每一子訊框。高頻帶增益因數計算器A230之其他實施可經組態以應用具有不同覆蓋週期及/或可為對稱或不對稱之不同窗形狀(例如矩形、漢明)的成窗函數。高頻帶增益因數計算器A230之一實施亦可能經組態以將不同成窗函數應用於一訊框內之不同子訊框,及/或一訊框亦可能包括具有不同長度之子訊框。
在無限制之情況下,將以下值表示為特定實施之實例。雖然可使用任何其他持續時間,但對於此等情況採用20毫秒之訊框。對以7 kHz取樣之高頻帶訊號而言,每一訊框均具有140個樣本。若將該訊框劃分為長度相等之五個子訊框,則每一子訊框皆具有28個樣本,且在圖23a中所示之窗將為42個樣本寬。對以8 kHz取樣之高頻帶訊號而言,每一訊框皆具有160個樣本。若將該訊框劃分為長度相等之五個子訊框,則每一子訊框皆具有32個樣本,且在圖23a中所示之窗將為48個樣本寬。在其他實施中,可使用任何寬度之子訊框,且高頻帶增益計算器A230之一實施甚至可能經組態以對一訊框之每一樣本產生不同增益因數。
圖24展示高頻帶解碼器B200之一實施B202之方塊圖。高頻帶解碼器B202包括一高頻帶激發產生器B300,其經組態以基於窄頻帶激發訊號S80產生高頻帶激發訊號S120。視特定系統設計選擇而定,高頻帶激發產生器B300可根據本文中所描述之高頻帶激發產生器A300之任一實施而加以實施。通常需要實施高頻帶激發產生器B300以與特定編碼系統之高頻帶編碼器之高頻帶激發產生器具有相同響應。然而,因窄頻帶解碼器B110通常執行編碼窄頻帶激發訊號S50之去量化,故在大多數情況下,高頻帶激發產生器B300可經實施以接收來自窄頻帶解碼器B110之窄頻帶激發訊號S80,且無需包括經組態以去量化編碼窄頻帶激發訊號S50之逆量化器。窄頻帶解碼器B110亦可能經實施以包括反稀疏濾波器600之一實體,該反稀疏濾波器600經配置以在去量化窄頻帶激發訊號被輸入至窄頻帶合成濾波器(諸如濾波器330)之前對其進行過濾。
逆量化器560經組態以對高頻帶濾波器參數S60a去量化(在此實例中,去量化為一組LSF),且LSF至LP濾波器係數轉換570經組態以將LSF轉換為一組濾波器係數(例如,如上文參看窄頻帶編碼器A122之逆量化器240及轉換250所描述)。如上文所提及,在其他實施中,可使用不同係數組(例如,倒頻譜系數)及/或係數表示(例如,ISP)。高頻帶合成濾波器B200經組態以根據高頻帶激發訊號S120及該組濾波器係數來產生合成高頻帶訊號。對於其中高頻帶編碼器包括合成濾波器之系統而言(例如,如在上文所描述之編碼器A202之實例中),可需要實施高頻帶合成濾波器B200以與該合成濾波器具有相同響應(例如,相同傳送函數)。
高頻帶解碼器B202亦包括:一逆量化器580,其經組態以去量化高頻帶增益因數S60b;及一增益控制元件590(例如,乘法器或放大器),其經組態及配置以將去量化增益因數應用於合成高頻帶訊號,以產生高頻帶訊號S100。對其中訊框之增益包絡由一個以上增益因數指定之情況而言,增益控制元件590可包括邏輯,該邏輯經組態以可能根據與由對應高頻帶編碼器之增益計算器(例如,高頻帶增益計算器A230)所應用之成窗函數相同或不同的成窗函數將增益因數應用於各別子訊框。在高頻帶解碼器B202之其他實施中,增益控制元件590經類似組態但經配置以將經去量化增益因數應用於窄頻帶激發訊號S80或高頻帶激發訊號S120。
如上文所提及,可需要在高頻帶編碼器及高頻帶解碼器中獲得相同狀態(例如,藉由在編碼期間使用去量化值)。因此,在根據該實施之編碼系統中,可需要確保在高頻帶激發產生器A300及B300中之對應雜訊產生器之狀態相同。舉例而言,該實施之高頻帶激發產生器A300及B300可經組態以使得雜訊產生器之狀態為已在相同訊框內編碼之資訊(例如,窄頻帶濾波器參數S40或其一部分及/或編碼窄頻帶激發訊號S50或其一部分)的確定性函數。
本文中所描述之元件之量化器中之一或多者(例如,量化器230、420或430)可經組態以執行分類向量量化。舉例而言,該量化器可經組態以基於已在窄頻帶通道及/或高頻帶通道中之相同訊框內編碼之資訊來選擇一組碼簿中之一碼簿。該技術通常以犧牲額外碼簿儲存為代價來增加編碼效率。
如上文參看(例如)圖8及圖9所論述,在將粗略頻譜包絡自窄頻帶語音訊號S20移除之後,相當數量之週期結構可仍保留於殘餘訊號中。舉例而言,殘餘訊號可含有時間上之約略週期脈衝或峰值之序列。該結構(其通常與音高相關)尤其可能發生於有聲語音訊號中。對窄頻帶殘餘訊號之量化表示的計算可包括根據由(例如)一或多個碼簿表示之長期週期性模型來編碼此音高結構。
一實際殘餘訊號之音高結構可並非與週期性模型完全匹配。舉例而言,殘餘訊號可在音高脈衝之位置之規律性中包括小抖動,使得在訊框中之連續音高脈衝之間的距離不完全相等且該結構並不非常規律。此等不規律性傾向於降低編碼效率。
窄頻帶編碼器A120之一些實施可經組態以藉由在量化之前或量化期間將適應性時間彎曲應用於殘餘,或藉由另外在編碼激發訊號中包括適應性時間彎曲來執行音高結構之規律化。舉例而言,該編碼器可經組態以選擇或否則計算時間中彎曲之程度(例如,根據一或多個感知加權及/或誤差最小化準則),使得所得激發訊號最佳符合長期週期性模型。音高結構之規律化係由稱為鬆弛碼激發線性預測(RCELP)編碼器之一子組CELP編碼器而執行。
RCELP編碼器通常經組態以將時間彎曲執行為一適應性時間移位。此時間移位可為自負的若干毫秒至正的若干毫秒範圍內之延遲,且其通常平滑地變化以避免可聽不連續性。在一些實施中,該編碼器經組態以用分段形式來應用該規律化,其中每一訊框或子訊框係由對應固定時間移位而彎曲。在其他實施中,編碼器經組態以將規律化施加為連續彎曲函數,使得訊框或子訊框根據音高周線(亦稱為音高軌線)而被彎曲。在一些情況下,編碼器經組態以藉由將移位應用於用於計算編碼激發訊號之感知加權輸入訊號而在編碼激發訊號中包括時間彎曲。
編碼器計算經規律化及量化之編碼激發訊號,且解碼器對編碼激發訊號去量化以獲得用於合成解碼語音訊號之激發訊號。因此,解碼輸出訊號展現與經由規律化而包括於編碼激發訊號中之變化的延遲相同的變化的延遲。通常,並無指定規律化量之資訊被傳輸至解碼器。
規律化傾向於使殘餘訊號更易於編碼,此改良來自長期預測器之編碼增益,且因此提高整體編碼效率,而通常不產生假影。可需要僅對有聲訊框執行規律化。舉例而言,窄頻帶編碼器A124可經組態以僅移位具有長期結構之彼等訊框或子訊框(諸如有聲訊號)。甚至可需要對包括音高脈衝能量之子訊框執行規律化。RCELP編碼器之現有實施包括如電信行業協會(TIA)IS-127中所描述之增強型可變速率編解碼器(EVRC),及第三代合作夥伴項目2(3GPP2)可選模式聲碼器(SMV)。
不幸的是,規律化可對其中高頻帶激發係得自編碼窄頻帶激發訊號之寬頻帶語音編碼器造成問題(諸如包括寬頻帶語音編碼器A100及寬頻帶語音解碼器B100之系統)。由於其係得自經時間彎曲之訊號,故高頻帶激發訊號通常具有不同於原始高頻帶語音訊號之時間剖面的時間剖面。換言之,高頻帶激發訊號將不再與原始高頻帶語音訊號同步。
在經彎曲高頻帶激發訊號與原始高頻帶語音訊號之間的時間未對準可引起若干問題。舉例而言,經彎曲的高頻帶激發訊號可不再為根據自原始高頻帶語音訊號擷取之濾波器參數而組態之合成濾波器提供合適源激發。結果,合成高頻帶訊號可含有降低解碼寬頻帶語音訊號之感知品質的可聽假影。
時間未對準亦可引起增益包絡編碼之無效率。如上文所提及,在窄頻帶激發訊號S80之時間包絡與高頻帶訊號S30之時間包絡之間可能存在相關性。藉由根據在該兩個時間包絡之間的關係來編碼高頻帶訊號之增益包絡,與直接編碼增益包絡相比,可實現編碼效率之增加。然而,當編碼窄頻帶激發訊號經規律化時,可減弱此相關性。在窄頻帶激發訊號S80與高頻帶訊號S30之間的時間未對準可導致在高頻帶增益因數S60b中出現波動,且編碼效率可下降。
組態包括寬頻帶語音編碼方法,其根據包括於對應編碼窄頻帶激發訊號中之時間彎曲來執行高頻帶語音訊號之時間彎曲。該等方法之潛在優勢包括改良解碼寬頻帶語音訊號之品質及/或改良編碼高頻帶增益包絡之效率。
圖25展示寬頻帶語音編碼器A100之一實施AD10之方塊圖。編碼器AD10包括窄頻帶編碼器A120之一實施A124,其經組態以在計算編碼窄頻帶激發訊號S50期間執行規律化。舉例而言,窄頻帶編碼器A124可根據上文論述之RCELP實施中之一或多個實施而被組態。
窄頻帶編碼器A124亦經組態以輸出指定所應用之時間彎曲程度的規律化資料訊號SD10。對其中窄頻帶編碼器A124經組態以將固定時間移位應用於每一訊框或子訊框的各種情況而言,規律化資料訊號SD10可包括一系列值,該等值將每一時間移位量指示為整數或非整數值(以樣本、毫秒或一些其他時間增量為單位)。對其中窄頻帶編碼器A124經組態以用其他方式修改訊框或樣本之其他序列的時間比例(例如,藉由壓縮一部分且擴展另一部分)的情況而言,規律化資訊訊號SD10可包括該修改之對應描述,諸如一組函數參數。在一特定實例中,窄頻帶編碼器A124經組態以將一訊框劃分為三個子訊框且計算每一子訊框之固定時間移位,使得規律化資料訊號SD10指示編碼窄頻帶訊號之每一規律化訊框的三個時間移位量。
寬頻帶語音編碼器AD10包括一延遲線D120,其經組態以根據由輸入訊號指示之延遲量來推進或阻滯高頻帶語音訊號S30之部分,以產生經時間彎曲的高頻帶語音訊號S30a。在圖25中所示之實例中,延遲線D120經組態以根據由規律化資料訊號SD10指示之彎曲來對高頻帶語音訊號S30進行時間彎曲。以此方式,包括於編碼窄頻帶激發訊號S50中之相同量的時間彎曲亦在分析之前被應用於高頻帶語音訊號S30之對應部分。雖然此實例將延遲線D120展示為獨立於高頻帶編碼器A200之元件,但在其他實施中,延遲線D120經配置為高頻帶編碼器之部分。
高頻帶編碼器A200之另外實施可經組態以執行未彎曲高頻帶語音訊號S30之頻譜分析(例如,LPC分析),且在計算高頻帶增益參數S60b之前執行高頻帶語音訊號S30之時間彎曲。該編碼器可包括(例如)經配置以執行時間彎曲之延遲線D120之實施。然而,在該等情況下,基於未彎曲訊號S30之分析的高頻帶濾波器參數S60a可描述與高頻帶激發訊號S120在時間上未對準之頻譜包絡。
可根據適於將所要時間彎曲操作應用於高頻帶語音訊號S30之邏輯元件與儲存元件的任何組合來組態延遲線D120。舉例而言,延遲線D120可經組態以根據所要時間移位自緩衝器讀取高頻帶語音訊號S30。圖26a展示包括一移位暫存器SR1之延遲線D120之該實施D122的示意圖。移位暫存器SR1為具有某長度m之緩衝器,其經組態以接收且儲存高頻帶語音訊號S30之m個最近樣本。值m至少等於所支援之最大正(或"推進")與負(或"阻滯")時間移位之和。使值m等於高頻帶訊號S30之訊框或子訊框的長度可係方便的。
延遲線D122經組態以自移位暫存器SR1之偏移位置OL輸出經時間彎曲的高頻帶訊號S30a。偏移位置OL之定位根據由(例如)規律化資料訊號SD10所指示之當前時間移位而圍繞參考定位(零時間移位)變化。延遲線D122可經組態以支援相等推進及阻滯限制,或者一限制大於另一限制以使在一方向上執行之移位大於在另一方向上執行之移位。圖26a展示所支援之正時間移位多於負時間移位的特定實例。延遲線D122可經組態以一次輸出一或多個樣本(例如,視輸出匯流排寬度而定)。
具有多於若干毫秒之量值的規律化時間移位可在解碼訊號中導致可聽假影。通常,由窄頻帶編碼器A124執行之規律化時間移位的量值不超過若干毫秒,使得由規律化資料訊號SD10指示之時間移位受限制。然而,在該等情況下,可能需要組態延遲線D122以對正及/或負方向上的時間移位強加最大限制(例如,以遵守比由窄頻帶編碼器所強加之限制更苛刻的限制)。
圖26b展示包括一移位窗SW之延遲線D122之一實施D124的示意圖。在此實例中,偏移位置OL之定位由移位窗SW所限制。雖然圖26b展示其中緩衝器長度m大於移位窗SW之寬度的情形,但亦可實施延遲線D124以使得移位窗SW之寬度等於m。
在其他實施中,延遲線D120可經組態以根據所要時間移位將高頻帶語音訊號S30寫入緩衝器。圖27展示延遲線D120之該實施D130的示意圖,其包括經組態以接收及儲存高頻帶語音訊號S30之兩個移位暫存器SR2及SR3。延遲線D130經組態以根據由(例如)規律化資料訊號SD10指示之時間移位,將訊框或子訊框自移位暫存器SR2寫入移位暫存器SR3。移位暫存器SR3係組態成經配置以輸出經時間彎曲高頻帶訊號S30之FIFO緩衝器。
在圖27中展示之特定實例中,移位暫存器SR2包括一訊框緩衝器部分FB1及一延遲緩衝器部分DB,且移位暫存器SR3包括一訊框緩衝器部分FB2、一推進緩衝器部分AB及一阻滯緩衝器部分RB。推進緩衝器AB與阻滯緩衝器RB之長度可相等,或一者可大於另一者,使得在一方向上所支援之位移大於另一方向上所支援之移位。延遲緩衝器DB及阻滯緩衝器部分RB可經組態以具有相同長度。或者,延遲緩衝器DB可比阻滯緩衝器RB更短,以考量到用於將樣本自訊框緩衝器FB1傳送至移位暫存器SR3之時間間隔,其可包括其他處理操作(諸如在將樣本儲存至移位暫存器SR3之前,彎曲該樣本)。
在圖27之實例中,訊框緩衝器FB1經組態以具有與高頻帶訊號S30之一訊框之長度相等的長度。在另一實例中,訊框緩衝器FB1經組態以具有與高頻帶訊號S30之一子訊框之長度相等的長度。在該情況下,延遲線D130可經組態以包括將相同(例如,平均)延遲應用於待移位之訊框之子訊框的邏輯。延遲線D130亦可包括對來自訊框緩衝器FB1之值與待覆寫於阻滯緩衝器RB或推進緩衝器AB中的值求平均之邏輯。在另一實例中,移位暫存器SR3可經組態以僅經由訊框緩衝器FB1接收高頻帶訊號S30之值,且在該情況下,延遲線D130可包括在寫入移位暫存器SR3之連續訊框或子訊框之間的間隙上進行內插之邏輯。在其他實施中,延遲線D130可經組態以在將來自訊框緩衝器FB1之樣本寫入移位暫存器SR3之前對其執行彎曲操作(例如,根據由規律化資料訊號SD10描述的函數)。
可需要延遲線D120應用基於(但並非相同於)由規律化資料訊號SD10所指定之彎曲的時間彎曲。圖28展示寬頻帶語音編碼器AD10之一實施AD12的方塊圖,其包括一延遲值映射器D110。延遲值映射器D110經組態以將由規律化資料訊號SD10所指示之彎曲映射至映射延遲值SD10a中。延遲線D120經配置以根據由映射延遲值SD10a所指示之彎曲來產生經時間彎曲的高頻帶語音訊號S30a。
可預期由窄頻帶編碼器應用之時間移位隨時間而平滑變化。因此,通常計算在語音訊框期間應用於子訊框之平均窄頻帶時間移位,且根據此平均值來移位高頻帶語音訊號S30之對應訊框就已足夠。在該實例中,延遲值映射器D110經組態以計算每一訊框之子訊框延遲值的平均值,且延遲線D120經組態以將計算出之平均值應用於高頻帶訊號S30之對應訊框。在其他實例中,可計算及應用在較短時期(諸如兩個子訊框或一訊框之一半)或較長時期(諸如兩個訊框)內之平均值。在其中平均值為樣本之非整數值的情形下,延遲值映射器D110可經組態以在將該值輸出至延遲線D120之前將其四捨五入為整數數目個樣本。
窄頻帶編碼器A124可經組態以在編碼窄頻帶激發訊號中包括非整數數目個樣本之規律化時間移位。在此情況下,可需要延遲值映射器D110經組態以將窄頻帶時間移位四捨五入為整數數目個樣本,且可需要延遲線D120將該四捨五入之時間移位應用於高頻帶語音訊號S30。
在寬頻帶語音編碼器AD10之一些實施中,窄頻帶語音訊號S20之取樣率與高頻帶語音訊號S30之取樣率可不同。在該等情況下,延遲值映射器D110可經組態以調節在規律化資料訊號SD10中所指示之時間移位量,以解決在窄頻帶語音訊號S20(或窄頻帶激發訊號S80)之取樣率與高頻帶語音訊號S30之取樣率之間的差值。舉例而言,延遲值映射器D110可經組態以根據取樣率之比率來按比例調整時間移位量。在上文提及之一特定實例中,窄頻帶語音訊號S20以8 kHz進行取樣,且高頻帶語音訊號S30以7 kHz進行取樣。在此情況下,延遲值映射器D110經組態以將每一移位量乘以7/8。延遲值映射器D110之實施亦可經組態以結合本文中所描述之整數四捨五入及/或時間移位平均運算來執行該按比例調整運算。
在另外的實施中,延遲線D120經組態以用其他方式修改訊框或樣本之其他序列的時間比例(例如,藉由壓縮一部分且擴展另一部分)。舉例而言,窄頻帶編碼器A124可經組態以根據諸如音高周線或軌線之函數來執行規律化。在該情況下,規律化資料訊號SD10可包括該函數之對應描述(諸如一組參數),且延遲線D120可包括經組態以根據該函數來彎曲高頻帶語音訊號S30之訊框或子訊框的邏輯。在其他實施中,延遲值映射器D110經組態以在函數由延遲線D120應用於高頻帶語音訊號S30之前對該函數求平均值、按比例調整及/或四捨五入。舉例而言,延遲值映射器D110可經組態以根據該函數計算一或多個延遲值,每一延遲值指示許多樣本,該等樣本接著由延遲線D120應用以對高頻帶語音訊號S30之一或多個對應訊框或子訊框進行時間彎曲。
圖29展示根據包括於對應編碼窄頻帶激發訊號中之時間彎曲來對高頻帶語音訊號進行時間彎曲之方法MD100的流程圖。任務TD100處理寬頻帶語音訊號以獲得窄頻帶語音訊號及高頻帶語音訊號。舉例而言,任務TD100可經組態以使用具有低通濾波器及高通濾波器之濾波器組(諸如濾波器組A110之一實施)來過濾寬頻帶語音訊號。任務TD200將窄頻帶語音訊號編碼為至少一編碼窄頻帶激發訊號及複數個窄頻帶濾波器參數。編碼窄頻帶激發訊號及/或濾波器參數可被量化,且編碼窄頻帶語音訊號亦可包括其他參數(諸如語音模式參數)。任務TD200亦包括編碼窄頻帶激發訊號中之時間彎曲。
任務TD300基於窄頻帶激發訊號產生高頻帶激發訊號。在此情況下,窄頻帶激發訊號係基於編碼窄頻帶激發訊號。至少根據高頻帶激發訊號,任務TD400將高頻帶語音訊號編碼為至少複數個高頻帶濾波器參數。舉例而言,任務TD400可經組態以將高頻帶語音訊號編碼為複數個經量化LSF。任務TD500將時間移位應用於高頻帶語音訊號,該時間移位係基於關於包括於編碼窄頻帶激發訊號中之時間彎曲的資訊。
任務TD400可經組態以對高頻帶語音訊號執行頻譜分析(諸如LPC分析),及/或計算高頻帶語音訊號之增益包絡。在該等情況下,任務TD500可經組態以在分析及/或增益包絡計算之前將時間移位應用於高頻帶語音訊號。
寬頻帶語音編碼器A100之其他實施經組態以逆轉由包括於編碼窄頻帶激發訊號中之時間彎曲引起的高頻帶激發訊號S120之時間彎曲。舉例而言,高頻帶激發產生器A300可經實施以包括延遲線D120之一實施,其經組態以接收規律化資料訊號SD10或經映射延遲值SD10a,且將對應的逆時間移位應用於窄頻帶激發訊號S80及/或基於其之後續訊號(諸如調和擴展訊號S160或高頻帶激發訊號S120)。
其他的寬頻帶語音編碼器實施可經組態以將窄頻帶語音訊號S20與高頻帶語音訊號S30彼此獨立地編碼,使得高頻帶語音訊號S30被編碼為高頻帶頻譜包絡及高頻帶激發訊號之表示。此實施可經組態以執行對高頻帶殘餘訊號之時間彎曲,或以其他方式根據關於包括於編碼窄頻帶激發訊號中之時間彎曲之資訊將時間彎曲包括於編碼高頻帶激發訊號中。舉例而言,高頻帶編碼器可包括本文中所描述之延遲線D120及/或延遲值映射器D110之一實施,該延遲線D120及/或該延遲值映射器D110經組態以將時間彎曲應用於高頻帶殘餘訊號。該操作之潛在優勢包括更有效編碼高頻帶殘餘訊號及便在合成的窄頻帶語音訊號與高頻帶語音訊號之間的匹配更佳。
如上文所提及,本文中所描述之組態包括可用於執行嵌入式編碼、支援與窄頻帶系統之相容性且避免需要編碼轉換之實施。對高頻帶編碼之支援亦可用於基於成本而區分具有帶有反向相容性之寬頻帶支援的晶片、晶片組、設備及/或網路以及區分彼等具有窄頻帶支援之晶片、晶片組、設備及/或網路。如本文中所描述之對高頻帶編碼之支援亦可連同用於支援低頻帶編碼之技術而使用,且根據該組態之系統、方法或裝置可支援自(例如)約50 Hz或100 Hz直至約7 kHz或8 kHz之頻率分量的編碼。
如上文所提及,將高頻帶支援添加至語音編碼器可改良清晰度,尤其係關於摩擦音之區別。雖然此區別通常可由人類收聽者由特定上下文得出,但高頻帶支援可充當使語音辨識及其他機器解譯應用(諸如用於自動聲音選單導航及/或自動呼叫處理之系統)成為可能(enabling)之特徵。
可將根據一組態之裝置嵌入至用於無線通信之攜帶型設備(諸如蜂巢式電話或個人數位助理(PDA))中。或者,該裝置可包括於另一通信設備(諸如VoIP手機、經組態以支援VoIP通信之個人電腦或經組態以路由電話或VoIP通信之網路設備)中。舉例而言,可將根據一組態之裝置實施於用於通信設備之晶片或晶片組中。視特定應用而定,該設備亦可包括以下特徵:諸如語音訊號之類比-數位及/或數位-類比轉換、對語音訊號執行放大及/或其他訊號處理操作之電路及/或用於傳輸及/或接收編碼語音訊號之射頻電路。
已明確設想及揭示的是,組態可包括在美國臨時專利申請案第60/667,901號及60/673,965號中所揭示之其他特徵中的任何一或多個特徵及/或配合其一起使用。該等特徵包括移除發生於高頻帶中且大體上不存在於窄頻帶中之短持續時間的高能量叢發。該等特徵包括對諸如高頻帶LSF之係數表示的固定或適應性平滑化。該等特徵包括固定地或適應性地定形與諸如LSF之係數表示之量化相關的雜訊。該等特徵亦包括增益包絡之固定或適應性平滑化,及增益包絡之適應性衰減。
可將高頻帶激發產生器A300及B300、高頻帶編碼器A100、高頻帶解碼器B200、寬頻帶語音編碼器A100及寬頻帶語音解碼器B100之實施之各種元件實施為駐留於(例如)相同晶片上或一晶片組中之兩個或兩個以上晶片間的電子及/或光學設備,但亦設想了不具有該限制之其他配置。可將該裝置之一或多個元件整體或部分地實施為一或多組指令,該等指令經配置以在邏輯元件(例如,電晶體、閘極)之一或多個固定或可程式化陣列上執行,諸如,微處理器、嵌入式處理器、IP核心、數位訊號處理器、FPGA(場可程式化閘陣列)、ASSP(特殊應用標準產品)及ASIC(特殊應用積體電路)。一或多個該等元件亦可能具有共同結構(例如,用於在不同時間執行對應於不同元件之碼部分的處理器、經執行以在不同時間執行對應於不同元件之任務的一組指令或在不同時間執行用於不同元件之操作的一組電子及/或光學設備)。而且,一或多個該等元件可能用於執行任務或執行不直接關於裝置之操作之其他組指令,諸如關於裝置所嵌入於之設備或系統之另一操作的任務。
圖30展示根據一組態之編碼具有窄頻帶部分及高頻帶部分之語音訊號之高頻帶部分之方法M100的流程圖。任務X100計算表現高頻帶部分之頻譜包絡之特徵的一組濾波器參數。任務X200藉由將非線性函數應用於得自窄頻帶部分之訊號來計算頻譜擴展訊號。任務X300根據(A)該組濾波器參數及(B)基於頻譜擴展訊號之高頻帶激發訊號來產生合成高頻帶訊號。任務X400基於(C)在高頻帶部分之能量與(D)得自窄頻帶部分之訊號之能量之間的關係來計算增益包絡。
圖31a展示根據一組態產生高頻帶激發訊號之方法M200的流程圖。任務Y100藉由將非線性函數應用於得自語音訊號之窄頻帶部分的窄頻帶激發訊號來計算調和擴展訊號。任務Y200將該調和擴展訊號與調變雜訊訊號混合以產生高頻帶激發訊號。圖31b展示根據包括任務Y300及Y400之另一組態來產生高頻帶激發訊號之方法M210的流程圖。任務Y300根據窄頻帶激發訊號與調和擴展訊號間之一者隨時間之能量來計算時域包絡。任務Y400根據該時域包絡來調變雜訊訊號以產生調變雜訊訊號。
圖32展示根據一組態之解碼具有窄頻帶部分及高頻帶部分之語音訊號之高頻帶部分之方法M300的流程圖。任務Z100接收表現高頻帶部分之頻譜包絡之特徵的一組濾波器參數及表現高頻帶部分之時間包絡之特徵的一組增益因數。任務Z200藉由將非線性函數應用於得自窄頻帶部分之訊號來計算頻譜擴展訊號。任務Z300根據(A)該組濾波器參數及(B)基於頻譜擴展訊號之高頻帶激發訊號來產生合成高頻帶訊號。任務Z400基於該組增益因數來調變合成高頻帶訊號之增益包絡。舉例而言,任務Z400可經組態以藉由將該組增益因數應用於得自窄頻帶部分之激發訊號、頻譜擴展訊號、高頻帶激發訊號或合成高頻帶訊號來調變合成高頻帶訊號之增益包絡。
圖33說明分碼多向近接(CDMA)無線電話系統3300,其可包括複數個行動台3302、複數個基地台3304、一基地台控制器(BSC)3306及一行動交換中心(MSC)3308。MSC 3308可經組態以介接公眾交換電話網路(PSTN)3310。MSC 3308亦可經組態以介接BSC 3306。在系統3300中可存在一個以上BSC 3306。每一基地台3304可包括至少一扇區(未圖示),其中每一扇區可具有全向天線或指向徑向遠離基地台3304之特定方向的天線。或者,每一扇區可包括用於分集接收之兩個天線。每一基地台3304可經設計以支援複數個頻率分配。扇區與頻率分配之相交可稱為CDMA通道。行動台3302可包括蜂巢式或攜帶型通信系統(PCS)電話。
在蜂巢式電話系統3300之操作期間,基地台3304可來自若干組行動台3302接收若干組反向鏈結訊號。行動台3302可進行電話呼叫或其他通信。由給定基地台3304接收之每一反向鏈結訊號可在該基地台3304中被處理。可將所得資料轉發至BSC 3306。BSC 3306可提供呼叫資源分配及包括安排在基地台3304之間的軟交遞的行動性管理功能。BSC 3306亦可將所接收資料路由至MSC 3308,其提供用於介接PSTN 3310之額外路由服務。相似地,PSTN 3310可介接MSC 3308,且MSC 3308可介接BSC 3306,BSC 3306又可控制基地台3304以將若干組前向鏈結訊號傳輸至若干組行動台3302。
圖34描繪訊號傳輸環境3400,其包括一編碼器3402、一解碼器3404及一傳輸媒體3406。編碼器3402可在行動台3302內或在基地台3304中被實施。解碼器3404可在基地台3304中或在行動台3302中被實施。編碼器3402可編碼語音訊號s(n)3410,從而形成編碼語音訊號senc (n)3412。編碼語音訊號3412可在傳輸媒體3406上傳輸至解碼器3404。解碼器3404可解碼senc (n)3412,藉此產生合成語音訊號(n)3416。
如本文中所使用之術語"編碼"可通常意指涵蓋編碼及解碼之方法。通常,編碼系統、方法及裝置試圖在維持可接受語音再生(亦即,s(n)3410(n)3416)之同時最小化經由傳輸媒體3406傳輸之位元數目(亦即,最小化senc (n)3412之頻寬)。裝置可為行動電話、個人數位助理(PDA)、膝上型電腦、數位攝影機、音樂播放機、遊戲設備、基地台或具有處理器之任何其他設備。編碼語音訊號3412之組成可根據由該編碼器3402所利用之特定語音編碼模式而改變。下文描述多種編碼模式。
可將下文描述之編碼器3402及解碼器3404之組件實施為電子硬體、電腦軟體或該兩者之組合。在下文中依據其功能性而描述此等組件。將功能性實施為硬體或軟體可視特定應用及強加於整個系統之設計約束而定。傳輸媒體3406可代表許多不同傳輸媒體,包括(但不限於):基於陸地通信線、在基地台與衛星之間的鏈結、在蜂巢式電話與基地台之間,或在蜂巢式電話與衛星之間的無線通信。
通信之每一方可傳輸資料以及接收資料。每一方可利用編碼器3402及解碼器3404。然而,在下文中將訊號傳輸環境3400描述為包括在傳輸媒體3406之一端處的編碼器3402及在另一端處的解碼器3404。
出於此描述之目的,s(n)3410可包括在包括不同有聲聲音及靜默時間段之典型對話期間獲得之數位語音訊號。可將語音訊號s(n)3410分割為訊框,且可將每一訊框進一步分割為子訊框。此等任意選擇之訊框/子訊框邊界可在執行一些塊處理之情況下得以使用。描述為對訊框執行之操作亦可對子訊框執行,在此意義上,本文中可將訊框與子訊框互換使用。然而,若實施連續處理而非塊處理,則不可將s(n)3410分割為訊框/子訊框。因而,可將下文描述之塊技術擴展至連續處理。
可將編碼器3402實施為窄頻帶(NB)編碼器或寬頻帶(WB)編碼器。NB編碼器可數位取樣在8 kHz處之訊號s(n)3410及存在於50 Hz至4 kHz之頻寬中之編碼訊號資訊。NB編碼器之一實例可包括增強型可變速率編碼器(EVRC-B)。WB編碼器可數位取樣在16 kHz處之訊號s(n)3410及存在於NB編碼器頻寬加上在4 kHz與8 kHz之間的範圍中的碼資訊。WB編碼器之一實例可包括EVRC-WB編碼器。在一態樣中,EVRC-WB為EVRC-B之寬頻帶擴展。自訊號s(n)3410分割之每一訊框可包括20毫秒(ms)之資料或160個樣本。每一子訊框可包括53個或54個資料樣本。雖然此等參數可適合於語音編碼,但其僅為實例,且可使用其他合適替代參數。
若將編碼器3402實施為NB編碼器,則可將訊框封裝為窄頻帶封包3418。窄頻帶封包3418可包括窄頻帶識別符3422。識別符3422可對解碼器3404指示窄頻帶封包3418係使用NB編碼器而編碼。若將編碼器3402實施為WB編碼器,則可將訊框封裝為寬頻帶封包3420。寬頻帶封包3420可包括寬頻帶識別符3424。識別符3424可對解碼器3404指示寬頻帶封包3420係使用WB編碼器而編碼。解碼器3404可包括一封包識別模組3414,其可辨識識別符3422或3424且確定應實施NB解碼器還是WB解碼器來解碼封包3418或3420。
圖35為說明用於在與語音訊號相關之封包中包括識別符的方法3500之一組態的流程圖。在一態樣中,識別符可指示封包係由NB編碼器還是WB編碼器而編碼。可由諸如編碼器3402之編碼器實施方法3500。
可由編碼器3402接收3502訊號。在一態樣中,該訊號為一種類型之語音訊號。訊號可經分析且分割3504為複數個訊框。使用特定編碼機制(例如,CELP、PPP、NELP)可將訊號之經分割訊框以半速率進行編碼3506。在一態樣中,可將封包編碼為具有80位元。術語"半速率"可用於表示具有80位元之封包。確定3508訊框是否為包括80位元之寬頻帶半速率訊框。換言之,確定3508編碼器3402是否用作WB編碼器且將訊框編碼為寬頻帶半速率(WB-HR)訊框。若訊框為WB-HR訊框,則可將寬頻帶識別等封裝3510至封包中。在一態樣中,寬頻帶識別符包括以二進位形式之十進位數字"126"及"127"的開頭六位。十進位數字"126"之二進位形式為"1111110",且"127"之二進位形式為"1111111"。因而,寬頻帶識別符可包括六個1之串(例如,"111111")。
若確定3508訊框並非WB-HR訊框,則可將窄頻帶識別等封裝3512至封包中。在一態樣中,窄頻帶識別符可與延遲參數相關。舉例而言,用於表示延遲參數之位元亦可用作窄頻帶識別符。可傳輸3514封包。在一態樣中,將封包傳輸3514至一解碼器。
圖36為說明解碼封包之方法3600之一組態的流程圖。可由解碼器3404實施方法3600。在一態樣中,接收3602半速率封包。可分析3604包括於半速率封包中之識別符。該識別符可指示半速率封包係由WB編碼器還是NB編碼器而編碼。在一態樣中,該識別符為係無效/非法滯後之特別封包識別符(ID)。確定3606封包是否為基於對識別符之分析的WB-HR封包。若封包為WB-HR封包,則使用寬頻帶解碼機制來解碼3608該封包。在一組態中,解碼器3404用作WB解碼器。然而,若確定3606該封包並非WB-HR,則可使用窄頻帶解碼機制來解碼3610該封包。解碼器3404可用作NB解碼器。可自一或多個經解碼封包重建3612訊號。
圖37為說明在通信通道3706上與多模式解碼器3704通信之多模式編碼器3702之一組態的方塊圖。通信通道3706可包括射頻(RF)介面。編碼器3702可包括相關解碼器(未圖示)。編碼器3702及其相關解碼器可形成第一語音編碼器。解碼器3704可包括相關編碼器(未圖示)。解碼器3704及其相關編碼器可形成第二語音編碼器。
編碼器3702可包括一初始參數計算模組3718、一速率確定模組3720、一模式分類模組3722、複數個編碼模式3724、3726、3728及一封包格式化模組3730。封包格式化模組3730可插入一封包識別符3708。將編碼模式3724、3726、3728之數目展示為N,其可表示任何數目之編碼模式3724、3726、3728。出於簡明性目的,展示三個編碼模式3724、3726、3728,其中虛線指示其他編碼模式之存在。
解碼器3704可包括一封包分解器模組3732、複數個解碼模式3734、3736、3738及一後濾波器3740。封包分解器模組3732可包括一封包識別模組3714。將解碼模式3734、3736、3738之數目展示為N,其可表示任何數目之解碼模式3734、3736、3738。出於簡明性目的,展示三個解碼模式3734、3736、3738,其中虛線指示其他解碼模式之存在。
可將語音訊號s(n)3710提供至初始參數計算模組3718。可將語音訊號3710劃分為稱為訊框之樣本塊。值n可表示訊框數目,或值n可表示在一訊框中之樣本數目。在一替代組態中,線性預測(LP)殘餘誤差訊號可替代語音訊號3710而使用。LP殘餘誤差訊號可由諸如編碼激發線性預測(CELP)編碼器之語音編碼器使用。
初始參數計算模組3718可基於當前訊框得出多種參數。在一態樣中,此等參數包括以下參數中之至少一個參數:線性預測編碼(LPC)濾波器係數、線頻譜對(LSP)係數、正規化自相關函數(NACF)、開放迴路滯後、零交叉率、頻帶能量及共振峰殘餘訊號。
初始參數計算模組3718可耦接至模式分類模組3722。模式分類模組3722可在編碼模式3724、3726、3728之間動態轉換。初始參數計算模組3718可將參數提供至模式分類模組3722。模式分類模組3722可耦接至速率確定模組3720。速率確定模組3720可接受速率控制訊號。速率控制訊號可指導編碼器3702以特定速率編碼語音訊號3710。在一態樣中,特定速率包括可指示將使用一百七十一位元來編碼語音訊號3710之全速率。在另一實例中,特定速率包括可指示將使用八十位元來編碼語音訊號3710之半速率。在另一實例中,特定速率包括可指示將使用十六位元來編碼語音訊號3710之八分之一速率。
如先前所陳述,模式分類模組3722可經耦接以基於逐個訊框在編碼模式3724、3726、3728之間動態轉換,以選擇用於當前訊框之最適合編碼模式3724、3726、3728。模式分類模組3722可藉由將參數與預定義臨限及/或最高值比較來選擇用於當前訊框之特定編碼模式3724、3726、3728。此外,模式分類模組3722可基於自速率確定模組3720接收之速率控制訊號來選擇特定編碼模式3724、3726、3728。舉例而言,編碼模式A 3724可使用一百七十一位元來編碼語音訊號3710,而編碼模式B 3726可使用八十位元來編碼語音訊號3710。
基於訊框之能量含量,模式分類模組3722可將訊框分類為非語音或不活動語音(例如,靜默、背景雜訊或言語之間的停頓),或語音。基於訊框之週期性,模式分類模組3722可將語音訊框分類為語音之特定類型,例如有聲、無聲或過渡。
有聲語音可包括展現相對高程度之週期性之語音且可包括元音聲。音高週期可為可用於分析且重建訊框之內容的語音訊框之分量。無聲語音可包括輔音聲。過渡語音訊框可包括在有聲語音與無聲語音之間的過渡。可將並非被分類為有聲語音或無聲語音之訊框分類為過渡語音。
語音模式(亦稱為發聲模式)指示當前訊框表示有聲語音還是無聲語音。此參數可具有二進位值,該值基於訊框之週期性(例如零交叉、NACF、音高增益)及/或話音活動之一或多個量測值,諸如在該量測值與臨限值之間的關係。在其他實施中,語音模式參數具有用以指示諸如靜默或背景雜訊,或靜默與有聲語音之間的過渡之模式的一或多個其他狀態。
分類語音訊框可允許使用不同編碼模式3724、3726、3728來編碼不同類型之語音,從而導致在共用通道(諸如通信通道3706)中更有效使用頻寬。舉例而言,因有聲語音為週期的且因此預測性高,故低位元率、高預測性編碼模式3724、3726、3728可用於編碼有聲語音。
模式分類模組3722可基於訊框之分類來選擇用於當前訊框之編碼模式3724、3726、3728。可平行耦接多種編碼模式3724、3726、3728。編碼模式3724、3726、3728中之一或多個模式可在任何給定時間操作。在一組態中,根據當前訊框之分類來選擇一個編碼模式3724、3726、3728。
不同編碼模式3724、3726、3728可根據不同編碼位元率、不同編碼機制或編碼位元率與編碼機制之不同組合來操作。如先前所陳述,使用之多種編碼率可為全速率、半速率、四分之一速率及/或八分之一速率。使用之多種編碼機制可為CELP編碼、原型音高週期(PPP)編碼(或波形內插(WI)編碼)及/或雜訊激發線性預測(NELP)編碼。因此,舉例而言,一特定編碼模式3724、3726、3728可為全速率CELP;另一編碼模式3724、3726、3728可為半速率CELP;另一編碼模式3724、3726、3728可為全速率PPP;且另一編碼模式3724、3726、3728可為NELP。
根據CELP編碼模式3724、3726、3728,可利用經量化版本之LP殘餘訊號來激發線性預測聲道模型。在CELP編碼模式中,可量化整個當前訊框。CELP編碼模式3724、3726、3728可提供相對準確之語音再生,但係以相對高編碼位元率為代價。CELP編碼模式3724、3726、3728可用於編碼分類為過渡語音之訊框。
根據NELP編碼模式3724、3726、3728,經過濾之偽隨機雜訊訊號可用於模型化LP殘餘訊號。NELP編碼模式3724、3726、3728可為達成低位元率之相對簡單的技術。NELP編碼模式3724、3726、3728可用於編碼分類為無聲語音之訊框。
根據PPP編碼模式3724、3726、3728,可編碼在每一訊框內之音高週期的子集。可藉由在此等原型週期之間內插而重建語音訊號之剩餘週期。在PPP編碼之時域實施中,可計算描述如何修改先前原型週期以近似於當前原型週期之第一組參數。可選擇一或多個碼向量,該等碼向量在相加時近似於在當前原型週期與經修改先前原型週期之間的差。第二組參數描述此等經選擇碼向量。在PPP編碼之一頻域實施中,一組參數可經計算以描述原型之振幅及相位頻譜。根據PPP編碼之實施,解碼器3704可藉由基於描述振幅及相位之參數組而重建當前原型來合成輸出語音訊號3716。過去的原型週期可用作當前原型週期之振幅及/或相位之預測器。可在當前重建原型週期與先前重建原型週期之間的區域內內插語音訊號。原型可包括當前訊框之一部分,利用來自先前訊框之相似定位於訊框內的原型而對該部分線性內插,以在解碼器3704處重建語音訊號3710或LP殘餘訊號。
編碼原型週期而非整個語音訊框可降低編碼位元率。可利用PPP編碼模式3724、3726、3728來編碼分類為有聲語音之訊框。藉由採用有聲語音之週期性,PPP編碼模式3724、3726、3728可達成低於CELP編碼模式3724、3726、3728之位元率。
經選擇編碼模式3724、3726、3728可耦接至封包格式化模組3730。經選擇編碼模式3724、3726、3728可編碼或量化當前訊框且將經量化訊框參數3712提供至封包格式化模組3730。封包格式化模組3730可將經量化訊框參數3712組裝至格式化封包3713中。封包格式化模組3730可將封包格式化為寬頻帶封包或窄頻帶封包。封包識別符3708可包括於該封包中。如先前所解釋,封包識別符3708可對解碼器3704指示封包為寬頻帶封包還是為窄頻帶封包。封包格式化模組3730可在一通信通道3706上將經格式化封包3713提供至接收器(未圖示)。接收器可接收、解調變及數位化經格式化封包3713,且將封包3713提供至解碼器3704。
在解碼器3704中,封包分解器模組3732接收來自接收器之封包3713。封包分解器模組3732可解封封包3713,且封包識別模組3714可辨識包括於封包3713中之封包識別符3708。封包識別模組3714可發現封包3713為WB-HR封包或窄頻帶半速率封包。封包分解器模組3732亦可經組態以基於逐個封包而在解碼模式3734、3736、3738之間動態轉換。解碼模式3734、3736、3738之數目可與編碼模式3724、3726、3728之數目相同。每一編號的編碼模式3724、3726、3728可與經組態以使用相同編碼位元率及編碼機制之各別相似編號的解碼模式3734、3736、3738相關。
若封包分解器模組3732偵測到封包3713,則封包3713被分解且提供至相關解碼模式3734、3736、3738。相關解碼模式3734、3736、3738可基於對封包識別符3708之分析來實施寬頻帶或窄頻帶解碼技術。若封包分解器模組3732未偵測到封包,則宣告封包丟失,且抹除解碼器(未圖示)可執行訊框抹除處理。解碼模式3734、3736、3738之平行陣列可耦接至後濾波器3740。相關解碼模式3734、3736、3738可解碼(或去量化)封包3713且將資訊提供至後濾波器3740。後濾波器3740可重建(或合成)語音訊框,從而輸出合成語音訊框(n)3716。
在一組態中,並不傳輸量化參數本身。實情為,傳輸在解碼器3704中指定在各種查找表(LUT)(未圖示)中之位址的碼簿指數。解碼器3704可接收碼簿指數且搜索各種碼簿LUT以發現合適參數值。因此,可傳輸參數(諸如音高滯後、適應性碼簿增益及LSP)之碼簿指數,且可由解碼器3704搜索三個相關碼簿LUT。
根據CELP編碼模式,可傳輸音高滯後、音高增益、碼簿參數及LSP參數。因可在解碼器3704處合成LP殘餘訊號,故傳輸LSP碼簿指數。此外,可傳輸在當前訊框之音高滯後值與前一訊框之音高滯後值之間的差。
根據其中將在解碼器3704處合成語音訊號3710之PPP編碼模式,傳輸音高滯後、振幅及相位參數。由PPP語音編碼技術使用之較低位元率可能不允許傳輸絕對音高滯後資訊及相對音高滯後差值兩者。
根據一實例,利用低位元率PPP編碼模式來傳輸諸如有聲語音訊框之高週期性訊框,該低位元率PPP編碼模式量化用於傳輸的當前訊框之音高滯後值與前一訊框之音高滯後值之間的差,且不量化用於傳輸之當前訊框之絕對音高滯後值。因有聲訊框係高週期性的,故傳輸差值而非絕對音高滯後值可允許達成較低編碼位元率。在一態樣中,推廣此量化以使得計算出前一訊框之參數值的加權和,其中權重之和為1,且自當前訊框之參數值減去該加權和。可接著量化該差。
圖38為說明可變速率語音編碼方法3800之一實例之流程圖。在一態樣中,由一單個行動台3302來實施方法3800,該單個行動台3302可被允許將封包編碼為寬頻帶封包或窄頻帶封包。在其他態樣中,可由多於一個行動台3302來實施方法3800。換言之,一行動台3302可包括用以編碼寬頻帶封包或窄頻帶封包之編碼器,而一獨立的行動台3302可包括用以使用寬頻帶或窄頻帶解碼技術來解碼封包之解碼器。可計算3802當前訊框之初始參數。在一組態中,初始參數計算模組3718計算3802該等參數。參數可包括以下參數中之一或多者:線性預測編碼(LPC)濾波器係數、線頻譜對(LSP)係數、正規化自相關函數(NACF)、開放迴路滯後、頻帶能量、零交叉率及共振峰殘餘訊號。
可將當前訊框分類3804為活動或不活動。在一組態中,分類模組3722將當前訊框分類為包括"活動"語音或"不活動"語音。如上文所描述,s(n)3710可包括語音週期及靜默週期。活動語音可包括有聲話語,而不活動語音可包括背景雜訊、靜默、停頓等。
確定3806將當前訊框分類為活動的或是不活動的。若將當前訊框分類為活動的,則進一步將活動語音分類3808為有聲、無聲或過渡訊框。可以許多不同方式分類人類語音。語音的兩種分類可包括有聲聲音及無聲聲音。可將並非有聲或無聲之語音分類為過渡語音。
基於在步驟3806及3808中進行之訊框分類,可選擇3810編碼器/解碼器模式。如圖37中所示,可平行連接多種編碼器/解碼器模式。不同編碼器/解碼器模式根據不同編碼機制來操作。某些模式可在語音訊號s(n)3710的展現某些特性之編碼部分處更為有效。
如先前所解釋,CELP模式可經選擇以編碼分類為過渡語音之訊框。PPP模式可經選擇以編碼分類為有聲語音之訊框。NELP模式可經選擇以編碼分類為無聲語音之訊框。相同編碼技術可頻繁地在不同位元率下操作,並具有不同效能水準。在圖37中之不同編碼器/解碼器模式可表示不同編碼技術,或以不同位元率操作之相同編碼技術,抑或以上之組合。
經選擇之編碼模式可編碼3812當前訊框且根據位元率將經編碼訊框格式化3814為封包。封包識別符可包括3816於該封包中。封包識別符可指示該封包被編碼為寬頻帶封包還是窄頻帶封包。可將封包發送3818至解碼器。
圖39為說明規則窄頻帶半速率封包3902及寬頻帶半速率封包3904之一組態之方塊圖。在一態樣中,每一封包可包括一封包識別符,諸如封包識別符A 3906及封包識別符B 3907。封包識別符A 3906可包括合法滯後值3908,且封包識別符B 3907可包括非法滯後值3914。非法滯後值3914可為對解碼器指示某封包為寬頻帶半速率封包3904或特別窄頻帶半速率封包之值。合法滯後值可對解碼器指示某封包是否為規則(非特別)窄頻帶半速率CELP封包3902。在其他組態中,合法滯後值可對解碼器指示某封包是否為包括在範圍[0:100]內之音高滯後值的任何其他半速率封包。在範圍[0:100]內之音高滯後值僅用作一實例。本系統及方法可應用於具有一組有效值(與特定編碼機制相關)及另一組非法/無效值的給定N位元欄位。
在一組態中,規則窄頻帶半速率封包3902利用包括於封包3902中之80位元中的每一位元。因而,延遲參數可用於儲存合法滯後值3908,其可對解碼器指示傳入封包為規則(非特別)窄頻帶半速率CELP。在一態樣中,延遲參數包括7位元。延遲參數可並非在十進位數字"101"與"127"之間的值3910。在此7位元欄位中之合法(有效)滯後值可為在十進位數字"0"與"100"之間的值3910。在"0"與"100"之間的值3910可以其二進位形式(例如,7位元二進位數)包括於規則(非特別)窄頻帶半速率CELP封包3902中。
在一態樣中,寬頻帶編碼器實施NELP編碼機制以編碼無聲聲音。可將無聲聲音之訊號在寬頻帶半速率封包3904中封裝為具有80位元之封包。然而,具有無聲聲音之封包可不包括延遲。在一組態中,因可能在無延遲之情況下達成無聲聲音之訊號的可接受再生,故編碼器可不分析無聲聲音之延遲。寬頻帶半速率封包3904可利用80位元中之74個位元,留下6個位元未使用。與寬頻帶半速率封包3904相關之封包識別符B 3907可包括六個1之串3912(亦即,"111111")。在一組態中,此可映射為十進位數字"126"及"127"(以7位元),且可被保留作為寬頻帶半速率封包3904之識別符。
在一組態中,可利用來自N位元參數之至少兩個非法值。若使用兩個非法值,則一來自N位元參數之位元可經釋放以載運資訊。在另一組態中,來自N位元參數之可經釋放以載運資訊的位元數目可等於log2 (X),其中X為自N位元參數提供之非法值數目。舉例而言,八個非法值可釋放三個位元以載運其他資訊。
圖40為說明分配至多種類型之封包之位元數目的表4000。表4000包括複數個參數4002。在該複數個參數4002中之每一參數可利用確定數目之位元。在表4000中說明之多種封包類型可已利用先前論述之多種編碼模式中之一者加以編碼。封包類型可包括:全速率CELP(FCELP)4004、半速率CELP(HCELP)4006、特別半速率CELP(SPLHCELP)4008、全速率PPP(FPPP)4010、特別半速率PPP(SPLHPPP)4012、四分之一速率PPP(QPPP)4014、特別半速率NELP(SPLHNELP)4016、四分之一速率NELP(QNELP)4018及靜默編碼器4020。
FCELP 4004及FPPP 4010可為具有總計171位元之封包。FCELP 4004封包可轉換為SPLHCELP 4008封包。在一態樣中,FCELP 4004封包對諸如固定碼簿指數(FCB指數)及固定碼簿增益(FCB增益)之參數分配位元。如圖所示,當FCELP 4004封包轉換為SPLHCELP 4008封包時,對諸如FCB指數、FCB增益及△滯後之參數分配零位元。換言之,在無此等位元之情況下將SPLHCELP 4008封包傳輸至解碼器。SPLHCELP 4008封包包括對諸如線頻譜對(LSP)、適應性碼簿(ACB)增益、特別半速率識別(ID)、特別封包ID、音高滯後及模式位元資訊之參數分配的位元。傳輸至解碼器之位元總數可自171減少至80。
相似地,FPPP 4010封包可轉換為SPLHPPP 4012封包。如圖所示,FPPP 4010封包將位元分配至頻帶對準參數。FPPP 4010封包可轉換為SPLHPPP 4012封包。可去除分配至頻帶對準之位元。換言之,在無此等位元之情況下將SPLHPPP 4012封包傳輸至解碼器。傳輸至解碼器之位元總數可自171減少至80。在一組態中,分配至振幅及全域對準參數之位元係包括於SPLHPPP 4012封包中。振幅參數可指示訊號s(n)3710之頻譜的振幅,且全域對準參數可表示可確保最大程度對準之線性相移。
此外,多種類型之封包可包括分配至滯後/特別封包ID參數之位元。滯後/特別封包ID參數可表示使解碼器辨識出特定封包係使用窄頻帶編碼技術還是寬頻帶編碼技術而編碼之封包識別符。
本文中之多種組態被說明為具有用於不同參數及封包之不同數目位元。與每一參數相關之特定位元數目在本文中係以實例說明的,且並非意謂係限制性的。參數可包括比本文中所使用之實例更多或更少之位元。
圖41說明可在根據一組態之通信設備4108中利用之多種組件。通信設備4108可包括一處理器4102,其控制設備4108之操作。處理器4102亦可稱為CPU。可包括唯獨記憶體(ROM)及隨機存取記憶體(RAM)兩者之記憶體4104將指令及資料提供至處理器4102。記憶體4104之一部分亦可包括非揮發性隨機存取記憶體(NVRAM)。
通信設備4108亦可包括一外殼4122,其含有一傳輸器4110及一接收器4112,以允許資料在存取終端4108與遠端地點之間的傳輸及接收。可將傳輸器4110及接收器4112組合為一收發器4120。一天線4118附接至外殼4122且電耦接至收發器4120。
通信設備4108亦包括一訊號偵測器4106,其用於偵測且量化由收發器4120接收之訊號位準。訊號偵測器4106偵測諸如總能量、每一偽雜訊(PN)碼片之導頻能量、功率譜密度之訊號及其他訊號。
通信設備4108之狀態改變器4114基於當前狀態及由收發器4120所接收且由訊號偵測器4106所偵測之額外訊號來控制通信設備4108之狀態。設備4108能夠以許多狀態中之任一狀態操作。
通信設備4108亦包括一系統確定器4124,該系統確定器4124用於控制設備4108,且在其確定當前服務提供者系統不合適時確定設備4108應轉移至之服務提供者系統。
由一匯流排系統4118將通信設備4108之多種組件耦接在一起,該匯流排系統4118除資料匯流排之外亦可包括電源匯流排、控制訊號匯流排及狀態訊號匯流排。然而,為了說明清晰,該多種匯流排在圖41中被說明為匯流排系統4118。通信設備4108亦可包括一數位訊號處理器(DSP)4116,其用於處理訊號。
可使用多種不同技術中之任何技術來表示資訊及訊號。舉例而言,在以上描述中可參考之資料、指令、命令、資訊、訊號、位元、符號及碼片可由電壓、電流、電磁波、磁場或磁粒子、光場或光學粒子或其任何組合來表示。
可將結合本文中所揭示之組態而描述之各種說明性邏輯區塊、模組、電路及演算法步驟實施為電子硬體、電腦軟體或該兩者之組合。為清楚說明硬體與軟體之此互換性,已依據其功能性在上文中大體描述了各種說明性組件、塊、模組、電路及步驟。將該功能性實施為硬體還是軟體視特定應用及強加於整個系統之設計約束而定。熟練技工可對於每一特定應用以不同方式實施所描述功能性,但不應將該等實施決策解譯為引起偏離所揭示之方法及設備的範疇。
結合本文中所揭示之組態描述的多種說明性邏輯塊、模組及電路可利用通用處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或其他可程式化邏輯設備、離散閘或電晶體邏輯、離散硬體組件或其經設計以執行本文中所描述之功能的任何組合來實施或執行。通用處理器可為微處理器,但替代地,該處理器可為任何處理器、控制器、微控制器或狀態機。處理器亦可實施為計算設備之組合,例如DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器,或任何其他該組態。
結合本文中所揭示之組態描述之方法或演算法的步驟可直接體現於硬體、由處理器執行之軟體模組或該兩者之組合中。軟體模組可駐留於RAM記憶體、快閃記憶體、ROM記憶體、可擦可程式唯讀記憶體(EPROM)、電子可擦可程式唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式碟片、緊密光碟唯讀記憶體(CD-ROM)或在此項技術中已知之任何其他形式的儲存媒體中。儲存媒體可耦接至處理器,使得處理器可自儲存媒體讀取資訊且將資訊寫入儲存媒體。或者,儲存媒體可整合至處理器。處理器與儲存媒體可駐留於ASIC中。ASIC可駐存於使用者終端機中。或者,處理器與儲存媒體可作為離散組件駐留於使用者終端機中。
本文中所揭示之方法包含用於達成所描述之方法的一或多個步驟或動作。方法步驟及/或動作可彼此交換,而不偏離本系統及方法之範疇。換言之,除非針對組態之適當操作指定特定順序之步驟或動作,否則可修改特定步驟及/或動作之順序及/或使用,而不偏離本系統及方法之範疇。可在硬體、軟體或該兩者中實施本文中所揭示之方法。硬體及記憶體之實例可包括RAM、ROM、EPROM、EEPROM、快閃記憶體、光碟、暫存器、硬碟、抽取式碟片、CD-ROM或任何其他形式之硬體及記憶體。
儘管已說明且描述本系統及方法之特定組態及應用,但應瞭解,該等系統及方法並不限於本文中所揭示之精確組態及組件。可在本文中所揭示之方法及系統的配置、操作及細節中進行對於熟習此項技術者而言為顯而易見之多種修改、變化及變更,而不偏離所主張之系統及方法的精神及範疇。
110...低通濾波器
120...降取樣器
130...高通濾波器
140...降取樣器
150...升取樣器
160...低通濾波器
170...升取樣器
180...高通濾波器
210...LPC分析模組
220...LP濾波器係數至LSF轉換
230...量化器
240...逆量化器
250...LSF至LP濾波器係數轉換
260...白化濾波器
270...量化器
310...逆量化器
320...LSF至LP濾波器係數轉換
330...窄頻帶合成濾波器
340...逆量化器
410...LP濾波器係數至LSF轉換
420...量化器
430...量化器
450...逆量化器
460...包絡計算器
470...組合器
480...雜訊產生器
490...組合器
492...組合器
510...升取樣器
520...非線性函數計算器
530...降取樣器
540...頻譜平化器
550...加權因數計算器
560...逆量化器
570...LSF至LP濾波器係數轉換
580...逆量化器
590...增益控制元件
600...反稀疏濾波器
3300...蜂巢式電話系統
3302...行動台
3304...基地台
3306...BSC
3308...MSC
3310...PSTN
3400...訊號傳輸環境
3402...編碼器
3404...解碼器
3406...傳輸媒體
3410...語音訊號
3412...編碼語音訊號
3414...封包識別模組
3416...合成語音訊號
3418...窄頻帶封包
3420...寬頻帶封包
3422...窄頻帶識別符
3424...寬頻帶識別符
3702...編碼器
3704...解碼器
3706...通信通道
3708...封包識別符
3710...語音訊號
3712...經量化訊框參數
3713...格式化封包
3714...封包識別模組
3716...輸出語音訊號
3718...初始參數計算模組
3720...速率確定模組
3722...模式分類模組
3724...編碼模式A
3726...編碼模式B
3728...編碼模式N
3730...封包格式化模組
3732...封包分解器模組
3734...解碼模式A
3736...解碼模式B
3738...解碼模式N
3740...後濾波器
3902...窄頻帶半速率封包
3904...寬頻帶半速率封包
3906...封包識別符A
3907...封包識別符B
3908...合法滯後
3910...值
3912...串
3914...非法滯後
4000...表
4102...處理器
4104...記憶體
4106...訊號偵測器
4108...通信設備
4110...傳輸器
4112...接收器
4114...狀態改變器
4118...天線/匯流排系統
4120...收發器
4122...外殼
4124...系統確定器
A100...寬頻帶語音編碼器
A102...寬頻帶語音編碼器
A110...濾波器組
A112...濾波器組
A114...濾波器組
A120...窄頻帶編碼器
A122...窄頻帶編碼器
A124...窄頻帶編碼器
A130...多工器
A200...高頻帶編碼器
A202...高頻帶編碼器
A210...分析模組
A220...合成濾波器
A230...高頻帶增益因數計算器
A300...高頻帶激發產生器
A302...高頻帶激發產生器
A304...高頻帶激發產生器
A306...高頻帶激發產生器
A312...高頻帶激發產生器
A314...高頻帶激發產生器
A316...高頻帶激發產生器
A400...頻譜擴展器
A402...頻譜擴展器
AB...推進緩衝器
AD10...寬頻帶語音編碼器
AD12...寬頻帶語音編碼器
B100...寬頻帶語音解碼器
B102...寬頻帶語音解碼器
B110...窄頻帶解碼器
B112...窄頻帶解碼器
B120...濾波器組
B122...濾波器組
B124...濾波器組
B130...解多工器
B200...高頻帶解碼器/高頻帶合成濾波器
B202...高頻帶解碼器
B300...高頻帶激發產生器
D110...延遲值映射器
D120...延遲線
D122...延遲線
D124...延遲線
D130...延遲線
DB...延遲緩衝器
FB1...訊框緩衝器
FB2...訊框緩衝器
OL...偏移位置
RB...阻滯緩衝器
S10...寬頻帶語音訊號
S20...窄頻帶訊號
S30...高頻帶訊號
S30a...時間校準高頻帶訊號
S40...窄頻帶濾波器參數
S50...編碼窄頻帶激發訊號/窄頻帶殘餘訊號
S60...高頻帶編碼參數
S60a...高頻帶濾波器參數
S60b...高頻帶增益因數
S70...多工訊號
S80...窄頻帶激發訊號
S90...窄頻帶訊號
S100...高頻帶訊號
S110...寬頻帶語音訊號
S120...高頻帶激發訊號
S130...合成高頻帶訊號
S160...調和擴展訊號
S170...調變雜訊訊號
S180...調和加權因數
S190...雜訊加權因數
SD10...規律化資料訊號
SD10a...映射延遲值
SR1...移位暫存器
SR2...移位暫存器
SR3...移位暫存器
SW...移位窗
圖1a展示根據一組態之寬頻帶語音編碼器A100之方塊圖;圖1b展示寬頻帶語音編碼器A100之一實施A102之方塊圖;圖2a展示根據一組態之寬頻帶語音解碼器B100之方塊圖;圖2b展示寬頻帶語音解碼器B100之一實施B102之方塊圖;圖3a展示濾波器組A110之一實施A112之方塊圖;圖3b展示濾波器組B120之一實施B122之方塊圖;圖4a展示濾波器組A110之一實例之低頻帶及高頻帶之頻寬覆蓋範圍;圖4b展示濾波器組A110之另一實例之低頻帶及高頻帶之頻寬覆蓋範圍;圖4c展示濾波器組A112之一實施A114之方塊圖;圖4d展示濾波器組B122之一實施B124之方塊圖;圖5a展示語音訊號之頻率與對數振幅之曲線的一實例;圖5b展示基本線性預測編碼系統之方塊圖;圖6展示窄頻帶編碼器A120之一實施A122之方塊圖;圖7展示窄頻帶解碼器B110之一實施B112之方塊圖;圖8a展示有聲語音之殘餘訊號之頻率與對數振幅之曲線的一實例;圖8b展示有聲語音之殘餘訊號之時間與對數振幅之曲線的一實例;圖9展示亦執行長期預測之基本線性預測編碼系統之方塊圖;圖10展示高頻帶編碼器A200之一實施A202之方塊圖;圖11展示高頻帶激發產生器A300之一實施A302之方塊圖;圖12展示頻譜擴展器A400之一實施A402之方塊圖;圖12a展示在頻譜擴展操作之一實例中多個點處之訊號頻譜之曲線;圖12b展示在頻譜擴展操作之另一實例中多個點處之訊號頻譜之曲線;圖13展示高頻帶激發產生器A302之一實施A304之方塊圖;圖14展示高頻帶激發產生器A302之一實施A306之方塊圖;圖15展示用於包絡計算任務T100之流程圖;圖16展示組合器490之一實施492之方塊圖;圖17說明計算高頻帶訊號S30之週期性之量測值的方法;圖18展示高頻帶激發產生器A302之一實施A312之方塊圖;圖19展示高頻帶激發產生器A302之一實施A314之方塊圖;圖20展示高頻帶激發產生器A302之一實施A316之方塊圖;圖21展示用於增益計算任務T200之流程圖;圖22展示用於增益計算任務T200之一實施T210之流程圖;圖23a展示成窗函數之圖;圖23b展示如圖23a中所示之成窗函數在語音訊號之子訊框中的應用;圖24展示高頻帶解碼器B200之一實施B202之方塊圖;圖25展示寬頻帶語音編碼器A100之一實施AD10之方塊圖;圖26a展示延遲線D120之一實施D122之示意圖;圖26b展示延遲線D120之一實施D124之示意圖;圖27展示延遲線D120之一實施D130之示意圖;圖28展示寬頻帶語音編碼器AD10之一實施AD12之方塊圖;圖29展示根據一組態之訊號處理方法MD100之流程圖;圖30展示用於根據一組態之方法M100之流程圖;圖31a展示用於根據一組態之方法M200之流程圖;圖31b展示用於方法M200之一實施M210之流程圖;圖32展示用於根據一組態之方法M300之流程圖;圖33說明無線通信系統之一組態;圖34為說明訊號傳輸環境之一組態之方塊圖;圖35為說明用於包括具有與語音訊號相關之封包之識別符的方法之一組態的流程圖;圖36為說明解碼封包之方法之一組態的流程圖;圖37為說明與多模式解碼器通信之多模式編碼器之一組態的方塊圖;圖38為說明可變速率語音編碼方法之一組態之流程圖;圖39為說明規則窄頻帶半速率封包及寬頻帶半速率封包之一組態之方塊圖;圖40為說明分配至多種類型之封包之位元數目的表;及圖41為在通信設備之一組態中之某些組件的方塊圖。
A100...寬頻帶語音編碼器
A102...寬頻帶語音編碼器
A110...濾波器組
A120...窄頻帶編碼器
A130...多工器
A200...高頻帶編碼器
S10...寬頻帶語音訊號
S20...窄頻帶訊號
S30...高頻帶訊號
S40...窄頻帶濾波器參數
S50...編碼窄頻帶激發訊號/窄頻帶殘餘訊號
S60...高頻帶編碼參數
S70...多工訊號

Claims (25)

  1. 一種用於在一與一語音訊號相關之封包中包含一識別符的方法,該方法包含:接收一訊號;將該訊號分割為複數個訊框;將該訊號之一訊框編碼至一封包中;確定該封包是否係以複數個編碼機制之一者來編碼;基於該確定,封裝一N位元參數之一非法值,其中該非法值識別一編碼機制,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式;及傳輸該封包。
  2. 如請求項1之方法,其中將該封包編碼為一寬頻帶半速率封包。
  3. 如請求項2之方法,其中該寬頻帶半速率封包包括80位元。
  4. 如請求項2之方法,其中該非法值為一寬頻帶識別符。
  5. 如請求項4之方法,其中該寬頻帶識別符包含二進位形式之十進位數一百二十六。
  6. 如請求項4之方法,其中該寬頻帶識別符包含二進位形式之十進位數一百二十七。
  7. 如請求項4之方法,其中該寬頻帶識別符包含二進位形式之六個一。
  8. 如請求項2之方法,其中使用一雜訊激發線性預測 (NELP)編碼機制來編碼該寬頻帶半速率封包。
  9. 如請求項1之方法,其中由一行動臺上之寬頻帶編碼器來編碼該訊框。
  10. 如請求項1之方法,進一步包含由一行動臺上之寬頻帶解碼器來解碼該訊框。
  11. 如請求項1之方法,進一步包含將該封包自一第一行動台傳輸至一第二行動台。
  12. 如請求項1之方法,其中用於載運資訊之來自該N位元參數的位元數等於log2 (X),其中X為用於該N位元參數之反轉非法值的數目。
  13. 一種用於在一與一語音訊號相關之封包中包含一識別符的裝置,其包含:一處理器;記憶體,其與該處理器電子通信;指令,其儲存於該記憶體中,該等指令可執行以:接收一訊號;將該訊號分割為複數個訊框;將該訊號之一訊框編碼至一封包中;確定該封包是否係以複數個編碼機制之一者來編碼;基於該確定,封裝一N位元參數之一非法值,其中該非法值識別一編碼機制,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式;及 傳輸該封包。
  14. 如請求項13之裝置,其中將該封包編碼為一寬頻帶半速率封包。
  15. 如請求項14之裝置,其中該寬頻帶半速率封包包括80位元。
  16. 如請求項14之裝置,其中該非法值為一寬頻帶識別符。
  17. 如請求項16之裝置,其中該寬頻帶識別符包含二進位形式之十進位數一百二十六。
  18. 如請求項16之裝置,其中該寬頻帶識別符包含二進位形式之十進位數一百二十七。
  19. 如請求項16之裝置,其中該寬頻帶識別符包含二進位形式之六個一。
  20. 一種經組態以在一與一語音訊號相關之封包中包含一識別符的系統,其包含:用於處理之構件;用於接收一訊號之構件;用於將該訊號分割為複數個訊框之構件;用於將該訊號之一訊框編碼至一封包中之構件;用於確定該封包是否係以複數個編碼機制之一者來編碼之構件;用於基於該確定,封裝一N位元參數之一非法值,其中該非法值識別一編碼機制,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式之構件;及 用於傳輸該封包之構件。
  21. 一種電腦可讀媒體,其經組態以儲存一組指令,可執行該等指令以:接收一訊號;將該訊號分割為複數個訊框;將該訊號之一訊框編碼至一封包中;確定該封包是否係以複數個編碼機制之一者來編碼;基於該確定,封裝一N位元參數之一非法值,其中該非法值識別一編碼機制,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式;及傳輸該封包。
  22. 一種用於解碼一封包之方法,該方法包含:接收一封包;確定一N位元參數之一非法值是否被包括在該封包,其中該非法值識別用於編碼該封包之複數個編碼機制之一者,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式;及基於該確定,選擇一用於該封包之解碼模式。
  23. 一種用於解碼一封包之裝置,其包含:一處理器;記憶體,其與該處理器電子通信;指令,其儲存於該記憶體中,該等指令可執行以: 接收一封包;確定一N位元參數之一非法值是否被包括在該封包,其中該非法值識別用於編碼該封包之複數個編碼機制之一者,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式;及基於該確定,選擇一用於該封包之解碼模式。
  24. 一種經組態以解碼一封包之系統,其包含:用於處理之構件;用於接收一封包之構件;用於確定一N位元參數之一非法值是否被包括在該封包的構件,其中該非法值識別用於編碼該封包之複數個編碼機制之一者,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少一位元形式;及用於基於該確定,選擇一用於該封包之解碼模式的構件。
  25. 一種電腦可讀媒體,其經組態以儲存一組指令,可執行該等指令以:接收一封包;確定一N位元參數之一非法值是否被包括在該封包,其中該非法值識別用於編碼該封包之複數個編碼機制之一者,其中該非法值為至少二個反轉非法值之一者,且該非法值包括來自用於載運資訊的該N位元參數之至少 一位元形式;及基於該確定,選擇一用於該封包之解碼模式。
TW096127832A 2006-07-31 2007-07-30 用於在一與一語音訊號相關之封包中包含一識別符之系統及方法 TWI384807B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US83461706P 2006-07-31 2006-07-31
US11/677,173 US8135047B2 (en) 2006-07-31 2007-02-21 Systems and methods for including an identifier with a packet associated with a speech signal

Publications (2)

Publication Number Publication Date
TW200816716A TW200816716A (en) 2008-04-01
TWI384807B true TWI384807B (zh) 2013-02-01

Family

ID=38920744

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096127832A TWI384807B (zh) 2006-07-31 2007-07-30 用於在一與一語音訊號相關之封包中包含一識別符之系統及方法

Country Status (10)

Country Link
US (1) US8135047B2 (zh)
EP (1) EP2047461B1 (zh)
JP (2) JP5437067B2 (zh)
KR (1) KR101058760B1 (zh)
CN (1) CN104123946B (zh)
BR (1) BRPI0714825A2 (zh)
CA (1) CA2657424C (zh)
RU (1) RU2421828C2 (zh)
TW (1) TWI384807B (zh)
WO (1) WO2008016947A2 (zh)

Families Citing this family (139)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
US8024192B2 (en) * 2006-08-15 2011-09-20 Broadcom Corporation Time-warping of decoded audio signal after packet loss
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
GB0705328D0 (en) 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
JP2011504250A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP5229234B2 (ja) * 2007-12-18 2013-07-03 富士通株式会社 非音声区間検出方法及び非音声区間検出装置
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
USRE47180E1 (en) * 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US7911975B2 (en) * 2008-08-26 2011-03-22 International Business Machines Corporation System and method for network flow traffic rate encoding
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
BR122019023709B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
WO2010134757A2 (ko) * 2009-05-19 2010-11-25 한국전자통신연구원 계층형 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
KR101697497B1 (ko) 2009-09-18 2017-01-18 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
KR101381272B1 (ko) 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
WO2011086923A1 (ja) * 2010-01-14 2011-07-21 パナソニック株式会社 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5593244B2 (ja) * 2011-01-28 2014-09-17 日本放送協会 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) * 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
ES2727131T3 (es) * 2011-02-16 2019-10-14 Dolby Laboratories Licensing Corp Decodificador con filtros configurables
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
PL2737479T3 (pl) * 2011-07-29 2017-07-31 Dts Llc Adaptacyjna poprawa zrozumiałości głosu
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
RU2504790C1 (ru) * 2012-05-24 2014-01-20 Открытое акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (ОАО "Российские космические системы") Способ и устройство поиска и обнаружения сигналов
KR101340048B1 (ko) * 2012-06-12 2013-12-11 (주)에프씨아이 스펙트럼 반전 검출 장치 및 방법
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
WO2014209434A1 (en) * 2013-02-15 2014-12-31 Max Sound Corporation Voice enhancement methods and systems
US9236058B2 (en) * 2013-02-21 2016-01-12 Qualcomm Incorporated Systems and methods for quantizing and dequantizing phase information
RU2740690C2 (ru) * 2013-04-05 2021-01-19 Долби Интернешнл Аб Звуковые кодирующее устройство и декодирующее устройство
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
JP6259911B2 (ja) 2013-06-09 2018-01-10 アップル インコーポレイテッド デジタルアシスタントの2つ以上のインスタンスにわたる会話持続を可能にするための機器、方法、及びグラフィカルユーザインタフェース
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
JP5892395B2 (ja) * 2014-08-06 2016-03-23 ソニー株式会社 符号化装置、符号化方法、およびプログラム
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10061554B2 (en) * 2015-03-10 2018-08-28 GM Global Technology Operations LLC Adjusting audio sampling used with wideband audio
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20170069306A1 (en) * 2015-09-04 2017-03-09 Foundation of the Idiap Research Institute (IDIAP) Signal processing method and apparatus based on structured sparsity of phonological features
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
PL3443557T3 (pl) 2016-04-12 2020-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio do kodowania sygnału audio, sposób kodowania sygnału audio i program komputerowy, z uwzględnieniem wykrytego regionu widmowego pełnego w wyższym pasmie częstotliwości
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN117278375A (zh) * 2017-10-27 2023-12-22 特拉沃夫有限责任公司 使用编码正弦波形的高频谱效率数据通信系统的接收器
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN111602197B (zh) * 2018-01-17 2023-09-05 日本电信电话株式会社 解码装置、编码装置、它们的方法以及计算机可读记录介质
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
CN110365615A (zh) * 2018-03-26 2019-10-22 晨星半导体股份有限公司 载波频偏估测装置与载波频偏估测方法
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
CN110660402B (zh) 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
RU2713750C1 (ru) * 2019-07-26 2020-02-07 Федеральное государственное автономное образовательное учреждение высшего образования "Дальневосточный федеральный университет" (ДВФУ) Способ когерентной разнесенной передачи сигнала
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN111510555B (zh) * 2020-04-03 2021-04-02 厦门亿联网络技术股份有限公司 一种dect基站通信方法、装置及系统
CN111769901B (zh) * 2020-05-12 2023-04-14 厦门亿联网络技术股份有限公司 一种传输数据帧的dect基站、移动终端及系统
CN113270105B (zh) * 2021-05-20 2022-05-10 东南大学 一种基于混合调制的类语音数据传输方法
CN114333862B (zh) * 2021-11-10 2024-05-03 腾讯科技(深圳)有限公司 音频编码方法、解码方法、装置、设备、存储介质及产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004006226A1 (en) * 2002-07-05 2004-01-15 Voiceage Corporation Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US6804340B2 (en) * 2001-05-03 2004-10-12 Raytheon Company Teleconferencing system
US20050177364A1 (en) * 2002-10-11 2005-08-11 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
TWI239184B (en) * 2001-10-24 2005-09-01 Qualcomm Inc Method and apparatus for data packet transport in a wireless communication system using an internet protocol
US7016834B1 (en) * 1999-07-14 2006-03-21 Nokia Corporation Method for decreasing the processing capacity required by speech encoding and a network element

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2225321T3 (es) 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
JPH06337153A (ja) 1993-05-28 1994-12-06 Toshiba Corp 空気調和機
CA2262894C (en) * 1997-06-19 2004-08-03 Kabushiki Kaisha Toshiba Information data multiplexing transmission system, multiplexer and demultiplexer used therefor, and error correcting encoder and decoder
KR100273288B1 (ko) * 1998-04-09 2000-12-15 김영환 디스플레이 패널용 데이터 제어 장치
US6567876B1 (en) * 1999-12-03 2003-05-20 Hewlett-Packard Development Company, L.P. Docking PCI to PCI bridge using IEEE 1394 link
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
RU2331933C2 (ru) 2002-10-11 2008-08-20 Нокиа Корпорейшн Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
JP4047296B2 (ja) 2004-03-12 2008-02-13 株式会社東芝 音声復号化方法及び音声復号化装置
DE502005006899D1 (de) * 2004-10-25 2009-04-30 Bosch Gmbh Robert Verfahren und vorrichtung zur trennung der abarbeitung von programmcode bei einem rechnersystem mit wenigstens zwei ausführungseinheiten
NZ562182A (en) 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
CN2800435Y (zh) * 2005-05-24 2006-07-26 鸿富锦精密工业(深圳)有限公司 一种便携式光盘播放器
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7747669B2 (en) * 2006-03-31 2010-06-29 Intel Corporation Rounding of binary integers

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016834B1 (en) * 1999-07-14 2006-03-21 Nokia Corporation Method for decreasing the processing capacity required by speech encoding and a network element
US6804340B2 (en) * 2001-05-03 2004-10-12 Raytheon Company Teleconferencing system
TWI239184B (en) * 2001-10-24 2005-09-01 Qualcomm Inc Method and apparatus for data packet transport in a wireless communication system using an internet protocol
WO2004006226A1 (en) * 2002-07-05 2004-01-15 Voiceage Corporation Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US20050177364A1 (en) * 2002-10-11 2005-08-11 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding

Also Published As

Publication number Publication date
WO2008016947A3 (en) 2008-03-20
JP2013210659A (ja) 2013-10-10
JP2010501080A (ja) 2010-01-14
RU2421828C2 (ru) 2011-06-20
TW200816716A (en) 2008-04-01
CN104123946B (zh) 2019-04-12
JP5437067B2 (ja) 2014-03-12
KR20090035727A (ko) 2009-04-10
BRPI0714825A2 (pt) 2013-05-21
WO2008016947A2 (en) 2008-02-07
RU2009107164A (ru) 2010-09-10
US8135047B2 (en) 2012-03-13
CA2657424C (en) 2013-05-28
KR101058760B1 (ko) 2011-08-24
CN104123946A (zh) 2014-10-29
EP2047461A2 (en) 2009-04-15
US20080027711A1 (en) 2008-01-31
CA2657424A1 (en) 2008-02-07
EP2047461B1 (en) 2013-04-17

Similar Documents

Publication Publication Date Title
TWI384807B (zh) 用於在一與一語音訊號相關之封包中包含一識別符之系統及方法
KR100956525B1 (ko) 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치