TWI598873B - 信號處理裝置及方法及其非暫時性處理器可讀媒體 - Google Patents

信號處理裝置及方法及其非暫時性處理器可讀媒體 Download PDF

Info

Publication number
TWI598873B
TWI598873B TW104119306A TW104119306A TWI598873B TW I598873 B TWI598873 B TW I598873B TW 104119306 A TW104119306 A TW 104119306A TW 104119306 A TW104119306 A TW 104119306A TW I598873 B TWI598873 B TW I598873B
Authority
TW
Taiwan
Prior art keywords
signal
high frequency
frequency band
value
band
Prior art date
Application number
TW104119306A
Other languages
English (en)
Other versions
TW201604865A (zh
Inventor
凡卡特拉曼S 阿堤
文卡特什 克里希南
維法克 雷真德倫
文卡塔 薩伯拉曼亞姆 強卓 賽克哈爾 奇比亞姆
蘇巴辛格哈 夏敏達 蘇巴辛格哈
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201604865A publication Critical patent/TW201604865A/zh
Application granted granted Critical
Publication of TWI598873B publication Critical patent/TWI598873B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

信號處理裝置及方法及其非暫時性處理器可讀媒體 優先權主張
本申請案主張來自2014年6月26日申請之題為「TEMPORAL GAIN ADJUSTMENT BASED ON HIGH-BAND SIGNAL CHARACTERISTIC」的美國臨時專利申請案第62/017,790號之優先權,該案之內容以全文引用之方式併入本文中。
本發明大體上係關於信號處理。
技術之進步已產生體積較小且功能更強大之計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括無線計算器件,諸如,攜帶型無線電話、個人數位助理(PDA)及傳呼器件,其體積小、重量輕且易於由使用者攜帶。更具體言之,攜帶型無線電話(諸如蜂巢式電話及網際網路協定(IP)電話)可經由無線網絡傳達語音及資料封包。另外,許多該等無線電話包括併入於其中之其他類型的器件。舉例而言,無線電話亦可包括數位靜態相機、數位視訊攝影機、數位記錄器及音頻檔案播放器。
由數位技術傳輸語音係普遍的,尤其在長距離及數位無線電電話應用中。判定可經由頻道發送之最少資訊量同時維持經重建構話音之所感知品質可係關注事項。若藉由取樣及數位化來傳輸話音,則數 量級為六十四千位元/每秒(kbps)之資料速率可用於達成類比電話的話音品質。經由在接收器處使用話音分析,繼之以寫碼、傳輸及重新合成,可達成資料速率的顯著減小。
用於壓縮話音之器件可用於許多電信領域中。例示性領域為無線通信。無線通信之領域具有許多應用,包括(例如)無線電話、傳呼、無線區域迴路、諸如蜂巢式及個人通信服務(PCS)電話系統之無線電話、行動網際網路協定(IP)電話及衛星通信系統。特定應用為用於行動用戶之無線電話。
已開發出用於無線通信系統之各種空中介面,包含(例如)分頻多重存取(FDMA)、分時多重存取(TDMA)、分碼多重存取(CDMA)及分時同步CDMA(TD-SCDMA)。結合該等空中介面,已建立了各種國內及國際標準,包括(例如)進階行動電話服務(AMPS)、全球行動通信系統(GSM)及暫行標準95(IS-95)。例示性無線電話通信系統為分碼多重存取(CDMA)系統。IS-95標準及其衍生標準(IS-95A、ANSI J-STD-008及IS-95B)(本文中統稱為IS-95)由電信上業協會(TIA)及其他公認標準機構頒佈以指定CDMA空中介面針對蜂巢式或PCS電話通信系統的使用。
IS-95標準隨後演進成諸如cdma2000及WCDMA的「3G」系統,該等「3G」系統提供更大容量及高速度封包資料服務。cdma2000之兩個變體由TIA發佈之文件IS-2000(cdma2000 1xRTT)及IS-856(cdma2000 1xEV-DO)呈現。cdma2000 1xRTT通信系統給予153kbps之峰值資料速率,而cdma2000 1xEV-DO通信系統定義範圍介於38.4kbps至2.4Mbps之資料速率集合。WCDMA標準體現於第三代合作夥伴計劃「3GPP」第3G TS 25.211號、第3G TS 25.212號、第3G TS 25.213號及第3G TS 25.214號文件中。進階國際行動電信(進階IMT)規範闡述「4G」標準。對於高行動性通信(例如,來自火車及汽車),進 階IMT規範設定100百萬位元/秒(Mbit/s)之峰值資料速率用於4G服務,且對於低行動性通信(例如,來自行人及固定使用者)設定1十億位元/秒(Gbit/s)的峰值資料速率。
使用藉由提取關於人類話音產生模型之參數來壓縮話音之技術的器件被稱為話音編碼器。話音寫碼器可包含編碼器及解碼器。編碼器將傳入話音信號劃分成時間區塊或分析訊框。可將每一時間分段(或「訊框」)之持續時間選擇為足夠短,以使得可預期信號之頻譜包絡為保持相對固定。舉例而言,一個訊框長度為20毫秒,此對應於8千赫(kHz)取樣速率下的160個樣本,儘管可使用被視為適合於特定應用之任何訊框長度或取樣速率。
編碼器分析傳入話音訊框以提取某些相關參數,且接著將該等參數量化成二進位表示,亦即,量化成位元集合或二進位資料封包。經由通信頻道(亦即,有線及/或無線網路連接)將資料封包傳輸至接收器及解碼器。解碼器處理資料封包、去量化經處理資料封包以產生參數並使用經去量化參數重新合成話音訊框。
話音寫碼器之功能為藉由移除話音中固有之自然冗餘而將經數位化話音信號壓縮成低位元速率信號。可藉由用參數集合表示輸入話音訊框及使用量化以藉由位元集合表示參數來達成數位壓縮。若輸入話音訊框具有位元數目Ni,且由話音寫碼器所產生之資料封包具有位元數目No,則由話音寫碼器所達成之壓縮因數為Cr=Ni/No。挑戰為在達成目標壓縮因數時保持經解碼話音之高語音品質。話音寫碼器之效能取決於:(1)話音模型或上文所描述之分析及合成程序之組合執行得有多好;及(2)在每訊框No個位元之目標位元速率下參數量化程序執行得有多好。因此,話音模型之目標係在針對每一訊框具有小參數集合的情況下擷取話音信號之本質或目標語音品質。
話音寫碼器通常利用參數集合(包括向量)來描述話音信號。良好 參數集合向感知上準確之話音信號的重建構理想地提供低系統頻寬。音調、信號功率、頻譜包絡(或共振峰)、振幅及相譜為話音寫碼參數之實例。
話音寫碼器可經實施為時域寫碼器,其試圖藉由使用高時間解析度處理以每次編碼小的話音區段(通常為5毫秒(ms)之子訊框)來擷取時域話音波形。對於每一子訊框,借助於搜尋演算法發現來自碼簿空間之高精確度代表。替代地,話音寫碼器可經實施為頻域寫碼器,其試圖用參數集合(分析)來擷取輸入話音頻框之短期話音頻譜,且使用對應合成程序以自頻譜參數來重新產生話音波形。參數量化器藉由根據已知量化技術用碼向量之所儲存表示來表示參數而保留參數。
一個時域話音寫碼器為碼激勵線性預測(CELP)寫碼器。在CELP寫碼器中,藉由找到短期共振峰濾波器之係數的線性預測(LP)分析來移除話音信號中之短期相關或冗餘。將短期預測濾波器應用於傳入話音訊框產生LP殘餘信號,LP殘餘信號係用長期預測濾波器參數及後續隨機碼簿予以進一步模型化及量化。因此,CELP寫碼將編碼時域話音波形之任務劃分成編碼LP短期濾波器係數及編碼LP殘餘之單獨任務。可以固定速率(亦即,針對每一訊框使用相同數目(No)個位元)或以可變速率(其中針對不同類型之訊框內容使用不同位元速率)執行時域寫碼。可變速率寫碼器試圖使用將寫碼解碼器參數編碼至充分獲得目標品質之位準所需要的位元量。
諸如CELP寫碼器之時域寫碼器通常可依賴於每訊框高數目(N0)個位元以保留時域話音波形之準確度。倘若每訊框之位元數目No相對大(例如,8kbps或高於8kbps),則此等寫碼器可遞送極好的語音品質。在低位元速率(例如,4kbps及低於4kbps)下,歸因於受限數目個可用位元,時域寫碼器可不能保持高品質及穩健效能。在低位元速率下,受限碼簿空間削減在較高速率商業應用中所部署的時域寫碼器之 波形匹配能力。因此,儘管隨時間推移進行改良,但以低位元速率操作之許多CELP寫碼系統仍遭受特徵化為雜訊的感知明顯失真。
低位元速率下對CELP寫碼器的替代例為根據類似於CELP寫碼器之原理操作的「雜訊激勵線性預測」(NELP)寫碼器。NELP寫碼器使用經濾波偽隨機雜訊信號來模型化話音而非碼簿。由於NELP將較簡單模型用於經寫碼話音,因此NELP達成比CELP低之位元速率。NELP可用於壓縮或表示無聲話音或靜默。
以大約為2.4kbps之速率操作的寫碼系統本質上大體上係參數的。亦即,此等寫碼系統藉由以規則間隔傳輸描述話音信號之音調週期及頻譜包絡(或共振峰)的參數進行操作。此等所謂的參數寫碼器的說明為LP聲碼器系統。
LP聲碼器藉由每音調週期單一脈衝來模型化有聲話音信號。可擴增此基本技術以包括關於頻譜包絡以及其他事項的傳輸資訊。儘管LP聲碼器提供大體合理之效能,但其可引入特徵化為傳言之感知顯著失真。
近年來,已出現為波形寫碼器及參數寫碼器兩者之混合的寫碼器。此等所謂的混合寫碼器之說明為原型波形內插(PWI)話音寫碼系統。PWI寫碼系統亦可被稱為原型音調週期(PPP)話音寫碼器。PWI寫碼系統提供用於寫碼有聲話音之高效方法。PWI之基本概念為以固定間隔提取代表性音調週期(原型波形)、傳輸其描述及藉由在原型波形之間進行內插而重建構話音信號。PWI方法可對LP殘餘信號抑或話音信號進行操作。
可存在對改良話音信號(例如,經寫碼話音信號、經重建構話音信號或二者)之音訊品質的研究關注及商業關注。舉例而言,通信器件可接收具有低於最佳語音品質之語音品質的話音信號。為了說明,通信器件可在語音呼叫期間自另一通信器件接收話音信號。歸因於各 種原因(諸如,環境雜訊(例如,風、街道雜訊)、通信器件之介面的限制、由通信器件進行之信號處理、封包丟失、頻寬限制、位元速率限制等),語音呼叫品質可受損。
在傳統電話系統(例如,公眾交換電話網路(PSTN))中,信號頻寬限於300赫茲(Hz)至3.4千赫茲(kHz)的頻率範圍。在諸如蜂巢式電話及網際網路語音通訊協定之寬頻(WB)應用中,信號頻寬可跨越自50Hz至7kHz之頻率範圍。超寬頻(SWB)寫碼技術支援擴展至16kHz左右的頻寬。將信號頻寬自3.4kHz之窄頻電話擴展至16kHz之SWB電話可改良信號重建構之品質、可懂度及自然度。
SWB寫碼技術通常涉及編碼及傳輸信號之較低頻率部分(例如,0Hz至6.4kHz,亦稱為「低頻帶」)。舉例而言,可使用濾波器參數及/或低頻帶激勵信號表示低頻帶。然而,為了改良寫碼效率,信號之較高頻率部分(例如,6.4kHz至16kHz,亦稱為「高頻帶」)可能未經充分編碼並傳輸。實情為,接收器可利用信號模型化以預測高頻帶。在一些實施中,可將與高頻帶相關聯之資料提供至接收器以輔助預測。此資料可被稱為「旁側資訊」,且可包含增益資訊、線譜頻率(LSF,亦被稱為線譜對(LSP))等。在使用信號模型化編碼及解碼高頻帶信號時,非吾人所樂見之雜訊或可聽偽訊在某些條件下可被引入至高頻帶信號中。
在特定態樣中,一種方法包括在一編碼器處判定一輸入音訊信號之一高頻帶部分之一較高頻率範圍的一信號特徵是否滿足一臨限值。該方法亦包括產生對應於該高頻帶部分之一高頻帶激勵信號;基於該高頻帶激勵信號產生一經合成高頻帶部分;及基於該經合成高頻帶部分與該高頻帶部分的一比較來判定一時間增益參數之一值。該方法進一步包括回應於該信號特徵滿足該臨限值,調整該時間增益參數 的該值。調整該時間增益參數之該值控制該時間增益參數的一可變性。
在另一特定態樣中,一種裝置包括一預處理模組,其經組態以對一輸入音訊信號之至少一部分進行濾波以產生複數個輸出。該裝置亦包括一第一濾波器,其經組態以判定該輸入音訊信號之一高頻帶部分之一較高頻率範圍的一信號特徵。該裝置進一包括一高頻帶激勵產生器,其經組態以產生對應於該高頻帶部分的一高頻帶激勵信號;及一第二濾波器,其經組態以基於該高頻帶激勵信號產生一經合成高頻帶部分。該裝置亦包括一時間包絡估計器,其經組態以:基於該經合成高頻帶部分與該高頻帶部分的一比較來判定一時間增益參數之一值;及回應於該信號特徵滿足一臨限值,調整該時間增益參數的該值。調整該時間增益參數之該值控制該時間增益參數的一可變性。
在另一特定態樣中,一種非暫時性處理器可讀媒體包括指令,該等指令在由處理器執行時使得該處理器執行包括以下操作的操作:判定一輸入音訊信號之一高頻帶部分之一較高頻率範圍的一信號特徵是否滿足一臨限值。該等操作亦包括:產生對應於該高頻帶部分之一高頻帶激勵信號;基於該高頻帶激勵信號產生一經合成高頻帶部分;及基於該經合成高頻帶部分與該高頻帶部分的一比較來判定一時間增益參數之一值。該等操作進一步包括回應於該信號特徵滿足該臨限值,調整該時間增益參數的該值。調整該時間增益參數之該值控制該時間增益參數的一可變性。
在另一特定態樣中,一種裝置包括用於對一輸入音訊信號之至少一部分進行濾波以產生複數個輸出的構件。該裝置亦包括用於基於該複數個輸出判定該輸入音訊信號之一高頻帶部分之一較高頻率範圍的一信號特徵是否滿足一臨限值的構件。該裝置進一步包括用於產生對應於該高頻帶部分之一高頻帶激勵信號的構件;用於基於該高頻帶 激勵信號產生一經合成高頻帶部分的構件;及用於估計該高頻帶部分之一時間包絡的構件。該用於估計之構件經組態以:基於該經合成高頻帶部分與該高頻帶部分的一比較來判定一時間增益參數之一值;及回應於該信號特徵滿足該臨限值,調整該時間增益參數的該值。調整該時間增益參數之該值控制該時間增益參數的一可變性。
在另一特定態樣中,一種調整一編碼器之線性預測係數(LPC)的方法包括在該編碼器處基於使用一線性預測(LP)階數之一第一值的LP增益操作來判定LP增益。該LP增益與一LP合成濾波器之一能量位準相關聯。該方法亦包括比較該LP增益與一臨限值,及在該LP增益滿足該臨限值情況下將該LP階數自該第一值減小至一第二值。
在另一特定態樣中,一種裝置包括一編碼器及儲存指令的一記憶體,該等指令由該編碼器可執行以執行操作。該等操作包括基於使用一線性預測(LP)階數之一第一值的LP增益操作來判定LP增益。該LP增益與一LP合成濾波器之一能量位準相關聯。該等操作亦包括比較該LP增益與一臨限值,及在該LP增益滿足該臨限值情況下將該LP階數自該第一值減小至一第二值。
在另一特定態樣中,一種非暫時性電腦可讀媒體包括用於調整一編碼器之線性預測係數(LPC)的指令。該等指令在由該編碼器執行時使得該編碼器執行操作。該等操作包括基於使用一線性預測(LP)階數之一第一值的LP增益操作來判定LP增益。該LP增益與一LP合成濾波器之一能量位準相關聯。該等操作亦包括比較該LP增益與一臨限值,及在該LP增益滿足該臨限值情況下將該LP階數自該第一值減小至一第二值。
在另一特定態樣中,一種裝置包括用於基於使用一線性預測(LP)階數之一第一值的LP增益操作來判定LP增益的構件。該LP增益與一LP合成濾波器之一能量位準相關聯。該裝置亦包括用於比較該LP增 益與一臨限值之構件,及用於在該LP增益滿足該臨限值情況下將該LP階數自該第一值減小至一第二值的構件。
100‧‧‧系統
102‧‧‧音訊信號
110‧‧‧預處理模組
112‧‧‧正交鏡像濾波器(QMF)濾波器
122‧‧‧低頻帶信號
124‧‧‧高頻帶信號
126‧‧‧高頻帶信號特徵
130‧‧‧低頻帶分析模組
132‧‧‧線性預測(LP)分析及寫碼模組
134‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
136‧‧‧量化器
142‧‧‧低頻帶位元串流
144‧‧‧低頻帶激勵信號
150‧‧‧高頻帶分析模組
152‧‧‧線性預測(LP)分析及寫碼模組
154‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
156‧‧‧量化器
160‧‧‧高頻帶激勵產生器
161‧‧‧高頻帶激勵信號
162‧‧‧增益調整器
163‧‧‧碼簿
164‧‧‧合成模組
165‧‧‧臨限值
172‧‧‧高頻帶旁側資訊
180‧‧‧多工器
192‧‧‧輸出位元串流
200‧‧‧編碼器
201‧‧‧輸入信號
202‧‧‧分析濾波器
203‧‧‧信號
204‧‧‧低頻帶編碼器/ACELP編碼器
205‧‧‧低頻帶激勵信號
206‧‧‧取樣器/增加取樣器
207‧‧‧經增加取樣信號
208‧‧‧第一非線性變換產生器/非線性變換模組
209‧‧‧經頻寬擴展信號
210‧‧‧第一頻譜翻轉模組
211‧‧‧「經翻轉」信號
212‧‧‧切換器
214‧‧‧極零濾波器
215‧‧‧帶通信號
216‧‧‧降混器
217‧‧‧信號
218‧‧‧濾波器
219‧‧‧信號
220‧‧‧切換器
222‧‧‧適應性白化及按比例調整模組
230‧‧‧隨機雜訊產生器
232‧‧‧雜訊包絡模組
234‧‧‧按比例調整模組
240‧‧‧組合器
241‧‧‧高頻帶激勵信號
242‧‧‧頻譜翻轉模組
243‧‧‧經翻轉信號
244‧‧‧濾波器
245‧‧‧帶通信號
246‧‧‧降混器
247‧‧‧高頻帶「目標」信號
248‧‧‧線性預測(LP)分析模組
250‧‧‧線性預測係數(LPC)至線譜對(LSP)轉換器
252‧‧‧量化模組
260‧‧‧合成濾波器
261‧‧‧經合成高頻帶信號
262‧‧‧時間包絡估計模組
263‧‧‧增益資訊
264‧‧‧量化模組
400‧‧‧解碼器
401‧‧‧經編碼音訊信號
402‧‧‧第一資料
403‧‧‧第二資料
404‧‧‧低頻帶解碼器/ACELP核心解碼器
461‧‧‧經量化線譜對(LSP)索引
462‧‧‧時間包絡應用程式模組
463‧‧‧增益包絡資料
464‧‧‧混頻器
466‧‧‧取樣器
468‧‧‧頻譜翻轉模組
469‧‧‧高頻帶經解碼信號
470‧‧‧合成濾波器組
471‧‧‧低頻帶經解碼信號
473‧‧‧經合成音訊信號
500‧‧‧基於高頻帶信號特徵調整時間增益參數之方法
520‧‧‧基於高頻帶信號特徵調整時間增益參數之方法
540‧‧‧調整編碼器之LPC的方法
600‧‧‧器件
602‧‧‧數位至類比轉換器(DAC)
604‧‧‧類比至數位轉換器(ADC)
606‧‧‧處理器
608‧‧‧話音及音樂寫碼器解碼器
610‧‧‧處理器
612‧‧‧回波消除器
622‧‧‧系統級封裝或系統單晶片器件
626‧‧‧顯示控制器
628‧‧‧顯示器
630‧‧‧輸入器件
632‧‧‧記憶體
634‧‧‧寫碼解碼器
636‧‧‧聲碼器編碼器
638‧‧‧聲碼器解碼器
640‧‧‧無線控制器
642‧‧‧天線
644‧‧‧電源供應器
646‧‧‧麥克風
648‧‧‧揚聲器
650‧‧‧收發器
656‧‧‧指令
662‧‧‧增益形狀調整器
672‧‧‧信號重建構
圖1為說明可操作以基於高頻帶信號特徵調整時間增益參數之系統之特定態樣的圖;圖2為說明可操作以基於高頻帶信號特徵調整時間增益參數之編碼器之組件的特定態樣的圖;圖3包括說明根據特定態樣之信號之頻率分量的圖;圖4為說明解碼器之組件之特定態樣的圖,該解碼器可操作以使用基於高頻帶信號特徵調整之時間增益參數來合成音訊信號的高頻帶部分;圖5A描繪一流程圖以說明基於高頻帶信號特徵調整時間增益參數之方法的特定態樣;圖5B描繪一流程圖以說明計算高頻帶信號特徵之方法之特定態樣;圖5C描繪一流程圖以說明調整編碼器之調整線性預測係數(LPC)之方法的特定態樣;且圖6為可操作以執行根據圖1至圖5B之系統、裝置及方法的信號處理操作之無線器件的方塊圖。
揭示基於高頻帶信號特徵調整時間增益資訊的系統及方法。舉例而言,時間增益資訊可包括增益形狀參數,其在按子訊框基礎上於編碼器處產生。在某些情形下,輸入至編碼器之音訊信號在高頻帶中可具有極少內容或無內容(例如,關於高頻帶可經「頻帶有限」)。舉例而言,頻帶有限信號可於在與SWB模型相容之電子器件、不能越過整個高頻帶擷取資料的器件等處之音訊擷取期間產生。為了說明,特 定無線電話可能不能或可經程式化以避免在高於8kHz、高於10kHz等的頻率下擷取資料。當編碼此等頻帶有限信號時,信號模型(例如,SWB諧波模型)可歸因於時間增益之大的變化引入可聽偽訊。
為了減小此等偽訊,編碼器(例如,話音編碼器或「聲碼器」)可判定待編碼之音訊信號的信號特徵。在一個實例中,信號特徵為音訊信號之高頻帶部分之較高頻率區中的能量之總和。作為非限制性實例,信號特徵可藉由對12kHz至16kHz頻率範圍內之分析濾波器組輸出之能量求和來判定,且可因此對應於高頻帶「信號底限」。如本文所使用,音訊信號之高頻帶部分的「較高頻率區」可對應於低於音訊信號之高頻帶部分之頻寬的任何頻率範圍(在音訊信號之高頻帶部分的較高部分處)。作為非限制性實例,若音訊信號之高頻帶部分由6.4kHz至14.4kHz頻率範圍特徵化,則音訊信號之高頻帶部分的較高頻率區可由10.6kHz至14.4kHz頻率範圍特徵化。作為另一非限制性實例,若音訊信號之高頻帶部分由8kHz至16kHz頻率範圍特徵化,則音訊信號之高頻帶部分的較高頻率區可由13kHz至16kHz頻率範圍特徵化。編碼器可處理音訊信號之高頻帶部分以產生高頻帶激勵信號,且可基於高頻帶激勵信號產生高頻帶部分之經合成版本。基於「原始」高頻帶部分與經合成高頻帶部分的比較,編碼器可判定增益形狀參數的值。若高頻帶部分之信號特徵滿足臨限值(例如,信號特徵指示音訊信號係頻帶有限的且具有極少高頻帶內容或無高頻帶內容),則編碼器可調整增益形狀參數之值以限制增益形狀參數的可變性(例如,受限動態範圍)。限制增益形狀參數之可變性可減小在頻帶有限音訊信號之編碼/解碼期間產生的偽訊。
參看圖1,可操作以基於高頻帶信號特徵調整時間增益參數之系統的特定態樣經展示,並通常指定為100。在一特定態樣中,系統100可整合至編碼系統或裝置中(例如,無線電話或寫碼器/解碼器(寫碼解 碼器)中)。
應注意,在以下描述中,將由圖1之系統100執行之各種功能描述為由某些組件或模組執行。然而,組件及模組之此劃分僅係為了說明。在替代態樣中,由特定組件或模組所執行之功能可替代地劃分於多個組件或模組之間。此外,在替代態樣中,圖1之兩個或兩個以上組件或模組可整合至單一組件或模組中。可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、數位信號處理器(DSP)、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施圖1中所說明之每一組件或模組。
系統100包括經組態以接收音訊信號102的預處理模組110。舉例而言,音訊信號102可由麥克風或其他輸入器件提供。在特定態樣中,音訊信號102可包括話音。音訊信號102可為超寬頻(SWB)信號,其包括在大約50赫茲(Hz)至大約16千赫茲(kHz)之頻率範圍內的資料。預處理模組110可基於頻率將音訊信號102濾波成多個部分。舉例而言,預處理模組110可產生低頻帶信號122及高頻帶信號124。低頻帶信號122及高頻帶信號124可具有相等或不等頻寬,且可重疊或不重疊。
在特定態樣中,低頻帶信號122及高頻帶信號124對應於不重疊頻率頻帶中的資料。舉例而言,低頻帶信號122及高頻帶信號124可對應於50Hz至7kHz及7kHz至16kHz的不重疊頻率頻帶中的資料。在替代態樣中,低頻帶信號122及高頻帶信號124可對應於50Hz至8kHz且8kHz至16kHz的不重疊頻率頻帶中的資料。在另一替代態樣中,低頻帶信號122及高頻帶信號124對應於重疊頻帶(例如,50Hz至8kHz及7kHz至16kHz),其可使預處理模組110之低通濾波器及高通濾波器能夠具有光滑滾落,其可簡化設計且減少低通濾波器及高通濾波器的成本。使低頻帶信號122及高頻帶信號124重疊亦可實現接收器處 低頻帶及高頻帶信號之光滑摻合,其可引起更少聽覺偽訊。
在特定態樣中,預處理模組110包括分析濾波器組。舉例而言,預處理模組110可包括正交鏡像濾波器(QMF)濾波器組,其包括複數個QMF。每一QMF可對音訊信號102的一部分進行濾波。作為另一實例,預處理模組110可包括複合低延遲濾波器組(CLDFB)。預處理模組110亦可包括經組態以翻轉音訊信號102之頻譜的頻譜翻轉器。因此,在特定態樣中,儘管高頻帶信號124對應於音訊信號102的高頻帶部分,但高頻帶信號124可作為基頻信號進行傳達。
在特定SWB態樣中,濾波器組包括40個QMF濾波器,其中每一濾波器(例如,說明性QMF濾波器112)對音訊信號102之400Hz部分進行操作。每一QMF濾波器112可產生包括實部及虛部的濾波器輸出。預處理模組110可對來自對應於音訊信號102之高頻帶部分之較高頻率部分的QMF濾波器的濾波器輸出求和。舉例而言,預處理模組110可對來自對應於12kHz至16kHz頻率範圍之10個QMF的輸出求和,該等QMF使用著色圖案展示於圖1中。預處理模組110可基於經求和之QMF輸出來判定高頻帶信號特徵126。在一特定態樣中,預處理模組110對QMF輸出之總和進行長期求平均運算以判定高頻帶信號特徵126。為了說明,預處理模組110可根據以下偽碼進行操作:
儘管以上偽碼說明使用分析濾波器組在10個頻帶(例如,表示12至16kHz資料的10個400Hz頻帶)上之長期求平均運算,但應瞭解,預處理模組110可根據實質上類似於針對不同分析濾波器組之偽碼、頻帶之不同數目及/或資料的不同頻率範圍操作。作為非限制性實例,預處理模組110可將複合低延遲分析濾波器組用於表示13至16kHz資料的20個頻帶。
在特定態樣中,高頻帶信號特徵126在按子訊框基礎上判定。為了說明,音訊信號102可被劃分成複數個訊框,其中每一訊框對應於大約20毫秒(ms)的音訊。每一訊框可包括複數個子訊框。舉例而言,每一20ms訊框可包括四個5ms(或大約5ms)子訊框。在替代態樣中,訊框及子訊框可對應於不同時間長度,且不同數目個子訊框可包括於每一訊框中。
應注意,儘管圖1的實例說明SWB信號的處理,但此僅為了說明。在替代態樣中,音訊信號102可為具有大約50Hz至大約8kHz之頻率範圍的寬頻(WB)信號。在此態樣中,低頻帶信號122可對應於大約50Hz至大約6.4kHz之頻率範圍,且高頻帶信號124可對應於大約6.4kHz至大約8kHz的頻率範圍。
系統100可包括經組態以接收低頻帶信號122的低頻帶分析模組 130。在特定態樣中,低頻帶分析模組130可表示碼激勵線性預測(CELP)編碼器的態樣。低頻帶分析模組130可包括線性預測(LP)分析及寫碼模組132、線性預測係數(LPC)至線譜對(LSP)變換模組134及量化器136。LSP亦可被稱作線譜頻率(LSF),且該兩個術語在本文中可以互換地使用。LP分析及寫碼模組132可將低頻帶信號122之頻譜包絡編碼成LPC之集合。可針對音訊之每一訊框(例如,對應於16kHz之取樣速率下之320個樣本的20毫秒之音訊)、音訊之每一子訊框(例如,5ms之音訊)或其任何組合產生LPC。可由所執行LP分析之「階數」判定針對每一訊框或子訊框所產生之LPC的數目。在特定態樣中,LP分析及寫碼模組132可產生對應於第十階LP分析的十一個LPC之集合。
LPC至LSP變換模組134可將由LP分析及寫碼模組132所產生的LPC之集合變換成對應LSP集合(例如,使用一對一變換)。替代性地,LPC之集合可經一對一地變換成部分自相關係數、對數面積比率值、導譜對(ISP)或導譜頻率(ISF)之對應集合。LPC集合與LSP集合之間的變換可係可逆的而不存在誤差。
量化器136可量化由變換模組134產生的LSP之集合。舉例而言,量化器136可包括或耦接至包括多個條目(例如,向量)的多個碼簿。為量化LSP之集合,量化器136可識別“最接近”(例如,基於諸如最小平方或均方誤差之失真量度)LSP集合的碼簿的條目。量化器136可輸出對應於碼簿中所識別條目之位置的索引值或一系列索引值。因此,量化器136之輸出可表示包括於低頻帶位元串流142中之低頻帶濾波器參數。
低頻帶分析模組130亦可產生低頻帶激勵信號144。舉例而言,低頻帶激勵信號144可為藉由量化LP殘餘信號產生的經編碼信號,在由低頻帶分析模組130執行的LP程序期間產生該LP殘餘信號。LP殘餘信號可表示預測誤差。
系統100可進一步包括高頻帶分析模組150,其經組態以自預處理模組110接收高頻帶信號124及高頻帶信號特徵126並自低頻帶分析模組130接收低頻帶激勵信號144。高頻帶分析模組150可產生高頻帶旁側資訊(例如,參數)172。舉例而言,高頻帶旁側資訊172可包括高頻帶LSP、增益資訊等。
高頻帶分析模組150可包括高頻帶激勵產生器160。高頻帶激勵產生器160可藉由將低頻帶激勵信號144的頻譜擴展到高頻帶頻率範圍(例如,8kHz至16kHz)中而產生高頻帶激勵信號161。為了說明,高頻帶激勵產生器160可對低頻帶激勵信號應用變換(例如,非線性變換,諸如絕對值或平方運算),且可將經變換低頻帶激勵信號與雜訊信號(例如,根據對應於低頻帶激勵信號144的包絡而調變的白雜訊,其模仿低頻帶信號122的緩慢變化的時間特徵)混合來產生高頻帶激勵信號161。
高頻帶激勵信號161可用於判定包括於高頻帶旁側資訊172中的一或多個高頻帶增益參數。如所說明,高頻帶分析模組150亦可包括LP分析及寫碼模組152、LPC至LSP變換模組154及量化器156。LP分析及寫碼模組152、變換模組154及量化器156中之每一者可如上文參考低頻帶分析模組130之對應組件所描述但以相對減少之解析度(例如,對於每一係數、LSP等使用較少位元)起作用。LP分析及寫碼模組152可產生由變換模組154變換至LSP並由量化器156基於碼簿163量化的LPC之集合。舉例而言,LP分析及寫碼模組152、變換模組154及量化器156可使用高頻帶信號124來判定包括於高頻帶旁側資訊172中的高頻帶濾波器資訊(例如,高頻帶LSP)。在特定態樣中,高頻帶分析模組150可包括本地解碼器,其基於由變換模組154產生之LPC使用濾波器係數,且接收高頻帶激勵信號161作為輸入。本地解碼器之合成濾波器(例如,合成模組164)的輸出,諸如高頻帶信號124之經合成 版本,可與高頻帶信號124進行比較,且增益參數(例如,訊框增益及/或時間包絡增益塑形值)可經判定、量化並包括於高頻帶旁側資訊172中。
在特定態樣中,高頻帶旁側資訊172可包括高頻帶LSP以及高頻帶增益參數。舉例而言,高頻帶旁側資訊172可包括時間增益參數(例如,增益形狀參數),其指示高頻帶信號124之頻譜包絡隨時間如何演進。舉例而言,增益形狀參數可係基於「原始」高頻帶部分與經合成高頻帶部分之間的正規化能量之比率。增益形狀參數可在按子訊框基礎上來經判定並應用。在特定態樣中,亦可判定並應用第二增益參數。舉例而言,「增益訊框」參數可跨越整個訊框來判定並應用,其中增益訊框參數對應於特定訊框之高頻帶與低頻帶的能量比率。
舉例而言,高頻帶分析模組150可包括合成模組164,其經組態以基於高頻帶激勵信號161產生高頻帶信號124的經合成版本。高頻帶分析模組150亦可包括增益調整器162,其基於「原始」高頻帶信號124與由合成模組164產生之高頻帶信號的經合成版本之比較來判定增益形狀參數的值。為了說明,對於包括四個子訊框之特定音訊訊框,高頻帶信號124對於各別子訊框可具有10、20、30、20的值(例如,振幅或能量)。高頻帶信號之經合成版本可具有值10、10、10、10。增益調整器162可判定各別子訊框的增益形狀參數之值為1、2、3、2。在解碼器處,增益形狀參數值可用以使高頻帶信號之經合成版本塑形以更緊密地反映「原始」高頻帶信號124。在特定態樣中,增益調整器162可使增益形狀參數值正規化為0與1之間的值。舉例而言,增益形狀參數值可經正規化為0.33、0.67、1、0.33。
在特定態樣中,增益調整器162可基於高頻帶信號特徵126是否滿足臨限值165來調整增益形狀參數的值。該臨限值165可為固定或可調整的。滿足臨限值165之高頻帶信號特徵126可指示,音訊信號102 在高頻帶部分(例如,8kHz至16kHz)之較高頻率區(例如,12kHz至16kHz)中包括小於臨限量的音訊內容。因此,與經合成域相對,高頻帶信號特徵可在濾波/分析域(例如,QMF域)中判定。當音訊信號102在高頻帶部分之較高頻率區中包括極少內容或不包括內容時,增益的大擺動可由高頻帶分析模組150編碼,從而在信號解碼上引起可聽偽訊。為了減小此等偽訊,增益調整器162可在高頻帶信號特徵滿足臨限值165時調整增益形狀參數值。調整增益形狀參數值可限制增益形狀參數的可變性(例如,動態範圍)。為了說明,增益調整器可根據以下偽碼操作:
在替代態樣中,臨限值165可儲存於預處理模組110處或可用於該預處理模組,且預處理模組110可判定高頻帶信號特徵126是否滿足臨限值165。在此態樣中,預處理模組110可發送指示符(例如,位元)至增益調整器162。指示符在高頻帶信號特徵126滿足臨限值165時可具有第一值(例如,1),且在高頻帶信號特徵126並不滿足臨限值165時可具有第二值(例如,0)。增益調整器162可基於指示符具有第一值抑或第二值而調整增益形狀參數的值。
低頻帶位元串流142及高頻帶旁側資訊172可由多工器(MUX)180進行多路傳輸以產生輸出位元串流192。輸出位元串流192可表示對應 於音訊信號102之經編碼音訊信號。舉例而言,輸出位元串流192可經傳輸(例如,經由有線、無線或光學通道)及/或儲存。在接收器處,反向操作可由解多工器(DEMUX)、低頻帶解碼器、高頻帶解碼器及濾波器組來執行以產生音訊信號(例如,音訊信號102之提供至揚聲器其他輸出器件的經重建構版本)。用於表示低頻帶位元串流142之位元數目可實質上大於用於表示高頻帶旁側資訊172之位元數目。因此,輸出位元串流192中之大部分位元可表示低頻帶資料。高頻帶旁側資訊172可用於接收器處以根據信號模型自低頻帶資料重新產生高頻帶激勵信號。舉例而言,信號模型可表示低頻帶資料(例如,低頻帶信號122)與高頻帶資料(例如,高頻帶信號124)之間的關係或相關性之預期集合。因此,不同信號模型可用於不同種類之音訊資料(例如,話音、音樂等),且在使用中之特定信號模型在傳達經編碼音訊資料之前可由傳輸器及接收器協商(或藉由業界標準界定)。使用信號模型,傳輸器處之高頻帶分析模組150可能能夠產生高頻帶旁側資訊172,使得接收器處之對應高頻帶分析模組能夠使用信號模型自輸出位元串流192重建構高頻帶信號124。
藉由在高頻帶信號特徵滿足臨限值時選擇性地調整時間增益資訊(例如,增益形狀參數),圖1的系統100在經編碼信號經頻帶有限(例如,包括很少高頻帶內容或不包括高頻帶內容)時可減小可聽偽訊。圖1的系統100因此在輸入信號並不附接至使用中的信號模型時可實現約束時間增益。
參看圖2,展示用於編碼器200中之組件的特定態樣。在說明性態樣中,編碼器200對應於圖1的系統100。
編碼器200可接收具有為「F」之頻寬的輸入信號201(例如,具有自0Hz至F Hz之頻率範圍的信號,諸如當F=16,000=16k時為0Hz至16kHz)。分析濾波器202可輸出輸入信號201的低頻帶部分。自分析 濾波器202輸出之信號203可具有自0Hz至F1 Hz(諸如,在F1=6.4k時為0Hz至6.4kHz)的頻率分量。
諸如ACELP編碼器(例如,圖1之低頻帶分析模組130中的LP分析及寫碼模組132)之低頻帶編碼器204可編碼信號203。ACELP編碼器204可產生諸如LPC之寫碼資訊及低頻帶激勵信號205。
來自ACELP編碼器的低頻帶激勵信號205(其亦可由接收器中之ACELP解碼器再現,諸如圖4中所描述)可在取樣器206處經增加取樣,使得經增加取樣信號207的有效頻寬在自0Hz至F Hz的頻率範圍內。低頻帶激勵信號205可由取樣器206接收,此係由於樣本集合對應於12.8kHz之取樣速率(例如,6.4kHz低頻帶激勵信號205之奈奎斯取樣速率)。舉例而言,低頻帶激勵信號205可以低頻帶激勵信號205之頻寬的速率兩倍之速率進行取樣。
第一非線性變換產生器208可經組態以基於經增加取樣信號207產生說明為非線性激勵信號的經頻寬擴展信號209。舉例而言,非線性變換產生器208可對經增加取樣信號207執行非線性變換操作(例如,絕對值運算或平方運算)以產生經頻寬擴展信號209。非線性變換操作可將原始信號(自0Hz至F1 Hz(例如,0Hz至6.4kHz)之低頻帶激勵信號205)之諧波擴展至較高頻帶,諸如自0Hz擴展至F Hz(例如,自0Hz至16kHz)。
經頻寬擴展信號209可經提供至第一頻譜翻轉模組210。第一頻譜翻轉模組210可經組態以執行經頻寬擴展信號209的頻譜鏡像操作(例如,「翻轉」頻譜)以產生「經翻轉」信號211。翻轉經頻寬擴展信號209之頻譜可將經頻寬擴展信號209之內容改變(例如,「翻轉」)至經翻轉信號211之範圍為0Hz至F Hz(例如,子0Hz至16kHz)的頻譜之相對末端。舉例而言,經頻寬擴展信號209在14.4kHz處的內容可在經翻轉信號211之1.6kHz處,經頻寬擴展信號209在0Hz處的內容可在 經翻轉信號211的16kHz處等。
經翻轉信號211可提供至切換器212之輸入,其以第一操作模式選擇性地路由經翻轉信號211至包括濾波器214及降混器216的第一路徑,或以第二操作模式路由該經翻轉信號至包括濾波器218的第二路徑。舉例而言,切換器212可包括多工器,其對控制輸入處指示編碼器200之操作模式的信號作出回應。
在第一操作模式中,經翻轉信號211在濾波器214處經帶通濾波,以產生帶通信號215,該帶通信號在自(F-F2)Hz至(F-F1)Hz之頻率範圍外部具有減少或移除的信號內容,其中F2>F1。舉例而言,當F=16k、F1=6.4k且F2=14.4k時,經翻轉信號211可經帶通濾波至頻率範圍1.6kHz至9.6kHz。濾波器214可包括極零濾波器,其經組態以作為具有在大約F-F1處(例如,在16kHz-6.4kHz=9.6kHz處)之截止頻率的低通濾波器操作。舉例而言,極零濾波器可為高階濾波器,其在截止頻率處具有急劇下降,且經組態以濾除經翻轉信號211的高頻分量(例如,經翻轉信號211之在(F-F1)與F之間諸如在9.6kHz與16kHz之間的分量)。此外,濾波器214可包括高通濾波器,其經組態以使輸出信號中在F-F2以下(例如,在16kHz-14.4kHz=1.6kHz以下)的頻率分量衰減。
帶通信號215可經提供至降混器216,其可產生具有自0Hz擴展至(F2-F1)Hz諸如自0Hz至8KHz的有效信號頻寬之信號217。舉例而言,降混器216可經組態以將帶通信號215自在1.6kHz與9.6kHz之間的頻率範圍降混至基頻(例如,0Hz與8kHz之間的頻率範圍)以產生信號217。降混器216可使用兩階赫伯特(Hilbert)變換來實施。舉例而言,降混器216可使用具有虛數分量及實數分量之兩個五階無限脈衝回應(IIR)濾波器來實施。
在第二操作模式中,切換器212提供經翻轉信號211至濾波器218 以產生信號219。濾波器218可作為低通濾波器操作以使(F2-F1)Hz以上(例如,8kHz以上)的頻率分量衰減。濾波器218處之低通濾波可作為重新取樣程序的部分執行,在該重新取樣程序處,取樣速率經轉換成2*(F2-F1)(例如,成2*(14.4Hz-6.4Hz=16kHz))。
切換器220輸出信號217、219中之一者以根據操作模式在適應性白化及按比例調整模組222處處理,且適應性白化及按比例調整模組處的輸出經提供至諸如加法器之組合器240的第一輸入。組合器240之第二輸入接收自隨機雜訊產生器230的輸出產生之信號,該輸出已根據雜訊包絡模組232(例如,調變器)及按比例調整模組234進行了處理。組合器240產生高頻帶激勵信號241,諸如圖1之高頻帶激勵信號161。
具有在0Hz與F Hz之間的頻率範圍內之有效頻寬的輸入信號201亦可在基頻信號產生路徑處處理。舉例而言,輸入信號201可在頻譜翻轉模組242處在頻譜上翻轉以產生經翻轉信號243。經翻轉信號243可在濾波器244處經帶通濾波以產生帶通信號245,該帶通信號具有在自(F-F2)Hz至(F-F1)Hz(例如,自1.6kHz至9.6kHz)之頻率範圍外部的經移除或減小之信號分量。
在特定態樣中,濾波器244判定輸入信號201之高頻帶部分之較高頻率範圍的信號特徵。作為說明性非限制性實例,濾波器244可基於對應於12kHz至16kHz頻率範圍之濾波器輸出判定高頻帶信號底限的長期平均值,如參看圖1所描述。圖3說明此等頻帶有限信號(指示為1至7)的實例。此等頻帶有限信號之線性預測係數(LPC)估計引起在高頻帶中導致偽訊的量化及穩定性的問題。舉例而言,若經32kHz取樣之輸入信號經頻帶有限至10kHz(亦即,在10kHz以上且直至奈奎斯存在極其有限的能量)且高頻帶正自8至16kHz或6.4至14.4kHz編碼,則來自8至10kHz的頻帶有限頻譜內容可引起高頻帶LPC估計中 的穩定性問題。詳言之,LP係數在以所要固定點精度Q格式表示時可歸因於精度損失而飽和。在此等情境下,較低預測階數可用於LP分析(例如,使用LPC階數=2或4而非10)。用於LP分析之LPC階數的此減小以限制飽和度及穩定性問題可基於LP合成濾波器的LP增益或能量來執行。若LP增益高於特定臨限值,則LPC階數可經調整至較低值。LP合成濾波器之能量藉由|1/A(z)|^2給出,其中A(z)為LP分析濾波器。對應於48dB之為64的典型LP增益值為良好指示符以檢查此等頻帶有限情境下的高LP增益,且控制預測階數以避免LPC估計中的飽和度問題。
帶通信號245可在降混器246處進行降混以產生高頻帶「目標」信號247,其具有在自0Hz至(F2-F1)Hz(例如,自0Hz至8kHz)之頻率範圍內的有效信號頻寬。高頻帶目標信號247為對應於第一頻率範圍的基頻信號。
表示對高頻帶激勵信號241之修改使得其表示高頻帶目標信號247的參數可經提取並傳輸至解碼器。為了說明,高頻帶目標信號247可由LP分析模組248處理以產生LPC,該等LPC在LPC至LSP轉換器250處經轉換成LSP,並在量化模組252處量化。量化模組252可產生待發送至解碼器之LSP量化索引,諸如在圖1之高頻帶旁側資訊172中。
LPC可用以組態合成濾波器260,其接收高頻帶激勵信號241作為輸入並產生經合成高頻帶信號261作為輸出。經合成高頻帶信號261在時間包絡估計模組262處與高頻帶目標信號247進行比較(例如,信號261及247的能量可在各別信號之每一子訊框處進行比較)以產生增益資訊263,諸如增益形狀參數值。增益資訊263經提供至量化模組264以產生經量化增益資訊索引以發送至解碼器,諸如在圖1之高頻帶旁側資訊172中。
如上文所描述,若LP增益高於特定臨限值以減小飽和度,則較低預測階數可用於LP分析(例如,使用LPC階數=2或4而非10)。為了說明,LP分析模組248可根據以下偽碼進行操作:
基於偽碼,LP分析模組分析模組248可基於使用LP階數之第一值的LP增益操作來判定LP增益。舉例而言,LP分析模組248可使用函數「ener_1_Az」估計LP增益(例如,「enerG」)。函數可使用16階濾波器(例如,十六階增益計算)來估計LP增益。LP分析模組248亦可比較增益與臨限值。根據偽碼,臨限值具有為64的數值。然而,應理解,偽碼中之臨限值僅用作非限制性實例,且其他數值可用作臨限值。LP分析模組248亦可判定能量位準(「enerG」)是否超出限值。舉例而言,LP分析模組248可使用函數「is_numeric_float」判定能量位準是否係「無限的」。若LP分析模組248判定,能量位準(例如,LP增益)滿 足臨限值(例如,大於臨限值)或超出限值或兩者,則LP分析模組248可將LP階數自第一值(例如,16)減小至第二值(例如,2或4)以減小LPC飽和度的似然度。
在特定態樣中,在由濾波器244判定之信號特徵滿足臨限值時(例如,當信號特徵指示輸入信號201在高頻帶部分之較高頻率範圍中具有極少內容或不具有內容時),時間包絡估計模組262可調整增益形狀參數的值。當編碼此等信號時,增益形狀參數之值的廣泛擺動在訊框間及/或在子訊框間發生,從而導致經重建構音訊信號的可聽偽訊。舉例而言,如圖3中用圓圈表示,高頻帶偽訊可存在於經重建構音訊信號中。本發明的技術在輸入信號201在高頻帶部分或至少其較高頻率區中具有極少內容或無內容時,可藉由選擇性地調整增益形狀參數值來實現減小或消除此等偽訊的存在。
如關於第一路徑所描述,在第一操作模式中,高頻帶激勵信號241產生路徑包括降混操作以產生信號217。此降混操作在經由赫伯特變換器實施情況下可為複合的。替代實施可係基於正交鏡像濾波器(QMF)。在第二操作模式中,降混操作並非包括於高頻帶激勵信號241產生路徑中。此導致高頻帶激勵信號241與高頻帶目標信號247之間的失配。應瞭解,根據第二模式(例如,使用濾波器218)產生高頻帶激勵信號241可繞過極零濾波器214及降混器216,且減小與極零濾波及降混器相關聯的複雜且計算上昂貴之操作。儘管圖2描述第一路徑(包括濾波器214及降混器216)及第二路徑(包括濾波器218)與編碼器200的獨特操作模式相關聯,但在其他態樣中,編碼器200可經組態而以第二模式操作,而非經組態以亦以第一模式操作(例如,編碼器200可省略切換器212、濾波器214、降混器216及切換器220,從而使濾波器218的輸入經耦接以接收經翻轉信號211且使信號219提供至適應性白化及按比例調整模組222)。
圖4描繪解碼器400之特定態樣,該解碼器可用以解碼經編碼音訊信號,諸如由圖1之系統100或圖2之編碼器200產生的經編碼音訊信號。
解碼器400包括接收經編碼音訊信號401的低頻帶解碼器404,諸如ACELP核心解碼器404。經編碼音訊信號401為音訊信號之經編碼版本,諸如圖2之輸入信號201;且包括對應於音訊信號之低頻帶部分的第一資料402(例如,低頻帶激勵信號205及經量化LSP索引)及對應於音訊信號之高頻帶部分的第二資料403(例如,增益包絡資料463及經量化LSP索引461)。在特定態樣中,增益包絡資料463包括增益形狀參數值,其在輸入信號(例如,輸入信號201)在高頻帶部分(或其較高頻率區)中具有極少內容或無內容時經選擇性地調整以限制可變性/動態範圍。
低頻帶解碼器404產生經合成低頻帶解碼信號471。高頻帶信號合成包括提供圖2之低頻帶激勵信號205(或低頻帶激勵信號205之表示,諸如低頻帶激勵信號205的接收自編碼器之經量化版本)至圖2的增加取樣器206。高頻帶合成包括如由切換器212及220所控制使用增加取樣器206、非線性變換模組208、頻譜翻轉模組210、濾波器214及降混器216(在第一操作模式中)或濾波器218(在第二操作模式)產生高頻帶激勵信號241,且使用適應性白化及按比例調整模組222來提供第一輸入至圖2的組合器240。至組合器之第二輸入由隨機雜訊產生器230的由雜訊包絡模組232處理的輸出產生,且在圖2之按比例調整模組234處進行按比例調整。
圖2之合成濾波器260可根據諸如由圖2之編碼器200之量化模組252輸出的接收自編碼器之LSP量化索引而在解碼器400中組態,且處理由組合器240輸出的激勵信號241以產生經合成信號。經合成信號提供至時間包絡應用模組462,其經組態以應用諸如增益形狀參數值的 一或多個增益(例如,根據自圖2之編碼器200的量化模組264輸出的增益包絡索引)來產生經調整信號。
高頻帶合成以混頻器464進行之處理繼續,該混頻器經組態以將信號自0Hz至(F2-F1)Hz之頻率範圍升混(upmix)至(F-F2)Hz至(F-F1)Hz(例如,1.6kHz至9.6kHz)的頻率範圍。由混頻器464輸出之升混信號在取樣器466處經增加取樣,且取樣器466之經增加取樣輸出經提供至頻譜翻轉模組468,該頻譜翻轉模組468可如關於頻譜翻轉模組210所描述而操作,以產生具有自F1 Hz擴展至F2 Hz之頻率頻帶的高頻帶經解碼信號469。
由低頻帶解碼器404輸出之低頻帶解碼信號471(自0Hz至F1 Hz)及自頻譜翻轉模組468輸出的高頻帶經解碼信號469(自F1 Hz至F2 Hz)經提供至合成濾波器組470。合成濾波器組470基於低頻帶經解碼信號471與高頻帶經解碼信號469的組合產生經合成音訊信號473,諸如圖2之音訊信號201的經合成版本,且具有自0Hz至F2 Hz的頻率範圍。
如關於圖2所描述,根據第二模式(例如,使用濾波器218)產生高頻帶激勵信號241可繞過極零濾波器214及降混器216,且減小與極零濾波及降混器相關聯的複合且計算上昂貴之操作。儘管圖4描述第一路徑(包括濾波器214及降混器216)及第二路徑(包括濾波器218)為與解碼器400之獨特操作模式相關聯,但在其他態樣中,解碼器400可經組態而以第二模式操作而無需可組態而以第一模式操作(例如,解碼器400可省略切換器212、濾波器214、降混器216及切換器220,使濾波器218之輸入耦接以接收經翻轉信號211並使信號219提供至適應性白化及按比例調整模組222的輸入)。
參看圖5A,展示基於高頻帶信號特徵調整時間增益參數之方法500的特定態樣。在說明性態樣中,可由圖1的系統100或圖2的編碼器200執行方法500。
方法500可包括在502處判定音訊信號之高頻帶部分之較高頻率範圍的信號特徵是否滿足臨限值。舉例而言,在圖1中,增益調整器162可判定信號特徵126是否滿足臨限值165。
前進至504,方法500可產生對應於高頻帶部分的高頻帶激勵信號。方法500可在506處進一步基於高頻帶激勵信號來產生經合成高頻帶部分。舉例而言,在圖1中,高頻帶激勵產生器160可產生高頻帶激勵信號161,且合成模組164可基於高頻帶激勵信號161產生合經成高頻帶部分。
繼續至508,方法500可基於經合成高頻帶部分與高頻帶部分的比較來判定時間增益參數(例如,增益形狀)的值。方法500亦可包括在510處判定信號特徵是否滿足臨限值。當信號特徵滿足臨限值時,方法500可包括在512處調整該時間增益參數的值。調整時間增益參數之值可限制時間增益參數的可變性。舉例而言,在圖1中,在高頻帶信號特徵126滿足臨限值165(例如,高頻帶信號特徵126指示音訊信號102在高頻帶部分(或至少其較高頻率區)中具有極少內容或無內容)時,增益調整器162可調整增益形狀參數的值。在說明性態樣中,調整增益形狀參數之值包括基於正規化常數(例如,0.315)與增益形狀參數之第一值的特定百分數(例如,10%)之總和來計算增益形狀參數的第二值,如參看圖1描述之偽碼中所展示。
當信號特徵並不滿足臨限值時,方法500可包括在514處使用時間增益參數的未調整值。舉例而言,在圖1中,當音訊信號102在高頻帶部分(或至少其較高頻率區)中包括足夠內容時,增益調整器162可避免限制增益形狀參數值的可變性。
在特定態樣中,圖5A的方法500可經由諸如中央處理單元(CPU)、數位信號處理器(DSP)或控制器等的處理單元之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)實施, 經由韌體器件實施,或其任何組合來實施。作為實例,可由執行指令之處理器(如關於圖6所描述)執行圖5A之方法500。
參看圖5B,展示計算高頻帶信號特徵之方法520的特定態樣。在說明性態樣中,可由圖1的系統100或圖2的編碼器200執行方法520。
方法520包括在522處經由對音訊信號執行頻譜翻轉操作而產生音訊信號的經頻譜翻轉版本以在基頻下處理音訊信號的高頻帶部分。舉例而言,參看圖2,頻譜翻轉模組242可藉由對輸入信號201執行頻譜翻轉操作而產生經翻轉信號243(例如,輸入信號201的頻譜經翻轉版本)。在頻譜上翻轉輸入信號201可實現基頻下處理輸入信號201之高頻帶部分之較高頻率範圍(例如,12至16kHz部分)。
在524處,可基於音訊信號之經頻譜翻轉版本來計算能量值之總和。舉例而言,參看圖1,預處理模組110可對能量值之總和執行長期求平均運算。能量值可對應於QMF輸出,該等QMF輸出對應於輸入信號201之高頻帶部分的較高頻率範圍。能量值之總和可指示高頻帶信號特徵126。
圖5B之方法520可減小在頻帶有限音訊信號之編碼/解碼期間產生的偽訊。舉例而言,能量值之總和的長期平均值可指示高頻帶信號特徵126。若高頻帶信號特徵126滿足臨限值(例如,信號特徵指示音訊信號係頻帶有限的且具有極少高頻帶內容或無高頻帶內容),則編碼器可調整增益形狀參數之值以限制增益形狀參數的可變性(例如,受限動態範圍)。限制增益形狀參數之可變性可減小在頻帶有限音訊信號之編碼/解碼期間產生的偽訊。
在特定態樣中,圖5B之方法520可經由諸如中央處理單元(CPU)、數位信號處理器(DSP)或控制器的處理單元之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)實施,經由韌體器件實施,或其任何組合實施。作為實例,可由執行指令之處 理器(如關於圖6所描述)執行圖5B之方法520。
參看圖5C,展示調整編碼器之LPC的方法540之特定態樣。在說明性態樣中,可由圖1的系統100或圖2的LP分析模組248執行方法540。根據一個實施,LP分析模組248可根據上文所描述以執行方法540的對應偽碼而操作。
方法540包括於542處在編碼器處基於使用線性預測(LP)階數之第一值的LP增益操作來判定LP增益。該LP增益可與一LP合成濾波器之一能量位準相關聯。舉例而言,參看圖2,LP分析模組248可基於使用LP階數之第一值的LP增益計算來判定LP增益。根據一個實施,第一值對應於十六階濾波器。該LP增益可與LP合成濾波器260之一能量位準相關聯。舉例而言,能量位準可對應於脈衝回應能量位準,其係基於音訊訊框之音訊訊框大小且基於針對音訊訊框產生的LPC之數目。合成濾波器260(例如,LP合成濾波器)可對自低頻帶激勵信號之非線性擴展產生(例如,自經頻寬擴展信號209產生)的高頻帶激勵信號241作出回應。
在544處,可比較LP增益與臨限值。舉例而言,參看圖2,LP分析模組248可比較LP增益與臨限值。在546處,若LP增益滿足臨限值,則LP階數可自第一值減小至第二值。舉例而言,參看圖2,若LP增益滿足(例如,高於)臨限值,則LP分析模組248可將LP階數自第一值減小至第二值。根據一個實施,第二值對應於二階濾波器。根據另一實施,第二值對應於四階濾波器。
方法540亦可包括判定能量位準是否超出限值。舉例而言,參看圖2,LP分析模組248可判定合成濾波器260之能量位準是否超出限值(例如,可使得能量值被解釋為具有不正確數值的「無限」限值)。LP階數回應於合成濾波器260之能量位準超出限值而可自第一值減小至第二值。
在特定態樣中,圖5C的方法540可經由諸如CPU、DSP或控制器之處理單元的硬體(例如,FPGA器件、ASIC等)實施,經由韌體器件實施,或其任何組合來實施。作為實例,可由執行指令之處理器(如關於圖6所描述)執行圖5C之方法540。
參看圖6,器件(例如,無線通信器件)之特定說明性態樣的方塊圖經描繪並通常指定為600。在各種態樣中,器件600可具有比圖6中所說明較少或較多之組件。在說明性態樣中,器件600可對應於一或多個系統、裝置或參看圖1、圖2及圖4描述之器件的一或多個組件。在說明性態樣中,器件600可根據諸如圖5A之方法500、圖5B之方法520及/或圖5C之方法540的全部或一部分的本文中所描述之一或多種方法而操作。
在特定態樣中,器件600包括處理器606(例如,中央處理單元(CPU))。器件600可包括一或多個額外處理器610(例如,一或多個數位信號處理器(DSP))。處理器610可包括話音及音樂寫碼器解碼器(寫碼解碼器)608及回波消除器612。話音及音樂寫碼解碼器608可包括聲碼器編碼器636、聲碼器解碼器638或該兩者。
在特定態樣中,聲碼器編碼器636可包括圖1之系統100或圖2的編碼器200。聲碼器編碼器636可包括增益形狀調整器662,其經組態以基於高頻帶信號特徵來選擇性地調整時間增益資訊(例如,增益形狀參數值)(例如,當高頻帶信號特徵指示輸入音訊信號在高頻帶部分之較高頻率範圍內具有極少內容或無內容)。
聲碼器解碼器638可包括圖4的解碼器400。舉例而言,聲碼器解碼器638可經組態以基於經調整之增益形狀參數值執行信號重建構672。儘管話音及音樂寫碼解碼器608說明為處理器610的組件,但在其他態樣中,話音及音樂編解碼器608之一或多個組件可包括於處理器606、寫碼解碼器634、另一處理組件或其組合中。
器件600可包括記憶體632及經由收發器650耦接至天線642的無線控制器640。器件600可包括耦接至顯示控制器626之顯示器628。揚聲器648、麥克風646或該兩者可耦接至寫碼解碼器634。寫碼解碼器634可包括數位至類比轉換器(DAC)602及類比至數位轉換器(ADC)604。
在特定態樣中,寫碼解碼器634可自麥克風646接收類比信號、使用類比至數位轉換器604將類比信號轉換成數位信號並將數位信號諸如以脈碼調變(PCM)格式提供至話音及音樂寫碼解碼器608。話音及音樂寫碼解碼器608可處理數位信號。在特定態樣中,話音及音樂寫碼解碼器608可將數位信號提供至寫碼解碼器634。寫碼解碼器634可使用數位至類比轉換器602將數位信號轉換成類比信號且可將類比信號提供至揚聲器648。
記憶體632可包括指令656,該等指令可由處理器606、處理器610、寫碼解碼器634、器件600之另一處理單元或其組合執行以執行本文中所揭示之方法及程序(諸如,圖5A至圖5B之方法中之一或多者)。圖1、圖2或圖4之系統的一或多個組件可由執行指令以執行一或多個任務或其組合的處理器經由專用硬體(例如,電路)來實施。作為實例,記憶體632或處理器606、處理器610及/或寫碼解碼器634之一或多個組件可為記憶體器件,諸如隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟或光碟唯讀記憶體(CD-ROM)。記憶體器件可包括指令(例如,指令656),其在由電腦(例如,寫碼解碼器634中之處理器、處理器606及/或處理器610)執行時可使得電腦執行圖5A至圖5B之方法的至少一部分。作為實例,記憶體632 或處理器606、處理器610、寫碼解碼器634的一或多個組件可為包括指令(例如,指令656)的非暫時性電腦可讀媒體,該等指令在由電腦(例如,寫碼解碼器634中之處理器、處理器606及/或處理器610)執行時使得電腦執行圖5A至圖5B之方法的至少一部分。
在特定態樣中,器件600可包括於系統級封裝或系統單晶片器件622(諸如,行動台數據機(MSM))中。在特定態樣中,處理器606、處理器610、顯示控制器626、記憶體632、寫碼解碼器634、無線控制器640及收發器650包括於系統級封裝或系統單晶片器件622中。在特定態樣中,諸如觸控式螢幕及/或小鍵盤等之輸入器件630及電源供應器644耦接至系統但晶片器件622。此外,在特定態樣中,如圖6中所說明,顯示器628、輸入器件630、揚聲器648、麥克風646、天線642及電源供應器644在系統單晶片器件622外部。然而,顯示器628、輸入器件630、揚聲器648、麥克風646、天線642及電源供應器644中的每一者可耦接至系統單晶片器件622的組件,諸如介面或控制器。在說明性態樣中,器件600對應於行動通信器件、智慧型電話、蜂巢式電話、膝上型電腦、電腦、平板電腦、個人數位助理、顯示器件、電視、遊戲控制台、音樂播放器、收音機、數位視訊播放器、光碟播放器、調諧器、攝影機、導航器件、解碼器系統、編碼器系統或其任何組合。
在說明性態樣中,處理器610可操作以根據所描述技術執行信號編碼及解碼操作。舉例而言,麥克風646可擷取音訊信號。ADC 604可將所擷取音訊信號自類比波形轉換成包括數位音訊樣本之數位波形。處理器610可處理數位音訊樣本。回波消除器612可減少可已由進入麥克風646的揚聲器648之輸出所產生的回波。
聲碼器編碼器636可壓縮對應於經處理話音信號之數位音訊樣本且可形成傳輸封包(例如,數位音訊樣本之經壓縮位元表示)。舉例而 言,傳輸封包可對應於圖1之位元串流192之至少一部分。傳輸封包可儲存在記憶體632中。收發器650可調變某一形式之傳輸封包(例如,可將其他資訊隨附於該傳輸封包)且可經由天線642傳輸經調變資料。
作為另一實例,天線642可接收包括接收封包之傳入封包。可由另一器件經由網路發送接收封包。舉例而言,接收封包可對應於在圖4之ACELP核心解碼器404處接收到的位元串流之至少一部分。聲碼器解碼器638可解壓縮並解碼接收封包以產生經重建構音訊樣本(例如,對應於經合成音訊信號473)。回波消除器612可移除來自經重建構音訊樣本之回波。DAC 602可將聲碼器解碼器638之輸出自數位波形轉換成類比波形且可將經轉換波形提供至揚聲器648以用於輸出。
熟習此項技術者將進一步瞭解,各種說明性邏輯區塊、組態、模組、電路及結合本文中所揭示之態樣描述的演算法步驟可實施為電子硬體、由諸如硬體處理器之處理器件執行的電腦軟體,或兩者的組合。上文已大體在功能性方面描述了各種說明性組件、區塊、組態、模組、電路及步驟。此功能性經實施為硬體或是軟體取決於特定應用及強加於整個系統之設計約束。對於每一特定應用而言,熟習此項技術者可以變化之方式實施所描述之功能性,但不應將該等實施決策解釋為導致脫離本發明之範疇。
結合本文中所揭示之態樣所描述的方法或演算法之步驟可直接具體化於硬體中、由處理器執行之軟體模組中或兩者之組合中。軟體模組可駐留於記憶體器件中,諸如隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟或光碟唯讀記憶體(CD-ROM)。例示性記憶體器件耦接至處理器,使得處理器可自記憶體器 件讀取資訊並將資訊寫入至記憶體器件。在替代方案中,記憶體器件可與處理器成一體式。處理器及儲存媒體可駐留於特殊應用積體電路(ASIC)中。ASIC可駐留於計算器件或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐留於計算器件或使用者終端機中。
提供所揭示態樣之先前描述以使得熟習此項技術者能夠製作或使用所揭示態樣。對於熟習此項技術者而言,對此等態樣之各種修改將易於顯而易見,且可在不背離本發明之範疇的情況下將本文中所界定之一般原理應用於其他態樣。因此,本發明並非意欲限於本文中所展示之實施例,而應符合可能與如以下申請專利範圍所界定之原理及新穎特徵相一致的最廣泛範疇。
100‧‧‧系統
102‧‧‧音訊信號
110‧‧‧預處理模組
112‧‧‧正交鏡像濾波器(QMF)濾波器
122‧‧‧低頻帶信號
124‧‧‧高頻帶信號
126‧‧‧高頻帶信號特徵
130‧‧‧低頻帶分析模組
132‧‧‧線性預測(LP)分析及寫碼模組
134‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
136‧‧‧量化器
142‧‧‧低頻帶位元串流
144‧‧‧低頻帶激勵信號
150‧‧‧高頻帶分析模組
152‧‧‧線性預測(LP)分析及寫碼模組
154‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
156‧‧‧量化器
160‧‧‧高頻帶激勵產生器
161‧‧‧高頻帶激勵信號
162‧‧‧增益調整器
163‧‧‧碼簿
164‧‧‧合成模組
165‧‧‧臨限值
172‧‧‧高頻帶旁側資訊
180‧‧‧多工器
192‧‧‧輸出位元串流

Claims (38)

  1. 一種信號處理方法,其包含:在一音訊編碼器處基於一音訊信號之一經頻譜翻轉版本計算能量值之一總和,能量值之該總和對應於該音訊信號之一高頻帶部分之一較高頻率範圍;在該音訊編碼器處判定該高頻帶部分之該較高頻率範圍之一信號特徵是否滿足一臨限值;產生對應於該高頻帶部分之一高頻帶激勵信號;基於該高頻帶激勵信號產生一經合成高頻帶部分;基於該經合成高頻帶部分與該高頻帶部分之一比較來判定一時間增益參數之一值;回應於該信號特徵滿足該臨限值,調整該時間增益參數之該值,其中調整該時間增益參數之該值控制該時間增益參數之一可變性;及傳輸該時間增益參數作為來自該音訊編碼器之一位元串流之部分至一接收器。
  2. 如請求項1之方法,其中調整該時間增益參數之該值限制該時間增益參數之該可變性。
  3. 如請求項1之方法,其中該等能量值對應於一分析濾波器組之輸出,且該方法進一步包含對能量值的該總和執行一求平均運算以判定該信號特徵。
  4. 如請求項1之方法,其中該計算、該判定該信號特徵是否滿足該臨限值、該產生該高頻帶激勵信號、該產生該經合成高頻帶部分、該判定該值及該調整該值係於包含一行動通信器件之一器件中執行。
  5. 如請求項1之方法,其中該音訊信號之該高頻帶部分的該較高頻率範圍對應於該音訊信號之該經頻譜翻轉版本之一較低頻率範圍,其中該等能量值處於一對數域中,且其中該等能量值對應於一正交鏡像濾波器(QMF)分析濾波器組,一複合低延遲濾波器組,或一變換分析濾波器組之輸出。
  6. 如請求項1之方法,其中該計算、該判定該信號特徵是否滿足該臨限值、該產生該高頻帶激勵信號、該產生該經合成高頻帶部分、該判定該值及該調整該值係於包含一固定位置通信器件之一器件中執行。
  7. 如請求項1之方法,其中該高頻帶激勵信號係基於該音訊信號之一低頻帶部分之一諧波擴展來產生。
  8. 如請求項1之方法,其進一步包含:對該音訊信號之該經頻譜翻轉版本執行一帶通濾波操作以產生一經帶通濾波信號;及對該經帶通濾波信號執行一降混操作以在基頻下產生一經降混信號。
  9. 如請求項1之方法,其進一步包含對該音訊信號之該經頻譜翻轉版本執行一低通濾波操作以產生一經低通濾波信號。
  10. 如請求項1之方法,其中該信號特徵對應於該高頻帶部分之該較高頻率範圍的一信號能量。
  11. 如請求項1之方法,其中該高頻帶部分之該較高頻率範圍包括介於12千赫茲(kHz)與16kHz之間之一頻率範圍。
  12. 如請求項1之方法,其中該信號特徵係基於該音訊信號之該經頻譜翻轉版本來判定。
  13. 如請求項12之方法,其中該信號特徵對應於一經平均高頻帶信號底限。
  14. 如請求項1之方法,其中該信號特徵滿足該臨限值指示該音訊信號在該高頻帶部分中具有有限內容。
  15. 如請求項1之方法,其中該時間增益參數包括一增益形狀參數。
  16. 如請求項15之方法,其進一步包含針對該音訊信號之複數個子訊框中之每一者判定該增益形狀參數之值。
  17. 如請求項15之方法,其中調整該增益形狀參數之該值包含基於一正規化常數與該增益形狀參數之一第一值之一特定百分數之一總和來計算該增益形狀參數之一第二值。
  18. 如請求項15之方法,其中調整該增益形狀參數之該值包括基於一正規化常數與該增益形狀參數之一第一值的10%之一總和計算該增益形狀參數之一第二值。
  19. 一種信號處理裝置,其包含:一音訊編碼器之一預處理模組,該預處理模組經組態以對一音訊信號之至少一部分進行濾波以基於該音訊信號之該經頻譜翻轉版本計算能量值之一總和,能量值之該總和對應於該音訊信號之一高頻帶部分之一較高頻率範圍;一第一濾波器,其經組態以判定該高頻帶部分之該較高頻率範圍之一信號特徵;一高頻帶激勵產生器,其經組態以產生對應於該高頻帶部分之一高頻帶激勵信號;一第二濾波器,其經組態以基於該高頻帶激勵信號產生一經合成高頻帶部分;一時間包絡估計器,其經組態以進行以下操作:基於該經合成高頻帶部分與該高頻帶部分之一比較來判定一時間增益參數之一值;及回應於該信號特徵滿足一臨限值,調整該時間增益參數之 該值,其中調整該時間增益參數之該值控制該時間增益參數之一可變性;及一傳輸器,其經組態以傳輸該時間增益參數作為一位元串流之部分至一接收器。
  20. 如請求項19之裝置,其進一步包含:一天線;及一接收器,該接收器耦合至該天線並經組態以接收該音訊信號。
  21. 如請求項20之裝置,其中該預處理模組、該第一濾波器、該高頻帶激勵產生器、該第二濾波器、該時間包絡估計器、該天線及該接收器係整合至一行動通信器件中。
  22. 如請求項20之裝置,其中該預處理模組、該第一濾波器、該高頻帶激勵產生器、該第二濾波器、該時間包絡估計器、該天線及該接收器係整合至一固定位置通信器件中。
  23. 如請求項19之裝置,其中該時間包絡估計器經組態以調整該時間增益參數之該值限制該時間增益參數之該可變性。
  24. 如請求項19之裝置,其中該預處理模組包含一分析濾波器組,其經組態以對該音訊信號之至少該部分進行濾波。
  25. 如請求項24之裝置,其中該分析濾波器組包含一正交鏡像濾波器(QMF)分析濾波器組。
  26. 如請求項24之裝置,其中該分析濾波器組包含一複合低延遲濾波器組。
  27. 如請求項24之裝置,其中能量值之該總和對應於該分析濾波器組之輸出,且其中該預處理模組進一步經組態以基於能量值之該總和執行一求平均運算以判定該信號特徵。
  28. 如請求項19之裝置,其中該預處理模組包含一頻譜翻轉器,其經組態以產生該音訊信號之該頻譜翻轉版本。
  29. 如請求項19之裝置,其中該時間增益參數包含一增益形狀參 數,且其中該時間包絡估計器進一步經組態以藉由基於一正規化常數與該增益形狀參數之一第一值的一特定百分數之一總和計算該增益形狀參數之一第二值來調整該增益形狀參數的該值。
  30. 一種包含指令之非暫時性處理器可讀媒體,該等指令在由在一音訊編碼器處之一處理器執行時使該處理器執行包含以下操作之操作:基於一音訊信號之一經頻譜翻轉版本計算能量值之一總和,能量值之該總和對應於該音訊信號之一高頻帶部分之一較高頻率範圍;判定該高頻帶部分之該較高頻率範圍之一信號特徵是否滿足一臨限值;產生對應於該高頻帶部分之一高頻帶激勵信號;基於該高頻帶激勵信號產生一經合成高頻帶部分;基於該經合成高頻帶部分與該高頻帶部分之一比較來判定一時間增益參數之一值;回應於該信號特徵滿足該臨限值,調整該時間增益參數之該值,其中調整該時間增益參數之該值控制該時間增益參數之一可變性;及啟動該時間增益參數之傳輸作為待自該音訊編碼器發送至一接收器之一位元串流之部分。
  31. 如請求項30之非暫時性處理器可讀媒體,其中調整該時間增益參數之該值限制該時間增益參數的該可變性。
  32. 如請求項30之非暫時性處理器可讀媒體,其中能量值之該總和對應於一分析濾波器組之輸出,且其中該等操作進一步包含基於能量值之該總和執行一求平均運算以判定該信號特徵。
  33. 如請求項30之非暫時性處理器可讀媒體,其中該等能量值對應於一正交鏡像濾波器(QMF)分析濾波器組,一複合低延遲濾波器組,或一變換分析濾波器組之輸出。
  34. 如請求項30之非暫時性處理器可讀媒體,其中該信號特徵指示該較高頻率範圍中之音訊內容的一量。
  35. 一種信號處理裝置,其包含:用於對在一音訊編碼器處之一音訊信號之至少一部分進行濾波以產生複數個輸出之構件,其中該用於濾波之構件經組態以基於該音訊信號之一經頻譜翻轉版本計算能量值之一總和,能量值之該總和對應於該音訊信號之一高頻帶部分之一較高頻率範圍;用於基於該複數個輸出判定該高頻帶部分之該較高頻率範圍之一信號特徵是否滿足一臨限值之構件;用於產生對應於該高頻帶部分之一高頻帶激勵信號之構件;用於基於該高頻帶激勵信號產生一經合成高頻帶部分之構件;及用於估計該高頻帶部分之一時間包絡之構件,其中用於估計之該構件經組態以進行以下操作:基於該經合成高頻帶部分與該高頻帶部分之一比較來判定一時間增益參數之一值;回應於該信號特徵滿足該臨限值,調整該時間增益參數之該值,其中調整該時間增益參數之該值控制該時間增益參數之一可變性;及用於傳輸該時間增益參數作為來自該音訊編碼器之一位元串流之部分至一接收器之構件。
  36. 如請求項35之裝置,其中該用於濾波之構件、該用於判定之構 件、該用於產生該高頻帶激勵信號之構件、該用於產生該經合成高頻帶部分之構件及該用於估計之構件係整合至一行動通信器件中。
  37. 如請求項35之裝置,其中該用於濾波之構件、該用於判定之構件、該用於產生該高頻帶激勵信號之構件、該用於產生該經合成高頻帶部分之構件及該用於估計之構件係整合至一固定通信器件中。
  38. 如請求項35之裝置,其中該高頻帶部分之該較高頻率範圍包括介於12千赫茲(kHz)與16kHz之間的一頻率範圍,其中該信號特徵對應於該高頻帶部分之該較高頻率範圍的一信號能量,且其中該用於估計之構件經組態以調整該時間增益參數之該值限制該時間增益參數之該可變性。
TW104119306A 2014-06-26 2015-06-15 信號處理裝置及方法及其非暫時性處理器可讀媒體 TWI598873B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462017790P 2014-06-26 2014-06-26
US14/731,198 US9583115B2 (en) 2014-06-26 2015-06-04 Temporal gain adjustment based on high-band signal characteristic

Publications (2)

Publication Number Publication Date
TW201604865A TW201604865A (zh) 2016-02-01
TWI598873B true TWI598873B (zh) 2017-09-11

Family

ID=54931208

Family Applications (2)

Application Number Title Priority Date Filing Date
TW104119307A TW201606758A (zh) 2014-06-26 2015-06-15 基於高頻帶信號特徵之時間增益調整
TW104119306A TWI598873B (zh) 2014-06-26 2015-06-15 信號處理裝置及方法及其非暫時性處理器可讀媒體

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW104119307A TW201606758A (zh) 2014-06-26 2015-06-15 基於高頻帶信號特徵之時間增益調整

Country Status (12)

Country Link
US (2) US9583115B2 (zh)
EP (2) EP3161825B1 (zh)
JP (2) JP6312868B2 (zh)
KR (2) KR101849871B1 (zh)
CN (2) CN106663440B (zh)
AR (2) AR100848A1 (zh)
BR (1) BR112016030384B1 (zh)
CA (2) CA2952006C (zh)
ES (2) ES2690252T3 (zh)
HU (2) HUE039281T2 (zh)
TW (2) TW201606758A (zh)
WO (2) WO2015199955A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
KR20200099560A (ko) * 2017-12-19 2020-08-24 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템
US11425258B2 (en) * 2020-01-06 2022-08-23 Waves Audio Ltd. Audio conferencing in a room
CN113820067B (zh) * 2021-11-22 2022-02-18 北京理工大学 强冲击传感器下阶跃响应动态特性计算方法及发生装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4301329A (en) 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
JP2625998B2 (ja) 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
FR2742568B1 (fr) * 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7146309B1 (en) 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
CA2603255C (en) * 2005-04-01 2015-06-23 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
CN102163429B (zh) 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
EP1875464B9 (en) * 2005-04-22 2020-10-28 Qualcomm Incorporated Method, storage medium and apparatus for gain factor attenuation
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
MY146431A (en) * 2007-06-11 2012-08-15 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
JP5441577B2 (ja) * 2009-09-11 2014-03-12 三菱電機株式会社 冷蔵庫
FR2961937A1 (fr) * 2010-06-29 2011-12-30 France Telecom Codage/decodage predictif lineaire adaptatif
JP2012144128A (ja) * 2011-01-11 2012-08-02 Toyota Motor Corp 燃料タンクの給油部構造
US8811601B2 (en) * 2011-04-04 2014-08-19 Qualcomm Incorporated Integrated echo cancellation and noise suppression
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic

Also Published As

Publication number Publication date
KR101849871B1 (ko) 2018-04-17
US9583115B2 (en) 2017-02-28
ES2690252T3 (es) 2018-11-20
JP6312868B2 (ja) 2018-04-18
JP2017523460A (ja) 2017-08-17
JP2017524980A (ja) 2017-08-31
US20150380006A1 (en) 2015-12-31
BR112016030384A2 (zh) 2017-08-22
EP3161823B1 (en) 2018-07-18
KR20170023851A (ko) 2017-03-06
ES2690251T3 (es) 2018-11-20
EP3161825B1 (en) 2018-07-18
CN106663440B (zh) 2018-05-08
US9626983B2 (en) 2017-04-18
CA2952214C (en) 2020-06-16
AR100848A1 (es) 2016-11-02
AR100847A1 (es) 2016-11-02
EP3161823A1 (en) 2017-05-03
KR101809866B1 (ko) 2017-12-15
CN106663440A (zh) 2017-05-10
TW201604865A (zh) 2016-02-01
HUE039281T2 (hu) 2018-12-28
CN106463136B (zh) 2018-05-08
EP3161825A1 (en) 2017-05-03
CA2952006A1 (en) 2015-12-30
WO2015199955A1 (en) 2015-12-30
CN106463136A (zh) 2017-02-22
BR112016030384B1 (pt) 2023-04-04
US20150380007A1 (en) 2015-12-31
JP6196004B2 (ja) 2017-09-13
CA2952006C (en) 2019-05-21
WO2015199954A1 (en) 2015-12-30
KR20170023007A (ko) 2017-03-02
CA2952214A1 (en) 2015-12-30
HUE039698T2 (hu) 2019-01-28
TW201606758A (zh) 2016-02-16

Similar Documents

Publication Publication Date Title
TWI598873B (zh) 信號處理裝置及方法及其非暫時性處理器可讀媒體
EP3138096B1 (en) High band excitation signal generation
JP6513718B2 (ja) 不一致周波数範囲を使用するハイバンド信号をエンコーディングする方法、エンコーダを備えた装置、エンコーダに実行させる命令を備えたコンピュータ可読記憶媒体、不一致周波数範囲を使用するハイバンド信号をデコーディングする方法、デコーダ、ハイバンド信号を生成する装置、デコーダに実行させる命令を備えたコンピュータ可読記憶媒体
US9818419B2 (en) High-band signal coding using multiple sub-bands