TW201521020A - 用於高頻帶時間特性改善追踪之增益形狀估計 - Google Patents
用於高頻帶時間特性改善追踪之增益形狀估計 Download PDFInfo
- Publication number
- TW201521020A TW201521020A TW103135270A TW103135270A TW201521020A TW 201521020 A TW201521020 A TW 201521020A TW 103135270 A TW103135270 A TW 103135270A TW 103135270 A TW103135270 A TW 103135270A TW 201521020 A TW201521020 A TW 201521020A
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- gain shape
- frequency band
- high frequency
- band
- Prior art date
Links
- 230000002123 temporal effect Effects 0.000 title description 10
- 230000005236 sound signal Effects 0.000 claims abstract description 139
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000005284 excitation Effects 0.000 claims description 105
- 239000002131 composite material Substances 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 4
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 46
- 238000010586 diagram Methods 0.000 description 14
- 238000002156 mixing Methods 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001453 impedance spectrum Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
本發明揭示一種方法,該方法包括在一話語編碼器處基於一調和延伸信號及/或基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號來判定第一增益形狀參數。該方法亦包括基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數。該方法進一步包括將該等第一增益參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該經編碼版本再生該音訊信號期間實現增益調整。
Description
本申請案主張2013年10月10日申請之名為「用於高頻帶時間特性改善追踪之增益形狀估計(GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS)」之美國臨時專利申請案第61/889,434號的優先權,該臨時專利申請案之內容的全文係以引用方式併入。
本發明大體上係關於信號處理。
技術進步已引起較小且更強大之計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括無線計算器件,諸如,體積小、重量輕且易於由使用者攜載之攜帶型無線電話、個人數位助理(personal digital assistant,PDA)及傳呼器件。更具體言之,諸如蜂巢式電話及網際網路協定(Internet Protocol,IP)電話之攜帶型無線電話可經由無線網路而傳達語音及資料封包。另外,許多此等無線電話包括併入於其中的其他類型之器件。舉例而言,無線電話亦可包括數位靜態攝影機、數位視訊攝影機、數位記錄器及音訊檔案播放器。
在傳統電話系統(例如,公眾交換式電話網路(public switched telephone network,PSTN))中,信號頻寬限於300赫茲(Hz)至3.4千赫茲
(kHz)之頻率範圍。在諸如蜂巢式電話及網際網路語音通訊協定(voice over internet protocol,VoIP)之寬頻(wideband,WB)應用中,信號頻寬可跨越50Hz至7kHz之頻率範圍。超寬頻(super wideband,SWB)寫碼技術支援延伸高達約16kHz之頻寬。將信號頻寬自3.4kHz之窄頻電話延伸至16kHz之SWB電話可改善信號重新建構品質、可懂度及逼真度。
SWB寫碼技術通常涉及編碼及傳輸信號之較低頻率部分(例如,50Hz至7kHz,亦被稱作「低頻帶(low-band)」)。舉例而言,可使用濾波器參數及/或低頻帶激發信號來表示低頻帶。然而,為了改善寫碼效率,可不完全地編碼及傳輸信號之較高頻率部分(例如,7kHz至16kHz,亦被稱作「高頻帶(high-band)」)。取而代之,接收器可利用信號模型化以預測高頻帶。在一些實施中,可將與高頻帶相關聯之資料提供至接收器以輔助預測。此資料可被稱為「旁側資訊(side information)」,且可包括增益資訊、線譜頻率(LSF,亦被稱為線譜對(line spectral pair,LSP))等等。低頻帶信號之屬性可用以產生旁側資訊;然而,低頻帶與高頻帶之間的能量不均等值可引起不準確地特性化高頻帶之旁側資訊。
本發明揭示用於執行用於高頻帶時間特性改善追踪之雙級增益形狀估計的系統及方法。話語編碼器可利用音訊信號之低頻帶部分(例如,調和延伸低頻帶激發)以產生用以在解碼器處重新建構音訊信號之高頻帶部分的資訊(例如,旁側資訊)。第一增益形狀估計器可判定在調和延伸低頻帶激發中不存在的高頻帶殘差信號之能量變化。舉例而言,增益形狀估計器可估計在高頻帶殘差信號中相對於調和延伸低頻帶激發信號偏移或不存在的高頻帶之時間變化或偏差(例如,能量位準)。第一增益形狀調整器(基於第一增益形狀參數)可調整調和延
伸低頻帶激發之時間演進,使得其接近地模仿高頻帶殘差之時間包絡。可基於經調整/經修改調和延伸低頻帶激發來產生合成高頻帶信號,且第二增益形狀估計器可在第二級處判定合成高頻帶信號與音訊信號之高頻帶部分之間的能量變化。可調整合成高頻帶信號以基於來自第二增益形狀估計器之資料(例如,第二增益形狀參數)來模型化音訊信號之高頻帶部分。可將第一增益形狀參數及第二增益形狀參數連同其他旁側資訊一起傳輸至解碼器以重新建構音訊信號之高頻帶部分。
在一特定態樣中,一種方法包括在一話語編碼器處基於一調和延伸信號及/或基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號來判定第一增益形狀參數。在另一特定態樣中,基於與一音訊信號之一高頻帶部分相關聯的該高頻帶殘差信號之時間演進來判定該等第一增益形狀參數。該方法亦包括基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數。該方法進一步包括將該等第一增益形狀參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該經編碼版本再生該音訊信號期間實現增益調整。
在另一特定態樣中,一種裝置包括一第一增益形狀估計器,該第一增益形狀估計器經組態以基於一調和延伸信號及/或基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號來判定第一增益形狀參數。該裝置亦包括一第二增益形狀估計器,該第二增益形狀估計器經組態以基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數。該裝置進一步包括一多工器,該多工器經組態以將該等第一增益形狀參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該經編碼版本再生該音訊信號期間實現增益調整。
在另一特定態樣中,一種非暫時性電腦可讀媒體包括指令,該等指令在由一處理器執行時使該處理器基於一調和延伸信號及/或基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號來判定第一增益形狀參數。該等指令亦可執行以使該處理器基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數。該等指令亦可執行以使該處理器將該等第一增益形狀參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該經編碼版本再生該音訊信號期間實現增益調整。
在另一特定態樣中,一種裝置包括用於基於一調和延伸信號及/或基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號來判定第一增益形狀參數的構件。該裝置亦包括用於基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數的構件。該裝置亦包括用於將該等第一增益形狀參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該經編碼版本再生該音訊信號期間實現增益調整的構件。
在另一特定態樣中,一種方法包括在一話語解碼器處自一話語編碼器接收一經編碼音訊信號。該經編碼音訊信號包括基於在該話語編碼器處產生之一第一調和延伸信號及/或基於在該話語編碼器處產生之一高頻帶殘差信號的第一增益形狀參數。該經編碼音訊信號亦包括基於在該話語編碼器處產生之一第一合成高頻帶信號及基於一音訊信號之一高頻帶的第二增益形狀參數。該方法亦包括基於該等第一增益形狀參數及基於該等第二增益形狀參數而自該經編碼音訊信號再生該音訊信號。
在另一特定態樣中,一種話語解碼器經組態以自一話語編碼器接收一經編碼音訊信號。該經編碼音訊信號包括基於在該話語編碼器處產生之一調和延伸信號及/或基於在該話語編碼器處產生之一高頻
帶殘差信號的第一增益形狀參數。該經編碼音訊信號亦包括基於在該話語編碼器處產生之一第一合成高頻帶信號及基於一音訊信號之一高頻帶的第二增益形狀參數。該話語解碼器經進一步組態以基於該等第一增益形狀參數及基於該等第二增益形狀參數而自該經編碼音訊信號再生該音訊信號。
在另一特定態樣中,一種裝置包括用於自一話語編碼器接收一經編碼音訊信號的構件。該經編碼音訊信號包括基於在該話語編碼器處產生之一第一調和延伸信號及/或基於在該話語編碼器處產生之一高頻帶殘差信號的第一增益形狀參數。該經編碼音訊信號亦包括基於在該話語編碼器處產生之一第一合成高頻帶信號及基於一音訊信號之一高頻帶的第二增益形狀參數。該裝置亦包括用於基於該等第一增益形狀參數及基於該等第二增益形狀參數而自該經編碼音訊信號再生該音訊信號的構件。
在另一特定態樣中,一種非暫時性電腦可讀媒體包括指令,該等指令在由一處理器執行時使該處理器自一話語編碼器接收一經編碼音訊信號。該經編碼音訊信號包括基於在該話語編碼器處產生之一第一調和延伸信號及/或基於在該話語編碼器處產生之一高頻帶殘差信號的第一增益形狀參數。該經編碼音訊信號亦包括基於在該話語編碼器處產生之一第一合成高頻帶信號及基於一音訊信號之一高頻帶的第二增益形狀參數。該等指令亦可執行以使該處理器基於該等第一增益形狀參數及基於該等第二增益形狀參數而自該經編碼音訊信號再生該音訊信號。
由所揭示實施例中之至少一者提供的特定優勢包括改善音訊信號之調和延伸低頻帶激發與音訊信號之高頻帶殘差之間的能量相關性。舉例而言,可基於增益形狀參數來調整調和延伸低頻帶激發以接近地模仿高頻帶殘差信號之時間特性。在檢閱整個申請案之後,本發
明之其他態樣、優勢及特徵將變得顯而易見,該申請案包括以下章節:【圖式簡單說明】、【實施方式】及申請專利範圍。
100‧‧‧系統
102‧‧‧輸入音訊信號
110‧‧‧分析濾波器組
122‧‧‧低頻帶信號
124‧‧‧高頻帶信號
130‧‧‧低頻帶分析模組
132‧‧‧線性預測(LP)分析與寫碼模組
134‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
136‧‧‧量化器
142‧‧‧低頻帶位元串流
144‧‧‧低頻帶激發信號
150‧‧‧高頻帶分析模組
152‧‧‧線性預測(LP)分析與寫碼模組
154‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
156‧‧‧量化器
160‧‧‧高頻帶激發產生器
161‧‧‧高頻帶激發信號
163‧‧‧碼簿
172‧‧‧高頻帶旁側資訊
180‧‧‧多工器(MUX)
190‧‧‧第一增益形狀估計器
192‧‧‧第一增益形狀調整器
194‧‧‧第二增益形狀估計器
196‧‧‧第二增益形狀調整器
199‧‧‧輸出位元串流
200‧‧‧系統
202‧‧‧包絡追踪器
203‧‧‧低頻帶時域包絡
204‧‧‧線性預測分析濾波器
205‧‧‧白雜訊
207‧‧‧非線性激發產生器
208‧‧‧調和延伸信號
211‧‧‧混頻器
214‧‧‧訊框識別模組
216‧‧‧寫碼模式指示信號
220‧‧‧經調變雜訊信號
224‧‧‧高頻帶殘差信號
240‧‧‧雜訊組合器
242‧‧‧第一增益形狀參數
244‧‧‧經調整調和延伸信號
254‧‧‧第一組合器
256‧‧‧第二組合器
300‧‧‧時序圖
302‧‧‧第一時序窗
304‧‧‧第二時序窗
306‧‧‧第三時序窗
308‧‧‧第四時序窗
310‧‧‧第五時序窗
312‧‧‧第六時序窗
314‧‧‧第七時序窗
400‧‧‧系統
402‧‧‧線性預測(LP)合成器
404‧‧‧合成高頻帶信號
406‧‧‧第二增益形狀參數
410‧‧‧增益訊框估計器
412‧‧‧增益訊框參數
418‧‧‧經調整合成高頻帶信號
500‧‧‧系統
507‧‧‧非線性激發產生器
508‧‧‧第二調和延伸信號
520‧‧‧高頻帶激發產生器
522‧‧‧線性預測(LP)合成器/線性預測係數合成器
524‧‧‧第二合成高頻帶信號
526‧‧‧第二增益形狀調整器/第二增益形狀估計器
528‧‧‧第二經調整合成高頻帶信號
544‧‧‧第二經調整調和延伸信號
561‧‧‧第二高頻帶激發信號
592‧‧‧第一增益形狀調整器/第一增益形狀估計器
600‧‧‧第一方法
602‧‧‧步驟
604‧‧‧步驟
606‧‧‧步驟
610‧‧‧第二方法
612‧‧‧步驟
614‧‧‧步驟
700‧‧‧器件
710‧‧‧處理器
722‧‧‧系統單晶片器件
726‧‧‧顯示控制器
728‧‧‧顯示器
730‧‧‧輸入器件
732‧‧‧記憶體
734‧‧‧編碼解碼器(CODEC)
736‧‧‧揚聲器
738‧‧‧麥克風
740‧‧‧無線控制器
742‧‧‧無線天線
744‧‧‧電力供應器
760‧‧‧指令
782‧‧‧兩級增益估計系統
784‧‧‧兩級增益調整系統
790‧‧‧記憶體
795‧‧‧指令
796‧‧‧數位信號處理器(DSP)
797‧‧‧兩級增益估計系統
798‧‧‧兩級增益調整系統
圖1為用以說明可操作以在用於高頻帶重新建構之兩個級處判定增益形狀參數的系統之特定實施例的圖解;圖2為用以說明可操作以基於調和延伸信號及/或高頻帶殘差信號而在第一級處判定增益形狀參數的系統之特定實施例的圖解;圖3為用以說明基於調和延伸信號與高頻帶殘差信號之間的能量不均等值之增益形狀參數的時序圖;圖4為用以說明可操作以基於合成高頻帶信號及輸入音訊信號之高頻帶部分而在第二級處判定第二增益形狀參數的系統之特定實施例的圖解;圖5為用以說明可操作以使用增益形狀參數來再生音訊信號的系統之特定實施例的圖解;圖6為用以說明用於使用增益估計進行高頻帶重新建構的方法之特定實施例的流程圖;及圖7為可操作以根據圖1至圖6之系統及方法來執行信號處理操作之無線器件的方塊圖。
參看圖1,展示可操作以在用於高頻帶重新建構之兩個級處判定增益形狀參數的系統之特定實施例且將其大體上指定為100。在一特定實施例中,系統100可整合至編碼系統或裝置中(例如,在無線電話、寫碼器/解碼器(CODEC)或數位信號處理器(DSP)中)。在其他特定實施例中,系統100可整合至機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、PDA、固定位置資料單元或電腦中。
應注意,在以下描述中,由圖1之系統100執行的各種功能被描述為由某些組件或模組執行。然而,組件及模組之此劃分係僅出於說明起見。在一替代實施例中,由一特定組件或模組執行之功能可代替地劃分於多個組件或模組當中。此外,在一替代實施例中,圖1之兩個或兩個以上組件或模組可整合成單一組件或模組。可使用硬體(例如,場可程式化閘陣列(field-programmable gate array,FPGA)器件、特殊應用積體電路(application-specific integrated circuit,ASIC)、DSP、控制器等等)、軟體(例如,可由處理器執行之指令)或其任何組合來實施圖1所說明之每一組件或模組。
系統100包括經組態以接收輸入音訊信號102之分析濾波器組(analysis filter bank)110。舉例而言,輸入音訊信號102可由麥克風或其他輸入器件提供。在一特定實施例中,輸入音訊信號102可包括話語。輸入音訊信號102可為包括在大約50Hz至大約16kHz之頻率範圍內之資料的SWB信號。分析濾波器組110可基於頻率而將輸入音訊信號102濾波成多個部分。舉例而言,分析濾波器組110可產生低頻帶信號122及高頻帶信號124。低頻帶信號122與高頻帶信號124可具有相等或不相等頻寬,且可重疊或非重疊。在一替代實施例中,分析濾波器組110可產生兩個以上輸出。
在圖1之實例中,低頻帶信號122及高頻帶信號124佔據非重疊頻帶。舉例而言,低頻帶信號122及高頻帶信號124可分別佔據50Hz至7kHz及7kHz至16kHz之非重疊頻帶。在一替代實施例中,低頻帶信號122及高頻帶信號124可分別佔據50Hz至8kHz及8kHz至16kHz之非重疊頻帶。在另一替代實施例中,低頻帶信號122與高頻帶信號124重疊(例如,分別為50Hz至8kHz及7kHz至16kHz),此情形可使分析濾波器組110之低通濾波器及高通濾波器能夠具有平滑衰減(smooth rolloff),此情形可簡化低通濾波器及高通濾波器之設計且縮減低通濾
波器及高通濾波器之成本。使低頻帶信號122與高頻帶信號124重疊亦可在接收器處實現低頻帶信號與高頻帶信號之平滑調合(smooth blending),此情形可引起較少的聲訊人為效應(audible artifact)。
應注意,雖然圖1之實例說明SWB信號之處理,但此情形係僅出於說明起見。在一替代實施例中,輸入音訊信號102可為具有大約50Hz至大約8kHz之頻率範圍的WB信號。在此實施例中,低頻帶信號122可(例如)對應於大約50Hz至大約6.4kHz之頻率範圍,且高頻帶信號124可對應於大約6.4kHz至大約8kHz之頻率範圍。
系統100可包括經組態以接收低頻帶信號122之低頻帶分析模組130。在一特定實施例中,低頻帶分析模組130可表示碼激發線性預測(code excited linear prediction,CELP)編碼器之實施例。低頻帶分析模組130可包括線性預測(linear prediction,LP)分析與寫碼模組132、線性預測係數(linear prediction coefficient,LPC)至LSP變換模組134,及量化器136。LSP亦可被稱為LSF,且兩個術語(LSP及LSF)可在本文中被互換式地使用。LP分析與寫碼模組132可將低頻帶信號122之譜包絡編碼為LPC之集合。可針對音訊之每一訊框(例如,20毫秒(ms)之音訊,對應於在16kHz之取樣速率下的320個樣本)、音訊之每一子訊框(例如,5ms之音訊)或其任何組合來產生LPC。可藉由所執行之LP分析的「階(order)」來判定針對每一訊框或子訊框所產生之LPC的數目。在一特定實施例中,LP分析與寫碼模組132可產生對應於十階LP分析的十一個LPC之集合。
LPC至LSP變換模組134可將由LP分析與寫碼模組132產生的LPC之集合變換成LSP之對應集合(例如,使用一對一變換)。替代地,LPC之集合可經一對一變換成部分自相關係數(parcor coefficient)、對數面積比率值(log-area-ratio value)、導抗譜對(immittance spectral pair,ISP)或導抗譜頻率(immittance spectral frequency,ISF)之對應集
合。LPC之集合與LSP之集合之間的變換可無錯誤地可逆。
量化器136可量化由變換模組134產生的LSP之集合。舉例而言,量化器136可包括或耦接至包括多個項目(例如,向量)之多個碼簿。為了量化LSP之集合,量化器136可識別「最接近於」(例如,基於諸如最小平方或均方誤差之失真量度)LSP之集合的碼簿之項目。量化器136可輸出對應於碼簿中之經識別項目之位置的一索引值或一系列索引值。因此,量化器136之輸出可表示包括於低頻帶位元串流142中之低頻帶濾波器參數。
低頻帶分析模組130亦可產生低頻帶激發信號144。舉例而言,低頻帶激發信號144可為藉由量化在由低頻帶分析模組130執行之LP程序期間產生之LP殘差信號而產生的經編碼信號。LP殘差信號可表示預測誤差。
系統100可進一步包括經組態以自分析濾波器組110接收高頻帶信號124及自低頻帶分析模組130接收低頻帶激發信號144之高頻帶分析模組150。高頻帶分析模組150可基於高頻帶信號124及低頻帶激發信號144來產生高頻帶旁側資訊172。舉例而言,高頻帶旁側資訊172可包括高頻帶LSP及/或增益資訊(例如,基於高頻帶能量對低頻帶能量之至少一比率),如本文進一步所描述。在一特定實施例中,增益資訊可包括基於調和延伸信號及/或高頻帶殘差信號之增益形狀參數。調和延伸信號可歸因於高頻帶信號124與低頻帶信號122之間的不充分相關性而不足以用於高頻帶合成。舉例而言,高頻帶信號124之子訊框可包括未在經模型化高頻帶激發信號161中被足夠地模仿之能量位準波動。
高頻帶分析模組150可包括第一增益形狀估計器190。第一增益形狀估計器190可基於與低頻帶信號122相關聯之第一信號及/或基於高頻帶信號124之高頻帶殘差來判定第一增益形狀參數。如本文所描
述,第一信號可為低頻帶信號122之經變換(例如,非線性或調和延伸)低頻帶激發。高頻帶旁側資訊172可包括第一增益形狀參數。高頻帶分析模組150亦可包括經組態以基於第一增益形狀參數來調整調和延伸低頻帶激發之第一增益形狀調整器192。舉例而言,第一增益形狀調整器192可按比例調整調和延伸低頻帶激發之特定子訊框以近似高頻帶信號124之殘差的對應子訊框之能量位準。
高頻帶分析模組150亦可包括高頻帶激發產生器160。高頻帶激發產生器160可藉由將低頻帶激發信號144之頻譜延伸至高頻帶頻率範圍(例如,7kHz至16kHz)中而產生高頻帶激發信號161。舉例說明,高頻帶激發產生器160可使經調整調和延伸低頻帶激發與雜訊信號(例如,根據模仿低頻帶信號122之緩慢變化時間特性的對應於低頻帶激發信號144之包絡而調變的白雜訊)混頻以產生高頻帶激發信號161。舉例而言,可根據以下等式來執行該混頻:高頻帶激發=(α*經調整調和延伸低頻帶激發)+((1-α)*經調變雜訊)
經調整調和延伸低頻帶激發與經調變雜訊被混頻的比率可影響接收器處之高頻帶重新建構品質。對於有聲話語信號,混頻可被偏置朝向經調整調和延伸低頻帶激發(例如,混頻因子α可在0.5至1.0之範圍內)。對於無聲信號,混頻可被偏置朝向經調變雜訊(例如,混頻因子α可在0.0至0.5之範圍內)。
如所說明,高頻帶分析模組150亦可包括LP分析與寫碼模組152、LPC至LSP變換模組154,及量化器156。LP分析與寫碼模組152、變換模組154及量化器156中之每一者可如上文參考低頻帶分析模組130之對應組件所描述但以比較縮減之解析度(例如,針對每一係數、LSP等等使用較少位元)而起作用。LP分析與寫碼模組152可產生由變換模組154變換至LSP且由量化器156基於碼簿163而量化的LPC之
集合。舉例而言,LP分析與寫碼模組152、變換模組154及量化器156可使用高頻帶信號124以判定包括於高頻帶旁側資訊172中之高頻帶濾波器資訊(例如,高頻帶LSP)。
量化器156可經組態以量化譜頻率值(諸如,由變換模組154提供之LSP)之集合。在其他實施例中,除了LSF或LSP以外或代替LSF或LSP,量化器156亦可接收及量化一或多種其他類型之譜頻率值的集合。舉例而言,量化器156可接收及量化由LP分析與寫碼模組152產生的LPC之集合。其他實例包括可在量化器156處接收及量化的部分自相關係數、對數面積比率值及ISF之集合。量化器156可包括將輸入向量(例如,呈向量格式的譜頻率值之集合)編碼為表格或碼簿(諸如,碼簿163)中之對應項目之索引的向量量化器。作為另一實例,量化器156可經組態以判定可供在解碼器處(諸如,在疏鬆碼簿實施例中)動態地產生而非自儲存體擷取輸入向量的一或多個參數。舉例說明,可根據諸如第三代合作夥伴2(3GPP2)增強型可變速率編碼解碼器(EVRC)之工業標準而在諸如CELP及編碼解碼器之寫碼方案中應用疏鬆碼簿實例。在另一實施例中,高頻帶分析模組150可包括量化器156,且可經組態以使用數個碼簿向量來產生合成信號(例如,根據濾波器參數之集合)及選擇與最好地匹配於高頻帶信號124(諸如,在感知加權域中)之合成信號相關聯的碼簿向量中之一者。
在一特定實施例中,高頻帶旁側資訊172可包括高頻帶LSP以及高頻帶增益參數。舉例而言,高頻帶激發信號161可用以判定包括於高頻帶旁側資訊172中之額外增益參數。高頻帶分析模組150可包括第二增益形狀估計器194及第二增益形狀調整器196。可對高頻帶激發信號161執行線性預測係數合成操作以產生合成高頻帶信號。第二增益形狀估計器194可基於合成高頻帶信號及高頻帶信號124來判定第二增益形狀參數。高頻帶旁側資訊172可包括第二增益形狀參數。第二增
益形狀調整器196可經組態以基於第二增益形狀參數來調整合成高頻帶信號。舉例而言,第二增益形狀調整器196可按比例調整合成高頻帶信號之特定子訊框以近似高頻帶信號124之對應子訊框之能量位準。
低頻帶位元串流142及高頻帶旁側資訊172可由多工器(MUX)180多工以產生輸出位元串流199。輸出位元串流199可表示對應於輸入音訊信號102之經編碼音訊信號。舉例而言,可傳輸(例如,經由有線、無線或光學通道)及/或儲存輸出位元串流199。因此,多工器180可將由第一增益形狀估計器190判定之第一增益形狀參數及由第二增益形狀估計器194判定之第二增益形狀參數插入至輸出位元串流199中,以在再生輸入音訊信號102期間實現高頻帶激發增益調整。在接收器處,可由解多工器(DEMUX)、低頻帶解碼器、高頻帶解碼器及濾波器組執行逆操作以產生音訊信號(例如,提供至揚聲器或其他輸出器件的輸入音訊信號102之經重新建構版本)。用以表示低頻帶位元串流142之位元的數目可實質上大於用以表示高頻帶旁側資訊172之位元的數目。因此,輸出位元串流199中之大多數位元可表示低頻帶資料。高頻帶旁側資訊172可在接收器處用以根據信號模型而自低頻帶資料重新產生高頻帶激發信號。舉例而言,信號模型可表示低頻帶資料(例如,低頻帶信號122)與高頻帶資料(例如,高頻帶信號124)之間的關係或相關性之預期集合。因此,不同信號模型可用於不同種類之音訊資料(例如,話語、音樂等等),且在使用中之特定信號模型可在經編碼音訊資料之傳達之前由傳輸器及接收器協商(或由工業標準定義)。在使用信號模型的情況下,傳輸器處之高頻帶分析模組150可能夠產生高頻帶旁側資訊172,使得接收器處之對應高頻帶分析模組能夠使用信號模型以自輸出位元串流199重新建構高頻帶信號124。
系統100可改善音訊信號102之調和延伸低頻帶激發與輸入音訊
信號102之高頻帶殘差之間的逐訊框能量相關性(例如,改善時間演進)。舉例而言,在第一增益級期間,第一增益形狀估計器190及第一增益形狀調整器192可基於第一增益參數來調整調和延伸低頻帶激發。可調整調和延伸低頻帶激發以逐訊框地近似高頻帶之殘差。調整調和延伸低頻帶激發可改善合成域中之增益形狀估計,且縮減輸入音訊信號102之高頻帶重新建構期間的聲訊人為效應。系統100亦可改善高頻帶信號124與高頻帶信號124之合成版本之間的逐訊框能量相關性。舉例而言,在第二增益級期間,第二增益形狀估計器194及第二增益形狀調整器196可基於第二增益參數來調整高頻帶信號124之合成版本。可調整高頻帶信號124之合成版本以逐訊框地近似高頻帶信號124。可將第一增益形狀參數及第二增益形狀參數傳輸至解碼器以縮減輸入音訊信號102之高頻帶重新建構期間的聲訊人為效應。
參看圖2,展示可操作以基於調和延伸信號及/或高頻帶殘差信號而在第一級處判定增益形狀參數的系統200之特定實施例。系統200包括線性預測分析濾波器204、非線性激發產生器207、訊框識別模組214、第一增益形狀估計器190,及第一增益形狀調整器192。
高頻帶信號124可提供至線性預測分析濾波器204。線性預測分析濾波器204可經組態以基於高頻帶信號124(例如,輸入音訊信號102之高頻帶部分)來產生高頻帶殘差信號224。舉例而言,線性預測分析濾波器204可將高頻帶信號124之譜包絡編碼為用以預測高頻帶信號124之未來樣本(基於當前樣本)的LPC之集合。高頻帶殘差信號224可提供至訊框識別模組214及第一增益形狀估計器190。
訊框識別模組214可經組態以判定用於高頻帶殘差信號224之特定訊框的寫碼模式,及基於該寫碼模式來產生寫碼模式指示信號216。舉例而言,訊框識別模組214可判定高頻帶殘差信號224之特定訊框為有聲訊框抑或無聲訊框。在一特定實施例中,有聲訊框可對應
於第一寫碼模式(例如,第一度量),且無聲訊框可對應於第二寫碼模式(例如,第二度量)。
低頻帶激發信號144可提供至非線性激發產生器207。如關於圖1所描述,可使用低頻帶分析模組130而自低頻帶信號122(例如,輸入音訊信號102之低頻帶部分)產生低頻帶激發信號144。非線性激發產生器207可經組態以基於低頻帶激發信號144來產生調和延伸信號208。舉例而言,非線性激發產生器207可對低頻帶激發信號144之訊框(或子訊框)執行絕對值運算或平方運算以產生調和延伸信號208。
舉例說明,非線性激發產生器207可增加取樣低頻帶激發信號144(例如,在大約0kHz至8kHz之範圍內的信號)以產生在大約0kHz至16kHz之範圍內的16kHz信號(例如,頻寬為低頻帶激發信號144之頻寬之大約兩倍的信號),且隨後對經增加取樣信號執行非線性操作。16kHz信號之低頻帶部分(例如,大約自0kHz至8kHz)可具有實質上類似於低頻帶激發信號144之諧波的諧波,且16kHz信號之高頻帶部分(例如,大約自8kHz至16kHz)可實質上無諧波。非線性激發產生器207可將16kHz信號之低頻帶部分中的「主要(dominant)」諧波延伸至16kHz信號之高頻帶部分以產生調和延伸信號208。因此,調和延伸信號208可為使用非線性操作(例如,平方運算及/或絕對值運算)而將諧波延伸至高頻帶中的低頻帶激發信號144之調和延伸版本。調和延伸信號208可提供至第一增益形狀估計器190及第一增益形狀調整器192。
第一增益形狀估計器190可接收寫碼模式指示信號216,且基於寫碼模式來判定取樣速率。舉例而言,第一增益形狀估計器190可取樣調和延伸信號208之第一訊框以產生第一複數個子訊框,且可在類似時間例項(time instance)時取樣高頻帶殘差信號224之第二訊框以產生第二複數個子訊框。第一複數個子訊框及第二複數個子訊框中之子
訊框(例如,向量維度)的數目可基於寫碼模式。舉例而言,第一(及第二)複數個子訊框可回應於寫碼模式指示出高頻帶殘差信號224之特定訊框為有聲訊框的判定而包括第一數目個子訊框。在一特定實施例中,第一複數個子訊框及第二複數個子訊框各自可回應於高頻帶殘差信號224之特定訊框為有聲訊框的判定而包括十六個子訊框。替代地,第一(及第二)複數個子訊框可回應於寫碼模式指示出高頻帶殘差信號224之特定訊框不為有聲訊框的判定而包括第二數目個子訊框,該第二數目小於子訊框之第一數目。舉例而言,第一複數個子訊框及第二複數個子訊框各自可回應於寫碼模式指示出高頻帶殘差信號224之特定訊框不為有聲訊框的判定而包括八個子訊框。
第一增益形狀估計器190可經組態以基於調和延伸信號208及/或高頻帶殘差信號224來判定第一增益形狀參數242。第一增益形狀估計器190可評估第一複數個子訊框中之每一子訊框的能量位準,且評估第二複數個子訊框中之每一對應子訊框的能量位準。舉例而言,第一增益形狀參數242可識別相比於高頻帶殘差信號224之對應子訊框具有較低或較高能量位準的調和延伸信號208之特定子訊框。第一增益形狀估計器190亦可基於寫碼模式來判定用以提供至調和延伸信號208之每一特定子訊框的能量之按比例調整的量。可在相比於高頻帶殘差信號224之對應子訊框具有較低或較高能量位準的調和延伸信號208之子訊框位準下執行能量之按比例調整。舉例而言,回應於寫碼模式具有第一度量(例如,有聲訊框)之判定,可藉由因子(ΣRHB 2)/(ΣR'LB 2)來按比例調整調和延伸信號208之特定子訊框,其中(ΣR'LB 2)對應於調和延伸信號208之特定子訊框的能量位準,且(ΣRHB 2)對應於高頻帶殘差信號224之對應子訊框的能量位準。替代地,回應於寫碼模式具有第二度量(例如,無聲訊框)之判定,可藉由因子Σ[(RHB)*(R'LB)]/(ΣR'LB 2)來按比例調整調和延伸信號208之特定子訊框。第一增益形狀參數242可
識別需要能量按比例調整的調和延伸信號208之每一子訊框,且可針對各別子訊框識別經計算能量按比例調整因子。第一增益形狀參數242可提供至第一增益形狀調整器192且作為高頻帶旁側資訊172而提供至圖1之多工器180。
第一增益形狀調整器192可經組態以基於第一增益形狀參數242來調整調和延伸信號208以產生經調整調和延伸信號244。舉例而言,第一增益形狀調整器192可根據經計算能量按比例調整來按比例調整調和延伸信號208之經識別子訊框以產生經調整調和延伸信號244。經調整調和延伸信號244可提供至包絡追踪器202及第一組合器254以執行按比例調整操作。
包絡追踪器202可經組態以接收經調整調和延伸信號244,及計算對應於經調整調和延伸信號244之低頻帶時域包絡203。舉例而言,包絡追踪器202可經組態以計算經調整調和延伸信號244之訊框之每一樣本的平方以產生平方值之序列。包絡追踪器202可經組態以對平方值之序列執行平滑操作,諸如,藉由將一階無限脈衝回應(infinite impulse response,IIR)低通濾波器應用於平方值之序列而進行。包絡追踪器202可經組態以將平方根函數應用於平滑序列之每一樣本以產生低頻帶時域包絡203。包絡追踪器202亦可使用絕對運算而非平方運算。低頻帶時域包絡203可提供至雜訊組合器240。
雜訊組合器240可經組態以組合低頻帶時域包絡203與由白雜訊產生器(未圖示)產生之白雜訊205以產生經調變雜訊信號220。舉例而言,雜訊組合器240可經組態以根據低頻帶時域包絡203來調幅白雜訊205。在一特定實施例中,雜訊組合器240可被實施為經組態以根據低頻帶時域包絡203來按比例調整白雜訊205以產生經調變雜訊信號220之乘法器。經調變雜訊信號220可提供至第二組合器256。
第一組合器254可被實施為經組態以根據混頻因子(α)來按比例調
整經調整調和延伸信號244以產生第一經按比例調整信號之乘法器。第二組合器256可被實施為經組態以基於混頻因子(1-α)來按比例調整經調變雜訊信號220以產生第二經按比例調整信號之乘法器。舉例而言,第二組合器256可基於1減混頻因子之差(例如,1-α)來按比例調整經調變雜訊信號220。第一經按比例調整信號及第二經按比例調整信號可提供至混頻器211。
混頻器211可基於混頻因子(α)、經調整調和延伸信號244及經調變雜訊信號220來產生高頻帶激發信號161。舉例而言,混頻器211可組合第一經按比例調整信號與第二經按比例調整信號以產生高頻帶激發信號161。
圖2之系統200可改善調和延伸信號208與高頻帶殘差信號224之間的能量之時間演進。舉例而言,第一增益形狀估計器190及第一增益形狀調整器192可基於第一增益形狀參數242來調整調和延伸信號208。可調整調和延伸信號208以逐子訊框地近似高頻帶殘差信號224之能量位準。調整調和延伸信號208可縮減合成域中之聲訊人為效應,如關於圖4所描述。系統200亦可基於寫碼模式來動態地調整子訊框之數目以基於間距差異來修改增益形狀參數242。舉例而言,可針對在訊框內具有時間演進之相對低差異的無聲訊框產生相對小數目個增益形狀參數242(例如,相對小數目個子訊框)。替代地,可針對在訊框內具有時間演進之相對高差異的有聲訊框產生相對大數目個增益形狀參數242。在一替代實施例中,經選擇以調整調和延伸低頻帶之時間演進之子訊框的數目對於無聲訊框以及有聲訊框兩者可相同。
參看圖3,展示用以說明基於調和延伸信號與高頻帶殘差信號之間的能量不均等值之增益形狀參數的時序圖300。時序圖300包括高頻帶殘差信號224之第一跡線、調和延伸信號208之第二跡線,及經估計增益形狀參數242之第三跡線。
時序圖300描繪高頻帶殘差信號224之特定訊框及調和延伸信號208之對應訊框。時序圖300包括第一時序窗302、第二時序窗304、第三時序窗306、第四時序窗308、第五時序窗310、第六時序窗312,及第七時序窗314。每一時序窗302至314可表示各別信號224、208之子訊框。雖然描繪七個時序窗,但在其他實施例中,可存在額外(或較少)時序窗。舉例而言,在一特定實施例中,每一各別信號224、208可包括低至四個時序窗或高達十六個時序窗(亦即,四個子訊框或十六個子訊框)。時序窗之數目可基於如關於圖2所描述之寫碼模式。
第一時序窗302中的高頻帶殘差信號224之能量位準可近似第一時序窗302中的對應調和延伸信號208之能量位準。舉例而言,第一增益形狀估計器190可量測第一時序窗302中的高頻帶殘差信號224之能量位準、量測第一時序窗302中的調和延伸信號208之能量位準,且比較差與臨限值。若差低於臨限值,則高頻帶殘差信號224之能量位準可近似調和延伸信號208之能量位準。因此,在此狀況下,用於第一時序窗302之第一增益形狀參數242可指示出調和延伸信號208之對應子訊框無需能量按比例調整。用於第三時序窗306及第四時序窗308的高頻帶殘差信號224之能量位準亦可近似第三時序窗306及第四時序窗308中的對應調和延伸信號208之能量位準。因此,用於第三時序窗306及第四時序窗308之第一增益形狀參數242亦可指示出調和延伸信號208之對應子訊框可無需能量按比例調整。
第二時序窗304及第五時序窗310中的高頻帶殘差信號224之能量位準可波動,且第二時序窗304及第五時序窗310中的調和延伸信號208之對應能量位準可不準確地反映高頻帶殘差信號224之波動。圖1至圖2之第一增益形狀估計器190可在第二時序窗304及第五時序窗310中產生增益形狀參數242以調整調和延伸信號208。舉例而言,第一增益形狀估計器190可指示第一增益形狀調整器192在第二時序窗304及
第五時序窗310(例如,第二子訊框及第五子訊框)處「按比例調整」調和延伸信號208。調和延伸信號208被調整之量可基於高頻帶殘差信號224之寫碼模式。舉例而言,若寫碼模式指示出訊框為有聲訊框,則可藉由因子(ΣRHB 2)/(ΣR'LB 2)來調整調和延伸信號208。替代地,若寫碼模式指示出訊框為無聲訊框,則可藉由因子Σ[(RHB)*(R'LB)]/(ΣR'LB 2)來調整調和延伸信號208。
用於第六時序窗312及第七時序窗314的高頻帶殘差信號224之能量位準可近似第六時序窗312及第七時序窗314中的對應調和延伸信號208之能量位準。因此,用於第六時序窗312及第七時序窗314之第一增益形狀參數242可指示出調和延伸信號208之對應子訊框無需能量按比例調整。
產生如關於圖3所描述之第一增益形狀參數242可改善調和延伸信號208與高頻帶殘差信號224之間的能量之時間演進。舉例而言,可藉由基於第一增益形狀參數242來調整調和延伸信號208而在調和延伸信號208中考量高頻帶殘差信號224之能量波動。調整調和延伸信號208可縮減合成域中之聲訊人為效應,如關於圖4所描述。
參看圖4,展示可操作以基於合成高頻帶信號及輸入音訊信號之高頻帶部分而在第二級處判定第二增益形狀參數的系統400之特定實施例。系統400可包括線性預測(LP)合成器402、第二增益形狀估計器194、第二增益形狀調整器196,及增益訊框估計器410。
線性預測(LP)合成器402可經組態以接收高頻帶激發信號161,及對高頻帶激發信號161執行線性預測合成操作以產生合成高頻帶信號404。合成高頻帶信號404可提供至第二增益形狀估計器194及第二增益形狀調整器196。
第二增益形狀估計器194可經組態以基於合成高頻帶信號404及高頻帶信號124來判定第二增益形狀參數406。舉例而言,第二增益形
狀估計器194可評估合成高頻帶信號404之每一子訊框的能量位準,且評估高頻帶信號124之每一對應子訊框的能量位準。舉例而言,第二增益形狀參數406可識別相比於高頻帶信號124之對應子訊框具有較低能量位準的合成高頻帶信號404之特定子訊框。可在合成域中判定第二增益形狀參數406。舉例而言,可使用與激發域中之激發信號(例如,調和延伸信號208)相對的合成信號(例如,合成高頻帶信號404)來判定第二增益形狀參數406。第二增益形狀參數406可提供至第二增益形狀調整器196且作為高頻帶旁側資訊172而提供至多工器180。
第二增益形狀調整器196可經組態以基於第二增益形狀參數406來產生經調整合成高頻帶信號418。舉例而言,第二增益形狀調整器196可基於第二增益形狀參數406來「按比例調整」合成高頻帶信號404之特定子訊框以產生經調整合成高頻帶信號418。第二增益形狀調整器196可以類似於圖1至圖2之第一增益形狀調整器192基於第一增益形狀參數242來調整調和延伸信號208之特定子訊框之方式的方式來「按比例調整」合成高頻帶信號404之子訊框。經調整合成高頻帶信號418可提供至增益訊框估計器410。
增益訊框估計器410可基於經調整合成高頻帶信號404及高頻帶信號124來產生增益訊框參數412。增益訊框參數412可作為高頻帶旁側資訊172而提供至多工器180。
圖4之系統400可藉由基於合成高頻帶信號404之能量位準及高頻帶信號124之對應能量位準來產生第二增益形狀參數406而改善圖1之輸入音訊信號102的高頻帶重新建構。第二增益形狀參數406可縮減輸入音訊信號102之高頻帶重新建構期間的聲訊人為效應。
參看圖5,展示可操作以使用增益形狀參數來再生音訊信號的系統500之特定實施例。系統500包括非線性激發產生器507、第一增益形狀調整器592、高頻帶激發產生器520、線性預測(LP)合成器522,
及第二增益形狀調整器526。在一特定實施例中,系統500可整合至解碼系統或裝置中(例如,在無線電話、CODEC或DSP中)。在其他特定實施例中,系統500可整合至機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、PDA、固定位置資料單元或電腦中。
非線性激發產生器507可經組態以接收圖1之低頻帶激發信號144。舉例而言,圖1之低頻帶位元串流142可包括表示低頻帶激發信號144之資料,且可作為位元串流199而傳輸至系統500。非線性激發產生器507可經組態以基於低頻帶激發信號144來產生第二調和延伸信號508。舉例而言,非線性激發產生器507可對低頻帶激發信號144之訊框(或子訊框)執行絕對值運算或平方運算以產生第二調和延伸信號508。在一特定實施例中,非線性激發產生器507可以實質上類似於圖2之非線性激發產生器207之方式的方式而操作。第二調和延伸信號508可提供至第一增益形狀調整器592。
諸如圖2之第一增益形狀參數242的第一增益形狀參數亦可提供至第一增益形狀調整器592。舉例而言,圖1之高頻帶旁側資訊172可包括表示第一增益形狀參數242之資料,且可傳輸至系統500。第一增益形狀調整器592可經組態以基於第一增益形狀參數242來調整第二調和延伸信號508以產生第二經調整調和延伸信號544。在一特定實施例中,第一增益形狀調整器592可以實質上類似於圖1至圖2之第一增益形狀調整器192之方式的方式而操作。第二經調整調和延伸信號544可提供至高頻帶激發產生器520。
高頻帶激發產生器520可基於第二經調整調和延伸信號544來產生第二高頻帶激發信號561。舉例而言,高頻帶激發產生器520可包括包絡追踪器、雜訊組合器、第一組合器、第二組合器,及混頻器。在一特定實施例中,高頻帶激發產生器520之組件可以實質上類似於圖2之包絡追踪器202、圖2之雜訊組合器240、圖2之第一組合器254、圖2
之第二組合器256及圖2之混頻器211之方式的方式而操作。第二高頻帶激發信號561可提供至線性預測合成器522。
線性預測合成器522可經組態以接收第二高頻帶激發信號561,及對第二高頻帶激發信號561執行線性預測合成操作以產生第二合成高頻帶信號524。在一特定實施例中,線性預測合成器522可以實質上類似於圖4之線性預測合成器402之方式的方式而操作。第二合成高頻帶信號524可提供至第二增益形狀調整器526。
諸如圖4之第二增益形狀參數406的第二增益形狀參數亦可提供至第二增益形狀調整器526。舉例而言,圖1之高頻帶旁側資訊172可包括表示第二增益形狀參數406之資料,且可傳輸至系統500。第二增益形狀調整器526可經組態以基於第二增益形狀參數406來調整第二合成高頻帶信號524以產生第二經調整合成高頻帶信號528。在一特定實施例中,第二增益形狀調整器526可以實質上類似於圖1及圖4之第二增益形狀調整器196之方式的方式而操作。在一特定實施例中,第二經調整合成高頻帶信號528可為圖1之高頻帶信號124的經再生版本。
圖5之系統500可使用高頻帶激發信號144、第一增益形狀參數242及第二增益形狀參數406來再生高頻帶信號124。使用增益形狀參數242、406可藉由基於話語編碼器處偵測的能量之時間演進來調整第二調和延伸信號508及第二合成高頻帶信號524而改善再生準確度。
參看圖6,展示使用增益估計進行高頻帶重新建構的方法600、610之特定實施例的流程圖。第一方法600可由圖1至圖2之系統100至200及圖4之系統400執行。第二方法610可由圖5之系統500執行。
第一方法600包括:在602處,在話語編碼器處基於調和延伸信號及/或基於與音訊信號之高頻帶部分相關聯的高頻帶殘差信號來判定第一增益形狀參數。舉例而言,圖1之第一增益形狀估計器190可基於調和延伸信號(例如,圖2之調和延伸信號208)及/或高頻帶信號124
之高頻帶殘差來判定第一增益形狀參數(例如,圖2之第一增益形狀參數242)。
方法600亦可包括:在604處,基於合成高頻帶信號及基於音訊信號之高頻帶部分來判定第二增益形狀參數。舉例而言,第二增益形狀估計器194可基於合成高頻帶信號404及高頻帶信號124來判定第二增益形狀參數406。
在606處,可將第一增益形狀參數及第二增益形狀參數插入至音訊信號之經編碼版本中以在自音訊信號之經編碼版本再生音訊信號期間實現增益調整。舉例而言,圖1之高頻帶旁側資訊172可包括第一增益形狀參數242及第二增益形狀參數406。多工器180可將第一增益形狀參數242及第二增益形狀參數406插入至位元串流199中,且位元串流199可傳輸至解碼器(例如,圖5之系統500)。圖5之第一增益形狀調整器592可基於第一增益形狀參數242來調整調和延伸信號508以產生第二經調整調和延伸信號544。第二高頻帶激發信號561係至少部分地基於第二經調整調和延伸信號544。另外,圖5之第二增益形狀調整器526可基於第二增益形狀參數406來調整合成高頻帶信號524以再生高頻帶信號124之版本。
第二方法610可包括:在612處,在話語解碼器處自話語編碼器接收經編碼音訊信號。經編碼音訊信號可包括基於在話語編碼器處產生之調和延伸信號208及/或在話語編碼器處產生之高頻帶殘差信號224的第一增益形狀參數242。經編碼音訊信號亦可包括基於合成高頻帶信號404及高頻帶信號124之第二增益形狀參數406。
在614處,可基於第一增益形狀參數及基於第二增益形狀參數自經編碼音訊信號再生音訊信號。舉例而言,圖5之第一增益形狀調整器592可基於第一增益形狀參數242來調整調和延伸信號508以產生第二經調整調和延伸信號544。圖5之高頻帶激發產生器520可基於第二
經調整調和延伸信號544來產生第二高頻帶激發信號561。線性預測合成器522可對第二高頻帶激發信號561執行線性預測合成操作以產生第二合成高頻帶信號524,且第二增益形狀調整器526可基於第二增益形狀參數406來調整第二合成高頻帶信號524以產生第二經調整合成高頻帶信號528(例如,經再生音訊信號)。
圖6之方法600、610可改善音訊信號102之調和延伸低頻帶激發與輸入音訊信號102之高頻帶殘差之間的逐子訊框能量相關性(例如,改善時間演進)。舉例而言,在第一增益級期間,第一增益形狀估計器190及第一增益形狀調整器192可基於第一增益參數來調整調和延伸低頻帶激發,以基於高頻帶之殘差來模型化調和延伸低頻帶激發。方法600、610亦可改善高頻帶信號124與高頻帶信號124之合成版本之間的逐子訊框能量相關性。舉例而言,在第二增益級期間,第二增益形狀估計器194及第二增益形狀調整器196可基於第二增益參數來調整高頻帶信號124之合成版本,以基於高頻帶信號124來模型化高頻帶信號124之合成版本。
在特定實施例中,圖6之方法600、610可經由處理單元(諸如,中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,FPGA器件、ASIC等等)、經由韌體器件或其任何組合而實施。作為一實例,圖6之方法600、610可由執行指令之處理器執行,如關於圖7所描述。
參看圖7,描繪無線通信器件之特定說明性實施例的方塊圖且將其大體上指定為700。器件700包括耦接至記憶體732之處理器710(例如,CPU)。記憶體732可包括可由處理器710及/或CODEC 734執行以執行本文所揭示之方法及程序(諸如,圖6之方法600、610)的指令760。
在一特定實施例中,CODEC 734可包括兩級增益估計系統782及
兩級增益調整系統784。在一特定實施例中,兩級增益估計系統782包括圖1之系統100的一或多個組件、圖2之系統200的一或多個組件,及/或圖4之系統400的一或多個組件。舉例而言,兩級增益估計系統782可執行與圖2之系統100至200、圖4之系統400及圖6之方法600相關聯的編碼操作。在一特定實施例中,兩級增益調整系統784可包括圖5之系統500的一或多個組件。舉例而言,兩級增益調整系統784可執行與圖5之系統500及圖6之方法610相關聯的解碼操作。兩級增益估計系統782及/或兩級增益調整系統784可經由專用硬體(例如,電路系統)而實施、由執行指令以執行一或多個任務之處理器實施,或其組合。
作為一實例,記憶體732或CODEC 734中之記憶體790可為記憶體器件,諸如,隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦可程式化唯讀記憶體(EPROM)、電可擦可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟,或緊密光碟唯讀記憶體(CD-ROM)。記憶體器件可包括指令(例如,指令760或指令795),該等指令在由電腦(例如,CODEC 734中之處理器及/或處理器710)執行時可使電腦執行圖6之方法600、610中之一者的至少一部分。作為一實例,記憶體732或CODEC 734中之記憶體790可為包括指令(例如,分別為指令760或指令795)之非暫時性電腦可讀媒體,該等指令在由電腦(例如,CODEC 734中之處理器及/或處理器710)執行時使電腦執行圖6之方法600、610中之一者的至少一部分。
器件700亦可包括耦接至CODEC 734及處理器710之DSP 796。在一特定實施例中,DSP 796可包括兩級增益估計系統797及兩級增益調整系統798。兩級增益估計系統797可包括圖1之系統100的一或多個組件、圖2之系統200的一或多個組件,及/或圖4之系統400的一或多個
組件。舉例而言,兩級增益估計系統797可執行與圖2之系統100至200、圖4之系統400及圖6之方法600相關聯的編碼操作。兩級增益調整系統798可包括圖5之系統500的一或多個組件。舉例而言,兩級增益調整系統798可執行與圖5之系統500及圖6之方法610相關聯的解碼操作。兩級增益估計系統797及/或兩級增益調整系統798可經由專用硬體(例如,電路系統)而實施、由執行指令以執行一或多個任務之處理器實施,或其組合。
圖7亦展示耦接至處理器710及顯示器728之顯示控制器726。CODEC 734可耦接至處理器710,如所展示。揚聲器736及麥克風738可耦接至CODEC 734。舉例而言,麥克風738可產生圖1之輸入音訊信號102,且CODEC 734可基於輸入音訊信號102來產生輸出位元串流199以供傳輸至接收器。作為另一實例,揚聲器736可用以輸出由CODEC 734自圖1之輸出位元串流199重新建構的信號,其中輸出位元串流199係自傳輸器接收。圖7亦指示出無線控制器740可耦接至處理器710及無線天線742。
在一特定實施例中,處理器710、顯示控制器726、記憶體732、CODEC 734、DSP 796及無線控制器740包括於系統級封裝或系統單晶片器件(例如,行動台數據機(MSM))722中。在一特定實施例中,輸入器件730(諸如,觸控螢幕及/或小鍵盤)及電力供應器744耦接至系統單晶片器件722。此外,在一特定實施例中,如圖7所說明,顯示器728、輸入器件730、揚聲器736、麥克風738、天線742及電力供應器744在系統單晶片器件722外部。然而,顯示器728、輸入器件730、揚聲器736、麥克風738、天線742及電力供應器744中之每一者可耦接至系統單晶片器件722之組件,諸如,介面或控制器。
結合所描述實施例,揭示第一裝置,其包括用於基於調和延伸信號及/或基於與音訊信號之高頻帶部分相關聯的高頻帶殘差信號來
判定第一增益形狀參數的構件。舉例而言,用於判定第一增益形狀參數的構件可包括圖1至圖2之第一增益形狀估計器190、圖2之訊框識別模組214、圖7之兩級增益估計系統782、圖7之兩級增益估計系統797、經組態以判定第一增益形狀參數之一或多個器件(例如,執行非暫時性電腦可讀儲存媒體處之指令的處理器),或其任何組合。
第一裝置亦可包括用於基於合成高頻帶信號及基於音訊信號之高頻帶部分來判定第二增益形狀參數的構件。舉例而言,用於判定第二增益形狀參數的構件可包括圖1及圖4之第二增益形狀估計器194、圖7之兩級增益估計系統782、圖7之兩級增益估計系統797、經組態以判定第二增益參數之一或多個器件(例如,執行非暫時性電腦可讀儲存媒體處之指令的處理器),或其任何組合。
第一裝置亦可包括用於將第一增益形狀參數及第二增益形狀參數插入至音訊信號之經編碼版本中以在自音訊信號之經編碼版本再生音訊信號期間實現增益調整的構件。舉例而言,用於將第一增益形狀參數及第二增益形狀參數插入至音訊信號之經編碼版本中的構件可包括圖1之多工器180、圖7之兩級增益估計系統782、圖7之兩級增益估計系統797、經組態以將第一增益參數插入至音訊信號之經編碼版本中的一或多個器件(例如,執行非暫時性電腦可讀儲存媒體處之指令的處理器),或其任何組合。
結合所描述實施例,揭示第二裝置,其包括用於自話語編碼器接收經編碼音訊信號的構件。經編碼音訊信號包括基於在話語編碼器處產生之第一調和延伸信號及基於在話語編碼器處產生之高頻帶殘差信號的第一增益形狀參數。經編碼音訊信號亦包括基於在話語編碼器處產生之第一合成高頻帶信號及基於音訊信號之高頻帶的第二增益形狀參數。舉例而言,用於接收經編碼音訊信號的構件可包括圖5之非線性激發產生器507、圖5之第一增益形狀估計器592、圖5之第二增益
形狀估計器526、圖7之兩級增益調整系統784、圖7之兩級增益調整系統798、經組態以判定經編碼音訊信號之接收的一或多個器件(例如,執行非暫時性電腦可讀儲存媒體處之指令的處理器),或其任何組合。
第二裝置亦可包括用於基於第一增益形狀參數及基於第二增益形狀參數而自經編碼音訊信號再生音訊信號的構件。舉例而言,用於再生音訊信號的構件可包括圖5之非線性激發產生器507、圖5之第一增益形狀估計器592、圖5之高頻帶激發產生器520、圖5之線性預測係數合成器522、圖5之第二增益形狀估計器526、圖7之兩級增益調整系統784、圖7之兩級增益調整系統798、經組態以再生音訊信號之一或多個器件(例如,執行非暫時性電腦可讀儲存媒體處之指令的處理器),或其任何組合。
熟習此項技術者將進一步瞭解,結合本文所揭示之實施例而描述的各種說明性邏輯區塊、組態、模組、電路及演算法步驟可被實施為電子硬體、由諸如硬體處理器之處理器件執行的電腦軟體,或此兩者之組合。各種說明性組件、區塊、組態、模組、電路及步驟已在上文大體上在其功能性方面予以描述。將此功能性實施為硬體抑或軟體取決於特定應用及強加於整個系統之設計約束。熟習此項技術者可針對每一特定應用而以變化之方式來實施所描述功能性,但不應將此等實施決策解譯為導致脫離本發明之範疇。
結合本文所揭示之實施例而描述之方法或演算法的步驟可直接地體現於硬體中、體現於由處理器執行之軟體模組中,或體現於該兩者之組合中。軟體模組可駐留於諸如以下各者之記憶體器件中:隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦可程式化唯讀記憶體(EPROM)、電可擦可程
式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟,或緊密光碟唯讀記憶體(CD-ROM)。例示性記憶體器件耦接至處理器,使得處理器可自記憶體器件讀取資訊及將資訊寫入至記憶體器件。在替代例中,記憶體器件可與處理器成整體。處理器及儲存媒體可駐留於ASIC中。ASIC可駐留於計算器件或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件而駐留於計算器件或使用者終端機中。
提供所揭示實施例之前述描述以使熟習此項技術者能夠製作或使用所揭示實施例。在不脫離本發明之範疇的情況下,對此等實施例之各種修改對於熟習此項技術者而言將易於顯而易見,且本文所定義之原理可應用於其他實施例。因此,本發明並不意欲限於本文所展示之實施例,而應符合可能與如由以下申請專利範圍定義之原理及新穎特徵相一致的最廣泛範疇。
124‧‧‧高頻帶信號
144‧‧‧低頻帶激發信號
161‧‧‧高頻帶激發信號
180‧‧‧多工器(MUX)
190‧‧‧第一增益形狀估計器
192‧‧‧第一增益形狀調整器
200‧‧‧系統
202‧‧‧包絡追踪器
203‧‧‧低頻帶時域包絡
204‧‧‧線性預測分析濾波器
205‧‧‧白雜訊
207‧‧‧非線性激發產生器
208‧‧‧調和延伸信號
211‧‧‧混頻器
214‧‧‧訊框識別模組
216‧‧‧寫碼模式指示信號
220‧‧‧經調變雜訊信號
224‧‧‧高頻帶殘差信號
240‧‧‧雜訊組合器
242‧‧‧第一增益形狀參數
244‧‧‧經調整調和延伸信號
254‧‧‧第一組合器
256‧‧‧第二組合器
Claims (30)
- 一種方法,其包含:在一話語編碼器處基於一調和延伸信號、基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號或其任何組合來判定第一增益形狀參數;基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數;及將該等第一增益形狀參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該編碼版本再生該音訊信號期間實現增益調整。
- 如請求項1之方法,其中該等第一增益形狀參數係在一線性預測殘差域中予以判定。
- 如請求項1之方法,其中該等第二增益形狀參數係在一線性預測合成域中予以判定。
- 如請求項1之方法,其中該調和延伸信號係經由非線性調和延伸而自該音訊信號之一低頻帶部分予以產生。
- 如請求項1之方法,其進一步包含:基於該等第一增益形狀參數來調整該調和延伸信號以產生一經修改調和延伸信號;及產生一高頻帶激發信號,其中該高頻帶激發信號係至少部分地基於該經修改調和延伸信號。
- 如請求項5之方法,其進一步包含:取樣該調和延伸信號之一低頻帶訊框以產生第一複數個子訊框;取樣該高頻帶殘差信號之一對應高頻帶訊框以產生第二複數 個子訊框;及基於該第一複數個子訊框之能量位準、基於該第二複數個子訊框之能量位準或其任何組合來產生該等第一增益形狀參數。
- 如請求項6之方法,其中調整該調和延伸信號包含按比例調整該第一複數個子訊框中之一特定子訊框以近似該第二複數個子訊框中之一對應子訊框的一能量位準。
- 如請求項6之方法,其中該第二複數個子訊框回應於該高頻帶訊框為一有聲訊框的一判定而包括第一數目個子訊框,且其中該第二複數個子訊框回應於該高頻帶訊框不為一有聲訊框的一判定而包括第二數目個子訊框,該第二數目小於子訊框之該第一數目。
- 如請求項6之方法,其中該第一複數個子訊框及該第二複數個子訊框針對一有聲訊框及一無聲訊框兩者包括相同數目個子訊框,其中若一低頻帶核心取樣速率為12.8千赫茲(kHz),則該第一複數個子訊框及該第二複數個子訊框包括四個子訊框,且其中若該低頻帶核心取樣速率為16kHz,則該第一複數個子訊框及該第二複數個子訊框包括五個子訊框。
- 如請求項5之方法,其進一步包含:對該高頻帶激發信號執行一線性預測合成操作以產生一合成高頻帶信號;基於該合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數;及將該等第二增益形狀參數插入至該音訊信號之該經編碼版本中。
- 如請求項10之方法,其進一步包含基於該等第二增益形狀參數來調整該合成高頻帶信號。
- 一種裝置,其包含:一第一增益形狀估計器,其經組態以基於一調和延伸信號、基於與一音訊信號之一高頻帶部分相關聯的一高頻帶殘差信號或其任何組合來判定第一增益形狀參數;一第二增益形狀估計器,其經組態以基於一合成高頻帶信號及基於該音訊信號之該高頻帶部分來判定第二增益形狀參數;及電路系統,其經組態以將該等第一增益形狀參數及該等第二增益形狀參數插入至該音訊信號之一經編碼版本中以在自該音訊信號之該經編碼版本再生該音訊信號期間實現增益調整。
- 如請求項12之裝置,其中該等第一增益形狀參數係在線性預測殘差域中予以判定。
- 如請求項12之裝置,其中該電路系統包括一多工器。
- 如請求項12之裝置,其中該調和延伸信號係經由非線性調和延伸而自該音訊信號之一低頻帶部分予以產生。
- 如請求項12之裝置,其進一步包含一第一增益形狀調整器,該第一增益形狀調整器經組態以基於該等第一增益形狀參數來調整該調和延伸信號以產生一經修改調和延伸信號。
- 如請求項16之裝置,其中該第一增益形狀估計器經進一步組態以:取樣該調和延伸信號之一低頻帶訊框以產生第一複數個子訊框;取樣該高頻帶殘差信號之一對應高頻帶訊框以產生第二複數個子訊框;及基於該第一複數個子訊框之能量位準、基於該第二複數個子訊框之能量位準或其任何組合來產生該等第一增益形狀參數。
- 如請求項17之裝置,其進一步包含一第一增益形狀調整器,該第一增益形狀調整器經組態以藉由按比例調整該第一複數個子訊框中之一特定子訊框以近似該第二複數個子訊框中之一對應子訊框的一能量位準來調整該調和延伸信號。
- 如請求項17之裝置,其中該第一複數個子訊框回應於該高頻帶訊框為一有聲訊框的一判定而包括第一數目個子訊框,且其中該第一複數個子訊框回應於該高頻帶訊框不為一有聲訊框的一判定而包括第二數目個子訊框,該第二數目小於子訊框之該第一數目。
- 如請求項17之裝置,其中該第一複數個子訊框回應於該高頻帶訊框為一有聲訊框的一判定而包括十六個子訊框。
- 如請求項16之裝置,其進一步包含一線性預測合成器,該線性預測合成器經組態以對該高頻帶激發信號執行一線性預測合成操作以產生該合成高頻帶信號。
- 如請求項12之裝置,其進一步包含一第二增益形狀調整器,該第二增益形狀調整器經組態以基於該等第二增益形狀參數來調整該合成高頻帶信號。
- 一種方法,其包含:在一話語解碼器處自一話語編碼器接收一經編碼音訊信號,其中該經編碼音訊信號包含:基於在該話語編碼器處產生之一第一調和延伸信號、基於在該話語編碼器處產生之一高頻帶殘差信號或其任何組合的第一增益形狀參數;及基於在該話語編碼器處產生之一第一合成高頻帶信號及基於一音訊信號之一高頻帶的第二增益形狀參數;及基於該等第一增益形狀參數及基於該等第二增益形狀參數而 自該經編碼音訊信號再生該音訊信號。
- 如請求項23之方法,其中在該話語解碼器處再生該音訊信號包含:基於非線性地延伸該經編碼音訊信號之一低頻帶激發來產生一第二調和延伸信號;及基於該等第一增益形狀參數來調整該第二調和延伸信號以獲得一第二經修改調和延伸信號。
- 如請求項24之方法,其進一步包含基於該經修改第二調和延伸信號來產生一第二高頻帶激發信號。
- 如請求項25之方法,其進一步包含對該第二高頻帶激發信號執行一線性預測合成操作以產生一第二合成高頻帶信號。
- 如請求項26之方法,其進一步包含基於該等第二增益形狀參數來調整該第二合成高頻帶信號。
- 一種話語解碼器,其經組態以:自一話語編碼器接收一經編碼音訊信號,其中該經編碼音訊信號包含:基於在該話語編碼器處產生之一第一調和延伸信號、基於在該話語編碼器處產生之一高頻帶殘差信號或其任何組合的第一增益形狀參數;及基於在該話語編碼器處產生之一第一合成高頻帶信號及基於一音訊信號之一高頻帶的第二增益形狀參數;及基於該等第一增益形狀參數及基於該等第二增益形狀參數而自該經編碼音訊信號再生該音訊信號。
- 如請求項28之話語解碼器,其包含:一非線性激發產生器,其經組態以基於該經編碼音訊信號之一低頻帶激發來產生一第二調和延伸信號;及 一第一增益形狀調整器,其經組態以基於該等第一增益形狀參數來調整該第二調和延伸信號以獲得一第二經修改調和延伸信號。
- 如請求項29之話語解碼器,其進一步包含一高頻帶激發產生器,該高頻帶激發產生器經組態以基於該經修改第二調和延伸信號來產生一第二高頻帶激發信號。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361889434P | 2013-10-10 | 2013-10-10 | |
US14/508,486 US9620134B2 (en) | 2013-10-10 | 2014-10-07 | Gain shape estimation for improved tracking of high-band temporal characteristics |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201521020A true TW201521020A (zh) | 2015-06-01 |
TWI604440B TWI604440B (zh) | 2017-11-01 |
Family
ID=52810401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103135270A TWI604440B (zh) | 2013-10-10 | 2014-10-09 | 信號處理方法、裝置及系統 |
Country Status (22)
Country | Link |
---|---|
US (1) | US9620134B2 (zh) |
EP (1) | EP3055860B1 (zh) |
JP (1) | JP6262337B2 (zh) |
KR (1) | KR101828193B1 (zh) |
CN (1) | CN105593933B (zh) |
AU (1) | AU2014331903B2 (zh) |
BR (1) | BR112016007914B1 (zh) |
CA (1) | CA2925572C (zh) |
CL (1) | CL2016000819A1 (zh) |
DK (1) | DK3055860T3 (zh) |
ES (1) | ES2774334T3 (zh) |
HK (1) | HK1219344A1 (zh) |
HU (1) | HUE047305T2 (zh) |
MX (1) | MX350816B (zh) |
MY (1) | MY183940A (zh) |
NZ (1) | NZ717833A (zh) |
PH (1) | PH12016500470B1 (zh) |
RU (1) | RU2648570C2 (zh) |
SA (1) | SA516370898B1 (zh) |
SI (1) | SI3055860T1 (zh) |
TW (1) | TWI604440B (zh) |
WO (1) | WO2015054421A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9659564B2 (en) * | 2014-10-24 | 2017-05-23 | Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi | Speaker verification based on acoustic behavioral characteristics of the speaker |
US10109284B2 (en) * | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) * | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
US6233554B1 (en) * | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6141638A (en) | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
US7117146B2 (en) | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
GB2342829B (en) | 1998-10-13 | 2003-03-26 | Nokia Mobile Phones Ltd | Postfilter |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6449313B1 (en) | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6704701B1 (en) | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
WO2001059766A1 (en) | 2000-02-11 | 2001-08-16 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
WO2002023536A2 (en) | 2000-09-15 | 2002-03-21 | Conexant Systems, Inc. | Formant emphasis in celp speech coding |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
US6766289B2 (en) | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
JP3457293B2 (ja) | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US6993207B1 (en) | 2001-10-05 | 2006-01-31 | Micron Technology, Inc. | Method and apparatus for electronic image processing |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7047188B2 (en) | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7788091B2 (en) | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
JP2006197391A (ja) | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
UA94041C2 (ru) * | 2005-04-01 | 2011-04-11 | Квелкомм Инкорпорейтед | Способ и устройство для фильтрации, устраняющей разреженность |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
PL1875463T3 (pl) | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US9009032B2 (en) | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
WO2008072671A1 (ja) | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
KR101413968B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
BRPI0910511B1 (pt) * | 2008-07-11 | 2021-06-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para decodificar e codificar um sinal de áudio |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CA2780962C (en) | 2009-11-19 | 2017-09-05 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2710590B1 (en) | 2011-05-16 | 2015-10-07 | Google, Inc. | Super-wideband noise supression |
CN102802112B (zh) | 2011-05-24 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 具有音频文件格式转换功能的电子装置 |
US9336787B2 (en) * | 2011-10-28 | 2016-05-10 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus and encoding method |
-
2014
- 2014-10-07 US US14/508,486 patent/US9620134B2/en active Active
- 2014-10-08 ES ES14790439T patent/ES2774334T3/es active Active
- 2014-10-08 KR KR1020167011241A patent/KR101828193B1/ko active IP Right Grant
- 2014-10-08 WO PCT/US2014/059753 patent/WO2015054421A1/en active Application Filing
- 2014-10-08 AU AU2014331903A patent/AU2014331903B2/en active Active
- 2014-10-08 CN CN201480053480.6A patent/CN105593933B/zh active Active
- 2014-10-08 BR BR112016007914-0A patent/BR112016007914B1/pt active IP Right Grant
- 2014-10-08 MY MYPI2016700917A patent/MY183940A/en unknown
- 2014-10-08 SI SI201431494T patent/SI3055860T1/sl unknown
- 2014-10-08 RU RU2016113271A patent/RU2648570C2/ru active
- 2014-10-08 NZ NZ717833A patent/NZ717833A/en unknown
- 2014-10-08 MX MX2016004528A patent/MX350816B/es active IP Right Grant
- 2014-10-08 EP EP14790439.5A patent/EP3055860B1/en active Active
- 2014-10-08 DK DK14790439.5T patent/DK3055860T3/da active
- 2014-10-08 JP JP2016521700A patent/JP6262337B2/ja active Active
- 2014-10-08 HU HUE14790439A patent/HUE047305T2/hu unknown
- 2014-10-08 CA CA2925572A patent/CA2925572C/en active Active
- 2014-10-09 TW TW103135270A patent/TWI604440B/zh active
-
2016
- 2016-03-10 PH PH12016500470A patent/PH12016500470B1/en unknown
- 2016-04-07 SA SA516370898A patent/SA516370898B1/ar unknown
- 2016-04-08 CL CL2016000819A patent/CL2016000819A1/es unknown
- 2016-06-24 HK HK16107358.3A patent/HK1219344A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
TWI604440B (zh) | 2017-11-01 |
US20150106102A1 (en) | 2015-04-16 |
DK3055860T3 (da) | 2020-02-03 |
BR112016007914A2 (pt) | 2017-08-01 |
PH12016500470A1 (en) | 2016-05-16 |
PH12016500470B1 (en) | 2016-05-16 |
HK1219344A1 (zh) | 2017-03-31 |
RU2016113271A (ru) | 2017-11-15 |
CA2925572C (en) | 2019-05-21 |
US9620134B2 (en) | 2017-04-11 |
MX2016004528A (es) | 2016-07-22 |
KR101828193B1 (ko) | 2018-02-09 |
MX350816B (es) | 2017-09-25 |
CN105593933A (zh) | 2016-05-18 |
CA2925572A1 (en) | 2015-04-16 |
JP6262337B2 (ja) | 2018-01-17 |
RU2648570C2 (ru) | 2018-03-26 |
CN105593933B (zh) | 2019-10-15 |
BR112016007914B1 (pt) | 2021-12-21 |
EP3055860A1 (en) | 2016-08-17 |
EP3055860B1 (en) | 2019-11-20 |
JP2016539355A (ja) | 2016-12-15 |
ES2774334T3 (es) | 2020-07-20 |
SA516370898B1 (ar) | 2019-01-03 |
SI3055860T1 (sl) | 2020-03-31 |
KR20160067207A (ko) | 2016-06-13 |
CL2016000819A1 (es) | 2016-10-14 |
HUE047305T2 (hu) | 2020-04-28 |
NZ717833A (en) | 2019-01-25 |
WO2015054421A1 (en) | 2015-04-16 |
MY183940A (en) | 2021-03-17 |
AU2014331903B2 (en) | 2018-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI604440B (zh) | 信號處理方法、裝置及系統 | |
US10410652B2 (en) | Estimation of mixing factors to generate high-band excitation signal | |
US9899032B2 (en) | Systems and methods of performing gain adjustment | |
KR20160087827A (ko) | 고대역 코딩에서의 선택적 위상 보상 | |
AU2014331903A1 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
US20150149157A1 (en) | Frequency domain gain shape estimation |