TWI713819B - 用於頻譜映射及調整之計算裝置及方法 - Google Patents
用於頻譜映射及調整之計算裝置及方法 Download PDFInfo
- Publication number
- TWI713819B TWI713819B TW107104695A TW107104695A TWI713819B TW I713819 B TWI713819 B TW I713819B TW 107104695 A TW107104695 A TW 107104695A TW 107104695 A TW107104695 A TW 107104695A TW I713819 B TWI713819 B TW I713819B
- Authority
- TW
- Taiwan
- Prior art keywords
- band
- channel
- spectrum
- gain
- spectrum mapping
- Prior art date
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 254
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000003595 spectral effect Effects 0.000 title claims abstract description 40
- 230000005284 excitation Effects 0.000 claims abstract description 121
- 238000001228 spectrum Methods 0.000 claims description 266
- 230000015572 biosynthetic process Effects 0.000 claims description 26
- 238000003786 synthesis reaction Methods 0.000 claims description 26
- 230000005236 sound signal Effects 0.000 description 80
- 230000000875 corresponding effect Effects 0.000 description 34
- 230000005540 biological transmission Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 15
- 230000001364 causal effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 230000003111 delayed effect Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 208000035742 Air-borne transmission Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000005557 airborne transmission Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmitters (AREA)
- Mobile Radio Communication Systems (AREA)
- Error Detection And Correction (AREA)
Abstract
一種方法包括:在一第一裝置之一編碼器處基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道。該方法亦包括基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該方法亦包括產生該非參考目標通道之一高頻帶部分。該方法進一步包括基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數。該方法亦包括將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道。該方法進一步包括基於該一或多個頻譜映射參數及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流。
Description
本發明大體上係關於多個音訊信號之編碼。
技術之進步已帶來更小且更強大之計算裝置。舉例而言,當前存在多種攜帶型個人計算裝置,包括無線電話(諸如行動電話及智慧型電話)、平板電腦及膝上型電腦,該等攜帶型個人計算裝置係小的輕質的且容易由使用者攜帶。此等裝置可經由無線網路來傳達語音及資料封包。另外,許多此類裝置併入額外功能,諸如數位靜態攝影機、數位視訊攝影機、數位記錄器及音訊檔案播放器。又,此等裝置可處理可執行指令,該等指令包括可用以存取網際網路之軟體應用程式,諸如網頁瀏覽器應用程式。因而,此等裝置可以包括顯著計算能力。
計算裝置可包括或耦接至多個麥克風以接收音訊信號。一般而言,與多個麥克風之第二麥克風相比,聲源更接近於第一麥克風。因此,由於麥克風距聲源之各別距離,自第二麥克風接收之第二音訊信號可相對於自第一麥克風接收之第一音訊信號延遲。在其他實施中,第一音訊信號可相對於第二音訊信號延遲。在立體編碼中,來自麥克風之音訊信號可經編碼以產生中間通道信號及一或多個側通道信號。中間通道信號可對應於第一
音訊信號與第二音訊信號之總和。側通道信號可對應於第一音訊信號與第二音訊信號之間的差。
在一特定實施中,一種裝置包括一編碼器,其經組態以基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道。該編碼器亦經組態以基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該編碼器亦經組態以產生該非參考目標通道之一高頻帶部分。該編碼器經進一步組態以基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數。該編碼器亦經組態以將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道。該編碼器經進一步組態以基於該一或多個頻譜映射參數及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流。該裝置亦包括經組態以將該經編碼位元串流傳輸至一第二裝置的一傳輸器。
在另一特定實施中,一種方法包括在一第一裝置之一編碼器處基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道。該方法亦包括基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該方法亦包括產生該非參考目標通道之一高頻帶部分。該方法進一步包括基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數。該方法亦包括將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道。該方法進一步包括基於該一或多個頻譜映射參數及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流。該方法
亦包括將該經編碼位元串流傳輸至一第二裝置。
在另一特定實施中,一種非暫時性電腦可讀媒體包括在由一第一裝置之一編碼器執行時使得該編碼器執行包括以下項之操作的指令:基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道。該等操作亦包括基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該等操作亦包括產生該非參考目標通道之一高頻帶部分。該等操作亦包括基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數。該等操作亦包括將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道。該等操作亦包括基於該一或多個頻譜映射參數及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流。該等操作亦包括啟動該經編碼位元串流至一第二裝置之傳輸。
在另一特定實施中,一種裝置包括用於基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道的構件。該裝置亦包括用於基於對應於非參考目標通道之非參考高頻帶激勵產生經合成非參考高頻帶通道的構件。該裝置亦包括用於產生該非參考目標通道之一高頻帶部分的構件。該裝置進一步包括用於基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數的構件。該裝置亦包括用於將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道的構件。該裝置進一步包括用於基於該一或多個頻譜映射參數及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流的構件。該裝置亦包括用於將經編碼位元串流傳輸至第二裝置的構件。
在另一特定實施中,一種裝置包括經組態以自一所接收低頻帶位元串流產生一參考通道及一非參考通道的一解碼器。該低頻帶位元串流係自一第二裝置之一編碼器接收。該解碼器亦經組態以基於對應於該非參考通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該解碼器經進一步組態以自一所接收頻譜映射位元串流提取一或多個頻譜映射參數。該頻譜映射位元串流係自該第二裝置之該編碼器接收。該解碼器亦經組態以藉由將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道來產生一頻譜狀經合成非參考高頻帶通道。該解碼器經進一步組態以至少基於該頻譜狀非參考高頻帶通道、該參考通道及該非參考目標通道產生一輸出信號。該裝置亦包括經組態以顯現該輸出信號之一播放裝置。在一些實施中,該參考通道及該非參考目標通道可為基於一降混位元串流產生於該解碼器處的通道。根據一個實施,該解碼器可在未產生該參考通道及該非參考目標通道的情況下產生該左通道及該右通道之該等低頻帶部分。
在另一特定實施中,一種方法包括在一裝置之一解碼器處自一所接收低頻帶位元串流產生一參考通道及一非參考通道。該低頻帶位元串流係自一第二裝置之一編碼器接收。該方法亦包括基於對應於該非參考通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該方法進一步包括自一所接收頻譜映射位元串流提取一或多個頻譜映射參數。該頻譜映射位元串流係自該第二裝置之該編碼器接收。該方法亦包括藉由將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道來產生一頻譜狀經合成非參考高頻帶通道。該方法進一步包括至少基於該頻譜狀非參考高頻帶通道、該參考通道及該非參考目標通道產生一輸出信號。該方法亦包括在一播放裝置處顯現該輸出信號。
在另一特定實施中,一種非暫時性電腦可讀媒體包括在由一裝置之一解碼器執行時使得該解碼器執行包括以下項之操作的指令:自一所接收低頻帶位元串流產生一參考通道及一非參考通道。該低頻帶位元串流係自一第二裝置之一編碼器接收。該等操作亦包括基於對應於該非參考通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道。該等操作亦包括自一所接收頻譜映射位元串流提取一或多個頻譜映射參數。該頻譜映射位元串流係自該第二裝置之該編碼器接收。該等操作亦包括藉由將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道來產生一頻譜狀經合成非參考高頻帶通道。該等操作亦包括至少基於該頻譜狀非參考高頻帶通道、該參考通道及該非參考目標通道產生一輸出信號。該等操作亦包括將該輸出信號提供至一播放裝置用於顯現。
在另一特定實施中,一種裝置包括用於自一所接收低頻帶位元串流產生一非參考通道的構件。該低頻帶位元串流係自一第二裝置之一編碼器接收。該裝置亦包括用於基於對應於非參考通道之非參考高頻帶激勵產生經合成非參考高頻帶通道的構件。該裝置亦包括用於自所接收頻譜映射位元串流提取一或多個頻譜映射參數的構件。該頻譜映射位元串流係自該第二裝置之該編碼器接收。該裝置亦包括用於藉由將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道來產生一頻譜狀經合成非參考高頻帶通道的構件。該裝置亦包括用於至少基於該頻譜狀非參考高頻帶通道、該參考通道及該非參考目標通道產生一輸出信號的構件。該裝置亦包括用於顯現該輸出信號的構件。
在檢閱整個申請案之後,本發明之其他實施方案、優勢及特徵將變得顯而易見,該整個申請案包括以下章節:圖式簡單說明、實施方式及申
請專利範圍。
100:系統
104:第一裝置
106:第二裝置
110:傳輸器
112:輸入介面
120:網路
126:第一輸出通道
128:第二輸出通道
130:第一音訊通道
132:第二音訊通道
142:第一揚聲器
144:第二揚聲器
146:第一麥克風
148:第二麥克風
152:聲源
153:記憶體
191:指令
200:編碼器
202:包括降混器
204:通道間頻寬擴展(ICBWE)編碼器
204a:第一部分
204b:第二部分
206:中間通道頻寬擴展(BWE)編碼器
208:低頻帶編碼器
212:左通道
214:右通道
216:降混位元串流
222:中間通道
224:低頻帶側通道
232:基於低頻帶激勵信號
234:參數
242:ICBWE位元串流
244:高頻帶中間通道位元串流
246:低頻帶位元串流
251:線性預測係數(LPC)估計器
252:線性預測係數(LPC)量化器
253:非線性BWE產生器
254:隨機雜訊產生器
255:信號倍增器
256:雜訊包絡調變器
257:求和器
258:倍增器
259:線性預測係數(LPC)合成濾波器
260:高頻帶增益形狀估計器
261:高頻帶增益形狀量化器
262:高頻帶增益形狀縮放器
263:高頻帶增益訊框估計器
264:高頻帶增益訊框量化器
265:多工器
271:高頻帶線性預測係數(LPC)
272:高頻帶線性預測係數(LPC)位元串流
273:增益經調整諧波高頻帶激勵
274:雜訊
275:增益經調整經調變雜訊
276:高頻帶激勵
277:經合成高頻帶中間通道
278:高頻帶增益形狀參數
279:經量化高頻帶增益形狀參數
280:高頻帶增益形狀位元串流
281:經縮放經合成高頻帶中間通道
282:高頻帶增益訊框參數
283:高頻帶增益訊框位元串流
290:濾波器組
292:高頻帶中間通道
294:低頻帶中間通道
299:高頻帶激勵產生器
300:解碼器
302:中間通道頻寬擴展(BWE)解碼器
304:低頻帶解碼器
306:通道間頻寬擴展(BWE)解碼器
308:低頻帶升混器
310:信號組合器
312:信號組合器
314:通道間移位器
322:參數
324:高頻帶中間通道
325:低頻帶激勵信號
326:低頻帶中間通道
328:低頻帶側通道
330:高頻帶左通道
332:高頻帶右通道
334:低頻帶左通道
336:低頻帶右通道
340:未經移位左通道
342:未經移位右通道
350:左通道
352:右通道
360:線性預測係數(LPC)反量化器
362:高頻帶激勵產生器
364:線性預測係數(LPC)合成濾波器
366:高頻帶增益形狀反量化器
368:高頻帶增益形狀縮放器
370:高頻帶增益訊框反量化器
372:高頻帶增益訊框縮放器
380:高頻帶激勵
382:經合成高頻帶中間通道
384:經縮放經合成高頻帶中間通道
404:高頻帶參考通道判定單元
406:高頻帶參考通道指示符編碼器
408:非參考高頻帶激勵產生器
410:線性預測係數(LPC)合成濾波器
412:高頻帶目標通道產生器
414:頻譜映射估計器
416:頻譜映射量化器
418:信號倍增器
420:信號倍增器
422:信號組合器
424:開關
440:高頻帶參考通道指示符
442:高頻帶參考通道指示符位元串流
452:增益經調整諧波高頻帶激勵
454:增益經調整經調變雜訊
456:非參考高頻帶激勵
457:經量化線性預測係數(LPC)
458:經合成非參考高頻帶
459:非參考通道
460:非參考高頻帶通道
462:頻譜映射參數
464:高頻帶頻譜映射位元串流
466:經量化頻譜映射參數
482:經調變雜訊
502:頻譜映射施加器
504:增益映射估計器與量化器
510:經合成高頻帶中間通道
514:頻譜狀經合成非參考高頻帶
516:非參考高頻帶通道
520:經合成高頻帶中間通道
522:高頻帶增益映射位元串流
524:經量化高頻帶增益映射位元串流
590:多工器
602:非參考高頻帶激勵產生器
604:線性預測係數(LPC)合成濾波器
606:頻譜映射施加器
608:頻譜映射反量化器
610:高頻帶增益形狀縮放器
612:非參考高頻帶增益縮放器
616:增益映射反量化器
618:參考高頻帶增益縮放器
620:高頻帶通道映射器
622:信號倍增器
624:信號倍增器
626:信號組合器
630:諧波高頻帶激勵
632:經調變雜訊
634:增益經調整諧波高頻帶激勵
636:增益經調整經調變雜訊
638:非參考高頻帶激勵
640:經量化高頻帶線性預測係數(LPC)
642:經合成非參考高頻帶
644:經解量化頻譜映射位元串流
646:頻譜狀經合成非參考高頻帶
648:經量化高頻帶增益形狀
650:經縮放信號
651:倍增器
652:經量化高頻帶增益訊框
656:所得信號
658:經解碼高頻帶非參考通道
660:經量化高頻帶增益映射參數
662:經解碼高頻帶中間通道
664:經解碼高頻帶參考通道
700:方法
800:方法
900:裝置
902:數位至類比轉換器(DAC)
904:類比至數位轉換器(ADC)
906:處理器
908:媒體編解碼器
910:額外處理器
912:回音消除器
922:系統單晶片裝置
926:顯示器控制器
928:顯示器
930:輸入裝置
934:編解碼器
942:天線
944:電源供應器
946:麥克風
948:揚聲器
1000:基地台
1006:處理器
1008:音訊編解碼器
1010:轉碼器
1014:資料串流
1016:經轉碼資料串流
1032:記憶體
1036:編碼器
1038:解碼器
1042:第一天線
1044:第二天線
1052:第一收發器
1054:第二收發器
1060:網路連接
1062:解調變器
1064:接收器資料處理器
1070:媒體閘道器
1082:傳輸資料處理器
1084:傳輸多輸入多輸出(MIMO)處理器
圖1為包括可操作以估計一或多個頻譜映射參數之編碼器及可操作以提取一或多個頻譜映射參數之解碼器的系統之特定說明性實例的方塊圖;圖2A為說明圖1之編碼器的圖;圖2B為說明中間通道頻寬擴展(BWE)編碼器的圖;圖3A為說明圖1之解碼器的圖;圖3B為說明中間通道BWE解碼器的圖;圖4為說明圖1之編碼器之通道間頻寬擴展編碼器之第一部分的圖;圖5為說明圖1之編碼器之通道間頻寬擴展編碼器之第二部分的圖;圖6為說明圖1之通道間頻寬擴展解碼器的圖;圖7為估計一或多個頻譜映射參數之方法的特定實例;圖8為提取一或多個頻譜映射參數之方法的特定實例;圖9為可操作以估計一或多個頻譜映射參數之行動裝置之特定說明性實例的方塊圖;及圖10為可操作以估計一或多個頻譜映射參數之基地台的方塊圖。
本申請案主張2017年3月9日申請的標題為「INTER-CHANNEL BANDWIDTH EXTENSION SPECTRAL MAPPING AND ADJUSTMENT」之美國臨時專利申請案第62/469,432號之優先權,其以全文引用的方式併入本文中。
下文參考圖式描述本發明之特定態樣。在描述中,共同特徵藉由共同參考編號指示。如本文所使用,各種術語僅僅用於描述特定實施之目的,
且並不意欲限制實施。舉例而言,除非內容以其他方式明確地指示,否則單數形式「一」、「一個」及「該」意欲同樣包括複數形式。可進一步理解,術語「包含」及「包含著」可與「包括」或「包括著」互換使用。另外,應理解,術語「其中」可與「在…的情況下」互換使用。如本文中所使用,用以修改元件(諸如,結構、組件、操作等等)之序數術語(例如,「第一」、「第二」、「第三」等等)本身不指示元件關於另一元件之任何優先權或次序,而是僅將元件與具有相同名稱之另一元件區別開(除非使用序數術語)。如本文所使用,術語「集合」指代特定元素中之一或多者,且術語「複數個」指代特定元素中之多個(例如,兩個或兩個以上)。
在本發明中,諸如「判定」、「計算」、「移位」、「調整」等之術語可用於描述如何執行一或多個操作。應注意,此等術語不應解釋為限制性的且其他技術可用以執行類似操作。另外,如本文中所提及,「產生」、「計算」、「使用」、「選擇」、「存取」與「判定」可互換地使用。舉例而言,「產生」、「計算」或「判定」參數(或信號)可指積極地產生、計算或判定參數(或信號),或可指使用、選擇或存取已(諸如)由另一組件或裝置產生之參數(或信號)。
揭示可操作以編碼多個音訊信號之系統及裝置。裝置可包括經組態以編碼多個音訊信號之編碼器。可使用多個記錄裝置(例如,多個麥克風)同時及時地俘獲多個音訊信號。在一些實例中,藉由多路傳輸若干同時或非同時記錄之音訊通道可合成地(例如,人工)產生多個音訊信號(或多通道音訊)。如說明性實例,音訊通道之並行記錄或多路傳輸可產生2通道組態(亦即,立體聲:左及右)、5.1通道組態(左、右、中央、左環繞、右環繞及低頻重音(LFE)通道)、7.1通道組態、7.1+4通道組態、22.2通道組態
或N通道組態。
電話會議室(或遠程呈現室)中之音訊俘獲裝置可包括獲取空間音訊之多個麥克風。空間音訊可包括話語以及經編碼且經傳輸之背景音訊。視如何配置麥克風以及來源(例如,講話者)相對於麥克風及房間大小所處的位置,來自給定來源(例如,講話者)之話語/音訊可於不同時間到達多個麥克風處。舉例而言,相比於與裝置相關聯之第二麥克風,聲源(例如,講話者)可更接近與裝置相關聯之第一麥克風。因此,與第二麥克風相比,自聲源發出之聲音可更早到達第一麥克風。裝置可經由第一麥克風接收第一音訊信號且可經由第二麥克風接收第二音訊信號。
中側(MS)寫碼及參數立體(PS)寫碼為可提供優於雙單通道寫碼技術之經改良效能的立體寫碼技術。在雙單通道寫碼中,左(L)通道(或信號)及右(R)通道(或信號)經獨立地寫碼,而不利用通道間相關。在寫碼之前,藉由將左通道及右通道轉換為總通道及差通道(例如,側通道),MS寫碼減少相關L/R通道對之間的冗餘。總信號及差信號經波形寫碼或基於MS寫碼中之模型而寫碼。總信號比側信號耗費相對更多的位元。PS寫碼藉由將L/R信號轉換為總信號及一組側參數來減少每一子帶中之冗餘。側參數可指示通道間強度差(IID)、通道間相位差(IPD)、通道間時差(ITD)、側或殘餘預測增益等。總信號為經寫碼之波形且與側參數一起傳輸。在混合型系統中,側通道可在較低頻帶中(例如,小於2千赫茲(kHz))經波形寫碼,並在較高頻帶(例如,大於或等於2kHz)中經PS寫碼,其中通道間相位保持在感知上並不關鍵。在一些實施中,PS寫碼亦可在波形寫碼之前用於較低頻帶中以減少通道間冗餘。
可在頻域或子帶域中完成MS寫碼及PS寫碼。在一些實例中,左通道
及右通道可不相關。舉例而言,左通道及右通道可包括不相關之合成信號。當左通道及右通道不相關時,MS寫碼、PS寫碼或兩者之寫碼效率可接近於雙單通道寫碼之寫碼效率。
取決於記錄組態,可在左通道與右通道之間存在時間性移位以及其他空間效應(諸如回聲及室內混響)。若並不補償通道之間的時間移位及相位失配,則總通道及差通道可含有減少與MS或PS技術相關聯之寫碼增益的可比能量。寫碼增益之減少可基於時間(或相位)移位之量。總信號及差信號之可比能量可限制通道經時間移位但高度相關之某些訊框中的MS寫碼之使用。在立體寫碼中,中間通道(例如,總通道)及側通道(例如,差通道)可基於以下公式產生:M=(L+R)/2,S=(L-R)/2, 公式1
其中M對應於中間通道,S對應於側通道,L對應於左通道且R對應於右通道。
在一些狀況下,中間通道及側通道可基於以下公式產生:M=c(L+R),S=c(L-R), 公式2
其中c對應於頻率相關之複合值。基於公式1或公式2而產生中間通道及側通道可被稱作「降混」。基於公式1或公式2而自中間通道及側通道產生左通道及右通道之相反程序可被稱作「升混」。
在一些狀況下,中間通道可係基於其他公式,諸如:M=(L+gDR)/2,或 公式3
M=g1L+g2R 公式4
其中g1+g2=1.0,且其中gD為增益參數。在其他實例中,降混可在頻帶中執行,其中中間(b)=c1L(b)+c2R(b),其中c1及c2為複數,其中側
(b)=c3L(b)-c4R(b),且其中c3及c4為複數。
用以在MS寫碼或雙單通道寫碼之間選擇特定訊框之特別途徑可包括:產生中間信號及側信號,計算中間信號及側信號之能量,並基於該能量判定是否執行MS寫碼。舉例而言,可執行MS寫碼以回應側信號與中間信號之能量比小於臨限值之判定。為了說明,若右通道經移位至少第一時間(例如,約0.001秒或48kHz下的48個樣本),則中間信號(對應於左信號與右信號之總和)之第一能量可與用於有聲話語訊框之側信號(對應於左信號與右信號之間的差)之第二能量相當。當第一能量與第二能量相當時,較高數目個位元可用以編碼側通道,從而降低MS寫碼相對於雙單通道寫碼之寫碼效率。可因此在第一能量與第二能量相當時使用雙單通道寫碼(例如,當第一能量與第二能量之比大於或等於臨限值時)。在一替代途徑中,可基於左通道與右通道之臨限值及歸一化交叉相關值之比較來在MS寫碼與雙單通道寫碼之間決定何者用於特定訊框。
在一些實例中,編碼器可判定指示第一音訊信號與第二音訊信號之間的時間未對準之量的失配值。如本文所使用,「時間移位值」、「移位值」及「失配值」可被互換地使用。舉例而言,編碼器可判定指示第一音訊信號相對於第二音訊信號之移位(例如,時間失配)的時間移位值。時間失配值可對應於在第一麥克風處第一音訊信號之接收與在第二麥克風處第二音訊信號之接收之間的時間延遲之量。此外,編碼器可在逐訊框基礎上判定時間失配值,例如,基於每20毫秒(ms)話語/音訊訊框。舉例而言,時間失配值可對應於第二音訊信號之第二訊框相對於第一音訊信號之第一訊框延遲的時間之量。替代地,時間失配值可對應於第一音訊信號之第一訊框相對於第二音訊信號之第二訊框延遲的時間之量。
當與第二麥克風相比,聲源更接近第一麥克風時,第二音訊信號之訊框可相對於第一音訊信號之訊框延遲。在此情況下,第一音訊信號可被稱為「參考音訊信號」或「參考通道」且經延遲第二音訊信號可被稱為「目標音訊信號」或「目標通道」。替代地,當與第一麥克風相比,聲源更接近第二麥克風時,第一音訊信號之訊框可相對於第二音訊信號之訊框延遲。在此情況下,第二音訊信號可被稱為參考音訊信號或參考通道,且經延遲第一音訊信號可被稱為目標音訊信號或目標通道。
視聲源(例如講話者)位於會議室或遠程呈現室內之位置及聲源(例如講話者)位置如何相對於麥克風改變而定,參考通道及目標通道可自一個訊框改變至另一訊框;類似地,時間延遲值亦可自一個訊框改變至另一訊框。然而,在一些實施中,時間失配值可始終係正的,以指示「目標」通道相對於「參考」通道之延遲量。此外,時間失配值可對應於「非因果移位」值,經延遲目標通道藉由該「非因果移位」值在時間上「經拉回」,使得目標通道與「參考」通道對準(例如最大限度地對準)。可對參考通道及經非因果移位之目標通道執行判定中間通道及側通道之降混演算法。
編碼器可基於參考音訊通道及應用於目標音訊通道之複數個時間失配值而判定時間失配值。舉例而言,可在第一時間(m1)處接收參考音訊通道之第一訊框X。可在對應於第一時間失配值之第二時間(n1)處接收目標音訊通道之第一特定訊框Y,例如,shift1=n1-m1。另外,可在第三時間(m2)接收參考音訊通道之第二訊框。可在對應於第二時間失配值之第四時間(n2)處接收目標音訊通道之第二特定訊框,例如,移位shift2=n2-m2。
裝置可以第一取樣速率(例如,32kHz取樣速率(亦即,640個樣本每訊框))進行成框或緩衝演算法,以產生訊框(例如,20ms樣本)。為回應第
一音訊信號之第一訊框及第二音訊信號之第二訊框同時到達裝置之判定,編碼器可估計如等於零樣本之時間失配值(例如shift1)。可在時間上對準左通道(例如,對應於第一音訊信號)及右通道(例如,對應於第二音訊信號)。在一些狀況下,即使當對準時,左通道及右通道可歸因於各種原因(例如麥克風校準)在能量方面存在不同。
在一些實例中,左通道及右通道可由於各種原因(例如,與麥克風中的另一者相比,聲源(諸如講話者)可更接近麥克風中的一者,且兩個麥克風相隔距離可大於臨限值(例如,1至20厘米)距離)在時間上未對準。聲源相對於麥克風之位置可在左通道及右通道中引入不同的延遲。此外,在左通道與右通道之間可存在增益差、能量差或位準差。
在一些實例中,在存在超過兩個通道之情況下,參考通道最初基於通道之位準或能量而被選擇,且隨後基於不同通道對之間的時間失配值(例如,t1(ref,ch2),t2(ref,ch3),t3(ref,ch4),…t3(ref,chN))而被改進,其中ch1為最初參考通道且t1(.)、t2(.)等為估計失配值之函數。若所有時間失配值係正的,則ch1被視為參考通道。若失配值中之任一者為負值,則參考通道經重組態成與產生負值的失配值相關聯的通道且上述過程繼續直至實現參考通道之最佳選擇(亦即,基於最大限度地去相關最大數目之側通道)為止。遲滯可用以克服參考通道選擇中之任何急劇變化。
在一些實例中,當多個講話者交替地講話時(例如,在不重疊情況下),音訊信號自多個聲源(例如,講話者)到達麥克風之時間可變化。在此狀況下,編碼器可基於講話者動態地調節時間失配值以識別參考通道。在一些其他實例中,多個講話者可同時講話,取決於哪個講話者最大聲、距麥克風最近等,此可導致變化時間性失配值。在此狀況下,參考及目標
通道之識別可基於當前訊框中之變化的時間移位值及先前訊框中之經估計時間失配值,及第一及第二音訊信號的能量或時間演進。
在一些實例中,當兩種信號可能展示較少(例如,無)相關時,可合成或人工產生第一音訊信號及第二音訊信號。應理解,本文所描述之實例為說明性且可在類似或不同情境中判定第一音訊信號與第二音訊信號之間的關係中具指導性。
編碼器可基於第一音訊信號之第一訊框與第二音訊信號之複數個訊框之比較產生比較值(例如,差值或交叉相關值)。該複數個訊框中之每一訊框可對應於特定時間失配值。編碼器可基於比較值產生第一經估計時間失配值。舉例而言,第一估計時間失配值可對應於指示第一音訊信號之第一訊框與第二音訊信號之對應第一訊框之間較高時間類似性(或較低差)之比較值。
編碼器可藉由在多個階段中優化一序列經估計時間失配值來判定最終時間失配值。舉例而言,編碼器可首先基於自第一音訊信號及第二音訊信號之立體聲經預處理及經重新取樣版本產生之比較值而估計「暫訂」時間失配值。編碼器可產生與接近於經估計「暫訂」時間失配值之時間失配值相關聯的經內插比較值。編碼器可基於經內插之比較值判定第二經估計「內插」時間失配值。舉例而言,第二經估計「內插」時間失配值可對應於指示比剩餘經內插之比較值及第一經估計「暫訂」時間失配值更高之時間類似性(或較低差)的特定內插比較值。若當前訊框(例如第一音訊信號之第一訊框)之第二經估計「內插」時間失配值與前一訊框(例如先於第一訊框之第一音訊信號之訊框)之最終時間失配值不同,則當前訊框之「內插」時間失配值經進一步「修正」以改良第一音訊信號與經移位第二音訊
信號之間的時間類似性。具體而言,第三經估計「修正」時間失配值可藉由查究當前訊框之第二經估計「內插」時間失配值及前一訊框之最終經估計時間失配值來對應於時間類似性之更準確量度。第三經估計「修正」時間失配值經進一步調節以藉由限制訊框之間的時間失配值中之任何偽改變來估計最終時間失配值,且受進一步控制以不在如本文中所描述之兩個連續(或相連)訊框中自負時間失配值切換到正時間失配值(或反之亦然)。
在一些實例中,編碼器可制止在相連訊框中或在鄰近訊框中在正時間失配值與負時間失配值之間切換或反之亦然。舉例而言,編碼器可將最終時間失配值設定成特定值(例如0),該特定值基於第一訊框之經估計「內插」或「修正」時間失配值及先於第一訊框之特定訊框中之對應經估計「內插」或「修正」或最終時間失配值而指示無時間性移位。為了說明,為回應當前訊框的經估計之「暫訂」或「內插」或「修正」失配值中之一者為正數的且前一訊框(例如,前於第一訊框的訊框)的經估計之「暫訂」或「內插」或「修正」或「最終」估計失配值中之另一者為負數的之判定,編碼器可設定當前訊框(例如,第一訊框)之最終失配值以指示無時間性移位,亦即shift1=0。替代地,為回應當前訊框的經估計之「暫訂」或「內插」或「修正」失配值中之一者為負數的且前一訊框(例如,前於第一訊框的訊框)的經估計之「暫訂」或「內插」或「修正」或「最終」估計失配值中之另一者為正數的之判定,編碼器亦可設定當前訊框(例如,第一訊框)之最終失配值以指示無時間性移位,亦即移位1=0。
編碼器可基於時間失配值而將第一音訊信號或第二音訊信號之訊框選作「參考」或「目標」。舉例而言,回應於判定最終時間失配值係正數,編碼器可產生具有指示第一音訊信號為「參考」信號且第二音訊信號
為「目標」信號之第一值(例如,0)的參考通道或信號指示符。替代地,回應於判定最終時間失配值係負數,編碼器可產生具有指示第二音訊信號為「參考」信號且第一音訊信號為「目標」信號之第二值(例如,1)的參考通道或信號指示符。
編碼器可估計與參考信號相關之相對增益(例如,相對增益參數)及非因果經移位目標信號。舉例而言,回應於判定最終時間失配值係正數,編碼器可估計增益值以標準化或均衡第一音訊信號相對於第二音訊信號之按非因果時間失配值(例如最終時間失配值之絕對值)偏移的振幅或功率位準。替代地,回應於判定最終時間失配值係負數,編碼器可估計增益值以標準化或均衡非因果經移位第一音訊信號相對於第二音訊信號之振幅或功率位準。在一些實例中,編碼器可估計增益值以標準化或均衡「參考」信號相對於非因果經移位「目標」信號之振幅或功率位準。在其他實例中,編碼器可基於相對於目標信號(例如,未移位目標信號)之參考信號估計增益值(例如,相對增益值)。
編碼器可基於參考信號、目標信號、非因果時間失配值及相對增益參數產生至少一個經編碼信號(例如,中間信號、側信號或兩者)。在其他實施中,編碼器可基於參考通道及時間失配經調整目標通道產生至少一個經編碼信號(例如,中間通道、側通道或兩者)。側信號可對應於第一音訊信號之第一訊框的第一樣本與第二音訊信號之所選擇訊框的所選擇樣本之間的差。編碼器可基於最終時間失配值選擇所選訊框。由於第一樣本與所選擇之樣本之間的減小之差,相比於對應於第二音訊信號之訊框(與第一訊框同時由裝置接收)的第二音訊信號之其他樣本,更少的位元可用於編碼側通道信號。裝置之傳輸器可傳輸至少一個經編碼信號、非因果時間失
配值、相對增益參數、參考通道或信號指示符或其組合。
編碼器可基於參考信號、目標信號、非因果時間失配值、相對增益參數、第一音訊信號之特定訊框之低頻帶參數、特定訊框之高頻帶參數或其一組合產生至少一個經編碼信號(例如,中間信號、側信號或兩者)。該特定訊框可先於第一訊框。來自一或多個前述訊框之某些低頻帶參數、高頻帶參數或其組合可用於編碼第一訊框之中間信號、側信號或兩者。基於低頻帶參數、高頻帶參數或其組合對中間信號、側信號或兩者進行編碼可改良非因果時間失配值及通道間相對增益參數之估計值。低頻帶參數、高頻帶參數或其組合可包括音調參數、語音參數、寫碼器類型參數、低頻帶能量參數、高頻帶能量參數、包絡參數(例如,傾角參數)、音調增益參數、FCB增益參數、寫碼模式參數、語音活動參數、雜訊估計參數、訊雜比參數、共振峰參數、話語/音樂判斷參數、非因果移位、通道間增益參數或其組合。裝置之傳輸器可傳輸至少一個經編碼信號、非因果時間失配值、相對增益參數、參考通道(或信號)指示符或其組合。在本發明中,諸如「判定」、「計算」、「移位」、「調整」等之術語可用於描述如何執行一或多個操作。應注意,此等術語不應解釋為限制性的且其他技術可用以執行類似操作。
參看圖1,揭示一系統之特定說明性實例且該系統整體指定為100。系統100包括經由網路120以通信方式耦接至第二裝置106之第一裝置104。網路120可包括:一或多個無線網路、一或多個有線網路或其組合。
第一裝置104可包括記憶體153、編碼器200、傳輸器110及一或多個輸入介面112。記憶體153可為包括指令191之非暫時性電腦可讀媒體。指
令191可為可由編碼器200執行以執行本文中所描述之操作中之一或多者。輸入介面112中之第一輸入介面可耦接至第一麥克風146。輸入介面112中之第二輸入介面可耦接至第二麥克風148。編碼器200可包括通道間頻寬擴展(ICBWE)編碼器204。ICBWE編碼器204可經組態以基於經合成非參考高頻帶及非參考目標通道估計一或多個頻譜映射參數。與ICBWE編碼器204之操作相關聯的額外細節關於圖2及圖4至圖5進行描述。
第二裝置106可包括解碼器300。解碼器300可包括ICBWE解碼器306。ICBWE解碼器306可經組態以自所接收頻譜映射位元串流提取一或多個頻譜映射參數。與ICBWE解碼器306之操作相關聯的額外細節關於圖3及圖6進行描述。第二裝置106可耦接至第一揚聲器142、第二揚聲器144或兩者。儘管圖中未示,但第二裝置106可包括其他組件,諸如處理器(例如,中央處理單元)、麥克風、接收器、傳輸器、天線、記憶體等。
在操作期間,第一裝置104可經由第一輸入介面自第一麥克風146接收第一音訊通道130(例如,第一音訊信號),且可經由第二輸入介面自第二麥克風148接收第二音訊通道132(例如,第二音訊信號)。第一音訊通道130可對應於右通道或左通道中之一者。第二音訊通道132可對應於右通道或左通道中之另一者。與第二麥克風148相比,聲源152(例如,使用者、揚聲器、環境雜訊、樂器等)可更接近第一麥克風146。因此,相比於經由第二麥克風148,來自聲源152之音訊信號可在較早時間經由第一麥克風146在輸入介面112處接收。經由多個麥克風之多通道信號獲取中的此自然延遲可能會在第一音訊通道130與第二音訊通道132之間引入時間未對準。
根據一個實施,第一音訊通道130可為「參考通道」,且第二音訊通
道132可為「目標通道」。目標通道可經調整(例如,經時間移位)以實質上與參考通道對準。根據另一實施,第二音訊通道132可為參考通道,且第一音訊通道130可為目標通道。根據一個實施,參考通道及目標通道可在逐訊框基礎上變化。舉例而言,對於第一訊框,第一音訊通道130可為參考通道,且第二音訊通道132可為目標通道。然而,對於第二訊框(例如,後續訊框),第一音訊通道130可為目標通道,且第二音訊通道132可為參考通道。為便於描述,除非下文另外指出,否則第一音訊通道130為參考通道,且第二音訊通道132為目標通道。應注意,關於音訊通道130、132描述之參考通道可獨立於下文描述之高頻帶參考通道指示符。舉例而言,高頻帶參考通道指示符可指示通道130、132任一者之高頻帶為高頻帶參考通道,且高頻帶參考通道指示符可指示可為與參考通道相同或不同之通道的一高頻帶參考通道。
如關於圖2A、圖4及圖5更詳細描述,編碼器200可產生降混位元串流216、ICBWE位元串流242、高頻帶中間通道位元串流244及低頻帶位元串流246。傳輸器110可經由網路120將降混位元串流216、ICBWE位元串流242、高頻帶中間通道位元串流244或其一組合傳輸至第二裝置106。替代地或另外,傳輸器110可將降混位元串流216、ICBWE位元串流242、高頻帶中間通道位元串流244或其一組合儲存在網路120之裝置或本端裝置處,以供稍後進一步處理或解碼。
解碼器300可基於降混位元串流216、ICBWE位元串流242、高頻帶中間通道位元串流244及低頻帶位元串流246執行解碼操作。舉例而言,解碼器300可基於降混位元串流216、低頻帶位元串流246、ICBWE位元串流242及高頻帶中間通道位元串流244產生第一通道(例如,第一輸出通
道126)及第二通道(例如,第二輸出通道128)。第二裝置106可經由第一揚聲器142輸出第一輸出通道126。第二裝置106可經由第二揚聲器144輸出第二輸出通道128。在替代性實例中,第一輸出通道126及第二輸出通道128可作為立體聲信號對傳輸至單個輸出揚聲器。
如下文所述,圖1之ICBWE編碼器204可基於最大似然性量度或開環或閉環頻譜失真減少量度而估計頻譜映射參數,使得頻譜狀經合成非參考高頻帶通道的頻譜形狀(例如,頻譜包絡或頻譜傾角)實質上類似於非參考目標通道之頻譜形狀(例如,頻譜包絡)。可在ICBWE位元串流242中將頻譜映射參數傳輸至解碼器300,並在解碼器300處使用以產生在左通道及右通道之間具有經減少偽影及改良式空間平衡的輸出信號126、128。
參看圖2A,展示可操作以估計頻譜映射參數之編碼器200的特定實施。編碼器200包括降混器202、ICBWE編碼器204、中間通道BWE編碼器206、低頻帶編碼器208及濾波器組290。
可將左通道212及右通道214提供至降混器202。根據一個實施,左通道212及右通道214可為頻域通道(例如,變換域通道)。根據另一實施,左通道212及右通道214可為時域通道。降混器202可經組態以降混左通道212及右通道214以產生降混位元串流216、中間通道222及低頻帶側通道224。儘管低頻帶側通道224展示為經估計,但在其他替代性實施中,可以替代方式產生並編碼全頻寬側通道,且可將對應位元串流傳輸至解碼器。降混位元串流216可包括基於左通道212及右通道214之降混參數(例如,移位參數、目標增益參數、參考通道指示符、通道間位準差、通道間相位差等)。降混位元串流216可自編碼器200傳輸至諸如圖3A之解碼器300的解碼器。
中間通道222可表示通道212、214之整個頻帶,且低頻帶側通道224可表示通道212、214之低頻帶部分。作為非限制性實例,中間通道222可在通道212、214為超寬頻通道的情況下表示通道212、214之整個頻帶(20Hz至16kHz),且低頻帶側通道224可表示通道212、214之低頻帶部分(例如,20Hz至8kHz或20Hz至6.4kHz)。中間通道222可被提供至重取樣濾波器組290,且低頻帶側通道224可被提供至低頻帶編碼器208。
重取樣濾波器組290可經組態以將中間通道222之高頻分量及低頻分量分開。為了說明,重取樣濾波器組290可將中間通道222之高頻分量分開以產生高頻帶中間通道292,且濾波器組290可將中間通道222之低頻分量分開以產生低頻帶中間通道294。在寫碼模式為超寬頻之情境中,高頻帶中間通道292可自8kHz跨越至16kHz,且低頻帶中間通道294可自20Hz跨越至8kHz。應瞭解,本文中所描述之寫碼模式及頻率範圍僅為達成說明之目的,且不應被理解為限制性的。在其他實施中,寫碼模式可為不同的(例如,寬頻寫碼模式、完全頻帶寫碼模式等)及/或頻率範圍可為不同的。在其他實施中,降混器202可經組態以直接提供低頻帶中間通道294及高頻帶中間通道292。在此等實施中,濾波器組290處的濾波操作可繞過。高頻帶中間通道292可被提供至中間通道BWE編碼器206,且低頻帶中間通道294可被提供至低頻帶編碼器208。
低頻帶編碼器208可經組態以編碼低頻帶中間通道294及低頻帶側通道224以產生低頻帶位元串流246。在一些實施中,可繞過包括以下項的以下步驟中之一或多者:產生低頻帶側通道224、編碼低頻帶側通道224,及包括對應於低頻帶側通道之資訊作為低頻帶位元串流246之部分。根據一個實施,低頻帶編碼器208可包括中間通道低頻帶編碼器(例
如,圖中未示且基於ACELP或TCX寫碼),其經組態以藉由編碼低頻帶中間通道294來產生低頻帶中間通道位元串流。低頻帶編碼器208亦可包括側通道低頻帶編碼器(例如,圖中未示且基於ACELP或TCX寫碼),其經組態以藉由編碼低頻帶側通道224來產生低頻帶側通道位元串流。低頻帶位元串流246可自編碼器200傳輸至解碼器(例如,圖3A之解碼器300)。
低頻帶編碼器208亦可產生被提供至中間通道BWE編碼器206之低頻帶激勵信號232。中間通道BWE編碼器206可經組態以編碼高頻帶中間通道292以產生高頻帶中間通道位元串流244。舉例而言,中間通道BWE編碼器206可基於低頻帶激勵信號232及高頻帶中間通道292而估計線性預測係數(LPC)、增益形狀參數、增益訊框參數等,以產生高頻帶中間通道位元串流244。根據一個實施,中間通道BWE編碼器206可使用時域頻寬擴展編碼高頻帶中間通道292。高頻帶中間通道位元串流244可自編碼器200傳輸至解碼器(例如,圖3A之解碼器300)。
中間通道BWE編碼器206可將一或多個參數234提供至通道間BWE編碼器204。一或多個參數234可包括諧波高頻帶激勵(例如,圖2B之諧波高頻帶激勵237)、經調變雜訊(例如,圖4之經調變雜訊482)、經量化增益形狀、經量化線性預測係數(LPC)、經量化增益訊框等。亦可將左通道212及右通道214提供至通道間BWE編碼器204。通道間BWE編碼器204可經組態以提取與通道212、214相關聯之增益映射參數、與通道212、214相關聯之頻譜狀映射參數等,以促進將一或多個參數234映射至通道212、214。經提取參數可包括於ICBWE位元串流242中。ICBWE位元串流242可自編碼器200傳輸至解碼器。與ICBWE編碼器204相關聯之操作關於圖4至圖5更詳細描述。因此,圖2A之ICBWE編碼器204可估計頻譜狀映射參
數,將頻譜狀映射參數量化至ICBWE位元串流242中,並將ICBWE位元串流242傳輸至解碼器。
圖2A之編碼器200可接收兩個通道212、214,並執行通道212、214之降混以產生中間通道222、降混位元串流216,及(在一些實施中)低頻帶側通道224。編碼器200可使用低頻帶編碼器208編碼中間通道222及低頻帶側通道224以產生低頻帶位元串流246。編碼器200亦可使用ICBWE編碼器204產生映射資訊,其指示如何自高頻帶中間通道(解碼器處)映射經解碼高頻帶左通道及右通道(解碼器處)。
圖2A之ICBWE編碼器204可基於最大似然性量度或開環或閉環頻譜失真減少量度而估計頻譜映射參數,使得頻譜狀經合成非參考高頻帶通道之頻譜包絡實質上類似於非參考目標通道之頻譜包絡。頻譜映射參數可在ICBWE位元串流242中傳輸至解碼器300,且在解碼器300處使用以產生具有經減少之偽影的輸出信號。
參看圖2B,展示中間通道BWE編碼器206之特定實施。中間通道BWE編碼器206包括線性預測係數(LPC)估計器251、LPC量化器252及LPC合成濾波器259。高頻帶中間通道292被提供至LPC估計器251,且LPC估計器251可經組態以基於高頻帶中間通道292預測高頻帶LPC 271。高頻帶LPC 271被提供至LPC量化器252。LPC量化器252可經組態以量化高頻帶LPC以產生經量化高頻帶LPC 457及高頻帶LPC位元串流272。經量化LPC 457被提供至LPC合成濾波器259,且高頻帶LPC位元串流被提供至多工器265。
中間通道BWE編碼器206亦包括高頻帶激勵產生器299,其包括非線性BWE產生器253、隨機雜訊產生器254、信號倍增器255、雜訊包絡調變
器256、求和器257及倍增器258。來自低頻帶編碼器208之低頻帶激勵232被提供至非線性BWE產生器253。非線性BWE產生器253可對低頻帶激勵232執行非線性擴展以產生諧波高頻帶激勵237。諧波高頻帶激勵237可包括於一或多個參數234中。諧波高頻帶激勵237被提供至信號倍增器255及雜訊包絡調變器256。信號倍增器可經組態以基於增益因子(Gain(1))調整諧波高頻帶激勵237,以產生增益經調整諧波高頻帶激勵273。增益經調整諧波高頻帶激勵273被提供至求和器257。
隨機雜訊產生器254可經組態以產生被提供至雜訊包絡調變器256的雜訊274。雜訊包絡調變器256可經組態以基於諧波高頻帶激勵237調變雜訊274以產生經調變雜訊482。經調變雜訊482被提供至信號倍增器258。信號倍增器258可經組態以基於增益因子(Gain(2))調整經調變雜訊482以產生增益經調整經調變雜訊275。增益經調整經調變雜訊275被提供至求和器257,且求和器257可經組態以添加增益經調整諧波高頻帶激勵273及增益經調整經調變雜訊275以產生高頻帶激勵276。高頻帶激勵276被提供至LPC合成濾波器259。
應注意,在一些實施中,Gain(1)及Gain(2)可為每一向量值對應於子訊框中之對應信號之比例因子的向量。
LPC合成濾波器259可經組態以將經量化LPC 457應用於高頻帶激勵276以產生經合成高頻帶中間通道277。經合成高頻帶中間通道277被提供至高頻帶增益形狀估計器260,且被提供至高頻帶增益形狀縮放器262。高頻帶中間通道292亦被提供至高頻帶增益形狀估計器260。高頻帶增益形狀估計器260可經組態以基於高頻帶中間通道292及經合成高頻帶中間通道277產生高頻帶增益形狀參數278。高頻帶增益形狀參數278被提供至
高頻帶增益形狀量化器261。
高頻帶增益形狀量化器261可經組態以量化高頻帶增益形狀參數278並產生經量化高頻帶增益形狀參數279。經量化高頻帶增益形狀參數279被提供至高頻帶增益形狀縮放器262。高頻帶增益形狀量化器261亦可經組態以產生被提供至多工器265之高頻帶增益形狀位元串流280。
高頻帶增益形狀縮放器262可經組態以基於經量化高頻帶增益形狀參數279縮放經合成高頻帶中間通道277,以產生經縮放經合成高頻帶中間通道281。經縮放經合成高頻帶中間通道281被提供至高頻帶增益訊框估計器263。高頻帶增益訊框估計器263可經組態以基於經縮放經合成高頻帶中間通道281估計高頻帶增益訊框參數282。高頻帶增益訊框參數282被提供至高頻帶增益訊框量化器264。
高頻帶增益訊框量化器264可經組態以量化高頻帶增益訊框參數282以產生高頻帶增益訊框位元串流283。高頻帶增益訊框位元串流283被提供至多工器265。多工器265可經組態以組合高頻帶LPC位元串流272、高頻帶增益形狀位元串流280、高頻帶增益訊框位元串流283及其他資訊以產生高頻帶中間通道位元串流244。根據一個實施,其他資訊可包括與經調變雜訊482、諧波高頻帶激勵237、經量化高頻帶LPC 457等相關聯的資訊。如關於圖4更詳細所描述,ICBWE編碼器204可將提供至多工器265之資訊用於信號處理操作。
參看圖3A,展示可操作以執行頻譜形狀映射之解碼器300的特定實施。解碼器300包括中間通道BWE解碼器302、低頻帶解碼器304、ICBWE解碼器306、低頻帶升混器308、信號組合器310、信號組合器312及通道間移位器314。
自編碼器200傳輸之低頻帶位元串流246可提供至低頻帶解碼器304。如上文所描述,低頻帶位元串流246可包括低頻帶中間通道位元串流及低頻帶側通道位元串流。低頻帶解碼器304可經組態以解碼低頻帶中間通道位元串流以產生被提供至低頻帶升混器308之低頻帶中間通道326。低頻帶解碼器304亦可經組態以解碼低頻帶側通道位元串流以產生被提供至低頻帶升混器308之低頻帶側通道328。低頻帶解碼器304亦可經組態以產生被提供至中間通道BWE解碼器302之低頻帶激勵信號325。
中間通道BWE解碼器302可經組態以基於低頻帶激勵信號325解碼高頻帶中間通道位元串流244以產生一或多個參數322(例如,諧波高頻帶激勵、經調變雜訊、經量化增益形狀、經量化線性預測係數(LPC)、經量化增益訊框等)及高頻帶中間通道324。一或多個參數322可對應於圖2A之一或多個參數234。根據一個實施,中間通道BWE解碼器302可使用時域頻寬擴展解碼來解碼高頻帶中間通道位元串流244。一或多個參數322及高頻帶中間通道324被提供至ICBWE解碼器306。
ICBWE位元串流242亦可提供至ICBWE解碼器306ICBWE解碼器306可經組態以基於ICBWE位元串流242、一或多個參數322及高頻帶中間通道324產生高頻帶左通道330及高頻帶右通道332。因此,基於ICBWE位元串流242及來自中間通道BWE解碼之信號及參數,ICBWE解碼器306可產生經解碼高頻帶左通道及經解碼高頻帶右通道330、332。與ICBWE解碼器306相關聯之操作關於圖6更詳細描述。高頻帶左通道330被提供至信號組合器310,且高頻帶右通道332被提供至信號組合器312。低頻帶升混器308可經組態以基於降混位元串流216升混低頻帶中間通道326及低頻帶側通道328,以產生低頻帶左通道334及低頻帶右通道336。低頻帶左通道
334被提供至信號組合器310,且低頻帶右通道336被提供至信號組合器312。
信號組合器310可經組態以組合高頻帶左通道330及低頻帶左通道334以產生未經移位左通道340。未經移位左通道340被提供至通道間移位器314。信號組合器312可經組態以組合高頻帶右通道332及低頻帶右通道336以產生未經移位右通道342。未經移位右通道342被提供至通道間移位器314。應注意,在一些實施中,與通道間移位器314相關聯的操作可繞過。舉例而言,若對應編碼器處的降混器未經組態以在中間通道及側通道產生之前移位通道中之任一者,則可繞過與通道間移位器314相關聯的操作。通道間移位器314可經組態以基於與降混位元串流216相關聯之移位資訊移位未經移位左通道340以產生左通道350。通道間移位器314亦可經組態以基於與降混位元串流216相關聯之移位資訊移位未經移位右通道342,以產生右通道352。舉例而言,通道間移位器314可使用來自降混位元串流216之移位資訊來移位未經移位左通道340、未經移位右通道342或其一組合,以產生左通道及右通道350、352。根據一個實施,左通道350為左通道212之經解碼版本,且右通道352為右通道214之經解碼版本。
參看圖3B,展示中間通道BWE解碼器302之特定實施。中間通道BWE解碼器302包括LPC反量化器360、高頻帶激勵產生器362、LPC合成濾波器364、高頻帶增益形狀反量化器366、高頻帶增益形狀縮放器368、高頻帶增益訊框反量化器370及高頻帶增益訊框縮放器372。
高頻帶LPC位元串流272被提供至LPC反量化器360。LPC反量化器可自高頻帶LPC位元串流272提取經量化高頻帶LPC 640。如關於圖6所描述,經量化高頻帶LPC 640可由ICBWE解碼器306用於信號處理操作。
低頻帶激勵信號325被提供至高頻帶激勵產生器362。高頻帶激勵產生器362可基於低頻帶激勵信號325產生諧波高頻帶激勵630,且可產生經調變雜訊632。如關於圖6所描述,諧波高頻帶激勵630及經調變雜訊632可由ICBWE解碼器306用於信號處理操作。高頻帶激勵產生器362亦可產生高頻帶激勵380。高頻帶激勵產生器362可經組態以實質上類似於圖2B之高頻帶激勵產生器299的方式操作。舉例而言,高頻帶激勵產生器362可對低頻帶激勵信號325執行類似操作以產生高頻帶激勵380(如高頻帶激勵產生器299對低頻帶激勵232執行的操作)。根據一個實施,高頻帶激勵380可實質上類似於圖2B之高頻帶激勵276。高頻帶激勵380被提供至LPC合成濾波器364。LPC合成濾波器364可將經量化高頻帶LPC 640應用於高頻帶激勵380以產生經合成高頻帶中間通道382。經合成高頻帶中間通道382被提供至高頻帶增益形狀縮放器368。
高頻帶增益形狀位元串流280被提供至高頻帶增益形狀反量化器366。高頻帶增益形狀反量化器366可經組態以自高頻帶增益形狀位元串流280提取經量化高頻帶增益形狀648。經量化高頻帶增益形狀648被提供至高頻帶增益形狀縮放器368及ICBWE解碼器306,用於信號處理操作,如關於圖6所描述。高頻帶增益形狀縮放368可經組態以基於經量化高頻帶增益形狀648縮放經合成高頻帶中間通道382以產生經縮放經合成高頻帶中間通道384。經縮放經合成高頻帶中間通道384被提供至高頻帶增益訊框縮放器372。
高頻帶增益訊框位元串流283被提供至高頻帶增益訊框反量化器370。高頻帶增益訊框反量化器370可經組態以自高頻帶增益訊框位元串流283提取經量化高頻帶增益訊框652。經量化高頻帶增益訊框652被提供
至高頻帶增益訊框縮放器372及ICBWE解碼器306,用於信號處理操作,如關於圖6所描述。高頻帶增益訊框縮放器372可將經量化高頻帶增益訊框652應用於經縮放經合成高頻帶中間通道384以產生經解碼高頻帶中間通道662。經解碼高頻帶中間通道662被提供至ICBWE解碼器306用於信號處理操作,如關於圖6所描述。
參看圖4至圖5,展示ICBWE編碼器204之特定實施。圖4中展示ICBWE編碼器204之第一部分204a,且圖5中展示ICBWE編碼器204之第二部分204b。
ICBWE編碼器204之第一部分204a包括高頻帶參考通道判定單元404及高頻帶參考通道指示符編碼器406。左通道212及右通道214被提供至高頻帶參考通道判定單元404。高頻帶參考通道判定單元404可經組態以判定左通道212或右通道214是否為高頻帶參考通道。舉例而言,高頻帶參考通道判定單元404可產生高頻帶參考通道指示符440,其指示左通道212或右通道214是否用以估計高頻帶非參考通道459。高頻帶參考通道指示符440可基於左通道及右通道212、214能量、左通道及右通道212、214之間的通道間移位、在降混模組處產生的參考通道指示符、基於非因果移位估計之參考通道指示符,及高頻帶左通道能量及高頻帶右通道能量進行估計。
根據一個實施,高頻帶參考通道指示符440可使用多階段技術進行判定,其中每一階段改良先前階段之輸出以判定高頻帶參考通道指示符440。舉例而言,在第一階段,高頻帶參考通道判定單元404可基於一參考信號產生高頻帶參考通道指示符440。為了說明,高頻帶參考通道判定單元404可回應於判定參考信號指示第二音訊信號132(例如,右側音訊信
號)被指定為參考信號,產生高頻帶參考通道指示符440以指示右通道214被指定為高頻帶參考通道。替代地,高頻帶參考通道判定單元404可回應於判定參考信號指示第一音訊信號130(例如,左側音訊信號)被指定為參考信號,產生高頻帶參考通道指示符440以指示左通道212被指定為高頻帶參考通道。
在第二階段,高頻帶參考通道判定單元404可基於增益參數、與左通道212相關聯之第一能量、與右通道214相關聯之第二能量,或其一組合改進(例如,更新)高頻帶參考通道指示符440。舉例而言,高頻帶參考通道判定單元404可回應於判定增益參數滿足第一臨限值,第一能量(例如,左側完全頻帶能量)與右側能量(例如,右側完全頻帶能量)之比滿足第二臨限值或兩者,設定(例如,更新)高頻帶參考通道指示符440以指示左通道212被指定為參考通道且右通道214被指定為非參考通道。作為另一實例,高頻帶參考通道判定單元404可回應於判定增益參數未能滿足第一臨限值,第一能量(例如,左側完全頻帶能量)與右側能量(例如,右側完全頻帶能量)之比未能滿足第二臨限值或兩者,設定(例如,更新)高頻帶參考通道指示符440以指示右通道214被指定為參考通道且左通道212被指定為非參考通道。
在第三階段,高頻帶參考通道判定單元404可基於左側能量及右側能量改進(例如,進一步更新)高頻帶參考通道指示符440。舉例而言,高頻帶參考通道判定單元404可回應於判定左側能量(例如,左側HB能量)與右側能量(例如,右側HB能量)之比滿足臨限值,設定(例如,更新)高頻帶參考通道指示符440以指示左通道212被指定為參考通道且右通道214被指定為非參考通道。作為另一實例,高頻帶參考通道判定單元404可回應於判
定左側能量(例如,左側HB能量)與右側能量(例如,右側HB能量)之比未能滿足臨限值,設定(例如,更新)高頻帶參考通道指示符440以指示右通道214被指定為參考通道且左通道212被指定為非參考通道。高頻帶參考通道指示符編碼器406可編碼高頻帶參考通道指示符440以產生高頻帶參考通道指示符位元串流442。
ICBWE編碼器204之第一部分204a亦包括非參考高頻帶激勵產生器408、線性預測係數(LPC)合成濾波器410、高頻帶目標通道產生器412、頻譜映射估計器414及頻譜映射量化器416。非參考高頻帶激勵產生器408包括信號倍增器418、信號倍增器420及信號組合器422。
非線性諧波高頻帶激勵237被提供至信號倍增器418,且經調變雜訊482被提供至信號倍增器420。在特定實施中,非線性諧波高頻帶激勵237可係基於諧波建模(例如,(.)^2或|.|)的,其不同於用於中間高頻帶激勵232產生之諧波建模。在替代性實施中,非線性諧波高頻帶激勵237可係基於非參考低頻帶激勵信號的。經調變雜訊482可係基於非線性諧波高頻帶激勵信號237或高頻帶激勵信號232之包絡經調變雜訊的。在另一替代性實施中,經調變雜訊482可為基於白化非線性諧波高頻帶激勵信號237的經時間成形之隨機雜訊。時間成形可係基於語音因子控制之一階自適應性濾波器的。
信號倍增器418將增益(Gain(a))應用於諧波高頻帶激勵237,以產生增益經調整諧波高頻帶激勵452,且信號倍增器420將增益(Gain(b))應用於經調變雜訊482以產生增益經調整經調變雜訊454。增益經調整諧波高頻帶激勵452及增益經調整經調變雜訊454被提供至信號組合器422。信號組合器422可經組態以將增益經調整諧波高頻帶激勵452與增益經調整經
調變雜訊454組合以產生非參考高頻帶激勵456。非參考高頻帶激勵456可以類似於高頻帶中間通道激勵之方式產生。然而,增益(Gain(a)及Gain(b))可為用以基於高頻帶參考通道與高頻帶非參考通道之相對能量、高頻帶非參考通道之雜訊底限等產生高頻帶中間通道激勵的增益之修改版本。
應注意,在一些實施中,Gain(a)及Gain(b)可為向量每一值對應於子訊框中之對應信號之比例因子的向量。
混合增益(Gain(a)及Gain(b))亦可基於對應於高頻帶中間通道、高頻帶非參考通道的或自低頻帶語音因子或語音資訊導出的語音因子。混合增益(Gain(a)及Gain(b))亦可基於對應於高頻帶中間通道及高頻帶非參考通道之頻譜包絡。在另一替代性實施中,混合增益(Gain(a)及Gain(b))可基於信號中講話者或背景源之數目,及左(或參考、目標)通道及右(或目標、參考)通道的有聲-無聲特性。
非參考高頻帶激勵456被提供至LPC合成濾波器410。LPC合成濾波器410可經組態以基於非參考高頻帶激勵456及經量化高頻帶LPC 457(例如,高頻帶中間通道之LPC)產生經合成非參考高頻帶458。舉例而言,LPC合成濾波器410可將經量化高頻帶LPC 457應用於非參考高頻帶激勵456以產生經合成非參考高頻帶458。經合成非參考高頻帶458被提供至頻譜映射估計器414。
高頻帶參考通道指示符440可被提供(作為控制信號)至開關424,其接收左通道212及右通道214作為輸入。基於高頻帶參考通道指示符440,開關424可將左通道212或右通道214提供至高頻帶目標通道產生器412作為非參考通道459。舉例而言,若高頻帶參考通道指示符440指示左通道
212為參考通道,則開關424可將右通道214提供至高頻帶目標通道產生器412作為非參考通道459。若高頻帶參考通道指示符440指示右通道214為參考通道,則開關424可將左通道212提供至高頻帶目標通道產生器412作為非參考通道459。
高頻帶目標通道產生器412可對非參考通道459之低頻帶信號分量濾波,以產生非參考高頻帶通道460(例如,非參考通道459之高頻帶部分)。在一些實施中,非參考高頻帶通道460可基於進一步信號處理操作進行頻譜翻轉(例如,頻譜翻轉操作)。非參考高頻帶通道460被提供至頻譜映射估計器414。頻譜映射估計器414可經組態以產生頻譜映射參數462,其將非參考高頻帶通道460之頻譜(或能量)映射至經合成非參考高頻帶458之頻譜。舉例而言,頻譜映射估計器414可產生濾波器係數,其將非參考高頻帶通道460之頻譜映射至經合成非參考高頻帶458之頻譜。舉例而言,頻譜映射估計器414判定頻譜映射參數462,其將經合成非參考高頻帶458之頻譜包絡映射為實質上接近於非參考高頻帶通道460之頻譜包絡(例如,非參考高頻帶信號)。頻譜映射參數462被提供至頻譜映射量化器416。頻譜映射量化器416可經組態以量化頻譜映射參數462以產生高頻帶頻譜映射位元串流464及經量化頻譜映射參數466。經量化頻譜映射參數466可被應用於濾波器(例如),其中u i 為經量化頻譜映射參數466。
ICBWE編碼器204之第二部分204b包括頻譜映射施加器502、增益映射估計器與量化器504,及多工器590。經合成非參考高頻帶458及經量化頻譜映射參數466被提供至頻譜映射施加器502。頻譜映射施加器502可經組態以基於經合成非參考高頻帶458及經量化頻譜映射參數466產生頻譜狀經合成非參考高頻帶514。舉例而言,頻譜映射施加器502可將經量化
頻譜映射參數應用於經合成非參考高頻帶458以產生頻譜狀經合成非參考高頻帶514。在其他替代性實施中,頻譜映射施加器502可將頻譜映射參數462(例如,經去量化參數)應用於經合成非參考高頻帶458,以產生頻譜狀經合成非參考高頻帶514。頻譜狀經合成非參考高頻帶514可用以估計高頻帶增益映射參數。舉例而言,頻譜狀經合成非參考高頻帶514被提供至增益映射估計器與量化器504。
因此,頻譜映射估計器414可使用頻譜形狀應用程式,其使用濾波器濾波。頻譜映射估計器414可估計並量化用於參數(u i )之值。在一實例實施中,濾波器h(z)可為一階濾波器,且信號之頻譜包絡可近似於滯後索引一(lag(1))與滯後索引零(lag(0))之自相關係數之比。若t(n)表示第n個樣本非參考高頻帶通道460,x(n)表示經合成非參考高頻帶458之第n樣本,且y(n)表示頻譜狀經合成非參考高頻帶514之第n樣本,則,其中為用於信號卷積操作之符號。
信號s(n)之頻譜包絡可表示為,其中為lag(n)處的信號之自相關。因為,所以。為解決(u i ,i=0,1),使得y(n)之包絡近似於t(n)之包絡,t(n)之包絡(T)可等於。又,其可展示為,此時
。因此,編碼器200可判定包絡(T),使得。
應注意,當ryy值經擴展時,可能存在許多近似值以獲得值u之多個可能近似值。可針對上文等式獲得反覆及分析型解決方案兩者。本文中描述分析型解決方案之非限制性實例。藉由將上文等式擴展至u之冪數達至二的術語,結果為:a * u 2+b * u+c=0,其中
用於(u)的兩個可能解決方案可歸因於二次等式之本質而存在。因為兩個可能解決方案可能係真實或假想的,所以若b 2-4 * a *c is 0,則存在兩個真實解決方案。以其他方式,存在兩個假想解決方案。在一些實施中,為了啟用參數a、b及c之經控制演進來估計頻譜映射參數(u),中間標準化相關性值T、rxx(1)/rxx(0)、rxx(2)/rxx(0),及rxx(3)/rxx(0)在時間上進行修勻或調節(例如,使用一階IIR濾波器或移動平均值濾波器)。
因為非參考通道大體而言在較高頻率下具有較陡的頻譜能量滾降,所以較小(u)值可為較佳的(包括負值)。較小(u)值包絡該信號,使得在較高頻率下存在較陡的頻譜能量滾降。根據一個實施,可使用絕對值<1(亦即,|ufinal|<1)的(u)之值。
若不存在真實解決方案,則先前訊框之(u)可被用作當前訊框之(u)。若存在一或多個真實解決方案,且不存在絕對值小於一的真實解決方案,則先前訊框之ufinal值可用於當前訊框。若存在一或多個真實解決方案,且存在絕對值小於一的一個真實解決方案,則當前訊框可使用真實解決方案作為ufinal值。若存在一或多個真實解決方案且存在絕對值小於一的多於一個真實解決方案,則當前訊框可使用最小(u)值作為ufinal值,或當前訊框可使用最接近於先前訊框之(u)值的(u)值。
在替代性實施中,頻譜映射參數可基於非參考高頻帶通道及非參考高頻帶激勵456之頻譜分析進行估計,以最大化頻譜狀非參考HB信號與非參考HB目標通道之間的頻譜匹配。在另一實施中,頻譜映射參數可係基
於非參考高頻帶通道及經合成高頻帶中間通道520或高頻帶中間通道292之LP分析。
非參考高頻帶通道516、經合成高頻帶中間通道520及高頻帶中間通道292亦被提供至增益映射估計器與量化器504。增益映射估計器與量化器504可基於頻譜狀經合成非參考高頻帶514、非參考高頻帶通道516、經合成高頻帶中間通道520及高頻帶中間通道292產生高頻帶增益映射位元串流522及經量化高頻帶增益映射位元串流524。舉例而言,增益映射估計器與量化器504可基於經合成高頻帶中間通道520及頻譜狀經合成非參考高頻帶514產生調整增益參數集合。為了說明,增益映射估計器與量化器504可判定對應於經合成高頻帶中間通道510之能量(或功率)與頻譜狀經合成非參考高頻帶514之能量(或功率)之間的差(或比)的經合成高頻帶增益。該調整增益參數集合可指示經合成高頻帶增益。
增益映射估計器與量化器504可基於調整增益參數集合及經預測調整增益參數集合產生第一調整增益參數集合。舉例而言,第一調整增益參數集合可指示該調整增益參數集合與經預測調整增益參數集合之間的差。作為另一實例,第一調整增益參數集合可對應於經預測調整增益參數集合及經合成高頻帶中間通道520之第一能量與頻譜狀經合成非參考高頻帶514之第二能量之比的乘積(例如,第一調整增益參數集合=經預測調整增益參數集合*(經合成高頻帶中間通道520之第一能量/頻譜狀經合成非參考高頻帶514之第二能量)。
高頻帶參考通道指示符位元串流442、高頻帶頻譜映射位元串流464及高頻帶增益映射位元串流522被提供至多工器590。多工器590可經組態以藉由多路傳輸高頻帶參考通道指示符位元串流442、高頻帶頻譜映射位
元串流464及高頻帶增益映射位元串流522來產生ICBWE位元串流242。ICBWE位元串流242可被傳輸至解碼器,諸如圖3A之解碼器300。
參看圖6,展示ICBWE解碼器306之特定實施。ICBWE解碼器306包括非參考高頻帶激勵產生器602、LPC合成濾波器604、頻譜映射施加器606、頻譜映射反量化器608、高頻帶增益形狀縮放器610、非參考高頻帶增益縮放器612、增益映射反量化器616、參考高頻帶增益縮放器618及高頻帶通道映射器620。非參考高頻帶激勵產生器602包括信號倍增器622、信號倍增器624及信號組合器626。
諧波高頻帶激勵630(自低頻帶位元串流246產生)被提供至信號倍增器622,且經調變雜訊632被提供至信號倍增器624。信號倍增器622將增益(Gain(a))應用於諧波高頻帶激勵630以產生增益經調整諧波高頻帶激勵634,且信號倍增器624將增益(Gain(b))應用於經調變雜訊632以產生增益經調整經調變雜訊636。應注意,在一些實施中,Gain(a)及Gain(b)可為向量每一值對應於子訊框中之對應信號之比例因子的向量。混合增益(Gain(a)及Gain(b))亦可基於對應於經合成高頻帶中間通道、經合成高頻帶非參考通道的或自低頻帶語音因子或語音資訊導出的語音因子。混合增益(Gain(a)及Gain(b))亦可基於對應於經合成高頻帶中間通道、經合成高頻帶非參考通道的或自低頻帶語音因子或語音資訊導出的頻譜包絡。在另一替代性實施中,混合增益(Gain(a)及Gain(b))可基於信號中講話者或背景源之數目,及左(或參考、目標)通道及右(或目標、參考)通道的有聲-無聲特性。增益經調整諧波高頻帶激勵634及增益經調整經調變雜訊636被提供至信號組合器626。信號組合器626可經組態以組合增益經調整諧波高頻帶激勵634及增益經調整經調變雜訊636以產生非參考高頻帶激勵
638。因此,非參考高頻帶激勵638可以實質上類似於ICBWE編碼器204之非參考高頻帶激勵456的方式產生。
非參考高頻帶激勵638被提供至LPC合成濾波器604。LPC合成濾波器604可經組態以基於高頻帶中間通道之非參考高頻帶激勵638及經量化高頻帶LPC 640(來自傳輸自編碼器200之位元串流)產生經合成非參考高頻帶642。舉例而言,LPC合成濾波器604可將經量化高頻帶LPC 640應用於非參考高頻帶激勵638以產生經合成非參考高頻帶642。經合成非參考高頻帶642被提供至頻譜映射施加器606。
來自編碼器200之高頻帶頻譜映射位元串流464被提供至頻譜映射反量化器608。頻譜映射反量化器608可經組態以解碼高頻帶頻譜映射位元串流464以產生經解量化頻譜映射位元串流644。經解量化頻譜映射位元串流644被提供至頻譜映射施加器606。頻譜映射施加器606可經組態以將經解量化頻譜映射位元串流644應用於經合成非參考高頻帶642(以實質上類似於ICBWE編碼器204處的方式)以產生頻譜狀經合成非參考高頻帶646。舉例而言,經量化頻譜映射位元串流644可經應用作為濾波器(例如),其中u為經量化頻譜映射參數。頻譜狀經合成非參考高頻帶646被提供至高頻帶增益形狀縮放器610。
高頻帶增益形狀縮放器610可經組態以基於經量化高頻帶增益形狀(來自傳輸自編碼器200之位元串流)縮放頻譜狀經合成非參考高頻帶646,以產生經縮放信號650。經縮放信號650被提供至非參考高頻帶增益縮放器612。倍增器651可經組態以將經量化高頻帶增益訊框652(例如,中間通道增益訊框)與經量化高頻帶增益映射參數660(來自高頻帶增益映射位元串流522)相乘以產生所得信號656。所得信號656可藉由應用經量化高
頻帶增益訊框652及經量化高頻帶增益映射參數660之產品或使用兩個依序增益階段來產生。所得信號656被提供至非參考高頻帶增益縮放器612。非參考高頻帶增益縮放器612可經組態以藉由所得信號656縮放經縮放信號650,以產生經解碼高頻帶非參考通道658。經解碼高頻帶非參考通道658被提供至高頻帶通道映射器620。根據另一實施,經預測參考通道增益映射參數可應用於中間通道以產生經解碼高頻帶非參考通道658。
來自編碼器200之高頻帶增益映射位元串流522被提供至增益映射反量化器616。增益映射反量化器616可經組態以解碼高頻帶增益映射位元串流522以產生經量化高頻帶增益映射參數660。經量化高頻帶增益映射參數660被提供至參考高頻帶增益縮放器618,且經解碼高頻帶中間通道662(自高頻帶中間通道位元串流244產生)被提供至參考高頻帶增益縮放器618。參考高頻帶縮放器618可經組態以基於經量化高頻帶增益映射參數660縮放經解碼高頻帶中間通道662,以產生經解碼高頻帶參考通道664。經解碼高頻帶參考通道664被提供至高頻帶通道映射器620。
高頻帶通道映射器620可經組態以將經解碼高頻帶參考通道664或經解碼高頻帶非參考通道658指定為高頻帶左通道330。舉例而言,高頻帶通道映射器620可基於來自編碼器200之高頻帶參考通道指示符位元串流442判定高頻帶左通道330是否為參考通道(或非參考通道)。在使用類似技術的情況下,高頻帶通道映射器620可經組態以將經解碼高頻帶參考通道664及經解碼高頻帶非參考通道658之另一者指定為高頻帶右通道332。
關於圖1至圖6描述之技術可啟用改良式高頻帶估計,以供用於音訊編碼及音訊解碼。舉例而言,頻譜映射參數466可用以產生具有近似於高頻帶通道(例如,非參考高頻帶通道460)之頻譜包絡的一頻譜包絡的經合
成高頻帶通道(例如,頻譜狀經合成非參考高頻帶514)。因此,頻譜映射參數466可在解碼器466處用以產生近似於編碼器200處之高頻帶通道之頻譜包絡的經合成高頻帶通道(例如,頻譜狀經合成非參考高頻帶646)。因此,當在解碼器300處重建構高頻帶時,可出現經減少之偽影,此係由於高頻帶可具有類似於編碼器側上的低頻帶的頻譜包絡。
參看圖7,展示估計頻譜映射參數之方法700。方法700可由圖1之第一裝置104執行。詳言之,方法700可由編碼器200執行。
方法700包括:在702,在第一裝置之編碼器處基於高頻帶參考通道指示符選擇左通道或右通道作為非參考目標通道。舉例而言,參看圖4,開關424可基於高頻帶參考通道指示符440選擇左通道212或右通道214作為非參考高頻帶通道460。
方法700包括:在704,基於對應於非參考目標通道之非參考高頻帶激勵產生經合成非參考高頻帶通道。舉例而言,參看圖4,LPC合成濾波器410可藉由將經量化高頻帶LPC 457應用於非參考高頻帶激勵456來產生經合成非參考高頻帶458。在一些實施中,方法700亦包括:產生非參考目標通道之高頻帶部分。
方法700亦包括:在706,基於經合成非參考高頻帶通道及非參考目標通道之高頻帶部分,估計一或多個頻譜映射參數。舉例而言,參看圖4,頻譜映射估計器414可基於經合成非參考高頻帶458及非參考高頻帶通道460估計頻譜映射參數462。
根據一個實施,一或多個頻譜映射參數係基於非參考目標通道在滯後索引一處的第一自相關值及非參考目標通道在滯後索引零處的第二自相關值進行估計。一或多個頻譜映射參數可包括至少兩個頻譜映射參數候選
者之一特定頻譜映射參數。在一個實施中,若至少兩個頻譜映射參數候選者為非真實候選者,則特定頻譜映射參數可對應於先前訊框之頻譜映射參數。在另一實施中,若至少兩個頻譜映射參數候選者中之每一頻譜映射參數候選者具有大於一之絕對值,則特定頻譜映射參數可對應於先前訊框之頻譜映射參數。在另一實施中,若至少兩個頻譜映射參數候選者中之僅一個頻譜映射參數候選者具有小於一之絕對值,則特定頻譜映射參數可對應於具有小於一之絕對值的頻譜映射參數候選者。在另一實施中,若至少兩個頻譜映射參數候選者中之多於一者具有小於一之絕對值,則特定頻譜映射參數可對應於具有最小值之頻譜映射參數候選者。在另一實施中,若至少兩個頻譜映射參數候選者中之多於一者具有小於一之絕對值,則特定頻譜映射參數可對應於先前訊框之頻譜映射參數。
方法700亦包括:在708,將一或多個頻譜映射參數應用於經合成非參考高頻帶通道,以產生頻譜狀經合成非參考高頻帶通道。應用一或多個頻譜參數可對應於基於頻譜映射濾波器對經合成非參考高頻帶通道進行濾波。頻譜狀經合成非參考高頻帶通道可具有類似於非參考目標通道之頻譜包絡的一頻譜包絡。舉例而言,參看圖5,頻譜映射施加器502可將經量化頻譜映射參數466應用於經合成非參考高頻帶458,以產生頻譜狀經合成非參考高頻帶514。頻譜狀經合成非參考高頻帶514可具有類似於非參考高頻帶通道460之頻譜包絡的一頻譜包絡。頻譜狀經合成非參考高頻帶通道可用以估計增益映射參數。
方法700亦包括:在710,基於一或多個頻譜映射參數及頻譜狀經合成非參考高頻帶通道產生經編碼位元串流。舉例而言,參看圖4,頻譜映射量化器416可基於頻譜映射參數462產生高頻帶頻譜映射位元串流464。
另外,參看圖5,增益映射估計器與量化器504可基於頻譜狀經合成非參考高頻帶514產生高頻帶增益映射位元串流522。
方法700進一步包括:在712,將經編碼位元串流傳輸至第二裝置。舉例而言,參看圖1,傳輸器110可將ICBWE位元串流242(包括高頻帶頻譜映射位元串流464)傳輸至第二裝置106。
方法700可啟用改良式高頻帶估計用於音訊編碼及音訊解碼。舉例而言,頻譜映射參數466可用以產生具有近似於高頻帶通道(例如,非參考高頻帶通道460)之頻譜包絡的一頻譜包絡的經合成高頻帶通道(例如,頻譜狀經合成非參考高頻帶514)。因此,頻譜映射參數466可在解碼器466處用以產生近似於編碼器200處之高頻帶通道之頻譜包絡的經合成高頻帶通道(例如,頻譜狀經合成非參考高頻帶646)。因此,當在解碼器300處重建構高頻帶時,可出現經減少之偽影,此係由於高頻帶可具有類似於編碼器側上的低頻帶的頻譜包絡。
參看圖8,展示提取頻譜映射參數之方法800。方法800可由圖1之第二裝置106執行。詳言之,方法800可由解碼器300執行。
方法800包括:在802,在裝置之解碼器處自所接收位元串流產生參考通道及非參考目標通道。位元串流可自第二裝置之編碼器接收。舉例而言,參看圖1,解碼器300可自低頻帶位元串流246產生非參考通道。參考通道及非參考目標通道可為解碼器300處產生之升混通道。作為非限制性實例,若低頻帶參考通道為左通道之低頻帶部分,則左通道之高頻帶部分可對應於高頻帶參考通道。根據一個實施,解碼器300可在無參考通道及非參考目標通道的情況下產生左通道及右通道。
方法800亦包括:在804,基於對應於非參考目標通道之非參考高頻
帶激勵產生經合成非參考高頻帶通道。舉例而言,參看圖6,LPC合成濾波器604可藉由將經量化高頻帶LPC 640應用於非參考高頻帶激勵638來產生經合成非參考高頻帶642。
方法800進一步包括:在806,自所接收頻譜映射位元串流提取一或多個頻譜映射參數。頻譜映射位元串流可自第二裝置之編碼器接收。舉例而言,參看圖6,頻譜映射反量化器608可自高頻帶頻譜映射位元串流464提取經量化頻譜映射位元串流644。
方法800亦包括:在808,藉由將一或多個頻譜映射參數應用於經合成非參考高頻帶通道,來產生頻譜狀非參考高頻帶通道。頻譜狀經合成非參考高頻帶通道可具有類似於非參考目標通道之頻譜包絡的一頻譜包絡。舉例而言,參看圖6,頻譜映射施加器606可將經量化頻譜映射位元串流644應用於經合成非參考高頻帶,以產生頻譜狀經合成非參考高頻帶646。頻譜狀經合成非參考高頻帶通道646可具有類似於非參考目標通道之頻譜包絡的一頻譜包絡。
方法800亦包括:在810,至少基於頻譜狀非參考高頻帶通道、參考通道及非參考目標通道產生輸出信號。舉例而言,參看圖1,解碼器300可基於頻譜狀經合成非參考高頻帶646產生輸出信號126、128中之至少一者。
方法800進一步包括:在812,在播放裝置處顯現輸出信號。舉例而言,參看圖1,揚聲器142、144可分別顯現並輸出輸出信號126、128。
方法800可啟用改良式高頻帶估計用於音訊編碼及音訊解碼。舉例而言,頻譜映射參數466可用以產生具有近似於高頻帶通道(例如,非參考高頻帶通道460)之頻譜包絡的一頻譜包絡的經合成高頻帶通道(例如,頻譜
狀經合成非參考高頻帶514)。因此,頻譜映射參數466可在解碼器466處用以產生近似於編碼器200處之高頻帶通道之頻譜包絡的經合成高頻帶通道(例如,頻譜狀經合成非參考高頻帶646)。因此,當在解碼器300處重建構高頻帶時,可出現經減少之偽影,此係由於高頻帶可具有類似於編碼器側上的低頻帶的頻譜包絡。
參看圖9,描繪裝置(例如,無線通信裝置)之特定說明性實例之方塊圖,且通常將該裝置指定為900。在各種實施中,裝置900可相比圖9中所說明的具有較多或較少組件。在一說明性實施中,裝置900可對應於圖1之第一裝置104或圖1之第二裝置106。在說明性實施中,裝置900可執行參考圖1至圖8之系統及方法所描述之一或多個操作。
在特定實施中,裝置900包括處理器906(例如,中央處理單元(CPU))。裝置900可包括一或多個額外處理器910(例如,一或多個數位信號處理器(DSP))。處理器910可包括媒體(例如,話語及音樂)寫碼解碼器(編解碼器)908及回音消除器912。媒體編解碼器908可包括解碼器300、編碼器200或其一組合。編碼器200可包括ICBWE編碼器204,且解碼器300可包括ICBWE解碼器306。
裝置900可包括記憶體153及編解碼器934。儘管媒體編解碼器908說明為處理器910之組件(例如,專用電路及/或可執行程式碼),但在其他實施中,媒體編解碼器908之一或多個組件(諸如解碼器300、編碼器200或其一組合)可包括於處理器906、編解碼器934、另一處理組件或其一組合中。
裝置900可包括耦接至天線942之傳輸器110。裝置900可包括耦接至顯示器控制器926之顯示器928。一或多個揚聲器948可耦接至編解碼器
934。一或多個麥克風946可經由輸入介面112耦接至編解碼器934。在特定實施中,揚聲器948可包括圖1之第一揚聲器142、第二揚聲器144,或其一組合。在特定實施中,麥克風946可包括圖1之第一麥克風146、第二麥克風148,或其一組合。編解碼器934可包括數位至類比轉換器(DAC)902及類比至數位轉換器(ADC)904。
記憶體153可包括指令191,其可由處理器906、處理器910、編解碼器934、裝置900之另一處理單元或其一組合執行,以執行參考圖1至圖8所描述之一或多個操作。
裝置900之一或多個組件可藉由執行用以執行一或多個任務或其一組合之指令的處理器經由專用硬體(例如,電路)實施。作為一實例,記憶體153處理器906、處理器910及/或編解碼器934之一或多個組件可為記憶體裝置,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可卸除式磁碟或光碟唯讀記憶體(CD-ROM)。記憶體裝置可包括在由一電腦(例如,編解碼器934中之處理器、處理器906及/或處理器910)執行時可使得電腦執行參考圖1至圖8所描述之一或多個操作的指令(例如,指令960)。作為一實例,記憶體153或處理器906、處理器910及/或編解碼器934中之一或多個組件可為包括指令(例如,指令960)之非暫時性電腦可讀媒體,當由電腦(例如,編解碼器934中之處理器、處理器906及/或處理器910)執行時,該等指令使得電腦執行參考圖1至圖8所描述之一或多個操作。
在特定實施中,裝置900可包括於系統級封裝或系統單晶片裝置(例
如,行動台數據機(MSM))922中。在特定實施中,處理器906、處理器910、顯示器控制器926、記憶體153、編解碼器934及傳輸器110包括於封裝內系統或系統單晶片裝置922中。在特定實施中,諸如觸控螢幕及/或小鍵盤之輸入裝置930及電源供應器944耦接至系統單晶片裝置922。此外,在特定實施中,如圖9中所說明,顯示器928、輸入裝置930、揚聲器948、麥克風946、天線942及電源供應器944位於系統單晶片裝置922外部。然而,顯示器928、輸入裝置930、揚聲器948、麥克風946、天線942及電源供應器944中之每一者可耦接至系統單晶片裝置922之組件,諸如介面或控制器。
裝置900可包括:無線電話、行動通信裝置、行動電話、智慧型電話、蜂巢式電話、膝上型電腦、桌上型電腦、電腦、平板電腦、機上盒、個人數位助理(PDA)、顯示裝置、電視、遊戲控制台、音樂播放器、收音機、視訊播放器、娛樂單元、通信裝置、固定位置資料單元、個人媒體播放器、數位視訊播放器、數位視訊光碟(DVD)播放器、調諧器、攝影機、導航裝置、解碼器系統、編碼器系統或其任何組合。
參考圖10,描繪了基地台1000之特定例示性實例的方塊圖。在各種實施中,基地台1000可相比圖10中所說明的具有較多組件或較少組件。在說明性實例中,基地台1000可包括圖1之第一裝置104或第二裝置106。在說明性實例中,基地台1000可根據參看圖1至圖8所描述之方法或系統中之一或多者操作。
基地台1000可為無線通信系統之部分。無線通信系統可包括多個基地台及多個無線裝置。無線通信系統可為長期演進(LTE)系統、分碼多重存取(CDMA)系統、全球行動通信系統(GSM)系統、無線區域網路
(WLAN)系統或一些其他無線系統。CDMA系統可實施寬頻CDMA(WCDMA)、CDMA 1X、演進資料最佳化(EVDO)、分時同步CDMA(TD-SCDMA),或一些其他版本之CDMA。
無線裝置亦可被稱作使用者裝備(UE)、行動台、終端機、存取終端機、用戶單元、工作台等。該等無線裝置可包括:蜂巢式電話、智慧型電話、平板電腦、無線數據機、個人數位助理(PDA)、手持型裝置、膝上型電腦、智能本、迷你筆記型電腦、平板電腦、無接線電話、無線區域迴路(WLL)站、藍芽裝置等。無線裝置可包括或對應於圖10之裝置1000。
各種功能可由基地台1000之一或多個組件(及/或,圖中未示之其他組件中)執行,諸如發送及接收訊息及資料(例如,音訊資料)。在特定實例中,基地台1000包括處理器1006(例如,CPU)。基地台1000可包括轉碼器1010。轉碼器1010可包括音訊編解碼器1008。舉例而言,轉碼器1010可包括經組態以執行音訊編解碼器1008之操作的一或多個組件(例如,電路)。作為另一實例,轉碼器1010可經組態以執行一或多個電腦可讀指令以執行音訊編解碼器1008之操作。儘管音訊編解碼器1008說明為轉碼器1010之組件,但在其他實例中,音訊編解碼器1008之一或多個組件可包括於處理器1006、另一處理組件,或其一組合中。舉例而言,解碼器1038(例如,聲碼器解碼器)可包括於接收器資料處理器1064中。作為另一實例,編碼器1036(例如,聲碼器編碼器)可包括於傳輸資料處理器1082中。
轉碼器1010可起到在兩個或兩個以上網路之間轉碼訊息及資料的作用。轉碼器1010可經組態以將訊息及音訊資料自第一格式(例如,數位格式)轉換至第二格式。為進行說明,解碼器1038可解碼具有第一格式之經
編碼信號,且編碼器1036可將經解碼信號編碼成具有第二格式之經編碼信號。另外地或替代地,轉碼器1010可經組態以執行資料速率適應。舉例而言,轉碼器1010可在不改變音訊資料之格式的情況下降頻轉換資料速率或升頻轉換資料速率。為進行說明,轉碼器1010可將64kbit/s信號降頻轉換成16kbit/s信號。
音訊編解碼器1008可包括編碼器1036及解碼器1038。編碼器1036可包括圖1之編碼器200。解碼器1038可包括圖1之解碼器300。
基地台1000可包括記憶體1032。諸如電腦可讀儲存裝置之記憶體1032可包括指令。指令可包括可由處理器1006、轉碼器1010或其組合執行之一或多個指令,以執行參考圖1至圖8之方法及系統所描述之一或多個操作。基地台1000可包括耦接至天線陣列之多個傳輸器及接收器(例如,收發器),諸如第一收發器1052及第二收發器1054。天線陣列可包括第一天線1042及第二天線1044。天線陣列可經組態以無線方式與一或多個無線裝置通信,諸如圖10之裝置1000。舉例而言,第二天線1044可自無線裝置接收資料串流1014(例如,位元串流)。資料串流1014可包括訊息、資料(例如,經編碼話語資料),或其一組合。
基地台1000可包括諸如空載傳輸連接之網路連接1060。網路連接1060可經組態以與無線通信網路之核心網路或一或多個基地台通信。舉例而言,基地台1000可經由網路連接1060自核心網路接收第二資料串流(例如,訊息或音訊資料)。基地台1000可處理第二資料串流以產生訊息或音訊資料,且經由天線陣列之一或多個天線將訊息或音訊資料提供至一或多個無線裝置,或經由網路連接1060將其提供至另一基地台。在特定實施中,網路連接1060可為廣域網路(WAN)連接,作為說明性的非限制性
實例。在一些實施中,核心網路可包括或對應於公眾交換電話網路(PSTN)、封包基幹網路或兩者。
基地台1000可包括耦接至網路連接1060及處理器1006之媒體閘道器1070。媒體閘道器1070可經組態以在不同電信技術之媒體串流之間轉換。舉例而言,媒體閘道器1070可在不同傳輸協定、不同寫碼方案或兩者之間轉換。為進行說明,作為說明性非限制性實例,媒體閘道器1070可自PCM信號轉換成即時輸送協定(RTP)信號。媒體閘道器1070可在封包交換式網路(例如,網際網路通訊協定語音(VoIP)網路、IP多媒體子系統(IMS)、諸如LTE、WiMax及UMB之第四代(4G)無線網路等)、電路交換式網路(例如,PSTN)及混合型網路(例如,諸如GSM、GPRS及EDGE之第二代(2G)無線網路、諸如WCDMA、EV-DO及HSPA之第三代(3G)無線網路等)之間轉換資料。
另外,媒體閘道器1070可包括轉碼且可經組態以當編碼解碼器不兼容時轉碼資料。舉例而言,作為一說明性非限制性實例,媒體閘道器1070可在自適應多速率(AMR)編解碼器與G.711編解碼器之間進行轉碼。媒體閘道器1070可包括路由器及複數個實體介面。在一些實施中,媒體閘道器1070亦可包括控制器(未展示)。在特定實施中,媒體閘道器控制器可在媒體閘道器1070外部、在基地台1000外部或在其兩者外部。媒體閘道器控制器可控制並協調操作多個媒體閘道器。媒體閘道器1070可自媒體閘道器控制器接收控制信號,且可起到在不同傳輸技術之間橋接器的作用,且可添加對終端使用者能力及連接之服務。
基地台1000可包括耦接至收發器1052、1054、接收器資料處理器1064,及處理器1006之解調變器1062,且接收器資料處理器1064可耦接
至處理器1006。解調變器1062可經組態以解調變接收自收發器1052、1054之經調變信號,且將經解調變資料提供至接收器資料處理器1064。接收器資料處理器1064可經組態以自經解調變資料提取訊息或音訊資料,且將該訊息或音訊資料發送至處理器1006。
基地台1000可包括傳輸資料處理器1082及傳輸多輸入多輸出(MIMO)處理器1084。傳輸資料處理器1082可耦接至處理器1006及傳輸MIMO處理器1084。傳輸MIMO處理器1084可耦接至收發器1052、1054及處理器1006。在一些實施中,傳輸MIMO處理器1084可耦接至媒體閘道器1070。傳輸資料處理器1082可經組態以自處理器1006接收訊息或音訊資料,且基於諸如CDMA或正交分頻多工(OFDM)之寫碼方案寫碼該等訊息或該音訊資料,作為例示性的非限制性實例。傳輸資料處理器1082可將經寫碼資料提供至傳輸MIMO處理器1084。
可使用CDMA或OFDM技術將經寫碼資料與諸如導頻資料之其他資料多路傳輸在一起以產生經多路傳輸資料。經多路傳輸資料接著可基於特定調變方案(例如,二進位相移鍵控(「BPSK」)、正交相移鍵控(「QSPK」)、M-元相移鍵控(「M-PSK」)、M-元正交振幅調變(「M-QAM」)等)藉由傳輸資料處理器1082調變(亦即,符號映射)以產生調變符號。在特定實施中,可使用不同調變方案調變經寫碼資料及其他資料。用於每一資料串流之資料速率、寫碼,及調變可藉由處理器1006所執行之指令來判定。
傳輸MIMO處理器1084可經組態以自傳輸資料處理器1082接收調變符號,且可進一步處理調變符號,且可對該資料執行波束成形。舉例而言,傳輸MIMO處理器1084可將波束成形權重應用於調變符號。波束成形
權重可對應於天線陣列之一或多個天線(自該等天線傳輸調變符號)。
在操作期間,基地台1000之第二天線1044可接收資料串流1014。第二收發器1054可自第二天線1044接收資料串流1014,且可將資料串流1014提供至解調變器1062。解調變器1062可解調變資料串流1014之經調變信號,且將經解調變資料提供至接收器資料處理器1064。接收器資料處理器1064可自經解調變資料提取音訊資料,且將經提取音訊資料提供至處理器1006。
處理器1006可將音訊資料提供至轉碼器1010以用於轉碼。轉碼器1010之解碼器1038可將音訊資料自第一格式解碼成經解碼音訊資料,且編碼器1036可將經解碼音訊資料編碼成第二格式。在一些實施中,編碼器1036可使用自無線裝置接收的較高資料速率(例如,升頻轉換)或較低資料速率(例如,降頻轉換)編碼音訊資料。在其他實施中,音訊資料可未經轉碼。儘管轉碼(例如,解碼及編碼)被說明為由轉碼器1010執行,但轉碼操作(例如,解碼及編碼)可由基地台1000之多個組件執行。舉例而言,解碼可由接收器資料處理器1064執行,且編碼可由傳輸資料處理器1082執行。在其他實施中,處理器1006可將音訊資料提供至媒體閘道器1070以供轉換成另一傳輸協定、寫碼方案或兩者。媒體閘道器1070可藉助於網路連接1060將經轉換資料提供至另一基地台或核心網路。
可經由處理器1006將在編碼器1036處產生之經編碼音訊資料(諸如經轉碼資料)提供至傳輸資料處理器1082或網路連接1060。可將來自轉碼器1010之經轉碼音訊資料提供至傳輸資料處理器1082,用於根據諸如OFDM之調變方案寫碼,以產生調變符號。傳輸資料處理器1082可將調變符號提供至傳輸MIMO處理器1084,以供進一步處理及波束成形。傳輸
MIMO處理器1084可應用波束成形權重,且可經由第一收發器1052將調變符號提供至天線陣列之一或多個天線,諸如第一天線1042。因此,基地台1000可將對應於自無線裝置接收之資料串流1014的經轉碼資料串流1016提供至另一無線裝置。經轉碼資料串流1016可具有與資料串流1014不同的編碼格式、資料速率,或該等兩者。在其他實施中,可將經轉碼資料串流1016提供至網路連接1060,用於傳輸至另一基地台或核心網路。
在特定實施中,本文中揭示之系統及裝置之一或多個組件可整合於解碼系統或設備(例如,其中之電子裝置、編解碼器或處理器)中、整合於編碼系統或設備中,或整合於該等兩者中。在其他實施中,本文所揭示之系統及裝置之一或多個組件可整合至以下各者中:無線電話、平板電腦、桌上型電腦、膝上型電腦、機上盒、音樂播放器、視訊播放器、娛樂單元、電視、遊戲控制台、導航裝置、通信裝置、個人數位助理(PDA)、固定位置資料單元、個人媒體播放器或另一類型之裝置。
結合所描述之技術,第一設備包括用於基於高頻帶參考通道指示符選擇左通道或右通道作為非參考目標通道的構件。舉例而言,用於選擇的該構件可包括圖1、圖2A及圖9之編碼器200、圖1、圖2A、圖4及圖5之編碼器204、圖4之開關424、圖9之編解碼器908、圖9之處理器906、可由處理器執行之指令191、圖10之編碼器1036、一或多個其他裝置、電路或其任何組合。
第一設備亦包括用於基於對應於非參考目標通道之非參考高頻帶激勵產生經合成非參考高頻帶通道的構件。舉例而言,用於產生經合成非參考高頻帶通道的該構件可包括圖1、圖2A及圖9之編碼器200、圖1、圖2A、圖4及圖5之ICBWE編碼器204、圖4之LPC合成濾波器410、圖9之編
解碼器908、圖9之處理器906、可由處理器執行之指令191、圖10之編碼器1036、一或多個其他裝置、電路或其任何組合。
第一設備亦包括用於基於經合成非參考高頻帶通道及非參考目標通道之高頻帶部分估計一或多個頻譜映射參數的構件。舉例而言,用於估計的該構件可包括圖1、圖2A及圖9之編碼器200、圖1、圖2A、圖4及圖5之ICBWE編碼器204、圖4之頻譜映射估計器414、圖9之編解碼器908、圖9之處理器906、可由處理器執行之指令191、圖10之編碼器1036、一或多個其他裝置、電路或其任何組合。
第一設備亦包括用於將一或多個頻譜映射參數應用於經合成非參考高頻帶通道以產生頻譜狀經合成非參考高頻帶通道的構件。舉例而言,用於應用的該構件可包括圖1、圖2A及圖9之編碼器200、圖1、圖2A、圖4及圖5之ICBWE編碼器204、圖5之頻譜映射施加器502、圖9之編解碼器908、圖9之處理器906、可由處理器執行之指令191、圖10之編碼器1036、一或多個其他裝置、電路或其任何組合。
第一設備亦包括用於基於一或多個頻譜映射參數及頻譜狀經合成非參考高頻帶通道產生經編碼位元串流的構件。舉例而言,用於產生頻譜映射參數位元串流的該構件可包括圖1、圖2A及圖9之編碼器200、圖1、圖2A、圖4及圖5之ICBWE編碼器204、圖4之頻譜映射量化器416、圖9之編解碼器908、圖9之處理器906、可由處理器執行之指令191、圖10之編碼器1036、一或多個其他裝置、電路或其任何組合。
第一設備亦包括用於將經編碼位元串流傳輸至第二裝置的構件。舉例而言,用於傳輸的該構件可包括圖1及圖9之傳輸器110、圖10之收發器1052、一或多個其他裝置、電路或其任何組合。
結合所描述之技術,第二設備包括用於自所接收低頻帶位元串流產生參考通道及非參考目標通道的構件。舉例而言,用於產生非參考通道的該構件可包括圖1、圖3A及圖9之解碼器300、圖10之解碼器1038、一或多個其他裝置、電路或其任何組合。
第二設備亦包括用於基於對應於非參考目標通道之非參考高頻帶激勵產生經合成非參考高頻帶通道的構件。舉例而言,用於產生經合成非參考高頻帶通道的該構件可包括圖1、圖3A及圖9之解碼器300、圖1、圖3A、圖6及圖9之ICBWE解碼器306、圖6之LPC合成濾波器604、圖10之解碼器1038、一或多個其他裝置、電路或其任何組合。
第二設備亦包括用於自所接收頻譜映射位元串流提取一或多個頻譜映射參數的構件。舉例而言,用於提取的該構件可包括圖1、圖3A及圖9之解碼器300、圖1、圖3A、圖6及圖9之ICBWE解碼器306、圖6之頻譜映射反量化器608、圖10之解碼器1038、一或多個其他裝置、電路或其任何組合。
第二設備亦包括用於藉由將一或多個頻譜映射參數應用於經合成非參考高頻帶通道來產生頻譜狀經合成非參考高頻帶通道的構件。舉例而言,用於產生頻譜狀經合成非參考高頻帶通道的該構件可包括圖1、圖3A及圖9之解碼器300、圖1、圖3A、圖6及圖9之ICBWE解碼器306、圖6之頻譜映射施加器606、圖10之解碼器1038、一或多個其他裝置、電路或其任何組合。
第二設備亦包括用於至少基於頻譜狀非參考高頻帶通道、參考通道及非參考目標通道產生輸出信號的構件。舉例而言,用於產生輸出信號的該構件可包括圖1、圖3A及圖9之解碼器300、圖1、圖3A、圖6及圖9之
ICBWE解碼器306、圖10之解碼器1038、一或多個其他裝置、電路或其任何組合。
第二設備亦包括用於再現輸出信號的構件。舉例而言,用於顯現輸出信號之構件可包括圖1之第一揚聲器142、圖1之第二揚聲器144、圖9之揚聲器948、一或多個其他裝置、電路,或其任何組合。
應注意,藉由本文所揭示之系統及裝置之一或多個組件執行的各種功能經描述為藉由某些組件或模組執行。組件及模組之此劃分僅用於說明。在一替代性實施中,由特定組件或模組執行之功能可被劃分於多個組件或模組之中。此外,在替代性實施中,兩個或多於兩個組件或模組可被整合至單個組件或模組中。每一組件或模組可使用硬體(例如,場可程式化閘陣列、(FPGA)裝置、特殊應用積體電路(ASIC)、DSP、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施。
熟習此項技術者將進一步瞭解,結合本文中所揭示之實施而描述的各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由諸如硬體處理器之處理裝置執行的電腦軟體或兩者之組合。上文大體在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此功能性經實施為硬體或是軟體取決於特定應用及強加於整個系統之設計約束而定。熟習此項技術者可針對每一特定應用來以變化方式實施所描述之功能性,但此類實施決策不應被解譯為導致脫離本發明之範疇。
結合本文中所揭示之實施所描述之方法或演算法之步驟可直接體現於硬體中、由處理器執行之軟體模組中或兩者之組合中。軟體模組可存在於記憶體裝置中,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋力矩轉移(STT-MRAM)、快閃記憶體、唯讀記憶體
(ROM)、可程式化唯讀記憶體(PROM)、可擦除可程式化唯讀記憶體(EPROM)、電可擦除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟或光碟唯讀記憶體(CD-ROM)。例示性記憶體裝置耦接至處理器,以使得處理器可自記憶體裝置讀取資訊及將資訊寫入至記憶體裝置。在替代方案中,記憶體裝置可與處理器成一體式。處理器及儲存媒體可駐存於特殊應用積體電路(ASIC)中。ASIC可駐存於計算裝置或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐存於計算裝置或使用者終端機中。
提供對所揭示實施之先前描述,以使得熟習此項技術者能夠製作或使用所揭示之實施。對此等實施之各種修改對於熟習此項技術者將容易地顯而易見,且在不背離本發明之範疇的情況下,本文中所定義之原理可應用於其他實施。因此,本發明並非意欲限於本文中所展示之實施,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
204a:第一部分
212:左通道
214:右通道
234:參數
404:高頻帶參考通道判定單元
406:高頻帶參考通道指示符編碼器
408:非參考高頻帶激勵產生器
410:線性預測係數(LPC)合成濾波器
412:高頻帶目標通道產生器
414:頻譜映射估計器
416:頻譜映射量化器
418:信號倍增器
420:信號倍增器
422:信號組合器
424:開關
440:高頻帶參考通道指示符
442:高頻帶參考通道指示符位元串流
452:增益經調整諧波高頻帶激勵
454:增益經調整經調變雜訊
456:非參考高頻帶激勵
457:經量化線性預測係數(LPC)
458:經合成非參考高頻帶
459:非參考通道
460:非參考高頻帶通道
462:頻譜映射參數
464:高頻帶頻譜映射位元串流
466:經量化頻譜映射參數
482:經調變雜訊
Claims (34)
- 一種計算裝置,其包含:一編碼器,其經組態以:基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道;產生該非參考目標通道之一高頻帶部分;基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道;基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數;將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道;基於該頻譜狀經合成非參考高頻帶通道估計一增益映射參數,該增益映射參數不同於(distinct from)該一或多個頻譜映射參數;及基於該一或多個頻譜映射參數、該增益映射參數、及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流;及一傳輸器,其經組態以將該經編碼位元串流傳輸至一第二裝置。
- 如請求項1之計算裝置,其中該編碼器進一步經組態以:將一第一增益應用於一諧波高頻帶激勵以產生一增益經調整諧波高頻帶激勵;將一第二增益應用於經調變雜訊以產生增益經調整經調變雜訊;及 組合該增益經調整諧波高頻帶激勵及該增益經調整經調變雜訊以產生該非參考高頻帶激勵。
- 如請求項1之計算裝置,其中該經合成非參考高頻帶通道係使用一線性預測係數合成濾波器產生。
- 如請求項1之計算裝置,其中該編碼器經進一步組態以基於一頻譜映射濾波器對該經合成非參考高頻帶通道進行濾波。
- 如請求項1之計算裝置,其中該增益映射參數進一步基於一高頻帶中間通道、一經合成高頻帶中間通道及一非參考高頻帶通道。
- 如請求項1之計算裝置,其中該一或多個頻譜映射參數係基於該非參考目標通道在滯後索引一處的一第一自相關值及該非參考目標通道在滯後索引零處的一第二自相關值進行估計。
- 如請求項1之計算裝置,其中該一或多個頻譜映射參數包括對應於至少兩個頻譜映射參數候選者所滿足之一準則的一頻譜映射參數以匹配該非參考目標通道之一頻譜形狀及該頻譜狀經合成非參考高頻帶通道之一頻譜形狀。
- 如請求項7之計算裝置,其中若該至少兩個頻譜映射參數候選者為非真實候選者,則該頻譜映射參數對應於一先前訊框之一頻譜映射參數。
- 如請求項7之計算裝置,其中若該至少兩個頻譜映射參數候選者中之每一頻譜映射參數候選者具有大於一之一絕對值,則該頻譜映射參數對應於一先前訊框之一頻譜映射參數。
- 如請求項7之計算裝置,其中若該至少兩個頻譜映射參數候選者中之僅一個頻譜映射參數候選者具有小於一之一絕對值,則該頻譜映射參數對應於具有小於一之一絕對值的一頻譜映射參數候選者。
- 如請求項7之計算裝置,其中若該至少兩個頻譜映射參數候選者中之多於一者具有小於一之一絕對值,則該頻譜映射參數對應於具有一最小值之一頻譜映射參數候選者。
- 如請求項7之計算裝置,其中若該至少兩個頻譜映射參數候選者中之多於一者具有小於一之一絕對值,則該頻譜映射參數對應於一先前訊框之一頻譜映射參數。
- 如請求項1之計算裝置,其中該經編碼位元串流對應於一通道間頻寬擴展(ICBWE)位元串流,該ICBWE位元串流係基於一高頻帶參考通道指示符位元串流、一高頻帶頻譜映射位元串流及一高頻帶增益映射位元串流。
- 如請求項1之計算裝置,其中該計算裝置係一行動裝置,且該編碼器 及該傳輸器整合於該行動裝置中。
- 如請求項1之計算裝置,其中該計算裝置係一基地台,且該編碼器及該傳輸器整合於該基地台中。
- 一種編碼視訊資料之方法,該方法包含:在一第一裝置之一編碼器處,基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道;產生該非參考目標通道之一高頻帶部分;基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道;基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數;將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道;基於該頻譜狀經合成非參考高頻帶通道估計一增益映射參數,該增益映射參數不同於(distinct from)該一或多個頻譜映射參數;基於該一或多個頻譜映射參數、該增益映射參數、及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流;及將該經編碼位元串流傳輸至一第二裝置。
- 如請求項16之方法,其進一步包含:將一第一增益應用於一諧波高頻帶激勵以產生一增益經調整諧波高 頻帶激勵;將一第二增益應用於經調變雜訊以產生增益經調整經調變雜訊;及組合該增益經調整諧波高頻帶激勵及該增益經調整經調變雜訊以產生該非參考高頻帶激勵。
- 如請求項16之方法,其進一步包含基於一線性預測係數合成濾波器產生該經合成非參考高頻帶通道。
- 如請求項16之方法,其中該一或多個頻譜映射參數包括對應於至少兩個頻譜映射參數候選者所滿足之一準則的一頻譜映射參數以匹配該非參考目標通道之一頻譜形狀及該頻譜狀經合成非參考高頻帶通道之一頻譜形狀。
- 如請求項19之方法,其中若該至少兩個頻譜映射參數候選者為非真實候選者,則該頻譜映射參數對應於一先前訊框之一頻譜映射參數。
- 如請求項19之方法,其中若該至少兩個頻譜映射參數候選者中之每一頻譜映射參數候選者具有大於一之一絕對值,則該頻譜映射參數對應於一先前訊框之一頻譜映射參數。
- 如請求項19之方法,其中若該至少兩個頻譜映射參數候選者中之僅一個頻譜映射參數候選者具有小於一之一絕對值,則該頻譜映射參數對應於具有小於一之一絕對值的一頻譜映射參數候選者。
- 如請求項19之方法,其中若該至少兩個頻譜映射參數候選者中之多於一者具有小於一之一絕對值,則該頻譜映射參數對應於具有一最小值之一頻譜映射參數候選者。
- 如請求項19之方法,其中若該至少兩個頻譜映射參數候選者中之多於一者具有小於一之一絕對值,則該頻譜映射參數對應於一先前訊框之一頻譜映射參數。
- 如請求項16之方法,其中在一行動裝置處執行估計該一或多個頻譜映射參數及應用該一或多個頻譜映射參數。
- 如請求項16之方法,其中在一基地台處執行估計該一或多個頻譜映射參數及應用該一或多個頻譜映射參數。
- 一種計算裝置,其包含:用於基於一高頻帶參考通道指示符選擇一左通道或一右通道作為一非參考目標通道的構件;用於產生該非參考目標通道之一高頻帶部分的構件;用於基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道的構件;用於基於該經合成非參考高頻帶通道及該非參考目標通道之該高頻帶部分估計一或多個頻譜映射參數的構件; 用於將該一或多個頻譜映射參數應用於該經合成非參考高頻帶通道以產生一頻譜狀經合成非參考高頻帶通道的構件;用於基於該頻譜狀經合成非參考高頻帶通道估計一增益映射參數的構件,該增益映射參數不同於(distinct from)該一或多個頻譜映射參數;用於基於該一或多個頻譜映射參數、該增益映射參數、及該頻譜狀經合成非參考高頻帶通道產生一經編碼位元串流的構件;及用於將該頻譜映射參數位元串流傳輸至一第二裝置的構件。
- 如請求項27之計算裝置,其中該計算裝置係一行動裝置,且用於估計該一或多個頻譜映射參數的該構件及用於應用該一或多個頻譜映射參數的該構件整合於該行動裝置中。
- 如請求項27之計算裝置,其中該計算裝置係一基地台,且用於估計該一或多個頻譜映射參數的該構件及用於應用該一或多個頻譜映射參數的該構件整合於該基地台中。
- 一種計算裝置,其包含:一解碼器,其經組態以:自一所接收低頻帶位元串流產生一參考通道及一非參考目標通道,該低頻帶位元串流係自一第二裝置之一編碼器接收;基於對應於該非參考目標通道之一非參考高頻帶激勵產生一經合成非參考高頻帶通道;自一所接收頻譜映射位元串流提取一或多個頻譜映射參數,該頻 譜映射位元串流係自該第二裝置之該編碼器接收;自一所接收高頻帶增益映射位元串流提取一增益映射參數,該高頻帶增益映射位元串流係自該第二裝置之該編碼器接收,且該增益映射參數不同於(distinct from)該一或多個頻譜映射參數;藉由將該一或多個頻譜映射參數及該增益映射參數應用於該經合成非參考高頻帶通道來產生一頻譜狀經合成非參考高頻帶通道;及至少基於該頻譜狀經合成非參考高頻帶通道、該參考通道及該非參考目標通道產生一輸出信號。
- 如請求項30之計算裝置,其進一步包含經組態以顯現該輸出信號之一播放裝置。
- 如請求項30之計算裝置,其中該編碼器係進一步經組態以:基於一經量化高頻帶增益形狀而縮放該頻譜狀經合成非參考高頻帶以產生一經縮放信號;及基於該經縮放信號而產生一經解碼高頻帶非參考通道,其中該輸出信號係至少基於該經解碼高頻帶非參考通道。
- 如請求項30之計算裝置,其中該計算裝置係一行動裝置,且該解碼器整合於該行動裝置中。
- 如請求項30之計算裝置,其中該計算裝置係一基地台,且該解碼器整合於該基地台中。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762469432P | 2017-03-09 | 2017-03-09 | |
US62/469,432 | 2017-03-09 | ||
US15/890,670 US10553222B2 (en) | 2017-03-09 | 2018-02-07 | Inter-channel bandwidth extension spectral mapping and adjustment |
US15/890,670 | 2018-02-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201833904A TW201833904A (zh) | 2018-09-16 |
TWI713819B true TWI713819B (zh) | 2020-12-21 |
Family
ID=63445733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107104695A TWI713819B (zh) | 2017-03-09 | 2018-02-09 | 用於頻譜映射及調整之計算裝置及方法 |
Country Status (7)
Country | Link |
---|---|
US (3) | US10553222B2 (zh) |
EP (1) | EP3593348B1 (zh) |
CN (2) | CN110337691B (zh) |
ES (1) | ES2894625T3 (zh) |
SG (1) | SG11201906584WA (zh) |
TW (1) | TWI713819B (zh) |
WO (1) | WO2018164805A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
CN111586547B (zh) * | 2020-04-28 | 2022-05-06 | 北京小米松果电子有限公司 | 音频输入模组的检测方法及装置、存储介质 |
CN117198313A (zh) * | 2023-08-17 | 2023-12-08 | 珠海全视通信息技术有限公司 | 侧音消除方法、装置、电子设备、存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070088542A1 (en) * | 2005-04-01 | 2007-04-19 | Vos Koen B | Systems, methods, and apparatus for wideband speech coding |
US20150380007A1 (en) * | 2014-06-26 | 2015-12-31 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999926B2 (en) * | 2000-11-16 | 2006-02-14 | International Business Machines Corporation | Unsupervised incremental adaptation using maximum likelihood spectral transformation |
US7512180B2 (en) * | 2003-06-25 | 2009-03-31 | Microsoft Corporation | Hierarchical data compression system and method for coding video data |
BRPI0514998A (pt) * | 2004-08-26 | 2008-07-01 | Matsushita Electric Ind Co Ltd | equipamento de codificação de sinal de canal múltiplo e equipamento de decodificação de sinal de canal múltiplo |
DK1875463T3 (en) * | 2005-04-22 | 2019-01-28 | Qualcomm Inc | SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
KR102653849B1 (ko) * | 2014-03-24 | 2024-04-02 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
-
2018
- 2018-02-07 US US15/890,670 patent/US10553222B2/en active Active
- 2018-02-08 EP EP18706149.4A patent/EP3593348B1/en active Active
- 2018-02-08 CN CN201880013501.XA patent/CN110337691B/zh active Active
- 2018-02-08 ES ES18706149T patent/ES2894625T3/es active Active
- 2018-02-08 WO PCT/US2018/017359 patent/WO2018164805A1/en unknown
- 2018-02-08 CN CN202310746061.1A patent/CN116721668A/zh active Pending
- 2018-02-08 SG SG11201906584WA patent/SG11201906584WA/en unknown
- 2018-02-09 TW TW107104695A patent/TWI713819B/zh active
-
2019
- 2019-11-04 US US16/673,733 patent/US10872613B2/en active Active
-
2020
- 2020-12-11 US US17/120,067 patent/US11705138B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070088542A1 (en) * | 2005-04-01 | 2007-04-19 | Vos Koen B | Systems, methods, and apparatus for wideband speech coding |
US20150380007A1 (en) * | 2014-06-26 | 2015-12-31 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
Non-Patent Citations (1)
Title |
---|
"3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions (Release 13)", 3GPP STANDARD; 3GPP TS 26.290, 3RD GENERATION PARTNERSHIP PROJECT (3GPP), MOBILE COMPETENCE CENTRE ; 650, ROUTE DES LUCIOLES ; F-06921 SOPHIA-ANTIPOLIS CEDEX ; FRANCE, (2015121 * |
Also Published As
Publication number | Publication date |
---|---|
TW201833904A (zh) | 2018-09-16 |
US20210098006A1 (en) | 2021-04-01 |
SG11201906584WA (en) | 2019-09-27 |
US20180261232A1 (en) | 2018-09-13 |
CN116721668A (zh) | 2023-09-08 |
CN110337691A (zh) | 2019-10-15 |
EP3593348A1 (en) | 2020-01-15 |
US10553222B2 (en) | 2020-02-04 |
EP3593348B1 (en) | 2021-09-15 |
ES2894625T3 (es) | 2022-02-15 |
WO2018164805A1 (en) | 2018-09-13 |
US11705138B2 (en) | 2023-07-18 |
US10872613B2 (en) | 2020-12-22 |
US20200066283A1 (en) | 2020-02-27 |
CN110337691B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI651716B (zh) | 通信裝置、方法及設備及非暫時性之電腦可讀儲存裝置 | |
TWI775838B (zh) | 用於在多源環境中之非諧波語音偵測及頻寬擴展之裝置、方法、電腦可讀媒體及設備 | |
TWI713819B (zh) | 用於頻譜映射及調整之計算裝置及方法 | |
US10593341B2 (en) | Coding of multiple audio signals | |
CN110622242A (zh) | 用于立体声解码的立体声参数 | |
TWI713853B (zh) | 時域頻道之間的預測 | |
TW201905901A (zh) | 具有時域頻道間頻寬延展之高頻帶殘值預測 | |
TWI724290B (zh) | 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置 |