TWI724290B - 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置 - Google Patents
通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置 Download PDFInfo
- Publication number
- TWI724290B TWI724290B TW107111104A TW107111104A TWI724290B TW I724290 B TWI724290 B TW I724290B TW 107111104 A TW107111104 A TW 107111104A TW 107111104 A TW107111104 A TW 107111104A TW I724290 B TWI724290 B TW I724290B
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- band
- low
- bit stream
- gain
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004891 communication Methods 0.000 title claims description 11
- 238000013507 mapping Methods 0.000 claims abstract description 126
- 230000005284 excitation Effects 0.000 claims abstract description 45
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 description 65
- 230000005540 biological transmission Effects 0.000 description 36
- 230000000875 corresponding effect Effects 0.000 description 28
- 230000009466 transformation Effects 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 208000035742 Air-borne transmission Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005557 airborne transmission Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Display Devices Of Pinball Game Machines (AREA)
Abstract
一種方法包括解碼一低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號。該方法進一步包括解碼一高頻帶中間聲道頻寬擴展位元串流以產生一經合成高頻帶中間信號。該方法亦包括判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數。該ICBWE增益映射參數係基於自一立體聲降混/升混參數位元串流提取之一所選擇頻域增益參數。該方法進一步包括基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道。該方法包括輸出一第一音訊聲道及一第二音訊聲道。該第一音訊聲道係基於該參考高頻帶聲道,且該第二音訊聲道係基於目標高頻帶聲道。
Description
本發明大體上係關於多個音訊信號之編碼。
技術之進步已帶來更小且更強大之計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括無線電話(諸如行動及智慧型電話)、平板電腦及膝上型電腦,該等攜帶型個人計算器件為小的輕質的且容易地由使用者攜載。此等器件可經由無線網路傳達語音及資料封包。另外,許多此類器件併入額外功能,諸如數位靜態攝影機、數位視訊攝影機、數位記錄器及音訊檔案播放器。又,此等器件可處理可執行指令,包括軟體應用程式,諸如可用以存取網際網路之網路瀏覽器應用程式。由此因而,此等器件可包括顯著計算能力。
計算器件可包括接收音訊聲道之多個麥克風。舉例而言,第一麥克風可接收左音訊聲道,且第二麥克風可接收對應右音訊聲道。在立體聲編碼中,編碼器可將左音訊聲道及對應右音訊聲道變換至頻域,以分別產生左頻域聲道及右頻域聲道。編碼器可將頻域聲道降混以產生中間聲道。反變換可應用於中間聲道以產生時域中間聲道,且低頻帶編碼器可編碼時域中間聲道之低頻帶部分以產生經編碼低頻帶中間聲道。中間聲道頻寬擴展(BWE)編碼器可基於時域中間聲道及經編碼低頻帶中間聲道之激勵產生中
間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀、增益訊框等)。編碼器可產生包括經編碼低頻帶中間聲道及中間聲道BWE參數之位元串流。
編碼器亦可自頻域聲道(例如,左頻域聲道及右頻域聲道)提取立體聲參數(例如,離散傅立葉變換(DFT)降混參數)。立體聲參數可包括頻域增益參數(例如,側邊增益)、聲道間相位差(IPD)參數、聲道間層級差(ILD)、擴散散佈/增益及聲道間BWE(ICBWE)增益映射參數。立體聲參數亦可包括基於左及右立體聲聲道之時域及/或頻域分析進行估計的聲道間時間差(ITD)。立體聲參數可插入(例如,包括或編碼)於位元串流中,且位元串流可自編碼器傳輸至解碼器。
根據一個實施,一種器件包括一接收器,其經組態以自一編碼器接收一位元串流。該位元串流包括至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流。該器件亦包括經組態以解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號的一解碼器。該解碼器經進一步組態以產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展。該解碼器經進一步組態以解碼該高頻帶中間聲道BWE位元串流以至少基於該非線性諧波激勵信號及高頻帶中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀及增益訊框參數)產生一經合成高頻帶中間信號。該解碼器亦經組態以判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數。該ICBWE增益映射參數係基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域(例如,對應於該高頻帶
BWE部分之一子頻帶群組或頻率區間)增益參數進行判定(例如,預測、導出、引導或映射)。對於寬頻內容,該解碼器經進一步組態以基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道。該器件亦包括經組態以輸出一第一音訊聲道及一第二音訊聲道之一或多個揚聲器。該第一音訊聲道係基於該參考高頻帶聲道,且該第二音訊聲道係基於目標高頻帶聲道。
根據另一實施,一種解碼一信號之方法包括自一編碼器接收一位元串流。該位元串流包括至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流。該方法亦包括解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號。該方法亦包括產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展。該方法亦包括解碼該高頻帶中間聲道BWE位元串流以至少基於該非線性諧波激勵信號及高頻帶中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀及增益訊框參數)產生一經合成高頻帶中間信號。該方法亦包括判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數。該ICBWE增益映射參數係基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域(例如,對應於該高頻帶BWE部分之一子頻帶群組或頻率區間)增益參數進行判定(例如,預測、導出、引導或映射)。該方法進一步包括基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道。該方法亦包括輸出一第一音訊聲道及一第二音訊聲道。該第一音訊聲道係基於該參考高頻帶聲道,且該第二音訊聲道係基於目標高頻帶聲道。
根據另一實施,一種非暫時性電腦可讀媒體包括用於解碼一信號的指令。該等指令在由一解碼器內的一處理器執行時,使得該處理器執行包括自一編碼器接收一位元串流的操作。該位元串流包括至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流。該等操作亦包括解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號。該等操作亦包括產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展。該等操作亦包括解碼該高頻帶中間聲道BWE位元串流以至少基於該非線性諧波激勵信號及高頻帶中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀及增益訊框參數)產生一經合成高頻帶中間信號。該等操作亦包括判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數。該ICBWE增益映射參數係基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域(例如,對應於該高頻帶BWE部分之一子頻帶群組或頻率區間)增益參數進行判定(例如,預測、導出、引導或映射)。該等操作進一步包括基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道。該等操作亦包括輸出一第一音訊聲道及一第二音訊聲道。該第一音訊聲道係基於該參考高頻帶聲道,且該第二音訊聲道係基於目標高頻帶聲道。
根據另一實施,一種裝置包括用於自一編碼器接收一位元串流的構件。該位元串流包括至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流。該裝置亦包括用於解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低
頻帶中間激勵信號的構件。該裝置亦包括用於產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展的構件。該裝置亦包括用於解碼該高頻帶中間聲道BWE位元串流以至少基於該非線性諧波激勵信號及高頻帶中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀及增益訊框參數)產生一經合成高頻帶中間信號的構件。該裝置亦包括用於判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數的構件。該ICBWE增益映射參數係基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域(例如,對應於該高頻帶BWE部分之一子頻帶群組或頻率區間)增益參數進行判定(例如,預測、導出、引導或映射)。該裝置亦包括用於基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道的構件。該裝置亦包括用於輸出一第一音訊聲道及一第二音訊聲道的構件。該第一音訊聲道係基於該參考高頻帶聲道,且該第二音訊聲道係基於目標高頻帶聲道。
在檢閱整個申請案之後,本發明之其他實施方案、優勢及特徵將變得顯而易見,該整個申請案包括以下章節:圖式簡單說明、實施方式及申請專利範圍。
100:系統
104:第一器件
106:第二器件
110:傳輸器
112:輸入介面
114:編碼器
116:最終移位值
118:解碼器
120:網路
126:第一輸出聲道
128:第二輸出聲道
130:第一音訊聲道
132:第二音訊聲道
142:第一揚聲器
144:第二揚聲器
146:第一麥克風
148:第二麥克風
152:聲源
153:記憶體
191:分析資料
202:變換單元
204:變換單元
206:立體聲提示估計器
208:中間聲道產生器
210:反變換單元
212:中間聲道編碼器
214:中間聲道頻寬擴展(BWE)編碼器
252:第一頻域音訊聲道Lfr(b)
254:第二頻域音訊聲道Rfr(b)
256:頻域中間聲道Mfr(b)
258:時域中間聲道M(t)
260:低頻帶中間聲道激勵
290:立體聲降混/升混參數位元串流
292:低頻帶中間聲道位元串流
294:高頻帶中間聲道頻寬擴展(BWE)位元串流
302:低頻帶中間聲道解碼器
304:中間聲道頻寬擴展(BWE)解碼器
306:變換單元
308:聲道間頻寬擴展(ICBWE)空間平衡器
310:立體聲升混器
312:反變換單元
314:反變換單元
316:組合器
318:移位器
320:移位器
322:聲道間頻寬擴展(ICBWE)增益映射參數產生器
324:提取器
326:選擇器
328:頻域增益參數
330:頻域增益參數
332:聲道間頻寬擴展(ICBWE)增益映射參數
350:低頻帶中間信號
352:低頻帶中間激勵信號
354:頻域低頻帶中間信號
356:第一頻域低頻帶聲道
358:第二頻域低頻帶聲道
360:第一低頻帶聲道
362:第二低頻帶聲道
364:經合成高頻帶中間信號
366:第一高頻帶聲道
368:第二高頻帶聲道
370:第一聲道
372:第二聲道
400:方法
402-412:步驟
500:器件
502:數位至類比轉換器(DAC)
504:類比至數位轉換器(ADC)
506:處理器
508:媒體編解碼器(CODEC)
510:處理器
512:回音消除器
522:系統單晶片器件
526:顯示器控制器
528:顯示器
530:輸入器件
534:編解碼器
542:天線
544:電源供應器
546:麥克風
548:揚聲器
560:指令
590:收發器
600:基地台
606:處理器
608:音訊編解碼器
610:轉碼器
614:資料串流
616:經轉碼資料串流
642:第一天線
644:第二天線
652:第一收發器
654:第二收發器
660網路連接
662:解調器
664:接收器資料處理器
670:媒體閘道器
682:傳輸資料處理器
684:傳輸多輸入多輸出(MIMO)處理器
圖1為包括可操作以基於自一編碼器傳輸之一頻域增益參數判定聲道間頻寬擴展(ICBWE)映射參數之解碼器的系統之特定說明性實例的方塊圖;圖2為說明圖1之編碼器的圖式;圖3為說明圖1之解碼器的圖式;
圖4為說明基於自編碼器傳輸之頻域增益參數判定ICBWE映射參數之特定方法的流程圖;圖5為可操作以基於自編碼器傳輸之頻域增益參數判定ICBWE映射參數之器件的特定說明性實例之方塊圖;及圖6為可操作以基於自編碼器傳輸之頻域增益參數判定ICBWE映射參數之基地台的方塊圖。
相關申請案之交互參考
本申請案主張2017年4月5日申請的標題為「INTER-CHANNEL BANDWIDTH EXTENSION」之美國臨時專利申請案第62/482,150號之權益,該申請案明確地以全文引用之方式併入本文中。
下文參考圖式描述本發明之特定態樣。在描述中,共同特徵藉由共同參考編號指示。如本文所使用,各種術語僅僅用於描述特定實施之目的,且並不意欲限制實施。舉例而言,除非上下文以其他方式明確地指示除非上下文另外明確指示,否則單數形式「一」、「一個」及「該」意欲同樣包括複數形式。可進一步理解,術語「包含」及「包含著」可與「包括」或「包括著」互換使用。另外,應理解,術語「其中」可與「在…的情況下」互換使用。如本文中所使用,用以修改元件(諸如,結構、組件、操作等)之序數術語(例如,「第一」、「第二」、「第三」等)本身不指示元件關於另一元件之任何優先權或次序,而是僅將元件與具有相同名稱之另一元件區別開(除非使用序數術語)。如本文所使用,術語「集合」指特定元件中之一或多者,且術語「複數個」指特定元件之多者(例如,兩個或兩個以上)。
在本發明中,諸如「判定」、「計算」、「移位」、「調整」等之
術語可用於描述如何執行一或多個操作。應注意,此等術語不應解釋為限制性的且其他技術可用以執行類似操作。另外,如本文中所提及,「產生」、「計算」、「使用」、「選擇」、「存取」、「識別」及「判定」可互換地使用。舉例而言,「產生」、「計算」或「判定」參數(或信號)可指積極地產生、計算或判定參數(或信號),或可指使用、選擇或存取已(諸如)由另一組件或器件產生之參數(或信號)。
揭示可操作以編碼多個音訊信號之系統及器件。器件可包括經組態以編碼多個音訊信號之編碼器。可使用多個記錄器件(例如,多個麥克風)同時及時地俘獲多個音訊信號。在一些實例中,藉由多工若干同時或非同時記錄之音訊聲道可合成地(例如,人工)產生多個音訊信號(或多聲道音訊)。如說明性實例,音訊聲道之並行記錄或多工可產生2聲道組態(亦即,立體聲:左及右)、5.1聲道組態(左、右、中央、左環繞、右環繞及低頻重音(LFE)聲道)、7.1聲道組態、7.1+4聲道組態、22.2聲道組態或N聲道組態。
電話會議室(或遠程呈現室)中之音訊俘獲器件可包括獲取空間音訊之多個麥克風。空間音訊可包括語音以及經編碼且經傳輸之背景音訊。視如何組態麥克風以及給定來源(例如,講話者)位於相對於麥克風及房間大小的位置,來自該來源(例如,講話者)之話語/音訊可於不同時間到達多個麥克風處。舉例而言,相比於與器件相關聯之第二麥克風,聲源(例如講話者)可更接近與器件相關聯之第一麥克風。因此,與第二麥克風相比,自聲源發出之聲音可更早到達第一麥克風。器件可經由第一麥克風接收第一音訊信號,且可經由第二麥克風接收第二音訊信號。
中側(MS)寫碼及參數立體聲(PS)寫碼為可提供優於雙單聲道寫碼技
術之經改良效能的立體聲寫碼技術。在雙單聲道寫碼中,左(L)聲道(或信號)及右(R)聲道(或信號)經獨立地寫碼,而不利用聲道間相關。在寫碼之前,藉由將左聲道及右聲道變換為總聲道及差聲道(例如,旁聲道),MS寫碼減少相關L/R聲道對之間的冗餘。總信號及差信號經波形寫碼或基於MS寫碼中之模型而寫碼。總信號比側信號耗費相對更多的位元。PS寫碼藉由將L/R信號變換成總信號及一組旁參數而減少每一子頻帶或頻帶中之冗餘。旁參數可指示聲道間強度差(IID)、聲道間相位差(IPD)、聲道間時差(ITD)、旁或殘餘預測增益,等。總信號為經寫碼之波形且與側參數一起傳輸。在混合型系統中,旁聲道可在較低頻帶中經波形寫碼(例如,小於2千赫茲(kHz))且在較高頻帶中經PS寫碼(例如,大於或等於2kHz),其中聲道間相位保持在感知上不重要。在一些實施中,PS寫碼亦可在波形寫碼之前用於較低頻帶中以減少聲道間冗餘。
可在頻域或子頻帶域中進行MS寫碼及PS寫碼。在一些實例中,左聲道及右聲道可不相關。舉例而言,左聲道及右聲道可包括不相關之合成信號。當左聲道及右聲道不相關時,MS寫碼、PS寫碼或兩者之寫碼效率可接近於雙單聲道寫碼之寫碼效率。
取決於記錄組態,可在左聲道與右聲道之間存在時間失配以及其他空間效果(諸如回聲及室內迴響)。若並不補償聲道之間的時間移位及相位失配,則總聲道及差聲道可含有減少與MS或PS技術相關之寫碼增益的可比能量。寫碼增益之減少可基於時間(或相位)移位之量。總信號及差信號之可比能量可限制聲道經時間移位但高度相關之某些訊框中的MS寫碼之使用。在立體聲寫碼中,中間聲道(例如,總聲道)及旁聲道(例如,差聲道)可基於以下公式產生:
M=(L+R)/2,S=(L-R)/2, 公式1
其中M對應於中間聲道,S對應於旁聲道,L對應於左聲道,且R對應於右聲道。
在一些情況係,中間聲道及旁聲道可基於以下公式產生:M=c(L+R),S=c(L-R), 公式2
其中c對應於頻率相關之複合值。基於公式1或公式2產生之中間聲道及旁聲道可被稱為執行「降混」演算法。基於公式1或公式2自中間聲道及側聲道而產生左聲道及右聲道之反向程序可被稱為執行「升混」演算法。
在一些情況中,中間聲道可係基於其他公式,諸如:M=(L+gDR)/2,或 公式3
M=g1L+g2R 公式4
其中g1+g2=1.0,且其中gD為增益參數。在其他實例中,降混可在頻帶中執行,其中中間(b)=c1L(b)+c2R(b),其中c1及c2為複數,其中旁(b)=c3L(b)-c4R(b),且其中c3及c4為複數。
用以對於特定訊框在MS寫碼或雙單聲道寫碼之間選擇的特用方法可包括產生中間聲道及旁聲道,計算中間聲道及旁聲道之能量,及基於該等能量判定是否執行MS寫碼。舉例而言,可回應於旁聲道與中間聲道之能量比小於臨限值之判定執行MS寫碼。為了說明,若右聲道經移位至少第一時間(例如,約0.001秒或在48kHz下48個樣本),則針對有聲語音訊框,中間聲道之第一能量(對應於左信號及右信號之總和)可與旁聲道之第二能量(對應於左信號與右信號之間的差)相當。當第一能量與第二能量相當時,較高數目之位元可用於編碼旁聲道,由此減少相對於雙單聲道寫碼之MS寫碼的寫碼效能。可因此在第一能量與第二能量相當時使用雙單寫
碼(例如,在第一能量及第二能量之比大於或等於臨限值時)。在一替代途徑中,可基於左聲道與右聲道之臨限值及正規化交叉相關值之比較來在MS寫碼與雙單聲道寫碼之間決定何者用於特定訊框。
在一些實例中,編碼器可判定指示第一音訊信號與第二音訊信號之間的時間失配量之失配值。如本文所使用,「時間移位值」、「移位值」及「失配值」可被互換地使用。舉例而言,編碼器可判定指示第一音訊信號相關於第二音訊信號之移位(例如,時間失配)的時間移位值。移位值可對應於第一音訊信號在第一麥克風處之接收與第二音訊信號在第二麥克風處之接收之間的時間延遲之量。另外,編碼器可在逐框之基礎上(例如,基於每一20毫秒(ms)話語/音訊訊框)判定移位值。舉例而言,移位值可對應於第二音訊信號之第二框架相對於第一音訊信號之第一框延遲之一時間量。替代地,移位值可對應於第一音訊信號之第一訊框相對於第二音訊信號之第二訊框延遲之一時間量。
當聲源距第一麥克風之距離比距第二麥克風之距離更近時,第二音訊信號之訊框可相對於第一音訊信號之訊框經延遲。在此情況下,第一音訊信號可被稱為「參考音訊信號」或「參考聲道」且經延遲第二音訊信號可被稱為「目標音訊信號」或「目標聲道」。替代地,當聲源距離第二麥克風之距離比距第一麥克風之距離更近時,第一音訊信號之訊框可相對於第二音訊信號之訊框經延遲。在此情況下,第二音訊信號可被稱為參考音訊信號或參考聲道,且經延遲第一音訊信號可被稱為目標音訊信號或目標聲道。
視聲源(例如,講話者)位於會議室或遠程呈現室內之位置及聲源(例如,講話者)位置如何相對於麥克風改變而定,參考聲道及目標聲道可自
一個訊框改變至另一訊框;類似地,時間失配值亦可自一個訊框改變至另一訊框。然而,在一些實施中,移位值可始終為正,以指示「目標」聲道相對於「參考」聲道之延遲的量。另外,移位值可對應於一「無關聯移位(non-causal shift)」值,經延遲目標聲道藉由該「無關聯移位」值在時間上「經拉回」,以使得目標聲道與「參考」聲道在編碼器處對準(例如,最大限度地對準)。可對參考聲道及經無關聯移位之目標聲道執行判定中間聲道及旁聲道之降混演算法。
編碼器可基於參考音訊聲道及應用於目標音訊聲道之複數個移位值而判定移位值。舉例而言,可在第一時間(m1)處接收參考音訊聲道之第一訊框X。可在對應於第一移位值之第二時間(n1)處接收目標音訊聲道之第一特定圖框Y,(例如)shift1=n1-m1。另外,可在第三時間(m2)接收參考音訊聲道之第二訊框。可在對應於第二移位值之第四時間(n2)處接收目標音訊聲道之第二特定圖框Y,(例如)shift2=n2-m2。
器件可以第一取樣速率(例如,32kHz取樣速率(亦即,640個樣本每訊框))進行成框或緩衝演算法,以產生訊框(例如,20ms樣本)。回應於判定第一音訊信號之第一訊框及第二音訊信號之第二訊框同時到達器件,編碼器可估計移位值(例如,shift1)為等於零樣本。可在時間上對準左聲道(例如,對應於第一音訊信號)及右聲道(例如,對應於第二音訊信號)。在一些狀況下,即使當對準時,左聲道及右聲道可歸因於各種原因(例如麥克風校準)在能量方面存在不同。
在一些實例中,左聲道及右聲道可由於各種原因(例如,與麥克風中的另一者相比,聲源(諸如講話者)可更接近麥克風中的一者,且兩個麥克風相隔距離可大於臨限值(例如,1至20厘米)距離)在時間上未對準。聲源
相對於麥克風之部位可在第一聲道及第二聲道中引入不同延遲。另外,在第一聲道與第二聲道之間可存在增益差、能量差或位準差。
在一些實例中,在存在超過兩個聲道之情況下,參考聲道最初基於聲道之位準或能量而被選擇,且隨後基於不同聲道對之間的時間失配值(例如,t1(ref,ch2),t2(ref,ch3),t3(ref,ch4),…t3(ref,chN))而被改進,其中ch1為最初參考聲道且t1(.)、t2(.)等為估計失配值之函數。若所有時間失配值為正,則ch1被視為參考聲道。若失配值中之任一者為負值,則參考聲道經重組態成與產生負值的失配值相關聯的聲道且上述過程繼續直至實現參考聲道之最佳選擇(亦即,基於最大限度地去相關最大數目之旁聲道)為止。遲滯可用以克服參考聲道選擇中之任何急劇變化。
在一些實例中,當多個講話者交替地講話時(例如,在不重疊情況下),音訊信號自多個聲源(例如,講話者)到達麥克風之時間可變化。在此情況下,編碼器可基於講話者來動態調整時間移位值,以識別參考聲道。在一些其他實例中,多個講話者可同時講話,取決於哪個講話者最大聲、距麥克風最近等,此可產生變化之時間移位值。在此情況下,參考及目標聲道之識別可基於當前訊框中之變化之時間移位值、先前訊框中之經估計時間失配值,及第一及第二音訊信號的能量(或時間演進)。
在一些實例中,當兩種信號可能展示較少(例如,無)相關時,可合成或人工產生第一音訊信號及第二音訊信號。應理解,本文所描述之實例為說明性且可在類似或不同情境中判定第一音訊信號與第二音訊信號之間的關係中具指導性。
編碼器可基於第一音訊信號之第一訊框及第二音訊信號之複數個訊框的比較產生比較值(例如,差值或交叉相關值)。複數個訊框之每一訊框
可對應於特定移位值。編碼器可基於比較值產生第一經估計移位值。舉例而言,第一經估計移位值可對應於指示第一音訊信號之第一訊框與第二音訊信號之對應第一訊框之間的較高時間類似性(或較低差)之比較值。
編碼器可藉由在多個階段中改進一系列經估計移位值而判定最終移位值。舉例而言,編碼器可首先基於自第一音訊信號及第二音訊信號之經立體聲預處理及經重取樣版本產生的比較值而估計「暫訂」移位值。編碼器可生成與臨近於經評估之「暫訂」移位值相關之移位值的內插比較值。編碼器可基於內插比較值判定第二經估計「內插」移位值。舉例而言,第二經估計「內插」移位值可對應於指示相較於剩餘內插比較值及第一經估計「暫訂」移位值之較高時間相似性(或較小差)的特定內插比較值。若當前訊框(例如,第一音訊信號之第一訊框)之第二經估計「內插」移位值不同於先前訊框(例如,先於第一訊框之第一音訊信號的訊框)之最終移位值,則當前訊框之「內插」移位值經進一步「修正」,以改良第一音訊信號與經移位第二音訊信號之間的時間相似性。特定而言,藉由在當前訊框之第二經評估「內插」移位值及先前訊框之最終經評估移位值周圍搜尋,第三經評估「修正」移位值可對應於時間相似性之較精確量測值。第三經估計「修正」移位值經進一步調節以藉由限制訊框之間的移位值中的任何偽改變來估計最終移位值,且經進一步控制以在如本文所描述之兩個相繼(或連續)訊框中不將負移位值切換至正移位值(或反之亦然)。
在一些實例中,編碼器可避免在連續訊框中或相鄰訊框中在正移位值與負移位值之間切換或反之亦然。舉例而言,編碼器可基於第一訊框之經估計「內插」或「修正」移位值及先於第一訊框之特定訊框中的對應經估計「內插」或「修正」或最終移位值將最終移位值設定成指示無時間移
位之特定值(例如,0)。為了說明,回應於判定當前訊框之經估計「暫訂」或「內插」或「修正」移位值中之一者為正且先前訊框(例如,先於第一訊框之訊框)之經估計「暫訂」或「內插」或「修正」或「最終」經估計移位值中之另一者為負,編碼器可設定當前訊框(例如,第一訊框)之最終移位值以指示無時間移位,亦即shift1=0。替代地,為回應當前訊框之經估計「暫訂」或「內插」或「修正」移位值中之一者為負且先前訊框(例如,先於第一訊框之訊框)之經估計「暫訂」或「內插」或「修正」或「最終」經估計移位值中之另一者為正的判定,編碼器亦可設定當前訊框(例如,第一訊框)之最終移位值以指示無時間性移位,亦即shift1=0。
應注意,在一些實施中,可在變換域中執行最終移位值之估計,其中可在頻域中估計聲道間交叉相關性。作為一實例,最終移位值之估計可很大程度上基於廣義交叉相關性相位變換(GCC-PHAT)演算法。
編碼器可基於移位值來選擇第一音訊信號或第二音訊信號之訊框作為「參考」或「目標」。舉例而言,回應於判定最終移位值為正,編碼器可產生參考聲道或具有指示第一音訊信號為「參考」聲道且第二音訊信號為「目標」聲道之第一值(例如,0)的信號指示符。替代地,回應於判定最終移位值為負,編碼器可產生參考聲道,或具有指示第二音訊信號為「參考」聲道且第一音訊信號為「目標」聲道之第二值(例如,1)的信號指示符。
編碼器可估計與參考聲道及無關聯經移位目標聲道相關聯之相對增益(例如,相對增益參數)。舉例而言,回應於判定最終移位值為正,編碼器可估計增益值以正規化或均衡第一音訊信號相對於偏移了無關聯移位值(例如,最終移位值之絕對值)之第二音訊信號的能量或功率位準。替代
地,為回應判定最終移位值為負,編碼器可估計增益值以正規化或均衡第一音訊信號相對於第二音訊信號的功率或振幅位準。在一些實例中,編碼器可估計一增益值以正規化或均衡「參考」聲道相對於無關聯經移位「目標」聲道之振幅或功率位準。在其他實例中,編碼器可基於相對於目標聲道(例如,未移位目標聲道)之參考聲道估計增益值(例如,一相對增益值)。
編碼器可基於參考聲道、目標聲道、無關聯移位值及相對增益參數產生至少一經編碼信號(例如,一中間聲道、一旁聲道或兩者)。在其他實施中,編碼器可基於參考聲道及經時間失配調整之目標聲道產生至少一經編碼信號(例如,一中間聲道、一旁聲道或兩者)。旁聲道可對應於第一音訊信號之第一訊框的第一樣本與第二音訊信號之一所選擇訊框的所選擇樣本之間的一差。編碼器可基於最終移位值選擇所選擇之訊框。由於第一樣本與所選擇之樣本之間的減小之差,相比於對應於第二音訊信號之訊框(與第一訊框同時由器件接收)的第二音訊信號之其他樣本,更少的位元可用於編碼側聲道信號。器件之一傳輸器可傳輸該至少一個經編碼信號、該無關聯移位值、該相對增益參數、該參考聲道或信號指示符或其組合。
編碼器可基於參考聲道、目標聲道、無關聯移位值、相對增益參數、第一音訊信號之一特定訊框之低頻帶參數、特定訊框之高頻帶參數或其一組合產生至少一經編碼信號(例如,一中間聲道、一旁聲道或兩者)。特定訊框可先於第一訊框。來自一或多個前面訊框的某些低頻帶參數、高頻帶參數或其組合可用於編碼第一訊框之一中間聲道、一旁聲道或兩者。基於低頻帶參數、高頻帶參數或其組合編碼中間聲道、旁聲道或兩者可包括無關聯移位值及聲道間相對增益參數之估計。低頻帶參數、高頻帶參數
或其組合可包括一音調參數、一語音參數、一寫碼器類型參數、一低頻帶能量參數、一高頻帶能量參數、一傾角參數、一音調增益參數、一FCB增益參數、一寫碼模式參數、一語音活動參數、一雜訊估計參數、一信號雜訊比參數、一共振峰成形參數、一語音/音樂決策參數、無關聯移位、聲道間增益參數或其組合。器件之傳輸器可傳輸至少一個經編碼信號、無關聯移位值、相對增益參數、參考聲道(或信號)指示符或其組合。
根據一些編碼實施,編碼器可將左音訊聲道及對應右音訊聲道變換至頻域,以分別產生左頻域聲道及右頻域聲道。編碼器可將頻域聲道降混以產生中間聲道。反變換可應用於中間聲道以產生時域中間聲道,且低頻帶編碼器可編碼時域中間聲道之低頻帶部分以產生經編碼低頻帶中間聲道。中間聲道頻寬擴展(BWE)編碼器可產生中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀、增益訊框等)。在一些實施中,中間聲道BWE編碼器基於時域中間聲道及經編碼低頻帶中間聲道之激勵產生中間聲道BWE參數。編碼器可產生包括經編碼低頻帶中間聲道及中間聲道BWE參數之位元串流。
編碼器亦可自頻域聲道(例如,左頻域聲道及右頻域聲道)提取立體聲參數(例如,離散傅立葉變換(DFT)降混參數)。立體聲參數可包括頻域增益參數(例如,側邊增益或聲道間位準差(ILD))、聲道間相位差(IPD)參數、立體聲充填增益等。立體聲參數可插入(例如,包括或編碼)於位元串流中,且位元串流可自編碼器傳輸至解碼器。根據一個實施,立體聲參數可包括聲道間BWE(ICBWE)增益映射參數。然而,ICBWE增益映射參數可相對於其他立體聲參數略「冗餘」。因此,為減少寫碼複雜性及冗餘傳輸,可能不會自頻域聲道提取ICBWE增益映射參數。舉例而言,編碼器
可旁路自頻域聲道判定ICBWE增益參數。
當自編碼器接收位元串流時,解碼器可解碼經編碼低頻帶中間聲道以產生低頻帶中間信號及低頻帶中間激勵信號。可使用低頻帶中間聲道激勵解碼(自編碼器接收之)中間聲道BWE參數,以產生經合成高頻帶中間信號。可藉由將ICBWE增益映射參數應用於經合成高頻帶中間信號來產生左高頻帶聲道及右高頻帶聲道。然而,因為並非包括ICBWE增益映射參數作為位元串流之部分,所以解碼器可基於頻域增益參數(例如,側邊增益或ILD)產生ICBWE增益映射參數。解碼器亦可基於高頻帶中間合成信號、低頻帶中間合成(或激勵)信號及低頻帶側(例如,殘餘預測)合成信號產生ICBWE增益映射參數。
舉例而言,解碼器可自位元串流提取頻域增益參數,且選擇與經合成高頻帶中間信號之頻率範圍相關聯的頻域增益參數。為了說明,對於寬頻寫碼,經合成高頻帶中間信號可具有介於6.4千赫茲(kHz)與8kHz之間的頻率範圍。若特定頻域增益參數與介於5.2KHz與8.56KHz之間的頻率範圍相關聯,則可選擇特定頻域增益參數以產生ICBWE增益映射參數。在另一實例中,若一或多組頻域增益參數與一或多組頻率範圍(例如6.0-7.0kHz、7.0-8.0kHz)相關聯,則選擇一或多組立體聲降混/升混增益參數以產生ICBWE增益映射參數。根據一個實施,可基於所選擇頻域增益參數(sidegain)使用以下實例來判定ICBWE增益映射參數(gsMapping):ICBWE gain Mapping parameter,gsMapping=(1-sidegain)
一旦ICBWE增益映射參數得以判定(例如,提取),則左高頻帶聲道及右高頻帶聲道便可使用增益縮放操作進行合成。舉例而言,經合成高頻帶中間信號可藉由ICBWE增益映射參數按比例縮放以產生目標高頻帶聲
道,且經合成高頻帶中間信號可藉由經修改ICBWE增益映射參數(例如,
2-gsMapping或)按比例縮放以產生參考高頻帶聲道。
可基於與低頻帶中間信號之頻域版本相關聯的升混操作產生左低頻帶聲道及右低頻帶聲道。舉例而言,低頻帶中間信號可轉換成頻域,立體聲參數可用以將低頻帶中間信號之頻域版本升混以產生頻域左低頻帶聲道及右低頻帶聲道,且可對頻域左低頻帶聲道及右低頻帶聲道執行反變換操作以分別產生左低頻帶聲道及右低頻帶聲道。左低頻帶聲道可與左高頻帶聲道合併以產生實質上類似於左音訊聲道之左聲道,且右低頻帶聲道可與右高頻帶聲道合併以產生(亦即,實質上類似於右音訊聲道之右聲道。
因此,可藉由省略取決於輸入內容頻寬在編碼器處提取及傳輸ICBWE增益映射參數來減少編碼複雜性及傳輸頻寬。舉例而言,可能不會針對WB多聲道寫碼傳輸ICBWE增益映射參數,然而,該等參數針對超寬頻或全頻帶多聲道寫碼進行傳輸。詳言之,可基於包括於位元串流中之其他立體聲參數(例如,頻域增益參數)在解碼器針對寬頻信號產生ICBWE增益映射參數。在其他實施中,亦可基於高頻帶(亦即,BWE)中間合成信號、低頻帶中間合成(或激勵)信號及低頻帶側(例如,殘餘預測)合成信號產生ICBWE增益映射參數。
參看圖1,揭示一系統之特定說明性實例且該系統整體指定為100。系統100包括經由網路120以通信方式耦接至第二器件106之第一器件104。網路120可包括:一或多個無線網路、一或多個有線網路或其組合。
第一器件104可包括編碼器114、傳輸器110、一或多個輸入介面112或其組合。輸入介面112之第一輸入介面可耦接至第一麥克風146。一或
多個輸入介面112之第二輸入介面可耦接至第二麥克風148。第一器件104亦可包括經組態以儲存分析資料191之記憶體153。第二器件106可包括解碼器118。解碼器118可包括聲道間頻寬擴展(ICBWE)增益映射參數產生器322。第二器件106可耦接至第一揚聲器142、第二揚聲器144或兩者。
在操作期間,第一器件104可經由第一輸入介面自第一麥克風146接收第一音訊聲道130,並可經由第二輸入介面自第二麥克風148接收第二音訊聲道132。第一音訊聲道130可對應於右聲道信號或左聲道信號中之一者。第二音訊聲道132可對應於右聲道信號或左聲道信號中之另一者。為便於描述及說明,除非另行說明,否則第一音訊聲道130對應於左音訊聲道,且第二音訊聲道132對應於右音訊聲道。與第二麥克風148相比,聲源152(例如,使用者、揚聲器、環境雜訊、樂器等)可更接近第一麥克風146。因此,相比於經由第二麥克風148,來自聲源152之音訊信號可在較早時間經由第一麥克風146在輸入介面112處接收。經由多個麥克風之多聲道信號獲取中的此自然延遲可在第一音訊聲道130與第二音訊聲道132之間引入時間移位。
編碼器114可經組態以判定指示音訊聲道130、132之間的時間移位之移位值(例如,最終移位值116)。最終移位值116可儲存於記憶體153中作為分析資料191,且經編碼至立體聲降混/升混參數位元串流290中作為立體聲參數。編碼器114亦可經組態以將音訊聲道130、132變換為頻域以產生頻域音訊聲道。頻域音訊聲道可經降混以產生中間聲道,且中間聲道之時域版本之低頻帶部分可經編碼至低頻帶中間聲道位元串流292中。編碼器114亦可基於時域中間聲道及經編碼低頻帶中間聲道之激勵產生中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀、增益訊框等)。編碼
器114可編碼中間聲道BWE參數作為高頻帶中間聲道BWE位元串流294。
編碼器114亦可自頻域音訊聲道提取立體聲參數(例如,離散傅立葉變換(DFT)降混參數)。立體聲參數可包括頻域增益參數(例如,側邊增益)、聲道間相位差(IPD)參數、立體聲充填增益等。立體聲參數可插入於立體聲降混/升混參數位元串流290中。因為ICBWE增益映射參數可使用其他立體聲參數進行判定或估計,所以可能不會自頻域音訊聲道提取ICBWE增益映射參數以減少寫碼複雜性及冗餘傳輸。傳輸器可經由網路120將立體聲降混/升混參數位元串流290、低頻帶中間聲道位元串流292及高頻帶中間聲道BWE位元串流294傳輸至第二器件106。關於圖2更詳細地描述與編碼器114相關聯之操作。
解碼器118可基於立體聲降混/升混參數位元串流290、低頻帶中間聲道位元串流292及高頻帶中間聲道BWE位元串流294執行解碼操作。解碼器118可解碼低頻帶中間聲道位元串流292以產生低頻帶中間信號及低頻帶中間激勵信號。高頻帶中間聲道BWE位元串流294可使用低頻帶中間激勵信號進行解碼以產生經合成高頻帶中間信號。可藉由將ICBWE增益映射參數應用於經合成高頻帶中間信號來產生左高頻帶聲道及右高頻帶聲道。然而,因為並非包括ICBWE增益映射參數作為位元串流之部分,所以解碼器118可基於與立體聲降混/升混參數位元串流290相關聯之頻域增益參數產生ICBWE增益映射參數。
舉例而言,解碼器118可包括經組態以自立體聲降混/升混參數位元串流290提取頻域增益參數且經組態以選擇與經合成高頻帶中間信號之頻率範圍相關聯之頻域增益參數的ICBWE空間增益映射參數產生器322。為了說明,對於寬頻寫碼,經合成高頻帶中間信號可具有介於6.4千赫茲
(kHz)與8kHz之間的頻率範圍。若特定頻域增益參數與介於5.2KHz與8.56KHz之間的頻率範圍相關聯,則可選擇特定頻域增益參數以產生ICBWE增益映射參數。根據一個實施,可基於所選擇頻域增益參數(sidegain)使用以下等式來判定ICBWE增益映射參數(gsMapping):
一旦ICBWE增益映射參數得以判定,則左高頻帶聲道及右高頻帶聲道便可使用增益縮放操作進行合成。可基於與低頻帶中間信號之頻域版本相關聯的升混操作產生左低頻帶聲道及右低頻帶聲道。左低頻帶聲道可與左高頻帶聲道合併以產生實質上類似於第一音訊聲道130之第一輸出聲道126(例如,左聲道),且右低頻帶聲道可與右高頻帶聲道合併以產生實質上類似於第二音訊聲道132之第二輸出聲道128(例如,右聲道)。第一揚聲器142可輸出第一輸出聲道126,且第二揚聲器144可輸出第二輸出聲道128。關於圖3更詳細地描述與解碼器118相關聯之操作。
因此,可藉由省略在編碼器處提取及傳輸ICBWE增益映射參數來減少編碼複雜性及傳輸頻寬。ICBWE增益映射參數可在解碼器處基於包括於位元串流中之其他立體聲參數(例如,頻域增益參數)而產生。
參考圖2,展示編碼器114之特定實施。編碼器114包括變換單元202、變換單元204、立體聲提示估計器206、中間聲道產生器208、反變換單元210、中間聲道編碼器212及中間聲道BWE編碼器214。
第一音訊聲道130(例如,左聲道)可提供至變換單元202,且第二音訊聲道132(例如,右聲道)可提供至變換單元204。變換單元202可經組態以對第一音訊聲道130執行開窗操作及變換操作以產生第一頻域音訊聲道Lfr(b)252,且變換單元204可經組態以對第二音訊聲道132執行開窗操作
及變換操作以產生第二頻域音訊聲道Rfr(b)254。舉例而言,變換單元202、204可將離散傅立葉變換(DFT)操作、快速傅立葉變換(FFT)操作、MDCT操作等分別應用於音訊聲道130、132。根據一些實施,正交鏡像濾波器組(QMF)操作可用以將音訊聲道130、132分裂成多個子頻帶。第一頻域音訊聲道252被提供至立體聲提示估計器206,且被提供至中間聲道產生器208。第二頻域音訊聲道254亦被提供至立體聲提示估計器206,且被提供至中間聲道產生器208。
立體聲提示估計器206可經組態以自頻域音訊聲道252、254提取(例如,產生)立體聲提示以產生立體聲降混/升混參數位元串流290。經編碼成立體聲降混/升混參數位元串流290的立體聲提示(例如,DFT降混參數)之非限制性實例可包括頻域增益參數(例如,側邊增益)、聲道間相位差(IPD)參數、立體聲充填或殘餘預測增益等。根據一個實施,立體聲提示可包括ICBWE增益映射參數。然而,ICBWE增益映射參數可基於其他立體聲提示進行判定或估計。因此,為減少寫碼複雜性及冗餘傳輸,可能不會提取ICBWE增益映射參數(例如,不會將ICBWE增益映射參數編碼成立體聲降混/升混參數位元串流290)。立體聲提示可插入(例如,包括或編碼)於立體聲降混/升混參數位元串流290中,且立體聲降混/升混參數位元串流290可自編碼器114傳輸至解碼器118。立體聲提示亦可提供至中間聲道產生器208。
中間聲道產生器208可基於頻域第一頻域音訊聲道252及第二頻域音訊聲道254產生頻域中間聲道Mfr(b)256。根據一些實施,頻域中間聲道Mfr(b)256可亦基於立體聲提示而產生。如下為一些基於頻域音訊聲道252、254及立體聲提示產生頻域中間聲道256的方法。
Mfr(b)=(Lfr(b)+Rfr(b))/2
Mfr(b)=c1(b)*Lfr(b)+c2*Rfr(b),其中c1(b)及c2(b)為每頻帶降混參數。
在一些實施中,降混參數c1(b)及c2(b)係基於立體聲提示。舉例而言,在IPD進行估計的中間側降混的一個實施中,c1(b)=(cos(-γ)-i*sin(-γ))/20.5且c2(b)=(cos(IPD(b)-γ)+i*sin(IPD(b)-γ))/20.5,其中i為表示平方根-1之虛數。在其他實例中,中間聲道亦可基於移位值(例如,最終移位值116)。在此等實施中,左聲道及右聲道可在頻域中間聲道之估計之前基於移位值之估計而在時間上對準。在一些實施中,可在時域中直接對第一及第二音訊聲道130、132實施此時間對準。在其他實施中,可藉由應用相位旋轉以獲得時間移位之效果,來在變換域中對Lfr(b)及Rfr(b)執行時間對準。在一些實施中,可執行聲道之時間對準,作為對目標聲道執行之無關聯移位操作。而在其他實施中,可分別地對參考聲道執行時間對準作為關聯移位操作,或對參考/目標聲道執行時間對準作為關聯/無關聯移位操作。在一些實施中,可俘獲關於參考及目標聲道之資訊作為參考聲道指示符(其可基於最終移位值116之正負號進行估計)。在一些實施中,可包括關於參考聲道指示符及移位值之資訊作為編碼器之位元串流輸出的部分。
頻域中間聲道256被提供至反變換單元210。反變換單元210可對頻域中間聲道256執行反變換操作以產生時域中間聲道M(t)258。因此,頻域中間聲道256可經反變換至時域,或經變換至MDCT域以供寫碼。時域中間聲道258被提供至中間聲道編碼器212且被提供至中間聲道BWE編碼器214。
中間聲道編碼器212可經組態以編碼時域中間聲道258之低頻帶部分以產生低頻帶中間聲道位元串流292。低頻帶中間聲道位元串流292可自編碼器114傳輸至解碼器118。中間聲道編碼器212可經組態以產生低頻帶中間聲道之低頻帶中間聲道激勵260。低頻帶中間聲道激勵260被提供至中間聲道BWE編碼器214。
中間聲道BWE編碼器214可基於時域中間聲道258及低頻帶中間聲道激勵260產生中間聲道BWE參數(例如,線性預測係數(LPC)、增益形狀、增益訊框等)。中間聲道BWE編碼器214可將中間聲道BWE參數編碼成高頻帶中間聲道BWE位元串流294。高頻帶中間聲道BWE位元串流294可自編碼器114傳輸至解碼器116。
根據一個實施,中間聲道BWE編碼器214可基於時域頻寬擴展(TBE)模型使用高頻帶寫碼演算法編碼中間高頻帶聲道。中間高頻帶聲道之TBE寫碼可產生一組LPC參數、高頻帶整體增益參數及高頻帶時間增益形狀參數。中間聲道BWE編碼器214可產生對應於中間高頻帶聲道的一組中間高頻帶增益參數。舉例而言,中間聲道BWE編碼器214可基於LPC參數產生經合成中間高頻帶聲道,且可基於中間高頻帶信號與經合成中間高頻帶信號之比較產生中間高頻帶增益參數。如本文中所描述,中間聲道BWE編碼器214亦可產生至少一個調整增益參數、至少一個調整頻譜形狀參數或其一組合。中間聲道BWE編碼器214可傳輸LPC參數(例如,中間高頻帶LPC參數)、中間高頻帶增益參數集合、至少一調整增益參數、至少一頻譜形狀參數或其一組合。LPC參數、中間高頻帶增益參數或兩者可對應於中間高頻帶信號之經編碼版本。
因此,編碼器114可產生立體聲降混/升混參數位元串流290、低頻帶
中間聲道位元串流292及高頻帶中間聲道BWE位元串流294。位元串流290、292、294可經多工至單個位元串流中,且該單個位元串流可傳輸至解碼器118。為了減少寫碼複雜性及冗餘傳輸,不將ICBWE增益映射參數編碼成立體聲降混/升混參數位元串流290。如關於圖3詳細描述,可基於其他立體聲提示(例如,DFT降混立體聲參數)在解碼器118產生ICBWE增益映射參數。
參考圖3,展示解碼器118之特定實施。解碼器118包括低頻帶中間聲道解碼器302、中間聲道BWE解碼器304、變換單元306、ICBWE空間平衡器308、立體聲升混器310、反變換單元312、反變換單元314、組合器316及移位器320。
低頻帶中間聲道位元串流292可自圖2之編碼器114被提供至低頻帶中間聲道解碼器302。低頻帶中間聲道解碼器302可經組態以解碼低頻帶中間聲道位元串流292以產生低頻帶中間信號350。低頻帶中間聲道解碼器302亦可經組態以產生低頻帶中間信號350之激勵。舉例而言,低頻帶中間聲道解碼器302可產生低頻帶中間激勵信號352。低頻帶中間信號350被提供至變換單元306,且低頻帶中間激勵信號352被提供至中間聲道BWE解碼器304。
變換單元306可經組態以對低頻帶中間信號350執行變換操作以產生頻域低頻帶中間信號354。舉例而言,變換單元306可將低頻帶中間信號350自時域變換至頻域。頻域低頻帶中間信號354被提供至立體聲升混器310。
立體聲升混器310可經組態以使用自立體聲降混/升混參數位元串流290提取之立體聲提示對頻域低頻帶中間信號354執行升混操作。舉例而
言,立體聲降混/升混參數位元串流290可被(自編碼器114)提供至立體聲升混器310。立體聲升混器310可將與立體聲降混/升混參數位元串流290相關聯之立體聲提示用以升混頻域低頻帶中間信號354且產生第一頻域低頻帶聲道356及第二頻域低頻帶聲道358。第一頻域低頻帶聲道356被提供至反變換單元312,且第二頻域低頻帶聲道358被提供至反變換單元314。
反變換單元312可經組態以對第一頻域低頻帶聲道356執行反變換操作以產生第一低頻帶聲道360(例如,時域聲道)。第一低頻帶聲道360(例如,左低頻帶聲道)被提供至組合器316。反變換單元314可經組態以對第二頻域低頻帶聲道358執行反變換操作以產生第二低頻帶聲道362(例如,時域聲道)。第二低頻帶聲道362(例如,右低頻帶聲道)亦被提供至組合器316。
中間聲道BWE解碼器304可經組態以基於低頻帶中間激勵信號352及經編碼成高頻帶中間聲道BWE位元串流294之中間聲道BWE參數產生經合成高頻帶中間信號364。舉例而言,高頻帶中間聲道BWE位元串流294被(自編碼器114)提供至中間聲道BWE解碼器304。可藉由將中間聲道BWE參數應用於低頻帶中間激勵信號352在中間聲道BWE解碼器304執行合成操作。基於合成操作,中間聲道BWE解碼器304可產生經合成高頻帶中間信號364。經合成高頻帶中間信號364被提供至ICBWE空間平衡器308。在一些實施中,中間聲道BWE解碼器304可包括於ICBWE空間平衡器308中在其他實施中,ICBWE空間平衡器308可包括於中間聲道BWE解碼器304中。在一些特定實施中,可能不會顯式地判定中間聲道BWE參數,而是可能直接產生第一及第二高頻帶聲道。
立體聲降混/升混參數位元串流290被(自編碼器114)提供至解碼器
118。如圖2中所描述,ICBWE增益映射參數並非包括於被提供至解碼器118之位元串流(例如,立體聲降混/升混參數位元串流290)中。因此,為了使用ICBWE空間平衡器308產生第一高頻帶聲道366及第二高頻帶聲道,ICBWE空間平衡308(或解碼器118之另一組件)可基於被經編碼成立體聲降混/升混參數位元串流290之其他立體聲提示(例如,DFT立體聲參數)產生ICBWE增益映射參數332。
ICBWE空間平衡器308包括ICBWE增益映射參數產生器322。儘管ICBWE增益映射參數產生器322包括於ICBWE空間平衡器308中,但在其他實施中,ICBWE增益映射參數產生器322可包括於解碼器118之不同組件內、可位於解碼器118外部,或可為解碼器118之單獨組件。ICBWE增益映射參數產生器322包括提取器324及選擇器326。提取器324可經組態以自立體聲降混/升混參數位元串流290提取一或多個頻域增益參數328。選擇器326可經組態以選擇一組頻域增益參數330(自一或多個經提取頻域增益參數328)以供用於ICBWE增益映射參數332之產生。
所選擇頻域增益參數330可基於所選擇頻域增益參數330之頻率範圍與經合成高頻帶中間信號364之頻率範圍的頻譜近接性進行選擇。舉例而言,第一特定頻域增益參數之第一頻率範圍可與經合成高頻帶中間信號364之頻率範圍重疊第一量,且第二特定頻域增益參數之第二頻率範圍可
與經合成高頻帶中間信號364之頻率範圍重疊第二量。舉例而言,若第一量大於第二量,則可選擇第一特定頻域增益參數作為所選擇頻域增益參數330。在無具有與經合成高頻帶中間信號364之頻率範圍重疊之一頻率範圍的(經提取頻域增益參數328之)頻域增益參數的實施中,可選擇具有最接近經合成高頻帶中間信號364之頻率範圍之一頻率範圍的頻域增益參數作為所選擇頻域增益參數330。
作為頻域增益參數選擇之非限制性實例,對於寬頻寫碼,經合成高頻帶中間信號364可具有介於6.4千赫茲(kHz)與8kHz之間的頻率範圍。若頻域增益參數330與介於5.2KHz與8.56KHz之間的頻率範圍相關聯,則可選擇頻域增益參數330以產生ICBWE增益映射參數332。舉例而言,在當前實施中,頻帶數目(b)=9對應於介於5.28與8.56kHz之間的頻率範圍。由於該頻帶包括頻率範圍(6.4-8khz),因此此頻帶之sidegain可直接用以導出ICBWE增益映射參數322。在不存在橫跨對應於高頻帶(6.4-8kHz)之頻率範圍的頻帶情況下,可使用最接近高頻帶之頻率範圍的頻帶。在存在對應於高頻帶之多個頻率範圍的一實例實施中,隨後根據頻寬將頻率範圍中之每一者的側邊增益加權以產生最終ICBWE增益映射參數,亦即gsMapping=權重[b]*sidegain[b]+權重[b+1]*sidegain[b+1]。
在選擇器326選擇頻域增益參數330之後,ICBWE增益映射參數產生器322可使用頻域增益參數330產生ICBWE增益映射參數332。根據一個實施,可基於所選擇頻域增益參數(sidegain)330使用以下等式來判定ICBWE增益映射參數(gsMapping)332:gsMapping=(1-sidegain)
一旦ICBWE增益映射參數產生器322產生ICBWE增益映射參數(gsMapping)322,ICBWE空間平衡器308便可產生第一高頻帶聲道366及第二高頻帶聲道368。舉例而言,ICBWE空間平衡器308可經組態以基於ICBWE增益映射參數(gsMapping)322對經合成高頻帶中間信號364執行增益縮放操作以產生高頻帶聲道366。為了說明,ICBWE空間平衡器308可將經合成高頻帶中間信號364按比例縮放二與ICBWE增益映射參數332
之間的差(例如,2-gsMapping或),以產生第一高頻帶聲道
366(例如,左高頻帶聲道),且ICBWE空間平衡器308可將經合成高頻帶中間信號364按比例縮放ICBWE增益映射參數332,以產生第二高頻帶聲道368(例如,右高頻帶聲道)。高頻帶聲道366、368被提供至組合器316。為了用ICBWE增益映射最小化框間增益變體假影,當自第i個訊框之gsMapping參數變換至第(i+1)個訊框之gsMapping參數時,可在訊框邊界使用藉由逐漸變窄窗(例如,正弦(.)窗或三角窗)的疊加。
ICBWE參考聲道可用於組合器316處。舉例而言,組合器316可判定哪些高頻帶聲道366、368對應於左聲道且哪些高頻帶聲道366、368對應於右聲道。因此,可將參考聲道指示符提供至ICBWE空間平衡器308,以指示左高頻帶聲道對應於第一高頻帶聲道366抑或對應於第二高頻帶聲道368。組合器316可經組態以將第一高頻帶聲道366及第一低頻帶聲道360
組合以產生第一聲道370。舉例而言,組合器316可將左高頻帶聲道及左低頻帶聲道360組合以產生一左聲道。組合器316亦可經組態以將第二高頻帶聲道368及第二低頻帶聲道362組合以產生一第二聲道372。舉例而言,組合器316可將右高頻帶聲道及右低頻帶聲道組合以產生一右聲道。第一及第二聲道370、372被提供至移位器320。
作為一實例,可指定第一聲道為參考聲道,且可指定第二聲道為非參考聲道或「目標」聲道。因此,第二聲道372可經歷移位器320處的一移位操作。移位器320可自立體聲降混/升混參數位元串流290提取一移位值(例如,最終移位值116),且可將第二聲道372移位該移位值以產生第二輸出聲道128。移位器320可傳遞第一高頻帶聲道366作為第一輸出聲道126。在一些實施中,移位器320可經組態以對目標聲道執行關聯移位。在其他實施中,移位器320可經組態以對參考聲道執行無關聯移位。而在其他實施中,移位器320可經組態以分別對目標/參考聲道執行關聯/無關聯移位。可包括指示哪個聲道為目標聲道且哪個聲道為參考聲道的資訊作為所接收位元串流之部分。在一些實施中,移位器320可在時域中執行移位操作。在其他實施中,可在頻域中執行移位操作。在一些實施中,移位器320可包括於立體聲升混器310中。因此,可對低頻帶信號執行移位操作。
根據一個實施,移位操作可獨立於ICBWE操作。舉例而言,高頻帶之參考聲道指示符可能不會與用於移位器320之參考聲道指示符相同。為了說明,高頻帶之參考聲道(例如,與ICBWE操作相關聯之參考聲道)可不同於移位器320處的參考聲道。根據一些實施,可能不會在移位器320指定一參考聲道,且移位器320可經組態以移位聲道370、372兩者。
因此,可藉由省略在編碼器114處提取及傳輸ICBWE增益映射參數來減少編碼複雜性及傳輸頻寬。ICBWE增益映射參數332可在解碼器118基於包括於位元串流290中之其他立體聲參數(例如,頻域增益參數328)而產生。
參看圖4,展示基於自編碼器傳輸之頻域增益參數判定ICBWE映射參數之方法400。方法400可由圖1及圖3之解碼器118執行。
方法400包括在402處自編碼器接收位元串流。位元串流可包括至少低頻帶中間聲道位元串流、高頻帶中間聲道BWE位元串流及立體聲降混/升混參數位元串流。舉例而言,參考圖3,解碼器118可接收立體聲降混/升混參數位元串流290、低頻帶中間聲道位元串流292及高頻帶中間聲道BWE位元串流294。
方法400亦包括在404處解碼低頻帶中間聲道位元串流以產生低頻帶中間信號及低頻帶中間激勵信號。舉例而言,參考圖3,低頻帶中間聲道解碼器302可解碼低頻帶中間聲道位元串流292以產生低頻帶中間信號350。低頻帶中間聲道解碼器302亦可產生低頻帶中間激勵信號352。
方法400進一步包括在406處解碼高頻帶中間聲道BWE位元串流以基於低頻帶中間激勵信號之非線性諧波擴展且基於高頻帶聲道BWE參數產生經合成高頻帶中間信號。舉例而言,中間聲道BWE解碼器304可基於低頻帶中間激勵信號352及經編碼成高頻帶中間聲道BWE位元串流294之中間聲道BWE參數產生經合成高頻帶中間信號364。為了說明,可藉由將中間聲道BWE參數應用於低頻帶中間激勵信號352在中間聲道BWE解碼器304執行合成操作。基於合成操作,中間聲道BWE解碼器304可產生經合成高頻帶中間信號364。
方法400亦包括在408處基於自立體聲降混/升混參數位元串流提取之所選擇頻域增益參數判定用於經合成高頻帶中間信號的ICBWE增益映射參數。所選擇頻域增益參數可基於所選擇頻域增益參數之頻率範圍與經合成高頻帶中間信號之頻率範圍的頻譜近接性進行選擇。舉例而言,參考圖3,提取器可自立體聲降混/升混參數位元串流290提取頻域增益參數328,且選擇器326可選擇頻域增益參數330(自一或多個經提取頻域增益參數328)以供用於ICBWE增益映射參數332之產生。因此,根據一個實施,方法400亦可包括自立體聲參數位元串流提取一或多個頻域增益參數。所選擇頻域增益參數可選自一或多個頻域增益參數。
所選擇頻域增益參數330可基於所選擇頻域增益參數330之頻率範圍與經合成高頻帶中間信號364之頻率範圍的頻譜近接性進行選擇。為了說明,對於寬頻寫碼,經合成高頻帶中間信號364可具有介於6.4千赫茲(kHz)與8kHz之間的頻率範圍。若頻域增益參數330與介於5.2KHz與8.56KHz之間的頻率範圍相關聯,則可選擇頻域增益參數330以產生ICBWE增益映射參數332。
在選擇器326選擇頻域增益參數330之後,ICBWE增益映射參數產生器322可使用頻域增益參數330產生ICBWE增益映射參數332。根據一個實施,可基於所選擇頻域增益參數(sidegain)330使用以下等式來判定ICBWE增益映射參數(gsMapping)332:
方法400進一步包括在410處基於ICBWE增益映射參數對經合成高頻帶中間信號執行增益縮放操作以產生參考高頻帶聲道及目標高頻帶聲道。執行增益縮放操作可包括將經合成高頻帶中間信號按比例縮放ICBWE增
益映射參數以產生右高頻帶聲道。舉例而言,參考圖3,ICBWE空間平衡器308可將經合成高頻帶中間信號364按比例縮放ICBWE增益映射參數332,以產生第二高頻帶聲道368(例如,右高頻帶聲道)。執行增益縮放操作亦可包括將經合成高頻帶中間信號按比例縮放二與ICBWE增益映射參數之間的差,以產生左高頻帶聲道。舉例而言,參考圖3,ICBWE空間平衡器308可將經合成高頻帶中間信號364按比例縮放二與ICBWE增益映射參數332之差(例如,2-gsMapping),以產生第一高頻帶聲道366(例如,左高頻帶聲道)。
方法400亦包括在412處輸出第一音訊聲道及第二音訊聲道。第一音訊聲道可基於參考高頻帶聲道,且第二音訊聲道可基於目標高頻帶聲道。舉例而言,參考圖1,第二器件106可輸出第一輸出聲道126(例如,基於左聲道370之第一音訊聲道)及第二輸出聲道128(例如,基於右聲道372之第二音訊聲道)。
因此,根據方法400,可藉由省略在編碼器114處提取及傳輸ICBWE增益映射參數來減少編碼複雜性及傳輸頻寬。ICBWE增益映射參數332可在解碼器118基於包括於位元串流290中之其他立體聲參數(例如,頻域增益參數328)而產生。
參考圖5,描繪了器件(例如,無線通信器件)之特定說明性實例的方塊圖,且通常將該器件指定為500。在各種實施中,器件500可相比圖5中所說明的具有較多或較少組件。在說明性實施中,器件500可對應於圖1之第二器件106。在說明性實施中,器件500可執行參考圖1至圖4之系統及方法所描述之一或多個操作。
在一特定實施中,器件500包括處理器506(例如,中央處理單元
(CPU))。器件500可包括一或多個額外處理器510(例如,一或多個數位信號處理器(DSP))。處理器510可包括媒體(例如,語音及音樂)寫碼器-解碼器(編解碼器(CODEC))508及回音消除器512。媒體編解碼器508可包括圖1之解碼器118、編碼器114或該等兩者。解碼器118可包括ICBWE增益映射參數產生器322。
器件500可包括記憶體153及編解碼器534。儘管媒體編解碼器508經說明為處理器510之組件(例如,專用電路及/或可執行程式碼),但在其他實施中,媒體編解碼器508之一或多個組件(諸如解碼器118、編碼器114或兩者)可包括於處理器506、編解碼器534、另一處理組件或其組合中。
器件500可包括耦接至天線542之收發器590。器件500可包括耦接至顯示器控制器526之顯示器528。一或多個揚聲器548可耦接至編解碼器534。一或多個麥克風546可經由輸入介面592耦接至編解碼器534。在一特定實施中,揚聲器548可包括圖1之第一揚聲器142、第二揚聲器144,或其一組合。編解碼器534可包括數位至類比轉換器(DAC)502及類比至數位轉換器(ADC)504。
記憶體153可包括可由解碼器118、處理器506、處理器510、編解碼器534、器件500之另一處理單元或其一組合執行之指令560,以執行參考圖1至圖4所描述之一或多個操作。
舉例而言,指令560可為可執行的以使得處理器510解碼低頻帶中間聲道位元串流292以產生低頻帶中間信號350及低頻帶中間激勵信號352。指令560可進一步為可執行的以使得處理器510基於低頻帶中間激勵信號352解碼高頻帶中間聲道BWE位元串流294以產生經合成高頻帶中間信號364。指令560亦可為可執行的以使得處理器510基於自立體聲降混/升混參
數位元串流290提取之所選擇頻域增益參數330判定用於經合成高頻帶中間信號364的ICBWE增益映射參數332。所選擇頻域增益參數330可基於所選擇頻域增益參數330之頻率範圍與經合成高頻帶中間信號364之頻率範圍的頻譜近接性進行選擇。指令560可進一步為可執行的以使得處理器510基於ICBWE增益映射參數332對經合成高頻帶中間信號364執行增益縮放操作以產生第一高頻帶聲道366(例如,左高頻帶聲道)及第二高頻帶聲道368(例如,右高頻帶聲道)。指令560亦可為可執行的以使得處理器510產生第一輸出聲道326及第二輸出聲道328。
器件500之一或多個組件可藉由用以執行一或多個任務或其一組合之處理器執行指令經由專用硬體(例如,電路)實施。作為一實例,記憶體153或處理器506、處理器510及/或編解碼器534之一或多個組件可為記憶體器件,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可卸除式磁碟或光碟唯讀記憶體(CD-ROM)。記憶體器件可包括指令(例如,指令560),該等指令在由一電腦(例如,編解碼器534中之處理器、解碼器118、處理器506及/或處理器510)執行時可使得電腦執行參考圖1至圖4所描述之一或多個操作。作為一實例,記憶體153或處理器506、處理器510及/或編解碼器534中之一或多個組件可為包括指令(例如,指令560)之非暫時性電腦可讀媒體,當由電腦(例如,編解碼器534中之處理器、解碼器118、處理器506及/或處理器510)執行時,該等指令使得電腦執行參考圖1至圖4所描述之一或多個操作。
在一特定實施中,器件500可包括於系統級封裝或系統單晶片器件(例如,行動台數據機(MSM))522中。在一特定實施中,處理器506、處理器510、顯示器控制器526、記憶體153、編解碼器534及收發器590包括於系統級封裝或系統單晶片器件522中。在一特定實施中,諸如觸控螢幕及/或小鍵盤之輸入器件530及電源供應器544耦接至系統單晶片器件522。此外,在一特定實施中,如圖5中所說明,顯示器528、輸入器件530、揚聲器548、麥克風546、天線542及電力供應器544位於系統單晶片器件522外部。然而,顯示器528、輸入器件530、揚聲器548、麥克風546、天線542及電力供應器544中之每一者可耦接至系統單晶片器件522之組件,諸如介面或控制器。
器件500可包括:無線電話、行動通信器件、行動電話、智慧型電話、蜂巢式電話、膝上型電腦、桌上型電腦、電腦、平板電腦、機上盒、個人數位助理(PDA)、顯示器件、電視、遊戲控制台、音樂播放器、收音機、視訊播放器、娛樂單元、通信器件、固定位置資料單元、個人媒體播放器、數位視訊播放器、數位視訊光碟(DVD)播放器、調諧器、攝影機、導航器件、解碼器系統、編碼器系統或其任何組合。
在一特定實施中,本文中揭示之系統及器件的一或多個組件可整合於解碼系統或裝置(例如,其中的電子器件、編解碼器或處理器)、編碼系統或裝置,或該等兩者中。在其他實施中,本文所揭示之系統及器件之一或多個組件可整合至以下各者中:無線電話、平板電腦、桌上型電腦、膝上型電腦、機上盒、音樂播放器、視訊播放器、娛樂單元、電視、遊戲控制台、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元、個人媒體播放器或另一類型之器件。
應注意,藉由本文所揭示之系統及器件之一或多個組件執行的各種功能經描述為藉由某些組件或模組執行。組件及模組之此劃分僅用於說明。在一替代性實施中,由特定組件或模組執行之功能可被劃分於多個組件或模組之中。此外,在替代性實施中,兩個或多於兩個組件或模組可被整合至單個組件或模組中。每一組件或模組可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、DSP、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施。
結合所描述之實施,裝置包括用於自編碼器接收位元串流的構件。位元串流可包括低頻帶中間聲道位元串流、中間聲道BWE位元串流及立體聲參數位元串流。舉例而言,用於接收的該構件可包括圖1之第二器件106、圖5之天線542、圖5之收發器590、一或多個其他器件、模組、電路、組件或其一組合。
裝置亦可包括用於解碼低頻帶中間聲道位元串流以產生低頻帶中間信號及低頻帶中間信號之低頻帶中間聲道激勵的構件。舉例而言,用於解碼低頻帶中間聲道位元串流的該構件可包括圖1、圖3及圖5之解碼器118、圖3之低頻帶中間聲道解碼器302、圖5之編解碼器508、圖5之處理器510、處理器506、器件500、可由處理器執行之指令560、一或多個其他器件、模組、電路、組件或其一組合。
裝置亦可包括用於基於低頻帶中間聲道激勵解碼中間聲道BWE位元串流以產生經合成高頻帶中間信號的構件。舉例而言,用於解碼中間聲道BWE位元串流的該構件可包括圖1、圖3及圖5之解碼器118、圖3之中間聲道BWE解碼器304、圖5之編解碼器508、圖5之處理器510、處理器506、器件500、可由處理器執行之指令560、一或多個其他器件、模組、電
路、組件或其一組合。
裝置亦可包括用於基於自立體聲參數位元串流提取之所選擇頻域增益參數判定用於經合成高頻帶中間信號的ICBWE增益映射參數的構件。所選擇頻域增益參數可基於所選擇頻域增益參數之頻率範圍與經合成高頻帶中間信號之頻率範圍的頻譜近接性進行選擇。舉例而言,用於判定ICBWE增益映射參數的該構件可包括圖1、圖3及圖5之解碼器118、圖3之ICBWE空間平衡器308、圖3之ICBWE增益映射參數產生器322、圖3之提取器324、圖3之選擇器326、圖5之編解碼器508、圖5之處理器510、處理器506、器件500、可由處理器執行之指令560、一或多個其他器件、模組、電路、組件或其一組合。
裝置亦可包括用於基於ICBWE增益映射參數對經合成高頻帶中間信號執行增益縮放操作以產生左高頻帶聲道及右高頻帶聲道的構件。舉例而言,用於執行增益縮放操作的該構件可包括圖1、圖3及圖5之解碼器118、圖3之ICBWE空間平衡器308、圖5之編解碼器508、圖5之處理器510、處理器506、器件500、可由處理器執行之指令560、一或多個其他器件、模組、電路、組件或其一組合。
裝置亦可包括用於輸出第一音訊聲道及第二音訊聲道的構件。第一音訊聲道可基於左高頻帶聲道,且第二音訊聲道可基於右高頻帶聲道。舉例而言,用於輸出的該構件可包括圖1之第一揚聲器142、圖1之第二揚聲器144、圖5之揚聲器548、一或多個其他器件、模組、電路、組件或其一組合。
參考圖6,描繪基地台600之特定說明性實例之方塊圖。在各種實施中,基地台600可相比圖6中所說明的具有較多組件或較少組件。在例示
性實例中,基地台600可包括圖1之第二器件106。在說明性實例中,基地台600可根據參看圖1至圖5所描述之方法或系統中之一或多者操作。
基地台600可為無線通信系統之部分。無線通信系統可包括多個基地台及多個無線器件。無線通信系統可為長期演進(LTE)系統、分碼多重存取(CDMA)系統、全球行動通信系統(GSM)系統、無線區域網路(WLAN)系統或一些其他無線系統。CDMA系統可實施寬頻CDMA(WCDMA)、CDMA 1X、演進資料最佳化(EVDO)、分時同步CDMA(TD-SCDMA),或一些其他版本之CDMA。
無線器件亦可被稱作使用者設備(UE)、行動台、終端機、存取終端機、用戶單元、工作台等。該等無線器件可包括:蜂巢式電話、智慧型電話、平板電腦、無線數據機、個人數位助理(PDA)、手持型器件、膝上型電腦、智能本、迷你筆記型電腦、平板電腦、無接線電話、無線區域迴路(WLL)站、藍芽器件等。無線器件可包括或對應於圖5之器件500。
各種功能可由基地台600(及/或圖中未示之其他組件)之一或多個組件執行,諸如發送及接收訊息及資料(例如,音訊資料)。在一特定實例中,基地台600包括處理器606(例如,CPU)。基地台600可包括轉碼器610。轉碼器610可包括音訊編解碼器608。舉例而言,轉碼器610可包括經組態以執行音訊編解碼器608之操作的一或多個組件(例如,電路)。作為另一實例,轉碼器610可經組態以執行一或多個電腦可讀指令以執行音訊編解碼器608之操作。儘管音訊編解碼器608說明為轉碼器610之組件,但在其他實例中,音訊編解碼器608之一或多個組件可包括於處理器606、另一處理組件,或其一組合中。舉例而言,解碼器638(例如,聲碼器解碼器)可包括於接收器資料處理器664中。作為另一實例,編碼器636
(例如,聲碼器編碼器)可包括於傳輸資料處理器682中。編碼器636可包括圖1之編碼器114。解碼器638可包括圖1之解碼器118。
轉碼器610可起到在兩個或兩個以上網路之間轉碼訊息及資料的作用。轉碼器610可經組態以將訊息及音訊資料自第一格式(例如,數位格式)轉換至第二格式。為了說明,解碼器638可對具有第一格式之經編碼信號進行解碼,且編碼器636可將經解碼信號編碼成具有第二格式之經編碼信號。另外地或替代性地,轉碼器610可經組態以執行資料速率適應。舉例而言,轉碼器610可在不改變音訊資料之格式的情況下降頻轉換資料速率或升頻轉換資料速率。為進行說明,轉碼器610可將64kbit/s信號降頻轉換成16kbit/s信號。
基地台600可包括記憶體632。諸如電腦可讀儲存器件之記憶體632可包括指令。指令可包括可由處理器606、轉碼器610或其組合執行之一或多個指令,以執行參考圖1至圖5之方法及系統所描述之一或多個操作。
基地台600可包括耦接至天線陣列之多個傳輸器及接收器(例如,收發器),諸如第一收發器652及第二收發器654。天線陣列可包括第一天線642及第二天線644。天線陣列可經組態以無線方式與一或多個無線器件通信,諸如圖5之器件500。舉例而言,第二天線644可自無線器件接收資料串流614(例如,位元串流)。資料串流614可包括訊息、資料(例如,經編碼語音資料),或其一組合。
基地台600可包括網路連接660,諸如空載傳輸連接。網路連接660可經組態以與核心網路或無線通信網路之一或多個基地台通信。舉例而言,基地台600可經由網路連接660自核心網路接收第二資料串流(例如,訊息或音訊資料)。基地台600可處理第二資料串流以產生訊息或音訊資料,且
經由天線陣列之一或多個天線將訊息或音訊資料提供至一或多個無線器件,或經由網路連接660將其提供至另一基地台。在特定實施中,網路連接660可為廣域網路(WAN)連接,作為說明性的非限制性實例。在一些實施中,核心網路可包括或對應於公眾交換電話網路(PSTN)、封包基幹網路或兩者。
基地台600可包括耦接至網路連接660及處理器606之媒體閘道器670。媒體閘道器670可經組態以在不同電信技術之媒體串流之間轉換。舉例而言,媒體閘道器670可在不同傳輸協定、不同寫碼方案或兩者之間轉換。為進行說明,作為說明性非限制性實例,媒體閘道器670可自PCM信號轉換成即時輸送協定(RTP)信號。媒體閘道器670可在封包交換式網路(例如,網際網路通訊協定語音(VoIP)網路、IP多媒體子系統(IMS)、諸如LTE、WiMax及UMB之第四代(4G)無線網路等)、電路切換式網路(例如,PSTN)及混合型網路(例如,諸如GSM、GPRS及EDGE之第二代(2G)無線網路、諸如WCDMA、EV-DO及HSPA之第三代(3G)無線網路等)之間轉換資料。
另外,媒體閘道器670可包括諸如轉碼器610之轉碼器,且可經組態以在編碼解碼器不相容時轉碼資料。舉例而言,作為一說明性非限制性實例,媒體閘道器670可在自適應多重速率(AMR)編解碼器與G.711編解碼器之間進行轉碼。媒體閘道器670可包括路由器及複數個實體介面。在一些實施中,媒體閘道器670亦可包括控制器(圖中未示)。在特定實施中,媒體閘道器控制器可在媒體閘道器670外部、在基地台600外部或在其兩者外部。媒體閘道器控制器可控制並協調操作多個媒體閘道器。媒體閘道器670可自媒體閘道器控制器接收控制信號,且可起到在不同傳輸技術之
間橋接器的作用,且可添加對最終使用者能力及連接之服務。
基地台600可包括耦接至收發器652、收發器654、接收器資料處理器664及處理器606之解調器662,且接收器資料處理器664可耦接至處理器606。解調器662可經組態以解調變自收發器652、654所接收之經調變信號,且可經組態以將經解調變資料提供至接收器資料處理器664。接收器資料處理器664可經組態以自經解調資料提取訊息或音訊資料,且將該訊息或音訊資料發送至處理器606。
基地台600可包括傳輸資料處理器682及傳輸多輸入多輸出(MIMO)處理器684。傳輸資料處理器682可耦接至處理器606及傳輸MIMO處理器684。傳輸MIMO處理器684可耦接至收發器652、654及處理器606。在一些實施中,傳輸MIMO處理器684可耦接至媒體閘道器670。傳輸資料處理器682可經組態以自處理器606接收訊息或音訊資料,且基於諸如CDMA或正交分頻多工(OFDM)之寫碼方案寫碼該等訊息或該音訊資料,作為例示性的非限制性實例。傳輸資料處理器682可將經寫碼資料提供至傳輸MIMO處理器684。
可使用CDMA或OFDM技術將經寫碼資料與諸如導頻資料之其他資料多工在一起以產生經多工資料。經多工資料接著可基於特定調變方案(例如,二進位相移鍵控(「BPSK」)、正交相移鍵控(「QSPK」)、M-元相移鍵控(「M-PSK」)、M-元正交振幅調變(「M-QAM」)等)藉由傳輸資料處理器682調變(亦即,符號映射)以產生調變符號。在特定實施中,可使用不同調變方案調變經寫碼資料及其他資料。用於每一資料串流之資料速率、寫碼,及調變可藉由處理器606所執行之指令來判定。
傳輸MIMO處理器684可經組態以自傳輸資料處理器682接收調變符
號,且可進一步處理調變符號,且可對該資料執行波束成形。舉例而言,傳輸MIMO處理器684可將波束成形權重應用於調變符號。
在操作期間,基地台600之第二天線644可接收資料串流614。第二收發器654可自第二天線644接收資料串流614,且可將資料串流614提供至解調器662。解調器662可解調資料串流614之經調變信號,且將經解調資料提供至接收器資料處理器664。接收器資料處理器664可自經解調資料提取音訊資料,且將經提取音訊資料提供至處理器606。
處理器606可將音訊資料提供至轉碼器610以供轉碼。轉碼器610之解碼器638可將音訊資料自第一格式解碼成經解碼音訊資料且編碼器636可將經解碼音訊資料編碼成第二格式。在一些實施中,編碼器636可使用比自無線器件接收的更高資料速率(例如,升頻轉換)或更低資料速率(例如,降頻轉換)編碼音訊資料。在其他實施中,音訊資料可未經轉碼。儘管轉碼(例如,解碼及編碼)被說明為由轉碼器610執行,但轉碼操作(例如,解碼及編碼)可由基地台600之多個組件執行。舉例而言,解碼可由接收器資料處理器664執行,且編碼可由傳輸資料處理器682執行。在其他實施中,處理器606可將音訊資料提供至媒體閘道器670以供轉換成另一傳輸協定、寫碼方案或兩者。媒體閘道器670可藉助於網路連接660將經轉換資料提供至另一基地台或核心網路。
可經由處理器606將在編碼器636產生之經編碼音訊資料提供至傳輸資料處理器682或網路連接660。可將來自轉碼器610之經轉碼音訊資料提供至傳輸資料處理器682,用於根據諸如OFDM之調變方案寫碼,以產生調變符號。傳輸資料處理器682可將調變符號提供至傳輸MIMO處理器684,以供進一步處理及波束成形。傳輸MIMO處理器684可應用波束成形
權重,且可經由第一收發器652將調變符號提供至天線陣列之一或多個天線,諸如第一天線642。因此,基地台600可將對應於自無線器件接收之資料串流614的經轉碼資料串流616提供至另一無線器件。經轉碼資料串流616可具有與資料串流614不同的編碼格式、資料速率,或該等兩者。在其他實施中,可將經轉碼資料串流616提供至網路連接660,用於傳輸至另一基地台或核心網路。
熟習此項技術者將進一步瞭解,結合本文中所揭示之實施而描述的各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由諸如硬體處理器之處理器件執行的電腦軟體或兩者之組合。上文大體在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此功能性經實施為硬體或是軟體取決於特定應用及強加於整個系統之設計約束而定。對於每一特定應用而言,熟習此項技術者可針對每一特定應用而以變化之方式實施所描述之功能性,而但不應將此等實施決策解譯為致使脫離本發明之範疇。
結合本文中所揭示之實施所描述之方法或演算法之步驟可直接體現於硬體中、由處理器執行之軟體模組中或兩者之組合中。軟體模組可駐存於記憶體器件中,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可卸除式磁碟或光碟唯讀記憶體(CD-ROM)。例示性記憶體器件耦接至處理器,以使得處理器可自記憶體器件讀取資訊及將資訊寫入至記憶體器件。在替代方案中,記憶體器件可與處理器成一體式。處理器及儲存媒體
可駐存於特殊應用積體電路(ASIC)中。ASIC可駐留於計算器件或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐留於計算器件或使用者終端機中。
提供對所揭示實施之先前描述,以使得熟習此項技術者能夠製作或使用所揭示之實施。熟習此項技術者將容易地顯而易見對此等實施方案之各種修改,且在不背離本發明之範疇的情況下,本文中所定義之原理可應用於其他實施方案。因此,本發明並非意欲限於本文中所展示之實施,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
100:系統
104:第一器件
106:第二器件
110:傳輸器
112:輸入介面
114:編碼器
116:最終移位值
118:解碼器
120:網路
126:第一輸出聲道
128:第二輸出聲道
130:第一音訊聲道
132:第二音訊聲道
142:第一揚聲器
144:第二揚聲器
146:第一麥克風
148:第二麥克風
152:聲源
153:記憶體
191:分析資料
290:立體聲降混/升混參數位元串流
292:低頻帶中間聲道位元串流
294:高頻帶中間聲道頻寬擴展(BWE)位元串流
322:聲道間頻寬擴展(ICBWE)增益映射參數產生器
Claims (30)
- 一種通信器件,其包含:一接收器,其經組態以自一編碼器接收一位元串流,該位元串流包含至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流;一解碼器,其經組態以:解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號;產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展;解碼該高頻帶中間聲道BWE位元串流以基於該低頻帶中間激勵信號之該非線性諧波擴展且基於高頻帶中間聲道BWE參數產生一經合成高頻帶中間信號;判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數,該ICBWE增益映射參數基於自該立體聲降混/升混參數位元串流提取之一增益參數集合;及基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道;及一或多個揚聲器,其經組態以輸出一第一音訊聲道及一第二音訊聲道,該第一音訊聲道基於該參考高頻帶聲道且該第二音訊聲道基於該目標高頻帶聲道。
- 如請求項1之器件,其中該增益參數集合係基於該增益參數集合之一頻率範圍與該經合成高頻帶中間信號之一頻率範圍的一頻譜近接性進行選擇。
- 如請求項1之器件,其中該增益參數集合對應於該立體聲降混/升混參數位元串流之一側邊增益或該立體聲降混/升混參數位元串流之聲道間層級差異(ILD)。
- 如請求項1之器件,其中該參考高頻帶聲道對應於一左高頻帶聲道或一右高頻帶聲道,且其中該目標高頻帶聲道對應於該左高頻帶聲道或該右高頻帶聲道之另一者。
- 如請求項4之器件,其中該解碼器經進一步組態以基於該低頻帶中間信號產生一左低頻帶聲道及一右低頻帶聲道。
- 如請求項5之器件,其中該解碼器經進一步組態以:將該左低頻帶聲道與該左高頻帶聲道組合以產生該第一音訊聲道;及將該右低頻帶聲道與該右高頻帶聲道組合以產生該第二音訊聲道。
- 如請求項1之器件,其中該解碼器經進一步組態以自該立體聲降混/升混參數位元串流提取一或多個頻域增益參數,其中該增益參數集合係選自該一或多個頻域增益參數。
- 如請求項1之器件,其中該解碼器經組態以將該經合成高頻帶中間信號按比例縮放該ICBWE增益映射參數以產生該目標高頻帶聲道。
- 如請求項1之器件,其中來自一高頻帶之多個頻率範圍的側邊增益基於該等多個頻率範圍之每一頻率範圍之頻率頻寬進行加權以產生該ICBWE增益映射參數。
- 如請求項1之器件,其中該器件包含於一基地台中。
- 如請求項1之器件,其中該器件包含一行動器件,及其中該解碼器整合於該行動器件中。
- 一種解碼一信號之方法,該方法包含:自一編碼器接收一位元串流,該位元串流包含至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流;在一解碼器解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號;產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展;解碼該高頻帶中間聲道BWE位元串流以基於該低頻帶中間激勵信號之該非線性諧波擴展且基於高頻帶中間聲道BWE參數產生一經合成高頻帶中間信號; 判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數,該ICBWE增益映射參數基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域增益參數;基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一參考高頻帶聲道及一目標高頻帶聲道;及輸出一第一音訊聲道及一第二音訊聲道,該第一音訊聲道基於該參考高頻帶聲道且該第二音訊聲道基於該目標高頻帶聲道。
- 如請求項12之方法,其中該所選擇頻域增益參數係基於該所選擇頻域增益參數之一頻率範圍與該經合成高頻帶中間信號之一頻率範圍的一頻譜近接性進行選擇。
- 如請求項12之方法,其中該參考高頻帶聲道對應於一左高頻帶聲道或一右高頻帶聲道,且其中該目標高頻帶聲道對應於該左高頻帶聲道或該右高頻帶聲道之另一者。
- 如請求項14之方法,進一步包含基於該低頻帶中間信號產生一左低頻帶聲道及一右低頻帶聲道。
- 如請求項15之方法,其進一步包含:將該左低頻帶聲道與該左高頻帶聲道組合以產生該第一音訊聲道;及將該右低頻帶聲道與該右高頻帶聲道組合以產生該第二音訊聲道。
- 如請求項12之方法,其進一步包含自該立體聲降混/升混參數位元串流提取一或多個頻域增益參數,其中該所選擇頻域增益參數係選自該一或多個頻域增益參數。
- 如請求項12之方法,其中執行該增益縮放操作包含將該經合成高頻帶中間信號按比例縮放該ICBWE增益映射參數以產生該目標高頻帶聲道。
- 如請求項12之方法,其中判定用於該經合成高頻帶中間信號的該ICBWE增益映射參數在一基地台處執行。
- 如請求項12之方法,其中判定用於該經合成高頻帶中間信號的該ICBWE增益映射參數在一行動器件處執行。
- 一種非暫時性電腦可讀媒體,其包含用於解碼一信號之指令,該等指令在由一解碼器內之一處理器執行時使得該處理器執行以下操作,該等操作包含:自一編碼器接收一位元串流,該位元串流包含至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流;解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號;產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性 諧波擴展;解碼該高頻帶中間聲道BWE位元串流以基於該低頻帶中間激勵信號之該非線性諧波擴展且基於高頻帶中間聲道BWE參數產生一經合成高頻帶中間信號;判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數,該ICBWE增益映射參數基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域增益參數;基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一左高頻帶聲道及一右高頻帶聲道;及產生一第一音訊聲道及一第二音訊聲道,該第一音訊聲道基於該左高頻帶聲道且該第二音訊聲道基於該右高頻帶聲道。
- 如請求項21之非暫時性電腦可讀媒體,其中該所選擇頻域增益參數係基於該所選擇頻域增益參數之一頻率範圍與該經合成高頻帶中間信號之一頻率範圍的一頻譜近接性進行選擇。
- 如請求項21之非暫時性電腦可讀媒體,其中該參考高頻帶聲道對應於一左高頻帶聲道或一右高頻帶聲道,且其中該目標高頻帶聲道對應於該左高頻帶聲道或該右高頻帶聲道中之另一者。
- 如請求項23之非暫時性電腦可讀媒體,其中該等操作進一步包含基於該低頻帶中間信號產生一左低頻帶聲道及一右低頻帶聲道。
- 如請求項24之非暫時性電腦可讀媒體,其中該等操作進一步包含:將該左低頻帶聲道與該左高頻帶聲道組合以產生該第一音訊聲道;及將該右低頻帶聲道與該右高頻帶聲道組合以產生該第二音訊聲道。
- 如請求項21之非暫時性電腦可讀媒體,其中該等操作進一步包含自該立體聲降混/升混參數位元串流提取一或多個頻域增益參數,其中該所選擇頻域增益參數係選自該一或多個頻域增益參數。
- 如請求項21之非暫時性電腦可讀媒體,其中執行該增益縮放操作包含將該經合成高頻帶中間信號按比例縮放該ICBWE增益映射參數以產生該目標高頻帶聲道。
- 一種通信裝置,其包含:用於自一編碼器接收一位元串流的構件,該位元串流包含至少一低頻帶中間聲道位元串流、一高頻帶中間聲道頻寬擴展(BWE)位元串流及一立體聲降混/升混參數位元串流;用於解碼該低頻帶中間聲道位元串流以產生一低頻帶中間信號及一低頻帶中間激勵信號的構件;用於產生對應於一高頻帶BWE部分的該低頻帶中間激勵信號之一非線性諧波擴展的構件;用於解碼該高頻帶中間聲道BWE位元串流以基於該低頻帶中間激勵信號之該非線性諧波擴展且基於高頻帶中間聲道BWE參數產生一經合成高頻帶中間信號的構件; 用於判定對應於該經合成高頻帶中間信號之一聲道間頻寬擴展(ICBWE)增益映射參數的構件,該ICBWE增益映射參數基於自該立體聲降混/升混參數位元串流提取之一所選擇頻域增益參數;用於基於該ICBWE增益映射參數對該經合成高頻帶中間信號執行一增益縮放操作以產生一左高頻帶聲道及一右高頻帶聲道的構件;及用於輸出一第一音訊聲道及一第二音訊聲道的構件,該第一音訊聲道基於該左高頻帶聲道且該第二音訊聲道基於該右高頻帶聲道。
- 如請求項28之裝置,其中該裝置包含於一基地台中。
- 如請求項28之裝置,其中該裝置包含一行動器件,及其中用於判定該ICBWE增益映射參數的該構件整合於該行動器件中。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762482150P | 2017-04-05 | 2017-04-05 | |
US62/482,150 | 2017-04-05 | ||
US15/935,952 | 2018-03-26 | ||
US15/935,952 US10573326B2 (en) | 2017-04-05 | 2018-03-26 | Inter-channel bandwidth extension |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201903754A TW201903754A (zh) | 2019-01-16 |
TWI724290B true TWI724290B (zh) | 2021-04-11 |
Family
ID=63711139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107111104A TWI724290B (zh) | 2017-04-05 | 2018-03-30 | 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10573326B2 (zh) |
EP (1) | EP3607549B1 (zh) |
KR (1) | KR102208602B1 (zh) |
CN (1) | CN110447072B (zh) |
BR (1) | BR112019020643A2 (zh) |
SG (1) | SG11201907670UA (zh) |
TW (1) | TWI724290B (zh) |
WO (1) | WO2018187082A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10535357B2 (en) | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150380008A1 (en) * | 2014-06-26 | 2015-12-31 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
TW201732783A (zh) * | 2016-02-12 | 2017-09-16 | 高通公司 | 多個高頻帶音訊信號之通道間編碼及解碼 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US8605911B2 (en) * | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8015368B2 (en) * | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
KR101589942B1 (ko) * | 2009-01-16 | 2016-01-29 | 돌비 인터네셔널 에이비 | 외적 향상 고조파 전치 |
AU2010209673B2 (en) | 2009-01-28 | 2013-05-16 | Dolby International Ab | Improved harmonic transposition |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
CN103650036B (zh) * | 2012-07-06 | 2016-05-11 | 深圳广晟信源技术有限公司 | 对多声道数字音频编码的方法 |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
TWI758146B (zh) * | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10157621B2 (en) | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
US10249307B2 (en) | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
-
2018
- 2018-03-26 US US15/935,952 patent/US10573326B2/en active Active
- 2018-03-27 KR KR1020197029291A patent/KR102208602B1/ko active IP Right Grant
- 2018-03-27 CN CN201880020626.5A patent/CN110447072B/zh active Active
- 2018-03-27 BR BR112019020643A patent/BR112019020643A2/pt unknown
- 2018-03-27 EP EP18718044.3A patent/EP3607549B1/en active Active
- 2018-03-27 SG SG11201907670U patent/SG11201907670UA/en unknown
- 2018-03-27 WO PCT/US2018/024500 patent/WO2018187082A1/en unknown
- 2018-03-30 TW TW107111104A patent/TWI724290B/zh active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150380008A1 (en) * | 2014-06-26 | 2015-12-31 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
TW201732783A (zh) * | 2016-02-12 | 2017-09-16 | 高通公司 | 多個高頻帶音訊信號之通道間編碼及解碼 |
Also Published As
Publication number | Publication date |
---|---|
EP3607549A1 (en) | 2020-02-12 |
WO2018187082A1 (en) | 2018-10-11 |
BR112019020643A2 (pt) | 2020-04-28 |
US20180293992A1 (en) | 2018-10-11 |
CN110447072A (zh) | 2019-11-12 |
EP3607549B1 (en) | 2022-09-28 |
SG11201907670UA (en) | 2019-10-30 |
TW201903754A (zh) | 2019-01-16 |
KR20190134641A (ko) | 2019-12-04 |
US10573326B2 (en) | 2020-02-25 |
CN110447072B (zh) | 2020-11-06 |
KR102208602B1 (ko) | 2021-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI651716B (zh) | 通信裝置、方法及設備及非暫時性之電腦可讀儲存裝置 | |
TWI724184B (zh) | 音頻信號之間之通道間相位差之編碼及解碼 | |
TWI828480B (zh) | 用於立體聲解碼之立體聲參數 | |
US10891961B2 (en) | Encoding of multiple audio signals | |
US10593341B2 (en) | Coding of multiple audio signals | |
TWI778073B (zh) | 用於具有時域頻道間頻寬延展之高頻帶殘值預測的音訊信號寫碼裝置、方法、包含指令的非暫時性電腦可讀媒體及設備 | |
TWI713819B (zh) | 用於頻譜映射及調整之計算裝置及方法 | |
TW201907730A (zh) | 時域頻道之間的預測 | |
TWI763754B (zh) | 通道間相位差參數之修改 | |
TWI724290B (zh) | 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置 |