TW202315425A - 用於立體聲解碼之立體聲參數 - Google Patents
用於立體聲解碼之立體聲參數 Download PDFInfo
- Publication number
- TW202315425A TW202315425A TW111148802A TW111148802A TW202315425A TW 202315425 A TW202315425 A TW 202315425A TW 111148802 A TW111148802 A TW 111148802A TW 111148802 A TW111148802 A TW 111148802A TW 202315425 A TW202315425 A TW 202315425A
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- quantized
- frame
- value
- generate
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims description 173
- 238000000034 method Methods 0.000 claims description 107
- 230000004044 response Effects 0.000 claims description 27
- 230000003111 delayed effect Effects 0.000 claims description 14
- 238000013139 quantization Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 24
- 230000000875 corresponding effect Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 11
- 230000010363 phase shift Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 230000001364 causal effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000016507 interphase Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/05—Generation or adaptation of centre channel in multi-channel audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Abstract
一種裝置包括一接收器及一解碼器。該接收器經組態以接收包括一經編碼中間聲道及一經量化值之一位元串流,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值。該移位之該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。該解碼器經組態以解碼該經編碼中間聲道以產生一經解碼中間聲道,及基於該經解碼中間聲道產生一第一聲道。該解碼器經進一步組態以基於該經解碼中間聲道及該經量化值產生一第二聲道。該第一聲道對應於該參考聲道且該第二聲道對應於該目標聲道。
Description
本發明大體上係關於解碼音訊信號。
技術之進步已產生更小且更強大的計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括諸如行動及智慧型電話之無線電話、平板電腦及膝上型電腦,其體積小、重量輕且容易由使用者攜帶。此等器件可經由無線網路傳達語音及資料封包。另外,許多此類器件併有額外功能性,諸如數位靜態相機、數位視訊攝影機、數位記錄器及音訊檔案播放器。又,此類器件可處理可用以存取網際網路之可執行指令,包括軟體應用程式,諸如網頁瀏覽器應用程式。因而,此等器件可包括顯著的計算能力。
計算器件可包括或可耦接至多個麥克風以接收音訊信號。通常,聲源與多個麥克風中之第一麥克風的接近程度大於與多個麥克風中之第二麥克風的接近程度。因此,歸因於第一麥克風及第二麥克風與聲源相隔之各別距離,自第二麥克風接收之第二音訊信號可相對於自第一麥克風接收之第一音訊信號延遲。在其他實施方案中,第一音訊信號可相對於第二音訊信號延遲。在立體聲編碼中,可編碼來自麥克風之音訊信號以產生中間聲道信號及一或多個旁聲道信號。中間聲道信號可對應於第一音訊信號與第二音訊信號之總和。旁聲道信號可對應於第一音訊信號與第二音訊信號之間的差。由於在接收第二音訊信號相對於第一音訊信號方面之延遲,第一音訊信號可能不與第二音訊信號對準。延遲可由被傳輸至解碼器之經編碼移位值(例如,立體聲參數)指示。第一音訊信號與第二音訊信號之精確對準會使能夠進行高效編碼以用於傳輸至解碼器。然而,相較於傳輸低精確度資料,傳輸指示音訊信號之對準的高精確度資料會使用增加的傳輸資源。亦可編碼指示第一音訊信號與第二音訊信號之間的特性的其他立體聲參數且將其傳輸至解碼器。
解碼器可至少基於中間聲道信號及立體聲參數重新建構第一音訊信號及第二音訊信號,立體聲參數係經由包括一系列訊框之位元串流在解碼器處被接收。音訊信號重新建構期間的解碼器處之精確度可基於編碼器之精確度。舉例而言,經編碼高精確度移位值可在解碼器處被接收,且可使解碼器能夠以高精確度在第一音訊信號及第二音訊信號之經重新建構版本中再生延遲。若移位值在解碼器處不可用,諸如當經由位元串流傳輸之資料之訊框歸因於有雜訊的傳輸條件而損毀時,則可請求移位值且將其重新傳輸至解碼器以使能夠精確地再生音訊信號之間的延遲。舉例而言,解碼器在再生延遲方面之精確度可超過人類之聲訊感知力限制以感知延遲之變化。
根據本發明之一項實施方案,一種裝置包括一接收器,其經組態以接收一位元串流之至少一部分。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值,且該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該裝置亦包括一解碼器,其經組態以解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分。該解碼器亦經組態以至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分,及至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分。該解碼器經進一步組態以回應於該第二訊框不可用於解碼操作而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種解碼一信號之方法包括接收一位元串流之至少一部分。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值,且該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該方法亦包括解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分。該方法進一步包括至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分,及至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分。該方法亦包括回應於該第二訊框不可用於解碼操作而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種非暫時性電腦可讀媒體包括指令,該等指令在由一解碼器內之一處理器執行時致使該處理器執行操作,該等操作包括接收一位元串流之至少一部分。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值,且該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該等操作亦包括解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分。該等操作進一步包括至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分,及至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分。該等操作亦包括回應於該第二訊框不可用於解碼操作而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種裝置包括用於接收一位元串流之至少一部分的構件。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值,且該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該裝置亦包括用於解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分的構件。該裝置進一步包括用於至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分的構件,及用於至少基於該經解碼中間聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分的構件。該裝置亦包括用於回應於該第二訊框不可用於解碼操作而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分的構件。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種裝置包括一接收器,其經組態以自一編碼器接收一位元串流之至少一部分。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值。該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該裝置亦包括一解碼器,其經組態以解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分。該解碼器亦經組態以對該經解碼中間聲道之該第一部分執行一變換操作以產生一經解碼頻域中間聲道之一第一部分。該解碼器經進一步組態以升混該經解碼頻域中間聲道之該第一部分以產生一左頻域聲道之一第一部分及一右頻域聲道之一第一部分。該解碼器亦經組態以至少基於該左頻域聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分。該解碼器經進一步組態以至少基於該右頻域聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分。該解碼器亦經組態以判定該第二訊框不可用於解碼操作。該解碼器經進一步組態以回應於判定該第二訊框不可用而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種解碼一信號之方法包括在一解碼器處自一編碼器接收一位元串流之至少一部分。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值。該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該方法亦包括解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分。該方法進一步包括對該經解碼中間聲道之該第一部分執行一變換操作以產生一經解碼頻域中間聲道之一第一部分。該方法亦包括升混該經解碼頻域中間聲道之該第一部分以產生一左頻域聲道之一第一部分及一右頻域聲道之一第一部分。該方法進一步包括至少基於該左頻域聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分。該方法進一步包括至少基於該右頻域聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分。該方法亦包括判定該第二訊框不可用於解碼操作。該方法進一步包括回應於判定該第二訊框不可用而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種非暫時性電腦可讀媒體包括指令,該等指令在由一解碼器內之一處理器執行時致使該處理器執行操作,該等操作包括自一編碼器接收一位元串流之至少一部分。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值。該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該等操作亦包括解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分。該等操作進一步包括對該經解碼中間聲道之該第一部分執行一變換操作以產生一經解碼頻域中間聲道之一第一部分。該等操作亦包括升混該經解碼頻域中間聲道之該第一部分以產生一左頻域聲道之一第一部分及一右頻域聲道之一第一部分。該等操作進一步包括至少基於該左頻域聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分。該等操作進一步包括至少基於該右頻域聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分。該等操作亦包括判定該第二訊框不可用於解碼操作。該等操作進一步包括回應於判定該第二訊框不可用而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種裝置包括用於自一編碼器接收一位元串流之至少一部分的構件。該位元串流包括一第一訊框及一第二訊框。該第一訊框包括一中間聲道之一第一部分及一立體聲參數之一第一值。該第二訊框包括該中間聲道之一第二部分及該立體聲參數之一第二值。該裝置亦包括用於解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分的構件。該裝置亦包括用於對該經解碼中間聲道之該第一部分執行一變換操作以產生一經解碼頻域中間聲道之一第一部分的構件。該裝置亦包括用於升混該經解碼頻域中間聲道之該第一部分以產生一左頻域聲道之一第一部分及一右頻域聲道之一第一部分的構件。該裝置亦包括用於至少基於該左頻域聲道之該第一部分及該立體聲參數之該第一值產生一左聲道之一第一部分的構件。該裝置亦包括用於至少基於該右頻域聲道之該第一部分及該立體聲參數之該第一值產生一右聲道之一第一部分的構件。該裝置亦包括用於判定該第二訊框不可用於解碼操作的構件。該裝置亦包括用於回應於該第二訊框不可用之一判定而至少基於該立體聲參數之該第一值產生該左聲道之一第二部分及該右聲道之一第二部分的構件。該左聲道之該第二部分及該右聲道之該第二部分對應於該第二訊框之一經解碼版本。
根據另一實施方案,一種裝置包括一接收器及一解碼器。該接收器經組態以接收包括一經編碼中間聲道及一經量化值之一位元串流,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值。該移位之該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。該解碼器經組態以解碼該經編碼中間聲道以產生一經解碼中間聲道,及基於該經解碼中間聲道產生一第一聲道。該解碼器經進一步組態以基於該經解碼中間聲道及該經量化值產生一第二聲道。該第一聲道對應於該參考聲道且該第二聲道對應於該目標聲道。
根據另一實施方案,一種解碼一信號之方法包括在一解碼器處接收包括一中間聲道及一經量化值之一位元串流,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值。該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。該方法亦包括解碼該中間聲道以產生一經解碼中間聲道。該方法進一步包括基於該經解碼中間聲道產生一第一聲道,及基於該經解碼中間聲道及該經量化值產生一第二聲道。該第一聲道對應於該參考聲道且該第二聲道對應於該目標聲道。
根據另一實施方案,一種非暫時性電腦可讀媒體包括指令,該等指令在由一解碼器內之一處理器執行時致使該處理器執行操作,該等操作包括在一解碼器處接收包括一中間聲道及一經量化值之一位元串流,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值。該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。該等操作亦包括解碼該中間聲道以產生一經解碼中間聲道。該等操作進一步包括基於該經解碼中間聲道產生一第一聲道,及基於該經解碼中間聲道及該經量化值產生一第二聲道。該第一聲道對應於該參考聲道且該第二聲道對應於該目標聲道。
根據另一實施方案,一種裝置包括用於在一解碼器處接收包括一中間聲道及一經量化值之一位元串流的構件,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值。該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。該裝置亦包括用於解碼該中間聲道以產生一經解碼中間聲道的構件。該裝置進一步包括用於基於該經解碼中間聲道產生一第一聲道的構件,及用於基於該經解碼中間聲道及該經量化值產生一第二聲道的構件。該第一聲道對應於該參考聲道且該第二聲道對應於該目標聲道。
根據另一實施方案,一種裝置包括一接收器,其經組態以自一編碼器接收一位元串流。該位元串流包括一中間聲道及一經量化值,該經量化值表示相關聯於該編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值,該值相比於該經量化值具有一較大精確度。該裝置亦包括一解碼器,其經組態以解碼該中間聲道以產生一經解碼中間聲道。該解碼器亦經組態以對該經解碼中間聲道執行一變換操作以產生一經解碼頻域中間聲道。該解碼器經進一步組態以升混該經解碼頻域中間聲道以產生一第一頻域聲道及一第二頻域聲道。該解碼器亦經組態以基於該第一頻域聲道產生一第一聲道。該第一聲道對應於該參考聲道。該解碼器經進一步組態以基於該第二頻域聲道產生一第二聲道。該第二聲道對應於該目標聲道。若該經量化值對應於一頻域移位,則該第二頻域聲道在頻域中被移位該經量化值,且若該經量化值對應於一時域移位,則該第二頻域聲道之一時域版本被移位該經量化值。
根據另一實施方案,一種方法包括在一解碼器處自一編碼器接收一位元串流。該位元串流包括一中間聲道及一經量化值,該經量化值表示相關聯於該編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值,該值相比於該經量化值具有一較大精確度。該方法亦包括解碼該中間聲道以產生一經解碼中間聲道。該方法進一步包括對該經解碼中間聲道執行一變換操作以產生一經解碼頻域中間聲道。該方法亦包括升混該經解碼頻域中間聲道以產生一第一頻域聲道及一第二頻域聲道。該方法亦包括基於該第一頻域聲道產生一第一聲道。該第一聲道對應於該參考聲道。該方法進一步包括基於該第二頻域聲道產生一第二聲道。該第二聲道對應於該目標聲道。若該經量化值對應於一頻域移位,則該第二頻域聲道在頻域中被移位該經量化值,且若該經量化值對應於一時域移位,則該第二頻域聲道之一時域版本被移位該經量化值。
根據另一實施方案,一種非暫時性電腦可讀媒體包括用於解碼一信號之指令。該等指令在由一解碼器內之一處理器執行時致使該處理器執行操作,該等操作包括自一編碼器接收一位元串流。該位元串流包括一中間聲道及一經量化值,該經量化值表示相關聯於該編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值,該值相比於該經量化值具有一較大精確度。該等操作亦包括解碼該中間聲道以產生一經解碼中間聲道。該等操作進一步包括對該經解碼中間聲道執行一變換操作以產生一經解碼頻域中間聲道。該等操作亦包括升混該經解碼頻域中間聲道以產生一第一頻域聲道及一第二頻域聲道。該等操作亦包括基於該第一頻域聲道產生一第一聲道。該第一聲道對應於該參考聲道。該等操作進一步包括基於該第二頻域聲道產生一第二聲道。該第二聲道對應於該目標聲道。若該經量化值對應於一頻域移位,則該第二頻域聲道在頻域中被移位該經量化值,且若該經量化值對應於一時域移位,則該第二頻域聲道之一時域版本被移位該經量化值。
根據另一實施方案,一種裝置包括用於自一編碼器接收一位元串流的構件。該位元串流包括一中間聲道及一經量化值,該經量化值表示相關聯於該編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位。該經量化值係基於該移位之一值,該值相比於該經量化值具有一較大精確度。該裝置亦包括用於解碼該中間聲道以產生一經解碼中間聲道的構件。該裝置亦包括用於對該經解碼中間聲道執行一變換操作以產生一經解碼頻域中間聲道的構件。該裝置亦包括用於升混該經解碼頻域中間聲道以產生一第一頻域聲道及一第二頻域聲道的構件。該裝置亦包括用於基於該第一頻域聲道產生一第一聲道的構件。該第一聲道對應於該參考聲道。該裝置亦包括用於基於該第二頻域聲道產生一第二聲道的構件。該第二聲道對應於該目標聲道。若該經量化值對應於一頻域移位,則該第二頻域聲道在頻域中被移位該經量化值,且若該經量化值對應於一時域移位,則該第二頻域聲道之一時域版本被移位該經量化值。
在檢閱整個申請案之後,本發明之其他實施方案、優勢及特徵將變得顯而易見,該整個申請案包括以下章節:圖式簡單說明、實施方式,及發明申請專利範圍。
相
關申請案之交叉參考
本申請案主張2017年5月11日申請之名為「STEREO PARAMETERS FOR STEREO DECODING」之美國臨時專利申請案第62/505,041號的權益,該美國臨時專利申請案之全文以引用之方式明確地併入本文中。
下文參考圖式來描述本發明之特定態樣。在該描述中,共同特徵係由共同參考編號指示。如本文中所使用,各種術語係僅出於描述特定實施方案之目的而使用,且並不意欲限制實施方案。舉例而言,除非上下文另有清楚指示,否則單數形式「一(a/an)」及「該」意欲同樣包括複數形式。可進一步理解,術語「包含(comprises及comprising)」可與「包括(includes或including)」互換地使用。另外,應理解,術語「其中(wherein)」可與「其中(where)」互換地使用。如本文中所使用,用以修飾諸如結構、組件、操作等等之元件之序數術語(例如,「第一」、「第二」、「第三」等等)本身並不指示該元件相對於另一元件之任何優先權或次序,而是僅僅區別該元件與具有相同名稱之另一元件(假使沒有使用序數術語)。如本文中所使用,術語「集合」係指特定元件中之一或多個,且術語「複數個」係指特定元件中之多個(例如,兩個或多於兩個)。
在本發明中,諸如「判定」、「計算」、「移位」、「調整」等等之術語可用以描述如何執行一或多個操作。應注意,此類術語不應被認作限制性的,且其他技術可用以執行相似操作。另外,如本文中所提及,「產生」、「計算」、「使用」、「選擇」、「存取」及「判定」可互換地使用。舉例而言,「產生」、「計算」或「判定」一參數(或一信號)可指主動地產生、計算或判定該參數(或該信號),或可指使用、選擇或存取已經諸如由另一組件或器件產生之該參數(或該信號)。
本發明揭示可操作以編碼多個音訊信號之系統及器件。器件可包括經組態以編碼多個音訊信號之編碼器。可使用多個記錄器件--例如,多個麥克風--在時間上同時地捕捉多個音訊信號。在一些實例中,可藉由多工在同一時間或在不同時間記錄之若干音訊聲道來合成地(例如,人工地)產生多個音訊信號(或多聲道音訊)。作為說明性實例,音訊聲道之同時記錄或多工可產生2聲道組態(亦即,立體聲:左及右)、5.1聲道組態(左、右、中央、左環繞、右環繞及低頻增強(low frequency emphasis;LFE)聲道)、7.1聲道組態、7.1+4聲道組態、22.2聲道組態或N聲道組態。
電話會議室(或遠程呈現室)內之音訊捕捉器件可包括獲取空間音訊之多個麥克風。空間音訊可包括話語以及被編碼及傳輸之背景音訊。取決於多個麥克風如何被配置以及給定源(例如,談話者)相對於該等麥克風及室尺寸位於何處,來自該源(例如,談話者)之話語/音訊可在不同時間到達該等麥克風。舉例而言,聲源(例如,談話者)與相關聯於器件之第一麥克風的接近程度可大於與相關聯於器件之第二麥克風的接近程度。因此,自聲源發出之聲音到達第一麥克風的時間可早於到達第二麥克風的時間。器件可經由第一麥克風接收第一音訊信號,且可經由第二麥克風接收第二音訊信號。
中間-旁(mid-side;MS)寫碼及參數立體聲(parametric stereo;PS)寫碼為可提供優於雙單聲道寫碼技術之改良效能的立體聲寫碼技術。在雙單聲道寫碼中,獨立地寫碼左(L)聲道(或信號)及右(R)聲道(或信號),而不利用聲道間相關性。MS寫碼藉由在寫碼之前將左聲道及右聲道變換為總和聲道及差聲道(例如,旁聲道)而縮減相關L/R聲道對之間的冗餘。總和信號及差信號被波形寫碼或基於MS寫碼中之模型被寫碼。在總和信號上所耗費之位元相對多於在旁信號上所耗費之位元。PS寫碼藉由將L/R信號變換為總和信號及旁參數集合而縮減每一子頻帶中之冗餘。旁參數可指示聲道間強度差(inter-channel intensity difference;IID)、聲道間相位差(inter-channel phase difference;IPD)、聲道間時差(inter-channel time difference;ITD)、旁或殘餘預測增益等等。總和信號被波形寫碼且連同旁參數一起被傳輸。在混合式系統中,旁聲道可在下頻帶(例如,小於2千赫茲(kHz))中被波形寫碼且在上頻帶(例如,大於或等於2 kHz)中被PS寫碼,其中聲道間相位保留在感知上較不關鍵。在一些實施方案中,PS寫碼亦可在波形寫碼之前用於下頻帶中以縮減聲道間冗餘。
MS寫碼及PS寫碼可在頻域中或在子頻帶域中或在時域中進行。在一些實例中,左聲道與右聲道可能不相關。舉例而言,左聲道及右聲道可包括不相關合成信號。當左聲道與右聲道不相關時,MS寫碼、PS寫碼或兩者之寫碼效率可接近雙單聲道寫碼之寫碼效率。
取決於記錄組態,可在左聲道與右聲道之間存在時間移位,以及存在其他空間效應,諸如回音及室內回響。若不補償聲道之間的時間移位及相位失配,則總和聲道及差聲道可含有相當的能量,從而縮減相關聯於MS或PS技術之寫碼增益。寫碼增益之縮減可基於時間(或相位)移位之量。總和信號及差信號之相當的能量可限制聲道在時間上移位但高度地相關之某些訊框中的MS寫碼之使用。在立體聲寫碼中,可基於以下公式產生中間聲道(例如,總和聲道)及旁聲道(例如,差聲道):
M = (L+R)/2,S = (L-R)/2, 公式1
其中M對應於中間聲道,S對應於旁聲道,L對應於左聲道,且R對應於右聲道。
在一些狀況下,可基於以下公式產生中間聲道及旁聲道:
M = c(L+R),S = c(L-R), 公式2
其中c對應於頻率相依之複合值。基於公式1或公式2產生中間聲道及旁聲道可被稱作「降混(downmixing)」。基於公式1或公式2自中間聲道及旁聲道產生左聲道及右聲道之反向程序可被稱作「升混(upmixing)」。
在一些狀況下,中間聲道可基於其他公式,諸如:
M = (L+gD R)/2,或 公式3
M = g1 L + g2 R 公式4
其中g1 + g2 = 1.0,且其中gD為增益參數。在其他實例中,可在頻帶中執行降混,其中mid(b) = c1 L(b) + c2 R(b),其中c1及c2為複數,其中side(b) = c3 L(b) - c4 R(b),且其中c3及c4為複數。
用以針對特定訊框而在MS寫碼或雙單聲道寫碼之間選擇之特用途徑可包括產生中間信號及旁信號,計算中間信號及旁信號之能量,及基於該等能量判定是否執行MS寫碼。舉例而言,可回應於判定旁信號與中間信號之能量比率小於臨限值而執行MS寫碼。出於說明起見,若右聲道被移位至少第一時間(例如,約0.001秒或48 kHz下48個樣本),則針對有聲話語訊框,中間信號之第一能量(對應於左信號與右信號之總和)可與旁信號之第二能量(對應於左信號與右信號之間的差)相當。當第一能量與第二能量相當時,可使用較高數目個位元以編碼旁聲道,藉此相對於雙單聲道寫碼而縮減MS寫碼之寫碼效能。當第一能量與第二能量相當時(例如,當第一能量與第二能量之比率大於或等於臨限值時),可因此使用雙單聲道寫碼。在一替代途徑中,可基於左聲道及右聲道之臨限值及正規化交叉相關性值之比較針對特定訊框而在MS寫碼與雙單聲道寫碼之間作出決定。
在一些實例中,編碼器可判定指示第一音訊信號與第二音訊信號之間的時間未對準之量的失配值。如本文中所使用,「時間移位值」、「移位值」及「失配值」可互換地使用。舉例而言,編碼器可判定指示第一音訊信號相對於第二音訊信號之移位(例如,時間失配)的時間移位值。時間失配值可對應於第一麥克風處的第一音訊信號之接收與第二麥克風處的第二音訊信號之接收之間的時間延遲之量。此外,編碼器可在逐訊框基礎上--例如,基於每一20毫秒(ms)話語/音訊訊框--判定時間失配值。舉例而言,時間失配值可對應於第二音訊信號之第二訊框相對於第一音訊信號之第一訊框延遲的時間量。替代地,時間失配值可對應於第一音訊信號之第一訊框相對於第二音訊信號之第二訊框延遲的時間量。
當聲源與第一麥克風之接近程度大於與第二麥克風之接近程度時,第二音訊信號之訊框可相對於第一音訊信號之訊框延遲。在此狀況下,第一音訊信號可被稱作「參考音訊信號」或「參考聲道」,且經延遲第二音訊信號可被稱作「目標音訊信號」或「目標聲道」。替代地,當聲源與第二麥克風之接近程度大於與第一麥克風之接近程度時,第一音訊信號之訊框可相對於第二音訊信號之訊框延遲。在此狀況下,第二音訊信號可被稱作參考音訊信號或參考聲道,且經延遲第一音訊信號可被稱作目標音訊信號或目標聲道。
取決於聲源(例如,談話者)在會議室或遠程呈現室內位於何處或聲源(例如,談話者)位置相對於麥克風如何改變,參考聲道及目標聲道可自一個訊框至另一訊框而改變;相似地,時間延遲值亦可自一個訊框至另一訊框而改變。然而,在一些實施方案中,時間失配值可始終為正以指示「目標」聲道相對於「參考」聲道之延遲量。此外,時間失配值可對應於「非因果移位(non-causal shift)」值,經延遲目標聲道在時間上被「拉回」該值,使得該目標聲道與「參考」聲道對準(例如,最大限度地對準)。可對參考聲道及經非因果移位目標聲道執行用以判定中間聲道及旁聲道之降混演算法。
編碼器可基於參考音訊聲道及應用於目標音訊聲道之複數個時間失配值判定時間失配值。舉例而言,可在第一時間(m1)接收參考音訊聲道之第一訊框X。可在對應於第一時間失配值之第二時間(n1)接收目標音訊聲道之第一特定訊框Y,例如,shift1 = n1 - m1。另外,可在第三時間(m2)接收參考音訊聲道之第二訊框。可在對應於第二時間失配值之第四時間(n2)接收目標音訊聲道之第二特定訊框,例如,shift2 = n2 - m2。
器件可以第一取樣速率(例如,32 kHz取樣速率(亦即,每訊框640個樣本))執行成框或緩衝演算法以產生訊框(例如,20 ms樣本)。編碼器可回應於判定第一音訊信號之第一訊框及第二音訊信號之第二訊框在同一時間到達器件而將時間失配值(例如,shift1)估計為等於零個樣本。左聲道(例如,對應於第一音訊信號)與右聲道(例如,對應於第二音訊信號)可在時間上對準。在一些狀況下,即使當對準時,左聲道與右聲道亦可歸因於各種原因(例如,麥克風校準)而在能量方面不同。
在一些實例中,左聲道與右聲道可歸因於各種原因(例如,諸如談話者之聲源與麥克風中之一者的接近程度可大於與麥克風中之另一者的接近程度,且兩個麥克風相隔的距離可大於臨限值(例如,1至20公分)距離)而在時間上未對準。聲源相對於麥克風之位置可在左聲道及右聲道中引入不同延遲。另外,可在左聲道與右聲道之間存在增益差、能量差或位準差。
在一些實例中,在存在多於兩個聲道之情況下,參考聲道最初基於聲道之位準或能量被選擇,且隨後基於不同聲道對之間的時間失配值--例如,t1(ref, ch2)、t2(ref, ch3)、t3(ref, ch4)、…--被改進,其中ch1最初為參考聲道且t1(.)、t2(.)等等為用以估計失配值之函數。若所有時間失配值為正,則ch1被視為參考聲道。若失配值中之任一者為負值,則參考聲道被重新組態為相關聯於引起負值之失配值的聲道,且繼續以上程序直至達成參考聲道之最佳選擇(例如,基於使最大數目個旁聲道最大限度地去相關)。可使用遲滯以克服參考聲道選擇之任何突然變化。
在一些實例中,當多個談話者交替地談話(例如,無重疊)時,音訊信號自多個聲源(例如,談話者)到達麥克風之時間可變化。在此類狀況下,編碼器可基於談話者動態地調整時間失配值以識別參考聲道。在一些其他實例中,多個談話者可在同一時間談話,此可取決於哪一談話者最大聲、最接近於麥克風等等而引起變化時間失配值。在此類狀況下,參考聲道及目標聲道之識別可基於當前訊框中之變化時間移位值及先前訊框中之經估計時間失配值,且基於第一音訊信號及第二音訊信號之能量或時間演進。
在一些實例中,當第一音訊信號及第二音訊信號潛在地展示較少(例如,無)相關性時,可合成或人工地產生該兩個信號。應理解,本文中所描述之實例係說明性的,且可在相似或不同情形中判定第一音訊信號與第二音訊信號之間的關係方面具指導性。
編碼器可基於第一音訊信號之第一訊框與第二音訊信號之複數個訊框的比較產生比較值(例如,差值或交叉相關性值)。複數個訊框中之每一訊框可對應於特定時間失配值。編碼器可基於比較值產生第一經估計時間失配值。舉例而言,第一經估計時間失配值可對應於指示第一音訊信號之第一訊框與第二音訊信號之對應第一訊框之間的較高時間相似性(或較低差)的比較值。
編碼器可藉由在多個階段中改進一系列經估計時間失配值而判定最終時間失配值。舉例而言,編碼器可首先基於自第一音訊信號及第二音訊信號之經立體聲預處理及重新取樣版本產生之比較值估計「暫訂」時間失配值。編碼器可產生相關聯於與經估計「暫訂」時間失配值緊接之時間失配值的經內插比較值。編碼器可基於經內插比較值判定第二經估計「經內插」時間失配值。舉例而言,第二經估計「經內插」時間失配值可對應於相比於剩餘經內插比較值及第一經估計「暫訂」時間失配值指示較高時間相似性(或較低差)之特定經內插比較值。若當前訊框(例如,第一音訊信號之第一訊框)之第二經估計「經內插」時間失配值不同於前一訊框(例如,先於第一訊框的第一音訊信號之訊框)之最終時間失配值,則當前訊框之「經內插」時間失配值進一步「經修正」以改良第一音訊信號與經移位第二音訊信號之間的時間相似性。詳言之,第三經估計「經修正」時間失配值可藉由查究當前訊框之第二經估計「經內插」時間失配值及前一訊框之最終經估計時間失配值而對應於時間相似性之更準確的量度。第三經估計「經修正」時間失配值進一步經調節以藉由限制訊框之間的時間失配值之任何偽(spurious)改變而估計最終時間失配值,且進一步經控制以不在如本文中所描述之兩個逐次(或連序)訊框中自負時間失配值切換到正時間失配值(或反之亦然)。
在一些實例中,編碼器可制止在連序訊框中或在鄰近訊框中在正時間失配值與負時間失配值之間切換或反之亦然。舉例而言,編碼器可基於第一訊框之經估計「經內插」或「經修正」時間失配值及先於第一訊框之特定訊框中之對應經估計「經內插」或「經修正」或最終時間失配值而將最終時間失配值設定為指示無時間移位之特定值(例如,0)。出於說明起見,編碼器可回應於判定當前訊框(例如,第一訊框)之一個經估計「暫訂」或「經內插」或「經修正」時間失配值為正且前一訊框(例如,先於第一訊框之訊框)之另一經估計「暫訂」或「經內插」或「經修正」或「最終」經估計時間失配值為負而將當前訊框之最終時間失配值設定為指示無時間移位,亦即,shift1 = 0。替代地,編碼器亦可回應於判定當前訊框(例如,第一訊框)之一個經估計「暫訂」或「經內插」或「經修正」時間失配值為負且前一訊框(例如,先於第一訊框之訊框)之另一經估計「暫訂」或「經內插」或「經修正」或「最終」經估計時間失配值為正而將當前訊框之最終時間失配值設定為指示無時間移位,亦即,shift1 = 0。
編碼器可基於時間失配值而將第一音訊信號或第二音訊信號之訊框選擇為「參考」或「目標」。舉例而言,回應於判定最終時間失配值為正,編碼器可產生具有指示第一音訊信號為一「參考」信號且第二音訊信號為「目標」信號之一第一值(例如,0)的一參考聲道或信號指示符。替代地,回應於判定最終時間失配值為負,編碼器可產生具有指示第二音訊信號為「參考」信號且第一音訊信號為「目標」信號之一第二值(例如,1)的參考聲道或信號指示符。
編碼器可估計相關聯於參考信號及經非因果移位目標信號之一相對增益(例如,一相對增益參數)。舉例而言,回應於判定最終時間失配值為正,編碼器可估計用以正規化或等化第一音訊信號相對於第二音訊信號之振幅或功率位準的一增益值,該增益值被偏移達到該非因果時間失配值(例如,最終時間失配值之絕對值)。替代地,回應於判定最終時間失配值為負,編碼器可估計用以正規化或等化經非因果移位第一音訊信號相對於第二音訊信號之振幅或功率位準的一增益值。在一些實例中,編碼器可估計用以正規化或等化「參考」信號相對於經非因果移位「目標」信號之振幅或功率位準的一增益值。在其他實例中,編碼器可基於參考信號相對於目標信號(例如,未移位目標信號)估計增益值(例如,一相對增益值)。
編碼器可基於參考信號、目標信號、非因果時間失配值及相對增益參數產生至少一個經編碼信號(例如,一中間信號、一旁信號或同時產生兩者)。在其他實施方案中,編碼器可基於參考聲道及經時間失配調整目標聲道產生至少一個經編碼信號(例如,一中間聲道、一旁聲道或同時產生兩者)。旁信號可對應於第一音訊信號之第一訊框之第一樣本與第二音訊信號之經選擇訊框之經選擇樣本之間的一差。編碼器可基於最終時間失配值選擇經選擇訊框。由於與對應於由器件在與第一訊框同時接收的第二音訊信號之訊框的第二音訊信號之其他樣本相比較,第一樣本與經選擇樣本之間的差縮減,故可使用較少位元以編碼旁聲道信號。器件之傳輸器可傳輸至少一個經編碼信號、非因果時間失配值、相對增益參數、參考聲道或信號指示符或其組合。
編碼器可基於參考信號、目標信號、非因果時間失配值、相對增益參數、第一音訊信號之特定訊框之低頻帶參數、特定訊框之高頻帶參數或其組合而產生至少一個經編碼信號(例如,中間信號、旁信號或兩者)。特定訊框可先於第一訊框。可使用來自一或多個先前訊框之某些低頻帶參數、高頻帶參數或其組合以編碼第一訊框之中間信號、旁信號或兩者。基於低頻帶參數、高頻帶參數或其組合而編碼中間信號、旁信號或兩者可改良非因果時間失配值及聲道間相對增益參數之估計。低頻帶參數、高頻帶參數或其組合可包括音調參數、發聲參數、寫碼器類型參數、低頻帶能量參數、高頻帶能量參數、傾角參數、音調增益參數、FCB增益參數、寫碼模式參數、語音活動參數、雜訊估計參數、信雜比參數、共振峰參數、話語/音樂決策參數、非因果移位、聲道間增益參數或其組合。器件之傳輸器可傳輸至少一個經編碼信號、非因果時間失配值、相對增益參數、參考聲道(或信號)指示符或其組合。在本發明中,諸如「判定」、「計算」、「移位」、「調整」等等之術語可用以描述如何執行一或多個操作。應注意,此類術語不應被認作限制性的,且其他技術可用以執行相似操作。
根據一些實施方案,最終時間失配值(例如,移位值)為指示目標聲道與參考聲道之間的「真」移位的「未量化」值。儘管所有數位值歸因於由儲存或使用數位值之系統提供之精確度而「經量化」,但如本文中所使用,數位值在藉由用以縮減數位值之精確度(例如,用以縮減相關聯於數位值之範圍或頻寬)之量化操作而產生的情況下「經量化」,且否則「未量化」。作為一非限制性實例,第一音訊信號可為目標聲道,且第二音訊信號可為參考聲道。若目標聲道與參考聲道之間的真移位為三十七個樣本,則目標聲道可在編碼器處被移位三十七個樣本以產生與參考聲道在時間上對準之經移位目標聲道。在其他實施方案中,兩個聲道皆可經移位使得該等聲道之間的相對移位等於最終移位值(在此實例中為37個樣本)。對聲道進行此相對移位達該移位值會達成在時間上對準該等聲道之效應。高效率編碼器可儘可能地對準聲道以縮減寫碼熵,且因此增加寫碼效率,此係因為寫碼熵對聲道之間的移位改變敏感。經移位目標聲道及參考聲道可用以產生被編碼且作為位元串流之部分而傳輸至解碼器之中間聲道。另外,最終時間失配值可被量化且作為位元串流之部分而傳輸至解碼器。舉例而言,可使用為四之「底限(floor)」來量化最終時間失配值,使得經量化最終時間失配值等於九(例如,大致37/4)。
解碼器可解碼中間聲道以產生經解碼中間聲道,且解碼器可基於經解碼中間聲道產生第一聲道及第二聲道。舉例而言,解碼器可使用包括於位元串流中之立體聲參數來升混經解碼中間聲道以產生第一聲道及第二聲道。第一聲道及第二聲道可在解碼器處在時間上對準;然而,解碼器可基於經量化最終時間失配值而使該等聲道中之一或多者相對於彼此移位。舉例而言,若第一聲道對應於編碼器處之目標聲道(例如,第一音訊信號),則解碼器可使第一聲道移位三十六個樣本(例如,4*9)以產生經移位第一聲道。在感知上,經移位第一聲道及第二聲道分別相似於目標聲道及參考聲道。舉例而言,若編碼器處之目標聲道與參考聲道之間的三十七樣本移位對應於10 ms移位,則解碼器處之經移位第一聲道與第二聲道之間的三十六樣本移位在感知上相似於且可在感知上不可區別於三十七樣本移位。
參看圖1,展示系統100之特定說明性實例。系統100包括第一器件104,其經由網路120以通信方式耦接至第二器件106。網路120可包括一或多個無線網路、一或多個有線網路或其組合。
第一器件104包括編碼器114、傳輸器110及一或多個輸入介面112。輸入介面112中之第一輸入介面可耦接至第一麥克風146。輸入介面112中之第二輸入介面可耦接至第二麥克風148。第一器件104亦可包括經組態以儲存分析資料之記憶體153,如下文所描述。第二器件106可包括解碼器118及記憶體154。第二器件106可耦接至第一喇叭142、第二喇叭144或兩者。
在操作期間,第一器件104可經由第一輸入介面自第一麥克風146接收第一音訊信號130,且可經由第二輸入介面自第二麥克風148接收第二音訊信號132。第一音訊信號130可對應於右聲道信號或左聲道信號中之一者。第二音訊信號132可對應於右聲道信號或左聲道信號中之另一者。如本文中所描述,第一音訊信號130可對應於參考聲道,且第二音訊信號132可對應於目標聲道。然而,應理解,在其他實施方案中,第一音訊信號130可對應於目標聲道,且第二音訊信號132可對應於參考聲道。在其他實施方案中,可能完全不存在參考聲道及目標聲道之指派。在此類狀況下,可對該等聲道中之任一者或兩者執行編碼器處之聲道對準及解碼器處之聲道去對準,使得該等聲道之間的相對移位係基於移位值。
第一麥克風146及第二麥克風148可自聲源152(例如,使用者、揚聲器、環境雜訊、樂器等等)接收音訊。在一特定態樣中,第一麥克風146、第二麥克風148或兩者可自多個聲源接收音訊。多個聲源可包括主要(或最主要)聲源(例如,聲源152)及一或多個次要聲源。一或多個次要聲源可對應於交通、背景音樂、另一談話者、街道雜訊等等。聲源152(例如,主要聲源)與第一麥克風146之接近程度可大於與第二麥克風148之接近程度。因此,在輸入介面112處經由第一麥克風146自聲源152接收音訊信號之時間可早於經由第二麥克風148自聲源152接收音訊信號之時間。經由多個麥克風之多聲道信號獲取之此自然延遲可在第一音訊信號130與第二音訊信號132之間引入時間移位。
第一器件104可將第一音訊信號130、第二音訊信號132或兩者儲存於記憶體153中。編碼器114可判定指示針對第一訊框190之第一音訊信號130相對於第二音訊信號132之移位(例如,非因果移位)的第一移位值180(例如,非因果移位值)。第一移位值180可為表示針對第一訊框190之參考聲道(例如,第一音訊信號130)與目標聲道(例如,第二音訊信號132)之間的移位的值(例如,未量化值)。第一移位值180可儲存於記憶體153中作為分析資料。編碼器114亦可判定指示針對第二訊框192之第一音訊信號130相對於第二音訊信號132之移位的第二移位值184。第二訊框192可在第一訊框190之後(例如,在時間上遲於第一訊框190)。第二移位值184可為表示針對第二訊框192之參考聲道(例如,第一音訊信號130)與目標聲道(例如,第二音訊信號132)之間的移位的值(例如,未量化值)。第二移位值184亦可儲存於記憶體153中作為分析資料。
因此,移位值180、184(例如,失配值)可分別指示針對第一訊框190及第二訊框192之第一音訊信號130與第二音訊信號132之間的時間失配(例如,時間延遲)量。如本文中所提及,「時間延遲(time delay)」可對應於「時間延遲(temporal delay)」。時間失配可指示第一音訊信號130經由第一麥克風146之接收與第二音訊信號132經由第二麥克風148之接收之間的時間延遲。舉例而言,移位值180、184之第一值(例如,正值)可指示第二音訊信號132相對於第一音訊信號130延遲。在此實例中,第一音訊信號130可對應於前導信號且第二音訊信號132可對應於滯後信號。移位值180、184之第二值(例如,負值)可指示第一音訊信號130相對於第二音訊信號132延遲。在此實例中,第一音訊信號130可對應於滯後信號且第二音訊信號132可對應於前導信號。移位值180、184之第三值(例如,0)可指示第一音訊信號130與第二音訊信號132之間無延遲。
編碼器114可量化第一移位值180以產生第一經量化移位值181。出於說明起見,若第一移位值180(例如,真移位值)等於三十七個樣本,則編碼器114可基於底限而量化第一移位值180以產生第一經量化移位值181。作為一非限制性實例,若底限等於四,則第一經量化移位值181可等於九(例如,大致37/4)。如下文所描述,第一移位值180可用以產生中間聲道之第一部分191,且第一經量化移位值181可被編碼至位元串流160中且被傳輸至第二器件106。如本文中所使用,信號或聲道之「部分」包括:信號或聲道之一或多個訊框;信號或聲道之一或多個子訊框;信號或聲道之一或多個樣本、位元、厚塊、字或其他片段;或其任何組合。以相似方式,編碼器114可量化第二移位值184以產生第二經量化移位值185。出於說明起見,若第二移位值184等於三十六個樣本,則編碼器114可基於底限而量化第二移位值184以產生第二經量化移位值185。作為一非限制性實例,第二經量化移位值185亦可等於九(例如,36/4)。如下文所描述,第二移位值184可用以產生中間聲道之第二部分193,且第二經量化移位值185可被編碼至位元串流160中且被傳輸至第二器件106。
編碼器114亦可基於移位值180、184產生參考信號指示符。舉例而言,編碼器114可回應於判定第一移位值180指示第一值(例如,正值)而將參考信號指示符產生為具有指示第一音訊信號130為「參考」信號且第二音訊信號132對應於「目標」信號之第一值(例如,0)。
編碼器114可基於移位值180、184在時間上對準第一音訊信號130與第二音訊信號132。舉例而言,對於第一訊框190,編碼器114可使第二音訊信號132在時間上移位第一移位值180以產生與第一音訊信號130在時間上對準之經移位第二音訊信號。儘管第二音訊信號132被描述為在時域中經歷時間移位,但應理解,第二音訊信號132可在頻域中經歷相移以產生經移位第二音訊信號132。舉例而言,第一移位值180可對應於頻域移位值。對於第二訊框192,編碼器114可使第二音訊信號132在時間上移位第二移位值184以產生與第一音訊信號130在時間上對準之經移位第二音訊信號。儘管第二音訊信號132被描述為在時域中經歷時間移位,但應理解,第二音訊信號132可在頻域中經歷相移以產生經移位第二音訊信號132。舉例而言,第二移位值184可對應於頻域移位值。
編碼器114可基於參考聲道之樣本及目標聲道之樣本而針對每一訊框產生一或多個額外立體聲參數(例如,除了移位值180、184以外之其他立體聲參數)。作為一非限制性實例,編碼器114可針對第一訊框190產生第一立體聲參數182且針對第二訊框192產生第二立體聲參數186。立體聲參數182、186之非限制性實例可包括其他移位值、聲道間相位差參數、聲道間位準差參數、聲道間時差參數、聲道間相關性參數、頻譜傾角參數、聲道間增益參數、聲道間發聲參數或聲道間音調參數。
出於說明起見,若立體聲參數182、186對應於增益參數,則對於每一訊框,編碼器114可基於參考信號(例如,第一音訊信號130)之樣本且基於目標信號(例如,第二音訊信號132)之樣本產生增益參數(例如,寫碼器-解碼器增益參數)。舉例而言,對於第一訊框190,編碼器114可基於第一移位值180(例如,非因果移位值)選擇第二音訊信號132之樣本。如本文中所提及,基於移位值選擇音訊信號之樣本可對應於藉由基於移位值調整(例如,移位)音訊信號而產生經修改(例如,經時移或經頻移)音訊信號且選擇經修改音訊信號之樣本。舉例而言,編碼器114可藉由基於第一移位值180移位第二音訊信號132而產生經時移第二音訊信號,且可選擇經時移第二音訊信號之樣本。編碼器114可回應於判定第一音訊信號130為參考信號而基於第一音訊信號130之第一訊框190之第一樣本判定經選擇樣本之增益參數。作為一實例,增益參數可基於以下方程式中之一者:
, 方程式1a
, 方程式1b
, 方程式1c
, 方程式1d
, 方程式1e
, 方程式1f
其中
對應於用於降混處理之相對增益參數,
對應於「參考」信號之樣本,
對應於第一訊框190之第一移位值180,且
對應於「目標」信號之樣本。可例如基於方程式1a至1f中之一者修改增益參數(
),以併有長期平滑/遲滯邏輯以避免訊框之間的大增益跳躍。
編碼器114可量化立體聲參數182、186以產生被編碼至位元串流160中且被傳輸至第二器件106之經量化立體聲參數183、187。舉例而言,編碼器114可量化第一立體聲參數182以產生第一經量化立體聲參數183,且編碼器114可量化第二立體聲參數186以產生第二經量化立體聲參數187。經量化立體聲參數183、187分別相比於立體聲參數182、186可具有較低解析度(例如,較少精確度)。
對於每一訊框190、192,編碼器114可基於移位值180、184、其他立體聲參數182、186及音訊信號130、132產生一或多個經編碼信號。舉例而言,對於第一訊框190,編碼器114可基於第一移位值180(例如,未量化移位值)、第一立體聲參數182及音訊信號130、132產生中間聲道之第一部分191。另外,對於第二訊框192,編碼器114可基於第二移位值184(例如,未量化移位值)、第二立體聲參數186及音訊信號130、132產生中間聲道之第二部分193。根據一些實施方案,編碼器114可基於移位值180、184、其他立體聲參數182、186及音訊信號130、132而針對每一訊框190、192產生旁聲道(未展示)。
舉例而言,編碼器114可基於以下方程式中之一者產生中間聲道之部分191、193:
, 方程式2a
, 方程式2b
,其中
可採取任一任意值, 方程式2c
其中
對應於中間聲道,
對應於用於降混處理之相對增益參數(例如,立體聲參數182、186),
對應於「參考」信號之樣本,
對應於移位值180、184,且
對應於「目標」信號之樣本。
編碼器114可基於以下方程式中之一者產生旁聲道:
, 方程式3a
, 方程式3b
,其中
可採取任一任意值, 方程式3c
其中
對應於旁聲道信號,
對應於用於降混處理之相對增益參數(例如,立體聲參數182、186),
對應於「參考」信號之樣本,
對應於移位值180、184,且
對應於「目標」信號之樣本。
傳輸器110可經由網路120將位元串流160傳輸至第二器件106。第一訊框190及第二訊框192可被編碼至位元串流160中。舉例而言,中間聲道之第一部分191、第一經量化移位值181及第一經量化立體聲參數183可被編碼至位元串流160中。另外,中間聲道之第二部分193、第二經量化移位值185及第二經量化立體聲參數187可被編碼至位元串流160中。旁聲道資訊亦可被編碼於位元串流160中。儘管未展示,但額外資訊亦可針對每一訊框190、192被編碼至位元串流160中。作為一非限制性實例,參考聲道指示符可針對每一訊框190、192被編碼至位元串流160中。
歸因於不良傳輸條件,被編碼至位元串流160中之一些資料可能會在傳輸中遺失。封包遺失可能會歸因於不良傳輸條件而發生,訊框擦除可能會歸因於不良無線電條件而發生,封包可能會歸因於高抖動而遲到等等。根據非限制性說明性實例,第二器件106可接收位元串流160之第一訊框190以及第二訊框192之中間聲道之第二部分193。因此,第二經量化移位值185及第二經量化立體聲參數187可能會歸因於不良傳輸條件而在傳輸中遺失。
第二器件106可因此接收如由第一器件104所傳輸之位元串流160之至少一部分。第二器件106可將位元串流160之經接收部分儲存於記憶體154中(例如,緩衝器中)。舉例而言,第一訊框190可儲存於記憶體154中,且第二訊框192之中間聲道之第二部分193亦可儲存於記憶體154中。
解碼器118可解碼第一訊框190以產生對應於第一音訊信號130之第一輸出信號126,及產生對應於第二音訊信號132之第二輸出信號128。舉例而言,解碼器118可解碼中間聲道之第一部分191以產生經解碼中間聲道之第一部分170。解碼器118亦可對經解碼中間聲道之第一部分170執行變換操作以產生經頻域(frequency-domain;FD)解碼中間聲道之第一部分171。解碼器118可升混經頻域解碼中間聲道之第一部分171以產生相關聯於第一輸出信號126之第一頻域聲道(未展示)及相關聯於第二輸出信號128之第二頻域聲道(未展示)。在升混期間,解碼器118可將第一經量化立體聲參數183應用於經頻域解碼中間聲道之第一部分171。
應注意,在其他實施方案中,解碼器118可能不執行變換操作,而是基於中間聲道、一些立體聲參數(例如,降混增益)且另外在可用時亦基於時域中之經解碼旁聲道執行升混,以產生相關聯於第一輸出信號126之第一時域聲道(未展示)及相關聯於第二輸出信號128之第二時域聲道(未展示)。
若第一經量化移位值181對應於頻域移位值,則解碼器118可使第二頻域聲道移位第一經量化移位值181以產生第二經移位頻域聲道(未展示)。解碼器118可對第一頻域聲道執行反變換操作以產生第一輸出信號126。解碼器118亦可對第二經移位頻域聲道執行反變換操作以產生第二輸出信號128。
若第一經量化移位值181對應於時域移位值,則解碼器118可對第一頻域聲道執行反變換操作以產生第一輸出信號126。解碼器118亦可對第二頻域聲道執行反變換操作以產生第二時域聲道。解碼器118可使第二時域聲道移位第一經量化移位值181以產生第二輸出信號128。因此,解碼器118可使用第一經量化移位值181以模擬第一輸出信號126與第二輸出信號128之間的可感知差。第一喇叭142可輸出第一輸出信號126,且第二喇叭144可輸出第二輸出信號128。在一些狀況下,可在時域中執行升混以直接產生第一時域聲道及第二時域聲道之實施方案中省略反變換操作,如上文所描述。亦應注意,解碼器118處之時域移位值之存在可僅僅指示解碼器經組態以執行時域移位,且在一些實施方案中,儘管時域移位可在解碼器118處可用(指示解碼器在時域中執行移位操作),但供接收到位元串流之編碼器可能已執行頻域移位操作或時域移位操作以用於對準聲道。
若解碼器118判定第二訊框192不可用於解碼操作(例如,判定第二經量化移位值185及第二經量化立體聲參數187不可用),則解碼器118可基於相關聯於第一訊框190之立體聲參數而針對第二訊框192產生輸出信號126、128。舉例而言,解碼器118可基於第一經量化移位值181估計或內插第二經量化移位值185。另外,解碼器118可基於第一經量化立體聲參數183估計或內插第二經量化立體聲參數187。
在估計第二經量化移位值185及第二經量化立體聲參數187之後,解碼器118可以與針對第一訊框190產生輸出信號126、128之方式相似的方式針對第二訊框192產生輸出信號126、128。舉例而言,解碼器118可解碼中間聲道之第二部分193以產生經解碼中間聲道之第二部分172。解碼器118亦可對經解碼中間聲道之第二部分172執行變換操作以產生經頻域解碼中間聲道之第二部分173。基於經估計第二經量化移位值185及經估計第二經量化立體聲參數187,解碼器118可升混經頻域解碼中間聲道之第二部分173,對經升混信號執行反變換,且移位所得信號以產生輸出信號126、128。關於圖2更詳細地描述解碼操作之實例。
系統100可在編碼器114處儘可能地對準聲道以縮減寫碼熵,且因此增加寫碼效率,此係因為寫碼熵對聲道之間的移位改變敏感。舉例而言,編碼器114可使用未量化移位值以準確地對準聲道,此係因為未量化移位值具有相對高解析度。在解碼器118處,相較於使用未量化移位值,經量化立體聲參數可用以使用縮減數目個位元來模擬輸出信號126、128之間的可感知差,且可使用一或多個先前訊框之立體聲參數來內插或估計遺漏立體聲參數(歸因於不良傳輸)。根據一些實施方案,移位值180、184(例如,未量化移位值)可用以使目標聲道在頻域中移位,且經量化移位值181、185可用以使目標聲道在時域中移位。舉例而言,用於時域立體聲編碼之移位值相比於用於頻域立體聲編碼之移位值可具有較低解析度。
參看圖2,展示繪示解碼器118之特定實施方案的圖解。解碼器118包括中間聲道解碼器202、變換單元204、升混器206、反變換單元210、反變換單元212及移位器214。
可將圖1之位元串流160提供至解碼器118。舉例而言,可將第一訊框190之中間聲道之第一部分191及第二訊框192之中間聲道之第二部分193提供至中間聲道解碼器202。另外,可將立體聲參數201提供至升混器206及移位器214。立體聲參數201可包括相關聯於第一訊框190之第一經量化移位值181及相關聯於第一訊框190之第一經量化立體聲參數183。如上文關於圖1所描述,歸因於不良傳輸條件,解碼器118可能不會接收到相關聯於第二訊框192之第二經量化移位值185及相關聯於第二訊框192之第二經量化立體聲參數187。
為了解碼第一訊框190,中間聲道解碼器202可解碼中間聲道之第一部分191以產生經解碼中間聲道之第一部分170(例如,時域中間聲道)。根據一些實施方案,可將兩個不對稱視窗應用於經解碼中間聲道之第一部分170以產生時域中間聲道之經視窗化部分。將經解碼中間聲道之第一部分170提供至變換單元204。變換單元204可經組態以對經解碼中間聲道之第一部分170執行變換操作以產生經頻域解碼中間聲道之第一部分171。將經頻域解碼中間聲道之第一部分171提供至升混器206。根據一些實施方案,可完全跳過視窗化及變換操作,且可將經解碼中間聲道之第一部分170(例如,時域中間聲道)直接提供至升混器206。
升混器206可升混經頻域解碼中間聲道之第一部分171以產生頻域聲道250之部分及頻域聲道254之部分。升混器206可在升混操作期間將第一經量化立體聲參數183應用於經頻域解碼中間聲道之第一部分171以產生頻域聲道250、254之部分。根據第一經量化移位值181包括頻域移位(例如,第一經量化移位值181對應於第一經量化頻域移位值281)之實施方案,升混器206可基於第一經量化頻域移位值281執行頻域移位(例如,相移)以產生頻域聲道254之部分。將頻域聲道250之部分提供至反變換單元210,且將頻域聲道254之部分提供至反變換單元212。根據一些實施方案,升混器206可經組態以在可在時域中應用立體聲參數(例如,基於目標增益值)之情況下對時域聲道進行操作。
反變換單元210可對頻域聲道250之部分執行反變換操作以產生時域聲道260之部分。將時域聲道260之部分提供至移位器214。反變換單元212可對頻域聲道254之部分執行反變換操作以產生時域聲道264之部分。亦將時域聲道264之部分提供至移位器214。在時域中執行升混操作之實施方案中,可跳過升混操作之後的反變換操作。
根據第一經量化移位值181對應於第一經量化頻域移位值281之實施方案,移位器214可略過移位操作且傳遞時域聲道260、264之部分分別作為輸出信號126、128之部分。根據第一經量化移位值181包括時域移位(例如,第一經量化移位值181對應於第一經量化時域移位值291)之實施方案,移位器214可使時域聲道264之部分移位第一經量化時域移位值291以產生第二輸出信號128之部分。
因此,解碼器118可使用具有縮減精確度之經量化移位值(相較於編碼器114處使用之未量化移位值)以針對第一訊框190產生輸出信號126、128之部分。使用經量化移位值以使輸出信號128相對於輸出信號126移位可復原使用者在編碼器114處對移位之感知。
為了解碼第二訊框192,中間聲道解碼器202可解碼中間聲道之第二部分193以產生經解碼中間聲道之第二部分172(例如,時域中間聲道)。根據一些實施方案,可將兩個不對稱視窗應用於經解碼中間聲道之第二部分172以產生時域中間聲道之經視窗化部分。將經解碼中間聲道之第二部分172提供至變換單元204。變換單元204可經組態以對經解碼中間聲道之第二部分172執行變換操作以產生經頻域解碼中間聲道之第二部分173。將經頻域解碼中間聲道之第二部分173提供至升混器206。根據一些實施方案,可完全跳過視窗化及變換操作,且可將經解碼中間聲道之第二部分172(例如,時域中間聲道)直接提供至升混器206。
如上文關於圖1所描述,歸因於不良傳輸條件,解碼器118可能不會接收到第二經量化移位值185及第二經量化立體聲參數187。結果,針對第二訊框192之立體聲參數可能不會由升混器206及移位器214可存取。升混器206包括立體聲參數內插器208,其經組態以基於第一經量化頻域移位值281內插(或估計)第二經量化移位值185。舉例而言,立體聲參數內插器208可基於第一經量化頻域移位值281產生第二經內插頻域移位值285。立體聲參數內插器208亦可經組態以基於第一經量化立體聲參數183內插(或估計)第二經量化立體聲參數187。舉例而言,立體聲參數內插器208可基於第一經量化立體聲參數183產生第二經內插立體聲參數287。
升混器206可升混經頻域解碼中間聲道之第二部分173以產生頻域聲道252之部分及頻域聲道256之部分。升混器206可在升混操作期間將第二經內插立體聲參數287應用於經頻域解碼中間聲道之第二部分173以產生頻域聲道252、256之部分。根據第一經量化移位值181包括頻域移位(例如,第一經量化移位值181對應於第一經量化頻域移位值281)之實施方案,升混器206可基於第二經內插頻域移位值285執行頻域移位(例如,相移)以產生頻域聲道256之部分。將頻域聲道252之部分提供至反變換單元210,且將頻域聲道256之部分提供至反變換單元212。
反變換單元210可對頻域聲道252之部分執行反變換操作以產生時域聲道262之部分。將時域聲道262之部分提供至移位器214。反變換單元212可對頻域聲道256之部分執行反變換操作以產生時域聲道266之部分。亦將時域聲道266之部分提供至移位器214。在升混器206對時域聲道進行操作之實施方案中,可將升混器206之輸出提供至移位器214,且可跳過或省略反變換單元210、212。
移位器214包括移位值內插器216,其經組態以基於第一經量化時域移位值291內插(或估計)第二經量化移位值185。舉例而言,移位值內插器216可基於第一經量化時域移位值291產生第二經內插時域移位值295。根據第一經量化移位值181對應於第一經量化頻域移位值281之實施方案,移位器214可略過移位操作且傳遞時域聲道262、266之部分分別作為輸出信號126、128之部分。根據第一經量化移位值181對應於第一經量化時域移位值291之實施方案,移位器214可使時域聲道266之部分移位第二經內插時域移位值295以產生第二輸出信號128。
因此,解碼器118可基於立體聲參數或來自先前訊框之立體聲參數之變化而近似立體聲參數(例如,移位值)。舉例而言,解碼器118可自一或多個先前訊框之立體聲參數外插針對在傳輸(例如,第二訊框192)期間遺失之訊框之立體聲參數。
參看圖3,展示用於預測解碼器處之遺漏訊框之立體聲參數的圖解300。根據圖解300,可能會成功地將第一訊框190自編碼器114傳輸至解碼器118,且可能不會成功地將第二訊框192自編碼器114傳輸至解碼器118。舉例而言,第二訊框192可能會歸因於不良傳輸條件而在傳輸中遺失。
解碼器118可自第一訊框190產生經解碼中間聲道之第一部分170。舉例而言,解碼器118可解碼中間聲道之第一部分191以產生經解碼中間聲道之第一部分170。在使用關於圖2所描述之技術的情況下,解碼器118亦可基於經解碼中間聲道之第一部分170產生左聲道之第一部分302及右聲道之第一部分304。左聲道之第一部分302可對應於第一輸出信號126,且右聲道之第一部分304可對應於第二輸出信號128。舉例而言,解碼器118可使用第一經量化立體聲參數183及第一經量化移位值181以產生聲道302、304。
解碼器118可基於第一經量化移位值181內插(或估計)第二經內插頻域移位值285(或第二經內插時域移位值295)。根據其他實施方案,可基於相關聯於兩個或多於兩個先前訊框(例如,第一訊框190及在第一訊框之前的至少一訊框或在第二訊框192之後的訊框、位元串流160中之一或多個其他訊框,或其任何組合)之經量化移位值估計(例如,內插或外插)第二經內插移位值285、295。解碼器118亦可基於第一經量化立體聲參數183內插(或估計)第二經內插立體聲參數287。根據其他實施方案,可基於相關聯於兩個或多於兩個其他訊框(例如,第一訊框190及在第一訊框之前或之後的至少一訊框)之經量化立體聲參數估計第二經內插立體聲參數287。
另外,解碼器118可基於經解碼中間聲道之第一部分170(或相關聯於兩個或多於兩個先前訊框之中間聲道)內插(或估計)經解碼中間聲道之第二部分306。在使用關於圖2所描述之技術的情況下,解碼器118亦可基於經解碼中間聲道之經估計第二部分306產生左聲道之第二部分308及右聲道之第二部分310。左聲道之第二部分308可對應於第一輸出信號126,且右聲道之第二部分310可對應於第二輸出信號128。舉例而言,解碼器118可使用第二經內插立體聲參數287及第二經內插頻域量化移位值285以產生左聲道及右聲道。
參看圖4A,展示解碼信號之方法400。方法400可由圖1之第二器件106、圖1及圖2之解碼器118或兩者執行。
方法400包括:在402處,在解碼器處接收包括中間聲道及經量化值之位元串流,經量化值表示相關聯於編碼器之第一聲道(例如,參考聲道)與相關聯於編碼器之第二聲道(例如,目標聲道)之間的移位。經量化值係基於移位之值。該值相關聯於編碼器且相比於經量化值具有較大精確度。
方法400亦包括:在404處,解碼中間聲道以產生經解碼中間聲道。方法400進一步包括:在406處,基於經解碼中間聲道產生第一聲道(第一經產生聲道);及在408處,基於經解碼中間聲道及經量化值產生第二聲道(第二經產生聲道)。第一經產生聲道對應於相關聯於編碼器之第一聲道(例如,參考聲道),且第二經產生聲道對應於相關聯於編碼器之第二聲道(例如,目標聲道)。在一些實施方案中,第一聲道及第二聲道兩者可基於移位之經量化值。在一些實施方案中,解碼器可能不在移位操作之前明確地識別參考聲道及目標聲道。
因此,圖4A之方法400可使能夠對準編碼器旁聲道以縮減寫碼熵,且因此增加寫碼效率,此係因為寫碼熵對聲道之間的移位改變敏感。舉例而言,編碼器114可使用未量化移位值以準確地對準聲道,此係因為未量化移位值具有相對高解析度。可將經量化移位值傳輸至解碼器118以縮減資料傳輸資源使用量。在解碼器118處,可使用經量化移位參數以模擬輸出信號126、128之間的可感知差。
參看圖4B,展示解碼信號之方法450。在一些實施方案中,圖4B之方法450為圖4A之解碼音訊信號之方法400之更詳細版本。方法450可由圖1之第二器件106、圖1及圖2之解碼器118或兩者執行。
方法450包括:在452處,在解碼器處自編碼器接收位元串流。位元串流包括中間聲道及經量化值,經量化值表示相關聯於編碼器之參考聲道與相關聯於編碼器之目標聲道之間的移位。經量化值可基於移位之值(例如,未量化值),該值相比於經量化值具有較大精確度。舉例而言,參看圖1,解碼器118可自編碼器114接收位元串流160。位元串流160可包括中間聲道之第一部分191及第一經量化移位值181,第一經量化移位值181表示第一音訊信號130(例如,參考聲道)與第二音訊信號132(例如,目標聲道)之間的移位。第一經量化移位值181可基於第一移位值180(例如,未量化值)。
第一移位值180相比於第一經量化移位值181可具有較大精確度。舉例而言,第一經量化移位值181可對應於第一移位值180之低解析度版本。第一移位值可由編碼器114使用以在時間上匹配目標聲道(例如,第二音訊信號132)與參考聲道(例如,第一音訊信號130)。
方法450亦包括:在454處,解碼中間聲道以產生經解碼中間聲道。舉例而言,參看圖2,中間聲道解碼器202可解碼中間聲道之第一部分191以產生經解碼中間聲道之第一部分170。方法400亦包括:在456處,對經解碼中間聲道執行變換操作以產生經解碼頻域中間聲道。舉例而言,參看圖2,變換單元204可對經解碼中間聲道之第一部分170執行變換操作以產生經頻域解碼中間聲道之第一部分171。
方法450亦可包括:在458處,升混經解碼頻域中間聲道以產生頻域聲道之第一部分及第二頻域聲道。舉例而言,參看圖2,升混器206可升混經頻域解碼中間聲道之第一部分171以產生頻域聲道250之部分及頻域聲道254之部分。方法450亦可包括:在460處,基於頻域聲道之第一部分產生第一聲道。第一聲道可對應於參考聲道。舉例而言,反變換單元210可對頻域聲道250之該部分執行反變換操作以產生時域聲道260之部分,且移位器214可傳遞時域聲道260之該部分作為第一輸出信號126之部分。第一輸出信號126可對應於參考聲道(例如,第一音訊信號130)。
方法450亦可包括:在462處,基於第二頻域聲道產生一第二聲道。第二聲道可對應於目標聲道。根據一項實施方案,若經量化值對應於一頻域移位,則第二頻域聲道可在頻域中被移位達到該經量化值。舉例而言,參看圖2,升混器206可使頻域聲道254之部分移位達到該第一經量化頻域移位值281而至一第二經移位頻域聲道(未展示)。反變換單元212單元可對第二經移位頻域聲道執行一反變換以產生第二輸出信號128之部分。第二輸出信號128可對應於目標聲道(例如,第二音訊信號132)。
根據另一實施方案,若經量化值對應於一時域移位,則第二頻域聲道之一時域版本可被移位達到該經量化值。舉例而言,反變換單元212可對頻域聲道254之該部分執行一反變換操作以產生時域聲道264之部分。移位器214可使時域聲道264之部分移位達到該第一經量化時域移位值291以產生第二輸出信號128之部分。第二輸出信號128可對應於目標聲道(例如,第二音訊信號132)。
因此,圖4B之方法450可能促成對準編碼器旁聲道以縮減寫碼熵,且因此增加寫碼效率,此係因為寫碼熵對聲道之間的移位改變敏感。舉例而言,編碼器114可使用未量化移位值以準確地對準聲道,此係因為未量化移位值具有相對高解析度。可將經量化移位值傳輸至解碼器118以縮減資料傳輸資源使用量。在解碼器118處,可使用經量化移位參數以模擬輸出信號126、128之間的可感知差。
參看圖5A,展示解碼信號之另一方法500。方法500可由圖1之第二器件106、圖1及圖2之解碼器118或兩者執行。
方法500包括:在502處,接收位元串流之至少一部分。位元串流包括第一訊框及第二訊框。第一訊框包括中間聲道之第一部分及立體聲參數之第一值,且第二訊框包括中間聲道之第二部分及立體聲參數之第二值。
方法500亦包括:在504處,解碼中間聲道之第一部分以產生經解碼中間聲道之第一部分。方法500進一步包括:在506處,至少基於經解碼中間聲道之第一部分及立體聲參數之第一值產生左聲道之第一部分;及在508處,至少基於經解碼中間聲道之第一部分及立體聲參數之第一值產生右聲道之第一部分。該方法亦包括:在510處,回應於第二訊框不可用於解碼操作而至少基於立體聲參數之第一值產生左聲道之第二部分及右聲道之第二部分。左聲道之第二部分及右聲道之第二部分對應於第二訊框之經解碼版本。
根據一項實施方案,方法500包括:回應於第二訊框可用於解碼操作而基於立體聲參數之第一值及立體聲參數之第二值產生立體聲參數之經內插值。根據另一實施方案,方法500包括:回應於第二訊框不可用於解碼操作而至少基於立體聲參數之第一值、左聲道之第一部分及右聲道之第一部分至少產生左聲道之第二部分及右聲道之第二部分。
根據一項實施方案,方法500包括:回應於第二訊框不可用於解碼操作而至少基於立體聲參數之第一值、中間聲道之第一部分、左聲道之第一部分或右聲道之第一部分至少產生中間聲道之第二部分及旁聲道之第二部分。方法500亦包括:回應於第二訊框不可用於解碼操作而基於中間聲道之第二部分、旁聲道之第二部分及立體聲參數之第三值產生左聲道之第二部分及右聲道之第二部分。立體聲參數之第三值係至少基於立體聲參數之第一值、立體聲參數之經內插值及寫碼模式。
因此,方法500可使解碼器118能夠基於立體聲參數或來自先前訊框之立體聲參數之變化而近似立體聲參數(例如,移位值)。舉例而言,解碼器118可自一或多個先前訊框之立體聲參數外插針對在傳輸(例如,第二訊框192)期間遺失之訊框之立體聲參數。
參看圖5B,展示解碼信號之另一方法550。在一些實施方案中,圖5B之方法550為圖5A之解碼音訊信號之方法500之更詳細版本。方法550可由圖1之第二器件106、圖1及圖2之解碼器118或兩者執行。
方法550包括:在552處,在解碼器處自編碼器接收位元串流之至少一部分。位元串流包括第一訊框及第二訊框。第一訊框包括中間聲道之第一部分及立體聲參數之第一值,且第二訊框包括中間聲道之第二部分及立體聲參數之第二值。舉例而言,參看圖1,第二器件106可自編碼器114接收位元串流160之部分。位元串流包括第一訊框190及第二訊框192。第一訊框190包括中間聲道之第一部分191、第一經量化移位值181及第一經量化立體聲參數183。第二訊框192包括中間聲道之第二部分193、第二經量化移位值185及第二經量化立體聲參數187。
方法550亦包括:在554處,解碼中間聲道之第一部分以產生經解碼中間聲道之第一部分。舉例而言,參看圖2,中間聲道解碼器202可解碼中間聲道之第一部分191以產生經解碼中間聲道之第一部分170。方法550亦可包括:在556處,對經解碼中間聲道之第一部分執行變換操作以產生經解碼頻域中間聲道之第一部分。舉例而言,參看圖2,變換單元204可對經解碼中間聲道之第一部分170執行變換操作以產生經頻域解碼中間聲道之第一部分171。
方法550亦可包括:在558處,升混經解碼頻域中間聲道之第一部分以產生左頻域聲道之第一部分及右頻域聲道之第一部分。舉例而言,參看圖1,升混器206可升混經頻域解碼中間聲道之第一部分171以產生頻域聲道250及頻域聲道254。如本文中所描述,頻域聲道250可為左聲道,且頻域聲道254可為右聲道。然而,在其他實施方案中,頻域聲道250可為右聲道,且頻域聲道254可為左聲道。
方法550亦可包括:在560處,至少基於左頻域聲道之第一部分及立體聲參數之第一值產生左聲道之第一部分。舉例而言,升混器206可使用第一經量化立體聲參數183以產生頻域聲道250。反變換單元210可對頻域聲道250執行反變換操作以產生時域聲道260,且移位器214可傳遞時域聲道260作為第一輸出信號126(例如,根據方法550之左聲道之第一部分)。
方法550亦可包括:在562處,至少基於右頻域聲道之第一部分及立體聲參數之第一值產生右聲道之第一部分。舉例而言,升混器206可使用第一經量化立體聲參數183以產生頻域聲道254。反變換單元212可對頻域聲道254執行反變換操作以產生時域聲道264,且移位器214可傳遞(或選擇性地移位)時域聲道264作為第二輸出信號128(例如,根據方法550之右聲道之第一部分)。
方法550亦包括:在564處,判定第二訊框不可用於解碼操作。舉例而言,解碼器118可判定第二訊框192之一或多個部分不可用於解碼操作。出於說明起見,第二經量化移位值185及第二經量化立體聲參數187可能會基於不良傳輸條件而在傳輸(自第一器件104至第二器件106)中遺失。方法550亦包括:在566處,回應於判定第二訊框不可用而至少基於立體聲參數之第一值產生左聲道之第二部分及右聲道之第二部分。左聲道之第二部分及右聲道之第二部分可對應於第二訊框之經解碼版本。
舉例而言,立體聲參數內插器208可基於第一經量化頻域移位值281內插(或估計)第二經量化移位值185。出於說明起見,立體聲參數內插器208可基於第一經量化頻域移位值281產生第二經內插頻域移位值285。立體聲參數內插器208亦可基於第一經量化立體聲參數183內插(或估計)第二經量化立體聲參數187。舉例而言,立體聲參數內插器208可基於第一經量化立體聲參數183產生第二經內插立體聲參數287。
升混器206可升混經頻域解碼中間聲道之第二部分173以產生頻域聲道252及頻域聲道256。升混器206可在升混操作期間將第二經內插立體聲參數287應用於經頻解碼域中間聲道之第二部分173以產生頻域聲道252、256。根據第一經量化移位值181包括頻域移位(例如,第一經量化移位值181對應於第一經量化頻域移位值281)之實施方案,升混器206可基於第二經內插頻域移位值285執行頻域移位(例如,相移)以產生頻域聲道256。
反變換單元210可對頻域聲道252執行反變換操作以產生時域聲道262,且反變換單元212可對頻域聲道256執行反變換操作以產生時域聲道266。移位值內插器216可基於第一經量化時域移位值291內插(或估計)第二經量化移位值185。舉例而言,移位值內插器216可基於第一經量化時域移位值291產生第二經內插時域移位值295。根據第一經量化移位值181對應於第一經量化頻域移位值281之實施方案,移位器214可略過移位操作且傳遞時域聲道262、266分別作為輸出信號126、128。根據第一經量化移位值181對應於第一經量化時域移位值291之實施方案,移位器214可使時域聲道266移位第二經內插時域移位值295以產生第二輸出信號128。
因此,方法550可使解碼器118能夠基於針對一或多個先前訊框之立體聲參數內插(或估計)針對在傳輸(例如,第二訊框192)期間遺失之訊框之立體聲參數。
參看圖6,描繪器件(例如,無線通信器件)之特定說明性實例的方塊圖且將該器件整體上指定為600。在各種實施方案中,器件600可具有比圖6所繪示之組件更少或更多的組件。在一說明性實施方案中,器件600可對應於圖1之第一器件104、圖1之第二器件106或其組合。在一說明性實施方案中,器件600可執行參考圖1至圖3、圖4A、圖4B、圖5A及圖5B之系統及方法所描述之一或多個操作。
在一特定實施方案中,器件600包括處理器606(例如,中央處理單元(central processing unit;CPU))。器件600可包括一或多個額外處理器610(例如,一或多個數位信號處理器(digital signal processor;DSP))。處理器610可包括媒體(例如,話語及音樂)寫碼器-解碼器(coder-decoder;CODEC)608及回音消除器612。媒體CODEC 608可包括解碼器118、編碼器114或其組合。
器件600可包括記憶體153及CODEC 634。儘管媒體CODEC 608被繪示為處理器610之組件(例如,專用電路系統及/或可執行程式設計碼),但在其他實施方案中,媒體CODEC 608之一或多個組件,諸如解碼器118、編碼器114或其組合,可包括於處理器606、CODEC 634、另一處理組件或其組合中。
器件600可包括耦接至天線642之傳輸器110。器件600可包括耦接至顯示控制器626之顯示器628。一或多個揚聲器648可耦接至CODEC 634。一或多個麥克風646可經由輸入介面112耦接至CODEC 634。在一特定實施方案中,揚聲器648可包括圖1之第一喇叭142、圖1之第二喇叭144或其組合。在一特定實施方案中,麥克風646可包括圖1之第一麥克風146、圖1之第二麥克風148或其組合。CODEC 634可包括數位至類比轉換器(digital-to-analog converter;DAC)602及類比至數位轉換器(analog-to-digital converter;ADC)604。
記憶體153可包括可由處理器606、處理器610、CODEC 634、器件600之另一處理單元或其組合執行以執行參考圖1至圖3、圖4A、圖4B、圖5A、圖5B所描述之一或多個操作的指令660。指令660可執行以致使處理器(例如,處理器606、處理器610、CODEC 634、解碼器118、器件600之另一處理單元或其組合)執行圖4A之方法400、圖4B之方法450、圖5A之方法500、圖5B之方法550或其組合。
器件600之一或多個組件可經由專用硬體(例如,電路系統)實施、由執行指令以執行一或多個任務之處理器實施,或其組合。作為一實例,記憶體153或處理器606、處理器610及/或CODEC 634之一或多個組件可為記憶體器件,諸如隨機存取記憶體(random access memory;RAM)、磁阻式隨機存取記憶體(magnetoresistive random access memory;MRAM)、自旋力矩轉移MRAM(spin-torque transfer MRAM;STT-MRAM)、快閃記憶體、唯讀記憶體(read-only memory;ROM)、可程式化唯讀記憶體(programmable read-only memory;PROM)、可擦除可程式化唯讀記憶體(erasable programmable read-only memory;EPROM)、電可擦除可程式化唯讀記憶體(electrically erasable programmable read-only memory;EEPROM)、暫存器、硬碟、抽取式磁碟,或緊密光碟唯讀記憶體(compact disc read-only memory;CD-ROM)。記憶體器件可包括指令(例如,指令660),該等指令在由電腦(例如,CODEC 634中之處理器、處理器606及/或處理器610)執行時可致使該電腦執行參考圖1至圖3、圖4A、圖4B、圖5A、圖5B所描述之一或多個操作。作為一實例,記憶體153或處理器606、處理器610及/或CODEC 634之一或多個組件可為包括指令(例如,指令660)之非暫時性電腦可讀媒體,該等指令在由電腦(例如,CODEC 634中之處理器、處理器606及/或處理器610)執行時致使該電腦執行參考圖1至圖3、圖4A、圖4B、圖5A、圖5B所描述之一或多個操作。
在一特定實施方案中,器件600可包括於系統級封裝或系統單晶片器件(例如,行動台數據機(mobile station modem;MSM))622中。在一特定實施方案中,處理器606、處理器610、顯示控制器626、記憶體153、CODEC 634及傳輸器110包括於系統級封裝或系統單晶片器件622中。在一特定實施方案中,諸如觸控螢幕及/或小鍵盤之輸入器件630以及電力供應器644耦接至系統單晶片器件622。此外,在一特定實施方案中,如圖6所繪示,顯示器628、輸入器件630、揚聲器648、麥克風646、天線642及電力供應器644在系統單晶片器件622外部。然而,顯示器628、輸入器件630、揚聲器648、麥克風646、天線642及電力供應器644中之每一者可耦接至系統單晶片器件622之一組件,諸如介面或控制器。
器件600可包括無線電話、行動通信器件、行動電話、智慧型電話、蜂巢式電話、膝上型電腦、桌上型電腦、電腦、平板電腦、機上盒、個人數位助理(personal digital assistant;PDA)、顯示器件、電視、遊戲主控台、音樂播放器、收音機、視訊播放器、娛樂單元、通信器件、固定位置資料單元、個人媒體播放器、數位視訊播放器、數位視訊光碟(digital video disc;DVD)播放器、調諧器、攝影機、導航器件、解碼器系統、編碼器系統,或其任何組合。
在一特定實施方案中,本文中所揭示之系統及器件之一或多個組件可整合至解碼系統或裝置(例如,電子器件、CODEC,或其中之處理器)中,整合至編碼系統或裝置中,或兩者。在其他實施方案中,本文中所揭示之系統及器件之一或多個組件可整合至以下各者中:無線電話、平板電腦、桌上型電腦、膝上型電腦、機上盒、音樂播放器、視訊播放器、娛樂單元、電視、遊戲主控台、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元、個人媒體播放器,或另一類型之器件。
結合本文中所描述之技術,第一裝置包括用於接收位元串流的構件。位元串流包括中間聲道及經量化值,經量化值表示相關聯於編碼器之參考聲道與相關聯於編碼器之目標聲道之間的移位。經量化值係基於移位之值。該值相關聯於編碼器且相比於經量化值具有較大精確度。舉例而言,用於接收位元串流的構件可包括:圖1之第二器件106;第二器件106之接收器(未展示);圖1、圖2或圖6之解碼器118;圖6之天線642;一或多個其他電路、器件、組件、模組;或其組合。
第一裝置亦可包括用於解碼中間聲道以產生經解碼中間聲道的構件。舉例而言,用於解碼中間聲道的構件可包括:圖1、圖2或圖6之解碼器118;圖2之中間聲道解碼器202;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第一裝置亦可包括用於基於經解碼中間聲道產生第一聲道的構件。第一聲道對應於參考聲道。舉例而言,用於產生第一聲道的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元210;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第一裝置亦可包括用於基於經解碼中間聲道及經量化值產生第二聲道的構件。第二聲道對應於目標聲道。用於產生第二聲道的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元212;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
結合本文中所描述之技術,第二裝置包括用於自編碼器接收位元串流的構件。位元串流可包括中間聲道及經量化值,經量化值表示相關聯於編碼器之參考聲道與相關聯於編碼器之目標聲道之間的移位。經量化值可基於移位之值,該值相比於經量化值具有較大精確度。舉例而言,用於接收位元串流的構件可包括:圖1之第二器件106;第二器件106之接收器(未展示);圖1、圖2或圖6之解碼器118;圖6之天線642;一或多個其他電路、器件、組件、模組;或其組合。
第二裝置亦可包括用於解碼中間聲道以產生經解碼中間聲道的構件。舉例而言,用於解碼中間聲道的構件可包括:圖1、圖2或圖6之解碼器118;圖2之中間聲道解碼器202;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第二裝置亦可包括用於對經解碼中間聲道執行變換操作以產生經解碼頻域中間聲道的構件。舉例而言,用於執行變換操作的構件可包括:圖1、圖2或圖6之解碼器118;圖2之變換單元204;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第二裝置亦可包括用於升混經解碼頻域中間聲道以產生第一頻域聲道及第二頻域聲道的構件。舉例而言,用於升混的構件可包括:圖1、圖2或圖6之解碼器118;圖2之升混器206;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第二裝置亦可包括用於基於第一頻域聲道產生第一聲道的構件。第一聲道可對應於參考聲道。舉例而言,用於產生第一聲道的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元210;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第二裝置亦可包括用於基於第二頻域聲道產生第二聲道的構件。第二聲道可對應於目標聲道。若經量化值對應於頻域移位,則第二頻域聲道可在頻域中被移位經量化值。若經量化值對應於時域移位,則第二頻域聲道之時域版本可被移位經量化值。用於產生第二聲道的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元212;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
結合本文中所描述之技術,第三裝置包括用於接收位元串流之至少一部分的構件。位元串流包括第一訊框及第二訊框。第一訊框包括中間聲道之第一部分及立體聲參數之第一值,且第二訊框包括中間聲道之第二部分及立體聲參數之第二值。用於接收的構件可包括:圖1之第二器件106;第二器件106之接收器(未展示);圖1、圖2或圖6之解碼器118;圖6之天線642;一或多個其他電路、器件、組件、模組;或其組合。
第三裝置亦可包括用於解碼中間聲道之第一部分以產生經解碼中間聲道之第一部分的構件。舉例而言,用於解碼的構件可包括:圖1、圖2或圖6之解碼器118;圖2之中間聲道解碼器202;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第三裝置亦可包括用於至少基於經解碼中間聲道之第一部分及立體聲參數之第一值產生左聲道之第一部分的構件。舉例而言,用於產生左聲道之第一部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元210;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第三裝置亦可包括用於至少基於經解碼中間聲道之第一部分及立體聲參數之第一值產生右聲道之第一部分的構件。舉例而言,用於產生右聲道之第一部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元212;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第三裝置亦可包括用於回應於第二訊框不可用於解碼操作而至少基於立體聲參數之第一值產生左聲道之第二部分及右聲道之第二部分的構件。左聲道之第二部分及右聲道之第二部分對應於第二訊框之經解碼版本。用於產生左聲道之第二部分及右聲道之第二部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之立體聲移位值內插器216;圖2之立體聲參數內插器208;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
結合本文中所描述之技術,第四裝置包括用於自編碼器接收位元串流之至少一部分的構件。位元串流可包括第一訊框及第二訊框。第一訊框可包括中間聲道之第一部分及立體聲參數之第一值,且第二訊框可包括中間聲道之第二部分及立體聲參數之第二值。用於接收的構件可包括:圖1之第二器件106;第二器件106之接收器(未展示);圖1、圖2或圖6之解碼器118;圖6之天線642;一或多個其他電路、器件、組件、模組;或其組合。
第四裝置亦可包括用於解碼中間聲道之第一部分以產生經解碼中間聲道之第一部分的構件。舉例而言,用於解碼中間聲道之第一部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之中間聲道解碼器202;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第四裝置亦可包括用於對經解碼中間聲道之第一部分執行變換操作以產生經解碼頻域中間聲道之第一部分的構件。舉例而言,用於執行變換操作的構件可包括:圖1、圖2或圖6之解碼器118;圖2之變換單元204;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第四裝置亦可包括用於升混經解碼頻域中間聲道之第一部分以產生左頻域聲道之第一部分及右頻域聲道之第一部分的構件。舉例而言,用於升混的構件可包括:圖1、圖2或圖6之解碼器118;圖2之升混器206;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第四裝置亦可包括用於至少基於左頻域聲道之第一部分及立體聲參數之第一值產生左聲道之第一部分的構件。舉例而言,用於產生左聲道之第一部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元210;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第四裝置亦可包括用於至少基於右頻域聲道之第一部分及立體聲參數之第一值產生右聲道之第一部分的構件。舉例而言,用於產生右聲道之第一部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之反變換單元212;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
第四裝置亦可包括用於回應於第二訊框不可用之判定而至少基於立體聲參數之第一值產生左聲道之第二部分及右聲道之第二部分的構件。左聲道之第二部分及右聲道之第二部分可對應於第二訊框之經解碼版本。用於產生左聲道之第二部分及右聲道之第二部分的構件可包括:圖1、圖2或圖6之解碼器118;圖2之立體聲移位值內插器216;圖2之立體聲參數內插器208;圖2之移位器214;圖6之處理器606;圖6之處理器610;圖6之CODEC 634;圖6之指令660,其可由處理器執行;一或多個其他電路、器件、組件、模組;或其組合。
應注意,由本文中所揭示之系統及器件之一或多個組件執行的各種功能被描述為由某些組件或模組執行。組件及模組之此劃分係僅出於說明起見。在一替代實施方案中,由特定組件或模組執行之功能可被劃分於多個組件或模組之中。此外,在一替代實施方案中,兩個或多於兩個組件或模組可整合成單一組件或模組。每一組件或模組可使用硬體(例如,場可程式化閘陣列(field-programmable gate array;FPGA)器件、特殊應用積體電路(application-specific integrated circuit;ASIC)、DSP、控制器等等)、軟體(例如,可由處理器執行之指令)或其任何組合予以實施。
參看圖7,描繪基地台700之特定說明性實例的方塊圖。在各種實施方案中,基地台700可具有比圖7所繪示之組件更多的組件或更少的組件。在一說明性實例中,基地台700可包括圖1之第二器件106。在一說明性實例中,基地台700可根據參考圖1至圖3、圖4A、圖4B、圖5A、圖5B及圖6所描述之方法或系統中之一或多者而操作。
基地台700可為無線通信系統之部分。無線通信系統可包括多個基地台及多個無線器件。無線通信系統可為長期演進(Long Term Evolution;LTE)系統、分碼多重存取(Code Division Multiple Access;CDMA)系統、全球行動通信系統(Global System for Mobile Communications;GSM)系統、無線區域網路(wireless local area network;WLAN)系統,或某一其他無線系統。CDMA系統可實施寬頻CDMA(Wideband CDMA;WCDMA)、CDMA 1X、演進資料最佳化(Evolution-Data Optimized;EVDO)、分時同步CDMA(Time Division Synchronous CDMA;TD-SCDMA),或CDMA之某一其他版本。
無線器件亦可被稱作使用者設備(user equipment;UE)、行動台、終端機、存取終端機、用戶單元、台等等。無線器件可包括蜂巢式電話、智慧型電話、平板電腦、無線數據機、個人數位助理(PDA)、手持型器件、膝上型電腦、智慧筆記型電腦、迷你筆記型電腦、平板電腦、無線電話、無線區域迴路(wireless local loop;WLL)台、藍芽器件等等。無線器件可包括或對應於圖6之器件600。
基地台700之一或多個組件可執行(及/或在未展示之其他組件中執行)各種功能,諸如發送及接收訊息及資料(例如,音訊資料)。在一特定實例中,基地台700包括處理器706(例如,CPU)。基地台700可包括轉碼器710。轉碼器710可包括音訊CODEC 708。舉例而言,轉碼器710可包括經組態以執行音訊CODEC 708之操作的一或多個組件(例如,電路系統)。作為另一實例,轉碼器710可經組態以執行一或多個電腦可讀指令以執行音訊CODEC 708之操作。儘管音訊CODEC 708被繪示為轉碼器710之組件,但在其他實例中,音訊CODEC 708之一或多個組件可包括於處理器706、另一處理組件或其組合中。舉例而言,解碼器738(例如,聲碼器解碼器)可包括於接收器資料處理器764中。作為另一實例,編碼器736(例如,聲碼器編碼器)可包括於傳輸資料處理器782中。編碼器736可包括圖1之編碼器114。解碼器738可包括圖1之解碼器118。
轉碼器710可用於在兩個或多於兩個網路之間轉碼訊息及資料。轉碼器710可經組態以將訊息及音訊資料自第一格式(例如,數位格式)轉換為第二格式。出於說明起見,解碼器738可解碼具有第一格式之經編碼信號,且編碼器736可將經解碼信號編碼成具有第二格式之經編碼信號。另外或替代地,轉碼器710可經組態以執行資料速率調適。舉例而言,轉碼器710可在不改變音訊資料之格式的情況下降頻轉換資料速率或升頻轉換資料速率。出於說明起見,轉碼器710可將64 kbit/s信號降頻轉換成16 kbit/s信號。
基地台700可包括記憶體732。諸如電腦可讀儲存器件之記憶體732可包括指令。該等指令可包括可由處理器706、轉碼器710或其組合執行以執行參考圖1至圖3、圖4A、圖4B、圖5A、圖5B、圖6之方法及系統所描述之一或多個操作的一或多個指令。
基地台700可包括耦接至天線陣列之多個傳輸器及接收器(例如,收發器),諸如第一收發器752及第二收發器754。天線陣列可包括第一天線742及第二天線744。天線陣列可經組態成以無線方式與一或多個無線器件--諸如圖6之器件600--通信。舉例而言,第二天線744可自無線器件接收資料串流714(例如,位元串流)。資料串流714可包括訊息、資料(例如,經編碼話語資料)或其組合。
基地台700可包括網路連接760,諸如空載傳輸連接。網路連接760可經組態以與核心網路或無線通信網路之一或多個基地台通信。舉例而言,基地台700可經由網路連接760自核心網路接收第二資料串流(例如,訊息或音訊資料)。基地台700可處理第二資料串流以產生訊息或音訊資料,且經由天線陣列之一或多個天線將訊息或音訊資料提供至一或多個無線器件,或經由網路連接760將訊息或音訊資料提供至另一基地台。在一特定實施方案中,作為一說明性非限制性實例,網路連接760可為廣域網路(wide area network;WAN)連接。在一些實施方案中,核心網路可包括或對應於公眾交換電話網路(PSTN)、封包基幹網路或兩者。
基地台700可包括耦接至網路連接760及處理器706之媒體閘道器770。媒體閘道器770可經組態以在不同電信技術之媒體串流之間轉換。舉例而言,媒體閘道器770可在不同傳輸協定、不同寫碼方案或兩者之間轉換。出於說明起見,作為一說明性非限制性實例,媒體閘道器770可自PCM信號至即時輸送協定(Real-Time Transport Protocol;RTP)信號進行轉換。媒體閘道器770可在以下各者之間轉換資料:封包交換網路(例如,網際網路通訊協定語音(Voice Over Internet Protocol;VoIP)網路、IP多媒體子系統(IP Multimedia Subsystem;IMS)、第四代(fourth generation;4G)無線網路,諸如LTE、WiMax及UMB等等);電路交換網路(例如,PSTN);及混合式網路(例如,第二代(second generation;2G)無線網路,諸如GSM、GPRS及EDGE;第三代(third generation;3G)無線網路,諸如WCDMA、EV-DO及HSPA等等)。
另外,媒體閘道器770可包括諸如轉碼器710之轉碼器,且可經組態以在寫碼器-解碼器不相容時轉碼資料。舉例而言,作為一說明性非限制性實例,媒體閘道器770可在調適性多速率(Adaptive Multi-Rate;AMR)寫碼器-解碼器與G.711寫碼器-解碼器之間進行轉碼。媒體閘道器770可包括路由器及複數個實體介面。在一些實施方案中,媒體閘道器770亦可包括控制器(未展示)。在一特定實施方案中,媒體閘道器控制器可在媒體閘道器770外部,在基地台700外部,或兩者。媒體閘道器控制器可控制及協調多個媒體閘道器之操作。媒體閘道器770可自媒體閘道器控制器接收控制信號,且可用於在不同傳輸技術之間進行橋接,且可向最終使用者能力及連接添加服務。
基地台700可包括耦接至收發器752、754、接收器資料處理器764及處理器706之解調變器762,且接收器資料處理器764可耦接至處理器706。解調變器762可經組態以解調變自收發器752、754接收之經調變信號,及將經解調變資料提供至接收器資料處理器764。接收器資料處理器764可經組態以自經解調變資料提取訊息或音訊資料,及將訊息或音訊資料發送至處理器706。
基地台700可包括傳輸資料處理器782及傳輸多輸入多輸出(multiple input-multiple output;MIMO)處理器784。傳輸資料處理器782可耦接至處理器706及傳輸MIMO處理器784。傳輸MIMO處理器784可耦接至收發器752、754及處理器706。在一些實施方案中,傳輸MIMO處理器784可耦接至媒體閘道器770。作為一說明性非限制性實例,傳輸資料處理器782可經組態以自處理器706接收訊息或音訊資料,及基於諸如CDMA或正交分頻多工(orthogonal frequency-division multiplexing;OFDM)之寫碼方案寫碼訊息或音訊資料。傳輸資料處理器782可將經寫碼資料提供至傳輸MIMO處理器784。
可使用CDMA或OFDM技術將經寫碼資料與諸如導頻資料之其他資料一起多工以產生經多工資料。可接著由傳輸資料處理器782基於特定調變方案(例如,二元相移鍵控(「Binary phase-shift keying;BPSK」)、正交相移鍵控(「Quadrature phase-shift keying;QSPK」)、M元相移鍵控(「M-ary phase-shift keying;M-PSK」)、M元正交調幅(「M-ary Quadrature amplitude modulation;M-QAM」)等等)調變(亦即,符號映射)經多工資料以產生調變符號。在一特定實施方案中,可使用不同調變方案來調變經寫碼資料及其他資料。針對每一資料串流之資料速率、寫碼及調變可由處理器706所執行之指令判定。
傳輸MIMO處理器784可經組態以自傳輸資料處理器782接收調變符號,且可進一步處理調變符號且可對資料執行波束成形。舉例而言,傳輸MIMO處理器784可將波束成形權重應用於調變符號。
在操作期間,基地台700之第二天線744可接收資料串流714。第二收發器754可自第二天線744接收資料串流714,且可將資料串流714提供至解調變器762。解調變器762可解調變資料串流714之經調變信號,且將經解調變資料提供至接收器資料處理器764。接收器資料處理器764可自經解調變資料提取音訊資料,且將經提取音訊資料提供至處理器706。
處理器706可將音訊資料提供至轉碼器710以供轉碼。轉碼器710之解碼器738可將音訊資料自第一格式解碼成經解碼音訊資料,且編碼器736可將經解碼音訊資料編碼成第二格式。在一些實施方案中,相比於自無線器件接收之資料速率,編碼器736可使用較高資料速率(例如,升頻轉換)或較低資料速率(例如,降頻轉換)來編碼音訊資料。在其他實施方案中,可能不轉碼音訊資料。儘管轉碼(例如,解碼及編碼)被繪示為由轉碼器710執行,但轉碼操作(例如,解碼及編碼)可由基地台700之多個組件執行。舉例而言,解碼可由接收器資料處理器764執行,且編碼可由傳輸資料處理器782執行。在其他實施方案中,處理器706可將音訊資料提供至媒體閘道器770以供轉換為另一傳輸協定、寫碼方案或兩者。媒體閘道器770可經由網路連接760將經轉換資料提供至另一基地台或核心網路。
可經由處理器706將在編碼器736處產生之經編碼音訊資料提供至傳輸資料處理器782或網路連接760。可將來自轉碼器710之經轉碼音訊資料提供至傳輸資料處理器782以供根據諸如OFDM之調變方案而寫碼以產生調變符號。傳輸資料處理器782可將調變符號提供至傳輸MIMO處理器784以供進一步處理及波束成形。傳輸MIMO處理器784可應用波束成形權重,且可經由第一收發器752將調變符號提供至天線陣列之一或多個天線,諸如第一天線742。因此,基地台700可將對應於自無線器件接收之資料串流714的經轉碼資料串流716提供至另一無線器件。經轉碼資料串流716相比於資料串流714可具有不同的編碼格式、資料速率或兩者。在其他實施方案中,可將經轉碼資料串流716提供至網路連接760以供傳輸至另一基地台或核心網路。
熟習此項技術者應進一步瞭解,結合本文中所揭示之實施方案而描述的各種說明性邏輯區塊、組態、模組、電路及演算法步驟可被實施為電子硬體、由諸如硬體處理器之處理器件執行之電腦軟體,或兩者之組合。上文已大體上在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此類功能性被實施為硬體抑或軟體取決於特定應用及強加於整個系統之設計約束。熟習此項技術者可針對每一特定應用而以變化的方式實施所描述之功能性,但不應將此類實施決策解譯為造成脫離本發明之範疇。
結合本文中所揭示之實施方案所描述之方法或演算法之步驟可直接體現於硬體中、體現於由處理器執行之軟體模組中,或體現於兩者之組合中。軟體模組可駐存於諸如以下各者之記憶體器件中:隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦除可程式化唯讀記憶體(EPROM)、電可擦除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟,或緊密光碟唯讀記憶體(CD-ROM)。例示性記憶體器件耦接至處理器,使得處理器可自記憶體器件讀取資訊及將資訊寫入至記憶體器件。在替代方案中,記憶體器件可與處理器成一體式。處理器及儲存媒體可駐存於特殊應用積體電路(ASIC)中。ASIC可駐存於計算器件或使用者終端機中。在替代方案中,處理器及儲存媒體可作為離散組件駐存於計算器件或使用者終端機中。
提供對所揭示實施方案之先前描述以使熟習此項技術者能夠製作或使用所揭示實施方案。在不脫離本發明之範疇的情況下,對此等實施方案之各種修改對於熟習此項技術者而言將容易顯而易見,且本文中所定義之原理可應用於其他實施方案。因此,本發明並不意欲限於本文中所展示之實施方案,而是應符合可能與如由以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
100:系統
104:第一器件
106:第二器件
110:傳輸器
112:輸入介面
114:編碼器
118:解碼器
120:網路
126:第一輸出信號
128:第二輸出信號
130:第一音訊信號
132:第二音訊信號
142:第一喇叭
144:第二喇叭
146:第一麥克風
148:第二麥克風
152:聲源
153:記憶體
154:記憶體
160:位元串流
170:經解碼中間聲道之第一部分
171:經頻域解碼中間聲道之第一部分
172:經解碼中間聲道之第二部分
173:經頻域解碼中間聲道之第二部分
180:第一移位值
181:第一經量化移位值
182:第一立體聲參數
183:第一經量化立體聲參數
184:第二移位值
185:第二經量化移位值
186:第二立體聲參數
187:第二經量化立體聲參數
190:第一訊框
191:中間聲道之第一部分
192:第二訊框
193:中間聲道之第二部分
201:立體聲參數
202:中間聲道解碼器
204:變換單元
206:升混器
208:立體聲參數內插器
210:反變換單元
212:反變換單元
214:移位器
216:移位值內插器
250:頻域聲道
252:頻域聲道
254:頻域聲道
256:頻域聲道
260:時域聲道
262:時域聲道
264:時域聲道
266:時域聲道
281:第一經量化頻域移位值
285:第二經內插頻域移位值
287:第二經內插立體聲參數
291:第一經量化時域移位值
295:第二經內插時域移位值
300:圖解
302:左聲道之第一部分
304:右聲道之第一部分
306:經解碼中間聲道之第二部分
308:左聲道之第二部分
310:右聲道之第二部分
400:方法
402:步驟
404:步驟
406:步驟
408:步驟
450:方法
452:步驟
454:步驟
456:步驟
458:步驟
460:步驟
462:步驟
500:方法
502:步驟
504:步驟
506:步驟
508:步驟
510:步驟
550:方法
552:步驟
554:步驟
556:步驟
558:步驟
560:步驟
562:步驟
564:步驟
566:步驟
600:器件
602:數位至類比轉換器(DAC)
604:類比至數位轉換器(ADC)
606:處理器
608:媒體寫碼器-解碼器(CODEC)
610:處理器
612:回音消除器
622:行動台數據機(MSM)/系統單晶片器件
626:顯示控制器
628:顯示器
630:輸入器件
634:寫碼器-解碼器(CODEC)
642:天線
644:電力供應器
646:麥克風
648:揚聲器
660:指令
700:基地台
706:處理器
708:音訊寫碼器-解碼器(CODEC)
710:轉碼器
714:資料串流
716:經轉碼資料串流
732:記憶體
736:編碼器
738:解碼器
742:第一天線
744:第二天線
752:第一收發器
754:第二收發器
760:網路連接
762:解調變器
764:接收器資料處理器
770:媒體閘道器
782:傳輸資料處理器
784:傳輸多輸入多輸出(MIMO)處理器
圖1為包括解碼器之系統之特定說明性實例的方塊圖,解碼器可操作以估計遺漏訊框之立體聲參數且使用經量化立體聲參數來解碼音訊信號;
圖2為繪示圖1之解碼器的圖解;
圖3為預測解碼器處之遺漏訊框之立體聲參數之說明性實例的圖解;
圖4A為解碼音訊信號之方法之非限制性說明性實例;
圖4B為圖4A之解碼音訊信號之方法之更詳細版本的非限制性說明性實例;
圖5A為解碼音訊信號之方法之另一非限制性說明性實例;
圖5B為圖5A之解碼音訊信號之方法之更詳細版本的非限制性說明性實例;
圖6為包括解碼器之器件之特定說明性實例的方塊圖,解碼器用以估計遺漏訊框之立體聲參數且使用經量化立體聲參數來解碼音訊信號;且
圖7為基地台之方塊圖,基地台可操作以估計遺漏訊框之立體聲參數且使用經量化立體聲參數來解碼音訊信號。
118:解碼器
126:第一輸出信號
128:第二輸出信號
170:經解碼中間聲道之第一部分
171:經頻域解碼中間聲道之第一部分
172:經解碼中間聲道之第二部分
173:經頻域解碼中間聲道之第二部分
183:第一經量化立體聲參數
191:中間聲道之第一部分
193:中間聲道之第二部分
201:立體聲參數
202:中間聲道解碼器
204:變換單元
206:升混器
208:立體聲參數內插器
210:反變換單元
212:反變換單元
214:移位器
216:移位值內插器
250:頻域聲道
252:頻域聲道
254:頻域聲道
256:頻域聲道
260:時域聲道
262:時域聲道
264:時域聲道
266:時域聲道
281:第一經量化頻域移位值
285:第二經內插頻域移位值
287:第二經內插立體聲參數
291:第一經量化時域移位值
295:第二經內插時域移位值
Claims (30)
- 一種音訊信號解碼裝置,其包含: 一接收器,其經組態以接收一位元串流之至少一部分,該位元串流包含一第一訊框及一第二訊框,該第一訊框包括一中間聲道之一第一部分及一第一經量化立體聲參數,該第二訊框包括該中間聲道之一第二部分及一第二經量化立體聲參數,其中該接收器經進一步組態以接收一經量化值,該經量化值表示對應於該中間聲道之該第二部分之該第二訊框相對於該中間聲道之該第一部分之該第一訊框延遲的一時間量的一移位;及 一解碼器,其經組態以: 至少基於該中間聲道之該第一部分及該第一經量化立體聲參數產生一聲道之一第一部分;及 回應於該第二訊框不可用於解碼操作而: 基於一或多個先前訊框之立體聲參數估計該第二經量化立體聲參數;及 至少基於該經估計第二經量化立體聲參數產生該聲道之一第二部分,該聲道之該第二部分對應於該第二訊框之一經解碼版本。
- 如請求項1之裝置,其中該一或多個先前訊框之該等立體聲參數包括該第一經量化立體聲參數。
- 如請求項2之裝置,其中該解碼器經組態以藉由內插該第一經量化立體聲參數來估計該第二經量化立體聲參數。
- 如請求項2之裝置,其中該解碼器經組態以藉由外插該第一經量化立體聲參數來估計該第二經量化立體聲參數。
- 如請求項1之裝置,其中該解碼器經進一步組態以: 解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分; 對該經解碼中間聲道之該第一部分執行一變換操作以產生一經解碼頻域中間聲道之一第一部分; 基於該第一經量化立體聲參數升混該經解碼頻域中間聲道之該第一部分以產生一左頻域聲道之一第一部分及一右頻域聲道之一第一部分; 對該左頻域聲道之該第一部分執行一第一時域操作以產生一左聲道之一第一部分;及 對該右頻域聲道之該第一部分執行一第二時域操作以產生一右聲道之一第一部分,其中該聲道之該第一部分包括該左聲道之該第一部分或該右聲道之該第一部分。
- 如請求項5之裝置,其中,回應於該第二訊框不可用於該等解碼操作,該解碼器經進一步組態以: 至少基於該一或多個先前訊框之該等立體聲參數產生該中間聲道之該第二部分及一旁聲道之一第二部分: 對該中間聲道之該第二部分執行一第二變換操作以產生該經解碼頻域中間聲道之一第二部分; 升混該經解碼頻域中間聲道之該第二部分以產生該左頻域聲道之一第二部分及該右頻域聲道之一第二部分; 對該左頻域聲道之該第二部分執行一第三時域操作以產生該左聲道之一第二部分;及 對該右頻域聲道之該第二部分執行一第四時域操作以產生該右聲道之一第二部分,其中該聲道之該第二部分包括該左聲道之該第二部分或該右聲道之該第二部分。
- 如請求項6之裝置,其中該經估計第二經量化立體聲參數用以升混該經解碼頻域中間聲道之該第二部分。
- 如請求項6之裝置,其中該解碼器經組態以對該經解碼中間聲道之該第一部分執行一內插操作以產生該經解碼中間聲道之該第二部分。
- 如請求項1之裝置,其中該第一經量化立體聲參數為一經量化值,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位,該經量化值係基於該移位之一值,該移位之該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。
- 如請求項1之裝置,其中該第一經量化立體聲參數相比於一第一立體聲參數具有一較低解析度,且其中該第二經量化立體聲參數相比於一第二立體聲參數具有一較低解析度。
- 如請求項10之裝置,其中該第一立體聲參數及該第二立體聲參數包含一聲道間相位差參數或一聲道間位準差參數。
- 如請求項10之裝置,其中該第一立體聲參數及該第二立體聲參數包含一聲道間時差參數。
- 如請求項10之裝置,其中該第一立體聲參數及該第二立體聲參數包含一聲道間相關性參數。
- 如請求項10之裝置,其中該第一立體聲參數及該第二立體聲參數包含一頻譜傾角參數。
- 如請求項10之裝置,其中該第一立體聲參數及該第二立體聲參數包含一聲道間增益參數。
- 如請求項10之裝置,其中該第一立體聲參數及該第二立體聲參數包含一聲道間發聲參數。
- 如請求項1之裝置,其中該第一經量化立體聲參數及該第二經量化立體聲參數包含一聲道間音調參數。
- 如請求項1之裝置,其中該接收器及該解碼器整合至一行動器件中。
- 如請求項1之裝置,其中該接收器及該解碼器整合至一基地台中。
- 一種音訊信號解碼方法,其包含: 在一解碼器處接收一位元串流之至少一部分,該位元串流包含一第一訊框及一第二訊框,該第一訊框包括一中間聲道之一第一部分及一第一經量化立體聲參數,該第二訊框包括該中間聲道之一第二部分及一第二經量化立體聲參數,且進一步接收一經量化值,該經量化值表示對應於該中間聲道之該第二部分之該第二訊框相對於該中間聲道之該第一部分之該第一訊框延遲的一時間量的一移位; 至少基於該中間聲道之該第一部分及該第一經量化立體聲參數產生一聲道之一第一部分;及 回應於該第二訊框不可用於解碼操作而: 基於一或多個先前訊框之立體聲參數估計該第二經量化立體聲參數;及 至少基於該第二經量化立體聲參數產生該聲道之一第二部分,該聲道之該第二部分對應於該第二訊框之一經解碼版本。
- 如請求項20之方法,其中該一或多個先前訊框之該等立體聲參數包括該第一經量化立體聲參數。
- 如請求項21之方法,其中估計該第二經量化立體聲參數包含內插該第一經量化立體聲參數。
- 如請求項21之方法,其中估計該第二經量化立體聲參數包含外插該第一經量化立體聲參數。
- 如請求項20之方法,其進一步包含: 解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分; 對該經解碼中間聲道之該第一部分執行一變換操作以產生一經解碼頻域中間聲道之一第一部分; 基於該第一經量化立體聲參數升混該經解碼頻域中間聲道之該第一部分以產生一左頻域聲道之一第一部分及一右頻域聲道之一第一部分; 對該左頻域聲道之該第一部分執行一第一時域操作以產生一左聲道之一第一部分;及 對該右頻域聲道之該第一部分執行一第二時域操作以產生一右聲道之一第一部分,其中該聲道之該第一部分包括該左聲道之該第一部分或該右聲道之該第一部分。
- 如請求項24之方法,其進一步包含,回應於該第二訊框不可用於該等解碼操作而: 至少基於該一或多個先前訊框之該等立體聲參數產生該中間聲道之該第二部分及一旁聲道之一第二部分: 對該中間聲道之該第二部分執行一第二變換操作以產生該經解碼頻域中間聲道之一第二部分; 升混該經解碼頻域中間聲道之該第二部分以產生該左頻域聲道之一第二部分及該右頻域聲道之一第二部分; 對該左頻域聲道之該第二部分執行一第三時域操作以產生該左聲道之一第二部分;及 對該右頻域聲道之該第二部分執行一第四時域操作以產生該右聲道之一第二部分,其中該聲道之該第二部分包括該左聲道之該第二部分或該右聲道之該第二部分。
- 如請求項20之方法,其進一步包含: 解碼該中間聲道之該第一部分以產生一經解碼中間聲道之一第一部分;及 對該經解碼中間聲道之該第一部分執行一內插操作以產生該經解碼中間聲道之該第二部分。
- 如請求項20之方法,其中該第一經量化立體聲參數為一經量化值,該經量化值表示相關聯於一編碼器之一參考聲道與相關聯於該編碼器之一目標聲道之間的一移位,該經量化值係基於該移位之一值,該移位之該值相關聯於該編碼器且相比於該經量化值具有一較大精確度。
- 如請求項20之方法,其中該解碼器整合至一行動器件中。
- 如請求項20之方法,其中該解碼器整合至一基地台中。
- 一種音訊信號解碼裝置,其包含: 用於接收一位元串流之至少一部分的構件,該位元串流包含一第一訊框及一第二訊框,該第一訊框包括一中間聲道之一第一部分及一第一經量化立體聲參數,該第二訊框包括該中間聲道之一第二部分及一第二經量化立體聲參數,其中用於接收該位元串流之至少一部分的該構件經進一步組態以接收一經量化值,該經量化值表示對應於該中間聲道之該第二部分之該第二訊框相對於該中間聲道之該第一部分之該第一訊框延遲的一時間量的一移位; 用於至少基於該中間聲道之該第一部分及該第一經量化立體聲參數產生一聲道之一第一部分的構件; 用於回應於該第二訊框不可用於解碼操作而基於一或多個先前訊框之立體聲參數估計該第二經量化立體聲參數的構件;及 用於至少基於該第二經量化立體聲參數產生該聲道之一第二部分的構件,該聲道之該第二部分對應於該第二訊框之一經解碼版本。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762505041P | 2017-05-11 | 2017-05-11 | |
US62/505,041 | 2017-05-11 | ||
US15/962,834 US10224045B2 (en) | 2017-05-11 | 2018-04-25 | Stereo parameters for stereo decoding |
US15/962,834 | 2018-04-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202315425A true TW202315425A (zh) | 2023-04-01 |
TWI828479B TWI828479B (zh) | 2024-01-01 |
Family
ID=64097350
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111148802A TWI828479B (zh) | 2017-05-11 | 2018-04-30 | 用於立體聲解碼之立體聲參數 |
TW107114648A TWI790230B (zh) | 2017-05-11 | 2018-04-30 | 用於立體聲解碼之立體聲參數 |
TW111148803A TWI828480B (zh) | 2017-05-11 | 2018-04-30 | 用於立體聲解碼之立體聲參數 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107114648A TWI790230B (zh) | 2017-05-11 | 2018-04-30 | 用於立體聲解碼之立體聲參數 |
TW111148803A TWI828480B (zh) | 2017-05-11 | 2018-04-30 | 用於立體聲解碼之立體聲參數 |
Country Status (9)
Country | Link |
---|---|
US (5) | US10224045B2 (zh) |
EP (1) | EP3622508A1 (zh) |
KR (2) | KR20240006717A (zh) |
CN (2) | CN110622242B (zh) |
AU (1) | AU2018266531C1 (zh) |
BR (1) | BR112019023204A2 (zh) |
SG (1) | SG11201909348QA (zh) |
TW (3) | TWI828479B (zh) |
WO (1) | WO2018208515A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
JP7354275B2 (ja) * | 2019-03-14 | 2023-10-02 | ブームクラウド 360 インコーポレイテッド | 優先度を持つ空間認識マルチバンド圧縮システム |
CN113676397B (zh) * | 2021-08-18 | 2023-04-18 | 杭州网易智企科技有限公司 | 空间位置数据处理方法、装置、存储介质及电子设备 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4456601B2 (ja) | 2004-06-02 | 2010-04-28 | パナソニック株式会社 | 音声データ受信装置および音声データ受信方法 |
WO2009084226A1 (ja) | 2007-12-28 | 2009-07-09 | Panasonic Corporation | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 |
CN105225667B (zh) * | 2009-03-17 | 2019-04-05 | 杜比国际公司 | 编码器系统、解码器系统、编码方法和解码方法 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
WO2010137300A1 (ja) | 2009-05-26 | 2010-12-02 | パナソニック株式会社 | 復号装置及び復号方法 |
ES2526320T3 (es) * | 2010-08-24 | 2015-01-09 | Dolby International Ab | Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM |
KR101748756B1 (ko) * | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
US8654984B2 (en) * | 2011-04-26 | 2014-02-18 | Skype | Processing stereophonic audio signals |
CN102810313B (zh) | 2011-06-02 | 2014-01-01 | 华为终端有限公司 | 音频解码方法及装置 |
WO2013017435A1 (en) * | 2011-08-04 | 2013-02-07 | Dolby International Ab | Improved fm stereo radio receiver by using parametric stereo |
ES2560402T3 (es) * | 2012-04-05 | 2016-02-18 | Huawei Technologies Co., Ltd | Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico |
EP3067889A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
ES2904275T3 (es) * | 2015-09-25 | 2022-04-04 | Voiceage Corp | Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
-
2018
- 2018-04-25 US US15/962,834 patent/US10224045B2/en active Active
- 2018-04-27 AU AU2018266531A patent/AU2018266531C1/en active Active
- 2018-04-27 KR KR1020247000286A patent/KR20240006717A/ko active Application Filing
- 2018-04-27 KR KR1020197033240A patent/KR102628065B1/ko active IP Right Grant
- 2018-04-27 SG SG11201909348Q patent/SG11201909348QA/en unknown
- 2018-04-27 EP EP18724713.5A patent/EP3622508A1/en active Pending
- 2018-04-27 BR BR112019023204A patent/BR112019023204A2/pt unknown
- 2018-04-27 WO PCT/US2018/029872 patent/WO2018208515A1/en unknown
- 2018-04-27 CN CN201880030918.7A patent/CN110622242B/zh active Active
- 2018-04-27 CN CN202310638403.8A patent/CN116665682A/zh active Pending
- 2018-04-30 TW TW111148802A patent/TWI828479B/zh active
- 2018-04-30 TW TW107114648A patent/TWI790230B/zh active
- 2018-04-30 TW TW111148803A patent/TWI828480B/zh active
-
2019
- 2019-02-11 US US16/272,903 patent/US10783894B2/en active Active
-
2020
- 2020-07-01 US US16/918,887 patent/US11205436B2/en active Active
-
2021
- 2021-12-20 US US17/556,981 patent/US11823689B2/en active Active
-
2023
- 2023-11-17 US US18/513,188 patent/US20240161757A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
TWI790230B (zh) | 2023-01-21 |
AU2018266531A1 (en) | 2019-10-31 |
US10783894B2 (en) | 2020-09-22 |
KR20240006717A (ko) | 2024-01-15 |
KR20200006978A (ko) | 2020-01-21 |
US20190214028A1 (en) | 2019-07-11 |
US10224045B2 (en) | 2019-03-05 |
AU2018266531C1 (en) | 2023-04-06 |
BR112019023204A2 (pt) | 2020-05-19 |
EP3622508A1 (en) | 2020-03-18 |
TWI828480B (zh) | 2024-01-01 |
US20220115026A1 (en) | 2022-04-14 |
CN110622242A (zh) | 2019-12-27 |
SG11201909348QA (en) | 2019-11-28 |
TWI828479B (zh) | 2024-01-01 |
KR102628065B1 (ko) | 2024-01-22 |
WO2018208515A1 (en) | 2018-11-15 |
TW201902236A (zh) | 2019-01-01 |
US20240161757A1 (en) | 2024-05-16 |
US11823689B2 (en) | 2023-11-21 |
US20200335114A1 (en) | 2020-10-22 |
AU2018266531B2 (en) | 2022-08-18 |
US11205436B2 (en) | 2021-12-21 |
TW202315426A (zh) | 2023-04-01 |
CN110622242B (zh) | 2023-06-16 |
CN116665682A (zh) | 2023-08-29 |
US20180330739A1 (en) | 2018-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102230623B1 (ko) | 다중의 오디오 신호들의 인코딩 | |
TWI790230B (zh) | 用於立體聲解碼之立體聲參數 | |
US10885925B2 (en) | High-band residual prediction with time-domain inter-channel bandwidth extension | |
US10885922B2 (en) | Time-domain inter-channel prediction | |
KR102581558B1 (ko) | 채널간 위상차 파라미터 수정 | |
KR20190134641A (ko) | 채널간 대역폭 확장 |