TWI806839B - 多音訊信號之處理器件、裝置、非暫時性電腦可讀媒體與方法 - Google Patents

多音訊信號之處理器件、裝置、非暫時性電腦可讀媒體與方法 Download PDF

Info

Publication number
TWI806839B
TWI806839B TW106132827A TW106132827A TWI806839B TW I806839 B TWI806839 B TW I806839B TW 106132827 A TW106132827 A TW 106132827A TW 106132827 A TW106132827 A TW 106132827A TW I806839 B TWI806839 B TW I806839B
Authority
TW
Taiwan
Prior art keywords
signal
frequency domain
channel
domain
decoded
Prior art date
Application number
TW106132827A
Other languages
English (en)
Other versions
TW201818398A (zh
Inventor
文卡塔 薩伯拉曼亞姆 強卓 賽克哈爾 奇比亞姆
凡卡特拉曼 阿堤
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201818398A publication Critical patent/TW201818398A/zh
Application granted granted Critical
Publication of TWI806839B publication Critical patent/TWI806839B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/055Time compression or expansion for synchronising with other signals, e.g. video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)

Abstract

本發明提供一種器件,其包括經組態以接收來自一第二器件之一經編碼位元串流的一接收器。該經編碼位元串流包括基於在該第二器件處捕捉之一參考聲道及在該第二器件處捕捉之一目標聲道而判定之一時間性失配值。該器件亦包括經組態以解碼該經編碼位元串流以產生一第一頻域輸出信號及一第二頻域輸出信號之一解碼器。該解碼器經組態以對該等頻域輸出信號執行逆變換操作以產生一第一時域信號及一第二時域信號。基於該時間性失配值,該解碼器經組態以映射該等時域信號至一經解碼目標聲道及一經解碼參考聲道。該解碼器亦經組態以基於該時間性失配值對該經解碼目標聲道執行一因果時域移位操作以產生一經調整解碼目標聲道。

Description

多音訊信號之處理器件、裝置、非暫時性電腦可讀媒體與方法
本發明大體上係關於多音訊信號之編碼。
技術的進步已帶來更小且更強大的計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括無線電話(諸如行動及智慧型電話)、平板電腦及膝上型電腦,該等攜帶型個人計算器件為小的輕質的且容易由使用者攜載。此等器件可經由無線網路傳達語音及資料封包。另外,許多此類器件併入額外功能性,諸如數位靜態相機、數位視訊相機、數位記錄器及音訊檔案播放器。又,此等器件可處理可執行指令,包括軟體應用程式,諸如可用以存取網際網路之網路瀏覽器應用程式。因而,此等器件可包括顯著計算能力。
計算器件可包括接收音訊信號之多個麥克風。一般而言,與多個麥克風之第二麥克風相比,聲源更接近於第一麥克風。因此,由於麥克風距聲源之各別距離,自第二麥克風接收之第二音訊信號可相對於自第一麥克風接收之第一音訊信號延遲。在其他實施中,第一音訊信號可相對於第二音訊信號延遲。在立體聲編碼中,來自麥克風之音訊信號可經編碼以產生中間聲道信號及一或多個旁聲道信號。中間聲道可對應於第一音訊信號及第二音訊信號之總和。旁聲道信號可對應於第一音訊信號與第二音訊信號 之間的差。由於接收第二音訊信號相對於第一音訊信號之延遲,第一音訊信號可不與第二音訊信號對準。第一音訊信號相對於第二音訊信號之未對準可增加兩種音訊信號之間的差值。由於差值增加,所以較高數目之位元可用以編碼旁聲道信號。
在一特定實施中,器件包括經組態以接收來自第二器件之經編碼位元串流之接收器。經編碼位元串流包括時間性失配值及立體聲參數。時間性失配值及立體聲參數係基於在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道而判定。器件亦包括經組態以解碼經編碼位元串流以產生第一頻域輸出信號及第二頻域輸出信號之解碼器。解碼器亦經組態以對第一頻域輸出信號執行第一逆變換操作以產生第一時域信號。解碼器經進一步組態以對第二頻域輸出信號執行第二逆變換操作以產生第二時域信號。解碼器亦經組態以基於時間性失配值將第一時域信號或第二時域信號中之一者映射為經解碼目標聲道。解碼器經進一步組態以將第一時域信號或第二時域信號中之另一者映射為經解碼參考聲道。解碼器亦經組態以基於時間性失配值對經解碼目標聲道執行因果時域移位操作以產生經調整解碼目標聲道。器件亦包括經組態以輸出第一輸出信號及第二輸出信號之輸出器件。第一輸出信號係基於經解碼參考聲道且第二輸出信號係基於經調整解碼目標聲道。
器件亦包括經組態以解碼經編碼位元串流以產生經解碼中間信號之立體聲解碼器。器件進一步包括經組態以對經解碼中間信號執行變換操作以產生頻域解碼中間信號的變換單元。器件亦包括經組態以對頻域解碼中間信號執行升混操作以產生第一頻域輸出信號及第二頻域輸出信號的升混 器。立體聲參數在升混操作期間經應用於頻域解碼中間信號。
在另一特定實施中,方法包括在器件之接收器處接收來自第二器件之經編碼位元串流。經編碼位元串流包括時間性失配值及立體聲參數。時間性失配值及立體聲參數係基於在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道而判定。方法亦包括在器件之解碼器處解碼經編碼位元串流以產生第一頻域輸出信號及第二頻域輸出信號。方法亦包括對第一頻域輸出信號執行第一逆變換操作以產生第一時域信號。方法進一步包括對第二頻域輸出信號執行第二逆變換操作以產生第二時域信號。方法亦包括基於時間性失配值將第一時域信號或第二時域信號中之一者映射為經解碼目標聲道。方法進一步包括將第一時域信號或第二時域信號中之另一者映射為經解碼參考聲道。方法亦包括輸出第一輸出信號及第二輸出信號。第一輸出信號係基於經解碼參考聲道且第二輸出信號係基於經調整解碼目標聲道。
方法亦包括解碼經編碼位元串流以產生經解碼中間信號。方法進一步包括對經解碼中間信號執行變換操作以產生頻域解碼中間信號。方法亦包括對頻域解碼中間信號執行升混操作以產生第一頻域輸出信號及第二頻域輸出信號。立體聲參數在升混操作期間經應用於頻域解碼中間信號。
在另一特定實施中,非暫時性電腦可讀媒體包括在由解碼器內之處理器執行時引起解碼器執行包括解碼自第二器件接收之經編碼位元串流以產生第一頻域輸出信號及第二頻域輸出信號的操作的指令。經編碼位元串流包括時間性失配值及立體聲參數。時間性失配值及立體聲參數係基於在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道而判定。操作亦包括對第一頻域輸出信號執行第一逆變換操作以產生第一時域信號。操 作亦包括對第二頻域輸出信號執行第二逆變換操作以產生第二時域信號。操作亦包括基於時間性失配值將第一時域信號或第二時域信號中之一者映射為經解碼目標聲道。操作亦包括將第一時域信號或第二時域信號中之另一者映射為經解碼參考聲道。操作亦包括輸出第一輸出信號及第二輸出信號。第一輸出信號係基於經解碼參考聲道且第二輸出信號係基於經調整解碼目標聲道。
操作亦包括解碼經編碼位元串流以產生經解碼中間信號。操作進一步包括對經解碼中間信號執行變換操作以產生頻域解碼中間信號。操作亦包括對頻域解碼中間信號執行升混操作以產生第一頻域輸出信號及第二頻域輸出信號。立體聲參數在升混操作期間經應用於頻域解碼中間信號。
在另一特定實施中,一種裝置包括用於接收來自第二器件之經編碼位元串流的構件。經編碼位元串流包括時間性失配值及立體聲參數。時間性失配值及立體聲參數係基於在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道而判定。裝置亦包括用於解碼經編碼位元串流以產生第一頻域輸出信號及第二頻域輸出信號的構件。裝置進一步包括用於對第一頻域輸出信號執行第一逆變換操作以產生第一時域信號的構件。裝置亦包括用於對第二頻域輸出信號執行第二逆變換操作以產生第二時域信號的構件。裝置進一步包括用於基於時間性失配值將第一時域信號或第二時域信號中之一者映射為經解碼目標聲道的構件。裝置亦包括用於將第一時域信號或第二時域信號中之另一者映射為經解碼參考聲道的構件。裝置進一步包括用於基於時間性失配值對經解碼目標聲道執行因果時域移位操作以產生經調整解碼目標聲道的構件。裝置亦包括用於輸出第一輸出信號及第二輸出信號的構件。第一輸出信號係基於經解碼參考聲道且第二輸出信號係 基於經調整解碼目標聲道。
本發明之其他實施、優勢及特徵將在審閱整個申請案之後變得顯而易見,該整個申請案包括以下章節:圖式簡單說明、實施方式及申請專利範圍。
100:系統
104:第一器件
106:第二器件
108:時間性等化器
109:頻域立體聲寫碼器
109a:頻域立體聲寫碼器
109b:頻域立體聲寫碼器
109c:頻域立體聲寫碼器
109d:頻域立體聲寫碼器
109e:頻域立體聲寫碼器
110:傳輸器
112:輸入介面
114:編碼器
116:最終移位值
118:解碼器
120:網路
124:時間性平衡器
125:頻域立體聲解碼器
126:第一輸出信號
128:第二輸出信號
130:第一音訊信號
132:第二音訊信號
142:第一揚聲器
144:第二揚聲器
146:第一麥克風
148:第二麥克風
152:聲源
153:記憶體
162:立體聲參數
164:旁頻帶位元串流
166:中頻帶位元串流
168:時域降混參數
190:參考信號
191:分析資料
192:經調整目標信號
202:信號預處理器
204:移位估計器
206:框間移位變化分析器
208:參考信號指定器
210:目標信號調整器
228:音訊信號
230:第一經重取樣之信號
232:第二經重取樣之信號
242:目標信號/目標聲道
262:第一移位值
264:參考信號指示符
266:目標信號指示符
302:變換
304:變換
306:立體聲參數估計器
308:旁頻帶信號產生器
310:旁頻帶編碼器
312:中頻帶信號產生器
314:變換
316:中頻帶編碼器
330:頻域參考信號
332:頻域經調整目標信號
334:頻域旁頻帶信號
336:時域中頻帶信號
338:頻域中頻帶信號
404:變換
406:旁頻帶編碼器
430:頻域中頻帶位元串流
502:中頻帶信號產生器
504:中頻帶編碼器
506:旁頻帶編碼器
530:頻域中頻帶信號
602:旁頻帶編碼器
702:中頻帶編碼器
802:解多工器(DeMUX)
804:去加重器
806:重取樣器
808:去加重器
810:重取樣器
812:傾斜平衡器
830:重取樣因數估計器
834:去加重器
836:重取樣器
838:去加重器
840:重取樣器
842:傾斜平衡器
860:第一取樣速率
862:第一因數
864:經去加重之信號
866:經重取樣之信號
868:經去加重之信號
870:經重取樣之信號
880:第二取樣速率
882:第二因數
884:經去加重之信號
886:經重取樣之信號
888:經去加重之信號
890:經重取樣之信號
906:信號比較器
910:內插器
911:移位改進器
912:移位變化分析器
913:絕對移位產生器
934:比較值
936:試驗性移位值
938:經內插之移位值
940:經修正之移位值
1000:通信之方法
1102:解多工器(DEMUX)
1104:中頻帶解碼器
1106:旁頻帶解碼器
1108:變換
1110:升混器
1112:立體聲參數處理器
1114:逆變換
1116:逆變換
1120:時域升混器
1150:中頻帶信號
1152:頻域中頻帶信號
1154:旁頻帶信號
1156:升混信號
1158:升混信號
1160:信號
1162:信號
1164:第一時域信號
1166:第二時域
1170:信號
1172:信號
1200:系統
1204:第一器件
1206:第二器件
1208:頻域移位器
1208a:頻域移位器
1208b:頻域移位器
1209:頻域立體聲寫碼器
1209a:頻域立體聲寫碼器
1209b:頻域立體聲寫碼器
1210:傳輸器
1212:輸入介面
1214:編碼器
1216:最終移位值
1218:解碼器
1224:時間性平衡器
1226:第一輸出信號
1228:第二輸出信號
1230:第一音訊信號
1232:第二音訊信號
1242:第一揚聲器
1244:第二揚聲器
1246:第一麥克風
1248:第二麥克風
1252:聲源
1253:記憶體
1262:立體聲參數
1264:旁頻帶位元串流
1266:中頻帶位元串流
1268:頻域降混參數
1290:頻域信號
1291:分析資料
1292:頻域信號
1302:開窗電路
1304:變換電路
1306:開窗電路
1308:變換電路
1310:聲道間移位估計器
1312:移位器
1350:時域信號
1402:非因果移位器
1502:立體聲參數估計器
1504:旁頻帶信號產生器
1506:中頻帶信號產生器
1508:中頻帶編碼器
1510:旁頻帶編碼器
1530:頻域中頻帶信號
1534:頻域旁頻帶信號
1610:旁頻帶編碼器
1800:通信方法
1900:第一解碼器系統
1901:經編碼位元串流
1902:解碼器
1904:移位器
1906:逆變換電路
1908:逆變換電路
1910:經解碼頻域左聲道
1912:經解碼頻域右聲道
1914:經調整解碼頻域目標聲道
1916:經解碼時域左聲道
1918:經調整解碼時域目標聲道
1950:第二解碼器系統
1952:移位器
1962:經解碼時域左聲道
1964:經解碼時域右聲道
1968:經調整解碼時域目標聲道
2000:第一通信方法
2020:第二通信方法
2100:器件
2102:數位至類比轉換器(DAC)
2104:類比至數位轉換器(ADC)
2106:處理器
2108:媒體編碼解碼器
2110:處理器
2112:回音消除器
2122:系統單晶片器件
2126:顯示控制器
2128:顯示器
2130:輸入器件
2134:編解碼器
2142:天線
2144:電源供應器
2146:麥克風
2148:揚聲器
2160:指令
2200:基地台
2206:處理器
2208:音訊編解碼器
2210:轉碼器
2214:資料串流
2216:經轉碼資料串流
2232:記憶體
2242:第一天線
2244:第二天線
2252:第一收發器
2254:第二收發器
2260:網路連接
2262:解調器
2264:接收器資料處理器
2270:媒體閘道器
2282:傳輸資料處理器
2284:傳輸多輸入多輸出(MIMO)處理器
圖1為包括可操作以編碼多音訊信號之編碼器之系統的特定說明性實例之方塊圖;圖2為說明圖1之編碼器的圖;圖3為說明圖1之編碼器的頻域立體聲寫碼器的第一實施之圖;圖4為說明圖1之編碼器的頻域立體聲寫碼器的第二實施之圖;圖5為說明圖1之編碼器的頻域立體聲寫碼器的第三實施之圖;圖6為說明圖1之編碼器的頻域立體聲寫碼器的第四實施之圖;圖7為說明圖1之編碼器的頻域立體聲寫碼器的第五實施之圖;圖8為說明圖1之編碼器的信號預處理器之圖;圖9為說明圖1之編碼器的移位估計器204之圖;圖10為說明編碼多音訊信號之特定方法之流程圖;圖11為說明可操作以解碼音訊信號的解碼器之圖;圖12為包括可操作以編碼多音訊信號之編碼器之系統的特定說明性實例之另一方塊圖;圖13為說明圖12之編碼器的圖;圖14為說明圖12之編碼器的另一圖;圖15為說明圖12之編碼器的頻域立體聲寫碼器的第一實施之圖;圖16為說明圖12之編碼器的頻域立體聲寫碼器的第二實施之圖; 圖17說明補零技術;圖18為說明編碼多音訊信號之特定方法之流程圖;圖19說明可操作以解碼音訊信號之解碼系統;圖20包括說明解碼音訊信號之特定方法的流程圖;圖21為可操作以編碼多音訊信號之器件之特定說明性實例的方塊圖;且圖22為基地台之特定說明性實例之方塊圖。
相關申請案
本申請案主張2016年10月31日申請之名為「ENCODING OF MULTIPLE AUDIO SIGNALS」之美國臨時專利申請第62/415,369號的權益,該案明確地以全文引用之方式併入本文中。
揭示可操作以編碼多音訊信號之系統及器件。器件可包括經組態以編碼多音訊信號之編碼器。可使用多個記錄器件(例如,多個麥克風)同時及時地捕捉多音訊信號。在一些實例中,可藉由多工若干同時或非同時記錄之音訊聲道合成地(例如,人工地)產生多音訊信號(或多聲道音訊)。如說明性實例,音訊聲道之並行記錄或多工可產生2聲道組態(亦即,立體聲:左及右)、5.1聲道組態(左、右、中央、左環繞、右環繞及低頻重音(LFE)聲道)、7.1聲道組態、7.1+4聲道組態、22.2聲道組態或N聲道組態。
電話會議室(或遠程呈現室)中之音訊捕捉器件可包括獲取空間音訊之多個麥克風。空間音訊可包括語音以及經編碼並經傳輸之背景音訊。視如何配置麥克風以及來源(例如,講話者)相對於麥克風及房間尺寸所處的位 置,來自給定來源(例如,講話者)之語音/音訊可於不同時間到達多個麥克風處。舉例而言,相比於與器件相關聯之第二麥克風,聲源(例如,講話者)可更接近與器件相關聯之第一麥克風。因此,與第二麥克風相比,自聲源發出之聲音可更早到達第一麥克風。器件可經由第一麥克風接收第一音訊信號,且可經由第二麥克風接收第二音訊信號。
中旁(MS)寫碼及參數立體(PS)寫碼為可提供優於雙單聲道寫碼技術之經改良效率的立體寫碼技術。在雙單聲道寫碼中,左(L)聲道(或信號)及右(R)聲道(或信號)經獨立地寫碼,而不利用聲道間相關。在寫碼之前,藉由將左聲道及右聲道變換為總聲道及差聲道(例如,旁聲道),MS寫碼減少相關L/R聲道對之間的冗餘。總和信號及差值信號為以MS寫碼之經寫碼的波形。總和信號比旁信號耗費相對更多之位元。PS寫碼藉由將L/R信號變換為總和信號及一組旁參數來減少每一子頻帶中之冗餘。旁參數可指示聲道間強度差(IID)、聲道間相位差(IPD)、聲道間時差(ITD)等。總和信號為經寫碼之波形且連同旁參數傳輸。在混合式系統中,旁聲道可為以較低頻帶(例如,小於2千赫茲(kHz))寫碼及以較高頻帶(例如,大於或等於2kHz)PS寫碼(其中間聲道間相位保持在感知上不太關鍵)之波形。
可在頻域或子頻帶域中完成MS寫碼及PS寫碼。在一些實例中,左聲道及右聲道可不相關。舉例而言,左聲道及右聲道可包括不相關之合成信號。當左聲道及右聲道不相關時,MS寫碼、PS寫碼或兩者之寫碼效率可接近於雙單聲道寫碼之寫碼效率。
取決於記錄組態,可在左聲道與右聲道之間存在時間性移位以及其他空間效應(諸如回聲及室內回響)。若並不補償聲道之間的時間性移位及 相位失配,則總聲道及差聲道可含有減少與MS或PS技術相關之寫碼增益的可比能量。寫碼增益之減少可基於時間性(或相位)移位之量。總和信號及差信號之可比能量可限制聲道經時間性移位但高度相關之某些訊框中的MS寫碼之使用。在立體寫碼中,中間聲道(例如,總和聲道)及旁聲道(例如,差聲道)可基於下列式而產生:M=(L+R)/2,S=(L-R)/2, 式1
其中M對應於中間聲道,S對應於旁聲道,L對應於左聲道,且R對應於右聲道。
在一些狀況下,可基於下列式產生中間聲道及旁聲道:M=c(L+R),S=c(L-R), 式2
其中c對應於頻率相依之複合值。基於式1或式2產生中間聲道及旁聲道可被稱為執行「降混」演算法。基於式1或式2自中間聲道及旁聲道來產生左聲道及右聲道之反向處理可被稱為執行「升混」演算法。
在一些狀況下,中間聲道可係基於其他式,諸如:M=(L+gDR)/2,或 式3
M=g1L+g2R 式4
其中g1+g2=1.0,且其中gD為增益參數。在其他實例中,降混可在頻帶中執行,其中中間(b)=c1L(b)+c2R(b),其中c1及c2為複數,其中旁(b)=c3L(b)-c4R(b),且其中c3及c4為複數。
用以在MS寫碼或雙單聲道寫碼之間選擇特定訊框之特別途徑可包括:產生中間信號及旁信號,計算中間信號及旁信號之能量,並基於能量判定是否執行MS寫碼。舉例而言,可執行MS寫碼以回應旁信號與中間信號之能量比小於臨限值之判定。舉例而言,若右聲道經移位至少一第一時 間(例如,約0.001秒或在48kHz下之48個樣本),則中間信號(對應於左信號及右信號之總和)之第一能量可與有聲話音訊框之旁信號(對應於左信號與右信號之間的差)之第二能量相當。當第一能量與第二能量相當時,較高數目之位元可用於編碼旁聲道,藉此減少相對於雙單聲道寫碼之MS寫碼的寫碼效率。雙單聲道因此可在第一能量與第二能量相當時(例如,在第一能量與第二能量之比大於或等於臨限值時)使用。在替代方法中,可針對特定訊框基於臨限值與左聲道及右聲道之正規化交叉相關值之比較來在MS寫碼與雙單聲道寫碼之間作出決定。
在一些實例中,編碼器可判定指示第一音訊信號相對於第二音訊信號之移位的時間性移位值。移位值可對應於在第一麥克風處第一音訊信號之接收與在第二麥克風處第二音訊信號之接收之間的時間性延遲之量。另外,編碼器可在逐框之基礎上(例如,基於每一20毫秒(ms)話音/音訊訊框)判定移位值。舉例而言,移位值可對應於第二音訊信號之第二訊框相對於第一音訊信號之第一訊框經延遲的一時間量。替代地,移位值可對應於第一音訊信號之第一訊框相對於第二音訊信號之第二訊框經延遲的一時間量。
當與第二麥克風相比,聲源更接近第一麥克風時,第二音訊信號之訊框可相對於第一音訊信號之訊框延遲。在此狀況下,第一音訊信號可被稱為「參考音訊信號」或「參考聲道」,且經延遲之第二音訊信號可被稱為「目標音訊信號」或「目標聲道」。替代地,當與第一麥克風相比,聲源更接近第二麥克風時,第一音訊信號之訊框可相對於第二音訊信號之訊框經延遲。在此狀況下,第二音訊信號可被稱為參考音訊信號或參考聲道,且經延遲第一音訊信號可被稱為目標音訊信號或目標聲道。
視聲源(例如,講話者)位於會議室或遠程呈現室內之位置及聲源(例如,講話者)位置如何相對於麥克風改變,參考聲道及目標聲道可自一個訊框改變至另一訊框;類似地,時間性延遲值亦可自一個訊框改變至另一訊框。然而,在一些實施中,移位值可始終為正,以指示「目標」聲道相對於「參考」聲道之延遲的量。另外,移位值可對應於「非因果移位」值,經延遲目標聲道藉由該「非因果移位」值在時間上「經拉回」,使得目標聲道與「參考」聲道對準(例如,最大限度地對準)。可對參考聲道及非因果經移位目標聲道執行判定中間聲道及旁聲道之降混演算法。
編碼器可基於參考音訊聲道及應用於目標音訊聲道之複數個移位值而判定移位值。舉例而言,可在第一時間(m1)處接收參考音訊聲道之第一訊框X。可在對應於第一移位值(例如,shift1=n1-m1)之第二時間(n1)處接收目標音訊聲道之第一特定訊框Y。另外,可在第三時間(m2)處接收參考音訊聲道之第二訊框。可在對應於第二移位值(例如,shift2=n2-m2)之第四時間(n2)處接收目標音訊聲道之第二特定訊框。
器件可以第一取樣速率(例如,32kHz取樣速率(亦即,640個樣本每訊框))進行成框或緩衝演算法,以產生訊框(例如,20ms樣本)。回應於對第一音訊信號之第一訊框及第二音訊信號之第二訊框同時到達器件之判定,編碼器可將移位值(例如,shift1)估計為等於零樣本。可在時間上對準左聲道(例如,對應於第一音訊信號)及右聲道(例如,對應於第二音訊信號)。在一些狀況下,即使當對準時,左聲道及右聲道可歸因於各種原因(例如麥克風校準)在能量方面存在不同。
在一些實例中,左聲道及右聲道可歸因於各種原因(例如,與麥克風中之另一者相比,聲源(諸如講話者)可更接近麥克風中之一者,且兩個麥 克風可大於臨限(例如,1至20公分)距離間隔)在時間上不對準。相對於麥克風之聲源的位置可在左聲道及右聲道中引入不同延遲。另外,在左聲道與右聲道之間可存在增益差、能量差或位準差。
在一些實例中,當多個講話者交替地講話時(例如,在不重疊情況下),音訊信號自多個聲源(例如,講話者)到達麥克風之時間可變化。在此狀況下,編碼器可基於講話者動態地調整時間性移位值以識別參考聲道。在一些其他實例中,多個講話者可同時講話,取決於哪個講話者最大聲、距麥克風最近等,此可產生變化之時間性移位值。
在一些實例中,當兩個信號可能展示較少(例如,無)相關時,可合成或人工地產生第一音訊信號及第二音訊信號。應理解,本文所描述之實例為說明性且可在類似或不同情形中判定第一音訊信號與第二音訊信號之間的關係中具指導性。
編碼器可基於第一音訊信號之第一訊框與第二音訊信號之複數個訊框的比較而產生比較值(例如,差值或交叉相關值)。複數個訊框中之每一訊框可對應於特定移位值。編碼器可基於比較值產生第一經估計移位值。舉例而言,第一經估計移位值可對應於指示第一音訊信號之第一訊框與第二音訊信號之對應第一訊框之間的較高時間類似性(或較小差)之比較值。
編碼器可藉由在多個階段中改進一系列經估計移位值而判定最終移位值。舉例而言,基於由第一音訊信號及第二音訊信號之經立體聲預處理且經再取樣之版本產生的比較值,編碼器可首先估計「試驗性」移位值。編碼器可產生與接近經估計「試驗性」移位值之移位值相關聯的經內插比較值。編碼器可基於經內插比較值判定第二經估計「內插」移位值。舉例而言,第二經估計「內插」移位值可對應於指示相較於剩餘經內插比較值 及第一經估計「試驗性」移位值具有較高時間類似性(或較小差)的特定經內插比較值。若當前訊框(例如,第一音訊信號之第一訊框)之第二經估計「內插」移位值不同於前一訊框(例如,先於第一訊框之第一音訊信號的訊框)之最終移位值,則當前訊框之「內插」移位值經進一步「修正」,以改良第一音訊信號與經移位第二音訊信號之間的時間類似性。特定而言,藉由在當前訊框之第二經估計「內插」移位值及前一訊框之最終經估計移位值周圍搜尋,第三經估計「修正」移位值可對應於時間類似性之較精確量測值。進一步調節第三經估計「修正」移位值以藉由限制訊框之間的移位值中之任何偽改變來估計最終移位值且進一步控制第三經估計「修正」移位值以不在如本文所描述之兩個相繼(或連續)訊框中將負移位值切換成正移位值(或反之亦然)。
在一些實例中,編碼器可避免在連續訊框中或相鄰訊框中之正移位值與負移位值之間的切換(或反之亦然)。舉例而言,基於第一訊框之經估計「內插」或「修正」移位值及先於第一訊框之特定訊框中的對應經估計「內插」或「修正」或最終移位值,編碼器可將最終移位值設定為指示無時間性移位之特定值(例如,0)。舉例而言,為回應當前訊框之經估計「試驗性」或「內插」或「修正」移位值中之一者為正且前一訊框(例如,先於第一訊框之訊框)之經估計「試驗性」或「內插」或「修正」或「最終」經估計移位值中之另一者為負的判定,編碼器可設定當前訊框(例如,第一訊框)之最終移位值以指示無時間性移位,亦即shift1=0。替代地,為回應當前訊框之經估計「試驗性」或「內插」或「修正」移位值中之一者為負且前一訊框(例如,先於第一訊框之訊框)之經估計「試驗性」或「內插」或「修正」或「最終」估計移位值中之另一者為正的判 定,編碼器亦可設定當前訊框(例如,第一訊框)之最終移位值以指示無時間性移位,亦即shift1=0。
編碼器可基於移位值來選擇第一音訊信號或第二音訊信號之訊框作為「參考」或「目標」。舉例而言,為回應最終移位值為正之判定,編碼器可產生具有第一值(例如,0)之參考聲道或信號指示符,該第一值指示第一音訊信號為「參考」信號且第二音訊信號為「目標」信號。替代地,為回應最終移位值為負之判定,編碼器可產生具有第二值(例如,1)之參考聲道或信號指示符,該第二值指示第二音訊信號為「參考」信號且第一音訊信號為「目標」信號。
編碼器可估計與參考信號及非因果經移位目標信號相關聯之相對增益(例如,相對增益參數)。舉例而言,為回應最終移位值為正之判定,編碼器可估計增益值以相對於藉由非因果移位值(例如,最終移位值之絕對值)偏移之第二音訊信號正規化或等化第一音訊信號的能量或功率位準。替代地,回應於最終移位值為負之判定,編碼器可估計增益值以相對於第二音訊信號正規化或等化非因果經移位之第一音訊信號的功率位準。在一些實例中,編碼器可估計增益值以相對於非因果經移位「目標」信號正規化或等化「參考」信號之能量或功率位準。在其他實例中,編碼器可相對於目標信號(例如,未移位之目標信號)基於參考信號來估計增益值(例如,相對增益值)。
編碼器可基於參考信號、目標信號、非因果移位值及相對增益參數產生至少一個經編碼信號(例如,中間信號、旁信號或兩者)。旁信號可對應於第一音訊信號之第一訊框的第一樣本與第二音訊信號之所選擇訊框的所選擇樣本之間的差。編碼器可基於最終移位值選擇所選訊框。由於第一 樣本與所選擇樣本之間的減小之差,相比於對應於第二音訊信號之訊框(與第一訊框同時由器件接收)的第二音訊信號之其他樣本,更少的位元可用於編碼旁聲道信號。器件之傳輸器可傳輸至少一個經編碼信號、非因果移位值、相對增益參數、參考聲道或信號指示符或其組合。
編碼器可基於參考信號、目標信號、非因果移位值、相對增益參數、第一音訊信號之特定訊框的低頻帶參數、特定訊框之高頻帶參數或其組合而產生至少一個經編碼信號(例如,中間信號、旁信號或兩者)。特定訊框可先於第一訊框。來自一或多個前述訊框之某些低頻帶參數、高頻帶參數或其組合可用於編碼第一訊框之中間信號、旁信號或兩者。基於低頻帶參數、高頻帶參數或其組合來編碼中間信號、旁信號或兩者可改良非因果移位值之估計值及聲道間相對增益參數。低頻帶參數、高頻帶參數或其組合可包括:音調參數、語音參數、寫碼器類型參數、低頻帶能量參數、高頻帶能量參數、傾斜參數、音調增益參數、FCB增益參數、寫碼模式參數、語音活動參數、雜訊估計參數、信雜比參數、共振峰參數、話音/音樂決策參數、非因果移位、聲道間增益參數或其組合。器件之傳輸器可傳輸至少一個經編碼信號、非因果移位值、相對增益參數、參考聲道(或信號)指示符或其組合。
在本發明中,諸如「判定」、「計算」、「移位」、「調整」等之術語可用於描述如何執行一或多個操作。應注意此等術語不應理解為限制性且其他技術可用以執行類似操作。
參看圖1,揭示系統之特定說明性實例且一般將其指定為100。系統100包括經由網路120以通信方式耦接至第二器件106之第一器件104。網路120可包括一或多個無線網路、一或多個有線網路或其組合。
第一器件104可包括編碼器114、傳輸器110、一或多個輸入介面112或其組合。輸入介面112之第一輸入介面可耦接至第一麥克風146。輸入介面112之第二輸入介面可耦接至第二麥克風148。編碼器114可包括時間性等化器108及頻域立體聲寫碼器109且可經組態以降混並編碼多音訊信號,如本文所描述。第一器件104亦可包括經組態以儲存分析資料191之記憶體153。第二器件106可包括解碼器118。解碼器118可包括經組態以升混及再現多個聲道之時間性平衡器124。第二器件106可經耦接至第一揚聲器142、第二揚聲器144或兩者。
在操作期間,第一器件104可經由第一輸入介面自第一麥克風146接收第一音訊信號130,並可經由第二輸入介面自第二麥克風148接收第二音訊信號132。第一音訊信號130可對應於右聲道信號或左聲道信號中之一者。第二音訊信號132可對應於右聲道信號或左聲道信號中之另一者。與第二麥克風148相比,聲源152(例如,使用者、揚聲器、環境雜訊、樂器等)可更接近第一麥克風146。因此,來自聲源152之音訊信號可在與經由第二麥克風148相比較早時間處經由第一麥克風146在輸入介面112處接收。經由多個麥克風獲取之多聲道信號的此固有延遲可在第一音訊信號130與第二音訊信號132之間引入時間性移位。
時間性等化器108可判定指示第一音訊信號130(例如,「目標」)相對於第二音訊信號132(例如,「參考」)之移位(例如,非因果移位)的最終移位值116(例如,非因果移位值)。舉例而言,最終移位值116之第一值(例如,正值)可指示第二音訊信號132相對於第一音訊信號130延遲。最終移位值116之第二值(例如,負值)可指示第一音訊信號130相對於第二音訊信號132延遲。最終移位值116之第三值(例如,0)可指示第一音訊信號130與 第二音訊信號132之間無延遲。
在一些實施中,最終移位值116之第三值(例如,0)可指示第一音訊信號130與第二音訊信號132之間的延遲已切換正負號。舉例而言,第一音訊信號130之第一特定訊框可先於第一訊框。第二音訊信號132之第一特定訊框及第二特定訊框可對應於由聲源152發出之同一聲音。第一音訊信號130與第二音訊信號132之間的延遲可自第一特定訊框相對於第二特定訊框延遲切換至第二訊框相對於第一訊框延遲。替代地,第一音訊信號130與第二音訊信號132之間的延遲可自第二特定訊框相對於第一特定訊框延遲切換至第一訊框相對於第二訊框延遲。為回應第一音訊信號130與第二音訊信號132之間的延遲已切換正負號的判定,時間性等化器108可設定最終移位值116以指示第三值(例如,0)。
時間性等化器108可基於最終移位值116產生參考信號指示符。舉例而言,為回應最終移位值116指示第一值(例如,正值)的判定,時間性等化器108可產生具有指示第一音訊信號130為「參考」信號190之第一值(例如,0)的參考信號指示符。時間性等化器108可回應於最終移位值116指示第一值(例如,正值)的判定而判定第二音訊信號132對應於「目標」信號(未展示)。替代地,為回應最終移位值116指示第二值(例如,負值)的判定,時間性等化器108可產生具有指示第二音訊信號132為「參考」信號190之第二值(例如,1)的參考信號指示符。時間性等化器108可回應於最終移位值116指示第二值(例如,負值)的判定而判定第一音訊信號130對應於「目標」信號。為回應最終移位值116指示第三值(例如,0)的判定,時間性等化器108可產生具有指示第一音訊信號130為「參考」信號190之第一值(例如,0)的參考信號指示符。時間性等化器108可回應於最終移位 值116指示第三值(例如,0)的判定而判定第二音訊信號132對應於「目標」信號。替代地,為回應最終移位值116指示第三值(例如,0)的判定,時間性等化器108可產生具有指示第二音訊信號132為「參考」信號190之第二值(例如,1)的參考信號指示符。時間性等化器108可回應於最終移位值116指示第三值(例如,0)的判定而判定第一音訊信號130對應於「目標」信號。在一些實施中,為回應最終移位值116指示第三值(例如,0)的判定,時間性等化器108可使參考信號指示符不變。舉例而言,參考信號指示符可與對應於第一音訊信號130之第一特定訊框的參考信號指示符相同。時間性等化器108可產生指示最終移位值116之絕對值的非因果移位值。
時間性等化器108可基於目標信號、參考信號190、第一移位值(例如,用於前一訊框之移位值)、最終移位值116、參考信號指示符或其組合而產生目標信號指示符。目標信號指示符可指示第一音訊信號130或第二音訊信號132中之哪一者為目標信號。時間性等化器108可基於目標信號指示符、目標信號或兩者產生經調整目標信號192。舉例而言,時間性等化器108可基於自第一移位值至最終移位值116之時間性移位演進調整目標信號(例如,第一音訊信號130或第二音訊信號132)。時間性等化器108可內插目標信號,以使得對應於訊框邊界的目標信號之樣本之子集經由平滑及緩慢移位丟棄以產生經調整目標信號192。
因此,時間性等化器108可將目標信號時間移位以產生經調整目標信號192,以使得參考信號190與經調整目標信號192大體上經同步。時間性等化器108可產生時域降混參數168。時域降混參數可指示目標信號與參考信號190之間的移位值。在其他實施中,時域降混參數可包括類似於降 混增益等之額外參數。舉例而言,時域降混參數168可包括第一移位值262、參考信號指示符264或兩者,如參考圖2進一步描述。關於圖2更詳細描述時間性等化器108。時間性等化器108可提供參考信號190及經調整目標信號192至頻域立體聲寫碼器109,如圖所示。
頻域立體聲寫碼器109可將一或多個時域信號(例如,參考信號190及經調整目標信號192)變換成頻域信號。頻域信號可用以估計立體聲參數162。立體聲參數162可包括使得能夠再現與左聲道及右聲道相關聯之空間性質的參數。根據一些實施,立體聲參數162可包括諸如以下各者之參數:聲道間強度差(IID)參數(例如,聲道間位準差值(ILD))、聲道間時差值(ITD)參數、聲道間相位差值(IPD)參數、聲道間相關(ICC)參數、非因果移位參數、頻譜傾斜參數、聲道間語音參數、聲道間音調參數、聲道間增益參數等。立體聲參數162可在頻域立體聲寫碼器109處在其他信號產生期間使用。立體聲參數162亦可作為經編碼信號之部分而傳輸。關於圖3至圖7更詳細地描述立體聲參數162之估計及使用。
頻域立體聲寫碼器109亦可至少部分地基於頻域信號而產生旁頻帶位元串流164及中頻帶位元串流166。出於說明之目的,除非另外指出,否則假定參考信號190為左聲道信號(l或L)且經調整目標信號192為右聲道信號(r或R)。參考信號190之頻域表示可標示為Lfr(b)且經調整目標信號192之頻域表示可標示為Rfr(b),其中b表示頻域表示之頻帶。根據一個實施,旁頻帶信號Sfr(b)可自參考信號190及經調整目標信號192之頻域表示在頻域中產生。舉例而言,旁頻帶信號Sfr(b)可表達為(Lfr(b)-Rfr(b))/2。旁頻帶信號Sfr(b)可經提供至旁頻帶編碼器以產生旁頻帶位元串流164。根據一個實施,中頻帶信號m(t)可在時域中產生且變換成頻域。舉例而言,中頻 帶信號m(t)可表達為(l(t)+r(t))/2。關於圖3、圖4及圖7更詳細地描述在產生頻域中之中頻帶信號之前產生時域中之中頻帶信號。根據另一實施,中頻帶信號Mfr(b)可由頻域信號產生(例如,略過時域中頻帶信號產生)。關於圖5至圖6更詳細地描述自頻域信號產生中頻帶信號Mfr(b)。時域/頻域中頻帶信號可經提供至中頻帶編碼器以產生中頻帶位元串流166。
可使用多個技術來對旁頻帶信號Sfr(b)及中頻帶信號m(t)或Mfr(b)進行編碼。根據一個實施,時域中頻帶信號m(t)可使用時域技術(諸如代數碼激勵線性預測(ACELP))編碼,從而頻寬擴展以用於較高頻帶寫碼。在旁頻帶寫碼之前,中頻帶信號m(t)(經寫碼或未經寫碼)可轉換為頻域(例如,變換域)以產生中頻帶信號Mfr(b)。
旁頻帶寫碼之一個實施包括使用頻率中頻帶信號Mfr(b)及對應於頻帶(b)之立體聲參數162(例如,ILD)中之資訊自頻域中頻帶信號Mfr(b)預測旁頻帶SPRED(b)。舉例而言,預測旁頻帶SPRED(b)可表達為Mfr(b)*(ILD(b)-1)/(ILD(b)+1)。頻帶(b)中之錯誤信號e(b)可依據旁頻帶信號Sfr(b)及預測旁頻帶SPRED(b)而計算。舉例而言,錯誤信號e(b)可表達為Sfr(b)-SPRED(b)。可使用變換域寫碼技術寫碼錯誤信號e(b)以產生經寫碼錯誤信號eCODED(b)。對於較高頻帶,錯誤信號e(b)可表達為來自前一訊框的頻帶(b)中之中頻帶信號M_PASTfr(b)之按比例調整版本。舉例而言,經寫碼錯誤信號eCODED(b)可表達為gPRED(b)*M_PASTfr(b),其中gPRED(b)可經估計,以使得e(b)-gPRED(b)*M_PASTfr(b)之能量實質上減少(例如,減至最小)。
傳輸器110可經由網路120傳輸立體聲參數162、旁頻帶位元串流164、中頻帶位元串流166、時域降混參數168或其組合至第二器件106。 替代地或另外,傳輸器110可將立體聲參數162、旁頻帶位元串流164、中頻帶位元串流166、時域降混參數168或其組合儲存於網路120之器件或本端器件處以供稍後進一步處理或解碼。因為非因果移位(例如,最終移位值116)可在編碼過程期間被判定,因此除每一頻帶中之非因果移位以外傳輸IPD(例如,作為立體聲參數162之部分)可為冗餘的。因此,在一些實施中,可針對相同訊框但在相互獨佔式頻帶中估計IPD及非因果移位。在其他實施中,除用於每頻帶較精細調整之移位以外還可估計較低解析度IPD。替代地,可不針對其中判定非因果移位之訊框判定IPD。
解碼器118可基於立體聲參數162、旁頻帶位元串流164、中頻帶位元串流166及時域降混參數168執行解碼操作。舉例而言,頻域立體聲解碼器125及時間性平衡器124可執行升混以產生第一輸出信號126(例如,對應於第一音訊信號130)、第二輸出信號128(例如,對應於第二音訊信號132),或兩者。第二器件106可經由第一揚聲器142輸出第一輸出信號126。第二器件106可經由第二揚聲器144輸出第二輸出信號128。在替代性實例中,第一輸出信號126及第二輸出信號128可作為立體聲信號對傳輸至單個輸出揚聲器。
系統100因此可使得頻域立體聲寫碼器109能夠將參考信號190及經調整目標信號192變換為頻域以產生立體聲參數162、旁頻帶位元串流164及中頻帶位元串流166。時間性等化器108之將第一音訊信號130在時間上移位以與第二音訊信號132對準的時間移位技術可結合頻域信號處理來實施。舉例而言,時間性等化器108在編碼器114處估計每一訊框之移位(例如,非因果移位值),根據非因果移位值移位(例如,調整)目標聲道,並使用移位的經調整聲道用於變換域中之立體聲參數估計。
參看圖2,展示第一器件104之編碼器114之說明性實例。編碼器114包括時間性等化器108及頻域立體聲寫碼器109。
時間性等化器108包括經由移位估計器204耦接至框間移位變化分析器206、耦接至參考信號指定器208或兩者之信號預處理器202。在一特定實施中,信號預處理器202可對應於重取樣器。框間移位變化分析器206可經由目標信號調整器210耦接至頻域立體聲寫碼器109。參考信號指定器208可耦接至框間移位變化分析器206。
在操作期間,信號預處理器202可接收音訊信號228。舉例而言,信號預處理器202可自輸入介面112接收音訊信號228。音訊信號228可包括第一音訊信號130、第二音訊信號132或兩者。信號預處理器202可產生第一經重取樣之信號230、第二經重取樣之信號232或兩者。關於圖8更詳細地描述信號預處理器202之操作。信號預處理器202可將第一經重取樣之信號230、第二經重取樣之信號232或兩者提供至移位估計器204。
移位估計器204可基於第一經重取樣之信號230、第二經重取樣之信號232或兩者產生最終移位值116(T)、非因果移位值或兩者。關於圖9更詳細地描述移位估計器204之操作。移位估計器204可向框間移位變化分析器206、參考信號指定器208或兩者提供最終移位值116。
參考信號指定器208可產生參考信號指示符264。參考信號指示符264可指示音訊信號130、132中之哪一者為參考信號190,且信號130、132中之哪一者為目標聲道242。參考信號指定器208可向框間移位變化分析器206提供參考信號指示符264。
框間移位變化分析器206可基於目標信號242、參考信號190、第一移位值262(Tprev)、最終移位值116(T)、參考信號指示符264或其組合產生 目標信號指示符266。框間移位變化分析器206可向目標信號調整器210提供目標信號指示符266。
目標信號調整器210可基於目標信號指示符266、目標信號242或兩者產生經調整目標信號192。基於自第一移位值262(Tprev)至最終移位值116(T)之時間性移位演進,目標信號調整器210可調整目標信號242。舉例而言,第一移位值262可包括對應於前一訊框之最終移位值。為回應最終移位值自具有小於對應於前一訊框之最終移位值116(例如,T=4)之對應於前一訊框之第一值(例如,Tprev=2)的第一移位值262變化之判定,目標信號調整器210可內插目標信號242,以使得對應於訊框邊界之目標信號242的樣本之子集經由平滑且緩慢移位丟棄,以產生經調整之目標信號192。替代地,為回應最終移位值自大於最終移位值116(例如,T=2)之第一移位值262(例如,Tprev=4)變化之判定,目標信號調整器210可內插目標信號242,使得對應於訊框邊界之目標信號242之樣本之子集經由平滑及緩慢移位進行重複以產生經調整目標信號192。基於混合正弦內插器(hybrid Sine-interpolator)及拉格朗日內插器(Lagrange-interpolator),可執行平滑及緩慢移位。為回應最終移位值並未自第一移位值262改變成最終移位值116(例如,Tprev=T)之判定,目標信號調整器210可在時間上偏移目標信號242以產生經調整目標信號192。目標信號調整器210可頻域立體聲寫碼器109提供經調整目標信號192。
在附件A中進一步描述與音訊處理組件(包括(但不限於)信號預處理器、移位估計器、框間移位變化分析器、參考信號指定器、目標信號調整器等)相關聯的操作之額外實施例。
參考信號190亦可經提供至頻域立體聲寫碼器109。頻域立體聲寫碼 器109可基於參考信號190及經調整目標信號192產生立體聲參數162、旁頻帶位元串流164及中頻帶位元串流166,如關於圖1所描述及如關於圖3至圖7所進一步描述。
參看圖3至圖7,展示如圖2中所描述之與時域降混一起工作的頻域立體聲寫碼器109之幾個實例詳述實施109a至109e。在一些實例中,參考信號190可包括左聲道信號且經調整目標信號192可包括右聲道信號。然而,應理解在其他實例中,參考信號190可包括右聲道信號且經調整目標信號192可包括左聲道信號。在其他實施中,參考聲道190可為在逐框之基礎上選擇的左或右聲道中之任一者,且類似地經調整目標信號192可為在經調整用於時間性移位之後的左聲道或右聲道中之另一者。出於下文描述之目的,吾人提供當參考信號190包括左聲道信號(L)且經調整目標信號192包括右聲道信號(R)時的特定狀況之實例。對於其他狀況之類似描述可經平常地擴展。亦應理解,圖3至圖7中所說明之各個組件(例如,變換、信號產生器、編碼器、估計器等)可使用硬體(例如,專用電路)、軟體(例如,由處理器執行之指令)或其組合而實施。
在圖3中,可對參考信號190執行變換302且可對經調整目標信號192執行變換304。變換302、304可藉由產生頻域(或子頻帶域)信號之變換操作而執行。作為非限制性實例,執行變換302、304可包括執行離散傅立葉變換(DFT)操作、快速傅立葉變換(FFT)操作等。根據一些實施,正交鏡濾波器組(QMF)操作(使用濾波器組,諸如複雜低延遲濾波器組)可用於將輸入信號(例如,參考信號190及經調整目標信號192)分裂成多個子頻帶,且可使用另一頻域變換操作將子頻帶轉換為頻域。變換302可應用於參考信號190以產生頻域參考信號(Lfr(b))330,且變換304可應用於經調 整目標信號192以產生頻域經調整目標信號(Rfr(b))332。頻域參考信號330及頻域經調整目標信號332可經提供至立體聲參數估計器306及旁頻帶信號產生器308。
立體聲參數估計器306可基於頻域參考信號330及頻域經調整目標信號332提取(例如,產生)立體聲參數162。舉例而言,IID(b)可取決於頻帶(b)中之左聲道的能量EL(b)及頻帶(b)中之右聲道的能量ER(b)。舉例而言,IID(b)可表達為20*log10(EL(b)/ER(b))。在編碼器處估計並傳輸之IPD可提供在頻帶(b)中之左聲道與右聲道之間的頻域中之相位差之估計。立體聲參數162可包括額外(或替代)參數,諸如ICC、ITD等。立體聲參數162可經傳輸至圖1之第二器件106,提供至旁頻帶信號產生器308,且提供至旁頻帶編碼器310。
旁頻帶產生器308可基於頻域參考信號330及頻域經調整目標信號332產生頻域旁頻帶信號(Sfr(b))334。可在頻域區間/頻帶中估計頻域旁頻帶信號334。在每一頻帶中,增益參數(g)係不同的且可係基於聲道間位準差值(例如,基於立體聲參數162)。舉例而言,頻域旁頻帶信號334可表達為(Lfr(b)-c(b)* Rfr(b))/(1+c(b)),其中c(b)可為ILD(b)或ILD(b)之函式(例如,c(b)=10^(ILD(b)/20))。頻域旁頻帶信號334可經提供至旁頻帶編碼器310。
參考信號190及經調整目標信號192亦可經提供至中頻帶信號產生器312。中頻帶信號產生器312可基於參考信號190及經調整目標信號192產生時域中頻帶信號(m(t))336。舉例而言,時域中頻帶信號336可表達為(l(t)+r(t))/2,其中l(t)包括參考信號190且r(t)包括經調整目標信號192。變換314可應用於時域中頻帶信號336以產生頻域中頻帶信號(Mfr(b)) 338,且頻域中頻帶信號338可經提供至旁頻帶編碼器310。時域中頻帶信號336亦可經提供至中頻帶編碼器316。
旁頻帶編碼器310可基於立體聲參數162、頻域旁頻帶信號334及頻域中頻帶信號338產生旁頻帶位元串流164。中頻帶編碼器316可藉由對時域中頻帶信號336進行編碼來產生中頻帶位元串流166。在特定實例中,旁頻帶編碼器310及中頻帶編碼器316可包括用以分別產生旁頻帶位元串流164及中頻帶位元串流166的ACELP編碼器。對於較低頻帶,頻域旁頻帶信號334可使用變換域寫碼技術來編碼。對於較高頻帶,頻域旁頻帶信號334可表達為自前一訊框之中頻帶信號(經量化或未經量化)的預測。
參看圖4,展示頻域立體聲寫碼器109之第二實施109b。頻域立體聲寫碼器109之第二實施109b可以實質上類似於頻域立體聲寫碼器109之第一實施109a的方式操作。然而,在第二實施109b中,變換404可應用於中頻帶位元串流166(例如,時域中頻帶信號336之經編碼版本)以產生頻域中頻帶位元串流430。旁頻帶編碼器406可基於立體聲參數162、頻域旁頻帶信號334及頻域中頻帶位元串流430產生旁頻帶位元串流164。
參看圖5,展示頻域立體聲寫碼器109之第三實施109c。頻域立體聲寫碼器109之第三實施109c可以實質上類似於頻域立體聲寫碼器109之第一實施109a的方式操作。然而,在第三實施109c中,可將頻域參考信號330及頻域經調整目標信號332提供至中頻帶信號產生器502。根據一些實施,立體聲參數162亦可經提供至中頻帶信號產生器502。中頻帶信號產生器502可基於頻域參考信號330及頻域經調整目標信號332產生頻域中頻帶信號Mfr(b)530。根據一些實施,頻域中頻帶信號Mfr(b)530亦可基於立體聲參數162而產生。基於頻域參考聲道330產生中頻帶信號530、經調 整目標聲道332及立體聲參數162之一些方法如下。
Mfr(b)=(Lfr(b)+Rfr(b))/2
Mfr(b)=c1(b)*Lfr(b)+c2*Rfr(b),其中c1(b)及c2(b)為複值。
在一些實施中,複值c1(b)及c2(b)係基於立體聲參數162。舉例而言,在中旁降混之一個實施中,當估計IPD時,c1(b)=(cos(-γ)-i*sin(-γ))/20.5且c2(b)=(cos(IPD(b)-γ)+i*sin(IPD(b)-γ))/20.5,其中i為表示-1之平方根的虛數。
出於有效旁頻帶信號編碼之目的,頻域中頻帶信號530可經提供至中頻帶編碼器504及旁頻帶編碼器506。在此實施中,中頻帶編碼器504可在編碼之前進一步將中頻帶信號530變換至任何其他變換/時域。舉例而言,中頻帶信號530(Mfr(b))可經逆變換回至時域,或變換至MDCT域以用於寫碼。
旁頻帶編碼器506可基於立體聲參數162、頻域旁頻帶信號334及頻域中頻帶信號530產生旁頻帶位元串流164。中頻帶編碼器504可基於頻域中頻帶信號530產生中頻帶位元串流166。舉例而言,中頻帶編碼器504可編碼頻域中頻帶信號530以產生中頻帶位元串流166。
參看圖6,展示頻域立體聲寫碼器109之第四實施109d。頻域立體聲寫碼器109之第四實施109d可以實質上類似於頻域立體聲寫碼器109之第三實施109c的方式操作。然而,在第四實施109d中,中頻帶位元串流166可經提供至旁頻帶編碼器602。在替代實施中,基於中頻帶位元串流之經量化中頻帶信號可經提供至旁頻帶編碼器602。旁頻帶編碼器602可經組態以基於立體聲參數162、頻域旁頻帶信號334及中頻帶位元串流166產生旁頻帶位元串流164。
參看圖7,展示頻域立體聲寫碼器109之第五實施109e。頻域立體聲寫碼器109之第五實施109e可以實質上類似於頻域立體聲寫碼器109之第一實施109a的方式操作。然而,在第五實施109e中,可將頻域中頻帶信號338提供至中頻帶編碼器702。中頻帶編碼器702可經組態以編碼頻域中頻帶信號338以產生中頻帶位元串流166。
參看圖8,展示信號預處理器202之說明性實例。信號預處理器202可包括耦接至重取樣因數估計器830、去加重器804、去加重器834或其組合之解多工器(DeMUX)802。去加重器804可經由重取樣器806耦接至去加重器808。去加重器808可經由重取樣器810耦接至傾斜平衡器812。去加重器834可經由重取樣器836耦接至去加重器838。去加重器838可經由重取樣器840耦接至傾斜平衡器842。
在操作期間,deMUX 802可藉由解多工音訊信號228來產生第一音訊信號130及第二音訊信號132。deMUX 802可向重取樣因數估計器830提供與第一音訊信號130、第二音訊信號132或兩者相關聯之第一取樣速率860。deMUX 802可向去加重器804提供第一音訊信號130,向去加重器834提供第二音訊信號132,或兩者。
重取樣因數估計器830可基於第一取樣速率860、第二取樣速率880或兩者產生第一因數862(d1)、第二因數882(d2)或兩者。重取樣因數估計器830可基於第一取樣速率860、第二取樣速率880或兩者判定重取樣因數(D)。舉例而言,重取樣因數(D)可對應於第一取樣速率860與第二取樣速率880之比(例如,重取樣因數(D)=第二取樣速率880/第一取樣速率860或重取樣因數(D)=第一取樣速率860/第二取樣速率880)。第一因數862(d1)、第二因數882(d2)或兩者可為重取樣因數(D)之因數。舉例而言,重 取樣因數(D)可對應於第一因數862(d1)與第二因數882(d2)之乘積(例如,重取樣因數(D)=第一因數862(d1)*第二因數882(d2))。在一些實施中,如本文所描述,第一因數862(d1)可具有第一值(例如,1),第二因數882(d2)可具有第二值(例如,1),或兩者,此舉略過重取樣階段。
去加重器804可藉由基於IIR濾波器(例如,一階IIR濾波器)濾波第一音訊信號130產生去加重信號864。去加重器804可將經去加重之信號864提供至重取樣器806。重取樣器806可藉由基於第一因數862(d1)重取樣經去加重之信號864產生經重取樣之信號866。重取樣器806可向去加重器808提供經重取樣之信號866。去加重器808可藉由基於IIR濾波器濾波經重取樣之信號866產生去加重之信號868。去加重器808可將經去加重之信號868提供至重取樣器810。重取樣器810可藉由基於第二因數882(d2)重取樣經去加重之信號868產生經重取樣之信號870。
在一些實施中,第一因數862(d1)可具有第一值(例如,1),第二因數882(d2)可具有第二值(例如,1),或兩者,此舉略過重取樣階段。舉例而言,當第一因數862(d1)具有第一值(例如,1)時,經重取樣之信號866可與經去加重之信號864相同。作為另一實例,當第二因數882(d2)具有第二值(例如,1)時,經重取樣之信號870可與經去加重之信號868相同。重取樣器810可向傾斜平衡器812提供經重取樣之信號870。傾斜平衡器812可藉由對經重取樣之信號870執行傾斜平衡而產生第一經重取樣之信號230。
去加重器834可藉由基於IIR濾波器(例如,一階IIR濾波器)濾波第二音訊信號132產生經去加重信號884。去加重器834可將經去加重之信號884提供至重取樣器836。重取樣器836可藉由基於第一因數862(d1)重取 樣經去加重之信號884產生經重取樣之信號886。重取樣器836可向去加重器838提供經重取樣之信號886。去加重器838可藉由基於IIR濾波器濾波經重取樣之信號886產生經去加重信號888。去加重器838可將經去加重之信號888提供至重取樣器840。重取樣器840可藉由基於第二因數882(d2)重取樣經去加重之信號888產生經重取樣之信號890。
在一些實施中,第一因數862(d1)可具有第一值(例如,1),第二因數882(d2)可具有第二值(例如,1),或兩者,此舉略過重取樣階段。舉例而言,當第一因數862(d1)具有第一值(例如,1)時,經重取樣之信號886可與去加重之信號884相同。作為另一實例,當第二因數882(d2)具有第二值(例如,1)時,經重取樣之信號890可與經去加重之信號888相同。重取樣器840可向傾斜平衡器842提供經重取樣之信號890。傾斜平衡器842可藉由對經重取樣之信號890執行傾斜平衡而產生第二經重取樣之信號232。在一些實施中,傾斜平衡器812及傾斜平衡器842可分別補償歸因於去加重器804及去加重器834之低通(LP)效應。
參看圖9,展示移位估計器204之說明性實例。移位估計器204可包括信號比較器906、內插器910、移位改進器911、移位變化分析器912、絕對移位產生器913或其組合。應理解移位估計器204可包括比圖9中所說明之組件少或多的組件。
信號比較器906可產生比較值934(例如,不同值、類似性值、相干值或交叉相關值)、試驗性移位值936,或兩者。舉例而言,信號比較器906可基於第一經重取樣之信號230及應用於第二經重取樣之信號232的複數個移位值產生比較值934。信號比較器906可基於比較值934判定試驗性移位值936。第一經重取樣信號230可包括比第一音訊信號130更少之樣本或 更多之樣本。第二經重取樣信號232可包括比第二音訊信號132更少之樣本或更多之樣本。相比於基於原始信號(例如,第一音訊信號130及第二音訊信號132)之樣本,基於經重取樣之信號(例如,第一經重取樣之信號230及第二經重取樣之信號232)的較少樣本判定比較值934可使用更少的資源(例如,時間、操作之數目,或兩者)。相比於基於原始信號(例如,第一音訊信號130及第二音訊信號132)之樣本,基於經重取樣之信號(例如,第一經重取樣之信號230及第二經重取樣之信號232)的更多樣本判定比較值934可增加精確度。信號比較器906可向內插器910提供比較值934、試驗性移位值936或兩者。
內插器910可擴展試驗性移位值936。舉例而言,內插器910可產生經內插移位值938。舉例而言,藉由內插比較值934,內插器910可產生對應於接近試驗性移位值936之移位值的經內插之比較值。內插器910可基於經內插之比較值及比較值934判定經內插移位值938。比較值934可基於移位值之較粗略之粒度。舉例而言,比較值934可基於移位值之集合的第一子集,以使得第一子集之第一移位值與第一子集之每一第二移位值之間的差大於或等於臨限值(例如,
Figure 106132827-A0305-02-0033-1
1)。臨限值可基於重取樣因數(D)。
經內插之比較值可基於接近於經重取樣之試驗性移位值936的移位值之較精細之粒度。舉例而言,經內插之比較值可基於移位值之集合之第二子集,以使得第二子集之最大移位值與經重取樣試驗性移位值936之間的差小於臨限值(例如,
Figure 106132827-A0305-02-0033-2
1),且第二子集之最小移位值與經重取樣試驗性移位值936之間的差小於臨限值。相比於基於移位值之集合之較精細粒度(例如,所有)判定比較值934,基於移位值之集合的較粗略粒度(例如,第一子集)判定比較值934可使用更少的資源(例如,時間、操作或兩者)。在不 判定對應於移位值之集合的每一移位值的比較值情況下,基於接近於試驗性移位值936的移位值之較小集合之較精細粒度,判定對應於移位值之第二子集的經內插之比較值可擴展試驗性移位值936。因此,基於移位值之第一子集判定試驗性移位值936及基於經內插比較值判定經內插移位值938可平衡資源使用率及經估計移位值的改進。內插器910可將經內插移位值938提供至移位改進器911。
移位改進器911可藉由改進經內插移位值938產生經修正之移位值940。舉例而言,移位改進器911可判定經內插失配值938是否指示第一音訊信號130與第二音訊信號132之間的移位變化大於移位變化臨限值。移位變化可由經內插移位值938及與前一訊框相關聯的第一移位值之間的差指示。為回應差小於或等於臨限值之判定,移位改進器911可將經修正之移位值940設定為經內插移位值938。替代地,為回應差大於臨限值之判定,移位改進器911可判定對應於小於或等於移位變化臨限值之差的複數個移位值。移位改進器911可基於第一音訊信號130及應用於第二音訊信號132之複數個移位值判定比較值。移位改進器911可基於比較值判定經修正之移位值940。舉例而言,移位改進器911可基於比較值及經內插移位值938選擇複數個移位值之移位值。移位改進器911可設定經修正之移位值940以指示所選擇移位值。對應於前一訊框之第一移位值與經內插移位值938之間的非零差可指示第二音訊信號132之一些樣本對應於兩個訊框。舉例而言,可在編碼期間複製第二音訊信號132之一些樣本。替代地,非零差可指示第二音訊信號132之一些樣本既不對應於前一訊框亦不對應於當前訊框。舉例而言,第二音訊信號132之一些樣本可在編碼期間丟失。將經修正之移位值940設定為複數個移位值中之一者可防止在連續 (或相鄰)訊框之間的大移位變化,藉此減少在編碼期間樣本丟失或樣本複製的量。移位改進器911可將經修正之移位值940提供至移位變化分析器912。
在一些實施中,移位改進器911可調整經內插移位值938。移位改進器911可基於經調整內插移位值938判定經修正之移位值940。在一些實施中,移位改進器911可判定經修正之移位值940。
移位變化分析器912可判定經修正之移位值940是否指示第一音訊信號130與第二音訊信號132之間的時序切換或反向,如參看圖1所描述。詳言之,時序反向或切換可指示對於前一訊框,第一音訊信號130係在第二音訊信號132之前在該(該等)輸入介面112處接收,且對於後續訊框,第二音訊信號132係在第一音訊信號130之前在該(該等)輸入介面處接收。替代地,時序反向或切換可指示對於前一訊框,第二音訊信號132係在第一音訊信號130之前在該(該等)輸入介面112處接收,且對於後續訊框,第一音訊信號130係在第二音訊信號132之前在該(該等)輸入介面處接收。換言之,時序切換或反向可指示對應於前一訊框之最終移位值具有不同於對應於當前訊框之經修正移位值940之第二正負號的第一正負號(例如,正至負轉變或反之亦然)。移位變化分析器912可基於經修正之移位值940及與前一訊框相關聯的第一移位值判定第一音訊信號130與第二音訊信號132之間的延遲是否已切換正負號。為回應判定第一音訊信號130與第二音訊信號132之間的延遲已切換正負號,移位變化分析器912可將最終移位值116設定為指示無時間移位之值(例如,0)。替代地,為回應第一音訊信號130與第二音訊信號132之間的延遲並未切換正負號的判定,移位變化分析器912可將最終移位值116設定為經修正之移位值940。移位變化分析器912 可藉由改進經修正之移位值940產生經估計移位值。移位變化分析器912可將最終移位值116設定為經估計之移位值。藉由避免第一音訊信號130之連續(或相鄰)訊框的第一音訊信號130及第二音訊信號132在相對方向上之時間移位,將最終移位值116設定為指示無時間移位可降低解碼器處之失真。絕對移位產生器913可藉由將絕對函式應用於最終移位值116來產生非因果移位值。
參看圖10,展示通信之方法1000。方法1000可藉由圖1之第一器件104、圖1至圖2之編碼器114、圖1至圖7之頻域立體聲寫碼器109、圖2及圖8之信號預處理器202、圖2及圖9之移位估計器204或其組合執行。
方法1000包括於1002處在第一器件處判定指示第一音訊信號相對於第二音訊信號之移位的移位值。舉例而言,參看圖2,時間性等化器108可判定指示第一音訊信號130(例如,「目標」)相對於第二音訊信號132(例如,「參考」)之移位(例如,非因果移位)的最終移位值116(例如,非因果移位值)。舉例而言,最終移位值116之第一值(例如,正值)可指示第二音訊信號132相對於第一音訊信號130延遲。最終移位值116之第二值(例如,負值)可指示第一音訊信號130相對於第二音訊信號132延遲。最終移位值116之第三值(例如,0)可指示第一音訊信號130與第二音訊信號132之間無延遲。
在1004處,可基於移位值對第二音訊信號執行時間移位操作以產生經調整第二音訊信號。舉例而言,參看圖2,目標信號調整器210可基於自第一移位值262(Tprev)至最終移位值116(T)之時間性移位演進調整目標信號242。舉例而言,第一移位值262可包括對應於前一訊框之最終移位值。為回應最終移位值自具有小於對應於前一訊框之最終移位值116(例 如,T=4)之對應於前一訊框之第一值(例如,Tprev=2)的第一移位值262變化之判定,目標信號調整器210可內插目標信號242,以使得對應於訊框邊界之目標信號242的樣本之子集經由平滑且緩慢移位丟棄,以產生經調整之目標信號192。替代地,為回應最終移位值自大於最終移位值116(例如,T=2)之第一移位值262(例如,Tprev=4)變化之判定,目標信號調整器210可內插目標信號242,使得對應於訊框邊界之目標信號242之樣本之子集經由平滑及緩慢移位進行重複以產生經調整目標信號192。基於混合正弦內插器及拉格朗日內插器,可執行平滑及緩慢移位。為回應最終移位值並未自第一移位值262改變成最終移位值116(例如,Tprev=T)之判定,目標信號調整器210可在時間上偏移目標信號242以產生經調整目標信號192。
在1006處,可對第一音訊信號執行第一變換操作以產生頻域第一音訊信號。在1008處,可對經調整第二音訊信號執行第二變換操作以產生頻域經調整第二音訊信號。舉例而言,參看圖3至圖7,可對參考信號190執行變換302且可對經調整目標信號192執行變換304。變換302、304可包括頻域變換操作。作為非限制性實例,變換302、304可包括DFT操作、FFT操作等。根據一些實施,QMF操作(例如,使用複雜低延遲濾波器組)可用於將輸入信號(例如,參考信號190及經調整目標信號192)分裂成多個子頻帶,且在一些實施中,可使用另一頻域變換操作將子頻帶進一步轉換為頻域。變換302可應用於參考信號190以產生頻域參考信號Lfr(b)330,且變換304可應用於經調整目標信號192以產生頻域經調整目標信號Rfr(b)332。
在1010處,可基於頻域第一音訊信號及頻域經調整第二音訊信號估 計一或多個立體聲參數。舉例而言,參看圖3至圖7,頻域參考信號330及頻域經調整目標信號332可經提供至立體聲參數估計器306及旁頻帶信號產生器308。立體聲參數估計器306可基於頻域參考信號330及頻域經調整目標信號332提取(例如,產生)立體聲參數162。舉例而言,IID(b)可取決於頻帶(b)中之左聲道的能量EL(b)及頻帶(b)中之右聲道的能量ER(b)。舉例而言,IID(b)可表達為20*log10(EL(b)/ER(b))。在編碼器處估計並傳輸之IPD可提供在頻帶(b)中之左聲道與右聲道之間的頻域中之相位差之估計。立體聲參數162可包括額外(或替代)參數,諸如ICC、ITD等。
在1012處,一或多個立體聲參數可經發送至第二器件。舉例而言,參看圖1,第一器件104可傳輸立體聲參數162至圖1之第二器件106。
方法1000亦可包括基於第一音訊信號及經調整第二音訊信號而產生時域中頻帶。舉例而言,參看圖3、圖4及圖7,中頻帶信號產生器312可基於參考信號190及經調整目標信號192產生時域中頻帶信號336。舉例而言,時域中頻帶信號336可表達為(l(t)+r(t))/2,其中l(t)包括參考信號190且r(t)包括經調整目標信號192。方法1000亦可包括編碼時域中頻帶信號以產生中頻帶位元串流。舉例而言,參看圖3及圖4,中頻帶編碼器316可藉由編碼時域中頻帶信號336產生中頻帶位元串流166。方法1000可進一步包括發送中頻帶位元串流至第二器件。舉例而言,參看圖1,傳輸器110可發送中頻帶位元串流166至第二器件106。
方法1000亦可包括基於頻域第一音訊信號、頻域經調整第二音訊信號及一或多個立體聲參數產生旁頻帶信號。舉例而言,參看圖3,旁頻帶產生器308可基於頻域參考信號330及頻域經調整目標信號332產生頻域旁頻帶信號334。可在頻域區間/頻帶中估計頻域旁頻帶信號334。在每一頻 帶中,增益參數(g)係不同的且可係基於聲道間位準差值(例如,基於立體聲參數162)。舉例而言,頻域旁頻帶信號334可表達為(Lfr(b)-c(b)* Rfr(b))/(1+c(b)),其中c(b)可為ILD(b)或ILD(b)之函式(例如,c(b)=10^(ILD(b)/20))。
方法1000亦可包括對時域中頻帶信號執行第三變換操作以產生頻域中頻帶信號。舉例而言,參看圖3,變換314可應用於時域中頻帶信號336以產生頻域中頻帶信號338。方法1000亦可包括基於旁頻帶信號、頻域中頻帶信號及一或多個立體聲參數產生旁頻帶位元串流。舉例而言,參看圖3,旁頻帶編碼器310可基於立體聲參數162、頻域旁頻帶信號334及頻域中頻帶信號338產生旁頻帶位元串流164。
方法1000亦可包括基於頻域第一音訊信號及頻域經調整第二音訊信號及另外或替代地基於立體聲參數而產生頻域中頻帶信號。舉例而言,參看圖5至圖6,中頻帶信號產生器502可基於頻域參考信號330及頻域經調整目標信號332及另外或替代地基於立體聲參數162而產生頻域中頻帶信號530。方法1000亦可包括編碼頻域中頻帶信號以產生中頻帶位元串流。舉例而言,參看圖5,中頻帶編碼器504可編碼頻域中頻帶信號530以產生中頻帶位元串流166。
方法1000亦可包括基於頻域第一音訊信號、頻域經調整第二音訊信號及一或多個立體聲參數產生旁頻帶信號。舉例而言,參看圖5至圖6,旁頻帶產生器308可基於頻域參考信號330及頻域經調整目標信號332產生頻域旁頻帶信號334。根據一個實施,方法1000包括基於旁頻帶信號、中頻帶位元串流及一或立體聲參數產生旁頻帶位元串流。舉例而言,參看圖6,中頻帶位元串流166可經提供至旁頻帶編碼器602。旁頻帶編碼器602 可經組態以基於立體聲參數162、頻域旁頻帶信號334及中頻帶位元串流166產生旁頻帶位元串流164。根據另一實施,方法1000包括基於旁頻帶信號、頻域中頻帶信號及一或多個立體聲參數產生旁頻帶位元串流。舉例而言,參考圖5,旁頻帶編碼器506可基於立體聲參數162、頻域旁頻帶信號334及頻域中頻帶信號530產生旁頻帶位元串流164。
根據一個實施,方法1000亦可包括藉由下取樣第一音訊信號產生第一經降頻取樣信號及藉由下取樣第二音訊信號產生第二經降頻取樣信號。方法1000亦可包括基於第一經降頻取樣信號及應用於第二經降頻取樣信號之複數個移位值判定比較值。移位值可基於比較值。
根據另一實施,方法1000亦可包括判定對應於先於第一樣本之第一音訊信號之第一特定樣本的第一移位值及基於對應於第一音訊信號及第二音訊信號之比較值判定經修正之移位值。移位值可基於經修正之移位值與第一移位值的比較。
圖10之方法1000可使得頻域立體聲寫碼器109能夠將參考信號190及經調整目標信號192變換為頻域以產生立體聲參數162、旁頻帶位元串流164及中頻帶位元串流166。時間性等化器108之將第一音訊信號130在時間上移位以與第二音訊信號132對準的時間移位技術可結合頻域信號處理來實施。舉例而言,時間性等化器108在編碼器114處估計每一訊框之移位(例如,非因果移位值),根據非因果移位值移位(例如,調整)目標聲道,並使用移位的經調整聲道用於變換域中之立體聲參數估計。
參看圖11,展示說明解碼器118之特定實施的圖。經編碼音訊信號經提供至解碼器118之解多工器(DEMUX)1102。經編碼音訊信號可包括立體聲參數162、旁頻帶位元串流164及中頻帶位元串流166。解多工器1102 可經組態以自經編碼音訊信號提取中頻帶位元串流166,且將中頻帶位元串流166提供至中頻帶解碼器1104。解多工器1102亦可經組態以自經編碼音訊信號提取旁頻帶位元串流164及立體聲參數162(例如,ILD、IPD)。可將旁頻帶位元串流164及立體聲參數162提供至旁頻帶解碼器1106。
中頻帶解碼器1104可經組態以對中頻帶位元串流166進行解碼以產生中頻帶信號(mCODED(t))1150。若中頻帶信號1150為時域信號,則可將變換1108應用於中頻帶信號1150以產生頻域中頻帶信號(MCODED(b))1152。頻域中頻帶信號1152可經提供至升混器1110。然而,若中頻帶聲道1150為頻域信號,則中頻帶信號1150可直接提供至升混器1110且變換1108可被略過或可不存在於解碼器118中。
旁頻帶解碼器1106可基於旁頻帶位元串流164及立體聲參數162產生旁頻帶信號(SCODED(b))1154。舉例而言,可針對低頻帶及高頻帶解碼錯誤(e)。旁頻帶信號1154可表達為SPRED(b)+eCODED(b),其中SPRED(b)=MCODED(b)*(ILD(b)-1)/(ILD(b)+1)。旁頻帶信號1154亦可經提供至升混器1110。
升混器1110可基於頻域中頻帶信號1152及旁頻帶信號1154執行升混操作。舉例而言,升混器1110可基於頻域中頻帶信號1152及旁頻帶信號1154產生第一升混信號(Lfr)1156及第二升混信號(Rfr)1158。因此,在所描述實例中,第一升混信號1156可為左聲道信號,且第二升混信號1158可為右聲道信號。第一升混信號1156可表達為MCODED(b)+SCODED(b),且第二升混信號1158可表達為MCODED(b)-SCODED(b)。可將升混信號1156、1158提供至立體聲參數處理器1112。
立體聲參數處理器1112可將立體聲參數162(例如,ILD、IPD)應用 於升混信號1156、1158以產生信號1160、1162。舉例而言,立體聲參數162(例如,ILD、IPD)可應用於頻域中之升混左聲道及右聲道。當可用時,IPD(相位差值)可在左及右聲道上擴展以維持聲道間相位差值。逆變換1114可應用於信號1160以產生第一時域信號l(t)1164,且逆變換1116可應用於信號1162以產生第二時域信號r(t)1166。逆變換1114、1116之非限制性實例包括逆離散餘弦變換(IDCT)操作、快速傅立葉逆變換(IFFT)操作等。根據一個實施,第一時域信號1164可為參考信號190之重建構版本,且第二時域信號1166可為經調整目標聲道192之重建構版本。
根據一個實施,在升混器1110處執行的操作可在立體聲參數處理器1112處執行。根據另一實施,在立體聲參數處理器1112處執行的操作可在升混器1110處執行。根據又一個實施,升混器1110及立體聲參數處理器1112可實施於單個處理元件(例如,單個處理器)內。
另外,可將第一時域信號1164及第二時域信號1166提供至時域升混器1120。時域升混器1120可對時域信號1164、1166(例如,經逆變換之左及右信號)執行時域升混。時域升混器1120可執行逆移位調整以撤銷在時間性等化器108(更特定言之,目標信號調整器210)中執行的移位調整。時域升混可基於時域降混參數168。舉例而言,時域升混可基於第一移位值262及參考信號指示符264。另外,時域升混器1120可執行在可存在的時域降混模組處執行的其他操作之逆操作。
參看圖12,揭示系統之特定說明性實例且一般將其指定為1200。系統1200包括經由網路120以通信方式耦接至第二器件1206之第一器件1204。第一器件1204可對應於圖1之第一器件104,且第二器件1206可對應於圖1之第二器件106。舉例而言,圖1之第一器件104之組件亦可包括 於第一器件1204中,且圖1之第二器件106之組件亦可包括於第二器件1206中。因此,除了關於圖12描述之寫碼技術之外,第一器件1204可以實質上類似於圖1之第一器件104的方式操作,且第二器件1206可以實質上類似於圖1之第二器件106的方式操作。
第一器件1204可包括編碼器1214、傳輸器1210、輸入介面1212或其組合。根據一個實施,編碼器1214可對應於圖1之編碼器114且可以實質上類似方式操作,傳輸器1210可對應於圖1之傳輸器110且可以實質上類似方式操作,且輸入介面1212可對應於圖1之輸入介面112且可以實質上類似方式操作。輸入介面1212之第一輸入介面可耦接至第一麥克風1246。輸入介面1212之第二輸入介面可耦接至第二麥克風1248。編碼器1214可包括頻域移位器1208及頻域立體聲寫碼器1209且可經組態以降混並編碼多音訊信號,如本文所描述。第一器件1204亦可包括經組態以儲存分析資料1291之記憶體1253。第二器件1206可包括解碼器1218。解碼器1218可包括經組態以升混及再現多個聲道之時間性平衡器1224。第二器件1206可經耦接至第一揚聲器1242、第二揚聲器1244或兩者。
在操作期間,第一器件1204可經由第一輸入介面自第一麥克風1246接收第一音訊信號1230,並可經由第二輸入介面自第二麥克風1248接收第二音訊信號1232。第一音訊信號1230可對應於右聲道信號或左聲道信號中之一者。第二音訊信號1232可對應於右聲道信號或左聲道信號中之另一者。與第二麥克風1248相比,聲源1252可更接近於第一麥克風1246。因此,來自聲源1252之音訊信號可在與經由第二麥克風1248相比較早時間處經由第一麥克風1246在輸入介面1212處接收。經由多個麥克風獲取之多聲道信號的此固有延遲可在第一音訊信號1230與第二音訊信 號1232之間引入時間性失配。
頻域移位器1208可經組態以執行左聲道及右聲道之變換操作(例如,變換分析)以估計變換域(例如,頻域)中之非因果移位值。舉例而言,頻域移位器1208可對左聲道及右聲道執行開窗操作。舉例而言,頻域移位器1208可對左聲道執行開窗操作以分析第一音訊信號1230之特定窗,且頻域移位器1208可對右聲道執行開窗操作以分析第二音訊信號1232之對應窗。頻域移位器1208可對第一音訊信號1230執行第一變換操作(例如,DFT操作)以將第一音訊信號1230自時域轉換成變換域,且頻域移位器1208可對第二音訊信號1232執行第二變換操作(例如,DFT操作)以將第二音訊信號1232自時域轉換成變換域。
頻域移位器1208可基於變換域中之第一音訊信號1230與變換域中之第二音訊信號1232之間的相位差估計非因果移位值(例如,最終移位值1216)。最終移位值1216可為與聲道指示符相關聯之非負值。聲道指示符可指示哪一音訊信號1230、1232為參考信號(例如,參考聲道)且哪一音訊信號1230、1232為目標信號(例如,目標聲道)。替代地,可估計移位值(例如,正值、零值或負值)。如本文所使用,「移位值」亦可被稱作「時間失配值」。移位值可經傳輸至第二器件1206。
根據另一實施,移位值之絕對值可為最終移位值1216(例如,非因果移位值)且移位值之正負號可指示哪一音訊信號1230、1232為參考信號且哪一音訊信號1230、1232為目標信號。時間性失配值之絕對值(例如,最終移位值1216)以及失配值之正負號可經傳輸至第二器件1206,該失配值之正負號指示哪一聲道為參考聲道且哪一聲道為目標聲道。
在判定最終移位值1216之後,頻域移位器1208藉由執行變換域(例 如,頻域)中之目標信號之相位旋轉在時間上對準目標信號及參考信號。舉例而言,若第一音訊信號1230為參考信號,則頻域信號1290可對應於變換域中之第一音訊信號1230。頻域移位器1208可執行變換域中之第二音訊信號1232的相位旋轉以產生在時間上與頻域信號1290對準的頻域信號1292。頻域信號1290及頻域信號1292可經提供至頻域立體聲寫碼器1209。
因此,頻域移位器1208可在時間上對準第二音訊信號1232(例如,目標信號)之變換域版本以產生信號1292,使得第一音訊信號1230之變換域版本及信號1292實質上經同步。頻域移位器1208可產生頻域降混參數1268。頻域降混參數1268可指示目標信號與參考信號之間的移位值。在其他實施中,頻域降混參數1268可包括類似於降混增益等之額外參數。
頻域立體聲寫碼器1209可基於頻域信號(例如,頻域信號1290、1292)估計立體聲參數1262。立體聲參數1262可包括使得能夠再現與左聲道及右聲道相關聯之空間性質的參數。根據一些實施,立體聲參數1262可包括各種參數,諸如聲道間強度差(IID)參數(例如,聲道間位準差(ILD))、稱為旁頻帶增益之ILD的替代、聲道間時差(ITD)參數、聲道間相位差(IPD)參數、聲道間相關(ICC)參數、非因果移位參數、頻譜傾斜參數、聲道間語音參數、聲道間音調參數、聲道間增益參數等。應理解除非明確地提及,否則ILD亦可指替代旁頻帶增益。ITD參數可對應於時間性失配值或最終移位值1216。立體聲參數1262可在頻域立體聲寫碼器1209處在其他信號產生期間使用。立體聲參數1262亦可作為經編碼信號之部分而傳輸。根據一個實施,藉由頻域立體聲寫碼器1209執行之操作亦可藉由頻域移位器1208執行。作為非限制性實例,頻域移位器1208可判定 ITD參數並使用ITD參數作為最終移位值1216。
頻域立體聲寫碼器1209亦可至少部分地基於頻域信號而產生旁頻帶位元串流1264及中頻帶位元串流1266。為達成說明之目的,除非另外指出,否則假定頻域信號1290(例如,參考信號)為左聲道信號(l或L)且頻域信號1292為右聲道信號(r或R)。頻域信號1290可標示為Lfr(b)且頻域信號1292可標示為Rfr(b),其中b表示頻域表示之頻帶。根據一個實施,旁頻帶信號Sfr(b)可在頻域中由頻域信號1290及頻域信號1292產生。舉例而言,旁頻帶信號Sfr(b)可表達為(Lfr(b)-Rfr(b))/2。旁頻帶信號Sfr(b)可經提供至旁頻帶編碼器以產生旁頻帶位元串流1264。中頻帶信號Mfr(b)亦可由頻域信號1290、1292產生。
可使用多個技術來對旁頻帶信號Sfr(b)及中頻帶信號Mfr(b)進行編碼。旁頻帶寫碼之一個實施包括使用頻率中頻帶信號Mfr(b)及對應於頻帶(b)之立體聲參數1262(例如,ILD)中之資訊自頻域中頻帶信號Mfr(b)預測旁頻帶SPRED(b)。舉例而言,預測旁頻帶SPRED(b)可表達為Mfr(b)*(ILD(b)-1)/(ILD(b)+1)。頻帶(b)中之錯誤信號e(b)可依據旁頻帶信號Sfr(b)及預測旁頻帶SPRED(b)而計算。舉例而言,錯誤信號e(b)可表達為Sfr(b)-SPRED(b)。可使用變換域寫碼技術寫碼錯誤信號e(b)以產生經寫碼錯誤信號eCODED(b)。對於較高頻帶,錯誤信號e(b)可表達為來自前一訊框的頻帶(b)中之中頻帶信號M_PASTfr(b)之按比例調整版本。舉例而言,經寫碼錯誤信號eCODED(b)可表達為gPRED(b)*M_PASTfr(b),其中gPRED(b)可經估計,以使得e(b)-gPRED(b)*M_PASTfr(b)之能量實質上減少(例如,減至最小)。
傳輸器1210可經由網路120傳輸立體聲參數1262、旁頻帶位元串流 1264、中頻帶位元串流1266、頻域降混參數1268或其組合至第二器件1206。替代地或另外,傳輸器1210可將立體聲參數1262、旁頻帶位元串流1264、中頻帶位元串流1266、頻域降混參數1268或其組合儲存於網路120之器件或本端器件處以供稍後進一步處理或解碼。因為非因果移位(例如,最終移位值1216)可在編碼過程期間被判定,因此除每一頻帶中之非因果移位以外傳輸IPD及/或ITD(例如,作為立體聲參數1262之部分)可為冗餘的。因此,在一些實施中,可針對相同訊框但在相互獨佔式頻帶中估計IPD及/或ITD及非因果移位。在其他實施中,除用於每頻帶較精細調整之移位以外還可估計較低解析度IPD。替代地,可不針對其中判定非因果移位之訊框判定IPD及/或ITD。
解碼器1218可基於立體聲參數1262、旁頻帶位元串流1264、中頻帶位元串流1266及頻域降混參數1268執行解碼操作。解碼器1218(例如,第二器件1206)可因果地移位再生目標信號以撤銷藉由編碼器1214執行的非因果移位。因果移位可在頻域中(例如,藉由相位旋轉)或在時域中執行。解碼器1218可執行升混,以產生(例如,對應於第一音訊信號1230之)第一輸出信號1226、(例如,對應於第二音訊信號1232之)第二輸出信號1228或兩者。第二器件1206可經由第一揚聲器1242輸出第一輸出信號1226。第二器件1206可經由第二揚聲器1244輸出第二輸出信號1228。在替代性實例中,第一輸出信號1226及第二輸出信號1228可作為立體聲信號對傳輸至單個輸出揚聲器。
系統1200因此可使得頻域立體聲寫碼器1209能夠產生立體聲參數1262、旁頻帶位元串流1264及中頻帶位元串流1266。頻域移位器1208之頻率移位技術可結合頻域信號處理而實施。舉例而言,頻域移位器1208 在編碼器1214處估計每一訊框之移位(例如,非因果移位值),根據非因果移位值移位(例如,調整)目標聲道,並使用移位的經調整聲道用於變換域中之立體聲參數估計。
參看圖13,展示第一器件1204的編碼器1214之說明性實例。編碼器1214包括頻域移位器1208之第一實施1208a及頻域立體聲寫碼器1209。頻域移位器1208a包括開窗電路1302、變換電路1304、開窗電路1306、變換電路1308、聲道間移位估計器1310及移位器1312。
在操作期間,第一音訊信號1230(例如,時域信號)可經提供至開窗電路1302且第二音訊信號1232(例如,時域信號)可經提供至開窗電路1306。開窗電路1302可對左聲道(例如,對應於第一音訊信號1230之聲道)執行開窗操作以分析第一音訊信號1230之特定窗。開窗電路1306可對右聲道(例如,對應於第二音訊信號1232之聲道)執行開窗操作以分析第二音訊信號1232之對應窗。
變換電路1304可對第一音訊信號1230執行第一變換操作(例如,離散傅立葉變換(DFT)操作)以將第一音訊信號1230自時域轉換成變換域。舉例而言,變換電路1304可對第一音訊信號1230執行第一變換操作以產生頻域信號1290。頻域信號1290可經提供至聲道間移位估計器1310及頻域立體聲寫碼器1209。變換電路1308可對第二音訊信號1232執行第二變換操作(例如,DFT操作)以將第二音訊信號1232自時域轉換成變換域。舉例而言,變換電路1308可對第二音訊信號1232執行第二變換操作以產生時域信號1350。時域信號1350可經提供至聲道間移位估計器1310及移位器1312。
聲道間移位估計器1310可基於頻域信號1290與頻域信號1350之間的 相位差估計最終移位值1216(例如,非因果移位值或ITD值)。最終移位值1216可經提供至移位器1312。如本文所使用,「最終移位值」可被稱作「最終時間性失配值」。因此,術語「移位值」及「時間性失配值」可在本文中互換使用。根據一個實施,最終移位值1216經寫碼並提供至第二器件1206。移位器1312對變換域信號1350執行相移操作(例如,相位旋轉操作)以產生頻域信號1292。頻域信號1292之相位係如此使得頻域信號1292及頻域信號1290在時間上對準。
在圖13中,假定第二音訊信號1232為目標信號。然而,若目標信號未知,則頻域信號1350及頻域信號1290可經提供至移位器1312。最終移位值1216可指示哪一頻域信號1350、1290對應於目標信號,且移位器1312可對對應於目標信號之頻域信號1350、1290執行相位旋轉操作。基於最終移位值之相位旋轉操作可對另一信號略過。應注意,亦可執行基於經計算IPD之其他相位旋轉操作(若可用)。頻域信號1292可經提供至頻域立體聲寫碼器1209。關於圖15至圖16描述頻域立體聲寫碼器1209之操作。
參看圖14,展示第一器件1204之編碼器1214之另一說明性實例。編碼器1214包括頻域移位器1208之第二實施1208b及頻域立體聲寫碼器1209。頻域移位器1208b包括開窗電路1302、變換電路1304、開窗電路1306、變換電路1308及非因果移位器1402。
開窗電路1302、1306及變換電路1304、1308可以實質上類似於關於圖13所描述之方式操作。舉例而言,開窗電路1302、1306及變換電路1304、1308可分別基於音訊信號1230、1232產生頻域信號1290、1350。頻域信號1290、1350可經提供至非因果移位器1402。
非因果移位器1402可在時間上對準頻域中之目標聲道及參考聲道。舉例而言,非因果移位器1402可執行目標聲道之相位旋轉以非因果地移位目標聲道以與參考聲道對準。最終移位值1216可自記憶體1253提供至非因果移位器1402。根據一些實施,來自前一訊框之移位值(基於時域技術或頻域技術而估計)可用作最終移位值1216。因此,來自前一訊框之移位值可在逐訊框之基礎上使用,其中時域降混技術及頻域降混技術係基於特定量度在編解碼器(CODEC)中選擇。最終移位值1216(例如,非因果移位值)可指示非因果移位且可指示目標聲道。最終移位值1216可在時域中或在變換域中估計。舉例而言,最終移位值1216可指示右聲道(例如,與頻域信號1350相關聯之聲道)為目標聲道。非因果移位器1402可將頻域信號1350之相位旋轉在最終移位值1216中指示的移位量以產生頻域信號1292。頻域信號1292可經提供至頻域立體聲寫碼器1209。非因果移位器1402可傳遞頻域信號1290(例如,在此實例中之參考聲道)至頻域立體聲寫碼器1209。最終移位值1216指示頻域信號1290為可基於頻域信號1290之最終移位值導致略過相位旋轉的參考聲道。應注意,可執行基於經計算IPD之其他相位旋轉操作(若可用)。關於圖15至圖16描述頻域立體聲寫碼器1209之操作。
參看圖15,展示頻域立體聲寫碼器1209之第一實施1209a。頻域立體聲寫碼器1209之第一實施1209a包括立體聲參數估計器1502、旁頻帶信號產生器1504、中頻帶信號產生器1506、中頻帶編碼器1508及旁頻帶編碼器1510。
頻域信號1290、1292可經提供至立體聲參數估計器1502。立體聲參數估計器1502可基於頻域信號1290、1292提取(例如,產生)立體聲參數 1262。舉例而言,IID(b)可取決於頻帶(b)中之左聲道的能量EL(b)及頻帶(b)中之右聲道的能量ER(b)。舉例而言,IID(b)可表達為20*log10(EL(b)/ER(b))。在編碼器處估計並藉由編碼器傳輸之IPD可提供在頻帶(b)中之左聲道與右聲道之間的頻域中之相位差之估計。立體聲參數1262可包括額外(或替代)參數,諸如ICC、ITD等。立體聲參數1262可經傳輸至圖12之第二器件1206,提供至旁頻帶信號產生器1504,且提供至旁頻帶編碼器1510。
旁頻帶產生器1504可基於頻域信號1290、1292產生頻域旁頻帶信號(Sfr(b))1534。可在頻域區間/頻帶中估計頻域旁頻帶信號1534。在每一頻帶中,增益參數(g)係不同的且可係基於聲道間位準差值(例如,基於立體聲參數1262)。舉例而言,頻域旁頻帶信號1534可表達為(Lfr(b)-c(b)* Rfr(b))/(1+c(b)),其中c(b)可為ILD(b)或ILD(b)之函式(例如,c(b)=10^(ILD(b)/20))。頻域旁頻帶信號1534可經提供至旁頻帶編碼器1510。
頻域信號1290、1292亦可經提供至中頻帶信號產生器1506。根據一些實施,立體聲參數1262亦可經提供至中頻帶信號產生器1506。中頻帶信號產生器1506可基於頻域信號1290、1292產生頻域中頻帶信號Mfr(b)1530。根據一些實施,頻域中頻帶信號Mfr(b)1530亦可基於立體聲參數1262而產生。基於頻域信號1290、1292及立體聲參數162產生中頻帶信號1530之一些方法如下。
Mfr(b)=(Lfr(b)+Rfr(b))/2
Mfr(b)=c1(b)*Lfr(b)+c2*Rfr(b),其中c1(b)及c2(b)為複值。
在一些實施中,複值c1(b)及c2(b)係基於立體聲參數162。舉例而 言,在中旁降混之一個實施中,當估計IPD時,c1(b)=(cos(-γ)-i*sin(-γ))/20.5且c2(b)=(cos(IPD(b)-γ)+i*sin(IPD(b)-γ))/20.5,其中i為表示-1之平方根的虛數。
出於有效旁頻帶信號編碼之目的,頻域中頻帶信號1530可經提供至中頻帶編碼器1508及旁頻帶編碼器1510。在此實施中,中頻帶編碼器1508可在編碼之前進一步將中頻帶信號1530變換至任何其他變換/時域。舉例而言,中頻帶信號1530(Mfr(b))可經逆變換回至時域,或變換至MDCT域以用於寫碼。
旁頻帶編碼器1510可基於立體聲參數1262、頻域旁頻帶信號1534及頻域中頻帶信號1530產生旁頻帶位元串流1264。中頻帶編碼器1508可基於頻域中頻帶信號1530產生中頻帶位元串流1266。舉例而言,中頻帶編碼器1508可編碼頻域中頻帶信號1530以產生中頻帶位元串流1266。
參看圖16,展示頻域立體聲寫碼器1209之第二實施1209b。頻域立體聲寫碼器1209之第二實施1209b包括立體聲參數估計器1502、旁頻帶信號產生器1504、中頻帶信號產生器1506、中頻帶編碼器1508及旁頻帶編碼器1610。
頻域立體聲寫碼器1209之第二實施1209b可以實質上類似於頻域立體聲寫碼器1209之第一實施1209a的方式操作。然而,在第二實施1209b中,中頻帶位元串流1266可經提供至旁頻帶編碼器1610。在替代實施中,基於中頻帶位元串流之經量化中頻帶信號可經提供至旁頻帶編碼器1610。旁頻帶編碼器1610可經組態以基於立體聲參數1262、頻域旁頻帶信號1534及中頻帶位元串流1266產生旁頻帶位元串流1264。
參看圖17,展示補零目標信號之實例。關於圖17描述之補零技術可 藉由圖12之編碼器1214執行。
在1702處,展示第二音訊信號1232(例如,目標信號)之窗。在1702處,編碼器1214可對第二音訊信號1232之兩旁執行補零。舉例而言,窗中之第二音訊信號1232之內容可經補零。然而,若第二音訊信號1232(或第二音訊信號1232之頻域版本)經歷因果或非因果移位(例如,時間移位或相位移位),則窗中之第二音訊信號1232之非零部分可經旋轉且不連續可在時間域中發生。因此,為避免與補零兩旁相關聯之不連續,補零的量可增加。然而,增加補零之量可增加窗大小及變換操作之複雜度。增加補零之量亦可增加立體聲或多聲道寫碼系統之端對端延遲。
然而,在1704處,使用非對稱補零展示第二音訊信號1232之窗。非對稱補零之一個實例為單旁補零。在所說明之實例中,第二音訊信號1232之窗之右手旁由相對大量補零且第二音訊信號1232之窗之左手旁由相對少量補零(或不補零)。結果,第二音訊信號1232可經移位相對大量而不導致不連續。另外,窗之大小相對較小,此可導致與變換操作相關聯的減少之複雜度。
在1706處,使用單旁(或非對稱)補零展示第二音訊信號1232之窗。在所說明的實例中,第二音訊信號1232之左手旁相對大量補零且第二音訊信號1232之右手旁並不補零。結果,第二音訊信號1232可經移位(向左)相對大量而不導致不連續。另外,窗之大小相對較小,此可導致與變換操作相關聯的減少之複雜度。
因此,相較於補零窗之兩旁,關於圖17描述之補零技術可藉由基於移位之方向補零窗之一旁在編碼器處實現目標聲道之相對大移位(例如,相對大時間移位或相對大相位旋轉/移位)。舉例而言,因為編碼器非因果 地移位目標聲道,因此窗之一個旁可經補零(如在1704及1706處所說明)以促進相對大移位,且窗之大小可等於具有雙旁補零的窗之大小。另外,解碼器可回應於編碼器處之非因果移位而執行因果移位。結果,解碼器可補零窗之與編碼器相對的旁以促進相對大因果移位。
參看圖18,展示通信之方法1800。方法1800可藉由圖1之第一器件104、圖1至圖2之編碼器114、圖1至圖7之頻域立體聲寫碼器109、圖2及圖8之信號預處理器202、圖2及圖9之移位估計器204、圖12之第一器件1204、圖12之編碼器1214、圖12之頻域移位器1208、圖12之頻域立體聲寫碼器1209或其組合執行。
方法1800包括在1802處在第一器件處使用編碼器側開窗方案對參考聲道執行第一變換操作以產生頻域參考聲道。舉例而言,參看圖13,變換電路1304可對第一音訊信號1230(例如,根據方法1800之參考聲道)執行第一變換操作以產生頻域信號1290(例如,根據方法1800之頻域參考聲道)。
方法1800亦包括在1804處使用編碼器側開窗方案對目標聲道執行第二變換操作以產生頻域目標聲道。舉例而言,參看圖13,變換電路1308可對第二音訊信號1232(例如,根據方法1800之目標聲道)執行第二變換操作以產生頻域信號1350(例如,根據方法1800之頻域目標聲道)。
方法1800亦包括在1806處判定指示頻域參考聲道與頻域目標聲道之間的聲道間相位未對準(例如,相移或相位旋轉)之量的失配值。舉例而言,參看圖13,聲道間移位估計器1310可判定指示頻域信號1290與頻域信號1350之間的相移之量的最終移位值1216(例如,根據方法1800之失配值)。
方法1800亦包括在1808處基於失配值調整頻域目標聲道以產生頻域經調整目標聲道。舉例而言,參看圖13,移位器1312可基於最終移位值1216調整頻域信號1350以產生頻域信號1292(例如,根據方法1800之頻域經調整目標聲道)。
方法1800亦包括在1810處基於頻域參考聲道及頻域經調整目標聲道估計一或多個立體聲參數。舉例而言,參看圖15至圖16,立體聲參數估計器1502可基於頻域聲道1290、1292估計立體聲參數1262。方法1800亦包括在1812處傳輸一或多個立體聲參數至接收器。舉例而言,參看圖12,傳輸器1210可傳輸立體聲參數1262至第二器件1206之接收器。
根據一個實施,方法1800包括基於頻域參考聲道及頻域經調整目標聲道產生頻域中頻帶聲道。舉例而言,參看圖15,中頻帶信號產生器1506可基於頻域信號1290、1292產生中頻帶信號1530(例如,根據方法1800之頻域中頻帶聲道)。方法1800亦可包括編碼頻域中頻帶聲道以產生中頻帶位元串流。舉例而言,參看圖15,中頻帶編碼器1508可編碼頻域中頻帶信號1530以產生中頻帶位元串流1266。方法1800亦可包括傳輸中頻帶位元串流至接收器。舉例而言,參看圖12,傳輸器1210可傳輸中頻帶位元串流1266至第二器件1206之接收器。
根據一個實施,方法1800包括基於頻域參考聲道、頻域經調整目標聲道及一或多個立體聲參數產生旁頻帶聲道。舉例而言,參看圖15,旁頻帶信號產生器1504可基於頻域信號1290、1292及立體聲參數1262產生頻域旁頻帶信號1534(例如,根據方法1800之旁頻帶聲道)。方法1800亦可包括基於旁頻帶聲道、頻域中頻帶聲道及一或多個立體聲參數產生旁頻帶位元串流。舉例而言,參看圖15,旁頻帶編碼器1510可基於立體聲參數 1262、頻域旁頻帶信號1534及頻域中頻帶信號1530產生旁頻帶位元串流1264。方法1800亦可包括傳輸旁頻帶位元串流至接收器。舉例而言,參看圖12,傳輸器可傳輸旁頻帶位元串流1264至第二器件1206之接收器。
根據一個實施,方法1800可包括藉由降頻取樣頻域參考聲道產生第一經降頻取樣信號及藉由降頻取樣頻域目標聲道產生第二經降頻取樣信號。方法1800亦可包括基於第一經降頻取樣信號及應用於第二經降頻取樣信號之複數個相移值判定比較值。失配可基於比較值。
根據另一實施,方法1800包括在執行第二變換操作之前對頻域目標聲道執行補零操作。可對目標聲道之窗之兩旁執行補零操作。根據另一實施,可對目標聲道之窗的單旁執行補零操作。根據另一實施,可對目標聲道之窗的任一旁不對稱地執行補零操作。在每一實施中,相同開窗方案亦可用於參考聲道。
圖18之方法1800可使得頻域立體聲寫碼器1209能夠產生立體聲參數1262、旁頻帶位元串流1264及中頻帶位元串流1266。頻域移位器1208之相移技術可結合頻域信號處理而實施。舉例而言,頻域移位器1208在編碼器1214處估計每一訊框之移位(例如,非因果移位值),根據非因果移位值移位(例如,調整)目標聲道,並使用移位的經調整聲道用於變換域中之立體聲參數估計。
參看圖19,展示第一解碼器系統1900及第二解碼器系統1950。第一解碼器系統1900包括解碼器1902、移位器1904(例如,因果移位器或非因果移位器)、逆變換電路1906及逆變換電路1908。第二解碼器系統1950包括解碼器1902、逆變換電路1906、逆變換電路1908及移位器1952(例如,因果移位器或非因果移位器)。根據一個實施,第一解碼器系統1900可對 應於圖12之解碼器1218。根據另一實施,第二解碼器系統1950可對應於圖12之解碼器1218。
經編碼位元串流1901可經提供至解碼器1902。經編碼位元串流1901可包括立體聲參數1262、旁頻帶位元串流1264、中頻帶位元串流1266、頻域降混參數1268、最終移位值1216等。在解碼器系統1900、1950處接收之最終移位值1216可為用聲道指示符(例如,目標聲道指示符)多工的非負移位值,或表示負或非負移位之單個移位值。解碼器1902可經組態以基於經編碼位元串流1901解碼中頻帶聲道及旁頻帶聲道。解碼器1902亦可經組態以對中頻帶聲道及旁頻帶聲道執行DFT分析。解碼器1902可解碼立體聲參數1262。
解碼器1902可解碼經編碼位元串流1901以產生經解碼頻域左聲道1910及經解碼頻域右聲道1912。應注意,解碼器1902經組態以執行緊密對應於編碼器之逆操作的操作,直至在非因果移位操作之前為止。因此,在一些實施中,經解碼頻域左聲道1910及經解碼頻域右聲道1912可對應於編碼器側頻域參考聲道(1290)及編碼器側頻域經調整目標聲道(1292),或反之亦然;而在其他實施中,經解碼頻域左聲道1910及經解碼頻域右聲道1912可對應於編碼器側時域參考聲道(190)及編碼器側時域經調整目標聲道(192)之頻率變換版本,或反之亦然。經解碼頻域左聲道1910及經解碼頻域右聲道1912可經提供至移位器1904(例如,因果移位器)。解碼器1902亦可基於經編碼位元串流1901判定最終移位值1216。最終移位值可為指示參考聲道(例如,第一音訊信號1230)與目標聲道(例如,第二音訊信號1232)之間的相移之失配值。最終移位值1216可對應於時間性移位。最終移位值1216可經提供至因果移位器1904。
移位器1904(例如,因果移位器)可經組態以基於最終移位值1216之目標聲道指示符判定經解碼頻域左聲道1910係為目標聲道抑或為參考聲道。類似地,移位器1904可經組態以基於最終移位值1216之目標聲道指示符判定經解碼頻域右聲道1912係為目標聲道抑或為參考聲道。為易於說明,經解碼頻域右聲道1912經描述為目標聲道。然而,應理解在其他實施中(或對於其他訊框),經解碼頻域左聲道1910可為目標聲道且下文所描述之移位操作可對經解碼頻域左聲道1910執行。
移位器1904可經組態以基於最終移位值1216對經解碼頻域右聲道1912(例如,在所說明實例中之目標聲道)執行頻域移位操作(例如,因果移位操作)以產生經調整解碼頻域目標聲道1914。經調整解碼頻域目標聲道1914可經提供至逆變換電路1908。因果移位器1904可基於與最終移位值1216相關聯之目標聲道指示符略過對經解碼頻域左聲道1910之移位操作。舉例而言,最終移位值1216可指示目標聲道(例如,執行頻域因果移位所針對之聲道)為經解碼頻域右聲道1912。經解碼頻域左聲道1910可經提供至逆變換電路1906。
逆變換電路1906可經組態以對經解碼頻域左聲道1910執行第一逆變換操作以產生經解碼時域左聲道1916。根據一個實施,經解碼時域左聲道1916可對應於圖12之第一輸出信號1226。逆變換電路1908可經組態以對經調整解碼頻域目標聲道1914執行第二逆變換操作以產生經調整解碼時域目標聲道1918(例如,時域右聲道)。根據一個實施,經調整解碼時域目標聲道1918可對應於圖12之第二輸出信號1228。
在第二解碼器系統1950處,經解碼頻域左聲道1910可經提供至逆變換電路1906,且經解碼頻域右聲道1912可經提供至逆變換電路1908。逆 變換電路1906可經組態以對經解碼頻域左聲道1910執行第一逆變換操作以產生經解碼時域左聲道1962。逆變換電路1908可經組態以對經解碼頻域右聲道1912執行第二逆變換操作以產生經解碼時域右聲道1964。經解碼時域左聲道1962及經解碼時域右聲道1964可經提供至移位器1952。
在第二解碼器系統1950處,解碼器1902可提供最終移位值1216至移位器1952。最終移位值1216可對應於相移量且可指示哪一聲道(用於每一訊框)為參考聲道及哪一聲道為目標聲道。舉例而言,移位器1904(例如,因果移位器)可經組態以基於最終移位值1216之目標聲道指示符判定經解碼時域左聲道1962係為目標聲道抑或為參考聲道。類似地,移位器1904可經組態以基於最終移位值1216之目標聲道指示符判定經解碼時域右聲道1964係為目標聲道抑或為參考聲道。為易於說明,經解碼時域右聲道1964經描述為目標聲道。然而,應理解在其他實施中(或對於其他訊框),經解碼時域左聲道1962可為目標聲道且下文所描述之移位操作可對經解碼時域左聲道1962執行。
移位器1952可基於最終移位值1216對經解碼時域右聲道1964執行時域移位操作以產生經調整解碼時域目標聲道1968。時域移位操作可包括非因果移位或因果移位。根據一個實施,經調整解碼時域目標聲道1968可對應於圖12之第二輸出信號1228。移位器1952可基於與最終移位值1216相關聯之目標聲道指示符略過對經解碼時域左聲道1962之移位操作。經解碼時域參考聲道1962可對應於圖12之第一輸出信號1226。
本文中所描述之每一解碼器118、1218及每一解碼系統1900、1950可結合本文中所描述之每一編碼器114、1214及每一編碼系統而使用。作為非限制性實例,圖12之解碼器1218可接收來自圖1之編碼器114的位元 串流。為回應接收到位元串流,解碼器1218可在頻域中對目標聲道執行相位旋轉操作以撤銷在編碼器114處在時域中執行的時間移位操作。作為另一非限制性實例,圖1之解碼器118可接收來自圖12之編碼器1214的位元串流。為回應接收到位元串流,解碼器118可在頻域中對目標聲道執行時間移位操作以撤銷在編碼器1214處在頻域中執行的相位旋轉操作。
參看圖20,展示通信之第一方法2000及通信之第二方法2020。方法2000、2020可藉由圖1之第二器件106、圖12之第二器件1206、圖19之第一解碼器系統1900、圖19之第二解碼器系統1950或其組合執行。
第一方法2000包括在2002處在第一器件處接收來自第二器件之經編碼位元串流。經編碼位元串流可包括指示在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道之間的移位量之失配值。移位量可對應於時間性移位。舉例而言,參看圖19,解碼器1902可接收經編碼位元串流1901。經編碼位元串流1901可包括指示參考聲道與目標聲道之間的移位量之失配值(例如,最終移位值1216)。移位量可對應於時間性移位。
第一方法2000亦可包括在2004處解碼經編碼位元串流以產生經解碼頻域左聲道及經解碼頻域右聲道。舉例而言,參看圖19,解碼器1902可解碼經編碼位元串流1901以產生經解碼頻域左聲道1910及經解碼頻域右聲道1912。
方法2000亦可包括在2006處基於與失配值相關聯之目標聲道指示符,將經解碼頻域左聲道或經解碼頻域右聲道中之一者映射為經解碼頻域目標聲道及將另一者映射為經解碼頻域參考聲道。舉例而言,參看圖19,移位器1904將經解碼頻域左聲道1910映射至經解碼頻域參考聲道及將經解碼頻域右聲道1912映射至經解碼頻域目標聲道。應理解在其他實施中 或對於其他訊框,移位器1904可將經解碼頻域左聲道1910映射至經解碼頻域目標聲道及將經解碼頻域右聲道1912映射至經解碼頻域參考聲道。
第一方法2000亦可包括在2008處基於失配值對經解碼頻域目標聲道執行頻域因果移位操作以產生經調整解碼頻域目標聲道。舉例而言,參看圖19,移位器1904可基於最終移位值1216對經解碼頻域右聲道1912(例如,經解碼頻域目標聲道)執行頻域因果移位操作以產生經調整解碼頻域目標聲道1914。
第一方法2000亦可包括在2010處對經解碼頻域參考聲道執行第一逆變換操作以產生經解碼時域參考聲道。舉例而言,參看圖19,逆變換電路1906可對經解碼頻域左聲道1910執行第一逆變換操作以產生經解碼時域參考聲道1916。
第一方法2000亦可包括在2012處對經調整解碼頻域目標聲道執行第二逆變換操作以產生經調整解碼時域目標聲道。舉例而言,參看圖19,逆變換電路1908可對經調整解碼頻域目標聲道1914執行第二逆變換操作以產生經調整解碼時域目標聲道1918。
第二方法2020包括在2022處接收來自第二器件之經編碼位元串流。經編碼位元串流可包括時間性失配值及立體聲參數。時間性失配值及立體聲參數係基於在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道而判定。舉例而言,參看圖19,解碼器1902可接收經編碼位元串流1901。經編碼位元串流1901可包括時間性失配值、失配值(例如,最終移位值1216)及立體聲參數1262(例如,IPD及ILD)。
第二方法2020亦可包括在2024處解碼經編碼位元串流以產生第一頻域輸出信號及第二頻域輸出信號。舉例而言,參看圖19,解碼器1902可 解碼經編碼位元串流1901以產生經解碼頻域左聲道1910及經解碼頻域右聲道1912。
第二方法2020亦可包括在2026處對第一頻域輸出信號執行第一逆變換操作以產生第一時域信號。舉例而言,參看圖19,逆變換電路1906可對經解碼頻域左聲道1910執行第一逆變換操作以產生經解碼時域左聲道1962。
第二方法2020亦可包括在2028處對第二頻域輸出信號執行第二逆變換操作以產生第二時域信號。舉例而言,參看圖19,逆變換電路1908可對經解碼頻域右聲道1912執行第二逆變換操作以產生經解碼時域右聲道1964。
第二方法2020亦可包括在2030處基於時間性失配值,將第一時域信號或第二時域信號中之一者映射為經解碼目標聲道及將另一者映射為經解碼參考聲道。舉例而言,參看圖19,移位器1952將經解碼時域左聲道1962映射為經解碼時域參考聲道且將經解碼時域右聲道1964映射為經解碼時域頻道。應理解在其他實施中或對於其他訊框,移位器1904可將經解碼時域左聲道1962映射至經解碼時域目標聲道及將經解碼時域右聲道1964映射至經解碼時域參考聲道。
第二方法2020亦可包括在2032處基於時間性失配值對經解碼目標聲道執行因果時域移位操作以產生經調整解碼目標聲道。對經解碼目標聲道執行之因果時域移位操作可基於時間性失配值之絕對值。舉例而言,參看圖19,移位器1952可基於最終移位值1216對經解碼時域右聲道1964執行時域移位操作以產生經調整解碼時域目標聲道1968。時域移位操作可包括非因果移位或因果移位。
第二方法2020亦可包括在2032處輸出第一輸出信號及第二輸出信號。第一輸出信號可基於經解碼參考聲道且第二輸出信號可基於經調整目標聲道。舉例而言,參看圖12,第二器件可輸出第一輸出信號1226及第二輸出信號1228。
根據第二方法2020,可在第二器件(例如,編碼器側器件)處使用編碼器側開窗方案判定時間性失配值及立體聲參數。編碼器側開窗方案可使用具有第一重疊大小之第一窗,且在解碼器1218處解碼器側開窗方案可使用具有第二重疊大小之第二窗。第一重疊大小不同於第二重疊大小。舉例而言,第二重疊大小小於第一重疊大小。編碼器側開窗方案之第一窗具有第一補零量,且解碼器側開窗方案之第二窗具有第二補零量。第一補零量不同於第二補零量。舉例而言,第二補零量小於第一補零量。
根據一些實施,第二方法2020亦包括解碼經編碼位元串流以產生經解碼中間信號及對經解碼中間信號執行變換操作以產生頻域解碼中間信號。第二方法2020亦可包括對頻域解碼中間信號執行升混操作以產生第一頻域輸出信號及第二頻域輸出信號。立體聲參數在升混操作期間經應用於頻域解碼中間信號。立體聲參數可包括在第二器件處基於參考聲道及目標聲道估計的ILD值之集合及IPD值之集合。ILD值之集合及IPD值之集合經傳輸至解碼器側接收器。
參看圖21,描繪了器件(例如,無線通信器件)之特定說明性實例的方塊圖,且通常將該器件指定為2100。在各種實施例中,器件2100可具有比圖21中所說明的更少或更多之組件。在說明性實施例中,器件2100可對應於圖1之第一器件104、圖1之第二器件106、圖12之第一器件1204、圖12之第二器件1206或其組合。在說明性實施例中,器件2100可執行參 考圖1至圖20之系統及方法所描述之一或多個操作。
在一特定實施例中,器件2100包括處理器2106(例如,中央處理單元(CPU))。器件2100可包括一或多個額外處理器2110(例如,一或多個數位信號處理器(DSP))。處理器2110可包括媒體(例如,話音及音樂)編碼器解碼器(編碼解碼器)2108及回音消除器2112。媒體編碼解碼器2108可包括解碼器118、編碼器114、解碼器1218、編碼器1214或其組合。編碼器114可包括時間性等化器108。
器件2100可包括記憶體153及編解碼器2134。儘管媒體編解碼器2108經說明為處理器2110之組件(例如,專用電路及/或可執行程式碼),但在其他實施例中媒體編解碼器2108之一或多個組件(諸如解碼器118、編碼器114、解碼器1218、編碼器1214或其組合)可包括於處理器2106、編解碼器2134另一處理組件或其組合中。
器件2100可包括耦接至天線2142之傳輸器110。器件2100可包括耦接至顯示控制器2126之顯示器2128。可將一或多個揚聲器2148耦接至編解碼器2134。一或多個麥克風2146可經由一或多個輸入介面112耦接至編解碼器2134。在特定實施中,揚聲器2148可包括圖1之第一揚聲器142、第二揚聲器144,或其組合。在一特定實施中,麥克風2146可包括圖1之第一麥克風146、第二麥克風148、圖12之第一麥克風1246、圖12之第二麥克風1248或其組合。編解碼器2134可包括數位至類比轉換器(DAC)2102及類比至數位轉換器(ADC)2104。
記憶體153可包括可由處理器2106、處理器2110、編解碼器2134、器件2100之另一處理單元或其組合執行,以執行參看圖1至圖20描述之一或多個操作的指令2160。記憶體153可儲存分析資料191。
器件2100之一或多個組件可經由專用硬體(例如,電路)、藉由執行一或多個任務之處理器執行指令或其組合來實施。作為實例,記憶體153或處理器2106、處理器2110及/或編解碼器2134之一或多個組件可為記憶體器件,諸如隨機存取記憶體(RAM)、磁阻隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦除可程式化唯讀記憶體(EPROM)、電可擦除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可卸除式磁碟或光碟唯讀記憶體(CD-ROM)。記憶體器件可包括在由電腦(例如,編解碼器2134中之處理器、處理器2106及/或處理器2110)執行時可使得電腦執行參看圖1至圖20描述之一或多個操作的指令(例如,指令2160)。作為實例,記憶體153或處理器2106、處理器2110及/或編解碼器2134中之一或多個組件可為包括指令(例如,指令2160)之非暫時性電腦可讀媒體,當由電腦(例如,編解碼器2134中之處理器、處理器2106及/或處理器2110)執行時,該等指令使得電腦執行參考圖1至圖20所描述之一或多個操作。
在特定實施例中,器件2100可包括於系統級封裝或系統單晶片器件(例如,行動台數據機(MSM))2122中。在特定實施例中,處理器2106、處理器2110、顯示控制器2126、記憶體153、編解碼器2134及傳輸器110包括於系統級封裝或系統單晶片器件2122中。在特定實施例中,諸如觸控螢幕及/或小鍵盤之輸入器件2130及電源供應器2144耦接至系統單晶片器件2122。此外,在特定實施例中,如圖21中所說明,顯示器2128、輸入器件2130、揚聲器2148、麥克風2146、天線2142及電源供應器2144在系統單晶片器件2122的外部。然而,顯示器2128、輸入器件2130、揚聲器2148、麥克風2146、天線2142及電源供應器2144中之每一者可耦接至 系統單晶片器件2122的組件,諸如介面或控制器。
器件2100可包括:無線電話、行動通信器件、行動電話、智慧型電話、蜂巢式電話、膝上型電腦、桌上型電腦、電腦、平板電腦、機上盒、個人數位助理(PDA)、顯示器件、電視、遊戲控制台、音樂播放器、收音機、視訊播放器、娛樂單元、通信器件、固定位置資料單元、個人媒體播放器、數位視訊播放器、數位視訊光碟(DVD)播放器、調諧器、攝影機、導航器件、解碼器系統、編碼器系統或其任何組合。
結合所揭示之實施,一種裝置包括用於接收來自第二器件之經編碼位元串流的構件。經編碼位元串流包括時間性失配值及立體聲參數。時間性失配值及立體聲參數係基於在第二器件處捕捉之參考聲道及在第二器件處捕捉之目標聲道而判定。舉例而言,用於接收之構件可包括圖1之解碼器118、圖12之解碼器1218、圖19之解碼器1902、一或多個其他器件、電路或模組。
裝置亦包括用於解碼經編碼位元串流以產生第一頻域輸出信號及第二頻域輸出信號的構件。舉例而言,用於解碼之構件可包括圖1之解碼器118、圖12之解碼器1218、圖19之解碼器1902、圖21之編解碼器2134、圖21之處理器2106、圖21之處理器2110、一或多個其他器件、電路或模組。
裝置亦包括用於對第一頻域輸出信號執行第一逆變換操作以產生第一時域信號的構件。舉例而言,用於執行之構件可包括圖1之解碼器118、圖12之解碼器1218、圖19之逆變換單元1906、圖21之編解碼器2134、圖21之處理器2106、圖21之處理器2110、一或多個其他器件、電路或模組。
裝置亦包括用於對第二頻域輸出信號執行第二逆變換操作以產生第二時域信號的構件。舉例而言,用於執行之構件可包括圖1之解碼器118、圖12之解碼器1218、圖19之逆變換單元1908、圖21之編解碼器2134、圖21之處理器2106、圖21之處理器2110、一或多個其他器件、電路或模組。
裝置亦包括用於將第一時域信號或第二時域信號中之一者映射為經解碼目標聲道的構件及用於將第一時域信號或第二時域信號中之另一者映射為經解碼參考聲道的構件。舉例而言,用於映射之構件可包括圖1之解碼器118、圖12之解碼器1218、圖19之移位器1952、圖21之編解碼器2134、圖21之處理器2106、圖21之處理器2110、一或多個其他器件、電路或模組。
裝置亦包括用於基於時間性失配值對經解碼目標聲道執行因果時域移位操作以產生經調整解碼目標聲道的構件。舉例而言,用於執行之構件可包括圖1之解碼器118、圖12之解碼器1218、圖19之移位器1952、圖21之編解碼器2134、圖21之處理器2106、圖21之處理器2110、一或多個其他器件、電路或模組。
裝置亦包括用於輸出第一輸出信號及第二輸出信號的構件。第一輸出信號係基於經解碼參考聲道且第二輸出信號係基於經調整解碼目標聲道。舉例而言,用於輸出之構件可包括圖1之解碼器118、圖12之解碼器1218、圖21之編解碼器2134、一或多個其他器件、電路或模組。
參考圖22,描繪基地台2200之特定說明性實例之方塊圖。在各種實施中,基地台2200可相比圖22中所說明的具有較多組件或較少組件。在說明性實例中,基地台2200可包括圖1之第一器件104、第二器件106、圖 12之第一器件1204、圖12之第二器件1206,或其組合。在說明性實例中,基地台2200可根據本文所描述之方法操作。
基地台2200可為無線通信系統之部分。無線通信系統可包括多個基地台及多個無線器件。無線通信系統可為長期演進(LTE)系統、分碼多重存取(CDMA)系統、全球行動通信系統(GSM)系統、無線區域網路(WLAN)系統,或某其他無線系統。CDMA系統可實施寬頻CDMA(WCDMA)、CDMA 1X、演進資料最佳化(EVDO)、分時同步CDMA(TD-SCDMA),或某其他版本之CDMA。
無線器件亦可被稱作使用者設備(UE)、行動台、終端機、存取終端機、用戶單元、工作台等。無線器件可包括蜂巢式電話、智慧型電話、平板電腦、無線數據機、個人數位助理(PDA)、手持型器件、膝上型電腦、智慧筆記型電腦、迷你筆記型電腦、平板電腦、無接線電話、無線區域迴路(WLL)站、藍芽器件等。無線器件可包括或對應於圖21之器件2100。
各種功能可藉由基地台2200之一或多個組件(及/或在未圖示之其他組件中)執行,諸如發送及接收訊息及資料(例如,音訊資料)。在特定實例中,基地台2200包括處理器2206(例如,CPU)。基地台2200可包括轉碼器2210。轉碼器2210可包括音訊編解碼器2208(例如,話音及音樂CODEC)。舉例而言,轉碼器2210可包括經組態以執行音訊編解碼器2208之操作的一或多個組件(例如,電路)。作為另一實例,轉碼器2210經組態以執行一或多個電腦可讀指令以執行音訊編解碼器2208之操作。儘管音訊編解碼器2208說明為轉碼器2210之組件,但在其他實例中,音訊編解碼器2208之一或多個組件可包括於處理器2206、另一處理組件,或其組合中。舉例而言,解碼器1218(例如,聲碼器解碼器)可包括於接收器 資料處理器2264中。作為另一實例,編碼器1214(例如,聲碼器編碼器)可包括於傳輸資料處理器2282中。
轉碼器2210可起到在兩個或多於兩個網路之間轉碼訊息及資料的作用。轉碼器2210經組態以將訊息及音訊資料自第一格式(例如,數位格式)轉換成第二格式。舉例而言,解碼器1218可解碼具有第一格式之經編碼信號,且編碼器1214可將經解碼信號編碼成具有第二格式之經編碼信號。另外或替代地,轉碼器2210經組態以執行資料速率調適。舉例而言,轉碼器2210可在不改變音訊資料之格式的情況下降頻轉換資料速率或升頻轉換資料速率。舉例而言,轉碼器2210可將64千位元/s信號降頻轉換成16千位元/s信號。音訊編解碼器2208可包括編碼器1214及解碼器1218。
基地台2200可包括記憶體2232。諸如電腦可讀儲存器件之記憶體2232可包括指令。該等指令可包括可由處理器2206、轉碼器2210或其組合執行以執行本文所描述之方法的一或多個指令。基地台2200可包括耦接至天線陣列之多個傳輸器及接收器(例如,收發器),諸如第一收發器2252及第二收發器2254。天線陣列可包括第一天線2242及第二天線2244。天線陣列經組態以與一或多個無線器件(諸如圖21之器件2100)無線地通信。舉例而言,第二天線2244可接收來自無線器件之資料串流2214(例如,位元串流)。資料串流2214可包括訊息、資料(例如,經編碼話音資料),或其組合。
基地台2200可包括網路連接2260,諸如空載傳輸連接。網路連接2260經組態以與核心網路或無線通信網路之一或多個基地台通信。舉例而言,基地台2200可經由網路連接2260接收來自核心網路之第二資料串 流(例如,訊息或音訊資料)。基地台2200可處理第二資料串流以產生訊息或音訊資料,且經由天線陣列之一或多個天線將訊息或音訊資料提供至一或多個無線器件,或經由網路連接2260將其提供至另一基地台。在特定實施中,網路連接2260可為廣域網路(WAN)連接,如說明性非限制性實例。在一些實施中,核心網路可包括或對應於公眾交換電話網路(PSTN)、封包基幹網路或兩者。
基地台2200可包括經耦接至網路連接2260及處理器2206之媒體閘道器2270。媒體閘道器2270經組態以在不同電信技術之媒體串流之間轉換。舉例而言,媒體閘道器2270可在不同傳輸協定、不同寫碼方案或兩者之間轉換。舉例而言,媒體閘道器2270可自PCM信號轉換成即時輸送協定(RTP)信號,如說明性非限制性實例。媒體閘道器2270可在封包切換網路(例如,網際網路通訊協定語音(VoIP)網路、IP多媒體子系統(IMS)、第四代(4G)無線網路(諸如LTE、WiMax及UMB)等)、電路切換網路(例如,PSTN)及混合網路(例如,第二代(2G)無線網路(諸如GSM、GPRS及EDGE)、第三代(3G)無線網路(諸如WCDMA、EV-DO及HSPA)等)之間轉換資料。
另外,媒體閘道器2270可包括諸如轉碼器2210之轉碼器,且經組態以在編碼解碼器不相容時轉碼資料。舉例而言,媒體閘道器2270可在適應性多重速率(AMR)編解碼器與G.711編解碼器之間進行轉碼,作為說明性非限制性實例。媒體閘道器2270可包括路由器及複數個實體介面。在一些實施中,媒體閘道器2270亦可包括控制器(未展示)。在一特定實施中,媒體閘道器控制器可在媒體閘道器2270外部、在基地台2200外部或在兩者外部。媒體閘道器控制器可控制並協調多個媒體閘道器之操作。媒 體閘道器2270可自媒體閘道器控制器接收控制信號,且可起到在不同傳輸技術之間橋接器的作用,且可添加對最終使用者能力及連接之服務。
基地台2200可包括耦接至收發器2252、收發器2254、接收器資料處理器2264及處理器2206之解調器2262,且接收器資料處理器2264可耦接至處理器2206。解調器2262經組態以解調自收發器2252、2254所接收之經調變信號,且將經解調資料提供至接收器資料處理器2264。接收器資料處理器2264經組態以自經解調資料提取訊息或音訊資料,且將訊息或音訊資料發送至處理器2206。
基地台2200可包括傳輸資料處理器2282及傳輸多輸入多輸出(MIMO)處理器2284。可將傳輸資料處理器2282耦接至處理器2206及傳輸MIMO處理器2284。傳輸MIMO處理器2284可耦接至收發器2252、2254及處理器2206。在一些實施中,可將傳輸MIMO處理器2284耦接至媒體閘道器2270。作為說明性非限制性實例,傳輸資料處理器2282經組態以自處理器2206接收訊息或音訊資料,且基於諸如CDMA或正交分頻多工(OFDM)之寫碼方案寫碼該等訊息或該音訊資料。傳輸資料處理器2282可將經寫碼資料提供至傳輸MIMO處理器2284。
可使用CDMA或OFDM技術將經寫碼資料與諸如導頻資料之其他資料多工,以產生經多工資料。經多工資料接著可藉由傳輸資料處理器2282基於特定調變方案(例如,二進位相移鍵控(「BPSK」)、正交相移鍵控(「QSPK」)、M-元相移鍵控(「M-PSK」)、M-元正交振幅調變(「M-QAM」)等)調變(亦即,符號映射)以產生調變符號。在特定實施中,可使用不同調變方案調變經寫碼資料及其他資料。針對每一資料串流之資料速率、寫碼及調變可由處理器2206執行之指令判定。
傳輸MIMO處理器2284經組態以自傳輸資料處理器2282接收調變符號,且可進一步處理調變符號,且可對資料執行波束成形。舉例而言,傳輸MIMO處理器2284可將波束成形權重應用於調變符號。波束成形權重可對應於天線陣列之一或多個天線(自該等天線傳輸調變符號)。
在操作期間,基地台2200之第二天線2244可接收資料串流2214。第二收發器2254可自第二天線2244接收資料串流2214,且可向解調器2262提供資料串流2214。解調器2262可解調資料串流2214之經調變信號,且將經解調資料提供至接收器資料處理器2264。接收器資料處理器2264可自經解調資料提取音訊資料且將所提取音訊資料提供至處理器2206。
處理器2206可將音訊資料提供至轉碼器2210以用於轉碼。轉碼器2210之解碼器1218可將音訊資料自第一格式解碼成經解碼音訊資料,且編碼器1214可將經解碼音訊資料編碼成第二格式。在一些實施中,編碼器1214可使用比自無線器件所接收之資料速率更高資料速率(例如,升頻轉換)或更低資料速率(例如,降頻轉換)對音訊資料進行編碼。在其他實施中,音訊資料可未經轉碼。儘管轉碼(例如,解碼及編碼)經說明為藉由轉碼器2210執行,但轉碼操作(例如,解碼及編碼)可藉由基地台2200之多個組件執行。舉例而言,解碼可由接收器資料處理器2264執行,且編碼可由傳輸資料處理器2282執行。在其他實施中,處理器2206可將音訊資料提供至媒體閘道器2270用於轉換成另一傳輸協定、寫碼方案或兩者。媒體閘道器2270可經由網路連接2260將經轉換資料提供至另一基地台或核心網路。
可經由處理器2206將在編碼器1214處產生之經編碼音訊資料(諸如經轉碼資料)提供至傳輸資料處理器2282或網路連接2260。可將來自轉碼器 2210之經轉碼音訊資料提供至傳輸資料處理器2282,用於根據諸如OFDM之調變方案寫碼,以產生調變符號。傳輸資料處理器2282可將調變符號提供至傳輸MIMO處理器2284以供進一步處理及波束成形。傳輸MIMO處理器2284可應用波束成形權重,且可經由第一收發器2252將調變符號提供至天線陣列之一或多個天線,諸如第一天線2242。因此,基地台2200可將對應於自無線器件所接收之資料串流2214的經轉碼資料串流2216提供至另一無線器件。經轉碼資料串流2216可具有與資料串流2214相比不同之編碼格式、資料速率或兩者。在其他實施中,可將經轉碼資料串流2216提供至網路連接2260,以供傳輸至另一基地台或核心網路。
在特定實施中,本文所揭示之系統及器件之一或多個組件可整合至解碼系統或裝置(例如,電子裝置、編解碼器或其中之處理器)中、整合至編碼系統或裝置中或整合至兩者中。在其他實施中,本文所揭示之系統及器件之一或多個組件可整合至以下各者中:無線電話、平板電腦、桌上型電腦、膝上型電腦、機上盒、音樂播放器、視訊播放器、娛樂單元、電視、遊戲控制台、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元、個人媒體播放器或另一類型之器件。
應注意,藉由本文所揭示之系統及器件之一或多個組件執行的各種功能經描述為藉由某些組件或模組執行。組件及模組之此劃分僅係為了說明。在替代實施中,由特定組件或模組執行之功能可劃分於多個組件或模組之中。此外,在替代實施中,兩個或大於兩個組件或模組可整合至單個組件或模組中。每一組件或模組可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、DSP、控制器等)、軟體(例 如,可由處理器執行之指令)或其任何組合來實施。
熟習此項技術者將進一步瞭解,結合本文所揭示之實施例所描述之各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由諸如硬體處理器之處理器件執行的電腦軟體或兩者之組合。上文大體在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此功能性經實施為硬體或是軟體取決於特定應用及強加於整個系統之設計約束而定。對於每一特定應用而言,熟習此項技術者可以變化之方式實施所描述之功能性,但不應將此等實施決策解釋為導致脫離本發明之範疇。
結合本文中所揭示之實施例而描述之方法或演算法的步驟可直接體現於硬體中、由處理器執行之軟體模組中,或兩者之組合中。軟體模組可駐留於記憶體器件中,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦除可程式化唯讀記憶體(EPROM)、電可擦除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟或光碟唯讀記憶體(CD-ROM)。例例示性記憶體器件耦接至處理器,以使得處理器可自記憶體器件讀取資訊及將資訊寫入至記憶體器件。在替代例中,記憶體器件可與處理器成一體式。處理器及儲存媒體可駐留於特殊應用積體電路(ASIC)中。ASIC可駐留於計算器件或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐留於計算器件或使用者終端機中。
提供對所揭示實施之先前描述,以使得熟習此項技術者能夠製作或使用所揭示之實施。熟習此項技術者將容易地顯而易見對此等實例之各種修改且在不脫離本發明之範疇的情況下本文中所定義之原理可應用於其他 實施。因此,本發明並非意欲限於本文中所展示之實施,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
1216‧‧‧最終移位值
1900‧‧‧第一解碼器系統
1901‧‧‧經編碼位元串流
1902‧‧‧解碼器
1904‧‧‧移位器
1906‧‧‧逆變換電路
1908‧‧‧逆變換電路
1910‧‧‧經解碼頻域左聲道
1912‧‧‧經解碼頻域右聲道
1914‧‧‧經調整解碼頻域目標聲道
1916‧‧‧經解碼時域左聲道
1918‧‧‧經調整解碼時域目標聲道
1950‧‧‧第二解碼器系統
1952‧‧‧移位器
1962‧‧‧經解碼時域左聲道
1964‧‧‧經解碼時域右聲道
1968‧‧‧經調整解碼時域目標聲道

Claims (30)

  1. 一種多音訊信號之處理器件,其包含:一接收器,其經組態以接收來自一第二器件之一經編碼位元串流,該經編碼位元串流包括一時間性失配值及立體聲參數,其中該時間性失配值及該等立體聲參數係基於在該第二器件處捕捉的一參考聲道及在該第二器件處捕捉的一目標聲道而判定;一解碼器,其經組態以:解碼該經編碼位元串流以產生一第一頻域輸出信號及一第二頻域輸出信號;對該第一頻域輸出信號執行一第一逆變換操作以產生一第一時域信號;對該第二頻域輸出信號執行一第二逆變換操作以產生一第二時域信號;基於該時間性失配值,映射該第一時域信號或該第二時域信號中之一者為一經解碼目標聲道;映射該第一時域信號或該第二時域信號中之另一者為一經解碼參考聲道;及基於該時間性失配值對該解碼目標聲道執行一因果時域移位操作以產生一經調整解碼目標聲道;及一輸出器件,其經組態以輸出一第一輸出信號及一第二輸出信號,該第一輸出信號係基於該經解碼參考聲道,且該第二輸出信號係基於該經調整解碼目標聲道。
  2. 如請求項1之器件,其中在該第二器件處,該時間性失配值及該等立體聲參數性使用一編碼器側開窗方案而判定。
  3. 如請求項2之器件,其中該編碼器側開窗方案使用具有一第一重疊大小之第一窗,且其中在該解碼器處之一解碼器側開窗方案使用具有一第二重疊大小之第二窗。
  4. 如請求項3之器件,其中該第一重疊大小不同於該第二重疊大小。
  5. 如請求項4之器件,其中該第二重疊大小小於該第一重疊大小。
  6. 如請求項2之器件,其中該編碼器側開窗方案使用具有一第一補零量之第一窗,且其中在該解碼器處之一解碼器側開窗方案使用具有一第二補零量之第二窗。
  7. 如請求項6之器件,其中該第一補零量不同於該第二補零量。
  8. 如請求項7之器件,其中該第二補零量小於該第一補零量。
  9. 如請求項1之器件,其中該等立體聲參數包括基於該第二器件處之該參考聲道及該目標聲道估計的聲道間位準差(ILD)值之一集合及聲道間相位差(IPD)值之一集合。
  10. 如請求項9之器件,其中ILD值之該集合及IPD值之該集合經傳輸至該接收器。
  11. 如請求項1之器件,其中對該解碼目標聲道執行的該因果時域移位操作係基於該時間性失配值之一絕對值。
  12. 如請求項1之器件,其進一步包含:一立體聲解碼器,其經組態以解碼該編碼位元串流以產生一解碼中間信號;一變換單元,其經組態以對該解碼中間信號執行一變換操作以產生一頻域解碼中間信號;及一升混器,其經組態以對該頻域解碼中間信號執行一升混操作以產生該第一頻域輸出信號及該第二頻域輸出信號,該等立體聲參數在該升混操作期間應用於該頻域解碼中間信號。
  13. 如請求項1之器件,其中該接收器、該解碼器及該輸出器件整合至一行動器件中。
  14. 如請求項1之器件,其中該接收器、該解碼器及該輸出器件整合至一基地台中。
  15. 一種多音訊信號之處理方法,其包含: 在一器件之一接收器處接收來自一第二器件之一經編碼位元串流,該經編碼位元串流包括一時間性失配值及立體聲參數,其中該時間性失配值及該等立體聲參數係基於在該第二器件處捕捉的一參考聲道及在該第二器件處捕捉的一目標聲道而判定;在該器件之一解碼器處解碼該經編碼位元串流以產生一第一頻域輸出信號及一第二頻域輸出信號;對該第一頻域輸出信號執行一第一逆變換操作以產生一第一時域信號;對該第二頻域輸出信號執行一第二逆變換操作以產生一第二時域信號;基於該時間性失配值,將該第一時域信號或該第二時域信號中之一者映射為一經解碼目標聲道;將該第一時域信號或該第二時域信號中之另一者映射為一經解碼參考聲道;基於該時間性失配值對該經解碼目標聲道執行一因果時域移位操作以產生一經調整解碼目標聲道;及輸出一第一輸出信號及一第二輸出信號,該第一輸出信號係基於該經解碼參考聲道且該第二輸出信號係基於該經調整解碼目標聲道。
  16. 如請求項15之方法,其中在該第二器件處,該時間性失配值及該等立體聲參數係使用一編碼器側開窗方案而判定。
  17. 如請求項16之方法,其中該編碼器側開窗方案使用具有一第一重疊 大小之第一窗,且其中在該解碼器處之一解碼器側開窗方案使用具有一第二重疊大小之第二窗。
  18. 如請求項17之方法,其中該第一重疊大小不同於該第二重疊大小。
  19. 如請求項18之方法,其中該第二重疊大小小於該第一重疊大小。
  20. 如請求項16之方法,其中該編碼器側開窗方案使用具有一第一補零量之第一窗,且其中在該解碼器處之一解碼器側開窗方案使用具有一第二補零量之第二窗。
  21. 如請求項15之方法,其進一步包含:解碼該經編碼位元串流以產生一經解碼中間信號;對該經解碼中間信號執行一變換操作以產生一頻域解碼中間信號;及對該頻域解碼中間信號執行一升混操作以產生該第一頻域輸出信號及該第二頻域輸出信號,該等立體聲參數在該升混操作期間應用於該頻域解碼中間信號。
  22. 如請求項15之方法,其中對該經解碼目標聲道之該因果時域移位操作係在一行動器件處執行。
  23. 如請求項15之方法,其中對該解碼目標聲道之該因果時域移位操作 係在一基地台處執行。
  24. 一種包含指令之非暫時性電腦可讀媒體,該等指令在由一解碼器內之一處理器執行時使得該處理器執行包含以下各者的操作:解碼自一第二器件接收之一經編碼位元串流以產生一第一頻域輸出信號及一第二頻域輸出信號,該經編碼位元串流包括一時間性失配值及立體聲參數,其中該時間性失配值及該等立體聲參數係基於在該第二器件處捕捉之一參考聲道及在該第二器件處捕捉之一目標聲道而判定;對該第一頻域輸出信號執行一第一逆變換操作以產生一第一時域信號;對該第二頻域輸出信號執行一第二逆變換操作以產生一第二時域信號;基於該時間性失配值,將該第一時域信號或該第二時域信號中之一者映射為一經解碼目標聲道;將該第一時域信號或該第二時域信號中之另一者映射為一經解碼參考聲道;基於該時間性失配值對該經解碼目標聲道執行一因果時域移位操作以產生一經調整解碼目標聲道;及輸出一第一輸出信號及一第二輸出信號,該第一輸出信號係基於該經解碼參考聲道且該第二輸出信號係基於該經調整解碼目標聲道。
  25. 如請求項24之非暫時性電腦可讀媒體,其中在該第二器件處,該時間性失配值及該等立體聲參數係使用一編碼器側開窗方案來判定。
  26. 如請求項25之非暫時性電腦可讀媒體,其中該編碼器側開窗方案使用具有一第一重疊大小之第一窗,且其中在該解碼器處之一解碼器側開窗方案使用具有一第二重疊大小之第二窗。
  27. 如請求項26之非暫時性電腦可讀媒體,其中該第一重疊大小不同於該第二重疊大小。
  28. 一種多音訊信號之處理裝置,其包含:用於接收來自一第二器件之一經編碼位元串流的構件,該經編碼位元串流包括一時間性失配值及立體聲參數,其中該時間性失配值及該等立體聲參數係基於在該第二器件處捕捉的一參考聲道及在該第二器件處捕捉的一目標聲道而判定;用於解碼該經編碼位元串流以產生一第一頻域輸出信號及一第二頻域輸出信號的構件;用於對該第一頻域輸出信號執行一第一逆變換操作以產生一第一時域信號的構件;用於對該第二頻域輸出信號執行一第二逆變換操作以產生一第二時域信號的構件;用於基於該時間性失配值將該第一時域信號或該第二時域信號中之一者映射為一經解碼目標聲道的構件;用於將該第一時域信號或該第二時域信號中之另一者映射為一經解碼參考聲道的構件; 用於基於該時間性失配值對該經解碼目標聲道執行一因果時域移位操作以產生一經調整解碼目標聲道的構件;及用於輸出一第一輸出信號及一第二輸出信號的構件,該第一輸出信號係基於該經解碼參考聲道且該第二輸出信號係基於該經調整解碼目標聲道。
  29. 如請求項28之裝置,其中用於執行該因果時域移位操作之該構件整合至一行動器件中。
  30. 如請求項28之裝置,其中用於執行該因果時域移位操作之該構件整合至一基地台中。
TW106132827A 2016-10-31 2017-09-25 多音訊信號之處理器件、裝置、非暫時性電腦可讀媒體與方法 TWI806839B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662415369P 2016-10-31 2016-10-31
US62/415,369 2016-10-31
US15/711,538 US10224042B2 (en) 2016-10-31 2017-09-21 Encoding of multiple audio signals
US15/711,538 2017-09-21

Publications (2)

Publication Number Publication Date
TW201818398A TW201818398A (zh) 2018-05-16
TWI806839B true TWI806839B (zh) 2023-07-01

Family

ID=62022507

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106132827A TWI806839B (zh) 2016-10-31 2017-09-25 多音訊信號之處理器件、裝置、非暫時性電腦可讀媒體與方法

Country Status (8)

Country Link
US (2) US10224042B2 (zh)
EP (2) EP3533055A1 (zh)
KR (1) KR102505148B1 (zh)
CN (2) CN116504255A (zh)
BR (1) BR112019007968A2 (zh)
SG (1) SG11201901942TA (zh)
TW (1) TWI806839B (zh)
WO (1) WO2018080683A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102083200B1 (ko) * 2016-01-22 2020-04-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10878879B2 (en) * 2017-06-21 2020-12-29 Mediatek Inc. Refresh control method for memory system to perform refresh action on all memory banks of the memory system within refresh window
US10932122B1 (en) * 2019-06-07 2021-02-23 Sprint Communications Company L.P. User equipment beam effectiveness

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101690270A (zh) * 2006-05-04 2010-03-31 Lg电子株式会社 采用再混音能力增强音频
US20100283639A1 (en) * 2007-12-21 2010-11-11 France Telecom Transform-based coding/decoding, with adaptive windows

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5557647A (en) * 1993-01-06 1996-09-17 Kabushiki Kaisha Toshiba Baseband signal demodulator
US6973184B1 (en) 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
JP3923783B2 (ja) * 2001-11-02 2007-06-06 松下電器産業株式会社 符号化装置及び復号化装置
WO2003090206A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Signal synthesizing
BR0304540A (pt) * 2002-04-22 2004-07-20 Koninkl Philips Electronics Nv Métodos para codificar um sinal de áudio, e para decodificar um sinal de áudio codificado, codificador para codificar um sinal de áudio, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenagem, e, decodificador para decodificar um sinal de áudio codificado
EP1735778A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatuses thereof
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US8483411B2 (en) * 2008-01-01 2013-07-09 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
JP5269914B2 (ja) * 2009-01-22 2013-08-21 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
PL2405425T3 (pl) * 2009-04-08 2014-12-31 Fraunhofer Ges Forschung Urządzenie, sposób i program komputerowy do realizacji upmixu sygnału audio downmixu z użyciem wygładzania wartości faz
EP2476113B1 (en) * 2009-09-11 2014-08-13 Nokia Corporation Method, apparatus and computer program product for audio coding
KR20110049068A (ko) * 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9025660B2 (en) * 2011-03-04 2015-05-05 Vixs Systems, Inc. Video decoder with general video decoding device and methods for use therewith
KR101662681B1 (ko) * 2012-04-05 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법
US9799339B2 (en) * 2012-05-29 2017-10-24 Nokia Technologies Oy Stereo audio signal encoder
US9865269B2 (en) * 2012-07-19 2018-01-09 Nokia Technologies Oy Stereo audio signal encoder
JP6250071B2 (ja) * 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
CN109509478B (zh) * 2013-04-05 2023-09-05 杜比国际公司 音频处理装置
GB2518823A (en) * 2013-09-25 2015-04-08 Sony Corp Data encoding and decoding
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
RU2679254C1 (ru) * 2015-02-26 2019-02-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки аудиосигнала для получения обработанного аудиосигнала с использованием целевой огибающей во временной области
KR102083200B1 (ko) * 2016-01-22 2020-04-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101690270A (zh) * 2006-05-04 2010-03-31 Lg电子株式会社 采用再混音能力增强音频
US20100283639A1 (en) * 2007-12-21 2010-11-11 France Telecom Transform-based coding/decoding, with adaptive windows

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
網路文獻 D. Mauler, et al. A low delay, variable resolution, perfect reconstruction spectral analysis-synthesis system for speech enhancement 2007 15TH EUROPEAN SIGNAL PROCESSING CONFERENCE, IEEE 20150430 https://www.eurasip.org/Proceedings/Eusipco/Eusipco2007/Papers/A2L-D02.pdf *

Also Published As

Publication number Publication date
CN109844858B (zh) 2023-06-02
BR112019007968A2 (pt) 2019-07-09
KR20230035430A (ko) 2023-03-13
US20180122385A1 (en) 2018-05-03
TW201818398A (zh) 2018-05-16
EP3855431A1 (en) 2021-07-28
US10891961B2 (en) 2021-01-12
CN116504255A (zh) 2023-07-28
WO2018080683A1 (en) 2018-05-03
CN109844858A (zh) 2019-06-04
EP3533055A1 (en) 2019-09-04
US10224042B2 (en) 2019-03-05
SG11201901942TA (en) 2019-05-30
US20190147896A1 (en) 2019-05-16
KR20190067825A (ko) 2019-06-17
KR102505148B1 (ko) 2023-02-28

Similar Documents

Publication Publication Date Title
TWI651716B (zh) 通信裝置、方法及設備及非暫時性之電腦可讀儲存裝置
TWI806839B (zh) 多音訊信號之處理器件、裝置、非暫時性電腦可讀媒體與方法
TW201935465A (zh) 編碼多重音訊信號之器件,通信之方法及裝置及電腦可讀儲存器件
TWI791632B (zh) 用於音訊信號之編碼或解碼之器件、方法、電腦可讀儲存器件以及裝置
US10885925B2 (en) High-band residual prediction with time-domain inter-channel bandwidth extension
US10885922B2 (en) Time-domain inter-channel prediction
TW201833904A (zh) 通道間頻寬擴展頻譜映射及調整
KR102709512B1 (ko) 다수의 오디오 신호들의 디코딩