TWI763754B - 通道間相位差參數之修改 - Google Patents

通道間相位差參數之修改

Info

Publication number
TWI763754B
TWI763754B TW106143607A TW106143607A TWI763754B TW I763754 B TWI763754 B TW I763754B TW 106143607 A TW106143607 A TW 106143607A TW 106143607 A TW106143607 A TW 106143607A TW I763754 B TWI763754 B TW I763754B
Authority
TW
Taiwan
Prior art keywords
channel
generate
value
parameter values
ipd
Prior art date
Application number
TW106143607A
Other languages
English (en)
Other versions
TW201832572A (zh
Inventor
凡卡特拉曼 阿堤
文卡塔 薩伯拉曼亞姆 強卓 賽克哈爾 奇比亞姆
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201832572A publication Critical patent/TW201832572A/zh
Application granted granted Critical
Publication of TWI763754B publication Critical patent/TWI763754B/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明提供一種方法,該方法包括在一解碼器處執行基於一失配值而修改通道間相位差(IPD)參數值之至少一部分以產生經修改IPD參數值。該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量。該等經修改IPD參數值在一升混(up-mix)操作期間應用於一經頻域解碼中間通道。

Description

通道間相位差參數之修改
本發明大體上係關於多音訊信號之編碼。
技術之進步已帶來更小且更強大之計算裝置。舉例而言,當前存在多種攜帶型個人計算裝置,包括無線電話(諸如行動電話及智慧型電話)、平板電腦及膝上型電腦,該等攜帶型個人計算裝置係小的輕質的且易於由使用者攜載。此等裝置可經由無線網路傳達語音及資料封包。另外,許多此類裝置併入有額外功能性,諸如數位靜態相機、數位視訊相機、數位記錄器及音訊檔案播放器。又,此類裝置可處理可執行指令,包括軟體應用程式,諸如可用以存取網際網路之網路瀏覽器應用程式。因而,此等裝置可包括顯著的計算能力。
計算裝置可包括或耦接至多個麥克風以接收音訊信號。一般而言,與多個麥克風之第二麥克風相比,聲源更接近於第一麥克風。因此,由於麥克風距聲源之各別距離,自第二麥克風接收之第二音訊信號可相對於自第一麥克風接收之第一音訊信號延遲。在其他實施中,第一音訊信號可相對於第二音訊信號延遲。在立體聲編碼中,來自麥克風之音訊信號可經編碼以產生中間通道信號及一或多個旁通道信號。中間通道信號可對應於第一音訊信號與第二音訊信號之總和。旁通道信號可對應於第一音訊信號與 第二音訊信號之間的差。由於接收第二音訊信號相對於第一音訊信號之延遲,第一音訊信號可不與第二音訊信號對準。第一音訊信號相對於第二音訊信號之未對準可增加兩種音訊信號之間的差值。由於差值之增大加,音訊信號之頻域版本之間的相位差可變得較不相關。
在一特定實施中,一種裝置包括經組態以接收包括一經編碼中間通道及立體聲參數之一經編碼位元串流之一接收器。該等立體聲參數包括通道間相位差(IPD)參數值及一失配值,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量。該裝置亦包括經組態以對該經編碼中間通道進行解碼以產生一經解碼中間通道之一中間通道解碼器。該裝置進一步包括一變換單元,該變換單元經組態以對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道。該裝置亦包括一立體聲參數調整單元,該立體聲參數調整單元經組態以基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值。該裝置亦包括一升混器,該升混器經組態以對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道。該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道。該裝置亦包括一第一逆變換單元,該第一逆變換單元經組態以對頻域左通道執行一第一逆變換操作以產生一時域左通道。該裝置進一步包括一第二逆變換單元,該第二逆變換單元經組態以對該頻域右通道執行一第二逆變換操作以產生一時域右通道。
在另一特定實施中,一種對音訊通道進行解碼之方法包括在一解碼器處接收包括一經編碼中間通道及立體聲參數之一經編碼位元串流。該等立體聲參數包括通道間相位差(IPD)參數值及一失配值,該失配值指示一 編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量。該方法亦包括對該經編碼中間通道進行解碼以產生一經解碼中間通道及對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道。該方法進一步包括基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值。該方法亦包括對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道。該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道。該方法進一步包括對頻域左通道執行一第一逆變換操作以產生一時域左通道及對該頻域右通道執行一第二逆變換操作以產生一時域右通道。
在另一特定實施中,一種非暫時性電腦可讀媒體包括指令,該等指令在由一解碼器內之一處理器執行時使得該處理器執行包括以下各者之操作:對一經編碼中間通道進行解碼以產生一經解碼中間通道。該經編碼中間通道包括於由該解碼器接收之一經編碼位元串流中。該經編碼位元串流進一步包括包括通道間相位差(IPD)參數值及一失配值之立體聲參數,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量。該等操作亦包括對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道。該等操作亦包括基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值。該等操作亦包括對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道。該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道。該等操作亦包括對頻域左通道執行一第一逆變換操作以產生一時域左通道及對該頻域右通道執行一第二逆變換操作以產生一時域右通道。
在另一特定實施中,一種設備包括用於接收包括一經編碼中間通道 及立體聲參數之一經編碼位元串流的構件。該等立體聲參數包括通道間相位差(IPD)參數值及一失配值,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量。該設備亦包括用於對該經編碼中間通道進行解碼以產生一經解碼中間通道之構件及用於對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道之構件。該設備進一步包括用於基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值之構件。該設備亦包括用於對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道之構件。該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道。該設備進一步包括用於對頻域左通道執行一第一逆變換操作以產生一時域左通道之構件及用於對該頻域右通道執行一第二逆變換操作以產生一時域右通道之構件。
在檢閱整個申請案之後,本發明之其他實施、優勢及特徵將變得顯而易見,該整個申請案包括以下章節:圖式簡單說明、實施方式及申請專利範圍。
100:系統
104:第一裝置
106:第二裝置
110:傳輸器
111:立體聲參數調整單元
112:輸入介面
114:編碼器
114A:編碼器
115:接收器
116:失配值
118:解碼器
118A:解碼器
120:網路
126:左通道
128:右通道
130:參考通道
132:目標通道
134:經調整目標通道
142:第一擴音器
144:第二擴音器
146:第一麥克風
148:第二麥克風
152:聲源
153:記憶體
162:立體聲參數
164:通道間相位差(IPD)參數值
165:經修改通道間相位差(IPD)參數值
166:通道間時差(ITD)參數值
202:變換單元
206:立體聲參數估計器
207:降混器
208:旁通道產生器
210:旁通道編碼器
212:中間通道產生器
213:逆變換單元
216:中間通道編碼器
230:旁通道修改器
232:逆變換單元
248:位元串流
252:多工器
254:殘餘寫碼啟用信號
256:經頻域調整目標通道
258:頻域參考通道
262:中間通道
264:旁通道
266:頻域中間通道
268:經修改旁通道
270:頻域旁通道
302:中間通道解碼器
304:旁通道解碼器
306:變換單元
308:變換單元
310:升混器
312:立體聲參數調整單元
314:比較單元
316:修改單元
318:逆變換單元
320:逆變換單元
322:通道間對準單元
340:經編碼中間通道
342:經編碼旁通道
344:經解碼中間通道
346:經解碼旁通道
348:經頻域解碼中間通道
350:經頻域解碼旁通道
352:經修改通道間相位差(IPD)參數值
354:頻域左通道
356:頻域右通道
358:時域左通道
360:時域右通道
400:方法
500:方法
600:裝置
602:數位至類比轉換器(DAC)
604:類比至數位轉換器(ADC)
606:處理器
608:媒體寫碼器解碼器(CODEC)
610:處理器
612:回聲消除器
622:行動台數據機(MSM)/系統單晶片裝置
626:顯示器控制器
628:顯示器
630:輸入裝置
634:寫碼器解碼器(CODEC)
642:天線
644:電源供應器
646:麥克風
648:揚聲器
660:指令
700:基地台
706:處理器
708:音訊寫碼器解碼器(CODEC)
710:轉碼器
714:資料串流
716:經轉碼資料串流
732:記憶體
742:第一天線
744:第二天線
752:第一收發器
754:第二收發器
760:網路連接
762:解調變器
764:接收器資料處理器
770:媒體閘道器
782:傳輸資料處理器
784:傳輸多輸入多輸出(MIMO)處理器
圖1係包括可操作以修改通道間相位差(IPD)參數之編碼器及可操作以修改IPD參數之解碼器之系統之特定說明性實例的方塊圖;圖2係說明圖1之編碼器之一實例的圖式;圖3係說明圖1之解碼器之一實例的圖式;圖4係判定IPD資訊之方法的特定實例;圖5係對位元串流進行解碼之方法的特定實例;圖6係包括可操作以修改IPD參數之編碼器及可操作以修改IPD參數之解碼器之裝置之特定說明性實例的方塊圖;且 圖7係包括可操作以修改IPD參數之編碼器及可操作以修改IPD參數之解碼器之基地台之特定說明性實例的方塊圖。
相關申請案之交叉參考
本申請案主張2017年1月19日申請之標題為「MULTIPLE SIGNAL CODING AND INTER-CHANNEL PARAMETER MODIFICATION」之美國臨時專利申請案第62/448,297號的權益,該美國臨時專利申請案明確地以全文引用之方式併入本文中。
下文參考圖式描述本發明之特定態樣。在本說明書中,共同部件由共同參考編號指示。如本文所使用,各種術語僅僅用於描述特定實施之目的,且並不意欲限制實施。舉例而言,除非上下文以其他方式明確地指示除非上下文另外明確指示,否則單數形式「一」、及「該」意欲同樣包括複數形式。可進一步理解,術語「包含」及「包含著」可與「包括」或「包括著」互換使用。另外,應理解,術語「其中(wherein)」可與「在...之情況下(where)」互換使用。如本文所使用,用以修改諸如結構、組件、操作等之元件之序數術語(例如「第一」、「第二」、「第三」等)本身不指示元件關於另一元件之任何優先權或次序,而是僅將元件與具有相同名稱之另一元件區別開(除非使用序數術語)。如本文所使用,術語「組」指代特定元件中之一或多者,且術語「複數個」指代特定元件中之多者(例如兩者或更多者)。
在本發明中,諸如「判定」、「計算」、「移位」、「調整」等之術語可用以描述如何執行一或多個操作。應注意,此等術語不應被理解為限制性的且其他技術可用以執行類似操作。另外,如本文中所提及,「產生」、 「計算」、「使用」、「選擇」、「存取」與「判定」可互換使用。舉例而言,「產生」、「計算」或「判定」參數(或信號)可指代積極主動地產生、計算或判定參數(或信號),或可指代使用、選擇或存取已諸如由另一組件或裝置產生之參數(或信號)。
揭示了可操作以編碼多音訊信號之系統及裝置。裝置可包括經組態以編碼多重音訊信號之編碼器。可使用多個記錄裝置(例如多個麥克風)同時及時地捕獲多個音訊信號。在一些實例中,可藉由對若干同時或非同時記錄之音訊通道進行多工來合成地(例如人工地)產生多個音訊信號(或多通道音訊)。作為說明性實例,音訊通道之並行記錄或多工可產生2通道組態(亦即,立體聲:左及右)、5.1通道組態(左、右、中央、左環繞、右環繞及低頻重音(low frequency emphasis,LFE)通道)、7.1通道組態、7.1+4通道組態、22.2通道組態或N通道組態。
電話會議室(或遠程呈現室)內之音訊捕獲裝置可包括獲取空間音訊之多個麥克風。空間音訊可包括語音以及經編碼且經傳輸之背景音訊。視如何組態麥克風以及給定來源(例如講話者)位於相對於麥克風及房間大小的位置而定,來自該來源(例如講話者)之話語/音訊可在不同時間到達多個麥克風處。舉例而言,相比於與裝置相關聯之第二麥克風,聲源(例如講話者)可更接近與裝置相關聯之第一麥克風。因此,與第二麥克風相比,自聲源發出之聲音可更早到達第一麥克風。裝置可經由第一麥克風接收第一音訊信號,且可經由第二麥克風接收第二音訊信號。
中側(mid-side,MS)寫碼及參數立體聲(parametric stereo,PS)寫碼為可提供優於雙單通道寫碼技術之經改良效能的立體聲寫碼技術。在雙單通道寫碼中,左(L)通道(或信號)及右(R)通道(或信號)經獨立地寫碼,而 不利用通道間相關。在寫碼之前,藉由將左通道及右通道變換為總和通道及差通道(例如旁通道),MS寫碼減少相關L/R通道對之間的冗餘。總和信號及差信號經波形寫碼或基於MS寫碼中之模型而寫碼。總和信號比側信號耗費相對更多的位元。PS寫碼藉由將L/R信號變換為總和信號及一組側參數來減少每一子帶中之冗餘。旁參數可指示通道間強度差(inter-channel intensity difference,IID)、通道間相位差(IPD)、通道間時差(inter-channel time difference,ITD)、旁或殘餘預測增益等。總和信號為經寫碼之波形且連同旁參數傳輸。在混合型系統中,可在較低頻帶(例如小於2千赫茲(kHz))中對旁通道進行波形寫碼,且可在較高頻帶(例如大於或等於2kHz)中對旁通道進行PS寫碼,其中間通道間相位保存在感知上較不關鍵。在一些實施中,PS寫碼亦可在波形寫碼之前用於較低頻帶中以減少通道間冗餘。
可在頻域或子帶域中完成MS寫碼及PS寫碼。在一些實例中,左通道與右通道可不相關。舉例而言,左通道及右通道可包括不相關之合成信號。當左通道與右通道不相關時,MS寫碼、PS寫碼或兩者之寫碼效率可接近於雙單通道寫碼之寫碼效率。
取決於記錄組態,可在左通道與右通道之間存在時間移位以及其他空間效應(諸如回聲及室內回響)。若並不補償通道之間的時間移位及相位失配,則總和通道及差通道可含有減少與MS或PS技術相關之寫碼增益的可比能量。寫碼增益之減少可基於時間(或相位)移位之量。總和信號與差信號之可比能量可限制通道經時間移位但高度相關之某些訊框中的MS寫碼之使用。在立體聲寫碼中,中間通道(例如總和通道)及旁通道(例如差通道)可基於以下公式而產生: M=(L+R)/2,S=(L-R)/2, 公式1
其中M對應於中間通道,S對應於旁通道,L對應於左通道,且R對應於右通道。
在一些狀況下,中間通道及旁通道可基於以下公式而產生:M=c(L+R),S=c(L-R), 公式2
其中c對應於頻率相關之複合值。基於式1或式2而產生中間通道及旁通道可被稱作「降混」。基於式1或式2而自中間通道及旁通道產生左通道及右通道之相反過程可被稱作「升混」。
在一些狀況下,中間通道可基於其他公式,諸如:M=(L+gDR)/2或 公式3
M=g1L+g2R 公式4
其中g1+g2=1.0,且其中gD係增益參數。在其他實例中,可在頻帶中執行降混,其中中(b)=c1L(b)+c2R(b),其中c1及c2係複數,其中旁(b)=c3L(b)-c4R(b),且其中c3及c4係複數。
用以針對特定訊框在MS寫碼或雙單通道寫碼之間進行選擇的特別途徑可包括:產生中間信號及側信號,計算中間信號及側信號之能量,並基於該能量判定是否執行MS寫碼。舉例而言,可進行MS寫碼以回應側信號與中間信號之能量比小於臨限值之判定。為了說明,若右通道移位了第一時間(例如48kHz下約0.001秒或48個樣本),則中間信號之第一能量(對應於左信號與右信號之總和)可與有聲語音訊框之旁信號的第二能量(對應於左信號與右信號之間的差)相當。當第一能量與第二能量相當時,較高數目之位元可用於對旁通道進行編碼,由此減少相對於雙單通道寫碼之MS寫碼的寫碼效能。當第一能量與第二能量相當時(例如當第一能量與第二 能量之比大於或等於臨限值時),可因此使用雙單通道寫碼。在替代途徑中,可基於左通道與右通道之臨限值及歸一化交叉相關值之比較來在MS寫碼與雙單通道寫碼之間決定何者用於特定訊框。
在一些實例中,編碼器可判定指示第一音訊信號與第二音訊信號之間的時間未對準之量的失配值。如本文所使用,「時間移位值」、「移位值」與「失配值」可互換使用。舉例而言,編碼器可判定指示第一音訊信號相對於第二音訊信號之移位(例如時間失配)的時間移位值。時間失配值可對應於在第一麥克風處第一音訊信號之接收與在第二麥克風處第二音訊信號之接收之間的時間性延遲之量。此外,編碼器可例如基於每一20毫秒(ms)語音/音訊訊框而在逐訊框基礎上判定時間失配值。舉例而言,時間失配值可對應於第二音訊信號之第二訊框相對於第一音訊信號之第一訊框延遲的時間之量。替代地,時間失配值可對應於第一音訊信號之第一訊框相對於第二音訊信號之第二訊框延遲的時間之量。
當聲源距第一麥克風之距離比距第二麥克風之距離更近時,第二音訊信號之訊框可相對於第一音訊信號之訊框而延遲。在此狀況下,第一音訊信號可被稱為「參考音訊信號」或「參考通道」且經延遲第二音訊信號可被稱為「目標音訊信號」或「目標通道」。替代地,當聲源距離第二麥克風之距離比距第一麥克風之距離更近時,第一音訊信號之訊框可相對於第二音訊信號之訊框而延遲。在此狀況下,第二音訊信號可被稱為參考音訊信號或參考通道,且經延遲第一音訊信號可被稱為目標音訊信號或目標通道。
視聲源(例如講話者)位於會議室或遠程呈現室內之位置及聲源(例如講話者)位置如何相對於麥克風改變而定,參考通道及目標通道可自一個 訊框改變至另一訊框;類似地,時間延遲值亦可自一個訊框改變至另一訊框。然而,在一些實施中,時間失配值可始終係正的,以指示「目標」通道相對於「參考」通道之延遲的量。此外,時間失配值可對應於「非因果移位」值,經延遲目標通道藉由該「非因果移位」值在時間上「經拉回」,使得目標通道與「參考」通道對準(例如最大限度地對準)。可對參考通道及非因果移位目標通道執行判定中間通道及旁通道之降混演算法。
編碼器可基於參考音訊通道及應用於目標音訊通道之複數個時間失配值而判定時間失配值。舉例而言,參考音訊通道之第一訊框X可在第一時間(m1)接收。可在對應於第一時間失配值(例如shift1=n1-m1)之第二時間(n1)處接收目標音訊通道之第一特定訊框Y。另外,可在第三時間(m2)處接收參考音訊通道之第二訊框。可在對應於第二時間失配值(例如shift2=n2-m2)之第四時間(n2)處接收目標音訊通道之第二特定訊框。
裝置可以第一取樣速率(例如32kHz取樣速率(亦即,640個樣本每訊框))進行成框或緩衝演算法,以產生訊框(例如20ms樣本)。為回應第一音訊信號之第一訊框及第二音訊信號之第二訊框同時到達裝置之判定,編碼器可估計如等於0樣本之時間失配值(例如shift1)。可在時間上對準左通道(例如對應於第一音訊信號)及右通道(例如對應於第二音訊信號)。在一些狀況下,即使當對準時,左通道及右通道可歸因於各種原因(例如麥克風校準)在能量方面存在不同。
在一些實例中,左通道及右通道可由於各種原因(例如與麥克風中之另一者相比,諸如講話者之聲源可更接近麥克風中之一者,且兩個麥克風相隔距離可大於臨限值(例如1至20公分)距離)在時間上不對準。聲源相對於麥克風之位置可在左通道及右通道中引入不同延遲。另外,在左通道與 右通道之間可存在增益差、能量差或位準差。
在一些實例中,在存在超過兩個通道之情況下,參考通道最初基於通道之位準或能量而被選擇,且隨後基於不同通道對之間的時間失配值(例如t1(ref,ch2),t2(ref,ch3),t3(ref,ch4),...t3(ref,chN))而被改進,其中ch1係最初參考通道且t1(.)、t2(.)等為估計失配值之函數。若所有時間失配值係正的,則ch1被視為參考通道。若失配值中之任一者係負值,則參考通道經重組態成與產生負值的失配值相關聯的通道且上述過程繼續直至實現參考通道之最佳選擇(亦即,基於最大限度地去相關最大數目之旁通道)為止。滯後可用於克服參考通道選擇中之任何急劇變化。
在一些實例中,當多個講話者交替地講話時(例如在不重疊的情況下),音訊信號自多個聲源(例如講話者)到達麥克風之時間可變化。在此狀況下,編碼器可基於講話者動態地調整時間失配值以識別參考通道。在一些其他實例中,多個講話者可同時講話,取決於哪個講話者最大聲、距麥克風最近等,此可產生變化時間失配值。在此狀況下,參考及目標通道之識別可基於當前訊框中之變化的時間移位值及先前訊框中之經估計時間失配值,及第一及第二音訊信號的能量或時間演進。
在一些實例中,當兩種信號可能展示較少(例如無)相關時,可合成或人工產生第一音訊信號及第二音訊信號。應理解,本文所描述之實例係說明性的且可在類似或不同情境中判定第一音訊信號與第二音訊信號之間的關係中具指導性。
編碼器可基於第一音訊信號之第一訊框與第二音訊信號之複數個訊框的比較而產生比較值(例如差值或交叉相關值)。該複數個訊框中之每一訊框可對應於特定時間失配值。編碼器可基於比較值產生第一經估計時間 失配值。舉例而言,第一估計時間失配值可對應於指示第一音訊信號之第一訊框與第二音訊信號之對應第一訊框之間較高時間類似性(或較低差)之比較值。
編碼器可藉由在多個階段中優化一序列經估計時間失配值來判定最終時間失配值。舉例而言,編碼器可首先基於自第一音訊信號及第二音訊信號之立體聲經預處理及經重新取樣版本產生之比較值而估計「暫訂」時間失配值。編碼器可產生與接近於經估計「暫訂」時間失配值之時間失配值相關聯的經內插比較值。編碼器可基於經內插之比較值判定第二經估計「內插」時間失配值。舉例而言,第二經估計「內插」時間失配值可對應於指示比剩餘經內插之比較值及第一經估計「暫訂」時間失配值更高之時間類似性(或較低差)的特定內插比較值。若當前訊框(例如第一音訊信號之第一訊框)之第二經估計「內插」時間失配值與前一訊框(例如先於第一訊框之第一音訊信號之訊框)之最終時間失配值不同,則當前訊框之「內插」時間失配值經進一步「修正」以改良第一音訊信號與經移位第二音訊信號之間的時間類似性。具體而言,一第三經估計「修正」時間失配值可藉由查究當前訊框之第二經估計「內插」時間失配值及前一訊框之最終經估計時間失配值來對應於時間類似性之一更準確量度。第三經估計「修正」時間失配值經進一步調節以藉由限制訊框之間的時間失配值中之任何偽改變來估計最終時間失配值,且受進一步控制以不在如本文中所描述之兩個連續(或相連)訊框中自負時間失配值切換到正時間失配值(或反之亦然)。
在一些實例中,編碼器可節制在相連訊框中或在鄰近訊框中在正時間失配值與負時間失配值之間切換或反之亦然。舉例而言,編碼器可將最 終時間失配值設定成一特定值(例如0),該特定值基於第一訊框之經估計「內插」或「修正」時間失配值及先於第一訊框之特定訊框中之對應經估計「內插」或「修正」或最終時間失配值而指示無時間移位。為了說明,為回應當前訊框的經估計「暫訂」或「內插」或「修正」時間失配值中之一者為正的且前一訊框(例如前於第一訊框的訊框)的經估計「暫訂」或「內插」或「修正」或「最終」估計時間失配值中之另一者為負的之判定,編碼器可設定當前訊框(例如第一訊框)之最終時間失配值以指示無時間移位,亦即shift1=0。替代地,為回應當前訊框的經估計「暫訂」或「內插」或「修正」時間失配值中之一者為負的且前一訊框(例如前於第一訊框的訊框)的經估計「暫訂」或「內插」或「修正」或「最終」估計時間失配值中之另一者為正的之判定,編碼器亦可設定當前訊框(例如第一訊框)之最終時間失配值以指示無時間移位,亦即shift1=0。
編碼器可基於時間失配值而將第一音訊信號或第二音訊信號之訊框選作「參考」或「目標」。舉例而言,回應於判定了最終時間失配值係正的,編碼器可產生具有第一值(例如0)之參考通道或信號指示符,第一值指示第一音訊信號係「參考」信號且第二音訊信號係「目標」信號。替代地,回應於判定了最終時間失配值係負的,編碼器可產生具有第二值(例如1)之參考通道或信號指示符,第二值指示第二音訊信號係「參考」信號且第一音訊信號係「目標」信號。
編碼器可估計與參考信號及非因果經移位目標信號相關聯之相對增益(例如相對增益參數)。舉例而言,回應於判定了最終時間失配值係正的,編碼器可估計增益值以標準化或均衡第一音訊信號相對於第二音訊信號之按非因果時間失配值(例如最終時間失配值之絕對值)偏移的振幅或功 率位準。替代地,回應於判定了最終時間失配值係負的,編碼器可估計增益值以標準化或均衡非因果經移位第一音訊信號相對於第二音訊信號之振幅或功率位準。在一些實例中,編碼器可估計增益值以標準化或均衡「參考」信號相對於非因果經移位「目標」信號之幅度或功率位準。在其他實例中,編碼器可基於相對於目標信號(例如未移位目標信號)之參考信號估計增益值(例如相對增益值)。
編碼器可基於參考信號、目標信號、非因果時間失配值及相對增益參數而產生至少一個經編碼信號(例如中間信號、旁信號或兩者)。在其他實施中,編碼器可基於參考通道及經時間失配調整目標通道而產生至少一個經編碼信號(例如中間通道、旁通道或兩者)。側信號可對應於第一音訊信號之第一訊框的第一樣本與第二音訊信號之所選擇訊框的所選擇樣本之間的差。編碼器可基於最終時間失配值選擇所選訊框。由於第一樣本與所選樣本之間的減小之差,相比於對應於第二音訊信號之與第一訊框同時由裝置接收到之訊框的第二音訊信號之其他樣本,更少的位元可用於對旁通道信號進行編碼。裝置之傳輸器可傳輸至少一個經編碼信號、非因果時間失配值、相對增益參數、參考通道或信號指示符或其組合。
編碼器可基於參考信號、目標信號、非因果時間失配值、相對增益參數、第一音訊信號之特定訊框的低頻帶參數、特定訊框之高頻帶參數或其組合而產生至少一個經編碼信號(例如中間信號、旁信號或兩者)。特定訊框可先於第一訊框。來自一或多個前面的訊框之某些低頻帶參數、高頻帶參數或其組合可用於對第一訊框之中間信號、旁信號或兩者進行編碼。基於低頻帶參數、高頻帶參數或其組合對中間信號、旁信號或兩者進行編碼可改良非因果時間失配值及通道間相對增益參數之估計值。低頻帶參 數、高頻帶參數或其組合可包括音調參數、語音參數、寫碼器類型參數、低頻帶能量參數、高頻帶能量參數、傾角參數、音調增益參數、FCB增益參數、寫碼模式參數、語音活動參數、雜訊評估參數、訊雜比參數、共振峰參數、話語/音樂決策參數、非因果移位、通道間增益參數或其組合。裝置之傳輸器可傳輸至少一個經編碼信號、非因果時間失配值、相對增益參數、參考通道(或信號)指示符或其組合。在本發明中,諸如「判定」、「計算」、「移位」、「調整」等之術語可用以描述如何執行一或多個操作。應注意,此等術語不應被理解為限制性的且其他技術可用以執行類似操作。
參看圖1,揭示了系統之特定說明性實例且通常將該系統指定為100。系統100包括經由網路120以通信方式耦接至第二裝置106之第一裝置104。網路120可包括一或多個無線網路、一或多個有線網路或其組合。
第一裝置104包括編碼器114、傳輸器110及一或多個輸入介面112。輸入介面112中之第一輸入介面耦接至第一麥克風146,且輸入介面112中之第二輸入介面耦接至第二麥克風148。關於圖2描述編碼器114之架構之非限制性實例。第二裝置106包括接收器115及解碼器118。關於圖3描述解碼器118之架構之非限制性實例。第二裝置106耦接至第一擴音器142且耦接至第二擴音器144。
在操作期間,第一裝置104經由第一輸入介面自第一麥克風146接收參考通道130(例如第一音訊信號),且經由第二輸入介面自第二麥克風148接收目標通道132(例如第二音訊信號)。參考通道130對應於左通道或右通道中之一者,且目標通道132對應於左通道或右通道中之另一者。與 第二麥克風148相比,聲源152(例如使用者、揚聲器、環境雜訊、樂器等)可更接近第一麥克風146。因此,相比於經由第二麥克風148,來自聲源152之音訊信號可在較早時間經由第一麥克風146在輸入介面112處接收。經由多個麥克風之多通道信號獲取中之此固有延遲可在參考通道130與目標通道132之間引入時間未對準。因此,目標通道132可經調整(例如在時間上經移位)以與參考通道130大體上對準。
編碼器114經組態以判定指示參考通道130與目標通道132之間的時間未對準之量的失配值116(例如非因果移位值)。根據一個實施,失配值116在時域中指示時間未對準的量。根據另一實施,失配值116在頻域中指示時間未對準的量。編碼器114經組態以按失配值116調整目標通道132以產生經調整目標通道134。因為按失配值116調整了目標通道132,所以經調整目標通道134與參考通道130大體上對準。
編碼器114經組態以基於經調整目標通道134及參考通道130之頻域版本而估計立體聲參數162。根據一個實施,失配值116包括於立體聲參數162中。立體聲參數162亦包括通道間相位差(IPD)參數值164及通道間時差(ITD)參數值166。根據一個實施,失配值116與ITD參數值166類似(例如值相同)。IPD參數值164可在逐頻帶基礎上指示通道130、134之間的相位差。
根據一個實施,編碼器114基於時間失配值116而修改IPD參數值164以產生經修改IPD參數值165。舉例而言,回應於失配值116之絕對值滿足臨限值的判定,編碼器114可修改IPD參數值164以產生經修改IPD參數值165。是否應修改IPD參數值164之判定可基於短期及長期IPD值。
根據一個實施,編碼器114將IPD參數值164中之一或多者設定成零 以產生經修改IPD參數值165。根據另一實施,編碼器114在時間上修勻IPD參數值164中之一或多者以產生經修改IPD參數值165。
為了說明,編碼器114可基於失配值116而判定IPD資訊。IPD資訊可指示應如何修改IPD參數值164,且IPD參數值164可指示在不同頻帶(b)下參考通道130之頻域版本與經調整目標通道134之頻域版本之間的相位差。根據一個實施,修改IPD參數值164包括將IPD參數值164中之一或多者設定成零值(或其他增益值)。根據另一實施,修改IPD參數值164可包括在時間上修勻IPD參數值164中之一或多者。根據一個實施,修改使用殘餘寫碼的IPD參數值(例如具有較低頻帶(b)之IPD參數),且具有較高頻帶之IPD參數值不變。
編碼器114可判定失配值116是否滿足第一失配臨限值(例如上失配臨限值)。若編碼器114判定失配值116滿足(例如大於)第一失配臨限值,則編碼器114經組態以針對與經調整目標通道134之頻域版本相關聯的每一頻帶(b)而修改IPD參數值164。因此,若通道130、132之間的時間未對準係大的(例如大於第一失配臨限值),則使目標通道132移位以改良目標通道130與參考通道132之時間對準可使得在移位之後產生之IPD參數值在一個訊框與下一訊框之間具有大的變化。舉例而言,目標通道132之時間移位可使目標通道132移位遠大於可由IPD參數值164指示之時間距離。為了說明,IPD參數值164可指示來自-pi至pi範圍之值。然而,時間移位可大於該範圍。因此,若失配值116大於第一失配臨限值,則編碼器114可判定IPD參數值164不具有特定相關性。結果,IPD參數值164可設定成零值(或在若干訊框內在時間上經修勻)。
編碼器114亦可判定失配值116是否滿足第二失配臨限值(例如下失配 臨限值)。若編碼器114判定失配值116未能滿足(例如小於)第二失配臨限值,則編碼器114經組態以繞過對IPD參數值164之修改。因此,若通道130、132之間的時間未對準係小的(例如小於第二失配臨限值),則使目標通道132移位以改良目標通道130與參考通道132之時間對準可使得在移位之後產生之IPD參數值164在一個訊框與下一訊框之間具有小的變化。結果,由IPD參數值164指示之變化可具有更大之顯著性,且每一頻帶(b)之IPD參數值164可保持不變。
編碼器114可回應於失配值116未能滿足第一失配臨限值之第一判定及回應於失配值116滿足第二失配臨限值之判定而修改與目標通道132之頻域版本相關聯之頻帶(b)之子集的IPD參數值164。根據一個實施,可回應於失配值116未能滿足第一失配臨限值且滿足第二失配臨限值而針對與殘餘寫碼相關聯之頻帶(b)來修改IPD參數值164(例如設定成零或在時間上修勻)。根據另一實施,可回應於失配值116未能滿足第一失配臨限值且滿足第二失配臨限值而修改用於選擇頻帶(b)之IPD參數值164。
編碼器114經組態以使用IPD參數值164、經修改IPD參數值165等來對經調整目標通道134(或經調整目標通道134之頻域版本)及參考通道130(或參考通道130之頻域版本)執行升混操作。舉例而言,編碼器114可至少部分地基於升混操作而產生中間通道262及旁通道264。關於圖2更詳細地描述中間通道262及旁通道264之產生。編碼器114經進一步組態以對中間通道262進行編碼以產生經編碼中間通道340,且編碼器經組態以對旁通道264進行編碼以產生經編碼旁通道342。
位元串流248(例如經編碼位元串流)包括經編碼中間通道340、經編碼旁通道342及立體聲參數162。根據一個實施,經修改IPD參數值165不 包括於位元串流248中,且解碼器118調整IPD參數值164以產生經修改IPD參數值(如關於圖3所描述)。根據另一實施,經修改IPD參數值165包括於位元串流248中。傳輸器110經組態以經由網路120將位元串流248傳輸至第二裝置106。
接收器115經組態以接收位元串流248。如關於圖3所描述,解碼器118經組態以執行位元串流248之解碼操作組件以產生左通道126及右通道128。一或多個揚聲器經組態以輸出左通道126及右通道128。舉例而言,第二裝置106可經由第一擴音器142輸出左通道126,且第二裝置106可經由第二擴音器144輸出右通道128。在替代性實例中,左通道126及右通道128可作為立體聲信號對傳輸至單個輸出擴音器。
系統100可基於失配值116而修改IPD參數以在解碼階段期間減少假影。舉例而言,為了減少可由對不包括相關資訊之IPD參數值進行解碼引起之假影的引入,編碼器114可產生指示編碼器114是否應修改(例如在時間上修勻)IPD參數、指示應修改哪些IPD參數等之IPD資訊(例如一或多個旗標、具有預定義型樣之IPD參數值、在低頻帶中設定成零之IPD參數值)。
參看圖2,展示說明編碼器114A之特定實施的圖式。編碼器114A可對應於圖1之編碼器114。編碼器114A包括變換單元202、立體聲參數估計器206、降混器、立體聲參數調整單元11、逆變換單元213、中間通道編碼器216、旁通道編碼器210、旁通道修改器230、逆變換單元232及多工器252。
參考通道130及經調整目標通道134經提供至變換單元202。藉由以失配值116使目標通道132移位(例如非因果地移位)來產生經調整目標通道 134。編碼器114A可基於失配值116而判定是否應對目標通道132執行時間移位操作,且可判定寫碼模式以產生經調整目標通道134。在一些實施中,若失配值116未用以使目標通道132在時間上移位,則經調整目標通道134可與目標通道132之時間移位相同。
變換單元202經組態以對參考通道130執行第一變換操作以產生頻域參考通道258,且變換單元202經組態以對經調整目標通道134執行第二變換操作以產生經頻域調整目標通道256。變換操作可包括離散傅立葉變換(Discrete Fourier Transform,DFT)操作、快速傅立葉變換(Fast Fourier Transform,FFT)操作等。根據一些實施,正交鏡像濾波器組(Quadrature Mirror Filterbank,QMF)操作(使用濾波器組,諸如複雜低延遲濾波器組)可用於將輸入信號(例如參考通道130及經調整目標通道134)分裂成多個子頻帶。編碼器114A可經組態以基於第一時間移位操作而判定是否應在變換域中對經頻域調整目標通道256執行第二時間移位(例如非因果)操作,以產生經頻域調整目標通道256之經修改版本。
頻域參考通道258及經頻域調整目標通道256提供至立體聲參數估計器206。立體聲參數估計器206經組態以基於頻域參考通道258及經頻域調整目標通道256而提取(例如產生)立體聲參數162。舉例而言,IID(b)可取決於頻帶(b)中之左通道的能量EL(b)及頻帶(b)中之右通道的能量ER(b)。舉例而言,IID(b)可表達為20×log10(EL(b)/ER(b))。在編碼器處估計且傳輸之IPD可提供在頻帶(b)中之左通道與右通道之間的相位差在頻域中之相位差值的估計。立體聲參數162可包括額外(或替代)參數,諸如ICC、ITD等。立體聲參數162可傳輸至圖1之第二裝置106且可提供至降混器207。降混器207包括中間通道產生器212及旁通道產生器208。在一些實施中, 立體聲參數162經提供至旁通道編碼器210。
立體聲參數162亦經提供至立體聲參數調整單元111。立體聲參數調整單元111經組態以基於失配值116而修改IPD參數值164(例如立體聲參數162)以產生經修改IPD參數值165。另外地或替代性地,立體聲參數調整單元111經組態以判定待應用於殘餘通道(例如旁通道264)之殘餘增益(例如殘餘增益值)。在一些實施中,立體聲參數調整單元111亦可判定IPD旗標(未展示)之值。IPD旗標之值指示一或多個頻帶之IPD參數值是否應被忽略或置零。舉例而言,當IPD旗標經確證時,一或多個頻帶之IPD參數值可被忽略或置零。立體聲參數調整單元111可向降混器207(例如旁通道產生器208)及旁通道修改器230提供IPD資訊(例如經修改IPD參數值165、IPD參數值164、IPD旗標或其組合)。
頻域參考通道258及經頻域調整目標通道256經提供至降混器207。根據一些實施,立體聲參數162經提供至中間通道產生器212。降混器207之中間通道產生器212經組態以基於頻域參考通道258及經頻域調整目標通道256而產生頻域中間通道Mfr(b)266。根據一些實施,亦基於立體聲參數162而產生頻域通道266。
頻域中間通道Mfr(b)266自中間通道產生器212提供至逆變換單元213(例如DFT合成器)及旁通道修改器230。逆變換單元213經組態以對頻域中間通道266執行逆變換操作以產生中間通道262(例如時域中間通道)。逆變換操作可包括離散傅立葉逆變換(Inverse Discrete Fourier Transform,IDFT)操作、離散餘弦逆變換(Inverse Discrete Cosine Transform,IDCT)操作等。根據一個實施,逆變換單元213合成頻域中間通道266以產生中間通道262。中間通道262提供至中間通道編碼器216。中間通道編碼器 216經組態以對中間通道262進行編碼以產生經編碼中間通道340。經編碼中間通道340經提供至多工器252。
降混器207之旁通道產生器208經組態以基於頻域參考通道258、經頻域調整目標通道256、立體聲參數162及經修改IPD參數值165而產生頻域旁通道Sfr(b)270。在頻域旁通道270之每一頻帶(例如區間)中,增益參數(g)可不同且可基於通道間位準差(例如基於立體聲參數162)。舉例而言,頻域旁通道270可表達為(Lfr(b)-c(b)×Rfr(b))/(1+c(b)),其中c(b)可係ILD(b)或取決於ILD(b)(例如c(b)=10^(ILD(b)/20))。頻域旁通道270經提供至旁通道修改器230。旁通道修改器230經修改IPD參數值165。旁通道修改器230經組態以基於頻域旁通道270、頻域中間通道266及經修改IPD參數值165而產生經修改旁通道268(例如經頻域修改旁通道)。
逆變換單元232經組態以對經修改旁通道268執行逆變換操作以產生旁通道264(例如時域旁通道)。逆變換操作可包括IDFT操作、IDCT運算等。根據一個實施,逆變換單元232合成經修改旁通道268以產生旁通道264。旁通道264經提供至旁通道編碼器210。回應於殘餘寫碼啟用信號254啟動旁通道編碼器210,旁通道編碼器210經組態以對旁通道264進行編碼以產生經編碼旁通道342。若殘餘寫碼啟用信號254指示停用了殘餘編碼,則旁通道編碼器210可不針對一或多個頻帶而產生經編碼旁通道342。
經編碼中間通道340、經編碼旁通道342及立體聲參數162提供至多工器252。多工器252經組態以基於經編碼中間通道340、經編碼旁通道342及立體聲參數162而產生位元串流248。
編碼器114A可基於失配值116而修改IPD參數以在解碼階段期間減少 假影。舉例而言,為了減少可由對不包括相關資訊之IPD參數值進行解碼引起之假影的引入,編碼器114A可產生指示編碼器114A是否應修改(例如在時間上修勻)IPD參數、指示應修改哪些IPD參數等之IPD資訊(例如一或多個旗標、具有預定義型樣之IPD參數值、在低頻帶中設定成零之IPD參數值)。
參看圖3,展示了說明一解碼器118A之特定實施的圖式。解碼器118A可對應於圖1之解碼器118。解碼器118A包括中間通道解碼器302、旁通道解碼器304、變換單元306、變換單元308、升混器310、立體聲參數調整單元312、逆變換單元318、逆變換單元320及通道間對準單元322。
位元串流248經提供至解碼器118A,且解碼器118A經組態以對位元串流248之部分進行解碼以產生左通道126及右通道128。位元串流248包括經編碼中間通道340、經編碼旁通道342及立體聲參數162。根據一個實施,一解多工器(未展示)可自位元串流248提取經編碼中間通道340、經編碼旁通道342及立體聲參數162。經編碼中間通道340經提供至中間通道解碼器302,經編碼旁通道342經旁通道解碼器304,且立體聲參數162經提供至立體聲參數調整單元312。立體聲參數162至少包括IPD參數值164、ITD參數值166及失配值116。
中間通道解碼器302經組態以對經編碼中間通道340進行解碼以產生經解碼中間通道344(例如一時域中間通道mCODED(t))。經解碼中間通道344經提供至變換單元306。變換單元306經組態以對經解碼中間通道344執行變換操作以產生經頻域解碼中間通道348。變換操作可包括一離散餘弦變換(DCT)操作、一離散傅立葉變換(DFT)操作、一快速傅立葉變換 (FFT)操作等。經頻域解碼中間通道348經提供至升混器310。
旁通道解碼器304經組態以對經編碼旁通道342進行解碼以產生一經解碼旁通道346。經解碼旁通道346經提供至變換單元308。變換單元308經組態以對經解碼旁通道346執行第二變換操作以產生經頻域解碼旁通道350。第二變換操作可包括DCT操作、DFT操作、FFT運算等。經頻域解碼旁通道350亦經提供至升混器310。儘管說明了經編碼旁通道342之解碼操作,但在一個實施中,解碼器118A可接收指示解碼器118A是應處理抑或忽略一或多個頻帶之殘餘信號資訊的IPD旗標。因此,當IPD旗標指示應忽略一或多個頻帶之殘餘資訊時,可繞過(針對一或多個頻帶)經編碼旁通道342之解碼操作。
經編碼成位元串流248之立體聲參數162經提供至立體聲參數調整單元312。立體聲參數調整單元312包括比較單元314及修改單元316。比較單元314經組態以比較失配值116之絕對值與臨限值。修改單元316經組態以回應於失配值116之絕對值滿足(例如大於)臨限值之判定修改IPD參數值164之至少一部分以產生經修改IPD參數值352。為了說明,對是否應修改IPD參數值352之判定可使用以下假碼來表達:
Figure 106143607-A0305-02-0027-10
Figure 106143607-A0305-02-0028-2
作為非限制性實例,修改單元316可藉由將IPD參數值164中之一或多者設定成零值來產生經修改IPD參數值352。作為另一非限制性實例,修改單元316可藉由在時間上修勻IPD參數值164中之一或多者來產生經修改IPD參數值352。經修改IPD參數值352經提供至升混器310。根據一個實施,立體聲參數調整單元312經組態以基於經編碼旁通道342之可用性而修改IPD參數值164。根據另一實施,立體聲參數調整單元312經組態以基於與位元串流248相關聯之位元速率而修改IPD參數值164。
根據另一實施,立體聲參數調整單元312經組態以基於發聲參數、與先前訊框相關聯之封包損耗判定、語音/音樂分類或另一參數而修改IPD參數值164。作為非限制性實例,回應於前一訊框在傳輸中丟失之判定,立體聲參數調整單元312可修改IPD參數值164以產生經修改IPD參數值352。
升混器310經組態以對經頻域解碼中間通道348執行升混操作以產生頻域左通道354及頻域右通道356。經修改IPD參數值352及其他立體聲參數162(例如ILD、殘餘預測增益等)在升混操作期間應用於經頻域解碼中間通道348。根據一些實施,升混器310對經頻域解碼中間通道348及經頻域解碼旁通道350執行升混操作以產生頻域通道354、356。在此情境下,經修改IPD參數值352在升混操作期間應用於經頻域解碼中間通道348及經頻域解碼旁通道350。頻域左通道354經提供至逆變換單元318,且頻域右通道356經提供至逆變換單元320。
逆變換單元318經組態以對頻域左通道354執行第一逆變換操作以產生時域左通道358。舉例而言,第一逆變換操作可包括離散傅立葉逆變換(IDFT)操作、離散餘弦逆變換(IDCT)操作、快速傅立葉逆變換(IFFT)操作等。根據一個實施,逆變換單元318經組態以對頻域左通道354執行合成開窗操作以產生時域左通道358。時域左通道358經提供至通道間對準單元322。逆變換單元320經組態以對頻域右通道356執行第二逆變換操作以產生時域右通道360。舉例而言,第二逆變換操作可包括IDCT操作、IDFT操作、IFFT運算等。根據一個實施,逆變換單元320經組態以對頻域右通道356執行合成開窗操作以產生時域右通道360。時域右通道360亦經提供至通道間對準單元322。
立體聲參數162之ITD參數值166經提供至通道間對準單元322。根據圖3之所說明實例,立體聲參數調整單元312將ITD參數值166提供至通道間對準單元322。在其他實施中,ITD參數值166經直接提供至通道間對準單元322。根據一個實施,通道間對準單元322經組態以基於ITD參數值166而調整時域右通道360,以產生右通道128及將時域左通道358作為左 通道126傳遞。根據一個實施,通道間對準單元322經組態以基於ITD參數值166而調整時域左通道358,以產生左通道126及將時域右通道360作為右通道128傳遞。
解碼器118A可產生相比於產生為不具有經修改IPD參數值352之通道具有減少之假影的通道126、128。舉例而言,為了減少可由對不包括相關資訊之IPD參數值(例如IPD參數值164)進行解碼引起之假影的引入,解碼器118A可修改IPD參數值164以在時間上修勻可另外引起假影之不相關IPD參數值164。
參考圖4,展示判定IPD資訊之方法400。方法400可由圖1之第一裝置104、圖2之編碼器114A或其組合執行。
方法400包括在402處在編碼器處對參考通道執行第一變換操作以產生頻域參考通道。舉例而言,參看圖2,變換單元202對參考通道130執行第一變換操作以產生頻域參考通道258。
方法400亦包括在404處對目標通道之經調整版本執行第二變換操作以產生經頻域調整目標通道。舉例而言,參看圖2,變換單元202對經調整目標通道134(例如基於失配值116之目標通道132的經調整版本)執行第二變換操作以產生經頻域調整目標通道256。
方法400亦包括在406處判定指示參考通道與目標通道之間的時間未對準之量的失配值。舉例而言,參考圖1,編碼器114判定指示參考通道130與目標通道132之間的時間未對準之量的失配值116。
方法400亦包括在408處基於失配值而判定IPD資訊。IPD資訊指示應修改IPD參數之至少一部分,且IPD參數指示在不同頻帶下頻域參考通道與經頻域調整目標通道之間的相位差。舉例而言,參看圖2,立體聲參數 調整單元111基於失配值116而判定IPD參數值164之待修改的至少一部分。
根據一個實施,方法400包括將IPD參數值164中之一或多者設定成零值以修改IPD參數值164。根據一個實施,方法400包括在時間上修勻IPD參數值164中之一或多者以修改IPD參數值164。根據一個實施,方法400包括判定失配值116滿足第一失配臨限值。方法400亦可包括回應於判定失配值116滿足第一失配臨限值而修改與經頻域調整目標通道256相關聯之每一頻帶的IPD參數值164。根據一個實施,方法400包括判定失配值116未能滿足第二失配臨限值。方法400亦可包括回應於失配值116未能滿足第二失配臨限值之判定而繞過修改IPD參數值164。
根據一個實施,方法400包括判定失配值116未能滿足第一失配值及判定失配值116滿足第二失配值。方法400亦可包括回應於判定失配值116未能滿足第一失配臨限值及回應於判定失配值116滿足第二失配臨限值而修改與經頻域調整目標通道256相關聯之頻帶之子集的IPD參數值164。
方法400亦包括在410處基於IPD資訊而傳輸位元串流。舉例而言,參看圖1,傳輸器110可將位元串流傳輸至第二裝置106。
圖4之方法400可基於失配值116而修改IPD參數值,以在解碼階段期間減少假影。舉例而言,為了減少可由對不包括相關資訊之IPD參數值進行解碼引起之假影的引入,方法400可使得能夠產生指示編碼器114A是否應修改(例如在時間上修勻)IPD參數、指示應修改哪些IPD參數等之IPD資訊(例如一或多個旗標、具有預定義型樣之IPD參數值、在低頻帶中設定成零之IPD參數值)。
參考圖5,展示對位元串流進行解碼之方法500。方法400可由圖1之 第二裝置106、圖3之解碼器或其組合執行。
方法500包括在502處在解碼器處接收包括經編碼中間通道及立體聲參數之經編碼位元串流。立體聲參數包括IPD參數值及指示編碼器側參考通道與編碼器側目標通道之間的時間未對準之量的失配值。舉例而言,參看圖1,接收器115接收包括經編碼中間通道340、經編碼旁通道342及立體聲參數162之位元串流248。
方法500亦包括在504處對經編碼中間通道進行解碼以產生經解碼中間通道。舉例而言,參看圖3,中間通道解碼器302對經編碼中間通道340進行解碼以產生經解碼中間通道344。方法500亦包括在506處對經解碼中間通道執行變換操作以產生經頻域解碼中間通道。舉例而言,參看圖3,變換單元306對經解碼中間通道344執行變換操作以產生經頻域解碼中間通道348。
方法500亦包括在508處基於失配值而修改IPD參數值之至少一部分以產生經修改IPD參數值。舉例而言,參看圖3,比較單元314比較失配值116之絕對值與臨限值。修改單元316回應於失配值116之絕對值滿足(例如大於)臨限值之判定而修改IPD參數值164之至少一部分以產生經修改IPD參數值352。
方法500亦包括在510處對經頻域解碼中間通道執行升混操作以產生頻域左通道及頻域右通道。經修改IPD參數在升混操作期間應用於經頻域解碼中間通道。舉例而言,參看圖3,升混器310在升混過程期間將經修改IPD參數值應用於經頻域解碼中間通道348以產生頻域左通道354及頻域右通道356。
方法500包括在512處對頻域左通道執行第一逆變換操作以產生時域 左通道。舉例而言,參看圖3,逆變換單元318對頻域左通道354執行第一逆變換操作以產生時域左通道358。方法500亦包括在514處對頻域右通道執行第二逆變換操作以產生時域右通道。舉例而言,參看圖3,逆變換單元520對頻域右通道356執行第二逆變換操作以產生時域右通道360。
方法500亦包括在516處輸出左通道或右通道中之至少一者。左通道與時域左通道相關聯,且右通道與時域右通道相關聯。舉例而言,參看圖1,第一擴音器142輸出與時域左通道358相關聯之左通道126,且第二擴音器144輸出與時域右通道360相關聯之右通道128。
圖5之方法500可使得能夠產生相比於產生為不具有經修改IPD參數值352之通道具有減少之假影的通道126、128。舉例而言,為了減少可由對不包括相關資訊之IPD參數值(例如IPD參數值164)進行解碼引起之假影的引入,解碼器118A可修改IPD參數值164以在時間上修勻可另外引起假影之不相關IPD參數值164。
參看圖6,描繪了裝置(例如無線通信裝置)之特定說明性實例的方塊圖,且通常將該裝置指定為600。在各種實施中,與圖6中所說明相比,裝置600可具有更少或更多組件。在說明性實施中,裝置600可對應於圖1之第一裝置104、圖1之第二裝置106或其組合。在說明性實施中,裝置600可執行參考圖1至圖5之系統及方法所描述之一或多個操作。
在特定實施中,裝置600包括處理器606(例如中央處理單元(central processing unit,CPU))。裝置600包括一或多個額外處理器610(例如一或多個數位信號處理器(digital signal processor,DSP))。處理器610可包括媒體(例如語音及音樂)寫碼器解碼器(CODEC)608及回聲消除器612。媒體CODEC 608包括解碼器118A及編碼器114A。編碼器114A包括立體 聲參數調整單元111,且解碼器118A包括立體聲參數調整單元312。
裝置600包括記憶體153及CODEC 634。儘管媒體CODEC 608說明為處理器610之組件(例如專用電路及/或可執行程式碼),但在其他實施中,媒體CODEC 608之一或多個組件(諸如解碼器118A、編碼器114A或其組合)可包括於處理器606、CODEC 634、另一處理組件或其組合中。
裝置600包括傳輸器110及接收器115。傳輸器110及接收器115耦接至天線642。裝置600包括耦接至顯示器控制器626之顯示器628。一或多個揚聲器648耦接至CODEC 634。可經由輸入介面112將一或多個麥克風646耦接至CODEC 634。在特定實施中,揚聲器648包括圖1之第一擴音器142、第二擴音器144或其組合。在特定實施中,麥克風646包括圖1之第一麥克風146、第二麥克風148或其組合。CODEC 634包括數位至類比轉換器(digital-to-analog converter,DAC)602及類比至數位轉換器(analog-to-digital converter,ADC)604。
記憶體153包括指令660,指令660可由處理器606、處理器610、CODEC 634、編碼器114A、解碼器118A、裝置600之另一處理單元或其組合執行以執行參考圖1至圖5所描述之一或多個操作。
可藉由執行用以執行一或多個任務或其組合之指令的處理器經由專用硬體(例如電路)實施裝置600之一或多個組件。作為實例,記憶體153或處理器606、處理器610及/或CODEC 634之一或多個組件可係記憶體裝置,諸如隨機存取記憶體(random access memory,RAM)、磁電阻隨機存取記憶體(magnetoresistive random access memory,MRAM)、自旋扭矩轉移MRAM(spin-torque transfer MRAM,STT-MRAM)、快閃記憶體、唯讀記憶體(read-only memory,ROM)、可程式化唯讀記憶體 (programmable read-only memory,PROM)、可擦除可程式化唯讀記憶體(erasable programmable read-only memory,EPROM)、電可擦除可程式化唯讀記憶體(electrically erasable programmable read-only memory,EEPROM)、暫存器、硬碟、可移除式磁碟或光碟唯讀記憶體(compact disc read-only memory,CD-ROM)。記憶體裝置可包括指令(例如指令660),該等指令在由電腦(例如CODEC 634中之處理器、處理器606、編碼器114A、解碼器118A及/或處理器610)執行時可使得電腦執行參考圖1至圖5所描述之一或多個操作。作為實例,記憶體153或處理器606、處理器610、編碼器114A、解碼器118A及/或CODEC 634之一或多個組件可係包括指令(例如指令660)之非暫時性電腦可讀媒體,該等指令在由電腦(例如CODEC 634中之處理器、處理器606、及/或處理器610)執行時使得電腦執行參考圖1至圖5所描述之一或多個操作。
在特定實施中,裝置600可包括於系統級封裝或系統單晶片裝置(例如行動台數據機(mobile station modem,MSM))622中。在特定實施中,處理器606、處理器610、顯示器控制器626、記憶體153、CODEC 634、傳輸器110及接收器115包括於系統級封裝或系統單晶片裝置622中。在特定實施中,諸如觸控螢幕及/或小鍵盤之輸入裝置630及電源供應器644耦接至系統單晶片裝置622。此外,在特定實施中,如圖6中所說明,顯示器628、輸入裝置630、揚聲器648、麥克風646、天線642及電源供應器644在系統單晶片裝置622外部。然而,顯示器628、輸入裝置630、揚聲器648、麥克風646、天線642及電源供應器644中之每一者可耦接至系統單晶片裝置622之組件,諸如介面或控制器。
裝置600可包括:無線電話、行動通信裝置、行動電話、智慧型電 話、蜂巢式電話、膝上型電腦、桌上型電腦、電腦、平板電腦、機上盒、個人數位助理(personal digital assistan,PDA)、顯示裝置、電視、遊戲控制台、音樂播放器、收音機、視訊播放器、娛樂單元、通信裝置、固定位置資料單元、個人媒體播放器、數位視訊播放器、數位視訊光碟(digital video disc,DVD)播放器、調諧器、攝影機、導航裝置、解碼器系統、編碼器系統或其任何組合。
在特定實施中,本文所揭示之系統及裝置的一或多個組件可整合至解碼系統或設備(例如電子裝置、CODEC或其中之處理器)中、編碼系統或設備中或兩者中。在其他實施中,本文所揭示之系統及裝置之一或多個組件可整合至以下各者中:無線電話、平板電腦、桌上型電腦、膝上型電腦、機上盒、音樂播放器、視訊播放器、娛樂單元、電視、遊戲控制台、導航裝置、通信裝置、個人數位助理(PDA)、固定位置資料單元、個人媒體播放器或另一類型之裝置。
結合上文所揭示之技術,一種設備包括用於接收包括經編碼中間通道及立體聲參數之經編碼位元串流的構件。立體聲參數包括IPD參數值及指示編碼器側參考通道與編碼器側目標通道之間的未對準之量的失配值。舉例而言,用於接收之構件可包括圖1及圖6之接收器115、圖6之天線642、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於對經編碼中間通道進行解碼以產生經解碼中間通道之構件。舉例而言,用於解碼之構件可包括圖1之解碼器118、圖1及圖3之中間通道解碼器302、圖1及圖6之解碼器118A、圖6之處理器610、圖6之處理器606、可由圖6之處理器組件執行之指令660、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於對經解碼中間通道執行變換操作以產生經頻域解碼中間通道之構件。舉例而言,用於執行變換操作之構件可包括圖1之解碼器118、圖1及圖3之變換單元306、圖1及圖6之解碼器118A、圖6之處理器610、圖6之處理器606、可由圖6之處理器組件執行之指令660、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於基於失配值而修改IPD參數值之至少一部分以產生經修改IPD參數值之構件。舉例而言,用於修改之構件可包括圖1之解碼器118、圖1、圖3及圖6之立體聲參數調整單元312、圖1及圖6之解碼器118A、圖6之處理器610、圖6之處理器606、可由圖6之處理器組件執行之指令660、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於對經頻域解碼中間通道執行升混操作以產生頻域左通道及頻域右通道之構件。經修改IPD參數值在升混操作期間應用於經頻域解碼中間通道。舉例而言,用於執行升混操作之構件可包括圖1之解碼器118、圖1及圖3之升混器310、圖1及圖6之解碼器118A、圖6之處理器610、圖6之處理器606、可由圖6之處理器組件執行之指令660、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於對頻域左通道執行第一逆變換操作以產生時域左通道之構件。舉例而言,用於執行第一逆變換操作之構件可包括圖1之解碼器118、圖1及圖3之逆變換單元318、圖1及圖6之解碼器118A、圖6之處理器610、圖6之處理器606、可由圖6之處理器組件執行之指令660、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於對該頻域右通道執行第二逆變換操作以產生時域右通道之構件。舉例而言,用於執行第二逆變換操作之構件可包括圖1之 解碼器118、圖1及圖3之逆變換單元320、圖1及圖6之解碼器118A、圖6之處理器610、圖6之處理器606、可由圖6之處理器組件執行之指令660、其他處理器、電路、硬體組件或其組合。
該設備亦包括用於輸出左通道或右通道中之至少一者的構件,左通道與時域左通道相關聯,且右通道與時域右通道相關聯。舉例而言,用於輸出之構件可包括圖1之第一擴音器142、圖1之第二擴音器144、圖6之揚聲器648、其他處理器、電路、硬體組件或其組合。
參考圖7,描繪了基地台700之特定說明性實例的方塊圖。在各種實施中,基地台700可相比圖7中所說明具有更多組件或更少組件。在說明性實例中,基地台700可根據圖4之方法400、圖5之方法500或兩者而操作。
基地台700可係無線通信系統之部分。無線通信系統可包括多個基地台及多個無線裝置。無線通信系統可係長期演進(Long Term Evolution,LTE)系統、第四代(fourth generation,4G)LTE系統、第五代(fifth generation,5G)系統、分碼多重存取(Code Division Multiple Access,CDMA)系統、全球行動通信系統(Global System for Mobile Communications,GSM)系統、無線局域網路(wireless local area network,WLAN)系統或某一其他無線系統。CDMA系統可實施寬頻CDMA(Wideband CDMA,WCDMA)、CDMA 1X、演進資料最佳化(Evolution-Data Optimized,EVDO)、分時同步CDMA(Time Division Synchronous CDMA,TD-SCDMA),或一些其他版本之CDMA。
無線裝置亦可被稱作使用者裝備(user equipment,UE)、行動台、終端機、存取終端機、用戶單元、工作台等。該等無線裝置可包括:蜂巢式 電話、智慧型電話、平板電腦、無線數據機、個人數位助理(PDA)、手持型裝置、膝上型電腦、智能本、迷你筆記型電腦、平板電腦、無接線電話、無線區域迴路(wireless local loop,WLL)站、藍芽裝置等。無線裝置可包括或對應於圖6之裝置600。
各種功能可由基地台700之一或多個組件(及/或在未展示之其他組件中)執行,諸如發送及接收訊息及資料(例如音訊資料)。在特定實例中,基地台700包括處理器706(例如CPU)。基地台700可包括轉碼器710。轉碼器710可包括音訊CODEC 708(例如話音及音樂CODEC)。舉例而言,轉碼器710可包括經組態以執行音訊CODEC 708之操作的一或多個組件(例如電路)。作為另一實例,轉碼器710經組態以執行一或多個電腦可讀指令以執行音訊CODEC 708之操作。儘管音訊CODEC 708經說明為轉碼器710之組件,但在其他實例中,音訊CODEC 708之一或多個組件可包括於處理器706、另一處理組件或其組合中。舉例而言,解碼器118(例如聲碼器解碼器)可包括於接收器資料處理器764中。作為另一實例,編碼器114(例如聲碼器編碼器)可包括於傳輸資料處理器782中。
轉碼器710可起到在兩個或多於兩個網路之間轉碼訊息及資料的作用。轉碼器710經組態以將訊息及音訊資料自第一格式(例如數位格式)轉換成第二格式。為了說明,解碼器118可對具有第一格式之經編碼信號進行解碼,且編碼器114可將經解碼信號編碼成具有第二格式之經編碼信號。另外或替代地,轉碼器710經組態以執行資料速率調適。舉例而言,轉碼器710可在不改變音訊資料之格式的情況下降頻轉換資料速率或升頻轉換資料速率。為進行說明,轉碼器710可將64kbit/s信號降頻轉換成16kbit/s信號。音訊CODEC 708可包括編碼器114及解碼器118。解碼器118 可包括立體聲參數調節器。
基地台700包括記憶體732。記憶體732(電腦可讀儲存裝置之實例)可包括指令。指令可包括可由處理器706、轉碼器710或其組合執行以執行圖4之方法400、圖5之方法500或兩者的一或多個指令。基地台700可包括耦接至天線之陣列的多個傳輸器及接收器(例如收發器),諸如第一收發器752及第二收發器754。天線陣列可包括第一天線742及第二天線744。天線陣列經組態以無線方式與一或多個無線裝置通信,諸如圖6之裝置600。舉例而言,第二天線744可自無線裝置接收資料串流714(例如位元串流)。資料串流714可包括訊息、資料(例如經編碼話音資料)或其組合。
基地台700可包括網路連接760,諸如空載傳輸連接。網路連接760經組態以與核心網路或無線通信網路之一或多個基地台通信。舉例而言,基地台700可經由網路連接760自核心網路接收第二資料串流(例如訊息或音訊資料)。基地台700可處理第二資料串流以產生訊息或音訊資料,且經由天線陣列之一或多個天線將訊息或音訊資料提供至一或多個無線裝置,或經由網路連接760將其提供至另一基地台。在特定實施中,作為說明性非限制性實例,網路連接760可為廣域網路(wide area network,WAN)連接。在一些實施中,核心網路可包括或對應於公眾交換電話網路(Public Switched Telephone Network,PSTN)、封包基幹網路或兩者。
基地台700可包括耦接至網路連接760及處理器706之媒體閘道器770。媒體閘道器770經組態以在不同電信技術之媒體串流之間轉換。舉例而言,媒體閘道器770可在不同傳輸協定、不同寫碼方案或兩者之間轉換。為了說明,作為說明性非限制性實例,媒體閘道器770可自PCM信號轉換成即時輸送協定(RTP)信號。媒體閘道器770可在封包交換式網路(例 如網際網路通訊協定語音(Voice Over Internet Protocol,VoIP)網路、IP多媒體子系統(IP Multimedia Subsystem,IMS)、第四代(4G)無線網路,諸如LTE、WiMax及UMB、第五代(5G)無線網路等)、電路交換式網路(例如PSTN)及混合型網路(例如第二代(second generation,2G)無線網路,諸如GSM、GPRS及EDGE、第三代(third generation,3G)無線網路,諸如WCDMA、EV-DO及HSPA等)之間轉換資料。
另外,媒體閘道器770可包括諸如轉碼器710之轉碼器,且經組態以在編碼解碼器不相容時轉碼資料。舉例而言,作為說明性非限制性實例,媒體閘道器770可在適應性多重速率(Adaptive Multi-Rate,AMR)寫碼器解碼器與G.711寫碼器解碼器之間進行轉碼。媒體閘道器770可包括路由器及複數個實體介面。在一些實施中,媒體閘道器770亦可包括控制器(未展示)。在特定實施中,媒體閘道器控制器可在媒體閘道器770外部、在基地台700外部或在兩者外部。媒體閘道器控制器可控制並協調多個媒體閘道器之操作。媒體閘道器770可自媒體閘道器控制器接收控制信號,且可起到在不同傳輸技術之間橋接的作用,且可添加對最終使用者能力及連接之服務。
基地台700可包括耦接至收發器752、收發器754、接收器資料處理器764及處理器706之解調變器762,且接收器資料處理器764可耦接至處理器706。解調變器762經組態以解調變自收發器752、754所接收之經調變信號,且經組態以將經解調變資料提供至接收器資料處理器764。接收器資料處理器764經組態以自經解調資料提取訊息或音訊資料,且將訊息或音訊資料發送至處理器706。
基地台700可包括傳輸資料處理器782及傳輸多輸入多輸出(multiple input-multiple output,MIMO)處理器784。傳輸資料處理器782可耦接至處理器706及傳輸MIMO處理器784。傳輸MIMO處理器784可耦接至收發器752、收發器754及處理器706。在一些實施中,傳輸MIMO處理器784可耦接至媒體閘道器770。作為說明性非限制性實例,傳輸資料處理器782經組態以自處理器706接收訊息或音訊資料,且基於諸如CDMA或正交分頻多工(orthogonal frequency-division multiplexing,OFDM)之寫碼方案寫碼該等訊息或該音訊資料。傳輸資料處理器782可提供經寫碼資料至傳輸MIMO處理器784。
可使用CDMA或OFDM技術將經寫碼資料與諸如導頻資料之其他資料多工在一起以產生經多工資料。接著可藉由傳輸資料處理器782基於特定調變方案(例如二進位相移鍵控(「Binary phase-shift keying,BPSK」)、正交相移鍵控(「Quadrature phase-shift keying,QSPK」)、M-元相移鍵控(「M-ary phase-shift keying,M-PSK」)、M-元正交振幅調變(「M-ary Quadrature amplitude modulation,M-QAM」)等)而調變(亦即,符號映射)經多工資料以產生調變符號。在特定實施中,可使用不同調變方案調變經寫碼資料及其他資料。針對每一資料串流之資料速率、寫碼及調變可由處理器706執行之指令判定。
傳輸MIMO處理器784經組態以自傳輸資料處理器782接收調變符號,且可進一步處理調變符號,且可對資料執行波束成形。舉例而言,傳輸MIMO處理器784可將波束成形權重應用至調變符號。
在操作期間,基地台700之第二天線744可接收資料串流714。第二收發器754可自第二天線744接收資料串流714,且可將資料串流714提供至解調變器762。解調變器762可解調變資料串流714之經調變信號且將經解 調變資料提供至接收器資料處理器764。接收器資料處理器764可自經解調變資料提取音訊資料,且將經提取音訊資料提供至處理器706。
處理器706可將音訊資料提供至轉碼器710以供轉碼。轉碼器710之解碼器118可將音訊資料自第一格式解碼成經解碼音訊資料,且編碼器114可將經解碼音訊資料編碼成第二格式。在一些實施中,編碼器114可使用比自無線裝置接收到之資料速率更高資料速率(例如升頻轉換)或更低資料速率(例如降頻轉換)來對音訊資料進行編碼。在其他實施中,音訊資料可未經轉碼。儘管轉碼(例如解碼及編碼)經說明為藉由轉碼器710執行,但轉碼操作(例如解碼及編碼)可由基地台700之多個組件執行。舉例而言,解碼可由接收器資料處理器764執行,且編碼可由傳輸資料處理器782執行。在其他實施中,處理器706可將音訊資料提供至媒體閘道器770用於轉換成另一傳輸協定、寫碼方案或兩者。媒體閘道器770可經由網路連接760將經轉換資料提供至另一基地台或核心網路。
在編碼器114處產生之經編碼音訊資料,諸如經轉碼資料,可經由處理器706提供至傳輸資料處理器782或網路連接760。可將來自轉碼器710之經轉碼音訊資料提供至傳輸資料處理器782,以供根據諸如OFDM之調變方案進行寫碼以產生調變符號。傳輸資料處理器782可將調變符號提供至傳輸MIMO處理器784以供進一步處理及波束成形。傳輸MIMO處理器784可應用波束成形權重,且可經由第一收發器752將調變符號提供至天線陣列之一或多個天線,諸如第一天線742。因此,基地台700可將對應於自無線裝置接收之資料串流714的經轉碼資料串流716提供至另一無線裝置。經轉碼資料串流716可具有與資料串流714不同之編碼格式、資料速率或兩者。在其他實施中,可將經轉碼資料串流716提供至網路連接 760以供傳輸至另一基地台或核心網路。
應注意,藉由本文所揭示之系統及裝置之一或多個組件執行的各種功能經描述為藉由某些組件或模組執行。組件及模組之此劃分僅用於說明。在替代實施中,由特定組件或模組執行之功能可劃分於多個組件或模組之中。此外,在替代實施中,兩個或多於兩個組件或模組可整合至單個組件或模組中。每一組件或模組可使用硬體(例如場可程式化閘陣列(field-programmable gate array,FPGA)裝置、特殊應用積體電路(application-specific integrated circuit,ASIC)、DSP、控制器等)、軟體(例如可由處理器執行之指令)或其任何組合來予以實施。
熟習此項技術者將進一步瞭解,結合本文中所揭示之實施而描述的各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由諸如硬體處理器之處理裝置執行的電腦軟體或兩者之組合。上文大體上在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此功能性經實施為硬體或是可執行軟體取決於特定應用及強加於整個系統之設計約束。熟習此項技術者可針對每一特定應用而以變化之方式實施所描述之功能性,而但不應將此等實施決策解譯為引起脫離本發明之範疇。
結合本文中所揭示之實施所描述之方法或演算法之步驟可直接體現於硬體中、由處理器執行之軟體模組中或兩者之組合中。軟體模組可存在於記憶體裝置中,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦除可程式化唯讀記憶體(EPROM)、電可擦除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、 抽取式磁碟或光碟唯讀記憶體(CD-ROM)。例示性記憶體裝置耦接至處理器,以使得處理器可自記憶體裝置讀取資訊及將資訊寫入至記憶體裝置。在替代方案中,記憶體裝置可與處理器成一體式。處理器及儲存媒體可駐留於特殊應用積體電路(ASIC)中。ASIC可駐留於計算裝置或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐留於計算裝置或使用者終端機中。
提供對所揭示實施之先前描述,以使得熟習此項技術者能夠製作或使用所揭示實施。熟習此項技術者將容易地顯而易見對此等實施之各種修改,且在不背離本發明之範疇的情況下,本文中所定義之原理可應用於其他實施。因此,本發明並不意欲限於本文中所展示之實施,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
116‧‧‧失配值
118A‧‧‧解碼器
126‧‧‧左通道
128‧‧‧右通道
162‧‧‧立體聲參數
164‧‧‧通道間相位差(IPD)參數值
166‧‧‧通道間時差(ITD)參數值
302‧‧‧中間通道解碼器
304‧‧‧旁通道解碼器
306‧‧‧變換單元
308‧‧‧變換單元
310‧‧‧升混器
312‧‧‧立體聲參數調整單元
314‧‧‧比較單元
316‧‧‧修改單元
318‧‧‧逆變換單元
320‧‧‧逆變換單元
322‧‧‧通道間對準單元
340‧‧‧經編碼中間通道
342‧‧‧經編碼旁通道
344‧‧‧經解碼中間通道
346‧‧‧經解碼旁通道
348‧‧‧經頻域解碼中間通道
350‧‧‧經頻域解碼旁通道
352‧‧‧經修改通道間相位差(IPD)參數值
354‧‧‧頻域左通道
356‧‧‧頻域右通道
358‧‧‧時域左通道
360‧‧‧時域右通道

Claims (35)

  1. 一種用於通道間相位差參數修改之裝置,其包含:一接收器,其經組態以接收包括一經編碼中間通道及複數個立體聲參數之一經編碼位元串流,該等立體聲參數包括複數個通道間相位差(IPD)參數值及一失配值,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量;一中間通道解碼器,其經組態以對該經編碼中間通道進行解碼以產生一經解碼中間通道;一變換單元,其經組態以對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道;一立體聲參數調整單元,其經組態以基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值;一升混器,其經組態以對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道,該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道;一第一逆變換單元,其經組態以對該頻域左通道執行一第一逆變換操作以產生一時域左通道;及一第二逆變換單元,其經組態以對該頻域右通道執行一第二逆變換操作以產生一時域右通道。
  2. 如請求項1之裝置,其中該立體聲參數調整器單元經組態以:比較該失配值之一絕對值與一臨限值;及 回應於該失配值之該絕對值滿足該臨限值之一判定而修改該等IPD參數值之至少該部分。
  3. 如請求項1之裝置,其進一步包含:一或多個揚聲器,其經組態以輸出一左通道或一右通道中之至少一者,該左通道與該時域左通道相關聯,且該右通道與該時域右通道相關聯。
  4. 如請求項3之裝置,其中該等立體聲參數包括一通道間時差(ITD)參數值作為該失配值,且其進一步包含:一通道間對準單元,其經組態以:基於該ITD參數值而調整該時域右通道以產生該右通道;或基於該ITD參數值而調整該時域左通道以產生該左通道。
  5. 如請求項4之裝置,其中該通道間對準單元包括於該升混器中。
  6. 如請求項1之裝置,其進一步包含:一旁通道解碼器,其經組態以對一經編碼旁通道進行解碼以產生一經解碼旁通道,該經編碼旁通道包括於該經編碼位元串流中;及一第二變換單元,其經組態以對該經解碼旁通道執行一第二變換操作以產生一經頻域解碼旁通道。
  7. 如請求項6之裝置,其中該立體聲參數調整單元經進一步組態以基於該經編碼旁通道之一可用性而修改該等IPD參數值。
  8. 如請求項1之裝置,其中該立體聲參數調整單元經進一步組態以基於與該經編碼位元串流相關聯之一位元速率而修改該等IPD參數值。
  9. 如請求項1之裝置,其中該立體聲參數調整單元經進一步組態以基於一發聲參數、與一先前訊框相關聯之一封包損耗判定、一語音/音樂分類而修改該等IPD參數值。
  10. 如請求項1之裝置,其中該立體聲參數調整單元經組態以將該等IPD參數值中之一或多者設定成零值。
  11. 如請求項1之裝置,其中該立體聲參數調整單元經組態以在時間上修勻該等IPD參數值中之一或多者。
  12. 如請求項1之裝置,其中該失配值在一頻域中指示時間未對準之該量。
  13. 如請求項1之裝置,其中該失配值在一時域中指示時間未對準之該量。
  14. 如請求項1之裝置,其中該立體聲參數調整單元整合至一行動裝置中。
  15. 如請求項1之裝置,其中該立體聲參數調整單元整合至一基地台中。
  16. 一種對音訊通道進行解碼之方法,該方法包含: 在一解碼器處接收包括一經編碼中間通道及複數個立體聲參數之一經編碼位元串流,該等立體聲參數包括複數個通道間相位差(IPD)參數值及一失配值,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量;對該經編碼中間通道進行解碼以產生一經解碼中間通道;對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道;基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值;對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道,該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道;對該頻域左通道執行一第一逆變換操作以產生一時域左通道;及對該頻域右通道執行一第二逆變換操作以產生一時域右通道。
  17. 如請求項16之方法,其中修改該等IPD參數值之至少該部分包含:比較該失配值之一絕對值與一臨限值;及回應於該失配值之該絕對值滿足該臨限值之一判定而修改該等IPD參數值之至少該部分。
  18. 如請求項16之方法,其進一步包含輸出一左通道或一右通道中之至少一者,該左通道與該時域左通道相關聯,且該右通道與該時域右通道相關聯。
  19. 如請求項18之方法,其中該等立體聲參數包括一通道間時差(ITD)參數值作為該失配值,且其進一步包含:基於該ITD參數值而調整該時域右通道以產生該右通道;或基於該ITD參數值而調整該時域左通道以產生該左通道。
  20. 如請求項16之方法,進一步包含:對一經編碼旁通道進行解碼以產生一經解碼旁通道,該經編碼旁通道包括於該經編碼位元串流中;及對該經解碼旁通道執行一第二變換操作以產生一經頻域解碼旁通道。
  21. 如請求項20之方法,其進一步包含基於該經編碼旁通道之一可用性而修改該等IPD參數值。
  22. 如請求項16之方法,其進一步包含基於與該經編碼位元串流相關聯之一位元速率而修改該等IPD參數值。
  23. 如請求項16之方法,其進一步包含將該等IPD參數值中之一或多者設定成零值。
  24. 如請求項16之方法,其進一步包含在時間上修勻該等IPD參數值中之一或多者。
  25. 如請求項16之方法,其中該失配值在一頻域中指示時間未對準之該量。
  26. 如請求項16之方法,其中該失配值在一時域中指示時間未對準之該量。
  27. 如請求項16之方法,其中在一行動裝置處執行修改該等IPD參數值之至少該部分。
  28. 如請求項16之方法,其中在一基地台處執行修改該等IPD參數值之至少該部分。
  29. 一種包含指令之非暫時性電腦可讀媒體,該等指令在由一解碼器內之一處理器執行時使得該處理器執行包含以下各者之操作:對一經編碼中間通道進行解碼以產生一經解碼中間通道,該經編碼中間通道包括於由該解碼器接收之一經編碼位元串流中,該經編碼位元串流進一步包含包括複數個通道間相位差(IPD)參數值及一失配值之複數個立體聲參數,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量;對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道;基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值;對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道,該等經修改IPD參數值在該升混操作期間應用於該經頻域解 碼中間通道;對該頻域左通道執行一第一逆變換操作以產生一時域左通道;及對該頻域右通道執行一第二逆變換操作以產生一時域右通道。
  30. 如請求項29之非暫時性電腦可讀媒體,其中修改該等IPD參數值之至少該部分包含:比較該失配值之一絕對值與一臨限值;及回應於該失配值之該絕對值滿足該臨限值之一判定而修改該等IPD參數值之至少該部分。
  31. 如請求項29之非暫時性電腦可讀媒體,其中該等操作進一步包含向一或多個揚聲器提供一左通道或一右通道中之至少一者,該左通道與該時域左通道相關聯,且該右通道與該時域右通道相關聯。
  32. 一種用於通道間相位差參數修改之設備,其包含:用於接收包括一經編碼中間通道及複數個立體聲參數之一經編碼位元串流的構件,該等立體聲參數包括複數個通道間相位差(IPD)參數值及一失配值,該失配值指示一編碼器側參考通道與一編碼器側目標通道之間的時間未對準之一量;用於對該經編碼中間通道進行解碼以產生一經解碼中間通道之構件;用於對該經解碼中間通道執行一變換操作以產生一經頻域解碼中間通道之構件; 用於基於該失配值而修改該等IPD參數值之至少一部分以產生經修改IPD參數值之構件;用於對該經頻域解碼中間通道執行一升混操作以產生一頻域左通道及一頻域右通道之構件,該等經修改IPD參數值在該升混操作期間應用於該經頻域解碼中間通道;用於對該頻域左通道執行一第一逆變換操作以產生一時域左通道之構件;及用於對該頻域右通道執行一第二逆變換操作以產生一時域右通道之構件。
  33. 如請求項32之設備,其進一步包含用於輸出一左通道及一右通道之構件,該左通道與該時域左通道相關聯,且該右通道與該時域右通道相關聯。
  34. 如請求項32之設備,其中用於修改之該構件整合至一基地台中。
  35. 如請求項32之設備,其中用於修改之該構件整合至一行動裝置中。
TW106143607A 2017-01-19 2017-12-12 通道間相位差參數之修改 TWI763754B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762448297P 2017-01-19 2017-01-19
US62/448,297 2017-01-19
US15/836,618 2017-12-08
US15/836,618 US10366695B2 (en) 2017-01-19 2017-12-08 Inter-channel phase difference parameter modification

Publications (2)

Publication Number Publication Date
TW201832572A TW201832572A (zh) 2018-09-01
TWI763754B true TWI763754B (zh) 2022-05-11

Family

ID=62840896

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106143607A TWI763754B (zh) 2017-01-19 2017-12-12 通道間相位差參數之修改

Country Status (9)

Country Link
US (2) US10366695B2 (zh)
EP (1) EP3571695B1 (zh)
KR (1) KR102581558B1 (zh)
CN (2) CN110100280B (zh)
AU (1) AU2017394681B2 (zh)
BR (1) BR112019014544A2 (zh)
SG (1) SG11201904753WA (zh)
TW (1) TWI763754B (zh)
WO (1) WO2018136167A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366695B2 (en) 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10224045B2 (en) * 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1784819B1 (en) * 2004-11-02 2008-04-30 Coding Technologies AB Stereo compatible multi-channel audio coding
WO2009068085A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation An encoder
WO2010097748A1 (en) * 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
US20130262130A1 (en) * 2010-10-22 2013-10-03 France Telecom Stereo parametric coding/decoding for channels in phase opposition
US20140164001A1 (en) * 2012-04-05 2014-06-12 Huawei Technologies Co., Ltd. Method for Inter-Channel Difference Estimation and Spatial Audio Coding Device

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
MX2011006248A (es) 2009-04-08 2011-07-20 Fraunhofer Ges Forschung Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase.
EP2702776B1 (en) * 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
JP6612753B2 (ja) 2013-11-27 2019-11-27 ディーティーエス・インコーポレイテッド 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
US10366695B2 (en) 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1784819B1 (en) * 2004-11-02 2008-04-30 Coding Technologies AB Stereo compatible multi-channel audio coding
WO2009068085A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation An encoder
WO2010097748A1 (en) * 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
US20130262130A1 (en) * 2010-10-22 2013-10-03 France Telecom Stereo parametric coding/decoding for channels in phase opposition
US20140164001A1 (en) * 2012-04-05 2014-06-12 Huawei Technologies Co., Ltd. Method for Inter-Channel Difference Estimation and Spatial Audio Coding Device

Also Published As

Publication number Publication date
EP3571695A1 (en) 2019-11-27
WO2018136167A1 (en) 2018-07-26
KR102581558B1 (ko) 2023-09-21
AU2017394681B2 (en) 2022-08-18
BR112019014544A2 (pt) 2020-02-27
CN116033328A (zh) 2023-04-28
KR20190107025A (ko) 2019-09-18
EP3571695B1 (en) 2022-03-23
US10854212B2 (en) 2020-12-01
AU2017394681A1 (en) 2019-06-20
TW201832572A (zh) 2018-09-01
US20190295559A1 (en) 2019-09-26
KR20230138046A (ko) 2023-10-05
SG11201904753WA (en) 2019-08-27
US20180204579A1 (en) 2018-07-19
CN110100280B (zh) 2023-02-24
US10366695B2 (en) 2019-07-30
CN110100280A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
US9978381B2 (en) Encoding of multiple audio signals
US10593341B2 (en) Coding of multiple audio signals
US10885922B2 (en) Time-domain inter-channel prediction
TWI778073B (zh) 用於具有時域頻道間頻寬延展之高頻帶殘值預測的音訊信號寫碼裝置、方法、包含指令的非暫時性電腦可讀媒體及設備
US10854212B2 (en) Inter-channel phase difference parameter modification
TWI724290B (zh) 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置
KR102724147B1 (ko) 채널간 위상차 파라미터 수정