TW201519663A - 用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道的方法及信號處理單元 - Google Patents

用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道的方法及信號處理單元 Download PDF

Info

Publication number
TW201519663A
TW201519663A TW103124927A TW103124927A TW201519663A TW 201519663 A TW201519663 A TW 201519663A TW 103124927 A TW103124927 A TW 103124927A TW 103124927 A TW103124927 A TW 103124927A TW 201519663 A TW201519663 A TW 201519663A
Authority
TW
Taiwan
Prior art keywords
channel
output
input
channels
rules
Prior art date
Application number
TW103124927A
Other languages
English (en)
Other versions
TWI562652B (en
Inventor
Juergen Herre
Fabian Kuech
Achim Kuntz
Michael Kratschmer
Christof Faller
Original Assignee
Fraunhofer Ges Forschung
Univ Friedrich Alexander Er
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Univ Friedrich Alexander Er filed Critical Fraunhofer Ges Forschung
Publication of TW201519663A publication Critical patent/TW201519663A/zh
Application granted granted Critical
Publication of TWI562652B publication Critical patent/TWI562652B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道的一方法包含提供與該等多個輸入聲道之各個輸入聲道相聯結的規則之一集合,其中該等規則定義相聯結的輸入聲道與一集合之輸出聲道間之不同對映關係。針對該等多個輸入聲道之各個輸入聲道,存取與該輸入聲道相聯結的一規則,決定定義於該所存取規則中之該集合之輸出聲道是否係存在於該輸出聲道組態,及若定義於該所存取規則中之該集合之輸出聲道係存在於該輸出聲道組態,則擇定該經存取之規則。該等輸入聲道係根據所選規則而對映至該等輸出聲道。

Description

用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道的方法及信號處理單元
本發明係有關於用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道的方法及信號處理單元,及更明確言之,適用於不同揚聲器聲道組態間之一格式下混轉換的方法及裝置。
空間音訊編碼工具為業界眾所周知且已經標準化,例如MPEG環繞標準。空間音訊編碼始於多個原先輸入,例如5或7個輸入聲道,係藉其在一再生配置中的位置識別,例如識別為一左聲道、一中聲道、一右聲道、一左環繞聲道、一右環繞聲道、及一低頻加強(LFE)聲道。一空間音訊編碼器可從原先聲道導出一或多個下混聲道,此外,可推衍空間線索相關的參數資料,諸如聲道同調值、聲道間相位差、聲道間時間差等中的聲道間位準差。該等一或多個下混聲道與指示該等空間線索之參數邊帶資訊一起發射給一空間音訊解碼器用以解碼該等下混聲道及相聯 結的參數資料以最終獲得輸出聲道,其為原先輸入聲道之近似版本。於輸出配置中之聲道位置可固定,例如5.1格式、7.1格式等。
又,空間音訊對象編碼工具為技藝界眾所周知且經標準化,例如MPEG SAOC標準(SAOC=空間音訊對象編碼)。與始於原先聲道的空間音訊編碼相反,空間音訊對象編碼始於非自動專用於某些渲染再生配置的音訊對象。反而該等音訊對象於再生場景的位置具有彈性且可由使用者設定,例如藉將某些渲染資訊輸入空間音訊對象編碼解碼器內。另外或此外,渲染資訊可以額外邊帶資訊或母資料傳輸;渲染資訊可包括於再生配置中某個音訊對象欲放置之位置之資訊(例如隨著時間之經過)。為了獲得某個資料壓縮,多個音訊對象係使用SAOC編碼器編碼,其從該等輸入對象藉根據某個下混資訊,經由下混該等對象而計算一或多個傳送聲道。又復,SAOC編碼器計算表示對象間線索的參數邊帶資訊,諸如對象層級差異(OLD)、對象同調值等。如同於SAC(SAC=空間音訊編碼),對象間參數資料係針對個別時間/頻率拼貼塊計算。針對音訊信號之某個訊框(例如1024或2048樣本),考慮多個頻帶(例如24、32或64頻帶),因此針對各個訊框及各個頻帶提供參數資料。舉例言之,當一塊音訊有20訊框及當各個訊框被區分為32頻帶時,時間/頻率拼貼塊之數目為640。
期望再生格式亦即輸出聲道組態(輸出揚聲器組態)可與輸入聲道組態不同,其中輸出聲道數目與輸入聲道 數目不同。因此,可能要求格式轉換以將該輸入聲道組態之該等輸入聲道對映至該輸出聲道組態之該等輸出聲道。
本發明之一目的係提出一種以彈性方式用以將一輸入聲道組態之輸入聲道對映至一輸出聲道組態之輸出聲道的改良辦法。
此一目的係藉如請求項1之方法、如請求項25之電腦程式、如請求項26之信號處理單元及如請求項27之音訊解碼器達成。
本發明之實施例提出一種用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道的方法,該方法包含:提供與該等多個輸入聲道之各個輸入聲道相聯結的一集合之規則,其中該等規則定義該相聯結的輸入聲道與一集合之輸出聲道間之不同對映;針對該等多個輸入聲道之各個輸入聲道,存取與該輸入聲道相聯結的一規則,決定於該所存取規則中定義的該集合之輸出聲道是否存在於該輸出聲道組態,及若於該存取規則中定義的該集合之輸出聲道係存在於該輸出聲道組態,則選擇該存取規則;及依據該所選規則,將該等輸入聲道對映至該等輸出聲道。
本發明之實施例提供當在電腦或處理器上跑時用以執行此種方法之一電腦程式。本發明之實施例提供包 含經組配或經規劃以執行此種方法之一處理器的一信號處理單元。本發明之實施例提供包含此種信號處理單元之一音訊解碼器。
本發明之實施例係基於一新穎辦法,其中描述潛在輸入-輸出聲道對映關係之一集合的規則係與多個輸入聲道中之各個輸入聲道相聯結,及其中針對一給定輸入-輸出聲道組態擇定該集合之規則中之一個規則。據此,該等規則不與一輸入聲道組態或與一特定輸入-輸出聲道組態相聯結。如此,針對一給定輸入聲道組態及一特定輸出聲道組態,針對存在於該給定輸入聲道組態中之多個輸入聲道各自,該相聯結的規則集合係經存取以便決定哪個規則匹配該給定輸出聲道組態。該等規則可定義欲直接施用至該等輸入聲道之一或多個係數,或可定義一欲施用之方法以推衍欲應用至該等輸入聲道之該等係數。根據該等係數,可生成一係數矩陣諸如一下混(DMX)矩陣,其可施用至該給定輸入聲道組態中之該等輸入聲道以將其對映至該給定輸出聲道組態中之該等輸出聲道。因該集合之規則係與該等輸入聲道相聯結而非與一輸入聲道組態或一特定輸入-輸出聲道組態相聯結,故本發明辦法可以彈性方式用於不同輸入聲道組態及不同輸出聲道組態。
於本發明之實施例中,聲道表示音訊通道,其中各個輸入聲道及各個輸出聲道具有一方向,其中一相聯結的揚聲器係相對於一中心收聽者位置定位。
100、200‧‧‧3D音訊解碼器
102‧‧‧預渲染器/混合器電路
104、204‧‧‧聲道信號
106‧‧‧對象信號
108‧‧‧對象母資料
110‧‧‧信號
112‧‧‧空間音訊對象編碼(SAOC)編碼器
114‧‧‧SAOC傳送聲道
116‧‧‧統一語音及音訊編碼(USAC)編碼器
118、214‧‧‧信號空間音訊對象編碼光譜分布(SAOC-SI)
120、208‧‧‧對象信號
122‧‧‧預渲染對象信號
124‧‧‧OAM編碼器
126、212‧‧‧壓縮對象母資料資訊
128‧‧‧壓縮輸出信號MP4
202、220‧‧‧USAC解碼器
206、218、222‧‧‧預渲染對象信號
210‧‧‧SAOC傳送聲道信號
216‧‧‧對象渲染器
224‧‧‧對象母資料(OAM)解碼器
226‧‧‧混合器
228‧‧‧聲道信號
230‧‧‧32聲道揚聲器
232‧‧‧格式轉換電路
234‧‧‧5.1揚聲器系統
236‧‧‧雙耳渲染器
238‧‧‧耳機
240‧‧‧下混器
242‧‧‧控制器
244、246、248‧‧‧信號
300‧‧‧水平收聽者平面
302‧‧‧前中心方向
304‧‧‧後中心方向
306‧‧‧虛擬線
400‧‧‧對映規則之優先排序集合
402‧‧‧對映規則選擇器
404‧‧‧輸入聲道組態
406‧‧‧輸出聲道組態
408‧‧‧擇定之對映規則
410‧‧‧評估器
412‧‧‧推衍之下混(DMX)係數
414‧‧‧下混矩陣
420‧‧‧信號處理單元
422‧‧‧處理器
424‧‧‧記憶體
426‧‧‧輸入介面
428‧‧‧輸出介面
500、502、504、508‧‧‧步驟
506、520、524-528‧‧‧方塊
522‧‧‧箭頭
CC‧‧‧中聲道、中置水平揚聲器
ECC‧‧‧架高中置揚聲器
LC‧‧‧左聲道、左揚聲器
LFC‧‧‧低頻加強聲道
LRC‧‧‧右環繞聲道
LSC‧‧‧左環繞聲道
P‧‧‧中心收聽者位置
RC‧‧‧右聲道、右揚聲器
x1-4‧‧‧方向
α‧‧‧方位角
β‧‧‧仰角
將就附圖描述本發明之實施例,附圖中:圖1顯示一3D音訊系統之一3D音訊編碼器之一綜覽;圖2顯示一3D音訊系統之一3D音訊解碼器之一綜覽;圖3顯示用以具現可於圖2之3D音訊解碼器中具現之一格式轉換器之一實施例;圖4顯示一揚聲器組態之一示意頂視圖;圖5顯示另一揚聲器組態之一示意後視圖;圖6a顯示用以將一輸入聲道組態之輸入聲道對映至一輸出聲道組態之輸出聲道的一信號處理單元之方塊圖;圖6b顯示依據本發明之一實施例一信號處理單元;圖7顯示用以將一輸入聲道組態之輸入聲道對映至一輸出聲道組態之輸出聲道的一方法;及圖8顯示該對映步驟之進一步細節之一實施例。
在以細節描述本發明辦法之實施例之前,給定其中可具現本發明辦法之一3D音訊編解碼系統之綜論。
圖1及2顯示依據實施例一3D音訊系統之演算法方塊圖。更明確言之,圖1顯示一3D音訊編碼器100之綜覽。該音訊編碼器100於一預渲染器/混合器電路102其可選擇性地設置接收輸入信號,更明確言之,多個輸入聲道提供多個聲道信號104、多個對象信號106及相對應對象母資料108給該音訊編碼器100。藉預渲染器102處理之該等對象信號106(參考信號110)可提供給一SAOC編碼器112(SAOC=空間音訊對象編碼)。該SAOC編碼器112生成提供給一USAC 編碼器116(USAC=統一語音及音訊編碼)之輸入。此外,該信號SAOC-SI 118(SAOC-SI=SAOC邊帶資訊)也提供給USAC編碼器116之輸入。該USAC編碼器116進一步從該預渲染器/混合器直接接收對象信號120以及聲道信號及預渲染對象信號122。對象母資料資訊108係施用至一OAM編碼器124(OAM=對象母資料)提供經壓縮之對象母資料資訊126給USAC編碼器。基於前述輸入信號,該USAC編碼器116生成一壓縮輸出信號MP4,如於128顯示。
圖2顯示該3D音訊系統之一3D音訊解碼器200。由圖1之音訊編碼器100所產生的編碼信號128(MP4)係於音訊解碼器200更特別於USAC解碼器202接收。該USAC解碼器202將所接收信號128解碼成聲道信號204、預渲染對象信號206、對象信號208、及SAOC傳送聲道信號210。又復,經壓縮之對象母資料資訊212及信號SAOC-SI 214係藉USAC解碼器輸出。該等對象信號208係供給一對象渲染器216輸出經渲染之對象信號218。該等SAOC傳送聲道信號210係供給SAOC解碼器220輸出經渲染之對象信號222。該經壓縮之對象母資料資訊212係供給OAM解碼器224輸出個別控制信號給對象渲染器216及SAOC解碼器220用以產生經渲染之對象信號218及經渲染之對象信號222。該解碼器進一步包含一混合器226,如圖2顯示,接收該等輸入信號204、206、218及222用以輸出該等聲道信號228。如於230指示,該等聲道信號可直接輸出給一揚聲器,例如32聲道揚聲器。另外,該等信號228可供給一格式轉換電路232, 接收指示該等聲道信號228欲被轉換方式之一再生布局信號作為一控制輸入。於圖2描繪之該實施例中,假設轉換係欲以信號可供給5.1揚聲器系統之方式達成,如於234指示。又,聲道信號228欲供給一雙耳渲染器236產生兩個輸出信號,例如用於耳機如於238指示。
圖1及2描繪之編碼/解碼系統可基於MPEG-D USAC編解碼器用於聲道信號及對象信號之編碼(參考信號104及106)。為了提高編碼大量對象之效率,可使用MPEG SAOC技術。三個型別之渲染器可執行下列工作:渲染對象至聲道,渲染聲道至耳機,或渲染聲道至一不同揚聲器設備(參考圖2,元件符號230、234及238)。當對象信號明確地發射或使用SAOC參數式編碼時,相對應於對象母資料資訊108係經壓縮(參考信號126)及多工化為3D音訊位元串流128。
圖1及2顯示針對總體3D音訊系統之演算法方塊,容後詳述。
該預渲染器/混合器102可選擇性地設置以在編碼之前將一聲道加對象輸入場景轉換成一聲道場景。功能上而言其係與預渲染器/混合器相同,容後詳述。期望對象之預渲染以確保在該編碼器輸入之一決定性信號熵,其基本上係與同時作用態對象信號之數目獨立無關。藉由對象之預渲染,無需傳輸對象母資料。離散對象信號係經渲染至該編碼器經組配以使用的該聲道布局。針對各個聲道該等對象之權值係得自該相聯結的對象母資料(OAM)。
該USAC編碼器116為針對揚聲器聲道信號、離散對象信號、對象下混信號及預渲染信號之核心編解碼器。其係基於MPEG-D USAC技術。其係基於輸入聲道及對象分派之幾何及語意資訊而產生聲道及對象對映資訊。此一對映資訊描述輸入聲道及對象係對映至USAC-聲道元件,類似成對聲道元件(CPE)、單聲道元件(SCE)、低頻加強(LFE)及聲道四元組元件(QCE),及CPE、SCE及LFE、及相對應資訊發送至解碼器。全部額外酬載例如SAOC資料114、118或對象母資料126被考慮於編碼器速率控制。取決於渲染器之速率/失真要求及互動要求,對象的編碼係以多種方式為可能。下列對象編碼變化係屬可能:
●預渲染對象:於編碼之前,對象信號係經預渲染及混合至22.2聲道信號。接續編碼鏈瞭解22.2聲道信號。
●離散對象波形:對象係呈單聲道波形供給編碼器。除了聲道信號之外,編碼器使用單聲道元件(SCE)以發送對象。解碼對象係在接收器端經預渲染及混合。壓縮對象母資料資訊係發送至接收器/渲染器。
●參數對象波形:對象性質及其彼此之關係係利用SAOC參數描述。對象信號之下混係以USAC編碼。參數資訊係併肩發送。取決於對象之數目及總資料速率,選擇下混聲道之數目。壓縮對象母資料資訊係發送至SAOC渲染器。
用於對象信號之SAOC編碼器112及SAOC解碼器220可基於MPEG SAOC技術。基於少數發射聲道及額外 參數資料,系統能夠重建、修正及渲染多個音訊對象,諸如OLD、對象間同調(IOC)、下混增益(DMG)。比較個別發射全部對象所要求的資料速率,該額外參數資料具有顯著較低的資料速率,使得編碼極有效率。SAOC編碼器112取對象/聲道信號作為輸入單聲道波形,及輸出參數資訊(其壓縮成3D音訊串流128)及SAOC傳送聲道(其係使用單聲道元件編碼及發射)。SAOC解碼器220從解碼SAOC傳送聲道210及參數資訊214重建對象/聲道信號,及基於再生布局、解壓縮對象母資料資訊及選擇性地,基於使用者互動資訊而產生輸出音訊場景。
提出對象母資料編解碼器(參考OAM編碼器124及OAM解碼器224)使得針對各個對象,載明該等對象於3D空間的幾何位置及體積之相聯結的母資料係於時間及空間藉對象性質的量化而有效地編碼。壓縮對象母資料cOAM 126係發射至接收器200作為邊帶資訊。
對象渲染器216利用壓縮對象母資料以根據給定再生格式產生對象波形。各個對象根據其母資料經渲染至某個輸出聲道218。此方塊之輸出係由部分結果之和產生。若以聲道為基礎之內容以及離散/參數對象兩者經解碼,在輸出所得波形228之前,或在饋至後處理器模組諸如雙耳渲染器236或揚聲器渲染器模組232之前,以聲道為基礎之波形及經渲染之對象波形係藉混合器226混合。
雙耳渲染器模組236產生多聲道音訊材料之雙耳下混,使得各個輸入聲道係以虛擬音源表示。處理係於正 交鏡象濾波器排組(QMF)域中逐一訊框進行,及雙耳化係基於所度量之雙耳室脈衝響應。
揚聲器渲染器232在發射的聲道組態228與期望的再生格式間轉換。也可稱作「格式轉換器」。格式轉換器進行轉換成較少數輸出聲道,亦即產生下混。
格式轉換器232之一可能具現係顯示於圖3。於本發明之實施例中,信號處理單元為此種格式轉換器。格式轉換器232又稱揚聲器渲染器,藉將發射器(輸入)聲道組態之發射器(輸入)聲道對映至該期望的再生格式之(輸出)聲道(輸出聲道組態)而在發射器聲道組態與期望的再生格式間轉換。格式轉換器232通常進行轉換成較少數輸出聲道,亦即進行下混(DMX)方法240。下混器240其較佳地於QMF域操作,接收混合器輸出信號228及輸出揚聲器信號234。可提供組配器242又稱控制器,其接收下列信號作為控制輸入,一指示混合器輸出布局(輸入聲道組態)之一信號246,亦即決定由混合器輸出信號228表示之資料布局,及指示期望再生布局(輸出聲道組態)之信號248。基於此一資訊,控制器242較佳自動地針對輸入及輸出格式之給定組合生成下混矩陣,及將此等矩陣應用至下混器240。格式轉換器232許可標準揚聲器組態以及許可具有非標準揚聲器位置之隨機組態。
本發明之實施例係有關於揚聲器渲染器232之具現,亦即用以具現揚聲器渲染器232之功能部分之裝置及方法。
現在參考圖4及5。圖4顯示表示5.1格式之一揚聲器組態,包含六個揚聲器表示一左聲道LC、一中聲道CC、一右聲道RC、一左環繞聲道LSC、一右環繞聲道LRC及一低頻加強聲道LFC。圖5顯示另一個揚聲器組態包含表示一左聲道LC、一中聲道CC、一右聲道RC及一架高中聲道ECC的揚聲器。
後文中,不考慮低頻加強聲道,原因在於與該低頻加強聲道相聯結的揚聲器(重低音喇叭)之正確位置並不重要。
聲道係排列在相對於一中心收聽者位置P之特定方向。各個聲道之方向係由方位角α及仰角β定義,參考圖5。方位角表示聲道於水平收聽者平面300且可表示個別聲道相對於前中心方向302之方向。如圖4可知,前中心方向302可定義為收聽者位在該中心收聽者位置P之推定觀看方向。後中心方向304包含相對於前中心方向300為180度方位角。在前中心方向與後中心方向間之該前中心方向左側的全部方位角係在該前中心方向之左側上,及在前中心方向與後中心方向間之該前中心方向右側的全部方位角係在該前中心方向之右側上。位在一虛擬線306前方的揚聲器為前揚聲器,該虛擬線係正交於前中心方向302且通過中心收聽者位置P,及位在虛擬線306後方的揚聲器為後揚聲器。於5.1格式中,聲道LC之方位角α為向左30度,CC之α為0度,RC之α為向右30度,LSC之α為向左110度,及RSC之α為向右110度。
一聲道之仰角β定義水平收聽者平面300與該中心收聽者位置與該聲道相聯結的揚聲器間之一虛擬連接線之方向間之夾角。於圖4之組態中,全部揚聲器係排列於水平收聽者平面300內部,及因此全部仰角皆為零。於圖5中,聲道ECC之仰角β可為30度。恰位在中心收聽者位置上方的揚聲器將具有90度仰角。排列於水平收聽者平面300下方的揚聲器具有負仰角。
於空間之一特定聲道的位置,亦即與(特定聲道)相聯結的揚聲器位置係藉方位角、仰角及揚聲器距中心收聽者位置之距離給定。
下混應用將一集合之輸入聲道渲染到一集合之輸出聲道於該處,輸入聲道之數目係大於輸出聲道之數目。一或多個輸入聲道可一起混合到相同輸出聲道。同時,一或多個輸入聲道可於多個一個輸出聲道上渲染。此種從該等輸入聲道至該輸出聲道之對映關係係由一集合之下混係數決定(或另外,調配成一下混矩陣)。下混係數之選擇顯著地影響所能達成的下混輸出聲音品質。不佳的選擇可能導致輸入聲音場景之不平衡混合或不佳空間再生。
為了獲得良好下混係數,專家(例如音效工程師)可將其專業知識列入考慮,手動調諧該等係數。但針對反對某些應用中之手動調諧提出多項理由:市面上聲道組態(聲道配置)之數目增加,針對各個新組態要求新調諧效應。由於組態數目的增加,針對輸入及輸出聲道組態的每種可能的組合將DMX矩陣進行手動個別最佳化變成不合實際。 新組態將出現在製造端上,要求自/至既有組態或其它新組態的新DMX矩陣。新組態可能出現在已經部署一下混應用之後,因而不再可能做手動調諧。於典型應用景況(例如起居室收聽揚聲器)中,遵照標準之揚聲器配置(例如根據ITU-R BS 775之5.1環繞)相當常有例外規則。針對此等非標準揚聲器配置之DMX矩陣無法藉手動最佳化,原因在於其於系統設計期間為未知之故。
既有的或先前提出的用於決定DMX矩陣之系統包含於許多下混應用中採用手動調諧下混矩陣。此等矩陣之下混係數並非以自動方式推衍,反而係由一音效師最佳化以提供最佳的下混品質。音效師可於DMX係數之設計期間將不同輸入聲道之不同性質列入考慮(例如針對中置聲道、針對環繞聲道等的不同處理)。但如前文摘述,若在設計過程後之一稍後階段,增加新輸入及/或輸出組態,則針對每種可能輸入-輸出聲道組態組合進行下混係數的手動推衍乃相當不合實際或甚至為不可能。
一項直捷的可能係藉處理各個輸入聲道作為一虛擬音源,而針對輸入及輸出組態之一給定組合自動地推衍下混係數,該虛擬音源於空間之位置係藉與該特定聲道相聯結的於空間中之位置(亦即與該特定輸入聲道相聯結的揚聲器位置)給定。各個虛擬音源可藉一通用汰選演算法再生,例如於2D之切線法則汰選,或於3D之向量基底幅值汰選(VBAP),參考V.Pulkki:「使用向量基底幅值汰選之虛擬音源定位」,音訊工程學會期刊,45卷456-466頁1997年。 如此所應用的汰選法則之汰選增益決定當將輸入聲道對映至輸出聲道時所施用的增益,亦即汰選增益為期望的下混係數。雖然通用汰選演算法許可自動推衍DMX矩陣,但因各種理由故所得下混聲音品質通常為低:
-針對不存在於輸出組態的每個輸入聲道位置施加汰選。如此導致下述情況,於該處極為常見輸入信號係同調分布於多個輸出聲道上方。此點為非期望者,原因在於其使得封包聲音的再生降級如同混疊。又針對於輸入信號中之離散聲音成分,再生為幻影源造成來源寬度及色彩的非期望的改變。
-通用汰選並未考慮不同聲道之不同性質,原因在於其不允許與其它聲道不同地針對中置聲道而最佳化該等下混係數。根據聲道語意學針對不同聲道差異地最佳化該下混通常將允許獲得較高輸出信號品質。
-通用汰選並未考慮聽覺心理知識,其將針對前向聲道、邊帶聲道等要求不同的汰選演算法。此外,通用汰選結果導致在間隔寬廣揚聲器上渲染的汰選增益,並未導致在輸出組態上該空間聲音場景的正確再生。
-包括垂直間隔揚聲器之汰選的通用汰選,由於其並未考慮聽覺心理效應(垂直空間知覺線索與水平線索不同)故未能導致良好結果。
-通用汰選並未考慮收聽者大半轉頭朝向較佳方向(「前方」,螢幕),因而傳遞非最佳結果。
針對輸入及輸出組態之一給定組合,數學(亦即 自動)推衍下混係數之另一項提議已由A.Ando做出:「於再生聲場中維持聲音之物理性質的多聲道聲音信號之對話」,IEEE於音訊、語音及語文處理之會議紀錄,第19卷第6期2011年8月。此項推衍也係基於一數學公式其並未考慮輸入及輸出聲道組態之語意學。因而其也具有與切線法則或VBAP汰選辦法之相同問題。
本發明之實施例提出用於不同揚聲器聲道組態間之格式轉換的新穎辦法,其可進行為將多個輸入聲道對映至多個輸出聲道之一下混過程,於該處輸出聲道之數目通常小於輸入聲道之數目,及於該處輸出聲道位置可與輸入聲道位置不同。本發明之實施例係有關於改良此等下混具現之效能的新穎辦法。
雖然本發明之實施例係關聯音訊編碼描述,但須注意一般而言所描述之新穎下混相關辦法也可施用至下混應用,亦即不涉及音訊編碼之應用。
本發明之實施例係有關於自動生成可應用於下混應用,例如用於前文參考圖1至3描述之下混方法之DMX係數或DMX矩陣之方法及信號處理單元(系統)。DMX係數係取決於輸入及輸出聲道組態推衍。一輸入聲道組態及一輸出聲道組態可取作為輸入資料及最佳化DMX係數(或最佳化DMX矩陣)可從該輸入資料推衍得。於後文詳細說明部分中,下混係數一詞係有關於靜態下混係數,亦即不取決於輸入音訊信號波形之下混係數。於一下混應用中,例如可施用額外係數(例如動態、時變增益)以保有該等輸入信號 之功率(所謂主動下混技術)。用於自動生成DMX矩陣之所揭示系統之實施例許可針對給定的輸入及輸出聲道組態獲得高品質DMX輸出信號。
於本發明之實施例中,將一輸入聲道對映至一或多個輸出聲道包括針對該輸入聲道所對映至的各個輸出聲道,推衍至少一個欲施加至該輸入聲道的係數。該至少一個係數可包括一增益係數,亦即欲施加至與該輸入聲道相聯結的該輸入信號之一增益值,及/或一延遲係數,亦即欲施加至與該輸入聲道相聯結的該輸入信號之一延遲值。於本發明之實施例中,對映可包括推衍頻率選擇性係數,亦即針對輸入聲道之不同頻帶之不同係數。於本發明之實施例中,將輸入聲道對映至輸出聲道包括從該等係數產生一或多個係數矩陣。各個矩陣定義針對該輸出聲道組態之各個輸出聲道,欲施用至該輸入聲道組態之各個輸入聲道之一係數。針對該輸入聲道所不對映至的該等輸出聲道,於該係數矩陣中之個別係數將為零。於本發明之實施例中,可產生針對增益係數及延遲係數的分開係數矩陣。於本發明之實施例中,於係數為頻率選擇性之情況下,可產生針對各個頻帶之一係數矩陣。於本發明之實施例中,對映可進一步包括施加所衍生的係數至與該等輸入聲道相聯結的輸入信號。
圖6顯示用以自動產生一DMX矩陣之系統。系統包含描述輸出入聲道對映圖之規則集合,方塊400,及基於規則之集合400,選擇用於一輸入聲道組態404及一輸出聲 道組態組合406之一給定組合的最適當規則。該系統可包含一適當介面以接收輸入聲道組態404及輸出聲道組態406上之資訊。
輸入聲道組態界定存在於一輸入配置之聲道,其中各個輸入聲道具有相聯結的方向或位置。輸出聲道組態界定存在於輸出配置中之聲道,其中各個輸出聲道具有相聯結的方向或位置。
選擇器402供應所選規則408給一評估器410。評估器410接收所選規則408及評估所選規則408以根據該等所選規則408推衍DMX係數412。一DMX矩陣414可從所推衍的下混係數產生。評估器410可經組配以從下混係數推衍下混矩陣。評估器410可接收輸入聲道組態及輸出聲道組態上之資訊,諸如輸出配置幾何形狀上之資訊(例如聲道位置)及輸入配置幾何形狀上之資訊(例如聲道位置),及當推衍下混係數時將該資訊列入考慮。
如圖6b顯示,該系統可於一信號處理單元420具現,包含經規劃或組配作為選擇器402及評估器410之一處理器422,及經組配以儲存對映規則之集合400之至少部分。對映規則之另一部分可由處理器不存取儲存於記憶體424之該等規則檢查。任一個情況下,該等規則係提供給處理器以執行所描述之方法。信號處理單元可包括用以接收與輸入聲道相聯結的輸入信號228之一輸入介面426及用以輸出與輸出聲道相聯結的輸出信號234之一輸出介面428。
須注意該等規則大致上適用於輸入聲道而不適 用輸入聲道組態,使得各個規則可運用於分享該特定規則所設計使用的相同輸入聲道之多個輸入聲道組態。
該等規則之集合包括一規則之集合描述將各個輸入聲道對映至一或數個輸出聲道之可能性。針對有些輸入聲道,該規則之集合只包括單一聲道,但通常該規則之集合將包括多個(多數)用於大部分或全部輸入聲道之規則。該規則之集合可由一系統設計師填充,該設計師當填充該規則之集合時結合有關下混之專家知識。例如,該設計師可結合有關聽覺心理之知識或其技藝意圖。
潛在地針對各個輸入聲道可存在有數個不同對映規則。不同對映規則例如定義不同的可能性以取決於在該特定使用情況下可利用之輸出聲道列表,而渲染在輸出聲道上正在考慮的一輸入聲道。換言之,針對各個輸入聲道,可能存在有多個規則,例如各個定義從該輸入聲道至不同輸出揚聲器之集合的對映關係,於該處該集合之輸出揚聲器也可只包含一個揚聲器或甚至可為空白的。
針對於該集合之對映規則中之一個輸入聲道,具有多個規則之可能最常見理由為不同的可用輸出聲道(由不同的可能輸出聲道組態決定)要求從一個輸入聲道至可用輸出聲道之不同對映關係。例如一個規則可定義從一特定輸入聲道對映至一特定輸出揚聲器,其在一個輸出聲道組態為可利用而在另一個輸出聲道組態為不可利用。
據此,如圖7顯示,於該方法之一個實施例中,針對一輸入聲道,存取於相聯結的規則集合中之一規則, 步驟500。決定於該所存取規則中定義的該輸出聲道之集合是否於輸出聲道組態為可利用,步驟502。若該輸出聲道之集合於輸出聲道組態為可利用,則擇定該所存取之規則,步驟504。若該輸出聲道之集合於輸出聲道組態為不可利用,則方法跳回步驟500及存取下一個規則。步驟500及502係迭代重複地進行直到找到定義一輸出聲道之集合匹配該輸出聲道組態的一規則為止。於本發明之實施例中,當遇到定義一空白輸出聲道之集合的一規則,故絲毫也無相對應IC對映時(或換言之,與一係數零相對應)可停止迭代重複處理。
如於圖7中藉方塊506指示,針對該輸入聲道組態之多個輸入聲道中之各個輸入聲道進行步驟500、502及504。該等多個輸入聲道可包括該輸入聲道組態之全部輸入聲道,或可包括至少兩個該輸入聲道組態之輸入聲道之一子集。然後,根據所選規則,該等輸入聲道對映至該等輸出聲道。
如圖8顯示,該等輸入聲道對映至該等輸出聲道可包含評估所選規則以推衍出欲施加至與該等輸入聲道相聯結的輸入音訊信號之係數,方塊520。該等係數可施加至輸入信號以生成與該等輸出聲道相聯結的輸出音訊信號,箭頭522及方塊524。另外,從該等係數可生成一下混矩陣,方塊526,及該下混矩陣可施加至該等輸入信號,方塊524。然後,該等輸出音訊信號可輸出至與該等輸出聲道相聯結的揚聲器,方塊528。
如此,針對給定輸入/輸出組態選擇規則包含藉從該集合之規則,其描述如何將各個輸入聲道對映至在該給定輸出聲道組態中為可利用的該等輸出聲道上,選擇適當分錄而針對一給定輸入及輸出組態推衍出一下混矩陣。更明確言之,系統只選擇針對該給定輸出配置為有效的該等對映規則,亦即描述針對該特定使用情況,對映至在該給定輸出聲道組態中為可利用的揚聲器聲道之對映關係。描述對映至不存在於所考慮的輸出組態中既有的輸出聲道之對映關係被捨棄為無效,因而不選用作為針對該給定輸出組態之適當規則。
針對一個輸入聲道之多個規則之一個實施例係於後文中描述用於將一架高中置聲道(亦即在方位角0度及仰角大於0度之一聲道)對映至不同輸出揚聲器。用於架高中置聲道之第一規則可定義直接地對映至水平面中之該中置聲道(亦即對映至方位角0度及仰角0度之一聲道)。用於架高中置聲道之第二規則可定義輸入信號對映至左及右前聲道(例如立體聲再生系統之兩個聲道或5.1環繞再生系統之左及右聲道)作為一幻影源。例如第二規則可以相等增益將輸入信號對映至左及右前聲道,使得再生信號被知覺為在中心位置的一幻影源。
若該輸入聲道組態之一輸入聲道(揚聲器位置)也存在於該輸出聲道組態,則該輸入聲道可直接地對映至相同輸出聲道。藉將直接一對一對映規則加入作為第一規則,此點可反映在該集合之對映規則。第一規則可在該等 對映規則選擇之前處理。在對映規則決定外部處理避免了於儲存其餘對映規則之一記憶體的資料庫內,載明用於各個輸入聲道的一對一對映規則之需要(例如30度方位角之左前輸入對映至30度方位角之左前輸出)。此種直接一對一對映關係可經處理,例如使得針對一輸入聲道的直接一對一對映關係為可能(亦即存在有相關輸出聲道),該特定輸入聲道係直接地對映至相同輸出聲道而不會在其餘對映規則之該集合中啟動搜尋此一特定輸入聲道。
於本發明之實施例中,規則經過優先排序。在選擇規則期間,該系統偏好較高排序規則優於較低排序規則。此點可經由針對各個輸入聲道之一優先排序規則列表之迭代重複而予具現。針對各個輸入聲道,該系統可迴圈通過針對考慮中的該輸入聲道潛在規則的該有序列表,直到找到一合宜有效對映規則為止,如此中止且如此選擇最高優先排序之適當對映規則。具現該優先排序之另一項可能可為將成本項分派給反映出該等對映規則適用之品質影響的各項規則(較高成本對較低品質)。然後該系統可跑一搜尋演算法,其藉選出最佳規則而最小化成本項。若用於不同輸入聲道之規則選擇可彼此互動,則成本項的使用也許可通用地最小化成本項。該成本項之通用最小化確保了獲得最高輸出品質。
規則之優先排序可由一系統架構定義,例如藉以優先排序順序填充潛在對映規則之列表,或藉分派成本項給個別規則。優先排序可反映出輸出信號所能達成的聲音 品質:推定較高優先排序規則可遞送較高聲音品質,例如較佳空間影像,比較低優先排序規則更好的封包。可能可考慮於規則之優先排序中的潛在其它面向,例如複雜度面向。因不同規則導致不同的下混矩陣,其最終將導致應用該所產生的下混矩陣之下混處理中之不同運算複雜度或記憶體要求。
所選對映規則(諸如藉選擇器402)決定了下混增益,可能結合了幾何形狀資訊。亦即用以決定下混增益值之一規則可傳遞根據與揚聲器聲道相聯結的位置決定之下混增益值。
對映規則可直接定義一或數個下混增益亦即增益係數作為數值。該等規則例如另可定義藉載明欲施用一特定汰選法則,例如切線法則汰選或VBAP而間接地定義該等增益。於該種情況下,下混增益取決於幾何形狀資料,諸如該輸入聲道相對於收聽者的位置或方向,以及該輸出頻道或該等輸出聲道相對於收聽者的位置或方向。該等規則可定義下混增益頻率相依性。該頻率相依性可由針對不同頻率或頻帶的不同增益值反映或可反映為參數等化器參數,濾波器或第二排序區段之擱架形式之參數,其描述當一輸入聲道對映至一或數個輸出聲道時欲施加至該信號之一濾波器響應。
於本發明之實施例中,具現規則以直接地或間接地定義下混係數為欲施加至該等輸入聲道之下混增益。但下混係數並不限於下混增益,反而也可包括當輸入聲道對 映至輸出聲道時所施用的其它參數。該等對映規則可具現以直接地或間接地定義延遲值,該延遲值可藉延遲汰選技術而非幅值汰選技術而渲染該等輸入聲道。又復,延遲與幅值汰選可予組合。於此種情況下,該等對映規則將允許決定增益及延遲值作為下混係數。
於本發明之實施例中,針對各個輸入聲道評估所選規則,用以對映至該等輸出聲道之經推衍增益(及/或其它係數)係移轉給下混矩陣。該下混矩陣可在起點以零起始,使得當針對各個輸入聲道評估所選規則時,該下混矩陣潛在地散在地以非零值填充。
該規則集合之該等規則可經組配以在將該等輸入聲道對映至該等輸出聲道時具現不同構想。特定規則或特定類別之規則及該等規則之潛在通用對映構思容後詳述。
一般而言,該等規則允許結合專家知識於下混係數之自動生成以獲得,比較從通用數學下混係數產生器例如以VBAP為基礎之解決方案所能獲得者更佳品質的下混係數。專家知識可來自於有關聽覺心理之知識,其比較通用數學式例如通用汰選法則更精確地反映出人類聲音知覺。所結合的專家知識也可反映出設定下混解決方案中之經驗或可反映出技藝下混意圖。
可具現規則以減少過度汰選:經常不期望有大量經汰選的輸入聲道之再生。對映規則可經設計使得其接受方向再生錯誤,亦即一音源可被渲染在錯誤位置以減少回 送時的汰選量。舉例言之,一規則可在略為錯誤位置將一輸入聲道對映至一輸出聲道,而非在二或多個輸出聲道上汰選該輸入聲道至正確位置。
可具現規則以考慮該聲道之語意學。具有不同意義的聲道,諸如載有特定內容之聲道可具有相聯結的不同調諧規則。一個實施例為用以將該輸入聲道對映至該等輸出聲道之規則:中置聲道之聲音內容常與其它聲道之聲音內容有顯著差異。舉例言之,於電影,中置聲道主要用以再生對白(亦即作為「對白聲道」),因此有關該中置聲道之規則可具現為意圖語音被知覺為從附近音源產生而極少有空間音源展開及自然音色。如此,一中置對映規則允許比較其它聲道之規格更大的再生音源位置偏差而避免汰選(亦即幻影源渲染)的需要。如此確保該電影對白被再生為離散音源,而比較幻影源具有極少展開及較多自然音色。
其它語意規則可解譯左及右前置聲道為立體聲成對聲道之一部分。此等規則可針對再生立體聲聲音影像使得其置中:若左及右前置聲道係對映至非對稱性輸出配置,左-右非對稱性,則該等規則可施加校正項(例如校正增益)其確保該立體聲聲音影像之平衡再生,亦即置中再生。
利用聲道語意學之另一實施例為用於環繞聲道之規則經常用以生成封包周圍聲場(例如室混疊)其不會提引出音源具有分開來源位置的知覺。因而此種聲音內容之確切再生位置通常並不要緊。因此將環繞聲道之語意學列入考慮的對映規則可只有對空間精度之低度要求而予定 義。
可具現規則以反映出保留該輸入聲道組態特有的分集之意圖。此等規則例如可再生輸入聲道為一幻影源,即便在該幻影源的位置有一分開輸出聲道為可資利用亦復如此。此種在可能有無-汰選解決方案之處蓄意地導入汰選可為優異,若離散輸出聲道及幻影源被饋以在輸入聲道組態為(例如空間)分集的輸入聲道:離散輸出聲道及幻影源被差異地知覺,如此保留所考慮的該等輸入聲道之分集。
分集保留規則之一個實施例為從架高中置聲道對映至左及右前聲道作為在水平面之中心位置的幻影源即便於水平面之一中置揚聲器為於輸出組態中所實體可得亦復如此。若同時另一輸入聲道係對映至水平面之一中置聲道,則由本實施例所得之對映關係可應用至保留輸入聲道分集。若無分集保留規則,則兩個輸入聲道,亦即架高中置聲道及另一輸入聲道將經由相同信號路徑再生,亦即經由水平面之一中置揚聲器再生,故喪失輸入聲道分集。
除了使用如前文解釋之幻影源之外,輸入聲道組態所特有之空間分集特性的保留或模擬可藉具現下列策略之規則達成。1.若該輸入聲道對映至在較低位置(較低仰角)之一輸出聲道,則規則可定義一等化濾波器施用至於架高位置(較高仰角)與一輸入聲道相聯結的一輸入信號。該等化濾波器可補償不同聲道之音色變化且可基於實驗專家知識及/或度量BRIR資料等推衍。2.若該輸入聲道對映至在較低位置之一輸出聲道,則規則可定義一解相關/混疊濾波器 施用至於架高位置與一輸入聲道相聯結的一輸入信號。該濾波器可從有關室聲學等的BRIR度量或實驗知識推衍。該規則可定義經濾波之信號係在多個揚聲器上再生,於該處針對各個揚聲器可施用不同濾波器。該濾波器也可只模型化早期反射。
於本發明之實施例中,該選擇器可將針對一輸入聲道選擇一規則時,其它輸入聲道係如何對映至一或多個輸出聲道列入考慮。舉例言之,該選擇器可選擇第一規則,若無其它輸入聲道對映至該輸出聲道時,將該輸入聲道對映至一第一輸出聲道。於有另一輸入聲道對映至該輸出聲道之情況下,該選擇器可選擇另一規則,將該輸入聲道對映至一或多個其它輸出聲道,意圖保留該輸入聲道組態所特有的一分集。舉例言之,當另一輸入聲道也對映至相同輸出聲道及否則應用另一規則之情況下,該選擇器可施用該等規則具現用以保留該輸入聲道組態所特有的一分集。
規則可具現為音色保留規則。換言之,可具現規則以考慮下述事實,該輸出配置之不同揚聲器係由收聽者以不同音色知覺。一項理由為音色係由收聽者的頭部、耳廓、及軀幹的聲音效應所導入。該音色取決於聲音到達收聽者耳朵之入射角,亦即針對不同揚聲器位置的音色不同。此等規則將針對輸入聲道位置及該輸入聲道所對映至的輸出聲道位置之不同音色列入考慮,及推衍等化資訊其補償音色之非期望差異,亦即補償非期望的音色變化。為了達成此項目的,規則可包括一等化規則連同一對映規 則,決定從一個輸入聲道對映至輸出組態,原因在於等化特性通常係取決於接受考慮的特定輸入及輸出聲道。換言之,一等化規則可聯結某些對映規則,其中兩個規則可一起解譯為一個規則。
等化規則可導致等化資訊,例如可由頻率相依性下混係數反映,或例如可由針對等化濾波器之參數資料反映,該等等化濾波器施用至該等信號以獲得期望的音色保留效應。音色保留規則之一個實施例乃一項規則其描述從一架高中置聲道對映至水平面的中心聲道。音色保留規則將定義一等化濾波器其於下混程序施用以補償,相較於一信號透過在水平面之中心聲道位置之一揚聲器再生所知覺的音色,當透過安裝於架高中置聲道位置之一揚聲器再生該信號時由該收聽者所知覺的不同音色。
本發明之實施例提供後備通用對映規則。可採用一通用對映規則,例如輸入組態位置之通用VBAP汰選,其適用於當針對一給定輸入聲道及給定輸出聲道組態不再發現有進階規則時。此項通用對映規則確保針對全部可能的組態隨時找到有效輸入/輸出對映,及針對各個輸入聲道,至少滿足一基本渲染品質。須注意使用比後備規則更精製的規則,通常可對映其它輸入聲道,使得所生成的下混係數之總體品質通常將高於(及至少一般高)由通用數學解例如VBAP所生成的係數品質。於本發明之實施例中,通用對映規則可定義該輸入聲道對映至具有一左輸出聲道及一右輸出聲道的立體聲道組態之一個或兩個輸出聲道。
於一實施例中,所描述的程序亦即從一集合之潛在對映規則決定對映規則,及藉建構一下混矩陣施加該等所選用之規則,由此可應用於下混處理,該等程序可經變更使得所選對映規則可直接應用於下混程序而無中間調配一下混矩陣。舉例言之,由所選規則決定的對映增益(亦即下混增益)可直接施用於下混程序而無中間調配一下混矩陣。
其中該等係數或下混矩陣施用至與該等輸入聲道相聯結的輸入信號之方式為熟諳技藝人士所顯然易知。輸入信號係藉施用所推衍的係數處理,及處理後之信號輸出至與該輸入聲道所對映的該(等)輸出聲道相聯結的揚聲器。若二或更多個輸入聲道係對映至相同輸出聲道,則加上個別信號及輸出至與該輸出聲道相聯結的揚聲器。
於一優異實施例中該系統可具現如下。給定對映規則之一有序列表。該順序反映對映規則優先排序。各個對映規則決定從一個輸入聲道對映至一或多個輸出聲道,亦即各個對映規則決定一輸入聲道係在哪個輸出揚聲器上渲染。對映規則以數值方式明確地定義下混增益。另外,對映規則指示一汰選法則係針對所考慮的輸入及輸出聲道作評估,亦即該汰選法則必須根據所考慮的輸入及輸出聲道之空間位置(例如方位角)作評估。對映規則可額外地載明當進行下混處理時,一等化濾波器須施用至所考慮的輸入聲道。該等化濾波器可由一濾波器參數指示載明,決定欲施用來自濾波器之一列表中之哪個濾波器。該系統可針對 一給定輸入及輸出聲道組態生成一集合之下混係數如下。針對該輸入聲道組態之各個輸入聲道:a)鑒於該列表之順序,迭代重複通過對映規則之該列表;b)針對描述來自所考慮之輸入聲道之一對映的各個規則,決定該規則是否適用(有效),亦即決定該對映規則考慮用於渲染的該(等)輸出聲道是否在所考慮的輸出聲道組態內為可資利用;c)針對所所考慮之輸入聲道發現的第一有效規則決定從該輸入聲道對映至該(等)輸出聲道;d)找到一有效規則後,針對所所考慮之輸入聲道結束迭代重複;e)評估該所選規則以決定用於該所所考慮之輸入聲道的下混係數。該規則之評估可涉及汰選增益之計算及/或可涉及決定一濾波器規格。
推衍下混係數之本發明辦法為優異,原因在於其提供結合專家知識於下混設計的可能性(例如聽覺心理原理、不同聲道之語意學處理等)。比較純粹數學辦法(例如VBAP之通用應用),如此允許當施用該推衍下混係數於一下混應用時,獲得更高品質之下混輸出信號。比較手動調諧下混係數,該系統允許針對更多個輸入/輸出組態組合自動推衍係數而無需調諧專家,因而減低成本。該系統進一步允許於已經部署下混具現之應用推衍下混係數,如此許可高品質下混應用,於該處於設計過程之後可改變輸入/輸出組態,亦即可能無需專家調諧該等係數。
後文中,將以進一步細節描述本發明之特定非限制性實施例。該實施例係參考可具現圖2顯示之格式轉換232的一格式轉換器描述。後文中描述的該格式轉換器包含 多個特定特性件,其中顯示部分特性件為選擇性,因而可被刪除。後文中,將描述如何啟動轉換器以具現本發明。
後文說明書參照表1至6描述,該等表出現於說明書末端。表中針對個別聲道使用的標記解譯如下:符號「CH」表示「聲道」。符號「M」表示「水平收聽者平面」,亦即0度仰角。此乃於正常2D配置諸如立體聲或5.1中之揚聲器所在平面。符號「L」表示較低平面,亦即仰角<0度。符號「U」表示較高平面,亦即仰角>0度,諸如30度作為3D配置中之上揚聲器。符號「T」表示頂聲道,亦即90度仰角,又名「上帝之聲」聲道。位在標記M/L/U/T中之一者後方為用於左(L)或右(R)之一標記接著為方位角。舉例言之,CH_M_L030及CH_M_R030表示習知立體聲配置之左及右聲道。各聲道之方位角及仰角指示於表1,但LFE聲道及最末空白聲道除外。
一輸入聲道組態及一輸出聲道組態可包括表1中指示之該等聲道之任一種組合。
輸入/輸出格式亦即輸入聲道組態及輸出聲道組態之範例係顯示於表2。表2中指示的輸入/輸出格式為標準格式及其標示將為熟諳技藝人士所認知。
表3顯示一規則矩陣,其中一或多個規則係與各個輸入聲道(來源聲道)相聯結。如從表3可知,各個規則界定該輸入聲道欲對映至其上的一或多個輸出聲道(目的地聲道)。此外,各個規則定義於其第3欄的增益值G。各個規則進一步定義一EQ指數,指示是否欲施用一等化濾波器, 及若是,則欲施用哪個等化濾波器(EQ指數1至4)。輸入聲道之對映至一個輸出聲道係以表3第3欄給定之增益G進行。輸入聲道之對映至2輸出聲道(指示於第2欄)係藉在二輸出聲道間施用汰選進行,其中從施用汰選法則所得的汰選增益g1及g2額外乘以個別規則給定之增益(表3第3欄)。特定規則適用頂聲道。根據第一規則,頂聲道係對映至上平面之全部輸出聲道,以ALL_U指示;及根據第二(較低優先排序)規則,頂聲道係對映至水平收聽者平面之全部輸出聲道,以ALL_M指示。
表3不包括與各個聲道相聯結的第一規則,亦即直接地對映至具有相同方向之一聲道。在存取表3顯示之規則之前,此一第一規則可藉系統/演算法檢查。如此,用於存在有一直接對映的輸入聲道,演算法無需存取表3以找出匹配規則,反而施加該直接對映規則於推衍一個係數以直接地對映該輸入聲道至該輸出聲道。於此等情況下,針對不滿足第一規則,亦即不存在有直接對映的該等聲道後文描述為有效。於替代實施例中,直接對映規則可含括於規格表中,而存取該等規格表之前未經檢查。
表4顯示用於預先界定之等化濾波器中之77濾波器排組頻帶的標準化中心頻率。表5顯示用於預先界定之等化濾波器中之等化器參數。
表6顯示於各列中被考慮為於彼此上方/下方之聲道。
在處理輸入信號之前,啟動格式轉換器,諸如音 訊信號藉一核心解碼器諸如圖2中之解碼器200的該核心解碼器遞送。於初始相期間,與輸入聲道相聯結的規則係經評估,及推衍欲施用至該等輸入聲道(亦即與輸入聲道相聯結的輸入信號)之係數。
於初始相中,該格式轉換器可針對輸入及輸出格式之給定組合而自動生成最佳化下混參數(例如下混矩陣)。可施加一演算法其針對各個輸入揚聲器,從已經設計為結合聽覺考量的一列表之規則中選出最適合的對映規則。各個規則描述從一個輸入聲道對映至一或數個輸出揚聲器聲道。輸入聲道或為對映至單一輸出聲道,或為汰選至兩個輸出聲道,或為(於「上帝之聲」聲道之情況下)分布在更多個輸出聲道。針對各個輸入聲道之最佳對映關係可取決於在期望輸出格式中可用的輸出揚聲器之該列表選擇。各個對映關係針對所考慮的該輸入聲道定義下混增益,以及潛在地也定義施用至所考慮的該輸入聲道之一等化器。具有非標準揚聲器位置之輸出配置,藉提供與一常規揚聲器配置之方位角及仰角偏差可傳訊給該系統。又復,將期望目標揚聲器位置之距離變化列入考慮。音訊信號之實際下混可在該等信號之一混成QMF子帶表示型態上進行。
饋入格式轉換器內的音訊信號可稱作輸入信號。由於格式轉換處理結果所得音訊信號可稱作輸出信號。格式轉換器之音訊輸入信號可為核心解碼器之音訊輸出信號。向量及矩陣係藉粗體符號標示。向量元件或矩陣 元件係標示以斜體變化補充以指數指示在該向量/矩陣中該向量/矩陣元件之列/欄。
格式轉換器之啟動可在藉核心解碼器遞送的音訊信號進行處理之前進行。啟動可將下列列入考慮作為輸入參數:欲處理之音訊資料之取樣率;一參數傳訊欲使用該格式轉換器處理之該音訊資料的聲道組態;一參數傳訊該期望輸出格式的聲道組態;及選擇性地,參數傳訊該等輸出揚聲器位置與一標準揚聲器配置(隨機配置功能)之偏差。該啟動可回送該輸入揚聲器組態之聲道數目;該輸出揚聲器組態之聲道數目;一下混矩陣及等化濾波器參數其被施用於格式轉換器之音訊信號處理中;及修整增益及延遲值以補償揚聲器距離。
詳言之,啟動可將下列輸入參數列入考慮:輸入參數
該輸入格式及輸出格式相對應於輸入聲道組態及輸出聲道組態。razi,A及rele,A表示傳訊揚聲器位置(方位角及仰角)與遵照該等規則之一標準揚聲器配置的偏差之一參數,其中A為聲道指數。根據標準配置該等聲道之角度係顯示於表1。
於本發明之實施例中,其中只導出一增益係數矩陣,唯一輸入參數可為format_in及format_out。取決於所具現之特徵,其它輸入參數為選擇性,其中fs可用於頻率選擇性係數之情況下,啟動一或多個等化濾波器,razi,A及rele,A可用以將揚聲器位置之微分列入考慮,及trimA及Nmaxdelay可用以將個別揚聲器距一中心收聽者位置的距離列入考慮。
於轉換器之實施例中,可證實下列情況及若不符合情況,則視為轉換器啟動為失敗,及回送錯誤。razi,A及rele,A之絕對值分別地不應超過35度及55度。任何成對揚聲器(不含LFE聲道)間之最小夾角不應小於15度。razi,A值須為藉水平揚聲器之方位角的排序不應改變。同理,高及低揚聲器的排序不應改變。rele,A值須為藉(約略)位在彼此上方/下方之揚聲器的仰角不應改變。為了證實此點,可應用下列程序:
●針對表6之各列,其含有輸出格式之2或3聲道,進行:
○藉仰角排序該等聲道,未經隨機化。
○藉仰角排序該等聲道,有考慮隨機化。
○若兩種排序不同,則回送啟動錯誤。
「隨機化」一詞表示將實際景況聲道與標準聲道間之偏差列入考慮,亦即偏差razic及relec施加至該標準輸出聲道組態。
於trimA中之揚聲器距離須為0.4米至200米。最大與最小揚聲器距離間之比須不超過4。最大計算修整延遲不應超過Nmaxdelay
若滿足前述條件,則轉換器的啟動成功。
於實施例中,該格式轉換器啟動回送下列輸出參數:輸出參數
後文描述採用如後文定義之中間參數以求清晰。須注意演算法之具現可刪除該等中間參數之介紹。
97]中間參數以對映取向方式描述下混參數,亦即呈每個對映i之參數Si、Di、Gi、Ei之集合。
無庸待言於本發明之實施例中,取決於具現哪個特性件,該轉換器將不輸出前述全部輸出參數。
用於隨機揚聲器配置,亦即含有揚聲器位在與期望的輸出格式偏移位置(聲道方向)之輸出配置,位置偏差係藉將揚聲器位置偏差角載明為輸入參數razi,A及rele,A而予傳訊。前處理係藉將razi,A及rele,A施用至標準配置之角施行。更明確言之,表1中該等聲道之方位角及仰角係藉將razi,A及rele,A加至相對應聲道修正。
Nin表示該輸入聲道(揚聲器)組態之聲道數目。此一數目可針對該給定輸入參數format_in取自表2。Nout表示該輸出聲道(揚聲器)組態之聲道數目。此一數目可針對該給定輸出參數format_out取自表2。
參數向量S、D、G、E定義輸入聲道之對映至輸出聲道。針對從一輸入聲道對映至輸出聲道具有非零下混增益之各個對映i,其定義下混增益以及等化器指數,指示哪個等化器曲線於對映i中須施加至考慮的該輸入聲道。
考慮一種情況,其中格式Format_5_1轉換成Format_2_0,將獲得下列下混矩陣(考慮用於直接對映之係數1、表2及表5、及具有IN1=CH_M_L030、IN=CH_M_R030、IN3=CH_M_000、IN4=CH_M_L110、IN5=CH_M_R110、OUT1=CH_M_L030、及OUT2=CH_M_R030):
左向量指示輸出聲道,矩陣表示下混矩陣,及右向量指示輸入聲道。
如此,該下混矩陣包括異於零的六個分錄及因此,i從1至6(任意順序只要於各個向量中使用相同順序即可)。若始於第一列,從左至右且從上至下計數該下混矩陣之分錄,則於本實施例中向量S、D、G及E將為:S=(IN1,IN3,IN4,IN2,IN3,IN5)
D=(OUT1,OUT1,OUT1,OUT2,OUT2,OUT2)
E=(0,0,0,0,0,0)
據此,於各個向量中之第i個分錄係有關於一個輸入聲道及一個輸出聲道間之第i個對映,故該等向量針對各個聲道提供一集合之資料包括涉及的輸入聲道、涉及的輸出聲道、欲施用之增益值及欲施加哪個等化器。
為了補償揚聲器距一中心收聽者位置之不同距離,Tg,A及/或Td,A可施用至各個輸出聲道。
向量S、D、G、E係依據如下演算法初始化:
-首先,對映計數器經啟動:i=1
-若輸入聲道也以輸出格式存在(例如考慮的輸入聲道為CH_M_R030及聲道CH_M_R030存在於輸出格式),則:Si=來源聲道於輸入之指數(實施例:於 Format_5_2_1聲道CH_M_R030根據表2係在第二位 置,亦即於本格式中具有指數2)
Di=相同聲道於輸出之指數
Gi=1
Ei=0
i=i+1
如此,首先處理直接對映及1之增益係數及零之等化器指數係與各個直接對映相聯結。在各個直接對映之後,i增加1,i=i+1。
針對各個輸入聲道,針對該聲道不存在有直接對映,搜尋及選擇表3之輸入欄(來源欄)中之此一聲道的第一分錄,針對該聲道存在有在輸出欄(目的地欄)之相對應列的聲道。換言之,搜尋及選擇此一聲道的第一分錄定義一或多個輸出聲道其全部皆存在於輸出聲道組態(藉format_out給定)。針對特定規則,如此表示諸如針對輸入聲道CH_T_000定義相聯結的輸入聲道係對映至具有特定仰角的全部輸出聲道,如此可表示選擇第一規則定義具有特定仰角的一或多個輸出聲道其也係存在於輸出組態。
如此,進行演算法:
-否則(亦即若該輸入聲道不存在於輸出格式)
搜尋表3來源欄中此一聲道的第一分錄,針對此存在有於目的地欄之相對應列中之該等聲道。若該輸出格式含有至少一個「CH_U_」聲道,則該ALL_U目的地須被考慮為有效(亦即存在有相關輸出聲道)。若該輸 出格式含有至少一個「CH_M_」聲道,則該ALL_M目的地須被考慮為有效(亦即存在有相關輸出聲道)。
如此,針對各個輸入聲道選擇一規則。然後如下評估該規則以推衍欲施用至該等輸入聲道之該等係數。
-若目的地欄含有ALL_U,則:針對其名稱中具有「CH_U_」的各個輸出聲道x,進行: Si=於輸入之來源聲道之指數
Di=於輸出之聲道x之指數
Gi=(增益欄之值)/開平方(「CH_U_」之聲道數目)
Ei=EQ欄之值
i=i+1
-否則若目的地欄含有ALL_M,則:針對其名稱中具有「CH_M_」的各個輸出聲道x,進行:Si=於輸入之來源聲道之指數
Di=於輸出之聲道x之指數
Gi=(增益欄之值)/開平方(「CH_M_」之聲道數目)
Ei=EQ欄之值
i=i+1
-否則若有一個聲道於該目的地欄,則:Si=於輸入之來源聲道之指數
Di=於輸出之目的地聲道之指數
Gi=增益欄之值
Ei=EQ欄之值
i=i+1
-否則(兩個聲道於該目的地欄)
Si=於輸入之來源聲道之指數
Di=於輸出之第一目的地聲道之指數
Gi=(增益欄之值)*g1
Ei=EQ欄之值
i=i+1
Si=Si-1
Di=於輸出之第二目的地聲道之指數
Gi=(增益欄之值)*g2
Ei=Ei-1
i=i+1
增益g1及g2係藉以下述方式施用切線法則幅值汰選計算:
●展開來源目的地聲道方位角為正。
●目的地聲道之方位角為α1及α2(參考表4)。
●來源聲道之方位角(汰選目標)為αsrc
‧α=(α center src ).sgn21)
具有
藉前述演算法,導出欲施加至該等輸入聲道之增益係數(Gi)。此外,決定是否欲施加等化器,及若是則欲施加哪個等化器(Ei)。
增益係數Gi可直接施用至輸入聲道或可加至可施用至輸入聲道的一下混矩陣,亦即與該等輸入聲道相聯結的該等輸入信號。
前述演算法係僅供舉例說明之用。於其它實施例中,係數可自規則或基於規則推衍,且可加至一下混矩陣而不定義前述特定向量。
等化器增益值GEQ可決定如下:GEQ係由每個頻帶k及等化器指數e之增益值組成。五個預先界定的等化器為不同峰濾波器之組合。如由表5可知,等化器GEQ,1、GEQ,2、及GEQ,5包括單一峰濾波器,等化器GEQ,3包括三個峰濾波器,及等化器GEQ,4包括兩個峰濾波器。各個等化器為一或多個峰濾波器與增益之串級: 於該處band(k)為載明於表4頻帶j之標準化中心頻率,f s 為取樣頻率,及函數peak()係用於負G 及否則
等化器之參數係載明於表5。於如上方程式1及2中,b係由band(k).fs/2給定,Q係由針對個別峰濾波器(1至n)之PQ給定,G係由針對個別峰濾波器之Pg給定,及f係由針對個別峰濾波器之Pf給定。
舉個實施例,針對具有指數4等化器之等化器增益值GEQ,4係以取自表3列中之濾波參數計算。表3列舉針對GEQ,4之峰濾波器的兩個參數集合,亦即針對n=1及n=2之參數集合。該等參數為峰頻率Pf以Hz表示,峰濾波品質因數PQ,於峰頻率施加的增益Pg(以dB表示),及施加至兩個峰濾波器級聯(針對參數針對n=1及n=2之濾波器級聯)之總增益g,以dB表示。
如此
如上陳述之等化器定義獨立地針對各個頻帶k定義零相位增益GEQ,4。各頻帶k係以其標準化中心頻率band(k)載明,於該處0<=band<=1。注意標準化中心頻率band=1相對應於未經標準化頻率f s /2,於該處f s 標示取樣頻率。因此band(k).f s /2標示頻帶k之未經標準化中心頻率,以Hz表示。
針對各個輸出聲道A於樣本中之修整延遲Td,A及針對各個輸出聲道A於樣本中之修整延遲Tg,A及(線性增益值)係以揚聲器距離表示為trimA之函數計算:
於該處 表示全部輸出聲道之最大trimA
若最大Td,A超過Nmaxdelay,則啟動失敗而回送錯誤。
可將輸出配置與一標準配置之偏差列入考慮如下。
方位角偏差razi,A(方位角偏差)係藉單純施用razi,A至如前文解說之標準配置之角度而列入考慮。如此,當將一輸入聲道汰選至2輸出聲道時,使用修正角。如此,當進行個別規則定義的汰選時,當將一個輸入聲道對映至二或更多個輸出聲道時razi,A係列入考慮。於替代實施例中,個別規則可直接定義個別增益值(亦即已經預先進行汰選)。於此等實施例中,系統可適用以基於隨機化角而重新計算增益值。
仰角偏差rele,A可於後處理中列入考慮如下。一旦計算輸出參數,其可相關於特定隨機仰角修正。唯有若非 全部rele,A皆為零才可進行本步驟。
-針對Di中的各個元件i,進行:-若具有指數Di之輸出聲道被定義為一水平聲道(亦即輸出聲道標記含有標記「_M_」),及若此一輸出聲道現為高度聲道(仰角於0...60度之範圍),及若具有指數Si之輸入聲道為一高度聲道(亦即標記含有「_U_」),則
●h=min(隨機化輸出聲道之仰角,35)/35
●定義具有新指數e之新等化器,於該處
●Ei=e
否則若具有指數Si之輸入聲道為一水平聲道(標記含有「_M_」),
●h=min(隨機化輸出聲道之仰角,35)/35
●定義具有新指數e之新等化器,於該處
●Ei=eh為一標準化仰角參數,指示因一隨機配置仰角偏差rele,A所致之標準化水平輸出聲道(「_M_」)之仰角。針對零仰角偏差,接著為h=0及有效地未應用後處理。
當將一輸入聲道(聲道標記中之「_U_」)對映至一個或數個水平輸出聲道(聲道標記中之「_M_」)時,規則 表(表3)通常施加0.85之增益。於輸出聲道因一隨機配置仰角偏差rele,A而獲得架高之情況下,針對h趨近於h=1.0,藉以因數Gcomp趨近於1/0.85而定標該等化器增益,0.85之增益被部分(0<h<1)或全部(h=1)補償。同理,針對h趨近於h=1.0,等化器定義朝向平坦EQ曲線消退
以水平輸入聲道對映至架高的一輸出聲道為例,因一隨機配置仰角偏差rele,A而該等化器係部分(0<h<1)或全部(h=1)施用。
藉此程序,於隨機化輸出聲道係高於配置輸出聲道之情況下,與1不同的增益值及因一輸入聲道之對映至一下輸出聲道所致而施加的等化器係經修正。
依據前文描述,增益補償直接施加至該等化器。於替代辦法中,下混係數Gi可經修正。針對此種替代辦法,施用增益補償之演算法將為如下:-若具有指數Di之輸出聲道被定義為一水平聲道(亦即輸出聲道標記含有標記「_M_」),及若此一輸出聲道現為高度聲道(仰角於0...60度之範圍),及若具有指數Si之輸入聲道為一高度聲道(亦即標記含有「_U_」),則
●h=min(隨機化輸出聲道之仰角,35)/35
●Gi=hGi/0.85+(1-h)Gi
●定義具有新指數e之新等化器,於該處
●Ei=e
否則若具有指數Si之輸入聲道為一水平聲道(標記含有「_M_」),
●h=min(隨機化輸出聲道之仰角,35)/35
●定義具有新指數e之新等化器,於該處
●Ei=e
舉個實例,設Di為從一輸入聲道對映至一輸出聲道針對第i輸出聲道之聲道指數。例如針對輸出格式FORMAT_5_1(參考表2),Di=3將指中置聲道CH_M_000。針對一輸出聲道Di正常為具有仰角0度的水平輸出聲道(亦即具有標記「CH_M_」的聲道)考慮rele,A=35(亦即第i對映之輸出聲道的rele,A)。於施用rele,A至輸出聲道之後(藉將rele,A加至個別標準配置角,諸如表1定義者),輸出聲道Di現在具有35度仰角。若一上輸入聲道(具有標記「CH_U_」)對映至輸出聲道Di,則從評估前述規則所得之針對此對映之參數將修正如下:標準化仰角參數係計算為h=min(35,35)/35=35/35=1.0-
如此 Gi,後處理=Gi,後處理之前/0.85。
針對根據求出的修正等化器,定義一新未用的指數e(例如E=6)。藉設定Ei=e=6,可歸屬對映規則。
如此為了輸入聲道之對映至架高(先前水平)輸 出聲道Di,增益須藉因數1/0.85定標及等化器須以具有常數增益=1.0的等化器曲線置換(亦即具有平坦頻率響應)。此乃預期結果原因在於一步聲道須對映至一有效上輸出聲道(因施用35度隨機配置仰角偏差故,正常水平輸出聲道變成一有效上輸出聲道)。
如此,於本發明之實施例中,該方法及信號處理單元係經組配以將輸出聲道與一標準配置(其中該等規則已經基於標準配置設計)之方位角及仰角之偏差列入考慮。該等偏差係藉修正個別係數之計算及/或藉重新計算/修正事先已經計算的或明確地定義於規則中的係數而列入考慮。如此,本發明之實施例可因應與標準配置偏差的不同輸出配置。
初始化輸出參數Nin、Nout、Tg,A、Td,A、GEQ可如前述推衍得。其餘初始化輸出參數MDMX、IEQ可藉將中間參數從對映取向表示型態(藉對映計數器i列舉)重排成聲道取向表示型態推衍得,定義如下:
-將MDMX初始化為NoutxNin零矩陣。
-針對各個i(i呈上升順序)進行:MDMX,A,B=Gi具有A=Di,B=Si(A、B為聲道指數)
IEQ,A=Ei具有A=Si
於該處MDMX,A,B表示於MDMX第A列及第B欄的矩陣元件及IEQ,A表示向量IEQ之第A個元件。
設計不同特定規則及規則之優先排序以傳遞較高聲音品質可從表3推衍出。實施例將給定於後文。
定義該輸入聲道之對映至與於水平收聽者平面的該輸入聲道有較低方向偏差之一或多個輸出聲道的對映之一規則的順位係高於定義該輸入聲道之對映至與於水平收聽者平面的該輸入聲道有較高方向偏差之一或多個輸出聲道的對映之一規則的順位。如此,於該輸入配置之該等揚聲器之方向被儘可能正確地再生。定義一輸入聲道之對映至與該輸入聲道具有相同仰角之一或多個輸出聲道的對映之一規則的順位係高於定義該輸入聲道之對映至與該輸入聲道之仰角具有不同仰角之一或多個輸出聲道的對映之一規則的順位。如此,考慮下述事實源自於不同仰角的信號由一使用者所差異知覺。
具有與一前中心方向不同方向之一輸入聲道相聯結的一集合之規則中之一個規則可定義該輸入聲道對映至位在與該輸入聲道之前中心方向同側上的及位在該輸入聲道之方向兩側上的兩個輸出聲道,及該集合之規則中之另一個較低順位規則定義該輸入聲道對映至位在與該輸入聲道之前中心方向同側上的單一輸出聲道。與具有90度仰角之一輸入聲道相聯結的一集合之規則中之一個規則可定義該輸入聲道對映至具有比較輸入聲道之該仰角更低的一第一仰角之全部可用輸出聲道,及該集合之規則中之另一個較低順位規則可定義該輸入聲道對映至具有比該輸入聲道更低的一第二仰角之全部可用輸出聲道。與包含一前中心方向之一輸入聲道相聯結的一集合之規則中之一個規則可定義該輸入聲道對映至二輸出聲道,一個位在該前中心 方向之左側而一個位在該前中心方向之右側。如此,可針對特定聲道設計規則以便將該等特定聲道之特定性質及/或語意學列入考慮。
與包含一後中心方向之一輸入聲道相聯結的一集合之規則中之一規則可定義該輸入聲道對映至二輸出聲道,一個位在該前中心方之之左側而一個位在該前中心方向之右側,其中該規則進一步定義若該二輸出聲道相對於該後中心方向之夾角係大於90度,則使用小於1之一增益係數。與包含一前中心方向不同方向的一輸入聲道相聯結的一集合之規則中之一規則可定義使用小於1之一增益係數於對映該輸入聲道至位在該前中心方向之與該輸入聲道之該同側上的單一輸出聲道,其中該輸出聲道相對於一前中心方向之夾角係小於該輸入聲道相對於一前中心方向之夾角。如此,一聲道可對映至位在更前方的一或多個聲道以減少該輸入聲道之不理想空間渲染的可感知性。又,可輔助減少下混中的周圍聲音量,此乃期望特徵。周圍聲音可主要存在於後聲道。
定義具有一仰角的一輸入聲道對映至具有一仰角低於該輸入聲道之該仰角的一或多個輸出聲道之一規則可使用小於1之增益係數定義。定義具有一仰角的一輸入聲道對映至具有一仰角低於該輸入聲道之該仰角的一或多個輸出聲道之一規則可應用使用一等化濾波器的頻率選擇性處理而予定義。因此,架高聲道通常以與又一或較低聲道不同方式知覺的事實可於輸入聲道之對映至輸出聲道時列 入考慮。
概略言之,所對映的輸入聲道之所得再生之知覺偏離該輸入聲道之知覺愈大,則對映至偏離輸入聲道位置之輸出聲道的輸入聲道可被衰減愈多,亦即一輸入聲道可取決於透過可用揚聲器的再生瑕疵程度而可被衰減。
藉使用等化濾波器可達成頻率選擇性處理。舉例言之,一下混矩陣之元件可以頻率相依性方式修正。舉例言之,此種修正可針對不同頻帶使用不同增益因數達成,故達成施用一等化濾波器的效果。
摘要言之,於本發明之實施例中,給定描述從輸入聲道對映至輸出聲道之一優先排序規則之集合。其可由一系統設計師在系統設計階段定義,反映專家下混知識。該集合可具現為一有序列表。針對該輸入聲道組態之各個輸入聲道,該系統依據該給定使用情況的輸入聲道組態及輸出聲道組態選擇對映規則集合中之一適當規則。各個所選規則決定從一個輸入聲道至一或數個輸出聲道之一(或多)下混係數。該系統可迭代重複通過該給定輸入聲道組態之該等輸入聲道,及藉評估針對全部輸入聲道所選用之對映規則所導出的該等下混係數編譯一下混矩陣。規則選擇將規則優先排序列入考慮,如此,當施用所導出的下混係數時最適化系統效能,例如獲得最高下混輸出品質。對映規則可考慮其並不反映在純粹數學對映演算法例如VBAP中之聽覺心理或技藝原理。對映規則可將聲道語意學列入考慮,例如針對中心聲道或左/右成對聲道施用不同處理。 對映規則藉由許可渲染中的角錯誤而減少汰選量。對映規則可蓄意地導入幻影源(例如藉VBAP渲染),即便單一相對應輸出揚聲器為可資利用亦復如此。如此實施之意圖可保有該輸入聲道組態中特有的分集。
雖然已經以裝置之脈絡描述若干面向,但顯然此等面向也表示相對應方法之描述,於該處一方塊或裝置相對應於一方法步驟或一方法步驟之一特性件。同理,以一方法步驟之脈絡描述的面向也表示一相對應裝置之一相對應方塊或項目或特性件之描述。部分或全部方法步驟可藉(或使用)硬體裝置執行,例如微處理器、可規劃電腦或電子電路。於若干實施例中,最要緊之方法步驟中之某一或多個可藉此種裝置執行。於本發明之實施例中,此處描述的方法係經處理器具現或經電腦具現。
取決於某現具現要求,本發明之實施例可於硬體或軟體具現。該具現可使用非過渡儲存媒體執行,諸如數位儲存媒體,例如軟碟、DVD、藍光、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體具有電子式可讀取控制信號儲存其上,其與一可規劃電腦系統協作(或能夠協作),使得執行個別方法。因此,數位儲存媒體可為電腦可讀取。
依據本發明之若干實施例包含具有電子式可讀取控制信號之一資料載體,該等控制信號能夠與一可規劃電腦系統協作,使得執行此處描述之方法中之一者。
一般而言,本發明之實施例可具現為具有一程式碼之電腦程式產品,當該電腦程式產品係在一電腦上跑時 該程式碼被操作用以執行此處描述之方法中之一者。該程式碼例如可儲存於一機器可讀取載體上。
其它實施例包含儲存於一機器可讀取載體上用以執行此處描述之方法中之一者之該電腦程式。
換言之,因此,本發明方法之又一實施例為具有一程式碼之電腦程式,當該電腦程式係在一電腦上跑時該程式碼用以執行此處描述之方法中之一者。
因此,本發明方法之又一實施例為一資料載體(或一數位儲存媒體、或一電腦可讀取媒體)包含紀錄於其上之用以執行此處描述之方法中之一者的該電腦程式。該資料載體、該數位儲存媒體或紀錄媒體為典型地具體有形及/或非過渡。
因此,本發明方法之又一實施例為一資料串列或一信號序列表示用以執行此處描述之方法中之一者的該電腦程式。該資料串列或該信號序列例如可經組配以透過一資料通訊連接例如透過網際網路傳送。
又一實施例包含一處理構件例如一電腦或一可規劃邏輯裝置經規劃、組配、或調適以執行此處描述之方法中之一者。
又一實施例包含一電腦其上安裝有該電腦程式以執行此處描述之方法中之一者。
依據本發明之又一實施例包含一裝置或一系統經組配以將用以執行此處描述之方法中之一者的一電腦程式傳送(例如電子式或光學式)給一接收器。該接收器例如可 為一電腦、一行動裝置、一記憶體裝置等。該裝置或系統例如可包含一檔案伺服器用以將該電腦程式傳送給該接收器。
於若干實施例中,可規劃邏輯裝置(例如可現場程式規劃閘陣列)可用以執行此處描述之方法之部分或全部功能。於若干實施例中,一可現場程式規劃閘陣列可與一微處理器協作以執行此處描述之方法中之一者。一般而言,該等方法較佳係藉任一種硬體裝置進行。
前述實施例僅用於例示本發明之原理。須瞭解此處描述之配置及細節之修正及變化將為熟諳技藝人士所顯然易知。因此意圖本發明僅由緊接之申請專利範圍各項之範圍所限而非由藉著描述及解釋此處實施例所呈示之特定細節所限。
500-508‧‧‧步驟,方塊

Claims (28)

  1. 一種用以將一輸入聲道組態之多個輸入聲道對映至一輸出聲道組態之輸出聲道之方法,該方法包含:提供與該等多個輸入聲道之各個輸入聲道相聯結的一集合之規則,其中該等規則定義該相聯結的輸入聲道與一集合之輸出聲道間之不同對映;針對該等多個輸入聲道之各個輸入聲道,存取與該輸入聲道相聯結的一規則,決定於該所存取規則中定義的該集合之輸出聲道是否存在於該輸出聲道組態,及若於該存取規則中定義的該集合之輸出聲道係存在於該輸出聲道組態,則選擇該存取規則;及依據該所選規則,將該等輸入聲道對映至該等輸出聲道。
  2. 如請求項1之方法,其包含若於該經存取之規則中定義的該集合之輸出聲道係不存在於該輸出聲道組態,則不選擇該經存取之規則,及重複存取、決定及選擇與該輸入聲道相聯結的至少另一個規則之該等步驟。
  3. 如請求項1或2中任一項之方法,其中該等規則定義欲施用至該輸入聲道之一增益係數、欲施用至該輸入聲道之一延遲係數、欲施用以將一輸入聲道對映至二或多個輸出聲道之一汰選法則、及欲施用至該輸入聲道之一頻率相依性增益中之至少一者。
  4. 如請求項1至3中任一項之方法,其中於該等規則之集合 中之該等規則係經優先排序,其中較高順位規則係以優於較低順位規則之較高優先選擇。
  5. 如請求項4之方法,其包含以一特定順序存取於該等規則集合中之該等規則直到決定於一經存取之規則中定義的該集合之輸出聲道係存在於該輸出聲道組態,使得該等規則之優先排序係由該特定順序給定。
  6. 如請求項4或5之方法,其中假定傳遞較高聲音品質之一規則係比假定傳遞較低聲音品質之一規則被更高優先排序。
  7. 如請求項4至6中任一項之方法,其中定義該輸入聲道對映至與於一水平收聽者平面中之該輸入聲道具有一較低方向偏差的一或多個輸出聲道之一規則係比定義該輸入聲道對映至與於一水平收聽者平面中之該輸入聲道具有一較高方向偏差的一或多個輸出聲道之一規則被更高優先排序。
  8. 如請求項4至7中任一項之方法,其中定義一輸入聲道對映至具有與該輸入聲道之一相同仰角的一或多個輸出聲道之一規則係比定義該輸入聲道對映至具有與該輸入聲道之該仰角不同之一仰角的一或多個輸出聲道之一規則被更高優先排序。
  9. 如請求項4至8中任一項之方法,其中於該等規則之集合中,該最高順位規則定義其具有相同方向之該輸入聲道與一輸出聲道間之直接對映。
  10. 如請求項9之方法,其包含針對各個輸入聲道,在存取 儲存與各個輸入聲道相聯結的規則之該集合中之其它規則的一記憶體之前,檢查包含與該輸入聲道相同方向的一輸出聲道是否存在於該輸出聲道組態。
  11. 如請求項4至10中任一項之方法,其中於該等規則之集合中,該最低順位規則定義該輸入聲道之對映至具有一左輸出聲道及一右輸出聲道之一立體聲輸出聲道組態的一個或兩個輸出聲道。
  12. 如請求項1至11中任一項之方法,其中與具有與一前中心方向不同方向之一輸入聲道相聯結的一集合之規則中之一個規則定義該輸入聲道對映至位在與該輸入聲道之該前中心方向同側上及位在該輸入聲道之該方向兩側上的二輸出聲道,及該集合之規則中之另一較低順位規則定義該輸入聲道對映至位在與該輸入聲道之該前中心方向同側上的一單一輸出聲道。
  13. 如請求項4至12中任一項之方法,其中與具有90度之一仰角的一輸入聲道相聯結的一集合之規則中之一個規則定義該輸入聲道對映至具有比該輸入聲道之該仰角更低的一第一仰角之全部可用輸出聲道,及該集合之規則中之另一較低順位規則定義該輸入聲道對映至具有比該第一仰角更低的一第二仰角之全部可用輸出聲道。
  14. 如請求項1至13中任一項之方法,其中與包含一前中心方向之一輸入聲道相聯結的一集合之規則中之一規則定義該輸入聲道對映至二輸出聲道,一者位在該前中心方向之該左側及一者位在該前中心方向之該右側。
  15. 如請求項1至14中任一項之方法,其中與包含一後中心方向之一輸入聲道相聯結的一集合之規則中之一規則定義該輸入聲道對映至二輸出聲道,一者位在該前中心方向之該左側及一者位在該前中心方向之該右側,其中該規則進一步定義若該等二輸出聲道相對於該後中心方向之一角係大於90度則使用小於1之一增益係數。
  16. 如請求項1至15中任一項之方法,其中與具有與一前中心方向不同之一方向的一輸入聲道相聯結的一集合之規則中之一規則定義使用小於1之一增益係數於將該輸入聲道對映至位在該輸入聲道之該前中心方向的該同側上之一單一輸出聲道中,其中該輸出聲道相對於一前中心方向之一角係小於該輸入聲道相對於該前中心方向之一角。
  17. 如請求項1至16中任一項之方法,其中定義將具有一仰角之一輸入聲道對映至具有一仰角低於該輸入聲道之該仰角的一或多個輸出聲道之一規則定義使用小於1之一增益係數。
  18. 如請求項1至17中任一項之方法,其中定義將具有一仰角之一輸入聲道對映至具有一仰角低於該輸入聲道之該仰角的一或多個輸出聲道之一規則定義施用一頻率選擇處理。
  19. 如請求項1至18中任一項之方法,其包含接收與該等輸入聲道相聯結的輸入音訊信號,其中將該等輸入聲道對映至該等輸出聲道包含評估該等所選規則以推衍欲施 用至該等輸入音訊信號之係數及施用該等係數至該等輸入音訊信號以便產生與該等輸出聲道相聯結的輸出音訊信號,及輸出該等輸出音訊信號給與該等輸出聲道相聯結的揚聲器。
  20. 如請求項19之方法,其包含產生一下混矩陣及將該下混矩陣施用至該輸入音訊信號。
  21. 如請求項19或20之方法,其包含施加修整延遲及修整增益給該等輸出音訊信號以便減少或補償於該輸入聲道組態及該輸出聲道組態中該等個別揚聲器與該中心收聽者位置間之距離間之差。
  22. 如請求項19至21中任一項之方法,其包含當評估一規則定義一輸入聲道之對映至包括一特定輸出聲道之一個或兩個輸出聲道時,將一實際輸出組態之一輸出聲道之一水平角與於該集合之規則中定義的該特定輸出聲道之一水平角間之一偏差列入考慮,其中該等水平角表示於一水平收聽者平面內部相對於一前中心方向之夾角。
  23. 如請求項19至22中任一項之方法,其包含修正一增益係數,該增益係數係於界定將具有一仰角之一輸入聲道對映至具有比該輸入聲道之該仰角更低的仰角之一或多個輸出聲道之一規則中定義,以將一實際輸出組態之一輸出聲道之一仰角與該規則中定義的一個輸出聲道之一仰角間之一偏差列入考慮。
  24. 如請求項19至23中任一項之方法,其包含修正於一規則中定義的一頻率選擇性處理,該規則定義將具有一仰角 之一輸入聲道對映至具有仰角低於該輸入聲道之該仰角的一或多個輸出聲道,該修正將一實際輸出組態之一輸出聲道之一仰角與該規則中定義的一個輸出聲道之仰角間之一偏差列入考慮。
  25. 一種電腦程式,其當在一電腦或一處理器上跑時用以執行如請求項1至24中任一項之方法。
  26. 一種信號處理單元,其包含一處理器經組配以或規劃以執行如請求項1至25中任一項之方法。
  27. 如請求項26之信號處理單元,其進一步包含:一輸入信號介面用以接收與該輸入聲道組態之該等輸入聲道相聯結的輸入信號,及一輸出信號介面用以輸出與該輸出聲道組態相聯結的輸出音訊信號。
  28. 一種音訊解碼器,其包含如請求項26或27之信號處理單元。
TW103124927A 2013-07-22 2014-07-21 Method and signal processing unit for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration TWI562652B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP13177360 2013-07-22
EP13189249.9A EP2830332A3 (en) 2013-07-22 2013-10-18 Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration

Publications (2)

Publication Number Publication Date
TW201519663A true TW201519663A (zh) 2015-05-16
TWI562652B TWI562652B (en) 2016-12-11

Family

ID=48874133

Family Applications (2)

Application Number Title Priority Date Filing Date
TW103124924A TWI532391B (zh) 2013-07-22 2014-07-21 用以將第一及第二輸入通道映射到至少一輸出通道之裝置及方法
TW103124927A TWI562652B (en) 2013-07-22 2014-07-21 Method and signal processing unit for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW103124924A TWI532391B (zh) 2013-07-22 2014-07-21 用以將第一及第二輸入通道映射到至少一輸出通道之裝置及方法

Country Status (20)

Country Link
US (6) US9936327B2 (zh)
EP (8) EP2830335A3 (zh)
JP (2) JP6130599B2 (zh)
KR (3) KR101803214B1 (zh)
CN (4) CN105556992B (zh)
AR (4) AR096996A1 (zh)
AU (3) AU2014295309B2 (zh)
BR (2) BR112016000999B1 (zh)
CA (3) CA2968646C (zh)
ES (5) ES2645674T3 (zh)
HK (1) HK1248439B (zh)
MX (2) MX355588B (zh)
MY (1) MY183635A (zh)
PL (5) PL3025518T3 (zh)
PT (5) PT3258710T (zh)
RU (3) RU2635903C2 (zh)
SG (3) SG11201600402PA (zh)
TW (2) TWI532391B (zh)
WO (2) WO2015010961A2 (zh)
ZA (1) ZA201601013B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI659413B (zh) * 2015-12-08 2019-05-11 瑞典商安訊士有限公司 用於在音訊區域中控制聲音影像之方法、裝置與系統
TWI742689B (zh) * 2020-05-22 2021-10-11 宏正自動科技股份有限公司 影音處理裝置、影音播放系統及其影音處理方法

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
KR102268836B1 (ko) * 2013-10-09 2021-06-25 소니그룹주식회사 부호화 장치 및 방법, 복호 장치 및 방법, 그리고 프로그램
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
CN114005454A (zh) 2015-06-17 2022-02-01 三星电子株式会社 实现低复杂度格式转换的内部声道处理方法和装置
US11128978B2 (en) * 2015-11-20 2021-09-21 Dolby Laboratories Licensing Corporation Rendering of immersive audio content
KR102358283B1 (ko) * 2016-05-06 2022-02-04 디티에스, 인코포레이티드 몰입형 오디오 재생 시스템
GB201609089D0 (en) * 2016-05-24 2016-07-06 Smyth Stephen M F Improving the sound quality of virtualisation
CN106604199B (zh) * 2016-12-23 2018-09-18 湖南国科微电子股份有限公司 一种数字音频信号的矩阵处理方法及装置
EP3583772B1 (en) * 2017-02-02 2021-10-06 Bose Corporation Conference room audio setup
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
GB2561844A (en) * 2017-04-24 2018-10-31 Nokia Technologies Oy Spatial audio processing
MX2019013056A (es) * 2017-05-03 2020-02-07 Fraunhofer Ges Forschung Procesador de audio, sistema, metodo y programa de computadora para reproducir audio.
CN109151704B (zh) * 2017-06-15 2020-05-19 宏达国际电子股份有限公司 音讯处理方法、音频定位系统以及非暂态电脑可读取媒体
US10257623B2 (en) * 2017-07-04 2019-04-09 Oticon A/S Hearing assistance system, system signal processing unit and method for generating an enhanced electric audio signal
JP6988904B2 (ja) * 2017-09-28 2022-01-05 株式会社ソシオネクスト 音響信号処理装置および音響信号処理方法
KR102511818B1 (ko) * 2017-10-18 2023-03-17 디티에스, 인코포레이티드 3d 오디오 가상화를 위한 오디오 신호 사전 설정
US11540075B2 (en) * 2018-04-10 2022-12-27 Gaudio Lab, Inc. Method and device for processing audio signal, using metadata
CN109905338B (zh) * 2019-01-25 2021-10-19 晶晨半导体(上海)股份有限公司 一种串行数据接收器的多级均衡器增益的控制方法
US11568889B2 (en) 2019-07-22 2023-01-31 Rkmag Corporation Magnetic processing unit
JP2021048500A (ja) * 2019-09-19 2021-03-25 ソニー株式会社 信号処理装置、信号処理方法および信号処理システム
KR102283964B1 (ko) * 2019-12-17 2021-07-30 주식회사 라온에이엔씨 인터콤시스템 통신명료도 향상을 위한 다채널다객체 음원 처리 장치
GB2594265A (en) * 2020-04-20 2021-10-27 Nokia Technologies Oy Apparatus, methods and computer programs for enabling rendering of spatial audio signals
CN112135226B (zh) * 2020-08-11 2022-06-10 广东声音科技有限公司 Y轴音频再生方法以及y轴音频再生系统
RU207301U1 (ru) * 2021-04-14 2021-10-21 Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный институт кино и телевидения" (СПбГИКиТ) Усилительно-преобразовательное устройство
US20220386062A1 (en) * 2021-05-28 2022-12-01 Algoriddim Gmbh Stereophonic audio rearrangement based on decomposed tracks
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering
CN114866948A (zh) * 2022-04-26 2022-08-05 北京奇艺世纪科技有限公司 一种音频处理方法、装置、电子设备和可读存储介质
KR102671956B1 (ko) * 2022-12-06 2024-06-05 주식회사 라온에이엔씨 인터콤용 실감음향 오디오출력장치

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4308423A (en) 1980-03-12 1981-12-29 Cohen Joel M Stereo image separation and perimeter enhancement
US4748669A (en) * 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
JPS6460200A (en) * 1987-08-31 1989-03-07 Yamaha Corp Stereoscopic signal processing circuit
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
JPH04281700A (ja) * 1991-03-08 1992-10-07 Yamaha Corp 多チャンネル再生装置
JP3146687B2 (ja) 1992-10-20 2001-03-19 株式会社神戸製鋼所 高耐食性表面改質TiまたはTi基合金部材
JPH089499B2 (ja) 1992-11-24 1996-01-31 東京窯業株式会社 焼成マグネシア・ドロマイトれんが
JP2944424B2 (ja) * 1994-06-16 1999-09-06 三洋電機株式会社 音響再生回路
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6421446B1 (en) 1996-09-25 2002-07-16 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
JP4304401B2 (ja) 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
TW533746B (en) * 2001-02-23 2003-05-21 Formosa Ind Computing Inc Surrounding sound effect system with automatic detection and multiple channels
ES2271654T3 (es) * 2002-08-07 2007-04-16 Dolby Laboratories Licensing Corporation Conversion espacial de canales de audio.
WO2004047489A1 (en) * 2002-11-20 2004-06-03 Koninklijke Philips Electronics N.V. Audio based data representation apparatus and method
JP3785154B2 (ja) * 2003-04-17 2006-06-14 パイオニア株式会社 情報記録装置、情報再生装置及び情報記録媒体
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US8046217B2 (en) 2004-08-27 2011-10-25 Panasonic Corporation Geometric calculation of absolute phases for parametric stereo decoding
CN101010726A (zh) 2004-08-27 2007-08-01 松下电器产业株式会社 音频解码器、方法以及程序
JP4369957B2 (ja) * 2005-02-01 2009-11-25 パナソニック株式会社 再生装置
US7991272B2 (en) * 2005-07-11 2011-08-02 Lg Electronics Inc. Apparatus and method of processing an audio signal
KR100619082B1 (ko) 2005-07-20 2006-09-05 삼성전자주식회사 와이드 모노 사운드 재생 방법 및 시스템
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20070080485A1 (en) 2005-10-07 2007-04-12 Kerscher Christopher S Film and methods of making film
TWI469133B (zh) 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
TWI342718B (en) 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
US8050434B1 (en) * 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
RU2406165C2 (ru) 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
AU2008215232B2 (en) * 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
TWM346237U (en) * 2008-07-03 2008-12-01 Cotron Corp Digital decoder box with multiple audio source detection function
US8483395B2 (en) 2007-05-04 2013-07-09 Electronics And Telecommunications Research Institute Sound field reproduction apparatus and method for reproducing reflections
US20080298610A1 (en) * 2007-05-30 2008-12-04 Nokia Corporation Parameter Space Re-Panning for Spatial Audio
JP2009077379A (ja) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd 立体音響再生装置、立体音響再生方法及びコンピュータプログラム
CN101889307B (zh) * 2007-10-04 2013-01-23 创新科技有限公司 相位-幅度3d立体声编码器和解码器
JP2009100144A (ja) * 2007-10-16 2009-05-07 Panasonic Corp 音場制御装置、音場制御方法およびプログラム
EP2258120B1 (en) * 2008-03-07 2019-08-07 Sennheiser Electronic GmbH & Co. KG Methods and devices for reproducing surround audio signals via headphones
US8306233B2 (en) * 2008-06-17 2012-11-06 Nokia Corporation Transmission of audio signals
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
CA2820199C (en) * 2008-07-31 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Signal generation for binaural signals
EP2398257B1 (en) * 2008-12-18 2017-05-10 Dolby Laboratories Licensing Corporation Audio channel spatial translation
EP2214161A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
JP4788790B2 (ja) * 2009-02-27 2011-10-05 ソニー株式会社 コンテンツ再生装置、コンテンツ再生方法、プログラム、及びコンテンツ再生システム
AU2013206557B2 (en) 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
WO2010115850A1 (en) 2009-04-08 2010-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
US8699849B2 (en) * 2009-04-14 2014-04-15 Strubwerks Llc Systems, methods, and apparatus for recording multi-dimensional audio
KR20100121299A (ko) 2009-05-08 2010-11-17 주식회사 비에스이 다기능 마이크로 스피커
US8848952B2 (en) * 2009-05-11 2014-09-30 Panasonic Corporation Audio reproduction apparatus
SG177277A1 (en) 2009-06-24 2012-02-28 Fraunhofer Ges Forschung Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
EP2326108B1 (en) 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
WO2011072729A1 (en) 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
KR101673232B1 (ko) 2010-03-11 2016-11-07 삼성전자주식회사 수직 방향 가상 채널을 생성하는 장치 및 그 방법
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
CN103210668B (zh) * 2010-09-06 2016-05-04 杜比国际公司 用于多通道音频再生的向上混合方法及系统
US8903525B2 (en) * 2010-09-28 2014-12-02 Sony Corporation Sound processing device, sound data selecting method and sound data selecting program
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
KR20120038891A (ko) 2010-10-14 2012-04-24 삼성전자주식회사 오디오 시스템 및 그를 이용한 오디오 신호들의 다운 믹싱 방법
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
US9154896B2 (en) 2010-12-22 2015-10-06 Genaudio, Inc. Audio spatialization and environment simulation
EP2673956B1 (en) * 2011-02-10 2019-04-24 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
WO2012122035A2 (en) 2011-03-04 2012-09-13 Third Millennium Metals, Llc Aluminum-carbon compositions
WO2012140525A1 (en) * 2011-04-12 2012-10-18 International Business Machines Corporation Translating user interface sounds into 3d audio space
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
TWM416815U (en) * 2011-07-13 2011-11-21 Elitegroup Computer Sys Co Ltd Output/input module for switching audio source and audiovisual playback device thereof
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
TWI479905B (zh) * 2012-01-12 2015-04-01 Univ Nat Central Multi-channel down mixing device
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
KR101915258B1 (ko) * 2012-04-13 2018-11-05 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
KR101676634B1 (ko) * 2012-08-31 2016-11-16 돌비 레버러토리즈 라이쎈싱 코오포레이션 오브젝트―기반 오디오를 위한 반사된 사운드 렌더링
PL2896221T3 (pl) * 2012-09-12 2017-04-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do i sposób zapewniania rozszerzonych możliwości kierowanego downmixu dla 3D audio
KR101407192B1 (ko) * 2012-09-28 2014-06-16 주식회사 팬택 사운드 출력을 제어하는 휴대 단말 및 사운드 출력 제어 방법
US8638959B1 (en) 2012-10-08 2014-01-28 Loring C. Hall Reduced acoustic signature loudspeaker (RSL)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI659413B (zh) * 2015-12-08 2019-05-11 瑞典商安訊士有限公司 用於在音訊區域中控制聲音影像之方法、裝置與系統
TWI742689B (zh) * 2020-05-22 2021-10-11 宏正自動科技股份有限公司 影音處理裝置、影音播放系統及其影音處理方法

Also Published As

Publication number Publication date
KR101803214B1 (ko) 2017-11-29
CA2918843C (en) 2019-12-03
ES2729308T3 (es) 2019-10-31
EP3518563B1 (en) 2022-05-11
KR101858479B1 (ko) 2018-05-16
PL3133840T3 (pl) 2019-01-31
CN107040861A (zh) 2017-08-11
SG11201600475VA (en) 2016-02-26
ZA201601013B (en) 2017-09-27
EP3025518B1 (en) 2017-09-13
EP2830332A3 (en) 2015-03-11
KR101810342B1 (ko) 2018-01-18
EP3133840B1 (en) 2018-07-04
US20180192225A1 (en) 2018-07-05
AU2014295310B2 (en) 2017-07-13
EP3025519A2 (en) 2016-06-01
JP6227138B2 (ja) 2017-11-08
CA2918811C (en) 2018-06-26
AU2014295309A1 (en) 2016-02-11
KR20160061977A (ko) 2016-06-01
RU2672386C1 (ru) 2018-11-14
US11877141B2 (en) 2024-01-16
JP2016527806A (ja) 2016-09-08
CA2918811A1 (en) 2015-01-29
EP3025518A2 (en) 2016-06-01
AU2017204282A1 (en) 2017-07-13
PT3258710T (pt) 2019-06-25
PL3025519T3 (pl) 2018-02-28
SG11201600402PA (en) 2016-02-26
CN105556991B (zh) 2017-07-11
AR109897A2 (es) 2019-02-06
US11272309B2 (en) 2022-03-08
MY183635A (en) 2021-03-04
US10798512B2 (en) 2020-10-06
EP3258710B1 (en) 2019-03-20
WO2015010962A3 (en) 2015-03-26
EP4061020A1 (en) 2022-09-21
BR112016000999A2 (zh) 2017-07-25
US20160142853A1 (en) 2016-05-19
ES2649725T3 (es) 2018-01-15
ES2688387T3 (es) 2018-11-02
KR20170141266A (ko) 2017-12-22
RU2016105648A (ru) 2017-08-29
US9936327B2 (en) 2018-04-03
US20210037334A1 (en) 2021-02-04
US20190075419A1 (en) 2019-03-07
WO2015010962A2 (en) 2015-01-29
CN105556991A (zh) 2016-05-04
RU2635903C2 (ru) 2017-11-16
BR112016000999B1 (pt) 2022-03-15
TWI562652B (en) 2016-12-11
RU2016105608A (ru) 2017-08-28
EP2830332A2 (en) 2015-01-28
JP6130599B2 (ja) 2017-05-17
TW201513686A (zh) 2015-04-01
US20160134989A1 (en) 2016-05-12
US20200396557A1 (en) 2020-12-17
JP2016527805A (ja) 2016-09-08
ES2925205T3 (es) 2022-10-14
EP3025519B1 (en) 2017-08-23
RU2640647C2 (ru) 2018-01-10
CN106804023A (zh) 2017-06-06
SG10201605327YA (en) 2016-08-30
PT3025519T (pt) 2017-11-21
PL3518563T3 (pl) 2022-09-19
WO2015010961A2 (en) 2015-01-29
AU2014295310A1 (en) 2016-02-11
CA2918843A1 (en) 2015-01-29
CA2968646A1 (en) 2015-01-29
EP3133840A1 (en) 2017-02-22
PL3025518T3 (pl) 2018-03-30
KR20160034962A (ko) 2016-03-30
EP3518563A2 (en) 2019-07-31
MX355273B (es) 2018-04-13
AR097004A1 (es) 2016-02-10
CA2968646C (en) 2019-08-20
AU2014295309B2 (en) 2016-10-27
ES2645674T3 (es) 2017-12-07
US10154362B2 (en) 2018-12-11
BR112016000990B1 (pt) 2022-04-05
AR116606A2 (es) 2021-05-26
TWI532391B (zh) 2016-05-01
WO2015010961A3 (en) 2015-03-26
AU2017204282B2 (en) 2018-04-26
US10701507B2 (en) 2020-06-30
MX2016000911A (es) 2016-05-05
EP2830335A3 (en) 2015-02-25
PT3133840T (pt) 2018-10-18
MX2016000905A (es) 2016-04-28
EP2830335A2 (en) 2015-01-28
CN107040861B (zh) 2019-02-05
AR096996A1 (es) 2016-02-10
PL3258710T3 (pl) 2019-09-30
PT3025518T (pt) 2017-12-18
HK1248439B (zh) 2020-04-09
CN105556992A (zh) 2016-05-04
CN105556992B (zh) 2018-07-20
BR112016000990A2 (zh) 2017-07-25
MX355588B (es) 2018-04-24
EP3258710A1 (en) 2017-12-20
EP3518563A3 (en) 2019-08-14
CN106804023B (zh) 2019-02-05
PT3518563T (pt) 2022-08-16

Similar Documents

Publication Publication Date Title
US11877141B2 (en) Method and signal processing unit for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
RU2635884C2 (ru) Устройство и способ для предоставления улучшенных характеристик направленного понижающего микширования для трехмерного аудио