TWI630829B - 一種高階保真立體音響格式化3d聲訊響度位準之調節方法及裝置 - Google Patents
一種高階保真立體音響格式化3d聲訊響度位準之調節方法及裝置 Download PDFInfo
- Publication number
- TWI630829B TWI630829B TW103100879A TW103100879A TWI630829B TW I630829 B TWI630829 B TW I630829B TW 103100879 A TW103100879 A TW 103100879A TW 103100879 A TW103100879 A TW 103100879A TW I630829 B TWI630829 B TW I630829B
- Authority
- TW
- Taiwan
- Prior art keywords
- hoa
- loudness
- signal
- energy
- matrix
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/005—Tone control or bandwidth control in amplifiers of digital signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本發明係關於高階保真立體音響(HOA)內容響度位準調節。HOA聲訊響度位準在傳送側之調節方法,包括步驟為,只測量HOA聲訊的W通道之響度,按照所測得W通道之響度,對HOA訊號之全部通道,勻化HOA主增益。
Description
本發明係關於高階保真立體音響(HOA;Higher-Order Ambisonics)內容之響度位準調節。具體而言,係關於HOA響度位準之測量方法和HOA響度位準之測量裝置。
此段在向讀者引介技術諸面向,與本發明諸要旨相關,見下述和/或所請求。於此論述相信有助於向讀者提供背景資訊,便於更佳瞭解本發明諸要旨。誠然,須知此等陳述以此觀點閱讀,而非認可先前技術。
聲場訊號,諸如保真立體音響(Ambisonics),帶有聲場之表示法。保真立體音響格式是根據聲場之球諧函數分解。雖然基本保真立體音響格式或B-格式使用零或一階之球諧函數,但所謂高階保真立體音響(HOA)也是使用至少第2階之進一步球諧函數。意即HOA訊號包括
不同階N之不同部份,諸如零階訊號(W通道,N=0)、一階(N=1)之一或以上訊號、二階(N=2)之一或以上訊號等。需要解碼過程,才可得個別揚聲器訊號。為合成聲訊場景,需要指涉空間揚聲器配置之泛移函數,才能獲得指定聲源之空間局部化。
在解碼器側要進行之一項課題是,設置重播位準。如先前技術(註1)和第1圖所示,設定各揚聲器饋送之放大器增益G1,使具有-18dBFSrms之數位全帶粉紅雜訊,造成聲壓位準(SPL)78±5dBA。在第1圖中,使用粉紅雜訊測試訊號,個別對各揚聲器,藉在放大器12內調節揚聲器放大率G1,位準調節各揚聲器13之聲壓位準。數位粉紅雜訊測試訊號在D/A變換器11內變換類比訊號。在混合和展示現場之SPL位準調節,以及在混合室內之內容響度位準調節,可在節目或項目間交換時,得以感受到不變的響度。
內容響度位準校正
在混合設施和展示現場之重播位準,是以此方式設置,須能在項目或節目之間交換,不需進一步位準調節。對通道基礎內容言,若內容在混合側調諧到悅耳響度位準,即可簡便達成。對悅耳聽覺位準之指涉,可為全項本身或錨訊之響度。
使用全項本身參照,可用於「短型內容」,如果內容要做為檔案儲存。除利用聽覺調節外,按照EBU R128(註2)以響度單位全標度(LUFS;Loudness Units
Full Scale)測量響度,可用於內容之響度調節。LUFS之在ITU-R BS.1770(註3)的另一名稱是「相對於全標度之K加權響度」(1LUFS=1LKFS)。可惜在(註2)內之解決方案只能支持內容供設置至5通道周圍。22通道檔案之響度測量(全部22通道均以同等通道權值1為因數),可與所感受響度相關,惟尚無徹底表列測試之證據或證明。當使用錨訊,諸如對話,做為參照時,選用位準與此有關。如此可用於「長型內容」,諸如影片配音、現場記錄和廣播。延伸悅耳聽覺位準之另外要求是,於此所講話語之理解性。
除利用聽覺調節外,內容亦相對於響度測量常態化,諸如ATSC A/85(註4)所界定。內容之第一部份識別為錨部份。再計算(註3)內界定之量度,或決定此等訊號和到達目標響度之增益因數。增益因數用來標度完整項。可惜所支持通道最多數量也限於5。
ITU-R BS.1770(註3)之第2圖顯示EBU R128(註2)和ATSC A/85(註4)內所用響度之量度。(註2)擬議把全部內容項之測得響度,增益調節至-23dBLKFS。在(註4)內,只測量錨訊響度,而內容經增益調節,使錨部份到達目標響度-24dBLKFS。諸輸入訊號L,R,C,Ls,Rs在K過濾器21內過濾,各通道之功率在功率均化器22內平均化,各通道經加權33,把加權訊號加到24,得測量響度值25。
由於藝術考量,內容必須在混合播音室內調
節。此係利用個別聽覺為之。可用自動響度量度做為支持,並顯示未超出特定響度。
對於HOA和聲訊客體(AO)基礎內容,還有必須混合至不同數量和不同位置的揚聲器之通道基礎內容,必須顧及描繪。描繪器必須符合特別特徵之需要,而此等描繪器必須在混合播音室以及消費者的展示現場使用。
鑑於上述,待解決之一問題是,解碼聲訊資料重播,應以同等響度感受,尤其是當不同聲訊項間之交換,或描繪於不同揚聲器設置時。本發明至少要解決此問題。
原則上,本發明包括只測量聲訊訊號W通道之響度(即聲場訊號之第0階部份訊號),並按照W通道所測得響度,把全部訊號通道之主增益勻化(即調節其位準)。
按照本發明一具體例,HOA聲訊響度位準之調節方法,包括步驟為,測量HOA聲訊W通道響度,並按照測得W通道響度,對HOA訊號之全部係數通道,把HOA主增益勻化,以獲得所需響度位準。
又,在本發明一具體例中,HOA響度位準調節裝置包括:HOA響度測量單位、測量HOA訊號的W通道響度,和HOA主增益單位,按照從HOA響度測量單位接收的W通道測得響度,調整HOA訊號的全部係數通道
之增益。
好處是,可在傳輸側,即在傳送和儲存HOA格式化聲訊之前,進行測量W通道響度和勻化HOA主增益。本發明進一步之有益具體例,載於申請專利範圍附屬項、以下說明和附圖。
31‧‧‧描繪器
32‧‧‧D/A變換器
33‧‧‧放大器
34‧‧‧揚聲器
b‧‧‧輸入向量
w‧‧‧揚聲器饋送
G1‧‧‧放大器增益
80,90‧‧‧高階保真立體音響系統
81,91‧‧‧微音器
82,92‧‧‧HOA編碼器
83,93‧‧‧HOA響度計
83m,93m‧‧‧監聽器
q83‧‧‧暫時短期響度測量
83x,93x‧‧‧適應/選擇單位
84,94‧‧‧HOA主增益單位
85,95‧‧‧HOA響度保存描繪器
86,96‧‧‧傳輸或儲存
87‧‧‧HOA響度保存描繪器
88,98‧‧‧揚聲器
99‧‧‧通道基礎描繪器
第1圖表示使用粉紅雜訊測試訊號於位準調節各揚聲器聲壓位準之已知解決方案;第2圖為已知系統所用ITU-R BS.1770響度測量;第3圖表示本發明一具體例把內容描繪於特定揚聲器設置之結構;第4圖為能量保存描繪矩陣實施例之設置和能量分佈;第5圖為描繪於描繪階N=1-6的22.0通道設置之3測量項目雙耳響度值;第6圖按照本發明描繪於五個不同揚聲器設置之測量項目雙耳響度值;第7圖為HOA W通道訊號響度值與描繪後平均響度之比較;第8圖表示本發明可用於例如HOA現場廣播之系統;第9圖表示通道基礎傳輸系統。
茲參照附圖說明本發明具體例。
第3圖表示聲訊回放裝置或其部份,其中內容可描繪在任何特定揚聲器設置上。內容格式可為高階保真立體音響(HOA;Higher-Order Ambisonies)、聲訊客體(AO;Audio Object)或通道基礎(則描繪於不同設置)。揚聲器饋送w之重播,應以同等響度感受,尤其是當項目之間交換或描繪於不同揚聲器設置。輸入向量b記載在描繪單一時間樣本之前,訊號集合之單一時間樣本。向量w記載在描繪器31內描繪單一時間樣本之後,揚聲器饋送集合之單一時間樣本。描繪器31之特性需在製作和消費側一致,或至少需在製作側獲悉。描繪後,揚聲器饋送w在D/A變換器32內,由數位變換成類比,在放大器33內放大,再饋送至揚聲器34。
以下推演所需描繪特性,以全部三個內容格式(HOA、AO、通道基礎)開始,再詳述HOA。須知HOA訊號包括不同階N的不同部份訊號,諸如零階(W通道,N=0)訊號、一階(N=1)之一或以上訊號、二階(N=2)之一或以上訊號等。
訊號能量和感受響度
為簡化理論分析,將集中在τ時間樣本區塊的訊號w(第3圖)能量,其界定如下(詳後述):
其中W是L揚聲器通道和τ樣本的矩陣,Wl,i是矩陣元件,l指揚聲器指數,i指樣本指數。能量Ew是對超過200Hz的頻率,賦予此等錨訊號的感受響度之充分估計,如(註5)所載。因為K過濾器壓抑200Hz以下之頻率(註2),Ew與響度量度大約呈比例。在下表1列出響度量度和能量量度之直接比較。明顯看出響度位準和HOA W通道(見「HOA(W)」欄)很接近(實質上等於)所描繪訊號(見「描繪」欄)和雙耳訊號(見「雙耳」欄)之響度位準和訊號能量。數值例如參照22.0設置(NHK),即有22種揚聲器和第4階HOA訊號(L=22,N=4)。
描繪器要件
使用下述規格:不失一般原則(即不是先解條件),假設DC自由測試訊號x(t)。令A為此訊號之RMS值,而EA=A2為其能量。測試訊號為來自方向Ω=
(θ,Φ)T之單一原始訊號,θ係高度,而Φ係方位角。能量考量應用於最佳聽覺區域,所謂美妙區。
測試訊號可表示為通道基礎訊號、AO或HOA訊號。下表代表此等表示法,其中b是抽象輸入向量,描繪後之通道基礎表示法以向量w表示,描繪後之能量為EW,而描繪後的同等能量(響度)為EA=EW。令D為概括描繪矩陣:w=Db (2)
在表2內,對寫碼成AO(頂排)、HOA訊號(中排)或通道基礎表示法(底排)之方向性測試訊號,推衍能量保存要件EA=EW。向量b是描繪前之寫碼輸入。向量w是描繪後訊號(D/A前之揚聲器訊號)。EW是描繪後能量。EA=A2是測試訊號x(t)之能量,而ti是時間樣本指數。下述EW是為HOA情況推衍為例。
關於AO描繪,為AO考慮導致公知要件,即平方描繪權值cw合計等於1:
此要件亦可應用於獨立AO之重疊,但對於相關AO,要應用通道基礎考量。
描繪通道基礎內容之要件見下式:1=c b T D T Dc b (4)
其中向量 c b 含內容創造所用之泛移權值,而矩陣D是概括描繪矩陣(亦稱解碼矩陣)。
例如要考慮二種內容:
1.原有內容已使用獨立AO泛移加以混合,且平方泛移權值合計等於1。描繪要件即成為 D T D=I(恒等矩陣尺寸
Lb×Lb)。為描繪矩陣所得要件見下述,而本發明解決方案可用於此類內容。
2.對於微音器記錄和混合內容,泛移權值性質不明,往往在混合於不同揚聲器設置時,未能預估所描繪訊號之能量。因此,一般在停止混合和再描繪後,不可能預估,本發明不能應用。於此,似乎只能應用不同的措施:分離雙向性和非方向性組份,以除去通道間之任何相關性,並為雙向內容使用客體相關描繪方法。再添加外圍混合,其方式為保存導向原有之非方向性能量化。傳統方法已用來在混合播音室內創造新的藝術性混合。
對能量保存HOA描繪器而言,HOA描繪要件為:1=y T D T Dy (5)
其中HOA基礎內容中,任何訊號以平面波之重疊表示。平面波訊b=y x(ti)以編碼於HOA,其中y是編碼向量,由方向Ω之球諧函數(SH)組成。向量b和y由(N+1)2元件組成,其中N指HOA階。由於SH之正交性能,向量乘積yTy=(N+1)2(N3D常態化SH)。
要件DTD=I如(註5)所述,其中I=(N+1)2×(N+1)2。此等「能量保存」解碼矩陣之構建程序,係根據單數值分解(SVD)。在(註5)內,能量保存
界定為。
描繪矩陣Dn符合能量保存要件之導衍步驟如下:
1.導衍能量保存描繪矩陣De,只要揚聲器L數量多於或至少等於HOA係數(N+1)2之數量,多少揚聲器位置均可。
2.令能量保存描繪矩陣獨立於HOA階。由於構成
De,使,而要件導致以下式因數標度:
對於實際HOA描繪器構造,適用下述。實務上,揚聲器之定位往往不是最適當,而L<(N+1)2。然後,描繪矩陣設計只能接近理論。在揚聲器低密度區域,偏差常常最大,若提高HOA階,則更大。實施例見第4圖。優良之描繪矩陣設計之特徵為,能量離開揚聲器低密度區即減弱,即從該方向衝擊的聲音,應是感受不到音響。
第4圖表示真實世界的能量保存描繪矩陣DHOA實施例。在頂排有不同HOA階之各種揚聲器設置,底排是各方向性能量保存特徵。具有等間隔方向取樣球體之6724平面波,係HOA編碼和描繪至22或12通道設置。方向性能量保存以灰級表示,而不同之設置及其最小值和最大值如下:圖4a)表示22_NHK_45設置具有HOA階N=4:[-0,2dB;0,0dB]
圖4b)表示22_NHK_45設置具有HOA階N=6:[-1,2dB;0,1dB]
圖4c)表示12_SwissAudec_110設置具有HOA階N=
3:[-1,1dB;0,2dB]
可見對於N=4之22通道設置,訊號能量相當均勻分佈,故只發生0.2dB偏差。對N=6之22通道設置和N=3之12通道設置,訊號能量仍然相當均勻分佈,但偏差已1.3dB(即使在無揚聲器之方向)。訊號能量之平均分佈對能量保存描繪有益。
因為只有在揚聲器跨越圍繞聽覺位置之完整凸殼,能量才可能保存,則構造描繪步驟變成:
1.構造大約能量保存描繪矩陣D。二適當方法載於(註5)和(註6)。
能量保存在前區應準確,在背底或側區可較不準確。
2.因為Cauchy-Schwarz不等式(詳後),描繪矩陣可以下式常態化:
對近似能量保存矩陣,此式可取代式(6),而式(6)可視為式(7)之特殊情況。選項是使用從中心(Ωc=(0,0)T)衝擊的單位能量之測試訊號,把描繪矩陣常態化:
其模態向量,以及方向Ωc之球諧函數(Ωc)。模態向量可為方向Ωc的球諧函數組成之HOA測試訊號。
參照HOA內容已用來評估上述考量,使用能量和響度量度進行實際研究。為HOA零階係數通道(W通道)、描繪後之多通道訊號(超過5通道的設置之通道權值為1),以及多通道訊號之雙耳停止混合,使用Technicolor聽覺室之雙耳室內衝擊反應(BRIRs),和從中心揚聲器通道利用-23LKFS測試訊號核正,進行響度測量。並列進行能量測量。能量測量(滿檔)匹配響度測量很接近,除了無聲通路之項目外。此等通路對LKFS測量可忽略,故此處數字會較高。此舉證明假設能量測量賦予感受響度之估計值。測量資料列如下。資料有些評估如下所示。可由非正式聽覺測試確認。LKFS測量準確率為±2dB。
以下參照描繪不同HOA階時之響度保存。第5圖表示對22.0揚聲器通道設置描繪不同HOA階時之響度保存。三個測試項目T1,T2,T3之雙耳響度測量,按照本發明方式描繪於22.0通道設置,以描繪N=1...6諸階。測試項目階為N=6,而描繪器在描繪較低階時,忽略較高階。第一測試項目T1之量度,對N=1階為t11,對N=2階為t12,依此類推,對第二和第三測試項目T2,T3類此。可見有不同描繪階之部份訊號(即各測試項目之組份)係以實質上同樣響度描繪,與其描繪階無關。
以下涉及描繪於不同響度設置之響度保存。第6圖表示把N=4(即第4階)之14個HOA測試項目LT1,...LT14描繪於5個不同揚聲器設置時之響度保存。在
五欄之各群中,即各測試項目,諸欄(自左至右)相當於選擇之揚聲器設置為22.0(CfP),12.0(Auro3D),9.0(Auro3D),5.0(ITU),2.0(±30°)。可見五欄中各群差異很小。亦即以實質上同樣響度描繪指定訊號。較少揚聲器者(尤其是2D設置),理論上能量保存會降級,按照式(7)描繪矩陣之常態化,導致實用之改進描繪器。
以下涉及第一階HOA W通道和描繪後之響度項目。使N3D常態化,第0階係數通道含有大致同等能量和響度的描繪輸出之非標度單版本。第7圖表示Technicolor的13個N=4測試項目LM1,...,LM13(即測試訊號)之此相關性,即HOA W通道訊號的響度量度與描繪後平均響度之比較。單通道LKFS量度(各測試項目之左欄)與第6圖五個不同揚聲器設置的雙耳LKFS量度(各測試項目之右欄)平均值比較。意外發現二者實質上相等。因此,HOA W通道可用來估計描繪後之總響度。在使用微音器陣列或在內容製作中監聽響度時,此項特點可用來設置五個HOA廣播記錄之響度位準。
按照本發明,若在製作側的混合設備和在消費側的展示現場,使用同樣揚聲器位準校正,以及描繪器具有特殊能量保存特性,所感受響度即可常態化。能量保存記載描繪器之特性,可從任意方向保存方向性源始訊號之能量。此舉適用於全部3D聲訊輸出格式,其中至少有AO、通道基礎和HOA。
HOA內容是例如利用聽覺,在混合設備校正
之響度位準,其中能量保存描繪是用來監聽。對HOA內容(全部係數通道)應用充分主增益,再儲存以供分佈。又,能量保存描繪亦用在展示現場。
實務上,HOA描繪器可構成能量至少保存在揚聲器間之區域(即揚聲器位置間之地方)。導致良好響
度保存結果的描繪矩陣之常態化,是利用為之。
HOA零階係數通道(W通道)之LKFS響度量度,粗略匹配相關通道表示法或其相關雙耳停止混合之響度量度。因此,可用來監聽內容製作,尤其是廣播,特別是現場廣播內之響度。然而,亦可有益用來監聽所錄內容。
本發明在一具體例中,提供高階保真立體音響(HOA)內容響度位準之調節方法,故在不同場地和/或以不同揚聲器設置聆聽時,對聲壓位準校正過的3D聲訊系統之描繪和重播,可感受同等響度。內容之HOA編碼需加以特定,而描繪器需共享能量保存之通性。
在一具體例中,本發明係關於HOA內容響度之監聽工具,可用於例如現場廣播HOA訊號、AO訊號,或使用HOA微音器記錄創造之通道基礎訊號。
茲說明現場廣播用的HOA系統如下。
HOA微音器陣列容許即時捕獲3D聲訊,不需在播音室內後處理。因此,如此之內容捕獲系統充分適合於現場廣播事件,像運動和/或音樂會事件。以下說明一種系統,可設置和監聽3D內容之響度。
第8圖描繪HOA系統80之一具體例。首先,把微音器(或微音器陣列)81定位在與要記錄事件的臨界距離內,以維持類比設置(像適當之預放大)。微音器81提供其輸出給即時HOA編碼器82,發生編碼HOA格式化訊號。HOA格式化訊號提供給HOA響度計83,即評估HOA零階通道(HOA W通道)和計算LKFS(LUFS)響度量度之單位。W通道可從HOA編碼器82、HOA響度計83或W通道摘取單位(圖上未示)內之HOA訊號摘取。HOA響度計83提供暫時、短期和整合之響度量度q83(註1)(註2)給HOA主增益單位84。在一具體例內,響度量度亦可在視需要之適應/選擇單位83x內,人為或自動適應和/或選擇,再提供給HOA主增益單位84。在一具體例中,HOA響度計83進行相關能量量度,用在HOA主增益單位84內設定增益,並調節響度。
視需要之第二個HOA響度監聽單位83m,可附設在HOA主增益單位84後,以監聽合理和/或尤其是更複雜系統,視需要之第一HOA響度保存描繪器85可用於監聽。優良之實際解決方案是使用語音錨測試記錄,以設置初始主增益。
俟利用傳送器傳輸86後(或由儲存單位儲存後),在消費者裝置內利用接收器接收(或利用檢復單位檢復所儲存內容),使用第二HOA響度保存描繪器87描繪聲訊內容至所需揚聲器設置88。可用不同的揚聲器設
置88,諸如在5.1左右音響5.1sur之立體聲st、其他3D聲場sf或頭掛聽筒hp。HOA格式之一優點是比較簡單即可以高品質,使其描繪於任何特定揚聲器設置最佳。
原則上,HOA系統80可理解為包含二部份:編碼部份和解碼部份。編碼部份包含編碼器單位82、響度計83、主增益單位84,以及視需要之一或以上適應/選擇單位83x、響度監聽單位83m和第一響度保存描繪器85。接收器內之解碼部至少包含響度保存描繪單位87。若編碼部和解碼部透過儲存裝置連接,儲存裝置可為其中任一之部份,亦可分開。
在一具體例內,以第9圖繪示通道基礎之傳輸或回放系統90。按前述捕獲HOA訊號和調節響度,使用微音器/微音器陣列91、HOA編碼器92、HOA主增益單位94、HOA響度計93和HOA響度保存描繪器95。視需要之第二HOA響度監聽單位93m可附在HOA主增益單位94後,以供監聽。HOA響度保存描繪器95在此具體例中不再視需要。在此具體例中,響度量度亦在視需要之適應/選擇單位93x內,以人為或自動方式適應和/或選擇,然後提供給HOA主增益單位94。
由HOA響度保存描繪器95提供之通道基礎聲訊,再於傳輸單位或儲存單位96內傳送或儲存。添加傳輸設置之揚聲器位置和/或指示原有內容格式之旗誌,做為訊號之元資料。因此,含有傳輸設置之揚聲器位置和/或發訊原有資料已為HOA之旗誌,做為傳送或儲存訊
號內之元資料。俟傳輸/儲存和在消費者側接收內容後,使用能量保存通道基礎描繪器99把資料描繪於消費者之揚聲器設置98內,為其一具體例。而在另一具體例(圖上未示)中,使用能量保存通道基礎描繪器99,在傳輸或儲存之前,把資料描繪於預定或個別揚聲器設置98。在任一情況下,通道基礎描繪器99按照式(4)作業。亦可有不同的揚聲器設置,如前述。
另外,通道基礎內容可以使用第二HOA編碼單位(圖上未示,例如取代通道基礎描繪器99),再編碼於HOA,其中第二HOA編碼單位最好是響度保存HOA描繪器。
茲說明HOA響度計83,93。使用N3D常態化零階HOA係數通道,做為輸入訊號。處理方式類比(註1)(註2),其中處理僅就單通道加以說明。在各種不同具體例中,HOA響度計83,93可顯示一或以上之暫時、短期之整合響度量度。此等差異主要用於響度測量之時幅。
在使用響度保存描繪器之條件下,此等量度可藉以推論在消費者揚聲器設置描繪後可得之(目標)響度。例如,量度可用來保持悅耳的聽覺位準,在不同內容或不同節目間交換時,不會有響度跳躍。以聲壓位準(SPL)校正系統,可實現同等響度。
響度保存描繪器需符合(至少大致)如下要件:
對於AO基礎內容:式(3);對於通道基礎內容:式(4);對於HOA基礎內容:式(5)。
在一具體例中,HOA描繪器按照式(6)(7)(8)使用描繪矩陣常態化。
以下能量計算推衍HOA描繪後之訊號能量EW。測試訊號是DC自由時間訊號x(t),其RMS值為A,從方向Ω=(θ,Φ)T衝擊的能量EA=A2,其中θ為高度,Φ是方位角。
令x指τ樣本之向量,x=(x(t 1),...x(t i ),...,x(t τ )) T 。
E A =x T x=A 2 (9)
HOA編碼由下式賦予: B=yx T (10)
其中向量係由方向Ω的真值球諧函數組合,而、矩陣元素Bo,i、階指數o,和時間樣本指數i。
HOA界域內之能量,由矩陣B之平方Frobenius模方求得:
而上述編碼方程式變成:
揚聲器訊號W以矩陣描繪後,由下式求得:
W=D B (13)
其中。W是由B的向量bi,由下式求得: W=(Db 1 ,...Db i ,...Db τ ) (14)
揚聲器訊號之能量,以矩陣W之平方Frobenius模方求得:
可使用諸欄合計以及歐幾理德向量模方,為bi欄改寫:
其中∥ Dy ∥ 2 =( Dy ) T Dy :
以下說明解碼矩陣常態化,即如何導衍式(7)和式(6),式(7)為特別情況。使用Frobenius模方,為任意矩陣界定Cauchy-Schwarz不等式:
由此依照下式簡單常態化,以描繪矩陣D:
若揚聲器數量大於或等於HOA係數(L (N+1)2),才能發生完美能量保存。如果描繪矩陣D是完美能量保存,其奇數值分解變成:D=UIV,其中U,V為單元矩陣,I為規模(N+1)2 x(N+1)2之單位矩陣。在單元轉換下,Frobenius模方不變,而在此情況下,
。此直接導致式(6)。
雖然本發明之圖示、說明,並指出應用於較佳具體例之基本新穎特點,惟須知所述裝置和方法,在所揭示裝置之形式和細節,及其操作,可由技術專家進行各種省略、置換和改變,不違本發明之精神。茲陳明凡此等元件之所有組合,以實質上同樣方式進行同樣功能,以達成同樣結果,均在本發明範圍內。諸元件由上述一具體例置換成另一具體例,亦完全在刻意構想內。需知本發明所述純為舉例方式,細節可以修飾,不違本發明範圍。說明書和(得便時)申請專利範圍及附圖揭示之各特點,係單獨或以任何適當組合方式提供。諸特點可得便以硬體、軟體,或二者組合方式實施。其可應用之連接為無線或有線連接,不一定要直接或專用。
引用資料
(註1):ISO/IEC JTC1/SC29/WG11/N13196,〈22.2多通道聲音重製之核正〉,聲訊小組,2012年10月,中國上海。
(註2):EBU技術推荐書R128,〈聲訊訊號之響度常態化和容許之最大位準〉,2010年,日內瓦,[http://tech.ebu.ch/docs/r/r128.pdf]。
(註3):ITU-R推荐書BS.1770-2,〈測量聲訊節目響度和真實高峰聲訊位準〉,2011年,日內瓦。
(註4):ATSCA/85,〈為數位電視建立和維持聲訊響度之技術〉,高級電視系統委員會,華府,2011年7月25日。
(註5):F.Zotter,H.Pomberger,M.Noisternig,〈能量保存響度解碼〉,ACTA ACUSTICA UNITED with ACUSTICA,第98卷(2012),37-47頁。
(註6):F.Zotter,M.Frank,〈萬能保真立體音響泛移和解碼〉,J.Audio End.Soc.,第60卷第10期,2012年10月。
Claims (13)
- 一種高階保真立體音響(HOA)格式化3D聲訊響度位準之調節方法,3D聲訊至少具有係數為第0階之一係數通道,以及係數高於0階之一或以上係數通道,此方法包括步驟為:測量3D聲訊係數為第0階的係數通道之響度;按照所測得係數為0階的係數通道之響度,為3D聲訊之全部係數通道,位準調節主增益,其中獲得位準調節過之HOA訊號者。
- 如申請專利範圍第1項之方法,又包括3D聲訊之描繪步驟,其中使用常態化描繪矩陣,並監聽(83m)所描繪訊號之響度者。
- 如申請專利範圍第2項之方法,其中描繪是使用以常態化因數Dn常態化之描繪矩陣,按照,其中De是能量保存描繪矩陣,或按照,其中D是近似能量保存描繪矩陣者,其中N指的是HOA階數且其中∥D∥ fro 指的是D的能量。
- 如申請專利範圍第2項之方法,其中描繪是使用以常態化因數 D n 常態化之描繪矩陣,按照,其中y是方向Ωc的球諧函數組成之HOA測試訊號,而D為近似能量保存描繪矩陣者。
- 如申請專利範圍第1項之方法,又包括步驟為,描繪從該位準調節步驟所得訊號,並傳送所描繪訊號,其中描繪是使用常態化因數常態化之能量保存描繪矩陣,按照或按照,其中D為近似能量保存描繪矩陣,而y係方向Ωc的球諧函數組成之HOA測試訊號者,其中∥D∥ fro 指的是D的能量。
- 如申請專利範圍第1項之方法,又包括步驟為,傳送、接收和描繪從該位準調節步驟所得訊號,其中傳送和接收後之描繪,是使用常態化因數常態化之能量保存描繪矩陣,按照或按照,其中D為近似能量保存描繪矩陣,而y係方向Ωc的球諧函數組成之HOA測試訊號者,其中∥D∥ fro 指的是D的能量。
- 如申請專利範圍第1項之方法,其中係數通道響度之測量步驟和主增益之位準調節步驟,係在傳輸或儲存步驟之前,在傳送側進行者。
- 一種高階保真立體音響(HOA)格式化3D聲訊響度位準之調節裝置,3D聲訊至少具有係數為第0階之一係數通道,以及係數高於0階之一或以上係數通道,此裝置包括:響度測量單位(83,93),以測量係數為第0階之係數通道響度;主增益單位(84,94),按照所測得從響度測量單位(83,93)接收之響度,調整3D聲響的全部係數通道之增益,主增益單位提供位準調節過之HOA訊號者。
- 如申請專利範圍第8項之裝置,又包括監聽單位(85),以描繪位準調節過之HOA訊號,其中使用常態化描繪矩陣,並監聽所描繪訊號之響度,其中使用所監聽響度來控制HOA響度測量單位(83,93)者。
- 如申請專利範圍第8項之裝置,其中響度測量單位(83)提供暫時、短期和整合響度量度(q83)給主增益單位(84)者。
- 如申請專利範圍第8項之裝置,又包括:描繪器,供描繪從主增益單位(84,94)所得該位準調節過之HOA訊號,其中使用以常態化因數常態化之能量保存描繪矩陣,按照或按照,其中D是近似能量保存描繪矩陣,而y是方向Ωc的球諧函數組成之HOA測試訊號,其中∥D∥ fro 指的是D的能量;傳送器,供傳送所描繪訊號者。
- 如申請專利範圍第8項之裝置,又包括:傳送器,供傳送從主增益單位(84,94)所得之該位準調節過HOA訊號;接收器,供接收所傳送訊號;描繪器,供描繪所接收訊號,其中使用經常態化因數常態化之能量保存描繪矩陣,按照或按照,其中D為近似能量保存描繪矩陣,而y為方向Ωc的球諧函數組成之HOA測試訊號者,其中∥D∥ fro 指的是D的能量。
- 如申請專利範圍第8項之裝置,又包括:儲存器,供儲存從主增益單位(84,94)所得之該位準調節過HOA訊號;檢復單位,供檢復所儲存訊號;描繪器,供描繪所檢復訊號,其中描繪是使用經常態化因數常態化之能量保存描繪矩陣,按照或按照,其中D為近似能量保存描繪矩陣,而y係方向Ωc的球諧函數組成之HOA測試訊號者,其中∥D∥ fro 指的是D的能量。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??13305047.6 | 2013-01-16 | ||
EP13305047 | 2013-01-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201433185A TW201433185A (zh) | 2014-08-16 |
TWI630829B true TWI630829B (zh) | 2018-07-21 |
Family
ID=47739173
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103100879A TWI630829B (zh) | 2013-01-16 | 2014-01-10 | 一種高階保真立體音響格式化3d聲訊響度位準之調節方法及裝置 |
TW107107286A TWI679903B (zh) | 2013-01-16 | 2014-01-10 | 一種高階保真立體音響格式化3d聲訊響度位準之調節方法及裝置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107107286A TWI679903B (zh) | 2013-01-16 | 2014-01-10 | 一種高階保真立體音響格式化3d聲訊響度位準之調節方法及裝置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9832584B2 (zh) |
EP (1) | EP2946468B1 (zh) |
JP (1) | JP6271586B2 (zh) |
KR (3) | KR102031826B1 (zh) |
CN (2) | CN108174341B (zh) |
HK (1) | HK1256573A1 (zh) |
TW (2) | TWI630829B (zh) |
WO (1) | WO2014111308A2 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
US9883310B2 (en) | 2013-02-08 | 2018-01-30 | Qualcomm Incorporated | Obtaining symmetry information for higher order ambisonic audio renderers |
US10178489B2 (en) | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
US10063207B2 (en) | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
US9847088B2 (en) | 2014-08-29 | 2017-12-19 | Qualcomm Incorporated | Intermediate compression for higher order ambisonic audio data |
US9875745B2 (en) * | 2014-10-07 | 2018-01-23 | Qualcomm Incorporated | Normalization of ambient higher order ambisonic audio data |
CN112185401B (zh) | 2014-10-10 | 2024-07-02 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
US9940937B2 (en) * | 2014-10-10 | 2018-04-10 | Qualcomm Incorporated | Screen related adaptation of HOA content |
US10070094B2 (en) * | 2015-10-14 | 2018-09-04 | Qualcomm Incorporated | Screen related adaptation of higher order ambisonic (HOA) content |
US10182303B1 (en) * | 2017-07-12 | 2019-01-15 | Google Llc | Ambisonics sound field navigation using directional decomposition and path distance estimation |
US11330370B2 (en) | 2018-02-15 | 2022-05-10 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
US10904687B1 (en) | 2020-03-27 | 2021-01-26 | Spatialx Inc. | Audio effectiveness heatmap |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373961A (zh) * | 2007-08-23 | 2009-02-25 | 索尼株式会社 | 信号处理设备、信号处理方法及其程序 |
US20090238370A1 (en) * | 2008-03-20 | 2009-09-24 | Francis Rumsey | System, devices and methods for predicting the perceived spatial quality of sound processing and reproducing equipment |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
TW201301912A (zh) * | 2011-05-09 | 2013-01-01 | Dts Inc | 用於多聲道音訊之室內特徵化及校正技術 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1241135C (zh) * | 1999-10-21 | 2006-02-08 | 国际商业机器公司 | 用于排序分类属性以更好地可视化多维数据的系统和方法 |
FI118247B (fi) * | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
EP1531567B1 (en) * | 2003-11-17 | 2007-09-05 | Alcatel Lucent | Method and apparatus for carrying out connection and related input/output processing functions in a synchronous digital hierarchy transport node |
WO2009129008A1 (en) * | 2008-04-17 | 2009-10-22 | University Of Utah Research Foundation | Multi-channel acoustic echo cancellation system and method |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
ES2690164T3 (es) * | 2009-06-25 | 2018-11-19 | Dts Licensing Limited | Dispositivo y método para convertir una señal de audio espacial |
WO2011117399A1 (en) * | 2010-03-26 | 2011-09-29 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
NZ587483A (en) * | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
US9131298B2 (en) * | 2012-11-28 | 2015-09-08 | Qualcomm Incorporated | Constrained dynamic amplitude panning in collaborative sound systems |
-
2014
- 2014-01-09 EP EP14700272.9A patent/EP2946468B1/en active Active
- 2014-01-09 CN CN201810250413.3A patent/CN108174341B/zh active Active
- 2014-01-09 US US14/761,109 patent/US9832584B2/en active Active
- 2014-01-09 WO PCT/EP2014/050316 patent/WO2014111308A2/en active Application Filing
- 2014-01-09 CN CN201480005125.1A patent/CN104937843B/zh active Active
- 2014-01-09 KR KR1020157018779A patent/KR102031826B1/ko active IP Right Grant
- 2014-01-09 KR KR1020197029440A patent/KR102115345B1/ko active IP Right Grant
- 2014-01-09 KR KR1020207014425A patent/KR102143545B1/ko active IP Right Grant
- 2014-01-09 JP JP2015552044A patent/JP6271586B2/ja active Active
- 2014-01-10 TW TW103100879A patent/TWI630829B/zh active
- 2014-01-10 TW TW107107286A patent/TWI679903B/zh active
-
2018
- 2018-12-06 HK HK18115651.8A patent/HK1256573A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373961A (zh) * | 2007-08-23 | 2009-02-25 | 索尼株式会社 | 信号处理设备、信号处理方法及其程序 |
US20090238370A1 (en) * | 2008-03-20 | 2009-09-24 | Francis Rumsey | System, devices and methods for predicting the perceived spatial quality of sound processing and reproducing equipment |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
TW201301912A (zh) * | 2011-05-09 | 2013-01-01 | Dts Inc | 用於多聲道音訊之室內特徵化及校正技術 |
Also Published As
Publication number | Publication date |
---|---|
HK1256573A1 (zh) | 2019-09-27 |
KR102031826B1 (ko) | 2019-10-15 |
CN108174341B (zh) | 2021-01-08 |
KR20150107744A (ko) | 2015-09-23 |
TW201824881A (zh) | 2018-07-01 |
CN104937843A (zh) | 2015-09-23 |
US9832584B2 (en) | 2017-11-28 |
CN108174341A (zh) | 2018-06-15 |
JP6271586B2 (ja) | 2018-01-31 |
EP2946468A2 (en) | 2015-11-25 |
JP2016508343A (ja) | 2016-03-17 |
TWI679903B (zh) | 2019-12-11 |
TW201433185A (zh) | 2014-08-16 |
EP2946468B1 (en) | 2016-12-21 |
WO2014111308A2 (en) | 2014-07-24 |
CN104937843B (zh) | 2018-05-18 |
WO2014111308A3 (en) | 2014-09-12 |
US20150373473A1 (en) | 2015-12-24 |
KR102115345B1 (ko) | 2020-05-26 |
KR20190119151A (ko) | 2019-10-21 |
KR20200058598A (ko) | 2020-05-27 |
KR102143545B1 (ko) | 2020-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI630829B (zh) | 一種高階保真立體音響格式化3d聲訊響度位準之調節方法及裝置 | |
US12112766B2 (en) | Efficient DRC profile transmission | |
TWI631553B (zh) | 將以<i>L</i><sub>1</sub>個頻道為基礎之輸入聲音訊號產生至<i>L</i><sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於<i>L</i><sub>1</sub>個聲音頻道至<i>L</i><sub>2</sub>個揚聲器頻道 | |
US10880659B2 (en) | Providing and transmitting audio signal | |
US20080069366A1 (en) | Method and apparatus for extracting and changing the reveberant content of an input signal | |
US9756437B2 (en) | System and method for transmitting environmental acoustical information in digital audio signals | |
US20210250717A1 (en) | Spatial audio Capture, Transmission and Reproduction | |
JP5909100B2 (ja) | ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム | |
KR20140090469A (ko) | 영상표시장치의 동작 방법 | |
US9485578B2 (en) | Audio format | |
KR20130114477A (ko) | 오디오 처리 장치, 및 그 동작방법 | |
JP2015065551A (ja) | 音声再生システム |