TW202013356A - 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 - Google Patents
對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 Download PDFInfo
- Publication number
- TW202013356A TW202013356A TW108142370A TW108142370A TW202013356A TW 202013356 A TW202013356 A TW 202013356A TW 108142370 A TW108142370 A TW 108142370A TW 108142370 A TW108142370 A TW 108142370A TW 202013356 A TW202013356 A TW 202013356A
- Authority
- TW
- Taiwan
- Prior art keywords
- hoa
- signal
- representation
- frame
- vector
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000007906 compression Methods 0.000 title description 18
- 230000006835 compression Effects 0.000 title description 17
- 239000011159 matrix material Substances 0.000 claims description 41
- 238000010606 normalization Methods 0.000 abstract description 11
- 239000013598 vector Substances 0.000 description 56
- 238000012545 processing Methods 0.000 description 30
- 230000005236 sound signal Effects 0.000 description 23
- 230000006870 function Effects 0.000 description 15
- 238000000354 decomposition reaction Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000006837 decompression Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 241001306293 Ophrys insectifera Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000005428 wave function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本發明係為一種判定非差分增益值表示所需最低整數位元數以用於高階保真立體音響(HOA)資料框表示壓縮之方法,當壓縮一HOA資料框表示時,於進行知覺編碼(16)前,應用一增益控制(15、151)用於各聲道信號,依一差分方式傳送增益值作為邊資訊。然而,用以開始此類串流壓縮HOA資料框表示之解碼,需要絕對增益值,其應以最小位元數編碼。用以判定此類最低整數位元數,將HOA資料框表示( C (k))於空間域中呈現至位於一單位球面上之虛擬揚聲器信號,隨後進行HOA資料框表示( C (k))之正規化,接著 將最低整數位元數設成
Description
本發明相關判定非差分增益值表示所需最低整數位元數以用於高階保真立體音響(HOA)資料框表示壓縮的方法,非差分增益值與該等HOA資料框中特定者的聲道信號關聯。
高階保真立體音響(HOA)提供一可能性用以表示立體聲,其他技術係波場合成(WFS)或基於聲道的措施像”22.2”,對照到基於聲道的方法,HOA表示提供不受特定揚聲器設置支配的優勢,然而,此彈性係以解碼過程作為代價,其要求在一特定揚聲器設置上回播HOA表示。相較於WFS措施,其中通常需要極大數量的揚聲器,HOA亦可呈現到僅由極少揚聲器組成的設置。HOA的另一優勢 在於亦可利用相同表示,不用任何修改用於耳機的雙聲道呈現。
HOA係基於複合平面諧波振幅藉由截斷球諧函數(SH)展開的空間密度表示,各展開係數係一角頻率函數,其可等效地由一時域函數表示。因此,不失一般性,完整的HOA聲場表示實際上可理解為由O個時域函數組成,其中O表示展開係數的數目。以下此等時域函數將等效地稱為HOA係數序列或稱為HOA聲道。
HOA表示的空間解析度係利用展開的成長最大階N得以提升,不幸地,展開係數的數目O隨著階N成二次方成長,尤其O=(N+1)2。例如,使用階N=4的典型HOA表示需要O=25的HOA(展開)係數。已知一期望單聲道取樣率f S及每樣本的位元數N b,用於HOA表示傳輸的總位元率係由O.f S.N b判定,利用每樣本N b=16位元,以f S=48kHz(千赫)的取樣率,傳輸階N=4的HOA表示造成19.2百萬位元/秒的位元率,其用於許多實際應用如串流係極高位元率。因此高度期望HOA表示的壓縮。
HOA聲場表示的壓縮先前曾揭示在歐洲專利號EP2665208 A1、EP2743922 A1、EP2800401 A1中,請參考2014年一月所頒佈ISO/IEC JTC1/SC29/WG11,N14264,MPEG-H立體聲的WD1-HOA內文。此等措施的共同點在於,其執行聲場分析並將已知HOA表示分解成方向分量及殘餘周圍分量。最終壓縮表示一方面係假設由數個量化信號組成,由方向信號及向量為基信號的知覺編碼 以及周圍HOA分量的相關係數序列形成該等量化信號,另一方面,最終壓縮表示包括量化信號相關的額外邊資訊,其係HOA表示從其壓縮版本重建所需。
在傳遞到知覺編碼器前,要求此等中間時域信號具有值範圍[-1,1[內的最大振幅,其係從目前可用知覺編碼器的實施引發的要求,為在壓縮HOA表示時滿足此要求,在知覺編碼器前面,使用一增益控制處理單元(參閱歐洲專利號EP2824661 A1及上述ISO/IEC JTC1/SC29/WG11 N14264文件),其平順地減弱或增大輸入信號。假設作為結果的信號修改係不可逆且係逐訊框應用,其中尤其假設連續框之間信號振幅的變化係’2’的乘冪。為促成此信號修改在HOA解壓縮器中的反轉,在總邊資訊中包括對應的正規化邊資訊,此正規化邊資訊可由底數’2’的指數組成,該等指數描述二連續框之間的相對振幅變化。由於連續框之間更可能發生小振幅變化而非較大振幅變化,因此根據上述ISO/IEC JTC1/SC29/WG11 N14264文件,使用遊程碼編碼此等指數。
使用差分編碼振幅變化用以在HOA解壓縮中重建原始信號振幅係可行的,例如若單一檔案係從頭到尾不用任何時序跳躍以解壓縮,然而,為促進隨機存取,在編碼表示(其通常係一位元流)中必須存在獨立存取單位,為要允許解壓縮從一期望位置(或至少在其附近)開始,不 用管先前訊框來的資訊。此一獨立存取單位必須包含增益控制處理單元從第一訊框直到目前訊框造成的總絕對振幅變化(即非差分增益值),假設二連續框之間的振幅變化係’2’的乘冪,亦藉由底數’2’的指數描述總絕對振幅變化即足夠。用於此指數的有效率編碼,在增益控制處理單元的應用前知道信號的潛在最大增益係必要的。然而,此知識係高度依賴待壓縮HOA表示的值範圍相關的限制規格,可惜MPEG-H立體聲文件ISO/IEC JTC1/SC29/WG11 N14264的確只提供格式描述用於輸入HOA表示,無設定值範圍相關的任何限制。
待由本發明解決的難題係提供非差分增益值表示所需的最低整數位元數,解決此難題係藉由後附申請專利範圍第1項中揭示的方法。
在後附申請專利範圍的各別依附項中揭示本發明有利的附加實施例。
在應用HOA壓縮器內的增益控制處理單元前,本發明建立輸入HOA表示的值範圍與信號的潛在最大增益之間的相互關係,基於該相互關係,判定所需位元總數-用於一輸入HOA表示的值範圍的已知規格-以用於底數’2’的指數的有效率編碼,用以在一存取單位內描述修改信號由增益控制處理單元從第一訊框直到目前訊框造成的總絕對振幅變化(即非差分增益值)。
另外,一旦固定指數編碼所需位元總數的計算規則,本發明即使用一處理用以證實一已知HOA表示是 否滿足所需值範圍限制,以便正確地壓縮該HOA表示。
原則上,本發明揭示一種方法,用於HOA資料框表示的壓縮,適合用以判定非差分增益值表示所需最低整數位元數βe以用於該等HOA資料框中特定者的聲道信號,其中各訊框中的各聲道信號包括一樣本值群,及其中將一差分增益值指定到該等HOA資料框中每一者的各聲道信號,及此類差分增益值造成目前HOA資料框中一聲道信號的樣本值的振幅變化(相關該聲道信號在前一HOA資料框中的樣本值),及其中在一編碼器中將此類增益順應聲道信號編碼,及其中將該HOA資料框表示在空間域中呈現到O個虛擬揚聲器信號w j (t),其中虛擬揚聲器的位置係位於一單位球面上及不匹配該等假設用於βe計算者,該呈現係由一矩陣乘法 w (t)=( Ψ )-1. c (t)表示,其中 w (t)係一向量,含有所有虛擬揚聲器信號, Ψ 係一虛擬揚聲器位置模式矩陣,及 c (t)係該HOA資料框表示的對應HOA係數序列的向量,及其中計算最大允許振幅值
- 藉由一或多個子步a)、b)、c),由該正規化HOA資料框表示形成該等聲道信號:
a)用以表示該等聲道信號中的主要聲音信號,將HOA係數序列 c (t)的該向量乘以一混合矩 陣 A ,該混合矩陣 A 的歐幾里德範數係不大於‘1’,其中混合矩陣 A 表示該正規化HOA資料框表示的係數序列的線性組合;
b)用以表示該等聲道信號中的一周圍分量 c AMB(t),從該正規化HOA資料框表示中減去該等主要聲音信號,及選擇該周圍分量 c AMB(t)的係數序列的至少一部分,其中 ,及藉由計算 w MIN(t)= 以變換作為結果的最小周圍分 量 c AMB,MIN(t),其中<1及 Ψ MIN係一模式 矩陣用於該最小周圍分量 c AMB,MIN(t);
- 將該等非差分增益值表示用於該等聲道信號所需 的該最低整數位元數βe設成 , 其中,N係 階,O=(N+1)2係HOA係數序列的數目,K係該模式矩陣的平方歐幾里德範數與O之間的比率, 及其中N MAX,DES係感興趣階,及係用 於各階的虛擬揚聲器方向,其係假設用於該HOA資料框表示的該壓縮實施,以便藉由 以選擇β e ,為將 該等非差分增益值的底數’2’的指數編碼,及其中用以計算 ,∥ Ψ ∥2係該模式矩陣 Ψ 的歐幾 里德範數, ,N係階, N MAX係感興趣最大階,係該等虛擬揚聲 器的方向,O=(N+1)2係HOA係數序列的數目,及K係該模式矩陣的平方歐基里德範數∥ Ψ ∥2 2與O之間的比率。
圖1
11‧‧‧方向及向量估計處理步驟
12‧‧‧HOA分解處理步驟
13‧‧‧周圍分量修改處理步驟
14‧‧‧聲道指定步驟
15,151‧‧‧增益控制處理步驟
16‧‧‧知覺編碼器步驟
17‧‧‧邊資訊信號源編碼器步驟
18‧‧‧多工器
C (k)‧‧‧初始訊框
CAMB(k-1)‧‧‧周圍HOA分量的訊框
C M,A(k-1)‧‧‧修改周圍HOA分量
C P,M,A(k-1)‧‧‧暫預測修改周圍HOA分量
e 1(k-2),...,e I (k-2)‧‧‧指數
β1(k-2),...,β I (k-2)‧‧‧異常旗標
M DIR(k),M VEC(k),
M DIR(k-1),M VEC(k-1)‧‧‧元組集
v A,T(k-1)‧‧‧目標指定向量
v A(k-2)‧‧‧最終指定向量
X PS(k-1)‧‧‧所有主要聲音信號框
y 1(k-2),..., y I (k-2)‧‧‧信號框
y P,1(k-1),..., y P,I (k-1))‧‧‧預測信號框
z 1(k-2),..., z I (k-2)‧‧‧信號
圖2
21‧‧‧解多工步驟
22‧‧‧知覺解碼器步驟
23‧‧‧邊資訊信號源解碼器步驟
24,241‧‧‧逆增益控制處理步驟
25‧‧‧聲道重指定步驟
26‧‧‧主要音合成步驟
27‧‧‧環音聲合成步驟
28‧‧‧HOA組成步驟
C I,AMB(k)‧‧‧周圍HOA分量的中間表示訊框
e 1(k),...,e I (k)‧‧‧增益校正指數
β1(k),...,β I (k)‧‧‧增益校正異常旗標
M DIR(k+1),M VEC(k+1)‧‧‧元組集
v AMB,ASSIGN(k)‧‧‧指定向量
ζ(k+1)‧‧‧預測參數
圖3
K‧‧‧比率
N‧‧‧HOA階
圖4
N MIN‧‧‧最小階
圖5
51‧‧‧計算模式矩陣
52‧‧‧計算歐幾里德範數
53‧‧‧計算增益
Ψ ‧‧‧模式矩陣
∥ Ψ ∥2‧‧‧模式矩陣的歐幾里德範數
γ dB‧‧‧分貝值
圖6
x,y,z‧‧‧坐標軸
r‧‧‧半徑
θ‧‧‧斜角
以下將參考附圖以描述本發明的示範實施例,圖中:
圖1顯示HOA壓縮器;
圖2顯示HOA解壓縮器;
圖4顯示反模式矩陣 Ψ -1的歐幾里德範數用於虛擬方向 Ω MIN,d ,d=1,...,O MIN以用於HOA階N MIN=1,...,9;
圖6顯示球面坐標系。
即若未明確說明,以下實施例係可運用在任何組合或子組合中。
以下提出HOA壓縮及解壓縮的原理,為要提供發生上述問題的較詳細相關情境,此說明的基礎係MPEG-H立體聲文件ISO/IEC JTC1/SC29/WG11 N14264中所述處理,亦請參閱歐洲專利號EP2665208 A1、EP2800401 A1及EP2743922 A1。在N14264中,’方向分量’係延伸到一’主要聲音分量’,作為方向分量,假設主要聲音分量係部分由方向信號表示,意指該等信號係具有對應方向的單聲道信號,假設其從該對應方向撞擊聆聽者,連同一些預測參數用以從方向信號中預測部分的原始HOA表示。此外,亦假設主要聲音分量由’向量為基信號’表示,意指該等信號係具有一對應向量的單聲道信號,該向量定義向量為基信號的方向分布。
HOA壓縮
圖1繪示歐洲專利號EP2800401 A1所揭示HOA壓縮器的整體架構,其具有一空間HOA編碼部分如圖1A繪示及一知覺及信號源編碼部分如圖1B繪示。空間HOA編碼器提供第一壓縮HOA表示,由I個信號連同描述如何產生其HOA表示的邊資訊組成,在將二編碼表示進行多工前,在知覺及邊資訊信號源編碼器中,將I個信號進行知覺編碼,並使邊資訊受信號源編碼。
空間HOA編碼
在第一步驟中,將原始HOA表示的目前第k訊框 C (k)輸入到一方向及向量估計處理步驟或級11,假設其提供元組集M DIR(k)及M VEC(k)。元組集M DIR(k)係由元組組成,其第一元素表示方向信號索引及第二元素表示各別量化方向,元組集M VEC(k)係由元組組成,其第一元素指出向量為基信號索引及第二元素表示定義信號方向分布的向量,即如何計算向量為基信號的HOA表示。
使用元組集M DIR(k)及M VEC(k)兩者,在一HOA分解步驟或級12中,將初始HOA訊框 C (k)分解成所有主要聲音(即方向及向量為基)信號的訊框 X PS(k-1)及周圍HOA分量的訊框 C AMB(k-1)。請注意一訊框的延遲,其係由於交疊加處理,為要避免區塊效應。此外,為豐富主要聲音HOA分量,假設HOA分解步驟/級12輸出一些預測參數ζ(k-1),描述如何從方向信號中預測部分的原始HOA表示。此外,假設待提供一目標指定向量 v A,T(k-1)到I個可用聲道,該向量含有HOA分解處理步驟或級12中所判定主要聲音信號的指定有關的資訊。可假設受影響的聲道被佔用,意指該等聲道不可在各別時間框中用以傳送周圍HOA分量的任何係數序列。
在周圍分量修改處理步驟或級13中,根據目標指定向量 v A,T(k-1)提供的資訊以修改周圍HOA分量的訊框CAMB(k-1),尤其(在其他方面之中)取決於哪些聲道係可用且未由主要聲音信號佔用的有關資訊(包含在目標指定向量 v A,T(k-1)中),判定周圍HOA分量的哪些係數序列待 傳輸在已知I個聲道中。此外,若選擇的係數序列索引在連續框之間有變化,則執行係數序列的淡入及淡出。
此外,假設總是選擇周圍HOA分量 C AMB(k-2)的第一O MIN個係數序列待知覺編碼及傳輸,其中O MIN=(N MIN+1)2,N MIN N通常係比原始HOA表示的階小的階。為將此等HOA係數序列去相關,可將其在步驟/級13中變換到一些預設方向 Ω MIN,d ,d=1,...,O MIN撞擊來的方向信號(即一般平面波函數)。
配合修改的周圍HOA分量 C M,A(k-1),在步驟/級13中計算一暫預測修改周圍HOA分量 C P,M,A(k-1),並使用在增益控制處理步驟或級15、151中,為要允許一合理預見,其中周圍HOA分量修改有關的資訊係與聲道指定步驟或級14中所有可能信號類型指定到可用聲道直接相關。假設該指定有關的最終資訊係包含在最終指定向量 v A(k-2)中,為在步驟/級13中計算此向量,因此利用目標指定向量 v A,T(k-1)中包含的資訊。
步驟/級14中的聲道指定利用指定向量 v A(k-2)提供的資訊,將包含在訊框 X PS(k-2)中及包含在訊框 C M,A(k-2)中的適當信號指定到I個可用聲道,得出信號框 y i (k-2),i=1,...,I。另外,亦將包括在訊框 X PS(k-1)中及訊框 C P,AMB(k-1)中的適當信號指定到I個可用聲道,得出預測信號框 y P,i (k-1),i=1,...,I。
最後藉由增益控制15、151處理信號框 y i (k-2),i=1,...,I中的每一者,結果造成指數e i (k-2)及異 常旗標β i (k-2),i=1,...,I及信號 z i (k-2),i=1,...,I,其中平順地修改信號增益,如用以達成適合知覺編碼器步驟或級16的值範圍。步驟/級16輸出對應的編碼信號框,i=1,...,I,預測信號框 y P,i (k-1),i=1,...,I允許一種預見,為要避免連續區塊之間的嚴重增益變化。在邊資訊信號源編碼器步驟或級17中,將邊資訊資料M DIR(k-1)、M VEC(k-1)、e i (k-2)、β i (k-2)、ζ(k-1)及 v A(k-2)進行信號 源編碼,結果造成編碼邊資訊框,在一多工器18 中,將訊框(k-2)的編碼信號與用於此訊框的編碼 邊資訊資料合併,結果造成輸出訊框。在一 空間HOA解碼器中,假設步驟/級15、151中的增益修改係藉由使用指數e i (k-2)及異常旗標β i (k-2),i=1,...,I組成的增益控制邊資訊來回復。
HOA解壓縮
圖2繪示歐洲專利號EP2800401 A1揭露的HOA解壓縮器的整體架構,係由HOA壓縮器組件的相等類似者依相反次序配置所組成,及包括一知覺及信號源解碼部分如圖2A繪示及一空間HOA解碼部分如圖2B繪示。
在知覺及信號源解碼部分(表示一知覺及邊資訊信號源解碼器)中,一解多工步驟或級21接收位元流 來的輸入訊框,及提供I個信號的知覺編碼表示, i=1,...,I,及編碼邊資訊資料,描述如何產生其一HOA 表示。在一知覺解碼器步驟或級22中,將信號知覺解 碼,結果造成解碼信號,i=1,...,I,在一邊資訊信號源 解碼器步驟或級23中,將編碼邊資訊資料解碼,結果 造成資料集M DIR(k+1)、M VEC(k+1)、指數e i (k)、異常旗標β i (k)、預測參數ζ(k+1),及一指定向量 v AMB,ASSIGN(k)。關於 v A與 v AMB,ASSIGN之間的差異,請參閱上述MPEG文件N14264。
空間HOA解碼
在空間HOA解碼部分中,將各知覺解碼信號,i= 1,...,I連同其關聯增益校正指數e i (k)及增益校正異常旗標β i (k)一起輸入到一逆增益控制處理步驟或級24、241。第i 個逆增益控制處理步驟/級提供一增益校正信號框。
將所有I個增益校正信號框,i=1,...,I連 同指定向量 v AMB,ASSIGN(k)及元組集M DIR(k+1)及M VEC(k+1)饋到一聲道重指定步驟或級25,請參閱上述元組集M DIR(k+1)及M VEC(k+1)的定義。指定向量 v AMB,ASSIGN(k)係由I個分量組成,該等分量指出各傳輸聲道是否包含周圍HOA分量的一係數序列及包含哪一者。在聲道重指定步驟/級 25中,將增益校正信號框重分配,為要重建所有主要 聲音信號(即所有方向及向量為基信號)的訊框及周圍 HOA分量的一中間表示的訊框 C I,AMB(k)。此外,提供在第k訊框有效的周圍HOA分量的係數序列索引集,及周圍HOA分量的係數索引的資料集、及,其必須係賦能、去能及在第(k-1)訊框保持有效。
在一環音聲合成步驟或級27中,使用周圍HOA分量的係數序列的索引集(其係現用在第k訊框),從周圍HOA分量的中間表示的訊框 C I,AMB(k)中產生周 圍HOA分量框。由於與主要聲音HOA分量的同 步化,因此引入一訊框的延遲。
之後,空間HOA解碼器從I個信號及邊資訊中產生重建HOA表示,若在編碼端將周圍HOA分量變換到方向信號,則在步驟/級27中在解碼器端反轉該變換。
信號的潛在最大增益在HOA壓縮器內的增益控制處理步驟/級15、151前係高度依賴輸入HOA表示的值範圍,因此,首先定義一有意義值範圍用於輸入HOA表示,隨後在進入增益控制處理步驟/級前,在信號的潛在最大增益上作出斷定。
輸入HOA表示的正規化
用以使用本發明的處理,在那之前要實施(總)輸入HOA表示信號的正規化,執行一逐訊框處理以用於HOA壓縮,其中相關段落高階保真立體音響基本原理中在方程(54)中規定的時間連續HOA係數序列的向量 c (t),將原始輸 入HOA表示的第k訊框 C (k)定義為
其中k表示訊框索引,L表示訊框長度(依樣本),O=(N+1)2表示HOA係數序列的數目,及T S指出取樣期間。
如在歐洲專利號EP2824661 A1中提及,由於此等時域函數並非在呈現後由揚聲器所播放的信號,因此一HOA表示的有意義正規化自實際觀點看來,並非 藉由在個別HOA係數序列的值範圍上強加限制所達 成。反而,更便利的是考慮’等效空間域表示’,其係以HOA表示呈現到O個虛擬揚聲器信號w j (t),1 j O所得到。假設各別虛擬揚聲器位置係藉由一球面坐標系表達,其中假設各位置位在單位球面上及具有半徑‘1’。因此,位置係可由階依存方向,1 j O等效地表達,其中θ j (N)及分別表示斜度及方位角(亦請參閱圖6及其用於球面坐標系定義的說明)。此等方向應儘可能均勻地分布在單位球面上,用於特定方向的計算,請參閱如J.Fliege及U.Maier於1999年在多特蒙德大學數學系發表的技術報告,”計算球體體積公式之二階段方法(A two-stage approach for computing cubature formulae for the sphere)”,網址在http://www.mathematik.uni-dortmund.de/lsx/research/projects/fliege/nodes/nodes.html。此等位置通常係依賴’均勻分布在球面上’的定義類型,因此,並非不明確的。
定義值範圍用於虛擬揚聲器信號比定義值範圍用於HOA係數序列有利,係因可直覺地將用於前者的值範圍同等地設成區間[-1,1[,如用於傳統揚聲器信號假設PCM表示的情況。此導致一空間均勻分布量化誤差,以便量化有利地應用在相關實際聆聽的一領域中。在此相關情況中,一重要方面係可選擇每樣本的位元數係如通常用於傳統揚聲器信號時一樣低,即16,其增加效率,優於HOA係數序列的直接量化,其中通常要求每樣本較高位元數(如24或甚至32)。
為詳細說明空間域中的正規化過程,將所有虛擬揚聲器信號彙總在一向量中作為
w (t):=[w 1(t)...w O (t)] T , (2)其中(.) T 表示換位,相關虛擬方向 Ω j (N),1 j O的模式矩陣 由 Ψ 表示,其係由 定義,具有 可將呈現過程公式化為一矩陣乘法
w (t)=( Ψ )-1. c (t). (5)
使用此等定義,有關虛擬揚聲器信號的合理要求係:
揚聲器信號的總功率因此滿足條件
增益控制前用於信號值範圍的結果
假設執行輸入HOA表示的正規化係根據段落輸入HOA表示的正規化中的說明,以下考慮信號 y i ,i=1,...,I的值範圍,該等信號係輸入到HOA壓縮器中的增益控制處理單元15、151。此等信號係藉由將以下中的一或多者指定到I個可用聲道所產生:HOA係數序列,或主要聲音信號 x PS,d ,d=1,...,D,及/或周圍HOA分量 c AMB,n ,n=1,...,O(空間變換應用到其一部分)中的特定係數序列。因此在方程(6)的正規化假說下,必須分析所述此等不同信號類型的可能值範圍。由於所有信號種類係從原始HOA係數序列在中間計算,因此要看一下其可能值範圍。圖1A及圖2B中未繪示I個聲道中只包含一或多個HOA係數序列的情況,即在此類情況中不需HOA分解、周圍分量修改及對應的合成區塊。
用於HOA表示的值範圍的結果
從虛擬揚聲器信號中得到時間連續HOA表示係藉由
c (t)= Ψw (t), (8)其係方程(5)中操作的逆操作,因此使用方式(8)及(7),將所有HOA係數序列的總功率定界限如下:
∥ Ψ ∥2 2=K.O, (10a) 寫出模式矩陣的平方歐幾里德範數,其中
結合所有先前爭議及考量,提供一上限用於HOA係數序列數量如下:
重要的是,要注意到方程(6)中的條件隱含方程(11)中的條件,但反過來卻不然,即方程(11)不隱含方程(6)。另一重要方面係,在近乎均勻分布虛擬揚聲器位置的假說下,模式矩陣 Ψ 的行向量(其表示相關虛擬揚聲器位置的模式向量)幾乎互為正交,及各具有N+1的歐幾里德範數。此特性意指空間變換幾乎保留歐幾里德範圍,但一乘法常數除外,即
用於主要聲音信號的值範圍的結果
若為方向信號,此向量對應到相關一特定信號源方向 Ω S,1的模式向量,即 v 1= S ( Ω S,1) (14)
以下考量D個主要聲音信號 x d (t),d=1,...,D的一般情形,該等信號可集中在向量 x (t)中係根據
x (t)=[x 1(t) x 2(t)...x D (t)] T . (16)必須基於矩陣
V :=[ v 1 v 2... v D ] (17)以判定此等信號,該矩陣係由表示單聲道主要聲音信號x d (t),d=1,...,D的方向分布的所有向量 v d ,d=1,...,D形成。
用於主要聲音信號 x (t)的有意義萃取,將以下限制寫成公式:
a)得到各主要聲音信號作為原始HOA表示的係數序列的線性組合,即
x (t)= A . c (t), (18)
b)應選擇混合矩陣 A ,使其歐幾里德範數不超過值‘1’,即
範例用於混合矩陣的選擇
得到如何判定混合矩陣滿足限制(20)的範例係藉由計算主要聲音信號,使萃取後殘餘的歐幾里德範數減到最小,即
x (t)=argmin x (t)∥ V . x (t)- c (t)∥2 (26) 方程(26)中最小化問題的解係由 x (t)= V + c (t), (27)提供,其中(.)+指出莫耳-潘若斯(Moore-Penrose)偽逆。藉由比較方程(27)與方程(18),在此範例中,隨後發生混合矩陣等於矩陣 V 的莫耳-潘若斯(Moore-Penrose)偽逆,即 A = V +。 然而,仍必須選擇矩陣 V 滿足限制(19),即 若只是方向信號,其中矩陣 V 係模式矩陣相關一些來源信號方向 Ω S,d ,d=1,...,D,即 V =[ S ( Ω S,1) S ( Ω S,2)... S ( Ω S,D )], (29)則藉由選擇來源信號方向 Ω S,d ,d=1,...,D可滿足限制(28),使任二鄰近方向的距離不會太小。
結果用於周圍HOA分量的係數序列的值範圍
計算周圍HOA分量係藉由從原始HOA表示中減去主要聲音信號的HOA表示,即 c AMB(t)= c (t)- V . x (t). (30)若根據準則(20)以判定主要聲音信號 x (t)的向量,可推斷如下
周圍HOA分量的空間變換係數序列的值範圍
在歐洲專利號EP2743922 A1所揭露HOA壓縮處理中及在上述MPEG文件N14264中的另一方面係,總是選擇周圍HOA分量的第一O MIN個係數序列指定到傳輸聲道,其中O MIN=(N MIN+1)2,N MIN N通常係較小階,小於原始HOA表 示的階。為使此等HOA係數序列去相關,可將此等係數序列變換到一些預設方向 Ω MIN,d ,d=1,...,O MIN撞擊來的虛擬揚聲器信號(類似於段落輸入HOA表示的正規化中所述概念)。
定義周圍HOA分量的所有係數序列的向量具有階索引n N MIN(以 c AMB,MIN(t))及相關虛擬方向 Ω MIN,d ,d=1,...,O MIN的模式矩陣(以 Ψ MIN),得到所有虛擬揚聲器信號的向量(定義以) w MIN(t)如下:
在上述MPEG文件N14264中,係根據上述Fliege等人文章以選擇虛擬方向 Ω MIN,d ,d=1,...,O MIN,在圖4中繪示模式矩陣 Ψ MIN的反矩陣的各別歐幾里德範數以用於階N MIN=1,...,9,可看出 用於N MIN=1,...,9. (39)
a)係根據方程/限制(18)、(19)及(20)以計算所有主要聲音信號x(t)的向量;
b)若使用上述Fliege等人文章中定義的該等虛擬揚聲器位置時,最小階N MIN(其判定周圍HOA分量中應用空間變換的第一係數序列數目O MIN)必須低於’9’。
尤其,從圖3可推論出,若假設係根據Fliege等人文章 中的分配以選擇虛擬揚聲器方向,1 j O用於初始空間 變換,及若額外假設感興趣最大階係N MAX=29(如在MPEG 文件N14264中),則由於此特殊情況中<1.5,信號的 振幅在增益控制前不會超過值1.5O,即可選擇 1.5。
因此,底數’2’的各指數(於存取單位內描述一修改信號由增益控制處理單元從第一訊框直到目前訊框造成的總絕對振幅變化)可假設區間[e MIN,e MAX]內的任一整數值。因此,編碼所需(最低整數)位元數βe係提供如下
使用此位元數βe用於指數,確保可捕捉到HOA壓縮器增益控制處理單元15,...,151造成的所有可能絕對振幅變化,允許在壓縮表示內的一些預設登錄點開始解壓縮。
當HOA解壓縮器中開始壓縮HOA表示的解壓縮時,依增益控制步驟/級15,...,151中實施處理的相反方式,為應用一正確增益控制,在逆增益控制步驟或級24,...,241中使用非差分增益值(表示總絕對振幅變化,係指定到邊資訊用於一些資料框且從解多工器21中由接收的資料流中所接收)。
進一步實施例
當實施如段落HOA壓縮、空間HOA編碼、HOA分解 及空間HOA解碼中所述特殊HOA壓縮/分解系統時,用於指數編碼的位元總數βe必須根據方程(42)依一定標因子K MAX,DES設定,該定標因子本身係依賴待壓縮HOA表示的一 期望最大階N MAX,DES及特定虛擬揚聲器方向, 1 N N MAX。
例如,當根據Fliege等人文章以假設N MAX,DES= 29及選擇虛擬揚聲器方向時,合理選擇會是 1.5。在該情形中,保證正確壓縮用於階N的HOA表示,1 N N MAX,其係根據段落輸入HOA表示的正規化,使用相 同虛擬揚聲器方向進行正規化。然而,在 以下情形中無法提供此保證:若一HOA表示(用於效率理由)亦同等地依PCM格式由虛擬揚聲器信號表示,但其中 選擇虛擬揚聲器的方向,1 j O係與在系統設計階段假 設的虛擬揚聲器方向不同。
由於虛擬揚聲器位置的此不同選擇,即使此等虛擬揚聲器信號的振幅位在區間[1,1[內,仍不再能保證 信號的振幅在增益控制前不會超過值,及因此 無法保證此HOA表示具有適當正規化用於根據MPEG文件N14264中所述處理的壓縮。
在此情況中,有利的是具有一系統,其基於虛擬揚聲器位置的知識,提供虛擬揚聲器信號的最大允許振幅以確保各別HOA表示適用根據MPEG文件N14264中所述處理的壓縮。在圖5中繪示此一系統,其採取虛擬揚聲 器位置,1 j O作為輸入,其中O=(N+1)2,, 及提供虛擬揚聲器信號的最大允許振幅γ dB(用分貝測量)作為輸出。在步驟或級51中,係根據方程(3)以計算相關虛擬揚聲器位置的模式矩陣 Ψ ,在一隨後步驟或級52中,計算模式矩陣的歐幾里德範數∥ Ψ ∥2,在第三步驟或級53中,將振幅γ計算為‘1’及虛擬揚聲器位置數與K MAX,DES的平方根的乘積與模式矩陣的歐幾里德範數之間的商數中的最小值,即
從方程(9)中發現到HOA係數序列的數量係定界限如下
高階保真立體音響的基本原理
高階保真立體音響(HOA)係基於感興趣緊密區內的聲場描述,其係假設為無音源。在該情形中,由同質波方程完全實體判定感興趣區內在時間t及位置x的聲壓p(t,x)的時空反應。以下假設一球面坐標系,如圖6所示,在使用的坐標系中,x軸指向前方位置,y軸指向左方,及z軸指向上方。由一半徑r>0(即到坐標原點的距離)、一斜角θ[0,π](自極軸z(!)測得)及一方位角[0,2π[(在x-y平面中自x軸反時鐘方向測得)表示一空間位置。另外,(.) T 表示換位。
接著,可由”傅立葉聲學”教科書顯示,聲壓相關時間的傅立葉變換係由F t (.)表示,即
若聲場係由從角度元組(θ,)規定的所有可能方向抵達的無限個不同角頻率ω的平面諧波疊加來表示, 則可顯示(請參閱B.Rafaely的文章,”球體上之聲場藉由球面卷積之平面波分解(Plane-wave decomposition of the sound field on a sphere by spherical convolution),美國聲學學會期刋,第4(116)期,第2149-2157頁,2004年10月),各別平面波複合振幅函數C(ω,θ,)係可由以下球諧函數展開來表達:
實數值球諧函數的定義
實數值球諧函數(假設SN3D正規化,係根據J.Daniel於2001年6月在巴黎大學發表的博士論文,名稱為”聲場之表示,應用至多媒體環境中複合聲音場景之傳輸及再製(Représentation de champs acoustiques,application à la transmission et à la reproduction de scènes sonores complexes dans un contexte multimedia)”,章節3.1)係提供如下
實施本發明處理係可藉由單一處理器或電子電路,或藉由並聯操作或在本發明處理的不同部分操作的數個處理器或電子電路。
用以操作該處理器或該等處理器的指令可儲存在一或多個記憶體中。
11‧‧‧方向及向量估計處理步驟
12‧‧‧HOA分解處理步驟
13‧‧‧周圍分量修改處理步驟
14‧‧‧聲道指定步驟
15,151‧‧‧增益控制處理步驟
16‧‧‧知覺編碼器步驟
17‧‧‧邊資訊信號源編碼器步驟
18‧‧‧多工器
C (k)‧‧‧初始訊框
CAMB(k-1)‧‧‧周圍HOA分量之訊框
C M,A(k-1)‧‧‧修改周圍HOA分量
C P,M,A(k-1)‧‧‧暫預測修改周圍HOA分量
e 1(k-2),...,e I (k-2)‧‧‧指數
β1(k-2),...,β I (k-2)‧‧‧異常旗標
M DIR(k),M VEC(k), M DIR(k-1),M VEC(k-1)‧‧‧元組集
v A,T(k-1)‧‧‧目標指定向量
v A(k-2)‧‧‧最終指定向量
X PS(k-1)‧‧‧所有主要聲音信號框
y 1(k-2),..., y I (k-2)‧‧‧信號框
y P,1(k-1),..., y P,I (k-1))‧‧‧預測信號框
z 1(k-2),..., z I (k-2)‧‧‧信號
ζ(k-1)‧‧‧預測參數
Claims (2)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14306026 | 2014-06-27 | ||
EP14306026.7 | 2014-06-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202013356A true TW202013356A (zh) | 2020-04-01 |
TWI735083B TWI735083B (zh) | 2021-08-01 |
Family
ID=51178841
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112108235A TW202403729A (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
TW108142370A TWI735083B (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
TW110123995A TWI797658B (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
TW104120628A TWI681385B (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112108235A TW202403729A (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110123995A TWI797658B (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
TW104120628A TWI681385B (zh) | 2014-06-27 | 2015-06-26 | 對於高階保真立體音響資料框表示之壓縮判定用於描述非差分增益值表示的最低整數位元數之方法與裝置 |
Country Status (7)
Country | Link |
---|---|
US (3) | US9922657B2 (zh) |
EP (3) | EP4057280A1 (zh) |
JP (5) | JP6641303B2 (zh) |
KR (3) | KR20240047489A (zh) |
CN (6) | CN113808598A (zh) |
TW (4) | TW202403729A (zh) |
WO (1) | WO2015197516A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808598A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
EP2960903A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
US10075802B1 (en) | 2017-08-08 | 2018-09-11 | Qualcomm Incorporated | Bitrate allocation for higher order ambisonic audio data |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE522453C2 (sv) * | 2000-02-28 | 2004-02-10 | Scania Cv Ab | Sätt och anordning för styrning av ett mekaniskt tillsatsaggregat i ett motorfordon |
CN1138254C (zh) * | 2001-03-19 | 2004-02-11 | 北京阜国数字技术有限公司 | 一种基于小波变换的音频信号压缩编/解码方法 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
ATE527654T1 (de) * | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
WO2009001874A1 (ja) | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
EP2605244B1 (en) * | 2008-09-17 | 2015-11-04 | Panasonic Intellectual Property Management Co., Ltd. | Recording medium and playback device |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CA3097372C (en) * | 2010-04-09 | 2021-11-30 | Dolby International Ab | Mdct-based complex prediction stereo coding |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
CN102760437B (zh) * | 2011-04-29 | 2014-03-12 | 上海交通大学 | 实时声道控制转换的音频解码装置 |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
CN107071687B (zh) | 2012-07-16 | 2020-02-14 | 杜比国际公司 | 用于渲染音频声场表示以供音频回放的方法和设备 |
EP2733963A1 (en) * | 2012-11-14 | 2014-05-21 | Thomson Licensing | Method and apparatus for facilitating listening to a sound signal for matrixed sound signals |
EP2738962A1 (en) * | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
CN106471822B (zh) * | 2014-06-27 | 2019-10-25 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备 |
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
KR102606212B1 (ko) * | 2014-06-27 | 2023-11-29 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 데이터 프레임들 중 특정 데이터 프레임들의 채널 신호들과 연관된 비차분 이득 값들을 포함하는 코딩된 hoa 데이터 프레임 표현 |
CN113808598A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
-
2015
- 2015-06-22 CN CN202111089783.1A patent/CN113808598A/zh active Pending
- 2015-06-22 EP EP22165452.8A patent/EP4057280A1/en active Pending
- 2015-06-22 CN CN202111089841.0A patent/CN113808600A/zh active Pending
- 2015-06-22 KR KR1020247011011A patent/KR20240047489A/ko active Search and Examination
- 2015-06-22 US US15/319,711 patent/US9922657B2/en active Active
- 2015-06-22 JP JP2016575018A patent/JP6641303B2/ja active Active
- 2015-06-22 KR KR1020167036543A patent/KR102428425B1/ko active IP Right Grant
- 2015-06-22 EP EP18196350.5A patent/EP3489953B8/en active Active
- 2015-06-22 EP EP15732579.6A patent/EP3161821B1/en active Active
- 2015-06-22 CN CN201580035127.XA patent/CN106663434B/zh active Active
- 2015-06-22 CN CN202111089981.8A patent/CN113793618A/zh active Pending
- 2015-06-22 KR KR1020227026372A patent/KR102655047B1/ko active IP Right Grant
- 2015-06-22 WO PCT/EP2015/063917 patent/WO2015197516A1/en active Application Filing
- 2015-06-22 CN CN202111089797.3A patent/CN113808599A/zh active Pending
- 2015-06-22 CN CN202111089793.5A patent/CN113793617A/zh active Pending
- 2015-06-26 TW TW112108235A patent/TW202403729A/zh unknown
- 2015-06-26 TW TW108142370A patent/TWI735083B/zh active
- 2015-06-26 TW TW110123995A patent/TWI797658B/zh active
- 2015-06-26 TW TW104120628A patent/TWI681385B/zh active
-
2018
- 2018-02-07 US US15/891,066 patent/US10224044B2/en active Active
- 2018-12-03 US US16/208,284 patent/US10621995B2/en active Active
-
2019
- 2019-12-27 JP JP2019237723A patent/JP6872002B2/ja active Active
-
2021
- 2021-04-16 JP JP2021069477A patent/JP7275191B2/ja active Active
-
2023
- 2023-05-02 JP JP2023076033A patent/JP7516610B2/ja active Active
-
2024
- 2024-07-03 JP JP2024107100A patent/JP2024147600A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI728563B (zh) | 用於將聲音或聲場的高階保真立體音響(hoa)表示予以解碼的方法及裝置 | |
TWI686793B (zh) | 用於確定用於hoa資料框表示之壓縮的最低整數位元數的方法及設備,以及用於解碼聲音或聲場的壓縮的高階保真立體音響(hoa)聲音表示的方法及設備 | |
TWI689916B (zh) | 用以判定用於描述將振幅變化對應為2之指數之非差分增益值之表示之最低整數位元數以用於hoa資料框表示壓縮之方法及裝置以及用於執行其的電腦程式產品、編碼之hoa資料框表示以及用於儲存其的儲存媒體,以及解碼聲音或聲場之壓縮高階保真立體音響(hoa)聲音表示之方法及裝置 | |
JP2021105741A (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 | |
TW202431250A (zh) | 用以判定用於描述將振幅變化對應為2之指數之非差分增益值之表示之最低整數位元數以用於hoa資料框表示壓縮之方法及裝置以及用於執行其的電腦程式產品、編碼之hoa資料框表示以及用於儲存其的儲存媒體,以及解碼聲音或聲場之壓縮高階保真立體音響(hoa)聲音表示之方法及裝置 |