TW201517022A - 球面諧波係數之寫碼 - Google Patents
球面諧波係數之寫碼 Download PDFInfo
- Publication number
- TW201517022A TW201517022A TW103131238A TW103131238A TW201517022A TW 201517022 A TW201517022 A TW 201517022A TW 103131238 A TW103131238 A TW 103131238A TW 103131238 A TW103131238 A TW 103131238A TW 201517022 A TW201517022 A TW 201517022A
- Authority
- TW
- Taiwan
- Prior art keywords
- spherical harmonic
- harmonic coefficients
- threshold
- order
- clause
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 187
- 238000000034 method Methods 0.000 claims abstract description 137
- 238000009792 diffusion process Methods 0.000 claims description 41
- 239000000463 material Substances 0.000 claims description 41
- 230000006870 function Effects 0.000 claims description 40
- 238000009499 grossing Methods 0.000 claims description 35
- 238000005562 fading Methods 0.000 claims description 22
- 230000001131 transforming effect Effects 0.000 claims description 8
- 230000006835 compression Effects 0.000 description 23
- 238000007906 compression Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 12
- 230000003287 optical effect Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
大體而言,本發明描述用於寫碼表示一三維聲場之球面諧波係數之技術。一種包含一記憶體及一或多個處理器之器件可經組態以執行該等技術。該記憶體可經組態以儲存複數個球面諧波係數。該一或多個處理器可經組態以關於該複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
Description
本申請案主張2013年9月10日申請之美國臨時申請案第61/875,841號的權利。
本發明係關於音訊資料,且更特定言之,係關於音訊資料之寫碼。
高階立體混響(HOA)信號(常常藉由複數個球面諧波係數(SHC)或其他階層元素表示)為聲場之三維表示。此HOA或SHC表示可以獨立於局域揚聲器幾何結構之方式表示此聲場,該局域揚聲器幾何結構用以播放自此SHC信號所呈現的多通道音訊信號。此SHC信號亦可促進回溯相容性,此係由於此SHC信號可呈現為熟知的且高採用之多通道格式,諸如5.1音訊通道格式或7.1音訊通道格式。SHC表示可因此實現亦適應回溯相容性之聲場的更好表示。
大體而言,描述用於球面諧波係數之寫碼的技術。
在一態樣中,一種壓縮多通道音訊資料之方法包含關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
在另一態樣中,一種器件包含一或多個處理器,該一或多個處
理器經組態以關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
在另一態樣中,一種器件包含用於關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本的構件。
在另一態樣中,一種非暫時性電腦可讀儲存媒體儲存有指令,該等指令在被執行時使得一或多個處理器關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
在另一態樣中,一種壓縮音訊資料之方法,該方法包含:關於複數個球面諧波係數執行一能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數的一精簡版本;及基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
在另一態樣中,一種器件包含一或多個處理器,該一或多個處理器經組態以:關於複數個球面諧波係數執行一能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波之一精簡版本;及基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
在另一態樣中,一種器件包含:用於關於複數個球面諧波係數執行一能量分析以判定至少一個容能之構件,其中該複數個球面諧波係數中之至少一者具有大於1之一階;用於基於該複數個該等球面諧波係數動態地判定至少一個臨限值之構件;用於將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數的
一精簡版本之構件;及用於基於該複數個球面諧波係數之該精簡版本而產生一位元串流之構件。
在另一態樣中,一種非暫時性電腦可讀儲存媒體儲存有指令,該等指令在被執行時使得一或多個處理器:關於複數個球面諧波係數執行一能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數的一精簡版本;及基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
在另一態樣中,一種壓縮音訊資料之方法包含:針對一滑動時間窗,針對包括球面諧波係數之樣本的該音訊資料動態地判定複數個臨限值;及針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合。
在另一態樣中,一種器件包含一或多個處理器,該一或多個處理器經組態以:針對一滑動時間窗,針對包括球面諧波係數之樣本的音訊資料動態地判定複數個臨限值;及針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合。
在另一態樣中,一種器件包含:用於針對一滑動時間窗針對包括球面諧波係數之樣本的音訊資料動態地判定複數個臨限值之構件;用於針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合的構件。
在另一態樣中,一種非暫時性電腦可讀儲存媒體儲存有指令,該等指令在被執行時使得一或多個處理器:針對一滑動時間窗,針對包括球面諧波係數之樣本的音訊資料動態地判定複數個臨限值;及針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數
以便產生該等球面諧波係數之一精簡集合。
在另一態樣中,一種壓縮音訊資料之方法包含將對包括球面諧波係數之樣本的音訊資料以每階為基礎而動態地判定之複數個臨限值應用於複數個球面諧波係數以便產生該等球面諧波係數之一精簡集合。
在另一態樣中,一種器件包含一或多個處理器,該一或多個處理器經組態以將對包括球面諧波係數之樣本的音訊資料以每階為基礎而動態地判定之複數個臨限值應用於複數個球面諧波係數以便產生該等球面諧波係數之一精簡集合。
在另一態樣中,一種器件包含用於將對包括球面諧波係數之樣本的音訊資料以每階為基礎而動態地判定之複數個臨限值應用於複數個球面諧波係數以便產生該等球面諧波係數之一精簡集合的構件。
在另一態樣中,一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:針對球面諧波係數以每階為基礎而針對包括該等球面諧波係數之樣本的音訊資料動態地判定複數個臨限值;及將該等動態地判定之臨限值應用於該等球面諧波係數以便產生不包括該等球面諧波係數中存在於該等球面諧波係數之該等樣本中之至少一者的該等球面諧波係數之一精簡集合。
在另一態樣中,一種壓縮包含球面諧波係數之音訊資料的方法,該方法包含將至少一個臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
在另一態樣中,一種器件包含一或多個處理器,該一或多個處理器經組態以將至少一個臨限值應用於球面諧波係數以便產生該等球面諧波係數之一精簡集合,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
在另一態樣中,一種器件包含用於將至少一個臨限值應用於球面諧波係數以便產生該等球面諧波係數之一精簡集合的構件,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
在另一態樣中,一種非暫時性電腦可讀儲存媒體儲存有指令,該等指令在被執行時使得一或多個處理器將至少一個臨限值應用於球面諧波係數以便產生該等球面諧波係數之一精簡集合,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
該等技術之一或多個態樣的細節闡述於隨附圖式及以下描述中。此等技術之其他特徵、目標及優點將自描述及圖式以及自申請專利範圍顯而易見。
10A‧‧‧音訊編碼器件
10B‧‧‧音訊編碼器件
10C‧‧‧音訊編碼器件
11A‧‧‧球面諧波係數(SHC)
11B‧‧‧球面諧波係數(SHC)
11C‧‧‧經編碼SHC/經編碼音訊資料
11A'‧‧‧球面諧波係數(SHC)
11B'‧‧‧球面諧波係數(SHC)
12‧‧‧音訊壓縮單元
14‧‧‧音訊編碼單元
16‧‧‧位元串流產生單元
17‧‧‧位元串流
20‧‧‧能量分析單元
20A‧‧‧零階能量分析單元
20B‧‧‧非零階能量分析單元
21‧‧‧容能
21A‧‧‧零階容能
21B‧‧‧非零階容能
22‧‧‧臨限值應用單元
23‧‧‧臨限值
24‧‧‧位元遮罩產生單元
25‧‧‧位元遮罩
30‧‧‧時間-頻率分析單元
32‧‧‧擴散分析單元
33‧‧‧擴散百分比
34‧‧‧臨限值判定單元
35‧‧‧基線臨限值
36‧‧‧衰落單元
40‧‧‧音訊解碼器件/多通道饋飼
42‧‧‧提取單元
44‧‧‧音訊解碼單元
46‧‧‧逆時間-頻率分析單元
48‧‧‧音訊呈現單元
49‧‧‧通道/多通道音訊資料/揚聲器饋飼
49A‧‧‧通道
49N‧‧‧通道
110‧‧‧閘
112‧‧‧緊密HOA內容
圖1至圖3為說明各種階及子階之球面諧波基底函數的圖式。
圖4A至圖4C為說明可執行本發明中所述之技術的各種態樣以寫碼描述二維或三維聲場之球面諧波係數的實例音訊編碼器件之方塊圖。
圖5為說明可執行本發明中所述之技術的各種態樣以解碼描述二維或三維聲場之球面諧波係數的實例音訊解碼器件之方塊圖。
圖6為更詳細地說明圖5之實例中所示之音訊呈現單元的方塊圖。
圖7至圖11為各自說明音訊編碼器件在執行本發明中所述之技術的各種態樣時之例示性操作的流程圖。
圖12及圖13為各自說明音訊編碼器件在執行本發明中所述之技術的各種態樣時之例示性操作的圖式。
環繞聲之演進已使用於現今之娛樂的許多輸出格式可用。此等
環繞聲格式之實例包括風行之5.1格式(其包括以下六個通道:左前(FL)、右前(FR)、中心或前中心、左後或左環繞、右後或右環繞,及低頻效應(LFE))、成長之7.1格式,及即將來臨之22.2格式(例如,用於供超高清晰度電視標準使用)。其他實例包括用於球面諧波陣列之格式。
對未來MPEG編碼器之輸入視情況為三種可能格式中之一者:(i)傳統的基於通道之音訊,其意謂經由在預先指定之位置處的揚聲器來播放;(ii)基於物件之音訊,其涉及針對相關聯之後設資料含有位置座標(以及其他資訊)之單音訊物件的離散脈衝-碼調變(PCM)資料;及(iii)基於場景之音訊,其涉及使用球面諧波基底函數之係數(亦稱為「球面諧波係數」或SHC)表示聲場。
在市場中存在各種「環繞聲」格式。其範圍(例如)自5.1家庭影院系統(其已在超越立體聲進軍起居室方面最成功)變化至藉由NHK(Nippon Hoso Kyokai或Japan Broadcasting Corporation)所開發之22.2系統。內容創造者(例如,好萊塢影城)將樂意一次性針對電影產生原聲帶,而並非花努力來針對每一揚聲器組態重混合其。近來,標準委員會已考慮如下方式:將編碼提供至標準化位元串流中且在轉譯器之位置處提供對揚聲器幾何結構及聲學條件可調適且不可知的後續解碼。
為了針對內容創造者提供此靈活性,階層式組之元素可用以表示聲場。階層式組之元素可指代如下一組元素:元素經排序,使得一基礎組之較低階元素提供經模型化聲場的完全表示。由於該組擴展為包括較高階元素,因此表示變得更詳細。
階層式組之元素的一實例為一組球面諧波係數(SHC)。以下表達式使用SHC論證聲場之描述或表示:
此表達式展示,在聲場之任何點{rr,θr,φr}處的壓力pi可藉由SHC 獨特地表示。此處,,c為聲速(~343m/s),{rr,θr,φr}為參考點(或觀測點),jn(.)為階為n之球面貝塞爾函數,且為階為n且子階為m的球面諧波基底函數。可認識到,方括號中之術語為可藉由各種時間-頻率變換近似之信號(亦即,S(ω,rr,θr,φr))的頻域表示,該等變換諸如離散傅立葉變換(DFT)、離散餘弦變換(DCT)或子波變換。階層式組之其他實例包括多組子波變換係數及其他組之多解析度基底函數係數。
圖1為說明零階球面諧波基底函數(第一列)、一階球面諧波基底函數(第二列)及二階球面諧波基底函數(第三列)之圖式。階(n)係藉由表格之列來識別,其中第一列指代零階,第二列指代一階且第三列指代二階。子階(m)係藉由表格之行來識別,其更詳細地展示於圖3中。對應於零階球面諧波基底函數之SHC可被視為指定聲場之能量,而對應於剩餘的較高階球面諧波基底函數之SHC可指定彼能量的方向。
圖2為說明自零階(n=0)至四階(n=4)之球面諧波基底函數的圖式。如可見,針對每一階,存在子階m之擴展,其為易於說明之目的經展示但並未在圖2之實例中明顯地提到。
圖3為說明自零階(n=0)至四階(n=4)之球面諧波基底函數的另一圖式。在圖3中,球面諧波基底函數係展示於三維座標空間中,其中階及子階皆得以展示。
在任何情況下,SHC 可藉由各種麥克風陣列組態實體獲取(例如,記錄),或者,其可自聲場之基於通道或基於物件的描述導出。前者表示對編碼器之基於場景的音訊輸入。舉例而言,涉及
1+24(25,及因此四階)個係數之四階表示可得以使用。
為了說明此等SHC可自基於物件之描述導出的方式,考慮以下方程式。用於對應於個別音訊物件之聲場的係數可表達為
其中i為,為階為n之球面漢克爾函數(具有第二種類),且{rs,θs,φs}為物件之位置。已知源能量g(ω)隨頻率而變(例如,使用時間-頻率分析技術,諸如對PCM串流執行快速傅立葉變換)允許吾人將每一PCM物件及其位置轉換為SHC 。此外,可展示(因為上文為線性及正交分解),用於每一物件之係數係加性的。以此方式,眾多PCM物件可藉由係數表示(例如,作為用於個別物件之係數向量的總和)。基本上,此等係數含有關於聲場之資訊(隨3D座標而變之壓力),且在觀測點{rr,θr,φr}附近,上文表示自個別物件至整個聲場之表示的變換。下文在基於物件及基於SHC之音訊寫碼的情形中描述剩餘的諸圖。
圖4A至圖4C各自為說明可執行本發明中所述之技術的各種態樣以寫碼描述二維或三維聲場之球面諧波係數的實例音訊編碼器件10A-10C之方塊圖。在圖4A至圖4C之實例中的每一者中,音訊編碼器件10A-10C各自大體表示能夠編碼音訊資料之任何器件,諸如桌上型電腦、膝上型電腦、工作站、平板或平板觸摸電腦、專用音訊記錄器件、蜂巢式電話(包括所謂的「智慧型電話」)、個人媒體播放器器件、個人遊戲器件,或能夠編碼音訊資料的任何其他類型之器件。
儘管展示為單一器件(亦即,圖4A至圖4C之實例中的器件10A-10C),但下文引用為包括於器件10A-10C內之各種組件或單元可實際上來自在器件10A-10C外部的單獨器件。換言之,儘管在本發明中描述為藉由單一器件(亦即,圖4A至圖4C之實例中的器件10A-10C)執行,但該等技術可藉由包含多個器件之系統來實施或以其他方式執
行,其中此等器件中之每一者可各自包括下文更詳細地描述之各種組件或單元中的一或多者。因此,該等技術不應限於圖4A至圖4C之實例。
如圖4A之實例中所示,音訊編碼器件10A包含音訊壓縮單元12、音訊編碼單元14及位元串流產生單元16。音訊壓縮單元12可表示壓縮球面諧波係數(SHC)11A(「SHC 11A」)之單元。在一些例子中,音訊壓縮單元12表示無損地壓縮SHC 11A之單元。SHC 11A可表示複數個SHC,其中該複數個SHC中之至少一者具有大於1之階(其中具有此多樣性之SHC被稱為高階立體混響(HOA),以便與一實例為所謂的「B格式」之低階立體混響區分)。
亦即,SHC 11A可指代與一或多個球面諧波相關聯之係數。此等球面諧波可與傅立葉級數之三角基底函數相似。亦即,類似於傅立葉級數之三角函數可表示弦之振動之基本模式的方式,球面諧波可表示圍繞麥克風之球體之振動的基本模式。此等係數可藉由對涉及此等球面諧波之使用的在球面座標中之波動方程式求解來導出。在此意義上,SHC 11A可將環繞麥克風之3D聲場表示為一系列球面諧波,其中係數表示相應球面諧波之音量乘數。
低階立體混響(其亦可被稱為一階立體混響)可將聲音資訊編碼為表示為W、X、Y及Z之四個通道。此編碼格式常常被稱為「B格式」。W通道指代對應於全向麥克風之輸出的所俘獲聲音信號之非方向性單聲道組件。X、Y及Z通道為在三個維度上之方向性組件。X、Y及Z通道通常分別對應於三個8字形麥克風之輸出,其中一者面向前,其中另一者面向左且其中第三者面向上。此等B格式信號通常係基於聲場之球面諧波分解,且對應於在空間點處之壓力(W)及三個分量壓力梯度(X、Y及Z)。此等四個B格式信號(亦即,W、X、Y及Z)一起近似圍繞麥克風之聲場。正式地,此等B格式信號可表達多極展開式之一階
截斷。
高階立體混響指代表示使用更多通道之聲場的形式,從而表示與原始一階B格式相比更精細之形態組件。結果,高階立體混響可俘獲顯著更多的空間資訊。術語「高階立體混響」中之「高階」指代依據球面諧波對球體之函數的多形態展開式的更多項。藉由高階立體混響增加空間資訊可引起所俘獲聲音更好地表達為球體之上的壓力。使用高階立體混響來產生SHC 20A可實現所俘獲聲音藉由存在於音訊解碼器處之揚聲器的更好的重現。
在任何情況下,儘管音訊壓縮單元12可無損地壓縮SHC 11A,但通常,音訊壓縮單元12移除SHC 11A中在聲場經重現時描述聲場方面並非最重要或相關的彼等SHC 11A(因為一些SHC 11A可能不能夠藉由人類聽覺系統聽見)。在此意義上,當聲場自SHC 11A之經壓縮版本重現時,此壓縮之有損本質可能不會過度地影響聲場之所感知品質。
如圖4A之實例中所示,音訊壓縮單元12包括能量分析單元20、臨限值應用單元22及位元遮罩產生單元24。能量分析單元20表示接收SHC 11A且關於SHC 11A執行能量分析以便識別具有最重要的音訊資訊(其可指代在聲場經重現以供藉由人類聽覺系統消耗時對描述聲場最重要的資訊)之SHC 11A之階及/或子階的單元。能量分析單元20可以逐音訊訊框為基礎對SHC 11A進行操作。為了說明,能量分析單元20可針對SHC 11A之每一訊框判定能量,其中訊框可(例如)指代音訊信號之1024個樣本,每一樣本針對每訊框總共25×1024或25,600個SHC包含SHC 11A中之25個(例如,當階n設定為4時)。能量分析單元20可將用於階與子階之每一組合的容能21輸出至臨限值應用單元22。
在一些例子中,儘管未展示於圖4A之實例中,但能量分析單元20可包括可將平滑化函數應用於藉由能量分析單元20所判定之容能21的平滑單元。平滑化函數可使容能21平滑,以避免在突然移除SHC
11B及將SHC 11B引入至位元串流17中時的不連續性。平滑單元可分析基於藉由能量分析單元20對SHC 11A之先前及後續訊框之分析所產生的容能21。換言之,在臨限值應用單元22針對SHC 11A之當前訊框應用臨限值23之前,能量分析單元20可針對SHC 11A之後一訊框判定容能21。平滑單元可接著基於用於SHC 11A之前一訊框及後一訊框中之一或多者的容能使針對當前訊框所判定的容能21平滑。
臨限值應用單元22可表示將臨限值23應用於SHC 11A中具有大於零之階之彼等SHC 11A(其可被稱為「非零階SHC 11A」)的單元。臨限值應用單元22可能不將臨限值23應用於SHC 11A中之零階者(其可被稱為「零階SHC 11A」),假設SHC 11A之此SHC 11A對應於定義聲場之總能量的基底函數(換言之,其以一些方式表示何物可被視為聲場之增益)。在任何情況下,儘管展示為應用單一臨限值(亦即,圖4A之實例中的臨限值23),但臨限值應用單元22可應用多個臨限值,其中每一臨限值可對應於不同階、子階或階與子階之組合。
此外,臨限值應用單元22可基於待針對所得之位元串流17達成的目標位元速率應用不同的臨限值。亦即,在一些實例中,臨限值應用單元22可在目標位元速率為高(作為一實例,高於256千位元/秒(Kbps))時應用一或多個臨限值,且在目標位元速率為低(例如,等於或低於256Kbps)時應用不同組之一或多個臨限值。儘管未展示於圖4A之實例中,但臨限值應用單元22可判定目標位元速率(其可藉由使用者經由使用者介面組態或每應用程式設定,等),且比較此目標位元速率與臨限位元速率(其中256Kbps可表示上文實例中之臨限位元速率),以便判定應用各種不同的非零組之臨限值23的時間。在一些實例中,臨限值應用單元22可包括多個不同的臨限位元速率以在兩個、三個、四個或四個以上不同的非零組之臨限值23之間進行區分。
在任何情況下,臨限值應用單元22可將臨限值23應用於藉由能
量分析單元20所輸出之容能21,以便判定在所得之位元串流17中是否包括SHC 11A的各種階/子階組合。在一些實例中,臨限值應用單元22將臨限值23乘至對應於非零階SHC 11A之容能21,且比較此乘法之結果與對應於零階SHC 11A的容能21。
若此乘法之結果大於對應於零階SHC 11A之容能21,則臨限值應用單元22將1(或,換言之,具有值1之位元)輸出至位元遮罩產生單元24,且將非零階SHC 11A之相應階/子階傳遞至音訊編碼單元14。若此乘法之結果不大於對應於零階SHC 11A之容能21,則臨限值應用單元22將零(或,換言之,具有值零之位元)輸出至位元遮罩產生單元24,且並不將非零階SHC 11A之相應階/子階傳遞至音訊編碼單元14(有效地判定此等SHC 11A在描述聲場時並非最重要的且自所得之位元串流17濾波掉此等SHC 11A)。以此方式,臨限值應用單元22可將SHC 11B傳遞至音訊編碼單元14,其中在SHC 11A之階/子階組合中無一者自所得之位元串流17濾波掉時,SHC 11B可與SHC 11A相同。
位元遮罩產生單元24表示產生位元遮罩之單元,該位元遮罩識別SHC 11A中之一或多者針對給定的持續時間(其常常設定為音訊訊框之持續時間)是否存在於位元串流中。位元遮罩產生單元24可接收1位元值,且形成傳遞至位元串流產生單元16之位元遮罩25。
音訊編碼單元14可表示執行一形式之編碼以進一步壓縮SHC 11B之單元。在一些例子中,此音訊編碼單元14可表示進階音訊寫碼(AAC)編碼單元之一或多個執行個體。常常,音訊編碼單元14可針對在SHC 11B中剩餘之階/子階組合中的每一者調用AAC編碼單元之執行個體。亦即,針對零階SHC 11B,音訊編碼單元14可調用AAC編碼單元之第一執行個體,從而僅將零階SHC 11B傳遞至AAC編碼單元的此執行個體。若非零階SHC 11B之一階、零子階SHC 11B存在於SHC 11B中,則音訊編碼單元14可調用AAC編碼單元之第二不同的執行個
體以僅編碼SHC 11B的此等SHC 11B。關於SHC 11B可使用AAC編碼單元編碼之方式的更多資訊可在藉由Eric Hellerud等人之題為「Encoding Higher Order Ambisonics with AAC」的會議論文中找到,該論文係於2008年5月17日至20日在第124次會議上呈現且在以下網頁處可得:http://ro.uow.edu.au/cgi/viewcontent.cgi?article=8025&context=engpapers。音訊編碼單元14可將經編碼SHC 11C輸出至位元串流產生單元16。
位元串流產生單元16表示如下單元:格式化資料以符合已知格式(其可指代藉由解碼器件已知的格式),藉此產生位元串流17。位元串流產生單元16可包括多工器,該多工器多工位元遮罩25與經編碼SHC 11C以形成位元串流17。
以此方式,音訊編碼器件10A之音訊壓縮單元12可執行本發明中所述之技術以壓縮SHC 11A。亦即,音訊壓縮單元12可調用能量分析單元20來關於SHC 11A執行能量分析以判定至少一個容能21。音訊壓縮單元12可接下來調用臨限值應用單元22來將臨限值23應用於該至少一個容能21以產生該複數個球面諧波係數(亦即,圖4A之實例中的SHC 11B)之精簡版本,該精簡版本使SHC 11A中之至少一者自SHC 11A消除。音訊編碼器件10A可進一步調用位元串流產生單元16來基於SHC 11B產生位元串流17。
在一些例子中,當執行能量分析時,能量分析單元20可關於SHC 11A所對應於之階與子階之每一組合執行能量分析以產生對應於階與子階之每一組合的該至少一個容能21。在此例子中,當應用臨限值時,臨限值應用單元22可將臨限值應用於對應於階與子階之每一組合的容能21以判定是否消除SHC 11A之階與子階的相應組合,且基於判定消除SHC 11A中對應於階與子階之該組合的彼等SHC 11A以產生SHC 11B。
在一些例子中,當應用臨限值時,臨限值應用單元22可將與SHC
11A中具有大於1之階的彼等SHC 11A相關聯之該至少一個容能21乘以臨限值23以判定至少一個比較容能。臨限值應用單元22可接著判定該至少一個比較容能是否大於與SHC 11A中具有等於零之階的SHC 11A相關聯之該至少一個容能21,且基於判定消除SHC 11A中具有大於1之階的一或多個SHC 11A。
在一些例子中,能量分析單元20可將平滑化函數應用於該至少一個容能21以產生至少一個平滑容能。當應用臨限值時,臨限值應用單元22可將臨限值23應用於該至少一個平滑容能以產生SHC 11B。
在一些例子中,音訊編碼器件10A可調用位元遮罩產生單元24來產生位元遮罩25以識別SHC 11A中自SHC 11B包括及消除之SHC 11A。在此例子中,當產生位元串流17時,位元串流產生單元16產生位元串流17以包括位元遮罩25。
在一些例子中,音訊編碼器件10A可調用音訊編碼單元14來根據音訊編碼方案音訊編碼SHC 11B以產生經編碼音訊資料11C,其中位元串流產生單元17可在產生位元串流17時產生位元串流17以包括經編碼音訊資料11C。在一些實例中,音訊編碼方案包含進階音訊編碼(AAC)方案。在一些實例中,音訊編碼方案包含參數通道間音訊編碼方案,諸如動畫專家組(MPEG)環繞聲。
圖4B為說明可執行該等技術之各種態樣以壓縮音訊資料之音訊編碼器件10B的另一實例之方塊圖。音訊編碼器件10B可類似於音訊編碼器件10A在於:音訊編碼器件10B包括能量分析單元20A及20B(「能量分析單元20」)、臨限值應用單元22、位元遮罩產生單元24、音訊編碼單元14及位元串流產生單元16。然而,音訊編碼器件10B進一步包括時間-頻率分析單元30、擴散分析單元32、臨限值判定單元34及衰落單元36。
時間-頻率分析單元30可表示經組態以執行SHC 11A之時間-頻率
分析以便將SHC 11A自時域變換至頻域的單元。時間-頻率分析單元30可輸出SHC 11A',SHC 11A'可表示如在頻域中所表達之SHC 11A。儘管關於時間-頻率分析單元30描述,但該等技術可關於時域中留下之SHC 11A來執行而非關於如變換至頻域的SHC 11A'來執行,如圖4C之實例中所示。
擴散分析單元32可表示經組態以執行一形式之擴散分析以識別藉由包括漫射聲(其可指代具有低層級之方向或較高階SHC之聲音,從而意謂具有大於零或1之階的SHC)之SHC 11A'所表示的聲場百分比的單元。作為一實例,擴散分析單元32可以類似於藉由Ville Pulkki之論文中所述之方式的方式執行擴散分析,該論文於2007年6月出版於J.Audio Eng.Soc.第55卷第6號中且題為「Spatial Sound Reproduction with Directional Audio Coding」。在一些例子中,當執行擴散分析以判定擴散百分比33時,擴散分析單元32可僅分析SHC 11A'之非零子集,諸如SHC 11A'之零階及一階SHC 11A'。擴散分析單元32可將擴散百分比33輸出至臨限值判定單元34。
臨限值判定單元34可表示經組態以判定臨限值23以供藉由臨限值應用單元22使用之單元。在一些例子中,臨限值判定單元34可基於擴散百分比而動態地判定臨限值23。在一些例子中,臨限值判定單元34可每頻率區間動態地判定臨限值23(當SHC 11A自時域變換至頻域時,諸如在圖4B之實例中)以產生適用於頻率區間中之一或多者的臨限值23。在一些實例中,臨限值判定單元34可基於SHC 11A'之階而動態地判定臨限值23以產生一或多個特定階臨限值23。在一些實例中,臨限值判定單元34可基於SHC 11A'之子階判定臨限值23以產生一或多個特定子階臨限值23。在一些實例中,臨限值判定單元34可基於SHC 11A'之階及子階而動態地判定臨限值23以產生特定階、子階臨限值23。在一些實例中,臨限值判定單元34可基於位元串流17待對應於之
目標位元速率而動態地判定臨限值23。儘管為易於說明之目的描述為藉以判定臨限值之單獨方式,但臨限值判定單元34可基於前述實例之任何組合判定臨限值23。
在以上實例中之每一者中,臨限值判定單元34可使臨限值之動態產生基於基線臨限值35。基線臨限值35可表示可藉由使用者組態之臨限值35。在一些實例中,一個以上基線臨限值35可得以定義,其中基線臨限值35中之每一者可對應於位元串流17待對應於之不同的目標位元速率。以此方式,臨限值判定單元34可判定特定目標位元速率臨限值,其中一或多個較高的臨限值可針對較低的目標位元速率產生且一或多個較低(相對地)的臨限值可針對較高的目標位元速率產生。臨限值判定單元34可將臨限值23輸出至臨限值應用單元22。
零階能量分析單元20A可表示經組態以關於SHC 11A'中具有等於零之階的彼等SHC 11A'執行能量分析之單元。零階能量分析單元20A可以類似於上文關於圖4A之實例中所示的音訊編碼器件10A之能量分析單元20所述之方式的方式關於SHC 11A'之此等SHC 11A'執行能量分析以產生零階容能21A。非零階能量分析單元20B可表示經組態以關於SHC 11A'中具有大於零之階的彼等SHC 11A'執行能量分析之單元。非零階能量分析單元20B可以類似於上文關於圖4A之實例中所示的音訊編碼器件10A之能量分析單元20所述之方式的方式關於SHC 11A'之此等SHC 11A'執行能量分析以產生非零階容能21B。如上文關於圖4A之實例中所示的音訊編碼器件10A之能量分析單元20所提到,音訊編碼器件10B之能量分析單元20中的一者或兩者可包括平滑單元以出於上文所提到之原因使容能21A及21B(「容能21」)平滑。
假設如下文更詳細地描述之臨限值可以每階、子階、階及子階兩者、頻率區間或其他基礎或基礎之組合為基礎來應用,則能量分析單元20可同樣以此等基礎中之一或多者或基礎之組合為基礎來產生容
能21。因此,儘管上文描述為產生容能,但能量分析單元20可以每個為基礎或以上文所提到之基礎的組合以及上文並未明確地闡述之任何其他類似基礎為基礎來產生多個容能。
臨限值應用單元22可類似於上文關於圖4A之實例所述的臨限值應用單元22,除了圖4B之實例的臨限值應用單元22可應用動態地判定之臨限值23以外。在一些例子中,臨限值應用單元22可關於SHC 11A'之不同的非零子集應用臨限值23中之每一者。舉例而言,當臨限值32已基於SHC 11A'之階動態地判定時,臨限值23可為階特定的,使得在被應用時,臨限值應用單元22僅將臨限值23中之每一者應用於SHC 11A'中具有相應階之該等SHC 11A'。臨限值應用單元22可以類似型式應用根據上文所列出之實例中之每一者所判定的臨限值23。並非以類似於上文關於圖4B之實例所述之方式的方式輸出SHC 11B,而是臨限值應用單元22可將SHC 11A'輸出至衰落單元36。臨限值應用單元22亦可將一系列1及零輸出至類似於上文所述之位元遮罩產生單元24的位元遮罩產生單元24。
衰落單元36可表示如下單元:經組態以基於對位元遮罩產生單元24之1及零輸出淡入及淡出SHC 11A'中經移除或重新引入(在自SHC 11A'先前移除或消除之後)的彼等SHC 11A'。衰落單元36可緩慢地淡入SHC 11A'中重新引入至SHC 11B之精簡集合的彼等SHC 11A',且緩慢地淡出SHC 11A'中自SHC 11B之精簡集合移除的彼等SHC 11A'。衰落單元36可類似於上文所述之平滑化函數考慮SHC 11A'之後續及/或先前訊框以避免突然轉變。
音訊編碼單元14可類似於上文關於圖4A之實例所述的音訊編碼單元14來操作以產生經編碼音訊資料11C。同樣,位元串流產生單元16可類似於上文關於圖4A之實例所述的位元串流產生單元16來操作以基於經編碼音訊資料11C產生位元串流17。
在操作中,音訊編碼器件10B可執行本發明中所述之技術以壓縮音訊資料(亦即,在圖4B之實例中的SHC 11A)。當執行該等技術時,音訊編碼器件10B可調用能量分析單元20來關於SHC 11A'執行能量分析以判定容能21。音訊編碼器件10B亦可調用臨限值判定單元34來基於SHC 11A'動態地判定至少一個臨限值23。音訊編碼器件10B可接著調用臨限值應用單元22來將動態地判定之至少一個臨限值23應用於容能21以產生球面諧波係數的精簡版本,亦即,圖4B之實例中的SHC 11B。音訊編碼器件10B可調用位元串流產生單元16來基於SHC 11B之經編碼版本產生位元串流17,該經編碼版本被稱為圖4B之實例中的經編碼音訊資料11C。
在一些實例中,臨限值判定單元34在動態地判定臨限值23時基於具有等於零之階及等於1之階的SHC 11A'之擴散分析(諸如,藉由擴散分析單元32所執行之擴散分析)而動態地判定臨限值23。在其他實例中,臨限值判定單元34在動態地判定臨限值23時以每階為基礎而針對SHC 11A'動態地判定臨限值23。在其他實例中,臨限值判定單元34在動態地判定臨限值23時以每子階為基礎而針對SHC 11A'動態地判定臨限值23。在其他實例中,臨限值判定單元34在動態地判定臨限值23時以階及子階為基礎而針對SHC 11A'動態地判定臨限值23。
在一些實例中,音訊編碼器件10B調用時間-頻率分析單元30來將SHC 11A自時域變換至頻域以便產生經變換之複數個球面諧波係數(亦即,圖4B之實例中的SHC 11A')。臨限值判定單元34可在動態地判定臨限值23時以每頻率區間為基礎而針對SHC 11A'動態地判定臨限值23。在一些實例中,當應用動態地判定之臨限值23時,臨限值應用單元22可將動態地判定之臨限值23應用於容能21B以產生經變換之複數個球面諧波係數的精簡版本,該精簡版本使球面諧波係數中之至少一者自經變換之複數個球面諧波係數消除,該精簡版本在圖4B之實例
中表示為SHC 11B。
在一些例子中,當執行能量分析時,能量分析單元20A可關於SHC 11A'中具有等於零之階的彼等SHC 11A'執行能量分析以判定零階容能21A,而能量分析單元20B可關於SHC 11A'中具有大於零之階的彼等SHC 11A'執行能量分析以判定非零階容能21B。
在一些例子中,當執行能量分析時,能量分析單元20B可關於SHC 11A'所對應於之階與子階之每一組合執行能量分析以產生對應於階與子階之每一組合的容能21B。當應用動態地判定之臨限值23時,臨限值應用單元22可將臨限值23應用於對應於階與子階之每一組合的容能21B以判定是否消除SHC 11A'之階與子階的相應組合。衰落單元36可接著基於判定消除SHC 11A'中對應於階與子階之組合的彼等SHC 11A'以產生SHC 11B。
在一些例子中,當應用動態地判定之臨限值23時,臨限值應用單元22可將容能21B乘以動態地判定之臨限值23以判定至少一個比較容能。臨限值應用單元22可接著判定該至少一個比較容能是否大於與SHC 11A'中具有等於零之階的彼等SHC 11A'相關聯之容能21A,從而輸出零以指示SHC 11A'中具有大於零之階的彼等SHC 11A'中之一或多者已被消除。衰落單元36可接著淡出SHC 11A'中之彼等SHC 11A'以有效地消除SHC 11A'中具有更大之階的一或多個SHC 11A'。
在一些實例中,能量分析單元20中之一者或兩者可將平滑化函數應用於容能21A及21B中之一者或兩者以產生一或多個平滑化容能。當應用動態地判定之臨限值23時,臨限值應用單元22可將動態地判定之臨限值23應用於該一或多個平滑化容能以產生1及零,該等1及零傳遞至衰落單元36以便產生SHC 11B。
在一些例子中,音訊編碼器件10B可調用位元遮罩產生單元24來產生位元遮罩25以識別SHC 11A'中自SHC 11A包括及消除以形成SHC
11B的SHC 11A'。在此等例子中,當產生位元串流17時,位元串流產生單元16可產生位元串流17以包括位元遮罩25。
在一些例子中,音訊編碼器件10B可調用音訊編碼單元14來根據音訊編碼方案編碼SHC 11B以產生經編碼音訊資料11C。當產生位元串流17時,位元串流產生單元16可產生位元串流17以包括經編碼音訊資料11C。在一些實例中,音訊編碼方案包含進階音訊編碼(AAC)方案。
在一些例子中,如上文所提到,音訊編碼器件10B可調用衰落單元36來在產生SHC 11B時將衰落函數應用於SHC 11A'。
就此而言,該等技術可使得臨限值判定單元34能夠針對滑動時間窗針對包括SHC 11A之音訊資料動態地判定臨限值23。該等技術可進一步使得臨限值應用單元22能夠針對滑動時間窗將動態地判定之臨限值23應用於SHC 11A',以便結合衰落單元36工作來產生不包括存在於SHC 11A'中之球面諧波係數中之至少一者的SHC 11B。
在一些實例中,滑動時間窗包含音訊訊框,其中音訊訊框可包含SHC 11A'之1024個樣本。因此,在一些實例中,臨限值應用單元22可接收SHC 11A'之1024個樣本,其中四階立體混響之每一樣本包括用於總共25,600個SHC的25個不同的係數。臨限值應用單元22可將臨限值23應用於此等SHC 11A',以判定在訊框期間之任何點處,具有大於零之階的SHC 11A'是否提供顯著資訊。若在訊框期間,給定階與子階組合之SHC 11A'中無一者提供顯著資訊,則臨限值應用單元22可針對彼階/子階組合輸出零,藉此衰落單元36可淡出SHC 11A'中的對應於彼階/子階組合的彼等SHC。以此方式,臨限值判定單元34可以逐訊框為基礎而針對SHC 11A'動態地判定臨限值23。
在一些實例中,滑動時間窗表示針對球面諧波係數中的具有較低階之彼等球面諧波係數的較大時間窗,及針對球面諧波係數中的具
有較高階之彼等球面諧波係數的相對較小時間窗。換言之,窗大小可基於SHC 11A'之階而變化,使得針對SHC 11A'中的具有較低階(諸如,小於或等於1之階)的彼等SHC,該窗設定為全訊框(或作為一實例,SHC 11A'之1024個樣本)。針對SHC 11A'中的具有大於1之階的彼等SHC(作為一實例),該窗可設定為128個樣本或在該等窗重疊之情況下可能更大。具有較短窗允許更快速地改變的更具適應性之定限,而較長窗允許較不快速地(相對地)改變的較不具適應性之定限。由於每訊框使用八個窗(1024/128等於八),臨限值應用單元22可每訊框將1及零輸出至位元遮罩產生單元24八次,其中1及零之位元遮罩可針對192個位元之總位元遮罩將24個位元(假設SHC 11A'中之零階SHC始終包括於位元串流17中)使用八次來指定。
此外,該等技術之各種態樣亦可使得音訊編碼器件10B能夠以每階為基礎而針對SHC 11A'動態地判定臨限值23(其中階指代與SHC 11A'相關聯之階n)。亦即,臨限值判定單元34可以每階為基礎而針對SHC 11A'判定臨限值23。臨限值判定單元22可接著將動態地判定之臨限值23應用於SHC 11A',以便結合衰落單元36工作來產生SHC 11B。
在一些實例中,臨限值判定單元34可在動態地判定臨限值23時針對球面諧波係數(球面諧波係數中的具有零之階及子階的彼等球面諧波係數除外)的階與子階之每一組合而動態地判定24個臨限值,其中球面諧波係數之最大階為4。
在一些例子中,當動態地判定臨限值23時,臨限值判定單元34可針對滑動時間窗以每階為基礎而針對SHC 11A'動態地判定該複數個臨限值,如上文所述。在此等例子中,滑動時間窗表示針對球面諧波係數中的具有較低階之彼等球面諧波係數的較大的時間窗,及針對球面諧波係數中具有較高階之彼等球面諧波係數的相對較小時間窗。
此外,該等技術之各種態樣可使得音訊編碼器件10B能夠調用臨
限值判定單元34來基於SHC 11A'之擴散分析而動態地判定臨限值23。在一些例子中,當動態地判定臨限值23時,臨限值判定單元34可基於SHC 11A'中具有等於零之階及等於1之階的至少彼等SHC 11A'之擴散分析而動態地判定臨限值23。臨限值應用單元22可接著將動態地判定之臨限值23應用於SHC 11A',以便結合衰落單元36工作來產生SHC 11B。
在一些例子中,當動態地判定臨限值23時,臨限值判定單元34可基於擴散分析且以類似於上文所述之方式的方式以每階為基礎而動態地判定複數個臨限值23。在此等例子中,當動態地判定臨限值23時,臨限值判定單元34可針對SHC 11A'(除了SHC 11A'中具有為零之階及子階的彼等SHC 11A'以外)的階與子階之每一組合動態地判定24個臨限值,其中球面諧波係數之最大階為4。
在一些例子中,當動態地判定臨限值23時,臨限值判定單元34可針對滑動時間窗基於擴散分析而動態地判定臨限值23。在此等例子中,滑動時間窗表示針對球面諧波係數中的具有較低階之彼等球面諧波係數的較大的時間窗,及針對球面諧波係數中具有較高階之彼等球面諧波係數的相對較小時間窗。
圖4C為說明可執行該等技術之各種態樣以壓縮音訊資料之音訊編碼器件10C的另一實例之方塊圖。音訊編碼器件10C可實質上類似於音訊編碼器件10B,除了衰落單元36移除SHC之非變換版本(亦即,圖4C之實例中的SHC 11A)以外。就此而言,該等技術可使得位元串流17能夠基於在時域中所表達之SHC 11A而非在頻域中所表達之SHC 11A'來產生。
因此,並非編碼所有SHC 11A或SHC 11A'(此情形將可能需要大的頻寬以用於傳輸及儲存資料),而是該等技術可經由定限降低頻寬要求。換言之,為了減少SHC之數目,該等技術可僅傳輸且儲存最重
要的SHC,同時基於動態信號能量臨限值(亦即,圖4A至圖4C之實例中的臨限值23)抑制所有其他SHC。能量臨限值可藉由0階SHC之能量相對於較高階SHC來估計。若較高階SH係數含有小於同時在0階中發現之能量的預定義比率,則此較高階係數可得以抑制。以此方式,頻寬減小得以達成。
在一些例子中,預定義臨限值可經提供以考慮所使用之SH正規化方案,使得基於球面諧波之階或子階不存在偏差。
在一些例子中,為了減少所需要之SHC的數目,且為了避免感知假影,該等技術可動態地調整此臨限值且以多解析度方式-基於數個參數及條件。此等參數可包含a)觀測時間窗,b)頻率內容,c)頻率相依之觀測時間,d)與SHC相關之立體混響階,e)漫射聲估計,及/或跨越立體混響係數之相干量測。
更詳細地,a)上文可涉及在持續時間係可調整(最可能達至約300ms,但並非真正受限)之滑動窗內執行能量分析。此窗可防止SHC過於迅速地將其經偵測狀態自「作用中」改變至「受抑制」。當改變其狀態時,該等技術亦可對SHC使用淡入及淡出以可能地避免所謂的「拉鏈」雜訊。
更詳細地,b)上文可涉及隨時間頻率(間距)而變而執行能量分析以說明人類聽覺系統之頻率相依敏感性。可使在a)中所述之滑動時間窗的長度隨頻率而變,從而使分析為「多解析度的」。
更詳細地,c)上文可涉及使上文在a)中所述之滑動窗的長度為SH模式之函數,使得較高形態SHC在較小的時間窗內得以分析,從而使分析為多解析度的。
更詳細地,d)上文可涉及藉由增大之立體混響階將能量臨限值加權為較高,從而可能地確保較高階SHC(與較低階SHC相比)的較大抑制。
更詳細地,e)上文可涉及藉由跨越SHC之所計算「擴散」或「相干」量測而控制能量臨限值。在漫射聲場景中(諸如,在混響記錄中),擴散內容可僅藉由較低階SHC來描述。針對突然的非擴散事件(諸如,鼓掌),擴散量測可減少,且較高階SHC較不可能受到抑制。
圖5為說明可執行本發明中所述之技術的各種態樣以解碼描述三維聲場之球面諧波係數的實例音訊解碼器件40之方塊圖。音訊解碼器件40大體表示能夠解碼音訊資料之任何器件,諸如桌上型電腦、膝上型電腦、工作站、平板或平板觸摸電腦、專用音訊記錄器件、蜂巢式電話(包括所謂的「智慧型電話」)、個人媒體播放器器件、個人遊戲器件,或能夠解碼音訊資料的任何其他類型之器件。
一般而言,音訊解碼器件40執行與藉由音訊編碼器件10A-10C中之任一者所執行之音訊編碼處理程序互逆的音訊解碼處理程序,除了執行定限以外,該定限通常藉由音訊編碼器件10A-10C使用以促進外來的不相關資料(例如,將不能夠藉由人類聽覺系統感知之資料)之移除。換言之,音訊編碼器件10A-10C可移除音訊資料中之一些音訊資料,此係由於典型的人類聽覺系統可能不能夠辨別精確度在此等區域中之缺乏。假設此音訊資料係不相關的,音訊解碼器件4無需執行空間分析以再插入此外來的音訊資料。
儘管展示為單一器件(亦即,圖5之實例中的器件40),但下文引用為包括於器件40內之各種組件或單元可形成在器件40外部的單獨器件。換言之,儘管在本發明中描述為藉由單一器件(亦即,圖5之實例中的器件40)執行,但該等技術可藉由包含多個器件之系統來實施或以其他方式執行,其中此等器件中之每一者可各自包括下文更詳細地描述之各種組件或單元中的一或多者。因此,該等技術不應限於圖5之實例。
如圖5之實例中所示,音訊解碼器件40包含提取單元42、音訊解
碼單元44、逆時間-頻率分析單元46及音訊呈現單元48。提取單元42表示經組態以既提取位元遮罩25且亦基於位元遮罩25提取經編碼音訊資料11C之單元。提取單元42將經編碼音訊資料11C輸出至音訊解碼單元44。音訊解碼單元44表示解碼經編碼音訊資料(常常根據互逆音訊解碼方案,諸如AAC解碼方案)以便復原SHC 11B之單元。音訊解碼單元44將SHC 11B(其在此實例中假設為處於頻域中)輸出至逆時間-頻率分析單元46。
逆時間-頻率分析單元46可表示經組態以執行SHC 11B之逆時間-頻率分析以便將SHC 11B自頻域變換至時域的單元。逆時間-頻率分析單元46可輸出SHC 11B',SHC 11B'可表示如在時域中所表達之SHC 11B。儘管關於逆時間-頻率分析單元46描述,但該等技術可關於頻域中之SHC 11B執行而非關於時域中之SHC 11B'執行。
音訊呈現單元48表示經組態以呈現通道49A-49N(「通道49」,其亦可大體被稱為「多通道音訊資料49」或被稱為「揚聲器饋飼49」)之單元。音訊呈現單元48可將變換(常常以矩陣之形式表達)應用於SHC 11B'。因為SHC 11B'以三個維度來描述聲場,所以SHC 11B'表示以能夠適應大多數解碼器-局域揚聲器幾何結構(其可指代將播放多通道音訊資料49之揚聲器之幾何結構)的方式促進多通道音訊資料49之呈現的音訊格式。下文關於圖6描述關於多通道音訊資料49之呈現的更多資訊。
圖6為更詳細地說明圖5之實例中所示的音訊解碼器件40之音訊呈現單元48的方塊圖。大體而言,圖6說明自SHC 11B'至與解碼器-局域揚聲器幾何結構相容之多通道音訊資料49的轉換。針對一些局域揚聲器幾何結構(其再次可指代在解碼器處之揚聲器幾何結構),確保可逆性之一些變換可導致低於合乎需要的音訊-影像品質。亦即,當與經俘獲之音訊比較時,聲音重現可能並非始終引起聲音之正確局域
化。為了校正此低於合乎需要的影像品質,該等技術可經進一步擴增以引入可被稱為「虛擬揚聲器」之概念。
並非要求一或多個揚聲器重新定位或定位於具有藉由標準(諸如,上文所提到之ITU-R BS.775-1)所指定之某些角容限的特定或所定義之空間區域中,而是以上構架可經修改以包括某形式之水平移動,諸如向量基振幅水平移動(VBAP)、基於距離之振幅水平移動或其他形式之水平移動。為說明之目的聚焦於VBAP,VBAP可有效地引入可表徵為「虛擬揚聲器」之物。VBAP可大體修改對一或多個揚聲器之饋飼,使得此等一或多個揚聲器有效地輸出如下聲音:表現為發源於在不同於該一或多個揚聲器之位置及/或角度中之至少一者的位置及角度中支援虛擬揚聲器的一或多者處的虛擬揚聲器。
為了說明,用於依據SHC判定揚聲器饋飼之以下方程式可如下:
在以上方程式中,VBAP矩陣之大小為M列乘N行,其中M表示揚聲器之數目(且將在以上方程式中等於五)且N表示虛擬揚聲器的數目。VBAP矩陣可隨自收聽者之所定義位置至揚聲器之位置中的每一者的向量及自收聽者之所定義位置至虛擬揚聲器之位置中的每一者的向量而變來計算。以上方程式中之D矩陣的大小可為N列乘(階+1)2行,其中階可指代SH函數之階。D矩陣可表示以下
g矩陣(或向量,假設僅存在單一行)可表示針對配置於解碼器-局域幾何結構中之揚聲器之揚聲器饋飼的增益。在方程式中,g矩陣之大小為M。A矩陣(或向量,假設僅存在單一行)可表示SHC 20A,且大小為(階+1)(階+1),其亦可表示為(階+1)2。
實際上,VBAP矩陣為提供可被稱為「增益調整」之物的M×N矩陣,「增益調整」將揚聲器之位置及虛擬揚聲器之位置列為重要因素。以此方式引入水平移動可引起多通道音訊之更好的重現,該多通道音訊在藉由局域揚聲器幾何結構重現時產生更好品質影像。此外,藉由將VBAP併入至此方程式中,該等技術可克服並不與在各種標準中所指定之揚聲器幾何結構對準的差的揚聲器幾何結構。
實務上,方程式可經逆轉且用以針對揚聲器之特定幾何結構或組態(其在本發明中再次可被稱為解碼器-局域幾何結構)將SHC 20A變換回至多通道饋飼40。亦即,方程式可經逆轉以針對g矩陣求解。經逆轉方程式可如下:
在此實例中,g矩陣可針對5.1揚聲器組態中之五個揚聲器中的每一者表示揚聲器增益。在此組態中所使用之虛擬揚聲器位置可對應於在5.1多通道格式規範或標準中所定義之位置。可支援此等虛擬揚聲器中之每一者的揚聲器之位置可使用任何數目種已知的音訊局域化技術來判定,其中許多技術涉及播放具有特定頻率之音調以關於頭端單元(諸如,音訊/視訊接收器(A/V接收器)、電視、遊戲系統、數位視訊光碟系統,或其他類型之頭端系統)判定每一揚聲器的位置。或者,頭端單元之使用者可手動地指定揚聲器中之每一者的位置。在任何情
況下,給定此等已知的位置及可能之角度,頭端單元可對增益求解,從而藉由VBAP假設虛擬揚聲器之理想組態。
就此而言,該等技術可使得器件或裝置能夠對該複數個虛擬通道執行向量基振幅水平移動或其他形式之水平移動以產生如下複數個通道:驅動解碼器-局域幾何結構中之揚聲器以發出表現為發源於在不同局域幾何結構中所組態之虛擬揚聲器的聲音。該等技術可因此使得音訊解碼器件40能夠對該複數個球面諧波係數(諸如,SHC 11B')執行變換,以產生複數個通道。該複數個通道中之每一者可與空間之相應不同區域相關聯。此外,該複數個通道中之每一者可包含複數個虛擬通道,其中該複數個虛擬通道可與空間之相應不同區域相關聯。在一些例子中,該等技術可使得器件能夠對虛擬通道執行向量基振幅水平移動以產生多通道音訊資料49之該複數個通道。
圖9為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4A之實例中所示的音訊編碼器件10A)之例示性操作的流程圖。音訊編碼器件10A可關於SHC 11A'執行能量分析以判定至少一個容能21(60)。音訊編碼器件10A可接著將臨限值23應用於該至少一個容能21以產生SHC 11A'之精簡集合,亦即,圖4A之實例中所示的SHC 11B(62)。音訊編碼器件10A可接著基於SHC 11B產生位元串流17(64)。
圖10為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4B之實例中所示的音訊編碼器件10B)之例示性操作的流程圖。音訊編碼器件1BA可關於SHC 11A'執行能量分析以判定至少一個容能21(70)。音訊編碼器件10B亦可基於SHC 11A'動態地判定至少一個臨限值23(72)。音訊編碼器件10B可接著將動態地判定之臨限值23應用於該至少一個容能21以產生SHC 11A'之精簡集合,亦即,圖4A之實例中所示的SHC 11B(74)。音訊編碼器件10A可接著基於SHC
11B產生位元串流17(76)。
圖11為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4B之實例中所示的音訊編碼器件10B)之例示性操作的流程圖。音訊編碼器件10B可針對滑動時間窗針對包括SHC 11A之音訊資料動態地判定臨限值23(80)。音訊編碼器件10B可接著針對滑動時間窗將動態地判定之臨限值23應用於SHC 11A'以便產生SHC 11A'的精簡集合,該精簡集合在圖4B之實例中表示為SHC 11B(82)。
圖12為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4B之實例中所示的音訊編碼器件10B)之例示性操作的流程圖。音訊編碼器件10B可針對SHC 11A以每階為基礎而針對包括SHC 11A之音訊資料動態地判定臨限值23(90)。音訊編碼器件10B可接著將動態地判定之臨限值23應用於SHC 11A'以便產生SHC 11A的精簡集合,該精簡集合在圖4B之實例中表示為SHC 11B(92)。
圖13為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4B之實例中所示的音訊編碼器件10B)之例示性操作的流程圖。音訊編碼器件10B可基於SHC 11A'之擴散分析而動態地判定臨限值23(100)。音訊編碼器件10B可接著將動態地判定之臨限值23應用於SHC 11A'以便產生SHC 11A的精簡集合,該精簡集合在圖4B之實例中表示為SHC 11B(102)。
圖14為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4A之實例中所示的音訊編碼器件10A)之例示性操作的圖式。圖14表示藉以圖解藉由音訊編碼器件10A之音訊壓縮單元12所執行之操作的另一方式。如圖14之實例中所示,音訊編碼器件10A可接收臨限值23。針對具有大於零之階(N)的每一較高階立體混響(SHC 11A)(或換言之,針對SHC 11A中具有大於零之階的彼等SHC 11A),音訊編碼器件10A執行能量分析以判定容能21。音訊編碼器件10A亦
可針對SHC 11A之零階SHC 11A執行能量分析,從而將臨限值23乘以非零階容能21且比較此修改之結果與零階容能21。
當此乘法之結果大於零階容能21時,音訊編碼器件10A輸出1,其控制閘110。當此乘法之結果小於零階容能21時,音訊編碼器件10A輸出零,其再次控制閘110。閘110控制SHC 11A之非零階SHC 11A是否包括於緊密HOA內容112中,緊密HOA內容112為指代SHC 11A之精簡集合(且亦在圖4A之實例中表示為SHC 11B)的另一方式。如圖14之實例中所示,控制閘110之1及零亦形成所謂的「緊密位元遮罩」,「緊密位元遮罩」為指代圖4A之實例中所示之位元遮罩25的另一方式。
圖15為說明在執行本發明中所述之技術的各種態樣時音訊編碼器件(諸如,圖4B之實例中所示的音訊編碼器件10B)之例示性操作的流程圖。圖15表示藉以圖解藉由音訊編碼器件10B及10C之音訊壓縮單元12所執行之操作的另一方式。如圖15之實例中所示,音訊壓縮單元12可接收基線臨限值35,音訊壓縮單元12可在以上文所述之方式動態地判定臨限值23時使用基線臨限值35。
音訊壓縮單元12亦可接收SHC 11A(其在圖15之實例中表示為「HOA內容」)。音訊壓縮單元12可應用變換30以將SHC 11A自時域變換至頻域(產生SHC 11A')。音訊編碼器件10B之音訊壓縮單元12可執行此變換且將SHC 11A之經變換版本(或換言之,SHC 11A')或其衍生物包括於位元串流中,而音訊編碼器件10C之音訊壓縮單元12可能不執行此變換,從而在位元串流中包括SHC 11A(或其衍生物)。以此方式,單一音訊壓縮單元12可藉由提供可組態開關12來實施兩種技術,該可組態開關12藉以選擇頻率相依或頻率獨立定限。
音訊壓縮單元12亦可對SHC 11A'之零階SHC 11A'執行上文所述之能量分析20A且對SHC 11A'之非零階SHC 11A'執行上文所述之能量
分析20B,其中平滑化可應用於由於此等能量分析20所輸出的容能21。音訊壓縮單元12可以上文所述之方式將臨限值23應用於此等容能21以產生位元遮罩25。位元遮罩25可輸出至衰落單元36,衰落單元36可取決於頻率相依抑或頻率獨立定限已得以組態而將衰落函數應用於SHC 11A'或SHC 11A中之非零階者。閘110亦可藉由此位元遮罩25控制以再次取決於頻率相依抑或頻率獨立定限已得以組態而包括或消除SHC 11A'或SHC 11A中之非零階者。
就此而言,音訊寫碼器件(例如,實例圖4A至圖4C中所示之音訊編碼器件10A-10C及/或音訊解碼器件40)可經組態或以其他方式表示經組態以執行在以下條款中所闡述之技術的器件或裝置:
條款1. 一種壓縮多通道音訊資料之方法,其包含:關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
條款2. 如條款1之方法,其中執行該能量分析包含:關於該複數個球面諧波係數執行該能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;及將一臨限值應用於該至少一個容能以產生該複數個球面諧波之該精簡版本。
條款3. 如條款1之方法,其進一步包含基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
條款4. 如條款1之方法,其中執行該能量分析包含關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析,以產生對應於該階與該子階之每一組合的一容能。
條款5. 如條款1之方法,其中執行該能量分析包含:關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析,以產生對應於該階與該子階之每一組合的一容
能;及將一臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合;及基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本。
條款6. 如條款2或5之方法,其中應用該臨限值包含:將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數。
條款7. 如條款2或5之方法,其進一步包含將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能,其中應用該臨限值包含將該臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本。
條款8. 如條款1之方法,其進一步包含產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數。
條款9. 如條款1之方法,其進一步包含:產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數;及產生一位元串流以包括該位元遮罩及該複數個球面諧波係數之
該精簡版本。
條款10. 如條款1之方法,其進一步包含:根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料;及產生一位元串流以包括該經編碼音訊資料。
條款11. 如條款10之方法,其中該音訊編碼方案包含一進階音訊編碼(AAC)方案。
條款12. 如條款1之方法,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
條款13. 一種器件,其包含:一或多個處理器,其經組態以關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
條款14. 如條款13之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數執行該能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;及將一臨限值應用於該至少一個容能以產生該複數個球面諧波的該精簡版本。
條款15. 如條款13之器件,其中該一或多個處理器經進一步組態以基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
條款16. 如條款13之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行該能量分析,以產生對應於該階與該子階之每一組合的一容能。
條款17. 如條款13之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數所對應於的一
階與一子階之每一組合執行一能量分析,以產生對應於該階與該子階之每一組合的一容能;及將一臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合,及基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本。
條款18. 如條款14或17之器件,其中該一或多個處理器經進一步組態以,在應用該臨限值時,將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該臨限值以判定至少一個比較容能,判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能,及基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數。
條款19. 如條款14或17之器件,其中該一或多個處理器經進一步組態以將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能,且在應用該臨限值時,將該臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本。
條款20. 如條款13之器件,其中該一或多個處理器經進一步組態以產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數。
條款21. 如條款13之器件,其中該一或多個處理器經進一步組態以產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數,及產生一位元串流以包括該位元遮罩及該複數個球面諧波係數之該精簡版本。
條款22. 如條款13之器件,其中該一或多個處理器經進一步組態
以根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料,及產生一位元串流以包括該經編碼音訊資料。
條款23. 如條款22之器件,其中該音訊編碼方案包含一進階音訊編碼(AAC)方案。
條款24. 如條款13之器件,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
條款25. 一種器件,其包含:用於關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本的構件。
條款26. 如條款25之器件,其中用於執行該能量分析之該構件包含:用於關於該複數個球面諧波係數執行該能量分析以判定至少一個容能之構件,其中該複數個球面諧波係數中之至少一者具有大於1之一階;及用於將一臨限值應用於該至少一個容能以產生該複數個球面諧波之該精簡版本的構件。
條款27. 如條款25之器件,其進一步包含用於基於該複數個球面諧波係數之該精簡版本而產生一位元串流的構件。
條款28. 如條款25之器件,其中用於執行該能量分析之該構件包含用於關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析以產生對應於該階與該子階之每一組合的一容能的構件。
條款29. 如條款25之器件,其中用於執行該能量分析之該構件包含:
用於關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析以產生對應於該階與該子階之每一組合的一容能的構件;及用於將一臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合的構件;及用於基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本的構件。
條款30. 如條款26及29之器件,其中用於應用該臨限值之該構件包含:用於將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該臨限值以判定至少一個比較容能的構件;用於判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能的構件;及用於基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數的構件。
條款31. 如條款26及29之器件,其進一步包含用於將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能之構件,其中用於應用該臨限值之該構件包含用於將該臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本的構件。
條款32. 如條款25之器件,其進一步包含用於產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之
該精簡版本消除的該等球面諧波係數的構件。
條款33. 如條款25之器件,其進一步包含:用於產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數的構件;及用於產生一位元串流以包括該位元遮罩及該複數個球面諧波係數之該精簡版本的構件。
條款34. 如條款25之器件,其進一步包含:用於根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料的構件;及用於產生一位元串流以包括該經編碼音訊資料之構件。
條款35. 如條款34之器件,其中該音訊編碼方案包含一進階音訊編碼(AAC)方案。
條款36. 如條款25之器件,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
條款37. 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
條款1A. 一種壓縮音訊資料之方法,該方法包含:關於複數個球面諧波係數執行一能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數的一精簡版本;及
基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
條款2A. 如條款1A之方法,其中動態地判定該至少一個臨限值包含基於該複數個球面諧波係數中的具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定該至少一個臨限值。
條款3A. 如條款1A之方法,其中動態地判定該至少一個臨限值包含針對該複數個球面諧波係數以每階為基礎而動態地判定該至少一個臨限值。
條款4A. 如條款1A之方法,其中動態地判定該至少一個臨限值包含針對該複數個球面諧波係數以每子階為基礎而動態地判定該至少一個臨限值。
條款5A. 如條款1A之方法,其中動態地判定該至少一個臨限值包含針對該複數個球面諧波係數以階及子階為基礎而動態地判定該至少一個臨限值。
條款6A. 如條款1A之方法,其進一步包含將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,其中動態地判定該至少一個臨限值包含針對該經變換之複數個球面諧波係數以每頻率區間為基礎而動態地判定該至少一個臨限值。
條款7A. 如條款1A之方法,其進一步包含將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,其中應用該動態地判定之至少一個臨限值包含將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該經變換之複數個球面諧波係數之一精簡版本,該精簡版本使該等球面諧波係數中之至少一者自該經變換之複數個球面諧波係數消除。
條款8A. 如條款1A之方法,其進一步包含,在執行該能量分析及應用該動態地判定之至少一個臨限值之前,將該複數個球面諧波係
數自一時域變換至一頻域以產生經變換之複數個球面諧波係數。
條款9A. 如條款1A之方法,其中執行該能量分析包含:關於該複數個球面諧波係數中的具有等於零之一階的彼等球面諧波係數執行一能量分析以判定一零階容能;及關於該複數個球面諧波係數中的具有大於零之一階的彼等球面諧波係數執行一能量分析以判定非零階容能。
條款10A. 如條款1A之方法,其中執行該能量分析包含關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析,以產生對應於該階與該子階之每一組合的一容能,其中應用該動態地判定之至少一個臨限值包含:將該臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合;及基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本。
條款11A. 如條款1A之方法,其中應用該動態地判定之至少一個臨限值包含:將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數。
條款12A. 如條款1A之方法,其進一步包含將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能,其中應用該動態地判定之至少一個臨限值包含將該動態地判定之至少一個臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本。
條款13A. 如條款1A之方法,其進一步包含產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數。
條款14A. 如條款1A之方法,其進一步包含產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數,其中產生該位元串流進一步包含產生該位元串流以包括該位元遮罩。
條款15A. 如條款1A之方法,其進一步包含根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料,其中產生該位元串流進一步包含產生該位元串流以包括該經編碼音訊資料。
條款16A. 如條款15A之方法,其中該音訊編碼方案包含一進階音訊編碼(AAC)方案。
條款17A. 如條款1A之方法,其進一步包含在產生該複數個球面諧波係數之該精簡版本時將一衰落函數應用於該複數個球面諧波係數。
條款18A. 如條款1A之方法,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
條款19A. 一種器件,其包含:一或多個處理器,其經組態以:關於複數個球面諧波係數執行一能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波之一精簡版本;及基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
條款20A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,基於該複數個球面諧波係數中的具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定該至少一個臨限值。
條款21A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該複數個球面諧波係數以每階為基礎而動態地判定該至少一個臨限值。
條款22A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該複數個球面諧波係數以每子階為基礎而動態地判定該至少一個臨限值。
條款23A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該複數個球面諧波係數以階及子階為基礎而動態地判定該至少一個臨限值。
條款24A. 如條款19A之器件,其中該一或多個處理器經進一步組態以將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,且其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該經變換之複數個球面諧波係數以每頻率區間為基礎而動態地判定該至少一個臨限值。
條款25A. 如條款19A之器件,其中該一或多個處理器經進一步組態以將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,且其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該經變換之複數個球面諧波係數之一精簡版本,該精簡版本使該等球面諧波係數中之至少一者自該經變換之複數個球面諧波係數消除。
條款26A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析及應用該動態地判定之至少一個臨限值之前,將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數。
條款27A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數中的具有等於零之一階的彼等球面諧波係數執行一能量分析以判定一零階容能,及關於該複數個球面諧波係數中的具有大於零之一階的彼等球面諧波係數執行一能量分析以判定非零階容能。
條款28A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析,以產生對應於該階與該子階之每一組合的一容能,且其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將該臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合,及基於該等判定來消除該複數個該等球面諧波係數
中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本。
條款29A. 如條款19A之器件,其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能,判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能,及基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數。
條款30A. 如條款19A之器件,其中該一或多個處理器經進一步組態以將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能,且其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將該動態地判定之至少一個臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本。
條款31A. 如條款19A之器件,其中該一或多個處理器經進一步組態以產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數。
條款32A. 如條款19A之器件,其中該一或多個處理器經進一步組態以產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數,且其中該一或多個處理器經進一步組態以,在產生該位元串流時,產生該位元串流以包括該位元遮罩。
條款33A. 如條款19A之器件,
其中該一或多個處理器經進一步組態以根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料,且其中該一或多個處理器經進一步組態以,在產生該位元串流時,產生該位元串流以包括該經編碼音訊資料。
條款34A. 如條款33A之器件,其中該音訊編碼方案包含一進階音訊編碼(AAC)方案。
條款35A. 如條款19A之器件,其中該一或多個處理器經進一步組態以在產生該複數個球面諧波係數之該精簡版本時將一衰落函數應用於該複數個球面諧波係數。
條款36A. 如條款19A之器件,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
條款37A. 一種器件,其包含:用於關於複數個球面諧波係數執行一能量分析以判定至少一個容能之構件,其中該複數個球面諧波係數中之至少一者具有大於1之一階;用於基於該複數個該等球面諧波係數動態地判定至少一個臨限值之構件;用於將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數的一精簡版本的構件;及用於基於該複數個球面諧波係數之該精簡版本而產生一位元串流的構件。
條款38A. 如條款37A之器件,其中用於動態地判定該至少一個臨限值之該構件包含用於基於該複數個球面諧波係數中的具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動
態地判定該至少一個臨限值的構件。
條款39A. 如條款37A之器件,其中用於動態地判定該至少一個臨限值之該構件包含用於針對該複數個球面諧波係數以每階為基礎而動態地判定該至少一個臨限值之構件。
條款40A. 如條款37A之器件,其中用於動態地判定該至少一個臨限值之該構件包含用於針對該複數個球面諧波係數以每子階為基礎而動態地判定該至少一個臨限值之構件。
條款41A. 如條款37A之器件,其中用於動態地判定該至少一個臨限值之該構件包含用於針對該複數個球面諧波係數以階及子階為基礎而動態地判定該至少一個臨限值之構件。
條款42A. 如條款37A之器件,其進一步包含用於將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數的構件,其中用於動態地判定該至少一個臨限值之該構件包含用於針對該經變換之複數個球面諧波係數以每頻率區間為基礎而動態地判定該至少一個臨限值的構件。
條款43A. 如條款37A之器件,其進一步包含用於將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數的構件,其中用於應用該動態地判定之至少一個臨限值之該構件包含用於將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該經變換之複數個球面諧波係數之一精簡版本的構件,該精簡版本使該等球面諧波係數中之至少一者自該經變換之複數個球面諧波係數消除。
條款44A. 如條款37A之器件,其進一步包含用於在執行該能量分析及應用該動態地判定之至少一個臨限值之前,將該複數個球面
諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數的構件。
條款45A. 如條款37A之器件,其中用於執行該能量分析之該構件包含:用於關於該複數個球面諧波係數中的具有等於零之一階的彼等球面諧波係數執行一能量分析以判定一零階容能的構件;及用於關於該複數個球面諧波係數中的具有大於零之一階的彼等球面諧波係數執行一能量分析以判定非零階容能的構件。
條款46A. 如條款37A之器件,其中用於執行該能量分析之該構件包含用於關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析以產生對應於該階與該子階之每一組合的一容能的構件,其中用於應用該動態地判定之至少一個臨限值之該構件包含:用於將該臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合的構件;及用於基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本的構件。
條款47A. 如條款37A之器件,其中用於應用該動態地判定之至少一個臨限值的該構件包含:用於將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能的構件;用於判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能
的構件;及用於基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數的構件。
條款48A. 如條款37A之器件,其進一步包含用於將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能之構件,其中用於應用該動態地判定之至少一個臨限值的該構件包含用於將該動態地判定之至少一個臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本的構件。
條款49A. 如條款37A之器件,其進一步包含用於產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數的構件。
條款50A. 如條款37A之器件,其進一步包含用於產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數的構件,其中用於產生該位元串流之該構件進一步包含用於產生該位元串流以包括該位元遮罩之構件。
條款51A. 如條款37A之器件,其進一步包含用於根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料的構件,其中用於產生該位元串流之該構件進一步包含用於產生該位元串流以包括該經編碼音訊資料之構件。
條款52A. 如條款51A之器件,其中該音訊編碼方案包含一進階音訊編碼(AAC)方案。
條款53A. 如條款37A之器件,其進一步包含用於在產生該複數個球面諧波係數之該精簡版本時將一衰落函數應用於該複數個球面諧波係數的構件。
條款54A. 如條款37A之器件,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
條款55A. 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:關於複數個球面諧波係數執行一能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數的一精簡版本;及基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
條款1B. 一種壓縮音訊資料之方法,其包含:針對一滑動時間窗,針對包括球面諧波係數之樣本的該音訊資料動態地判定複數個臨限值;及針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合。
條款2B. 如條款1B之方法,其中該滑動時間窗包含一音訊訊框,且其中動態地判定該等臨限值包含針對包括該等球面諧波係數之該等樣本的該音訊資料以逐訊框為基礎而動態地判定該等臨限值。
條款3B. 如條款1B之方法,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款4B. 如條款1B之方法,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款5B. 如條款1B之方法,其進一步包含關於該等球面諧波係數執行一能量分析以判定至少一個容能。
條款6B. 如條款5B之方法,其中應用該等動態地判定之臨限值包含:將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該等動態地判定之臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數。
條款7B. 如條款1B之方法,其中該複數個球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款8B. 一種器件,其包含:一或多個處理器,其經組態以:針對一滑動時間窗,針對包括球面諧波係數之樣本的音訊資料動態地判定複數個臨限值;及針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合。
條款9B. 如條款8B之器件,其中該滑動時間窗包含一音訊訊框,且其中該一或多個處理器經進一步組態以,在動態地判定該等臨限值時,針對包括該等球面諧波係數之該等樣本的該音訊資料以逐訊框為基礎而動態地判定該等臨限值。
條款10B. 如條款8B之器件,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間
窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款11B. 如條款8B之器件,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款12B. 如條款8B之器件,其中該一或多個處理器經進一步組態以關於該等球面諧波係數執行一能量分析以判定至少一個容能。
條款13B. 如條款12B之器件,其中該一或多個處理器經進一步組態以,在應用該等動態地判定之臨限值時,將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該等動態地判定之臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數。
條款14B. 如條款8B之器件,其中該複數個球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款15B. 一種器件,其包含:用於針對一滑動時間窗針對包括球面諧波係數之樣本的該音訊資料動態地判定複數個臨限值的構件;用於針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合的構件。
條款16B. 如條款15B之器件,其中該滑動時間窗包含一音訊訊框,且其中用於動態地判定該等臨限值之該構件包含用於針對包括該等球面諧波係數之該等樣本的該音訊資料以逐訊框為基礎而動態地判定該等臨限值的構件。
條款17B. 如條款15B之器件,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款18B. 如條款15B之器件,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款19B. 如條款15B之器件,其進一步包含用於關於該等球面諧波係數執行一能量分析以判定至少一個容能之構件。
條款20B. 如條款19B之器件,其中用於應用該等動態地判定之臨限值的該構件包含:用於將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該等動態地判定之臨限值以判定至少一個比較容能的構件;用於判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能的構件;及用於基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數的構件。
條款21B. 如條款15B之器件,其中該複數個球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款22B. 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:針對一滑動時間窗,針對包括球面諧波係數之樣本的該音訊資料動態地判定複數個臨限值;針對該滑動時間窗將該等動態地判定之臨限值應用於該等球面
諧波係數以便產生該等球面諧波係數之一精簡集合。
條款1C. 一種壓縮音訊資料之方法,其包含:將對包括球面諧波係數之樣本的音訊資料以每階為基礎而動態地判定之複數個臨限值應用於複數個球面諧波係數以便產生該等球面諧波係數之一精簡集合。
條款2C. 如條款1C之方法,其進一步包含針對除了該等球面諧波係數中具有為零之一階及子階的彼等球面諧波係數以外的該等球面諧波係數的階與子階之每一組合動態地判定該複數個臨限值中之一相應臨限值,其中該等球面諧波係數之一最大階為4。
條款3C. 如條款1C之方法,其進一步包含針對一滑動時間窗,針對該等球面諧波係數以每階為基礎而動態地判定該複數個臨限值。
條款4C. 如條款3C之方法,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款5C. 如條款1C之方法,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款6C. 如條款1C之方法,其進一步包含關於該等球面諧波係數執行一能量分析以判定至少一個容能。
條款7C. 如條款6C之方法,其中應用該複數個臨限值包含:將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該等動態地判定之臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或
多個球面諧波係數。
條款8C. 如條款1B之方法,其中該等球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款9C. 一種器件,其包含:一或多個處理器,其經組態以將對包括球面諧波係數之樣本的音訊資料以每階為基礎而動態地判定之複數個臨限值應用於複數個球面諧波係數以便產生該等球面諧波係數之一精簡集合。
條款10C. 如條款9C之器件,其進一步包含針對除了該等球面諧波係數中具有為零之一階及子階的彼等球面諧波係數以外的該等球面諧波係數的階與子階之每一組合動態地判定該複數個臨限值中之一相應臨限值,其中該等球面諧波係數之一最大階為4。
條款11C.如條款9C之器件,其進一步包含針對一滑動時間窗,針對該等球面諧波係數以每階為基礎而動態地判定該複數個臨限值。
條款12C. 如條款11C之器件,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款13C. 如條款9C之器件,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款14C. 如條款9C之器件,其進一步包含關於該等球面諧波係數執行一能量分析以判定至少一個容能。
條款15C. 如條款14C之器件,其中應用該複數個臨限值包含:將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該等動態地判定之臨限值以判定至少一
個比較容能;判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數。
條款16C. 如條款9B之器件,其中該等球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款17C. 一種器件,其包含:用於將對包括球面諧波係數之樣本的音訊資料以每階為基礎而動態地判定之複數個臨限值應用於複數個球面諧波係數以便產生該等球面諧波係數之一精簡集合的構件。
條款18C. 如條款17C之器件,其進一步包含針對除了該等球面諧波係數中具有為零之一階及子階的彼等球面諧波係數以外的該等球面諧波係數的階與子階之每一組合動態地判定該複數個臨限值中之一相應臨限值,其中該等球面諧波係數之一最大階為4。
條款19C. 如條款17C之器件,其進一步包含針對一滑動時間窗,針對該等球面諧波係數以每階為基礎而動態地判定該複數個臨限值。
條款20C. 如條款19C之器件,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款21C. 如條款17C之器件,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款22C. 如條款17C之器件,其進一步包含關於該等球面諧
波係數執行一能量分析以判定至少一個容能。
條款23C. 如條款22C之器件,其中應用該複數個臨限值包含:將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該等動態地判定之臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數。
條款24C. 如條款17B之器件,其中該等球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款25C. 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:針對球面諧波係數以每階為基礎而針對包括該等球面諧波係數之樣本的音訊資料動態地判定複數個臨限值;及將該等動態地判定之臨限值應用於該等球面諧波係數,以便產生不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者的該等球面諧波係數之一精簡集合。
條款1D. 一種壓縮包含球面諧波係數之音訊資料的方法,該方法包含:將至少一個臨限值應用於該等球面諧波係數以便產生該等球面諧波係數之一精簡集合,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
條款2D. 如條款1D之方法,其中該至少一個臨限值係基於該等
球面諧波係數中具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定。
條款3D. 如條款1D之方法,其中該至少一個臨限值係針對該等球面諧波係數基於該擴散分析且以每階為基礎而動態地判定。
條款4D. 如條款3D之方法,其中該至少一個臨限值係針對除了該等球面諧波係數中具有為零之一階及子階的彼等球面諧波係數以外的該等球面諧波係數的階與子階之每一組合動態地判定,其中該等球面諧波係數之一最大階為4。
條款5D. 如條款1D之方法,其中該至少一個臨限值係基於該擴散分析針對一滑動時間窗動態地判定。
條款6D. 如條款5D之方法,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款7D. 如條款1D之方法,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款8D. 如條款1D之方法,其進一步包含關於該等球面諧波係數執行一能量分析以判定至少一個容能。
條款9D. 如條款8D之方法,其中應用該至少一個臨限值包含:將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數。
條款10D. 如條款1D之器件,其中該等球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款11D. 一種器件,其包含:一或多個處理器,其經組態以將至少一個臨限值應用於球面諧波係數以便產生該等球面諧波係數之一精簡集合,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
條款12D. 如條款11D之器件,其中該至少一個臨限值係基於該等球面諧波係數中具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定。
條款13D. 如條款11D之器件,其中該至少一個臨限值係針對該等球面諧波係數基於該擴散分析且以每階為基礎而動態地判定。
條款14D. 如條款13D之器件,其中該至少一個臨限值係針對除了該等球面諧波係數中具有為零之一階及子階的彼等球面諧波係數以外的該等球面諧波係數的階與子階之每一組合動態地判定,其中該等球面諧波係數之一最大階為4。
條款15D. 如條款11D之器件,其中該至少一個臨限值係基於該擴散分析針對一滑動時間窗動態地判定。
條款16D. 如條款15D之器件,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款17D. 如條款11D之器件,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款18D. 如條款11D之器件,其中該一或多個處理器經進一步組態以關於該等球面諧波係數執行一能量分析以判定至少一個容
能。
條款19D. 如條款18D之器件,其中該一或多個處理器經進一步組態以,在應用該至少一個臨限值時,將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能,判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能,及基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數。
條款20D. 如條款11D之器件,其中該等球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款21D. 一種器件,其包含:用於將至少一個臨限值應用於球面諧波係數以便產生該等球面諧波係數之一精簡集合的構件,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
條款22D. 如條款21D之器件,其中該至少一個臨限值係基於該等球面諧波係數中具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定。
條款23D. 如條款21D之器件,其中該至少一個臨限值係針對該等球面諧波係數基於該擴散分析且以每階為基礎而動態地判定。
條款24D. 如條款23D之器件,其中該至少一個臨限值係針對除了該等球面諧波係數中具有為零之一階及子階的彼等球面諧波係數以外的該等球面諧波係數的階與子階之每一組合動態地判定,其中該等球面諧波係數之一最大階為4。
條款25D. 如條款21D之器件,其中該至少一個臨限值係基於該擴散分析針對一滑動時間窗動態地判定。
條款26D. 如條款25D之器件,其中該滑動時間窗表示針對該等球面諧波係數中具有一較低階之彼等球面諧波係數的一較大的時間窗,及針對該等球面諧波係數中具有一較高階之彼等球面諧波係數的一相對較小時間窗。
條款27D. 如條款21D之器件,其中該等球面諧波係數包括具有大於1之一階的至少一球面諧波係數。
條款28D. 如條款21D之器件,其進一步包含用於關於該等球面諧波係數執行一能量分析以判定至少一個容能之構件。
條款29D. 如條款28D之器件,其中用於應用該至少一個臨限值之該構件包含:用於將與該等球面諧波係數中具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能的構件;用於判定該至少一個比較容能是否大於與該等球面諧波係數中具有等於零之一階的該球面諧波係數相關聯之該至少一個容能的構件;及用於基於該判定來消除該等球面諧波係數中具有大於1之一階的一或多個球面諧波係數的構件。
條款30D. 如條款21D之器件,其中該等球面諧波係數之該精簡集合不包括存在於該等球面諧波係數之該等樣本中的該等球面諧波係數中之至少一者。
條款31D. 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:將至少一個臨限值應用於球面諧波係數以便產生該等球面諧波係數之一精簡集合,其中該至少一個臨限值係基於該等球面諧波係數之一擴散分析而動態地判定。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體來實施,則該等功能可作為一或多個指令或程式碼儲存於電腦可讀媒體上或經由電腦可讀媒體來傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體可對應於(1)為非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可藉由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於本發明中所述之技術之實施的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例且非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器件、磁碟儲存器件或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可藉由電腦存取的任何其他媒體。又,將任何連接恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纖纜線、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而替代地針對非暫時性有形儲存媒體。如本文所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上內容之組合亦應包括於電腦可讀媒體之範疇內。
指令可藉由一或多個處理器執行,該一或多個處理器諸如一或
多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA),或其他等效的積體或離散邏輯電路。因此,如本文所使用之術語「處理器」可指代前述結構或適用於本文所述之技術之實施的任何其他結構中之任一者。另外,在一些態樣中,本文所述之功能性可提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以廣泛多種器件或裝置來實施,包括無線手機、積體電路(IC)或IC之集合(例如,晶片組)。各種組件、模組或單元在本發明中得以描述以強調經組態以執行所揭示技術之器件的功能態樣,但未必需要藉由不同的硬體單元來實現。實情為,如上文所述,各種單元可組合於編解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所述之一或多個處理器)之集合結合合適的軟體及/或韌體來提供。
該等技術之各種實施例已得以描述。該等技術之此等及其他態樣係在以下申請專利範圍之範疇內。
10A‧‧‧音訊編碼器件
11A‧‧‧球面諧波係數(SHC)
11B‧‧‧球面諧波係數(SHC)
11C‧‧‧經編碼SHC/經編碼音訊資料
12‧‧‧音訊壓縮單元
14‧‧‧音訊編碼單元
16‧‧‧位元串流產生單元
17‧‧‧位元串流
20‧‧‧能量分析單元
21‧‧‧容能
22‧‧‧臨限值應用單元
23‧‧‧臨限值
24‧‧‧位元遮罩產生單元
25‧‧‧位元遮罩
Claims (30)
- 一種壓縮多通道音訊資料之方法,其包含:關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
- 如請求項1之方法,其中執行該能量分析包含:關於該複數個球面諧波係數執行該能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;及將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波係數之該精簡版本;且其中該方法進一步包含基於該複數個球面諧波係數之該精簡版本而產生一位元串流。
- 如請求項2之方法,其中動態地判定該至少一個臨限值包含基於該複數個球面諧波係數中的具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定該至少一個臨限值。
- 如請求項2之方法,其中動態地判定該至少一個臨限值包含針對該複數個球面諧波係數以每階為基礎而動態地判定該至少一個臨限值。
- 如請求項2之方法,其中動態地判定該至少一個臨限值包含針對該複數個球面諧波係數以每子階為基礎而動態地判定該至少一個臨限值。
- 如請求項2之方法,其中動態地判定該至少一個臨限值包含針對該複數個球面諧波係數以階及子階為基礎而動態地判定該至少一個臨限值。
- 如請求項2之方法,其進一步包含將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,其中動態地判定該至少一個臨限值包含針對該經變換之複數個球面諧波係數以每頻率區間為基礎而動態地判定該至少一個臨限值。
- 如請求項2之方法,其進一步包含將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,其中應用該動態地判定之至少一個臨限值包含將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該經變換之複數個球面諧波係數之一精簡版本,該精簡版本使該等球面諧波係數中之至少一者自該經變換之複數個球面諧波係數消除。
- 如請求項2之方法,其進一步包含,在執行該能量分析及應用該動態地判定之至少一個臨限值之前,將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數。
- 如請求項2之方法,其中執行該能量分析包含:關於該複數個球面諧波係數中的具有等於零之一階的彼等球面諧波係數執行一能量分析以判定一零階容能;及關於該複數個球面諧波係數中的具有大於零之一階的彼等球面諧波係數執行一能量分析以判定非零階容能。
- 如請求項2之方法,其中執行該能量分析包含關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析以產生對應於該階與該子階之每一組合的一容能, 其中應用該動態地判定之至少一個臨限值包含:將該臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合;及基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本。
- 如請求項2之方法,其中應用該動態地判定之至少一個臨限值包含:將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能;判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能;及基於該判定來消除該複數個球面諧波係數中的具有大於1之一階的一或多個球面諧波係數。
- 如請求項2之方法,其進一步包含將一平滑化函數應用於該至少一個容能以產生至少一個平滑容能,其中應用該動態地判定之至少一個臨限值包含將該動態地判定之至少一個臨限值應用於該至少一個平滑容能以產生該複數個球面諧波係數之該精簡版本。
- 如請求項2之方法,其進一步包含產生一位元遮罩以識別該複數個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數。
- 如請求項2之方法,其進一步包含產生一位元遮罩以識別該複數 個球面諧波係數中的所包括且自該複數個球面諧波係數之該精簡版本消除的該等球面諧波係數,其中產生該位元串流進一步包含產生該位元串流以包括該位元遮罩。
- 如請求項2之方法,其進一步包含根據一音訊編碼方案來音訊編碼該複數個球面諧波係數之該精簡版本以產生經編碼音訊資料,其中產生該位元串流進一步包含產生該位元串流以包括該經編碼音訊資料。
- 如請求項2之方法,其進一步包含在產生該複數個球面諧波係數之該精簡版本時將一衰落函數應用於該複數個球面諧波係數。
- 如請求項1之方法,其中該複數個球面諧波係數之該精簡版本使該等球面諧波係數中之至少一者自該複數個球面諧波係數消除。
- 一種器件,其包含:一記憶體,其經組態以儲存複數個球面諧波係數;及一或多個處理器,該一或多個處理器經組態以關於該複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
- 如請求項19之器件,其中該一或多個處理器經組態以:關於該複數個球面諧波係數執行該能量分析以判定至少一個容能,其中該複數個球面諧波係數中之至少一者具有大於1之一階;基於該複數個該等球面諧波係數動態地判定至少一個臨限值;將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該複數個球面諧波之一精簡版本,且其中該一或多個處理器經進一步組態以基於該複數個球面諧 波係數之該精簡版本而產生一位元串流。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,基於該複數個球面諧波係數中的具有等於零之一階及等於1之一階的至少彼等球面諧波係數之一擴散分析而動態地判定該至少一個臨限值。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該複數個球面諧波係數以每階及每子階中之一或多者為基礎而動態地判定該至少一個臨限值。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該複數個球面諧波係數以階及子階為基礎而動態地判定該至少一個臨限值。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,且其中該一或多個處理器經進一步組態以,在動態地判定該至少一個臨限值時,針對該經變換之複數個球面諧波係數以每頻率區間為基礎而動態地判定該至少一個臨限值。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以將該複數個球面諧波係數自一時域變換至一頻域以產生經變換之複數個球面諧波係數,且其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將該動態地判定之至少一個臨限值應用於該至少一個容能以產生該經變換之複數個球面諧波係數之 一精簡版本,該精簡版本使該等球面諧波係數中之至少一者自該經變換之複數個球面諧波係數消除。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數中的具有等於零之一階的彼等球面諧波係數執行一能量分析以判定一零階容能,且關於該複數個球面諧波係數中的具有大於零之一階的彼等球面諧波係數執行一能量分析以判定非零階容能。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以,在執行該能量分析時,關於該複數個球面諧波係數所對應於的一階與一子階之每一組合執行一能量分析以產生對應於該階與該子階之每一組合的一容能,且其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將該臨限值應用於對應於該階與該子階之每一組合的該等容能以判定是否消除該複數個球面諧波係數的該階與該子階之該對應組合,且基於該等判定來消除該複數個該等球面諧波係數中的對應於該階與該子階之該組合的彼等球面諧波係數以對該複數個該等球面諧波係數產生該精簡版本。
- 如請求項20之器件,其中該一或多個處理器經進一步組態以,在應用該動態地判定之至少一個臨限值時,將與該複數個球面諧波係數中的具有大於1之一階的彼等球面諧波係數相關聯之該至少一個容能乘以該動態地判定之至少一個臨限值以判定至少一個比較容能,判定該至少一個比較容能是否大於與該複數個球面諧波係數中的具有等於零之一階的該球面諧波係數相關聯之該至少一個容能,且基於該判定來消除該複數個球面諧波係 數中的具有大於1之一階的一或多個球面諧波係數。
- 一種用於壓縮多通道音訊資料之器件,其包含:用於儲存複數個球面諧波係數的構件;及用於關於該複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本的構件。
- 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在被執行時使得一或多個處理器:關於複數個球面諧波係數執行一能量分析以判定該複數個球面諧波係數之一精簡版本。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361875841P | 2013-09-10 | 2013-09-10 | |
US14/479,752 US9466302B2 (en) | 2013-09-10 | 2014-09-08 | Coding of spherical harmonic coefficients |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201517022A true TW201517022A (zh) | 2015-05-01 |
Family
ID=52625640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103131238A TW201517022A (zh) | 2013-09-10 | 2014-09-10 | 球面諧波係數之寫碼 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9466302B2 (zh) |
TW (1) | TW201517022A (zh) |
WO (1) | WO2015038519A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016210174A1 (en) | 2015-06-25 | 2016-12-29 | Dolby Laboratories Licensing Corporation | Audio panning transformation system and method |
US11871052B1 (en) * | 2018-09-27 | 2024-01-09 | Apple Inc. | Multi-band rate control |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
WO2011104463A1 (fr) * | 2010-02-26 | 2011-09-01 | France Telecom | Compression de flux audio multicanal |
EP2469741A1 (en) | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
-
2014
- 2014-09-08 US US14/479,752 patent/US9466302B2/en active Active
- 2014-09-09 WO PCT/US2014/054711 patent/WO2015038519A1/en active Application Filing
- 2014-09-10 TW TW103131238A patent/TW201517022A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2015038519A1 (en) | 2015-03-19 |
US20150071447A1 (en) | 2015-03-12 |
US9466302B2 (en) | 2016-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI583210B (zh) | 變換球諧係數 | |
EP3005357B1 (en) | Performing spatial masking with respect to spherical harmonic coefficients | |
RU2661775C2 (ru) | Передача сигнальной информации рендеринга аудио в битовом потоке | |
TWI611706B (zh) | 將虛擬揚聲器映射至實體揚聲器 | |
US9473870B2 (en) | Loudspeaker position compensation with 3D-audio hierarchical coding | |
JP6105062B2 (ja) | 後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体 | |
JP6820386B2 (ja) | 高次アンビソニック(hoa)コンテンツの画面に関連した適応 | |
JP6067935B2 (ja) | 回転された高次アンビソニックスのバイノーラル化 | |
JP6062544B2 (ja) | 基底関数係数を使用した3次元オーディオコード化のためのシステム、方法、装置、およびコンピュータ可読媒体 | |
TW201511583A (zh) | 用於音場之分解表示的內插法 | |
US20200120438A1 (en) | Recursively defined audio metadata | |
TW202105164A (zh) | 用於低頻率效應之音訊呈現 | |
TW201517022A (zh) | 球面諧波係數之寫碼 |