TW202211206A - 低延遲、低頻率效應之編碼解碼器 - Google Patents
低延遲、低頻率效應之編碼解碼器 Download PDFInfo
- Publication number
- TW202211206A TW202211206A TW109130176A TW109130176A TW202211206A TW 202211206 A TW202211206 A TW 202211206A TW 109130176 A TW109130176 A TW 109130176A TW 109130176 A TW109130176 A TW 109130176A TW 202211206 A TW202211206 A TW 202211206A
- Authority
- TW
- Taiwan
- Prior art keywords
- coefficients
- lfe
- channel signal
- lfe channel
- low
- Prior art date
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在一些實施方案中,一種對一低頻率效應(LFE)聲道進行編碼之方法包括:接收一時域LFE聲道信號;使用一低通濾波器對該時域LFE聲道信號進行濾波;將經濾波之該時域LFE聲道信號轉換成該LFE聲道信號的包括表示該LFE聲道信號之一頻譜之一定數目個係數之一頻域表示;將係數配置至與該LFE聲道信號之不同頻帶對應之一定數目個次頻帶群組中;根據該低通濾波器之一頻率回應曲線將每一次頻帶群組中之係數量化;使用針對該次頻帶群組調諧之一熵寫碼器對每一次頻帶群組中之該等經量化係數進行編碼;及產生包含經編碼之該等經量化係數之一位元串流;及將該位元串流儲存於一儲存裝置上或將該位元串流串流傳輸至一下游裝置。
Description
本發明大體而言係關於音訊信號處理,且確切而言,係關於處理低頻率效應(LFE)聲道。
舉例而言,沉浸式服務之標準化努力包含針對聲音、多串流電傳會議、虛擬實境(VR)、使用者產生之現場及非現場內容串流傳輸開發一沉浸式聲音與音訊服務(IVAS)編碼解碼器。IVAS標準之一目標係開發音訊品質出色、延遲低、支援空間音訊寫碼、具有一恰當位元速率範圍、高品質錯誤恢復及一實際實施複雜性的一單個編碼解碼器。為達成此目標,期望開發可基於能夠進行IVAS之裝置或能夠處理LFE信號之任何其他裝置來處置低延遲LFE操作的一IVAS編碼解碼器。LFE聲道用於範圍為20 Hz至120 Hz之深度低音調聲響,且通常發送至經設計以再生低頻率音訊內容之一揚聲器。
揭示一可配置低延遲LFE編碼解碼器之實施方案。
在一些實施方案中,一種對一低頻率效應(LFE)聲道進行編碼之方法包括:使用一或多個處理器接收一時域LFE聲道信號;使用一低通濾波器對該時域LFE聲道信號進行濾波;使用該一或多個處理器將經濾波之該時域LFE聲道信號轉換成該LFE聲道信號的包含表示該LFE聲道信號之一頻譜之一定數目個係數之一頻域表示;使用該一或多個處理器將係數配置至與該LFE聲道信號之不同頻帶對應之一定數目個次頻帶群組中;使用該一或多個處理器根據該低通濾波器之一頻率回應曲線將每一次頻帶群組中之係數量化;使用該一或多個處理器使用針對每一次頻帶群組調諧之一熵寫碼器對該次頻帶群組中之該等經量化係數進行編碼;及使用該一或多個處理器產生包含經編碼之該等經量化係數之一位元串流;以及使用該一或多個處理器將該位元串流儲存於一儲存裝置上或將該位元串流串流傳輸至一下游裝置。
在一些實施方案中,將每一次頻帶群組中之該等係數量化進一步包括基於可用量化點之一最大數目及該等係數之絕對值之一和來產生一縮放移位因數;及使用該縮放移位因數將該等係數量化。
在一些實施方案中,若一經量化係數超過量化點之該最大數目,則將該縮放移位因數減小且再次將該等係數量化。
在一些實施方案中,對於每一次頻帶群組而言,該等量化點係不同的。
在一些實施方案中,根據一精細量化方案或一粗略量化方案將每一次頻帶群組中之該等係數量化,其中與根據該粗略量化方案指派給一或多個次頻帶群組之量化點相比,利用該精細量化方案將更多量化點分配給該等各別次頻帶群組。
在一些實施方案中,該等係數之正負號位元與該等係數被分開寫碼。
在一些實施方案中,存在四個次頻帶群組,且一第一次頻帶群組對應於0 Hz至100 Hz之一第一頻率範圍,一第二次頻帶群組對應於100 Hz至200 Hz之一第二頻率範圍,一第三次頻帶群組對應於200 Hz至300 Hz之一第三頻率範圍,且一第四次頻帶群組對應於300 Hz至400 Hz之一第四頻率範圍。
在一些實施方案中,該熵寫碼器係一算術熵寫碼器。
在一些實施方案中,將經濾波之該時域LFE聲道信號轉換成該LFE聲道信號的包括表示該LFE聲道信號之一頻譜之一定數目個係數的一頻域表示進一步包括:判定該LFE聲道信號之一第一步長;基於該第一步長指定一窗函數之一第一窗口大小;將該第一窗口大小應用於該時域LFE聲道信號之一或多個訊框;及將一修改型離散餘弦變換(MDCT)應用於經窗口化之該訊框以產生該等係數。
在一些實施方案中,該方法進一步包括:判定該LFE聲道信號之一第二步長;基於該第二步長指定該窗函數之一第二窗口大小;及將該第二窗口大小應用於該時域LFE聲道信號之該一或多個訊框。
在一些實施方案中,該第一步長係N毫秒(ms),N大於或等於5 ms且小於或等於60 ms,該第一窗口大小高於或等於10 ms,該第二步長係5 ms 且該第二窗口大小係10 ms。
在一些實施方案中,該第一步長係20毫秒(ms),該第一窗口大小係10 ms或20 ms或40 ms,該第二步長係10 ms且該第二窗口大小係10 ms或20 ms。
在一些實施方案中,該第一步長係10毫秒(ms),該第一窗口大小係10 ms或20 ms,該第二步長係5 ms,且該第二窗口大小係10 ms。
在一些實施方案中,該第一步長係20毫秒(ms),該第一窗口大小係10 ms、20 ms或40 ms,該第二步長係5 ms且該第二窗口大小係10 ms。
在一些實施方案中,該窗函數係具有一可配置漸隱長度之一凱撒-貝索導出(KBD)窗函數。
在一些實施方案中,該低通濾波器係一截止頻率為約130 Hz或低於130 Hz之一四階巴特沃斯低通濾波器。
在一些實施方案中,該方法進一步包括:使用該一或多個處理器判定該LFE聲道信號之一訊框之一能量位準是否低於一臨限值;根據該能量位準低於一臨限位準,產生一靜寂訊框指示符以指示該解碼器;將該靜寂訊框指示符插入至該LFE聲道位元串流之後設資料中;及在偵測到靜寂訊框時減小一LFE聲道位元速率。
在一些實施方案中,一種對一低頻率效應(LFE)聲道位元串流進行解碼之方法包括:使用一或多個處理器接收一LFE聲道位元串流,該LFE聲道位元串流包含表示一時域LFE聲道信號之一頻譜之熵寫碼係數;使用該一或多個處理器使用一熵解碼器將經量化係數解碼;使用該一或多個處理器將經量化係數逆量化,其中該等係數已根據用於在一編碼器中對該時域LFE聲道信號進行濾波之一低通濾波器之一頻率回應曲線而在與頻帶對應之次頻帶群組中被量化;使用該一或多個處理器將經逆量化之該等係數轉換成一時域LFE聲道信號;使用該一或多個處理器調整該時域LFE聲道信號之一延時;及使用一低通濾波器對經延時調整之該LFE聲道信號進行濾波。
在一些實施方案中,低通濾波器之一階數經組態以確保由於對包含該LFE聲道信號之一多聲道音訊信號中之該LFE聲道進行編碼及解碼所致之一第一總演算法延時小於或等於由於對其他聲道進行編碼及解碼所致之一第二總演算法延時。
在一些實施方案中,該方法進一步包括:判定該第二總演算法延時是否超過一臨限值;及根據該第二總演算法延時超過該臨限值,將該低通濾波器組態為一N階低通濾波器,其中N係大於或等於2之一整數;及根據該第二總演算法延時不超過該臨限值,將該低通濾波器之該階數組態為小於N。
本文中所揭示之其他實施方案係關於一系統、設備及電腦可讀媒體。在隨附圖式及下文說明中陳述一或多個所揭示實施方案的細節。依據說明、圖式及申請專利範圍明瞭其他特徵、目標及優點。
本文中所揭示之特定實施例提供以下優點中之一或多者。所揭示之低延遲LFE編碼解碼器:1)主要針對LFE聲道;2)主要針對20 Hz至120 Hz之一頻率範圍,但在低/中等位元速率情景中攜載達300 Hz之音訊且在高位元速率情景中攜載達400 Hz之音訊;3)藉由根據一輸入低通濾波器之一頻率回應曲線應用一量化方案來達成一低位元速率;4)具有一低演算法延遲且經設計而以20毫秒(ms)之一步幅操作並且具有33毫秒之一總演算法延遲(包含成框);5)可經組態至更小之步幅及更低之演算法延遲以支援其他情景,包含組態成低至5毫秒之步幅及13毫秒之總演算法延遲(包含成框);6)基於LFE編碼解碼器可用之延遲在解碼器輸出處自動地選擇一低通濾波器;7)具有在靜寂期間具有50位元/秒(bps)之一低位元速率之一靜寂模式;及8)在有效訊框期間,位元速率基於所使用之量化位準而在2千位元/秒(kbps)至4 kbps之間波動,且在靜寂訊框期間位元速率係50 bps。
在以下詳細說明中,陳述眾多具體細節以提供對各種所闡述實施例之一透徹理解。熟習此項技術者應明瞭,可在不具有此等具體細節之情況下實踐各種所闡述之實施方案。在其他例項中,未詳細闡述眾所周知之方法、過程、組件及電路以免使實施例之態樣發生不必要模糊。下文闡述可各自彼此獨立地使用或與其他特徵之任何組合使用之數個特徵。
命名法
如本文中所使用,將術語「包含」及其變化形式解讀為開放式術語,意指「包含但不限於」。將術語「或」解讀為「及/或」,除非內容脈絡另有明確指示。將術語「基於」解讀為「至少部分地基於」。將術語「一項實例性實施方案」及「實例性實施方案」解讀為「至少一項實例性實施方案」。將術語「另一實施方案」解讀為「至少一項其他實施方案」。將術語「經判定」或「判定」解讀為獲得、接收、運算、計算、估計、預測或導出。除非另有定義,否則本文所使用之所有技術術語及科學術語皆具有與熟習本發明所屬領域技術者通常所理解的相同的意義。
系統概述
圖1圖解說明根據一或多個實施方案的用於對IVAS位元串流(包含一LFE聲道位元串流)進行編碼及解碼之一IVAS編碼解碼器100。在編碼時,IVAS編碼解碼器100接收音訊資料101之N+1個聲道,其中音訊資料101之N個聲道被輸入至空間分析與降混單元102中,且一個LFE聲道被輸入至LFE聲道編碼單元105中。音訊資料101包括但不限於:單聲道信號、立體聲信號、雙耳信號、空間音訊信號(例如,多聲道空間音訊對象)、一階高保真度立體聲響複製(FoA)、高階高保真度立體聲響複製(HoA)及任何其他音訊資料。
在一些實施方案中,空間分析與降混單元102經組態以實施複雜先進耦合(CACPL)以用於對立體聲音訊資料進行分析/降混,及/或實施空間重構(SPAR)以用於對FoA音訊資料進行分析/降混。在其他實施方案中,空間分析與降混單元102實施其他格式。空間分析與降混單元102之輸出包括空間後設資料及音訊資料之1至N個聲道。將空間後設資料輸入至空間後設資料編碼單元104中,空間後設資料編碼單元104經組態以對空間後設資料進行量化及熵寫碼。在一些實施方案中,量化可包含精細、適度、粗略及額外粗略量化策略,且熵寫碼可包含霍夫曼或算術寫碼。
將音訊資料之1至N個聲道輸入至主音訊聲道編碼單元103中,主音訊聲道編碼單元103經組態以將音訊資料之1至N個聲道編碼成一或多個經增強聲音服務(EVS)位元串流。在一些實施方案中,主音訊聲道編碼單元103遵照3GPP TS 26.445且提供各種各樣之功能性,例如為窄頻(EVS-NB)及寬頻(EVS-WB)語音服務增強品質與寫碼效率、使用超寬頻(EVS-SWB)語音增強品質、在對話應用中增強混合內容與音樂之品質、封包遺失及延時抖動的穩健性以及與AMR-WB編碼解碼器之反向相容性。
在一些實施方案中,主音訊聲道編碼單元103包括一預處理與模式選擇單元,該預處理與模式選擇單元基於模式/位元速率控制以一規定的位元速率在用於對語音信號進行編碼之一語音寫碼器及用於對音訊信號進行編碼之一感知寫碼器之間做出選擇。在一些實施方案中,語音編碼器係代數碼激式線性預測(ACELP)之一改良變化形式,其針對不同語音類別而擴展出專門的基於LP之模式。
在一些實施方案中,音訊編碼器係一修改型離散餘弦變換(MDCT)編碼器,其在低延時/低位元速率下效率得到提高且經設計以在語音編碼器與音訊編碼器之間實行無縫且可靠切換。
如先前所闡述,LFE聲道信號用於範圍為20 Hz至120 Hz之深度低音調聲響,且通常發送至經設計以再生低頻率音訊內容之一揚聲器(例如,一低音揚聲器)。將LFE聲道信號輸入至LFE聲道信號編碼單元105中,LFE聲道信號編碼單元105經組態以按照參考圖2A之闡述對LFE聲道信號進行編碼。
在一些實施方案中,一IVAS解碼器包括:空間後設資料解碼單元106,其經組態以恢復空間後設資料;及主音訊聲道解碼單元107,其經組態以恢復1至N個聲道音訊信號。將所恢復之空間後設資料及所恢復之1至N個聲道音訊信號輸入至空間合成/升混/呈現單元109中,空間合成/升混/呈現單元109經組態以使用空間後設資料將1至N個聲道音訊信號合成並呈現為N個或N個以上聲道輸出音訊信號以供在各種音訊系統之揚聲器上播放,包含但不限於:家庭影院系統、視訊會議室系統、虛擬實境(VR)裝備及能夠呈現音訊之任何其他音訊系統。LFE聲道解碼單元108接收LFE位元串流且經組態以對LFE位元串流進行解碼,如參考圖2B所闡述。
儘管上文所闡述之LFE編碼/解碼之實例性實施方案係藉由一IVAS編碼解碼器來實行,但下文所闡述之低延遲LFE編碼解碼器可係一獨立LFE編碼解碼器,或其可包含於在需要或期望低延遲及可組態性之音訊應用中對低頻率信號進行編碼及解碼之任何專用或標準化音訊編碼解碼器。
圖2A係圖解說明根據一或多個實施例的圖1中所展示之LFE聲道編碼單元105之功能組件之一方塊圖。圖2B係圖解說明根據一或多個實施例的圖1中所展示之LFE聲道解碼器108之功能組件之一方塊圖。LFE聲道解碼器108包括熵解碼與逆量化單元204、逆MDCT與窗口化單元205、延時調整單元206及輸出LPF 207。延時調整單元206可位於LPF 207之前或之後,且實行延時調整(例如,藉由緩衝經解碼LFE聲道信號)以使經解碼LFE聲道信號與主編碼解碼器經解碼輸出相匹配。在後文中,參考圖2B所闡述之LFE聲道編碼單元105及LFE聲道解碼單元108統稱為一LFE編碼解碼器。
LFE聲道編碼單元105包括輸入低通濾波器(LPF) 201、窗口化與MDCT單元202以及量化與熵寫碼單元203。在一實施例中,輸入音訊信號係一脈衝碼調變(PCM)音訊信號,且LFE聲道編碼單元105預期一步幅為5毫秒、10毫秒或20毫秒之一輸入音訊信號。內在地,LFE聲道編碼單元105對5毫秒或10毫秒子訊框進行操作,且對此等子訊框之一組合實行窗口化及MDCT。在一實施例中,LFE聲道編碼單元105以一20毫秒輸入步幅運行且內在地將此輸入劃分成相等長度之兩個子訊框。去往LFE之先前輸入訊框之最後子訊框與去往LFE之當前輸入訊框之第一子訊框級聯且被窗口化。去往LFE之當前輸入訊框之第一子訊框與去往LFE之當前輸入訊框之第二子訊框級聯且被窗口化。實行MDCT兩次,每一經窗口化區塊上各一次。
在一實施例中,演算法延時(不包含成框延時)等於8毫秒+由輸入LPF 103引致之延時+由輸出LPF 207引致之延時。在四階輸入LPF 201及四階輸出LPF 207之情況下,總系統延遲係大約15毫秒。在四階輸入LPF 201及二階輸出LPF 207之情況下,總LFE編碼解碼器延遲大約13毫秒。
圖3係圖解說明根據一或多個實施例的一實例性輸入LPF 201之一頻率回應之一曲線圖。在所展示之實例中,LPF 201係截止頻率為130 Hz之四階巴特沃斯濾波器。其他實施例可使用具有相同或不同階數以及相同或不同截止頻率的一不同類型之LPF (例如,契比雪夫(Chebyshev)、貝索(Bessel))。
圖4係圖解說明,根據一或多個實施例之一菲爾德窗口之一曲線圖。在一實施例中,由窗口化與MDCT單元202應用之窗函數係漸隱長度為8毫秒之一菲爾德窗函數。菲爾德窗口係α=5之一凱澤-貝索導出(KBD)窗,其係藉由建構來滿足MDCT之Princen-Bradley條件,且因此以先進音訊寫碼(AAC)數位音訊格式使用的一窗口。亦可使用其他窗函數。
量化及熵寫碼
在一實施例中,量化與熵寫碼單元203實施符合輸入LPF 201頻率回應曲線之一量化策略以更高效地將MDCT係數量化。在一實施例中,將頻率範圍劃分為表示4個頻帶之4個次頻帶群組:0 Hz至100 Hz、100 Hz至200 Hz、200 Hz 至300 Hz及300 Hz至400 Hz。此等頻帶是實例,且更多或更少的頻帶可與相同或不同頻率範圍一起使用。更確切而言,MDCT係數係使用基於一特定訊框中之MDCT係數值動態地運算之一縮放移位因數加以量化,且依據LPF頻率回應曲線選擇量化點,如圖5至圖8中所展示。此量化策略有助於減少MDCT係數的屬100 Hz至200 Hz、200 Hz至300 Hz及300 Hz至400 Hz頻帶之量化點,而為主LFE頻帶0 Hz至100 Hz保留最佳量化點,0 Hz至100 Hz中將存在最低頻率效應能量(例如,隆隆聲)。
在一實施例中,下文闡述去往LFE聲道編碼單元105之一Flen
毫秒(ms)輸入PCM步幅(輸入訊框長度)之一量化策略,其中訊框長度Flen
可取由5*f
ms給定之任何值,在此1<=f
<=12。
首先,將輸入PCM步幅劃分成相等長度的N
個子訊框,每一子訊框寬度(Sw
) =Flen
/N
ms。N
應經選擇以使得每一Sw
係5 ms之倍數(舉例而言,若Flen =
20 ms,則N
可係1、2或4;若Flen
= 10 ms,則N可係1或2;且若Flen
= 5 ms,則N
等於1)。使Si
係任何給定訊框中的第i
子訊框,在此i
係範圍係0 <=i
<=N
之一整數,其中S0
對應於去往LFE編碼單元105之先前輸入訊框中之最後子訊框,且S1
至SN
係當前訊框中之N
個子訊框。
接下來,將每一Si
及Si+1
子訊框級聯且利用一菲爾德窗口(參見圖4)來窗口化,且然後對此等經窗口化樣本實行MDCT。此使得對每一訊框進行總共N次MDCT。來自每一MDCT之MDCT係數之數目(num_coeffs
) =取樣頻率*Sw
/1000。每一MDCT之頻率解析度(每一MDCT係數之寬度)(Wmdct
)係大約1000/(2*Sw
) Hz。鑒於低音揚聲器通常具有大約100 Hz至120 Hz之一LPF截止點,且在400 Hz之後的後LPF能量通常非常低,將高達400 Hz的MDCT係數量化且發送至LFE解碼單元108,而將MDCT係數之其餘部分量化為0。發送高達400 Hz的MDCT係數確保在LFE解碼單元108處高達120 Hz的高品質重構。因此,用於量化及碼(Nquant
)之MDCT係數之總數目等於N*400/Wmdct
。
接下來,將MDCT係數配置於M
個次頻帶群組中,其中每一次頻帶群組之寬度係Wmdct
之一倍數且所有次頻帶群組之寬度之和等於400 Hz。使每一次頻帶之寬度係SBWm
Hz,其中m
係範圍為1 <=m
<=M
之一整數。在此寬度下,第m
次頻帶群組中之係數之數目=SNquant
=N*SBWm
/Wmdct
(即,來自每一MDCT之SBWm
/Wmdct
係數)。然後,根據下文所闡述之一移位縮放因數(shift)來縮放每一次頻帶群組中之MDCT係數,該移位縮放因數係由所有Nquant
MDCT係數之絕對值之和或最大值確定。然後,在編碼器輸入處使用符合LPF曲線之一量化方案單獨地將每一次頻帶群組中之縮放MDCT係數量化及寫碼。利用一熵寫碼器(例如,一算術或霍夫曼寫碼器)對經量化MDCT係數進行寫碼。利用一不同熵寫碼器來對每一次頻帶群組進行寫碼,且每一熵寫碼器使用一恰當概率分佈模型來高效地對各別次頻帶群組進行寫碼。
現在將闡述具有一20毫秒(ms)之步幅(Flen
= 20 ms)、2個子訊框(N
= 2)且取樣頻率= 48000之一實例性量化策略。在此實例性輸入組態下,子訊框寬度Sw
= 10 ms且MDCT之數目 =N
= 2。對一20 ms區塊實行第一MDCT。藉由將先前20 ms 輸入中之一10 ms至20 ms子訊框與當前20 ms輸入中之一0 ms至10 ms子訊框級聯來形成此區塊,且然後對20 ms長之菲爾德窗口進行窗口化(參見圖4)。在N
= 1且N
= 4之情況下,相應地對菲爾德窗口進行縮放且漸隱長度改變為16/N ms。對藉由利用一20 ms長菲爾德窗口給當前20 ms輸入訊框窗口化所形成之一20 ms區塊實行第二MDCT。每一MDCT的MDCT係數數目(num_coeffs
) =480,每一MDCT係數之寬度Wmdct
= 50 Hz,量化及寫碼之係數之總數目Nquant
=16,且量化及寫碼之係數之總數目/MDCT
= 16/N = 8。
接下來,將MDCT係數配置於4個次頻帶群組(M=4)中,其中每一次頻帶群組對應於一100 Hz頻帶(0至100、100至200、200至300、300至400、SBWm
=100 Hz,每一次頻帶群組中之係數之數目=SNquant
=N*SBWm
/Wmdct
= 4)。使a1
、a2
、a3
、a4
、a5
、a6
、a7
、a8
作為將自第一MDCT量化之前8個MDCT係數,且b1
、b2
、b3
、b4
、b5
、b6
、b7
、b8
作為將自第二MDCT量化之前8個MDCT係數。4個次頻帶群組經配置以具有以下係數:
次頻帶群組1 = {a1
, a2
, b1
, b2
},
次頻帶群組2 = {a3
, a4
, b3
, b4
},
次頻帶群組3 ={a5
, a6
, b5
, b6
},
次頻帶群組4 = {a7
, a8
, b7
, b8
},
其中每一次頻帶群組對應於一100 Hz頻帶。
一增益為大約-30 dB (或小於-30 dB)之訊框可具有值為大於10-2
或10-1
或更低之MDCT係數,而具有滿量程增益之一訊框可具有值為20或高於20之MDCT係數。為滿足此寬的值範圍,基於可用之最大量化點(max_value
)及MDCT係數(lfe_dct_new
)之絕對值之一和來運算一縮放移位因數(shift
),如下:
shift=floor(shifts_per_double*log2(max_value/sum(abs(lfe_dct_new))))。
在一實施方案中,lfe_dct_new係16個MDCT係數之一陣列,shifts_per_double係一常數(例如4),max_value係為精細量化(例如,63個量化值)及粗略量化(例如,31個量化值)而選擇之一整數,且在精細量化時移位僅限於自4至35之5位元值,且在粗略量化時移位僅限於2至33之5位元值。
然後,如下運算經量化MDCT係數:
vals=round(lfe_dct_new*(2^(shift/shifts_per_double))),其中round()運算將結果四捨五入至最接近整數值。
若經量化值(vals
)超過最大允許的可用量化點數目(max_val
),則減小縮放移位因數(shift)且再次計算經量化值(vals
)。在其他實施方案中,代替和函數sum(abs(lfe_dct_new))),可使用最大值函數max(abs(lfe_dct_new)))來運算縮放移位因數(shift
),但使用max()函數將將量化值更分散,而使得設計一高效的熵寫碼器更困難。
在上文所闡述之量化步驟中,在一個迴路中一起計算每一次頻帶群組之經量化值,但每一次頻帶群組之量化點係不同的。若第一次頻帶群組超過允許的範圍,則減小縮放移位因數。若其他次頻帶群組中之任一者超過允許的範圍,則將該次頻帶群組刪減為max_value
。針對每一次頻帶群組單獨地對所有MDCT係數之正負號位元及經量化MDCT係數之絕對值進行寫碼。
圖5圖解說明根據一或多個實施方案精細量化點隨頻率之變化。在精細量化時,次頻帶群組1 (0 Hz至100 Hz)具有64個量化點,次頻帶群組2 (100 Hz至200 Hz)具有32個量化點,次頻帶群組3 (200 Hz至300 Hz)具有8個量化點且次頻帶群組4 (300 Hz至400 Hz)具有2個量化點。在一實施例中,利用熵寫碼器(例如,一算術或霍夫曼熵寫碼器)對每一次頻帶群組進行熵寫碼,其中每一熵寫碼器使用一不同概率分佈。因此,主0 Hz至100 Hz範圍被分配的量化點最多。
注意,為次頻帶群組1至次頻帶群組4分配量化點係遵循LPF頻率回應曲線之形狀,該LPF頻率回應曲線在較低頻率中所具有之資訊多於在較高頻率中之資訊,且在截止頻率之外無資訊。為正確地重構高達130 Hz之頻率,亦對與高於130 Hz之頻率對應之MDCT係數進行編碼以避免或最小化頻疊。在一些實施方案中,對高達400 Hz之MDCT係數進行編碼以使得可在解碼單元處恰當地重構高達130 Hz之頻率。
圖6圖解說明根據一或多個實施方案粗略量化點隨頻率之變化。在粗略量化時,次頻帶群組1 (0 Hz至100 Hz)具有32個量化點,次頻帶群組2 (100 Hz至200 Hz)具有16個量化點,次頻帶群組3 (200 Hz至300 Hz) 具有4個量化點且次頻帶群組4 (300 Hz至400 Hz)未經量化及熵寫碼。在一實施例中,利用使用一不同概率分佈之一單獨熵寫碼器來對每一次頻帶群組進行熵寫碼。
圖7圖解說明根據一或多個實施方案在精細量化時經量化MDCT係數之一概率分佈。y軸係出現頻率且x軸係量化點數目。Sg1係與0 Hz至100 Hz頻帶中之經量化MDCT係數對應之次頻帶群組1,Sg2係與100 Hz至200 Hz頻帶中之經量化MDCT係數對應之次頻帶群組2。Sg3係與200 Hz至300 Hz頻帶中之經量化MDCT係數對應之次頻帶群組3。Sg4係與頻帶300 Hz至400 Hz中之經量化MDCT係數對應之次頻帶群組4。
圖8圖解說明根據一或多個實施方案在粗略量化時經量化MDCT係數之一概率分佈。y軸係出現頻率且x軸係量化點數目。Sg1係與0 Hz至100 Hz頻帶中之經量化MDCT係數對應之次頻帶群組1,Sg2係與100 Hz至200 Hz頻帶中之經量化MDCT係數對應之次頻帶群組2。Sg3係與200 Hz至300 Hz頻帶中之經量化MDCT係數對應之次頻帶群組3。Sg4係與頻帶300 Hz至400 Hz中之經量化MDCT係數對應之次頻帶群組4。
注意,主頻帶(0 Hz至100 Hz)係發現LFE效應最多的頻帶且因此分配更多量化點以達到更大解析度。然而,在粗略量化中分配給主頻帶之位元比精細量化少。在一實施例中,針對MDCT係數之一訊框是使用精細量化還是粗略量化取決於由主音訊聲道編碼器103設定之所期望目標位元速率。主音訊聲道編碼器103在初始化期間一次性設定此值,或基於對每一訊框中之主音訊聲道進行編碼所需或所使用之位元而逐訊框地動態設定此值。
靜寂訊框
在一些實施方案中,在LFE聲道位元串流中添加一信號以指示靜寂訊框。一靜寂訊框係具有低於一所規定臨限值之能量之一訊框。在一些實施方案中,將1位元包含於傳輸至解碼器之LFE聲道位元串流中(例如,插入於訊框標頭中)以指示一靜寂訊框,且將LFE聲道位元串流中之所有MDCT係數設定為0。在靜寂訊框期間此技術可將位元速率減小至50 bps。
解碼器LPF
在LFE聲道解碼單元108之輸出處提供實施LPF 207 (參見圖2B)之兩個選項。基於可用延時(其他音訊聲道之總延時減去LFE漸隱延時減去輸入LPF延時)選擇LPF 207。注意,預期由主音訊聲道編碼單元103/主音訊聲道解碼單元107對其他聲道進行編碼/解碼,且該等聲道之延時取決於主音訊聲道編碼單元103/主音訊聲道解碼單元107之演算法延時。
在一實施方案中,若可用延時小於3.5 ms,則使用截止點為130 Hz之二階巴特沃斯LPF;否則使用截止點為130 Hz之四階巴特沃斯LPF。因此,在LFE聲道解碼單元108處,需在移除在截止頻率以外的疊頻能量與演算法延時之間做出折衷。在一些實施方案中,可完全移除LPF 207,此乃因低音揚聲器通常具有一LPF。LPF 20有助於減小LFE解碼器輸出自身的截止點以外的疊頻能量,且可有助於高效後處理。
實例性程序
圖9係根據一或多個實施方案的對MDCT係數進行編碼之一程序900之一流程圖。可使用例如參考圖11所闡述之系統1100實施程序900。
程序900包含以下步驟:接收一時域LFE聲道信號(901);使用一低通濾波器對該時域LFE聲道信號進行濾波(902);將經濾波時域LFE聲道信號轉換成LFE聲道信號的包括表示LFE聲道信號之一頻譜之一定數目個係數之一頻域表示(903);將係數配置至與LFE聲道信號之不同頻帶對應之一定數目個次頻帶群組中(904);根據低通濾波器之一頻率回應曲線使用縮放移位因數將每一次頻帶群組中之係數量化(905);使用針對次頻帶群組組態之一熵寫碼器對每一次頻帶群組中之經量化係數進行編碼(906);產生包含經編碼之經量化係數之一位元串流(907);及將位元串流儲存於一儲存裝置上或將位元串流串流傳輸至一下游裝置(908)。
圖10係根據一或多個實施方案的對MDCT係數進行解碼之一程序1000之一流程圖。可使用例如參考圖11所闡述之系統1100來實施程序1000。
程序1000包含以下步驟:接收一LFE聲道位元串流(1001),其中LFE聲道位元串流包括表示一時域LFE聲道信號之一頻譜之經熵寫碼係數;對係數進行解碼及逆量化(1002),其中係數係使用一縮放移位因數根據一低通濾波器之一頻率回應曲線在與不同頻帶對應之次頻帶群組中被量化;將經解碼且經逆量化係數轉換成一時域LFE聲道信號(1003);調整時域LFE聲道信號之一延時(1004);及使用一低通濾波器對經延時調整之LFE聲道信號進行濾波(1005)。在一實施例中,可基於可自用於對包括時域LFE聲道信號之一多聲道音訊信號之全頻帶寬度聲道進行編碼/解碼之一主編碼解碼器得到之一總演算法延時來對低通濾波器之階數進行組態。在一些實施方案中,解碼單元僅需要獲悉編碼單元是利用精細量化還是粗略量化對MDCT係數進行編碼即可。可使用LFE位元串流標頭中之一位元或任何其他適合的傳信機制來指示量化類型。
在一些實施方案中,按照如下方式實行經逆量化係數至時域PCM樣本之解碼。將每一次頻帶群組中之經逆量化係數重新配置至N個群組中(N是在編碼單元處運算之MDCT之數目),其中每一群組具有與各別MDCT對應之係數。根據上文所闡述之實例性實施方案,編碼單元對以下4個次頻帶群組進行編碼:
次頻帶群組1 = {a1
, a2
, b1
, b2
},
次頻帶群組2 = {a3
, a4
, b3
, b4
},
次頻帶群組3 = {a5
, a6
, b5
, b6
},
次頻帶群組4 = {a7
, a8
, b7
, b8
}。
解碼單元對4個次頻帶群組進行解碼且將其重新配置回至{a1
, a2
, a3
, a4
, a5
, a6
, a7
, a8
}及{b1
, b2
, b3
, b4
, b5
, b6
, b7
, b8
},且然後將零填補到群組以得到所期望之逆MDCT (iMDCT)輸入長度。實行N次iMDCT 以將每一群組中之MDCT係數逆變換成時域區塊。在此實例中,每一區塊係2*Sw ms寬,其中Sw係上文所界定之子訊框寬度。接下來,由圖4中所展示之LFE編碼單元使用之同一菲爾德窗口來給此區塊窗口化。藉由恰當地疊加先前iMDCT輸出之經窗口化資料與當前iMDCT輸出來重新建構每一子訊框Si
(i係1 < =i
< =N
之間的一整數)。最後,藉由級聯所有N個子訊框來重新建構(1003)之輸出。
實例性系統架構
圖11係根據一或多個實施方案的用於實施參考圖1至圖10所闡述之特徵及程序之一系統1100之一方塊圖。系統1100包括一或多個伺服器電腦或任何用戶端裝置,包含但不限於:叫用伺服器、使用者裝備、會議室系統、家庭影院系統、虛擬實境(VR)裝備及沉浸式內容攝取裝置。系統1100包括任何消費型裝置,包含但不限於:智慧型電話、平板電腦、可穿戴電腦、車輛電腦、遊戲主控台、環繞式系統、資訊站等。
如所展示,系統1100包括一中央處理單元(CPU) 1101,中央處理單元1101能夠根據儲存於例如一唯讀記憶體(ROM) 1102中之一程式或自例如一儲存單元1108載入至一隨機存取記憶體(RAM) 1103之一程式實行各種程序。在RAM 1103中亦視需要儲存當CPU 1101實行各種程序時所需之資料。CPU 1101、ROM 1102及RAM 1103經由一匯流排1104彼此連接。一輸入/輸出(I/O)介面1105亦連接至匯流排1104。
以下組件連接至I/O介面1105:一輸入單元1106,其可包含一鍵盤、一滑鼠等;一輸出單元1107,其可包含一顯示器,例如一液晶顯示器(LCD)及一或多個揚聲器;儲存單元1108,其包含一硬碟或另一適合的儲存裝置;及一通信單元1109,其包含一網路介面卡,例如一網路卡(例如,有線或無線)。
在一些實施方案中,輸入單元1106包括處於不同位置中(根據主機裝置)且能夠以各種格式擷取音訊信號(例如,單聲道、立體聲、空間、沉浸式及其他適合的格式)之一或多個麥克風。
在一些實施方案中,輸出單元1107包含具有各種數目個揚聲器之系統。輸出單元1107 (根據主機裝置之能力)可以各種格式(例如,單聲道、立體聲、沉浸式、雙聲道及其他適合的格式)呈現音訊信號。
通信單元1109經組態以與其他裝置進行通信(例如,經由一網路)。一磁碟機1110亦視需要連接至I/O介面1105。一可抽換式媒體1111 (例如一磁碟、一光碟、一磁光碟、一快閃磁碟機或另一適合可抽換式媒體)安裝於磁碟機1110上,使得視需要將自可抽換式媒體1111讀取之一電腦程式安裝至儲存單元1108中。熟習此項技術者應理解儘管系統1100被闡述為包含上文所闡述之組件,但在實際應用中,可添加、移除及/或替換此等組件中之一些組件且所有此等修改或更改全部處於本發明之範疇內。
根據本發明之實例性實施例,上文所闡述之程序可被實施為電腦軟體程式或實施於一電腦可讀儲存媒體上。舉例而言,本發明之實施例包含一電腦程式產品,該電腦程式產品包含有形地體現於一機器可讀媒體上之一電腦程式,該電腦程式包含用於實行方法之程式碼。在此等實施例中,電腦程式可經由通信單元1309自網路下載且安裝,及/或自可抽換式媒體1111安裝。
通常,本發明之各種實例性實施例可被實施為硬體或特殊用途電路(例如,控制電路系統)、軟體、邏輯或其任何組合。舉例而言,上文所論述之單元可由控制電路系統(例如,與圖11之其他組件組合之一CPU)執行,因此控制電路系統可正在實行本發明中所闡述之動作。一些態樣可被實施為硬體,而其他態樣可被實施為可由一控制器、微處理器或其他運算裝置(例如,控制電路系統)執行之韌體或軟體。雖然本發明之實例性實施例之各項態樣可被圖解說明且闡述為方塊圖、流程圖或使用某一其他圖形表示,但應瞭解,本文中所闡述之這些方塊、設備、系統、技術或方法可在(作為非限制性實例)硬體、軟體、韌體、特殊用途電路或邏輯、一般用途硬體或控制器或者其他計算裝置或其某一組合中實施。
另外,流程圖中所展示之各種區塊可被視為方法步驟及/或由電腦程式碼之操作達成之操作,及/或被視為經構造以施行相關聯功能之複數個耦合邏輯電路元件。舉例而言,本發明之實施例包含一電腦程式產品,該電腦程式產品包含有形地體現於一機器可讀媒體上之一電腦程式,該電腦程式含有經組態以施行上文所闡述之方法之程式碼。
在本發明之內容脈絡中,一機器/電腦可讀媒體可係可含有或儲存由一指令執行系統、設備或裝置使用之一程式或與一指令執行系統、設備或裝置結合之任何有形媒體。機器/電腦可讀媒體可係一機器/電腦可讀信號媒體或一機器/電腦可讀儲存媒體。一機器/電腦 可讀媒體可係非暫時性的且可包含但不限於一電子、磁性、光學、電磁、紅外線或半導體系統、設備或裝置或前述各項之任何適合的組合。機器/電腦可讀儲存媒體之更具體實例將包含具有一或多個配線之一電連接、一可攜式電腦磁碟、一硬碟、RAM、ROM、一可抹除可程式化唯讀記憶體(EPROM或快閃記憶體)、一光纖、一可攜式光碟唯讀記憶體(CD-ROM)、一光學儲存裝置、一磁性儲存裝置或前述各項之任何適合組合。
可以一或多種程式設計語言之任何組合撰寫施行本發明方法之電腦程式碼。可將此等電腦程式碼提供給一般用途電腦、特殊用途電腦之一處理器或具有控制電路系統之其他可程式化資料處理設備,以使得程式碼在由電腦或其他可程式化資料處理設備之處理器執行時使得將實施在流程圖及/或方塊圖中所規定之功能/操作。程式碼可作為一獨立軟體封裝完全地在一電腦上、部分地在電腦上執行,部分地在電腦上且部分地在一遠端電腦上執行,或者完全地在遠端電腦或伺服器上執行,亦或者散佈於一或多個遠端電腦及/或伺服器上。
雖然本文件含有諸多具體實施方案細節,但此等細節不應被解釋為對可主張內容之範疇之限制,而是應被解釋為可係對特定實施例特有之特徵之說明。本說明書中在單獨實施例之內容脈絡中所闡述之特定特徵亦可以組合方式實施於一單個實施例中。相反地,在一單個實施例之內容脈絡中闡述之各種特徵亦可單獨地或以任何適合子組合方式實施於多個實施例中。此外,儘管上文可將特徵闡述為以特定組合方式起作用且甚至最初如此主張,但來自一所主張組合之一或多個特徵在一些情形中可自該組合去除,且該所主張組合可針對於一子組合或一子組合之變化形式。圖中所描繪之邏輯流程不需要所展示之特定次序或順序次序來達成所期望結果。另外,可提供其他步驟,或可自所闡述之流程清除步驟,且可為所闡述之系統添加或自所闡述之系統移除其他組件。因此,其他實施方案處於所附申請專利範圍之範疇內。
100:沉浸式聲音與音訊服務編碼解碼器
101:音訊資料
102:空間分析與降混單元
103:主音訊聲道編碼單元/主音訊聲道編碼器
104:空間後設資料編碼單元
105:低頻率效應聲道編碼單元
106:空間後設資料解碼單元
107:主音訊聲道解碼單元
108:低頻率效應聲道解碼單元
109:空間合成/升混/呈現單元
201:輸入低通濾波器/四階輸入低通濾波器/低通濾波器
202:修改型離散餘弦變換單元
203:量化與熵寫碼單元
204:熵解碼與逆量化單元
205:逆修改型離散餘弦變換與窗口化單元
206:延時調整單元
207:輸出低通濾波器/低通濾波器/四階輸出低通濾波器/二階輸出低通濾波器
900:程序
901:步驟
902:步驟
903:步驟
904:步驟
905:步驟
906:步驟
907:步驟
908:步驟
1000:程序
1001:步驟
1002:步驟
1003:步驟
1004:步驟
1005:步驟
1100:系統
1101:中央處理單元
1102:唯讀記憶體
1103:隨機存取記憶體
1104:匯流排
1105:輸入/輸出介面
1309:通信單元
在圖式中,為易於說明起見展示示意性元件(例如,表示裝置、單元、指令區塊及資料元素之元件)之具體配置或次序。然而,熟習此項技術者應理解,圖式中之示意性元件之具體次序或配置並不意在暗示需要一特定處理次序或順序或程序分離。此外,一圖式中包含一示意性元件並不意在暗示在所有實施例中皆需要此等元件,或並不意在暗示由此等元件表示之特徵可不包含於一些實施方案中或與在一些實施方案中之其他元件組合。
此外,在圖式中,使用連接元素(例如實線或虛線或箭頭)圖解說明兩個或兩個以上其他示意性元件之間或當中的一連接、關係或關聯性,不存在任何此等連接元素並不意在暗示連接、關係或關聯性不可存在。換言之,圖式中未展示元件之間的一些連接、關係或關聯性以免使本發明模糊。另外,為易於圖解說明,使用一單個連接元件來表示元件之間的多個連接、關係或關聯性。舉例而言,在一連接元素表示信號、資料或指令之一通信,熟習此項技術者應理解此等元素視需要表示影響通信之一或多個信號路徑。
圖1圖解說明根據一或多個實施方案的用於對IVAS及LFE位元串流進行編碼及解碼之一IVAS編碼解碼器。
圖2A係圖解說明根據一或多個實施方案的LFE編碼之一方塊圖。
圖2B係圖解說明根據一或多個實施方案之LFE解碼之一方塊圖。
圖3係圖解說明根據一或多個實施方案的具有130 Hz之一拐角一截止點之四階巴特沃斯低通濾波器之一頻率回應之一曲線圖。
圖4係圖解說明根據一或多個實施方案之一菲爾德(Fielder)窗口之一曲線圖。
圖5圖解說明根據一或多個實施方案的精細量化點隨頻率之變化。
圖6圖解說明根據一或多個實施方案的粗略量化點隨頻率之變化。
圖7圖解說明根據一或多個實施方案的經量化MDCT係數隨精細量化之一概率分佈。
圖8圖解說明根據一或多個實施方案的經量化MDCT係數隨粗略量化之一概率分佈。
圖9係根據一或多個實施方案的對修改型離散餘弦變換(MDCT)係數進行編碼之一程序之一流程圖。
圖10係根據一或多個實施方案的對修改型離散餘弦變換(MDCT)係數進行解碼之一程序之一流程圖。
圖11係根據一或多個實施方案的用於實施參考圖1至圖10所闡述之特徵及程序之一系統之一方塊圖。
各個種圖式中使用相同參考符號來指示相似元件。
100:沉浸式聲音與音訊服務編碼解碼器
101:音訊資料
102:空間分析與降混單元
103:主音訊聲道編碼單元/主音訊聲道編碼器
104:空間後設資料編碼單元
105:低頻率效應聲道編碼單元
106:空間後設資料解碼單元
107:主音訊聲道解碼單元
108:低頻率效應聲道解碼單元
109:空間合成/升混/呈現單元
Claims (22)
- 一種對一低頻率效應(LFE)聲道進行編碼之方法,其包括: 使用一或多個處理器接收一時域LFE聲道信號; 使用一低通濾波器對該時域LFE聲道信號進行濾波; 使用該一或多個處理器將經濾波之該時域LFE聲道信號轉換成該LFE聲道信號的包含表示該LFE聲道信號之一頻譜之一定數目個係數之一頻域表示; 使用該一或多個處理器將係數配置至與該LFE聲道信號之不同頻帶對應之一定數目個次頻帶群組中; 使用該一或多個處理器根據該低通濾波器之一頻率回應曲線將每一次頻帶群組中之係數量化; 使用該一或多個處理器使用針對每一次頻帶群組調諧之一熵寫碼器對該次頻帶群組中之該等經量化係數進行編碼;及 使用該一或多個處理器產生包含經編碼之該等經量化係數之一位元串流;及 使用該一或多個處理器將該位元串流儲存於一儲存裝置上或將該位元串流串流傳輸至一下游裝置。
- 如請求項1之方法,其中將每一次頻帶群組中之該等係數量化進一步包括: 基於可用量化點之一最大數目及該等係數之絕對值之一和來產生一縮放移位因數;及 使用該縮放移位因數將該等係數量化。
- 如請求項2之方法,若一經量化係數超過量化點之該最大數目,則將該縮放移位因數減小且再次將該等係數量化。
- 如前述請求項1至3中任一項之方法,其中對於每一次頻帶群組而言,該等量化點係不同的。
- 如前述請求項1至3中任一項之方法,其中根據一精細量化方案或一粗略量化方案將每一次頻帶群組中之該等係數量化,其中與根據該粗略量化方案指派給一或多個次頻帶群組之量化點相比,利用該精細量化方案將更多量化點分配給該等各別次頻帶群組。
- 如前述請求項1至3中任一項之方法,其中該等係數之正負號位元與該等係數被分開寫碼。
- 如前述請求項1至3中任一項之方法,其中存在四個次頻帶群組,且一第一次頻帶群組對應於0 Hz至100 Hz之一第一頻率範圍,一第二次頻帶群組對應於100 Hz至200 Hz之一第二頻率範圍,一第三次頻帶群組對應於200 Hz至300 Hz之一第三頻率範圍,且一第四次頻帶群組對應於300 Hz至400 Hz之一第四頻率範圍。
- 如前述請求項1至3中任一項之方法,其中該熵寫碼器係一算術熵寫碼器。
- 如前述請求項1至3中任一項之方法,其中將經濾波之該時域LFE聲道信號轉換成該LFE聲道信號的包含表示該LFE聲道信號之一頻譜之一定數目個係數的一頻域表示進一步包括: 判定該LFE聲道信號之一第一步長; 基於該第一步長指定一窗函數之一第一窗口大小; 將該第一窗口大小應用於該時域LFE聲道信號之一或多個訊框;及 將一修改型離散餘弦變換(MDCT)應用於經窗口化之該等訊框以產生該等係數。
- 如請求項9之方法,其進一步包括: 判定該LFE聲道信號之一第二步長; 基於該第二步長指定該窗函數之一第二窗口大小;及 將該第二窗口大小應用於該時域LFE聲道信號之該一或多個訊框。
- 如請求項10之方法,其中: 該第一步長係N毫秒(ms); N大於或等於5 ms且小於或等於60 ms; 該第一窗口大小高於或等於10 ms; 該第二步長係5 ms;且 該第二窗口大小係10 ms。
- 如請求項10之方法,其中: 該第一步長係20毫秒(ms); 該第一窗口大小係10 ms、20 ms或40 ms; 該第二步長係10 ms;且 該第二窗口大小係10 ms或20 ms。
- 如請求項10之方法,其中: 該第一步長係10毫秒(ms); 該第一窗口大小係10 ms或20 ms; 該第二步長係5 ms;且 該第二窗口大小係10 ms。
- 如請求項10之方法,其中: 該第一步長係20毫秒(ms); 該第一窗口大小係10 ms、20 ms或40 ms; 該第二步長係5 ms;且 該第二窗口大小係10 ms。
- 如請求項9之方法,其中該窗函數係具有一可配置漸隱長度之一凱撒-貝索導出(KBD)窗函數。
- 如前述請求項1至3中任一項之方法,其中該低通濾波器係一截止頻率為約130 Hz或低於130 Hz之一四階巴特沃斯低通濾波器。
- 如請求項1至3中任一項之方法,其進一步包括: 使用該一或多個處理器判定該LFE聲道信號之一訊框之一能量位準是否低於一臨限值; 根據該能量位準低於一臨限位準, 產生一靜寂訊框指示符以指示該解碼器; 將該靜寂訊框指示符插入至該LFE聲道位元串流之後設資料中;及 在偵測到靜寂訊框時減小一LFE聲道位元速率。
- 一種對一低頻率效應(LFE)聲道位元串流進行解碼之方法,其包括: 使用一或多個處理器接收一LFE聲道位元串流,該LFE聲道位元串流包含表示一時域LFE聲道信號之一頻譜之熵寫碼係數; 使用該一或多個處理器使用一熵解碼器將經量化係數解碼; 使用該一或多個處理器將經量化係數逆量化,其中該等係數已根據用於在一編碼器中對該時域LFE聲道信號進行濾波之一低通濾波器之一頻率回應曲線而在與頻帶對應之次頻帶群組中被量化; 使用該一或多個處理器將經逆量化之該等係數轉換成一時域LFE聲道信號; 使用該一或多個處理器調整該時域LFE聲道信號之一延時;及 使用一低通濾波器對經延時調整之該LFE聲道信號進行濾波。
- 如請求項18之方法,其中低通濾波器之一階數經組態以確保由於對該LFE聲道進行編碼及解碼所致之一第一總演算法延時小於或等於由於對包含該LFE聲道信號之一多聲道音訊信號中之其他聲道進行編碼及解碼所致之一第二總演算法延時。
- 如請求項19之方法,其進一步包括: 判定該第二總演算法延時是否超過一臨限值;及 根據該第二總演算法延時超過該臨限值, 將該低通濾波器組態為一N階低通濾波器,其中N係大於或等於2之一整數;及 根據該第二總演算法延時不超過該臨限值, 將該低通濾波器之該階數組態為小於N。
- 一種低延遲低頻率效應(LFE)之編碼器/解碼器,其包括: 一或多個處理器;及 一儲存指令之非暫時性電腦可讀媒體,該等指令在由該一或多個處理器執行時使得該一或多個處理器實行如方法請求項1至20中任一項之操作。
- 一種儲存指令之非暫時性電腦可讀媒體,該等指令在由一或多個處理器執行時使得該一或多個處理器實行如方法請求項1至20中任一項之操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109130176A TW202211206A (zh) | 2020-09-03 | 2020-09-03 | 低延遲、低頻率效應之編碼解碼器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109130176A TW202211206A (zh) | 2020-09-03 | 2020-09-03 | 低延遲、低頻率效應之編碼解碼器 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202211206A true TW202211206A (zh) | 2022-03-16 |
Family
ID=81731788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109130176A TW202211206A (zh) | 2020-09-03 | 2020-09-03 | 低延遲、低頻率效應之編碼解碼器 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW202211206A (zh) |
-
2020
- 2020-09-03 TW TW109130176A patent/TW202211206A/zh unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6626581B2 (ja) | 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法 | |
US8527282B2 (en) | Method and an apparatus for processing a signal | |
CN110085239B (zh) | 对音频场景进行解码的方法、解码器及计算机可读介质 | |
CN107077861B (zh) | 音频编码器和解码器 | |
WO2019105575A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
JP2021513108A (ja) | ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法 | |
KR20170087529A (ko) | 오디오 인코더 및 디코더 | |
CN114175151A (zh) | Ivas比特流的编码和解码 | |
EP3762923A1 (en) | Audio coding | |
JP2023530409A (ja) | マルチチャンネル入力信号内の空間バックグラウンドノイズを符号化および/または復号するための方法およびデバイス | |
US20220293112A1 (en) | Low-latency, low-frequency effects codec | |
US20240153512A1 (en) | Audio codec with adaptive gain control of downmixed signals | |
TW202211206A (zh) | 低延遲、低頻率效應之編碼解碼器 | |
RU2809977C1 (ru) | Кодек с малой задержкой и низкочастотными эффектами | |
RU2809587C1 (ru) | Устройство, способ и компьютерная программа для кодирования звукового сигнала или для декодирования кодированной аудиосцены | |
TW202429446A (zh) | 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的解碼器及解碼方法 | |
TW202411984A (zh) | 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的編碼器及編碼方法 |