TWI809289B

TWI809289B - 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體

Info

Publication number: TWI809289B
Application number: TW109124754A
Authority: TW
Inventors: 克里斯托弗克哲伶; 拉爾斯維爾摩斯; 海庫布恩哈根; 柏爾艾克斯特蘭德
Original assignee: 瑞典商都比國際公司
Priority date: 2018-01-26
Filing date: 2018-12-04
Publication date: 2023-07-21
Also published as: IL304861B1; JP2021507316A; CL2020002392A1; US11289106B2; KR20230043248A; CA3089632A1; TWI702594B; AR127544A2; BR112020014135A2; AU2019212843B2; RU2757322C2; CN111656444B; TW202343436A; WO2019148112A1; TW202046293A; IL278573B; US11626120B2; IL278573B2; US11626121B2; US20220180880A1

Abstract

本發明揭示一種用於解碼一經編碼音訊位元串流之方法。該方法包含接收該經編碼音訊位元串流且解碼音訊資料以產生一經解碼低頻帶音訊信號。該方法進一步包含提取高頻重建後設資料，且使用一分析濾波器組對該經解碼低頻帶音訊信號濾波以產生一經濾波低頻帶音訊信號。該方法亦包含：提取指示是否對該音訊資料執行頻譜平移或諧波轉置之一旗標；及根據該旗標使用該經濾波低頻帶音訊信號及該高頻重建後設資料來重新產生該音訊信號之一高頻帶部分。

Description

用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體

實施例係關於音訊信號處理，且更具體而言，係關於音訊位元串流之編碼、解碼或轉碼，其中控制資料指示對音訊資料執行一基礎形式之高頻重建(「HFR」)或一增強形式之HFR。

一典型資訊位元串流包含指示音訊內容之一或多個頻道之音訊資料(例如，經編碼音訊資料)及指示該音訊資料或音訊內容之至少一個特性之後設資料兩者。用於產生一經編碼音訊位元串流之一個熟知格式係在MPEG標準ISO/IEC 14496-3：2009中描述之MPEG-4進階音訊編碼(AAC)格式。在MPEG-4標準中，AAC表示「進階音訊編碼」且HE-AAC表示「高效率進階音訊編碼」。

MPEG-4 AAC標準定義若干音訊設定檔(audio profile)，該等音訊設定檔判定哪些物件及編碼工具存在於一合規編碼器或解碼器中。此等音訊設定檔之三者係(1)AAC設定檔；(2)HE-AAC設定檔；及(3)HE-AAC v2設定檔。AAC設定檔包含AAC低複雜性(或「AAC-LC」)物件類型。AAC-LC物件係MPEG-2 AAC低複雜性設定檔之具有一些調整之對應物，且不包含頻譜頻帶複製(「SBR」)物件類型或參數立體聲(「PS」)物件類型。HE-AAC設定檔係AAC設定檔之一超集且另外包含SBR物件類型。HE-AAC v2設定檔係HE-AAC設定檔之一超集且另外包含PS物件類型。

SBR物件類型含有頻譜頻帶複製工具，該頻譜頻帶複製工具係顯著改良感知音訊編解碼器之壓縮效率之一重要高頻重建(「HFR」)編碼工具。SBR重建(例如，解碼器中)接收器側上之一音訊信號之高頻分量。因此，編碼器僅需要編碼並傳輸低頻分量，從而容許按低資料速率之一更高音訊品質。SBR係基於先前經截斷之諧波序列之複製以便降低來自可用頻寬限制信號及自編碼器獲得之控制資料之資料速率。藉由適應性逆濾波以及雜訊與正弦波之選用相加而維持音調與類雜訊分量之間之比率。在MPEG-4 AAC標準中，SBR工具執行頻譜修補(亦稱為線性平移或頻譜平移)，其中將數個連續正交鏡相濾波器(QMF)副頻帶自一音訊信號之一經傳輸低頻部分複製(或「修補」)至該音訊信號之一高頻帶部分(其係在解碼器中產生)。

對於某些音訊類型(諸如具有相對低交越頻率之音樂內容)，頻譜修補或線性平移可能不理想。因此，需要用於改良頻譜頻帶複製之技術。

揭示一第一類別實施例，該第一類別實施例係關於一種用於解碼一經編碼音訊位元串流之方法。該方法包含接收該經編碼音訊位元串流且解碼該音訊資料以產生一經解碼低頻帶音訊信號。該方法進一步包含提取高頻重建後設資料且使用一分析濾波器組對該經解碼低頻帶音訊信號濾波以產生一經濾波低頻帶音訊信號。該方法進一步包含：提取指示是否對該音訊資料執行頻譜平移或諧波轉置之一旗標；及根據該旗標使用該經濾波低頻帶音訊信號及該高頻重建後設資料重新產生該音訊信號之一高頻帶部分。最後，該方法包含組合該經濾波低頻帶音訊信號與該經重新產生之高頻帶部分以形成一寬頻帶音訊信號。

一第二類別實施例係關於一種用於解碼一經編碼音訊位元串流之音訊解碼器。該解碼器包含：一輸入介面，其用於接收該經編碼音訊位元串流，其中該經編碼音訊位元串流包含表示一音訊信號之一低頻帶部分的音訊資料；及一核心解碼器，其用於解碼該音訊資料以產生一經解碼低頻帶音訊信號。該解碼器亦包含：一解多工器，其用於自該經編碼音訊位元串流提取高頻重建後設資料，其中該高頻重建後設資料包含針對將連續數目個副頻帶自該音訊信號之一低頻帶部分線性地平移至該音訊信號之一高頻帶部分之一高頻重建程序之操作參數；及一分析濾波器組，其用於對該經解碼低頻帶音訊信號濾波以產生一經濾波低頻帶音訊信號。該解碼器進一步包含：一解多工器，其用於自該經編碼音訊位元串流提取指示是否對該音訊資料執行線性平移或諧波轉置之一旗標；及一高頻重新產生器，其用於根據該旗標使用該經濾波低頻帶音訊信號及該高頻重建後設資料重新產生該音訊信號之一高頻帶部分。最後，該解碼器包含一合成濾波器組，該合成濾波器組用於組合該經濾波低頻帶音訊信號與該經重新產生之高頻帶部分以形成一寬頻帶音訊信號。

其他類別之實施例係關於編碼且轉碼含有後設資料之音訊位元串流，該後設資料識別是否執行增強頻譜頻帶複製(eSBR)處理。

1:編碼器

2:遞送子系統

3:解碼器

4:後處理單元

100:編碼器

105:編碼器

106:後設資料產生階段

107:填充器/格式化器階段

109:緩衝記憶體

200:解碼器

201:緩衝記憶體

202:音訊解碼子系統

203:增強頻譜頻帶複製(eSBR)處理階段

204:控制位元產生階段

205:位元串流有效負載反格式化器/剖析器

210:音訊處理單元(APU)

213:頻譜頻帶複製(SBR)處理階段

215:位元串流有效負載反格式化器/剖析器

300:後處理器

301:緩衝記憶體/緩衝器

400:增強頻譜頻帶複製(eSBR)解碼器

401:增強頻譜頻帶複製(eSBR)控制資料產生子系統

500:音訊處理單元(APU)

圖1係可經組態以執行本發明方法之一實施例之一系統之一實施例之一方塊圖。

圖2係為本發明音訊處理單元之一實施例之一編碼器之一方塊圖。

圖3係一系統之一方塊圖，該系統包含係本發明音訊處理單元之一實施例之一解碼器及視情況亦耦合至解碼器之一後處理器。

圖4係為本發明音訊處理單元之一實施例之一解碼器之一方塊圖。

圖5係為本發明音訊處理單元之另一實施例之一解碼器之一方塊圖。

圖6係本發明音訊處理單元之另一實施例之一方塊圖。

圖7係一MPEG-4 AAC位元串流之一區塊之一圖式，該區塊包含其所分割成之片段。

標記法及命名法

貫穿本發明(包含在發明申請專利範圍中)，在一廣義上使用表達「對」一信號或資料執行一操作(例如，濾波、按比例調整、變換或將增益應用至信號或資料)以表示直接對信號或資料，或對信號或資料之一經處理版本(例如，對在對其執行操作之前已經歷初濾波或預處理之信號之一版本)執行操作。

貫穿本發明(包含在發明申請專利範圍中)，在一廣義上使用表達「音訊處理單元」或「音訊處理器」以表示經組態以處理音訊資料之一系統、裝置或設備。音訊處理單元之實例包含(但不限於)編碼器、轉碼器、解碼器、編解碼器、預處理系統、後處理系統及位元串流處理系統(有時稱為位元串流處理工具)。基本上全部消費者電子器件(諸如行動電話、電視、膝上型電腦及平板電腦)含有一音訊處理單元或音訊處理器。

貫穿本發明(包含在發明申請專利範圍中)，在一廣義上使用術語「耦合」或「經耦合」以意謂一直接或間接連接。因此，若一第一裝置耦合至一第二裝置，則該連接可係透過一直接連接，或透過經由其他裝置及連接之一間接連接。再者，整合至其他組件中或與其他組件整合之組件亦彼此耦合。

MPEG-4 AAC標準設想一經編碼MPEG-4 AAC位元串流包含後設資料，該後設資料指示待由一解碼器應用(若有待應用者)以解碼位元串流之音訊內容之各類型之高頻重建(「HFR」)處理及/或控制此HFR處理及/或指示待採用以解碼位元串流之音訊內容之至少一個HFR工具之至少一個特性或參數。在本文中，吾人使用表達「SBR後設資料」以表示在MPEG-4 AAC標準中描述或提及用於與頻譜頻帶複製(「SBR」)一起使用之此類型之後設資料。如熟習此項技術者瞭解，SBR係一種形式之HFR。

SBR較佳用作一雙速率系統，其中底層編解碼器按原始取樣率的一半操作，而SBR按原始取樣率操作。SBR編碼器與底層核心編解碼器並行工作，但按一較高取樣率。雖然SBR主要係解碼器中之一後期程序，但在編碼器中提取重要參數以確保解碼器中之最準確高頻重建。編碼器針對適合於當前輸入信號片段特性之一時間及頻率範圍/解析度估計SBR範圍之頻譜包絡。頻譜包絡由一複QMF分析及後續能量計算估計。可高自由程度地選擇頻譜包絡之時間及頻率解析度，以確保針對給定輸入片段之最適合之時間頻率解析度。包絡估計需要考量主要位於高頻區域(例如，一高帽區)中之原始中之一暫態將在包絡調整之前輕微存在於SBR產生之高頻帶中，此係因為解碼器中之高頻帶係基於其中相較於高頻帶，暫態更不顯著之低頻帶。相較於如在其他音訊編碼演算法中使用之普通頻譜包絡，此態樣對頻譜包絡資料之時間頻率解析度提出不同要求。

除頻譜包絡之外，亦提取表示針對不同時間及頻率區域之輸入信號之頻譜特性之若干額外參數。由於編碼器自然地能夠存取原始信號以及關於解碼器中之SBR單元將如何產生高頻帶之資訊，故給定特定控制參數集，系統可處置其中低頻帶構成一強諧波系列且待重新產生之高頻帶主要構成隨機信號分量之情境，以及其中強音調分量存在於原始高頻帶中而無低頻帶中之對應者(高頻帶區域基於其)之情境。此外，SBR編碼器與底層核心編解碼器密切相關工作以評鑑在一給定時間應由SBR涵蓋哪一頻率範圍。在立體聲信號之情況中，藉由利用熵編碼以及控制資料之頻道相依性而在傳輸之前有效率編碼SBR資料。

通常需要按一給定位元率及一給定取樣率將控制參數提取演算法仔細地調諧至底層編解碼器。此係歸因於相較於一高位元率，一較低位元率通常暗示一較大SBR範圍，且不同取樣率對應於SBR訊框之不同時間解析度之事實。

一SBR解碼器通常包含若干不同部分。SBR解碼器包括一位元串流解碼模組、一高頻重建(HFR)模組、一額外高頻分量模組及一包絡調整器模組。系統係基於一複值QMF過濾器組(針對高品質SBR)或一實值QMF過濾器組(針對低功率SBR)。本發明之實施例可適用於高品質SBR及低功率SBR兩者。在位元串流提取模組中，控制資料自位元串流讀取且經解碼。在自位元串流讀取包絡資料之前針對當前訊框獲得時間頻率柵格。底層核心解碼器解碼當前訊框之音訊信號(雖然按較低取樣率)以產生時域音訊樣品。使用音訊資料之所得訊框以供HFR模組進行高頻重建。接著使用一QMF過濾器組分析經解碼低頻帶信號。隨後對QMF過濾器組之副頻帶樣品執行高頻重建及包絡調整。以一靈活方式基於給定控制參數自低頻帶重建高頻。此外，根據控制資料在一副頻帶頻道基礎上適應性地濾波經重建高頻帶以確保給定時間/頻率區域之適當頻譜特性。

一MPEG-4 AAC位元串流之頂層係一序列資料區塊(「raw_data_block」元素)，該等區塊之各者係含有音訊資料(通常針對1024或960個樣品之一時間段)及相關資訊及/或其他資料之資料(本文中稱為一「區塊」)之一片段。在本文中，吾人使用術語「區塊」以表示包括判定或指示一個(但非一個以上)「raw_data_block」元素之音訊資料(及對應後設資料及視情況亦其他相關資料)之一MPEG-4 AAC位元串流之一片段。

一MPEG-4 AAC位元串流之各區塊可包含數個語法元素(其等之各者在位元串流中亦物化為資料之一片段)。在MPEG-4 AAC標準中定義數種類型之此等語法元素。各語法元素由資料元素「id_syn_ele」之一不同值識別。語法元素之實例包含一「single_channel_element()」、一「channel_pair_element()」及一「fill_element()」。一單一頻道元素係包含一單一音訊頻道(一單聲道音訊信號)之音訊資料之一容器。一頻道對元素包含兩個音訊頻道(即，一立體聲音訊信號)之音訊資料。

一填充元素係包含一識別符(例如，上文提及之元素「id_syn_ele」之值)，接著為資料(其被稱為「填充資料」)之資訊之一容器。填充元素已歷史上被用於調整待經由一恆定速率通帶傳輸之位元串流之瞬時位元率。藉由將適當量之填充資料加至各區塊，可達成一恆定資料速率。

根據本發明之實施例，填充資料可包含擴展能夠在一位元串流中傳輸之資料(例如，後設資料)之類型之一或多個擴展有效負載。可視情況由接收位元串流之一裝置(例如，一解碼器)使用接收具有含有一新類型之資料之填充資料之位元串流之一解碼器，以擴展裝置之功能性。因此，如熟習此項技術者可瞭解，填充元素係一特定類型之資料結構且不同於通常用於傳輸音訊資料(例如，含有頻道資料之音訊有效負載)之資料結構。

在本發明之一些實施例中，用於識別一填充元素之識別符可由具有0x6之一值的一三位元式首先傳輸最高有效位元之不帶正負號整數(「uimsbf」)組成。在一個區塊中，可出現相同類型之語法元素(例如，若干填充元素)之若干例項。

用於編碼音訊位元串流之另一標準係MPEG統一話音及音訊編碼(USAC)標準(ISO/IEC 23003-3：2012)。MPEG USAC標準描述使用頻譜頻帶複製處理(包含如MPEG-4 AAC標準中描述之SBR處理，且亦包含其他增強形式之頻譜頻帶複製處理)編碼及解碼音訊內容。此處理應用MPEG-4 AAC標準中描述之SBR工具組之一經擴展且經增強版本之頻譜頻帶複製工具(在本文中有時稱為「增強SBR工具」或「eSBR工具」)。因此，eSBR(如在USAC標準中定義)係對SBR(如在MPEG-4 AAC標準中定義)之一改良。

在本文中，吾人使用表達「增強SBR處理」(或「eSBR處理」)以表示使用在MPEG-4 AAC標準中未描述或提及之至少一個eSBR工具(例如，在MPEG USAC標準中描述或提及之至少一個eSBR工具)之頻譜頻帶複製處理。此等eSBR工具之實例係諧波轉置及QMF-修補額外預處理或「預平坦化」。

整數階T之一諧波轉置器將具有頻率ω之一正弦曲線映射至具有頻率Tω之一正弦曲線，同時保持信號持續時間。通常依序使用三個階T=2,3,4以使用最小可能轉置階產生所要輸出頻率範圍之各部分。若需要高於第四階轉置範圍之輸出，則其可藉由頻率偏移產生。當可行時，產生近臨界取樣之基頻帶時域以供處理以最小化運算複雜性。

諧波轉置器可基於QMF或DFT。當使用基於QMF之諧波轉置器時，完全在QMF域中使用一經修改相位聲碼器結構(其執行整數倍降低取樣，接著為針對每一QMF副頻帶之時間拉伸)實行核心編碼器時域信號之頻寬擴展。在一共同QMF分析/合成變換階段中實行使用若干轉置因數(例如，T=2,3,4)之轉置。由於基於QMF之諧波轉置器不以信號適應性頻域過取樣為特徵，故可忽略位元串流中之對應旗標(sbrOversamplingFlag[ch])。

當使用基於DFT之諧波轉置器時，較佳藉由內插而將因數3及4轉置器(第3及第4階轉置器)整合至因數2轉置器(第2階轉置器)中以降低複雜性。針對各訊框(其對應於coreCoderFrameLength核心編碼器樣品)，轉置器之標稱「全大小」變換大小首先由位元串流中之信號適應性頻域過取樣旗標(sbrOversamplingFlag[ch])判定。

當sbrPatchingMode==1時(其指示待使用線性轉置以產生高頻帶)，可引入一額外步驟以避免經輸入至後續包絡調整器之高頻信號之頻譜包絡之形狀中之不連續性。此改良後續包絡調整階段之操作，從而導致經感知為更穩定之一高頻帶信號。額外預處理之操作對於其中用於高頻重建之低頻帶信號之粗頻譜包絡顯示大位準變動之信號類型有益。然而，可在編碼器中藉由應用任何種類之信號相依分類而判定位元串流元素之值。較佳透過一單位元式位元串流元素bs_sbr_preprocessing啟動額外預處理。當bs_sbr_preprocessing被設定為1時，啟用額外預處理。當bs_sbr_preprocessing被設定為0時，停用額外預處理。額外處理較佳利用一預增益(preGain)曲線，該預增益曲線由高頻產生器使用以針對各圖塊按比例調整低頻帶X_Low。例如，可根據以下項計算預增益曲線：preGain(k)=10^{(meanNrg-lowEnvSlope(k))/20} ,0

k<k ₀其中k₀係在主頻帶表中之第一QMF副頻帶且lowEnvSlope係使用(在一最小平方意義上)計算一最佳多項式擬合係數之一函數(諸如polyfit())計算。例如，polyfit(3,k ₀ ,x_lowband,lowEnv,lowEnvSlope)可經採用(使用三次多項式)且其中

,0

k<k ₀其中x_lowband(k)=[0...k₀-1]，numTimeSlot係存在於一訊框內之SBR包絡時槽之數目，RATE係指示每一時槽之QMF副頻帶樣品之數目之一常數(例如，2)，φ_k係一線性預測濾波器係數(潛在地自協方差方法獲得)且其中

根據MPEG USAC標準產生之一位元串流(在本文中有時稱為一「USAC位元串流」)包含經編碼音訊內容且通常包含指示待由一解碼器應用以解碼USAC位元串流之音訊內容之各類型之頻譜頻帶複製處理之後設資料，及/或控制此頻譜頻帶複製處理及/或指示待採用以解碼USAC位元串流之音訊內容之至少一個SBR工具及/或eSBR工具之至少一個特性或參數之後設資料。

在本文中，吾人使用表達「增強SBR後設資料」(或「eSBR後設資料」)以表示後設資料，該後設資料指示待由一解碼器應用以解碼一經編碼音訊位元串流(例如，一USAC位元串流)之音訊內容之各類型之頻譜頻帶複製處理及/或控制此頻譜頻帶複製處理及/或指示待採用以解碼此音訊內容之至少一個SBR工具及/或eSBR工具之至少一個特性或參數，但在MPEG-4 AAC標準中未描述或提及。eSBR後設資料之一實例係在MPEG USAC標準中描述或提及但在MPEG-4 AAC標準中未描述或提及之後設資料(指示，或用於控制頻譜頻帶複製處理)。因此，本文中之eSBR後設資料表示非SBR後設資料之後設資料，且本文中之SBR後設資料表示非eSBR後設資料之後設資料。

一USAC位元串流可包含SBR後設資料及eSBR後設資料兩者。更具體而言，一USAC位元串流可包含控制eSBR處理藉由一解碼器之執行之eSBR後設資料，及控制SBR處理藉由解碼器之執行之SBR後設資料。根據本發明之典型實施例，eSBR後設資料(例如，eSBR特定組態資料)(根據本發明)包含於一MPEG-4 AAC位元串流中(例如，在一SBR有效負載之結尾處之sbr_extension()容器中)。

在使用一eSBR工具組(其包括至少一個eSBR工具)解碼一經編碼位元串流期間，由一解碼器執行eSBR處理基於在編碼期間經截斷之諧波序列之複製而重新產生音訊信號之高頻頻帶。此eSBR處理通常調整經產生之高頻頻帶之頻譜包絡且應用逆濾波，且相加雜訊及正弦波分量以重新產生原始音訊信號之頻譜特性。

根據本發明之典型實施例，在一經編碼音訊位元串流(例如，一MPEG-4 AAC位元串流)之後設資料片段之一或多者中包含eSBR後設資料(例如，包含係eSBR後設資料之小數目個控制位元)，該經編碼音訊位元串流亦包含在其他片段(音訊資料片段)中之經編碼音訊資料。一般而言，位元串流之各區塊之至少一個此後設資料片段係(或包含)一填充元素(其包含指示填充元素之開始的一識別符)，且於填充元素中包含在識別符之後的eSBR後設資料。

圖1係其中系統之一或多個元件可根據本發明之一實施例經組態之一例示性音訊處理鏈(一音訊資料處理系統)之一方塊圖。系統包含如展示般耦合在一起之以下元件：編碼器1、遞送子系統2、解碼器3及後處理單元4。在所展示系統之變體中，省略一或多個元件，或包含額外音訊資料處理單元。

在一些實施方案中，編碼器1(其視情況包含一預處理單元)經組態以接受包括音訊內容之PCM(時域)樣品作為輸入，且輸出指示音訊內容之一經編碼音訊位元串流(其具有與MPEG-4 AAC標準相容之格式)。指示音訊內容之位元串流之資料在本文中有時稱為「音訊資料」或「經編碼音訊資料」。若編碼器根據本發明之一典型實施例經組態，則自編碼器輸出之音訊位元串流包含eSBR後設資料(及通常亦其他後設資料)以及音訊資料。

可確證自編碼器1輸出之一或多個經編碼音訊位元串流以編碼音訊遞送子系統2。子系統2經組態以儲存及/或遞送自編碼器1輸出之各經編碼位元串流。自編碼器1輸出之一經編碼音訊位元串流可由子系統2(例如，呈一DVD或藍光光碟之形式)儲存，或由子系統2(其可實施一傳輸鏈路或網路)傳輸或可由子系統2儲存並傳輸兩者。

解碼器3經組態以解碼其經由子系統2接收之一經編碼MPEG-4 AAC音訊位元串流(其由編碼器1產生)。在一些實施例中，解碼器3經組態以自位元串流之各區塊提取eSBR後設資料，且解碼位元串流(包含藉由使用經提取eSBR後設資料執行eSBR處理)以產生經解碼音訊資料(例如，經解碼PCM音訊樣品串流)。在一些實施例中，解碼器3經組態以自位元串流(但忽略包含於位元串流中之eSBR後設資料)提取SBR後設資料，且解碼位元串流(包含藉由使用經提取SBR後設資料執行SBR處理)以產生經解碼音訊資料(例如，經解碼PCM音訊樣品串流)。一般而言，解碼器3包含(例如，以一非暫時性方式)儲存自子系統2接收之經編碼音訊位元串流之片段之一緩衝器。

圖1之後處理單元4經組態以自解碼器3接受一經解碼音訊資料串流(例如，經解碼PCM音訊樣品)且對其執行後處理。後處理單元亦可經組態以呈現經後處理音訊內容(或自解碼器3接收之經解碼音訊)以供一或多個揚聲器播放。

圖2係為本發明音訊處理單元之一實施例之一編碼器(100)之一方塊圖。編碼器100之任何組件或元件可實施為硬體、軟體或硬體及軟體之一組合中之一或多個程序及/或一或多個電路(例如，ASIC、FPGA或其他積體電路)。編碼器100包含如展示般連接之編碼器105、填充器/格式化器階段107、後設資料產生階段106及緩衝記憶體109。一般而言，編碼器100亦包含其他處理元件(未展示)。編碼器100經組態以將一輸入音訊位元串流轉換為一經編碼輸出MPEG-4 AAC位元串流。

後設資料產生器106經耦合且經組態以產生後設資料(包含eSBR後設資料及SBR後設資料)(及/或將該後設資料傳遞至階段107)以藉由階段107而被包含於待自編碼器100輸出之經編碼位元串流中。

編碼器105經耦合且經組態以編碼輸入音訊資料(例如，藉由對其執行壓縮)，且確證所得經編碼音訊至階段107以包含於待自階段107輸出之經編碼位元串流中。

階段107經組態以多工來自編碼器105之經編碼音訊及來自產生器106之後設資料(包含eSBR後設資料及SBR後設資料)以產生經編碼位元串流以自階段107輸出，較佳使得經編碼位元串流具有如由本發明之實施例之一者指定之格式。

緩衝記憶體109經組態以(例如，以一非暫時性方式)儲存自階段107輸出之經編碼音訊位元串流之至少一個區塊，且接著自緩衝記憶體109確證經編碼音訊位元串流之一序列區塊作為自編碼器100至一遞送系統之輸出。

圖3係一系統之一方塊圖，該系統包含係發明音訊處理單元之一實施例之解碼器(200)及視情況亦耦合至解碼器(200)之一後處理器(300)。解碼器200及後處理器300之任何組件或元件可實施為硬體、軟體或硬體及軟體之一組合中之一或多個程序及/或一或多個電路(例如，ASIC、FPGA或其他積體電路)。解碼器200包括如展示般連接之緩衝記憶體201、位元串流有效負載反格式化器(剖析器)205、音訊解碼子系統202(有時稱為一「核心」解碼階段或「核心」解碼子系統)、eSBR處理階段203及控制位元產生階段204。一般而言，解碼器200亦包含其他處理元件 (未展示)。

緩衝記憶體(緩衝器)201(例如，以一非暫時性方式)儲存由解碼器200接收之一經編碼MPEG-4 AAC音訊位元串流之至少一個區塊。在解碼器200之操作中，自緩衝器201確證位元串流之一序列區塊至反格式化器205。

在圖3之實施例(或待描述之圖4之實施例)之變體中，非一解碼器之一APU(例如，圖6之APU 500)包含一緩衝記憶體(例如，與緩衝器201相同之一緩衝記憶體)，該緩衝記憶體(例如，以一非暫時性方式)儲存由圖3或圖4之緩衝器201接收之相同類型之一經編碼音訊位元串流(例如，一MPEG-4 AAC音訊位元串流)(即，包含eSBR後設資料之一經編碼音訊位元串流)之至少一個區塊。

再次參考圖3，反格式化器205經耦合且經組態以解多工位元串流之各區塊以自其提取SBR後設資料(包含經量化包絡資料)及eSBR後設資料(及通常亦其他後設資料)，確證至少eSBR後設資料及SBR後設資料至eSBR處理階段203，且通常亦確證其他經提取後設資料至解碼子系統202(且視情況亦至控制位元產生器204)。反格式化器205亦經耦合且經組態以自位元串流之各區塊提取音訊資料，且確證經提取音訊資料至解碼子系統(解碼階段)202。

圖3之系統視情況亦包含後處理器300。後處理器300包含緩衝記憶體(緩衝器)301及包含耦合至緩衝器301之至少一個處理元件之其他處理元件(未展示)。緩衝器301(例如，以一非暫時性方式)儲存由後處理器300自解碼器200接收之經解碼音訊資料之至少一個區塊(或訊框)。後處理器300之處理元件經耦合且經組態以自緩衝器301接收自緩衝器301 輸出之經解碼音訊之一序列區塊(或訊框)，且使用自解碼子系統202(及/或反格式化器205)輸出之後設資料及/或自解碼器200之階段204輸出之控制位元適應性地處理該序列區塊(或訊框)。

解碼器200之音訊解碼子系統202經組態以解碼由剖析器205提取之音訊資料(此解碼可被稱為一「核心」解碼操作)以產生經解碼音訊資料，且確證經解碼音訊資料至eSBR處理階段203。解碼係在頻域中執行且通常包含逆量化，接著為頻譜處理。一般而言，子系統202中之處理之一最後階段將一頻域轉時域變換應用至經解碼頻域音訊資料，使得子系統之輸出係時域、經解碼音訊資料。階段203經組態以將由eSBR後設資料及eSBR(由剖析器205提取)指示之SBR工具及eSBR工具應用至經解碼音訊資料(即，使用SBR及eSBR後設資料對解碼子系統202之輸出執行SBR及eSBR處理)以產生自解碼器200輸出(例如，至後處理器300)之經完全解碼音訊資料。一般而言，解碼器200包含儲存自反格式化器205輸出之經反格式化音訊資料及後設資料之一記憶體(可由子系統202及階段203存取)，且階段203經組態以在SBR及eSBR處理期間視需要存取音訊資料及後設資料(包含SBR後設資料及eSBR後設資料)。階段203中之SBR處理及eSBR處理可被視為對核心解碼子系統202之輸出之後處理。視情況，解碼器200亦包含一最後升混合子系統(其可應用在MPEG-4 AAC標準中定義之參數立體聲(「PS」)工具，使用由反格式化器205提取之PS後設資料及/或在子系統204中產生之控制位元)，該最後升混合子系統經耦合且經組態以對階段203之輸出執行升混合，以產生自解碼器200輸出之經完全解碼之經升混合音訊。替代地，後處理器300經組態以(例如，使用由反格式化器205提取之PS後設資料及/或在子系統204中產生之控制位元)對解碼器200之輸出執行升混合。

回應於由反格式化器205提取之後設資料，控制位元產生器204可產生控制資料，且控制資料可在解碼器200內(例如，在一最後升混合系統中)使用及/或經確證為解碼器200之輸出(例如，至後處理器300以供在後處理中使用)。回應於自輸入位元串流提取之後設資料(且視情況亦回應於控制資料)，階段204可產生(且確證至後處理器300)指示自eSBR處理階段203輸出之經解碼音訊資料應經歷一特定類型之後處理之控制位元。在一些實施方案中，解碼器200經組態以確證由反格式化器205自輸入位元串流提取之後設資料至後處理器300，且後處理器300經組態以使用後設資料對自解碼器200輸出之經解碼音訊資料執行後處理。

圖4係為本發明音訊處理單元之另一實施例之一音訊處理單元(「APU」)(210)之一方塊圖。APU 210係未經組態以執行eSBR處理之一舊型解碼器。APU 210之任何組件或元件可實施為硬體、軟體或硬體及軟體之一組合中之一或多個程序及/或一或多個電路(例如，ASIC、FPGA或其他積體電路)。APU 210包括如展示般連接之緩衝記憶體201、位元串流有效負載反格式化器(剖析器)215、音訊解碼子系統202(有時稱為一「核心」解碼階段或「核心」解碼子系統)及SBR處理階段213。一般而言，APU 210亦包含其他處理元件(未展示)。APU 210可表示(例如)一音訊編碼器、解碼器或轉碼器。

APU 210之元件201及202與(圖3之)解碼器200之相同編號之元件相同且將不重複其等之上文描述。在APU 210之操作中，自緩衝器201確證由APU 210接收之一經編碼音訊位元串流(一MPEG-4 AAC位元串流)之一序列區塊至反格式化器215。

根據本發明之任何實施例，反格式化器215經耦合且經組態以解多工位元串流之各區塊以提取SBR後設資料(包含量化包絡資料)且通常亦自其提取其他後設資料，但忽略可包含於位元串流中之eSBR後設資料。反格式化器215經組態以確證至少SBR後設資料至SBR處理階段213。反格式化器215亦經耦合且經組態以自位元串流之各區塊提取音訊資料，且確證經提取音訊資料至解碼子系統(解碼階段)202。

解碼器200之音訊解碼子系統202經組態以解碼由反格式化器215提取之音訊資料(此解碼可被稱為一「核心」解碼操作)以產生經解碼音訊資料，且確證經解碼音訊資料至SBR處理階段213。在時域中執行解碼。一般而言，子系統202中之處理之一最後階段將一頻域轉時域變換應用至經解碼頻域音訊資料，使得子系統之輸出係時域、經解碼音訊資料。階段213經組態以將由SBR後設資料(由剖析器215提取)指示之SBR工具(但非eSBR工具)應用至經解碼音訊資料(即，使用SBR後設資料對解碼子系統202之輸出執行SBR處理)以產生自APU 210輸出(例如，至後處理器300)之經完全解碼音訊資料。一般而言，APU 210包含儲存自反格式化器215輸出之經反格式化音訊資料及後設資料之一記憶體(其可由子系統202及階段213存取)，且階段213經組態以在SBR處理期間視需要存取音訊資料及後設資料(包含SBR後設資料)。階段213中之SBR處理可被視為對核心解碼子系統202之輸出的後處理。視情況，APU 210亦包含一最後升混合子系統(其可應用MPEG-4 AAC標準中定義的參數立體聲(「PS」)工具，使用由反格式化器215提取的PS後設資料)，該最後升混合子系統經耦合且經組態以對階段213之輸出執行升混合，以產生自APU 210輸出之經完全解碼的經升混合音訊。替代地，一後處理器經組態以(例如，使用由反格式化器215提取之PS後設資料及/或在APU 210中產生之控制位元)對APU 210之輸出執行升混合。

編碼器100、解碼器200及APU 210之各種實施方案經組態以執行本發明方法之不同實施例。

根據一些實施例，於一經編碼音訊位元串流(例如，一MPEG-4 AAC位元串流)中包含eSBR後設資料(例如，包含係eSBR後設資料之少量控制位元)，使得舊型解碼器(其等未經組態以剖析eSBR後設資料或使用與eSBR後設資料相關之任何eSBR工具)可忽略eSBR後設資料，但仍然儘可能地解碼位元串流，而無需使用eSBR後設資料或與eSBR後設資料相關之任何eSBR工具，通常無經解碼音訊品質之任何顯著損失。然而，經組態以剖析位元串流以識別eSBR後設資料且回應於eSBR後設資料而使用至少一個eSBR工具的eSBR解碼器將享受使用至少一個此eSBR工具的益處。因此，本發明之實施例提供一種用於以一回溯相容方式有效率地傳輸增強頻譜頻帶複製(eSBR)控制資料或後設資料的手段。

一般而言，位元串流中之eSBR後設資料指示以下eSBR工具(其等在MPEG USAC標準中描述，且其等可或可未由一編碼器在位元串流之產生期間應用)之一或多者(例如，指示以下eSBR工具之一或多者之至少一個特性或參數)：●諧波轉置；及●QMF-修補額外預處理(預平坦化)。

例如，位元串流中包含之eSBR後設資料可指示參數(在MPEG USAC標準中且在本發明中描述)之值：sbrPatchingMode[ch]、sbrOversamplingFlag[ch]、sbrPitchInBins[ch]、sbrPitchInBins[ch]及 bs_sbr_preprocessing。

在本文中，標記X[ch](其中X係某一參數)表示該參數與待解碼之一經編碼位元串流之音訊內容之頻道(「ch」)相關。為了簡潔起見，吾人有時省略表達[ch]，且假定相關參數與音訊內容之一頻道相關。

在本文中，標記X[ch][env](其中X係某一參數)表示該參數與待解碼之一經編碼位元串流之音訊內容之頻道(「ch」)之SBR包絡(「env」)相關。為了簡潔起見，吾人有時省略表達[env]及[ch]，且假定相關參數與音訊內容之一頻道之一SBR包絡相關。

在一經編碼位元串流之解碼期間，由以下eSBR後設資料參數控制在解碼(針對由位元串流指示之音訊內容之各頻道「ch」)之一eSBR處理階段期間諧波轉置之執行：sbrPatchingMode[ch]：sbrOversamplingFlag[ch]；sbrPitchInBinsFlag[ch]；及sbrPitchInBins[ch]。

值「sbrPatchingMode[ch]」指示在eSBR中使用之轉置器類型：sbrPatchingMode[ch]=1指示如在MPEG-4 AAC標準(如與高品質SBR或低功率SBR一起使用)之第4.6.18節中描述之線性轉置修補；sbrPatchingMode[ch]=0指示如在MPEG USAC標準之第7.5.3或7.5.4節中描述之諧波SBR修補。

值「sbrOversamplingFlag[ch]」指示與基於DFT之諧波SBR修補組合使用eSBR中之信號適應性頻域過取樣，如在MPEG USAC標準之第7.5.3節中描述。此旗標控制在轉置器中利用之DFT之大小：1指示啟用信號適應性頻域過取樣，如MPEG USAC標準之第7.5.3.1節中描述；0指示停用信號適應性頻域過取樣，如MPEG USAC標準之第7.5.3.1 節中描述。

值「sbrPitchInBinsFlag[ch]」控制sbrPitchInBins[ch]參數之解譯：1指示sbrPitchInBins[ch]中之值有效且大於零；0指示sbrPitchInBins[ch]之值被設定為零。

值「sbrPitchInBins[ch]」控制交叉乘積項在SBR諧波轉置器中之相加。值sbrPitchinBins[ch]係在範圍[0,127]中之一整數值且表示針對作用於核心編碼器之取樣頻率之一1536-線DFT在頻格中量測之距離。

在一MPEG-4 AAC位元串流指示其頻道未耦合之一SBR頻道對(而非一單一SBR頻道)之情況中，位元串流指示上文語法之兩個例項(針對諧波或非諧波變換)，一個針對sbr_channel_pair_element()之各頻道。

eSBR工具之諧波轉置通常按相對低交越頻率改良經解碼音樂信號之品質。非諧波轉置(即，舊型頻譜修補)通常改良話音信號。因此，關於對於編碼特定音訊內容，哪一類型之轉置較佳之決定中之一起始點是取決於話音/音樂偵測而選擇轉置方法，其中對音樂內容採用諧波轉置且對話音內容採用頻譜修補。

由稱為「bs_sbr_preprocessing」之一單位元eSBR後設資料參數之值控制在eSBR處理期間預平坦化之執行，其意義在於取決於此單一位元之值而執行或不執行預平坦化。當使用如MPEG-4 AAC標準之第4.6.18.6.3節中描述之SBR QMF-修補演算法時，可(當由「bs_sbr_preprocessing」參數指示時)執行預平坦化之步驟以努力避免經輸入至一後續包絡調整器(該包絡調整器執行eSBR處理之另一階段)之一高頻信號之頻譜包絡之形狀中之不連續性。預平坦化通常改良後續包絡調整階段之操作，從而導致經感知為更穩定之一高頻帶信號。

預期對於在一MPEG-4 AAC位元串流中包含指示上文提及之eSBR工具(諧波轉置及預平坦化)之eSBR後設資料之整體位元率要求為每秒約數百個位元，此係因為根據本發明之一些實施例，僅傳輸執行eSBR處理所需之差分控制資料。舊型解碼器可忽略此資訊，此係因為其此資訊一回溯相容方式(如隨後將解釋)而包含。因此，由於數個原因，與包含eSBR後設資料相關聯之位元率之不利影響可忽略，該數個原因包含以下：●位元率損失(歸因於包含eSBR後設資料)係總位元率之一非常小分率，此係因為僅傳輸執行eSBR處理所需之差分控制資料(且非SBR控制資料之一聯播)；及●SBR相關之控制資訊之調諧通常不取決於轉置之細節。在本申請案中隨後論述控制資料何時取決於轉置器之操作之實例。

因此，本發明之實施例提供一種用於以一回溯相容方式有效率地傳輸增強頻譜頻帶複製(eSBR)控制資料或後設資料之手段。eSBR控制資料之此有效率傳輸減少採用本發明之態樣之解碼器、編碼器及轉碼器中之記憶體要求，同時對位元率無有形不利影響。再者，亦減少與根據本發明之實施例執行eSBR相關聯之複雜性及處理要求，此係因為SBR資料僅需要處理一次且非聯播，若將eSBR視為MPEG-4 AAC中之一完全獨立物件類型而非以一回溯相容方式整合至MPEG-4 AAC編解碼器中，情況將係如此。

接著，參考圖7，吾人描述根據本發明之一些實施例之其中包含eSBR後設資料之一MPEG-4 AAC位元串流之一區塊(「raw_data_block」)之元素。圖7係MPEG-4 AAC位元串流之一區塊(一「raw_data_block」)之一圖式，其展示該區塊之一些片段。

一MPEG-4 AAC位元串流之一區塊可包含至少一個「single_channel_element()」(例如，圖7中展示之單一頻道元素)及/或至少一個「channel_pair_element()」(雖然其可存在，但在圖7中未具體展示)，包含針對一音訊節目之音訊資料。區塊亦可包含數個「fill_elements」(例如，圖7之填充元素1及/或填充元素2)，該數個「fill_elements」包含與節目相關之資料(例如，後設資料)。各「single_channel_element()」包含指示一單一頻道元素之開始的一識別符(例如，圖7之「ID1」)，且可包含指示一多頻道音訊節目之一不同頻道的音訊資料。各「channel_pair_element()」包含指示一頻道對元素之開始的一識別符(圖7中未展示)，且可包含指示節目之兩個頻道的音訊資料。

一MPEG-4 AAC位元串流之一fill_element(在本文中稱為一填充元素)包含指示一填充元素之開始的一識別符(圖7之「ID2」)及識別符之後的填充資料。識別符ID2可由具有0x6之一值的一三位元式首先傳輸最高有效位元之不帶正負號整數(「uimsbf」)組成。填充資料可包含一extension_payload()元素(在本文中有時稱為一擴展有效負載)，在MPEG-4 AAC標準之表4.57中展示其語法。若干類型之擴展有效負載存在且透過「extension_type」參數識別，該參數係一四位元式首先傳輸最高有效位元之不帶正負號整數(「uimsbf」)。

填充資料(例如，其之一擴展有效負載)可包含一標頭或識別符(例如，圖7之「標頭1」)，該標頭或識別符指示指示一SBR物件之填充資料之一片段(即，標頭初始化一「SBR物件」類型，其在MPEG-4 AAC標準中被稱為sbr_extension_data())。例如，一頻譜頻帶複製(SBR)擴展有效負載經識別具有針對標頭中之extension_type欄位之「1101」或「1110」之值，其中識別符「1101」識別具有SBR資料之一擴展有效負載且「1110」識別具有SBR資料之一擴展有效負載，該SBR資料具有一循環冗餘檢查(CRC)以驗證SBR資料之正確性。

當標頭(例如，extension_type欄位)初始化一SBR物件類型時，SBR後設資料(在本文中有時稱為「頻譜頻帶複製資料」且在MPEG-4 AAC標準中被稱為sbr_data())接在標頭之後，且至少一個頻譜頻帶複製擴展元素(例如，圖7之填充元素1之「SBR extension element」)可接在SBR後設資料之後。此一頻譜頻帶複製擴展元素(位元串流之一片段)在MPEG-4 AAC標準中被稱為一「sbr_extension()」容器。一頻譜頻帶複製擴展元素視情況包含一標頭(例如，圖7之填充元素1之「SBR擴展標頭」)。

MPEG-4 AAC標準設想一頻譜頻帶複製擴展元素可包含針對一節目之音訊資料之PS(參數立體聲)資料。MPEG-4 AAC標準設想當一填充元素之(例如，其之一擴展有效負載之)標頭初始化一SBR物件類型(如圖7之「標頭1」)且填充元素之一頻譜頻帶複製擴展元素包含PS資料時，填充元素(例如，其擴展有效負載)包含頻譜頻帶複製資料及一「bs_extension_id」參數，「bs_extension_id」參數之值(即，bs_extension_id=2)指示PS資料包含於填充元素之一頻譜頻帶複製擴展元素中。

根據本發明之一些實施例，eSBR後設資料(例如，指示是否對區塊之音訊內容執行增強頻譜頻帶複製(eSBR)處理之一旗標)包含於一填充元素之一頻譜頻帶複製擴展元素中。例如，在圖7之填充元素1中指示此一旗標，其中旗標出現在填充元素1之「SBR擴展元素」之標頭(填充元素1之「SBR擴展標頭」)之後。視情況，於一頻譜頻帶複製擴展元素中於頻譜頻帶複製擴展元素之標頭之後(例如，在圖7中之填充元素1之SBR擴展元素中，在SBR擴展標頭之後)包含此一旗標及額外eSBR後設資料。根據本發明之一些實施例，包含eSBR後設資料之一填充元素亦包含一「bs_extension_id」參數，「bs_extension_id」參數之值(例如，bs_extension_id=3)指示eSBR後設資料包含於填充元素中且待對相關區塊之音訊內容執行eSBR處理。

根據本發明之一些實施例，eSBR後設資料包含於一MPEG-4 AAC位元串流之一填充元素(例如，圖7之填充元素2)中而非填充元素之一頻譜頻帶複製擴展元素(SBR擴展元素)中。此係因為含有具有SBR資料或具備一CRC之SBR資料之一extension_payload()之填充元素不含有任何其他擴展類型之任何其他擴展有效負載。因此，在其中eSBR後設資料儲存其自身擴展有效負載之實施例中，使用一分開之填充元素以儲存eSBR後設資料。此一填充元素包含指示一填充元素之開始的一識別符(例如，圖7之「ID2」)及識別符之後的填充資料。填充資料可包含一extension_payload()元素(在本文中有時稱為一擴展有效負載)，在MPEG-4 AAC標準之表4.57中展示其語法。填充資料(例如，其之一擴展有效負載)包含指示一eSBR物件之一標頭(圖7之填充元素2之「標頭2」)(即，標頭初始化一增強頻譜頻帶複製(eSBR)物件類型)，且填充資料(例如，其之一擴展有效負載)包含在標頭之後之eSBR後設資料。例如，圖7之填充元素2包含此一標頭(「標頭2」)且在標頭之後亦包含eSBR後設資料(即，填充元素2中之「旗標」，其指示是否對區塊之音訊內容執行增強頻譜頻帶複製(eSBR)處理)。視情況，於圖7之填充元素2之填充資料中於標頭2之後亦包含額外eSBR後設資料。在本段落中描述之實施例中，標頭(例如，圖7之標頭2)具有一識別值，該識別值非在MPEG-4 AAC標準之表4.57中指定之習知值之一者，且代替性地指示一eSBR擴展有效負載(使得標頭之extension_type欄位指示填充資料包含eSBR後設資料)。

在一第一類別實施例中，本發明係一種音訊處理單元(例如，一解碼器)，其包括：一記憶體(例如，圖3或圖4之緩衝器201)，其經組態以儲存一經編碼位元串流之至少一個區塊(例如，一MPEG-4 AAC位元串流之至少一個區塊)；一位元串流有效負載反格式化器(例如，圖3之元件205或圖4之元件215)，其耦合至該記憶體且經組態以解多工該位元串流之該區塊之至少一個部分；及一解碼子系統(例如，圖3之元件202及203，或圖4之元件202及213)，其經耦合且經組態以解碼該位元串流之該區塊之音訊內容之至少一個部分，其中該區塊包含：一填充元素，其包含指示該填充元素之一開始的一識別符(例如，MPEG-4 AAC標準之表4.85之具有值0x6之「id_syn_ele」識別符)及該識別符之後的填充資料，其中該填充資料包含：至少一個旗標，其識別是否(例如，使用包含於該區塊中之頻譜頻帶複製資料及eSBR後設資料)對該區塊之音訊內容執行增強頻譜頻帶複製(eSBR)處理。

該旗標係eSBR後設資料，且該旗標之一實例係 sbrPatchingMode旗標。該旗標之另一實例係harmonicSBR旗標。此等旗標之兩者指示是否對該區塊之該音訊資料執行一基礎形式之頻譜頻帶複製或一增強形式之頻譜複製。該基礎形式之頻譜複製係頻譜修補，且該增強形式之頻譜頻帶複製係諧波轉置。

在一些實施例中，該填充資料亦包含額外eSBR後設資料(即，除旗標之外之eSBR後設資料)。

該記憶體可係(例如，以一非暫時性方式)儲存該經編碼音訊位元串流之該至少一個區塊之一緩衝記憶體(例如，圖4之緩衝器201之一實施方案)。

據估計，藉由一eSBR解碼器在包含eSBR後設資料(指示此等eSBR工具)之一MPEG-4 AAC位元串流之解碼期間(使用eSBR諧波轉置及預平坦化)執行eSBR處理之複雜性將如下(針對使用經指示參數之典型解碼)：●諧波轉置(16kbps,14400/28800Hz)○基於DFT：3.68 WMOPS(每秒加權百萬個運算)；○基於QMF：0.98 WMOPS；●QMF修補預處理(預平坦化)：0.1 WMOPS。

已知基於DFT之轉置通常針對暫態比基於QMF之轉置更佳地執行。

根據本發明之一些實施例，包含eSBR後設資料之(一經編碼音訊位元串流之)一填充元素亦包含其值(例如，bs_extension_id=3)傳訊eSBR後設資料包含於填充元素中且待對相關區塊之音訊內容執行eSBR處理之一參數(例如，一「bs_extension_id」參數)及/或其值(例如， bs_extension_id=2)傳訊填充元素之一sbr_extension()容器包含PS資料之一參數(例如，相同「bs_extension_id」參數)。例如，如下文之表1中指示，具有值bs_extension_id=2之此一參數可傳訊填充元素之一sbr_extension()容器包含PS資料，且具有值bs_extension_id=3之此一參數可傳訊填充元素之一sbr_extension()容器包含eSBR後設資料：

根據本發明之一些實施例，包含eSBR後設資料及/或PS資料之各頻譜頻帶複製擴展元素之語法如下文之表2中所指示(其中「sbr_extension()」表示係頻譜頻帶複製擴展元素之一容器，「bs_extension_id」如上文之表1中描述，「ps_data」表示PS資料，且「esbr_data」表示eSBR後設資料)：

在一例示性實施例中，在上文之圖2中提及之esbr_data()指示以下後設資料參數之值：1.一位元後設資料參數「bs_sbr_preprocessing」；及2.針對待解碼之經編碼位元串流之音訊內容之各頻道(「ch」)，上文描述之參數之各者為：「sbrPatchingMode[ch]」；「sbrOversamplingFlag[ch]」；「sbrPitchInBinsFlag[ch]」；及「sbrPitchInBins[ch]」。

例如，在一些實施例中，esbr_data()可具有表3中指示之語法以指示此等後設資料參數：

上文之語法實現一增強形式之頻譜頻帶複製(諸如諧波轉置)之一有效率實施方案，作為對一舊型解碼器之一擴展。具體而言，表3之eSBR資料僅包含執行增強形式之頻譜頻帶複製所需之在位元串流中尚未支援或非可直接自位元串流中已經支援之參數導出之該等參數。自位元串流中已經定義之位置中之預存在參數提取執行增強形式之頻譜頻帶複製所需之全部其他參數及處理資料。

例如，可擴展一MPEG-4 HE-AAC或HE-AAC v2合規解碼器以包含一增強形式之頻譜頻帶複製，諸如諧波轉置。此增強形式之頻譜頻帶複製係已經由解碼器支援之基礎形式之頻譜頻帶複製之補充。在一MPEG-4 HE-AAC或HE-AAC v2合規解碼器之背景內容中，此基礎形式之頻譜頻帶複製係如MPEG-4 AAC標準之第4.6.18節中定義之QMF頻譜修補SBR工具。

當執行增強形式之頻譜頻帶複製時，一經擴展HE-AAC解碼器可重用已經包含於位元串流之SBR擴展有效負載中之許多位元串流參數。可經重用之特定參數包含(例如)判定主頻帶表之各種參數。此等參數包含bs_start_freq(判定主頻率表參數之開始的參數)、bs_stop_freq(判定主頻率表之停止的參數)、bs_freq_scale(判定每一倍頻程之頻帶之數目之參數)及bs_alter_scale(更改頻帶之比例的參數)。可經重用之參數亦包含判定雜訊頻帶表(bs_noise_bands)及限制器頻帶表參數(bs_limiter_bands)之參數。因此，在各項實施例中，自位元串流省略在USAC標準中指定之至少一些等效參數，藉此減少位元串流中之控制附加項。一般而言，在於AAC標準中指定之一參數具有在USAC標準中指定之一等效參數之情況下，在USAC標準中指定之等效參數與在AAC標準中指定之參數具有相同名稱，例如，包絡比例因數E_OrigMapped。然而，在USAC標準中指定之等效參數通常具有一不同值，該值係針對在USAC標準中定義之增強SBR處理而非針對在AAC標準中定義之SBR處理「經調諧」。

為了改良針對具有諧波頻率結構及強音調特性之音訊內容之主觀品質，尤其按低位元率，推薦增強SBR之啟動。可在編碼器中藉由應用一信號相依分類機制而判定控制此等工具之對應位元串流元素(即，esbr_data())之值。一般而言，諧波修補方法(sbrPatchingMode==1)之使用對於以非常低位元率編碼音樂信號較佳，其中核心編解碼器可在音訊頻寬方面顯著受限制。若此等信號包含一顯著諧波結構，則尤其如此。相反地，常規SBR修補方法之使用對於話音及混合信號較佳，此係因為其提供話音中之時間結構之一較佳保存。

為了改良諧波轉置器之效能，可啟動一預處理步驟(bs_sbr_preprocessing==1)，該預處理步驟努力避免引入進入後續包絡調整器中之信號之頻譜不連續性。工具之操作對於其中用於高頻重建之低頻帶信號之粗頻譜包絡顯示大位準變動之信號類型有益。

為了改良諧波SBR修補之暫態回應，可應用信號適應性頻域過取樣(sbrOversamplingFlag==1)。由於信號適應性頻域過取樣增加轉置器之運算複雜性，但僅為含有暫態之訊框帶來益處，故此工具之使用由位元串流元素控制，該位元串流元素每一訊框且每一獨立SBR頻道經傳輸一次。

在經提出之增強SBR模式中操作之一解碼器通常需要能夠在舊型SBR修補與增強SBR修補之間切換。因此，可引入延遲，取決於解碼器設置，該延遲可與一個核心音訊訊框之持續時間同樣長。一般而言，針對舊型SBR修補與針對增強SBR修補之延遲將類似。

除了許多參數之外，在根據本發明之實施例執行一增強形式之頻譜頻帶複製時，一經擴展HE-AAC解碼器亦可重用其他資料元素。例如，包絡資料及雜訊資料亦可自bs_data_env(包絡比例因數)及bs_noise_env(雜訊底限比例因數)資料提取且在增強形式之頻譜頻帶複製期間使用。

本質上，此等實施例利用SBR擴展有效負載中之一舊型HE-AAC或HE-AAC v2解碼器已經支援之組態參數及包絡資料以實現需要儘可能少的額外經傳輸資料之一增強形式之頻譜頻帶複製。後設資料最初係針對一基礎形式之HFR(例如，SBR之頻譜平移操作)經調諧，但根據實施例，後設資料用於一增強形式之HFR(例如，eSBR之諧波轉置)。如先前論述，後設資料一般表示經調諧且旨在與基礎形式之HFR(例如，線性頻譜平移)一起使用之操作參數(例如，包絡比例因數、雜訊底限比例因數、時間/頻率柵格參數、正弦加法資訊、可變交越頻率/頻帶、逆濾波模式、包絡解析度、平滑模式、頻率內插模式)。然而，與增強形式之HFR(例如，諧波轉置)特定之額外後設資料參數組合之此後設資料可用於使用增強形式之HFR有效地且有效率地處理音訊資料。

因此，可藉由依賴於已經定義之位元串流元素(例如，SBR擴展有效負載中之位元串流元素)且(在一填充元素擴展有效負載中)僅新增支援增強形式之頻譜頻帶複製所需之該等參數而以一非常有效率方式產生支援一增強形式之頻譜頻帶複製之經擴展解碼器。與將最新新增之參數放置於一經保留資料欄位(諸如一擴展容器)中組合之此資料減少特徵藉由確保位元串流與不支援一增強形式之頻譜頻帶複製之舊型解碼器回溯相容而實質上減少產生支援增強形式之頻譜頻帶複製之一解碼器之屏障。將瞭解，經保留資料欄位係一回溯相容資料欄位，亦即，其係已經由較早解碼器(諸如舊型HE-AAC或HE-AAC v2解碼器)支援之一資料欄位。類似地，擴展容器回溯相容，亦即，其係已經由較早解碼器(諸如舊型HE-AAC或HE-AAC v2解碼器)支援之一擴展容器。

在表3中，在右欄中之數字指示在左欄中之對應參數之位元之數目。

在一些實施例中，更新在MPEG-4 AAC中定義之SBR物件類型以含有如SBR擴展元素(bs_extension_id==EXTENSION_ID_ESBR)中傳訊之SBR工具及增強SBR(eSBR)工具之態樣。若一解碼器偵測此SBR擴展元素，則該解碼器採用增強SBR工具之經傳訊態樣。

在一些實施例中，本發明係包含以下步驟之一方法：編碼音訊資料以產生一經編碼位元串流(例如，一MPEG-4 AAC位元串流)，其包含藉由在經編碼位元串流之至少一個區塊之至少一個片段中包含eSBR後設資料且在該區塊之至少另一片段中包含音訊資料。在典型實施例中，該方法包含在經編碼位元串流之各區塊中使用eSBR後設資料多工音訊資料之一步驟。在一eSBR解碼器中之經編碼位元串流之典型解碼中，解碼器(包含藉由剖析且解多工eSBR後設資料及音訊資料)自位元串流提取eSBR後設資料且使用eSBR後設資料以處理音訊資料以產生一經解碼音訊資料串流。

本發明之另一態樣係一種eSBR解碼器，其經組態以在不包含eSBR後設資料之一經編碼音訊位元串流(例如，一MPEG-4 AAC位元串流)之解碼期間(例如，使用稱為諧波轉置或預平坦化之eSBR工具之至少一者)執行eSBR處理。將參考圖5描述此一解碼器之一實例。

圖5之eSBR解碼器(400)包含如展示般連接之緩衝記憶體201(其與圖3及圖4之記憶體201相同)、位元串流有效負載反格式化器215(其與圖4之反格式化器215相同)、音訊解碼子系統202(其有時稱為一「核心」解碼階段或「核心」解碼子系統，且與圖3之核心解碼子系統202相同)、eSBR控制資料產生子系統401及eSBR處理階段203(其與圖3之階段203相同)。一般而言，解碼器400亦包含其他處理元件(未展示)。

在解碼器400之操作中，自緩衝器201確證由解碼器400接收之一經編碼音訊位元串流(一MPEG-4 AAC位元串流)之一序列區塊至反格式化器215。

反格式化器215經耦合且經組態以解多工位元串流之各區塊以自其提取SBR後設資料(包含量化包絡資料)及通常亦其他後設資料。反格式化器215亦經組態以確證至少SBR後設資料至eSBR處理階段203。反格式化器215亦經耦合且經組態以自位元串流之各區塊提取音訊資料，且確證經提取音訊資料至解碼子系統(解碼階段)202。

解碼器400之音訊解碼子系統202經組態以解碼由反格式化器215提取之音訊資料(此解碼可被稱為一「核心」解碼操作)以產生經解碼音訊資料，且確證經解碼音訊資料至eSBR處理階段203。在頻域中執行解碼。一般而言，子系統202中之處理之一最後階段將一頻域轉時域變換應用至經解碼頻域音訊資料，使得子系統之輸出係時域、經解碼音訊資料。階段203經組態以將由SBR後設資料(由反格式化器215提取)及由在子系統401中產生之eSBR後設資料指示之SBR工具(及eSBR工具)應用至經解碼音訊資料(即，以使用SBR及eSBR後設資料對解碼子系統202之輸出執行SBR及eSBR處理)以產生自解碼器400輸出之完全解碼之音訊資料。一般而言，解碼器400包含儲存自反格式化器215(及視情況亦子系統401)輸出之經反格式化音訊資料及後設資料之一記憶體(其可由子系統202及階段203存取)，且階段203經組態以在SBR及eSBR處理期間視需要存取音訊資料及後設資料。階段203中之SBR處理可被視為對核心解碼子系統202之輸出之後處理。視情況，解碼器400亦包含一最後升混合子系統(其可應用在MPEG-4 AAC標準中定義之參數立體聲(「PS」)工具，使用由反格式化器215提取之PS後設資料)，該最後升混合子系統經耦合且經組態以對階段203之輸出執行升混合以產生自APU 210輸出之經完全解碼之經升混合音訊。

參數立體聲係使用立體聲信號之左及右頻道之一下行降混合及描述立體聲影像之空間參數集來表示一立體聲信號之一編碼工具。參數立體聲通常採用三個類型之空間參數：(1)描述頻道之間之強度差的頻道間強度差(IID)；(2)描述頻道之間之相位差的頻道間相位差(IPD)；及(3)描述頻道之間之相干性(或類似性)的頻道間相干性(ICC)。相干性可經量測為依據時間或相位而變化之互相關的最大值。這三個參數通常實現立體聲影像之一高品質重建。然而，IPD參數僅指定立體聲輸入信號之頻道之間的相對相位差，且不指示此等相位差在左及右頻道內的分佈。因此，可另外使用描述一總體相移或總體相位差(OPD)之一第四類型的參數。在立體聲重建程序中，經接收降混合信號s[n]及經接收降混合d[n]之一不相關版本兩者的連續窗化片段與空間參數一起經處理，以根據以下項來產生左(l_k(n))及右(r_k(n))經重建信號：l_k(n)=H₁₁(k,n)s_k(n)+H₂₁(k,n)d_k(n)r_k(n)=H₁₂(k,n)s_k(n)+H₂₂(k,n)d_k(n) 其中H₁₁、H₁₂、H₂₁及H₂₂係由立體聲參數定義。最後藉由一頻率轉時間變換將信號l_k(n)及r_k(n)變換回至時域。

圖5之控制資料產生子系統401經耦合且經組態以偵測待解碼之經編碼音訊位元串流之至少一個性質，且回應於偵測步驟之至少一個結果來產生eSBR控制資料(其可係或包含根據本發明之其他實施例之經編碼音訊位元串流中所包含之任何類型的eSBR後設資料)。確證eSBR控制資料至階段203，以在偵測位元串流之一特定性質(或性質之組合)之後觸發個別eSBR工具或eSBR工具之組合的應用及/或控制此等eSBR工具的應用。例如，為了控制使用諧波轉置來執行eSBR處理，控制資料產生子系統401的一些實施例將包含：一音樂偵測器(例如，一習知音樂偵測器之一簡化版本)，用於回應於偵測位元串流指示或不指示音樂而設定sbrPatchingMode[ch]參數(及確證設定參數至階段203)；一暫態偵測器，用於回應於偵測由位元串流指示之音訊內容中之暫態的存在或缺乏而設定sbrOversamplingFlag[ch]參數(及確證設定參數至階段203)；及/或一音高偵測器，用於回應於偵測由位元串流指示之音訊內容的音高而設定sbrPitchInBinsFlag[ch]及sbrPitchInBins[ch]參數(及確證設定參數至階段203)。本發明的其他態樣係由在此段落中及先前段落中所描述之發明解碼器的任何實施例執行的音訊位元串流解碼方法。

本發明之態樣包含本發明APU、系統或裝置之任何實施例經組態(例如，經程式化)以執行之類型之一編碼或解碼方法。本發明之其他態樣包含經組態(例如，經程式化)以執行本發明方法之任何實施例之一系統或裝置，及(例如，以一非暫時性方式)儲存用於實施發明方法或其步驟之任何實施例之程式碼之一電腦可讀媒體(例如，一磁碟)。例如，本發明系統可係或包含使用軟體或韌體程式化及/或以其他方式經組態以對資料執行各種操作之任何者(包含本發明方法或其步驟之一實施例)之一可程式化通用處理器、數位信號處理器或微處理器。此一通用處理器可係或包含一電腦系統，該電腦系統包含一輸入裝置、一記憶體及經程式化(及/或以其他方式經組態)以回應於確證至其之資料而執行本發明方法(或其步驟)之一實施例之處理電路。

本發明之實施例可實施於硬體、韌體或軟體或兩者之一組合中(例如，作為一可程式化邏輯陣列)。除非另外指示，否則包含為本發明之部分之演算法或程序非固有地與任何特定電腦或其他設備相關。特定而言，各種通用機器可與根據本文中之教示撰寫之程式一起使用，或其對於建構更專用設備(例如，積體電路)以執行所需方法步驟更方便。因此，本發明可實施於在一或多個可程式化電腦系統(例如，圖1之任何元件，或圖2之編碼器100(或其之一元件)，或圖3之解碼器200(或其之一元件)，或圖4之解碼器210(或其之一元件)，或圖5之解碼器400(或其之一元件)之一實施方案)上執行之一或多個電腦程式中，該一或多個可程式化電腦系統各包括至少一個處理器、至少一個資料儲存系統(包含揮發性及非揮發性記憶體及/或儲存元件)、至少一個輸入裝置或埠及至少一個輸出裝置或埠。將程式碼應用至輸入資料以執行本文中描述之功能且產生輸出資訊。以已知方式將輸出資訊應用至一或多個輸出裝置。

各此程式可以任何所要電腦語言(包含機器、組合或高階程序、邏輯或物件導向式程式設計語言)實施以與一電腦系統進行通信。在任何情況中，語言可係一經編譯或經解譯語言。

例如，當藉由電腦軟體指令序列實施時，本發明之實施例之各種功能及步驟可由在適合數位信號處理硬體中運行之多執行緒軟體指令序列實施，在該情況中，實施例之各種裝置、步驟及功能可對應於軟體指令之部分。

各此電腦程式較佳儲存於可由一通用或專用可程式化電腦讀取之一儲存媒體或裝置(例如，固態記憶體或媒體，或磁性或光學媒體)上或經下載至該儲存媒體或裝置，用於在該儲存媒體或裝置由電腦系統讀取時組態且操作電腦以執行本文中描述之程序。本發明系統亦可實施為經組態具有(例如，儲存)一電腦程式之一電腦可讀儲存媒體，其中如此組態之儲存媒體引起一電腦系統以一特定及預定義方式操作以執行本文中描述之功能。

已描述本發明之數項實施例。然而，將理解，可進行各種修改而不脫離本發明之精神及範疇。本發明之許多修改及變動根據上文之教示係可行的。例如，為了促進有效率實施方案，相移可與複合QMF分析及合成濾波器組組合使用。分析濾波器組負責將由核心解碼器產生之時域低頻帶信號濾波成複數個副頻帶(例如，QMF副頻帶)。合成濾波器組負責將由選定HFR技術(如由經接收之sbrPatchingMode參數)產生之經重新產生高頻帶與經解碼低頻帶組合以產生一寬頻輸出音訊信號。然而，在一特定取樣率模式(例如，正常雙速率操作或降低取樣率SBR模式)中操作之一給定過濾器組實施方案不應具有位元串流相依之相移。在SBR中使用之QMF組係餘弦調變濾波器組之理論之一複指示擴展。可經展示，當使用複指數調變擴展餘弦調變濾波器組時，假頻取消約束變得過時。因此，針對SBR QMF組，分析濾波器h_k(n)及合成濾波器f_k(n)兩者可由以下項定義：

其中p₀(n)係一實值對稱或不對稱原型濾波器(一般而言，一低通原型濾波器)，M表示頻道之數目且N係原型濾波器階數。在分析濾波器組中使用之頻道之數目可不同於在合成濾波器組中使用之頻道之數目。例如，分析濾波器組可具有32個頻道，且合成濾波器組可具有64個頻道。當在降低取樣率模式中操作合成濾波器組時，合成濾波器組可僅具有32個頻道。由於來自濾波器組之副頻帶樣品係複值，故可將一新增的可能頻道相依相移步驟附加至分析濾波器組。在合成濾波器組之前需要補償此等額外相移。雖然原則上，相移項可具有任意值而不損害QMF分析/合成鏈之操作，但其等亦可經約束至針對一致性驗證之某些值。SBR信號將由相位因數之選擇影響而來自核心解碼器之低通信號將不會。輸出信號之音訊品質將不受影響。

原型濾波器p₀(n)之數值(自n=0至n=639)列示於表4中。

亦可藉由一或多個數學運算(諸如捨位、子取樣、內插及整數倍降低取樣)自表4導出原型濾波器p₀(n)。

雖然SBR相關之控制資訊之調諧通常不取決於轉置之細節(如先前論述)，但在一些實施例中，可在eSBR擴展容器(bs_extension_id==EXTENSION_ID_ESBR)中聯播控制資料之某些元素以改良經重新產生之信號之品質。一些經聯播元素可包含雜訊底限資料(例如，雜訊底限比例因數及指示各雜訊底限之增量編碼之方向(在頻率方向或時間方向上))、逆濾波資料(例如，指示選自無逆濾波、一低位準之逆濾波、一中間位準之逆濾波及一強位準之逆濾波之逆濾波模式之一參數)及缺失諧波資料(例如，指示是否應將一正弦曲線加至經重新產生之高頻帶之一特定頻帶之一參數)。全部此等元素依賴於在編碼器中執行之解碼器之轉置器之一合成模擬且因此若針對選定轉置器經適當地調諧則可增加經重新產生之信號之品質。

具體而言，在一些實施例中，缺失諧波及逆濾波控制資料在eSBR擴展容器中(連同表3之其他位元串流參數)經傳輸且針對eSBR之諧波轉置器經調諧。傳輸針對eSBR之諧波轉置器之此兩個類別之後設資料所需之額外位元率相對低。因此，發送eSBR擴展容器中之經調諧缺失諧波及/或逆濾波控制資料將增加由轉置器產生之音訊之品質而僅最小地影響位元率。為了確保與舊型解碼器之回溯相容性，亦可使用隱式或顯式傳訊在位元串流中作為SBR控制資料之部分發送針對SBR之頻譜平移操作調諧之參數。

應理解，在隨附發明申請專利範圍之範疇內，可以本文中具體描述之外之方式實踐本發明。在以下發明申請專利範圍中含有之任何元件符號僅係為了闡釋性目的且不應用於以無論任何方式解釋或限制發明申請專利範圍。自以下經列舉例示性實施例(EEE)，將瞭解本發明之各種態樣：

1.一種用於執行一音訊信號之高頻重建之方法，該方法包括：接收一經編碼音訊位元串流，該經編碼音訊位元串流包含表示該音訊信號之一低頻帶部分的音訊資料及高頻重建後設資料；解碼該音訊資料以產生一經解碼低頻帶音訊信號；自該經編碼音訊位元串流提取該高頻重建後設資料，該高頻重建後設資料包含針對一高頻重建程序之操作參數，該等操作參數包含定位於該經編碼音訊位元串流之一擴展容器中之一修補模式參數，其中該修補模式參數之一第一值指示頻譜平移，且該修補模式參數之一第二值指示藉由相位聲碼器頻率擴展之諧波轉置；對該經解碼低頻帶音訊信號濾波以產生一經濾波低頻帶音訊信號；使用該經濾波低頻帶音訊信號及該高頻重建後設資料重新產生該音訊信號之一高頻帶部分，其中若該修補模式參數係該第一值，則該重新產生包含頻譜平移，且若該修補模式參數係該第二值，則該重新產生包含藉由相位聲碼器頻率擴展之諧波轉置；及組合該經濾波低頻帶音訊信號與該經重新產生之高頻帶部分以形成一寬頻帶音訊信號。

2.如EEE 1之方法，其中該擴展容器包含在該修補模式參數等於該第二值時使用之逆濾波控制資料。

3.如EEE 1至2中任一項之方法，其中該擴展容器進一步包含在該修補模式參數等於該第二值時使用之缺失諧波控制資料。

4.如任何前述EEE之方法，其中該經編碼音訊位元串流進一步包含一填充元素，該填充元素具有指示該填充元素之一開始的一識別符及該識別符之後的填充資料，其中該填充資料包含該擴展容器。

5.如EEE 4之方法，其中該識別符係一三位元式首先傳輸最高有效位元之不帶正負號整數且具有0x6之一值。

6.如EEE 4或EEE 5之方法，其中該填充資料包含一擴展有效負載，該擴展有效負載包含頻譜頻帶複製擴展資料，且該擴展有效負載經識別具有一四位元式首先傳輸最高有效位元之不帶正負號整數且具有「1101」或「1110」之一值，且視情況，其中該頻譜頻帶複製擴展資料包含：一選用頻譜頻帶複製標頭，頻譜頻帶複製資料，其在該標頭之後，及一頻譜頻帶複製擴展元素，其在該頻譜頻帶複製資料之後，且其中旗標包含於該頻譜頻帶複製擴展元素中。

7.如EEE 1至6中任一項之方法，其中該高頻重建後設資料包含包絡比例因數、雜訊底限比例因數、時間/頻率柵格資訊或指示一交越頻率之一參數。

8.如EEE 1至7中任一項之方法，其中藉由包含係一原型濾波器p₀(n)之經調變版本之分析濾波器h_k(n)的一分析濾波器組根據以下項執行該濾波：

0

n

N；0

k<M

其中p₀(n)係一實值對稱或不對稱原型濾波器，M係該分析濾波器組中之頻道之一數目且N係該原型濾波器之一階數。

9.如EEE 8之方法，其中自本文中之表4之係數導出該原型濾波器p₀(n)。

10.如EEE 8之方法，其中藉由選自由捨位、子取樣、內插或整數倍降低取樣組成之群組之一或多個數學運算自本文中之表4之係數導出該原型濾波器p₀(n)。

11.如EEE 1至10中任一項之方法，其中在該濾波之後將一相移加至該經濾波低頻帶音訊信號，且在該組合之前補償該相移以降低該方法之一複雜性。

12.如任何前述EEE之方法，其中該擴展容器進一步包含指示當該修補模式參數等於該第一值時是否使用額外預處理以避免該高頻帶部分之一頻譜包絡之一形狀中之不連續性之一旗標，其中該旗標之一第一值啟用該額外預處理且該旗標之一第二值停用該額外預處理。

13.如EEE 12之方法，其中該額外預處理包含使用一線性預測濾波器係數計算一預增益曲線。

14.如EEE 1至13中任一項之方法，其中該擴展容器係一回溯相容擴展容器。

15.如EEE 1至14中任一項之方法，其中根據一格式編碼該經編碼音訊流，且其中該擴展容器係以該格式之至少一個舊型版本定義之一擴展容器。

16.一種非暫時性電腦可讀媒體，其含有在由一處理器執行時執行如EEE 1至15中任一項之方法之指令。

17.一種音訊處理單元，其用於執行一音訊信號之高頻重建，該音訊處理單元經組態以執行如EEE 1至15中任一項之方法。