TWI447709B

TWI447709B - 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法

Info

Publication number: TWI447709B
Application number: TW100103980A
Authority: TW
Inventors: Jeffrey C Riedmiller; Harald H Mundt; Michael Schug; Martin Wolters
Original assignee: Dolby Lab Licensing Corp; Dolby Int Ab
Priority date: 2010-02-11
Filing date: 2011-02-01
Publication date: 2014-08-01
Also published as: US20200176008A1; CN102754151B; JP2015045886A; JP6133263B2; CA2995461A1; EP3444816B1; EA201270712A1; EP4047602A1; EP2534656A1; BR112012019880A2; JP5666625B2; US10566006B2; TW201506912A; US20150043754A1; EP2534656B1; CN103795364A; CA2918302C; WO2011100155A1; US11948592B2; KR101381588B1

Description

用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法

本發明一般有關於編碼及解碼音訊信號，且更特定而言有關於可用來編碼及解碼音訊信號以用於較廣範圍的回放裝置及收聽環境的技術。

手持式及其他類型之可攜式裝置的逐漸普及已經對媒體內容的創作者及經銷商(以及對該等裝置的設計者及製造商)在這些裝置上的回放方面產生新的機會與挑戰。許多可攜式裝置能夠回放廣泛的媒體內容類型及格式，包括那些通常與HDTV、藍光光碟或DVD之高品質、寬廣頻寬及寬廣動態範圍音訊內容關聯的媒體內容類型及格式。可攜式裝置可用來在它們本身的內部聲波變換器上或者在諸如頭戴式耳機的外部變換器上回放這類型的音訊內容；然而，它們無法以跨越不同媒體格式及內容類型的一致響度及清晰度(intelligibility)之方式來再生此內容。

【發明內容及實施方式】

本發明之揭示

本發明針對提供用以編碼及解碼音訊信號以供在包括手持式及其他類型之可攜式裝置的各種裝置上回放的改良方法。

本發明的各種態樣於下列所示的申請專利範圍中加以陳述。

本發明的各種特徵及其較佳實施例可藉由參照下列討論及隨附圖式而更佳地被理解，在該等圖式中相似元件符號意指數個圖中的相似元件。僅陳述下列討論及圖式的內容作為範例，且不應被理解成代表對本發明之範圍的限制。

實行本發明之模式

A.導論

本發明針對音訊資訊之編碼及解碼以供在具挑戰性的收聽環境(諸如那些手持式及其他類型之可攜式裝置的使用者遭遇的收聽環境)中回放。音訊編碼及解碼的幾個實例由已發表的標準加以描述，諸如那些描述於由美國先進電視系統委員會在2005年6月14日所發表之「數位音訊壓縮標準(AC-3、E-AC-3)」，Revision B，Document A/52B(文中稱為「ATSC標準」)中，以及描述於由國際標準組織(ISO)所發表之ISO/IEC 13818-7，進階音訊編碼(Advanced Audio Coding，AAC)(文中稱為「MPEG-2 AAC標準」)以及ISO/IEC 14496-3，第4子部份(文中稱為「MPEG-4音訊標準」)中的標準。僅提到符合這些標準的編碼及解碼程序作為範例。也可將本發明的原則與符合其他標準的編碼系統一起使用。

發明人發現符合一些編碼標準的裝置可用特徵通常在對於手持式及其他類型之可攜式裝置典型的應用及收聽環境方面是不充足的。當這些類型的裝置被用來解碼符合這些標準之已編碼輸入信號的音訊內容時，已解碼音訊內容通常在響度位準顯著低於藉由解碼特別針對這些裝置上的回放所準備之已編碼輸入信號獲得的音訊內容的響度位準下加以再生。

符合ATSC標準的已編碼輸入信號(文中稱為「順應ATSC的已編碼信號」)例如含有已編碼音訊資訊及用以描述如何可將此資訊解碼的元資料。某些元資料參數識別動態範圍壓縮設定值，該動態範圍壓縮設定值指定當該已編碼音訊資訊被解碼時如何可將該音訊資訊的動態範圍壓縮。該已解碼信號的全動態範圍可被保持或它可在解碼時以不同程度加以壓縮，以滿足不同應用及收聽環境的需求。其他元資料識別該已編碼音訊資訊之響度的某一度量，諸如該已編碼信號中的平均計畫位準(program level)或對話位準。此元資料可被解碼器用來調整該已編碼信號的振幅以在回放期間達到指定的響度或參考再生位準。在一些應用中，可指定或假設一或更多個參考再生位準，而在其他應用中，使用者可控制參考再生位準之設定。例如，用來將順應ATSC的已編碼信號編碼及解碼的編碼程序假設對話是在二個參考再生位準的一者中加以回放。一個位準為低於截波位準31 dB，這是最大可能數位值或全刻度(full scale，FS)值，文中記為-31 dB_FS 。使用此位準的解碼模式有時稱為「線模式(Line Mode)」，且意欲被使用於適合較廣動態範圍的應用及環境中。將另一位準設定在-20 dB_FS 。使用此第二位準的解碼模式有時稱為「射頻模式(RF Mode)」，其意欲被使用於像是那些藉由將射頻(RF)信號調變的廣播中所遭遇的應用及環境中，此應用及環境中需要較窄的動態範圍以避免過度調變。

舉另一例子，符合MPEG-2 AAC及MPEG-4音訊標準的已編碼信號包括識別已編碼音訊資訊之平均響度位準的元資料。將順應MPEG-2 AAC及MPEG-4音訊之已編碼信號解碼的程序可容許收聽者指定想要的回放位準。解碼器使用該想要的回放位準及平均響度元資料來調整已編碼信號的振幅，使得該想要的回放位準被達到。

當手持式及其他類型的可攜式裝置被用來將順應ATSC、順應MPEG-2 AAC、及順應MPEG-4音訊之已編碼信號的音訊內容依據這些元資料參數而解碼及回放時，動態範圍及響度位準通常不合適，因為這些類型的裝置所遭遇之不利收聽環境或者因為這些裝置中所使用之較低操作電壓造成的電氣限制。

符合其他標準的已編碼信號使用類似類型的元資料，且可包括用以指定想要的回放響度位準的供應。解碼這些信號的可攜式裝置通常遭遇相同問題。

可將本發明用來在無須特別針對這些裝置所準備之內容的情況下改善手持式及可攜式裝置使用者的收聽體驗。

B.裝置概述

第1圖為併入本發明各種態樣的一種類型之接收器/解碼器裝置10的示意方塊圖。裝置10接收來自信號路徑11的已編碼輸入信號、於解格式器(deformatter)12中施加合適的程序以自該輸入信號擷取已編碼音訊資訊及關聯的元資料、傳送該已編碼音訊資訊至解碼器14且沿信號路徑13傳送該元資料。已編碼音訊資訊包括代表聽覺刺激之頻譜內容的已編碼次頻帶信號，且元資料指定各種參數的值，該等參數包括一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。術語「動態範圍壓縮設定值」意指定義動態範圍壓縮器之操作特性的特徵，諸如增益因子、壓縮始動時間及壓縮釋放時間。

解碼器14施加解碼程序至已編碼音訊資訊以獲得已解碼次頻帶信號，該等已解碼次頻帶信號被傳送至動態範圍控制器16。可回應於自信號路徑13所接收之解碼控制參數而調整解碼程序的操作及功能。可用來調整解碼程序的操作及功能之解碼控制參數的實例為：識別由已編碼音訊資訊所代表之音訊通道的數量及組態的參數。

動態範圍控制器16任意地調整已解碼音訊資訊的動態範圍。此調整可能回應於自信號路徑13所接收之元資料及/或由回應於來自收聽者之輸入而可被提供的控制信號而加以開啟或關閉及調整。例如，控制信號可回應於收聽者操作切換器或選擇用於裝置10的操作選項而被提供。

在符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準的實施例中，例如，已編碼輸入信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號，該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量。動態範圍控制器16可能不採取動作，這容許該音訊信號以動態範圍的最大量加以回放，或該動態範圍控制器可能修改已解碼次頻帶信號以用不同程度壓縮該動態範圍。

合成濾波器排18施加一排合成濾波器至已解碼次頻帶信號(該等已解碼次頻帶信號可能已經由動態範圍控制器16加以調整)，且在它的輸出提供了可能為數位或類比信號的時域音訊信號。

增益-限幅器20在本發明一些實施例中被用來調整時域音訊信號的振幅。將增益-限幅器20的輸出沿路徑21傳送以供隨後由聲波變換器的呈現。

第2圖為併入本發明各種態樣的編碼器/發送器裝置30的示意方塊圖。裝置30接收來自信號路徑31且代表聽覺刺激的音訊輸入信號。裝置30施加一排分析濾波器至音訊信號以獲得呈該輸入音訊信號之頻域表示的次頻帶信號或者一組代表該輸入音訊信號的頻寬限制信號。元資料計算器34分析該音訊輸入信號及/或一或更多個該音訊輸入信號所衍生的信號(諸如該音訊輸入信號的已修改版本或來自分析濾波器排32的次頻帶信號)以計算元資料，該元資料指定用於各種參數的值，該等參數包括編碼控制參數、一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。元資料計算器34可分析時域信號、頻域信號、或時域信號及頻域信號的組合。也可回應於自路徑33所接收的一或更多個元資料參數而調整由元資料計算器34所實施的計算。編碼器36施加編碼程序至分析濾波器排32的輸出，以獲得包括已編碼次頻帶信號的已編碼音訊資訊，該已編碼音訊資訊被傳送至格式器38。可回應於自路徑33所接收之編碼控制參數而調整編碼程序。編碼程序也可沿路徑33產生其他解碼控制參數，以供裝置10中所實施的程序用來解碼該已編碼音訊資訊。格式器38組合該已編碼音訊資訊及該元資料的至少一些成為具有適用於傳輸或儲存之格式的已編碼輸出信號，該元資料包括該一或更多個解碼控制參數及該一或更多個指定動態範圍壓縮的參數。

在符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準的實施例中，例如，已編碼輸出信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號，該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量且具有用於在參考再生位準回放的振幅。

解格式器12、解碼器14、合成濾波器排18、分析濾波器排32、編碼器36及格式器38在設計及操作上可為習知的。幾個實例包括符合上述已發表標準的對應組件。這些標準中所指定或建議之組件的實施例適合與本發明一起使用，但它們不是必需的。這些組件的特定實施例不是關鍵的。

第3至5圖為轉碼器裝置40之不同實施例的示意方塊圖，該轉碼器裝置包含上述裝置10及裝置30中的一些組件。這些組件實質上以與它們的對應部分相同的方式操作。第3圖中所示的裝置40能夠轉碼自路徑11所接收的已編碼輸入信號成為符合相同編碼標準的已修改版本。在此實施例中，裝置40接收來自信號路徑11的已編碼輸入信號、於解格式器12中施加合適的程序以自該已編碼輸入信號擷取第一已編碼音訊資訊及關聯的元資料、傳送該第一已編碼音訊資訊至解碼器14及至格式器38、且沿信號路徑43傳送該元資料。該第一已編碼音訊資訊包括代表聽覺刺激之頻譜內容的已編碼次頻帶信號，且該元資料指定用於各種參數的值，該等參數包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的參數。解碼器14施加解碼程序至該第一已編碼音訊資訊以獲得已解碼次頻帶信號。可回應於自信號路徑43所接收之該一或更多個解碼控制參數而調整解碼程序的操作及功能。次頻帶信號可為聽覺刺激的頻域表示或者一組代表該聽覺刺激的頻寬限制信號。

元資料計算器44分析已解碼次頻帶信號及/或自該等已解碼次頻帶信號所衍生的一或更多個信號以計算一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的參數值。例如，該一或更多個信號可藉由施加合成濾波器排18至該等已解碼次頻帶信號所衍生。可回應於自路徑43所接收的元資料而調整由元資料計算器44所實施的計算。如果元資料計算不需要合成濾波器排18的輸出，則可自此實施例刪去該合成濾波器排。

裝置40的另一實施例顯示於第4圖中。此實施例類似於第3圖中所示的實施例，但包括編碼器36。該編碼器36的含括係容許裝置40轉碼自路徑11所接收的已編碼輸入信號(符合第一編碼標準)成為符合第二編碼標準的已編碼輸出信號，該第二編碼標準可能與該第一編碼標準相同或相異，前提是該二個編碼標準的次頻帶信號相容。這可能在此實施例中藉由使編碼器36施加編碼程序至次頻帶信號以獲得符合該第二編碼標準的第二已編碼音訊資訊而加以完成。將第二已編碼音訊資訊傳送至格式器38。可回應於自路徑43所接收的元資料而調整編碼程序。編碼程序也可沿路徑43產生其他元資料，以供裝置40中所實施的程序用來解碼該已編碼音訊資訊。格式器38組合自路徑43所接收的元資料及它接收的已編碼音訊資訊成為具有適用於傳輸或儲存之格式的已編碼輸出信號。

裝置40的另一實施例顯示於第5圖中。此實施例包括合成濾波器排18，其被施加至已解碼次頻帶信號以獲得已編碼音訊資訊的時域或寬頻表示。合成濾波器排18及分析濾波器排32的含括係容許裝置40基本上在編碼標準的任何選擇之間轉碼。將合成濾波器排18的輸出傳送至分析濾波器排32，該分析濾波器排產生次頻帶信號以供編碼器36編碼。編碼器36施加編碼程序至分析濾波器排32的輸出以產生第二已編碼音訊資訊，該第二已編碼音訊資訊被傳送至格式器38。編碼程序也可沿路徑43產生其他元資料，以供裝置40中所實施的程序用來解碼該已編碼音訊資訊。元資料計算器44可自它對於下列之任一者或所有者的分析來計算元資料參數值：自解碼器14所接收的次頻帶信號、合成濾波器排18的輸出、及分析濾波器排32的輸出。

將裝置10及裝置30的一些態樣更詳細地描述於下。這些描述應用至裝置40的對應特徵。這些態樣在符合上述ATSC標準之方法及裝置的特徵及特性方面加以描述。這些特定特徵及特性僅以範例方式加以討論。這些實施例隱含的原理可直接應用於符合其他標準的方法及裝置。

C.接收器/解碼器

上述回放問題可藉由使用下述三種不同技術的一或更多者而解決。第一種技術使用增益-限幅且可僅藉由裝置10中的特徵來實施。第二及第三種技術使用動態範圍壓縮且它們的實施需要裝置10及裝置30兩者中的特徵。

1.增益-限幅器

第一種技術將裝置10操作於RF模式中而不是線模式中，使得它以動態範圍控制器16提供較高動態範圍壓縮位準及較高參考再生位準的方式來解碼順應ATSC的已編碼輸入信號。增益-限幅器20提供額外的增益，提高有效參考再生位準的值自-14 dB_FS 至-8 dB_FS 。實驗結果指示參考位準等於-11 dB_FS 對許多應用產生良好結果。

增益-限幅器20也施加限幅操作以防止被放大的數位信號超過0 dB_FS 。限幅器的操作特性可影響已再生音訊的感知品質(perceived quality)，但對本發明而言沒有特定限幅器是關鍵的。限幅器基本上可用任何可能想要的方式加以實施。較佳地，將限幅器設計成提供「軟性的」限幅功能，而不是「硬性的」截波功能。

2.微分壓縮值

第二種技術容許裝置10施加動態範圍控制器16中的一或更多個已修改動態範圍壓縮參數。解格式器12獲得來自已編碼輸入信號的微分動態範圍壓縮(dynamic range compression，DRC)參數值，且將該微分參數值與習知DRC參數值一起沿路徑13傳送至動態範圍控制器16。動態範圍控制器16藉由以算術方式結合該等習知DRC參數值與對應的微分DRC參數值來計算它需要的該一或更多個DRC參數值。在此情況中不需要使用增益-限幅器20。

藉由產生已編碼輸入信號的編碼器/發送器裝置30將微分DRC參數值提供於該已編碼輸入信號中。此將描述於下。

如果已編碼輸入信號不含有這些微分DRC值，裝置10可依據上述第一種技術使用增益-限幅器20。

3.相異的壓縮設定值

第三種技術容許裝置10依據動態範圍控制器16中的新動態範圍壓縮設定值來施加動態範圍壓縮。解格式器12獲得一或更多個來自已編碼輸入信號之用於該新設定值的DRC參數值，且沿路徑13傳送該一或更多個DRC參數值至動態範圍控制器16。在此情況中不需要使用增益-限幅器20。

藉由產生已編碼輸入信號的編碼器/發送器裝置30將用於新動態範圍壓縮設定值的DRC參數值提供於該已編碼輸入信號中。此將描述於下。

如果已編碼輸入信號不含有該一或更多個用於該新DRC設定值的DRC參數值，裝置10可依據上述第一種技術使用增益-限幅器20。

D.編碼器/發送器

1.微分壓縮值

藉由使用自已編碼輸入信號所擷取的微分DRC參數值來將以上討論之第二種技術的程序實施於裝置10中。這些微分參數值由產生已編碼信號的裝置30所提供。

裝置30提供一組微分DRC參數值，該組微分DRC參數值代表一組將出現於已編碼信號中的DRC參數值與一組防止已解碼音訊信號樣本超過0 dB_FS 的較高參考再生位準的用於新DRC設定值之對應基參數值之間的差異。對本發明而言沒有計算DRC參數值的特定方法是關鍵的。符合ATSC標準之計算DRC參數值的已知方法係揭示於由美國先進電視系統委員會在2009年11月4日所發表之「ATSC Recommended Practice：Techniques for Establishing an Maintaining Audio Loudness for Digital Television」，Document A/85中，尤其是Section 9與Annex F，以及於Robinson等人之「Dynamic Range Control via Metadata」中，preprint no.5028，107th AES Convention，New York，1999年9月。

如果已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準，增加參考再生位準的值自-14 dB_FS 至-8 dB_FS 。實驗結果指示參考位準等於-11 dB_FS 對許多應用產生良好結果。

對於順應ATSC的已編碼輸出信號，元資料計算器34計算該標準中所指示之對應基參數「compr」的微分參數值。格式器38可組合該微分參數值成為各已編碼信號訊框被記為「addbsi(額外位元串流資訊)」及/或「auxdata(輔助資料)」的部分。如果將微分參數值組合成為「addbsi」或「auxdata」部分，已編碼信號將與所有順應ATSC的解碼器相容。那些無法辨識微分參數值的解碼器仍可藉由忽略「addbsi」或「auxdata」部分而正確地處理及解碼該已編碼信號訊框。更多細節參照上述之A/52B Document。

對於符合MPEG-2 AAC或MPEG-4音訊標準的已編碼輸出信號，格式器38可組合該等微分參數值成為各已編碼信號訊框在該二個標準中被記為「Fill_Element」或「Data_Stream_Element」的部分。如果將微分參數值組合成為這些部分的任一者，已編碼信號將與所有順應MPEG-2 AAC及MPEG-4音訊標準的解碼器相容。更多細節參照上述之ISO/IEC 13818-7及ISO/IEC 14496-3。

微分參數值可被計算且以一速率被插入至已編碼信號中，該速率大於、等於、或小於對應基參數於該已編碼信號中的速率。用於微分值的速率可變動。也可將用以指示先前的微分值是否應被再度使用的旗標或位元含括於已編碼信號中。

2.相異的壓縮設定值

藉由使用自已編碼輸入信號所擷取之用於新動態範圍壓縮設定值的DRC參數值來將以上討論之第三種技術的程序實施於裝置10中。這些參數值由產生已編碼信號的裝置30所提供。

裝置30藉由計算防止已解碼音訊信號樣本超過0 dB_FS 的較高參考再生位準所需要的參數值而衍生出用於新DRC設定值的DRC參數值。

如果已編碼輸出信號符合ATSC標準、MPEG-2 AAC或MPEG-4音訊標準，元資料計算器34根據參考再生位準的值自-14 dB_FS 增加至-8 dB_FS 的假設來計算DRC壓縮值。實驗結果指示參考位準等於-11 dB_FS 對許多應用產生良好結果。格式器38可組合用於該DRC設定值的參數值成為各已編碼信號訊框的部分，如同以上針對微分參數所述。這些訊框部分的使用係容許已編碼信號與所有符合各別標準的解碼器相容。

E.實施例

併入本發明各種態樣的裝置可用各種方式加以實施，包括由電腦或包括更特定組件(諸如耦接至類似於一般用途電腦中出現之組件的數位信號處理器(DSP)電路)的某其他裝置所執行的軟體。第6圖為可被用來實施本發明態樣之裝置70的示意方塊圖。處理器72提供運算資源。RAM 73為用於處理之處理器72所使用的系統隨機存取記憶體(RAM)。ROM 74代表諸如唯讀記憶體(ROM)的一些持續儲存器的形式，用以儲存操作裝置70所需的程式且可能用以進行本發明各種態樣。I/O控制器75代表用以藉由通訊通道76、77接收輸入信號及發送輸出信號的介面電路。在所示實施例中，所有主要系統組件連接至匯流排71，其可代表超過一個的實體或邏輯匯流排；然而，不需要匯流排架構來實施本發明。

在由一般用途電腦系統所實施的實施例中，可將額外組件含括而用於介接於諸如鍵盤或滑鼠及顯示器的裝置，且用於控制具有儲存媒體(諸如磁帶或磁碟、或光學媒體)的儲存裝置。儲存媒體可被用來記錄用於作業系統、公用程式及應用程式的指令程式，且可包括實施本發明各種態樣的程式。

實行本發明各種態樣所需要的功能可由以各種方式實施的組件(包括分離的邏輯組件、積體電路、一或更多個ASIC及/或程式控制處理器)加以實施。實施這些組件的方式對本發明並不重要。

本發明的軟體實施例可藉由各種機器可讀取媒體加以傳送，諸如貫穿包括從超聲波至紫外線頻率之頻譜的基頻或調變通訊路徑，或藉由利用基本上任何記錄技術(包括磁帶、磁卡或磁碟、光學卡或光碟、及在包括紙的媒體上的可偵測標記)而傳送資訊的儲存媒體。

10．．．接收器/解碼器裝置

11、13、31、43．．．信號路徑

12．．．解格式器

14．．．解碼器

16．．．動態範圍控制器

18．．．合成濾波器排

20．．．增益-限幅器

21、33．．．路徑

30．．．編碼器/發送器裝置

32．．．分析濾波器排

34、44．．．元資料計算器

36．．．編碼器

38．．．格式器

40．．．轉碼器裝置

70．．．裝置

71．．．匯流排

72．．．處理器

73．．．隨機存取記憶體

74．．．唯讀記憶體

75．．．I/O控制器

76、77．．．通訊通道

第1圖為回放裝置的示意方塊圖。

第2圖為編碼裝置的示意方塊圖。

第3至5圖為轉碼裝置的示意方塊圖。

第6圖為可被用來實施本發明各種態樣之裝置的示意方塊圖。

10．．．接收器/解碼器裝置

11、13．．．信號路徑

12．．．解格式器

14．．．解碼器

16．．．動態範圍控制器

18．．．合成濾波器排

20．．．增益-限幅器

21．．．路徑

Claims

一種用以解碼已編碼輸入信號以產生音訊輸出信號的方法，其中該方法包含：接收該已編碼輸入信號，其包括已編碼音訊資訊及關聯的元資料，該關聯的元資料包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的第一參數，且該元資料任意地包括一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的第二參數，其中該一或更多個第一參數具有的值係依據產生該已編碼音訊資訊的編碼程序加以設定且用以代表具有在第一參考再生位準回放之不超過截波位準之振幅的聽覺刺激，且其中該一或更多個第二參數具有的值係依據產生該已編碼音訊資訊的編碼程序加以設定且用以代表具有在第二參考再生位準回放之不超過該截波位準之振幅的聽覺刺激，該第二參考再生位準係高於該第一參考再生位準；施加解碼程序至該已編碼音訊資訊以獲得代表該聽覺刺激之頻譜內容的次頻帶信號，其中該解碼程序回應於該一或更多個解碼控制參數而調整；修改該等次頻帶信號以獲得具有已改變動態範圍特性的已修改次頻帶信號，其中如果該元資料包括該一或更多個第二參數，該修改回應於該一或更多個第二參數而調整，或如果該元資料不包括該一或更多個第二參數，該修改回應於該一或更多個第一參數而調整；施加合成濾波器排至該等已修改次頻帶信號以獲得時域音訊信號；及如果該元資料不包括該一或更多個第二參數，回應於該元資料施加增益及限幅器至該時域音訊信號，其中該增益之施加修改該時域音訊信號以獲得具有在該第二參考再生位準回放之振幅的音訊輸出信號，且其中該限幅器之施加防止該音訊輸出信號的振幅超過該截波位準。
如申請專利範圍第1項之方法，其中該一或更多個第二參數代表該第一動態範圍壓縮設定值與該第二動態範圍壓縮設定值之對應參數間的差異。
如申請專利範圍第1或2項之方法，其中該已編碼輸入信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準，該第一參考再生位準對應於低於該截波位準20dB的振幅，且該第二參考再生位準對應於低於該截波位準11dB的振幅。
一種用以編碼代表聽覺刺激之音訊輸入信號的方法，其中該方法包含：接收該音訊輸入信號；施加分析濾波器排至該音訊輸入信號以產生代表該音訊輸入信號之頻譜內容的次頻帶信號；分析一或更多個自該音訊輸入信號所衍生的信號以計算元資料，該元資料包括一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的第一參數及一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的第二參數，其中該一或更多個第一參數具有的值經設定而代表具有在第一參考再生位準回放之不超過截波位準之振幅的聽覺刺激，且其中該一或更多個第二參數具有的值經設定而代表具有在第二參考再生位準回放之不超過該截波位準之振幅的聽覺刺激；施加編碼程序至該等次頻帶信號以獲得已編碼音訊資訊；及組合該已編碼音訊資訊及該元資料成為具有適用於傳輸或儲存之格式的已編碼輸出信號，其中該一或更多個第二參數代表該第一動態範圍壓縮設定值與該第二動態範圍壓縮設定值之對應參數間的差異。
如申請專利範圍第4項之方法，其中該已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準，該第一參考再生位準對應於低於該截波位準20dB的振幅，且該第二參考再生位準對應於低於該截波位準11dB的振幅。
一種用以轉碼已編碼輸入信號以產生已編碼輸出信號的方法，其中該方法包含：接收該已編碼輸入信號，其包括第一已編碼音訊資訊及關聯的元資料，該關聯的元資料包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的第一參數，其中該一或更多個第一參數具有的值係依據產生該第一已編碼音訊資訊的第一編碼程序加以設定且用以代表具有在第一參考再生位準回放之不超過截波位準之振幅的聽覺刺激；施加解碼程序至該第一已編碼音訊資訊以獲得代表該聽覺刺激之頻譜內容的次頻帶信號，其中該解碼程序回應於該一或更多個解碼控制參數而調整；分析一或更多個自該等次頻帶信號所獲得的信號以計算一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的第二參數，其中該一或更多個第二參數具有的值經設定而代表具有在第二參考再生位準回放之不超過該截波位準之振幅的聽覺刺激；及組合第二已編碼音訊資訊、該一或更多個第一參數及該一或更多個第二參數成為具有適用於傳輸或儲存之格式的已編碼輸出信號，其中該第二已編碼音訊資訊為該等次頻帶信號的已編碼表示。
如申請專利範圍第6項之方法，其中該一或更多個第二參數代表該第一動態範圍壓縮設定值與該第二動態範圍壓縮設定值之對應參數間的差異。
如申請專利範圍第6或7項之方法，其包含：施加合成濾波器排至該等次頻帶信號以獲得被分析以計算該一或更多個指定動態範圍壓縮之第二參數的該一或更多個信號。
如申請專利範圍第6或7項之方法，其包含：施加第二編碼程序至該等次頻帶信號以產生該第二已編碼音訊資訊。
如申請專利範圍第6或7項之方法，其中該第二已編碼音訊資訊為該第一已編碼音訊資訊。
如申請專利範圍第6或7項之方法，其中該已編碼輸入信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準，且該第一參考再生位準對應於低於該截波位準20dB的振幅。
如申請專利範圍第6或7項之方法，其中該已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準，且該第二參考再生位準對應於低於該截波位準11dB的振幅。
一種設備，其包含用以實施申請專利範圍第1至12項中任一項之方法步驟的手段。
一種記錄指令程式的儲存媒體，該指令程式由裝置所執行以實施申請專利範圍第1至12項中任一項方法之步驟。