TWI525987B - 在單一播放模式中組合響度量測的系統 - Google Patents

在單一播放模式中組合響度量測的系統 Download PDF

Info

Publication number
TWI525987B
TWI525987B TW100105070A TW100105070A TWI525987B TW I525987 B TWI525987 B TW I525987B TW 100105070 A TW100105070 A TW 100105070A TW 100105070 A TW100105070 A TW 100105070A TW I525987 B TWI525987 B TW I525987B
Authority
TW
Taiwan
Prior art keywords
loudness
correlation value
audio signal
value
correlation
Prior art date
Application number
TW100105070A
Other languages
English (en)
Other versions
TW201145816A (en
Inventor
馬丁 渥特斯
麥可 舒格
哈洛德 穆特
傑佛瑞 萊德米勒
Original Assignee
杜比實驗室特許公司
杜比國際公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杜比實驗室特許公司, 杜比國際公司 filed Critical 杜比實驗室特許公司
Publication of TW201145816A publication Critical patent/TW201145816A/zh
Application granted granted Critical
Publication of TWI525987B publication Critical patent/TWI525987B/zh

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/14Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for gain control and tone control

Landscapes

  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

在單一播放模式中組合響度量測的系統
本文件關於多媒體資料的處理,特別是多媒體資料的編碼、傳輸、解碼及顯現,例如音訊檔案或位元流。尤其,本文件關於多媒體播放器中的響度控制之實施方式。
音訊內容之相異的混合及回放位準之問題在電影產業中藉由指定SMPTE(Society of Motion Picture and Television Engineers,動畫及電視工程師協會)建議(其保證了跨越電影院及針對不同內容之一致的回放位準)來加以解決。SMPTE建議確保音訊內容被再生於對消費者愉悅的一致位準。
廣播中的情況較有挑戰性,考慮到使用者的個別回放系統不受到技術人員的控制且由於廣播之較複雜的配銷通路及網路。藉由引入數位廣播,此產業建立了時變元資料(time-varying-metadata)的概念,其能夠在接收端控制增益值以對特定收聽環境調整內容。一個實例為Dolby Digital中所含括的元資料,其包括對話的通用響度正規化資訊(「dialnorm」,對話正規化),以及用以降低節目之動態範圍的增益字(gain-words)(「dynrng」及「compr」)。應該注意到的是,貫穿此說明書及在申請專利範圍中,應將對Dolby Digital的參照理解成包含Dolby Digital與Dolby Digital Plus編碼系統兩者。此種系統對於在接收器之關於收聽環境及收聽偏好的操作模式被指定的情況特別有效。經由實例,對話正規化標準容許Dolby Digital之所謂「線模式」及「RF模式」的規格。「RF模式」針對峰值限制情況(其中已解碼節目意圖經由電視上的RF輸入來傳遞,諸如經由機上盒的天線輸出)來加以設計。「線模式」提供比「RF模式」更少的動態範圍壓縮且亦容許使用者調整家用解碼器內的低階提升及高階衰減參數。提升及衰減區域的調整或「縮放(scaling)」容許使用者針對其特定收聽環境客製化音訊再生。這些科技亦為今日的音訊/視訊光碟(像是DVD及藍光光碟)之一部份。
音訊內容的重要配銷通路仍然是CD,其含有16位元PCM資料而沒有任何元資料。CD典型所使用的峰值正規化被視為所謂「響度戰爭」的主要原因,其已經導致具有高平均音訊位準的音訊內容之動態範圍縮減。然而,消費者行為在近年來隨著已編碼內容(例如呈資料縮減格式的內容,諸如mp3)對於內容配銷與儲存而言變得較受歡迎及重要而改變。此種格式容許幾乎無限之內容擁有者及音訊熱衷者可利用的動態範圍。此外,作為個人媒體播放器的行動電話、智慧型手機及其他可攜式電子裝置愈來愈受歡迎已產生的新挑戰在於,設計出滿足消費者期待之各種收聽條件下的一致音訊調平(leveling)及最佳音訊品質之高品質回放裝置。個人音樂收藏的大量內容(時常超過數千個檔案)以及廣泛的音訊格式(諸如mp3、HE-AAC、OGG、WMA、及Dolby Digital)進一步使提供具有一致音訊調平的音訊回放裝置之問題複雜化。
本文件解決了藉由使用電子裝置(例如媒體播放器)中的正規化響度值提供一致音訊調平的問題。尤其強調此種裝置的挑戰,即特別是相異的收聽環境,彼等影響想要的輸出位準以及最大動態範圍容限與廣泛的不同來源及格式之音訊內容,這造成難以回放所有內容於相同之想要的輸出位準。此外,可考慮到諸如可攜式媒體播放器中的正規化響度值之運算的複雜度及編解碼器無關的可應用性方面。此外,解決方案應對於所顯現的內容為非破壞性,即解碼階段以前的實際PCM信號或酬載應維持不變。解決後者問題的可能方法為使用元資料,該元資料被儲存於多媒體檔案或位元流及/或隨著該多媒體檔案或位元流傳送。
依據一態樣,描述一種提供響度相關資料至媒體播放器的方法。媒體播放器可為例如行動電話、智慧型手機、mp3播放器、膝上型電腦或個人媒體播放器。響度相關資料可為與音訊信號關聯的響度值或響度相關值。可將音訊信號儲存於媒體檔案(例如mp3檔案、WMA檔案或iTunes媒體檔案)中作為樣本。替代地或額外地,音訊信號可隨位元流加以提供,例如ACC、HE-ACC、Dolby Pulse或Dolby Digital位元流。
該方法可包含提供與音訊信號關聯的第一響度相關值的步驟,其中該第一響度相關值已經依據第一程序或演算法加以決定。也可將響度相關值稱為調平資訊。用以決定響度相關值的程序或演算法可為音訊信號的一組操控以使決定代表音訊信號之感知響度(即感知能量)的響度相關值。此種程序或演算法可為用以量測音訊節目響度的ITU-R BS.1770演算法及/或重放增益(Replay Gain)響度計算方案。在一實施例中,第一程序可為ITU-R BS.1770演算法且第一響度相關值可為BS.1770響度值。應注意到的是,也可使用ITU-R BS.1770演算法的變型,例如不考慮音訊信號的靜音時間之變型。
該方法可包含藉由使用包含可逆關係的模型轉換該第一響度相關值而成為第二響度相關值的步驟,其中該第二響度相關值係與用以決定響度相關值的第二程序關聯。在一實施例中,第二程序可為重放增益響度計算方案。在此種情況中,第二響度值相關值可為重放增益調整值,即放大或衰減音訊信號至預定輸出位準的增益值。典型地,第二響度相關值在藉由從第一響度相關值轉換所得到時為響度相關值(其針對音訊信號依據第二程序或演算法所決定)的估計。這是由於事實上包含可逆關係的模型可能為由第一及第二程序所決定之響度相關值間的實際關係的近似。
可逆關係可為以對數空間量測(例如以dB量測)的第一響度相關值與該第二響度相關值間的線性關係。此種可逆關係可藉由決定與對應的複數個音訊信號關聯之複數個第一響度相關值來加以獲得,其中該複數個第一響度相關值依據第一程序加以決定。此外,可決定與該對應的複數個音訊信號關聯之複數個第一響度相關值,其中該複數個第二響度相關值依據第二程序加以決定。可將包含一或更多個模型參數的模型擬合至複數對的第一及第二響度相關值。模型可被擬合且模型參數可藉由使用誤差最小化方案而被決定,例如藉由使用最小均方誤差準則、總最小平方誤差準則或最小絕對偏差誤差準則,藉此產生可逆關係。在一實施例中,可使用中位數誤差準則。經由實例,可決定模型參數,使得第二響度相關值之估計誤差的中位數可為零。可逆關係也可藉由使用線性回歸來加以決定。
該方法可包含儲存該第二響度相關值於與該音訊信號關聯的元資料中的步驟。元資料可具有預定語法或格式。在一實施例中,預定格式使用重放增益語法。替代地或額外地,預定格式可與iTunes樣式元資料或ID3v2標籤相容。在另一實施例中,可將第一響度相關值依據MPEG標準ISO 14496-3657隨著Fill Element(例如隨著「節目參考位準」參數)傳輸於Dolby Pulse或HE-ACC位元流中。
該方法可包含提供該元資料至該媒體播放器的步驟。元資料可隨著音訊信號加以提供。在一實施例中,可將音訊信號及元資料儲存於一或更多個檔案中。可將該等檔案儲存於儲存媒體上,例如隨機存取記憶體(RAM)或光碟。在一實施例中,可將音訊信號及元資料傳輸至媒體播放器,例如在諸如HE-ACC的媒體位元流內。
如以上所概述,用以決定響度相關值的第一及/或第二程序可為用以量測音訊節目響度的ITU-R BS.1770演算法及/或重放增益響度計算方案。典型地,第一及第二程序不同。第一及/或第二可包含依據人類響度感知處理該音訊信號的步驟,例如藉由使用A加權及/或K加權。此外,該程序可包含決定已處理音訊信號之一或更多個部分的能量的步驟。此外,該程序可包含偏移該能量以決定響度相關值的步驟。可實施此種偏移以正規化該響度相關值至全刻度(FS)。替代地或額外地,增益值可藉由以目標能量偏移該能量來加以得到。換句話說,可將增益值決定為該能量與目標能量間的偏差。也可將此增益值稱為響度相關值。
在一實施例中,可逆關係可為第一或第二階多項式。尤其,可逆關係可由L2=A+BL1所表示,其中L2為以對數空間(例如dB)量測的第二響度相關值,L1為以對數空間(例如dB)量測的第一響度相關值且A與B為實數,而-17A-15及/或-0.7B-0.9。A與B可呈現以上間隔中的實數之任一者。尤其,-16.1A-15.9或-16.01A-15.99或A=-16.00。尤其,-0.80B-0.82或-0.811B-0.813或B=-0.812。
替代地,可將B限制成B=-1.0。在此情況中,對於第一及第二響度相關值的功率量測之關係由常數因子所模型化。此外,可將A設定為一19A-18、或-18.4A-18.3、或-18.31A-18.29或A=-18.30或A=-18.10或A=-18.00。
可逆關係可由L2=A+BL1+CL1 2所表示,其中L2為以對數空間(例如dB)量測的第二響度相關值,L1為以對數空間(例如dB)量測的第一響度相關值且A、B與C為實數。
替代地或額外地,可將可逆關係分段成第一及/或第二響度相關值的間隔,且不同的可逆關係可針對該複數個間隔來加以決定。可逆關係的參數可藉由使用分段式線性回歸來加以決定。經由實例,可將整體可逆關係分段成複數個間隔[L1,t-1,L1,t)而t=1,...,NT,其中NT為間隔或區段的總數量(NT>0)。針對各個間隔[L1,t-1,L1,t),可決定不同的可逆關係,例如第一或第二階多項式。此外,可能有利的是,使整體可逆關係在該複數個間隔的邊界處是連續的。
轉換該第一響度相關值而成為第二響度相關值的步驟可進一步包含:如果該音訊信號為單聲道信號則以預定值偏移該第一響度相關值的步驟。在一實施例中,可逆關係關於立體聲音訊信號。在此種情況中,單聲道音訊信號的對應可逆關係可藉由在施加該可逆關係之前以該預定值偏移該第一響度相關值來加以獲得。該預定值可為3dBFS。
提供響度相關資料至媒體播放器的方法可進一步包含從該元資料擷取該第二響度相關值的步驟及/或藉由使用該第二響度相關值顯現該音訊信號的步驟。音訊信號可在目標輸出位準加以顯現。在此種情況中,顯現的步驟可包含依據第二響度相關值放大或衰減音訊信號。換句話說,可將第二響度相關值或從目標輸出位準及該第二響度相關值所得到的值(例如對應於該目標輸出位準與該第二響度相關值間的差異之值)施加至音訊信號的樣本。
該方法可進一步包含藉由使用該可逆關係轉換該第二響度相關值而成為該第一響度相關值的步驟。尤其,可使用該可逆關係的相反。在此種情況中,媒體播放器可藉由使用該第一響度相關值顯現該音訊信號。如以上所概述,顯現的步驟可包含施加該第一響度相關值或從該第一響度相關值所得到的值至該音訊信號的樣本之步驟。此外,顯現的步驟可包含控制響度已處理的音訊信號之動態範圍的步驟。此外,顯現的步驟可包含限制該響度已處理的音訊信號以避免截波的步驟。
依據另外的態樣,描述一種經組態成提供響度相關資料至媒體播放器的系統。該系統可包含響度編碼器,其經組態成提供與音訊信號關聯的第一響度相關值,其中該第一響度相關值已經依據第一程序加以決定。可將該響度編碼器進一步組態成藉由使用包含可逆關係的模型轉換該第一響度相關值而成為第二響度相關值,其中該第二響度相關值係與用以決定響度相關值的第二程序關聯。此外,可將該響度編碼器組態成儲存該第二響度相關值於與該音訊信號關聯的元資料中。
該系統可包含傳輸媒體,其經組態成提供該元資料至該媒體播放器。此種傳輸媒體可為無線或有線傳輸媒體。此外,該傳輸媒體可為諸如RAM或光碟的儲存媒體。
該系統可包含媒體播放器,其經組態成從該元資料擷取該第二響度相關值;且根據該第二響度相關值顯現該音訊信號。此外,可將該媒體播放器組態成藉由使用該可逆關係轉換該第二響度相關值而成為該第一響度相關值;且藉由使用該第一響度相關值顯現該音訊信號。
依據另一態樣,描述一種響度編碼器。可將該響度編碼器組態成:提供與音訊信號關聯的第一響度相關值;其中該第一響度相關值已經依據第一程序加以決定;藉由使用包含可逆關係的模型轉換該第一響度相關值而成為第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯;及/或儲存該第二響度相關值於與該音訊信號關聯的元資料中。
依據另外的態樣,描述一種媒體播放器。可將該媒體播放器組態成從與音訊信號關聯的元資料擷取第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯。此外,可將該媒體播放器組態成藉由使用包含可逆關係的模型轉換該第二響度相關值而成為第一響度相關值;其中該第一響度相關值已經依據第一程序加以決定。此外,可將該媒體播放器組態成藉由使用該第一響度相關值顯現該音訊信號。
依據另外的態樣,描述一種藉由使用第一響度相關值顯現音訊信號於媒體播放器的方法。該方法可包含在該媒體播放器接收與該音訊信號關聯的元資料的步驟。該方法可接著從與該音訊信號關聯的元資料擷取第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯。可藉由使用包含可逆關係的模型將該第二響度相關值轉換成為第一響度相關值;其中該第一響度相關值已經依據第一程序加以決定。最終,該方法可包含藉由使用該第一響度相關值顯現該音訊信號的步驟。在一實施例中,第二響度相關值藉由使用該可逆關係從該第一響度相關值轉換而在對應的響度編碼器加以得到。尤其,第二響度相關值可藉由使用該可逆關係從ITU-R BS.1770響度值來加以決定。在另一實施例中,第二響度相關值可對應於藉由直接使用第二程序所決定的響度相關值。尤其,第二響度相關值可對應於藉由傳統裝置所算出的重放增益調整值。
依據另一態樣,描述一種決定用以轉換第一響度相關值而成為第二響度相關值的可逆關係之方法。該方法可包含決定複數個與對應之複數個音訊信號關聯的第一響度相關值的步驟,其中該複數個第一響度相關值係依據第一程序加以決定。該方法可進一步包含決定複數個與該對應之複數個音訊信號關聯的第二響度相關值的步驟,其中該複數個第二響度相關值係依據第二程序加以決定。此外,該方法可包含提供用於該可逆關係的模型的步驟,該模型包含模型參數。此外,該方法可包含藉由使用誤差最小化準則(諸如最小均方誤差)擬合該模型至該複數個第一及第二響度相關值來決定該模型參數,藉此產生該可逆關係。
依據另外的態樣,描述一種軟體程式。可將該軟體程式進一步調整而用以當在運算裝置上加以實行時實施依據本文件中所概述之態樣的任一者之方法。
依據另外的態樣,描述一種包含經調整而用於執行在處理器上的軟體程式的儲存媒體。可將該軟體程式進一步調整而用以當在運算裝置上加以實行時實施依據本文件中所概述之態樣的任一者之方法。
依據另外的態樣,描述一種電腦程式產品。該電腦程式產品可包含可執行的指令,該等指令用以當在運算裝置上加以實行時實施依據本文件中所概述之態樣的任一者之方法。
應注意到的是,可將本專利申請案中所概述的方法及系統(包括它們的較佳實施例)單獨使用或組合此文件中所揭示的其他方法及系統來使用。此外,可將本專利申請案中所概述的方法及系統之所有態樣任意地組合。尤其,可將申請專利範圍的特徵以任意方式彼此組合。
在恆定之感知位準提供音訊輸出的一個方法為定義目標輸出位準,在該目標輸出位準顯現音訊內容。此種目標輸出位準可例如為-11dBFS(相對於全刻度的分貝)。尤其目標輸出位準可取決於目前的收聽環境。此外,可決定音訊內容的電際響度位準(也稱為參考位準)。響度位準較佳隨著媒體內容加以提供,例如隨著連同該媒體內容所提供的元資料。為了在目標輸出位準顯現音訊內容,匹配的增益值可在回放期間來施加。可將匹配的增益值決定為目標輸出位準與實際響度位準間的差異。
此外,在內容需要被提升以匹配目標輸出位準的情況(即假如要施加正的匹配增益)中應考慮到潛在的截波。此外,如果實際響度位準或參考位準被提供於與媒體內容關聯的元資料中,傳統媒體內容的處理(即不包含所需元資料之媒體內容的處理)必須被解決。
如以上已經指示,用以串流及廣播的系統(例如Dolby Digital)典型依賴傳輸元資料(其包含了指示目前節目的響度位準之「對話正規化」值)至解碼裝置。「對話正規化」值可針對不同節目而有所不同。有鑑於事實上「對話正規化」值在編碼器加以決定,內容擁有者能夠控制到達實際解碼器的完整信號鏈。此外,可降低解碼裝置上之運算的複雜度,因為不需要在解碼器決定目前節目的響度值。反而將響度值提供於與目前節目關聯的元資料中。
針對檔案為基礎的系統(即針對關於媒體檔案而不是媒體位元流的系統),響度值或參考值典型對於給定檔案不會改變。換句話說,響度值以每一檔案為基礎加以決定。在一實施例中,將響度值編碼至酬載中(即實際媒體內容被修改)以便符合某些目標輸出位準。另一方面,媒體檔案系統已經被設計成每一檔案依賴單一響度值,其中該響度值可被儲存作為額外的與媒體內容關聯之元資料。此種媒體檔案系統的實例根據在http://www.replaygain.org上所指明之所謂「重放增益」措施及對應的「重放增益」格式。將此網站的揭示以引用方式倂入於本文件的優先權日之公開版本中。已經將重放增益格式實施於各種媒體播放器上,該等媒體播放器藉此能夠對於包含元資料(對應於重放增益格式)的媒體檔案實施響度調整。
重放增益格式定義預定的重放增益語法,該重放增益語法用以指定複數個與特定媒體檔案關聯的參數。可能的參數可為每一媒體曲目的重放增益調整值或每一媒體曲目專輯的重放增益調整值。第一參數指定媒體檔案的響度值,反之第二參數指定專輯(即一組媒體曲目)的共用響度值。另外的參數可為每一曲目的重放增益峰值信號振幅及/或每一專輯的重放增益峰值信號振幅。這些參數分別指定曲目或專輯的最大絕對振幅。
重放增益措施也指明一種用以針對特定曲目或專輯決定以上參數的程序,即參數的含義被指明。重放增益調整值(即響度相關值)藉由使用http://www.replaygain.org上所概述的程序來加以決定。重放增益調整值應當調整音樂響度至粉紅噪音(pink noise)在-20dBFS被回放於立體聲揚聲器之上的響度。關聯的聲壓位準(即預定目標輸出位準)為83dB SPL。重放增益峰值信號振幅藉由決定媒體檔案的最大絕對振幅來加以決定。然而應注意到的是,這些程序的感知動機(尤其是關於決定響度值的程序)可能受到質疑,且較佳的是施加一般已經被接受為感知上有意義的程序。
結果,定義音訊內容的適當感知相關參數上會有問題。尤其,決定同等滿足不同使用者之感知的媒體檔案或一組媒體檔案的響度位準之問題必須被解決。事實上,響度為高度主觀的量且時常沒有單一個響度位準將在所有時刻滿足所有收聽者(或甚至單一個收聽者)。Dolby實驗室所實施的研究作出的結論是,即使當音訊節目已經藉由一組人「由耳朵」來加以「正規化」時,「正規化的」節目無法百分之百徹底滿足不同組收聽者。儘管如此,將一種用以量測音訊節目響度以及真實峰值音訊位準的方法指明為ITU-R BS.1770建議。此建議以引用方式加以倂入。所指明之用以量測音訊響度的方法已經廣泛地被接受,且其可被用來作為用於不同來源及格式的多媒體內容之共用響度量測。這樣說來,可確保的是,不同編碼工具會一致地表現。這將增加消費者滿意度,因為來自不同來源的內容將類似地表現。應注意到的是,ITU-R BS.1770不定義預定目標響度或目標輸出位準,且其開放給使用者根據響度量測得到適當的增益。BS.1770演算法已經被證實針對不同內容(演說、音樂及影片)及針對單聲道、立體聲與5.0/5.1多聲道等等正確地預測響度。此外,運算的複雜度相較於利用濾波器組分析及模型遮蔽之更精密的心理聽覺模型(例如Zwicker模型)而言很低。
總之,所謂的重放增益措施指明了用以關聯響度資料與特定媒體檔案的重放增益格式。此格式已經由各種媒體播放器所廣泛接受。重放增益措施也指明了演算法或程序以算出重放增益調整值而正規化跨越曲目及/或專輯的響度。有鑑於已經在BS.1770建議中加以考慮的大量心理聽覺與生理學專門知識,然而期待的是,在使用BS.1770建議中所指明的響度量測時可達成較高程度的感知滿意度。
假定以上考量,提出了根據ITU-R建議BS.1770中所定義的響度量測來於媒體播放器中實施響度正規化,且藉由表達此種響度值成為等同或對應於重放增益調整值成為具有媒體檔之元資料。換句話說,提出了根據ITU-R BS.1770量測響度。此外,為了支援現存的重放增益元資料且維持兩類型的調平資訊恆定調平,描述了重放增益與ITU-R BS.1770間的轉換。為了達成此目標,調平方法(即重放增益及ITU-R BS.1770)兩者由統計上相關的音樂資料庫之機制來加以調查。
在下列中,概述有關於依據ITU-R BS.1770建議之響度量測的某些態樣。第1a圖顯示響度量測演算法100之各種組件的方塊圖。方塊圖顯示五個主要聲道的輸入(左、中、右、左環繞及右環繞);此容許了包含一至五聲道之媒體檔案的監測。對於具有少於五個聲道的媒體檔案而言,將不使用一些輸入。典型未將低頻效果(LFE)聲道含括於響度量測中。
該演算法的第一階段施加前置濾波101至信號,如ITU-R BS.1770-1的第2圖中所示。前置濾波負責收聽者頭部的聽覺效果,其中該頭部被模型化成剛性球體。前置濾波器101由ITU-R BS.1770-1的第3圖中所示之具有ITU-R BS.1770-1的表1中所指明之係數的濾波器來加以定義。該演算法的第二階段102施加RLB加權曲線,其由ITU-R BS.1770-1的第4圖中所示的高通濾波器所組成,其中該RLB加權曲線被指定成ITU-R BS.1770-1的第3圖中所示之具有ITU-R BS.1770-1的表2中所指明之係數的第二階濾波器。
隨後,測量間隔T中的各聲道之均方能量藉由使用ITU-R BS.1770-1的方程式(1)於單元103中加以量測。最終,將能量值加權(參考符號104)且將不同聲道的已加權能量值加總(參考符號105)以產生各別測量間隔T中的媒體檔案之響度值。將加權104稱為K加權。此外,響度決定可包含偏移已加權能量值的總和。因此,可將依據ITU-R BS.1770-1所決定的響度值稱為響度K、加權、相對於正常滿刻度(Loudness,K weighted,relative to normal Full Scale,LKFS)。
總之,ITU-R BS.1770建議用以決定BS.1770響度的下列步驟:(1)以修正的低頻B曲線(RLB)串聯球狀頭部近似濾波器(單元101及102)來濾波所有聲道;(2)算出每一通道相對於全刻度的長期功率(單元103);(3)如果存在,將環繞聲道功率增加1.41因子(1.5dB)(單元104);(4)加總所有通道功率,轉換成dB且添加0.691dB的校準位準(單元105)。結果為以LKFS表示的響度。校準位準確保單聲道全刻度正弦波為-3.01LKFS的響度。
用於決定重放增益措施中所使用的增益值之演算法異於依據ITU-R BS.1770-1的響度量測。增益值藉由使用以平均相等響度濾波器(較精確而言為近似於反相平均響度曲線的IIR(Infinite Impulse Response,無限脈衝響應)濾波器,如在http://www.replaygain.org所概述)的預處理來加以決定。隨後,RMS(均方根)能量值針對各別音訊信號的50ms時間間隔加以計算。將不同RMS能量整理成數值順序且僅將具有最高RMS能量的5%時間間隔視為用於估計音訊信號的整體感知響度。最終,音訊檔案的重放增益調整值可藉由校準該重放增益調整值來加以決定,使得用該重放增益調整值顯現的音訊信號在依據粉紅噪音參考信號在-20dBFS被回放於二個揚聲器之上的平均重放位準83dB SPL(Sound Pressure Level,聲壓位準)加以顯現。
總之,針對決定重放增益調整值提出下列步驟:
(1)以平均相等響度濾波器濾波所有聲道;(2)針對50ms長度的非重疊區塊算出相對於全刻度的功率且對聲道平均;(3)算出超過每一曲目之所有區塊的5%的區塊功率且藉由轉換成dB得到響度。最終,由目標響度與量測的響度間之差異算出重放增益調整值,其中該目標響度根據粉紅噪音參考信號[-25.5dB響度]。這樣說來,由重放增益調整值獲得增益值。
調平方法兩者(即ITU-R BS.1770及重放增益)量測頻率加權的功率。調平方法兩者間的主要差異為從彼等得到響度的濾波器特性及統計功率分析。儘管ITU-R BS.1770施加具有高通濾波器特性之頻率加權的曲線110,重放增益頻率加權的曲線120具有帶通濾波器特性,如第1b圖中所示。
在ITU-R BS.1770中,能量對於潛在包括靜音(其典型無法有助於主觀響度)的完整音樂曲目加以平均。在發明人所實施的調查中,較佳將靜音時間自該量測排除。這樣說來,可使用修改的ITU-R BS.1770演算法。為了此目的,靜音時間可藉由使用一或更多準則來加以偵測。依據第一準則,音訊信號的(絕對)峰值位準在音訊信號的靜音時間期間不超過(絕對)峰值臨限。在一實施例中,此種峰值臨限可為-60dBFS或-70dBFS。依據另外的準則,音訊信號的能量在音訊信號的靜音時間期間可能不超過能量臨限。在一實施例中,此種能量臨限可為-70LKFS。另外的準則可為靜音時間的最小及/或最大期間。這樣說來,如果針對音訊信號的最小及/或最大期間滿足第一及/或第二準則,靜音時間可被偵測。典型的最小期間可為200msec或1sec,其中典型的最大期間可為400msec或10sec。
這樣說來,用以決定響度相關值的第一或第二程序可為修改的ITU-R BS.1770演算法,其針對該響度相關值的決定排除了音訊信號的靜音時間。音訊信號的靜音時間可如以上所述來加以決定。也可將靜音時間的排除稱為靜音閘控,其中可將由靜音時間的最小期間及最大期間所給定的時間間隔稱為靜音閘。這樣說來,也可將修改的ITU-R BS.1770演算法稱為使用靜音閘控的ITU-R BS.1770演算法。更概括而言,可以說一種用以決定響度相關值的程序可能或可能不考慮靜音閘控。
然而由於音樂資料通常不展現出大量的靜音,靜音的影響受到限制。在另一方面,重放增益量測了僅超過所有訊框功率5%之訊框功率,其係接近絕對最大的訊框功率,即重放增益針對特定音樂檔案決定了接近最大的功率。
有鑑於事實上重放增益調整值及ITU-R BS.1770響度值藉由使用不同程序或演算法來加以決定,對於特定媒體檔案而言兩個值間的關係高度複雜。但是,根據此文件中所概述之發明人的分析,可決定兩個程序間的有意義關係及它們生成的響度相關值。如將被顯示者,重放增益中所施加之接近最大的功率量測及ITU-R BS.1770中所施加的長期功率對於重放增益調整值與BS.1770響度值間的關係具有顯著影響。此外,將顯示的是,來自不同功率量測方案的結果間的關係取決於特定音樂檔案的動態範圍。
如以上所示,提議隨著等同的或對應的重放增益調整值傳遞依據ITU-R BS.1770-1的響度值。在上下文中,提議根據統計上得到的關係(例如線性方程式)匹配重放增益含義至BS.1770響度結果。這可藉由針對統計相關數量的聲音或音訊檔案(例如以mp3及mp4a格式)決定BS.1770響度值及重放增益調整值來加以達成。隨後,可決定BS.1770響度值與重放增益調整值間之決定性及較佳可逆的關係。此種關係可為多項式(例如第一或第二階的多項式),其藉由使用適當的誤差最小化準則而被匹配至複數對的BS.1770響度值及重放增益調整值。在一實施例中,該關係可為以對數空間量測的線性方程式,其藉由使用最小均方誤差準則或其他誤差準則(諸如總最小平方誤差準則或最小絕對偏差誤差準則)來加以決定。可將線性回歸技術用來決定該關係。
在一實施例中,統計上相關的音樂資料庫由21220個源自不同私人音樂收藏的立體聲檔案所組成。壓縮格式為在32與48 kHz間的各種位元率及採樣率之mp3及AAC。重放增益調整值針對所有檔案加以計算。將依據ITU-R BS.1770的響度算出而不考慮靜音時間,其中當相對於全刻度的最大峰值位準維持低於-60dBFS超過一秒時識別出靜音。平均上音訊曲目期間的僅0.6%被識別為靜音,指示了靜音的效應相對很小。具有低響度值的檔案似乎具有比較大聲檔案更高程度的靜音時間(0.3%靜音時間在-5LKFS至1.2%靜音時間在-30LKFS)。第2a圖顯示在依據ID3元資料的範例資料庫中的音樂風格分佈。
根據以上範例音樂資料庫,已經發現的是,一般而言各風格間的5至10LKFS範圍中的響度變化適中。然而古典音樂及講話內容相較於其他風格具有特別低的響度,如第2b圖中可見。依據ID3元資料,所有音樂檔案的約一半沒有早於2001,如第2c圖中可見。如以上已經指示,從1990年早期開始直到今日,響度有傾向增加。這可見於第2d圖中。如果限制分析至最近2009的音樂檔案,平均響度在-8.5LKFS。
第2e圖顯示了其中數對的重放增益調整值與BS.1770響度值針對上述音樂資料庫加以繪製的圖式。線210已經藉由使用被擬合至複數個資料對的最小平方直線(第一階多項式)來加以獲得。該線具有以對數空間量測(dB)的-0.81之斜率。與以對數空間量測的-1.0不同的斜率指示下面的功率量測兩者間的非線性關係。當斜率被限制至以對數空間量測的-1.0時,虛線220代表最小平方解,使得不同功率量測間的關係由常數因子加以線性模型化。
可施加線性回歸以決定可被用來轉換重放增益調整值而成為ITU-R BS.1770響度值的關係,且反之亦然。虛線220代表直線擬合,其中斜率被限制為以dB空間量測的-1.0而具有-18.3dB的偏移(參考符號221)。沒有此限制下,最適斜率以dB空間量測為-0.81且最適偏移為-16.0dB,如實線210所示(參考符號211)。
換句話說,提議藉由使用下列方程式決定重放增益調整值的估計值:
重放增益’=-16.00-0.812*BS1770, (1)
其中重放增益’為以dB量測之重放增益調整值重放增益的估計值,且BS1770為以dB(或LKFS)量測的BS.1770響度值,針對相同媒體檔案。方程式(1)已經藉由對統計上相關的複數對之BS.1770響度值及重放增益調整值施加均方誤差準則及以dB空間量測的線性關係來加以得到,其中從相同媒體檔案決定各對的值。
替代地,可將該斜率限制至以dB空間量測的-1.0。在此種情況中,重放增益調整值的估計值可藉由使用下列方程式來加以決定:
重放增益’=-18.3-1.0*BS1770, (2)
應注意到的是,在替代實施例中,可將該斜率限制至以dB空間量測的-1.0且第一階多項式的偏移可用具有預定斜率-1.0的dB空間加以擬合,使得重放增益估計誤差的中位數針對下面的資料庫為0.0dB。藉由使用此誤差準則,可決定可逆關係使得具有正估計誤差的已量測資料點數量等於具有負估計誤差的資料點數量。藉由使用此中位數為基礎的誤差準則,針對受調查的資料庫可獲得-18.1的偏移,即
重放增益’=-18.0-1.0*BS1770
應注意到的是,在一些例子中,有利的是修改前面的方程式以使用-18.0而不是-18.1的偏移,即
重放增益’=-18.1-1.0*BS1770
將BS.1770響度值與重放增益調整值間的關係之估計誤差定義為誤差=重放增益’一重放增益(dB)。將針對上述量測之此誤差的絕對值之統計特性提供於表1中。
第2f圖顯示針對對應於估計與實際重放增益調整值間的差異之誤差的對應誤差長方圖。長方圖230對應於從方程式(1)所獲得的估計值且長方圖240對應於從方程式(2)所獲得的估計值。
應注意到的是,以上方程式(1)及(2)已經針對立體聲音訊內容所得到。然而,已經觀察到的是,針對單聲道內容,ITU-R BS.1770響度及重放增益調整值具有不同表現。儘管重放增益調整值的決定對於單聲道信號及對應的雙單聲道信號而言產生了相同結果,該雙單聲道信號之ITU-R BS.1770響度的決定比對應的單聲道信號高3 dB。
因此,可針對通用的單聲道或立體聲內容將以上轉換規則調整成:
重放增益’=-16.00-0.812*(BS1770+x),(1’)
重放增益’=-18.3-1.0*(BS1770+x), (2’)
其中對於單聲道內容x=3dBFS且否則x=0dBFS。
觀察到最適斜率不等於-1.0指示了重放增益調整值與BS.1770響度值間的關係對於實際響度位準的依存性。這可藉由兩個程序所實施之不同的統計功率分析加以解釋。由重放增益所決定之接近最大的訊框功率無法用與ITU-R BS.1770所決定的長期功率相同之方式來改變。當動態範圍被縮減時對於較高響度值而言尤其如此。因此可藉由第二階多項式達成改善的擬合。第二階多項式可具有針對低響度的-1.0斜率且具有針對適中或較高響度值(例如>-25LKFS)之降低的斜率(大於-1.0)。然而對於許多音樂檔案而言使用具有最適位準的偏移(18.3 dB)之-1.0的斜率已經足夠。
事實上在使用重放增益程序時與在使用ITU-R BS.1770程序時之功率量測值間的非線性關係主要是由於兩個程序中所使用之不同的統計功率分析方案,可見於第2g圖中。為了此目的,重放增益中之接近最大的訊框功率量測由ITU-R BS.1770中所使用的長期功率量測所代替。修改的重放增益調整值對於對應的BS.1770響度值來加以繪製,且從第2g圖可見的是,具有-1.0之斜率的線250充分擬合複數個資料點/對。
使用以上轉換方程式(1)或(2),響度量測可依據BS.1770實施且隨後被轉換成等同的重放增益調整值(其可依據重放增益格式來加以儲存及/或傳輸)。取決於電子裝置上的音訊解碼器之性能,該響度可依據重放增益規格來加以正規化。換句話說,如果媒體播放器可相容於重放增益,可藉由使用重放增益調整值在重放增益措施目標輸出位準顯現媒體檔案。
另一方面,如果音訊解碼器被組態成依據BS.1770實施響度正規化,可藉由使用方程式(1)或(2)的相反而從等同的重放增益調整值重新計算BS.1770響度值。換句話說,媒體播放器可從重放增益調整值決定BS.1770響度值且藉由依據BS.1770標準決定適當增益而在目標輸出位準顯現媒體檔案。有鑑於事實上BS.1770響度值被正規化至全刻度(FS),可將被施加而用以達成以FS量測之目標輸出位準的增益決定為該目標輸出位準與該BS.1770響度值間的差異。
應注意到的是,由於轉換方程式(1)或(2)的可逆性,原始的BS.1770響度值可從等同的重放增益調整值來加以重新計算而不損失響資訊。這就是如果重放增益調整值經由轉換方程式(1)或(2)而得自ITU響度的情況。
在下列中,考慮了依據重放增益語法儲存重放增益參數的態樣。如以上所概述,重放增益格式典型包含有關媒體內容之二個類型的參數,「重放增益峰值信號振幅」以及「重放增益調整值」。這些參數可用逐個曲目的方式或用逐個專輯的方式加以計算。曲目為基礎的值較適合用於其中來自不同專輯之曲目被混合的使用情況及播放清單。專輯為基礎的值較適合用於其中專輯的所有曲目被連續播放的使用情況。「重放增益峰值信號振幅」指示了音訊信號的最大絕對振幅且可被用來防止在媒體播放器的截波。在一實施例中,依據ITU-R BS.1770-1建議所決定的「真實峰值音訊位準」值可隨著「重放增益峰值信號振幅」參數來加以傳輸。
此外,對於以上所提及的參數,重放增益格式容許重放增益參數原創者的規格。此種重放增益參數原創者的可能值可為例如工程師、藝人、製作人或使用者。
以上重放增益參數可藉由使用下列所述的語法來加以儲存。在一實施例中,檔案中所儲存的媒體內容(其相容於MPEG-4檔案標準)可較佳使用iTunes樣式元資料。其他格式可儲存重放增益參數於ID3v2規格(其以引用方式倂入)中所指明的ID3v2標籤中。將兩個情況的語法概述於下:
1) iTunes樣式元資料中的重放增益參數
可將重放增益參數添加作為「----」型的延伸框,符合標準i-Tunes樣式元資料。「mean」框可存在於「----」框內且包含http://www.replaygain.org上所指明的意義「org.hydrogenaudio.replaygain」。「name」框可存在於「----」框內且包含該值的名稱:replaygain_track_gain;relpaygain_track_peak;replaygain_album_gain;及/或replaygain_album_peak。
「data」框可存在於「----」框內且包含呈下列格式的該值:
‧較佳將增益調整值寫成具有2個小數位及-/+開頭的dB浮點值。(例如「-4.65 dB」)。
‧較佳將峰值信號振幅寫成浮點值(例如「0.860931396」)。峰值信號振幅可高於1.0。
媒體播放器較佳應只對「name」框中的值匹配且為了相容性忽略「mean」框中的值。
可將用於重放增益原創者代碼之額外的iTunes樣式元資料定義:重放增益可包括「原創者代碼」資訊。為了此目的,「mean」框可存在於「----」框內且含有依據http://www.replaygain.org的意義「org.hydrogenaudio.replaygain」。「name」框可存在於「----」框內且含有名稱「replaygain_originator_name」。可使用下列原創者代碼:000=重放增益未指定;001=重放增益由藝人/製作人/母帶工程師所預設;010=重放增益由使用者所設定;011=重放增益自動決定。
此外,「data」框可包含正文字串,其代表以下列順序之用於重放增益值的3位元原創者代碼序連(concatenation):replaygain_track_gain;replaygain_track_peak;replaygain_album_gain;及/或replaygain_album_peak。例如,「011011000000」可映射至用於曲目增益與峰值的自動產生值以及用於專輯增益與峰值的未指定值。
最少,具有重放增益元資料檔案應包括曲目增益值或專輯增益值的一者。
1) ID3v2標籤中的重放增益
可將重放增益值儲存於「TXXX」欄位,其遵循下列語法:
可將各重放增益參數含括於其本身的特定「TXXX」元素中。為了區別參數,「Description」字串可採用與iTunes「name」框(見上述)中所寫相同的值,即特別是replaygain_track_gain;replaygain_track_peak;replaygain_album_gain;replaygain_album_peak及/或replaygain_originator_code。可將對應於這些參數描數的參數值儲存於「Value」欄位。其可使用與以上iTunes段落中所描述者相同的格式。
在使用方程式(1)的較佳實施例中,重放增益調整應在-16 dB與+9 dB之間(對應於0至-31.25 dBFS響度值的範圍)。此範圍外的值應被壓至-16 dB與+9 dB。在使用方程式(2)的另一實施例中,對應於0 dBFS與-31.25 dBFS之ITU-R BS.1770響度值的重放增益調整值可取自第2e圖中的線220。
在下列中,描述有關範例回放系統(其支援所提出之用於響度正規化的方法)的不同態樣。尤其,這些態樣關於想要的目標輸出位準、控制動態範圍、及處理不包含響度元資料的多媒體檔案。
可攜式媒體播放器(例如行動電話、專用的個人音樂播放器、或膝上型電腦)時常需要支援不同的收聽環境。收聽環境的實例可為使用內建揚聲器的環境、使用頭戴式耳機輸出的環境、及/或與類比或數位底座(其可支援多聲道輸出)組合使用的線輸出。
取決於選定的收聽環境,可能需要選擇適當的目標輸出位準。經由實例,對於使用可連接裝置至Hifi設備的底座之後者使用情況而言,例如Dolby Digital的「線模式」中所指明的較低目標位準-31dBFS最適當,因此致能全動態範圍性能。
此外,可攜式媒體播放器應能夠依據施加的響度正規化來控制動態範圍。考慮到最低支援的響度值為-31 dBFS,-31 dBFS以上的所有目標輸出位準應支援經由動態範圍控制的截波保護。即如果具有-31 dBFS響度值或參考位準的音訊檔案要在超過-31 dBFS的目標輸出位準加以顯現,必須施加正的匹配增益,這可造成放大的音訊信號會截波。因此,可攜式媒體播放器應至少設置限幅器以便防止此種可能的截波。支援用於動態範圍控制的格式(諸如Dolby Digital)也可在信號被饋送至限幅器中以前施加此種元資料。例如,操作於RF模式中的Dolby Digital解碼器(其具有-20 dBFS的目標位準)將需要限幅器的9 dB額外提升以達成-11 dBFS的目標位準而沒有截波效應。經由實例,可使用具有信號依賴性始動時間及釋放時間的預看限幅器,其即使對於沒有任何可聽效應的關鍵(例如動態)內容能夠防止截波。
此外,可攜式媒體播放器應能夠處理不包含響度相關元資料的多媒體檔案。當準備檔案的回放時,媒體播放器可首先檢查是否有可用的重放增益值。在完整的專輯被回放的情況中,可能較偏好專輯增益超過曲目增益。否則,可將使用曲目增益設定成內定。在沒有可用的重放增益調整值的情況中,系統可檢查格式依賴性響度值(諸如Dolby Digital中的「對話正規化」參數或MPEG ACC中的節目參考位準)的存在。在此種情況中,可使用這些格式依賴性響度值。如果重放增益調整值或格式依賴性響度值皆不可用,內定響度值可由可攜式媒體播放器加以使用。經由實例,針對立體聲音樂內容可使用-11 dBFS的內定響度值(即內定重放增益調整值),且針對音訊/視訊及多聲道內容可使用-27 dBFS。已經將這些內定響度值決定於以上對統計上相關數量的音樂檔案之統計量測中。
在一實施例中,設定-11 dBFS(任意為-8或-14 dBFS)的目標輸出位準且用以設定此目標輸出位準的增益根據隨著媒體檔案所提供的響度值或參考位準來加以決定。放大的媒體檔案之動態範圍由單方面的演算法或藉由結合單方面的限幅器與可能得自其他可用元資料的動態範圍控制所控制。
為了進一步示出媒體播放器(其依據本文件中所概述的方法施加響度值)的實施方式,將該等方法的範例虛擬碼實施方式提供於表3中。
將範例媒體播放器的接收器/解碼器裝置10示於第3圖中。裝置10接收來自信號路徑或傳輸媒體11的已編碼輸入信號、施加合適的程序於解格式器12中以從該輸入信號擷取已編碼音訊資訊及關聯的元資料、傳送該已編碼音訊資訊至解碼器14且沿信號路徑13傳送該元資料。已編碼音訊資訊可包括代表音訊信號之頻譜內容的已編碼次頻帶信號,且元資料可指定響度增益值與依據動態範圍壓縮設定值指定動態範圍壓縮的其他參數。術語「動態範圍壓縮設定值」意指諸如定義動態範圍壓縮器之(響度)增益因子、壓縮始動時間及壓縮釋放時間的特徵。解碼器14施加解碼程序至已編碼音訊資訊以獲得已解碼次頻帶信號,其被傳送至動態範圍控制器16。解碼程序的操作及功能可回應從信號路徑13所接收的解碼控制參數來加以調整。可被用來調整解碼程序的操作及功能之解碼控制參數的實例為,識別由已編碼因訊資訊所代表的音訊聲道的數量與組態之參數。
動態範圍控制器16任意地調整已解碼音訊資訊的動態範圍。此調整可能回應於自信號路徑13所接收之元資料及/或由回應於來自收聽者之輸入而可被提供的控制信號來加以開啟或關閉及調整。例如,控制信號可回應於收聽者操作切換器或選擇用於裝置10的操作選項來加以提供。在符合ATSC標準、MPEG-2 ACC標準或MPEG-4音訊標準的實施方式中,例如,已編碼輸入信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號,該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量。動態範圍控制器16可能不採取動作,這容許該音訊信號以動態範圍的最大量加以回放,或該動態範圍控制器可能修改已解碼次頻帶信號以用不同程度壓縮該動態範圍。合成濾波器排18施加一排合成濾波器至已解碼次頻帶信號(該等已解碼次頻帶信號可能已經由動態範圍控制器16加以調整),且在它的輸出提供了可能為數位或類比信號的時域音訊信號。
增益-限幅器20在本發明一些實施方式中被用來調整時域音訊信號的振幅。將增益-限幅器20的輸出沿路徑21傳送以供隨後由聲波變換器的呈現。
第4圖為在音訊內容製作或傳輸站且可倂入本文件中所概述之各種態樣的範例編碼器/發送器裝置30的示意方塊圖。裝置30接收來自信號路徑31的音訊輸入信號。裝置30施加一排分析濾波器至音訊信號以獲得呈該輸入音訊信號之頻域表示的次頻帶信號或者一組代表該輸入音訊信號的頻寬限制信號。元資料計算器34分析該音訊輸入信號及/或一或更多個得自該音訊輸入信號的信號(諸如該音訊輸入信號的已修改版本或來自分析濾波器排32的次頻帶信號)以計算元資料,該元資料指定用於各種參數的值,該等參數包括編碼控制參數、一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。元資料計算器34可分析時域信號、頻域信號、或時域信號及頻域信號的組合。由元資料計算器34所實施的計算也可回應於自路徑33所接收的一或更多個元資料參數來加以調整。編碼器36施加編碼程序至分析濾波器排32的輸出,以獲得包括已編碼次頻帶信號的已編碼音訊資訊,該已編碼音訊資訊被傳送至格式器38。編碼程序可回應於自路徑33所接收之編碼控制參數而加以調整。編碼程序也可沿路徑33產生其他解碼控制參數,以供裝置10中所實施的程序用來解碼該已編碼音訊資訊。格式器38組合該已編碼音訊資訊及該元資料(包括該一或更多個解碼控制參數及該一或更多個指定動態範圍壓縮的參數(尤其是響度增益值))的至少一些而成為具有適用於傳輸或儲存之格式的已編碼輸出信號。
在符合ATSC標準、MPEG-2 ACC標準或MPEG-4音訊標準的實施方式中,例如,已編碼輸出信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號,該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量且具有用於在參考再生位準回放的振幅。
第5圖示出範例整體系統500,包含音訊編碼器511及音訊解碼器521,以及任意的依據線/RF或音樂模式之動態範圍控制及響度調整522。音訊編碼器511可為Dolby Digital、Dolby Digital Plus、Dolby Pulse、HE-ACC、mp3、或任何其他編碼器。響度量測應根據ITU-R BS.1770加以實施,如單元512所示。將所量測或所提供的BS.1770響度在Dolby Digital/Dolby Digital Plus中隨著「對話正規化」元資料直接傳輸於位元流中、或者在Dolby Pulse或MPEG HE-ACC中隨著「prog_ref_level」。這由虛箭號513所示。替代地或額外地,可將該響度藉由轉換至重放增益而傳遞於一或更多個ID3v2標籤或iTunes樣式元資料中。可將此種轉換實施於響度轉換單元514中。將ID3v2標籤或iTunes樣式元資料515自編碼側510提供至解碼側520。應注意到的是,Dolby Pulse編碼器包含由單元510所示的處理方塊,且Dolby Pulse解碼器包含由單元520所示的處理方塊。在解碼側520,藉由使用反轉換單元523將重放增益元資料轉換成ITU-R BS.1770響度。轉換單元514及反轉換單元523典型施加本文件中所概述的可逆關係。在一實施例中,在解碼側520所接收的重放增益元資料可為原始的重放增益元資料530(如以上所示在編碼器側510所算出或者以在解碼器或播放器側520的後處理),在反轉換單元523中所決定的響度值典型為對於ITU-BS.1770響度的近似。應注意到的是,可任意將響度資訊使用在編碼器側510以算出動態範圍控制(Dynamic Range Control,DRC)元資料。可將此DRC元資料經由鏈路513提供至解碼器側520且可將其使用於解碼單元521中。
在本文件中,以經描述一種用於可攜式媒體播放器中的響度正規化之方法及系統。該方法及系統依賴標準化BS.1770響度量測與各種可攜式媒體播放器中所使用的重放增益容器之組合。已經從統計量測決定了方程式,該等統計量測可被用來在編碼側已及在解碼側轉換BS.1770響度值而成為重放增益值(反之亦然)。這樣說來,可達成依據BS.1770的響度正規化,這與目前對話正規化為基礎的調平完全相容。該系統即使對於混合內容(例如部份以BS.1770分析且部份以重放增益演算法分析的內容)而言導致統計上最適的響度正規化。該方法及系統可用低的運算複雜度來加以實施,尤其在可攜式媒體播放器。
儘管本發明的特定實施例及本發明的應用已經被描述於本文中,對熟習本技藝之人士顯而易見的是,可能有本文中所描述之實施例及應用上的變化而不背離本文中所描述及揭示之發明的範圍。應理解的是,儘管本發明的某些形式已經被顯示及描述,本發明不限於所描述及顯示的特定實施例或所描述的特定方法。
可將本文件中所描述的方法及系統實施成軟體、韌體及/或硬體。可將某些組件例如實施成執行於數位信號處理器或微處理器上的軟體。可將其他組件例如實施成硬體及/或應用特定積體電路。可將所述方法及系統中所遇到的信號儲存於媒體上,諸如隨機存取記憶體或光學儲存媒體。它們可經由網路加以傳送,諸如無線電網路、衛星網路、無線網路或有線網路,例如網際網路。
利用本文件中所述方法之典型的裝置為解碼音訊信號的媒體播放器。在編碼側,可將該等系統及方法用於廣播台中及在多媒體製作站。
100...響度量測演算法
101...前置濾波器
102...RLB濾波器
103...均方單元
104...加權
105...加總
110...曲線
120...曲線
210...實線
211...偏移
220...虛線
221...偏移
230...長方圖
240...長方圖
250...線
500...範例整體系統
510...編碼側
511...音訊編碼器
512...單元
513...鏈路
514...響度轉換單元
515...ID3v2標籤或iTunes樣式元資料
520...解碼側
521...音訊解碼器
522...動態範圍控制及響度調整
523...反轉換單元
530...原始的重放增益元資料
10...接收器/解碼器裝置
11、13、31...信號路徑
12...解格式器
14...解碼器
16...動態範圍控制器
18...合成濾波器排
20...增益-限幅器
21...路徑
30...編碼器/發送器裝置
32...分析濾波器排
34...元資料計算器
36...編碼器
38...格式器
本發明參照隨附圖式以例示方式解說於上,其中
第1a圖示出BS.1770響度的範例量測設置;
第1b圖示出針對重放增益及ITU-R BS.1770所施加的範例頻率加權曲線;
第2a圖示出音樂檔案的範例資料庫之風格分佈;
第2b圖示出針對第2a圖範例資料庫之不同風格的平均BS.1770響度及標準差;
第2c圖示出針對第2a圖範例資料庫所提供之年份資訊的分佈;
第2d圖示出針對第2a圖範例資料庫之平均BS.1770響度及標準差對年份資訊;
第2e圖示出針對第2a圖範例資料庫之重放增益調整值對BS.1770響度值;
第2f圖顯示針對第2a圖範例資料庫之BS.1770響度與重放增益響度間的轉碼誤差之範例長方圖;
第2g圖顯示針對第2a圖範例資料庫之修改的重放增益調整值對BS.1770響度值;
第3圖為媒體播放器內的範例解碼裝置之示意方塊圖;
第4圖為在音訊製作或傳輸站的範例編碼裝置之示意方塊圖;
第5圖示出範例編碼及解碼系統的示意方塊圖。
500...範例整體系統
510...編碼側
511...音訊編碼器
512...單元
513...鏈路
514...響度轉換單元
515...ID3v2標籤或iTunes樣式元資料
520...解碼側
521...音訊解碼器
522...動態範圍控制及響度調整
523...反轉換單元
530...原始的重放增益元資料

Claims (30)

  1. 一種提供用於響度正規化的感知相關的響度相關資料給媒體播放器的方法,該方法包含:-提供與音訊信號關聯的第一響度相關值;其中該第一響度相關值已經依據第一程序加以決定,其中該第一程序包含依據人類響度感知處理該音訊信號;-藉由使用包含可逆關係的模型轉換該第一響度相關值而成為第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯,其中該可逆關係為在該第一與第二響度相關值間的實際關係的近似;-儲存該第二響度相關值於與該音訊信號關聯的元資料中;及-提供該元資料至該媒體播放器,以使用該第二響度相關值顯現該音訊信號。
  2. 如申請專利範圍第1項之方法,其中該第一及/或該第二程序包含:-決定已處理音訊信號之時間間隔的能量;及-偏移該能量以決定響度相關值。
  3. 如申請專利範圍第2項之方法,其中:-該第一程序為用以量測音訊節目響度的ITU-R BS.1770演算法;-該第二程序為重放增益(Replay Gain)響度計算方案;且其中該重放增益響度計算方案進一步包含從該響度相關值計算增益值,該增益值為該第二響度相關值。
  4. 如申請專利範圍第1至3項中任一項之方法,其中該可逆關係為第一或第二階多項式。
  5. 如申請專利範圍第4項之方法,其中該可逆關係由下列所表示:L2=A+BL1其中L2為以dB量測的該第二響度相關值,L1為以dB量測的該第一響度相關值且A與B為實數。
  6. 如申請專利範圍第5項之方法,其中-17A-15且-0.7B-0.9。
  7. 如申請專利範圍第6項之方法,其中-16.1A-15.9且-0.80B-0.82。
  8. 如申請專利範圍第7項之方法,其中-16.01A-15.99且-0.811B-0.813。
  9. 如申請專利範圍第8項之方法,其中A=-16.00且B=-0.812。
  10. 如申請專利範圍第5項之方法,其中B=-1.0。
  11. 如申請專利範圍第10項之方法,其中-19A-18、或-18.4A-18.3、或-18.31A-18.29或A=-18.30或A=-18.10或A=-18.00。
  12. 如申請專利範圍第4項之方法,其中該可逆關係由下列所表示:L2=A+BL1+CL1 2其中L2為以dB量測的該第二響度相關值,L1為以dB量測的該第一響度相關值且A、B與C為實數。
  13. 如申請專利範圍第1至3項中任一項之方法,其中:-包含該第二響度相關值的元資料具有預定格式;-該預定格式使用重放增益語法;及/或-該預定格式包含iTunes樣式元資料或ID3v2標籤。
  14. 如申請專利範圍第1至3項中任一項之方法,其中:-該可逆關係已經根據針對複數個音訊信號所計算的複數個第一及第二響度相關值來加以決定;-該可逆關係已經藉由使用線性回歸來加以決定;-該可逆關係已經藉由使用分段式線性回歸來加以決定;及/或-該可逆關係已經藉由使用誤差最小化方案來加以決定。
  15. 如申請專利範圍第14項之方法,其中以對數空間量測的該第一響度相關值與該第二響度相關值間的可逆關係為線性關係。
  16. 如申請專利範圍第1至3項中任一項之方法,其中提供該元資料至該媒體播放器的步驟包含傳輸該音訊信號及該元資料至該媒體播放器。
  17. 如申請專利範圍第1至3項中任一項之方法,進一步包含:-從該元資料擷取該第二響度相關值;及-藉由使用該第二響度相關值顯現該音訊信號。
  18. 如申請專利範圍第17項之方法,進一步包含:-藉由使用該可逆關係轉換該第二響度相關值而成為該第一響度相關值;及-藉由使用該第一響度相關值顯現該音訊信號。
  19. 如申請專利範圍第17項之方法,其中顯現之步驟包含:-施加從該第一或該第二響度相關值所得到的值至該音訊信號的樣本;及/或-控制該音訊信號之動態範圍;及/或-限制該音訊信號以避免截波。
  20. 如申請專利範圍第1至3項中任一項之方法,其中該音訊信號係以媒體格式加以表示,該媒體格式為下列之一者:mp3、AAC、HE-AAC、OGG、WMA、Dolby Digital、Dolby Digital Plus、或Dolby Pulse。
  21. 如申請專利範圍第1至3項中任一項之方法,其中轉換該第一響度相關值而成為第二響度相關值之步驟進一步包含:如果該音訊信號為單聲道信號,將該第一響度相關值偏移預定值。
  22. 一種在媒體播放器決定用於響度正規化的感知相關的響度相關的響度編碼器,該響度編碼器:-提供與音訊信號關聯的第一響度相關值;其中該第一響度相關值已經依據第一程序加以決定,其中該第一程序包含依據人類響度感知處理該音訊信號;-藉由使用包含可逆關係的模型轉換該第一響度 相關值而成為第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯,其中該可逆關係為在該第一與第二響度相關值間的實際關係的近似;及-儲存該第二響度相關值於與該音訊信號關聯的元資料中,其中該元資料致使媒體播放器使用該第二響度相關值顯現該音訊信號。
  23. 一種提供用於響度正規化的感知相關的感知相關值給媒體播放器的系統,該系統包含:-如申請專利範圍第22項所述之響度編碼器;-傳輸媒體,提供該元資料至該媒體播放器;-該媒體播放器:-從該元資料擷取該第二響度相關值;且-根據該第二響度相關值顯現該音訊信號。
  24. 如申請專利範圍第23項之系統,其中該媒體播放器係進一步:-藉由使用該可逆關係轉換該第二響度相關值而成為該第一響度相關值;且-藉由使用該第一響度相關值顯現該音訊信號。
  25. 一種媒體播放器,用以:-從與音訊信號關聯的元資料擷取第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯;-藉由使用包含可逆關係的模型轉換該第二響度相關值而成為第一響度相關值;其中該第一響度相關值已經依 據第一程序加以決定,其中該可逆關係為在該第一與第二響度相關值間的實際關係的近似,其中該第一程序包含依據人類響度感知處理該音訊信號;且-藉由使用該第一響度相關值顯現該音訊信號。
  26. 如申請專利範圍第25項之媒體播放器,其為下列之一者:行動電話、智慧型手機、mp3播放器、膝上型電腦、或個人媒體播放器。
  27. 一種藉由使用第一響度相關值顯現音訊信號於媒體播放器的方法,該方法包含:-在該媒體播放器接收與該音訊信號關聯的元資料;-從與該音訊信號關聯的該元資料擷取第二響度相關值;其中該第二響度相關值係與用以決定響度相關值的第二程序關聯;-藉由使用包含可逆關係的模型轉換該第二響度相關值而成為第一響度相關值;其中該第一響度相關值已經依據第一程序加以決定,其中該可逆關係為在該第一與第二響度相關值間的實際關係的近似,其中該第一程序包含依據人類響度感知處理該音訊信號;及-藉由使用該第一響度相關值顯現該音訊信號。
  28. 一種決定用以轉換第一響度相關值而成為第二響度相關值的可逆關係之方法,其中該可逆關係為在該第一與第二響度相關值間的實際關係的近似,該方法包含:-決定複數個與對應之複數個音訊信號關聯的第一響度相關值,其中該複數個第一響度相關值係依據第一程序 加以決定,其中該第一程序包含依據人類響度感知處理該音訊信號;-決定複數個與該對應之複數個音訊信號關聯的第二響度相關值,其中該複數個第二響度相關值係被使用以在媒體播放器顯現該對應複數個音訊信號;-提供用於該可逆關係的模型,該模型包含一或更多個模型參數;及-藉由使用誤差最小化方案擬合該模型至該複數個第一及第二響度相關值來決定該模型,藉此產生該可逆關係。
  29. 一種軟體程式,經調整而用於當在運算裝置上加以實行時在處理器上執行且實施申請專利範圍第1至21、27、28項中任一項的方法步驟。
  30. 一種包含軟體程式的儲存媒體,該軟體程式經調整而用於在運算裝置上加以實行時在處理器上執行且實施申請專利範圍第1至21、27、28項中任一項的方法步驟。
TW100105070A 2010-03-10 2011-02-16 在單一播放模式中組合響度量測的系統 TWI525987B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US31256110P 2010-03-10 2010-03-10

Publications (2)

Publication Number Publication Date
TW201145816A TW201145816A (en) 2011-12-16
TWI525987B true TWI525987B (zh) 2016-03-11

Family

ID=44059059

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100105070A TWI525987B (zh) 2010-03-10 2011-02-16 在單一播放模式中組合響度量測的系統

Country Status (8)

Country Link
US (1) US9154102B2 (zh)
EP (3) EP3694103A1 (zh)
JP (1) JP5695677B2 (zh)
CN (1) CN102792588B (zh)
AR (1) AR080473A1 (zh)
ES (1) ES2763838T3 (zh)
TW (1) TWI525987B (zh)
WO (1) WO2011110525A1 (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
TWI538394B (zh) 2009-04-10 2016-06-11 杜比實驗室特許公司 利用順逆向濾波方式獲取所欲非零相移之技術
TWI501580B (zh) 2009-08-07 2015-09-21 Dolby Int Ab 資料串流的鑑別
CN103443854B (zh) * 2011-04-08 2016-06-08 杜比实验室特许公司 用于混合来自两个编码位流的音频节目的元数据的自动配置
JP5909100B2 (ja) * 2012-01-26 2016-04-26 日本放送協会 ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN107403624B (zh) * 2012-05-18 2021-02-12 杜比实验室特许公司 用于音频信号的动态范围调整及控制的方法和设备
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US9411881B2 (en) * 2012-11-13 2016-08-09 Dolby International Ab System and method for high dynamic range audio distribution
US10027303B2 (en) * 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
GB2510323B (en) * 2012-11-13 2020-02-26 Snell Advanced Media Ltd Management of broadcast audio loudness
CN107257234B (zh) * 2013-01-21 2020-09-15 杜比实验室特许公司 解码具有保留数据空间中的元数据容器的编码音频比特流
BR122015008454B1 (pt) 2013-01-21 2022-02-15 Dolby Laboratories Licensing Corporation Codificador e decodificador de áudio com sonoridade de programa e metadados de limite.
RU2631139C2 (ru) * 2013-01-21 2017-09-19 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
BR112015017295B1 (pt) * 2013-01-28 2023-01-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia
WO2014148848A2 (ko) * 2013-03-21 2014-09-25 인텔렉추얼디스커버리 주식회사 오디오 신호 크기 제어 방법 및 장치
JP2016514856A (ja) * 2013-03-21 2016-05-23 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
CN104080024B (zh) * 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US9559651B2 (en) * 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2833549B1 (en) * 2013-08-01 2016-04-06 EchoStar UK Holdings Limited Loudness level control for audio reception and decoding equipment
EP2838196B1 (en) * 2013-08-12 2023-04-26 Bellevue Investments GmbH & Co. KGaA System and method for controlled dynamics adaptation for musical content
CN117767898A (zh) * 2013-09-12 2024-03-26 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN110648677B (zh) 2013-09-12 2024-03-08 杜比实验室特许公司 用于下混合音频内容的响度调整
WO2015128390A1 (en) * 2014-02-27 2015-09-03 Sonarworks Sia Method of and apparatus for determining an equalization filter
US9654076B2 (en) * 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
CN112185401B (zh) * 2014-10-10 2024-07-02 杜比实验室特许公司 基于发送无关的表示的节目响度
JP6487764B2 (ja) * 2015-04-27 2019-03-20 日本放送協会 音量監視装置及びプログラム
RU2703973C2 (ru) * 2015-05-29 2019-10-22 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ регулировки уровня громкости
JP6692673B2 (ja) * 2015-06-01 2020-05-13 株式会社コーセー 細胞間脂質の薬剤による変化の評価方法、薬剤のスクリーニング方法、細胞間脂質の評価方法
US10978079B2 (en) * 2015-08-25 2021-04-13 Dolby Laboratories Licensing Corporation Audio encoding and decoding using presentation transform parameters
US9832590B2 (en) * 2015-09-12 2017-11-28 Dolby Laboratories Licensing Corporation Audio program playback calibration based on content creation environment
KR102583931B1 (ko) * 2017-01-25 2023-10-04 삼성전자주식회사 음향 출력 장치 및 그의 제어 방법
US9860644B1 (en) * 2017-04-05 2018-01-02 Sonos, Inc. Limiter for bass enhancement
EP3389183A1 (en) * 2017-04-13 2018-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an input audio signal and corresponding method
WO2018199989A1 (en) 2017-04-28 2018-11-01 Hewlett-Packard Development Company, L.P. Loudness enhancement based on multiband range compression
CN107895582A (zh) * 2017-10-16 2018-04-10 中国电子科技集团公司第二十八研究所 面向多源信息领域的说话人自适应语音情感识别方法
EP3753105B1 (en) 2018-02-15 2023-01-11 Dolby Laboratories Licensing Corporation Loudness control methods and devices
US11775250B2 (en) 2018-09-07 2023-10-03 Gracenote, Inc. Methods and apparatus for dynamic volume adjustment via audio classification
JP7397066B2 (ja) * 2018-09-07 2023-12-12 グレースノート インコーポレイテッド オーディオ分類を介した動的な音量調整のための方法、コンピュータ可読記憶媒体及び装置
WO2020185025A1 (ko) 2019-03-14 2020-09-17 가우디오랩 주식회사 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치
KR102390643B1 (ko) * 2019-10-10 2022-04-27 가우디오랩 주식회사 오디오 라우드니스 메타데이터 생성 방법 및 이를 위한 장치

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3189346B2 (ja) 1991-12-17 2001-07-16 ソニー株式会社 記録装置
JP3334419B2 (ja) 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
JP3580444B2 (ja) 1995-06-14 2004-10-20 ソニー株式会社 信号伝送方法および装置、並びに信号再生方法
US7013013B2 (en) * 1998-03-20 2006-03-14 Pioneer Electronic Corporation Surround device
US7058188B1 (en) 1999-10-19 2006-06-06 Texas Instruments Incorporated Configurable digital loudness compensation system and method
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP4583781B2 (ja) * 2003-06-12 2010-11-17 アルパイン株式会社 音声補正装置
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US8311232B2 (en) * 2004-03-02 2012-11-13 Harman International Industries, Incorporated Method for predicting loudspeaker preference
WO2007120453A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
MY144152A (en) 2007-06-19 2011-08-15 Dolby Lab Licensing Corp Loudness measurement with spectral modifications
WO2009093867A2 (en) * 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
TWI429301B (zh) 2008-05-05 2014-03-01 Mstar Semiconductor Inc 音量控制裝置與方法
JP2009296298A (ja) * 2008-06-05 2009-12-17 Panasonic Corp 音声信号処理装置および方法
WO2010013943A2 (en) * 2008-07-29 2010-02-04 Lg Electronics Inc. A method and an apparatus for processing an audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法

Also Published As

Publication number Publication date
WO2011110525A1 (en) 2011-09-15
AR080473A1 (es) 2012-04-11
ES2763838T3 (es) 2020-06-01
EP2545646B1 (en) 2017-05-17
EP3694103A1 (en) 2020-08-12
EP2545646A1 (en) 2013-01-16
US20120328115A1 (en) 2012-12-27
JP5695677B2 (ja) 2015-04-08
US9154102B2 (en) 2015-10-06
JP2013521539A (ja) 2013-06-10
CN102792588B (zh) 2015-11-25
CN102792588A (zh) 2012-11-21
EP3236586A1 (en) 2017-10-25
EP3236586B1 (en) 2019-11-27
TW201145816A (en) 2011-12-16

Similar Documents

Publication Publication Date Title
TWI525987B (zh) 在單一播放模式中組合響度量測的系統
JP7138814B2 (ja) ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
JP7199591B2 (ja) 多様な再生環境のためのダイナミックレンジ制御
TWI524330B (zh) 用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置
JP7543386B2 (ja) 多様な再生環境のためのダイナミックレンジ制御