TW201438003A - 用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置 - Google Patents

用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置 Download PDF

Info

Publication number
TW201438003A
TW201438003A TW103103168A TW103103168A TW201438003A TW 201438003 A TW201438003 A TW 201438003A TW 103103168 A TW103103168 A TW 103103168A TW 103103168 A TW103103168 A TW 103103168A TW 201438003 A TW201438003 A TW 201438003A
Authority
TW
Taiwan
Prior art keywords
value
loudness
control
audio
limiter
Prior art date
Application number
TW103103168A
Other languages
English (en)
Other versions
TWI524330B (zh
Inventor
Robert Bleidt
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201438003A publication Critical patent/TW201438003A/zh
Application granted granted Critical
Publication of TWI524330B publication Critical patent/TWI524330B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

本案提供一種用以解碼一位元串流以便從該位元串流產生一音訊輸出信號之解碼器設備,該位元串流包含音訊資料且任擇地包含含有一參考響度值之響度元資料,該解碼器設備包含:一音訊解碼器設備,其經組配來從該音訊資料重新建構一音訊信號;以及一信號處理器,其經組配來基於該音訊信號產生該音訊輸出信號;其中該信號處理器包含一增益控制設備,其經組配來調整該音訊輸出信號之一位準;其中該增益控制設備包含一參考響度解碼器,其經組配來產生一響度值,其中在該參考響度值存在於該位元串流中的情況下,該響度值係該參考響度值;其中該增益控制設備包含一增益計算器,其經組配來基於該響度值且基於一音量控制值計算一增益值,該音量控制值係由一允許使用者控制該音量控制值之外部使用者介面提供;其中該增益控制設備包含一響度處理器,其經組配來基於該增益值控制該音訊輸出信號之響度。

Description

用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置 發明領域
本發明係關於對在電子重現設備上以數位形式播放之音訊、視訊及多媒體內容之響度的控制,具體而言但非排他性地,係關於常常發生在新媒體設備上的對播放響度的控制,其中內容係製作成具有及不具有嵌入式響度元資料。
發明背景
在產生及傳輸音樂、視訊及其他多媒體內容時,在不同歌曲間或在不同節目間執行響度標準化過程來確保消費者聽到具有適當響度之音訊信號。自早期的錄音及電影以來,此操作係在產生過程期間進行或經由用於劇場之重現標準來進行。當今在音樂及無線電廣播業內的慣常做法係將響度調整為接近媒體之最大峰值位準的值,而在電影及電視業內的做法係使用比最大峰值位準低20dB至31dB的若干標準響度位準中之一者。在媒體匯流(media convergence)之前的時代,消費者並未注意到上述情形,因為使用分開的設備或音量設定來播放每種類型之內容。
隨著用於播放音樂及電影內容之行動設備(諸如 行動電話或可攜式媒體播放器)的出現,若將未經修改的內容傳輸至設備,則生產實踐中的此差異導致可能高達30dB的響度差異。
自一種類型之內容切換至另一種類型時,上述情 形可能導致電影的音量太小或音樂的音量太大。
相關趨勢為,在錄音的母帶後期處理(mastering) 期間經由使用強烈的動態範圍壓縮、限制及限幅(clipping)來增大許多類型之錄製音樂之響度。此種母帶後期處理係在僅考慮諸如光碟片之無損耗記錄媒體的情況下進行,但是當今所售的大多數音樂呈諸如MPEG AAC及MP3之有損耗的資料壓縮格式。資料壓縮過程可能引入在播放期間於解碼器中重新建構之時域波形的變化,此等變化引起波形中超過信號之全尺度限值或最大峰值的過衝(overshoot)。在通常用於行動設備中之定點解碼器(或飽和浮點解碼器)中,上述情形可導致將過衝限幅至全尺度限值,從而引起重現信號中之額外可聽見的限幅。
在一些情況下,對音樂之此強烈壓縮及限幅係出 於藝術目的進行,但更常見的係為了以下目的進行:藉由使錄音比其他錄音「聽起來更響」來增加錄音之商業吸引力,或為了提供在所有傾聽環境中(諸如在機場或嘈雜場所以及安靜環境中)均可理解之內容。
在電影及視訊業內,在一些類型中使用廣泛音訊 動態範圍來獲得動態效果及創造更具吸引力的體驗。當經由杜比數位或MPEG-4 AAC編碼解碼器傳送給消費者時,常常包括音訊動態範圍控制元資料,以便允許在存在嘈雜環境的情況下或在大聲場景將過於煩擾的情況下於接收器或播放器處任擇地減小動態範圍。
由杜比數位來編碼的DVD或BluRay內容中所包括之傳統元資料或在由杜比數位(在先進電視系統委員會公司的音訊壓縮標準A/52中標準化)或MPEG-4 AAC(在ISO/IEC 14496-3及ETSI TS 101 154中標準化)來編碼的TV信號中所傳輸之傳統元資料包括以下分量:
1.單個靜態元資料值,其指示節目之總體長期整合響度,在MPEG標準中稱為節目參考位準。
2.降混增益之靜態元資料值,其用來控制多聲道內容之降混以便經由立體聲或單聲道設備輸出。
3.動態範圍控制增益或縮放因數之兩個集合,其係在音訊信號中針對用於多個頻帶或頻區之每一經資料壓縮的位元串流訊框加以發送。一個集合係用於「輕度」壓縮(行業術語),且另一個集合係用於「重度」壓縮。此等輕度及重度DRC值的使用通常與在針對操作模式「線路模式」及「RF模式」所建立之解碼器響度目標位準上的操作有關。針對此等模式之命名慣例及操作點係在數位媒體的初期建立的,在數位媒體的初期可能必需將數位音訊轉換為類比信號,該等類比信號係經由基頻纜線發送至後續設備上的 線路輸入端或經由RF載波傳輸至類比電視機。
此元資料的使用允許在播放期間以非破壞性方式使重現適應於傾聽環境。可用不同的元資料集合或完全不使用元資料來播放相同的串流或檔案,以便產生不同的動態範圍。不同於使用僅駐留於播放設備中之壓縮器,使用元資料的動態範圍控制允許創造性藝術家必要時在產生過程期間監視及控制壓縮之性質。
不幸的是,常常在諸如MPEG AAC或杜比數位家 族之有損耗編碼解碼器中實行之動態範圍控制元資料不能對信號進行足夠強的壓縮以便與當代音樂之響度匹配,因為元資料以音訊壓縮訊框為基礎影響信號之平均功率(可能在若干頻帶中),其中常見的訊框週期為20ms至40ms。 此逐訊框增益控制不夠快,以致於不能將信號的峰值與平均值之比減小至經高度處理之當代音樂的峰值與平均值之比。
如[5]中所描述,Wolters等人用來解決此問題的 方法係在播放設備中使用接在解碼器後面的音訊限制器來增加平均響度。此將解決響度匹配問題,以使得音樂及電影內容具有相等響度,但有若干缺點。當消費者在安靜環境中(可能在安靜房間內使用連接至揚聲器之行動設備,或使用具有強隔音效果之頭戴式耳機或耳機)播放內容時,電影內容被壓縮的強烈程度將與音樂相同,此係不符合要求的。限制器亦在設備CPU或DSP上引入額外工作負載,從而縮短電池壽命。
Camerer等人在[6]中描述一種不同的方法,其提 議將諸如ITU標準BS.1770-2中所描述之響度量測結果編碼為音樂檔案中之元資料,並且將每一檔案之播放標準化為由設備之音量控制所設定的目標位準。此方法依靠先前的音樂響度標準化系統,諸如SoundCheck(www.apple.com)及ReplayGain(www.replaygain.org),該等系統係諸如iPod之一些音樂播放器之任擇的特徵。在該等方法中,提倡要求響度標準化預設為開啟;然而,並未規定當使用者關閉響度標準化時出現什麼情況,或更重要的是,當播放未用響度元資料來編碼之內容時出現什麼情況。假設所有內容在播放前將由播放設備或由安全的可信賴的散佈者(諸如iTunes)進行分析。另外,關於調整內容之總體動態範圍來使其適應於傾聽環境並未作出規定。
因此,本發明之一目標係提供統一的方法來解決 使以下兩種內容之播放響度標準化的問題:電影/視訊式內容,其可能具有廣泛的動態範圍及可能的嵌入式響度元資料;以及音樂或無線電/播客內容,其可能具有極窄的動態範圍及強烈的壓縮、限制及限幅,可能含有但很可能不含嵌入式響度元資料,此係由於消費者已經擁有或交換了大量先前音樂內容。
本發明之另一目標係允許按消費者之傾聽環境 或品味來調整含有動態範圍控制元資料之內容之動態範圍。
本發明之另一目標係預防有損耗的資料壓縮音 訊解碼器(諸如AAC、MP3或杜比數位解碼器)中由信號分量變化引起之可能的限幅,該等變化係由資料壓縮過程引入。
本發明之另一目標係對音樂錄製業提供輕微的 激勵,以使其放棄對其內容中之更強的動態範圍壓縮、限制及限幅的追求。
本發明之又一目標係限制設備CPU或DSP上由響度處理或限幅預防所引起的額外工作負載。
發明概要
本發明之一實施例包括一種用以解碼一位元串流以便從該位元串流產生一音訊輸出信號之解碼器設備,該位元串流包含音訊資料且任擇地包含含有一參考響度值之響度元資料,該解碼器設備包含:一音訊解碼器設備,其經組配來從該音訊資料重新建構一音訊信號;以及一信號處理器,其經組配來基於該音訊信號產生該音訊輸出信號;其中該信號處理器包含一增益控制設備,其經組配來調整該音訊輸出信號之一位準;其中該增益控制設備包含一參考響度解碼器,其經組配來產生一響度值,其中在該參考響度值存在於該位元串流中的情況下,該響度值係該參考響度值;其中該增益控制設備包含一增益計算器,其經組配來 基於該響度值且基於一音量控制值計算一增益值,該音量控制值係由一允許使用者控制該音量控制值之使用者介面提供;其中該增益控制設備包含一響度處理器,其經組配來基於該增益值控制該音訊輸出信號之響度。
音訊解碼器設備可為能夠從壓縮式位元串流之音訊資料重新建構音訊信號之任何設備。信號處理器可為能夠在來自音訊解碼器設備之音訊信號被設定至其時產生音訊輸出信號並且具有如下文所闡述之增益控制設備的任何設備。增益控制設備係經設置來控制音訊輸出信號之響度的設備。
參考響度解碼器經組配來解碼位元串流中所含的響度元資料。若響度元資料含有參考響度值,則參考響度解碼器正是將此參考響度值輸出為響度值。
增益計算器係用以計算增益值的設備,該增益值係基於由參考響度解碼器輸出之響度值及由解碼器設備之使用者設定的音量控制值。為了設定音量控制值,可使用任何使用者介面。增益計算器特定而言可為減法器。
響度處理器能夠基於由增益計算器提供的增益值來控制音訊輸出信號之響度位準。響度處理器特定而言可為乘法器。
不同於可攜式設備中或消費者電子設備中所使用之傳統的壓縮式解碼器設備(諸如杜比數位或AAC解碼器設備),用可變增益值或解碼器目標臨界值(對應於全尺度 位元串流之解碼位準)來操作壓縮解碼器設備,該值受控於使用者之音量控制。此允許解碼器設備通常在設備之數位音訊系統之最大全尺度範圍以下很好地操作。此操作避免了限幅解碼器過衝的可能性,且允許不具有重度動態範圍壓縮及限制的電影式內容之響度標準化至具有重度壓縮及限制的音樂內容之響度標準化,而無需不會如通常所需對電影式內容進行進一步壓縮或限制。僅出於響度匹配目的,本發明在不減小內容之動態範圍的情況下執行此標準化。
在本發明之一較佳實施例中,在參考響度值不存 在於位元串流中的情況下,響度值係預設響度值。此等特徵允許不具有響度元資料之位元串流之高品質播放。
在本發明之一較佳實施例中,預設響度值係設定 為介於-4dB與-10dB之間的值,特定而言,介於-6dB與-8dB之間,該值被稱為全尺度振幅。當代音樂之實驗研究顯示,意欲進行全尺度播放的音樂內容之響度的觀測上限約為-7dB。因此,所主張之預設響度值提供用以播放不具有響度元資料之位元串流的最佳化模式。
在本發明之一較佳實施例中,信號處理器包含一 動態範圍控制設備,其經組配來調整音訊輸出信號之動態範圍,
其中該動態範圍控制設備包含一動態範圍控制開關,其經組配來從響度元資料導出至少一個動態範圍控制值且二者擇一地輸出該等導出的動態範圍控制值中之一者或一預設動態範圍控制值, 其中該動態範圍控制設備包含一動態範圍計算器,其經組配來基於由該動態範圍控制開關輸出之動態範圍控制值且基於一壓縮控制值計算一動態範圍值,該壓縮控制值係由一允許使用者控制該壓縮控制值之使用者介面提供;其中該動態範圍控制設備包含一動態範圍處理器,其經組配來基於該動態範圍值控制該音訊輸出信號之動態範圍。
動態範圍控制設備包含一動態範圍控制開關,其 經組配來將位元串流之響度元資料解碼成使得可導出至少一個動態範圍控制值。動態範圍控制開關通常經組配成使得可導出用於輕度動態範圍控制的一動態範圍控制值以及用於重度動態範圍控制的另一動態範圍控制值。動態範圍控制開關可二者擇一地輸出此等導出的動態範圍控制值中之一者或一預設動態範圍控制值。動態範圍控制開關可受到自動控制,例如取決於使用音訊輸出信號之後續設備,或藉由使用者動作來手動控制。預設動態範圍控制值可設定為例如0dB。
動態範圍控制設備可包含一動態範圍計算器,其 能夠基於由該動態範圍控制開關輸出之動態範圍控制值且基於一壓縮控制值計算一動態範圍值,該壓縮控制值係由一允許使用者控制該壓縮控制值之使用者介面提供。動態範圍計算器特定而言可為乘法器。
此外,動態範圍處理器係預知的,其能夠基於動態範圍值控制音訊輸出信號之動態範圍。藉由此等特徵, 可使位元串流之播放適應於傾聽環境及/或傾聽者的品味。
根據本發明之較佳實施例,信號處理器包含一限 制器設備,其經組配來限制輸出音訊信號之振幅,其中該限制器設備包含一具有一限制器的限制器組件以及一經組配來控制該限制器組件之控制組件,其中一已處理的音訊信號被輸入至該限制器組件,該已處理的音訊信號係從音訊信號藉由至少由增益控制設備加以處理而導出,且其中自該限制器組件輸出該音訊輸出信號。
限制器設備提供用以達成解碼器過衝限幅預防 目的之限制,提供針對聽力損失預防或使用者偏好之音量限制,且在由於傾聽環境或使用者品味而需要時提供藝術壓縮來允許用峰值限制進行內容之可逆產生。
根據本發明之一較佳實施例,控制組件經組配來 取決於位元串流之位元速率來控制限制器組件。當位元速率降低時,解碼器過衝限幅的可能性增加。因此,當取決於位元串流之位元速率來控制限制器組件時,解碼器過衝限幅預防得以增強。
根據本發明之一較佳實施例,控制組件經組配來 取決於音訊解碼器設備之壓縮效率來控制限制器組件。產生位元串流的音訊編碼器設備之壓縮效率以及解碼位元串流的音訊解碼器設備之壓縮效率描述了在編碼原始音訊資料來產生位元串流時,資料品質降低了多少。資料品質降低越多,解碼器過衝限幅的可能性增加。因此,當取決於 音訊解碼器設備之壓縮效率來控制限制器組件時,解碼器過衝限幅預防得以增強。
根據本發明之一較佳實施例,控制組件經組配來 取決於一真峰值來控制限制器組件,該真峰值係在位元串流之響度元資料中加以傳輸且指示由外部編碼器轉換為位元串流之音訊源的最大峰值位準。此真峰值的使用允許為音訊輸出信號之最大可能峰值位準計算一更準確的值。
根據本發明之一較佳實施例,控制組件經組配來 取決於增益控制設備之增益值來控制限制器組件。音訊輸出信號之最大可能峰值位準在此子情況下係由增益控制設備之增益值判定的。若該值為0dB,則解碼器設備按音量控制值之最大設定所要求的以其全尺度限值操作。當該音量控制值減小時,解碼器設備將操作以使得全尺度位元串流值僅達到由增益控制設備之增益值所設定的最大位準。
根據本發明之一較佳實施例,控制組件經組配來 取決於音量限值來控制限制器組件,該音量限值係由使用者或製造商設定以便預防聽力損傷。藉由此等特徵,可有效地避免聽力損傷。
根據本發明之一較佳實施例,控制組件經組配來 取決於藝術限制器參數來控制限制器組件,該等藝術限制器參數係在位元串流之響度元資料中加以傳輸且指示藝術限制器臨界值、藝術限制器啟動時間(attack time)值及/或藝術限制器解除時間(release time)值。此等特徵允許限制器設備之操作受到藝術家或內容創作者之創造性控制。先前所 論述之響度元資料中所含的動態範圍控制值允許經由使用在典型時間常數為100ms至3秒的情況下作用的壓縮增益來使內容之總體動態範圍適應於傾聽環境。在具有挑戰性的傾聽環境中,用此等時間常數來壓縮音訊信號可能不會產生具有足夠響度來獲得可懂度或享受而不具有令人不快的高峰值位準之信號。亦存在以下可能:傳統上僅產生經高度壓縮之「壓扁的(crushed)」混音之音樂創作者可能需要使用本發明之靈活性來產生「壓扁的」混音及具有較少限制及壓縮之「未壓扁的(uncrushed)」混音,以使得消費者在安靜環境中或在需要時可聽到「未壓扁的」版本。
根據本發明之一較佳實施例,控制組件經組配來 持續地或重複地控制限制器組件。此等特徵允許隨著時間的流逝對限制器組件之可變控制。
根據本發明之較佳實施例,限制器設備經組配來 經由旁路設備略過限制器,就增益及延遲而言,該旁路設備之傳遞函數類似於限制器之傳遞函數。藉由此等特徵,可顯著減小信號處理器之工作負載。
本發明之一實施例包括一種系統,該系統包含一解碼器及一編碼器,其中該解碼器係按所主張來設計。
本發明之一實施例包括一種解碼一位元串流以便從該位元串流產生一音訊輸出信號之方法,該位元串流包含音訊資料且任擇地包含含有一參考響度值之響度元資料,該方法包含以下步驟:使用一音訊解碼器設備從該音訊資料重新建構一音訊 信號;以及使用一信號處理器來基於該音訊信號產生該音訊輸出信號;其中使用該信號處理器所包含的一增益控制設備來調整該音訊輸出信號之響度位準;其中藉由該增益控制設備所包含的一參考響度解碼器產生一響度值,其中在該參考響度值存在於該位元串流中的情況下,該響度值係該參考響度值;其中藉由該增益控制設備所包含的一增益計算器基於該響度值且基於一音量控制值計算一增益值,該音量控制值係由一允許使用者控制該音量控制值之使用者介面提供;其中藉由該增益控制設備所包含的一響度處理器基於該增益值控制該音訊輸出信號之響度位準。
本發明之一實施例包括一種電腦程式,其用以在電腦或處理器上運行時執行本文中所主張之方法。
1‧‧‧位元串流
2‧‧‧音訊資料
3‧‧‧響度元資料
4‧‧‧參考響度值
5‧‧‧降混增益值
6‧‧‧輕度動態範圍控制值
7‧‧‧重度動態範圍控制值
8‧‧‧音訊信號
9‧‧‧音訊解碼器設備
10‧‧‧參考響度解碼器
11‧‧‧降混增益解碼器
12‧‧‧動態範圍控制開關
13‧‧‧動態範圍處理器
14‧‧‧動態範圍計算器
15‧‧‧響度處理器
16‧‧‧增益計算器
17‧‧‧靜態目標位準提供器
18‧‧‧音訊輸出信號
19‧‧‧混合音訊信號
20‧‧‧音量控制值
21‧‧‧解碼器設備
22‧‧‧輔助音訊信號
23‧‧‧音訊信號混合器
24‧‧‧經響度調整的輔助音訊信號
25‧‧‧壓縮控制值
26‧‧‧信號處理器
27‧‧‧信號處理器
28‧‧‧增益計算器
29‧‧‧混合音訊信號
30‧‧‧限制器設備
31‧‧‧響度值
32‧‧‧藝術限制器參數
33‧‧‧增益值
34‧‧‧位元速率值
35‧‧‧已處理的音訊信號
36‧‧‧真峰值
37‧‧‧響度值
41‧‧‧解碼器設備
42‧‧‧音訊輸出信號
43‧‧‧預設動態範圍控制值
44‧‧‧動態範圍值
51‧‧‧限制器
52‧‧‧限制器開關
53‧‧‧旁路設備
54‧‧‧限幅預測設備
55‧‧‧比較器
56‧‧‧限幅預測函數
57‧‧‧音量限值
58‧‧‧音量限制開關
59‧‧‧最小值尋找器
60‧‧‧真峰值開關
61‧‧‧組合器
62‧‧‧限制器組件
63‧‧‧控制組件
71‧‧‧組合器
72‧‧‧最小值尋找器
73‧‧‧動態範圍控制開關
74‧‧‧動態範圍控制開關之輸出資料
70a‧‧‧藝術限制器臨界值
70b‧‧‧藝術限制器啟動時間值
70c‧‧‧藝術限制器解除時間值
隨後參考附圖來論述本發明之較佳實施例,其中:圖1展示出諸如ISO/IEC 14496-3及ETSI TS 101 154所規定的具有響度元資料支援之現有先前技術資料壓縮式音訊解碼器之方塊圖,該解碼器係整合於典型行動電話、平板電腦或可攜式媒體播放器中;圖2展示出根據本發明之具有資料壓縮式音訊解碼器 設備及任擇的音訊限制器的解碼器之一實施例,該解碼器適合整合於典型行動電話、平板電腦或可攜式媒體播放器中;圖3展示出AAC-LC立體聲解碼器中由於重新建構之信號波形的過衝所引起之可能的額外限幅對位串流位元速率之按經驗導出的函數;圖4展示出根據本發明之任擇的限制器設備之一較佳實施例的方塊圖;以及圖5展示出根據本發明之任擇的限制器設備之一較佳實施例的方塊圖,該限制器設備在藝術限制模式下操作。
較佳實施例之詳細說明
作為對理解本發明之操作的幫助,圖1中介紹諸如ISO/IEC 14496-3及ETSI TS 101 154所規定的現有先前技術具備元資料致能型資料壓縮式音訊解碼器設備21之操作,該解碼器設備係整合於典型行動電話、平板電腦或可攜式媒體播放器中。壓縮式音訊位元串流1可包括壓縮式音訊本質資料2及響度元資料3。解碼器設備21包含:音訊解碼器設備9,其經組配來從音訊資料2重新建構音訊信號8;以及信號處理器26,其經組配來基於音訊信號8產生音訊輸出信號18。響度元資料3包括整個檔案、節目、歌曲或專輯之總體整合響度的參考響度值4,在ISO/IEC 14496-3中被稱為節目參考位準。此參考響度值4可在位元串流1中加以傳輸,每個檔案傳輸一次,或以足以允許在節目進行的同時加入 廣播位元串流1之重複率加以傳輸。藉由設計為減法器16之增益計算器16將此參考響度值4與由靜態目標位準提供器17提供之固定的解碼器目標位準值進行比較。增益計算器16之輸出係傳入之位元串流1與所需目標位準之間的響度差。將此響度差應用於設計為乘法器15之響度處理器15,以便調整音訊輸出信號18之位準以使得獲得歌曲或節目之目標長期響度。
動態範圍控制開關12允許應用通常在「線路模式」 下使用的輕度動態範圍控制值6或通常在「RF模式」下使用的重度動態範圍控制值7,或根本不應用動態範圍控制值。 此等值6、7係在位元串流1中針對用於多個頻帶或頻區之每一資料壓縮式位元串流訊框加以發送,且被應用於設計為乘法器13之動態範圍處理器13,以便改變音訊解碼器設備9之輸出位準以使得根據所需動態範圍來壓縮音訊輸出信號18之短期(大約幾秒)響度。通常,亦調整由靜態目標位準提供器17提供之解碼器目標位準,其具有以下選擇:針對RF模式之12dB至-20dB及針對線路模式之-31dB。動態範圍控制值6及/或7的運算通常係預先計算出,以使得由乘法器16結合乘法器13之運算所產生的任何位準增加受控制,以使得音訊輸出信號18處的限幅得以預防。
元資料3亦含有降混增益值5,其用來在需要時將 多聲道內容(諸如5.1聲道環繞節目)之聲道混合為立體聲或單聲道輸出。因為本發明可應用於含有任何數目個聲道之位元串流1,所以未進一步論述此特徵。
重要的是,若給定之位元串流1中不存在參考響 度值4,則將參考響度解碼器10所輸出的響度值31設定為等於靜態目標位準提供器17所輸出的解碼器目標位準,以使得音訊輸出信號18中沒有增益調整,且解碼器設備21作為簡單的解碼器設備操作,其輸出範圍等於音訊輸出信號18之全尺度動態範圍。
然後通常將音訊解碼器21之輸出供應至系統音 訊混合器23,在此音訊混合器中將音訊輸出信號18與使用者介面聲音(UI聲音)、振鈴音或其他音訊信號22相結合,以使得產生混合音訊信號19。藉由音量控制值20控制總音量。 音訊信號混合器23之操作可包括次級音量控制,其用以調整每一種類型之音訊信號的相對位準或取決於設備之操作模式來改變音訊信號之振幅,該等次級音量控制與理解本發明之操作無關。重要的是,解碼器設備21之音訊輸出信號18通常經縮放以使得全尺度輸出信號對應於最大固定點或標稱全尺度(通常在-1.0至1.0的範圍內)浮點值。在對當代音樂而言很典型的重度壓縮之音訊資料的情況下,當在標稱傾聽位準上傾聽時,解碼器輸出信號18將具有接近其全尺度值的峰值。因此,當在安靜環境中傾聽時,音訊輸出信號18上的0dB FS(稱為音訊輸出信號之全尺度振幅)全尺度峰值將在系統音訊混合器23中受到衰減,且對應於傾聽者耳朵處的聲壓位準(SPL),可能為75dB SPL。
圖2描繪用以解碼位元串流1以便從位元串流產 生音訊輸出信號42之解碼器設備41,位元串流1包含音訊資 料2且任擇地包含含有參考響度值4之響度元資料3,解碼器設備41包含:音訊解碼器設備9,其經組配來從音訊資料2重新建構音訊信號8;以及信號處理器27,其經組配來基於音訊信號8產生音訊輸出信號42;其中信號處理器27包含增益控制設備10、15、28,其經組配來調整音訊輸出信號42之位準;其中增益控制設備10、15、28包含參考響度解碼器10,其經組配來產生響度值37,其中在參考響度值4存在於位元串流1中的情況下,響度值37係參考響度值4;其中增益控制設備10、15、28包含增益計算器28,其經組配來基於響度值37且基於音量控制值20計算增益值33,該音量控制值20係由允許使用者控制音量控制值20之使用者介面提供;其中增益控制設備10、15、28包含響度處理器28,其經組配來基於增益值33控制音訊輸出信號42之響度。
音訊解碼器設備9可為能夠從壓縮式位元串流1之音訊資料2重新建構音訊信號8之任何設備9。信號處理器37可為能夠在來自音訊解碼器設備9之音訊信號8被饋送至其時產生音訊輸出信號42並且具有如下文所闡述之增益控制設備10、15、28的任何設備37。增益控制設備10、15、28係經設置來控制音訊輸出信號42之響度的設備。
參考響度解碼器10經組配來解碼位元串流1中所 含的響度元資料3。若響度元資料3含有參考響度值4,則參考響度解碼器10正是將此參考響度值4輸出為響度值37。
增益計算器28係用以計算增益值33的設備,該增 益值係基於由參考響度解碼器10輸出之響度值37及由解碼器設備41之使用者設定的音量控制值20。為了設定音量控制值20,可使用任何使用者介面。增益計算器28特定而言可為減法器28。
響度處理器15能夠基於由增益計算器28提供的 增益值33來控制音訊輸出信號42之響度位準。響度處理器15特定而言可為乘法器15。
不同於可攜式設備中或消費者電子設備中所使 用之傳統的壓縮式解碼器設備21(諸如杜比數位或AAC解碼器設備),用可變增益值33或解碼器目標臨界值33(對應於全尺度位元串流之解碼位準)來操作壓縮解碼器設備41,該值受控於使用者之音量控制。此允許解碼器設備41通常在設備之數位音訊系統之最大全尺度範圍以下很好地操作。 此操作避免了限幅解碼器過衝的可能性,且允許不具有重度動態範圍壓縮及限制的電影式內容之響度標準化至具有重度壓縮及限制的音樂內容之響度標準化,而無需如通常所需對電影式內容進行進一步壓縮或限制。僅出於響度匹配目的,本發明在不減小內容之動態範圍的情況下執行此標準化。
在本發明之一較佳實施例中,在參考響度值4不 存在於位元串流1中的情況下,響度值37係預設響度值37。 此等特徵允許不具有響度元資料3之位元串流1之高品質播放。
在本發明之一較佳實施例中,預設響度值37係設 定為介於-4dB與-10dB之間的值,特定而言,介於-6dB與-8dB之間,該值被稱為全尺度振幅。當代音樂之實驗研究顯示,意欲進行全尺度播放的音樂內容之響度的觀測上限約為-7dB。因此,所主張之預設響度值37提供用以播放不具有響度元資料3之位元串流的最佳化模式。
在本發明之一較佳實施例中,信號處理器27包含動態範圍控制設備12、13、14,其經組配來調整音訊輸出信號42之動態範圍,其中動態範圍控制設備12、13、14包含動態範圍控制開關12,其經組配來從響度元資料3導出至少一個動態範圍控制值6、7且二者擇一地輸出導出的動態範圍控制值6、7中之一者或預設動態範圍控制值43,其中動態範圍控制設備12、13、14包含動態範圍計算器14,其經組配來基於由動態範圍控制開關12輸出之動態範圍控制值6、7、43且基於壓縮控制值25計算動態範圍值44,該壓縮控制值25係由允許使用者控制壓縮控制值25之使用者介面提供;其中動態範圍控制設備12、13、14包含動態範圍處理器13,其經組配來基於動態範圍值44控制音訊輸出信號42之動態範圍。
動態範圍控制設備12、13、14包含動態範圍控制 開關12,其經組配來將位元串流1之響度元資料3解碼成使得可導出至少一個動態範圍控制值6、7。動態範圍控制開關12通常經組配成使得可導出用於輕度動態範圍控制的動態範圍控制值6以及用於重度動態範圍控制的另一動態範圍控制值7。動態範圍控制開關12可二者擇一地輸出此等導出的動態範圍控制值6、7中之一者或預設動態範圍控制值43。動態範圍控制開關12可受到自動控制,例如取決於使用音訊輸出信號42之後續設備,或藉由使用者動作來手動控制。預設動態範圍控制值可設定為例如0dB。
動態範圍控制設備12、13、14可包含動態範圍計 算器14,其能夠基於由動態範圍控制開關12輸出之動態範圍控制值6、7、43且基於壓縮控制值25計算動態範圍值44,該壓縮控制值25係由允許使用者控制壓縮控制值25之使用者介面提供。動態範圍計算器14特定而言可為乘法器14。
此外,動態範圍處理器13係預知的,其能夠基於 動態範圍值44控制音訊輸出信號42之動態範圍。藉由此等特徵,可使位元串流1之播放適應於傾聽環境及/或傾聽者的品味。
圖2展示出改良式音訊解碼器41中所含的本發明 之一較佳實施例之操作。傳入之位元串流1由音訊本質資料2及任擇的響度元資料3組成,該響度元資料3含有節目參考位準4、降混增益5、輕度DRC值6及重度DRC值7的前述標準元資料值。元資料3亦可包括在任擇的實施例中使用之藝術限制器參數32及真峰值36。
與先前在圖1中所描述的操作相反,將參考響度 解碼器10所輸出的響度值37與音量控制之音量控制值20進行比較,以使得使用乘法器15將解碼器設備41之音訊輸出信號42調整至所需傾聽位準。然後將該音訊輸出信號41與系統音訊混合器23之經響度調整的輔助音訊信號24相加來形成混合音訊信號29,該混合音訊信號29被發送至設備中的後續音訊後處理功能,或直接發送至數位類比轉換器(DAC)且自DAC發送至揚聲器,或發送至設備的數位輸出端(諸如當設備經由HDMI、MHL、S/PDIF、AES、TosLink、AirPlay或其他有線或無線數位介面標準連接至其他設備時,常常發生此情形)。
重要的是,音訊輸出信號42在本發明中通常並不 以全尺度值來操作。音訊輸出信號42之0dB FS現在對應於在解碼器設備41之情況下有可能的最大聲壓位準,且取決於所連接之耳機、揚聲器或其他換能器,在典型耳機之情況下可能對應於110dB SPL至120dB SPL的範圍。
若給定之位元串流1中不存在值4,則將響度值37 設定為-7dB FS的位準。當代音樂之實驗研究(諸如[5]中)顯示,此響度值係意欲進行全尺度播放的音樂內容之響度的觀測上限。此對音樂創作者及散佈者提供輕微的激勵,以使其製作其內容的不具有重度限制、壓縮或限幅之版本以用於散佈至利用本發明之設備或散佈生態系統,因為其內容隨後將與響度元資料3一起加以散佈,響度元資料3將允許其內容被重現為大聲的或比內容之傳統「壓扁」版本 更大聲。
如同圖1之先前技術解碼器中一樣,動態範圍控 制開關12同樣允許選擇不進行動態範圍修改,或應用輕度動態範圍控制值6或重度動態範圍控制值7。例如,在行動電話中,當電話經由HDMI連接至外部音訊系統時可應用輕度動態範圍控制值6,且當使用頭戴式耳機插孔時可應用重度動態範圍控制值7。然後將此等動態範圍控制值(或靜態預設動態範圍控制值43,若不應用動態範圍控制,則可將其設定為零)饋送至乘法器14,乘法器14根據新的使用者壓縮控制值25來縮放動態範圍控制值,使用者壓縮控制值25在0至1的範圍內變化。壓縮控制值25允許縮放動態範圍控制值6、7、43,以使得可將可變量的動態範圍壓縮應用於音訊輸出信號42而不取決於傾聽位準。壓縮控制值25的值可自解碼器設備41中之使用者介面控制元件獲得,自對應於設備41之模式或其位置或組態的預設值獲得,自解碼器設備41所獲得的周圍噪音的估計獲得,自總音量設定或輸出位準之按經驗獲得的函數獲得,或經由其他手段獲得。
然後將含有經縮放的動態範圍控制值之乘法器 14之輸出44以通常方式應用於乘法器13,其中乘法器13修改音訊解碼器設備9之音訊信號8的響度以便由乘法器15加以進一步修改。由乘法器15輸出(或在其他實施例中由乘法器13輸出)之已處理的音訊信號35被連接至下文所闡述之任擇的實施例之限制器設備30,或直接用作音訊輸出信號42。
熟習此項技術者將理解,在系統音訊混合器23 或減法器28中可能需要對音量控制值20加以偏移或縮放,以使得混合音訊信號29之音量在響度方面與經響度調整的輔助音訊信號24相符。
在用來匹配各種類型之內容之響度的先前方法 中(諸如[5]中),在核心音訊解碼器之後且在應用了動態範圍控制元資料之後於信號鏈中使用限制器,以便在不進行限幅的情況下限制信號峰值且因此增加信號之平均位準。 與簡單地在臨界位準處實行數學飽和之「硬」限制器或限幅器相反,此限制器應以如下方式操作:藉由在信號波形接近或超過臨界值時改變信號增益來以「軟」方式限制信號峰值,從而避免將可聽見的假影引入至信號中。此類軟限制器的計算成本很高,可能佔解碼器設備所引起的工作負載的10%至30%。
相反,本發明不需要用以控制音訊輸出信號42 的峰值與平均值之比來達成響度匹配目的之限制器,而是可包括任擇的限制器設備30,其用以達成以下目的:進行保護以對抗限幅、進行限制來避免聽力損傷,以及進行限制來獲得藝術效果或壓縮增加。特定解碼器設備41可配備有限制器設備30來達成此等目的中之任一者或全部,其具有變化的實行成本,或可直接省略限制器設備30。下文闡述此等情況中之每一者。
考慮到限幅保護,必須考慮信號之兩種子情況。 一些位元串流1可能不含任何元資料3,諸如已經存在於使 用者的設備上之舊有音樂內容,其未經分析來得到響度或動態範圍。在此子情況下,乘法器13不在使用中,且乘法器15在最高音量控制設定下提供最大均一增益。因此,限幅的唯一可能係信號波形中資料壓縮所致的過衝之可能性。 在普通信號之情況下可能的可能過衝的量可針對壓縮編碼解碼器在可信區間內按經驗判定為每聲道每樣本之位元數或壓縮比之類似量度的函數。針對AAC LC立體聲位元串流之典型按經驗判定值限幅預測函數56展示於圖3中。熟習此項技術者應理解,可使用其他方法(經驗法、分析法或迭代法)來判定或預測可能存在的限幅的量。
根據圖4及圖5所示的本發明之較佳實施例,信號 處理器27包含限制器設備30,其經組配來限制輸出音訊信號42之振幅,其中限制器設備30包含具有限制器51的限制器組件62以及經組配來控制限制器組件62之控制組件63,其中已處理的音訊信號35被輸入至限制器組件62,該已處理的音訊信號係從音訊信號8藉由至少由增益控制設備10、15、28加以處理而導出,且其中自限制器組件62輸出音訊輸出信號42。
限制器設備30提供用以達成解碼器過衝限幅預防目的之限制,提供針對聽力損失預防或使用者偏好之音量限制,且在由於傾聽環境或使用者品味而需要時提供藝術壓縮來允許用峰值限制進行內容之可逆產生。
限制器51受控於內部信號或所供應的峰值位準或藝術元資料,其提供用以達成解碼器過衝限幅預防目的 之限制,提供針對聽力損失預防或使用者偏好之音量限制,且在由於傾聽環境或使用者品味而需要時提供藝術壓縮來允許用峰值限制進行內容之可逆產生。
限制器51理想地為有效的非限幅式預見性限制 器,諸如常用於數位音訊母帶後期處理且係熟習此項技術者已知的。例如,其可為諸如[8]中所描述之實行方案。或者,若限幅保護並非所需特徵,而音量限制係所需特徵,則可替代具有由58之輸出所設定的臨界值之硬限幅器,且可移除或縮短補償緩衝器53。
根據圖4所示的本發明之較佳實施例,控制組件 63經組配來取決於位元串流1之位元速率來控制限制器組件62。當位元速率降低時,解碼器過衝限幅的可能性增加。 因此,當取決於位元串流1之位元速率來控制限制器組件62時,解碼器過衝限幅預防得以增強。
在此任擇的特徵之較佳實施例中,由音訊解碼器 設備9解碼的位元串流1之位元速率值34被輸入至限幅預測設備54中,限幅預測設備54包含限幅預測函數56,該函數係在邏輯敘述或邏輯閘中實行為查找表,或藉由將為熟習此項技術者所已知的實行至少一個變數之函數的其他技術來實行。經由類似地實行之最小函數59將函數56之輸出饋送至比較器55,該最小函數選擇其兩個輸入中之較小者。 此處認為下文所描述之音量限制特徵不在使用中,且開關58輸出對應於0dB FS(全尺度)的值,因此最小函數59總是由限幅預測函數56之輸出來控制。以此方式,比較器55將 限幅保護函數56之輸出與已處理的音訊信號35之最大可能峰值位準進行比較,來判定是否有必要經由限制器開關52接合限制器51來進行保護以對抗音訊輸出信號42處的限幅。
根據本發明之較佳實施例,控制組件經組配來取 決於音訊解碼器設備9之壓縮效率來控制限制器組件62。產生位元串流的音訊編碼器設備之壓縮效率以及解碼位元串流1的音訊解碼器設備9之壓縮效率描述了在編碼原始音訊資料來產生位元串流1時,資料品質降低了多少。資料品質降低越多,解碼器過衝限幅的可能性增加。因此,當取決於音訊解碼器設備9之壓縮效率來控制限制器組件62時,解碼器過衝限幅預防得以增強。
在此任擇的特徵之較佳實施例中,音訊解碼器設 備9之壓縮效率被輸入至限幅預測設備54中,限幅預測設備54包含限幅預測函數56,該函數係在邏輯敘述或邏輯閘中實行為查找表,或藉由將為熟習此項技術者所已知的實行至少一個變數之函數的其他技術來實行。經由類似地實行之最小函數59將函數56之輸出饋送至比較器55,該最小函數選擇其兩個輸入中之較小者。此處認為下文所描述之音量限制特徵不在使用中,且開關58輸出對應於0dB FS(全尺度)的值,因此最小函數59總是由限幅預測函數56之輸出來控制。以此方式,比較器55將限幅保護函數56之輸出與已處理的音訊信號35之最大可能峰值位準進行比較,來判定是否有必要經由限制器開關52接合限制器51來進行保護 以對抗音訊輸出信號42處的限幅。
在已處理的核心解碼器輸出信號35之最大位準 小於由限幅預測函數56預測之位準的情況下,不存在由於解碼器過衝所引起的限幅之可能性(在函數54之可信區間或誤差界內),且開關52選擇補償緩衝器53之輸出。該緩衝器僅為用來與限制器51之處理延遲相匹配的延遲,且將引入與限制器51之顯著工作負載相比而言僅為可忽略的計算工作負載。
根據本發明之較佳實施例,控制組件63經組配來 取決於增益控制設備10、15、28之增益值33來控制限制器組件62。音訊輸出信號42之最大可能峰值位準在此子情況下係由增益控制設備10、15、28之增益值33判定的。若該值為0dB,則解碼器設備41按音量控制值20之最大設定所要求的以其全尺度限值操作。當該音量控制值20減小時,解碼器設備41將操作以使得全尺度位元串流值僅達到由10、15、28之增益值33所設定的最大位準。
在不存在元資料3的此子情況下,開關60輸出0 dB FS值,因為此係位元串流1之傳入音訊資料2中可能的最大值。
根據本發明之較佳實施例,控制組件63經組配來 取決於真峰值36來控制限制器組件62,該真峰值係在位元串流1之響度元資料3中加以傳輸且指示由外部編碼器轉換為位元串流1之音訊源的最大峰值位準。此真峰值36的使用允許為音訊輸出信號42之最大可能峰值位準計算更準確的 值。
在位元串流含有響度元資料3的情況下,可規定 元資料3亦包括由ITU標準BS.1770-3所規定之真峰值量測結果。在此子情況下,開關60選擇響度元資料3中所含的真峰值36,而不是0dB FS常數。藉由加法器61計算增益調整33與真峰值36之總和,該總和指示限制器30之信號輸入35的最大峰值振幅,且然後藉由比較器55將該總和與限幅函數56之輸出進行比較。此真峰值元資料值36的使用僅允許為音訊輸出信號41之最大可能峰值位準計算更準確的值。
根據本發明之較佳實施例,控制組件63經組配來 取決於音量限值57來控制限制器組件62,該音量限值係由使用者或製造商設定以便預防聽力損傷。藉由此等特徵,可有效地避免聽力損傷。
在進行限制來避免聽力損傷的情況下,設備使用 者或製造商可使用音量限制信號來設定最大峰值位準57,輸出必須被限於該最大峰值位準。當開關58被扳轉來啟動此音量限制特徵時,最小函數59選擇兩個輸出位準中之較低者,其係接合限制器51以用於限制輸出(由於限幅預防)或用於音量限制所需的。開關58之輸出亦被輸入至限制器51,以便將其臨界值設定為適當位準。
根據圖5所示的本發明之較佳實施例,控制組件 63經組配來取決於藝術限制器參數32來控制限制器組件62,該等藝術限制器參數係在位元串流1之響度元資料3中加以傳輸且指示藝術限制器臨界值74a、藝術限制器啟動時間值 74b及/或藝術限制器解除時間值74c。此等特徵允許限制器設備30之操作受到藝術家或內容創作者之創造性控制。先前所論述之響度元資料3中所含的動態範圍控制值6、7允許經由使用在典型時間常數為100ms至3秒的情況下作用的壓縮增益來使內容之總體動態範圍適應於傾聽環境。在具有挑戰性的傾聽環境中,用此等時間常數來壓縮音訊信號可能不會產生具有足夠響度來獲得可懂度或享受而不具有令人不快的高峰值位準之信號。亦存在以下可能:傳統上僅產生經高度壓縮之「壓扁的」混音之音樂創作者可能需要使用本發明之靈活性來產生「壓扁的」混音及具有較少限制及壓縮之「未壓扁的」混音,以使得消費者在安靜環境中或在需要時可聽到「未壓扁的」版本。
為解決此等兩個擔憂,限制器30可經重新組配來在藝術限制器模式下操作,如圖5所示。
在此模式下,響度元資料3包括針對內容之每一音訊訊框所發送的藝術限制器參數32,其在圖5中以電匯流排標記法展示。32中含有針對輕度模式及重度模式之限制器啟動時間、解除時間及臨界值,其係由開關12選擇且由對應聯動開關73選擇來輸出匯流排74。匯流排74含有:所選的藝術限制器臨界值74a,藉由加法器71將其與解碼器增益調整33相加;以及所需的啟動時間74b及解除時間74c,其被直接供應至限制器51。最小函數72係用來選擇音量限值57(或在未使用音量限值的情況下,0dB FS)或加法器71之輸出。以此方式,限制器51通常以受控於值74a的臨界值 操作,直至音量控制20增加至音量限值已達到並且限制該限制器臨界值之最大位準的點。在此模式下,限制器51持續地操作,且開關52總是在所示位置中。在混音、母帶後期處理或其他創造性操作或散佈操作期間,可藉由監視以下各者的輸出來達成此等參數之藝術用途:設備、音訊軟體外掛程式,或含有本發明之複本的其他裝置。
根據本發明之較佳實施例,不可能在限制器設備 30之後應用補償增益(makeup-gain)來人工地增加其響度,因為此操作將移除上文所提及之輕微激勵。
根據本發明之較佳實施例,控制組件63經組配來 持續地或重複地控制限制器組件62。此等特徵允許隨著時間的流逝對限制器組件62之可變控制。
根據本發明之較佳實施例,限制器設備30經組配 來經由旁路設備53略過限制器51,就增益及延遲而言,該旁路設備之傳遞函數類似於限制器51之傳遞函數。藉由此等特徵,可顯著減小信號處理器27之工作負載。
熟習此項技術者將理解,此過程可在軟體中實行 為一系列電腦指令或在硬體組件中實行。此處所描述的操作通常係藉由電腦CPU或數位信號處理器作為軟體指令來執行,且圖中所示的暫存器及操作可藉由對應的電腦指令來實行。然而,此並不排除等效硬體設計中使用硬體組件的實施例。熟習此項技術者亦將理解,值4、6、7、20、33、36、57、74a及其他值通常將在對數尺度的域中表達,此係標準做法且係在所參考之標準中規定的。此外,本發明之 操作在此處係以循序的基本方式加以展示。熟習此項技術者將理解,該等操作在特定硬體或軟體平台上實行時可加以組合、變換或預先計算以便使效率最佳化。熟習此項技術者亦將理解,此等操作可在時域資料上執行,或可在頻域中的一或多個頻帶中執行。
在改良式解碼器41設備之建構中,熟習此項技術 者將認識到,將有必要使用數值表示、暫存器長度或其他常規手段來在信號路徑中以及本發明之別處避免內部飽和、限幅或溢位,該信號路徑係自音訊解碼器9至乘法器13及15,及任擇的限制器設備30至音訊輸出信號42。
應進一步瞭解,雖然本發明提供了在諸如AAC、 MP3或杜比數位之有損耗音訊資料壓縮編碼解碼器中控制由解碼器過衝所產生的限幅之特定優點,但本發明亦可用於具有無損耗音訊編碼解碼器或具有根本未由音訊編碼解碼器加以壓縮之音訊信號的音訊系統中。
本發明可提供:
1.一種用於音訊響度標準化的系統,其提供一輸出,該輸出的全尺度值意欲對應於一合併設備之最大峰值輸出電壓或聲壓位準,其中該輸出的響度位準或平均功率係直接或間接受控於該設備之使用者音量控制,以使得具有音訊響度元資料之內容及不具有音訊響度元資料但已標準化為其全尺度值之內容幾乎係在相同的音訊響度位準得以重現。
2.一種系統,其中不具有音訊響度元資料之內 容的長期平均功率或感知響度係藉由一固定值來估計,該固定值係藉由對內容之經驗分析或統計分析來判定的。
3.一種系統,其中該估計經偏壓來以比具有適 當準備之元資料之相同內容略低的響度來重現不具有音訊響度元資料之典型內容,從而對使用該元資料提供激勵。
4.一種用於資料壓縮式音訊解碼之系統,其含 有一輸出峰值限制器,其中對峰值限制的需要係藉由壓縮音訊解碼器之目標位準以及音訊編碼解碼器壓縮效率或位元速率的計算出之函數來判定,該峰值限制係用以達成預防對解碼器過衝的限幅之目的。
5.一種用於資料壓縮式音訊解碼之系統,其含 有一輸出峰值限制器,其中對峰值限制的需要係藉由壓縮音訊解碼器之目標位準、音訊編碼解碼器壓縮效率或位元速率的計算出之函數以及在壓縮位元串流中傳輸的指示音訊節目之最大峰值位準之元資料值來判定,該峰值限制係用以達成預防對解碼器過衝的限幅之目的。
6.一種用於資料壓縮式音訊解碼之系統,其含 有一輸出峰值限制器,其中對峰值限制的需要係藉由壓縮音訊解碼器之目標位準來判定,該峰值限制係用以達成限制設備之最大峰值音訊輸出之目的。
7.一種用於資料壓縮式音訊解碼或音訊處理之 系統,其含有一輸出峰值限制器,其中對峰值限制的需要係藉由應用於音訊信號之縮放增益的值來判定,該峰值限制係用以達成限制設備之最大峰值音訊輸出之目的。
8.一種用於資料壓縮式音訊解碼或音訊處理之 系統,其含有一輸出峰值限制器,其中對峰值限制的需要係藉由應用於音訊信號之縮放增益的值以及在壓縮式位元串流中傳輸的指示音訊節目之最大峰值位準之元資料值來判定,該峰值限制係用以達成限制設備之最大峰值音訊輸出之目的。
9.一種系統,其中在不需要限制時,用具有類 似增益及延遲的函數替換該限制器。
10.一種用於資料壓縮式音訊解碼或音訊處理之 系統,其含有一輸出峰值限制器,其中峰值限制器臨界值係由在壓縮式位元串流中傳輸的元資料值來控制或在週期性基礎上加以控制。
11.一種用於音訊響度標準化之對應的方法或非 暫時性儲存器,其提供一輸出,該輸出的全尺度值意欲對應於一合併設備之最大峰值輸出電壓或聲壓位準,其中該輸出的響度位準或平均功率係直接或間接受控於該設備之使用者音量控制,以使得具有音訊響度元資料之內容及不具有音訊響度元資料但已標準化為其全尺度值之內容幾乎係在相同的音訊響度位準得以重現。
雖然已就裝置之情境來描述一些態樣,但顯然此 等態樣亦表示對應的方法之描述,其中方塊或設備對應於方法步驟或方法步驟之特徵。類似地,就方法步驟之情境所描述的態樣亦表示對應的方塊或對應的裝置的項目或特徵之描述。該等方法步驟中之一些或全部可藉由(或使用) 例如為微處理器、可規劃電腦或電子電路之硬體裝置來執行。在一些實施例中,最重要的方法步驟中之某一或多者可藉由此裝置來執行。
取決於特定的實行方案要求,本發明之實施例可 在硬體或軟體中實行。可使用儲存有電子可讀控制信號的非暫時性儲存媒體來執行實行方案,非暫時性儲存媒體諸如數位儲存媒體,例如軟碟、DVD、藍光碟、CD、ROM、PROM及EPROM、EEPROM或快閃記憶體,該等電子可讀控制信號與可規劃電腦系統合作(或能夠與可規劃電腦系統合作)以使得各別方法得以執行。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含一種具有電子可 讀控制信號的資料載體,該等電子可讀控制信號能夠與可規劃電腦系統合作以使得本文中所描述之方法中之一者得以執行。
一般而言,本發明之實施例可實行為一種具有程 式碼的電腦程式產品,當該電腦程式產品在電腦上運行時,該程式碼可操作來執行該等方法中之一者。該程式碼可例如儲存於機器可讀載體上。
其他實施例包含用以執行本文中所描述之方法中之一者的電腦程式,其儲存於機器可讀載體上。
換言之,本發明之方法之一實施例因此係一種具有程式碼的電腦程式,當該電腦程式在電腦上運行時,該程式碼用以執行本文中所描述之方法中之一者。
本發明之方法之另一實施例因此係一種資料載 體(或數位儲存媒體或電腦可讀媒體),其包含記錄於其上的用以執行本文中所描述之方法中之一者的電腦程式。資料載體、數位儲存媒體或記錄媒體通常為有形的及/或非暫時性的。
本發明之方法之另一實施例因此係一種資料串 流或一種信號序列,其表示用以執行本文中所描述之方法中之一者的電腦程式。該資料串流或該信號序列可例如經組配來經由資料通訊連接(例如經由網際網路)加以傳遞。
另一實施例包含一種處理構件,例如電腦或可規 劃邏輯設備,其經組配來執行或適於執行本文中所描述之方法中之一者。
另一實施例包含一種電腦,其上安裝有用以執行 本文中所描述之方法中之一者的電腦程式。
根據本發明之另一實施例包含一種裝置或一種 系統,其經組配來將用以執行本文中所描述之方法中之一者的電腦程式傳遞(例如,電子地或光學地)至一接收器。該接收器可例如為電腦、行動設備、記憶體設備或類似物。 該裝置或系統可例如包含一用以將電腦程式傳遞至接收器之檔案伺服器。
在一些實施例中,可規劃邏輯設備(例如場可規 劃閘陣列)可用來執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可規劃閘陣列可與微處理器合作以便執行本文中所描述之方法中之一者。一般而 言,較佳藉由任何硬體裝置來執行該等方法。
上述實施例僅例示出本發明之原理。應理解,本文中所描述之配置及細節的修改及變化對熟習此項技術者而言將顯而易見。因此,意欲僅受以下申請專利範圍之範疇限制,而不受本文中經由對實施例之描述及闡釋所呈現的特定細節限制。
參考文獻
[1] International Organization for Standardization and International Electrotechnical Commission, ISO/IEC 14496-3 Information technology - Coding of audio-visual objects - Part 3: Audio, www.iso.org.
[2] European Telecommunications Standards Institute, ETSI TS 101 154: Digital Video Broadcasting (DVB); Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 transport stream, www.etsi.org.
[3] Advanced Television Systems Committee, Inc., Audio Compression Standard A/52, www.atsc.org.
[4] International Telecommunications Union, Recommendation ITU-R BS.1770-3: Algorithms to measure audio programme loudness and true-peak audio level, www.itu.int.
[5] Martin Wolters, Harald Mundt, and Jeffrey Riedmiller, 「Loudness Normalization In The Age Of Portable Media Players」, paper 8044, Audio Engineering Society 128th Convention, www.aes.org
[6] Florian Camerer, et al, 「Loudness Normalization: The Future of File-Based Playback,」 Music Loudness Alliance, www.music-loudness.com.
[7] Dolby Laboratories, Inc., Dolby Digital Professional Encoding Guidelines, www.dolby.com.
[8] Perttu Hamalainen, 「Smoothing Of The Control Signal Without Clipped Output In Digital Peak Limiters」, Proc. of the 5th International Conference on Digital Audio Effects, Hamburg, Germany, September 26-28, 2002.
1‧‧‧位元串流
2‧‧‧音訊資料
3‧‧‧響度元資料
4‧‧‧參考響度值
5‧‧‧降混增益值
6‧‧‧輕度動態範圍控制值
7‧‧‧重度動態範圍控制值
8‧‧‧音訊信號
9‧‧‧音訊解碼器設備
10‧‧‧參考響度解碼器
11‧‧‧降混增益解碼器
12‧‧‧動態範圍控制開關
13‧‧‧動態範圍處理器
14‧‧‧動態範圍計算器
15‧‧‧響度處理器
20‧‧‧音量控制值
22‧‧‧輔助音訊信號
23‧‧‧音訊信號混合器
24‧‧‧經響度調整的輔助音訊信號
25‧‧‧壓縮控制值
27‧‧‧信號處理器
28‧‧‧增益計算器
29‧‧‧混合音訊信號
30‧‧‧限制器設備
32‧‧‧藝術限制器參數
33‧‧‧增益值
34‧‧‧位元速率值
35‧‧‧已處理的音訊信號
36‧‧‧真峰值
37‧‧‧響度值
41‧‧‧解碼器設備
42‧‧‧音訊輸出信號
43‧‧‧預設動態範圍控制值
44‧‧‧動態範圍值

Claims (16)

  1. 一種用以解碼一位元串流以便從該位元串流產生一音訊輸出信號之解碼器設備,該位元串流包含音訊資料且任擇地包含含有一參考響度值之響度元資料,該解碼器設備包含:一音訊解碼器設備,其經組配來從該音訊資料重新建構一音訊信號;以及一信號處理器,其經組配來基於該音訊信號產生該音訊輸出信號;其中該信號處理器包含一增益控制設備,其經組配來調整該音訊輸出信號之一響度位準;其中該增益控制設備包含一參考響度解碼器,其經組配來產生一響度值,其中在該參考響度值存在於該位元串流中的情況下,該響度值係該參考響度值;其中該增益控制設備包含一增益計算器,其經組配來基於該響度值且基於一音量控制值計算一增益值,該音量控制值係由一允許一使用者控制該音量控制值之使用者介面提供;其中該增益控制設備包含一響度處理器,其經組配來基於該增益值控制該音訊輸出信號之該響度位準。
  2. 如前一請求項之解碼器設備,其中在該參考響度值不存在於該位元串流中的情況下,該響度值係一預設響度值。
  3. 如前一請求項之解碼器設備,其中該預設響度值係設定為介於-4dB與-10dB之間的一值,特定而言,介於-6dB與-8dB之間,該值被稱為一全尺度振幅。
  4. 如前述請求項中之一項之解碼器設備,其中該信號處理器包含一動態範圍控制設備,其經組配來調整該音訊輸出信號之一動態範圍,其中該動態範圍控制設備包含一動態範圍控制開關,其經組配來從該響度元資料導出至少一個動態範圍控制值且二者擇一地輸出該等導出的動態範圍控制值中之一者或一預設動態範圍控制值,其中該動態範圍控制設備包含一動態範圍計算器,其經組配來基於由該動態範圍控制開關輸出之該動態範圍控制值且基於一壓縮控制值計算一動態範圍值,該壓縮控制值係由一允許一使用者控制該壓縮控制值之使用者介面提供;其中該動態範圍控制設備包含一動態範圍處理器,其經組配來基於該動態範圍值控制該音訊輸出信號之該動態範圍。
  5. 如前述請求項中之一項之解碼器設備,其中該信號處理器包含一限制器設備,其經組配來限制該輸出音訊信號之一振幅,其中該限制器設備包含一具有一限制器的限制器組件以及一經組配來控制該限制器組件之控制組件,其中一已處理的音訊信號被輸入至該限制器組件,該已處理的音訊信號係從該音訊信號藉由至少由該增 益控制設備加以處理而導出,且其中自該限制器組件出該音訊輸出信號。
  6. 如前一請求項之解碼器設備,其中該控制組件經組配來取決於該位元串流之一位元速率來控制該限制器組件。
  7. 如請求項5或6之解碼器設備,其中該控制組件經組配來取決於該音訊解碼器設備之一壓縮效率來控制該限制器組件。
  8. 如請求項5至7中之一項之解碼器設備,其中該控制組件經組配來取決於一真峰值來控制該限制器組件,該真峰值係在該位元串流之該響度元資料中加以傳輸且指示由一外部編碼器轉換為該位元串流之一音訊源的一最大峰值位準。
  9. 如請求項5至8中之一項之解碼器設備,其中該控制組件經組配來取決於該增益控制設備之該增益值來控制該限制器組件。
  10. 如請求項5至9中之一項之解碼器設備,其中該控制組件經組配來取決於一音量限值來控制該限制器組件,該音量限值係由該使用者或製造商設定以便預防聽力損傷。
  11. 如請求項5至10中之一項之解碼器設備,其中該控制組件經組配來取決於藝術限制器參數來控制該限制器組件,該等藝術限制器參數係在該位元串流之該響度元資料中加以傳輸且指示藝術限制器臨界值、藝術限制器啟 動時間值及/或藝術限制器解除時間值。
  12. 如請求項5至11中之一項之解碼器設備,其中該控制組件經組配來持續地或重複地控制該限制器組件。
  13. 如請求項5至12中之一項之解碼器設備,其中該限制器設備經組配來經由一旁路設備略過該限制器,就一增益及一延遲而言,該旁路設備之一傳遞函數類似於該限制器之一傳遞函數。
  14. 一種系統,其包含一解碼器設備及一編碼器,其中該解碼器設備係根據請求項1至13中之一項來設計。
  15. 一種用以解碼一位元串流以便從該位元串流產生一音訊輸出信號之方法,該位元串流包含音訊資料且任擇地包含含有一參考響度值之響度元資料,該方法包含以下步驟:使用一音訊解碼器設備從該音訊資料重新建構一音訊信號;以及使用一信號處理器基於該音訊信號產生該音訊輸出信號;其中使用該信號處理器所包含的一增益控制設備來調整該音訊輸出信號之一響度位準;其中藉由該增益控制設備所包含的一參考響度解碼器產生一響度值,其中在該參考響度值存在於該位元串流中的情況下,該響度值係該參考響度值;其中藉由該增益控制設備所包含的一增益計算器基於該響度值且基於一音量控制值計算一增益值,該音 量控制值係由一允許一使用者控制該音量控制值之使用者介面提供;其中藉由該增益控制設備所包含的一響度處理器基於該增益值來控制該音訊輸出信號之該響度位準。
  16. 一種電腦程式,當在一電腦或一處理器上運行時,該電腦程式用以執行如請求項15之方法。
TW103103168A 2013-01-28 2014-01-28 用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置 TWI524330B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361757606P 2013-01-28 2013-01-28
PCT/EP2014/051484 WO2014114781A1 (en) 2013-01-28 2014-01-27 Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices

Publications (2)

Publication Number Publication Date
TW201438003A true TW201438003A (zh) 2014-10-01
TWI524330B TWI524330B (zh) 2016-03-01

Family

ID=50002749

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103103168A TWI524330B (zh) 2013-01-28 2014-01-28 用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置

Country Status (13)

Country Link
US (1) US9576585B2 (zh)
EP (1) EP2948947B1 (zh)
JP (1) JP6445460B2 (zh)
KR (1) KR101849612B1 (zh)
CN (2) CN105190750B (zh)
AR (1) AR096574A1 (zh)
BR (6) BR122021011658B1 (zh)
CA (1) CA2898567C (zh)
ES (1) ES2628153T3 (zh)
MX (1) MX351187B (zh)
RU (1) RU2639663C2 (zh)
TW (1) TWI524330B (zh)
WO (1) WO2014114781A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360575A (zh) * 2015-03-13 2019-02-19 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
US10394520B2 (en) 2015-06-17 2019-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US10630254B2 (en) 2016-10-07 2020-04-21 Sony Corporation Information processing device and information processing method
TWI732403B (zh) * 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
JP6174129B2 (ja) 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
UA122050C2 (uk) 2013-01-21 2020-09-10 Долбі Лабораторіс Лайсензін Корпорейшн Аудіокодер і аудіодекодер з метаданими гучності та границі програми
KR102660144B1 (ko) 2013-01-21 2024-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
CN110083714B (zh) 2013-04-05 2024-02-13 杜比实验室特许公司 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CN109785851B (zh) 2013-09-12 2023-12-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
WO2016039150A1 (ja) * 2014-09-08 2016-03-17 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN113257274A (zh) 2014-10-01 2021-08-13 杜比国际公司 高效drc配置文件传输
WO2016057530A1 (en) 2014-10-10 2016-04-14 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
TWI631835B (zh) * 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US9837086B2 (en) * 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
CN106354469B (zh) * 2016-08-24 2019-08-09 北京奇艺世纪科技有限公司 一种响度调节方法及装置
EP3389183A1 (en) 2017-04-13 2018-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an input audio signal and corresponding method
WO2019161191A1 (en) * 2018-02-15 2019-08-22 Dolby Laboratories Licensing Corporation Loudness control methods and devices
US11282533B2 (en) * 2018-09-28 2022-03-22 Dolby Laboratories Licensing Corporation Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model
CN109217834B (zh) * 2018-10-19 2022-06-21 歌尔科技有限公司 增益调整方法、音频设备及可读存储介质
WO2020123424A1 (en) * 2018-12-13 2020-06-18 Dolby Laboratories Licensing Corporation Dual-ended media intelligence
WO2020185927A1 (en) * 2019-03-12 2020-09-17 Whelen Engineering Company, Inc. Volume scaling and synchronization of tones
US11517815B2 (en) * 2019-08-19 2022-12-06 Cirrus Logic, Inc. System and method for use in haptic signal generation
WO2021039189A1 (ja) * 2019-08-30 2021-03-04 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
KR102508413B1 (ko) * 2019-11-01 2023-03-10 가우디오랩 주식회사 주파수 스펙트럼 보정을 위한 오디오 신호 처리 방법 및 장치
WO2021195429A1 (en) * 2020-03-27 2021-09-30 Dolby Laboratories Licensing Corporation Automatic leveling of speech content
US11907611B2 (en) 2020-11-10 2024-02-20 Apple Inc. Deferred loudness adjustment for dynamic range control
CN112951266B (zh) * 2021-02-05 2024-02-06 杭州网易云音乐科技有限公司 齿音调整方法、装置、电子设备及计算机可读存储介质
WO2022271187A1 (en) * 2021-06-25 2022-12-29 Hewlett-Packard Development Company, L.P. Electronic device audio adjustment

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040199933A1 (en) * 2003-04-04 2004-10-07 Michael Ficco System and method for volume equalization in channel receivable in a settop box adapted for use with television
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
RU2406166C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
CN101267189A (zh) * 2008-04-16 2008-09-17 深圳华为通信技术有限公司 音量自动调节装置、方法以及移动终端
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8284959B2 (en) * 2008-07-29 2012-10-09 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
JP5603339B2 (ja) * 2008-10-29 2014-10-08 ドルビー インターナショナル アーベー 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI529703B (zh) * 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
JP6185457B2 (ja) * 2011-04-28 2017-08-23 ドルビー・インターナショナル・アーベー 効率的なコンテンツ分類及びラウドネス推定
US8848932B2 (en) * 2011-10-13 2014-09-30 Blackberry Limited Proximity sensing for user detection and automatic volume regulation with sensor interruption override
KR102660144B1 (ko) * 2013-01-21 2024-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461452B (zh) * 2015-03-13 2023-04-07 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
TWI732403B (zh) * 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US11842743B2 (en) 2015-03-13 2023-12-12 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
CN109360575B (zh) * 2015-03-13 2023-06-27 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
US11367455B2 (en) 2015-03-13 2022-06-21 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10943595B2 (en) 2015-03-13 2021-03-09 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
CN109461452A (zh) * 2015-03-13 2019-03-12 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US11664038B2 (en) 2015-03-13 2023-05-30 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
CN109360575A (zh) * 2015-03-13 2019-02-19 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
TWI771266B (zh) * 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US11417350B2 (en) 2015-03-13 2022-08-16 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11379178B2 (en) 2015-06-17 2022-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US10838687B2 (en) 2015-06-17 2020-11-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US10394520B2 (en) 2015-06-17 2019-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US10630254B2 (en) 2016-10-07 2020-04-21 Sony Corporation Information processing device and information processing method

Also Published As

Publication number Publication date
MX351187B (es) 2017-10-04
KR101849612B1 (ko) 2018-04-18
AR096574A1 (es) 2016-01-20
ES2628153T3 (es) 2017-08-01
BR122022020276A8 (pt) 2022-11-29
CN105190750A (zh) 2015-12-23
MX2015009534A (es) 2015-10-30
WO2014114781A1 (en) 2014-07-31
CN110853660A (zh) 2020-02-28
BR122022020284A8 (pt) 2022-11-29
BR122022020319A8 (pt) 2022-11-29
CA2898567A1 (en) 2014-07-31
US9576585B2 (en) 2017-02-21
BR122022020284B1 (pt) 2023-02-28
CN105190750B (zh) 2019-10-25
JP2016509693A (ja) 2016-03-31
TWI524330B (zh) 2016-03-01
KR20150109418A (ko) 2015-10-01
RU2015136531A (ru) 2017-03-07
RU2639663C2 (ru) 2017-12-21
BR122022020326A2 (zh) 2017-08-22
EP2948947B1 (en) 2017-03-29
BR122022020319A2 (zh) 2017-08-22
BR122022020319B1 (pt) 2023-02-28
BR122021011658B1 (pt) 2023-02-07
CA2898567C (en) 2018-09-18
EP2948947A1 (en) 2015-12-02
BR122022020284A2 (zh) 2017-08-22
BR122022020276B1 (pt) 2023-02-23
BR122022020326B1 (pt) 2023-03-14
CN110853660B (zh) 2024-01-23
BR122022020276A2 (zh) 2017-08-22
BR112015017295A2 (pt) 2020-10-20
JP6445460B2 (ja) 2018-12-26
BR122022020326A8 (pt) 2022-11-29
BR112015017295B1 (pt) 2023-01-24
US20150332685A1 (en) 2015-11-19

Similar Documents

Publication Publication Date Title
TWI524330B (zh) 用於新媒體設備上之具有及不具有嵌入式響度元資料之媒體之標準化音訊播放的方法及裝置
US10276173B2 (en) Encoded audio extended metadata-based dynamic range control
JP5695677B2 (ja) 単一再生モードにおいてラウドネス測定値を合成するシステム
EP2840712B1 (en) Loudness level control for audio reception and decoding equipment
CN106796799B (zh) 高效drc配置文件传输