TW201443886A - 用於響度及動態範圍控制之後設資料 - Google Patents
用於響度及動態範圍控制之後設資料 Download PDFInfo
- Publication number
- TW201443886A TW201443886A TW103111835A TW103111835A TW201443886A TW 201443886 A TW201443886 A TW 201443886A TW 103111835 A TW103111835 A TW 103111835A TW 103111835 A TW103111835 A TW 103111835A TW 201443886 A TW201443886 A TW 201443886A
- Authority
- TW
- Taiwan
- Prior art keywords
- drc
- audio signal
- audio
- loudness
- signal
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 204
- 238000010606 normalization Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims description 42
- 238000005259 measurement Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 23
- 230000003750 conditioning effect Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 230000002596 correlated effect Effects 0.000 claims 1
- 101100031387 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) drc-1 gene Proteins 0.000 description 17
- 238000007906 compression Methods 0.000 description 17
- 230000006835 compression Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000009467 reduction Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Abstract
將一音訊正規化增益值應用於一音訊信號以產生一正規化信號。處理該正規化信號以根據若干預定義動態範圍控制(DRC)特性中之一選定DRC特性來計算DRC增益值。編碼該音訊信號,且提供該等DRC增益值作為與該經編碼音訊信號相關聯之後設資料。亦描述及主張若干其他實施例。
Description
本非臨時申請案主張2013年3月29日申請之美國臨時申請案第61/806,570號之較早申請日的權利。
本發明之一實施例大體上係關於編碼及解碼音訊信號且使用與經編碼信號相關聯之後設資料,以改良經解碼信號在消費型電子終端使用者器件中之播放品質。亦描述其他實施例。
數位音訊內容出現於包括(例如)音樂檔案及電影檔案之許多不同執行個體中。在大多數情況下,出於資料速率減少之目的而編碼音訊信號,使得媒體檔案或串流之傳送或遞送消耗較少頻寬且較快,藉此允許同時地發生眾多其他傳送。可在不同類型之終端使用者器件中接收媒體檔案或串流,在該等終端使用者器件處,經編碼音訊信號係在經由內建式揚聲器抑或可卸離式揚聲器而呈現給消費者之前被解碼。此情形已幫助燃料消費者(fuel consumer)用於經由網際網路而獲得數位媒體之嗜好。數位音訊節目之建立者及經銷商具有供其使用之若干工業標準,該等工業標準可用於編碼及解碼音訊內容。此等標準包括由Advanced Television Systems Committee公司在2005年6月14日公開之數位音訊壓縮標準(AC-3、E-AC-3)修訂版B文件A/52B(「ATSC標準」)、基於ISO/IEC 13818-7之進階音訊寫碼(AAC)中之MPEG-2輸送
串流的歐洲電信標準協會ETSI TS 101 154之數位視訊廣播(DVB)(「MPEG-2 AAC標準」),及由國際標準組織(ISO)公開之ISO/IEC 14496-3(「MPEG-4音訊」)。
存在用於數位音訊之播放的不斷增加種類之終端使用者器件,包括桌上型電腦、膝上型電腦、攜帶型手持式器件(例如,智慧型電話)、家用電視,及車輛內媒體系統。此等器件具有不同類比信號路徑、揚聲器及聲學環境。又,音訊信號之動態範圍在不同節目之間變化。此外,數位音訊節目之產生者(包括建立者且有時甚至包括經銷商)常常希望藉由數位地修改音訊信號而使得其平均響度高出若干dB來增加該等產生者之節目的平均響度。然而,此情形亦會要求減少所得音訊信號之尖峰位準,以便避免剪輯(剪輯會導致不良之可聽失真)。此要求係使用動態範圍控制(DRC)而達成,該DRC壓縮音訊信號之高頻分量(highs)及低頻分量(lows),使得所得音訊信號可適宜於較窄範圍內(藉此避免剪輯)。然而,所有此等因素產生一問題,此在於:如由終端使用者感知之響度可既橫越不同終端使用者器件又在同一器件上之連續節目期間顯著地變化,從而在播放期間導致令人不悅的使用者體驗。
諸如Apple公司之SoundCheckTM程式的軟體工具自動地調整歌曲之播放音量以有希望得到相同可感知響度,使得(例如)與自1970年代起之較老歌曲相比較,具有較小動態範圍但具有較高平均響度之新近流行唱片被壓低音量。又,音訊節目可包括與經編碼音訊信號相關聯且描述關聯音訊信號之後設資料部分。後設資料可包括由終端使用者器件中之軟體使用以控制(例如)經解碼音訊信號之對話位準、DRC及任何降混(downmixing)以便在播放期間改變消費者之體驗的資訊。
需要一種使用任何習知編碼/解碼(編解碼器)及關聯後設資料建
構來控制被遞送至消費者之音訊之品質的系統化而仍靈活之方法。下文更詳細地描述本發明之至少以下實施例。
在一項實施例中,一種用於編碼一音訊信號之方法涵蓋將一音訊正規化增益值應用於一音訊信號以便產生一正規化信號。處理該正規化信號,以便計算用於該正規化信號之數個動態範圍控制(DRC)增益值。根據若干預定義DRC特性中之一選定DRC特性來計算該等DRC增益值。編碼該音訊信號,且提供該等增益值作為與該經編碼信號相關聯之後設資料。接著可在播放處理之解碼級(decoding stage)中將所提供之DRC增益值應用於經解碼音訊信號,以在播放期間調整經解碼音訊信號之動態範圍。
在另一實施例中,若干預定義DRC特性為編碼器裝置及解碼器裝置所「知道」。將用於編碼器裝置中之DRC特性的索引傳達至解碼器裝置。此情形使終端使用者器件之解碼器裝置能夠根據諸如以下各者之本機參數來修改所提供之DRC增益值(其由該解碼器裝置使用以壓縮經解碼音訊信號):使用者輸入(包括播放音量及/或響度正規化開啟或關閉設定)、使用者內容脈絡(或終端使用者器件正被使用之條件,例如,深夜、車輛內等等),以及數位至類比轉換器及待用於播放經解碼音訊信號之揚聲器的動態範圍。
在另一實施例中,可在編碼裝置中計算響度資訊或響度參數,例如,關於多頻道音訊信號之DRC壓縮式版本或降混式版本。接著可提供響度資訊作為與經編碼多頻道音訊信號相關聯之後設資料。在一項實施例中,在編碼裝置處,量測輸入多頻道音訊信號之降混式版本的響度參數,且其中可能已在先前已或未將DRC應用於輸入信號之情況下獲得降混信號。
存在可由編碼級(encoding stage)連同(例如)用以在編碼級中產生降混式信號之降混增益提供作為與輸入信號之經編碼版本相關聯之後
設資料的各種響度參數。後設資料中含有之響度資訊可包括以下各者中之一或多者:節目響度(如在諸如根據ITU BS.1770而計算的整個音訊節目之主觀響度度量中)、真實尖峰值(諸如根據ITU BS.1770而量測)、錨點響度、響度範圍、響度範圍最高值、最大瞬間響度,及短期響度。此後設資料亦可包括已經選擇以產生用於輸入音訊信號之DRC增益值的DRC特性之索引,此等DRC增益值亦可包括於該後設資料中。
在解碼裝置中,DRC處理器可基於以下各者來調整或產生用於DRC之不同增益值:1)在後設資料中獲得之DRC特性的索引;2)在後設資料中獲得之DRC增益值;及3)包括(例如)諸如音量設定及響度正規化開啟/關閉設定之使用者輸入的本機參數。因此,可在播放處理期間即時地達成動態範圍控制,而解碼裝置不必計算經解碼音訊信號之每訊框響度值(或DRC輸入位準)。在一項實施例中,當解碼音訊檔案或串流時由在解碼器裝置中執行之媒體播放器讀取與音訊檔案或串流相關聯之後設資料,且使用該後設資料以自動地(亦即,在無使用者輸入之情況下且對使用者透通地)調整經解碼數位音訊內容之響度(在數位至類比轉換之前)。可進行此情形以取決於使用者輸入及使用者選擇之播放模式的動態範圍(例如,線路輸出(line-out)相對於內建式揚聲器)而改良使用者對音訊檔案或串流中之內容之播放的體驗。
在一另外實施例中,根據由使用者設定之播放音量及/或由編碼裝置量測且經由後設資料而提供之真實尖峰值及/或基於目標空餘空間(數位音訊信號之尖峰位準與其剪輯位準之間的差)來控制應用於解碼裝置中之DRC壓縮的量,該目標空餘空間係可在解碼裝置中基於使用者播放音量設定及可自正用於播放之數位至類比轉換器件及揚聲器器件得到的動態範圍而計算。
在又一實施例中,可在解碼級中定義目標DRC特性,且可藉由以
下各者來達成此目標:i)找出哪一編碼級DRC特性已被使用;及ii)比較兩個DRC特性以判定如何修改經接收DRC增益值。因此,基於自後設資料擷取之DRC特性索引(指向由編碼器使用之DRC特性),所擷取之DRC增益值係在編碼級處設定,且基於建議採用不同目標DRC特性索引之某些本機條件,在解碼器處即時地修改動態範圍調整。
在另一實施例中,產生關於DRC壓縮式音訊內容信號及/或降混式音訊內容信號之響度資訊,且將該響度資訊作為後設資料而內嵌於經編碼多頻道數位音訊檔案或串流中。接著在解碼(在解碼級中)之後使用此特定後設資料,以藉由自訂經解碼多頻道音訊內容之降混來改良使用者體驗。
在又一實施例中,使應用於解碼級中(在驅動揚聲器之前,應用於經解碼音訊內容信號)之DRC壓縮的量變化,以便在揚聲器之輸出處避免剪輯。DRC壓縮之此變化可為以下各者之函數:a)由使用者設定之播放音量;b)真實尖峰值(其係自經編碼音訊檔案或串流擷取);及/或c)在至數位至類比轉換器(DAC)之輸入處的目標空餘空間(在已應用DRC壓縮之後)。舉例而言,在低播放音量下,存在較多空餘空間,使得可應用較少DRC壓縮,此情形又將允許經解碼音訊信號中之較高尖峰傳遞通過至揚聲器。
以上【發明內容】並不包括本發明之所有態樣的窮舉清單。預料到,本發明包括可自上文所概述之各種態樣之所有適合組合以及以下【實施方式】中揭示且與本申請案一起申請之申請專利範圍中特頂地指出之態樣加以實踐的所有系統及方法。此等組合具有在以上【發明內容】中未特定地敍述之特定優點。
2‧‧‧編碼器
4‧‧‧DRC處理器
6‧‧‧音訊量測模組
7‧‧‧輔助資料頻道/輔助資料頻道處理器
8‧‧‧多工器
9‧‧‧預調節濾波器
10‧‧‧解碼器
12‧‧‧DRC_1處理器
13‧‧‧解多工器
14‧‧‧選用信號處理區塊/混頻器
15‧‧‧動態範圍調整單元
16‧‧‧選用信號處理區塊/另外音訊處理
18‧‧‧數位至類比轉換器(DAC)
19‧‧‧傳感器(揚聲器)
20‧‧‧降混處理器/降混模組
在隨附圖式之諸圖中作為實例而非作為限制來說明本發明之實施例,在該等圖式中,類似參考指示相似元件。應注意,在本發明中
對本發明之「一」或「一項」實施例之參考未必為對同一實施例之參考,且其意謂至少一項。又,可使用給定圖以說明本發明之一項以上實施例的特徵,且對於給定實施例可能並非需要該圖中之所有元件。
圖1為數位音訊編碼級或編碼裝置之相關組件的方塊圖。
圖2展示可用於編碼級中之若干實例DRC特性。
圖3為解碼器級或解碼器裝置且尤其是在播放經解碼音訊信號期間執行處理之解碼器級或解碼器裝置之相關組件的方塊圖。
圖4展示可用於解碼級中以產生新DRC增益值之若干實例DRC特性。
圖5為具有接收經解碼多頻道音訊信號之降混處理器的解碼級中之組件的方塊圖。
圖6展示適合於供解碼級中使用以產生新增益值之若干實例DRC特性。
圖7為適合於特定降混情境之數位音訊編碼級或編碼裝置之相關組件的方塊圖。
此處將本發明之若干實施例描述為數位音訊寫碼及解碼之後設資料增強,數位音訊寫碼及解碼在播放具有指定後設資料之經寫碼音訊檔案或經寫碼音訊串流期間用於響度正規化及動態範圍控制(DRC)。雖然闡述眾多細節,但應理解,可在無此等細節的情況下實踐本發明之一些實施例。在其他情況下,尚未詳細地展示熟知之電路、結構及技術以便不混淆對此描述之理解。舉例而言,此處在根據MPEG標準的用於位元速率減少之編碼的內容脈絡中描述某些細節,本發明之實施例亦適用於包括無損耗資料壓縮的其他形式之音訊寫碼及解碼,諸如,Apple無損耗音訊編解碼器(Apple Lossless Audio Codec,ALAC)。
參看圖1,展示根據本發明之一實施例的編碼器級或編碼器裝置之方塊圖。此方塊圖可用以不僅描述數位音訊編碼器裝置,而且描述用於編碼音訊信號之方法。由編碼器2編碼數位音訊信號,且接著可使用多工器(mux)8而將數位音訊信號與後設資料進行組合。所得經編碼音訊或經編碼音訊串流含有內嵌式後設資料,該後設資料包括每數位音訊訊框一動態範圍控制(DRC)增益值。儘管未圖示,但將後設資料內嵌有經編碼信號之替代方案係經由在圖1中被稱作輔助資料頻道7之分離後設資料頻道而提供後設資料(在此狀況下包括每訊框DRC增益值)。音訊信號之編碼可涉及有損耗資料速率減少編碼,或音訊信號之編碼可涉及無損耗資料壓縮。又,音訊信號可為脈碼調變式(pulse code modulated,PCM)數位音訊序列,或其他經取樣單頻道或多頻道音訊信號(此處亦被稱作音訊節目),該多頻道音訊信號可包括多個音訊頻道,例如,6頻道5.1環場音效、2頻道立體聲等等。
後設資料包括由DRC處理器4計算之DRC增益值(每訊框)。由如所展示之乘法器符號表示的正規化器或調整器將音訊正規化增益值(例如,GLN)應用於輸入數位音訊信號,以產生正規化信號。處理正規化信號(由DRC處理器4),以根據數個預定義DRC特性中之一選定DRC特性來計算數個DRC增益值。該等DRC特性可在編碼裝置內儲存於作為DRC處理器4之部分的記憶體內。圖2中給出DRC特性之實例,其中沿著x軸之DRC輸入位準係指短期響度值(此處亦被稱作DRC輸入位準),且沿著y軸的是增益值之範圍,應用該等增益值以達成對輸入音訊信號之壓縮性或擴展性效應。圖2中之增益值在此處亦被稱作DRC增益值。
音訊正規化為將恆定量之增益應用於音訊錄製(亦被稱作音訊節目或音訊信號),以使音訊信號之平均值或尖峰值達到目標位準(正規)。當橫越全信號或音訊節目應用相同量之增益時,該信號之信雜
比及相對動態在極大程度上不變。正規化不同於動態範圍壓縮或動態範圍控制(DRC),該動態範圍壓縮或DRC將時變位準之增益應用於輸入音訊信號,以使結果適宜於最小值至最大值範圍內。實例包括尖峰正規化,其中改變增益以使最高數位樣本值(例如,脈碼調變式(PCM)值)或類比信號尖峰達到給定位準。
另一類型之音訊正規化係基於節目響度之度量。此處,改變所應用之增益(其在圖1中被特定地描繪為節目響度正規化增益或GLN)以使(例如)遍及整個音訊節目之平均響度達到目標位準。節目響度之實例包括諸如RMS值之平均功率的度量,或諸如由國際電信聯盟(ITU)推薦BS.1770之「Algorithms to measure programme loudness and true-peak audio level」提供之度量的人類感知響度之度量。取決於輸入信號之動態範圍及目標位準,節目響度正規化可引起高於給定錄製或傳輸或播放媒體之極限的尖峰。在此等狀況下,可使用DRC以在此等狀況下防止剪輯,此情形又可變更音訊信號之信雜比及相對動態。
DRC可藉由窄化或「壓縮」音訊信號之動態範圍來減少大聲聲音(loud sound)之音量或放大安靜聲音(quiet sound)。壓縮通常用於聲音錄製及重現與廣播中。用以應用壓縮之電子硬體單元或音訊軟體有時被稱作壓縮器。壓縮器常常具有若干控制項,包括(例如)臨限值(例如,以dB為單位)、增益減少之比率或量(增益值)、使壓縮被應用之速率變化且使效應平滑的攻擊與釋放控制項,及硬/軟拐點控制項。
DRC特性(在此處被用作片語)給出以下兩者之間的關係:輸入音訊信號之響度的短期度量(此處亦被稱作圖4中之「響度[dB]」或圖2中之DRC輸入位準),其係遍及可大約為數位音訊信號之一訊框或封包的時間區間(例如,介於5毫秒與100毫秒之間的區間)而計算;及可應用於輸入音訊信號之增益值。此關係亦可被稱作壓縮器設定檔(其中增益值用來壓縮抑或擴展輸入音訊信號)。圖2中展示可用於編碼級
中之若干實例DRC特性,而圖4及圖6展示可用於解碼級(待在下文描述)中之實例DRC特性。
可使用任何適合處理序以在編碼級中選擇當前DRC特性。回應於接收到該選擇,DRC處理器4存取經儲存DRC特性,且將經存取設定檔應用於輸入信號(在此狀況下為增益正規化數位音訊信號),且藉此產生每訊框DRC增益值。DRC處理器4可如下產生DRC增益值。處理正規化音訊信號,以便計算短期響度度量,例如,係在大約為輸入音訊信號之約一個訊框上進行計算。接著使用所計算短期響度度量作為至反映諸如圖2所描繪之DRC特性或任何其他適合DRC特性的DRC特性中之一者的查找表的輸入,以引起DRC增益值。舉例而言,若音訊訊框為小聲,則很可能會產生正值更大之DRC增益,且若音訊訊框為大聲,則很可能會產生負值更小之DRC增益值。在一項實施例中,輸入數位音訊之每一訊框可與經獨立產生之DRC增益值相關聯。接著提供DRC增益值作為與(例如)內嵌於同一位元串流內之經編碼音訊信號相關聯的後設資料。此編碼裝置可為一媒體伺服器之部分,該媒體伺服器正對來自(例如)在終端使用者器件中執行之用戶端程式之請求作出回應,以經由網際網路而將音訊節目(例如,作為(例如)音樂檔案或電影檔案之部分)傳輸至請求終端使用者器件。替代地,可提供經編碼音訊位元串流以供儲存於任何形式之適合錄製媒體中。
在一項實施例中,DRC處理器4可被視作與編碼器2並行地操作,惟至DRC處理器4之輸入為輸入至編碼器2之音訊信號的正規化版本除外。在圖1之實例中,正規化值GLN可為對於整個音訊節目為固定且與數位音訊信號之信號樣本相乘的純量。可「先於」使(正規化)音訊信號傳遞通過DRC處理器4而計算正規化增益值GLN。可基於先前由音訊量測模組6計算之響度參數(例如,節目響度)來計算正規化增益(藉由在圖1中被標記為GLN之區塊)。此計算係可在DRC處理器4執行第二遍
次(經由輸入音訊信號之正規化版本)之前在經由輸入音訊信號之第一遍次中由音訊量測模組6進行。接著基於(例如)以下兩者之比率來進行GLN之計算:(i)原始數位音訊節目之測定響度(例如,針對整個原始音訊節目而計算之節目響度);及(ii)目標或所要響度。參見下文以得到關於如何計算實例GLN之額外細節。
在一另外實施例中,回應於輸入音訊信號中之音訊內容的類型,可基於分別與數種不同類型之音訊內容相關聯的數個預定目標響度值而自動地選擇音訊正規化增益值。舉例而言,若音訊節目為古典音樂,則相較於目標節目為流行音樂或者對話或談話放映或者關卡動畫(action packed motion picture)之情況,選擇不同目標響度值。
圖1展示傳遞通過以下三個信號處理區塊的至音訊量測模組6之輸入信號:乘法器(用於動態範圍調整)、降混處理器20(用以引起多頻道音訊信號之降混),及預調節濾波器9。然而,此情形僅僅為圖1所說明之一項實施例。在其他實施例中,可省略彼三個信號處理區塊中之一或多者。舉例而言,若未針對音訊信號(音訊節目)指示降混,則可自編碼級省略降混處理器20,使得音訊信號將僅經受動態範圍調整及預調節(在由音訊量測模組6處理之前)。作為另一實例,可省略預調節濾波器9,而仍指示降混及動態範圍調整,在此狀況下,音訊信號將僅經受動態範圍調整及降混(在由音訊量測模組6處理之前)。
仍參看圖1,除了作為後設資料之DRC增益以外,編碼裝置亦可將選定DRC特性之索引提供於新後設資料輸送欄位中作為另外後設資料(與經編碼音訊信號相關聯)。在圖1之實例中,使用輔助資料頻道7以提供索引,而將DRC增益內嵌有經編碼音訊信號。輔助頻道係與正遞送經編碼音訊之主要資料頻道分離。存在對於提供與經編碼音訊信號相關聯之後設資料為可能的若干方式。圖1僅展示一種機制,其中已將DRC增益值與經編碼音訊一起內嵌(由多工器)於同一位元串流
(「主要」資料頻道)中,而經由輔助資料頻道處理器7來供應響度參數。在另一方式中,舉例而言,組合器或格式化器將DRC增益值與經編碼音訊信號一起配置成單一檔案內之訊框或封包。在又一方式中,可添加壓縮器,因為DRC增益值係與音訊信號一起內嵌於同一檔案或位元串流中,所以壓縮器減少DRC增益值之位元速率。在又一方式中,輔助資料頻道處理器7將DRC增益值配置至輔助資料頻道中(除了其他後設資料以外)。
除了當前DRC特性之索引以外,後設資料亦可包括由解碼級中之音訊量測模組6計算的節目響度值,且亦視情況包括真實尖峰值。基於輸入音訊信號而執行以計算節目響度及真實尖峰值之音訊量測係可根據任何適合已知技術,例如,根據ITU-BS.1770-3。在一另外實施例中,如圖1所說明,此音訊量測可使用由DRC處理器4計算之DRC增益值,以便計算響度參數(例如,節目響度及真實尖峰值),該等響度參數接著被提供作為其他後設資料。換言之,可針對音訊節目而基於輸入音訊信號之DRC調整式或壓縮式版本來計算節目響度值及真實尖峰值(在無GLN正規化的情況下)。此處應注意,如圖1所說明,壓縮式音訊信號可為由降混處理器20處理之多頻道音訊信號,降混處理器20引起特定降混音訊信號被產生且被饋送至音訊量測模組6之輸入。此處,降混處理為選用的,此在於:可省略或跳過降混處理器20,使得在無降混的情況下對壓縮式音訊信號執行音訊量測。
在一另外實施例中,為了執行音訊量測(在音訊量測模組6中),使用已基於以下兩者而組態之選用預調節濾波器9:1)輸入音訊信號之特徵或特性;及/或2)被預期為接收及執行經編碼音訊位元串流之播放之終端使用者器件的特性。如在圖1中所見,輸入音訊信號可在輸入至模組6之前由濾波器9預調節,在模組6處,將對輸入音訊信號執行響度計算。預調節濾波器9可為(例如)高通濾波器、帶通濾波器
或其組合,該濾波器模型化特定播放器件(例如,消費型電子器件,諸如,桌上型電腦、膝上型電腦、平板電腦、智慧型電話,或數位媒體播放器,其經設計成經由網際網路而接收數位內容且經由附接式顯示監視器而執行播放)之數位至類比級及揚聲器(傳感器)級的頻率回應或轉移函數。
現在轉至圖3,此圖為解碼級或解碼裝置之相關組件的方塊圖。圖3中之方塊圖不僅提供針對數位音訊解碼器裝置或解碼級之支援,而且提供針對用於解碼音訊之方法的支援,如下文所解釋。所展示之解碼器裝置具有解碼器10,解碼器10接收已由解多工器13自經編碼音訊位元串流擷取之經編碼音訊信號。該位元串流可包括內嵌式後設資料,例如,DRC增益值、DRC特性之索引(用於編碼級中),及響度參數。如上文關於編碼裝置所建議,一替代方案係將後設資料中之一些或全部包括於分離輔助資料頻道7中(參見圖1)。在兩種情況下,提供經編碼音訊信號作為至解碼器10之輸入,作為回應,解碼器10產生經解碼音訊信號。解碼器10可與圖1之編碼器2互補,以便能夠復原可基本上相似於編碼級之原始輸入音訊信號的信號。經解碼音訊信號傳遞通過選用信號處理區塊14、16,直至其到達數位至類比轉換器(DAC)18及功率放大器(未圖示)為止,在DAC 18及功率放大器處,經解碼音訊信號被轉換成類比形式且被應用以驅動傳感器(揚聲器)19。
解碼裝置亦具有接收與經編碼音訊信號相關聯之後設資料的DRC_1處理器12,其中該後設資料包括在編碼級中計算之DRC增益值。DRC_1處理器12可修改彼等增益值以產生新或經修改增益值。此修改係可基於正用於經解碼音訊信號之播放的本機參數,包括傳感器19(例如,內建式揚聲器或外部無線或有線附接式揚聲器)、功率放大器(未圖示)及數位至類比轉換器(DAC)18之組合的使用者輸入及/或動態範圍。接著,在將經修改增益值饋送至選用混頻及另外音訊處理區
塊(區塊14、16)之前,將經修改增益值應用於經解碼信號(此調整係由乘法器符號描繪),且接著應用至DAC 18上。因此將經修改DRC增益值應用於經解碼音訊信號以產生所謂解碼級DRC調整式音訊信號。在將所謂解碼級DRC調整式音訊信號饋送至DAC 18之前,可由混頻器14將所謂解碼級DRC調整式音訊信號與如所展示的來自其他音訊來源之其他解碼級DRC調整式音訊信號進行組合(亦即,經由其他動態範圍調整單元15)。
在一項實施例中,解碼級中之經接收後設資料包括先前選定或當前DRC特性之索引(根據該索引,已在編碼級中計算DRC增益值,如在圖1中一樣)。在一項實例中,選定或當前DRC特性之複本可儲存於DRC_1處理器12中,且係與此索引相關聯。此DRC特性被稱作編碼級DRC特性。與此對比,DRC_1處理器12亦可含有如所展示之數個所謂解碼級DRC特性。該等所謂解碼級DRC特性中之一者用以產生新或經修改增益值,如下。
在一項實施例中,DRC_1處理器12「反轉」由編碼級之DRC處理器4執行的操作,以便藉由將經接收DRC增益值(來自經接收後設資料)應用於當前DRC特性來獲得自儲存於處理器12中之選定或當前DRC特性開始的短期響度或DRC輸入位準(例如,以dB為單位)。接著使用此經復原短期響度值作為至該等解碼級DRC特性中之一選定DRC特性中的輸入,以便得到新或經修改增益值。新或經修改增益值在此處被稱作解碼級或解碼器DRC增益值。解碼級DRC特性及編碼級DRC特性中每一者係可以查找表方式予以儲存。
解碼級DRC特性之選擇係可根據以下各者中之一或多者:使用者內容脈絡(包括深夜、步行、跑步、車輛內或汽車內,及耳機相對於內建式喇叭),及揚聲器信號路徑動態範圍。在彼狀況下,圖3之解碼裝置可內嵌於諸如以下各者之終端使用者器件內:行動電話、膝上型
電腦,或平板電腦,其常常在相當不同之使用者內容脈絡中得到應用。此等內容脈絡係可由已知電子感測器硬體及軟體偵測,該電子感測器硬體及軟體包括環境光感測器及位置、定向或運動感測器。傳感器信號路徑動態範圍係可由終端使用者器件之製造商提前判定,且可被儲存或以其他方式提供至DRC_1處理器12以在解碼處理序期間使用。傳感器動態範圍可包括DAC 18之動態範圍。在可得到較大動態範圍的情況下,DRC_1處理器12可遍及經解碼音訊信號之短期響度的預期範圍選擇允許保持更動態之範圍的解碼級DRC特性。
在圖3亦描繪之另一實施例中,解碼級中之經接收後設資料可進一步包括可為以下各者中之一或多者的數個響度參數:節目響度、真實尖峰、響度範圍、最大瞬間響度,及短期響度。此等值中之一或多者係可由DRC_1處理器12在產生經修改或新DRC增益值(基於每訊框)時使用。
如上文所描述,解碼級中之DRC_1處理器12(亦被稱作解碼器DRC處理器)可使用選定解碼級DRC特性來產生其經修改DRC增益值。上文已建議,選定解碼級DRC特性可為儲存於處理器12中且可根據使用者輸入或使用者內容脈絡控制信號而存取之若干預定義DRC特性中的一者。圖4說明可使用之解碼級DRC特性的若干實例。此等解碼級DRC特性包括用於深夜使用之一個DRC特性、用於汽車內或車輛內使用之另一DRC特性,及用於具有有限動態範圍之揚聲器或傳感器19的另一DRC特性。
根據本發明之另一實施例,來自圖1及圖3之組件的組合可得到用於既編碼又解碼音訊信號之系統。數個編碼器動態範圍控制(DRC)特性儲存於編碼器級中。此等特性中每一者使DRC增益值與短期響度值相關,其中每一響度值可指遍及(例如)大約為數位音訊之約一個訊框(例如,長度介於5毫秒與100毫秒之間)之預定義區間的音訊信號之
平均功率。選擇該等編碼器DRC特性中之一者,且接著使用該編碼器DRC特性以產生編碼器級增益值。接著提供此等編碼器級增益值作為與經編碼音訊信號相關聯之後設資料。上文已給出且結合圖1而描述此編碼器級之若干實例。
解碼器級具有不僅儲存編碼器DRC特性而且儲存數個解碼器DRC特性之處理器。該等解碼器DRC特性中每一者使DRC增益值與短期響度值相關,該等短期響度值可相似於在編碼器級中計算以用於判定編碼器DRC增益值之短期響度值。解碼器級中之處理器用以使用來自編碼器級之編碼器級增益值來計算解碼器級增益值。在一特定狀況下,解碼器級中之處理器使用選定編碼器DRC特性之索引連同以後設資料為基礎之編碼器級增益值,以便計算其解碼器級增益值。上文已給出且結合圖3而描述此情形之實例。解碼器級最終可(當用作(例如)終端使用者器件中之播放處理的部分時)解碼經編碼音訊信號,且接著應用解碼器級增益值以達成所要動態範圍調整(對經解碼音訊信號)。
根據本發明之又一實施例,用於提供經編碼音訊及關聯後設資料之方法涉及多頻道音訊信號之降混。如在圖1中所見,由音訊量測模組6基於已傳遞通過降混處理器20之多頻道數位音訊信號來計算一組響度參數,其中該等參數描述多頻道音訊信號之降混的響度設定檔。舉例而言,可由降混處理器20將六或七頻道音訊信號處理成二頻道或立體聲信號;更一般化地,降混為將N個頻道之音訊信號轉換成具有M個頻道之音訊信號,其中N大於M。
編碼多頻道音訊信號,且提供經編碼信號連同與經編碼信號相關聯之後設資料,其中在此狀況下,該後設資料包括描述降混之響度設定檔的該組所計算響度參數。後設資料亦可包括多頻道音訊信號之基本頻道佈局。舉例而言,該基本頻道佈局可藉由識別六個頻道(例如,中央前、右前、左前、左環場音效、右環場音效,及重低音喇
叭)中每一者來給出5.1環場音效多頻道音訊信號之細節。接著可由解碼級接收經編碼多頻道音訊信號及其關聯後設資料--參見(例如)下文所描述之圖5--其中解碼及處理經編碼音訊信號,以便根據該組響度參數及包括於該後設資料中之基本頻道佈局來產生降混。後設資料亦可包括用於編碼級中以計算響度參數包括於後設資料中所針對之特定降混的降混增益。應注意,在此實施例中,無需存在由解碼級針對動態範圍所執行之任何調整(在經由本機揚聲器之播放期間)。可藉由(例如)採用如下慣例來實施此方案:若在解碼級中接收之後設資料不含有DRC增益值,則不對經解碼信號執行DRC調整。
圖5描繪本發明之另一實施例,其中除了諸如關於降混之真實尖峰及節目響度的響度參數以外,與經編碼多頻道音訊信號相關聯之後設資料亦可進一步包括DRC增益值。此圖描繪在一些方面相似於圖3中之解碼級的解碼級,此在於:該解碼級可含有解多工器13,接著含有解碼器10、選用的另外音訊處理16及DAC 18。此處同樣地,與編碼音訊信號相關聯之經接收後設資料提供DRC增益值。此等DRC增益值待用於解碼級中,以在處理經解碼音訊信號以產生降混之前對經解碼音訊信號執行動態範圍調整。換言之,由解碼器10解碼經編碼多頻道音訊信號,且接著,由新DRC增益值抑或由原始DRC增益值(後者係已自解多工器13獲得)調整該等經解碼頻道中之一或多者。此情形係在降混模組20產生特定降混之前發生。降混模組20可使用亦自後設資料擷取之降混增益值(如上文所建議)。在另一實施例中,針對動態範圍而使用新增益值來調整經解碼音訊信號,該等新增益值係由DRC_1處理器12使用(例如)相似於上文結合圖3所描述之程序的程序而計算。此處,可影響新增益值之本機參數可相似,且包括使用者音量設定及響度正規化開啟/關閉開關。此等本機參數可控管若干可用解碼級DRC特性中之一特定DRC特性的選擇,以用於產生新DRC增益
值。
作為先前段落中描述之方法的替代方案,可將由DRC_1處理器12(在解碼級中)產生之DRC增益值設計成應用於降混模組20下游。為了說明此實施例,可修改圖5中之解碼級,使得圖5所展示之乘法器的輸入(其另一輸入自DRC_1處理器12接收DRC增益值)將定位於降混模組20下游(及DAC 18上游)。在此狀況下,DRC_1處理器12可產生基於經由後設資料(自解碼級)而接收之原始DRC增益值的經修改DRC增益值,抑或DRC_1處理器12可經由原始DRC增益值而傳遞至調整器或乘法器區塊。用以針對此狀況產生特定形式之原始DRC增益值的對應編碼級可如圖7所展示。
參看圖7,展示一編碼器裝置,該編碼器裝置可相似於圖1之編碼器裝置,惟至少在以下態樣中除外。此處,DRC增益係以使得其接著可在解碼器裝置中直接地應用於降混之方式予以計算(由DRC處理器4)。與圖1對比,圖7之DRC處理器4亦對降混信號進行操作,該降混信號係由接收原始多頻道輸入音訊信號且作為回應而饋送另一輸入接收正規化增益值GLN之正規化器(或乘法器)的降混處理器20產生。編碼器2可仍以與圖1中之方式相同的方式來處理原始輸入音訊信號,以產生經編碼信號。
返回至圖5,其中之解碼級可自一編碼級(未圖示)接收其經編碼音訊信號及後設資料,在該編碼級中已產生輸入多頻道音訊信號之特定降混。使用輸入多頻道音訊信號及/或其特定降混而在解碼級中計算當前DRC增益值,且接著,提供當前DRC增益值連同多頻道音訊信號之經編碼版本作為後設資料(例如,藉由(例如)如在圖1中一樣使用多工器8將經編碼音訊信號與當前DRC增益值作為後設資料而組合於單一經編碼位元串流或檔案內)。用於提供經編碼音訊信號連同一組所計算響度參數及一基本頻道佈局且視情況提供當前DRC參數(其全
部為與經編碼音訊信號相關聯之後設資料)之其他方式為可能的。實例包括以下各者:組合器或格式化器,其將DRC增益值連同音訊信號一起配置成單一檔案內之訊框或封包;多工器,其產生含有已運用經編碼音訊信號之訊框進行時間多工之DRC增益值的位元串流;壓縮器,其在DRC增益值與經編碼音訊信號一起內嵌於同一檔案中或同一位元串流中時減少DRC增益值之資料速率;及輔助資料頻道處理器,其將DRC增益值配置至與主要資料頻道分離之輔助資料頻道中(其中主要資料頻道含有正被遞送至圖5之解碼級的經編碼音訊信號)。
應注意,如較早所建議,若與經編碼多頻道音訊信號相關聯之後設資料並不指定進行動態範圍調整,抑或簡單地並不含有DRC增益值或DRC參數(例如,不提及DRC特性之有效索引),則處理經解碼音訊信號以產生降混,而不對經解碼音訊信號執行任何動態範圍調整。此情形可如同圖5中之情形一樣,DRC_1處理器12可將其所有新增益值提供為0dB,此意謂將不對經解碼音訊信號之動態範圍執行調整。
在DRC_1處理器12確實接收DRC參數作為後設資料的情況下,可由處理器12根據可選自圖6所描繪之實例的解碼級DRC特性(或其他適合DRC特性)來產生新增益值。圖6展示三個不同DRC特性,其中每一者係與一不同使用者音量設定或位準相關聯。可看出,隨著音量增加,由DRC特性定義之壓縮的量在短期響度正在增加時增加。
可受益於此處所描述之技術的編解碼器之實例包括諸如AAC及AC-3的MPEG及ATSC之標準,但含有用以控制經解碼音訊信號之響度及動態範圍之機制的其他標準或方法亦可受益。
音訊量測模組6可為待由處理器執行之軟體常式,或固線式數位音訊處理邏輯電路系統之配置,該軟體常式或該配置計算或提供用於給定數位音訊檔案之一或多個響度參數。常式可用於諸如媒體播放器
的某一範圍之音訊產品中,以用於音樂內容之響度正規化。可在數位音訊寫碼處理序期間將所計算音訊量測作為後設資料而儲存於經編碼音訊檔案中。舉例而言,MPEG當前提供可儲存此後設資料之位元串流欄位。此等欄位之當前使用包括儲存參考響度、每數位音訊訊框之動態範圍控制(DRC)增益,及降混加權因數。根據本發明之一實施例,在MPEG-4音訊系統架構之「樣本描述延伸(sample description extension)」中定義新「方塊(box)」,以儲存後設資料(如下文進一步所描述)。
節目響度為可為數位音訊檔案之整個內容之平均響度估計的音訊量測。可根據ITU-BS.1770-3來計算一實例。在已將所應用之動態範圍壓縮應用於音訊內容信號之後,可在編碼級中計算節目響度,例如,參見圖1,其中未正規化音訊信號係針對動態範圍而在由濾波器9預調節且饋送至音訊量測模組6之前予以調整(同時跳過降混處理器20)。在另一實施例中,對於音訊內容信號之降混,可由音訊量測模組6在編碼級中計算節目響度,例如,參見圖1。
真實尖峰值為可為來自音訊檔案之音訊位元串流之最大樣本量值(例如,以4倍過度取樣速率)的音訊量測。可按照ITU-BS.1770-3來計算一實例。
響度範圍可為基於ITU BS.1770或按照歐洲廣播聯盟(EBU)規格之音訊量測。其量測用於給定區塊大小之數位音訊(例如,400ms之區塊)之響度的統計分佈,且產生響度分佈之低百分位數與高百分位數的差以描述動態範圍。指示響度範圍之其他音訊量測為可能的。
此處,本發明之一實施例為MPEG-4系統架構之「樣本描述延伸」部分中的新「方塊」,該新「方塊」可被填充有用於每一播放軌(音訊節目)之靜態後設資料,例如,節目響度、錨點響度、真實尖峰
及響度範圍。MPEG-4樣本描述延伸內之新方塊的額外每播放軌或每音訊節目內容可包括:諸如遍及0.4秒之視窗的最大瞬間響度、諸如遍及0.3秒之視窗的最大短期響度、定義包括高度頻道及其他頻道的用於播放系統之頻道佈局的頻道映射、DRC頻道映射、DRC特性之索引、降混係數、立體聲降混之節目響度、立體聲降混之錨點響度,及立體聲降混之真實尖峰。雖然用於將後設資料傳遞至播放處理器之其他輔助資料頻道如上文所描述為可能的,但此處,特定方法可具有以下優點;可得到靜態後設資料而不解碼音訊位元串流;添加錨點響度(又名,對話正規化(dialnorm))以支援電影/TV內容音量正規化;用於編碼器中之DRC特性的知識可幫助預測DRC增益之效應;可使用DRC特性之知識以修改解碼器處之DRC特性;可以可支援大於5.1之多頻道音訊格式的不會過時方式來定義降混係數;及對降混響度及剪輯之較好控制。
節目響度或錨點響度之使用適合於響度正規化。錨點響度通常係基於所擷取之語音片段,且可僅應用於電影/TV放映內容。
關於動態範圍控制(DRC),可使描述經錄製音訊內容之動態範圍之態樣的若干後設資料值可用(參見下表)。動態範圍之大小可有用於在播放期間調整DRC,例如,若動態範圍小或甚至可關閉DRC,則DRC較不積極。此外,可取決於使用者輸入、音量設定以及DAC動態範圍及揚聲器動態範圍而設定目標動態範圍,且目標動態範圍可選擇DRC特性,使得該範圍將減少至目標。此情形亦可考量針對較小空間(聆聽環境)之合理動態範圍限制。舉例而言,當響度正規化引起正增益[dB]時,或當需要空餘空間以避免降混之剪輯時,真實尖峰值及最大響度值可有用於估計空餘空間。接著可調整DRC特性以接近空餘空間目標。
描述動態範圍之態樣的實例後設資料
在編碼器級中使用DRC處理器以使用該等預定義DRC特性中之一選定DRC特性來產生增益值。可在新MPEG-4方塊中傳輸選定DRC特性之索引。可在現有欄位中(在輕度及/或重度壓縮期間)傳輸增益值(每訊框)。
如(例如)在圖1中所見,在輸入處將節目響度正規化增益GLN應用於DRC處理器4以確保關於選定DRC特性之適當位準對準。可基於由音訊量測模組6產生之節目響度值LPL及DRC目標響度值LCTL[dB]而將正規化增益計算為GLN=LCTL-LPL[dB],其中作為一實例,LCTL=-31dB。
根據本發明之一實施例,在解碼級中改變所擷取之DRC增益值,以藉由(例如)改變至不同DRC特性(相較於用於編碼級中之DRC特性)而實際上達成可適應於各種條件之自訂DRC。現在,播放時之處理由於能夠理解經擷取索引之意義而被給出何種DRC特性應用於編碼級中之知識。可證明此等改變正確之本機條件包括:深夜模式;有雜訊環境(例如,在移動中汽車內之雜訊);播放系統限制(例如,膝上型電腦、平板電腦或智慧型電話之內部揚聲器,此係與外部喇叭或頭戴式耳機相對);使用者偏好;及內容之動態範圍。參見圖4以得到有用於此等情形中之實例DRC特性。
在一項實施例中,對於在1kHz下之正弦輸入,可用DRC特性應基於壓縮器之穩態輸入/輸出位準。此情形維持與使用k加權響度估計
之壓縮器的相容性。此處假定,將DRC特性應用於響度正規化音訊信號。此情形對於具有處於正確位準之DRC死頻帶(若適用)為重要的,且針對具有各種響度位準之內容產生較一致之結果,尤其是若此內容係在響度正規化開啟之情況下播放。
降混係指音訊之操縱,其中使數個相異音訊頻道混合以產生較低數目個頻道。此處,在必要時可由音訊節目產生設施控制降混。舉例而言,一些內容可在降混之前需要環場音效頻道之較多衰減,以維持可懂度。
當前,若設定DRC_presentation_mode,則DVB及MPEG在產生降混時需要使用DRC。此情形可在降混中引起動態範圍損耗。與此對比,為了在適當時維持動態範圍,此處,本發明之一實施例為一適應性方案,其中僅需要DRC壓縮以用於在如圖5所展示之高播放音量期間進行降混。接著調適DRC之應用以僅減少最大聲片段之位準(參見(例如)圖6)。此外,現在可在解碼級處擷取可在編碼級處已由音訊量測模組6計算--參見圖1--且已被提供作為後設資料的立體聲降混之真實尖峰值,且使用該真實尖峰值以估計在降混之前需要將多少DRC壓縮應用於經解碼信號。應注意,儘管圖5展示在處置前往降混處理器20之經解碼信號之前將來自處理器12之DRC增益值應用於經解碼信號的實施例,但此處,一替代方案係在降混之後應用DRC增益值,例如,直接地應用於降混處理器20之輸出。
若使用降混且DRC壓縮獨立地在作用中,則在必要時可修改DRC特性,使得針對降混達成足夠空餘空間。此解決方案提供較多靈活性。又,可使用(例如)相對於滿刻度而K加權之響度(Loudness K-weighted relative to Full Scale,LKFS)值(其被接收作為後設資料)而在解碼級中針對響度來使立體聲降混正規化。此等LKFS值為在編碼級
中由音訊量測模組6基於原始多頻道數位音訊信號之降混式版本而計算的響度參數(參見圖1)。此情形確保多頻道內容及立體聲內容將遍及立體聲系統以相同位準而播放。
1)一種用於編碼及解碼一音訊信號之系統,其包含:一編碼器級,複數個編碼器動態範圍控制(DRC)特性儲存於該編碼器級中,其中該等編碼器DRC特性中每一者使增益值與響度值相關,該編碼器級用以使用該等編碼器DRC特性中之一選定DRC特性來產生編碼器級增益值,且提供該等編碼器級增益值作為與一經編碼音訊信號相關聯之後設資料;及一解碼器級,其具有一處理器,該處理器儲存a)該複數個編碼器DRC特性及b)複數個解碼器DRC特性,其中該等解碼器DRC特性中每一者使增益值與響度值相關,且用以使用來自該編碼器級之該等編碼器級增益值來計算解碼器級增益值。
2)如陳述式1之系統,其中該編碼器級用以提供該選定編碼器DRC特性之一索引,且該解碼器級中之該處理器用以使用該索引及該等編碼器級增益值以計算該等解碼器級增益值。
3)如陳述式1之系統,其中該解碼器級用以解碼該經編碼音訊信號,且接著應用該等解碼器級增益值以達成對該經解碼音訊信號之動態範圍控制。
4)一種用於解碼音訊之方法,其包含:接收經編碼音訊信號及與該經編碼音訊信號相關聯之後設資料,其中該後設資料可包括複數組響度參數中之一者,其中該複數組響度參數包括a)描述一各別降混之響度設定檔的一組,及b)描述一基本頻道佈局之響度設定檔的一組;解碼該經編碼音訊信號以產生經解碼音訊信號;及處理該經解碼音訊信號以根據包括於該後設資料中之該組響度參數來產生一降混。
5)如陳述式4之方法,其中與該經編碼音訊信號相關聯之該後設
資料進一步包含DRC參數,該方法進一步包含:在處理該經解碼音訊信號以產生該降混之前或之後,根據該等DRC參數而對該經解碼音訊信號執行動態範圍調整。
6)如陳述式4之方法,其中與該經編碼音訊信號相關聯之該後設資料並不指定進行動態範圍調整抑或並不含有DRC參數,且其中處理該經解碼音訊信號以產生該降混係在產生該降混之前不對該經解碼音訊信號執行動態範圍調整的情況下發生。
7)一種數位音訊解碼器裝置,其包含:一解碼器,其用以接收經編碼音訊信號且產生經解碼音訊信號;及一降混處理器,其用以接收該經解碼音訊信號及與該經解碼音訊信號相關聯之後設資料,其中該後設資料包括為a)描述一各別降混之響度設定檔的一組或b)描述一基本頻道佈局之響度設定檔的一組中之一者的一組響度參數,其中該降混處理器用以根據包括於該後設資料中之該組響度參數來產生降混式音訊信號。
8)一種用於提供經編碼音訊及關聯後設資料之方法,其包含:基於一多頻道音訊信號來計算一組響度參數,該組響度參數描述該多頻道音訊信號之一降混之響度設定檔;編碼該多頻道音訊信號;及提供a)該經編碼多頻道音訊信號及b)與該經編碼多頻道音訊信號相關聯之該組所計算響度參數及該多頻道音訊信號之一基本頻道佈局作為後設資料。
9)如陳述式8之方法,其進一步包含:產生該多頻道音訊信號之該降混;使用該降混來計算動態範圍控制(DRC)增益值;及組合該經編碼音訊信號與該等所計算DRC增益值作為與該經編碼音訊信號相關聯之後設資料。
10)一種數位音訊編碼器裝置,其包含:一響度參數計算器,其用以計算描述一多頻道音訊信號之一降混之響度設定檔的一組響度參
數;一編碼器,其用以編碼該多頻道音訊信號;及用於提供該經編碼音訊信號連同該組所計算響度參數及該多頻道音訊信號之一基本頻道佈局作為與該經編碼音訊信號相關聯之後設資料的構件。
11)一種用於解碼音訊之方法,其包含:接收一經編碼音訊信號及與該經編碼音訊信號相關聯之後設資料,其中該後設資料包括一組響度參數;解碼該經編碼音訊信號以產生一經解碼音訊信號;及根據a)包括於該後設資料中之該組響度參數、b)播放音量或c)目標空餘空間中的一者來處理該經解碼音訊信號以達成該經解碼音訊信號之動態範圍壓縮。
如上文所解釋,本發明之一實施例可為被儲存有指令之機器可讀媒體(諸如,微電子記憶體),該等指令使一或多個資料處理組件(此處通常被稱作「處理器」)程式化以執行上文所描述之數位音訊處理操作,包括編碼、解碼、響度量測、濾波、混頻、相加、反轉、比較及決策制定。此等指令可為媒體播放器應用程式之部分。在其他實施例中,彼等操作中之一些係可由含有固線式邏輯之特定硬體組件(例如,專用數位濾波器區塊、狀態機)執行。替代地,彼等操作係可由程式化資料處理組件及固定固線式電路組件之任何組合執行。
雖然已在隨附圖式中描述及展示某些實施例,但應理解,此等實施例僅僅說明而非限定本發明,且本發明不限於所展示及描述之特定建構及配置,此係因為各種其他修改可為一般熟習此項技術者所想到。舉例而言,儘管編碼級及解碼級中每一者已在一項實施例中被描述為(例如)在經由網際網路而通信之音訊內容產生者機器及音訊內容消費者機器中分離地操作,但亦可在同一機器內(例如)作為轉碼處理序之部分而執行編碼及解碼。因此,該描述應被認作說明性的而非限制性的。
2‧‧‧編碼器
4‧‧‧DRC處理器
6‧‧‧音訊量測模組
7‧‧‧輔助資料頻道/輔助資料頻道處理器
8‧‧‧多工器
9‧‧‧預調節濾波器
20‧‧‧降混處理器/降混模組
Claims (19)
- 一種用於編碼音訊信號之方法,其包含:將一音訊正規化增益值應用於一音訊信號以產生一正規化信號;且接著處理該正規化信號以計算用於該正規化信號之複數個動態範圍控制(DRC)增益值,其中根據複數個預定義DRC特性中之一選定DRC特性來計算該等DRC增益值;編碼該音訊信號;及提供該等DRC增益值作為與該經編碼音訊信號相關聯之後設資料。
- 如請求項1之方法,其進一步包含:提供該選定DRC特性之一索引作為該經編碼音訊信號之後設資料。
- 如請求項1之方法,其中該音訊正規化增益值為一節目響度正規化增益值。
- 如請求項1之方法,其中提供該等DRC增益值作為後設資料包含:將該等DRC增益值與該經編碼音訊信號一起內嵌至一主要資料頻道中;及將該選定DRC特性之該索引連同其他後設資料一起提供於與該主要資料頻道相關聯之一輔助資料頻道中。
- 如請求項4之方法,其中該其他後設資料包含一節目響度值,及一真實尖峰值。
- 如請求項1之方法,其進一步包含:將該等DRC增益值應用於自該音訊信號或該正規化信號中之 一者導出之一信號,以產生一動態範圍調整式信號;及基於該動態範圍調整式信號來執行音訊量測以計算一節目響度值;及使用該節目響度值來計算該音訊正規化增益值。
- 如請求項6之方法,其進一步包含:基於該音訊信號之一特性及/或基於被預期為接收該經編碼音訊信號之一播放器件之一特性來組態一濾波器;及在執行該音訊量測之前使用該濾波器來預調節該動態範圍調整式信號。
- 如請求項1之方法,其進一步包含:回應於該音訊信號中之音訊內容的類型,基於分別與複數種不同類型之音訊內容相關聯的複數個預定目標響度值而自動地選擇該音訊正規化增益值。
- 一種數位音訊編碼器裝置,其包含:一正規化器,其用以將一音訊正規化增益值應用於一音訊信號以便產生一正規化音訊信號;一動態範圍控制(DRC)處理器,其用以處理該正規化音訊信號以計算用於該正規化音訊信號之複數個DRC增益值,其中根據複數個預定義DRC特性中之一選定DRC特性來計算該等DRC增益值;一編碼器,其用以接收該音訊信號;及用於提供該等DRC增益值作為與該經編碼音訊信號相關聯之後設資料的構件。
- 如請求項9之裝置,其進一步包含用於提供該選定DRC特性之一索引作為與該經編碼音訊信號相關聯之後設資料的構件。
- 如請求項9之裝置,其進一步包含: 一音訊量測單元,其用以基於該音訊信號來計算響度參數;及用於提供該等響度參數作為與該經編碼信號相關聯之後設資料的構件。
- 如請求項11之裝置,其進一步包含:一降混處理器,其用以計算該音訊信號之一降混,其中該音訊量測單元用以基於該降混來計算該等響度參數。
- 如請求項11之裝置,其進一步包含一預調節濾波器,該音訊信號用以在輸入至該音訊量測單元之前傳遞通過該預調節濾波器。
- 一種用於解碼音訊之方法,其包含:接收一經編碼音訊信號;接收與該經編碼音訊信號相關聯之後設資料,該後設資料包括複數個動態範圍控制(DRC)增益值;解碼該經編碼音訊信號以產生一經解碼音訊信號;自複數個可用DRC特性當中選擇一當前DRC特性,且基於該當前DRC特性來修改該等DRC增益值;及將該等經修改DRC增益值應用於該經解碼音訊信號以產生一DRC調整式音訊信號。
- 如請求項14之方法,其中該經接收後設資料進一步包含一先前選定DRC特性之一索引,根據該索引,當正產生該經編碼音訊信號時計算該等DRC增益值,且其中該選定當前DRC特性係與該索引相關聯。
- 如請求項14之方法,其中該經接收後設資料進一步包括選自由以下各者組成之群組的複數個值:節目響度、真實尖峰、響度範圍、最大瞬間響度,及短期響度值。
- 如請求項14之方法,其中自該複數個可用DRC特性當中選擇該當 前DRC特性係進一步基於以下各者中之一或多者:包括深夜、步行、跑步及汽車之使用者內容脈絡;及揚聲器動態範圍。
- 一種數位音訊解碼器裝置,其包含:一解碼器,其用以接收一經編碼音訊信號且產生經解碼音訊信號;一動態範圍控制(DRC)處理器,其用以接收與該經編碼音訊信號相關聯之後設資料,其中該後設資料包括複數個DRC增益值,該DRC處理器用以自複數個經儲存DRC特性當中選擇一當前DRC特性,且基於該當前DRC特性來修改該等DRC增益值;及一乘法器,其用以將該等經修改DRC增益值應用於該經解碼音訊信號以產生DRC調整式音訊信號。
- 如請求項18之裝置,其中該DRC處理器用以接收與該經編碼音訊信號相關聯之另外後設資料,該另外後設資料包含一先前選定DRC特性之一索引,根據該索引,當正產生該經編碼音訊信號時計算該等DRC增益值,且其中由該DRC處理器選擇之該當前DRC特性係與該索引相關聯。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361806570P | 2013-03-29 | 2013-03-29 | |
US14/225,950 US9559651B2 (en) | 2013-03-29 | 2014-03-26 | Metadata for loudness and dynamic range control |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201443886A true TW201443886A (zh) | 2014-11-16 |
TWI562138B TWI562138B (en) | 2016-12-11 |
Family
ID=51620877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103111835A TWI562138B (en) | 2013-03-29 | 2014-03-28 | Method and apparatus for encoding and decoding audio signal |
Country Status (9)
Country | Link |
---|---|
US (4) | US9559651B2 (zh) |
EP (2) | EP3540733A1 (zh) |
KR (1) | KR101761041B1 (zh) |
CN (3) | CN105103222B (zh) |
AU (1) | AU2014241222B2 (zh) |
ES (1) | ES2738494T3 (zh) |
HK (1) | HK1215489A1 (zh) |
TW (1) | TWI562138B (zh) |
WO (1) | WO2014160849A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI651718B (zh) * | 2017-09-12 | 2019-02-21 | 華碩電腦股份有限公司 | 音訊處理方法及音訊處理裝置 |
Families Citing this family (125)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US9202509B2 (en) | 2006-09-12 | 2015-12-01 | Sonos, Inc. | Controlling and grouping in a multi-zone media system |
US8788080B1 (en) | 2006-09-12 | 2014-07-22 | Sonos, Inc. | Multi-channel pairing in a media system |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
US8923997B2 (en) | 2010-10-13 | 2014-12-30 | Sonos, Inc | Method and apparatus for adjusting a speaker system |
US11265652B2 (en) | 2011-01-25 | 2022-03-01 | Sonos, Inc. | Playback device pairing |
US11429343B2 (en) | 2011-01-25 | 2022-08-30 | Sonos, Inc. | Stereo playback configuration and control |
EP2695161B1 (en) * | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
WO2013078056A1 (en) * | 2011-11-22 | 2013-05-30 | Dolby Laboratories Licensing Corporation | Method and system for generating an audio metadata quality score |
US8811630B2 (en) | 2011-12-21 | 2014-08-19 | Sonos, Inc. | Systems, methods, and apparatus to filter audio |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9729115B2 (en) | 2012-04-27 | 2017-08-08 | Sonos, Inc. | Intelligently increasing the sound level of player |
US9524098B2 (en) | 2012-05-08 | 2016-12-20 | Sonos, Inc. | Methods and systems for subwoofer calibration |
JP6174129B2 (ja) | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
USD721352S1 (en) | 2012-06-19 | 2015-01-20 | Sonos, Inc. | Playback device |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9690271B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration |
US9668049B2 (en) | 2012-06-28 | 2017-05-30 | Sonos, Inc. | Playback device calibration user interfaces |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9690539B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration user interface |
US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
EP2873073A1 (en) * | 2012-07-12 | 2015-05-20 | Dolby Laboratories Licensing Corporation | Embedding data in stereo audio using saturation parameter modulation |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
US8965033B2 (en) | 2012-08-31 | 2015-02-24 | Sonos, Inc. | Acoustic optimization |
US9008330B2 (en) | 2012-09-28 | 2015-04-14 | Sonos, Inc. | Crossover frequency adjustments for audio speakers |
RU2719690C2 (ru) | 2013-01-21 | 2020-04-21 | Долби Лабораторис Лайсэнзин Корпорейшн | Аудиокодер и аудиодекодер с метаданными громкости и границы программы |
RU2631139C2 (ru) | 2013-01-21 | 2017-09-19 | Долби Лэборетериз Лайсенсинг Корпорейшн | Оптимизация громкости и динамического диапазона через различные устройства воспроизведения |
EP2959479B1 (en) | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
USD721061S1 (en) | 2013-02-25 | 2015-01-13 | Sonos, Inc. | Playback device |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
EP2981910A1 (en) | 2013-04-05 | 2016-02-10 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN118016076A (zh) | 2013-09-12 | 2024-05-10 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
CN109920440B (zh) | 2013-09-12 | 2024-01-09 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
SG11201603116XA (en) * | 2013-10-22 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
US9226073B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9226087B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
CN110808723A (zh) | 2014-05-26 | 2020-02-18 | 杜比实验室特许公司 | 音频信号响度控制 |
US9367283B2 (en) | 2014-07-22 | 2016-06-14 | Sonos, Inc. | Audio settings |
EP3175634B1 (en) * | 2014-08-01 | 2021-01-06 | Steven Jay Borne | Audio device |
USD883956S1 (en) | 2014-08-13 | 2020-05-12 | Sonos, Inc. | Playback device |
JP6683618B2 (ja) * | 2014-09-08 | 2020-04-22 | 日本放送協会 | 音声信号処理装置 |
US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9891881B2 (en) | 2014-09-09 | 2018-02-13 | Sonos, Inc. | Audio processing algorithm database |
US10127006B2 (en) | 2014-09-09 | 2018-11-13 | Sonos, Inc. | Facilitating calibration of an audio playback device |
EP3201916B1 (en) * | 2014-10-01 | 2018-12-05 | Dolby International AB | Audio encoder and decoder |
EP4044180A1 (en) | 2014-10-01 | 2022-08-17 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
CN112185402B (zh) | 2014-10-10 | 2024-06-04 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
KR101701396B1 (ko) * | 2014-10-28 | 2017-02-01 | 주식회사 엑티저 | 오디오 신호 처리 장치 및 방법 |
US9973851B2 (en) | 2014-12-01 | 2018-05-15 | Sonos, Inc. | Multi-channel playback of audio content |
US9584911B2 (en) * | 2015-03-27 | 2017-02-28 | Cirrus Logic, Inc. | Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses |
WO2016172593A1 (en) | 2015-04-24 | 2016-10-27 | Sonos, Inc. | Playback device calibration user interfaces |
US10664224B2 (en) | 2015-04-24 | 2020-05-26 | Sonos, Inc. | Speaker calibration user interface |
USD886765S1 (en) | 2017-03-13 | 2020-06-09 | Sonos, Inc. | Media playback device |
USD768602S1 (en) | 2015-04-25 | 2016-10-11 | Sonos, Inc. | Playback device |
US20170085972A1 (en) | 2015-09-17 | 2017-03-23 | Sonos, Inc. | Media Player and Media Player Design |
USD906278S1 (en) | 2015-04-25 | 2020-12-29 | Sonos, Inc. | Media player device |
USD920278S1 (en) | 2017-03-13 | 2021-05-25 | Sonos, Inc. | Media playback device with lights |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
CN112291699B (zh) | 2015-06-17 | 2022-07-22 | 弗劳恩霍夫应用研究促进协会 | 用于处理音频信号的音频处理器和方法及音频编码器 |
US9729118B2 (en) | 2015-07-24 | 2017-08-08 | Sonos, Inc. | Loudness matching |
US9538305B2 (en) | 2015-07-28 | 2017-01-03 | Sonos, Inc. | Calibration error conditions |
US9877134B2 (en) * | 2015-07-28 | 2018-01-23 | Harman International Industries, Incorporated | Techniques for optimizing the fidelity of a remote recording |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9736610B2 (en) | 2015-08-21 | 2017-08-15 | Sonos, Inc. | Manipulation of playback device response using signal processing |
US9712912B2 (en) | 2015-08-21 | 2017-07-18 | Sonos, Inc. | Manipulation of playback device response using an acoustic filter |
US9800905B2 (en) * | 2015-09-14 | 2017-10-24 | Comcast Cable Communications, Llc | Device based audio-format selection |
US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
WO2017049169A1 (en) | 2015-09-17 | 2017-03-23 | Sonos, Inc. | Facilitating calibration of an audio playback device |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
US11106423B2 (en) | 2016-01-25 | 2021-08-31 | Sonos, Inc. | Evaluating calibration of a playback device |
US9886234B2 (en) | 2016-01-28 | 2018-02-06 | Sonos, Inc. | Systems and methods of distributing audio to one or more playback devices |
TWI720153B (zh) * | 2016-03-29 | 2021-03-01 | 日商新力股份有限公司 | 送訊裝置、送訊方法、收訊裝置、收訊方法及收送訊系統 |
US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
CN105845151B (zh) * | 2016-05-30 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 应用于语音识别前端的音频增益调整方法和装置 |
US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
USD827671S1 (en) | 2016-09-30 | 2018-09-04 | Sonos, Inc. | Media playback device |
US10412473B2 (en) | 2016-09-30 | 2019-09-10 | Sonos, Inc. | Speaker grill with graduated hole sizing over a transition area for a media device |
USD851057S1 (en) | 2016-09-30 | 2019-06-11 | Sonos, Inc. | Speaker grill with graduated hole sizing over a transition area for a media device |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US11030515B2 (en) * | 2016-12-30 | 2021-06-08 | Google Llc | Determining semantically diverse responses for providing as suggestions for inclusion in electronic communications |
EP3574583B1 (en) | 2017-03-31 | 2020-12-09 | Dolby International AB | Inversion of dynamic range control |
KR102441950B1 (ko) | 2017-08-11 | 2022-09-08 | 삼성전자 주식회사 | 오디오 신호의 크기에 기반하여 오디오 신호를 증폭하는 방법 및 이를 구현한 전자 장치 |
US10171054B1 (en) * | 2017-08-24 | 2019-01-01 | International Business Machines Corporation | Audio adjustment based on dynamic and static rules |
CN111108760B (zh) * | 2017-09-29 | 2021-11-26 | 苹果公司 | 用于空间音频的文件格式 |
KR102491646B1 (ko) * | 2017-11-30 | 2023-01-26 | 삼성전자주식회사 | 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치 |
CN109979475A (zh) * | 2017-12-26 | 2019-07-05 | 深圳Tcl新技术有限公司 | 解决回声消除失效的方法、系统及存储介质 |
KR20240067965A (ko) | 2018-01-07 | 2024-05-17 | 그레이스노트, 인코포레이티드 | 볼륨 조절을 위한 방법 및 장치 |
US11330370B2 (en) | 2018-02-15 | 2022-05-10 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
US11011180B2 (en) * | 2018-06-29 | 2021-05-18 | Guoguang Electric Company Limited | Audio signal dynamic range compression |
US10911013B2 (en) | 2018-07-05 | 2021-02-02 | Comcast Cable Communications, Llc | Dynamic audio normalization process |
EP3821430A1 (en) * | 2018-07-12 | 2021-05-19 | Dolby International AB | Dynamic eq |
US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
US11206484B2 (en) | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
CN109286922B (zh) * | 2018-09-27 | 2021-09-17 | 珠海市杰理科技股份有限公司 | 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备 |
RU2768224C1 (ru) * | 2018-12-13 | 2022-03-23 | Долби Лабораторис Лайсэнзин Корпорейшн | Двусторонняя медийная аналитика |
CN116866816A (zh) | 2019-03-14 | 2023-10-10 | 高迪奥实验室公司 | 用于控制响度级的音频信号处理方法和装置 |
EP3997700A1 (en) * | 2019-07-09 | 2022-05-18 | Dolby Laboratories Licensing Corporation | Presentation independent mastering of audio content |
US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
JP7434792B2 (ja) * | 2019-10-01 | 2024-02-21 | ソニーグループ株式会社 | 送信装置及び受信装置、並びに音響システム |
EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
KR102295287B1 (ko) * | 2019-12-26 | 2021-08-30 | 네이버 주식회사 | 오디오 신호 처리 방법 및 시스템 |
US11398216B2 (en) | 2020-03-11 | 2022-07-26 | Nuance Communication, Inc. | Ambient cooperative intelligence system and method |
KR102550396B1 (ko) * | 2020-03-12 | 2023-07-04 | 가우디오랩 주식회사 | 메타데이터를 이용하여 오디오 신호의 라우드니스 레벨을 제어 방법 및 이를 이용하는 장치 |
CN113470692B (zh) * | 2020-03-31 | 2024-02-02 | 抖音视界有限公司 | 音频处理方法、装置、可读介质及电子设备 |
US11907611B2 (en) * | 2020-11-10 | 2024-02-20 | Apple Inc. | Deferred loudness adjustment for dynamic range control |
JP2023551222A (ja) * | 2020-11-24 | 2023-12-07 | ガウディオ・ラボ・インコーポレイテッド | オーディオ信号の正規化を行う方法及びそのための装置 |
CN112700784B (zh) * | 2020-12-24 | 2023-12-15 | 惠州市德赛西威汽车电子股份有限公司 | 一种基于itu-r bs.1770的响度校准方法及存储介质 |
CN112951266B (zh) * | 2021-02-05 | 2024-02-06 | 杭州网易云音乐科技有限公司 | 齿音调整方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4295428B2 (ja) | 2000-12-06 | 2009-07-15 | 富士通マイクロエレクトロニクス株式会社 | Firフィルタ、firフィルタの制御方法、およびfirフィルタを有する半導体集積回路、firフィルタでフィルタリングされたデータを送信する通信システム |
KR20030004978A (ko) * | 2001-07-07 | 2003-01-15 | 삼성전자 주식회사 | 이동 통신시스템에서 초기전송 및 재전송 방법 |
MXPA04012865A (es) * | 2002-06-24 | 2005-03-31 | Matsushita Electric Ind Co Ltd | Dispositivo de preparacion de metadatos, metodo de preparacion para el mismo y dispositivo de recuperacion. |
US20040228455A1 (en) * | 2003-05-13 | 2004-11-18 | Texley Eric M. | Dynamic range compression modification of a digital telephone switch for individual hearing characteristics |
BRPI0410740A (pt) | 2003-05-28 | 2006-06-27 | Dolby Lab Licensing Corp | método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio |
US7398207B2 (en) | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
TWI233091B (en) * | 2003-11-18 | 2005-05-21 | Ali Corp | Audio mixing output device and method for dynamic range control |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
KR100948256B1 (ko) | 2004-06-24 | 2010-03-18 | 한국전자통신연구원 | 타겟팅 지원을 위한 확장된 서술구조와 이를 적용한티비애니타임 서비스 방법 및 시스템 |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7456093B2 (en) | 2004-07-03 | 2008-11-25 | Taiwan Semiconductor Manufacturing Co., Ltd. | Method for improving a semiconductor device delamination resistance |
KR100561440B1 (ko) * | 2004-07-24 | 2006-03-17 | 삼성전자주식회사 | 채널 변경에 따른 음량 자동 보정 장치 및 그 방법 |
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
MX2009002795A (es) * | 2006-09-18 | 2009-04-01 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de objetos de audio. |
US9053753B2 (en) * | 2006-11-09 | 2015-06-09 | Broadcom Corporation | Method and system for a flexible multiplexer and mixer |
JP5541928B2 (ja) * | 2007-03-09 | 2014-07-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
EP2146522A1 (en) | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
KR101599535B1 (ko) | 2008-07-29 | 2016-03-03 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 장치 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
RU2468451C1 (ru) * | 2008-10-29 | 2012-11-27 | Долби Интернэшнл Аб | Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала |
US20100263002A1 (en) | 2009-04-09 | 2010-10-14 | At&T Intellectual Property I, L.P. | Distribution of modified or selectively chosen media on a procured channel |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) * | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
US8736700B2 (en) * | 2010-09-30 | 2014-05-27 | Apple Inc. | Techniques for synchronizing audio and video data in an image signal processing system |
WO2013102799A1 (en) | 2012-01-06 | 2013-07-11 | Sony Ericsson Mobile Communications Ab | Smart automatic audio recording leveler |
CN103325380B (zh) * | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9991861B2 (en) * | 2012-08-10 | 2018-06-05 | Bellevue Investments Gmbh & Co. Kgaa | System and method for controlled dynamics adaptation for musical content |
RU2631139C2 (ru) | 2013-01-21 | 2017-09-19 | Долби Лэборетериз Лайсенсинг Корпорейшн | Оптимизация громкости и динамического диапазона через различные устройства воспроизведения |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
CN109920440B (zh) * | 2013-09-12 | 2024-01-09 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
-
2014
- 2014-03-26 US US14/225,950 patent/US9559651B2/en active Active
- 2014-03-27 CN CN201480018634.8A patent/CN105103222B/zh active Active
- 2014-03-27 EP EP19170552.4A patent/EP3540733A1/en active Pending
- 2014-03-27 CN CN202010164205.9A patent/CN111370007B/zh active Active
- 2014-03-27 KR KR1020157026825A patent/KR101761041B1/ko active IP Right Grant
- 2014-03-27 ES ES14724887T patent/ES2738494T3/es active Active
- 2014-03-27 EP EP14724887.6A patent/EP2956936B1/en active Active
- 2014-03-27 AU AU2014241222A patent/AU2014241222B2/en active Active
- 2014-03-27 CN CN202311381485.9A patent/CN117275493A/zh active Pending
- 2014-03-27 WO PCT/US2014/031992 patent/WO2014160849A2/en active Application Filing
- 2014-03-28 TW TW103111835A patent/TWI562138B/zh active
-
2016
- 2016-03-23 HK HK16103436.8A patent/HK1215489A1/zh unknown
-
2017
- 2017-01-27 US US15/417,424 patent/US10644666B2/en active Active
-
2020
- 2020-01-29 US US16/776,297 patent/US10958229B2/en active Active
-
2021
- 2021-03-03 US US17/191,481 patent/US11563411B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI651718B (zh) * | 2017-09-12 | 2019-02-21 | 華碩電腦股份有限公司 | 音訊處理方法及音訊處理裝置 |
Also Published As
Publication number | Publication date |
---|---|
CN105103222B (zh) | 2020-03-17 |
US10644666B2 (en) | 2020-05-05 |
US10958229B2 (en) | 2021-03-23 |
EP2956936A2 (en) | 2015-12-23 |
US20200169233A1 (en) | 2020-05-28 |
HK1215489A1 (zh) | 2016-08-26 |
CN111370007B (zh) | 2023-10-27 |
AU2014241222B2 (en) | 2016-10-27 |
US11563411B2 (en) | 2023-01-24 |
ES2738494T3 (es) | 2020-01-23 |
KR20150122760A (ko) | 2015-11-02 |
US20170201219A1 (en) | 2017-07-13 |
US9559651B2 (en) | 2017-01-31 |
CN111370007A (zh) | 2020-07-03 |
WO2014160849A3 (en) | 2014-11-27 |
US20210351754A1 (en) | 2021-11-11 |
CN117275493A (zh) | 2023-12-22 |
EP2956936B1 (en) | 2019-04-24 |
EP3540733A1 (en) | 2019-09-18 |
AU2014241222A1 (en) | 2015-10-08 |
US20140294200A1 (en) | 2014-10-02 |
KR101761041B1 (ko) | 2017-07-25 |
CN105103222A (zh) | 2015-11-25 |
WO2014160849A2 (en) | 2014-10-02 |
TWI562138B (en) | 2016-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11563411B2 (en) | Metadata for loudness and dynamic range control | |
JP6778781B2 (ja) | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 | |
US9576585B2 (en) | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata of new media devices | |
US9154102B2 (en) | System for combining loudness measurements in a single playback mode | |
CN106796799B (zh) | 高效drc配置文件传输 |