TW201506912A - 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 - Google Patents
用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 Download PDFInfo
- Publication number
- TW201506912A TW201506912A TW103122263A TW103122263A TW201506912A TW 201506912 A TW201506912 A TW 201506912A TW 103122263 A TW103122263 A TW 103122263A TW 103122263 A TW103122263 A TW 103122263A TW 201506912 A TW201506912 A TW 201506912A
- Authority
- TW
- Taiwan
- Prior art keywords
- level
- signal
- decoding
- encoded
- dynamic range
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000005236 sound signal Effects 0.000 title claims description 18
- 230000006835 compression Effects 0.000 claims abstract description 34
- 238000007906 compression Methods 0.000 claims abstract description 34
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 10
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 claims 1
- 230000011664 signaling Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
許多可攜式回放裝置無法以一致的響度與清晰度來解碼及回放具有寬廣頻寬及寬廣動態範圍的已編碼音訊內容,除非該已編碼音訊內容已經特別針對這些裝置來準備。此問題可藉由與該已編碼內容一起含括一些元資料而加以克服,該元資料藉由相對於另一已知壓縮設定值的絕對值或者微分值而指定適合的動態範圍壓縮設定值。回放裝置也可適應地施加增益及限幅至該回放音訊。揭示編碼器、轉碼器及解碼器的實施例。
Description
本發明一般有關於編碼及解碼音訊信號,且更特定而言有關於可用來編碼及解碼音訊信號以用於較廣範圍的回放裝置及收聽環境的技術。
手持式及其他類型之可攜式裝置的逐漸普及已經對媒體內容的創作者及經銷商(以及對該等裝置的設計者及製造商)在這些裝置上的回放方面產生新的機會與挑戰。許多可攜式裝置能夠回放廣泛的媒體內容類型及格式,包括那些通常與HDTV、藍光光碟或DVD之高品質、寬廣頻寬及寬廣動態範圍音訊內容關聯的媒體內容類型及格式。可攜式裝置可用來在它們本身的內部聲波變換器上或者在諸如頭戴式耳機的外部變換器上回放這類型的音訊內容;然而,它們無法以跨越不同媒體格式及內容類型的一致響度及清晰度(intelligibility)之方式來再生此內容。
10‧‧‧接收器/解碼器裝置
11、13、31、43‧‧‧信號路徑
12‧‧‧解格式器
14‧‧‧解碼器
16‧‧‧動態範圍控制器
18‧‧‧合成濾波器排
20‧‧‧增益-限幅器
21、33‧‧‧路徑
30‧‧‧編碼器/發送器裝置
32‧‧‧分析濾波器排
34、44‧‧‧元資料計算器
36‧‧‧編碼器
38‧‧‧格式器
40‧‧‧轉碼器裝置
70‧‧‧裝置
71‧‧‧匯流排
72‧‧‧處理器
73‧‧‧隨機存取記憶體
74‧‧‧唯讀記憶體
75‧‧‧I/O控制器
76、77‧‧‧通訊通道
第1圖為回放裝置的示意方塊圖。
第2圖為編碼裝置的示意方塊圖。
第3至5圖為轉碼裝置的示意方塊圖。
第6圖為可被用來實施本發明各種態樣之裝置的示意方塊圖。
本發明針對提供用以編碼及解碼音訊信號以供在包括手持式及其他類型之可攜式裝置的各種裝置上回放的改良方法。
本發明的各種態樣於下列所示的申請專利範圍中加以陳述。
本發明的各種特徵及其較佳實施例可藉由參照下列討論及隨附圖式而更佳地被理解,在該等圖式中相似元件符號意指數個圖中的相似元件。僅陳述下列討論及圖式的內容作為範例,且不應被理解成代表對本發明之範圍的限制。
本發明針對音訊資訊之編碼及解碼以供在具挑戰性的
收聽環境(諸如那些手持式及其他類型之可攜式裝置的使用者遭遇的收聽環境)中回放。音訊編碼及解碼的幾個實例由已發表的標準加以描述,諸如那些描述於由美國先進電視系統委員會在2005年6月14日所發表之「數位音訊壓縮標準(AC-3、E-AC-3)」,Revision B,Document A/52B(文中稱為「ATSC標準」)中,以及描述於由國際標準組織(ISO)所發表之ISO/IEC 13818-7,進階音訊編碼(Advanced Audio Coding,AAC)(文中稱為「MPEG-2 AAC標準」)以及ISO/IEC 14496-3,第4子部份(文中稱為「MPEG-4音訊標準」)中的標準。僅提到符合這些標準的編碼及解碼程序作為範例。也可將本發明的原則與符合其他標準的編碼系統一起使用。
發明人發現符合一些編碼標準的裝置可用特徵通常在對於手持式及其他類型之可攜式裝置典型的應用及收聽環境方面是不充足的。當這些類型的裝置被用來解碼符合這些標準之已編碼輸入信號的音訊內容時,已解碼音訊內容通常在響度位準顯著低於藉由解碼特別針對這些裝置上的回放所準備之已編碼輸入信號獲得的音訊內容的響度位準下加以再生。
符合ATSC標準的已編碼輸入信號(文中稱為「順應ATSC的已編碼信號」)例如含有已編碼音訊資訊及用以描述如何可將此資訊解碼的元資料。某些元資料參數識別動態範圍壓縮設定值,該動態範圍壓縮設定值指定當該已編碼音訊資訊被解碼時如何可將該音訊資訊的動態範圍壓
縮。該已解碼信號的全動態範圍可被保持或它可在解碼時以不同程度加以壓縮,以滿足不同應用及收聽環境的需求。其他元資料識別該已編碼音訊資訊之響度的某一度量,諸如該已編碼信號中的平均計畫位準(program level)或對話位準。此元資料可被解碼器用來調整該已編碼信號的振幅以在回放期間達到指定的響度或參考再生位準。在一些應用中,可指定或假設一或更多個參考再生位準,而在其他應用中,使用者可控制參考再生位準之設定。例如,用來將順應ATSC的已編碼信號編碼及解碼的編碼程序假設對話是在二個參考再生位準的一者中加以回放。一個位準為低於截波位準31dB,這是最大可能數位值或全刻度(full scale,FS)值,文中記為-31dBFS。使用此位準的解碼模式有時稱為「線模式(Line Mode)」,且意欲被使用於適合較廣動態範圍的應用及環境中。將另一位準設定在-20dBFS。使用此第二位準的解碼模式有時稱為「射頻模式(RF Mode)」,其意欲被使用於像是那些藉由將射頻(RF)信號調變的廣播中所遭遇的應用及環境中,此應用及環境中需要較窄的動態範圍以避免過度調變。
舉另一例子,符合MPEG-2 AAC及MPEG-4音訊標準的已編碼信號包括識別已編碼音訊資訊之平均響度位準的元資料。將順應MPEG-2 AAC及MPEG-4音訊之已編碼信號解碼的程序可容許收聽者指定想要的回放位準。解碼器使用該想要的回放位準及平均響度元資料來調整已編
碼信號的振幅,使得該想要的回放位準被達到。
當手持式及其他類型的可攜式裝置被用來將順應ATSC、順應MPEG-2 AAC、及順應MPEG-4音訊之已編碼信號的音訊內容依據這些元資料參數而解碼及回放時,動態範圍及響度位準通常不合適,因為這些類型的裝置所遭遇之不利收聽環境或者因為這些裝置中所使用之較低操作電壓造成的電氣限制。
符合其他標準的已編碼信號使用類似類型的元資料,且可包括用以指定想要的回放響度位準的供應。解碼這些信號的可攜式裝置通常遭遇相同問題。
可將本發明用來在無須特別針對這些裝置所準備之內容的情況下改善手持式及可攜式裝置使用者的收聽體驗。
第1圖為併入本發明各種態樣的一種類型之接收器/解碼器裝置10的示意方塊圖。裝置10接收來自信號路徑11的已編碼輸入信號、於解格式器(deformatter)12中施加合適的程序以自該輸入信號擷取已編碼音訊資訊及關聯的元資料、傳送該已編碼音訊資訊至解碼器14且沿信號路徑13傳送該元資料。已編碼音訊資訊包括代表聽覺刺激之頻譜內容的已編碼次頻帶信號,且元資料指定各種參數的值,該等參數包括一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。術語「動態範圍壓縮設定值」意指定義動態範圍壓縮
器之操作特性的特徵,諸如增益因子、壓縮始動時間及壓縮釋放時間。
解碼器14施加解碼程序至已編碼音訊資訊以獲得已解碼次頻帶信號,該等已解碼次頻帶信號被傳送至動態範圍控制器16。可回應於自信號路徑13所接收之解碼控制參數而調整解碼程序的操作及功能。可用來調整解碼程序的操作及功能之解碼控制參數的實例為:識別由已編碼音訊資訊所代表之音訊通道的數量及組態的參數。
動態範圍控制器16任意地調整已解碼音訊資訊的動態範圍。此調整可能回應於自信號路徑13所接收之元資料及/或由回應於來自收聽者之輸入而可被提供的控制信號而加以開啟或關閉及調整。例如,控制信號可回應於收聽者操作切換器或選擇用於裝置10的操作選項而被提供。
在符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準的實施例中,例如,已編碼輸入信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號,該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量。動態範圍控制器16可能不採取動作,這容許該音訊信號以動態範圍的最大量加以回放,或該動態範圍控制器可能修改已解碼次頻帶信號以用不同程度壓縮該動態範圍。
合成濾波器排18施加一排合成濾波器至已解碼次頻帶信號(該等已解碼次頻帶信號可能已經由動態範圍控制
器16加以調整),且在它的輸出提供了可能為數位或類比信號的時域音訊信號。
增益-限幅器20在本發明一些實施例中被用來調整時域音訊信號的振幅。將增益-限幅器20的輸出沿路徑21傳送以供隨後由聲波變換器的呈現。
第2圖為併入本發明各種態樣的編碼器/發送器裝置30的示意方塊圖。裝置30接收來自信號路徑31且代表聽覺刺激的音訊輸入信號。裝置30施加一排分析濾波器至音訊信號以獲得呈該輸入音訊信號之頻域表示的次頻帶信號或者一組代表該輸入音訊信號的頻寬限制信號。元資料計算器34分析該音訊輸入信號及/或一或更多個該音訊輸入信號所衍生的信號(諸如該音訊輸入信號的已修改版本或來自分析濾波器排32的次頻帶信號)以計算元資料,該元資料指定用於各種參數的值,該等參數包括編碼控制參數、一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。元資料計算器34可分析時域信號、頻域信號、或時域信號及頻域信號的組合。也可回應於自路徑33所接收的一或更多個元資料參數而調整由元資料計算器34所實施的計算。編碼器36施加編碼程序至分析濾波器排32的輸出,以獲得包括已編碼次頻帶信號的已編碼音訊資訊,該已編碼音訊資訊被傳送至格式器38。可回應於自路徑33所接收之編碼控制參數而調整編碼程序。編碼程序也可沿路徑33產生其他解碼控制參數,以供裝置10中所實施的程序用來解
碼該已編碼音訊資訊。格式器38組合該已編碼音訊資訊及該元資料的至少一些成為具有適用於傳輸或儲存之格式的已編碼輸出信號,該元資料包括該一或更多個解碼控制參數及該一或更多個指定動態範圍壓縮的參數。
在符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準的實施例中,例如,已編碼輸出信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號,該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量且具有用於在參考再生位準回放的振幅。
解格式器12、解碼器14、合成濾波器排18、分析濾波器排32、編碼器36及格式器38在設計及操作上可為習知的。幾個實例包括符合上述已發表標準的對應組件。這些標準中所指定或建議之組件的實施例適合與本發明一起使用,但它們不是必需的。這些組件的特定實施例不是關鍵的。
第3至5圖為轉碼器裝置40之不同實施例的示意方塊圖,該轉碼器裝置包含上述裝置10及裝置30中的一些組件。這些組件實質上以與它們的對應部分相同的方式操作。第3圖中所示的裝置40能夠轉碼自路徑11所接收的已編碼輸入信號成為符合相同編碼標準的已修改版本。在此實施例中,裝置40接收來自信號路徑11的已編碼輸入信號、於解格式器12中施加合適的程序以自該已編碼輸入信號擷取第一已編碼音訊資訊及關聯的元資料、傳送該
第一已編碼音訊資訊至解碼器14及至格式器38、且沿信號路徑43傳送該元資料。該第一已編碼音訊資訊包括代表聽覺刺激之頻譜內容的已編碼次頻帶信號,且該元資料指定用於各種參數的值,該等參數包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的參數。解碼器14施加解碼程序至該第一已編碼音訊資訊以獲得已解碼次頻帶信號。可回應於自信號路徑43所接收之該一或更多個解碼控制參數而調整解碼程序的操作及功能。次頻帶信號可為聽覺刺激的頻域表示或者一組代表該聽覺刺激的頻寬限制信號。
元資料計算器44分析已解碼次頻帶信號及/或自該等已解碼次頻帶信號所衍生的一或更多個信號以計算一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的參數值。例如,該一或更多個信號可藉由施加合成濾波器排18至該等已解碼次頻帶信號所衍生。可回應於自路徑43所接收的元資料而調整由元資料計算器44所實施的計算。如果元資料計算不需要合成濾波器排18的輸出,則可自此實施例刪去該合成濾波器排。
裝置40的另一實施例顯示於第4圖中。此實施例類似於第3圖中所示的實施例,但包括編碼器36。該編碼器36的含括係容許裝置40轉碼自路徑11所接收的已編碼輸入信號(符合第一編碼標準)成為符合第二編碼標準的已編碼輸出信號,該第二編碼標準可能與該第一編碼標準相同或相異,前提是該二個編碼標準的次頻帶信號相
容。這可能在此實施例中藉由使編碼器36施加編碼程序至次頻帶信號以獲得符合該第二編碼標準的第二已編碼音訊資訊而加以完成。將第二已編碼音訊資訊傳送至格式器38。可回應於自路徑43所接收的元資料而調整編碼程序。編碼程序也可沿路徑43產生其他元資料,以供裝置40中所實施的程序用來解碼該已編碼音訊資訊。格式器38組合自路徑43所接收的元資料及它接收的已編碼音訊資訊成為具有適用於傳輸或儲存之格式的已編碼輸出信號。
裝置40的另一實施例顯示於第5圖中。此實施例包括合成濾波器排18,其被施加至已解碼次頻帶信號以獲得已編碼音訊資訊的時域或寬頻表示。合成濾波器排18及分析濾波器排32的含括係容許裝置40基本上在編碼標準的任何選擇之間轉碼。將合成濾波器排18的輸出傳送至分析濾波器排32,該分析濾波器排產生次頻帶信號以供編碼器36編碼。編碼器36施加編碼程序至分析濾波器排32的輸出以產生第二已編碼音訊資訊,該第二已編碼音訊資訊被傳送至格式器38。編碼程序也可沿路徑43產生其他元資料,以供裝置40中所實施的程序用來解碼該已編碼音訊資訊。元資料計算器44可自它對於下列之任一者或所有者的分析來計算元資料參數值:自解碼器14所接收的次頻帶信號、合成濾波器排18的輸出、及分析濾波器排32的輸出。
將裝置10及裝置30的一些態樣更詳細地描述於下。
這些描述應用至裝置40的對應特徵。這些態樣在符合上述ATSC標準之方法及裝置的特徵及特性方面加以描述。這些特定特徵及特性僅以範例方式加以討論。這些實施例隱含的原理可直接應用於符合其他標準的方法及裝置。
上述回放問題可藉由使用下述三種不同技術的一或更多者而解決。第一種技術使用增益-限幅且可僅藉由裝置10中的特徵來實施。第二及第三種技術使用動態範圍壓縮且它們的實施需要裝置10及裝置30兩者中的特徵。
第一種技術將裝置10操作於RF模式中而不是線模式中,使得它以動態範圍控制器16提供較高動態範圍壓縮位準及較高參考再生位準的方式來解碼順應ATSC的已編碼輸入信號。增益-限幅器20提供額外的增益,提高有效參考再生位準的值自-14dBFS至-8dBFS。實驗結果指示參考位準等於-11dBFS對許多應用產生良好結果。
增益-限幅器20也施加限幅操作以防止被放大的數位信號超過0dBFS。限幅器的操作特性可影響已再生音訊的感知品質(perceived quality),但對本發明而言沒有特定限幅器是關鍵的。限幅器基本上可用任何可能想要的方式加以實施。較佳地,將限幅器設計成提供「軟性的」限幅功能,而不是「硬性的」截波功能。
第二種技術容許裝置10施加動態範圍控制器16中的一或更多個已修改動態範圍壓縮參數。解格式器12獲得來自已編碼輸入信號的微分動態範圍壓縮(dynamic range compression,DRC)參數值,且將該微分參數值與習知DRC參數值一起沿路徑13傳送至動態範圍控制器16。動態範圍控制器16藉由以算術方式結合該等習知DRC參數值與對應的微分DRC參數值來計算它需要的該一或更多個DRC參數值。在此情況中不需要使用增益-限幅器20。
藉由產生已編碼輸入信號的編碼器/發送器裝置30將微分DRC參數值提供於該已編碼輸入信號中。此將描述於下。
如果已編碼輸入信號不含有這些微分DRC值,裝置10可依據上述第一種技術使用增益-限幅器20。
第三種技術容許裝置10依據動態範圍控制器16中的新動態範圍壓縮設定值來施加動態範圍壓縮。解格式器12獲得一或更多個來自已編碼輸入信號之用於該新設定值的DRC參數值,且沿路徑13傳送該一或更多個DRC參數值至動態範圍控制器16。在此情況中不需要使用增益-限幅器20。
藉由產生已編碼輸入信號的編碼器/發送器裝置30將用於新動態範圍壓縮設定值的DRC參數值提供於該已編碼輸入信號中。此將描述於下。
如果已編碼輸入信號不含有該一或更多個用於該新DRC設定值的DRC參數值,裝置10可依據上述第一種技術使用增益-限幅器20。
藉由使用自已編碼輸入信號所擷取的微分DRC參數值來將以上討論之第二種技術的程序實施於裝置10中。這些微分參數值由產生已編碼信號的裝置30所提供。
裝置30提供一組微分DRC參數值,該組微分DRC參數值代表一組將出現於已編碼信號中的DRC參數值與一組防止已解碼音訊信號樣本超過0dBFS的較高參考再生位準的用於新DRC設定值之對應基參數值之間的差異。對本發明而言沒有計算DRC參數值的特定方法是關鍵的。符合ATSC標準之計算DRC參數值的已知方法係揭示於由美國先進電視系統委員會在2009年11月4日所發表之「ATSC Recommended Practice:Techniques for Establishing an Maintaining Audio Loudness for Digital Television」,Document A/85中,尤其是Section 9與Annex F,以及於Robinson等人之「Dynamic Range Control via Metadata」中,preprint no.5028,107th AES
Convention,New York,1999年9月。
如果已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準,增加參考再生位準的值自-14dBFS至-8dBFS。實驗結果指示參考位準等於-11dBFS對許多應用產生良好結果。
對於順應ATSC的已編碼輸出信號,元資料計算器34計算該標準中所指示之對應基參數「compr」的微分參數值。格式器38可組合該微分參數值成為各已編碼信號訊框被記為「addbsi(額外位元串流資訊)」及/或「auxdata(輔助資料)」的部分。如果將微分參數值組合成為「addbsi」或「auxdata」部分,已編碼信號將與所有順應ATSC的解碼器相容。那些無法辨識微分參數值的解碼器仍可藉由忽略「addbsi」或「auxdata」部分而正確地處理及解碼該已編碼信號訊框。更多細節參照上述之A/52B Document。
對於符合MPEG-2 AAC或MPEG-4音訊標準的已編碼輸出信號,格式器38可組合該等微分參數值成為各已編碼信號訊框在該二個標準中被記為「Fill_Element」或「Data_Stream_Element」的部分。如果將微分參數值組合成為這些部分的任一者,已編碼信號將與所有順應MPEG-2 AAC及MPEG-4音訊標準的解碼器相容。更多細節參照上述之ISO/IEC 13818-7及ISO/IEC 14496-3。
微分參數值可被計算且以一速率被插入至已編碼信號中,該速率大於、等於、或小於對應基參數於該已編碼信
號中的速率。用於微分值的速率可變動。也可將用以指示先前的微分值是否應被再度使用的旗標或位元含括於已編碼信號中。
藉由使用自已編碼輸入信號所擷取之用於新動態範圍壓縮設定值的DRC參數值來將以上討論之第三種技術的程序實施於裝置10中。這些參數值由產生已編碼信號的裝置30所提供。
裝置30藉由計算防止已解碼音訊信號樣本超過0dBFS的較高參考再生位準所需要的參數值而衍生出用於新DRC設定值的DRC參數值。
如果已編碼輸出信號符合ATSC標準、MPEG-2 AAC或MPEG-4音訊標準,元資料計算器34根據參考再生位準的值自-14dBFS增加至-8dBFS的假設來計算DRC壓縮值。實驗結果指示參考位準等於-11dBFS對許多應用產生良好結果。格式器38可組合用於該DRC設定值的參數值成為各已編碼信號訊框的部分,如同以上針對微分參數所述。這些訊框部分的使用係容許已編碼信號與所有符合各別標準的解碼器相容。
併入本發明各種態樣的裝置可用各種方式加以實施,包括由電腦或包括更特定組件(諸如耦接至類似於一般用
途電腦中出現之組件的數位信號處理器(DSP)電路)的某其他裝置所執行的軟體。第6圖為可被用來實施本發明態樣之裝置70的示意方塊圖。處理器72提供運算資源。RAM 73為用於處理之處理器72所使用的系統隨機存取記憶體(RAM)。ROM 74代表諸如唯讀記憶體(ROM)的一些持續儲存器的形式,用以儲存操作裝置70所需的程式且可能用以進行本發明各種態樣。I/O控制器75代表用以藉由通訊通道76、77接收輸入信號及發送輸出信號的介面電路。在所示實施例中,所有主要系統組件連接至匯流排71,其可代表超過一個的實體或邏輯匯流排;然而,不需要匯流排架構來實施本發明。
在由一般用途電腦系統所實施的實施例中,可將額外組件含括而用於介接於諸如鍵盤或滑鼠及顯示器的裝置,且用於控制具有儲存媒體(諸如磁帶或磁碟、或光學媒體)的儲存裝置。儲存媒體可被用來記錄用於作業系統、公用程式及應用程式的指令程式,且可包括實施本發明各種態樣的程式。
實行本發明各種態樣所需要的功能可由以各種方式實施的組件(包括分離的邏輯組件、積體電路、一或更多個ASIC及/或程式控制處理器)加以實施。實施這些組件的方式對本發明並不重要。
本發明的軟體實施例可藉由各種機器可讀取媒體加以傳送,諸如貫穿包括從超聲波至紫外線頻率之頻譜的基頻或調變通訊路徑,或藉由利用基本上任何記錄技術(包括
磁帶、磁卡或磁碟、光學卡或光碟、及在包括紙的媒體上的可偵測標記)而傳送資訊的儲存媒體。
10‧‧‧接收器/解碼器裝置
11、13‧‧‧信號路徑
12‧‧‧解格式器
14‧‧‧解碼器
16‧‧‧動態範圍控制器
18‧‧‧合成濾波器排
20‧‧‧增益-限幅器
21‧‧‧路徑
Claims (6)
- 一種用以解碼已編碼輸入信號以產生音訊輸出信號的方法,其中該方法包含:接收該已編碼輸入信號,其包括已編碼音訊資訊及關聯的元資料,該關聯的元資料包括一或更多個解碼控制參數,用於指定適合於被第一解碼模式使用的動態範圍壓縮的一或更多個第一參數,以及用於指定適合於被第二解碼模式使用的動態範圍壓縮的一或更多個第二參數,該第一解碼模式使用第一參考再生位準,該第二解碼模式使用第二參考再生位準;施加解碼程序至該已編碼音訊資訊以獲得次頻帶信號,其中該解碼程序回應於該一或更多個解碼控制參數而調整;修改該等次頻帶信號以獲得具有已改變動態範圍特性的已修改次頻帶信號,其中該修改回應於該一或更多個第二參數而調整;施加合成濾波器排至該等已修改次頻帶信號以獲得時域音訊信號;及施加增益及限幅器至該時域音訊信號,其中該增益之施加提高該音訊輸出信號之有效參考再生位準,且其中該限幅器之施加防止該音訊輸出信號的振幅超過一截波位準。
- 如申請專利範圍第1項之方法,其中該第一參考再生位準對應於低於該截波位準31dB的振幅,該第二參考 再生位準對應於低於該截波位準20dB的振幅,且該有效參考再生位準對應於低於該截波位準14dB至8dB的振幅。
- 如申請專利範圍第2項之方法,其中該有效參考再生位準對應於低於截波位準11dB的振幅。
- 一種用以解碼已編碼輸入信號以產生音訊輸出信號的設備,其中該設備包含:用於接收包括已編碼音訊資訊及關聯的元資料的該已編碼輸入信號的手段,該關聯的元資料包括一或更多個解碼控制參數,用於指定適合於被第一解碼模式使用的動態範圍壓縮的一或更多個第一參數,以及用於指定適合於被第二解碼模式使用的動態範圍壓縮的一或更多個第二參數,該第一解碼模式使用第一參考再生位準,該第二解碼模式使用第二參考再生位準;用於施加解碼程序至該已編碼音訊資訊以獲得次頻帶信號的手段,其中該解碼程序回應於該一或更多個解碼控制參數而調整;用於修改該等次頻帶信號以獲得具有已改變動態範圍特性的已修改次頻帶信號的手段,其中該修改回應於該一或更多個第二參數而調整;用於施加合成濾波器排至該等已修改次頻帶信號以獲得時域音訊信號的手段;及用於施加增益及限幅器至該時域音訊信號的手段,其中該增益之施加提高該音訊輸出信號之有效參考再生位 準,且其中該限幅器之施加防止該音訊輸出信號的振幅超過一截波位準。
- 如申請專利範圍第4項之設備,其中該第一參考再生位準對應於低於該截波位準31dB的振幅,該第二參考再生位準對應於低於該截波位準20dB的振幅,且該有效參考再生位準對應於低於該截波位準14dB至8dB的振幅。
- 如申請專利範圍第5項之設備,其中該有效參考再生位準對應於低於截波位準11dB的振幅。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30364310P | 2010-02-11 | 2010-02-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201506912A true TW201506912A (zh) | 2015-02-16 |
TWI529703B TWI529703B (zh) | 2016-04-11 |
Family
ID=43881135
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100103980A TWI447709B (zh) | 2010-02-11 | 2011-02-01 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TW103122263A TWI529703B (zh) | 2010-02-11 | 2011-02-01 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100103980A TWI447709B (zh) | 2010-02-11 | 2011-02-01 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
Country Status (18)
Country | Link |
---|---|
US (8) | US8903729B2 (zh) |
EP (3) | EP4047602B1 (zh) |
JP (2) | JP5666625B2 (zh) |
KR (1) | KR101381588B1 (zh) |
CN (2) | CN103795364B (zh) |
AR (1) | AR080156A1 (zh) |
BR (2) | BR112012019880B1 (zh) |
CA (6) | CA2787466C (zh) |
CL (1) | CL2012002213A1 (zh) |
CO (1) | CO6511277A2 (zh) |
EA (1) | EA023730B9 (zh) |
ES (1) | ES2916403T3 (zh) |
MX (1) | MX2012008954A (zh) |
MY (1) | MY169981A (zh) |
SG (1) | SG182632A1 (zh) |
TW (2) | TWI447709B (zh) |
UA (1) | UA105277C2 (zh) |
WO (1) | WO2011100155A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI594231B (zh) * | 2016-12-23 | 2017-08-01 | 瑞軒科技股份有限公司 | 分頻壓縮電路,音訊處理方法以及音訊處理系統 |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10158337B2 (en) | 2004-08-10 | 2018-12-18 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
AR077680A1 (es) | 2009-08-07 | 2011-09-14 | Dolby Int Ab | Autenticacion de flujos de datos |
TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
WO2011048010A1 (en) | 2009-10-19 | 2011-04-28 | Dolby International Ab | Metadata time marking information for indicating a section of an audio object |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP2695161B1 (en) * | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
JP6174129B2 (ja) * | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
RU2610588C2 (ru) * | 2012-11-07 | 2017-02-13 | Долби Интернешнл Аб | Вычисление отношения сигнал-шум конвертора с уменьшенной сложностью |
US9411881B2 (en) * | 2012-11-13 | 2016-08-09 | Dolby International Ab | System and method for high dynamic range audio distribution |
IL287218B (en) | 2013-01-21 | 2022-07-01 | Dolby Laboratories Licensing Corp | Audio encoder and decoder with program loudness and boundary metada |
IN2015MN01766A (zh) * | 2013-01-21 | 2015-08-28 | Dolby Lab Licensing Corp | |
CN112652316B (zh) * | 2013-01-21 | 2023-09-15 | 杜比实验室特许公司 | 利用响度处理状态元数据的音频编码器和解码器 |
RU2639663C2 (ru) * | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
EP2959479B1 (en) | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9883318B2 (en) | 2013-06-12 | 2018-01-30 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109903776B (zh) * | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN110675884B (zh) * | 2013-09-12 | 2023-08-08 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US20150095320A1 (en) * | 2013-09-27 | 2015-04-02 | Trooclick France | Apparatus, systems and methods for scoring the reliability of online information |
AU2014339086B2 (en) * | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US20150146099A1 (en) * | 2013-11-25 | 2015-05-28 | Anthony Bongiovi | In-line signal processor |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US10021484B2 (en) * | 2014-02-27 | 2018-07-10 | Sonarworks Sia | Method of and apparatus for determining an equalization filter |
US10063207B2 (en) * | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
KR102201027B1 (ko) | 2014-03-24 | 2021-01-11 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스 |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US10820883B2 (en) | 2014-04-16 | 2020-11-03 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
US9922657B2 (en) * | 2014-06-27 | 2018-03-20 | Dolby Laboratories Licensing Corporation | Method for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
JP6555263B2 (ja) * | 2014-06-30 | 2019-08-07 | ソニー株式会社 | 情報処理装置および方法 |
EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
EP3467827B1 (en) | 2014-10-01 | 2020-07-29 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
EP3518236B8 (en) | 2014-10-10 | 2022-05-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US11089349B2 (en) * | 2017-01-20 | 2021-08-10 | Hanwha Techwin Co., Ltd. | Apparatus and method for playing back and seeking media in web browser |
US10924078B2 (en) * | 2017-03-31 | 2021-02-16 | Dolby International Ab | Inversion of dynamic range control |
CN110033781B (zh) * | 2018-01-10 | 2021-06-01 | 盛微先进科技股份有限公司 | 音频处理方法、装置及非暂时性电脑可读媒体 |
SG11202007408WA (en) | 2018-04-09 | 2020-09-29 | Dolby Int Ab | Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio |
JP2021521700A (ja) | 2018-04-11 | 2021-08-26 | ボンジョビ アコースティックス リミテッド ライアビリティー カンパニー | オーディオ強化聴力保護システム |
WO2020028833A1 (en) | 2018-08-02 | 2020-02-06 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
CN112732069A (zh) * | 2021-02-20 | 2021-04-30 | 上海创感传感技术有限公司 | 一种电子设备状态修改方法和装置 |
CN112992159B (zh) * | 2021-05-17 | 2021-08-06 | 北京百瑞互联技术有限公司 | 一种lc3音频编解码方法、装置、设备及存储介质 |
US20240276143A1 (en) * | 2023-02-09 | 2024-08-15 | Samsung Electronics Co., Ltd. | Signal normalization using loudness metadata for audio processing |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
JP2007109328A (ja) | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
EP2063418A4 (en) * | 2006-09-15 | 2010-12-15 | Panasonic Corp | AUDIO CODING DEVICE AND AUDIO CODING METHOD |
DE102006048685A1 (de) | 2006-10-14 | 2008-04-17 | Mtu Aero Engines Gmbh | Turbinenschaufel einer Gasturbine |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
US9373339B2 (en) * | 2008-05-12 | 2016-06-21 | Broadcom Corporation | Speech intelligibility enhancement system and method |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
US8374361B2 (en) * | 2008-07-29 | 2013-02-12 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
JP5136378B2 (ja) * | 2008-12-09 | 2013-02-06 | 富士通株式会社 | 音響処理方法 |
US20100161340A1 (en) * | 2008-12-24 | 2010-06-24 | Plantronics, Inc. | Dynamic Codec Switching |
US8670990B2 (en) * | 2009-08-03 | 2014-03-11 | Broadcom Corporation | Dynamic time scale modification for reduced bit rate audio coding |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
ES2565394T3 (es) | 2011-12-15 | 2016-04-04 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, método y programa informático para evitar artefactos de recorte |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
RU2639663C2 (ru) | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
AU2014339086B2 (en) | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
KR101967810B1 (ko) | 2014-05-28 | 2019-04-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송 |
RU2019122989A (ru) | 2014-05-30 | 2019-09-16 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
US20180165358A1 (en) | 2014-06-30 | 2018-06-14 | Sony Corporation | Information processing apparatus and information processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
ES2870749T3 (es) | 2015-05-29 | 2021-10-27 | Fraunhofer Ges Forschung | Dispositivo y procedimiento para el control de volumen |
PT3311379T (pt) | 2015-06-17 | 2023-01-06 | Fraunhofer Ges Forschung | Controlo de intensidade sonora para interatividade de utilizador em sistemas de codificação de áudio |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2011
- 2011-02-01 TW TW100103980A patent/TWI447709B/zh active
- 2011-02-01 TW TW103122263A patent/TWI529703B/zh active
- 2011-02-03 CA CA2787466A patent/CA2787466C/en active Active
- 2011-02-03 MX MX2012008954A patent/MX2012008954A/es active IP Right Grant
- 2011-02-03 EP EP22160243.6A patent/EP4047602B1/en active Active
- 2011-02-03 BR BR112012019880-7A patent/BR112012019880B1/pt active IP Right Grant
- 2011-02-03 WO PCT/US2011/023531 patent/WO2011100155A1/en active Application Filing
- 2011-02-03 ES ES18191911T patent/ES2916403T3/es active Active
- 2011-02-03 UA UAA201210385A patent/UA105277C2/ru unknown
- 2011-02-03 CA CA2918302A patent/CA2918302C/en active Active
- 2011-02-03 JP JP2012552907A patent/JP5666625B2/ja active Active
- 2011-02-03 EP EP11706975.7A patent/EP2534656B1/en active Active
- 2011-02-03 US US13/576,386 patent/US8903729B2/en active Active
- 2011-02-03 CN CN201410039751.4A patent/CN103795364B/zh active Active
- 2011-02-03 SG SG2012053765A patent/SG182632A1/en unknown
- 2011-02-03 MY MYPI2012003595A patent/MY169981A/en unknown
- 2011-02-03 CA CA3075793A patent/CA3075793C/en active Active
- 2011-02-03 CA CA2995461A patent/CA2995461C/en active Active
- 2011-02-03 CA CA3201814A patent/CA3201814A1/en active Pending
- 2011-02-03 CA CA3114177A patent/CA3114177C/en active Active
- 2011-02-03 CN CN201180009098.1A patent/CN102754151B/zh active Active
- 2011-02-03 BR BR122019025627-6A patent/BR122019025627B1/pt active IP Right Grant
- 2011-02-03 EP EP18191911.9A patent/EP3444816B8/en active Active
- 2011-02-03 EA EA201270712A patent/EA023730B9/ru not_active IP Right Cessation
- 2011-02-03 KR KR1020127023274A patent/KR101381588B1/ko active IP Right Grant
- 2011-02-10 AR ARP110100414A patent/AR080156A1/es active IP Right Grant
-
2012
- 2012-07-30 CO CO12127728A patent/CO6511277A2/es active IP Right Grant
- 2012-08-09 CL CL2012002213A patent/CL2012002213A1/es unknown
-
2014
- 2014-10-28 US US14/525,536 patent/US9646622B2/en active Active
- 2014-12-10 JP JP2014249460A patent/JP6133263B2/ja active Active
-
2017
- 2017-04-07 US US15/482,328 patent/US10418045B2/en active Active
-
2019
- 2019-07-05 US US16/504,076 patent/US10566006B2/en active Active
-
2020
- 2020-02-11 US US16/787,502 patent/US11341982B2/en active Active
-
2022
- 2022-05-23 US US17/750,803 patent/US11670315B2/en active Active
-
2023
- 2023-04-20 US US18/303,919 patent/US11948592B2/en active Active
-
2024
- 2024-03-28 US US18/620,081 patent/US20240249738A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI594231B (zh) * | 2016-12-23 | 2017-08-01 | 瑞軒科技股份有限公司 | 分頻壓縮電路,音訊處理方法以及音訊處理系統 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI529703B (zh) | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |