TWI464735B - 利用聽覺場景分析及頻譜偏斜度進行之音訊處理技術 - Google Patents
利用聽覺場景分析及頻譜偏斜度進行之音訊處理技術 Download PDFInfo
- Publication number
- TWI464735B TWI464735B TW097126643A TW97126643A TWI464735B TW I464735 B TWI464735 B TW I464735B TW 097126643 A TW097126643 A TW 097126643A TW 97126643 A TW97126643 A TW 97126643A TW I464735 B TWI464735 B TW I464735B
- Authority
- TW
- Taiwan
- Prior art keywords
- audio signal
- auditory
- skewness
- event
- signal
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 title claims description 29
- 238000004458 analytical method Methods 0.000 title description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 21
- 230000005284 excitation Effects 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 210000002469 basement membrane Anatomy 0.000 claims description 3
- 210000003027 ear inner Anatomy 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 2
- 239000003607 modifier Substances 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 230000005404 monopole Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
- H03G9/18—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Holo Graphy (AREA)
- Electrically Operated Instructional Devices (AREA)
Description
本發明一般是關於音訊處理,且尤其是關於聽覺場景分析及頻譜偏斜度。
以下文件之全部內容以參照方式被併入本文。
Crockett與Seefeldt的專利合作條約下的國際申請案S.N.PCT/US2007/008313,名稱為“Controlling Dynamic Gain Parameters of Audio using Auditory Scene Analysis and Specific-Loudness-Based Detection of Auditory Events”,Brett Graham Crockett與Alan Jeffrey Seefeldt為發明人,於2007年3月30日提出申請,其代理人備申號為DOL186 PCT(因為此申請案還未公開,一複本作為附件且形成此申請案之一整體部分。);
Seefeldt等人的專利合作條約下的國際申請案S.N.PCT/US 2004/016964,名稱為“Method,Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal”,Alan Jeffrey Seefeldt等人為發明人,於2004年5月27日提出申請,其代理人備申號為DOL119 PCT,且於2004年12月23日公開為WO 2004/111994 A2;
Seefeldt的專利合作條約下的國際申請案S.N.PCT/US2005/038579,名稱為”Calculating and Adjusting the
Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal”,Alan Jeffrey Seefeldt為發明人,於2005年10月25日提出申請,其代理人備申號為DOL15202 PCT,且於2006年5月4日公開為WO 2006/047600;Crockett的美國專利申請案S.N.10/474,387,名稱為“High Quality Time-Scaling and Pitch-Scaling of Audio Signals”,Brett Graham Crockett為發明人,於2003年10月10日提出申請,其代理人備申號為DOL07503,且於2004年6月24日公開為US 2004/0122662 A1;Crockett等人的美國專利申請案S.N.10/478,398,名稱為“Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events”,Brett G.Crockett等人為發明人,於2003年11月20日提出申請,其代理人備申號為DOL09201,且於2004年7月29日公開為US 2004/0148159 A1;Crockett的美國專利申請案S.N.10/478,538,名稱為”Segmenting Audio Signals Into Auditory Events”,Brett G.Crockett為發明人,於2003年11月20日提出申請,其代理人備申號為DOL098,且於2004年8月26日公開為2004/0165730 A1;Crockett等人的美國專利申請案S.N.10/478,397,名稱為“Comparing Audio Using Characterizations Based on Auditory Events”,Brett G.Crockett等人為發明人,於2003年11月20日提出申請,其代理人備申號為DOL092,且於2004年9月2日公開為US 2004/0172240 A1;
Smithers的專利合作條約下的國際申請案S.N.PCT/US 05/24630,名稱為“Method for Combining Audio Signals Using Auditory Scene Analysis”,Michael John Srnithers為發明人,於2005年7月13日提出申請,其代理人備申號為DOL148 PCT,且於2006年3月9日公開為WO 2006/026161;Crockett,B.and Smithers,M.的“A Method for Characterizing and Identifying Audio Based on Auditory Scene Analysis”,音訊工程協會會議論文6416,第118次會議,巴賽隆納,2005年5月28-31日;Crockett,B.的“High Quality Multichannel Time Scaling and Pitch-Shifting using Auditory Scene Analysis”,音訊工程協會會議論文5948,紐約,2003年10月;以及Seefeldt等人的“A New Objective Measure of Perceived Loudness”,音訊工程協會會議論文6236,三藩市,2004年10月28日。
將聲音分為被感知為個別且相異的單元或片段有時被稱為“聽覺事件分析”或“聽覺場景分析”(“ASA”)。該等片段有時被稱為“聽覺事件”或“音訊事件”。Albert S.Bregman的“Auditory Scene Analysis--The Perceptual Organization of Sound”(Massachusetts Institute of Technology,1991年,第四次印刷,2001年,第二MIT出版平裝版本)廣泛地討論了
聽覺場景分析。除此之外,Bhadkamkar等人的序號為6,002,776的美國專利(1999年12月14日)引用追溯到1976年的公開案為“與透過聽覺場景分析進行聲音分離相關的先前技術”。然而,Bhadkamkar等人不鼓勵實際使用聽覺場景分析,認為:“雖然從做為人類聽覺處理的模型之科學觀點來看是令人感興趣的,但是包含聽覺場景分析的技術目前需要太大量計算且太專業化,而不被認為是用於聲音分離之實際技術,直到作出基本進展。”
Crockett及Crocket等人在以上列出的各個專利申請案及論文中識別聽覺事件。該等文件教示了藉由檢測頻譜成分(以頻率為函數的幅值)關於時間的一變化將一音訊信號分為聽覺事件(每個聽覺事件傾向於被感覺為個別且相異的)。這例如可藉由以下步驟被執行:藉由計算音訊信號之連續的時間區塊之頻譜內容,比較連續的時間區塊之間的頻譜內容,且將一聽覺事件邊界識別為頻譜內容之差值超過一臨界值的區塊之間的邊界。可選擇的方式是,除了關於時間之頻譜成分改變外,關於時間的幅值變化可被計算或代替之。
該等聽覺事件邊界標記器一般被配置為一時間控制信號,從而一般在0至1的範圍表示事件邊界之強度。此外,此控制信號往往被濾波,使得保持事件邊界強度,且該等事件邊界之間的時間間隔被計算為之前的事件邊界之衰減值。接著被濾波的聽覺事件強度藉由其他音訊處理方法使用,包括自動增益控制及動態範圍控制。
自動增益控制(AGC)及動態範圍控制(DRC)之技術是眾所周知的且一般用於許多音訊信號路徑。就抽象觀念而言,這兩個技術都測量一音訊信號之位準,且接著將該信號進行增益修改一數量,該數量是已量測的位準之一函數。在一線性的1:1動態處理系統中,輸入音訊未被處理,且輸出音訊信號理想地匹配輸入音訊信號。另外,假設一自動地測量輸入信號且利用該測量值控制輸出信號的音訊動態處理系統。若輸入信號之位準上升6dB且被處理的輸出的信號之位準只上升3dB,則輸出信號已關於輸入信號被壓縮一2:1之比率。
在Crockett及Seefeldt中,聽覺場景分析藉由最小化聽覺事件邊界之間的增益之變化,且將許多增益變化限於一事件邊界之鄰近,而改良AGC及DRC方法之效能。其藉由修改動態處理釋放行為而這樣做。這樣,聽覺事件聽起來是一致且自然的。
一鋼琴上彈奏的音符是一例子。利用習知的AGC或DRC方法,施加給音訊信號的增益在每個音符之尾部期間增加,從而使每個音符不自然地增強。利用聽覺場景分析,AGC或DRC增益在每個符號內保持恆定且只在檢測出一聽覺事件邊界的每個符號開始時改變。隨著每個音符之尾部漸漸消失,產生的增益調整音訊信號聽起來是自然的。
聽覺場景分析之典型的實施態樣(如以上的參考案中)故意位準不變的。即,其檢測出聽覺事件邊界,而與絕對
信號位準無關。雖然位準不變用於許多應用,但是一些聽覺場景分析受益於一些位準相依性。
此一情形是在Crockett與Seefeldt中描述的方法。此處,AGC及DRC之ASA控制防止聽覺事件邊界之間的大的增益變化。然而,較長期的增益變化對於一些類型的音訊信號可能仍是不被期望的。當一音訊信號從一較大聲進入一較輕聲部分時,被限制只在接近事件邊界改變的AGC或DRC增益可能允許處理的音訊信號之位準在輕聲部分不期望且不自然地上升。此情形經常發生在零星的對話與輕聲的背景聲音交替的影片中。因為輕聲的背景音訊信號也包含聽覺事件,所以AGC或DRC增益在接近該等事件邊界時改變,且整個音訊信號位準上升。
僅透過音訊信號位準、功率或響度之一測量對聽覺事件之重要性加權是不被期望的。在許多情形中,信號測量與絕對再現位準之間的關係未知。理想上,獨立於音訊信號之絕對位準而區別或檢測感知上較輕聲的信號之一測量是有用的。
此處,“感知上較輕聲”不是指相對於一客觀響度測量較輕聲(如Seefeldt等人與Seefeldt中的),而是基於內容之被期望的響度較輕聲。例如,人類經驗指出低語是一輕聲的聲音。若一動態處理系統測量此是輕聲的,從而又增加AGC增益以達成某一標稱輸出響度或位準,則產生的被增益調整的低語應比從經驗上所能得知的大聲。
本文教示的是一種用於控制一音訊信號內的聽覺事件之響度的方法及裝置。在一實施例中,該方法包括以下步驟:利用頻譜內的偏斜度對該等聽覺事件(一聽覺事件具有一頻譜及一響度)加權;以及利用該等權重控制該等聽覺事件之響度。本發明之各個實施例如下:該加權與該等頻譜內的偏斜度之測量成比例;該偏斜度之測量是被平滑化的偏斜度之一測量;該加權對於該音訊信號之幅值是不敏感的;該加權對於功率是不敏感的;該加權對於響度是不敏感的;信號測量與絕對再現位準之間的任何關係在加權時是未知的;該加權包括利用該等頻譜內的偏斜度,對聽覺事件邊界重要性加權;以及在該音訊信號之感覺較輕聲的片段期間減少AGC或DRC處理位準之增強,相較於不執行所主張的加權之方法。
在其他實施例中,本發明是一種包含用於執行如以上方法中的任何一者之電腦程式的電腦可讀記憶體。
在其他實施例中,本發明是一種電腦系統,包括一CPU、以上提到的記憶體中的一者以及一可通訊地耦接該CPU與該記憶體的匯流排。
在另一實施例中,本發明是一種音訊信號處理器,包括:一頻譜偏斜度計算器,用於計算一音訊信號內的頻譜偏斜度;一聽覺事件識別器,用於利用該被計算出的頻譜偏斜度識別且加權該音訊信號內的聽覺事件;一參數修改器,用於修改用以控制該音訊信號內的聽覺事件之響度的
參數;以及一控制器,用於控制該音訊信號內的聽覺事件之該響度。
在另一實施例中,本發明是一種用於控制一音訊信號內的聽覺事件之響度的方法,包括以下步驟:計算一音訊信號之連續的聽覺事件之頻譜的偏斜度之測量;基於偏斜度之該等測量產生該等聽覺事件之權重;自該等權重導出一控制信號;以及利用該控制信號控制該等聽覺事件之該響度。
本發明之各個特徵以及其較佳實施例可透過參照以下討論及附圖被較佳地理解,其中類似的參考符號表示類似的元件。
第1圖描述了一種用於執行分析聽覺場景及控制動態增益參數的兩Crockett及Seefeldt方法的裝置;第2圖描述了依據本發明之一實施例的用於識別聽覺事件且計算用於修改該等聽覺事件的偏斜度之一音訊處理器,它們本身用於修改該等動態參數處理參數;第3圖是依據本發明之一實施例的將聽覺事件用於控制一動態範圍控制器(DRC)之一數位實施態樣內的釋放時間之一系列圖表;第4圖是依據本發明之一實施例的適用於作為一傳輸濾波器的一線性濾波器之一理想的特性響應;以及第5圖顯示了一組近似於以ERB刻度的關鍵頻帶之理想聽覺濾波器特性響應。
第1圖描述了一用於依據Crockett與Seefeldt分析聽覺場景且控制動態增益參數的裝置1。該裝置包括一聽覺事件識別器10、一可取捨聽覺事件特性識別器11以及一動態參數修改器12。該聽覺事件識別器10接收音訊為輸入,且產生一輸入給該動態參數修改器12(以及一輸入給該聽覺事件特性識別器11,若存在)。該動態參數修改器12接收該聽覺事件識別器10(以及聽覺時間特性識別器11,若存在)之輸出且產生一輸出。
該聽覺事件識別器10分析頻譜且自該等結果識別用以控制動態增益參數的可感知音訊事件之位置。可選擇的方式是,該聽覺事件識別符10將該音訊轉換到一可感知的響度域(可提供比第一方法較心理聲學相關的資訊),且在可感知的響度域內識別用以控制該等動態增益參數的聽覺事件之位置(在此選擇中,該音訊處理知道絕對聲音再現位準。)
該動態參數修改器12基於該聽覺事件識別器10(以及聽覺事件特性識別器11,若存在)之輸出修改該等動態參數。
在兩個選擇中,一數位音訊信號x
[n
]被分為區塊,且對於每個區塊t,D
[t
]表示目前區塊與前一區塊之間的頻譜差值。
對於第一選擇,D
[t
]是目前區塊t
與前一區塊t
-1之正規化對數頻譜係數(以dB為單位)之間的差值之大小的總和,
對於所有頻譜係數。在此選擇中,D
[t
]正比於以頻譜的絕對差值(本身以dB為單位)。對於第二選擇,D
[t
]是目前區塊t
與前一區塊t
-1之正規化特定響度係數之間的差值之大小的總和,對於所有特定響度係數。在此選擇中,D
[t
]正比於以特定響度的絕對差值(以宋為單位)。
在這兩個選擇中,若D
[t
]超過一臨界值D min
,則一事件被認為已發生。該事件可具有一在0與1之間的強度,基於D
[t
]減去D min
對D max
與D min
之間的差值之比率。該強度A
[t
]可被計算為:
最大及最小限制值對於每個選擇是不同的,由於它們不同的單位。然而,來自兩者的結果是一在0至1之範圍內的事件強度。其他選擇可計算一事件強度,但是方程式(1)中表示的選擇本身已在一些領域自我證明,包括控制動態處理。相較於一個二元事件決策,將一強度(正比於與該事件相關的頻譜變化之量)指定給聽覺事件允許對動態處理進行較大的控制。較大的增益變化在較強的事件期間是可被接受的,且方程式(1)中的信號允許此可變控制。
信號A
[t
]是一脈衝信號,具有發生在一事件邊界之位置上的一脈衝。為了控制釋放時間之目的,可進一步對該信號A
[t
]進行平滑處理,使得其在檢測到一事件邊界之後平滑
地衰減到零。被平滑化的事件控制信號可依據以下方程式自A
[t
]計算出:
此處,α event
控制事件控制信號之衰減時間。
第3圖是描述了依據一實施例的本發明之操作及結果的一連串圖表。第3圖內的“b)”描述了第3圖中的“a)”之對應的音訊信號之事件控制信號,其中平滑器之半衰減時間被設定為250ms。該音訊信號包含對話之三個叢發,與輕聲的背景營火爆裂聲交錯。該事件控制信號顯示了對話及背景聲音內的許多聽覺事件。
在第3圖中,“c)”顯示了在事件控制信號被用以改變該DRC增益平滑化之釋放時間常數之情形下的DRC增益信號。如Crocket與Seefeldt描述的,當控制信號等於1時,該釋放平滑係數沒有被影響,且該被平滑化的增益依據時間常數之值變化。當該控制信號等於零時,該被平滑化的增益被阻止改變。當該控制信號在0與1時,該被平滑化的增益被允許改變-但是以與該控制信號成正比的一減小的速率。
在第3圖之“c)”中,由於在背景中檢測到的事件之數目,DRC增益在輕聲的背景聲音期間上升。在第3圖之“d)”中產生的被DRC修改的音訊信號在對話之叢發之間具有背景雜訊之可聽見且不被期望的增強。
為了在輕聲的背景聲音期間降低增益變化,本發明之
一實施例使用音訊信號頻譜之非對稱性的一測量修改或加權該聽覺強度A
[t
]。本發明之一實施例計算該音訊信號之激發的頻譜偏斜度。
偏斜度是一機率分佈之非對稱性的一統計測量。關於平均值對稱的一分佈具有零偏斜度。大部分或大量集中在平均值以上以及具有趨向低於平均值的一長尾部之一分佈具有一負偏斜度。集中在平均值之下且具有趨向高於該平均值的一長尾部之一分佈具有一正偏斜度。一典型的音訊信號之大小或功率頻譜具有正偏斜度。即,該頻譜內的能量之大部分集中在該頻譜較低處,且該頻譜具有朝向該頻譜之上部的一長尾部。
第2圖描述了依據本發明之一實施例的一音訊處理器2。該音訊處理器2包括第1圖之該動態參數修改器12及該可取捨聽覺事件特性識別器11以及一聽覺事件識別器20及一偏斜度計算器21。該偏斜度計算器21及聽覺事件識別器20都接收音訊信號13,且該偏斜度計算器21產生輸入給該聽覺事件識別器20。除此之外,該聽覺事件識別器20、聽覺事件特性識別器11以及動態參數修改器12如同與第1圖中的其等對應者被連接。
在第2圖中,該偏斜度計算器21自該音訊信號13之一頻譜表示計算偏斜度,且該聽覺事件識別器20自相同的頻譜表示計算聽覺場景分析。該音訊信號13可被分組為M個樣本之百分之五十的重疊區塊,且該離散傅利葉轉換可被計算如下:
其中M=2*N個樣本且x
[n
,t
]表示一樣本區塊。該轉換之區塊大小被假設與用於計算聽覺事件信號的區塊大小相同。然而,並不一定要是此情形。在存在不同的區塊速率之情形下,一區塊速率上的信號可被內插或速率轉換到與另一區塊速率上的信號相同的時標。
近似於時間區塊t期間的能量沿著在關鍵頻帶b上的內耳之基底膜之分佈的激發信號E
[b
,t
]被計算出:
其中T
[k
]表示模擬音訊穿過外耳及中耳之傳輸的一濾波器之頻率響應,且C b
[k
]表示在對應關鍵頻帶b的一位置上的基底膜之頻率響應。
第4圖描述了一適合的傳輸濾波器之頻率響應T
[k
]。第5圖描述了一組適合的關鍵頻帶濾波器響應,對應C b
[k
],其中40個頻帶沿著Moore及Glasberg等效矩形帶寬(ERB)刻度均勻地隔開,對於一48kHz之樣本率以及M=2048之轉換大小。一圓指數函數描述了每個濾波器形狀,且1個ERB分隔該等頻帶。
若該等聽覺事件邊界按照Crocket及Seefeldt自特定響度頻譜計算出,則該激發信號E
[b
,t
]已作為特定響度計算之部分存在。
最後,該頻譜偏斜度自該激發信號E
[b
,t
]計算為:
其中μ
是該激發之算術平均值:
且σ是該激發信號之方差:
方程式(5)之偏斜度信號SK
[t
]大大地波動,且需要對其平滑化以避免當修改該事件控制信號及接著的動態處理參數時的人工因素。一實施例使用一具有一衰減常數α SK
的單極平滑器,該衰減常數α SK
具有一大約6.5 ms之半衰減時間:SK
'[t
]=α SK SK
'[t
-1]+(1-α SK
)SK
[t
] (8)
將偏斜度分別限制到最大值SKmax
及最小值SKmin
可能是有用的。一被限制的偏斜度SK
"[t
]可被計算為:
該偏斜度信號SK
"[t
]之低值(接近0.0的值)一般對應特性上較輕聲的信號,而高偏斜度值(接近1.0的值)一般對應特性上較大聲的信號。在第3圖中,“e)”圖顯示了對應第3圖的“a)”中的音訊信號之偏斜度信號。該偏斜度對於較大聲的對話叢發是高的且對於背景聲音是低的。
該偏斜度信號SK
"[t
]傳給第2圖之聽覺事件識別器20,該聽覺事件識別器20將該頻譜差值測量D
[t
]加權為:D SK
[t
]=SK
"[t
]D
[t
] (8)
該被偏斜度修改的聽覺強度信號A SK
[t
]以與方程式(1)中A
[t
]之方式相同的方式被計算:
該被偏斜度修改的聽覺強度信號以與方程式(2)中的A
[t
]之方式相同的方式被平滑化:
在第3圖中,“f)”,描述了第3圖之“a)”中的對應音訊信號之被偏斜度修改的事件控制信號。當對應較大聲對話的事件仍存在時,較少的聽覺事件出現在背景聲音期間。
在第3圖中,“g)”顯示了被偏斜度修改的事件控制DRC信號。由於在背景聲音中具有較少的聽覺事件,所以DRC增益保持相當固定且只對於較大聲的對話部分移動。第3圖中的“h)”顯示了產生的被DRC修改的音訊信號。
該被DRC修改的音訊信號在背景聲音期間不具有位準之任何不被期望的增強。
該偏斜度信號SK
"[t
]對於感覺較大聲的信號有時變低。對於該等大聲的信號,頻譜差值測量D
[t
]之值足夠大,
使得即使在透過方程式8中的偏斜度信號SK
"[t
]加權之後,該被加權的頻譜差值測量D SK
[t
]一般仍足夠大以指示一聽覺事件邊界。該事件控制信號未受到不利影響。
1‧‧‧裝置
2‧‧‧音訊處理器
10‧‧‧聽覺事件識別器
11‧‧‧可取捨聽覺事件特性識別器
12‧‧‧動態參數修改器
13‧‧‧音訊信號
20‧‧‧聽覺事件識別器
21‧‧‧偏斜度計算器
第1圖描述了一種用於執行分析聽覺場景及控制動態增益參數的兩Crockett及Seefeldt方法的裝置;第2圖描述了依據本發明之一實施例的用於識別聽覺事件且計算用於修改該等聽覺事件的偏斜度之一音訊處理器,它們本身用於修改該等動態參數處理參數;第3圖是依據本發明之一實施例的將聽覺事件用於控制一動態範圍控制器(DRC)之一數位實施態樣內的釋放時間之一系列圖表;第4圖是依據本發明之一實施例的適用於作為一傳輸濾波器的一線性濾波器之一理想的特性響應;以及第5圖顯示了一組近似於以ERB刻度的關鍵頻帶之理想聽覺濾波器特性響應。
2‧‧‧音訊處理器
11‧‧‧可取捨聽覺事件特性識別器
12‧‧‧動態參數修改器
13‧‧‧音訊信號
20‧‧‧聽覺事件識別器
21‧‧‧偏斜度計算器
Claims (11)
- 一種用以控制音訊信號的信號處理方法,包含偵測頻譜成分相關於時間的變化以分割該音訊信號成聽覺事件,該分割步驟包括偵測該音訊信號中的聽覺事件邊界之位置及強度;取得該音訊信號之頻譜偏斜度之測量,其中該頻譜偏斜度係該音訊信號頻譜之概率分布不對稱之統計量;響應該測量以調整該聽覺事件之強度,使得越少該頻譜在該聽覺事件之位置上歪斜,則該聽覺事件之強度被降低的越多,以及響應該聽覺事件之位置和歪斜調整強度以控制該信號處理程序。
- 如請求項1之方法,其中分割該音訊信號成聽覺事件包含分析該音訊信號之頻譜。
- 如請求項2之方法,其中取得該音訊信號之頻譜偏斜度之測量包含從該音訊信號之一頻譜表示來計算該偏斜度。
- 如請求項3之方法,其中計算該偏斜度包含計算逼近於沿著內耳基底膜之能量分佈之一激發信號。
- 如請求項1之方法,其中分割該音訊信號成聽覺事件包含轉換該音訊信號成一感知響度域,該轉換包含計算逼近於沿著內耳基底膜之能量分佈之激發信號。
- 如請求項5之方法,其中取得該音訊信號之頻譜偏斜度之測量包括從該激發信號計算該偏斜度。
- 如請求項1~6中任一項之方法,其中該頻譜偏斜度之測量是一平滑化的測量。
- 一種包含適應於執行如請求項1~7中任一項方法之構件之裝置。
- 一種儲存在電腦可讀媒體上之電腦程式,其於一電腦上執行時,執行如請求項1~7中任一項之方法。
- 一種包含如請求項9之電腦程式之電腦可讀記憶體。
- 一種電腦系統,包含:一CPU;如請求項10之記憶體;以及一匯流排,其通訊地耦接該CPU與該記憶體。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US95946307P | 2007-07-13 | 2007-07-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200915301A TW200915301A (en) | 2009-04-01 |
TWI464735B true TWI464735B (zh) | 2014-12-11 |
Family
ID=39776994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097126643A TWI464735B (zh) | 2007-07-13 | 2008-07-14 | 利用聽覺場景分析及頻譜偏斜度進行之音訊處理技術 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8396574B2 (zh) |
EP (1) | EP2168122B1 (zh) |
JP (1) | JP5192544B2 (zh) |
CN (1) | CN101790758B (zh) |
AT (1) | ATE535906T1 (zh) |
BR (1) | BRPI0813723B1 (zh) |
ES (1) | ES2377719T3 (zh) |
RU (1) | RU2438197C2 (zh) |
TW (1) | TWI464735B (zh) |
WO (1) | WO2009011827A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
EP2425426B1 (en) | 2009-04-30 | 2013-03-13 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US8510361B2 (en) * | 2010-05-28 | 2013-08-13 | George Massenburg | Variable exponent averaging detector and dynamic range controller |
KR102003191B1 (ko) * | 2011-07-01 | 2019-07-24 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법 |
WO2013150340A1 (en) * | 2012-04-05 | 2013-10-10 | Nokia Corporation | Adaptive audio signal filtering |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9349384B2 (en) | 2012-09-19 | 2016-05-24 | Dolby Laboratories Licensing Corporation | Method and system for object-dependent adjustment of levels of audio objects |
US9979829B2 (en) | 2013-03-15 | 2018-05-22 | Dolby Laboratories Licensing Corporation | Normalization of soundfield orientations based on auditory scene analysis |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN104079247B (zh) | 2013-03-26 | 2018-02-09 | 杜比实验室特许公司 | 均衡器控制器和控制方法以及音频再现设备 |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
MY197063A (en) * | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
JP6224850B2 (ja) | 2014-02-28 | 2017-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 会議における変化盲を使った知覚的連続性 |
US10306392B2 (en) | 2015-11-03 | 2019-05-28 | Dolby Laboratories Licensing Corporation | Content-adaptive surround sound virtualization |
US9372881B1 (en) | 2015-12-29 | 2016-06-21 | International Business Machines Corporation | System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset |
WO2017147325A1 (en) | 2016-02-25 | 2017-08-31 | Dolby Laboratories Licensing Corporation | Multitalker optimised beamforming system and method |
WO2020020043A1 (en) * | 2018-07-25 | 2020-01-30 | Dolby Laboratories Licensing Corporation | Compressor target curve to avoid boosting noise |
CN113015059B (zh) * | 2021-02-23 | 2022-10-18 | 歌尔科技有限公司 | 音频优化方法、装置、设备及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200404272A (en) * | 2002-08-30 | 2004-03-16 | Dolby Lab Licensing Corp | Controlling loudness of speech in signals that contain speech and other types of audio material |
US20040122662A1 (en) * | 2002-02-12 | 2004-06-24 | Crockett Brett Greham | High quality time-scaling and pitch-scaling of audio signals |
US20050071154A1 (en) * | 2003-09-30 | 2005-03-31 | Walter Etter | Method and apparatus for estimating noise in speech signals |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
TW200623024A (en) * | 2004-12-21 | 2006-07-01 | Dolby Lab Licensing Corp | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
Family Cites Families (131)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2808475A (en) | 1954-10-05 | 1957-10-01 | Bell Telephone Labor Inc | Loudness indicator |
US4281218A (en) | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
US4624009A (en) | 1980-05-02 | 1986-11-18 | Figgie International, Inc. | Signal pattern encoder and classifier |
DE3314570A1 (de) | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
US4594561A (en) * | 1984-10-26 | 1986-06-10 | Rg Dynamics, Inc. | Audio amplifier with resistive damping for minimizing time displacement distortion |
US4739514A (en) | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
US4887299A (en) | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
US5027410A (en) | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
JPH02118322U (zh) | 1989-03-08 | 1990-09-21 | ||
US5097510A (en) | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
US5369711A (en) | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
WO1992012607A1 (en) | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
EP0517233B1 (en) | 1991-06-06 | 1996-10-30 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
US5278912A (en) | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
JPH0566795A (ja) * | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
US5363147A (en) | 1992-06-01 | 1994-11-08 | North American Philips Corporation | Automatic volume leveler |
DE4335739A1 (de) | 1992-11-17 | 1994-05-19 | Rudolf Prof Dr Bisping | Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen |
US5457769A (en) | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5706352A (en) | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
US5434922A (en) | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
BE1007355A3 (nl) | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
IN184794B (zh) | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP2986345B2 (ja) | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
TW247390B (en) | 1994-04-29 | 1995-05-11 | Audio Products Int Corp | Apparatus and method for adjusting levels between channels of a sound system |
US5500902A (en) | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
GB9419388D0 (en) | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
US5548538A (en) | 1994-12-07 | 1996-08-20 | Wiltron Company | Internal automatic calibrator for vector network analyzers |
US5682463A (en) | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
CA2167748A1 (en) | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
DK0661905T3 (da) | 1995-03-13 | 2003-04-07 | Phonak Ag | Fremgangsmåde til tilpasnning af et høreapparat, anordning hertil og høreapparat |
DE19509149A1 (de) | 1995-03-14 | 1996-09-19 | Donald Dipl Ing Schulz | Codierverfahren |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
AU5663296A (en) | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
US6301555B2 (en) | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
US5601617A (en) | 1995-04-26 | 1997-02-11 | Advanced Bionics Corporation | Multichannel cochlear prosthesis with flexible control of stimulus waveforms |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5663727A (en) | 1995-06-23 | 1997-09-02 | Hearing Innovations Incorporated | Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same |
US5712954A (en) | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
US6002776A (en) * | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5907622A (en) | 1995-09-21 | 1999-05-25 | Dougherty; A. Michael | Automatic noise compensation system for audio reproduction equipment |
US6327366B1 (en) | 1996-05-01 | 2001-12-04 | Phonak Ag | Method for the adjustment of a hearing device, apparatus to do it and a hearing device |
US6108431A (en) | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
US6430533B1 (en) | 1996-05-03 | 2002-08-06 | Lsi Logic Corporation | Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation |
JPH09311696A (ja) * | 1996-05-21 | 1997-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 自動利得調整装置 |
JPH09312540A (ja) | 1996-05-23 | 1997-12-02 | Pioneer Electron Corp | ラウドネスボリュームコントロール装置 |
JP3765622B2 (ja) | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
EP0820212B1 (de) | 1996-07-19 | 2010-04-21 | Bernafon AG | Lautheitsgesteuerte Verarbeitung akustischer Signale |
JP2953397B2 (ja) | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
JP3367592B2 (ja) * | 1996-09-24 | 2003-01-14 | 日本電信電話株式会社 | 自動利得調整装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US5862228A (en) | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
US6125343A (en) | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
US6272360B1 (en) | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
US6185309B1 (en) | 1997-07-11 | 2001-02-06 | The Regents Of The University Of California | Method and apparatus for blind separation of mixed and convolved sources |
KR100261904B1 (ko) | 1997-08-29 | 2000-07-15 | 윤종용 | 헤드폰 사운드 출력장치 |
US6088461A (en) | 1997-09-26 | 2000-07-11 | Crystal Semiconductor Corporation | Dynamic volume control system |
US6233554B1 (en) | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6298139B1 (en) | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US6353671B1 (en) | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6311155B1 (en) | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US6498855B1 (en) | 1998-04-17 | 2002-12-24 | International Business Machines Corporation | Method and system for selectively and variably attenuating audio data |
EP1086607B2 (en) | 1998-06-08 | 2012-04-11 | Cochlear Limited | Hearing instrument |
EP0980064A1 (de) | 1998-06-26 | 2000-02-16 | Ascom AG | Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen |
GB2340351B (en) | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6351731B1 (en) | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6823303B1 (en) | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6411927B1 (en) | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
FI113935B (fi) | 1998-09-25 | 2004-06-30 | Nokia Corp | Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä |
DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
US6314396B1 (en) | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
EP1089242B1 (en) | 1999-04-09 | 2006-11-08 | Texas Instruments Incorporated | Supply of digital audio and video products |
AU4278300A (en) | 1999-04-26 | 2000-11-10 | Dspfactory Ltd. | Loudness normalization control for a digital hearing aid |
US6263371B1 (en) | 1999-06-10 | 2001-07-17 | Cacheflow, Inc. | Method and apparatus for seaming of streaming content |
US6442278B1 (en) | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
US6985594B1 (en) | 1999-06-15 | 2006-01-10 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment |
US6675125B2 (en) | 1999-11-29 | 2004-01-06 | Syfx | Statistics generator system and method |
FR2802329B1 (fr) | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
US6351733B1 (en) | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
DE10018666A1 (de) | 2000-04-14 | 2001-10-18 | Harman Audio Electronic Sys | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
US6889186B1 (en) | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
AUPQ952700A0 (en) | 2000-08-21 | 2000-09-14 | University Of Melbourne, The | Sound-processing strategy for cochlear implants |
JP3448586B2 (ja) | 2000-08-29 | 2003-09-22 | 独立行政法人産業技術総合研究所 | 聴覚障害を考慮した音の測定方法およびシステム |
US6625433B1 (en) | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
US6807525B1 (en) | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
EP1206104B1 (en) | 2000-11-09 | 2006-07-19 | Koninklijke KPN N.V. | Measuring a talking quality of a telephone link in a telecommunications network |
US7457422B2 (en) | 2000-11-29 | 2008-11-25 | Ford Global Technologies, Llc | Method and implementation for detecting and characterizing audible transients in noise |
FR2820573B1 (fr) | 2001-02-02 | 2003-03-28 | France Telecom | Methode et dispositif de traitement d'une pluralite de flux binaires audio |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
DE10107385A1 (de) | 2001-02-16 | 2002-09-05 | Harman Audio Electronic Sys | Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken |
US6915264B2 (en) | 2001-02-22 | 2005-07-05 | Lucent Technologies Inc. | Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding |
US7194100B2 (en) | 2001-04-10 | 2007-03-20 | Phonak Ag | Method for individualizing a hearing aid |
US7461002B2 (en) | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7283954B2 (en) | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
ATE318062T1 (de) | 2001-04-18 | 2006-03-15 | Gennum Corp | Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen |
KR100400226B1 (ko) * | 2001-10-15 | 2003-10-01 | 삼성전자주식회사 | 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법 |
US7177803B2 (en) | 2001-10-22 | 2007-02-13 | Motorola, Inc. | Method and apparatus for enhancing loudness of an audio signal |
US20040037421A1 (en) | 2001-12-17 | 2004-02-26 | Truman Michael Mead | Parital encryption of assembled bitstreams |
US7068723B2 (en) | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
FR2842576B1 (fr) | 2002-07-17 | 2004-10-08 | Skf Ab | Dispositif de palier a roue libre et poulie a roue libre |
JP4257079B2 (ja) | 2002-07-19 | 2009-04-22 | パイオニア株式会社 | 周波数特性調整装置および周波数特性調整方法 |
JP4321049B2 (ja) | 2002-07-29 | 2009-08-26 | パナソニック電工株式会社 | 自動利得制御装置 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
DE602004023917D1 (de) | 2003-02-06 | 2009-12-17 | Dolby Lab Licensing Corp | Kontinuierliche audiodatensicherung |
DE10308483A1 (de) | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
US7551745B2 (en) | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
KR101164937B1 (ko) | 2003-05-28 | 2012-07-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램 |
US6923684B2 (en) | 2003-10-10 | 2005-08-02 | O'sullivan Industries, Inc. | Power harness having multiple upstream USB ports |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
GB2413906A (en) | 2004-04-21 | 2005-11-09 | Imagination Tech Ltd | Radio volume control system |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
TWI393120B (zh) | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
ES2313413T3 (es) * | 2004-09-20 | 2009-03-01 | Nederlandse Organisatie Voor Toegepast-Natuurwetenschappelijk Onderzoek Tno | Compensacion en frecuencia para el analisis de precepcion de habla. |
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8265295B2 (en) | 2005-03-11 | 2012-09-11 | Rane Corporation | Method and apparatus for identifying feedback in a circuit |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
GB2428168A (en) | 2005-07-06 | 2007-01-17 | Motorola Inc | A transmitter splits a signal into a plurality of sub-signals, each containing a plurality of sub-carriers, and amplifies each sub-signal separately. |
JP4981123B2 (ja) | 2006-04-04 | 2012-07-18 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整 |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
CN101410892B (zh) | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
DE602007011594D1 (de) | 2006-04-27 | 2011-02-10 | Dolby Lab Licensing Corp | Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke |
JP4940308B2 (ja) | 2006-10-20 | 2012-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | リセットを用いるオーディオダイナミクス処理 |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
JP4938862B2 (ja) | 2007-01-03 | 2012-05-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ハイブリッドデジタル/アナログラウドネス補償音量調節 |
EP2130019B1 (en) | 2007-03-19 | 2013-01-02 | Dolby Laboratories Licensing Corporation | Speech enhancement employing a perceptual model |
EP2162879B1 (en) | 2007-06-19 | 2013-06-05 | Dolby Laboratories Licensing Corporation | Loudness measurement with spectral modifications |
-
2008
- 2008-07-11 US US12/668,741 patent/US8396574B2/en active Active
- 2008-07-11 WO PCT/US2008/008592 patent/WO2009011827A1/en active Application Filing
- 2008-07-11 CN CN2008800245251A patent/CN101790758B/zh active Active
- 2008-07-11 RU RU2010105052/08A patent/RU2438197C2/ru active
- 2008-07-11 BR BRPI0813723A patent/BRPI0813723B1/pt active IP Right Grant
- 2008-07-11 EP EP08780174A patent/EP2168122B1/en active Active
- 2008-07-11 AT AT08780174T patent/ATE535906T1/de active
- 2008-07-11 ES ES08780174T patent/ES2377719T3/es active Active
- 2008-07-11 JP JP2010517000A patent/JP5192544B2/ja active Active
- 2008-07-14 TW TW097126643A patent/TWI464735B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US20040122662A1 (en) * | 2002-02-12 | 2004-06-24 | Crockett Brett Greham | High quality time-scaling and pitch-scaling of audio signals |
TW200404272A (en) * | 2002-08-30 | 2004-03-16 | Dolby Lab Licensing Corp | Controlling loudness of speech in signals that contain speech and other types of audio material |
US20050071154A1 (en) * | 2003-09-30 | 2005-03-31 | Walter Etter | Method and apparatus for estimating noise in speech signals |
TW200623024A (en) * | 2004-12-21 | 2006-07-01 | Dolby Lab Licensing Corp | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
Also Published As
Publication number | Publication date |
---|---|
TW200915301A (en) | 2009-04-01 |
JP2010534030A (ja) | 2010-10-28 |
US20100198378A1 (en) | 2010-08-05 |
ATE535906T1 (de) | 2011-12-15 |
CN101790758A (zh) | 2010-07-28 |
CN101790758B (zh) | 2013-01-09 |
EP2168122A1 (en) | 2010-03-31 |
RU2438197C2 (ru) | 2011-12-27 |
WO2009011827A1 (en) | 2009-01-22 |
BRPI0813723B1 (pt) | 2020-02-04 |
US8396574B2 (en) | 2013-03-12 |
RU2010105052A (ru) | 2011-08-20 |
EP2168122B1 (en) | 2011-11-30 |
ES2377719T3 (es) | 2012-03-30 |
JP5192544B2 (ja) | 2013-05-08 |
BRPI0813723A2 (pt) | 2017-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI464735B (zh) | 利用聽覺場景分析及頻譜偏斜度進行之音訊處理技術 | |
US9768749B2 (en) | Audio control using auditory event detection | |
CN109616142B (zh) | 用于音频分类和处理的装置和方法 | |
JP6328627B2 (ja) | 雑音検出及びラウドネス低下検出によるラウドネスコントロール | |
US9117455B2 (en) | Adaptive voice intelligibility processor | |
CN104079247B (zh) | 均衡器控制器和控制方法以及音频再现设备 | |
CN112470219B (zh) | 压缩机目标曲线以避免增强噪声 | |
EP2828853B1 (en) | Method and system for bias corrected speech level determination | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
RU2343631C1 (ru) | Способ и устройство порогового шумопонижения с автоматическим определением порога |