TWI471856B - 控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式 - Google Patents

控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式 Download PDF

Info

Publication number
TWI471856B
TWI471856B TW96111810A TW96111810A TWI471856B TW I471856 B TWI471856 B TW I471856B TW 96111810 A TW96111810 A TW 96111810A TW 96111810 A TW96111810 A TW 96111810A TW I471856 B TWI471856 B TW I471856B
Authority
TW
Taiwan
Prior art keywords
loudness
specific loudness
audio signal
modified
frequency
Prior art date
Application number
TW96111810A
Other languages
English (en)
Other versions
TW200746049A (en
Inventor
Alan Jeffrey Seefeldt
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW200746049A publication Critical patent/TW200746049A/zh
Application granted granted Critical
Publication of TWI471856B publication Critical patent/TWI471856B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L2021/065Aids for the handicapped in understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Control Of Amplification And Gain Control (AREA)

Description

控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式 發明領域
本發明係有關於音頻信號處理,特別是本發明係有關於音頻信號之被感知的聲音響度及/或被感知的頻譜平衡之測量與控制。本發明例如在音頻播放環境中之背景雜訊干擾一個或多個響度補償音量控制、自動增益控制、動態範圍控制(例如包括限頻器、壓縮器、擴頻器等)、動態等化與補償為有用的。本發明不僅包括方法亦包括對應之電腦程式與裝置。
發明背景
其曾有很多企圖要發展令人滿意之測量響度的客觀方法。Fletcher與Munson在1933年判定人耳於低或高頻率比中間(或語音)頻率較不靈敏。他們亦發現在敏感度之相對變化隨著聲音位準提高而降低。早期之響度儀表由麥克風、放大器、量計與濾波器的組合所組成,其被設計以粗略地模擬在低、中、高聲音位準之聽覺的頻率響應。
雖然此類裝置提供單一、固定位準之隔離音調的響度之測量,較複雜的聲音之測量不能很好地符合響度之主觀的感知。此種型式之聲音位準量計已被標準化,但只就如工業噪音之監測與控制的特定工作被使用。
在1950年代早期,Zwicker與Stevens於他人之間在發展響度感知處理的較實際之模型方面延伸Fletcher與Munson 的工作。Stevens在1956年於Acoustical Society of America期刋中發表用於“Calculation of Loudness of Complex Noise”之方法,及Zwicker在1958年於Acoustica中發表他的“Psychological and Methodical Basis of Loudness”文章。在1959年,Zwcker發表了用於響度計算之圖形程序,以及其後很短時間內的數篇類似之文章。Stevens與Zwicker之方法被標準化作為ISO 532(分部為A部與B部)。此二種方法涉及類似之步驟。
首先,被稱為激發之能量沿著內耳的頭蓋骨底部薄膜之時間變化性分佈藉由傳送音頻通過具有在關鍵頻帶比率尺度上均一地間隔的中心頻率的一帶通聽覺相關聯聽覺濾波器排組被模擬。每一個聽覺濾波器被設計來模擬沿著內耳的頭蓋骨底部薄膜之特定位置之頻率響應,而以濾波器之中心頻率對應於此位置。關鍵頻帶寬被定義為此一種濾波器之帶寬。以赫茲為單位來測量,這些聽覺濾波器之關鍵頻帶寬隨著中心頻率漸增而提高。所以,定義一種捲繞頻率尺度使得以此捲繞尺度被測量之所有聽覺濾波器的關鍵頻帶寬為固定是為有用的。此種捲繞尺度被稱為關鍵頻帶比率尺度且在了解及模擬廣泛範圍之心理聲音現象為非常有用的。例如見1990年柏林之Springer-Verlag的E.Zwicker與H.Fastl之“Psychoacoustics-Facts and Models”。Stevens與Zwick之方法運用被稱為Bark尺度之關鍵頻帶比率尺度,其中之關鍵頻帶寬在低於500Hz為常數及在高於500Hz提高。最近,Moore與Glasberg定義一種關鍵頻帶比 率尺度,其被稱為等值長方形帶寬(ERB)尺度(B.C.Moore,B.Glasberg與T.Baer在1997年4月The Audio Engineering Society期刋第45卷第4期,第224-240頁之“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness.”)。透過使用有刻痕之雜訊遮罩的心理聲音實驗,Moore與Glasbery證明,在與其中關鍵頻帶寬於低於500Hz時維持常數之Bark尺度相對照之下,關鍵頻帶寬係繼續減小。
遵循激發計算的為一非線性壓縮函數,其產生被稱為「特定響度」之一種數量。特定響度為感知響度作為頻率與時間之函數的一度量,且可沿著如上面被討論之Bark或ERB尺度之關鍵頻帶比率尺度以每單位頻率的感知響度為單位被測量。理想上,特定響度呈現響度作為頻率與時間之函數的一連續分配函數,且其時間上變化的「總響度」藉由將此分配函數對頻率積分而被計算。在實務上,特定響度之精確呈現藉由將此分配函數例如透過使用上面提及之聽覺濾波器沿著關鍵頻帶比率尺度均勻地抽樣而被獲得。在此情形中,總響度可簡單地僅是加總來自每一個濾波器之特定響度而被計算。為降低複雜度,一些應用可以用被感知之響度的估計與修改之稍微不精確為代價而計算對特定響度的較粗略之近似值。此近似值將在稍後更詳細地被討論。
響度可用唪(phon)為單元被測量。以唪表示之某一聲音為具有主觀響度之1kHz音調的聲壓位準(SPL)等於該聲音者。慣常地,SPL之基準0dB為2×10-5 巴斯卡之均方根壓力, 且此因而亦為基準0唪。在比較非1kHz之頻率的音調之響度與1kHz響度中使用此定義,相等響度之等高線可針對某一唪位準被決定。第11圖顯示介於20Hz與125kHz間及4.2唪(被視為聽覺臨界值)與120唪間之頻率的相等響度等高線(ISO226:1087(E),“聲音-一般相等之響度位準等高線”)。該唪度量考慮到人耳隨頻率之變化的敏感度,但其結果不允許在變化中位準之聲音的相對主觀響度之評估,原因在於其無企圖要求以SPL來校正響度成長之非線性,此即為了等高線之間隔會變化的事實。
響度亦可用「(sone)」為單位被測量。在唪單位與單位間如第11圖中被指出地有一對一之映射。一被定義為1kHz純正弦波之40dB(SPL)的響度且等於40唪。之單位為使得的二倍增加對應於加倍之被感知的響度。例如,4被感知為如2之響度的二倍。因而,以表達響度位準為更有資訊性的。在給予特定響度之定義為感知響度是為頻率與時間的函數下,特定響度可用每單位之頻率的為單位被測量。因而,在使用Bark尺度時,特定響度具有之單位為每Bark之,而類似地在使用ERB尺度時,特定響度具有之單位為每ERB之
如上面被提及者,人耳之敏感度隨著頻率與位準二者而變化,此為在心理聲音文獻完備地被記載之事實。結果之一為某一聲音之被感知的頻譜或音色隨著聲音被聽到之聲音位準而變化。例如,就包含低、中與高頻率之聲音而言,此類頻率成份之被感知的相對比例隨著聲音之整體響 度而改變:當其為安靜的時,低與高頻率成份聲音相對於中間頻率比起其在大聲時更安靜。此現象為相當習知的,且已在所謂響度控制的聲音再生設備被緩和。響度控制為在音量被關小時施用低及有時候亦為高頻率升高之音量控制。因而,耳朵在頻率極端之較敏感度被這些頻率之人工升高補償。此類控制為完全被動的、被施用之補償程度為音量控制或一些其他使用者操作方式控制的設定之函數,而非音頻信號內容之函數。
在實務上,在低、中與高頻率間被感知的相對頻譜平衡係依頻率而定的,特別是依其實際頻譜及依其是欲為大聲或柔聲而定的。考慮交響樂之錄製。在聽眾之成員會在音樂廳聆賞的相同水準再生下,不論樂團正在大聲或安靜地演奏,整個頻譜之平衡可能是正確的。例如,若音樂以10dB較安靜地被再生,整個頻譜被感知的平衡就大聲樂節以一方式改變,而就安靜樂節以另一方式改變。慣常之被動的響度控制不會施用成為音樂之函數的不同補償。
在2004年5月24日申請之國際專利申請案第PCT/US2004/016964號且在2004年12月23日公告為WO 2004/11994 A2中,Seefeldt等人在其他事項中揭示一種用於測量及調整音頻信號之被感知的響度的系統。指定美國之該PCT申請案整體在此處被納入作為參考。在該申請案中,心理聲音模型以感知單位來計算音頻信號之響度。此外,該申請案引進用於計算寬帶多重增益之技術,其在被施用至音頻時,形成增益修改後之音響度實質上等於基準 響度的結果。然而,此種寬帶增益之施用改變該音頻之被感知的頻譜平衡。
發明概要
在一層面中,本發明藉由修改一音頻信號提供用於導出可用於控制該音頻信號之特定響度的資訊以降低其特定響度與一目標特定響度間之差。特定響度係成為頻率與時間之函數的感知響度之一測量。在實務施作中,被修改之音頻信號的特定響度可被做成以近似於目標特定響度。該近似不僅被普通之信號處理考量影響,亦如下面被描述地被在修改中被運用的時間及/或頻率平滑所影響。
由於特定響度係成為頻率與時間之函數的感知響度之一測量,為了降低音頻信號特定響度與一目標特定響度間之差,該修改可修改該音頻信號成為頻率之函數。雖然在一些情形中,目標特定響度於時間上為不變的且音頻信號本身可為穩定狀態之於時間上為不變的,該修改典型上亦修改音頻信號成為時間之函數。
本發明之層面亦可被運用以補償在音頻播放環境中之背景雜訊干擾。當音頻在出現背景雜訊時被聽到時,該雜訊可以依音頻信號之位準與頻譜及雜訊之位準與頻譜二者而定的方式部分或完全地遮蔽該音頻。結果為音頻之被感知的頻譜的變更。依照心理聲音研究(例如見1997年4月之Audio Eng.Soc.,期刊第45卷第4期的Moore,Glasberg與Baer之“A Model for the Prediction of Thresholds,Loudness and Partial Loudness”),吾人可定義音頻之「部分特定響度」為音頻在出現如頻譜之次要干擾聲音信號中的感知響度。
因而在另一層面中,本發明藉由修改一音頻信號提供用於導出可用於控制該音頻信號之部分響度的資訊以降低其特定響度與一部分特定響度間之差。如此做可以感知上精確之方式來減緩頻譜之影響。在考慮干擾頻譜之本發明的此與其他層面中,其被假設對音頻信號本及次要之干擾信號本身有存取。
在另一層面中,本發明藉由修改音頻信號提供用於控制該音頻信號之特定響度以降低其特定響度與一目標特定響度間之差。
在另一層面中,本發明藉由修改音頻信號提供用於控制該音頻信號之部分特定響度以降低其部分特定響度與一目標特定響度間之差。
當目標特定響度不為音頻信號之函數時,其可為被儲存或被接收之目標特定響度。當目標特定響度不為音頻信號之函數時,該修改或該導出可外顯地或內藏地計算特定響度或部分特定響度。內藏計算之例包括查表或「封閉形式」之數學公式,其中特定響度及/或部分特定響度係先天地被決定(封閉形式意為要描述可確實地使用標準之數學運算與函數(如指數函數或餘弦函數)的有限數被呈現之數學公式)。同樣當目標特定響度不為音頻信號之函數時,目標特定響度可為在時間上與頻率上二者均為不變的,或僅為時間上不變的。
在還另一層面中,本發明藉由依照一個或多個處理與一個或多個處理控制參數處理一音頻信號或該音頻信號之一度量而提供用於處理該音頻信號以產生一目標特定響度。雖然該目標特定響度可為時間上不變的(固定的),該目標特定響度可有利地為該音頻信號之特定響度的函數。雖然其典型上可為靜態的、為在頻率上與時間上不變的信號,該音頻信號本身為頻率上與時間上變動的,因而造成目標特定響度在其為音頻信號之函數時為頻率上與時間上變動的。
音頻與目標特定響度及目標特定響度之呈現可由傳輸被接收或由儲存媒體被再生。
目標特定響度之呈現可為一個或多個尺度因子,其作為音頻信號或音頻信號之度量尺度。
任一上面之本發明的層面之目標特定響度可為音頻信號或音頻信號之度量的函數。音頻信號之一適合的度量為該音頻信號之特定響度。音頻信號或音頻信號之度量的函數可為音頻信號或音頻信號之度量的縮放。例如,該尺度為下列的尺度之一或其組合。
(a)如下列關係的該特定響度之一時間上與頻率上變化的尺度因子縮放: (b)如下列關係的該特定響度之一時間上變化與頻率上不變的尺度因子Φ[t ]縮放: (c)如下列關係的該特定響度之一時間上不變與頻率上變化的尺度因子Θ[b ]縮放: (d)如下列關係的該特定響度之一時間上不變與頻率上不變的尺度因子α縮放: 其中為音頻信號之目標特定響度、N [b ,t ]為特定響度、b為頻率之一度量、及t為時間之一度量。
在情形(a)之時間上與頻率上變化的尺度因子中,縮放可至少部分地用所欲的多頻帶響度與音頻信號之多頻帶響度的比值被決定。此縮放可使用成為動態範圍控制。運用本發明成為動態範圍控制之層面的進一步細節在下面被設立。
亦在情形(a)之時間上與頻率上變化的尺度因子中,特定響度用所欲之頻譜形狀的一度量對音頻信號之頻譜形狀的一度量之比值被訂出尺度。此縮放可被運用以將音頻信號之被感知的頻譜由時間上變化之被感知的頻譜轉換為實質地頻率上變化之被感知的頻譜。當特定響度用所欲之頻譜形狀的一度量對音頻信號之頻譜形狀的一度量之比值被訂出尺度時,此縮放可使用成為動態等化器。運用本發明成為動態等化器之層面的進一步細節在下面被設立。
在情形(b)之時間上變化、頻率上不變的尺度因子中,尺度標示可至少部分地用所欲的寬頻帶響度與音頻信號之寬頻帶響度的比值被決定。此縮放可使用成為自動增益控 制或動態範圍控制。運用本發明成為自動增益控制或動態範圍控制之層面的進一步細節在下面被設立。
在情形(a)(時間上與頻率上變化之尺度因子)或情形(b)(時間上變化、頻率不變之尺度因子)中,尺度因子可為音頻信號或音頻信號之度量的函數。
在情形(c)之時間上變化、頻率上不變的尺度因子或情形(d)之時間上不變、頻率上不變的尺度因子二者中,該等修改或導出可包括儲存尺度因子或該尺度因子可由外部來源被接收。
在情形(c)與情形(d)其中之一,尺度因子可不為音頻信號或音頻信號之度量的函數。
在本發明之任一各種層面與其變形中,該等修改、導出或產生可各式地外顯或內藏地計算(1)特定響度、及/或(2)部分特定響度、及/或目標特定響度。內藏的計算例如可涉及查表或封閉形式之數學公式。
修改參數可在時間上被平滑。修改參數例如可為(1)多個與音頻信號之頻帶有關的振幅縮放因子,或(2)多個用於控制一個或多個濾波器(如多拍FIR濾波器或多極FIR濾波器)之濾波器係數。該等縮放因子或濾波器係數(與其被施用之濾波器)可為時間上變化的。
在計算定義目標特定響度之音頻信號的特定響度之函數或其反函數中,執行此類計算之過程係在以感知的(心理聲音的)響度域為特徵地運算-計算之輸入與輸出係為特定響度。對照之下,在對音頻信號之頻帶施用振幅尺度因 子或對音頻信號之可控制的濾波施用濾波器係數中,修改參數之運算係修改在感知的(心理聲音的)響度域外之音頻信號,其中此可以電氣信號域為特徵。雖然對音頻信號之修改可對電氣信號域中的音頻信號被做成,在電氣信號域中之變化由在感知的(心理聲音的)響度域中之計算被導出,使得被修改之音頻信號具有近似於所欲的目標特定響度之特定響度。
藉由從響度域中之計算導出修改參數,對感知響度與被感知的頻譜平衡比起若此些修改參數在電氣信號域中被導出之更大控制可被達成。此外,在執行響度域計算中之頭蓋骨底部薄膜模擬的心理聲音濾波器排組或其等值事項之使用比起修改參數在電氣信號域中被導出的配置可提供被感知的頻譜之更詳細的控制。
每一個修改、導出與產生可依干擾之音頻信號、目標特定響度、由特定響度被導出之未修改的音頻信號之特定響度或該修改的音頻信號之部分特定響度的估計、該未被修改的音頻信號之特定響度、及對由修改的音頻信號之特定響度或部分特定響度被導出之目標特定響度的近似之一個或多個測量而定的。
該修改或導出可至少部分地由干擾之音頻信號、目標特定響度、由特定響度被導出之未修改的音頻信號之特定響度或該修改的音頻信號之部分特定響度的估計、該未被修改的音頻信號之特定響度、及對由修改的音頻信號之特定響度或部分特定響度被導出之目標特定響度的近似之一 個或多個測量來導出修改參數。
更明確地說,該修改或導出可部分地由下列導出修改參數:(1)一目標特定響度,與由該被修改之音頻信號的特定響度被接收之該未被修改的音頻信號之特定響度的一估計之一;以及(2)該未被修改之音頻信號的特定響度,與對由該被修改之音頻信號的特定響度被導出之該目標特定響度的一近似,之一或者在一干擾音頻信號被考慮時,該修改或導出可部分地由下列導出修改參數:(1)一干擾音頻信號的一度量,(2)一目標特定響度,與由該被修改之音頻信號的部分特定響度被導出之該未被修改的音頻信號之特定響度的一估計之一;以及(3)該未被修改之音頻信號的特定響度,與對由該被修改之音頻信號的部分特定響度被導出之該目標特定響度的一近似,之一。
一種向前饋送配置可被運用,其中該特定響度由該音頻信號被導出,及其中該目標特定響度由該方法外部之來源或在該修改或導出包括儲存一目標特定響度時由一儲存器被接收。或者,一種混合式向前/向後饋送配置可被運 用,其中對該目標特定響度的一近似由該被修改的音頻信號被導出,及其中該目標特定響度由該方法外部之來源或在該修改或導出包括儲存一目標特定響度時由一儲存器被接收。
該修改或導出可包括一個或多個處理用於外顯地或內藏地獲得該目標特定響度,其外顯地或內藏地計算該音頻信號或該音頻信號之度量的一函數。在一替選方式中,一向前饋送配置可被運用,其中該特定響度與該目標特定響度係由該音頻信號被導出,該目標特定響度之導出運用該音頻信號或該音頻信號之度量的一函數。在另一替選方式中,一混合式向前/向後饋送配置可被運用,其中對該目標特定響度之一近似係由該被修改的音頻信號被導出,及該目標特定響度係由該音頻信號被導出,該目標特定響度之導出係運用該音頻信號或該音頻信號之度量的一函數。
該修改或導出可包括一個或多個處理用於外顯地或內藏地獲得響應該被修改的音頻信號之該未被修改的音頻信號的該特定響度之一估計,其外顯地或內藏地計算該音頻信號或該音頻信號之度量的一反函數。在一替選方式中,一向後饋送配置可被運用,其中該特定響度係由該音頻信號被導出及該未被修改的音頻信號的特定響度之估計係由該被修改的音頻信號被導出。該估計之導出係使用該音頻信號或該音頻信號的一度量之反函數被計算。
修改參數可被施用至該音頻信號以產生一被修改的音頻信號。
本發明之另一層面為其有時間上及/或空間上隔離之處理或裝置,使得其實際上有一編碼器或編碼及亦有一解碼器或解碼。例如,其可有一種編碼/解碼系統,其中該修改或導出可為發射與接收或儲存且亦再生該音頻信號,及(1)修改參數與(2)一目標特定響度或一目標特定響度之呈現的其中之一。替選地,其實際上可只有一解碼器或解碼,其中有發射或儲存該音頻信號,及(1)修改參數與(2)一目標特定響度或一目標特定響度之呈現的其中之一。替選地,其實際上可只有一編碼器或編碼,其中有接收與再生該音頻信號,及(1)修改參數與(2)一目標特定響度或一目標特定響度之呈現的其中之一。
圖式簡單說明
第1圖為一功能方塊圖,顯示依據本發明之層面的一向前饋送施作之一例。
第2圖為一功能方塊圖,顯示依據本發明之層面的一向後饋送施作之一例。
第3圖為一功能方塊圖,顯示依據本發明之層面的一混合式向前/向後饋送施作之一例。
第4圖為一功能方塊圖,顯示依據本發明之層面的一混合式向前/向後饋送施作之另一例。
第5圖為一功能方塊圖,顯示其中如用任何一向前饋送、向後饋送與混合式向前/向後饋送配置被決定之該未被修改的音頻信號與該等修改參數可在例如時間上或空間上的裝置或處理中用以被儲存或被發射之方式。
第6圖為一功能方塊圖,顯示其中如用任何一向前饋送、向後饋送與混合式向前/向後饋送配置被決定之該未被修改的音頻信號與一目標特定響度或其呈現可在例如時間上或空間上的裝置或處理中用以被儲存或被發射之方式。
第7圖為一示意性之功能方塊圖或示意性之流程圖,顯示本發明的一層面之概要。
第8圖為適合作為本發明之一實施例的傳輸濾波器的一線性濾波器p(z)之理想化特徵響應,其中垂直軸為以分貝(dB)表示之衰減及水平軸為以赫茲(Hz)表示之以10為底的對數之頻率。
第9圖顯示ERB頻率尺度(垂直軸)與以赫茲表示之頻率(水平軸)間的關係。
第10圖顯示一組近似ERB尺度上之關鍵頻帶的理想化聽覺濾波器特徵響應。水平尺度為以赫茲表示之頻率及垂直軸為以分貝表示之位準。
第11圖顯示ISO 226之相等響度等高線。水平軸為以赫茲表示之以10為底的對數之頻率及垂直軸為以分貝表示之聲壓位準。
第12圖顯示用傳輸濾波器p(z)被常規化的ISO 226之相等響度等高線。水平軸為以赫茲表示之以10為底的對數之頻率及垂直軸為以分貝表示之聲壓位準。
第13a圖為一理想化圖,顯示針對在一段女性講話上之0.25的響度縮放之寬度與多頻帶增益。水平尺度為ERB頻帶及垂直尺度為以分貝(dB)表示之相對增益。
第13b圖為一理想化圖,分別顯示原始信號、寬帶增益修改信號與多帶增益修改信號之特定響度。水平尺度為ERB頻帶及垂直尺度為特定響度(/ERB)。
第14a圖為一理想化圖,顯示:針對典型之AGC,L o [t ]為L i [t ]之函數。水平尺度為log(L i [t ])及垂直尺度為log(L o [t ])。
第14b圖為一理想化圖,顯示:針對典型之DRC,L o [t ]為L i [t ]之函數。水平尺度為log(L i [t ])及垂直尺度為log(L o [t ])。
第15圖為一理想化圖,顯示針對多頻帶DRC之典型的頻帶平滑函數。水平尺度為頻帶數目及垂直尺度為頻帶b之增益輸出。
第16圖為一示意性之功能方塊圖或示意性之流程圖,顯示本發明的一層面之概要。
第17圖為類似第1圖之示意性功能方塊圖或示意性流程圖,其亦包括針對播放環境中之雜訊的補償。
實施本發明之最佳模式
第1至4圖顯示功能方塊圖,說明依據本發明之層面之可能的向前饋送、向後饋送、及二版本之混合式向前/向後饋送施作例。
參照第1圖中之向前饋送拓樸的一例,一音頻信號被施用至二路徑:(1)具有能在響應修改參數下修改音頻之處理或裝置2(「修改音頻信號」)的信號路徑,與(2)具有能產生 修改參數之處理或裝置4(「產生修改參數」)的控制路徑。在第1圖之向前饋送拓樸的一例及在第2-4圖之例中的修改音頻信號2可為例如依照由產生修改參數4(或分別由第2-4圖中相對部分之每一個處理或裝置4’,4”與4''')被接收的修改參數M,以頻率上及/或時間上變化之方式修改音頻信號的振幅。產生修改參數4與其在第2-4圖中之相對部分的每一個至少部分地在感知響度域中操作。修改音頻信號2在電氣信號域中操作並在第1-4圖之每一個例中產生被修改的音頻信號。同樣在第1-4圖之每一個例中修改音頻信號2與產生修改參數4(或其相對部分)修改音頻信號以降低其特定響度與一目標特定響度間之差。
在第1圖之向前饋送例中,處理或裝置4可包括數個處理及/或裝置:在響應音頻信號或音頻信號之特定響度的該音頻信號之一度量下計算目標特定響度的一「計算目標特定響度」處理或裝置6、在響應音頻信號或音頻信號之激發的該音頻信號之一度量下計算該音頻信號的特定響度之一「計算特定響度」處理或裝置8、及在響應特定響度與目標特定響度下計算修改參數之一「計算修改參數」處理或裝置10。計算目標特定響度6可執行一個或多個函數F,其每一個具有函數參數。例如,其可計算音頻信號之特定響度,然後施用一個或多個函數F至此以提供目標特定響度。此在第1圖中示意地被指出為一「選擇函數F與函數參數」輸入至處理或裝置6。取代被處理或裝置6計算地,目標特定響度可藉由被納入產生修改參數4中或與之相關聯之一儲存 處理或裝置(示意地被顯示為一「儲存」輸入至處理或裝置10)或用在整體處理或裝置外部之來源(示意地被顯示為「外部」輸入處理或裝置10)而被提供。因而,該等修改參數係至少部分地根據在感知(心理聲音)響度域(即特定響度及在一些情形中之目標特定響度計算而定)。
被處理或裝置6,8與10(與被第2圖之例中為處理或裝置12,14,10’、在第3圖之例中的6,14,10”、與在第4圖之例中的8,12,10''')可外顯地及/或內藏地被執行。內藏執行之例子包括登入值係完全或部分地根據特定響度及/或目標特定響度及/或修改參數計算,及(2)封閉形式之數學公式,其係先天上完全或部分地根據特定響度及/或目標特定響度及/或修改參數。
雖然第1圖之例中計算處理或裝置6,8與10(與被第2圖之例中為處理或裝置12,14,10’、在第3圖之例中的6,14,10”、與在第4圖之例中的8,12,10''')示意地被顯示及被描述為分離的,此只是為了解釋之目的。其應被了解一個或所有這些處理或裝置可在單一處理或裝置中被組合或在多處理或裝置中各式地被組合。例如在下面第9圖之配置中,如於第1圖之例中的向前饋送拓樸地,計算修改參數之處理或裝置在響應由音頻信號被導出之平滑後的激發與一目標特定響度下如此做。在第9圖之例中,計算修改參數之處理或裝置內藏地計算音頻信號之特定響度。
如本發明的一層面地,在本發明的第1圖之例與此處本發明的其他實施例中,音頻信號之目標特定響度() 可藉由用一個或多個尺度因子將特定響度(N [b ,t ])加以比例調整而被計算。該比例調整為如下列關係的該特定響度之一時間上與頻率上變化的尺度因子縮放: 如下列關係的該特定響度之一時間上變化與頻率上不變的尺度因子Φ[t ]縮放: 如下列關係的該特定響度之一時間上不變與頻率上變化的尺度因子Θ[b ]縮放:、或者如下列關係的音頻信號之該特定響度的尺度因子α縮放: 此處b為頻率之一度量(如頻帶數目)及t為時間之一度量(如區塊數目)。多重縮放亦可被運用而使用特定縮放及/或特定縮放之組合的實例。此種多重縮放的例子在下面被給予。在一些情形中,如在下面進一步被解釋地,該縮放可為音頻信號或音頻信號之度量的函數。在其他情形中,亦如在下面進一步被解釋地當該縮放不為音頻信號或音頻信號之度量的函數時,該縮放反而可被判定或被供應。例如,使用者可選擇施用時間上與頻率上不變的尺度因子α 或時間上不變、頻率上變化的尺度因子Θ[b ]之縮放。
因而,目標特定響度可被表示為音頻信號或音頻信號之度量的函數之一個或多個函數F(特定響度為音頻信號之可能的一個度量):
假設函數F為可逆的,未被修改的音頻信號之特定響度N [b,t ]可被計算成為目標特定響度的反函數F-1
如將在下面被看出地,反函數F-1在第2圖中向後饋送配置與混合式之向後/向後饋送配置例中被計算。
對計算目標特定響度6之一「選擇函數與函數參數」輸入被顯示以指出處理或裝置6可藉由依照一個或多個函數參數施用一個或多個函數來計算目標特定響度。例如,計算目標特定響度8可計算音頻信號之特定響度的函數或函數F以定義目標特定響度。例如,「選擇函數與函數參數」輸入可選擇落入一個或多個上面型式之縮放內的一個或多個特定函數以及一個或多個函數參數,如屬於該等函數之常數(如尺度因子)。
與尺度相關聯之尺度因子由於目標特定響度可如上面被指出地被計算作為特定響度之一縮放而作用成為目標特定響度的呈現。因而在第9圖中,下面要描述及上面被提及之檢查表可用尺度因子被訂指標及激發,使得特定響度與目標特定響度之計算為在表中固有的。
不論是運用檢查表、封閉形式數學公式或一些其他技術,產生修改參數4(與在每一個第2-4圖之例中相對部分之處理或裝置4’,4”與4''')為使得該等計算係以感知(心理聲音)響度域為基礎,甚至特定響度與目標特定響度未能外顯地被計算亦然。其有外顯的特定響度或有概念性之內藏的特 定響度,此二種之一均可。類似地,其有外顯的目標特定響度或有概念性之內藏的目標特定響度,此二種之一均可。在任一情形中,修改參數之計算尋求產生修改音頻信號以降低特定響度與一目標特定響度間之差的修改參數。
在具有次要干擾音頻信號(如雜訊)之播放環境中,計算修改參數10(與分別在每一個第2-4圖之例中相對部分之處理或裝置10’,10”與10''')亦可接收此次要干擾音頻信號之一度量或該次要干擾音頻信號本身的選配輸入作為其輸入之一。次要干擾音頻信號之度量可為在下面被描述之第17圖中的其激發。此選配輸入在第1圖(與在第2-4圖)中以虛線被顯示。次要干擾信號之度量可為如下面描述之第17圖之例的其激發。干擾信號或信號本身(其被假設該干擾信號針對處理為分離地可得可用的)之度量對第1圖中之計算修改參數處理或裝置10(與分別在每一個第2-4圖之例中相對部分之處理或裝置10’,10”與10''')的施用允許適當地被組配之此處理或裝置如下面在「雜訊補償」標題下進一步被解釋地計算考慮到干擾信號之修改參數。在第2-4圖之例中,部分特定響度之計算假設干擾信號的適合之度量不僅被施用至各計算修改參數10’,10”或10''',亦被施用至「計算被修改的音頻信號之特定響度的近似」處理或裝置12及/或「計算目標特定響度之近似」處理或裝置14以促進用此函數或裝置之計算部分特定響度。在第1圖之向前饋送例中,部分特定響度係非外顯地被計算-第1圖之計算修改參數10計算適合的修改參數以使被修改的音頻信號之部分特定響度近 似於目標特定響度。此在前面所提及之標題「雜訊補償」下於下面進一步被解釋。
如上面被提及者,在第1-4圖之每一個例中,修改參數M在被施用至被音頻信號修改器2時降低結果所得之被修改的音頻信號之特定響度或部分特定響度與目標特定響度間的差。理想上,被修改的音頻信號之特定響度緊密地近似目標特定響度或與之相同。修改參數例如可採用被施用至由濾波器排組被導出之頻帶或被施用至時間上變化的增益因子之形式。因之,在所有第1-4圖之例中,修改音頻信號2亦可例如被施作成為多個振幅量度器,其每一個在(a)或時間上變化之濾波器(如多拍FIR濾波器或多極FIR濾波器)中操作。
在此文件之此處與其他處,相同元件編號之使用指出該處理或裝置係與帶有相同元件編號之另外或其他者實質上相同的。帶有撇之數字(如10’)的元件編號指出類似結構或功能的處理或裝置,但可為帶有相同基本元件編號之另外或其他者的修改。
在某些限制下,第1圖之向前饋送例的幾近等值的向後饋送配置可被實現。第2圖揭示此例,其中音頻信號亦在一信號路徑被施用至修改音頻信號處理或裝置2。該處理或裝置2亦由一控制路徑接收修改參數M,其中在向後饋送配置中之產生修改參數處理或裝置4’由修改音頻信號2之輸出接收被修改的音頻信號作為其輸入。因而在第2圖之例中,被修改的音頻信號而非未被修改的音頻信號被施用至控制 路徑。修改音頻信號處理或裝置2與產生修改參數處理或裝置4’修改音頻信號以降低其特定響度與一目標特定響度間之差。處理或裝置4’可包括數個功能及/或裝置:「計算被修改的音頻信號之特定響度的近似」處理或裝置12、「計算目標特定響度之近似」處理或裝置14、及計算修改參數之「計算修改參數」處理或裝置10’。
在函數F為可逆的之限制下,處理或裝置12藉由施用反函數F-1 至被修改的音頻信號的特定響度或部分特定響度來估計未被修改的音頻信號之特定響度。處理或裝置12可如上面被描述地計算一反函數F-1 。此在第2圖中示意地被指出為對處理或裝置12之「選擇反函數F-1 與函數參數」輸入。「計算目標特定響度之近似」14藉由計算被修改的音頻信號之特定響度或部分特定響度而操作。此特定響度或部分特定響度為目標特定響度之近似。未被修改的音頻信號之特定響度的近似與目標特定響度之近似被計算修改參數10’使用以導出修改參數M,其在若被修改音頻信號2施用至音頻信號時降低被修改的音頻信號之特定響度或部分特定響度與目標特定響度間之差。如上面被提及者,修改參數例如可採用被施用至由濾波器排組被導出之頻帶或被施用至時間上變化的增益因子之形式。在計算修改參數10”之實務實施例中,該向後饋送迴圈會在修改參數M之計算與應用間引進延遲。
如上面被提及者,在具有次要干擾音頻信號(如雜訊)之播放環境中,計算修改參數10’、計算被修改的音頻信號 之特定響度的近似12與計算目標特定響度之近似14的每一個亦可接收此次要干擾音頻信號之一度量或該次要干擾音頻信號本身的選配輸入作為其輸入之一,且處理或裝置12與處理或裝置14之每一個可計算被修改的音頻信號之部分特定響度。此類選配輸入在第2圖中用虛線被顯示。
如上面被提及者,本發明之層面的混合式向前/向後饋送配置施作為可能的。第3與4圖顯示此施作之二例。在第3與4圖之例中,如在第1與2圖中之例地,音頻信號亦被施用至在一信號路徑中的修改音頻信號處理或裝置2,但在各控制路徑中之產生修改參數(第3圖中之4”與第4圖中之4''')的每一個均接收未被修改的音頻信號與被修改的音頻信號二種。在第3與4圖二者之例中,修改音頻信號2與產生修改參數(分別為4”與4''')修改音頻信號以降低其特定響度(此為內藏的)與一目標特定響度(此亦為內藏的)間之差。
在第3圖之例中,產生修改參數處理或裝置4’可包括數個函數與裝置:如在第1圖之例中的計算目標特定響度6、如在第2圖之向後饋送例中的計算目標特定響度之近似14、及「計算修改參數」處理或裝置10”。如在第1圖之例中地,於此混合式向前/向後饋送例之向前饋送部分中計算目標特定響度6可實施執行一個或多個函數F,其每一個具有函數參數。此在第3圖中示意地被顯示為對處理或裝置6之「選擇函數與函數參數」輸入。於此混合式向前/向後饋送例之向後饋送部分中被修改的音頻信號如在第2圖之向後饋送例中地被施用至計算目標特定響度之近似14。處理 或裝置14在第3圖之例中如在第2圖之向後饋送配置例中藉由計算被修改的音頻信號之特定響度或部分特定響度而操作。此特定響度或部分特定響度為目標特定響度之一近似。目標特定響度(來自處理或裝置6)與目標特定響度之近似(來自處理或裝置14)以導出修改參數M,其在若被修改音頻信號2施用至音頻信號時降低被修改的音頻信號之特定響度或部分特定響度與目標特定響度間之差。如上面被提及者,修改參數例如可採用被施用至由濾波器排組被導出之頻帶或被施用至時間上變化的增益因子之形式。在實務實施例中,該向後饋送迴圈會在修改參數M之計算與應用間引進延遲。如上面被提及者,在具有次要干擾音頻信號(如雜訊)之播放環境中,計算修改參數10”與計算目標特定響度之近似14的每一個亦可接收此次要干擾音頻信號之一度量或該次要干擾音頻信號本身的選配輸入作為其輸入之一,且處理或裝置12與處理或裝置14之每一個可計算被修改的音頻信號之部分特定響度。此類選配輸入在第3圖中用虛線被顯示。
計算修改參數10”可運用錯誤檢測裝置或功能,使得其目標特定響度與目標規格響度輸入間之差可調整修改參數之測量目標特定響度之近似與「實際」目標特定響度間的差。此調整測量未被修改的音頻信號之特定響度與目標特定響度(此可為內藏的)間的差。因而,修改參數可根據使用函數F在向前饋送路徑中由原始音頻之特定響度被計算的目標特定響度與在向後饋送路徑中由特定響度或部分特定 響度被計算的目標特定響度近似間之誤差被更新。
在第4圖中,一替選之混合式向前/向後饋送例被顯示。此替選方式與第3圖之例不同處在於反函數或函數F-1 係在向後饋送路徑中被計算,而非如函數或函數F係在向前饋送路徑中被計算。在第4圖之例中,提供修改參數處理或裝置4’可包括數個功能或裝置:如在第1圖之向前饋送例中的計算特定響度8、如在第2圖之混合式向前/向後饋送例中的計算未被修改的音頻信號之特定響度的近似12、及計算修改參數10'''。計算特定響度8如在第1圖之向前饋送例地提供未被修改的音頻信號之特定響度作為對計算修改參數10'''的輸入。如在第2圖中之向後饋送例地,在函數F為可逆的之限制下,處理或裝置12藉由施用反函數F-1 至被修改的音頻信號的特定響度或部分特定響度來估計未被修改的音頻信號之特定響度。針對計算未被修改的音頻信號之特定響度的近似12之「選擇反函數F-1 與函數參數」輸入被顯示以指出處理或裝置12可如上面被描述地計算一反函數F-1 。此在第4圖中示意地被指出為對處理或裝置12之「選擇反函數F-1 與函數參數」輸入。因而,處理或裝置12提供對未被修改的音頻信號之特定響度的一近似作為對計算修改參數10'''之另一輸入。
如在第1-3圖中之例地,計算修改參數10'''導出修改參數M,其在若被修改音頻信號2施用至音頻信號時降低被修改的音頻信號之特定響度或部分特定響度與目標特定響度間之差,其在此例中為內藏的。如上面被提及者,修改參 數例如可採用被施用至由濾波器排組被導出之頻帶或被施用至時間上變化的增益因子之形式。在實務實施例中,該向後饋送迴圈會在修改參數M之計算與應用間引進延遲。
如上面被提及者,在具有次要干擾音頻信號(如雜訊)之播放環境中,計算修改參數10'''與計算被修改的音頻信號之特定響度的近似12的每一個亦可接收此次要干擾音頻信號之一度量或該次要干擾音頻信號本身的選配輸入作為其輸入之一,且處理或裝置12可計算被修改的音頻信號之部分特定響度。此類選配輸入在第4圖中用虛線被顯示。
計算修改參數10”’可運用錯誤檢測裝置或功能,使得其特定響度與特定響度近似輸入會產生輸出,其調整修改參數而降低特定響度之近似與「實際」特定響度間的差。由於特定響度之近似係由被修改的音頻信號之特定響度或部分特定響度被導出,其可被視為目標特定響度之一近似,此些調整降低被修改的音頻信號之特定響度與目標特定響度間的差,此為函數或函數F-1 所固有的。因而,修改參數M可根據在向前饋送路徑中由原始音頻被計算之特定響度與在向後饋送路徑中由被修改的音頻信號之特定響度或部分特定響度使用反函數或函數F-1 被計算之特定響度近似間的誤差被更新。由於該向後饋送路徑,實務之施作會在修改參數的更新與應用間引進延遲。
雖然第1-4圖之例中的修改修改參數M在被施用至修改音頻信號處理或裝置2降低音頻信號之特定響度與目標特定響度間之差,在實務實施例中於響應同一音頻信號下被 產生的對應之修改參數不會彼此相同。
雖然對本發明之層面不為關鍵或必要的,音頻信號或被修改的音頻信號之特定響度的計算可有利地運用在國際專利申請案第PCT/US2004/016964(被公布為WO2004/111964 A2)中被設立之技術,其中之計算從二個或多個特定響度模型函數之一群組選擇二個或多個特定響度模型函數的一個或組合,其選擇係被該輸入音頻信號之特徵的度量控制。下面第1圖之特定響度104的描述說明此種配置。
依照本發明之進一步的層面,未被修改的音頻信號與(1)修改參數或(2)目標特定響度或目標特定響度之呈現(如在外顯地或內藏地計算目標特定響度中可用的尺度因子)可被儲存或被發射以便例如在時間上及/或空間上分離之處理或裝置中使用。該等修改參數、目標特定響度或目標特定響度之呈現可用任何適合的方法被決定,例如用上述的第1-4圖中之例的向前饋送、向後饋送與混合式向前/向後饋送配置例。在實務中,如第1圖之例中的向前饋送配置為最不複雜且最快的,原因為其避免根據被修改的音頻信號之計算。發射或儲存未被修改的音頻信號與修改參數之例在第5圖中被顯示,而發射或儲存未被修改的音頻信號與目標特定響度之呈現的例子在第6圖中被顯示。
如在第5圖之例中的配置可被用以在時間上或空間上分離對音頻信號之修改參數的施用與此類修改參數之產生。如在第6圖之例中的配置可被用以在時間上或空間上分離該等修改參數之施用及產生二者與目標特定響度或其呈 現。二種型式之配置使避免產生修改參數或產生目標特定響度之複雜性的簡單之低成本的播放或接收配置為可能的。雖然第5圖型式之配置比第6圖型式之配置較簡單,第6圖之配置具有的利益為需被儲存或發射之資訊會少很多,特別是如一個或多個尺度因子之目標特定響度的呈現被儲存或發射時為然。此資訊之被儲存或發射的降低特別在低位元率音頻環境中為有用的。
因之,本發明的進一步層面為處理或裝置之提供,其為(1)由一儲存或發射的處理或裝置接收或播放修改參數並將之施用至亦被接收的音頻信號,或(2)由一儲存或發射的處理或裝置接收或播放目標特定響度或目標特定響度之呈現、藉由施用其目標特定響度或目標特定響度之呈現至亦被接收的音頻信號(或至如音頻信號之特定響度的其之度量,此可由該音頻信號被導出)而產生修改參數、及施用該等修改參數M至被接收的音頻信號。此類處理或裝置可被特徵化成為解碼處理或解碼器,而要產生被儲存或發射之資訊所需的處理或裝置可被特徵化成為編碼處理或編碼器。此類編碼處理或編碼器為要產生各解碼處理或解碼器所需要之資訊時可使用的第1-4圖之配置例的一些部分。此類解碼處理或解碼器可與處理及/或再生聲音之任何型式的處理或裝置真實地被結合或與之操作。
在本發明之一層面中如於第5圖的例中,未被修改的音頻信號與例如用如第1圖4、第2圖之4’、第3圖之4”、或第4圖之4’”產生修改參數的修改參數產生處理或產生器所產 生之修改參數M可被施用至適合的儲存或發射裝置或功能(「儲存或發射」)16。在使用第1圖之向前饋送例作為編碼器或編碼處理的情形中,若沒有需要在編碼器或編碼處理之時間或空間位置提供被修改的音頻信號,修改音頻信號2不會被要求來產生被修改的音頻信號且可被省略。儲存或發射16例如可包括任何適合之磁性、光學或固態儲存器與播放裝置或任何適合之有線或無線發射與接收裝置,其選用對本發明並非關鍵性的。然後被播放或被接收之修改參數可被施用至在第1-4圖之例中被運用的型式之修改音頻信號2,以修改該被播放或被接收之音頻信號,使得其特定響度近似其中修改參數被導出之配置的目標特定響度或為其所固有的。修改參數可用任何各種方法被儲存或發射。例如,其可被儲存或發射成為伴隨音頻信號之元資料、其可在分離之路徑或通道中被傳送、其可在音頻中以資訊隱藏遮蓋式地被編碼、其可被多工等。要修改音頻信號的修改參數之使用為選配的,且在若為選配的時,其使用對使用者為可選擇的。例如,修改參數若被施用至音頻信號可能降低音頻信號之動態範圍。是否要運用此動態範圍降低對使用者為可選擇的。
在本發明之另一層面中如於第6圖的例中,未被修改的音頻信號與目標特定響度或目標特定響度之呈現可被施用至適合的儲存或發射裝置或功能(「儲存或發射」)16。在使用如第1圖之向前饋送組配作為編碼器或編碼處理的情形中,若沒有需要在編碼器或編碼處理之時間或空間位置提 供修改參數或被修改的音頻信號,即非計算修改參數10式之處理或裝置亦非修改音頻信號2式之處理或裝置被需要且可被省略。如在第5圖之例的情形地。儲存或發射16例如可包括任何適合之磁性、光學或固態儲存器與播放裝置或任何適合之有線或無線發射與接收裝置,其選用對本發明並非關鍵性的。被播放或被接收之目標特定響度或目標特定響度的呈現以及未被修改的音頻信號便可被施用至在第1圖之例中被運用的計算修改參數10或被施用至在第2圖之例中被運用的計算修改參數10”以提供修改參數M,以修改該被播放或被接收之音頻信號,使得其特定響度近似其中修改參數被導出之配置的目標特定響度或為其所固有的。雖然目標特定響度或其呈現在第1圖之例的型式之編碼器或編碼處理可能不是最容易被獲得的,目標特定響度或其呈現或對目標特定響度或其呈現之近似可在第2-4圖之例的型式之編碼器或編碼被獲得(近似係在第2與3圖之處理或裝置14中與在第4圖之處理或裝置12中被獲得。其目標特定響度或其呈現可用任何各種方法被儲存或發射。例如,其可被儲存或發射成為伴隨音頻信號之元資料、其可在分離之路徑或通道中被傳送、其可在音頻中以資訊隱藏遮蓋式地被編碼、其可被多工等。要修改音頻信號的由被播放或被接收之目標特定響度或其呈現之使用為選配的,且在若為選配的時,其使用對使用者為可選擇的。例如,修改參數若被施用至音頻信號可能降低音頻信號之動態範圍。是否要運用此動態範圍降低對使用者為可選擇的。
在實施本發明成為數位系統時,向前饋送組配為最務實的,且此類組配之例子因而在下面詳細地被描述,但其被了解本發明之領域不如此地受限。
在整個此文件中,如「濾波器」或「濾波器排組」在此處被使用以基本上包括如IIR濾波器或變換之任何形式的重現性或非重現性濾波,及「被濾波」之資訊係為施用此類濾波器的結果。下面被描述之實施例係運用以變換所施作的濾波器排組。
第7圖更詳細地顯示在向前饋送配置中被實施之本發明的一層面之釋例性實施例。音頻首先通過一分析濾波器排組(「分析濾波器排組」)100,其將音頻信號分割成多個頻帶(因此,第5圖顯示由分析濾波器排組100之多重輸出,每一個輸出呈現一頻率,此輸出通過各種函數或裝置承載上達至一合成濾波器排組,其如下面進一步被描述地將頻帶加總成為組合式之寬帶信號)。與在分析濾波器排組100中之每一個頻帶相關聯的濾波器之響應被設計以模擬在內耳的頭蓋骨底部薄膜之特定位置的響應。在分析濾波器排組100之每一個濾波器的輸出接著被傳送至一傳輸濾波器功能(「傳輸濾波器」)101,其模擬音頻通過外耳與中耳之傳輸的濾波效果。若只有音頻之響度要被測量,傳輸濾波器可在分析濾波器排組前被施用,但由於分析濾波器排組之輸出被用以合成被修改的音頻信號,故於濾波器排組後施用傳輸濾波器為有利的。接著傳輸濾波器101之輸出傳送至激發函數或裝置(「激發」)102內,其輸出模擬沿著頭蓋 骨底部薄膜之能量的分佈。激發能量值可對時間用一平滑函數或裝置(「平滑」)103被平滑。平滑函數之時間常數係依照所欲之應用的要求被設定。被平滑之激發信號隨後在特定響度函數或裝置(「特定響度(SL)」)104被變換成為特定響度。特定響度係以每單位頻率之為單位被呈現。與每一個頻帶相關聯之特定響度成份被傳送至特定響度修改函數或裝置(「SL修改」)105內。SL修改105採用原始之特定響度為其輸入,然後輸出一所欲或「目標」特定響度,其依據本發明之一層面較佳地為原始特定響度的函數(見下面之下一個標題:「目標特定響度」)。SL修改105依所欲之效果而定地可在每一個頻帶上獨立地操作,或在頻帶間存在有相依性(如第7圖中以交叉連接所建議之頻率平滑)。一增益求解器函數或裝置(「增益求解器」)106採用來自激發102之被平滑的激發頻帶成份與來自SL修改105之目標特定響度作為輸入而決定須被施用至析濾波器排組100的輸出之每一個頻帶的增益來變換被測量之特定響度成為目標特定響度。增益求解器可用各種裝置被施作。例如,增益求解器包括如在國際專利申請案第PCT/US2004/016964號(被公佈為WO2004/111964 A2)中所揭示之方式的迴覆處理或者一檢查表。雖然處理求解器106所產生之每頻帶的增益可進一步在時間上用選配之平滑函數或裝置(「平滑」)107被平滑以使感知上的人工物為最少,較佳的是時間平滑可如他處被描述地在整體處理或裝置之別處被施用。最後,增益透過各別的乘法性組合函數或組合器108被施用,且被 處理或被「修改」之音頻在合成濾波器排組函數或裝置(「合成濾波器排組」)110中由該等增益被修改的頻帶被合成。此外,來自分析濾波器排組之輸出可在施用增益前用延遲函數或裝置(「延遲」)109被延遲以補償與增益計算相關聯之任何延遲。或者,取代計算增益用於在頻帶中施用增益修改之使用的是,增益求解器106可計算用於控制如多拍FIR濾波器或多極IIR濾波器之時間變化濾波器的濾波器係數。為了解說簡單起見,本發明之層面主要被描述成為運用被施用至頻帶的增益因子,其被了解到濾波器係數與時間上變化的濾波器可在實務實施例中被運用。
在實務實施例中,音頻之處理可在數位域中被執行。因之,音頻輸入信號用離散時間數列x[n]被表示,其已以某種抽樣頻率fs由音頻源被抽樣。其被假設數列x[n]已適當地被訂尺度,使得以分貝表示之x[n]的rms功率由下式被給予: 此等於音頻正被人類聽者試聽時以dB表示的聲壓位準。此外為了解說簡單起見,音頻信號被假設為單聲道的。
分析濾波器排組100、傳輸濾波器101、激發102、特定響度104、特定響度修改105、增益求解器106與合成濾波器排組110可在下面更詳細地被描述。
分析濾波器排組100
音頻輸入信號被施用至一分析濾波器排組或濾波器排組函數(「分析濾波器排組」)100。在分析濾波器排組100 中之每一個濾波器被設計以模擬沿著內耳中頭蓋骨底部薄膜的特定位置之頻率響應。分析濾波器排組100可包括一組線性濾波器,其帶寬與間隔如被Moore,Glasberg與Baer所定義地(見前述的B.C.J.Moore,B.Glasberg,T.Baer之“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”)在等值長方形帶寬(ERB)頻率尺度上為固定的。
雖然ERB頻率尺度較接近地符合人類感知且在產生符合主觀之響度結果的客觀之響度測量展現改善的績效,Bark頻率尺度可在降低之績效下被運用。
就以赫茲表示之中心頻率而言,以赫茲表示之ERB頻率可被近似為如下:ERB (f )=24.7(4.37f /1000+1) (1)
由此關係式,一捲繞之頻率尺度被定義,使得以捲繞尺度為單位的對應之ERB在沿著捲繞尺度的任一點均等於1。用於由以赫茲表示之之線性頻率變換為此ERB尺度之函數係由將第1式的倒數積分而得到:
藉由針對f求解第2a式表達由ERB尺度變換回到線性頻率尺度亦為有用的: 其中e為ERB尺度中之單位。第9圖顯示ERB尺度及以赫茲表 示之頻率間之關係。
分析濾波器排組100可在沿著ERB尺度均勻地間隔之中心頻率f c [1]...f c [B ]包括被稱為頻帶的聽覺濾波器。更明確地說:f c [1]=f min (3a)
f c [b ]=f c [b -1]+ERBToHz (HzToERB (f c [b -1])+△)b =2...B (3b)
f c [B ]<f max , (3c)其中△為分析濾波器排組100之所欲的ERB間隔,及其中f minf max 分別為所欲之最小與最大中心頻率。吾人可選擇△=1,並考慮人耳為靈敏之頻率範圍,吾人可設定f min =50Hz及f max =20,000Hz。以此些參數下,例如第3a-c式之應用可得到B =40個聽覺濾波器。
每一個聽覺濾波器之頻率響應量可用如Moore與Glasberg所建議之捨入指數函數被加以特徵化。明確地說,具有中心頻率f c [b ]之濾波器的響應量可被計算為:H b (f )=(1+pg )e -pg (4a)其中: 此種在ERB尺度上近似關鍵頻帶之B聽覺濾波器的響應量在第10圖中被顯示。
分析濾波器排組100之濾波運算可用一般被稱為短時 離散傅立葉變換(STDFT)之有限長度的傅立葉變換適當地被近似,原因在於以被稱為全率施作之音頻信號抽樣率執行濾波器的施作咸信比精確之響度測量所須地提供較多時間的解析。藉由使用STDFT取代全率施作,效率之改善與計算複雜度之降低可被達成。
輸入音頻信號x [n ]之STDFT被定義為: 其中k為頻率指標、t為時間區塊指標、N為DFT大小、T為跳頻規模、及w[n]為長度N之窗常規化,使得:
注意在第5a式中之變數t係為代表STDFT的時間區塊之離散指標而與以秒做為時間度量相反。T之每一個增量代表T個樣本沿著信號x [n ]的跳頻。隨後對指標t係假設此定義。雖然不同之參數設定與窗形可針對f s =44100Hz而依施作而定地使用,及選擇N =2048,T =2048及使w [n ]為漢寧窗可提供時間與頻率之解析的適當平衡。上面描述之在使用快速傅立葉變換可為更有效率的。
取代STDFT的是,修改式離散娛餘弦變換(MDCT)可被運用以施作分析濾波器排組100。MDCT為在如Dolby AC-3之感知音頻編碼器中普遍被使用之變換。若被揭示之系統以此感知式編碼音頻被施作,所揭示的響度測量與修改可藉由處理被編碼之音頻的現存之MDCT係數來更有效率地 被施作,而消除執行分析濾波器排組變換之需求。輸入音頻信號x [n ]之MDCT在下式被給予: 其中(6)一般而言,跳頻規模被選用為恰為變換長度之一半,使得信號x [n ]之完美重建為可能的。
傳輸濾波器101
分析濾波器排組100之輸出被施用至一傳輸濾波器或傳輸濾波器函數(「傳輸濾波器」)101,其依照通過外耳與中耳之音頻的傳輸將濾波器排組之每一個頻帶濾波。第8圖顯示傳輸濾波器通過可聽到的頻率範圍之適合的頻率響應量P (f )。該響應係符合如在ISO 226標準中被定出之聽覺臨界值的倒數的低於1kHz之單元,而以該臨界值被常規化以等於在1kHz之單元。
激發102
為了計算輸入音頻信號之響度,在施用傳輸濾波器101後於分析濾波器排組100之每一個濾波器中的音頻信號之短時間的度量被需要。此時間與頻率變化度量被稱為激發。在分析濾波器排組100之每一個濾波器的短時間能量輸出可在激發函數102中透過在頻率域中的濾波器響應與輸入信號的功率頻譜相乘而被近似。
其中b為頻帶數目、t為區塊數目、及H b [k ]與P [k ]分別為在對應於STDFT或MDCT櫃指標k之頻率被抽樣的聽覺濾波器與傳輸濾波器之頻率響應。其應被注意到,用於聽覺濾波器之響應量的公式而非在第4a-c式中被定出者可於第7式中被使用而達到類似之結果。例如,國際專利申請案第PCT/US2004/016964(被公告為WO 2004/111964 A2)描述二種替選做法:以第12階IIR轉換函數為特徵之聽覺濾波器與低成本之「磚牆」帶通近似。
彙整而言,激發函數102為每一個時期t在各別ERB頻帶中能量E的頻域呈現。
時間平均(「平滑」)103
針對下面被描述之本發明的某些應用,其可能欲在激發E [b,t ]變換為特定響度前將其平滑。例如,平滑可依據下式在平滑函數103中重覆地被執行: 其中在每一個頻帶b之時間常數λ b 依照所欲的應用被選用。在大多數情形中,該等時間常數可有利地被選用為與在頻帶b內人類之響度感知的積分時間成比例。Watson與Gengel執行實驗證明此積分時間在低頻率(125-200Hz)時為於150-175ms範圍內,及在高頻率時為40-60ms(Acoustical Society of America期刊1969年第46卷第4期(第2部分),第989-997頁之Charles S.Watson與Roy W.Gengel的“Signal Duration and Signal Frequency in Relation to Auditory Sensitivity”)。
特定響度104
在特定響度變換器或變換器函數(「特定響度」)104中,激發之每一個產生被變換成為特定響度之成份值,其以每ERB之被測量。
起先在計算特定響度中,之每一個頻帶中的激發位準可被轉換為如用傳輸濾波器P (z )(第12圖)被常規化之ISO 226(第11圖)之相等響度等高線所定出的在1kHz之等值的激發位準。
其中T 1kHz (E,f )為在1kHz產生該位準之函數,此係與在頻率f之位準E同樣地大聲。在實務上,T 1kHz (E,f )被施作成為用傳輸濾波器被常規化之相等響度等高線的檢查表之一內插值。轉換為在1kHz之等值的位準使下列之特定響度計算簡單化。
接著,在每一個頻帶中之特定響度可被計算為:N [b ,t ]=α[b ,t ]N NB [b ,t ]+(1-α[b ,t ])N WB [b ,t ], (10)其中N NB [b,t ]與N WB [b,t ]分別為根據窄帶與寬帶信號模型之特定響度值。α[b,t ]為由音頻信號被計算之位於0與1間的一內插因子。國際專利申請案第PCT/US2004/016964(被公告為WO 2004/111964 A2)描述用於由激發之頻譜扁平度計算α[b,t ]的技術。其亦更詳細地描述「窄帶」與「寬帶」信號模型。
該等窄帶與寬帶特定響度值N NB [b,t ]與N WB [b,t ]可使用指數函數由轉換後之激發被估計:
其中TQ 1kHz 為針對1kHz音調靜音中在臨界值之激發位準。由相等響度等高線(第11與12圖),TQ 1kHz 等於4.2dB。注意,當激發等於靜音中之臨界值時,此二特定響度函數均等於0。針對大於靜音中之臨界值的激發而言,此二函數依照強度感知之Stevens法則以冪數公式單調地成長。窄帶函數比寬帶函數更迅速地增加。針對窄帶與寬帶情形之指數β增益G的特定選擇係被選用以符合對音調與雜訊之響度成長的實驗資料。
Moore與Glasberg建議特定響度當激發為在聽覺之臨界值時應等於某些小的值而非0。特定響度便隨著激發減為0而應單調地減為0。該調整乃在於聽覺之臨界值為一機率性之臨界值(音調在此點有50%之時間被偵測),及在於臨界值一起出現之數個音調的每一個被加總為比任何音調可更聽得到之聲音。在所揭示之應用中以此性質放大特定響度函數具有的添加利益為使得下面要被討論之增益求解器於激發接近臨界值時呈現得更好。若特定響度在激發為臨界值或低於此值時被定義為0,則增益求解器之獨一解針對激發為臨界值或低於此值不存在。若另一方面,特定響度針 對如Moore與Glasberg所建議之所有激發值均大於或等於0而被定義為單調地增加,則獨一值存在。大於一單元之響度縮放將永遠形成增益大於一單元的結果,反之亦然。第11a與11b式中之特定響度函數可依據下列各式被變更以具有所欲的性質:
其中常數λ大於1、指數η小於1、及常數K與C被選用使得特定響度函數與其第一階導數在之點為連續的。
由此特定響度,整體或「總」響度L [t ]用所有頻帶b之特定響度的總和被給予:
特定響度修改105
在特定響度修改函數(「特定響度修改」)105中,被稱為之目標特定響度可依整體處理或裝置之所欲應用而定地以各種方法由SL 104(第7圖)之特定響度被計算。如在下面更詳細被描述地,例如在音量控制之情形中,目 標特定響度可使用一尺度因子α被計算。見下面之第16式與其相關的描述。在自動增益控制(AGC)與動態範圍控制(DRC)之情形中,目標特定響度可使用所欲之輸出響度對輸入響度的比值被計算。見下面之第17與18式與其相關的描述。在動態等化之情形中,目標特定響度可使用第23式中所設立之關係與其相關的描述被計算。
增益求解器106
在此例中,增益求解器106針對每一個頻帶b與每一個時段t採用被平滑之激發與目標特定響度作為輸入,並產生增益G [b,t ]於稍後被使用於修改音頻。令Ψ{.}代表由激發至特定響度之非線性轉換使得: 則增益求解器求得G [b,t ],使得 增益求解器106決定頻率上與時間上變化之增益,其在被施用至原始激發時形成特定響度,其理想上等於所欲之目標特定響度。在實務上,增益求解器106決定頻率上與時間上變化之增益,其在被施用至音頻信號之頻域版本時形成修改音頻信號以降低其特定響度與目標特定響度間之差。理想上,該修改為使得被修改的音頻信號具有緊密地近似目標特定響度之特定響度。第14a式之解可用各種方法被實施。例如,若以Ψ-1 {.}表示之特定響度的反函數之封閉形式存在,則增亦可藉由重組公式14a而直接被計算: 或者,若Ψ-1 {.}之封閉形式解不存在,一迴覆性的做法可被運用,其中針對第14a式之每一次迴覆使用增益之目前的估計被評估。該結果所得之特定響度與所欲的目標被比較,且增益根據誤差被更新。若增益適當地被更新,其將收斂至所欲之解。另一方法涉及針對每一個頻帶中之激發值的一範圍預先計算函數Ψ{.}以創立一檢查表。吾人可由此檢查表獲得反函數Ψ-1 {.}之近似且增益便可由第14b式被計算。如先前被提及者,目標特定響度可用特定響度之一縮放被表示: 將第13式帶入14c,然後14c帶入14b得到增益之替選的表示式: 吾人可看到增益可純粹地被表示成為激發與特定響度縮放之函數。所以,增亦可透過14d之評估或等值之檢查表被計算,而終究不需外顯地計算特定響度或目標特定響度作為中間值。然而,這些值係透過第14d式之使用內藏式地被計算。其他透過特定響度與目標特定響度之外顯或內藏計算用於計算修改的等值方法可被設計,且本發明被試圖要涵蓋所有此類方法。
合成濾波器排組110
如上述地,合成濾波器排組110可透過使用短時間傅立葉變換(STDFT)或修改式離散餘弦變換(MDCT)而有效率地被施作,且STDFT或MDCT可類似地被使用以施作合成濾波器排組110。明確地說,令X [k,t ]代表如先前被定義之輸入音頻的STDFT或MDCT,在X [k,t ]之被處理(被修改)的音頻之STDFT或MDCT可被計算為: 其中S b [k ]為與頻帶相關聯之合成濾波器的響應,及分析濾波器排組100為與第7圖中的延遲方塊109相關聯之延遲。合成濾波器S b [k ]之形狀可被選用與分析濾波器排組H b [k ]中被運用的濾波器相同,或其可被修改以在沒有任何函數修改(即G [b,t ]=1時)下提供完美的重建。然後最終被處理之音頻可透過逆傅立葉或修改式餘弦變換被產生且如對熟習本技藝者所熟悉地進行重疊相加之合成。
目標特定響度
實施如第1-7圖之例的本發明之層面的配置之行為主要用其中目標特定響度被計算的方式被敘述。雖然本發明不受限於計算目標特定響度之任何特定的函數或反函數,數個此類函數及針對其之合適的應用現在將被描述。
適於音量控制之時間上不變與頻率上不變的函數
標準之音量控制藉由對音頻施用寬帶增益而調整音頻信號之響度。一般而言,增益被耦合至被使用者調整之旋鈕或滑桿,至音頻之響度到達所欲的位準為止。本發明之層面允許施作此種控制的更為心理聲音上一致之方法。依 據本發明之層面的非使寬帶增益被耦合至音量控制而形成用通過所有頻帶之相同量的增益變化的是,其可造成被感知之頻譜的變化,一特定響度縮放代之地與音量控制調整被結合,使得在每一個多頻帶中之增益以考慮到人類聽覺模型的量被改變,使得在被感知之頻譜中理想上沒有改變。在本發明之此層面的文意與其釋例性之應用中,「固定的」或「時間上不變的」被試圖要允許音量控制尺度因子之設定例如被使用者隨時間地變化。此種「時間上不變的」有時被稱為「準時間上不變的」、「準靜止的」、「逐件式時間上不變的」、「逐件式靜止的」、「逐步階時間上不變的」及「逐步階式靜止的」。給予此一尺度因子α,目標特定響度可被計算為被測量之特定響度乘以α:
由於總響度L [t ]為在整個所有頻帶b之特定響度N [b,t ]的和,上面之修改亦用α之因子將總響度比例地調整,但其係以針對音量控制調整中之層面在特定時間保留相同被感知之頻譜的方式來如此做。換言之,在任何特定時間,音量控制調整中之層面形成被感知之響度中的變化但無被修改的音頻信號之被感知的響度相對於未被修改的音頻信號之被感知的響度中之變化。第13a圖顯示當針對由女人講話所組成之音頻信號的α=0.25時在頻帶“b ”於特定時間“t ”之多頻帶增益G [b,t ]的結果。為了比較,要在如標準音量控制中以0.25將原始總響度(水平線)比例調整所需要之寬帶增益亦亦被描繪。多頻帶增益G [b,t ]在低與高頻帶比起中間頻 帶提高。此與指出人耳在低與高頻率較不敏感之相等響度等高線為一致的。
第13b圖顯示針對原始音頻信號、依照習知技藝之音量控制被修改的寬帶增益修改信號、及依照本發明之層面被修改的多頻帶增益修改信號之特定響度。多頻帶增益修改信號之特定響度為原始信號被乘以0.25者。寬帶增益修改信號之特定響度已針對原始未被修改的音頻信號者改變其頻譜形狀。在此情形中,特定響度在相對意義上具有在低與高頻率之損失的響度。此由於其音量被轉低而被感知為因頻之鈍化,此為多頻帶修改信號之響度係用在感知響度域被導出的增益加以控制者所不會發生的問題。
與傳統之音量控制相關聯的被感知之頻譜平衡的失真還一起存在一第二問題。在第11a-11d式中被反映之響度模型中被反映的響度感知之性質係為在任一頻率之信號的響度隨著信號位準趨近聽覺之臨界值更迅速地降低。結果為要施加相同之響度衰減至較輕柔的信號所需之電氣衰減比起較大聲的信號所需者是較少的。傳統之音量控制不管信號位準地施加之固定衰減,因而在音量被轉小時,輕柔的信號針對較大聲的信號變得「太柔」。在很多情形此形成因頻中之細節損失。考慮在回響室中響板之錄音。在此錄音中,響板之主「打擊」比起回響回音是十分大聲的,但就是此回響回音傳達此室之大小。隨著音量以回響回音被轉小,回響回音針對主打擊變得較柔和且最後低於聽覺臨界值而不見留下「亁」音響之響板。根據響度式之音量控制 藉由使錄音之較柔的回響部分相對於較大聲之主打擊升高使得這些段落間的相對響度維持固定的而防止錄音之較柔的部分消失不見。為了達成此效果,多頻帶增益G [b,t ]必須以相稱的響度感知之人類的時間上解析度之比率隨著時間變化。由於多頻帶增益G [b,t ]被計算成為被平滑之激發的函數,第8式中之時間常數λb 的選用敘述增益在每一個頻帶b中對時間有多迅速地變化。如稍早被提及者,這些時間常數可被選用與頻帶b內之人類的響度感知之整合時間成比例且因而得到G [b,t ]對時間之適當的變異。其應被注意到若時間常數不適當地被選用(太快或太慢),則感知上討厭的人工物被導入已處理之音頻中。
適合固定等化之時間上不變且頻率上變化的函數
在一些應用中,吾人可能希望對音頻施用固定之感知等化,在此情形中目標特定響度可如下列關係地藉由施用時間上不變但頻率上變化的尺度因子Θ[b]被計算: 其中為目標特定響度、N [b,t ]為音頻信號之特定響度、b為頻率之度量、及t為時間之度量。在此情形中,縮放由頻帶至頻帶為可變化的。此種應用針對例如強化被講話頻率凌越之頻譜部分以升高可讀性為有用的。
適合自動增益與動態範圍控制
之頻率上不變且時間上變化的函數
自動增益與動態範圍控制(AGC與DRC)在音頻處理領域為相當習知的。就抽象意義而言,此二種技術以某種方 法測量音頻信號之位準,然後用為該被測量之位準的函數之量修改信號的增益。就AGC之情形而言,信號增益被修改使得其被測量之位準更接近使用選用的基準位準。以DRC而言,信號增益被修改使得信號之被測量的位準之範圍被變換為某種所欲的範圍。例如,吾人可能希望使音頻之安靜部分較大聲及大聲部分較安靜。此種系統被Robinson與Gundry描述(1999年9月24-27日在紐約之AES第107屆會議的重印本5028之Charles Robinson與Kenneth Gundry的“Dynamic Range Control via Metadata”)。AGC與DRC之傳統施作一般運用如平滑尖峰或振幅均方根(rms)之音頻信號位準的簡單度量以導出增益修改。此類簡單度量以某種程度與音頻之被感知的響度有統計相關,但本發明之層面藉由根據心理聲音模型以響度之度量導出增益修改而允許在感知上更相關的AGC與DRC。同樣地,很多傳統之AGC與DRC系統以寬帶增益施用增益修改,而引發前面被提及之被處理的音頻中之音色的(頻譜的)失真。另一方面,本發明之層面運用多頻帶以降低此類失真或使之最小化的方式來形塑特定響度。
運用本發明之層面的AGC與DRC應用二者均以變換或映射輸入寬帶響度L i [t ]成為所預之輸出寬度響度L o [t ]的函數被特徵化,其中響度以如之感知響度單位被測量。輸入寬帶響度L i [t ]為輸入音頻信號之總響度N [b,t ]的函數。雖然其可與輸入寬帶響度相同,其可為音頻信號之總響度的時間上被平滑之版本。
第14a與14b圖分別顯示就AGC與DRC為典型之映射函數例。在給予其中L o [t ]為L i [t ]之函數的映射下,目標特定響度可被計算為: 音頻信號之原始特定響度N [b,t ]簡單地用所欲的輸出寬帶響度對輸入寬度響度之比值被比例調整以得到輸出特定響度。就AGC系統而言,輸入寬帶響度L i [t ]一般應為音頻之長期響度的一度量。此可藉由將總響度L [t ]對時間平滑以產生L i [t ]。
在與AGC比較下,DRC系統對信號之響度的較短期層面反應,且L i [t ]可被做得等於L [t ]。結果為,在給予L o [t ]/L i [t ]下,特定響度之縮放會迅速地波動而導致在被處理之音頻中不想要的人工物。一典型之人工物為一部分之頻譜被一些相對地不相關的一部分之頻譜的可聽到之調變。例如,一古典音樂段落可能包含被持續之弦樂音符凌越的高頻率,而低頻率包含大聲之隆隆聲的定音鼓。每當定音鼓打擊時,整體響度L i [t ]提高,且DRC系統對整個特定響度施用衰減。該等弦樂變聽起來與定音鼓之響度「泵動」向下及向上。此種頻譜中之交叉泵動也是傳統寬帶DRC系統之問題,且典型的解決方案涉及對不同頻帶獨立地施用DRC。此處被揭示之系統因濾波器排組與運用感知響度模型的特定響度之計算所致地在先天上為多頻帶,且因而修改DRC系統以依照本發明之層面用多頻帶方式操作為相當 直接了當的,及接著被描述。
適合動態範圍控制之頻率上
不變且時間上變化的函數
DRC系統可藉由輸入與輸出響度均與頻帶b獨立地變化被擴充以多頻帶或頻率不變的方式操作。這些多頻帶值被稱為L i [b,t ]與L o [b,t ],且目標特定響度便可用下式被給予: 其中L o [b,t ]已如第14b圖顯示地由L i [b,t ]被計算或被映射,但針對每一個頻帶b為獨立地。輸入多頻帶響度L i [b,t ]為輸入音頻信號之特定響度N [b,t ]的函數。雖然其可與輸入音頻信號之特定響度相同,其可為音頻信號之特定響度的時間上被平滑及/或頻率上被平滑的版本。
計算L i [b,t ]之最直接了當的方法為將其設定為等於特定響度N [b,t ]。在此情形中,DRC在感知響度模型之聽覺濾波器排組中每一個頻帶獨立地被執行,而非如剛剛在「適合自動增益與動態範圍控制之頻率上不變且時間上變化的函數」標題下所描述針對所有頻帶之相同的輸入對輸出響度比值。在運用頻帶之實務實施例中,沿著頻率軸的這些頻帶之間隔為相當確定的以提供響度之精確的度量。然而對每一個頻帶獨立地施用DRC尺度因子會造成被處理之音頻聽起來是「撕裂」的。為避免此問題,吾人可選擇藉由在頻帶將特定響度N [b,t ]平滑來計算L i [b,t ],使得由一頻帶至下一個被施用之DRC量不會如此劇烈地變化。此可藉由 定義一頻帶平滑濾波器Q (b )及然後依據下列標準卷積和對所有頻帶c將特定響度平滑: 其中N[c,t] 為音頻信號之特定響度,及Q (b-c )為平滑濾波器之頻帶平移後的響應。第15圖顯示此頻帶平滑濾波器之一例。
若計算L i [b,t ]為L o [b,t ]之函數的DRC函數就每一個頻帶b為固定的,則對特定響度N[b,t] 之每一個頻帶被引發的變化型式將依被處理之音頻的頻譜而定地變化,甚至是信號之整體響度若維持相同亦然。例如,具有大聲重音與靜高音之音頻信號會使重音割斷且高音升高。具有靜重音與大聲高音會發生相反情形。靜效果為音頻之音色或被感知的頻譜中之層面,且此在某些應用為所欲的。
然而,吾人會希望不須修改音頻之平均被感知的頻譜地執行多頻帶DRC。吾人可能要每一個頻帶中之平均修改約略相同而仍允許該等修改之短期變異在頻帶間獨立地操作。所欲之效果可藉由強迫每一個頻帶中的DRC之平均行為如一些基準行為者般地相等。吾人可針對寬帶輸入響度L i [t ]選擇此基準行為作為所欲之DRC。令函數L o [t ]=DRC {L i [t ]}代表針對寬待響度之所欲的映射。然後令代表寬帶輸入響度之時間平均版本,及令代表多頻帶輸入響度L i [b,t ]之時間平均版本,則多頻帶輸出響度可被計算為:
注意,多頻帶輸入響度首先被調整為與寬帶輸入響度相同之平均範圍中。然後針對寬帶響度被設計之DRC函數被施用。最後,其結果被向下調整回到多頻帶之平均範圍。利用此DRC多頻帶之成形,降低頻譜泵動的利益被保留而同時保留音頻之平均被感知的頻譜。
適合動態等化之頻率變化且時間變化的函數
本發明之另一層面的應用為音頻之時間變化上被感知的頻譜對目標時間不變上被感知的頻譜之故意的變換而仍保留音頻之原始的動態範圍。吾人可稱此處理為動態等化(DEQ)。在傳統之靜態等化下,簡單之固定濾波被施用至音頻以改變其頻譜。例如,吾人可能施用固定之低音或高音升高。此處理未考慮音頻之目前的頻譜,而可能對一些信號(即已包含相當大量之低音或高音的信號)為不適當的。在利用DEQ下,信號之頻譜成為基本上靜態的所欲之形狀。針對本發明之層面而言,此所欲之形狀在濾波器排組的跨頻帶被定出且被稱為EQ [b ]。在實務實施例中,被測量之頻譜應呈現音頻的頻譜形狀,其可藉由將特定響度N [b,t ]對時間平滑而被產生。吾人可稱該被平滑之特定響度為。如利用多頻帶DRC地,吾人不會要DEQ修改由一頻帶至下一頻帶地劇烈變化,且頻帶平滑函數因而可被施用以產生頻帶平滑後之頻譜
為了保留音頻之原始動態範圍,該所欲之頻譜EQ[b] 應被常規化以具有與用被給予之被測量的頻譜形狀相同的整體響度。吾人可稱為被常規化之頻譜形狀為
最後,目標特定響度被計算為: 其中β為使用者定出之由0至1之範圍的參數,指出將被施用之DEQ的程度。參見第23式,吾人注意到當β=0時,原始特定響對為未被修改的,而當β=1時,該特定響度用所欲之頻譜形狀對被測量之頻譜形狀的比值被調整。
產生所欲之頻譜形狀EQ [b ]的一方便之方法為就使用者如針對使用者覺得愉快之其頻譜平衡的某件音頻被測量地將之設定等於。在實務實施例中,如第16圖顯示之例,使用者可被提供一按鈕或其他適合之致動器507,其在被致動時造成音頻之頻譜形狀。的目前測量之捕取,且然後(在目標特定響度預置捕取與儲存506中)儲存此度量作為一預置,此稍後可在DEQ被失能時(如被預置選擇508)被載入EQ [b ]。第16圖為第17圖之簡化版本,其中只有單一條線被顯示以代表由分析濾波器排組100至合成濾波器排組110之多頻帶。第17圖之例亦提供動態EQ特定響度(SL)修改505,其提供依照如上面被舉例之動態等化的對用處理或裝置104被測量之特定響度的修改。
組合式處理
吾人可能希望要組合所有先前被討論之處理,包括音量控制(VC)、AGC、DRC與DEQ成為單一系統。由於每一個這些系統可被呈現為特定響度之縮放,他們全部可容易地被組合為如下: 其中代表與處理“*”相關聯之尺度因子。然後單一集合之增益G [b,t ]可針對代表該組合式處理的目標特定響度被計算。
在一些情形中,響度修改過程之一個或其組合會在時間上波動太迅速並在結果之被處理的音頻產生人工物。其因而會欲平滑這些尺度因子之一些部分集合。一般而言,來自VC與DEQ之尺度因子在時間上平滑地變化,但AGC與DRC尺度因子之組合的平滑可能是需要的。
令這些尺度因子之組合用下式被呈現:
在該平滑背後之基本觀念在於當特定響度正在提高時該等組合式尺度因子應迅速地反應,且當特定響度正在降低時該等尺度因子應更加強地被平滑。此觀念對應於在音頻壓縮器之設計中運用快速打擊及緩慢放開之相當習知的實務。用於平滑尺度因子之適當的時間常數可用特定響度之頻帶平滑後版本對時間之平滑被計算: 其中N [c,t ]為音頻信號之特定響度及Q (b-c )為如上面第19式 中之平滑濾波器的頻帶平移響度。
此頻帶平滑後之響度的時間上被平滑之版本便被計算為: 其中該頻帶相依平滑係數λ[b,t ]以下式被給予:
然後平滑後之組合式尺度因子被計算為: 其中λM [b,t ]為λ[b,t ]之頻帶平滑後的版本:
平滑係數之頻帶平滑可防止時間上被平滑的尺度因子對頻帶劇烈地變化。該等所欲之尺度因子時間與頻帶平滑形成被處理之音頻包含較少討論的感知之人工物。
雜訊補償
在很多音頻播放環境中存在與聽者要聽之音頻干擾的背景雜訊。例如,在行進中之汽車中的聽者可能正在所安裝之立體聲系統上播放音樂且來自引擎與道路之雜訊會顯著地變更音樂的感知。特別是針對其中雜訊能量相對於音樂能量之頻譜部分,音樂被感知之響度被降低。若雜訊之位準夠大,音樂完全被遮蓋。針對本發明之一層面,吾人會要選用增益G [b,t ]使得在出現干擾雜訊中被處理之音頻的特定響度等於目標特定響度。為達成此效果,吾人 可運用如前面Moore與Glasberg所定義之部分響度的觀念。假設吾人能獲得雜訊本身之度量與音頻本身之度量。令E N [b,t ]代表來自雜訊之激發及E A [b,t ]代表來自音頻之激發。則音頻與雜訊之組合式特定響度用下式被給予:N TOT [b ,t ]=Ψ{E A [b ,t ]+E N [b ,t ]}, (31)其中再次地說,Ψ{.}代表由激發至特定響度之非線性變換。吾人可假設聽者以下式保留組合式特定響度之方式將音頻之部分特定響度與雜訊之部分特定響度間的組合式特定響度分割:N TOT [b ,t ]=N A [b ,t ]+N N [b ,t ]. (32)
音頻之部分特定響度N A [b,t ]為吾人希望要控制的值且吾人必須對此值求解。雜訊之部分特定響度可被近似為: 其中E TN [b,t ]為雜訊之出現中被遮蓋的臨界值、E TQ [b ]為在頻帶b 中之靜音中聽覺的臨界值、及k 為介於0與1間之指數。組合第31-33式,吾人可到達對音頻之部分特定響度的表式:
吾人注意到當音頻之激發等於雜訊之被遮蓋的臨界值、(E A [b,t ]=E TN [b,t ]),音頻之部分特定響度等於信號在靜音中之臨界值的響度,其為所欲之結果。當音頻之激發大於雜訊者很多時,第34式中的第二項消失,且音頻之特定 響度近似地等於若雜訊未出現時所會是的什麼值。換言之,隨著音頻變得比雜訊大聲,雜訊被音頻遮蓋。指數k 實證地被選用以如其為信號對雜訊比之函數地對雜訊中的音調之響度的資料給予良好之配適。Moore與Glasberg已發現k =0.3之值為適當的。雜訊之被遮蓋的臨界值可被近似為雜訊激發本身之函數:E TN [b ,t ]=K [b ]E N [b ,t ]+E TQ [b ] (35)其中K [b ]為在較低頻率頻帶增加之常數。因而在第34式被給予之音頻的部分特定響度可抽象地被呈現為音頻之激發與雜訊之激發的函數:N A [b ,t ]=Φ{E A [b ,t ],E N [b ,t ]}. (36)然後被修改之增益求解器被運用以計算增益G[b,t ],使得在雜訊出現中被處理的音頻之部分特定響度等於目標特定響度:
第17圖顯示第7圖之系統以原始增益求解器106用被描述的雜訊補償增益求解器206被取代(注意代表濾波器排組之多頻帶的方塊間之多條垂直線已用單條線被取代以使圖簡化)。此外,該圖顯示雜訊激發之度量(以對應於方塊100、101、102與103之操作的方式用分析濾波器排組200、傳輸濾波器201、激發202與平滑203被取代),其與音頻之激發(來自平滑103)及目標特定響度(來自SL修改105)一起饋送至新的增益求解器206。
在該操作之其最基本模式中,第17圖中之SL修改105可簡單地設定目標特定響度等於音頻N [b ,t ]之原始特 定響度。換言之,SL修改提供音頻信號之特定響度的頻率上不變的尺度因子α 縮放,其中α=1。在以如第17圖中之配置下,增益被計算使得在雜訊出現之被處理的音頻之被感知的響度頻譜等於在雜訊不出現時音頻之響度頻譜。此外,先前被描述之用於計算目標特定響度成為原始者的函數技術(包括VC、AGC、DRC與DEQ)之任一個或其組合可配合雜訊補償響度修改系統被運用。
在實務實施例中,雜訊之測量可由音頻將被播放的環境內或附近被放置之麥克風被獲得。替選地,樣板雜訊激發之一預設集合可被運用,其近似在各種情況下的預期雜訊頻譜。例如,在汽車車廂內之雜訊可於各種行駛速率預先被分析及然後被儲存成為雜訊激發對速率之檢查表。然後被饋入第17圖中之增益求解器206中的雜訊激發可在汽車速率變化時可由此檢查表被近似。
對特定響度之近似
雖然所揭示之本發明在特定響度的精確度量被使用時最佳地成立,某些應用會需使用較粗略之近似以降低計算複雜性。以適合之近似下,被感知的響度之可接受的估計與修改仍可被達成。此一近似應試圖至少部分地保留響度感知之數個關鍵層面。首先,該近似應至少粗略地捕取響度感知中以頻率之變化敏感性。在一般條件中,該近似在較低與較高頻率比起在中間頻率顯示較小敏感性。其次,該近似應展現響度隨信號位準之非線性成長。明確地說,特定響度之成長就接近聽覺的臨界值的低位準信號必須為 最快的及然後隨著信號位準提高降低至成長之固定比率。最後,該近似應展現響度加總之性質,意為就固定信號位準而言,總響度(特定響度對頻率之整合)隨著信號帶寬提高而增加。
為降低特定響度計算之複雜性而仍保留響度感知的所欲之性質的一方法為使用較少頻帶及其中該等頻帶不會在關鍵頻帶率尺度上均勻地被分隔之濾波器排組。例如,吾人可使用與稍早被描述之40個頻帶相反地以在線性頻率尺度上均勻地分佈的頻帶之5個別頻帶濾波器排組。針對此類濾波器排組之有效率的施作存在很多技術,例如為餘弦調變式濾波器排組(Prentice Hall 1993年出版之P.P Vaidyanthan的MultiRate Systems and Filter Banks )。作為一般之例子而言,考慮具有B 個頻帶之一濾波器排組,其中每一個頻帶用一時間域脈衝響應h b [n ]被描述。同時,假設濾波器排組為幾近完美之重建,意為: 每一個頻帶b之頻率響應可用以赫茲表示的一中心頻率f b 與帶寬△f b 被特徵化。則以ERB為單位的等值之中心頻率與帶寬以下列被給予:e b =HzToERB (f b ) (39a) 若頻帶之數目B 為相當小,則每一個頻帶之帶寬e b 將可能大於1 ERB。
x b [n ]=h b [n ]*x [n ]代表與每一個頻帶相關聯之音頻信號,平滑後之激發信號可類似第7與8式地藉由計算用在頻率f b 被抽樣的傳輸濾波器之頻率響應及以ERB為單位的帶寬之倒數被加權的x b [n ]之被平滑的rms功率而被計算: 用1/e b 將頻帶產生之激發加權可有效地在其內被小計的整個所有關鍵頻帶之此頻帶內均勻分佈能量。吾人可能替選地指定所有之能量至其中心頻率為最接近該頻帶的中心頻帶f b ,但均勻分佈能量針對最為現實世界之音頻信號的較佳之近似。
在利用激發下,除了頻帶之總數較小而降低複雜性外,吾人可如上面被討論地前進以計算特定響度N [b,n ]、目標特定響度與增益G[b,n ]。同樣地,在計算整體響度L [n ]中亦須進行修改:在特定響度對頻帶被加總時,其須用頻帶b內之ERB數目被加權: 最後,被修改的音頻信號可利用將由各頻帶用增益被加權之每一個頻帶信號加總而被產生: 為了說明簡單,上面之計算被顯示針對信號x [n ]的每一個樣本期間n被執行。然而在實務上,激發可被細抽樣為在時間上低很多之比率,然後後續之響度處理可在此降低後之比率被實施。當增益在結束時被施用,其便可在被施用至頻 帶信號前透過內插被向上抽樣。
上面僅為對所揭示之本發明為適合的對特定響度之較粗略近似的一例。其他之近似為可能的,且本發明被欲於涵蓋所有此類近似之使用。
施作
本發明可用硬體或軟體或二者之組合(如可程式邏輯陣列)被施作。除非特別指出,被納入成為部分之本發明的法則並非先天上與任何特定之電腦或其他裝置相關。特別是,各種通用目的之機器可用依照此處之教習被寫成的程式被使用,或構建更專用之裝置(如積體電路)以執行所須的方法步驟對其可能是更方便的。因而,本發明可在每一個包含至少一處理器、至少一資料儲存系統(包括依電性與非依電性及/或儲存元件)、至少一輸入裝置或埠、與至少一輸出裝置或埠之一個或多個可程式的電腦系統上執行之一個或多個電腦程式中被施作。程式碼被施用至輸入資料以執行此處被描述之功能及產生輸出資訊。該輸出資訊以習知的方式被施用至一個或多個裝置。
每一個此程式可用任何所欲之電腦語言(包括機器語言、組合語言、或高階之程序、邏輯或物件導向程式語言)被施作以與電腦系統溝通。在任何情形中,該語言可為被編譯或被解譯之語言。
每一個此電腦語言可被儲存或被下載至以通用或特殊目的之可程式的電腦可讀取之儲存媒體或裝置(如固態記憶體或媒體、或磁性或光學媒體),用於在該儲存媒體或裝 置被電腦系統讀取時組配及操作系統以執行此處被描述之程序。該發明性之系統亦可被考慮被施作成為電腦可讀取之以電腦程式被組配的儲存媒體,此處如此被組配之儲存媒體造成電腦系統以特定及預先定義的方式作業而執行此處被描述之功能。
本發明之數個實施例已被描述。不過,其將被了解各種修改可不偏離本發明之精神與領域地被做成。例如,此處被描述之步驟為在順序上獨立的,因而可以與被描述者不同之順序被執行。
2‧‧‧修改音頻信號
4’‧‧‧產生修改參數
4”‧‧‧產生修改參數
4'''‧‧‧產生修改參數
6‧‧‧計算目標特定響度處理或裝置
8‧‧‧計算特定響度處理或裝置
10’‧‧‧計算修改參數處理或裝置
10”‧‧‧計算修改參數處理或裝置
10'''‧‧‧計算修改參數處理或裝置
12‧‧‧計算被修改的音頻信號之特定響度的近似處理或裝置
14‧‧‧計算目標特定響度之近似處理或裝置
16‧‧‧儲存或發射裝置或功能
100‧‧‧分析濾波器排組
101‧‧‧傳輸濾波器
102‧‧‧激發函數或裝置
103‧‧‧平滑函數或裝置
104‧‧‧特定響度函數或裝置
105‧‧‧特定響度修改函數或裝置
106‧‧‧增益求解器函數或裝置
107‧‧‧平滑函數或裝置
108‧‧‧組合器
109‧‧‧延遲函數或裝置
110‧‧‧合成濾波器排組
200‧‧‧分析濾波器排組
201‧‧‧傳輸濾波器
202‧‧‧激發
203‧‧‧平滑
206‧‧‧增益求解器
505‧‧‧動態EQ特定響度(SL)修改
506‧‧‧目標特定響度預置捕取與儲存
507‧‧‧按鈕致動器
508‧‧‧預置選擇
第1圖為一功能方塊圖,顯示依據本發明之層面的一向前饋送施作之一例。
第2圖為一功能方塊圖,顯示依據本發明之層面的一向後饋送施作之一例。
第3圖為一功能方塊圖,顯示依據本發明之層面的一混合式向前/向後饋送施作之一例。
第4圖為一功能方塊圖,顯示依據本發明之層面的一混合式向前/向後饋送施作之另一例。
第5圖為一功能方塊圖,顯示其中如用任何一向前饋送、向後饋送與混合式向前/向後饋送配置被決定之該未被修改的音頻信號與該等修改參數可在例如時間上或空間上的裝置或處理中用以被儲存或被發射之方式。
第6圖為一功能方塊圖,顯示其中如用任何一向前饋送、向後饋送與混合式向前/向後饋送配置被決定之該未被 修改的音頻信號與一目標特定響度或其呈現可在例如時間上或空間上的裝置或處理中用以被儲存或被發射之方式。
第7圖為一示意性之功能方塊圖或示意性之流程圖,顯示本發明的一層面之概要。
第8圖為適合作為本發明之一實施例的傳輸濾波器的一線性濾波器p(z)之理想化特徵響應,其中垂直軸為以分貝(dB)表示之衰減及水平軸為以赫茲(Hz)表示之以10為底的對數之頻率。
第9圖顯示ERB頻率尺度(垂直軸)與以赫茲表示之頻率(水平軸)間的關係。
第10圖顯示一組近似ERB尺度上之關鍵頻帶的理想化聽覺濾波器特徵響應。水平尺度為以赫茲表示之頻率及垂直軸為以分貝表示之位準。
第11圖顯示ISO 226之相等響度等高線。水平軸為以赫茲表示之以10為底的對數之頻率及垂直軸為以分貝表示之聲壓位準。
第12圖顯示用傳輸濾波器p(z)被常規化的ISO 226之相等響度等高線。水平軸為以赫茲表示之以10為底的對數之頻率及垂直軸為以分貝表示之聲壓位準。
第13a圖為一理想化圖,顯示針對在一段女性講話上之0.25的響度縮放之寬度與多頻帶增益。水平尺度為ERB頻帶及垂直尺度為以分貝(dB)表示之相對增益。
第13b圖為一理想化圖,分別顯示原始信號、寬帶增益修改信號與多帶增益修改信號之特定響度。水平尺度為 ERB頻帶及垂直尺度為特定響度(/ERB)。
第14a圖為一理想化圖,顯示:針對典型之AGC,L o [t ]為L i [t ]之函數。水平尺度為log(L i [t ])及垂直尺度為log(L o [t ])。
第14b圖為一理想化圖,顯示:針對典型之DRC,L o [t ]為L i [t ]之函數。水平尺度為log(L i [t ])及垂直尺度為log(L o [t ])。
第15圖為一理想化圖,顯示針對多頻帶DRC之典型的頻帶平滑函數。水平尺度為頻帶數目及垂直尺度為頻帶b之增益輸出。
第16圖為一示意性之功能方塊圖或示意性之流程圖,顯示本發明的一層面之概要。
第17圖為類似第1圖之示意性功能方塊圖或示意性流程圖,其亦包括針對播放環境中之雜訊的補償。
2‧‧‧修改音頻信號處理或裝置
4’,4”,4'''‧‧‧產生修改參數處理或裝置
6‧‧‧計算目標特定響度間之差處理或裝置
8‧‧‧計算特定響度處理或裝置
10’,10”,10'''‧‧‧計算修改參數處理或裝置

Claims (68)

  1. 一種用以控制一音頻信號之一特殊響度特徵的方法,其中該特殊響度特徵為一特定響度,其係感知響度作為頻率及時間之一函數的一度量,抑或是一部分特定響度,其係在一次要干擾信號存在下該信號之感知響度作為頻率及時間之一函數的一度量,該方法包含下列步驟:a)計算一目標特定響度;b)導出可用於修改該音頻信號之頻率上及時間上變化的修改參數以降低該特殊響度特徵與該目標特定響度之間的差;以及c)施用該修改參數至該音頻信號以降低該特殊響度特徵與該目標特定響度之間的差。
  2. 如請求項第1項所述之方法,其中該計算一目標特定響度的步驟或該導出頻率上及時間上變化的修改參數的步驟包括外顯地計算(i)特定響度、(ii)部分特定響度、或(iii)特定響度及部分特定響度兩者之處理。
  3. 如請求項第1項所述之方法,其中該計算一目標特定響度的步驟或該導出頻率上及時間上變化的修改參數的步驟包括隱含地計算(i)特定響度、(ii)部分特定響度、或(iii)特定響度及部分特定響度兩者之處理。
  4. 如請求項第3項所述之方法,其中該處理運用一檢查表,而使得該處理固有地決定(i)特定響度、(ii)部分特定響度、或(iii)特定響度及部分特定響度兩者。
  5. 如請求項第3項所述之方法,其中(i)特定響度、(ii)部分 特定響度、或(iii)特定響度及部分特定響度兩者,係以由該處理所運用的一封閉形式之數學式被固有地決定。
  6. 如請求項第1至5項任一項所述之方法,其中用以計算該目標特定響度之該音頻信號的該函數包含該音頻信號的一或多個縮放。
  7. 如請求項第6項所述之方法,其中該等一或多個縮放包括呈下列關係的該特定響度之一時間上及頻率上變化的尺度因子Ξ[b,t]縮放: 其中()為該目標特定響度、(N [b,t ])為該音頻信號之該特定響度、b 為頻率之一度量、及t 為時間之一度量。
  8. 如請求項第7項所述之方法,其中該縮放係至少由一所欲多頻帶響度與該音頻信號的多頻帶響度的比值所決定。
  9. 如請求項第8項所述之方法,其中該縮放係表示為呈下列關係中的L o [b,t ]/L i [b,t ]: 其中N [b,t ]為該音頻信號之特定響度、L o [b,t ]為所欲多頻帶響度、L i [b,t ]為該音頻信號之多頻帶響度、及為該目標特定響度。
  10. 如請求項第9項所述之方法,其中L o [b,t ]為L i [b,t ]的一函數。
  11. 如請求項第10項所述之方法,其中L o [b,t ]作為L i [b,t ]的一 函數係表示為:L o [b ,t ]=DRC {L i [b ,t ]},其中DRC {}指出映射L i [b,t ]至L o [b,t ]的一動態範圍函數。
  12. 如請求項第9項所述之方法,其中L i [b,t ]為該音頻信號之特定響度的(i)時間平滑化、(ii)頻率平滑化、或(iii)時間及頻率兩者平滑化的版本。
  13. 如請求項第8項所述之方法,其中該方法可使用成為一動態範圍控制,其中該修改或該等修改參數的施用產生出、或者該目標特定響度對應於一音頻信號,其中針對不同特定響度縮放值,被感知音頻頻譜或一干擾信號存在下的被感知音頻頻譜係為不同。
  14. 如請求項第13項所述之方法,其中該動態範圍函數控制每一個頻帶中的響度,使得施用至每一個頻帶之短期改變在頻帶間獨立地變化,而同時,施用至每一個頻帶的平均改變對於所有頻帶為大體上相同。
  15. 如請求項第14項所述之方法,其中L o [b,t ]作為L i [b,t ]的一函數係表示為: 其中L o [t ]=DRC {L i [t ]}代表該音頻信號的總響度對所欲之總響度的一映射,其中代表該音頻信號之寬帶響度L i [t ]的一時間平均版本、及代表該音頻信號之多頻帶響度L i [b,t ]的一時間平均版本。
  16. 如請求項第14項所述之方法,其中該方法可使用成為一 動態範圍控制,其中該修改或該等修改參數的施用產生出、或者該目標特定響度對應於一音頻信號,其中針對不同特定響度縮放值,被感知音頻頻譜或一干擾信號存在下的被感知音頻頻譜維持與該音頻信號被感知音頻頻譜實質相同。
  17. 如請求項第7項所述之方法,其中該特定響度係以一所欲頻譜形狀之一度量對該音頻信號頻譜形狀之度量的比值縮放。
  18. 如請求項第17項所述之方法,其中該方法將該音頻信號的被感知之頻譜從一時間上變化的被感知頻譜轉換為一大體上時間上不變的被感知頻譜。
  19. 如請求項第17項所述之方法,其中該縮放係表示為,呈下列關係:,並且其中為該音頻信號之時間平滑化多頻帶響度、為一所欲頻譜EQ [b ]被常規化成具有與多頻帶響度相同的寬帶響度,使得係表示為: 其中N [b,t ]為該音頻信號之特定響度、為該目標特定響度、及β 為具有由包括0與1所限界且包括0與1之範圍的一參數,該參數控制縮放的位準。
  20. 如請求項第19項所述之方法,其中該參數β 係從該方法外部的一來源選用或控制。
  21. 如請求項第20項所述之方法,其中該來源為該方法的一使用者。
  22. 如請求項第17項所述之方法,其中該方法可使用成為一動態等化器,其中該修改或該等修改參數的施用產生出、或者該目標特定響度對應於一音頻信號,其中針對不同特定響度縮放值,被感知音頻頻譜或一干擾信號存在下的被感知音頻頻譜係不同。
  23. 如請求項第7項所述之方法,其中該音頻信號的多頻帶響度藉由將該音頻信號分割成關鍵頻帶及跨越該等關鍵頻帶之數者頻率平滑化而被近似化。
  24. 如請求項第23項所述之方法,其中在一特殊頻帶b 該多頻帶響度的一頻帶平滑化版本,L [b,t ],係表示為跨越所有頻帶c 的卷積和: 其中N [c,t ]為該音頻信號之特定響度,及Q (b-c )為平滑濾波器的頻帶平移之響應。
  25. 如請求項第6項所述之方法,其中該等一或多個縮放包括該特定響度之一時間上變化、頻率上不變的尺度因子Φ[t ]縮放,呈下列關係: 其中()為該目標特定響度、(N [b,t ])為該音頻信號之特定響度、b 為頻率之一度量、及t 為時間之一度量。
  26. 如請求項第25項所述之方法,其中該縮放係至少由一所欲寬帶響度與該音頻信號之寬帶響度的比值所決定。
  27. 如請求項第25項所述之方法,其中該音頻信號之特定響度的函數縮放係表示為呈下列關係中的L o [t ]/L i [t ]: 其中N [b,t ]為該音頻信號之特定響度、L o [t ]為該所欲寬帶響度、L i [t ]為該音頻信號之寬帶響度、及為該目標特定響度。
  28. 如請求項第27項所述之方法,其中L o [t ]為L i [t ]的一函數。
  29. 如請求項第28項所述之方法,其中L o [t ]作為L i [t ]的一函數係表示為:L o [t ]=DRC {L i [t ]},其中DRC {}指出映射L i [t ]至L o [t ]的一動態範圍函數。
  30. 如請求項第27項所述之方法,其中L i [t ]為該音頻信號的總響度之時間平滑化版本。
  31. 如請求項第27項所述之方法,其中L i [t ]為該音頻信號的長期響度之一度量。
  32. 如請求項第27項所述之方法,其中L i [t ]為該音頻信號的短期響度之一度量。
  33. 如請求項第25項所述之方法,其中該方法可使用成為一自動增益控制或動態範圍控制,其中該修改或該等修改參數的施用產生出、或者該目標特定響度對應於一音頻信號,其中針對特定響度縮放或部分特定響度縮放的不 同值,被感知音頻頻譜或一干擾信號存在下的被感知音頻頻譜維持與該音頻信號的被感知音頻頻譜實質相同。
  34. 如請求項第17項所述之方法,其中該尺度因子為該音頻信號的一度量。
  35. 如請求項第6項所述之方法,其中該等一或多個縮放包括該特定響度之一時間上不變、頻率上變化的尺度因子Θ[b ]縮放,呈下列關係: 其中為該目標特定響度、N [b,t ]為該音頻信號之特定響度、b 為頻率之一度量、及t 為時間之一度量。
  36. 如請求項第35項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出包括儲存該尺度因子Θ[b ]。
  37. 如請求項第35項所述之方法,其中該尺度因子Θ[b ]係從該方法外部之一來源接收。
  38. 如請求項第6項所述之方法,其中該等一或多個縮放包括該音頻信號之特定響度之一時間上不變、頻率上不變的尺度因子α 縮放,呈下列關係: 其中()為該目標特定響度、(N [b,t ])為該音頻信號之特定響度、b 為頻率之一度量、及t 為時間之一度量。
  39. 如請求項第38項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出包括儲存該尺度因子α
  40. 如請求項第35項所述之方法,其中該方法可使用為一音量控制,其中該修改或該等修改參數的施用產生出、或者該目標特定響度對應於一音頻信號,其中針對特定響度或部分特定響度縮放的不同值,被感知音頻頻譜或一干擾信號存在下的被感知音頻頻譜維持與該音頻信號的被感知音頻頻譜實質相同。
  41. 如請求項第1項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出,外顯地計算(i)特定響度、(ii)部分特定響度、(iii)目標特定響度、(iv)特定響度及部分特定響度、(v)特定響度及目標特定響度、(vi)部分特定響度及目標特定響度、或(vii)特定響度、部分特定響度及目標特定響度。
  42. 如請求項第1項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出,隱含地計算(i)特定響度、(ii)部分特定響度、(iii)目標特定響度、(iv)特定響度及部分特定響度、(v)特定響度及目標特定響度、(vi)部分特定響度及目標特定響度、或(vii)特定響度、部分特定響度及目標特定響度。
  43. 如請求項第42項所述之方法,其中該修改或該等修改參數的施用、該等修改參數的該導出、或者產生運用一檢查表,其固有地決定(i)特定響度、(ii)部分特定響度、(iii)目標特定響度、(iv)特定響度及部分特定響度、(v)特定響度及目標特定響度、(vi)部分特定響度及目標特定響度、或(vii)特定響度、部分特定響度及目標特定響度。
  44. 如請求項第43項所述之方法,其中該修改或該等修改參數的施用、該等修改參數的該導出、或該產生,運用一封閉形式的數學式,其固有地決定(i)特定響度、(ii)部分特定響度、(iii)目標特定響度、(iv)特定響度及部分特定響度、(v)特定響度及目標特定響度、(vi)部分特定響度及目標特定響度、或(vii)特定響度、部分特定響度及目標特定響度。
  45. 如請求項第1項所述之方法,其中該等修改參數為在時間上經平滑化。
  46. 如請求項第45項所述之方法,其中該等修改參數包含多個與該音頻信號的頻帶相關之振幅縮放因子。
  47. 如請求項第46項所述之方法,其中該等多個振幅縮放因子之至少一些為時間上變化的。
  48. 如請求項第45項所述之方法,其中該等修改參數包括用於控制一或多個濾波器的多個濾波器係數。
  49. 如請求項第48項所述之方法,其中該等一或多個濾波器之至少一些為時間上變化的及該等濾波器係數之至少一些為時間上變化的。
  50. 如請求項第1項所述之方法,其中該修改或該等修改參數的施用、該等修改參數的該導出、或該產生係與下列的一或多個為相依的:一干擾音頻信號之一度量,一目標特定響度,從經修改的音頻信號之特定響度或部分特定響度 所導出之未經修改的音頻信號的特定響度之一估計,該未經修改的音頻信號之特定響度,以及對從該經修改的音頻信號之特定響度或部分特定響度所導出的目標特定響度之一近似。
  51. 如請求項第1項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出,至少從下列的一或多個導出修改參數:一干擾音頻信號之一度量,一目標特定響度,從經修改的音頻信號之特定響度或部分特定響度所導出之未經修改的音頻信號的特定響度之一估計,該未經修改的音頻信號之特定響度,以及對從該經修改的音頻信號之特定響度或部分特定響度所導出的目標特定響度之一近似。
  52. 如請求項第51項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出,至少從下列導出修改參數:(1)下列其中之一:一目標特定響度;及從該經修改的音頻信號之特定響度所接收的該未經修改的音頻信號之特定響度的一估計;以及(2)下列其中之一:該未經修改的音頻信號之特定響度;及對從該經修改的音頻信號之特定響度所導出的目 標特定響度之一近似。
  53. 如請求項第51項所述之方法,其中該修改或該等修改參數的施用、或者該等修改參數的該導出,至少從下列導出修改參數:(1)一干擾音頻信號之一度量;(2)下列其中之一:一目標特定響度;及從該經修改的音頻信號之部分特定響度所導出的該未經修改的音頻信號之特定響度的一估計;以及(3)下列其中之一:該未經修改的音頻信號之特定響度;及對從該經修改的音頻信號之部分特定響度所導出的目標特定響度之一近似。
  54. 如請求項第52項所述之方法,其中該方法運用一前饋配置,其中該特定響度係從該音頻信號導出,及其中該目標特定響度係從該方法外部之一來源接收、或者當該修改或該等修改參數的施用或該等修改參數的導出包括儲存一目標特定響度時,該目標特定響度係從一儲存接收。
  55. 如請求項第52或53項所述之方法,其中該方法運用一混合式前饋/後饋配置,其中對該目標特定響度的近似係從該經修改的音頻信號導出,及其中該目標特定響度係從該方法外部之一來源接收、或者當該修改或該等修改參數的施用或該等修改參數的導出包括儲存一目標特 定響度時,該目標特定響度係從一儲存接收。
  56. 如請求項第52項所述之方法,其中該修改或該等修改參數的施用或該等修改參數的導出包括一或多個處理用以外顯地或隱含地獲得該目標特定響度,其一或數者外顯地或隱含地計算該音頻信號的該函數或該音頻信號的度量。
  57. 如請求項第56項所述之方法,其中該方法運用一前饋配置,其中該特定響度與該目標特定響度係從該音頻信號導出,該目標特定響度之導出係運用使用該音頻信號的該函數或該音頻信號的度量之計算。
  58. 如請求項第56項所述之方法,其中該方法運用一混合式前饋/後饋配置,其中對該目標特定響度的一近似係從該經修改的音頻信號導出及該目標特定響度係從該音頻信號導出,該目標特定響度之導出係運用使用該音頻信號的該函數或該音頻信號的度量之計算。
  59. 如請求項第52項所述之方法,其中該修改或該等修改參數的施用或該等修改參數的導出,包括一或多個處理,用以響應於該經修改的音頻信號,外顯地或隱含地獲得該未經修改的音頻信號之特定響度的一估計,其一或數者外顯地或隱含地計算該音頻信號的該函數之反運算或該音頻信號的度量。
  60. 如請求項第59項所述之方法,其中該方法運用一後饋配置,其中該未經修改的音頻信號之特定響度的一估計以及對該目標特定響度之一近似,係從該經修改的音頻信 號導出,該特定響度的該估計係使用該音頻信號的該函數之反運算或該音頻信號的度量被計算。
  61. 如請求項第59項所述之方法,其中該方法運用一混合式前饋/後饋配置,其中該特定響度係從該音頻信號導出,及該未經修改的音頻信號之特定響度的該估計係從該經修改的音頻信號導出,該估計之導出係使用該音頻信號的該函數之反運算或該音頻信號的度量被計算。
  62. 如請求項第1項所述之方法,其中步驟b)包含傳送或儲存該等修改參數及該音頻信號;步驟c)包含接收該等被傳送之修改參數及該音頻信號、或者再生該等被儲存之修改參數及該音頻信號、及施用該等被接收或被再生之修改參數至該音頻信號;以及步驟b)之執行與步驟c)之執行係(i)時間上分離的、(ii)空間上分離的、或(iii)時間上分離且空間上分離的。
  63. 如請求項第1項所述之方法,其中該計算一目標特定響度響應於該音頻信號而計算。
  64. 如請求項第1項所述之方法,其中該等修改參數包含多個與該音頻信號的頻帶相關之振幅縮放因子。
  65. 如請求項第1項所述之方法,進一步包含跨越該音頻信號之頻帶而平滑化。
  66. 一種適於控制一音頻信號之一特殊響度特徵的裝置,其中該特殊響度特徵為一特定響度,其係感知響度作為頻 率及時間之一函數的一度量,抑或是一部分特定響度,其係在一次要干擾信號存在下該信號之感知響度作為頻率及時間之一函數的一度量,該裝置包含:a)計算構件,其用以計算一目標特定響度;b)導出構件,其用以導出可用於修改該音頻信號之頻率上及時間上變化的修改參數以降低該特殊響度特徵與該目標特定響度之間的差;以及c)施用構件,其用以施用該修改參數至該音頻信號以降低該特殊響度特徵與該目標特定響度之間的差。
  67. 一種用以控制一音頻信號之一特殊響度特徵的裝置,其中該特殊響度特徵為一特定響度,其係感知響度作為頻率及時間之一函數的一度量,抑或是一部分特定響度,其係在一次要干擾信號存在下該音頻信號之感知響度作為頻率及時間之一函數的一度量,該裝置包含:適於從一傳輸接收或從一儲存媒體再生一音頻信號及用以修改該音頻信號之頻率上及時間上變化的修改參數、且適於響應於該等被接收的修改參數修改該音頻信號以便降低該音頻信號之特殊響度特徵與一給定目標特定響度之間的差之構件,其中該等修改參數係藉由計算該目標特定響度及藉由導出可用於修改該音頻信號以降低該特殊響度特徵與該目標特定響度之間的差之該等頻率上及時間上變化的修改參數而獲得。
  68. 一種編碼有一電腦程式之非暫態電腦可讀儲存媒體,用 以致使一電腦執行如請求項第1項所述之方法。
TW96111810A 2006-04-04 2007-04-03 控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式 TWI471856B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US78953906P 2006-04-04 2006-04-04

Publications (2)

Publication Number Publication Date
TW200746049A TW200746049A (en) 2007-12-16
TWI471856B true TWI471856B (zh) 2015-02-01

Family

ID=38325459

Family Applications (1)

Application Number Title Priority Date Filing Date
TW96111810A TWI471856B (zh) 2006-04-04 2007-04-03 控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式

Country Status (9)

Country Link
EP (1) EP2002429B1 (zh)
JP (1) JP4981123B2 (zh)
CN (1) CN101421781A (zh)
BR (1) BRPI0709877B1 (zh)
ES (1) ES2400160T3 (zh)
PL (1) PL2002429T3 (zh)
RU (1) RU2426180C2 (zh)
TW (1) TWI471856B (zh)
WO (1) WO2007120453A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10020003B2 (en) 2016-12-09 2018-07-10 Acer Incorporated Voice signal processing apparatus and voice signal processing method

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004111994A2 (en) 2003-05-28 2004-12-23 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2006047600A1 (en) 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP5185254B2 (ja) 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
NO345590B1 (no) 2006-04-27 2021-05-03 Dolby Laboratories Licensing Corp Audioforsterkningsregulering ved bruk av spesifikk lydstyrkebasert hørehendelsesdeteksjon
CN101529721B (zh) 2006-10-20 2012-05-23 杜比实验室特许公司 使用复位的音频动态处理
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CN101790758B (zh) 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
PL2232700T3 (pl) 2007-12-21 2015-01-30 Dts Llc System regulacji odczuwanej głośności sygnałów audio
KR101238731B1 (ko) 2008-04-18 2013-03-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 서라운드 경험에 최소한의 영향을 미치는 멀티-채널 오디오에서 음성 가청도를 유지하는 방법과 장치
TWI416328B (zh) * 2008-04-29 2013-11-21 Novatek Microelectronics Corp 用於一多媒體裝置控制音頻資料來源的方法及其相關裝置
ATE552690T1 (de) 2008-09-19 2012-04-15 Dolby Lab Licensing Corp Upstream-signalverarbeitung für client- einrichtungen in einem drahtlosen kleinzellen- netz
CN102160115A (zh) 2008-09-19 2011-08-17 杜比实验室特许公司 对于资源受限客户机设备的上游质量增强信号处理
TWI491277B (zh) * 2008-11-14 2015-07-01 That Corp 動態音量控制和多空間處理保護(二)
CN104378075B (zh) 2008-12-24 2017-05-31 杜比实验室特许公司 频域中的音频信号响度确定和修改
US8675298B2 (en) * 2009-01-09 2014-03-18 Lsi Corporation Systems and methods for adaptive target search
TWI503816B (zh) * 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
WO2010131470A1 (ja) * 2009-05-14 2010-11-18 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置
DK2433437T3 (en) * 2009-05-18 2015-01-12 Oticon As Signal Enhancement using wireless streaming
WO2010138309A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
WO2010138311A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
PL2381574T3 (pl) * 2010-04-22 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do modyfikacji wejściowego sygnału audio
JP5126281B2 (ja) * 2010-04-27 2013-01-23 ソニー株式会社 楽曲再生装置
TWI800092B (zh) 2010-12-03 2023-04-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
CN102044249B (zh) * 2010-12-10 2012-05-30 北京中科大洋科技发展股份有限公司 一种适用于文件播出系统的音频响度一致性控制方法
CN102610229B (zh) * 2011-01-21 2013-11-13 安凯(广州)微电子技术有限公司 一种音频动态范围压缩方法、装置及设备
US8930182B2 (en) * 2011-03-17 2015-01-06 International Business Machines Corporation Voice transformation with encoded information
EP2530835B1 (en) * 2011-05-30 2015-07-22 Harman Becker Automotive Systems GmbH Automatic adjustment of a speed dependent equalizing control system
WO2013091703A1 (en) * 2011-12-22 2013-06-27 Widex A/S Method of operating a hearing aid and a hearing aid
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
JP5827442B2 (ja) 2012-04-12 2015-12-02 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法
CN112185400A (zh) * 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
CN103428607A (zh) * 2012-05-25 2013-12-04 华为技术有限公司 一种音频信号播放系统及电子设备
ITTO20120530A1 (it) * 2012-06-19 2013-12-20 Inst Rundfunktechnik Gmbh Dynamikkompressor
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
CN103841241B (zh) * 2012-11-21 2017-02-08 联想(北京)有限公司 音量调整方法及装置
CN103050119B (zh) * 2012-12-30 2015-06-17 安徽科大讯飞信息科技股份有限公司 一种灯光或电机与声音同步的自适应检测方法
CN107257234B (zh) * 2013-01-21 2020-09-15 杜比实验室特许公司 解码具有保留数据空间中的元数据容器的编码音频比特流
EP2787746A1 (en) * 2013-04-05 2014-10-08 Koninklijke Philips N.V. Apparatus and method for improving the audibility of specific sounds to a user
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
ME02623B (me) * 2013-04-05 2017-06-20 Dolby Laboratories Licensing Corp Aparat za kompandovanje i metod za smanjenje šuma kvantizacije korišćenjem napredne spektralne ekstenzije
BR112015032174B1 (pt) * 2013-06-21 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V escalador de tempo, descodificador de áudio, método e um programa de computador utilizando um controle de qualidade
MX352748B (es) 2013-06-21 2017-12-06 Fraunhofer Ges Forschung Control de búfer de variabilidad, decodificador de audio, método y programa de computadora.
JP6201460B2 (ja) * 2013-07-02 2017-09-27 ヤマハ株式会社 ミキシング管理装置
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
EP3108669B1 (en) 2014-02-18 2020-04-08 Dolby International AB Device and method for tuning a frequency-dependent attenuation stage
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
EP3451706B1 (en) 2014-03-24 2023-11-01 Dolby International AB Method and device for applying dynamic range compression to a higher order ambisonics signal
US9615185B2 (en) * 2014-03-25 2017-04-04 Bose Corporation Dynamic sound adjustment
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
US9800220B2 (en) * 2014-09-24 2017-10-24 Intel Corporation Audio system with noise interference mitigation
CN104393848B (zh) * 2014-10-27 2017-08-04 广州酷狗计算机科技有限公司 音量调节方法及装置
RU2589298C1 (ru) * 2014-12-29 2016-07-10 Александр Юрьевич Бредихин Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
WO2016172111A1 (en) 2015-04-20 2016-10-27 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
CN107925390B (zh) 2015-08-24 2021-11-23 杜比实验室特许公司 音量均一化处理
US9590580B1 (en) * 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
CN106817324B (zh) * 2015-11-30 2020-09-11 腾讯科技(深圳)有限公司 频响校正方法及装置
CN105916095B (zh) * 2016-05-31 2017-08-04 音曼(北京)科技有限公司 反馈延迟网络音色优化的方法
CN106101925B (zh) * 2016-06-27 2020-02-21 联想(北京)有限公司 一种控制方法及电子设备
CN106354469B (zh) * 2016-08-24 2019-08-09 北京奇艺世纪科技有限公司 一种响度调节方法及装置
WO2018066383A1 (ja) 2016-10-07 2018-04-12 ソニー株式会社 情報処理装置および方法、並びにプログラム
US10389323B2 (en) 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
CN110832830B (zh) * 2018-03-22 2021-07-09 华为技术有限公司 一种调节音量的方法和电子设备
CN111048108B (zh) * 2018-10-12 2022-06-24 北京微播视界科技有限公司 音频处理方法和装置
US10998872B2 (en) 2018-10-24 2021-05-04 Gracenote, Inc. Methods and apparatus for audio equalization
US11295718B2 (en) 2018-11-02 2022-04-05 Bose Corporation Ambient volume control in open audio device
US11032642B1 (en) 2020-03-10 2021-06-08 Nuvoton Technology Corporation Combined frequency response and dynamic range correction for loudspeakers
CN111698631B (zh) * 2020-05-22 2021-10-15 深圳市东微智能科技股份有限公司 音频设备自动调试方法、音频设备以及音频系统
US11317203B2 (en) 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal
US11202149B1 (en) 2020-09-11 2021-12-14 Ford Global Technologies, Llc Vehicle audio control
CN112040373B (zh) * 2020-11-02 2021-04-23 统信软件技术有限公司 一种音频数据处理方法、计算设备及可读存储介质
CN116033314B (zh) * 2023-02-15 2023-05-30 南昌航天广信科技有限责任公司 一种音频自动增益补偿方法、系统、计算机及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
US20020076072A1 (en) * 1999-04-26 2002-06-20 Cornelisse Leonard E. Software implemented loudness normalization for a digital hearing aid
US20030044028A1 (en) * 2001-09-04 2003-03-06 Cranfill David B. Dynamic gain control of audio in a communication device
US20040213420A1 (en) * 2003-04-24 2004-10-28 Gundry Kenneth James Volume and compression control in movie theaters
TW200504682A (en) * 2003-07-24 2005-02-01 Inventec Multimedia & Telecom System and method for language translation on multimedia data
TW200520589A (en) * 2003-09-26 2005-06-16 Velodyne Acoustics Inc Adjustable speaker systems and methods

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3006259B2 (ja) * 1992-01-17 2000-02-07 ソニー株式会社 補聴器
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
DE69833749T2 (de) * 1997-04-16 2006-08-17 Emma Mixed Signal C.V. Filterbankanordnung und verfahren zur filterung und trennung eines informationssignals in unterschiedlichen frequenzbändern, insbesondere für audiosignale in hörhilfegeräten
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
WO2004111994A2 (en) * 2003-05-28 2004-12-23 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
WO2006047600A1 (en) * 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
US20020076072A1 (en) * 1999-04-26 2002-06-20 Cornelisse Leonard E. Software implemented loudness normalization for a digital hearing aid
US20030044028A1 (en) * 2001-09-04 2003-03-06 Cranfill David B. Dynamic gain control of audio in a communication device
US20040213420A1 (en) * 2003-04-24 2004-10-28 Gundry Kenneth James Volume and compression control in movie theaters
TW200504682A (en) * 2003-07-24 2005-02-01 Inventec Multimedia & Telecom System and method for language translation on multimedia data
TW200520589A (en) * 2003-09-26 2005-06-16 Velodyne Acoustics Inc Adjustable speaker systems and methods

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10020003B2 (en) 2016-12-09 2018-07-10 Acer Incorporated Voice signal processing apparatus and voice signal processing method

Also Published As

Publication number Publication date
RU2426180C2 (ru) 2011-08-10
WO2007120453A1 (en) 2007-10-25
BRPI0709877B1 (pt) 2019-12-31
EP2002429A1 (en) 2008-12-17
ES2400160T3 (es) 2013-04-08
PL2002429T3 (pl) 2013-03-29
EP2002429B1 (en) 2012-11-21
BRPI0709877A2 (pt) 2011-07-26
TW200746049A (en) 2007-12-16
CN101421781A (zh) 2009-04-29
JP2009532739A (ja) 2009-09-10
RU2008143336A (ru) 2010-05-10
JP4981123B2 (ja) 2012-07-18

Similar Documents

Publication Publication Date Title
TWI471856B (zh) 控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式
US11296668B2 (en) Methods and apparatus for adjusting a level of an audio signal
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI397901B (zh) 控制音訊信號比響度特性之方法及其相關裝置與電腦程式