TWI469138B

TWI469138B - 用於在一通話期間修改在一下行鏈路語音信號中之話音之可辨識度的方法、裝置及製造物品

Info

Publication number: TWI469138B
Application number: TW100141335A
Authority: TW
Inventors: Shaohai Chen; Guy C Nicholson; Bruce C Po
Original assignee: Apple Inc
Priority date: 2010-11-12
Filing date: 2011-11-11
Publication date: 2015-01-11
Also published as: JP5525508B2; KR20120051595A; JP2012105287A; EP2453438A1; WO2012064764A1; US8744091B2; KR101311028B1; NL2007764A; US20120121096A1; HK1170839A1; TW201227718A; NL2007764C2; EP2453438B1

Description

用於在一通話期間修改在一下行鏈路語音信號中之話音之可辨識度的方法、裝置及製造物品

本發明之一實施例係關於改良使用者對通信器件中之下行鏈路音訊的體驗。亦描述其他實施例。

可在兩個電子通信器件之間執行即時雙向通信(其可能不僅為音訊，而且可為音訊及視訊)，此處一般將該等電子通信器件稱作電話器件。此等器件在幾年中已自簡單之簡易老式電話系統(POTS)類比有線站演進為蜂巢式網路電話、智慧型行動電話、網際網路語音通信協定(VOIP)站，及執行VOIP應用程式之桌上型及膝上型個人電腦。需要保持與分派給POTS網路中之語音頻道的原始、相對小之頻寬回溯相容。此已部分地防止出現「高保真度」電話通話，而不管此電話之可用性。

諸如智慧型電話之現代電話器件不僅支援經由語音頻道之語音通信，而且支援經由資料頻道之多媒體服務，諸如即時音訊、視訊聊天及行動TV。改良下行鏈路音訊信號之聲音品質對於智慧型電話而言係尤其需要的，此係因為該等智慧型電話可歸因於其對蜂巢式無線鏈路之依賴而更易受電磁干擾影響。另外，智慧型電話常常用於有雜訊之聲音環境中(諸如，在外面風中或在繁忙之公路或擁擠之人群附近)。

智慧型電話具有應用於下行鏈路音訊信號之若干音訊信號處理階段，該信號係自通信網路接收(在該信號經由揚聲器而被器件之近端使用者聽到之前)。另外，已發展信號處理演算法以在近端使用者處於高環境雜訊之區域中時改良下行鏈路音訊信號中所含有之遠端使用者話音的可辨識度。通常，在接收下行鏈路音訊信號之同時，近端使用者將手動地調整音量，推進器件更接近於其耳朵或佩戴耳機以克服環境雜訊。可辨識度提升演算法將藉由自動地調整等化濾波器以便隨所量測之環境雜訊位準抑或當前的使用者所選擇之音量設定而相對於下行鏈路話音之低頻分量增加高頻分量下的增益來起到幫助作用。此將使話音更可辨識(儘管為稍微人工探測)。

根據本發明之實施例，一使用者所選擇之音量設定及環境聲雜訊樣本可一起用以在一通話期間修改一下行鏈路語音信號以控制其可辨識度。該經取樣之環境聲雜訊及一先前儲存之雜訊位準用以判定一當前雜訊位準。使用該使用者所選擇之音量設定與該當前雜訊位準兩者，可判定一總輸出增益及一頻率回應。在該通話期間，藉由根據該所判定之頻率回應調整該下行鏈路語音信號之頻率回應特性而修改該下行鏈路語音信號。亦藉由根據該所判定之總輸出增益調整該下行鏈路音訊信號之總響度而修改該下行鏈路音訊信號。此可使得在該下行鏈路語音信號中之話音能夠保持可辨識，而不管在該通話期間之廣泛變化之環境雜訊位準且不要求使用者對該音量設定進行許多調整。

上述概要並不包括本發明之所有態樣之詳盡清單。預期本發明包括可自上文所概述之各種態樣之所有合適組合實踐的所有系統及方法，以及在下文之實施方式中所揭示及在本申請案所申請之申請專利範圍中特別指出的系統及方法。此等組合具有未在上述概要中特定敍述之特定優點。

現將參看下文所概述之圖式來描述本發明之實施例。在隨附圖式之諸圖中藉由實例而非藉由限制來說明本發明之實施例，在該等圖式中，相似參考指示類似元件。應注意，在本發明中對本發明之「一」或「一個」實施例的參考未必為對同一實施例的參考，且其意謂至少一個。

現解釋參看附加圖式之本發明之若干實施例。儘管闡述了眾多細節，但應理解，可在無此等細節的情況下實踐本發明之一些實施例。在其他例子中，尚未詳細展示熟知之電路、結構及技術以便不會混淆對此描述之理解。

圖1為實例通信器件之方塊圖。器件100具有外殼(未圖示)，在該外殼中係圖1中所描繪之整合組件。聲換能器介面電路114係用以將下行鏈路音訊信號饋送至揚聲器111。聲換能器介面電路114(其可部分地實施於音訊編解碼器積體電路器件內)可具有數位轉類比轉換器後續接著音訊放大器，以在介面電路114之輸出端處將數位下行鏈路音訊信號轉換為類比揚聲器驅動器信號。或者，聲換能器介面電路114可僅將數位音訊信號緩衝且連接至耳機(例如，使用藍芽順應性介面電路，及有線耳機之數位麥克風電路)。下行鏈路信號係藉由具有耦接至通信網路178之輸入端的下行鏈路音訊信號處理器172提供。

聲換能器介面電路114係用以將音訊信號自語音拾取器件或麥克風113饋送至上行鏈路音訊信號處理器174。針對此功能，介面電路114可具有類比至數位轉換器，該類比至數位轉換器將來自所連接之麥克風113的類比輸出信號轉換為數位形式。或者，介面電路114可僅緩衝來自數位、無線或有線耳機之數位麥克風信號(例如，使用藍芽無線耳機晶片組或數位麥克風晶片組)。上行鏈路音訊信號處理器174在將上行鏈路音訊信號發送至通信網路178之前提高該信號之品質。

揚聲器111可為以免持聽筒模式使用之喇叭，或其可為聽筒揚聲器或接收器，喇叭與聽筒揚聲器或接收器兩者將整合於通信器件外殼中。麥克風113可為整合於通信器件外殼中之麥克風。作為替代，揚聲器111及麥克風113可整合於耳機(未圖示)中。耳機(其可為有線或無線耳機)將經連接以經由介面電路114中之適當的耳機介面電路(未圖示)來接收下行鏈路音訊及發送上行鏈路音訊。

器件100包括處理器186。處理器186可執行於記憶體184中儲存之電話應用程式。處理器186亦可執行一程式，該程式藉由將使用者對多種不同音量控制或調整按鈕(及其相關聯之開關或機械至電換能器)中之任一者的致動解碼為特定音量設定(例如，來自外殼整合之實體開關196)而提供音量設定(控制信號)。該程式可追蹤作為所儲存之資料變數的當前音量設定，且接著基於下一偵測到之開關致動而更新當前設定。或者，處理器186可執行在具有觸敏螢幕112之顯示器上讀取觸碰事件的軟體組件，從而表示虛擬音量按鈕之致動。可或者自位於有線耳機(未圖示)之麥克風外殼中的實體開關讀取音量設定。耳機可經由標準耳機插口(未圖示)而連接至(主機)器件100。在彼狀況下，器件100之有線耳機介面含有晶片組之部分，該部分經由麥克風偏置線來偵測或讀取開關，且接著將此資訊提供至處理器186。在又一實施例中，可自整合於無線耳機(未圖示)中之實體開關讀取音量設定。針對彼狀況，(主機)器件100之無線耳機介面含有短距離無線介面晶片組(例如，藍芽收發器晶片組)之部分，該部分經由與主機器件100之無線鏈路來偵測或讀取開關。

器件100支援已建立於器件100之近端使用者與遠端器件182之遠端使用者之間的雙向交談，該雙向交談可為語音通話或視訊通話(統稱為通話180)之部分。可經由器件100之網路介面176來建立並進行通話180。網路介面176可包括(例如)經由與公眾交換電話網路(PSTN)之有線連接來發出或接收通話180所需的電路及軟體。在另一實施例中，網路介面176可具有將通話180進行為無線、蜂巢式網路連接所需的電路及軟體。舉例而言，網路介面176可包括RF通信電路(其耦接至天線)，使得器件100之近端使用者可經由無線通信網路來發出或接收通話180。RF通信電路可包括RF收發器電路及蜂巢式基頻處理器以經由蜂巢式網路來啟用通話180。在又一實施例中，網路介面176可使用網際網路語音通信協定(VOIP)連接經由有線或無線區域網路來發出或起始通話180。

可經由網路介面176所連接至之通信網路178來發出或起始通話180。取決於藉由遠端使用者所使用之遠端器件182的特定類型，通信網路178可實際上由若干不同類型之彼此合作的網路構成(例如，經由未圖示之閘道器)以建立並進行通話180。舉例而言，通信網路178可包括處於近端處之蜂巢式網路鏈路，後續接著回載傳輸或PSTN區段且最後為處於遠端處的無線或有線區域網路區段。

來自遠端器件182之下行鏈路語音信號係經由網路介面176而接收且在遞送至聲換能器介面電路114之前藉由下行鏈路音訊信號處理器172處理。下行鏈路處理器172可包括呈將多個品質改良操作應用於來自網路介面176之下行鏈路語音信號(例如，包括自動增益控制及/或雜訊抑制)的硬體及/或軟體之形式的數位音訊信號處理性能。

下行鏈路音訊信號處理器172亦可包括圖1中所示之用以改良在不同之環境聲雜訊環境中下行鏈路語音信號之可辨識度的組件。雜訊迴轉濾波器(noise slew filter)121約束經取樣之雜訊序列可改變的速率。增益提升計算器122基於經約束之雜訊序列且基於使用者所選擇之音量設定來判定總增益。等化(EQ)提升計算器123基於經約束之雜訊序列且基於使用者所選擇之音量設定來判定頻率回應。參數選擇電路124根據所判定之總增益來選擇參數，該參數經由增益區塊126來設定響度位準。參數選擇電路124亦根據所判定之頻率回應來選擇用於數位等化(EQ)濾波器125之一組係數。EQ濾波器125可根據該等係數來修改下行鏈路語音信號之頻率回應特性。現將更詳細地描述在通話期間藉由下行鏈路音訊處理器172對下行鏈路語音信號之處理以改良遠端使用者之話音的可辨識度。

一旦已建立通話180或已與遠端器件182進行連接，則藉由下行鏈路音訊信號處理器172對下行鏈路語音信號的處理可如下繼續進行。參看圖2，處理器186(或其他合適電路)判定使用者所選擇之音量設定(在201中)且將該設定傳輸至下行鏈路音訊信號處理器172。聲換能器介面電路114對存在於器件100之近端使用者(亦即，緊接近於器件100)周圍的環境聲雜訊取樣且將經取樣之環境音訊雜訊信號傳輸至雜訊迴轉濾波器121(在202中)。雜訊迴轉濾波器121基於經取樣之環境音訊雜訊及使用者所選擇之音量設定來估計當前雜訊位準(在204中)且將當前雜訊位準傳輸至增益提升計算器122及EQ提升計算器123。增益提升計算器122基於經約束之雜訊序列且基於使用者所選擇之音量設定來判定總增益(在205中)。EQ提升計算器123基於經約束之雜訊序列且基於使用者所選擇之音量設定來判定頻率回應(在206中)。EQ濾波器125根據所判定之頻率回應而根據藉由參數選擇電路124所選擇之該組係數來修改下行鏈路語音信號之頻率回應特性(在210中)。增益區塊126基於總輸出增益而根據藉由參數選擇電路124所選擇之參數來設定下行鏈路語音信號之響度位準(在211中)。現將更詳細地描述如圖2中所示之對下行鏈路語音信號之處理。

聲換能器介面電路114對存在於器件100之近端使用者(亦即，緊接近於器件100)周圍的環境聲雜訊取樣。可在通話期間重複地對環境聲雜訊取樣以獲得經取樣之雜訊序列。聲換能器介面電路114將經取樣之環境音訊雜訊信號傳輸至雜訊迴轉濾波器121(在202中)。音訊樣本可為原始樣本，或其可為其低通濾波版本。可藉由器件100之一或多個麥克風(例如，射束可導引之麥克風陣列)經由聲換能器介面電路114而獲得音訊樣本。聲換能器介面電路114可具有自主要用於拾取近端使用者之話音的麥克風信號提取表示環境聲雜訊之信號所需的電路及軟體。

聲換能器介面電路114將環境雜訊信號傳輸至雜訊迴轉濾波器121。雜訊迴轉濾波器可為約束其輸出(表示經取樣之雜訊位準)可增加或減小之速率(亦即，改變之速率)的任何濾波器。雜訊迴轉濾波器121可用以產生環境雜訊位準之更平滑轉變，同時亦消除短期波動(例如，藉由包括低通濾波器)。對環境雜訊位準進行濾波防止對雜訊信號中之簡短尖峰的攪動回應。舉例而言，迴轉濾波器121防止波動，該等波動可引起總增益(其稍後應用於下行鏈路音訊信號)過大(其產生稱為下行鏈路音訊信號之提升抽汲的效應)。在替代性實施例中，可經由其他可能之實施(諸如，平均化或無限脈衝回應(IIR)遞迴濾波器)來達成雜訊估計的減慢或平滑化。

在本發明之一實施例中，迴轉濾波器121自經取樣之環境聲雜訊(於其輸入端處接收)及於迴轉濾波器121中儲存之先前估計之雜訊位準來估計當前雜訊位準(在204中)。參看圖3，迴轉濾波器121可藉由以下步驟來估計當前雜訊位準：計算經取樣之環境聲雜訊與先前估計之雜訊位準之間的雜訊差(在301中)；判定針對該雜訊差所允許之最大改變速率(在302中)；判定針對最大改變速率所允許之最大雜訊差(在303中)；及在經取樣之環境聲雜訊與先前估計之雜訊位準之間的雜訊差大於最大允許雜訊差的情況下限制自雜訊迴轉濾波器121所輸出的當前雜訊位準(在304至306中)。現將更詳細地描述藉由雜訊迴轉濾波器121來估計當前雜訊位準。

可藉由首先計算在於雜訊迴轉濾波器121之輸入端處接收的經取樣之環境聲雜訊與先前估計之雜訊位準之間的改變量(例如，以分貝為單位)(亦稱作差值雜訊或雜訊差)(在301中)來判定當前雜訊位準。亦可判定針對雜訊差所允許之最大改變速率或迴轉速率(以dB/秒為單位)(在302中)。迴轉速率可為固定值(例如，+/- 4 dB/s之值)。或者，迴轉速率可動態地變化(亦即，隨差值雜訊而變)。舉例而言，參見圖4中所說明之曲線圖。動態地判定迴轉速率允許使迴轉速率針對合理之大雜訊改變(例如，當使用者在通話期間自安靜的汽車中走到繁忙之街道拐角時)而變得更大。在此情形中具有固定之迴轉速率將以應用於下行鏈路音訊信號之總增益增加(以補償環境雜訊之增加)的方式引起明顯延遲。舉例而言，安靜的汽車可具有60 dBA之雜訊，而繁忙之街道可具有84 dBA之雜訊。約束至4 dB/s之固定迴轉速率的24 dB之雜訊改變將導致6秒來完全作出回應(藉由改變總增益及EQ濾波器參數)，此為過長之延遲。

圖4展示針對多個差值雜訊範圍來動態地判定迴轉速率之實例。對於小於第一預定臨限值401(例如，8 dB)之差值雜訊值而言，迴轉速率可為預定最小迴轉速率402(例如，4 dB/s)，如由曲線圖區段403所示。對於在第一預定臨限值401與第二(較高)預定臨限值404之間的差值雜訊值而言，迴轉速率可如所示而變化，使得迴轉時間或反應時間不超過此處被稱作差值時間的某一時間量(例如，2秒)。將藉由用差值時間除當前差值雜訊來計算在此狀況下之迴轉速率。此計算之結果反映於曲線圖區段405中。對於高於第二臨限值404之差值雜訊值而言，迴轉速率可為預定最大迴轉速率406(例如，10 dB/s)，如由曲線圖區段407所示。類似地，對於對應於負差值雜訊值之雜訊減小而言，迴轉速率為負的，但可實質上遵循與正值之曲線相同的曲線。根據圖4中所示之實例，動態地判定迴轉速率約束經取樣之雜訊序列，使得每當雜訊序列中之兩個樣本之間的雜訊差為小的時其改變速率設定為低速率，且每當雜訊差為大的時其改變速率設定為高速率。

再次參看圖3，迴轉濾波器121接著使用新近判定之迴轉速率來判定最大差值雜訊或迴轉差值(在303中)。迴轉差值為用樣本週期乘之新近判定的迴轉速率。該樣本週期為在用以判定當前雜訊位準之環境聲雜訊樣本之間消逝的時間量。舉例而言，聲換能器介面電路114可經組態以在雙向語音交談期間以8 kHz之樣本速率將類比麥克風拾取信號轉換為數位音訊樣本。然而，換能器介面電路114可以半秒之時間間隔將環境聲雜訊樣本傳輸至迴轉濾波器121。在此狀況下，迴轉濾波器121之樣本週期將為1秒的一半。若需要，則其他樣本速率及樣本週期亦係可能的。

接著將差值雜訊與迴轉差值比較(在304中)以判定是否需要限制或約束自雜訊迴轉濾波器121所輸出之當前雜訊位準。若差值雜訊不超過迴轉差值，則藉由雜訊迴轉濾波器121所輸出之當前雜訊位準為所輸入之環境聲雜訊(在305中)。若差值雜訊超過迴轉差值，則藉由迴轉濾波器121所輸出之當前雜訊位準為先前雜訊位準外加迴轉差值(在306中)。每當雜訊差超過迴轉差值時(亦即，每當雜訊改變足夠大時)，迴轉濾波器121由此將當前雜訊位準限制至先前雜訊位準外加迴轉差值。迴轉濾波器121接著將當前雜訊位準傳輸至增益提升計算器122及EQ提升計算器123。

再次參看圖2，下行鏈路音訊信號處理器172中之增益提升計算器122經組態以基於自迴轉濾波器121所接收之當前雜訊位準(亦即，經約束之雜訊序列)且基於可自處理器186接收之使用者所選擇之音量設定來判定待應用於下行鏈路語音信號的總增益(在205中)。參看圖5，簡言之，增益提升計算器122如下判定總增益：自當前雜訊位準判定待應用於使用者所選擇之音量設定的增益提升(在501中)，亦判定針對使用者所選擇之音量設定所允許的最大提升(在502中)，在增益提升大於最大允許提升之情況下限制增益提升(在503中)。增益提升計算器122將增益提升加至使用者所選擇之音量設定且將彼輸出為總增益。現將更詳細地描述藉由增益提升計算器122來判定總增益。

增益提升計算器122首先自自雜訊迴轉濾波器121所接收之當前雜訊位準判定待應用於使用者所選擇之音量設定(其可自處理器186接收)的增益提升(在501中)。增益提升具有修改對應於音量設定之音量曲線的效應，如圖6中所示。在不存在環境雜訊之情形中，藉由使用者所選擇之音量設定所指示的增益506為待應用於下行鏈路語音信號之輸出增益。在有雜訊之環境中，將增益提升507應用於使用者所選擇之音量設定，使得下行鏈路音訊信號之輸出增益為藉由增益提升507所修改之使用者所選擇的音量設定。增益提升有效地使對應於使用者所選擇之音量設定的音量曲線向上移位，如由線508所指示。

增益提升曲線可呈現更複雜的形式(諸如，如圖7中所示之多分段線)，以允許更複雜之提升行為。曲線圖可具有多個區段710、720、730及740，該等區段針對不同之雜訊環境而具有不同的提升特性。舉例而言，對於不超過第一臨限雜訊位準701之當前雜訊位準而言，將不應用增益提升，如由區段710所指示。對於大於第一臨限雜訊位準701但不超過第二(較高)臨限位準702之當前雜訊位準而言，增益提升為區段720上之對應於當前雜訊位準的值。對於大於第二臨限位準702之當前雜訊位準而言，增益提升為區段730上之對應於當前雜訊位準的值。一旦達到預定最大增益提升703，則增益提升保持處於最大增益提升，如由區段740所指示。

返回至圖5，增益提升計算器122亦可判定針對使用者指定之音量設定所允許的最大提升(在502中)。一旦增益提升計算器122判定增益提升及所允許之最大提升，則接著將增益提升與最大提升比較(在503中)。若增益提升超過最大提升，則自增益提升計算器122所輸出之總增益為使用者所選擇之音量設定外加最大提升。否則，自增益提升計算器122所輸出之總增益為使用者所選擇之音量設定外加增益提升。當近端使用者處於有雜訊之環境中時，基於使用者所選擇之音量設定而將增益提升限制至最大提升將允許對應於最高音量位準之音量設定對下行鏈路語音信號具有可感知的效應。將圖8用作一實例，若歸因於規章或系統約束而不允許下行鏈路語音信號之輸出增益高於某一位準801，則在下行鏈路語音信號之輸出增益達到最大位準時將必須固定(clamp)增益提升。在此情形中，將使頂部少數音量位準在高雜訊環境中變平，如由線段802所指示，且近端使用者將具有較高音量設定不具有效應的感知。圖9展示在根據使用者所選擇之音量設定限制增益提升之後的下行鏈路音訊信號之輸出增益。增益提升被允許回應於雜訊而擺動，但在較高之音量位準下受使用者所選擇之音量設定限制，如由區段803所示。藉由近端使用者來調整音量設定將接著在較高之音量位準下具有可感知的效應。

EQ提升計算器123亦接收自雜訊迴轉濾波器121所輸出之當前雜訊位準(亦即，經約束之雜訊序列)。再次參看圖2，下行鏈路音訊信號處理器172中之EQ提升計算器123經組態以自自雜訊迴轉濾波器121所接收之當前雜訊位準判定對應於當前雜訊位準及自處理器186所接收之使用者所選擇之音量設定的頻率回應(在206中)。參看圖10，EQ提升計算器123藉由判定對應於使用者所選擇之音量設定的指標值(在901中)來判定頻率回應。如圖11中所示，每一使用者所選擇之音量設定具有至圖12之頻率回應係數清單中之特定頻率回應設定的指標。EQ提升計算器123亦基於當前雜訊位準來判定頻率回應位移(在902中)。該頻率回應位移為至指標之整數位移。如圖13中所示，該位移加至指標以產生指向頻率回應係數清單中之頻率回應設定的所得指標(在903中)，該所得指標「高於」對應於使用者所選擇之音量設定的頻率回應。舉例而言，若音量設定之指標指向標稱頻率回應且位移為+3，則所得指標將指向藉由係數清單中之max3_eq所指示的頻率回應設定。當使用者處於有雜訊之環境中時，該位移自動地提升下行鏈路語音信號之可辨識度。

EQ提升計算器123藉由(例如)圖14中所指示之曲線圖來判定隨當前雜訊位準而變的指標位移。對於不超過臨限位準910(例如，65 dB)之當前雜訊位準而言，位移為零，如由線段920所指示。對於超過臨限位準910之當前雜訊位準而言，位移與當前雜訊位準之增加成比例而以整數增量增加(如由區段930所指示)，直至達到最大位移值940(例如，指標位移4)為止。對於高於對應於區段930之位準的當前雜訊位準而言，位移值保持處於最大位移值940，如由線段950所指示。EQ提升計算器123接著將所得指標傳輸至參數選擇電路124。

參數選擇電路124根據藉由增益提升計算器122所判定之總增益而自音量組態表選擇經由增益區塊126設定響度位準的參數。在一實施例中，參數選擇電路124可根據所判定之總增益而選擇經由增益區塊126設定下行鏈路語音信號之總動態範圍的參數。參數選擇電路124亦可根據藉由EQ提升計算器123所判定之頻率回應而自頻率回應係數清單(例如，如圖11中所示)選擇用於EQ濾波器125之該組係數。該組係數可使得EQ濾波器125修改下行鏈路語音信號之頻率回應特性及/或執行多頻帶限制、多頻帶壓縮或多頻帶擴展。接著將音量位準傳輸至增益區塊126，且將係數傳輸至EQ濾波器125。

EQ濾波器125藉由根據自選擇電路124所接收之頻率回應係數修改下行鏈路語音信號之頻率回應特性(在圖2之210中)來對該等頻率回應係數作出回應。在一實施例中，係數相對於下頻帶及上頻率而增加中間頻帶上之增益。中間頻帶之增益之增加亦可伴隨有下頻帶或上頻帶中的同時增益減小，以將(揚聲器111之)總輸出聲能或功率維持為大約與所遞送的聲能或功率相同。強調中間頻帶增加了由近端使用者經由揚聲器111所聽到之人話音的可辨識度。

在另一實施例中，EQ濾波器125可對下行鏈路語音信號執行多頻帶限制、多頻帶壓縮及/或多頻帶擴展。對於多頻帶限制而言，將下行鏈路語音信號之所要頻帶中的增益自動地衰減或限制至處於或接近一臨限值之某一位準(每當彼頻帶中之信號位準升高至該臨限值以上時)。對於多頻帶壓縮而言，可按需要減小所要頻帶中之增益以達成平滑限制效應。對於多頻帶擴展而言，當信號下降至下臨限值以下時，在所要頻帶中將更多增益應用於該信號。對下行鏈路語音信號應用多頻帶限制、多頻帶壓縮或多頻帶擴展可改良下行鏈路語音信號隨著其被近端使用者聽到的感知響度且減少下行鏈路語音信號中的聲失真。EQ濾波器125可接著將經修改之下行鏈路音訊信號傳輸至增益區塊126。

增益區塊126根據自參數選擇電路124所接收之音量位準來修改下行鏈路語音信號(在211中)。增益區塊126可具有多個音量位準(將在該等音量位準下操作揚聲器111)。該等音量位準橫跨最低或最小位準與最高或最大位準之間的範圍。自選擇電路124所接收之音量位準對應於下行鏈路語音信號之響度。增益區塊126可包括本端音訊放大器，該本端音訊放大器藉由相應地放大下行鏈路語音信號來對音量位準作出回應。在一實施例中，增益區塊126亦可在將下行鏈路語音信號饋送至聲換能器介面電路114之前根據自參數選擇電路124所接收之參數對該信號執行總限制、壓縮及擴展。

在一實施例中，下行鏈路音訊信號處理器172可包括舒適雜訊產生器(未圖示)。該舒適雜訊產生器產生待加至下行鏈路語音信號之人工背景雜訊。將背景雜訊加至下行鏈路語音信號最小化聲音位準之突然改變及遠端使用者之話音的不連貫性(choppiness)(聲音位準之突然改變與遠端使用者之話音的不連貫性兩者可能影響下行鏈路語音信號中之遠端使用者之話音的可辨識度)。舒適雜訊產生器可耦接至參數選擇電路124以接收根據藉由增益提升計算器122所判定之總增益及藉由EQ提升計算器123所判定之頻率回應所選擇的參數。該等參數可啟用或停用舒適雜訊產生器且可設定藉由舒適雜訊產生器所產生之人工背景雜訊的響度。舉例而言，當近端使用者處於具有高環境雜訊之環境中時，可停用舒適雜訊產生器，使得遠端使用者之話音的可辨識度不受人工背景雜訊之添加的影響。

如上文所提出，本發明之實施例在行動通信器件(諸如，行動智慧型電話)中可為尤其需要的。圖15展示可實施本發明之一實施例的實例通信器件100(其為行動多功能器件或智慧型電話)。器件100具有外殼101，結合圖1所描述之大部分組件整合於外殼101中。該外殼將顯示螢幕112固持於器件100之前面上。顯示螢幕112亦可包括觸控螢幕。器件100亦可包括一或多個實體按鈕(諸如，音量控制按鈕196)及/或虛擬按鈕(在觸控螢幕上)。

器件100包括輸入-輸出組件，諸如手機麥克風113及喇叭115。當未啟用免持聽筒模式時，在手機操作模式中在通話期間自置放成鄰近於使用者耳朵之聽筒或接收器116發射電話通話期間的聲音。器件100亦可包括耳機插口(未圖示)及無線耳機介面，以與具有內建式麥克風之耳機器件連接，從而允許使用者在佩戴連接至器件100之耳機之同時體驗通話。

器件100具有記憶體184(展示於圖1中)，記憶體184可包括隨機存取記憶體、非揮發性記憶體(諸如，固態磁碟儲存器)、快閃記憶體，及/或其他合適之數位儲存器。可存在執行或實行於記憶體184中儲存之各種軟體程式、模組或指令集(例如，應用程式)的一或多個處理器，以執行上文所描述之各種功能。此等模組或指令無需實施為單獨之程式，而是可以各種組合得以組合或另外重配置。舉例而言，迴轉濾波器121可與上行鏈路音訊信號處理器174或聲換能器介面電路114整合。另外，某些功能之啟用可散佈於兩個或兩個以上模組當中，且可能與某一硬體組合。

總之，描述了用於動態地修改下行鏈路音訊信號之音量及可辨識度之技術的各種態樣。如上文所解釋，本發明之一實施例可為具有儲存於其上之指令的機器可讀媒體，該等指令將處理器程式化以執行上文所描述之數位信號處理操作中的一些，包括(例如)雜訊迴轉濾波器121、增益提升計算器122、EQ提升計算器123及參數選擇電路124之功能。機器可讀媒體可包括用於以可由機器(例如，電腦)讀取之形式來儲存或傳送資訊的任何機構，諸如緊密光碟唯讀記憶體(CD-ROM)、唯讀記憶體(ROM)、隨機存取記憶體(RAM)及可抹除可程式化唯讀記憶體(EPROM)。在其他實施例中，此等操作中之一些可藉由含有硬連線邏輯的特定硬體組件來執行。彼等操作可或者藉由經程式化之資料處理組件與固定硬體電路組件的任何組合來執行。

出於解釋之目的，描述特定實施例以提供對本發明之透徹理解。此等不應解釋為限制本發明之範疇，而是僅解釋為說明本發明的不同實例及態樣。應瞭解，本發明之範疇包括上文未詳細論述之其他實施例。在不脫離如附加申請專利範圍中所界定之本發明之精神及範疇的情況下，可在本文所揭示之本發明之系統及方法的配置、操作及細節方面進行對於熟習此項技術者將顯而易見的各種其他修改、改變及變化。舉例而言，圖1中所描繪之具有電話器件(具有無線通話性能)的器件100可為行動電話器件(例如，智慧型電話手機)或其可為執行VOIP電話應用程式之桌上型個人電腦。因此，本發明之範疇應由申請專利範圍及其合法等效物來判定。此等等效物包括當前已知之等效物以及未來發展之等效物兩者(亦即，所發展之執行相同功能的任何元件)，而不管結構。此外，無元件、組件或方法步驟意欲獻給公眾，而不管該元件、組件或方法步驟是否係在申請專利範圍中明確敍述。

100．．．主機器件/通信器件

101．．．外殼

111．．．揚聲器

112．．．觸敏螢幕/顯示螢幕

113．．．麥克風/手機麥克風

114．．．聲換能器介面電路

115．．．喇叭

116．．．聽筒或接收器

121．．．雜訊迴轉濾波器

122．．．增益提升計算器

123．．．等化(EQ)提升計算器

124．．．參數選擇電路

125．．．數位等化(EQ)濾波器

126．．．增益區塊

172．．．下行鏈路音訊信號處理器

174．．．上行鏈路音訊信號處理器

176．．．網路介面

178．．．通信網路

180．．．通話

182．．．遠端器件

184．．．記憶體

186．．．處理器

196．．．外殼整合之實體開關/音量控制按鈕

401．．．第一預定臨限值

402．．．預定最小迴轉速率

403．．．曲線圖區段

404．．．第二(較高)預定臨限值

405．．．藉由用差值時間除當前差值雜訊來計算在此狀況下之迴轉速率之結果

406．．．預定最大迴轉速率

407．．．曲線圖區段

506．．．增益

507．．．增益提升

508．．．增益提升有效地使對應於使用者所選擇之音量設定的音量曲線向上移位

701．．．第一臨限雜訊位準

702．．．第二(較高)臨限位準

703．．．預定最大增益提升

710．．．不應用增益提升

720．．．區段

730．．．區段

740．．．區段

801．．．位準

802．．．線段

803．．．區段

910．．．臨限位準

920．．．位移為零

930．．．區段

940．．．最大位移值

950．．．位移值保持處於最大位移值940

圖1為具有可辨識度處理之通信器件之方塊圖。

圖2為可辨識度處理之流程圖。

圖3為圖1之迴轉濾波器之流程圖。

圖4為隨藉由圖1之迴轉濾波器所使用之雜訊之改變而變的迴轉速率的曲線圖。

圖5為展示在判定總增益時所執行之操作的流程圖。

圖6為說明應用於使用者所選擇之音量設定之增益提升的曲線圖。

圖7為隨藉由圖1之增益提升計算器所使用之當前雜訊位準而變的增益提升之曲線圖。

圖8為說明在總增益達到最大位準時之限幅效應的曲線圖。

圖9為說明由於基於使用者所選擇之音量設定來限制增益提升的總增益的曲線圖。

圖10為展示在判定頻率回應時所執行之操作的流程圖。

圖11為對應於每一使用者所選擇之音量設定之頻率回應係數清單指標值的表。

圖12為頻率回應係數清單。

圖13說明在將指標位移加至對應於使用者所選擇之音量設定之指標值時的所得指標。

圖14為隨當前雜訊位準而變的頻率回應指標位移之曲線圖。

圖15為可實施可辨識度處理性能之實例行動通信器件之外殼的預期、外部視圖。

Claims

一種用於在一通話期間修改一下行鏈路語音信號中之話音之可辨識度的方法，其包含：基於(a)在該通話期間取樣環境聲雜訊及(b)一先前估計之雜訊位準來計算一當前雜訊位準估計，其係藉由：(1)基於該經取樣之環境聲雜訊且基於該先前判定之雜訊位準來計算一差值雜訊，(2)判定一迴轉速率，(3)藉由將該迴轉速率與一雜訊樣本週期相乘來計算一迴轉差值，及(4)在該差值雜訊不超過該迴轉差值時，將該經取樣之環境聲雜訊選擇作為該當前雜訊位準估計；基於該當前雜訊位準估計且基於一使用者所選擇之音量設定來判定一總輸出增益；基於該當前雜訊位準估計且基於該使用者所選擇之音量設定來判定一頻率回應；及根據該總輸出增益及該頻率回應在該通話期間修改該下行鏈路語音信號。
如請求項1之方法，其中該迴轉速率係可變的，因為當該差值雜訊大於一臨限值時，該迴轉速率係被增加。
如請求項1之方法，其中判定該總輸出增益包含：判定對應於該當前雜訊位準估計之一增益提升；及自一音量組態表選擇對應於藉由該增益提升所修改之該使用者所選擇之音量設定的一音量位準。
如請求項3之方法，其中判定該總輸出增益進一步包含：基於該使用者所選擇之音量設定來限制該增益提升。
如請求項1之方法，其中判定該頻率回應包含：基於該當前雜訊位準估計來判定一指標位移；判定對應於該使用者所選擇之音量設定的一指標值；及如由藉由該指標位移所修改之該指標值所指示自一係數清單選擇一組係數，該組係數對應於用於修改該下行鏈路語音信號的該頻率回應。
如請求項1之方法，其中修改該下行鏈路語音信號包含：根據該頻率回應來修改該下行鏈路語音信號之頻率特性；及根據該總輸出增益來修改該下行鏈路語音信號之一總增益。
一種用於在一通話期間修改一下行鏈路語音信號中之話音之可辨識度的方法，其包含：基於(a)在該通話期間取樣環境聲雜訊及(b)一先前估計之雜訊位準來計算一當前雜訊位準估計，其係藉由：(1)基於該經取樣之環境聲雜訊且基於該先前估計之雜訊位準來計算一差值雜訊，(2)判定一迴轉速率，(3)藉由將該迴轉速率與一雜訊樣本週期相乘來計算一迴轉差值，及(4)在該差值雜訊超過該迴轉差值時，將該先前估計之雜訊位準外加該迴轉差值選擇作為該當前雜訊位準估計。
一種用於在一通話期間修改一下行鏈路語音信號中之話音之可辨識度的裝置，其包含：一通信器件外殼，其具有整合於其中之以下各者，一聲換能器介面電路，其耦接至一麥克風輸入端以對環境聲雜訊取樣，一處理器，其用以感測一使用者所選擇之音量設定，一迴轉濾波器電路，其具有耦接至該聲換能器介面電路之一輸入端，該迴轉濾波器電路用以基於該經取樣之環境聲雜訊且基於一先前估計之雜訊位準來計算一當前雜訊位準，其中該迴轉濾波器電路計算該經取樣之環境聲雜訊與該先前估計之雜訊位準之間的一差值雜訊、判定一迴轉速率、藉由將該迴轉速率與一雜訊樣本週期相乘來計算一迴轉差值、每當該差值雜訊超過該迴轉差值時藉由該先前估計之雜訊位準外加該迴轉差值來限制該當前雜訊位準估計，及輸出如所限制之該當前雜訊位準估計，一增益提升計算器，其耦接至該迴轉濾波器電路及該處理器，該增益提升計算器用以基於該當前雜訊位準估計且基於該使用者所選擇之音量設定來判定一總輸出增益，一參數選擇電路，其用以自一音量組態表選擇對應於該總輸出增益之一音量位準及回應於該當前雜訊位準估計及該使用者所選擇之音量設定自一係數清單選擇一組係數，一EQ濾波器，其具有待耦接至一通信網路以接收一下行鏈路語音信號之一輸入端，該EQ濾波器用以根據該組係數來修改該下行鏈路語音信號，及一增益模組，用以根據該音量位準來修改該下行鏈路語音信號之一總響度。
如請求項8之裝置，其中該迴轉濾波器電路用以改變該迴轉速率，使得當該差值雜訊大於一臨限值時，該迴轉速率係被增加。
如請求項8之裝置，其中該迴轉速率針對處於或低於一第一臨限值之差值雜訊為一第一恆定值、針對在該第一臨限值與一第二臨限值之間的差值雜訊增加，且針對處於或高於該第二臨限值之差值雜訊為一第二恆定值。
如請求項8之裝置，其中該增益提升計算器基於該當前雜訊位準估計來判定一增益提升，且將該使用者所選擇之音量設定外加該增益提升輸出作為該總輸出增益。
如請求項11之裝置，其中該增益提升計算器基於該使用者所選擇之音量設定來限制該增益提升。
如請求項8之裝置，進一步包含一EQ提升計算器，其具有耦接至該迴轉濾波器電路及該處理器之一輸入端，該EQ提升計算器用以基於該當前雜訊位準估計且基於該使用者所選擇之音量設定來判定該係數清單的一指標，其中該EQ提升計算器基於該當前雜訊位準估計來判定一指標位移、判定對應於該使用者所選擇之音量設定的一指標值，且將藉由該指標位移所修改之該指標值輸出作為該係數清單的該指標。
一種用於在一通話期間修改在一下行鏈路語音信號中之話音之可辨識度的方法，其包含：在該通話期間重複地對環境聲雜訊取樣以獲得一經取樣之雜訊序列；基於該經取樣之雜訊序列計算一當前雜訊位準估計之序列，其中該當前雜訊位準估計之序列係經約束，因為(1)每當(a)從該經取樣之雜訊序列取得之一經取樣雜訊位準與(b)從該當前雜訊位準估計之序列取得之一先前估計雜訊位準之間的一雜訊差小於一臨限值時，其改變速率係降低且(2)每當該雜訊差大於該臨限值時，其改變速率係增加；基於該當前雜訊位準估計之經約束之序列且基於一使用者所選擇之音量設定來判定一總增益；基於該當前雜訊位準估計之經約束之序列且基於該使用者所選擇之音量設定來判定一頻率回應；及根據該所判定之總增益及該所判定之頻率回應在該通話期間修改該下行鏈路語音信號。
如請求項14之方法，其進一步包含：根據該所判定之總增益及該所判定之頻率回應來修改藉由一舒適雜訊產生器所產生之人工背景雜訊的一音量位準。
如請求項14之方法，其中判定該總增益包含：基於該經約束之序列來判定一增益提升；及自一音量組態表選擇對應於該使用者所選擇之音量設定外加該增益提升的該總增益。
如請求項16之方法，其中判定該總增益進一步包含：基於該使用者所選擇之音量設定來限制該增益提升。
如請求項14之方法，其中判定該頻率回應包含：基於該經約束之序列來判定一指標位移；判定對應於該使用者所選擇之音量設定的一指標值；及如由藉由該指標位移所修改之該指標值所指示自一係數清單選擇一組係數，該組係數對應於用於修改該下行鏈路語音信號的該頻率回應。
如請求項14之方法，其中修改該下行鏈路語音信號包含：根據該頻率回應來修改該下行鏈路語音信號之頻率特性；及根據該總增益來修改該下行鏈路語音信號之一總響度。
如請求項14之方法，其中根據該所判定之頻率回應來修改該下行鏈路語音信號包含：相對於下頻帶及上頻帶而增加一中間頻帶上的增益。
一種製造物品，其包含：一非暫時性機器可讀儲存媒體，其具有儲存於其中之指令，該等指令將一處理器程式化，該處理器為一攜帶型通信器件之一組件，以在一通話期間重複地對環境聲雜訊取樣以獲得一經取樣之雜訊序列、計算經約束之一當前雜訊位準估計之序列，使得(a)每當一經取樣之雜訊位準與一先前估計雜訊位準之間的一雜訊差小於一臨限值時，其改變速率係減少且(b)每當該雜訊差大於該臨限值時，其改變速率係增加、基於該經約束之序列且基於一使用者所選擇之音量設定來判定一總增益、基於該經約束之序列且基於該使用者所選擇之音量設定來判定一頻率回應，及根據該所判定之總增益及該所判定之頻率回應在該通話期間修改該下行鏈路語音信號。
如請求項21之製造物品，其中該處理器係用以藉由以下步驟來判定該總增益：基於該經約束之序列來判定一增益提升；自一音量組態表選擇對應於該使用者所選擇之音量設定外加該增益提升的該總增益；及基於該使用者所選擇之音量設定來限制該增益提升。
如請求項21之製造物品，其中該處理器係用以藉由以下步驟來判定該頻率回應：基於該經約束之序列來判定一指標位移；判定對應於該使用者所選擇之音量設定的一指標值；及如由藉由該指標位移所修改之該指標值所指示自一係數清單選擇一組係數。
如請求項21之製造物品，其中該處理器係用以藉由以下步驟來修改該下行鏈路語音信號：根據該頻率回應來修改該下行鏈路語音信號之頻率特性；及根據該總增益來修改該下行鏈路語音信號之一總響度。