TWI484483B

TWI484483B - 增加語音清晰度的方法和裝置以及運算裝置

Info

Publication number: TWI484483B
Application number: TW102105328A
Authority: TW
Inventors: Jen Po Hsiao; ting wei Sun; Hann-Shi Tong
Original assignee: Htc Corp
Priority date: 2012-02-22
Filing date: 2013-02-08
Publication date: 2015-05-11
Also published as: KR20130096625A; JP2013172454A; TW201335931A; EP2631907A1; KR101455710B1; CN103295581A; CN103295581B; JP5704470B2; US9064497B2; US20130218560A1

Description

增加語音清晰度的方法和裝置以及運算裝置

本發明是有關於增加語音清晰度，且特別是有關於增加語音清晰度的方法和裝置以及運算裝置。

通話的聲音品質是行動電話使用者重要的使用經驗。部分行動電話利用雜訊降低技術來減少發話聲音訊號中夾帶的環境雜訊從而改善通話中發話聲音品質。又環境雜訊可能會劣化來話聲音訊號的品質。此時，行動電話使用者必須手動增大行動電話的音量。若音量過大，這種做法除了不方便以外，又未必能獲得合適的聆聽品質。

本發明係關於增加語音清晰度的方法和裝置以及運算裝置。

本發明提出一種增加語音清晰度的方法的一實施例。此方法包括以下步驟。對運算裝置之至少一麥克風所檢測到的一聲音訊號進行語音活動檢測從而檢測環境雜訊。根據檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊。利用運算裝置依據雜訊資訊和第一聲音訊號且按照一可調的動態餘量來增強第一聲音訊號從而輸出一第二聲音訊號。

另一實施例提出一種增加語音清晰度的裝置。此裝置包括環境雜訊決定單元和清晰度增加單元。環境雜訊決定單元用以根據運算裝置之至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊。清晰度增加單元耦接環境雜訊決定單元，用以根據檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據雜訊資訊和第一聲音訊號且按照一可調的動態餘量來增強第一聲音訊號從而輸出一第二聲音訊號。

又一實施例提出一種運算裝置。此運算裝置包括至少一麥克風、用以控制運算裝置的處理單元、通訊單元。訊號處理單元，耦接處理單元和通訊單元，用以增加運算裝置的語音清晰度，其包括環境雜訊決定單元和清晰度增加單元。環境雜訊決定單元用以根據運算裝置之至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊。清晰度增加單元，耦接環境雜訊決定單元，用以根據檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據雜訊資訊和第一聲音訊號且按照一可調的動態餘量來增強第一聲音訊號從而輸出一第二聲音訊號。

為了對本發明之上述及其他方面有更佳的瞭解，下文舉多種實施例，並配合所附圖式，作詳細說明如下：

以下提出增加運算裝置中如重現訊號的語音清晰度的方法和裝置以及運算裝置的實施例。第1圖繪示一種增加語音清晰度的方法的實施例的流程圖。依據此方法之一實施例，通話中的下行語音的語音清晰度得以改善，而就算在吵雜的環境中打電話或接電話，亦能如此。在其他實施例中，此方法亦可增加聽覺音重現時的清晰度，縱使環境雜訊大時，亦能如此，而聽覺音重現的場合譬如：來自多媒體資料源所播放語音檔案、多媒體檔案、串流語音或視訊(例如：在運算裝置上觀看YouTube的視訊)。再者，實現增加語音清晰度時，可額外加上保護運算裝置的硬體線路和使用者聽覺的設計。

此方法可應用於運算裝置，譬如是具有語音通訊功能(如電話、行動通訊、網路電路VoIP等等)的運算裝置，例如：行動電話、智慧型電話、平板電腦、筆記型電腦等等。第2圖繪示一種架構之實施例，依據此架構可衍生出運算裝置，其中行動裝置2包括訊號處理單元21、通訊單元23、處理單元25(例如具有單核心或多核心處理單元)、至少一麥克風M1和至少一揚聲器SK1。此方法例如可應用於訊號處理單元21，其接收來自通訊單元23的下行語音訊號(SRx)和輸出上行語音訊號(STx)至通訊單元23，其中通訊單元23支援一或多種通訊標準，例如2G、3G、3.5G、長期演進技術(LTE)、4G。

在其他例子中，此方法可應用於具有多媒體功能的運算裝置中以增加其聲音清晰度，而運算裝置例如是個人電腦、手提電腦、多媒體裝置、遊戲機等等。例如，此方法可應用在訊號處理單元21中，於重現一多媒體資料源即播放其聲音或多媒體資料之時，訊號處理單元21接收來自處理單元25或通訊單元23(或多媒體晶片或資料源)的聲音訊號(記作SRx)，其中多媒體資料源例如是儲存在運算裝置的音樂或視訊檔案，或來自遠端裝置、網站或網路雲端中的裝置之串流聲音或視訊(如在運算裝置上觀目YouTube)。又此方法可應用於具有無線網路功能(如Wi-Fi)的行動裝置上以增加基於網際網路協定(Internet protocol)的語音通訊或串流多媒體的聲音清晰度。

請參考第1圖，在步驟S10中，例如進行語音活動檢測(voice activity detection，VAD)，依據檢測到的聲音訊號以檢測環境雜訊。檢測到的聲音訊號例如是來自至少一麥克風(例如麥克風M1)的訊號，此訊號於通話的場合中(例如：電話、行動通訊或VoIP網路電話)需要上傳，而於聲音或多媒體重現之場合中此訊號則不需上傳。在步驟S20中，根據檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，其中第一聲音訊號的聲音清晰將得以增加，而第一聲音訊號例如是一下行語音訊號(例如SRx)，或來自訊號處理單元21、多媒體晶片或資料源的聲音訊號。在步驟S30中，依據雜訊資訊和第一聲音訊號從而輸出(例如增強或放大)一第二聲音訊號。然後，第二聲音訊號可被視為第一聲音訊號的一個聲音清晰度增加後的版本。在一些例子中，運算裝置利用揚聲器或耳機播放第二聲音訊號(得用數位或類比方式呈現)，或輸出第二聲音訊號以作其用途，例如由運算裝置錄音、由外部揚聲器重現、或透過運算裝置作無線廣播。

在一實施例中，步驟S30利用運算裝置依據雜訊資訊和第一聲音訊號且按照一可調的動態餘量(headroom)來增強第一聲音訊號從而輸出第二聲音訊號。在一些實施例中，雜訊資訊代表針對第一聲音訊號之檢測到的環境雜訊的度量水平。例如，在步驟S30中，可利用雜訊資訊例如訊雜比(SNR)、雜訊強度或其他雜訊度量以來增強第一聲音訊號。

如第1圖的方法所示，使用語音活動檢測從檢測到的聲音訊號中檢測出環境雜訊能有助於增加第一聲音訊號(例如是下行語音訊號SRx或欲重現的聲音訊號)的聲音清晰度。吾人應注意到，使用語音活動檢測而檢測到的環境雜訊的準確度能足以讓步驟S20提供可靠的雜訊資訊以用於後續如步驟S30之一例子中進行決定和放大動作。此外，這種方式避免了將語音或聲音誤判為環境雜訊之狀況，以及避免了在步驟S30之該例子中不合適或異常地增強或放大下行語音訊號之狀況。

例如，步驟S30可實施為：使得增強的下行語音訊號持續具有不大於一目標準位(例如3dB)的訊雜比(SNR)。若檢測到的環境雜訊之準位(記作Le)為-15dB，下行語音訊號之準位(記作Ld)為-30dB，則增強的下行語音訊號之訊號準位為Ld加上一數值Lg從而滿足此目標準位。

運算裝置的使用者在吵雜環境下通話時，縱使揚聲器的音量已增大，使用者仍然可能因為聲音清晰度的惡劣情況而感到不便。在最壞的情況下，過度驅動此放大的下行語音訊號可造成例如音頻元件或揚聲器的硬體損害。又此過度放大的下行語音訊號會帶來不悅的聆聽經驗或甚至傷害到使用者的聽覺。關於上述問題，為了訊號品質或保護行動裝置的硬體起見，在一些例子中，可以設計數值Lg在一動態餘量(headroom)之範圍內，而動態餘量亦即最大允許之增益的增量。動態餘量亦可定義為標稱(nominal)訊號值與最大無失真(undistorted)值之差值。例如，延續上述的數字上的例子，動態餘量可預定為10dB，使得放大的下行語音訊號可以增強至-5dB(即-15dB+10dB)。

但是，若放大的下行語音訊號的訊號準位大或接近最大準位(例如0dB)，則放大的下行語音訊號可能會失真。第4圖示意這種情況的例子：若檢測到的環境雜訊的準位Le為-2dB，而下行語音訊號的準位在時點t1以前為-9dB，又動態餘量預定為10dB的話，則可預期放大的下行語音訊號的準位將達到+1dB(即-9dB+10dB)。吾人應注意到：在數位域中，訊號準位是不允許超過最大訊號準位0dB的，故在上述情況下，放大的下行語音訊號會達到最大訊號準位而失真。如此將造成音頻元件或揚聲器的硬體損害，或帶來不悅的聆聽經驗或甚至傷害到使用者的聽覺。

故此，在其他實施例中，步驟S30可以利用可調的動態餘量來實施。例如，可按照一個或多個條件來調整動態餘量，或者動態地調整動態餘量。此外，可以設定動態餘量以避免訊號失真以至於對硬體或聽覺造成損害。

在一些例子中，可調的動態餘量依據第一聲音訊號的訊號準位而被調整，使得第二聲音訊號的訊號準位跟第一聲音訊號的訊號準位成線性或非線性比例，但仍然低於一截斷準位(clipping level)例如0dB。

例如，在步驟S30中，可利用具有不同數值的動態餘量來決定放大的下行語音訊號。當下行語音訊號的訊號準位(例如訊號能量準位)低於一門檻值(即並非接近最大準位)時，可調的動態餘量為一第一數值(例如10dB)；當下行語音訊號的訊號準位(例如-9dB)超過門檻值時，可調的動態餘量為一第二數值(例如5dB)，其中第二數值小於第一數值。請參考第4圖，當動態餘量小於第一數值如8dB時，放大的下行語音訊號的準位(記作Lb)為-1dB，其低於最大準位；如此，放大的下行語音訊號之準位如前述例子對於硬體和聽覺保護而言都是安全的，縱使在吵雜環境中，亦是如此。

在另一例子中，動態餘量可依據運算裝置2的音量控制水平而被調整。例如，當音量控制水平被改變時，利用代表音量控制水平的音量資料來通知訊號處理單元21。訊號處理單元21依據音量資料採用不同的動態餘量的數值以執行步驟S30。例如，若音量資料表示音量控制水平處於或低於一門檻值(例如中間或以上的準位)時，可設定動態餘量為一第一數值(例如10dB)。當音量資料表示音量控制水平處於或接近最大準位或超過門檻值時，可設定動態餘量為一第二數值(例如5dB)，其中第二數值小於第一數值。在其他例子中，可依據一個或多個條件，例如依據下行語音訊號準位和音量控制水平，來調整動態餘量。

在步驟S30的其他例子中，可針對不同頻帶來增強或放大第一聲音訊號。例如第5圖所示的一雜訊頻譜。為了維持足夠的訊雜比，可針對一個或多個頻帶以及人類聽覺對聲音清晰度的特性來增強或放大聲音訊號(例如是下行語音或源自例如檔案或串流視訊或聲音之聲音訊號)。在此例中，需要針對下行語音訊號中約500Hz的頻帶(記作 B1)和3kHz的頻帶(記作B2)進行增強或放大下行語音訊號。

請參考第3A圖，其繪示運算裝置中之一種增加語音清晰度的系統的實施例的方塊圖。此系統3回應欲增加語音清晰度的之一第一聲音訊號(例如第2圖中檢來自行動裝置的通訊單元23的下行語音訊號或來自處理單元25欲作聲音重現的訊號)以及運算裝置之至少一麥克風所檢測到的一聲音訊號，以輸出一第二聲音訊號至運算裝置的至少一揚聲器SK1。此系統3包括環境雜訊決定單元30和清晰度增加單元32。此系統3可實作為軟體或電路，或對訊號處理單元或一般處理器作程式化設定而實現。環境雜訊決定單元30可視作如第1圖所示的步驟S10之一實施例。清晰度增加單元32可視為如第1圖所示的步驟S20和S30之一實施例。

環境雜訊決定單元30包括前置處理模組301和雜訊估測模組303。前置處理模組301利用語音活動檢測模組3013來執行語音活動檢測，以決定麥克風M1檢測到的聲音訊號是否為聲音或雜訊。前置處理模組301更輸出決定結果至雜訊估測模組303。雜訊估測模組303回應此決定結果和來自前置處理模組301的聲音訊號以輸出一參考雜訊訊號S_RN ，其代表行動裝置所處的環境雜訊。也就是說，當檢測到的聲音訊號為雜訊時，雜訊估測模組303可輸出檢測到的環境雜訊。關於這個例子，多種等效的實施例列舉如下。在一實施例中，雜訊估測模組303可輸出來自前置處理模組301之檢測到的聲音訊號，並且輸出參考雜訊訊號S_RN ，參考雜訊訊號S_RN 指出環境雜訊和有助訊雜比估測的資訊。例如，若語音活動檢測模組3013指出此檢測到的聲音訊號代表使用者語音，雜訊估測模組303輸出夾帶一較低雜訊分數的參考雜訊訊號S_RN 。若此檢測到的聲音訊號代表雜訊，例如與某種聲音譬如小孩的叫喊相似時，雜訊估測模組303輸出夾帶一較高雜訊分數的參考雜訊訊號S_RN ，此雜訊分數較高用以通知後續處理階段(諸如訊雜比估測)可以忽略參考雜訊訊號S_RN 中的環境雜訊。在另一實施例中，可實現雜訊估測模組303為當語音活動檢測模組3013指出沒有語音活動或雜訊分數低於一特定門檻值時，雜訊估測模組303才輸出環境雜訊。如此，雜訊估測模組303可用其他方式實現，並不受限於此。

語音活動檢測模組3013可避免將語音或聲音誤判為環境雜訊之狀況，而且有助於適當地進行環境雜訊估測和有助於後續處理階段中適當地增強或放大第一聲音訊號。在一些例子中，可取能量準位門檻值作為語音活動檢測的條件。若訊號準位超過此能量準位門檻值，則可決定欲上傳的聲音訊號代表有語音活動。反之，若訊號準位低於此能量準位門檻值，則聲音訊號可視為環境雜訊。在其他例子中，語音活動檢測模組3013可擷取檢測到的聲音訊號於頻域或時域上的聲音特徵從而決定語音活動。其中，可儲存諸如在辦公室或火車站中說話、走路等聲音的既定聲音特徵，以供決定語音活動時參考之用。又例如，語音活動檢測模組3013可實施為，以串列或並列方式輸出檢測到的聲音訊號以及語音活動檢測的決定結果(例如雜訊分數，或語音或雜訊的指示)。

此外，前置處理模組301更可在語音活動檢測模組3013之前利用回音消除模組3011以執行回音消除處理，從而獲得更準確的語音活動檢測的決定結果。例如可利用時域適應性(adaptive)濾波器以實現回音消除模組3011的回音消除處理，又回音消除模組3011輸出檢測到的聲音訊號的一個回音消除後的版本至語音活動檢測模組3013。

在其他例子中，環境雜訊決定單元30可對檢測到的聲音訊號進行雜訊頻譜檢測或估測從而檢測環境雜訊，其中雜訊頻譜檢測或估測可用以辨別語音和雜訊。

清晰度增加單元32包括訊雜比估測模組321、增益計算模組323、增強模組325。訊雜比估測模組321用以實現步驟S20以取得雜訊資訊。訊雜比估測模組321回應參考雜訊訊號S_RN 和第一聲音訊號例如下行語音訊號SRx以輸出雜訊資訊，例如第6圖中虛線N代表的頻域上的雜訊準位的曲線。增益計算模組323和增強模組325用以實現步驟S30以增強第一聲音訊號例如下行語音訊號SRx。增益計算模組323耦接於增強模組325和訊雜比估測模組321之間，增益計算模組323回應雜訊資訊和第一聲音訊號SRx以決定一或多個參數從而控制增強模組325以增強第一聲音訊號SRx。例如，增益計算模組323決定了：如第6圖所示，對於某些頻帶而言，第一聲音訊號SRx的訊號準位(記作Sg)小於環境雜訊的訊號準位N。由此，增益計算模組323決定需要對第一聲音訊號SRx中例如頻帶W1 進行增強處理，並且控制增強模組325增強第一聲音訊號SRx中已決定的頻帶，為聲音清晰度而維持足夠的訊雜比。已決定的頻帶例如第6圖所示的頻帶W1和W2之一個或多個頻帶。例如，增益計算模組323比較環境雜訊的雜訊準位與第一聲音訊號SRx的訊號準位以決定用以控制增強模組325的決定結果，其中決定結果更可包括提供給增強模組325使用的訊號準位之一增量。

再者，前述關於步驟S30的例子可應用於實現增益計算模組323以決定一個或多個準位從而增強下行語音訊號之一個或多個頻帶。例如，增益計算模組323可按照一個或多個條件來調整其動態餘量，或者動態地調整其動態餘量。此外，動態餘量得以設定以避免對硬體或人類聽覺造成損害並且避免訊號失真。在一些例子中，增益計算模組323可從行動裝置的處理單元或其他元件取得音量資料，從而決定是否需要或如何調整動調餘量。

增強模組325以增加處理可利用等化或其加增強或放大技術而實現。

在一些實施例中，如第3A圖所示屬於系統3之一或多個的模組、單元及方塊，可以軟體程式碼、軟體模組或專屬電路(諸如晶片或晶片中的電路模組)實現，或是對訊號處理單元或可程式化晶片或一般處理器進行程式化設定來實現。例如，可利用例如單核或多核的處理器來實現系統3，處理器諸如應用處理器、數位訊號處理器、特殊應用積體電路(ASIC，Application Specific Integrated Circuit)或元件可程式邏輯閘陣列(FPGA，Field Programmable Gate Array)，其可設計用來執行如第3A圖中系統3的操作(或如第1圖中的方法)之用。

請參考第3B圖，其繪示清晰度增加單元的另一實施的方塊圖。第3B圖的清晰度增加單元42相較於第3A圖，在用以重現一第一聲音訊號(例如記作SRx)的路徑上，更包括前置處理模組420。前置處理模組420回應第一聲音訊號，若第一聲音訊號代表欲求的語音或聲音，前置處理模組420輸出經前置處理的第一聲音訊號，以供後續處理階段放大之用。例如，若第一聲音訊號在通話中的某時段代表並非語音或代表雜訊，這種並非欲求訊號是不需要放大，或可將之過濾掉。在一些實施例中，前置處理模組420可包括前述例子中的語音活動檢測模組或雜訊估測模組之一者或兩者。又一些實施例中，若第一聲音訊號代表欲求的語音或聲音，前置處理模組420可輸出一個或多個控制訊號或指示資料至清晰度增加單元42之一個或多個模組，以使經前置處理的第一聲音訊號為後續處理階段所放大。

再者，其他實施例更揭露一種電腦或運算裝置可讀式資訊儲存媒體，其上儲存有程式碼或一個或多個程式模組。此程式碼之執行能實現上如第1圖之增加語音清晰度的方法，或實現如第3A或3B圖之系統3。這些實施例的可讀式資訊儲存媒體比如但不受限於：光學式資訊儲存媒體，磁式資訊儲存媒體或記憶體，如記憶卡、靭體或ROM或RAM、或其專屬於或嵌入於可程式晶片諸如數位訊號處理器或一般處理器之記憶體。

綜上所述，雖然以實施例揭露如上，然其並非用以限定本案之實施方式。本揭露所屬技術領域中具有通常知識者，在不脫離本揭露之精神和範圍內，當可作各種之更動與潤飾。因此，本案之保護範圍當視後附之申請專利範圍所界定者為準。

2‧‧‧行動裝置

3‧‧‧系統

21‧‧‧訊號處理單元

23‧‧‧通訊單元

25‧‧‧處理單元

30‧‧‧環境雜訊決定單元

32、42‧‧‧清晰度增加單元

301‧‧‧前置處理模組

303‧‧‧雜訊估測模組

321‧‧‧訊雜比估測模組

323‧‧‧增益計算模組

325‧‧‧增強模組

420‧‧‧前置處理模組

3011‧‧‧回音消除模組

3013‧‧‧語音活動檢測模組

M1‧‧‧麥克風

SK1‧‧‧揚聲器

第1圖繪示一種增加語音清晰度的方法的實施例的流程圖。

第2圖繪示一種運算裝置之實施例的方塊圖。

第3A圖繪示運算裝置中之一種增加語音清晰度的系統的實施例的方塊圖。

第3B圖繪示運算裝置中之清晰度增加單元的另一實施例的方塊圖。

第4圖示意語音清晰度增加單元之運作的實施例。

第5圖示意針對下行語音的不同頻帶來增強下行語音的實施例。

第6圖繪示意使用訊雜比估測得到的雜訊資訊的實施例。

S10-S30‧‧‧步驟

Claims

一種增加語音清晰度的方法，該方法為運算裝置所使用，該方法包括：對該運算裝置之至少一麥克風所檢測到的一聲音訊號進行語音活動檢測從而檢測環境雜訊；根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊；以及利用該運算裝置依據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量(headroom)來增強該第一聲音訊號從而輸出一第二聲音訊號，其中該可調的動態餘量依據該第一聲音訊號的訊號準位而被調整，使得該第二聲音訊號的訊號準位低於一截斷準位並且跟該第一聲音訊號的訊號準位成比例。
如申請專利範圍第1項所述之增加語音清晰度的方法，其中該雜訊資訊代表針對該第一聲音訊號的該檢測到的環境雜訊的度量水平。
如申請專利範圍第1項所述之增加語音清晰度的方法，其中該檢測環境雜訊步驟包括：進行語音活動檢測以決定該檢測到的聲音訊號是否為雜訊；以及當該檢測到的聲音訊號代表雜訊時，輸出該檢測到的環境雜訊。
如申請專利範圍第1項所述之增加語音清晰度的方法，其中該檢測環境雜訊步驟包括：輸出該檢測到的聲音訊號的一回音消除後的版本；以及當該檢測到的聲音訊號代表雜訊時，輸出該檢測到的環境雜訊；其中對該檢測到的聲音訊號的該回音消除後的版本進行該語音活動檢測以決定該檢測到的聲音訊號是否為雜訊。
如申請專利範圍第1項所述之增加語音清晰度的方法，更包括：對該第一聲音訊號進行一前置處理以決定該第一聲音訊號是否雜訊；其中在該輸出該第二聲音訊號的步驟中，若利用該前置處理決定該第一聲音訊號為雜訊，則不用增強該第一聲音訊號來輸出該第二聲音訊號。
如申請專利範圍第5項所述之增加語音清晰度的方法，其中利用語音活動檢測對該第一聲音訊號進行該前置處理。
如申請專利範圍第5項所述之增加語音清晰度的方法，其中利用雜訊估測對該第一聲音訊號進行該前置處理。
如申請專利範圍第1項所述之增加語音清晰度的方法，其中針對人類聽覺的至少一個頻帶來增強該第一聲音訊號以輸出該第二聲音訊號。
一種增加運算裝置之語音清晰度的裝置，包括：一環境雜訊決定單元，用以根據該運算裝置之至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊；一清晰度增加單元，耦接該環境雜訊決定單元，用以根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量(headroom)來增強該第一聲音訊號從而輸出一第二聲音訊號，其中該清晰度增加單元依據該第一聲音訊號的訊號準位以調整該可調的動態餘量，使得該第二聲音訊號的訊號準位低於一截斷準位並且跟該第一聲音訊號的訊號準位成比例。
如申請專利範圍第9項所述之增加運算裝置之語音清晰度的裝置，其中該雜訊資訊代表針對該第一聲音訊號的該檢測到的環境雜訊的度量水平。
如申請專利範圍第9項所述之增加運算裝置之語音清晰度的裝置，其中該環境雜訊決定單元包括：一前置處理模組，用以根據該檢測到的聲音訊號以輸出一聲音訊號，其包括：一語音活動檢測模組，用以決定該檢測到的聲音訊號是否為雜訊並且輸出決定結果；以及一雜訊估測模組，回應該前置處理模組的該決定結果和該聲音訊號以輸出一參考雜訊訊號。
如申請專利範圍第9項所述之增加運算裝置之語音清晰度的裝置，其中該清晰度增加單元包括：一訊雜比估測模組，回應該參考雜訊訊號和該第一聲音訊號，用以輸出該雜訊資訊；一增強模組；以及一增益計算模組，耦接於該增強模組和該訊雜比估測模組之間，回應該雜訊資訊和該第一聲音訊號，用以控制該增強模組以增強該第一聲音訊號。
如申請專利範圍第12項所述之增加運算裝置之語音清晰度的裝置，其中該清晰度增加單元更包括：一前置處理模組，用以決定該第一聲音訊號是否雜訊；其中若該前置處理模組決定該第一聲音訊號為雜訊，則該前置處理模組通知該增益計算模組以控制該增強模組不用增強該第一聲音訊號以輸出該第二聲音訊號。
如申請專利範圍第12項所述之增加運算裝置之語音清晰度的裝置，其中該前置處理模組對該第一聲音訊號進行語音活動檢測或雜訊估測以決定該第一聲音訊號是否雜訊。
一種運算裝置，包括：至少一麥克風；一處理單元，用以控制該運算裝置；一通訊單元；一訊號處理單元，耦接該處理單元和該通訊單元，用以增加該運算裝置的語音清晰度，包括：一環境雜訊決定單元，用以根據該運算裝置之該至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊；一清晰度增加單元，耦接該環境雜訊決定單元，用以根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量來增強該第一聲音訊號從而輸出一第二聲音訊號，其中該清晰度增加單元依據該第一聲音訊號的訊號準位以調整該可調的動態餘量，使得該第二聲音訊號的訊號準位低於一截斷準位並且跟該第一聲音訊號的訊號準位成比例。
如申請專利範圍第15項所述之運算裝置，其中該清晰度增加單元包括：一訊雜比估測模組，回應該參考雜訊訊號和該第一聲音訊號，用以輸出該雜訊資訊；一增強模組；以及一增益計算模組，耦接於該增強模組和該訊雜比估測模組之間，回應該雜訊資訊和該第一聲音訊號，用以控制該增強模組以增強該第一聲音訊號。
如申請專利範圍第16項所述之運算裝置，其中該清晰度增加單元更包括：一前置處理模組，用以決定該第一聲音訊號是否雜訊；其中若該前置處理模組決定該第一聲音訊號為雜訊，則該前置處理模組通知該增益計算模組以控制該增強模組不用增強該第一聲音訊號以輸出該第二聲音訊號。
如申請專利範圍第15項所述之運算裝置，其中該通訊單元輸出該第一聲音訊號至該訊號處理單元，該第一聲音訊號為用作語音通訊之下行聲音訊號。
如申請專利範圍第15項所述之運算裝置，其中該通訊單元依據一多媒體資料源以輸出該第一聲音訊號至該訊號處理單元。
如申請專利範圍第15項所述之運算裝置，其中該清晰度增加單元針對人類聽覺的至少一個頻帶來增強該第一聲音訊號以輸出該第二聲音訊號。
一種增加語音清晰度的方法，該方法為運算裝置所使用，該方法包括：對該運算裝置之至少一麥克風所檢測到的一聲音訊號進行語音活動檢測從而檢測環境雜訊；根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊；以及利用該運算裝置依據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量(headroom)來增強該第一聲音訊號從而輸出一第二聲音訊號，其中當該第一聲音訊號的訊號準位低於一門檻值時，該可調的動態餘量為一第一數值；當該第一聲音訊號的訊號準位超過該門檻值時，該可調的動態餘量為一第二數值，該第二數值小於該第一數值。
一種增加語音清晰度的方法，該方法為運算裝置所使用，該方法包括：對該運算裝置之至少一麥克風所檢測到的一聲音訊號進行語音活動檢測從而檢測環境雜訊；根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊；以及利用該運算裝置依據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量(headroom)來增強該第一聲音訊號從而輸出一第二聲音訊號，其中該可調的動態餘量依據該運算裝置的一音量控制水平而被調整，其中當該音量控制水平低於一門檻值時，該可調的動態餘量為一第一數值；當音量控制水平超過該門檻值時，該可調的動態餘量為一第二數值，該第二數值小於該第一數值。
一種增加運算裝置之語音清晰度的裝置，包括：一環境雜訊決定單元，用以根據該運算裝置之至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊；一清晰度增加單元，耦接該環境雜訊決定單元，用以根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量(headroom)來增強該第一聲音訊號從而輸出一第二聲音訊號，其中當該第一聲音訊號的訊號準位低於一門檻值時，該清晰度增加單元改變該可調的動態餘量為一第一數值；當該第一聲音訊號的訊號準位超過該門檻值時，該清晰度增加單元改變該可調的動態餘量為一第二數值，其中該第二數值小於該第一數值。
一種增加運算裝置之語音清晰度的裝置，包括：一環境雜訊決定單元，用以根據該運算裝置之至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊；一清晰度增加單元，耦接該環境雜訊決定單元，用以根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量(headroom)來增強該第一聲音訊號從而輸出一第二聲音訊號，其中該清晰度增加單元依據該運算裝置的一音量控制水平而調整該可調的動態餘量，其中當該音量控制水平低於一門檻值時，該清晰度增加單元改變該可調的動態餘量為一第一數值；當音量控制水平超過該門檻值時，該清晰度增加單元改變該可調的動態餘量為一第二數值，其中該第二數值小於該第一數值。
一種運算裝置，包括：至少一麥克風；一處理單元，用以控制該運算裝置；一通訊單元；一訊號處理單元，耦接該處理單元和該通訊單元，用以增加該運算裝置的語音清晰度，包括：一環境雜訊決定單元，用以根據該運算裝置之該至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊；一清晰度增加單元，耦接該環境雜訊決定單元，用以根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量來增強該第一聲音訊號從而輸出一第二聲音訊號，其中當該第一聲音訊號的訊號準位低於一門檻值時，該清晰度增加單元改變該可調的動態餘量為一第一數值；當該第一聲音訊號的訊號準位超過該門檻值時，該清晰度增加單元改變該可調的動態餘量為一第二數值，其中該第二數值小於該第一數值。
一種運算裝置，包括：至少一麥克風；一處理單元，用以控制該運算裝置；一通訊單元；一訊號處理單元，耦接該處理單元和該通訊單元，用以增加該運算裝置的語音清晰度，包括：一環境雜訊決定單元，用以根據該運算裝置之該至少一麥克風所檢測到的一聲音訊號從而檢測環境雜訊；一清晰度增加單元，耦接該環境雜訊決定單元，用以根據該檢測到的環境雜訊和一第一聲音訊號取得雜訊資訊，以及根據該雜訊資訊和該第一聲音訊號且按照一可調的動態餘量來增強該第一聲音訊號從而輸出一第二聲音訊號，其中該清晰度增加單元依據該運算裝置的一音量控制水平而調整該可調的動態餘量，其中當該音量控制水平低於一門檻值時，該清晰度增加單元改變該可調的動態餘量為一第一數值；當音量控制水平超過該門檻值時，該清晰度增加單元改變該可調的動態餘量為一第二數值，其中該第二數值小於該第一數值。