TWI622978B

TWI622978B - 語音信號處理裝置及語音信號處理方法

Info

Publication number: TWI622978B
Application number: TW106104067A
Authority: TW
Inventors: 杜博仁; 張嘉仁; 曾凱盟
Original assignee: 宏碁股份有限公司
Priority date: 2017-02-08
Filing date: 2017-02-08
Publication date: 2018-05-01
Also published as: US10297268B2; TW201830381A; US20180226087A1

Abstract

一種語音信號處理裝置及語音信號處理方法。依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，以提高聆聽聲音的舒適度以及語音信號的可辨識度。

Description

語音信號處理裝置及語音信號處理方法

本發明是有關於一種信號處理裝置，且特別是有關於一種語音信號處理裝置及語音信號處理方法。

一般對於聽障人士來說，其往往無法清楚地接收較高頻的語音信號，例如子音信號，但對於低頻的語音信號卻可以清楚地聽到。為使聽障人士可清楚地聽到語音信號，當判斷出語音信號為子音信號時，語音信號將被進行降頻處理，反之，若語音信號非子音信號，則不進行降頻處理。如此雖可幫助聽障人士更清楚地聽到語音信號，然當環境中的其它雜訊信號造成子音信號的判斷錯誤時，將使得原本應進行降頻處理的子音信號未被進行降頻處理。而當未被進行降頻處理的子音信號出現在前後的皆為進行降頻處理的子音信號時，聲音將出現斷斷續續的情形，而造成聽者的不適，嚴重時還可能影響到語音信號的可辨識度。

本發明提供一種語音信號處理裝置及語音信號處理方法，可有效改善因子音信號誤判而造成聲音斷斷續續的情形，而提高聽者聆聽聲音的舒適度以及語音信號的可辨識度。

本發明的語音信號處理裝置包括帶通濾波單元以及處理單元。帶通濾波單元對語音信號進行第一頻段以及第二頻段的帶通濾波，以分別產生第一帶通濾波信號以及第二帶通濾波信號，其中第一頻段以及第二頻段至少其中之一為子音頻段。處理單元耦接濾波單元，將語音信號、第一帶通濾波信號以及第二帶通濾波信號分割為多個音框，並計算此些音框中取樣信號的能量，以獲得對應此些音框的原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量，依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，其中目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的目標音框的子音信號判斷條件較目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的目標音框的子音信號判斷條件寬鬆，其中當目標音框的前一音框所對應的原始語音取樣信號為子音信號時，依據目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框所對應的原始語音取樣信號能量之間的第一比值，以及目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第二比值判斷目標音框所對應的原始語音取樣信號是否為子音信號。

在本發明的一實施例中，上述的處理單元更計算目標音框的過零率，當目標音框的前一音框所對應的原始語音取樣信號為子音信號時，處理單元更依據目標音框的過零率判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中當目標音框的過零率大於預設過零率、第一比值大於第一預設值且第二比值大於第二預設值時，目標音框所對應的原始語音取樣信號為子音信號。

在本發明的一實施例中，其中當目標音框的過零率大於預設過零率且第一比值大於第三預設值時，目標音框所對應的原始語音取樣信號為子音信號，其中第三預設值大於第一預設值。

在本發明的一實施例中，其中當目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號時，處理單元更依據目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第三比值判斷目標音框所對應的原始語音取樣信號是否為子音信號。

在本發明的一實施例中，上述的處理單元更計算目標音框的過零率，當目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號時，處理單元更依據目標音框的過零率判斷目標音框所對應的原始語音取樣信號是否為子音信號，當目標音框的過零率大於預設過零率、第一比值大於第一預設值、第二比值小於第二預設值且第三比值小於第三預設值時，目標音框所對應的原始語音取樣信號為子音信號，其中第二預設值與第三預設值小於等於1。

在本發明的一實施例中，上述的處理單元更計算目標音框的過零率，當目標音框的前一音框所對應的原始語音取樣信號不為子音信號時，處理單元依據目標音框的過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和以及目標音框所對應的第二頻段信號能量與原始語音取樣信號能量之間的第三比值判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於第一預設能量且第三比值大於第一預設值，目標音框所對應的原始語音取樣信號為子音信號。

在本發明的一實施例中，其中當目標音框的前一音框所對應的原始語音取樣信號不為子音信號時，處理單元更依據第一比值判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於預設能量、第三比值大於第二預設值且第一比值大於第三預設值，目標音框所對應的原始語音取樣信號為子音信號，其中第一預設值大於第二預設值。

在本發明的一實施例中，上述第二頻段高於第一頻段。

本發明的語音信號處理方法包括下列步驟：對語音信號進行第一頻段以及第二頻段的帶通濾波，以分別產生第一帶通濾波信號以及第二帶通濾波信號，其中第一頻段以及第二頻段至少其中之一為子音頻段；將語音信號、第一帶通濾波信號以及第二帶通濾波信號分割為多個音框；計算此些音框中取樣信號的能量，以獲得對應此些音框的原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量；以及依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，其中目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的目標音框的子音信號判斷條件較目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的目標音框的子音信號判斷條件寬鬆，其中當目標音框的前一音框所對應的原始語音取樣信號為子音信號時，依據目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框所對應的原始語音取樣信號能量之間的第一比值，以及目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第二比值判斷目標音框所對應的原始語音取樣信號是否為子音信號。

在本發明的一實施例中，上述的語音信號處理方法更包括下列步驟：計算目標音框的過零率；判斷目標音框的前一音框所對應的原始語音取樣信號是否為子音信號；以及若目標音框的前一音框所對應的原始語音取樣信號為子音信號，更依據目標音框的過零率判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中當目標音框的過零率大於預設過零率、第一比值大於第一預設值且第二比值大於第二預設值時，目標音框所對應的原始語音取樣信號為子音信號。

在本發明的一實施例中，當目標音框的過零率大於預設過零率且第一比值大於第三預設值時，目標音框所對應的原始語音取樣信號為子音信號，其中第三預設值大於第一預設值。

在本發明的一實施例中，上述的語音信號處理方法更包括：判斷目標音框的前兩個音框所對應的原始語音取樣信號是否皆為子音信號：以及若目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號，更依據目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的一第三比值判斷目標音框所對應的原始語音取樣信號是否為子音信號。

在本發明的一實施例中，上述的語音信號處理方法，更包括下列步驟：計算目標音框的過零率；判斷目標音框的前兩個音框所對應的原始語音取樣信號是否皆為子音信號；以及若目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號，更依據目標音框的過零率判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中當目標音框的過零率大於預設過零率、第一比值大於一第一預設值、第二比值小於第二預設值且第三比值小於第三預設值時，目標音框所對應的原始語音取樣信號為子音信號，其中第二預設值與第三預設值小於等於1。

在本發明的一實施例中，上述的語音信號處理方法更包括下列步驟：計算目標音框的過零率；判斷目標音框的前一音框所對應的原始語音取樣信號是否為子音信號；以及若目標音框的前一音框所對應的原始語音取樣信號不為子音信號，依據目標音框的過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和以及目標音框所對應的第二頻段信號能量與原始語音取樣信號能量之間的第三比值判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於預設能量且第三比值大於第一預設值，目標音框所對應的原始語音取樣信號為子音信號。

在本發明的一實施例中，其中若目標音框的前一音框所對應的原始語音取樣信號不為子音信號，語音信號處理方法更包括：依據目標音框的過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和、第三比值以及第一比值判斷目標音框所對應的原始語音取樣信號是否為子音信號，其中若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於預設能量、第三比值大於第二預設值且第一比值大於第三預設值，目標音框所對應的原始語音取樣信號為子音信號，其中第一預設值大於第二預設值。

在本發明的一實施例中，上述第二頻段高於第一頻段。

基於上述，本發明的實施例依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，其中目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的目標音框的子音信號判斷條件較目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的目標音框的子音信號判斷條件寬鬆。如此依據目標音框之前的音框來調整子音信號判斷條件，可有效改善因子音信號誤判而造成聲音斷斷續續的情形，而提高聽者聆聽聲音的舒適度以及語音信號的可辨識度。

為讓本發明的上述特徵和優點能更明顯易懂，下文特舉實施例，並配合所附圖式作詳細說明如下。

102‧‧‧濾波單元

104‧‧‧處理單元

SF1~SFN‧‧‧濾波信號

S1‧‧‧語音信號

S2‧‧‧第一帶通濾波信號

S3‧‧‧第二帶通濾波信號

S4‧‧‧低通濾波信號

S202~S218、S302~S304‧‧‧語音辨識方法的步驟

圖1是依照本發明一實施例之語音信號處理裝置的示意圖。

圖2是依照發明一實施例之語音信號處理方法的流程示意圖。

圖3是依照發明另一實施例之語音信號處理方法的流程示意圖。

圖1是依照本發明一實施例之語音信號處理裝置的示意圖，請參照圖1。語音信號處理裝置包括濾波單元102以及處理單元104，濾波單元102耦接處理單元104。濾波單元102可對語音信號S1進行低通濾波以及第一頻段、第二頻段的帶通濾波，以分別產生低通濾波信號S4、第一帶通濾波信號S2以及第二帶通濾波信號S3。其中濾波單元102可例如包括低通濾波器與帶通濾波器，而處理單元104可例如以中央處理單元來實施，然不以此為限，另外第一頻段以及第二頻段至少其中之一為子音頻段。舉例來說，在本實施例中，低通濾波的切斷頻率為0~2kHz，而第一頻段以及第二頻段分別為2kHz~4kHz以及4kHz~12kHz，然不以此為限。

處理單元104可對語音信號S1、第一帶通濾波信號S2以及第二帶通濾波信號S3進行取樣，並將語音信號S1、第一帶通濾波信號S2以及第二帶通濾波信號S3分割為多個音框，其中各個音框可包括N個語音信號S1的取樣信號、N個第一帶通濾波信號S2的取樣信號以及N個第二帶通濾波信號S3的取樣信號，其中N為正整數。處理單元104還可計算各個音框中取樣信號的能量，以獲得原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量，其中原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量分別對應音框中語音信號S1的取樣信號、第一帶通濾波信號S2的取樣信號以及第二帶通濾波信號S3 的取樣信號的能量。

在獲得原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量後，處理單元104便可依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，其中目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的目標音框的子音信號判斷條件較目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的目標音框的子音信號判斷條件寬鬆。進一步來說，當目標音框的前一音框所對應的原始語音取樣信號為子音信號時，處理單元104可依據目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框所對應的原始語音取樣信號能量之間的第一比值，以及目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第二比值，來判斷目標音框所對應的原始語音取樣信號是否為子音信號。在部分實施例中，處理單元104還可計算目標音框的過零率，並進一步依據目標音框的過零率判斷目標音框所對應的原始語音取樣信號是否為子音信號。

而當目標音框的前一音框所對應的原始語音取樣信號不為子音信號時，處理單元則可依據目標音框的過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和、目標音框所對應的第二頻段信號能量與原始語音取樣信號能量之間的比值以及上述的第一比值，來判斷目標音框所對應的原始語音取樣信號是否為子音信號。其中若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於第三預設值且第一比值大於第四預設值，目標音框所對應的原始語音取樣信號為子音信號，其中第二預設值大於第三預設值。

如依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，使目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的目標音框的子音信號判斷條件較目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的目標音框的子音信號判斷條件寬鬆，便可有效改善因子音信號誤判而造成聲音斷斷續續的情形，而提高聽者聆聽聲音的舒適度以及語音信號的可辨識度。

舉例來說，當目標音框的前一音框所對應的原始語音取樣信號為子音信號時，處理單元104判斷對應一目標音框(例如第m個音框，m為正整數)的原始語音取樣信號是否為子音信號的方式，可以下列式子來判斷：

其中，當代表對應第m個音框的原始語音取樣信號為子音信號，而當代表對應第m個音框的原始語音取樣信號不為子音信號。也就是說，只要為1，且和其中一個為1，即判斷對應第m個音框的原始語音取樣信號為子音信號。另外、、則可分別以下列式子表示：

其中為第m個音框的過零率，Z _TH1為預設過零率，其可例如設定為20，然不以此為限。另外，EB1_m為第m個音框的第一頻段信號能量、EB2_m為第m個音框的第二頻段信號能量，EB1_m-1為第m-1個音框的第一頻段信號能量、EB2_m-1為第m-1個音框的第二頻段信號能量，而E _m為第m個音框的原始語音取樣信號能量，γ ₁為第一預設值，γ ₂為第二預設值，γ ₃為第三預設值，其中γ ₃大於γ ₁，例如在本實施例中，γ ₃可為0.75，γ ₁可為0.6，然不以此為限。此外，γ ₂值可依設計者的需求設定，例如在本實施例中，例如在本實施例中，γ ₂值可為0.8，然不以此為限，例如在其他實施例中，γ ₂值亦可為1.1、1、0.9或0.7。

此外，當目標音框的前一音框所對應的原始語音取樣信號不為子音信號時，處理單元104判斷對應第m個音框的原始語音取樣信號是否為子音信號的方式，可以下列式子來判斷：

類似地，當代表對應第m個音框的原始語音取樣信號為子音信號，而當代表對應第m個音框的原始語音取樣信號不為子音信號。也就是說，只要為1，且和其中一個為1，即判斷對應第m個音框的原始語音取樣信號為子音信號。另外、、則可分別以下列式子表示：

其中E _TH為預設能量，其可例如設定為24，然不以此為限。為第m個音框的過零率，Z _TH為預設過零率，其可例如設定為22，然不以此為限。另外，α ₁為第四預設值，α ₂為第五預設值，α ₃為第六預設值，其中α ₁大於α ₂，例如在本實施例中，α ₁可為0.8，α ₂可為0.35，然不以此為限。此外，α ₃值可依設計者的需求設定，例如在本實施例中，例如在本實施例中，α ₃值可為1，然不以此為限。

值得注意的是，上述預設能量與預設值的設定值僅為示範性的實施例，本發明並不以上述所舉數值為限，只要是預設能量與預設值的設定可使第m-1個音框所對應的原始語音取樣信號為子音信號時所對應的子音信號判斷條件較第m-1個音框所對應的原始語音取樣信號不為子音信號時所對應的子音信號判斷條件寬鬆，皆可做為本發明的預設能量與預設值。

此外，在部分實施例中，處理單元104亦可依據目標音框之前的多個音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，以進一步避免子音信號的誤判。舉例來說，當目標音框(第m個音框)的前兩個音框(第m-1個音框以及第m-2個音框)所對應的原始語音取樣信號皆為子音信號時，處理單元可依據第m-1個音框所對應的第一頻段信號能量以及第二頻段信號能量的和與第m-2個音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的比值來判斷第m個音框所對應的原始語音取樣信號是否為子音信號，也就是說，上述可改以下列式子表示：

其中k ₁為第七預設值，k ₂為第八預設值，k ₃為第九預設值，其中k ₁小於上述式(4)的γ ₁，k ₁可例如為0.5，然不以此為限，其可依設計者的需求設定。k ₂與k ₃則可例如設定為小於等於1的值，然亦不以此為限。以此類推，亦可依據目標音框之前的更多個音框所對應的原始語音取樣信號來判斷目標音框是否為子音信號。其判斷方式類似於依據目標音框之前的2個音框所對應的原始語音取樣信號進行子音信號判斷的方式，因此在此不再贅述。

圖2是依照本發明一實施例之語音信號處理方法的流程示意圖，請參照圖2。由上述實施例可知，語音辨識裝置的語音辨識方法可包括下列步驟。首先，對語音信號進行第一頻段以及第二頻段的帶通濾波，以分別產生第一帶通濾波信號以及第二帶通濾波信號，其中第一頻段以及第二頻段至少其中之一為子音頻段(步驟S202)。接著，將語音信號、第一帶通濾波信號以及第二帶通濾波信號分割為多個音框(步驟S204)。然後，計算此些音框中取樣信號的能量，以獲得對應此些音框的原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量(步驟S206)。之後，判斷目標音框的前一音框所對應的原始語音取樣信號是否為子音信號(步驟S208)。若目標音框的前一音框所對應的原始語音取樣信號為子音信號，依據目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框所對應的原始語音取樣信號能量之間的第一比值，以及目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第二比值，來判斷目標音框所對應的原始語音取樣信號是否為子音信號(步驟S210)。

在部分實施例中，步驟S210可如圖2所示包括，可先計算目標音框的過零率(步驟S212)，然後再依據目標音框的過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框所對應的原始語音取樣信號能量之間的第一比值，以及目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第二比值，來判斷目標音框所對應的原始語音取樣信號是否為子音信號(步驟S214)。其中當目標音框的過零率大於預設過零率、第一比值大於第一預設值且第二比值大於第二預設值時，目標音框所對應的原始語音取樣信號為子音信號，另外，若目標音框的過零率大於預設過零率且第一比值大於第三預設值，亦判斷目標音框所對應的原始語音取樣信號為子音信號，其中第三預設值大於第一預設值。

另外，若在步驟S208判斷出目標音框的前一音框所對應的原始語音取樣信號不為子音信號，則可接著計算目標音框的過零率(步驟S216)，然後再依據目標音框的過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和以及目標音框所對應的第二頻段信號能量與原始語音取樣信號能量之間的第三比值、目標音框所對應的第一頻段信號能量與第二頻段信號能量的和以及上述的第一比值，來判斷目標音框所對應的原始語音取樣信號是否為子音信號(步驟S218)。其中若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於預設能量且上述的第三比值大於第四預設值，可將目標音框所對應的原始語音取樣信號判斷為子音信號。另外，若目標音框的過零率大於預設過零率、目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於預設能量、第三比值大於第五預設值且第一比值大於第六預設值，亦可將目標音框所對應的原始語音取樣信號判斷為子音信號，其中第四預設值大於第五預設值。

圖3是依照本發明另一實施例之語音信號處理方法的流程示意圖，請參照圖3。本實施例與圖2實施例的不同之處在於，在步驟S210可包括依據目標音框的前兩個音框所對應的原始語音取樣信號來調整子音信號判斷條件的步驟。如圖3所示，在步驟S212後，更判斷目標音框的前兩個音框所對應的原始語音取樣信號是否皆為子音信號(步驟S302)，若目標音框的前兩個音框所對應的原始語音取樣信號非皆為子音信號，可以圖2實施例的步驟S214進行子音信號的判斷。而若目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號，則可依據目標音框的過零率、目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和與目標音框的前一音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的第四比值判斷目標音框所對應的原始語音取樣信號是否為子音信號(步驟S304)。其中若目標音框的過零率大於預設過零率、上述的第一比值大於一第七預設值、上述的第二比值小於第八預設值且第四比值小於第九預設值時，可將目標音框所對應的原始語音取樣信號判斷為子音信號，其中第八預設值與第九預設值小於等於1

綜上所述，本發明的實施例依據目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整目標音框的子音信號判斷條件，其中目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的目標音框的子音信號判斷條件較目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的目標音框的子音信號判斷條件寬鬆。如此依據目標音框之前的音框來調整子音信號判斷條件，可有效改善因子音信號誤判而造成聲音斷斷續續的情形，而提高聽者聆聽聲音的舒適度以及語音信號的可辨識度。

雖然本發明已以實施例揭露如上，然其並非用以限定本發明，任何所屬技術領域中具有通常知識者，在不脫離本發明的精神和範圍內，當可作些許的更動與潤飾，故本發明的保護範圍當視後附的申請專利範圍所界定者為準。

Claims

一種語音信號處理裝置，包括：一帶通濾波單元，對一語音信號進行一第一頻段以及一第二頻段的帶通濾波，以分別產生一第一帶通濾波信號以及一第二帶通濾波信號，其中該第一頻段以及該第二頻段至少其中之一為子音頻段；以及一處理單元，耦接該濾波單元，將該語音信號、該第一帶通濾波信號以及該第二帶通濾波信號分割為多個音框，並計算該些音框中取樣信號的能量，以獲得對應該些音框的原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量，依據一目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整該目標音框的子音信號判斷條件，其中該目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的該目標音框的子音信號判斷條件較該目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的該目標音框的子音信號判斷條件寬鬆，該處理單元更計算該目標音框的過零率，其中當該目標音框的前一音框所對應的原始語音取樣信號為子音信號時，該處理單元依據該目標音框的過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與該目標音框所對應的原始語音取樣信號能量之間的一第一比值，以及該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與該目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的一第二比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中當該目標音框的過零率大於一預設過零率、該第一比值大於一第一預設值且該第二比值大於一第二預設值時，該目標音框所對應的原始語音取樣信號為子音信號。
如申請專利範圍第1項所述的語音信號處理裝置，其中當該目標音框的過零率大於該預設過零率且該第一比值大於一第三預設值時，該目標音框所對應的原始語音取樣信號為子音信號，其中該第三預設值大於該第一預設值。
如申請專利範圍第1項所述的語音信號處理裝置，其中當該目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號時，該處理單元更依據該目標音框的過零率、該目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和與該目標音框的前一音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的一第三比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中當該目標音框的過零率大於一預設過零率、該第一比值大於一第三預設值、該第二比值小於一第四預設值且該第三比值小於一第五預設值時，該目標音框所對應的原始語音取樣信號為子音信號，其中該第四預設值與該第五預設值小於等於1。
如申請專利範圍第1項所述的語音信號處理裝置，其中該處理單元更計算該目標音框的過零率，當該目標音框的前一音框所對應的原始語音取樣信號不為子音信號時，該處理單元依據該目標音框的過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和以及該目標音框所對應的第二頻段信號能量與原始語音取樣信號能量之間的一第三比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中若該目標音框的過零率大於一預設過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於一第一預設能量且該第三比值大於一第一預設值，該目標音框所對應的原始語音取樣信號為子音信號。
如申請專利範圍第4項所述的語音信號處理裝置，其中當該目標音框的前一音框所對應的原始語音取樣信號不為子音信號時，該處理單元更依據該第一比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中若該目標音框的過零率大於該預設過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於該預設能量、該第三比值大於一第二預設值且該第一比值大於一第三預設值，該目標音框所對應的原始語音取樣信號為子音信號，其中該第一預設值大於該第二預設值。
如申請專利範圍第1項所述的語音信號處理裝置，其中該第二頻段高於該第一頻段。
一種語音信號處理方法，包括：對一語音信號進行一第一頻段以及一第二頻段的帶通濾波，以分別產生一第一帶通濾波信號以及一第二帶通濾波信號，其中該第一頻段以及該第二頻段至少其中之一為子音頻段；將該語音信號、該第一帶通濾波信號以及該第二帶通濾波信號分割為多個音框；計算該些音框中取樣信號的能量，以獲得對應該些音框的原始語音取樣信號能量、第一頻段信號能量以及第二頻段信號能量；計算一目標音框的過零率；判斷該目標音框的前一音框所對應的原始語音取樣信號是否為子音信號；以及依據該目標音框的前一音框所對應的原始語音取樣信號是否為子音信號來調整該目標音框的子音信號判斷條件，其中該目標音框的前一音框所對應的原始語音取樣信號為子音信號時所對應的該目標音框的子音信號判斷條件較該目標音框的前一音框所對應的原始語音取樣信號不為子音信號時所對應的該目標音框的子音信號判斷條件寬鬆，其中當該目標音框的前一音框所對應的原始語音取樣信號為子音信號時，依據該目標音框的過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與該目標音框所對應的原始語音取樣信號能量之間的一第一比值，以及該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和與該目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的一第二比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中當該目標音框的過零率大於一預設過零率、該第一比值大於一第一預設值且該第二比值大於一第二預設值時，該目標音框所對應的原始語音取樣信號為子音信號。
如申請專利範圍第7項所述的語音信號處理方法，其中當該目標音框的過零率大於該預設過零率且該第一比值大於一第三預設值時，該目標音框所對應的原始語音取樣信號為子音信號，其中該第三預設值大於該第一預設值。
如申請專利範圍第7項所述的語音信號處理方法，更包括：判斷該目標音框的前兩個音框所對應的原始語音取樣信號是否皆為子音信號；以及若該目標音框的前兩個音框所對應的原始語音取樣信號皆為子音信號，更依據該目標音框的過零率、該目標音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和與該目標音框的前一音框的前一音框所對應的第一頻段信號能量以及第二頻段信號能量的和之間的一第三比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中當該目標音框的過零率大於一預設過零率、該第一比值大於一第三預設值、該第二比值小於一第四預設值且該第三比值小於一第五預設值時，該目標音框所對應的原始語音取樣信號為子音信號，其中該第四預設值與該第五預設值小於等於1。
如申請專利範圍第7項所述的語音信號處理方法，更包括：計算該目標音框的過零率；判斷該目標音框的前一音框所對應的原始語音取樣信號是否為子音信號；以及若該目標音框的前一音框所對應的原始語音取樣信號不為子音信號，依據該目標音框的過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和以及該目標音框所對應的第二頻段信號能量與原始語音取樣信號能量之間的一第三比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中若該目標音框的過零率大於一預設過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於一預設能量且該第三比值大於一第一預設值，該目標音框所對應的原始語音取樣信號為子音信號。
如申請專利範圍第10項所述的語音信號處理方法，其中若該目標音框的前一音框所對應的原始語音取樣信號不為子音信號，該語音信號處理方法更包括：依據該目標音框的過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和、該第三比值以及該第一比值判斷該目標音框所對應的原始語音取樣信號是否為子音信號，其中若該目標音框的過零率大於該預設過零率、該目標音框所對應的第一頻段信號能量以及第二頻段信號能量的和大於該預設能量、該第三比值大於一第二預設值且該第一比值大於一第三預設值，該目標音框所對應的原始語音取樣信號為子音信號，其中該第一預設值大於該第二預設值。
如申請專利範圍第7項所述的語音信號處理方法，其中該第二頻段高於該第一頻段。