TW201627989A - 語音辨識裝置及語音辨識方法 - Google Patents
語音辨識裝置及語音辨識方法 Download PDFInfo
- Publication number
- TW201627989A TW201627989A TW104102540A TW104102540A TW201627989A TW 201627989 A TW201627989 A TW 201627989A TW 104102540 A TW104102540 A TW 104102540A TW 104102540 A TW104102540 A TW 104102540A TW 201627989 A TW201627989 A TW 201627989A
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- energy
- sub
- original
- audio segment
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005070 sampling Methods 0.000 claims abstract description 69
- 238000001914 filtration Methods 0.000 claims description 15
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Abstract
一種語音辨識裝置及語音辨識方法。依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值判斷對應目標音框的原始語音取樣信號是否為雜訊。
Description
本發明是有關於一種辨識裝置,且特別是有關於一種語音辨識裝置及語音辨識方法。
一般對於聽障人士來說,其往往無法清楚地接收較高頻的語音信號,例如子音信號,但對於低頻的語音信號卻可以清楚地聽到。習知的子音信號判斷方式為在頻域中進行信號處理,判斷方式主要有兩種,非及時子音信號判斷和即時子音判斷。非及時子音信號判斷,主要透過能量和過零率來判斷。即時的子音信號判斷,主要是依據高頻信號與總能量的比例是否大於一固定的值以及低頻信號和總能量的比例是否小於固定的值來決定語音信號是否為子音信號。習知的子音信號判斷方式雖可區別子音信號與雜訊,然其準確度仍無法滿足實際的需求。
本發明提供一種語音辨識裝置及語音辨識方法,可有效地辨識出語音信號是否為子音信號。
本發明的語音辨識裝置,包括帶通濾波單元以及處理單元。其中帶通濾波單元對語音信號進行第一子音頻段以及第二子音頻段的帶通濾波,以分別產生第一帶通濾波信號以及第二帶通濾波信號。處理單元耦接帶通濾波單元,將語音信號、第一帶通濾波信號以及第二帶通濾波信號分割為多個音框,其中各音框包括N個取樣信號,N為正整數,處理單元更計算目標音框中取樣信號的能量,以獲得原始語音取樣信號能量、第一子音頻段信號能量以及第二子音頻段信號能量,依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值判斷對應目標音框的原始語音取樣信號是否為雜訊。
在本發明的一實施例中,上述處理單元判斷第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值是否分別落於對應的預設比值範圍,若第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值分別落於對應的預設比值範圍,則目標音框的原始語音取樣信號為雜訊信號。
在本發明的一實施例中,上述處理單元更計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框的能量加權平均值,以得到雜訊信號能量加權平均值,並依據目標音框所對應的原始語音取樣信號能量是否大於該雜訊信號能量加權平均值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述對應各個判斷為雜訊信號的原始語音取樣信號的音框的加權值隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。
在本發明的一實施例中,上述處理單元更依據第二子音頻段信號能量與原始語音取樣信號能量的比值以及第一子音頻段信號能量與原始語音取樣信號能量的比值之和是否大於等於預設和值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述處理單元更計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權平均值,以得到第一子音能量比例加權平均值,並依據目標音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值是否小於第一子音能量比例加權平均值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述對應各個被判斷為雜訊信
號的原始語音取樣信號的音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權值隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。
在本發明的一實施例中,上述處理單元更依據第二子音頻段信號能量與原始語音取樣信號能量的比值是否大於等於預設比值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述處理單元更依據原始語音取樣信號能量是否大於等於下限值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述處理單元更計算原始語音取樣信號的第一過零率、第二過零率以及第三過零率,並計算目標音框與目標音框之前的多個音框的原始語音取樣信號的平均過零率,以得到第一平均過零率、第二平均過零率以及第三平均過零率,並依據第一平均過零率、第二平均過零率以及第三平均過零率是否分別大於等於其對應的預設平均過零率來判斷目標音框所對應的原始語音取樣信號是否為子音信號,其中第一過零率、第二過零率以及第三過零率分別為在目標音框中原始語音取樣信號通過第一預設值、第二預設值以及第三預設值的次數,第二預設值小於第一預設值且大於第三預設值。
在本發明的一實施例中,上述處理單元更依據第二過零
率是否大於等於預設過零率來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
本發明的語音辨識方法包括下列步驟。對語音信號進行第一子音頻段以及第二子音頻段的帶通濾波,以分別產生第一帶通濾波信號與第二帶通濾波信號。將語音信號、第一帶通濾波信號與第二帶通濾波信號分為多個音框,其中各音框包括N個取樣信號,N為正整數。計算目標音框中取樣信號的能量,以獲得原始語音取樣信號能量、第一子音頻段信號能量以及第二子音頻段信號能量。依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值判斷對應目標音框的原始語音取樣信號是否為雜訊。
在本發明的一實施例中,上述語音辨識方法更包括下列步驟。判斷第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值是否分別落於對應的預設比值範圍。若第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值分別落於對應的預設比值範圍,則目標音框的原始語音取樣信號為雜訊信號。
在本發明的一實施例中,上述語音辨識方法更包括下列
步驟。計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框的能量加權平均值,以得到雜訊信號能量加權平均值。依據目標音框所對應的原始語音取樣信號能量是否大於雜訊信號能量加權平均值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述對應各個被判斷為雜訊信號的原始語音取樣信號的音框的加權值隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。
在本發明的一實施例中,上述語音辨識方法更包括,依據第二子音頻段信號能量與原始語音取樣信號能量的比值以及第一子音頻段信號能量與原始語音取樣信號能量的比值之和是否大於等於預設和值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述語音辨識方法更包括下列步驟。計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權平均值,以得到第一子音能量比例加權平均值。依據目標音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值是否小於第一子音能量比例加權平均值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述對應各個被判斷為雜訊信
號的原始語音取樣信號所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權值隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。
在本發明的一實施例中,上述語音辨識方法更包括,依據第二子音頻段信號能量與原始語音取樣信號能量的比值是否大於等於預設比值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述語音辨識方法更包括,依據原始語音取樣信號能量是否大於等於下限值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述語音辨識方法更包括下列步驟。計算原始語音取樣信號的第一過零率、第二過零率以及第三過零率,並計算目標音框與目標音框之前多N個音框的原始語音取樣信號的平均過零率,以得到第一平均過零率、第二平均過零率以及第三平均過零率,其中N為正整數,其中第一過零率、第二過零率以及第三過零率分別為在目標音框中原始語音取樣信號通過第一預設值、第二預設值以及第三預設值的次數,第二預設值小於第一預設值且大於第三預設值。依據第一平均過零率、第二平均過零率以及第三平均過零率是否分別大於等於其對應的預設平均過零率來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
在本發明的一實施例中,上述語音辨識方法更包括,依據第二過零率是否大於等於預設過零率來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
基於上述,本發明的實施例依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值判斷對應目標音框的原始語音取樣信號是否為雜訊,以減低將原始語音取樣信號誤判為子音信號的情形發生,進而提高子音信號的辨識準確度。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
102‧‧‧帶通濾波單元
104‧‧‧處理單元
S1‧‧‧語音信號
S2‧‧‧第一帶通濾波信號
S3‧‧‧第二帶通濾波信號
S202~S230、S302‧‧‧語音辨識方法的流程步驟
圖1繪示為本發明一實施例之語音辨識裝置的示意圖。
圖2A~2B繪示本發明一實施例之語音辨識方法的流程示意圖。
圖3A~3B繪示本發明另一實施例之語音辨識方法的流程示意圖。
圖1繪示為本發明一實施例之語音辨識裝置的示意
圖,請參照圖1。語音辨識裝置包括帶通濾波單元102以及處理單元104,帶通濾波單元102耦接處理單元104,帶通濾波單元102可例如以帶通濾波器來實施,而處理單元104可例如以中央處理單元來實施,然不以此為限。帶通濾波單元102可對語音信號S1進行第一子音頻段以及第二子音頻段的帶通濾波,以分別產生第一帶通濾波信號S2以及第二帶通濾波信號S3,在本實施例中第一子音頻段以及第二子音頻段分別為2kHz~4kHz以及4kHz~10kHz,然不以此為限。
處理單元104可對語音信號S1、第一帶通濾波信號S2以及第二帶通濾波信號S3進行取樣,並將語音信號S1、第一帶通濾波信號S2以及第二帶通濾波信號S3分個為多個音框,其中各個音框可包括N個語音信號S1的取樣信號、N個第一帶通濾波信號S2的取樣信號以及N個第二帶通濾波信號S3的取樣信號。處理單元104還可計算各個音框中取樣信號的能量,以獲得原始語音取樣信號能量、第一子音頻段信號能量以及第二子音頻段信號能量,其中原始語音取樣信號能量、第一子音頻段信號能量以及第二子音頻段信號能量分別對應音框中語音信號S1的取樣信號、第一帶通濾波信號S2的取樣信號以及第二帶通濾波信號S3的取樣信號的能量。在獲得原始語音取樣信號能量、第一子音頻段信號能量以及第二子音頻段信號能量後,處理單元104便可依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音
頻段信號能量與原始語音取樣信號能量的比值判斷對應各個音框的原始語音取樣信號是否為雜訊。
詳細來說,處理單元104可判斷第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值是否分別落於其對應的預設比值範圍,若第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值分別落於其對應的預設比值範圍,則目標音框的原始語音取樣信號為雜訊信號。
舉例來說,處理單元104判斷對應一目標音框(例如第m個音框,m為正整數)的原始語音取樣信號是否為雜訊的方式,可以下列式子來判斷:
其中EB1 m 為第一子音頻段信號能量、EB2 m 為第二子音頻段信號能量,而E m 為原始語音取樣信號能量,當式(1)、(2)、(3)皆滿足時,處理單元104判斷第m個音框的原始語音取樣信號為雜訊信號。
在判斷出目標音框的原始語音取樣信號為雜訊信號後,處理單元104還計算在目標音框之前被判斷為雜訊信號的原始語音取樣信號的多個音框的能量加權平均值,以得到雜訊信號能量加權平均值,並依據目標音框所對應的原始語音取樣信號能量是否大於雜訊信號能量加權平均值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。
舉例來說,雜訊信號能量加權平均值可為計算在目標音框之前被判斷為雜訊信號的原始語音取樣信號的3個音框的能量加權平均值而得到,假設在第m個音框之前,最近被判斷為雜訊的三個音框分別為第m-10個音框、第m-12個音框以及第m-20個音框,則對應第m個音框的雜訊信號能量加權平均值AK m 可如下式子所示:
其中E m-10、E m-12、E m-20分別為第m-10個音框、第m-12個音框以及第m-20個音框的原始語音取樣信號能量,而a0、a1、a2分別為第m-10個音框、第m-12個音框以及第m-20個音框對應的加權值。其中加權值a0、a1、a2可為固定值亦或是變動值。舉例來說,對應各個被判斷為雜訊信號的原始語音取樣信號的音框的加權值可隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。如在本實施例中,加權值a0、a1、a2可隨音框與第m個音框之間的間隔長短不同而改變。當雜訊信號能量加權平均值AK m 滿足下列式子時,可判斷對應第
m個音框的原始語音取樣信號為子音信號:E m >AK m (5)
另外,處理單元可計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權平均值,以得到第一子音能量比例加權平均值,並依據目標音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值是否小於第一子音能量比例加權平均值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。舉例來說,第一子音能量比例加權平均值可為計算在目標音框之前被判斷為雜訊信號的原始語音取樣信號的3個音框的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權平均值而得到,假設在第m個音框之前,最近被判斷為雜訊的三個音框分別為第m-10個音框、第m-12個音框以及第m-20個音框,則對應第m個音框的第一子音能量比例加權平均值AF m 可如下式子所示:
其中EB1 m-10、EB1 m-12、EB1 m-20分別為第m-10個音框、第m-12個音框以及第m-20個音框的第一子音頻段信號能量、E m-10、E m-12、E m-20分別為第m-10個音框、第m-12個音框以及第m-20個音框的原始語音取樣信號能量,而c0、c1、c2分別為第m-10個音框、第m-12個音框以及第m-20個音框對應的加權值。其中加權值c0、
c1、c2可為固定值亦或是變動值。舉例來說,對應各個被判斷為雜訊信號的原始語音取樣信號的音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權值可隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。如在本實施例中,加權值c0、c1、c2可隨音框與第m個音框之間的間隔長短不同而改變。當第一子音能量比例加權平均值AF m 滿足下列式子時,可判斷對應第m個音框的原始語音取樣信號為子音信號:
此外,處理單元104可依據第二子音頻段信號能量與原始語音取樣信號能量的比值與第一子音頻段信號能量與原始語音取樣信號能量的比值之和是否大於等於預設和值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。例如,對第m個音框而言,上述判斷方式可以下列式子表示:
在本實施例中,預設和值為1,然並不以此為限,預設和值亦可依實際情形調整為其他值。
又,處理單元104亦可依據第二子音頻段信號能量與原始語音取樣信號能量的比值是否大於等於預設比值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。例如,對第m個音框而言,上述判斷方式可以下列式子表示:
在本實施例中,預設比值為0.8,然不以此為限,在部分實施例中預設比值亦可為其他值,如下式所示:
在式(7)中,預設比值為0.35。
另外,處理單元104還可依據原始語音取樣信號能量是否大於等於下限值來判斷目標音框所對應的原始語音取樣信號是否為子音信號。例如,對第m個音框而言,上述判斷方式可以下列式子表示:
在本實施例中,下限值為50,然不以此為限,在部分實施例中下限值亦可依實際情形進行調整。
由於子音訊號可能會有能量大小不同的情形出現,在能量比較小的部分會可能會被視為雜訊,為避免此情形,除了上述依據能量來判斷原始語音取樣信號是否為子音信號外,處理單元104亦可依據過零率來判斷原始語音取樣信號是否為子音信號。處理單元104可計算原始語音取樣信號的第一過零率、第二過零率以及第三過零率,並計算目標音框與目標音框之前的多個音框的原始語音取樣信號的平均過零率,以得到第一平均過零率、第二平均過零率以及第三平均過零率,並依據第一平均過零率、第二平均過零率以及第三平均過零率是否分別大於等於其對應的預設平均過零率來
判斷目標音框所對應的原始語音取樣信號是否為子音信號。其中第一過零率、第二過零率以及第三過零率分別為在目標音框中原始語音取樣信號通過第一預設值、第二預設值以及第三預設值的次數,其中第二預設值小於第一預設值且大於第三預設值。
對第m個音框而言,原始過零率可如下式所示:
其中N為正整數,其代表在第m個音框內之取樣信號的個數,mL為幅度門檻值,而為在第m個音框內的原始語音取樣信號。處理單元104可依據是否大於等於一預設過零率來判斷原始語音取樣信號是否為子音信號,例如可依據下式來判斷:
其中預設過零率並不以22為限,在部分實施例中其值亦可依實際情形進行調整。此外,處理單元104可另外依據原始語音取樣信號包含能量條件的過零率、來判斷原始語音取樣信號是否為子音信號,過零率、可如下式所示:
其中、可以下式表示:
在本實施例中,α x 之值為0.5,然不以此為限,在部分實施例中其值亦可依實際情形進行調整。如此藉由調整計算過零率的基準,可更精確地判斷原始語音取樣信號是否為子音信號。處理單元104更可依據多個音框的平均過零率來判斷原始語音取樣信號是否為子音信號,舉例來說,對第m個音框而言,可依據其與最近兩個音框(亦即第m-1、m-2個音框)的過零率的平均值來判斷原始語音取樣信號是否為子音信號,其判斷式可如下所示:
如上實施例所述,處理單元104可依據能量或過零率至少之其一來判斷原始語音取樣信號是否為子音信號,亦即處理單元104可綜合上述式子的條件至少其一來判斷對應目標音框的原始語音取樣信號是否為子音信號。舉例來說,處理單元104可判斷式(5)、(7)、(9)、(11)、(13)、(18)、(19)、(20)是否同時滿足,若同時滿足才判斷對應目標音框的原始語音取樣信號為子音信號。又例如,處理單元104亦可判斷式(5)、(8)、(10)、(11)、(13)、(18)、(19)、(20)是否同時滿足,若同時滿足才判斷對應目標音框的原始語音取樣信號為子音信號。
圖2A~2B繪示本發明一實施例之語音辨識方法的流程示意圖,請參照圖2A~2B。由上述實施例可知,語音辨識裝置的語音辨識方法可包括下列步驟。首先,對語音信號進行第一子音頻
段以及第二子音頻段的帶通濾波,以分別產生第一帶通濾波信號與第二帶通濾波信號(步驟S202)。接著,將語音信號、第一帶通濾波信號與第二帶通濾波信號分為多個音框(步驟S204),其中各音框包括N個取樣信號,N為正整數。然後,計算目標音框中取樣信號的能量,以獲得一原始語音取樣信號能量、一第一子音頻段信號能量以及一第二子音頻段信號能量(步驟S206)。之後,依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值判斷對應目標音框的原始語音取樣信號是否為雜訊(步驟S208)。例如,可判斷第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值是否分別落於對應的預設比值範圍,若第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語音取樣信號能量的比值分別落於對應的預設比值範圍,則目標音框的原始語音取樣信號為雜訊信號。
之後,計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框的能量加權平均值,以得到雜訊信號能量加權平均值(步驟S210)。然後判斷目標音框所對應的原始語音取樣信號能量是否大於雜訊信號能量加權平均值(步驟S212),其中對應各個被
判斷為雜訊信號的原始語音取樣信號的音框的加權值可隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。若目標音框所對應的原始語音取樣信號能量未大於雜訊信號能量加權平均值,則判斷目標音框所對應的原始語音取樣信號非子音信號(步驟S214)。相反地,若目標音框所對應的原始語音取樣信號能量大於雜訊信號能量加權平均值,則計算多個之前被判斷為雜訊信號的原始語音取樣信號所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權平均值,以得到第一子音能量比例加權平均值(步驟S216)。然後再判斷目標音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值是否小於第一子音能量比例加權平均值(步驟S218),其中對應各個被判斷為雜訊信號的原始語音取樣信號所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值的加權值隨對應各個被判斷為雜訊信號的原始語音取樣信號的音框與目標音框之間的間隔長短不同而改變。
若目標音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值未小於第一子音能量比例加權平均值,則目標音框所對應的原始語音取樣信號非子音信號(步驟S214)。相反地,若目標音框所對應的第一子音頻段信號能量與原始語音取樣信號能量的比值小於第一子音能量比例加權平均值,則接著判斷第二子音頻段信號能量與原始語音取樣信號能量的比值是否大於等於預設比值(步驟S220)。若第二子音頻段信號能量與原始語音
取樣信號能量的比值未大於等於預設比值,則目標音框所對應的原始語音取樣信號非子音信號(步驟S214)。相反地,若第二子音頻段信號能量與原始語音取樣信號能量的比值大於等於預設比值,則判斷原始語音取樣信號能量是否大於等於下限值(步驟S222)。若原始語音取樣信號能量未大於等於下限值,則目標音框所對應的原始語音取樣信號非子音信號(步驟S214)。
相反地,若原始語音取樣信號能量大於等於下限值,則接著計算原始語音取樣信號的第一過零率、第二過零率以及第三過零率,並計算目標音框與目標音框之前的多個音框的原始語音取樣信號的平均過零率,以得到一第一平均過零率、一第二平均過零率以及一第三平均過零率(步驟S224)。其中第一過零率、第二過零率以及第三過零率分別為在目標音框中原始語音取樣信號通過第一預設值、第二預設值以及第三預設值的次數,其中第二預設值小於第一預設值且大於第三預設值。然後再判斷第一平均過零率、第二平均過零率以及第三平均過零率是否分別大於等於其對應的預設平均過零率(步驟S226)。若第一平均過零率、第二平均過零率以及第三平均過零率未皆大於等於其對應的預設平均過零率,則目標音框所對應的原始語音取樣信號非子音信號(步驟S214)。相反地,若第一平均過零率、第二平均過零率以及第三平均過零率大於等於其對應的預設平均過零率,則接著判斷第二過零率是否大於等於預設過零率(步驟S228)。若第二過零率未大於等於預設過零率,則目標音框所對應的原始語音取樣信號非子音
信號(步驟S214)。相反地,若第二過零率大於等於預設過零率,則目標音框所對應的原始語音取樣信號為子音信號(步驟S230)。
圖3A~3B繪示本發明一實施例之語音辨識方法的流程示意圖,請參照圖3A~3B。本實施例與圖2A~2B實施例的不同之處在於,本實施例在步驟S212判斷出目標音框所對應的原始語音取樣信號能量大於雜訊信號能量加權平均值後,接著判斷第二子音頻段信號能量與原始語音取樣信號能量的比值以及第一子音頻段信號能量與原始語音取樣信號能量的比值之和是否大於等於預設和值(步驟S302),若第二子音頻段信號能量與原始語音取樣信號能量的比值與第一子音頻段信號能量與原始語音取樣信號能量的比值之和未大於等於預設和值,則目標音框所對應的原始語音取樣信號非子音信號(步驟S214)。相反地,若第二子音頻段信號能量與原始語音取樣信號能量的比值與第一子音頻段信號能量與原始語音取樣信號能量的比值之和大於等於預設和值,則直接進入步驟S220,判斷第二子音頻段信號能量與原始語音取樣信號能量的比值是否大於等於預設比值,並如圖2A~2B實施例繼續執行後面語音辨識方法的步驟。
綜上所述,本發明的實施例可綜合上述式子的條件至少其一來判斷對應目標音框的原始語音取樣信號是否為子音信號,以提高子音信號的辨識準確度。例如可依據第一子音頻段信號能量與第二子音頻段信號能量的比值、第一子音頻段信號能量與原始語音取樣信號能量的比值以及第二子音頻段信號能量與原始語
音取樣信號能量的比值判斷對應目標音框的原始語音取樣信號是否為雜訊,以減低將原始語音取樣信號誤判為子音信號的情形發生,進而提高子音信號的辨識準確度。
102‧‧‧帶通濾波單元
104‧‧‧處理單元
S1‧‧‧語音信號
S2‧‧‧第一帶通濾波信號
S3‧‧‧第二帶通濾波信號
Claims (22)
- 一種語音辨識裝置,包括:一帶通濾波單元,對一語音信號進行一第一子音頻段以及一第二子音頻段的帶通濾波,以分別產生一第一帶通濾波信號以及一第二帶通濾波信號;以及一處理單元,耦接該帶通濾波單元,將該語音信號、該第一帶通濾波信號以及該第二帶通濾波信號分割為多個音框,其中各該音框包括N個取樣信號,N為正整數,計算目標音框中取樣信號的能量,以獲得一原始語音取樣信號能量、一第一子音頻段信號能量以及一第二子音頻段信號能量,依據該第一子音頻段信號能量與該第二子音頻段信號能量的比值、該第一子音頻段信號能量與該原始語音取樣信號能量的比值以及該第二子音頻段信號能量與該原始語音取樣信號能量的比值判斷對應該目標音框的原始語音取樣信號是否為雜訊。
- 如申請專利範圍第1項所述的語音辨識裝置,其中該處理單元更判斷該第一子音頻段信號能量與該第二子音頻段信號能量的比值、該第一子音頻段信號能量與該原始語音取樣信號能量的比值以及該第二子音頻段信號能量與該原始語音取樣信號能量的比值是否分別落於對應的預設比值範圍,若該第一子音頻段信號能量與該第二子音頻段信號能量的比值、該第一子音頻段信號能量與該原始語音取樣信號能量的比值以及該第二子音頻段信號能量與該原始語音取樣信號能量的比值分別落於對應的預設比值範 圍,則該目標音框的原始語音取樣信號為雜訊信號。
- 如申請專利範圍第1項所述的語音辨識裝置,其中該處理單元更計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框的能量加權平均值,以得到一雜訊信號能量加權平均值,並依據該目標音框所對應的原始語音取樣信號能量是否大於該雜訊信號能量加權平均值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第3項所述的語音辨識裝置,其中對應各該被判斷為雜訊信號的原始語音取樣信號的音框的加權值隨對應各該被判斷為雜訊信號的原始語音取樣信號的音框與該目標音框之間的間隔長短不同而改變。
- 如申請專利範圍第3項所述的語音辨識裝置,其中該處理單元更依據該第二子音頻段信號能量與該原始語音取樣信號能量的比值與該第一子音頻段信號能量與該原始語音取樣信號能量的比值之和是否大於等於一預設和值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第5項所述的語音辨識裝置,其中該處理單元更計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框所對應的該第一子音頻段信號能量與該原始語音取樣信號能量的比值的加權平均值,以得到一第一子音能量比例加權平均值,並依據該目標音框所對應的該第一子音頻段信號能量與該原始語音取樣信號能量的比值是否小於該第一子音能量比例加權平均值 來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第6項所述的語音辨識裝置,其中對應各該被判斷為雜訊信號的原始語音取樣信號的音框所對應的該第一子音頻段信號能量與該原始語音取樣信號能量的比值的加權值隨對應各該被判斷為雜訊信號的原始語音取樣信號的音框與該目標音框之間的間隔長短不同而改變。
- 如申請專利範圍第6項所述的語音辨識裝置,其中該處理單元更依據該第二子音頻段信號能量與該原始語音取樣信號能量的比值是否大於等於一預設比值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第8項所述的語音辨識裝置,其中該處理單元更依據該原始語音取樣信號能量是否大於等於一下限值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第9項所述的語音辨識裝置,其中該處理單元更計算該原始語音取樣信號的第一過零率、第二過零率以及第三過零率,並計算該目標音框與該目標音框之前的多個音框的原始語音取樣信號的平均過零率,以得到一第一平均過零率、一第二平均過零率以及一第三平均過零率,並依據該第一平均過零率、該第二平均過零率以及該第三平均過零率是否分別大於等於其對應的預設平均過零率來判斷該目標音框所對應的原始語音取樣信號是否為子音信號,該第一過零率、該第二過零率以及該第三過零率分別為在該目標音框中該原始語音取樣信號通過一第 一預設值、一第二預設值以及一第三預設值的次數,該第二預設值小於該第一預設值且大於該第三預設值。
- 如申請專利範圍第10項所述的語音辨識裝置,其中該處理單元更依據該第二過零率是否大於等於一預設過零率來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 一種語音辨識方法,包括:對一語音信號進行一第一子音頻段以及一第二子音頻段的帶通濾波,以分別產生一第一帶通濾波信號與一第二帶通濾波信號;將該語音信號、該第一帶通濾波信號與該第二帶通濾波信號分為多個音框,其中各該音框包括N個取樣信號,N為正整數;計算目標音框中取樣信號的能量,以獲得一原始語音取樣信號能量、一第一子音頻段信號能量以及一第二子音頻段信號能量;以及依據該第一子音頻段信號能量與該第二子音頻段信號能量的比值、該第一子音頻段信號能量與該原始語音取樣信號能量的比值以及該第二子音頻段信號能量與該原始語音取樣信號能量的比值判斷對應該目標音框的原始語音取樣信號是否為雜訊。
- 如申請專利範圍第12項所述的語音辨識方法,更包括:判斷該第一子音頻段信號能量與該第二子音頻段信號能量的比值、該第一子音頻段信號能量與該原始語音取樣信號能量的比值以及該第二子音頻段信號能量與該原始語音取樣信號能量的比值是否分別落於對應的預設比值範圍;以及 若該第一子音頻段信號能量與該第二子音頻段信號能量的比值、該第一子音頻段信號能量與該原始語音取樣信號能量的比值以及該第二子音頻段信號能量與該原始語音取樣信號能量的比值分別落於對應的預設比值範圍,則該目標音框的原始語音取樣信號為雜訊信號。
- 如申請專利範圍第12項所述的語音辨識方法,更包括:計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框的能量加權平均值,以得到一雜訊信號能量加權平均值;以及依據該目標音框所對應的原始語音取樣信號能量是否大於該雜訊信號能量加權平均值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第14項所述的語音辨識方法,其中對應各該被判斷為雜訊信號的原始語音取樣信號的音框的加權值隨對應各該被判斷為雜訊信號的原始語音取樣信號的音框與該目標音框之間的間隔長短不同而改變。
- 如申請專利範圍第14項所述的語音辨識方法,更包括:依據該第二子音頻段信號能量與該原始語音取樣信號能量的比值與該第一子音頻段信號能量與該原始語音取樣信號能量的比值之和是否大於等於一預設和值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第16項所述的語音辨識方法,更包括:計算多個之前被判斷為雜訊信號的原始語音取樣信號的音框 所對應的該第一子音頻段信號能量與該原始語音取樣信號能量的比值的加權平均值,以得到一第一子音能量比例加權平均值;以及依據該目標音框所對應的該第一子音頻段信號能量與該原始語音取樣信號能量的比值是否小於該第一子音能量比例加權平均值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第17項所述的語音辨識方法,其中對應各該被判斷為雜訊信號的原始語音取樣信號所對應的該第一子音頻段信號能量與該原始語音取樣信號能量的比值的加權值隨對應各該被判斷為雜訊信號的原始語音取樣信號的音框與該目標音框之間的間隔長短不同而改變。
- 如申請專利範圍第17項所述的語音辨識方法,更包括:依據該第二子音頻段信號能量與該原始語音取樣信號能量的比值是否大於等於一預設比值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第19項所述的語音辨識方法,更包括:依據該原始語音取樣信號能量是否大於等於一下限值來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第20項所述的語音辨識方法,更包括:計算該原始語音取樣信號的第一過零率、第二過零率以及第三過零率,並計算該目標音框與該目標音框之前多N個音框的原 始語音取樣信號的平均過零率,以得到一第一平均過零率、一第二平均過零率以及一第三平均過零率,其中N為正整數,該第一過零率、該第二過零率以及該第三過零率分別為在該目標音框中該原始語音取樣信號通過一第一預設值、一第二預設值以及一第三預設值的次數,該第二預設值小於該第一預設值且大於該第三預設值;以及依據該第一平均過零率、該第二平均過零率以及該第三平均過零率是否分別大於等於其對應的預設平均過零率來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
- 如申請專利範圍第21項所述的語音辨識方法,更包括:依據該第二過零率是否大於等於一預設過零率來判斷該目標音框所對應的原始語音取樣信號是否為子音信號。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104102540A TWI566242B (zh) | 2015-01-26 | 2015-01-26 | 語音辨識裝置及語音辨識方法 |
US14/659,542 US9495973B2 (en) | 2015-01-26 | 2015-03-16 | Speech recognition apparatus and speech recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104102540A TWI566242B (zh) | 2015-01-26 | 2015-01-26 | 語音辨識裝置及語音辨識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201627989A true TW201627989A (zh) | 2016-08-01 |
TWI566242B TWI566242B (zh) | 2017-01-11 |
Family
ID=56433766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104102540A TWI566242B (zh) | 2015-01-26 | 2015-01-26 | 語音辨識裝置及語音辨識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9495973B2 (zh) |
TW (1) | TWI566242B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI622978B (zh) * | 2017-02-08 | 2018-05-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
TWI588819B (zh) * | 2016-11-25 | 2017-06-21 | 元鼎音訊股份有限公司 | 語音處理之方法、語音通訊裝置及其電腦程式產品 |
CN108630193B (zh) * | 2017-03-21 | 2020-10-02 | 北京嘀嘀无限科技发展有限公司 | 语音识别方法及装置 |
CN112509569B (zh) * | 2020-11-24 | 2022-05-17 | 北京百度网讯科技有限公司 | 语音数据的处理方法、装置、电子设备及存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW373069B (en) * | 1996-12-19 | 1999-11-01 | Holtek Semiconductor Inc | Voiced/unvoiced noise of phonetic coding identifying method |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US20030179888A1 (en) * | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US20040175010A1 (en) * | 2003-03-06 | 2004-09-09 | Silvia Allegro | Method for frequency transposition in a hearing device and a hearing device |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US8032370B2 (en) * | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
TWI308740B (en) * | 2007-01-23 | 2009-04-11 | Ind Tech Res Inst | Method of a voice signal processing |
US8321213B2 (en) * | 2007-05-25 | 2012-11-27 | Aliphcom, Inc. | Acoustic voice activity detection (AVAD) for electronic systems |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US8280087B1 (en) * | 2008-04-30 | 2012-10-02 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Delivering fundamental frequency and amplitude envelope cues to enhance speech understanding |
TW201015538A (en) * | 2008-10-15 | 2010-04-16 | Mao-Lin Chen | Intelligent speech recognition control device |
US8606572B2 (en) * | 2010-10-04 | 2013-12-10 | LI Creative Technologies, Inc. | Noise cancellation device for communications in high noise environments |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
US9286907B2 (en) * | 2011-11-23 | 2016-03-15 | Creative Technology Ltd | Smart rejecter for keyboard click noise |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
TWI504282B (zh) * | 2012-07-20 | 2015-10-11 | Unlimiter Mfa Co Ltd | 增加聽障者聽到聲音正確性之方法及助聽器 |
WO2014035328A1 (en) * | 2012-08-31 | 2014-03-06 | Telefonaktiebolaget L M Ericsson (Publ) | Method and device for voice activity detection |
WO2014094242A1 (en) * | 2012-12-18 | 2014-06-26 | Motorola Solutions, Inc. | Method and apparatus for mitigating feedback in a digital radio receiver |
-
2015
- 2015-01-26 TW TW104102540A patent/TWI566242B/zh active
- 2015-03-16 US US14/659,542 patent/US9495973B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI622978B (zh) * | 2017-02-08 | 2018-05-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
Also Published As
Publication number | Publication date |
---|---|
US9495973B2 (en) | 2016-11-15 |
US20160217808A1 (en) | 2016-07-28 |
TWI566242B (zh) | 2017-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI557728B (zh) | 語音辨識裝置及語音辨識方法 | |
TWI566242B (zh) | 語音辨識裝置及語音辨識方法 | |
CN103854662B (zh) | 基于多域联合估计的自适应语音检测方法 | |
CN103886871B (zh) | 语音端点的检测方法和装置 | |
CN103325381B (zh) | 一种基于模糊隶属函数的语音分离方法 | |
WO2022160593A1 (zh) | 一种语音增强方法、装置、系统及计算机可读存储介质 | |
US9959886B2 (en) | Spectral comb voice activity detection | |
CN103117067B (zh) | 一种低信噪比下语音端点检测方法 | |
CN101354889B (zh) | 一种语音变调方法及装置 | |
WO2015196760A1 (zh) | 一种麦克风阵列语音检测方法及装置 | |
US20140309992A1 (en) | Method for detecting, identifying, and enhancing formant frequencies in voiced speech | |
US9384759B2 (en) | Voice activity detection and pitch estimation | |
WO2016004757A1 (zh) | 杂音检测方法和装置 | |
CN104599677A (zh) | 基于语音重建的瞬态噪声抑制方法 | |
CN105989834B (zh) | 语音辨识装置及语音辨识方法 | |
WO2009123387A1 (en) | Procedure for processing noisy speech signals, and apparatus and computer program therefor | |
CN103258537A (zh) | 利用特征结合对语音情感进行识别的方法及其装置 | |
EP2823584A2 (en) | Voice signal enhancement | |
CN105916090A (zh) | 一种基于智能化语音识别技术的助听器系统 | |
CN103745729A (zh) | 一种音频去噪方法和系统 | |
CN108986844B (zh) | 一种基于说话人语音特征的语音端点检测方法 | |
TWI622978B (zh) | 語音信號處理裝置及語音信號處理方法 | |
CN104599682A (zh) | 电话线质量语音的基音周期提取方法 | |
CN105989835B (zh) | 语音辨识装置及语音辨识方法 | |
Rao et al. | Speech enhancement for listeners with hearing loss based on a model for vowel coding in the auditory midbrain |