TWI583205B - 語音信號處理裝置及語音信號處理方法 - Google Patents
語音信號處理裝置及語音信號處理方法 Download PDFInfo
- Publication number
- TWI583205B TWI583205B TW104118328A TW104118328A TWI583205B TW I583205 B TWI583205 B TW I583205B TW 104118328 A TW104118328 A TW 104118328A TW 104118328 A TW104118328 A TW 104118328A TW I583205 B TWI583205 B TW I583205B
- Authority
- TW
- Taiwan
- Prior art keywords
- sampling point
- converted signal
- signal frame
- count value
- mth
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims description 15
- 238000005070 sampling Methods 0.000 claims description 354
- 239000000523 sample Substances 0.000 claims description 44
- 239000013074 reference sample Substances 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/35—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
- H04R25/353—Frequency, e.g. frequency shift or compression
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/057—Time compression or expansion for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明是有關於一種信號處理裝置,且特別是有關於一種語音信號處理裝置及語音信號處理方法。
一般對於聽障人士來說,其往往無法清楚地接收較高頻的語音信號,例如子音信號,但對於低頻的信號卻可以清楚地聽到。一般習知技術為藉由將高頻的語音信號進行降頻,並將信號框進行重疊,以解決此問題。然,由於習知技術在進行信號框的重疊動作時,並不會考慮其相位是否匹配,因此在重疊處將出現一部分信號相加、一部分信號相減的情形,進而造成信號的失真。
本發明提供一種語音信號處理裝置及語音信號處理方法,可有效地改善信號框重疊時相位不匹配所導致的信號失真情形。
本發明的語音信號處理裝置包括處理單元,其用以降頻取樣語音信號,以產生包括一序列的原始降頻信號框的降頻信號,並依據原始降頻信號框產生對應的更新降頻信號框,其中各原始降頻信號框包括p個取樣點。處理單元更依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號決定在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,將自與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點,並混疊相鄰的更新降頻信號框,以產生交疊語音信號,其中p為正整數、m為大於1的正整數。
在本發明的一實施例中,上述相鄰兩個更新降頻信號框分別具有50%的重疊區段。
在本發明的一實施例中,上述處理單元更依據第m個原始降頻信號框中取樣點的取樣值累計第一計數值以及第二計數值,其中當降頻信號由正半周轉為負半周時處理單元歸零第一計數值,當降頻信號由負半周轉為負半周時處理單元歸零第二計數值。處理單元將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值或第二計數值做為基準值,並依據基準值決定第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。
在本發明的一實施例中,上述處理單元更判斷第m個原
始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值是否小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值。若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值做為基準值,並將第m個原始降頻信號框中第一計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值未小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值做為基準值,並將第m個原始降頻信號框中第二計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。
在本發明的一實施例中,上述處理單元更將降頻信號乘以一漢明窗。
本發明的語音信號處理方法包括下列步驟。降頻取樣語音信號,以產生包括一序列的原始降頻信號框的降頻信號,其中
各原始降頻信號框包括p個取樣點,其中p為正整數。依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號決定在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,其中m為大於1的正整數。將自與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點。混疊相鄰的更新降頻信號框,以產生交疊語音信號。
在本發明的一實施例中,上述相鄰兩個更新降頻信號框分別具有50%的重疊區段。
在本發明的一實施例中,上述依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號決定在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點的步驟包括下列步驟。依據第m個原始降頻信號框中取樣點的取樣值累計第一計數值以及第二計數值,其中當降頻信號由正半周轉為負半周時歸零第一計數值,當降頻信號由負半周轉為負半周時歸零第二計數值。將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值或第二計數值做為基準值。依據基準值決定第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點的相位匹配的最後一個取樣點。
在本發明的一實施例中,上述將第m個原始降頻信號框
中與相位基準取樣點編號對應的取樣點所對應的第一計數值或第二計數值做為基準值的步驟包括下列步驟。判斷第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值是否小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值。若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值做為基準值。若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值未小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值做為基準值。
在本發明的一實施例中,若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,上述語音信號處理方法包括,將第m個原始降頻信號框中第一計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。
在本發明的一實施例中,若第m個原始降頻信號框中與
相位基準取樣點編號對應的取樣點所對應的第一計數值未小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,上述語音信號處理方法包括,將第m個原始降頻信號框中第二計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。
在本發明的一實施例中,上述語音信號處理方法包括,將降頻信號乘以漢明窗。
基於上述,本發明的實施例依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號決定在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,將自與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點,以有效地改善信號框重疊時相位不匹配所導致的信號失真情形。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
102‧‧‧處理單元
104‧‧‧及取樣單元
S1‧‧‧原始語音信號
S2‧‧‧取樣語音信號
W1~W4‧‧‧取樣信號框
WL1~WL4‧‧‧原始降頻信號框
WL1’~WL4‧‧‧更新降頻信號框
WH1~WH4‧‧‧乘以漢明窗後的更新降頻信號框
SL、SL’、SH‧‧‧降頻信號
‧‧‧第一計數值
n‧‧‧取樣點編號
SO‧‧‧交疊語音信號
S402~S410、S502~S512‧‧‧語音信號處理方法的步驟
圖1繪示為本發明一實施例之語音信號處理裝置的示意圖。
圖2繪示本發明一實施例之取樣語音信號的信號處理示意
圖。
圖3繪示本發明一實施例之原始降頻信號框WL2的示意圖。
圖4繪示本發明一實施例之語音信號處理方法的流程示意圖。
圖5繪示本發明另一實施例之語音信號處理方法的流程示意圖。
圖1繪示為本發明一實施例之語音信號處理裝置的示意圖,請參照圖1。語音信號處理裝置包括處理單元102以及取樣單元104,處理單元102耦接取樣單元104,其中處理單元102可例如以中央處理單元來實施,而取樣單元104則可例如以邏輯電路來實施,然不以此為限。取樣單元104可取樣原始語音信號S1,以產生取樣語音信號S2。處理單元102可對取樣語音信號S2進行降頻,以產生包括一序列的降頻信號框的降頻信號,如圖2所繪示之取樣語音信號S2的信號處理示意圖所示,取樣語音信號S2可包括一序列的取樣信號框,為簡化說明,在圖2實施例中僅繪示出4個取樣信號框W1~W4,然並不以此為限。降頻信號SL包括多個原始降頻信號框WL1~WL4,由於降頻信號SL為降頻取樣語音信號S2所得到,因此原始降頻信號框的長度大於取樣語音信號S2的取樣信號框的長度。
處理單元102可透過調整原始降頻信號框所包含的取樣
點,而得到更新降頻信號框(例如圖2之更新降頻信號框WL1’~WL4’),使各個更新降頻信號框的中間取樣點與下一個更新降頻信號框的初始取樣點的相位匹配,進而改善信號框重疊時相位不匹配所導致的信號失真情形。
進一步來說,各個原始降頻信號框可包括p個取樣點,其中p為正整數,處理單元102可將在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的取樣點編號做為相位基準取樣點編號,並依據相位基準取樣點編號決定在第m個原始降頻信號框中與此相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,並將自此最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點,以使第m個更新降頻信號框的中間取樣點與第m+1個更新降頻信號框的初始取樣點的相位匹配,其中m為大於1的正整數。如此一來,第m個更新降頻信號框與第m+1個更新降頻信號框進行50%的信號框混疊時(亦即第m個更新降頻信號框與第m+1個更新降頻信號框分別有具有50%的重疊區段),相位不匹配的情形便可大幅地減少,而改善信號失真的情形。
詳細來說,處理單元102可依據第m個原始降頻信號框中取樣點的取樣值累計第一計數值以及第二計數值,其中當降頻信號SL由正半周轉為負半周時歸零第一計數值,當降頻信號由負半周轉為負半周時歸零第二計數值。具體來說,上述計數值的累計方式可依據下列式子(1)~(4)表示:
其中m為大於1的正整數,n=0,1,2,...,2N-2,N為大於1的正整數,s m (n)為第m個原始降頻信號框中編號n的取樣點的取樣值,PN m (n)為將取樣值s m (n)轉為以“1”、“0”表示之值,其中PN m (-1)=PN m (0)。為第m個原始降頻信號框中編號n的取樣點所對應的第一計數值,而為第m個原始降頻信號框中編號n的取樣點所對應的第二計數值,其中,而。,由式(1)、(2)可知為對應降頻信號在正半周時的累計計數值,而為對應降頻信號在負半周時的累計計數值。如式(1)~(4)所示,在本實施例中,將取樣值s m (n)大於等於0以及s m (n)小於0時的取樣值分別設為1、0,在計數第一計數值時把等於1時所對應的第一計數值歸零,另外並在計數第二計數值時把等於-1時所對應的第二計數值歸零。
處理單元102可將第m個原始降頻信號框中與在第m個更新降頻信號框的中所得到的相位基準取樣點編號對應的取樣點所對應的第一計數值或第二計數值做為基準值,並依據此基準值決定第m個原始降頻信號框中與與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。例如處理單元102可判斷第m
個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值是否小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,其可以下列式子(5)表示:
其中為第m-1個原始降頻信號框中與第m-1個原始降頻信號框的中間取樣點的相位匹配的最後一個取樣點所對應的編號,其等於第m個原始降頻信號框中對應第m個更新降頻信號框最後一個取樣點的取樣點的編號。例如,在圖2中,假設各個原始降頻信號框WL1~WL4中分別包括0,1,2,…,200等201個取樣點,在原始降頻信號框WL1中與原始降頻信號框WL1的中間取樣點的相位匹配的最後一個取樣點所對應的編號為188,而在原始降頻信號框WL2中對應更新降頻信號框WL2’最後一個取樣點的取樣點的編號亦為188。為在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號,例如在圖2中,在原始降頻信號框WL2中與更新降頻信號框WL2’的中間取樣點所對應的取樣點取樣點編號為88(亦即相位基準取樣點編號為88,N為101)。為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值,為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值。
若第m個原始降頻信號框中與相位基準取樣點編號對應
的取樣點所對應的第一計數值小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,處理單元102將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值第一計數值做為基準值,並將第m個原始降頻信號框中第一計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為最後一個取樣點,其可以下列式子(6)、(7)表示:
由式(6)、(7)可知,當第m個原始降頻信號框中編號n的取樣點所對應的第一計數值等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值時,等於取樣點所對應的編號n,否則等於0。而則為在所有中的最大值,其代表在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點的相位匹配的最後一個取樣點的編號,此取樣點用以做為第m+1個更新降頻信號框的初始取樣點。
相反地,若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值未小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值(亦即式(5)不成立),則處理單元102將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值做
為基準值,並將第m個原始降頻信號框中第二計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為最後一個取樣點,其可以下列式子(8)、(9)表示:
由式(8)、(9)可知,當為第m個原始降頻信號框中編號n的取樣點所對應的第二計數值等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值時,等於取樣點所對應的編號n,否則等於0。而則為在所有中的最大值,其代表在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點的相位匹配的最後一個取樣點的編號,此取樣點用以做為第m+1個更新降頻信號框的初始取樣點。
舉例來說,假設圖2中的各個原始降頻信號框WL1~WL4分別包括201個取樣點,亦即各個原始降頻信號框WL1~WL4中分別包括0,1,2,…,200等201個取樣點。在原始降頻信號框WL2中與更新降頻信號框WL2’的中間取樣點所對應的相位基準取樣點編號(其為88)所對應的第一計數值小於等於在原始降頻信號框WL2中與更新降頻信號框WL2’的中間取樣點所對應的相位基準取樣點編號取樣點對應的第二計數值,且在原始降頻信號框WL2的中間取樣點(亦即在原始降頻信號框WL2中編號為88的取樣點)所對應的第一計數值為18。
為找出更新降頻信號框WL3’的初始取樣點,處理單元102可計數在原始降頻信號框WL2中第一計數值等於18時所對應的取樣點的編號(由於在原始降頻信號框WL2中編號為88的取樣點所對應的第一計數值小於對應的第二計數值,因此以第一計數值做為基準值)。如圖3所繪示之原始降頻信號框WL2的示意圖所示,在圖3的實施例中,原始降頻信號框WL2中第一計數值等於18時所對應的取樣點的編號(亦即不等於0的的值)包括編號20、40、63、79、100、125、142、163、192等的取樣點,其中編號192的取樣點為在原始降頻信號框WL2中第一計數值等於基準值(其值為18)時所對應的取樣點中最後取樣的取樣點,因此等於192,處理單元102將其做為更新降頻信號框WL3’的初始取樣點,並將自原始降頻信號框WL2中編號192的取樣點起的連續201個取樣點做為更新降頻信號框WL3’的取樣點。如圖2所示,更新降頻信號框WL3’包括原始降頻信號框WL2中編號183~200的取樣點以及原始降頻信號框WL3中編號192以及編號192以前的取樣點,其中原始降頻信號框WL2中編號92(其為更新降頻信號框WL3’的中間取樣點在原始降頻信號框WL3中所對應的取樣點編號)可做為相位基準取樣點編號,其用以做為尋找更新降頻信號框WL4’的初始取樣點的依據。類似地,更新降頻信號框WL4’的初始取樣點亦可以類似的方式得到,因此在此不再贅述。
值得注意的是,由於原始降頻信號框WL1為第一個原始
降頻信號框,因此更新降頻信號框WL1’的取樣點即為原始降頻信號框WL1所包括的取樣點,且原始降頻信號框WL1中與更新降頻信號框WL1’的中間取樣點所對應的相位基準取樣點編號為100。在本實施例中,原始降頻信號框WL1中與原始降頻信號框WL1的中間取樣點的相位匹配的最後一個取樣點所對應的編號為188(然不以此為限),其中最後一個取樣點(編號188的取樣點)的求取方式與上述實施例類似,本領域具通常知識者應可依據上述內容推得其實施方式,因此在此不再贅述。
在調整完各個原始降頻信號框所包含的取樣點,而得到對應的更新降頻信號框後,處理單元102便可對相鄰的更新降頻信號框進行50%的混疊,以產生交疊語音信號,由於此時各個更新降頻信號框的中間取樣點與下一個更新降頻信號框的初始取樣點的相位匹配,因此信號框重疊時相位不匹配所導致的信號失真情形將大幅地被改善。此外,在部份實施例中,亦可在得到各個原始降頻信號框對應的更新降頻信號框後,將降頻信號乘以漢明窗(Hamming Window),以增加更新降頻信號框左右端的連續性。如圖2所示,在將包括更新降頻信號框WL1’~WL4’的降頻信號SL’乘以漢明窗後,可得到包括更新降頻信號框WH1~WH4的降頻信號SH,然後再將更新降頻信號框WH1~WH4進行混疊,即可得到交疊語音信號SO。
圖4繪示本發明一實施例之語音信號處理方法的流程示意圖,請參照圖4。由上述實施例可知,語音信號處理裝置的語音
信號處理方法可包括下列步驟。首先,取樣原始語音信號,以產生取樣語音信號(步驟S402)。接著,降頻取樣語音信號,以產生包括一序列的原始降頻信號框的降頻信號(步驟S404),其中各原始降頻信號框包括p個取樣點,其中p為正整數。然後,依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號決定在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點(步驟S406),其中m為大於1的正整數。之後,將自與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點(步驟S408)。最後,再混疊相鄰的更新降頻信號框,以產生交疊語音信號(步驟S410),其中相鄰兩個更新降頻信號框可例如分別具有50%的重疊區段。
圖5繪示本發明另一實施例之語音信號處理方法的流程示意圖,請參照圖5。詳細來說,圖4實施例之步驟S406在本實施例中可包括步驟S502~S506,亦即先依據第m個原始降頻信號框中取樣點的取樣值累計第一計數值以及第二計數值,其中當降頻信號由正半周轉為負半周時歸零第一計數值,當降頻信號由負半周轉為負半周時歸零第二計數值(步驟S502),然後將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值或第二計數值做為基準值(步驟S504),之後再依據基準值決定第m個原始降頻信號框中與相位基準取樣點編號對應的取
樣點的相位匹配的最後一個取樣點(步驟S506)。更進一步來說,步驟S504可包括,先判斷第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值是否小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值(步驟S508)。若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值做為基準值(步驟S510),在此情形下,於步驟S506可將第m個原始降頻信號框中第一計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。相反地,若第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第一計數值未小於等於第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值,將第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點所對應的第二計數值做為基準值(步驟S512),在此情形下,於步驟S506可將第m個原始降頻信號框中第二計數值等於基準值時所對應的取樣點中最後取樣的取樣點做為第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點。
綜上所述,本發明的實施例依據在第m個原始降頻信號
框中與第m個更新降頻信號框的中間取樣點所對應的相位基準取樣點編號決定在第m個原始降頻信號框中與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,將自與相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點,以有效地改善信號框重疊時相位不匹配所導致的信號失真情形。
S402~S410‧‧‧語音信號處理方法的流程步驟
Claims (12)
- 一種語音信號處理裝置,包括:一處理單元,對一取樣語音信號進行降頻,以產生包括一序列的原始降頻信號框的降頻信號,並依據該些原始降頻信號框產生對應的更新降頻信號框,其中各該原始降頻信號框包括p個取樣點,該處理單元依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的一相位基準取樣點編號決定在該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,將自與該相位基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點,混疊相鄰的更新降頻信號框,以產生一交疊語音信號,其中該相位基準取樣點編號為在該第m個原始降頻信號框中與該第m個更新降頻信號框的中間取樣點所對應的取樣點的編號,p為正整數、m為大於1的正整數。
- 如申請專利範圍第1項所述的語音信號處理裝置,其中該相鄰兩個更新降頻信號框分別具有50%的重疊區段。
- 如申請專利範圍第2項所述的語音信號處理裝置,其中該處理單元更依據該第m個原始降頻信號框中取樣點的取樣值累計一第一計數值以及一第二計數值,其中當該降頻信號由正半周轉為負半周時歸零該第一計數值,當該降頻信號由負半周轉為負半周時歸零該第二計數值,將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值或該第二計 數值做為一基準值,並依據該基準值決定該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點。
- 如申請專利範圍第3項所述的語音信號處理裝置,其中該處理單元更判斷該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值是否小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值,若該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值,將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值做為該基準值,並將該第m個原始降頻信號框中該第一計數值等於該基準值時所對應的取樣點中最後取樣的取樣點做為該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點,若該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值未小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值,將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值做為該基準值,並將該第m個原始降頻信號框中該第二計數值等於該基準值時所對應的取樣點中最後取樣的取樣點做為該第m個原始降頻信號框中與該相位 基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點。
- 如申請專利範圍第1項所述的語音信號處理裝置,其中該處理單元更將該降頻信號乘以一漢明窗。
- 一種語音信號處理方法,包括:對一取樣語音信號進行降頻,以產生包括一序列的原始降頻信號框的降頻信號,其中各該原始降頻信號框包括p個取樣點,其中p為正整數;依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的一相位基準取樣點編號決定在該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點,其中該相位基準取樣點編號為在該第m個原始降頻信號框中與該第m個更新降頻信號框的中間取樣點所對應的取樣點的編號,m為大於1的正整數;以及將自與該相位基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點起的連續p個取樣點做為第m+1個更新降頻信號框的取樣點;以及混疊相鄰的更新降頻信號框,以產生一交疊語音信號。
- 如申請專利範圍第6項所述的語音信號處理方法,其中該相鄰兩個更新降頻信號框分別具有50%的重疊區段。
- 如申請專利範圍第7項所述的語音信號處理方法,其中依據在第m個原始降頻信號框中與第m個更新降頻信號框的中間取樣點所對應的一相位基準取樣點編號決定在該第m個原始降頻信 號框中與該相位基準取樣點編號對應的取樣點相位匹配的最後一個取樣點的步驟包括:依據該第m個原始降頻信號框中取樣點的取樣值累計一第一計數值以及一第二計數值,其中當該降頻信號由正半周轉為負半周時歸零該第一計數值,當該降頻信號由負半周轉為負半周時歸零該第二計數值;將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值或該第二計數值做為一基準值;以及依據該基準值決定該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點的相位匹配的該最後一個取樣點。
- 如申請專利範圍第8項所述的語音信號處理方法,其中將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值或該第二計數值做為該基準值的步驟包括:判斷該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值是否小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值;若該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數 值,將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值做為該基準值;以及若該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值未小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值,將該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值做為該基準值。
- 如申請專利範圍第9項所述的語音信號處理方法,其中若該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值,該語音信號處理方法包括:將該第m個原始降頻信號框中該第一計數值等於該基準值時所對應的取樣點中最後取樣的取樣點做為該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點。
- 如申請專利範圍第9項所述的語音信號處理方法,其中若該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第一計數值未小於等於該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點所對應的該第二計數值,該語音信號處理方法包括:將該第m個原始降頻信號框中該第二計數值等於該基準值時 所對應的取樣點中最後取樣的取樣點做為該第m個原始降頻信號框中與該相位基準取樣點編號對應的取樣點相位匹配的該最後一個取樣點。
- 如申請專利範圍第6項所述的語音信號處理方法,包括:將該降頻信號乘以一漢明窗。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104118328A TWI583205B (zh) | 2015-06-05 | 2015-06-05 | 語音信號處理裝置及語音信號處理方法 |
US14/804,355 US9699570B2 (en) | 2015-06-05 | 2015-07-21 | Voice signal processing apparatus and voice signal processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104118328A TWI583205B (zh) | 2015-06-05 | 2015-06-05 | 語音信號處理裝置及語音信號處理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201644287A TW201644287A (zh) | 2016-12-16 |
TWI583205B true TWI583205B (zh) | 2017-05-11 |
Family
ID=57452894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104118328A TWI583205B (zh) | 2015-06-05 | 2015-06-05 | 語音信號處理裝置及語音信號處理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9699570B2 (zh) |
TW (1) | TWI583205B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630012A (en) * | 1993-07-27 | 1997-05-13 | Sony Corporation | Speech efficient coding method |
US5727072A (en) * | 1995-02-24 | 1998-03-10 | Nynex Science & Technology | Use of noise segmentation for noise cancellation |
US5845247A (en) * | 1995-09-13 | 1998-12-01 | Matsushita Electric Industrial Co., Ltd. | Reproducing apparatus |
US6738445B1 (en) * | 1999-11-26 | 2004-05-18 | Ivl Technologies Ltd. | Method and apparatus for changing the frequency content of an input signal and for changing perceptibility of a component of an input signal |
US20100198586A1 (en) * | 2008-04-04 | 2010-08-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Audio transform coding using pitch correction |
US20140358530A1 (en) * | 2013-05-30 | 2014-12-04 | Kuo-Ping Yang | Method of processing a voice segment and hearing aid |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971691B (zh) * | 2013-01-29 | 2017-09-29 | 鸿富锦精密工业(深圳)有限公司 | 语音信号处理系统及方法 |
TWI528351B (zh) * | 2013-08-14 | 2016-04-01 | 元鼎音訊股份有限公司 | 聲音處理之方法及開放式播音裝置 |
WO2015029546A1 (ja) * | 2013-08-30 | 2015-03-05 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
TWI566241B (zh) * | 2015-01-23 | 2017-01-11 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
TWI557729B (zh) * | 2015-05-20 | 2016-11-11 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
-
2015
- 2015-06-05 TW TW104118328A patent/TWI583205B/zh active
- 2015-07-21 US US14/804,355 patent/US9699570B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630012A (en) * | 1993-07-27 | 1997-05-13 | Sony Corporation | Speech efficient coding method |
US5727072A (en) * | 1995-02-24 | 1998-03-10 | Nynex Science & Technology | Use of noise segmentation for noise cancellation |
US5845247A (en) * | 1995-09-13 | 1998-12-01 | Matsushita Electric Industrial Co., Ltd. | Reproducing apparatus |
US6738445B1 (en) * | 1999-11-26 | 2004-05-18 | Ivl Technologies Ltd. | Method and apparatus for changing the frequency content of an input signal and for changing perceptibility of a component of an input signal |
US20100198586A1 (en) * | 2008-04-04 | 2010-08-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Audio transform coding using pitch correction |
US20140358530A1 (en) * | 2013-05-30 | 2014-12-04 | Kuo-Ping Yang | Method of processing a voice segment and hearing aid |
Also Published As
Publication number | Publication date |
---|---|
US9699570B2 (en) | 2017-07-04 |
TW201644287A (zh) | 2016-12-16 |
US20160360324A1 (en) | 2016-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017004869A1 (zh) | 模数转换器误差估计校正的装置及其方法 | |
CN101154384A (zh) | 声音信号纠正方法、声音信号纠正设备以及计算机程序 | |
CN108918499B (zh) | 拉曼图谱中去除拉曼基线漂移的方法 | |
CN107910017A (zh) | 一种带噪语音端点检测中阈值设定的方法 | |
CN110798419A (zh) | 一种调制方式识别方法及装置 | |
CN108447493A (zh) | 频域卷积盲源分离分频段多质心聚类排序方法 | |
TWI583205B (zh) | 語音信號處理裝置及語音信號處理方法 | |
RU2018145032A (ru) | Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа | |
TWI557729B (zh) | 語音信號處理裝置及語音信號處理方法 | |
EP2382623B1 (en) | Aligning scheme for audio signals | |
JP6182862B2 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP5787126B2 (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
CN106328158B (zh) | 语音信号处理装置及语音信号处理方法 | |
JP2004109712A (ja) | 話者方向検出装置 | |
CN105551503B (zh) | 基于原子预选择的音频匹配追踪方法与系统 | |
CN106297814B (zh) | 语音信号处理装置及语音信号处理方法 | |
JP2011100029A (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
CN116137153A (zh) | 一种语音降噪模型的训练方法以及语音增强方法 | |
WO2019100327A1 (zh) | 一种信号处理方法、装置及终端 | |
US20160217805A1 (en) | Voice signal processing apparatus and voice signal processing method | |
CN111613238A (zh) | 信号之间延时的确定方法、装置、设备以及存储介质 | |
JP6438786B2 (ja) | 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム | |
US10937449B2 (en) | Apparatus and method for determining a pitch information | |
Iwai et al. | Formant frequency estimation with windowless autocorrelation in the presence of noise | |
US9344103B1 (en) | High-resolution time-to-digital converter and method thereof |