TW202331701A - 雙麥克風陣列回音消除方法、雙麥克風陣列回音消除裝置、電子設備、及非揮發性電腦可讀儲存媒體 - Google Patents
雙麥克風陣列回音消除方法、雙麥克風陣列回音消除裝置、電子設備、及非揮發性電腦可讀儲存媒體 Download PDFInfo
- Publication number
- TW202331701A TW202331701A TW112113463A TW112113463A TW202331701A TW 202331701 A TW202331701 A TW 202331701A TW 112113463 A TW112113463 A TW 112113463A TW 112113463 A TW112113463 A TW 112113463A TW 202331701 A TW202331701 A TW 202331701A
- Authority
- TW
- Taiwan
- Prior art keywords
- initial
- signal
- spectrum
- suppression gain
- gain factor
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000001228 spectrum Methods 0.000 claims abstract description 268
- 230000001629 suppression Effects 0.000 claims abstract description 209
- 238000001914 filtration Methods 0.000 claims abstract description 53
- 238000009499 grossing Methods 0.000 claims abstract description 51
- 230000003044 adaptive effect Effects 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000003860 storage Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 4
- 238000003491 array Methods 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 7
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 description 6
- 101710180672 Regulator of MON1-CCZ1 complex Proteins 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000002592 echocardiography Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/34—Microprocessors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/36—Memories
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
一種雙麥克風陣列回音消除方法、裝置、電子設備、及非揮發性電腦可讀儲存媒體。所述方法包括:對遠端訊號、第一近端訊號和第二近端訊號進行線性濾波處理;分別對第一初始誤差頻譜、第二初始誤差頻譜進行質心擬合,獲得第一近端訊號和第二近端訊號的初始抑制增益因子及可變步長因子;利用自適應零極點回音消除器對第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號;對初始抑制增益因子進行子帶範圍選取求平滑因子,並獲得二次抑制增益因子;利用二次抑制增益因子對目標頻譜訊號進行濾波處理,獲得目標近端語音訊號。
Description
本發明是有關一種雙麥克風陣列回音消除方法、雙麥克風陣列回音消除裝置、電子設備、及及非揮發性電腦可讀儲存媒體,尤其是有關回音消除技術領域。
回音消除(Acoustic Echo Cancelling ,AEC)技術在現代通訊電子設備中的應用十分廣泛,在雙方通話過程中,近端麥克風會採集到揚聲器的聲音,從而使遠端可以聽到自己的回音,因此回音消除性能的好壞嚴重影響著雙方的通話品質。
本申請發明人在實現本申請實施例的過程中,發現:在實際環境由於通訊設備、環境雜訊等因素影響,回音消除性能通常無法達到最優,會導致殘留較大回音。
本申請實施例的目的是提供一種雙麥克風陣列回音消除方法、裝置及電子設備,能夠有效提升回音消除效果,提高語音通話品質。
第一方面,本發明實施例提供了一種雙麥克風陣列回音消除方法,所述方法包括:
獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號;
對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜;
分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子;
利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號;
對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子;
利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號。
在一些實施例中,所述對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜,包括:
對所述遠端訊號進行傅立葉轉換,獲得遠端頻域資訊,對所述第一近端訊號進行傅立葉轉換,獲得第一近端頻域資訊,且對所述第二近端訊號進行傅立葉轉換,獲得第二近端頻域資訊;
使用上一幀更新的濾波器權重係數對所述遠端頻域資訊進行濾波處理,獲得回音頻譜;
用所述第一近端頻域資訊減去所述回音頻譜,獲得第一初始誤差頻譜;
用所述第二近端頻域資訊減去所述回音頻譜,獲得第二初始誤差頻譜。
在一些實施例中,所述分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,包括:
計算所述遠端頻域資訊與所述第一初始誤差頻譜之間的第一互相關係數,以及所述遠端頻域資訊與所述第二初始誤差頻譜之間的第二互相關係數;
對所述第一互相關係數進行質心擬合,獲得第一初始抑制增益因子,且對所述第二互相關係數進行質心擬合,獲得第二初始抑制增益因子;
用所述第一初始抑制增益因子乘以所述第一初始誤差頻譜,獲得所述第一誤差頻譜,且用所述第二初始抑制增益因子乘以所述第二初始誤差頻譜,獲得所述第二誤差頻譜。
在一些實施例中,所述將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子,包括:
基於所述第一初始抑制增益因子、所述第二初始抑制增益因子更新所述上一幀濾波器權重係數,獲得當前幀濾波器權重係數;
如果所述第一初始抑制增益因子、所述第二初始抑制增益因子小於預設閾值時,將所述第一初始抑制增益因子、所述第二初始抑制增益因子充當下一幀線性濾波處理的可變步長因子。
在一些實施例中,所述利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號,包括:
基於所述第一誤差頻譜和時延補償,計算第一支路頻譜訊號,且基於第二誤差頻譜和時延補償,計算第二支路頻譜訊號;
基於所述第一支路頻譜訊號和所述第二支路頻譜訊號,計算所述第一支路頻譜訊號與所述第二支路頻譜訊號之間的差分訊號互相關功率譜係數及自適應零極點回音消除器的權重係數;
利用所述自適應零極點回音消除器的權重係數對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號。
在一些實施例中,對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子,包括:
對初始抑制增益因子進行子帶範圍選取,獲得若干個子帶範圍內的初始抑制增益因子;
對若干個所述子帶範圍內的初始抑制增益因子進行排序處理,並計算抑制增益係數平滑因子;
利用所述抑制增益係數平滑因子對所述初始抑制增益因子做全頻帶平滑處理及指數運算,獲得所述二次抑制增益因子。
在一些實施例中,所述利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號,包括:
對所述目標頻譜訊號進行降噪處理;
用所述二次抑制增益因子乘以降噪處理後的所述目標頻譜訊號後,進行傅立葉逆變換,並重疊相加,獲得目標近端語音訊號。
第二方面,本發明實施例提供了一種雙麥克風陣列回音消除裝置,所述裝置包括:
訊號獲取模組,用於獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號;
線性濾波模組,用於對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜;
質心擬合模組,用於分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子;
殘留回音抑制模組,用於利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號;
平滑模組,用於對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子;
目標獲取模組,用於利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號。
第三方面,本發明實施例提供了一種電子設備,包括:
雙麥克風陣列和至少一個處理器,以及
儲存器,所述儲存器與所述至少一個處理器通訊連接,所述儲存器儲存有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行時,使所述電子設備實現上述任一項所述的方法。
第四方面,本發明實施例提供了一種非揮發性電腦可讀儲存媒體,所述電腦可讀儲存媒體儲存有電腦可執行指令,當所述電腦可執行指令被電子設備執行時,使所述電子設備執行如上所述的方法。
本發明實施例的雙麥克風陣列回音消除方法、裝置及電子設備,獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號,然後,對遠端訊號和雙麥克風陣列的近端訊號做初次濾波處理,可以對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜,從而初步消除回音;接著,分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子;利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號,從而實現殘留回音抑制;對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子,利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,實現二次抑制增益濾波,獲得目標近端語音訊號,有效提升回音消除效果,有效提高語音通話品質。
為讓本發明之上述和其他目的、特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式,作詳細說明如下。
一個或多個實施例通過與之對應的附圖中的圖片進行示例性說明,這些示例性說明並不構成對實施例的限定,附圖中具有相同參考數位標號的元件表示為類似的元件,除非有特別申明,附圖中的圖不構成比例限制。
下面結合具體實施例對本申請進行詳細說明。以下實施例將有助於本領域的具通常知識者進一步理解本申請,但不以任何形式限制本申請。應當指出的是,對本領域的普通技術人員來說,在不脫離本申請構思的前提下,還可以做出若干變形和改進。這些都屬於本申請的保護範圍。
為了使本申請的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本申請進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本申請,並不用於限定本申請。
需要說明的是,如果不衝突,本申請實施例中的各個特徵可以相互結合,均在本申請的保護範圍之內。另外,雖然在裝置示意圖中進行了功能模組劃分,在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同於裝置中的模組劃分,或流程圖中的循序執行所示出或描述的步驟。此外,本文所採用的「第一」、「第二」、「第三」等字樣並不對資料和執行次序進行限定,僅是對功能和作用基本相同的相同項或相似項進行區分。
除非另有定義,本說明書所使用的所有的技術和科學術語與屬於本申請的技術領域的技術人員通常理解的含義相同。本說明書中在本申請的說明書中所使用的術語只是為了描述具體的實施方式的目的,不是用於限制本申請。本說明書所使用的術語「和/或」包括一個或多個相關的所列項目的任意的和所有的組合。
此外,下面所描述的本申請各個實施方式中所涉及到的技術特徵只要彼此之間未構成衝突就可以相互組合。
本申請實施例提供的雙麥克風陣列回音消除方法和裝置可以應用於電子設備,電子設備可以為智慧手機、藍牙耳機、有線耳機等用於通話的設備,以藍牙耳機為例,將藍牙耳機與需要通話的智慧手機藍牙連接,用戶佩戴藍牙耳機,可以實現通話。
如圖1和圖2所示,電子設備100包括控制器11、揚聲器12和雙麥克風陣列13,控制器11與揚聲器12和雙麥克風陣列13連接。揚聲器12用於播放聲音,為遠端訊號;雙麥克風陣列13用於採集聲音,雙麥克風陣列13採集的聲音包括用戶說話的聲音、回音和背景雜訊,為近端訊號。並且,雙麥克風陣列13包括兩個麥克風,分別為第一麥克風mic1、第二麥克風mic2,雙麥克風陣列13為端射設置,如圖3所示,雙麥克風陣列13採用端射方式可以抑制非增益方向上的聲音,即揚聲器12方向上的聲音,從而可以保留需要增益方向上的聲音,即近端用戶說話方向上的聲音。控制器11用於獲取用戶在通話過程中產生的遠端訊號,以及第一麥克風mic1的第一近端訊號和第二麥克風mic2的第二近端訊號。
電子設備100還包括線性自適應濾波器模組14、自適應零極點回音抵消器15、單通道降噪模組NR和抑制增益濾波輸出模組16,且控制器11與線性自適應濾波器模組14、自適應零極點回音抵消器15、單通道降噪模組NR和抑制增益濾波輸出模組16連接。
其中,線性自適應濾波器模組14用於對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜,且控制器11從線性自適應濾波器模組14獲取第一初始誤差頻譜和第二初始誤差頻譜。
線性自適應濾波器模組14還用於分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子,且控制器11從線性自適應濾波器模組14獲得第一誤差頻譜和第一初始抑制增益因子、第二誤差頻譜和第二初始抑制增益因子,第一初始抑制增益因子和第二初始抑制增益因子組成初始抑制增益因子。
自適應零極點回音抵消器15用於對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號。
抑制增益濾波輸出模組16,用於對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子;利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號,且輸出所述目標近端語音訊號。
電子設備100還包括延時補償運算模組d/c,用於計算遠端訊號分別與第一近端訊號和/或第二近端訊號之間的時延補償。
通過控制器11、線性自適應濾波器模組14、自適應零極點回音抵消器15和抑制增益濾波輸出模組16對遠端訊號和近端訊號的初次濾波處理、質心擬合、殘留回音抑制以及二次濾波處理,實現電子設備100在通話過程中的回音消除,解決回音消除效果不佳、殘留回音過大的問題,從而有效提高語音通話品質。
請參閱圖4,圖4為本發明實施例提供的雙麥克風陣列回音消除方法的流程示意圖,所述方法應用於電子設備100,可以由電子設備100中的處理器111執行,如圖4所示,所述方法包括:
S401:獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號。
電子設備的控制器獲取電子設備在通話過程中產生的遠端訊號和近端訊號,遠端訊號為揚聲器播放的聲音訊號,近端訊號包括用戶說話的聲音、回音和/或背景雜訊。並且,雙麥克風陣列包括第一麥克風mic1和第二麥克風mic2,第一麥克風產生第一近端訊號,第二麥克風產生第二近端訊號。
遠端訊號用x(n)表示,且遠端訊號x(n)用公式1表示:
公式1;
第一近端訊號用d1(n)表示,且第一近端訊號d1(n)用公式2表示:
公式2;
第二近端訊號用d2(n)表示,且第二近端訊號d2(n)用公式3表示:
公式3;
其中,M表示一幀遠端訊號x(n)或第一近端訊號d1(n)、第二近端訊號d2(n)的採樣點數,i表示電子設備的控制器在採集遠端訊號x(n)或近端訊號d1(n)、第二近端訊號d2(n)的第i個採樣點。
S402:對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜。
在電子設備的控制器獲得遠端訊號x(n)、第一近端訊號d1(n)、第二近端訊號d2(n)後,線性自適應濾波器模組對遠端訊號x(n)第一近端訊號d1(n)、第二近端訊號d2(n)進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜。
在其中一些實施方式中,對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜,包括:
對所述遠端訊號進行傅立葉轉換,獲得遠端頻域資訊,對所述第一近端訊號進行傅立葉轉換,獲得第一近端頻域資訊,且對所述第二近端訊號進行傅立葉轉換,獲得第二近端頻域資訊;
使用上一幀更新的濾波器權重係數對所述遠端頻域資訊進行濾波處理,獲得回音頻譜;
用所述第一近端頻域資訊減去所述回音頻譜,獲得第一初始誤差頻譜;
用所述第二近端頻域資訊減去所述回音頻譜,獲得第二初始誤差頻譜。
具體地,首先,對遠端訊號x(n)進行傅立葉轉換,獲得遠端頻域資訊X(n),對第一近端訊號d1(n)進行傅立葉轉換,獲得第一近端頻域資訊D1(n),且對第二近端訊號d2(n)進行傅立葉轉換,獲得第二近端頻域資訊D2(n)。遠端頻域資訊X(n)用公式4表示,第一近端頻域資訊D1(n)用公式5表示,第二近端頻域資訊D2(n)用公式6表示:
公式4;
公式5;
公式6;
其中,X(n)表示第n幀遠端頻域資訊,D1(n)表示第n幀第一近端頻域資訊,D2(n)表示第n幀第二近端頻域資訊,win表示漢寧窗,長度大小為2*M,fft表示傅立葉轉換。近端頻域資訊D(n)包括第一近端頻域資訊D1(n)和第二近端頻域資訊D2(n)。
然後,使用上一幀更新的濾波器權重係數對遠端頻域資訊X(n)進行濾波處理,獲得回音頻譜,由於回音路徑與通話流程是固定的,可以在濾波前對遠端頻域資訊分別與第一近端頻域資訊D1(n)和第二近端頻域資訊D2(n)進行延遲對齊,從而估計出第一回音頻譜Y1(n)和第二回音頻譜Y2(n),上一幀更新的濾波器權重係數包括第一麥克風上一幀更新的濾波器權重係數
和第二麥克風上一幀更新的濾波器權重係數
。即對遠端頻域資訊X(n)在頻域上進行濾波,獲得回音頻譜用Y(n)表示,回音頻譜Y(n)包括第一回音頻譜Y1(n)和第二回音頻譜Y2(n),使用公式7和公式8計算:
公式7;
公式8。
其中,
表示第一麥克風上一幀更新的濾波器權重係數,
表示第二麥克風上一幀更新的濾波器權重係數。
最後,用所述近端頻域資訊D(n)減去所述回音頻譜Y(n),獲得第一初始誤差頻譜E1(n)和第二初始誤差頻譜E2(n),即用第一近端頻域資訊D1(n)減去第一回音頻譜Y1(n),獲得第一初始誤差頻譜E1(n);用第二近端頻域資訊D2(n)減去第二回音頻譜Y2(n),獲得第二初始誤差頻譜E2(n)。用公式9和公式10表示:
公式9;
公式10。
獲得的第一初始誤差頻譜E1(n)和第二初始誤差頻譜E2(n)可以初步消除第一麥克風和第二麥克風的線性回音。
S403:分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子。
為了減少近端訊號大部分線性回音,首先需要計算初始抑制增益因子,初始抑制增益因子包括第一初始抑制增益因子和第二初始抑制增益因子。分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,可以包括:
計算所述遠端頻域資訊與所述第一初始誤差頻譜之間的第一互相關係數,以及所述遠端頻域資訊與所述第二初始誤差頻譜之間的第二互相關係數;
對所述第一互相關係數進行質心擬合,獲得第一初始抑制增益因子,且對所述第二互相關係數進行質心擬合,獲得第二初始抑制增益因子;
用所述第一初始抑制增益因子乘以所述第一初始誤差頻譜,獲得所述第一誤差頻譜,且用所述第二初始抑制增益因子乘以所述第二初始誤差頻譜,獲得所述第二誤差頻譜。
具體地,首先,計算遠端頻域資訊X(n)與第一初始誤差頻譜E1(n)之間的第一互相關係數。同理,計算遠端頻域資訊X(n)與第二初始誤差頻譜E2(n)之間的第二互相關係數。
利用公式11-17,計算出第一互相關係數和第二互相關係數。
公式11;
公式12;
公式13;
公式14;
公式15;
公式16;
公式17。
其中,gamma表示平滑因子,一般取一個小於1但接近於1的數,如0.9;σ表示除法保護因子,可以令除法保護因子σ>0;conj表示共軛運算;
表示第一初始誤差頻譜的平滑功率譜;
表示第二初始誤差頻譜的平滑功率譜;
表示遠端頻域資訊的平滑功率譜,
表示遠端頻域資訊、第一近端頻域資訊及第一初始誤差頻譜的平滑功率譜,
表示遠端頻域資訊、第二近端頻域資訊及第二初始誤差頻譜的平滑功率譜;
表示第一互相關係數,
表示第二互相關係數。
接著,對第一互相關係數進行質心擬合,獲得第一初始抑制增益因子,且對第二互相關係數進行質心擬合,獲得第二初始抑制增益因子,可以使用公式18和公式19計算獲得:
公式18;
公式19;
其中,k表示質心擬合距離,i表示第n幀的第i個頻點,
表示第一初始抑制增益因子;
表示第二初始抑制增益因子。
在求得第一初始抑制增益因子
和第二初始抑制增益因子
後,用第一初始抑制增益因子
乘以第一初始誤差頻譜E1(n),獲得第一誤差頻譜,且用第二初始抑制增益因子
乘以第二初始誤差頻譜E2(n),獲得第二誤差頻譜,用公式20和公式21表示:
公式20;
公式21。
其中,
表示第一誤差頻譜,
表示第二誤差頻譜。
獲得的第一誤差頻譜
和第二誤差頻譜
可以減少大部分線性回音的近端頻域訊號。
在其中一些實施方式中,為了提高濾波器精度及魯棒性,可以即時更新濾波器權重係數,因此,所述將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子,可以包括:
基於所述第一初始抑制增益因子、所述第二初始抑制增益因子更新所述上一幀濾波器權重係數,獲得當前幀濾波器權重係數;
如果所述第一初始抑制增益因子、所述第二初始抑制增益因子小於預設閾值時,將所述第一初始抑制增益因子、所述第二初始抑制增益因子充當下一幀線性濾波處理的可變步長因子。
具體地,基於第一初始抑制增益因子
、第二初始抑制增益因子
更新上一幀濾波器權重係數
,上一幀濾波器權重係數包括第一麥克風上一幀更新的濾波器權重係數
和第二麥克風上一幀更新的濾波器權重係數
,獲得當前幀濾波器權重係數,用公式22和公式23表示:
公式22;
公式23。
其中,
表示第一麥克風mic1當前幀濾波器權重係數,
表示第二麥克風mic2當前幀濾波器權重係數;μ表示固定步長因子,通常範圍取0<μ<2;
表示第一麥克風mic1的濾波器係數調整量,
表示第二麥克風mic2的濾波器係數調整量,濾波器係數調整量的計算方法包括但不限於歸一化最小均方誤差(Least Mean Square,LMS)、遞迴最小二乘(Recursive Least Squares ,RLS)和卡爾曼等演算法;
表示第一初始抑制增益因子,
表示第二初始抑制增益因子,將
和
充當為下一幀線性濾波處理的可變步長因子,並執行對所述遠端頻域資訊進行濾波處理的步驟,使得濾波器更具有魯棒性(Robustness,健壯性、穩健性、強健性)。
因此,當濾波器未收斂時,殘留回音過大,步長變大,幫助濾波器快速收斂;當濾波器逐漸收斂時,如第一初始抑制增益因子
、第二初始抑制增益因子
逐漸變小,小於預設閾值,逐漸接近0的時候,例如預設閾值為0.01,步長逐漸減少,說明第一初始誤差頻譜E1(n)和第二初始誤差頻譜E2(n)中殘留回音較小或處於無回音狀態。然後,按照步驟S402,用當前幀濾波器權重係數(
和
)對遠端頻域資訊X(n)進行濾波處理,獲得回音頻譜,進而計算初始誤差頻譜。
S404:利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號。
在其中一些實施方式中,利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號,可以包括:
基於所述第一誤差頻譜和時延補償,計算第一支路頻譜訊號,且基於第二誤差頻譜和時延補償,計算第二支路頻譜訊號;
基於所述第一支路頻譜訊號和所述第二支路頻譜訊號,計算所述第一支路頻譜訊號與所述第二支路頻譜訊號之間的差分訊號互相關功率譜係數及自適應零極點回音消除器的權重係數;
利用所述自適應零極點回音消除器的權重係數對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號。
具體地,首先,計算兩個支路的頻譜訊號,即基於第一誤差頻譜和時延補償,計算第一支路頻譜訊號,且基於第二誤差頻譜和時延補償,計算第二支路頻譜訊號;然後,基於第一支路頻譜訊號和第二支路頻譜訊號,計算第一支路頻譜訊號與第二支路頻譜訊號之間的差分訊號互相關功率譜係數及自適應零極點回音消除器的權重係數,最後利用所述自適應零極點回音消除器的權重係數對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號。可以使用公式24-公式29獲得:
公式24;
公式25;
公式26;
公式27;
公式28;
公式29。
其中,
表示第二支路頻譜訊號;
表示第一支路頻譜訊號;delay表示時延補償運算,
表示第一支路的時延補償,
表示第二支路的時延補償;α的取值範圍為0≤α≤1,β的取值範圍為0≤β≤1,且α+β=1;
表示自適應零極點回音抵消器權重係數,
表示差分訊號互相關功率譜係數,
表示第二支路自相關功率譜;
表示目標頻譜訊號。
S405:對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子。
為了提升回音消除效果,可以對初始抑制增益因子進行平滑。
在其中一些實施方式中,所述初始抑制增益因子包括所述第一初始抑制增益因子和所述第二初始抑制增益因子,對初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子,可以包括:
對所述初始抑制增益因子進行子帶範圍選取,獲得若干個子帶範圍;
對若干個所述子帶範圍內的初始抑制增益因子進行排序處理,並計算抑制增益係數平滑因子;
利用所述抑制增益係數平滑因子對所述初始抑制增益因子做全頻帶平滑處理及指數運算,獲得所述二次抑制增益因子。
具體地,子帶範圍的選取,可以選取子帶最小值minFre、子帶最大值maxFre和參考子帶點refFre,然後,對子帶範圍進行排序處理,比如從小到大的順序,得到序列hNI,並根據公式30選取參考值Refer,公式30如下所示:
公式30。
其中,
表示參考值;refFre表示參考子帶點;hNI表示子帶範圍從小到大的序列。
可以利用公式31計算抑制增益係數平滑因子,公式31如下:
公式31。
其中,
表示抑制增益係數平滑因子;minFre表示子帶最小值;maxFre表示子帶最大值,refFre表示參考子帶點;i表示第n幀的第i個頻點。
在求得抑制增益係數平滑因子
後,利用抑制增益係數平滑因子
對初始抑制增益因子做全頻帶平滑處理及指數運算,獲得二次抑制增益因子,用公式32表示:
公式32。
其中,初始抑制增益因子包括第一初始抑制增益因子g1(i)和第二初始抑制增益因子g2(i),G(i)表示二次抑制增益因子。
S406:利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號。
為了盡可能消除殘留回音,同時為了避免二次濾波可能損傷近端訊號,得到最優的輸出。利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號,可以包括:
對所述目標頻譜訊號進行降噪處理;
用所述二次抑制增益因子乘以降噪處理後的所述目標頻譜訊號後,進行傅立葉逆變換,並重疊相加,獲得目標近端語音訊號。
具體地,首先對目標頻譜訊號進行降噪處理,然後,用二次抑制增益因子乘以降噪處理後的目標頻譜訊號後,進行傅立葉逆變換,並重疊相加,獲得目標近端語音訊號。用公式33-公式36計算獲得:
公式33;
公式34;
公式35;
公式36。
其中,
表示重疊相加保留塊,ifft表示傅立葉逆變換;NR表示降噪演算法處理,
表示降噪處理後的目標頻譜訊號,
表示誤差頻譜,包括第一誤差頻譜
和第二誤差頻譜
;
表示目標近端語音訊號。
本發明實施例,獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號,然後,對遠端訊號和雙麥克風陣列的近端訊號做初次濾波處理,可以對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜,從而初步消除回音;接著,分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子;利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號,從而實現殘留回音抑制;對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子,利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,實現二次抑制增益濾波,獲得目標近端語音訊號,有效提升回音消除效果,有效提高語音通話品質。
相應的,如圖5所示,本發明實施例還提供了一種雙麥克風陣列回音消除裝置,可以用於電子設備,雙麥克風陣列回音消除裝置500包括:
訊號獲取模組501,用於獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號;
線性濾波模組502,用於對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜;
質心擬合模組503,用於分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子;
殘留回音抑制模組504,用於利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號;
平滑模組505,用於對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子;
目標獲取模組506,用於利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,獲得目標近端語音訊號。
本發明實施例,獲取電子設備在通話過程中產生的遠端訊號,以及雙麥克風陣列的第一近端訊號和第二近端訊號,然後,對遠端訊號和雙麥克風陣列的近端訊號做初次濾波處理,可以對所述遠端訊號、所述第一近端訊號和第二近端訊號進行線性濾波處理,獲得第一初始誤差頻譜和第二初始誤差頻譜,從而初步消除回音;接著,分別對所述第一初始誤差頻譜和第二初始誤差頻譜進行質心擬合,獲得所述第一近端訊號和所述第二近端訊號的初始抑制增益因子,並將所述初始抑制增益因子充當下一幀線性濾波處理的可變步長因子;利用自適應零極點回音消除器對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號,從而實現殘留回音抑制;對所述初始抑制增益因子進行子帶範圍選取後,求得平滑因子,並進行全頻帶平滑及指數運算,獲得二次抑制增益因子,利用所述二次抑制增益因子對所述目標頻譜訊號進行濾波處理,實現二次抑制增益濾波,獲得目標近端語音訊號,有效提升回音消除效果,有效提高語音通話品質。
在其他實施例中,線性濾波模組502,還用於:
對所述遠端訊號進行傅立葉轉換,獲得遠端頻域資訊,對所述第一近端訊號進行傅立葉轉換,獲得第一近端頻域資訊,且對所述第二近端訊號進行傅立葉轉換,獲得第二近端頻域資訊;
使用上一幀更新的濾波器權重係數對所述遠端頻域資訊進行濾波處理,獲得回音頻譜;
用所述第一近端頻域資訊減去所述回音頻譜,獲得第一初始誤差頻譜;
用所述第二近端頻域資訊減去所述回音頻譜,獲得第二初始誤差頻譜。
在其他實施例中,質心擬合模組503,還用於:
計算所述遠端頻域資訊與所述第一初始誤差頻譜之間的第一互相關係數,以及所述遠端頻域資訊與所述第二初始誤差頻譜之間的第二互相關係數;
對所述第一互相關係數進行質心擬合,獲得第一初始抑制增益因子,且對所述第二互相關係數進行質心擬合,獲得第二初始抑制增益因子;
用所述第一初始抑制增益因子乘以所述第一初始誤差頻譜,獲得所述第一誤差頻譜,且用所述第二初始抑制增益因子乘以所述第二初始誤差頻譜,獲得所述第二誤差頻譜。
在其他實施例中,雙麥克風陣列回音消除裝置500還包括更新模組507,用於:
基於所述第一初始抑制增益因子、所述第二初始抑制增益因子更新所述上一幀濾波器權重係數,獲得當前幀濾波器權重係數;
如果所述第一初始抑制增益因子、所述第二初始抑制增益因子小於預設閾值時,將所述第一初始抑制增益因子、所述第二初始抑制增益因子充當下一幀線性濾波處理的可變步長因子。
在其他實施例中,殘留回音抑制模組504,還用於:
基於所述第一誤差頻譜和時延補償,計算第一支路頻譜訊號,且基於第二誤差頻譜和時延補償,計算第二支路頻譜訊號;
基於所述第一支路頻譜訊號和所述第二支路頻譜訊號,計算所述第一支路頻譜訊號與所述第二支路頻譜訊號之間的差分訊號互相關功率譜係數及自適應零極點回音消除器的權重係數;
利用所述自適應零極點回音消除器的權重係數對所述第一誤差頻譜和第二誤差頻譜進行殘留回音抑制,獲得目標頻譜訊號。
在其他實施例中,平滑模組505,還用於:
對初始抑制增益因子進行子帶範圍選取,獲得若干個子帶範圍內的初始抑制增益因子;
對若干個所述子帶範圍內的初始抑制增益因子進行排序處理,並計算抑制增益係數平滑因子;
利用所述抑制增益係數平滑因子對所述初始抑制增益因子做全頻帶平滑處理及指數運算,獲得所述二次抑制增益因子。
在其他實施例中,目標獲取模組506,還用於:
對所述目標頻譜訊號進行降噪處理;
用所述二次抑制增益因子乘以降噪處理後的所述目標頻譜訊號後,進行傅立葉逆變換,並重疊相加,獲得目標近端語音訊號。
需要說明的是,上述裝置可執行本申請實施例所提供的方法,具備執行方法相應的功能模組和有益效果。未在裝置實施例中詳盡描述的技術細節,可參見本申請實施例所提供的方法。
圖6為電子設備100的一個實施例中電子設備100控制器的硬體結構示意圖,如圖6所示,控制器110包括:
一個或多個處理器111、儲存器112。圖6中以一個處理器111、一個儲存器112為例。
處理器111、儲存器112可以通過匯流排或者其他方式連接,圖6中以通過匯流排連接為例。
儲存器112作為一種非揮發性電腦可讀儲存媒體,可用於儲存非揮發性軟體程序、非揮發性電腦可執行程序以及模組,如本申請實施例中的雙麥克風陣列回音消除方法對應的程序指令/模組(例如,附圖5所示的訊號獲取模組501、線性濾波模組502、質心擬合模組503、殘留回音抑制模組504、平滑模組505、目標獲取模組506、更新模組507)。處理器111通過運行儲存在儲存器112中的非揮發性軟體程序、指令以及模組,從而執行控制器的各種功能應用以及數據處理,即實現上述方法實施例的雙麥克風陣列回音消除方法。
儲存器112可以包括儲存程序區和儲存數據區,其中,儲存程序區可儲存作業系統、至少一個功能所需要的應用程序;儲存數據區可儲存根據電子設備100的使用所創建的數據等。此外,儲存器112可以包括高速隨機存取儲存器,還可以包括非揮發性儲存器,例如至少一個磁碟儲存器件、快閃記憶體器件、或其他非揮發性固態儲存器件。在一些實施例中,儲存器112可選包括相對於處理器111遠端設置的儲存器,這些遠端儲存器可以通過網路連接至訊號長時間記錄設備。上述網路的實例包括但不限於互聯網、企業內部網、局域網、移動通訊網及其組合。
所述一個或者多個模組儲存在所述儲存器112中,當被所述一個或者多個處理器111執行時,執行上述任意方法實施例中的雙麥克風陣列回音消除方法,例如,執行以上描述的圖4中的方法步驟S401至步驟S406的方法步驟;實現圖5中的模組501-507的功能。
上述產品可執行本申請實施例所提供的方法,具備執行方法相應的功能模組和有益效果。未在本實施例中詳盡描述的技術細節,可參見本申請實施例所提供的方法。
本申請實施例提供了一種非揮發性電腦可讀儲存媒體,所述電腦可讀儲存媒體儲存有電腦可執行指令,該電腦可執行指令被一個或多個處理器執行,例如圖6中的一個處理器111,可使得上述一個或多個處理器可執行上述任意方法實施例中的雙麥克風陣列回音消除方法,例如,執行以上描述的圖4中的方法步驟S401至步驟S406的方法步驟;實現圖5中的模組501-507的功能。
以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部模組來實現本實施例方案的目的。
通過以上的實施例的描述,本發明所屬技術領域中具有通常知識者可以清楚地瞭解到各實施例可借助軟體加通用硬體平臺的方式來實現,當然也可以通過硬體。本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程是可以通過電腦程序來指令相關的硬體來完成,所述的程序可儲存於一電腦可讀取儲存媒體中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的儲存媒體可為磁碟、光碟、唯讀儲存記憶體(Read-Only Memory,ROM)或隨機儲存記憶體(Random Access Memory,RAM)等。
最後應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;在本發明的思路下,以上實施例或者不同實施例中的技術特徵之間也可以進行組合,步驟可以以任意順序實現,並存在如上所述的本發明的不同方面的許多其它變化,為了簡明,它們沒有在細節中提供;儘管參照前述實施例對本發明進行了詳細的說明,本發明所屬技術領域中具有通常知識者應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的範圍。
100:電子設備
11:控制器
12:揚聲器
13:麥克風陣列
14:線性自適應濾波器模組
15:自適應零極點回音抵消器模組
16:增益抑制濾波輸出模組
NR:單通道降噪模組
mic1:第一麥克風
mic2:第二麥克風
w1、w2、w3:濾波器權重係數
b(n):第一支路頻譜訊號
f(n):第二支路頻譜訊號
e1(n):第一初始誤差頻譜
e2(n):第二初始誤差頻譜
d/c:延時補償運算模組
out:輸出
S401~S406:步驟
501:訊號獲取模組
502:線性濾波模組
503:質心擬合模組
504:殘留回音抑制模組
505:平滑模組
506:目標獲取模組
507:更新模組
110:控制器
111:處理器
112:儲存器
圖1為本發明一實施例所提供的電子設備的示意性方塊圖;
圖2為本發明一實施例所提供的電子設備的電路結構圖;
圖3為本發明一實施例所提供的電子設備的雙麥克風陣列的結構示意圖;
圖4為本發明一實施例所提供的雙麥克風陣列回音消除方法的流程示意圖;
圖5為本發明一實施例所提供的雙麥克風陣列回音消除裝置的結構示意圖;以及
圖6為本發明一實施例所提供的電子設備的控制器的硬體結構示意圖。
S401~S406:步驟
Claims (11)
- 一種雙麥克風陣列回音消除方法,包括: 獲取一電子設備在通話過程中產生的一遠端訊號,以及一雙麥克風陣列的一第一近端訊號和一第二近端訊號; 對該遠端訊號、該第一近端訊號和該第二近端訊號進行線性濾波處理,獲得一第一初始誤差頻譜和一第二初始誤差頻譜; 分別對該第一初始誤差頻譜和該第二初始誤差頻譜進行質心擬合,獲得該第一近端訊號和該第二近端訊號的一初始抑制增益因子,並將該初始抑制增益因子充當下一幀線性濾波處理的一可變步長因子; 利用一自適應零極點回音消除器對該第一誤差頻譜和該第二誤差頻譜進行殘留回音抑制,獲得一目標頻譜訊號; 對該初始抑制增益因子進行子帶範圍選取後,求得一平滑因子,並進行全頻帶平滑及指數運算,獲得一二次抑制增益因子; 利用該二次抑制增益因子對該目標頻譜訊號進行濾波處理,獲得一目標近端語音訊號。
- 如請求項1所述之雙麥克風陣列回音消除方法,其中,該對該遠端訊號、該第一近端訊號和該第二近端訊號進行線性濾波處理,獲得該第一初始誤差頻譜和該第二初始誤差頻譜,包括: 對該遠端訊號進行傅立葉轉換,獲得一遠端頻域資訊,對該第一近端訊號進行傅立葉轉換,獲得一第一近端頻域資訊,且對該第二近端訊號進行傅立葉轉換,獲得一第二近端頻域資訊; 使用一上一幀更新的濾波器權重係數對該遠端頻域資訊進行濾波處理,獲得一回音頻譜; 用該第一近端頻域資訊減去該回音頻譜,獲得一第一初始誤差頻譜; 用該第二近端頻域資訊減去該回音頻譜,獲得一第二初始誤差頻譜。
- 如請求項2所述之雙麥克風陣列回音消除方法,其中,該分別對該第一初始誤差頻譜和該第二初始誤差頻譜進行質心擬合,獲得該第一近端訊號和該第二近端訊號的該初始抑制增益因子,包括: 計算該遠端頻域資訊與該第一初始誤差頻譜之間的一第一互相關係數,以及該遠端頻域資訊與該第二初始誤差頻譜之間的一第二互相關係數; 對該第一互相關係數進行質心擬合,獲得一第一初始抑制增益因子,且對該第二互相關係數進行質心擬合,獲得一第二初始抑制增益因子; 用該第一初始抑制增益因子乘以該第一初始誤差頻譜,獲得該第一誤差頻譜,且用該第二初始抑制增益因子乘以該第二初始誤差頻譜,獲得該第二誤差頻譜。
- 如請求項3所述之雙麥克風陣列回音消除方法,其中,該將該初始抑制增益因子充當下一幀線性濾波處理的該可變步長因子,包括: 基於該第一初始抑制增益因子、該第二初始抑制增益因子更新該上一幀濾波器權重係數,獲得一當前幀濾波器權重係數; 如果該第一初始抑制增益因子、該第二初始抑制增益因子小於一預設閾值時,將該第一初始抑制增益因子、該第二初始抑制增益因子充當下一幀線性濾波處理的該可變步長因子。
- 如請求項1所述之雙麥克風陣列回音消除方法,其中,該利用該自適應零極點回音消除器對該第一誤差頻譜和該第二誤差頻譜進行殘留回音抑制,獲得該目標頻譜訊號,包括: 基於該第一誤差頻譜和一時延補償,計算一第一支路頻譜訊號,且基於該第二誤差頻譜和該時延補償,計算一第二支路頻譜訊號; 基於該第一支路頻譜訊號和該第二支路頻譜訊號,計算該第一支路頻譜訊號與該第二支路頻譜訊號之間的一差分訊號互相關功率譜係數及一自適應零極點回音消除器的權重係數; 利用該自適應零極點回音消除器的權重係數對該第一誤差頻譜和該第二誤差頻譜進行殘留回音抑制,獲得該目標頻譜訊號。
- 如請求項1所述之雙麥克風陣列回音消除方法,其中,該對該初始抑制增益因子進行子帶範圍選取後,求得該平滑因子,並進行全頻帶平滑及指數運算,獲得該二次抑制增益因子,包括: 對該初始抑制增益因子進行子帶範圍選取,獲得若干個子帶範圍內的該初始抑制增益因子; 對若干個所述子帶範圍內的該初始抑制增益因子進行排序處理,並計算一抑制增益係數平滑因子; 利用該抑制增益係數平滑因子對該初始抑制增益因子做全頻帶平滑處理及指數運算,獲得該二次抑制增益因子。
- 如請求項1至6中任一項所述之雙麥克風陣列回音消除方法,其中,該利用該二次抑制增益因子對該目標頻譜訊號進行濾波處理,獲得該目標近端語音訊號,包括: 對該目標頻譜訊號進行降噪處理; 用該二次抑制增益因子乘以降噪處理後的該目標頻譜訊號後,進行傅立葉逆變換,並重疊相加,獲得該目標近端語音訊號。
- 一種雙麥克風陣列回音消除裝置,包括: 一訊號獲取模組,用於獲取一電子設備在通話過程中產生的一遠端訊號,以及一雙麥克風陣列的一第一近端訊號和一第二近端訊號; 一線性濾波模組,用於對該遠端訊號、該第一近端訊號和該第二近端訊號進行線性濾波處理,獲得一第一初始誤差頻譜和一第二初始誤差頻譜; 一質心擬合模組,用於分別對該第一初始誤差頻譜和該第二初始誤差頻譜進行質心擬合,獲得該第一近端訊號和該第二近端訊號的一初始抑制增益因子,並將該初始抑制增益因子充當下一幀線性濾波處理的一可變步長因子; 一殘留回音抑制模組,用於利用一自適應零極點回音消除器對該第一誤差頻譜和該第二誤差頻譜進行殘留回音抑制,獲得一目標頻譜訊號; 一平滑模組,用於對該初始抑制增益因子進行子帶範圍選取後,求得一平滑因子,並進行全頻帶平滑及指數運算,獲得一二次抑制增益因子; 一目標獲取模組,用於利用該二次抑制增益因子對該目標頻譜訊號進行濾波處理,獲得一目標近端語音訊號。
- 一種電子設備,包括: 一雙麥克風陣列和至少一處理器以及一儲存器,該儲存器與該至少一處理器通訊連接,該儲存器儲存有可被該至少一處理器執行的一指令,該指令被該至少一處理器執行,以使該至少一處理器能夠執行請求項1至7中任一項所述的雙麥克風陣列回音消除方法。
- 如請求項9所述之電子設備,其中,該雙麥克風陣列為端射設置。
- 一種非揮發性電腦可讀儲存媒體,儲存有一電腦可執行指令,當該電腦可執行指令被一電子設備執行時,使該電子設備執行如請求項1至7中任一項所述之雙麥克風陣列回音消除方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022104702239 | 2022-04-28 | ||
CN202210470223.9A CN114822575A (zh) | 2022-04-28 | 2022-04-28 | 一种双麦克风阵列回声消除方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202331701A true TW202331701A (zh) | 2023-08-01 |
Family
ID=82509355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112113463A TW202331701A (zh) | 2022-04-28 | 2023-04-11 | 雙麥克風陣列回音消除方法、雙麥克風陣列回音消除裝置、電子設備、及非揮發性電腦可讀儲存媒體 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230353683A1 (zh) |
JP (1) | JP2023164265A (zh) |
KR (1) | KR102649227B1 (zh) |
CN (1) | CN114822575A (zh) |
DE (1) | DE102022134574A1 (zh) |
TW (1) | TW202331701A (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170052056A (ko) * | 2015-11-03 | 2017-05-12 | 삼성전자주식회사 | 전자 장치 및 그의 음향 에코 저감 방법 |
CN107610713B (zh) * | 2017-10-23 | 2022-02-01 | 科大讯飞股份有限公司 | 基于时延估计的回声消除方法及装置 |
KR20200024066A (ko) * | 2018-08-27 | 2020-03-06 | 서강대학교산학협력단 | 스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법 |
KR102517975B1 (ko) * | 2019-01-29 | 2023-04-04 | 삼성전자주식회사 | 시간 상관 관계에 기초하여 잔여 에코를 추정하는 잔여 에코 추정기, 잔여 에코를 추정하는 프로그램 코드를 저장하는 비일시적 컴퓨터 판독 가능한 매체, 그리고 어플리케이션 프로세서 |
-
2022
- 2022-04-28 CN CN202210470223.9A patent/CN114822575A/zh active Pending
- 2022-11-10 US US18/054,153 patent/US20230353683A1/en active Pending
- 2022-12-08 KR KR1020220170731A patent/KR102649227B1/ko active IP Right Grant
- 2022-12-08 JP JP2022196688A patent/JP2023164265A/ja active Pending
- 2022-12-22 DE DE102022134574.2A patent/DE102022134574A1/de active Pending
-
2023
- 2023-04-11 TW TW112113463A patent/TW202331701A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
JP2023164265A (ja) | 2023-11-10 |
DE102022134574A1 (de) | 2023-11-02 |
KR20230153236A (ko) | 2023-11-06 |
US20230353683A1 (en) | 2023-11-02 |
KR102649227B1 (ko) | 2024-03-18 |
CN114822575A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727604B (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
CN105144674B (zh) | 多通道回声消除与噪声抑制 | |
TWI488179B (zh) | 藉由歸零處理雜訊減除提供雜訊抑制的方法及系統 | |
CN110169041B (zh) | 一种声回波消除的方法和系统 | |
CN108376548B (zh) | 一种基于麦克风阵列的回声消除方法与系统 | |
KR101183847B1 (ko) | 다중의 오디오 신호를 사용하여 주변 잡음을 억제하는 방법 및 장치 | |
US8958572B1 (en) | Adaptive noise cancellation for multi-microphone systems | |
EP3791565B1 (en) | Method and apparatus utilizing residual echo estimate information to derive secondary echo reduction parameters | |
CN111131947B (zh) | 耳机信号处理方法、系统和耳机 | |
US9699554B1 (en) | Adaptive signal equalization | |
US20160066087A1 (en) | Joint noise suppression and acoustic echo cancellation | |
US10115412B2 (en) | Signal processor with side-tone noise reduction for a headset | |
EP4071757A1 (en) | Echo cancellation method and device | |
CN111354368B (zh) | 补偿处理后的音频信号的方法 | |
US10129410B2 (en) | Echo canceller device and echo cancel method | |
TWI465121B (zh) | 利用全方向麥克風改善通話的系統及方法 | |
CN111445916B (zh) | 一种会议系统中音频去混响方法、装置及存储介质 | |
CN109326297B (zh) | 自适应后滤波 | |
TW202331701A (zh) | 雙麥克風陣列回音消除方法、雙麥克風陣列回音消除裝置、電子設備、及非揮發性電腦可讀儲存媒體 | |
KR20220157475A (ko) | 반향 잔류 억제 | |
JP7495684B2 (ja) | エコー除去方法、装置および電子機器 | |
TW202331700A (zh) | 回音消除方法、回音消除裝置、及電子設備 | |
CN117099361A (zh) | 用于经滤波参考声学回声消除的装置和方法 | |
CN118072752A (zh) | Ows耳机的语音增强方法、系统、耳机及存储介质 | |
CN115631761A (zh) | 回声消除装置、方法、计算机设备及存储介质 |