TW201813342A - 全雙工語音通信系統及方法 - Google Patents

全雙工語音通信系統及方法 Download PDF

Info

Publication number
TW201813342A
TW201813342A TW106128763A TW106128763A TW201813342A TW 201813342 A TW201813342 A TW 201813342A TW 106128763 A TW106128763 A TW 106128763A TW 106128763 A TW106128763 A TW 106128763A TW 201813342 A TW201813342 A TW 201813342A
Authority
TW
Taiwan
Prior art keywords
functionality
end signal
received
acoustic echo
signal
Prior art date
Application number
TW106128763A
Other languages
English (en)
Inventor
譚美 查格爾
狄龍 里德 里特爾
魯道夫 席爾瓦
艾瑞克 貝斯
弗朗西斯 查克威美卡 歐諾齊
Original Assignee
美商美高森美半導體美國公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商美高森美半導體美國公司 filed Critical 美商美高森美半導體美國公司
Publication of TW201813342A publication Critical patent/TW201813342A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/21Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a set of bandfilters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/234Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using double talk detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

一種全雙工語音通信方法由以下操作組成:估計一近端信號內之一聲學回聲;消除該所估計聲學回聲;偵測一改變是否已出現於一近端聲學回聲路徑中,該所接收之近端信號是否表示話音且該所接收之遠端信號是否表示靜音,其中回應於其結果,該方法進一步由以下操作組成:使該經回聲消除之近端信號的頻率分量交替地衰減一第一頻域衰減值及一第二較大頻域衰減值;使該經頻率分量衰減之經回聲消除之近端信號的一第一函數交替地衰減一第一可切換衰減值及一第二較大可切換衰減值;及使該所接收之遠端信號的一第二函數交替地衰減一第三可切換衰減值及一第四較大可切換衰減值。

Description

全雙工語音通信系統及方法
本發明係有關於一種語音通信系統及方法,特別是關於一種全雙工之語音通信系統及方法。
在語音電信期間,在第一端處之說話者的語音係在第二端處輸出。輸出語音藉由第二端處之麥克風拾取,且作為回聲發送回至說話者。為克服回聲問題,聲學回聲消除器經提供以估計聲學回聲且將其自藉由麥克風輸出之信號移除。在語音通信之啟動期間,聲學回聲消除器提供迅速回聲消除,然而,迅速回聲消除方法通常過調且消除並非回聲之語音。因此,在啟動之後,聲學回聲消除器進入穩定狀態模式,在該模式中,聲學估計更準確,然而,對改變之回應不如啟動期間迅速。
若在說話者與麥克風之間的聲學回聲路徑中存在改變,諸如當某人在麥克風或揚聲器前方揮動其手時,則聲學回聲消除器之穩定狀態不能恰當地估計聲學回聲,且回聲消除效率較低,從而引起語音通信上之回聲。因此,聲學回聲路徑改變偵測器經提供以便偵測聲學回聲路徑中之改變。若聲學回聲路徑中之改變被偵測到,則聲學回聲消除器切換至迅速啟動模式以便固定聲學回聲估計且改良回聲消除。
另外,全雙工語音通信系統提供對其他背景雜訊之消除,以便提供高品質通信。
不幸地,先前技術全雙工語音通信系統之速度及準確度需要改良,以便改良語音通信之品質。
因此,本發明之主要目標為克服先前技術全雙工語音通信系統之缺點中的至少一些。在一個具體例中,此藉由一種全雙工語音通信系統提供,該全雙工語音通信系統包含:一近端輸入埠,其經配置以接收一近端信號;一遠端輸入埠,其與一遠端通信裝置通信且經配置以接收來自該遠端通信裝置之一遠端信號;一聲學回聲估計功能性,其經配置以回應於該所接收之遠端信號而估計該所接收之近端信號內的一聲學回聲;一聲學回聲消除功能性,其經配置以將該所估計聲學回聲自該所接收之近端信號消除;一頻域處理功能性;一第一可切換衰減功能性;一第二可切換衰減功能性;一回聲路徑改變偵測功能性,其經配置以偵測一近端聲學回聲路徑中之一改變;一近端話音偵測功能性,其經配置以偵測該所接收之近端信號是否表示話音;一遠端靜音偵測功能性,其經配置以偵測該所接收之遠端信號是否表示靜音;及一系統協調單元,其中回應於該回聲路徑改變偵測功能性之一輸出、該近端話音偵測功能性之一輸出及該遠端靜音偵測功能性之一輸出,該系統協調單元經配置以進行以下操作:控制該頻域處理功能性以使該經回聲消除之近端信號的頻率分量交替地衰減一第一頻域衰減值及一第二頻域衰減值,該第二頻域衰減值大於該第一頻域衰減值;控制該第一可切換衰減功能性以使該頻域處理功能性之一輸出的一第一函數交 替地衰減一第一可切換衰減值及一第二可切換衰減值,該第二可切換衰減值大於該第一可切換衰減值;及控制該第二可切換衰減功能性以使該所接收之遠端信號的一第二函數交替地衰減一第三可切換衰減值及一第四可切換衰減值,該第四可切換衰減值大於該第三可切換衰減值。
在一個具體例中,該系統協調單元控制該第一可切換衰減功能性以使該頻域處理功能性之該輸出的該第一函數衰減該第二可切換衰減值的該配置及該系統協調單元控制該第二可切換衰減功能性以使該所接收之遠端信號的該第二函數衰減該第四可切換衰減值的該配置係回應於一聲學回聲路徑改變藉由該回聲路徑改變偵測功能性之偵測。在另一具體例中,該系統協調單元控制該頻域處理功能性以使該經回聲消除之近端信號的該等頻率分量衰減該第二頻域衰減值的該配置係回應於以下所有三者之一組合:藉由該回聲路徑改變偵測功能性偵測到一聲學回聲路徑改變;藉由該近端話音偵測功能性偵測到該所接收之近端信號表示話音;及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號不表示靜音。
在一個具體例中,回應於該回聲路徑改變偵測功能性之該輸出、該近端話音偵測功能性之該輸出及該遠端靜音偵測功能性之該輸出,該系統協調單元經進一步配置以控制該聲學回聲估計功能性以交替地進行以下操作:不更新該所估計聲學回聲;以一第一速度更新該所估計聲學回聲;及以一第二速度更新該所估計聲學回聲,該第二速度大於該第一速度。在一個其他具體例中,該系統協調單元控制該聲學回聲估計功能性以該第二速度更新該所估計 聲學回聲的該配置係回應於以下所有三者之一組合:藉由該回聲路徑改變偵測功能性偵測到一聲學回聲路徑改變;藉由該近端話音偵測功能性偵測到該所接收之近端信號不表示話音;及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號不表示靜音。
在一個具體例中,該系統進一步包含一雜訊估計功能性,其中回應於藉由該近端話音偵測功能性偵測到該所接收之近端信號不表示話音及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號表示靜音,該系統協調單元經進一步配置以回應於該所接收之近端信號而控制該雜訊估計功能性以估計近端背景雜訊,且其中該系統協調單元經進一步配置以回應於以下所有三者之一組合而控制該頻域處理功能性以將該所估計近端背景雜訊之一雜訊函數輸出至該遠端輸出埠:藉由該回聲路徑改變偵測功能性未偵測到一聲學回聲路徑改變;藉由該近端話音偵測功能性偵測到該所接收之近端信號不表示話音;及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號不表示靜音。
在一個具體例中,該系統進一步包含:一近端飽和偵測功能性,其經配置以偵測該所接收之近端信號的一振幅位準;及一揚聲器飽和偵測功能性,其經配置以偵測該所接收之遠端信號的一振幅位準,其中該系統協調單元經進一步配置以回應於該所接收之近端信號的該偵測到之振幅位準超過一近端飽和值及該所接收之遠端信號的該偵測到之振幅位準超過一遠端飽和值中的一者而控制該聲學回聲估計功能性以不更新該所估計聲學回聲。在另一具體例中,該系統進一步包含:一近端窄頻帶信號偵測功能性,其經配置以偵測該所接收之近端信號內的一窄頻帶載頻調的一表示;及 一遠端窄頻帶信號偵測功能性,其經配置以偵測該所接收之遠端信號內的一窄頻帶載頻調的一表示,其中該系統協調單元經進一步配置以回應於該偵測到之近端窄頻帶載頻調及該偵測到之遠端窄頻帶載頻調中的一者而控制該聲學回聲估計功能性以不更新該所估計聲學回聲。
在一個具體例中,該回聲路徑改變偵測功能性包含:一時域路徑改變偵測功能性,其經配置以進行以下操作:執行對該所接收之近端信號的一時域分析;回應於該時域分析而偵測該近端聲學回聲路徑中之一改變;及輸出該偵測到之改變的一指示,一頻域路徑改變偵測功能性,其經配置以進行以下操作:執行對該所接收之遠端信號及該經回聲消除之近端信號的一頻域分析;回應於該頻域分析而偵測該近端聲學回聲路徑中之一改變;及輸出該偵測到之改變的一指示,及一組合路徑改變偵測功能性,其經配置以判定該時域路徑改變偵測功能性之該輸出指示及該頻域路徑改變偵測功能性之該輸出指示的一第三函數,其中該回聲路徑改變偵測功能性之該聲學回聲路徑改變偵測係回應於該等輸出之該經判定之第三函數。
獨立地,諸具體例提供一種全雙工語音通信方法,該方法包含:接收一近端信號;接收來自一遠端通信裝置之一遠端信號;回應於該所接收之遠端信號而估計該所接收之近端信號內的一聲學回聲;將該所估計聲學回聲自該所接收之近端信號消除;偵測一改變是否已出現於一近端聲學回聲路徑中;偵測該所接收之近端信號是否表示話音;及偵測該所接收之遠端信號是否表示靜音,其中回應於該近端聲學回聲路徑改變偵測之一結果、該近端信號話音 表示偵測之一結果及該遠端靜音表示偵測之一結果,該方法進一步包含:使該經回聲消除之近端信號的頻率分量交替地衰減一第一頻域衰減值及一第二頻域衰減值,該第二頻域衰減值大於該第一頻域衰減值;使該經頻率分量衰減之經回聲消除之近端信號的一第一函數交替地衰減一第一可切換衰減值及一第二可切換衰減值,該第二可切換衰減值大於該第一可切換衰減值;及使該所接收之遠端信號的一第二函數交替地衰減一第三可切換衰減值及一第四可切換衰減值,該第四可切換衰減值大於該第三可切換衰減值。
在一個具體例中,該使該經頻率分量衰減之經回聲消除之近端信號的該第一函數衰減該第二可切換衰減值及該使該所接收之遠端信號的該第二函數衰減該第四可切換衰減值係回應於偵測到一聲學回聲路徑改變。在另一具體例中,該使該經回聲消除之近端信號的該等頻率分量衰減該第二頻域衰減值係回應於以下所有三者之一組合:偵測到一聲學回聲路徑改變;偵測到該所接收之近端信號表示話音;及偵測到該所接收之遠端信號不表示靜音。
在一個具體例中,回應於該近端聲學回聲路徑改變偵測之該結果、該近端信號話音表示偵測之該結果及該遠端靜音表示偵測之該結果,該方法進一步包含交替地進行以下操作:不更新該所估計聲學回聲;以一第一速度更新該所估計聲學回聲;及以一第二速度更新該所估計聲學回聲,該第二速度大於該第一速度。視情況,該以該第二速度更新該所估計聲學回聲係回應於以下所有三者之一組合:偵測到一聲學回聲路徑改變;偵測到該所接收之近端信號不表示話音;及偵測到該所接收之遠端信號不表示靜音。
在一個具體例中,該方法進一步包含:回應於偵測到 該所接收之近端信號不表示話音且偵測到該所接收之遠端信號表示靜音,回應於該所接收之近端信號而估計近端背景雜訊;及回應於以下所有三者之一組合而輸出該所估計近端背景雜訊之一雜訊函數:未偵測到聲學回聲路徑改變;偵測到該所接收之近端信號不表示話音;及偵測到該所接收之遠端信號不表示靜音。在另一具體例中,該方法進一步包含:偵測該所接收之近端信號的一振幅位準;偵測該所接收之遠端信號的一振幅位準;及回應於該所接收之近端信號的該偵測到之振幅位準超過一近端飽和值及該所接收之遠端信號的該偵測到之振幅位準超過一遠端飽和值中的一者,不更新該所估計聲學回聲。
在一個具體例中,該方法進一步包含:偵測一窄頻帶載頻調之一表示是否存在於該所接收之近端信號內;偵測一窄頻帶載頻調之一表示是否存在於該所接收之遠端信號內;及回應於偵測到該所接收之近端信號內的該窄頻帶載頻調表示及偵測到該所接收之遠端信號內的該窄頻帶載頻調表示中的一者,不更新該所估計聲學回聲。在另一具體例中,該回聲路徑改變偵測包含:執行對該所接收之近端信號的一時域分析;回應於該時域分析而偵測該近端聲學回聲路徑中之一改變;輸出該偵測到之時域改變的一指示;執行對該所接收之遠端信號及該經回聲消除之近端信號的一頻域分析;回應於該頻域分析而偵測該近端聲學回聲路徑中之一改變;輸出該偵測到之頻域改變的一指示;及判定該輸出時域指示及該輸出頻域指示的一第三函數,其中該聲學回聲路徑改變偵測係回應於該經判定之第三函數。
本發明之額外特徵及優點將自以下圖式及描述變得 顯而易見。
10‧‧‧全雙工語音通信系統
20‧‧‧環境感測系統
30‧‧‧系統協調單元
35‧‧‧聲學回聲消除功能性
40‧‧‧加法器
50‧‧‧時域至頻域轉換功能性
60‧‧‧頻域處理功能性
62‧‧‧舒適雜訊產生功能性
70‧‧‧頻域至時域轉換功能性
80A‧‧‧可切換衰減功能性
80B‧‧‧可切換衰減功能性
100‧‧‧調適控制功能性
110‧‧‧聲學回聲估計功能性
115‧‧‧回聲路徑改變偵測功能性
120‧‧‧近端飽和偵測功能性
130‧‧‧揚聲器飽和偵測功能性
140‧‧‧收斂偵測功能性
150‧‧‧發散偵測功能性
160‧‧‧遠端窄頻帶信號偵測功能性
170‧‧‧近端窄頻帶信號偵測功能性
180‧‧‧近端話音偵測功能性
190‧‧‧遠端靜音偵測功能性
200‧‧‧輸出模組
210‧‧‧揚聲器輸入系統
220‧‧‧揚聲器輸出系統
230‧‧‧遠端通信裝置/遠端語音通信系統/近端聲學回聲路徑
240‧‧‧通信網路
300‧‧‧頻域濾波功能性
305‧‧‧雜訊減少功能性
310‧‧‧受控資料路徑
320‧‧‧受控資料路徑
330‧‧‧舒適雜訊訓練及播放功能性
400‧‧‧時域路徑改變偵測功能性
410‧‧‧頻域路徑改變偵測功能性
420‧‧‧組合路徑改變偵測功能性
430‧‧‧自回歸移動平均(ARMA)濾波器
440‧‧‧交叉相關功能性
450‧‧‧比較器
500‧‧‧ARMA濾波器
505‧‧‧ARMA濾波器
510‧‧‧平方根功能性
520‧‧‧乘法器
530‧‧‧濾波及正規化功能性
540‧‧‧乘法器
550‧‧‧減法器
560‧‧‧比較器
565‧‧‧累加器
570‧‧‧比較器
1000‧‧‧階段
1010‧‧‧階段
1020‧‧‧階段
1030‧‧‧階段
1040‧‧‧階段
1050‧‧‧階段
1060‧‧‧階段
1070‧‧‧階段
1075‧‧‧階段
1077‧‧‧階段
1080‧‧‧階段
1090‧‧‧階段
1100‧‧‧階段
1110‧‧‧階段
1120‧‧‧階段
1130‧‧‧階段
1140‧‧‧階段
1150‧‧‧階段
1160‧‧‧階段
1170‧‧‧階段
1180‧‧‧階段
1190‧‧‧階段
1200‧‧‧階段
1210‧‧‧階段
1220‧‧‧階段
1230‧‧‧階段
1240‧‧‧階段
1250‧‧‧階段
1260‧‧‧階段
1270‧‧‧階段
1280‧‧‧階段
1290‧‧‧階段
1300‧‧‧階段
1310‧‧‧階段
2000‧‧‧階段
2010‧‧‧階段
2020‧‧‧階段
2030‧‧‧階段
2040‧‧‧階段
2050‧‧‧階段
3000‧‧‧階段
3010‧‧‧階段
3020‧‧‧階段
3030‧‧‧階段
3040‧‧‧階段
3050‧‧‧階段
3060‧‧‧階段
3070‧‧‧階段
3080‧‧‧階段
3090‧‧‧階段
3100‧‧‧階段
ERROR‧‧‧信號
FS‧‧‧信號
P1‧‧‧埠
P2‧‧‧埠
P3‧‧‧埠
P4‧‧‧埠
RIN‧‧‧信號
ROUT‧‧‧信號
SIN‧‧‧信號
SOUT‧‧‧信號
THRESHOLD‧‧‧臨限值
THRESHOLD 1‧‧‧預定臨限值
THRESHOLD 2‧‧‧預定臨限值
TS‧‧‧信號
YHAT‧‧‧回聲估計信號
為了較好地理解本發明以及為了展示本發明可如何實行,現將僅藉由實例參看隨附圖式,其中相同數字始終指明對應部分或元件。現詳細地特定參看圖式,強調所展示之細節係藉由實例展示且僅出於說明性論述本發明之較佳具體例之目的,且為了提供被認為係對本發明之原理及概念態樣最有用且易於理解的描述的內容來呈現。就此而言,不會嘗試比基本理解本發明所需更詳細地展示本發明之結構細節,關於圖式進行描述使本發明之若干形式可如何在實踐中體現對熟習本技藝者顯而易見。在隨附圖式中:圖1A說明根據某些具體例之全雙工語音通信系統的各種高階方塊圖;圖1B說明根據某些具體例之全雙工語音通信系統的各種高階方塊圖;圖1C說明根據某些具體例之全雙工語音通信系統的各種高階方塊圖;圖2A說明根據某些具體例之第一全雙工語音通信方法的高階流程圖;圖2B說明根據某些具體例之第一全雙工語音通信方法的高階流程圖;圖2C說明根據某些具體例之第一全雙工語音通信方法的高階流程圖;圖2D說明根據某些具體例之聲學回聲路徑改變偵測方法的高階流程圖; 圖2E說明根據某些具體例之第二全雙工語音通信方法的高階流程圖;圖3說明根據某些具體例之頻域處理功能性及舒適雜訊產生功能性的高階示意圖;及圖4A說明根據某些具體例之聲學回聲路徑改變偵測功能性的各種高階示意圖;圖4B說明根據某些具體例之聲學回聲路徑改變偵測功能性的各種高階示意圖;圖4C說明根據某些具體例之聲學回聲路徑改變偵測功能性的各種高階示意圖。
在詳細解釋本發明之至少一個具體例之前,應理解,本發明在其應用上不限於以下描述中所闡述或圖式中所說明的組件之構造及配置之細節。本發明可適用於其他具體例或以各種方式實踐或進行。亦應理解,本文中所使用之片語及術語係出於描述目的且不應被視為限制性的。
圖1A說明根據某些具體例之全雙工語音通信系統10的高階方塊圖。全雙工語音通信系統10包含:複數個埠P1、P2、P3及P4;環境感測系統20;系統協調單元30;聲學回聲消除功能性35,其包含加法器40、調適控制功能性100及聲學回聲估計功能性110;時域至頻域轉換功能性50;頻域處理功能性60;舒適雜訊產生功能性62;頻域至時域轉換功能性70;一對可切換衰減功能性80A及80B;及回聲路徑改變偵測功能性115。圖1B說明環境感測系統20之詳細具體例的高階方塊圖。特定而言,環境感測 系統20包含:近端飽和偵測功能性120;揚聲器飽和偵測功能性130;收斂偵測功能性140;發散偵測功能性150;遠端窄頻帶信號偵測功能性160;近端窄頻帶信號偵測功能性170;近端話音偵測功能性180;遠端靜音偵測功能性190;及輸出模組200。圖1A至圖1B之結構將一起加以描述。
以下各者中之每一者可用諸如ASIC之專用硬體或藉由執行儲存於相關聯記憶體上之電子可讀指令的微處理器或微控制器來實施:系統協調單元30;聲學回聲消除功能性35;加法器40;調適控制功能性100;聲學回聲估計功能性110;時域至頻域轉換功能性50;頻域處理功能性60;舒適雜訊產生功能性62;頻域至時域轉換功能性70;可切換衰減功能性80A及80B;回聲路徑改變偵測功能性115;近端飽和偵測功能性120;揚聲器飽和偵測功能性130;收斂偵測功能性140;發散偵測功能性150;遠端窄頻帶信號偵測功能性160;近端窄頻帶信號偵測功能性170;近端話音偵測功能性180;遠端靜音偵測功能性190;及輸出模組200。
埠P1耦接至揚聲器輸入系統210(諸如,麥克風系統)、加法器40之正輸入、回聲路徑改變偵測功能性115之輸入、近端飽和偵測功能性120之輸入、收斂偵測功能性140之輸入、發散偵測功能性150之輸入、近端窄頻帶信號偵測功能性170之輸入、近端話音偵測功能性180之輸入及遠端靜音偵測功能性190之輸入,該節點處之信號指示為SIN。
加法器40之負輸入耦接至聲學回聲估計功能性110之輸出、發散偵測功能性150之輸入及遠端靜音偵測功能性190之輸入,該節點處之信號指示為YHAT。加法器40之輸出(亦即,聲 學回聲消除功能性35之輸出)耦接至收斂偵測功能性140之輸入、發散偵測功能性150之輸入、調適控制功能性100之輸入、時域至頻域轉換功能性50之各別輸入及回聲路徑改變偵測功能性115之各別輸入,該節點處之信號指示為ERROR。
時域至頻域轉換功能性50之輸出耦接至頻域處理功能性60之各別輸入,且頻域處理功能性60之各別輸出耦接至頻域至時域轉換功能性70之輸入。舒適雜訊產生功能性62之輸入耦接至頻域處理功能性60之各別輸出,且舒適雜訊產生功能性62之輸出耦接至頻域處理功能性60之各別輸入。頻域至時域轉換功能性70之輸出耦接至可切換衰減功能性80A之輸入,且可切換衰減功能性80A之輸出耦接至埠P2,埠P2處之信號指示為SOUT。
埠P3耦接至可切換衰減功能性80B之輸入及時域至頻域轉換功能性50之輸入,埠P3處之信號指示為RIN。可切換衰減功能性80B之輸出耦接至聲學回聲估計功能性110之輸入、揚聲器飽和偵測功能性130之輸入、遠端窄頻帶信號偵測功能性160之輸入、遠端靜音偵測功能性190之輸入、回聲路徑改變偵測功能性115之各別輸入及經由埠P4耦接至揚聲器輸出系統220,該節點處之信號指示為ROUT。如圖1C中所說明,埠P2及P3進一步經由通信網路240與遠端通信裝置230通信。在一個具體例中,通信網路240為電話網路及網際網路中之一者。
回聲路徑改變偵測功能性115之輸出耦接至系統協調單元30之各別輸入。近端飽和偵測功能性120、揚聲器飽和偵測功能性130、收斂偵測功能性140、發散偵測功能性150、遠端窄頻帶信號偵測功能性160、近端窄頻帶信號偵測功能性170、近端話音 偵測功能性180及遠端靜音偵測功能性190中之每一者的輸出經由輸出模組200耦接至系統協調單元30之各別輸入。調適控制功能性100、頻域處理功能性60、舒適雜訊產生功能性62以及可切換衰減功能性80A及80B中之每一者的各別輸入耦接至系統協調單元30之各別輸出。
聲學回聲消除功能性35在本文中經說明及描述為與頻域處理功能性60分離,然而,此並不意欲以任何方式為限制性的。在另一具體例(未圖示)中,聲學回聲消除功能性35係實施為頻域處理功能性60之部分。可切換衰減功能性80A及80B中之每一者包含可選擇的複數個衰減位準。特定而言,在一個具體例中,可切換衰減功能性80A展現大於3dB之高衰減位準及小於3dB之低衰減位準。在另一具體例中,可切換衰減功能性80B展現大於1dB之高衰減位準及小於1dB之低衰減位準。
圖1A至圖1C之操作將一起加以描述。在操作中,近端信號SIN(亦即,表示由揚聲器輸入系統210接收之聲音的信號)係視情況在應用波束成形濾波器之後在埠P1處接收。另外,遠端信號RIN(亦即,表示在通信裝置230處接收之聲音的信號)係在埠P3處接收。信號SIN經配置以處理成信號SOUT且被傳輸至遠端通信裝置230。特定而言,如下文將描述,信號ERROR表示在聲學回聲消除之後的信號SIN。信號ERROR藉由時域至頻域轉換功能性50轉換至頻域,且藉由頻域處理功能性60處理。經處理信號接著藉由頻域至時域轉換功能性70轉換回至時域。經轉換信號接著在必要時藉由可切換衰減功能性80A衰減,如下文將描述,且作為信號SOUT被輸出。信號RIN經配置以處理成信號ROUT,如 下文將描述,信號ROUT被輸出至揚聲器輸出系統220。近端飽和偵測功能性120經配置以判定信號SIN之振幅是否超過最大允許值。若聲音太強,則全雙工語音通信系統10將不能夠恰當地分析該等聲音。類似地,揚聲器飽和偵測功能性130經配置以判定信號ROUT之振幅是否超過揚聲器輸出系統220之最大允許值。
如上文所描述,收斂偵測功能性140經配置以接收信號SIN及ERROR,亦即,在加法器40之輸出處的信號。特定而言,聲學回聲估計功能性110經配置以輸出信號SIN內來自信號RIN之回聲的估計,上文指示為信號YHAT,且加法器40經配置以自信號SIN減去回聲估計YHAT。如上文所描述,信號RIN係接收自遠端語音通信系統230且在揚聲器輸出系統220處輸出。輸出聲音可在揚聲器輸入系統210處被拾取作為回聲,且使在揚聲器輸入系統210處接收之話音降級。若回聲估計YHAT準確,則信號ERROR將僅含有來自揚聲器輸入系統210附近之近端聲音且實質上不含來自在揚聲器輸出系統220處輸出之聲音的回聲。收斂偵測功能性140經配置以比較信號SIN與ERROR,且判定聲學回聲估計功能性110是否已成功進行回聲估計,亦即,回聲消除演算法已收斂於最佳解,如在進行本發明時熟習本技藝者所已知的。
如上文所描述,發散偵測功能性150經配置以接收信號SIN、ERROR及YHAT,且判定聲學回聲估計功能性110是否未成功進行回聲估計,亦即,回聲消除演算法已自最佳解發散,如在進行本發明時熟習本技藝者所已知的。在一個具體例中,收斂偵測功能性140經配置以相比發散偵測功能性150在較長時段內分析信號SIN及ERROR。結果,收斂偵測功能性140較慢但較準確。在 另一具體例(未圖示)中,發散偵測功能性150並未被提供,且收斂偵測功能性140經配置以判定聲學回聲估計演算法是收斂於最佳解還是自最佳解發散。
遠端窄頻帶信號偵測功能性160經配置以在信號ROUT內偵測展現小於8KHz之頻率的聲音之單載頻調的表示。類似地,近端窄頻帶信號偵測功能性170經配置以在信號SIN內偵測展現小於8KHz之頻率的聲音之單載頻調的表示。
近端話音偵測功能性180經配置以回應於語音活動偵測(VAD)演算法而偵測信號SIN內是否存在話音。遠端靜音偵測功能性190經配置以偵測信號ROUT表示靜音還是表示聲音。對信號ROUT內之聲音的偵測係進一步回應於對含有信號ROUT之回聲的信號SIN及YHAT之分析。
如上文所描述,系統協調單元30經配置以接收近端飽和偵測功能性120、揚聲器飽和偵測功能性130、收斂偵測功能性140、發散偵測功能性150、遠端窄頻帶信號偵測功能性160、近端窄頻帶偵測功能性170、近端話音偵測功能性180及遠端靜音偵測功能性190之輸出。
回應於藉由近端飽和偵測功能性120偵測到飽和信號SIN或藉由揚聲器飽和偵測功能性130偵測到飽和信號ROUT,系統協調單元30經配置以控制調適控制功能性100以停用對聲學回聲估計功能性110之調適,亦即,更新回聲估計。特定而言,聲學回聲估計功能性110經配置以持續地更新信號SIN內之回聲的估計,然而,非線性飽和信號可使回聲估計降級。藉由停用回聲估計更新,飽和信號將不會干擾未來回聲估計。一旦近端飽和偵測功能 性120及/或遠端飽和偵測功能性130停止偵測飽和信號,系統協調單元30便經配置以控制調適控制功能性以重新繼續對聲學回聲估計功能性110之調適,調適控制功能性100經配置以回應於信號ERROR而控制聲學回聲估計功能性110之聲學回聲估計,如在進行本發明時熟習本技藝者所已知的。
另外,在一個具體例中,回應於偵測到飽和信號SIN,系統協調單元30經配置以控制可切換衰減功能性80A以使待輸出之信號衰減最大衰減位準,藉此將較乾淨信號FOUT輸出至遠端通信裝置。
若任意載頻調存在於信號ROUT及SIN中之任一者或兩者中,則聲學回聲估計功能性110之聲學回聲估計可藉由任意載頻調降級。回應於藉由遠端窄頻帶信號偵測功能性160偵測到信號ROUT內之單載頻調及/或藉由近端窄頻帶信號偵測功能性170偵測到信號SIN內之單載頻調,系統協調單元30經配置以控制調適控制功能性100以停用對聲學回聲估計功能性110之調適,亦即,更新回聲估計,如上文所描述。
回應於藉由收斂偵測功能性140判定聲學回聲估計演算法已收斂於最佳解,系統協調單元30經配置以進一步判定當前通信之狀態。特定而言,回應於近端話音偵測功能性180及遠端靜音偵測功能性190之輸出,系統協調單元30經配置以判定是否信號ROUT及SIN中之任一者內不存在話音,信號ROUT及SIN中之兩者內存在話音(雙向通話),是否信號SIN內存在但信號ROUT內不存在話音(僅近端話音),或信號ROUT內存在但信號SIN內不存在話音(僅遠端話音)。如上文所描述,近端話音係回應於語 音活動偵測演算法而偵測,而遠端話音係在無語音活動偵測演算法之情況下偵測。結果,遠端話音之偵測包括信號ROUT上之雜訊的偵測。
回應於偵測到之話音狀態,系統協調單元30經配置以在數個狀態下控制調適控制功能性100、頻域處理功能性60以及可切換衰減功能性80A及80B。
聲學回聲估計功能性110經配置以回應於調適控制功能性100而在以下三個模式中之一者中操作:正常速度模式,亦即,穩定狀態模式;高速模式;及非調適性模式。具體而言,在正常速度模式中,聲學回聲估計功能性110經配置以基於經收斂回聲估計而根據次要回聲改變連續地更新聲學回聲估計,如在進行本發明時熟習本技藝者所已知的。在正常速度模式中,該聲學回聲估計更新較慢但較準確。在高速模式中,聲學回聲估計功能性110經配置而以比正常速度模式中快的速度更新聲學回聲估計,然而,該估計較不準確。在非調適性模式中,聲學回聲估計功能性110經配置以不更新聲學回聲估計,如上文所描述。該正常速度模式僅在偵測到遠端話音且未偵測到回聲路徑230中之改變時啟用,如下文將描述。該高速模式僅在偵測到遠端話音且偵測到回聲路徑230中之改變時啟用,如下文將描述。在所有其他狀況下,該非調適模式經啟用,如下文將描述。
頻域處理功能性60經配置以在偵測到雙向通話而聲學回聲路徑230中無改變時及在偵測到遠端話音且聲學回聲路徑230中具有或不具有改變時應用低位準殘餘回聲衰減。頻域處理功能性60經配置以在偵測到雙向通話且聲學回聲路徑230中具有改 變時應用高位準殘餘回聲衰減。特定而言,頻域衰減藉由自適應性濾波器實施,該濾波器在雙向通話之週期期間處於作用中且在遠端話音之週期期間處於訓練中。
可切換衰減功能性80A及80B經配置以在偵測到雙向通話而聲學回聲路徑230中無改變時應用低位準衰減。可切換衰減功能性80A及80B經配置以偵測到雙向通話或遠端話音且聲學回聲路徑230中具有改變時應用高位準衰減。
若系統協調單元30判定無話音存在於信號ROUT中且無話音存在於信號SIN中,亦即,遠端話音及近端話音兩者皆不存在,則系統協調單元30經配置以控制調適控制功能性100以在非調適性模式中操作。歸因於信號ROUT中缺乏話音,不存在要消除之回聲,因此聲學回聲調適停用。在不存在回聲時停用聲學回聲調適將防止聲學回聲估計中之不必要錯誤。
另外,回應於判定無話音存在於信號ROUT及SIN中之任一者中,系統協調單元30經配置以控制舒適雜訊產生功能性62以判定信號SIN內之背景雜訊的估計。如上文所描述,在一個具體例中,VAD演算法藉由近端話音偵測功能性180利用以偵測信號SIN內之話音,VAD演算法允許近端話音偵測功能性180區分話音與背景雜訊。特定而言,時域至頻域轉換功能性50經配置以視情況回應於快速傅立葉變換(FFT)而將信號ERROR變換成頻率分量。如上文所描述,信號ERROR包含在減去回聲估計信號YHAT之後的信號SIN。由於信號ROUT內存在靜音,因此不應存在回聲且信號ERROR將實質上相同於信號SIN。在一個具體例中,背景雜訊估計之判定包含更新先前判定之近端背景雜訊估計。在另 一具體例中,背景雜訊估計包含對信號ERROR之複數個頻率分量中之每一者進行自回歸移動平均(ARMA)濾波。只要在信號SIN及ROUT中之任一者上未偵測到話音,背景雜訊估計便繼續。
若系統協調單元30判定話音存在於信號ROUT中但話音不存在於信號SIN中,亦即,存在遠端話音但不存在近端話音,則系統協調單元30經配置以控制調適控制功能性100以啟用藉由聲學回聲估計功能性110在上文所描述之正常速度模式中更新聲學回聲估計。另外,頻域處理功能性60經配置以應用殘餘回聲濾波器以使信號ERROR內之殘餘回聲衰減低衰減值,殘餘回聲濾波器之低衰減值視情況為約9至15dB。儘管不需要使並非輸出之信號中之回聲衰減,但如下文所描述,自適應性殘餘回聲濾波器經配置以在存在遠端話音期間繼續更新。
由於不存在來自揚聲器輸入系統210附近之話音,因此信號ERROR內之僅有聲音將為由揚聲器輸入系統210拾取之背景雜訊及未由聲學回聲估計功能性110消除之任何殘餘回聲。因此,可較佳地不將信號ERROR傳輸至遠端通信裝置,藉此確保無回聲將由遠端說話者聽到。然而,藉由進行此操作,揚聲器輸入系統210周圍之由遠端說話者所預期的背景雜訊將不被聽到。自遠端說話者之觀點,此將聽起來像其並不與任何人說話。為解決此問題,系統協調單元30經配置以控制頻域處理功能性60以將舒適雜訊產生功能性62之輸出傳遞至頻域至時域轉換功能性70,且不將信號ERROR之頻率分量傳遞至頻域至時域轉換功能性70。結果,信號SOUT內之殘餘回聲未被傳輸至通信裝置230,而背景雜訊估計被傳輸。在一個具體例中,舒適雜訊產生功能性62經配置以藉 由所估計背景雜訊調變白雜訊FFT係數,經調變白雜訊FFT係數被輸出至頻域至時域轉換功能性70且舒適雜訊因此被傳輸至遠端。
系統協調單元經進一步配置以控制可切換衰減功能性80A以不使頻域至時域轉換功能性70之輸出衰減,且控制可切換衰減功能性80B以不使信號RIN衰減。由於信號RIN中不存在話音,無回聲將存在於信號SIN中,因此信號RIN之衰減係不必要的。類似地,存在於信號SIN中之任何回聲藉由頻域處理功能性60截掉,因此信號ERROR之衰減係不必要的。
若系統協調單元30判定話音存在於信號SIN中但無話音存在於信號ROUT中,亦即,存在近端話音但不存在遠端話音,則系統協調單元30經配置以控制調適控制功能性100以停用藉由聲學回聲估計功能性110更新聲學回聲估計。系統協調單元經進一步配置以控制可切換衰減功能性80A以不使頻域至時域轉換功能性70之輸出衰減,且控制可切換衰減功能性80B以不使信號RIN衰減。由於信號RIN中不存在話音,無回聲將存在於信號SIN中,因此衰減係不必要的。
若系統協調單元30判定話音存在於信號SIN及ROUT兩者中,亦即,存在雙向通話,則系統協調單元30經配置以控制調適控制功能性100以停用藉由聲學回聲估計功能性110更新聲學回聲估計,此係因為聲學回聲估計功能性110之調適將因為雙向通話而不準確。系統協調單元30經進一步配置以進行以下操作:控制可切換衰減功能性80A以使頻域至時域轉換功能性70之輸出衰減低衰減值;及控制可切換衰減功能性80B以使信號RIN衰減低衰減值。在一個具體例中,如上文所描述,可切換衰減功能 性80A及80B中之每一者的低位準值小於3dB。可切換衰減功能性80B之衰減使遠端話音衰減,藉此減少由揚聲器輸入系統210接收之回聲的量。可切換衰減功能性80A之衰減使近端話音衰減,且結果,進一步使與近端話音混合之任何殘餘回聲衰減。藉由可切換衰減功能性80A及80B進行之雙重衰減將回聲之振幅減少至在遠端通信裝置230處不太能聽到之位準,藉此提供對聲學回聲估計功能性110之非調適狀態的補償。另外,頻域處理功能性60經配置以應用殘餘回聲濾波器之低位準衰減以使信號ERROR內之殘餘回聲衰減,如上文所描述。
信號ROUT之回聲自揚聲器輸出系統220沿聲學回聲路徑230行進至揚聲器輸入系統210。若在聲學回聲路徑230中存在改變,諸如當某人在揚聲器輸入系統210及/或揚聲器輸出系統220之前方揮動其手時,則聲學回聲估計功能性110之正常速度模式不能恰當地估計聲學回聲。如下文將進一步描述,回聲路徑改變偵測功能性115經配置以分析信號ERROR、SIN及ROUT以判定聲學回聲路徑230中是否已存在改變。在一個具體例中,如下文將描述,回聲路徑改變偵測功能性115經配置以執行對信號SIN及ERROR之時域分析及對信號ERROR及ROUT之頻域分析。
若回聲路徑改變偵測功能性115偵測到回聲路徑230中之改變且系統協調單元30偵測到話音存在於信號ROUT中但無話音存在於信號SIN中,亦即,存在遠端話音但不存在近端話音,則系統協調單元30經配置以控制調適控制功能性100以啟用藉由聲學回聲估計功能性110在高速模式中更新聲學回聲估計。特定而言,如上文所描述,聲學回聲估計功能性110經配置於高速模式中 以較快速適應回聲中之改變,該等改變歸因於聲學回聲路徑230中之改變而為顯著的。
另外,回應於偵測到之聲學回聲路徑230改變及遠端話音,系統協調單元30經進一步配置以控制可切換衰減功能性80A以使頻域至時域轉換功能性70之輸出衰減高衰減值。類似地,系統協調單元30經進一步配置以控制可切換衰減功能性80B以使信號RIN衰減高衰減值。在一個具體例中,如上文所描述,可切換衰減功能性80A及80B之高衰減值分別大於3dB及1dB。此外,頻域處理功能性60經配置以應用殘餘回聲濾波器以使信號ERROR內之殘餘回聲衰減於低位準,如上文所描述。
若回聲路徑改變偵測功能性115偵測到回聲路徑230中之改變且系統協調單元30偵測到話音存在於信號ROUT及SIN兩者中,亦即,存在雙向通話,則系統協調單元30經配置以控制調適控制功能性100以歸因於雙向通話而停用藉由聲學回聲估計功能性110更新聲學回聲估計,如上文所描述。
另外,回應於偵測到之聲學回聲路徑230改變及雙向通話,系統協調單元30經進一步配置以控制可切換衰減功能性80A以使頻域至時域轉換功能性70之輸出衰減高衰減位準,如上文所描述。類似地,系統協調單元30經進一步配置以控制可切換衰減功能性80B以使信號RIN衰減高衰減值,如上文所描述。此外,頻域處理功能性60經配置以應用殘餘回聲濾波器以使信號ERROR內之殘餘回聲衰減高衰減值。
概言之,當收斂偵測功能性140偵測到聲學回聲估計功能性110已收斂於最佳解時,系統協調單元30經配置以在數個 狀態中控制調適控制功能性100、頻域處理功能性60以及可切換衰減功能性80A及80B,如下:1.在存在雙向通話之情況下,聲學回聲估計調適經停用,頻域殘餘回聲濾波器係在低位準下啟動且接收自遠端並傳輸至遠端之時域信號被衰減低衰減值;2.在僅存在遠端話音且近端聲學回聲路徑中存在改變的情況下,聲學回聲估計調適係在高速模式中啟用,頻域殘餘回聲濾波器係在低位準下啟動且接收自遠端並傳輸至遠端之時域信號被衰減高衰減值;且3.在存在雙向通話且近端聲學回聲路徑中存在改變的情況下,聲學回聲估計調適經停用,頻域殘餘回聲濾波器係在高位準下啟動且接收自遠端並傳輸至遠端之時域信號被衰減高衰減值。
另外,當收斂偵測功能性140偵測到聲學回聲估計功能性110已收斂於最佳解時,系統協調單元30經進一步配置以在數個可選狀態中控制調適控制功能性100、頻域處理功能性60以及可切換衰減功能性80A及80B,如下:1.在不存在來自近端及遠端兩者之話音的情況下,聲學回聲估計調適經停用且近端背景雜訊之估計經判定;2.在僅存在近端話音之情況下,聲學回聲估計調適經停用;且3.在僅存在遠端話音之情況下,聲學回聲估計調適係在正常速度模式中啟用,頻域殘餘回聲濾波器係在低位準下啟動且舒適雜訊而非近端背景雜訊被傳輸至遠端揚聲器。
若發散偵測功能性150偵測到聲學回聲估計功能性110已自最佳解發散預定邊限,則系統協調單元30經配置以控制調 適控制功能性100以控制聲學回聲估計功能性110在上文所描述之高速模式中操作,而不管近端話音偵測功能性180及遠端靜音偵測功能性190之輸出。
圖2A至圖2C說明根據某些具體例之全雙工語音通信方法的高階流程圖,圖2A至圖2C在一起加以描述。在階段1000中,接收近端信號。如上文所描述,近端信號表示藉由諸如麥克風之近端揚聲器輸入系統拾取的聲音。在階段1010中,自遠端通信裝置接收遠端信號。如上文所描述,遠端信號表示藉由遠端通信裝置拾取之聲音。
在階段1020中,回應於階段1010之所接收之遠端信號,估計階段1000之所接收之近端信號內的聲學回聲。在階段1030中,將階段1020之所估計聲學回聲自所接收之近端信號消除。
在階段1040中,對階段1020之所估計聲學回聲進行分析以判定該估計是否已收斂於最佳解。若所估計聲學回聲已收斂於最佳解,則在階段1050中,偵測近端聲學回聲路徑中之改變。在階段1060中,對階段1000之所接收之近端信號進行分析以判定其是否表示話音。在階段1070中,對階段1010之所接收之遠端信號進行分析以判定其是否表示靜音。如上文所描述,在一個具體例中,當未偵測到靜音時,遠端話音被視為存在,即使其可能為雜訊而非話音亦如此。
在可選階段1075中,偵測階段1000之所接收之近端信號的振幅及階段1010之所接收之遠端信號的振幅。若近端信號及遠端信號中之一者或兩者的振幅超過各別飽和值,則階段1020之聲學回聲估計不再被更新直至兩個振幅低於各別飽和值。
在可選階段1077中,對階段1000之所接收之近端信號及階段1010之所接收之遠端信號進行分析以判定其中是否存在展現低於8kHz之頻率的非話音窄頻帶載頻調之表示。若一或多個窄頻帶載頻調之表示存在於近端信號及遠端信號中之一者或兩者中,則階段1020之聲學回聲估計不再被更新直至窄頻帶載頻調不再被偵測到。
在階段1080中,對階段1000之所接收之近端信號及階段1010之所接收之遠端信號進行分析。若無話音在所接收之近端信號內被偵測到(亦即,存在靜音抑或雜訊)且靜音在所接收之遠端信號內被偵測到,則在階段1090中,階段1020之聲學回聲估計不再被更新。另外,在階段1100中,估計階段1000之所接收之近端信號內的近端背景雜訊。
若在階段1080中無話音在階段1000之所接收之近端信號中且靜音在階段1010之所接收之遠端信號中的條件不滿足,則在階段1110中,對近端及遠端信號進行分析。儘管階段1110之分析在本文中係描述為在階段1080之分析之後執行,但此並不意欲以任何方式為限制性的,且階段1080及1110以及下文所描述之階段1130、1170、1220及1270的分析在一個具體例中係並行地執行。若話音於所接收之近端信號內被偵測到且靜音在所接收之遠端信號內被偵測到,則在階段1120中,階段1020之聲學回聲估計不再被更新。
若在階段1110中話音在階段1000之所接收之近端信號中且靜音在階段1010之所接收之遠端信號中的條件不滿足,則在階段1130中,對近端及遠端信號以及階段1050之近端聲學回聲 路徑改變偵測進行分析。若無話音在所接收之近端信號內被偵測到、無靜音在所接收之遠端信號內被偵測到且近端聲學回聲路徑改變尚未被偵測到,則在階段1140中,將階段1020之聲學回聲估計以第一速度更新。另外,在階段1150中,使階段1030之經回聲消除之近端信號的頻率分量衰減第一頻域衰減值。此外,在階段1160中,將階段1100之所估計近端背景雜訊的雜訊函數輸出至階段1010之遠端通信裝置。
若在階段1130中無話音在階段1000之所接收之近端信號中、無靜音在階段1010之所接收之遠端信號中且無階段1050之近端聲學回聲路徑改變的條件不滿足,則在階段1170中,對近端及遠端信號以及近端聲學回聲路徑改變偵測進行分析。若話音在所接收之近端信號內被偵測到、無靜音在所接收之遠端信號內被偵測到且近端聲學回聲路徑改變尚未被偵測到,則在階段1180中,階段1020之聲學回聲估計歸因於雙向通話而不再被更新。另外,在階段1190中,使階段1030之經回聲消除之近端信號的頻率分量衰減第一頻域衰減值,如上文關於階段1150所描述。此外,在階段1200中,視情況在時域中使階段1190之經衰減頻率分量的第一函數衰減第一可切換衰減值。類似地,在階段1210中,視情況在時域中使階段1010之所接收之遠端信號的第二函數衰減第二可切換衰減值。
若在階段1170中話音在階段1000之所接收之近端信號中、無靜音在階段1010之所接收之遠端信號中且無階段1050之近端聲學回聲路徑改變的條件不滿足,則在階段1220中,對近端及遠端信號以及近端聲學回聲路徑改變偵測進行分析。若無話音在 所接收之近端信號內被偵測到、無靜音在所接收之遠端信號內被偵測到且近端聲學回聲路徑改變已被偵測到,則在階段1230中,將階段1020之聲學回聲估計以第二速度更新,該第二速度大於階段1140之第一速度。另外,在階段1240中,使階段1030之經回聲消除之近端信號的頻率分量衰減第一頻域衰減值,如上文關於階段1150所描述。此外,在階段1250中,視情況在時域中使階段1190之經衰減頻率分量的第一函數衰減第三可切換衰減值。第三可切換衰減值大於階段1200之第一可切換衰減值。類似地,在階段1260中,視情況在時域中使階段1010之所接收之遠端信號的第二函數衰減第四可切換衰減值,該第四可切換衰減值大於階段1210之第二可切換衰減值。
若在階段1220中無話音在階段1000之所接收之近端信號中、無靜音在階段1010之所接收之遠端信號中且具有階段1050之近端聲學回聲路徑改變的條件不滿足,則在階段1270中,對近端及遠端信號以及近端聲學回聲路徑改變偵測進行分析。若話音在所接收之近端信號內被偵測到、無靜音在所接收之遠端信號內被偵測到且近端聲學回聲路徑改變已被偵測到,則階段1020之聲學回聲估計歸因於雙向通話而不再被更新。另外,在階段1280中,使階段1030之經回聲消除之近端信號的頻率分量衰減第二頻域衰減值,該第二頻域衰減值大於階段1150之第一頻域衰減值。此外,在階段1290中,使階段1190之經衰減頻率分量的第一函數衰減第三可切換衰減值,如上文關於階段1250所描述。類似地,在階段1300中,使階段1010之所接收之遠端信號的第二函數衰減第四可切換衰減值,如上文關於階段1260所描述。
若在上文所描述之階段1040中判定階段1020之聲學回聲估計尚未收斂於最佳解,則在階段1310中,將階段1020之聲學回聲估計以第二速度更新,如上文關於階段1230所描述。
圖2D說明根據某些具體例的偵測近端聲學回聲路徑中之改變的方法之高階流程圖。特定而言,圖2D描述執行階段1050之近端聲學回聲路徑改變偵測的詳細方法。在階段2000中,執行如上文所描述之階段1000至1030。在階段2010中,對階段1000之所接收之近端信號及階段1030之經回聲消除之聲學信號執行時域分析。在一個具體例中,時域分析包含所接收之近端信號的函數與經回聲消除之聲學信號的函數之交叉相關的判定。視情況,所接收之近端信號及經回聲消除之聲學信號中之每一者的函數包含自回歸移動平均。在階段2020中,回應於階段2010之時域分析,偵測近端聲學回聲路徑中之改變的指示。在一個具體例中,將階段2010之交叉相關值與預定臨限值比較,且若交叉相關值大於臨限值,則聲學回聲路徑改變之指示經輸出。
在階段2030中,執行對階段1010之所接收之遠端信號及階段1030之經回聲消除之聲學信號的頻域分析。在一個具體例中,遠端信號及經回聲消除之聲學信號中之每一者的FFT頻譜係根據巴克(Bark)尺度而分離成複數個頻率子頻帶。在一個其他具體例中,對於每一頻率子頻帶,所接收之遠端信號及經回聲消除之聲學信號的互功率經判定。另外,對於每一頻率子頻帶,經回聲消除之聲學信號的函數與經判定之互功率的函數之間的差經判定,該等函數視情況為自回歸移動平均。進一步視情況,經判定之互功率的自回歸移動平均值係藉由經平均化之經回聲消除之聲學信號及藉 由所接收之遠端信號的自回歸移動平均值而正規化。在階段2040中,回應於階段2030之頻域分析,偵測近端聲學回聲路徑中之改變的指示。在一個具體例中,近端聲學回聲路徑改變偵測係回應於頻帶之數目,其中經回聲消除之聲學信號函數與互功率函數之間的差大於預定臨限值。
在階段2050中,判定階段2020之經判定之近端聲學回聲路徑改變及階段2040之經判定之近端聲學回聲路徑改變的函數。在一個具體例中,該函數為指示時域分析及頻域分析中之至少一者已偵測到近端聲學回聲路徑中之改變的或(OR)函數。將經判定之函數輸出以指示近端聲學回聲路徑中實際上是否存在改變。
圖2E說明第二全雙工語音通信方法之高階流程圖。在階段3000中,接收近端信號,該近端信號表示由近端通信裝置之麥克風拾取的聲音。在階段3010中,自遠端通信裝置接收遠端信號,該遠端信號表示由遠端通信裝置拾取之聲音。在階段3020中,回應於階段3010之遠端信號而估計階段3000之近端信號內的聲學回聲。在階段3030中,將階段3020之所估計聲學回聲自階段3000之近端信號消除。
在階段3040中,偵測近端聲學回聲路徑(亦即,說話者與階段3000之近端通信裝置的麥克風之間的聲學回聲路徑)中是否存在改變。在階段3050中,偵測階段3000之近端信號是否表示話音。在階段3060中,偵測階段3010之遠端信號是否表示靜音。
在階段3070中,回應於階段3040之聲學回聲路徑改變偵測,階段3050之近端話音偵測及階段3060之遠端靜音偵測:使階段3030之經回聲消除之聲學近端信號的頻率分量交替地衰減 第一頻域衰減值及第二頻域衰減值,該第二頻域衰減值大於該第一頻域衰減值;使經頻率分量衰減之經回聲消除之近端信號的第一函數交替地衰減第一可切換衰減值及第二可切換衰減值,該第二可切換衰減值大於該第一可切換衰減值;及使階段3010之遠端信號的第二函數交替地衰減第三可切換衰減值及第四可切換衰減值,該第四可切換衰減值大於該第三可切換衰減值。特定而言,第一及第二頻域衰減值係用於頻域中之衰減,且第一、第二、第三及第四可切換衰減值係用於時域中之衰減。
在可選階段3080中,使經頻率分量衰減之經回聲消除之近端信號的第一函數衰減階段3070之第二可切換衰減值及使遠端信號之第二函數衰減第四可切換衰減值係回應於在階段3040偵測到聲學回聲路徑中之改變。
在可選階段3090中,使經回聲消除之近端信號的頻率分量衰減階段3070之第二頻域衰減值係回應於以下所有三者之組合:在階段3040偵測到聲學回聲路徑中之改變;在階段3050偵測到階段3000之近端信號表示話音;及在階段3060偵測到階段3010之遠端信號不表示靜音,亦即,遠端信號表示話音或雜訊。
在可選階段3100中,回應於階段3040之聲學回聲路徑改變偵測、階段3050之近端話音偵測及階段3060之遠端靜音偵測,階段3020之聲學回聲估計交替地進行以下操作:不更新;以第一速度更新;及以第二速度更新,該第二速度大於該第一速度。視情況,聲學回聲估計回應於以下所有三者之組合而以第二速度更新:在階段3040偵測到聲學回聲路徑中之改變;在階段3050偵測到階段3000之近端信號不表示話音;及在階段3060偵測到階段 3010之遠端信號不表示靜音。
圖3說明全雙工語音通信系統10之頻域處理功能性60及舒適雜訊產生功能性62的較詳細具體例之高階示意圖。頻域處理功能性60包含:頻域濾波功能性300,其經配置以使殘餘聲學回聲衰減,如上文所描述;雜訊減少功能性305;及受控資料路徑310。舒適雜訊產生功能性62包含:受控資料路徑320;及舒適雜訊訓練及播放功能性330。
受控資料路徑310及受控資料路徑320中之每一者的控制輸入耦接至系統協調單元30之各別輸出。受控資料路徑320之第一端子耦接至時域至頻域轉換功能性50之輸出及頻域濾波功能性300之輸入。受控資料路徑320之第二端子耦接至舒適雜訊訓練及播放功能性330之輸入。舒適雜訊訓練及播放功能性330之第一輸出耦接至頻域處理功能性60之受控資料路徑310的第一端子,且舒適雜訊訓練及播放功能性330之第二輸出耦接至雜訊減少功能性305之各別輸入。頻域濾波功能性300之輸出耦接至雜訊減少功能性305之各別輸入,且雜訊減少功能性305之輸出耦接至受控資料路徑310之第二端子。受控資料路徑310之第三端子耦接至頻域至時域轉換功能性70之輸入。
在操作中,如上文所描述,回應於偵測到無話音存在於近端信號SIN(未圖示)上且靜音存在於遠端信號ROUT(未圖示)上,系統協調單元30經配置以進行以下操作:控制受控資料路徑320以將時域至頻域轉換功能性50之輸出耦接至舒適雜訊訓練及播放功能性330之輸入;及控制受控資料路徑310以將雜訊減少功能性305之輸出耦接至頻域至時域轉換功能性70之輸入。
如上文進一步所描述,在近端及遠端兩者處皆靜音期間,舒適雜訊訓練及播放功能性330經配置以估計近端背景雜訊。特定而言,在一個具體例中,時域至頻域轉換功能性50經配置以藉由對信號ERROR執行FFT而將其轉換至頻域。FFT係數係視情況根據巴克尺度而分離成頻率子頻帶。舒適雜訊訓練及播放功能性330經配置以經由自回歸移動平均(ARMA)濾波器對子頻帶係數進行濾波。經平均化之子頻帶係數用以更新近端背景雜訊之先前所儲存估計。結果,近端背景雜訊中之任何改變被偵測到,且近端背景雜訊估計相應地被更新。
如上文所描述,回應於無話音活動存在於近端信號SIN中之指示及話音活動或無靜音存在於遠端信號ROUT處之指示,亦即,僅存在遠端話音,系統協調單元30經配置以進行以下操作:控制受控資料路徑320以將時域至頻域轉換功能性50之輸出與舒適雜訊訓練及播放功能性330之輸入解耦;及控制受控資料路徑310以將頻域至時域轉換功能性70之輸入耦接至舒適雜訊訓練及播放功能性330之輸出。如上文所描述,在一個具體例中,舒適雜訊訓練及播放功能性330經配置以產生FFT白雜訊,且藉由近端背景雜訊估計調變該白雜訊。經調變FFT白雜訊藉由頻域至時域轉換功能性70轉換至時域,如上文所描述。因此,舒適雜訊而非近端信號被輸出至遠端揚聲器。如上文所描述,舒適雜訊為近端背景雜訊之估計,且不包括遠端信號之聲學回聲。在一個較佳具體例中,歸因於近端背景雜訊估計之增加準確度,即刻地提供所產生之舒適雜訊,且舒適雜訊之逐步施加係不必要的。
回應於話音活動存在於近端處之指示,系統協調單元 30經配置以進行以下操作:控制受控資料路徑320以將時域至頻域轉換功能性50之輸出與舒適雜訊訓練及播放功能性330之輸入解耦;及控制受控資料路徑310以將頻域至時域轉換功能性70之輸入耦接至雜訊減少功能性305之輸出。頻域濾波功能性300經配置以將殘餘回聲自信號ERROR移除。雜訊減少功能性305經配置以減少來自信號ERROR之雜訊。在一個具體例中,雜訊減少功能性305之雜訊減少係回應於舒適雜訊訓練及播放功能性330之近端背景雜訊估計。
圖4A至圖4C說明全雙工語音通信系統10之回聲路徑改變偵測功能性115的詳細具體例之高階示意圖,圖4A至圖4C在一起加以描述。如圖4A中所說明,回聲路徑改變偵測功能性115包含:時域路徑改變偵測功能性400;頻域路徑改變偵測功能性410;及組合路徑改變偵測功能性420。
如圖4B中所說明,時域路徑改變偵測功能性400包含:一對自回歸移動平均(ARMA)濾波器430;交叉相關功能性440;及比較器450。每一ARMA濾波器430之輸入經配置以接收信號SIN及信號ERROR中之各別者。每一ARMA濾波器430之輸出耦接至交叉相關功能性440之各別輸入,且交叉相關功能性440之輸出耦接至比較器450之第一輸入。比較器450之第二輸入經配置以接收指示為THRESHOLD之臨限值。在一個具體例中,臨限值經配置以可藉由使用者調整。比較器450之輸出耦接至組合路徑改變偵測功能性420之各別輸入,輸出處之信號指示為TS。
如圖4C中所說明,頻域路徑改變偵測功能性410包含:ARMA濾波器500;ARMA濾波器505;一對平方根功能性510; 乘法器520;濾波及正規化功能性530;乘法器540;減法器550;比較器560;累加器565;及比較器570。ARMA濾波器500之輸入經配置以接收信號ERROR之子頻帶功率。在一個具體例(未圖示)中,信號ERROR之子頻帶功率係接收自時域至頻域轉換功能性50。ARMA濾波器505之輸入經配置以接收信號ROUT之子頻帶功率。在一個具體例(未圖示)中,信號ROUT之子頻帶功率係接收自時域至頻域轉換功能性50。類似地,每一平方根功能性510之輸入經配置以接收信號ROUT及ERROR中之各別者的子頻帶功率。
每一平方根功能性510之輸出耦接至乘法器520之各別輸入。乘法器520之輸出耦接至濾波及正規化功能性530之各別輸入。ARMA濾波器500及505中之每一者的輸出耦接至濾波及正規化功能性530之各別輸入。另外,ARMA濾波器500之輸出進一步耦接至減法器550之各別輸入,且ARMA濾波器505之輸出進一步耦接至乘法器540之各別輸入。濾波及正規化功能性530之輸出耦接至乘法器540之各別輸入,且乘法器540之輸出耦接至減法器550之各別輸入。減法器550之輸出耦接至比較器560之第一輸入,且比較器560之第二輸入經配置以接收指示為THRESHOLD 1之預定臨限值。比較器560之輸出耦接至累加器565之輸入。累加器565之輸出耦接至比較器570之第一輸入,且比較器570之第二輸入經配置以接收指示為THRESHOLD 2之預定臨限值。在一個具體例中,預定臨限值THRESHOLD 1及THRESHOLD 2各自經配置以藉由使用者調整。比較器570之輸出耦接至組合路徑改變偵測功能性420之各別輸入,輸出處之信號指示為FS。
若近端聲學回聲路徑230(未圖示)中存在改變,諸如 當近端說話者將其手置於近端聲學回聲路徑230內時,聲學輸出信號ROUT沿近端聲學回聲路徑230之行進時間及衰減將改變。結果,聲學回聲估計功能性110(未圖示)之聲學回聲估計將不同於實際回聲。時域路徑改變偵測功能性400經配置以接收信號SIN及ERROR,且回應於對所接收之信號的時域分析而偵測近端聲學回聲路徑230中之改變。特定而言,信號SIN及ERROR各自藉由各別ARMA濾波器430進行濾波。交叉相關功能性440經配置以判定經平均化之信號的交叉相關量度。該經判定之交叉相關量度係藉由比較器450與值THRESHOLD進行比較。若信號ERROR上存在顯著回聲,則信號ERROR與信號SIN之間的相似度將高於值THRESHOLD,且比較器450將輸出高信號TS。若信號ERROR上之回聲被成功地消除,則信號ERROR與信號SIN之間的相似度將低於值THRESHOLD,且比較器450將輸出低信號TS。因此,回應於近端聲學回聲路徑230中之改變,比較器450將迅速地輸出指示聲學回聲路徑450中存在改變的高信號TS。
判定交叉相關極快速,且因此時域路徑改變偵測功能性400提供對近端聲學回聲路徑230中之改變的迅速偵測。
頻域路徑改變功能性410經配置以對信號ERROR及ROUT執行頻域分析,以偵測近端聲學回聲路徑230中之改變。平方根功能性510及乘法器520經配置以判定信號ERROR及信號ROUT之所接收之頻率分量中的每一者之互功率。另外,對於頻率子頻帶中之每一者,信號ERROR功率及信號ROUT功率藉由各別ARMA濾波器500及505而平均化。濾波及正規化功能性530經配置以針對每一頻帶判定該經判定之互功率的自回歸移動平均值。經 平均化之互功率接著藉由經平均化之信號ERROR及ROUT而正規化。經平均化及正規化之互功率接著在乘法器540處乘以ARMA濾波器505之經平均化之信號ROUT。減法器550經配置以自ARMA濾波器500之經平均化之信號ERROR減去乘法器540之輸出。減法器550之輸出因此提供信號ERROR內之殘餘回聲。
比較器560經配置以針對每一頻率子頻帶而比較殘餘回聲與預定值THRESHOLD 1,從而判定殘餘回聲是否足夠顯著以指示近端聲學回聲路徑230中存在改變。若對於特定頻率子頻帶,殘餘回聲大於THRESHOLD 1,則累加器565經配置以使所儲存數目前進1。因此,比較器560及累加器565之組合操作對殘餘回聲大於預定值THRESHOLD 1之頻率子頻帶之數目進行計數。比較器570接著經配置以比較展現近端聲學回聲路徑230中之改變之指示的頻率子頻帶之經計數數目(亦即,累加器565之所產生數目)與預定值THRESHOLD 2。若頻率子頻帶之數目大於預定值THRESHOLD 2,則比較器570經配置以將指示近端聲學回聲路徑230中之改變的高信號FS輸出至組合路徑改變偵測功能性420。頻域路徑改變偵測功能性410之偵測慢於時域路徑改變偵測功能性400之偵測,但其較準確。
組合路徑改變偵測功能性420經配置以判定來自頻域路徑改變偵測功能性410之所接收之指示及來自時域路徑改變偵測功能性400之所接收之指示的函數。在一個具體例中,如下文將描述,所接收之指示的函數包含組合邏輯。在一個特定具體例中,組合路徑改變偵測功能性420經配置以判定頻域路徑改變偵測功能性410及時域路徑改變偵測功能性400中之至少一者是否指示近端 聲學回聲路徑230中已存在改變,亦即,信號FS及TS中之至少一者為高。在此情況下,組合路徑改變偵測功能性經配置以輸出近端聲學回聲路徑230中已存在改變之指示。
應瞭解,本發明的為清楚起見而在單獨具體例之上下文中描述的某些特徵亦可按組合形式提供於單一具體例中。相反,本發明的為簡潔起見而在單一具體例之上下文中描述的各種特徵亦可單獨地或以任何合適子組合形式提供。特定而言,本發明已描述為藉由類別識別每一電動裝置,然而,此並不意欲以任何方式為限制性的。在替代具體例中,所有電動裝置被同等對待,且因此類別藉由其相關聯功率要求之識別並非所需的。
除非另外定義,否則本文中所使用之所有技術及科學術語具有與一般熟習本發明所屬技藝者通常所理解的含義相同之含義。儘管類似或等效於本文中所描述之彼等方法的方法可在實踐或測試本發明時使用,但合適方法在本文中加以描述。
本文中所提及之所有公開案、專利申請案、專利及其他參考案均以全文引用的方式併入。在衝突狀況下,專利說明書(包括定義)將佔優勢。另外,材料、方法及實施例僅為說明性的且並不意欲為限制性的。
熟習本技藝者應瞭解,本發明並不限於上文已特定展示且描述的內容。確切而言,本發明之範疇係由所附申請專利範圍界定且包括上文所描述之各種特徵的組合及子組合兩者,以及熟習本技藝者在閱讀前文描述之後將想到的各種特徵之變化及修改。

Claims (18)

  1. 一種全雙工語音通信系統,其包含:一近端輸入埠,其經配置以接收一近端信號;一遠端輸入埠,其與一遠端通信裝置通信且經配置以接收來自該遠端通信裝置之一遠端信號;一聲學回聲估計功能性,其經配置以回應於該所接收之遠端信號而估計該所接收之近端信號內的一聲學回聲;一聲學回聲消除功能性,其經配置以將該所估計聲學回聲自該所接收之近端信號消除;一頻域處理功能性;一第一可切換衰減功能性;一第二可切換衰減功能性;一回聲路徑改變偵測功能性,其經配置以偵測一近端聲學回聲路徑中之一改變;一近端話音偵測功能性,其經配置以偵測該所接收之近端信號是否表示話音;一遠端靜音偵測功能性,其經配置以偵測該所接收之遠端信號是否表示靜音;及一系統協調單元,其中回應於該回聲路徑改變偵測功能性之一輸出、該近端話音偵測功能性之一輸出及該遠端靜音偵測功能性之一輸出,該系統協調單元經配置以進行以下操作:控制該頻域處理功能性以使該經回聲消除之近端信號的頻率分量交替地衰減一第一頻域衰減值及一第二頻域衰減值,該第二頻 域衰減值大於該第一頻域衰減值;控制該第一可切換衰減功能性以使該頻域處理功能性之一輸出的一第一函數交替地衰減一第一可切換衰減值及一第二可切換衰減值,該第二可切換衰減值大於該第一可切換衰減值;及控制該第二可切換衰減功能性以使該所接收之遠端信號的一第二函數交替地衰減一第三可切換衰減值及一第四可切換衰減值,該第四可切換衰減值大於該第三可切換衰減值。
  2. 如請求項1之系統,其中,該系統協調單元控制該第一可切換衰減功能性以使該頻域處理功能性之該輸出的該第一函數衰減該第二可切換衰減值的該配置,及該系統協調單元控制該第二可切換衰減功能性以使該所接收之遠端信號的該第二函數衰減該第四可切換衰減值的該配置,係回應於藉由該回聲路徑改變偵測功能性偵測到一聲學回聲路徑改變。
  3. 如請求項1之系統,其中,該系統協調單元控制該頻域處理功能性以使該經回聲消除之近端信號的該等頻率分量衰減該第二頻域衰減值的該配置係回應於以下所有三者之一組合:藉由該回聲路徑改變偵測功能性偵測到一聲學回聲路徑改變;藉由該近端話音偵測功能性偵測到該所接收之近端信號表示話音;及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號不表示靜音。
  4. 如請求項1之系統,其中,回應於該回聲路徑改變偵測功能性之該輸出、該近端話音偵測功能性之該輸出及該遠端靜音偵測功能性之該輸出,該系統協調單元經進一步配置以控制該聲學回聲估計 功能性而交替地進行以下操作:不更新該所估計聲學回聲;以一第一速度更新該所估計聲學回聲;及以一第二速度更新該所估計聲學回聲,該第二速度大於該第一速度。
  5. 如請求項4之系統,其中,該系統協調單元控制該聲學回聲估計功能性以該第二速度更新該所估計聲學回聲的該配置係回應於以下所有三者之一組合:藉由該回聲路徑改變偵測功能性偵測到一聲學回聲路徑改變;藉由該近端話音偵測功能性偵測到該所接收之近端信號不表示話音;及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號不表示靜音。
  6. 如請求項1之系統,其進一步包含一雜訊估計功能性,其中回應於藉由該近端話音偵測功能性偵測到該所接收之近端信號不表示話音及藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號表示靜音,該系統協調單元經進一步配置以回應於該所接收之近端信號而控制該雜訊估計功能性以估計近端背景雜訊,且其中該系統協調單元經進一步配置以回應於以下所有三者之一組合而控制該頻域處理功能性以將該所估計近端背景雜訊之一雜訊函數輸出至該遠端輸出埠:藉由該回聲路徑改變偵測功能性未偵測到一聲學回聲路徑改變;藉由該近端話音偵測功能性偵測到該所接收之近端信號不表示話音;及 藉由該遠端靜音偵測功能性偵測到該所接收之遠端信號不表示靜音。
  7. 如請求項1之系統,其進一步包含:一近端飽和偵測功能性,其經配置以偵測該所接收之近端信號的一振幅位準;及一揚聲器飽和偵測功能性,其經配置以偵測該所接收之遠端信號的一振幅位準,其中該系統協調單元經進一步配置以回應於該所接收之近端信號的該偵測到之振幅位準超過一近端飽和值及該所接收之遠端信號的該偵測到之振幅位準超過一遠端飽和值中的一者而控制該聲學回聲估計功能性以不更新該所估計聲學回聲。
  8. 如請求項1之系統,其進一步包含:一近端窄頻帶信號偵測功能性,其經配置以偵測該所接收之近端信號內的一窄頻帶載頻調的一表示;及一遠端窄頻帶信號偵測功能性,其經配置以偵測該所接收之遠端信號內的一窄頻帶載頻調的一表示,其中該系統協調單元經進一步配置以回應於該偵測到之近端窄頻帶載頻調及該偵測到之遠端窄頻帶載頻調中的一者而控制該聲學回聲估計功能性以不更新該所估計聲學回聲。
  9. 如請求項1之系統,其中,該回聲路徑改變偵測功能性包含:一時域路徑改變偵測功能性,其經配置以進行以下操作:執行對該所接收之近端信號的一時域分析;回應於該時域分析而偵測該近端聲學回聲路徑中之一改變;及輸出該偵測到之改變的一指示, 一頻域路徑改變偵測功能性,其經配置以進行以下操作:執行對該所接收之遠端信號及該經回聲消除之近端信號的一頻域分析;回應於該頻域分析而偵測該近端聲學回聲路徑中之一改變;及輸出該偵測到之改變的一指示,及一組合路徑改變偵測功能性,其經配置以判定該時域路徑改變偵測功能性之該輸出指示及該頻域路徑改變偵測功能性之該輸出指示的一第三函數,其中該回聲路徑改變偵測功能性之該聲學回聲路徑改變偵測係回應於該等輸出之該經判定之第三函數。
  10. 一種全雙工語音通信方法,該方法包含:接收一近端信號;接收來自一遠端通信裝置之一遠端信號;回應於該所接收之遠端信號而估計該所接收之近端信號內的一聲學回聲;將該所估計聲學回聲自該所接收之近端信號消除;偵測一改變是否已出現於一近端聲學回聲路徑中;偵測該所接收之近端信號是否表示話音;及偵測該所接收之遠端信號是否表示靜音,其中回應於該近端聲學回聲路徑改變偵測之一結果、該近端信號話音表示偵測之一結果及該遠端靜音表示偵測之一結果,該方法進一步包含:使該經回聲消除之近端信號的頻率分量交替地衰減一第一頻域衰減值及一第二頻域衰減值,該第二頻域衰減值大於該第一頻域 衰減值;使該經頻率分量衰減之經回聲消除之近端信號的一第一函數交替地衰減一第一可切換衰減值及一第二可切換衰減值,該第二可切換衰減值大於該第一可切換衰減值;及使該所接收之遠端信號的一第二函數交替地衰減一第三可切換衰減值及一第四可切換衰減值,該第四可切換衰減值大於該第三可切換衰減值。
  11. 如請求項10之方法,其中,該使該經頻率分量衰減之經回聲消除之近端信號的該第一函數衰減該第二可切換衰減值及該使該所接收之遠端信號的該第二函數衰減該第四可切換衰減值係回應於偵測到一聲學回聲路徑改變。
  12. 如請求項10之方法,其中,該使該經回聲消除之近端信號的該等頻率分量衰減該第二頻域衰減值係回應於以下所有三者之一組合:偵測到一聲學回聲路徑改變;偵測到該所接收之近端信號表示話音;及偵測到該所接收之遠端信號不表示靜音。
  13. 如請求項10之方法,其中,回應於該近端聲學回聲路徑改變偵測之該結果、該近端信號話音表示偵測之該結果及該遠端靜音表示偵測之該結果,該方法進一步包含交替地進行以下操作:不更新該所估計聲學回聲;以一第一速度更新該所估計聲學回聲;及以一第二速度更新該所估計聲學回聲,該第二速度大於該第一速度。
  14. 如請求項13之方法,其中,該以該第二速度更新該所估計聲學回聲係回應於以下所有三者之一組合:偵測到一聲學回聲路徑改變;偵測到該所接收之近端信號不表示話音;及偵測到該所接收之遠端信號不表示靜音。
  15. 如請求項10之方法,其進一步包含:回應於偵測到該所接收之近端信號不表示話音且偵測到該所接收之遠端信號表示靜音,回應於該所接收之近端信號而估計近端背景雜訊;及回應於以下所有三者之一組合而輸出該所估計近端背景雜訊之一雜訊函數:未偵測到聲學回聲路徑改變;偵測到該所接收之近端信號不表示話音;及偵測到該所接收之遠端信號不表示靜音。
  16. 如請求項10之方法,其進一步包含:偵測該所接收之近端信號的一振幅位準;偵測該所接收之遠端信號的一振幅位準;及回應於該所接收之近端信號的該偵測到之振幅位準超過一近端飽和值及該所接收之遠端信號的該偵測到之振幅位準超過一遠端飽和值中的一者,不更新該所估計聲學回聲。
  17. 如請求項10之方法,其進一步包含:偵測一窄頻帶載頻調之一表示是否存在於該所接收之近端信號內;偵測一窄頻帶載頻調之一表示是否存在於該所接收之遠端信號 內;及回應於偵測到該所接收之近端信號內的該窄頻帶載頻調表示及偵測到該所接收之遠端信號內的該窄頻帶載頻調表示中的一者,不更新該所估計聲學回聲。
  18. 如請求項10之方法,其中,該回聲路徑改變偵測包含:執行對該所接收之近端信號的一時域分析;回應於該時域分析而偵測該近端聲學回聲路徑中之一改變;輸出該偵測到之時域改變的一指示;執行對該所接收之遠端信號及該經回聲消除之近端信號的一頻域分析;回應於該頻域分析而偵測該近端聲學回聲路徑中之一改變;輸出該偵測到之頻域改變的一指示;及判定該輸出時域指示及該輸出頻域指示的一第三函數,其中該聲學回聲路徑改變偵測係回應於該經判定之第三函數。
TW106128763A 2016-09-13 2017-08-24 全雙工語音通信系統及方法 TW201813342A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662394204P 2016-09-13 2016-09-13
US62/394,204 2016-09-13
US15/683,862 2017-08-23
US15/683,862 US10122863B2 (en) 2016-09-13 2017-08-23 Full duplex voice communication system and method

Publications (1)

Publication Number Publication Date
TW201813342A true TW201813342A (zh) 2018-04-01

Family

ID=61561102

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106128763A TW201813342A (zh) 2016-09-13 2017-08-24 全雙工語音通信系統及方法

Country Status (5)

Country Link
US (1) US10122863B2 (zh)
CN (1) CN109716743B (zh)
DE (1) DE112017004612T5 (zh)
TW (1) TW201813342A (zh)
WO (1) WO2018052678A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2515592B (en) * 2013-12-23 2016-11-30 Imagination Tech Ltd Echo path change detector
US10014906B2 (en) * 2015-09-25 2018-07-03 Microsemi Semiconductor (U.S.) Inc. Acoustic echo path change detection apparatus and method
JP6833616B2 (ja) * 2017-05-29 2021-02-24 株式会社トランストロン エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
US10720173B2 (en) * 2018-02-21 2020-07-21 Bose Corporation Voice capture processing modified by back end audio processing state
US11363147B2 (en) * 2018-09-25 2022-06-14 Sorenson Ip Holdings, Llc Receive-path signal gain operations
US11205437B1 (en) * 2018-12-11 2021-12-21 Amazon Technologies, Inc. Acoustic echo cancellation control
US10636435B1 (en) 2018-12-22 2020-04-28 Microsemi Semiconductor (U.S.) Inc. Acoustic echo cancellation using low-frequency double talk detection
US10937441B1 (en) * 2019-01-04 2021-03-02 Amazon Technologies, Inc. Beam level based adaptive target selection
KR20210062475A (ko) * 2019-11-21 2021-05-31 삼성전자주식회사 전자 장치 및 그 제어 방법
CN111970610B (zh) * 2020-08-26 2022-05-20 展讯通信(上海)有限公司 回声路径检测方法、音频信号处理方法及系统、存储介质、终端
TWI790718B (zh) * 2021-08-19 2023-01-21 宏碁股份有限公司 會議終端及用於會議的回音消除方法

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965822A (en) * 1989-04-10 1990-10-23 Videotelecom Corp. Full duplex speakerphone
US5307405A (en) 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
US5646990A (en) * 1995-09-21 1997-07-08 Rockwell International Corporation Efficient speakerphone anti-howling system
US6141415A (en) * 1996-10-11 2000-10-31 Texas Instruments Incorporated Method and apparatus for detecting speech at a near-end of a communications system, a speaker-phone system, or the like
CA2224541C (en) 1997-01-07 2008-06-17 Northern Telecom Limited Method of providing conferencing in telephony
US5920834A (en) 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
US6658107B1 (en) 1998-10-23 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for providing echo suppression using frequency domain nonlinear processing
DE19935808A1 (de) 1999-07-29 2001-02-08 Ericsson Telefon Ab L M Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
US6795547B1 (en) 2000-08-02 2004-09-21 Conexant Systems, Inc. Full duplex speaker-phone providing increased loop stability
US6768796B2 (en) * 2001-02-05 2004-07-27 3Com Corporation System and method for echo cancellation
US6961422B2 (en) * 2001-12-28 2005-11-01 Avaya Technology Corp. Gain control method for acoustic echo cancellation and suppression
NO318401B1 (no) * 2003-03-10 2005-03-14 Tandberg Telecom As Et audio-ekkokanselleringssystem og en fremgangsmate for a tilveiebringe et ekkodempet utgangssignal fra et ekkotillagt signal
US7243065B2 (en) 2003-04-08 2007-07-10 Freescale Semiconductor, Inc Low-complexity comfort noise generator
US7480595B2 (en) 2003-08-11 2009-01-20 Japan Science And Technology Agency System estimation method and program, recording medium, and system estimation device
US7577248B2 (en) * 2004-06-25 2009-08-18 Texas Instruments Incorporated Method and apparatus for echo cancellation, digit filter adaptation, automatic gain control and echo suppression utilizing block least mean squares
US20060018457A1 (en) * 2004-06-25 2006-01-26 Takahiro Unno Voice activity detectors and methods
US7643630B2 (en) * 2004-06-25 2010-01-05 Texas Instruments Incorporated Echo suppression with increment/decrement, quick, and time-delay counter updating
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
EP1982509B1 (en) * 2006-01-06 2010-03-10 Koninklijke Philips Electronics N.V. Acoustic echo canceller
KR100764788B1 (ko) * 2006-03-16 2007-10-11 엘지전자 주식회사 이동통신 단말기 및 이동통신 단말기의 음성신호 송신방법
US8320574B2 (en) * 2006-04-20 2012-11-27 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in communication systems
TW200822780A (en) * 2006-11-07 2008-05-16 Fortemedia Inc Sound processing apparatus for automatically canceling howling and method for same
US8077857B1 (en) * 2007-03-14 2011-12-13 Clearone Communications, Inc. Portable speakerphone device with selective mixing
US8014519B2 (en) 2007-04-02 2011-09-06 Microsoft Corporation Cross-correlation based echo canceller controllers
US8139777B2 (en) 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
US8275139B2 (en) * 2008-03-26 2012-09-25 Ittiam Systems (P) Ltd. Linear full duplex system and method for acoustic echo cancellation
US20090281803A1 (en) * 2008-05-12 2009-11-12 Broadcom Corporation Dispersion filtering for speech intelligibility enhancement
FR2952263B1 (fr) * 2009-10-29 2012-01-06 Univ Paris Descartes Procede et dispositif d'annulation d'echo acoustique par tatouage audio
US20110228946A1 (en) 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system
CN102377453B (zh) * 2010-08-06 2014-02-26 联芯科技有限公司 一种控制自适应滤波器更新的方法、装置及回声消除器
US8320554B1 (en) * 2010-10-19 2012-11-27 Polycom, Inc. Acoustic echo canceller clock compensation
US8589153B2 (en) 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
CN103428157B (zh) * 2012-05-16 2016-08-10 京信通信系统(中国)有限公司 一种射频信号的控制方法和设备
US9088336B2 (en) * 2012-09-06 2015-07-21 Imagination Technologies Limited Systems and methods of echo and noise cancellation in voice communication
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
GB201308247D0 (en) * 2013-05-08 2013-06-12 Microsoft Corp Noise reduction
US9100466B2 (en) * 2013-05-13 2015-08-04 Intel IP Corporation Method for processing an audio signal and audio receiving circuit
US8953777B1 (en) 2013-05-30 2015-02-10 Amazon Technologies, Inc. Echo path change detector with robustness to double talk
GB2515592B (en) 2013-12-23 2016-11-30 Imagination Tech Ltd Echo path change detector
CN104767652B (zh) * 2014-01-08 2020-01-17 杜比实验室特许公司 监视数字传输环境性能的方法
US9319783B1 (en) * 2014-02-19 2016-04-19 Amazon Technologies, Inc. Attenuation of output audio based on residual echo
GB2536742B (en) * 2015-08-27 2017-08-09 Imagination Tech Ltd Nearend speech detector
CN108140395B (zh) 2015-09-25 2022-01-04 美高森美半导体(美国)股份有限公司 舒适噪声生成装置和方法
US10014906B2 (en) 2015-09-25 2018-07-03 Microsemi Semiconductor (U.S.) Inc. Acoustic echo path change detection apparatus and method

Also Published As

Publication number Publication date
CN109716743A (zh) 2019-05-03
WO2018052678A1 (en) 2018-03-22
CN109716743B (zh) 2020-12-08
DE112017004612T5 (de) 2021-09-09
US10122863B2 (en) 2018-11-06
US20180077290A1 (en) 2018-03-15

Similar Documents

Publication Publication Date Title
CN109716743B (zh) 全双工语音通信系统和方法
US10686942B2 (en) Auto-tuning of acoustic echo canceller
CN110225214B (zh) 对信号进行衰减的方法、衰减单元、系统和介质
KR100989266B1 (ko) 스펙트럼 음향 특성에 기초한 더블 토크 검출 방법
US5598468A (en) Method and apparatus for echo removal in a communication system
US8306215B2 (en) Echo canceller for eliminating echo without being affected by noise
US20160127561A1 (en) Automatic Tuning of a Gain Controller
US8160239B2 (en) Echo canceller and speech processing apparatus
GB2532348A (en) Controlling operational characteristics of acoustic echo canceller
IL112797A (en) Visible bee multiplication using spectral content
CN113196733B (zh) 使用低频近端语音检测的声学回声消除
TWI664626B (zh) 音響回音路徑變動偵測裝置及方法
JP2024008271A (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
Schuldt et al. Noise and howling mitigation in audio/video conferencing
WO2013072792A1 (en) Method and device for reducing acoustic feedback