TWI778524B - 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統 - Google Patents

偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統 Download PDF

Info

Publication number
TWI778524B
TWI778524B TW110106427A TW110106427A TWI778524B TW I778524 B TWI778524 B TW I778524B TW 110106427 A TW110106427 A TW 110106427A TW 110106427 A TW110106427 A TW 110106427A TW I778524 B TWI778524 B TW I778524B
Authority
TW
Taiwan
Prior art keywords
parameter group
judgment result
bilateral
far
unilateral
Prior art date
Application number
TW110106427A
Other languages
English (en)
Other versions
TW202234386A (zh
Inventor
鄭銘坤
潘慶元
王俊翔
蔡敷恩
Original Assignee
圓展科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 圓展科技股份有限公司 filed Critical 圓展科技股份有限公司
Priority to TW110106427A priority Critical patent/TWI778524B/zh
Publication of TW202234386A publication Critical patent/TW202234386A/zh
Application granted granted Critical
Publication of TWI778524B publication Critical patent/TWI778524B/zh

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

一種偵測雙邊發話及消除回音的方法,適用於通訊裝置,通訊裝置具有音訊處理電路,通訊裝置用於電性連接喇叭及麥克風,方法包括:通訊裝置取得遠端訊號,遠端訊號用於供喇叭播放;麥克風產生錄音;音訊處理電路依據遠端訊號及錄音進行音訊處理程序以產生近端振幅;以音訊處理電路至少依據近端振幅、歷史資訊及門檻資訊產生判斷結果,判斷結果用於指示雙邊發話或單邊發話;以及音訊處理電路依據判斷結果調整動態等化器的參數組。

Description

偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統
本發明涉及遠端音訊或視訊會議中的免持裝置,特別是一種偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統。
為滿足大型會議的需求,應用在視訊會議的免持裝置通常串接多個免持裝置,提高喇叭輸出音量,並且使用高感度麥克風,以便提供一個便於與會者聆聽及免持裝置收音的環境。
然而,上述作法將導致免持裝置的麥克風收到更多回音,以至於在執行回音消除演算法時難以達到全雙工。
有鑑於此,本發明提出一種偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統,藉此解決麥克風收到過多回音使得回音消除演算法難以達到全雙工的問題。
依據本發明一實施例的偵測雙邊發話及消除回音的方法,適用於通訊裝置,通訊裝置具有音訊處理電路,通訊裝置用於電性連接喇叭及麥克風,方法包括:通訊裝置取得遠端訊號,遠端訊號用於供喇叭播放;麥克風產生錄音;音訊處理電路依據遠端訊號及錄音進行音訊處理程序以產生近端振幅;以音訊處理電路至少依據近端振幅、歷史資訊及門檻資訊產生判斷結果,判斷結果用於指示雙邊發話或單邊發話;以及音訊處理電路依據判斷結果調整動態等化器的參數組。
依據本發明一實施例的偵測雙邊發話及消除回音的通訊裝置,包括:通訊電路,用於取得遠端訊號;以及音訊處理電路,電性連接通訊電路且用於電性連接喇叭及麥克風,其中音訊處理電路用於傳送遠端訊號至喇叭,接收麥克風產生的錄音,依據遠端訊號及錄音進行音訊處理程序以產生近端振幅,至少依據近端振幅、歷史資訊及門檻資訊產生用於指示雙邊發話或單邊發話的判斷結果,及依據判斷結果調整動態等化器的參數組,其中動態等化器依據參數組處理遠端訊號。
依據本發明一實施例的偵測雙邊發話及消除回音的通訊系統,包括彼此通訊連接的第一通訊裝置及第二通訊裝置,其中第一通訊裝置包括:第一通訊介面,用於取得一遠端訊號;第一音訊處理電路,電性連接第一通訊介面且用於電性連接第一喇叭及第一麥克風,第一音訊處理電路用於傳送遠端訊號至第一喇叭,接收第一麥克風產生的第一錄音,依據遠端訊號、第一錄音及第二判斷結果產生第一判斷結果,第一判斷結果用於指示雙邊發話或單邊發話,並依據第一判斷結果調整動態等化器的參數組,其中動態等化器依據參數組處理遠端訊號;以及第一通訊電路,電性連接該第一音訊處理電路且用於發送被動態等化器處理後的遠端訊號及接收第二判斷結果;第二通訊裝置包括:第二通訊電路,用於接收第一通訊裝置發送的遠端訊號;第二音訊處理電路,電性連接第二通訊電路且用於電性連接第二喇叭及第二麥克風,第二音訊處理電路用於傳送遠端訊號至第二喇叭,接收第二麥克風產生的第二錄音,依據遠端訊號及第二錄音產生第二判斷結果,第二判斷結果用於指示雙邊發話或單邊發話;其中第二通訊電路更用於發送第二判斷結果至第一通訊裝置。
以上之關於本揭露內容之說明及以下之實施方式之說明係用於示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
以下在實施方式中詳細敘述本發明之詳細特徵以及特點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之構想及特點。以下之實施例係進一步詳細說明本發明之觀點,但非以任何觀點限制本發明之範疇。
本發明適用的場景例如:在大型會議室中透過一或多個線上會議免持裝置(speakphone)播放音訊或視訊。
圖1是本發明一實施例的偵測雙邊發話及消除回音的通訊系統的硬體架構圖。雙邊發話的定義為:近端(本地端)喇叭播放遠端與會者聲音的同時,近端麥克風錄入近端與會者的聲音。
在圖1繪示的實施例中,通訊系統包括彼此通訊連接的第一通訊裝置10、第二通訊裝置20及第三通訊裝置30。該三通訊裝置10、20及30以菊鍊(daisy chain)形式串連。實務上,可依據會議空間大小決定通訊系統中的通訊裝置個數。若僅需要一個通訊裝置,則設置第一通訊裝置10。若需要兩個以上的通訊裝置,則設置一個第一通訊裝置10及一個以上的第二通訊裝置20。如圖1中的第三通訊裝置30,其與第二通訊裝置20具有相同硬體結構。因此,以下僅說明第一及第二通訊裝置10及20的實施細節。
第一通訊裝置10包括第一通訊介面11、第一通訊電路12、第一音訊處理電路14及第一轉換電路16。第一通訊介面11通訊連接網路N。第一音訊處理電路14電性連接第一通訊介面,且透過第一轉換電路16電性連接第一通訊電路12、第一喇叭18及第一麥克風19。
第一通訊介面11從網路N接收來自遠端裝置的遠端訊號。遠端訊號包含遠端與會者的語音資訊。
第一通訊電路12串連第一及第二通訊裝置10及20。第一通訊電路12可發送經第一音訊處理電路14及第一轉換電路16處理後的遠端訊號及接收來自第二通訊裝置20的第二判斷結果。第一通訊電路12例如採用低電壓差分訊號(Low Voltage Differential Signaling,LVDS)技術,並使用差動訊號傳送資料,藉此增加傳輸距離。
第一音訊處理電路14可傳送遠端訊號至第一喇叭18,接收第一麥克風19產生的第一錄音,依據遠端訊號、第一錄音及第二判斷結果產生第一判斷結果,第一判斷結果用於指示雙邊發話或單邊發話,並依據第一判斷結果調整動態等化器(Dynamic Equalizer)的參數組,其中動態等化器依據參數組處理遠端訊號。第一音訊處理電路14例如採用中央處理器(Central Processing Unit,CPU)。後文將另外敘述雙邊發話的偵測方式。
第一轉換電路16可集中資料並轉換資料格式。第一轉換電路16例如採用現場可程式化邏輯閘陣列(Field Programmable Gate Array,FPGA)。在其他實施例中,第一轉換電路16亦可整合於第一音訊處理電路14。
第一喇叭18可播放被動態等化器依據第一音訊處理電路14調整後的參數組調整的遠端訊號以產生第一遠端聲音。第一麥克風19可錄製本身所處環境的聲音以產生第一錄音。實務上,第一通訊裝置10可內建或外接第一喇叭18及第一麥克風19。
第二通訊裝置20包括第二通訊電路22、第二音訊處理電路24及第二轉換電路26。第二通訊電路22通訊連接第一通訊電路12。第二音訊處理電路24透過第二轉換電路26電性連接第二通訊電路22、第二喇叭28及第二麥克風29。
第二通訊電路22可接收第一通訊裝置10發送的遠端訊號,並將第二音訊處理電路24對於雙邊發話的第二判斷結果發送至第一通訊裝置10。第二通訊電路22與第一通訊電路12在硬體上基本相同。
第二音訊電路24可傳送遠端訊號至第二喇叭28,接收第二麥克風29產生的第二錄音,依據遠端訊號及第二錄音產生第二判斷結果,第二判斷結果可指示雙邊發話或單邊發話。
第二轉換電路26電性連接第二音訊處理電路24。第二轉換電路26與第一轉換電路16在硬體上基本相同。
第二喇叭28可播放從第一通訊裝置10接收的遠端訊號以產生第二遠端聲音。第二麥克風29可錄製本身所處環境的聲音以產生第二錄音。實務上,第二通訊裝置20可內建或外接第二喇叭28及第二麥克風29。
圖2是本發明一實施例的第一及第二音訊電路14及24的內部模組示意圖。圖2中的方塊可採用軟體或硬體電路方式實現。方塊之間的箭頭用於表示資料傳輸方向。為便於檢視,在圖2中省略繪示第一通訊界面13、第一及第二通訊電路12、22與第一及第二轉換電路16、26。
圖3是本發明一實施例的偵測雙邊發話及消除回音的方法的流程圖,適用於圖1繪示的第一或第二通訊裝置10或20。以下請一併參考圖2及圖3。
步驟S31為「通訊裝置取得遠端訊號」,步驟S32為「麥克風產生錄音」。
首先,第一通訊介面11從網路N取得遠端訊號,動態等化器141依據預設的參數組處理遠端訊號後,將遠端訊號輸出至第一及第二喇叭18及28。第一喇叭18依據處理後的遠端訊號播放第一遠端聲音,此時第一麥克風19錄入第一通訊裝置10週邊的聲音以產生第一錄音;若此時近端與會者發言,則第一錄音將包含與會者語音及第一遠端聲音。同理,第二喇叭28播放第二遠端聲音且第二麥克風29產生第二錄音。
步驟S33為「音訊處理電路依據遠端訊號及錄音進行音訊處理程序以至少產生近端振幅」。
請參考圖2,第一錄音經過適應性濾波器(Adaptive Filter)143、非線性處理器(Nonlinear Processor,NLP)144、雜訊抑制器(Noise Reduction,NR)145、混音器146、自動增益控制器(Automatic Gain Control,AGC)147以及壓縮器(Compressor)148等模組的處理,最終透過網路N而被傳送至遠端的通訊裝置。在上述模組中,適應性濾波器143及非線性處理器144可進行回音消除(Acoustic Echo Cancelling,AEC),雜訊抑制器145可抑制雜訊,混音器146將兩個雜訊抑制器145、245各自的輸出訊號進行混音。自動增益控制器147調整混音器146的輸出訊號中的響度,壓縮器148可避免聲音飽和。
第二音訊電路24中的適應性濾波器243、非線性處理器244及雜訊抑制器245等模組的運作方式如前所述,其差別在於:第二音訊電路24中的雜訊抑制器245的輸出訊號更被串接到第一音訊電路14中的混音器146。
第一、第二音訊電路14、24中的雙邊發話偵測器142、242各自用於偵測第一、第二通訊裝置10、20週邊是否具有雙邊發話的狀況。
在以菊鍊形式串聯的多個通訊裝置中,位於末端的通訊裝置將依據近端振幅、遠端語音機率、遠端振幅、歷史資訊及門檻資訊等進行綜合判斷以產生雙邊通話的判斷結果。近端振幅反映近端聲音的音量。遠端語音機率反映遠端聲音為語音的機率。遠端振幅反映遠端聲音的音量。歷史資訊包括近端振幅衰減值、遠端語音機率衰減值及遠端振幅衰減值,該三衰減值反應前次的近端振幅、遠端語音機率及遠端振幅。門檻資訊則包含由高門檻值及低門檻值形成的區間,且高門檻值大於低門檻值。非位於末端的通訊裝置除了依據前述多種資訊,更參考後一級通訊裝置的另一判斷結果以產生雙邊通話的判斷結果。以圖1為例,第一通訊裝置10的後一級通訊裝置為第二通訊裝置20,第二通訊裝置20的後一級通訊裝置為第三通訊裝置30。
步驟S34為「音訊處理電路至少依據近端振幅、歷史資訊及門檻資訊產生用於指示雙邊發話或單邊發話的判斷結果」。假設本發明一實施例的通訊系統僅包含位於末端的第二通訊裝置20及非位於末端的第一通訊裝置10,以下舉例說明產生判斷結果的兩種實施方式。
在步驟S34的第一種實施方式中,第二通訊裝置20中的雙邊發話偵測器242進行運算如下所述:
首先,將雜訊抑制器245本次輸出音訊訊框(frame)以K個取樣點為單位分成數個區塊。對於每一區塊中的K個取樣點取得振幅最大者,再將所有區塊的振幅最大值予以平均。按上述得到的平均振幅即為近端振幅A2。
其次,從歷史資訊中取得近端振幅衰減值A2’,其為雜訊抑制器245前次計算的結果與衰減係數的乘積。從歷史資訊中取得前次第一旗標F21’,其為第二音訊電路24前次設定的結果。從門檻資訊中取得高門檻值TH及低門檻值TL,其中TH>TL。歷史資訊及門檻資訊例如儲存於第二音訊電路10的儲存單元中。
再來,選擇近端振幅A2與近端振幅衰減值A2’中的較大者A2 max
若­­TH<A2 max,則將第一旗標F21設為1;
若­­A2 max<TL,則將第一旗標F21設為0;
若TL≤­­A2 max≤TH,則維持第一旗標F21的設定值,即以前次的第一旗標F21’作為本次第一旗標F21;以及
將A2 max乘以衰減係數以作為下一次計算時的近端振幅衰減值A2’。
當第一旗標F21被設定時(F21=1),第二判斷結果指示為雙邊發話。當第一旗標F21被解除時(F21=0),第二判斷結果指示為單邊發話。
請參考前述的運算流程。第一通訊裝置10中的雜訊抑制器145按前述方式產生近端振幅A1。第一音訊處理電路14從歷史資訊中取得近端振幅衰減值A1’及前次第一旗標F11’,從門檻資訊中取得高門檻值TH及低門檻值TL,然後按照前述方式設定、解除或維持第一旗標F11。當第一旗標F21被設定時(F21=1),第一判斷結果指示為雙邊發話。與前述不同的是,當第一通訊裝置10中的第一旗標F11被解除(F11=0)但第二通訊裝置20中的第一旗標F22被設定(F21=1)時,第一判斷結果仍指示為雙邊發話。除非兩個通訊裝置10、20的第一旗標F11、F21皆被解除,第一判斷結果才會指示單邊通話。簡言之,雙邊發話偵測器142除了進行如前述雙邊發話偵測器242的運算,更透過第一通訊電路12接收第二判斷結果做為參考依據。
在步驟S34的第二種實施方式中,第二音訊處理電路24依據遠端訊號及第二錄音進行音訊處理程序產生近端振幅A2、遠端語音機率P2及遠端振幅F2。
雙邊發話偵測器242取得的歷史資訊包括近端振幅衰減值A2’、遠端語音機率衰減值P2’、遠端振幅衰減值F2’、前次第一旗標F21’、前次第二旗標F22’及前次第三旗標F33’。雙邊發話偵測器242取得的門檻資訊包括近端振幅區間R1、遠端語音區間R2及端振幅區間R3,其中,每個區間Rn由高門檻值THn及低門檻值TLn組成,即Rn=[THn, TLn],且THn>TLn,n∈{1, 2, 3}。
雙邊發話偵測器242至少依據近端振幅A2、歷史資訊及門檻資訊產生第二判斷結果的運算過程如下所述:
選擇近端振幅A2及近端振幅A2’衰減值中的第一較大者A2 max
當第一較大者A2 max大於近端振幅區間R1時,即TH1<A2 max,則將第一旗標F21設定為1;
當第一較大者A2 max小於近端振幅區間R1時,即A2 max<TL1,則將第一旗標F21解除為0;
當第一較大者A2 max介於近端振幅區間R1時,即TL1<A2 max<TH1,則以前次第一旗標F21’作為本次第一旗標F21;
選擇遠端語音機率P2及遠端語音機率衰減值P2’中的第二較大者P2 max
當第二較大者P2 max大於遠端語音區間R2時,即TH2<P2 max,則將第二旗標F22設定為1;
當第二較大者P2 max小於遠端語音區間R2時,即P2 max<TL2,則將第二旗標F22解除為0;
當第二較大者P2 max介於遠端語音區間R2時,即TL2<A2 max<TH2,則以前次第二旗標F22’作為本次第二旗標F22;
選擇遠端振幅F2及遠端振幅衰減值F2’中的第三較大者F2 max
當第三較大者F2 max大於遠端振幅區間R3,即TH3<F2 max,則將第三旗標F23設定為1;
當第三較大者F2 max小於遠端振幅區間R3時,即F2 max<TL3,則將第三旗標F23解除為0;
當第三較大者F2 max介於遠端振幅區間R3時,即TL3<F2 max<TH3,則以前次第二旗標F23’作為本次第二旗標F23;以及
將第一、第二及第三較大者A2 max、P2 max及F2 max各自乘以對應的衰減係數以作為下一次運算時所需的近端振幅衰減值A2’、遠端語音機率衰減值P2’及遠端振幅衰減值F2’。
在雙邊發話偵測器242完成上述運算過程之後,再依據該三旗標F21、F22及F23採用如下判斷邏輯:當第一旗標F21被設定時,或當第二旗標F22及第三旗標F23皆被設定時,將第二判斷結果D2指示為雙邊發話,即D2=(F21 or (F22 and F23))。若D2為1,代表目前第二通訊裝置20為雙邊發話;若D2為0,代表目前第二通訊裝置20為單邊發話。
此外,第二通訊電路22更將第二判斷結果D2傳送至第一通訊裝置10的雙邊發話偵測器142。
同理,比照雙邊發話偵測器242的計算方式,第一音訊處理電路14中的雙邊發話偵測器142依據近端振幅A1、遠端語音機率P1、遠端振幅F1及對應於該三資料的歷史資訊與門檻資訊可計算出屬於第一通訊裝置10的三個旗標F11、F12及F13。須注意的是:第一判斷結果D1的判斷邏輯更參考第二判斷結果D2,即D1=(F11 or (F12 and F13) or D2)。若D1為1,代表目前第一通訊裝置10為雙邊發話;若D1為0,代表目前第一通訊裝置10為單邊發話。
在步驟S34的第二種實施方式中,若符合以下三種情況其中一者,則雙邊發話偵測器142、242判定為雙邊發話:
(1) 最近二次取樣的近端聲音的音量超過一閾值;
(2) 最近二次播放的遠端聲音屬於語音的機率超過另一閾值且遠端聲音的音量超過又一閾值;以及
(3) 後一級通訊裝置判定為雙邊發話(屬於菊鍊末端的通訊裝置則不需考慮此狀況)。
步驟S35為「音訊處理電路依據該判斷結果調整該動態等化器參數」。
在產生第一判斷結果D1之後,第一音訊處理電路14依據第一判斷結果D1調整動態等化器的參數組。
在一實施例中,動態等化器的參數組可被調整為單邊參數組或雙邊參數組,各參數組中包含一或多個參數。作為第一通訊裝置10上電運作時的預設值,單邊參數組用於純語音或純回音的狀況。雙邊參數組則用於雙邊發話的狀況。
圖4是第一音訊處理電路14設定動態等化器參數的流程圖。
步驟S41為「啟動雙邊發話偵測」,其細節如前文所述。
步驟S42至S43的流程表示當判斷結果指示為雙邊發話時,判斷當前的動態等化器141的參數組是否為雙邊參數組。當步驟S43判斷為「是」時,執行步驟S44,維持目前雙邊參數組的設定。當步驟S43判斷為「否」時,執行步驟S45,將動態等化器141的參數組由單邊參數組逐漸調整為雙邊參數組,直到動態等化器141的曲線符合雙邊參數組的設定為止。
步驟S42至S46的流程表示當判斷結果指示為單邊發話時,判斷當前的動態等化器141的參數組是否為單邊參數組。當步驟S46判斷為「是」時,執行步驟S47,維持目前的單邊參數組的設定。當步驟S46判斷為「否」時,執行步驟S48,將動態等化器141的參數組由雙邊參數組逐漸調整為單邊參數組,直到動態等化器141的曲線符合單邊參數組的設定為止。
在完成步驟S44、S45、S46及S47之後皆返回步驟S41。
步驟S45及步驟4S8所述的「逐漸調整」的一種實施方式為:對於動態等化器中可設定的每個參數,每隔一單位時依據一偏移量調整參數組中的一參數,直到該參數等於單/雙邊參數組中的單/雙邊參數。單邊參數組中的一單邊參數的增益值大於雙邊參數組中的一雙邊參數的增益值。雙邊參數組中的參數設定在負增益,藉此抑制第一及第二喇叭18及28的輸出音量。雙邊參數組中的參數值在喇叭失真嚴重的頻率抑制較強,其他失真較不嚴重的頻率則抑制較弱或甚至不用抑制。因此,可降低第一及第二麥克風19及29錄入聲音中的遠端語音的失真程度。
綜上所述,本發明提出的偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統不僅可以提高線上會議的收音與聆聽距離,同時可以全雙工模式執行回音消除功能。本發明可提升線上會議的流暢度,帶給所有與會者同處一地的臨場感。本發明可避免一方說話時,另一方的聲音無法傳遞的狀況。藉由調整動態等化器的參數,本發明可以針對喇叭非線性失真的頻段進行抑制,在其他頻段則可以減少調整幅度或甚至不調整。是以在本發明中所使用的串列免持裝置(speakerphone)並不需要特別提高單一喇叭的音量,因此避免在大會議室中為了提高喇叭音量,導致靠近喇叭的與會者暴露於過大音量的不適感。此外,在本發明中所使用的串列免持裝置也無須配置高感度的麥克風。
雖然本發明以前述之實施例揭露如上,然其並非用於限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
N…網路 10…第一通訊裝置 11…第一通訊介面 12…第一通訊電路 14…第一音訊處理電路 16…第一轉換電路 18…第一喇叭 19…第一麥克風 20…第二通訊裝置 22…第二通訊電路 24…第二音訊處理電路 28…第二喇叭 29…第二麥克風 30…第三通訊裝置 32…第三通訊電路 34…第三音訊處理電路 38…第三喇叭 39…第三麥克風 141…動態等化器 142、242…雙邊發話偵測器 143、243…適應性濾波器 144、244…非線性處理器 145、245…雜訊抑制器 146…混音器 147…自動增益控制器 148…壓縮器 S31~S35、S41~S49…步驟
圖1是本發明一實施例的偵測雙邊發話及消除回音的通訊系統的硬體架構圖; 圖2是本發明一實施例的第一及第二音訊電路的內部模組示意圖; 圖3是本發明一實施例的偵測雙邊發話及消除回音的方法的流程圖;以及 圖4是第一音訊處理電路設定動態等化器的參數組的流程圖。
S31~S35…步驟

Claims (7)

  1. 一種偵測雙邊發話及消除回音的方法,適用於一通訊裝置,該通訊裝置具有一音訊處理電路,該通訊裝置用於電性連接一喇叭及一麥克風,該方法包括:以該通訊裝置取得一遠端訊號,該遠端訊號用於供該喇叭播放;以該麥克風產生一錄音;以該音訊處理電路依據該遠端訊號及該錄音進行一音訊處理程序以產生一近端振幅;以該音訊處理電路至少依據該近端振幅、一歷史資訊及一門檻資訊產生一判斷結果,該判斷結果用於指示雙邊發話或單邊發話;以及以該音訊處理電路依據該判斷結果調整動態等化器的一參數組;其中該歷史資訊包括一近端振幅衰減值及一前次判斷結果;該門檻資訊包括一高門檻值及一低門檻值,且該高門檻值大於該低門檻值;以及以該音訊處理電路至少依據該近端振幅、該歷史資訊及該門檻資訊產生該判斷結果包括:選擇該近端振幅及該近端振幅衰減值中的較大者;當該較大者大於該高門檻值時,指示該判斷結果為雙邊發話;當該較大者小於該低門檻值時,選擇性地指示該判斷結果為單邊發話;及當該較大者介於該高門檻值及該低門檻值之間時,以該前次判斷結果作為該判斷結果; 以該音訊處理電路依據該判斷結果調整該動態等化器的該參數組包括:當該判斷結果指示為單邊發話時,判斷該參數組是否為一單邊參數組;當該參數組為該單邊參數組時,維持該參數組;且當該參數組非該單邊參數組時,將該參數組調整為該單邊參數組;以及當該判斷結果指示為雙邊發話時,判斷該參數組是否為一雙邊參數組;當該參數組為該雙邊參數組時,維持該參數組;且當該參數組非該雙邊參數組時,將該參數組調整為該雙邊參數組,其中該單邊參數組中的一單邊參數的增益值大於該雙邊參數組中的一雙邊參數的增益值。
  2. 如請求項1的方法,更包括:以該音訊處理電路依據該遠端訊號及該錄音進行該音訊處理程序以產生一遠端語音機率及一遠端振幅;其中該歷史資訊包括一近端振幅衰減值、一遠端語音機率衰減值、一遠端振幅衰減值、一前次第一旗標、一前次第二旗標及一前次第三旗標;該門檻資訊包括一近端振幅區間、一遠端語音區間及一遠端振幅區間;至少依據該近端振幅、該歷史資訊及該門檻資訊產生該判斷結果包括:選擇該近端振幅及該近端振幅衰減值中的一第一較大者;當該第一較大者大於該近端振幅區間時,設定一第一旗標; 當該第一較大者小於該近端振幅區間時,解除該第一旗標;且當該第一較大者介於該近端振幅區間時,以該前次第一旗標作為該第一旗標;選擇該遠端語音機率及該遠端語音機率衰減值中的一第二較大者;當該第二較大者大於該遠端語音區間時,設定一第二旗標;當該第二較大者小於該遠端語音區間時,解除該第二旗標;且當該第二較大者介於該遠端語音區間時,以該前次第二旗標作為該第二旗標;選擇該遠端振幅及該遠端振幅衰減值中的一第三較大者;當該第三較大者大於該遠端振幅區間,設定一第三旗標;當該第三較大者小於該遠端振幅區間時,解除該第三旗標;且當該第三較大者介於該遠端振幅區間時,以該前次第三旗標作為該第三旗標;以及當該第一旗標被設定時,或當該第二旗標及該第三旗標皆被設定時,指示該判斷結果為雙邊發話。
  3. 如請求項2的方法,更包括:以該通訊裝置從與該通訊裝置通訊連接的另一通訊裝置取得另一判斷結果,且至少依據該近端振幅、該歷史資訊及該門檻資訊產生該判斷結果更包括:當該另一判斷結果指示為雙邊發話時,指示該判斷結果為雙邊發話。
  4. 如請求項1的方法,其中將該參數組調整為該單邊參數組包括:每隔一單位時間依據一偏移量調整該參數組中的一參數,直到該參數組中的該參數等於該單邊參數;以及 將該參數組調整為該雙邊參數組包括:每隔該單位時間依據該偏移量調整該參數組中的該參數,直到該參數組中的該參數等於該雙邊參數。
  5. 一種偵測雙邊發話及消除回音的通訊裝置,包括:一通訊電路,用於取得一遠端訊號;以及一音訊處理電路,電性連接該通訊電路且用於電性連接一喇叭及一麥克風,其中該音訊處理電路用於傳送該遠端訊號至該喇叭,接收該麥克風產生的一錄音,依據該遠端訊號及該錄音進行一音訊處理程序以產生一近端振幅,至少依據該近端振幅、一歷史資訊及一門檻資訊產生用於指示雙邊發話或單邊發話的一判斷結果,及依據該判斷結果調整一動態等化器的一參數組,其中該動態等化器依據該參數組處理該遠端訊號;其中該歷史資訊包括一近端振幅衰減值及一前次判斷結果;該門檻資訊包括一高門檻值及一低門檻值,且該高門檻值大於該低門檻值;以及該音訊處理電路至少依據該近端振幅、該歷史資訊及該門檻資訊產生該判斷結果包括:選擇該近端振幅及該近端振幅衰減值中的較大者;當該較大者大於該高門檻值時,指示該判斷結果為雙邊發話;當該較大者小於該低門檻值時,選擇性地指示該判斷結果為單邊發話;及當該較大者介於該高門檻值及該低門檻值之間時,以該前次判斷結果作為該判斷結果;該音訊處理電路依據該判斷結果調整該動態等化器的該參數組包括: 當該判斷結果指示為單邊發話時,判斷該參數組是否為一單邊參數組;當該參數組為該單邊參數組時,維持該參數組;且當該參數組非該單邊參數組時,將該參數組調整為該單邊參數組;以及當該判斷結果指示為雙邊發話時,判斷該參數組是否為一雙邊參數組;當該參數組為該雙邊參數組時,維持該參數組;且當該參數組非該雙邊參數組時,將該參數組調整為該雙邊參數組,其中該單邊參數組中的一單邊參數的增益值大於該雙邊參數組中的一雙邊參數的增益。
  6. 如請求項5的通訊裝置,其中該通訊電路更用於取得另一通訊裝置的另一判斷結果,該另一判斷結果用於指示該另一通訊裝置為雙邊發話或單邊發話,且該音訊處理電路更依據該另一判斷結果更新該判斷結果。
  7. 一種偵測雙邊發話及消除回音的通訊系統,包括彼此通訊連接的一第一通訊裝置及一第二通訊裝置,其中該第一通訊裝置包括:一第一通訊介面,用於取得一遠端訊號;一第一音訊處理電路,電性連接該第一通訊介面且用於電性連接一第一喇叭及一第一麥克風,該第一音訊處理電路用於傳送該遠端訊號至該第一喇叭,接收該第一麥克風產生的一第一錄音,依據該遠端訊號、該第一 錄音及一第二判斷結果產生一第一判斷結果,該第一判斷結果用於指示雙邊發話或單邊發話,並依據該第一判斷結果調整一動態等化器的一參數組,其中該動態等化器依據該參數組處理該遠端訊號;以及一第一通訊電路,電性連接該第一通訊電路且用於發送被該動態等化器處理後的該遠端訊號及接收該第二判斷結果;該第二通訊裝置包括:一第二通訊電路,用於接收該第一通訊裝置發送的該遠端訊號;一第二音訊處理電路,電性連接該第二通訊電路且用於電性連接一第二喇叭及一第二麥克風,該第二音訊處理電路用於傳送該遠端訊號至該第二喇叭,接收該第二麥克風產生的一第二錄音,依據該遠端訊號及該第二錄音產生該第二判斷結果,該第二判斷結果用於指示雙邊發話或單邊發話;其中該第二通訊電路更用於發送該第二判斷結果至該第一通訊裝置;其中該第二音訊處理電路依據該遠端訊號及該第二錄音產生該第二判斷結果包括:第二音訊處理電路進行音韻處理程序以產生近端振幅;第二音訊處理電路至少依據該近端振幅、一歷史資訊及一門檻資訊產生用於指示雙邊發話或單邊發話的一判斷結果作為該第二判斷結果,及依據該判斷結果調整一動態等化器的一參數組,其中該動態等化器依據該參數組處理該遠端訊號;該歷史資訊包括一近端振幅衰減值及一前次判斷結果; 該門檻資訊包括一高門檻值及一低門檻值,且該高門檻值大於該低門檻值;以及該第二音訊處理電路至少依據該近端振幅、該歷史資訊及該門檻資訊產生該判斷結果包括:選擇該近端振幅及該近端振幅衰減值中的較大者;當該較大者大於該高門檻值時,指示該判斷結果為雙邊發話;當該較大者小於該低門檻值時,選擇性地指示該判斷結果為單邊發話;及當該較大者介於該高門檻值及該低門檻值之間時,以該前次判斷結果作為該判斷結果;該第二音訊處理電路依據該判斷結果調整該動態等化器的該參數組包括:當該判斷結果指示為單邊發話時,判斷該參數組是否為一單邊參數組;當該參數組為該單邊參數組時,維持該參數組;且當該參數組非該單邊參數組時,將該參數組調整為該單邊參數組;以及當該判斷結果指示為雙邊發話時,判斷該參數組是否為一雙邊參數組;當該參數組為該雙邊參數組時,維持該參數組;且當該參數組非該雙邊參數組時,將該參數組調整為該雙邊參數組,其中 該單邊參數組中的一單邊參數的增益值大於該雙邊參數組中的一雙邊參數的增益。
TW110106427A 2021-02-24 2021-02-24 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統 TWI778524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110106427A TWI778524B (zh) 2021-02-24 2021-02-24 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110106427A TWI778524B (zh) 2021-02-24 2021-02-24 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統

Publications (2)

Publication Number Publication Date
TW202234386A TW202234386A (zh) 2022-09-01
TWI778524B true TWI778524B (zh) 2022-09-21

Family

ID=84957310

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110106427A TWI778524B (zh) 2021-02-24 2021-02-24 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統

Country Status (1)

Country Link
TW (1) TWI778524B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW357536B (en) * 1996-10-04 1999-05-01 Lucent Technologies Inc Intelligent acoustic systems peripheral
CN101151840A (zh) * 2005-01-10 2008-03-26 四次方有限公司 用于视觉媒体统合处理的集成架构
US20120069989A1 (en) * 2007-03-14 2012-03-22 Clearone Communications, Inc. Personal speakerphone device
US20160127527A1 (en) * 2014-10-30 2016-05-05 Imagination Technologies Limited Controlling Operational Characteristics of Acoustic Echo Canceller

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW357536B (en) * 1996-10-04 1999-05-01 Lucent Technologies Inc Intelligent acoustic systems peripheral
CN101151840A (zh) * 2005-01-10 2008-03-26 四次方有限公司 用于视觉媒体统合处理的集成架构
US20120069989A1 (en) * 2007-03-14 2012-03-22 Clearone Communications, Inc. Personal speakerphone device
US20160127527A1 (en) * 2014-10-30 2016-05-05 Imagination Technologies Limited Controlling Operational Characteristics of Acoustic Echo Canceller

Also Published As

Publication number Publication date
TW202234386A (zh) 2022-09-01

Similar Documents

Publication Publication Date Title
US6442272B1 (en) Voice conferencing system having local sound amplification
JP4255461B2 (ja) 電話会議用のステレオ・マイクロフォン処理
WO2008150022A1 (ja) 音声信号処理装置、遅延時間の設定方法
JPH06104970A (ja) 拡声電話機
CN105637892B (zh) 用于在收听音频的同时辅助对话的系统和耳机
EP1700465B1 (en) System and method for enchanced subjective stereo audio
JP2013121105A (ja) 耳孔装着型収音装置、信号処理装置、収音方法
CN110956975B (zh) 回声消除方法及装置
CN106448691A (zh) 一种用于扩音通信系统的语音增强方法
US8744524B2 (en) User interface tone echo cancellation
CN108462763B (zh) 降噪终端和降噪方法
CN106657700B (zh) 一种能消除回声的免提通话装置及其控制方法
CN112492112A (zh) 一种基于对讲系统的回音消除方法和装置
US6771779B1 (en) System, apparatus, and method for improving speech quality in multi-party devices
US9232072B2 (en) Participant controlled spatial AEC
TWI778524B (zh) 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統
CN112637438B (zh) 一种基于单线传输的门禁双端对讲方法和系统
JP2861888B2 (ja) エコー・ノイズキャンセラおよびエコー・ノイズ消去方法
JP6945158B2 (ja) 通話装置、プログラム及び通話システム
JPH06153289A (ja) 音声入出力装置
CN216982106U (zh) 音频处理电路及开放式音频设备
US10264116B2 (en) Virtual duplex operation
US11670318B2 (en) Apparatus and method for acoustic echo cancellation with occluded voice sensor
JP2007124163A (ja) 通話装置
CN115705848A (zh) 一种降噪方法、设备及存储介质

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent