JP2022528683A - 音声通話方法並びにその、装置、電子機器及びコンピュータプログラム - Google Patents
音声通話方法並びにその、装置、電子機器及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2022528683A JP2022528683A JP2021558866A JP2021558866A JP2022528683A JP 2022528683 A JP2022528683 A JP 2022528683A JP 2021558866 A JP2021558866 A JP 2021558866A JP 2021558866 A JP2021558866 A JP 2021558866A JP 2022528683 A JP2022528683 A JP 2022528683A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- voice
- voice call
- audio
- audio capture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 238000004590 computer program Methods 0.000 title claims description 11
- 230000005236 sound signal Effects 0.000 claims abstract description 213
- 230000008569 process Effects 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 26
- 230000009471 action Effects 0.000 claims description 11
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 51
- 238000001514 detection method Methods 0.000 description 25
- 238000004891 communication Methods 0.000 description 16
- 230000007613 environmental effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000009977 dual effect Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/002—Applications of echo suppressors or cancellers in telephonic connections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6008—Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
端末システムの履歴時刻での音声通話状態を取得するステップであって、端末システムに少なくとも2つのオーディオキャプチャ機器が設けられているステップと、
各オーディオキャプチャ機器により現在の時刻にキャプチャされた第1の音声信号を取得し、各第1の音声信号の信号エネルギーをそれぞれ決定するステップと、
履歴時刻での音声通話状態、及び各第1の音声信号の信号エネルギー応じて、各オーディオキャプチャ機器のうち現在の時刻でのターゲットオーディオキャプチャ機器を決定するステップとを含む。
ユーザによる音声通話トリガー動作を受信するステップと、
音声通話トリガー動作に応じて、端末システムのオーディオ再生機器と少なくとも2つのオーディオキャプチャ機器を起動させるステップと、
音声通話の初期時刻に対して、事前設定情報に対応する少なくとも2つのオーディオキャプチャ機器のうちのオーディオキャプチャ機器をターゲットオーディオキャプチャ機器とし、初期時刻での音声通話状態を決定するステップと、
音声通話の初期時刻以外の現在の時刻に対して、第1の態様または第1の態様のいずれかの実施例に係る方法によって決定されたターゲットオーディオキャプチャ機器によりキャプチャされた音声信号に基づいて、相手端機器と音声通話を行うステップとを含む。
端末システムの履歴時刻での音声通話状態を取得するための通話状態取得モジュールであって、端末システムに少なくとも2つのオーディオキャプチャ機器が設けられている通話状態取得モジュールと、
各オーディオキャプチャ機器により現在の時刻にキャプチャされた第1の音声信号を取得し、各第1の音声信号の信号エネルギーをそれぞれ決定するための信号エネルギー取得モジュールと、
履歴時刻での音声通話状態、及び各第1の音声信号の信号エネルギー応じて、各オーディオキャプチャ機器のうちターゲットオーディオキャプチャ機器を決定するためのターゲットオーディオキャプチャ機器決定モジュールとを含む。
ユーザによる音声通話トリガー動作を受信するためのトリガー動作受信モジュールと、
音声通話トリガー動作に応じて、端末システムのオーディオ再生機器と少なくとも2つのオーディオキャプチャ機器を起動させるための機器起動モジュールと、
音声通話の初期時刻に対して、事前設定情報に対応する少なくとも2つのオーディオキャプチャ機器のうちのオーディオキャプチャ機器をターゲットオーディオキャプチャ機器とし、初期時刻での音声通話状態を決定するための初期決定モジュールと、
音声通話の初期時刻以外の現在の時刻に対して、第1の態様または第1の態様のいずれかの実施例に係る方法によって決定されたターゲットオーディオキャプチャ機器によりキャプチャされた音声信号に基づいて、相手端機器と音声通話を行うための音声通話モジュールとを含む。
オーディオ再生機器は、音声信号を再生するためのものであり、
少なくとも2つのオーディオキャプチャ機器は、音声信号をキャプチャするためのものであり、
メモリにコンピュータプログラムが記憶されており、
プロセッサは、コンピュータプログラムを実行することで、第1の態様または第2の者面に係る方法を実現するためのものである。
近端とは、音声通話中の通信ネットワークにおけるローカル端である。
遠端とは、音声通話中の通信ネットワークにおける相手端である。
近端機器とは、音声通話中の近端での発話者が用いた通話機器であり、近端機器に、オーディオキャプチャ機器(例えばマイクロホン)及びオーディオ再生機器(例えばスピーカ、受話器)が設けられている。
遠端機器とは、音声通話中の遠端での発話者が用いた通話機器であり、遠端機器に、オーディオキャプチャ機器(例えばマイクロホン)及びオーディオ再生機器(例えばスピーカ、受話器)が設けられている。
近端音声信号とは、音声通話中に、近端の発話者が話し、近端機器のオーディオキャプチャ機器がキャプチャした音声信号である。
遠端音声信号とは、音声通話中に、遠端の発話者が話し、遠端機器のオーディオキャプチャ機器がキャプチャした後、通信ネットワークを介して近端機器に伝送した音声信号である。
エコー信号とは、音声通話中に、近端機器のオーディオ再生機器が遠端音声信号を再生した後、近端機器のオーディオキャプチャ機器がキャプチャした音声信号である。
エコーキャンセレーションとは、近端機器のオーディオキャプチャ機器からキャプチャされた音声信号からエコー信号をフィルタリングする処理プロセスである。
遠端シングルトークとは、音声通話中に、遠端音声信号が存在し、且つ近端音声信号が存在しない場合の通話状態である。
近端シングルトークとは、音声通話中に、遠端音声信号が存在せず、且つ近端音声信号が存在する場合の通話状態である。
両端ダブルトークとは、音声通話中に、遠端音声信号が存在し、且つ近端音声信号が存在する場合の通話状態である。
ノートークとは、音声通話中に、遠端音声信号が存在せず、且つ近端音声信号が存在しない場合の通話状態である。
履歴時刻に遠端音声信号が存在するか否かを決定し、第1の決定結果を得て、
履歴時刻に近端近端音声信号が存在するか否かを決定し、第2の決定結果を得て、
第1の決定結果及び第2の決定結果に従って、履歴時刻での音声通話状態を決定する方式によって決定される。
履歴時刻でのターゲットオーディオキャプチャ機器により履歴時刻にキャプチャされた第2の音声信号を取得するステップと、
第2の音声信号にエコーキャンセレーションを行い、エコーキャンセレーション処理後の第2の音声信号に近端音声信号が存在するか否かを決定するステップと、を含む。
第1の決定結果として遠端音声信号が存在し、且つ第2の決定結果として近端音声信号が存在しない場合、履歴時刻での音声通話状態が遠端シングルトークであるステップと、
第1の決定結果として遠端音声信号が存在せず、且つ第2の決定結果として近端音声信号が存在する場合、履歴時刻での音声通話状態が近端シングルトークであるステップと、
第1の決定結果として遠端音声信号が存在し、且つ第2の決定結果として近端音声信号が存在する場合、履歴時刻での音声通話状態が両端ダブルトークであるステップと、
第1の決定結果として遠端音声信号が存在せず、且つ第2の決定結果として近端音声信号が存在しない場合、履歴時刻での音声通話状態がノートークであるステップと、を含む。
履歴時刻での音声通話状態が遠端シングルトークである場合、信号エネルギーが最小の第1の音声信号に対応するオーディオキャプチャ機器を現在の時刻でのターゲットオーディオキャプチャ機器として決定するステップと、
履歴時刻での音声通話状態が近端シングルトークである場合、信号エネルギーが最大の第1の音声信号に対応するオーディオキャプチャ機器を現在の時刻でのターゲットオーディオキャプチャ機器として決定するステップと、
履歴時刻での音声通話状態が両端ダブルトークまたはノートークである場合、履歴時刻で決定されたターゲットオーディオキャプチャ機器を現在の時刻でのターゲットオーディオキャプチャ機器として決定するステップと、を含む。
現在の時刻よりも前に、音声通話状態が遠端シングルトークであり続ける回数を決定するステップと、
回数が所定値よりも大きい場合、現在の時刻でのターゲットオーディオキャプチャ機器を現在の時刻以降の所定期間内のターゲットオーディオキャプチャ機器として決定するステップと、をさらに含んでもよい。
現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行うステップと、
エコーキャンセレーション処理後の第1の音声信号に近端音声信号が存在する場合、エコーキャンセレーション処理後の第1の音声信号を遠端機器に送信するステップと、をさらに含む。
現在の時刻での遠端音声信号を取得するステップと、
現在の時刻での遠端音声信号及び現在の時刻でのエコー伝搬経路関数に基づいて、現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号中のエコー信号を得るステップと、
エコー信号に基づいて、現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行うステップと、を含む。
履歴時刻に選択されたターゲットオーディオキャプチャ機器によりキャプチャされた第2の音声信号にエコー信号削除を行い、履歴時刻での残留エコー信号を得るステップと、
履歴時刻での残留エコー信号に基づいて、履歴時刻でのエコー伝搬経路関数を更新し、現在の時刻でのエコー伝搬経路関数を得るステップと、をさらに含んでもよい。
エコーキャンセレーション処理後の第1の音声信号中の環境ノイズ信号及び残留エコー信号を除去して得られた音声信号を遠端機器に送信するステップを含む。
信号エネルギー取得モジュール602は、各オーディオキャプチャ機器により現在の時刻にキャプチャされた第1の音声信号を取得し、各第1の音声信号の信号エネルギーをそれぞれ決定するためのものであり、
ターゲットオーディオキャプチャ機器決定モジュール603は、履歴時刻での音声通話状態、及び各第1の音声信号の信号エネルギー応じて、各オーディオキャプチャ機器のうちターゲットオーディオキャプチャ機器を決定するためのものである。
履歴時刻に遠端音声信号が存在するか否かを決定し、第1の決定結果を得て、
履歴時刻に近端音声信号が存在するか否かを決定し、第2の決定結果を得て、
第1の決定結果及び第2の決定結果に従って、履歴時刻での音声通話状態を決定する。
履歴時刻でのターゲットオーディオキャプチャ機器により履歴時刻にキャプチャされた第2の音声信号を取得し、
第2の音声信号にエコーキャンセレーションを行い、エコーキャンセレーション処理後の第2の音声信号に近端音声信号が存在するか否かを決定する。
第1の決定結果として遠端音声信号が存在し、且つ第2の決定結果として近端音声信号が存在しない場合、履歴時刻での音声通話状態が遠端シングルトークであり、
第1の決定結果として遠端音声信号が存在せず、且つ第2の決定結果として近端音声信号が存在する場合、履歴時刻での音声通話状態が近端シングルトークであり、
第1の決定結果として遠端音声信号が存在し、且つ第2の決定結果として近端音声信号が存在する場合、履歴時刻での音声通話状態が両端ダブルトークであり、
第1の決定結果として遠端音声信号が存在せず、且つ第2の決定結果として近端音声信号が存在しない場合、履歴時刻での音声通話状態がノートークである。
履歴時刻での音声通話状態が遠端シングルトークである場合、信号エネルギーが最小の第1の音声信号に対応するオーディオキャプチャ機器を現在の時刻でのターゲットオーディオキャプチャ機器として決定し、
履歴時刻での音声通話状態が近端シングルトークである場合、信号エネルギーが最大の第1の音声信号に対応するオーディオキャプチャ機器を現在の時刻でのターゲットオーディオキャプチャ機器として決定し、
履歴時刻での音声通話状態が両端ダブルトークまたはノートークである場合、履歴時刻でのターゲットオーディオキャプチャ機器を現在の時刻でのターゲットオーディオキャプチャ機器として決定する。
履歴時刻での音声通話状態が遠端シングルトークである場合、現在の時刻よりも前に、音声通話状態が遠端シングルトークであり続ける回数を決定し、この回数が所定値よりも大きい場合、現在の時刻でのターゲットオーディオキャプチャ機器を現在の時刻以降のターゲットオーディオキャプチャ機器として決定する。
現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行い、
エコーキャンセレーション処理後の第1の音声信号に近端音声信号が存在する場合、エコーキャンセレーション処理後の第1の音声信号を音声通話の相手端機器に送信するための信号送信モジュールをさらに含む。
現在の時刻での遠端音声信号を取得し、
現在の時刻での遠端音声信号及び現在の時刻でのエコー伝搬経路関数に基づいて、現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号中のエコー信号を決定し、
エコー信号に基づいて、現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行う。
履歴時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第2の音声信号にエコーキャンセレーションを行い、履歴時刻での残留エコー信号を得て、
履歴時刻での残留エコー信号に基づいて、履歴時刻でのエコー伝搬経路関数を更新し、現在の時刻でのエコー伝搬経路関数を得る方式によって得られる。
トリガー動作受信モジュール701は、ユーザによる音声通話トリガー動作を受信するためのものであり、
機器起動モジュール702は、音声通話トリガー動作に応じて、端末システムのオーディオ再生機器と少なくとも2つのオーディオキャプチャ機器を起動させるためのものであり、
初期決定モジュール703は、音声通話の初期時刻に対して、事前設定情報に対応する少なくとも2つのオーディオキャプチャ機器のうちのオーディオキャプチャ機器をターゲットオーディオキャプチャ機器とし、初期時刻での音声通話状態を決定するためのものであり、
音声通話モジュール704は、音声通話の初期時刻以外の現在の時刻に対して、第1の態様、第1の態様のいずれかの任意選択的な実施例または第3の態様に係る方法によって決定されたターゲットオーディオキャプチャ機器によりキャプチャされた音声信号に基づいて、相手端機器と音声通話を行うためのものである。
601 通話状態取得モジュール
602 信号エネルギー取得モジュール
603 ターゲットオーディオキャプチャ機器決定モジュール
700 音声通話装置
701 トリガー動作受信モジュール
702 機器起動モジュール
703 初期決定モジュール
704 音声通話モジュール
800 電子機器
801 プロセッサ
802 バス
803 メモリ
804 送受信機
805 オーディオ再生機器
806 オーディオキャプチャ機器
Claims (15)
- 音声通話方法であって、
端末システムの履歴時刻での音声通話状態を取得するステップであって、前記端末システムに少なくとも2つのオーディオキャプチャ機器が設けられているステップと、
各前記オーディオキャプチャ機器により現在の時刻にキャプチャされた第1の音声信号を取得し、各前記第1の音声信号の信号エネルギーをそれぞれ決定するステップと、
前記履歴時刻での音声通話状態、及び各前記第1の音声信号の信号エネルギー応じて、前記オーディオキャプチャ機器のうち前記現在の時刻でのターゲットオーディオキャプチャ機器を決定するステップと、を含む、ことを特徴とする音声通話方法。 - 前記履歴時刻での音声通話状態は、
前記履歴時刻に遠端音声信号が存在するか否かを決定し、第1の決定結果を得るステップと、
前記履歴時刻に近端音声信号が存在するか否かを決定し、第2の決定結果を得るステップと、
前記第1の決定結果と前記第2の決定結果に従って、前記履歴時刻での音声通話状態を決定するステップと、によって決定される、ことを特徴とする請求項1に記載の方法。 - 前記履歴時刻に近端音声信号が存在するか否かを決定するステップは、
前記履歴時刻でのターゲットオーディオキャプチャ機器により前記履歴時刻にキャプチャされた第2の音声信号を取得するステップと、
前記第2の音声信号にエコーキャンセレーションを行い、エコーキャンセレーション処理後の前記第2の音声信号に近端音声信号が存在するか否かを決定するステップと、を含む、ことを特徴とする請求項2に記載の方法。 - 前記音声通話状態は、少なくとも、遠端シングルトーク、近端シングルトーク、両端ダブルトークまたはノートークを含む、ことを特徴とする請求項2に記載の方法。
- 第1の決定結果と前記第2の決定結果に従って、前記履歴時刻での音声通話状態を決定する前記ステップは、
前記第1の決定結果として遠端音声信号が存在し、且つ前記第2の決定結果として近端音声信号が存在しない場合、前記履歴時刻での音声通話状態が遠端シングルトークであるステップと、
前記第1の決定結果として遠端音声信号が存在せず、且つ前記第2の決定結果として近端音声信号が存在する場合、前記履歴時刻での音声通話状態が近端シングルトークであるステップと、
前記第1の決定結果として遠端音声信号が存在し、且つ前記第2の決定結果として近端音声信号が存在する場合、前記履歴時刻での音声通話状態が両端ダブルトークであるステップと、
前記第1の決定結果として遠端音声信号が存在せず、且つ前記第2の決定結果として近端音声信号が存在しない場合、前記履歴時刻での音声通話状態がノートークであるステップと、を含む、ことを特徴とする請求項4に記載の方法。 - 前記履歴時刻での音声通話状態、及び各前記第1の音声信号の信号エネルギー応じて、前記オーディオキャプチャ機器のうち前記現在の時刻でのターゲットオーディオキャプチャ機器を決定する前記ステップは、
前記履歴時刻での音声通話状態が遠端シングルトークである場合、信号エネルギーが最小の第1の音声信号に対応するオーディオキャプチャ機器を前記現在の時刻でのターゲットオーディオキャプチャ機器として決定するステップと、
前記履歴時刻での音声通話状態が近端シングルトークである場合、信号エネルギーが最大の第1の音声信号に対応するオーディオキャプチャ機器を前記現在の時刻でのターゲットオーディオキャプチャ機器として決定するステップと、
前記履歴時刻での音声通話状態が両端ダブルトークまたはノートークである場合、履歴時刻でのターゲットオーディオキャプチャ機器を前記現在の時刻でのターゲットオーディオキャプチャ機器として決定するステップと、を含む、ことを特徴とする請求項4に記載の方法。 - 前記履歴時刻での音声通話状態が遠端シングルトークである場合、
前記現在の時刻よりも前に、音声通話状態が遠端シングルトークであり続ける回数を決定するステップと、
前記回数が所定値よりも大きい場合、前記現在の時刻でのターゲットオーディオキャプチャ機器を前記現在の時刻以降のターゲットオーディオキャプチャ機器として決定するステップと、をさらに含む、ことを特徴とする請求項6に記載の方法。 - 前記現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行うステップと、
エコーキャンセレーション処理後の第1の音声信号に近端音声信号が存在する場合、エコーキャンセレーション処理後の前記第1の音声信号を音声通話の相手端機器に送信するステップと、をさらに含む、ことを特徴とする請求項1~7のいずれか1項に記載の方法。 - 前記現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行う前記ステップは、具体的には、
前記現在の時刻での遠端音声信号を取得するステップと、
前記現在の時刻での遠端音声信号と前記現在の時刻でのエコー伝搬経路関数に基づいて、前記現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号中のエコー信号を決定するステップと、
前記エコー信号に基づいて、前記現在の時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第1の音声信号にエコーキャンセレーションを行うステップと、を含む、ことを特徴とする請求項8に記載の方法。 - 前記現在の時刻でのエコー伝搬経路関数は、
前記履歴時刻でのターゲットオーディオキャプチャ機器によりキャプチャされた第2の音声信号にエコーキャンセレーションを行い、前記履歴時刻での残留エコー信号を得て、
前記履歴時刻での残留エコー信号に基づいて、前記履歴時刻でのエコー伝搬経路関数を更新し、前記現在の時刻でのエコー伝搬経路関数を得る方式によって得られる、ことを特徴とする請求項9に記載の方法。 - 音声通話方法であって、
ユーザによる音声通話トリガー動作を受信するステップと、
前記音声通話トリガー動作に応じて、端末システムのオーディオ再生機器と少なくとも2つのオーディオキャプチャ機器を起動させるステップと、
音声通話の初期時刻に対して、事前設定情報に対応する前記少なくとも2つのオーディオキャプチャ機器のうちの1つのオーディオキャプチャ機器をターゲットオーディオキャプチャ機器とし、前記初期時刻での音声通話状態を決定するステップと、
音声通話の初期時刻以外の現在の時刻に対して、請求項1~10のいずれか1項に記載の方法によって決定されたターゲットオーディオキャプチャ機器によりキャプチャされた音声信号に基づいて、相手端機器と音声通話を行うステップと、を含む、ことを特徴とする音声通話方法。 - 音声通話装置であって、
端末システムの履歴時刻での音声通話状態を取得するための通話状態取得モジュールであって、前記端末システムに少なくとも2つのオーディオキャプチャ機器が設けられている通話状態取得モジュールと、
各前記オーディオキャプチャ機器により現在の時刻にキャプチャされた第1の音声信号を取得し、各前記第1の音声信号の信号エネルギーをそれぞれ決定するための信号エネルギー取得モジュールと、
前記履歴時刻での音声通話状態、及び各前記第1の音声信号の信号エネルギー応じて、前記オーディオキャプチャ機器のうちターゲットオーディオキャプチャ機器を決定するためのターゲットオーディオキャプチャ機器決定モジュールと、を含む、ことを特徴とする音声通話装置。 - 音声通話装置であって、
ユーザによる音声通話トリガー動作を受信するためのトリガー動作受信モジュールと、
前記音声通話トリガー動作に応じて、端末システムのオーディオ再生機器と少なくとも2つのオーディオキャプチャ機器を起動させるための機器起動モジュールと、
音声通話の初期時刻に対して、事前設定情報に対応する前記少なくとも2つのオーディオキャプチャ機器のうちのオーディオキャプチャ機器をターゲットオーディオキャプチャ機器とし、前記初期時刻での音声通話状態を決定するための初期決定モジュールと、
音声通話の初期時刻以外の現在の時刻に対して、請求項1~10のいずれか1項に記載の方法によって決定されたターゲットオーディオキャプチャ機器によりキャプチャされた音声信号に基づいて、相手端機器と音声通話を行うための音声通話モジュールと、を含む、ことを特徴とする音声通話装置。 - メモリ、プロセッサ、オーディオ再生機器、及び少なくとも2つのオーディオキャプチャ機器を含み、
前記オーディオ再生機器は、音声信号を再生するためのものであり、
前記少なくとも2つのオーディオキャプチャ機器は、音声信号をキャプチャするためのものであり、
前記メモリにコンピュータプログラムが記憶されており、
前記プロセッサは、前記コンピュータプログラムを実行することで、請求項1~11のいずれか1項に記載の方法を実現する、ことを特徴とする電子機器。 - プロセッサによって実行されると、請求項1~11のいずれか1項に記載の方法を実現するコンピュータプログラムが記憶されている、ことを特徴とするコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910906728.3A CN110602327B (zh) | 2019-09-24 | 2019-09-24 | 语音通话方法、装置、电子设备及计算机可读存储介质 |
CN201910906728.3 | 2019-09-24 | ||
PCT/CN2020/081385 WO2021056999A1 (zh) | 2019-09-24 | 2020-03-26 | 语音通话方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022528683A true JP2022528683A (ja) | 2022-06-15 |
JP7290749B2 JP7290749B2 (ja) | 2023-06-13 |
Family
ID=68862870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021558866A Active JP7290749B2 (ja) | 2019-09-24 | 2020-03-26 | 音声通話方法並びにその、装置、電子機器及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11875808B2 (ja) |
EP (1) | EP3920516B1 (ja) |
JP (1) | JP7290749B2 (ja) |
CN (1) | CN110602327B (ja) |
WO (1) | WO2021056999A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110602327B (zh) | 2019-09-24 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 语音通话方法、装置、电子设备及计算机可读存储介质 |
CN112151051B (zh) * | 2020-09-14 | 2023-12-19 | 海尔优家智能科技(北京)有限公司 | 音频数据的处理方法和装置及存储介质 |
CN115208976B (zh) * | 2021-04-13 | 2024-10-18 | 深圳市万普拉斯科技有限公司 | 通话通道切换的处理方法、装置、通话设备和存储介质 |
CN113452855B (zh) * | 2021-06-03 | 2022-05-27 | 杭州网易智企科技有限公司 | 啸叫处理方法、装置、电子设备及存储介质 |
CN113555030B (zh) * | 2021-07-29 | 2024-05-31 | 杭州萤石软件有限公司 | 音频信号的处理方法、装置及设备 |
WO2023238419A1 (ja) * | 2022-06-07 | 2023-12-14 | サントリーホールディングス株式会社 | 携帯情報端末、情報処理システム、携帯情報端末の制御方法及びプログラム |
CN115334413B (zh) * | 2022-07-15 | 2024-07-12 | 北京达佳互联信息技术有限公司 | 语音信号处理方法、系统、装置及电子设备 |
CN117935835B (zh) * | 2024-03-22 | 2024-06-07 | 浙江华创视讯科技有限公司 | 音频降噪方法、电子设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6424662A (en) * | 1987-07-21 | 1989-01-26 | Nippon Telegraph & Telephone | Voice conference equipment |
JPH07336790A (ja) * | 1994-06-13 | 1995-12-22 | Nec Corp | マイクロホンシステム |
US20100111324A1 (en) * | 2008-10-31 | 2010-05-06 | Temic Automotive Of North America, Inc. | Systems and Methods for Selectively Switching Between Multiple Microphones |
US20160227336A1 (en) * | 2015-01-30 | 2016-08-04 | Knowles Electronics, Llc | Contextual Switching of Microphones |
US20170064087A1 (en) * | 2015-08-27 | 2017-03-02 | Imagination Technologies Limited | Nearend Speech Detector |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8401178B2 (en) * | 2008-09-30 | 2013-03-19 | Apple Inc. | Multiple microphone switching and configuration |
CN101719969B (zh) * | 2009-11-26 | 2013-10-02 | 美商威睿电通公司 | 判断双端对话的方法、系统以及消除回声的方法和系统 |
US9729344B2 (en) * | 2010-04-30 | 2017-08-08 | Mitel Networks Corporation | Integrating a trigger button module into a mass audio notification system |
US20120057717A1 (en) * | 2010-09-02 | 2012-03-08 | Sony Ericsson Mobile Communications Ab | Noise Suppression for Sending Voice with Binaural Microphones |
JP2012075039A (ja) * | 2010-09-29 | 2012-04-12 | Sony Corp | 制御装置、および制御方法 |
CN102710839B (zh) * | 2012-04-27 | 2017-11-28 | 华为技术有限公司 | 一种提升语音通话效果的方法及通信终端 |
CN107257317B (zh) * | 2012-05-04 | 2022-06-03 | 江虹 | 在通信终端设备之间已建立通信信道的即时通信系统和方法 |
CN105513596B (zh) * | 2013-05-29 | 2020-03-27 | 华为技术有限公司 | 一种语音控制方法和控制设备 |
CN104639719A (zh) * | 2013-11-11 | 2015-05-20 | 中兴通讯股份有限公司 | 一种通话方法和通信终端 |
US9451360B2 (en) * | 2014-01-14 | 2016-09-20 | Cisco Technology, Inc. | Muting a sound source with an array of microphones |
CN104092801A (zh) * | 2014-05-22 | 2014-10-08 | 中兴通讯股份有限公司 | 智能终端通话降噪方法及智能终端 |
US9712915B2 (en) * | 2014-11-25 | 2017-07-18 | Knowles Electronics, Llc | Reference microphone for non-linear and time variant echo cancellation |
KR20170052056A (ko) * | 2015-11-03 | 2017-05-12 | 삼성전자주식회사 | 전자 장치 및 그의 음향 에코 저감 방법 |
CN107181853B (zh) * | 2016-03-10 | 2020-10-09 | 深圳富泰宏精密工业有限公司 | 麦克风切换方法及应用该方法的电子装置 |
CN105847497A (zh) * | 2016-03-28 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种语音信号处理方法及装置 |
CN106101365A (zh) * | 2016-06-29 | 2016-11-09 | 北京小米移动软件有限公司 | 通话过程中调整麦克风的方法及装置 |
US20210407668A1 (en) * | 2017-02-28 | 2021-12-30 | 19Labs, Inc. | Systems and methods for maintaining privacy and security while real time monitoring a plurality of patients over the internet |
CN106953961A (zh) * | 2017-04-28 | 2017-07-14 | 苏州科技大学 | 一种双麦克风的手机语音应用装置及其应用方法 |
CN107547704A (zh) * | 2017-09-28 | 2018-01-05 | 奇酷互联网络科技(深圳)有限公司 | 通话mic的切换方法、装置和移动终端 |
CN108076226B (zh) * | 2017-12-22 | 2020-08-21 | Oppo广东移动通信有限公司 | 一种通话质量调整的方法、移动终端及存储介质 |
CN108234766A (zh) * | 2017-12-29 | 2018-06-29 | 努比亚技术有限公司 | 麦克风切换方法、移动终端及计算机可读存储介质 |
US11404073B1 (en) * | 2018-12-13 | 2022-08-02 | Amazon Technologies, Inc. | Methods for detecting double-talk |
CN110166615A (zh) * | 2019-05-28 | 2019-08-23 | 努比亚技术有限公司 | 自动切换通话上行信号源的方法、装置、终端及存储介质 |
US11114109B2 (en) * | 2019-09-09 | 2021-09-07 | Apple Inc. | Mitigating noise in audio signals |
CN110602327B (zh) * | 2019-09-24 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 语音通话方法、装置、电子设备及计算机可读存储介质 |
-
2019
- 2019-09-24 CN CN201910906728.3A patent/CN110602327B/zh active Active
-
2020
- 2020-03-26 EP EP20868976.0A patent/EP3920516B1/en active Active
- 2020-03-26 JP JP2021558866A patent/JP7290749B2/ja active Active
- 2020-03-26 WO PCT/CN2020/081385 patent/WO2021056999A1/zh unknown
-
2021
- 2021-08-27 US US17/460,160 patent/US11875808B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6424662A (en) * | 1987-07-21 | 1989-01-26 | Nippon Telegraph & Telephone | Voice conference equipment |
JPH07336790A (ja) * | 1994-06-13 | 1995-12-22 | Nec Corp | マイクロホンシステム |
US20100111324A1 (en) * | 2008-10-31 | 2010-05-06 | Temic Automotive Of North America, Inc. | Systems and Methods for Selectively Switching Between Multiple Microphones |
US20160227336A1 (en) * | 2015-01-30 | 2016-08-04 | Knowles Electronics, Llc | Contextual Switching of Microphones |
US20170064087A1 (en) * | 2015-08-27 | 2017-03-02 | Imagination Technologies Limited | Nearend Speech Detector |
Also Published As
Publication number | Publication date |
---|---|
US11875808B2 (en) | 2024-01-16 |
EP3920516A4 (en) | 2022-05-04 |
WO2021056999A1 (zh) | 2021-04-01 |
JP7290749B2 (ja) | 2023-06-13 |
EP3920516B1 (en) | 2023-12-06 |
EP3920516A1 (en) | 2021-12-08 |
EP3920516C0 (en) | 2023-12-06 |
CN110602327B (zh) | 2021-06-25 |
US20210390969A1 (en) | 2021-12-16 |
CN110602327A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022528683A (ja) | 音声通話方法並びにその、装置、電子機器及びコンピュータプログラム | |
US20210375298A1 (en) | Voice processing method, apparatus, electronic device, and storage medium | |
CN105513596B (zh) | 一种语音控制方法和控制设备 | |
US8451312B2 (en) | Automatic video stream selection | |
US20070116254A1 (en) | Configuration of echo cancellation | |
US20220076688A1 (en) | Method and apparatus for optimizing sound quality for instant messaging | |
WO2013127302A1 (zh) | 一种防止外放扬声器与麦克风声音串扰的方法及终端 | |
JP6336119B2 (ja) | 情報処理方法、装置、プログラム、及び記録媒体 | |
US8744524B2 (en) | User interface tone echo cancellation | |
WO2023151526A1 (zh) | 音频采集方法、装置、电子设备及外设组件 | |
EP2636212B1 (en) | Controlling audio signals | |
CN105744210B (zh) | 视频会议的回声消除方法、装置及系统 | |
CN104023117B (zh) | 一种信息处理的方法及电子设备 | |
US9858944B1 (en) | Apparatus and method for linear and nonlinear acoustic echo control using additional microphones collocated with a loudspeaker | |
US11388281B2 (en) | Adaptive method and apparatus for intelligent terminal, and terminal | |
CN105162998B (zh) | 双音多频信号的去噪方法和装置 | |
CN114979344A (zh) | 回声消除方法、装置、设备及存储介质 | |
CN111292760B (zh) | 发声状态检测方法及用户设备 | |
CN109327625B (zh) | 一种通话回拨方法、装置、存储介质及移动终端 | |
CN111383648B (zh) | 一种回波消除方法和装置 | |
CN105704334B (zh) | 电话重拨方法及装置 | |
US20070211875A1 (en) | Method of controlling an electronic device using audio inputs | |
KR20140006195A (ko) | 반향 제거 장치 | |
CN109936824A (zh) | Ptt业务的实现方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211001 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230601 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7290749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |