JP2001514823A - Echo-reducing telephone with state machine controlled switch - Google Patents

Echo-reducing telephone with state machine controlled switch

Info

Publication number
JP2001514823A
JP2001514823A JP53949498A JP53949498A JP2001514823A JP 2001514823 A JP2001514823 A JP 2001514823A JP 53949498 A JP53949498 A JP 53949498A JP 53949498 A JP53949498 A JP 53949498A JP 2001514823 A JP2001514823 A JP 2001514823A
Authority
JP
Japan
Prior art keywords
state machine
signal
flag
finite state
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP53949498A
Other languages
Japanese (ja)
Inventor
グノセペリウス,ヨハン
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Publication of JP2001514823A publication Critical patent/JP2001514823A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic

Abstract

(57)【要約】 本発明の目的は、漏話により生じるエコーを減少することである。上述した問題、漏話により生じるエコーをいかにして減少するかは、マイクロフォンからの信号の信号エネルギ、マイクロフォンからの信号のVADフラグ、スピーカへの信号の信号エネルギ、及びスピーカへの信号のVADフラグを入力として取るステート・マシンにより制御されるスイッチをマイクロフォンとスピーカに導入することにより解決される。 (57) Summary It is an object of the present invention to reduce echoes caused by crosstalk. The problem described above, how to reduce the echo caused by crosstalk, depends on the signal energy of the signal from the microphone, the VAD flag of the signal from the microphone, the signal energy of the signal to the speaker, and the VAD flag of the signal to the speaker. The problem is solved by introducing switches to the microphones and speakers controlled by a state machine that takes as input.

Description

【発明の詳細な説明】 ステート・マシン制御スイッチによるエコー減少電話 発明の技術分野 本発明は一般に電気通信に関係し、特にインターネットを介した音声通信用の 音声処理に関係する。 関連技術の説明 標準的なインターネット電話は、音声ボード、マイクロフォン及び2個のスピ ーカを有するPCを使用する。マイクロフォンとスピーカはしばしば机上で互いに 近接して配置される。このような構成により受信端でエコーとして聞こえる相当 量の漏話が発生する。インターネット電話を使用可能とするにはこのエコーを抑 止しなければならない。 GSMでは、移動電話のユーザーが会話中であるか又は会話中でない時を検出す るためVAD(Voice Activity Detection、音声活動検出)を使用することが公知 である。この情報を使用して、音声を送信する時には帯域幅を減少することかが 可能である。VOX原理(Voice Operated Transmission、音声操作送信)による不 連続音声コーディングでは、VAD装置は受取った音声列が人間の音声であるかど うかを検出する責任がある。VAD装置は2つの異なる状態、すなわち音声列が人 間の声であることを指示する第1状態と、音声列が人間の声ではないことを指示 する他の状態を取る。 VAD装置が、与えられた音声列が人間の音声を表していることを検出した場合 、VAD装置は、音声列を音声フレームにコード化する音声コーディング装置へ第 1状態信号を発行する。反対に、与えられた音声列が人間の声以外の何かを表し ている場合、VAD装置はSID(Silnce Descriptor、静寂記述子)装置へ第2状態 信号を発行する。前記SID装置は各N番目のフレームにSIDフレームを送り出す。 残りのN-1のフレームを送信する可能な機会の間は、何も送信されない。SIDフレ ームは送信側の概算背景雑音と概算雑音スペクトルに関する情報を含む。この処 理により電池電力と無線帯域幅が節約可能となる。 SID装置が第1状態信号を発生している状態から第2状態信号を発生している 状態へ、すなわち音声を検出している状態から非音声時間間隔を検出する状態へ 変化すると、いわゆるハングオーバー(hang-over)が通常適用されて、この間 音声コーディング装置は受取った音声列が人間の音声であるかのように音声フレ ームを送り続ける。ハングオーバー時間後に、VAD装置が依然として非音声を検 出している場合、SIDフレームが発生される。この処理の理由は、人間の声の単 語間の短い休止は非音声と解釈されるべきではなく、音声フレーム発生器は依然 としてアクティブでなければならないからである。 発明の要旨 本発明は漏話により導入されるエコーの減少用の方法と装置を開示する。 本発明の目的は従って漏話により生じるエコーを減少することである。 上述した問題、漏話により生じるエコーをいかに減少するかは、マイクロフォ ンからの信号の信号のエネルギ、マイクロフォンからの信号のVADフラグ、スピ ーカへの信号の信号エネルギ、及びスピーカへの信号のVADフラグを入力として 取るステートマシンにより制御されるスイッチをスピーカとマイクロフォンに入 れることにより解決される。 本発明の利点の1つは、そう多くの計算能力を必要とすることなく、漏話によ り生じるエコーが著しく減少することである。 その他の利点は、以下の詳細な説明の下で当業者には明らかである。 本発明の更なる適用範囲は以下に与える詳細な説明から明らかとなる。しかし ながら、以下の詳細な説明から本発明の範囲内の各種の変更や修正が当業者には 明らかとなるため、本発明の望ましい実施例は単なる説明用に与えたものである ことを理解すべきである。 図面の簡単な説明 図1は本発明の1実施例のブロック線図である。 図2は有限状態図である。 望ましい実施例の詳細な説明 図1では、マイクロフォン101はGSMエンコーダ102に接続される。GSMエ ンコーダ102に信号が到達する前に、既知の技術に従ってディジタル化されサ ンプルされるが、これは図1には示されていない。GSMエンコーダ102から、 コード化信号は図面に図示されていない受信器に送信され、最初に送信を付勢ま たは減勢可能なスイッチ103を通過する。GSMエンコーダ102からはVAD装置 104にACFEAutocorrection CoeFficient、自動訂正係数)が渡される。VAD 装置105にはGSMフレームから長期予測装置ラグ値NEも渡される。VAD装置10 4からは、有限ステート・マシン105へ信号のエネルギを表す値PEが渡される 。VAD装置104が人間の音声を検出したかどうかを指示するフラグFEもVAD装置 104は計算する。フラグFEは有限ステート・マシン105に渡される。フラグ FEは人間の音声を検出した場合に真である。 さらに図1には、送信者(図示せず)から受信し、GSMデコーダ106へ渡さ れるサンプルされたコード化音声信号がある。GSMデコーダ106から、デコー ドされサンプルされた音声信号がスピーカ107に渡され、最初に音声信号がス ピーカに到達することをエイブルまたはディスエイブル可能なスイッチ108を 通る。スピーカが正しく機能するためには、既知技術によるD/A変換を必要とす るが、図1には図示されていない。受信したサンプルされたコード化音声信号か ら長期予測装置ラグ値NDが演鐸されVAD装置109に渡される。 GSMフレームのデコードは通常VAD装置の使用には関係していないため、GSMデ コーダはACFを計算するための必要なパラメータが不足している。ACFを計算可能 とするため、自動相関装置110がGSMデコーダ106からのデータを受け取っ てVAD装置109へ渡されるACFDを計算する。自動相関装置110は基準に記載 されているようにGSMデコーダの一部である。スピーカへの音声信号のエネルギ の指示である値PDがVAD装置109から有限ステート・マシン105に渡される 。VAD装置109からは、VAD装置が人間の音声を検出したかどうかを指示するフ ラグFDが前記有限ステート・マシンに渡される。 有限ステート・マシン106は、有限ステート・マシンに入力される値に応じ てスイッチ103と109を設定する機能を含む。 図2に、図1の有限ステート・マシンの状態と可能な遷移を図示する。 状態間の遷移は以下の説明に従って行われる。以下の定義が使用される: ・FE:コード化時のVADフラグ ・FD:デコード時のVADフラグ ・PE:コード化時の信号エネルギ ・PD:デコード時の信号エネルギ ・ハングオーバー:方向を切り替える決定から切替が行われるまでの時間。この 時間は部屋のエコーを補償する十分な長さがなければならない。 201.FE=1かつFD=0またはFE=1かつPE>PD、ハングオーバー=0 202.FE=0、ハングオーバー=600ms 203.FD=1かつFE=0またはFD=1かつPD>PE、ハングオーバー=0 204.FD=0、ハングオーバー=600ms 205.FD=1かつPD>PE、ハングオーバー=600ms 206.FE=1かつPE>PD、ハングオーバー=600ms 状態送信中207では、マイクロフォンから音声信号の送信を制御するスイッ チはエイブルされ、スピーカへ音声信号の送信を制御するスイッチはディスエイ ブルされる。状態受信中208では、マイクロフォンから音声信号の送信を制御 するスイッチはディスエイブルされ、スピーカへの送信を制御するスイッチはエ イブルされる。アイドル状態209では両方のスイッチがディスエイブルされる 。 本発明を以上のように説明してきたが、同じものが多数の方法に変更できるこ とは明らかである。このような変更は本発明の要旨と範囲から逸脱するものとは 見なせるものではなく、当業者には明らかなこの様な全ての変更は以下の請求の 範囲の範囲内に含まれるものと見なせる。Description: FIELD OF THE INVENTION The present invention relates generally to telecommunications, and more particularly to voice processing for voice communications over the Internet. 2. Description of the Related Art A standard Internet phone uses a PC with a voice board, microphone and two speakers. Microphones and speakers are often placed close to each other on a desk. Such a configuration causes a considerable amount of crosstalk that can be heard as an echo at the receiving end. This echo must be suppressed to enable internet telephony. In GSM, VAD for detecting when the user of the mobile telephone is not in or conversation is a conversation (V oice A ctivity D etection, voice activity detection) is known to use. Using this information, it is possible to reduce the bandwidth when transmitting voice. VOX principles (V oice O perated Transmission, voice operated transmission) In the discontinuous speech coding by, the VAD apparatus is responsible for voice string received to detect whether the human voice. The VAD device takes two different states, a first state indicating that the speech sequence is a human voice and another state indicating that the speech sequence is not a human voice. If the VAD device detects that the given speech sequence represents human speech, the VAD device issues a first state signal to a speech coding device that encodes the speech sequence into speech frames. Conversely, the voice string given when they represent something other than a human voice, VAD apparatus SID (Si lnce D escriptor, silence descriptor) issues a second status signal to the apparatus. The SID device sends out a SID frame for each Nth frame. Nothing is transmitted during the possible opportunities to transmit the remaining N-1 frames. The SID frame contains information about the estimated background noise and the estimated noise spectrum of the transmitting side. This process can save battery power and wireless bandwidth. When the SID device changes from generating the first status signal to generating the second status signal, that is, from detecting voice to non-voice time interval, a so-called hangover occurs. (Hang-over) is usually applied, during which the speech coding device continues to send speech frames as if the received speech sequence were human speech. After the hangover time, if the VAD device is still detecting non-voice, a SID frame is generated. The reason for this processing is that short pauses between words in the human voice should not be interpreted as non-speech, and the speech frame generator must still be active. SUMMARY OF THE INVENTION The present invention discloses a method and apparatus for reducing echo introduced by crosstalk. It is therefore an object of the present invention to reduce the echo caused by crosstalk. The above problems, how to reduce the echo caused by the crosstalk, input the signal energy of the signal from the microphone, the VAD flag of the signal from the microphone, the signal energy of the signal to the speaker, and the VAD flag of the signal to the speaker The problem is solved by putting a switch controlled by a state machine taking into the speaker and microphone. One of the advantages of the present invention is that echoes caused by crosstalk are significantly reduced without requiring much computing power. Other advantages will be apparent to those skilled in the art under the following detailed description. Further areas of applicability of the present invention will become apparent from the detailed description provided hereinafter. However, it should be understood that preferred embodiments of the present invention have been given by way of illustration only, since various changes and modifications within the scope of the invention will become apparent to those skilled in the art from the following detailed description. It is. BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram of one embodiment of the present invention. FIG. 2 is a finite state diagram. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT In FIG. 1, a microphone 101 is connected to a GSM encoder 102. Before the signal reaches the GSM encoder 102, it is digitized and sampled according to known techniques, but this is not shown in FIG. From the GSM encoder 102, the coded signal is transmitted to a receiver (not shown) and first passes through a switch 103 that can activate or deactivate the transmission. ACF E in VAD apparatus 104 from the GSM encoder 102 (A utocorrection C oe F ficient , automatic correction factor) is passed. The long-term prediction device lag value NE is also passed to the VAD device 105 from the GSM frame. From VAD apparatus 104, the value P E representing the energy of the signal to a finite state machine 105 is passed. Flag F E also VAD apparatus 104 VAD apparatus 104 instructs whether the detected human speech is calculated. Flag F E is passed to a finite state machine 105. The flag FE is true when a human voice is detected. 1 also includes a sampled coded audio signal received from a sender (not shown) and passed to GSM decoder 106. From the GSM decoder 106, the decoded and sampled audio signal is passed to the speaker 107 and first passes through a switch 108 that can enable or disable the audio signal from reaching the speaker. In order for the loudspeaker to function properly, D / A conversion according to a known technique is required, but is not shown in FIG. Received sampled coded long term predictor lag value N D from the audio signal is passed to the VAD apparatus 109 is were deducted and examples of the solution were. The GSM decoder lacks the necessary parameters to calculate the ACF, since decoding of the GSM frame is usually not related to the use of a VAD device. To enable the ACF to be calculated, the autocorrelator 110 receives the data from the GSM decoder 106 and calculates the ACF D passed to the VAD device 109. The autocorrelator 110 is part of the GSM decoder as described in the standard. A value P D, which is an indication of the energy of the audio signal to the speaker, is passed from the VAD device 109 to the finite state machine 105. From VAD apparatus 109, the flag F D the VAD apparatus instructs whether the detected human voice is passed to the finite state machine. The finite state machine 106 has a function of setting the switches 103 and 109 according to a value input to the finite state machine. FIG. 2 illustrates the states and possible transitions of the finite state machine of FIG. The transition between the states is performed according to the following description. The following definitions are used: • F E : VAD flag during coding • F D : VAD flag during decoding • P E : Signal energy during coding • P D : Signal energy during decoding • Hangover: The time between the decision to switch directions and the switch. This time must be long enough to compensate for room echoes. 201. F E = 1 and F D = 0 or F E = 1 and P E > P D , hangover = 0 202. F E = 0, hangover = 600 ms 203. F D = 1 and F E = 0 or F D = 1 and P D > P E , hangover = 0 204. F D = 0, hangover = 600 ms 205. 206. F D = 1 and P D > P E , hangover = 600 ms F E = 1 and P E > P D , hangover = 600 ms During state transmission 207, the switch controlling the transmission of the audio signal from the microphone is disabled, and the switch controlling the transmission of the audio signal to the speaker is disabled. . In state receiving 208, the switch controlling the transmission of the audio signal from the microphone is disabled and the switch controlling the transmission to the loudspeaker is disabled. In the idle state 209, both switches are disabled. Having described the invention in the foregoing, it is clear that the same can be varied in many ways. Such modifications should not be deemed to depart from the spirit and scope of the present invention, and all such modifications apparent to those skilled in the art are deemed to be within the scope of the following claims.

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,GM,KE,LS,M W,SD,SZ,UG,ZW),EA(AM,AZ,BY ,KG,KZ,MD,RU,TJ,TM),AL,AM ,AT,AU,AZ,BA,BB,BG,BR,BY, CA,CH,CN,CU,CZ,DE,DK,EE,E S,FI,GB,GE,GH,GM,GW,HU,ID ,IL,IS,JP,KE,KG,KP,KR,KZ, LC,LK,LR,LS,LT,LU,LV,MD,M G,MK,MN,MW,MX,NO,NZ,PL,PT ,RO,RU,SD,SE,SG,SI,SK,SL, TJ,TM,TR,TT,UA,UG,US,UZ,V N,YU,ZW────────────────────────────────────────────────── ─── Continuation of front page    (81) Designated countries EP (AT, BE, CH, DE, DK, ES, FI, FR, GB, GR, IE, IT, L U, MC, NL, PT, SE), OA (BF, BJ, CF) , CG, CI, CM, GA, GN, ML, MR, NE, SN, TD, TG), AP (GH, GM, KE, LS, M W, SD, SZ, UG, ZW), EA (AM, AZ, BY) , KG, KZ, MD, RU, TJ, TM), AL, AM , AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CU, CZ, DE, DK, EE, E S, FI, GB, GE, GH, GM, GW, HU, ID , IL, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MD, M G, MK, MN, MW, MX, NO, NZ, PL, PT , RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, UA, UG, US, UZ, V N, YU, ZW

Claims (1)

【特許請求の範囲】 1. 電話応用で音声送信時にエコーを減少する方法であって、前記電話応用は スピーカとマイクロフォンを含み、有限ステート・マシンが前記マクロフォンか らの信号の特性と前記スピーカへの信号の特性に依存して前記スピーカとマイク ロフォンに影響してオン又はオフさせることを特徴とする前記方法。 2. 請求項1記載の方法において、前記電話応用は、少なくとも1個のVAD装 置と、1個のGSMエンコーダと、1個のGSMデコーダを含み、マイクロフォンから の信号の第1VADフラグが前記有限ステート・マシンに渡され、マイクロフォンか らの信号の信号エネルギを表す第1値が前記有限ステート・マシンに渡され、ス ピーカへの信号の第2VADフラグが前記有限ステート・マシンに渡され、スピー カへの信号の信号エネルギを表す第2値が前記有限ステート・マシンに渡され、 前記第1VADフラグ、前記第2VADフラグ、前記第1値及び前記第2値に依存して 前記有限ステート・マシンは前記マイクロフォンからの前記信号の送信を制御す る第1スイッチに影響し、前記有限ステート・マシンは前記スピーカへの前記第 2信号の送信を制御する第2スイッチに影響する方法。 3. 請求項2記載の方法において、前記マイクロフォンからの第1のサンプル された音声信号は前記GSMエンコーダに渡され、第1長期予測装置ラグ値は第1V AD装置に渡され、第1自動相関係数は前記第1GSMエンコーダから前記第1VAD装置 に渡され、第1ブール・フラグは前記第1VAD装置から前記有限ステート・マシン に渡され、前記マイクロフォンからの信号のエネルギを表す第1値は前記第1VAD 装置から前記有限ステート・マシンに渡され、第2のサンプルされコード化され た音声信号を受け取り、前記第2音声信号はGSMデコーダに渡され、前記第2音 声信号からの第2長期予測装置ラグ値が第2VAD装置に渡され、第2自動相関係 数が計算され前記第2VAD装置に渡され、前記第2音声信号のエネルギを表す第 2値が前記第2VAD装置から前記有限ステート・マシンに渡され、第2ブール・ フラグが前記VAD装置から前記有限ステート・マシンに渡され、前記有限ステー ト・マシンは、前記第1ブール・フラグ、前記第2ブール・フラグ、前記第1値 及び前記第2値に依存して、前記マイクロフォンからの前記第1サンプ ルされコード化された音声信号の送信に影響を与える第1スイッチと、スピーカ への前記第2デコード音声信号の送信に影響を与える第2スイッチとを制御する 方法。 4. 請求項2記載の方法において、前記有限ステート・マシンが第1状態を取 る場合、前記マイクロフォンからの送信を制御する前記第1スイッチは前記送信 を可能とするよう設定され、スピーカへの送信を制御する前記第2スイッチは前 記送信を可能としないよう設定され、前記有限ステート・マシンが第2状態を取 る場合、前記マイクロフォンからの送信を制御する前記第1スイッチは前記送信 を可能としないよう設定され、スピーカへの送信を制御する前記第2スイッチは 前記送信を可能とするよう設定される方法。 5. 請求項4記載の方法において、前記有限ステート・マシンが第3状態を取 る場合、前記第1及び第2スイッチは共に同じ状態に設定される方法。 6. 請求項5記載の方法において、前記第1フラグが真で前記第2フラグが偽 の場合、又は前記第1フラグが真で前記第1値が前記第2値より大きい場合に前 記有限ステート・マシンは前記第3状態から前記第1状態に切り替わり、前記第 1フラグが偽でハングオーバー時間を経過した場合に前記有限ステート・マシン は前記第1状態から前記第3状態に切り替わり、前記第2フラグが真で前記第1 フラグが偽の場合、又は前記第2フラグが真で前記第2値が前記第1値より大き い場合に前記有限ステート・マシンは前記第3状態から前記第2状態に切り替わ り、前記第2フラグが偽で前記ハングオーバー時間を過ぎた場合に前記有限ステ ート・マシンは前記第2状態から前記第3状態に切り替わり、前記第2フラグが 真で前記第2値が前記第1値より大きくかつ前記ハングオーバー時間を過ぎた場 合に前記有限ステート・マシンは前記第1状態から前記第2状態に切り替わり、 前記第1フラグが真で前記第1値が前記第2値より大きくかつ前記ハングオーバ ー時間を過ぎた場合に前記有限ステート・マシンは前記第2状態から前記第1状 態へ切り替わる方法。 7. 請求項6記載の方法において、前記ハングオーバー時間が600msである方 法。 8. 電話応用で音声送信時にエコーを減少する装置であって、前記電話応用は スピーカとマイクロフォンを含み、前記電話応用は、前記マクロフォンからの信 号の特性と前記スピーカへの信号の特性に依存して前記スピーカとマイクロフォ ンに影響してオン又はオフさせるようにした有限ステート・マシンを含む前記装 置。 9. 音声のエコーを減少する装置を含む、電話応用で音声を送受信するよう配 置したパーソナル・コンピュータであって、前記電話応用はスピーカとマイクロ フォンを含み、前記電話応用は、前記マクロフォンからの信号の特性と前記スピ ーカへの信号の特性に依存して前記スピーカとマイクロフォンに影響してオン又 はオフさせるようにした有限ステート・マシンを含む前記パーソナル・コンピュ ータ。[Claims]   1. A method for reducing echo when transmitting voice in a telephone application, wherein the telephone application Including loudspeaker and microphone, if the finite state machine is The speaker and the microphone depending on the characteristics of these signals and the characteristics of the signal to the speaker. The method as described above, wherein the method comprises turning on or off the lophone.   2. The method of claim 1, wherein the telephone application comprises at least one VAD device. Unit, one GSM encoder and one GSM decoder, from the microphone The first VAD flag of this signal is passed to the finite state machine, A first value representing the signal energy of these signals is passed to the finite state machine and The second VAD flag of the signal to the speaker is passed to the finite state machine and A second value representing the signal energy of the signal to power is passed to the finite state machine; Depending on the first VAD flag, the second VAD flag, the first value and the second value The finite state machine controls transmission of the signal from the microphone. The finite state machine affects the first switch, A method that affects a second switch that controls the transmission of two signals.   3. The method of claim 2, wherein the first sample from the microphone. The resulting speech signal is passed to the GSM encoder, and the first long-term predictor lag value is 1V Passed to the AD device, the first auto-correlation coefficient from the first GSM encoder to the first VAD device And a first Boolean flag is passed from the first VAD device to the finite state machine. And the first value representing the energy of the signal from the microphone is the first VAD Passed from the device to the finite state machine for a second sampled and coded Receiving the second audio signal, the second audio signal is passed to a GSM decoder, The second long-term predictor lag value from the voice signal is passed to a second VAD device and a second automatic phase relationship A number is calculated and passed to the second VAD device and represents a second signal representing the energy of the second audio signal. A binary value is passed from the second VAD device to the finite state machine and a second Boolean A flag is passed from the VAD device to the finite state machine and the finite state machine is The first Boolean flag, the second Boolean flag, the first value And the first sump from the microphone depending on the second value. A first switch for affecting the transmission of the coded audio signal and a loudspeaker; And a second switch that affects transmission of the second decoded audio signal to the second switch. Method.   4. The method of claim 2, wherein the finite state machine takes a first state. The first switch for controlling transmission from the microphone And the second switch for controlling the transmission to the speaker is The finite state machine is set not to allow transmission and the finite state machine takes the second state. The first switch for controlling transmission from the microphone And the second switch for controlling transmission to the speaker is A method configured to allow said transmission.   5. The method of claim 4, wherein the finite state machine takes a third state. The first and second switches are both set to the same state.   6. The method of claim 5, wherein the first flag is true and the second flag is false. Or if the first flag is true and the first value is greater than the second value, The finite state machine switches from the third state to the first state and The finite state machine when the hangover time elapses with one flag false Switches from the first state to the third state, the second flag is true and the first state If the flag is false, or if the second flag is true and the second value is greater than the first value The finite state machine switches from the third state to the second state. If the second flag is false and the hangover time has passed, the finite step is performed. The port machine switches from the second state to the third state and the second flag is True if the second value is greater than the first value and the hangover time has passed If the finite state machine switches from the first state to the second state, The first flag is true, the first value is greater than the second value and the hangover Over time, the finite state machine transitions from the second state to the first state. How to switch to the state.   7. The method of claim 6, wherein the hangover time is 600ms. Law.   8. A device for reducing echo when transmitting voice in a telephone application, wherein the telephone application Including a speaker and a microphone, wherein the telephone application receives signals from the microphone. And the microphone depending on the characteristics of the signal and the signal to the speaker. Said device including a finite state machine adapted to turn on or off Place.   9. Arrange to send and receive audio in telephone applications, including devices to reduce audio echo. A personal computer, wherein the telephone application is a speaker and a micro computer. And the telephone application includes the characteristics of the signal from the microphone and the On or off the speaker and microphone depending on the characteristics of the signal to the Said personal computer including a finite state machine adapted to be turned off. Data.
JP53949498A 1997-03-11 1998-02-24 Echo-reducing telephone with state machine controlled switch Pending JP2001514823A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9700873A SE511650C2 (en) 1997-03-11 1997-03-11 Method and apparatus for reducing echo in a telephone application
SE9700873-4 1997-03-11
PCT/SE1998/000332 WO1998040974A1 (en) 1997-03-11 1998-02-24 Echo reducing phone with state machine controlled switches

Publications (1)

Publication Number Publication Date
JP2001514823A true JP2001514823A (en) 2001-09-11

Family

ID=20406109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53949498A Pending JP2001514823A (en) 1997-03-11 1998-02-24 Echo-reducing telephone with state machine controlled switch

Country Status (9)

Country Link
EP (1) EP0974205A1 (en)
JP (1) JP2001514823A (en)
CN (1) CN1255255A (en)
AU (1) AU735505B2 (en)
BR (1) BR9808240A (en)
CA (1) CA2283590A1 (en)
SE (1) SE511650C2 (en)
TW (1) TW407435B (en)
WO (1) WO1998040974A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL145386A0 (en) * 1999-03-15 2002-06-30 Vocaltec Comm Ltd Echo suppression device and method for performing the same
US6754337B2 (en) * 2002-01-25 2004-06-22 Acoustic Technologies, Inc. Telephone having four VAD circuits
US7020257B2 (en) * 2002-04-17 2006-03-28 Texas Instruments Incorporated Voice activity identiftication for speaker tracking in a packet based conferencing system with distributed processing
CN101145803B (en) * 2007-09-06 2012-09-05 杭州华三通信技术有限公司 A method and device for separating echo reflection

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4897832A (en) * 1988-01-18 1990-01-30 Oki Electric Industry Co., Ltd. Digital speech interpolation system and speech detector
GB2256351B (en) * 1991-05-25 1995-07-05 Motorola Inc Enhancement of echo return loss
FI110826B (en) * 1995-06-08 2003-03-31 Nokia Corp Eliminating an acoustic echo in a digital mobile communication system

Also Published As

Publication number Publication date
CN1255255A (en) 2000-05-31
AU735505B2 (en) 2001-07-12
CA2283590A1 (en) 1998-09-17
BR9808240A (en) 2000-05-16
AU6426498A (en) 1998-09-29
SE511650C2 (en) 1999-11-01
SE9700873L (en) 1998-09-12
WO1998040974A1 (en) 1998-09-17
SE9700873D0 (en) 1997-03-11
EP0974205A1 (en) 2000-01-26
TW407435B (en) 2000-10-01

Similar Documents

Publication Publication Date Title
US6223154B1 (en) Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
US5881373A (en) Muting a microphone in radiocommunication systems
US6574601B1 (en) Acoustic speech recognizer system and method
US20010041976A1 (en) Signal processing apparatus and mobile radio communication terminal
KR100343776B1 (en) Apparatus and method for volume control of the ring signal and/or input speech following the background noise pressure level in digital telephone
GB2352377A (en) Noise suppression method for a mobile telephone
US6122531A (en) Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
JP2512418B2 (en) Voice conditioning device
CN101179635B (en) Device, method and system for performing echo control to hand-free telephone
US20050114118A1 (en) Method and apparatus to reduce latency in an automated speech recognition system
EP1784925A2 (en) Speakerphone having improved outbound audio quality
US7246059B2 (en) Method for fast dynamic estimation of background noise
US7318030B2 (en) Method and apparatus to perform voice activity detection
JPH05160773A (en) Voice communication equipment
JPH08163227A (en) Automatic received sound volume varying circuit
EP2158753B1 (en) Selection of audio signals to be mixed in an audio conference
WO2014194273A2 (en) Systems and methods for enhancing targeted audibility
JP2001514823A (en) Echo-reducing telephone with state machine controlled switch
JP3075067B2 (en) Digital mobile radio equipment
JPH0950298A (en) Voice coding device and voice decoding device
JP3034494B2 (en) Interactive speech rate conversion apparatus and method
JP2974427B2 (en) Voice communication system and voice communication device
JP2979859B2 (en) Digital mobile radio equipment
JP2005534258A (en) System and method for operating a speakerphone in a communication device
JPH1023067A (en) Voice transmission system