JP2597817B2 - 音声信号検出方法 - Google Patents

音声信号検出方法

Info

Publication number
JP2597817B2
JP2597817B2 JP6057516A JP5751694A JP2597817B2 JP 2597817 B2 JP2597817 B2 JP 2597817B2 JP 6057516 A JP6057516 A JP 6057516A JP 5751694 A JP5751694 A JP 5751694A JP 2597817 B2 JP2597817 B2 JP 2597817B2
Authority
JP
Japan
Prior art keywords
signal
received signal
value
ratio
frequency tone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6057516A
Other languages
English (en)
Other versions
JPH07321912A (ja
Inventor
クロード・シサロ
ジェラール・リヒター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH07321912A publication Critical patent/JPH07321912A/ja
Application granted granted Critical
Publication of JP2597817B2 publication Critical patent/JP2597817B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/46Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は電話通信分野における音
声信号の検出方法に係り、更に詳細に説明すれば、電話
回線を介して伝送される音声信号を、呼の現在の状態を
知らせるために、中央局と発呼者との間で授受される種
々の呼−進行トーン信号(call-progress tones)から
識別するための方法に係る。なお、明細書の記載を簡潔
にするため、以下では、かかる「呼−進行トーン信号」
を単に「トーン信号」と表記する。この「トーン信号」
は、当該技術分野では周知の発信音、呼び出し音、話中
音、警報音、リオーダ接続音、等を含んでいる。
【0002】
【従来の技術】最近になって、簡単なファックス装置か
ら複雑な音声処理アプリケーション・システムに至るま
での、多種多様な機器を共通の専用交換電話ネットワー
クに接続することが多くなったから、電話通信分野の技
術者にとっては、音声信号を検出することが重要な問題
となってきた。
【0003】米国特許第5070526号には、受信信
号のディジタル表示を分析して、トーン信号を検出する
ためのシステムが開示されている。これらのトーン信号
が周期的であるのとは対照的に、音声信号は、音声周波
数帯内で実質的にランダムな周波数を有する。このシス
テムでは、電話回線を介して伝送されるアナログ形式の
通信信号をディジタル形式に変換してコンピュータのメ
モリ内に格納するとともに、かかるディジタル表示の諸
セグメントを分析することにより、この通信信号が所定
の間隔で反復する処の一様な周波数成分を有するか否か
を決定するようになっている。
【0004】音声信号を検出するという問題は、電話回
線の一方の側にある1つのシステムから他方の側にいる
被呼者へ音声メッセージを伝送する処の、音声サーバ・
アプリケーションにおいて特に重要となる。このような
システムでは、発呼者に応じた2つのタイプの呼を見出
すことができる。第1のタイプの呼は、「入接続呼」と
呼ばれ、例えば、通信販売アプリケーションの場合に
は、音声サーバ・アプリケーションの電話番号をダイヤ
ルした発呼者によって開始されるような電話通信につい
てこれが当てはまる。これとは逆に、一層複雑なシステ
ムでは、機械を用いて、個人の電話加入者を呼び出すの
に必要なダイヤル操作を行った後、音声メッセージを送
り出すことができる。かかる第2のタイプの呼は、「出
接続呼」と呼ばれている。例えば、図1の航空座席予約
サービス・アプリケーションの場合を考えてみる。航空
座席予約サービスを提供する音声サーバ101は、専用
交換電話ネットワーク102に接続されているから、個
々の電話器103に接続することができる。ここで、特
定の航空便がキャンセルされたものと仮定すると、その
航空便の座席を予約した全ての搭乗予定者に対し、キャ
ンセルが生じたことを通知するのが望ましい。従って、
音声サーバ101は、その航空便の全ての搭乗予定者の
電話番号をダイヤルすることによって一連の電話通信の
呼を開始し、種々の呼−進行手順を管理し、電話回線の
他方の側に搭乗予定者がいるか否かを確認するととも
に、キャンセルが生じたことをその搭乗予定者に通知す
る音声メッセージを送り出さなければならない。かかる
電話通信の呼が成功しなかった場合には、音声サーバ1
01は、後の時点で再度これを試みることになろう。
【0005】トーン信号として、種々の制御及び呼状態
情報が現用されているから、電話システム内では複数の
トーン信号が用いられることが多い。
【0006】また、音声サーバ・アプリケーションが国
際的な規模で用いられる傾向にあることを考慮すると、
かかるシステムは、世界中に存在する多数の呼−進行手
順に対応する能力を有することが必要である。従って、
かかるシステムは、世界中に存在する種々の専用交換電
話ネットワーク内で現用されている多数のトーン信号を
処理し且つこれを認識しなければならない。電話ネット
ワークを通して伝送される種々のトーン信号(即ち、各
国において周波数が異なっている発信音、呼び出し音、
話中音、警報音、リオーダ接続音、等)を正確に識別す
るには、高いレベルの識別能力が必要である。
【0007】例えば、発信音について見ると、フランス
国内の発信音が440Hzの周波数を有するのに対し、
イタリア国内の発信音は特別の韻律(cadence )を有す
る425Hzのトーン信号で構成されており、アメリカ
合衆国内の発信音は350Hzと440Hzの周波数を
有する信号を組み合わせることによって作られる連続的
なトーン信号となっている。
【0008】また、最近のファクシミリ・システム又は
音声サーバ・アプリケーションは、2周波( Dual Tone
Multi-Frequency:DTMF)トーン信号を用いて、呼
を完成することができる。この2周波トーン信号は、電
話機の押しボタンが押されたときに、4つの高群周波数
と、4つの低群周波数との16個の組み合わせのうち1
つを選択することによって作られるものである。
【0009】一般に、電話システムでは、それぞれのト
ーン信号の決定及び音声信号の検出は、複雑な高速フー
リエ変換(FFT)を用いてこれを行うか、又は検出す
べき所望の周波数に合致するように調節されたディジタ
ル・バンドパス・フィルタを用いてこれを行う。前者の
システムは、大量のディジタル信号処理(以下「DS
P」と略記)資源を必要とし、後者のシステムは、種々
の国で現用されている広範な周波数範囲のトーン信号に
合致するように簡単に調節することができない。
【0010】
【発明が解決しようとする課題】従って、電話通信分野
では、種々の国で現用されているトーン信号を検出する
だけでなく、大量のDSP資源を必要としない処の、簡
単な音声信号検出方法が要請されている。
【0011】
【課題を解決するための手段】本発明が解決すべき問題
は、受信信号内の少なくとも1つのトーン信号を正確に
検出することができるだけでなく、広範囲の周波数に合
致するように調節可能な、呼−進行メカニズム用の簡単
な音声信号検出方法を提供することである。
【0012】この問題を解決するため、本発明の音声信
号検出方法は、単一周波トーン信号又は2周波トーン信
号が存在し得る電話信号における音声信号の存在を決定
するための音声信号検出方法であって、次のステップか
ら成る。
【0013】一のサンプリング・ウインドウの間に受信
される受信信号の最大値Amax と、受信信号のエネルギ
の測定値Eとを決定するステップ。
【0014】次の比率rの値を計算するステップ。
【0015】
【数7】
【0016】比率rの値を「5.2」に等しく設定した
閾値と比較するとともに、受信信号のレベルを測定する
ステップ。
【0017】比率rの値が前記閾値よりも大きく且つ受
信信号のレベルが「43dbm」よりも大きい場合にの
み、受信信号内の音声信号の存在を決定するステップ。
【0018】本発明の他の側面では、比率rの値を
「3」に等しく設定した第1の閾値と比較するととも
に、比率rの値が第1の閾値よりも小さい場合は、受信
信号内の単一周波トーン信号の存在を決定し、2周波ト
ーン信号の処理動作を開始する。即ち、比率rの値が第
1の閾値よりも大きい場合は、比率rの値を「5.2」
に等しく設定した第2の閾値と比較するとともに、比率
rの値が第2の閾値よりも小さい場合は、受信信号内の
2周波トーン信号の存在を決定する。他方、比率rの値
が第2の閾値よりも大きい場合は、受信信号のレベルを
「43dbm」に等しく設定した第3の閾値と比較する
とともに、受信信号のレベルが第3の閾値よりも大きい
場合にのみ、受信信号内の音声信号の存在を決定して、
音声サーバ・アプリケーションにその旨の情報を与え
る。
【0019】単一周波トーン信号又は2周波トーン信号
の周波数値は、次のステップを通して決定することが望
ましい。
【0020】受信信号内に単一周波トーン信号又は2周
波トーン信号が存在するとの決定に応答して、2次(se
cond-order)又は4次(fourth-order)の自己回帰プロ
セスを適用して、受信信号の自己回帰パラメータの最初
の推定を行うステップ。
【0021】自己回帰パラメータの最初の推定の結果に
応じて調節されたディジタル・バンドパス・フィルタを
用いてフィルタ動作を遂行することにより、受信信号内
に存在する雑音信号を部分的に除去するステップ。
【0022】2次又は4次の自己回帰プロセスを再度適
用して、受信信号の自己回帰パラメータの最後の推定を
行うステップ。
【0023】推定されたパラメータから単一周波トーン
信号又は2周波トーン信号の周波数値を計算するステッ
プ。
【0024】本発明の実施例では、単一周波トーン信号
又は2周波トーン信号のどちらが受信信号内に存在する
かの決定は、次の比率rを計算することにより達成され
る。
【0025】
【数8】
【0026】この比率rは、単一周波トーン信号の場合
には2に等しく、2周波トーン信号の場合には4に等し
いから、この比率rの計算は、受信信号内に存在するト
ーン信号の数を決定するための簡便な方法を与える。
【0027】2次の自己回帰プロセスのうち最初及び最
後の推定は、次のz伝達関数を有する予測関数に基づい
ている。この予測関数は、誤差信号を最小にする目的で
予測手段のパラメータを連続的に適応させる処の、「最
小2乗平均(Least Mean Square:LMS)」アルゴリ
ズムに関連している。
【0028】
【数9】
【0029】本発明の実施例では、4次の自己回帰プロ
セスのうち最初及び最後の推定は、次のz伝達関数に基
づいている。この予測関数は、対応する「最小2乗平
均」アルゴリズムに関連している。
【0030】
【数10】
【0031】DSP資源を減少させるとともに、トーン
信号検出メカニズムの精度を向上させるために、2次の
自己回帰プロセスは、パラメータa2 の値を常に1に設
定して遂行するのが好ましい。他方、4次の自己回帰プ
ロセスは、パラメータa3 及びa4 の値を、a1 及び1
にそれぞれ等しく設定することによって遂行するのが望
ましい。
【0032】単一周波トーン信号を処理する場合のフィ
ルタ動作は、次のz伝達関数を有するディジタル・バン
ドパス・フィルタを用いて行うのが望ましい。
【0033】
【数11】
【0034】2周波トーン信号を処理する場合のフィル
タ動作は、次のz伝達関数を有するディジタル・バンド
パス・フィルタを用いて行うのが望ましい。
【0035】
【数12】
【0036】音声信号を検出し且つトーン信号の周波数
値を決定するのに、簡単なステップだけが必要となるに
過ぎないから、DSP資源の量を制限することができ
る。
【0037】本発明の実施例の説明から理解されるよう
に、本発明の方法は2周波トーン信号を処理するのに特
に有用であるから、音声サーバ・アプリケーション内で
用いるのに適している。
【0038】
【実施例】本発明の実施例では、音声サーバ・アプリケ
ーションが、公知のRISC/6000に相当するホス
ト・コンピュータ上で実行されるようになっている。本
発明の音声信号検出方法は、この音声サーバ・アプリケ
ーション内で処理される処の、トーン信号を検出するも
のである。このホスト・コンピュータは、銀行又は通信
販売アプリケーションのような特定の音声サーバ・アプ
リケーションに用いるのに適しており、主要なディジタ
ル・リンクを管理するための特定の電子カードを用い
て、幾つかのT1又はE1ディジタル・リンクを監視す
る。本発明のトーン信号検出方法及び呼−進行メカニズ
ムに有利に適用可能なRISC/6000コンピュータ
用の公知の電子カードは、「ボイス・パック」9291
又は9295に関連する「音声サーバ・カード・アダプ
タ」として知られている。
【0039】しかしながら、本発明は、前述の特定のホ
スト・コンピュータに限定されるものではなく、多数の
トーン信号が存在する状況において、受信信号内の音声
を検出しなければならないような任意の電話システム
や、音声サーバ・アプリケーションにも適用できること
を理解すべきである。前述の各カードは、音声サーバ・
アプリケーションが必要とする通信タスクを処理するた
めの、DSP資源を備えている。これらの通信タスク
は、2周波トーン信号及び呼−進行を管理する通常の機
能に加えて、圧縮及び圧縮解除アルゴリズムや、音声認
識アルゴリズムや、エコー抑制動作等のタスクを含んで
いる。
【0040】図2には、音声サーバ・アプリケーション
が必要とする諸ステップ、特に音声信号の検出及びトー
ン信号の処理を含む諸ステップが示されている。ステッ
プ10では、電話回線を獲得するために、電話機がオフ
フック状態になる。ステップ20では、発信音を検出す
るために、電話回線上の受信信号を分析する。この場
合、ダイヤル操作はステップ30で行われる。ステップ
40では、種々のトーン信号(例えば、呼び出し音、話
中音)を検出し、それと同時に、電話回線の他方の側に
いる被呼者が通話状態になったことを決定するために、
音声信号検出方法を遂行する。
【0041】図3には、大量のDSP資源を必要とする
ことなく、音声信号の検出と、トーン信号の処理とを同
時に行うための諸ステップが示されている。スケーリン
グ・ステップ151は、通常のμ法則又はA法則の変換
に基づいており、T1又はE1ディジタル・リンクから
受信中の64Kbpsのディジタル信号について遂行さ
れる。この結果、8KHzの12ビットPCMサンプル
・ストリームが得られる。μ法則又はA法則の変換は、
当該技術分野では周知であるから、その説明を省略す
る。
【0042】ステップ152では、サンプリング・ウイ
ンドウ内のk個のPCMサンプルの集合について、受信
信号の最大値Amax を計算する。本発明の実施例では、
この計算は、20msのサンプリング・ウインドウ内の
k=160個のPCMサンプルの集合について、行うよ
うになっている。ステップ153では、ステップ152
の計算結果を用いて、受信信号のエネルギEを計算す
る。この計算を行うために、DSP資源は、これらのP
CMサンプルの2乗平均値を計算する。ステップ154
では、次式に従って、比率rを計算する。但し、次式
中、Amax は受信信号の最大値であり、Eは受信信号の
エネルギの計算値である。
【0043】
【数13】
【0044】次に、受信信号のタイプ、即ちその受信信
号が単一周波トーン信号及び2周波トーン信号のうち何
れを含んでいるかを決定するために、一連のテストを行
う。受信信号が単一周波トーン信号を含んでいる場合に
は、比率rの値が2に等しくなるのに対し、受信信号が
2周波トーン信号を含んでいる場合には、比率rの値は
4に等しくなる。ここで留意すべきは、比率rの値が、
それぞれのトーン信号の周波数値に依存しない、という
ことである。従って、ステップ155で、計算済みの比
率rの値が3よりも小さいことを決定すれば、このプロ
セスは、受信信号内に単一周波トーン信号が存在すると
決定した後、ステップ203に進み、そこで周波数値の
正確な計算を行う。このステップ203については、以
下で詳述する。
【0045】他方、ステップ155で、比率rの値が3
よりも大きいことを決定すれば、ステップ156に進
み、そこで比率rの値が略5.2に等しい値よりも小さ
いか否かを決定するための補助テストを行う。もし、比
率rの値が5.2よりも小さければ、このプロセスは、
受信信号内に2周波トーン信号が存在することを決定し
た後、ステップ208に進み、そこで当該2周波トーン
信号の周波数値を計算する。他方、比率rの値が5.2
よりも大きければ、追加のステップ157で、受信信号
のレベルが少なくとも43dbmに等しいか否かを決定
する。ステップ157の決定が肯定的である場合、この
プロセスは、受信信号内に或る音声信号が存在すると結
論し、その旨を表す情報を音声サーバ・アプリケーショ
ンに報告する。ステップ157の決定が否定的である場
合、このプロセスは、純粋な雑音信号が存在すると結論
して、次の処理動作を行わない。
【0046】以下では、単一周波トーン信号及び2周波
トーン信号の検出に関連して、それぞれの周波数値を計
算するための諸ステップを説明する。容易に理解される
ように、これらのステップは少数であって、その大部分
(例えば、Amax 、E及び比率rを計算するためのステ
ップ)は、単一周波トーン信号又は2周波トーン信号の
周波数値を計算するためと、受信信号内の音声信号の存
在を決定するために用いられる。従って、音声信号の検
出及びトーン信号の周波数値を計算するための包括的な
プロセスは、大量のDSP資源を必要とせずに、これを
遂行することができる。
【0047】受信信号内の単一周波トーン信号を検出す
る場合、このプロセスは、ステップ203に進み、そこ
で受信信号の自己回帰パラメータの最初の推定を行う。
この推定は、図4の自己回帰モデルを基礎とする2次の
自己回帰(Auto Regressive:AR)プロセスによって
遂行される。
【0048】図4に示されているように、AR予測ブロ
ック302は、推定値を与える。この推定値は、次のz
伝達関数によって特徴付けられる。
【0049】
【数14】
【0050】減算手段304は、推定値xテイルド(文
字xの上に記号〜を付されている)と、受信信号xとの
間の誤差を計算する。最小2乗平均(LMS)アルゴリ
ズム・ブロック306は、受信信号x及び誤差値を受け
取り、この誤差値が最小になるように、パラメータa1
の値を連続的に適応させる。受信信号が、正弦波のトー
ン信号であると想定しているので、パラメータa2 は、
1に等しいと見なされる。かくて、このARプロセス
は、1に等しいパラメータa2 を用いて、連続的に行わ
れるようになっている。このようにすると、ARアルゴ
リズムについて必要な処理資源を実質的に最小限に留め
ることができるだけでなく、パラメータa1 についての
計算の精度を向上させることができる。
【0051】LMSアルゴリズム・ブロック306の式
は、次の通りである。
【0052】
【数15】
【0053】本発明の実施例では、βの値が次式のよう
に計算される場合に、特に良好な結果が得られる。但
し、次式中、β0 は定数であり、Eは受信信号のエネル
ギの計算値(前出)である。
【0054】
【数16】
【0055】図3を参照するに、ステップ203は、受
信信号の自己回帰パラメータa1 の最初の推定値を発生
する(前出)。ステップ204では、このプロセスは、
ステップ203において決定したトーン信号の周波数近
傍にその特性を調節された、ディジタル・バンドパス・
フィルタを用いてフィルタ動作を行う。ステップ204
のフィルタ動作は、検出されたトーン信号の近傍に存在
する雑音信号の殆どの部分を除去するように、その特性
を調節された1次のディジタル・・バンドパス・フィル
タに基づいている。本発明の実施例では、1次のディジ
タル・バンドパス・フィルタは、次式のz伝達関数に基
づいている。
【0056】
【数17】
【0057】但し、前式中、μはこのフィルタの選択度
を特徴付けるパラメータである。このパラメータは、高
いレベルの選択度を与えるように、1に近い値を有する
のが望ましい。本発明の実施例では、μは一定の値0.
92に等しくなるように設定されている。
【0058】このフィルタは、雑音に対する当該アルゴ
リズム全体の許容度を実質的に改善し、この結果、信号
対雑音比が低い信号であっても、これを処理することを
可能にする。
【0059】ステップ205では、自己回帰パラメータ
の最後の推定を行う。これを行うため、以下で詳述する
図4のARプロセスに従って、フィルタ済みの信号を処
理する。次のステップ206では、次式に従って周波数
値を計算する。但し、次式中、Δt はサンプリング・ウ
インドウに対応する。
【0060】
【数18】
【0061】次に、このプロセスは、韻律処理ステップ
207に進み、そこでトーン信号の値及び持続時間を、
ホスト・プロセッサ上で実行中のアプリケーション・プ
ログラムに報告する。
【0062】前述のように、ステップ156のテスト結
果として、受信信号内に2周波トーン信号が存在するこ
とを決定した場合、このプロセスは、ステップ208に
進み、そこで4次のARプロセスを遂行する。前述と同
様に、この新しいARプロセスは、図4の自己回帰モデ
ルを基礎とするが、この場合のAR予測ブロック302
は、次のz伝達関数を有する4次の予測手段から構成さ
れる。
【0063】
【数19】
【0064】但し、前式中、a1 〜a4 は、受信信号の
自己回帰モデル化に用いられる4つのパラメータであ
る。前述と同様に、2周波トーン信号が純粋な正弦波で
あると想定しているから、パラメータa3 及びa4 の値
は、パラメータa1 及び1にそれぞれ等しくなるように
設定されている。このように設定すると、ARアルゴリ
ズムの計算が容易になるだけでなく、周波数値の計算の
精度が向上することになる。
【0065】ステップ208のARプロセスにおいて、
LMSアルゴリズム・ブロック306は、次式によって
特徴付けられる。
【0066】
【数20】
【0067】ステップ208のARプロセスが完了する
と、前記4個のパラメータの決定から評価可能な2つの
周波数と合致するように調節される処の、ディジタル・
バンドパス・フィルタを用いて、2周波トーン信号のフ
ィルタ動作を行う。前述と同様に、この2周波トーン信
号のフィルタ動作は、次式に従った2つの1次バンドパ
ス・ディジタル・フィルタの組み合わせに基づいてい
る。但し、次式中、μはこのフィルタの選択度のパラメ
ータ特性である。
【0068】
【数21】
【0069】ステップ210では、ステップ205につ
いて既に説明したような、ARパラメータの最後の推定
を行う。最終的に、ステップ211では、2周波トーン
信号の2つの正確な周波数値を、次式に従って計算する
ことができる。
【0070】
【数22】
【0071】この計算を行った後、ステップ207で
は、ホスト・コンピュータ上で実行中の汎用アプリケー
ション・プログラムが処理するために、これらの2つの
周波数値を韻律処理ルーチンへ報告することができる。
【0072】また、2周波トーン信号のそれぞれのエネ
ルギを計算するため、先ずステップ212では、当該技
術分野では周知の次式に従って、自己相関関数Rxx
(1)及びRxx(2)を計算する。
【0073】
【数23】
【0074】ステップ213では、2周波トーン信号の
それぞれのエネルギの所望の推定値P1及びP2を計算
するために、次式を計算する。
【0075】
【数24】
【0076】次に、P1及びP2の計算値を、韻律処理
ステップ207に送る。このようにして、2周波トーン
信号のそれぞれのエネルギの推定値が得られると、実際
のトーン信号が存在する場合の期間と存在しない場合の
期間とを容易に識別することができるから、ステップ2
07の韻律処理動作を改善することができる。
【0077】図5には、受信信号内にあるn個の異なる
トーン信号を検出するための、本発明に従ったARプロ
セスが示されている。このARプロセスは、次式に基づ
くAR予測ブロック402を用いて行われる。
【0078】
【数25】
【0079】前述と同様に、自己回帰パラメータa
1 は、次式の全体的な関係に従って推定誤差を最小限に
留めるように、このパラメータを連続的に更新する処
の、LMSアルゴリズム・ブロック406によって決定
される。
【0080】
【数26】
【0081】かくて、この周波数は、次式の根を調べる
ことによって決定される。
【0082】
【数27】
【0083】各トーン信号のエネルギは、次式に従って
計算される。その後、この計算結果は、検証のために韻
律処理ステップ207に報告される。
【0084】
【数28】
【0085】図6及び図7には、受信信号内の2つのト
ーン信号が互いに接近して配置されている場合におい
て、FFTを用いた通常の音声信号検出方法と、本発明
の音声信号検出方法とが、これらのトーン信号をどの程
度まで識別できるかということがそれぞれ示されてい
る。図7から明らかなように、本発明の音声信号検出方
法は、大量のDSP資源を必要としないにも拘わらず、
受信信号内の互いに接近して配置された2つのトーン信
号を明瞭に識別することができる。
【0086】
【発明の効果】以上のように、本発明によれば、大量の
DSP資源を必要とすることなく、世界中の種々の国に
存在するであろうトーン信号を確実に且つ明瞭に検出す
ることができる。
【図面の簡単な説明】
【図1】本発明の音声信号検出方法を適用可能な音声サ
ーバ・アプリケーションを示すブロック図である。
【図2】音声信号の検出と、トーン信号の検出との間の
時間的な関係を説明するための流れ図である。
【図3】本発明の音声信号検出方法のステップを示す流
れ図である。
【図4】受信信号の自己回帰モデルの原理を説明するブ
ロック図である。
【図5】n個の異なるトーン信号を用いる場合の自己回
帰アルゴリズムの原理を説明するブロック図である。
【図6】受信信号内の2つのトーン信号が互いに接近し
て配置されている場合において、FFTを用いた通常の
音声信号検出方法の識別能力を説明するための信号波形
図である。
【図7】受信信号内の2つのトーン信号が互いに接近し
て配置されている場合において、本発明の音声信号検出
方法の識別能力を説明するための信号波形図である。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−116600(JP,A) 特開 昭63−300299(JP,A) 特開 昭57−124958(JP,A)

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】単一周波トーン信号又は2周波トーン信号
    が存在し得る電話信号における音声信号の存在を決定す
    るための音声信号検出方法において、 一のサンプリング・ウインドウの間に受信される受信信
    号の最大値Amax と、当該受信信号のエネルギの測定値
    Eとを決定するステップと、 次の比率rの値を計算するステップと、 【数1】 前記比率rの値を「5.2」に等しく設定された閾値と
    比較するとともに、前記受信信号のレベルを測定するス
    テップと、 前記比率rの値が前記閾値よりも大きく且つ前記受信信
    号のレベルが「43dbm」よりも大きい場合にのみ、
    前記受信信号内の音声信号の存在を決定するステップと から成る、前記音声信号検出方法。
  2. 【請求項2】単一周波トーン信号又は2周波トーン信号
    が存在し得る電話信号における音声信号の存在を決定す
    るための音声信号検出方法において、 一のサンプリング・ウインドウの間に受信される受信信
    号の最大値Amax と、当該受信信号のエネルギの測定値
    Eとを決定するステップと、 次の比率rの値を計算するステップと、 【数2】 前記比率rの値を「3」に等しく設定された第1の閾値
    と比較するとともに、前記比率rの値が前記第1の閾値
    よりも小さい場合は、前記受信信号内の単一周波トーン
    信号の存在を決定するステップと、 前記比率rの値が前記第1の閾値よりも大きい場合は、
    前記比率rの値を「5.2」に等しく設定された第2の
    閾値と比較するとともに、前記比率rの値が前記第2の
    閾値よりも小さい場合には、前記受信信号内の2周波ト
    ーン信号の存在を決定するステップと、 前記比率rの値が前記第2の閾値よりも大きい場合は、
    前記受信信号のレベルを「43dbm」に等しく設定さ
    れた第3の閾値と比較するとともに、前記受信信号のレ
    ベルが前記第3の閾値よりも大きい場合にのみ、前記受
    信信号内の音声信号の存在を決定するステップと を含むことを特徴とする、前記音声信号検出方法。
  3. 【請求項3】前記受信信号内に単一周波トーン信号が存
    在するとの前記決定に応答して、 2次の自己回帰プロセスを適用して、前記受信信号の自
    己回帰パラメータの最初の推定を行うステップ(20
    3)と、 前記自己回帰パラメータの前記最初の推定の結果に応じ
    て調節されたディジタル・バンドパス・フィルタを用い
    てフィルタ動作を遂行することにより、前記受信信号内
    に存在する雑音信号を部分的に除去するステップ(20
    4)と、 2次の自己回帰プロセスを再度適用して、前記受信信号
    の自己回帰パラメータの最後の推定を行うステップ(2
    05)と、 前記推定されたパラメータから前記単一周波トーン信号
    の周波数値を計算するステップ(206)と を含むことを特徴とする、請求項2記載の音声信号検出
    方法。
  4. 【請求項4】前記受信信号内に2周波トーン信号が存在
    するとの前記決定に応答して、 4次の自己回帰プロセスを適用して、前記受信信号の自
    己回帰パラメータの最初の推定を行うステップ(20
    8)と、 前記自己回帰パラメータの前記最初の推定の結果に応じ
    て調節されたディジタル・バンドパス・フィルタを用い
    てフィルタ動作を遂行することにより、前記受信信号内
    に存在する雑音信号を部分的に除去するステップ(20
    9)と、 4次の自己回帰プロセスを再度適用して、前記受信信号
    の自己回帰パラメータの最後の推定を行うステップ(2
    10)と、 前記推定されたパラメータの値から前記2周波トーン信
    号の2つの周波数値を計算するステップ(211)と を含むことを特徴とする、請求項2記載の音声信号検出
    方法。
  5. 【請求項5】前記2次の自己回帰プロセスが、次のz伝
    達関数を有する一の予測関数に基づいており、 【数3】 前記予測関数が、前記受信信号と前記z伝達関数から計
    算された推定値との間の差から生じる誤差を最小に留め
    るように、前記予測関数のパラメータを適応させるため
    の最小2乗平均アルゴリズムに関連することを特徴とす
    る、請求項3記載の音声信号検出方法。
  6. 【請求項6】前記フィルタ動作が、次のz伝達関数、 【数4】 を有するディジタル・バンドパス・フィルタを用いて行
    われることを特徴とする、請求項5記載の音声信号検出
    方法。
  7. 【請求項7】前記パラメータμが、0.90〜0.95
    の範囲内の値に設定されることを特徴とする、請求項6
    記載の音声信号検出方法。
  8. 【請求項8】前記4次の自己回帰プロセスが、次のz伝
    達関数を有する一の予測関数に基づいており、 【数5】 前記予測関数が、前記受信信号と前記z伝達関数から計
    算された推定値との間の差から生じる誤差を最小に留め
    るように、前記予測関数のパラメータを適応させるため
    の最小2乗平均アルゴリズムに関連することを特徴とす
    る、請求項4記載の音声信号検出方法。
  9. 【請求項9】前記フィルタ動作が、次のz伝達関数、 【数6】 を有するディジタル・バンドパス・フィルタを用いて行
    われることを特徴とする、請求項8記載の音声信号検出
    方法。
JP6057516A 1993-04-29 1994-03-28 音声信号検出方法 Expired - Lifetime JP2597817B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR93480048.3 1993-04-29
EP93480048A EP0622964B1 (en) 1993-04-29 1993-04-29 Voice activity detection method and apparatus using the same

Publications (2)

Publication Number Publication Date
JPH07321912A JPH07321912A (ja) 1995-12-08
JP2597817B2 true JP2597817B2 (ja) 1997-04-09

Family

ID=8214826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6057516A Expired - Lifetime JP2597817B2 (ja) 1993-04-29 1994-03-28 音声信号検出方法

Country Status (4)

Country Link
US (2) US5533118A (ja)
EP (1) EP0622964B1 (ja)
JP (1) JP2597817B2 (ja)
DE (1) DE69331732T2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175634B1 (en) 1995-08-28 2001-01-16 Intel Corporation Adaptive noise reduction technique for multi-point communication system
US5844994A (en) * 1995-08-28 1998-12-01 Intel Corporation Automatic microphone calibration for video teleconferencing
US5598466A (en) * 1995-08-28 1997-01-28 Intel Corporation Voice activity detector for half-duplex audio communication system
US6191869B1 (en) 1996-08-27 2001-02-20 Sharp Kabushiki Kaisha Facsimile machine
GB2325110B (en) * 1997-05-06 2002-10-16 Ibm Voice processing system
GB2330727B (en) * 1997-10-24 2002-10-09 Mitel Corp Tone and periodical signal detection
US6157712A (en) * 1998-02-03 2000-12-05 Telefonaktiebolaget Lm Ericsson Speech immunity enhancement in linear prediction based DTMF detector
US6208970B1 (en) * 1998-12-21 2001-03-27 Nortel Networks Limited Method and system for estimation of a source of a voice signal
DK1141948T3 (da) * 1999-01-07 2007-08-13 Tellabs Operations Inc Fremgangsmåde og apparat til adaptiv undertrykkelse af stöj
US6556967B1 (en) 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
CA2270103C (en) 1999-04-23 2007-10-23 Newbridge Networks Corporation Recognition of a single frequency tone
US6381568B1 (en) 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
US6463292B1 (en) * 1999-06-04 2002-10-08 Lucent Technologies Inc. System and method for redirecting data messages
KR20020012376A (ko) * 2000-08-07 2002-02-16 임영식 특정 주파수대의 에너지 비를 이용한 톤 신호 검출 방법
US7085715B2 (en) * 2002-01-10 2006-08-01 Mitel Networks Corporation Method and apparatus of controlling noise level calculations in a conferencing system
US6847930B2 (en) * 2002-01-25 2005-01-25 Acoustic Technologies, Inc. Analog voice activity detector for telephone
US20030216909A1 (en) * 2002-05-14 2003-11-20 Davis Wallace K. Voice activity detection
US7127392B1 (en) 2003-02-12 2006-10-24 The United States Of America As Represented By The National Security Agency Device for and method of detecting voice activity
US8189762B2 (en) * 2003-10-30 2012-05-29 Hewlett-Packard Development Company, L.P. System and method for interactive voice response enhanced out-calling
US7925510B2 (en) * 2004-04-28 2011-04-12 Nuance Communications, Inc. Componentized voice server with selectable internal and external speech detectors
US8073148B2 (en) * 2005-07-11 2011-12-06 Samsung Electronics Co., Ltd. Sound processing apparatus and method
KR100744375B1 (ko) * 2005-07-11 2007-07-30 삼성전자주식회사 음성 처리 장치 및 방법
US8775168B2 (en) * 2006-08-10 2014-07-08 Stmicroelectronics Asia Pacific Pte, Ltd. Yule walker based low-complexity voice activity detector in noise suppression systems
US8537977B2 (en) * 2007-04-10 2013-09-17 Sk Telecom. Co., Ltd Apparatus and method for voice processing in mobile communication terminal

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4042788A (en) * 1976-05-17 1977-08-16 Stromberg-Carlson Corporation Tone detector
US4667065A (en) * 1985-02-28 1987-05-19 Bangerter Richard M Apparatus and methods for electrical signal discrimination
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4696031A (en) * 1985-12-31 1987-09-22 Wang Laboratories, Inc. Signal detection and discrimination using waveform peak factor
FR2631147B1 (fr) * 1988-05-04 1991-02-08 Thomson Csf Procede et dispositif de detection de signaux vocaux
US4979214A (en) * 1989-05-15 1990-12-18 Dialogic Corporation Method and apparatus for identifying speech in telephone signals
US5325425A (en) * 1990-04-24 1994-06-28 The Telephone Connection Method for monitoring telephone call progress
JP3229382B2 (ja) * 1992-01-28 2001-11-19 株式会社リコー カラー画像形成装置

Also Published As

Publication number Publication date
EP0622964B1 (en) 2002-03-20
DE69331732T2 (de) 2003-02-06
EP0622964A1 (en) 1994-11-02
DE69331732D1 (de) 2002-04-25
JPH07321912A (ja) 1995-12-08
US5619565A (en) 1997-04-08
US5533118A (en) 1996-07-02

Similar Documents

Publication Publication Date Title
JP2597817B2 (ja) 音声信号検出方法
US5023906A (en) Method for monitoring telephone call progress
US6940966B2 (en) Method and apparatus for detection of a telephone CPE alerting signal
US5325425A (en) Method for monitoring telephone call progress
US7079636B1 (en) Three-way telephone call prevention system and method
US5805685A (en) Three way call detection by counting signal characteristics
US20050131678A1 (en) Communication system tonal component maintenance techniques
JPH0622349A (ja) 通信チャネルトーン検出方法および装置
US6937723B2 (en) Echo detection and monitoring
WO2009111957A1 (zh) 一种线路状态检测方法、装置和预测式外呼系统
EP0663783B1 (en) Disconnect signalling detection arrangement
JP2728232B2 (ja) トーン検出方法及び呼出し進行方法
EP0423787A2 (en) A multi-frequency signal receiver and a method of detecting the multi-frequency signal
US5970447A (en) Detection of tonal signals
US6229889B1 (en) Robust signaling tone frequency measurement
JP3623973B2 (ja) 複数信号の検出及び識別システム
US6199036B1 (en) Tone detection using pitch period
JP3466643B2 (ja) 電話の信号の分類と電話によるメッセージの伝達方法とシステム
EP0988758B1 (en) Tone detection with aliasing bandpass filters
US6381330B1 (en) False tone detect suppression using multiple frame sweeping harmonic analysis
US5675639A (en) Voice/noise discriminator
US7023981B2 (en) Method and apparatus for signal detection
US6671252B1 (en) Robust signaling tone duration measurement
EP1376997A1 (en) Method for testing and adapting an audio unit parameters to a telecommunication system
JP2962210B2 (ja) ダイヤル検出装置