JPH05207526A - 電話の信号の分類と電話によるメッセージの伝達方法とシステム - Google Patents
電話の信号の分類と電話によるメッセージの伝達方法とシステムInfo
- Publication number
- JPH05207526A JPH05207526A JP4230719A JP23071992A JPH05207526A JP H05207526 A JPH05207526 A JP H05207526A JP 4230719 A JP4230719 A JP 4230719A JP 23071992 A JP23071992 A JP 23071992A JP H05207526 A JPH05207526 A JP H05207526A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signals
- telephone
- variance
- message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000005540 biological transmission Effects 0.000 title description 3
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000005236 sound signal Effects 0.000 claims abstract description 6
- 239000006185 dispersion Substances 0.000 abstract 2
- 230000008569 process Effects 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q1/00—Details of selecting apparatus or arrangements
- H04Q1/18—Electrical details
- H04Q1/30—Signalling arrangements; Manipulation of signalling currents
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
ク信号等を音声信号から正確に識別し、音声メッセージ
を送信しようと意図してる受信者に正しく届ける電話信
号の分類と電話によるメッセージの引き渡しの方法とシ
ステムを提供する。 【構成】 特性を有し電話線から受信した信号を処理す
る方法を提供する。この方法は、所定の時間にわたる信
号から得た複数のサンプルを測定することによって、フ
レームを形成するステップを有する。更に、この複数の
サンプルから選択したグループの線形予測符号化係数を
求める。更に、この線形予測符号化係数の分散を求め、
この分散を基準分散と比較する。信号の選択した特性に
発見的規則を適用し、この信号が音声信号によって構成
されているかどうかを判定する。
Description
し、更に詳しくは、電話の信号の分類と電話によるメッ
セージの伝達方法とシステムに関する。
広範囲にわたる部分になっている。その結果、個々の人
が相互に通信を行う種々の方法を作り出すため、技術開
発が加速されている。例えば、電話システムは非常に精
巧になり、ファクシミリ装置が次々と設けられ、コンピ
ュータ・ネットワークは更に広範囲をカバーするものと
なり、セルラー電話システムが普及している。
一人の人は、メッセージの意図した受信者と生の音声で
話す必要なくまたはこの受信者と同時に話す必要なく、
メッセージを残しておくという便宜によって、第2の人
に音音声のメッセージを通信することが可能になる。1
つの特に有利な信号媒体は、電話によるメッセージの伝
達である。特に、電話によるメッセージの伝達は、一般
的にこれによって送信者がシステムを呼び出し、音声に
よるメッセージを届けておくシステムを有している。そ
の後、この音声によるメッセージはこの音声によるメッ
セージの受信者として意図されている第2の人物に伝達
される。この種のメッセージ伝達システムによって、第
1の人は、メッセージを届けようと意図した受信者と生
の声で話すことなく、または同時に話すことなく、音声
によるメッセージを届けておくという便宜によって、第
2の人にこのメッセージを伝達することができる。
ッセージの伝達システムの1つの重要な問題、またはそ
の陰に潜んでいる複雑性は、意図した受信者に対して音
声によるメッセージを正確かつ信頼性をもって伝達する
ことである。特に、ある種の音声によるメッセージのシ
ステムは、音声によるメッセージを記憶し、意図した受
信者にこのメッセージを届けるため、この受信者は後で
呼び出しを受ける。この意図した受信者がこの呼び出し
に応答すると、この音声によるメッセージは引き渡され
る。その結果、このシステムは、メッセージを意図した
人物に引き渡すため、この意図した人物または誰か応答
を行う人物がこの電話に対して何時応答を行ったかを検
出することのできる正確なサブシステムを有する必要が
ある。従って、このシステムは、音声によるメッセージ
の意図した受信者と接触しようとするこのシステムの努
力に対する応答として、このシステムが受信する種々の
異なった種類の信号を識別することができなければなら
ない。例えば、システムが受信者と接触しようとする場
合、このシステムは、この意図した受信者の音声による
応答を受信するのではなく、呼び出し信号、話し中信
号、電話線のクリック音または種々の他の種類の信号を
受信する可能性がある。従って、メッセージが引き渡さ
れるべきでない場合に不注意に引き渡されることのない
よう、このサブシステムはこれらの種々の信号を受信者
の音声から識別することができなければならない。
方法は、フーリエ分析に基づいている。この分析では、
音声によるメッセージを引き渡すため、電話システムは
意図した受信者に対して電話の呼び出しを行う。この呼
び出しが行なわれると、システムは電話線で受信した信
号を監視する。特に、このシステムは8チャンネルの周
波数成分を監視し、電話線の信号が人間の音声を表す
か、または電話線で遭遇する可能性のある他の信号を表
すかを判定する。人間の音声は周波数成分の32ミリ秒
のフレームのそれぞれにわたって一貫性を有することは
なく、一方、呼び出し信号、話し中信号、またはリオー
ダ信号のような非音声信号は一貫性を有しているとう仮
定に基づいて、この方法は開発されている。従って、こ
の入力信号をフーリエ変換した後、一貫性のテストを行
う。その後、この一貫性テストの分析に基づいて、従来
技術によるフーリエ分析は、受信した信号が人間の声で
あるかその他の信号であるかを判定する。
は、特に入力信号がこれと関連する副標準の品質を有し
ている場合には、十分機能しないことが分かっている。
例えば、旧式の電話交換システムの場合には、システム
上の種々の空電妨害またはクリックによって、フーリエ
変換システムに誤った分析が発生する可能性がある。他
の例として、ベル電話システムから呼び出された信号用
の仕様が存在していても、これらの呼び出し信号はしば
しば、この仕様に違反している。その結果、既存のフー
リエ法は、呼び出し信号を人間の音声として誤って分類
し、またはその逆の分類を行っている。呼び出し信号を
人間の音声として誤って解釈した場合、このシステム
は、電話線の端部に事実上音声によるメッセージを受け
取る人物が存在しないのに、この音声によるメッセージ
を引き渡そうとする努力が行われる可能性がある。当然
のことながら、このように間違ってメッセージを引き渡
すことにより、実際に意図した受信者はこのメッセージ
を永遠に受け取ることを妨げられ、破滅的な結果が生ず
る可能性がある。
決しまたは従来技術によるシステムと関連する問題を少
なくする電話信号の分類及び電話によるメッセージの引
き渡しシステムに対する必要性が生じていることが理解
できる。本発明によれば、従来技術による信号分類と電
話によるメッセージの引き渡しシステムに関連する不利
な点と問題点を実質的に除去または少なくする電話の信
号の分類と電話によるメッセージの引き渡しの方法とシ
ステムが提供される。
話線から受信した信号を処理する方法を有している。こ
の方法は、所定の時間にわたって信号からの複数のサン
プルを測定することによって、フレームを形成するステ
ップを含んでいる。更に、複数のサンプルの選択したグ
ループの線形予測符号化係数を求める。更に、この直線
予測コード化係数の分散を求め、これを基準分散と比較
する。最後に、発見的規則をこの信号の選択した特性に
適用し、この信号が音音声によって構成されているかど
うかを判定する。
ムに対して、多くの技術上の利点を提供する。1つの技
術上の利点は、電話線の信号をより正確に認識すること
である。他の技術上の利点は、話し中信号、リオーダ信
号、クリック信号、及び音音声信号を正確に認識する能
力である。その結果、電話によるメッセージ引き渡しシ
ステムは、音声によるメッセージを届ける場合、より正
確であり信頼性があるという別の技術上の利点が得られ
る。更に他の技術上の利点は、電話メッセージ・システ
ムの処理能力に対する処理上の負荷が低減されることで
ある。
め、添付図と組み合わせて以下の説明を参照する。図1
と図2は、本発明の好適な実施例を示す。特に、図1
は、一般的に10で示す本発明の信号処理プロセスの機
能ブロック図を示す。一般的に、プロセス10は、電話
線から受信した信号を分析し、その信号が人間の音声信
号であるかまたは他の種類の信号であるかを分類するよ
うに動作する。好適な実施例では、潜在的に遭遇する他
の信号には、呼び出し信号、リオーダ信号、またはクリ
ック信号が含まれている。これらの種々の信号の各々
は、一般的に電話線出遭遇するものである。プロセス1
0の特定のステップは、以下でより詳細に説明する。
される。開始ブロック12の後、電話線の信号は低域フ
ィルタのステップ14を通過する。低域フィルタのステ
ップ14は、所定の周波数以上の周波数を切り離して除
去する帯域フィルタを加えるステップを含む。好適な実
施例では、800Hz以上の全ての信号を除去する。こ
の好適な切り離なしによって,800Hz以上で発生
し、従ってプロセス10内の残りのステップで処理され
ない全ての余分の信号を除去することが可能になる。濾
波された電話信号は、サンプリング・ステップ16によ
ってデータ・フレームに分解される。好適な実施例で
は、1フレーム当り512個のデータ・サンプルが、6
4ミリ秒の間に8000Hzの周波数でサンプリングに
よって集められる。従って、サンプリング・ステップ1
6によって形成した各フレームによって、512個のデ
ータ・サンプルが得られ、これらは、プロセス10のス
テップによって更に分析される。
ウンサンプリング・ステップによって、削減される。好
適な実施例では、4対1の比率で、ダウンサンプリング
が行われる。従って、サンプリング・ステップ16で得
た512個のサンプルは、ダウンサンプリング・ステッ
プ18で128個のサンプルに削減される。好適な実施
例では、処理しなければならないデータの量を少なくす
るため、ダウンサンプリングを利用する。ダウンサンプ
リングは、プロセス10を通じて正確な結果を尚達成し
ながら、実行することが可能であることに留意しなけれ
ばならない。その結果、信頼性のある結果を尚達成しな
がら、全体の分析を実行するのに必要なメモリの量とプ
ロセッサの負荷の両方を削減することができる。その結
果、システム全体は、より効率的かつ安価に動作する。
好適な実施例では512個のサンプルを128個のサン
プルにダウンサンプリングして使用しているが、サンプ
リング速度、サンプリングの時間、及びダウンサンプリ
ングの比率を含むパラメータの各々は、ここで意図する
発明の範囲から逸脱することなく、当業者によって調整
または変更することが可能であることにまた留意しなけ
ればならない。
と測定を実行する。特に、128個のサンプルについ
て、二乗平均平方根(「RMS」)の値を計算するステ
ップ20をを実行する。以下でより詳細に論ずるよう
に、このRMSの値は、二乗すると、これらのサンプル
のエネルギー水準を反映する。特に、受信中の信号の種
類を特に識別するため、このエネルギー水準を発見的分
類(heuristicclassificatio
n)に対して使用する。1フレームのサンプルのゼロク
ロスの数をまたゼロクロス測定ステップ22で測定す
る。このゼロクロスのプロセスは、技術上周知の手法に
従って実行される。サンプリングした電話の信号が話し
中信号を構成するかまたはリオーダ信号を構成するかを
判定するため、測定した実際のゼロクロスの数をまた発
見的分類と組み合わせて使用する。
リングしたデータ・フレームの線形予測符号化(「LP
C」)係数を計算する。信号に対する線形モデルを発生
するため、技術上周知のように、LPC係数を計算す
る。LPCモデルは、現在の信号は以前の信号にノイズ
・ファクターをプラスした合計であると仮定する。特
に、LPC分析では、信号は時間の関数であり、以下の
条件で記述することができる。
クター、y(t‐k)は以前の時刻t‐kに於ける信
号、n(t)は時刻tに於けるノイズの分散である。
ファクターを計算するため、LPC係数を使用すること
ができる。更に、ノイズの分散、n(t)、を得るた
め、分散の計算ステップ26はLPC係数を使用して実
行する。特に、ノイズの分散は、次式に従って計算され
る。 v=lTRl 等式(2) ここで、vはノイズの分散、lは入力データのLPC係
数のベクトル、Rは入力データの共分散マトリックスで
ある。
のため、計算ステップ24は、1つ以上の所定の基準デ
ータの組に基づいてまた行われる。特に、好適な実施例
では、3つの異なった基準データの組がLPC係数の形
で記憶されている。これらの3つに基準は、電話線で遭
遇する可能性のある3つの異なった種類の呼び出し信号
に対するLPC係数を反映するのが好ましい。3つの異
なった呼び出し音が設けられるが、その理由は、電話シ
ステムは国家によって支配され、従って1種類のみの呼
び出し信号を有すべきであるが、種々の種類の呼び出し
信号が尚電話線に現れると判断されているからである。
従って、これらの3種類の基準LPC係数の組は、それ
ぞれの種類の可能性のある呼び出し信号を表している。
信号の各々の分散をまた計算する。この計算は、上記の
等式(2)とステップ26に従って行われる。その結
果、分散の計算ステップ26に続いて、プロセス10は
データの分散vd 並びに3種類のそれぞれの基準呼び出
し信号の分散vr1、vr2及びvr3を有する。比較ステッ
プ28は、データの分散vd をそれぞれの基準分散の各
々と比較するために行われる。好適な実施例では、この
比較は比率に従って行われ、従って、次式で示される。
個の数の基準分散の1つである。等式(3)を検討する
と、もしデータがこれらの基準の1つと同じであれば、
このデータと基準との比較から比率rは約1であること
が理解できる。従って、等式(3)により、このデータ
が3つの基準値の1つと近似する確率が大きいか否かが
判定される。もしこのような大きい確率が存在すれば、
プロセス10内のこのステップで、この特定のデータは
これらの3つの基準によって表される3つの呼び出し信
号の1つに最もよく対応することが指示される。以下で
更に詳細に説明するように、この指示を検証するかまた
はこの指示に反論するため、別の発見的な分析が行われ
る。
を蓄積し、その分析を複数のフレーム時間実行する。好
適な実施例では、プロセス10は3回反復され、その結
果、データが測定されて評価され、計算は電話線の3つ
の連続する信号のフレームに対して行われる。その結
果、電話線で受信した信号の種類をより正確に予測する
ため、一連の3つのフレームに対して別の特性付けと分
類を行うことができる。遅延ブロック30はループの形
式で示されているが、収集した情報のフレームは進行基
準で集められ、ステップ16〜28を実行するのに必要
な処理時間によって、データの収集が中断されることは
ない。従って、遅延ブロック30によって集められた3
つのフレームは、電話線の連続する信号の情報を表し、
これはプロセス10の動作によって失われた情報のギャ
ップによって分離されることはない。
をより正確に予測するため、電話線の信号の種々の特性
について発見的分類のステップ32を実行する。ここで
使用しているように、発見的という用語は、その通常の
意味で定義され、幾くつかの代替案の中で最も可能性の
高い解決案を異なった考え方を適用することによって見
いだすという問題の解決手法を含んでいる。従って、本
発明では、プロセス10が電話線の信号の種類を正確に
予測することができるよう、以下の発見的規則を特定の
信号の特性に適用する。特に、これらの発見的規則は下
記の通りである。
0.9秒であるが2.5秒より長くない。従って、0.
9秒と2.5の間の時間間隔を分析するため、プロセス
10は複数のフレームにわたって継続することができ
る。従って、もしプロセス10が、信号は呼び出し信号
であるという仮の結論に達すれば、このプロセス10
は、更にこの評価を確認するため、その信号が0.9秒
〜2.5秒の持続時間をを有すかどうかを更に判定す
る。
Sの値の二乗)は、呼び出し信号の持続時間中比較的一
定の状態に止まっている。従って、プロセス10が、信
号は呼び出し信号であるという仮の結論に達すれば、プ
ロセス10は、このRMSの値(またはその二乗)をこ
の信号の持続時間にわったって更に評価し、RMSの値
が比較的一定の状態に止まっているか否かを判定する。
もしこの値が比較的一定であれば、この信号は呼び出し
信号であると結論することができる。しかし、もしRM
Sの値がこの信号の持続時間中に変動すれば、この信号
は呼び出し信号以外の何かであると結論することができ
る。
の値の二乗)は、信号の持続時間にわたって大幅に変動
する。従って、上で論じた第2の発見的規則と比較し
て、変動するエネルギー水準は、信号が呼び出し信号で
はなく人間の音声の信号である確率を示している。従っ
て、この信号のエネルギー水準の評価は、この信号が呼
び出し信号を構成しているか人間の音声信号を構成して
いるか否かについて更に決定力を有している。
しか持続しない。従って、プロセス10によって予めク
リック信号であると特性付けられた信号は、クリック信
号としてのこの特性が0.25秒未満の時間間隔一貫し
ていることを確認するため、プロセス10によって更に
評価される。しかし、もしプロセス10は最初この信号
がクリック信号であるとの指示を受け、しかもこの信号
の持続時間が0.25秒を超える場合は、プロセス10
はこの信号はクリック信号ではないと結論することがで
きる。
0ミリ秒であり、リオーダ信号のオン/オフ間隔は約2
50ミリ秒である。上述のように、ゼロクロス測定ステ
ップ22は、サンプリングした信号のゼロクロスの数を
決定する。特に、話し中信号とリオーダ信号の両方の場
合、話し中信号とリオーダ信号のいずれかがオンされる
と、所定数のゼロクロスを期待することができる。従っ
て、この所定数のゼロクロスと測定したゼロクロスの数
を比較することによって、分析した信号が話し中信号と
リオーダ信号のいずれであるかについての最初の指示が
行われる。この最初の指示が行われると、この信号のオ
ン/オフ間隔または持続時間をまた監視し、この信号が
話し中信号とリオーダ信号のいずれかであるかを確認す
る。この持続時間の間、話し中信号のオン/オフ間隔は
約500ミリ秒であり、一方リオーダ信号のオン/オフ
間隔は約250ミリ秒である。従って、ある信号が話し
中信号であるかリオーダ信号であるかについてのゼロク
ロス分析による指示は、この信号の持続時間を監視し、
これが500ミリ秒間オン/オフするか250ミリ秒間
オン/オフするかを判断することによって、更に確認す
ることができる。
し信号、音声信号、クリック信号、話し中信号、または
リオーダ信号のいずれかとして分類するため、プロセス
10は種々の測定と分析を行うことが理解できる。この
分類のプロセスは、図2に示すようなシステムで実行す
のが好ましい。特に、図2は音声引き渡しシステム34
を示す。音声引き渡しシステム34は、音声のメッセー
ジをその意図する受信者に届けるために動作する。特
に、システム34は、この意図した受信者に対して電話
で接触を行う迄、この音声メッセージを保持しておく。
接触が行われると、音声メッセージはこの受信者に引き
渡される。
は、開始ブロック36で開始される。開始ブロック36
から、このプロセスは音声メッセージ受信ステップ38
に続く。ステップ38で、音声メッセージを外部ソース
から受信する。例えば、この外部ソースは、音声メッセ
ージを受信させることを意図した受信者の指示と共にこ
の音声メッセージを受信する電話メッセージ・システム
によって構成される。従って、代表的なシステムでは、
送信者はこのシステムを呼び出し、メッセージを届ける
と共に、この呼び出しを受信させるように意図した受信
者に対応するコードを入力する。システム34はこのメ
ッセージを保持し、以下で詳述するステップに従ってこ
れを引き渡すように動作する。
ジの受信を意図した受信者がステップ40で呼び出され
る。この呼び出しは技術上周知の原理に従って行われ
る。従って、上記の例では、メッセージの送り主によっ
て入力されたコードが解読され、この音声メッセージの
受信を意図した受信者が呼び出される。ダイアルを行う
シーケンスが終了すると、システム34は、ステップ4
2で呼び出しに応答して受信した信号の種類を識別する
ように動作する。上述したように、システム34は、呼
び出し信号、音声信号、クリック信号、話し中信号、ま
たはリオーダ信号のいずれかの受信を予期するように構
成されている。従って、図2の残りのステップは、いず
れの種類の信号が受信されたかを識別し、これに従って
動作するようになっている。
ーダ信号であるか、またはクリック信号であるかを判定
するため、システム34はステップ44でこの受信した
信号を分析する。この信号がこれらの3種類の信号の1
つであるかどうかを判定するために実行する特定のプロ
セスは、図1と関連して上で説明したものである。もし
受信した信号が、話し中信号、リオーダ信号、またはク
リック信号のいずれかであれば、このシステムはステッ
プ46に示すように、このメッセージを後でもう一度引
き渡そうとするように構成されている。従って、ステッ
プ46に行くと、システム34は所定の所望の時間待機
し、この後ステップ40に戻って意図した受信者を呼び
出すことができる。ステップ40でプロセスを再び開始
すると、その後に続く残りのステップは、音声メッセー
ジを引き渡すため、再び実行することができる。
信号、リオーダ信号、またはクリック信号であると判定
されなければ、システム34は引き続きステップ48で
受信した信号は呼び出し信号であるかどうかを判定す
る。もし受信した信号が呼び出し信号であれば、システ
ム34は、ステップ50に示すように、呼び出し音が5
回以上連続するかどうかを判定する。もし受信した呼び
出し音の連続が5回未満であれば、システム34はステ
ップ42に戻り、その直後に引き続いて受信する信号を
識別する。従って、例えば、もし一連の3回の呼び出し
音を連続して受信すれば、システム34は、それぞれの
連続した呼び出し音を検出する毎に、ループで動作を行
う。
すれば、システム34は、ステップ52に示すように、
意図した受信者を後でもう一度呼び出そうとする。ステ
ップ46と関連して論じたように、後でもう一度トライ
するというステップ52の指示は、システム34が所定
の時間待機し、後でもう一度ステップ40に戻り、音声
メッセージの意図した受信者を呼び出そうとすることを
示すものである。ステップ48、50及び52を検討す
ると、5つ以上の呼び出し音が受信されるかまたは呼び
出し信号以外の信号に遭遇する迄、システム34は連続
した呼び出し音を処理することを理解しなければならな
い。例えば、もし話し中の信号に引き続いて3つの呼び
出し音を受信すれば、システム34はステップ42と5
2の間を3回ループし、ステップ44で話し中の信号を
検出すると、ステップ46で後でもう一度トライすると
いう結論に最終的に達する。もし呼び出し音がリオーダ
信号、クリック信号または音声信号のような他の信号に
続くなら、この交互に発生する信号は全体として一般的
に図2と関連して論じたように処理される。
し信号ではないと判定されたなら、システム34はこの
受信した信号がステップ54に示すように20秒以上の
沈黙を表すかどうかを判定する。もしこの受信した信号
が20秒以上の沈黙を構成すれば、システム34は、ス
テップ56に示すように、もう一度後で音声メッセージ
を引き渡そうとトライする。もしこの受信した信号が2
0秒以上の沈黙でなければ、システム34はこの信号を
分析し、ステップ58に示すようにこれが音声信号であ
るかどうかを判定する。もしこの受信した信号が音声信
号であれば、音声メッセージはステップ60に示すよう
に引き渡される。または、もしこの受信した信号が音声
信号でなければ、システム34は、ステップ62に示す
ように、この音声メッセージをもう一度後で引き渡そう
とトライし続ける。
メッセージを保持し、意図した受信者を呼び出し、この
呼び出しに応答して受信した信号を監視することによっ
て、このシステム34の意図した受信者にこの音声メッ
セージを引き渡そうと試みるように動作する。特に、信
号が話し中信号、リオーダ信号、クリック信号、呼び出
し信号または音声信号であるかどうかを判定し、更に過
度に長い沈黙の信号に遭遇したかどうかを判定するた
め、このシステムは信号を分析する。呼び出しに応答し
て音声に遭遇する迄、このシステムは繰り返してメッセ
ージを引き渡そうと試みる。音声信号を受信すると、シ
ステムはこの音声メッセージを受信者に引き渡す。従っ
て、上述したところから、本発明は正確で信頼性のある
音声メッセージ引き渡しシステムを提供するものである
ことを理解しなければならない。
で要約する。特性を有し電話線から受信した信号を処理
する方法に於いて、第1ステップは、所定の時間にわた
って信号から得た複数のサンプルを測定することによっ
て、フレームを形成する。このステップに続いて、この
所定の時間の複数のサンプルの二乗平均平方根を求め、
その後複数のサンプルの選択したグループの予測符号化
係数とこの直線予測符号化係数の分散を求める。これに
続いて、この分散を第1基準分散、第2基準分散、及び
第3基準分散と比較する。次に発見的規則を信号の選択
した特性に使用し、この信号が音声信号を構成するかど
うかを判定する。
するステップは、64ミリ秒の時間にわたって512個
のサンプルを測定するステップによって構成することが
できる。複数のサンプルから選択したグループの直線予
測符号化係数を求めるステップは、複数のサンプルの4
個毎のサンプルの直線予測符号化係数を求めるステップ
によって構成される。この分散の基準分散とのそれぞれ
の比較は、この分散を呼び出し信号基準を表す第1基
準、第2基準または第3基準と比較するステップによっ
て構成される。
るステップは、呼び出し信号の持続時間は少なくとも
0.9秒であるが2.5秒よりも長くないという発見的
規則に基づいて複数のフレームの持続時間を評価するス
テップによって構成される。代替案では、信号の選択し
た特性に発見的規則を適用するステップは、呼び出し信
号の二乗平均平方根がフレームの期間中比較的一定の状
態のままであるという発見的規則に基づいてこのフレー
ムを評価するステップによって構成される。信号の選択
した特性に発見的規則を適用する更に他の代替ステップ
は、クリック信号の持続時間がせいぜい0.25秒であ
るという発見的規則に基づいて複数のフレームの持続時
間を評価するステップによって構成される。信号の選択
した特性に発見的規則を適用する第4の代替ステップ
は、音声信号の二乗平均平方根はフレームの期間にわた
って大幅に変化するという発見的規則に基づいてこのフ
レームを評価するステップによって構成される。第5の
代替ステップでは、信号の選択した特性に発見的規則を
適用するステップは、話し中信号のオン/オフ間隔は約
500ミリ秒であるという発見的規則に基づいて複数の
フレームの持続時間を評価するステップによって構成さ
れる。信号の選択した特性に発見的規則を適用するもう
1つの代替ステップは、リオーダ信号のオン/オフ間隔
は約250ミリ秒であるという発見的規則に基づいて複
数のフレームの持続時間を評価するステップによって構
成される。
ロスを測定するステップによって更に構成することがで
きる。更に、本発明を詳細に説明したが、上記の請求項
によって定義された本発明の精神と範囲から逸脱するこ
となく、種々の変形、代替または変更を本発明に対して
行うことが可能であることを理解しなければならない。
する。 1.特性を有し電話線から受信した信号を処理する方法
に於いて、上記の方法は:所定の時間にわたって上記の
信号から複数のサンプルを測定することによって、フレ
ームを形成するステップ;上記の複数のサンプルの選択
したグループの直線予測符号化係数を求めるステップ;
上記の直線予測符号化係数の分散を求めるステップ;上
記の分散を基準分散と比較するステップ;及び上記の信
号の選択した特性に対して発見的規則を適用し、上記の
信号が音声信号によって構成されるかどうかを判定する
ステップ;によって構成されることを特徴とする方法。
ンプルの二乗平均平方根を求めるステップによって更に
構成されることを特徴とする前記項1記載の方法。 3.所定の時間にわたって測定を行う上記のステップ
は、64ミリ秒の時間にわたって測定を行うステップに
よって構成されることを特徴とする前記項1記載の方
法。
ップは、64ミリ秒の時間にたって512個のサンプル
を測定するステップによって構成されることを特徴とす
る前記項3記載の方法。 5.複数のサンプルを測定する上記のステップは、51
2個のサンプルを測定するステップによって構成される
ことを特徴とする前記項1記載の方法。
ループの直線予測符号化係数を求める上記のステップ
は、上記の複数のサンプルの4個毎のサンプルの直線予
測符号化係数を求めるステップによって構成されること
を特徴とする前記項5載の方法。 7.上記の複数のサンプルから選択したグループの直線
予測符号化係数を求める上記のステップは、上記の複数
のサンプルの内の全てのサンプルの直線予測符号化係数
を求めるステップによって構成されることを特徴とする
前記項5記載の方法。
ループの直線予測符号化係数を求める上記のステップ
は、上記の測定した512個のサンプルの内の128個
の直線予測符号化係数を求めるステップによって構成さ
れることを特徴とする前記項1記載の方法。 9.上記の基準分散は第1基準分散によって構成され、
上記の分散を第2基準分散と比較するステップによって
更に構成されることを特徴とする前記項1記載の方法。
って構成され:上記の分散を第2基準分散と比較するス
テップ;及び上記の分散を第3基準分散と比較するステ
ップ;によって更に構成されることを特徴とする前記項
1記載の方法。 11.上記の分散の基準分散との比較の各々は、上記の
分散を呼び出し信号の基準を表す第1基準、第2基準ま
たは第3基準と比較するステップによって構成されるこ
とを特徴とする前記項10記載の方法 12.信号の選択した特性に発見的規則を適用する上記
のステップは、呼び出し信号の持続時間は少なくとも
0.9秒であるが2.5秒よりも長くないという発見的
規則に基づいて複数のフレームの持続時間を評価するス
テップによって構成されることを特徴とする前記項1記
載の方法。
適用する上記のステップは、呼び出し信号の二乗平均平
方根が上記のフレームの期間中比較的一定の状態のまま
であるという発見的規則に基づいて上記のフレームを評
価するステップによって構成されることを特徴とする前
記項1記載の方法。 14.信号の選択した特性に発見的規則を適用する上記
のステップは、クリック信号の持続時間がせいぜい0.
25秒であるという発見的規則に基づいて複数のフレー
ムの持続時間を評価するステップによって構成されるこ
とを特徴とする前記項1記載の方法。
適用する上記のステップは、音声信号の二乗平均平方根
はフレームの期間にわたって大幅に変化するという発見
的規則に基づいてこのフレームを評価するステップによ
って構成されることを特徴とする前記項1記載の方法。 16.上記の所定の時間中上記の信号のゼロクロスを測
定するステップによって更に構成されることを特徴とす
る前記項1記載の方法。
適用する上記のステップは、話し中信号のオン/オフ間
隔は約500ミリ秒であるという発見的規則に基づいて
複数のフレームの持続時間を評価するステップによって
構成されることを特徴とする前記項1記載の方法。 18.信号の選択した特性に発見的規則を適用する上記
のステップは、リオーダ信号のオン/オフ間隔は約25
0ミリ秒であるという発見的規則に基づいて複数のフレ
ームの持続時間を評価するステップによって構成される
ことを特徴とする前記項1記載の方法。
を処理する方法に於いて、上記の方法は:所定の時間に
わたって上記の信号から複数のサンプルを測定すること
によってフレームを形成するステップ;上記の所定の時
間にわたって上記の複数のサンプルの二乗平均平方根を
求めるステップ;上記の所定の時間の間に上記の信号の
ゼロクロスを測定するステップ;上記の複数のサンプル
の選択したグループの直線予測符号化係数を求めるステ
ップ;上記の直線予測符号化係数の分散を求めるステッ
プ;上記の分散を基準分散と比較するステップ;及び上
記の信号の選択した特性に対して発見的規則を適用し、
上記の信号が音声信号によって構成されるかどうかを判
定するステップ;によって構成されることを特徴とする
方法 20.上記の基準分散は第1基準分散によって構成さ
れ:上記の分散を第2基準分散と比較するステップ;及
び上記の分散を第3基準分散と比較するステップ;によ
って構成されることを特徴とする前記項19記載の方
法。
適用する上記のステップは:呼び出し信号の持続時間は
少なくとも0.9秒であるが2.5秒よりも長くないと
いう発見的規則に基づいて複数のフレームの持続時間を
評価するステップ;及び呼び出し信号の二乗平均平方根
が上記のフレームの期間中比較的一定の状態のままであ
るという発見的規則に基づいてフレームを評価するステ
ップ;によって構成されることを特徴とする前記項19
記載の方法。
適用する上記のステップは、クリック信号の持続時間が
せいぜい0.25秒であるという発見的規則に基づいて
複数のフレームの持続時間を評価するステップによって
構成されることを特徴とする前記項19記載の方法。 23.信号の選択した特性に発見的規則を適用する上記
のステップは、音声信号の二乗平均平方根はフレームの
期間にわたって大幅に変化するという発見的規則に基づ
いてこのフレームを評価するステップによって構成され
ることを特徴とする前記項19記載の方法。
適用する上記のステップは:話し中信号のオン/オフ間
隔は約500ミリ秒であるという発見的規則に基づいて
複数のフレームの持続時間を評価するステップ;及びリ
オーダ信号のオン/オフ間隔は約250ミリ秒であると
いう発見的規則に基づいて複数のフレームの持続時間を
評価するステップ;によって構成されることを特徴とす
る前記項19記載の方法 25.特性を有し電話線から受信した信号を処理する方
法を提供する。この方法は、所定の時間にわたる信号か
ら得た複数のサンプルを測定することによって、フレー
ムを形成するステップを有する。更に、この複数のサン
プルから選択したグループの線形予測符号化係数を求め
る。更に、この線形予測符号化係数の分散を求め、この
分散を基準分散と比較する。信号の選択した特性に発見
的規則を適用し、この信号が音声信号によって構成され
ているかどうかを判定する。
ップのブロック図を示す。
のブロック図を示す。
Claims (1)
- 【請求項1】 特性を有し電話線から受信した信号を処
理する方法に於いて、上記の方法は:所定の時間にわた
って上記の信号から複数のサンプルを測定することによ
って、フレームを形成するステップ;上記の複数のサン
プルの選択したグループの直線予測符号化係数を求める
ステップ;上記の直線予測符号化係数の分散を求めるス
テップ;上記の分散を基準分散と比較するステップ;及
び上記の信号の選択した特性に対して発見的規則を適用
し、上記の信号が音声信号によって構成されるかどうか
を判定するステップ;によって構成されることを特徴と
する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US75270891A | 1991-08-30 | 1991-08-30 | |
US07/752708 | 1991-08-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05207526A true JPH05207526A (ja) | 1993-08-13 |
JP3466643B2 JP3466643B2 (ja) | 2003-11-17 |
Family
ID=25027460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23071992A Expired - Fee Related JP3466643B2 (ja) | 1991-08-30 | 1992-08-31 | 電話の信号の分類と電話によるメッセージの伝達方法とシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US5311575A (ja) |
EP (1) | EP0530645B1 (ja) |
JP (1) | JP3466643B2 (ja) |
DE (1) | DE69229584T2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5353331A (en) * | 1992-03-05 | 1994-10-04 | Bell Atlantic Network Services, Inc. | Personal communications service using wireline/wireless integration |
US5450484A (en) * | 1993-03-01 | 1995-09-12 | Dialogic Corporation | Voice detection |
US5416836A (en) * | 1993-12-17 | 1995-05-16 | At&T Corp. | Disconnect signalling detection arrangement |
US5459781A (en) * | 1994-01-12 | 1995-10-17 | Dialogic Corporation | Selectively activated dual tone multi-frequency detector |
US5546452A (en) | 1995-03-02 | 1996-08-13 | Geotel Communications Corp. | Communications system using a central controller to control at least one network and agent system |
US5544241A (en) * | 1995-06-27 | 1996-08-06 | Andrew S. Dibner | Telephone ring detector |
US5835583A (en) | 1995-10-05 | 1998-11-10 | Bell Atlantic Network Services, Inc. | Mediated AIN control of short code access to information service providers |
US6708146B1 (en) | 1997-01-03 | 2004-03-16 | Telecommunications Research Laboratories | Voiceband signal classifier |
US6510208B1 (en) * | 1997-01-20 | 2003-01-21 | Sony Corporation | Telephone apparatus with audio recording function and audio recording method telephone apparatus with audio recording function |
ES2347473T3 (es) * | 2005-12-05 | 2010-10-29 | Qualcomm Incorporated | Procedimiento y aparato de deteccion de componentes tonales de señales de audio. |
US8306809B2 (en) * | 2008-07-17 | 2012-11-06 | International Business Machines Corporation | System and method for suggesting recipients in electronic messages |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1348724A (en) * | 1971-01-07 | 1974-03-20 | Compur Werk Gmbh & Co | Control unit for controlling a recorder in a telephone answering and message recording system |
US4032711A (en) * | 1975-12-31 | 1977-06-28 | Bell Telephone Laboratories, Incorporated | Speaker recognition arrangement |
US4689760A (en) * | 1984-11-09 | 1987-08-25 | Digital Sound Corporation | Digital tone decoder and method of decoding tones using linear prediction coding |
US4809321A (en) * | 1986-09-22 | 1989-02-28 | Dytel Corporation | Busy/no-answer call completion equipment |
US5054083A (en) * | 1989-05-09 | 1991-10-01 | Texas Instruments Incorporated | Voice verification circuit for validating the identity of an unknown person |
JP2643593B2 (ja) * | 1989-11-28 | 1997-08-20 | 日本電気株式会社 | 音声・モデム信号識別回路 |
-
1992
- 1992-08-25 EP EP92114460A patent/EP0530645B1/en not_active Expired - Lifetime
- 1992-08-25 DE DE69229584T patent/DE69229584T2/de not_active Expired - Fee Related
- 1992-08-31 JP JP23071992A patent/JP3466643B2/ja not_active Expired - Fee Related
-
1993
- 1993-06-22 US US08/081,481 patent/US5311575A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3466643B2 (ja) | 2003-11-17 |
DE69229584D1 (de) | 1999-08-19 |
EP0530645A3 (en) | 1994-08-10 |
US5311575A (en) | 1994-05-10 |
DE69229584T2 (de) | 2000-07-20 |
EP0530645A2 (en) | 1993-03-10 |
EP0530645B1 (en) | 1999-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5796811A (en) | Three way call detection | |
US5805685A (en) | Three way call detection by counting signal characteristics | |
US6321194B1 (en) | Voice detection in audio signals | |
US6574601B1 (en) | Acoustic speech recognizer system and method | |
US6785365B2 (en) | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems | |
Lee et al. | A study of on-off characteristics of conversational speech | |
KR100278423B1 (ko) | 정상신호 및 비정상신호의 판별 | |
EP0243561B1 (en) | Tone detection process and device for implementing said process | |
EP0981887B1 (en) | Testing telecommunications equipment | |
EP0622964B1 (en) | Voice activity detection method and apparatus using the same | |
KR19980080615A (ko) | 음성 활동 검출 방법 및 장치 | |
AU689300B2 (en) | Test method | |
US5239574A (en) | Methods and apparatus for detecting voice information in telephone-type signals | |
JPH05207526A (ja) | 電話の信号の分類と電話によるメッセージの伝達方法とシステム | |
US20030216909A1 (en) | Voice activity detection | |
Sakhnov et al. | Approach for Energy-Based Voice Detector with Adaptive Scaling Factor. | |
WO2001086633A1 (en) | Voice activity detection and end-point detection | |
US5579432A (en) | Discriminating between stationary and non-stationary signals | |
US6199036B1 (en) | Tone detection using pitch period | |
Sakhnov et al. | Dynamical energy-based speech/silence detector for speech enhancement applications | |
US20030110029A1 (en) | Noise detection and cancellation in communications systems | |
Tanyer et al. | Voice activity detection in nonstationary Gaussian noise | |
Sakhnov et al. | Low-complexity voice activity detector using periodicity and energy ratio | |
Goldberg | Predictive coding with delayed decision. | |
JP2621241B2 (ja) | 通話信号識別方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080829 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090829 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100829 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |