JPH05316198A - Caller recognition telephone set - Google Patents

Caller recognition telephone set

Info

Publication number
JPH05316198A
JPH05316198A JP4117384A JP11738492A JPH05316198A JP H05316198 A JPH05316198 A JP H05316198A JP 4117384 A JP4117384 A JP 4117384A JP 11738492 A JP11738492 A JP 11738492A JP H05316198 A JPH05316198 A JP H05316198A
Authority
JP
Japan
Prior art keywords
speaker
recognition
caller
unit
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4117384A
Other languages
Japanese (ja)
Inventor
Shingo Nishimura
新吾 西村
Kazuhiko Okashita
和彦 岡下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sekisui Chemical Co Ltd
Original Assignee
Sekisui Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sekisui Chemical Co Ltd filed Critical Sekisui Chemical Co Ltd
Priority to JP4117384A priority Critical patent/JPH05316198A/en
Publication of JPH05316198A publication Critical patent/JPH05316198A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To eliminate the need for limiting an object audio to a content of a message learned in advance in the case of talker recognition. CONSTITUTION:When a talker recognition section 13 of a caller recognition telephone set 10 uses a neural network to recognize a talker, the section 13 receives a series of vectors representing an outline of a spectrum for a short period of time, a series of network outputs is totallized by sum, product, majority decision or the like for the result of recognition based on each output to obtain one recognition result, and number of learning data for the network is decreased by clustering.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、いたずら電話やまちが
い電話に煩わされることを防止するため、予め登録して
ある話者に対してのみ通話可能とする発呼者認識電話装
置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a caller identification telephone device which can make a call only to a speaker registered in advance in order to prevent a mischievous telephone or a wrong telephone from being bothered.

【0002】[0002]

【従来の技術】従来、特開昭59-208965 「電話機の呼出
方式」、特開昭60-239163 「自動応答電話方式」、特開
平2-55448 「音声ダイヤリング方式」、特開平3-35648
「迷惑電話防止装置」等が提案されている。これらの従
来技術では、具体的な認識方式に関する記述が乏しく、
記述されていたとしても、以下に示す程度の記述であ
る。
2. Description of the Related Art Conventionally, Japanese Patent Laid-Open No. 59-208965, "Calling System for Telephone", Japanese Patent Laid-Open No. 60-239163, "Automatic Answering Telephone System", Japanese Patent Laid-Open No. 2-55448, "Voice Dialing System", Japanese Patent Laid-Open No. 3-35648.
A "nuisance call prevention device" and the like have been proposed. In these conventional techniques, there is little description about a specific recognition method,
Even if it is described, the description is only to the extent shown below.

【0003】入力音声に含まれる話者に関する特徴量
を抽出し、このの抽出データと、予め同様の方法で
抽出しておいた辞書データとの距離を計算(類似度算
出)し、このの計算結果より入力音声が登録話者の
声か判定し、このの判定により、入力音声が予め登
録されている者の声であれば、応答制御部によりベル鳴
動を行なうことによって応答可能とする。
A feature amount relating to a speaker included in the input voice is extracted, a distance between the extracted data and dictionary data extracted in advance by a similar method is calculated (similarity calculation), and this calculation is performed. Based on the result, it is determined whether the input voice is the voice of the registered speaker, and if the input voice is the voice of a person who is registered in advance, the response control unit makes a response by making a bell ring.

【0004】そこで本出願人は既に、特開平3-114345
「発呼者認識電話装置」を出願している。これはニュー
ラルネットワークを利用することにより、認識率、処理
時間の向上を実現したものであった。
Therefore, the present applicant has already filed Japanese Patent Application Laid-Open No. 3-114345.
We have applied for "Caller Identification Telephone Device". By using a neural network, the recognition rate and the processing time were improved.

【0005】[0005]

【発明が解決しようとする課題】然しながら、本出願人
が既に提案している発呼者認識電話装置は、話者認識す
る際、対象とする音声を予め学習した発声内容に限定す
るものであった。即ち、発呼者に特定の言葉を発声して
もらうことを前提としており、使い勝手が悪かった。ま
た、それ以外の言葉が入力されると誤動作を起こすこと
があった。
However, the caller recognition telephone device proposed by the applicant of the present invention limits the target voice to the pre-learned utterance contents when recognizing the speaker. It was That is, it is premised that the caller speaks a specific word, and the usability is poor. Also, if other words are input, malfunctions may occur.

【0006】本発明は、発呼者認識電話装置において、
話者認識する際、対象とする音声を、予め学習した発声
内容に限定する必要がないものを提供することを目的と
する。
The present invention relates to a calling party recognition telephone device,
It is an object of the present invention to provide a target voice that does not need to be limited to previously learned utterances when recognizing a speaker.

【0007】[0007]

【課題を解決するための手段】請求項1に記載の本発明
の話者認識部における動作を説明する。まず、学習用の
音声から得た短時間スペクトルの概形を用いて、ニュー
ラルネットワークを学習する。この際に話者毎のクラス
タリングを行なうことによって学習用のデータ数を減ら
しておく。認識時は、任意の発声から上記と同じ短時間
スペクトルの概形を求め、その系列をネットワークに入
力し、ネットワーク出力の系列を得る。得られたネット
ワークの出力ベクトルは、それぞれが短時間の入力に対
する話者を示唆しており、これを系列全体で、和、積、
多数決等の総合的な判断を下すことによって、1つの認
識を得る。
The operation of the speaker recognition unit of the present invention as set forth in claim 1 will be described. First, the neural network is trained by using the outline of the short-time spectrum obtained from the training voice. At this time, the number of data for learning is reduced by performing clustering for each speaker. At the time of recognition, an outline of the same short-time spectrum as described above is obtained from an arbitrary utterance, the sequence is input to the network, and a sequence of network output is obtained. The output vector of the obtained network suggests the speaker for each input for a short time.
One recognition is obtained by making a comprehensive judgment such as a majority vote.

【0008】請求項2に記載の本発明の話者認識部にお
ける動作を説明する。まず、学習用の音声から得た短時
間スペクトルの概形を用いて、ニューラルネットワーク
を学習する。この際に話者毎のクラスタリングを行なう
ことによって学習用データ数を減らしておく。認識時
は、任意の発声から上記と同じ短時間スペクトルの概形
を求め、その系列をネットワークに入力し、ネットワー
ク出力の系列を得る。得られたネットワークの出力ベク
トルは、それぞれが短時間の入力に対する話者を示唆し
ているが、出力ベクトル選択用しきい値を設けて、この
中で信頼性の高い出力ベクトルのみを選択し、これらす
べてについて、和、積、多数決等の総合的な判断を下す
ことによって、1つの認識結果を得る。
The operation of the speaker recognition section of the present invention according to claim 2 will be described. First, the neural network is trained by using the outline of the short-time spectrum obtained from the training voice. At this time, the number of learning data is reduced by performing clustering for each speaker. At the time of recognition, an outline of the same short-time spectrum as described above is obtained from an arbitrary utterance, the sequence is input to the network, and a sequence of network output is obtained. The output vector of the obtained network suggests a speaker for each input for a short time, but a threshold for selecting an output vector is provided, and only a reliable output vector is selected among them. One recognition result is obtained by making a comprehensive judgment such as a sum, a product, or a majority decision for all of these.

【0009】然るに、本発明における「ニューラルネッ
トワーク」について説明すれば、下記(1) 〜(4) の如く
である。
However, the description of the "neural network" in the present invention is as follows (1) to (4).

【0010】(1)ニューラルネットワークは、その構造
から、図3(A)に示す階層的ネットワークと図3
(B)に示す相互結合ネットワークの2種に大別でき
る。本発明は、両ネットワークのいずれを用いて構成す
るものであっても良いが、階層的ネットワークは後述す
る如くの簡単な学習アルゴリズムが確立されているため
より有用である。
(1) From the structure of the neural network, the neural network and the hierarchical network shown in FIG.
It can be roughly classified into two types of mutual connection networks shown in (B). The present invention may be configured by using either of both networks, but the hierarchical network is more useful because a simple learning algorithm as described later has been established.

【0011】(2)ネットワークの構造 階層的ネットワークは、図4に示す如く、入力層、中間
層、出力層からなる階層構造をとる。各層は1以上のユ
ニットから構成される。結合は、入力層→中間層→出力
層という前向きの結合だけで、各層内での結合はない。
(2) Network Structure As shown in FIG. 4, the hierarchical network has a hierarchical structure including an input layer, an intermediate layer, and an output layer. Each layer is composed of one or more units. The coupling is only forward coupling such as input layer → middle layer → output layer, and there is no coupling in each layer.

【0012】(3)ユニットの構造 ユニットは図5に示す如く脳のニューロンのモデル化で
あり構造は簡単である。他のユニットから入力を受け、
その総和をとり一定の規則(変換関数)で変換し、結果
を出力する。他のユニットとの結合には、それぞれ結合
の強さを表わす可変の重みを付ける。
(3) Unit structure The unit is a model of a brain neuron as shown in FIG. 5, and the structure is simple. Receive input from other units,
The sum is taken and converted according to a certain rule (conversion function), and the result is output. A variable weight, which represents the strength of the bond, is attached to each of the bonds with other units.

【0013】(4)学習(バックプロパゲーション) ネットワークの学習とは、実際の出力を目標値(望まし
い出力)に近づけることであり、一般的には図5に示し
た各ユニットの変換関数及び重みを変化させて学習を行
なう。
(4) Learning (Back Propagation) Learning a network is to bring an actual output close to a target value (desired output). Generally, the conversion function and weight of each unit shown in FIG. Is learned by changing.

【0014】また、学習のアルゴリズムとしては、例え
ば、Rumelhart, D.E.,McClelland,J.L. and the PDP Re
search Group, PARALLEL DISTRIBUTED PROCESSING, the
MIT Press, 1986.に記載されているバックプロパゲー
ションを用いることができる。
As a learning algorithm, for example, Rumelhart, DE, McClelland, JL and the PDP Re
search Group, PARALLEL DISTRIBUTED PROCESSING, the
Backpropagation described in MIT Press, 1986. can be used.

【0015】[0015]

【作用】請求項1に記載の話者認識方式においては、 発声内容を限定しない話者認識技術を用いることによ
り、発呼者に特定の言葉を発声してもらう必要がなくな
り、発呼者認識電話装置の使い勝手が良くなった。ま
た、どんな言葉が入力されても対応できるようになっ
た。
In the speaker recognition method according to claim 1, by using the speaker recognition technology that does not limit the content of the utterance, it is not necessary for the caller to utter a specific word, and the caller recognition is performed. The usability of the telephone device has improved. In addition, it is now possible to respond to any words entered.

【0016】クラスタリングにより複数のデータの代
表ベクトルを学習データとしているので、学習効果を保
ちつつ学習データ数を削減できる。その結果、ニューラ
ルネットワークの学習時間が大幅に短縮できる。
Since the representative vector of a plurality of data is used as the learning data by clustering, it is possible to reduce the number of learning data while maintaining the learning effect. As a result, the learning time of the neural network can be greatly reduced.

【0017】更に、請求項2に記載の話者認識方式にお
いては、 出力ベクトルの中で信頼性の高いものを選択すること
により、総合的な判断がより確実になり、認識率が向上
する。
Furthermore, in the speaker recognition method according to the second aspect, by selecting a highly reliable output vector from among the output vectors, comprehensive judgment becomes more reliable and the recognition rate is improved.

【0018】[0018]

【実施例】図1は発呼者認識電話装置の一実施例を示す
ブロック図、図2は話者判定用しきい値とネットワーク
の出力値とを示す模式図、図3はニューラルネットワー
クを示す模式図、図4は階層的なニューラルネットワー
クを示す模式図、図5はユニットの構造を示す模式図で
ある。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram showing an embodiment of a calling party recognition telephone device, FIG. 2 is a schematic diagram showing a threshold value for speaker determination and an output value of a network, and FIG. 3 is a neural network. FIG. 4 is a schematic diagram showing a hierarchical neural network, and FIG. 5 is a schematic diagram showing the structure of a unit.

【0019】発呼者認識電話装置10は、発呼者が予め
登録してある話者かを認識し、登録話者に対してのみ電
話基本回路11により応答可能とするものである。この
とき、電話装置10は、図1に示す如く、着信に対して
自動応答する自動応答部12と、自動応答部12に対し
て返答した発呼者の音声から話者認識する話者認識部1
3と、話者認識部13の認識結果により電話基本回路1
1を制御する応答制御部14とを有する。1Aは相手電
話装置である。
The caller recognition telephone device 10 recognizes whether the caller is a pre-registered speaker and enables the telephone basic circuit 11 to respond only to the registered speaker. At this time, as shown in FIG. 1, the telephone device 10 includes an automatic response unit 12 that automatically responds to an incoming call, and a speaker recognition unit that recognizes a speaker from the voice of the caller who responds to the automatic response unit 12. 1
3 and the recognition result of the speaker recognition unit 13, the telephone basic circuit 1
1 and a response control unit 14 for controlling 1). 1A is a partner telephone device.

【0020】然るに、発呼者認識電話装置10の使用イ
メージを示せば、表1、表2の如くである。表1は登録
者の音声を学習する場合の使用イメージ、表2は電話が
かかってきた場合の使用イメージである。
However, the usage images of the caller identification telephone device 10 are shown in Tables 1 and 2. Table 1 is a usage image when learning the voice of the registrant, and Table 2 is a usage image when a call is received.

【0021】[0021]

【表1】 [Table 1]

【0022】[0022]

【表2】 [Table 2]

【0023】以下、話者認識部13による話者認識方式
について説明する。 登録者 5名・非登録者25名について、学習用の文章
を、サンプリング周波数10kHz 、フレーム長 25.6msec
、フレーム周期 12.8msec でフーリエ分析し、100〜50
00 Hz の帯域で68ch(1/12 Oct.) のパワーベクトルの系
列を得る。
The speaker recognition system by the speaker recognition unit 13 will be described below. Learning text for 5 registrants and 25 non-registrants, sampling frequency 10 kHz, frame length 25.6 msec
, Fourier analysis with a frame period of 12.8 msec, 100 to 50
Obtain a sequence of 68ch (1/12 Oct.) power vectors in the 00 Hz band.

【0024】これらのパワーベクトルから、階層的ク
ラスタリングを行なうことによって、話者毎に 200程度
の代表ベクトルを得る。
Hierarchical clustering is performed from these power vectors to obtain about 200 representative vectors for each speaker.

【0025】これらの代表ベクトルをニューラルネッ
トワークの入力とし(入力層68ユニット、入力パターン
は話者数×クラスタリング後の代表ベクトル数だけ得ら
れる)、登録者の場合のみ対応する出力ユニットが活性
化するように十分学習する。
These representative vectors are used as the input of the neural network (input layer 68 units, the input pattern is obtained by the number of speakers × the number of representative vectors after clustering), and the corresponding output unit is activated only in the case of the registrant. To learn enough.

【0026】任意の発声に対して、と同様にパワー
ベクトルの系列を得る。 これを、で学習したネットワークに入力し、出力ベ
クトルの系列 {x1 ,x2 ,…xn } xt =(xt 1 ,…,xt 5 ) n=フレーム数 を得る。
A sequence of power vectors is obtained in the same manner as for any utterance. This is input to the network learned by, and the sequence of output vectors {x 1 , x 2 , ... X n } x t = (x t 1 , ..., x t 5 ) n = the number of frames is obtained.

【0027】上記のベクトル系列に対し以下の3手
法を用いて、入力が登録者・非登録者いずれのものであ
るかを判断する。
The following three methods are used for the above vector series to determine whether the input is a registered person or a non-registered person.

【0028】(1) Σtt s(s= 1〜5 )の最大値が、
予め設定した話者判定用しきい値を越えていれば登録
者、そうでなければ非登録者
(1) The maximum value of Σ t x t s (s = 1 to 5) is
Registered person if it exceeds the preset threshold for speaker determination, otherwise non-registered person

【0029】(2) Πtt s(s= 1〜5 )の最大値が、
予め設定した話者判定用しきい値を越えていれば登録
者、そうでなければ非登録者
(2) The maximum value of Π t x t s (s = 1 to 5) is
Registered person if it exceeds the preset threshold for speaker determination, otherwise non-registered person

【0030】(3)max{xt 1 ,…,xt 5}=xt s(s=
1〜 5)の数の最大値が、予め設定した話者判定用しき
い値を越えていれば登録者、そうでなければ非登録者
(3) max {x t 1 , ..., X t 5 } = x t s (s =
If the maximum number of 1 to 5) exceeds the preset threshold for speaker determination, it is a registered person, otherwise it is a non-registered person.

【0031】また、上記の3手法の代わりに以下の手法
を用いても良い。 (1) Σtt s(s= 1〜5 )の最大値のみが、予め設定
した第1の話者判定用しきい値θ1 を越え、かつ、その
他の値が予め設定した第2の話者判定用しきい値θ2
下回っていれば登録者、そうでなければ非登録者
The following methods may be used instead of the above three methods. (1) Only the maximum value of Σ t x t s (s = 1 to 5) exceeds the preset first speaker determination threshold θ 1 and the other values are preset to the second value. If it is below the speaker judgment threshold θ 2 of , it is a registered person, otherwise it is a non-registered person.

【0032】(2) Πtt s(s= 1〜5 )の最大値のみ
が、予め設定した第1の話者判定用しきい値θ1 を越
え、かつ、その他の値が予め設定した第2の話者判定用
しきい値θ2 を下回っていれば登録者、そうでなければ
非登録者
(2) Only the maximum value of Π t x t s (s = 1 to 5) exceeds the preset first speaker determination threshold value θ 1 , and other values are preset. If it is below the second speaker judgment threshold value θ 2 , the registered person; otherwise, the non-registered person

【0033】(3) max {xt 1 ,…,xt 5}=xt s(s
= 1〜 5)の数の最大値が、予め設定した第1の話者判
定用しきい値θ1 を越え、かつ、その他の値が予め設定
した第2の話者判定用しきい値θ2 を下回っていれば登
録者、そうでなければ非登録者
(3) max {x t 1 , ..., X t 5 } = x t s (s
= 1 to 5) exceeds the first threshold value θ 1 for speaker determination set in advance and the other values have second threshold value θ 2 for speaker determination set in advance. Registered if below 2 , otherwise non-registered

【0034】任意発声の一例として、学習用短文「明日
は東京に出ますのですみませんが留守にします。」に対
して、「ただいま」「こんにちは」「おはようございま
す」の3単語を用いて話者認識実験を行なったところ、
学習に用いた登録者 5名および学習に用いていない非登
録者26名を完全に認識できた。
[0034] As an example of any utterance, learning short "Tomorrow will be the absence is I'm sorry because I get to Tokyo." For, "I'm home", "Hello" speaker by using the three-word of "good morning" When I did a recognition experiment,
We were able to fully recognize the 5 registered people who were used for learning and 26 non-registered people who were not used for learning.

【0035】[0035]

【発明の効果】以上のように本発明によれば、発呼者認
識電話装置において、話者認識する際、対象とする音声
を、予め学習した発声内容に限定する必要がないものと
することができる。
As described above, according to the present invention, in the caller recognition telephone device, when the speaker is recognized, it is not necessary to limit the target voice to the previously learned voice content. You can

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は発呼者認識電話装置の一実施例を示すブ
ロック図である。
FIG. 1 is a block diagram showing an embodiment of a caller identification telephone device.

【図2】図2は話者判定用しきい値とネットワークの出
力値とを示す模式図である。
FIG. 2 is a schematic diagram showing a speaker determination threshold value and a network output value.

【図3】図3はニューラルネットワークを示す模式図で
ある。
FIG. 3 is a schematic diagram showing a neural network.

【図4】図4は階層的なニューラルネットワークを示す
模式図である。
FIG. 4 is a schematic diagram showing a hierarchical neural network.

【図5】図5はユニットの構造を示す模式図である。FIG. 5 is a schematic diagram showing a structure of a unit.

【符号の説明】[Explanation of symbols]

10 発呼者認識電話装置 11 電話基本回路 12 自動応答部 13 話者認識部 14 応答制御部 10 Caller Recognition Telephone Device 11 Telephone Basic Circuit 12 Automatic Response Unit 13 Speaker Recognition Unit 14 Response Control Unit

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 H04M 3/42 P ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 5 Identification code Office reference number FI technical display location H04M 3/42 P

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 発呼者が予め登録してある話者かを認識
し、登録話者に対してのみ電話基本回路により応答可能
とする発呼者認識電話装置において、 着信に対して自動応答する自動応答部と、該自動応答部
に対して返答した発呼者の音声から話者認識する話者認
識部と、該話者認識部の認識結果により電話基本回路を
制御する応答制御部とを有し、 上記話者認識部は、ニューラルネットワークを用いて話
者認識する際、短時間スペクトルの概形を表すベクトル
の系列を入力し、ネットワーク出力の系列を、個々の出
力による認識結果の和、積、多数決等により総合して1
つの認識結果を得るものであって、ネットワークの学習
用データ数をクラスタリングにより削減することを特徴
とする発呼者認識電話装置。
1. A caller recognition telephone device which recognizes whether a caller is a pre-registered speaker and can respond only to a registered speaker by a telephone basic circuit. An automatic response unit, a speaker recognition unit for recognizing a speaker from the voice of a caller who replies to the automatic response unit, and a response control unit for controlling the telephone basic circuit based on the recognition result of the speaker recognition unit. The speaker recognizing unit inputs a series of vectors representing the outline of a short-time spectrum when recognizing a speaker using a neural network, and outputs a network output series of recognition results by individual outputs. 1 based on sum, product, majority vote, etc.
A caller-recognition telephone device for obtaining one recognition result, wherein the number of learning data of the network is reduced by clustering.
【請求項2】 発呼者が予め登録してある話者かを認識
し、登録話者に対してのみ電話基本回路により応答可能
とする発呼者認識電話装置において、 着信に対して自動応答する自動応答部と、該自動応答部
に対して返答した発呼者の音声から話者認識する話者認
識部と、該話者認識部の認識結果により電話基本回路を
制御する応答制御部とを有し、 上記話者認識部は、ニューラルネットワークを用いて話
者認識する際、短時間スペクトルの概形を表すベクトル
の系列を入力し、ネットワーク出力の系列から出力ベク
トル選択用しきい値を用いて選択した出力ベクトルにつ
いて、個々の出力による認識結果の和、積、多数決等に
より総合して1つの認識結果を得るものであって、ネッ
トワークの学習用データ数をクラスタリングにより削減
することを特徴とする発呼者認識電話装置。
2. A caller recognition telephone device which recognizes whether a caller is a pre-registered speaker and can respond to the registered speaker only by a telephone basic circuit. An automatic response unit, a speaker recognition unit for recognizing a speaker from the voice of the caller who replies to the automatic response unit, and a response control unit for controlling the telephone basic circuit according to the recognition result of the speaker recognition unit. The speaker recognition unit, when recognizing a speaker using a neural network, inputs a series of vectors representing the outline of a short-time spectrum, and sets a threshold for output vector selection from a series of network outputs. With respect to the output vector selected by using, a single recognition result is obtained by summing, multiplying, majority voting, etc. of recognition results by individual outputs, and the number of learning data of the network is reduced by clustering. Caller recognition telephone apparatus according to claim the door.
JP4117384A 1992-05-11 1992-05-11 Caller recognition telephone set Pending JPH05316198A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4117384A JPH05316198A (en) 1992-05-11 1992-05-11 Caller recognition telephone set

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4117384A JPH05316198A (en) 1992-05-11 1992-05-11 Caller recognition telephone set

Publications (1)

Publication Number Publication Date
JPH05316198A true JPH05316198A (en) 1993-11-26

Family

ID=14710320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4117384A Pending JPH05316198A (en) 1992-05-11 1992-05-11 Caller recognition telephone set

Country Status (1)

Country Link
JP (1) JPH05316198A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005117398A1 (en) * 2004-05-28 2005-12-08 Toshiba Tec Kabushiki Kaisha Telephone and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005117398A1 (en) * 2004-05-28 2005-12-08 Toshiba Tec Kabushiki Kaisha Telephone and program

Similar Documents

Publication Publication Date Title
CN110300001B (en) Conference audio control method, system, device and computer readable storage medium
CA2082942C (en) Simultaneous speaker-independent voice recognition and verification over a telephone network
US5917891A (en) Voice-dialing system using adaptive model of calling behavior
US5303299A (en) Method for continuous recognition of alphanumeric strings spoken over a telephone network
US8676572B2 (en) Computer-implemented system and method for enhancing audio to individuals participating in a conversation
CN109509471A (en) A method of the dialogue of intelligent sound robot is interrupted based on vad algorithm
US20050226398A1 (en) Closed Captioned Telephone and Computer System
EP0929962A1 (en) Voice-dialing system using model of calling behavior
WO2007142533A1 (en) Method and apparatus for video conferencing having dynamic layout based on keyword detection
WO2018100391A1 (en) Speaker identification
US20030110034A1 (en) Method for the voice-operated identification of the user of a telecommunication line in a telecommunications network during an interactive communication using a voice-operated conversational system
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JP2000349865A (en) Voice communication apparatus
JPH05316198A (en) Caller recognition telephone set
JPH05316197A (en) Caller recognition telephone set
JPH05316203A (en) Caller recognizing telephone device
JPH05316196A (en) Caller recognition telephone set
JP3363660B2 (en) Voice recognition method and voice recognition device
JPH06152728A (en) Answer message switching speech equipment
JPH06152727A (en) Answer message switching speech equipment
JPH06152726A (en) Answer message switching speech equipment
JP3829485B2 (en) Voice call device, voice call system, and voice call method
JPH06152725A (en) Answer message switching speech equipment
CN112309183A (en) Interactive listening and speaking exercise system suitable for foreign language teaching
EP1096474A2 (en) Speaker verification system and method