JPH05347664A - Voice dial recognition method - Google Patents

Voice dial recognition method

Info

Publication number
JPH05347664A
JPH05347664A JP15494092A JP15494092A JPH05347664A JP H05347664 A JPH05347664 A JP H05347664A JP 15494092 A JP15494092 A JP 15494092A JP 15494092 A JP15494092 A JP 15494092A JP H05347664 A JPH05347664 A JP H05347664A
Authority
JP
Japan
Prior art keywords
voice
voice information
terminal
registered
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP15494092A
Other languages
Japanese (ja)
Inventor
Yoshio Kuboyama
嘉男 久保山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP15494092A priority Critical patent/JPH05347664A/en
Publication of JPH05347664A publication Critical patent/JPH05347664A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To obtain a voice dial recognition method in which a communication a opposite terminal equipment is designated with high accuracy with simple configuration based on voice information of a language used usually. CONSTITUTION:For example, voice information for identifying a communication opposite terminal equipment and a terminal equipment number corresponding one by one to the voice information are stored respectively in a voice information registration memory 5 and a terminal number registration memory 7 respectively in advance in a voice terminal equipment accommodated into an exchange network. Then the voice information entered from a voice input section 1 and the voice information stored in advance are compared and discriminated by a voice information discrimination circuit 10 at dialing and a terminal equipment number corresponding to the registered voice information best coincident is sent to an exchange.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、電話等の音声端末を収
容する交換網で使用される着信相手指定するためのダイ
ヤルを音声情報により入力し、それをもとに通信相手を
判別する音声ダイヤル認識方法に関し、特に簡易な構成
で誤ダイヤルを起こしにくい音声ダイヤル認識方法に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice for inputting a dial for designating a called party, which is used in a switching network accommodating a voice terminal such as a telephone, by voice information, and for discriminating a communication partner based on the dialed information. The present invention relates to a dial recognition method, and more particularly, to a voice dial recognition method with a simple structure that is less likely to cause erroneous dialing.

【0002】[0002]

【従来の技術】従来の音声ダイヤル方式では、操作者が
通信相手端末番号を数字の音声情報として入力し、これ
を音声端末や交換機で認識し、数字に変換していたた
め、「イチ」や「ニ」といった極めて短い発音の連続の
各々がどの数字であるかを認識する必要があり、高度な
音声認識技術を必要とし、高価になるという欠点があ
り、かつ認識誤りが発生し易かった。また、音声であっ
ても、機械的な相手端末の番号を入力する必要があり、
日常使用されている言葉と異なる点があった。例えば、
「山田部長」に電話をかけるのに、「山田部長の番号は
1234番だから」と頭の中で、またはメモを見なが
ら、一度番号に変換してから、「イチ、ニ、サン、ヨ
ン」と発音する必要があった。図2は、従来の音声ダイ
ヤル方式で用いられる単語音声認識部の構成を示す図で
ある。図2において、21は入力音声のスペクトル分析
部、22は音素標準パターン部、23は入力音声と音素
標準パターンとの類似度を計算する音素類似度計算部、
24は計算結果を音素毎に時系列に蓄積する類似度行列
部、25は音素列として蓄積されている単語辞書部、2
6は類似度行列と単語辞書の一致度を計算する単語マッ
チング部、27は入力音声が最終的にどの単語であるか
を判定する単語判定部である。まず、入力された音声は
スペクトル分析部21で一定の短い時間区間(15m
秒)毎にスペクトル分析され、母音、子音等の音素毎に
蓄積された標準スペクトル群(約40種)の各々との類
似度が計算され、その結果が時間区間毎に順次、類似度
行列部24に蓄積される。そして、入力音声の休止等に
より単語の区切りを判定すると、次に、音素群を時系列
に並べて構成した単語群と類似度行列の一致度を計算す
る。この際、発声者毎の単語発音時間長の違いはダイナ
ミックプログラミング(DP)マッチング法により時間
の長さを単語辞書の長さに合わせて計算する。さらに、
単語マッチング部26で単語辞書の各単語との一致度を
計算し、その出力が最もよい一致度を示す単語を入力さ
れた単語であると単語判定部27で判定する。すなわ
ち、従来方式によれば、入力された音声単語を標準パタ
ーンの音素群と比較して判定するため、発声者による発
音の個人差の吸収が困難で誤判定し易く、また、単語辞
書に記録された範囲の単語しか使用できない。また、単
語数を多くすれば、入力音声と辞書内の全ての単語との
一致計算をするため、膨大なハードウェア量を必要とす
るか、あるいは計算時間が膨大になる。さらに、音素類
似度計算や単語一致度計算は厳密に行なう程、認識率が
向上するため、認識率を100%近くにするには、高度
な計算回路が必要で膨大なハードウェア量を要する。な
お、この種の方法については、例えば、「ディジタル音
声処理、古井 貞煕著、東海大学出版会(1985
年)」に記載されている。
2. Description of the Related Art In the conventional voice dial system, an operator inputs a communication partner terminal number as numeric voice information, which is recognized by a voice terminal or an exchange and converted into a number. It is necessary to recognize which number each of a series of extremely short pronunciations, such as "d", requires advanced voice recognition technology, has the drawback of being expensive, and is prone to recognition error. Also, even with voice, it is necessary to enter the number of the mechanical partner terminal,
There were differences from the words used in everyday life. For example,
When calling "Manager Yamada", "I have Yamada's number is 1234." In mind or while looking at the memo, convert it to a number and then "Ichi, Ni, San, Yong" I had to pronounce it. FIG. 2 is a diagram showing a configuration of a word voice recognition unit used in a conventional voice dialing method. In FIG. 2, 21 is a spectrum analysis unit of the input voice, 22 is a phoneme standard pattern unit, 23 is a phoneme similarity calculation unit that calculates the similarity between the input voice and the phoneme standard pattern,
Reference numeral 24 is a similarity matrix section that accumulates the calculation results in time series for each phoneme, 25 is a word dictionary section that is accumulated as a phoneme sequence, and 2
Reference numeral 6 is a word matching unit that calculates the degree of coincidence between the similarity matrix and the word dictionary, and 27 is a word determination unit that determines which word the input voice is finally in. First, the input voice is analyzed by the spectrum analysis unit 21 for a certain short time period (15 m).
Every second), the spectrum is analyzed, and the similarity with each of the standard spectrum groups (about 40 kinds) accumulated for each phoneme such as vowels and consonants is calculated, and the result is sequentially calculated for each time interval in the similarity matrix section. Stored in 24. Then, when the word break is determined by the pause of the input voice or the like, next, the degree of coincidence between the word group formed by arranging the phoneme groups in time series and the similarity matrix is calculated. At this time, the difference in word pronunciation time length for each speaker is calculated according to the length of the word dictionary by the dynamic programming (DP) matching method. further,
The word matching unit 26 calculates the degree of matching with each word in the word dictionary, and the word determining unit 27 determines that the word whose output shows the best matching degree is the input word. That is, according to the conventional method, since the input voice word is compared with the phoneme group of the standard pattern for determination, it is difficult to absorb the individual difference in pronunciation by the speaker, and it is easy to make an erroneous determination. Only the words in the specified range can be used. Further, if the number of words is increased, the calculation of matching between the input voice and all the words in the dictionary requires a huge amount of hardware, or the calculation time becomes huge. Further, the more rigorously the phoneme similarity calculation and the word coincidence calculation are, the higher the recognition rate is. Therefore, in order to bring the recognition rate close to 100%, an advanced calculation circuit is required and a huge amount of hardware is required. Note that this type of method is described in, for example, "Digital Speech Processing, Sadahiro Furui, Tokai University Press (1985).
Year)) ”.

【0003】[0003]

【発明が解決しようとする課題】上記従来技術では、
(1)極めて短い発音の連続の各々がどの数字であるか
を認識する必要があり、認識装置が高価になる、(2)
音声であっても、機械的な相手端末番号を入力する必要
があり、日常使用される言葉と異なる、等の問題があっ
た。本発明の目的は、このような問題点を改善し、簡易
な構成で、日常使用している言葉の音声情報により、通
信相手端末を精度よく指定できる音声ダイヤル認識方法
を提供することにある。
In the above prior art,
(1) It is necessary to recognize which number is in each sequence of extremely short pronunciations, which makes the recognition device expensive (2)
Even with voice, there is a problem that it is necessary to input a mechanical partner terminal number, which is different from the words used in daily life. An object of the present invention is to improve such problems and provide a voice dial recognition method with a simple configuration, which can accurately specify a communication partner terminal based on voice information of words used in daily life.

【0004】[0004]

【課題を解決するための手段】上記目的を達成するた
め、本発明の音声ダイヤル認識方法は、音声端末または
交換機に、予め、通常よく通信する相手の端末番号とと
もに音声情報を登録、蓄積しておき、発呼時の入力音声
情報と比較して、最もよく一致した登録音声情報に対応
する端末番号を通信相手の端末番号とすることに特徴が
ある。
In order to achieve the above object, the voice dial recognition method of the present invention is such that voice information is registered and stored in advance in a voice terminal or an exchange together with a terminal number of a party with whom communication is normally performed. Every other time, as compared with the input voice information at the time of making a call, the terminal number corresponding to the registered voice information that best matches is used as the terminal number of the communication partner.

【0005】[0005]

【作用】本発明においては、音声情報の意味自体を認識
する必要はなく、同一の音声入力部を用いた登録時の音
声情報と発呼時の入力音声情報とを、各々音声情報全体
のまとまりとして比較し、一致の程度をみればよく、か
つ通常良く通信する相手は高々数十人程度であるため、
誤ダイヤルを極めて少なくでき、また、登録音声情報群
の中から入力音声情報との一致を検出する手段は、簡易
かつ安価な回路で容易に実現できる。このため、複雑な
構成の音声認識装置等を必要とせず、かつ日常使用して
いる多様な言葉をそのまま使用し、簡易かつ安価な構成
で誤ダイヤルの少ない音声ダイヤル認識方法を提供でき
る。
In the present invention, it is not necessary to recognize the meaning itself of the voice information, and the voice information at the time of registration and the voice information at the time of making a call using the same voice input unit are respectively collected as a whole voice information. Therefore, it is only necessary to check the degree of agreement, and the number of people with whom communication is normally good is at most several dozens.
Erroneous dialing can be extremely reduced, and the means for detecting a match with the input voice information from the registered voice information group can be easily realized by a simple and inexpensive circuit. Therefore, it is possible to provide a voice dial recognition method that does not require a voice recognition device having a complicated configuration, uses a variety of words that are used everyday, and has a simple and inexpensive configuration with less erroneous dialing.

【0006】[0006]

【実施例】以下、本発明の一実施例を図面により説明す
る。 <第1の実施例>図1は、本発明の第1の実施例におけ
る音声端末の概略を示す構成図である。図1において、
1はマイクロホン等の音声入力部、2は通常の電話機等
で使用されているダイヤルボタン、3はアナログ音声情
報の特徴を抽出してディジタル化するためのコーダ、4
−1〜4−5は情報の登録、確認、変更等に使用する機
能スイッチ、5は音声情報群を登録、蓄積しておく音声
情報登録メモリ、6は音声情報登録メモリ内の各々のフ
ィールドに音声情報が登録されているか否かを管理する
管理メモリ、7は登録音声情報と1対1に対応する端末
番号を登録、蓄積しておく端末番号登録メモリ、8は音
声情報の登録および音声情報の呼び出しに使用するアド
レスカウンタ、9は発呼時の入力音声の一次的なバッフ
ァ、10は発呼時の入力音声情報と登録された音声情報
との一致を判定する音声情報判定回路、11は音声情報
判定回路10の一致/不一致の出力と管理メモリ6の読
み出し出力からアドレスカウンタ8を制御するアドレス
制御回路、12はアドレス制御回路11からの制御によ
りアドレスカウンタ8の出力を端末番号登録メモリ7の
アドレスとして入力させるゲート回路、13は音声情報
登録メモリ6への書き込みデータバッファ、14は音声
情報登録メモリ6からの読み出しデータバッファ、15
は端末番号登録メモリ7への書き込みデータのバッフ
ァ、16は端末番号登録メモリ7からの読み出しデータ
のバッファ、17は端末番号登録メモリ7の読み出し出
力を表示する表示回路、31〜35は音声情報線、36
は音声情報登録メモリ6から呼び出された登録音声情報
線、41〜43はダイヤルボタン2のダイヤル情報線、
44は端末番号登録メモリ7から呼び出された端末番号
情報線、45は通信相手端末番号を送出するための相手
端末番号情報線、51はアドレスカウンタ8の出力であ
るアドレス線、52はアドレスカウンタ8の出力で管理
メモリ6のアドレス線、53は入力音声情報線35と登
録音声情報線36の内容が一致した時に端末番号を呼び
出すための端末番号登録メモリ7のアドレス線、61は
音声情報判定回路10の出力で一致が検出された時に出
力する信号線、62はアドレス制御回路11の出力で、
音声情報判定回路10で一致が検出された時に出力する
信号線、63はアドレス制御回路12の出力でアドレス
カウンタ8を制御するための信号線である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. <First Embodiment> FIG. 1 is a block diagram showing the outline of a voice terminal according to a first embodiment of the present invention. In FIG.
Reference numeral 1 is a voice input unit such as a microphone, 2 is a dial button used in an ordinary telephone or the like, 3 is a coder for extracting the characteristics of analog voice information and digitizing it, 4
-1 to 4-5 are function switches used for registration, confirmation and change of information, 5 is a voice information registration memory for registering and accumulating voice information groups, and 6 is a field in the voice information registration memory. A management memory for managing whether or not voice information is registered, 7 is a terminal number registration memory for registering and storing registered voice information and a terminal number corresponding to one to one, and 8 is registration of voice information and voice information. An address counter used for calling the call, 9 is a temporary buffer of the input voice at the time of calling, 10 is a voice information determination circuit for determining whether the input voice information at the time of calling matches the registered voice information, and 11 is An address control circuit for controlling the address counter 8 based on the coincidence / non-coincidence output of the voice information judging circuit 10 and the read output of the management memory 6, and 12 is an address counter under the control of the address control circuit 11. Gate circuit for inputting the output of 8 as the address of the terminal number registration memory 7, 13 write data buffer to the audio information registration memory 6, 14 read data buffer from the speech information registration memory 6, 15
Is a buffer for writing data to the terminal number registration memory 7, 16 is a buffer for reading data from the terminal number registration memory 7, 17 is a display circuit for displaying the read output of the terminal number registration memory 7, and 31 to 35 are audio information lines. , 36
Is a registered voice information line called from the voice information registration memory 6, 41 to 43 are dial information lines of the dial buttons 2,
44 is a terminal number information line called from the terminal number registration memory 7, 45 is a partner terminal number information line for transmitting the communication partner terminal number, 51 is an address line output from the address counter 8, 52 is an address counter 8 Is output, the address line 53 of the management memory 6, 53 is the address line of the terminal number registration memory 7 for calling the terminal number when the contents of the input voice information line 35 and the registered voice information line 36 match, and 61 is the voice information determination circuit. A signal line output when a match is detected by the output of 10, and 62 is an output of the address control circuit 11,
Reference numeral 63 is a signal line output when the voice information judging circuit 10 detects a match, and 63 is a signal line for controlling the address counter 8 by the output of the address control circuit 12.

【0007】次に、本実施例の動作について述べる。ま
ず、登録時においては、操作者は、まず機能スイッチ4
−1を動作させて音声入力部1の出力線31を音声情報
登録メモリ6の書き込み線33側へ切り替える。次に、
操作者は、登録すべき音声情報を音声入力部1を用いて
入力する。このとき、音声情報は最初の音量が一定レベ
ルに達した時から一定の時間だけに区切る方法が考えら
れる。また、音声端末からのガイダンス指示によって登
録動作をより確実に行なう方法も可能である。こうして
入力された音声情報の蓄積データの形式はコーダ3で決
められるが、音声情報の特徴が分別できる形式であれ
ば、どのような形式でもよい。例えば、従来技術の例で
示したようなスペクトル分析をして、その結果をそのま
まディジタルデータとして蓄積してもよいし、単に、P
CMコーダ等でディジタル化して、そのまま蓄積しても
よい。本実施例の音声端末では、機能スイッチ4−1が
動作するとき、アドレスカウンタ8を動作させ、管理メ
モリ6を検索し、その内容が「0」のアドレスを検索し
ておき、入力された音声情報を音声情報メモリ5の当該
アドレスに書き込む。次に、機能スイッチ4−2を動作
させて、ダイヤルボタン2の出力線41を端末番号登録
メモリ7の書き込み線43側へ切り替え、登録すべき端
末番号をダイヤルボタン2を用いて入力し、アドレスカ
ウンタ8の出力で示される端末番号登録メモリ7のアド
レスに書き込む。次に、機能スイッチ4−5を「1」側
に動作させ、アドレスカウンタ8の出力で示される管理
メモリ6のアドレスに「1」を書き込む。また、発呼時
においては、機能スイッチ4−3,4−4を動作させ、
音声ダイヤル側に切り替える。これにより、操作者が発
声する音声は音声入力部1を経由し、音声情報線31,
32,34を通って、音声情報バッファ9へ入力され
る。一方、登録しておいた音声情報がメモリ5から呼び
出され、バッファ4を経由して音声情報判定回路10に
入力され、音声情報バッファ9の出力との一致が判定さ
れる。この判定方法は、DPマッチング法により両者の
時間の長さを合わせて、両者の一致度合を計算し、例え
ば、90%以上の一致があれば、一致したと判定する。
判定の結果、不一致の場合は、アドレス制御回路11の
制御によりアドレスカウンタ8が更新され、次の蓄積音
声情報が呼び出されて音声情報判定回路10へ入力され
る。操作者は既に音声ダイヤルとしてのまとまった音声
情報を発声し終わっているので、次の発声までに計算を
終了させる等の条件はなく、順次検索、計算により多少
時間がかかったとしても問題はなく、計算回路は少なく
て済む。また、一致した場合には、アドレス制御回路1
1からの制御でゲート12が開けられ、アドレスカウン
タ8の出力が端末番号登録メモリ7のアドレスとして入
力され、一致した音声情報に対応した端末番号が呼び出
され、相手端末番号情報線45を通じて交換機へ送出さ
れる。このとき、相手端末番号が表示回路17に表示さ
れる。
Next, the operation of this embodiment will be described. First, at the time of registration, the operator first sets the function switch 4
-1 is operated to switch the output line 31 of the voice input unit 1 to the write line 33 side of the voice information registration memory 6. next,
The operator uses the voice input unit 1 to input voice information to be registered. At this time, it is conceivable to divide the voice information into a certain time after the initial volume reaches a certain level. It is also possible to carry out the registration operation more reliably by the guidance instruction from the voice terminal. The format of the accumulated data of the voice information thus input is determined by the coder 3, but any format can be used as long as the features of the voice information can be distinguished. For example, the spectrum analysis as shown in the example of the prior art may be performed and the result may be directly stored as digital data.
It may be digitized by a CM coder or the like and stored as it is. In the voice terminal of the present embodiment, when the function switch 4-1 operates, the address counter 8 is operated, the management memory 6 is searched, and the address whose content is “0” is searched in advance, and the input voice is input. The information is written in the address of the voice information memory 5. Next, the function switch 4-2 is operated to switch the output line 41 of the dial button 2 to the writing line 43 side of the terminal number registration memory 7, and the terminal number to be registered is input using the dial button 2 to enter the address. Write to the address of the terminal number registration memory 7 indicated by the output of the counter 8. Next, the function switch 4-5 is operated to the "1" side, and "1" is written in the address of the management memory 6 indicated by the output of the address counter 8. When making a call, the function switches 4-3 and 4-4 are operated,
Switch to the voice dial side. As a result, the voice uttered by the operator passes through the voice input unit 1 and the voice information line 31,
It is input to the voice information buffer 9 through 32 and 34. On the other hand, the registered voice information is called from the memory 5, is input to the voice information determination circuit 10 via the buffer 4, and it is determined whether or not it matches the output of the voice information buffer 9. In this determination method, the DP matching method is used to match the lengths of time of both parties, and the degree of matching between the two is calculated.
If the result of determination is that they do not match, the address counter 8 is updated under the control of the address control circuit 11, and the next accumulated voice information is called and input to the voice information determination circuit 10. Since the operator has already uttered the complete voice information as a voice dial, there is no condition such as ending the calculation until the next utterance, and there is no problem even if it takes some time for sequential search and calculation. , The number of calculation circuits is small. If they match, the address control circuit 1
The gate 12 is opened by the control from 1, the output of the address counter 8 is input as the address of the terminal number registration memory 7, the terminal number corresponding to the matched voice information is called, and is sent to the exchange through the partner terminal number information line 45. Sent out. At this time, the partner terminal number is displayed on the display circuit 17.

【0008】また、本実施例では、上記の機能に付随し
て、次に示す動作が可能である。音声情報群登録メモリ
5の登録内容を確認するには、機能スイッチ4−3を動
作させ、登録音声情報と同様の音声を音声入力回路1か
ら入力する。これにより、音声情報登録メモリ5を検索
し、一致した音声情報に対応した端末番号が表示回路1
7に表示される。また、登録内容を変更するには、同様
に、機能スイッチ4−3を動作させ、登録音声情報と同
様の音声を音声入力回路1から入力することにより、音
声情報登録メモリ5を検索し、一致した音声情報に対応
した端末番号を表示回路17に表示し、さらに、機能ス
イッチ4−2を動作させ、ダイヤルボタン3から新しい
端末番号を入力する。さらに、登録を消去するには、機
能スイッチ4−3を動作させ、登録音声情報と同様の音
声を音声入力回路1から入力すると、音声情報登録メモ
リ5を検索し、一致を検出した音声情報登録メモリアド
レスに該当する管理メモリ6の内容を、機能スイッチ4
−5を「0」側に動作させて、「0」に書き替える。な
お、音声情報登録メモリエリアを全て検索しても、入力
音声情報が登録音声情報の何れとも一致しなかった場合
は、表示回路17に端末番号が表示されないことで判別
可能であるが、アナウンス等を出力してもよい。また、
機能スイッチ4−1〜4−5は、その機能を満足するも
のであれば、音声端末に取り付けられたダイヤルボタン
2や他の機能スイッチとの共用であってもよく、また、
操作者の押下等によるスイッチの切り替え動作だけでな
く、音声端末内に設けられた何らかの制御回路からの制
御による切り替えであってもよい。さらに、本実施例で
は、登録音声情報メモリ5、管理メモリ6、登録端末番
号メモリ7は別メモリであるが、同一メモリ内にフィー
ルドを分割して持ってもよい。また、これらのメモリ部
分をICメモリカードとし、本実施例の機能スイッチや
周辺回路部分を組み込んだICカード音声端末に挿入し
て、本実施例と同様の効果を得ることも可能である。
In addition, in the present embodiment, the following operation is possible in addition to the above functions. To confirm the registered contents of the voice information group registration memory 5, the function switch 4-3 is operated and the voice similar to the registered voice information is input from the voice input circuit 1. As a result, the voice information registration memory 5 is searched, and the terminal number corresponding to the matched voice information is displayed on the display circuit 1.
It is displayed on 7. Further, in order to change the registered contents, similarly, the function switch 4-3 is operated, and a voice similar to the registered voice information is input from the voice input circuit 1 to search the voice information registration memory 5 to find a match. The terminal number corresponding to the voice information is displayed on the display circuit 17, and the function switch 4-2 is operated to input a new terminal number from the dial button 3. Further, in order to delete the registration, the function switch 4-3 is operated, and when the same voice as the registered voice information is input from the voice input circuit 1, the voice information registration memory 5 is searched, and the voice information registration in which a match is detected is registered. The contents of the management memory 6 corresponding to the memory address are stored in the function switch 4
-5 is moved to the "0" side and rewritten to "0". Even if all the voice information registration memory areas are searched, if the input voice information does not match any of the registered voice information, it can be determined that the terminal number is not displayed on the display circuit 17, but an announcement etc. May be output. Also,
The function switches 4-1 to 4-5 may be shared with the dial button 2 attached to the voice terminal or other function switches as long as they satisfy the function.
Not only the switching operation of the switch by the pressing of the operator, but also the switching by the control from some control circuit provided in the voice terminal may be performed. Further, in this embodiment, the registered voice information memory 5, the management memory 6, and the registered terminal number memory 7 are separate memories, but the fields may be divided and held in the same memory. It is also possible to obtain the same effect as this embodiment by inserting these memory parts into an IC memory card and inserting them into an IC card voice terminal incorporating the function switch and peripheral circuit part of this embodiment.

【0009】<第2の実施例>図3は、本発明の第2の
実施例における交換機の概略を示す構成図である。本実
施例では、交換機のダイヤル受信トランクの一種として
音声ダイヤル受信トランクを設けた場合を示す。図3に
おいて、1は音声端末における音声入力回路、2はダイ
ヤルボタン、105は音声情報登録メモリ、106は管
理メモリ、107は端末番号登録メモリ、120は交換
機の通話路部、121は交換機の制御装置、122は音
声ダイヤル受信トランク、123は音声ダイヤル受信ト
ランク122の内部制御回路、124は音声情報とダイ
ヤル情報の流れを切り換えるためのスイッチ、125は
音声端末内で音声情報とダイヤル情報の流れを切り換え
るためのスイッチである。本実施例の音声ダイヤル受信
トランクの内部構成は、基本的には図1に示した音声端
末での回路と同様であるが、特に、機能スイッチを切り
替え制御する内部制御回路123と音声情報とダイヤル
情報の流れを切り換えるスイッチ124を追加し、交換
機からの制御によりスイッチ動作を可能としたことと、
複数の使用者のために、メモリを追加し、使用者ごとの
メモリフィールドが指定できるように制御装置121か
らアドレスカウンタ108の値を設定できるようにした
ことが、第1の実施例と異なる。このような構成によ
り、音声端末の操作者が、オフフック等によって交換機
へ要求があることを知らせると、交換機はダイヤル音を
返し、ダイヤルの入力を促す。ここで、音声ダイヤルの
発呼、登録、変更、削除等であることを知らせるため
に、ダイヤルボタン2から予め決められた特定の番号を
入力する。交換機では、ダイヤルを通常のダイヤル受信
トランクで受信し、制御装置121に報告すると、制御
装置121は通話路部120の通話路スイッチを音声ダ
イヤル受信トランク122へ切り換える。その後は、第
1の実施例と同様にして、音声情報と端末番号の登録や
音声情報による発呼を行なう。なお、上記実施例では、
音声ダイヤルへの用途について述べたが、同様の音声情
報認識方法を、音声より各種機器へ指示を出して動作さ
せる音声コマンドへ適用することも可能である。
<Second Embodiment> FIG. 3 is a block diagram showing the outline of an exchange according to a second embodiment of the present invention. In this embodiment, a voice dial receiving trunk is provided as a kind of dial receiving trunk of the exchange. In FIG. 3, 1 is a voice input circuit in a voice terminal, 2 is a dial button, 105 is a voice information registration memory, 106 is a management memory, 107 is a terminal number registration memory, 120 is a communication path section of an exchange, 121 is control of the exchange. A device, 122 is a voice dial receiving trunk, 123 is an internal control circuit of the voice dial receiving trunk 122, 124 is a switch for switching the flow of voice information and dial information, and 125 is a flow of voice information and dial information in the voice terminal. It is a switch for switching. The internal configuration of the voice dial receiving trunk of this embodiment is basically the same as the circuit in the voice terminal shown in FIG. 1, but in particular, the internal control circuit 123 for switching and controlling the function switches, voice information and dialing. A switch 124 for switching the flow of information is added, and the switch operation is enabled by the control of the exchange.
It differs from the first embodiment in that a memory is added for a plurality of users and the value of the address counter 108 can be set from the control device 121 so that a memory field for each user can be designated. With such a configuration, when the operator of the voice terminal informs the exchange of a request by off-hook or the like, the exchange returns a dial tone and prompts for dial input. Here, in order to inform that the voice dialing is a call, registration, change, deletion, etc., a predetermined specific number is input from the dial button 2. In the exchange, when the dial is received by the normal dial receiving trunk and reported to the control device 121, the control device 121 switches the call path switch of the call path unit 120 to the voice dial receiving trunk 122. After that, similarly to the first embodiment, the voice information and the terminal number are registered and the call is made by the voice information. In the above embodiment,
Although the application to the voice dial has been described, a similar voice information recognition method can be applied to a voice command to be operated by issuing an instruction to various devices from voice.

【0010】[0010]

【発明の効果】本発明によれば、予め登録しておいた音
声情報と発呼時の音声情報を比較・判定するので、音声
情報であれば何でもよく、任意の言葉が使用でき、さら
に、音量の意味自体を認識する必要がないので、高価な
音声認識装置は不要で、経済的に音声ダイヤルが実現で
きる。さらに、同一音声端末から入力された音声情報を
まとまりとして比較するので、一致が行ないやすく誤ダ
イヤルを起こしにくい。また、本発明を交換機で実施す
る場合でも、他の音声端末の使用者が同じ言葉の音声情
報を登録、使用しても発端末番号により判別すれば全く
混同しない等、多くの利点がある。
According to the present invention, since the voice information registered in advance and the voice information at the time of making a call are compared and judged, any voice information may be used, and arbitrary words can be used. Since it is not necessary to recognize the meaning of the volume itself, an expensive voice recognition device is unnecessary, and voice dialing can be realized economically. Furthermore, since the voice information input from the same voice terminal is compared as a group, it is easy to make a match and it is difficult to make an erroneous dial. Further, even when the present invention is carried out by the exchange, there are many advantages such that even if a user of another voice terminal registers and uses voice information of the same word, if it is discriminated by the calling terminal number, it will not be confused at all.

【0011】[0011]

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例における音声端末の概略
を示す構成図である。
FIG. 1 is a configuration diagram showing an outline of a voice terminal in a first embodiment of the present invention.

【図2】従来の音声ダイヤル方式で用いられる単語音声
認識部の構成を示す図である。
FIG. 2 is a diagram showing a configuration of a word voice recognition unit used in a conventional voice dial system.

【図3】本発明の第2の実施例における交換機の概略を
示す構成図である。
FIG. 3 is a configuration diagram showing an outline of an exchange in a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 音声入力部 2 ダイヤルボタン 3 コーダ 4−1 機能スイッチ 4−2 機能スイッチ 4−3 機能スイッチ 4−4 機能スイッチ 4−5 機能スイッチ 5 音声情報登録メモリ 6 管理メモリ 7 端末番号登録メモリ 8 アドレスカウンタ 9 バッファ 10 音声情報判定回路 11 アドレス制御回路 12 ゲート回路 13 書き込みデータバッファ 14 読み出しデータバッファ 15 バッファ 16 バッファ 17 表示回路 21 スペクトル分析部 22 音素標準パターン部 23 音素類似度計算部 24 類似度行列部 25 単語辞書部 26 単語マッチング部 27 単語判定部 31 音声情報線 32 音声情報線 33 音声情報線 34 音声情報線 35 音声情報線 36 登録音声情報線 41 ダイヤル情報線 42 ダイヤル情報線 43 ダイヤル情報線 44 端末番号情報線 45 相手端末番号情報線 51 アドレス線 52 アドレス線 53 アドレス線 61 信号線 62 信号線 63 信号線 103 コーダ 104−1 機能スイッチ 104−2 機能スイッチ 104−3 機能スイッチ 104−4 機能スイッチ 104−5 機能スイッチ 105 音声情報登録メモリ 106 管理メモリ 107 端末番号登録メモリ 108 アドレスカウンタ 109 バッファ 110 音声情報判定回路 111 アドレス制御回路 112 ゲート回路 113 書き込みデータバッファ 114 読み出しデータバッファ 115 バッファ 116 バッファ 120 通話路部 121 制御装置 122 音声ダイヤル受信トランク 123 内部制御装置 124 スイッチ 125 スイッチ 131 音声情報線 132 音声情報線 133 音声情報線 134 音声情報線 135 音声情報線 136 登録音声情報線 141 ダイヤル情報線 142 ダイヤル情報線 143 ダイヤル情報線 144 端末番号情報線 145 相手端末番号情報線 151 アドレス線 152 アドレス線 153 アドレス線 161 信号線 162 信号線 163 信号線 1 Voice Input Section 2 Dial Button 3 Coder 4-1 Function Switch 4-2 Function Switch 4-3 Function Switch 4-4 Function Switch 4-5 Function Switch 5 Voice Information Registration Memory 6 Management Memory 7 Terminal Number Registration Memory 8 Address Counter 9 buffer 10 voice information determination circuit 11 address control circuit 12 gate circuit 13 write data buffer 14 read data buffer 15 buffer 16 buffer 17 display circuit 21 spectrum analysis section 22 phoneme standard pattern section 23 phoneme similarity calculation section 24 similarity matrix section 25 Word dictionary unit 26 Word matching unit 27 Word determination unit 31 Voice information line 32 Voice information line 33 Voice information line 34 Voice information line 35 Voice information line 36 Registered voice information line 41 Dial information line 42 Dial information line 43 Dial information line 4 terminal number information line 45 partner terminal number information line 51 address line 52 address line 53 address line 61 signal line 62 signal line 63 signal line 103 coder 104-1 function switch 104-2 function switch 104-3 function switch 104-4 function Switch 104-5 Function switch 105 Voice information registration memory 106 Management memory 107 Terminal number registration memory 108 Address counter 109 Buffer 110 Voice information determination circuit 111 Address control circuit 112 Gate circuit 113 Write data buffer 114 Read data buffer 115 Buffer 116 Buffer 120 Call Road part 121 Control device 122 Voice dial receiving trunk 123 Internal control device 124 Switch 125 Switch 131 Voice information line 132 Voice information line 133 Sound Voice information line 134 Voice information line 135 Voice information line 136 Registered voice information line 141 Dial information line 142 Dial information line 143 Dial information line 144 Terminal number information line 145 Partner terminal number information line 151 Address line 152 Address line 153 Address line 161 Signal Line 162 Signal line 163 Signal line

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 音声端末を収容する交換網の着信端末指
定方法において、予め、該音声端末に、通信相手端末識
別のための音声情報、および該音声情報に対応する端末
番号を登録しておき、発呼時には、音声端末は、入力さ
れた音声情報と予め登録されていた音声情報とを比較し
て、最もよく一致する登録音声情報に対応する端末番号
を通信相手端末番号と判定し、該端末番号を交換機へ送
ることを特徴とする音声ダイヤル認識方法。
1. A method of designating a receiving terminal of a switching network accommodating a voice terminal, wherein voice information for identifying a communication partner terminal and a terminal number corresponding to the voice information are registered in advance in the voice terminal. At the time of making a call, the voice terminal compares the input voice information with the voice information registered in advance, determines the terminal number corresponding to the registered voice information that best matches the communication partner terminal number, A voice dial recognition method characterized by transmitting a terminal number to an exchange.
【請求項2】 音声端末を収容する交換網の着信端末指
定方法において、交換機に、予め音声端末から入力され
た通信相手端末識別のための音声情報、および該音声情
報に対応する端末番号を登録しておき、音声端末からの
発呼時には、交換機は、発呼端末を識別する番号を基に
該発呼端末から予め登録されていた登録音声情報を選定
して、該発呼端末から入力された音声情報と比較し、最
もよく一致する登録音声情報に対応する端末番号を通信
相手端末番号と判定し、接続動作を行なうことを特徴と
する音声ダイヤル認識方法。
2. A method of designating a called terminal of a switching network accommodating a voice terminal, wherein voice information for identifying a communication partner terminal, which is input from the voice terminal in advance, and a terminal number corresponding to the voice information are registered in the exchange. Incidentally, at the time of making a call from the voice terminal, the exchange selects the registered voice information registered in advance from the call terminal based on the number for identifying the call terminal, and inputs it from the call terminal. The voice dial recognition method is characterized in that the terminal number corresponding to the registered voice information that most closely matches is determined as the communication partner terminal number and the connection operation is performed.
JP15494092A 1992-06-15 1992-06-15 Voice dial recognition method Pending JPH05347664A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15494092A JPH05347664A (en) 1992-06-15 1992-06-15 Voice dial recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15494092A JPH05347664A (en) 1992-06-15 1992-06-15 Voice dial recognition method

Publications (1)

Publication Number Publication Date
JPH05347664A true JPH05347664A (en) 1993-12-27

Family

ID=15595261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15494092A Pending JPH05347664A (en) 1992-06-15 1992-06-15 Voice dial recognition method

Country Status (1)

Country Link
JP (1) JPH05347664A (en)

Similar Documents

Publication Publication Date Title
EP0943203B1 (en) Method and apparatus for locating a desired record in a telephone directory
US5905773A (en) Apparatus and method for reducing speech recognition vocabulary perplexity and dynamically selecting acoustic models
US6122361A (en) Automated directory assistance system utilizing priori advisor for predicting the most likely requested locality
US6438520B1 (en) Apparatus, method and system for cross-speaker speech recognition for telecommunication applications
US5917889A (en) Capture of alphabetic or alphanumeric character strings in an automated call processing environment
JP3204632B2 (en) Voice dial server
US7177800B2 (en) Method and device for the processing of speech information
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
US5987408A (en) Automated directory assistance system utilizing a heuristics model for predicting the most likely requested number
US20010056345A1 (en) Method and system for speech recognition of the alphabet
Kamm et al. Speech recognition issues for directory assistance applications
JPH05347664A (en) Voice dial recognition method
EP1315146A2 (en) Method and apparatus for improving access to numerical information in voice messages
JPH0192800A (en) Automatic apparatus
JPS6132679B2 (en)
KR100827074B1 (en) Apparatus and method for automatic dialling in a mobile portable telephone
JPS63276352A (en) Automatic voice dial telephone terminal equipment
KR0140814B1 (en) Information Communication Service Menu Voice Control Method
JPS6361300A (en) Voice recognition system
JP2002252705A (en) Method and device for detecting talker id
JPH09127975A (en) Speaker recognition system and information control method
KR100230972B1 (en) Voice cognition service apparatus of full electronic exchange
JPS60169900A (en) Word registration system
JPH1049186A (en) Numeral string speech recognition method and apparatus for executing the method
Rabiner Telecommunications applications of speech processing