JPH04200049A - Voice dialer - Google Patents

Voice dialer

Info

Publication number
JPH04200049A
JPH04200049A JP2333178A JP33317890A JPH04200049A JP H04200049 A JPH04200049 A JP H04200049A JP 2333178 A JP2333178 A JP 2333178A JP 33317890 A JP33317890 A JP 33317890A JP H04200049 A JPH04200049 A JP H04200049A
Authority
JP
Japan
Prior art keywords
voice
recognition
data
speaker
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2333178A
Other languages
Japanese (ja)
Inventor
Nobuo Hagimoto
萩本 信男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP2333178A priority Critical patent/JPH04200049A/en
Publication of JPH04200049A publication Critical patent/JPH04200049A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To recognize a key word in a memory area registered by the user without any special operation on each occasion of change in users by providing a voice data analysis means, a voice data storage means and a voice data control means to the dialer. CONSTITUTION:The dialer is provided with a bank memory 7 storing voice data for plural persons, each bank memory 7 is provided with an area storing a voice recognition characteristic data and a characteristic data for talker collation, and voice analysis means 3-5 are used to extract the voice recognition characteristic data from a designated voice signal and to extract the talker collation characteristic data and they are stored in the bank memory 7. Thus, when voice start is implemented by the recognition of a specific password, the key word is recognized and the talker is collated and the bank memory 7 registered by the user is selected and the voice dial mode is transited. Thus, the key word in the memory area registered by the user is used for an object of recognition without any special operation.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声認識を利用して電話装置などのダイヤリ
ング操作を簡単化した音声ダイヤル装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a voice dialing device that uses voice recognition to simplify the dialing operation of a telephone device or the like.

[従来の技術] 音声認識装置と電話装置とで構成される音声ダイヤル装
置では複数の人が使えるようにしたいという要求がある
6 従来、実用化され゛ている音声t!g−装置は、話゛者
を特定し、認R語数を制限するなど゛して、その性能を
確保してい乞のが実情である。
[Prior Art] There is a demand for a voice dialing device consisting of a voice recognition device and a telephone device to be usable by multiple people6. The reality is that G-devices must ensure their performance by identifying speakers, limiting the number of recognized words, and so on.

このように、−度に扱える認識対象単語数が制限される
場合があるので、複数の人が使えるようにするためには
、使用者毎のメモリ領域(バンク)を用意して、これを
使用者が変わるたびに切り換えて使うことになる。
In this way, the number of recognition target words that can be handled at a time may be limited, so in order for multiple people to be able to use it, prepare a memory area (bank) for each user and use this. You will need to switch and use it each time the person changes.

[発明が解決しようとする課題] このような構成の場合、音声ダイヤルを使用する際に、
使用者がシステムに対してどのバンクメモリを使うかを
伝えなければならない。スイ・ソチなどで指定を行なう
ことでこれを可能にできるが、本来、ハンズフリーであ
り、アイズフリーであるべき音声ダイヤルでスイッチを
使うと、その利便性が失われてしまう。
[Problem to be solved by the invention] In such a configuration, when using voice dialing,
The user must tell the system which bank memory to use. This can be done by specifying a phone number such as Sui-Sochi, but using a switch for voice dialing, which should be hands-free and eyes-free, loses its convenience.

また、特定のパスワードを音声認識することにより、バ
ンクメモリの切り換えをシステムが自動的に行なうよう
に音声認識させることができるが、このための余計な操
作(バンクメモリ切り換えのための発声)が加わるとい
う不具合がある。
Also, by voice recognition of a specific password, it is possible to have the system automatically perform voice recognition to switch bank memories, but this requires an extra operation (uttering a voice to switch bank memories). There is a problem.

一方、電話機を使用する通常のモードから音声認識によ
る音声ダイヤルモードへ移行するために何らかの方法で
使用者はシステムへその意志を伝える必要がある。
On the other hand, in order to shift from a normal mode using a telephone to a voice dialing mode using voice recognition, the user needs to convey his or her intention to the system in some way.

従来は、電話機のブツシュキーをある一定時間以上押し
続ける方法や、特定のキーワードを音声認識する方法な
どにより音声ダイヤルモードへ移行するようになってい
る。
Conventionally, the transition to voice dialing mode has been achieved by pressing and holding a button on a telephone for a certain period of time or by voice recognition of a specific keyword.

前者による方法であると、キーを押す操作のためにハン
ズフリーでなくなってしまう。後者による方法では、誤
認識により音声起動がかかつてしまうことである。
If the former method is used, hands-free operation is no longer possible due to the operation of pressing keys. In the latter method, voice activation may be delayed due to erroneous recognition.

また、話者を特定とした音声認識の場合でも、声質の似
ている人が発声すると認識をすることがあるので、その
結果、音声を登録した人とは異なる人の発声でも音声起
動がかかってしまう。また、周囲騒音により誤認識する
時も同様なことがある。
In addition, even in the case of voice recognition that specifies a speaker, recognition may occur if a person with a similar voice quality utters the voice.As a result, voice activation may occur even if the voice is uttered by a person different from the person who registered the voice. I end up. A similar situation may also occur when erroneous recognition is caused by ambient noise.

したがって、いたずらなどの発声やその他の音を誤認識
した結果、必要のないときに起動がかかることもあると
いう不具合がある。
Therefore, as a result of misrecognizing utterances such as pranks or other sounds, there is a problem in that the device may be activated when it is not necessary.

発明の目的 本発明の目的は、使用者が変わるたびに、特別な操作を
することなく、使用者が登録したメモリエリアにあるキ
ーワードを認識対象にすることができる音声ダイヤル装
置を提供することにある。
OBJECTS OF THE INVENTION An object of the present invention is to provide a voice dialing device that can recognize keywords in a memory area registered by the user without any special operations each time the user changes. be.

[課題を解決するための手段] このような目的を達成するために、本発明は、複数人の
音声データを蓄えるバンクメモリを備え、各バンクメモ
リには音声認識用の特徴データと話者照合用の特徴デー
タを格納するエリアが設けられ、音声分析手段を用いて
、指定された音声に対して音声認識用の特徴データを抽
出するとともに、話者照合用の特徴データを抽出し、バ
ンクメモリに格納することを特徴とする。
[Means for Solving the Problem] In order to achieve such an object, the present invention includes a bank memory that stores voice data of a plurality of people, and each bank memory has feature data for voice recognition and speaker verification. An area is provided to store feature data for voice recognition, and a voice analysis means is used to extract feature data for voice recognition from a specified voice, as well as feature data for speaker verification. It is characterized by being stored in.

[作用] 本発明は、音声認識用および話者照合用の特徴データを
バンクメモリに格納し、特定のパスワードの認識により
音声起動を行なう際に、キーワードの認識と同時に話者
照合を行ない、使用者が登録したバンクメモリに切り換
えて音声ダイヤルモードへ移行するようにできるので、
特別の操作をすることなく、使用者が登録したメモリエ
リアにあるキーワードを認識対象にすることができる。
[Function] The present invention stores characteristic data for voice recognition and speaker verification in a bank memory, and performs speaker verification at the same time as keyword recognition when voice activation is performed by recognizing a specific password. You can switch to the bank memory registered by the person and switch to voice dial mode.
Keywords in the memory area registered by the user can be targeted for recognition without any special operations.

[実施例] 以下、本発明の実施例を図面により詳細に説明する。[Example] Embodiments of the present invention will be described in detail below with reference to the drawings.

第1図は本発明による音声ダイヤルitの一実施例のシ
ステム構成図で、■はマイクロホン、2は増幅器、3は
音声分析部、4は音声認識用特徴抽出部、5は話者照合
用特徴抽出部、6は第1の制御部、7は第1のバタンメ
モリ、8は外部■/○、9は音声合成部、10は第2の
メモリ、11は第2の制御部、12はダイヤル制御部、
13は電話機、14は外部電話回線を示す。
FIG. 1 is a system configuration diagram of an embodiment of the voice dial IT according to the present invention, where ■ is a microphone, 2 is an amplifier, 3 is a voice analysis section, 4 is a feature extraction section for voice recognition, and 5 is a feature for speaker verification. Extraction unit, 6 is first control unit, 7 is first button memory, 8 is external ■/○, 9 is speech synthesis unit, 10 is second memory, 11 is second control unit, 12 is dial control unit,
13 is a telephone, and 14 is an external telephone line.

このような構成において、マイクロホン1より音声が入
力されると、その音声を電気信号に変換し、増幅器2に
より所望の振幅レベルに増幅し、音声分析部3に入力す
る。
In such a configuration, when a voice is input from the microphone 1, the voice is converted into an electrical signal, amplified to a desired amplitude level by the amplifier 2, and input to the voice analysis section 3.

音声分析部3は音声の信号を分析するためのフィルタ群
であり、音声帯域を複数チャンネルのバンドパスフィル
タで帯域分割し、各チャンネル出力を絶対値化し、さら
に、ローパスフィルタにより平滑した信号を出力する。
The audio analysis unit 3 is a group of filters for analyzing audio signals, and divides the audio band into multiple channels using bandpass filters, converts the output of each channel into an absolute value, and outputs a signal smoothed using a low-pass filter. do.

すなわち、音声分析部3は、音声信号の各帯域に占める
パワーのエンベロープを出力する。
That is, the audio analysis unit 3 outputs an envelope of power occupying each band of the audio signal.

音声分析部3により音声信号スペクトラムのエンベロー
プを取り出し、音声認識用特徴抽出部4および話者照合
用特徴抽出部5へそれぞれ入力する。
The speech analysis section 3 extracts the envelope of the speech signal spectrum and inputs it to the speech recognition feature extraction section 4 and the speaker verification feature extraction section 5, respectively.

これら抽出部4および5は、制御部6によりコントロー
ルされ、この制御部6では、音I認識と話者照合および
外部装置とのやりとりを行なう。
These extraction units 4 and 5 are controlled by a control unit 6, which performs sound I recognition, speaker verification, and communication with external devices.

特徴抽出部4は、音声分析部3から入力される信号によ
り、音声認識に使用するための特徴量を抽出し、それを
バタンメモリ7の所定のエリアに格納する。
The feature extractor 4 extracts feature amounts for use in speech recognition based on the signal input from the speech analyzer 3, and stores them in a predetermined area of the button memory 7.

また、外部l108を介して外部装置から指定のあった
ときは、話者照合用特徴抽出部5は、話者照合用のパラ
メータ(特徴量)を音声分析部3から入力された信号よ
り抽出し、バタンメモリ7の所定のエリアに格納する。
Furthermore, when a specification is received from an external device via the external l108, the speaker verification feature extraction unit 5 extracts parameters (features) for speaker verification from the signal input from the speech analysis unit 3. , stored in a predetermined area of the button memory 7.

音声合成部9は、システムが使用者にガイダンスメツセ
ージを出力したり、登録時の音声を録音しておき、音声
ダイヤル使用時にエコーバックして使用者がキーワード
を確認できるようにするためのものである。これらの固
定メツセージデータや音声データを格納するのがメモリ
10である。
The voice synthesis section 9 is for the system to output a guidance message to the user, record the voice at the time of registration, and echo it back when using voice dialing so that the user can confirm the keyword. be. The memory 10 stores these fixed message data and voice data.

本システムが扱う音声認識用の音声データとして大別し
てコントロールワード、キーワードの2種類がある。
There are two main types of voice data for voice recognition handled by this system: control words and keywords.

この内、コントロールワードは、システムのコントロー
ルシーケンスで処理の流れを制御するもので、例えば、
音声起動により通常モードから音声制御モードへ移行す
るときなどに使用する単語音声である。このコントロー
ルワードの登録時には、音声認識用のデータを抽出する
のと同時に、話者照合用のデータを抽出し、バタンメモ
リ7の所定エリアに格納する。コンロールワードを認識
するときは、同時に話者照合を行ない、照合した結果に
より該当するバンクメモリへ切り換える。
Among these, the control word controls the flow of processing in the system control sequence, for example,
This is a word sound used when transitioning from normal mode to voice control mode by voice activation. When registering this control word, data for voice recognition is extracted and at the same time data for speaker verification is extracted and stored in a predetermined area of the button memory 7. When recognizing a control word, speaker verification is performed at the same time, and the corresponding bank memory is switched based on the verification result.

一方、キーワードは、制御対象機器の各動作を制御する
音声認識用の単語音声である。登録時には、音声認識用
の音声データのみが登録され、データが指定されたユー
ザに対応するバングニリアに格納される。
On the other hand, the keyword is a word sound for speech recognition that controls each operation of the controlled device. At the time of registration, only voice data for voice recognition is registered, and the data is stored in the vanniglia corresponding to the specified user.

第2図は第1図のシステムのメイン動作を示すフローチ
ャート、第3図および第4図はそれぞれコントロールワ
ードおよびキーワード登録動作を示すフローチャート、
第5図は、話者切り換えモードの動作を示すフローチャ
ートである。
FIG. 2 is a flowchart showing the main operation of the system in FIG. 1, and FIGS. 3 and 4 are flowcharts showing control word and keyword registration operations, respectively.
FIG. 5 is a flowchart showing the operation of the speaker switching mode.

第6図および第7図はそれぞれコントロールワードおよ
びキーワードが登録されたメモリ7の内容の例を示す図
である。
FIGS. 6 and 7 are diagrams showing examples of the contents of the memory 7 in which control words and keywords are registered, respectively.

以下、本発明による電話機の音声認識による自動ダイヤ
リングの例を、第2図〜第7図を参照して詳細に説明す
る。
Hereinafter, an example of automatic dialing by voice recognition of a telephone according to the present invention will be explained in detail with reference to FIGS. 2 to 7.

音声ダイヤルの動作をスタートさせるために音声認識シ
ステムの起動をかけるが、このためのコントロールワー
ドが必要となる。
The voice recognition system is activated to start voice dialing, but a control word is required for this purpose.

ここで、電話機13に付属のブツシュキーから、予め定
めた特定のファンクションコード(例えば、登録モード
Func”1が割り当てられているとする)が入力され
ると、第1TXiのダイヤル制御部12はこれを検出し
て(第2図ステップ21)、制御部11にこのファンク
ションコードを検出したことを伝え、制御部11ては、
コントロールワード登録モートへ移行する(第2図ステ
ップ22)。
Here, when a predetermined specific function code (for example, registration mode Func"1 is assigned) is input from the button key attached to the telephone 13, the dial control unit 12 of the first TXi inputs this code. The function code is detected (step 21 in FIG. 2), and the control unit 11 is notified that this function code has been detected, and the control unit 11 then
The process moves to the control word registration mode (step 22 in FIG. 2).

二のコントロールワード登録モートの動作を、第3図を
参照して説明する。
The operation of the second control word registration mote will be explained with reference to FIG.

コントロール登録モード(こなると、制御部11の制御
のもとで、音声合成部9はそのモードになったことをユ
ーザに知らせるため、音声メツセージ、例えば、 「コ
ントロールワード登録モードてす。」をスピーカ15に
出力する(ステップ40)。
Control Registration Mode (In this case, under the control of the control unit 11, the speech synthesis unit 9 sends a voice message, for example, "Control word registration mode" to the speaker, to inform the user that it is in this mode. 15 (step 40).

このとき、このガイダンスを電話機13に付属の表示部
などに行なってもよく、また、その場合、音声メツセー
ジと併用しても良い。
At this time, this guidance may be provided on a display unit attached to the telephone 13, and in that case, it may be used in conjunction with a voice message.

次に、音声メツセージ「発声して下さいコなどのような
ものを、スピーカ15から出力したり、表示部に登録番
号を表示したりして、ユーザに対して、コントロールワ
ードとして登録すべき音声の発声要求指示を行なう(ス
テップ41)。
Next, a voice message such as "Please say something" is output from the speaker 15, a registration number is displayed on the display, and the user is informed of the voice that should be registered as a control word. A voice request instruction is issued (step 41).

メツセージに従って、ユーザが、コントロールワード、
例えば、「テレフォン」を発声すると(ステップ42.
43)、fm述のように、音声認識用のパラメータおよ
び話者照合用のデータを抽出する(ステップ44.45
)6 第6図に、このようなコントロールワードが登録された
ときのバタンメモリ7の一部の例を示す。
According to the message, the user selects the control word,
For example, if you say "telephone" (step 42.
43), as described in fm, extract parameters for speech recognition and data for speaker verification (steps 44 and 45).
)6 FIG. 6 shows an example of a part of the button memory 7 when such a control word is registered.

ユーザ(図では話者)毎にコントロールワード「テレフ
ォン」の音声認識用データと話者照合用のデータが対に
なって格納されている。この場合、コントロールワード
は1種類であるが、複数のコントロールワードを登録す
ることもある(ステップ46.47)。必要な数のコン
トロールが登録されると、現在のモードを終了し、通常
モードに戻る。
Speech recognition data and speaker verification data for the control word "telephone" are stored as a pair for each user (speaker in the figure). In this case, there is only one type of control word, but a plurality of control words may be registered (steps 46 and 47). Once the required number of controls are registered, exit the current mode and return to normal mode.

次に、ユーザが電話機13のブツシュキーにより、特定
のファンクションワード(例又は、F unc*#2.
話者切り換えモードが割り当てられている)を押せば、
話者切り換えモードへ移行する(ステップ23.24)
Next, the user selects a specific function word (eg, Func*#2.
(to which speaker switching mode is assigned),
Shift to speaker switching mode (step 23.24)
.

話者切り換えモートの動作を第5図を参照して説明する
The operation of the speaker switching mode will be explained with reference to FIG.

話者切り換えモードに入ると、現在選択されているバン
ク番号をユーザに報知する(ステップ71)。その方法
としては、前述した音烹合成による音声メツセージによ
り、「現在のバンク番号は〜てす」のように出力しても
良いし、電話機13に表示器があれば表示をしても良い
When the speaker switching mode is entered, the currently selected bank number is notified to the user (step 71). This can be done by outputting a voice message such as "The current bank number is..." using the above-mentioned sound synthesis method, or by displaying the message if the telephone 13 has a display device.

話者切り換えモードのときに、例えば、数字キーが押さ
れるとくステップ72)、バンク番号をインクリメント
して(ステップ73)、バンク番号が最大値を越えない
ときは(ステップ74)、現在のバンク番号で、最大値
を越えたときは、バンクを1として(ステップ75)、
ハング番号にしたがって、バンクメモリの切り換えを行
なう(ステップ76)。
When in speaker switching mode, for example, if a number key is pressed (step 72), the bank number is incremented (step 73), and if the bank number does not exceed the maximum value (step 74), the current bank number is If the maximum value is exceeded, set the bank to 1 (step 75),
Bank memories are switched according to the hang number (step 76).

バンク切り換えが終了すると、再び、音声メツセージで
バンク番号を報知する(ステップ71)。
When the bank switching is completed, the bank number is notified again by voice message (step 71).

数字キーが再度押されるなら(ステップ72)、上記と
同様の処理を行ない、エンド(E N D )キーが押
されるなら(ステップ77)、現在のモードを終了する
If the numeric key is pressed again (step 72), the same process as above is performed, and if the END key is pressed (step 77), the current mode is terminated.

次に、キーワード登録モードを割り当てたファンクショ
ンコード(例えば、F unc” 3 : )を入力す
ると、キーワード登録モードに移行する(ステップ25
.26)。
Next, when the function code assigned to the keyword registration mode (for example, Func"3:) is input, the mode shifts to the keyword registration mode (step 25).
.. 26).

このモードの動作を、第4図を参照して説明する。The operation in this mode will be explained with reference to FIG.

キーワード登録モードとなると、エントリ番号の入力要
求をデイスプレィや音声メツセージにより行なう(ステ
ップ52)。エントリ番号が入力され、それが妥当であ
れば、次の処理へ移り、確定しなければ、引き続いて番
号の入力処理を行なう(ステップ53.54)。
When the keyword registration mode is entered, an entry number input request is made on the display or by voice message (step 52). If the entry number is input and it is valid, the process moves to the next step, and if it is not determined, the number input process continues (steps 53 and 54).

次に、制御部11の制御により、音声メツセージ「キー
ワードをどうぞ」などの音声発声要求を行なう(ステッ
プ55)。ユーザは、メツセージに続いて、キーワード
(例えば、「とりひきさき」など)を発声すると(ステ
ップ56)、音声認識用のデータが抽出され(ステップ
57)、第7図に示すように、話者(1)のバンクエリ
ア1に格納される1つの音声データの登録が終了すると
、電話番号の登録の要求メツセージを電話機に付属の表
示器に表示するか、または、音声メツセージ「li電話
番号入力して下さい」などにより行なう(ステップ58
)。
Next, under the control of the control unit 11, a voice request such as a voice message "Keyword please" is made (step 55). When the user utters a keyword (for example, "Torihikisaki") following the message (step 56), data for speech recognition is extracted (step 57), and as shown in FIG. When the registration of one voice data stored in bank area 1 in (1) is completed, a message requesting registration of a telephone number will be displayed on the display attached to the telephone, or a voice message "li input telephone number" will be displayed. (Step 58)
).

電話番号の入力が確定していない間は、電話番号の入力
処理を行ない(ステップ59.60)、番号が確定する
と、入力データを所定のメモリエリアに格納する(ステ
ップ61)、 このときの電話番号を、先に登録した音声データと対応
付けて記憶する。電話番号を格納するメモリを、電話機
が短縮ダイヤルをサポートしているときは、共用するよ
うにしても良い。また、メモリ7または10の一部を使
用するようにしても良い9 電話番号の:gl録の方法として、音声の発声の直後に
逐−行なわずに、全ての音声を′杯録した後に、−括し
て・登録してしまうことも考えられる。−度に登録する
データの数が多いときは、この方法が便利な場合もある
―キーワードの登録モードは、ニンド(END)キーを
押すことで通常モードへ戻ることができる(ステップ5
1)。
While the input of the telephone number is not confirmed, the telephone number input process is performed (steps 59 and 60), and when the number is confirmed, the input data is stored in a predetermined memory area (step 61). The number is stored in association with the previously registered audio data. The memory for storing telephone numbers may be shared if the telephone supports speed dialing. Alternatively, a part of the memory 7 or 10 may be used. -It is also possible to register all of them together. - This method may be convenient when there is a large amount of data to be registered at one time - Keyword registration mode can be returned to normal mode by pressing the END key (Step 5).
1).

第2図のフローチャートを基に、自動ダイヤル動作を説
明する。
The automatic dialing operation will be explained based on the flowchart in FIG.

音声の自動ダイヤル動作を行なわない、通常のモードで
は、ダイヤル制御部12において、電話機13が星独で
動作するように、制御信号を設定しておく。したがって
、自動ダイヤル動作を行なわない間は、制御部11は、
電話機13を羊独動作させるための信号の設定だけであ
り、その他のダイヤル制御は行なわない。
In a normal mode in which automatic voice dialing is not performed, a control signal is set in the dial control section 12 so that the telephone 13 operates in a single mode. Therefore, while the automatic dialing operation is not performed, the control unit 11
It only sets signals for operating the telephone 13 independently, and does not perform any other dial control.

したがって、通常のモードで、システムは、コントロー
ルワードを認識対象単語として、音声認識を開始し、音
声起動用の単語音声「テレフォン」をモニタするだけで
ある(ステップ20)。
Therefore, in the normal mode, the system starts speech recognition with the control word as the recognition target word, and only monitors the speech activation word "telephone" (step 20).

このとき、認識対象となるのは、登録しである全ての話
者のコントロールワード「テレフォン」の音声認識用デ
ータである。
At this time, what is to be recognized is the speech recognition data for the control word "telephone" of all registered speakers.

「テレフォン」の音声認識が失敗したときは、認識のや
り直しをして、次の発声をモニタする(ステップ27)
。「テレフォン」をml&しない間は、ファンクション
コードの入力の有無をチエツクする(ステップ27.2
0)。ファンクションコードの入力があったときは、再
び音声認識のやり直しをして、 「テレフォン」のモニ
タをする(ステップ20〜27)。
If the voice recognition for "telephone" fails, try the recognition again and monitor the next utterance (step 27).
. While "telephone" is not set, check whether the function code is input (step 27.2).
0). When a function code is input, voice recognition is performed again and the "telephone" is monitored (steps 20 to 27).

話者(1)が、音声起動用のコントロールワード「テレ
フォン」を発声して、音声認識が成功すると(ステップ
27のYes)、システムは話者照合用のデータを用い
て話者照合処理を行なう(ステップ28)5照合結果に
より、話者(りが選択されると、話者(1)が予め登録
したキーワードデータの登録バンクへ認識対象メモリを
切り換える(ステップ29)。
When the speaker (1) utters the control word "telephone" for voice activation and the voice recognition is successful (Yes in step 27), the system performs speaker verification processing using data for speaker verification. (Step 28) When the speaker (ri) is selected based on the result of the 5 comparisons, the recognition target memory is switched to the registration bank of keyword data registered in advance by the speaker (1) (step 29).

前述した処理により、音声起動がかかると、音声ダイヤ
ルシーケンスを実行し、通話状態とする(ステップ30
)。その後、終話を確認するまで、システムは待機状態
となり、終話確認後、再び、通常の動作モードに戻る(
ステップ31)。
When the voice activation is performed through the above-described process, a voice dialing sequence is executed and a call state is established (step 30).
). After that, the system goes into standby mode until you confirm that the call has ended, and then returns to normal operation mode (
Step 31).

なお、本発明は、上述した実施例に限らず、種々の変形
例が考えられることは言うまでもない3[発明の効果コ 以上述べたように、本発明の音声ダイヤル装置によれば
、音声起動時にユーザが使用するハングメモリを判定し
て、切り換えるので、複数の二−ザが各バンクにキーワ
ードを登録している際に、ユーザが変わるたびに、バン
クメモリを切り換えることなく、音声認識を行なうこと
ができる。
Note that it goes without saying that the present invention is not limited to the embodiments described above, and that various modifications are possible. Since the hang memory used by the user is determined and switched, when multiple users have registered keywords in each bank, voice recognition can be performed without switching bank memories each time the user changes. I can do it.

また、バンクメモリの切り換えにおいて、スイッチの手
操作の代わりに音声で行なうことができるので、完全な
ハンズフリーを実現できる。
Furthermore, when switching between bank memories, it is possible to use voice instead of manually operating a switch, making it possible to achieve complete hands-free operation.

さらに、周囲騒音や第3者の話し声などで誤認識しても
、話者照合により、登録外のユーザであるとして、リジ
エクトできるので、従来に比べて、誤認識により音声起
動がかかる機会を減らすことができる。
Furthermore, even if there is a misrecognition due to ambient noise or the voice of a third party, the user can be rejected as an unregistered user through speaker verification, reducing the chances of voice activation due to misrecognition compared to conventional methods. be able to.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明による音声ダイヤル装置の一実施例のシ
ステム構成図、第2図はメインフローチャート、第3図
および第4図はそれぞれコントロールワードおよびキー
ワードの登録動作のフローチャート、第5図は話者切り
換えモードのフローチャート、第6図および第7図はそ
れぞれコントロールワードおよびキーワードの登録状態
を説明する図である。 3 °・・・音声分析部、4−・ 音声認識用特徴抽出
部、5   話者照合用特徴抽出部、13・電話機。 特許出願人    グラリオン株式会社代理人 弁理士
  永 1)武 三 部第1図 第2図 第3図 第5図 第6図 第7図
FIG. 1 is a system configuration diagram of an embodiment of a voice dialing device according to the present invention, FIG. 2 is a main flowchart, FIGS. 3 and 4 are flowcharts of control word and keyword registration operations, respectively, and FIG. The flowcharts of the user switching mode, FIGS. 6 and 7, are diagrams for explaining the registration status of control words and keywords, respectively. 3°...speech analysis section, 4-. feature extraction section for speech recognition, 5 feature extraction section for speaker verification, 13. telephone set. Patent Applicant Glarion Co., Ltd. Agent Patent Attorney Nagai 1) Takeshi Part 1 Figure 2 Figure 3 Figure 5 Figure 6 Figure 7

Claims (2)

【特許請求の範囲】[Claims] (1)登録番号に対応した認識対象の音声キーワードを
、入力された話者の音声データを比較照合して音声認識
し、該音声認識結果に基づいて前記登録番号のダイヤル
操作を行なう音声ダイヤル装置において、前記音声デー
タの音声認識用の特徴データと話者照合用の特徴データ
とのそれぞれの特徴量を抽出し、分析結果として出力す
る音声データ分析手段と、前記音声認識用および話者照
合用の特徴データを登録するエリアが設けられ、該特徴
データを記憶する音声データ記憶手段と、前記音声デー
タ分析手段により得られた分析結果を前記音声データ記
憶手段に記憶するように制御する音声データ制御手段と
を備え、前記音声データ分析手段の分析結果に基づいて
ダイヤル操作を行なうことを特徴とする音声ダイヤル装
置。
(1) A voice dialing device that performs voice recognition by comparing and collating the voice keyword to be recognized corresponding to a registration number with the input speaker's voice data, and performs a dialing operation of the registration number based on the voice recognition result. a voice data analysis means for extracting respective feature quantities of the voice recognition feature data and the speaker verification feature data of the voice data and outputting them as analysis results; an area for registering feature data, an audio data storage means for storing the feature data, and an audio data control for controlling the analysis results obtained by the audio data analysis means to be stored in the audio data storage means. 1. A voice dialing device comprising means for performing a dialing operation based on an analysis result of said voice data analyzing means.
(2)所定のパスワード認識により前記登録番号のダイ
ヤル操作を行なう時には、前記音声キーワード認識と共
に話者照合を行ない、該照合結果に基づいて前記音声デ
ータ記憶手段に設けられているエリアを話者に対応して
選択する選択制御手段を有することを特徴とする請求項
1記載の音声ダイヤル装置。
(2) When dialing the registration number using predetermined password recognition, speaker verification is performed along with the voice keyword recognition, and based on the verification result, the area provided in the voice data storage means is assigned to the speaker. 2. The voice dialing device according to claim 1, further comprising selection control means for corresponding selection.
JP2333178A 1990-11-29 1990-11-29 Voice dialer Pending JPH04200049A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2333178A JPH04200049A (en) 1990-11-29 1990-11-29 Voice dialer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2333178A JPH04200049A (en) 1990-11-29 1990-11-29 Voice dialer

Publications (1)

Publication Number Publication Date
JPH04200049A true JPH04200049A (en) 1992-07-21

Family

ID=18263175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2333178A Pending JPH04200049A (en) 1990-11-29 1990-11-29 Voice dialer

Country Status (1)

Country Link
JP (1) JPH04200049A (en)

Similar Documents

Publication Publication Date Title
US4853953A (en) Voice controlled dialer with separate memories for any users and authorized users
US5752232A (en) Voice activated device and method for providing access to remotely retrieved data
JP4085924B2 (en) Audio processing device
CA2019319C (en) Voice recognition dialing unit
US6744860B1 (en) Methods and apparatus for initiating a voice-dialing operation
JP2003515816A (en) Method and apparatus for voice controlled foreign language translation device
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
KR19990011027A (en) Portable telephone with memory for voice recognition processing
CN104168353A (en) Bluetooth earphone and voice interaction control method thereof
JPH08163252A (en) Pbx/computer interlock system
EP1316944B1 (en) Sound signal recognition system and method, and dialog control system and method using it
KR20050015585A (en) Apparatus And Method for Enhanced Voice Recognition
JPH04200049A (en) Voice dialer
JP2656234B2 (en) Conversation voice understanding method
JPS638798A (en) Voice recognition equipment
KR100250496B1 (en) User selective voice system and method
KR100214085B1 (en) Voice dialing method
KR100827074B1 (en) Apparatus and method for automatic dialling in a mobile portable telephone
JP3018759B2 (en) Specific speaker type speech recognition device
JP2000125397A (en) Speaker identification type digital hearing aid
KR940011237B1 (en) Phonetic dialing method and apparatus
KR950009425B1 (en) The phonetic dialing phone
JPH06303320A (en) Pbx device
JPH052400A (en) Speech recognition device
JPH04951A (en) Audio dial device