JPS60120400A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS60120400A
JPS60120400A JP58228274A JP22827483A JPS60120400A JP S60120400 A JPS60120400 A JP S60120400A JP 58228274 A JP58228274 A JP 58228274A JP 22827483 A JP22827483 A JP 22827483A JP S60120400 A JPS60120400 A JP S60120400A
Authority
JP
Japan
Prior art keywords
registration
key
voice
speech
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58228274A
Other languages
Japanese (ja)
Inventor
宇佐美 隆一
新家 修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58228274A priority Critical patent/JPS60120400A/en
Publication of JPS60120400A publication Critical patent/JPS60120400A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、音声認識装置に係シ、特に事前に話者の音声
パターンを登録後、認識を行う音声認識装置に関する゛
も”のである。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to a speech recognition device, and particularly to a speech recognition device that performs recognition after registering a speaker's speech pattern in advance.

〔従来技術と問題点〕[Prior art and problems]

第1図は音声認識装置の構成例を示す図、第2図はハン
ディ・パネルの構成例を示す図である。
FIG. 1 is a diagram showing an example of the configuration of a voice recognition device, and FIG. 2 is a diagram showing an example of the configuration of a handy panel.

図において、1はコントローラ、2はディスプレイ、3
はキーボード、4は音声認識具ニット、5はマイク、6
はハンディ・パネル、61は送シキー、62は戻しキー
、63は再登録キー、64はポーズ・キーを示す。
In the figure, 1 is the controller, 2 is the display, and 3
is a keyboard, 4 is a voice recognition device knit, 5 is a microphone, 6
61 is a forward key, 62 is a return key, 63 is a re-registration key, and 64 is a pause key.

従来の特定話者音声認識装置は、第1図に示す如く、°
マイク5から入力された音声の認識を行ってその結果を
通知する音声認識ユニット4、その出力とマージされる
キーボード3、音声特有の指示を行うためのハンディ・
パネル6、オペレータとの対話用のディスプレイ2、及
びそれらの入出力を制御するコントローラ1よ多構成さ
れている。
As shown in Fig. 1, the conventional speaker-specific speech recognition device is
A voice recognition unit 4 recognizes the voice input from the microphone 5 and notifies the result, a keyboard 3 that is merged with the output, and a handy keyboard 3 for giving voice-specific instructions.
It is composed of a panel 6, a display 2 for interaction with an operator, and a controller 1 for controlling input and output thereof.

ハンディ・パネル6は、第2図に示すように、プロンプ
トの空送シと戻しを行うだめの送りキー61と戻しキー
62、個人の音声特微量で音声の照合対象として作成さ
れた辞書を消去し再登録を行うための再登録キー63、
及び音声入力をしゃ断したり再度入力可能状態に戻した
りするだめのポーズ・キー64を有している。
As shown in FIG. 2, the handy panel 6 has a forward key 61 and a return key 62 for forwarding and reversing prompts, and for erasing a dictionary created as a target for voice matching based on individual voice features. a re-registration key 63 for re-registering;
It also has a pause key 64 for cutting off voice input and returning it to a state where it can be input again.

次に音声登録の概要を説明する。まず、音声登録処理が
起動されると、ディスプレイ2上に発声を指示するプロ
ンプトが表示され、オペレータはそのプロンプトに従っ
て発声を行う。正常に登録が行われると、次の語のプロ
ンプトが表示され、以下同様に処理を行う。ここでもし
登録が正常に行われない場合、オペレータは、ハンディ
・パネル6の再登録キー63を押下して、作成された辞
書を消去して再発声する。既に音声が登録済の語に対し
て再発声すると、学習処理と呼ばれる処理を行い、既存
の辞書の修正処理を行って発声変動に対応可能とする。
Next, an overview of voice registration will be explained. First, when the voice registration process is started, a prompt instructing to speak is displayed on the display 2, and the operator speaks according to the prompt. If registration is successful, a prompt for the next word will be displayed, and the process will continue in the same way. If the registration is not performed normally, the operator presses the re-registration key 63 on the handy panel 6 to erase the created dictionary and re-voice. When a word whose voice has already been registered is re-uttered, a process called a learning process is performed to correct the existing dictionary so that it can respond to variations in pronunciation.

又、辞書間に距離の近い類似語があると類似語側の辞書
を修正する処理も行われる。音声入力を途中でオペレー
タが中断する必要がある場合には、ハンディ・パネル6
のポーズ・キー64を押下することによ多入力しゃ断を
行う。更にもう一度ポーズ・キー64を押下することに
よ多入力可能状態に戻す。
Furthermore, if there are similar words that are close to each other in the dictionaries, a process is also performed to correct the dictionary for the similar words. If the operator needs to interrupt voice input midway through, use the handy panel 6.
Multiple inputs are cut off by pressing the pause key 64. Furthermore, by pressing the pause key 64 again, the state returns to the state where multiple inputs are possible.

以上に述べたような従来の登録方式は、ハンディ・パネ
ルという特殊なハードウェアを準備する必要があること
、及びハンディ・パネル上のキーの使用には特に制限を
設けないため、例えば先に述べた類似語側辞書の修正の
くり返しによシ、類似語側辞書が逆に破壊される可能性
がある等の問題点があった。
The conventional registration method described above requires the preparation of special hardware called a handy panel, and there are no particular restrictions on the use of keys on the handy panel. There is a problem in that the similar word dictionary may be destroyed due to repeated corrections of the similar word dictionary.

〔発明の目的〕[Purpose of the invention]

本発明は、上記の考察に基づくものであって、ハンディ
・パネルのような特殊なハードウェアを準備する必要が
なく、音声登録処理を効率的かつ効果的に行うことが可
能な音声認識装置を提供することを目的とするものであ
る。
The present invention is based on the above considerations, and provides a voice recognition device that can perform voice registration processing efficiently and effectively without the need to prepare special hardware such as a handy panel. The purpose is to provide

〔発明の構成〕[Structure of the invention]

そのために本発明の音声認識装置は、音声認識を行う音
声認識ユニットと、ディスプレイと、キーボードと、全
体の入出力を制御するコントローラとを具備した音声認
識装置において、キーボードにファンクション・キーを
設けると共に、コントローラは、音声特微量を作成する
ための音声登録処理ではファンクション・キーに音声登
録処理用のプロンプトの送りや戻し、ポーズ、再登録、
終了などの機能を定義すると共に、音声登録処理におけ
る初期登録を登録済辞書の修正/追加を行う学習処理よ
りも優先度を上げ、学習処理と認識処理の結果や状態、
コマンド入力フィールドをディスプレイ上に表示する処
理を行うように構成されたことを特徴とするものである
To this end, the speech recognition device of the present invention is a speech recognition device equipped with a speech recognition unit that performs speech recognition, a display, a keyboard, and a controller that controls overall input/output. , during voice registration processing to create voice features, the controller uses function keys to send and return prompts for voice registration processing, pause, reregister,
In addition to defining functions such as termination, the initial registration in the voice registration process is given priority over the learning process that corrects/adds registered dictionaries, and the results and status of the learning process and recognition process,
The present invention is characterized in that it is configured to display a command input field on a display.

〔発明の実施例〕[Embodiments of the invention]

以下、本発明の実施例を図面を参照しつつ説明する。 Embodiments of the present invention will be described below with reference to the drawings.

第3図は本発明の1実施例構成を示す図、第4図は本発
明が適用されるディスプレイの画面イメージを示す図、
第5図は本発明が適用されるキーボード上のファンクシ
ョン・キーの定義例を示す図である。第3図において、
工ないし5は第1図に対応するものを示す。
FIG. 3 is a diagram showing the configuration of one embodiment of the present invention, FIG. 4 is a diagram showing a screen image of a display to which the present invention is applied,
FIG. 5 is a diagram showing an example of definition of function keys on a keyboard to which the present invention is applied. In Figure 3,
Items 1 to 5 correspond to those shown in FIG.

本発明は、第3図に示すように、従来のハンディ・パネ
ルを削除し、その機能をキーボード3のファンクション
・キーに持たせるものである。ファンクション・キーは
、通常ユーザが自由に定義付けできるため、登録モード
において一意に決めても問題はない。ファンクション・
キーノ定義例を示したのが第4図である。第4図に示す
例では、ファンクション・キーのA1がポーズ・キー、
A3がプロンプトの戻しキー、A4がプロンプトの送シ
キー、B1が終了キー、B2が再登録キーとして定義さ
れる。ここで終了キーとは、登録処理を終了させる機能
を持つキーである。
As shown in FIG. 3, the present invention eliminates the conventional handy panel and provides the function keys of the keyboard 3 with the function. Since a function key can normally be freely defined by a user, there is no problem even if it is uniquely determined in the registration mode. function·
FIG. 4 shows an example of keno definition. In the example shown in FIG. 4, function key A1 is the pause key;
A3 is defined as a prompt return key, A4 is defined as a prompt send key, B1 is defined as an end key, and B2 is defined as a reregistration key. The end key here is a key that has the function of ending the registration process.

さらに本発明においては、すべての語に対して登録処理
が終了した後にのみ学習処理を可能とし、辞書の品質を
均一に保つようにする。すなわち、成る特定の語に着目
すると高認識率が得られるが、逆修正を受けた語は認識
率が低下するというような、部分的に登録完了時に学習
を許すことによる辞書のひずみが起こらないようにする
Furthermore, in the present invention, learning processing is enabled only after registration processing has been completed for all words, thereby maintaining uniform dictionary quality. In other words, a high recognition rate can be obtained by focusing on specific words consisting of the following words, but the recognition rate decreases for words that have been reversely modified.This is because the dictionary is not distorted by allowing learning to occur partially when registration is completed. Do it like this.

第1表は本発明の特定話者音声認識装置による登録時状
態遷移を示し、第2表は同じく学習時状態遷移を示す。
Table 1 shows state transitions during registration by the specific speaker speech recognition device of the present invention, and Table 2 similarly shows state transitions during learning.

本発明は、この第1表及び第2表〔第1表 登録時〕 に示すように、モードによってキー動作を制限すること
により実現する。
The present invention is realized by restricting key operations depending on the mode, as shown in Table 1 and Table 2 [Table 1: At the time of registration].

次に、本発明が適用される音声登録画面イメージを第5
図を参照しつつ説明する。第5図において、発声レベル
とは、オペレータの発声が大きすぎるか小さすぎるかを
指示し、登録状況は、総語数に対してどれだけ登録が完
了したかをオペレータに伝える。また、類似発声とは、
登録語に距離の近い語(似た発声)があることをオペレ
ータに伝え、読みを変えたほうが良いことを指示する。
Next, a fifth image of the voice registration screen to which the present invention is applied is shown.
This will be explained with reference to the figures. In FIG. 5, the utterance level indicates whether the operator's utterance is too loud or too soft, and the registration status indicates to the operator how much registration has been completed relative to the total number of words. Also, similar utterances are
Inform the operator that there is a word (pronounced similarly) that is close to the registered word, and instruct him or her to change the pronunciation.

完成度は、辞書の完成度を示し、候補は、学習時に距離
の近い候補が存在する場合にその候補を表示するだめの
ものである。さらに、コマンドとは、プロンプトの送シ
や戻しのみでは任意の語の位置への移動が困難であるた
めに、プロンプト語の移動用のコマンド入力フィールド
等に使用される。
The degree of completion indicates the degree of completion of the dictionary, and the candidate is used to display a nearby candidate when there is a nearby candidate during learning. Further, since it is difficult to move to an arbitrary word position by simply sending or returning a prompt, a command is used in a command input field for moving a prompt word.

第6図は登録モードでのコントローラによる処理の流れ
を説明する図である。コントローラは、ファンクション
・キーの意味付けを行う手段を有する。例えばユティリ
ティ機能である。具体的にはファンクション・キーが押
下されるとファンクション・キーに対応する文字列がコ
ントローラに通知される。これによシコントローラは、
先に述べたように、従来のハンディ・パネルに代えてキ
ーボードのファンクション・キーに同様の機能を持たせ
る。以下に登録モードでの処理の流れを第6図を参照し
つつ説明する。
FIG. 6 is a diagram illustrating the flow of processing by the controller in registration mode. The controller has means for assigning meaning to the function keys. For example, it is a utility function. Specifically, when a function key is pressed, a character string corresponding to the function key is notified to the controller. This controller is
As mentioned above, instead of the conventional handy panel, the function keys on the keyboard have similar functions. The flow of processing in the registration mode will be described below with reference to FIG.

■ 全単語が登録済みか否かを調べる0yesの場合に
は学習処理を行い、Noの場合には■の処理を行う。
■ Check whether all words have been registered. If 0, the learning process is performed, and if the answer is No, the process (■) is performed.

■ 次の発声プロンプトをディスプレイに表示する。次
に■の処理を行う。
■ Show the next spoken prompt on the display. Next, perform the process (■).

■ 発声が行われたか、ファンクション・キーが押下さ
れたかを調べる。
■ Determine whether a utterance was made or a function key was pressed.

発声が行われた場合にはその発声語の登録を行って■の
処理に戻り、ファンクション・キーが押下された場合に
は■の処理を行う。
If the utterance has been made, the uttered word is registered and the process returns to step 2, and if the function key has been pressed, the step 2 is performed.

■ 再登録指示か否かを調べる。■ Check whether there is a re-registration instruction.

Yesの場合には■の処理を行い、Noの場合には■の
処理を行う。
In the case of Yes, the process ``■'' is performed, and in the case of No, the process ``■'' is performed.

■ 登録済の辞書の内容をクリアする。次に■の処理に
戻る。
■ Clear the contents of registered dictionaries. Next, return to the process of ■.

■ プロンプトの送シ指示か否かを調べる。■ Check whether there is an instruction to send the prompt.

Yesの場合には■の処理を行い、Noの場合には■の
処理を行う。
In the case of Yes, the process ``■'' is performed, and in the case of No, the process ``■'' is performed.

■ プロンプトの送り指示に対して動作が可能か否かを
調べる。
■ Check whether the operation is possible in response to the prompt sending instruction.

Yesの場合には■の処理を行い、Noの場合には■の
処理に戻る。
In the case of Yes, the process ``■'' is performed, and in the case of No, the process returns to the process ``■''.

■ 発声プロンプトのポインタを次に進める。■ Advance the voice prompt pointer to the next point.

次に■の処理に戻る。Next, return to the process of ■.

■ プロンプトの戻し指示か否かを調べる。■ Check whether the prompt is returned or not.

Yesの場合には[相]の処理を行い、Noの場合には
@の処理を行う。
In the case of Yes, the process of [phase] is performed, and in the case of No, the process of @ is performed.

[相] プロンプトの戻し指示に対して動作が可能か否
かを調べる。
[Phase] Check whether the action is possible in response to the return instruction from the prompt.

Yesの場合には0の処理を行い、Noの場合には■の
処理に戻る。
If Yes, process 0 is performed, and if No, return to process ■.

■ 発声プロンプトのポインタを前に戻す。次に■の処
理に戻る。
■ Move the vocal prompt pointer back. Next, return to the process of ■.

@ 終了指示か否かを調べる。@ Check whether it is a termination instruction.

Yesの場合にはOの処理を行い、Noの場合には[相
]の処理を行う。
If Yes, process O is performed, and if No, process [phase] is performed.

@ ボーズ処理を行う。次に■の処理に戻る。@Perform Bose processing. Next, return to the process of ■.

■ 終了処理を行う。■ Perform termination processing.

以上のように、基本的には成る特定のファンクション・
キーが押下されたときに、そのファンクション・キーの
機能を有効にするか無効にするかの判定及び次の可能動
作の制限処理がコントローラ中の処理機能となる。
As mentioned above, a specific function basically consists of
When a key is pressed, the processing functions in the controller include determining whether to enable or disable the function of the function key and limiting the next possible operation.

〔発明の効果〕〔Effect of the invention〕

以上の説明から明らかなように、本発明によれば、特定
話者音声認識装置において、重要な認識率を左右する要
素である音声登録処理を、ノ1ンディ・パネルのような
特殊なハードウェアを準備するととなく、効率的かつ効
果的に行うことが可能となる。
As is clear from the above description, according to the present invention, in a specific speaker speech recognition device, the speech registration process, which is an important element that influences the recognition rate, is performed using special hardware such as a one-day panel. If you prepare, you will be able to carry out the process efficiently and effectively.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は音声認識装置の構成例を示す図、第2図はハン
ディ・パネルの構成例を示す図、第3図は本発明の1実
施例構成を示すi、第4図は本発明が適用されるディス
プレイの画面イメージを示す図、第5図は本発明が適用
されるキーボード上のファンクション・キーの定義例を
示す図、第6図は登録モードでのコントローラによる処
理の流れを説明する図である。 1・・・コントローラ、2・・・ディスプレイ、3・・
・キーボード、4・・・音声認識ユニット、5・・・マ
イク、6・・・ハンディ・パネル、61・・・送J)キ
ー、62・・・戻しキー、63・・・再登録キー、64
・・・ポーズ・キ特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部 ノ 1 図 イ 2 m )X3ffi −′f 4 閏 )! ■ 閏 特開昭GO−120400(5) ぞ 6 図 間 上台 ■ Yes くべ一υ史(里〉 ■ 希pプロンプト 表示 ■ 斧P計K FK(渭7偽ンキー) ■・□。7 ■ 辞書リグリア ■ ■ 送り 7 闘 重B作可?
FIG. 1 is a diagram showing an example of the configuration of a voice recognition device, FIG. 2 is a diagram showing an example of the configuration of a handy panel, FIG. 3 is a diagram showing an example of the configuration of an embodiment of the present invention, and FIG. A diagram showing a screen image of a display to which the present invention is applied; FIG. 5 is a diagram showing an example of definition of function keys on a keyboard to which the present invention is applied; FIG. 6 explains the flow of processing by the controller in registration mode. It is a diagram. 1... Controller, 2... Display, 3...
・Keyboard, 4... Voice recognition unit, 5... Microphone, 6... Handy panel, 61... Forward J) key, 62... Return key, 63... Re-registration key, 64
... Pose Ki Patent Applicant Fujitsu Ltd. Representative Patent Attorney Kyo Tani 4 Section 1 Figure I 2 m)X3ffi -'f 4 Leap)! ■ Entokukai Showa GO-120400 (5) 6 Uedai ■ Yes Kubeichi υ history (sato) ■ Nozomi p prompt display ■ Ax P meter K FK (歭7 false key) ■・□.7 ■ Dictionary Liguria ■ ■ Send 7 Fight Heavy B work possible?

Claims (1)

【特許請求の範囲】[Claims] 音声認識を行う音声認識ユニットと、ディスプレイと、
キーボードと、全体の入出力を制御するコントローラと
を具備した音声認識装置において、キーボードにファン
クション・キーを設けると共に、コントローラは、音声
特徴量を作成するための音声登録処理ではファンクショ
ン・キーに音声登録処理用のプロンプトの送シや戻し、
ポーズ、再登録、終了などの機能を定義すると共に、音
声登録処理における初期登録を登録済辞書の修正/追加
を行う学習処理よりも優先度を上げ、学習処理と認識処
理の結果や状態、コマンド入力フィールドをディスプレ
イ上に表示する処理を行うように構成されたことを特徴
とする音声認識装置。
A voice recognition unit that performs voice recognition, a display,
In a speech recognition device equipped with a keyboard and a controller that controls overall input/output, the keyboard is provided with function keys, and the controller registers speech to the function keys in speech registration processing for creating speech features. Send and return prompts for processing,
In addition to defining functions such as pause, re-registration, and termination, the initial registration in the voice registration process is prioritized over the learning process that corrects/adds registered dictionaries, and the results, status, and commands of the learning process and recognition process are defined. A speech recognition device characterized in that it is configured to perform a process of displaying an input field on a display.
JP58228274A 1983-12-02 1983-12-02 Voice recognition equipment Pending JPS60120400A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58228274A JPS60120400A (en) 1983-12-02 1983-12-02 Voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58228274A JPS60120400A (en) 1983-12-02 1983-12-02 Voice recognition equipment

Publications (1)

Publication Number Publication Date
JPS60120400A true JPS60120400A (en) 1985-06-27

Family

ID=16873906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58228274A Pending JPS60120400A (en) 1983-12-02 1983-12-02 Voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS60120400A (en)

Similar Documents

Publication Publication Date Title
JP6570651B2 (en) Voice dialogue apparatus and voice dialogue method
US8831956B2 (en) Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
US7684985B2 (en) Techniques for disambiguating speech input using multimodal interfaces
JPH0863330A (en) Voice input device
JPS58195957A (en) Program starting system by voice
JP2001034293A (en) Method and device for transferring voice
JP2005331882A (en) Voice recognition device, method, and program
JP2002116796A (en) Voice processor and method for voice processing and storage medium
JP2003076389A (en) Information terminal having operation controlled through touch screen or voice recognition and instruction performance method for this information terminal
JPH11161464A (en) Japanese sentence preparing device
JPH08166866A (en) Editing support system equipped with interactive interface
US20200342872A1 (en) Robot teaching device
JPS60120400A (en) Voice recognition equipment
TWI582756B (en) A method of switching input mode, a mobile communication device, and a computer readable medium
JP7063843B2 (en) Robot teaching device
JPS60146327A (en) Computer conversation method
JPH064264A (en) Voice input/output system
GB2344917A (en) Speech command input recognition system
Hess et al. “Could you please repeat that?” Speech design best practices for minimizing errors
JPH07120156B2 (en) Specific speaker voice registration method
JPS5864548A (en) Japanese voice processing system
JPS58195952A (en) Operator guidance controlling system by voice
JPS61196360A (en) Word processor
JP2006133296A (en) Voice interactive device
JPH11338493A (en) Information processor and processing method, and offering medium