JPH0757336A - Sound input operation device - Google Patents

Sound input operation device

Info

Publication number
JPH0757336A
JPH0757336A JP5200706A JP20070693A JPH0757336A JP H0757336 A JPH0757336 A JP H0757336A JP 5200706 A JP5200706 A JP 5200706A JP 20070693 A JP20070693 A JP 20070693A JP H0757336 A JPH0757336 A JP H0757336A
Authority
JP
Japan
Prior art keywords
operation command
vtr
voice
command
frequency distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5200706A
Other languages
Japanese (ja)
Other versions
JP3703502B2 (en
Inventor
Hideo Nakaya
秀雄 中屋
Tetsujiro Kondo
哲二郎 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP20070693A priority Critical patent/JP3703502B2/en
Publication of JPH0757336A publication Critical patent/JPH0757336A/en
Application granted granted Critical
Publication of JP3703502B2 publication Critical patent/JP3703502B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To improve a recognition rate of an operation command and to improve the reliability. CONSTITUTION:The sound signal S11 of the operation command by a sound input is supplied to a voice recognition board 14, and a most likeliest operation command candidate and a semi-likeliest operation command candidate are extracted, and the numbers data are fetched to a CPU board 15. In the CPU board 15, while considering a frequency distribution, the operation command with higher probability is selected from two operation command candidates to be made an execution operation command, and when the execution operation command concerned is suitable, a control command is transferred to a VTR 17. Thus, the VTR 17 becomes an operation mode corresponding to the operation command sound inputted from a microphone 12. Since the operation command with higher probability is preferentially selected according to the frequency distribution data among from the operation command candidates, the recognition rate of the operation command is increased. Further, the unsuitable operation command is eliminated, and the abnormal operation of the VTR 17 is prevented.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、音声入力によって被
操作機器、例えばVTRを操作する音声入力操作装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice input operation device for operating a device to be operated, such as a VTR, by voice input.

【0002】[0002]

【従来の技術】従来、図9に示すように、音声入力によ
ってVTR等の情報記録再生装置を操作する音声入力操
作装置が提案されている。
2. Description of the Related Art Conventionally, as shown in FIG. 9, a voice input operation device for operating an information recording / reproducing device such as a VTR by voice input has been proposed.

【0003】図9において、1は音声認識手段を有して
なる音声入力操作装置である。この音声入力操作装置1
では、マイクロホン2より供給される音声信号S1に基
づいて操作コマンドの認識が行なわれる。そして、音声
入力操作装置1からは、その認識された操作コマンドS
2がVTR等の情報記録再生装置3に供給される。
In FIG. 9, reference numeral 1 is a voice input operation device having voice recognition means. This voice input operation device 1
Then, the operation command is recognized based on the audio signal S1 supplied from the microphone 2. Then, from the voice input operation device 1, the recognized operation command S
2 is supplied to an information recording / reproducing device 3 such as a VTR.

【0004】[0004]

【発明が解決しようとする課題】ところが、VTR等の
情報記録再生装置3は多様な動作モードをもっており、
現在の動作モードから直接切り換えてはならない禁止モ
ードがある。この禁止モードが無視されて異常な操作コ
マンドS2が情報記録再生装置3に供給される場合に
は、情報記録再生装置3に混乱が生じて異常動作をする
おそれがある。
However, the information recording / reproducing apparatus 3 such as a VTR has various operation modes,
There is a prohibit mode that should not be directly switched from the current operation mode. When this prohibition mode is ignored and an abnormal operation command S2 is supplied to the information recording / reproducing apparatus 3, the information recording / reproducing apparatus 3 may be confused and operate abnormally.

【0005】情報記録再生装置3に異常な操作コマンド
S2が供給される原因として次のような場合がある。例
えば、音声信号S1が音声入力操作装置1に供給される
際に雑音が混入し、音声入力操作装置1で音声認識を誤
る場合である。また例えば、音声入力による操作に不慣
れなオペレータが誤った内容の操作コマンドを音声入力
する場合である。
The cause of the abnormal operation command S2 being supplied to the information recording / reproducing apparatus 3 is as follows. For example, there is a case where noise is mixed when the voice signal S1 is supplied to the voice input operation device 1, and the voice input operation device 1 misrecognizes the voice. Further, for example, there is a case where an operator who is unfamiliar with the operation by voice input inputs an operation command having incorrect contents by voice.

【0006】これらの理由により、音声入力による情報
記録再生装置3の操作には実用上信頼性が不充分であっ
た。
For these reasons, the reliability of the operation of the information recording / reproducing apparatus 3 by voice input is not sufficient for practical use.

【0007】そこで、本出願人は先に、操作コマンドが
現在の情報記録再生装置のステータス(動作モード)か
らみて不適切である場合はこれを排除し、情報記録再生
装置を動作させないようにすることで、信頼性を向上で
きるものを提案した(特開昭61−172239号公報
参照)。これによれば、情報記録再生装置の誤動作は防
止できるが、操作コマンドの認識率を向上させることに
は寄与していない。
Therefore, the applicant first removes the operation command from the current status (operation mode) of the information recording / reproducing apparatus when it is inappropriate, and prevents the information recording / reproducing apparatus from operating. Therefore, a device that can improve reliability has been proposed (see Japanese Patent Laid-Open No. 61-172239). According to this, the malfunction of the information recording / reproducing apparatus can be prevented, but it does not contribute to improving the recognition rate of the operation command.

【0008】そこで、この発明では、操作コマンドの認
識率を向上させ、信頼性の向上を図るものである。
Therefore, in the present invention, the recognition rate of the operation command is improved and the reliability is improved.

【0009】[0009]

【課題を解決するための手段】請求項1の発明に係る音
声入力操作装置は、音声入力による操作コマンドを認識
して被操作機器に対する所定個数の操作コマンド候補を
得る音声認識手段と、ある操作コマンドから次の操作コ
マンドへの度数分布データを格納するメモリ手段と、音
声認識手段で得られる操作コマンド候補の中からメモリ
手段に格納されている度数分布データに従って確率の高
い操作コマンドを優先的に選択する操作コマンド選択手
段とを備え、操作コマンド選択手段で選択される操作コ
マンドを被操作機器に供給するものである。
According to a first aspect of the present invention, there is provided a voice input operation device which recognizes an operation command by voice input to obtain a predetermined number of operation command candidates for an operated device, and a certain operation. The memory means for storing the frequency distribution data from the command to the next operation command and the operation command having a high probability in accordance with the frequency distribution data stored in the memory means are preferentially selected from the operation command candidates obtained by the voice recognition means. The operation command selecting means for selecting is provided, and the operation command selected by the operation command selecting means is supplied to the operated device.

【0010】請求項2の発明に係る音声入力装置は、音
声入力による操作コマンドを認識して被操作機器に対す
る所定個数の操作コマンド候補を得る音声認識手段と、
ある操作コマンドから次の操作コマンドへの度数分布デ
ータを格納するメモリ手段と、音声認識手段で得られる
操作コマンド候補の中からメモリ手段に格納されている
度数分布データに従って確率の高い操作コマンドを優先
的に選択する操作コマンド選択手段と、被操作機器のス
テータスを操作コマンド選択手段で選択された操作コマ
ンドに対応するステータスに変更することが適切か否か
を判断する操作コマンド適否判断手段とを備え、操作コ
マンド適否判断手段で適切であると判断された操作コマ
ンドを被操作機器に供給するものである。
A voice input device according to a second aspect of the present invention includes voice recognition means for recognizing an operation command by voice input to obtain a predetermined number of operation command candidates for the operated device.
A memory means for storing frequency distribution data from one operation command to the next operation command, and an operation command having a high probability is prioritized among the operation command candidates obtained by the voice recognition means according to the frequency distribution data stored in the memory means. And an operation command suitability determination means for determining whether it is appropriate to change the status of the operated device to the status corresponding to the operation command selected by the operation command selection means. The operation command appropriateness is judged by the operation command suitability judging means and is supplied to the operated device.

【0011】請求項3の発明に係る音声入力操作装置
は、請求項1または2の発明において、被操作機器に操
作コマンドが供給される毎に、メモリ手段の度数分布デ
ータを自動的に更新するものである。
According to a third aspect of the present invention, in the voice input operation device according to the first or second aspect, the frequency distribution data of the memory means is automatically updated every time an operation command is supplied to the operated device. It is a thing.

【0012】[0012]

【作用】請求項1の発明においては、音声認識によって
所定個数の操作コマンド候補を得、その操作コマンド候
補の中から度数分布データに従って確率の高い操作コマ
ンドを優先的に選択するものであり、操作コマンドの認
識率を上げることができ、信頼性を向上させることが可
能となる。
According to the first aspect of the invention, a predetermined number of operation command candidates are obtained by voice recognition, and an operation command having a high probability is preferentially selected from the operation command candidates according to the frequency distribution data. The command recognition rate can be increased, and the reliability can be improved.

【0013】請求項2の発明においては、音声認識によ
って所定個数の操作コマンド候補を得、その操作コマン
ド候補の中から度数分布データに従って確率の高い操作
コマンドを優先的に選択するものであり、操作コマンド
の認識率を上げることができ、信頼性を向上させること
が可能となる。また、被操作機器のステータスを上記選
択された操作コマンドに対応するステータスに変更する
ことが適切でないときは、その操作コマンドを被操作機
器に供給しないため、被操作機器の誤動作を防止でき、
これによっても信頼性を向上させることが可能となる。
According to the second aspect of the invention, a predetermined number of operation command candidates are obtained by voice recognition, and an operation command with a high probability is preferentially selected from the operation command candidates according to the frequency distribution data. The command recognition rate can be increased, and the reliability can be improved. Further, when it is not appropriate to change the status of the operated device to the status corresponding to the selected operation command, the operation command is not supplied to the operated device, and thus the malfunction of the operated device can be prevented,
This also makes it possible to improve reliability.

【0014】請求項3の発明においては、被操作機器に
操作コマンドが供給される毎にメモリ手段の度数分布デ
ータが自動的に更新されるため、オペレータによる偏り
をなくすことが可能となる。
According to the third aspect of the present invention, since the frequency distribution data of the memory means is automatically updated every time an operation command is supplied to the operated device, it is possible to eliminate bias by the operator.

【0015】[0015]

【実施例】以下、図1を参照しながら、この発明の一実
施例について説明する。本例は、VTRを操作するよう
にした例である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to FIG. In this example, the VTR is operated.

【0016】図において、11は音声入力操作装置であ
る。マイクロホン12からの音声信号S11は音声認識
システム13を構成する音声認識ボード14に供給され
る。音声認識ボード14にはCPU(中央処理ユニッ
ト)ボード15よりコントロールコマンドが供給され、
音声信号S11で指定される操作コマンドの認識が行な
われ、その認識データはCPUボード15に取り込まれ
る。
In the figure, 11 is a voice input operation device. The voice signal S11 from the microphone 12 is supplied to the voice recognition board 14 which constitutes the voice recognition system 13. A control command is supplied from the CPU (central processing unit) board 15 to the voice recognition board 14,
The operation command designated by the voice signal S11 is recognized, and the recognition data is taken into the CPU board 15.

【0017】また、CPUボード15では、VTR17
よりVTRインタフェース16を介して供給されるステ
ータスデータを参照しながら、認識データを処理し、そ
の処理結果に基づいてVTR17に対するコントロール
コマンドを発生する。このコントロールコマンドは、V
TRインタフェース16を介してVTR17に供給され
る。これにより、VTR17はマイクロホン12より音
声入力された操作コマンドに応じた動作モードに制御さ
れる。
The CPU board 15 has a VTR 17
Further, the recognition data is processed while referring to the status data supplied via the VTR interface 16, and a control command for the VTR 17 is generated based on the processing result. This control command is V
It is supplied to the VTR 17 via the TR interface 16. As a result, the VTR 17 is controlled to the operation mode corresponding to the operation command input by voice from the microphone 12.

【0018】これと同時に、CPUボード15はオペレ
ータがなすべき操作等についてのメッセージデータを発
生する。このメッセージデータはLCDインタフェース
18を介して表示手段としてのLCD(液晶表示素子)
モジュール19に供給され、LCDモジュール19にオ
ペレータがなすべき操作等のメッセージが表示される。
これにより、音声入力操作装置11は、オペレータがL
CDモジュール19に表示されるメッセージを読み取っ
て対話しながら、VTR17に対する操作コマンドを次
々に音声入力し得るようにされる。
At the same time, the CPU board 15 generates message data regarding the operation or the like to be performed by the operator. This message data is displayed on an LCD (liquid crystal display element) as a display means via the LCD interface 18.
The message is supplied to the module 19 and the LCD module 19 displays a message such as an operation to be performed by the operator.
As a result, the operator of the voice input operation device 11 is L
While reading and interacting with the message displayed on the CD module 19, operation commands for the VTR 17 can be sequentially input by voice.

【0019】なお、20はキーボードであり、このキー
ボード20を用いて1つのプログラムが終了するごとに
確認動作をするためのデータを入力し、またはプログラ
ムの途中でインターラプトを入力し得るようになされて
いる。
Reference numeral 20 denotes a keyboard, which is used to input data for confirming operation each time one program ends or to input an interrupt in the middle of the program. ing.

【0020】図2は、音声認識ボード14の構成を示し
ている。
FIG. 2 shows the configuration of the voice recognition board 14.

【0021】図において、マイクロホン12から供給さ
れる音声信号S11はアナログインタフェース14Aを
介して演算プロセッサ14Bに供給される。ここで、ア
ナログインタフェース14Aは、システムコントローラ
14Cから供給される制御データS12によって音声信
号S11のレベルを制御すると共に、この音声信号S1
1をディジタル音声信号S13に変換してシリアルデー
タとして演算プロセッサ14Bに供給する。
In the figure, the audio signal S11 supplied from the microphone 12 is supplied to the arithmetic processor 14B via the analog interface 14A. Here, the analog interface 14A controls the level of the audio signal S11 by the control data S12 supplied from the system controller 14C, and the audio signal S1.
1 is converted into a digital audio signal S13 and supplied as serial data to the arithmetic processor 14B.

【0022】演算プロセッサ14Bは、アナログインタ
フェース14Aより供給されるディジタル音声信号S1
3を、ディジタルフィルタによって複数、例えば8チャ
ネルに分けて周波数分析することによって音声パターン
を形成すると共に、音声の発生速度の変動による音声パ
ターンの時間的な歪みを修正する(これを「時間軸正規
化」と呼ぶ)。そして、演算プロセッサ14Bは、この
時間軸正規化された検出音声パターンを標準パターン登
録メモリ14Dに登録されている全ての標準パターンと
比較してパターン間のマッチング距離(時間軸正規化距
離)を算出するマッチング処理をし、マッチング距離が
最も小さい標準パターンの登録番号データを最有力操作
コマンド候補CNO1として抽出し、マッチング距離が
2番目に小さい標準パターンの登録番号データが準有力
操作コマンド候補CNO2として抽出する。
The arithmetic processor 14B has a digital audio signal S1 supplied from the analog interface 14A.
3 is divided into a plurality of channels, for example, 8 channels by a digital filter and frequency analysis is performed to form a voice pattern, and temporal distortion of the voice pattern due to fluctuations in voice generation speed is corrected (this is referred to as "time axis normalization"). Called ")." Then, the arithmetic processor 14B calculates the matching distance (time-axis normalized distance) between the patterns by comparing this time-axis-normalized detected voice pattern with all the standard patterns registered in the standard pattern registration memory 14D. The registration number data of the standard pattern with the smallest matching distance is extracted as the most probable operation command candidate CNO1, and the registration number data of the standard pattern with the second smallest matching distance is extracted as the quasi-potential operation command candidate CNO2. To do.

【0023】ここで、標準パターン登録メモリ14Dに
は、オペレータがVTR17に対する操作コマンドをマ
イクロホン12より音声入力したとき、その音声信号S
11をディジタル周波数分析して、その結果を標準パタ
ーンとして登録番号を付して格納する。標準パターン登
録メモリ14Dへの標準パターンの登録処理は、VTR
17に対する制御動作に入る前に、マイクロホン12、
アナログインタフェース14A、演算プロセッサ14B
を用いて実行される。
Here, when the operator inputs an operation command for the VTR 17 by voice into the standard pattern registration memory 14D from the microphone 12, the voice signal S is output.
11 is subjected to digital frequency analysis, and the result is stored as a standard pattern with a registration number. The registration process of the standard pattern in the standard pattern registration memory 14D is performed by VTR.
Before entering the control operation for 17, the microphone 12,
Analog interface 14A, arithmetic processor 14B
Is performed using.

【0024】システムコントローラ14Cは、この標準
パターン登録メモリ14Dへの標準パターンの格納処理
動作および演算プロセッサ14Bにおけるマッチング処
理動作を、CPUボード15の制御の下に、クロック発
生回路14Eにおいて発生されるクロックのタイミング
で制御する。
Under the control of the CPU board 15, the system controller 14C controls the standard pattern registration memory 14D by storing a standard pattern in the standard pattern registration memory 14D and the matching processing operation by the arithmetic processor 14B. Control at the timing of.

【0025】上述したように演算プロセッサ14Bで実
行されたマッチング処理で抽出された最有力操作コマン
ド候補CNO1および準有力操作コマンド候補CNO2
の登録番号データは、例えばシリアル入出力装置でなる
インタフェース14Fを介して、CPUボード15のバ
ス15Aに供給される。
The most probable operation command candidate CNO1 and the quasi-potential operation command candidate CNO2 extracted by the matching processing executed by the arithmetic processor 14B as described above.
The registration number data of is supplied to the bus 15A of the CPU board 15 via the interface 14F formed of, for example, a serial input / output device.

【0026】ここで、システムコントローラ14Cは、
CPUボード15のCPU15B(図6参照)をホスト
プロセッサとして、コントロールコマンドデータを受け
ると共に、現在の動作状態を表すステータスコードデー
タをCPUボード15のCPU15Bに送出する。
Here, the system controller 14C is
The CPU 15B of the CPU board 15 (see FIG. 6) is used as a host processor to receive control command data and send status code data representing the current operating state to the CPU 15B of the CPU board 15.

【0027】なお、音声認識ボード14としては、例え
ば日本電気株式会社から市販されている「音声認識LS
Iセット」を使用し得る。
The voice recognition board 14 is, for example, "Voice Recognition LS" commercially available from NEC Corporation.
I set ”may be used.

【0028】図3は、VTRインタフェース16の構成
を示している。
FIG. 3 shows the structure of the VTR interface 16.

【0029】VTRインタフェース16は、CPUボー
ド15のバス15Aにプロセッサ入出力装置(PIO)
16Aを介して結合されたデコーダ16Bおよびエンコ
ーダ16Cを有する。
The VTR interface 16 connects the processor board input / output device (PIO) to the bus 15A of the CPU board 15.
It has a decoder 16B and an encoder 16C coupled via 16A.

【0030】デコーダ16Bには、CPUボード15か
らコントロールコマンドCMDに対応するコードデータ
CODE1がプロセッサ入出力装置16Aを介して供給
される。コントロールコマンドCMDは、図4に示すよ
うに19種類ある。デコーダ16BはコードデータCO
DE1をラッチ回路16B1に取り込み、そのラッチ出
力をデコード回路16B2に供給する。
Code data CODE1 corresponding to the control command CMD is supplied from the CPU board 15 to the decoder 16B via the processor input / output device 16A. There are 19 types of control commands CMD, as shown in FIG. The decoder 16B uses the code data CO
DE1 is taken into the latch circuit 16B1 and the latch output is supplied to the decode circuit 16B2.

【0031】デコード回路16B2はROMでなり、図
4のコードデータCODE1をドライバ駆動データDR
Dに変換してドライバ16B3に供給する。これによ
り、ドライバ16B3からVTR17に対して、その動
作モードを切り換え制御できる信号形式の駆動コマンド
データDRVが送出される。
The decoding circuit 16B2 is a ROM, and the code data CODE1 of FIG. 4 is converted into the driver drive data DR.
It is converted to D and supplied to the driver 16B3. As a result, the driver 16B3 sends to the VTR 17 the drive command data DRV in a signal format capable of controlling the switching of the operation mode.

【0032】また、エンコーダ16Cは、VTR17の
現在の動作モードを示すステータスデータSTATUS
をレシーバ16C1に受けて、ROM構成のエンコード
回路16C2に供給する。エンコード回路16C2は、
図5に示すように12種類のステータスデータSTAT
USを対応するコードデータCODE2に変換するもの
である。このエンコード回路16C2より出力されるコ
ードデータCODE2はラッチ回路16C3でラッチさ
れ、されにプロセッサ入出力装置16Aを介してCPU
ボード15のバス15Aに出力される。
Further, the encoder 16C has status data STATUS indicating the current operation mode of the VTR 17.
Is received by the receiver 16C1 and supplied to the ROM-configured encoding circuit 16C2. The encoding circuit 16C2 is
As shown in FIG. 5, 12 types of status data STAT
It is for converting the US into the corresponding code data CODE2. The code data CODE2 output from the encoding circuit 16C2 is latched by the latch circuit 16C3, and then the CPU via the processor input / output device 16A.
It is output to the bus 15A of the board 15.

【0033】また、VTRインタフェース16は、VT
R17においてテープから再生された制御パルス信号C
TLを制御パルスレシーバ16Dに受けて、そのタイミ
ングに同期するインターラプト信号INTをプロセッサ
入出力装置16Aを介してCPUボード15のバス15
Aに供給すると共に、制御パルスレシーバ16Dの出力
をエンコーダ16Cのラッチ回路16C3にラッチ信号
として供給することによって、ステータス信号STAT
USに対応するコードデータCODE2をVTR17の
再生動作と同期させながらCPUボード15側に取り込
ませるようになされている。
The VTR interface 16 uses the VT
Control pulse signal C reproduced from the tape at R17
The control pulse receiver 16D receives the TL, and the interrupt signal INT synchronized with the timing is supplied to the bus 15 of the CPU board 15 via the processor input / output device 16A.
By supplying the output of the control pulse receiver 16D to the latch circuit 16C3 of the encoder 16C as a latch signal, the status signal STAT
The code data CODE2 corresponding to US is loaded into the CPU board 15 side in synchronization with the playback operation of the VTR 17.

【0034】図6は、CPUボード15の構成を示して
いる。
FIG. 6 shows the configuration of the CPU board 15.

【0035】CPUボード15は、音声認識ボード14
からバス15Aに転送されてきたデータをCPU15B
を介してメモリ15Cに格納し、またVTRインタフェ
ース16からバス15Aに転送されてきたデータを、C
PU15Bを介してメモリ15Cに格納する。メモリ1
5Cは、音声認識ボード用メモリ部15C1、VTR用
メモリ部15C2、メッセージメモリ部15C3および
度数分布メモリ部15C4を有する。
The CPU board 15 is the voice recognition board 14.
Data transferred from the bus 15A to the CPU 15B
The data stored in the memory 15C via the VTR interface 16 and transferred to the bus 15A from the VTR interface 16 is transferred to the C
The data is stored in the memory 15C via the PU 15B. Memory 1
5C has a voice recognition board memory unit 15C1, a VTR memory unit 15C2, a message memory unit 15C3, and a frequency distribution memory unit 15C4.

【0036】音声認識ボード用メモリ部15C1は、R
OMおよびRAMで構成され、音声認識ボード14を駆
動制御するために必要なコントロールコマンドを予めR
OMに格納し、このコントロールコマンドを必要に応じ
読み出して音声認識ボード14に転送するようになされ
ている。また音声認識ボード14からその現在の動作モ
ードを示すステータスデータおよび音声パターン登録番
号データが転送されてきたとき、これをRAMに一時記
憶し、このステータスデータに基づいて、その後音声認
識ボード14およびVTR17に対して転送すべきコン
トロールコマンドを決定するようになされている。
The voice recognition board memory unit 15C1 is R
It is composed of OM and RAM, and the control command necessary for driving and controlling the voice recognition board 14 is previously R
The control command is stored in the OM, read out as needed, and transferred to the voice recognition board 14. Further, when the status data indicating the current operation mode and the voice pattern registration number data are transferred from the voice recognition board 14, this is temporarily stored in the RAM, and then the voice recognition board 14 and the VTR 17 are based on this status data. The control command to be transferred is determined.

【0037】また、VTR用メモリ部15C2は、同様
にROMおよびRAMで構成され、VTR17を駆動制
御するために必要なコントロールコマンドを予めROM
に格納し、このコントロールコマンドを必要に応じて読
み出してVTR17に転送するようになされている。こ
れに対して、VTR17からその現在の動作モードを表
すステータスデータが転送されてきたとき、これをRA
Mに一時記憶する。度数分布メモリ部15C4は、バッ
テリでバックアップされた書き換え可能メモリで構成さ
れ、図7に示すように現在のVTR17のステータスか
ら次に実行される操作コマンドの対応度数分布データを
格納するためのものである。CPU15Bは、VTR用
メモリ部15C2に格納されたステータスデータおよび
度数分布メモリ部15C4に格納された度数分布データ
を用いて、音声認識ボード14から供給される最有力操
作コマンド候補CNO1および準有力操作コマンド候補
CNO2に対応する登録番号データに対応した操作コマ
ンドをVTR17に転送すべきか否かを判断する。
The VTR memory section 15C2 is also composed of a ROM and a RAM, and a control command necessary for driving and controlling the VTR 17 is stored in the ROM in advance.
The control command is stored in the VTR 17, and is read out as needed to be transferred to the VTR 17. On the other hand, when the status data indicating the current operation mode is transferred from the VTR 17, this is transferred to RA.
Temporarily store in M. The frequency distribution memory unit 15C4 is composed of a rewritable memory backed up by a battery, and stores the frequency distribution data corresponding to the operation command to be executed next from the current status of the VTR 17, as shown in FIG. is there. The CPU 15B uses the status data stored in the VTR memory unit 15C2 and the frequency distribution data stored in the frequency distribution memory unit 15C4 to supply the most probable operation command candidate CNO1 and the semi-potential operation command supplied from the voice recognition board 14. It is determined whether or not the operation command corresponding to the registration number data corresponding to the candidate CNO2 should be transferred to the VTR 17.

【0038】また、メッセージメモリ部15C3には、
LCDモジュール19に表示すべきメッセージについて
のデータが格納されており、CPU15Bが音声認識ボ
ード14およびVTR17から転送されてきたデータに
基づいて、オペレータに対して提示すべきメッセージデ
ータをメッセージメモリ部15C3から読み出してLC
Dインタフェース18を介してLCDモジュール19に
供給できるようになされている。
Further, the message memory unit 15C3 includes
Data about a message to be displayed is stored in the LCD module 19, and the CPU 15B sends message data to be presented to the operator from the message memory unit 15C3 based on the data transferred from the voice recognition board 14 and the VTR 17. Read and LC
The LCD module 19 can be supplied through the D interface 18.

【0039】また、キーボード20から入力された認識
またはインターラプトデータは、プロセッサ入出力装置
15Dを介してCPU15Bに読み込まれる。
The recognition or interrupt data input from the keyboard 20 is read by the CPU 15B via the processor input / output device 15D.

【0040】さらにCPUボード15には、カウンタタ
イマコントローラ15Eが設けられ、VTRインタフェ
ース16から転送されてくる制御パルス信号CTLのパ
ルス数を計数したり、音声パターン登録番号データが入
力される際の継続時間を計測したりする等の機能を、C
PU15Bの制御の下で、実行するようになされてい
る。
Further, the CPU board 15 is provided with a counter timer controller 15E for counting the number of pulses of the control pulse signal CTL transferred from the VTR interface 16 and continuing when voice pattern registration number data is input. Functions such as measuring time are
It is designed to be executed under the control of the PU 15B.

【0041】以上の構成において、CPUボード15の
CPU15Bは、図8に示す処理手順に従って、VTR
17を操作コマンド入力手段としてのマイクロホン12
より供給される音声信号S11に基づいて駆動制御す
る。
In the above configuration, the CPU 15B of the CPU board 15 follows the VTR according to the processing procedure shown in FIG.
Reference numeral 17 is a microphone 12 as an operation command input means.
The drive control is performed based on the audio signal S11 supplied from the device.

【0042】ステップSP1においてシステム全体に対
して電源が供給されると、CPU15BはステップSP
2に移り、音声認識ボード用メモリ部15C1からコン
トロールコマンドを読み出して音声認識ボード14のシ
ステムコントローラ14Cに転送することによって音声
入力レベルの調整を実行させる。システムコントローラ
14Cは、ステップSP3において、マイクロホン12
から操作コマンド1語分の音声信号S11が入力された
とき、アナログインタフェース14Aによって音声信号
S11の信号レベルを制御し、次のステップSP4にお
いて、その出力信号S13の信号レベルが基準レベルと
一致しているか否かの判断をする。否定結果が得られる
と、CPU15BはステップSP2に戻って、再度アナ
ログインタフェース14Aのレベル調整動作を実行さ
せ、以後当該1語分の音声信号S11の信号レベルが基
準レベルになるまでかかる動作が繰り返される。その結
果、アナログインタフェース14Aの出力信号S13の
信号レベルか基準レベルになると、ステップSP4にお
いて肯定結果が得られることにより、次のステップSP
5に移る。
When power is supplied to the entire system in step SP1, the CPU 15B determines in step SP
2, the control command is read from the voice recognition board memory unit 15C1 and transferred to the system controller 14C of the voice recognition board 14 to adjust the voice input level. The system controller 14C, in step SP3, the microphone 12
When the voice signal S11 for one operation command is input from the analog interface 14A, the signal level of the voice signal S11 is controlled by the analog interface 14A, and in the next step SP4, the signal level of the output signal S13 matches the reference level. Judge whether or not. When a negative result is obtained, the CPU 15B returns to step SP2 to execute the level adjustment operation of the analog interface 14A again, and thereafter, this operation is repeated until the signal level of the audio signal S11 for the one word reaches the reference level. . As a result, when the signal level of the output signal S13 of the analog interface 14A or the reference level is reached, a positive result is obtained in step SP4, so that the next step SP
Go to 5.

【0043】このようにして、CPU15Bは、マイク
ロホン12から入力される音声信号S11の信号レベル
を所定の基準レベルに合わせるように正規化し、これに
よりオペレータによる操作コマンドの音声入力レベルの
差異の影響を除去するようになされている。
In this way, the CPU 15B normalizes the signal level of the voice signal S11 input from the microphone 12 so as to match the predetermined reference level, and thereby the influence of the difference in the voice input level of the operation command by the operator. It is designed to be removed.

【0044】次に、CPU15Bは、ステップSP5に
おいて、音声認識ボード14のシステムコントローラ1
4Cを標準パターン登録モードに制御する。このときシ
ステムコントローラ14Cは、ステップSP6において
現在マイクロホン12から入力されている音声信号S1
1の1語分のデータを演算プロセッサ14Bに取り込ま
せてその周波数成分の分析を行わせることにより標準パ
ターンデータを検出させる。CPU15Bは、音声認識
ボード14から転送されてくるステータスデータに基づ
き、ステップSP7において、この1語分の操作コマン
ドの検出動作が終了したか否かを確認し、検出動作が終
了していない間は、再度ステップSP5に戻って標準パ
ターンの検出動作を引続き実行させる。
Next, in step SP5, the CPU 15B causes the system controller 1 of the voice recognition board 14 to operate.
4C is controlled to the standard pattern registration mode. At this time, the system controller 14C causes the audio signal S1 currently input from the microphone 12 in step SP6.
The standard pattern data is detected by fetching the data for one word of 1 into the arithmetic processor 14B and analyzing the frequency component. Based on the status data transferred from the voice recognition board 14, the CPU 15B confirms in step SP7 whether or not the detection operation of the operation command for one word is completed, and while the detection operation is not completed, Then, the process returns to step SP5 again, and the standard pattern detection operation is continuously executed.

【0045】このようにして、1語分の標準パターンデ
ータの検出が終了すると、当該検出された音声パターン
に一連の登録番号を付して登録パターンとして標準パタ
ーン登録メモリ14Dに格納する。その結果、CPU1
5BはステップSP7において肯定結果を得ることによ
ってステップSP8に移り、全ての操作命令についての
標準パターンの登録が終了したか否かを判断する。
In this way, when the detection of the standard pattern data for one word is completed, a series of registration numbers are attached to the detected voice pattern and stored in the standard pattern registration memory 14D as a registration pattern. As a result, CPU1
5B moves to step SP8 by obtaining a positive result in step SP7, and determines whether or not the registration of the standard pattern for all operation commands is completed.

【0046】ここで、否定結果が得られると、CPU1
5Bは再度ステップSP5に戻って、次の操作コマンド
についての音声信号S11によって操作コマンド1語分
の標準パターンの検出動作を実行させ、これに登録番号
を付して標準パターン登録メモリ14Dに格納する。
If a negative result is obtained here, the CPU 1
5B again returns to step SP5 to execute the detection operation of the standard pattern for one word of the operation command by the voice signal S11 for the next operation command, and adds the registration number to this to store it in the standard pattern registration memory 14D. .

【0047】以下同様にして、CPU15Bは、全ての
操作コマンドについてマイクロホン12から入力される
音声信号S11に基づいて標準パターンを検出し、この
標準パターンデータを標準パターン登録メモリ14Dに
登録番号を付して格納する。この処理が終了するとCP
U15Bは、ステップSP8において肯定結果を得るこ
とができることにより、標準パターン登録モードについ
ての処理動作を終了して次の操作コマンド認識モードに
入る。なお、標準パターンが登録されたROMを標準パ
ターン登録メモリ14Dとして内蔵し、上述した登録処
理を省略してもよい。
Similarly, the CPU 15B detects a standard pattern based on the voice signal S11 input from the microphone 12 for all operation commands, and assigns the standard pattern data to the standard pattern registration memory 14D with a registration number. To store. When this process ends, CP
Since the U15B can obtain a positive result in step SP8, the U15B ends the processing operation in the standard pattern registration mode and enters the next operation command recognition mode. The ROM in which the standard pattern is registered may be incorporated as the standard pattern registration memory 14D, and the above-described registration processing may be omitted.

【0048】本例の場合、図4に示すようにVTR17
に対して与えることができるコントロールコマンドCM
Dは19種類であり、これに応じてマイクロホン12を
介して標準パターン登録メモリ14Dに登録できる操作
コマンドは、図4のコントロールコマンドCMDと同じ
内容をもち、「STOP」、「PLAY」、・・・、
「RS4(×1/20)」と音声入力することで、各オ
ペレータについての標準パターンが検出され、登録番号
「1」、「2」・・・「19」が付されて登録されるこ
とになる。
In the case of this example, as shown in FIG.
Control command CM that can be given to
There are 19 types of D, and accordingly, the operation commands that can be registered in the standard pattern registration memory 14D via the microphone 12 have the same contents as the control command CMD of FIG. 4, and are “STOP”, “PLAY”, ...・ 、
By inputting "RS4 (x1 / 20)" by voice, the standard pattern for each operator is detected and registered with the registration numbers "1", "2" ... "19". Become.

【0049】またステップSP5〜SP8における音声
認識ボード14の動作状態および登録番号データはステ
ータスデータとしてCPU15Bに転送され、音声認識
ボード14の動作状態が逐次LCDモジュール19に表
示されると共に、標準パターン登録メモリ14Dに登録
された操作コマンドの内容および登録番号がLCDモジ
ュール19に表示される。
The operating state of the voice recognition board 14 and the registration number data in steps SP5 to SP8 are transferred to the CPU 15B as status data, and the operating state of the voice recognition board 14 is sequentially displayed on the LCD module 19 and the standard pattern is registered. The content of the operation command and the registration number registered in the memory 14D are displayed on the LCD module 19.

【0050】CPU15Bは、操作コマンド認識モード
に入ると、ステップSP9において、システムコントロ
ーラ14Cに対し操作コマンド認識モードを実行すべき
ことを内容とするコントロールコマンドを転送する。そ
して、次のステップSP10においてマイクロホン12
を介して音声信号S11が操作コマンド1語分だけ入力
されたとき、CPU15Bはシステムコントローラ14
Cによって音声信号S11をアナログインタフェース1
4Aを介して演算プロセッサ14Bに取り込ませ、周波
数分析を実行することによって入力音声パターンを検出
させ、その後当該検出音声パターンと標準パターン登録
メモリ14Dに登録されている全ての標準パターンとの
マッチング処理を実行する。
When the operation command recognition mode is entered, the CPU 15B transfers a control command instructing execution of the operation command recognition mode to the system controller 14C in step SP9. Then, in the next step SP10, the microphone 12
When the voice signal S11 is input via the operation command for one word, the CPU 15B causes the system controller 14 to operate.
The voice signal S11 is converted to an analog interface 1 by C.
The input voice pattern is detected by being loaded into the arithmetic processor 14B via 4A and performing frequency analysis, and then matching processing of the detected voice pattern and all the standard patterns registered in the standard pattern registration memory 14D is performed. Run.

【0051】この結果、マッチング距離が最も小さい標
準パターンの登録番号データが最有力操作コマンド候補
CNO1として抽出されると共に、マッチング距離が2
番目に小さい標準パターンの登録番号データが準有力操
作コマンド候補CNO2として抽出され、これらの登録
番号データが現在実行されている操作コマンド認識モー
ドにおいて入力された操作コマンドを示すデータとして
CPUボード15のCPU15Bに転送され、メモリ1
5Cの音声認識ボード用メモリ部15C1に格納され
る。
As a result, the registration number data of the standard pattern with the smallest matching distance is extracted as the most probable operation command candidate CNO1, and the matching distance is 2
The registration number data of the second smallest standard pattern is extracted as the semi-potential operation command candidate CNO2, and these registration number data are the data indicating the operation command input in the operation command recognition mode currently being executed. Transferred to the memory 1
It is stored in the voice recognition board memory unit 15C1 of 5C.

【0052】この状態になると、CPU15Bは、上述
した抽出動作の終了をステップSP11において確認
し、ステップSP11において肯定結果を得ることがで
きたとき、次のステップSP12に移る。
In this state, the CPU 15B confirms the end of the above-described extraction operation in step SP11, and when a positive result is obtained in step SP11, moves to the next step SP12.

【0053】なお、ステップSP11では、上述したよ
うに操作コマンド候補CNO1,CNO2を抽出する前
に、例えば音声信号S11の信号レベルが所定のレベル
範囲に入っているか、またはマイクロホン12に音声入
力された操作コマンドの語調が所定の長さ例えば2秒以
内であるか等も判定され、これにより音声信号S11が
図4に示すようなコントロールコマンドCMDに対応す
るものであることを確認する。これにより、音声入力の
認識精度を高めることができる。
In step SP11, before the operation command candidates CNO1 and CNO2 are extracted as described above, for example, the signal level of the audio signal S11 is within a predetermined level range, or audio is input to the microphone 12. It is also determined whether the tone of the operation command has a predetermined length, for example, within 2 seconds, and the like, and it is confirmed that the audio signal S11 corresponds to the control command CMD as shown in FIG. Thereby, the recognition accuracy of the voice input can be improved.

【0054】ステップSP11で音声入力レベルおよび
語調に関して否定結果が得られた場合には、CPU15
Bは当該音声入力データを無視し、ステップSP9に戻
って操作コマンド認識プログラムをやり直すようにされ
ている。
If a negative result is obtained regarding the voice input level and the tone in step SP11, the CPU 15
B ignores the voice input data and returns to step SP9 to redo the operation command recognition program.

【0055】このようにして、操作コマンド候補CNO
1,CNO2を確認すると、CPU15Bは、ステップ
SP12においてVTRインタフェース16を介してV
TR17からステータスデータを読み取って、VTR用
メモリ部15C2に取り込む。そして当該取り込んだス
テータスデータに基づいて、最有力操作コマンド候補C
NO1または準有力操作コマンド候補CNO2をVTR
17に実行させるかどうかの判断をする。
In this way, the operation command candidate CNO
1, CNO2 is confirmed, the CPU 15B sends V through the VTR interface 16 in step SP12.
The status data is read from TR17 and loaded into the VTR memory section 15C2. Then, based on the acquired status data, the most probable operation command candidate C
VTR of NO1 or CNO2, a quasi influential operation command candidate
17 determines whether to execute.

【0056】CPU15Bは、まずステップSP13に
おいて、次の3つの事項についてVTR17のステータ
ス、すなわち現在の動作モードを確認する。
First, in step SP13, the CPU 15B confirms the status of the VTR 17, that is, the current operation mode, for the following three items.

【0057】CPU15Bは、第1にステップSP13
において、「VTR17の電源が入っているか」を確認
し、否定結果が得られたときステップSP15に移って
「Power ON the VTR」というメッセージをLCDモジュ
ール19に表示させた後、ステップSP9に戻って音声
入力をやり直させる。
The CPU 15B firstly executes the step SP13.
At, in the case of confirming "whether the power of the VTR 17 is turned on", and when a negative result is obtained, move to step SP15 to display the message "Power ON the VTR" on the LCD module 19 and then return to step SP9. Retry the voice input.

【0058】また、CPU15Bは、第2にステップS
P13において、「テープがセットされているか」を確
認し、否定結果が得られたときステップSP15に移っ
て「Stand by the Cassette」というメッセージをLC
Dモジュール19に表示させた後、ステップSP9に戻
って音声入力をやり直させる。
The CPU 15B secondly executes the step S
In P13, confirm "whether the tape is set", and if a negative result is obtained, move to step SP15 and display the message "Stand by the Cassette" in LC.
After the display on the D module 19, the process returns to step SP9 and the voice input is performed again.

【0059】また、CPU15Bは、第3にステップS
P13において、「コネクタが接続されているか」を確
認し、否定結果が得られたときはステップSP15に移
って「Connect with the VTR」というメッセージをLC
Dモジュール19に表示させた後、ステップSP9に戻
って音声入力をやり直させる。
Further, the CPU 15B thirdly executes step S.
In P13, it is confirmed whether "the connector is connected". If a negative result is obtained, the process moves to step SP15 and the message "Connect with the VTR" is sent to the LC.
After the display on the D module 19, the process returns to step SP9 and the voice input is performed again.

【0060】これに対して、ステップSP13におい
て、肯定結果が得られると、CPU15Bは次のステッ
プSP20に移る。ステップSP20では、今回入力さ
れた操作コマンドに応じて操作コマンド認識モードで認
識された最有力操作コマンド候補CNO1と準有力操作
コマンド候補CNO2に対して、現在のVTR17のス
テータス(あるいは前回実行した操作コマンド)を考慮
し、以下のように総合判断をする。
On the other hand, when a positive result is obtained in step SP13, the CPU 15B moves to next step SP20. In step SP20, with respect to the most probable operation command candidate CNO1 and the semi-potential operation command candidate CNO2 recognized in the operation command recognition mode according to the operation command input this time, the status of the current VTR 17 (or the operation command previously executed) ), And make a comprehensive judgment as follows.

【0061】図7に示すような現在のVTR17のステ
ータスから次に実行される操作コマンドの対応度数分布
表(TBL)が予め作成されているものとする。これ
は、CPUボード15の度数分布メモリ部15C4に格
納されている。例えば、現在「REC」コマンドが実行
されていて、VTR17のステータスが「REC」状態
になっているとき、次に指示される操作コマンドは、通
常「STOP」が一番度数が多く他の操作コマンドはほ
とんど0度数を示している。図7の度数分布表を参照
し、現在のVTR17のステータスに関連して最も度数
の多い操作コマンドが、最有力操作コマンド候補CNO
1または準有力操作コマンド候補CNO2と一致してい
るかどうか判断する。
It is assumed that a correspondence frequency distribution table (TBL) of operation commands to be executed next is previously created from the current VTR 17 status as shown in FIG. This is stored in the frequency distribution memory unit 15C4 of the CPU board 15. For example, when the “REC” command is currently being executed and the status of the VTR 17 is in the “REC” state, the operation command to be instructed next is usually “STOP” with the highest frequency and other operation commands. Indicates almost 0 degrees. Referring to the frequency distribution table of FIG. 7, the operation command with the highest frequency in relation to the current VTR 17 status is the most likely operation command candidate CNO.
1 or quasi influential operation command candidate CNO2.

【0062】このとき、最も度数の多い操作コマンドが
最有力操作コマンド候補CNO1または準有力操作コマ
ンド候補CNO2と一致している場合は、これを実行操
作コマンドEXECとし、ステップSP14に移り、後
述する禁止モードの判断が行なわれる。なお、現在のV
TR17のステータスが「STOP」の場合は、次の操
作コマンドが特定できないため、最有力操作コマンド候
補CNO1を実行操作コマンドEXECとする。
At this time, if the operation command with the highest frequency coincides with the most probable operation command candidate CNO1 or the quasi-possible operation command candidate CNO2, this is set as the execution operation command EXEC, and the process proceeds to step SP14 and the prohibition described later is carried out. The mode is judged. The current V
When the status of TR17 is "STOP", the next operation command cannot be specified, so the most probable operation command candidate CNO1 is set as the execution operation command EXEC.

【0063】ステップSP20において、最有力操作コ
マンド候補CNO1または準有力操作コマンド候補CN
O2が共に不適切と判断された場合は、「Speak Anothe
r Command」というメッセージをLCDモジュール19
に表示させた後、ステップSP9に戻って新たな操作コ
マンド認識プログラムに入る。
At step SP20, the most promising operation command candidate CNO1 or the semi-possible operation command candidate CN
If both O2 are judged to be inappropriate, "Speak Anothe
LCD Command 19
After that, the process returns to step SP9 to enter a new operation command recognition program.

【0064】ステップSP20における処理は、例えば
入力された操作コマンドが不明瞭、または誤って別の操
作コマンドを発生した場合において、認識されるべき候
補を2つ挙げると共に統計データからより確率的に正し
そうな操作コマンド候補を選択することによって、音声
入力の認識率の積極的な向上が可能となる。
The processing in step SP20 is, for example, when the input operation command is ambiguous or when another operation command is erroneously generated, the two candidates to be recognized are listed and the statistical data is more probabilistically correct. By selecting a likely operation command candidate, the recognition rate of voice input can be positively improved.

【0065】ステップSP20において肯定結果が得ら
れると、CPU15Bは次のステップSP14に移っ
て、VTR17が前回に実行したコマンドと、ステップ
SP20で選択された実行操作コマンドEXECとの関
係をチェックし、これによりステップSP20で判断さ
れた実行操作コマンドEXECの内容がVTR17の動
作モードから考えて適切であるか否かの判断をする。つ
まり、下記の禁止モードのような場合に対して、実行操
作コマンドEXECを実行するかどうかの判断をする。
If a positive result is obtained in step SP20, the CPU 15B moves to the next step SP14 and checks the relationship between the command previously executed by the VTR 17 and the execution operation command EXEC selected in step SP20. Thus, it is determined whether the content of the execution operation command EXEC determined in step SP20 is appropriate considering the operation mode of the VTR 17. That is, it is determined whether or not to execute the execution operation command EXEC in the following prohibition mode.

【0066】実際上、VTR17のシステムコントロー
ラは、VTR17の現在の動作モードから次の動作モー
ドに切り換える際に、切り換えてはならない禁止モード
をもっており、かくしてVTR17が異常動作をしない
ようになされている。CPU15Bは、かかるVTR1
7のシステムコントローラとの関係を考慮して、以下に
述べる場合のように不適切な操作コマンドが入力された
ときには、これをステップSP14において判断するこ
とによって、当該不適切な操作コマンドにVTR17が
応動しないようになされている。 (1)VTR17のステータスが巻戻しモードである場
合 CPU15Bは、VTR17のステータスが巻戻しモー
ド(REW)である場合において、実行操作コマンドE
XECが「PLAY」であるとき、前回の実行操作コマ
ンドEXECを参照し、その内容が「PLAY」であれ
ば、ステップSP14において否定結果を得て、ステッ
プSP15に移って「Wait For A While」というメッセ
ージをLCDモジュール19に表示してステップSP9
に戻る。
In practice, the system controller of the VTR 17 has a prohibition mode which should not be switched when switching the current operation mode of the VTR 17 to the next operation mode, thus preventing the VTR 17 from abnormal operation. CPU15B is the VTR1
In consideration of the relation with the system controller of No. 7, when an improper operation command is input as described below, the VTR 17 responds to the improper operation command by determining this in step SP14. It is designed not to. (1) When the status of the VTR 17 is the rewind mode The CPU 15B executes the execution operation command E when the status of the VTR 17 is the rewind mode (REW).
When XEC is "PLAY", the previous execution operation command EXEC is referenced, and if the content is "PLAY", a negative result is obtained in step SP14, and the process moves to step SP15 and is called "Wait For A While". A message is displayed on the LCD module 19 and step SP9
Return to.

【0067】このようにするのは、前回の実行操作コマ
ンドEXECが「PLAY」で、かつVTR17のステ
ータスが「REW」であるということは、VTR17が
前回の「PLAY」の実行操作コマンドEXECによっ
て再生モード状態に入って磁気テープが最後まで再生さ
れた後、VTR17のシステムコントローラが自動巻戻
しモードに入ったことを意味している。自動巻戻し動作
は、VTR17のシステムコントローラの判断によって
実行されているもので、システムコントローラの動作を
混乱させないためには、この巻戻し動作が終了するまで
新たなコントロールコマンドをVTR17に供給しない
ようにすることが必要である。 (2)「STOP」モードが必要な場合 VTR17のシステムコントローラは、その動作を確実
にするため、「PLAY」、「REC」、「FF」、
「REW」、「EJECT」モードに入るには、VTR
が「STOP」モードになっていることを必要条件とし
てVTR17を制御している。
This is because the previous execution operation command EXEC is "PLAY" and the status of the VTR 17 is "REW" means that the VTR 17 is reproduced by the last execution command "EXEC" of PLAY. This means that the system controller of the VTR 17 has entered the automatic rewind mode after the mode tape has been entered and the magnetic tape has been reproduced to the end. The automatic rewinding operation is executed according to the judgment of the system controller of the VTR 17, and in order not to confuse the operation of the system controller, do not supply a new control command to the VTR 17 until the rewinding operation is completed. It is necessary to. (2) When "STOP" mode is required The system controller of the VTR 17 has "PLAY", "REC", "FF", in order to ensure its operation.
To enter "REW" or "EJECT" mode, enter the VTR
Controls the VTR 17 on the condition that it is in the "STOP" mode.

【0068】CPU15Bは、操作コマンドが入力され
たとき、VTR17がかかる必要条件を満足しないよう
なステータスにあるときには、これをステップSP14
において判断して否定結果を得る。そしてステップSP
15において「Speak Another Command」というメッセ
ージをLCDモジュール19に表示した後ステップSP
9に戻って新たな操作コマンド認識プログラムに戻る。 (3)同じ操作コマンドが音声入力された場合 CPU15Bは、ステップSP14において、VTR1
7から転送されてきたステータスデータと、実行操作コ
マンドEXECとが同一であることを判断すると、VT
R17のステータスに対して操作コマンドが不適切であ
るので、否定結果を発生してステップSP15に移り、
「Speak Another Command」のメッセージをLCDモジ
ュール19に表示した後、ステップSP9に戻って新た
な操作コマンド認識プログラムに入る。 (4)実行し得ない操作コマンドが音声入力された場合 VTR17は、「FF」または「REW」動作モードか
ら、直接「REC」、「EJECT」動作モードに切り
換えることができないように、システムコントローラに
よって制御されており、VTR17は、「FF」または
「REW」モードにあるとき、一旦「STOP」モード
に切り換えた後、「REW」、「EJECT」モードに
切り換え操作しなければならない。
When the operation command is input and the VTR 17 is in a status that does not satisfy the necessary condition, the CPU 15B executes this at step SP14.
And make a negative result. And step SP
After displaying the message "Speak Another Command" on the LCD module 19 in step 15, step SP
Returning to step 9 and returning to the new operation command recognition program. (3) When the same operation command is input by voice The CPU 15B proceeds to VTR1 in step SP14.
If it is determined that the status data transferred from No. 7 and the execution operation command EXEC are the same, VT
Since the operation command is inappropriate for the status of R17, a negative result is generated and the process proceeds to step SP15.
After displaying the message "Speak Another Command" on the LCD module 19, the process returns to step SP9 to enter a new operation command recognition program. (4) When an operation command that cannot be executed is input by voice The VTR 17 is controlled by the system controller so that it cannot directly switch from the “FF” or “REW” operation mode to the “REC” or “EJECT” operation mode. Under control, the VTR 17 must be switched to the "STOP" mode and then to the "REW" and "EJECT" modes when in the "FF" or "REW" mode.

【0069】したがって、CPU15Bは、VTR17
が「FF」または「REW」ステータスにあるとき、実
行操作コマンドEXECが「REC」、「EJECT」
であるときには、これをステップSP14において判断
して、否定結果を発生し、ステップSP15において
「Speak Another Command」のメッセージをLCDモジ
ュール19上に表示させた後、ステップSP9に戻って
新たな操作コマンド認識プログラムに入る。
Therefore, the CPU 15B has the VTR 17
Is in the "FF" or "REW" status, the execution operation command EXEC is "REC" or "EJECT".
If so, a negative result is determined in step SP14, a message "Speak Another Command" is displayed on the LCD module 19 in step SP15, and the process returns to step SP9 to recognize a new operation command. Enter the program.

【0070】ステップSP14において、適切な実行操
作コマンドEXECと判断された場合は、ステップSP
16に移り、入力された操作コマンドに対応するコント
ロールコマンドをVTR用メモリ部15C2より読み出
してVTRインタフェース16を介してVTR17に転
送する。その結果、VTR17は当該操作モードに切り
替わる。
If it is determined in step SP14 that the execution command is appropriate, EXEC, step SP14.
16, the control command corresponding to the input operation command is read from the VTR memory unit 15C2 and transferred to the VTR 17 via the VTR interface 16. As a result, the VTR 17 switches to the operation mode.

【0071】ステップSP21では、図7の度数分布の
更新が行なわれる。つまり、度数分布メモリ部15C4
の当該ステータスおよび当該操作コマンドに対応する部
分の度数に1が加算される。なお、このとき度数分布メ
モリ部15C4の当該部分がオーバーフローしそうな場
合、当該ステータスの中で当該部分以外の部分の度数に
−1が加算される(アンダーフローは0にクリップす
る)。このようにして、常に度数分布メモリ部15C4
の度数分布データは更新され、オペレータまたは使用環
境での操作の偏りを充分考慮できるようになっている。
At step SP21, the frequency distribution shown in FIG. 7 is updated. That is, the frequency distribution memory unit 15C4
1 is added to the frequency of the part corresponding to the status and the operation command. At this time, if the relevant portion of the frequency distribution memory unit 15C4 is likely to overflow, -1 is added to the frequencies of the portions other than the relevant portion in the status (underflow is clipped to 0). In this way, the frequency distribution memory unit 15C4 is always
The frequency distribution data of is updated so that the bias of the operation in the operator or the operating environment can be sufficiently taken into consideration.

【0072】CPU15Bは、ステップSP17におい
て肯定結果が得られると、ステップSP18に移って当
該プログラムを終了する。ここで、ステップSP17に
おいてプログラムの終了を判断させる方法としては、図
5の登録番号「9」の「END」コントロールコマンド
を送出させるように、マイクロホン12から「END」
操作コマンドを音声入力するか、キーボード20を用い
てCPU15Bに対してインタラプトをかけるようにす
ればよい。
When a positive result is obtained in step SP17, the CPU 15B moves to step SP18 and ends the program. Here, as a method of determining the end of the program in step SP17, the microphone 12 causes “END” so that the “END” control command of the registration number “9” in FIG. 5 is transmitted.
The operation command may be input by voice or the keyboard 20 may be used to interrupt the CPU 15B.

【0073】なお、上述実施例においては、最有力操作
コマンド候補CNO1および準有力操作コマンド候補C
NO2の2つの候補の中から度数分布に従って実行操作
コマンドEXECを選択するようにしたものであるが、
候補は1つでもよく、また3つ以上であってもよい。
In the above embodiment, the most probable operation command candidate CNO1 and the quasi-potential operation command candidate C are used.
The execution operation command EXEC is selected from the two candidates of NO2 according to the frequency distribution.
The number of candidates may be one, or may be three or more.

【0074】また、上述せずも、複数のオペレータの個
々の度数分布を度数分布メモリ部15C4に用意してお
き、各々のオペレータは自分の度数分布を選択的に使用
できるようにしてもよい。
Further, instead of the above description, individual frequency distributions of a plurality of operators may be prepared in the frequency distribution memory unit 15C4 so that each operator can selectively use his or her own frequency distribution.

【0075】また、上述実施例においては、この発明を
VTRに適用した場合について述べたが、これに限らず
広く情報記録再生装置に適用することができる。またL
CDモジュール19に表示させるメッセージは、必要に
応じて変更し得ることは勿論である。
Further, in the above-mentioned embodiments, the case where the present invention is applied to the VTR has been described, but the present invention is not limited to this and can be widely applied to the information recording / reproducing apparatus. Also L
Of course, the message displayed on the CD module 19 can be changed as needed.

【0076】[0076]

【発明の効果】請求項1の発明によれば、音声認識によ
って所定個数の操作コマンド候補を得、その操作コマン
ド候補の中から度数分布データに従って確率の高い操作
コマンドを優先的に選択するものであり、操作コマンド
の認識率を上げることができ、信頼性を向上させること
ができる。
According to the invention of claim 1, a predetermined number of operation command candidates are obtained by voice recognition, and an operation command having a high probability is preferentially selected from the operation command candidates according to the frequency distribution data. Therefore, the recognition rate of the operation command can be increased, and the reliability can be improved.

【0077】請求項2の発明によれば、音声認識によっ
て所定個数の操作コマンド候補を得、その操作コマンド
候補の中から度数分布データに従って確率の高い操作コ
マンドを優先的に選択するものであり、操作コマンドの
認識率を上げることができ、信頼性を向上させることが
できる。また、被操作機器のステータスを上記選択され
た操作コマンドに対応するステータスに変更することが
適切でないときは、その操作コマンドを被操作機器に供
給しないため、被操作機器の誤動作を防止でき、これに
よっても信頼性を向上させることができる。
According to the second aspect of the invention, a predetermined number of operation command candidates are obtained by voice recognition, and operation commands with a high probability are preferentially selected from the operation command candidates according to the frequency distribution data. The recognition rate of operation commands can be increased, and the reliability can be improved. Further, when it is not appropriate to change the status of the operated device to the status corresponding to the selected operation command, the operation command is not supplied to the operated device, and thus the malfunction of the operated device can be prevented. Also, the reliability can be improved.

【0078】請求項3の発明によれば、被操作機器に操
作コマンドが供給される毎にメモリ手段の度数分布デー
タが自動的に更新されるため、オペレータによる偏りを
なくすことができる。
According to the third aspect of the present invention, since the frequency distribution data of the memory means is automatically updated every time the operation command is supplied to the operated device, it is possible to eliminate bias by the operator.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明に係る音声入力操作装置の一実施例の
構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an embodiment of a voice input operation device according to the present invention.

【図2】音声認識ボードの構成例を示すブロック図であ
る。
FIG. 2 is a block diagram showing a configuration example of a voice recognition board.

【図3】VTRインタフェースの構成例を示すブロック
図である。
FIG. 3 is a block diagram showing a configuration example of a VTR interface.

【図4】VTRインタフェースで処理されるコントロー
ルコマンドを示す図である。
FIG. 4 is a diagram showing control commands processed by a VTR interface.

【図5】VTRインタフェースで処理されるステータス
データを示す図である。
FIG. 5 is a diagram showing status data processed by a VTR interface.

【図6】CPUボードの構成例を示すブロック図であ
る。
FIG. 6 is a block diagram showing a configuration example of a CPU board.

【図7】度数分布データ例を示す図である。FIG. 7 is a diagram showing an example of frequency distribution data.

【図8】実施例の処理手順を示すフローチャートであ
る。
FIG. 8 is a flowchart showing a processing procedure of the embodiment.

【図9】従来の音声入力操作装置を示す図である。FIG. 9 is a diagram showing a conventional voice input operation device.

【符号の説明】[Explanation of symbols]

11 音声入力操作装置 12 マイクロホン 13 音声認識システム 14 音声認識ボード 15 CPUボード 16 VTRインタフェース 17 VTR 18 LCDインタフェース 19 LCDモジュール 15C4 度数分布メモリ部 11 voice input operation device 12 microphone 13 voice recognition system 14 voice recognition board 15 CPU board 16 VTR interface 17 VTR 18 LCD interface 19 LCD module 15C4 frequency distribution memory unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 音声入力による操作コマンドを認識して
被操作機器に対する所定個数の操作コマンド候補を得る
音声認識手段と、 ある操作コマンドから次の操作コマンドへの度数分布デ
ータを格納するメモリ手段と、 上記音声認識手段で得られる操作コマンド候補の中から
上記メモリ手段に格納されている度数分布データに従っ
て確率の高い操作コマンドを優先的に選択する操作コマ
ンド選択手段とを備え、 上記操作コマンド選択手段で選択される操作コマンドを
上記被操作機器に供給することを特徴とする音声入力操
作装置。
1. A voice recognition means for recognizing an operation command by voice input to obtain a predetermined number of operation command candidates for an operated device, and a memory means for storing frequency distribution data from one operation command to the next operation command. An operation command selecting means for preferentially selecting an operation command having a high probability according to the frequency distribution data stored in the memory means from among the operation command candidates obtained by the voice recognizing means, the operation command selecting means A voice input operation device, which supplies an operation command selected in step 1 to the operated device.
【請求項2】 音声入力による操作コマンドを認識して
被操作機器に対する所定個数の操作コマンド候補を得る
音声認識手段と、 ある操作コマンドから次の操作コマンドへの度数分布デ
ータを格納するメモリ手段と、 上記音声認識手段で得られる操作コマンド候補の中から
上記メモリ手段に格納されている度数分布データに従っ
て確率の高い操作コマンドを優先的に選択する操作コマ
ンド選択手段と、 上記被操作機器のステータスを上記操作コマンド選択手
段で選択された操作コマンドに対応するステータスに変
更することが適切か否かを判断する操作コマンド適否判
断手段とを備え、 上記操作コマンド適否判断手段で適切であると判断され
た操作コマンドを上記被操作機器に供給することを特徴
とする音声入力操作装置。
2. A voice recognition means for recognizing an operation command by voice input to obtain a predetermined number of operation command candidates for an operated device, and a memory means for storing frequency distribution data from one operation command to the next operation command. , Operation command selecting means for preferentially selecting an operation command having a high probability in accordance with frequency distribution data stored in the memory means from operation command candidates obtained by the voice recognition means, and a status of the operated device. An operation command suitability determination means for determining whether or not it is appropriate to change to a status corresponding to the operation command selected by the operation command selection means, and the operation command suitability determination means determines that it is appropriate. A voice input operation device, which supplies an operation command to the operated device.
【請求項3】 上記被操作機器に操作コマンドが供給さ
れる毎に、上記メモリ手段の度数分布データを自動的に
更新することを特徴とする請求項1または2記載の音声
入力操作装置。
3. The voice input operation device according to claim 1, wherein the frequency distribution data of the memory means is automatically updated every time an operation command is supplied to the operated device.
JP20070693A 1993-08-12 1993-08-12 Voice input operation device Expired - Lifetime JP3703502B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20070693A JP3703502B2 (en) 1993-08-12 1993-08-12 Voice input operation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20070693A JP3703502B2 (en) 1993-08-12 1993-08-12 Voice input operation device

Publications (2)

Publication Number Publication Date
JPH0757336A true JPH0757336A (en) 1995-03-03
JP3703502B2 JP3703502B2 (en) 2005-10-05

Family

ID=16428879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20070693A Expired - Lifetime JP3703502B2 (en) 1993-08-12 1993-08-12 Voice input operation device

Country Status (1)

Country Link
JP (1) JP3703502B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006208461A (en) * 2005-01-25 2006-08-10 Honda Motor Co Ltd Equipment controller of voice recognition type

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006208461A (en) * 2005-01-25 2006-08-10 Honda Motor Co Ltd Equipment controller of voice recognition type
JP4628803B2 (en) * 2005-01-25 2011-02-09 本田技研工業株式会社 Voice recognition type device controller

Also Published As

Publication number Publication date
JP3703502B2 (en) 2005-10-05

Similar Documents

Publication Publication Date Title
US5031113A (en) Text-processing system
KR100233486B1 (en) Electronic appliance connection apparatus
US6477493B1 (en) Off site voice enrollment on a transcription device for speech recognition
US5666555A (en) Audio output method and apparatus in multi-window system
US6963840B2 (en) Method for incorporating multiple cursors in a speech recognition system
US5280392A (en) Automatic copy system of a double-deck VCR and control method thereof
JP2002149428A (en) Audio signal processor, and method for rewriting inside data of the audio signal processor
JPH0757336A (en) Sound input operation device
JP2002278591A (en) Information processing device, information processing method and program recording medium
JPH0828005B2 (en) Voice input operation device
JP3333322B2 (en) Sound equipment
KR920002944B1 (en) Screen reproducing method for vtr
KR910000147B1 (en) Recording and reproducing method of audio signal accoring to instructing of personal computer
US5355495A (en) Control system for a recording and/or reproducing apparatus
JPH05197385A (en) Voice recognition device
KR0157521B1 (en) Method for recording index using counter
KR950012079B1 (en) Apparatus for extension of function and method therefor
JP2928558B2 (en) Timer control circuit
JP2000155595A (en) Image pickup device
JPS59198551A (en) Tape recorder
KR960015558A (en) Cassette player with electronic organizer function and method of implementing electronic organizer using the cassette player
KR960011286B1 (en) Auto repeating apparatus and method with caption data
KR0181120B1 (en) Backup device for voice selectable by dtmf tones and the control method therefor
JP2933647B2 (en) Electronic equipment system
KR0170673B1 (en) Automatic power saving method & apparatus by using touch sensor

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050720

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080729

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090729

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090729

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100729

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100729

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110729

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120729

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130729

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term