【発明の詳細な説明】
装置及び機器の音声制御用装置
従来の技術
本発明は、装置又は機器の作動を制御する命令を用いた、装置及び機器の音声
制御用装置に関する。
装置及び機器の制御に対してはますます音声入力手段が用いられている。この
場合はマイクロフォンを介して受入れられたユーザの命令が、音声識別手法を用
いて識別される。この場合話し手に依存する音声識別手法と話し手に依存しない
音声識別手法との間では違いがある。話し手に依存しない音声識別では、限定さ
れた固定の命令セットがあり、この命令セットはユーザによってトレーニングさ
れなければならない。それに対しては学習フェーズにおいて各命令がユーザによ
って複数回繰り返され、それによって音声識別装置がユーザの音声に適合化され
る。
話し手に依存しない音声識別も固定的に定義される限定された命令セットで動
作する。この場合はいずれにしても音声識別手法はもはやトレーニングの必要が
ないようにインテリジェンスなものである。
前記2つの手法で共通しているのは、唯1つの限られた所定の固定命令セット
しか識別できないことである。これは通常ユーザが暗記して学習しなければなら
ないものである。この命令の数が多ければ多いほど、音声識別手法とユーザの記
憶力に対する要求も高くなる。
このような公知の音声識別手法の欠点は、例えばカーラジオの音声制御を著し
く困難にする。このような音響機器では、必要となる命令の数も比較的多くなり
、とりわけ長距離走行中は1つのカーラジオに対して多くの放送局がチューニン
グされなければならない。
本発明の課題は、装置及び機器の音声制御用装置において、前述した公知装置
の欠点に鑑みこれを解消すべく改善を行うことであり、特にユーザに対して多く
の命令の記憶学習の負担が軽減されるように改善することである。
上記課題は本発明により、表示装置にそのつどの動作状態に依存して、総体的
に設けられた命令の一部が表示され、前記表示された命令のそれぞれ1つの発声
によって1つの入力が行われ、マイクロフォンを介して受入れられた各音声信号
又はそこから導出された信号の記憶のためにメモリが設けられており、記憶され
た信号が、表示された各命令に相応する、音声に係わる信号と比較され、この比
較で正の結果となった命令が、選択結果として受入れられるように構成されて解
決される。
本発明による装置は一方で次のような利点を有している。すなわちそのつどの
目下の装置と機器の作動状
態のもとでどの命令が入力可能かがユーザに表示される。この場合はそのような
選択の利点としてだけではなく、個々の命令の視認性も得られる。これによりユ
ーザは、所定の言葉を役立てることにくみできる。それにより例えばユーザによ
る音声識別系にとって識別不可能な同義語の誤った使用が避けられる。他方では
本発明による装置は次のような利点を有する。すなわち音声識別装置が、受け取
った音声信号を総体的に可能な命令が多数にもかかわらず、そのつどのメニュー
表示された少ない命令との比較だけでよい利点を有する。これにより簡単で確実
な音声識別手法が選択される。
本発明の別の有利な実施例によれば、音声に係わる信号が、表示された各命令
の音声合成によって形成され、さらなる別のメモリにファイルされる。これによ
って次のような利点が得られる。すなわち、装置及び機器の製造者と、場合によ
ってはユーザが、コマンド選択リスト(メニュー)ないしは個々の命令の変更の
際に、新たな命令をテキスト形式(例えばいわゆるASCII文字等、これらが
比較すべき音声に係わる信号に変換される)で入力するだけでよい利点が得られ
る。
さらに本発明の別の実施例によれば、メモリと、さらなる別のメモリは、アナ
ログメモリであり、アナログ信号との比較が行われるか、又は前記メモリと、さ
らなる別のメモリは、デジタルメモリであり、デジタル信号との比較が行われる
。
さらに別の有利な実施例によれば、総体的に設けられた全ての命令の、音声に
係わる比較すべき信号がメモリにファイルされており、比較のための該メモリへ
のアクセスが前記表示された各命令に応じて制御される。
さらに別の実施例によれば、前記音声に係わる信号は、そのつどの命令の発音
のもとでの基本変調を表している。これにより、記憶されている信号と、音声に
係わる信号との簡単な比較が可能となる。
実施例
次に本発明を図面に基づき以下に詳細に説明する。
図示の実施例では本発明による装置によってカーラジオが音声制御されている
。このカーラジオは、アンテナ2を備えた受信部1、信号処理回路3、2つの出
力段4,5、スピーカ6,7によって概略的に示されている。信号処理回路3は公
知のように、ステレオデコーダ、ラジオデータ信号デコーダ、交通情報デコーダ
、音量及び音質調整器を含んでいる。
受信部1と信号処理回路3は、マイクロコンピュータ8によって制御されてい
る。このマイクロコンピュータは、信号処理回路3から様々なデータ、例えば復
号化されたラジオデータ信号等を受け取る。マイクロコンピュータ8の出力側は
、表示装置(ディスプレイ
)9と接続されている。この表示装置は、そのつどのカーラジオの作動状態にお
いて実行可能な命令のメニューを表示する。これは例えば“カセット”、“FM
”、“中波”、“交通情報”等の設定リストであってもよく、又そのつどの受信
すべき放送局の選局情報であってもよい。音声制御方式でない公知の入力装置で
は、複数の放送局からの1つの選局が、局名の横に配置されているキーボタンの
プッシュによって行われる。
本発明による、音声制御用装置では、マイクロフォン10が設けられている。
このマイクロフォン10の出力信号が増幅器11を介してメモリ12に供給され
る。表示装置9の他にマイクロコンピュータ8には、音声符号器13が接続され
ている。この音声符号器13の出力信号は音声合成信号を表し、メモリ14内に
書き込み可能である。音声符号化のための方法は、例えばそれ自体公知のコンピ
ュータ“Amiga”用のコンピュータプログラムSAY等がある。メモリ12及び
14の内容は、比較装置15において比較される。音声符号器13内で形成され
る信号の1つとメモリ12内にある信号とが(許容偏差範囲も含めて)一致する
場合には、これが音声に係わる信号としてマイクロコンピュータ8に通知される
。すなわち入力された命令と一致する、表示メニューからの命令が通知される。
その後で相応の機能がマイクロコンピュータ8によって
実行される。
その後は場合によってその他のメニューが表示装置9で視認できるようにされ
てもよい。この場合はメニュー内で構築されたデータが音声符号器13に供給さ
れ、それに対して新たな音声入力が可能となる。DETAILED DESCRIPTION OF THE INVENTION
Apparatus and voice control device for equipment
Conventional technology
The present invention relates to audio of devices and equipment using instructions to control the operation of the equipment or equipment.
The present invention relates to a control device.
Increasingly, voice input is used for controlling devices and equipment. this
If the user's instruction received via the microphone uses voice identification techniques
Is identified. In this case, speaker-dependent speech recognition and speaker-independent
There is a difference between this and the speech recognition method. Limited speaker-independent speech identification
There is a fixed instruction set that is trained by the user.
Must be done. In the learning phase, each instruction is
Multiple times, thereby adapting the speech recognition device to the user's speech.
You.
Speaker-independent speech identification also operates with a limited set of fixed instructions.
Make. In any case, the speech recognition method no longer needs training
Not as intelligent.
What the two approaches have in common is that there is only one limited fixed instruction set
It can only be identified. This usually requires the user to memorize and learn
Not something. The greater the number of these instructions, the more the voice
The demands on cognition also increase.
Disadvantages of such known voice identification techniques are, for example, the difficulty in controlling voice on car radios.
Make it difficult. Such audio equipment requires a relatively large number of instructions.
Many broadcasters tune to one car radio, especially when driving long distances.
Must be
An object of the present invention is to provide an apparatus and a device for controlling audio of a device, wherein
In order to solve this problem, it is necessary to make improvements to solve this problem.
To reduce the memory learning burden of the instruction.
According to the present invention, the above-mentioned object is achieved by a display device depending on the respective operating state.
Are displayed, and each one of the displayed instructions is uttered.
Makes one input and receives each audio signal through the microphone
Or a memory is provided for the storage of signals derived therefrom,
Is compared with the audio signal corresponding to each command displayed.
Instructions that yield a positive result in the comparison are configured and accepted to be accepted as a selection result.
Is decided.
On the one hand, the device according to the invention has the following advantages. That is,
Operating status of current equipment and equipment
Which command can be input under the condition is displayed to the user. In this case such
Not only as an advantage of the selection, but also the visibility of the individual instructions. This allows you
Users can use certain words to help. This allows, for example,
Incorrect use of synonyms that are indistinguishable by a speech recognition system. On the other hand
The device according to the invention has the following advantages. That is, the voice recognition device
Despite the large number of commands that can collectively output the audio signal,
It has the advantage that only a comparison with the few instructions displayed is sufficient. This makes it simple and reliable
Is selected.
According to another advantageous embodiment of the invention, the signal relating to the audio is represented by each displayed command.
And filed in yet another memory. This
Thus, the following advantages can be obtained. That is, in some cases,
In other words, the user can change the command selection list (menu) or individual commands.
At this time, new instructions are written in text format (for example, so-called ASCII characters, etc.)
Is converted to a signal related to the sound to be compared).
You.
According to yet another embodiment of the present invention, the memory and the further memory are
A log memory, where a comparison with an analog signal is made or
Another memory consisting of is a digital memory, where a comparison with a digital signal is made
.
According to yet another advantageous embodiment, the audio of all instructions provided collectively is provided.
The relevant signal to be compared is stored in a memory and stored in the memory for comparison.
Is controlled according to each of the displayed instructions.
According to yet another embodiment, the voice-related signal is the pronunciation of the respective instruction.
Represents the basic modulation under. This allows the stored signal and audio
A simple comparison with the signals concerned is made possible.
Example
Next, the present invention will be described in detail below with reference to the drawings.
In the embodiment shown, the car radio is voice-controlled by the device according to the invention.
. This car radio has a receiving unit 1 having an antenna 2, a signal processing circuit 3, and two outputs.
Schematically represented by power stages 4,5 and speakers 6,7. The signal processing circuit 3 is public
As you know, stereo decoder, radio data signal decoder, traffic information decoder
, Volume and tone control.
The receiving unit 1 and the signal processing circuit 3 are controlled by a microcomputer 8.
You. The microcomputer receives various data from the signal processing circuit 3, for example,
Receives encoded radio data signals and the like. The output side of the microcomputer 8
, Display device (display
9). This indicator shows the operating status of the respective car radio.
Display a menu of executable instructions. This is, for example, "cassette", "FM
, "Medium wave", "traffic information", etc.
It may be channel selection information of a broadcast station to be performed. A known input device that is not a voice control system
Is one of the key buttons located next to the station name.
Done by push.
In the voice control device according to the present invention, a microphone 10 is provided.
The output signal of the microphone 10 is supplied to the memory 12 via the amplifier 11.
You. A speech encoder 13 is connected to the microcomputer 8 in addition to the display device 9.
ing. The output signal of the speech coder 13 represents a speech synthesis signal,
Writable. Methods for speech coding include, for example, compilations known per se.
There is a computer program SAY for the computer "Amiga". Memory 12 and
The contents of 14 are compared in the comparison device 15. Formed in the speech encoder 13
One of the signals in the memory 12 matches the signal in the memory 12 (including the allowable deviation range).
In this case, this is notified to the microcomputer 8 as a signal relating to voice.
. That is, a command from the display menu that matches the input command is notified.
After that, the corresponding function is performed by the microcomputer 8
Be executed.
Thereafter, other menus may be made visible on the display device 9 in some cases.
You may. In this case, the data constructed in the menu is supplied to the speech encoder 13.
Then, a new voice input becomes possible.