JP2001042891A - Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium - Google Patents
Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory mediumInfo
- Publication number
- JP2001042891A JP2001042891A JP11212451A JP21245199A JP2001042891A JP 2001042891 A JP2001042891 A JP 2001042891A JP 11212451 A JP11212451 A JP 11212451A JP 21245199 A JP21245199 A JP 21245199A JP 2001042891 A JP2001042891 A JP 2001042891A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- voice
- recognition
- input
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、音声認識機能を有
する装置やシステムに適用される音声認識装置、音声認
識搭載装置、音声認識搭載システム、音声認識方法、及
び記憶媒体に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice recognition device, a voice recognition mounting device, a voice recognition mounting system, a voice recognition method, and a storage medium applied to a device or system having a voice recognition function.
【0002】[0002]
【従来の技術】近年では、音声認識機能が搭載されたカ
ーオーディオ装置、カーナビゲーションシステム、携帯
電話等の装置やシステムが多く使用されてきている。こ
の音声認識機能とは、使用者が操作スイッチやボタンを
操作する代わりに、音声(上記操作に対して予め設定し
ておいた任意の言葉、以下、「操作キーワード」と言
う)を入力することで、所望する動作(以下、「音声認
識機能による動作」と言う)を実行させることができる
機能である。2. Description of the Related Art In recent years, devices and systems such as a car audio device, a car navigation system, and a mobile phone having a voice recognition function have been widely used. This voice recognition function means that a user inputs a voice (an arbitrary word set in advance for the above operation, hereinafter referred to as an “operation keyword”) instead of operating an operation switch or button. This is a function that can execute a desired operation (hereinafter, referred to as “operation by voice recognition function”).
【0003】例えば、図6示すような、上記音声認識機
能が搭載されたカーオーディオ装置400がある。この
カーオーディオ装置400では、次のようにして、音声
認識機能による動作が実行される。For example, as shown in FIG. 6, there is a car audio device 400 equipped with the voice recognition function. In the car audio device 400, the operation by the voice recognition function is executed as follows.
【0004】先ず、使用者は、CD(Compact Disk)ユ
ニットやMD(Magnetic Disk )ユニット等を含むユニ
ット部430での所望する動作(ここでは、「CD再生
開始動作」とする)を音声認識機能によって行わせる直
前に、音声認識開始スイッチ480をONに操作する。
これにより、コントローラ470は、今から使用者から
の操作キーワードの入力があることを認識する。First, a user performs a desired operation (here, referred to as “CD reproduction start operation”) in a unit section 430 including a CD (Compact Disk) unit, an MD (Magnetic Disk) unit, and the like by a voice recognition function. Immediately before the operation is performed, the voice recognition start switch 480 is turned on.
Thereby, the controller 470 recognizes that an operation keyword has been input from the user.
【0005】そこで、使用者は、「CD再生開始動作」
に対して予め設定しておいた操作キーワード(”CDス
タート”等)をマイク450から入力する。この入力さ
れた操作キーワードは、コントローラ470によって認
識され、それに対応する制御コマンドに変換されて、ド
ライバ440を介してユニット部430のCDユニット
110aに供給されると共に、モニタ410やスピーカ
460に供給される。これにより、CDユニット110
aでのCD再生開始動作が実行され、例えば、CD再生
による音楽がスピーカ460から出力されたり、その音
楽の題名がモニタ410に表示されたりする。[0005] Therefore, the user has to perform a "CD reproduction start operation".
, An operation keyword (“CD start” or the like) set in advance is input from the microphone 450. The input operation keyword is recognized by the controller 470, converted into a corresponding control command, supplied to the CD unit 110a of the unit section 430 via the driver 440, and supplied to the monitor 410 and the speaker 460. You. Thereby, the CD unit 110
The CD playback start operation at “a” is executed. For example, music by CD playback is output from the speaker 460 or the title of the music is displayed on the monitor 410.
【0006】したがって、使用者は、上述のような音声
認識機能により、車を運転をしながらキー操作部420
のボタンやスイッチを操作することなく、ユニット部4
30の各種ユニットでの所望する動作を実行させること
ができる。Accordingly, the user operates the key operating section 420 while driving the car by the above-described voice recognition function.
Unit unit 4 without operating any buttons or switches
A desired operation can be executed in each of the 30 units.
【0007】[0007]
【発明が解決しようとする課題】ところで、上述したよ
うに従来の音声認識機能では、音声認識開始スイッチ4
80をONに操作することで、今から操作キーワードを
入力することを当該音声認識機能に対して認識させるよ
うに構成されている。すなわち、音声認識機能による動
作指示のための操作キーワードの入力の開始(以下、
「音声認識の開始」と言う)を、音声認識開始スイッチ
480で行なうように構成されている。これは、常に操
作キーワードの入力が可能な状態(音声認識開始スイッ
チ480がON状態)にしておくと、ある動作を実行さ
せるための操作キーワード以外の、単なる同乗者との会
話の音声や、ラジオから出力される音声、或いはノイズ
等までもが、操作キーワードの認識の対象となってしま
い、この結果、使用者が意図していない時に突然誤動作
する可能性があるためである。As described above, in the conventional voice recognition function, the voice recognition start switch 4 is used.
By turning on 80, the voice recognition function recognizes that an operation keyword is to be input. That is, the start of input of an operation keyword for an operation instruction by the voice recognition function (hereinafter, referred to as an operation keyword).
"Start of speech recognition") is performed by a speech recognition start switch 480. This is because if the operation keyword can be always input (the voice recognition start switch 480 is in the ON state), the voice of the conversation with the fellow passenger other than the operation keyword for executing a certain operation, or the radio This is because even voices or noises output from the terminal are subject to recognition of the operation keyword, and as a result, there is a possibility of malfunctioning suddenly when the user does not intend.
【0008】したがって、従来の音声認識機能では、音
声認識開始スイッチ480を設け、音声認識開始スイッ
チ480がONに操作されてから入力された音声のみ
を、操作キーワードの認識の対象として受け付けるよう
にしている。Therefore, in the conventional voice recognition function, the voice recognition start switch 480 is provided, and only the voice input after the voice recognition start switch 480 is turned on is received as the target of the operation keyword recognition. I have.
【0009】しかしながら、音声認識開始スイッチ48
0をONに操作しないかぎり、入力音声が操作キーワー
ドの認識の対象として受け付けられないということは、
使用者は、ある所望する動作を音声認識機能によって実
行させたいときにはその都度、音声認識開始スイッチ4
80を操作しなければならないということになる。これ
は、非常に面倒な操作であり、操作性向上のための音声
認識機能としての効果が薄れてしまうことになる。However, the voice recognition start switch 48
Unless 0 is turned on, the fact that the input voice is not accepted as a recognition target of the operation keyword means that
Whenever the user wants to execute a desired operation by the voice recognition function, the voice recognition start switch 4
You have to operate 80. This is a very troublesome operation, and the effect as the voice recognition function for improving the operability is weakened.
【0010】また、上述した理由により音声認識開始ス
イッチ480を取り付ける必要性があることから、その
ための取り付け費用がかかり、また、取り付ける場所を
確保する必要があると共に、当該取り付け場所としては
使用者が扱いやすい場所であることが好ましい。これ
は、装置或いはシステム全体のコストアップの問題につ
ながると共に、例えば、車載装置であれば内装のデザイ
ン設計上に制限が生じるという問題につながる。[0010] Further, since it is necessary to mount the voice recognition start switch 480 for the above-mentioned reason, it is necessary to mount the voice recognition start switch 480, and it is necessary to secure a mounting place. It is preferable that the place is easy to handle. This leads to a problem of an increase in the cost of the apparatus or the entire system, and also a problem that, for example, in the case of an in-vehicle apparatus, there is a restriction on the design of the interior.
【0011】そこで、本発明は、上記の欠点を除去する
ために成されたもので、音声認識の開始をも音声入力で
行えるように構成することで、操作性向上を図ることが
でき、さらには装置やシステム全体のコストダウン、及
び音声認識機能の高性能化をも図ることができる、音声
認識装置、音声認識搭載装置、音声認識搭載システム、
音声認識方法、及び記憶媒体を提供することを目的とす
る。Therefore, the present invention has been made to eliminate the above-mentioned drawbacks, and the operability can be improved by configuring so that voice recognition can be started by voice input. Can reduce the cost of the device and the entire system, and can also improve the performance of the voice recognition function, voice recognition device, voice recognition device, voice recognition system,
An object of the present invention is to provide a voice recognition method and a storage medium.
【0012】[0012]
【課題を解決するための手段】斯かる目的下において、
第1の発明は、任意の機能に対して実行指示するための
操作キーワードの音声入力を認識する操作認識手段と、
上記操作認識手段での上記操作キーワードの認識動作開
始を指示するための開始キーワードの音声入力を認識す
る開始認識手段とを備え、上記操作認識手段は、上記開
始認識手段の認識結果に基づいて、上記操作キーワード
の認識動作を開始することを特徴とする。For such a purpose,
A first invention is an operation recognizing means for recognizing a voice input of an operation keyword for instructing execution of an arbitrary function,
Start recognition means for recognizing a voice input of a start keyword for instructing a start of a recognition operation of the operation keyword in the operation recognition means, wherein the operation recognition means is based on a recognition result of the start recognition means, The operation of recognizing the operation keyword is started.
【0013】第2の発明は、上記第1の発明において、
上記操作認識手段は、上記開始認識手段により上記開始
キーワードの音声入力が認識されてから所定時間の間、
上記操作キーワードの認識動作を実行することを特徴と
する。According to a second aspect of the present invention, in the first aspect,
The operation recognition means, for a predetermined time after the start recognition means recognizes the voice input of the start keyword,
The operation of recognizing the operation keyword is performed.
【0014】第3の発明は、上記第1の発明において、
上記開始認識手段により上記開始キーワードの音声入力
が認識されてから所定期間の間、又は上記開始認識手段
により上記開始キーワードの音声入力が認識されてから
上記操作認識手段により上記操作キーワードの音声入力
が認識されるまでの間、音の出力を禁止する制御手段を
備えたことを特徴とする。According to a third aspect, in the first aspect,
The voice input of the operation keyword is performed by the operation recognizing unit for a predetermined period of time after the voice input of the start keyword is recognized by the start recognition unit, or after the voice input of the start keyword is recognized by the start recognition unit. Until the recognition, a control means for prohibiting the output of the sound is provided.
【0015】第4の発明は、上記第1の発明において、
上記開始キーワードの登録を指示するための登録キーワ
ードの音声入力を認識する登録認識手段と、上記登録認
識手段により上記登録キーワードの音声入力が認識され
た後の入力音声を上記開始キーワードとして登録する登
録手段とを備え、上記開始認識手段は、上記登録手段に
より登録された開始キーワードの音声入力を認識するこ
とを特徴とする。[0015] In a fourth aspect based on the first aspect,
Registration recognizing means for recognizing a voice input of the registered keyword for instructing the registration of the start keyword, and registration for registering the input voice after the voice input of the registered keyword is recognized by the registration recognizing means as the start keyword Means, wherein the start recognition means recognizes a voice input of the start keyword registered by the registration means.
【0016】第5の発明は、上記第4の発明において、
上記登録手段は、上記登録認識手段により上記登録キー
ワードの音声入力が認識されてから所定時間の間の入力
音声を上記開始キーワードとして登録することを特徴と
する。According to a fifth aspect, in the fourth aspect,
The registration means registers an input voice for a predetermined time from the recognition of the voice input of the registered keyword by the registration recognition means as the start keyword.
【0017】第6の発明は、上記第4の発明において、
上記登録認識手段により上記登録キーワードの音声入力
が認識されてから所定時間の間、又は上記登録認識手段
により上記登録キーワードの音声入力が認識されてから
上記登録手段により上記開始キーワードの登録が終了す
るまでの間、音の出力を禁止する制御手段を備えたこと
を特徴とする。According to a sixth aspect based on the fourth aspect,
The registration of the start keyword is completed by the registration unit for a predetermined time period after the voice input of the registered keyword is recognized by the registration recognition unit, or after the voice input of the registered keyword is recognized by the registration recognition unit. In the meantime, there is provided a control means for prohibiting sound output.
【0018】第7の発明は、上記第1の発明において、
上記開始キーワードの登録を指示するための操作手段
と、上記操作手段により上記開始キーワードの登録が指
示された後の入力音声を上記開始キーワードとして登録
する登録手段とを備え、上記開始認識手段は、上記登録
手段により登録された開始キーワードの音声入力を認識
することを特徴とする。According to a seventh aspect, in the first aspect,
Operating means for instructing the registration of the start keyword, and registering means for registering, as the start keyword, the input voice after the registration of the start keyword is instructed by the operating means, wherein the start recognition means comprises: It is characterized in that the voice input of the start keyword registered by the registration means is recognized.
【0019】第8の発明は、上記第7の発明において、
上記登録手段は、上記操作手段により上記開始キーワー
ドの登録が指示されてから所定時間の間の入力音声を上
記開始キーワードとして登録することを特徴とする。According to an eighth aspect, in the seventh aspect,
The registration means registers an input voice for a predetermined time after the instruction of the start keyword is instructed by the operation means as the start keyword.
【0020】第9の発明は、上記第7の発明において、
上記操作手段により上記開始キーワードの登録が指示さ
れてから所定時間の間、又は上記操作手段により上記開
始キーワードの登録が指示されてから上記登録手段によ
り上記開始キーワードの登録が終了するまでの間、音の
出力を禁止する制御手段を備えることを特徴とする。According to a ninth aspect, in the seventh aspect,
During a predetermined time after the start keyword is instructed by the operation means, or until the start keyword registration is completed by the registration means after the start keyword is instructed by the operation means, It is characterized by comprising control means for prohibiting output of sound.
【0021】第10の発明は、複数の機能を有し、当該
複数の機能のうちの任意の機能を操作キーワードの音声
入力によって実行させることが可能な音声認識搭載装置
であって、請求項1〜9の何れかに記載の音声認識装置
を有することを特徴とする。According to a tenth aspect, there is provided a voice recognition mounting apparatus having a plurality of functions, wherein any of the plurality of functions can be executed by voice input of an operation keyword. A speech recognition device according to any one of claims 1 to 9.
【0022】第11の発明は、複数の機器が通信可能に
接続されてなる音声認識搭載システムであって、上記複
数の機器のうち少なくとも1つの機器は、請求項1〜9
の何れかに記載の音声認識装置を有し、当該音声認識装
置によって他の機器の動作制御を行なうことを特徴とす
る。An eleventh invention is a voice recognition system comprising a plurality of devices communicably connected to each other, wherein at least one of the plurality of devices is one of the first to ninth embodiments.
Wherein the voice recognition device controls the operation of another device.
【0023】第12の発明は、入力された操作キーワー
ドの音声を認識し、当該操作キーワードに基づいて対応
する機能を実行させるための音声認識方法であって、上
記操作キーワードの音声認識の開始を、開始キーワード
の音声入力を待って行なうことを特徴とする。A twelfth invention is a speech recognition method for recognizing a speech of an input operation keyword and executing a corresponding function based on the operation keyword, wherein the speech recognition of the operation keyword is started. , After the voice input of the start keyword is performed.
【0024】第13の発明は、請求項1〜9の何れかに
記載の音声認識装置の機能をコンピュータに実施させる
ためのプログラムを記憶したコンピュータが読み取り可
能な記憶媒体であることを特徴とする。According to a thirteenth aspect, the present invention is a computer-readable storage medium storing a program for causing a computer to execute the functions of the voice recognition device according to any one of the first to ninth aspects. .
【0025】[0025]
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を用いて説明する。Embodiments of the present invention will be described below with reference to the drawings.
【0026】本発明は、例えば、図1に示すような、自
動車の運転席に設けられるセンターコントロールユニッ
ト100に適用される。The present invention is applied to, for example, a center control unit 100 provided in a driver's seat of an automobile as shown in FIG.
【0027】センターコントロールユニット100は、
音声認識機能を有し、図1及び図2に示すように、音声
認識機能による動作指示の対象となる各種ユニットが設
けられたユニット部110と、メインの電源スイッチ等
が設けられたキー操作部120と、ユニット部110の
状態等を表示するためのモニタ130とを備えている。
また、センターコントロールユニット100には、後述
するマイク150やスピーカ160が内蔵されている。The center control unit 100
As shown in FIGS. 1 and 2, a unit section 110 having a voice recognition function and provided with various units to be operated by the voice recognition function, and a key operation section provided with a main power switch and the like 120 and a monitor 130 for displaying the state of the unit section 110 and the like.
The center control unit 100 includes a microphone 150 and a speaker 160 described later.
【0028】ユニット部110は、CDユニット110
aやMDユニットの他、図示していないラジオやカーナ
ビゲーションユニット等も含んでおり、これらのユニッ
トは、キー操作部120の操作により動作させることも
可能であり、マイク150から使用者が所望する動作に
対応する操作キーワードを入力することによっても動作
させることが可能なようになされている。The unit section 110 includes a CD unit 110
a and an MD unit, as well as a radio and a car navigation unit (not shown). These units can be operated by operating the key operation unit 120. The operation can also be performed by inputting an operation keyword corresponding to the operation.
【0029】キー操作部120には、メインの電源スイ
ッチの他、音声認識機能による動作指示以外の動作のた
めのキーや、ユニット部110に対する各種動作指示の
ためのキー、後述するキーワード登録キー120a等の
各種キーが設けられている。The key operation unit 120 includes a main power switch, a key for operations other than an operation instruction by a voice recognition function, a key for various operation instructions to the unit unit 110, and a keyword registration key 120a to be described later. Etc. are provided.
【0030】モニタ130は、ユニット部110の各種
ユニットの現在状態や、ユニット110部の動作に伴っ
た各種情報(CDユニット110aでのCD再生動作に
よる再生トラック情報や、カーナビゲーションユニット
による地図表示等)等を表示する。The monitor 130 displays the current state of various units of the unit 110, various information associated with the operation of the unit 110 (reproduced track information by a CD reproducing operation of the CD unit 110a, map display by a car navigation unit, etc.). ) Etc. are displayed.
【0031】マイク150は、ユニット部110を音声
認識機能によって動作させるための操作キーワード等の
音声を入力するためのものであり、スピーカ160は、
マイク150から入力された音声のリピート出力や、ユ
ニット部110の動作に伴った出力(CDユニット11
0aでのCD再生動作による音楽の出力や、ラジオの出
力等)等を行なうためのものである。The microphone 150 is for inputting a voice such as an operation keyword for operating the unit unit 110 by the voice recognition function.
Repeat output of the audio input from the microphone 150 and output accompanying the operation of the unit unit 110 (CD unit 11
0a, music output, radio output, etc.).
【0032】ここで、従来装置では音声認識の開始(ユ
ニット部110を音声認識機能によって動作させるため
の操作キーワードの入力の開始)の指示を音声認識開始
スイッチで行なっていたのに対して、本実施の形態にお
けるセンターコントロールユニット100では、上記音
声認識の開始を、予め登録したキーワード(以下、「開
始キーワード」と言う)の音声をマイク150から入力
することで行えるようになされている。Here, in the conventional apparatus, the start of voice recognition (start of input of an operation keyword for operating the unit 110 by the voice recognition function) is instructed by the voice recognition start switch. In the center control unit 100 according to the embodiment, the start of the voice recognition can be performed by inputting a voice of a keyword registered in advance (hereinafter, referred to as a “start keyword”) from the microphone 150.
【0033】例えば、センターコントロールユニット1
00では、開始キーワードを登録するために用いるキー
ワード(以下、「登録キーワード」と言う)がデフォル
トとして予め用意されている。ここでは、例えば、登録
キーワードを”キーワードを登録”といった言葉として
いる。したがって、使用者が”コマンド認識開始”とい
う言葉を開始キーワードとして使用したい場合には、”
キーワードを登録”及び”コマンド認識開始”の2つの
言葉をマイク150から入力すれば、”コマンド認識開
始”が開始キーワードとして登録される。その後、使用
者がCDユニット110aでのCD再生を音声認識機能
によって動作させたい場合には、使用者は、先ず、開始
キーワードである”コマンド認識開始”をマイク150
から入力し、その入力に続いて、CD再生動作開始に対
して予め登録しておいた操作キーワード(”CDスター
ト”等)をマイク150から入力すれば、CDユニット
110aでのCD再生動作が開始されることになる。For example, the center control unit 1
In 00, a keyword used for registering a start keyword (hereinafter referred to as “registered keyword”) is prepared in advance as a default. Here, for example, the registered keyword is a word such as “register a keyword”. Therefore, if the user wants to use the word “command recognition start” as the start keyword,
When two words, "register keyword" and "command recognition start", are input from the microphone 150, "command recognition start" is registered as a start keyword, and then the user performs voice recognition for CD playback in the CD unit 110a. When the user wants to operate by the function, the user first inputs the start keyword “command recognition start” to the microphone 150.
Then, if an operation keyword (“CD start” or the like) registered in advance for the start of the CD reproduction operation is input from the microphone 150 after the input, the CD reproduction operation in the CD unit 110a starts. Will be done.
【0034】そこで、上述のようなセンターコントロー
ルユニット100での動作を実現するために、センター
コントロールユニット100の内部には、図2に示すよ
うな構成を有するコントローラ170が設けられてい
る。Therefore, in order to realize the operation of the center control unit 100 as described above, a controller 170 having a configuration as shown in FIG. 2 is provided inside the center control unit 100.
【0035】コントローラ170は、例えば、CPU、
ROM、及びRAMを含むマイクロコンピュータシステ
ムから構成され、CPUがROMに予め記憶された所定
の処理プログラムを実行することで、上記図2の音声認
識処理部171、音声合成処理部172、音声出力処理
部173、動作制御処理部174、及びキー入力処理部
175を含む構成を実現している。The controller 170 includes, for example, a CPU,
The microcomputer is constituted by a microcomputer system including a ROM and a RAM. The CPU executes a predetermined processing program stored in the ROM in advance, so that the voice recognition processing unit 171, the voice synthesis processing unit 172, the voice output processing A configuration including a unit 173, an operation control processing unit 174, and a key input processing unit 175 is realized.
【0036】音声認識処理部171は、開始キーワード
の登録を指示するための登録キーワードを認識する登録
キーワード認識部171aと、音声認識の開始を指示す
るための開始キーワードを認識する開始キーワード認識
部171bと、ユニット部110の各種ユニットに対す
る動作指示を表す操作キーワードを認識する操作キーワ
ード認識部171cとを含んでおり、これらの各認識部
171a〜171cによって、マイク150から入力さ
れた音声が登録キーワード、開始キーワード、及び操作
キーワードの何れのキーワードであるかを認識する。こ
の認識の方法としては、ここでは次のような方法を一例
として採用している。The speech recognition processing section 171 has a registered keyword recognizing section 171a for recognizing a registered keyword for instructing registration of a start keyword, and a start keyword recognizing section 171b for recognizing a start keyword for instructing start of speech recognition. And an operation keyword recognizing unit 171c for recognizing an operation keyword indicating an operation instruction for various units of the unit unit 110. The voices input from the microphone 150 are registered by the recognizing units 171a to 171c. It recognizes which keyword is the start keyword or the operation keyword. As a method of this recognition, the following method is adopted as an example here.
【0037】例えば、音声認識処理部171は、マイク
150から入力された音声を一旦テキスト形式のデータ
の変換してメモリ176に記憶する。すなわち、音声認
識処理部171は、マイク150からの入力音声をその
まま音声データとして記憶するのではなく、1つの言葉
(単語)としてのテキストデータに変換してからメモリ
176に記憶する。For example, the voice recognition processing section 171 temporarily converts voice input from the microphone 150 into text format data and stores the data in the memory 176. That is, the voice recognition processing unit 171 does not store the input voice from the microphone 150 as voice data as it is, but converts it into text data as one word and stores it in the memory 176.
【0038】このとき、メモリ176には、予め、登録
キーワードのテキストデータ(以下、「登録キーワード
データ」と言う)、及び各種の操作キーワードのテキス
トデータ(以下、「操作キーワードデータ」と言う)が
設定されている。At this time, the text data of the registered keyword (hereinafter, referred to as “registered keyword data”) and the text data of various operation keywords (hereinafter, referred to as “operation keyword data”) are stored in the memory 176 in advance. Is set.
【0039】ここでの登録キーワードデータは、”キー
ワードを登録”という音声に対応したテキストデータと
している。また、操作キーワードデータは、例えば、ユ
ニット部110のCDユニット110aに対する、CD
再生動作開始を示す”CDスタート”、CD再生動作終
了を示す”CDストップ”、CDの入れ替え動作を示
す”CDチェンジ”等といった各種動作を示す音声に対
応したテキストデータとしている。The registered keyword data here is text data corresponding to the voice of "register a keyword". The operation keyword data is, for example, a CD corresponding to the CD unit 110a of the unit unit 110.
This is text data corresponding to voices indicating various operations such as "CD start" indicating the start of the reproducing operation, "CD stop" indicating the end of the CD reproducing operation, and "CD change" indicating the switching operation of the CD.
【0040】尚、ここでは、登録キーワードについて
は、センターコントロールユニット100自体に対して
出荷時等に予めメモリ176に設定されているものとし
ている。一方の操作キーワードについては、センターコ
ントロールユニット100自体に対して出荷時等に予め
メモリ176に設定されているものとしてもよいし、使
用者が実際に使用する前に予め所定の操作を行なうこと
で、任意のキーワード(使用者が使いやすいキーワード
等)を各種動作に対応させて設定できるようにしてもよ
い。また、メモリ176に現在設定されている操作キー
ワードのデータを、使用者が任意のキーワードに変更で
きるようにしてもよい。Here, it is assumed that the registered keywords are set in the memory 176 in advance to the center control unit 100 at the time of shipment. One of the operation keywords may be set in the memory 176 in advance at the time of shipment or the like to the center control unit 100 itself, or by performing a predetermined operation in advance before the user actually uses the operation keyword. Alternatively, an arbitrary keyword (such as a keyword that is easy for the user to use) may be set in accordance with various operations. The user may be able to change the data of the operation keyword currently set in the memory 176 to an arbitrary keyword.
【0041】したがって、音声認識処理部171は、メ
モリ176に一旦記憶した入力音声のテキストデータ
と、メモリ176に予め設定されている各種キーワード
データとを比較することで、上記入力音声が登録キーワ
ードであるか操作キーワードであるかを認識する。Therefore, the speech recognition processing unit 171 compares the text data of the input speech once stored in the memory 176 with various keyword data preset in the memory 176, so that the input speech is a registered keyword. Recognize whether it is an operation keyword.
【0042】また、音声認識処理部171は、上述の登
録キーワードや操作キーワードと同様にして、後述する
処理によって使用者から入力された開始キーワードをテ
キストデータに変換してメモリ176に設定(登録)す
るようにもなされているため、その後にマイク150か
ら入力された音声については、メモリ176に設定され
た開始キーワードデータとのマッチングによって、当該
音声が開始キーワードであるかの認識も行なわれること
になる。The speech recognition processing unit 171 converts the start keyword input by the user into text data by the processing described later and sets it in the memory 176 in the same manner as the above-described registered keyword and operation keyword. Since the voice input from the microphone 150 after that is matched with the start keyword data set in the memory 176, it is also recognized that the voice is the start keyword. Become.
【0043】音声合成処理部172は、音声認識処理部
171での認識対象となるキーワード、すなわちマイク
150から入力された音声を音声出力処理部173を介
してマイク160から出力(リピート出力)するための
処理を実行する。The speech synthesis processing unit 172 outputs a keyword to be recognized by the speech recognition processing unit 171, that is, a speech input from the microphone 150 from the microphone 160 via the speech output processing unit 173 (repeat output). Execute the processing of
【0044】例えば、マイク150から”CDスター
ト”という音声が入力された場合、この音声は、音声認
識処理部171により、メモリ176にテキストデータ
として記憶され、操作キーワードとして認識される。音
声合成処理部172は、”CDスタート”という音声を
入力した使用者に対して、当該音声が音声認識処理部1
71の認識対象となり、操作キーワードとして受け付け
られたことを知らせるために、メモリ176に記憶され
た当該音声のデータを、スピーカ160からの出力デー
タとして音声出力処理部173に与える。音声出力処理
部173は、音声合成処理172からの出力データを音
声としてスピーカ160から出力する。したがって、こ
の場合には、マイク160から”CDスタート”という
音声が入力され音声認識処理部171で操作キーワード
として受け付けられると、スピーカ160から”CDス
タート”という音声がリピート出力されることになる。For example, when a voice "CD start" is input from the microphone 150, the voice is stored as text data in the memory 176 by the voice recognition processing unit 171, and is recognized as an operation keyword. The voice synthesizing unit 172 provides the user with the input of the voice “CD start” the voice to the voice recognition processing unit 1.
The voice data stored in the memory 176 is given to the voice output processing unit 173 as output data from the speaker 160 in order to notify that the voice has been recognized as an operation keyword and has been received as an operation keyword. The audio output processing unit 173 outputs the output data from the audio synthesis processing 172 as audio from the speaker 160. Therefore, in this case, when the voice “CD start” is input from the microphone 160 and is accepted as an operation keyword by the voice recognition processing unit 171, the voice “CD start” is repeatedly output from the speaker 160.
【0045】また、音声合成処理部172は、上述のリ
ピート出力の他、開始キーワードの登録の際の処理手順
を使用者に対して促すためのメッセージや、開始キーワ
ードの登録が終了した際にその旨を使用者に知らせるた
めのメッセージ等を、音声出力処理部173を介してス
ピーカ160から出力するための処理を実行する。In addition to the above-described repeat output, the speech synthesis processing unit 172 provides a message for prompting the user to perform a processing procedure at the time of registration of the start keyword, and a message when the registration of the start keyword is completed. A process for outputting a message or the like for notifying the user to the effect from the speaker 160 via the audio output processing unit 173 is executed.
【0046】例えば、マイク160から”キーワードを
登録”という音声が入力された場合、この音声は、音声
認識処理部171により登録キーワードとして認識され
る。音声合成処理部172は、”キーワードを登録”と
いう音声を入力した使用者に対して、次に使用者が行な
うべき処理を知らせるために、”開始キーワードを登録
する準備ができました。開始キーワードを言って下さ
い。”といったメッセージデータを生成し、これをスピ
ーカ160からの出力データとして音声出力処理部17
3に与える。音声出力処理部173は、音声合成処理部
172からの出力データを音声としてスピーカ160か
ら出力する。したがって、この場合には、マイク160
から”キーワードを登録”という音声が入力され音声認
識処理部171で登録キーワードとして受け付けられる
と、スピーカ160から”開始キーワードを登録する準
備ができました。開始キーワードを言って下さい。”と
いう音声が出力されることになる。For example, when a voice "register a keyword" is input from the microphone 160, this voice is recognized by the voice recognition processing unit 171 as a registered keyword. The voice synthesis processing unit 172 is ready to register the “start keyword” in order to notify the user who has input the voice “register keyword” of the process to be performed next by the user. Is generated, and the message data is output as the output data from the speaker 160.
Give to 3. The audio output processing unit 173 outputs the output data from the audio synthesis processing unit 172 as audio from the speaker 160. Therefore, in this case, the microphone 160
When the voice of “register keyword” is input and received as a registered keyword in the voice recognition processing unit 171, the voice “Ready to register the starting keyword. Please say the starting keyword.” Is output from the speaker 160. Will be output.
【0047】音声出力処理部173は、上述したような
音声合成処理部172から与えられたデータに対応する
音をスピーカ160から出力する他、後述する動作制御
処理部174から与えられたデータに対応する音もスピ
ーカ160から出力する。The voice output processing unit 173 outputs a sound corresponding to the data provided from the voice synthesis processing unit 172 as described above from the speaker 160, and outputs a sound corresponding to the data provided from the operation control processing unit 174 described later. The sound to be played is also output from the speaker 160.
【0048】キー入力処理部175は、キー操作部12
0の操作状態を検出して、その検出結果を動作制御処理
部174へ与える。The key input processing unit 175 includes the key operation unit 12
The operation state of “0” is detected, and the detection result is provided to the operation control processing unit 174.
【0049】動作制御処理部174は、センターコント
ロールユニット100全体の動作制御を司るものであ
り、特に、音声認識処理部171での入力音声の認識結
果や、キー入力処理部175でのキー操作部120の操
作状態検出結果に基づいて、センターコントロールユニ
ット100全体の動作を制御する。The operation control processing section 174 controls the operation of the center control unit 100 as a whole. In particular, the result of recognition of the input voice by the voice recognition processing section 171 and the key operation section by the key input processing section 175 The operation of the entire center control unit 100 is controlled based on the operation state detection result of 120.
【0050】例えば、マイク150から”CDスター
ト”という音声が入力された場合、この音声は、音声認
識処理部171により操作キーワードとして認識され
る。動作制御処理部174は、音声認識処理部171の
認識結果により、”CDスタート”という操作キーワー
ドがマイク150から入力されたことを把握すると、当
該操作キーワードに対応した制御コマンド(CDユニッ
ト110aでのCD再生動作開始を指示する制御コマン
ド)を生成し、これをドライバ140に与える。ドライ
バ140は、動作制御処理部174からの制御コマンド
に従って、CDユニット110aを駆動する。これによ
り、CDユニット110aでは、CD再生動作が開始す
る。このとき、動作制御処理部174は、必要に応じ
て、CDユニット110aで再生されているトラック情
報をモニタ130で表示するための動作制御等も行な
う。For example, when a voice "CD start" is input from the microphone 150, this voice is recognized by the voice recognition processing unit 171 as an operation keyword. When the operation control processing unit 174 recognizes that the operation keyword “CD start” has been input from the microphone 150 based on the recognition result of the speech recognition processing unit 171, the operation control processing unit 174 controls the control command (the CD unit 110a) corresponding to the operation keyword. A control command for instructing the start of the CD reproduction operation is generated, and the generated control command is given to the driver 140. The driver 140 drives the CD unit 110a according to a control command from the operation control processing unit 174. As a result, the CD playback operation is started in the CD unit 110a. At this time, the operation control processing unit 174 also performs operation control for displaying the track information reproduced by the CD unit 110a on the monitor 130, if necessary.
【0051】また、キー操作部120にてCD再生動作
開始を指示するためのキーが操作された場合、この操作
状態は、キー入力処理部175により検出される。動作
制御処理部174は、キー入力処理部175の検出結果
に対応した制御コマンド(CDユニット110aでのC
D再生動作開始を指示する制御コマンド)を生成し、こ
れをドライバ140に与える。ドライバ140は、動作
制御処理部174からの制御コマンドに従って、CDユ
ニット110aを駆動する。これにより、CDユニット
110aでは、CD再生動作が開始する。このときも、
動作制御処理部174は、必要に応じて、CDユニット
110aで再生されているトラック情報をモニタ130
で表示するための動作制御等も行なう。When a key for instructing the start of the CD reproduction operation is operated by the key operation section 120, this operation state is detected by the key input processing section 175. The operation control processing unit 174 receives a control command (C in the CD unit 110a) corresponding to the detection result of the key input processing unit 175.
A control command for instructing the start of the D reproduction operation is generated, and the generated control command is given to the driver 140. The driver 140 drives the CD unit 110a according to a control command from the operation control processing unit 174. As a result, the CD playback operation is started in the CD unit 110a. Again,
The operation control processing unit 174 monitors the track information reproduced by the CD unit 110a as necessary.
Also, operation control for displaying the information is performed.
【0052】上述のようなコントローラ170を有する
センターコントロールユニット100では、音声認識を
開始するための開始キーワードを、登録キーワードを音
声入力することによって登録することも可能であり、キ
ー操作部120に設けられたキーワード登録キー120
aの操作によっても登録することが可能となっている。
以下、これらの2パターンの開始キーワードの登録処
理、及びその登録後の操作キーワードの入力によるユニ
ット部110に対する動作指示処理について、図3及び
図4に示すフローチャートを用いて説明する。In the center control unit 100 having the controller 170 as described above, a start keyword for starting speech recognition can be registered by inputting a registered keyword by voice. Keyword registration key 120
It is also possible to register by the operation of a.
Hereinafter, the registration processing of these two patterns of start keywords and the operation instruction processing for the unit unit 110 by inputting the operation keywords after the registration will be described with reference to the flowcharts shown in FIGS.
【0053】(1)開始キーワードを登録キーワードの
音声入力により登録する場合(図3参照)(1) When the start keyword is registered by voice input of the registered keyword (see FIG. 3)
【0054】ステップS201:先ず、センターコント
ロールユニット100本体の電源がONされると、マイ
ク150からの音声入力待ち状態となる。この状態にお
いて、音声認識処理部171は、マイク150から音声
が入力されたか否かを判別する。この判別の結果、マイ
ク150から音声が入力された場合には次のステップS
201からの処理に進み、そうでない場合にはそのまま
音声入力待ち状態となる。尚、センターコントロールユ
ニット100本体の電源ON状態とは、ユニット部11
0の各種ユニットが動作可能な状態であり、車載ユニッ
トであればACCのON状態を示す。Step S201: First, when the power of the main body of the center control unit 100 is turned on, the apparatus enters a state of waiting for a voice input from the microphone 150. In this state, the voice recognition processing unit 171 determines whether or not voice has been input from the microphone 150. If the result of this determination is that speech has been input from the microphone 150, the next step S
The process proceeds to step 201, and if not, the process directly waits for a voice input. The power ON state of the main body of the center control unit 100 means that the unit 11
0 indicates that the various units are operable. If the unit is a vehicle-mounted unit, the ACC indicates an ON state.
【0055】ステップS202:マイク150から音声
が入力されると、音声認識処理部171は、登録キーワ
ード認識部171aによって、その入力音声のテキスト
データと、メモリ176に予め設定されている登録キー
ワードとを比較することで、当該入力音声が登録キーワ
ード(”キーワードを登録”等)であるか否かを判別す
る。この判別の結果、入力音声が登録キーワードである
場合には次のステップS203からの処理に進み、そう
でない場合には後述するステップS208からの処理に
進む。Step S202: When a voice is input from the microphone 150, the voice recognition processing unit 171 uses the registered keyword recognition unit 171a to convert the text data of the input voice and the registered keyword preset in the memory 176. By performing the comparison, it is determined whether or not the input voice is a registered keyword (eg, “register a keyword”). If the result of this determination is that the input speech is a registered keyword, the process proceeds to the next step S203; otherwise, the process proceeds to a step S208 described later.
【0056】ステップS203:ステップS202の判
別の結果、入力音声が登録キーワードである場合、すな
わち登録キーワードの入力が認識された場合、音声認識
処理部171は、その旨を動作制御処理部174へ通知
する。これを受けた動作制御処理部174は、ユニット
部110のCDユニット110aやMDユニット等が動
作している場合、その動作しているユニットに対してM
UTEをかける。これにより、使用者の声以外のものか
らの音(CD、MDの再生により出力されている音、ラ
ジオの音等)の反応を防ぐことができる。また、動作制
御処理部174は、登録キーワードが入力されてから所
定時間(例えば、5秒)内に入力された開始キーワード
を有効とするためのタイマ(図示せず)をセットする。
尚、このとき、動作制御処理部174により、使用者に
対して、当該登録キーワードを受け付け開始キーワード
を登録できる状態となったことを知らせるようにしても
よい。具体的には例えば、動作制御処理部174が、音
声出力処理部173により、アラーム音をスピーカ16
0から発生させたり、”開始キーワードを登録する準備
ができました。開始キーワードを言って下さい。”とい
ったメッセージ音をスピーカ160から発生させたりす
る。この場合、開始キーワードの入力を有効とする所定
時間については、上記のアラーム音やメッセージの出力
時間を考慮した時間を設定するようにする。Step S203: If the result of the determination in step S202 is that the input voice is a registered keyword, that is, if the input of the registered keyword has been recognized, the voice recognition processing unit 171 notifies the operation control processing unit 174 of this fact. I do. When the operation control processing unit 174 receives this, when the CD unit 110a, the MD unit, or the like of the unit unit 110 is operating, the operation control processing unit 174 sends the M to the operating unit.
Apply UTE. As a result, it is possible to prevent a reaction from a sound other than the user's voice (a sound output from reproduction of a CD or MD, a sound of a radio, or the like). Further, the operation control processing unit 174 sets a timer (not shown) for validating the start keyword input within a predetermined time (for example, 5 seconds) after the input of the registered keyword.
At this time, the operation control processing unit 174 may notify the user that the registered keyword has been accepted and the start keyword can be registered. Specifically, for example, the operation control processing unit 174 causes the sound output processing unit 173 to output an alarm sound to the speaker 16.
0 or a message sound such as "Ready to register start keyword. Please say start keyword." In this case, as the predetermined time for which the input of the start keyword is valid, a time is set in consideration of the output time of the alarm sound and the message.
【0057】ステップS204:ステップS203によ
りユニット部110がMUTE状態となると、マイク1
50からの音声入力待ち状態となる。このとき、動作制
御処理部174は、例えば、音声入力待ち状態であるこ
とを示すメッセージをモニタ130へ表示させる。そし
て、音声認識処理部171は、マイク150から音声が
入力されたか否かを判別する。この判別の結果、マイク
150から音声が入力された場合にはステップS206
の処理に進み、そうでない場合にはステップS205の
処理に進む。Step S204: When the unit 110 enters the MUTE state in step S203, the microphone 1
It is in a state of waiting for a voice input from 50. At this time, the operation control processing unit 174 causes the monitor 130 to display, for example, a message indicating that it is in a voice input waiting state. Then, the voice recognition processing unit 171 determines whether or not voice has been input from the microphone 150. If the result of this determination is that speech has been input from the microphone 150, step S206
Otherwise, the process proceeds to step S205.
【0058】ステップS205:ステップS204の判
別の結果、マイク150から音声が入力されない場合、
動作制御処理部174は、ステップS203にて設定し
たタイマにより、登録キーワードが入力されユニット部
110に対してMUTEをかけてから一定時間経過した
か否かを判別する。この判別の結果、一定時間を経過し
ていない場合には再びステップS204へと戻って音声
入力待ち状態となり、一定時間を経過した場合にはその
まま後述するステップS207へと進む。Step S205: If no voice is input from the microphone 150 as a result of the determination in step S204,
The operation control processing unit 174 determines whether or not a predetermined time has elapsed since the registered keyword was input and MUTE was applied to the unit unit 110 using the timer set in step S203. As a result of this determination, if the predetermined time has not elapsed, the flow returns to step S204 again to wait for voice input, and if the predetermined time has elapsed, the flow proceeds directly to step S207 described later.
【0059】ステップS206:ステップS204の判
別の結果、マイク150から音声が入力された場合、音
声認識処理部171は、開始キーワード認識部171b
により、当該音声を開始キーワードデータとしてメモリ
176に記憶(登録)する。そして、音声合成処理部1
72は、音声出力処理部173により、音声認識処理部
171によって登録された開始キーワードをスピーカ1
60から出力する。したがって、マイク150から入力
された、使用者が開始キーワードとして使用したい言葉
(”コマンド認識開始”等)の音声が、スピーカ160
からリピート出力される。これにより使用者は、自分が
入力した言葉が開始キーワードとして受け付けられたこ
とを把握することができる。Step S206: If the result of determination in step S204 is that speech has been input from the microphone 150, the speech recognition processing section 171 starts the start keyword recognition section 171b.
Thus, the voice is stored (registered) in the memory 176 as start keyword data. Then, the speech synthesis processing unit 1
72, the voice output processing unit 173 transmits the start keyword registered by the voice recognition processing unit 171 to the speaker 1;
Output from 60. Therefore, the voice of the word (“start command recognition” or the like) that the user wants to use as the start keyword, input from the microphone 150, is output from the speaker 160.
Is output repeatedly. This allows the user to know that the word entered by the user has been accepted as the start keyword.
【0060】ステップS207:ステップS206によ
り、開始キーワードの登録が終了すると、動作制御処理
部174は、ステップS203にてユニット部110へ
かけたMUTEを解除する。そして、動作制御処理部1
74は、音声出力処理部173により、”開始キーワー
ドを登録しました”といったメッセージをスピ−カ16
0から出力させる。また、ステップS205のタイムア
ウトの判別の結果、登録キーワードが入力されユニット
部110に対してMUTEをかけてから一定時間内に音
声の入力がなかった場合、動作制御処理部174は、ス
テップS203にてユニット部110へかけたMUTW
を解除し、音声出力処理部173により、例えば、”開
始キーワードの受付を終了しました”といったメッセー
ジや、”ばいばい”といったメッセージをスピ−カ16
0から出力させる。その後、ステップS201へと戻
り、再び音声入力待ち状態となる。Step S207: When the registration of the start keyword is completed in step S206, the operation control processing section 174 releases the MUTE applied to the unit section 110 in step S203. Then, the operation control processing unit 1
Numeral 74 denotes a message such as "registered start keyword" by the voice output processing unit 173.
Output from 0. In addition, as a result of the determination of the timeout in step S205, when the registered keyword is input and no voice is input within a predetermined time after the MUTE is applied to the unit unit 110, the operation control processing unit 174 determines in step S203 MUTW applied to the unit 110
Is canceled, and a message such as "acceptance of the start keyword has been completed" or a message such as "bye bye" is output by the voice output processing unit 173.
Output from 0. After that, the process returns to step S201, and again enters the voice input waiting state.
【0061】ステップS208:一方、ステップS20
2の判別の結果、入力音声が登録キーワードでない場
合、音声認識処理部171は、開始キーワード認識部1
71bによって、その入力音声のテキストデータと、上
述したステップS206にてメモリ176に登録された
開始キーワードとを比較することで、当該入力音声が開
始キーワード(”コマンド認識開始”等)であるか否か
を判別する。この判別の結果、入力音声が開始キーワー
ドである場合には次のステップS209からの処理に進
み、そうでない場合にはステップS201へと戻って再
び音声入力待ち状態となる。Step S208: On the other hand, step S20
If the result of determination in step 2 is that the input voice is not a registered keyword, the voice recognition processing unit
71b, by comparing the text data of the input voice with the start keyword registered in the memory 176 in the above-described step S206, whether or not the input voice is a start keyword (“command recognition start” or the like) is determined. Is determined. As a result of this determination, if the input voice is the start keyword, the process proceeds to the next step S209, and if not, the process returns to step S201 to again wait for voice input.
【0062】ステップS209:ステップS208の判
別の結果、入力音声が開始キーワードである場合、すな
わち開始キーワードの入力が認識された場合、音声認識
処理部171は、その旨を動作制御処理部174へ通知
する。これを受けた動作制御処理部174は、上述した
ステップS203と同様に、ユニット部110のCDユ
ニット110aやMDユニット等が動作している場合、
その動作しているユニットに対してMUTEをかける。
また、動作制御処理部174は、開始キーワードが入力
されてから所定時間(例えば、5秒)内に入力された操
作キーワードを有効とするためのタイマ(図示せず)を
セットする。尚、このとき、動作制御処理部174が、
使用者に対して、当該開始キーワードを受け付け操作キ
ーワードを入力できる状態となったことを知らせるよう
にしてもよい。具体的には例えば、動作制御処理部17
4が、音声出力処理部173により、”操作キーワード
を言って下さい”或いは”何にしますか?”といったメ
ッセージや、本ユニットが呼ばれたものとしてのその返
事のように”はい、何ですか?”といったメッセージを
スピーカ160から発生させたりする。この場合、操作
キーワードの入力を有効とする所定時間については、上
記のメッセージの出力時間を考慮した時間を設定するよ
うにする。Step S209: If the result of the determination in step S208 is that the input speech is the start keyword, that is, if the input of the start keyword has been recognized, the speech recognition processing unit 171 notifies the operation control processing unit 174 of that fact. I do. The operation control processing unit 174 that has received this, when the CD unit 110a, the MD unit, or the like of the unit unit 110 is operating, as in step S203 described above,
Apply MUTE to the operating unit.
Further, the operation control processing unit 174 sets a timer (not shown) for validating the operation keyword input within a predetermined time (for example, 5 seconds) after the input of the start keyword. At this time, the operation control processing unit 174
The user may be notified that the start keyword is accepted and the operation keyword can be input. Specifically, for example, the operation control processing unit 17
4. The voice output processing unit 173 displays a message such as "Please say the operation keyword" or "What do you want to do?" Or a reply as if this unit was called "Yes, what is it?" Or a message such as "?" In this case, as the predetermined time for which the input of the operation keyword is valid, a time is set in consideration of the output time of the message.
【0063】ステップS210:ステップS209によ
りユニット部110がMUTE状態となると、マイク1
50からの操作キーワードの入力待ち状態となる。この
とき、動作制御処理部174は、例えば、操作キーワー
ド入力待ち状態であることを示すメッセージをモニタ1
30へ表示させる。そして、音声認識処理部171は、
マイク150から操作キーワードの音声が入力されたか
否かを判別する。すなわち、音声認識処理部171は、
操作キーワード認識部171cにより、マイク150か
ら入力された音声のテキストデータと、メモリ176に
予め設定されている各種操作キーワードとを比較するこ
とで、当該入力音声が操作キーワードであるか否かを判
別する。この判別の結果、操作キーワードが入力された
場合にはステップS212の処理に進み、そうでない場
合にはステップS211の処理に進む。Step S210: When the unit section 110 enters the MUTE state in step S209, the microphone 1
It is in a state of waiting for the input of the operation keyword from 50. At this time, for example, the operation control processing unit 174 monitors the monitor 1 for a message indicating that the operation keyword input is waiting.
30 is displayed. Then, the voice recognition processing unit 171
It is determined whether or not the voice of the operation keyword has been input from microphone 150. That is, the voice recognition processing unit 171
The operation keyword recognition unit 171c compares the text data of the voice input from the microphone 150 with various operation keywords preset in the memory 176 to determine whether the input voice is the operation keyword. I do. If the result of this determination is that an operation keyword has been input, the flow proceeds to the processing in step S212; otherwise, the flow proceeds to the processing in step S211.
【0064】ステップS211:ステップS210の判
別の結果、マイク150から操作キーワードが入力され
ていない場合、動作制御処理部174は、ステップS2
09にて設定したタイマにより、開始キーワードが入力
されユニット部110に対してMUTEをかけてから一
定時間経過したか否かを判別する。この判別の結果、一
定時間を経過していない場合には再びステップS210
へと戻って操作キーワードの入力待ち状態となり、一定
時間を経過した場合にはそのまま後述するステップS2
13へと進む。Step S211: If the result of determination in step S210 is that no operation keyword has been input from the microphone 150, the operation control processing unit 174 proceeds to step S2.
The timer set in step 09 determines whether a predetermined time has elapsed since the start keyword was input and MUTE was applied to the unit 110. If the result of this determination is that the fixed time has not elapsed, step S210 is performed again.
Then, the process returns to step S2 to wait for an input of an operation keyword.
Proceed to 13.
【0065】ステップS212:ステップS210の判
別の結果、マイク150から操作キーワードが入力され
た場合、音声認識処理部171は、当該操作キーワード
を示すデータを音声合成処理部172及び動作制御処理
部174へ供給する。これを受けた音声合成処理部17
2は、音声出力処理部173により、上記操作キーワー
ドをスピーカ160から出力させる。したがって、マイ
ク150から入力された操作キーワードの音声が、スピ
ーカ160からリピート出力される。これにより使用者
は、自分が入力した操作キーワードが受け付けられたこ
とを把握することができる。また、動作制御処理部17
4は、上記操作キーワードに対応する制御コマンドをド
ライバ140へ供給する。例えば、上記操作キーワード
が、CDユニット110aでのCD再生動作の開始を示
す”CDスタート”であった場合、動作制御処理部17
4は、CD再生動作開始を示す制御コマンドを生成し、
これをドライバ140へ供給する。ドライバ140は、
動作制御処理部174からの制御コマンドにより、CD
ユニット110aでのCD再生動作を開始させる。さら
に、動作制御処理部174は、上記制御コマンドに基づ
く動作によって発生する情報(CDの再生音やCDの再
生トラックの情報等)を、スピーカ160やモニタ13
0から出力するための動作制御も行う。Step S212: If the result of determination in step S210 is that an operation keyword has been input from the microphone 150, the speech recognition processing unit 171 sends data indicating the operation keyword to the speech synthesis processing unit 172 and the operation control processing unit 174. Supply. Speech synthesis processing unit 17 receiving this
2 causes the audio output processing unit 173 to output the operation keyword from the speaker 160. Therefore, the voice of the operation keyword input from microphone 150 is repeatedly output from speaker 160. This allows the user to know that the operation keyword input by the user has been accepted. The operation control processing unit 17
4 supplies a control command corresponding to the operation keyword to the driver 140. For example, when the operation keyword is “CD start” indicating the start of the CD reproduction operation in the CD unit 110a, the operation control processing unit 17
4 generates a control command indicating the start of CD playback operation,
This is supplied to the driver 140. The driver 140
According to a control command from the operation control processing unit 174, the CD
The unit 110a starts the CD playback operation. Further, the operation control processing unit 174 transmits information (such as CD reproduction sound and CD reproduction track information) generated by the operation based on the control command to the speaker 160 and the monitor 13.
Operation control for outputting from 0 is also performed.
【0066】ステップS213:ステップS212によ
り、操作キーワードに対応する処理(コマンド処理)が
終了すると、動作制御処理部174は、ステップS20
9にてユニット部110へかけたMUTEを解除する。
また、ステップS211のタイムアウトの判別の結果、
開始キーワードが入力されユニット部110に対してM
UTEをかけてから一定時間内に操作キーワードの入力
がなかった場合、動作制御処理部174は、ステップS
209にてユニット部110へかけたMUTEを解除
し、音声出力処理部173により、例えば、”操作キー
ワードの受付を終了しました”といったメッセージ
や、”ばいばい”といったメッセージをスピ−カ160
から出力させる。その後、ステップS201へと戻り、
再び音声入力待ち状態となる。Step S213: When the processing (command processing) corresponding to the operation keyword is completed in step S212, the operation control processing unit 174 proceeds to step S20.
At 9, the MUTE applied to the unit 110 is released.
Also, as a result of the determination of the timeout in step S211,
The start keyword is input, and M
If the operation keyword has not been input within a certain period of time since the user entered UTE, the operation control processing unit 174 proceeds to step S
At step 209, the MUTE applied to the unit 110 is released, and the voice output processing unit 173 outputs a message such as "the operation keyword has been accepted" or a message "bye".
Output from Then, returning to step S201,
The voice input wait state is set again.
【0067】(2)開始キーワードをキー操作により登
録する場合(図4参照)(2) When starting keyword is registered by key operation (see FIG. 4)
【0068】ステップS301:先ず、センターコント
ロールユニット100本体の電源がONされると、マイ
ク150からの音声入力待ち状態となる。この状態にお
いて、音声認識処理部171は、マイク150から音声
が入力されたか否かを判別する。この判別の結果、マイ
ク150から音声が入力された場合には後述するステッ
プS301からの処理に進み、そうでない場合には次の
ステップS308からの処理に進む。尚、センターコン
トロールユニット100本体の電源ON状態とは、ユニ
ット部110の各種ユニットが動作可能な状態であり、
車載ユニットであればACCのON状態を示す。Step S301: First, when the power of the main body of the center control unit 100 is turned on, the apparatus enters a state of waiting for a voice input from the microphone 150. In this state, the voice recognition processing unit 171 determines whether or not voice has been input from the microphone 150. As a result of the determination, if a voice is input from the microphone 150, the process proceeds to step S301, which will be described later; otherwise, the process proceeds to the next step S308. The power ON state of the center control unit 100 is a state in which various units of the unit section 110 can operate.
In the case of an in-vehicle unit, it indicates the ON state of ACC.
【0069】ステップS308:ステップS301の判
別の結果、マイク150からの音声入力が無い場合、動
作制御処理部174は、キー入力処理部175からのキ
ー操作部120の操作状態検出結果により、キー操作部
120のキーワード登録キー120aが操作されたか否
かを判別する。この判別の結果、キーワード登録キー1
20aが操作された場合には次のステップS309から
の処理に進み、そうでない場合にはステップS301へ
戻って再び音声入力待ち状態となる。Step S308: As a result of the determination in step S301, when there is no voice input from the microphone 150, the operation control processing unit 174 determines the key operation based on the operation state detection result of the key operation unit 120 from the key input processing unit 175. It is determined whether or not the keyword registration key 120a of the unit 120 has been operated. As a result of this determination, the keyword registration key 1
If the button 20a has been operated, the process proceeds from the next step S309, and if not, the process returns to step S301 to wait for a voice input again.
【0070】ステップS309:ステップS308の判
別の結果、キー操作部120のキーワード登録キー12
0aが操作された場合、すなわち開始キーワードを登録
することを指示された場合、動作制御処理部174は、
ユニット部110のCDユニット110aやMDユニッ
ト等が動作している場合にはその動作しているユニット
に対してMUTEをかける。これにより、使用者の声以
外のものからの音(CDの再生により出力されている
音、ラジオの音等)への反応を防ぐことができる。ま
た、動作制御処理部174は、キー操作部120のキー
ワード登録キー120aが操作されてから所定時間(例
えば、5秒)内に入力された開始キーワードを有効とす
るためのタイマ(図示せず)をセットする。尚、このと
き、動作制御処理部174が、使用者に対して、当該キ
ーワード登録キー120a120aによる指示を受け付
け開始キーワードを登録できる状態となったことを知ら
せるようにしてもよい。具体的には例えば、動作制御処
理部174が、音声出力処理部173により、アラーム
音をスピーカ160から発生させたり、”開始キーワー
ドを登録する準備ができました。開始キーワードを言っ
て下さい。”といったメッセージをスピーカ160から
発生させたりする。この場合、開始キーワードの入力を
有効とする所定時間については、上記のアラーム音やメ
ッセージの出力時間を考慮した時間を設定するようにす
る。Step S309: As a result of the determination in step S308, the keyword registration key 12 of the key operation unit 120
When 0a is operated, that is, when an instruction to register a start keyword is issued, the operation control processing unit 174
When the CD unit 110a, the MD unit or the like of the unit unit 110 is operating, MUTE is applied to the operating unit. As a result, it is possible to prevent a reaction to a sound (a sound output by reproducing a CD, a radio sound, or the like) from a sound other than the user's voice. The operation control processing unit 174 includes a timer (not shown) for validating a start keyword input within a predetermined time (for example, 5 seconds) after the keyword registration key 120a of the key operation unit 120 is operated. Is set. At this time, the operation control processing unit 174 may notify the user that the instruction by the keyword registration keys 120a and 120a has been accepted and the start keyword can be registered. Specifically, for example, the operation control processing unit 174 causes the audio output processing unit 173 to generate an alarm sound from the speaker 160, or "Ready to register a start keyword. Please say the start keyword." Is generated from the speaker 160. In this case, as the predetermined time for which the input of the start keyword is valid, a time is set in consideration of the output time of the alarm sound and the message.
【0071】ステップS310:ステップS309によ
りユニット部110がMUTE状態となると、マイク1
50からの音声入力待ち状態となる。このとき、動作制
御処理部174は、例えば、音声入力待ち状態であるこ
とを示すメッセージをモニタ130へ表示させる。そし
て、音声認識処理部171は、マイク150から音声が
入力されたか否かを判別する。この判別の結果、マイク
150から音声が入力された場合にはステップS312
の処理に進み、そうでない場合にはステップS311の
処理に進む。Step S310: When the unit section 110 enters the MUTE state in step S309, the microphone 1
It is in a state of waiting for a voice input from 50. At this time, the operation control processing unit 174 causes the monitor 130 to display, for example, a message indicating that it is in a voice input waiting state. Then, the voice recognition processing unit 171 determines whether or not voice has been input from the microphone 150. If the result of this determination is that speech has been input from the microphone 150, step S312
Otherwise, the process proceeds to step S311.
【0072】ステップS311:ステップS310の判
別の結果、マイク150から音声が入力されない場合、
動作制御処理部174は、ステップS309にて設定し
たタイマにより、キーワード登録キー120aが操作さ
れユニット部110に対してMUTEをかけてから一定
時間経過したか否かを判別する。この判別の結果、一定
時間を経過していない場合には再びステップS310へ
と戻って音声入力待ち状態となり、一定時間を経過した
場合にはそのまま後述するステップS313へと進む。Step S311: If no voice is input from the microphone 150 as a result of the determination in step S310,
The operation control processing unit 174 determines whether or not a predetermined time has elapsed since the keyword registration key 120a was operated and MUTE was applied to the unit unit 110 by using the timer set in step S309. If the result of this determination is that the predetermined time has not elapsed, the flow returns to step S310 to wait for voice input, and if the predetermined time has elapsed, the flow proceeds directly to step S313 described below.
【0073】ステップS312:ステップS310の判
別の結果、マイク150から音声が入力された場合、音
声認識処理部171は、開始キーワード認識部171b
により、当該音声を開始キーワードデータとしてメモリ
176に記憶(登録)する。そして、音声合成処理部1
72は、音声出力処理部173により、音声認識処理部
171によって登録された開始キーワードをスピーカ1
60から出力する。したがって、マイク150から入力
された、使用者が開始キーワードとして使用したい言葉
(”コマンド認識開始”等)の音声が、スピーカ160
からリピート出力される。これにより使用者は、自分が
入力した言葉が開始キーワードとして受け付けられたこ
とを把握することができる。Step S312: As a result of the determination in step S310, when a voice is input from the microphone 150, the voice recognition processing section 171 starts the start keyword recognition section 171b.
Thus, the voice is stored (registered) in the memory 176 as start keyword data. Then, the speech synthesis processing unit 1
72, the voice output processing unit 173 transmits the start keyword registered by the voice recognition processing unit 171 to the speaker 1;
Output from 60. Therefore, the voice of the word (“start command recognition” or the like) that the user wants to use as the start keyword, input from the microphone 150, is output from the speaker 160.
Is output repeatedly. This allows the user to know that the word entered by the user has been accepted as the start keyword.
【0074】ステップS313:ステップS312によ
り、開始キーワードの登録が終了すると、動作制御処理
部174は、ステップS309にてユニット部110へ
かけたMUTEを解除する。そして、動作制御処理部1
74は、音声出力処理部173により、”開始キーワー
ドを登録しました”といったメッセージをスピ−カ16
0から出力させる。また、ステップS311のタイムア
ウトの判別の結果、キーワード登録キー120aが操作
されユニット部110に対してMUTEをかけてから一
定時間内に音声の入力がなかった場合、動作制御処理部
174は、ステップS309にてユニット部110へか
けたMUTEを解除し、音声出力処理部173により、
例えば、”開始キーワードの受付を終了しました”とい
ったメッセージや、”ばいばい”といったメッセージを
スピ−カ160から出力させる。その後、ステップS3
01へと戻り、再び音声入力待ち状態となる。Step S313: When the registration of the start keyword is completed in step S312, the operation control processing section 174 releases the MUTE applied to the unit section 110 in step S309. Then, the operation control processing unit 1
Numeral 74 denotes a message such as "registered start keyword" by the voice output processing unit 173.
Output from 0. Also, as a result of the determination of the timeout in step S311, if the keyword registration key 120a is operated and MUTE is not applied to the unit unit 110, and there is no voice input within a predetermined time, the operation control processing unit 174 proceeds to step S309. The MUTE applied to the unit unit 110 is released at, and the audio output processing unit 173 outputs
For example, a message such as "the reception of the start keyword has been completed" or a message such as "bye" is output from the speaker 160. Then, step S3
The process returns to 01, and again enters the voice input waiting state.
【0075】ステップS302:ステップS301の判
別の結果、マイク150から音声の入力があった場合、
音声認識処理部171は、開始キーワード認識部171
bによって、その入力音声のテキストデータと、上述し
たステップS206にてメモリ176に登録された開始
キーワードとを比較することで、当該入力音声が開始キ
ーワード(”コマンド認識開始”等)であるか否かを判
別する。この判別の結果、入力音声が開始キーワードで
ある場合には次のステップS303からの処理に進む。
一方、入力音声が開始キーワードでない場合、すなわち
音声が入力されがその音声が開始キーワードでない場
合、図5に示すように、入力音声が登録キーワードであ
るか否かをチェックするために、上記図3に示したよう
なステップS202からの処理を実行する。その後、上
記図4のステップS301へと戻って再び音声入力待ち
状態となる。これにより、開始キーワードの登録を、登
録キーワードの音声入力によっても、後述するステップ
S309からの処理により、キーワード登録キー120
aの操作によっても行なうことができる。Step S302: If the result of determination in step S301 is that a voice has been input from the microphone 150,
The speech recognition processing unit 171 includes a start keyword recognition unit 171.
b, by comparing the text data of the input voice with the start keyword registered in the memory 176 in step S206 described above, whether or not the input voice is the start keyword (“command recognition start” or the like) Is determined. If the result of this determination is that the input speech is the start keyword, the process proceeds to the next step S303.
On the other hand, if the input voice is not the start keyword, that is, if the voice is input but the voice is not the start keyword, as shown in FIG. 5, in order to check whether the input voice is a registered keyword, as shown in FIG. The processing from step S202 shown in FIG. After that, the process returns to step S301 in FIG. Thus, the registration of the start keyword can be performed by inputting the registered keyword by voice or by performing the processing from step S309 described later.
It can also be performed by the operation of a.
【0076】ステップS303:ステップS302の判
別の結果、入力音声が開始キーワードである場合、すな
わち開始キーワードの入力が認識された場合、音声認識
処理部171は、その旨を動作制御処理部174へ通知
する。これを受けた動作制御処理部174は、上述した
ステップS309と同様に、ユニット部110のCDユ
ニット110aやMDユニット等が動作している場合に
はその動作しているユニットに対してMUTEをかけ
る。また、動作制御処理部174は、開始キーワードが
入力されてから所定時間(例えば、5秒)内に入力され
た操作キーワードを有効とするためのタイマ(図示せ
ず)をセットする。尚、このとき、上述したステップS
209と同様に、動作制御処理部174が、使用者に対
して、当該開始キーワードを受け付け操作キーワードを
入力できる状態となったことを知らせるようにしてもよ
い。Step S303: If the input speech is the start keyword as a result of the determination in step S302, that is, if the input of the start keyword is recognized, the speech recognition processing unit 171 notifies the operation control processing unit 174 of the fact. I do. When the operation control processing unit 174 receives this, similarly to step S309 described above, when the CD unit 110a, the MD unit, or the like of the unit unit 110 is operating, the operation control processing unit 174 applies MUTE to the operating unit. . Further, the operation control processing unit 174 sets a timer (not shown) for validating the operation keyword input within a predetermined time (for example, 5 seconds) after the input of the start keyword. At this time, the above-described step S
Similarly to 209, the operation control processing unit 174 may notify the user that the start keyword is accepted and the operation keyword can be input.
【0077】ステップS304:ステップS303によ
りユニット部110がMUTE状態となると、マイク1
50からの操作キーワードの入力待ち状態となる。この
とき、動作制御処理部174は、例えば、操作キーワー
ド入力待ち状態であることを示すメッセージをモニタ1
30へ表示させる。そして、音声認識処理部171は、
マイク150から操作キーワードの音声が入力されたか
否かを判別する。すなわち、音声認識処理部171は、
操作キーワード認識部171cにより、マイク150か
ら入力された音声のテキストデータと、メモリ176に
予め設定されている各種操作キーワードとを比較するこ
とで、当該入力音声が操作キーワードであるか否かを判
別する。この判別の結果、操作キーワードが入力された
場合にはステップS306の処理に進み、そうでない場
合にはステップS305の処理に進む。Step S304: When the unit section 110 enters the MUTE state in step S303, the microphone 1
It is in a state of waiting for the input of the operation keyword from 50. At this time, for example, the operation control processing unit 174 monitors the monitor 1 for a message indicating that the operation keyword input is waiting.
30 is displayed. Then, the voice recognition processing unit 171
It is determined whether or not the voice of the operation keyword has been input from microphone 150. That is, the voice recognition processing unit 171
The operation keyword recognition unit 171c compares the text data of the voice input from the microphone 150 with various operation keywords preset in the memory 176 to determine whether the input voice is the operation keyword. I do. If the result of this determination is that an operation keyword has been input, the flow proceeds to the processing in step S306; otherwise, the flow proceeds to the processing in step S305.
【0078】ステップS305:ステップS304の判
別の結果、マイク150から操作キーワードが入力され
ない場合、動作制御処理部174は、ステップS303
にて設定したタイマにより、開始キーワードが入力され
ユニット部110に対してMUTEをかけてから一定時
間経過したか否かを判別する。この判別の結果、一定時
間を経過していない場合には再びステップS304へと
戻って操作キーワードの入力待ち状態となり、一定時間
を経過した場合にはそのまま後述するステップS307
へと進む。Step S305: If the operation keyword is not input from the microphone 150 as a result of the determination in step S304, the operation control processing unit 174 proceeds to step S303.
Then, it is determined whether or not a predetermined time has elapsed since the start keyword was input and MUTE was applied to unit unit 110 by the timer set in. If the result of this determination is that the predetermined time has not elapsed, the flow returns to step S304 again to wait for input of an operation keyword, and if the predetermined time has elapsed, step S307 described later is used as it is.
Proceed to.
【0079】ステップS306:ステップS304の判
別の結果、マイク150から操作キーワードが入力され
た場合、音声認識処理部171は、当該操作キーワード
を示すデータを音声合成処理部172及び動作制御処理
部174へ供給する。これを受けた音声合成処理部17
2は、音声出力処理部173により、上記操作キーワー
ドをスピーカ160から出力させる。したがって、マイ
ク150から入力された操作キーワードの音声が、スピ
ーカ160からリピート出力される。これにより使用者
は、自分が入力した操作キーワードが受け付けられたこ
とを把握することができる。また、動作制御処理部17
4は、上記操作キーワードに対応する制御コマンドをド
ライバ140へ供給する。例えば、上記操作キーワード
が、CDユニット110aでのCD再生動作の開始を示
す”CDスタート”であった場合、動作制御処理部17
4は、CD再生動作開始を示す制御コマンドを生成し、
これをドライバ140へ供給する。ドライバ140は、
動作制御処理部174からの制御コマンドにより、CD
ユニット110aでのCD再生動作を開始させる。さら
に、動作制御処理部174は、上記制御コマンドに基づ
く動作によって発生する情報(CDの再生音やCDの再
生トラックの情報等)を、スピーカ160やモニタ13
0から出力するための動作制御も行う。Step S306: As a result of the determination in step S304, when an operation keyword is input from the microphone 150, the voice recognition processing unit 171 sends data indicating the operation keyword to the voice synthesis processing unit 172 and the operation control processing unit 174. Supply. Speech synthesis processing unit 17 receiving this
2 causes the audio output processing unit 173 to output the operation keyword from the speaker 160. Therefore, the voice of the operation keyword input from microphone 150 is repeatedly output from speaker 160. This allows the user to know that the operation keyword input by the user has been accepted. The operation control processing unit 17
4 supplies a control command corresponding to the operation keyword to the driver 140. For example, when the operation keyword is “CD start” indicating the start of the CD reproduction operation in the CD unit 110a, the operation control processing unit 17
4 generates a control command indicating the start of CD playback operation,
This is supplied to the driver 140. The driver 140
According to a control command from the operation control processing unit 174, the CD
The unit 110a starts the CD playback operation. Further, the operation control processing unit 174 transmits information (such as CD reproduction sound and CD reproduction track information) generated by the operation based on the control command to the speaker 160 and the monitor 13.
Operation control for outputting from 0 is also performed.
【0080】ステップS307:ステップS306によ
り、操作キーワードに対応する処理(コマンド処理)が
終了すると、動作制御処理部174は、ステップS30
3にてユニット部110へかけたMUTEを解除する。
また、ステップS305のタイムアウトの判別の結果、
開始キーワードが入力されユニット部110に対してM
UTEをかけてから一定時間内に操作キーワードの入力
がなかった場合、動作制御処理部174は、ステップS
303にてユニット部110へかけたMUTEを解除
し、音声出力処理部173により、例えば、”操作キー
ワードの受付を終了しました”といったメッセージ
や、”ばいばい”といったメッセージをスピ−カ160
から出力させる。その後、ステップS301へと戻り、
再び音声入力待ち状態となる。Step S307: When the processing (command processing) corresponding to the operation keyword ends in step S306, the operation control processing unit 174 proceeds to step S30.
In step 3, the MUTE applied to the unit 110 is released.
Also, as a result of the determination of the timeout in step S305,
The start keyword is input, and M
If the operation keyword has not been input within a certain period of time since the user entered UTE, the operation control processing unit 174 proceeds to step S
At 303, the MUTE applied to the unit unit 110 is released, and the voice output processing unit 173 outputs, for example, a message such as "the reception of the operation keyword has been completed" or a message such as "bye".
Output from After that, returning to step S301,
The voice input wait state is set again.
【0081】上述のように本実施の形態では、音声認識
を開始するための開始キーワードを、登録キーワードを
用いた音声入力、或いはキーワード登録キー120aの
操作に基づいて予め登録しておき、その開始キーワード
がマイク150から入力されることで、音声認識を開始
するように構成した。As described above, in the present embodiment, a start keyword for starting speech recognition is registered in advance based on a voice input using a registered keyword or an operation of the keyword registration key 120a. The speech recognition is started when a keyword is input from the microphone 150.
【0082】これにより、従来装置で設けられていた音
声認識の開始のための音声認識開始スイッチ(上記図6
参照)を省くことができるため、装置或いはシステム全
体のコストダウンを図ることができる。また、上記音声
認識開始スイッチを設ける場所を確保する必要がないた
め、車の内装のデザインに制限が生じることはない。さ
らに、使用者にとっても、音声認識の開始の度に音声認
識開始スイッチをONするといった非常に煩わしい操作
を行なう必要がなくなるため、操作性を大幅に向上させ
ることができる。As a result, a speech recognition start switch for starting speech recognition provided in the conventional apparatus (see FIG. 6)
) Can be omitted, so that the cost of the apparatus or the entire system can be reduced. Further, since it is not necessary to secure a place where the voice recognition start switch is provided, there is no restriction on the design of the interior of the car. Further, the user does not need to perform a very troublesome operation such as turning on a voice recognition start switch every time voice recognition is started, so that operability can be greatly improved.
【0083】また、開始キーワードが音声入力されてか
ら、一定時間内の操作キーワードの音声入力を受け付け
るようにしたので、常に操作キーワードの入力が可能な
状態にしておくと、当該操作キーワード以外の音が認識
されてしまい、使用者が意図していない時に突然誤動作
する可能性がある、ということを確実に防ぐことができ
る。さらに、開始キーワードが入力されてからMUTE
をかけるようにしたので、余分なMUTEがかかること
なく、その後の操作キーワードの認識を正確に行なうこ
とができる。Further, since the input of the operation keyword within a certain period of time is accepted after the start keyword is input by voice, if the operation keyword can always be input, the sound other than the operation keyword can be input. Can be surely prevented, and there is a possibility that a malfunction may occur suddenly when the user does not intend. Furthermore, after the start keyword is input, MUTE
, The subsequent operation keywords can be accurately recognized without extra MUTE.
【0084】また、通常では、登録キーワードと開始キ
ーワードの2つのキーワードのみしか受け付けない、す
なわち入力された音声が登録キーワードであるか、開始
キーワードであるかの、2つのキーワードのみの認識を
行なうようにしているため、キーワードの誤認識を防ぐ
ことができる。Normally, only two keywords, a registered keyword and a start keyword, are accepted, that is, only two keywords, that is, whether the input voice is a registered keyword or a start keyword, are recognized. , It is possible to prevent erroneous recognition of keywords.
【0085】また、開始キーワードとして、使用者が利
用しやすく覚えやすい言葉を任意に登録することができ
るため、使用者は、自分が登録した開始キーワードを忘
れることなく正確に使用することができる。さらに、開
始キーワードとして、普段使用しない言葉を登録すれ
ば、同乗者の会話等の中の言葉が開始キーワードとして
認識されにくいため、キーワードの誤認識を確実に防ぐ
ことができる。さらにまた、開始キーワードとして、使
用者の好きな言葉を登録すれば、その言葉の音声入力
(呼びかけ)により反応するため、本装置に愛着がわ
き、装置の魅力を高めることができる。Also, since words that are easy for the user to use and easy to remember can be arbitrarily registered as start keywords, the user can use the registered start keywords accurately without forgetting them. Furthermore, if words that are not usually used are registered as start keywords, words in conversations of passengers and the like are unlikely to be recognized as start keywords, so that erroneous recognition of keywords can be reliably prevented. Furthermore, if a user's favorite word is registered as a start keyword, the user responds by voice input (calling) of the word, so that the user can be more attached to the present apparatus and the attractiveness of the apparatus can be enhanced.
【0086】また、開始キーワードの登録を、登録キー
ワードの音声入力と、キー操作部120のキーワード登
録キー120aの操作との何れの方法でも行なえるよう
にしたので、使用者は、そのときの状況に応じて、利用
しやすい方法で、開始キーワードの登録を行なうことが
できる。例えば、開始キーワードの登録は頻繁に行なう
作業ではないので、キー操作部120のキーワード登録
キー120aの操作により行なうようにしてもよい。Further, since the start keyword can be registered by either the voice input of the registered keyword or the operation of the keyword registration key 120a of the key operation unit 120, the user can check the situation at that time. , The start keyword can be registered in an easy-to-use method. For example, since the registration of the start keyword is not frequently performed, it may be performed by operating the keyword registration key 120a of the key operation unit 120.
【0087】尚、上述した本実施の形態において、次の
ような構成を採用するようにしてもよい。In the above-described embodiment, the following configuration may be adopted.
【0088】(1)ユニット部110としては、CDユ
ニット110aやMDユニットに限られることはなく、
例えば、CDユニット110a及びMDユニットに加え
て、ラジオ、TV、チューナ、カーナビゲーションシス
テム、エアコン等のユニットを含ませるようにしてもよ
いし、或いは、これらのユニットの一部を含むようにし
てもよい。(1) The unit section 110 is not limited to the CD unit 110a or the MD unit.
For example, in addition to the CD unit 110a and the MD unit, a unit such as a radio, a TV, a tuner, a car navigation system, and an air conditioner may be included, or a part of these units may be included.
【0089】(2)上記図2に示したようなコントロー
ラ170の機能を、CDユニット110aやカーナビゲ
ーションシステム等の各ユニット自体に持たせるように
してもよい。また、上記図2に示したようなコントロー
ラ170は、上記図1に示したような車載装置に限ら
ず、例えば、携帯電話等の電話機や、オーディオ装置、
その他の音声認識機能を有する装置やシステムに適用可
能である。(2) Each unit such as the CD unit 110a and the car navigation system may have the function of the controller 170 as shown in FIG. 2 described above. The controller 170 as shown in FIG. 2 is not limited to the in-vehicle device as shown in FIG. 1, but may be, for example, a telephone such as a mobile phone, an audio device,
The present invention is applicable to other devices and systems having a voice recognition function.
【0090】(3)入力音声の認識の際、当該入力音声
をテキストデータに変換してメモリ176に記憶するよ
うにしたが、例えば、当該入力音声をそのままサンプリ
ングしてメモリ176に記憶するようにしてもよい。(3) When recognizing an input voice, the input voice is converted into text data and stored in the memory 176. For example, the input voice is sampled as it is and stored in the memory 176. You may.
【0091】(4)開始キーワードをキー操作部120
のキーワード登録キー120aの操作によって登録する
場合、キーワード登録キー120aが押下され、開始キ
ーワードとしての音声が入力された後、再度キーワード
登録キー120aが押下されたときに、当該入力音声を
開始キーワードとして登録するようにしてもよい。(4) The start keyword is input to the key operation unit 120
When the keyword is registered by operating the keyword registration key 120a, when the keyword registration key 120a is pressed and the voice as the start keyword is input, and when the keyword registration key 120a is pressed again, the input voice is used as the start keyword. You may make it register.
【0092】(5)開始キーワードの登録を音声入力で
行ない、ユニット部110に対する全ての動作指示をも
音声認識機能によって行なうように構成した場合、キー
操作部120は必ずしも設ける必要はない。(5) When the start keyword is registered by voice input and all operation instructions to the unit section 110 are also performed by the voice recognition function, the key operation section 120 is not necessarily provided.
【0093】(6)音声入力待ち状態や、ユニット部1
10の動作状態等の情報を使用者に示すために、モニタ
130での表示を行なうようにしたが、これは必ずしも
必要ではなく、モニタ130を設けない構成とするよう
にしてもよい。また、モニタ130に各種情報を表示す
る代わりに、当該情報をスピーカ160から音声として
出力するようにしてもよい。(6) Waiting for voice input, unit unit 1
The display on the monitor 130 is performed in order to show the information such as the operation state of the device 10 to the user. However, this is not always necessary, and the monitor 130 may not be provided. Further, instead of displaying various kinds of information on the monitor 130, the information may be output from the speaker 160 as audio.
【0094】(7)本発明の目的は、上述した実施の形
態の各機能を実現するソフトウェアのプログラムコード
を記憶した記憶媒体を、システム或いは装置に供給し、
そのシステム或いは装置のコンピュータ(又はCPUや
MPU)が記憶媒体に格納されたプログラムコードを読
みだして実行することによっても、達成されることは言
うまでもない。この場合、記憶媒体から読み出されたプ
ログラムコード自体が本実施の形態の機能を実現するこ
ととなり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することとなる。プログラムコードを供給
するための記憶媒体としては、ROM、フロッピーディ
スク、ハードディスク、光ディスク、光磁気ディスク、
CD−ROM、CD−R、磁気テープ、不揮発性のメモ
リカード等を用いることができる。また、コンピュータ
が読みだしたプログラムコードを実行することにより、
本実施の形態の機能が実現されるだけでなく、そのプロ
グラムコードの指示に基づき、コンピュータ上で稼動し
ているOS等が実際の処理の一部又は全部を行い、その
処理によって本実施の形態の機能が実現される場合も含
まれることは言うまでもない。さらに、記憶媒体から読
み出されたプログラムコードが、コンピュータに挿入さ
れた拡張機能ボードやコンピュータに接続された機能拡
張ユニットに備わるメモリに書き込まれた後、そのプロ
グラムコードの指示に基づき、その機能拡張ボードや機
能拡張ユニットに備わるCPUなどが実際の処理の一部
又は全部を行い、その処理によって本実施の形態の機能
が実現される場合も含まれることは言うまでもない。(7) An object of the present invention is to provide a system or an apparatus with a storage medium storing a program code of software for realizing each function of the above-described embodiment,
It is needless to say that the present invention is also achieved when a computer (or CPU or MPU) of the system or apparatus reads out and executes a program code stored in a storage medium. In this case, the program code itself read from the storage medium implements the functions of the present embodiment, and the storage medium storing the program code constitutes the present invention. As storage media for supplying the program code, ROM, floppy disk, hard disk, optical disk, magneto-optical disk,
A CD-ROM, CD-R, magnetic tape, nonvolatile memory card, or the like can be used. Also, by executing the program code read by the computer,
Not only the functions of the present embodiment are realized, but also an OS or the like running on a computer performs a part or all of the actual processing based on the instructions of the program code. It is needless to say that the case where the function is realized is also included. Further, after the program code read from the storage medium is written to a memory provided in an extension function board inserted into the computer or a function extension unit connected to the computer, the function extension is performed based on the instruction of the program code. It goes without saying that a CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the present embodiment.
【0095】[0095]
【発明の効果】以上説明したように本発明では、任意の
機能を動作させるための操作キーワードの音声認識の開
始を、開始キーワードの音声入力によって行なえるよう
に構成したので、従来からの音声認識の開始のためのス
イッチ等を設ける必要はない。これにより、装置或いは
システム全体のコストダウンを図ることができる。As described above, according to the present invention, speech recognition of an operation keyword for operating an arbitrary function can be started by speech input of a start keyword. It is not necessary to provide a switch or the like for starting the operation. Thereby, the cost of the apparatus or the entire system can be reduced.
【0096】また、使用者は、音声認識により上記任意
の機能を動作させたい度に、その都度上記スイッチをO
Nする等といった非常に煩わしい操作を行なう必要がな
くなるため、操作性を大幅に向上させることができる。Each time the user wants to operate the above-mentioned arbitrary function by voice recognition, the user turns on the above switch every time.
Since it is not necessary to perform a very troublesome operation such as N, the operability can be greatly improved.
【0097】また、登録キーワードと開始キーワードの
2つのキーワードのみの音声入力の認識を行ない、開始
キーワードである場合に、次の操作キーワードの音声入
力の認識を行なうことができるように構成されているた
め、キーワードの誤認識を防ぐことができる。Further, the speech input of only the two keywords, the registered keyword and the start keyword, is recognized, and if the keyword is the start keyword, the speech input of the next operation keyword can be recognized. Therefore, erroneous recognition of the keyword can be prevented.
【0098】また、開始キーワードを登録するように構
成した場合には、開始キーワードとして、使用者が利用
しやすく覚えやすい言葉等を任意に登録することができ
るため、使用者は、自分が登録した開始キーワードを忘
れることなく正確に使用することができる。さらに、開
始キーワードとして、普段使用しない言葉を登録すれ
ば、会話中の言葉等が開始キーワードとして認識されに
くいため、キーワードの誤認識を確実に防ぐことができ
る。さらにまた、開始キーワードとして、使用者の好き
な言葉を登録すれば、その言葉の音声入力(呼びかけ)
により反応するため、本発明を適用した装置やシステム
に愛着がわき、当該装置やシステムの魅力を高めること
ができる。When the start keyword is configured to be registered, words that are easy for the user to use and easy to remember can be arbitrarily registered as the start keyword. It can be used accurately without forgetting the starting keyword. Furthermore, if words that are not usually used are registered as start keywords, words in conversation are difficult to be recognized as start keywords, so that erroneous recognition of keywords can be reliably prevented. Furthermore, if a user's favorite word is registered as a starting keyword, voice input of that word (call)
, The attachment to the device or system to which the present invention is applied is enhanced, and the attraction of the device or system can be enhanced.
【0099】また、開始キーワードの登録を、登録キー
ワードの音声入力と、キー操作との何れの方法でも行な
えるように構成した場合には、使用者は、そのときの状
況に応じて、利用しやすい方法で、開始キーワードの登
録を行なうことができる。If the start keyword is registered so that it can be registered by either the voice input of the registered keyword or the key operation, the user can use the key word in accordance with the situation at that time. The start keyword can be registered in an easy way.
【0100】また、開始キーワードが音声入力されてか
ら、一定時間内の操作キーワードの音声入力を受け付け
るように構成した場合には、確実に操作キーワードの音
声入力を認識することができる。これにより、当該認識
の誤りによって誤動作することを確実に防ぐくことがで
き、高性能な音声認識を提供することができる。[0100] Further, when the voice input of the operation keyword within a certain period of time is accepted after the voice input of the start keyword, the voice input of the operation keyword can be surely recognized. This can reliably prevent malfunction due to the recognition error, and provide high-performance speech recognition.
【0101】また、開始キーワードの音声入力が認識さ
れてから操作キーワードの音声入力がされる間に、音楽
やラジオ等の音の出力の禁止をするように構成した場合
には、さらに確実に操作キーワードの音声入力を認識す
ることができる。If the system is configured to prohibit the output of sound such as music or radio while the voice input of the operation keyword is performed after the voice input of the start keyword is recognized, the operation can be more reliably performed. The voice input of the keyword can be recognized.
【図1】本発明を適用した、自動車の運転席に設けられ
るセンターコントロールユニットの構成を説明するため
の図である。FIG. 1 is a diagram for explaining a configuration of a center control unit provided in a driver seat of an automobile to which the present invention is applied.
【図2】上記センターコントロールユニットの内部構成
を示すブロック図である。FIG. 2 is a block diagram showing an internal configuration of the center control unit.
【図3】上記センターコントロールユニットにおいて、
音声認識を開始することを示す開始キーワードを、登録
キーワードの音声入力により登録する場合の上記センタ
ーコントロールユニットの動作を説明するためのフロー
チャートである。FIG. 3 In the center control unit,
It is a flowchart for demonstrating the operation | movement of the said center control unit at the time of registering the start keyword which shows starting speech recognition by the voice input of a registered keyword.
【図4】上記開始キーワードをキーワード登録キーの操
作により登録する場合の上記センターコントロールユニ
ットの動作を説明するためのフローチャートである。FIG. 4 is a flowchart illustrating an operation of the center control unit when the start keyword is registered by operating a keyword registration key.
【図5】上記開始キーワードをキーワード登録キーの操
作により登録する場合において、入力音声が開始キーワ
ードでない場合の処理を説明するためのフローチャート
である。FIG. 5 is a flowchart illustrating a process when the input voice is not a start keyword when the start keyword is registered by operating a keyword registration key.
【図6】従来の音声認識機能の構成を示すブロック図で
ある。FIG. 6 is a block diagram showing a configuration of a conventional voice recognition function.
100 センターコントロールユニット 110 ユニット部 120 キー操作部 130 モニタ 140 ドライバ 150 マイク 160 スピーカ 170 コントローラ 171 音声認識処理部 171a 登録キーワード認識部 171b 開始キーワード認識部 171c 操作キーワード認識部 172 音声合成処理部 173 音声出力処理部 174 動作制御処理部 175 キー入力処理部 176 メモリ 100 center control unit 110 unit section 120 key operation section 130 monitor 140 driver 150 microphone 160 speaker 170 controller 171 voice recognition processing section 171a registered keyword recognition section 171b start keyword recognition section 171c operation keyword recognition section 172 voice synthesis processing section 173 voice output processing Unit 174 operation control processing unit 175 key input processing unit 176 memory
Claims (13)
操作キーワードの音声入力を認識する操作認識手段と、 上記操作認識手段での上記操作キーワードの認識動作開
始を指示するための開始キーワードの音声入力を認識す
る開始認識手段とを備え、 上記操作認識手段は、上記開始認識手段の認識結果に基
づいて、上記操作キーワードの認識動作を開始すること
を特徴とする音声認識装置。An operation recognizing means for recognizing a voice input of an operation keyword for instructing execution of an arbitrary function, and a start keyword for instructing a start of a recognition operation of the operation keyword by the operation recognizing means A speech recognition device, comprising: start recognition means for recognizing a voice input, wherein the operation recognition means starts a recognition operation of the operation keyword based on a recognition result of the start recognition means.
により上記開始キーワードの音声入力が認識されてから
所定時間の間、上記操作キーワードの認識動作を実行す
ることを特徴とする請求項1記載の音声認識装置。2. The operation recognition unit according to claim 1, wherein the operation recognition unit executes the operation keyword recognition operation for a predetermined time after the start recognition unit recognizes the voice input of the start keyword. Voice recognition device.
ードの音声入力が認識されてから所定期間の間、又は上
記開始認識手段により上記開始キーワードの音声入力が
認識されてから上記操作認識手段により上記操作キーワ
ードの音声入力が認識されるまでの間、音の出力を禁止
する制御手段を備えたことを特徴とする請求項1記載の
音声認識装置。3. The operation by the operation recognizing means for a predetermined period of time after the speech input of the start keyword is recognized by the start recognizing means, or after the speech input of the start keyword is recognized by the start recognizing means. 2. The speech recognition apparatus according to claim 1, further comprising control means for inhibiting output of a sound until the speech input of the keyword is recognized.
めの登録キーワードの音声入力を認識する登録認識手段
と、 上記登録認識手段により上記登録キーワードの音声入力
が認識された後の入力音声を上記開始キーワードとして
登録する登録手段とを備え、 上記開始認識手段は、上記登録手段により登録された開
始キーワードの音声入力を認識することを特徴とする請
求項1記載の音声認識装置。4. A registration recognizing means for recognizing a voice input of a registered keyword for instructing registration of the start keyword, and starting the input voice after the voice recognition of the registered keyword is recognized by the registration recognizing means. 2. A speech recognition apparatus according to claim 1, further comprising registration means for registering as a keyword, wherein said start recognition means recognizes a speech input of the start keyword registered by said registration means.
り上記登録キーワードの音声入力が認識されてから所定
時間の間の入力音声を上記開始キーワードとして登録す
ることを特徴とする請求項4記載の音声認識装置。5. The registration unit according to claim 4, wherein the registration unit registers an input voice for a predetermined time after the registration recognition unit recognizes a voice input of the registration keyword as the start keyword. Voice recognition device.
ードの音声入力が認識されてから所定時間の間、又は上
記登録認識手段により上記登録キーワードの音声入力が
認識されてから上記登録手段により上記開始キーワード
の登録が終了するまでの間、音の出力を禁止する制御手
段を備えたことを特徴とする請求項4記載の音声認識装
置。6. A method according to claim 1, wherein said registration recognition means recognizes the voice input of said registered keyword for a predetermined period of time, or after said registration recognition means recognizes the voice input of said registered keyword, said registration means recognizes said start keyword. 5. The speech recognition apparatus according to claim 4, further comprising control means for prohibiting output of a sound until the registration of the speech is completed.
めの操作手段と、 上記操作手段により上記開始キーワードの登録が指示さ
れた後の入力音声を上記開始キーワードとして登録する
登録手段とを備え、 上記開始認識手段は、上記登録手段により登録された開
始キーワードの音声入力を認識することを特徴とする請
求項1記載の音声認識装置。7. An operating unit for instructing the registration of the start keyword, and a registering unit for registering an input voice after the instruction of the registration of the start keyword by the operating unit as the start keyword, 2. The speech recognition apparatus according to claim 1, wherein the start recognition unit recognizes a speech input of the start keyword registered by the registration unit.
記開始キーワードの登録が指示されてから所定時間の間
の入力音声を上記開始キーワードとして登録することを
特徴とする請求項7記載の音声認識装置。8. A speech recognition apparatus according to claim 7, wherein said registering means registers an input voice for a predetermined time from when the registration of said start keyword is instructed by said operation means as said start keyword. apparatus.
の登録が指示されてから所定時間の間、又は上記操作手
段により上記開始キーワードの登録が指示されてから上
記登録手段により上記開始キーワードの登録が終了する
までの間、音の出力を禁止する制御手段を備えることを
特徴とする請求項7記載の音声認識装置。9. The registration of the start keyword is completed by the registration means for a predetermined time after the registration of the start keyword is instructed by the operation means, or after the registration of the start keyword is instructed by the operation means. 8. The speech recognition apparatus according to claim 7, further comprising control means for prohibiting output of a sound until the sound is output.
うちの任意の機能を操作キーワードの音声入力によって
実行させることが可能な音声認識搭載装置であって、 請求項1〜9の何れかに記載の音声認識装置を有するこ
とを特徴とする音声認識搭載装置。10. A voice recognition-equipped device which has a plurality of functions and is capable of executing any of the plurality of functions by voice input of an operation keyword. A voice recognition mounting device comprising the voice recognition device according to any one of claims 1 to 3.
る音声認識搭載システムであって、 上記複数の機器のうち少なくとも1つの機器は、請求項
1〜9の何れかに記載の音声認識装置を有し、当該音声
認識装置によって他の機器の動作制御を行なうことを特
徴とする音声認識搭載システム。11. A speech recognition mounting system in which a plurality of devices are communicably connected, wherein at least one of the plurality of devices is the speech recognition device according to any one of claims 1 to 9. Wherein the voice recognition device controls the operation of another device.
識し、当該操作キーワードに基づいて対応する機能を実
行させるための音声認識方法であって、 上記操作キーワードの音声認識の開始を、開始キーワー
ドの音声入力を待って行なうことを特徴とする音声認識
方法。12. A voice recognition method for recognizing a voice of an input operation keyword and executing a corresponding function based on the operation keyword, wherein the start of the voice recognition of the operation keyword is determined based on the start keyword. A speech recognition method characterized by performing the process after waiting for a speech input.
識装置の機能をコンピュータに実施させるためのプログ
ラムを記憶したコンピュータが読み取り可能な記憶媒
体。13. A computer-readable storage medium storing a program for causing a computer to execute the functions of the speech recognition device according to claim 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11212451A JP2001042891A (en) | 1999-07-27 | 1999-07-27 | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11212451A JP2001042891A (en) | 1999-07-27 | 1999-07-27 | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001042891A true JP2001042891A (en) | 2001-02-16 |
Family
ID=16622848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11212451A Pending JP2001042891A (en) | 1999-07-27 | 1999-07-27 | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001042891A (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020048357A (en) * | 2002-05-29 | 2002-06-22 | 양덕준 | Method and apparatus for providing text-to-speech and auto speech recognition on audio player |
JP2002304192A (en) * | 2001-04-05 | 2002-10-18 | Denso Corp | Voice recognition device |
US8214219B2 (en) | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
JP2013142903A (en) * | 2012-01-09 | 2013-07-22 | Samsung Electronics Co Ltd | Video system and method for controlling the same |
JP2015052743A (en) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | Information processor, method of controlling information processor and program |
WO2015167008A1 (en) * | 2014-05-02 | 2015-11-05 | 株式会社ソニー・コンピュータエンタテインメント | Guidance device, guidance method, program, and information storage medium |
KR20160119274A (en) * | 2012-07-03 | 2016-10-12 | 구글 인코포레이티드 | Determining hotword suitability |
JPWO2015068699A1 (en) * | 2013-11-08 | 2017-03-09 | 株式会社ソニー・インタラクティブエンタテインメント | Entertainment device, display control method, program, and information storage medium |
JP2017515147A (en) * | 2014-04-17 | 2017-06-08 | クアルコム,インコーポレイテッド | Keyword model generation to detect user-defined keywords |
WO2019176252A1 (en) * | 2018-03-13 | 2019-09-19 | ソニー株式会社 | Information processing device, information processing system, information processing method, and program |
JP2021009190A (en) * | 2019-06-28 | 2021-01-28 | アイリスオーヤマ株式会社 | Remote operation device and video acoustic apparatus |
-
1999
- 1999-07-27 JP JP11212451A patent/JP2001042891A/en active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002304192A (en) * | 2001-04-05 | 2002-10-18 | Denso Corp | Voice recognition device |
JP4724943B2 (en) * | 2001-04-05 | 2011-07-13 | 株式会社デンソー | Voice recognition device |
KR20020048357A (en) * | 2002-05-29 | 2002-06-22 | 양덕준 | Method and apparatus for providing text-to-speech and auto speech recognition on audio player |
US8214219B2 (en) | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
US12033635B2 (en) | 2012-01-09 | 2024-07-09 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
JP2013142903A (en) * | 2012-01-09 | 2013-07-22 | Samsung Electronics Co Ltd | Video system and method for controlling the same |
CN110265030A (en) * | 2012-01-09 | 2019-09-20 | 三星电子株式会社 | Image display and the method for controlling image display |
US11763812B2 (en) | 2012-01-09 | 2023-09-19 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
US9786278B2 (en) | 2012-01-09 | 2017-10-10 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
US10957323B2 (en) | 2012-01-09 | 2021-03-23 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
KR20160119274A (en) * | 2012-07-03 | 2016-10-12 | 구글 인코포레이티드 | Determining hotword suitability |
KR102196400B1 (en) * | 2012-07-03 | 2020-12-29 | 구글 엘엘씨 | Determining hotword suitability |
JP2015052743A (en) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | Information processor, method of controlling information processor and program |
JPWO2015068699A1 (en) * | 2013-11-08 | 2017-03-09 | 株式会社ソニー・インタラクティブエンタテインメント | Entertainment device, display control method, program, and information storage medium |
US11090556B2 (en) | 2013-11-08 | 2021-08-17 | Sony Interactive Entertainment Inc. | Entertainment device, display control method, program, and information storage medium |
JP2017515147A (en) * | 2014-04-17 | 2017-06-08 | クアルコム,インコーポレイテッド | Keyword model generation to detect user-defined keywords |
WO2015167008A1 (en) * | 2014-05-02 | 2015-11-05 | 株式会社ソニー・コンピュータエンタテインメント | Guidance device, guidance method, program, and information storage medium |
KR101883414B1 (en) * | 2014-05-02 | 2018-07-31 | 주식회사 소니 인터랙티브 엔터테인먼트 | Guiding device, guiding method, program, and information storage medium |
US9870772B2 (en) | 2014-05-02 | 2018-01-16 | Sony Interactive Entertainment Inc. | Guiding device, guiding method, program, and information storage medium |
JPWO2015167008A1 (en) * | 2014-05-02 | 2017-04-20 | 株式会社ソニー・インタラクティブエンタテインメント | GUIDANCE DEVICE, GUIDANCE METHOD, PROGRAM, AND INFORMATION STORAGE MEDIUM |
KR20160138572A (en) * | 2014-05-02 | 2016-12-05 | 주식회사 소니 인터랙티브 엔터테인먼트 | Guiding device, guiding method, program, and information storage medium |
WO2019176252A1 (en) * | 2018-03-13 | 2019-09-19 | ソニー株式会社 | Information processing device, information processing system, information processing method, and program |
JP2021009190A (en) * | 2019-06-28 | 2021-01-28 | アイリスオーヤマ株式会社 | Remote operation device and video acoustic apparatus |
JP7223423B2 (en) | 2019-06-28 | 2023-02-16 | アイリスオーヤマ株式会社 | Remote control device and audiovisual equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7454351B2 (en) | Speech dialogue system for dialogue interruption and continuation control | |
US7881940B2 (en) | Control system | |
US6298324B1 (en) | Speech recognition system with changing grammars and grammar help command | |
US20050216271A1 (en) | Speech dialogue system for controlling an electronic device | |
US6243675B1 (en) | System and method capable of automatically switching information output format | |
WO2010070781A1 (en) | Navigation device | |
WO2007145003A1 (en) | In-vehicle information device | |
JP2001042891A (en) | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium | |
JP2003114698A (en) | Command acceptance device and program | |
JP4290828B2 (en) | Interface device | |
JP2000322078A (en) | On-vehicle voice recognition device | |
KR100835793B1 (en) | Apparatus and method for playing mp3 using bluetooth of audio system for vehicle | |
JPH11317063A (en) | Car audio system, its control method and recording medium recorded with car audio system controlling program | |
JP2019028160A (en) | Electronic device and information terminal system | |
JP2001154689A (en) | Voice recognition device | |
JP2000305596A (en) | Speech recognition device and navigator | |
JP2006227225A (en) | Contents providing device and method | |
KR100819991B1 (en) | Apparatus and method for generating a preference list and playing a preference list in a car audio system | |
JP2000172290A (en) | Av apparatus controller | |
JPH1165592A (en) | Voice input system | |
JP2000250592A (en) | Speech recognizing operation system | |
KR20060085381A (en) | Voice recognition apparatus and method of telematics system | |
CN117090668A (en) | Vehicle exhaust sound adjusting method and device and vehicle | |
CN113689850A (en) | Agent cooperation apparatus, method of operating the same, and storage medium | |
JP2021110886A (en) | Data processing system |