JPH11237895A - 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体 - Google Patents

音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体

Info

Publication number
JPH11237895A
JPH11237895A JP10041521A JP4152198A JPH11237895A JP H11237895 A JPH11237895 A JP H11237895A JP 10041521 A JP10041521 A JP 10041521A JP 4152198 A JP4152198 A JP 4152198A JP H11237895 A JPH11237895 A JP H11237895A
Authority
JP
Japan
Prior art keywords
state
control
phrase
control target
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10041521A
Other languages
English (en)
Inventor
Koichiro Fukunaga
功一郎 福永
Masami Maesaka
正巳 前坂
Makoto Kisanuki
誠 木佐貫
Mitsuaki Shibazaki
光陽 柴崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP10041521A priority Critical patent/JPH11237895A/ja
Publication of JPH11237895A publication Critical patent/JPH11237895A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 制御対象の現在の状態にとって無効な発話が
あった場合、その旨をユーザに知らせる。 【解決手段】 動作状態出力部211や221は状態に
関する情報を音声認識装置23に送る。オーディオ状態
解析部234が情報に基づいてテーブルTのうち情報に
対応するフラグをセットする。パターンマッチング部2
36が音声から語句を認識すると、オーディオ状態解析
部234は、認識された語句が現在の状態で有効か無効
かを判定する。無効と判定された場合、警告出力部23
5はユーザに警告する。ユーザは、語句が認識されなか
ったわけではなく適切でなかったことが理解でき、誤っ
た指示を繰り返すことなく正しい語句を発話することが
容易になり、ユーザインタフェースが改善される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識によって
各種制御対象の制御を行う技術の改良に関するもので、
より具体的には、制御対象の現在の状態にとって無効な
発話があった場合、その旨をユーザに知らせるようにし
たものである。
【0002】
【従来の技術】音声認識は、認識しようとする語句ごと
に、語句の波形や特徴を表すパラメータなどの認識用デ
ータを予めデータベースに記録しておき、発話された言
葉をこれら認識用データとパターンマッチングすること
によって、発話された語句を推定する技術である。
【0003】このような音声認識をオーディオシステム
など各種制御対象の制御に用いる場合、どの語句を発話
した場合にどのような内容の制御が行われるか、予め定
めておく。そして、語句の認識結果は、認識用データに
対応した語句IDなどの形で得られ、制御用のアプリケ
ーションプログラムがこの認識結果を受け取り、どの語
句が認識されたか、すなわちユーザの発話語句に応じて
予め決められている制御を制御対象に対して行う。
【0004】ここで、このような従来技術によってオー
ディオシステムを制御する場合の構成例を図7のブロッ
ク図に示す。このシステムは、複数のオーディオソース
ユニット10,11と音声認識装置12とを、通信回線
13を介して接続したもので、各オーディオソースユニ
ット10,11は、外部から通信回線13を介して送信
されてくる制御コマンドを受信して各種動作を行う。
【0005】また、音声認識装置12は、音声入力部1
21と、認識辞書122と、パターンマッチング部12
3と、コマンド出力部124とを有する。このうち認識
辞書122には、このシステム上で発生しうるいろいろ
な結線状況や動作状態などあらゆる条件を想定し、オー
ディオソースユニット10,11に送信するいろいろな
制御コマンドに対応する全ての語句について、認識用デ
ータ(認識単語情報)が格納されている。
【0006】そして、ユーザが発話した音声は、音声入
力部121によってデジタル波形に変換され、パターン
マッチング部123が、変換されたデジタル波形を、認
識辞書122に格納されている各語句の認識用データと
比較するパターンマッチングを行う。この結果、発話さ
れた音声に特徴が一致する語句を認識辞書122内の語
句から選択することによって認識結果とする。この認識
結果はコマンド出力部124に受け渡され、コマンド出
力部124は、認識結果に応じた制御用コマンドを通信
回線13を介して送信することによって、オーディオソ
ースユニット10や11を制御し、ユーザの発話内容に
応じた動作を実現する。
【0007】
【発明が解決しようとする課題】ところで、このような
システムでは、どのような種類や機能のユニットがどの
ような結線状況で接続されているかや、それぞれのユニ
ットは電源がオンかオフかなど、様々な状態をとりう
る。なお、本出願において「状態」とは、制御対象の電
源がオンかオフかといった狭義の動作状態だけでなく、
制御対象が制御装置やシステムに接続されているかどう
か、どのような種類か、どのような型式か、どのような
機能を持っているかなど、語句の有効無効に影響するあ
らゆる要素を広く意味する。
【0008】このような従来技術において、ユーザが、
システムに現在接続されていない種類のオーディオソー
スユニットに対応する語句を発話した場合や、ユニット
の現在の状態では制御を実行することが不可能又は無意
味な語句を発話した場合を考える。例えば、CD再生中
にラジオを制御する語句を発しても制御は不可能であ
り、また、電源が既にオンであるユニットに対して「電
源オン」という語句を発して制御を行っても無意味であ
る。
【0009】このような場合でも、使用されうる全ての
単語が認識辞書に登録されているため、発話された語句
は認識されて認識結果が得られるが、従来技術では、シ
ステムの状態を把握する手段が存在しなかったため、認
識された語句が、システムの現在の状態では無意味な制
御内容を表す場合でも、語句に対応した制御コマンドが
制御対象に対して無条件に出力されていた。
【0010】しかしながら、このように出力される制御
コマンドは、実際には接続されていないユニットに対し
てのものであったり、制御対象のその時点の状態では受
け付け不可能なものであったりする。このため、制御コ
マンドが出力されてもその制御コマンドを受けたユニッ
トの側では何も動作が起きず、ユーザにとっては発話に
対する反応がシステムから返ってこないことになる。
【0011】このため、発話したユーザは、認識動作を
行った結果がどうであったのかわからないため、ユーザ
インタフェースが悪くなるという問題があった。特に、
システムから反応がないと、ユーザ自身が誤った指示を
したことに気がつかない場合は語句が認識されなかった
ものと誤解して同じ無効な語句をいろいろな発音で無駄
に繰り返したり、期待した動作がなかなか開始されない
ためにシステムの故障かと誤解するといった不都合が生
じる。
【0012】本発明は、上記のような従来技術の問題点
を解決するために提案されたもので、その目的は、制御
対象の現在の状態にとって無効な発話があった場合、そ
の旨をユーザに知らせることによって、ユーザインタフ
ェースを改善することである。
【0013】
【課題を解決するための手段】上記の目的を達成するた
め、請求項1の発明は、入力される音声から語句を認識
して制御対象を制御する音声認識による制御装置におい
て、制御対象がどのような状態であるかを状態の項目ご
とに表すテーブルと、制御対象がどのような状態である
かに応じて前記テーブルを更新する手段と、入力される
音声から語句を認識する手段と、認識された語句が現在
の状態で有効か無効かを前記テーブルを参照することに
よって判定する手段と、認識された語句が無効と判定さ
れた場合にその旨を警告する手段と、有効と認識された
語句に応じて制御対象を制御する手段と、を備えたこと
を特徴とする。請求項6の発明は、請求項1の発明を方
法の観点から把握したもので、入力される音声から語句
を認識して制御対象を制御する音声認識による制御方法
において、制御対象がどのような状態であるかを状態の
項目ごとに表すテーブルを前記状態に応じて更新するス
テップと、入力される音声から語句を認識するステップ
と、認識された語句が現在の状態で有効か無効かを前記
テーブルを参照することによって判定するステップと、
認識された語句が無効と判定された場合にその旨を警告
するステップと、有効と認識された語句に応じて制御対
象を制御するステップと、を含むことを特徴とする。請
求項9の発明は、請求項1の発明をコンピュータプログ
ラムを記録した記録媒体の観点から把握したもので、コ
ンピュータを用いて、入力される音声から語句を認識し
て制御対象を制御する音声認識による制御用プログラム
を記録した記録媒体において、当該プログラムは、前記
コンピュータに、制御対象がどのような状態であるかを
状態の項目ごとに表すテーブルを前記状態に応じて更新
させ、入力される音声から語句を認識させ、認識された
語句が現在の状態で有効か無効かを前記テーブルを参照
することによって判定させ、認識された語句が無効と判
定された場合にその旨を警告させ、有効と認識された語
句に応じて制御対象を制御させることを特徴とする。
【0014】請求項2の発明は、制御装置に接続して前
記制御装置からの制御コマンドによって動作させるため
の制御対象ユニットにおいて、当該制御対象ユニットが
どのような状態であるかに関する情報を前記制御装置に
送る手段を備えたことを特徴とする。請求項3の発明
は、入力される音声から語句を認識して制御対象を制御
する音声認識による制御装置と、前記制御装置に接続さ
れ、前記制御装置から制御コマンドを受信することによ
って動作する1又は2以上の制御対象ユニットと、を含
む音声認識による制御を用いるシステムにおいて、前記
制御対象ユニットは、当該制御対象ユニットがどのよう
な状態であるかに関する情報を前記制御装置に送る手段
を備え、前記制御装置は、送られてくる前記情報を受け
取る手段と、制御対象ユニットがどのような状態である
かを状態の項目ごとに表すテーブルと、制御対象ユニッ
トがどのような状態であるかに応じて前記テーブルを更
新する手段と、入力される音声から語句を認識する手段
と、認識された語句が現在の状態で有効か無効かを前記
テーブルを参照することによって判定する手段と、認識
された語句が無効と判定された場合にその旨を警告する
手段と、有効と認識された語句に応じて制御対象ユニッ
トを制御する手段と、を備えたことを特徴とする。請求
項7の発明は、請求項3の発明を方法の観点から把握し
たもので、入力される音声から語句を認識して制御対象
を制御する音声認識による制御装置と、前記制御装置に
接続され、前記制御装置から制御コマンドを受信するこ
とによって動作する1又は2以上の制御対象ユニット
と、を用いた音声認識による制御方法において、前記制
御対象ユニットは、当該制御対象ユニットがどのような
状態であるかに関する情報を前記制御装置に送るステッ
プを実行し、前記制御装置は、送られてくる前記情報を
受け取るステップと、制御対象ユニットがどのような状
態であるかを状態の項目ごとに表すテーブルを前記状態
に応じて更新するステップと、入力される音声から語句
を認識するステップと、認識された語句が現在の状態で
有効か無効かを前記テーブルを参照することによって判
定するステップと、認識された語句が無効と判定された
場合にその旨を警告するステップと、有効と認識された
語句に応じて制御対象ユニットを制御するステップと、
を実行することを特徴とする。
【0015】請求項1,3,6,7,9の発明では、無
効な語句が認識された場合、制御装置は沈黙しているの
ではなく無効である旨を警告する。このため、ユーザ
は、語句が認識されなかったわけではなく適切でなかっ
たことが理解でき、誤った指示を繰り返すことなく正し
い語句を発話することが容易になり、ユーザインタフェ
ースが改善される。なお、制御対象の状態に関する情報
は、信号線などで自動検出することが望ましいがユーザ
がスイッチなどで入力してもよい。また、請求項2,
3,7の発明では、制御対象であるユニットの状態に関
する情報、すなわち接続されているかどうか、どのよう
な種類か、どのような機能を持っているか、電源がオン
かオフかといった情報が、制御対象から制御装置に送ら
れ、受け取られる。このため、ユーザがスイッチなどで
このような情報を入力する必要がなく、操作が容易にな
る。
【0016】請求項4の発明は、請求項3記載の音声認
識による制御を用いるシステムにおいて、前記テーブル
には、複数の制御対象ユニットのうちどれがシステムに
接続されているかが格納され、前記判定する手段は、発
話された語句に関する制御対象ユニットがシステムに接
続されていない場合は当該語句を無効と判定するように
構成されたことを特徴とする。請求項8の発明は、請求
項4の発明を方法の観点から把握したもので、請求項6
又は7記載の音声認識による制御方法において、前記テ
ーブルには、複数の制御対象ユニットのうちどれがシス
テムに接続されているかが格納され、前記判定するステ
ップは、発話された語句に関する制御対象ユニットがシ
ステムに接続されていない場合は当該語句を無効と判定
することを特徴とする。請求項4,8の発明では、カー
オーディオシステムのように、システムに接続できる制
御対象ユニットが何種類もある場合、システムに接続さ
れていないユニットに関する語句が発話された場合にそ
の旨が警告されるので、ユーザインタフェースが効果的
に改善される。
【0017】請求項5の発明は、請求項3又は4記載の
音声認識による制御装置において、どのような語句が認
識されたときに、前記テーブルのうちどの項目を参照
し、参照した項目がどのような状態のときに、どのよう
な内容の警告を行なうか、が設定された第2のテーブル
を備えたことを特徴とする。請求項5の発明では、語句
ごとに参照する項目をあらかじめ定め、どの項目がどの
ような状態かに応じて違った内容の警告を設定しておく
ことによって、適切な内容の警告を迅速に出力すること
が可能となる。
【0018】
【発明の実施の形態】次に、本発明の実施の形態につい
て、図面を参照して説明する。なお、本発明の各機能
は、コンピュータを、ソフトウェアで制御することによ
って実現することが一般的と考えられる。この場合、コ
ンピュータが備えるレジスタ、メモリ、外部記憶装置な
どの記憶装置が、いろいろな形式で、情報を一時的に保
持したり永続的に保存する。そして、CPUが、前記ソ
フトウェアにしたがって、これらの情報に加工及び判断
などの処理を加え、さらに、処理の順序を制御する。
【0019】また、コンピュータを制御するソフトウェ
アは、本出願の各請求項及び本明細書に記述する処理に
対応した命令を組み合わせることによって作成され、作
成されたソフトウェアは、コンパイルされた組み込みソ
フトウェアなどの形式で実行されることで、上記のよう
なハードウェア資源を活用する。
【0020】但し、本発明を実現するための上記のよう
な態様はいろいろ変更することができ、例えば、本発明
を実現するソフトウェアを記録したROMチップやCD
−ROMのような記録媒体は、それ単独でも本発明の一
態様である。また、本発明の機能の一部をLSIなどの
物理的な電子回路で実現することも可能である。
【0021】このため、以下では、本発明の各機能を実
現する仮想的回路ブロックを用いることによって、本発
明の実施の形態(以下「実施形態」という)を説明す
る。
【0022】なお、説明に用いるそれぞれの図につい
て、それ以前に説明した図と同一又は同種の部材に関し
ては説明を省略する。
【0023】〔1.構成〕本実施形態は、制御対象であ
る各ユニットから音声認識装置に、状態に関する情報を
送り、音声認識装置では、制御対象の現在の状態では無
効な語句を認識した場合はその旨を警告するものであ
る。
【0024】まず、図1は、本実施形態の構成を示す機
能ブロック図である。本実施形態は、音声認識を用いる
カーオーディオシステムで、この図に示すように、CD
プレーヤ、ラジオ受信機など制御対象である複数のオー
ディオソースユニット21,22と、音声認識による制
御装置である音声認識装置23とを、通信回線24を介
して接続したものである。このうちオーディオソースユ
ニット21,22は、通信回線24を介して外部からの
制御コマンドを受信し、制御コマンドに基づいて各種動
作を行うように構成されている。
【0025】このうち音声認識装置23は、入力される
音声から語句を認識して制御対象を制御する音声認識に
よる制御装置であり、音声入力部231と、認識辞書2
32と、オーディオ状態受信部233と、テーブルT
と、オーディオ状態解析部234と、警告出力部235
と、パターンマッチング部236と、コマンド出力部2
37と、を有する。
【0026】このうち音声入力部231は、マイクロホ
ン(マイク)などから入力される音声をデジタル波形に
変換する部分である。また、認識辞書232は、システ
ムで発生しうる結線状況や動作状態などあらゆる条件を
想定し、使用される可能性のあるすべての制御コマンド
に対応する語句について、波形や各種パラメータなどの
特徴を表した認識用データを格納したものである。ま
た、パターンマッチング部236は、入力された音声
を、認識辞書232に格納されている各認識用データと
パターンマッチングすることによって語句を認識する部
分である。これら音声入力部231、認識辞書232お
よびパターンマッチング部236は、入力される音声か
ら語句を認識する手段を構成している。
【0027】また、テーブルTは、制御対象がどのよう
な状態であるかを、状態の項目ごとに状態フラグで表す
テーブルである。ここで、制御対象とは、オーディオソ
ースユニット21,22だけでなく、音声認識装置23
自体や、音声認識装置23を包含するシステム全体を含
み、例えば、システム全体の電源がオンかオフかという
状態を表す項目も、テーブルTに含まれる。
【0028】ここで、テーブルTの例を図2に示す。こ
の例では、カセットテープデッキのユニットがシステム
に接続されているかどうかを示す項目「テープ」や、ラ
ジオチューナーのユニットがシステムに接続されている
かどうかを示す項目「ラジオ」などが、それぞれ、「接
続」又は「非接続」のいずれかの値をとる状態フラグに
よって表されている。同様に、システム全体の電源がオ
ンかオフかを表す項目「電源」は、「ON」又は「OF
F」のいずれかの値をとる状態フラグによって表されて
いる。
【0029】なお、システムで用いるバス(通信回線)
の仕様上、システムに接続できるユニットの種類や最大
数が決まっている場合、テーブルのサイズや、テーブル
にどのような項目を設けるかは、設計段階で予め決定し
ておく。
【0030】そして、オーディオソースユニット21
は、このオーディオソースユニット21の状態に関する
情報を外部の音声認識装置23に送信するための状態出
力部211を有する。すなわち、この動作状態出力部2
11は、オーディオソースユニット21の状態に関する
情報として、オーディオソースユニット21自体がシス
テムに存在するかどうかの情報や、オーディオソースユ
ニット21がどのような動作状態であるかという情報を
通信回線24を介して音声認識装置23に通知するよう
に構成されている。
【0031】なお、オーディオソースユニット22も、
同様の動作状態出力部221を有する。また、同様に、
システム上のいろいろな状態に関する情報を音声認識装
置23に知らせる手段は、電源ユニットなどシステムの
所望の部分に設けることができる。
【0032】また、オーディオ状態受信部233は、オ
ーディオソースユニット21,22の状態に関して動作
状態出力部211,221から送信される情報を受信し
てオーディオ状態解析部234に受け渡す部分である。
また、オーディオ状態解析部234は、制御対象がどの
ような状態であるかに応じて、テーブルTを更新する機
能を有するとともに、パターンマッチング部236で認
識された語句が現在の状態で有効か無効かをテーブルT
を参照することによって判定する機能を有する。また、
警告出力部235は、認識された語句が無効と判定され
た場合にその旨を、表示機器25やスピーカ26からユ
ーザに警告する手段である。
【0033】また、コマンド出力部237は、有効と認
識された語句に応じて制御対象を制御する手段であり、
具体的には、認識された語句の意味する制御内容に応じ
た制御コマンドを出力することによってオーディオソー
スユニット21,22を制御する手段である。
【0034】〔2.作用及び効果〕上記のような本実施
形態は、次のような作用を有する。 〔2−1.状態に関する情報の送受信〕上記のような本
実施形態では、オーディオソースユニット21の動作状
態出力部211が、オーディオソースユニット21の状
態に関する情報を、通信回線24を介して音声認識装置
23に通知し、同様に、オーディオソースユニット22
の動作状態出力部221は、オーディオソースユニット
22の状態に関する情報を音声認識装置23に通知す
る。
【0035】〔2−2.テーブルの更新〕ここで、音声
認識装置23の動作手順を図3のフローチャートに示
す。すなわち、音声認識装置23のオーディオ状態受信
部233は、上記のように動作状態出力部211や22
1から送られた情報を受け取ると(ステップ1,2)、
受信した情報をオーディオ状態解析部234に受け渡
す。情報を受け取ったオーディオ状態解析部234はこ
の情報に基づいてテーブルTのうち情報に対応するフラ
グをセットする(ステップ3)。
【0036】例えば、オーディオソースユニット21が
カセットテープデッキのユニットで、このオーディオソ
ースユニット21の動作状態出力部211が、オーディ
オソースユニット21がシステムに接続されている旨の
情報を音声認識装置23に送信すると、音声認識装置2
3のオーディオ状態解析部234が、図2に示したテー
ブルTの項目「テープ」の状態フラグを「接続」にセッ
トする。
【0037】また、このように音声認識装置23に送信
されテーブルTにセットされる情報には、個々のユニッ
トの状態を表す情報だけでなく、システム全体の状態を
表す情報も含まれる。例えば、ある制御対象ユニットが
システム全体の電源をオンオフする機能を持っている場
合、例えば電源がオンであるという情報はそのような制
御対象ユニットから送られてくる。この場合は、オーデ
ィオ状態解析部234は、テーブルTの項目「電源」の
状態フラグを「ON」にセットする。
【0038】さらに、このような電源の機能を音声認識
装置23自体が持っている場合は、オーディオ状態解析
部234自身が電源の状態を調べ、電源がオンかオフか
の情報をテーブルTにセットしてもよい。
【0039】〔2−3.語句の認識〕一方、ユーザがマ
イクロホン(マイク)などに向かって語句を発話する
と、音声入力部231が、入力される音声をデジタル波
形に変換する。そして、パターンマッチング部236
が、このデジタル波形を、認識辞書232に格納されて
いる各認識用データとパターンマッチングすることによ
って語句を認識する。
【0040】〔2−4.語句が有効か無効かの判定〕こ
のようにパターンマッチング部236が音声から語句を
認識すると(ステップ1,4)、認識結果はオーディオ
状態解析部234に渡され、オーディオ状態解析部23
4は、認識結果に対応する項目の状態フラグがどのよう
な値をとっているかをテーブルTから検索することによ
って、認識された語句が現在の状態で有効か無効かを判
定する(ステップ5)。
【0041】〔2−5.無効な場合の警告〕そして、オ
ーディオ状態解析部234は、検索された状態フラグの
値から、例えば、対応するユニットがシステムに接続さ
れていないことが判明した場合や、現在のシステムの状
態では語句に対応する内容の制御が不可能であることが
判明した場合は、認識された語句がシステムの現状では
無効と判定し、その旨を警告出力部235に送る(ステ
ップ6)。
【0042】このように、認識された語句が無効と判定
された場合、警告出力部235は、表示機器25に警告
文やシンボルマークの点滅などを出力したり、スピーカ
26から合成音声やビープ音(ブザー音)などを出力す
ることによって、発話された語句に対応する制御内容で
は、システムは動作できない旨の警告をユーザに対して
出力する(ステップ8)。
【0043】〔2−6.有効な場合の制御〕一方、オー
ディオ状態解析部234が、認識された語句を有効と判
定した場合は、コマンド出力部237が、認識された語
句の意味する制御内容に応じた制御コマンドを通信回線
24を介して出力することによってオーディオソースユ
ニット21や22を制御する(ステップ7)。このよう
に出力された制御コマンドを受信したオーディオソース
ユニット21や22は、制御コマンドに基づいて各種動
作を行うことによって、ユーザが発話した語句に対応し
た制御内容が実現される。
【0044】〔2−7.具体例〕次に、音声合成を用い
た警告内容の例を示す。第1の例は、システムに、ラジ
オチューナーとカセットテープデッキが接続されてい
て、CDプレーヤのユニットは接続されていない例であ
る。この場合、テーブルTでは、図4に示すように、C
Dプレーヤが接続されているかどうかを示す「CD」と
いう項目3の状態フラグは「非接続」を示している。こ
の状態で、システムの音源(ソース)をCDプレーヤに
切り替える語句、例えば「しーでぃー」といった語句が
認識されたとする。この場合、認識結果から、項目「C
D」の状態フラグの値が検索によって参照され、「非接
続」となっているので「CDプレーヤはシステムに存在
しません」といった合成音声による警告が出力される。
【0045】また、第2の例は、システム全体の電源が
オンになっている例で、この場合、テーブルTでは、図
5に示すように、電源がオンかオフかを示す「電源」と
いう項目Nの状態フラグは「ON」(オン)を示してい
る。この状態で、システムの電源をオンにする語句、例
えば「でんげんおん」といった語句が認識されたとす
る。この場合、認識結果から、項目「電源」の状態フラ
グの値が検索によって参照され、既に「オン」となって
いるので「現在既に電源はオン状態です」といった合成
音声による警告が出力される。
【0046】〔2−8.第2のテーブルの使用〕なお、
どのような語句が認識されたときに、前記テーブルのう
ちどの項目を参照し、参照した項目がどのような状態の
ときに、どのような内容の警告を行なうかは、オーディ
オ状態解析部234及び警告出力部235の動作を司る
プログラムなどに具体的に記述することもできるが、こ
れらの事項は第2のテーブルの形で用意しておくことが
望ましい。
【0047】ここで、図6は、前記テーブルTとは別の
第2のテーブルT2に、これらの事項を格納する例であ
る。すなわち、第2のテーブルT2は、認識される個々
の語句ごとに、検索項目と警告内容とのペアを1つ又は
複数備えている。このうち検索項目は、その語句が認識
されたときに、オーディオ状態解析部234がテーブル
Tのどの項目を検索するかということに加えて、その項
目が例えば「接続」にであることを確認するのか、「非
接続」であることを確認するのかを表す。また、警告内
容は、検索した項目の状態フラグが前記検索項目に記述
された状態に反する場合に、どのような警告を出力すれ
ばよいのか、例えば音声合成で発声すべき文字列などの
形で表したものである。
【0048】例えば、上記〔2−7.具体例〕に示した
第1の例の場合、図6の例では、「しーでぃー」という
語句が認識された場合、オーディオ状態解析部234
は、対応する検索項目に記述されているように、項目
「CD」が「接続」になっていることを検索して確認す
る。そして、図6のように「接続」になっていない場合
は警告内容として「CDプレーヤはシステムに存在しま
せん」という文章を合成音声によって発声することにな
る。
【0049】なお、図6では1つの語句に対して検索項
目と警告内容のペアが1つだけの具体例を示したが、1
つの語句に対してペアはいくつ有ってもよく、例えば
「テレビ」と発話された場合に、(1)テレビチューナ
ーがない場合はその旨を警告し、(2)車両が走行中の
場合は「走行中は利用できません」といった別の警告内
容を設定することもできる。
【0050】〔2−9.効果〕以上のように、第1実施
形態では、システムに接続されていないユニットを制御
するための語句や、現在のシステムの状態では実行でき
ない制御内容を表す語句など、無効な語句が認識された
場合、制御装置は沈黙しているのではなく、無効である
旨を警告するという適正な応答をすることになる。この
ため、ユーザは、語句が認識されなかったわけではなく
適切でなかったことが理解でき、誤った指示を繰り返す
ことなく正しい語句を発話することが容易になり、ユー
ザインタフェースが改善される。
【0051】また、本実施形態では、制御対象の状態に
関する情報、すなわち接続されているかどうか、どのよ
うな種類か、どのような機能を持っているか、電源がオ
ンかオフかといった情報が、制御対象である各オーディ
オソースユニットから、制御装置である音声認識装置に
送られ、受け取られる。このため、ユーザがスイッチな
どでこのような情報を入力する必要がなく、操作が容易
になる。
【0052】特に、本実施形態では、カーオーディオシ
ステムのように、システムに接続できる制御対象ユニッ
トが何種類もある場合、システムに接続されていないユ
ニットに関する語句が発話された場合にその旨が警告さ
れるので、ユーザインタフェースが効果的に改善され
る。
【0053】加えて、本実施形態では、前記のように第
2のテーブルを用い、語句ごとに参照する項目をあらか
じめ定め、どの項目がどのような状態かに応じて違った
内容の警告を設定しておくことによって、適切な内容の
警告を迅速に出力することが可能となる。
【0054】〔3.他の実施の形態〕なお、本発明は上
記実施形態に限定されるものではなく、次に例示するよ
うな他の実施の形態も含むものである。例えば、図1や
図6に示した構成は一例に過ぎず、本発明はカーオーデ
ィオシステム以外の他の種類のシステムを制御するのに
用いることもできる。例えば、周辺機器を持つ一般的な
コンピュータを制御するために用いれば、ユーザの発話
に対して例えば「MOはシステムに接続されていませ
ん」といった警告を出力することもできる。
【0055】また、カーオーディオシステムと組み合わ
せる場合も、例えば、CDプレーヤやラジオチューナー
ユニット(ラジオ受信機)など具体的なユニットの種類
は例示に過ぎず、他の種類の音源や他の機能を持つユニ
ットに自由に置き換えることができる。
【0056】
【発明の効果】以上のように、本発明によれば、制御対
象の現在の状態にとって無効な発話があった場合、その
旨がユーザに警告されるので、ユーザは指示が不適切で
あったことを認識でき、音声認識によるユーザインタフ
ェースが改善される。
【図面の簡単な説明】
【図1】本発明の実施形態の構成を示す機能ブロック
図。
【図2】本発明の実施形態におけるテーブルの例を示す
図。
【図3】本発明の実施形態における音声認識装置の動作
手順を示すフローチャート。
【図4】本発明の実施形態において、認識結果から、対
応する項目の状態フラグが参照される状態を示す図(第
1の例)。
【図5】本発明の実施形態において、認識結果から、対
応する項目の状態フラグが参照される状態を示す図(第
2の例)。
【図6】本発明の実施形態において、第2のテーブルを
用いる例を示す概念図。
【図7】従来技術をカーオーディオシステムに適用した
構成例を示す図。
【符号の説明】
21,22…オーディオソースユニット 211,221…動作状態出力部 23…音声認識装置 231…音声入力部 232…認識辞書 233…オーディオ状態受信部 234…オーディオ状態解析部 235…警告出力部 236…パターンマッチング部 237…コマンド出力部 24…通信回線 25…表示機器 26…スピーカ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 柴崎 光陽 東京都文京区白山5丁目35番2号 クラリ オン株式会社内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力される音声から語句を認識して制御
    対象を制御する音声認識による制御装置において、 制御対象がどのような状態であるかを状態の項目ごとに
    表すテーブルと、 制御対象がどのような状態であるかに応じて前記テーブ
    ルを更新する手段と、 入力される音声から語句を認識する手段と、 認識された語句が現在の状態で有効か無効かを前記テー
    ブルを参照することによって判定する手段と、 認識された語句が無効と判定された場合にその旨を警告
    する手段と、 有効と認識された語句に応じて制御対象を制御する手段
    と、 を備えたことを特徴とする音声認識による制御装置。
  2. 【請求項2】 制御装置に接続して前記制御装置からの
    制御コマンドによって動作させるための制御対象ユニッ
    トにおいて、 当該制御対象ユニットがどのような状態であるかに関す
    る情報を前記制御装置に送る手段を備えたことを特徴と
    する制御対象ユニット。
  3. 【請求項3】 入力される音声から語句を認識して制御
    対象を制御する音声認識による制御装置と、 前記制御装置に接続され、前記制御装置から制御コマン
    ドを受信することによって動作する1又は2以上の制御
    対象ユニットと、 を含む音声認識による制御を用いるシステムにおいて、 前記制御対象ユニットは、当該制御対象ユニットがどの
    ような状態であるかに関する情報を前記制御装置に送る
    手段を備え、 前記制御装置は、 送られてくる前記情報を受け取る手段と、 制御対象ユニットがどのような状態であるかを状態の項
    目ごとに表すテーブルと、 制御対象ユニットがどのような状態であるかに応じて前
    記テーブルを更新する手段と、 入力される音声から語句を認識する手段と、 認識された語句が現在の状態で有効か無効かを前記テー
    ブルを参照することによって判定する手段と、 認識された語句が無効と判定された場合にその旨を警告
    する手段と、 有効と認識された語句に応じて制御対象ユニットを制御
    する手段と、 を備えたことを特徴とする音声認識による制御を用いる
    システム。
  4. 【請求項4】 前記テーブルには、複数の制御対象ユニ
    ットのうちどれがシステムに接続されているかが格納さ
    れ、 前記判定する手段は、発話された語句に関する制御対象
    ユニットがシステムに接続されていない場合は当該語句
    を無効と判定するように構成されたことを特徴とする請
    求項3記載の音声認識による制御を用いるシステム。
  5. 【請求項5】 どのような語句が認識されたときに、 前記テーブルのうちどの項目を参照し、 参照した項目がどのような状態のときに、 どのような内容の警告を行なうか、 が設定された第2のテーブルを備えたことを特徴とする
    請求項3又は4記載の音声認識による制御を用いるシス
    テム。
  6. 【請求項6】 入力される音声から語句を認識して制御
    対象を制御する音声認識による制御方法において、 制御対象がどのような状態であるかを状態の項目ごとに
    表すテーブルを前記状態に応じて更新するステップと、 入力される音声から語句を認識するステップと、 認識された語句が現在の状態で有効か無効かを前記テー
    ブルを参照することによって判定するステップと、 認識された語句が無効と判定された場合にその旨を警告
    するステップと、 有効と認識された語句に応じて制御対象を制御するステ
    ップと、 を含むことを特徴とする音声認識による制御方法。
  7. 【請求項7】 入力される音声から語句を認識して制御
    対象を制御する音声認識による制御装置と、 前記制御装置に接続され、前記制御装置から制御コマン
    ドを受信することによって動作する1又は2以上の制御
    対象ユニットと、 を用いた音声認識による制御方法において、 前記制御対象ユニットは、当該制御対象ユニットがどの
    ような状態であるかに関する情報を前記制御装置に送る
    ステップを実行し、 前記制御装置は、 送られてくる前記情報を受け取るステップと、 制御対象ユニットがどのような状態であるかを状態の項
    目ごとに表すテーブルを前記状態に応じて更新するステ
    ップと、 入力される音声から語句を認識するステップと、 認識された語句が現在の状態で有効か無効かを前記テー
    ブルを参照することによって判定するステップと、 認識された語句が無効と判定された場合にその旨を警告
    するステップと、 有効と認識された語句に応じて制御対象ユニットを制御
    するステップと、 を実行することを特徴とする音声認識による制御方法。
  8. 【請求項8】 前記テーブルには、複数の制御対象ユニ
    ットのうちどれがシステムに接続されているかが格納さ
    れ、 前記判定するステップは、発話された語句に関する制御
    対象ユニットがシステムに接続されていない場合は当該
    語句を無効と判定することを特徴とする請求項6又は7
    記載の音声認識による制御方法。
  9. 【請求項9】 コンピュータを用いて、入力される音声
    から語句を認識して制御対象を制御する音声認識による
    制御用プログラムを記録した記録媒体において、 当該プログラムは、前記コンピュータに、 制御対象がどのような状態であるかを状態の項目ごとに
    表すテーブルを前記状態に応じて更新させ、 入力される音声から語句を認識させ、 認識された語句が現在の状態で有効か無効かを前記テー
    ブルを参照することによって判定させ、 認識された語句が無効と判定された場合にその旨を警告
    させ、 有効と認識された語句に応じて制御対象を制御させるこ
    とを特徴とする音声認識による制御用プログラムを記録
    した記録媒体。
JP10041521A 1998-02-24 1998-02-24 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体 Pending JPH11237895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10041521A JPH11237895A (ja) 1998-02-24 1998-02-24 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10041521A JPH11237895A (ja) 1998-02-24 1998-02-24 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11237895A true JPH11237895A (ja) 1999-08-31

Family

ID=12610697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10041521A Pending JPH11237895A (ja) 1998-02-24 1998-02-24 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11237895A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7469211B2 (en) 2002-06-28 2008-12-23 Denso Corporation Voice control system substituting the oppositely-working command in a pair if the recognized command is not selectable for the given system state
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7469211B2 (en) 2002-06-28 2008-12-23 Denso Corporation Voice control system substituting the oppositely-working command in a pair if the recognized command is not selectable for the given system state
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system

Similar Documents

Publication Publication Date Title
US8484033B2 (en) Speech recognizer control system, speech recognizer control method, and speech recognizer control program
EP1450349B1 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
US5983186A (en) Voice-activated interactive speech recognition device and method
US4426733A (en) Voice-controlled operator-interacting radio transceiver
JP2001083991A (ja) ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
JP2001083987A (ja) 記号挿入装置およびその方法
JPH10105192A (ja) 車両用音声案内装置
JP2003114698A (ja) コマンド受付装置及びプログラム
US6879953B1 (en) Speech recognition with request level determination
JPH11237895A (ja) 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体
JP2001042891A (ja) 音声認識装置、音声認識搭載装置、音声認識搭載システム、音声認識方法、及び記憶媒体
JP4201870B2 (ja) 音声認識による制御を用いるシステム及び音声認識による制御方法
JP2001092493A (ja) 音声認識修正方式
JPH11237892A (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
JP4450575B2 (ja) 車両用音声認識装置、車載ナビゲーション装置
JP2000305596A (ja) 音声認識装置及びナビゲーション装置
WO2002001550A1 (fr) Procede et systeme de commande d'un dispositif
JPH11242497A (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
JP2005157166A (ja) 音声認識装置、音声認識方法及びプログラム
JPH1028068A (ja) ラジオ装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
WO2005062294A1 (ja) 機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法
JP2000250592A (ja) 音声認識操作システム
JP2001142486A (ja) 音声認識装置
JP2000105681A (ja) 音声情報利用システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070814