JP2008268450A - 音声認識機能付き操作器 - Google Patents

音声認識機能付き操作器 Download PDF

Info

Publication number
JP2008268450A
JP2008268450A JP2007109809A JP2007109809A JP2008268450A JP 2008268450 A JP2008268450 A JP 2008268450A JP 2007109809 A JP2007109809 A JP 2007109809A JP 2007109809 A JP2007109809 A JP 2007109809A JP 2008268450 A JP2008268450 A JP 2008268450A
Authority
JP
Japan
Prior art keywords
unit
voice
learning
user
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007109809A
Other languages
English (en)
Other versions
JP4915665B2 (ja
Inventor
Kenji Nakakita
賢二 中北
Kiyotaka Takehara
清隆 竹原
Kenji Okuno
健治 奥野
Akira Baba
朗 馬場
Shinpei Hibiya
新平 日比谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2007109809A priority Critical patent/JP4915665B2/ja
Publication of JP2008268450A publication Critical patent/JP2008268450A/ja
Application granted granted Critical
Publication of JP4915665B2 publication Critical patent/JP4915665B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】認識可能語彙をユーザが記憶する負担を軽減した音声認識機能付き操作器を提供する。
【解決手段】操作器1は、照明器具20を操作するための手動操作部7と、ユーザの発話した音声が入力されるマイク5と、照明器具20を操作するための複数の操作語彙の音響モデルを記憶した音響モデル記憶部8と、マイク5に入力された音声と音響モデル記憶部8に記憶された音響モデルとを比較することによって音声認識を行う音声認識部9と、手動操作部7による操作入力または音声認識部9による認識結果の何れかに基づいて照明器具20を制御する制御部30とを備え、制御部30は、音声認識により操作可能な操作が手動操作部7により行われると、当該操作が音声認識により行えることを報知するための音声ガイダンスを音声生成部12により音声合成させてスピーカ6から出力させる。
【選択図】図1

Description

本発明は、音声認識機能付き操作器に関するものである。
従来、ユーザが発話した音声を認識し、認識結果をもとに負荷のオン、オフを制御する音声認識装置が提供されている。
また、このような負荷制御装置に用いられる音声対話装置として、ユーザーが音声を入力する音声入力手段と、音声認識手段にて用いる認識可能語彙の音響モデルを記憶する音声認識用辞書記憶手段と、入力音声を認識用辞書に予め記憶された認識可能語彙の音響モデルと比較することによって入力音声を認識する音声認識手段とを備えたものが従来提案されている(例えば特許文献1参照)。
特開平11−212594号公報
上述の音声対話装置では、入力音声を予め記憶された認識可能語彙の音響モデルと比較することで音声認識を行っているため、音声で負荷を操作したいユーザは、音声操作に使用できる認識可能語彙を記憶しておく必要がある。ここで、音声操作に使用される認識可能語彙が数個であれば、ユーザにとって認識可能語彙を記憶する負担はあまり大きくないが、オン/オフだけではなく細かい制御(例えば空調装置であれば温度や風量の設定など)を行おうとすると、制御に必要な認識可能語彙の数が増加し、ユーザにとって認識可能語彙を記憶する負担が増大するという問題があった。
認識可能語彙を記憶するユーザの負担を軽減するために、認識可能語彙を紙などの媒体に記載して、音声認識装置に並設しておくことも考えられるが、音声操作に使用できる認識可能語彙を探す手間が増えるため、手動でスイッチを操作する場合に比べてユーザの負担が増大するばかりか、音声操作による操作性の向上という目的につながっていないという問題もあった。
本発明は上記問題点に鑑みて為されたものであり、その目的とするところは、認識可能語彙をユーザが記憶する手間を軽減した音声認識機能付き操作器を提供することにある。
上記目的を達成するために、請求項1の発明は、被制御機器を操作するための手動操作部と、ユーザの発話した音声が入力される音声入力部と、被制御機器を操作するための複数の操作語彙の音響モデルを記憶した記憶部と、音声入力部に入力された音声と記憶部に記憶された音響モデルとを比較することによって音声認識を行う音声認識部と、音声ガイダンスを出力する音声出力部と、手動操作部による操作入力または音声認識部による認識結果の何れかに基づいて被制御機器を制御する制御部とを備え、制御部は、音声認識により操作可能な操作が手動操作部により行われると、当該操作が音声認識により行えることを報知するための音声ガイダンスを音声出力部から出力させることを特徴とする。ここにおいて、音声ガイダンスの内容としては、手動操作部による操作を音声認識により行える点のみを報知する内容でも良いし、手動操作部による操作を音声認識により実行する場合に用いる操作語彙でも良い。
請求項2の発明は、請求項1の発明において、制御部の動作モードを、手動操作部による操作入力に起因して音声出力部から音声ガイダンスを出力させる学習モードと、音声ガイダンスの出力を停止させる通常モードとに切り換えるモード切換部を設けたことを特徴とする。
請求項3の発明は、請求項2の発明において、ユーザによる操作語彙の学習状況の進捗度合いを推定する学習状況推定部を設け、モード切換部は、学習状況推定部の推定結果が所定レベル以下であれば動作モードを学習モードに切り替え、且つ、推定結果が所定レベルを超えると動作モードを通常モードに切り換えることを特徴とする。
請求項4の発明は、請求項3の発明において、学習状況推定部は、被制御機器に所望の動作を行わせる個々のタスク毎に学習状況の進捗度合いを推定し、モード切換部は、個々のタスク毎に、学習状況推定部の推定結果に基づいて動作モードの切り換えを行うことを特徴とする。
請求項5の発明は、請求項4の発明において、学習状況推定部は、個々のタスクを完了するまでの発話回数の平均値をもとに、個々のタスク毎に学習状況の進捗度合いを推定することを特徴とする。
請求項6の発明は、請求項4の発明において、学習状況推定部は、個々のタスク毎に、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数に対して音声操作の占める割合又は手動操作の占める割合の少なくとも何れか一方に基づいて学習状況の進捗度合いを推定することを特徴とする。
請求項7の発明は、請求項3の発明において、学習状況推定部は、被制御機器に所望の動作を行わせる全てのタスクについて、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数に対して音声操作の占める割合又は手動操作の占める割合の少なくとも何れか一方に基づいて学習状況の進捗度合いを推定し、モード切換部は、学習状況推定部の推定結果に基づいて動作モードの切り換えを行うことを特徴とする。
請求項8の発明は、請求項3乃至7の何れか1つの発明において、音声入力部に入力された音声からユーザを個別に識別するユーザ識別部を設け、学習状況推定部が、ユーザ識別部により識別された個々のユーザ毎に学習状況の進捗度合いを推定し、制御部は、個々のユーザ毎に学習状況推定部の推定結果に基づいて動作モードの切り換えを行うことを特徴とする。
請求項1の発明によれば、音声認識により操作可能な操作が手動操作部により行われると、制御部は、上記操作が音声認識により行えることを報知するための音声ガイダンスを音声出力部から出力させているので、音声認識による音声操作が可能なことを知らなかったユーザに対して、音声認識による音声操作が可能なことを知らしめることができ、マニュアルを読むなどして操作語彙を覚えるユーザの負担を軽減し、操作器を使いながら自然に新しい操作語彙を学習させることができるという効果がある。
請求項2の発明によれば、学習モードに切り替えた場合のみ、手動操作部による操作入力に起因して音声ガイダンスが出力されるので、音声ガイダンスの出力が不要な場合には通常モードに切り替えることで、音声ガイダンスの出力を停止させることができる。
請求項3の発明によれば、操作語彙の学習状況の進捗度合いが所定レベル以下の場合は学習モードに切り替えられ、手動操作部による操作入力に起因して音声ガイダンスが出力されるので、音声操作に未習熟の場合のみ音声ガイダンスを出力させて、学習効果を高めることができる。
請求項4の発明によれば、操作語彙の学習状況の進捗度合いが所定レベル以下のタスクのみ、音声ガイダンスが出力されるので、ユーザが習熟していない操作語彙であることを際立たせて、学習効果をより高めることができる。
請求項5の発明によれば、所望のタスクを行わせるまでの発話回数が多いほど、習熟度が低いと判断できるので、その場合には音声ガイダンスを出力することで、所望のタスクを行わせるための操作語彙をユーザに効率良く学習させることができる。
請求項6の発明によれば、音声操作の割合が低いほど、或いは、手動操作の割合が高いほど音声操作に慣れていないと判断できるので、その場合には音声ガイダンスを出力することで、所望のタスクを行わせるための操作語彙をユーザに効率良く学習させることができる。
請求項7の発明によれば、タスク毎に学習状況の進捗度合いを判断するのではなく、全タスクについて学習状況の進捗度合いを判断しているので、学習状況の進捗度合いの判定処理を簡略化できる。
請求項8の発明によれば、個々のユーザ毎に学習状況の進捗度合いを評価することで、音声ガイダンスの必要なユーザのみに音声ガイダンスを提供することができる。また音声ガイダンスの不要なユーザに対しては、音声ガイダンスの出力を停止することで、不要な音声ガイダンスを聞かされてユーザが不快に感じるのを防止できる。
以下に本発明の実施の形態を図面に基づいて説明する。
(実施形態1)
本発明の実施形態1を図1〜図3に基づいて説明する。本実施形態の操作器1は、被制御機器である宅内の設備機器(例えば照明器具、給湯器、防犯設備、防災設備、映像・音響設備など)を操作するために用いられる。操作器1は、図2に示すように例えば壁面に埋込配設される器体2を備えており、器体2の前面には動作表示用のLED3と、バックライトを備えた液晶ディスプレイ(LCD)4と、マイク(音声入力部)5と、スピーカ6と、各種の操作を行うための操作ボタン7a〜7dとを配置してある。
操作器1は、図1のブロック図に示すように、操作ボタン7a〜7dを有して被制御機器を操作するために用いられる手動操作部7と、被制御機器である照明器具20の点灯状態を制御する照明制御部19と、手動操作部7の操作に対応した動作を行わせるように照明制御部19を制御する手動制御部18を備えるとともに、LCD4の表示を制御する表示制御部14や、器体2の外部(宅内)に設けた防犯センサ21や防災センサ22の動作を制御するとともに各センサからの警報信号が入力されるセンサ制御部15や、外部の通信回線網23が接続される通信制御部16や、センサ制御部15を介して防犯センサ21や防災センサ22からの警報信号が入力されると通信制御部16を用いて予め設定された外部の通報先に警報を発する緊急通報部17を備えている。
また操作器1は、手動操作部7の操作に応じて被制御機器である照明器具20を制御する機能に加えて、音声により入力された操作命令に応じて照明器具20を制御する機能を備えている。すなわち被制御機器に所望の動作を行わせる操作(タスク)を、対応する操作語彙を発話することで行う音声操作と、手動操作部7を直接操作することで行う手動操作の両方で行えるようになっている。
而して操作器1は音声認識処理を行うために、ユーザの発話した音声を電気信号に変換するマイク5と、マイク5により入力された電気信号(音声信号)を増幅するアンプ(図示せず)と、操作に対する応答音や警報音や音声ガイダンスを出力するためのスピーカ6と、スピーカ6から出力される音がマイク5へ回り込み入力されてエコーやハウリングが発生するのを防止するエコーキャンセラ11とを備えるとともに、被制御機器を操作するための複数の操作語彙について多数の話者が発した操作語彙の特徴量を例えばHMM(隠れマルコフモデル)を用いてモデル化した音響モデルを記憶した音響モデル記憶部8と、マイク5から入力されアンプにより増幅された音声信号と記憶部8に記憶された音響モデルとを比較し、入力された音声信号と類似度の高い音響モデルに対応する音(操作語彙)を認識結果として出力する音声認識部9と、操作語彙を蓄積したデータベースや手動操作部7による操作と操作語彙との対応付けを行うデータベースなどが構築されたデータベース10と、人の音声を合成する音声生成部12と、音声の認識結果に基づいて表示制御部14や照明制御部19を制御するとともに、手動操作部18による手動操作に基づいて音声生成部12に対して合成する音声を出力する対話制御部13と、音声生成部12で合成された音声や警告音や報知音を出力するスピーカ6とを備えている。ここに、対話制御部13、音声生成部12、スピーカ6などから音声ガイダンスを出力する音声出力部が構成される。なお対話制御部13、手動制御部18、表示制御部14などはマイクロコンピュータよりなる制御部30の演算機能により実現される。
この操作器1の動作を図3のフローチャートに基づいて説明する。ステップS1で操作器1が動作を開始すると、制御部30は操作入力があるか否かを判別し(ステップS2)、操作入力があると操作入力の入力方法が音声操作によるものか手動操作によるものかを判別する(ステップS3)。ここで、操作入力が音声操作によるものであれば、音声認識部9がマイク5からユーザの発話した音声を取り込み(ステップS4)、入力された音声と音響モデル記憶部8に記憶された音響モデルとを比較することで音声認識を行い、認識結果を対話制御部13に出力する(ステップS5)。対話制御部13は、音声認識部9から入力された認識結果が音声か否かを判別し(ステップS6)、音声でなければステップS2に戻り、音声の場合は対話処理部13がデータベース10内に構築された語彙操作対応付けデータベースを参照する(ステップS7)。語彙操作対応付けデータベースには表1に示すような認識語彙−操作対応テーブルが登録されており、個々の被制御機器に対して、設置位置を示す宅内ID、機器IDと、被制御機器を操作するための操作語彙と、操作語彙による操作内容とを示すデータが対応付けて記憶されている。対話制御部13では、認識語彙操作テーブルを参照し(ステップS8)、認識結果が語彙操作対応付けデータベースに登録された操作語彙であれば、照明制御部19により操作語彙に対応する処理を行わせた後(ステップS9)、タスクを終了して(ステップS10)、ステップS2に戻る。一方、ステップS8において、音声認識部9から入力された操作語彙が語彙操作対応付けデータベースに登録された操作語彙でなければ、対話制御部13は照明器具20の制御は行わずにステップS2に移行する。また、ステップS2において操作器1の停止操作が行われると、操作器1による操作が停止される(ステップS17)。
Figure 2008268450
一方、ステップS3において操作入力の入力方法が手動操作によるものであれば、手動制御部18が手動操作部7の操作内容に応じて照明制御部19を制御し、所望の動作を行わせた後(ステップS11)、対話制御部13が、手動制御部18による制御動作をもとにデータベース10内に構築された操作語彙対応付けデータベースを参照し(ステップS12)、手動操作部7の操作に対応した操作語彙があるか否かを判別する(ステップS13)。操作語彙対応付けデータベースには表2に示すような操作−認識語彙対応テーブルが登録されており、個々のタスクに対して、手動操作部7による操作に割り当てた操作IDと、操作語彙とが対応付けて記憶されている。
Figure 2008268450
ここで、操作−認識語彙対応テーブルに手動操作部7の操作に対応した操作語彙がなければ、対話制御部13はタスクを終了して(ステップS10)、ステップS2に戻る。一方、操作−認識語彙対応テーブルに操作に対応した操作語彙があれば、学習状況推定部としての制御部30が、この操作語彙についてのユーザの学習状況を判定する処理を行い(ステップS14)、判定結果に応じて制御部30の演算機能により実現されたモード切替部が、制御部30の動作モードを学習モード又は通常モードの何れかに切り替える(ステップS15)。すなわち未習熟であれば動作モードを、手動操作部7による操作入力に起因して音声ガイダンスを出力させる学習モードに切り換え、習熟済であれば、動作モードを音声ガイダンスの出力を停止させる通常モードに切り換える。
例えば制御部30では、この操作語彙に対応するタスクについて、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数に対して音声操作の占める割合から学習状況の進捗度を判定している。すなわち制御部30は、音声操作の占める割合が所定の閾値以下であればこの操作語彙にユーザが習熟していないと判断し、手動操作部による操作に対応した操作語彙をユーザに知らせる音声ガイダンスを音声生成部12により合成させて、スピーカ6から出力させた後(ステップS16)、タスクを終了して(ステップS10)、ステップS2に戻る。一方、音声操作の割合が所定の閾値よりも高ければ、制御部30はこの操作語彙にユーザが習熟済みであると判断し、タスクを終了して(ステップS10)、ステップS2に戻る。
このように音声認識により行える操作が手動操作部7によって行われると、制御部30は、上記操作が音声認識により行えることを報知するための音声ガイダンスを音声生成部12により音声合成し、スピーカ6から出力させているので、音声認識による操作が可能なことを知らなかったユーザに対して、音声認識による操作が可能なことを知らしめることができ、マニュアルを読むなどして操作語彙を覚えるユーザの負担を軽減し、操作器を使いながら自然に新しい操作語彙を学習させることができる。また手動操作部7を用いて操作を行うと、手動操作部7による操作に対応した操作語彙を音声ガイダンスによって知ることができるので、マニュアルを読むことなく操作語彙を覚えることができ、ユーザが操作語彙を学習する負担を軽減することができる。
また本実施形態では、ある操作語彙に対応するタスクについて、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数に対して音声操作の占める割合が所定の閾値を超えると、その操作語彙に習熟済であると判断して音声ガイダンスを出力せず、所定の閾値以下の場合のみ音声ガイダンスを出力するようにしているので、ユーザが習熟していない操作語彙であることを際立たせることができ、学習効果をより高めることができる。ここにおいて、音声生成部12とスピーカ6とで、音声ガイダンスを出力する音声出力部が構成される。
なお制御部30では、全操作回数に対して音声操作の占める割合から学習状況の進捗合いを判定しているが、全操作回数に対して手動操作の占める割合から学習状況の進捗度合いを判定するようにしても良く、例えば全操作回数に対して手動操作の占める割合が所定の閾値よりも高ければ、対応する操作語彙に未習熟であると判断して、動作モードを学習モードに切り替えるとともに、手動操作の占める割合が閾値以下であれば、対応する操作語彙に習熟済みであると判断して、動作モードを通常モードに切り替える。この場合も、操作語彙に未習熟の場合のみ音声ガイダンスを出力させることで、ユーザが習熟していない操作語彙であることを際立たせることができ、学習効果をより高めることができる。
(実施形態2)
上述の実施形態1では、学習状況推定部たる制御部30が、操作語彙の学習状況の進捗度合いを判定する際に、ある操作語彙に対応するタスクについて、全操作回数に対して音声操作の占める割合又は手動操作の占める割合の何れかに基づいて学習状況の進捗度合いを判定しているが、タスクを完了するまでの発話回数の平均値をもとに操作語彙の学習状況の進捗度合いを判定するようにしても良い。尚、操作器1の構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
例えば操作器1で制御される被制御機器がテレビの場合、テレビのスイッチをオンにして、チャンネルをnチャンネルに合わせるというタスクを行う際に、「テレビ オン」という操作語彙でテレビをオンした後に、「テレビ nチャンネル」という操作語彙でチャンネルをnチャンネルに切り替える方法と、「テレビ nチャンネル」という操作語彙により、いっぺんにテレビをオンしてチャンネルをnチャンネルに切り替える方法とがある。また被制御機器が段調光機能を有する照明器具の場合、照明器具を調光点灯させるというタスクを行う際に、「ライトエー オン」という操作語彙で消灯状態の照明器具(ライトA)を点灯させた後に、「ライトエー チョウコウ」という操作語彙で照明器具(ライトA)を調光する方法と、「ライトエー チョウコウ」という操作語彙で、いっぺんに照明器具(ライトA)を調光点灯させる方法とがある。
このように同じタスクを複数通りの操作語彙で実現できる場合には、より少ない操作語彙でタスクを実行する方が、操作語彙に習熟していると考えられるので、学習状況推定部たる制御部30が、個々のタスクを完了するまでの発話回数を積算して、タスクを1回実行する際の平均発話回数を求めており、個々のタスクを完了するまでの発話回数の平均値(平均発話回数)をもとに、個々のタスク毎に学習状況の進捗度合いを推定しており、発話回数の平均値が個々のタスク毎に予め設定された閾値以上であれば、対応する操作語彙に未習熟であると判断して、動作モードを学習モードに切り替えるとともに、発話回数の平均値が上記の閾値未満であれば、対応する操作語彙に習熟済であると判断して、動作モードを通常モードに切り替えている。
そして、動作モードが学習モードに切り替えられた場合には、音声認識により行える操作が手動操作部7によって行われると、制御部30は、上記操作が音声認識により行えることを報知するための音声ガイダンスを音声生成部12により音声合成し、スピーカ6から出力させているので、音声認識による操作が可能なことを知らなかったユーザに対して、音声認識による操作が可能なことを知らしめることができる。一方、動作モードが通常モードに切り替えられた場合には、制御部30は、手動操作部7による手動操作が行われたとしても、上述の音声ガイダンスを出力することはなく、操作語彙に習熟しているユーザに対しては、音声ガイダンスの出力を停止することで、不要な音声ガイダンスを聞かされてユーザが不快に感じるのを防止できる。
(実施形態3)
上述の実施形態1では、学習状況推定部たる制御部30が、被制御機器に所望の動作を行わせる個々のタスク毎に対応する操作語彙の学習状況を判定しているのに対して、本実施形態では、被制御機器に所望の動作を行わせる全てのタスクについて操作語彙の学習状況を判定するようにしている。尚、操作器1の構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
すなわち、学習状況推定部たる制御部30では、操作器1により制御される被制御機器に所望の動作を行わせる全てのタスクについて、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数を積算するとともに、全操作回数に対する音声操作の割合、或いは、手動操作の割合を求めており、音声操作の割合又は手動操作の割合の何れかに基づいて操作語彙の学習状況を判定している。
つまり、制御部30は、全操作回数に対する音声操作の割合が所定の閾値以下、或いは、手動操作の割合が所定の閾値よりも高ければ、音声操作に未習熟であると判断して、動作モードを学習モードに切り替えるとともに、全操作回数に対する音声操作の割合が所定の閾値よりも高ければ、或いは、手動操作の割合が所定の閾値以下であれば、音声操作に習熟済であると判断して、動作モードを通常モードに切り替えている。
そして、動作モードが学習モードに切り替えられた場合には、音声認識により行える操作が手動操作部7によって行われると、制御部30は、上記操作が音声認識により行えることを報知するための音声ガイダンスを音声生成部12により音声合成し、スピーカ6から出力させているので、音声認識による操作が可能なことを知らなかったユーザに対して、音声認識による操作が可能なことを知らしめることができる。一方、動作モードが通常モードに切り替えられた場合には、制御部30は、手動操作部7による手動操作が行われたとしても、上述の音声ガイダンスを出力することはなく、操作語彙に習熟しているユーザに対しては、音声ガイダンスの出力を停止することで、不要な音声ガイダンスを聞かされてユーザが不快に感じるのを防止できる。
(実施形態4)
上述の実施形態では学習状況の進捗度合いを推定する際にユーザの識別を行っていないが、ユーザの識別を行って、個々のユーザ毎に学習状況の進捗度合いを判定するとともに、音声操作により行える操作が手動操作部により行われた際に、操作を行ったユーザの学習状況に応じて音声ガイダンスを出力するか否かを切り換えるようにしても良い。尚、音声認識機能付き操作器1の基本的な構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
本実施形態の操作器1では、操作部を操作する人物を撮影するカメラ(図示せず)を供え、操作器1を操作する全てのユーザの顔画像をデータベース10に予め登録するとともに、全てのユーザの音響モデルを音響モデル記憶部8に記憶させており、音声操作による操作が行われた場合には、入力音声と音響モデル記憶部8に記憶された各ユーザの音響モデルとを比較することで、音声操作を行ったユーザを特定し、このユーザが音声操作を行った回数を計数する。また手動操作部7による操作が行わせれた場合には、手動操作部7を操作した人物のカメラ画像と、データベース10に登録された顔画像とを比較することによって、手動操作を行ったユーザを特定し、このユーザが手動操作を行った回数を計数する。
次に、この操作器1の動作を図4のフローチャートに基づいて説明する。尚、図4のフローチャートに示す動作は、図3のフローチャートと略同様であるので、共通する部分の動作については、その説明は省略する。
操作入力方法が音声操作の場合、ステップS4で音声認識部9がマイク5からユーザの発話した音声を取り込み、入力された音声と音響モデル記憶部8に記憶された音響モデルとを比較することで音声認識を行って、認識結果を対話制御部13に出力する(ステップS5)。対話制御部13は、音声認識部9から入力された認識結果が音声か否かを判別し(ステップS6)、音声でなければステップS2に戻り、音声の場合は対話処理部13がデータベース10内に構築された語彙操作対応付けデータベースを参照する(ステップS7)。語彙操作対応付けデータベースには上記の表1に示すような認識語彙−操作対応テーブルが登録されており、個々の被制御機器に対して、設置位置を示す宅内ID、機器IDと、被制御機器を操作するための操作語彙と、操作語彙による操作内容とを示すデータが対応付けて記憶されている。この時、制御部30が、入力された音声と各ユーザの音響モデルとを比較することで、音声操作を行ったユーザを識別し、このユーザの音声操作回数を計数する(ステップS18)。その後、対話制御部13では、認識語彙操作テーブルを参照し(ステップS8)、認識結果が語彙操作対応付けデータベースに登録された操作語彙であれば、照明制御部19により操作語彙に対応する処理を行わせた後(ステップS9)、タスクを終了して(ステップS10)、ステップS2に戻る。
一方、操作入力方法が手動操作の場合、手動制御部18が手動操作部7の操作内容に応じて照明制御部19を制御し、所望の動作を行わせた後(ステップS11)、制御部30がカメラにより撮像された操作者の顔画像とデータベース10に登録された各ユーザの顔画像とを比較することによって、手動操作を行ったユーザを識別し、このユーザの手動操作回数を計数する(ステップS19)。その後、対話制御部13が、手動制御部18による制御動作をもとにデータベース10内に構築された操作語彙対応付けデータベースを参照し(ステップS12)、手動操作部7の操作に対応した操作語彙があるか否かを判別する(ステップS13)。操作語彙対応付けデータベースには上記の表2に示すような操作−認識語彙対応テーブルが登録されており、個々のタスクに対して、手動操作部7による操作に割り当てた操作IDと、操作語彙とが対応付けて記憶されている。ここで、操作−認識語彙対応テーブルに操作に対応した操作語彙があれば、学習状況推定部としての制御部30が、手動操作を行ったユーザについて対応する操作語彙の学習状況を判定する処理を行う(ステップS20)。すなわち制御部30では、ステップS18,S19の識別結果をもとに、この操作語彙について音声操作と手動操作とを含めた全操作回数を積算するとともに、全操作回数に対する音声操作の割合、或いは、手動操作の割合を求め、全操作回数に対する音声操作又は手動操作の割合に基づいて動作モードを学習モード又は通常モードの何れかに切り替えている(ステップS15)。ここにおいて、制御部30では、全操作回数に対する音声操作の割合が所定の閾値以下、或いは、手動操作の割合が所定の閾値よりも高ければ、音声操作に未習熟であると判断して、動作モードを学習モードに切り替えるとともに、全操作回数に対する音声操作の割合が所定の閾値よりも高ければ、或いは、手動操作の割合が所定の閾値以下であれば、音声操作に習熟済であると判断して、動作モードを通常モードに切り替えている。そして、動作モードが学習モードに切り替えられた場合は、制御部30が、手動操作部による操作に対応した操作語彙をユーザに知らせる音声ガイダンスを音声生成部12により合成させて、スピーカ6から出力させた後(ステップS16)、タスクを終了して(ステップS10)、ステップS2に戻る。一方、動作モードが通常モードに切り替えられた場合、制御部30は、この操作語彙にユーザが習熟済みであると判断し、タスクを終了して(ステップS10)、ステップS2に戻る。
このように本実施形態では、制御部30が、音声操作あるいは手動操作を行ったユーザを識別し、個々のユーザについてタスク毎に操作語彙の学習状況の進捗度合い(習熟度)を判定しているので、個々のユーザ毎にその習熟度に応じて動作モードを学習モード又は通常モードの何れかに切り換えることができる。複数のユーザが操作器1を使用する場合は、個々のユーザ毎に操作語彙の習熟度にバラツキが生じるが、発話したユーザを個別に識別することで、ユーザ毎に音声操作の習熟度を判定することができ、音声操作に未習熟のユーザに対してのみ音声ガイダンスを提供することで、その学習効果を高めることができる。また音声操作に習熟済のユーザに対しては音声ガイダンスの出力を停止することで、不要な音声ガイダンスを出力することによってユーザが不快感を感じるのを防ぐことができる。ここにおいて、個々のユーザ毎の音響モデルを登録した音響モデル記憶部8と音声認識部9、並びに、ユーザの顔画像を記憶したデータベースとカメラと顔認証を行う制御部30などから、ユーザを個別に識別するユーザ識別部が構成される。
なお、本実施形態では制御部30が、個々のユーザ毎に全操作回数に対する音声操作の割合又は手動操作の割合の何れかより学習状況の進捗度合いを判定しているが、実施形態2で説明したように、個々のタスクを完了するまでの発話回数の平均値から、個々のタスク毎の学習状況を推定するようにしても良く、この場合には個々のユーザ毎の音響モデルを登録した音響モデル記憶部8と音声認識部9とでユーザ識別部が構成される。
(実施形態5)
上述の各実施形態では、制御部30が、全操作回数に対する音声操作の占める割合又は手動操作の占める割合の何れかに基づいて、ユーザによる操作語彙の学習状況の進捗状況を判定し、その判定結果に基づいて動作モードを学習モード又は通常モードの何れかに自動的に切り替えるようになっているが、ユーザ自身が制御部30の動作モードを学習モード又通常モードの何れかに直接切り替えるようにしても良い。尚、操作器1の構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
本実施形態では手動操作部7に、制御部30の動作モードを学習モード又は通常モードの何れかに選択的に切り替える切替スイッチ(図示せず)を設けてあり、ユーザによる切替スイッチの切替操作に応じて、制御部30の動作モードが学習モード又は通常モードの何れかに切り替えられるので、ユーザ自身の意志で動作モードを設定することができる。
ここで、切替スイッチにより動作モードを学習モードに切り替えた場合、音声認識により行える操作が手動操作部7によって行われると、制御部30は、上記操作が音声認識により行えることを報知するための音声ガイダンスを音声生成部12により音声合成し、スピーカ6から出力させており、音声認識による操作が可能なことを知らなかったユーザに対して、音声認識による操作が可能なことを知らしめることができ、マニュアルを読むなどして操作語彙を覚えるユーザの負担を軽減し、操作器を使いながら自然に新しい操作語彙を学習させることができる。
一方、切替スイッチにより動作モードを通常モードに切り替えた場合、制御部30は、手動操作部7による手動操作が行われたとしても、上述の音声ガイダンスを出力することはなく、音声ガイダンスの不要なユーザに対しては、音声ガイダンスの出力を停止することで、不要な音声ガイダンスを聞かされてユーザが不快に感じるのを防止できる。
実施形態1の音声認識機能付き操作器のブロック図である。 同上の正面図である。 同上の動作を説明するフローチャートである。 実施形態4の動作を説明するフローチャートである。
符号の説明
1 音声認識機能付き操作器
5 マイク(音声入力部)
6 スピーカ(音声出力部)
7 手動操作部
8 音響モデル記憶部(記憶部)
9 音声認識部
20 照明器具(被制御機器)
30 制御部

Claims (8)

  1. 被制御機器を操作するための手動操作部と、ユーザの発話した音声が入力される音声入力部と、被制御機器を操作するための複数の操作語彙の音響モデルを記憶した記憶部と、音声入力部に入力された音声と記憶部に記憶された音響モデルとを比較することによって音声認識を行う音声認識部と、音声ガイダンスを出力する音声出力部と、手動操作部による操作入力または音声認識部による認識結果の何れかに基づいて被制御機器を制御する制御部とを備え、制御部は、音声認識により操作可能な操作が手動操作部により行われると、当該操作が音声認識により行えることを報知するための音声ガイダンスを音声出力部から出力させることを特徴とする音声認識機能付き操作器。
  2. 制御部の動作モードを、手動操作部による操作入力に起因して音声出力部から音声ガイダンスを出力させる学習モード、又は、音声ガイダンスの出力を停止させる通常モードの何れかに切り換えるモード切換部を設けたことを特徴とする請求項1記載の音声認識機能付き操作器。
  3. ユーザによる操作語彙の学習状況の進捗度合いを推定する学習状況推定部を設け、モード切換部制御部は、学習状況推定部の推定結果が所定レベル以下であれば動作モードを学習モードに切り替え、且つ、推定結果が所定レベルを超えると動作モードを通常モードに切り換えることを特徴とする請求項2記載の音声認識機能付き操作器。
  4. 学習状況推定部は、被制御機器に所望の動作を行わせる個々のタスク毎に学習状況の進捗度合いを推定し、モード切換部は、個々のタスク毎に、学習状況推定部の推定結果に基づいて動作モードの切り換えを行うことを特徴とする請求項3記載の音声認識機能付き操作器。
  5. 学習状況推定部は、個々のタスクを完了するまでの発話回数の平均値をもとに、個々のタスク毎に学習状況の進捗度合いを推定することを特徴とする請求項4記載の音声認識機能付き操作器。
  6. 学習状況推定部は、個々のタスク毎に、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数に対して音声操作の占める割合又は手動操作の占める割合の少なくとも何れか一方に基づいて学習状況の進捗度合いを推定することを特徴とする請求項4記載の音声認識機能付き操作器。
  7. 学習状況推定部は、被制御機器に所望の動作を行わせる全てのタスクについて、音声認識による音声操作と手動操作部による手動操作とを含めた全操作回数に対して音声操作の占める割合又は手動操作の占める割合の少なくとも何れか一方に基づいて学習状況の進捗度合いを推定し、モード切換部は、学習状況推定部の推定結果に基づいて動作モードの切り換えを行うことを特徴とする請求項3記載の音声認識機能付き操作器。
  8. 音声入力部に入力された音声からユーザを個別に識別するユーザ識別部を設け、学習状況推定部が、ユーザ識別部により識別された個々のユーザ毎に学習状況の進捗度合いを推定し、制御部は、個々のユーザ毎に学習状況推定部の推定結果に基づいて動作モードの切り換えを行うことを特徴とする請求項3乃至7の何れか1項に記載の音声認識機能付き操作器。
JP2007109809A 2007-04-18 2007-04-18 音声認識機能付き操作器 Expired - Fee Related JP4915665B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007109809A JP4915665B2 (ja) 2007-04-18 2007-04-18 音声認識機能付き操作器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007109809A JP4915665B2 (ja) 2007-04-18 2007-04-18 音声認識機能付き操作器

Publications (2)

Publication Number Publication Date
JP2008268450A true JP2008268450A (ja) 2008-11-06
JP4915665B2 JP4915665B2 (ja) 2012-04-11

Family

ID=40048060

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007109809A Expired - Fee Related JP4915665B2 (ja) 2007-04-18 2007-04-18 音声認識機能付き操作器

Country Status (1)

Country Link
JP (1) JP4915665B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020107550A (ja) * 2018-12-28 2020-07-09 パナソニックIpマネジメント株式会社 コントローラ、照明システム、照明制御方法及びプログラム
KR20210110362A (ko) * 2019-01-16 2021-09-07 닛폰세이테츠 가부시키가이샤 방향성 전자 강판의 제조 방법
US11330320B2 (en) 2016-08-31 2022-05-10 Samsung Electronics Co., Ltd. Display device and method for controlling display device

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11212594A (ja) * 1998-01-22 1999-08-06 Nec Corp 音声対話装置
JP2001331196A (ja) * 2000-05-22 2001-11-30 Nec Corp 音声応答装置
JP2002062893A (ja) * 2000-08-14 2002-02-28 Pioneer Electronic Corp 車載ナビゲーション装置
JP2002318597A (ja) * 2001-02-15 2002-10-31 Alpine Electronics Inc 音声入力案内方法及び装置
JP2003114698A (ja) * 2001-10-03 2003-04-18 Denso Corp コマンド受付装置及びプログラム
JP2005181442A (ja) * 2003-12-16 2005-07-07 Fuji Electric Holdings Co Ltd 音声対話装置、その方法、プログラム
JP2006189730A (ja) * 2005-01-07 2006-07-20 Matsushita Electric Ind Co Ltd 音声対話方法および音声対話装置
JP2007052397A (ja) * 2005-07-21 2007-03-01 Denso Corp 操作装置
JP2007114475A (ja) * 2005-10-20 2007-05-10 Honda Motor Co Ltd 音声認識機器制御装置
JP2008310344A (ja) * 2008-07-17 2008-12-25 Pioneer Electronic Corp 提示装置及び提示方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11212594A (ja) * 1998-01-22 1999-08-06 Nec Corp 音声対話装置
JP2001331196A (ja) * 2000-05-22 2001-11-30 Nec Corp 音声応答装置
JP2002062893A (ja) * 2000-08-14 2002-02-28 Pioneer Electronic Corp 車載ナビゲーション装置
JP2002318597A (ja) * 2001-02-15 2002-10-31 Alpine Electronics Inc 音声入力案内方法及び装置
JP2003114698A (ja) * 2001-10-03 2003-04-18 Denso Corp コマンド受付装置及びプログラム
JP2005181442A (ja) * 2003-12-16 2005-07-07 Fuji Electric Holdings Co Ltd 音声対話装置、その方法、プログラム
JP2006189730A (ja) * 2005-01-07 2006-07-20 Matsushita Electric Ind Co Ltd 音声対話方法および音声対話装置
JP2007052397A (ja) * 2005-07-21 2007-03-01 Denso Corp 操作装置
JP2007114475A (ja) * 2005-10-20 2007-05-10 Honda Motor Co Ltd 音声認識機器制御装置
JP2008310344A (ja) * 2008-07-17 2008-12-25 Pioneer Electronic Corp 提示装置及び提示方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11330320B2 (en) 2016-08-31 2022-05-10 Samsung Electronics Co., Ltd. Display device and method for controlling display device
JP2020107550A (ja) * 2018-12-28 2020-07-09 パナソニックIpマネジメント株式会社 コントローラ、照明システム、照明制御方法及びプログラム
JP7145502B2 (ja) 2018-12-28 2022-10-03 パナソニックIpマネジメント株式会社 コントローラ、照明システム、照明制御方法及びプログラム
KR20210110362A (ko) * 2019-01-16 2021-09-07 닛폰세이테츠 가부시키가이샤 방향성 전자 강판의 제조 방법

Also Published As

Publication number Publication date
JP4915665B2 (ja) 2012-04-11

Similar Documents

Publication Publication Date Title
KR102293063B1 (ko) 사용자 정의 가능한 웨이크업 음성 명령
KR101556173B1 (ko) 음성인식을 이용한 전자 기기 구동 장치 및 방법
JP2009104020A (ja) 音声認識装置
US20140149118A1 (en) Apparatus and method for driving electric device using speech recognition
US20030177012A1 (en) Voice activated thermostat
JP5075664B2 (ja) 音声対話装置及び支援方法
US20080147397A1 (en) Speech dialog control based on signal pre-processing
JP2009109587A (ja) 音声認識制御装置
WO2003052737A1 (fr) Procede de reconnaissance vocale, controleur a distance, terminal d'information, terminal de communication telephonique et systeme de reconnaissance vocale
JP6227209B2 (ja) 車載用音声認識装置および車載機器
US20070219805A1 (en) Device in which selection is activated by voice and method in which selection is activated by voice
WO2004032113A1 (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP2005284492A (ja) 音声利用操作装置
JP3951705B2 (ja) 電子機器
JP2002169584A (ja) 音声操作システム
JP4915665B2 (ja) 音声認識機能付き操作器
JP2009109586A (ja) 音声認識制御装置
JP2003114698A (ja) コマンド受付装置及びプログラム
JP2008268517A (ja) 音声認識機能付き操作器
KR20050005868A (ko) 음성 인식장치 및 방법
JP2009109536A (ja) 音声認識システム及び音声認識装置
JP2004301893A (ja) 音声認識装置の制御方法
JP2009101056A (ja) 浴室用音声認識制御装置
JP2009080183A (ja) 音声認識制御装置
JP2009109585A (ja) 音声認識制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091218

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20120111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees