JP2008268517A - 音声認識機能付き操作器 - Google Patents
音声認識機能付き操作器 Download PDFInfo
- Publication number
- JP2008268517A JP2008268517A JP2007110916A JP2007110916A JP2008268517A JP 2008268517 A JP2008268517 A JP 2008268517A JP 2007110916 A JP2007110916 A JP 2007110916A JP 2007110916 A JP2007110916 A JP 2007110916A JP 2008268517 A JP2008268517 A JP 2008268517A
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary
- voice
- speech
- recognition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】音声操作語彙をユーザが記憶する負担を軽減した音声認識機能付き操作器を提供することにある。
【解決手段】操作器1は、マイク5により入力されたユーザの音声を音響モデル記憶部8に記憶された音声パターンと比較することによって音声認識を行う音声認識部9と、照明器具20を操作するために用いられる複数の音声操作語彙が登録されたデータベース10と、音声認識部9による認識結果がデータベース10に登録された音声操作語彙に一致すると、当該音声操作語彙に基づき照明制御部19を用いて照明器具20に所望の動作を行わせる対話制御部13とを備える。対話制御部13は、音声認識部9の認識結果をもとにデータベース10から関連する操作を表す音声操作語彙を抽出し、抽出した音声操作語彙の音声を音声生成部12により生成してスピーカ6から出力させるとともに、表示制御部14を用いてLCD4に文字で表示させる。
【選択図】図1
【解決手段】操作器1は、マイク5により入力されたユーザの音声を音響モデル記憶部8に記憶された音声パターンと比較することによって音声認識を行う音声認識部9と、照明器具20を操作するために用いられる複数の音声操作語彙が登録されたデータベース10と、音声認識部9による認識結果がデータベース10に登録された音声操作語彙に一致すると、当該音声操作語彙に基づき照明制御部19を用いて照明器具20に所望の動作を行わせる対話制御部13とを備える。対話制御部13は、音声認識部9の認識結果をもとにデータベース10から関連する操作を表す音声操作語彙を抽出し、抽出した音声操作語彙の音声を音声生成部12により生成してスピーカ6から出力させるとともに、表示制御部14を用いてLCD4に文字で表示させる。
【選択図】図1
Description
本発明は、音声認識機能付き操作器に関するものである。
従来、ユーザが発話した音声を認識し、認識結果をもとに負荷のオン、オフを制御する音声認識装置が提供されている。
また、このような負荷制御装置に用いられる音声対話装置として、ユーザーが音声を入力する音声入力手段と、入力音声を認識する音声認識手段と、音声認識手段にて用いる認識用辞書を記憶する音声認識用辞書記憶手段とを備えたものが従来提案されている(例えば特許文献1参照)。
特開平11−212594号公報
上述の音声対話装置では、入力音声を予め記憶された音声パターン認識可能語彙の音響モデルと比較することで音声認識を行っているため、音声で負荷を操作したいユーザは、音声操作に使用できる認識可能語彙を記憶しておく必要がある。また、上記の音声対話装置は、ユーザが発話した際に入力音声を含む音声ガイダンスを出力する機能も備えているが、入力音声を含む音声ガイダンスしか出力されないため、音声操作に用いる認識可能語彙の一部でもユーザが知っておく必要があった。ここで、音声操作に使用される認識可能語彙が数個であれば、ユーザにとって認識可能語彙を記憶する負担はあまり大きくないが、オン/オフだけではなく細かい制御(例えば空調装置であれば温度や風量の設定など)を行おうとすると、制御に必要な認識可能語彙の数が増加し、ユーザにとって認識可能語彙を記憶する負担が増大するという問題があった。
認識可能語彙を記憶するユーザの負担を軽減するために、認識可能語彙を紙などの媒体に記載して、音声認識装置に並設しておくことも考えられるが、音声操作に使用できる認識可能語彙を探す手間が増えるため、手動でスイッチを操作する場合に比べてユーザの負担が増大するばかりか、音声操作による操作性の向上という目的につながっていないという問題もあった。
本発明は上記問題点に鑑みて為されたものであり、その目的とするところは、音声操作語彙をユーザが記憶する負担を軽減した音声認識機能付き操作器を提供することにある。
上記目的を達成するために、請求項1の発明は、ユーザの発話した音声が入力される音声入力部と、音声入力部により入力された音声を予め記憶した音声パターンと比較することによって音声認識を行う音声認識部と、被制御機器を操作するために用いられる複数の音声操作語彙が登録されたデータベースと、音声認識部による認識結果がデータベースに登録された音声操作語彙に一致すると、当該音声操作語彙に基づいて被制御機器の動作を制御する制御部と、音声認識部の認識結果に関連した操作を表す音声操作語彙をデータベースから抽出してユーザに報知する報知部とを備えたことを特徴とする。
請求項2の発明は、請求項1の発明において、音声操作語彙を表示する表示部を備え、前記報知部は、前記音声認識部の認識結果と少なくとも一部が関連する音声操作語彙を前記データベースから抽出するとともに、抽出した音声操作語彙を表示部に表示させることを特徴とする。
請求項3の発明は、請求項1又は2の発明において、操作対象の被制御機器が複数存在するため、単独では操作対象の特定が不充分で操作が行えない音声操作語彙を操作不可能語彙として前記データベースに登録するとともに、操作不可能語彙に関連する操作を行わせるための音声操作語彙を関連操作語彙としてデータベースに登録しておき、前記報知部は、前記音声認識部の認識結果がデータベースに登録された操作不可能語彙に一致すると、当該操作不可能語彙に対応する関連操作語彙をデータベースから抽出してユーザに報知することを特徴とする。
請求項1の発明によれば、音声認識部が音声入力部により入力された音声の認識を行うと、音声認識部の認識結果に関連した操作を表す音声操作語彙を報知部がデータベースから抽出してユーザに報知しているので、これまでユーザが知らなかった音声操作語彙をユーザに知らしめることができる。したがって、ユーザが音声操作を行うにつれて、新たな音声操作語彙を自然に覚えることができ、音声操作語彙を記憶するユーザの負担を軽減できるという効果がある。
請求項2の発明によれば、音声操作語彙の一部しか記憶していない場合でも、音声操作語彙の一部を発話すれば、ユーザの発話した音声に少なくとも一部が関連する音声操作語彙を、報知部がデータベースから抽出しユーザに報知しているので、音声操作語彙の一部を発話することで、関連する音声操作語彙を表示部に表示させることができ、ユーザが音声操作語彙を正確に記憶する負担を軽減できるという効果がある。
請求項3の発明によれば、ユーザが操作不可能語彙を発話した場合は、報知部が、ユーザの発話した操作不可能語彙に対応する関連操作語彙をデータベースから抽出してユーザに報知しているので、ユーザが発話した内容では操作が行えないことをユーザに知らしめるとともに、関連する操作を行わせるための関連操作語彙をユーザに報知することで、ユーザの意図する操作を確実に行わせることができるという効果がある。
以下に本発明の実施の形態を図面に基づいて説明する。
(実施形態1)
本発明の実施形態1を図1〜図3に基づいて説明する。本実施形態の音声認識機能付き操作器(以下、操作器と略称する。)1は、被制御機器である宅内の設備機器(例えば照明器具、給湯器、防犯設備、防災設備、映像・音響設備など)を操作するために用いられる。操作器1は、図2に示すように例えば壁面に埋込配設される器体2を備えており、器体2の前面には動作表示用のLED3と、バックライトを備えた液晶ディスプレイ(LCD)4と、マイク(音声入力部)5と、スピーカ6と、各種の操作を行うための操作ボタン7a〜7dとを配置してある。
本発明の実施形態1を図1〜図3に基づいて説明する。本実施形態の音声認識機能付き操作器(以下、操作器と略称する。)1は、被制御機器である宅内の設備機器(例えば照明器具、給湯器、防犯設備、防災設備、映像・音響設備など)を操作するために用いられる。操作器1は、図2に示すように例えば壁面に埋込配設される器体2を備えており、器体2の前面には動作表示用のLED3と、バックライトを備えた液晶ディスプレイ(LCD)4と、マイク(音声入力部)5と、スピーカ6と、各種の操作を行うための操作ボタン7a〜7dとを配置してある。
操作器1は、図1のブロック図に示すように、操作ボタン7a〜7dを有して被制御機器を操作したり各種の設定を行うために用いられる手動操作部7と、被制御機器である照明器具20の点灯状態を制御する照明制御部19と、手動操作部7の操作に対応した動作を行わせるように照明制御部19を制御する手動制御部18を備えるとともに、LCD4の表示を制御する表示制御部14や、器体2の外部(宅内)に設けた防犯センサ21や防災センサ22の動作を制御するとともに各センサからの警報信号が入力されるセンサ制御部15や、外部の通信回線網23が接続される通信制御部16や、センサ制御部15を介して防犯センサ21や防災センサ22からの警報信号が入力されると通信制御部16を用いて予め設定された外部の通報先に警報を発する緊急通報部17を備えている。
また操作器1は、手動操作部7の操作に応じて被制御機器である照明器具20を制御する機能に加えて、音声により入力された音声操作語彙に応じて照明器具20を制御する機能を備えている。すなわち被制御機器に所望の動作を行わせる操作(タスク)を、対応する音声操作語彙を発話することで行う音声操作と、手動操作部7を直接操作することで行う手動操作の両方で行えるようになっている。
而して操作器1は、音声認識処理を行うために、ユーザの発話した音声を電気信号に変換するマイク5と、マイク5により入力された電気信号(音声信号)を増幅するアンプ(図示せず)と、操作に対する報知音や警告音或いは後述の音声生成部12で生成された音声を出力するためのスピーカ6と、スピーカ6から出力される音がマイク5へ回り込み入力されてエコーやハウリングが発生するのを防止するエコーキャンセラ11とを備えるとともに、音声認識が可能な認識可能語彙について多数の話者が発した認識可能語彙の特徴量を例えばHMM(隠れマルコフモデル)を用いてモデル化した音響モデルを記憶した音響モデル記憶部8と、マイク5から入力されアンプにより増幅された音声信号と記憶部8に記憶された音響モデルとを比較し、入力された音声信号と類似度の高い音響モデルに対応する音(認識可能語彙)を認識結果として出力する音声認識部9と、被制御機器を操作するために用いられる複数の音声操作語彙などが予め登録されたデータベース10と、人の音声を生成してスピーカ6から出力させる音声生成部12と、音声の認識結果に基づいて表示制御部14や照明制御部19を制御するとともに、音声生成部12に対して合成する音声を出力する対話制御部13とを備えている。ここにおいて、対話制御部13や表示制御部14はマイクロコンピュータよりなる制御部30の演算機能により実現される。
次に、この操作器1を用いて音声操作により被制御機器を操作する場合の動作について図3のフローチャートを参照して説明する。尚、手動操作部7による手動操作については説明を省略する。
ステップS1で操作器1が動作を開始すると、制御部30は操作停止入力があるか否かを判別し(ステップS2)、操作停止入力があると操作器1が動作を停止する(ステップS3)。
一方、操作停止入力が無ければ、音声信号の入力待ちの状態となり、マイク5を介して音声信号が入力されると(ステップS4)、音声認識部9が、マイク5から入力された音声を音響モデル記憶部8に記憶された音響モデルおよび音声認識語彙辞書と比較することによって音声認識を行い(ステップS5)、ステップS6でマイク5からの入力が音声と判断された場合は、音声認識部9が対話制御部13に認識結果を出力する。
対話制御部13は、音声認識部9から認識結果が入力されると、データベース10に記憶された語彙操作対応テーブルを参照して(ステップS7)、認識結果に対応する音声操作語彙が存在するか否かを判断し(ステップS7)、登録済みの音声操作語彙が存在する場合は音声操作語彙に対応した操作を照明制御部19により行わせる(ステップS9)。
表1はデータベース10に記憶された語彙操作対応テーブルの一例を示し、このデータテーブルには、被制御機器を操作するための複数の音声操作語彙が、操作対象の被制御機器の設置場所を示す宅内IDと、被制御機器の機器IDと、音声操作語彙による操作内容とを関連付けて登録されている。したがって、音声認識部9の認識結果が表1のデータテーブルに登録済みの音声操作語彙であれば、対話制御部13は、照明制御部19を用いて、対応する機器IDの被制御機器(照明器具20)に、対応する操作内容を実行させることができる。
対話制御部13は、ステップS9で音声操作語彙に対応した操作を行った後、音声認識部9の認識結果(認識語彙)と少なくとも一部が関連する音声操作語彙をデータベース10から検索する処理を行う(ステップS10)。データベース10には認識語彙と関連語彙とを対応付けて記憶した関連語彙対応テーブルが登録されている。表2は関連語彙対応テーブルの一例であり、このデータテーブルには複数の認識語彙が登録されるとともに、個々の認識語彙毎に、各認識語彙に割り当てた認識語彙IDと、各認識語彙に少なくとも一部が関連する音声操作語彙(関連語彙)とが対応付けて登録されている。なお関連語彙としては、例えば認識語彙と意味的な同義語彙、反操作語彙(例えば認識語彙が「つけて」であれば「けして」)、操作対象機器の詳細な操作を行うための音声操作語彙などが登録されている。
対話制御部13では、ステップS10の関連語彙検索処理において、データベース10に登録された関連語彙対応テーブルを検索して認識語彙が存在するか否かを判断し(ステップS11)、関連語彙対応テーブルに認識語彙が存在すれば、認識語彙と対応付けて登録された関連語彙を抽出し、報知部としての対話制御部13が抽出した関連語彙を報知する処理を行う(ステップS12)。本実施形態では音声による報知と文字による報知の両方を行っており、対話制御部13は表示制御部14および音声生成部12の動作を制御して、表示制御部14により抽出した関連語彙を表示部としてのLCD4に表示させるとともに(ステップS13)、音声生成部12により関連語彙の音声を生成してスピーカ6から出力させた後(ステップS14)、ステップS2に戻る。
ここで、関連語彙の報知中あるいは報知後に、スピーカ6から音声で出力された関連語彙を聞いたり、LCD4に文字で表示された関連語彙を見ることで、ユーザに対して発話した語彙に関連する関連語彙(音声操作語彙)を知らしめることができ、ユーザが音声又は文字で提示された関連語彙を発話すると、上述と同様の処理により音声認識が行われ、発話した関連語彙に対応する操作を行うことができる。
ところで、図4(a)はLCD4に関連語彙を表示する画面の一例を示しており、画面の上側には認識語彙(音声操作語彙)W1が表示され、この認識語彙W1に関連した関連語彙W2が画面の下側に表示されている。図4(a)はユーザが「でんき」と発話した場合の画面例であり、ユーザの発話した「でんき」なる語彙は表1に示すように音声操作語彙として登録されているので、対話制御部13では、照明制御部19を用いて特定の照明器具(例えばシーリングライトA)の点灯/消灯を切り替えるとともに、表2に示す関連語彙対応テーブルから「でんき」という認識語彙W1に対応した関連語彙W2として「シーリングライトA」以外の「天井ライト」「スタンドライト」「玄関ライト」の3つの語彙を抽出し、表示制御部14を制御してLCD4に表示させる。なお関連語彙が複数存在する場合、音声生成部12では所定の優先順位にしたがって複数の関連語彙を順番に音声合成して、スピーカ6から出力させるようにすればよい。
一方、ステップS8において認識結果に対応する音声操作語彙が存在しないと判断された場合、対話制御部13は、音声認識部9の認識結果(認識語彙)と少なくとも一部が関連する音声操作語彙(関連語彙)をデータベース10から検索する処理を行い(ステップS10)、ステップS11の判定処理において関連語彙対応テーブルに認識語彙が存在すれば、認識語彙と対応付けて登録された関連語彙を抽出し、報知部としての対話制御部13が抽出した関連語彙を報知する処理を行った後(ステップS12〜S14)、ステップS2に戻る。
ここで、図4(b)はユーザが「てんじょう」と発話した場合にLCD4に表示される関連語彙の表示画面の一例であり、ユーザの発話した「てんじょう」なる語彙は表1に示すように音声操作語彙として登録されていないので、対話制御部13では、「てんじょう」という認識語彙W3に関連する関連語彙を関連語彙対応テーブルから検索する。表2に示す関連語彙対応テーブルには、「てんじょう」という認識語彙W3に関連する関連語彙W4として「天井ライト」「天井ライトをつけて」「天井ライトを消して」という3つの語彙が登録されているので、対話制御部13ではこれら3つの関連語彙を抽出し、LCD4に表示させるのである。また対話制御部13では音声生成部12を用いて複数の関連語彙を所定の順番で音声合成し、スピーカ6から出力させている。なお、認識語彙W3から関連語彙を抽出する方法として、各認識語彙毎に1乃至複数の関連語彙を関連語彙対応テーブルに登録しておき、このテーブルから認識語彙W3に対応する関連語彙を抽出する方法を説明したが、対話制御部13が、表1の語彙操作対応テーブルに登録された音声操作語彙から関連語彙W3に少なくとも一部が一致(前方一致、後方一致あるいは部分一致)する音声操作語彙を検索して、検索結果を文字あるいは音声で報知するようにしても良い。
したがって音声操作を行いたいユーザが音声操作語彙を知らない場合でも、操作対象の被制御機器の操作に関連するような言葉をユーザが発話することによって、発話した音声の内容(認識語彙)に関連する関連語彙がデータベース10の関連語彙対応テーブルに登録されていれば、認識語彙に関連した関連語彙がLCD4に表示されたりスピーカ6から音声で出力されるので、LCD4の表示を見たりスピーカ6からの音声を聞いたユーザは、操作対象の被制御機器の操作に関連する音声操作語彙を見つけ出すことができ、初めて音声操作を行う場合でも音声操作語彙を覚える必要が無く、音声操作語彙を覚えるユーザの負担を軽減することができる。また音声操作語彙の一部しか覚えていない場合でも、音声操作語彙の一部を発話すれば、発話した語彙(認識語彙)に関連する音声操作語彙がLCD4に表示されるので、所望の操作を行うための音声操作語彙をユーザに思い出させることができる。また更に、ユーザが音声操作語彙を発話した場合でも、対話制御部13が、データベースからユーザの発話した音声操作語彙に関連する関連語彙を検索し、表示制御部14を用いてLCD4に表示させるか、又は、スピーカ6から音声で出力されるので、マニュアルなどを見なくても、音声操作を行いながら関連する音声操作語彙を覚えることができ、音声操作語彙を覚えるユーザの負担をさらに軽減することができる。
(実施形態2)
本実施形態では、実施形態1で説明した操作器1において、操作対象の被制御機器が複数存在するため、単独では操作対象の特定が不充分で操作が行えない音声操作語彙を操作不可能語彙としてデータベース10に登録するとともに、操作不可能語彙に関連する操作を行わせるための音声操作語彙を関連操作語彙としてデータベース10に登録しており、報知部としての対話制御部13では、音声認識部9の認識結果がデータベース10に登録された操作不可能語彙に一致すると、当該操作不可能語彙に対応する関連操作語彙をデータベース10から抽出してユーザに報知することで、ユーザの知らない音声操作語彙を報知できるようにしている。尚、操作器1の構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
本実施形態では、実施形態1で説明した操作器1において、操作対象の被制御機器が複数存在するため、単独では操作対象の特定が不充分で操作が行えない音声操作語彙を操作不可能語彙としてデータベース10に登録するとともに、操作不可能語彙に関連する操作を行わせるための音声操作語彙を関連操作語彙としてデータベース10に登録しており、報知部としての対話制御部13では、音声認識部9の認識結果がデータベース10に登録された操作不可能語彙に一致すると、当該操作不可能語彙に対応する関連操作語彙をデータベース10から抽出してユーザに報知することで、ユーザの知らない音声操作語彙を報知できるようにしている。尚、操作器1の構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
データベース10には、事前に予測される操作不可能語彙と、操作不可能語彙に関連する操作を行わせるための音声操作語彙(適応化後操作可能語彙)とを対応付けた操作不可能語彙対応テーブルが予め登録されている。なお操作不可能語彙とは、例えば「つけて」「けして」などのように操作対象の被制御機器を特定していない語彙であり、操作対象の被制御機器が複数存在するため、単独では操作対象の特定が不充分で操作が行えないような音声操作語彙である。また適応化後操作可能語彙とは、「つけて」「けして」といった操作不可能語彙により操作可能な被制御機器群を示す語彙(例えば「でんき」、「えあこん」、「てれび」など)や、被制御機器を個別に特定するための語彙(例えば「しーりんぐらいとえー」「すたんどらいと」などである。表3は操作不可能語彙対応テーブルの一例であり、このデータテーブルには複数の操作不可能語彙が登録されるとともに、個々の操作不可能語彙毎に、各操作不可能語彙に割り当てた操作不可能語彙IDと、各操作不可能語彙に関連する操作を行わせるための音声操作語彙(適応化後操作可能語彙)とが対応付けて登録されている。
而して、対話制御部13では、音声認識部9の認識結果がデータベース10に登録された操作不可能語彙に一致した場合、操作不可能語彙対応テーブルから操作不可能語彙に対応付けて記憶された適応化後操作可能語彙(関連操作語彙)を検索し、検索された操作可能語彙をユーザに報知するのである。
ここで、この操作器1を用いて音声操作により被制御機器を操作する場合の動作について図5のフローチャートを参照して説明する。尚、ステップS15の操作不可能語彙適応検索処理以外は、実施形態1において図3のフローチャートで説明した処理と同様であるので、共通する処理の説明は省略し、操作不可能語彙適応検索処理について以下に説明する。
ステップS8において、音声認識部9の認識結果に対応する音声操作語彙が存在しないと判断された場合、対話制御部13は操作不可能語彙適応検索処理を行う(ステップS15)。すなわち対話制御部13では、データベース10に登録された操作不可能語彙対応テーブルを検索して、音声認識部9の認識結果が操作不可能語彙であるか否かを判断し、操作不可能語彙であれば、操作不可能語彙テーブルから対応する適応化後操作可能語彙を関連操作語彙として抽出する処理を行った後、ステップS10,S11の処理を経て、関連操作語彙を報知する処理を行い(ステップS12)、表示制御部14を制御して適応化後操作可能語彙をLCD4に表示させたり(ステップS13)、適応化後操作可能語彙を音声生成部12により音声合成させてスピーカ6から出力させた後(ステップS14)。、ステップS2に戻るのである。
ここで、関連語彙の報知中あるいは報知後に、スピーカ6から音声で出力された関連語彙を聞いたり、LCD4に文字で表示された関連語彙を見ることで、ユーザに対して発話した操作不可能語彙に関連する関連語彙(音声操作語彙)を知らしめることができ、ユーザが音声又は文字で提示された関連語彙を発話すると、上述と同様の処理により音声認識が行われ、発話した関連語彙に対応する操作を行うことができる。
したがって、音声操作を行いたいユーザが音声操作語彙を正確に覚えておらず、単独では操作対象の特定が不充分なために操作が行えない操作不可能語彙を発話した場合でも、ユーザの発話した操作不可能語彙に関連する操作を行わせるための関連操作語彙がデータベース10の操作不可能語彙テーブルに登録されていれば、操作不可能語彙に対応付けられた関連操作語彙が文字或いは音声で報知されるので、初めて音声操作を行う場合でも音声操作語彙を覚える必要が無く、音声操作語彙を覚えるユーザの負担を軽減することができる。また音声操作語彙を正確に覚えていない場合でも、発話した語彙が操作不可能語彙として登録されていれば、発話した操作不可能語彙に対応付けられた音声操作語彙(関連操作語彙)がユーザに報知されるので、所望の操作を行うための音声操作語彙をユーザに思い出させることができ、音声操作を行いながら音声操作語彙を学習することができる。
ところで、実施形態1で説明した操作器1ではユーザの発話した語彙が操作不可能語彙であった場合、ユーザの発話した操作不可能語彙(認識語彙)に一部が一致する音声操作語彙を検索し、検索結果をユーザに報知しているため、ユーザに報知する音声操作語彙の数が多くなる場合があるが、本実施形態では表3に示す操作不可能語彙対応テーブルに予め登録されている適応化後操作可能語彙がユーザに報知されるから、使用環境などを考慮して登録された語彙をユーザに報知することができ、的確な操作可能語彙をユーザに報知することができる。
1 音声認識機能付き操作器
4 LCD(表示部)
5 マイク(音声入力部)
6 スピーカ
8 音響モデル記憶部(記憶部)
9 音声認識部
10 データベース
12 音声生成部
13 対話制御部(制御部、報知部)
14 表示制御部
19 照明制御部
20 照明器具
4 LCD(表示部)
5 マイク(音声入力部)
6 スピーカ
8 音響モデル記憶部(記憶部)
9 音声認識部
10 データベース
12 音声生成部
13 対話制御部(制御部、報知部)
14 表示制御部
19 照明制御部
20 照明器具
Claims (3)
- ユーザの発話した音声が入力される音声入力部と、音声入力部により入力された音声を予め記憶した音声パターンと比較することによって音声認識を行う音声認識部と、被制御機器を操作するために用いられる複数の音声操作語彙が登録されたデータベースと、音声認識部による認識結果がデータベースに登録された音声操作語彙に一致すると、当該音声操作語彙に基づいて被制御機器の動作を制御する制御部と、音声認識部の認識結果に関連した操作を表す音声操作語彙をデータベースから抽出してユーザに報知する報知部とを備えたことを特徴とする音声認識機能付き操作器。
- 音声操作語彙を表示する表示部を備え、前記報知部は、前記音声認識部の認識結果と少なくとも一部が関連する音声操作語彙を前記データベースから抽出するとともに、抽出した音声操作語彙を表示部に表示させることを特徴とする請求項1記載の音声認識機能付き操作器。
- 操作対象の被制御機器が複数存在するため、単独では操作対象の特定が不充分で操作が行えない音声操作語彙を操作不可能語彙として前記データベースに登録するとともに、操作不可能語彙に関連する操作を行わせるための音声操作語彙を関連操作語彙としてデータベースに登録しておき、前記報知部は、前記音声認識部の認識結果がデータベースに登録された操作不可能語彙に一致すると、当該操作不可能語彙に対応する関連操作語彙をデータベースから抽出してユーザに報知することを特徴とする請求項1又は2記載の音声認識機能付き操作器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007110916A JP2008268517A (ja) | 2007-04-19 | 2007-04-19 | 音声認識機能付き操作器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007110916A JP2008268517A (ja) | 2007-04-19 | 2007-04-19 | 音声認識機能付き操作器 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008268517A true JP2008268517A (ja) | 2008-11-06 |
Family
ID=40048114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007110916A Withdrawn JP2008268517A (ja) | 2007-04-19 | 2007-04-19 | 音声認識機能付き操作器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008268517A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101207435B1 (ko) | 2012-07-09 | 2012-12-04 | 다이알로이드(주) | 대화형 음성인식 서버, 대화형 음성인식 클라이언트 및 대화형 음성인식 방법 |
JP2015036826A (ja) * | 2013-08-12 | 2015-02-23 | 日本電気株式会社 | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム |
CN108446095A (zh) * | 2013-01-17 | 2018-08-24 | 三星电子株式会社 | 图像处理设备、其控制方法、以及图像处理系统 |
JP2019133634A (ja) * | 2018-02-01 | 2019-08-08 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | スマート設備の機能案内方法及システム |
WO2020144884A1 (ja) * | 2019-01-11 | 2020-07-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 方法、制御装置、及びプログラム |
-
2007
- 2007-04-19 JP JP2007110916A patent/JP2008268517A/ja not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101207435B1 (ko) | 2012-07-09 | 2012-12-04 | 다이알로이드(주) | 대화형 음성인식 서버, 대화형 음성인식 클라이언트 및 대화형 음성인식 방법 |
CN108446095A (zh) * | 2013-01-17 | 2018-08-24 | 三星电子株式会社 | 图像处理设备、其控制方法、以及图像处理系统 |
JP2019153314A (ja) * | 2013-01-17 | 2019-09-12 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 映像処理装置及びその制御方法、並びに映像処理システム |
JP2015036826A (ja) * | 2013-08-12 | 2015-02-23 | 日本電気株式会社 | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム |
JP2019133634A (ja) * | 2018-02-01 | 2019-08-08 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | スマート設備の機能案内方法及システム |
US10937423B2 (en) | 2018-02-01 | 2021-03-02 | Baidu Online Network Technology (Beijing) Co., Ltd. | Smart device function guiding method and system |
WO2020144884A1 (ja) * | 2019-01-11 | 2020-07-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 方法、制御装置、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102293063B1 (ko) | 사용자 정의 가능한 웨이크업 음성 명령 | |
US10706853B2 (en) | Speech dialogue device and speech dialogue method | |
US7698134B2 (en) | Device in which selection is activated by voice and method in which selection is activated by voice | |
US8818816B2 (en) | Voice recognition device | |
US8428954B2 (en) | Environmental condition detector with validated personalized verbal messages | |
WO2003052737A1 (fr) | Procede de reconnaissance vocale, controleur a distance, terminal d'information, terminal de communication telephonique et systeme de reconnaissance vocale | |
JP2009192942A (ja) | 音声対話装置及び支援方法 | |
JP2009109587A (ja) | 音声認識制御装置 | |
WO2017042906A1 (ja) | 車載用音声認識装置および車載機器 | |
WO2018100743A1 (ja) | 制御装置および機器制御システム | |
JP3702867B2 (ja) | 音声制御装置 | |
JP2008268517A (ja) | 音声認識機能付き操作器 | |
JP2017167247A (ja) | 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム | |
JP2009109586A (ja) | 音声認識制御装置 | |
JP2006208486A (ja) | 音声入力装置 | |
KR101590053B1 (ko) | 음성 인식을 이용한 비상벨 장치, 이의 작동 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP4915665B2 (ja) | 音声認識機能付き操作器 | |
JP2009109585A (ja) | 音声認識制御装置 | |
JP2007286376A (ja) | 音声案内システム | |
JP2001042887A (ja) | 自動音声認識器を訓練する方法 | |
KR100994930B1 (ko) | 음성인식 기반 홈네트워크 시스템의 적응화 음성 인식 제어방법 및 그 시스템 | |
JP2006162782A (ja) | 音声認識装置 | |
CN113228170B (zh) | 信息处理装置及非易失性存储介质 | |
JP2001100786A (ja) | 音声認識方法、装置及び記憶媒体 | |
JP3192324B2 (ja) | 特定話者用単語音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100706 |