JP2017049537A - 操作装置、訂正方法およびプログラム - Google Patents

操作装置、訂正方法およびプログラム Download PDF

Info

Publication number
JP2017049537A
JP2017049537A JP2015174759A JP2015174759A JP2017049537A JP 2017049537 A JP2017049537 A JP 2017049537A JP 2015174759 A JP2015174759 A JP 2015174759A JP 2015174759 A JP2015174759 A JP 2015174759A JP 2017049537 A JP2017049537 A JP 2017049537A
Authority
JP
Japan
Prior art keywords
information
recognition
unit
operation information
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015174759A
Other languages
English (en)
Other versions
JP6548994B2 (ja
Inventor
亮 木山
Akira Kiyama
亮 木山
敏行 加納
Toshiyuki Kano
敏行 加納
鈴木 優
Masaru Suzuki
優 鈴木
誠二 江川
Seiji Egawa
誠二 江川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2015174759A priority Critical patent/JP6548994B2/ja
Publication of JP2017049537A publication Critical patent/JP2017049537A/ja
Application granted granted Critical
Publication of JP6548994B2 publication Critical patent/JP6548994B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

【課題】認識した情報の誤りを少ない負担でユーザに訂正させる。【解決手段】実施形態の操作装置は、動作させる対象の機器および動作内容を表す指示信号を入力する入力部と、指示信号を認識処理することにより認識情報を生成する認識部と、認識情報を解析して、動作させる対象の機器および動作内容を示す操作情報を生成する解析部と、操作情報に示される機器を、操作情報に示される内容で動作するように制御する制御部と、制御部とは異なる手段に基づき動作した機器および動作内容を示す動作情報を受信する受信部と、動作情報に基づき、認識情報が誤っているか否かを判定する判定部と、誤っていると判定された認識情報を訂正する訂正情報を生成する訂正部と、を備える。【選択図】図1

Description

本発明の実施形態は、操作装置、訂正方法およびプログラムに関する。
近年、テレビジョンまたはエアコンディショナ等の機器を音声等で操作するユーザインタフェースが提案されている。このようなユーザインタフェースでは、音声信号と認識結果とを収集し、収集した情報により認識処理に用いるモデルを学習することにより、認識精度を向上させることができる。
ところで、収集した情報には、誤った認識結果も含まれる。モデルを学習する場合、誤った認識結果は予め訂正しておく必要がある。従来は、収集した認識結果を人間が確認して、手動で誤りを訂正していた。しかし、人間が手動で訂正するのは非常に煩雑で時間がかかり、負担が大きい。また、機器を操作するためのモデルの場合、認識結果を単に訂正すればよいのではなく、訂正した認識結果により機器を操作できなければならない。
特開2008−216341号公報 特開2010−48890号公報 特開2000−276187号公報
本発明が解決しようとする課題は、認識情報の誤りの訂正の負担を軽減させることにある。
実施形態の操作装置は、動作させる対象の機器および動作内容を表す指示信号を入力する入力部と、前記指示信号を認識処理することにより認識情報を生成する認識部と、前記認識情報を解析して、動作させる対象の機器および動作内容を示す操作情報を生成する解析部と、前記操作情報に示される機器を、前記操作情報に示される内容で動作するように制御する制御部と、前記制御部とは異なる手段に基づき動作した機器および動作内容を示す動作情報を受信する受信部と、前記動作情報に基づき、前記認識情報が誤っているか否かを判定する判定部と、誤っていると判定された前記認識情報を訂正する訂正情報を生成する訂正部と、を備える。
図1は、第1実施形態に係る操作装置の構成を機器とともに示す図である。 図2は、判定部の構成の一例を、蓄積部とともに示す図である。 図3は、操作装置における、機器の制御時の処理の流れを示す図である。 図4は、蓄積部に記憶された情報の一例を示す図である。 図5は、動作情報の受信時の処理の流れを示す図である。 図6は、最後のレコードの動作情報のフィールドに空きがある場合の、動作情報の書き込み位置の一例を示す図である。 図7は、最後のレコードの動作情報のフィールドに空きが無い場合の、動作情報の書き込み位置の一例を示す図である。 図8は、操作装置における判定時の処理の流れを示す図である。 図9は、判定部による判定処理の流れを示す図である。 図10は、動作情報が書き込まれたレコード(最後のレコード)に、認識情報が書き込まれている場合の、蓄積部に記憶された情報の一例を示す図である。 図11は、図10の場合における、補助認識情報、補助操作情報および訂正情報を示す図である。 図12は、動作情報が書き込まれたレコード(最後のレコード)に、認識情報が書き込まれていない場合の、蓄積部に記憶された情報の一例を示す図である。 図13は、図12の場合における、補助認識情報、補助操作情報および訂正情報を示す図である。 図14は、第1実施形態の第1変形例の判定部による判定処理の流れを示す図である。 図15は、最後のレコードの操作情報に示される動作を、最後のレコードの動作情報が打ち消す場合の、蓄積部に記憶された情報の一例を示す図である。 図16は、最後に書き込まれた操作情報に示される動作を、最後のレコードの動作情報が打ち消す場合の、蓄積部に記憶された情報の一例を示す図である。 図17は、第1実施形態の第2変形例の判定部の処理内容を説明するためのタイミングチャートである。 図18は、第2実施形態に係る操作装置の構成を機器とともに示す図である。 図19は、レコード番号#1の操作情報を、直後のレコード番号#2の操作情報が打ち消す場合の、蓄積部に記憶された情報の一例を示す図である。 図20は、第3実施形態に係る操作装置の構成を機器とともに示す図である。 図21は、操作情報の内容をユーザが肯定する場合のシーケンスを示す図である。 図22は、操作情報の内容をユーザが否定する場合のシーケンスを示す図である。 図23は、情報処理装置のハードウェア構成を示す図である。
以下、図面を参照しながら実施形態に係る操作装置について詳細に説明する。本実施形態に係る操作装置は、ユーザからの指示を認識して機器を制御するとともに、認識した情報の誤りを少ない負担でユーザに訂正させることを目的とする。
(第1実施形態)
図1は、第1実施形態に係る操作装置10の構成を機器20とともに示す図である。
操作装置10は、音声またはジェスチャ等によるユーザの指示を受け付け、受け付けた指示に従って、少なくとも1つの機器20(例えば機器20−1,20−2,20−3)を制御する。機器20は、例えば、テレビジョンおよびエアコンディショナ等である。操作装置10は、例えば、電源のオンまたはオフ等の制御を行う。
操作装置10は、入力部31と、モデル記憶部32と、認識部33と、解析部34と、制御部35と、蓄積部36と、書込部37と、受信部38と、判定部39と、訂正部40と、学習部41とを備える。
入力部31は、ユーザから、動作させる対象の機器20および動作内容を表す指示信号を入力する。入力部31は、例えば、ユーザの音声による指示をマイクロフォンで取り込み、マイクロフォンから出力された電気信号をサンプリングした音声信号を指示信号として入力する。また、入力部31は、例えば、ユーザのジェスチャによる指示をカメラにより取り込んで得られる画像信号を、指示信号として入力する。
モデル記憶部32は、指示信号を認識処理するために用いるモデルを記憶する。モデル記憶部32は、例えば、音響モデルおよび言語モデル等を記憶する。モデル記憶部32は、認識部33からネットワークを介してアクセスが可能であれば、サーバ装置等が備えてもよい。
認識部33は、入力部31により入力された指示信号を、モデル記憶部32に記憶されたモデルを用いて認識処理することにより認識情報を生成する。例えば、指示信号が音声信号である場合、認識部33は、発話内容を表す文字列を、認識情報として生成する。また、例えば、指示信号がジェスチャを取り込んだ画像信号である場合、認識部33は、ジェスチャを表す文字列を、認識情報として生成する。
解析部34は、認識部33により生成された認識情報を解析して、動作させる対象の機器20および動作内容を示す操作情報を生成する。例えば、認識情報が文字列である場合には、解析部34は、認識情報を解析して、機器名を特定する単語(例えば、テレビジョンまたはエアコンディショナ等)を抽出し、抽出した単語に基づき動作させる対象の機器20を特定する。また、解析部34は、認識情報を解析して、動作内容を特定する単語(電源を点けるまたは電源を消す等)を抽出し、抽出した単語に基づき動作内容を特定する。そして、解析部34は、これらの内容を示す操作情報を生成する。
制御部35は、操作情報に示される機器20を、操作情報に示される内容で動作するように制御する。例えば、制御部35は、操作情報に示される機器20に対して、操作情報に示される動作を行わせるための信号(例えば、赤外線信号)を送信する。例えば、制御部35は、操作情報に基づき、テレビジョンまたはエアコンディショナに対して電源をオンまたはオフにするための信号を送信する。また、制御部35は、機器20を制御した時刻を表す情報を出力する。
蓄積部36は、時刻、指示信号、認識情報、操作情報、動作情報および訂正情報を対応付けて記憶する。例えば、蓄積部36は、時刻、指示信号、認識情報、操作情報、動作情報および訂正情報を、1つのレコードに含めて記憶する。蓄積部36は、一部の情報が含まれないレコードを記憶してもよい。蓄積部36は、例えば、時刻、指示信号、認識情報および操作情報を含み、動作情報および訂正情報を含まないレコードを記憶してもよい。蓄積部36は、例えば、訂正情報を含まないレコードを記憶してもよい。また、蓄積部36は、例えば、動作情報のみを含むレコードを記憶してもよい。
書込部37は、制御部35が操作情報に基づき機器20を制御した場合、機器20を制御した時刻、操作情報、並びに、その操作情報に対応する指示信号および認識情報を、対応付けて蓄積部36に書き込む。例えば、書込部37は、制御部35が機器20を制御した場合、蓄積部36に新規レコードを登録し、登録した新規レコードに、時刻、操作情報、指示信号および認識情報を書き込む。
受信部38は、制御部35とは異なる手段に基づき動作した機器20および動作内容を示す動作情報を、機器20から受信する。それぞれの機器20は、制御部35以外の手段により動作した場合、機器20を示す情報および動作内容を示す情報を含む動作情報を、操作装置10に送信する。例えば、それぞれの機器20は、リモートコントローラまたは本体に設けられた操作ボタン等が操作された場合、動作情報を操作装置10に送信する。受信部38は、このような動作情報を受信する。
受信部38は、動作情報を受信した場合、蓄積部36に動作情報を書き込む。この場合、受信部38は、受信した動作情報を、最後に書き込まれた、時刻、指示信号、認識情報および操作情報に対応付けて蓄積部36に書き込む。例えば、受信部38は、蓄積部36に記憶された最後のレコード(最も新しいレコード)に、受信した動作情報を書き込む。
ただし、受信部38は、最後に書き込まれた、時刻、指示信号、認識情報および操作情報に対応付けて、他の動作情報が既に書き込まれている場合、受信した動作情報を、何れの時刻、指示信号、認識情報および操作情報にも対応付けずに、単独で蓄積部36に書き込む。例えば、受信部38は、蓄積部36に記憶された最後のレコードに他の動作情報が既に書き込まれている場合、蓄積部36に新規レコードを登録し、登録した新規レコードに受信した動作情報を書き込む。
判定部39は、動作情報に基づき、認識情報が誤っているか否かを判定する。つまり、判定部39は、動作情報に基づき、認識情報の内容が、指示信号の内容と異なっているか否かを判定する。
判定部39は、受信した動作情報に対応する認識情報が蓄積部36に記憶されている場合、受信した動作情報に基づき、対応して記憶されている認識情報が誤っているか否かを判定する。例えば、判定部39は、受信した動作情報が書き込まれたレコードに、認識情報が書き込まれている場合、受信した動作情報に基づき、同一のレコードに書き込まれている認識情報が誤っているか否かを判定する。
これにより、判定部39は、制御部35が何れかの機器20を制御した後、次の機器20を制御する前に、何れかの機器20から動作情報を受信した場合に、認識情報が誤っているか否かを判定することができる。
ただし、判定部39は、受信した動作情報に対応する認識情報が蓄積部36に記憶されていない場合、訂正情報が記憶されていないことを条件として、受信した動作情報に基づき、最後に書き込まれた認識情報が誤っているか否かを判定する。例えば、判定部39は、受信した動作情報が書き込まれたレコードに、認識情報が書き込まれていない場合、最後に認識情報が書き込まれたレコード(認識情報を含むレコードのうちの最も新しいレコード)に訂正情報が書き込まれていないことを条件として、受信した動作情報に基づき、そのレコードに書き込まれた認識情報が誤っているか否かを判定する。
これにより、判定部39は、制御部35が何れかの機器20を制御した後、次の機器20を制御する前に、動作情報を2回以上受信した場合において、2回目以降の動作情報の受信時に、最後に書き込まれた認識情報が誤っているか否かを判定することができる。
本実施形態において、判定部39は、受信した動作情報に基づき次のように判定する。すなわち、判定部39は、指示信号を認識部33とは異なる認識処理をすることにより補助認識情報を生成する。続いて、判定部39は、補助認識情報に基づき、動作させる対象の機器20および動作内容を示す補助操作情報を生成する。そして、判定部39は、補助操作情報と動作情報とが一致した場合、認識情報が誤っていると判定する。
これにより、判定部39は、制御部35が誤った認識結果に基づき機器20を制御してしまったため、ユーザが他の手段を用いて目的の機器20を意図に沿った動作をさせたことを検出することができる。そして、判定部39は、このことを検知した場合に、認識結果が誤っていたと判定することができる。
訂正部40は、判定部39により誤っていると判定された認識情報を訂正する訂正情報を生成する。訂正部40は、生成した訂正情報を、誤っていると判定された認識情報に対応させて蓄積部36に記憶させる。例えば、訂正部40は、蓄積部36における、誤っていると判定された認識情報が書き込まれたレコードに、生成した訂正情報を書き込む。
なお、訂正部40は、判定部39において生成した補助認識情報を訂正情報としてよい。これにより、訂正部40は、簡易に訂正情報を生成することができる。
また、訂正部40は、認識部33とは異なるモデルを用いて、指示信号を認識処理することにより訂正情報を生成してもよい。例えば、訂正部40は、認識部33が用いるモデルよりも情報量が多いモデルにネットワークを介してアクセスして訂正情報を生成してもよい。これにより、訂正部40は、認識部33による認識の誤りを訂正できる可能性を高くすることができる。
また、訂正部40は、認識部33と同一のモデルを用い、認識部33とは異なるアルゴリズムで、指示信号を認識処理することにより訂正情報を生成してもよい。例えば、訂正部40は、認識部33より演算コストが大きいが正確に認識ができるアルゴリズムで訂正情報を生成してもよい。これにより、訂正部40は、認識部33による認識の誤りを訂正できる可能性を高くすることができる。
また、訂正部40は、クラウドソーシングを用いて不特定人が指示信号を認識した情報を用いて訂正情報を生成してもよい。これにより、訂正部40は、より確実に認識の誤りを訂正することができる。また、訂正部40は、認識部33により生成された第2候補以降の認識情報を訂正情報としてもよい。これにより、訂正部40は、小さいコストで訂正情報を生成することができる。
学習部41は、蓄積部36に記憶された、指示信号、および、対応する認識情報または訂正情報を用いて、モデル記憶部32に記憶されたモデルを学習する。学習部41は、例えば定期的にモデルを学習する。これにより、学習部41は、誤った認識結果を訂正する訂正情報を用いてモデルを学習することができる。従って、学習部41は、学習後において、認識部33による認識精度を向上させることができる。
図2は、判定部39の構成の一例を、蓄積部36とともに示す図である。判定部39は、例えば、補助認識部51と、補助解析部52と、一致検出部53とを有する。
補助認識部51は、判定対象となる認識情報に対応して記憶された指示信号を蓄積部36から読み出す。例えば、補助認識部51は、判定対象となる認識情報と同一レコードに書き込まれた指示信号を読み出す。そして、補助認識部51は、読み出した指示信号を、認識部33とは異なる認識処理をすることにより補助認識情報を生成する。
補助認識部51は、例えば、認識部33とは異なるモデルを用いて、指示信号を認識処理することにより補助認識情報を生成する。補助認識部51は、例えば、認識部33と同一のモデルを用い、認識部33とは異なるアルゴリズムで、指示信号を認識処理することにより補助認識情報を生成する。また、例えば、補助認識部51は、ネットワークを介してクラウドソーシングを提供するサーバに認識を依頼し、クラウドソーシングを用いて不特定人が指示信号を認識した情報を取得して補助認識情報を生成してもよい。また、例えば、補助認識部51は、認識部33により生成された第2候補以降の認識情報を、補助認識情報としてもよい。
補助解析部52は、補助認識部51により生成された補助認識情報に対して、解析部34と同一の処理を実行する。すなわち、補助解析部52は、補助認識部51により生成された補助認識情報を解析して、動作させる対象の機器20および動作内容を示す補助操作情報を生成する。
一致検出部53は、蓄積部36に書き込まれた動作情報を読み出す。一致検出部53は、補助解析部52により生成された補助操作情報と、読み出した動作情報とが一致するか否かを判定する。すなわち、一致検出部53は、補助操作情報に示される機器20および動作内容が、受信した動作情報に示される機器20および動作内容と同一であるか否かを判定する。一致検出部53は、一致する場合、判定対象となる認識情報が誤っていることを示す判定結果を出力する。また、一致検出部53は、一致しない場合、判定対象となる認識情報が誤ってはいないことを示す判定結果を出力する。
このような判定部39は、制御部35が誤った認識結果に基づき機器20を制御してしまったため、ユーザが他の手段を用いて目的の機器20を意図に沿った動作をさせたことを検出することができる。そして、判定部39は、このことを検知した場合に、認識結果が誤っていたと判定することができる。
図3は、操作装置10における、機器20の制御時の処理の流れを示す図である。操作装置10は、ユーザからの指示を受けた場合、図3に示す流れで処理を実行する。
まず、ステップS11において、入力部31は、ユーザの音声等による指示に応じて、指示信号を入力する。続いて、ステップS12において、認識部33は、入力された指示信号を認識処理することにより認識情報を生成する。
続いて、ステップS13において、解析部34は、認識情報を解析して操作情報を生成する。続いて、ステップS14において、制御部35は、操作情報に示される機器20を、操作情報に示される内容で動作するように制御する。
続いて、ステップS15において、書込部37は、蓄積部36に新規レコードを登録する。続いて、ステップS16において、書込部37は、ステップS11で入力した指示信号、ステップS12で生成した認識情報、ステップS13で生成した操作情報、および、制御部35が機器20を制御した時刻を、新規レコードに書き込む。操作装置10は、ステップS16の処理を終えると、本フローを終了する。
図4は、蓄積部36に記憶された情報の一例を示す図である。蓄積部36は、時刻フィールド、指示信号フィールド、認識情報フィールド、操作情報フィールド、動作情報フィールドおよび訂正情報フィールドを含むレコードを記憶する。
時刻フィールドには、制御部35が機器20を制御した時刻が書き込まれる。指示信号フィールドには、入力部31が入力した指示信号が書き込まれる。例えば、指示信号フィールドには、「テレビジョンを点けて」、「エアコンディショナを点けて」、「テレビジョンを消して」または「エアコンディショナを消して」等を表す音声信号が、指示信号として書き込まれる。
認識情報フィールドには、対応する指示信号を認識処理して得られた認識情報が書き込まれる。例えば、認識情報フィールドには、「テレビジョンを点けて」、「エアコンディショナを点けて」、「テレビジョンを消して」または「エアコンディショナを消して」等を表す文字列が、認識情報として書き込まれる。
操作情報フィールドには、対応する認識情報を解析して得られた操作情報が書き込まれる。例えば、操作情報フィールドには、対象の機器20が「テレビジョン」および動作内容が「電源ON」を表す操作情報、対象の機器20が「エアコンディショナ」および動作内容が「電源ON」を表す操作情報、対象の機器20が「テレビジョン」および動作内容が「電源OFF」を表す操作情報、または、対象の機器20が「エアコンディショナ」および動作内容が「電源OFF」を表す操作情報等が書き込まれる。
動作情報フィールドには、機器20から受信して得られた動作情報が書き込まれる。例えば、動作情報フィールドには、操作情報フィールドに書き込まれる操作情報と同様の内容を表す動作情報が書き込まれる。
訂正情報フィールドには、対応する認識情報が誤っている場合に、認識情報を訂正する訂正情報が書き込まれる。例えば、訂正情報フィールドには、「テレビジョンを点けて」、「エアコンディショナを点けて」、「テレビジョンを消して」または「エアコンディショナを消して」等の文字列が、訂正情報として書き込まれる。
図5は、動作情報の受信時の処理の流れを示す図である。操作装置10は、動作情報を受信した場合、図5に示す流れで処理を実行する。
まず、ステップS21において、受信部38は、何れかの機器20から動作情報を受信したか否かを判断する。受信部38は、動作情報を受信した場合(S21のYes)、処理をステップS22に進め、動作情報を受信しない場合(S21のNo)、処理をステップS21で待機する。
ステップS22において、受信部38は、蓄積部36に登録された最後のレコード(最も新しいレコード)に動作情報が書き込まれているか否かを判断する。すなわち、受信部38は、最後のレコードの動作情報フィールドが空いているか否かを判断する。最後のレコードに動作情報が書き込まれていない場合(S22のNo)、ステップS23において、受信部38は、受信した動作情報を最後のレコードに書き込む。これにより、受信部38は、操作情報に応じて機器20を制御した直後に受信した動作情報を、その操作情報に対応させて蓄積部36に書き込むことができる。受信部38は、ステップS23の処理を終えると、処理をステップS21から繰り返す。
一方、最後のレコードに動作情報が書き込まれている場合(S22のYes)、ステップS24において、受信部38は、蓄積部36に新規レコードを登録する。続いて、ステップS25において、受信部38は、受信した動作情報を、新規レコードに書き込む。これにより、受信部38は、操作情報に応じて機器20を制御した後に、2回以上動作情報を受信した場合、2回目以降の動作情報を操作情報とは対応付けずに独立に蓄積部36に書き込むことができる。受信部38は、ステップS25の処理を終えると、処理をステップS21から繰り返す。
図6は、最後のレコードの動作情報のフィールドに空きがある場合の、動作情報の書き込み位置の一例を示す図である。例えば、ユーザがリモートコントローラによりエアコンディショナの電源をOFFしたとする。この場合、受信部38は、機器20がエアコンディショナであり、動作内容が電源OFFであることを表す動作情報を受信する。
ここで、例えば、最後のレコード(レコード番号#2)の動作情報フィールドが、空いている。この場合、受信部38は、図6に示すように、受信した動作情報(機器20がエアコンディショナ、動作内容が電源OFF)を、最後のレコードの動作情報フィールドに書き込む。このように、受信部38は、操作情報に応じて機器20を制御した直後に受信した動作情報を、最後のレコードに書き込むことができる。
図7は、最後のレコードの動作情報のフィールドに空きが無い場合の、動作情報の書き込み位置の一例を示す図である。続いて、例えば、ユーザがリモートコントローラによりテレビジョンの電源をONしたとする。この場合、受信部38は、機器20がテレビジョンであり、動作内容が電源ONであることを表す動作情報を受信する。
ここで、例えば、最後のレコード(レコード番号#2)の動作情報フィールドには、他の動作情報(機器20がエアコンディショナ、動作内容が電源OFF)が既に書き込まれている。従って、受信部38は、蓄積部36に、新規レコード(レコード番号#3)を登録する。そして、受信部38は、図7に示すように、受信した動作情報(機器20がテレビジョン、動作内容が電源ON)を、新規レコードの動作情報フィールドに書き込む。なお、この場合、新規レコード(レコード番号#3)には、動作情報以外の情報は書き込まれない。このように、受信部38は、操作情報に応じて機器20を制御した後、2回目以降に受信した動作情報を、新規レコードに書き込むことができる。
図8は、操作装置10における判定時の処理の流れを示す図である。操作装置10は、判定タイミングにおいて、図8に示す流れで処理を実行する。
まず、ステップS31において、判定部39は、判定対象の認識情報が誤っているか否かを判定する。判定部39は、対象の認識情報が誤っていると判定した場合、処理をステップS32に進める。判定部39は、対象の認識情報が誤っていないと判定した場合、本フローを終了する。なお、判定部39の判定処理の内容は、図9においてさらに説明する。
ステップS32において、訂正部40は、指示信号を認識部33とは異なる認識処理により認識して、判定対象の認識情報を訂正する訂正情報を生成する。訂正部40は、ステップS31の判定処理において補助認識情報を生成した場合には、補助認識情報を訂正情報とする。
また、訂正部40は、認識部33とは異なるモデルを用いて訂正情報を生成してもよい。訂正部40は、認識部33とは異なる認識アルゴリズムで、認識部33と同一のモデルを用いて訂正情報を生成してもよい。また、訂正部40は、クラウドソーシングを用いて訂正情報を生成してもよい。また、訂正部40は、認識部33により生成された第2候補以降の認識情報を訂正情報としてもよい。
続いて、ステップS33において、訂正部40は、判定対象の認識情報に対応させて訂正情報を蓄積部36に書き込む。例えば、訂正部40は、判定対象の認識情報が書き込まれているレコードに訂正情報を書き込む。操作装置10は、ステップS33の処理を終えると、本フローを終了する。
このように、操作装置10は、認識情報が誤っていると判定した場合、認識情報を訂正する訂正情報を蓄積部36に書き込む。これにより、操作装置10は、認識結果を用いてモデルを学習する場合、訂正情報を用いて学習をすることができるので、認識精度を向上させることができる。
図9は、判定部39による判定処理の流れを示す図である。判定部39は、図9に示す流れで判定処理を実行する。
まず、ステップS41において、判定部39は、受信部38が動作情報を受信したか否かを判断する。判定部39は、動作情報を受信した場合(S41のYes)、処理をステップS42に進める。判定部39は、動作情報を受信していない場合(S41のNo)、処理をステップS41で待機する。
ステップS42において、判定部39は、受信した動作情報に対応する認識情報が蓄積部36に記憶されているか否かを判断する。すなわち、判定部39は、受信した動作情報が書き込まれたレコード(最後のレコード)に、認識情報が書き込まれているか否かを判断する。受信した動作情報に対応する認識情報が蓄積部36に記憶されている場合(S42のYes)、判定部39は、対応する認識情報(最後のレコードに書き込まれた認識情報)を判定対象とし、処理をステップS44に進める。
受信した動作情報に対応する認識情報が蓄積部36に記憶されていない場合(S42のNo)、つまり、受信した動作情報が新規レコードに書き込まれていた場合、判定部39は、処理をステップS43に進める。ステップS43において、判定部39は、最後に書き込まれた認識情報を含むレコード(認識情報が書き込まれたレコードのうち最も新しいレコード)に、訂正情報が書き込まれているか否かを判断する。最後に書き込まれた認識情報を含むレコードに、訂正情報が書き込まれている場合(S43のYes)、判定部39は、判定対象の認識情報が誤っていないとして、本フローを終了する。最後に書き込まれた認識情報を含むレコードに、訂正情報が書き込まれていない場合(S43のNo)、判定部39は、最後に書き込まれた認識情報(最も新しい認識情報)を判定対象とし、処理をステップS44に進める。
続いて、ステップS44において、判定部39は、判定対象の認識情報の元となる指示信号を、認識部33とは異なる認識処理により認識して、補助認識情報を生成する。例えば、判定部39は、認識部33とは異なるモデルを用いて補助認識情報を生成してもよい。また、判定部39は、認識部33とは異なる認識アルゴリズムで、認識部33と同一のモデルを用いて補助認識情報を生成してもよい。また、判定部39は、クラウドソーシングを用いて補助認識情報を生成してもよい。また、判定部39は、認識部33により生成された第2候補以降の認識情報を補助認識情報としてもよい。
続いて、ステップS45において、判定部39は、補助認識情報に基づき、補助操作情報を生成する。より具体的には、判定部39は、解析部34と同様の処理により、補助認識情報から補助操作情報を生成する。
続いて、ステップS46において、判定部39は、ステップS41で受信した動作情報と、ステップS45で生成した補助操作情報とが一致するか否かを判断する。すなわち、判定部39は、受信した動作情報により示される機器20および動作内容と、生成した補助操作情報の機器20および動作内容とが一致するか否かを判定する。
一致しなかった場合(S46のNo)、判定部39は、判定対象の認識情報が誤っていないと判定して、本フローを終了する。一致した場合(S46のYes)、判定部39は、判定対象の認識情報が誤っていると判定して、本フローを終了する。
これにより、判定部39は、生成した補助操作情報が、ユーザが他の手段を用いて目的の機器20を意図に沿った動作をさせた内容と一致していることを検出することができる。そして、判定部39は、このことを検知した場合に、認識結果が誤っていたと判定することができる。
図10は、動作情報が書き込まれたレコード(最後のレコード)に、認識情報が書き込まれている場合の、蓄積部36に記憶された情報の一例を示す図である。例えば、ユーザが「テレビジョンを点けて」と音声で指示をしたが、操作装置10がエアコンディショナの電源をONにしたとする。そして、ユーザは、テレビジョンの電源がONにならなかったので、リモートコントローラを用いてテレビジョンの電源をONにしたとする。
この場合、受信部38は、機器20がテレビジョンであり、動作内容が電源ONであることを表す動作情報を受信する。受信部38は、最後のレコード(レコード番号#2)の動作情報フィールドが空いているので、受信した動作情報を最後のレコードに書き込む。
ここで、最後のレコード(レコード番号#2)には、認識情報が存在する。従って、このような場合、判定部39は、最後のレコードの認識情報を判定対象とする。
図11は、図10の場合における、補助認識情報、補助操作情報および訂正情報を示す図である。
続いて、判定部39は、判定対象の認識情報の元となる指示信号に対して、認識部33とは異なる認識処理をして、補助認識情報を生成する。本例においては、判定部39は、最後のレコード(レコード番号#2)の指示信号を認識処理して、「テレビジョンを点けて」という文字列の補助認識情報を生成する。
続いて、判定部39は、補助認識情報を解析して補助操作情報を生成する。本例においては、判定部39は、機器20がテレビジョンであり、動作内容が電源ONであることを表す補助操作情報を生成する。
続いて、判定部39は、補助操作情報と、受信した動作情報とが一致するか否かを判断する。本例においては、補助操作情報と動作情報とが共に、機器20がテレビジョンであり、動作内容が電源ONであることを表す。従って、補助操作情報と動作情報とは一致する。補助操作情報と動作情報とが一致する場合、判定部39は、判定対象の認識情報(レコード番号#2の認識情報)が誤っていると判定する。
判定部39により認識情報が誤っていると判定された場合、訂正部40は、訂正情報を生成する。本例においては、訂正部40は、判定部39において生成された補助認識情報(「テレビジョンを点けて」)を取得して、訂正情報とする。そして、訂正部40は、訂正情報を判定対象の認識情報に対応させて蓄積部36に書き込む。本例においては、訂正部40は、最後のレコード(レコード番号#2)の訂正情報フィールドに、訂正情報(「テレビジョンを点けて」)を書き込む。
図12は、動作情報が書き込まれたレコード(最後のレコード)に、認識情報が書き込まれていない場合の、蓄積部36に記憶された情報の一例を示す図である。例えば、ユーザが「テレビジョンを点けて」と音声で指示をしたが、操作装置10がエアコンディショナの電源をONにしたとする。ユーザは、エアコンディショナの電源がONとなってしまったので、リモートコントローラを用いてエアコンディショナの電源をOFFにした後に、リモートコントローラを用いてテレビジョンの電源をONにした。
この場合、受信部38は、まず、機器20がエアコンディショナであり、動作内容が電源OFFであることを表す動作情報を受信して、レコード番号#2のレコードに書き込む。しかし、判定部39は、生成した補助操作情報と、受信した動作情報とが一致せずに、認識情報は誤っていないと判定した。従って、訂正部40は、レコード番号#2のレコードに訂正情報を書き込まなかった。
続いて、受信部38は、機器20がテレビジョンであり、動作内容が電源ONであることを表す動作情報を受信する。レコード番号#2のレコードには、既に他の動作情報(機器20がエアコンディショナ、動作内容が電源OFF)が書き込まれている。従って、受信部38は、新規レコード(レコード番号#3)を登録する。そして、受信部38は、新規レコード(レコード番号#3)に、受信した動作情報を書き込む。この場合、最後のレコード(レコード番号#3)には、認識情報が存在しない。
そこで、判定部39は、最後に認識情報が書き込まれたレコードに訂正情報が書き込まれているか否かを確認し、訂正情報が書き込まれていないことを条件として、最後に書き込まれた認識情報を判定対象とする。本例においては、最後に認識情報が書き込まれたレコードは、レコード番号#2のレコードである。レコード番号#2のレコードには、訂正情報が書き込まれていない。従って、本例においては、判定部39は、レコード番号#2のレコードに書き込まれた認識情報を判定対象とする。
図13は、図12の場合における、補助認識情報、補助操作情報および訂正情報を示す図である。
続いて、判定部39は、判定対象の認識情報の元となる指示信号に対して、認識部33とは異なる認識処理をして、補助認識情報を生成する。本例においては、判定部39は、最後に認識情報が書き込まれたレコード(レコード番号#2)の指示信号を認識処理して、「テレビジョンを点けて」という文字列の補助認識情報を生成する。
続いて、判定部39は、補助認識情報を解析して補助操作情報を生成する。本例においては、判定部39は、機器20がテレビジョンであり、動作内容が電源ONであることを表す補助操作情報を生成する。
続いて、判定部39は、補助操作情報と、受信した動作情報とが一致するか否かを判断する。本例においては、補助操作情報と動作情報とが共に、機器20がテレビジョンであり、動作内容が電源ONであることを表す。従って、補助操作情報と動作情報とは一致する。補助操作情報と動作情報とが一致する場合、判定部39は、判定対象の認識情報が誤っていると判定する。
判定部39により判定対象の認識情報が誤っていると判定された場合、訂正部40は、訂正情報を生成する。本例においては、訂正部40は、判定部39において生成された補助認識情報(「テレビジョンを点けて」)を取得して、訂正情報とする。そして、訂正部40は、訂正情報を判定対象の認識情報に対応させて蓄積部36に書き込む。本例においては、訂正部40は、最後に認識情報が書き込まれたレコード(レコード番号#2)の訂正情報フィールドに、訂正情報(「テレビジョンを点けて」)を書き込む。
(効果)
以上のように、本実施形態に係る操作装置10は、ユーザの音声またはジェスチャ等を認識して、機器20を制御することができる。
さらに、操作装置10は、機器20がリモートコントローラまたは操作ボタン等により直接操作された場合、動作情報を受信する。そして、操作装置10は、受信した動作情報に基づき、認識結果が誤っていたか否かを判定する。これにより、操作装置10は、ユーザに負担をかけずに認識結果の誤りを検出することができる。
また、さらに、操作装置10は、受信した動作情報と、認識部33とは異なる認識処理により生成した補助認識情報に基づく補助操作情報とが一致した場合に、認識結果に誤りがあると判定する。そして、操作装置10は、認識結果に誤りがある場合、補助認識情報を訂正情報とする。補助認識情報は、受信した動作情報と一致する補助操作情報の元となる情報である。従って、操作装置10は、機器20を確実に操作可能な訂正情報を生成することができる。
(第1変形例)
つぎに、第1実施形態の第1変形例に係る操作装置10について説明する。第1変形例に係る操作装置10については、図1から図13を参照して説明した第1実施形態との相違点を説明する。
図14は、第1実施形態の第1変形例の判定部39による判定処理の流れを示す図である。第1変形例は、図9に示したフローチャートのステップS44からステップS46の処理が、図14に示すステップS51の処理に置き換わっている点において異なり、他の点については第1実施形態と同一である。
ステップS51において、判定部39は、受信した動作情報が、判定対象の認識情報に対応する操作情報を打ち消す処理を表すか否かを判定する。判定部39は、受信した動作情報が、判定対象の認識情報に対応する操作情報を打ち消す処理を表していない場合(S51のNo)、判定対象の認識情報が誤っていないと判定する。
判定部39は、受信した動作情報が、判定対象の認識情報に対応する操作情報を打ち消す処理を表す場合(S51のYes)、判定対象の認識情報が誤っていると判定する。より具体的には、判定部39は、動作情報が示す機器と操作情報が示す機器とが同一であり、且つ、動作情報が示す動作内容が、操作情報が示す動作内容を打ち消す動作である場合、認識情報が誤っていると判定する。
ここで、打ち消す動作は、例えば、電源ONした動作を、電源OFFにする動作である。また、打ち消す動作は、例えば、テレビジョンの受信チャンネルを元に戻す動作である。また、打ち消す動作は、例えば、エアコンディショナの設定温度を元に戻す動作である。
図15は、最後のレコードの操作情報に示される動作を、最後のレコードの動作情報が打ち消す場合の、蓄積部36に記憶された情報の一例を示す図である。例えば、ユーザが「テレビジョンを点けて」と音声で指示をしたが、操作装置10がエアコンディショナの電源をONにしたとする。ユーザは、エアコンディショナが電源ONとなってしまったので、リモートコントローラを用いてエアコンディショナの電源をOFFにしたとする。
この場合、最後のレコード(レコード番号#1)の操作情報は、機器20がエアコンディショナであり、動作内容が電源ONであることを表す。また、最後のレコードの動作情報は、機器20がエアコンディショナであり、動作内容が電源OFFであることを表す。つまり、動作情報が示す機器と操作情報が示す機器とが同一であり、且つ、動作情報が示す動作内容が、操作情報が示す動作内容を打ち消す動作である。
従って、判定部39は、判定対象の認識情報が誤っていると判定する。そして、訂正部40は、判定対象の認識情報が書き込まれたレコード(レコード番号#1)に、訂正情報を書き込む。
図16は、最後に書き込まれた操作情報に示される動作を、最後のレコードの動作情報が打ち消す場合の、蓄積部36に記憶された情報の一例を示す図である。例えば、ユーザが「テレビジョンを点けて」と音声で指示をしたが、操作装置10がエアコンディショナの電源をONにしたとする。ユーザは、エアコンディショナの電源がONとなってしまったので、リモートコントローラを用いてテレビジョンの電源をONにした後に、リモートコントローラを用いてエアコンディショナの電源をOFFにしたとする。
この場合、最後に書き込まれた操作情報(レコード番号#1の操作情報)は、機器20がエアコンディショナであり、動作内容が電源ONであることを表す。また、最後のレコード(レコード番号#2)の動作情報は、機器20がエアコンディショナであり、動作内容が電源OFFであることを表す。つまり、動作情報が示す機器と、最後に書き込まれた操作情報が示す機器とが同一であり、且つ、動作情報が示す動作内容が、最後に書き込まれた操作情報が示す動作内容を打ち消す動作である。
従って、判定部39は、最後に書き込まれた操作情報に対応する認識情報が誤っていると判定する。そして、訂正部40は、最後に書き込まれた操作情報に対応する認識情報が書き込まれたレコード(レコード番号#1)に、訂正情報を書き込む。
制御部35が誤った認識結果に基づき機器20を制御してしまったため、意図とは異なる誤った機器20が動作してしまったり、意図とは異なる誤った動作をしてしまったりした場合、ユーザは、リモートコントローラ等を用いてその誤りを元に戻す。第1変形例に係る操作装置10は、動作情報に基づき、ユーザがリモートコントローラ等を用いて誤りを元に戻す動作をさせたことを検出することができる。そして、第1変形例に係る操作装置10は、このことを検知した場合に、認識結果が誤っていたと判定することができる。
これにより、第1変形例に係る操作装置10は、ユーザに負担をかけずに認識結果の誤りを検出することができる。
(第2変形例)
つぎに、第1実施形態の第2変形例に係る操作装置10について説明する。第2変形例に係る操作装置10については、図1から図13を参照して説明した第1実施形態との相違点を説明する。
図17は、第1実施形態の第2変形例の判定部39の処理内容を説明するためのタイミングチャートである。判定部39は、動作情報を受信した場合、制御部35が最後に機器20を制御してから一定期間内にその動作情報を受信したか否かを確認する。判定部39は、一定期間内に動作情報を受信した場合に、対応する認識情報が誤っていると判定する。また、判定部39は、一定期間を経過した後に動作情報を受信した場合には、対応する認識情報が誤っていないと判定する。
このような第2変形例に係る操作装置10は、例えば、ユーザが音声等により機器20を制御してから、比較的に短い時間で他の手段で機器20を制御した場合には、音声等による機器20の動作を修正した判断することができる。また、操作装置10は、例えば、ユーザが音声等により機器20を制御してから、一定期間を超えてから他の手段で機器20を制御した場合には、音声等による機器20の動作とは関連の無い操作をしたと判断することができる。
また、判定部39は、制御部35が最後に機器20を制御してから一定期間内にその動作情報を受信したことを、第1実施形態(図9のフローに示す処理)において、認識情報が誤っていると判定する前提条件としてもよい。また、判定部39は、第1実施形態の第1変形例(図14のフローに示す処理)において、認識情報が誤っていると判定する前提条件としてもよい。つまり、判定部39は、操作情報に基づき機器20を制御してから一定時間内に動作情報を受信したことを条件として、認識情報が誤っていると判定してもよい。
(第2実施形態)
つぎに、第2実施形態に係る操作装置60について説明する。第2実施形態に係る操作装置60は、図1に示した第1実施形態に係る操作装置10と略同一の構成および機能を有するので、略同一の機能を有する部材は同一の符号を付けて相違点を説明する。
図18は、第2実施形態に係る操作装置60の構成を機器20とともに示す図である。第2実施形態に係る操作装置60は、受信部38を備えない点において第1実施形態に係る操作装置10と異なる。
第2実施形態に係る判定部39は、連続した2つの操作情報を比較して、先行する操作情報に対応する認識情報が誤っているか否かを判定する。具体的には、判定部39は、操作情報が示す対象の機器20が、直後の操作情報が示す対象の機器20と同一であり、操作情報が示す動作内容を直後の操作情報が示す動作内容が打ち消している場合、対応する認識情報が誤っていると判定する。
図19は、レコード番号#1の操作情報を、直後のレコード番号#2の操作情報が打ち消す場合の、蓄積部36に記憶された情報の一例を示す図である。例えば、ユーザが「テレビジョンを点けて」と音声で指示をしたが、制御部35がエアコンディショナの電源をONにしたとする。意図に反してエアコンディショナが点いてしまったので、ユーザは、続いて「エアコンディショナを消して」と音声で指示をし、制御部35がエアコンディショナの電源をOFFにしたとする。
この場合、最初の音声の操作に応じて、書込部37は、機器20がエアコンディショナであり、動作内容が電源ONであることを表す操作情報をレコード(レコード番号#1)に書き込む。次の操作に応じて、書込部37は、機器20がエアコンディショナであり、動作内容が電源OFFであることを表す操作情報をレコード(レコード番号#2)に書き込む。
つまり、1回目の操作情報が示す対象の機器20が、直後の2回目の操作情報が示す対象の機器20と同一であり、1回目の操作情報が示す動作内容を直後の2回目の操作情報が示す動作内容が打ち消している。従って、判定部39は、1回目の操作情報に対応する認識情報(「エアコンディショナを点けて」)が誤っていると判定する。そして、訂正部40は、判定対象の認識情報が書き込まれたレコード(レコード番号#1)に、訂正情報を書き込む。
制御部35が誤った認識結果に基づき機器20を制御してしまったため、意図とは異なる誤った機器20が動作してしまったり、意図とは異なる誤った動作をしてしまったりした場合、ユーザは、再度、操作装置10を用いて機器20を制御してその誤りを元に戻す。第2実施形態に係る操作装置60は、連続する2つの操作情報を比較することにより、ユーザが操作装置10を用いて誤りを元に戻す動作をさせたことを検出することができる。そして、第2実施形態に係る操作装置60は、このことを検知した場合に、認識結果が誤っていたと判定することができる。
これにより、第2実施形態に係る操作装置60は、ユーザに負担をかけずに認識結果の誤りを検出することができる。
(第3実施形態)
つぎに、第3実施形態に係る操作装置70について説明する。第3実施形態に係る操作装置70は、図1に示した第1実施形態に係る操作装置10と略同一の構成および機能を有するので、略同一の機能を有する部材は同一の符号を付けて相違点を説明する。
図20は、第3実施形態に係る操作装置70の構成を機器20とともに示す図である。第3実施形態に係る操作装置70は、受信部38を備えない点において第1実施形態に係る操作装置10と異なる。また、操作装置70は、合成部71と、対話部72とをさらに備える。
合成部71は、解析部34から出力された操作情報の内容をユーザに提示するための合成信号を生成する。例えば、合成部71は、操作情報の内容を表す音声信号を生成する。また、合成部71は、操作情報の内容を表す画像信号を生成してもよい。
対話部72は、合成信号をユーザに対して出力することにより操作情報の内容をユーザに提示する。そして、対話部72は、操作情報の内容が正しいか否かをユーザに確認させる。例えば、対話部72は、操作情報の内容を表す音声信号をスピーカから出力する。そして、例えば、対話部72は、操作情報の内容が正しい(肯定的)または正しくない(否定的)の何れかの回答結果を、音声で入力する。また、例えば、対話部72は、操作情報の内容を表す画像信号をモニタから出力する。そして、例えば、対話部72は、肯定的または否定的の何れかの回答結果を、ボタン等により入力する。
制御部35は、対話部72を介して操作情報が正しい(肯定的)と回答された場合、操作情報に示される機器20を、操作情報に示される内容で動作するように制御する。また、制御部35は、対話部72を介して操作情報が正しくない(否定的)と回答された場合、何れの機器20も制御しない。
判定部39は、対話部72を介して操作情報が正しくない(否定的)と回答された場合、認識情報が誤っていると判定する。また、判定部39は、対話部72を介して操作情報が正しい(肯定的)と回答された場合、認識情報が誤っていないと判定する。そして、訂正部40は、判定部39により認識情報が誤っていると判定された場合、訂正情報を生成し、判定対象の認識情報に対応させて訂正情報を蓄積部36に書き込む。
図21は、操作情報の内容をユーザが肯定する場合のシーケンスを示す図である。まず、ステップS61において、ユーザが「テレビジョンを点けて」と音声で指示をする。続いて、ステップS62において、認識部33は、「テレビジョンを点けて」という文字列の認識情報を出力する。続いて、ステップS63において、解析部34は、機器20がテレビジョンであり、動作内容が電源ONであることを表す操作情報を出力する。続いて、ステップS64において、合成部71は、操作情報の内容をユーザに確認させるための「テレビジョンを点けますか」という音声信号である合成信号を生成する。続いて、ステップS65において、対話部72は、合成信号をスピーカから出力する。
続いて、ステップS66において、ユーザは、回答をする。ここでは、ユーザは、操作装置70の認識が正しいので、「はい」という肯定的な回答を音声で発する。対話部72は、ユーザからの回答を受信および解釈して、制御部35および判定部39に通知する。続いて、ステップS67において、制御部35は、肯定的な回答を取得したので、操作情報に従って機器20を制御する。
図22は、操作情報の内容をユーザが否定する場合のシーケンスを示す図である。まず、ステップS71において、ユーザが「テレビジョンを点けて」と音声で指示をする。続いて、ステップS72において、認識部33は、誤認識をしたため、「エアコンディショナを点けて」という文字列の認識情報を出力する。続いて、ステップS73において、解析部34は、機器20がエアコンディショナであり、動作内容が電源ONであることを表す操作情報を出力する。続いて、ステップS74において、合成部71は、操作情報の内容をユーザに確認させるための「エアコンディショナを点けますか」という音声信号である合成信号を生成する。続いて、ステップS75において、対話部72は、合成信号をスピーカから出力する。
続いて、ステップS76において、ユーザは、回答をする。ここでは、ユーザは、操作装置70の認識が誤っているので、「いいえ」という否定的な回答を音声で発する。対話部72は、ユーザからの回答を受信および解釈して、制御部35および判定部39に通知する。続いて、ステップS77において、判定部39は、否定的な回答を取得したので、認識情報が誤っていると判定する。続いて、ステップS78において、訂正部40は、訂正情報を生成して、蓄積部36に書き込む。
第3実施形態に係る操作装置70は、操作情報の内容をユーザに提示して、操作情報の内容が正しいか否かを確認してから、機器20を制御する。これにより、操作装置70は、ユーザの意図通りに確実に機器20を制御することができる。さらに、操作装置70は、認識結果が誤っていることを確実に判定することができる。このように、第3実施形態に係る操作装置70は、ユーザに負担をかけずに認識結果の誤りを検出することができる。
図23は、実施形態に係る情報処理装置200のハードウェア構成を示す図である。操作装置10,60,70は、例えば図23に示すようなハードウェア構成の情報処理装置200により実現される。
この情報処理装置200は、CPU(Central Processing Unit)201と、RAM(Random Access Memory)202と、ROM(Read Only Memory)203と、操作入力装置204と、表示装置205と、記憶装置206と、通信装置207と、マイクロフォン208と、カメラ209と、スピーカ210とを備える。そして、これらの各部は、バスにより接続される。
CPU201は、プログラムに従って演算処理および制御処理等を実行するプロセッサである。CPU201は、RAM202の所定領域を作業領域として、ROM203および記憶装置206等に記憶されたプログラムとの協働により各種処理を実行する。
RAM202は、SDRAM(Synchronous Dynamic Random Access Memory)等のメモリである。RAM202は、CPU201の作業領域として機能する。ROM203は、プログラムおよび各種情報を書き換え不可能に記憶するメモリである。
操作入力装置204は、マウスおよびキーボード等の入力デバイスである。操作入力装置204は、ユーザから操作入力された情報を指示信号として受け付け、指示信号をCPU201に出力する。
表示装置205は、LCD(Liquid Crystal Display)等の表示デバイスである。表示装置205は、CPU201からの表示信号に基づいて、各種情報を表示する。
記憶装置206は、フラッシュメモリ等の半導体による記憶媒体、または、磁気的若しくは光学的に記録可能な記憶媒体等にデータを書き込みおよび読み出しをする装置である。記憶装置206は、CPU201からの制御に応じて、記憶媒体にデータの書き込みおよび読み出しをする。通信装置207は、CPU201からの制御に応じて外部の機器とネットワークを介して通信する。
マイクロフォン208は、ユーザから発せられた音声の指示を電気信号に変換する。カメラ209は、ユーザを撮像して、ユーザのジェスチャ等を含む画像信号を生成する。スピーカ210は、合成音声等を出力する。
情報処理装置200で実行されるプログラムは、入力モジュール、認識モジュール、解析モジュール、制御モジュール、書込モジュール、受信モジュール、判定モジュール、訂正モジュールおよび学習モジュールを含むモジュール構成となっている。このプログラムは、CPU201(プロセッサ)によりRAM202上に展開して実行されることにより、情報処理装置200を、入力部31、モデル記憶部32、認識部33、解析部34、制御部35、蓄積部36、書込部37、受信部38、判定部39、訂正部40および学習部41として機能させる。なお、情報処理装置200は、入力部31、認識部33、解析部34、制御部35、書込部37、受信部38、判定部39、訂正部40および学習部41の少なくとも一部をハードウェア回路(例えば半導体集積回路)により実現した構成であってもよい。
また、情報処理装置200で実行されるプログラムは、コンピュータにインストール可能な形式または実行可能な形式のファイルで、CD−ROM、フレキシブルディスク、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、情報処理装置200で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、情報処理装置200で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。また、情報処理装置200で実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。
10 操作装置
20 機器
31 入力部
32 モデル記憶部
33 認識部
34 解析部
35 制御部
36 蓄積部
37 書込部
38 受信部
39 判定部
40 訂正部
41 学習部
51 補助認識部
52 補助解析部
53 一致検出部
60 操作装置
70 操作装置
71 合成部
72 対話部

Claims (17)

  1. 動作させる対象の機器および動作内容を表す指示信号を入力する入力部と、
    前記指示信号を認識処理することにより認識情報を生成する認識部と、
    前記認識情報を解析して、動作させる対象の機器および動作内容を示す操作情報を生成する解析部と、
    前記操作情報に示される機器を、前記操作情報に示される内容で動作するように制御する制御部と、
    前記制御部とは異なる手段に基づき動作した機器および動作内容を示す動作情報を受信する受信部と、
    前記動作情報に基づき、前記認識情報が誤っているか否かを判定する判定部と、
    誤っていると判定された前記認識情報を訂正する訂正情報を生成する訂正部と、
    を備える操作装置。
  2. 前記判定部は、
    前記指示信号を前記認識部とは異なる認識処理をすることにより補助認識情報を生成し、
    前記補助認識情報に基づき、動作させる対象の機器および動作内容を示す補助操作情報を生成し、
    前記補助操作情報と前記動作情報とが一致した場合、前記認識情報が誤っていると判定する
    請求項1に記載の操作装置。
  3. 前記判定部は、前記動作情報が示す機器と前記操作情報が示す機器とが同一であり、且つ、前記動作情報が示す動作内容が、前記操作情報が示す動作内容を打ち消す動作である場合、前記認識情報が誤っていると判定する
    請求項1に記載の操作装置。
  4. 前記認識情報、前記操作情報および前記動作情報を対応付けて記憶する蓄積部と、
    前記制御部が前記操作情報に基づき機器を制御した場合、前記操作情報および前記認識情報を対応付けて前記蓄積部に書き込む書込部と、
    をさらに備え、
    前記受信部は、
    受信した前記動作情報を、最後に書き込まれた前記操作情報および前記認識情報に対応付けて前記蓄積部に書き込み、
    最後に書き込まれた前記操作情報および前記認識情報に対応付けて他の前記動作情報が既に書き込まれている場合、受信した前記動作情報を、何れの前記操作情報および前記認識情報にも対応付けずに前記蓄積部に書き込む
    請求項1から3の何れか1項に記載の操作装置。
  5. 前記判定部は、
    受信した前記動作情報に対応する前記認識情報が前記蓄積部に記憶されている場合、受信した前記動作情報に基づき、対応して記憶されている前記認識情報が誤っているか否かを判定し、
    受信した前記動作情報に対応する前記認識情報が前記蓄積部に記憶されていない場合、前記訂正情報が記憶されていないことを条件として、受信した前記動作情報に基づき、最後に書き込まれた前記認識情報が誤っているか否かを判定する
    請求項4に記載の操作装置。
  6. 前記判定部は、前記操作情報に基づき機器を制御してから一定時間内に前記動作情報を受信したことを条件として、前記認識情報が誤っていると判定する
    請求項1から5の何れか1項に記載の操作装置。
  7. 前記訂正部は、前記判定部により生成した前記補助認識情報を前記訂正情報とする
    請求項2に記載の操作装置。
  8. 前記訂正部は、前記認識部とは異なるモデルを用いて、前記指示信号を認識処理することにより前記訂正情報を生成する
    請求項1から6の何れか1項に記載の操作装置。
  9. 前記訂正部は、前記認識部と同一のモデルを用い、前記認識部とは異なるアルゴリズムで、前記指示信号を認識処理することにより前記訂正情報を生成する
    請求項1から6の何れか1項に記載の操作装置。
  10. 前記訂正部は、クラウドソーシングを用いて不特定人が前記指示信号を認識した情報を用いて前記訂正情報を生成する
    請求項1から6の何れか1項に記載の操作装置。
  11. 前記訂正部は、前記認識部により生成された第2候補以降の前記認識情報を前記訂正情報とする
    請求項1から6の何れか1項に記載の操作装置。
  12. 前記指示信号は、音声信号である
    請求項1から11の何れか1項に記載の操作装置。
  13. 動作させる対象の機器および動作内容を表す指示信号を入力する入力部と、
    前記指示信号を認識処理することにより認識情報を生成する認識部と、
    前記認識情報を解析して、動作させる対象の機器および動作内容を示す操作情報を生成する解析部と、
    前記操作情報に示される機器を、前記操作情報に示される内容で動作するように制御する制御部と、
    前記操作情報を打ち消す情報を取得した場合、前記認識情報が誤っていると判定する判定部と、
    誤っていると判定された前記認識情報を訂正する訂正情報を生成する訂正部と、
    を備える操作装置。
  14. 前記判定部は、前記操作情報が示す対象の機器が、直後の前記操作情報が示す対象の機器と同一であり、前記操作情報が示す動作内容を直後の前記操作情報が示す動作内容が打ち消している場合、対応する前記認識情報が誤っていると判定する
    請求項13に記載の操作装置。
  15. 前記操作情報の内容をユーザに提示して正しいか否かを確認させる対話部をさらに備え、
    前記制御部は、前記操作情報が正しいと回答された場合、前記操作情報に示される機器を、前記操作情報に示される内容で動作するように制御し、
    前記判定部は、前記操作情報が正しくないと回答された場合、前記認識情報が誤っていると判定する
    請求項13に記載の操作装置。
  16. 動作させる対象の機器および動作内容を表す指示信号を入力する入力ステップと、
    前記指示信号を認識処理することにより認識情報を生成する認識ステップと、
    前記認識情報を解析して、動作させる対象の機器および動作内容を示す操作情報を生成する解析ステップと、
    前記操作情報に示される機器を、前記操作情報に示される内容で動作するように制御する制御ステップと、
    異なる手段に基づき動作した機器および動作内容を示す動作情報を受信する受信ステップと、
    前記動作情報に基づき、前記認識情報が誤っているか否かを判定する判定ステップと、
    誤っていると判定された前記認識情報を訂正する訂正情報を生成する訂正ステップと、
    を備える訂正方法。
  17. 情報処理装置を操作装置として機能させるためのプログラムであって、
    前記情報処理装置を、
    動作させる対象の機器および動作内容を表す指示信号を入力する入力部と、
    前記指示信号を認識処理することにより認識情報を生成する認識部と、
    前記認識情報を解析して、動作させる対象の機器および動作内容を示す操作情報を生成する解析部と、
    前記操作情報に示される機器を、前記操作情報に示される内容で動作するように制御する制御部と、
    前記制御部とは異なる手段に基づき動作した機器および動作内容を示す動作情報を受信する受信部と、
    前記動作情報に基づき、前記認識情報が誤っているか否かを判定する判定部と、
    誤っていると判定された前記認識情報を訂正する訂正情報を生成する訂正部と、
    して機能させるプログラム。
JP2015174759A 2015-09-04 2015-09-04 操作装置、訂正方法およびプログラム Expired - Fee Related JP6548994B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015174759A JP6548994B2 (ja) 2015-09-04 2015-09-04 操作装置、訂正方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015174759A JP6548994B2 (ja) 2015-09-04 2015-09-04 操作装置、訂正方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2017049537A true JP2017049537A (ja) 2017-03-09
JP6548994B2 JP6548994B2 (ja) 2019-07-24

Family

ID=58278352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015174759A Expired - Fee Related JP6548994B2 (ja) 2015-09-04 2015-09-04 操作装置、訂正方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6548994B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020149053A (ja) * 2019-03-11 2020-09-17 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド トレーニングコーパスの生成方法、装置、機器及び記憶媒体
JP2021501912A (ja) * 2017-11-02 2021-01-21 華為技術有限公司Huawei Technologies Co.,Ltd. フィルタリングモデル訓練方法および音声認識方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683388A (ja) * 1992-09-04 1994-03-25 Fujitsu Ten Ltd 音声認識装置
JP2001236091A (ja) * 2000-02-23 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> 音声認識結果の誤り訂正方法およびその装置
JP2005055827A (ja) * 2003-08-07 2005-03-03 Denso Corp 音声認識装置、及び音声認識方法
JP2006058479A (ja) * 2004-08-18 2006-03-02 Matsushita Electric Works Ltd 音声認識機能付制御装置
JP2009109585A (ja) * 2007-10-26 2009-05-21 Panasonic Electric Works Co Ltd 音声認識制御装置
JP2009116277A (ja) * 2007-11-09 2009-05-28 Panasonic Electric Works Co Ltd 音声認識装置
JP2010204172A (ja) * 2009-02-27 2010-09-16 Xanavi Informatics Corp 音声認識装置および音声認識方法
JP2014510309A (ja) * 2011-03-04 2014-04-24 クゥアルコム・インコーポレイテッド 環境音を認識するためのシステムおよび方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683388A (ja) * 1992-09-04 1994-03-25 Fujitsu Ten Ltd 音声認識装置
JP2001236091A (ja) * 2000-02-23 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> 音声認識結果の誤り訂正方法およびその装置
JP2005055827A (ja) * 2003-08-07 2005-03-03 Denso Corp 音声認識装置、及び音声認識方法
JP2006058479A (ja) * 2004-08-18 2006-03-02 Matsushita Electric Works Ltd 音声認識機能付制御装置
JP2009109585A (ja) * 2007-10-26 2009-05-21 Panasonic Electric Works Co Ltd 音声認識制御装置
JP2009116277A (ja) * 2007-11-09 2009-05-28 Panasonic Electric Works Co Ltd 音声認識装置
JP2010204172A (ja) * 2009-02-27 2010-09-16 Xanavi Informatics Corp 音声認識装置および音声認識方法
JP2014510309A (ja) * 2011-03-04 2014-04-24 クゥアルコム・インコーポレイテッド 環境音を認識するためのシステムおよび方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021501912A (ja) * 2017-11-02 2021-01-21 華為技術有限公司Huawei Technologies Co.,Ltd. フィルタリングモデル訓練方法および音声認識方法
US11211052B2 (en) 2017-11-02 2021-12-28 Huawei Technologies Co., Ltd. Filtering model training method and speech recognition method
JP7034279B2 (ja) 2017-11-02 2022-03-11 華為技術有限公司 フィルタリングモデル訓練方法および音声認識方法
JP2020149053A (ja) * 2019-03-11 2020-09-17 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド トレーニングコーパスの生成方法、装置、機器及び記憶媒体
KR20200108775A (ko) * 2019-03-11 2020-09-21 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 트레이닝 말뭉치를 생성하는 방법, 장치, 기기 및 저장 매체
KR102345156B1 (ko) * 2019-03-11 2021-12-29 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 트레이닝 말뭉치를 생성하는 방법, 장치, 기기 및 저장 매체
US11348571B2 (en) 2019-03-11 2022-05-31 Beijing Baidu Netcom Science And Technology Co., Ltd. Methods, computing devices, and storage media for generating training corpus

Also Published As

Publication number Publication date
JP6548994B2 (ja) 2019-07-24

Similar Documents

Publication Publication Date Title
JP6465077B2 (ja) 音声対話装置および音声対話方法
JP6635049B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6654611B2 (ja) 成長型対話装置
US20230039067A1 (en) Portable terminal device and information processing system
US20180182396A1 (en) Multi-speaker speech recognition correction system
JP6754184B2 (ja) 音声認識装置及び音声認識方法
EP3701521B1 (en) Voice recognition apparatus and operation method thereof cross-reference to related application
US10970678B2 (en) Conference information accumulating apparatus, method, and computer program product
CN106537492B (zh) 具有用于语音识别的校正策略的机动车操作装置
JP7143916B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2009192942A (ja) 音声対話装置及び支援方法
US8326597B2 (en) Translation apparatus, method, and computer program product for detecting language discrepancy
JP2011002656A (ja) 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム
US20180217985A1 (en) Control method of translation device, translation device, and non-transitory computer-readable recording medium storing a program
CN108498102B (zh) 康复训练方法及装置、存储介质、电子设备
JP2015153325A (ja) 情報処理装置、操作支援方法及び操作支援プログラム
KR20220037819A (ko) 복수의 기동어를 인식하는 인공 지능 장치 및 그 방법
JP6548994B2 (ja) 操作装置、訂正方法およびプログラム
US20140297257A1 (en) Motion sensor-based portable automatic interpretation apparatus and control method thereof
JP2020030458A (ja) 推論装置、学習方法、プログラム及び学習済みモデル
CN111862959B (zh) 发音错误检测方法、装置、电子设备及存储介质
US11430429B2 (en) Information processing apparatus and information processing method
US20210064640A1 (en) Information processing apparatus and information processing method
JP6886663B2 (ja) 動作指示生成システム、方法およびプログラム
WO2014162356A1 (ja) 言語リハビリテーション支援システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190626

R150 Certificate of patent or registration of utility model

Ref document number: 6548994

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees