JP7473002B2

JP7473002B2 - 情報処理装置及び情報処理方法

Info

Publication number: JP7473002B2
Application number: JP2022557209A
Authority: JP
Inventors: 祐介森田; 友和古屋
Original assignee: Nissan Motor Co Ltd
Current assignee: Nissan Motor Co Ltd
Priority date: 2020-10-22
Filing date: 2020-10-22
Publication date: 2024-04-23
Anticipated expiration: 2040-10-22
Also published as: US20230377578A1; EP4234338A1; JPWO2022084708A1; EP4234338A4; CN116323324A; WO2022084708A1

Description

本発明は、情報処理装置及び情報処理方法に関する。

車両の運転者の音声を認識し、認識結果に基づいて車載機器のうちの１つを操作対象機器とし、操作対象機器に対する操作入力の受け付けを許可し、運転者による制御指示を認識して当該制御指示を操作対象機器に送信する発明が知られている（特許文献１）。

特開２０１７－１５９６９２号公報

特許文献１に記載された発明は、運転者の音声を認識した結果に基づいて操作対象機器を特定しており、操作対象機器を一意に特定できない場合には誤操作が生じるおそれがあるという課題がある。

本発明は、上記問題に鑑みてなされたものであり、その目的とするところは、操作対象機器を一意に特定して操作対象機器の誤操作が生じる可能性を低減することができる情報処理装置及び情報処理方法を提供することにある。

本発明の一態様に係る情報処理装置及び情報処理方法は、ユーザの視線方向に関する視線データを記憶し、音声データを取得した際、記憶された視線データに基づいて、複数の機器から操作対象機器を特定し、音声データに基づいて操作対象機器に対する制御コマンドを生成し、操作対象機器を制御する。

本発明によれば、操作対象機器を一意に特定して操作対象機器の誤操作が生じる可能性を低減することができる。

図１は、本発明の一実施形態に係る情報処理装置の構成を示すブロック図である。図２は、本発明の一実施形態に係る情報処理装置の処理を示すフローチャートである。

以下、本発明の実施形態について、図面を参照して説明する。図面の記載において同一部分には同一符号を付して説明を省略する。

［情報処理装置の構成］
図１を参照して、本実施形態に係る情報処理装置１の構成例を説明する。情報処理装置１は一例として車両に搭載される。図１に示すように情報処理装置１は、視線データ受付部２１と、音声データ受付部２２と、コントローラ１００とを備える。その他、情報処理装置１は、記憶部２５と、報知部３００とを備えるものであってもよい。

視線データ受付部２１は、視線検知装置１１及びコントローラ１００と接続され、視線検知装置１１からユーザの視線方向に関する視線データを取得する（又は受け付ける）。例えば、ユーザは車両に乗車している乗員である。視線検知装置１１は、図示しないカメラから入力される画像データに対して、例えば、ユーザの顔や眼球を検知対象物とした特徴量算出および形状判別等の認識処理を行い、認識した検知対象物に基づき、ユーザの視線方向（視線ベクトル）を算出する。

視線検知装置１１によって算出された視線方向に関する情報を含む視線データは、視線データ受付部２１に入力される。なお、視線データには、ユーザが当該視線方向を見ている時刻、ユーザが当該視線方向を見ている頻度、ユーザが当該視線方向を見ている時間などの情報が含まれていてもよい。

視線データ受付部２１は、視線検知装置１１から取得した視線データをコントローラ１００に送信する。その他、視線データ受付部２１は、取得した視線データを後述する記憶部２５に送信するものであってもよい。

音声データ受付部２２は、音声認識装置１２及びコントローラ１００と接続され、音声認識装置１２から音声データを取得する（又は受け付ける）。ここで、音声認識装置１２は、図示しないマイクから入力されるユーザの音声に対して、周波数分析などの周知の技術を適用して音声の認識処理を行い、当該音声に対応するテキストデータを音声データとして算出する。

音声認識装置１２によって算出された音声データは、音声データ受付部２２に入力される。なお、音声データには、当該音声データの算出に用いた音声を取得した時刻の情報が含まれていてもよい。

音声データ受付部２２は、音声認識装置１２から取得した音声データをコントローラ１００に送信する。その他、音声データ受付部２２は、取得した音声データを後述する記憶部２５に送信するものであってもよい。

記憶部２５は、コントローラ１００と接続され、視線データ受付部２１によって取得した視線データ、音声データ受付部２２によって取得した音声データを記憶する。記憶部２５は、取得したデータ（視線データ、音声データ）を、所定時間の間、記憶するものであってもよい。すなわち、記憶されたデータは、記憶されてから所定時間の間、記憶部２５によって保持され、記憶されてから所定時間が経過した後には、削除されるものであってもよい。

コントローラ１００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、メモリ、記憶装置、入出力部などを備える汎用のコンピュータである。コントローラ１００は、情報処理装置１による制御対象である機器群４００と接続される。

ここで、機器群４００は、複数の機器であって、例えば、ナビゲーション機器、ドアのロック制御機器、ウィンドウの開閉制御機器、撮像画像の表示機器、計器表示機器、空調装置、サンルーフ、サンシェード、オーディオ装置などである。機器群４００のうち操作対象機器として特定された一の機器が、コントローラ１００からの信号により制御される。例えば、機器群４００は車両に搭載された複数の機器である。

コントローラ１００には、情報処理装置１として機能させるためのコンピュータプログラムがインストールされている。コンピュータプログラムを実行することにより、コントローラ１００は情報処理装置１が備える複数の情報処理回路として機能する。

なお、ここでは、ソフトウェアによって情報処理装置１が備える複数の情報処理回路を実現する例を示すが、もちろん、以下に示す各情報処理を実行するための専用のハードウェアを用意して情報処理回路を構成することも可能である。また、複数の情報処理回路を個別のハードウェアにより構成してもよい。

コントローラ１００は、複数の情報処理回路として、機器特定部１１０と、制御コマンド生成部１２０と、送信部１３０とを備える。

機器特定部１１０は、視線データに基づいて、複数の機器である機器群４００のうち少なくとも１つの機器を操作対象機器として特定する。より具体的には、機器特定部１１０は、視線データを参照して、視線方向に位置する機器を操作対象機器として特定するものであってもよい。なお、視線データに基づいて、複数の機器である機器群４００から複数の操作対象機器を特定する構成であってもよい。

また、機器特定部１１０は、所定期間内における視線データを参照して、機器群４００のそれぞれの機器に対して頻度を算出し、算出した頻度に基づいて操作対象機器として特定するものであってもよい。ここで、機器ごとに算出される「頻度」とは、所定期間内において当該機器に対して視線方向が向いていた回数を意味する。この場合、算出した「頻度」が最も高い機器を操作対象機器として特定するものであってもよい。

機器特定部１１０は、所定期間内における視線データを参照して、機器群４００のそれぞれの機器に対して「停留時間」を算出し、算出した「停留時間」に基づいて操作対象機器として特定するものであってもよい。ここで、機器ごとに算出される「停留時間」とは、所定期間内において当該機器に対して視線方向が連続して向いていた時間を意味する。この場合、算出した「停留時間」が所定の閾値（例えば、２～５秒）よりも長い機器を操作対象機器として特定するものであってもよいし、算出した「停留時間」が最も長い機器を操作対象機器として特定するものであってもよい。

その他、機器特定部１１０による操作対象機器の特定の処理と、音声データ受付部２２による音声データの取得（受け付け）の処理は、順不同である。すなわち、操作対象機器が特定されてから音声データを取得してもよいし、音声データを取得してから操作対象機器の特定を行ってもよい。

音声データを取得してから操作対象機器の特定を行う場合、機器特定部１１０は、音声データが入力されたタイミングの視線方向に基づいて、操作対象機器を特定するものであってもよいし、音声データが入力されたタイミングよりも過去（例えば、音声データが入力されたタイミングを基準として当該タイミングから所定時間の過去）の視線方向に基づいて、操作対象機器を特定するものであってもよい。

具体的には、機器特定部１１０は、音声データに含まれる時刻の情報を参照し、当該時刻又は当該時刻よりも過去の時刻に対応する視線データを記憶部２５から取得し、取得した視線データに基づいて、操作対象機器を特定するものであってもよい。

機器特定部１１０は、所定のタイミングにおける視線方向に基づいて操作対象機器を特定することができたか否かを判定し、操作対象機器を特定することができないと判定した場合に、当該タイミングよりも過去の視線方向に基づいて操作対象機器を特定するものであってもよい。

具体的には、機器特定部１１０は、ある視線データに基づいて操作対象機器を特定することができないと判定した場合に、当該視線データに含まれる時刻の情報を参照し、当該時刻よりも過去の時刻に対応する視線データを記憶部２５から取得し、取得した視線データに基づいて、操作対象機器を特定するものであってもよい。

機器特定部１１０が、操作対象機器を特定することができないと判定する場合の例としては、例えば、ある視線データに含まれる視線方向に基づいて、操作対象機器として特定されうる機器が複数存在し、機器群４００の中から操作対象機器を一意に特定できない場合が挙げられる。例えば、視線方向が、隣接する複数の機器の境界付近を向いている場合に生じうる。

このような場合には、隣接する複数の機器のいずれの機器を操作対象機器として特定すべきか精度よく決定できないおそれがある。そこで、機器特定部１１０は、当該当該視線データに含まれる時刻の情報を参照し、当該時刻よりも過去の時刻に対応する視線データを記憶部２５から取得し、取得した視線データに基づいて、操作対象機器を特定するものであってもよい。

上記の説明では、視線方向に機器そのものが存在する場合を想定して説明した。その他にも、機器特定部１１０は、視線方向に機器そのものが存在しない場合であっても、視線方向に所定の画像やアイコンが存在する場合に、視線方向に位置するアイコンに対応付けられた機器やサービスを、操作対象機器あるいは操作対象サービスとして特定するものであってもよい。

また、視線方向に機器、画像やアイコンが無い場合であっても、視線方向によって特定されるエリアに予め対応付けられている操作対象機器がある場合に、操作対象機器を特定するようにしてもよい。例えば、車外前方エリアに対して、車両前方に搭載された車載カメラが予め対応付けられており、視線方向が車外前方エリア内にある場合、当該車載カメラが特定されることになる。

制御コマンド生成部１２０は、音声データに基づいて、操作対象機器に対する制御コマンドを生成する。ここで生成される制御コマンドとは、例えば、操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、操作対象機器のロックの解除、もしくは、施錠などであり、制御コマンドは、操作対象機器に応じて事前に定められる。

また、制御コマンドに対応付けられる音声データも事前に定められるものであって、例えば、音声データは、操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、操作対象機器のロックの解除、もしくは、施錠のうち少なくとも１つの操作を指示するデータである。また、１つの制御コマンドに複数の音声データが対応付けられていても良い。この場合の例として、拡大という制御コマンドに対して、拡大して、大きくして、など複数の音声データが対応付けられる。

例えば、操作対象機器がナビゲーション機器である場合、制御コマンドは、ナビゲーション機器に表示される画像の「拡大」、「縮小」、「回転」、「移動」などである。制御コマンドに対応して、音声データは、「大きく」、「小さく」、「（時計回り／反時計周りに）回転」、「上／下／左／右」などである。

例えば、操作対象機器がドアのロック制御機器である場合、制御コマンドは、「ロック」、「ロック解除」などである。制御コマンドに対応して、音声データは、「閉める」、「開ける」などである。

なお、制御コマンド生成部１２０は、音声データに基づいて制御コマンドを生成できない場合に、操作対象機器の解除を行うものであってもよい。ここで「解除」とは、機器特定部１１０によって特定された操作対象機器について、操作対象機器ではないものとして取り扱うことを意味し、機器群４００のうちいずれの機器も、操作対象機器として特定されていない状態に戻すことを意味する。

送信部１３０は、制御コマンド生成部１２０によって生成された制御コマンドを、機器特定部１１０によって特定された操作対象機器に送信する。送信部１３０は、制御コマンドを操作対象機器に送信した後、操作対象機器の解除を行うものであってもよい。

その他、報知部３００は、音声又は光による報知を行う。より具体的には、音声データを取得中（又は受け付け中）であることをユーザに報知するものであってもよい。例えば、報知部３００は、受付中であることをビープ音などで報知するものであってもよいし、スピーカを介して特定された操作対象機器の名前を音声で読み上げることで報知を行うものであってもよい。その他、報知部３００は、機器群４００のそれぞれに備えられたランプ、ディスプレイなどを介して、点滅動作などの光の変化によってユーザに報知を行うものであってもよい。

［情報処理装置の処理手順］
次に、本実施形態に係る情報処理装置１の処理手順を、図２のフローチャートを参照して説明する。図２に示す情報処理装置１の処理は、所定の周期で繰り返し実行されるものであってもよいし、車両が走行中である場合にのみ実行されるものであってもよい。

なお、図２のフローチャートで示される処理の実行と並行して、視線データの取得（又は受け付け）、及び、音声データの取得（又は受け付け）が実行されてもよい。

まず、ステップＳ１０１において、音声データ受付部２２は音声データを取得し（又は受け付け）、その後、ステップＳ１０３において、コントローラ１００は、音声データが入力されたか否かを判定する。

音声データが入力されていないと判定された場合（ステップＳ１０３でＮＯの場合）には、ステップＳ１０１に戻る。

一方、音声データが入力されたと判定された場合（ステップＳ１０３でＹＥＳの場合）には、ステップＳ１０５において、コントローラ１００は、記憶部２５を参照し、記憶された視線データが存在するか否かを判定する。なお、記憶部２５には、視線データ受付部２１が取得した視線データが随時、記憶されているものとする。

記憶された視線データが存在しないと判定された場合（ステップＳ１０５でＮＯの場合）には、図２の処理を終了する。

一方、記憶された視線データが存在すると判定された場合（ステップＳ１０５でＹＥＳの場合）には、ステップＳ１０７にて、機器特定部１１０は、記憶された視線データのうち一の視線データに基づいて、複数の機器である機器群４００のうち少なくとも１つの機器を操作対象機器として特定できるかを試みる。あるいは、Ｓ１０１において入力された音声データと、記憶された視線データの双方に基づいて、操作対象機器を特定するようにしてもよい。ステップＳ１０９において、機器特定部１１０は、操作対象機器を特定できたか否かを判定する。

操作対象機器を特定できなかったと判定された場合（ステップＳ１０９でＮＯの場合）には、ステップＳ１０５に戻る。なお、ステップＳ１０５の処理を繰り返す際、コントローラ１００は、操作対象機器を特定できなかった一の視線データを対象外として、その他の記憶された視線データが存在するか否かを判定する。

操作対象機器を特定できたと判定された場合（ステップＳ１０９でＹＥＳの場合）には、ステップＳ１１１において、制御コマンド生成部１２０は、Ｓ１０１において入力された音声データと、Ｓ１０９において特定された操作対象機器に基づいて、操作対象機器に対する制御コマンドを生成する。そして、ステップＳ１１３において、送信部１３０は、生成された制御コマンドを操作対象機器に送信する。その後、図２の処理を終了する。

なお、上記構成においては、操作対象機器に対して制御コマンドを生成する場合、常に視線データに基づいて操作対象機器を特定する構成を例示したが、これに限られない。

例えば、Ｓ１０３において、音声データが入力された場合、音声データから操作対象機器の特定および操作対象機器に対する制御コマンドの生成が可能か否か判定し、（１）入力された音声データに基づいて操作対象機器の特定および操作対象機器に対する制御コマンドの生成が可能な場合には、Ｓ１１３へ進み、操作対象機器に対して制御コマンドを送信し、（２）入力された音声データに基づいて操作対象機器の特定および操作対象機器に対する制御コマンドの生成が不可能な場合には、Ｓ１０５以降のステップに進む構成としてもよい。この場合、音声データによって操作対象機器の特定または操作対象機器に対する制御コマンドの生成ができない場合、視線データに基づいて操作対象機器が特定されることとなる。

［実施形態の効果］
以上詳細に説明したように、本実施形態に係る情報処理装置及び情報処理方法は、ユーザの視線方向に関する視線データを記憶し、音声データを取得した際、記憶された視線データに基づいて、複数の機器から操作対象機器を特定し、音声データに基づいて操作対象機器に対する制御コマンドを生成し、制御コマンドを操作対象機器に送信する。

これにより、操作対象機器を一意に特定して操作対象機器の誤操作が生じる可能性を低減することができる。また、視線データに基づいて操作対象機器を特定するため、ユーザが音声によって操作対象機器を指定する必要がなく、ユーザの発話を短くすることができる。その結果、ユーザの利便性を向上させることができる。

また、視線データを用いて操作対象機器を特定するため、音声データのみに基づいて操作を行う場合と比較して、音声認識において操作対象機器を特定するために必要な計算コストを削減することができる。また、音声認識における認識エラーが防止され、誤操作が生じる可能性を低減することができる。

また、ユーザは、操作対象である機器を視認し、当該機器に対する音声を発話するのみで、当該機器を操作できるため、機器の操作ボタンの位置や配置を覚える必要がない。さらには、機器の操作ボタンに触れるためにユーザが上腕・手先を動かす必要がなくなる。その結果、操作の煩雑さを低減することができる。

操作対象機器の特定、及び、ユーザの発話を短くすることについて、例を挙げて説明する。例えば、機器群４００が「オーディオ機器」及び「空調装置」を含んでいる場合、「上げる」「下げる」という音声のみでは、いずれの機器を操作するか特定することができない。

しかしながら、ユーザが「上げる」「下げる」という音声を発する前に「オーディオ機器」を視認していた場合、「オーディオ機器」が操作対象機器として特定され、「オーディオ機器の音量を上げる」「オーディオ機器の音量を下げる」という制御コマンドが生成されることになる。その結果、「オーディオ機器」を音声で指定しない場合であっても、「空調装置」に対して操作が行われることがない。よって、誤操作が生じる可能性を低減することができる。

逆に、ユーザが「上げる」「下げる」という音声を発する前に「空調装置」を視認していた場合、「空調装置」が操作対象機器として特定され、「空調装置の音量を上げる」「空調装置の音量を下げる」という制御コマンドが生成されることになる。その結果、「空調装置」を音声で指定しない場合であっても、「オーディオ機器」に対して操作が行われることがない。よって、誤操作が生じる可能性を低減することができる。

その他にも、例えば、機器群４００が「ナビゲーション機器」、「撮像画像の表示機器」、「計器表示機器」を含んでいる場合、「拡大」「縮小」「回転」「移動」という音声のみでは、いずれの機器を操作するか特定することができない。この場合においても、ユーザが「拡大」「縮小」「回転」「移動」という音声を発する前に、操作したい機器を視認することで、視認した機器が操作対象機器として特定され、音声に対応した制御コマンドが生成されることになる。よって、誤操作が生じる可能性を低減することができる。

また、本実施形態に係る情報処理装置及び情報処理方法は、音声データが入力されたタイミングの視線方向に基づいて、操作対象機器を特定するものであってもよい。これにより、ユーザは発話のタイミングで操作対象である機器を視認するだけで、操作対象機器を指定することができる。その結果、操作の煩雑さを低減することができる。

さらに、本実施形態に係る情報処理装置及び情報処理方法は、音声データが入力されたタイミングよりも過去の視線方向に基づいて、操作対象機器を特定するものであってもよい。これにより、ユーザは発話する直前に操作対象である機器を視認するだけで、操作対象機器を指定することができる。その結果、操作の煩雑さを低減することができる。

また、本実施形態に係る情報処理装置及び情報処理方法は、音声データが入力されたタイミングよりも所定時間だけ過去の視線方向に基づいて、操作対象機器を特定するものであってもよい。これにより、ユーザは発話する直前に操作対象である機器を視認するだけで、操作対象機器を指定することができる。その結果、操作の煩雑さを低減することができる。特に、発話のタイミングよりも所定時間の間におけるユーザによる視認のみを対象とした処理が行われ、誤操作が生じる可能性を低減することができる。

さらに、本実施形態に係る情報処理装置及び情報処理方法は、音声データが入力されたタイミングの視線方向に基づいて、操作対象機器を特定することができないと判定された場合に、音声データが入力されたタイミングよりも過去の視線方向に基づいて、操作対象機器を特定するものであってもよい。これにより、ユーザは操作対象である機器を視認するのと同時に当該機器に対する操作内容を発話する必要がなく、操作の煩雑さを低減することができる。

また、本実施形態に係る情報処理装置及び情報処理方法は、視線方向に基づいて操作対象機器として特定されうる機器が複数存在すると判定された場合に、視線方向よりも過去のタイミングにおける視線方向に基づいて、操作対象機器を特定するものであってもよい。これにより、ユーザが様々な視認方向を向く中、操作対象機器を一意に特定できる視認方向を向いている場合を検知して操作対象機器を特定できる。その結果、ユーザは特定の視認方向を凝視する必要がない。また、操作の煩雑さを低減することができる。

さらに、本実施形態に係る情報処理装置及び情報処理方法は、音声データに基づいて複数の機器から操作対象機器を特定できない場合に、視線データに基づいて操作対象機器を特定するものであってもよい。これにより、操作対象機器を特定する可能性が高まり、操作の煩雑さを低減することができる。

さらに、本実施形態に係る情報処理装置及び情報処理方法は、視線方向に位置する機器を操作対象機器として特定するものであってもよい。これにより、ユーザは操作対象である機器を視認するだけで、操作対象機器を指定することができる。その結果、操作の煩雑さを低減することができる。

また、本実施形態に係る情報処理装置及び情報処理方法は、機器が視線方向に位置する頻度を算出し、当該頻度に基づいて、機器を操作対象機器として特定するものであってもよい。これにより、ユーザが意図をもって操作対象である機器を視認する場合を検知できる。その結果、誤操作が生じる可能性を低減することができ、さらには、操作の煩雑さを低減することができる。

さらに、本実施形態に係る情報処理装置及び情報処理方法は、機器が視線方向に位置する時間を算出し、当該時間に基づいて、機器を操作対象機器として特定するものであってもよい。これにより、ユーザが意図をもって操作対象である機器を視認する場合を検知できる。その結果、誤操作が生じる可能性を低減することができ、さらには、操作の煩雑さを低減することができる。

また、本実施形態に係る情報処理装置及び情報処理方法において、機器は、ナビゲーション機器、ドアのロック制御機器、ウィンドウの開閉制御機器、撮像画像の表示機器、計器表示機器、空調装置、サンルーフ、サンシェード、オーディオ装置のうち少なくともいずれか１つを含むものであってもよい。

ユーザは、これらの機器のうち、操作対象である機器を視認し、当該機器に対する音声を発話するのみで、当該機器を操作できるため、機器の操作ボタンの位置や配置を覚える必要がない。さらには、機器の操作ボタンに触れるためにユーザが上腕・手先を動かす必要がなくなる。その結果、操作の煩雑さを低減することができる。

さらに、本実施形態に係る情報処理装置及び情報処理方法において、制御コマンドは、操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、操作対象機器のロックの解除、もしくは、施錠であるものであってもよい。音声データに基づいて、操作対象機器に対応した制御コマンドが自動的に生成されるため、ユーザの利便性を向上させることができる。

また、本実施形態に係る情報処理装置及び情報処理方法は、音声データは、操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、操作対象機器のロックの解除、もしくは、施錠のうち少なくともいずれか１つを指示するデータであるものであってもよい。操作対象機器に対応した音声データを用いて制御コマンドが生成されるため、操作対象機器が特定された状態において、ユーザが音声によって操作対象機器を指定する必要がなく、ユーザの発話を短くすることができる。その結果、ユーザの利便性を向上させることができる。

上述の実施形態で示した各機能は、１又は複数の処理回路によって実装されうる。処理回路には、プログラムされたプロセッサや、電気回路などが含まれ、さらには、特定用途向けの集積回路（ＡＳＩＣ）のような装置や、記載された機能を実行するよう配置された回路構成要素なども含まれる。

以上、実施形態に沿って本発明の内容を説明したが、本発明はこれらの記載に限定されるものではなく、種々の変形及び改良が可能であることは、当業者には自明である。この開示の一部をなす論述及び図面は本発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施形態、実施例及び運用技術が明らかとなろう。

本発明はここでは記載していない様々な実施形態等を含むことは勿論である。したがって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。

１情報処理装置
１１視線検知装置
１２音声認識装置
２１視線データ受付部
２２音声データ受付部
２５記憶部
１００コントローラ
１１０機器特定部
１２０制御コマンド生成部
１３０送信部
３００報知部
４００機器群

Claims

視線データ受付部によって取得した、ユーザの視線方向に関する視線データを記憶する記憶装置と、
音声データが入力される音声データ受付部と、
コントローラと、を備え、
前記コントローラは、
前記音声データを取得した際、前記音声データに基づいて操作対象機器を特定できない場合に、前記視線データに基づいて前記操作対象機器を特定し、
前記音声データに基づいて前記操作対象機器に対する制御コマンドを生成し、
前記制御コマンドを前記操作対象機器に送信すること
を特徴とする情報処理装置。
請求項１に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングの前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。
請求項１又は２に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングよりも過去の前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。
請求項３に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングよりも所定時間だけ過去の前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。
請求項１～４のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングの前記視線方向に基づいて、前記操作対象機器を特定することができないと判定された場合に、前記音声データが入力されたタイミングよりも過去の前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。
請求項５に記載の情報処理装置であって、
前記コントローラは、
前記視線方向に基づいて前記操作対象機器として特定されうる機器が複数存在すると判定された場合に、前記視線方向よりも過去のタイミングにおける前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。
請求項１～６のいずれか一項に記載の情報処理装置であって、
前記コントローラは、複数の機器から前記操作対象機器を特定すること
を特徴とする情報処理装置。
請求項１～７のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
前記視線方向に位置する機器を前記操作対象機器として特定すること
を特徴とする情報処理装置。
請求項１～８のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
機器が前記視線方向に位置する頻度を算出し、
前記頻度に基づいて、前記機器を前記操作対象機器として特定すること
を特徴とする情報処理装置。
請求項１～９のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
機器が前記視線方向に位置する時間を算出し、
前記時間に基づいて、前記機器を前記操作対象機器として特定すること
を特徴とする情報処理装置。
請求項１～１０のいずれか一項に記載の情報処理装置であって、
前記操作対象機器は、ナビゲーション機器、ドアのロック制御機器、ウィンドウの開閉制御機器、撮像画像の表示機器、計器表示機器、空調装置、サンルーフ、サンシェード、オーディオ装置のうち少なくともいずれか１つを含むこと
を特徴とする情報処理装置。
請求項１～１１のいずれか一項に記載の情報処理装置であって、
前記制御コマンドは、前記操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、前記操作対象機器のロックの解除、もしくは、施錠であること
を特徴とする情報処理装置。
請求項１～１２のいずれか一項に記載の情報処理装置であって、
前記音声データは、前記操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、前記操作対象機器のロックの解除、もしくは、施錠のうち少なくともいずれか１つを指示するデータであること
を特徴とする情報処理装置。
視線データ受付部によって取得した、ユーザの視線方向に関する視線データを記憶し、
音声データ受付部から音声データを取得した際、前記音声データに基づいて操作対象機器を特定できない場合に、記憶された前記視線データに基づいて前記操作対象機器を特定し、
前記音声データに基づいて前記操作対象機器に対する制御コマンドを生成し、
前記制御コマンドを前記操作対象機器に送信すること
を特徴とする情報処理方法。