WO2022003822A1

WO2022003822A1 - 情報処理装置及び情報処理方法

Info

Publication number: WO2022003822A1
Application number: PCT/JP2020/025659
Authority: WO
Inventors: 親生高杉
Original assignee: 日産自動車株式会社
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2022-01-06
Also published as: CN115720654A; EP4174636A1; EP4174636A4; JP2024026216A; JPWO2022003822A1; US20230290334A1; JP7396490B2

Abstract

情報処理装置（１）は、音声データが入力される音声データ入力装置（マイク１１）と、ユーザからユーザデータが入力されるユーザデータ入力装置（入力装置１０）と、コントローラ（２０）と、を備える。コントローラ（２０）は、音声データ入力装置（マイク１１）に入力された第１音声データを認識し、第１音声データを認識した結果に基づいて所定機器を制御することを示す第２音声データを出力し、第２音声データが報知された後、認識した結果に基づいて所定機器を制御する一方で、第２音声データが報知されている間に所定機器の制御中止を示すユーザデータが入力された場合は所定機器の制御を中止する。

Description

情報処理装置及び情報処理方法

　本発明は、情報処理装置及び情報処理方法に関する。

　従来よりユーザの音声によってリモコンなどの機器を制御する発明が知られている（特許文献１）。特許文献１に記載された発明はユーザの音声を認識し、ユーザのコマンドに対応する制御内容をリモコンに表示する。ユーザはリモコンに表示された制御内容を確認し、制御内容をユーザが承認することにより制御が実行される。

特開２００７－２８６１７４号公報

　しかしながら、特許文献１に記載された発明はユーザに制御内容を確認させ、さらに承認を要求するため、実際に制御が実行されるまで時間がかかるという課題がある。

　本発明は、上記問題に鑑みて成されたものであり、その目的は、必要な場合のみ制御が中止され、中止指示がない限り速やかに自動的に制御が実行される情報処理装置及び情報処理方法を提供することである。

　本発明の一態様に係る情報処理装置は、音声データ入力装置に入力された第１音声データを認識し、第１音声データを認識した結果に基づいて所定機器を制御することを示す第２音声データを出力し、第２音声データが報知された後、認識した結果に基づいて所定機器を制御する一方で、第２音声データが報知されている間に所定機器の制御中止を示すユーザデータが入力された場合は所定機器の制御を中止する。

　本発明によれば、必要な場合のみ制御が中止され、中止指示がない限り速やかに自動的に制御が実行される。

図１は、本発明の実施形態に係る情報処理装置１の構成図である。図２は、本発明の実施形態に係る情報処理装置１の一動作例を説明するシーケンス図である。図３は、ディスプレイ１２の表示例を説明する図である。図４は、音声認識機能が起動したことを示図である。図５は、フィードバック用の音声データがスピーカ３１から報知されている間の表示例である。図６は、コントローラ２０による制御を中止するためにユーザが行う操作の一例を説明する図である。図７は、コントローラ２０による制御を中止するためにユーザが行う操作の他の例を説明する図である。図８は、コントローラ２０による制御を中止するためにユーザが行う操作の他の例を説明する図である。図９は、コントローラ２０による制御を中止するためにユーザが行う操作の他の例を説明する図である。図１０は、本発明の変形例に係る情報処理装置２の構成図である。図１１は、本発明の変形例に係る情報処理装置２の一動作例を説明するシーケンス図である。図１２は、本発明の変形例に係る情報処理装置２の一動作例を説明するシーケンス図である。

　以下、本発明の実施形態について、図面を参照して説明する。図面の記載において同一部分には同一符号を付して説明を省略する。

　図１を参照して本実施形態に係る情報処理装置１の構成例を説明する。情報処理装置１は一例として車両に搭載される。図１に示すように情報処理装置１は、入力装置１０と、コントローラ２０と、データベース３０と、スピーカ３１とを備える。

　入力装置１０は、車両に乗車しているユーザからのデータを受け付ける機器の総称である。図１に示すように入力装置１０はマイク１１と、タッチパネル１２と、スイッチ１３と、カメラ１４を含む。マイク１１にはユーザの音声データが入力される。マイク１１の設置場所は例えば運転席の近くである。タッチパネル１２はユーザのタッチ操作による入力を受け付ける。タッチパネル１２は主にナビゲーション装置のディスプレイとして用いられる。スイッチ１３はステアリングホイールに設けられ、ユーザの入力（スイッチオン）を受け付ける。カメラ１４は例えば運転席の近くに設置されユーザの姿勢、ジェスチャなどを撮像する。入力装置１０に入力されたデータはコントローラ２０に送信される。

　コントローラ２０はＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、メモリ、記憶装置、入出力部などを備える汎用のコンピュータである。コントローラ２０は入力装置１０から取得したデータを処理する。具体的にはＣＰＵは記憶装置に記憶されている様々なプログラムをメモリに読み込んで、プログラムに含まれる各種の命令を実行する。これによりコントローラ２０は情報処理装置１が備える複数の情報処理回路として機能する。コントローラ２０は複数の情報処理回路として、音声認識部２１と、音声出力部２２と、報知終了判定部２３と、制御信号送信部２４とを備える。

　音声認識部２１はマイク１１に入力されたユーザの音声データを認識する。音声認識には周波数分析などの周知の技術が用いられる。音声認識部２１は認識した結果を音声出力部２２に出力する。

　音声出力部２２はデータベース３０を参照して音声認識部２１の認識結果に対応するフィードバック用の音声データを取得する。フィードバック用の音声データとはこれから実施する所定機器の制御に関し、ユーザに確認を促すものである。例えばユーザの音声データが「運転席の窓を開けて」と認識された場合、これに対応するフィードバック用の音声データは「運転席の窓を開けます」となる。フィードバック用の音声データは予め複数個用意されており、データベース３０に格納されている。なお本実施形態ではデータベース３０はコントローラ２０の記憶装置とは異なる記憶装置に記憶されているものとして説明するがこれに限定されない。データベース３０はコントローラ２０の記憶装置に記憶されていてもよい。

　音声出力部２２はスピーカ３１を通じてフィードバック用の音声データをユーザに報知する。なお音声出力部２２は音声認識部２１の認識結果に基づいてフィードバック用の音声データをその都度生成してもよい。生成方法としてユーザの音声データに対しオウム返しするような音声データを生成するようにプログラムされればよい。

　音声出力部２２はフィードバック用の音声データの出力を開始した場合、開始したことを示す信号を報知終了判定部２３に送信する。また音声出力部２２はフィードバック用の音声データの出力が終了した場合、終了したことを示す信号を報知終了判定部２３に送信する。以下では開始したことを示す信号を単に開始信号と呼ぶ場合がある。同様に終了したことを示す信号を単に終了信号と呼ぶ場合がある。

　報知終了判定部２３は音声出力部２２による報知が終了したか否かを判定する。具体的には報知終了判定部２３は音声出力部２２から開始信号を受信した後に終了信号を受信した場合、音声出力部２２による報知が終了したと判定する。一方で報知終了判定部２３は音声出力部２２から開始信号を受信したがその後終了信号を受信していない場合、音声出力部２２による報知は終了していないと判定する。報知終了判定部２３は音声出力部２２による報知が終了したと判定した場合、報知が終了したことを示す信号を制御信号送信部２４に送信する。

　制御信号送信部２４は、報知終了判定部２３から報知が終了したことを示す信号を受信した場合、音声認識部２１の認識結果によって得られたユーザの指示（音声データ）に基づいて所定機器を制御する。所定機器は車両に搭載される機器であって、図１に示すようにパワーウィンドウ３２、空調装置３３、サンルーフ３４、サンシェード３５、パワーバックドア３６、パワートランク３７、ナビゲーション装置３８、オーディオ装置３９などが含まれる。一例としてユーザの指示が「運転席の窓を開けて」であった場合、制御信号送信部２４は運転席のパワーウィンドウ３２に対し窓を開けるための信号を送信する。パワーウィンドウ３２は受信した信号に基づいて自動で窓を開ける。なお所定機器には自動運転などの走行制御を行う機器が含まれてもよい。

　次に図２～９を参照して情報処理装置１の一動作例を説明する。

　図２に示すステップＳ１０１において、車両に乗車しているユーザは音声認識機能を起動させる。本実施形態において音声認識機能は常に起動しているものではない。音声認識機能はユーザの指示によって起動する。音声認識機能の起動方法の一例について図３を参照して説明する。図３に示すように走行中はタッチパネル１２にナビゲーション装置３８による経路案内が表示される。タッチパネル１２には発話を示すアイコン５０が表示されている。ユーザがこのアイコン５０をタッチ操作することにより音声認識機能が起動する。他の起動方法としてステアリングホイールに設けられたスイッチ１３に起動のトリガ機能を持たせてもよいし、所定のキーワードに関するユーザの発話を認識したことをトリガとして音声認識機能を起動させてもよい。

　音声認識機能が起動するとタッチパネル１２の表示は図４に示す内容に切り替わる。図４に示すように音声認識機能が起動した後のタッチパネル１２にはアイコン５１と、アイコン５２と、音声によって指示が可能な機器が表示される。なお図４において音声によって指示が可能な機器として、空調装置、パワーウィンドウ、ナビゲーション装置、オーディオ装置が表示されているがこれは一例である。

　図４に示すアイコン５２は、音声認識が可能であることを示すアイコンである。ユーザはアイコン５２がタッチパネル１２に表示されていることを確認した後、所定機器を作動させるための指示を音声で入力する。すなわち図２のステップＳ１０３に示すように、ユーザはマイク１１に向かって音声データを入力する。図２ではユーザの指示は「運転席の窓を開けて」である。

　処理はステップＳ１０５に進み、ユーザの音声データを取得した音声認識部２１は音声データを認識する。処理はステップＳ１０７に進み、音声出力部２２はデータベース３０を参照して音声認識部２１の認識結果に対応するフィードバック用の音声データを取得する。ユーザの指示は「運転席の窓を開けて」と認識されているため、フィードバック用の音声データとして「運転席の窓を開けます」が選択される。音声出力部２２はスピーカ３１を通じてフィードバック用の音声データをユーザに報知する。フィードバック用の音声データの報知が開始されたとき、すなわちスピーカ３１からフィードバック用の音声データの出力が開始されたとき、タッチパネル１２の表示は図５に示す内容に切り替わる。

　処理はステップＳ１０９に進み、報知終了判定部２３は音声出力部２２による報知が終了したか否かを判定する。報知終了判定部２３は音声出力部２２から開始信号を受信した後に終了信号を受信した場合、音声出力部２２による報知が終了したと判定する。図２において音声出力部２２による報知が終了したとは、「運転席の窓を開けます」という音声データの出力が終了したことを意味する。

　報知終了判定部２３は音声出力部２２から開始信号を受信したがその後終了信号を受信していない場合、音声出力部２２による報知は終了していないと判定する。換言すれば報知終了判定部２３は音声出力部２２から開始信号を受信したがその後終了信号を受信していない場合、フィードバック用の音声データがスピーカ３１から報知されていると判定する。

　音声出力部２２による報知が終了したと判定された場合（ステップＳ１０９でＮＯ）、処理はステップＳ１１１に進む。ステップＳ１１１において報知終了判定部２３は報知が終了したことを示す信号を制御信号送信部２４に送信する。この信号を受信した制御信号送信部２４は運転席のパワーウィンドウ３２に対し窓を開けるための制御信号を送信する。処理はステップＳ１１３に進み制御信号を受信したパワーウィンドウ３２は自動で窓を開ける（ステップＳ１１５）。

　一方、音声出力部２２による報知が終了していないと判定された場合（ステップＳ１０９でＹＥＳ）、処理はステップＳ１１９に進む。

　ステップＳ１１９において、コントローラ２０はフィードバック用の音声データがスピーカ３１から報知されている間に制御中止を示す信号をユーザから受信した場合（ステップＳ１１９でＹＥＳ）、コントローラ２０は所定機器の制御を中止する（ステップＳ１２１）。ここで制御中止を示す信号（以下単に中止信号と呼ぶ場合がある）について説明する。中止信号とはユーザが所定の操作を行った場合にコントローラ２０に送信される信号である。ユーザが音声で「運転席の窓を開けて」と指示した場合、ユーザはスピーカ３１を通じて「運転席の窓を開けます」というフィードバックを受ける。このとき仮に音声認識に誤りがあった場合、ユーザの要望として制御中止が想定される。図２に示す例ではユーザの音声指示は正確に認識されているが、例えば「助手席の窓を開けます」といったようにユーザの音声指示が正確に認識されない場合もありうる。このようなケースにおいてユーザの要望として制御中止が想定される。

　本実施形態においてユーザは、フィードバック用の音声データがスピーカ３１から報知されている間であれば複数の方法でコントローラ２０に中止信号を送信することができ、コントローラ２０による制御を中止することができる。一方で音声出力部２２による報知が終了した場合、ユーザはコントローラ２０に中止信号を送信することができなくなる、もしくは送信できたとしてもコントローラ２０は中止信号を受け付けない。したがってユーザはコントローラ２０による制御を中止するためには、フィードバック用の音声データがスピーカ３１から報知されている間に所定の操作を行う必要がある。なおフィードバック用の音声データがスピーカ３１から報知されている間とは、報知終了判定部２３が音声出力部２２から開始信号を受信してから終了信号を受信するまでの間と定義される。

　コントローラ２０による制御を中止するためにユーザが行う所定の操作について図６～図９を参照して説明する。

　図６に示すように、ユーザはタッチパネル１２に表示されたアイコン５１をタッチすることによりコントローラ２０による制御を中止することができる。具体的にはフィードバック用の音声データがスピーカ３１から報知されている間にユーザがアイコン５１をタッチすると中止信号がコントローラ２０に送信される。中止信号を受信したコントローラ２０はパワーウィンドウ３２に対し窓を開けるための制御信号を送信しない。これによりコントローラ２０による制御が中止される。なおアイコン５１はいわゆるリターンを示すアイコンである。

　また図７に示すように、ユーザはタッチパネル１２に表示されたアイコン５４をタッチすることによりコントローラ２０による制御を中止することができる。具体的にはフィードバック用の音声データがスピーカ３１から報知されている間にユーザがアイコン５４をタッチすると中止信号がコントローラ２０に送信される。なおアイコン５４には「中止」という文字が表示される。

　あるいは図８に示すように、ユーザはタッチパネル１２をスワイプすることによりコントローラ２０による制御を中止することができる。スワイプとはタッチパネル１２に触れた状態で指を滑らせる操作のことである。フィードバック用の音声データがスピーカ３１から報知されている間にユーザがタッチパネル１２をスワイプすると中止信号がコントローラ２０に送信される。図８に示す例では左から右にスワイプしているがこれに限定されない。ユーザは上から下にスワイプしてもよく、右から左にスワイプしてもよい。スワイプの方向に関わらず、フィードバック用の音声データがスピーカ３１から報知されている間にスワイプが行われれば中止信号がコントローラ２０に送信される。

　あるいは図９に示すように、ユーザはステアリングホイール６０に設けられたスイッチ１３のうち、特定のスイッチ（図９のスイッチ６１）を押すことによりコントローラ２０による制御を中止することができる。具体的にはフィードバック用の音声データがスピーカ３１から報知されている間にユーザがスイッチ６１を押すと中止信号がコントローラ２０に送信される。なおスイッチ６１はいわゆるリターンを示すスイッチである。

　あるいはユーザは音声を用いてコントローラ２０による制御を中止することができる。具体的にはフィードバック用の音声データがスピーカ３１から報知されている間にユーザがマイク１１に向かって「中止」と音声で指示した場合、コントローラ２０による制御は中止される。フィードバック用の音声データがスピーカ３１から報知されている間に音声データが入力された場合、音声認識部２１は入力された音声データを認識する。認識された音声データが制御の中止を示すものであるとき、コントローラ２０は制御を中止する。このケースにおいてフィードバック用の音声データがスピーカ３１から報知されている間に入力された音声データが中止信号となる。

　また別の例として、ユーザはジェスチャを用いてコントローラ２０による制御を中止することができる。具体的にはフィードバック用の音声データがスピーカ３１から報知されている間にユーザがカメラ１４の前で中止を示すジェスチャを行った場合、中止信号がコントローラ２０に送信される。中止を示すジェスチャとは一例としてカメラ１４の前に手をかざすジェスチャである。フィードバック用の音声データがスピーカ３１から報知されている間にカメラ１４から画像データが入力された場合、コントローラ２０は画像データを解析する。画像データから中止を示すジェスチャが検出された場合、コントローラ２０は制御を中止する。このケースにおいてフィードバック用の音声データがスピーカ３１から報知されている間に入力された画像データが中止信号となる。

　なお制御中止の要因は音声データの誤認識に限定されない。例えばユーザは指示を取り消したい場合もありうる。すなわちユーザは音声で「運転席の窓を開けて」と指示したが、単にその指示を取り消したい場合もある。このような場合も上述と同様に、フィードバック用の音声データがスピーカ３１から報知されている間にユーザは所定の操作を行えばよい。

　図２に戻る。ステップＳ１１７において、フィードバック用の音声データがスピーカ３１から報知されている間にユーザが中止信号を送信するための操作を行った場合、中止信号がコントローラ２０に送信される。ステップＳ１１９、１２１についてはすでに説明した。図２に示す例は中止信号が送信されるケースであるが、もちろん中止信号が送信されないケースもある。フィードバック用の音声データがスピーカ３１から報知されている間にユーザが何もしない場合、当然ながら中止信号は送信されない。この場合は報知が終了した後、速やかに窓が開かれる。

　図２のステップＳ１０９において音声出力部２２による報知が終了したとは、フィードバック用の音声データがスピーカ３１から報知されている間にユーザから中止信号が送信されることなく報知が終了したことを意味する。

　なお音声出力部２２による報知が終了した場合、ユーザはコントローラ２０に中止信号を送信することができなくなると説明したが、補足する。音声出力部２２による報知が終了した場合、タッチパネル１２の表示は図５に示す内容から図３に示す内容に切り替わる。このため音声出力部２２による報知が終了した場合、ユーザはタッチパネル１２を用いての中止信号の送信はできなくなる。

（作用効果）
　以上説明したように、本実施形態に係る情報処理装置１によれば、以下の作用効果が得られる。

　情報処理装置１は、車両に乗車しているユーザの音声データが入力される音声データ入力装置（マイク１１）と、ユーザからユーザデータが入力されるユーザデータ入力装置（マイク１１、タッチパネル１２、スイッチ１３、カメラ１４）と、コントローラ２０とを備える。コントローラ２０は音声データ入力装置に入力された第１音声データを認識する。第１音声データとは所定機器を作動させるための指示を示す音声データであり、一例は上述した「運転席の窓を開けて」である。コントローラ２０は第１音声データの認識結果に基づいて所定機器を制御することを示す第２音声データをスピーカ３１から出力する。第２音声データの一例は上述した「運転席の窓を開けます」である。

　コントローラ２０は第２音声データが報知された後、認識結果に基づいて所定機器を制御する一方で、第２音声データが報知されている間に所定機器の制御中止を示すユーザデータが入力された場合は所定機器の制御を中止する。制御中止を示すユーザデータとは上述した中止信号である。このような構成を備える情報処理装置１によればユーザへのフィードバック後、ユーザの中止指示がない限り速やかに自動的に制御が実行される。またユーザは必要に応じて制御を中止することができる。

　所定機器は車両に搭載された機器である。所定機器は少なくともパワーウィンドウ３２、空調装置３３、サンルーフ３４、サンシェード３５、パワーバックドア３６、パワートランク３７、ナビゲーション装置３８、オーディオ装置３９のうちいずれか１つを含む。

　第２音声データによる報知は、所定機器を制御することを示す報知である。一例として第２音声データによる報知はパワーウィンドウ３２の窓を開けることを示す報知である。

　コントローラ２０は、所定機器の制御中止を示すユーザデータが入力されることなく第２音声データによる報知が終了した場合、所定機器の制御を実行する。これによりユーザへのフィードバック後、ユーザの中止指示がない限り速やかに自動的に制御が実行される。またコントローラ２０は、所定機器の制御中止を示すユーザデータが入力されることなく第２音声データによる報知が終了した場合、他のユーザデータの入力を受け付けることなく、所定機器の制御を実行する。

　ユーザデータは、ユーザがタッチパネル１２を操作したことを示すデータ、ユーザの姿勢を撮像した画像データ、ユーザがステアリングホイールに設けられたスイッチ６１を操作したことを示すデータ、または音声データ入力装置に入力される音声データである。

　第２音声データが報知された後とは、第２音声データの出力が終了した後と定義され、第２音声データが報知されている間とは、第２音声データの出力が開始されてから終了するまでの間と定義される。

（変形例）
　次に図１０を参照して本実施形態の変形例を説明する。

　変形例に係る情報処理装置２は、情報処理装置１と比較して特定部２５及び待機時間設定部２６をさらに備える。情報処理装置１と重複する構成については符号を引用してその説明は省略する。以下、相違点を中心に説明する。

　特定部２５は入力装置１０の中からユーザが利用可能な装置を特定する。ここでいう利用可能な装置とはコントローラ２０による制御を中止するために利用可能な装置を意味する。すなわち利用可能な装置とはフィードバック用の音声データがスピーカ３１から報知されている間に利用可能な装置を意味する。

　図１０では入力装置１０としてマイク１１、タッチパネル１２、スイッチ１３、カメラ１４が示されているがこれらのすべてがいつでも利用可能とは限らない。故障などの原因で利用できない場合もありうる。あるいは何らかの制約によって利用できない場合もありうる。利用可能か否かの特定方法として、正常に動作していることを示す信号の有無で特定が可能である。

　特定部２５はマイク１１、タッチパネル１２、スイッチ１３、カメラ１４から正常に動作していることを示す信号を受信した場合、その装置はフィードバック用の音声データがスピーカ３１から報知されている間において利用可能であると特定する。特定部２５は特定結果を示す信号を待機時間設定部２６に送信する。

　待機時間設定部２６は特定部２５から受信した信号に基づいて待機時間を設定する。待機時間とは音声出力部２２による報知が終了した後にユーザからの中止信号を受け付ける時間である。上述の実施形態では、音声出力部２２による報知が終了した場合コントローラ２０は中止信号を受け付けないと説明したが、変形例では音声出力部２２による報知が終了した後であっても設定された待機時間の分だけ中止信号を受け付ける。例えば音声出力部２２による報知が２秒、待機時間設定部２６によって設定された待機時間が３秒である場合、変形例においてユーザが中止信号を送信可能な時間は５秒（２秒＋３秒）となる。

　次に待機時間の設定方法について説明する。待機時間は特定部２５によって特定された利用可能な装置に応じて設定される。例えば利用可能と特定された装置がカメラ１４のみだったと仮定する。この場合待機時間は他の装置が特定された場合と比較してもっとも長く設定される。理由はユーザが中止信号を送信するためにはカメラ１４の前に手をかざす必要があり、この動作に要する時間を確保するためである。この待機時間を第１待機時間と呼ぶ。

　続いて利用可能と特定された装置がマイク１１のみだったと仮定する。この場合待機時間はカメラ１４が特定された場合と比較して短く設定される。カメラ１４の前に手をかざす動作と比較して発話に要する時間は短いからである。この待機時間を第２待機時間と呼ぶ。

　続いて利用可能と特定された装置がタッチパネル１２のみだったと仮定する。この場合待機時間はカメラ１４が特定された場合と比較して短く設定される。カメラ１４の前に手をかざす動作と比較してタッチパネル１２の操作に要する時間は短いからである。この待機時間を第３待機時間と呼ぶ。

　続いて利用可能と特定された装置がスイッチ１３（スイッチ６１）のみだったと仮定する。この場合待機時間はカメラ１４が特定された場合と比較して短く設定される。カメラ１４の前に手をかざす動作と比較してスイッチ６１の操作に要する時間は短いからである。この待機時間を第４待機時間と呼ぶ。

　第１～４待機時間の関係は、第１待機時間＞第２待機時間＞第３待機時間＞第４待機時間である。

　次に図１１～１２を参照して情報処理装置２の一動作例を説明する。ただしステップＳ２０１～２０５、２１１、２１５～２２５の処理は、図２に示すステップＳ１０１～１０５、１０７、１１１～１２１に示す処理と同様であるため、説明を省略する。

　ステップＳ２０７において特定部２５はマイク１１、タッチパネル１２、スイッチ１３、カメラ１４から正常に動作していることを示す信号を受信する。信号を受信した場合、特定部２５はその装置は利用可能であると特定する。特定部２５は特定結果を示す信号を待機時間設定部２６に送信する。

　ステップＳ２０９において待機時間設定部２６は、特定部２５から受信した信号に基づいて待機時間を設定する。

　ステップＳ２１３において報知終了判定部２３は、待機時間が終了したか否かを判定する。報知終了判定部２３は、音声出力部２２から開始信号を受信した後に待機時間設定部２６から待機時間が終了したことを示す信号を受信した場合、待機時間が終了したと判定する。一例を挙げると、音声出力部２２による報知が２秒、待機時間設定部２６によって設定された待機時間が３秒である場合、音声出力部２２による報知が開始した後、５秒経過した時点で待機時間が終了したと判定される。なおステップＳ２１３において待機時間が終了したとは、ユーザから中止信号が送信されることなく待機時間が終了したことを意味する。

（作用効果）
　ユーザデータは複数の種別を含む。具体的には中止信号を送信可能な機器は複数の種別を含む（マイク１１、タッチパネル１２、スイッチ１３、カメラ１４）。コントローラ２０は、ユーザデータの種別に応じて所定機器の制御中止を示すユーザデータを受け付ける時間（待機時間）を変更する。このような構成を備える情報処理装置２によればユーザへのフィードバック後、ユーザの中止指示がない限り待機時間の経過を待って速やかに自動的に制御が実行される。また待機時間の設定にユーザデータの種別が用いられるため、ユーザインターフェースに適した設定が可能となる。

　待機時間は特定部２５によって特定された利用可能な装置に応じて設定されると説明したがこれに限定されない。待機時間はユーザの指示に対応する機器に応じて設定されてもよい。上述したようにユーザの指示が「運転席の窓を開けて」であった場合、ユーザの指示に対応する機器はパワーウィンドウ３２となる。他の例ではユーザの指示が「ラジオを流して」であった場合、ユーザの指示に対応する機器はオーディオ装置３９となる。ユーザの指示に対応する機器がパワーウィンドウ３２、サンルーフ３４、パワーバックドア３６、パワートランク３７などのように挟み込みが発生しうる機器である場合、挟み込みが発生しない機器と比較して待機時間は長く設定されてもよい。これによりユーザは指示を中止するか否かの判断に使う時間を確保できる。

　またユーザの指示に対応する機器が自動運転などの走行制御を行う機器である場合、走行制御を行う機器でない場合と比較して待機時間は長く設定されてもよい。走行環境は時々刻々と変化するため、走行制御に関する指示を中止するか否かの判断には時間がかかる場合があるからである。

　また待機時間は車両が走行中か停止中かに応じて設定されてもよい。具体的には車両が走行中である場合、停止中の場合と比較して待機時間は長く設定されてもよい。車両が走行中である場合、停止中の場合と比較してユーザのレスポンスが遅くなることが想定されるからである。

　上述の実施形態に記載される各機能は、１または複数の処理回路により実装され得る。処理回路は、電気回路を含む処理装置等のプログラムされた処理装置を含む。処理回路は、また、記載された機能を実行するようにアレンジされた特定用途向け集積回路（ＡＳＩＣ）や回路部品等の装置を含む。

　上記のように、本発明の実施形態を記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。

　例えばフィードバック用の音声データがスピーカ３１から報知されている間にユーザから中止信号とは異なる信号が入力される場合がある。コントローラ２０は、フィードバック用の音声データがスピーカ３１から報知されている間に入力された信号が中止信号か否か判定する機能を有してもよい。

　コントローラ２０は、所定機器が機械的に動作する装置または車内環境を制御する装置である場合のみ、所定機器の制御中止を示すユーザデータを受け付けてもよい。機械的に動作する装置とはパワーウィンドウ３２、サンルーフ３４、パワーバックドア３６、パワートランク３７である。車内環境を制御する装置とは空調装置３３である。これによりユーザは作動によって挟み込みが発生しうる機器、運転に影響を及ぼす機器の制御を中止することができる。

　近年のナビゲーション装置は経路案内の他に多くの機能を有する。例えばその機能には天気情報の提供、ニュースの提供などが含まれる。したがってマイク１１に入力されるユーザの指示には天気情報、ニュースなどを要求するものが含まれる。

　なお天気情報及びニュースを要求する指示についてコントローラ２０は中止信号を受け付けなくてもよい。天気情報及びニュースの提供は機械的な動作、運転に影響を及ぼす動作を含まないからである。

　マイク１１は車両に設置されるものに限定されない。携帯端末（例えばスマートフォン）のマイクが代用されてもよい。この場合、携帯端末はコントローラ２０と通信が可能となるように接続される。

１、２　情報処理装置
１０　入力装置
１１　マイク
１２　タッチパネル
１３　スイッチ
１４　カメラ
２０　コントローラ
２１　音声認識部
２２　音声出力部
２３　報知終了判定部
２４　制御信号送信部
２５　特定部
２６　待機時間設定部
３０　データベース
３１　スピーカ

Claims

　音声データが入力される音声データ入力装置と、
　ユーザからユーザデータが入力されるユーザデータ入力装置と、
　コントローラと、を備え、
　前記コントローラは、
　前記音声データ入力装置に入力された第１音声データを認識し、
　前記第１音声データを認識した結果に基づいて所定機器を制御することを示す第２音声データを出力し、
　前記第２音声データが報知された後、前記認識した結果に基づいて前記所定機器を制御する一方で、前記第２音声データが報知されている間に前記所定機器の制御中止を示すユーザデータが入力された場合は前記所定機器の制御を中止する
ことを特徴とする情報処理装置。
　前記所定機器は車両に搭載された機器である
ことを特徴とする請求項１に記載の情報処理装置。
　前記所定機器は、少なくともパワーウィンドウ、空調装置、サンルーフ、サンシェード、パワーバックドア、パワートランク、ナビゲーション装置、オーディオ装置のうちいずれか１つを含む
ことを特徴とする請求項２に記載の情報処理装置。
　前記第２音声データによる報知は、前記所定機器を制御することを示す報知である
ことを特徴とする請求項１～３のいずれか１項に記載の情報処理装置。
　前記コントローラは、前記所定機器の制御中止を示すユーザデータが入力されることなく前記第２音声データによる報知が終了した場合、前記所定機器の制御を実行する
ことを特徴とする請求項１～４のいずれか１項に記載の情報処理装置。
　前記コントローラは、前記所定機器の制御中止を示すユーザデータが入力されることなく前記第２音声データによる報知が終了した場合、他の前記ユーザデータの入力を受け付けることなく、前記所定機器の制御を実行する
ことを特徴とする請求項１～４のいずれか１項に記載の情報処理装置。
　前記ユーザデータは、前記ユーザがタッチパネルを操作したことを示すデータ、前記ユーザの姿勢を撮像した画像データ、前記ユーザがステアリングホイールに設けられたスイッチを操作したことを示すデータ、または前記音声データ入力装置に入力される音声データである
ことを特徴とする請求項１～６のいずれか１項に記載の情報処理装置。
　前記第２音声データが報知された後とは、前記第２音声データの出力が終了した後と定義され、
　前記第２音声データが報知されている間とは、前記第２音声データの出力が開始されてから終了するまでの間と定義される
ことを特徴とする請求項１～７のいずれか１項に記載の情報処理装置。
　前記ユーザデータは複数の種別を含み、
　前記コントローラは、前記ユーザデータの種別に応じて前記所定機器の制御中止を示すユーザデータを受け付ける時間を変更する
ことを特徴とする請求項７に記載の情報処理装置。
　前記所定機器が機械的に動作する装置または車内環境を制御する装置である場合のみ、前記コントローラは前記所定機器の制御中止を示すユーザデータを受け付ける
ことを特徴とする請求項１～９のいずれか１項に記載の情報処理装置。
　音声データ入力装置に入力された第１音声データを認識し、
　前記第１音声データを認識した結果に基づいて所定機器を制御することを示す第２音声データを出力し、
　前記第２音声データが報知された後、前記認識した結果に基づいて前記所定機器を制御する一方で、前記第２音声データが報知されている間に前記所定機器の制御中止を示すユーザデータが入力された場合は前記所定機器の制御を中止する
ことを特徴とする情報処理方法。