JP2019200393A

JP2019200393A - 判定装置、電子機器、応答システム、判定装置の制御方法、および制御プログラム

Info

Publication number: JP2019200393A
Application number: JP2018096494A
Authority: JP
Inventors: 成文後田; Narifumi Nochida
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2018-05-18
Filing date: 2018-05-18
Publication date: 2019-11-21
Also published as: US20190355357A1; CN110503950A

Abstract

【課題】テレビまたはラジオ等からの出力音声による誤反応を防止する。【解決手段】サーバ制御部（１０）は、認識情報を取得する情報取得部（１０２）と、認識情報に応じた応答を実行させるか否かを判定する応答判定部（１０３）と、を備え、応答判定部（１０３）は、認識情報の取得前、または認識情報の取得から所定時間内に認識情報と同一内容の第２認識情報を取得した場合は、認識情報に応じた応答を実行させないと判定する。【選択図】図１

Description

本発明は電子機器が出力するメッセージの作成要否を判定する判定装置等に関する。

従来、ユーザの発話を取得して音声認識し、該音声認識の結果に応じた応答メッセージを出力する電子機器が知られている。このような電子機器について、適切なタイミングで音声認識および応答メッセージの出力を実行するための技術が種々開発されている。

例えば、特許文献１には、特定の言葉の発話をトリガとして音声認識を開始する音声認識装置が開示されている。該音声認識装置は、一般的な会話での出現頻度が低い言葉、発話者の母語でない言葉、音声操作コマンドの意味を含む言葉等の限られた言葉を前記特定の言葉として認識する。これにより、通常の会話をトリガとして、発話者の意図しない音声認識が開始されることが防止される。

特開２００４−３０１８７５号公報（２００４年１０月２６日公開）

ところが、前記特許文献１に記載の技術では、テレビまたはラジオ等からの出力音声に前記特定の言葉が含まれていた場合、発話者が意図していないタイミングで音声認識装置が音声認識を開始する虞がある。

例えば、テレビまたはラジオからは、様々な状況における会話の音声が出力されると考えられる。そのため、特定の言葉を、単に一般的な会話での出現頻度が低い言葉に設定しても、誤認識は完全には防止できない。また例えば、テレビやラジオからの出力音声にはその外国語の言葉が含まれている可能性が十分にある。そのため、特定の言葉を、発話者にとっての外国語の言葉と設定した場合でも、誤認識は完全には防止できない。

そして、応答メッセージを出力する電子機器の場合、誤って開始された音声認識の結果に基づいて、応答メッセージの出力が行われる。換言すると、電子機器は誤反応を起こす。

本開示の一態様は、前記問題点を鑑みたものであり、テレビまたはラジオ等からの出力音声による誤反応を防止可能な判定装置等を実現することを目的とする。

上記の課題を解決するために、本発明の一態様に係る判定装置は、音声入力装置を備える電子機器による応答の要否を判定する判定装置であって、前記音声入力装置に入力された音声についての音声認識の結果と、該音声が入力された時刻である音声入力時刻、または前記音声認識を行った時刻である認識時刻とを対応付けた認識情報を取得する情報取得部と、前記認識情報に応じた応答を実行させるか否かを判定する応答判定部と、を備え、前記応答判定部は、前記認識情報の取得前、または前記認識情報の取得から所定時間内に、前記認識情報と同一内容の第２認識情報を取得した場合は、前記認識情報に応じた前記応答を実行させないと判定することを特徴とする。

本発明の一態様によれば、テレビまたはラジオ等からの出力音声による誤反応を防止することができる。

本発明の実施形態１に係る応答システムに含まれる、会話ロボットおよびクラウドサーバの要部構成を示すブロック図である。前記クラウドサーバの記憶部に格納されている、判定対象データベースのデータ構造の一例を示す図である。前記会話ロボットの動作概要を示す図である。前記応答システムにおける応答要否判定処理の流れを示すフローチャートである。本発明の実施形態２に係る応答システムに含まれる、会話ロボットおよびクラウドサーバの要部構成を示すブロック図である。本発明の実施形態３に係る応答システムに含まれる、会話ロボットの要部構成を示すブロック図である。前記応答システムにおける応答要否判定処理の流れを示すフローチャートである。本発明の実施形態４に係る応答システムに含まれる、会話ロボットおよびクラウドサーバの要部構成を示すブロック図である。前記クラウドサーバの記憶部に格納されている、判定対象データベースのデータ構造の一例を示す図である。前記応答システムにおける応答要否判定処理の流れを示すフローチャートである。

本開示は、ある入力音声の音声認識の結果およびタイミングに応じて、該入力音声に対する応答の要否を判定する応答システムに関する。以下、本開示の実施形態の例を、図面を参照して説明する。

〔実施形態１〕
≪装置の要部構成≫
本開示の実施形態１について、図１〜図４を参照して説明する。図１は、本実施形態に係る応答システム１００に含まれる、会話ロボット２およびクラウドサーバ１の要部構成を示すブロック図である。応答システム１００は、少なくとも１台のクラウドサーバ１と、複数台の会話ロボット（電子機器）２とを含む。図示の例では会話ロボット２は２台であるが、会話ロボット２は複数台であれば、その台数は特に限定しない。また、図１における２台の会話ロボット２は同様の構成を備えている。そのため、片方の会話ロボット２については、詳細な構成を省略して掲載している。

（会話ロボット２の要部構成）
会話ロボット２は、ユーザの発話に応じた応答を返すことで、該ユーザと会話するロボットである。会話ロボット２は図示の通り、制御部（判定装置）２０と、通信部２１と、マイク（音声入力装置）２２と、スピーカ（応答部）２３とを含む。

通信部２１は、クラウドサーバ１との通信を行う。マイク２２は、会話ロボット２の周囲の音を入力音声として制御部２０に入力する。

制御部２０は会話ロボット２を統括的に制御する。制御部２０は、マイク２２から入力される音声を取得すると、該音声が入力された時刻（音声入力時刻）を取得する。音声入力時刻の計時方法は特に限定しないが、例えば制御部２０の内部クロック等に基づいて計時してもよい。制御部２０は取得した音声を、通信部２１を介しクラウドサーバ１に送信する。このとき、制御部２０は該音声に、音声入力時刻と、自装置（会話ロボット２）を特定可能な識別情報（ロボット識別情報）とを付して、クラウドサーバ１に送信する。また、制御部２０は通信部２１を介しクラウドサーバ１から受信した応答メッセージ（後述）を、スピーカ２３に出力させる。スピーカ２３は、制御部２０の制御に従って応答メッセージを音声出力する。

なお、本実施形態では、会話ロボット２は応答を音声メッセージとして出力することとする。しかしながら、会話ロボット２は音声メッセージ以外の方法でユーザの発話に対する応答を実行してもよい。例えば、会話ロボット２はスピーカ２３に加えて、またはスピーカ２３の代わりにディスプレイを備え、ディスプレイにメッセージを表示させてもよい。もしくは、会話ロボット２は、可動部およびモータを備え、応答をジェスチャで示してもよい。もしくは、会話ロボット２は、ユーザが見えるような位置にＬＥＤ（light emitting diode）等で構成されるランプを備え、応答を光の明滅で示してもよい。

（クラウドサーバ１の要部構成）
クラウドサーバ１は、各会話ロボット２の応答の要否を判定する。クラウドサーバ１は、複数の会話ロボット２から音声を取集し、それぞれ音声認識を実行し、該音声認識の結果と、音声認識のタイミングとに応じて応答要否を判定する。なお、本実施形態では応答システム１００は図示の通り、クラウドネットワークを利用したクラウドサーバ１を用いることとする。しかしながら、応答システム１００は、クラウドサーバ１の代わりに、有線または無線で会話ロボット２と通信接続する単一または複数台のサーバを用いてもよい。以降の実施形態でも同様である。

クラウドサーバ１は図示の通り、サーバ制御部（判定装置）１０と、サーバ通信部１１と、記憶部１２とを備える。サーバ通信部１１は、会話ロボット２との通信を行う。記憶部１２はクラウドサーバ１に必要な各種データを格納する。

具体的には、記憶部１２は少なくとも判定対象データベース（ＤＢ）１２１を記憶している。また、記憶部１２は応答メッセージの作成に必要なデータ（例えば、応答メッセージの雛形または定型文等）を記憶している。判定対象ＤＢ１２１のデータ構造については後で詳述する。

サーバ制御部１０は、クラウドサーバ１を統括的に制御する。サーバ制御部１０は、音声認識部１０１と、情報取得部（認識情報格納部）１０２と、応答判定部（判定結果送信部）１０３と、応答作成部１０４とを含む。サーバ制御部１０はサーバ通信部１１を介し、会話ロボット２から音声と、該音声に対応付けられた音声入力時刻およびロボット識別情報とを受信する。図示の通り、会話ロボット２は複数台あるため、サーバ制御部１０は各会話ロボット２からの音声、音声入力時刻、およびロボット識別情報を受信する。そして、サーバ制御部１０は、以下で説明する処理を各音声について実行する。

音声認識部１０１は、会話ロボット２から受信した音声について、音声認識を実行する。音声認識の方法は特に限定されない。本実施形態では音声認識として、音声に含まれる言葉を文字列に変換することとする。音声認識部１０１は音声認識の結果（以下、単に認識結果と称する）を、音声認識の対象となった音声のロボット識別情報と対応付けて、応答作成部１０４に送信する。

音声認識部１０１は音声認識を実行すると、認識結果と、音声入力時刻とを対応付けた、認識情報を作成する。音声認識部１０１は認識情報を情報取得部１０２に送信する。

情報取得部１０２は、音声認識部１０１から取得した認識情報に基づいて、記憶部１２の判定対象ＤＢ１２１を更新する。このとき、情報取得部１０２は今取得した認識情報と同一の認識結果および音声入力時刻を示す認識情報が、判定対象ＤＢ１２１に格納されているか否かに応じて、判定対象ＤＢ１２１の更新方法を変える。以下、判定対象ＤＢ１２１の詳細なデータ構成とともに、情報取得部１０２による判定対象ＤＢ１２１の更新方法を説明する。

（判定対象ＤＢ）
図２は、判定対象ＤＢ１２１のデータ構造の一例を示す図である。判定対象ＤＢ１２１は、認識情報を集積したデータベースであり、応答メッセージの作成要否を判定するために参照されるデータベースである。判定対象ＤＢ１２１は少なくとも、認識結果を示す情報と、音声入力時刻を示す情報とを含む。

図示の例では、判定対象ＤＢ１２１は「ＩＤ」列と、「日付」列と、「時刻」列と、「言語」列と、「認識結果」列と、「カウント」列とを含む。同図の１レコードは１つの認識情報についての情報を示している。「日付」列と、「時刻」列と、「言語」列と、「認識結果」列に記憶される情報は、音声認識部１０１が作成する認識情報そのものである。なお、「言語」列は必須の情報ではない。また「日付」列と「時刻」列は一体であってもよい。

「ＩＤ」列には、認識情報を一意に特定するための識別コードが記憶される。「日付」列および「時刻」列にはそれぞれ、音声入力時刻のうちの年月日および時刻が記憶される。「言語」列には、認識結果を規定の言語のいずれかに分類した場合の類型が記憶される。この類型は音声認識部１０１が認識情報を作成する際に決定してもよいし、応答判定部１０３が認識結果の文字列に応じて決定してもよい。「認識結果」列には認識結果の文字列が記憶される。「カウント」列には、同一の認識情報を取得した回数が記憶される。

情報取得部１０２は認識情報を取得すると、該認識情報と同一の認識結果および音声入力時刻を示しているレコードが有るか判定対象ＤＢ１２１を検索する。該レコードが無い場合、情報取得部１０２は判定対象ＤＢ１２１に、取得した認識情報についてのレコードを追加する。追加したレコードの「ＩＤ」列には新たな識別コードが記憶され、「カウント」列には取得回数、すなわち「１」が記憶される。

なお、本実施形態で「同一」と称する場合、完全一致だけではなく、予め設定されたバッファの範囲内で一致（すなわち、略同一または部分一致）している場合も含む。具体的には、例えば、認識結果の文字列の一致割合が、予め設定された閾値以上であれば「同一の認識結果である」と判定してもよい。また、音声入力時刻を比較して、両者の相違が予め設定された時間範囲内である場合は、「同一時刻である」と判定してもよい。以降の実施形態についても同様である。

一方、情報取得部１０２が取得した認識情報と同一の認識結果および音声入力時刻を示しているレコードが有る場合、情報取得部１０２は該レコードの「カウント」列の数字をカウントアップする。例えば、情報取得部１０２が取得した認識情報が、ＩＤ＝２の認識情報と同一の認識結果および音声入力時刻を示していたとする。この場合、情報取得部１０２はＩＤ＝２のレコードの取得回数を４１８９から４１９０へと１つカウントアップする。情報取得部１０２は判定対象ＤＢ１２１の更新が終了すると、音声認識部１０１から取得した認識情報を、応答判定部１０３に送信する。

なお、判定対象ＤＢ１２１の各レコードは、所定時間（例えば、１０秒）が経過した場合、自動的に削除されてもよい。これにより、判定対象ＤＢ１２１のレコード数が時間とともに肥大化することを防止できるため、音声入力から応答メッセージの出力までの時間（すなわち、会話ロボット２のレスポンスに要する時間）を短くすることができる。

応答判定部１０３は、情報取得部１０２から取得した認識情報に応じて、応答メッセージを作成するか否か（すなわち、会話ロボット２に応答を実行させるか否か）を判定する。具体的には、応答判定部１０３は、取得した認識情報と同一内容（少なくとも同一の認識結果および音声入力時刻）を示す認識情報（第２認識情報）が、判定対象ＤＢ１２１に存在しない場合は応答メッセージを作成すると判定する。一方、応答判定部１０３は、第２認識情報が判定対象ＤＢ１２１に存在する場合は、応答メッセージを作成しないと判定する。

ここで、応答判定部１０３は、情報取得部１０２から認識情報を取得した後、所定のタイミングで判定を実行する。例えば、応答判定部１０３は、認識情報を受信してから所定時間（例えば、１秒程度）待機し、その後に判定を実行する。

これにより、応答判定部１０３は、前記認識情報の取得前に第２認識情報がすでに取得（および判定対象ＤＢ１２１の更新に反映）されていた場合に加えて、今取得した認識情報の取得から所定時間内に、情報取得部１０２が第２認識情報を取得した場合も、認識情報に応じた応答メッセージを作成しない、と判定することができる。

例えばテレビ番組の音声等では、同時刻に別の場所で（別のテレビから）同じ音声出力がなされる。この場合、複数の会話ロボット２がほぼ同時に音声を取得し、クラウドサーバ１に送信するが、会話ロボット２によって若干のタイムラグが生じる可能性がある。応答判定部１０３が情報取得部１０２における判定対象ＤＢ１２１の更新作業から所定時間後に判定を行う構成とすることにより、このようなタイムラグが生じた場合も、応答判定部１０３において正確な判定を行うことができる。なお、応答判定部１０３における判定の実行を遅延させるのではなく、情報取得部１０２から応答判定部１０３への認識情報の送信を遅延させてもよい。応答判定部１０３は判定結果を応答作成部１０４に送信する。

なお、応答判定部１０３は、取得した認識情報と同一の認識結果および音声入力時刻を示すレコードが判定対象ＤＢ１２１に存在し、かつ、該レコードのカウントが所定値未満である場合は応答を作成すると判定し、所定値以上である場合は応答メッセージを作成しないと判定してもよい。

もしくは、応答判定部１０３は、情報取得部１０２が判定対象ＤＢ１２１を更新してから所定時間（例えば、１秒）、判定を行わずに待機してもよい。そして、待機中に、判定対象ＤＢ１２１の、更新された認識情報のレコード（すなわち、応答判定部１０３が取得した認識情報に対応するレコード）の「カウント」が増加しなかった場合は応答を作成すると判定し、増加した場合は応答を作成しないと判定しても良い。

応答作成部１０４は、認識結果に応じた応答メッセージを作成して、該認識結果に対応付けられているロボット識別情報が示すロボットに向けて送信する。応答作成部１０４は、応答判定部１０３から応答メッセージを作成する旨の判定結果を受信した場合、記憶部１２の応答メッセージの雛形等を参照して、認識結果に応じた応答メッセージを作成する。応答作成部１０４は作成した応答メッセージを、サーバ通信部１１を介し会話ロボット２に送信する。このとき、応答作成部１０４は認識結果に対応付けられていたロボット識別情報が示す会話ロボット２に向けて、応答メッセージを送信する。これにより、ある会話ロボット２において取得された音声に対応する応答メッセージを、会話ロボット２に返すことができる。

≪会話ロボット２の動作概要≫
次に、本実施形態に係る応答システム１００の動作概要を説明する。図３は、応答システム１００に含まれる会話ロボットの動作概要を示している。図中の白抜き矢印は、時間の流れを示している。また、図示の例では、家Ａと家Ｂに１台ずつ会話ロボット２が配置されている。また、図示の例ではクラウドサーバ１は遠隔地にあるものとして、図示していない。

時刻１１：１５：３０に、図示のようにテレビから「こんにちは」と音声出力があったとする。この場合、各家の会話ロボット２は、「こんにちは」という音声を取得し、それぞれクラウドサーバ１に送信する。クラウドサーバ１はそれぞれの音声を音声認識する。図示の例では、家Ａおよび家Ｂの２台の会話ロボット２から同一内容の音声が略同時にクラウドサーバ１に送信されるため、これらの認識情報の認識結果および音声入力時刻は同一となる。情報取得部１０２はこれらの認識情報に基づいて判定対象ＤＢ１２１を更新する。

その後所定時間をおいて、応答判定部１０３は、各会話ロボット２由来の認識情報それぞれについて、応答要否を判定する。上述のように、同一の認識結果および音声入力時刻のレコードが判定対象ＤＢ１２１に存在するため、応答判定部１０３は、各認識情報について、応答メッセージを作成しないと判定する。そのため、応答作成部１０４は応答メッセージを作成せず、よって家Ａおよび家Ｂ両方の会話ロボット２は、何も音声出力をしない状態のままである。

一方、時刻１３：０７：１０に、家Ａでユーザが「こんにちは」と会話ロボット２に話しかけたとする。この場合、家Ａの会話ロボット２からのみ、音声がクラウドサーバ１に送信される。この場合、作成される認識情報と同一の認識結果および音声入力時刻を有するレコードは、判定対象ＤＢ１２１に存在しない。したがって、応答判定部１０３は応答メッセージを作成すると判定し、応答作成部１０４は「こんにちは」という認識結果に対応する応答メッセージ「こんにちは」を会話ロボット２に送信する。そして、会話ロボット２はスピーカ２３から、「こんにちは」と音声出力する。

さらに、時刻１６：４３：５０にテレビから「明日の天気は」と音声出力があったとする。この場合、時刻１１：１５：３０の場合と同様に、家Ａおよび家Ｂの２台の会話ロボット２から同一内容の音声が略同時にクラウドサーバ１に送信されるため、これらの認識情報の認識結果および音声入力時刻は同一となる。したがって、応答判定部１０３は、各認識情報について、応答メッセージを作成しないと判定し、応答作成部１０４は応答メッセージを作成しない。よって家Ａおよび家Ｂ両方の会話ロボット２は、何も音声出力をしない状態のままである。

≪処理の流れ≫
最後に、応答システム１００における応答メッセージの作成要否を判定する処理（応答要否判定処理）の流れについて、図４を参照して説明する。図４は、応答システム１００における応答要否判定処理の流れを示すフローチャートである。なお、図４の例は、ある入力音声についての（入力１回についての）、応答要否判定処理の流れを示している。

会話ロボット２の制御部２０は、マイク２２から周囲の音声を入力されると、音声入力時刻を取得する。制御部２０は、入力された音声に、音声入力時刻およびロボット識別情報を対応付けてクラウドサーバ１に送信する。クラウドサーバ１のサーバ制御部１０は該音声、音声入力時刻、およびロボット識別情報を取得する（Ｓ１０）。音声認識部１０１は取得した音声について、音声認識を実行し（Ｓ１２）、認識結果と音声入力時刻とを対応付けて認識情報を作成する（Ｓ１４）。音声認識部１０１は情報取得部１０２に認識情報を送信する。

情報取得部１０２は認識情報を受信すると（情報取得ステップ）、判定対象ＤＢ１２１を更新して、該認識情報を応答判定部１０３に送信する。応答判定部１０３は認識情報を受信すると、所定時間後に、該認識情報が判定対象ＤＢ１２１の認識情報と同一か否かを判定する（Ｓ１６、応答判定ステップ）。同一である場合（Ｓ１６でＹＥＳ）、応答判定部１０３は応答メッセージを作成しないと判定する（Ｓ２２）。一方、同一でない場合（Ｓ１６でＮＯ）、応答判定部１０３は応答メッセージを作成すると判定し（Ｓ１８）、応答作成部１０４は認識結果に応じた応答メッセージを作成する（Ｓ２０）。応答作成部１０４は作成した応答メッセージを、ロボット識別情報が示す会話ロボット２に送信し、会話ロボット２は該応答メッセージをスピーカ２３から出力する。

前記の処理によれば、クラウドサーバ１の応答判定部１０３は、同時に同内容の認識結果が得られた場合、該認識結果を示す認識情報については、該認識情報に応じた前記応答メッセージを作成しない（すなわち、会話ロボット２に応答を実行させない）と判定する。

テレビやラジオの音声等は、複数の場所で（別のテレビまたはラジオから）同時刻に同じ音声出力がなされる。したがって複数の会話ロボット２がほぼ同時に同じ内容の音声を取得し、クラウドサーバ１に送信すると考えられる。前記の構成によれば、このような場合に応答を実行させないと判定するため、テレビまたはラジオ等からの出力音声による誤反応を防止することができる。

本実施形態に係るクラウドサーバ１の音声認識部１０１は、音声認識を行う際に、音声認識を行った時刻である認識時刻を取得してもよい。認識時刻は、例えばクラウドサーバ１の計時部（図示せず）、またはサーバ制御部１０の制御クロック等に基づいて取得される。そして、音声認識部１０１は、音声に、音声入力時刻ではなく、認識時刻を対応付けた情報を認識情報としてもよい。以降の実施形態についても同様である。

この場合、判定対象ＤＢ１２１の「日付」列および「時刻」列にはそれぞれ、認識時刻のうちの年月日および時刻が記憶される。また、この場合、会話ロボット２の制御部２０は音声入力時刻を取得せず、音声とロボット識別情報とを対応付けてクラウドサーバ１に送信してもよい。

〔実施形態２〕
本開示に係る応答システムにおいて、音声認識および応答メッセージの作成は、会話ロボットが行っても良い。以下、本開示の実施形態２について、図５を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。以降の実施形態についても同様である。

図５は、本実施形態に係る応答システム２００に含まれる、会話ロボット４およびクラウドサーバ３の要部構成を示すブロック図である。クラウドサーバ３は、音声認識部１０１および応答作成部１０４を備えていない点で、クラウドサーバ１と異なる。会話ロボット４は、記憶部２４と、音声認識部２０１と、応答作成部２０２とを備える点で、会話ロボット２と異なる。

記憶部２４は、応答メッセージの作成に必要なデータ（例えば、応答メッセージの雛形または定型文等）を記憶している。音声認識部２０１は、実施形態１にて説明した音声認識部１０１と同様の機能を備えている、また、応答作成部２０２は、実施形態１にて説明した応答作成部１０４と同様の機能を備えている。本実施形態に係る応答システム２００では、会話ロボット４の制御部２０は、マイク２２から音声を入力されると、音声入力時刻を取得するとともに、音声認識部２０１で音声認識を実行する。音声認識部２０１は、音声認識の結果と音声入力時刻とを対応付けた認識情報を作成する。音声認識部２０１は、認識情報をロボット識別情報と対応付けて、クラウドサーバ３に送信する。また、音声認識部２０１は認識情報を応答作成部２０２に送信する。

クラウドサーバ３の情報取得部１０２は、会話ロボット４から認識情報を取得し、実施形態１にて説明した処理と同様の処理を実行する。応答判定部１０３も実施形態１と同様の判定を実行し、判定結果を、ロボット識別情報が示す会話ロボット４に送信する。会話ロボット４の応答作成部２０２は、応答メッセージを作成する旨の判定結果を受信した場合、記憶部２４に記憶された応答メッセージの雛形等を参照して、応答メッセージを作成する。制御部２０は、作成された応答メッセージをスピーカ２３から出力させる。

ユーザと会話ロボット４とがリアルタイムに会話している場合、応答要否の判定を迅速に行い、会話ロボット４からの応答出力をタイミング良く行うことが重要である。以上の処理によれば、応答システム２００のクラウドサーバ３は、音声認識および応答メッセージの作成を行わず、応答要否の判定のみを行う。したがって、複数の会話ロボット４についての処理を要求されるクラウドサーバ３の負荷を軽減することができる。また、以上の処理によれば、クラウドサーバ３は会話ロボット４に、応答可否の判定結果のみを送信すればよい。したがって、クラウドサーバ３において応答内容を決定し、該内容を示す情報を会話ロボット４に送信する場合に比べて、通信データの容量を削減して通信に係る負荷を軽減することができる。そのため、本実施形態に係るクラウドサーバ３は、より高速に各種処理を実行することができる。

例えば、クラウドサーバ３における応答要否の判定に係る処理速度も速くなる。したがって、会話ロボット４もより迅速に応答メッセージを出力することができる。

〔実施形態３〕
本開示に係る応答システムにおいて、会話ロボットはクラウドサーバを介さずに、会話ロボット同士で認識情報を送受信してもよい。そして、会話ロボットは、他の会話ロボットから受信した認識情報（他の認識情報）と、自装置で作成した認識情報とが同一である場合は、応答メッセージを作成しないこととしてもよい。

以下、本開示の実施形態３について、図６および図７を参照して説明する。図６は、本実施形態に係る応答システム３００に含まれる、会話ロボット５の要部構成を示すブロック図である。図示の通り、応答システム３００には、クラウドサーバ１は無くてもよい。会話ロボット５は、会話ロボット４の構成に加え、さらに応答判定部２０３を備える。

図７は、応答システム３００における応答要否判定処理の流れを示すフローチャートである。図７の例も図４と同様、ある入力音声についての（入力１回についての）、応答要否判定処理の流れを示している。

会話ロボット５はマイク２２で周囲の音声を取得し（Ｓ３０）、音声認識部２０１で音声認識（Ｓ３２）および認識情報の作成（Ｓ３４）を行う。会話ロボット５は他の会話ロボット５と通信し（Ｓ３６）、作成した認識情報を他の会話ロボット５それぞれに向けて送信する。また、他の会話ロボット５から他の会話ロボット５が作成した認識情報（他の認識情報）を受信する（Ｓ３８）。

制御部２０の応答判定部２０３は、受信した認識情報（他の認識情報）と作成した認識情報とが同一か否か判定する（Ｓ４０）。同一である場合（Ｓ４０でＹＥＳ）、応答判定部２０３は応答メッセージを作成しないと判定する（Ｓ４６）。一方、同一でない場合（Ｓ４０でＮＯ）、応答判定部２０３は応答メッセージを作成すると判定し（Ｓ４２）、応答作成部２０２は認識結果に応じた応答メッセージを作成する（Ｓ４４）。制御部２０は作成された応答メッセージを、スピーカ２３から出力する。

以上の処理によれば、会話ロボット５は、他の実施形態に記載のクラウドサーバ１または３のようなサーバが存在しなくとも、会話ロボット５同士で認識情報を送受信して互いの認識情報を照合することで、同時刻に同内容の認識結果が得られたか否かを判定することができる。したがって、クラウドサーバ１または３を含む大規模なシステムまたはネットワークを構築しなくとも、会話ロボット５だけでテレビ等からの出力音声による誤反応を防止することができる。

〔実施形態４〕
本開示の実施形態４について、図８〜図１０を参照して説明する。図８は、本実施形態に係る応答システム４００に含まれる、会話ロボット２およびクラウドサーバ６の要部構成を示すブロック図である。応答システム４００は、１台以上のクラウドサーバ６と、１台以上の会話ロボット２とを含む。図示の例では会話ロボット２は２台であるが、会話ロボット２の台数は特に限定しない。例えば、会話ロボット２は１台であってもよい。

会話ロボット２は、ユーザの発話に応じた応答を返すことで、該ユーザと会話するロボットである。会話ロボット２の構成は図１と同様である。なお、会話ロボット２は、以降で説明するクラウドサーバ６の機能を備えた装置であって、単独で（クラウドサーバ６無しで）動作可能な装置であってもよい。

クラウドサーバ６は、会話ロボット２の応答の要否を判定する。クラウドサーバ６は図示の通り、サーバ制御部（判定装置）１０と、サーバ通信部１１と、記憶部１２とを備える。

サーバ通信部１１は、会話ロボット２との通信を行う。なお、応答システム４００においてあるクラウドサーバ６と通信する会話ロボット２が１台だけである場合、サーバ通信部１１はロボット識別情報を受信しなくてもよい。一方、応答システム４００において会話ロボット２が複数台存在する場合、サーバ制御部１０は各会話ロボット２からの音声および音声入力時刻に加えてロボット識別情報を受信する。

記憶部１２はクラウドサーバ１に必要な各種データを格納する。具体的には、記憶部１２は少なくとも判定対象データベース（ＤＢ）１２２を記憶している。また、記憶部１２は応答メッセージの作成に必要なデータ（例えば、応答メッセージの雛形または定型文等）を記憶している。

（判定対象ＤＢ）
判定対象ＤＢ１２２は、応答メッセージの作成要否を判定するために参照されるＤＢであり、該ＤＢには１つ以上の判定情報が記憶されている。ここで、判定情報とは、音声入力がなされる予定の時刻または時間帯と、予測される音声認識の結果の少なくとも一部を示す所定のキーワードとを対応付けた情報である。

図９は、判定対象ＤＢ１２２のデータ構造の一例を示す図である。図示の例では、判定対象ＤＢ１２２は「ＩＤ」列と、「日付」列と、「時刻」列と、「キーワード」列とを含む。同図の１レコードは１つの判定情報を示している。なお、「日付」列と「時刻」列は一体であってもよい。また、「日付」列および「時刻」列の情報で１点の時刻を指定するのではなく、ある時刻からある時刻までの時間帯を示すようにしてもよい。

「ＩＤ」列には、判定情報を一意に特定するための識別コードが記憶される。なお、判定対象ＤＢ１２２において「ＩＤ」列の情報は必須ではない。「日付」列および「時刻」列にはそれぞれ、音声入力がなされる予定の時刻のうちの、年月日および時刻がそれぞれ記憶される。「キーワード」列には、予測される音声認識の結果の少なくとも一部を示すキーワードが記憶される。

判定対象ＤＢ１２２の各レコード、すなわち各判定情報は、クラウドサーバ６、または他の装置により、予め準備されて格納される。この判定情報は、例えば、ある時刻または時間帯に、ロボット２の近傍に存在するテレビまたはラジオ等の音声放送機器から発せられる可能性のあるキーワードを指定するものであってもよい。

すなわち、判定対象ＤＢ１２２の「キーワード」列に記憶されたキーワードは、テレビまたはラジオ等の番組において話される予定の台詞の少なくとも一部であり、「日付」列および「時刻」列に記憶された時刻（または時間帯）は、該番組において該台詞が話されると予測される時刻または時間帯であることが望ましい。

このように、放送予定または放送中のある番組で発せられる台詞の少なくとも一部と、該台詞の発せられるタイミングとを判定情報として判定対象ＤＢ１２２に格納しておくことで、後述する応答判定部１０３は、該台詞に対してロボット２が応答しないようにすることができる。

サーバ制御部１０は、クラウドサーバ６を統括的に制御する。サーバ制御部１０は、音声認識部１０１と、情報取得部（認識情報取得部）１０２と、応答判定部１０３と、応答作成部１０４とを含む。音声認識部１０１および応答作成部１０４の処理内容は、図１の説明における音声認識部１０１および応答作成部１０４と同様である。

本実施形態に係る情報取得部１０２は、音声認識部１０１から取得した認識情報を応答判定部１０３に送る。本実施形態に係る応答判定部１０３は、情報取得部１０２から取得した認識情報に応じて、応答メッセージを作成するか否か（すなわち、会話ロボット２に応答を実行させるか否か）を判定する。具体的には、応答判定部１０３は、記憶部１２の判定対象ＤＢ１２２を参照して、認識情報に含まれる時刻（音声入力時刻）と同一時刻を示し、かつ、認識情報に含まれる音声認識の結果と同一のキーワードを示すレコードが有るか否かを、判定する。なお、判定情報が時刻ではなく時間帯を指定している場合は、認識情報に含まれる時刻が、該時間帯の範囲内である場合は、「同一時刻である」とみなしてよい。

同一時刻かつ同一のキーワードを示すレコードがない場合、応答判定部１０３は、応答メッセージを作成すると判定する。一方、同一時刻かつ同一のキーワードを示すレコードがある場合、応答判定部１０３は、応答メッセージを作成しないと判定する。なお、本実施形態では、認識結果の文字列と判定情報のキーワードとの一致割合が予め設定された閾値以上である場合、これらが「同一」であると判定してよい。

応答作成部１０４は応答メッセージを作成して、該応答メッセージを、サーバ通信部１１を介して会話ロボット２に送信する。会話ロボット２からロボット識別情報を受信していた場合、応答作成部１０４は、認識結果に対応付けられていたロボット識別情報が示す会話ロボット２に向けて、応答メッセージを送信してもよい。これにより、ある会話ロボット２において取得された音声に対応する応答メッセージを、該会話ロボット２に返すことができる。

≪処理の流れ≫
続いて、応答システム４００における応答要否判定処理の流れについて、図１０を参照して説明する。図１０は、応答システム４００における応答要否判定処理の流れを示すフローチャートである。なお、図１０の例は、図４および図７と同様に、ある入力音声についての（入力１回についての）、応答要否判定処理の流れを示している。

会話ロボット２の制御部２０は、マイク２２から周囲の音声を入力されると、音声入力時刻を取得する。制御部２０は、入力された音声に、音声入力時刻（および、ロボット識別情報）を対応付けてクラウドサーバ６に送信する。クラウドサーバ６のサーバ制御部１０は該音声および音声入力時刻（および、ロボット識別情報）を取得する（Ｓ５０）。音声認識部１０１は取得した音声について、音声認識を実行し（Ｓ５２）、認識結果と音声入力時刻とを対応付けて認識情報を作成する（Ｓ５４）。音声認識部１０１は情報取得部１０２に認識情報を送信する。

情報取得部１０２は認識情報を受信すると（認識情報取得ステップ）、該認識情報を応答判定部１０３に送信する。応答判定部１０３は認識情報を受信すると、該認識情報が判定対象ＤＢ１２２の判定情報と同一か否かを判定する（Ｓ５６、応答判定ステップ）。すなわち、応答判定部１０３は、認識情報が示す音声入力時刻と時刻が同一（または音声入力時刻を含む時間帯の範囲内）であり、かつ、認識情報が示す音声認識の結果とキーワードが一致するレコードが判定対象ＤＢ１２２に存在するか否かを判定する。認識情報が判定対象ＤＢ１２２の判定情報と同一である場合（Ｓ５６でＹＥＳ）、応答判定部１０３は応答メッセージを作成しないと判定する（Ｓ６２）。一方、同一でない場合（Ｓ５６でＮＯ）、応答判定部１０３は応答メッセージを作成すると判定し（Ｓ５８）、応答作成部１０４は認識結果に応じた応答メッセージを作成する（Ｓ６０）。応答作成部１０４は作成した応答メッセージを会話ロボット２に送信し、会話ロボット２は該応答メッセージをスピーカ２３から出力する。

前記の処理によれば、応答システム４００は、音声入力がなされる予定の時刻または時間帯と、予測される音声認識の結果とを含む判定情報を予め記憶部に格納しておく。そして、会話ロボット２が得た音声入力から作成された認識情報に含まれる、時刻および音声認識結果が、いずれかの判定情報の時刻または時間帯、ならびにキーワードと合致する場合は、会話ロボット２に応答させないようにすることができる。

例えば、テレビまたはラジオの放送のように、応答すべきでないキーワードがいつ発せられるか予め分かっている場合、該応答すべきでないキーワードと、該キーワードが発せられると予測される時刻とを、予め判定情報として記憶部に格納しておくことができる。

これにより、応答システム４００は、ロボット２が適切でないタイミングで応答メッセージを出力することを防止することができる。したがって、応答システム４００は、テレビまたはラジオ等からの出力音声に対する応答要否を、適切に判定することができる。

〔変形例〕
前記各実施形態では、制御装置を搭載した電子機器の例として、会話ロボットを例に挙げて説明を行った。しかしながら、前記各実施形態に係る応答システムに含まれる電子機器は、会話機能を有する機器でさえあればよく、その態様は会話ロボットに限定されない。例えば、応答システムは、電子機器として携帯端末やパソコンなどの情報機器、スピーカ単体、電子レンジ、ならびに冷蔵庫等の家電機器を含んでいてもよい。

〔ソフトウェアによる実現例〕
クラウドサーバ１および３、ならびに会話ロボット２、４、および５の制御ブロックは、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ソフトウェアによって実現してもよい。

後者の場合、クラウドサーバ１および３、ならびに会話ロボット２、４、および５は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも１つのプロセッサ（制御装置）を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも１つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばＣＰＵ（Central Processing Unit）を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ＲＯＭ（Read Only Memory）等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するＲＡＭ（Random Access Memory）などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

〔まとめ〕
本発明の態様１に係る判定装置（サーバ制御部１０または制御部２０）は、音声入力装置（マイク２２）を備える電子機器（会話ロボット２または４）による応答の要否を判定する判定装置であって、前記音声入力装置に入力された音声についての音声認識の結果と、該音声が入力された時刻である音声入力時刻、または前記音声認識を行った時刻である認識時刻とを対応付けた認識情報を取得する情報取得部（情報取得部１０２または制御部２０）と、前記認識情報に応じた応答を実行させるか否かを判定する応答判定部（応答判定部１０３または応答判定部２０３）と、を備え、前記応答判定部は、前記認識情報の取得前、または前記認識情報の取得から所定時間内に、前記認識情報と同一内容の第２認識情報を取得した場合は、前記認識情報に応じた前記応答を実行させないと判定する。

例えばテレビ番組の音声等では、同時刻に別の場所で（別のテレビから）同じ音声出力がなされる。前記の構成によれば、判定装置は、同時に同内容の認識結果が得られた場合、該認識結果を示す認識情報については、該認識情報に応じた前記応答を実行させないと判定する。したがって、判定装置は、テレビまたはラジオ等からの出力音声による誤反応を防止することができる。

本発明の態様２に係る判定装置は、上記態様１において、複数の電子機器から、前記音声入力時刻および前記音声を取得して音声認識し、該音声認識の結果と前記音声入力時刻または前記認識時刻とを対応付けて認識情報を作成する音声認識部（音声認識部１０１）を備えていてもよい。

前記の構成によれば、電子機器は、音声さえ取得し判定装置に送信することができるならば、音声認識機能、および認識情報を作成する機能を備えていなくともよい。したがって、判定装置は、より多種の電子機器から音声を収集し応答要否の判定を行うことができる。

本発明の態様３に係る判定装置は、上記態様１において、前記情報取得部は、複数の前記電子機器から前記認識情報を取得してもよい。

前記の構成によれば、判定装置は自装置で音声認識と、音声入力時刻または認識時刻の特定とを行わなくてもよい。このように判定装置の処理負荷を軽減させることができるため、応答判定部における判定処理の速度を向上させることができる。

本発明の態様４に係る判定装置は、上記態様１から３のいずれか一態様において、前記応答判定部の判定結果に応じて、前記認識情報に応じた応答メッセージを作成する応答作成部を備えていてもよい。

前記の構成によれば、応答判定部が応答を実行させると判定した場合、認識情報に応じた応答メッセージを作成することができる。

本発明の態様５に係る判定装置は、上記態様１から３のいずれか一態様において、前記認識情報には、音声認識の対象となった音声を取得した電子機器を特定するための識別情報が含まれており、前記応答判定部の判定結果を、該判定が下された認識情報に含まれる前記識別情報に応じた電子機器に対して送信する判定結果送信部（応答判定部１０３）を備えていてもよい。

前記の構成によれば、判定装置は自装置で応答メッセージまたは応答動作等、応答に関する詳細な制御内容を決定しなくともよい。したがって判定装置の処理負荷を軽減させることができる。また、前記の構成によれば、判定装置は電子機器に、応答可否の判定結果のみを送信すればよい。したがって、判定装置において応答内容を決定し、該内容を示す情報を電子機器に送信する場合に比べ、通信データの容量を削減して通信に係る負荷を軽減することができる。以上のことから、前記構成によれば、判定装置における各種処理の速度を向上させることができる。

本発明の態様６に係る判定装置は、上記態様１から５のいずれか一態様において、前記情報取得部が取得した前記認識情報を記憶部に格納する認識情報格納部（情報取得部１０２）を備え、前記応答判定部は、所定のタイミングで、前記記憶部に格納された各認識情報について、それぞれの認識情報に応じた応答を作成するか否かを判定してもよい。

前記の構成によれば、例えば複数の電子機器からほぼ同時に音声（または認識情報）を受信した場合に、それぞれの音声（または認識情報）についての判定を、所定のタイミングで順次行うことができる。

例えばテレビ番組の音声は、同時刻に別の場所で同じ音声出力がなされる。この場合、複数の電子がほぼ同時に音声を取得し、判定装置に送信すると考えられる。前記の構成によれば、このような場合にも正確に判定処理を行うことができる。

本発明の態様７に係る判定装置は、上記態様１から６のいずれか一態様において、前記応答判定部は、記憶部に予め格納された、音声入力がなされる予定の時刻または時間帯と、予測される音声認識の結果の少なくとも一部を示す所定のキーワードとを対応付けた情報である判定情報を参照し、前記認識情報に含まれる前記音声入力時刻または前記認識時刻、および前記音声認識の結果が、前記判定情報の前記予定の時刻または時間帯、および音声認識の結果とそれぞれ合致する場合は、該認識情報に応じた応答を作成しないと判定してもよい。

前記の構成によれば、音声入力がなされる予定の時刻または時間帯と、予測される音声認識の結果とを予め判定情報として格納しておき、音声入力装置からの認識情報が、これら時刻または時間帯、および音声認識の結果と合致する場合は、電子機器に応答させないようにすることができる。

例えば、テレビまたはラジオの放送のように、応答すべきでないキーワードがいつ発せられるか予め分かっている場合、該応答すべきでないキーワードと、該キーワードが発せられると予測される時刻とを、予め判定情報として格納しておくことができる。これにより、判定装置は、電子機器が適切でないタイミングで応答メッセージを出力することを防止することができる。したがって、前記の構成によれば、テレビまたはラジオ等からの出力音声に対する応答要否を適切に判定することができる。

本発明の態様８に係る電子機器（会話ロボット２および４）は、音声入力装置（マイク２２）を備えた電子機器であって、前記態様１に記載の判定装置の判定結果に従って応答を実行する応答部を備える。

本発明の態様９に係る応答システム（応答システム１００、２００、３００、および４００）は、前記態様１から７のいずれか一態様に記載の判定装置と、前記態様８に記載の電子機器と、を含む。

本発明の態様１０に係る判定装置（サーバ制御部１０または制御部２０）の制御方法は、音声入力装置（マイク２２）を備える電子機器（会話ロボット２または４）による応答の要否を判定する判定装置の制御方法であって、前記音声入力装置に入力された音声についての音声認識の結果と、該音声が入力された時刻である音声入力時刻、または前記音声認識を行った時刻である認識時刻とを対応付けた認識情報を取得する情報取得ステップと、前記認識情報に応じた応答を実行させるか否かを判定する応答判定ステップと、を含み、前記応答判定ステップでは、前記認識情報の取得前、または前記認識情報の取得から所定時間内に、前記認識情報と同一内容の第２認識情報を取得した場合は、前記認識情報に応じた前記応答を実行させないと判定する。

前記態様８から１０のいずれか一態様に係る構成によれば、前記態様１に記載の判定装置と同様の効果を奏する。

本発明の各態様に係る判定装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記判定装置が備える各部（ソフトウェア要素）として動作させることにより上記判定装置をコンピュータにて実現させる判定装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

１００、２００、３００、４００応答システム
１、３、６クラウドサーバ
２、４、５会話ロボット
１０サーバ制御部（判定装置）
１０１音声認識部
１０２情報取得部（認識情報格納部）
１０３応答判定部（判定結果送信部）
１０４応答作成部
１１サーバ通信部
１２、２４記憶部
１２１、１２２判定対象ＤＢ
２０制御部（判定装置）
２０１音声認識部
２０２応答作成部
２０３応答判定部
２１通信部
２２マイク（音声入力装置）
２３スピーカ

Claims

音声入力装置を備える電子機器による応答の要否を判定する判定装置であって、
前記音声入力装置に入力された音声についての音声認識の結果と、該音声が入力された時刻である音声入力時刻、または前記音声認識を行った時刻である認識時刻とを対応付けた認識情報を取得する情報取得部と、
前記認識情報に応じた応答を実行させるか否かを判定する応答判定部と、を備え、
前記応答判定部は、前記認識情報の取得前、または前記認識情報の取得から所定時間内に、前記認識情報と同一内容の第２認識情報を取得した場合は、前記認識情報に応じた前記応答を実行させないと判定することを特徴とする、判定装置。
複数の電子機器から、前記音声入力時刻および前記音声を取得して音声認識し、該音声認識の結果と前記音声入力時刻または前記認識時刻とを対応付けて認識情報を作成する音声認識部を備えることを特徴とする、請求項１に記載の判定装置。
前記情報取得部は、複数の前記電子機器から前記認識情報を取得することを特徴とする、請求項１に記載の判定装置。
前記応答判定部の判定結果に応じて、前記認識情報に応じた応答メッセージを作成する応答作成部を備えることを特徴とする、請求項１〜３のいずれか１項に記載の判定装置。
前記認識情報には、音声認識の対象となった音声を取得した電子機器を特定するための識別情報が含まれており、
前記応答判定部の判定結果を、該判定が下された認識情報に含まれる前記識別情報に応じた電子機器に対して送信する判定結果送信部を備えることを特徴とする、請求項１〜３のいずれか１項に記載の判定装置。
前記情報取得部が取得した前記認識情報を記憶部に格納する認識情報格納部を備え、
前記応答判定部は、所定のタイミングで、前記記憶部に格納された各認識情報について、それぞれの認識情報に応じた応答を作成するか否かを判定することを特徴とする、請求項１〜５のいずれか１項に記載の判定装置。
前記応答判定部は、
記憶部に予め格納された、音声入力がなされる予定の時刻または時間帯と、予測される音声認識の結果の少なくとも一部を示す所定のキーワードとを対応付けた情報である判定情報を参照し、
前記認識情報に含まれる前記音声入力時刻または前記認識時刻、および前記音声認識の結果が、前記判定情報の前記予定の時刻または時間帯、および音声認識の結果とそれぞれ合致する場合は、該認識情報に応じた応答を作成しないと判定することを特徴とする、請求項１〜６のいずれか１項に記載の判定装置。
音声入力装置を備えた電子機器であって、
請求項１に記載の判定装置の判定結果に従って応答を実行する応答部を備えることを特徴とする、電子機器。
請求項１〜７のいずれか１項に記載の判定装置と、
請求項８に記載の電子機器と、を含む、応答システム。
音声入力装置を備える電子機器による応答の要否を判定する判定装置の制御方法であって、
前記音声入力装置に入力された音声についての音声認識の結果と、該音声が入力された時刻である音声入力時刻、または前記音声認識を行った時刻である認識時刻とを対応付けた認識情報を取得する情報取得ステップと、
前記認識情報に応じた応答を実行させるか否かを判定する応答判定ステップと、を含み、
前記応答判定ステップでは、前記認識情報の取得前、または前記認識情報の取得から所定時間内に、前記認識情報と同一内容の第２認識情報を取得した場合は、前記認識情報に応じた前記応答を実行させないと判定することを特徴とする、判定装置の制御方法。
請求項１に記載の判定装置としてコンピュータを機能させるための制御プログラムであって、上記情報取得部および上記応答判定部としてコンピュータを機能させるための制御プログラム。