JP2018180409A

JP2018180409A - 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法

Info

Publication number: JP2018180409A
Application number: JP2017082789A
Authority: JP
Inventors: 喬子下田; Kyoko Shimoda; 匠武井; Takumi Takei
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2017-04-19
Filing date: 2017-04-19
Publication date: 2018-11-15

Abstract

【課題】待機時間を適切に変更することが可能な技術を提供することを目的とする。【解決手段】音声認識装置は、音声認識部が音声を認識してから予め定められた待機時間以内に受信部がサーバ認識結果を受信しなかった場合に、音声認識部の認識結果を音声認識装置の認識結果として確定する認識結果確定部と、音声認識装置に関する現在の状況である現在状況を取得する現在状況取得部と、関連情報と、現在状況取得部で取得された現在状況と、音声認識部の認識結果とに基づいて待機時間を変更する待機時間変更部とを備える。【選択図】図１

Description

本発明は、音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法に関する。

音声の認識が可能なサーバと通信を行うことによって、サーバと協働して音声を認識する音声認識装置について様々な技術が提案されている。例えば特許文献１には、音声認識装置でサーバの認識結果を受信する待機時間が、音声認識装置の認識結果のタイプに基づいて変更される技術が示されている。

特表２０１２−５０１４８０号公報

通常、音声の認識結果には、音声認識装置の現在位置または現在時間に関連する単語が含まれることが多い。このため、音声認識装置の認識結果に、音声認識装置の現在位置または現在時間に関連する単語が含まれている場合には、音声認識装置の認識結果が正しい可能性は比較的高いと考えられる。このような場合に、上述の待機時間を短くして、ユーザに認識結果を提示する時間を短くすれば、ユーザにとって快適な音声認識装置を実現することができる。しかしながら、従来技術では、音声認識装置の認識結果に、音声認識装置の現在位置または現在時間に関連する単語が含まれているか否かに基づいて、待機時間を変更する技術は存在しない。

そこで、本発明は、上記のような問題点を鑑みてなされたものであり、待機時間を適切に変更することが可能な技術を提供することを目的とする。

本発明に係る音声認識装置は、音声の認識が可能なサーバと通信を行うことによって、サーバと協働して音声を認識する音声認識装置であって、音声を取得する音声取得部と、音声取得部で取得された音声をサーバに送信する送信部と、送信部から送信された音声をサーバで認識した結果であるサーバ認識結果をサーバから受信する受信部と、音声取得部で取得された音声を認識する音声認識部と、音声認識部が音声を認識してから予め定められた待機時間以内に受信部がサーバ認識結果を受信しなかった場合に、音声認識部の認識結果を音声認識装置の認識結果として確定する認識結果確定部と、位置及び時間の少なくともいずれか１つである状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とを関連付けた関連情報を記憶した記憶部と、音声認識装置に関する現在の状況である現在状況を取得する現在状況取得部と、関連情報と、現在状況取得部で取得された現在状況と、音声認識部の認識結果とに基づいて待機時間を変更する待機時間変更部とを備える。

本発明によれば、関連情報と、取得された現在状況と、音声認識部の認識結果とに基づいて待機時間を変更するので、待機時間を適切に変更することが可能な音声認識装置を実現することができる。

実施の形態１に係る音声認識システムの構成を示すブロック図である。実施の形態１に係る関連情報の一例を示す図である。実施の形態１に係る音声認識システムの動作を示すフローチャートである。変形例１に係る関連情報の一例を示す図である。変形例１に係る関連情報の一例を示す図である。その他の変形例に係る音声認識装置のハードウェア構成を示すブロック図である。その他の変形例に係る音声認識装置のハードウェア構成を示すブロック図である。

＜実施の形態１＞
図１は、本発明の実施の形態１に係る音声認識システムの構成を示すブロック図である。図１の音声認識システムは、音声認識装置１と、サーバ３１とを備える。音声認識装置１は、カーナビゲーション装置、ＰＮＤ（Portable Navigation Device）などのナビゲーション装置に備えられたり、携帯電話、スマートフォン及びタブレットなどの通信端末に備えられたりする。サーバ３１は、音声認識装置１を備える装置、例えばナビゲーション装置の外に設けられ、音声の認識が可能となっている。

この音声認識装置１は、サーバ３１と無線通信などの通信を行うことによって、サーバ３１と協働して音声を認識するように構成されている。つまり、本実施の形態１に係る音声認識システムは、いわゆるハイブリッド型の音声認識を行うことが可能となっている。

＜音声認識装置＞
音声認識装置１は、ユーザの音声が入力されるマイク１１と接続されている。マイク１１は、入力された音声に基づく音声情報を出力する。なお、音声情報は、ほぼ元の音声に戻すことができることから、音声情報と音声とは同一視できる。そこで以下の説明では、音声と音声情報とを区別せずに記載する。

図１の音声認識装置１は、音声取得部２と、送信部である音声送信部３と、受信部である認識結果受信部４と、記憶部５と、現在状況取得部６と、制御部７と、結果選択部８とを備える。制御部７は、音声認識部７ａと待機時間変更部７ｂとを備える。

音声取得部２は、マイク１１からの音声を取得する。なお、図１では、マイク１１は音声取得部２の外部に設けられているが、音声取得部２の内部に設けられてもよい。

音声送信部３は、音声取得部２で取得された音声をサーバ３１に送信する。この音声送信部３は、例えば、サーバ３１と無線通信などの通信が可能な通信装置である。後述するようにサーバ３１は、音声送信部３から送信された音声を認識する。以下の説明では、サーバ３１が、音声送信部３から送信された音声を認識した結果を「サーバ認識結果」と記す。

認識結果受信部４は、サーバ認識結果を直接的または間接的にサーバ３１から受信する。この認識結果受信部４は、例えば、サーバ３１と無線通信などの通信が可能な通信装置である。後述するように、音声認識部７ａが音声を認識してから待機時間以内に、認識結果受信部４がサーバ認識結果を受信しなかった場合、音声認識装置１は、サーバ認識結果を用いないように構成されている。上述の待機時間には初期値が予め定められているが、待機時間は固定値ではなく、後述するように条件に応じ可変である。

記憶部５は、音声認識装置１の音声認識部７ａで音声の認識を行うためのデータベースである辞書を記憶している。この辞書には、例えば、音声認識部７ａの認識結果となる単語、及び当該単語の音響などが含まれる。

本実施の形態１に係る記憶部５は、関連情報をさらに記憶している。図２は、本実施の形態１に係る関連情報の一例を示す図である。関連情報では、位置及び時間である状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とが関連付けられている。

図２のように本実施の形態１に係る状況は、位置として地域を含み、時間として日時を含む。地域は、例えば、都道府県、及び、関東地方などの八地方区分などを含む。日時は、例えば、分、時間、日、及び、月などを含む。なお、本実施の形態１に係る状況は、位置及び時間の両方を含んでいるが、これに限ったものではなく、位置及び時間の一方を含んでいてもよい。また、関連情報は、音声認識部７ａが用いる辞書の一部として記憶部５に記憶されてもよい。

現在状況取得部６は、音声認識装置１に関する現在の状況である現在状況を取得する。本実施の形態１では、現在状況取得部６は、現在状況として、音声認識装置１の現在の位置及び現在の時間を取得する。例えば、現在状況取得部６は、ＧＰＳ（Global Positioning System）から受信した信号に基づいて、音声認識装置１の現在の位置及び現在の時間を取得してもよい。

音声認識部７ａは、記憶部５に記憶された辞書を用いて、音声取得部２で取得された音声を認識する。

待機時間変更部７ｂは、関連情報と、現在状況取得部６で取得された現在状況と、音声認識部７ａの認識結果とに基づいて待機時間を変更する。本実施の形態１に係る待機時間変更部７ｂは、音声認識部７ａの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部６で取得された現在状況とが対応する場合に、待機時間を短くする。

例えば、音声認識部７ａの認識結果に、図２の関連情報の特定単語の一つである「ねぶた」が含まれ、現在状況取得部６で取得された現在状況が「８月４日」であった場合を想定する。この現在状況「８月４日」は、図２の関連情報において特定単語「ねぶた」に関連付けられた「８月」を含んでいる。このように特定状況の少なくとも一部と現在状況の少なくとも一部とが一致する場合、待機時間変更部７ｂは、特定状況と現在状況とが対応すると判定して、待機時間を短くする。

認識結果確定部である結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信しなかった場合に、音声認識部７ａの認識結果を音声認識装置１の認識結果として確定する。一方、結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置１の認識結果として確定する。

結果選択部８は、確定した認識結果を音声認識装置１の外に出力する。音声認識装置１から出力された認識結果は、例えばユーザに対する表示などに用いられる。音声認識装置１がナビゲーション装置に備えられている場合には、音声認識装置１から出力された認識結果は、ナビゲーション装置の経路探索などに用いられてもよい。

＜サーバ＞
図１のサーバ３１は、音声受信部３２と、記憶部３３と、音声認識部３４と、認識結果送信部３５とを備える。

音声受信部３２は、音声送信部３から送信された音声を直接的または間接的に音声認識装置１から受信する。この音声受信部３２は、例えば、音声認識装置１と無線通信などの通信が可能な通信装置である。

記憶部３３は、サーバ３１の音声認識部３４で音声の認識を行うためのデータベースである辞書を記憶している。この辞書には、例えば、音声認識部３４の認識結果となる単語、及び当該単語の音響などが含まれる。

音声認識部３４は、記憶部３３に記憶された辞書を用いて、音声受信部３２で受信された音声を認識する。

認識結果送信部３５は、音声認識部３４の認識結果、つまりサーバ認識結果を音声認識装置１に送信する。この認識結果送信部３５は、例えば、音声認識装置１と無線通信などの通信が可能な通信装置である。

＜動作＞
図３は、本実施の形態１に係る音声認識システムの動作を示すフローチャートである。

まずステップＳ１にて、音声取得部２はユーザが発した音声を取得する。その後、処理がステップＳ２とステップＳ１１とに進む。

ステップＳ２にて、音声認識装置１の音声認識部７ａは、音声取得部２で取得された音声を認識する。

ステップＳ３にて、現在状況取得部６は、現在状況を取得する。なお、このステップＳ３はステップＳ１またはステップＳ２の前に行われてもよい。

ステップＳ４にて、待機時間変更部７ｂは、音声認識部７ａの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部６で取得された現在状況とが対応するか否かを判定する。判定結果がＹｅｓの場合には、処理がステップＳ５に進み、判定結果がＮｏの場合には、処理がステップＳ６に進む。

ステップＳ５にて、待機時間変更部７ｂは、待機時間を１秒に設定する。その後、処理がステップＳ２１に進む。

ステップＳ６にて、待機時間変更部７ｂは、待機時間を２秒に設定する。その後、処理がステップＳ２１に進む。

なお、ステップＳ５及びステップＳ６の待機時間はこれらの数値に限ったものではなく、ステップＳ５の待機時間がステップＳ６の待機時間よりも短ければよい。

さて、ステップＳ１後のステップＳ１１では、音声送信部３は、音声取得部２で取得された音声をサーバ３１に送信する。

ステップＳ１２にて、サーバ３１の音声受信部３２は、音声送信部３から送信された音声を受信する。

ステップＳ１３にて、サーバ３１の音声認識部３４は、音声受信部３２で受信された音声を認識する。

ステップＳ１４にて、認識結果送信部３５は、サーバ認識結果を音声認識装置１に送信する。

ステップＳ１５にて、認識結果受信部４は、サーバ認識結果をサーバ３１から受信する。

ステップＳ２１にて、結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信したか否かを判定する。判定結果がＹｅｓの場合には、処理がステップＳ２２に進み、判定結果がＮｏの場合には、処理がステップＳ２３に進む。

ステップＳ２１からステップＳ２２に処理が進んだ場合、結果選択部８は、サーバ認識結果を音声認識装置１の認識結果として確定し、音声認識装置１の外に出力する。その後、図３の処理が終了する。

ステップＳ２１からステップＳ２３に処理が進んだ場合、結果選択部８は、音声認識装置１の音声認識部７ａの認識結果を音声認識装置１の認識結果として確定し、音声認識装置１の外に出力する。その後、図３の処理が終了する。

＜実施の形態１のまとめ＞
以上のような本実施の形態１に係る音声認識装置１によれば、結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置１の認識結果として確定する。そして、待機時間変更部７ｂは、音声認識部７ａの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部６で取得された現在状況とが対応する場合に、待機時間を短くする。

このような構成によれば、特定状況と現在状況とが対応する場合、つまり音声認識部７ａの認識結果が正しい可能性が高い場合には、待機時間を短くすることができる。したがって、この場合には、ユーザに対する応答を早くすることができるので、待機時間を適切に変更することが可能な音声認識装置１を実現することができる。

また、本実施の形態１では、待機時間変更部７ｂは、音声認識部７ａの認識結果に関連情報の特定単語が含まれなかったり、当該特定単語に関連付けられた特定状況と現在状況取得部６で取得された現在状況とが対応しなかったりする場合には、待機時間を短くしない。そして、結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置１の認識結果として確定する。

このような構成によれば、音声認識部７ａの認識結果が正しい可能性が高くない場合には、待機時間を短くしない。これにより例えば、音声取得部２が音声を取得した時点で音声認識装置１が通信しにくいトンネル内に位置していても、その後に、音声認識装置１がトンネルから出て、音声認識部７ａの認識結果よりも精度の高いサーバ認識結果を用いることができる可能性を高めることができる。つまり、音声認識部７ａの認識結果が正しい可能性が高くない場合には、精度が比較的良いサーバ認識結果をなるべく用いることができるので、待機時間を適切に変更することが可能な音声認識装置１を実現することができる。

また本実施の形態１に係る状況は、位置として地域を含み、時間として日時を含むので、適切な状況を用いることができる。ただし、状況はこれに限ったものではなく、位置として住所及び地域の少なくともいずれか１つを含んでもよく、時間として、日時及び季節の少なくともいずれか１つを含んでもよい。

また、以上のような本実施の形態１に係る音声認識装置１を備えるナビゲーション装置であっても、上述の効果と同様の効果を得ることができる。このことは、山道やトンネルが続く道の中を走行している際に、音声認識装置１の認識結果を目的地の設定に用いる場合などに有効である。また、以上のような本実施の形態１に係る音声認識装置１と、サーバ３１とを備える音声認識システムであっても、上述の効果と同様の効果を得ることができる。

＜変形例１＞
図４及び図５は、本変形例１に係る関連情報の一例を示す図である。図４及び図５の関連情報は、特定状況と特定単語とが互いに関連する度合を示す関連度を含んでいる。本変形例１に係る関連情報では、図４のように特定単語に対して日時ごとに第１関連度が規定され、図５のように特定単語に対して位置ごとに第２関連度が規定されている。

さて本変形例１に係る待機時間変更部７ｂは、音声認識部７ａの認識結果に関連情報の特定単語が含まれる場合に、現在状況取得部６で取得された現在状況に対応する特定状況と特定単語との関連度を求める。

例えば、関連情報が図４及び図５のように規定され、特定単語が「スキー」であり、現在状況が「１２月４日１２時０分」及び「長野県」であった場合に、待機時間変更部７ｂは、図４の関連情報から「スキー」と「１２月」とに対応する第１関連度「４」を取得し、図５の関連情報から「スキー」と「長野県」とに対応する第２関連度「５」を取得する。そして、待機時間変更部７ｂは、第１関連度「４」と第２関連度「５」とを合計した「９」を関連度として求める。

待機時間変更部７ｂは、求めた関連度に基づいて待機時間を変更する。例えば、待機時間変更部７ｂは、求めた関連度が予め定められた閾値以上である場合には待機時間を短くし、当該関連度が当該閾値よりも小さい場合には待機時間を短くしないように構成してもよい。

また例えば、待機時間変更部７ｂは、求めた関連度が高いほど待機時間を短くしてもよい。つまり、待機時間変更部７ｂは、音声認識部７ａの認識結果に関連情報の特定単語が含まれる場合に、現在状況取得部６で取得された現在状況に対応する特定状況と特定単語との関連度が高いほど待機時間を短くしてもよい。

以上のような本変形例１に係る音声認識装置１によれば、待機時間を精度よく調整することができるので、待機時間をより適切に変更することができる。

＜変形例２＞
実施の形態１では、結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置１の認識結果として確定した。しかしこれに限ったものではなく、例えば、結果選択部８は、待機時間以内にサーバ認識結果が受信された場合に、サーバ認識結果と音声認識部７ａの認識結果との両方、または、サーバ認識結果と音声認識部７ａの認識結果とに予め定められた規則を適用して得られた認識結果を、音声認識装置１の認識結果として確定してもよい。つまり、結果選択部８は、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信した場合に、サーバ認識結果及び音声認識部７ａの認識結果に基づく認識結果を、音声認識装置１の認識結果として確定してもよい。

＜その他の変形例＞
上述した音声認識装置１における音声取得部２、現在状況取得部６、制御部７、及び、結果選択部８を、以下「音声取得部２等」と記すこともある。音声取得部２等は、図６に示す処理回路８１により実現される。すなわち、処理回路８１は、音声を取得する音声取得部２と、音声取得部２で取得された音声を認識する音声認識部７ａと、音声認識部７ａが音声を認識してから待機時間以内に認識結果受信部４がサーバ認識結果を受信しなかった場合に、音声認識部７ａの認識結果を音声認識装置１の認識結果として確定する結果選択部８と、現在状況を取得する現在状況取得部６と、関連情報と、現在状況と、音声認識部７ａの認識結果とに基づいて待機時間を変更する待機時間変更部７ｂと、を備える。処理回路８１には、専用のハードウェアが適用されてもよいし、メモリに格納されるプログラムを実行するプロセッサが適用されてもよい。プロセッサには、例えば、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、ＤＳＰ（Digital Signal Processor）などが該当する。

処理回路８１が専用のハードウェアである場合、処理回路８１は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）、またはこれらを組み合わせたものが該当する。音声取得部２等の各部の機能それぞれは、処理回路を分散させた回路で実現されてもよいし、各部の機能をまとめて一つの処理回路で実現されてもよい。

処理回路８１がプロセッサである場合、音声取得部２等の機能は、ソフトウェア等との組み合わせにより実現される。なお、ソフトウェア等には、例えば、ソフトウェア、ファームウェア、または、ソフトウェア及びファームウェアが該当する。ソフトウェア等はプログラムとして記述され、メモリ８３に格納される。図７に示すように、処理回路８１に適用されるプロセッサ８２は、メモリ８３に記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、音声認識装置１は、処理回路８１により実行されるときに、音声を取得するステップと、取得された音声を認識するステップと、音声の認識を行ってから待機時間以内に音声認識装置１がサーバ認識結果を受信しなかった場合に、取得された音声を認識して得られた認識結果を音声認識装置１の認識結果として確定するステップと、現在状況を取得するステップと、関連情報と、取得された現在状況と、取得された音声を認識して得られた認識結果とに基づいて待機時間を変更するステップと、が結果的に実行されることになるプログラムを格納するためのメモリ８３を備える。換言すれば、このプログラムは、音声取得部２等の手順や方法をコンピュータに実行させるものであるともいえる。ここで、メモリ８３は、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリー、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）などの、不揮発性または揮発性の半導体メモリ、ＨＤＤ（Hard Disk Drive）、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、ＤＶＤ（Digital Versatile Disc）、そのドライブ装置等、または、今後使用されるあらゆる記憶媒体であってもよい。

以上、音声取得部２等の各機能が、ハードウェア及びソフトウェア等のいずれか一方で実現される構成について説明した。しかしこれに限ったものではなく、音声取得部２等の一部を専用のハードウェアで実現し、別の一部をソフトウェア等で実現する構成であってもよい。例えば、音声取得部２については専用のハードウェアとしての処理回路及びレシーバなどでその機能を実現し、それ以外についてはプロセッサ８２としての処理回路８１がメモリ８３に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。

以上のように、処理回路８１は、ハードウェア、ソフトウェア等、またはこれらの組み合わせによって、上述の各機能を実現することができる。なお、記憶部５は、メモリ８３から構成されるが、それらはそれぞれ複数のメモリから構成されてもよい。

また、以上で説明した音声認識装置１は、ナビゲーション装置と、通信端末と、ナビゲーション装置及び通信端末の少なくともいずれか１つにインストールされるアプリケーションの機能と、サーバとを適宜に組み合わせてシステムとして構築される音声認識システムにも適用することができる。この場合、以上で説明した音声認識装置１の各機能あるいは各構成要素は、前記システムを構築するサーバ以外の各機器に分散して配置されてもよい。その一例として、音声認識装置は、図１のマイク１１などを備える構成であってもよい。

なお、本発明は、その発明の範囲内において、実施の形態を適宜、変形、省略することが可能である。

１音声認識装置、２音声取得部、３音声送信部、４認識結果受信部、５記憶部、６現在状況取得部、７ａ音声認識部、７ｂ待機時間変更部、８結果選択部、３１サーバ。

Claims

音声の認識が可能なサーバと通信を行うことによって、前記サーバと協働して音声を認識する音声認識装置であって、
音声を取得する音声取得部と、
前記音声取得部で取得された前記音声を前記サーバに送信する送信部と、
前記送信部から送信された前記音声を前記サーバで認識した結果であるサーバ認識結果を前記サーバから受信する受信部と、
前記音声取得部で取得された前記音声を認識する音声認識部と、
前記音声認識部が前記音声を認識してから予め定められた待機時間以内に前記受信部が前記サーバ認識結果を受信しなかった場合に、前記音声認識部の認識結果を前記音声認識装置の認識結果として確定する認識結果確定部と、
位置及び時間の少なくともいずれか１つである状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とを関連付けた関連情報を記憶した記憶部と、
前記音声認識装置に関する現在の前記状況である現在状況を取得する現在状況取得部と、
前記関連情報と、前記現在状況取得部で取得された前記現在状況と、前記音声認識部の認識結果とに基づいて前記待機時間を変更する待機時間変更部と
を備える、音声認識装置。
請求項１に記載の音声認識装置であって、
前記待機時間変更部は、
前記音声認識部の認識結果に前記関連情報の前記特定単語が含まれ、かつ、前記特定単語に関連付けられた前記特定状況と前記現在状況取得部で取得された前記現在状況とが対応する場合に、前記待機時間を短くする、音声認識装置。
請求項１または請求項２に記載の音声認識装置であって、
前記関連情報は、前記特定状況と前記特定単語とが互いに関連する度合を示す関連度を含み、
前記待機時間変更部は、
前記音声認識部の認識結果に前記関連情報の前記特定単語が含まれる場合に、前記現在状況に対応する前記特定状況と前記特定単語との前記関連度に基づいて前記待機時間を変更する、音声認識装置。
請求項３に記載の音声認識装置であって、
前記待機時間変更部は、
前記音声認識部の認識結果に前記関連情報の前記特定単語が含まれる場合に、前記現在状況に対応する前記特定状況と前記特定単語との前記関連度が高いほど前記待機時間を短くする、音声認識装置。
請求項１から請求項４のうちのいずれか１項に記載の音声認識装置であって、
前記認識結果確定部は、
前記音声認識部が前記音声を認識してから前記待機時間以内に前記受信部が前記サーバ認識結果を受信した場合に、前記サーバ認識結果、または、前記サーバ認識結果及び前記音声認識部の認識結果に基づく認識結果を前記音声認識装置の認識結果として確定する、音声認識装置。
請求項１から請求項５のうちのいずれか１項に記載の音声認識装置であって、
前記状況は、前記時間として、日時及び季節の少なくともいずれか１つを含む、音声認識装置。
請求項１から請求項６のうちのいずれか１項に記載の音声認識装置であって、
前記状況は、前記位置として、住所及び地域の少なくともいずれか１つを含む、音声認識装置。
請求項１から請求項７のうちのいずれか１項に記載の音声認識装置を備える、ナビゲーション装置。
請求項１から請求項７のうちのいずれか１項に記載の音声認識装置と、
前記サーバと
を備える、音声認識システム。
音声の認識が可能なサーバと通信を行うことによって、前記サーバと協働して音声を認識する音声認識装置の音声認識方法であって、
音声を取得し、
取得された前記音声を前記音声認識装置から前記サーバに送信し、
送信された前記音声を前記サーバで認識した結果であるサーバ認識結果を前記サーバから前記音声認識装置にて受信し、
取得された前記音声を認識し、
前記音声の認識を行ってから予め定められた待機時間以内に前記音声認識装置が前記サーバ認識結果を受信しなかった場合に、取得された前記音声を認識して得られた認識結果を前記音声認識装置の認識結果として確定し、
位置及び時間の少なくともいずれか１つである状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とを関連付けた関連情報が予め規定され、
前記音声認識装置に関する現在の前記状況である現在状況を取得し、
前記関連情報と、取得された前記現在状況と、取得された前記音声を認識して得られた認識結果とに基づいて前記待機時間を変更する、音声認識方法。