JP2018180409A - 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 - Google Patents
音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 Download PDFInfo
- Publication number
- JP2018180409A JP2018180409A JP2017082789A JP2017082789A JP2018180409A JP 2018180409 A JP2018180409 A JP 2018180409A JP 2017082789 A JP2017082789 A JP 2017082789A JP 2017082789 A JP2017082789 A JP 2017082789A JP 2018180409 A JP2018180409 A JP 2018180409A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- unit
- server
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Navigation (AREA)
Abstract
【課題】待機時間を適切に変更することが可能な技術を提供することを目的とする。【解決手段】音声認識装置は、音声認識部が音声を認識してから予め定められた待機時間以内に受信部がサーバ認識結果を受信しなかった場合に、音声認識部の認識結果を音声認識装置の認識結果として確定する認識結果確定部と、音声認識装置に関する現在の状況である現在状況を取得する現在状況取得部と、関連情報と、現在状況取得部で取得された現在状況と、音声認識部の認識結果とに基づいて待機時間を変更する待機時間変更部とを備える。【選択図】図1
Description
本発明は、音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法に関する。
音声の認識が可能なサーバと通信を行うことによって、サーバと協働して音声を認識する音声認識装置について様々な技術が提案されている。例えば特許文献1には、音声認識装置でサーバの認識結果を受信する待機時間が、音声認識装置の認識結果のタイプに基づいて変更される技術が示されている。
通常、音声の認識結果には、音声認識装置の現在位置または現在時間に関連する単語が含まれることが多い。このため、音声認識装置の認識結果に、音声認識装置の現在位置または現在時間に関連する単語が含まれている場合には、音声認識装置の認識結果が正しい可能性は比較的高いと考えられる。このような場合に、上述の待機時間を短くして、ユーザに認識結果を提示する時間を短くすれば、ユーザにとって快適な音声認識装置を実現することができる。しかしながら、従来技術では、音声認識装置の認識結果に、音声認識装置の現在位置または現在時間に関連する単語が含まれているか否かに基づいて、待機時間を変更する技術は存在しない。
そこで、本発明は、上記のような問題点を鑑みてなされたものであり、待機時間を適切に変更することが可能な技術を提供することを目的とする。
本発明に係る音声認識装置は、音声の認識が可能なサーバと通信を行うことによって、サーバと協働して音声を認識する音声認識装置であって、音声を取得する音声取得部と、音声取得部で取得された音声をサーバに送信する送信部と、送信部から送信された音声をサーバで認識した結果であるサーバ認識結果をサーバから受信する受信部と、音声取得部で取得された音声を認識する音声認識部と、音声認識部が音声を認識してから予め定められた待機時間以内に受信部がサーバ認識結果を受信しなかった場合に、音声認識部の認識結果を音声認識装置の認識結果として確定する認識結果確定部と、位置及び時間の少なくともいずれか1つである状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とを関連付けた関連情報を記憶した記憶部と、音声認識装置に関する現在の状況である現在状況を取得する現在状況取得部と、関連情報と、現在状況取得部で取得された現在状況と、音声認識部の認識結果とに基づいて待機時間を変更する待機時間変更部とを備える。
本発明によれば、関連情報と、取得された現在状況と、音声認識部の認識結果とに基づいて待機時間を変更するので、待機時間を適切に変更することが可能な音声認識装置を実現することができる。
<実施の形態1>
図1は、本発明の実施の形態1に係る音声認識システムの構成を示すブロック図である。図1の音声認識システムは、音声認識装置1と、サーバ31とを備える。音声認識装置1は、カーナビゲーション装置、PND(Portable Navigation Device)などのナビゲーション装置に備えられたり、携帯電話、スマートフォン及びタブレットなどの通信端末に備えられたりする。サーバ31は、音声認識装置1を備える装置、例えばナビゲーション装置の外に設けられ、音声の認識が可能となっている。
図1は、本発明の実施の形態1に係る音声認識システムの構成を示すブロック図である。図1の音声認識システムは、音声認識装置1と、サーバ31とを備える。音声認識装置1は、カーナビゲーション装置、PND(Portable Navigation Device)などのナビゲーション装置に備えられたり、携帯電話、スマートフォン及びタブレットなどの通信端末に備えられたりする。サーバ31は、音声認識装置1を備える装置、例えばナビゲーション装置の外に設けられ、音声の認識が可能となっている。
この音声認識装置1は、サーバ31と無線通信などの通信を行うことによって、サーバ31と協働して音声を認識するように構成されている。つまり、本実施の形態1に係る音声認識システムは、いわゆるハイブリッド型の音声認識を行うことが可能となっている。
<音声認識装置>
音声認識装置1は、ユーザの音声が入力されるマイク11と接続されている。マイク11は、入力された音声に基づく音声情報を出力する。なお、音声情報は、ほぼ元の音声に戻すことができることから、音声情報と音声とは同一視できる。そこで以下の説明では、音声と音声情報とを区別せずに記載する。
音声認識装置1は、ユーザの音声が入力されるマイク11と接続されている。マイク11は、入力された音声に基づく音声情報を出力する。なお、音声情報は、ほぼ元の音声に戻すことができることから、音声情報と音声とは同一視できる。そこで以下の説明では、音声と音声情報とを区別せずに記載する。
図1の音声認識装置1は、音声取得部2と、送信部である音声送信部3と、受信部である認識結果受信部4と、記憶部5と、現在状況取得部6と、制御部7と、結果選択部8とを備える。制御部7は、音声認識部7aと待機時間変更部7bとを備える。
音声取得部2は、マイク11からの音声を取得する。なお、図1では、マイク11は音声取得部2の外部に設けられているが、音声取得部2の内部に設けられてもよい。
音声送信部3は、音声取得部2で取得された音声をサーバ31に送信する。この音声送信部3は、例えば、サーバ31と無線通信などの通信が可能な通信装置である。後述するようにサーバ31は、音声送信部3から送信された音声を認識する。以下の説明では、サーバ31が、音声送信部3から送信された音声を認識した結果を「サーバ認識結果」と記す。
認識結果受信部4は、サーバ認識結果を直接的または間接的にサーバ31から受信する。この認識結果受信部4は、例えば、サーバ31と無線通信などの通信が可能な通信装置である。後述するように、音声認識部7aが音声を認識してから待機時間以内に、認識結果受信部4がサーバ認識結果を受信しなかった場合、音声認識装置1は、サーバ認識結果を用いないように構成されている。上述の待機時間には初期値が予め定められているが、待機時間は固定値ではなく、後述するように条件に応じ可変である。
記憶部5は、音声認識装置1の音声認識部7aで音声の認識を行うためのデータベースである辞書を記憶している。この辞書には、例えば、音声認識部7aの認識結果となる単語、及び当該単語の音響などが含まれる。
本実施の形態1に係る記憶部5は、関連情報をさらに記憶している。図2は、本実施の形態1に係る関連情報の一例を示す図である。関連情報では、位置及び時間である状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とが関連付けられている。
図2のように本実施の形態1に係る状況は、位置として地域を含み、時間として日時を含む。地域は、例えば、都道府県、及び、関東地方などの八地方区分などを含む。日時は、例えば、分、時間、日、及び、月などを含む。なお、本実施の形態1に係る状況は、位置及び時間の両方を含んでいるが、これに限ったものではなく、位置及び時間の一方を含んでいてもよい。また、関連情報は、音声認識部7aが用いる辞書の一部として記憶部5に記憶されてもよい。
現在状況取得部6は、音声認識装置1に関する現在の状況である現在状況を取得する。本実施の形態1では、現在状況取得部6は、現在状況として、音声認識装置1の現在の位置及び現在の時間を取得する。例えば、現在状況取得部6は、GPS(Global Positioning System)から受信した信号に基づいて、音声認識装置1の現在の位置及び現在の時間を取得してもよい。
音声認識部7aは、記憶部5に記憶された辞書を用いて、音声取得部2で取得された音声を認識する。
待機時間変更部7bは、関連情報と、現在状況取得部6で取得された現在状況と、音声認識部7aの認識結果とに基づいて待機時間を変更する。本実施の形態1に係る待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部6で取得された現在状況とが対応する場合に、待機時間を短くする。
例えば、音声認識部7aの認識結果に、図2の関連情報の特定単語の一つである「ねぶた」が含まれ、現在状況取得部6で取得された現在状況が「8月4日」であった場合を想定する。この現在状況「8月4日」は、図2の関連情報において特定単語「ねぶた」に関連付けられた「8月」を含んでいる。このように特定状況の少なくとも一部と現在状況の少なくとも一部とが一致する場合、待機時間変更部7bは、特定状況と現在状況とが対応すると判定して、待機時間を短くする。
認識結果確定部である結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信しなかった場合に、音声認識部7aの認識結果を音声認識装置1の認識結果として確定する。一方、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置1の認識結果として確定する。
結果選択部8は、確定した認識結果を音声認識装置1の外に出力する。音声認識装置1から出力された認識結果は、例えばユーザに対する表示などに用いられる。音声認識装置1がナビゲーション装置に備えられている場合には、音声認識装置1から出力された認識結果は、ナビゲーション装置の経路探索などに用いられてもよい。
<サーバ>
図1のサーバ31は、音声受信部32と、記憶部33と、音声認識部34と、認識結果送信部35とを備える。
図1のサーバ31は、音声受信部32と、記憶部33と、音声認識部34と、認識結果送信部35とを備える。
音声受信部32は、音声送信部3から送信された音声を直接的または間接的に音声認識装置1から受信する。この音声受信部32は、例えば、音声認識装置1と無線通信などの通信が可能な通信装置である。
記憶部33は、サーバ31の音声認識部34で音声の認識を行うためのデータベースである辞書を記憶している。この辞書には、例えば、音声認識部34の認識結果となる単語、及び当該単語の音響などが含まれる。
音声認識部34は、記憶部33に記憶された辞書を用いて、音声受信部32で受信された音声を認識する。
認識結果送信部35は、音声認識部34の認識結果、つまりサーバ認識結果を音声認識装置1に送信する。この認識結果送信部35は、例えば、音声認識装置1と無線通信などの通信が可能な通信装置である。
<動作>
図3は、本実施の形態1に係る音声認識システムの動作を示すフローチャートである。
図3は、本実施の形態1に係る音声認識システムの動作を示すフローチャートである。
まずステップS1にて、音声取得部2はユーザが発した音声を取得する。その後、処理がステップS2とステップS11とに進む。
ステップS2にて、音声認識装置1の音声認識部7aは、音声取得部2で取得された音声を認識する。
ステップS3にて、現在状況取得部6は、現在状況を取得する。なお、このステップS3はステップS1またはステップS2の前に行われてもよい。
ステップS4にて、待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部6で取得された現在状況とが対応するか否かを判定する。判定結果がYesの場合には、処理がステップS5に進み、判定結果がNoの場合には、処理がステップS6に進む。
ステップS5にて、待機時間変更部7bは、待機時間を1秒に設定する。その後、処理がステップS21に進む。
ステップS6にて、待機時間変更部7bは、待機時間を2秒に設定する。その後、処理がステップS21に進む。
なお、ステップS5及びステップS6の待機時間はこれらの数値に限ったものではなく、ステップS5の待機時間がステップS6の待機時間よりも短ければよい。
さて、ステップS1後のステップS11では、音声送信部3は、音声取得部2で取得された音声をサーバ31に送信する。
ステップS12にて、サーバ31の音声受信部32は、音声送信部3から送信された音声を受信する。
ステップS13にて、サーバ31の音声認識部34は、音声受信部32で受信された音声を認識する。
ステップS14にて、認識結果送信部35は、サーバ認識結果を音声認識装置1に送信する。
ステップS15にて、認識結果受信部4は、サーバ認識結果をサーバ31から受信する。
ステップS21にて、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信したか否かを判定する。判定結果がYesの場合には、処理がステップS22に進み、判定結果がNoの場合には、処理がステップS23に進む。
ステップS21からステップS22に処理が進んだ場合、結果選択部8は、サーバ認識結果を音声認識装置1の認識結果として確定し、音声認識装置1の外に出力する。その後、図3の処理が終了する。
ステップS21からステップS23に処理が進んだ場合、結果選択部8は、音声認識装置1の音声認識部7aの認識結果を音声認識装置1の認識結果として確定し、音声認識装置1の外に出力する。その後、図3の処理が終了する。
<実施の形態1のまとめ>
以上のような本実施の形態1に係る音声認識装置1によれば、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置1の認識結果として確定する。そして、待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部6で取得された現在状況とが対応する場合に、待機時間を短くする。
以上のような本実施の形態1に係る音声認識装置1によれば、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置1の認識結果として確定する。そして、待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれ、かつ、当該特定単語に関連付けられた特定状況と現在状況取得部6で取得された現在状況とが対応する場合に、待機時間を短くする。
このような構成によれば、特定状況と現在状況とが対応する場合、つまり音声認識部7aの認識結果が正しい可能性が高い場合には、待機時間を短くすることができる。したがって、この場合には、ユーザに対する応答を早くすることができるので、待機時間を適切に変更することが可能な音声認識装置1を実現することができる。
また、本実施の形態1では、待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれなかったり、当該特定単語に関連付けられた特定状況と現在状況取得部6で取得された現在状況とが対応しなかったりする場合には、待機時間を短くしない。そして、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置1の認識結果として確定する。
このような構成によれば、音声認識部7aの認識結果が正しい可能性が高くない場合には、待機時間を短くしない。これにより例えば、音声取得部2が音声を取得した時点で音声認識装置1が通信しにくいトンネル内に位置していても、その後に、音声認識装置1がトンネルから出て、音声認識部7aの認識結果よりも精度の高いサーバ認識結果を用いることができる可能性を高めることができる。つまり、音声認識部7aの認識結果が正しい可能性が高くない場合には、精度が比較的良いサーバ認識結果をなるべく用いることができるので、待機時間を適切に変更することが可能な音声認識装置1を実現することができる。
また本実施の形態1に係る状況は、位置として地域を含み、時間として日時を含むので、適切な状況を用いることができる。ただし、状況はこれに限ったものではなく、位置として住所及び地域の少なくともいずれか1つを含んでもよく、時間として、日時及び季節の少なくともいずれか1つを含んでもよい。
また、以上のような本実施の形態1に係る音声認識装置1を備えるナビゲーション装置であっても、上述の効果と同様の効果を得ることができる。このことは、山道やトンネルが続く道の中を走行している際に、音声認識装置1の認識結果を目的地の設定に用いる場合などに有効である。また、以上のような本実施の形態1に係る音声認識装置1と、サーバ31とを備える音声認識システムであっても、上述の効果と同様の効果を得ることができる。
<変形例1>
図4及び図5は、本変形例1に係る関連情報の一例を示す図である。図4及び図5の関連情報は、特定状況と特定単語とが互いに関連する度合を示す関連度を含んでいる。本変形例1に係る関連情報では、図4のように特定単語に対して日時ごとに第1関連度が規定され、図5のように特定単語に対して位置ごとに第2関連度が規定されている。
図4及び図5は、本変形例1に係る関連情報の一例を示す図である。図4及び図5の関連情報は、特定状況と特定単語とが互いに関連する度合を示す関連度を含んでいる。本変形例1に係る関連情報では、図4のように特定単語に対して日時ごとに第1関連度が規定され、図5のように特定単語に対して位置ごとに第2関連度が規定されている。
さて本変形例1に係る待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれる場合に、現在状況取得部6で取得された現在状況に対応する特定状況と特定単語との関連度を求める。
例えば、関連情報が図4及び図5のように規定され、特定単語が「スキー」であり、現在状況が「12月4日12時0分」及び「長野県」であった場合に、待機時間変更部7bは、図4の関連情報から「スキー」と「12月」とに対応する第1関連度「4」を取得し、図5の関連情報から「スキー」と「長野県」とに対応する第2関連度「5」を取得する。そして、待機時間変更部7bは、第1関連度「4」と第2関連度「5」とを合計した「9」を関連度として求める。
待機時間変更部7bは、求めた関連度に基づいて待機時間を変更する。例えば、待機時間変更部7bは、求めた関連度が予め定められた閾値以上である場合には待機時間を短くし、当該関連度が当該閾値よりも小さい場合には待機時間を短くしないように構成してもよい。
また例えば、待機時間変更部7bは、求めた関連度が高いほど待機時間を短くしてもよい。つまり、待機時間変更部7bは、音声認識部7aの認識結果に関連情報の特定単語が含まれる場合に、現在状況取得部6で取得された現在状況に対応する特定状況と特定単語との関連度が高いほど待機時間を短くしてもよい。
以上のような本変形例1に係る音声認識装置1によれば、待機時間を精度よく調整することができるので、待機時間をより適切に変更することができる。
<変形例2>
実施の形態1では、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置1の認識結果として確定した。しかしこれに限ったものではなく、例えば、結果選択部8は、待機時間以内にサーバ認識結果が受信された場合に、サーバ認識結果と音声認識部7aの認識結果との両方、または、サーバ認識結果と音声認識部7aの認識結果とに予め定められた規則を適用して得られた認識結果を、音声認識装置1の認識結果として確定してもよい。つまり、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果及び音声認識部7aの認識結果に基づく認識結果を、音声認識装置1の認識結果として確定してもよい。
実施の形態1では、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果を音声認識装置1の認識結果として確定した。しかしこれに限ったものではなく、例えば、結果選択部8は、待機時間以内にサーバ認識結果が受信された場合に、サーバ認識結果と音声認識部7aの認識結果との両方、または、サーバ認識結果と音声認識部7aの認識結果とに予め定められた規則を適用して得られた認識結果を、音声認識装置1の認識結果として確定してもよい。つまり、結果選択部8は、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信した場合に、サーバ認識結果及び音声認識部7aの認識結果に基づく認識結果を、音声認識装置1の認識結果として確定してもよい。
<その他の変形例>
上述した音声認識装置1における音声取得部2、現在状況取得部6、制御部7、及び、結果選択部8を、以下「音声取得部2等」と記すこともある。音声取得部2等は、図6に示す処理回路81により実現される。すなわち、処理回路81は、音声を取得する音声取得部2と、音声取得部2で取得された音声を認識する音声認識部7aと、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信しなかった場合に、音声認識部7aの認識結果を音声認識装置1の認識結果として確定する結果選択部8と、現在状況を取得する現在状況取得部6と、関連情報と、現在状況と、音声認識部7aの認識結果とに基づいて待機時間を変更する待機時間変更部7bと、を備える。処理回路81には、専用のハードウェアが適用されてもよいし、メモリに格納されるプログラムを実行するプロセッサが適用されてもよい。プロセッサには、例えば、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)などが該当する。
上述した音声認識装置1における音声取得部2、現在状況取得部6、制御部7、及び、結果選択部8を、以下「音声取得部2等」と記すこともある。音声取得部2等は、図6に示す処理回路81により実現される。すなわち、処理回路81は、音声を取得する音声取得部2と、音声取得部2で取得された音声を認識する音声認識部7aと、音声認識部7aが音声を認識してから待機時間以内に認識結果受信部4がサーバ認識結果を受信しなかった場合に、音声認識部7aの認識結果を音声認識装置1の認識結果として確定する結果選択部8と、現在状況を取得する現在状況取得部6と、関連情報と、現在状況と、音声認識部7aの認識結果とに基づいて待機時間を変更する待機時間変更部7bと、を備える。処理回路81には、専用のハードウェアが適用されてもよいし、メモリに格納されるプログラムを実行するプロセッサが適用されてもよい。プロセッサには、例えば、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)などが該当する。
処理回路81が専用のハードウェアである場合、処理回路81は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、またはこれらを組み合わせたものが該当する。音声取得部2等の各部の機能それぞれは、処理回路を分散させた回路で実現されてもよいし、各部の機能をまとめて一つの処理回路で実現されてもよい。
処理回路81がプロセッサである場合、音声取得部2等の機能は、ソフトウェア等との組み合わせにより実現される。なお、ソフトウェア等には、例えば、ソフトウェア、ファームウェア、または、ソフトウェア及びファームウェアが該当する。ソフトウェア等はプログラムとして記述され、メモリ83に格納される。図7に示すように、処理回路81に適用されるプロセッサ82は、メモリ83に記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、音声認識装置1は、処理回路81により実行されるときに、音声を取得するステップと、取得された音声を認識するステップと、音声の認識を行ってから待機時間以内に音声認識装置1がサーバ認識結果を受信しなかった場合に、取得された音声を認識して得られた認識結果を音声認識装置1の認識結果として確定するステップと、現在状況を取得するステップと、関連情報と、取得された現在状況と、取得された音声を認識して得られた認識結果とに基づいて待機時間を変更するステップと、が結果的に実行されることになるプログラムを格納するためのメモリ83を備える。換言すれば、このプログラムは、音声取得部2等の手順や方法をコンピュータに実行させるものであるともいえる。ここで、メモリ83は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリー、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)などの、不揮発性または揮発性の半導体メモリ、HDD(Hard Disk Drive)、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD(Digital Versatile Disc)、そのドライブ装置等、または、今後使用されるあらゆる記憶媒体であってもよい。
以上、音声取得部2等の各機能が、ハードウェア及びソフトウェア等のいずれか一方で実現される構成について説明した。しかしこれに限ったものではなく、音声取得部2等の一部を専用のハードウェアで実現し、別の一部をソフトウェア等で実現する構成であってもよい。例えば、音声取得部2については専用のハードウェアとしての処理回路及びレシーバなどでその機能を実現し、それ以外についてはプロセッサ82としての処理回路81がメモリ83に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
以上のように、処理回路81は、ハードウェア、ソフトウェア等、またはこれらの組み合わせによって、上述の各機能を実現することができる。なお、記憶部5は、メモリ83から構成されるが、それらはそれぞれ複数のメモリから構成されてもよい。
また、以上で説明した音声認識装置1は、ナビゲーション装置と、通信端末と、ナビゲーション装置及び通信端末の少なくともいずれか1つにインストールされるアプリケーションの機能と、サーバとを適宜に組み合わせてシステムとして構築される音声認識システムにも適用することができる。この場合、以上で説明した音声認識装置1の各機能あるいは各構成要素は、前記システムを構築するサーバ以外の各機器に分散して配置されてもよい。その一例として、音声認識装置は、図1のマイク11などを備える構成であってもよい。
なお、本発明は、その発明の範囲内において、実施の形態を適宜、変形、省略することが可能である。
1 音声認識装置、2 音声取得部、3 音声送信部、4 認識結果受信部、5 記憶部、6 現在状況取得部、7a 音声認識部、7b 待機時間変更部、8 結果選択部、31 サーバ。
Claims (10)
- 音声の認識が可能なサーバと通信を行うことによって、前記サーバと協働して音声を認識する音声認識装置であって、
音声を取得する音声取得部と、
前記音声取得部で取得された前記音声を前記サーバに送信する送信部と、
前記送信部から送信された前記音声を前記サーバで認識した結果であるサーバ認識結果を前記サーバから受信する受信部と、
前記音声取得部で取得された前記音声を認識する音声認識部と、
前記音声認識部が前記音声を認識してから予め定められた待機時間以内に前記受信部が前記サーバ認識結果を受信しなかった場合に、前記音声認識部の認識結果を前記音声認識装置の認識結果として確定する認識結果確定部と、
位置及び時間の少なくともいずれか1つである状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とを関連付けた関連情報を記憶した記憶部と、
前記音声認識装置に関する現在の前記状況である現在状況を取得する現在状況取得部と、
前記関連情報と、前記現在状況取得部で取得された前記現在状況と、前記音声認識部の認識結果とに基づいて前記待機時間を変更する待機時間変更部と
を備える、音声認識装置。 - 請求項1に記載の音声認識装置であって、
前記待機時間変更部は、
前記音声認識部の認識結果に前記関連情報の前記特定単語が含まれ、かつ、前記特定単語に関連付けられた前記特定状況と前記現在状況取得部で取得された前記現在状況とが対応する場合に、前記待機時間を短くする、音声認識装置。 - 請求項1または請求項2に記載の音声認識装置であって、
前記関連情報は、前記特定状況と前記特定単語とが互いに関連する度合を示す関連度を含み、
前記待機時間変更部は、
前記音声認識部の認識結果に前記関連情報の前記特定単語が含まれる場合に、前記現在状況に対応する前記特定状況と前記特定単語との前記関連度に基づいて前記待機時間を変更する、音声認識装置。 - 請求項3に記載の音声認識装置であって、
前記待機時間変更部は、
前記音声認識部の認識結果に前記関連情報の前記特定単語が含まれる場合に、前記現在状況に対応する前記特定状況と前記特定単語との前記関連度が高いほど前記待機時間を短くする、音声認識装置。 - 請求項1から請求項4のうちのいずれか1項に記載の音声認識装置であって、
前記認識結果確定部は、
前記音声認識部が前記音声を認識してから前記待機時間以内に前記受信部が前記サーバ認識結果を受信した場合に、前記サーバ認識結果、または、前記サーバ認識結果及び前記音声認識部の認識結果に基づく認識結果を前記音声認識装置の認識結果として確定する、音声認識装置。 - 請求項1から請求項5のうちのいずれか1項に記載の音声認識装置であって、
前記状況は、前記時間として、日時及び季節の少なくともいずれか1つを含む、音声認識装置。 - 請求項1から請求項6のうちのいずれか1項に記載の音声認識装置であって、
前記状況は、前記位置として、住所及び地域の少なくともいずれか1つを含む、音声認識装置。 - 請求項1から請求項7のうちのいずれか1項に記載の音声認識装置を備える、ナビゲーション装置。
- 請求項1から請求項7のうちのいずれか1項に記載の音声認識装置と、
前記サーバと
を備える、音声認識システム。 - 音声の認識が可能なサーバと通信を行うことによって、前記サーバと協働して音声を認識する音声認識装置の音声認識方法であって、
音声を取得し、
取得された前記音声を前記音声認識装置から前記サーバに送信し、
送信された前記音声を前記サーバで認識した結果であるサーバ認識結果を前記サーバから前記音声認識装置にて受信し、
取得された前記音声を認識し、
前記音声の認識を行ってから予め定められた待機時間以内に前記音声認識装置が前記サーバ認識結果を受信しなかった場合に、取得された前記音声を認識して得られた認識結果を前記音声認識装置の認識結果として確定し、
位置及び時間の少なくともいずれか1つである状況のうちの予め定められた状況である特定状況と、予め定められた単語である特定単語とを関連付けた関連情報が予め規定され、
前記音声認識装置に関する現在の前記状況である現在状況を取得し、
前記関連情報と、取得された前記現在状況と、取得された前記音声を認識して得られた認識結果とに基づいて前記待機時間を変更する、音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017082789A JP2018180409A (ja) | 2017-04-19 | 2017-04-19 | 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017082789A JP2018180409A (ja) | 2017-04-19 | 2017-04-19 | 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018180409A true JP2018180409A (ja) | 2018-11-15 |
Family
ID=64276496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017082789A Pending JP2018180409A (ja) | 2017-04-19 | 2017-04-19 | 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018180409A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111627431A (zh) * | 2020-05-13 | 2020-09-04 | 广州国音智能科技有限公司 | 语音识别方法、装置、终端及存储介质 |
JPWO2020245912A1 (ja) * | 2019-06-04 | 2020-12-10 | ||
CN113251737A (zh) * | 2020-02-13 | 2021-08-13 | 东芝生活电器株式会社 | 信息处理系统 |
CN113838456A (zh) * | 2021-09-28 | 2021-12-24 | 科大讯飞股份有限公司 | 音素提取方法、语音识别方法、装置、设备及存储介质 |
WO2023128721A1 (ko) * | 2022-01-03 | 2023-07-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
CN113838456B (zh) * | 2021-09-28 | 2024-05-31 | 中国科学技术大学 | 音素提取方法、语音识别方法、装置、设备及存储介质 |
-
2017
- 2017-04-19 JP JP2017082789A patent/JP2018180409A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020245912A1 (ja) * | 2019-06-04 | 2020-12-10 | ||
WO2020245912A1 (ja) * | 2019-06-04 | 2020-12-10 | 日本電信電話株式会社 | 音声認識制御装置、音声認識制御方法、およびプログラム |
JP7168080B2 (ja) | 2019-06-04 | 2022-11-09 | 日本電信電話株式会社 | 音声認識制御装置、音声認識制御方法、およびプログラム |
CN113251737A (zh) * | 2020-02-13 | 2021-08-13 | 东芝生活电器株式会社 | 信息处理系统 |
JP7433959B2 (ja) | 2020-02-13 | 2024-02-20 | 東芝ライフスタイル株式会社 | 情報処理システム |
CN111627431A (zh) * | 2020-05-13 | 2020-09-04 | 广州国音智能科技有限公司 | 语音识别方法、装置、终端及存储介质 |
CN111627431B (zh) * | 2020-05-13 | 2022-08-09 | 广州国音智能科技有限公司 | 语音识别方法、装置、终端及存储介质 |
CN113838456A (zh) * | 2021-09-28 | 2021-12-24 | 科大讯飞股份有限公司 | 音素提取方法、语音识别方法、装置、设备及存储介质 |
CN113838456B (zh) * | 2021-09-28 | 2024-05-31 | 中国科学技术大学 | 音素提取方法、语音识别方法、装置、设备及存储介质 |
WO2023128721A1 (ko) * | 2022-01-03 | 2023-07-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018180409A (ja) | 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 | |
US8903651B2 (en) | Information terminal, server device, searching system, and searching method thereof | |
US9105267B2 (en) | Speech recognition apparatus | |
US20190311712A1 (en) | Selection system and method | |
US10349220B2 (en) | Association system, in-vehicle device, association method | |
JP6781719B2 (ja) | ナビゲート可能なルートのナビゲーションシステムへの提供 | |
US8412455B2 (en) | Voice-controlled navigation device and method | |
CN106796606B (zh) | 检索系统 | |
US20200327179A1 (en) | Information providing system, information providing apparatus, and information providing method | |
US20180376309A1 (en) | Information Transfer System, Vehicle-Mounted Terminal, and Information Transfer Method | |
US9366543B1 (en) | Intelligent navigation instruction generator | |
CN113035185A (zh) | 语音命令识别装置及语音命令识别方法 | |
US20190130908A1 (en) | Speech recognition device and method for vehicle | |
KR20230096136A (ko) | 컨텍스트 인식 내비게이션 음성 어시스턴트 | |
US20210108938A1 (en) | Methods and systems for determining a usage preference of a vehicle operator | |
WO2019087302A1 (ja) | 地図情報管理装置、地図情報管理システム、および地図情報管理方法 | |
JP6690341B2 (ja) | 測位制御装置、測位制御方法及びプログラム | |
US11386891B2 (en) | Driving assistance apparatus, vehicle, driving assistance method, and non-transitory storage medium storing program | |
JP6847000B2 (ja) | 経路探索装置及び経路探索方法 | |
US9933275B2 (en) | Navigation device with auto mirroring function and computer readable recording medium storing method of auto mirroring | |
JP2019174509A (ja) | サーバ装置およびpoi読み方通知方法 | |
US20060235608A1 (en) | Message integration method | |
JP2007120973A (ja) | 移動体用アプリケーション実行装置 | |
JPWO2019016882A1 (ja) | 通知制御装置及び通知制御方法 | |
JP2016212610A (ja) | 通信装置及び通信方法 |