JP2010204172A

JP2010204172A - 音声認識装置および音声認識方法

Info

Publication number: JP2010204172A
Application number: JP2009046715A
Authority: JP
Inventors: Yoshiyuki Mizuno; 佳幸水野; Hisashi Takahashi; 久高橋; Osamu Yamashita; 修山下
Original assignee: Xanavi Informatics Corp
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2009-02-27
Filing date: 2009-02-27
Publication date: 2010-09-16

Abstract

【課題】音声認識における認識率を高く保つことができる車載装置２０を提供する。
【解決手段】本発明の車載装置２０は、ユーザが発声した音声の特徴との類似度が高い標準パターンに対応するコマンドを標準パターン格納部２３から抽出して実行する。また、車載装置２０は、ユーザからの手動操作を受け付け、当該手動操作に対応するコマンドを実行する。また、車載装置２０は、ユーザの音声に対応するコマンドを実行してから所定時間が経過するまでの間に、ユーザから手動操作を受け付けた場合に、当該手動操作に対応するコマンドに対応付けて、ユーザの音声から抽出した特徴情報を特徴情報格納部２６に追加登録し、当該追加登録した特徴情報に対応するコマンドについて、当該コマンドに対応付けて特徴情報格納部２６に格納されている複数の特徴情報から、当該コマンドの標準パターンを作成し直して標準パターン格納部２３に登録する。
【選択図】図１

Description

本発明は、車両に搭載され、音声により入力されたコマンドを実行する技術に関する。

下記の特許文献１には、それぞれの単語を所定回数発声させ、その音声からその人の声の特徴を示すＨＭＭ（隠れマルコフモデル）を単語毎に作成し、作成したＨＭＭを用いて音声認識を行う音声認識装置が開示されている。

特開平９−８１１８３号公報

ところで、上記特許文献１では、各単語について、最初に所定回数発声した音声によって作成されたＨＭＭが使われ続けるため、最初のチューニングで失敗すると、最適ではないＨＭＭを使い続けることになり、音声の認識率が低くなる場合がある。また、人の声は、歯並びの変化や成長の過程で変化する場合がある。また、人の声を取り込むマイクも、経年変化や汚れ等により、同一の音声であっても異なる音声として取り込まれる場合がある。そのため、時間の経過と共に、音声の認識率が低下する場合がある。

本発明は上記事情を鑑みてなされたものであり、本発明の目的は、音声認識における認識率を高く保つことにある。

上記課題を解決するために、第１の発明は、ユーザの音声を識別する音声識別手段と、
ユーザの手動操作を受け付ける手動入力手段と、識別される音声または手動入力手段からの入力とコマンドとを対応付けて記憶するコマンド記憶手段と、音声識別手段によって識別された第１のコマンドが入力された後所定時間以内に、手動入力手段によって第１のコマンドと異なる第２のコマンドが入力されたとき、音声識別手段によって識別された音声と第２のコマンドとを対応付けてコマンド記憶手段に記憶する情報追加手段とを備えることを特徴とする音声認識装置を提供する。

また、第２の発明は、ユーザの音声を識別し、音声に対応付けられた第１のコマンドを出力する音声識別ステップと、第１のコマンドが出力された後所定時間以内に、ユーザの手動操作に対応付けられ、第１のコマンドと異なる第２のコマンドを出力する手動入力ステップと、音声識別ステップおよび手動入力ステップが行われたとき、音声識別ステップによって識別された音声と第２のコマンドとを対応付けて記憶する記憶ステップとを備えることを特徴とする音声認識方法を提供する。

本発明の車載装置によれば、音声認識における認識率を高く保つことができる。

本発明の一実施形態に係る車載システム１０の構成を示すシステム構成図である。標準パターン格納部２３に格納されるデータの構造の一例を示す図である。特徴情報格納部２６に格納されるデータの構造の一例を示す図である。グループ情報格納部２４に格納されるデータの構造の一例を示す図である。グループ毎のコマンドの具体例を示す図である。車載装置２０の動作の一例を示すフローチャートである。車載装置２０の機能を実現するコンピュータ３０の一例を示すハードウェア構成図である。

以下、本発明の実施の形態について説明する。

図１は、本発明の一実施形態に係る車載システム１０の構成を示すシステム構成図である。車載システム１０は、車両等の移動体に搭載され、音声認識開始スイッチ１１、マイク１２、入力装置１３、および車載装置２０を備える。車載装置２０は、特徴情報抽出部２１、コマンド抽出部２２、標準パターン格納部２３、グループ情報格納部２４、特徴情報追加部２５、特徴情報格納部２６、標準パターン再作成部２７、手動操作受付部２８、およびコマンド実行部２９を備える。

標準パターン格納部２３には、例えば図２に示すように、それぞれのコマンドを識別するコマンドＩＤ２６０毎に、当該コマンドのコマンド名２３１および当該コマンドをユーザが発声したときのユーザの音声の標準的な特徴を示す標準パターン２３２が格納される。コマンド毎の標準パターンは、初期設定時に後述する標準パターン再作成部２７によって作成され、その後、標準パターン再作成部２７によって随時更新される。

特徴情報格納部２６には、例えば図３に示すように、それぞれのコマンドを識別するコマンドＩＤ２６０毎に、当該コマンドをユーザが発声したときの当該ユーザの音声の特徴を示す特徴情報２６１が、当該特徴情報２６１が登録された日時を示す登録日時２６２に対応付けて格納される。コマンド毎の複数の特徴情報は、後述する標準パターン再作成部２７によってコマンド毎に標準パターンを作成するために使用される。

グループ情報格納部２４には、例えば図４に示すように、それぞれのグループを識別するグループＩＤ２４０毎に、当該グループに属する複数のコマンドのコマンドＩＤを含むコマンド群２４１が格納されている。それぞれのコマンドは、いずれかのグループに属している。グループ毎のコマンドの具体例を示すと、例えば図５のようになる。

図５の例では、「ヘディングアップ」コマンドと「ノースアップ」コマンドとは、同一の「地図方向変更系」のグループに属しているコマンドである。また、図５の例では、「ヘディングアップ」コマンドと「スタンダードビュー」コマンドとは、異なるグループに属しているコマンドである。類似した機能において使用される複数のコマンドが、同一のグループに割り当てられる。

特徴情報抽出部２１は、音声認識開始スイッチ１１が押下された場合に、音声認識開始スイッチ１１が押下されてから所定時間（例えば１０秒）が経過するまでの間にユーザが発声した音声をマイク１２を介して取得し、取得した音声から、当該音声の特徴情報を抽出してコマンド抽出部２２および特徴情報追加部２５へ送る。

コマンド抽出部２２は、特徴情報抽出部２１から特徴情報を受け取った場合に、受け取った特徴情報との類似度を、標準パターン格納部２３内のそれぞれのコマンドに対応する標準パターンについて算出する。そして、コマンド抽出部２２は、特徴情報抽出部２１から受け取った特徴情報との類似度が高い標準パターンを特定し、特定した標準パターンに対応するコマンドのコマンドＩＤを抽出して特徴情報追加部２５およびコマンド実行部２９へ送る。

コマンド抽出部２２は、例えば、予め定められた値以上の類似度となる標準パターンの中で、最も類似度の高い標準パターンを、特徴情報抽出部２１から受け取った特徴情報との類似度が高い標準パターンとして特定する。予め定められた値以上の類似度となる標準パターンが存在しなかった場合、コマンド抽出部２２は、特徴情報抽出部２１から受け取った特徴情報に対応するコマンドのコマンドＩＤを抽出できなかった旨を特徴情報追加部２５に通知する。

手動操作受付部２８は、タッチパネルやリモコン等の入力装置１３を介して、ユーザからの手動操作を受け付け、当該手動操作に対応するコマンドのコマンドＩＤを特徴情報追加部２５およびコマンド実行部２９へ送る。コマンド実行部２９は、コマンド抽出部２２または手動操作受付部２８から受け取ったコマンドＩＤに対応するコマンドを実行し、実行したコマンドのコマンドＩＤを特徴情報追加部２５に通知する。

標準パターン再作成部２７は、特徴情報格納部２６に特徴情報が追加登録された場合に、当該追加登録された特徴情報に対応付けられているコマンドＩＤを特定する。そして、標準パターン再作成部２７は、当該コマンドＩＤに対応付けて特徴情報格納部２６に格納されている複数の特徴情報から、例えば複数の特徴情報を平均する等により、当該コマンドの標準パターンを作成し直し、作成した標準パターンを当該コマンドのコマンドＩＤに対応付けて標準パターン格納部２３に登録する。

特徴情報追加部２５は、コマンド抽出部２２からコマンドＩＤを受け取った後に、当該コマンドＩＤをコマンド実行部２９より通知された場合に、当該コマンドＩＤをコマンド実行部２９より通知されてから予め定められた第１の時間（例えば１０秒）が経過するまでの間に、手動操作受付部２８から他のコマンドのコマンドＩＤを受け取ったか否かを判定する。

コマンドＩＤをコマンド実行部２９より通知されてから予め定められた第１の時間が経過するまでの間に、手動操作受付部２８から他のコマンドのコマンドＩＤを受け取らなかった場合、特徴情報追加部２５は、コマンド実行部２９より通知されたコマンドＩＤに対応付けて、特徴情報抽出部２１から受け取った特徴情報を、現在の日時と共に特徴情報格納部２６に追加登録する。

ここで、コマンドが実行されてから第１の時間が経過するまでの間、手動操作が行われなかったということは、ユーザが意図したコマンドが実行され、ユーザが発声した音声に対応するコマンドが適切に認識されたことを意味する。そのため、特徴情報追加部２５は、実行されたコマンドのコマンドＩＤを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部２６に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。

コマンドＩＤをコマンド実行部２９より通知されてから予め定められた第１の時間が経過するまでの間に、手動操作受付部２８から他のコマンドのコマンドＩＤを受け取った場合、特徴情報追加部２５は、当該他のコマンドが、車載装置２０の状態を、コマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドであるか否かを判定する。

車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドである場合、特徴情報追加部２５は、手動操作受付部２８から当該コマンドに対応するコマンドＩＤを受け付けてから予め定められた第２の時間（例えば１０秒）が経過するまでの間に、手動操作受付部２８からコマンドＩＤを受け付けたか否かを判定する。第２の時間が経過するまでの間に手動操作受付部２８からコマンドＩＤを受け付けた場合、特徴情報追加部２５は、受け付けたコマンドＩＤに対応付けて、特徴情報抽出部２１から受け取った特徴情報を、現在の日時と共に特徴情報格納部２６に追加登録する。

ここで、車載装置２０の状態を戻した直後に手動操作を行うということは、ユーザが意図したコマンドが実行されずに、車載装置２０の状態を戻した後にユーザが手動で所望のコマンドに対応する操作を行った可能性が高い。これは、ユーザが発声した音声に対応するコマンドが適切に認識されなかったことを意味する。そのため、特徴情報追加部２５は、車載装置２０の状態を戻した後に手動操作により入力されたコマンドが、ユーザが意図して発声したコマンドであるとして、当該コマンドのコマンドＩＤを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部２６に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。

コマンドＩＤをコマンド実行部２９より通知されてから予め定められた第１の時間が経過するまでの間に手動操作受付部２８から受け取ったコマンドＩＤが、車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドＩＤではない場合、特徴情報追加部２５は、グループ情報格納部２４を参照して、コマンド実行部２９から通知されたコマンドＩＤに対応するコマンドが、手動操作受付部２８から受け取った他のコマンドと同一のグループに属しているか否かを判定する。

コマンド実行部２９から通知されたコマンドＩＤに対応するコマンドが、手動操作受付部２８から受け取った他のコマンドと同一のグループに属している場合、特徴情報追加部２５は、特徴情報抽出部２１から受け取った特徴情報を、現在の日時と共に、手動操作受付部２８から受け取った他のコマンドのコマンドＩＤに対応付けて特徴情報格納部２６に追加登録する。

ここで、コマンドが実行された直後に、実行されたコマンドと同一のグループに属するコマンドがユーザによって手動入力されたということは、ユーザが意図したコマンドが実行されずに、ユーザが手動で所望のコマンドに対応する操作を行った可能性が高い。これは、ユーザが発声した音声に対応するコマンドが適切に認識されなかったことを意味する。そのため、特徴情報追加部２５は、後から手動で操作されたコマンドのコマンドＩＤを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部２６に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。

一方、コマンド実行部２９から通知されたコマンドＩＤに対応するコマンドが、手動操作受付部２８から受け取った他のコマンドと同一のグループに属していない場合、特徴情報追加部２５は、特徴情報抽出部２１から受け取った特徴情報を特徴情報格納部２６に追加登録しない。

ここで、コマンドが実行された直後に、実行されたコマンドとは異なるグループに属するコマンドがユーザによって手動入力されたということは、ユーザがまったく別な動作を車載装置２０に指示した可能性が高く、音声認識自体は適切に動作していた可能性が高い。そのため、特徴情報追加部２５は、後から手動で操作されたコマンドのコマンドＩＤを特徴情報格納部２６に追加登録する処理を行わない。これにより、車載装置２０は、ユーザの音声の特性に沿った標準パターンによって精度の高い音声認識を実現することができる。

また、コマンド抽出部２２からコマンドＩＤを抽出できなかった旨を通知された場合、特徴情報追加部２５は、特徴情報抽出部２１から特徴情報を受け取ってから予め定められた第３の時間（例えば１０秒）が経過するまでの間に、手動操作受付部２８からコマンドＩＤを受け付けたか否かを判定する。第３の時間が経過するまでの間に手動操作受付部２８からコマンドＩＤを受け付けた場合、特徴情報追加部２５は、受け付けたコマンドＩＤに対応付けて、特徴情報抽出部２１から受け取った特徴情報を、現在の日時と共に特徴情報格納部２６に追加登録する。

ここで、コマンド抽出部２２からコマンドＩＤを抽出できなかった旨を通知されたということは、ユーザの発声により何のコマンドも実行されなかったことを意味し、その直後に手動操作が行われたということは、ユーザが手動で所望のコマンドに対応する操作を行った可能性が高い。これは、ユーザが発声した音声に対応するコマンドが適切に認識されなかったことを意味する。そのため、特徴情報追加部２５は、コマンド抽出部２２からコマンドＩＤを抽出できなかった旨を通知された後に手動操作により入力されたコマンドのコマンドＩＤを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部２６に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。

なお、特徴情報格納部２６には、それぞれのコマンドＩＤ毎に、所定数（例えば３０）までの特徴情報を格納することができ、特徴情報追加部２５は、特徴情報をコマンドＩＤに対応付けて特徴情報格納部２６に追加登録する場合に、当該コマンドＩＤに既に所定数の特徴情報が登録されているならば、例えば最も古い特徴情報を削除してから、新たな特徴情報を現在の日時と共に特徴情報格納部２６に追加登録する。これにより、特徴情報格納部２６内には、最新のユーザの音声に基づく特徴情報が格納されることになる。

図６は、車載装置２０の動作の一例を示すフローチャートである。ユーザによって音声認識開始スイッチ１１が押下されることにより、車載装置２０は、本フローチャートに示す動作を開始する。

まず、特徴情報抽出部２１は、ユーザが発声した音声をマイク１２を介して取得し、取得した音声から、当該音声の特徴情報を抽出してコマンド抽出部２２および特徴情報追加部２５へ送る（Ｓ１００）。そして、コマンド抽出部２２は、特徴情報抽出部２１から受け取った特徴情報との類似度を、標準パターン格納部２３内のそれぞれのコマンドの標準パターンについて算出する。そして、コマンド抽出部２２は、特徴情報抽出部２１から受け取った特徴情報との類似度が高い標準パターンに対応するコマンドＩＤを特定することができたか否かを判定する（Ｓ１０１）。

特徴情報抽出部２１から受け取った特徴情報との類似度が高い標準パターンに対応するコマンドＩＤを特定することができなかった場合（Ｓ１０１：Ｎｏ）、コマンド抽出部２２は、特徴情報抽出部２１から受け取った特徴情報に対応するコマンドのコマンドＩＤを抽出できなかった旨を特徴情報追加部２５に通知する。このとき、コマンド抽出部２２は、図示しないスピーカを介して、ユーザに、対応するコマンドを特定できなかった旨を通知し、音声によるコマンド入力のリトライ、または、手動操作によるコマンドの入力を促してもよい。

次に、特徴情報追加部２５は、手動操作受付部２８からコマンドＩＤを受け取ったか否かを判定することにより、手動操作受付部２８が手動操作を受け付けたか否かを判定する（Ｓ１０２）。手動操作受付部２８が手動操作を受け付けた場合（Ｓ１０２：Ｙｅｓ）、特徴情報追加部２５は、ステップＳ１１１に示す処理を実行する。

手動操作受付部２８が手動操作を受け付けていない場合（Ｓ１０２：Ｎｏ）、特徴情報追加部２５は、特徴情報抽出部２１から受け取った特徴情報に対応するコマンドのコマンドＩＤを抽出できなかった旨をコマンド抽出部２２から通知されてから第３の時間が経過したか否かを判定する（Ｓ１０３）。

特徴情報抽出部２１から受け取った特徴情報に対応するコマンドのコマンドＩＤを抽出できなかった旨をコマンド抽出部２２から通知されてから第３の時間が経過していない場合（Ｓ１０３：Ｎｏ）、特徴情報追加部２５は、再びステップＳ１０１に示した処理を実行する。一方、特徴情報抽出部２１から受け取った特徴情報に対応するコマンドのコマンドＩＤを抽出できなかった旨をコマンド抽出部２２から通知されてから第３の時間が経過した場合（Ｓ１０３：Ｙｅｓ）、車載装置２０は、本フローチャートに示した動作を終了する。

ステップＳ１０１において、特徴情報抽出部２１から受け取った特徴情報との類似度が高い標準パターンに対応するコマンドＩＤを特定することができた場合（Ｓ１０１：Ｙｅｓ）、コマンド抽出部２２は、特定したコマンドＩＤを特徴情報追加部２５およびコマンド実行部２９へ送る。コマンド実行部２９は、コマンド抽出部２２から受け取ったコマンドＩＤに対応するコマンドを実行し、実行したコマンドのコマンドＩＤを特徴情報追加部２５に通知する（Ｓ１０４）。

次に、特徴情報追加部２５は、手動操作受付部２８からコマンドＩＤを受け取ったか否かを判定することにより、手動操作受付部２８が手動操作を受け付けたか否かを判定する（Ｓ１０５）。手動操作受付部２８が手動操作を受け付けていない場合（Ｓ１０５：Ｎｏ）、特徴情報追加部２５は、ステップＳ１０４においてコマンド実行部２９からコマンドＩＤが通知されてから第１の時間が経過したか否かを判定する（Ｓ１０６）。

ステップＳ１０４においてコマンド実行部２９からコマンドＩＤが通知されてから第１の時間が経過していない場合（Ｓ１０６：Ｎｏ）、特徴情報追加部２５は、再びステップＳ１０５に示した処理を実行する。一方、テップＳ１０４においてコマンド実行部２９からコマンドＩＤが通知されてから第１の時間が経過した場合（Ｓ１０６：Ｙｅｓ）、特徴情報追加部２５は、ステップＳ１１１に示す処理を実行する。

ステップＳ１０５において、手動操作受付部２８が手動操作を受け付けた場合（Ｓ１０５：Ｙｅｓ）、特徴情報追加部２５は、手動操作受付部２８から通知されたコマンドＩＤに対応するコマンドが、車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドであるか否かを判定する（Ｓ１０７）。

手動操作受付部２８から通知されたコマンドＩＤに対応するコマンドが、車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドではない場合（Ｓ１０７：Ｎｏ）、特徴情報追加部２５は、グループ情報格納部２４を参照して、コマンド実行部２９から通知されたコマンドＩＤに対応するコマンドが、手動操作受付部２８から通知されたコマンドＩＤに対応するコマンドと同一のグループに属しているか否かを判定する（Ｓ１０８）。

コマンド実行部２９から通知されたコマンドＩＤに対応するコマンドが、手動操作受付部２８から通知されたコマンドＩＤに対応するコマンドと同一のグループに属している場合（Ｓ１０８：Ｙｅｓ）、特徴情報追加部２５は、ステップＳ１１１に示す処理を実行する。一方、コマンド実行部２９から通知されたコマンドＩＤに対応するコマンドが、手動操作受付部２８から通知されたコマンドＩＤに対応するコマンドと同一のグループに属していない（Ｓ１０８：Ｎｏ）、車載装置２０は、本フローチャートに示した動作を終了する。

ステップＳ１０７において、手動操作受付部２８から通知されたコマンドＩＤに対応するコマンドが、車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドである場合（Ｓ１０７：Ｙｅｓ）、特徴情報追加部２５は、手動操作受付部２８からコマンドＩＤを受け取ったか否かを判定することにより、手動操作受付部２８が手動操作を受け付けたか否かを判定する（Ｓ１０９）。

手動操作受付部２８が手動操作を受け付けていない場合（Ｓ１０９：Ｎｏ）、特徴情報追加部２５は、ステップＳ１０７において車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドＩＤを手動操作受付部２８から通知されてから第２の時間が経過したか否かを判定する（Ｓ１１０）。

ステップＳ１０７において車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドＩＤを手動操作受付部２８から通知されてから第２の時間が経過していない場合（Ｓ１１０：Ｎｏ）、特徴情報追加部２５は、再びステップＳ１０９に示した処理を実行する。

一方、ステップＳ１０７において車載装置２０の状態をコマンド実行部２９によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドＩＤを手動操作受付部２８から通知されてから第２の時間が経過した場合（Ｓ１１０：Ｙｅｓ）、車載装置２０は、本フローチャートに示した動作を終了する。

ステップＳ１０９において、手動操作受付部２８が手動操作を受け付けた場合（Ｓ１０９：Ｙｅｓ）、特徴情報追加部２５は、特徴情報抽出部２１から受け取った特徴情報を、現在の日時と共に、当該手動操作が示すコマンドのコマンドＩＤに対応付けて特徴情報格納部２６に追加登録する（Ｓ１１１）。

次に、標準パターン再作成部２７は、追加登録された特徴情報に対応付けられているコマンドＩＤを特定する。そして、標準パターン再作成部２７は、当該コマンドＩＤに対応付けて特徴情報格納部２６に格納されている複数の特徴情報から、当該コマンドの標準パターンを作成し直し、作成した標準パターンを当該コマンドのコマンドＩＤに対応付けて標準パターン格納部２３に登録し（Ｓ１１２）、車載装置２０は、本フローチャートに示した動作を終了する。

図７は、車載装置２０の機能を実現するコンピュータ３０の一例を示すハードウェア構成図である。コンピュータ３０は、ＣＰＵ（Central Processing Unit）３１、ＲＡＭ（Random Access Memory）３２、ＲＯＭ（Read Only Memory）３３、ＨＤＤ（Hard Disk Drive）３４、入力インターフェイス（Ｉ／Ｆ）３５、出力インターフェイス（Ｉ／Ｆ）３６、およびメディアインターフェイス（Ｉ／Ｆ）３７を備える。

ＣＰＵ３１は、ＲＯＭ３３またはＨＤＤ３４に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ３３は、コンピュータ３０の起動時にＣＰＵ３１によって実行されるブートプログラムや、コンピュータ３０のハードウェアに依存するプログラム等を格納する。ＨＤＤ３４は、ＣＰＵ３１によって実行されるプログラムやデータ等を格納する。

入力インターフェイス３５は、音声認識開始スイッチ１１、マイク１２、または入力装置１３からの信号をＣＰＵ３１へ送る。ＣＰＵ３１は、入力インターフェイス３５を介して音声認識開始スイッチ１１マイク１２、および入力装置１３を制御し、入力インターフェイス３５を介して、音声認識開始スイッチ１１、マイク１２、または入力装置１３から信号を取得する。

出力インターフェイス３６は、ＣＰＵ３１から取得したデータを、ディスプレイ等の出力装置へ出力する。ＣＰＵ３１は、出力インターフェイス３６を介して出力装置を制御し、生成したデータを、出力インターフェイス３６を介して、出力装置へ出力する。

メディアインターフェイス３７は、記録媒体３８に格納されたプログラムまたはデータを読み取り、ＲＡＭ３２を介してＣＰＵ３１に提供する。ＣＰＵ３１は、当該プログラムを、メディアインターフェイス３７を介して記録媒体３８からＲＡＭ３２上にロードし、ロードしたプログラムを実行する。記録媒体３８は、例えばＤＶＤ（Digital Versatile Disk）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

コンピュータ３０のＣＰＵ３１は、ＲＡＭ３２上にロードされたプログラムを実行することにより、特徴情報抽出部２１、コマンド抽出部２２、標準パターン格納部２３、グループ情報格納部２４、特徴情報追加部２５、特徴情報格納部２６、標準パターン再作成部２７、手動操作受付部２８、およびコマンド実行部２９の各機能を実現する。また、ＲＯＭ３３またはＨＤＤ３４には、グループ情報格納部２４内のデータが格納され、ＨＤＤ３４には、標準パターン格納部２３および特徴情報格納部２６内のデータが格納される。

コンピュータ３０は、これらのプログラムを、記録媒体３８から読み取って実行するが、他の例として、コンピュータ３０に通信機能を設け、他の通信機器またはそれを介してこれらのプログラムを取得するようにしてもよい。

以上、本発明の実施の形態について説明した。

上記説明から明らかなように、本実施形態の車載装置２０によれば、音声認識における認識率を高く保つことができる。

なお、本発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。

例えば、上記した実施形態において、車載装置２０のユーザは１人であることを前提に説明したが、本発明はこれに限られず、車載装置２０は、複数のユーザについて、標準パターンの最適化を行うようにしてもよい。この場合、複数のユーザが均等に車載装置２０を使用したとすれば、車載装置２０は、いずれのユーザに対しても同程度の認識率の音声認識処理を提供することができ、ユーザ毎に使用頻度が異なる場合には、車載装置２０は、使用頻度に応じて、使用頻度の高いユーザの認識率をより高くすることができる。

また、他の形態として、車載装置２０は、ユーザ毎に、標準パターン格納部２３および特徴情報格納部２６内のデータを分け、使用に先立って、ユーザを識別する情報をユーザから入力してもらった上で、当該ユーザに対応するデータを使って、本発明の処理を実現するようにしてもよい。

１０・・・車載システム、１１・・・音声認識開始スイッチ、１２・・・マイク、１３・・・入力装置、２０・・・車載装置、２１・・・特徴情報抽出部、２２・・・コマンド抽出部、２３・・・標準パターン格納部、２３０・・・コマンドＩＤ、２３１・・・コマンド名、２３２・・・標準パターン、２４・・・グループ情報格納部、２４０・・・グループＩＤ、２４１・・・コマンド群、２５・・・特徴情報追加部、２６・・・特徴情報格納部、２６０・・・コマンドＩＤ、２６１・・・特徴情報、２６２・・・登録日時、２７・・・標準パターン再作成部、２８・・・手動操作受付部、２９・・・コマンド実行部、３０・・・コンピュータ、３１・・・ＣＰＵ、３２・・・ＲＡＭ、３３・・・ＲＯＭ、３４・・・ＨＤＤ、３５・・・入力インターフェイス、３６・・・出力インターフェイス、３７・・・メディアインターフェイス、３８・・・記録媒体

Claims

ユーザの音声を識別する音声識別手段と、
ユーザの手動操作を受け付ける手動入力手段と、
前記識別される音声または前記手動入力手段からの入力とコマンドとを対応付けて記憶するコマンド記憶手段と、
前記音声識別手段によって識別された第１のコマンドが入力された後所定時間以内に、前記手動入力手段によって前記第１のコマンドと異なる第２のコマンドが入力されたとき、前記音声識別手段によって識別された音声と前記第２のコマンドとを対応付けて前記コマンド記憶手段に記憶する情報追加手段と、
を備えることを特徴とする音声認識装置。
請求項１に記載の音声認識装置において、
前記コマンド記憶手段は、
前記識別される音声または前記手動入力手段からの入力とコマンドを対応付けるとともに、前記コマンドを複数のグループに分類して記憶し、
前記情報追加手段は、
前記音声識別手段によって識別された第１のコマンドが入力された後所定時間以内に、前記手動入力手段によって、前記第１のコマンドと異なりかつ前記第１のコマンドと同一の前記グループに属する第２のコマンドが入力されたとき、前記音声識別手段によって識別された音声と前記第２のコマンドとを対応付けて前記コマンド記憶手段に記憶する、
ことを特徴とする音声認識装置。
請求項１に記載の音声認識装置において、
前記情報追加手段は、
前記音声識別手段によって識別された第１のコマンドが入力された後所定時間以内に前記第１のコマンドが入力される前の状態に戻されたとき、前記手動入力手段によって次に入力された第２のコマンドを、前記音声識別手段によって識別された音声と対応付けて前記コマンド記憶手段に記憶する、
ことを特徴とする音声認識装置。
請求項１に記載の音声認識装置において、
前記音声識別手段は、
ユーザの音声の特徴を示す特徴情報を抽出する特徴抽出手段、を備え、
前記情報追加手段は、
前記第１のコマンドが入力されてから所定時間以内に前記手動入力手段が操作されなかった場合、前記特徴情報と前記第１のコマンドとを対応付けて前記コマンド記憶手段に記憶する、ことを特徴とする音声認識装置。
請求項１に記載の音声認識装置において、
前記情報追加手段は、
前記音声識別手段で識別された音声に該当する音声が存在せず、当該音声が入力されてから所定時間以内に、前記手動入力手段によってコマンドが入力されたとき、前記音声識別手段によって識別された音声と前記コマンドとを対応付けて前記コマンド記憶手段に記憶する、
ことを特徴とする音声認識装置。
請求項４記載の音声認識装置において、
同一のコマンドと対応付けられた複数の前記特徴情報から標準パターンを作成する標準パターン作成手段
を備えることを特徴とする音声認識装置。
ユーザの音声を識別し、音声に対応付けられた第１のコマンドを出力する音声識別ステップと、
前記第１のコマンドが出力された後所定時間以内に、ユーザの手動操作に対応付けられ、前記第１のコマンドと異なる第２のコマンドを出力する手動入力ステップと、
前記音声識別ステップおよび前記手動入力ステップが行われたとき、前記音声識別ステップによって識別された音声と前記第２のコマンドとを対応付けて記憶する記憶ステップと、
を備えることを特徴とする音声認識方法。