JP2010204172A - 音声認識装置および音声認識方法 - Google Patents

音声認識装置および音声認識方法 Download PDF

Info

Publication number
JP2010204172A
JP2010204172A JP2009046715A JP2009046715A JP2010204172A JP 2010204172 A JP2010204172 A JP 2010204172A JP 2009046715 A JP2009046715 A JP 2009046715A JP 2009046715 A JP2009046715 A JP 2009046715A JP 2010204172 A JP2010204172 A JP 2010204172A
Authority
JP
Japan
Prior art keywords
command
voice
feature information
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009046715A
Other languages
English (en)
Inventor
Yoshiyuki Mizuno
佳幸 水野
Hisashi Takahashi
久 高橋
Osamu Yamashita
修 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Xanavi Informatics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xanavi Informatics Corp filed Critical Xanavi Informatics Corp
Priority to JP2009046715A priority Critical patent/JP2010204172A/ja
Publication of JP2010204172A publication Critical patent/JP2010204172A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)

Abstract

【課題】音声認識における認識率を高く保つことができる車載装置20を提供する。
【解決手段】本発明の車載装置20は、ユーザが発声した音声の特徴との類似度が高い標準パターンに対応するコマンドを標準パターン格納部23から抽出して実行する。また、車載装置20は、ユーザからの手動操作を受け付け、当該手動操作に対応するコマンドを実行する。また、車載装置20は、ユーザの音声に対応するコマンドを実行してから所定時間が経過するまでの間に、ユーザから手動操作を受け付けた場合に、当該手動操作に対応するコマンドに対応付けて、ユーザの音声から抽出した特徴情報を特徴情報格納部26に追加登録し、当該追加登録した特徴情報に対応するコマンドについて、当該コマンドに対応付けて特徴情報格納部26に格納されている複数の特徴情報から、当該コマンドの標準パターンを作成し直して標準パターン格納部23に登録する。
【選択図】図1

Description

本発明は、車両に搭載され、音声により入力されたコマンドを実行する技術に関する。
下記の特許文献1には、それぞれの単語を所定回数発声させ、その音声からその人の声の特徴を示すHMM(隠れマルコフモデル)を単語毎に作成し、作成したHMMを用いて音声認識を行う音声認識装置が開示されている。
特開平9−81183号公報
ところで、上記特許文献1では、各単語について、最初に所定回数発声した音声によって作成されたHMMが使われ続けるため、最初のチューニングで失敗すると、最適ではないHMMを使い続けることになり、音声の認識率が低くなる場合がある。また、人の声は、歯並びの変化や成長の過程で変化する場合がある。また、人の声を取り込むマイクも、経年変化や汚れ等により、同一の音声であっても異なる音声として取り込まれる場合がある。そのため、時間の経過と共に、音声の認識率が低下する場合がある。
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、音声認識における認識率を高く保つことにある。
上記課題を解決するために、第1の発明は、ユーザの音声を識別する音声識別手段と、
ユーザの手動操作を受け付ける手動入力手段と、識別される音声または手動入力手段からの入力とコマンドとを対応付けて記憶するコマンド記憶手段と、音声識別手段によって識別された第1のコマンドが入力された後所定時間以内に、手動入力手段によって第1のコマンドと異なる第2のコマンドが入力されたとき、音声識別手段によって識別された音声と第2のコマンドとを対応付けてコマンド記憶手段に記憶する情報追加手段とを備えることを特徴とする音声認識装置を提供する。
また、第2の発明は、ユーザの音声を識別し、音声に対応付けられた第1のコマンドを出力する音声識別ステップと、第1のコマンドが出力された後所定時間以内に、ユーザの手動操作に対応付けられ、第1のコマンドと異なる第2のコマンドを出力する手動入力ステップと、音声識別ステップおよび手動入力ステップが行われたとき、音声識別ステップによって識別された音声と第2のコマンドとを対応付けて記憶する記憶ステップとを備えることを特徴とする音声認識方法を提供する。
本発明の車載装置によれば、音声認識における認識率を高く保つことができる。
本発明の一実施形態に係る車載システム10の構成を示すシステム構成図である。 標準パターン格納部23に格納されるデータの構造の一例を示す図である。 特徴情報格納部26に格納されるデータの構造の一例を示す図である。 グループ情報格納部24に格納されるデータの構造の一例を示す図である。 グループ毎のコマンドの具体例を示す図である。 車載装置20の動作の一例を示すフローチャートである。 車載装置20の機能を実現するコンピュータ30の一例を示すハードウェア構成図である。
以下、本発明の実施の形態について説明する。
図1は、本発明の一実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、車両等の移動体に搭載され、音声認識開始スイッチ11、マイク12、入力装置13、および車載装置20を備える。車載装置20は、特徴情報抽出部21、コマンド抽出部22、標準パターン格納部23、グループ情報格納部24、特徴情報追加部25、特徴情報格納部26、標準パターン再作成部27、手動操作受付部28、およびコマンド実行部29を備える。
標準パターン格納部23には、例えば図2に示すように、それぞれのコマンドを識別するコマンドID260毎に、当該コマンドのコマンド名231および当該コマンドをユーザが発声したときのユーザの音声の標準的な特徴を示す標準パターン232が格納される。コマンド毎の標準パターンは、初期設定時に後述する標準パターン再作成部27によって作成され、その後、標準パターン再作成部27によって随時更新される。
特徴情報格納部26には、例えば図3に示すように、それぞれのコマンドを識別するコマンドID260毎に、当該コマンドをユーザが発声したときの当該ユーザの音声の特徴を示す特徴情報261が、当該特徴情報261が登録された日時を示す登録日時262に対応付けて格納される。コマンド毎の複数の特徴情報は、後述する標準パターン再作成部27によってコマンド毎に標準パターンを作成するために使用される。
グループ情報格納部24には、例えば図4に示すように、それぞれのグループを識別するグループID240毎に、当該グループに属する複数のコマンドのコマンドIDを含むコマンド群241が格納されている。それぞれのコマンドは、いずれかのグループに属している。グループ毎のコマンドの具体例を示すと、例えば図5のようになる。
図5の例では、「ヘディングアップ」コマンドと「ノースアップ」コマンドとは、同一の「地図方向変更系」のグループに属しているコマンドである。また、図5の例では、「ヘディングアップ」コマンドと「スタンダードビュー」コマンドとは、異なるグループに属しているコマンドである。類似した機能において使用される複数のコマンドが、同一のグループに割り当てられる。
特徴情報抽出部21は、音声認識開始スイッチ11が押下された場合に、音声認識開始スイッチ11が押下されてから所定時間(例えば10秒)が経過するまでの間にユーザが発声した音声をマイク12を介して取得し、取得した音声から、当該音声の特徴情報を抽出してコマンド抽出部22および特徴情報追加部25へ送る。
コマンド抽出部22は、特徴情報抽出部21から特徴情報を受け取った場合に、受け取った特徴情報との類似度を、標準パターン格納部23内のそれぞれのコマンドに対応する標準パターンについて算出する。そして、コマンド抽出部22は、特徴情報抽出部21から受け取った特徴情報との類似度が高い標準パターンを特定し、特定した標準パターンに対応するコマンドのコマンドIDを抽出して特徴情報追加部25およびコマンド実行部29へ送る。
コマンド抽出部22は、例えば、予め定められた値以上の類似度となる標準パターンの中で、最も類似度の高い標準パターンを、特徴情報抽出部21から受け取った特徴情報との類似度が高い標準パターンとして特定する。予め定められた値以上の類似度となる標準パターンが存在しなかった場合、コマンド抽出部22は、特徴情報抽出部21から受け取った特徴情報に対応するコマンドのコマンドIDを抽出できなかった旨を特徴情報追加部25に通知する。
手動操作受付部28は、タッチパネルやリモコン等の入力装置13を介して、ユーザからの手動操作を受け付け、当該手動操作に対応するコマンドのコマンドIDを特徴情報追加部25およびコマンド実行部29へ送る。コマンド実行部29は、コマンド抽出部22または手動操作受付部28から受け取ったコマンドIDに対応するコマンドを実行し、実行したコマンドのコマンドIDを特徴情報追加部25に通知する。
標準パターン再作成部27は、特徴情報格納部26に特徴情報が追加登録された場合に、当該追加登録された特徴情報に対応付けられているコマンドIDを特定する。そして、標準パターン再作成部27は、当該コマンドIDに対応付けて特徴情報格納部26に格納されている複数の特徴情報から、例えば複数の特徴情報を平均する等により、当該コマンドの標準パターンを作成し直し、作成した標準パターンを当該コマンドのコマンドIDに対応付けて標準パターン格納部23に登録する。
特徴情報追加部25は、コマンド抽出部22からコマンドIDを受け取った後に、当該コマンドIDをコマンド実行部29より通知された場合に、当該コマンドIDをコマンド実行部29より通知されてから予め定められた第1の時間(例えば10秒)が経過するまでの間に、手動操作受付部28から他のコマンドのコマンドIDを受け取ったか否かを判定する。
コマンドIDをコマンド実行部29より通知されてから予め定められた第1の時間が経過するまでの間に、手動操作受付部28から他のコマンドのコマンドIDを受け取らなかった場合、特徴情報追加部25は、コマンド実行部29より通知されたコマンドIDに対応付けて、特徴情報抽出部21から受け取った特徴情報を、現在の日時と共に特徴情報格納部26に追加登録する。
ここで、コマンドが実行されてから第1の時間が経過するまでの間、手動操作が行われなかったということは、ユーザが意図したコマンドが実行され、ユーザが発声した音声に対応するコマンドが適切に認識されたことを意味する。そのため、特徴情報追加部25は、実行されたコマンドのコマンドIDを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部26に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。
コマンドIDをコマンド実行部29より通知されてから予め定められた第1の時間が経過するまでの間に、手動操作受付部28から他のコマンドのコマンドIDを受け取った場合、特徴情報追加部25は、当該他のコマンドが、車載装置20の状態を、コマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドであるか否かを判定する。
車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドである場合、特徴情報追加部25は、手動操作受付部28から当該コマンドに対応するコマンドIDを受け付けてから予め定められた第2の時間(例えば10秒)が経過するまでの間に、手動操作受付部28からコマンドIDを受け付けたか否かを判定する。第2の時間が経過するまでの間に手動操作受付部28からコマンドIDを受け付けた場合、特徴情報追加部25は、受け付けたコマンドIDに対応付けて、特徴情報抽出部21から受け取った特徴情報を、現在の日時と共に特徴情報格納部26に追加登録する。
ここで、車載装置20の状態を戻した直後に手動操作を行うということは、ユーザが意図したコマンドが実行されずに、車載装置20の状態を戻した後にユーザが手動で所望のコマンドに対応する操作を行った可能性が高い。これは、ユーザが発声した音声に対応するコマンドが適切に認識されなかったことを意味する。そのため、特徴情報追加部25は、車載装置20の状態を戻した後に手動操作により入力されたコマンドが、ユーザが意図して発声したコマンドであるとして、当該コマンドのコマンドIDを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部26に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。
コマンドIDをコマンド実行部29より通知されてから予め定められた第1の時間が経過するまでの間に手動操作受付部28から受け取ったコマンドIDが、車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドIDではない場合、特徴情報追加部25は、グループ情報格納部24を参照して、コマンド実行部29から通知されたコマンドIDに対応するコマンドが、手動操作受付部28から受け取った他のコマンドと同一のグループに属しているか否かを判定する。
コマンド実行部29から通知されたコマンドIDに対応するコマンドが、手動操作受付部28から受け取った他のコマンドと同一のグループに属している場合、特徴情報追加部25は、特徴情報抽出部21から受け取った特徴情報を、現在の日時と共に、手動操作受付部28から受け取った他のコマンドのコマンドIDに対応付けて特徴情報格納部26に追加登録する。
ここで、コマンドが実行された直後に、実行されたコマンドと同一のグループに属するコマンドがユーザによって手動入力されたということは、ユーザが意図したコマンドが実行されずに、ユーザが手動で所望のコマンドに対応する操作を行った可能性が高い。これは、ユーザが発声した音声に対応するコマンドが適切に認識されなかったことを意味する。そのため、特徴情報追加部25は、後から手動で操作されたコマンドのコマンドIDを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部26に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。
一方、コマンド実行部29から通知されたコマンドIDに対応するコマンドが、手動操作受付部28から受け取った他のコマンドと同一のグループに属していない場合、特徴情報追加部25は、特徴情報抽出部21から受け取った特徴情報を特徴情報格納部26に追加登録しない。
ここで、コマンドが実行された直後に、実行されたコマンドとは異なるグループに属するコマンドがユーザによって手動入力されたということは、ユーザがまったく別な動作を車載装置20に指示した可能性が高く、音声認識自体は適切に動作していた可能性が高い。そのため、特徴情報追加部25は、後から手動で操作されたコマンドのコマンドIDを特徴情報格納部26に追加登録する処理を行わない。これにより、車載装置20は、ユーザの音声の特性に沿った標準パターンによって精度の高い音声認識を実現することができる。
また、コマンド抽出部22からコマンドIDを抽出できなかった旨を通知された場合、特徴情報追加部25は、特徴情報抽出部21から特徴情報を受け取ってから予め定められた第3の時間(例えば10秒)が経過するまでの間に、手動操作受付部28からコマンドIDを受け付けたか否かを判定する。第3の時間が経過するまでの間に手動操作受付部28からコマンドIDを受け付けた場合、特徴情報追加部25は、受け付けたコマンドIDに対応付けて、特徴情報抽出部21から受け取った特徴情報を、現在の日時と共に特徴情報格納部26に追加登録する。
ここで、コマンド抽出部22からコマンドIDを抽出できなかった旨を通知されたということは、ユーザの発声により何のコマンドも実行されなかったことを意味し、その直後に手動操作が行われたということは、ユーザが手動で所望のコマンドに対応する操作を行った可能性が高い。これは、ユーザが発声した音声に対応するコマンドが適切に認識されなかったことを意味する。そのため、特徴情報追加部25は、コマンド抽出部22からコマンドIDを抽出できなかった旨を通知された後に手動操作により入力されたコマンドのコマンドIDを、ユーザが発声した音声の特徴情報に対応付けて特徴情報格納部26に追加登録することにより、当該特徴情報を、当該後から手動で操作されたコマンドの標準パターンに反映させる。
なお、特徴情報格納部26には、それぞれのコマンドID毎に、所定数(例えば30)までの特徴情報を格納することができ、特徴情報追加部25は、特徴情報をコマンドIDに対応付けて特徴情報格納部26に追加登録する場合に、当該コマンドIDに既に所定数の特徴情報が登録されているならば、例えば最も古い特徴情報を削除してから、新たな特徴情報を現在の日時と共に特徴情報格納部26に追加登録する。これにより、特徴情報格納部26内には、最新のユーザの音声に基づく特徴情報が格納されることになる。
図6は、車載装置20の動作の一例を示すフローチャートである。ユーザによって音声認識開始スイッチ11が押下されることにより、車載装置20は、本フローチャートに示す動作を開始する。
まず、特徴情報抽出部21は、ユーザが発声した音声をマイク12を介して取得し、取得した音声から、当該音声の特徴情報を抽出してコマンド抽出部22および特徴情報追加部25へ送る(S100)。そして、コマンド抽出部22は、特徴情報抽出部21から受け取った特徴情報との類似度を、標準パターン格納部23内のそれぞれのコマンドの標準パターンについて算出する。そして、コマンド抽出部22は、特徴情報抽出部21から受け取った特徴情報との類似度が高い標準パターンに対応するコマンドIDを特定することができたか否かを判定する(S101)。
特徴情報抽出部21から受け取った特徴情報との類似度が高い標準パターンに対応するコマンドIDを特定することができなかった場合(S101:No)、コマンド抽出部22は、特徴情報抽出部21から受け取った特徴情報に対応するコマンドのコマンドIDを抽出できなかった旨を特徴情報追加部25に通知する。このとき、コマンド抽出部22は、図示しないスピーカを介して、ユーザに、対応するコマンドを特定できなかった旨を通知し、音声によるコマンド入力のリトライ、または、手動操作によるコマンドの入力を促してもよい。
次に、特徴情報追加部25は、手動操作受付部28からコマンドIDを受け取ったか否かを判定することにより、手動操作受付部28が手動操作を受け付けたか否かを判定する(S102)。手動操作受付部28が手動操作を受け付けた場合(S102:Yes)、特徴情報追加部25は、ステップS111に示す処理を実行する。
手動操作受付部28が手動操作を受け付けていない場合(S102:No)、特徴情報追加部25は、特徴情報抽出部21から受け取った特徴情報に対応するコマンドのコマンドIDを抽出できなかった旨をコマンド抽出部22から通知されてから第3の時間が経過したか否かを判定する(S103)。
特徴情報抽出部21から受け取った特徴情報に対応するコマンドのコマンドIDを抽出できなかった旨をコマンド抽出部22から通知されてから第3の時間が経過していない場合(S103:No)、特徴情報追加部25は、再びステップS101に示した処理を実行する。一方、特徴情報抽出部21から受け取った特徴情報に対応するコマンドのコマンドIDを抽出できなかった旨をコマンド抽出部22から通知されてから第3の時間が経過した場合(S103:Yes)、車載装置20は、本フローチャートに示した動作を終了する。
ステップS101において、特徴情報抽出部21から受け取った特徴情報との類似度が高い標準パターンに対応するコマンドIDを特定することができた場合(S101:Yes)、コマンド抽出部22は、特定したコマンドIDを特徴情報追加部25およびコマンド実行部29へ送る。コマンド実行部29は、コマンド抽出部22から受け取ったコマンドIDに対応するコマンドを実行し、実行したコマンドのコマンドIDを特徴情報追加部25に通知する(S104)。
次に、特徴情報追加部25は、手動操作受付部28からコマンドIDを受け取ったか否かを判定することにより、手動操作受付部28が手動操作を受け付けたか否かを判定する(S105)。手動操作受付部28が手動操作を受け付けていない場合(S105:No)、特徴情報追加部25は、ステップS104においてコマンド実行部29からコマンドIDが通知されてから第1の時間が経過したか否かを判定する(S106)。
ステップS104においてコマンド実行部29からコマンドIDが通知されてから第1の時間が経過していない場合(S106:No)、特徴情報追加部25は、再びステップS105に示した処理を実行する。一方、テップS104においてコマンド実行部29からコマンドIDが通知されてから第1の時間が経過した場合(S106:Yes)、特徴情報追加部25は、ステップS111に示す処理を実行する。
ステップS105において、手動操作受付部28が手動操作を受け付けた場合(S105:Yes)、特徴情報追加部25は、手動操作受付部28から通知されたコマンドIDに対応するコマンドが、車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドであるか否かを判定する(S107)。
手動操作受付部28から通知されたコマンドIDに対応するコマンドが、車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドではない場合(S107:No)、特徴情報追加部25は、グループ情報格納部24を参照して、コマンド実行部29から通知されたコマンドIDに対応するコマンドが、手動操作受付部28から通知されたコマンドIDに対応するコマンドと同一のグループに属しているか否かを判定する(S108)。
コマンド実行部29から通知されたコマンドIDに対応するコマンドが、手動操作受付部28から通知されたコマンドIDに対応するコマンドと同一のグループに属している場合(S108:Yes)、特徴情報追加部25は、ステップS111に示す処理を実行する。一方、コマンド実行部29から通知されたコマンドIDに対応するコマンドが、手動操作受付部28から通知されたコマンドIDに対応するコマンドと同一のグループに属していない(S108:No)、車載装置20は、本フローチャートに示した動作を終了する。
ステップS107において、手動操作受付部28から通知されたコマンドIDに対応するコマンドが、車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドである場合(S107:Yes)、特徴情報追加部25は、手動操作受付部28からコマンドIDを受け取ったか否かを判定することにより、手動操作受付部28が手動操作を受け付けたか否かを判定する(S109)。
手動操作受付部28が手動操作を受け付けていない場合(S109:No)、特徴情報追加部25は、ステップS107において車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドIDを手動操作受付部28から通知されてから第2の時間が経過したか否かを判定する(S110)。
ステップS107において車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドIDを手動操作受付部28から通知されてから第2の時間が経過していない場合(S110:No)、特徴情報追加部25は、再びステップS109に示した処理を実行する。
一方、ステップS107において車載装置20の状態をコマンド実行部29によってコマンドが実行される前の状態に戻す旨を指示するコマンドのコマンドIDを手動操作受付部28から通知されてから第2の時間が経過した場合(S110:Yes)、車載装置20は、本フローチャートに示した動作を終了する。
ステップS109において、手動操作受付部28が手動操作を受け付けた場合(S109:Yes)、特徴情報追加部25は、特徴情報抽出部21から受け取った特徴情報を、現在の日時と共に、当該手動操作が示すコマンドのコマンドIDに対応付けて特徴情報格納部26に追加登録する(S111)。
次に、標準パターン再作成部27は、追加登録された特徴情報に対応付けられているコマンドIDを特定する。そして、標準パターン再作成部27は、当該コマンドIDに対応付けて特徴情報格納部26に格納されている複数の特徴情報から、当該コマンドの標準パターンを作成し直し、作成した標準パターンを当該コマンドのコマンドIDに対応付けて標準パターン格納部23に登録し(S112)、車載装置20は、本フローチャートに示した動作を終了する。
図7は、車載装置20の機能を実現するコンピュータ30の一例を示すハードウェア構成図である。コンピュータ30は、CPU(Central Processing Unit)31、RAM(Random Access Memory)32、ROM(Read Only Memory)33、HDD(Hard Disk Drive)34、入力インターフェイス(I/F)35、出力インターフェイス(I/F)36、およびメディアインターフェイス(I/F)37を備える。
CPU31は、ROM33またはHDD34に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM33は、コンピュータ30の起動時にCPU31によって実行されるブートプログラムや、コンピュータ30のハードウェアに依存するプログラム等を格納する。HDD34は、CPU31によって実行されるプログラムやデータ等を格納する。
入力インターフェイス35は、音声認識開始スイッチ11、マイク12、または入力装置13からの信号をCPU31へ送る。CPU31は、入力インターフェイス35を介して音声認識開始スイッチ11マイク12、および入力装置13を制御し、入力インターフェイス35を介して、音声認識開始スイッチ11、マイク12、または入力装置13から信号を取得する。
出力インターフェイス36は、CPU31から取得したデータを、ディスプレイ等の出力装置へ出力する。CPU31は、出力インターフェイス36を介して出力装置を制御し、生成したデータを、出力インターフェイス36を介して、出力装置へ出力する。
メディアインターフェイス37は、記録媒体38に格納されたプログラムまたはデータを読み取り、RAM32を介してCPU31に提供する。CPU31は、当該プログラムを、メディアインターフェイス37を介して記録媒体38からRAM32上にロードし、ロードしたプログラムを実行する。記録媒体38は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
コンピュータ30のCPU31は、RAM32上にロードされたプログラムを実行することにより、特徴情報抽出部21、コマンド抽出部22、標準パターン格納部23、グループ情報格納部24、特徴情報追加部25、特徴情報格納部26、標準パターン再作成部27、手動操作受付部28、およびコマンド実行部29の各機能を実現する。また、ROM33またはHDD34には、グループ情報格納部24内のデータが格納され、HDD34には、標準パターン格納部23および特徴情報格納部26内のデータが格納される。
コンピュータ30は、これらのプログラムを、記録媒体38から読み取って実行するが、他の例として、コンピュータ30に通信機能を設け、他の通信機器またはそれを介してこれらのプログラムを取得するようにしてもよい。
以上、本発明の実施の形態について説明した。
上記説明から明らかなように、本実施形態の車載装置20によれば、音声認識における認識率を高く保つことができる。
なお、本発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
例えば、上記した実施形態において、車載装置20のユーザは1人であることを前提に説明したが、本発明はこれに限られず、車載装置20は、複数のユーザについて、標準パターンの最適化を行うようにしてもよい。この場合、複数のユーザが均等に車載装置20を使用したとすれば、車載装置20は、いずれのユーザに対しても同程度の認識率の音声認識処理を提供することができ、ユーザ毎に使用頻度が異なる場合には、車載装置20は、使用頻度に応じて、使用頻度の高いユーザの認識率をより高くすることができる。
また、他の形態として、車載装置20は、ユーザ毎に、標準パターン格納部23および特徴情報格納部26内のデータを分け、使用に先立って、ユーザを識別する情報をユーザから入力してもらった上で、当該ユーザに対応するデータを使って、本発明の処理を実現するようにしてもよい。
10・・・車載システム、11・・・音声認識開始スイッチ、12・・・マイク、13・・・入力装置、20・・・車載装置、21・・・特徴情報抽出部、22・・・コマンド抽出部、23・・・標準パターン格納部、230・・・コマンドID、231・・・コマンド名、232・・・標準パターン、24・・・グループ情報格納部、240・・・グループID、241・・・コマンド群、25・・・特徴情報追加部、26・・・特徴情報格納部、260・・・コマンドID、261・・・特徴情報、262・・・登録日時、27・・・標準パターン再作成部、28・・・手動操作受付部、29・・・コマンド実行部、30・・・コンピュータ、31・・・CPU、32・・・RAM、33・・・ROM、34・・・HDD、35・・・入力インターフェイス、36・・・出力インターフェイス、37・・・メディアインターフェイス、38・・・記録媒体

Claims (7)

  1. ユーザの音声を識別する音声識別手段と、
    ユーザの手動操作を受け付ける手動入力手段と、
    前記識別される音声または前記手動入力手段からの入力とコマンドとを対応付けて記憶するコマンド記憶手段と、
    前記音声識別手段によって識別された第1のコマンドが入力された後所定時間以内に、前記手動入力手段によって前記第1のコマンドと異なる第2のコマンドが入力されたとき、前記音声識別手段によって識別された音声と前記第2のコマンドとを対応付けて前記コマンド記憶手段に記憶する情報追加手段と、
    を備えることを特徴とする音声認識装置。
  2. 請求項1に記載の音声認識装置において、
    前記コマンド記憶手段は、
    前記識別される音声または前記手動入力手段からの入力とコマンドを対応付けるとともに、前記コマンドを複数のグループに分類して記憶し、
    前記情報追加手段は、
    前記音声識別手段によって識別された第1のコマンドが入力された後所定時間以内に、前記手動入力手段によって、前記第1のコマンドと異なりかつ前記第1のコマンドと同一の前記グループに属する第2のコマンドが入力されたとき、前記音声識別手段によって識別された音声と前記第2のコマンドとを対応付けて前記コマンド記憶手段に記憶する、
    ことを特徴とする音声認識装置。
  3. 請求項1に記載の音声認識装置において、
    前記情報追加手段は、
    前記音声識別手段によって識別された第1のコマンドが入力された後所定時間以内に前記第1のコマンドが入力される前の状態に戻されたとき、前記手動入力手段によって次に入力された第2のコマンドを、前記音声識別手段によって識別された音声と対応付けて前記コマンド記憶手段に記憶する、
    ことを特徴とする音声認識装置。
  4. 請求項1に記載の音声認識装置において、
    前記音声識別手段は、
    ユーザの音声の特徴を示す特徴情報を抽出する特徴抽出手段、を備え、
    前記情報追加手段は、
    前記第1のコマンドが入力されてから所定時間以内に前記手動入力手段が操作されなかった場合、前記特徴情報と前記第1のコマンドとを対応付けて前記コマンド記憶手段に記憶する、ことを特徴とする音声認識装置。
  5. 請求項1に記載の音声認識装置において、
    前記情報追加手段は、
    前記音声識別手段で識別された音声に該当する音声が存在せず、当該音声が入力されてから所定時間以内に、前記手動入力手段によってコマンドが入力されたとき、前記音声識別手段によって識別された音声と前記コマンドとを対応付けて前記コマンド記憶手段に記憶する、
    ことを特徴とする音声認識装置。
  6. 請求項4記載の音声認識装置において、
    同一のコマンドと対応付けられた複数の前記特徴情報から標準パターンを作成する標準パターン作成手段
    を備えることを特徴とする音声認識装置。
  7. ユーザの音声を識別し、音声に対応付けられた第1のコマンドを出力する音声識別ステップと、
    前記第1のコマンドが出力された後所定時間以内に、ユーザの手動操作に対応付けられ、前記第1のコマンドと異なる第2のコマンドを出力する手動入力ステップと、
    前記音声識別ステップおよび前記手動入力ステップが行われたとき、前記音声識別ステップによって識別された音声と前記第2のコマンドとを対応付けて記憶する記憶ステップと、
    を備えることを特徴とする音声認識方法。
JP2009046715A 2009-02-27 2009-02-27 音声認識装置および音声認識方法 Pending JP2010204172A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009046715A JP2010204172A (ja) 2009-02-27 2009-02-27 音声認識装置および音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009046715A JP2010204172A (ja) 2009-02-27 2009-02-27 音声認識装置および音声認識方法

Publications (1)

Publication Number Publication Date
JP2010204172A true JP2010204172A (ja) 2010-09-16

Family

ID=42965755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009046715A Pending JP2010204172A (ja) 2009-02-27 2009-02-27 音声認識装置および音声認識方法

Country Status (1)

Country Link
JP (1) JP2010204172A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575492A (zh) * 2014-12-31 2015-04-29 深圳市航盛电子股份有限公司 一种声纹识别方法及装置和无钥匙车锁系统及实现方法
JP2017049537A (ja) * 2015-09-04 2017-03-09 株式会社東芝 操作装置、訂正方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575492A (zh) * 2014-12-31 2015-04-29 深圳市航盛电子股份有限公司 一种声纹识别方法及装置和无钥匙车锁系统及实现方法
JP2017049537A (ja) * 2015-09-04 2017-03-09 株式会社東芝 操作装置、訂正方法およびプログラム

Similar Documents

Publication Publication Date Title
CN105931640B (zh) 激活短语的低功率检测
US9548053B1 (en) Audible command filtering
EP2609587B1 (en) System and method for recognizing a user voice command in noisy environment
JP5883014B2 (ja) 録音の終了点自動検出のための方法及びシステム
EP2389672B1 (en) Method, apparatus and computer program product for providing compound models for speech recognition adaptation
EP1450349B1 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
JP6084654B2 (ja) 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法
WO2013005248A1 (ja) 音声認識装置およびナビゲーション装置
JP6844608B2 (ja) 音声処理装置および音声処理方法
CN107210040A (zh) 语音功能的操作方法和支持该方法的电子设备
JP2007226642A (ja) 音声認識機器制御装置
WO2018202073A1 (zh) 语音控制智能设备的方法、装置和智能设备
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
EP3751393A1 (en) Information processing device, information processing system, information processing method, and program
JP2010204172A (ja) 音声認識装置および音声認識方法
US8588979B2 (en) Enhancements to mechanical robot
JP4905522B2 (ja) 機器制御装置、機器制御方法及びプログラム
JP4829184B2 (ja) 車載装置および音声認識方法
JP2008003474A (ja) 電子機器
JP4235635B2 (ja) データ検索装置及びその制御方法
JP5770233B2 (ja) 制御装置、制御装置の制御方法、および、制御プログラム
US20200380040A1 (en) Voice recognition apparatus
JP2000305596A (ja) 音声認識装置及びナビゲーション装置
JP6571587B2 (ja) 音声入力装置、その方法、及びプログラム
JPWO2017199545A1 (ja) 応答制御装置、制御プログラム、情報処理方法、および通信システム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20110711