JP2012058311A - 動的音声認識辞書の生成方法及びその生成装置 - Google Patents

動的音声認識辞書の生成方法及びその生成装置 Download PDF

Info

Publication number
JP2012058311A
JP2012058311A JP2010198780A JP2010198780A JP2012058311A JP 2012058311 A JP2012058311 A JP 2012058311A JP 2010198780 A JP2010198780 A JP 2010198780A JP 2010198780 A JP2010198780 A JP 2010198780A JP 2012058311 A JP2012058311 A JP 2012058311A
Authority
JP
Japan
Prior art keywords
dictionary
task
generation
thread
search category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010198780A
Other languages
English (en)
Other versions
JP5500647B2 (ja
Inventor
Chiharu Takeda
千春 武田
Fumihiko Aoyama
文彦 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2010198780A priority Critical patent/JP5500647B2/ja
Publication of JP2012058311A publication Critical patent/JP2012058311A/ja
Application granted granted Critical
Publication of JP5500647B2 publication Critical patent/JP5500647B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】音声による検索機能のうち、利用者の発話に呼応する機能が有効になるまでの時間を短縮できる「動的音声認識辞書の生成方法」を提供することである。
【解決手段】利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するステップ(S11)と、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するステップ(S12)と、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定するステップ(S14)と、所定の条件に応じて前記新規作成のスレッドの処理優先度を変更するステップ(S15〜S17)とを含む動的音声認識辞書の生成方法であって、前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、所定の条件に応じてそのタスクの辞書生成スレッドの処理優先度を変更するステップを更に含む構成となる。
【選択図】図5

Description

本発明は、音声認識用の動的辞書を生成する方法と、その動的辞書を生成する装置に関する。
近年、音声認識の分野において、GTP(Grapheme To Phoneme:書き文字を音声の最小単位(音素)に変換する)技術を利用した音声認識用の辞書を動的(オンライン)に作成することが可能になっている。この技術の利用例としては、車載ナビゲーションシステムにおいて実用化されている音声操作による楽曲検索機能の実現が挙げられる。この機能はデバイス(ハードディスクドライブ/携帯用プレイヤ)から吸い上げた楽曲情報(楽曲のタイトルやアーティスト等)を基に読み情報を生成し、音声認識用の動的辞書を作成した後、この作成された辞書で音声認識を行うことにより楽曲情報を選択し操作が可能となる。
しかし、これらの楽曲検索を行うためには動的辞書の作成が完了していることが必須であり、この辞書作成の処理に多くの時間がかかることが課題として挙げられる。
この課題を解決するために、音声認識辞書を新規作成(または差分更新)する際に、辞書を複数の集合に分割して作成し、作成が完了した辞書から順にロードすることによって認識開始までの時間を短縮する方法が知られている(例えば、特許文献1参照。)。
またGTPによる動的辞書作成は楽曲情報に限らずPOI(Point Of Interest:車両の現在位置近傍のコンビニエンスストア等の施設検索や、設定されたルート沿いのガソリンスタンド等の施設検索等、所定の検索条件に従って施設を検索すること)等の施設名称やアドレスブックの名前など種々の文字列を基に辞書を生成することができる。例えば、車両の現在位置近くの地名やストリート名の単語リストを自動生成し音声認識に使うことによって音声認識によるPOI/住所検索を行う方法も知られている(例えば、特許文献2参照。)。
特開2010− 72081号公報 特開2002−318136号公報
しかし、上記特許文献1に示された音声認識用辞書作成装置では、分割して作成することで一部の語彙(楽曲)については短時間で音声認識が可能になるけれども、すべての語彙が認識可能になるまでの時間は、分割せずに作成した場合と比べてなんら変わるところはない。また、上記特許文献2に示された空間構築単語リストの形成方法では、GTPによる動的辞書作成はPOI等の施設名称やアドレスブックの名前など複数の動的辞書の作成要求が多くのデバイスや機能から要求され処理される場合においても、やはり上記と同様の課題が発生する。
複数の辞書作成要求があった場合には、現在行われている辞書作成要求に対して、現在の辞書作成要求が終了するまで待機するか、或いは現在の辞書作成要求を中止するかのいずれかで処理する必要がある。現在の辞書作成要求が終了するまで待機する場合、大量の件数に対して動的辞書の作成処理を行っていると、現在の要求が完了するまでに処理時間がかかり早急に処理を開始することができない。また、現在の辞書作成要求を中止する場合、現在の辞書作成要求を中止することでPOI検索用のGTP辞書作成を即座に開始することができるけれども、現在の辞書作成が中止されてしまったため、POI検索用のGTP辞書作成が完了した後に、作成を中止した辞書を再度初めから作成しなければならない。このためPOI検索用のGTP辞書作成が一定間隔で連続して要求された場合、現在の辞書作成要求を完了させることができない場合がある。
本発明は、このような事情に鑑みてなされたもので、音声による検索機能のうち、利用者の発話に呼応する機能が有効になるまでの時間を短縮できるとともに、利用者の発話に呼応する機能の類似機能が有効になるまでの時間も短縮できるようにした動的音声認識辞書の生成方法及びその生成装置を提供するものである。
本発明に係る動的音声認識辞書の生成方法は、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するステップと、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するステップと、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定するステップと、前記優先処理中の検索カテゴリの有無及び前記検索カテゴリが前記優先処理中の検索カテゴリの生成要求タスクに所属するか否かに応じて前記新規作成のスレッドの処理優先度を変更するステップとを含む動的音声認識辞書の生成方法であって、前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及び前記タスクが前記コマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するステップを更に含むことを特徴とする構成となる。
このような構成により、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成し、辞書生成スレッドのタスクを辞書生成中タスクのリストに追加し、優先処理中の検索カテゴリがセットされていない場合、新規作成したスレッドの処理優先度を辞書生成処理スレッドの標準値に設定し、優先処理中の検索カテゴリがセットされている場合であって、辞書生成スレッドを生成したタスクが優先処理中の検索カテゴリに所属するタスクである場合、新規作成したスレッドの処理優先度を辞書生成処理スレッドの標準値に設定し、優先処理中の検索カテゴリがセットされている場合であって、優先処理中の検索カテゴリに所属しないタスクである場合、スレッドの処理優先度を下げる。また利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがある場合であって、それらのタスクが上記コマンドに対応する検索カテゴリに所属するタスクでない場合、そのタスクの辞書生成スレッドの処理優先度を下げ、辞書生成中のタスクがある場合であって、それらのタスクが上記コマンドに対応する検索カテゴリに所属するタスクである場合、そのタスクの辞書生成スレッドの処理優先度を標準値に設定する。
本発明に係る動的音声認識辞書の生成方法において、前記辞書生成が完了した否かを判定するステップと、前記辞書生成の完了したタスクを辞書生成中タスクのリストから削除するステップと、辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであるか否か及び前記辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っているか否かに応じて前記スレッドの処理優先度を変更するステップを更に含むように構成することができる。
このような構成により、辞書生成完了したタスクを辞書生成中タスクのリストから削除し、生成完了したタスクが優先処理中検索カテゴリに所属するタスクであって、辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っておらず、辞書生成中の全タスクが優先処理中の検索カテゴリ以外のものである場合、それぞれのスレッドの処理優先度を標準値に設定し、優先処理中の検索カテゴリをクリアする。
また、本発明に係る動的音声認識辞書の生成方法において、前記利用者からの前記音声認識辞書の生成要求は、内蔵された記憶部の楽曲の編集操作、携帯電話機の接続操作、内蔵されたCD・DVDプレイヤへのCD・DVDの挿入操作、携帯用プレイヤの接続操作、USBメモリの接続操作、またはSDカードの接続操作であるように構成してもよい。
このような構成より、利用者による、内蔵された記憶部の楽曲の編集操作、携帯電話機の接続操作、内蔵されたCD・DVDプレイヤへのCD・DVDの挿入操作、携帯用プレイヤの接続操作、USBメモリの接続操作、またはSDカードの接続操作があったとき、新規に辞書生成スレッドを作成し、辞書生成スレッドのタスクを辞書生成中タスクのリストに追加する。
本発明に係る動的音声認識辞書の生成装置は、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するスレッド作成手段と、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するリスト追加手段と、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定する優先処理検索カテゴリ有無判定手段と、前記優先処理中の検索カテゴリの有無及び前記検索カテゴリが前記優先処理中の検索カテゴリの生成要求タスクに所属するか否かに応じて前記新規作成のスレッドの処理優先度を変更するスレッド処理優先度変更手段とを備えた動的音声認識辞書の生成装置であって、前記スレッド処理優先度変更手段は、前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及び前記タスクが前記コマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するように構成されたことを特徴とする構成となる。
このような構成により、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成し、辞書生成スレッドのタスクを辞書生成中タスクのリストに追加し、優先処理中の検索カテゴリがセットされていない場合、新規作成したスレッドの処理優先度を辞書生成処理スレッドの標準値に設定し、優先処理中の検索カテゴリがセットされている場合であって、辞書生成スレッドを生成したタスクが優先処理中の検索カテゴリに所属するタスクである場合、新規作成したスレッドの処理優先度を辞書生成処理スレッドの標準値に設定し、優先処理中の検索カテゴリがセットされている場合であって、優先処理中の検索カテゴリに所属しないタスクである場合、スレッドの処理優先度を下げる。また利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがある場合であって、それらのタスクが上記コマンドに対応する検索カテゴリに所属するタスクでない場合、そのタスクの辞書生成スレッドの処理優先度を下げ、辞書生成中のタスクがある場合であって、それらのタスクが上記コマンドに対応する検索カテゴリに所属するタスクである場合、そのタスクの辞書生成スレッドの処理優先度を標準値に設定する。
本発明に係る動的音声認識辞書の生成装置において、前記辞書生成が完了した否かを判定する辞書完了判定手段と、前記辞書生成の完了したタスクを辞書生成中タスクのリストから削除する辞書生成タスク削除手段とを更に備え、前記スレッド処理優先度変更手段は、辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであるか否か及び前記辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っているか否かに応じて前記スレッドの処理優先度を変更するように構成することができる。
このような構成により、辞書生成完了したタスクを辞書生成中タスクのリストから削除し、生成完了したタスクが優先処理中検索カテゴリに所属するタスクであって、辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っておらず、辞書生成中の全タスクが優先処理中の検索カテゴリ以外のものである場合、それぞれのスレッドの処理優先度を標準値に設定し、優先処理中の検索カテゴリをクリアする。
本発明に係る動的音声認識辞書の生成装置において、前記利用者からの前記音声認識辞書の生成要求は、内蔵された記憶部の楽曲の編集操作、携帯電話機の接続操作、内蔵されたCD・DVDプレイヤへのCD・DVDの挿入操作、携帯用プレイヤの接続操作、USBメモリの接続操作、またはSDカードの接続操作であるように構成してもよい。
このような構成により、利用者による、内蔵された記憶部の楽曲の編集操作、携帯電話機の接続操作、内蔵されたCD・DVDプレイヤへのCD・DVDの挿入操作、携帯用プレイヤの接続操作、USBメモリの接続操作、またはSDカードの接続操作があったとき、新規に辞書生成スレッドを作成し、辞書生成スレッドのタスクを辞書生成中タスクのリストに追加する。
本発明に係る動的音声認識辞書の生成方法及びその生成装置によれば、利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及びタスクがコマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するので、音声による検索機能のうち利用者の発話に呼応する機能が有効になるまでの時間を短縮できる、即ち利用者が即座に欲する要求が優先的に処理される。 また、利用者の発話に呼応する機能の類似機能も有効になるまでの時間も短縮できる。
本発明の実施の一形態に係る動的音声認識辞書の生成装置の構成を示すブロック図である。 辞書生成タスクから音声認識辞書の電話帳データを抽出し作成した認識辞書とそれらを用いて音声認識した結果行う処理の例を示す図である。 辞書生成タスクから音声認識辞書の楽曲データを抽出し作成した認識辞書とそれらを用いて音声認識した結果行う処理の例を示す図である。 辞書生成タスクから音声認識辞書のPOIリストを抽出し作成した認識辞書とそれらを用いて音声認識した結果行う処理の例を示す図である。 辞書生成の要求受付から辞書生成開始までに利用者の発話がない場合の処理を示すフローチャートである。 辞書生成の要求受付から辞書生成開始までに利用者の発話があった場合の前半の処理を示すフローチャートである。 辞書生成の要求受付から辞書生成開始までに利用者の発話があった場合の後半の処理を示すフローチャートである。 利用者の発話内容と辞書生成タスクと検索カテゴリとの対応関係を示す図である。 辞書生成完了時の処理を示すフローチャートである。 辞書生成の要求受付から辞書生成開始までに利用者の発話がなかった場合の各処理の時間に対する流れを示す図である。 辞書生成の要求受付から辞書生成開始までに利用者の発話がなかった場合の各処理の時間に対する流れを示す図である。
以下、本発明の実施の形態について図面を用いて説明する。
本発明の実施の一形態に係る動的音声認識辞書の生成装置は、図1に示すように構成される。図1において、動的音声認識辞書の生成装置100は、コンピュータユニット(CPUを含む)にて構成される処理ユニット11を有している。処理ユニット11には、ナビゲーション装置12と、このナビゲーション装置12に必要な地図情報及び各種情報を記憶する記憶部13(例えば、ハードディスクドライブ(HDD)ユニット)とが接続されている。また、処理ユニット11には、車室内に設けられLCD等により構成される表示部14と、車室内に設けられたスピーカ15に音声信号を供給する出力回路16と、利用者の発話を入力する音声入力回路17と、利用者の音声(単語)を認識しテキストに変換する内部ドライバである音声認識エンジン20とが接続されている。音声入力回路17には、利用者が操作するスイッチ18と、利用者の発話による音声信号を電気信号に変換するマイク19が接続されている。更に、処理ユニット11には、通信機(Bluetooth)21と、CD・DVDプレイヤ22と、コネクタ25が接続されている。通信機21は車内に持ち込まれた携帯電話機22と無線で接続される。CD・DVDプレイヤ23は車内のインストルメントパネルに内蔵され、このCD・DVDプレイヤ23にはCD・DVD24が挿入可能に構成される。またコネクタ25はその差込み口が上記インストルメントパネルに露出して設けられ、このコネクタ25には携帯用プレイヤ26が接続可能に構成される。なお、記憶部13には楽曲も記憶される。
一方、処理ユニット11は、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成し、この辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するように構成される。また処理ユニット11は、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定するように構成される。更に処理ユニット11は、利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及び前記タスクが前記コマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するように構成される。
なお、図6Cにおいて、「 Favorite Place Search 」や「 POI Search 」の目的はナビゲーション装置の目的地を設定することにあるため、これらのコマンドは『目的地設定』という検索カテゴリに属する。また「 Phone book 」や「 Recently Calls 」の目的は電話をかけることであるため、『電話発信』という検索カテゴリに属する。更に「 DAP Music Search 」、「 HDD Music search 」、「 Bt Audio search 」の目的はそれぞれのデバイス内の音楽を探すことであるため、これらのコマンドは『楽曲検索』という検索カテゴリに属する。
処理ユニット11は、辞書生成が完了した否かを判定するとともに、辞書生成の完了したタスクを辞書生成中タスクのリストから削除するように構成される。また処理ユニット11は、辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであるか否か及び書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っているか否かに応じてスレッドの処理優先度を変更するように構成される。
このように構成された動的音声認識辞書の生成装置100の動作を説明する。先ず図5に示すように、利用者の発話がない場合の辞書生成処理について説明する。記憶部13に記憶された楽曲の編集やコネクタ25への携帯用プレイヤ26の接続などの利用者の操作によって、認識辞書の生成要求を受付けた場合、処理ユニット11は新規に辞書生成スレッドを生成し(S11)、辞書生成中タスクのリストに追加し(S12)、辞書生成中タスクのリストを更新する(S13)。次に処理ユニット11は、優先処理中の検索カテゴリがセットされているか否かを、利用者の発話内容と辞書生成タスクと検索カテゴリとの対応関係を示す図6Cを参照して判定し(S14)、セットされていない場合は(S14でNO)、新規作成されたスレッドの処理優先度を辞書生成処理スレッドの標準値に設定する(S17)。
優先処理中の検索カテゴリがセットされている場合は(S14でYES)、処理ユニット11は、続けて辞書生成スレッドを生成したタスクが優先処理中の検索カテゴリに所属するタスクかどうかを判定する(S15)。そして処理ユニット11は、優先処理中の検索カテゴリに所属するタスクである場合(S15でYES)、新規作成したスレッドの処理優先度を辞書生成処理スレッドの標準値に設定し(S17)、優先処理中の検索カテゴリに所属しないタスクである場合(S15でNO)、スレッドの処理優先度を(標準値−1)に設定してスレッドの処理優先度を1段下げる(S18)。
具体的には、図8Aに示すように、携帯用プレイヤ26のコネクタ25への接続、記憶部13に記憶された楽曲データの編集操作、及び通信機21への携帯電話機22の無線接続がこの順に行われた場合、先ず携帯プレイヤ26の楽曲データから音声認識辞書が生成される(図3)。この辞書生成が完了すると、記憶部13に記憶された楽曲データの音声認識辞書が生成される。この辞書生成が完了すると、携帯電話機22の電話帳データから音声認識辞書が生成され(図2)、この辞書生成が完了すると、携帯電話機22の発着信履歴データから音声認識辞書が生成される。このように利用者の操作順に従って音声認識辞書の生成が順次行われる。音声認識辞書の生成が完了すると、例えば、利用者がスイッチ18をオンし、マイク19に向って所望のアルバム名を発話すると、携帯用プレイヤ26の楽曲データから生成された音声認識辞書により音声認識されて、そのアルバムの先頭曲から再生される(図3)。また利用者がスイッチ18をオンし、マイク19に向って電話をかけたい相手の名前を発話すると、電話帳データから生成された音声認識辞書により音声認識されて、その相手に電話発信される(図2)。なお、図4に示すPOIリストから音声認識辞書を生成してもよい。また1つの辞書生成処理が完了したときに次の辞書生成処理を開始したが、各辞書生成処理を時分割で行ってもよい。
次に図6A及び図6Bに示すように、利用者の発話がある場合の辞書生成処理について説明する。利用者の発話から、動的生成の音声認識辞書を必要とするコマンドを認識した場合(S22でYES)、処理ユニット11は、図6Cを参照し、上記コマンドに対応する検索カテゴリに所属するタスクの辞書が既に生成完了している、もしくは辞書生成中であるか否かを判定する(S23)。そして、処理ユニット11は、上記コマンドに対応する検索カテゴリに所属するタスクのうち、辞書がまだなく、辞書生成も開始していない場合(S23でNO)、図5の処理(S24)により、辞書生成スレッドを新規作成し(S11)、タスクをリストに追加し(S12)、辞書生成中のタスクのリストを更新する(S13)。
辞書生成中のタスクがある場合(S25でYES)、処理ユニット11は辞書生成中タスクのリストを参照し(S26)、このリストのN番目のタスクをAとし(S28)、このAが認識コマンドの所属する検索カテゴリに含まれるか否かを判定する(S29)。そして、処理ユニット11はAが認識コマンドの所属する検索カテゴリに含まれると判定した場合(A29でYES)、この検索カテゴリを優先処理中の検索カテゴリに設定し(S30,S31)、Aのスレッド優先度を標準値に設定する(S32)。なお、上記認識コマンドが所属する検索カテゴリに含まれるタスクが1つでもある場合、処理ユニット11はその検索カテゴリを優先処理中の検索カテゴリに設定する。一方、Aが認識コマンドの所属する検索カテゴリに含まれないと処理ユニット11が判定した場合(S29でNO)、Aのスレッド優先度を(標準値−1)に設定し、処理優先度を1段下げる(S33)。これらの処理は辞書生成中タスクの全てが完了するまで繰り返される(S34,S35)。
具体的には、図8Bに示すように、携帯用プレイヤ26のコネクタ25への接続、記憶部13に記憶された楽曲データの編集操作、及び通信機21への携帯電話機22の無線接続がこの順に行われた場合、携帯プレイヤ26の楽曲データからの音声認識辞書の生成(図3)、記憶部13に記憶された楽曲データの音声認識辞書の生成、携帯電話機22の電話帳データからの音声認識辞書の生成(図2)、及び携帯電話機22の発着信履歴データからの音声認識辞書の生成が時分割で行われる。そして、各音声認識辞書の生成中に「 Recently calls 」と利用者が発話すると、『電話発信』以外の検索カテゴリに属する携帯プレイヤ26の楽曲データからの音声認識辞書の生成(図3)、及び記憶部13に記憶された楽曲データの音声認識辞書の生成が一時中断され、携帯電話機22の電話帳データからの音声認識辞書の生成(図2)、及び携帯電話機22の発着信履歴データからの音声認識辞書の生成が時分割で続行される。これにより携帯電話機22の電話帳データからの音声認識辞書の生成(図2)、及び携帯電話機22の発着信履歴データからの音声認識辞書の生成が速やかに完了するので、最近の発着信履歴のリストが表示部に表示される。この結果、利用者はそのリストの中から電話をかけたい相手を発話することにより、速やかに相手に電話発信される。このように音声による検索機能のうち利用者の発話に呼応する機能が有効になるまでの時間を短縮できる。
また、利用者の発話に呼応する機能の類似機能も有効になるまでの時間も短縮できる。即ち、利用者が携帯用プレイヤ26内の楽曲検索を試みたが所望の楽曲が存在しなかった場合、続けて記憶部やCD・DVDプレイヤ24内の楽曲を検索するケースが想定される。また、電話発信しようとした際、先ず発着信履歴を検索してリスト上位になければ電話帳内を検索するケースも想定される。このような場合でも音声による検索機能有効化までの時間が短縮できる。
更に、辞書生成完了時の動作を図7に基づいて説明する。先ず処理ユニット11は辞書生成完了したタスクを辞書生成中タスクのリストから削除する(S41)。次いで処理ユニット11は、生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクかどうかを判定する(S43)。そして、処理ユニット11は生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクである場合(S43でYES)、辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っていないかを判定する(S45)。辞書生成中の全タスクが優先処理中の検索カテゴリ以外のものである場合(S45でNO)、処理ユニット11はそれぞれのスレッドの処理優先度を標準値に設定し(S46)、優先処理中の検索カテゴリをクリアする(S47)。
以上、説明したように、本発明に係る動的音声認識辞書の生成方法は、音声による検索機能のうち、利用者の発話に呼応する機能が有効になるまでの時間を短縮できるとともに、利用者の発話に呼応する機能の類似機能が有効になるまでの時間も短縮できるという効果を有し、音声認識用の動的辞書を生成するのに有用である。
100 動的音声認識辞書の作成装置
11 処理ユニット
12 ナビゲーション装置
13 記憶部
14 表示部
15 出力回路
16 スピーカ
17 音声入力回路
18 スイッチ
19 マイク
20 音声認識エンジン
21 通信機
22 携帯電話機
23 CD・DVDプレイヤ
24 CD・DVD
25 コネクタ
26 携帯用プレイヤ

Claims (6)

  1. 利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するステップと、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するステップと、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定するステップと、前記優先処理中の検索カテゴリの有無及び前記検索カテゴリが前記優先処理中の検索カテゴリの生成要求タスクに所属するか否かに応じて前記新規作成のスレッドの処理優先度を変更するステップとを含む動的音声認識辞書の生成方法であって、
    前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及び前記タスクが前記コマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するステップを更に含むことを特徴とする動的音声認識辞書の生成方法。
  2. 前記辞書生成が完了した否かを判定するステップと、前記辞書生成の完了したタスクを辞書生成中タスクのリストから削除するステップと、辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであるか否か及び前記辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っているか否かに応じて前記スレッドの処理優先度を変更するステップを更に含む請求項1記載の動的音声認識辞書の生成方法。
  3. 前記利用者からの前記音声認識辞書の生成要求は、内蔵された記憶部の楽曲の編集操作、携帯電話機の接続操作、内蔵されたCD・DVDプレイヤへのCD・DVDの挿入操作、携帯用プレイヤの接続操作、USBメモリの接続操作、またはSDカードの接続操作である請求項1記載の動的音声認識辞書の生成方法。
  4. 利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するスレッド作成手段と、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するリスト追加手段と、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定する優先処理検索カテゴリ有無判定手段と、前記優先処理中の検索カテゴリの有無及び前記検索カテゴリが前記優先処理中の検索カテゴリの生成要求タスクに所属するか否かに応じて前記新規作成のスレッドの処理優先度を変更するスレッド処理優先度変更手段とを備えた動的音声認識辞書の生成装置であって、
    前記スレッド処理優先度変更手段は、前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及び前記タスクが前記コマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するように構成されたことを特徴とする動的音声認識辞書の生成装置。
  5. 前記辞書生成が完了した否かを判定する辞書完了判定手段と、前記辞書生成の完了したタスクを辞書生成中タスクのリストから削除する辞書生成タスク削除手段とを更に備え、
    前記スレッド処理優先度変更手段は、辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであるか否か及び前記辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っているか否かに応じて前記スレッドの処理優先度を変更するように構成された請求項4記載の動的音声認識辞書の生成装置。
  6. 前記利用者からの前記音声認識辞書の生成要求は、内蔵された記憶部の楽曲の編集操作、携帯電話機の接続操作、内蔵されたCD・DVDプレイヤへのCD・DVDの挿入操作、携帯用プレイヤの接続操作、USBメモリの接続操作、またはSDカードの接続操作である請求項4記載の動的音声認識辞書の生成装置。
JP2010198780A 2010-09-06 2010-09-06 動的音声認識辞書の生成方法及びその生成装置 Active JP5500647B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010198780A JP5500647B2 (ja) 2010-09-06 2010-09-06 動的音声認識辞書の生成方法及びその生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010198780A JP5500647B2 (ja) 2010-09-06 2010-09-06 動的音声認識辞書の生成方法及びその生成装置

Publications (2)

Publication Number Publication Date
JP2012058311A true JP2012058311A (ja) 2012-03-22
JP5500647B2 JP5500647B2 (ja) 2014-05-21

Family

ID=46055521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010198780A Active JP5500647B2 (ja) 2010-09-06 2010-09-06 動的音声認識辞書の生成方法及びその生成装置

Country Status (1)

Country Link
JP (1) JP5500647B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016088241A1 (ja) * 2014-12-05 2016-06-09 三菱電機株式会社 音声処理システム及び音声処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249686A (ja) * 2000-03-08 2001-09-14 Matsushita Electric Ind Co Ltd 音声認識方法、音声認識装置、およびナビゲーション装置
JP2003202895A (ja) * 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
JP2010072081A (ja) * 2008-09-16 2010-04-02 Denso Corp 音声認識用辞書作成装置
JP2011215175A (ja) * 2010-03-31 2011-10-27 Alpine Electronics Inc 車載用電子装置およびその音楽データの音声認識辞書生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249686A (ja) * 2000-03-08 2001-09-14 Matsushita Electric Ind Co Ltd 音声認識方法、音声認識装置、およびナビゲーション装置
JP2003202895A (ja) * 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
JP2010072081A (ja) * 2008-09-16 2010-04-02 Denso Corp 音声認識用辞書作成装置
JP2011215175A (ja) * 2010-03-31 2011-10-27 Alpine Electronics Inc 車載用電子装置およびその音楽データの音声認識辞書生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016088241A1 (ja) * 2014-12-05 2016-06-09 三菱電機株式会社 音声処理システム及び音声処理方法

Also Published As

Publication number Publication date
JP5500647B2 (ja) 2014-05-21

Similar Documents

Publication Publication Date Title
CN111095400A (zh) 选择系统和方法
US9805722B2 (en) Interactive speech recognition system
US7870142B2 (en) Text to grammar enhancements for media files
US9092435B2 (en) System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
KR102281178B1 (ko) 멀티-레벨 음성 인식 방법 및 장치
JP5821639B2 (ja) 音声認識装置
US8949133B2 (en) Information retrieving apparatus
JP3964734B2 (ja) ナビゲ−ション装置
JP6128146B2 (ja) 音声検索装置、音声検索方法及びプログラム
US20160372110A1 (en) Adapting voice input processing based on voice input characteristics
JP2014219614A (ja) オーディオ装置、ビデオ装置及びコンピュータプログラム
JP5274711B2 (ja) 音声認識装置
US8484582B2 (en) Entry selection from long entry lists
JP2013088477A (ja) 音声認識システム
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
JP5500647B2 (ja) 動的音声認識辞書の生成方法及びその生成装置
JP2003162293A (ja) 音声認識装置及び方法
JP5942559B2 (ja) 音声認識装置
KR20200072105A (ko) 차량용 인포테인먼트 시스템 및 그의 제어 방법과 그를 포함하는 차량
JP3615309B2 (ja) データ検索装置および方法、情報記憶媒体
JP2013068665A (ja) 音声認識装置
JP5927969B2 (ja) 音声認識システム
JP4859642B2 (ja) 音声情報管理装置
JP2007193184A (ja) 音声住所認識装置
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140306

R150 Certificate of patent or registration of utility model

Ref document number: 5500647

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150