JP5500647B2 - Method and apparatus for generating dynamic speech recognition dictionary - Google Patents

Method and apparatus for generating dynamic speech recognition dictionary Download PDF

Info

Publication number
JP5500647B2
JP5500647B2 JP2010198780A JP2010198780A JP5500647B2 JP 5500647 B2 JP5500647 B2 JP 5500647B2 JP 2010198780 A JP2010198780 A JP 2010198780A JP 2010198780 A JP2010198780 A JP 2010198780A JP 5500647 B2 JP5500647 B2 JP 5500647B2
Authority
JP
Japan
Prior art keywords
speech recognition
recognition dictionary
task
dictionary
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010198780A
Other languages
Japanese (ja)
Other versions
JP2012058311A (en
Inventor
千春 武田
文彦 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2010198780A priority Critical patent/JP5500647B2/en
Publication of JP2012058311A publication Critical patent/JP2012058311A/en
Application granted granted Critical
Publication of JP5500647B2 publication Critical patent/JP5500647B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声認識用の動的辞書を生成する方法と、その動的辞書を生成する装置に関する。   The present invention relates to a method for generating a dynamic dictionary for speech recognition and an apparatus for generating the dynamic dictionary.

近年、音声認識の分野において、GTP(Grapheme To Phoneme:書き文字を音声の最小単位(音素)に変換する)技術を利用した音声認識用の辞書を動的(オンライン)に作成することが可能になっている。この技術の利用例としては、車載ナビゲーションシステムにおいて実用化されている音声操作による楽曲検索機能の実現が挙げられる。この機能はデバイス(ハードディスクドライブ/携帯用プレイヤ)から吸い上げた楽曲情報(楽曲のタイトルやアーティスト等)を基に読み情報を生成し、音声認識用の動的辞書を作成した後、この作成された辞書で音声認識を行うことにより楽曲情報を選択し操作が可能となる。   In recent years, in the field of speech recognition, it has become possible to dynamically (online) create a dictionary for speech recognition using GTP (Grapheme To Phoneme) technology that converts written characters to the smallest speech units (phonemes). It has become. As an example of use of this technology, there is a realization of a music search function by voice operation that is put into practical use in an in-vehicle navigation system. This function was created after reading information was created based on music information (music title, artist, etc.) sucked from the device (hard disk drive / portable player) and a dynamic dictionary for voice recognition was created. By performing voice recognition using a dictionary, music information can be selected and operated.

しかし、これらの楽曲検索を行うためには動的辞書の作成が完了していることが必須であり、この辞書作成の処理に多くの時間がかかることが課題として挙げられる。   However, in order to perform these music searches, it is indispensable that the creation of the dynamic dictionary is completed, and it takes a long time to process this dictionary creation.

この課題を解決するために、音声認識辞書を新規作成(または差分更新)する際に、辞書を複数の集合に分割して作成し、作成が完了した辞書から順にロードすることによって認識開始までの時間を短縮する方法が知られている(例えば、特許文献1参照。)。   To solve this problem, when creating a new voice recognition dictionary (or differential update), the dictionary is created by dividing it into a plurality of sets, and loading is performed in order from the completed dictionary until the start of recognition. A method for shortening the time is known (for example, see Patent Document 1).

またGTPによる動的辞書作成は楽曲情報に限らずPOI(Point Of Interest:車両の現在位置近傍のコンビニエンスストア等の施設検索や、設定されたルート沿いのガソリンスタンド等の施設検索等、所定の検索条件に従って施設を検索すること)等の施設名称やアドレスブックの名前など種々の文字列を基に辞書を生成することができる。例えば、車両の現在位置近くの地名やストリート名の単語リストを自動生成し音声認識に使うことによって音声認識によるPOI/住所検索を行う方法も知られている(例えば、特許文献2参照。)。   The dynamic dictionary creation by GTP is not limited to music information, but it is a predetermined search such as POI (Point Of Interest: Search for facilities such as convenience stores near the current position of the vehicle, search for facilities such as gas stations along the set route, etc. It is possible to generate a dictionary based on various character strings such as facility names such as searching facilities according to conditions) and address book names. For example, a method of performing POI / address search by voice recognition by automatically generating a word list of street names and street names near the current position of the vehicle and using it for voice recognition is also known (see, for example, Patent Document 2).

特開2010− 72081号公報JP 2010-72081 A 特開2002−318136号公報JP 2002-318136 A

しかし、上記特許文献1に示された音声認識用辞書作成装置では、分割して作成することで一部の語彙(楽曲)については短時間で音声認識が可能になるけれども、すべての語彙が認識可能になるまでの時間は、分割せずに作成した場合と比べてなんら変わるところはない。また、上記特許文献2に示された空間構築単語リストの形成方法では、GTPによる動的辞書作成はPOI等の施設名称やアドレスブックの名前など複数の動的辞書の作成要求が多くのデバイスや機能から要求され処理される場合においても、やはり上記と同様の課題が発生する。   However, in the speech recognition dictionary creating apparatus disclosed in Patent Document 1, although it is possible to recognize a part of vocabulary (songs) in a short time by dividing it, all vocabularies are recognized. There is no change in the time until it becomes possible compared to the case where it is created without dividing. In addition, in the method for forming a spatially constructed word list disclosed in Patent Document 2, dynamic dictionary creation using GTP requires many devices such as POI or other facility names and address book names to be created. Even when processing is requested from a function, the same problem as described above occurs.

複数の辞書作成要求があった場合には、現在行われている辞書作成要求に対して、現在の辞書作成要求が終了するまで待機するか、或いは現在の辞書作成要求を中止するかのいずれかで処理する必要がある。現在の辞書作成要求が終了するまで待機する場合、大量の件数に対して動的辞書の作成処理を行っていると、現在の要求が完了するまでに処理時間がかかり早急に処理を開始することができない。また、現在の辞書作成要求を中止する場合、現在の辞書作成要求を中止することでPOI検索用のGTP辞書作成を即座に開始することができるけれども、現在の辞書作成が中止されてしまったため、POI検索用のGTP辞書作成が完了した後に、作成を中止した辞書を再度初めから作成しなければならない。このためPOI検索用のGTP辞書作成が一定間隔で連続して要求された場合、現在の辞書作成要求を完了させることができない場合がある。   If there are multiple dictionary creation requests, either waiting until the current dictionary creation request is completed or canceling the current dictionary creation request for the current dictionary creation request It is necessary to process with. When waiting for the completion of the current dictionary creation request, if dynamic dictionary creation processing is performed for a large number of cases, it will take time to complete the current request and processing will start immediately. I can't. Also, when canceling the current dictionary creation request, it is possible to immediately start the GTP dictionary creation for POI search by canceling the current dictionary creation request, but the current dictionary creation has been suspended. After the creation of the GTP dictionary for POI search is completed, the dictionary for which creation has been stopped must be created again from the beginning. For this reason, when GTP dictionary creation for POI search is continuously requested at regular intervals, the current dictionary creation request may not be completed.

本発明は、このような事情に鑑みてなされたもので、音声による検索機能のうち、利用者の発話に呼応する機能が有効になるまでの時間を短縮できるとともに、利用者の発話に呼応する機能の類似機能が有効になるまでの時間も短縮できるようにした動的音声認識辞書の生成方法及びその生成装置を提供するものである。   The present invention has been made in view of such circumstances, and among the search functions by voice, it is possible to shorten the time until the function that responds to the user's utterance becomes effective, and to respond to the user's utterance. It is an object of the present invention to provide a method for generating a dynamic speech recognition dictionary and a device for generating the same, which can shorten the time until a function similar to a function becomes effective.

本発明に係る動的音声認識辞書の生成方法は、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するステップ(S11)と、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するステップ(S12)を有し、前記リストにセットされたタスクで必要な音声認識辞書を生成する動的音声認識辞書の生成方法であって、音声認識辞書生成が必要なタスクに対応するコマンドを目的毎に分類する検索カテゴリであって、優先処理中のものがあるか否かを判定するステップ(S14)と、優先処理中の前記検索カテゴリがあると判定されたときに、該検索カテゴリに所属するタスクで必要な音声認識辞書を、優先処理中でない検索カテゴリに所属するタスクで必要な音声認識辞書より優先して生成するステップ(S19)と、前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき該コマンドに対応するタスクが属する検索カテゴリを優先処理中の検索カテゴリに設定するステップ(S30)とを有する構成となる。
The dynamic speech recognition dictionary generation method according to the present invention includes a step (S11) of newly creating a dictionary generation thread when a request for generation of a speech recognition dictionary is received from a user, and a task of the dictionary generation thread. A dynamic speech recognition dictionary generating method for generating a speech recognition dictionary necessary for a task set in the list, the step of adding to a list of tasks during dictionary generation (S12). A step (S14) of determining whether there is a search category that classifies commands corresponding to tasks that require a task for each purpose, and whether there is a search category that is being prioritized, The voice recognition dictionary required for the task belonging to the search category is given priority over the voice recognition dictionary required for the task belonging to the search category not in the priority process. A step of forming (S19), when it recognizes a command that requires a dynamic generation of speech recognition dictionary when there is speech of the user, the search in the priority processing a search category task corresponding to the command belongs And a step of setting the category (S30) .

本発明に係る動的音声認識辞書の生成方法において、前記音声認識辞書生成が完了したときに、前記音声認識辞書生成の完了したタスクを辞書生成中タスクのリストから削除するステップ(S41)と、前記音声認識辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであって、前記辞書生成中タスクのリスト内に優先処理中の前記検索カテゴリに所属するタスクが残っていない場合、前記検索カテゴリが優先処理中のものであることを解除するステップ(S47)とを更に含む構することができる。
In a method of generating a dynamic speech recognition dictionary according to the present invention, when the voice recognition dictionary generated is completed, a step (S41) for deleting the completed tasks of said voice recognition dictionary generated from a list of dictionary generation in task, If the task has been completed of the voice recognition dictionary generation What task der belonging to the search category in the priority processing, there is no remaining task that belongs to the search category in the priority processing in the dictionary generation in the list of tasks , the search categories can be step of releasing the (S47) and further including configuration to that those in the priority processing.

本発明に係る動的音声認識辞書の生成装置は、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するスレッド作成手段(S11)と、前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するリスト追加手段(S12)を有し前記リストにセットされたタスクで必要な音声認識辞書を生成する動的音声認識辞書の生成装置であって、音声認識辞書生成が必要なタスクに対応するコマンドを目的毎に分類する検索カテゴリであって、優先処理中のものがあるか否かを判定する優先処理検索カテゴリ有無判定手段(S14)と、優先処理中の前記検索カテゴリがあると判定されたときに、該検索カテゴリに所属するタスクで必要な音声認識辞書を、優先処理中でない検索カテゴリに所属するタスクで必要な音声認識辞書より優先して生成する手段(S19)と、前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき該コマンドに対応するタスクが属する検索カテゴリを優先処理中の検索カテゴリに設定する手段(S30)とを有する構成となる。
The dynamic speech recognition dictionary generation apparatus according to the present invention includes a thread creation means (S11) for creating a new dictionary creation thread when a speech recognition dictionary creation request is received from a user, and the dictionary creation thread. and a list addition means (S12) to add tasks to the list of dictionary generation in task, a generator of dynamic speech recognition dictionary to generate a speech recognition dictionary required by the task set in said list, Preferential processing search category presence / absence determining means (S14) for determining whether or not there is a search category for classifying commands corresponding to tasks that require speech recognition dictionary generation for each purpose; when it is determined that there is the search categories being processed, the speech recognition dictionary required by the task belonging to the search category, belonging to the search category not being priority processing And means (S19) for generating in preference speech recognition dictionary required by disk, when it recognizes a command that requires a dynamic generation of speech recognition dictionary when there is speech of the user, corresponding to the command the search category that task belongs becomes configured to have a means (S30) for setting a search category in priority processing.

本発明に係る動的音声認識辞書の生成装置において、前記音声認識辞書生成が完了したときに、前記音声認識辞書生成の完了したタスクを辞書生成中タスクのリストから削除する辞書生成タスク削除(S41)と、前記音声認識辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであって、前記辞書生成中タスクのリスト内に優先処理中の前記検索カテゴリに所属するタスクが残っていない場合、前記検索カテゴリが優先処理中のものであることを解除する手段(S47)とを有する構成することができる。
In generating apparatus for dynamic speech recognition dictionary according to the present invention, when the voice recognition dictionary generation is completed, the dictionary generation task deletion to delete completed tasks of said voice recognition dictionary generated from a list of dictionary generation in task (S41 a), I task der that the completed tasks of speech recognition dictionary generation belongs to the search category in the priority processing, it remains a task that belongs to the search category in the priority processing in the dictionary generation in the list of tasks Tei If not, the search categories can be configured to have a means for releasing (S47) that is intended in the priority processing.

本発明に係る動的音声認識辞書の生成方法及びその生成装置によれば、利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及びタスクがコマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するので、音声による検索機能のうち利用者の発話に呼応する機能が有効になるまでの時間を短縮できる、即ち利用者が即座に欲する要求が優先的に処理される。 また、利用者の発話に呼応する機能の類似機能も有効になるまでの時間も短縮できる。   According to the method and apparatus for generating a dynamic speech recognition dictionary according to the present invention, when a command that requires a dynamically generated speech recognition dictionary is recognized due to a user's utterance, the task during dictionary generation is performed. The processing priority of the dictionary generation thread of the task is changed depending on whether or not the task belongs to the search category corresponding to the command. It is possible to shorten the time until the corresponding function becomes effective, that is, the request that the user wants immediately is processed preferentially. In addition, it is possible to shorten the time until the function similar to the function responding to the user's utterance becomes effective.

本発明の実施の一形態に係る動的音声認識辞書の生成装置の構成を示すブロック図である。It is a block diagram which shows the structure of the production | generation apparatus of the dynamic speech recognition dictionary which concerns on one Embodiment of this invention. 辞書生成タスクから音声認識辞書の電話帳データを抽出し作成した認識辞書とそれらを用いて音声認識した結果行う処理の例を示す図である。It is a figure which shows the example of the process performed as a result of carrying out the speech recognition using them, and the recognition dictionary which extracted and created the telephone directory data of the speech recognition dictionary from the dictionary production | generation task. 辞書生成タスクから音声認識辞書の楽曲データを抽出し作成した認識辞書とそれらを用いて音声認識した結果行う処理の例を示す図である。It is a figure which shows the example of the process performed as a result of carrying out the speech recognition using them using the recognition dictionary which extracted and created the music data of the speech recognition dictionary from the dictionary production | generation task. 辞書生成タスクから音声認識辞書のPOIリストを抽出し作成した認識辞書とそれらを用いて音声認識した結果行う処理の例を示す図である。It is a figure which shows the example of the process performed as a result of carrying out the speech recognition using them using the recognition dictionary which extracted and created the POI list | wrist of the speech recognition dictionary from the dictionary production | generation task. 音声認識辞書生成に係る要求を受付けた際の処理を示すフローチャートである。It is a flowchart which shows the process at the time of receiving the request | requirement which concerns on speech recognition dictionary production | generation . 用者の発話があった場合の前半の処理を示すフローチャートである。It is a flowchart illustrating the first half of the processes performed when there is speech of a Subscriber. 用者の発話があった場合の後半の処理を示すフローチャートである。Is a flow chart showing the second half of the process when there is speech of a Subscriber. 利用者の発話内容と辞書生成タスクと検索カテゴリとの対応関係を示す図である。It is a figure which shows the correspondence of a user's utterance content, a dictionary production | generation task, and a search category. 辞書生成完了時の処理を示すフローチャートである。It is a flowchart which shows the process at the time of completion of dictionary production | generation. 利用者の発話があった場合に優先度の設定がなされずに行われる処理の時間的な流れの例を示す図である It is a figure which shows the example of the time flow of the process performed without a priority being set when there is a user's utterance . 利用者の発話があった場合に設定される優先度に従って行われる処理の時間的な流れの例を示す図である It is a figure which shows the example of the time flow of the process performed according to the priority set when there is a user's utterance .

以下、本発明の実施の形態について図面を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

本発明の実施の一形態に係る動的音声認識辞書の生成装置は、図1に示すように構成される。図1において、動的音声認識辞書の生成装置100は、コンピュータユニット(CPUを含む)にて構成される処理ユニット11を有している。処理ユニット11には、ナビゲーション装置12と、このナビゲーション装置12に必要な地図情報及び各種情報を記憶する記憶部13(例えば、ハードディスクドライブ(HDD)ユニット)とが接続されている。また、処理ユニット11には、車室内に設けられLCD等により構成される表示部14と、車室内に設けられたスピーカ15に音声信号を供給する出力回路16と、利用者の発話を入力する音声入力回路17と、利用者の音声(単語)を認識しテキストに変換する内部ドライバである音声認識エンジン20とが接続されている。音声入力回路17には、利用者が操作するスイッチ18と、利用者の発話による音声信号を電気信号に変換するマイク19が接続されている。更に、処理ユニット11には、通信機(Bluetooth)21と、CD・DVDプレイヤ22と、コネクタ25が接続されている。通信機21は車内に持ち込まれた携帯電話機22と無線で接続される。CD・DVDプレイヤ23は車内のインストルメントパネルに内蔵され、このCD・DVDプレイヤ23にはCD・DVD24が挿入可能に構成される。またコネクタ25はその差込み口が上記インストルメントパネルに露出して設けられ、このコネクタ25には携帯用プレイヤ26が接続可能に構成される。なお、記憶部13には楽曲も記憶される。   A dynamic speech recognition dictionary generating apparatus according to an embodiment of the present invention is configured as shown in FIG. In FIG. 1, a dynamic speech recognition dictionary generation apparatus 100 has a processing unit 11 composed of a computer unit (including a CPU). The processing unit 11 is connected to a navigation device 12 and a storage unit 13 (for example, a hard disk drive (HDD) unit) that stores map information and various information necessary for the navigation device 12. Further, the processing unit 11 is provided with a display unit 14 that is provided in the vehicle interior and configured by an LCD or the like, an output circuit 16 that supplies an audio signal to a speaker 15 provided in the vehicle interior, and a user's utterance. The voice input circuit 17 is connected to a voice recognition engine 20 which is an internal driver that recognizes a user's voice (word) and converts it into text. Connected to the voice input circuit 17 are a switch 18 operated by the user and a microphone 19 for converting a voice signal generated by the user's speech into an electrical signal. Further, a communication device (Bluetooth) 21, a CD / DVD player 22, and a connector 25 are connected to the processing unit 11. The communication device 21 is wirelessly connected to a mobile phone 22 brought into the vehicle. The CD / DVD player 23 is built in an instrument panel in the vehicle, and the CD / DVD player 23 can be inserted into the CD / DVD player 23. Further, the connector 25 is provided so that its insertion port is exposed to the instrument panel, and a portable player 26 can be connected to the connector 25. Note that music is also stored in the storage unit 13.

一方、処理ユニット11は、利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成し、この辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するように構成される。また処理ユニット11は、辞書生成が必要なタスクに対応するコマンドを目的毎に分類した優先処理中の検索カテゴリがあるか否かを判定するように構成される。更に処理ユニット11は、利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき、辞書生成中のタスクがあるか否か及び前記タスクが前記コマンドに対応する検索カテゴリに属するタスクであるか否かに応じてそのタスクの辞書生成スレッドの処理優先度を変更するように構成される。   On the other hand, the processing unit 11 is configured to newly create a dictionary generation thread when a voice recognition dictionary generation request is received from the user, and add the dictionary generation thread task to the list of dictionary generation tasks. Is done. The processing unit 11 is configured to determine whether or not there is a search category in priority processing in which commands corresponding to tasks requiring dictionary generation are classified for each purpose. Further, when the processing unit 11 recognizes a command that requires a dynamically generated speech recognition dictionary when a user utters, the processing unit 11 determines whether or not there is a task that is generating a dictionary and the task corresponds to the command. The processing priority of the dictionary generation thread of the task is changed depending on whether the task belongs to the category.

なお、図6Cにおいて、「 Favorite Place Search 」や「 POI Search 」の目的はナビゲーション装置の目的地を設定することにあるため、これらのコマンドは『目的地設定』という検索カテゴリに属する。また「 Phone book 」や「 Recently Calls 」の目的は電話をかけることであるため、『電話発信』という検索カテゴリに属する。更に「 DAP Music Search 」、「 HDD Music search 」、「 Bt Audio search 」の目的はそれぞれのデバイス内の音楽を探すことであるため、これらのコマンドは『楽曲検索』という検索カテゴリに属する。   In FIG. 6C, since the purpose of “Favorite Place Search” and “POI Search” is to set the destination of the navigation device, these commands belong to the search category “set destination”. In addition, since the purpose of “Phone book” and “Recent Calls” is to make a call, it belongs to the search category of “calling a phone”. Furthermore, since the purpose of “DAP Music Search”, “HDD Music search”, and “Bt Audio search” is to search for music in each device, these commands belong to the search category “music search”.

処理ユニット11は、辞書生成が完了した否かを判定するとともに、辞書生成の完了したタスクを辞書生成中タスクのリストから削除するように構成される。また処理ユニット11は、辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであるか否か及び書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っているか否かに応じてスレッドの処理優先度を変更するように構成される。   The processing unit 11 is configured to determine whether or not dictionary generation has been completed and to delete a task for which dictionary generation has been completed from the list of tasks that are being generated by the dictionary. Further, the processing unit 11 determines whether or not the task for which dictionary generation has been completed is a task belonging to the search category being preferentially processed, and the task belonging to the search category being preferentially processed remains in the list of tasks being generated. It is configured to change the processing priority of a thread according to whether or not it exists.

このように構成された動的音声認識辞書の生成装置100の動作を説明する。先ず図5に示すよう辞書生成処理について説明する。記憶部13に記憶された楽曲の編集やコネクタ25への携帯用プレイヤ26の接続などの利用者の操作によって、認識辞書の生成要求を受付けた場合、処理ユニット11は新規に辞書生成スレッドを生成し(S11)、辞書生成中タスクのリストに追加し(S12)、辞書生成中タスクのリストを更新する(S13)。次に処理ユニット11は、後述するように優先処理中の検索カテゴリがセットされているか否かを判定し(S14)、セットされていない場合は(S14でNO)、新規作成されたスレッドの処理優先度を辞書生成処理スレッドの標準値に設定する(S17)。
The operation of the dynamic speech recognition dictionary generation apparatus 100 configured as described above will be described. First, a dictionary generation process as shown in FIG. 5 will be described. When a recognition dictionary generation request is received by a user's operation such as editing a song stored in the storage unit 13 or connecting the portable player 26 to the connector 25, the processing unit 11 newly generates a dictionary generation thread. (S11), the list is added to the dictionary generation task list (S12), and the dictionary generation task list is updated (S13). Then the processing unit 11 determine the constant whether search categories in priority process is set as described below (S14), if has not been set (at S14 NO), the threads created new The processing priority is set to the standard value of the dictionary generation processing thread (S17).

優先処理中の検索カテゴリがセットされている場合は(S14でYES)、処理ユニット11は、続けて辞書生成スレッドを生成したタスクが優先処理中の検索カテゴリに所属するタスクかどうかを判定する(S15)。そして処理ユニット11は、優先処理中の検索カテゴリに所属するタスクである場合(S15でYES)、新規作成したスレッドの処理優先度を辞書生成処理スレッドの標準値に設定し(S17)、優先処理中の検索カテゴリに所属しないタスクである場合(S15でNO)、スレッドの処理優先度を(標準値−1)に設定してスレッドの処理優先度を1段下げる(S18)。その後、前記音声認識辞書の生成要求に応じた音声認識辞書の生成が開始される(S19)。
If the search category in the priority process is set (YES in S14), the processing unit 11 determines whether the task that subsequently generated the dictionary generation thread belongs to the search category in the priority process ( S15). If the processing unit 11 is a task belonging to the search category being preferentially processed (YES in S15), the processing priority of the newly created thread is set to the standard value of the dictionary generation processing thread (S17). If the task does not belong to the search category (NO in S15), the thread processing priority is set to (standard value -1) and the thread processing priority is lowered by one level (S18). Thereafter, generation of a voice recognition dictionary in response to the voice recognition dictionary generation request is started (S19).

具体的には、携帯用プレイヤ26のコネクタ25への接続、記憶部13に記憶された楽曲データの編集操作、及び通信機21への携帯電話機22の無線接続等に起因して音声認識辞書が生成される。例えば、図3に示すように、携帯プレイヤ26の楽曲データから、あるいは、記憶部13に記憶された楽曲データから、音声認識辞書が生成される。例えば、図2に示すように、携帯電話機22の電話帳データから音声認識辞書が生成される。例えば、携帯電話機22の発着信履歴データから、前記電話帳データに係る音声認識辞書と同様に電話発信に係る(図6C参照)音声認識辞書が生成される。前記音声認識辞書の生成が完了すると、例えば、利用者がスイッチ18をオンし、マイク19に向って所望のアルバム名を発話すると、携帯用プレイヤ26の楽曲データから生成された音声認識辞書により音声認識されて、そのアルバムの先頭曲から再生される(図3参照)。また利用者がスイッチ18をオンし、マイク19に向って電話をかけたい相手の名前を発話すると、電話帳データから生成された音声認識辞書により音声認識されて、その相手に電話発信される(図2参照)。なお、図4に示すPOIリストから音声認識辞書を生成してもよい。また1つの辞書生成処理が完了したときに次の辞書生成処理を開始したが、各辞書生成処理を時分割で行ってもよい。
Specifically, connection to the connector 25 of the portable for the player 26, the editing operation of the music data stored in the storage unit 13, and a voice recognition dictionary due to the radio connection of the mobile telephone 22 to the communicator 21 Is generated. For example, as shown in FIG. 3, the music data of the portable player 26, or from the music data stored in the storage unit 13, the speech recognition dictionary Ru is generated. For example, as shown in FIG. 2, the speech recognition dictionary from the phone book data of the cellular phone 22 is Ru is generated. For example, a voice recognition dictionary related to a telephone call (see FIG. 6C) is generated from the outgoing / incoming history data of the mobile phone 22 in the same manner as the voice recognition dictionary related to the telephone directory data . When the generation of the voice recognition dictionary is completed, for example, when the user turns on the switch 18 and utters a desired album name toward the microphone 19, the voice is recognized by the voice recognition dictionary generated from the music data of the portable player 26. Recognized and played from the beginning of the album ( see FIG. 3). When the user turns on the switch 18 and speaks the name of the other party who wants to make a call toward the microphone 19, the voice is recognized by the voice recognition dictionary generated from the phone book data, and a call is made to the other party ( ( See FIG. 2). Note that a speech recognition dictionary may be generated from the POI list shown in FIG. The next dictionary generation process is started when one dictionary generation process is completed, but each dictionary generation process may be performed in a time-sharing manner.

次に図6A及び図6Bに示すように、利用者の発話がある場合の辞書生成処理について説明する。利用者の発話から、動的生成の音声認識辞書を必要とするコマンドを認識した場合(S21、S22でYES)、処理ユニット11は、図6Cに示すように、上記コマンドに対応する検索カテゴリに所属するタスクの辞書が既に生成完了している、もしくは辞書生成中であるか否かを判定する(S23)。そして、処理ユニット11は、上記コマンドに対応する検索カテゴリに属する辞書がまだなく、その辞書生成も開始していない場合(S23でNO)、図5の処理手順に従って(S24)、辞書生成スレッドを新規作成し(S11)、タスクをリストに追加し(S12)、辞書生成中のタスクのリストを更新する(S13)等の手順をふんで前記コマンドに対応したタスクに必要な音声認識辞書の生成に係る処理を行う。
Next, as shown in FIGS. 6A and 6B, a dictionary generation process in the case where there is a user's utterance will be described. When a command that requires a dynamically generated speech recognition dictionary is recognized from the user's utterance (YES in S21 and S22), the processing unit 11 sets a search category corresponding to the command as shown in FIG. 6C. It is determined whether the dictionary of the task to which it belongs has already been generated or is being generated (S23). Then, if there is no dictionary belonging to the search category corresponding to the command and the dictionary generation has not started (NO in S23), the processing unit 11 follows the processing procedure of FIG. 5 (S24) and sets a dictionary generation thread. Create a new speech recognition dictionary necessary for the task corresponding to the command by creating a new one (S11), adding the task to the list (S12), and updating the list of tasks being generated (S13). The process which concerns on is performed.

理ユニット11は辞書生成中タスクのリストを参照し(S26)、辞書生成中のタスクがあると判定すると(S25でYES)、このリストのN番目(初期値=1(S27))のタスクをAとし(S28)、このタスクAが認識コマンドの所属する検索カテゴリに含まれるか否かを判定する(S29)。そして、処理ユニット11は、前記タスクAが認識コマンドの所属する検索カテゴリに含まれると判定した場合(29でYES)、この検索カテゴリを優先処理中の検索カテゴリに設定し(S30,S31)、前記タスクAのスレッド優先度を標準値に設定する(S32)。なお、上記認識コマンドが所属する検索カテゴリに含まれるタスクが1つでもある場合、処理ユニット11はその検索カテゴリを優先処理中の検索カテゴリに設定する。一方、前記タスクAが認識コマンドの所属する検索カテゴリに含まれないと処理ユニット11が判定した場合(S29でNO)、前記タスクAのスレッド優先度を(標準値−1)に設定し、処理優先度を1段下げる(S33)。これらの処理は辞書生成中タスクの全てが完了するまで繰り返される(S34,S35)。これにより、利用者の発話から認識された認識コマンドに対応したタスクが優先処理中の検索カテゴリに属するものとして、そのタスクで必要な音声認識辞書が優先的に生成されるようになる。
Processing unit 11 refers to the list of dictionary generation during a task (S26), if it is determined that there is a task in the dictionary generating (S25 in YES), N-th of the list (initial value = 1 (S27)) The task A is defined as A (S28), and it is determined whether or not the task A is included in the search category to which the recognition command belongs (S29). Then, the processing unit 11, the case where the task A is determined to be included in the affiliation search category recognition command (YES in S 29), set this search category to search categories in priority processing (S30, S31) The thread priority of the task A is set to a standard value (S32). If there is at least one task included in the search category to which the recognition command belongs, the processing unit 11 sets that search category as the search category being preferentially processed. On the other hand, when the processing unit 11 determines that the task A is not included in the search category to which the recognition command belongs (NO in S29), the thread priority of the task A is set to (standard value -1), and the processing is performed. The priority is lowered by one level (S33). These processes are repeated until all the tasks during dictionary generation are completed (S34, S35). As a result, the task corresponding to the recognition command recognized from the user's utterance belongs to the search category being preferentially processed, and the speech recognition dictionary necessary for the task is generated preferentially.

具体的には、図8Bに示すように、携帯用プレイヤ26のコネクタ25への接続、記憶部13に記憶された楽曲データの編集操作、及び通信機21への携帯電話機22の無線接続がこの順に行われた場合、携帯プレイヤ26の楽曲データからの音声認識辞書の生成(図3)、記憶部13に記憶された楽曲データの音声認識辞書の生成、携帯電話機22の電話帳データからの音声認識辞書の生成(図2)、及び携帯電話機22の発着信履歴データからの音声認識辞書の生成が時分割で行われる。そして、各音声認識辞書の生成中に「 Recently calls 」と利用者が発話すると、検索カテゴリ『電話発信』以外の検索カテゴリに属する携帯プレイヤ26の楽曲データからの音声認識辞書の生成(図3)、及び記憶部13に記憶された楽曲データの音声認識辞書の生成の優先度が低下(標準値−1)することにより当該音声認識辞書の生成が一時中断され、携帯電話機22の電話帳データからの音声認識辞書の生成(図2)、及び携帯電話機22の発着信履歴データからの音声認識辞書の生成(優先度=標準値)が時分割で続行される。これにより携帯電話機22の電話帳データからの音声認識辞書の生成(図2)、及び携帯電話機22の発着信履歴データからの音声認識辞書の生成が相対的に優先されて速やかに完了するので、最近の発着信履歴のリストが表示部に表示される。この結果、利用者はそのリストの中から電話をかけたい相手を発話することにより、速やかに相手に電話発信される。このように音声による検索機能のうち利用者の発話に呼応する機能が有効になるまでの時間を短縮できる。
なお、各音声認識辞書の生成中に「Recently calls 」と利用者が発話した際に、図6Bに示すような優先度の設定に係る処理が行われない場合、具体的には、図8Aに示すように処理が行われる。携帯用プレイヤ26のコネクタ25への接続、記憶部13に記憶された楽曲データの編集操作、及び通信機21への携帯電話機22の無線接続がこの順に行われた場合、先ず携帯プレイヤ26の楽曲データから音声認識辞書が生成される(図3)。この辞書生成が完了すると、記憶部13に記憶された楽曲データの音声認識辞書が生成される。この辞書生成が完了すると、携帯電話機22の電話帳データから音声認識辞書が生成され(図2)、この辞書生成が完了すると、携帯電話機22の発着信履歴データから音声認識辞書が生成される。このように利用者の操作順に従って音声認識辞書の生成が順次行われる。

Specifically, as shown in FIG. 8B, the connection to the connector 25 of the portable player 26, the editing operation of the music data stored in the storage unit 13, and the wireless connection of the mobile phone 22 to the communication device 21 are performed. When performed in order, generation of a voice recognition dictionary from the music data of the portable player 26 (FIG. 3), generation of a voice recognition dictionary of the music data stored in the storage unit 13, and voice from the phone book data of the mobile phone 22 Generation of a recognition dictionary (FIG. 2) and generation of a voice recognition dictionary from outgoing / incoming history data of the mobile phone 22 are performed in a time-sharing manner. Then, the generated voice recognition dictionary from each and utterance by the user as "Recently calls" during the generation of speech recognition dictionary, the music data of the portable player 26 belonging to the search category of non-search category "Phone Call" (Figure 3) , And the generation priority of the voice recognition dictionary of the music data stored in the storage unit 13 is lowered (standard value −1), the generation of the voice recognition dictionary is temporarily interrupted. Generation of the voice recognition dictionary (FIG. 2) and generation of the voice recognition dictionary from the outgoing / incoming history data of the mobile phone 22 (priority = standard value) are continued in a time-sharing manner. As a result, the generation of the voice recognition dictionary from the phone book data of the mobile phone 22 (FIG. 2) and the generation of the voice recognition dictionary from the outgoing / incoming history data of the mobile phone 22 are relatively prioritized and completed quickly. A list of recent outgoing / incoming histories is displayed on the display unit. As a result, the user can quickly make a call to the other party by speaking the other party who wants to call from the list. As described above, it is possible to shorten the time until the function corresponding to the user's utterance becomes effective among the search functions by voice.
In addition, when the user utters “Recently calls” during the generation of each speech recognition dictionary, if the processing related to the priority setting as shown in FIG. 6B is not performed, specifically, FIG. Processing is performed as shown. When the connection of the portable player 26 to the connector 25, the editing operation of the music data stored in the storage unit 13, and the wireless connection of the mobile phone 22 to the communication device 21 are performed in this order, the music of the portable player 26 first. A speech recognition dictionary is generated from the data (FIG. 3). When this dictionary generation is completed, a voice recognition dictionary of music data stored in the storage unit 13 is generated. When this dictionary generation is completed, a voice recognition dictionary is generated from the telephone directory data of the mobile phone 22 (FIG. 2). When this dictionary generation is completed, a voice recognition dictionary is generated from the outgoing / incoming history data of the mobile phone 22. In this way, the voice recognition dictionary is sequentially generated according to the operation order of the user.

また、利用者の発話に呼応する機能の類似機能も有効になるまでの時間も短縮できる。即ち、利用者が携帯用プレイヤ26内の楽曲検索を試みたが所望の楽曲が存在しなかった場合、続けて記憶部やCD・DVDプレイヤ24内の楽曲を検索するケースが想定される。また、電話発信しようとした際、先ず発着信履歴を検索してリスト上位になければ電話帳内を検索するケースも想定される。このような場合でも音声による検索機能有効化までの時間が短縮できる。   In addition, it is possible to shorten the time until the function similar to the function responding to the user's utterance becomes effective. In other words, when the user tries to search for music in the portable player 26 but the desired music does not exist, it is assumed that the user searches for music in the storage unit or the CD / DVD player 24 continuously. In addition, when attempting to make a call, first, a case may be assumed where a call history is searched first, and if it is not higher in the list, a search is made in the telephone directory. Even in such a case, the time until the voice search function is activated can be shortened.

更に、辞書生成完了時の動作を図7に基づいて説明する。先ず処理ユニット11は辞書生成完了したタスクを辞書生成中タスクのリストから削除する(S41)。次いで処理ユニット11は、生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクかどうかを判定する(S43)。そして、処理ユニット11は生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクである場合(S43でYES)、辞書生成中タスクのリスト内に優先処理中の検索カテゴリに所属するタスクが残っていないかを判定する(S45)。辞書生成中の全タスクが優先処理中の検索カテゴリ以外のものである場合(S45でNO)、処理ユニット11はそれぞれのスレッドの処理優先度を標準値に設定し(S46)、優先処理中の検索カテゴリをクリアする(S47)。   Further, the operation when the dictionary generation is completed will be described with reference to FIG. First, the processing unit 11 deletes the task for which dictionary generation has been completed from the list of tasks for which dictionary generation is in progress (S41). Next, the processing unit 11 determines whether or not the generated task is a task belonging to the search category being preferentially processed (S43). If the task whose generation has been completed is a task belonging to the search category being preferentially processed (YES in S43), the task belonging to the search category being preferentially processed is listed in the list of tasks being generated in the dictionary. It is determined whether it remains (S45). When all the tasks in the dictionary generation are other than the search category being preferentially processed (NO in S45), the processing unit 11 sets the processing priority of each thread to the standard value (S46), and the preferential processing is in progress. The search category is cleared (S47).

以上、説明したように、本発明に係る動的音声認識辞書の生成方法は、音声による検索機能のうち、利用者の発話に呼応する機能が有効になるまでの時間を短縮できるとともに、利用者の発話に呼応する機能の類似機能が有効になるまでの時間も短縮できるという効果を有し、音声認識用の動的辞書を生成するのに有用である。   As described above, the dynamic speech recognition dictionary generation method according to the present invention can shorten the time until the function that responds to the user's utterance out of the search function by voice becomes effective, and the user This has the effect of shortening the time until the function similar to the function that responds to the utterance becomes effective, and is useful for generating a dynamic dictionary for speech recognition.

100 動的音声認識辞書の作成装置
11 処理ユニット
12 ナビゲーション装置
13 記憶部
14 表示部
15 出力回路
16 スピーカ
17 音声入力回路
18 スイッチ
19 マイク
20 音声認識エンジン
21 通信機
22 携帯電話機
23 CD・DVDプレイヤ
24 CD・DVD
25 コネクタ
26 携帯用プレイヤ
DESCRIPTION OF SYMBOLS 100 Dynamic speech recognition dictionary creation device 11 Processing unit 12 Navigation device 13 Storage unit 14 Display unit 15 Output circuit 16 Speaker 17 Speech input circuit 18 Switch 19 Microphone 20 Speech recognition engine 21 Communication device 22 Mobile phone 23 CD / DVD player 24 CD / DVD
25 Connector 26 Portable player

Claims (5)

利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するステップと、
前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するステップとを有し、
前記リストにセットされたタスクで必要な音声認識辞書を生成する動的音声認識辞書の生成方法であって、
音声認識辞書生成が必要なタスクに対応するコマンドを目的毎に分類する検索カテゴリであって、優先処理中のものがあるか否かを判定するステップと、
優先処理中の前記検索カテゴリがあると判定されたときに、該検索カテゴリに所属するタスクで必要な音声認識辞書を、優先処理中でない検索カテゴリに所属するタスクで必要な音声認識辞書より優先して生成するステップと、
前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき該コマンドに対応するタスクが属する検索カテゴリを優先処理中の検索カテゴリに設定するステップとを有する動的音声認識辞書の生成方法。
Creating a new dictionary generation thread when receiving a voice recognition dictionary generation request from a user;
Adding the task of the dictionary generation thread to a list of tasks during dictionary generation ,
A method for generating a dynamic speech recognition dictionary for generating a speech recognition dictionary necessary for tasks set in the list,
A search categories for classifying the command corresponding to the speech recognition dictionary generation necessary tasks for each object, determining whether there is in the priority processing,
When it is determined that there is the search category being preferentially processed, the speech recognition dictionary necessary for the task belonging to the search category is prioritized over the speech recognition dictionary necessary for the task belonging to the search category not preferentially processing. Generating steps,
When it recognizes a command that requires a dynamic generation of speech recognition dictionary when there is speech of the user, and a step of setting a search category task corresponding to the command belongs to the search category in priority processing A method for generating a dynamic speech recognition dictionary.
前記音声認識辞書生成が完了したときに、前記音声認識辞書生成の完了したタスクを辞書生成中タスクのリストから削除するステップと、
前記音声認識辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであって、前記辞書生成中タスクのリスト内に優先処理中の前記検索カテゴリに所属するタスクが残っていない場合、前記検索カテゴリが優先処理中のものであることを解除するステップとを含む請求項1記載の動的音声認識辞書の生成方法。
Deleting the task of generating the speech recognition dictionary from the list of tasks during dictionary generation when the speech recognition dictionary generation is completed;
If the task has been completed of the voice recognition dictionary generation What task der belonging to the search category in the priority processing, there is no remaining task that belongs to the search category in the priority processing in the dictionary generation in the list of tasks The method for generating a dynamic speech recognition dictionary according to claim 1, further comprising the step of canceling that the search category is in a priority process .
利用者からの音声認識辞書の生成要求を受付けたときに新規に辞書生成スレッドを作成するスレッド作成手段と、
前記辞書生成スレッドのタスクを辞書生成中タスクのリストに追加するリスト追加手段とを有し
前記リストにセットされたタスクで必要な音声認識辞書を生成する動的音声認識辞書の生成装置であって、
音声認識辞書生成が必要なタスクに対応するコマンドを目的毎に分類する検索カテゴリであって、優先処理中のものがあるか否かを判定する優先処理検索カテゴリ有無判定手段と、
優先処理中の前記検索カテゴリがあると判定されたときに、該検索カテゴリに所属するタスクで必要な音声認識辞書を、優先処理中でない検索カテゴリに所属するタスクで必要な音声認識辞書より優先して生成する手段(S19)と、
前記利用者の発話があって動的生成の音声認識辞書を必要とするコマンドを認識したとき該コマンドに対応するタスクが属する検索カテゴリを優先処理中の検索カテゴリに設定する手段とを有する動的音声認識辞書の生成装置。
Thread creation means for creating a new dictionary generation thread when a voice recognition dictionary generation request is received from a user;
And a list addition means for adding the task of the dictionary generation thread to the list of dictionary generation in task,
A dynamic speech recognition dictionary generation device that generates a speech recognition dictionary necessary for tasks set in the list,
A search categories for classifying the command corresponding to the speech recognition dictionary generation necessary tasks for each object, and determining priority processing search categories presence determining means for determining whether or not there is in the priority processing,
When it is determined that there is the search category being preferentially processed, the speech recognition dictionary necessary for the task belonging to the search category is prioritized over the speech recognition dictionary necessary for the task belonging to the search category not preferentially processing. Generating means (S19),
When it recognizes a command that requires a dynamic generation of speech recognition dictionary when there is speech of the user, and means for setting a search category task corresponding to the command belongs to the search category in priority processing Dynamic speech recognition dictionary generation device.
前記音声認識辞書生成が完了したときに、前記音声認識辞書生成の完了したタスクを辞書生成中タスクのリストから削除する辞書生成タスク削除と、
前記音声認識辞書生成の完了したタスクが優先処理中の検索カテゴリに所属するタスクであって、前記辞書生成中タスクのリスト内に優先処理中の前記検索カテゴリに所属するタスクが残っていない場合、前記検索カテゴリが優先処理中のものであることを解除する手段とを有する請求項記載の動的音声認識辞書の生成装置。
When the voice recognition dictionary generated is completed, and deletes dictionary generation task to delete completed tasks of said voice recognition dictionary generated from a list of dictionary generation in task,
If the task has been completed of the voice recognition dictionary generation What task der belonging to the search category in the priority processing, there is no remaining task that belongs to the search category in the priority processing in the dictionary generation in the list of tasks The dynamic speech recognition dictionary generating apparatus according to claim 3 , further comprising: means for canceling that the search category is being preferentially processed .
複数の音声認識辞書を作成する音声認識辞書生成手段(S19)と、Voice recognition dictionary generation means (S19) for creating a plurality of voice recognition dictionaries;
利用者の発話があって音声認識辞書を必要とするタスクについてのコマンドが認識されたときに、前記音声認識辞書生成手段による前記複数の音声認識辞書の生成において前記コマンドに対応するタスクで必要とする前記音声認識辞書を他の音声認識辞書より優先させる優先制御手段とを有する動的音声認識辞書の生成装置。Necessary for a task corresponding to the command in generating the plurality of speech recognition dictionaries by the speech recognition dictionary generating means when a command is recognized for a task that requires a speech recognition dictionary when a user utters An apparatus for generating a dynamic speech recognition dictionary, comprising: priority control means for prioritizing the speech recognition dictionary over other speech recognition dictionaries.
JP2010198780A 2010-09-06 2010-09-06 Method and apparatus for generating dynamic speech recognition dictionary Active JP5500647B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010198780A JP5500647B2 (en) 2010-09-06 2010-09-06 Method and apparatus for generating dynamic speech recognition dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010198780A JP5500647B2 (en) 2010-09-06 2010-09-06 Method and apparatus for generating dynamic speech recognition dictionary

Publications (2)

Publication Number Publication Date
JP2012058311A JP2012058311A (en) 2012-03-22
JP5500647B2 true JP5500647B2 (en) 2014-05-21

Family

ID=46055521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010198780A Active JP5500647B2 (en) 2010-09-06 2010-09-06 Method and apparatus for generating dynamic speech recognition dictionary

Country Status (1)

Country Link
JP (1) JP5500647B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016088241A1 (en) * 2014-12-05 2016-06-09 三菱電機株式会社 Speech processing system and speech processing method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249686A (en) * 2000-03-08 2001-09-14 Matsushita Electric Ind Co Ltd Method and device for recognizing speech and navigation device
JP2003202895A (en) * 2002-01-10 2003-07-18 Sony Corp Interaction device and interaction control method, storage medium, and computer program
JP2010072081A (en) * 2008-09-16 2010-04-02 Denso Corp Voice recognition dictionary creating device
JP5361781B2 (en) * 2010-03-31 2013-12-04 アルパイン株式会社 On-vehicle electronic device and voice data dictionary generation method for music data

Also Published As

Publication number Publication date
JP2012058311A (en) 2012-03-22

Similar Documents

Publication Publication Date Title
US7870142B2 (en) Text to grammar enhancements for media files
US9092435B2 (en) System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
CN111095400A (en) Selection system and method
US9805722B2 (en) Interactive speech recognition system
US7787907B2 (en) System and method for using speech recognition with a vehicle control system
JP5697860B2 (en) Information search device, information search method, and navigation system
US20100057470A1 (en) System and method for voice-enabled media content selection on mobile devices
KR100339587B1 (en) Song title selecting method for mp3 player compatible mobile phone by voice recognition
JP5274711B2 (en) Voice recognition device
CN101145341A (en) Method, system and apparatus for improved voice recognition
JP2013140269A (en) Voice recognition device
WO2006126649A1 (en) Audio edition device, audio edition method, and audio edition program
JP2013088477A (en) Speech recognition system
JP5263875B2 (en) Computer system, speech recognition method and computer program for speech recognition
JP5500647B2 (en) Method and apparatus for generating dynamic speech recognition dictionary
JP2019001428A (en) On-vehicle device, voice operation system, and voice operation method
JP2003162293A (en) Device and method for voice recognition
WO2013157174A1 (en) Speech recognition device
JP2013068665A (en) Speech recognition device
JP4859642B2 (en) Voice information management device
JP2003202890A (en) Speech recognition device, and method and program thereof
JP4466171B2 (en) Information retrieval device
JP2002041277A (en) Information processing unit and recording medium in which web browser controlling program is recorded
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system
JP2004295017A (en) Multimodal system and speech input method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140306

R150 Certificate of patent or registration of utility model

Ref document number: 5500647

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150