JP5037041B2 - On-vehicle voice recognition device and voice command registration method - Google Patents
On-vehicle voice recognition device and voice command registration method Download PDFInfo
- Publication number
- JP5037041B2 JP5037041B2 JP2006173813A JP2006173813A JP5037041B2 JP 5037041 B2 JP5037041 B2 JP 5037041B2 JP 2006173813 A JP2006173813 A JP 2006173813A JP 2006173813 A JP2006173813 A JP 2006173813A JP 5037041 B2 JP5037041 B2 JP 5037041B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voice
- dictionary
- command
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、車載用音声認識装置及び音声コマンド登録方法に関し、特に、車室内でユーザがコマンドとして発した単語や語句などの音声(以下、「ボイスタグ(Voice Tag) 」ともいう。)を基に的確な音声認識を行うよう適応された技術に関する。 The present invention relates to an in-vehicle voice recognition device and a voice command registration method, and in particular, based on voices such as words and phrases (hereinafter also referred to as “Voice Tags”) issued as commands by a user in a vehicle interior. The present invention relates to a technology adapted to perform accurate speech recognition.
最近の車両には、車室内のユーザに対して様々なサービスを提供するための機器や装置などが搭載されている。その代表的な車載機器として、設定した目的地に向けて道路を間違うことなく走行できるように案内する機能(経路誘導機能)を搭載したナビゲーション装置や、各種ソース(ラジオ受信機、CDプレーヤ、TV受信機、DVDプレーヤ等)から出力される音声(オーディオ)情報や映像(ビデオ)情報などの各種エンターテイメントを提供するオーディオ/ビデオ(A/V)機器などがある。これらの車載機器(装置)は、ユーザがリモコンや操作パネル等を操作して所要の指示を与えることにより、その操作指示に応じてその動作状態が変更される。変更された機器の動作状態は、車室内に設置されたスピーカ(リア席のユーザについてはワイヤレスヘッドホン等)を介して聴くことができ、また車載モニタ等の表示装置の画面を通して見ることができる。 Recent vehicles are equipped with devices and devices for providing various services to users in the passenger compartment. Typical in-vehicle devices include a navigation device equipped with a function (route guidance function) for guiding the user to travel to a set destination without making a mistake, and various sources (radio receiver, CD player, TV) There are audio / video (A / V) devices that provide various entertainment such as audio (audio) information and video (video) information output from a receiver, a DVD player, and the like. These in-vehicle devices (apparatuses) are operated according to the operation instructions when the user gives a necessary instruction by operating the remote controller or the operation panel. The changed operating state of the device can be heard via a speaker (such as wireless headphones for a user at the rear seat) installed in the passenger compartment, or can be viewed through a screen of a display device such as an in-vehicle monitor.
このように各車載機器に対してはリモコン操作等のマニュアル操作に基づいて所要の操作指示を入力することができるが、最近では、操作指示を音声入力(発話)するだけで当該機器の制御を行える機能(音声認識機能)を搭載した装置も出現している。かかる音声認識機能は、ユーザの操作上の便宜を図る点で有利であり、特に、運転者にとっては安全走行の点で非常に有用である。 As described above, a required operation instruction can be input to each in-vehicle device based on a manual operation such as a remote control operation. However, recently, the control of the device can be performed only by voice input (speech) of the operation instruction. Devices equipped with a function that can be performed (voice recognition function) have also appeared. Such a voice recognition function is advantageous in terms of convenience for the user's operation, and is particularly useful for the driver in terms of safe driving.
音声認識機能を実現するには音声コマンドの認識用辞書を必要とし、この認識用辞書には、音声認識の対象とされる単語や語句などの音声、すなわち、音声認識に基づいて制御されるべき車載機器の操作指示に関連したボイスタグ又はこれを含む音声コマンドが登録されている。ボイスタグは、例えば、ナビゲーション装置において住所録(Address Book)を呼び出す際に使用される。その一例を図9に示す。 To realize the voice recognition function, a voice command recognition dictionary is required. This recognition dictionary should be controlled based on the voice of words or phrases that are the target of voice recognition, that is, voice recognition. A voice tag related to an operation instruction of the in-vehicle device or a voice command including the voice tag is registered. The voice tag is used, for example, when calling an address book in a navigation device. An example is shown in FIG.
ボイスタグを登録する際には(図9(a)参照)、先ず、ナビゲーション機能が有効な状態で、リモコン操作や画面上でのタッチ操作等により"Address Book"画面61を表示させ、次に画面61上の"Add Voice Tag" 部分62にタッチすると、ボイスタグを記録する旨の案内情報(子画面)63が表示される。ユーザがこの画面63上の"Start" 部分64にタッチし、例えば2秒以内に、所望のボイスタグ(何と言って呼び出すかの音声)を発声すると、そのボイスタグを記録中である旨の案内情報(子画面)65が表示される。そして、この画面65上の"Finished"部分66が点灯すると、そのボイスタグの認識辞書への登録が完了する。例えば、その登録されたボイスタグが [マクドナルド] であったとする。
When registering a voice tag (see FIG. 9A), first, with the navigation function enabled, the “Address Book”
このようにして登録されたボイスタグ(= [マクドナルド] )を音声認識処理に使用する際には(図9(b)参照)、先ず、画面上でのタッチ操作等により自車位置周辺の地図画面67を表示させ、この状態で、ユーザが"Go to [マクドナルド]"と発声すると、この音声コマンド(PCMデータ)を基に音声認識処理を実行し、目的地までの誘導経路等の情報を画面67に表示する。図中、CMは自車位置マーク、GRは誘導経路、DS1は目的地までの距離及び時間とその方位を指示する情報、DS2は誘導経路上で次の案内ポイントまでの距離を指示する情報を示している。 When the voice tag (= [McDonald]) registered in this way is used for voice recognition processing (see FIG. 9B), first, a map screen around the vehicle position by a touch operation or the like on the screen. In this state, when the user utters “Go to [McDonald]”, voice recognition processing is executed based on this voice command (PCM data), and information such as a guidance route to the destination is displayed on the screen. 67. In the figure, CM is the vehicle position mark, GR is the guidance route, DS1 is information indicating the distance and time to the destination and its direction, and DS2 is information indicating the distance to the next guidance point on the guidance route. Show.
また、図9(a)においてボイスタグを登録する際、ユーザが発声したボイスタグが音声認識に使えないデータであった場合には、図9(c)に示すようにユーザに再登録を促す旨の案内情報(警告画面)68が表示される。ユーザは、必要であればこの画面68上の"Start" 部分にタッチして再度ボイスタグを発声し、必要でなければ"Cancel"部分にタッチして再登録を中止する。なお、ここでいう「音声認識に使えないデータ」とは、基本的には、周囲が非常に騒々しい環境下でユーザが発声を行ったために(一応登録はできたが)音声認識エンジンで使用する音声データとしては有効なレベルに達していなかった場合のデータを指している。ただし、図9(c)に例示した警告画面68は、このような場合に限らず、発声そのものを検出できなかった場合(同図(a)の例を参照すると、ユーザが画面63上の"Start" 部分64にタッチしてから何も発声しないで2秒経過してしまった場合)にも表示される。
In addition, when registering a voice tag in FIG. 9A, if the voice tag spoken by the user is data that cannot be used for speech recognition, the user is prompted to re-register as shown in FIG. 9C. Guidance information (warning screen) 68 is displayed. If necessary, the user touches the “Start” portion on the
上記の従来技術に関連する技術としては、例えば、特許文献1に記載されるように、音声認識装置において、入力した音声データの音声パターンとあらかじめ生成された標準音声パターンとのマッチングを行うマッチング部を予備選択部とマッチング処理部の2段構成とし、予備選択部では、入力した音声データと辞書生成部において音声データから全帯域フィルタによって分析され辞書に登録された全帯域辞書データとをマッチングして候補単語を絞り込むようにし、マッチング処理部では、絞り込まれた候補単語と辞書生成部において音声データから帯域別フィルタによって分析され辞書に登録された帯域別辞書データとのマッチング処理により候補単語の内から類似度が所定のしきい値より大きい候補単語を認識単語として出力するようにしたものがある。
上述したように従来の技術では、ユーザが発したボイスタグを認識辞書に登録してナビゲーション装置等の制御に利用できるようにした機能が実現されているが、従来の方法では認識辞書に登録されている全てのボイスタグに対して音声認識を行っているため、以下に説明するような不都合があった。 As described above, in the conventional technique, a function has been realized in which a voice tag issued by a user is registered in a recognition dictionary and can be used for control of a navigation device or the like. However, in the conventional method, the function is registered in the recognition dictionary. Since voice recognition is performed on all the voice tags, there are inconveniences as described below.
すなわち、音声認識エンジンでは、ユーザが発したボイスタグ(コマンド)と認識辞書に登録されている全てのコマンドとのそれぞれの合致度(「スコア」ともいう。)を算出し、その算出結果から最も合致度の大きいコマンドをユーザが発声したコマンドとして決定する(音声認識)。このとき、その最も合致度の大きいコマンドが1つに特定できれば問題はないが、登録されているコマンドの数が多くなってくると発声上「読み」の類似したコマンドも多くなるため、認識エンジンでは必ずしも1つに特定することができず、結果として、マッチングしないコマンドを誤認識してしまう場合が起こり得る。つまり、従来の技術では、ボイスタグを登録する際、過去に登録したボイスタグと同一もしくは類似している音声を登録した場合、ボイスタグ呼出し用の認識辞書には同一もしくは類似している音声データが複数登録されることになり、そのため、ナビゲーション装置等の制御に利用する際に音声認識処理を行ったときに誤認識する割合が高くなる(つまり、音声コマンドに対する認識率が低下する)といった課題があった。 That is, the speech recognition engine calculates the degree of matching (also called “score”) between the voice tag (command) issued by the user and all the commands registered in the recognition dictionary, and the best match is obtained from the calculation result. A command having a high degree is determined as a command uttered by the user (voice recognition). At this time, there is no problem as long as the command with the highest degree of matching can be specified, but as the number of registered commands increases, the number of commands that are similar to “read” on the utterance increases. However, it is not always possible to specify one, and as a result, a command that does not match may be erroneously recognized. That is, in the conventional technology, when registering a voice tag, if the same or similar voice as a previously registered voice tag is registered, a plurality of identical or similar voice data is registered in the voice tag calling recognition dictionary. Therefore, there is a problem that the rate of erroneous recognition increases when voice recognition processing is performed when used for control of a navigation device or the like (that is, the recognition rate for voice commands decreases). .
本発明は、かかる従来技術における課題に鑑み創作されたもので、音声コマンドを認識辞書に登録してナビゲーション装置等の車載機器の制御に利用するにあたり、登録した音声コマンドに対する認識率を向上させることができる車載用音声認識装置及び音声コマンド登録方法を提供することを目的とする。 The present invention was created in view of the problems in the prior art, and improves the recognition rate for a registered voice command when the voice command is registered in a recognition dictionary and used to control an in-vehicle device such as a navigation device. It is an object of the present invention to provide a vehicle-mounted speech recognition device and a speech command registration method.
上記の従来技術の課題を解決するため、本発明の一形態によれば、車室内でユーザが発話するコマンドを入力する音声入力手段と、前記音声入力手段を介して入力されたコマンドとの比較照合を行うのに使用され、制御対象機器の動作状態に応じて選択可能なコマンドを登録した複数の認識辞書と、入力されたコマンドを前記認識辞書に登録すべきかどうかを判断するための判別用辞書であって前記複数の認識辞書に登録されているコマンドと同じコマンドが登録されるよう適応されたものとを格納した記憶手段と、前記制御対象機器の動作状態に応じて有効な前記認識辞書を切り替える辞書切替選択手段と、前記音声入力手段を介して入力されたコマンドと前記記憶手段に格納されているいずれかの辞書に登録されているコマンドとの比較照合に基づいた音声認識を行う音声認識手段とを備え、前記音声認識手段は、前記音声入力手段を介してコマンドが入力されたときに、前記判別用辞書のみを使用して当該入力されたコマンドに対する音声認識を行い、該音声認識に基づいて算出した認識スコアが所定のしきい値より低い場合に、当該コマンドを前記制御対象機器の動作状態に応じて選択された前記認識辞書及び前記判別用辞書に登録することを特徴とする車載用音声認識装置が提供される。 In order to solve the above-described problems of the prior art, according to one aspect of the present invention, a comparison is made between voice input means for inputting a command spoken by a user in a vehicle cabin and commands input via the voice input means. A plurality of recognition dictionaries in which commands that can be selected according to the operation state of the control target device are registered, and for determining whether the input commands should be registered in the recognition dictionary. Storage means storing a dictionary adapted to register the same command as that registered in the plurality of recognition dictionaries, and the recognition dictionary effective according to the operating state of the control target device a dictionary switching selection means for switching a comparison of commands said registered in any of the dictionaries stored in the storage means and the input command through the voice input means Voice recognition means for performing voice recognition based on the command, and the voice recognition means uses the discrimination dictionary only when the command is inputted via the voice input means. When the recognition score calculated based on the voice recognition is lower than a predetermined threshold, the recognition dictionary selected according to the operation state of the control target device and the determination An in-vehicle voice recognition device characterized by being registered in a dictionary is provided.
本発明に係る車載用音声認識装置によれば、ユーザが発したコマンド(ボイスタグを含む)を登録するにあたり、判別用辞書のみを使用して当該コマンドに対する音声認識を行い、その結果に基づき認識スコアが当該しきい値より低い場合に、当該コマンドはこれまで登録したいずれのコマンドとも類似していないデータであると判断して、当該コマンドを認識辞書と判別用辞書に登録するようにしている。 According to the in-vehicle speech recognition device of the present invention, when registering a command (including a voice tag) issued by a user, speech recognition is performed on the command using only the discrimination dictionary, and a recognition score is based on the result. Is lower than the threshold value, the command is determined to be data that is not similar to any of the commands registered so far, and the command is registered in the recognition dictionary and the discrimination dictionary.
つまり、登録しようとしているコマンド(ボイスタグを含む)が判別用辞書に既に登録されているものと同一もしくは類似しているか、あるいは類似していない(非類似)かを判断し、非類似の場合にのみ当該コマンドを登録するようにしている。言い換えると、既に登録されているコマンドと同一もしくは類似しているコマンドについては、登録しないようにしている。 In other words, it is determined whether the command to be registered (including the voice tag) is the same as or similar to that already registered in the discrimination dictionary, or is not similar (dissimilar). Only the command is registered. In other words, a command that is the same as or similar to a command that has already been registered is not registered.
これによって、従来技術に見られたような不都合(過去に登録したコマンド(ボイスタグを含む)と同一もしくは類似している音声データが登録されることによってひき起こされる認識の際の紛らわしさ)を解消することができ、登録した音声コマンドに対する認識率を高めることが可能となる。 This eliminates the inconvenience seen in the prior art (confusingness in recognition caused by registration of voice data that is the same as or similar to previously registered commands (including voice tags)). It is possible to increase the recognition rate for the registered voice command.
本発明の他の形態によれば、車室内でユーザが発話するコマンドを入力する音声入力手段と、前記音声入力手段を介して入力されたコマンドとの比較照合を行うのに使用され、制御対象機器の動作状態に応じて選択可能なコマンドを登録した複数の認識辞書と、入力されたコマンドを前記認識辞書に登録すべきかどうかを判断するための判別用辞書であって前記複数の認識辞書に登録されているコマンドと同じコマンドが登録されるよう適応されたものとを格納した記憶手段と、前記制御対象機器の動作状態に応じて有効な前記認識辞書を切り替える辞書切替選択手段と、前記音声入力手段を介して入力されたコマンドと前記記憶手段に格納されているいずれかの辞書に登録されているコマンドとの比較照合に基づいた音声認識を行う音声認識手段とを備えた車載用音声認識装置において、前記音声入力手段を介してコマンドが入力されたときに、前記判別用辞書のみを有効にして当該入力されたコマンドに対する音声認識を実行し、該音声認識に基づいて算出した認識スコアが所定のしきい値より低い場合に、当該コマンドを前記制御対象機器の動作状態に応じて選択された前記認識辞書及び前記判別用辞書に登録することを特徴とする音声コマンド登録方法が提供される。 According to another aspect of the present invention, the voice input means for inputting a command spoken by the user in the vehicle interior and the command input via the voice input means are used for comparison and collation, A plurality of recognition dictionaries in which commands that can be selected according to the operating state of the device are registered, and a determination dictionary for determining whether or not the input commands should be registered in the recognition dictionary. A storage unit storing a command adapted to register the same command as the registered command, a dictionary switching selection unit that switches the recognition dictionary that is valid according to an operation state of the control target device, and the voice A voice recognition that performs voice recognition based on comparison and collation between a command input via the input means and a command registered in any of the dictionaries stored in the storage means. In-vehicle speech recognition and means, when the command through the voice input means is input, executes the voice recognition for the determination dictionary only enable and the input command, the voice When the recognition score calculated based on recognition is lower than a predetermined threshold value, the command is registered in the recognition dictionary and the discrimination dictionary selected according to the operation state of the control target device, A voice command registration method is provided.
本発明に係る車載用音声認識装置の他の構成上の特徴及びそれに基づく具体的な処理態様等については、後述する発明の実施の形態を参照しながら詳細に説明する。 Other structural features of the vehicle-mounted speech recognition apparatus according to the present invention and specific processing modes based thereon will be described in detail with reference to embodiments of the invention described later.
以下、本発明の実施の形態について、添付の図面を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings.
図1は、本発明の一実施形態に係る車載用音声認識装置を組み込んだ車載オーディオ/ビデオ(A/V)・ナビゲーションシステムの構成を示したものである。 FIG. 1 shows a configuration of an in-vehicle audio / video (A / V) navigation system incorporating an in-vehicle voice recognition device according to an embodiment of the present invention.
図示のように車載A/V・ナビゲーションシステム40は、本実施形態に係る車載用音声認識装置10と、その音声認識結果に基づいて発話内容(ボイスタグを含むコマンド)に対応した制御が行われる対象機器(図示の例では、ラジオ受信機1、DVD/CDプレーヤ2、TV受信機4及びナビゲーションユニット5)と、フロント席のユーザが各制御対象機器に対して各種設定操作を行うためのフロント席用操作ユニット(ヘッドユニット(H/U))20と、リア席のユーザが各制御対象機器(ナビゲーションユニット5を除く)に対して各種設定操作を行うためのリア席用操作ユニット30と、フロント席用表示ユニット25と、アンプユニット26と、スピーカ27と、リア席用表示ユニット31と、ワイヤレスヘッドホン32とを備えている。車載用音声認識装置10、各制御対象機器1〜5、フロント席用操作ユニット20、各表示ユニット25,31及びアンプユニット26は、伝送路として供される光ファイバ等のバス6を介して相互に接続されている。図示の例では、スピーカ27は1個のみ示されているが、実際には車室内の所定の場所に所要の個数、例えば、リア席が1列の場合であれば少なくともリア席の左右の近傍とフロント席の左右の近傍にそれぞれ2個ずつ、計4個のスピーカ27が設置されている。リア席用の操作ユニット30、表示ユニット31及びワイヤレスヘッドホン32についても同様に、それぞれ1台(1個)のみ示されているが、実際にはリア席の搭乗者数に応じて所要の台数(個数)分設けられている。
As shown in the figure, the in-vehicle A / V /
本実施形態に係る車載用音声認識装置10は、記録媒体としてのハードディスクドライブ(HDD)7と、マイクロホン8と、音声認識ユニット9とを備えている。マイクロホン8は、車室内の運転席前方のサンバイザー又はルームミラーの近傍に適宜設置され、ユーザが発声するコマンド(ボイスタグを含む)を検出してその音圧レベルに応じたアナログ音声信号に変換するものである。HDD7によって駆動されるディスク(図示せず)には、ナビゲーション機能を実行する際に使用する地図データと共に、音声認識機能を実行する際に使用するデータがそれぞれ割り当てられた記憶領域に格納されている。地図データは、各縮尺レベル(1/12500、1/25000、1/50000等)に応じて適当な大きさの経度幅及び緯度幅に区切られており、経路探索やマップマッチング等の各種処理に必要な道路ユニットのデータ及び交差点の詳細を表す交差点ユニットのデータ、各種施設(コンビニエンスストア、ガソリンスタンド、スーパー・ディスカウントショップ等)に関するデータ(位置、住所、電話番号、ジャンル等の各種情報)等を含んでいる。HDD7(その一部の記憶領域)に格納される音声認識用のデータの内容については、音声認識ユニット9の内部構成と併せて後で説明する。
The in-vehicle
フロント席用操作ユニット(H/U)20は、運転者と助手席の乗員が共用できるように両座席の中間のセンターコンソール上に「操作パネル」の形態で設置されており、その対応する表示ユニット25は、その操作パネル(H/U)の上方に配置されており、例えば、LCDモニタからなる。この表示ユニット25の画面には、ナビゲーションユニット5から出力された各種の映像情報(音声認識に基づいた自車位置周辺の地図、目的地までの誘導経路など)、DVD/CDプレーヤ2やTV受信機4などの映像ソースから出力された映像情報などが表示される。一方、リア席用操作ユニット30は、リア席のユーザが操作し易いように「リモコン」の形態で設けられており、これに対応するリア席用表示ユニット31と赤外線通信により接続されている。このリア席用表示ユニット31は、例えば、前の座席のヘッドレストの後部に設置されており、フロント側の表示ユニット25と同様に映像情報をディスプレイ画面に表示するLCDモニタ等を有している。この表示ユニット31は、その対応するワイヤレスヘッドホン32と赤外線通信及びRF通信により接続されている。なお、ワイヤレスヘッドホン32に代えて、ジャック付きのヘッドホンを使用してもよい。この場合には、ヘッドホンは対応する表示ユニット31とジャックを介して有線接続されることになる。
The front seat operation unit (H / U) 20 is installed in the form of an “operation panel” on the center console between the two seats so that the driver and the passenger in the front passenger seat can share the display. The
各制御対象機器1〜5は、基本的な動作として、フロント席用操作ユニット20、リア席用操作ユニット30又は音声認識ユニット10からバス6に送出された操作指示に係るデータ(後述する「機器制御信号」)を受信し、その操作指示に係るデータに基づいて自己の動作状態を設定もしくは変更し、その結果(現在の動作状態)を指示するデータを音声/映像信号としてバス6に送出する。例えば、ラジオ受信機1の場合、各操作ユニット20,30あるいは音声認識ユニット10から与えられる操作指示に応答して、FM放送やAM放送の信号を受信して復調することにより音声信号を生成し、これをデジタルの音声データに変換して、バス6に送出する。また、DVD/CDプレーヤ2の場合、同様に与えられる操作指示に応答して、ユーザにより選択されたDVDの記録面に記録された信号を読み取り、再生された映像データをバス6に送出する。また、ナビゲーションユニット5の場合、同様に与えられる操作指示に応答して、ユーザにより設定された目的地までの誘導経路を探索し、その探索した経路のデータをバス6に送出する。
Each of the
フロント席用操作ユニット20は、制御部21と、操作部22と、表示部23と、メモリ部24とを備えている。このうち、操作部22は、各制御対象機器1〜5に対して各種設定操作を行うための操作キー、例えば、電源のオン/オフ及び音量調整を行うための電源キー、各機器を選択するための選択キー、所定の動作や機能を行わせるためのシフトキーやプリセットキー等を備えている。表示部23は、操作パネル(H/U)上にLCD等の形態で配置されており、制御部21から出力されるデータに基づいて、各種情報、例えば、ラジオ受信機1に関してはFM/AMの種別やその放送局の受信周波数など、DVD/CDプレーヤ2に関してはCD演奏時のディスク番号や再生位置(トラック数、経過時間等)などを表示する。メモリ部24は、フラッシュメモリ等の不揮発性メモリからなり、制御部21からの制御に基づいて必要な情報(データ)を格納しておくためのものである。例えば、各操作ユニット20,30あるいは音声認識ユニット10から与えられる操作指示に基づいて選択機器からの音声/映像信号の出力動作が停止された時点での当該機器の動作状態を示すデータが格納される。このデータは、次の出力動作開始時に必要に応じて参照するために格納されるものであり、例えば、いずれの機器(ソース)を使用していたかを指示する「ソース種別」、オーディオソースであればその音声を聴取していた際の音量や音質の調整値を指示する「音量・音質」、各機器別の詳細な動作状態を指示する「機器別詳細情報」などを含む。
The front
制御部21はマイクロコンピュータ(マイコン)等により構成され、本システム40全体の制御を行うものである。基本的には、各操作ユニット20,30あるいは音声認識ユニット10から与えられた操作指示に基づき、選択機器からバス6を介して送られてくる音声/映像データを取得して音声/映像情報の再生を行う動作、操作状況や動作状態等を指示する情報を表示部23に表示させる動作などの制御を行う。この場合、取得された音声データは、制御部21によりバス6を介してアンプユニット26に送られ、適宜D/A変換され、また音量や音質等の制御が行われ、増幅された後、スピーカ27を通して音声出力される。また、取得された映像データは、制御部21によりバス6を介して表示ユニット25に送られ、そのディスプレイ画面に映像情報として表示される。
The
一方、リア席用操作ユニット(リモコン)30は、特に図示はしないが、フロント側の操作部22と同等の機能を有する操作部と、この操作部から入力された操作指示に応じた信号を赤外線通信により表示ユニット31に向けて送信するための赤外線送信部とを備えている。また、リア席用表示ユニット31は、特に図示はしないが、リモコン30及びワイヤレスヘッドホン32との間で制御信号やデータ等を通信するための赤外線通信部と、フロント側の制御部21と同等の制御を行う制御部と、フロント側の表示ユニット25と同様のLCDモニタ等からなる表示部と、フロント側のメモリ部24と同様のメモリ部とを備えている。
On the other hand, the rear seat operation unit (remote control) 30 is not particularly shown, but an operation unit having the same function as the
次に、本実施形態に係る車載用音声認識装置10の構成について、その一例を示す図2を参照しながら説明する。
Next, the configuration of the in-vehicle
本実施形態に係る車載用音声認識装置10は、図示のようにHDD7(その一部の記憶領域)と、マイクロホン8と、音声認識ユニット9とを備えている。音声認識ユニット9は、その機能ブロックとして、音声入力部11と、音声認識処理部12と、辞書切替選択部13と、音声再生処理部14と、機器制御信号発生部15とを備えている。
The on-vehicle
HDD7には、音声認識用のデータとして、ユーザが発話したコマンド(ボイスタグを含む)を認識するためのコマンド認識辞書と、本発明の特徴をなす判別用辞書JDと、音響モデルAMとが格納されている。音響モデルAMは当業者には周知のものであり、例えば、音素対応の音素HMM(隠れマルコフモデル)からなる音素HMMセットを生成し、この音素HMMセットの音素HMMを組み合わせて、それぞれの音節対応の初期音素連鎖音節HMMからなる初期音素連鎖音節HMMセットを生成し、その初期音素連鎖音節HMMセットを学習することによって、作成され得る。この音響モデルAMは、音声認識処理部12において音声認識を行う際に適宜参照される。
The
コマンド認識辞書は、例えば、各制御対象機器1〜5の動作状態もしくは操作指示に関連させてそれぞれ選択可能なコマンドからなる認識辞書毎に区分され(図示の例では、D1〜D3の3種類の辞書)、当該辞書の識別番号(ID=1〜3)に対応させて格納されている。図示の例では、1番目のコマンド認識辞書D1がボイスタグ(Voice Tag) 認識用の辞書として割り当てられている。
For example, the command recognition dictionary is classified for each recognition dictionary including commands that can be selected in association with the operation state or operation instruction of each
判別用辞書JDは、後述するようにユーザが発したボイスタグをボイスタグ認識用の辞書D1に登録すべきかどうかを判断する際に使用されるものである。この判別用辞書JDには、少なくともボイスタグ認識用の辞書D1に登録されているボイスタグと同じボイスタグが登録されるようになっている。さらに判別用辞書JDには、ナビゲーションユニット5が製品としてサポートしているコマンド(図2の例では、"Menu","Cancel","Map" )が予約語として登録されている。このような予約語を予め登録しておくことで、後述するようにボイスタグを音声認識したときに、ユーザが新規で登録したコマンドなのか、ナビゲーション機能として元々有していたコマンドなのかを判別することができる。
The determination dictionary JD is used when determining whether or not a voice tag issued by a user should be registered in the voice tag recognition dictionary D1 as described later. In this discrimination dictionary JD, at least the same voice tag as that registered in the voice tag recognition dictionary D1 is registered. Further, in the discrimination dictionary JD, commands supported by the
音声認識ユニット9において、音声入力部11は、マイクロホン8を介してユーザが発した音声コマンド(アナログ音声信号)を適宜増幅し、デジタル化した後、音声認識処理部12に出力する。音声認識処理部12は、基本的には、音響モデルAMを参照しながら各制御対象機器1〜5の動作状態において選択可能なコマンドからなる認識辞書(図示の例では、コマンド認識辞書D1〜D3のいずれか)を使用して、入力された音声コマンドと当該認識辞書に含まれる各コマンドとを比較照合し、それぞれ合致度(認識スコア)を算出して、最も認識スコアの大きいコマンドをユーザが発した音声コマンドとして決定するものである。さらに音声認識処理部12では、本発明に関連する処理として、後述するようにボイスタグを登録する際には判別用辞書JDを使用して認識処理を行い、その認識スコアに応じて、当該ボイスタグをボイスタグ認識用の辞書D1に登録すべきかどうかを決定する。
In the
辞書切替選択部13は、各制御対象機器1〜5と動作可能に接続されており、これらの動作状態に変化が発生したときにそれを検出してその動作状態に対応する選択可能なコマンドからなる認識辞書を選択するものである。音声再生処理部14では、ユーザによって音声入力されたコマンド(ボイスタグを含む)の認識結果をトークバック再生したり、各制御対象機器1〜5に対する、音声による操作の結果を報知するための音声データを合成する。合成された音声データはバス6(図1)に送出され、アンプユニット26を介してスピーカ27からユーザに報知される。機器制御信号発生部15では、音声認識処理部12で決定されたコマンドを取得し、そのコマンドの内容に応じた機器制御信号を出力する。出力された機器制御信号はバス6(図1)に送出され、該当する制御対象機器では、その機器制御信号に基づいて動作状態の変更を行う。
The dictionary
以下、本実施形態に係る車載用音声認識装置10(図2)において行うコマンド認識辞書と判別用辞書の切替選択に基づいたボイスタグの登録に係る処理について、その一例を示す図3を参照しながら説明する。併せて、図4〜図8も参照しながら補足説明する。 Hereinafter, with reference to FIG. 3 showing an example of processing related to voice tag registration based on switching selection between a command recognition dictionary and a discrimination dictionary performed in the in-vehicle speech recognition apparatus 10 (FIG. 2) according to the present embodiment. explain. In addition, a supplementary explanation will be given with reference to FIGS.
先ず初期状態として、ボイスタグ認識用の辞書(コマンド認識辞書D1)と判別用辞書JDにはボイスタグは登録されていないものとし、また判別用辞書JDには、ナビゲーション機能として元々有していたコマンド("Menu","Cancel","Map" )が予約語として登録されているものとする。 First, as an initial state, it is assumed that no voice tag is registered in the voice tag recognition dictionary (command recognition dictionary D1) and the discrimination dictionary JD, and the discrimination dictionary JD has a command ( “Menu”, “Cancel”, “Map”) are registered as reserved words.
この状態で最初のステップS1では、音声認識ユニット9において、マイクロホン8から音声入力部11を介してボイスタグ用の音声データを検出した(YES)か否(NO)かを判定する。判定結果がYESの場合にはステップS2に進み、判定結果がNOの場合にはボイスタグを検出するまで判定処理を繰り返す。
In the first step S1 in this state, the
次のステップS2では、音声認識ユニット9において、辞書切替選択部13が音声認識処理部12と協働して、選択可能なコマンド認識辞書(図2の例では、D1〜D3)と判別用辞書JDを有効化する。
In the next step S2, in the
次のステップS3では、音声認識処理部12において、HDD7に格納されている各辞書(この場合、ボイスタグ認識用の辞書D1と判別用辞書JD)を参照して、登録されているボイスタグは有る(YES)か否(NO)かを判定する。判定結果がYESの場合にはステップS4に進み、判定結果がNOの場合にはステップS5に進む。
In the next step S3, the voice
ステップS5では(ボイスタグが未だ登録されていない場合)、音声認識処理部12により、その検出したボイスタグのPCMデータ(音声データ)を録音すると共に、そのボイスタグを当該認識辞書(ボイスタグ認識用の辞書D1)と判別用辞書JDに登録する。図4はその一例を示しており、図示の例では、ボイスタグ認識用の辞書D1と判別用辞書JDにボイスタグとして"Best Buy"のコマンドが登録されている(図中、(b),(c)参照)。なお、(a)に示す画面51は、図9に例示した"Address Book"画面61と同等のものである。このようにしてボイスタグの登録が終了すると、ステップS1に戻って上記の処理を繰り返す。
In step S5 (when the voice tag is not yet registered), the voice
一方、ステップS4では、辞書切替選択部13が音声認識処理部12と協働して、現在有効になっている認識辞書のID(図2の例では、ID=1〜3)を保持した上で、辞書を全て無効化する(図4(c)、図5(b)、図7(b)参照)。
On the other hand, in step S4, the dictionary
次のステップS6では、辞書切替選択部13が音声認識処理部12と協働して、無効化された辞書のうち判別用辞書JDのみを有効にし(図5(c)、図7(c)参照)、音声認識処理部12において、録音されたPCMデータに基づきその判別用辞書JDのみを使用して、検出したボイスタグに対する音声認識を実行する。図5(a)、図7(a)は、この場合の「検出したボイスタグ」の一例を示しており、図5(a)の例ではボイスタグとして"My Home" が検出されており、図7(a)の例ではボイスタグとして"Best Buy"が検出されている。なお、各図の(a)に示す画面52は、図9に例示した画面65と同等のものである。
In the next step S6, the dictionary
次のステップS7では、音声認識処理部12において、音声認識に基づいて算出した認識スコアが所定のしきい値より低い(YES)か否(NO)かを判定する。判定結果がYESの場合にはステップS8に進み、判定結果がNOの場合にはステップS9に進む。ここに、認識スコアが当該しきい値より低い場合には、検出したボイスタグは、これまで登録したいずれのボイスタグとも類似していないデータ(非類似のデータ)であると判断することができる。一方、認識スコアが当該しきい値より高い場合には、検出したボイスタグは、これまで登録したいずれかのボイスタグと同一又は類似しているデータ(同一/類似のデータ)であると判断することができる。
In the next step S7, the voice
ステップS8では(検出したボイスタグが非類似のデータの場合)、音声認識処理部12により、その検出したボイスタグのPCMデータ(音声データ)を録音すると共に、そのボイスタグを判別用辞書JDとボイスタグ認識用の辞書D1に登録する。図6はその一例を示しており、図示の例では、ボイスタグとして新たに"My Home" のコマンドが登録されている(図中、(b)のボイスタグ認識用の辞書D1’、(c)の判別用辞書JD’参照)。このようにしてボイスタグの登録が終了すると、ステップS10に進む。
In step S8 (when the detected voice tag is dissimilar data), the voice
一方、ステップS9では(検出したボイスタグが同一/類似のデータの場合)、音声認識処理部12からの制御に基づき機器制御信号発生部15を介して表示ユニット(この場合、フロント席用表示ユニット25)の画面に、当該ボイスタグを各辞書(ボイスタグ認識用の辞書D1と判別用辞書JD)に登録しない旨の案内情報(警告画面)を表示する。図8(a)はその一例を示しており、図示の例では、過去に登録したボイスタグと極めて類似しているので登録しない旨、そして再登録を促す旨の案内情報(警告画面)53が表示されている。この警告画面を表示すると、ステップS10に進む。
On the other hand, in step S9 (when the detected voice tag is the same / similar data), the display unit (in this case, the front
最後のステップS10では、辞書切替選択部13が音声認識処理部12と協働して、判別用辞書JD(又はJD’)を無効にし、保持しておいた認識辞書IDのコマンド認識辞書を有効化する(図6(b),(c)、図8(b),(c)参照)。
In the last step S10, the dictionary
なお、本発明の要旨とは関係しないので特に図示はしていないが、上記の処理(図3)を通してコマンド認識辞書(ボイスタグ認識用辞書D1)に登録されたボイスタグは、各制御対象機器1〜5を制御するのに利用され得る。この場合、音声認識ユニット9では、機器制御信号発生部15により、音声認識処理部12で認識されたコマンドに応じた機器制御信号を出力し、これに対応する制御を当該制御対象機器に対して実行する。その際、当該制御対象機器の動作状態に係る映像を表示している表示ユニット25,31に対して当該コマンドに応じた制御(画面表示やその変更など)を行うと共に、当該制御対象機器の動作状態に係る音声を出力しているスピーカ27(ワイヤレスヘッドホン32を含む)に対して当該コマンドに応じた制御(音声の変更など)を行う。例えば、図9(b)に例示したように、自車位置周辺の地図画面67を表示させている状態で、ユーザがマイクロホン8を介して"Go to [My Home]" と発声すると、音声認識ユニット9では、この音声コマンド(PCMデータ)を基に音声認識処理を実行し、その実行結果に応じた機器制御信号を出力する。ナビゲーションユニット5では、この機器制御信号に応答して、表示ユニット25の画面に自宅(My Home) までの誘導経路等の情報を表示する。
The voice tag registered in the command recognition dictionary (voice tag recognition dictionary D1) through the above process (FIG. 3) is not shown because it is not related to the gist of the present invention. Can be used to
以上説明したように、本実施形態に係る車載用音声認識装置10によれば、マイクロホン8を介して音声入力されたコマンド(ボイスタグを含む)を認識辞書D1と判別用辞書JDに登録するにあたり、判別用辞書JDのみを使用して当該コマンドに対する音声認識を行い、その結果に基づき算出した認識スコアが当該しきい値より低い場合には、当該コマンドはこれまで登録したいずれのコマンドとも類似していない(非類似の)データであると判断して、当該コマンドを各辞書D1,JDに登録するようにしている。
As described above, according to the in-vehicle
一方、認識スコアが当該しきい値より高い場合には、当該コマンドはこれまで登録したいずれかのコマンドと同一もしくは類似している(同一/類似の)データであると判断して、当該コマンドを各辞書D1,JDに登録しない旨の案内情報(警告画面)53を表示するようにしている。 On the other hand, if the recognition score is higher than the threshold, it is determined that the command is the same or similar (same / similar) data as any of the registered commands so far, Guidance information (warning screen) 53 notifying registration in each of the dictionaries D1 and JD is displayed.
つまり、登録しようとしているコマンド(ボイスタグを含む)が判別用辞書JDに既に登録されているコマンドと同一/類似しているか、あるいは非類似かを判断し、非類似の場合にのみ当該コマンドを登録するようにし、同一/類似の場合には登録しないようにしている。 That is, it is determined whether the command to be registered (including the voice tag) is the same / similar to or not similar to the command already registered in the discrimination dictionary JD, and the command is registered only when it is dissimilar. If it is the same / similar, it is not registered.
これにより、従来技術に見られたような、過去に登録したコマンドと同一もしくは類似している音声データが登録されることによってひき起こされる認識の際の紛らわしさといった不都合を解消することができる。その結果、認識辞書に登録した音声コマンドに対する認識率を高めることができる。 As a result, it is possible to eliminate the inconvenience such as confusion at the time of recognition caused by registration of voice data that is the same as or similar to a command registered in the past as seen in the prior art. As a result, the recognition rate for voice commands registered in the recognition dictionary can be increased.
上述した実施形態では、車載用音声認識装置10を車載A/V・ナビゲーションシステム40の一部として組み込んだ場合を例にとって説明したが、本発明の要旨(ユーザが発したコマンド(ボイスタグ)をコマンド認識辞書(ボイスタグ認識用辞書D1)に登録するにあたり、その登録を行うべきかどうかを判断するための判別用辞書を作成しておき、この判別用辞書を使用して入力されたコマンドに対する認識処理を行い、その結果(認識スコア)に基づいて同一もしくは類似していないコマンドのみを認識辞書に登録するようにしたこと)からも明らかなように、必ずしもA/V機器とナビゲーション装置の両方を含むシステムに組み込んで使用する必要がないことはもちろんである。
In the above-described embodiment, the case where the in-vehicle
また、上述した実施形態では、地図データと共にコマンド認識辞書、判別用辞書等を格納する記録媒体としてHDD7を使用しているが、これに代えて、フラッシュメモリなどの書き換え可能な他の記録媒体を使用してもよい。
In the above-described embodiment, the
1〜5…制御対象機器、
7…HDD(記憶手段)、
8…マイクロホン(音声入力手段)、
9…音声認識ユニット(音声認識手段)、
10…車載用音声認識装置、
12…音声認識処理部、
13…辞書切替選択部、
14…音声再生処理部、
15…機器制御信号発生部、
20,30…操作ユニット、
25,31…表示ユニット(表示手段)、
27…スピーカ、
40…車載オーディオ/ビデオ(A/V)・ナビゲーションシステム、
53…ボイスタグを登録しない旨の案内情報(警告画面)、
D1,D1’…ボイスタグ認識用辞書(コマンド認識辞書)、
D2,D3…コマンド認識辞書、
JD,JD’…判別用辞書。
1 to 5 ... controlled devices,
7 HDD (storage means),
8 ... Microphone (voice input means),
9: Voice recognition unit (voice recognition means),
10 ... Vehicle speech recognition device,
12 ... voice recognition processing unit,
13 ... dictionary switching selection unit,
14 ... voice reproduction processing unit,
15 ... Device control signal generator,
20, 30 ... operation unit,
25, 31 ... display unit (display means),
27 ... Speaker,
40. Car audio / video (A / V) navigation system,
53. Guidance information (warning screen) not to register voice tag,
D1, D1 '... Voice tag recognition dictionary (command recognition dictionary),
D2, D3 ... Command recognition dictionary,
JD, JD '... Dictionary for discrimination.
Claims (6)
前記音声入力手段を介して入力されたコマンドとの比較照合を行うのに使用され、制御対象機器の動作状態に応じて選択可能なコマンドを登録した複数の認識辞書と、入力されたコマンドを前記認識辞書に登録すべきかどうかを判断するための判別用辞書であって前記複数の認識辞書に登録されているコマンドと同じコマンドが登録されるよう適応されたものとを格納した記憶手段と、
前記制御対象機器の動作状態に応じて有効な前記認識辞書を切り替える辞書切替選択手段と、
前記音声入力手段を介して入力されたコマンドと前記記憶手段に格納されているいずれかの辞書に登録されているコマンドとの比較照合に基づいた音声認識を行う音声認識手段とを備え、
前記音声認識手段は、前記音声入力手段を介してコマンドが入力されたときに、前記判別用辞書のみを使用して当該入力されたコマンドに対する音声認識を行い、該音声認識に基づいて算出した認識スコアが所定のしきい値より低い場合に、当該コマンドを前記制御対象機器の動作状態に応じて選択された前記認識辞書及び前記判別用辞書に登録することを特徴とする車載用音声認識装置。 Voice input means for inputting commands spoken by the user in the passenger compartment;
A plurality of recognition dictionaries in which commands that can be selected according to the operation state of the control target device are used for comparison and collation with commands input via the voice input means, and the input commands are A storage means for storing a determination dictionary for determining whether or not to register in a recognition dictionary and adapted to register the same command as that registered in the plurality of recognition dictionaries;
Dictionary switching selection means for switching the recognition dictionary effective according to the operation state of the control target device;
Voice recognition means for performing voice recognition based on a comparison collation between a command input via the voice input means and a command registered in any dictionary stored in the storage means;
When the command is input via the voice input unit, the voice recognition unit performs voice recognition on the input command using only the discrimination dictionary, and the recognition calculated based on the voice recognition A vehicle-mounted speech recognition apparatus, wherein when the score is lower than a predetermined threshold, the command is registered in the recognition dictionary and the discrimination dictionary selected according to the operation state of the control target device.
前記音声認識手段は、前記音声認識に基づいて算出した認識スコアが所定のしきい値より高い場合に、前記表示手段に対し、当該コマンドを前記認識辞書及び前記判別用辞書に登録しない旨の警告画面を表示させることを特徴とする請求項1に記載の車載用音声認識装置。 Furthermore, a display means is provided,
When the recognition score calculated based on the voice recognition is higher than a predetermined threshold, the voice recognition unit warns the display unit that the command is not registered in the recognition dictionary and the discrimination dictionary. The on-vehicle speech recognition apparatus according to claim 1, wherein a screen is displayed.
前記音声入力手段を介してコマンドが入力されたときに、前記判別用辞書のみを有効にして当該入力されたコマンドに対する音声認識を実行し、
該音声認識に基づいて算出した認識スコアが所定のしきい値より低い場合に、当該コマンドを前記制御対象機器の動作状態に応じて選択された前記認識辞書及び前記判別用辞書に登録することを特徴とする音声コマンド登録方法。 The voice input means for inputting a command spoken by the user in the passenger compartment and the command input via the voice input means are used for comparison and collation, and can be selected according to the operating state of the control target device. A plurality of recognition dictionaries in which commands are registered, and a discrimination dictionary for determining whether or not an input command should be registered in the recognition dictionary, and the same commands as those registered in the plurality of recognition dictionaries are registered Storage means storing the one adapted to be performed, dictionary switching selection means for switching the recognition dictionary effective according to the operating state of the control target device, and a command input via the voice input means, automotive speech and a speech recognition means for performing speech recognition based on the comparison and collation with the commands that are registered in any dictionary that is stored in the storage means In the identification apparatus,
When a command is input via the voice input means, only the discrimination dictionary is enabled and voice recognition is performed on the input command.
When the recognition score calculated based on the voice recognition is lower than a predetermined threshold, the command is registered in the recognition dictionary and the determination dictionary selected according to the operation state of the control target device. Characteristic voice command registration method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006173813A JP5037041B2 (en) | 2006-06-23 | 2006-06-23 | On-vehicle voice recognition device and voice command registration method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006173813A JP5037041B2 (en) | 2006-06-23 | 2006-06-23 | On-vehicle voice recognition device and voice command registration method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008003371A JP2008003371A (en) | 2008-01-10 |
JP5037041B2 true JP5037041B2 (en) | 2012-09-26 |
Family
ID=39007798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006173813A Active JP5037041B2 (en) | 2006-06-23 | 2006-06-23 | On-vehicle voice recognition device and voice command registration method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5037041B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8990092B2 (en) | 2010-06-28 | 2015-03-24 | Mitsubishi Electric Corporation | Voice recognition device |
CN102831894B (en) * | 2012-08-09 | 2014-07-09 | 华为终端有限公司 | Command processing method, command processing device and command processing system |
KR102245747B1 (en) * | 2014-11-20 | 2021-04-28 | 삼성전자주식회사 | Apparatus and method for registration of user command |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH067348B2 (en) * | 1989-04-13 | 1994-01-26 | 株式会社東芝 | Pattern recognition device |
JP3352144B2 (en) * | 1993-04-16 | 2002-12-03 | クラリオン株式会社 | Voice recognition device |
JPH08110790A (en) * | 1994-10-11 | 1996-04-30 | Nippon Telegr & Teleph Corp <Ntt> | Sound recognizing device |
JP4201870B2 (en) * | 1998-02-24 | 2008-12-24 | クラリオン株式会社 | System using control by speech recognition and control method by speech recognition |
JP2000029585A (en) * | 1998-07-08 | 2000-01-28 | Canon Inc | Voice command recognizing image processor |
JP2000259172A (en) * | 1999-03-11 | 2000-09-22 | Canon Inc | Voice recognition device and method of voice data recognition |
JP2000338991A (en) * | 1999-05-25 | 2000-12-08 | Nec Saitama Ltd | Voice operation telephone device with recognition rate reliability display function and voice recognizing method thereof |
JP2004029354A (en) * | 2002-06-25 | 2004-01-29 | Toshiba Corp | Speech recognition device, speech recognition method, and speech recognition program |
JP2004226698A (en) * | 2003-01-23 | 2004-08-12 | Yaskawa Electric Corp | Speech recognition device |
JP4450575B2 (en) * | 2003-06-26 | 2010-04-14 | 株式会社ザナヴィ・インフォマティクス | Vehicle voice recognition device, vehicle-mounted navigation device |
JP4236597B2 (en) * | 2004-02-16 | 2009-03-11 | シャープ株式会社 | Speech recognition apparatus, speech recognition program, and recording medium. |
JP2005242181A (en) * | 2004-02-27 | 2005-09-08 | Toshiba Corp | Method and apparatus for vocabulary selection, and program |
JP2006033795A (en) * | 2004-06-15 | 2006-02-02 | Sanyo Electric Co Ltd | Remote control system, controller, program for imparting function of controller to computer, storage medium with the program stored thereon, and server |
-
2006
- 2006-06-23 JP JP2006173813A patent/JP5037041B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008003371A (en) | 2008-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5014662B2 (en) | On-vehicle speech recognition apparatus and speech recognition method | |
JP4269973B2 (en) | Car audio system | |
JP3567864B2 (en) | Voice recognition device and recording medium | |
JP4304952B2 (en) | On-vehicle controller and program for causing computer to execute operation explanation method thereof | |
EP2045140B1 (en) | Adjustment of vehicular elements by speech control | |
JP4804052B2 (en) | Voice recognition device, navigation device provided with voice recognition device, and voice recognition method of voice recognition device | |
US20070203699A1 (en) | Speech recognizer control system, speech recognizer control method, and speech recognizer control program | |
JP6604151B2 (en) | Speech recognition control system | |
JP2008058409A (en) | Speech recognizing method and speech recognizing device | |
JP2017090613A (en) | Voice recognition control system | |
US20160111089A1 (en) | Vehicle and control method thereof | |
JP2009251388A (en) | Native language utterance device | |
JP2017090614A (en) | Voice recognition control system | |
KR101755308B1 (en) | Sound recognition module, Navigation apparatus having the same and vehicle having the same | |
JP5037041B2 (en) | On-vehicle voice recognition device and voice command registration method | |
JP4770374B2 (en) | Voice recognition device | |
JP6741387B2 (en) | Audio output device | |
JP2014065359A (en) | Display control device, display system and display control method | |
JP2020144264A (en) | Agent device, control method of agent device, and program | |
JP2007057805A (en) | Information processing apparatus for vehicle | |
JPH09114487A (en) | Device and method for speech recognition, device and method for navigation, and automobile | |
CN111724778A (en) | In-vehicle device, control method for in-vehicle device, and storage medium | |
JP4093394B2 (en) | Voice recognition device | |
JPH09114491A (en) | Device and method for speech recognition, device and method for navigation, and automobile | |
JP5028045B2 (en) | In-vehicle display device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111028 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120419 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120704 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5037041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |