JP2009025715A - In-vehicle device and speech recognition method - Google Patents
In-vehicle device and speech recognition method Download PDFInfo
- Publication number
- JP2009025715A JP2009025715A JP2007190866A JP2007190866A JP2009025715A JP 2009025715 A JP2009025715 A JP 2009025715A JP 2007190866 A JP2007190866 A JP 2007190866A JP 2007190866 A JP2007190866 A JP 2007190866A JP 2009025715 A JP2009025715 A JP 2009025715A
- Authority
- JP
- Japan
- Prior art keywords
- operation command
- voice
- sound
- command
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する装置に関する。 The present invention relates to an apparatus that is mounted on a vehicle and executes processing in accordance with an operation command input by voice.
特許文献1には、車両が停止中の場合には全ての操作を許可し、車両が走行中の場合には予め定められた操作のみを許可する車載用ナビゲーション装置が開示されている。これにより、画面を注視しながら操作する必要がある操作を、車両の走行中に、運転者に操作させることを防止することができ、運転者を運転に集中させることができる。また、特許文献2には、車両に搭載され、音声により入力された操作コマンドに応じて処理を行う音声認識装置が開示されている。
ところで、車両の走行中に、運転者以外の同乗者が、車載装置の機能を利用したい場合がある。同乗者は、運転していないため、画面を注視しながら操作する必要がある操作を行っても、運転の妨げとなることはない。しかし、従来は、車両が走行中の場合には、予め定められた操作のみが許可され、同乗者にとっては利便性の低いものとなっていた。これは、音声により操作コマンドを入力する場合においても同様であった。 By the way, during traveling of the vehicle, a passenger other than the driver may want to use the function of the in-vehicle device. Since the passenger is not driving, even if he / she performs an operation that needs to be performed while gazing at the screen, it does not hinder driving. However, conventionally, when the vehicle is running, only predetermined operations are permitted, which is inconvenient for passengers. This was the same when inputting an operation command by voice.
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、音声により入力された操作コマンドに応じて処理を行う車載装置において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができるようにすることにある。 The present invention has been made in view of the above circumstances, and an object of the present invention is an in-vehicle device that performs processing according to an operation command input by voice, depending on the position in the vehicle where the occupant is sitting, It is to be able to set an operation command to be permitted for a passenger sitting at the position.
上記課題を解決するために、本発明の車載装置は、座席位置毎に許可される操作コマンドが予め定められており、音声により操作コマンドが入力された場合に、複数のマイクロフォンを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、入力された操作コマンドが当該発生位置において許可されている操作コマンドである場合に、当該操作コマンドに対応する処理を実行する。 In order to solve the above-described problem, the in-vehicle device of the present invention has a predetermined operation command for each seat position, and is collected via a plurality of microphones when the operation command is input by voice. The voice generation position corresponding to the voice signal is identified from the voice signal, and when the input operation command is an operation command permitted at the generation position, processing corresponding to the operation command is executed.
例えば、本発明の第一の態様は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置であって、車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを格納する許可コマンド格納手段と、操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付手段と、音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定手段と、音源位置特定手段から出力された音声信号から操作コマンドを認識する音声認識手段と、音源位置特定手段から出力された音声信号に対応する音声の発生位置において許可されている操作コマンドを許可コマンド格納手段から抽出し、音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、音声認識手段によって認識された操作コマンドに対応する処理を実行するコマンド処理手段とを備えることを特徴とする車載装置を提供する。 For example, the first aspect of the present invention is an in-vehicle device that is mounted on a vehicle and executes processing in response to an operation command input by voice, in association with information indicating a seat area in the vehicle, The permission command storage means for storing the operation command permitted for the person sitting in the seat, the voice recognition start receiving means for receiving an instruction to start the input of the operation command from the user, and the voice recognition start receiving means for inputting the operation command After receiving the start instruction from the user, the sound generation position corresponding to the sound signal is identified from the sound signals collected via each of the plurality of microphones, and the identified position is generated from the position. Sound source position specifying means output together with a sound signal corresponding to the sound, and sound for recognizing an operation command from the sound signal output from the sound source position specifying means And the operation command permitted at the sound generation position corresponding to the sound signal output from the sound source position specifying means is extracted from the permission command storage means, and the operation command recognized by the voice recognition means is extracted. And a command processing unit that executes a process corresponding to the operation command recognized by the voice recognition unit when the operation command is the same as any one of the operation commands.
また、本発明の第二の態様は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置における音声認識方法であって、車載装置は、車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを許可コマンド格納手段に格納する許可コマンド格納ステップと、操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付ステップと、音声認識開始受付ステップにおいて操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定ステップと、音源位置特定ステップにおいて出力した音声信号から操作コマンドを認識する音声認識ステップと、音源位置特定ステップにおいて出力した音声信号に対応する音声の発生位置において許可されている操作コマンドを許可コマンド格納手段から抽出し、音声認識ステップにおいて認識した操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、音声認識ステップにおいて認識した操作コマンドに対応する処理を実行するコマンド処理ステップとを実行することを特徴とする音声認識方法を提供する。 The second aspect of the present invention is a speech recognition method in an in-vehicle device that is mounted on a vehicle and executes processing in accordance with an operation command input by voice, wherein the in-vehicle device is a seat area in the vehicle. In correspondence with the information indicating the permission command storage step for storing the operation command permitted for the person sitting on the seat in the permission command storage means, and the instruction for starting the input of the operation command is received from the user. After receiving an operation command input start instruction from the user in the step and the voice recognition start reception step, the voice generation position corresponding to the voice signal is specified from the voice signals collected through each of the plurality of microphones. The sound source position specifying step for outputting the specified generation position together with the audio signal corresponding to the sound generated from the generation position. A voice recognition step for recognizing an operation command from the voice signal output in the sound source position specifying step, and a permission command storage means for the operation command permitted in the sound generation position corresponding to the voice signal output in the sound source position specifying step. A command processing step for executing a process corresponding to the operation command recognized in the voice recognition step when the operation command extracted from the voice recognition step is the same as one of the extracted operation commands. A speech recognition method is provided.
本発明の車載装置によれば、音声により入力された操作コマンドに応じて処理を行う車載装置において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。 According to the vehicle-mounted device of the present invention, in the vehicle-mounted device that performs processing according to an operation command input by voice, permission is given to a passenger sitting at the position according to the position in the vehicle where the passenger is sitting. Operation commands to be set can be set.
まず、本発明の第一の実施形態について、図面を参照しながら説明する。 First, a first embodiment of the present invention will be described with reference to the drawings.
図1は、本発明の第一の実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、複数のマイクロフォン11、音声認識開始ボタン12、表示装置13、センサ14、および車載装置20を備える。車載装置20は、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25を有する。
FIG. 1 is a system configuration diagram showing the configuration of an in-vehicle system 10 according to the first embodiment of the present invention. The in-vehicle system 10 includes a plurality of
開始指示受付部22は、ユーザによって音声認識開始ボタン12が押下された場合に、音声信号に対応する音声の発生位置の特定を音源位置特定部21に指示する。音源位置特定部21は、開始指示受付部22から音声信号の発生位置の特定を指示された場合に、車両内に設けられた複数のマイクロフォン11のそれぞれを介して収集された音声信号の遅延量や振幅の差等に基づいて、当該音声信号に対応する音声の発生位置を特定する。そして、音源位置特定部21は、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に音声認識部23へ出力する。
The start
また、複数のマイクロフォン11のそれぞれを介して収集された信号に、異なる位置から発生した複数の音声に対応する音声信号が含まれている場合、音源位置特定部21は、発生位置毎に、当該発生位置から発生した音声に対応する音声信号を、対応する発生位置を示す情報と共に音声認識部23へ出力する。音源位置特定部21から音声認識部23へ出力されるデータ40には、例えば図2に示すように、車両内での音声の発生位置を示す音源位置41に対応付けて、当該音源位置41から発生した音声に対応する音声信号42が格納される。
In addition, when the signals collected via each of the plurality of
本実施形態において、音源位置41には、車両内の所定の高さにおける水平面をxy平面とした場合のxy平面上の座標が格納される。また、他の例として、音源位置41には、車両内の位置を示す三次元座標が格納されていてもよい。
In the present embodiment, the
音声認識部23は、音源位置特定部21から出力されたそれぞれの音声信号から公知の音声認識技術を用いて、操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声信号に対応する音声の発生位置を示す情報と共にコマンド処理部24へ出力する。
The
許可コマンド格納部25には、例えば図3に示すように、車両内の座席の領域を示す座席領域250に対応付けて、当該座席領域250で示される座席の属性251、当該座席に座った人に対して車両の走行時に許可する複数の操作コマンドを示す走行中許可コマンド252、および、当該座席に座った人に対して停車中に許可する複数の操作コマンドを示す停止中許可コマンド253が予め格納されている。
In the permission
座席領域250には、例えば図4に示すように、車両内の所定の高さにおける水平面をxy平面とした場合のxy平面上において、それぞれの座席位置を囲む矩形領域の対向する頂点の座標が格納される。図4は、車両の内部を上空から見た図を模式的に表したものであり、ハンドル15近傍の領域30は運転席を示し、領域31は助手席を示し、領域32は後部座席を示している。なお、図4に示す例において、複数のマイクロフォン11および表示装置13は、ダッシュボード付近に設けられる。
In the
走行中許可コマンド252または停止中許可コマンド253において、全ての操作コマンドが許可される場合、全ての操作コマンドが許可される旨を示す「ALL」が格納される。
When all the operation commands are permitted in the
コマンド処理部24は、音声認識部23から、音声信号および当該音声信号に対応する音声の発生位置を示す情報を受信した場合に、許可コマンド格納部25を参照して、当該発生位置が含まれる座席領域を特定する。そして、コマンド処理部24は、GPS(Global Positioning System)受信機や方位センサ、距離センサ等のセンサ14から受信した測定信号に基づいて車両が走行中か否かを判定する。
When the
車両が走行中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、走行中許可コマンド252に格納されている複数の操作コマンドを抽出する。一方、車両が停止中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、停止中許可コマンド253に格納されている複数の操作コマンドを抽出する。
When the vehicle is traveling, the
そして、コマンド処理部24は、音声認識部23から受信した操作コマンドが、許可コマンド格納部25から抽出した複数の操作コマンドのいずれかに該当する場合に、当該操作コマンドの元となった音声信号に対応する音声の発生位置が含まれる座席領域を、例えば図5に示すように表示装置13に表示して、音声認識部23から受信した操作コマンドに対応する処理を実行する。
Then, when the operation command received from the
図5に示した例において、コマンド処理部24は、表示装置13の画面内に音声信号の発生位置を示すアイコン50を表示している。アイコン50には、助手席を示す領域51、運転席を示す領域52、および後部座席を示す領域53が含まれる。図5に示した例では、運転席から発生した音声による操作コマンドに対応する処理が実行された旨が表示されている。
In the example shown in FIG. 5, the
また、他の例として、図6に示すように、画面のふちに沿って、助手席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域55、運転席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域56、および後部座席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域57を表示するようにしてもよい。
As another example, as shown in FIG. 6, an
なお、音声認識部23から複数の音声信号およびそれぞれの音声信号に対応する音声の発生位置を示す情報を受信した場合、コマンド処理部24は、それぞれの音声信号に対応する音声の発生位置に基づいて許可コマンド格納部25を参照し、運転席の領域から発生した音声に対応する音声信号による操作コマンドを優先して処理する。運転席から発生した音声に対応する音声信号による操作コマンドがなかった場合、コマンド処理部24は、例えば助手席、後部座席の順に優先して操作コマンドを実行する。
When receiving information indicating a plurality of voice signals and voice generation positions corresponding to the respective voice signals from the
図7は、車載装置20の動作の一例を示すフローチャートである。例えば車両のエンジンが始動する等の所定のタイミングで、車載装置20は、本フローチャートに示す動作を開始する。
FIG. 7 is a flowchart illustrating an example of the operation of the in-
まず、開始指示受付部22は、音声認識開始ボタン12が押下されたいか否かを判定する(S100)。音声認識開始ボタン12が押下されていない場合(S100:No)、開始指示受付部22は、音声認識開始ボタン12が押下されるまでステップS100に示した処理を繰り返す。
First, the start
音声認識開始ボタン12が押下された場合(S100:Yes)、開始指示受付部22は、音声信号に対応する音声の発生位置の特定を音源位置特定部21に指示する。音源位置特定部21は、車両内に設けられた複数のマイクロフォン11のそれぞれを介して収集された音声信号の遅延量や振幅の差等に基づいて、当該音声信号に対応する音声の発生位置を特定し(S101)、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に音声認識部23へ出力する。
When the voice recognition start button 12 is pressed (S100: Yes), the start
次に、音声認識部23は、音源位置特定部21から出力されたそれぞれの音声信号から公知の音声認識技術を用いて、操作コマンドを認識し(S102)、認識した操作コマンドを、当該操作コマンドの元となった音声信号に対応する音声の発生位置を示す情報と共にコマンド処理部24へ出力する。
Next, the
次に、コマンド処理部24は、音声認識部23から出力された操作コマンドを参照して、複数の操作コマンドが認識されたか否かを判定する(S103)。複数の操作コマンドが認識された場合(S103:Yes)、コマンド処理部24は、操作コマンドと共に音声認識部23から出力された音声の発生位置に基づいて許可コマンド格納部25を参照し、運転席の領域から発生した音声に対応する音声信号による操作コマンドを優先して処理する(S104)。
Next, the
次に、コマンド処理部24は、処理した操作コマンドに対応する音声の発生位置が含まれる座席位置を表示装置13に表示し(S105)、開始指示受付部22は、ステップS100に示した処理を実行する。
Next, the
ステップS103において、単一の操作コマンドが認識された場合(S103:No)、コマンド処理部24は、当該認識された操作コマンドに対応する処理を実行し(S106)、ステップS105に示した処理を実行する。
When a single operation command is recognized in step S103 (S103: No), the
以上、本発明の第一の実施形態について説明した。 The first embodiment of the present invention has been described above.
上記説明から明らかなように、本実施形態の車載システム10によれば、音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。
As is clear from the above description, according to the in-vehicle system 10 of the present embodiment, in the in-
次に、本発明の第二の実施形態について説明する。 Next, a second embodiment of the present invention will be described.
図8は、本発明の第二実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、複数のマイクロフォン11、音声認識開始ボタン12、複数の表示装置13、センサ14、および車載装置20を備える。車載装置20は、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25を有する。なお、以下に説明する点を除き、図8において、図1と同じ符号を付した構成は、図1における構成と同一または同様の機能を有するため説明を省略する。
FIG. 8 is a system configuration diagram showing the configuration of the in-vehicle system 10 according to the second embodiment of the present invention. The in-vehicle system 10 includes a plurality of
それぞれの表示装置13は、例えば図9に示すように、車両内の異なる位置に設けられる。表示装置13−1は例えば運転席の前に設けられ、運転席に座った者に見せる画面を表示する。表示装置13−2は例えば助手席の前に設けられ、助手席に座った者に見せる画面を表示する。表示装置13−3は、例えば後部座席の前に設けられたルーフモニタであり、後部座席に座った者に見せる画面を表示する。
Each
許可コマンド格納部25には、例えば図10に示すように、座席領域250に対応付けて、属性251、走行中許可コマンド252、停止中許可コマンド253、および、座席領域250で示される座席から発生した音声の音声信号に対応する操作コマンドによる処理結果を反映させる表示装置13を識別する表示装置ID254が予め格納されている。
In the permission
コマンド処理部24は、音声認識部23から、音声信号および当該音声信号に対応する音声の発生位置を示す情報を受信した場合に、許可コマンド格納部25を参照して、当該発生位置が含まれる座席領域を特定する。そして、コマンド処理部24は、マイクロフォン11から受信した測定信号に基づいて車両が走行中か否かを判定する。
When the
車両が走行中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、走行中許可コマンド252に格納されている複数の操作コマンドを抽出する。一方、車両が停止中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、停止中許可コマンド253に格納されている複数の操作コマンドを抽出する。
When the vehicle is traveling, the
そして、コマンド処理部24は、音声認識部23から受信した操作コマンドが、許可コマンド格納部25から抽出した複数の操作コマンドのいずれかに該当する場合に、当該操作コマンドに対応する処理を実行する。そして、コマンド処理部24は、許可コマンド格納部25を参照して、当該操作コマンドの元となった音声信号に対応する音声の発生位置が含まれる座席領域250に対応付けられている表示装置IDを特定する。そして、コマンド処理部24は、実行結果を、特定した表示装置IDに対応する表示装置13に反映させる。
Then, when the operation command received from the
以上、本発明の第二の実施形態について説明した。 The second embodiment of the present invention has been described above.
本実施形態の車載システム10においても、音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。さらに、操作コマンドによる処理を、当該操作コマンドの元となる音声が発せされた位置に座っている者が見る表示装置13に反映させることができる。
Also in the in-vehicle system 10 of the present embodiment, in the in-
なお、上記第一または第二の実施形態における車載装置20は、例えば図11に示すような構成のコンピュータ60によって実現される。図11は、車載装置20の機能を実現するコンピュータ60のハードウェア構成の一例を示すハードウェア構成図である。コンピュータ60は、CPU(Central Processing Unit)61、RAM(Random Access Memory)62、ROM(Read Only Memory)63、HDD(Hard Disk Drive)64、入力インターフェイス(I/F)65、出力インターフェイス(I/F)66、およびメディアインターフェイス(I/F)67を備える。
The in-
CPU61は、ROM63またはHDD64に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM63は、コンピュータ60の起動時にCPU61が実行するブートプログラムや、コンピュータ60のハードウェアに依存するプログラム等を格納する。HDD64は、CPU61によって実行されるプログラムを格納する。
The
入力インターフェイス65は、マイクロフォン11、音声認識開始ボタン12、またはセンサ14からの信号を受信してCPU61へ送る。CPU61は、入力インターフェイス65を介して、マイクロフォン11、音声認識開始ボタン12、およびセンサ14を制御し、入力インターフェイス65を介して、マイクロフォン11、音声認識開始ボタン12、またはセンサ14から信号を取得する。出力インターフェイス66は、CPU61から取得したデータを、表示装置13へ送る。CPU61は、出力インターフェイス66を介して、表示装置13を制御し、生成したデータを、出力インターフェイス66を介して表示装置13へ出力する。
The
メディアインターフェイス67は、記録媒体68に格納されたプログラムまたはデータを読み取り、RAM62に提供する。RAM62を介してCPU61に提供されるプログラムは、記録媒体68に格納されている。当該プログラムは、記録媒体68から読み出されて、RAM62を介してコンピュータ60にインストールされ、CPU61によって実行される。記録媒体68は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
The
コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25として機能させる。コンピュータ60は、これらのプログラムを、記録媒体68から読み取って実行するが、他の例として、コンピュータ60に通信機能を設け、通信回線を介してこれらのプログラムを取得するようにしてもよい。
A program installed and executed on the computer 60 causes the computer 60 to function as the sound source
また、本発明は、上記した各実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。 The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope of the gist.
例えば、上記した第二の実施形態において、車載システム10は、複数の座席のそれぞれに対応する複数の表示装置13を備えるが、他の形態として、車載システム10は、複数の座席のそれぞれの対応する画面を表示する1台の表示装置13を備えていてもよい。この場合、コマンド処理部24は、操作コマンドに対応する処理の実行結果を、当該操作コマンドに対応する音声信号の発生位置が含まれる座席領域250用の画面に反映させる。
For example, in the second embodiment described above, the in-vehicle system 10 includes a plurality of
複数の座席のそれぞれの対応する画面を表示する表示装置13としては、例えば、パネルの前面にスリットを設け、運転席側用の画像と助手席側用の画像とを水平方向に交互に並べ、上記スリットでバックライトの光を左右に分離することにより運転席側と助手席側とで異なる画像を表示することができる液晶ディスプレイであるデュアルディスプレイが好ましい。
As the
10・・・車載システム、11・・・マイクロフォン、12・・・音声認識開始ボタン、13・・・表示装置、14・・・センサ、15・・・ハンドル、20・・・車載装置、21・・・音源位置特定部、22・・・開始指示受付部、23・・・音声認識部、24・・・コマンド処理部、25・・・許可コマンド格納部、30・・・領域、31・・・領域、32・・・領域、40・・・データ、41・・・音源位置、42・・・音声信号、50・・・アイコン、51・・・領域、52・・・領域、53・・・領域、55・・・領域、56・・・領域、57・・・領域、60・・・コンピュータ、61・・・CPU、62・・・RAM、63・・・ROM、64・・・HDD、65・・・入力インターフェイス、66・・・出力インターフェイス、67・・・メディアインターフェイス、68・・・記録媒体
DESCRIPTION OF SYMBOLS 10 ... In-vehicle system, 11 ... Microphone, 12 ... Voice recognition start button, 13 ... Display device, 14 ... Sensor, 15 ... Handle, 20 ... In-vehicle device, 21. .. Sound source position specifying unit, 22... Start instruction receiving unit, 23... Voice recognition unit, 24... Command processing unit, 25.・
Claims (7)
車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを格納する許可コマンド格納手段と、
操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付手段と、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定手段と、
前記音源位置特定手段から出力された音声信号から操作コマンドを認識する音声認識手段と、
前記音源位置特定手段から出力された音声信号に対応する音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、前記音声認識手段によって認識された操作コマンドに対応する処理を実行するコマンド処理手段と
を備えることを特徴とする車載装置。 An in-vehicle device that is mounted on a vehicle and executes processing according to an operation command input by voice,
A permission command storage means for storing an operation command to be permitted for a person sitting on the seat in association with information indicating a seat area in the vehicle;
Voice recognition start accepting means for accepting an operation command input start instruction from the user;
After the voice recognition start accepting means accepts an instruction to start inputting an operation command from the user, the voice generation position corresponding to the voice signal is identified from the voice signals collected through each of the plurality of microphones, and identified. Sound source position specifying means for outputting the generated position together with an audio signal corresponding to the sound generated from the generated position;
Voice recognition means for recognizing an operation command from the voice signal output from the sound source position specifying means;
The operation command permitted at the sound generation position corresponding to the sound signal output from the sound source position specifying means is extracted from the permission command storage means, and the operation command recognized by the sound recognition means is extracted. An in-vehicle device comprising: a command processing unit that executes a process corresponding to the operation command recognized by the voice recognition unit when the operation command is the same as one of the operation commands.
前記許可コマンド格納手段には、
車両内の座席の領域を示す情報として、運転席の領域を示す情報が含まれており、当該運転席の領域を示す情報には、車両が走行中に許可される操作コマンドと、車両が停止中に許可される操作コマンドとが対応付けられており、
前記コマンド処理手段は、
前記音源位置特定手段から出力された音声信号に対応する音声の発生位置が運転席の領域に含まれる場合に、車両が走行中であるならば、車両が走行中に許可される操作コマンドを前記許可コマンド格納手段から抽出し、車両が停止中であるならば、車両が停止中に許可される操作コマンドを前記許可コマンド格納手段から抽出することを特徴とする車載装置。 The in-vehicle device according to claim 1,
In the permission command storage means,
Information indicating the area of the driver's seat is included as information indicating the area of the seat in the vehicle. The information indicating the area of the driver's seat includes an operation command that is permitted while the vehicle is traveling, and the vehicle is stopped. Are associated with permitted operation commands,
The command processing means includes
If the sound generation position corresponding to the sound signal output from the sound source position specifying means is included in the area of the driver's seat, if the vehicle is running, the operation commands permitted while the vehicle is running are An on-vehicle apparatus characterized in that if the vehicle is stopped and extracted from the permission command storage means, an operation command permitted while the vehicle is stopped is extracted from the permission command storage means.
前記コマンド処理手段は、
処理が実行される操作コマンドに対応する音声の発生位置を示す情報を表示装置に表示することを特徴とする車載装置。 The in-vehicle device according to claim 1 or 2,
The command processing means includes
An in-vehicle device characterized in that information indicating a sound generation position corresponding to an operation command to be processed is displayed on a display device.
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号に対応する音声の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、運転席の領域から発生した音声による操作コマンドを優先して処理することを特徴とする車載装置。 The in-vehicle device according to any one of claims 1 to 3,
The sound source position specifying means includes
After the voice recognition start receiving means receives an instruction to start inputting an operation command from the user, the voice corresponding to each voice signal is obtained from the mixed signal including a plurality of voice signals collected through each of the plurality of microphones. For each occurrence position, the sound signal of the sound generated from the position is separated, and the separated sound signal is output together with information indicating the sound generation position corresponding to the sound signal,
The voice recognition means
When a plurality of audio signals are output from the sound source position specifying means, an operation command is recognized for each audio signal, and the recognized operation command is combined with information indicating the generation position of the sound that is the basis of the operation command. Output,
The command processing means includes
An in-vehicle apparatus that preferentially processes an operation command by voice generated from a driver's seat area when a plurality of operation commands are recognized by the voice recognition means.
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号に対応する音声の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、それぞれの操作コマンドについて、当該操作コマンドの元となる音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、当該発生位置から発生した音声による操作コマンドであって前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、当該操作コマンドに対応する処理結果を、座席毎に設けられた表示装置の中で、当該操作コマンドに対応する音声の発生位置が含まれる座席の領域に対応する表示装置に表示することを特徴とする車載装置。 The in-vehicle device according to any one of claims 1 to 3,
The sound source position specifying means includes
After the voice recognition start receiving means receives an instruction to start inputting an operation command from the user, the voice corresponding to each voice signal is obtained from the mixed signal including a plurality of voice signals collected through each of the plurality of microphones. For each occurrence position, the sound signal of the sound generated from the position is separated, and the separated sound signal is output together with information indicating the sound generation position corresponding to the sound signal,
The voice recognition means
When a plurality of audio signals are output from the sound source position specifying means, an operation command is recognized for each audio signal, and the recognized operation command is combined with information indicating the generation position of the sound that is the basis of the operation command. Output,
The command processing means includes
When a plurality of operation commands are recognized by the voice recognition unit, for each operation command, an operation command that is permitted at a voice generation position that is a source of the operation command is extracted from the permission command storage unit, If the operation command by voice generated from the generation position and recognized by the voice recognition means is the same as any one of the extracted operation commands, the processing result corresponding to the operation command is An on-vehicle device characterized by displaying on a display device corresponding to an area of a seat including a sound generation position corresponding to the operation command among display devices provided for each.
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、それぞれの操作コマンドについて、当該操作コマンドの元となる音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、当該発生位置から発生した音声による操作コマンドであって前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、当該操作コマンドに対応する処理結果を、座席毎に異なる表示が可能な表示装置において、当該操作コマンドに対応する音声の発生位置が含まれる座席の領域に対応する表示に反映させることを特徴とする車載装置。 The in-vehicle device according to any one of claims 1 to 3,
The sound source position specifying means includes
After the voice recognition start receiving means receives an instruction to start inputting an operation command from the user, the voice corresponding to each voice signal is obtained from the mixed signal including a plurality of voice signals collected through each of the plurality of microphones. For each occurrence position, the sound signal of the sound generated from the position is separated, and the separated sound signal is output together with information indicating the position where the sound signal is generated,
The voice recognition means
When a plurality of audio signals are output from the sound source position specifying means, an operation command is recognized for each audio signal, and the recognized operation command is combined with information indicating the generation position of the sound that is the basis of the operation command. Output,
The command processing means includes
When a plurality of operation commands are recognized by the voice recognition unit, for each operation command, an operation command that is permitted at a voice generation position that is a source of the operation command is extracted from the permission command storage unit, If the operation command by voice generated from the generation position and recognized by the voice recognition means is the same as any one of the extracted operation commands, the processing result corresponding to the operation command is An in-vehicle device, wherein a display device capable of different display is reflected in a display corresponding to a seat area including a sound generation position corresponding to the operation command.
前記車載装置は、
車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを許可コマンド格納手段に格納する許可コマンド格納ステップと、
操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付ステップと、
前記音声認識開始受付ステップにおいて操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定ステップと、
前記音源位置特定ステップにおいて出力した音声信号から操作コマンドを認識する音声認識ステップと、
前記音源位置特定ステップにおいて出力した音声信号に対応する音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、前記音声認識ステップにおいて認識した操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、前記音声認識ステップにおいて認識した操作コマンドに対応する処理を実行するコマンド処理ステップと
を実行することを特徴とする音声認識方法。 A voice recognition method in an in-vehicle device that is mounted on a vehicle and executes processing according to an operation command input by voice,
The in-vehicle device is
A permission command storage step of storing, in the permission command storage means, an operation command to be permitted to a person sitting on the seat in association with information indicating a seat area in the vehicle;
A voice recognition start acceptance step for accepting an operation command input start instruction from a user;
After receiving an instruction to start inputting an operation command from the user in the voice recognition start receiving step, the voice generation position corresponding to the voice signal is specified from the voice signals collected through each of the plurality of microphones, and specified. A sound source position specifying step for outputting the generated position together with an audio signal corresponding to the sound generated from the generated position;
A voice recognition step of recognizing an operation command from the voice signal output in the sound source position specifying step;
The operation command permitted at the sound generation position corresponding to the sound signal output in the sound source position specifying step is extracted from the permission command storage means, and the operation command recognized in the sound recognition step is the extracted operation command. And a command processing step of executing a process corresponding to the operation command recognized in the voice recognition step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007190866A JP2009025715A (en) | 2007-07-23 | 2007-07-23 | In-vehicle device and speech recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007190866A JP2009025715A (en) | 2007-07-23 | 2007-07-23 | In-vehicle device and speech recognition method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009025715A true JP2009025715A (en) | 2009-02-05 |
Family
ID=40397547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007190866A Pending JP2009025715A (en) | 2007-07-23 | 2007-07-23 | In-vehicle device and speech recognition method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009025715A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015526753A (en) * | 2012-06-15 | 2015-09-10 | 本田技研工業株式会社 | Scene recognition based on depth |
CN105913844A (en) * | 2016-04-22 | 2016-08-31 | 乐视控股(北京)有限公司 | Vehicle-mounted voice acquisition method and device |
JP2016161754A (en) * | 2015-03-02 | 2016-09-05 | クラリオン株式会社 | Vehicle-mounted device |
WO2017081960A1 (en) * | 2015-11-09 | 2017-05-18 | 三菱自動車工業株式会社 | Voice recognition control system |
CN112309380A (en) * | 2019-07-26 | 2021-02-02 | 北京新能源汽车股份有限公司 | Voice control method, system and equipment and automobile |
JP2021028650A (en) * | 2019-08-09 | 2021-02-25 | トヨタ自動車株式会社 | Voice operation device |
JP2022087109A (en) * | 2020-10-07 | 2022-06-09 | グーグル エルエルシー | Multi-factor authentication and access control in vehicular environment |
US20230052913A1 (en) | 2017-10-03 | 2023-02-16 | Google Llc | Multi-factor authentication and access control in a vehicular environment |
-
2007
- 2007-07-23 JP JP2007190866A patent/JP2009025715A/en active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015526753A (en) * | 2012-06-15 | 2015-09-10 | 本田技研工業株式会社 | Scene recognition based on depth |
JP2016161754A (en) * | 2015-03-02 | 2016-09-05 | クラリオン株式会社 | Vehicle-mounted device |
WO2017081960A1 (en) * | 2015-11-09 | 2017-05-18 | 三菱自動車工業株式会社 | Voice recognition control system |
JP2017090611A (en) * | 2015-11-09 | 2017-05-25 | 三菱自動車工業株式会社 | Voice recognition control system |
CN105913844A (en) * | 2016-04-22 | 2016-08-31 | 乐视控股(北京)有限公司 | Vehicle-mounted voice acquisition method and device |
US20230052913A1 (en) | 2017-10-03 | 2023-02-16 | Google Llc | Multi-factor authentication and access control in a vehicular environment |
US11856399B2 (en) | 2017-10-03 | 2023-12-26 | Google Llc | Multi-factor authentication and access control in a vehicular environment |
CN112309380A (en) * | 2019-07-26 | 2021-02-02 | 北京新能源汽车股份有限公司 | Voice control method, system and equipment and automobile |
CN112309380B (en) * | 2019-07-26 | 2024-02-06 | 北京新能源汽车股份有限公司 | Voice control method, system, equipment and automobile |
JP2021028650A (en) * | 2019-08-09 | 2021-02-25 | トヨタ自動車株式会社 | Voice operation device |
JP2022087109A (en) * | 2020-10-07 | 2022-06-09 | グーグル エルエルシー | Multi-factor authentication and access control in vehicular environment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009025715A (en) | In-vehicle device and speech recognition method | |
JP5832674B2 (en) | Display control system | |
KR101910383B1 (en) | Driver assistance apparatus and vehicle including the same | |
JP2008013044A (en) | On-vehicle display device and method of displaying with on-vehicle display device | |
JP5964332B2 (en) | Image display device, image display method, and image display program | |
JP2006335231A (en) | Display system utilizing agent character display | |
JP2008018798A (en) | Display controlling device, display controlling method, display controlling program, and recording medium which can be read by computer | |
WO2018198614A1 (en) | Recommended driving output device, recommended driving output method and recommended driving output system | |
JP2010134596A (en) | On-vehicle information device and system | |
WO2016084360A1 (en) | Display control device for vehicle | |
CN103917849B (en) | Vehicle navigation apparatus | |
JPWO2018105074A1 (en) | Notification control device and notification control method | |
JP2009073428A (en) | In-vehicle apparatus and system | |
JP2009080041A (en) | On-vehicle device, on-vehicle multimedia system, and program | |
JP2020160180A (en) | Display control device, display control method, and program | |
JP5106756B2 (en) | Recording device and vehicle accident recording method | |
JP2009059229A (en) | Operation support method and operation support system | |
JP2006078357A (en) | Navigation system and navigation method | |
JP2007008354A (en) | Input/output control device | |
CN103818316A (en) | Method for displaying images of reverse view camera system of motor vehicle on display | |
JP4413630B2 (en) | In-vehicle information system | |
JP2007121796A (en) | Display control device | |
JP6717537B2 (en) | Operation restriction control device and operation restriction control method | |
JP5276188B2 (en) | Navigation device, control method, program, and storage medium | |
JP4783770B2 (en) | In-vehicle machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100215 |