JP5002014B2 - 音声入力型装置、音声入力制御方法及び音声入力制御プログラム - Google Patents

音声入力型装置、音声入力制御方法及び音声入力制御プログラム Download PDF

Info

Publication number
JP5002014B2
JP5002014B2 JP2009526295A JP2009526295A JP5002014B2 JP 5002014 B2 JP5002014 B2 JP 5002014B2 JP 2009526295 A JP2009526295 A JP 2009526295A JP 2009526295 A JP2009526295 A JP 2009526295A JP 5002014 B2 JP5002014 B2 JP 5002014B2
Authority
JP
Japan
Prior art keywords
command
voice
commands
storage unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009526295A
Other languages
English (en)
Other versions
JPWO2009019768A1 (ja
Inventor
孝洋 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Publication of JPWO2009019768A1 publication Critical patent/JPWO2009019768A1/ja
Application granted granted Critical
Publication of JP5002014B2 publication Critical patent/JP5002014B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Description

本発明は、音声入力を音声認識し、対応する動作を行う装置に関する。
音声認識機能を有し、音声コマンドを入力することにより対応する動作を実行させることができるナビゲーション装置が知られている(例えば、特許文献1、2を参照)。上記のようなナビゲーション装置では、何かの動作を実行させるために、特定の音声コマンドを用意している。例えば、地図画面のスケールを100mから50mに変更する場合には、ユーザが「詳細」と発話する。このように、ユーザは、所望の動作を実行させるためには、その動作に対応する音声コマンドを記憶する必要がある。
音声コマンドを記憶する場合、ユーザの感覚と、ナビゲーション装置に設定されている音声コマンドの動作との間にズレが生じる場合がある。例えば、地図の「拡大」、「縮小」などは、人によって動作に対する考え方、感覚が逆になる場合がある。このような場合、ナビゲーション装置側の設定がユーザの感覚と逆になっていると、そのユーザにとっては非常に使いにくいことになる。
特開2004−325936号公報 特開2007−17731号公報
本発明が解決しようとする課題としては、上記のようなものが例として挙げられる。本発明は、音声認識機能を有する装置において、ユーザの考え方や感覚と一致するように、音声コマンドに対応する動作を設定することを課題とする。
請求項1に記載の発明は、音声入力型装置であって、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部と、入力された音声コマンドを認識する音声認識手段と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段と、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段と、を備え、前記音声コマンドは、相対する意義を有する相対コマンドを含み、前記コマンド設定手段は、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定することを特徴とする。
請求項3に記載の発明は、音声入力型装置であって、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部と、入力された音声コマンドを認識する音声認識手段と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段と、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段と、を備え、前記音声コマンドは、類似する意義を有する類似コマンドを含み、前記コマンド設定手段は、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定することを特徴とする。
請求項に記載の発明は、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部を有する音声入力型装置において実行される音声入力制御方法であって、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定工程と、入力された音声コマンドを認識する音声認識工程と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御工程と、を備え、前記音声コマンドは、相対する意義を有する相対コマンドを含み、前記コマンド設定工程では、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定することを特徴とする。
請求項5に記載の発明は、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部を有する音声入力型装置において実行される音声入力制御方法であって、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定工程と、入力された音声コマンドを認識する音声認識工程と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御工程と、を備え、前記音声コマンドは、類似する意義を有する類似コマンドを含み、前記コマンド設定工程では、類似コマンドに対し、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定すて対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定することを特徴とする。
請求項に記載の発明は、コンピュータを有する音声入力型装置において実行される音声入力制御プログラムであって、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部、入力された音声コマンドを認識する音声認識手段、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段、として前記コンピュータを機能させ、前記音声コマンドは、相対する意義を有する相対コマンドを含み、前記コマンド設定手段は、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定することを特徴とする。
請求項7に記載の発明は、コンピュータを有する音声入力型装置において実行される音声入力制御プログラムであって、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部、入力された音声コマンドを認識する音声認識手段、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段、として前記コンピュータを機能させ、前記音声コマンドは、類似する意義を有する類似コマンドを含み、前記コマンド設定手段は、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定することを特徴とする。
本発明を適用したナビゲーション装置の構成を示すブロック図である。 音声入力制御に関連する構成要素のブロック図である。 音声コマンド設定時の表示画面例である。 コマンド動作を説明するアニメーションの例である。 音声コマンド設定処理のフローチャートである。 音声コマンド実行処理のフローチャートである。
10 自立測位装置
20 システムコントローラ
22 CPU
36 データ記憶ユニット
40 表示ユニット
60 入力装置
65 マイク
100 ナビゲーション装置
101 音声認識部
102 表示制御部
103 コマンド設定部
104 コマンド記憶部
105 動作制御部
本発明の好適な実施形態では、音声入力型装置は、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部と、入力された音声コマンドを認識する音声認識手段と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段と、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段と、を備え、前記音声コマンドは、相対する意義を有する相対コマンドを含み、前記コマンド設定手段は、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定する。
音声入力型装置は、ナビゲーション装置の他、音声入力により操作可能な多種の機器に適用される。コマンド記憶部には音声コマンドと、それに対応する動作とが対応付けて記憶される。コマンド設定手段は、ユーザの入力に基づいて、音声コマンドと、それに対応する動作とをコマンド記憶部に記憶する。ユーザの発話により音声コマンドが入力されると、その音声コマンドが認識され、コマンド記憶部を参照して当該音声コマンドに対応する動作が実行される。よって、ユーザは、各音声コマンドに対して、自分の考え方や感覚に合った動作を設定することができる。また、相対コマンドの場合には、ユーザが一方を設定すれば、他方は自動的に設定される。
上記の音声入力型装置の一態様では、前記コマンド設定手段は、前記音声コマンドとして前記相対コマンドのいずれかが入力された場合において入れ替えの入力がユーザになされたときには、当該相対コマンドについて対応する動作の設定を逆にする。これにより、実際に音声コマンドを入力したときに、音声コマンドの設定が自分の考え方や感覚に合っているか否かを確認し、必要に応じて容易に修正することが可能となる
本発明の他の好適な実施形態では、音声入力型装置は、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部と、入力された音声コマンドを認識する音声認識手段と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段と、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段と、を備え、前記音声コマンドは、類似する意義を有する類似コマンドを含み、前記コマンド設定手段は、類似コマンドに対して対応する動作を設定する際には、類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定する。これにより、ユーザは、類似コマンドを含む各音声コマンドに対して、自分の考え方や感覚に合った動作を設定することができる。
本発明の他の好適な実施形態では、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部を有する音声入力型装置において実行される音声入力制御方法は、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定工程と、入力された音声コマンドを認識する音声認識工程と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御工程と、を備え、前記音声コマンドは、相対する意義を有する相対コマンドを含み、前記コマンド設定工程では、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定する。この方法によれば、ユーザは、各音声コマンドに対して、自分の考え方や感覚に合った動作を設定することができる。また、相対コマンドの場合には、ユーザが一方を設定すれば、他方は自動的に設定される。
本発明の他の好適な実施形態では、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部を有する音声入力型装置において実行される音声入力制御方法では、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定工程と、入力された音声コマンドを認識する音声認識工程と、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御工程と、を備え、前記音声コマンドは、類似する意義を有する類似コマンドを含み、前記コマンド設定工程では、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定する。この方法によれば、ユーザは、類似コマンドを含む各音声コマンドに対して、自分の考え方や感覚に合った動作を設定することができる。
本発明の他の好適な実施形態では、コンピュータを有する音声入力型装置において実行される音声入力制御プログラムは、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部、入力された音声コマンドを認識する音声認識手段、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段、として前記コンピュータを機能させ、前記音声コマンドは、相対する意義を有する相対コマンドを含み、前記コマンド設定手段は、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定する。このプログラムをコンピュータに実行させることにより、ユーザは、各音声コマンドに対して、自分の考え方や感覚に合った動作を設定することができる。また、相対コマンドの場合には、ユーザが一方を設定すれば、他方は自動的に設定される。
本発明の他の好適な実施形態では、コンピュータを有する音声入力型装置において実行される音声入力制御プログラムは、音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部、入力された音声コマンドを認識する音声認識手段、前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段、ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段、として前記コンピュータを機能させ、前記音声コマンドは、類似する意義を有する類似コマンドを含み、前記コマンド設定手段は、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定する。このプログラムをコンピュータに実行させることにより、ユーザは、類似コマンドを含む各音声コマンドに対して、自分の考え方や感覚に合った動作を設定することができる。
上記の音声入力制御プログラムは記憶媒体に記憶して取り扱うことができる。
以下、図面を参照して本発明の好適な実施例について説明する。
[ナビゲーション装置]
図1に、ナビゲーション装置100の構成を示す。図1に示すように、ナビゲーション
装置100は、自立測位装置10、GPS受信機18、システムコントローラ20、ディスクドライブ31、データ記憶ユニット36、通信用インタフェース37、通信装置38、表示ユニット40、音声出力ユニット50、入力装置60及びマイク65を備える。
自立測位装置10は、加速度センサ11、角速度センサ12及び距離センサ13を備える。加速度センサ11は、例えば圧電素子からなり、車両の加速度を検出し、加速度データを出力する。角速度センサ12は、例えば振動ジャイロからなり、車両の方向変換時における車両の角速度を検出し、角速度データ及び相対方位データを出力する。距離センサ13は、車両の車輪の回転に伴って発生されているパルス信号からなる車速パルスを計測する。
GPS受信機18は、複数のGPS衛星から、測位用データを含む下り回線データを搬送する電波19を受信する。測位用データは、緯度及び経度情報等から車両の絶対的な位置を検出するために用いられる。
システムコントローラ20は、インタフェース21、CPU22、ROM23及びRAM24を含んでおり、ナビゲーション装置100全体の制御を行う。
インタフェース21は、加速度センサ11、角速度センサ12及び距離センサ13並びにGPS受信機18とのインタフェース動作を行う。そして、これらから、車速パルス、加速度データ、相対方位データ、角速度データ、GPS測位データ、絶対方位データ等をシステムコントローラ20に入力する。CPU22は、システムコントローラ20全体を制御する。ROM23は、システムコントローラ20を制御する制御プログラム等が格納された図示しない不揮発性メモリ等を有する。RAM24は、入力装置60を介して使用者により予め設定された経路データ等の各種データを読み出し可能に格納したり、CPU22に対してワーキングエリアを提供したりする。
システムコントローラ20、CD−ROMドライブ又はDVD−ROMドライブなどのディスクドライブ31、データ記憶ユニット36、通信用インタフェース37、表示ユニット40、音声出力ユニット50及び入力装置60は、バスライン30を介して相互に接続されている。
ディスクドライブ31は、システムコントローラ20の制御の下、CD又はDVDといったディスク33から、音楽データ、映像データなどのコンテンツデータを読み出し、出力する。なお、ディスクドライブ31は、CD−ROMドライブ又はDVD−ROMドライブのうち、いずれか一方としてもよいし、CD及びDVDコンパチブルのドライブとしてもよい。
データ記憶ユニット36は、例えば、HDDなどにより構成され、地図データや施設データなどのナビゲーション処理に用いられる各種データを記憶する。
通信装置38は、例えば、FMチューナやビーコンレシーバ、携帯電話や専用の通信カードなどにより構成され、通信用インタフェース37を介して、VICS(Vehicle Information Communication System)センタから配信される渋滞や交通情報などの道路交通情報、その他の情報を受信する。
表示ユニット40は、システムコントローラ20の制御の下、各種表示データをディスプレイなどの表示装置に表示する。具体的には、システムコントローラ20は、データ記憶ユニット36から地図データを読み出す。表示ユニット40は、システムコントローラ20によってデータ記憶ユニット36から読み出された地図データを、ディスプレイなどの表示画面上に表示する。表示ユニット40は、バスライン30を介してCPU22から送られる制御データに基づいて表示ユニット40全体の制御を行うグラフィックコントローラ41と、VRAM(Video RAM)等のメモリからなり即時表示可能な画像情報を一時的に記憶するバッファメモリ42と、グラフィックコントローラ41から出力される画像データに基づいて、液晶、CRT(Cathode Ray Tube)等のディスプレイ44を表示制御する表示制御部43と、ディスプレイ44とを備える。ディスプレイ44は、例えば対角5〜10インチ程度の液晶表示装置等からなり、車内のフロントパネル付近に装着される。
音声出力ユニット50は、システムコントローラ20の制御の下、CD又はDVDなどのディスク33、若しくはRAM24等からバスライン30を介して送られる音声デジタルデータのD/A変換を行うD/Aコンバータ51と、D/Aコンバータ51から出力される音声アナログ信号を増幅する増幅器(AMP)52と、増幅された音声アナログ信号を音声に変換して車内に出力するスピーカ53とを備えて構成されている。
入力装置60は、各種コマンドやデータを入力するための、キー、スイッチ、ボタン、リモコン、音声入力装置等から構成されている。入力装置60は、車内に搭載された当該車載用電子システムの本体のフロントパネルやディスプレイ44の周囲に配置される。また、ディスプレイ44がタッチパネル方式である場合には、ディスプレイ44の表示画面上に設けられたタッチパネルも入力装置60として機能する。
マイク65は運転席近傍に設けられ、ユーザが発話する音声を集音し、対応する音声信号をシステムコントローラ20へ供給する。
[機能構成]
図2は、ナビゲーション装置100の構成要素のうち、本発明の音声入力制御に関連のある構成要素の機能ブロック図を示す。図示のように、ナビゲーション装置100は、機能面では、主として音声認識部101と、表示制御部102と、コマンド設定部103と、コマンド記憶部104と、動作制御部105と、を備える。なお、これらの構成要素は、実際には、予め用意されたプログラムを、システムコントローラ20のCPU22が実行することにより実現される。
音声認識部101は、ユーザにより入力された音声コマンドを音声認識する。具体的には、ユーザが発話した音声は、マイク65により集音され、音声信号として音声認識部101へ入力される。音声認識部101は既知のアルゴリズムを用いて、入力された音声コマンドを認識する。
コマンド記憶部104は、音声コマンドに対応する動作(以下、「コマンド動作」とも呼ぶ。)を記憶している。例えば、音声コマンド「拡大」、「縮小」に対して、地図のスケールを変更する動作を対応付けて記憶している。
コマンド設定部103は、ユーザの選択に応じて、音声コマンドに対応するコマンド動作を設定する。コマンド設定時には、表示制御部102がコマンド動作説明画面を表示する。
図3(a)は、ディスプレイ44に表示される音声コマンド設定メニューの例を示す。本例では、音声コマンド設定メニューは音声コマンドリスト115と、設定終了ボタン116とを含む。音声コマンドリスト115は、設定の対象となる複数の音声コマンドをリスト表示している。設定終了ボタン116は、音声コマンドの設定モードを終了する際にユーザにより選択される。
この画面で、ユーザは、音声コマンドリストから設定の対象となる音声コマンドを選択する。いま、ユーザが音声コマンドとして「拡大」を選択したとすると、図3(b)に例示するコマンド動作説明画面が表示される。コマンド動作説明画面では、その音声コマンドに対して設定可能なコマンド動作の説明がアニメーションなどによりわかりやすく示される。この例では、音声コマンド「拡大」に対応するコマンド動作として、画像112に示すように地図スケールを詳細にする動作と、画像113に示すように地図スケールを広域にする動作とが選択可能となっている。ユーザが画像112を選択すると、表示制御部102は、図4(a)に示すように、ディスプレイ44上で地図スケールを詳細にするアニメーションを行う。一方、ユーザが画像113を選択すると、表示制御部102は、図4(b)に示すように、ディスプレイ44上で地図スケールを広域にするアニメーションを行う。こうして、ユーザは、音声コマンド「拡大」に対応して設定可能なコマンド動作を用意に理解し、自分の考え方や感覚に合ったものを設定することができる。ユーザが音声コマンドに対して設定したコマンド動作は、コマンド記憶部104に記憶される。
なお、上記の例では、ユーザが図3(b)に示す画像112を選択すると図4(a)及び図4(b)に例示するようなアニメーションが実行されることとしている。その代わりに、図3(b)に示すコマンド動作説明画面が表示された時点で、ユーザによる選択が無くても図4(a)及び図4(b)に例示するようなアニメーションが実行されることとしてもよい。
動作制御部105は、実際のナビゲーション装置100の使用時に、ユーザから音声コマンドが入力されると、その音声コマンドに対応するコマンド動作を実行する。例えば、上記のように音声コマンド「拡大」が入力されると、コマンド記憶部104を参照して音声コマンド「拡大」に対応するコマンド動作を読み出し、ナビゲーション装置100上でその動作を実行する。
[音声入力制御]
次に、音声コマンドについて例を挙げて説明する。ナビゲーション装置100において使用される音声コマンドには種々のものがあるが、本発明は音声コマンドとそれに対応するコマンド動作との関係が個々のユーザの考え方や感覚によって異なる場合に特に有効となる。そのような音声コマンドとしては特に「相対コマンド」と「類似コマンド」とが挙げられる。
「相対コマンド」とは、相対する意義を有するコマンドであり、例えば「拡大」と「縮小」、「上」と「下」、「右」と「左」などが挙げられる。特に地図の「拡大」と「縮小」などは人によって考え方や感覚が異なる場合が多く、ナビゲーション装置100側の設定が変えられないと、逆の考え方や感覚を持つユーザには非常に使いにくくなる。
「類似コマンド」とは、相互に類似する複数のコマンド動作に対応する意義を持つコマンドである。例えば音声コマンド「画面分割」は、ナビゲーション装置においては、1画面を2分割して2次元(2D)地図と3次元(3D)地図を同時に表示する動作と、1画面を2分割して地図とTV画像とを同時に表示する動作の両方の意味を持つと考えられる。
本実施例では、人によって考え方や感覚が異なる相対コマンドや類似コマンドについては、各音声コマンドに対してユーザが自分の考え方や感覚に合ったコマンド動作を設定できるように構成している。また、コマンド動作の設定時には、図4に例示するように、コマンド動作をアニメーションなどによりユーザにわかりやすく提示する。
次に、音声コマンド設定処理について説明する。この処理は、システムコントローラ20のCPU22が予め用意されたプログラムを実行し、図2に示す各構成要素として機能することにより行われる。
まず、コマンド設定部103は、ナビゲーション装置100の初回起動時であるか否かを判定する(ステップS101)。初回起動時でない場合(ステップS101;No)、処理は終了する。一方、初回起動時である場合(ステップS101;Yes)、表示制御部102は図3(a)に例示する音声コマンド設定メニューをディスプレイ44に表示する(ステップS102)。
次に、コマンド設定部103はユーザにより音声コマンドが選択されたか否かを判定する(ステップS103)。即ち、図3(a)において、音声コマンドリスト中の「拡大」、「縮小」などのいずれかが選択されたか否かが判定される。音声コマンドが選択されない場合(ステップS103;No)、処理は終了する。一方、音声コマンドが選択された場合(ステップS103;Yes)、表示制御部102は図3(b)に例示するようなコマンド動作説明画面を表示する(ステップS104)。この際、表示制御部102はユーザの入力に応じて図4に例示するようなアニメーション表示も行う。
コマンド動作説明画面の表示中に、コマンド設定部103は、ユーザによりいずれかの動作コマンドの選択がなされたか否かを判定する(ステップS105)。選択がなされると、コマンド設定部103は、選択された動作コマンドの内容をコマンド記憶部104に記憶する(ステップS106)。次に、コマンド設定部103は、ユーザにより設定終了の指示が入力されたか否かを判定する(ステップS107)。本実施例では、コマンド設定部103は、図3(a)に示す設定終了ボタン111が押されたか否かを判定する。設定終了の指示が入力されるまで、ステップS103〜S107が繰り返され、ユーザは希望する全ての音声コマンドに対してコマンド動作を設定することができる。ユーザが設定終了の指示を入力すると(ステップS107;Yes)、音声コマンド設定処理は終了する。
次に、音声コマンド実行処理について説明する。図6は音声コマンド実行処理のフローチャートである。この処理も、システムコントローラ20のCPU22が予め用意されたプログラムを実行し、図2に示す各構成要素として機能することにより行われる。
まず、音声認識部101はユーザによる音声コマンドの入力を検出する(ステップS201)。音声コマンドが入力されると、音声認識部101はその音声コマンドを認識し(ステップS202)、コマンド記憶部203を参照して、認識された音声コマンドに対応するコマンド動作を特定する(ステップS203)。そして、動作制御部105は特定されたコマンド動作を実行する(ステップS204)。
[変形例]
上記のコマンド設定処理では、個々の音声コマンドに対して1つずつコマンド動作を設定しているが、相対コマンドの場合には、いずれか一方が設定されたときに、他方を自動設定するように構成してもよい。例えば、相対コマンド「拡大」及び「縮小」について、ユーザが音声コマンド「拡大」に対して「地図スケールを詳細にする」コマンド動作を設定したときには、音声コマンド「縮小」に対して「地図スケールを広域にする」コマンド動作を自動的に設定することとしてもよい。
また、ユーザが一旦音声コマンドを設定し、音声コマンドの入力を行った際に、その設定が逆であった場合には、その時点で再設定できるように構成してもよい。具体的には、音声コマンドとして相対コマンドが入力された場合には、その音声コマンドに対応する動作を実行するとともに、ディスプレイ44に「入れ替え」ボタンなどを表示する。ユーザが「入れ替え」ボタンを押した場合には、現在の設定を逆にする。例えば、音声コマンド「拡大」に対して「地図スケールを詳細にする」コマンド動作を設定したとする。その後、ユーザは音声入力で「拡大」と発話すると地図スケールは詳細に変更されるが、その動作がユーザの考え方や感覚と逆であった場合、「入れ替え」ボタンを押すことにより、音声コマンド「拡大」には「地図スケールを広域にする」コマンド動作が設定される。これにより、実際に音声コマンドを入力したときに、音声コマンドの設定が自分の考え方や感覚に合っているか否かを確認し、必要に応じて容易に修正することが可能となる。
本発明は、ナビゲーションシステムの他、携帯電話、コンピュータ関連製品、家電製品など、音声入力により操作可能な各種の機器に利用することができる。

Claims (9)

  1. 音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部と、
    入力された音声コマンドを認識する音声認識手段と、
    前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段と、
    ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段と、を備え、
    前記音声コマンドは、相対する意義を有する相対コマンドを含み、
    前記コマンド設定手段は、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定することを特徴とする音声入力型装置。
  2. 前記コマンド設定手段は、前記音声コマンドとして前記相対コマンドのいずれかが入力された場合において入れ替えの入力がユーザになされたときには、当該相対コマンドについて対応する動作の設定を逆にすることを特徴とする請求項1に記載の音声入力型装置。
  3. 音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部と、
    入力された音声コマンドを認識する音声認識手段と、
    前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段と、
    ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段と、を備え、
    前記音声コマンドは、類似する意義を有する類似コマンドを含み、
    前記コマンド設定手段は、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定することを特徴とする音声入力型装置。
  4. 音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部を有する音声入力型装置において実行される音声入力制御方法であって、
    ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定工程と、
    入力された音声コマンドを認識する音声認識工程と、
    前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御工程と、を備え、
    前記音声コマンドは、相対する意義を有する相対コマンドを含み、
    前記コマンド設定工程では、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定することを特徴とする音声入力制御方法。
  5. 音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部を有する音声入力型装置において実行される音声入力制御方法であって、
    ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定工程と、
    入力された音声コマンドを認識する音声認識工程と、
    前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御工程と、を備え、
    前記音声コマンドは、類似する意義を有する類似コマンドを含み、
    前記コマンド設定工程では、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定することを特徴とする音声入力制御方法。
  6. コンピュータを有する音声入力型装置において実行される音声入力制御プログラムであって、
    音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部、
    入力された音声コマンドを認識する音声認識手段、
    前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段、
    ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段、として前記コンピュータを機能させ、
    前記音声コマンドは、相対する意義を有する相対コマンドを含み、
    前記コマンド設定手段は、複数の動作の選択肢から相対コマンドの一方について対応する動作がユーザにより選択されたときには、当該動作を当該相対コマンドの一方に対応する動作に設定するとともに、相対コマンドの他方に対して、当該動作と相対する動作を自動的に設定することを特徴とする音声入力制御プログラム。
  7. 請求項6に記載の音声入力制御プログラムを記憶したことを特徴とする記憶媒体。
  8. コンピュータを有する音声入力型装置において実行される音声入力制御プログラムであって、
    音声コマンドと、当該音声コマンドに対応する動作とを対応付けて記憶するコマンド記憶部、
    入力された音声コマンドを認識する音声認識手段、
    前記コマンド記憶部を参照し、認識された音声コマンドに対応する動作を実行する動作制御手段、
    ユーザの入力に基づいて、前記音声コマンドと前記動作とを対応付けて前記コマンド記憶部に記憶するコマンド設定手段、として前記コンピュータを機能させ、
    前記音声コマンドは、類似する意義を有する類似コマンドを含み、
    前記コマンド設定手段は、類似コマンドに対して対応する動作を設定する際には、当該類似コマンドに対応する動作の全てを前記複数の選択肢に含め、当該複数の選択肢からユーザにより選択された動作を当該類似コマンドに対応する動作に設定することを特徴とする音声入力制御プログラム。
  9. 請求項7に記載の音声入力制御プログラムを記憶したことを特徴とする記憶媒体。
JP2009526295A 2007-08-08 2007-08-08 音声入力型装置、音声入力制御方法及び音声入力制御プログラム Expired - Fee Related JP5002014B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/065528 WO2009019768A1 (ja) 2007-08-08 2007-08-08 音声入力型装置、音声入力制御方法及び音声入力制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2009019768A1 JPWO2009019768A1 (ja) 2010-10-28
JP5002014B2 true JP5002014B2 (ja) 2012-08-15

Family

ID=40341016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009526295A Expired - Fee Related JP5002014B2 (ja) 2007-08-08 2007-08-08 音声入力型装置、音声入力制御方法及び音声入力制御プログラム

Country Status (2)

Country Link
JP (1) JP5002014B2 (ja)
WO (1) WO2009019768A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435663A (zh) * 2020-11-11 2021-03-02 青岛歌尔智能传感器有限公司 命令语音管理方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816348A (ja) * 1994-07-04 1996-01-19 Casio Comput Co Ltd 情報処理装置
JP2003015689A (ja) * 2001-06-28 2003-01-17 Sumitomo Electric Ind Ltd 音声操作装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816348A (ja) * 1994-07-04 1996-01-19 Casio Comput Co Ltd 情報処理装置
JP2003015689A (ja) * 2001-06-28 2003-01-17 Sumitomo Electric Ind Ltd 音声操作装置

Also Published As

Publication number Publication date
WO2009019768A1 (ja) 2009-02-12
JPWO2009019768A1 (ja) 2010-10-28

Similar Documents

Publication Publication Date Title
JP2008013044A (ja) 車載表示装置および車載表示装置の表示方法
JP2009080683A (ja) タッチパネル型表示装置、その制御方法、プログラム及び記憶媒体
JPWO2008084575A1 (ja) 車載用音声認識装置
JP2008014818A (ja) 作動制御装置、プログラム
JP5795386B2 (ja) 表示装置及び制御方法
JP2008308063A (ja) ナビゲーション装置、並びに、表示制御方法及びプログラム
JP6076027B2 (ja) ナビゲーションシステム
JP4926296B2 (ja) ナビゲーション装置、制御方法、プログラム、及び記憶媒体
JP4314927B2 (ja) ナビゲーション装置
JPWO2009028085A1 (ja) 地図表示装置、地図表示方法、及び地図表示プログラム
JP2008046237A (ja) 地図表示装置
JP5002014B2 (ja) 音声入力型装置、音声入力制御方法及び音声入力制御プログラム
JP2009270960A (ja) ナビゲーション装置
JP4575491B2 (ja) ナビゲーション装置及びナビゲーション方法
JP2011095993A (ja) 情報表示装置、情報表示方法、及び情報表示プログラム
JP2005208798A (ja) 情報提供端末、および情報提供方法
JP4932902B2 (ja) ナビゲーション装置、ルート案内方法及びルート案内プログラム
JP5276188B2 (ja) ナビゲーション装置、制御方法、プログラム、及び記憶媒体
JP2007232390A (ja) 情報機器、案内情報提供方法及びプログラム
JP4767263B2 (ja) 地図データ表示装置及び表示制御方法
US20200249823A1 (en) System and method of reordering apps on a user interface
JP2008286755A (ja) 地図画像表示装置
JP2005128791A (ja) 表示装置
JP2014235054A (ja) 表示装置、表示方法及び表示プログラム
JP2009042159A (ja) 音声再生装置、音声再生方法及び音声再生プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120518

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees