JP2004234273A

JP2004234273A - 対話型端末装置及び対話アプリケーション提供方法

Info

Publication number: JP2004234273A
Application number: JP2003021298A
Authority: JP
Inventors: Toshihiro Kujirai; 俊宏鯨井
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2003-01-30
Filing date: 2003-01-30
Publication date: 2004-08-19
Anticipated expiration: 2023-01-30
Also published as: US20040260562A1; US7505910B2; JP4107093B2

Abstract

【課題】本発明の課題は、多数のアプリケーションが同時にシステム上に存在するカーナビゲーションシステムにおいて，誤認識率を減らして使いやすいユーザインタフェースを実現することである。
【解決手段】各アプリケーションの状態に応じて，各グローバルコマンドを有効にしたり，無効にしたりする。
【効果】本発明によれば、多数のアプリケーションが同時にシステム上に存在するカーナビゲーションシステムにおいて，各アプリケーションの状態に応じて適切なグローバルコマンドを有効にすることで，誤認識率を減らし，誤動作を防ぎ，一発声で複数のアプリケーションを実行するなど，使いやすいユーザインタフェースを実現できる。
【選択図】図６

Description

【０００１】
【発明の属する技術分野】
本発明は、複数のアプリケーションを同時に実行可能な音声対話装置に関するものである。
【０００２】
【従来の技術】
複数のアプリケーションが１つのシステム上に同時に存在する場合，アプリケーション自体を同時に実行することは可能であるが，ユーザの観点から見るとユーザが同時操作可能なアプリケーションの数はごく少なく，たいていの場合一つである。特に，音声による対話によって操作を行う場合は，同時にユーザと対話を行うアプリケーションは１つに限ることが望ましい。一方，ユーザが対話中のアプリケーション以外のアプリケーションを操作することを望んだ場合に，そのアプリケーションに対応づけられたコマンドを発声することで，発声されたコマンドに対応したアプリケーションとの対話にシステム状態を移行したり，特定の機能を実行できれば、いちいちメニューに戻ってからアプリケーションを選択するのではなく，直接アプリケーションを音声で操作できてユーザの満足度の観点から重要である。
【０００３】
従来の対話型ユーザインタフェース装置では，ユーザの発声内容が現在実行しているアプリケーション以外に対する発声であることを検知して，現在対話中の音声対話アプリケーションから、発声内容の対象とする音声対話アプリケーションに実行を移すことによって，自然な対話を実現する方法が採られている（例えば、特許文献１参照）。
【０００４】
また，従来のカーナビゲーションシステムは，カーナビゲーションシステムの開発メーカが，そのカーナビゲーションシステムで実行されるすべてのプログラムをあらかじめインストールした状態で販売する形式であった。この場合，どのようなシステムの状態においても，正常に対話が実行されるように調整をすることが可能であった。
【特許文献１】特開２００１−５６６９４号公報
【発明が解決しようとする課題】
現在の音声認識システムは完全ではなく，認識対象となるコマンドの数が多くなるほど認識率が低下する。
よって、例えばカーナビゲーション等に例示されるように端末の機能が高機能化し，より多くのアプリケーションがインストールされるようになった場合，アプリケーションに応じたコマンドの管理が要求されるためその数が非常に多くなり、上述の様に認識率の低下につながる。
【０００５】
また，携帯電話を通じて，インターネットからアプリケーションをダウンロード可能なカーナビゲーションが開発されているが、この様にどのようなアプリケーションがインストールされるか想定できない状態にあっては，システムが取りうる状態をあらかじめ全て数え上げて，それぞれの状態に応じて認識対象となるグローバルコマンドを適切に設定すること、例えば、上記のアプリケーション間の調整を取って管理すべきコマンドの数を減らす等の調整を取ることは不可能である。
【０００６】
よって、本願では、上記の様に、多くの音声対話アプリケーションを管理する装置において認識率を向上し、かつユーザとって使いやすい対話型ユーザインタフェース装置を提供することを課題とする。
【０００７】
【課題を解決するための手段】
上記課題を解決するために、本願の開示する代表的な発明を概説すれば以下の通りである。
【０００８】
本発明の端末装置は，少なくとも，複数のアプリケーションを制御する制御部と、音声入力部と、上記音声入力部を介した入力を音声認識する音声認識エンジンと、ユーザが対話中のアプリケーション以外の上記複数のアプリケーションとの対話を可能とするグローバルコマンドを記録する記録部とから構成される。そして，上記制御部は、上記音声認識結果が上記グローバルコマンドである場合には該グローバルコマンドに対応づけられたアプリケーションを実行し、上記複数の各アプリケーションの状態に応じて上記グローバルコマンドを管理することで，上記の課題を解決する。
【０００９】
【発明の実施の形態】
以下、本願の開示する発明について詳細に説明する。尚，本願において記載する。
【００１０】
グローバルコマンドとは，複数の音声対話アプリケーションのうちユーザと対話を行っているアプリケーション以外のアプリケーション，及び対話を行っているアプリケーションに何らかの動作をさせるために用いられるコマンドである。ユーザが対話中のアプリケーション以外のアプリケーションを操作することを望んだ場合に，そのアプリケーションに対応づけられたコマンドを発声することで，発声されたコマンドに対応したアプリケーションとの対話にシステム状態を移行したり等の機能を実現できる。又、必要に応じて、そのコマンドの端末装置内や，サーバ内での内部表現を意味することもある。
【００１１】
次に、図を用いて、本発明の実施例を説明する。
【００１２】
図１は、対話型端末装置の一実施例である。
端末装置１０は，音声入力部１１と，音声認識エンジン１２と，記録部１３と，制御部１４と，１つないし複数のアプリケーション１５ａ〜ｃで構成されている。
【００１３】
音声入力部１１は，例えば車のサンバイザー部に装着したマイクなどが考えられる。音声認識エンジン１２は，記録部１３に記録されているグローバルコマンドのうち，制御部１４が指定したグローバルコマンドと，対話中のアプリケーション１５がユーザと行っている対話に必要なコマンドであるローカルコマンドを認識対象とし，音声入力部１１によって入力された音声を認識して，どのグローバルコマンドが発声されたかを決定する。
【００１４】
制御部１４は，この音声認識結果を受け取り，グローバルコマンドに対応づけられたアプリケーション１５を実行する。グローバルコマンドとアプリケーション１５の対応付け方法としては，各グローバルコマンドにアプリケーション１５ａ〜ｃのうち対応するアプリケーションを特定するためのＩＤ情報を付与する方法が考えられる。制御部１４は各アプリケーション１５の状態の変化に応じて，各アプリケーションの状態に応じて，音声認識エンジン１２が認識対象すべきグローバルコマンドを指定する。アプリケーションの状態監視については各アプリケーションから動作状態が変化した旨の通知を受けて制御部で管理することができる。又図１３に示す様に監視部１３４を設けて，アプリケーション１３３の動作状態を監視させ、アプリケーション１３３の動作状態が変化した場合に，監視部から制御部１３１に通知する構成をとることもできる。このような構成をとることによって，アプリケーション１３３に制御部１４に状態を通知するための仕組みを設けておく必要がなくなるという効果がある。
【００１５】
制御部のグローバルコマンド管理については、例えば、図２のようなテーブルを記録部１３に持ち，各グローバルコマンドに対応づけて，対応アプリケーションＩＤ（対応アプリＩＤ），グローバルコマンドが有効になるアプリケーション状態，現在グローバルコマンドが有効になっているかどうかのフラグなどの情報を記録し管理する。各アプリケーション１５は，起動されたときや，停止したとき，またユーザとの優先的な対話を行う権利を持ったときなどに，それを制御部１４に通知し，制御部１４は上記フラグを書き換える。
【００１６】
例えば，アプリケーションが停止しているときは，そのアプリケーションを起動させるためにアプリケーションの名前をグローバルコマンドとして有効にしておき，起動された後では，より具体的な操作を可能とするために複数の操作コマンドが有効になり，先に有効となっていたアプリケーションの名前はグローバルコマンドとして無効になるといった使い方が考えられる。
【００１７】
尚、各アプリケーションの動作状態を表現する方法はいろいろ考えられるが，例えば、インストールされているが起動はされていない状態，起動されているがユーザと対話は行っていない状態，ユーザと対話を行っている状態のそれぞれでは，必要とされるグローバルコマンドが大きく異なる上に，アプリケーションの種類によらず普遍的な状態であることからこのような動作状態の変化に応じてグローバルコマンドを管理すれば良い。
【００１８】
グローバルコマンドは音声認識のための文法として標準的なＳＲＧＦ（ＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎＧｒａｍｍａｒＦｏｒｍａｔ）で記述することが考えられる。この場合，文法を直接記述する場合や文法を記述したファイル名を記述する。
【００１９】
図３に，この端末装置の制御フローを記す。
音声認識が実行（３０）された後，認識結果が正常であるかどうかを調べる（３１）。認識結果が正常ではなかった場合，エラー処理が行われる（３５）。エラー処理としては，ユーザに発声を促すガイダンスを出力して再び処理３０に戻るというような処理が考えられる。認識結果が正常であった場合，認識結果が現在対話中のアプリケーションに対する対話コマンドであるローカルコマンドに対応しているかどうかを判定する（３２）。ローカルコマンドだった場合，，該ローカルコマンドに対応づけられた現在対話中のアプリケーションの処理を実行する（３６）。認識結果がローカルコマンドでなかった場合，それはグローバルコマンドであるとして，グローバルコマンドに対応するすべてのアプリケーションのＩＤを図２のようなテーブルから参照し取得する（３３）。そして，取得したＩＤに対応したアプリケーションそれぞれに対して，認識されたグローバルコマンドに対応づけられた処理の実行を命令する（３４）。
【００２０】
このような制御フローにより，ローカルコマンドとグローバルコマンドに同じコマンドがあった場合，ローカルコマンドが優先されて実行される。これによって，対話中のアプリケーションに対する対話コマンドと同じ対話コマンドが他のアプリケーションのグローバルコマンドであった場合に，対話の流れを損なうことなく，対話中のアプリケーションとの対話を続けることができる効果が得られる。
【００２１】
ユーザのグローバルコマンド発声に対して実際の処理を行うため，各グローバルコマンドに対応した処理情報が必要となる。グローバルコマンドに対応した機能を表す情報は，記録部１３に保持することも考えられるが，アプリケーション１５に保持することが望ましい。各アプリケーション１５に図１４のようなテーブルを付与し，各アプリケーション１５の現在の状態と，ユーザが発声したコマンドに対応した機能を表す情報を記録しておくことが考えられる。
【００２２】
以上の構成をとることで、制御部は入力されたグローバルコマンドに対応づけられたアプリケーションに実行命令を通知することで、処理が実行される。
【００２３】
各アプリケーションの取りうる状態の数は，システム全体が取りうる状態の数に比べて小さいため，各アプリケーションの状態と認識対象となるグローバルコマンドを対応づけて管理することで，効率的な管理が可能になる。このようにアプリケーションの状態に応じて認識対象となるグローバルコマンドを変えることにより，一度に認識対象となるコマンドの数が減るため，処理量を減らすことが出来るだけでなく，状況にそぐわないコマンドが誤認識によって実行されてしまうことも防ぐという効果が得られる。
【００２４】
グローバルコマンドとアプリケーション１５の対応付けは１対１に限られたものではなく，１つのアプリケーション１５が複数のグローバルコマンドを持つことも考えられるし，１つのグローバルコマンドが複数のアプリケーション１５に対応づけられており，ユーザの１回の発声で複数のアプリケーション１５を同時に実行させることも考えられる。例えば図２に示す例の場合、「しゅうへんじょうほうけんさく」というコマンドはアプリケーションＩＤが２及び５のアプリケーション１５に対応づけられている。
【００２５】
更に、上述のように、図１４（ｂ）テーブルをアプリケーション１５で保持することで，グローバルコマンドに対応づけられたアプリケーション１５が複数あった場合でも，それぞれのアプリケーション１５が別の機能を実行できるというメリットがある。例えば，「目的地設定」というグローバルコマンドが発声された場合であっても，該コマンドに目的地設定アプリと渋滞情報アプリが対応づけられていた場合、目的地設定アプリはユーザとの対話を開始し、渋滞情報アプリは周辺の渋滞情報を取得して準備するといったことが可能となる。
【００２６】
また，異なるアプリケーションが同じグローバルコマンドを持つ場合でも，対話中の状態にそれらのグローバルコマンドを対応づけておくことで，ユーザと対話中のアプリケーション１５だけが，ユーザに要求された処理を行うことができる。例えば図４においては、ヘルプというコマンドはアプリケーションＩＤ１及び３に対応づけられている。現在対話中の状態にあるのはアプリケーションＩＤが１のアプリケーション１５であり，それに対応したＩＤ番号１のグローバルコマンドのフラグだけが有効になっている。従って，ユーザが「ヘルプ」と発声した場合，アプリケーションＩＤが１のアプリケーション１５のヘルプ処理が実行される。
【００２７】
本発明の構成においては，対話中のアプリケーションに対してもローカルコマンドとは別にグローバルコマンドも利用することができる。対話中のアプリケーション１５は，ユーザにガイダンスを出すなどしてユーザの次の発声を誘導することが望ましく，ローカルコマンドは誘導されたユーザ発声を認識対象として設計することが望ましい。一方，ユーザは上記のような誘導とは関係なく，操作に迷ったときにヘルプを呼び出す可能性がある。ローカルコマンドが対話の流れによって時々刻々と変化していくのに比べて，対話の流れとは無関係なコマンドは変化の頻度が少ない。そこでローカルコマンドとは別にグローバルコマンドとして管理するのが効率的である。
【００２８】
以上によって，本発明では，複数のアプリケーションがシステム上に存在する場合に，各アプリケーションの状態に応じて，グローバルコマンドを管理する対話型端末装置を提供することができる。
【００２９】
尚、上記の実施例では，グローバルコマンドを記録しておく記録部１３と，音声認識エンジン１２は，システム中に一つしか存在しなかったが，本発明はこのような構成に限定されるものではなく，図５の端末装置５０のように，複数の音声認識エンジン５１と記録部５３を持ち，各アプリケーション１５と対応づけることも考えられる。この場合，制御部５２では複数の認識結果を音声認識エンジン５１から受け取ることになる。このとき制御部５２がどの認識結果を用いるべきかを決定するために，音声認識エンジン５１が認識結果にスコア情報を付与することが考えられる。
【００３０】
このような構成にすることにより，各認識エンジン５１を認識対象とするグローバルコマンドの種別毎に特化し，処理効率を上げると共に認識率を高めることができる。例えば，認識エンジン５１ａでは連続単語認識を行い，認識エンジン５２ａでは連続数字認識を行い，認識エンジン５３ａでは地名認識を行うといった使い方が考えられる。
【００３１】
図６は，対話型端末装置の第３の実施例である。
この端末装置６０は，音声入力部１１と，音声認識エンジン６７と，入力部６１と，記録部６２と，通信部６３と，制御部６５と，１つないし複数のアプリケーション６６で構成されている。
【００３２】
図１で記した実施例に対して，図４に記した実施例では，新たに入力部６１と通信部６３が構成要素として追加されている。通信部６３によって，端末装置６０は外部のサーバ６４にアクセスし，アプリケーション６６をダウンロードすることが可能になる。ダウンロードの仕組みは，例えばＯＳＧｉ（ＯｐｅｎＳｅｒｖｉｃｅｓＧａｔｅｗａｙＩｎｉｔｉａｔｉｖｅ）の仕様に基づいた方式を用いることができる。
【００３３】
尚、音声認識エンジン６７や，制御部６５も端末装置６０で実行される実行プログラムとして構成することが考えられる。この場合，これらの実行プログラムの改良版が開発された場合も，通信部６３を通じてダウンロードし，従来のものと置き換えることで，端末装置６０をアップデートすることも可能である。
【００３４】
このような方法によって，ユーザは端末装置を購入した後に作成されたアプリケーション６６を利用することができたり，より性能の高い音声認識エンジン６７を利用することができるようになる。また，このようなアップデート機能によって，ユーザは端末装置を頻繁に買い換える必要がなくなるというメリットもある。
【００３５】
ダウンロードされたアプリケーション６６には，グローバルコマンドに関する情報を含めておくことが望ましい。アプリケーション６６にグローバルコマンドに関する情報を含めておくことで，ダウンロードされたアプリケーション６６に関してもあらかじめインストールされているアプリケーション６６と同様に音声対話によって操作が可能になるからである。
【００３６】
この場合、例えばグローバルコマンドに関する情報は，図７のように，グローバルコマンドに関する情報を，アプリケーション１５の状態に応じて分類して、上記アプリケーションプログラムの情報ヘッダ等に格納しておく。
【００３７】
図８に，アプリケーション６６がダウンロードされた場合の，端末装置の処理フローの一例を示す。制御部６５は，アプリケーション６６が通信部６３を通じてダウンロードされるのを監視する（８０）。ダウンロードは例えば端末装置の入力手段を介したユーザからの要求指示に応じてサーバから送られてきてもよいし、サーバから自動的に送信されてくることもある。アプリケーション６６がダウンロードされた場合，そのアプリケーション６６が保持しているグローバルコマンドに関する情報を，図２のような管理テーブルに追加する（８１）。アプリケーション６６が保持しているグローバルコマンドに関する情報には，各グローバルコマンドが有効か無効かに関する情報は含まれていないため，追加したグローバルコマンドが全て無効になるように管理テーブルを書き換える（８２）。その後で，インストール時登録に分類されているグローバルコマンドが有効になるように，管理テーブルを書き換える（８３）。
【００３８】
以上の動作をアプリケーションダウンロード時に行うことによって，起動時登録グローバルコマンドや，対話時登録グローバルコマンドに関しては，記録部６２への記録はインストール時に行われるが，実際に認識対象としてのフラグが立てられるのは，アプリケーション６６が状態の変化を制御部６５に通知した場合となる。
【００３９】
図１６は，上記実施例を実施する音声対話アプリケーション提供のためのシステム構成の一実施例である。
複数の端末装置１６０と，サーバ１６２はネットワーク１６１を介して接続されている。サーバ１６２には，音声対話アプリケーション１６３が例えばＨＤＤ装置などによって記録されている。音声対話アプリケーション１６３は，図５で説明したようにアプリケーションの状態によって分類されたグローバルコマンドと関連づけられており，これらのグローバルコマンドも同様にＨＤＤ装置などに記録されている。端末装置１６０から，音声対話アプリケーション１６３のダウンロードをネットワーク１６１を介して要求した場合，サーバ１６２は，音声対話アプリケーション１６３とそれに関連づけられたグローバルコマンドを端末装置１６０に送信する。
【００４０】
次にグローバルコマンドの編集について説明する。ユーザによって利用するアプリケーションの機能は異なるため，利用されるコマンドはユーザに依存するのが普通である。起動時登録コマンドの中でも，ユーザがほとんど利用しないコマンドがある場合，ユーザが明示的に認識対象から除外することで，システムの誤動作の可能性を低くすることが可能となる。また，一部のユーザしか頻繁に利用しないと考えられるコマンドを，最初から起動時登録コマンドに分類してしまうと，コマンドの数が多くなってしまい，認識率が低下することが考えられる。このような場合を想定して，図９のように，ユーザカスタマイズグローバルコマンドという分類を設けておくことが考えられる。この分類のコマンドは，デフォルトではアプリケーション６６の状態によって認識対象とせず，ユーザが明示的に認識対象として設定することを想定している。ユーザは入力部６１によって，記録部６２に記録されている図１０のような管理テーブルを編集し，各グローバルコマンドを認識対象とするかどうかを決定する。入力部６１としては，リモコンやタッチパネルなどを利用することが考えられる。
【００４１】
図１１に，ユーザがグローバルコマンドを編集する場合の端末装置の表示画面の一例を示す。グローバルコマンドを編集する画面（図１１ａ）から，リモコンの上下ボタンなどによってグローバルコマンドを編集するアプリケーション６６を選択し決定ボタンなどを押すと，選択したアプリケーション６６に対応したグローバルコマンドのリストが表示される（図１１ｂ）。このうち編集可能なグローバルコマンドから、リモコンの上下ボタンなどによって編集対象を選択し，決定ボタンを押すと「設定」の欄が「自動」「ＯＮ」「ＯＦＦ」のように切り替わる。
【００４２】
自動に設定した場合，図１１の画面の「起動用」「実行中」「対話中」の各状態に対応づけられたＯＮ・ＯＦＦの情報に従ってグローバルコマンドが有効になるかどうかが決まる。これがデフォルトの状態である。一方，「設定」の欄を「ＯＮ」に設定した場合には，アプリケーション６６の状態にかかわらず，そのグローバルコマンドは常に有効となる。同様に，「ＯＦＦ」に設定した場合は常に無効となる。
【００４３】
上記の例では，ユーザが「ＯＮ」または「ＯＦＦ」に設定したグローバルコマンドはアプリケーション６６の状態にかかわらず，有効かどうかが決まっているが，図１２のような画面で各アプリケーション状態に対応したフラグを変更するようにして，図２のような管理テーブルの「状態」の欄を書き換えれば，アプリケーション状態に応じた文法の有効・無効をユーザが決定できるようにすることも可能である。さらに新たにコマンドを追加設定できるようにすることも考えられる。これによりよりユーザの嗜好を反映した使いやすい端末が実現できる。
【００４４】
図１３は，対話型端末装置の第４の実施例である。
この端末装置１３０は，図１の端末装置１０に加えて入力部１３２と監視部１３４が追加された構成となっている。入力部１３２は，ユーザがシステムとの対話を希望していることを通知するためのものであり，例えばハンドルに取り付けたスイッチなどで実現される。
【００４５】
ユーザがシステムと対話を開始するとき，現在の音声技術のレベルでは，なんらかの入力によって対話を開始することをシステムに伝えることが音声認識率向上のためにも有効である。また，ユーザはグローバルコマンドに関する知識を持っていない場合も考えられるので，ユーザからの対話開始を伝える入力があった場合に，システム側からガイダンスを流して対話を誘導することも考えられる。このとき対話を開始するアプリケーションは，状況に応じて１つに決めておくことが望ましく，このアプリケーションを「対話中」の状態であるとする。
制御部１３１は，入力部１３２からの入力に応じて，「対話中」の状態にあるアプリケーション、例えば１３３ａにユーザとの対話を開始するように通知する。通知を受けたアプリケーション１３３ａは，ユーザに発声を促すためのガイダンスを出力するなどして，対話を開始する。
【００４６】
一方、システムに慣れたユーザはシステム側のガイダンスを遮ってグローバルコマンドを発声することで，速やかな操作性を希望することが考えられる。ガイダンスを遮る方法としては，グローバルコマンドの発声自体を検出する方式も考えられるが，より確実な方法としてガイダンスを遮るための入力をシステムにユーザが与えることで，ガイダンスが停止し，ユーザの音声入力待ちの状態になることで，システムに慣れたユーザの満足度を向上できる。ガイダンスを遮るための入力は，対話を開始することをシステムに伝える図１３に記載の入力部１３２で兼用することが可能であるが，別の入力部を設けても良い。別の入力部としては，ハンドルにスイッチを２つ取り付け，片方を入力部１３２として利用し，もう片方をこの目的に利用することが考えられる。
例えばカーナビを想定すると走行中の車内など騒音レベルの高い環境では，音声入力は誤動作を引き起こす可能性があるため、本構成により確実な処理を行えるという効果が得られる。
【００４７】
ユーザがグローバルコマンドを発声して，対話中のアプリケーション１３３ａ以外のアプリケーション１３３ｂを操作する場合，常にそのアプリケーション１３３ｂに対話を移す必要はなく，ユーザが所望の動作をそのアプリケーション１３３ｂが行いさえすれば，対話自体はもとのアプリケーション１３３ａと続けた方がいい場合がある。このような状況に対して，アプリケーション１３３にコマンドに対応した処理を実行後にユーザとの対話を開始するかどうかを判定するための情報を持たせておくことが考えられる。本発明では，上記のような状況を可能にする情報、つまりコマンド指示を受けた場合にその後の対話を該アプリケーションに移行するかの優先を決定する情報を優先度と呼ぶ。
具体的には，図１５のように図１４（ｂ）のテーブルに優先度の情報を追加したテーブルを，各アプリケーションに保持しておく。ユーザが発声したグローバルコマンドに対応した機能を実行した後に，この優先度情報に応じて，ユーザとの対話を行うかどうかを決定することができる。
【００４８】
例えば、図１５に示すコマンドを管理するアプリケーション１３３ｂが起動状態にあり、さらに、ＶＯＬＵＭＥＵＰのコマンドがアプリケーション１３３ｂのグローバルコマンドとして登録されて有効になっているとする。この状態でＶＯＬＵＭＥＵＰのコマンドが発声されると、制御部１３１は，ＶＯＬＵＭＥＵＰコマンドに対応したアプリケーション１３３ｂにＶＯＬＵＭＥＵＰコマンドの実行を命令する。アプリケーション１３３ｂは，図１５のテーブルを参照して，ＶＯＬＵＭＥＵＰコマンドに対応した，ボリュームを１段階上げるという動作を実行する。この処理に際して，アプリケーション１３３ｂは優先度に関する情報も参照し，この場合優先度が低いため，アプリケーション１３３ｂの状態は「起動」のまま変化せず，ユーザとの対話は行われない。従って，ユーザが再び入力部１３２によって対話の開始を通知した場合，もとのアプリケーション１３３ａが対話を開始することになる。
【００４９】
一方，上記の状況でＳＥＬＥＣＴのコマンドが発声された場合，アプリケーション１３３ｂは優先度に関する情報を参照し，優先度が高いのでアプリケーションの状態は「対話中」になり，制御部１３１に状態の変化を通知する。さらにアプリケーション１３３ｂはＤＩＡＬＯＧ（ＳＥＬＥＣＴ）という処理を実行する。この例では，曲名の選択を行うためのユーザとの対話を行うことを想定している。
【００５０】
この例では，アプリケーション１３３の状態に関する情報や，優先度に関する情報はテーブルに記録してあり，これを参照するものとして説明したが，どちらの情報も利用者の利用状態に応じて変化する。例えば本端末装置がカーナビで有る場合には、，テーブルから参照するのではなく，必要なときに走行状態の情報などからその場で，どのアプリケーション１３３が「対話」状態になるべきかを決めたり，コマンドが発声された後で対話を行うかを決めたりすることも考えられる。
【００５１】
【発明の効果】
本発明によれば、多数のアプリケーションが同時にシステム上に存在するカーナビゲーションシステムにおいて，各アプリケーションの状態に応じて適切なグローバルコマンドを有効にすることで，誤認識率を減らし，誤動作を防ぎ，一発声で複数のアプリケーションを実行するなど，使いやすいユーザインタフェースを実現できる。
【図面の簡単な説明】
【図１】対話型端末装置の一実施例を説明する構成図。
【図２】グローバルコマンドの管理テーブルの一実施例を説明する図。
【図３】音声認識結果の処理の一実施例を説明する流れ図。
【図４】グローバルコマンドの管理テーブルの一実施例を説明する図
【図５】対話型端末装置の一実施例を説明する構成図。
【図６】対話型端末装置の一実施例を説明する構成図。
【図７】グローバルコマンドの分類の一実施例を説明する図。
【図８】アプリケーションダウンロード時の処理の一実施例を説明する流れ図。
【図９】グローバルコマンドの分類の一実施例を説明する図。
【図１０】ユーザカスタマイズ可能なグローバルコマンド管理テーブルの一実施例を説明する図。
【図１１】グローバルコマンド編集画面の一実施例を説明する図。
【図１２】グローバルコマンド編集画面の一実施例を説明する図。
【図１３】対話型端末装置の一実施例を説明する構成図。
【図１４】アプリケーションが保持する情報の一実施例を説明する図。
【図１５】アプリケーションが保持する情報の一実施例を説明する図。
【図１６】音声対話アプリケーション提供方法の一実施例を説明する構成図。
【符号の説明】
１０・・・端末装置
１１・・・音声入力部
１２・・・音声認識エンジン
１３・・・記録部
１４・・・制御部
１５・・・アプリケーション
５０・・・端末装置
５１・・・音声認識エンジン
５２・・・制御部
５３・・・記録部
６０・・・端末装置
６１・・・入力部
６２・・・記録部
６３・・・通信部
６４・・・サーバ
６５・・・制御部
６６・・・アプリケーション
１３０・・・端末装置
１３１・・・制御部
１３２・・・入力部
１３３・・・アプリケーション
１３４・・・監視部
１６０・・・端末装置
１６１・・・ネットワーク
１６２・・・サーバ
１６３・・・アプリケーション。

Claims

複数の音声対話アプリケーションを制御する制御部と、
音声入力部と、
上記音声入力部を介した入力を音声認識する音声認識エンジンと、
対話中のアプリケーション及び該対話中のアプリケーション以外の上記複数のアプリケーションとの対話を可能とするグローバルコマンドを記録する記録部とを有し、
上記制御部は、上記複数の各アプリケーションの動作状態毎に対応づけて上記グローバルコマンドを管理し、上記音声認識結果が上記グローバルコマンドである場合には該グローバルコマンドに対応づけられた処理を実行することを特徴とする端末装置。
上記制御部は、上記対話中のアプリケーション及び該対話中のアプリケーション以外の複数のアプリケーションの動作状態がインストール状態、起動中、対話中の何れの状態にあるかに応じて異なるグローバルコマンドを管理することを特徴とする請求項１記載の端末装置。
入力部をさらに有し、
上記制御部は、上記入力部を介した入力に基づき上記グローバルコマンドを追加、削除又は変更の何れかを行うことを特徴とする請求項１又は２に記載の端末装置。
外部サーバとネットワークを介して接続される通信部をさらに有し、
上記制御部は、上記通信部を介して上記アプリケーションを取得した際に該アプリケーションに含まれるグローバルコマンドを上記記録部に読み込むことを特徴とする請求項１乃至３の何れかに記載の端末装置。
上記制御部は、上記音声認識結果が上記グローバルコマンドでない場合には、上記対話中のアプリケーションへの入力として処理することを特徴とする請求項１乃至４の何れかに記載の端末装置。
上記アプリケーションは、優先度に関する情報を有し、
上記制御部は、上記入力部を介して上記グローバルコマンドが入力された場合に、上記優先度に応じて、該アプリケーションとの対話を開始するか判定することを特徴とする請求項１乃至５の何れかに記載の端末装置。
上記制御部は、入力部からの入力に応じて上記アプリケーション対話を開始することを特徴とする請求項１乃至６の何れかに記載の端末装置。
上記制御部は、入力部からの入力に応じて、上記アプリケーションの音声処理を停止して、音声入力待ちの状態にすることを特徴とする請求項１乃至７の何れかに記載の端末装置。
記録手段に記録される複数の音声対話アプリケーションを、接続される複数の端末からの要求に応じて上記音声対話アプリケーションを提供する方法であって、上記音声対話アプリケーションは、上記端末で該アプリケーションが対話中以外の場合にも該端末利用者と該アプリケーションとの対話を可能とするグローバルコマンドを有し、該グローバルコマンドは該アプリケーションの動作状態に応じて分類管理されていることを特徴とする音声対話アプリケーション提供方法。
複数の音声対話アプリケーションを記録する記録手段と、
音声入力手段と、
上記音声入力手段からの音声入力を認識する音声認識手段と、
対話中のアプリケーション以外の上記アプリケーションとの対話を可能とするグローバルコマンドを記録管理する手段とを有し、
上記音声認識手段は、アプリケーションの動作状態に応じて異なるグロバールコマンドを認識することを特徴とする端末装置。