JP2014134675A

JP2014134675A - 機能実行システム及び発話例出力方法

Info

Publication number: JP2014134675A
Application number: JP2013002666A
Authority: JP
Inventors: Midori Onogi; 碧大野木; Shinya Iizuka; 真也飯塚; Kosuke Tsujino; 孝輔辻野; Wataru Uchida; 渉内田; Keitoku Isoda; 佳徳礒田
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2013-01-10
Filing date: 2013-01-10
Publication date: 2014-07-24
Anticipated expiration: 2033-01-10
Also published as: JP6122642B2

Abstract

【課題】音声入力による機能（タスク）の実行をさせるための発話例を適切に提示する。
【解決手段】通信端末１０は、音声を入力する音声入力部１１と、入力した音声に基づいて、実行されるタスクとして決定されたタスクを示す実行機能情報を取得して音声によるタスク実行を行う機能実行部１２と、音声によるタスク実行の利用履歴を示す履歴情報を取得する履歴情報取得部１３と、履歴情報に応じてタスクに応じた発話例を示すテキストを決定する発話例決定部１４と、決定された発話例を示すテキストを出力する発話例出力部１５とを備える。
【選択図】図１

Description

本発明は、音声による機能実行を行う機能実行システム及び当該機能実行システムに係る発話例出力方法に関する。

従来から、ユーザの音声を認識して、認識した音声に基づいて機能を実行するシステムが知られている。例えば特許文献１には、カーナビゲーション装置において認識した音声に基づいて、登録地を目的地として設定したり、登録地の地図を見たりといった機能が実行されることが記載されている。

特開２００６−２３４４４号公報

ユーザの音声を入力して機能を実行するシステムにおいて、機能を実行させるためにユーザがどのような発話をすればよいかを示す発話例をユーザに提示することが考えられる。

ところで、ユーザの発話によってある機能が実行される際には発話によって実行のさせ方を変えることができる。例えば、乗換案内の情報を検索するシステムでは、ユーザの発話に応じて単に乗換案内のアプリケーションを起動したり、あるいは、出発駅や目的駅を指定した上で乗換案内のアプリケーションを起動したりすることができる。音声入力に慣れていないユーザであれば、まず発話によって乗換案内のアプリケーションを起動して、その後に出発駅や目的駅を指定するという利用方法が考えられる。一方、音声入力に慣れているユーザであれば、乗換案内のアプリケーションを起動すると共に出発駅や目的駅を指定する発話を行うことができる。

しかしながら、機能を実行するための一律の発話例を示すものとすると、発話による機能実行の慣れに応じた適切な表示とはならない。例えば、出発駅や目的駅を指定した上で乗換案内のアプリケーションを起動する発話例は、音声入力に慣れていないユーザにとっては発話が長すぎて適切でない。一方、単に乗換案内のアプリケーションを起動する発話例は、音声入力に慣れているユーザにとっては物足りないものとなる。

あるいは、ユーザの発話によって、当該ユーザが意図しない機能が起動された場合、ユーザは意図する機能を起動するためにどのような発話をすればよいかわからない場合がある。

本発明は、上記の問題点に鑑みてなされたものであり、音声入力による機能の実行をさせるための発話例を適切に提示することができる機能実行システム及び発話例出力方法を提供することを目的とする。

上記の目的を達成するために、本発明に係る機能実行システムは、音声を入力して、入力した音声に基づいて、実行される機能として決定された機能を示す実行機能情報を取得して音声による機能実行を行う機能実行手段と、音声機能実行手段により行われる音声による機能実行の利用履歴を示す履歴情報を取得する履歴情報取得手段と、履歴情報取得手段によって取得された履歴情報に応じて、機能に応じた発話例を示すテキストを決定する発話例決定手段と、発話例決定手段によって決定された発話例を示すテキストを出力する発話例出力手段と、を備える。

本発明に係る機能実行システムでは、音声による機能実行の利用履歴に応じて発話例をユーザに提示することができる。従って、本発明に係る機能実行システムによれば、音声入力による機能の実行をさせるための発話例を適切に提示することができる。

履歴情報取得手段は、履歴情報として音声による機能実行の利用回数を示す情報を取得し、発話例決定手段は、履歴情報取得手段によって取得された履歴情報によって示される音声による機能実行の利用回数に応じて、機能に応じた発話例を示すテキストを決定する、こととしてもよい。この構成によれば、音声による機能実行の利用回数に応じて発話例をユーザに提示することができ、適切な発話例を確実に提示することができる。

履歴情報取得手段は、履歴情報として機能毎の音声による機能実行の利用回数を示す情報を取得し、発話例決定手段は、履歴情報取得手段によって取得された履歴情報によって示される機能毎の音声による機能実行の利用回数に応じて、機能に応じた発話例を示すテキストを機能毎に決定する、こととしてもよい。この構成によれば、機能毎の利用回数に応じて機能毎の発話例をユーザに提示することができ、機能毎に適切な発話例を提示することができる。

履歴情報取得手段は、履歴情報として機能毎の音声による機能実行の利用回数を示す情報を取得し、発話例決定手段は、履歴情報取得手段によって取得された履歴情報によって示される機能毎の音声による機能実行の利用回数に応じて、機能に応じた発話例を示すテキストの機能毎の順番を決定する、こととしてもよい。また、発話例決定手段は、履歴情報取得手段によって取得された履歴情報によって示される機能毎の音声による機能実行の利用回数に基づいて機能毎の機能実行の利用割合を算出して、算出した割合と機能毎に予め設定された閾値との差に応じて、機能に応じた発話例を示すテキストの機能毎の順番を決定することとしてもよい。これら構成によれば、機能毎に適切な優先度で発話例を提示することができる。

機能実行手段によって実行される機能には、文字列を入力して実行する機能が含まれており、履歴情報取得手段は、履歴情報として音声による機能実行の利用が入力した音声に基づく文字列の入力を伴うものであるか否かを示す情報を取得し、発話例決定手段は、履歴情報取得手段によって取得された履歴情報によって示される、音声による機能実行の利用が文字列の入力を伴うものであるか否かに応じて、機能に応じた発話例を示すテキストを機能毎に決定する、こととしてもよい。この構成によれば、入力された音声に機能に入力するための文字列が含まれていたか否かに応じて発話例をユーザに提示することができ、適切な発話例を確実に提示することができる。

機能実行手段によって実行される機能には、文字列を入力して実行する機能が含まれており、機能実行手段は、実行される機能として決定された機能を示す実行機能情報と共に当該機能に入力される文字列を示す情報を取得し、発話例決定手段は、機能に応じた発話例を示すテキストに、機能実行手段によって取得された情報によって示される当該機能に入力される文字列を含める、こととしてもよい。この構成によれば、提示される発話例をユーザにより馴染みのあるものとすることができ、提示する発話例をより適切な発話例とすることができる。

機能実行手段は、入力した音声に基づいて決定された、機能毎の優先度を示す情報を取得し、履歴情報取得手段は、履歴情報として、実行される機能として決定された機能の実行がキャンセルされたことを示す情報を取得し、発話例決定手段は、履歴情報取得手段によって、実行される機能として決定された機能の実行がキャンセルされたことを示す情報が取得された場合に、機能実行手段によって取得された情報によって示される機能毎の優先度に応じて、機能に応じた発話例を示すテキストを決定する、こととしてもよい。この構成によれば、音声による機能実行が適切に行われなかった場合に、適切な発話例を確実に提示することができる。

機能実行手段は、入力した音声に対して音声認識を行って、音声認識を行った結果に基づいて実行される機能を決定することとしてもよい。この構成によれば、本発明による、音声による機能実行及びそれに応じた発話例の提示を確実に実行することが可能となる。

ところで、本発明は、上記のように機能実行システムの発明として記述できる他に、以下のように発話例出力方法の発明としても記述することができる。これはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。

即ち、本発明に係る発話例出力方法は、音声を入力して、入力した音声に基づいて、実行される機能として決定された機能を示す実行機能情報を取得して音声による機能実行を行う機能実行ステップと、音声機能実行ステップにおいて行われる音声による機能実行の利用履歴を示す履歴情報を取得する履歴情報取得ステップと、履歴情報取得ステップにおいて取得された履歴情報に応じて、機能に応じた発話例を示すテキストを決定する発話例決定ステップと、発話例決定ステップにおいて決定された発話例を示すテキストを出力する発話例出力ステップと、を含む。

本発明によれば、音声による機能実行の利用履歴に応じて発話例をユーザに提示することができるため、音声入力による機能の実行をさせるための発話例を適切に提示することができる。

本発明の実施形態に係る機能実行システムである通信端末の構成を示す図である。提示する発話例の決定に用いられる情報を示す表である。提示する発話例の決定に用いられる別の情報を示す表である。本発明の実施形態に係る機能実行システムである通信端末のハードウェア構成を示す図である。第１実施形態に係る機能実行システムである通信端末で実行される処理（発話例出力方法）を示すシーケンス図である。第２実施形態に係る機能実行システムである通信端末で実行される処理（発話例出力方法）を示すシーケンス図である。

以下、図面と共に本発明に係る機能実行システム及び発話例出力方法の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。

（第１実施形態）
図１に本実施形態に係る機能実行システムである通信端末１０を示す。通信端末１０は、ユーザに携帯されて、通信網に接続して通信を行うことができる装置である。具体的には、通信端末１０は、移動体通信網に接続して移動体通信を行う携帯電話機やＰＣ（Personal Computer）等に相当する。通信端末１０は、ユーザからの音声（発話）を入力して音声に応じた機能を実行する装置（システム）である。通信端末１０は、通信網を介して音声認識サーバ２０及び意図解釈サーバ３０等と通信を行うことができる。音声に応じた機能の実行は、これらの装置２０，３０と情報の送受信を行うことで実現される。

通信端末１０によって実行される機能は、例えば、レシピ検索、乗換案内、グルメ検索（飲食店検索）、画像検索、音楽検索、地図検索、天気検索、音楽プレーヤ、スケジューラ、メール、メモ、ルート案内、電話、カメラが相当する。なお、本実施形態では、実行される機能をタスクと呼ぶ。

通信端末１０における音声に応じた機能の実行は、次のように行われる。まず、通信端末１０がユーザの音声を入力する。入力された音声は、通信端末１０から音声認識サーバ２０に送信される。音声認識サーバ２０は、通信端末１０から音声を受信し、受信した音声に対して音声認識を行う。音声認識サーバ２０は、音声認識の結果である文章（自然文）を通信端末１０に送信する。通信端末１０は、音声認識の結果を受信して、更に意図解釈サーバ３０に送信する。意図解釈サーバ３０は、当該音声認識の結果を受信して、その音声認識の結果に基づいて通信端末１０において実行すべきタスクを決定して、当該タスクを実行するように通信端末１０に指示する。例えば、意図解釈サーバ３０は、実行すべきタスクを示す情報を通信端末１０に送信する。通信端末１０は、意図解釈サーバ３０からの指示を受信して、当該指示に応じたタスクを実行する。なお、音声認識の結果である文章はいったん通信端末１０に送られることなく、音声認識サーバ２０から意図解釈サーバ３０へ直接送信されてもよい。更に、音声認識サーバ２０と意図解釈サーバ３０とは一体であってもよい。

音声認識サーバ２０は、音声を入力して、入力した音声に対して音声認識を行い、音声認識を行った結果を出力する音声認識手段である装置である。具体的には、上述したように音声認識サーバ２０は、通信端末１０から音声データを受信する。音声認識サーバ２０は、音声認識エンジンを有しており、当該音声認識エンジンを用いて音声認識を行う。音声認識自体は、従来の任意の音声認識方法を利用することができる。音声認識サーバ２０は、音声認識結果を文章として取得して、通信端末１０に送信する。

意図解釈サーバ３０は、通信端末１０において入力された音声に基づいて（ユーザの発話の意図解釈を行って）通信端末１０において実行されるタスクを決定して、通信端末１０に対して当該タスクの実行を指示する装置である。具体的には、意図解釈サーバ３０は、通信端末１０から音声認識結果である文章（入力文、テキストデータ）を示す情報を受信して、当該文章に基づいて通信端末１０において実行されるタスクを決定する。意図解釈サーバ３０に入力される文章は、通信端末１０に対するユーザの発話単位である。即ち、一回の発話に含まれる文章（文章群）を一つの単位として扱う。

意図解釈サーバ３０は、決定される機能の候補となるタスクを予め記憶している。文章に基づく、通信端末１０において実行されるタスクの決定には、従来から知られている方法を用いることができる。例えば、意図解釈サーバ３０は、入力される文章（あるいは文章に基づく情報）を機械学習における説明変数とし、タスクを機械学習における目的変数として、機械学習によって得られた学習モデル（判定ルール）を用いてタスクを決定（判定）する。意図解釈サーバ３０は、決定したタスクを示す情報を通信端末１０に送信して当該タスクを実行するように通信端末１０に指示する。

また、実行が指示されるタスクには、文字列を入力（引数）とすることができるものがある。これをタスクのスロットと呼ぶ。なお、文字列には１文字の文字も含まれる。スロットはタスク毎に予め定められている。例えば、乗換案内のタスクであれば、出発駅及び目的駅をスロットへの入力としてタスクが実行される。なお、タスクには０個以上のスロットが定義されている。即ち、スロットがないタスクもある。このようにスロットが定義されたタスクを実行するタスクとして決定する場合には、意図解釈サーバ３０は、スロットに入力される文字列を入力した文章から抽出することとしてもよい。スロットがないタスクの場合、後述するようなスロットに入力する文字列の抽出は行われない。文字列の抽出も、従来から知られている方法を用いることができる。意図解釈サーバ３０は、抽出したスロットに入力される文字列の情報も、決定したタスクを示す情報と合わせて通信端末１０に送信する。

例えば、ユーザの発話が「新橋から東京までの乗換案内を教えて」というものであった場合、乗換案内のタスクが実行されるタスクとして決定され、出発駅及び目的駅のスロットに入力される文字列として、「新橋」及び「東京」が抽出される。

上記の音声認識サーバ２０及び意図解釈サーバ３０は、ＣＰＵ（Central Processing Unit）及びメモリ等のハードウェアを備えるサーバ装置として構成されている。以上が、本実施形態に係る通信端末１０、及び通信端末１０における音声に応じた機能の実行を行うためのシステムの概要である。

引き続いて、本実施形態に係る通信端末１０の本発明に係る機能について説明する。図１に示すように通信端末１０は、音声入力部１１と、機能実行部１２と、履歴情報取得部１３と、発話例決定部１４と、発話例出力部１５とを備えて構成される。

音声入力部１１は、ユーザの発話である音声を入力する機能実行手段の一部である。具体的には、音声入力部１１は、通信端末１０が備えるマイクによってユーザの音声を入力する。この音声は、上述したようにユーザが通信端末１０のタスクを実行するために実行したい機能に応じて発話したものである。この音声の入力は、通信端末１０に対するユーザの操作（例えば、当該機能を実行するためのアプリケーションの起動操作）等により通信端末１０が音声に応じたタスクの実行を行うモードにされてから行われることとしてもよい。音声入力部１１は、入力した音声データを音声認識サーバ２０に送信する。

機能実行部１２は、音声入力部１１によって入力された音声に基づいて、意図解釈サーバ３０によって決定されたタスクを実行する機能実行手段の一部である。具体的には、機能実行部１２は、音声入力部１１による音声データの送信に応じて音声認識サーバ２０から送信される音声認識結果である文章を示す情報を受信する。続いて、機能実行部１２は、受信した当該文章を示す情報を意図解釈サーバ３０に送信する。続いて、機能実行部１２は、意図解釈サーバ３０によって当該文書に基づいて決定されたタスクを示す実行機能情報を受信することで取得する。機能実行部１２は、受信した当該実行機能情報によって示されるタスクを実行する。

また、意図解釈サーバ３０から送信される実行機能情報に、タスクのスロットに入力される文字列が付与されていた場合には、当該文字列をスロットに入力してタスクを実行する。なお、スロットへの文字列の入力が必要なタスクを実行する際に、意図解釈サーバ３０から文字列の送信が無かった場合は、スロットへ入力する文字列の入力を表示等によって促してもよい。その場合の文字列の入力は、音声入力により行われてもよいし、通信端末１０が備えるボタン等の操作部に対するユーザの操作により行われてもよい。

機能実行部１２は、１つ以上の（あるいは複数の）タスクに対応するアプリケーションプログラムを予め記憶しておき、記憶したアプリケーションプログラムを実行（起動）することによってタスクを実行する。また、タスクの実行は、アプリケーションプログラムを実行する以外にも、ネットワークからタスクに応じた情報を取得することで行われてもよい。

具体的には、レシピ検索、乗換案内、グルメ検索、画像検索、音楽検索、地図検索、天気検索等に関しては、例えば、機能実行部１２において案内や検索結果の情報の要求が行われて、取得された当該案内や検索結果の情報が、通信端末１０が備えるディスプレイ等の表示装置に表示出力される。

また、メール、音楽プレーヤ、スケジューラ、電話、カメラ等に関しては、機能実行部１２においてそれらのタスクを実行するためのアプリケーションプログラムが起動される。更に指示の内容によっては、アプリケーションプログラム起動後の動作も行われる。

機能実行部１２は、音声によるタスクの実行が行われる際にその旨を履歴情報取得部１３に通知する。機能実行部１２は、この通知の際に、実行するタスクや音声に基づいてタスクのスロットに入力された文字列を合わせて通知してもよい。

履歴情報取得部１３は、機能実行部１２により行われる音声によるタスク実行の利用履歴を示す履歴情報を取得する履歴情報取得手段である。この利用情報は、音声によるタスクの実行に対するユーザの習熟度を示すものである。例えば、履歴情報取得部１３は、履歴情報として音声によるタスク実行の利用回数を示す情報を取得することとしてもよい。具体的には、履歴情報取得部１３は、タスクの利用回数を記憶しておき、機能実行部１２よって音声によるタスクが実行されると利用回数を１回増加させる。この利用回数（システム全体の利用回数）は、どのタスクかにかかわらず１回とカウントすることとしてもよい。

あるいは、履歴情報取得部１３は、履歴情報としてタスク毎の音声によるタスク実行の利用回数を示す情報を取得することとしてもよい。この場合、履歴情報取得部１３は、タスク毎の利用回数を記憶しておき、機能実行部１２よって音声によるタスクが実行されるとそのタスクの利用回数を１回増加させる。あるいは、いくつかのタスクをまとめた上位のカテゴリ毎に利用回数をカウントし、それを履歴情報としてもよい。例えば、天気検索、地図検索及び乗換案内のタスクを、外出系のタスクとして１つのカテゴリとする。

また、上記の利用回数の代わりに、現時点から一定期間（例えば、一週間）遡った期間の利用回数や、通算の利用回数を音声入力によるタスク実行機能の利用開始からの日数で割って算出した利用頻度を履歴情報とすることとしてもよい。

また、履歴情報取得部１３は、音声によるタスク実行の利用が入力した音声に基づく文字列の入力を伴うものであるか否かを示す情報を、履歴情報として取得することとしてもよい。即ち、履歴情報取得部１３は、音声によるタスクの実行が行われる際に当該タスクのスロットに音声に基づく文字列が入力されるか否かを示す情報を履歴情報としてもよい。更に、スロットに入力された文字列自体を履歴情報としてもよい。履歴情報取得部１３は、取得した履歴情報を発話例決定部１４に出力する。

発話例決定部１４は、履歴情報取得部１３から入力された履歴情報に応じて、タスクに応じた発話例（通信端末１０への命令の例）を示すテキストを、ユーザに提示される発話例として決定する発話例決定手段である。例えば、発話例決定部１４は、履歴情報取得部１３から入力された履歴情報によって示される音声によるタスク実行の利用回数に応じて、タスクに応じた発話例を示すテキストを決定する。具体的には、発話例決定部１４は、図２に示すようなタスク、スロット指定情報、発話例及び習熟度が対応付けられた情報を記憶しておく。この情報は、予め通信網のサービス提供者等によって通信端末１０に入力されている。

発話例決定部１４は、タスク実行の利用回数に基づいて習熟度を決定する。発話例決定部１４は、そのために閾値を記憶しておく。例えば、利用回数が第１の閾値を超えていなければ初心者、第１の閾値を超えていれば中級者、第１の閾値よりも大きな値である第２の閾値を超えていれば上級者とする。発話例決定部１４は、決定した習熟度に対応付けられた発話例のテキストをユーザに提示される発話例として決定する。発話例決定部１４は、全てのタスクについて発話例を決定する。なお、ユーザに提示される候補となる、タスク毎の発話例の数は、上記の数に限られず任意の数とすることができる。閾値は、発話例の数に応じて適宜チューニングされて定められる。

通常、高い習熟度に対応付けられた発話例は、低い習熟度に対応付けられた発話例よりもより複雑な発話例である。図２に示すように、複雑な発話例は、発話内容が長い代わりにより高機能なタスクの実行（例えば、スロットへ音声のよる文字列を入力してタスクを実行する）を可能とする。

履歴情報がタスクあるいはカテゴリ毎の利用回数であった場合は、発話例決定部１４は、タスクあるいはカテゴリ毎に習熟度を決定して発話例を示すテキストを決定する。

また、発話例決定部１４は、履歴情報取得部１３から入力された履歴情報に応じて、タスクに応じた発話例を示すテキストのタスク毎の順番を決定することとしてもよい。複数のタスクがある場合、例えば、表示によって発話例をユーザに提示する際には発話例を順番に提示することとなる。上記のタスク毎の順番は、複数のタスクをユーザに提示する際に、発話例をユーザに提示する順番である。

例えば、発話例決定部１４は、タスク毎の音声によるタスク実行の利用回数に応じて上記の順番を決定する。より具体的には、発話例決定部１４は、タスク毎の音声によるタスク実行の利用回数に基づいて、タスク毎の機能実行の利用割合を算出する。発話例決定部１４は、算出した割合とタスク毎に予め設定された閾値との差に応じて、タスクに応じた発話例を示すテキストのタスク毎の順番を決定する。

この場合、発話例決定部１４は、予め、図３の表の期待される分布に示されるようにタスク毎の閾値を記憶しておく。例えば、図３に示すように天気検索、地図検索、乗換案内、メールのタスクそれぞれについて、０．４、０．３、０．２、０．１という閾値が設定される。この情報は、予め通信網のサービス提供者等によって通信端末１０に入力されている。

発話例決定部１４は、タスク毎の利用回数を全てのタスクの利用回数の和で割ることで、タスク毎の機能実行の利用割合を算出する。例えば、図３に示すように天気検索、地図検索、乗換案内、メールのタスクそれぞれについて、０．２、０．８、０、０という利用割合が算出される。発話例決定部１４は、タスク毎に閾値と利用割合との差を算出する。発話例決定部１４は、算出した差が大きい順をタスク毎の順番とする。図３に示す例では天気検索、地図検索、乗換案内、メールのタスクそれぞれの差の値は、０．２、−０．５、０．２、０．１となる。上述した例では発話例決定部１４は、全てのタスクについて発話例を決定することとしたが、順番を決定する場合には、例えば、順位が上位の特定の数のタスクのみの発話例を決定することとしてもよい。この場合、発話例が決定されなかったタスクについては、ユーザに発話例が提示されない。

従って、差の値が大きい順で、天気検索及び乗換案内、メール、地図検索の順と決定される。差の値が大きいということは、そのタスクについて、音声によるタスクの実行に際して、通信網のサービス提供者等が期待する割合よりも利用されていないということになる。上記の特徴は、そのようなタスクの発話例をよく利用されているタスクより前にユーザに提示（推薦）することで、音声によるタスクの実行を促進させるものである。

上記の発話例の決定は、タスク実行の利用回数に基づいて行われていたが、それ以外に基づいて行われてもよい。例えば、発話例決定部１４は、履歴情報によって示される、音声によるタスク実行の利用が、音声によるスロットへの文字列の入力を伴うものであるか否かに応じて、タスクに応じた発話例を示すテキストをタスク毎に決定する。この場合も、発話例決定部１４は、図２に示す情報を記憶しておく。

発話例決定部１４は、履歴情報によって示される、実行されたタスクと音声によるスロットへの文字列の入力の有無との情報から、図２のタスク、スロット指定情報及び習熟度の情報に基づき習熟度を決定する。例えば、乗換案内のタスクで、音声によるスロットへの文字列の入力が無かった（駅指定なし）場合は、習熟度を初心者と決定する。あるいは、乗換案内のタスクで、音声によるスロットへの文字列の入力があり、当該スロットが目的駅のスロットであった（目的駅指定）場合は、習熟度を中級者と決定する。

続いて、発話例決定部１４は、決定した習熟度よりも一段階高い習熟度に対応付けられた発話例のテキストをユーザに提示される発話例として決定する。例えば、習熟度を初心者と決定した場合には、中級者の習熟度に対応付けられた発話例をユーザに提示される発話例として決定する。これは、例えば、初心者の習熟度に相当する発話をユーザが行えている場合には、次の習熟度（次の段階）の発話をユーザに提示して（推薦して）、ユーザがより高度な発話によるタスクの実行を行えるようにするためである。このように、ユーザが発話を行うなかで未だやったことのない発話の具体例を推薦することで、習熟度向上の精度がより高くなる。

なお、上記の例では、一度、特定の習熟度の発話を行えば次の習熟度に対応する発話例を決定していたが、複数回、特定の習熟度の発話を行った場合に次の習熟度に対応する発話例を決定することとしてもよい。その態様の場合は、発話例決定部１４は、習熟度毎のユーザの発話の回数をカウントする。なお、決定した習熟度よりも一段階高い習熟度に対応付けられた発話例のテキストをユーザに提示される発話例として決定することは、上記のように音声によるスロットへの文字列の入力の有無に基づいて発話例を決定する場合だけでなく、上述した利用回数に応じて発話例を決定する場合にも行われてもよい。

上記の発話例の決定は、発話例のテキスト自体は、予め発話例決定部１４に記憶されたものの中から決定するものとしたが、履歴情報に基づいてユーザに提示するものとして決定する発話例を発話例決定部１４が生成することとしてもよい。具体的には、発話例決定部１４は、タスクに応じた発話例を示すテキストに、機能実行部１２によって過去に取得され実行されたタスクのスロットに入力された文字列を含める。上述したように、機能実行部１２によって実行されたタスクのスロットに入力された文字列は履歴情報に含まれうる。なお、この文字列は、音声（発話）から得られたものであってもよいし、ユーザの操作によって入力されたものであってもよい。

その場合、具体的には、発話例決定部１４は、まず、上記と同様に発話例を決定する。続いて、発話例決定部１４は、決定した発話例のうち、スロットに入力される文字列に対応する部分を、履歴情報に含まれている当該タスクのスロットに入力された文字列で置き換える。例えば、乗換案内についての「東京までの乗換案内を知りたい」という発話例の場合、「東京」という部分が乗換駅を指定するスロットに入力される文字列に相当する部分である。その部分が履歴情報に基づいて置き換えられる。例えば、ユーザが過去に乗換案内のタスクで、目的駅を「横浜」としていた場合は、「横浜までの乗換案内を知りたい」という発話例を決定する。

置き換えられる文字列は、例えば、最新のタスク実行の際にスロットに入力された文字列でもよいし、あるいは、過去のタスク実行の際に最も多くスロットに入力された文字列でもよい（その場合、文字列毎にスロットに入力された回数をカウントする）。

発話例決定部１４は、ユーザに提示される発話例として決定したタスクに応じた発話例を示すテキストを発話例出力部１５に出力する。

発話例出力部１５は、発話例決定部１４から入力された発話例を示すテキストを出力する発話例出力手段である。例えば、発話例出力部１５は、発話例を示すテキストを、通信端末１０が備えるディスプレイ等の表示装置に表示出力する。このように発話例（命令）を表示することで、ユーザにタスクを実行する場合の発話例を推薦することができる。発話例出力部１５は、この表示の際、発話例がどのタスクに対応するものであるかわかるようにタスク名等を合わせて表示する。この表示を参照することで、ユーザはタスクを実行するためにはどのような発話をすればよいか把握することができる。例えば、乗換案内のタスクの発話例であれば、「乗換案内：東京までの乗換案内を知りたい」という表示がなされる。

なお、通常、タスクは複数あるため、全てのタスクの発話例を表示する場合には、例えば、表示画面上には１つのタスクの発話例のみ表示し、数秒毎に表示するタスク（発話例）を切り替えることとしてもよい。これにより、ユーザが発話例を把握しやすくすることができる。また、発話例決定部１４によって発話例の順番が決定された場合には、その順番で表示する。

なお、発話例決定部１４による発話例の決定、及び発話例出力部１５による発話例の出力は、例えば、通信端末１０が音声に応じたタスクの実行を行うモードにされたタイミングで行われる。あるいは、当該モードにおいて発話例を表示する操作がユーザによって行われた場合に行われる。なお、上記の例では、複数のタスクの発話例を出力することとしたが、例えば、ユーザが機能のヘルプを参照する場合等にユーザによって指定された１つあるいは複数のタスクの発話例を出力することとしてもよい。また、通信端末１０が音声に応じたタスクの実行を行うモードにされてから一定時間、音声入力がない場合、あるいは通信端末１０が音声に応じたタスクの実行するためのアプリケーションを起動してから音声を入力するための操作（マイクボタンの押下）がない場合等に行われてもよい。また、通信端末１０が音声に応じたタスクの実行するためのアプリケーションを起動してから一定時間、音声を入力するための操作（マイクボタンの押下）がない場合には、当該システムの操作方法自体が分からないと判断し、操作方法（マイクボタンに関する情報）を出すこととしてもよい。マイクボタンの押下がない場合は、結果がキャンセルされる場合と異なり、「マイクボタンを押してから発話する」という操作方法自体をユーザが理解していない可能性がある。そこで、発話例以外のシステムの操作方法に関するヘルプ情報を保持しておき、マイクボタン押下がない場合は、発話例だけでなく操作方法も合わせて提示してもよい。

以上が、本実施形態に係る通信端末１０の本発明に係る機能である。なお、通信端末１０は、上記の機能以外にも通信端末１０が通常備える機能が備えられていてもよい。

引き続いて、図４に本実施形態に係る通信端末１０のハードウェア構成を示す。図４に示すように、通信端末１０は、ＣＰＵ１０１、ＲＡＭ（Random Access Memory）１０２、ＲＯＭ（Read OnlyMemory）１０３、操作部１０４、通信モジュール１０５、アンテナ１０６、マイク１０７及びディスプレイ１０８等のハードウェアにより構成されている。これらの構成要素が動作することにより、上述した通信端末１０の機能が発揮される。以上が、移動端末１０の構成である。

引き続いて、図５のシーケンス図を用いて、本実施形態に係る通信端末１０で実行される処理である発話例出力方法を説明する。本処理では、まず、通信端末１０が、ユーザの操作等により音声に応じたタスクの実行を行うモードにされる。通信端末１０では、続いて、発話例決定部１４によって、過去のユーザの発話に基づく履歴情報に応じて、タスクに応じた発話例を示すテキストが、ユーザに提示される発話例として決定される（Ｓ０１、発話例決定ステップ）。決定された発話例を示すテキストは、発話例出力部１５に出力される。続いて、発話例出力部１５よって、発話例決定部１４から入力された発話例を示すテキストが、ユーザに参照可能なように表示出力される（Ｓ０２、発話例出力ステップ）。ユーザは、その発話例を参照して、所望するタスクを実行するためにはどのような発話をすべきか把握することができる。

続いて、ユーザによってタスクを実行させるための発話が行われ、通信端末１０では、音声入力部１１によって音声データ（発話）が入力される（Ｓ０３、機能実行ステップ）。続いて、当該音声データが音声入力部１１から音声認識サーバ２０に送信される（Ｓ０４、機能実行ステップ）。音声認識サーバ２０では、当該音声が受信されて入力される（Ｓ０４、機能実行ステップ）。続いて、音声認識サーバ２０では、入力された音声に対して音声認識が行われる（Ｓ０５、機能実行ステップ）。音声認識結果である文章を示す情報が音声認識サーバ２０から通信端末１０に送信される（Ｓ０６、機能実行ステップ）。通信端末１０では、機能実行部１２によって、その情報が受信されて（Ｓ０６、機能実行ステップ）、意図解釈サーバ３０に送信される（Ｓ０７、機能実行ステップ）。

意図解釈サーバ３０では、音声認識結果である文章を示す情報が受信されて入力される（Ｓ０７、機能実行ステップ）。意図解釈サーバ３０では、入力された文章に基づいて、通信端末１０において実行されるタスクが決定される（Ｓ０８、機能実行ステップ）。決定したタスクを示す情報は、意図解釈サーバ３０から通信端末１０に送信される（Ｓ０９、機能実行ステップ）。

通信端末１０では、機能実行部１２によって、決定したタスクを示す情報が受信される（Ｓ０９、機能実行ステップ）。続いて、機能実行部１２によって、受信された情報によって示されるタスクが実行される（Ｓ１０、機能実行ステップ）。続いて、履歴情報取得部１３によって、上記のタスク実行に係る利用履歴を示す履歴情報が取得される（Ｓ１１、履歴情報取得ステップ）。具体的には例えば、履歴情報取得部１３において記憶しているタスク、あるいはタスク毎の利用回数が１回増加させられる。この利用履歴は、以降の発話例決定部１４による発話例の決定（Ｓ０１）、及び発話例出力部１５による発話例の出力（Ｓ０２）に利用される。以上が本実施形態に係る通信端末１０で実行される処理である発話例出力方法である。

上述したように本実施形態によれば、音声によるタスク実行の利用履歴に応じて発話例をユーザに提示することができる。従って、本実施形態によれば、音声入力による機能の実行をさせるための発話例を、ユーザの音声入力の習熟度に応じて適切に提示することができる。

具体的には、上述したように、ユーザの音声入力の習熟度として、音声によるタスク実行の利用回数を用いることができる。このような構成によれば、適切な発話例を確実に提示することができる。また、ユーザの音声入力の習熟度として、タスク毎の利用回数を用いることができる。この構成によれば、タスク毎に適切な発話例を提示することができる。

また、上述したように出力するタスクの順番を決定することとしてもよい。この構成によれば、タスク毎に適切な優先度で発話例を提示することができる。また、上述したように利用割合と閾値との差に応じてタスクの順番を決定することとしてもよい。この構成によれば、例えば、通信網のサービス提供者等がユーザに音声入力によるタスクの実行をしてもらいたいと考えているタスクについての発話例を積極的に提示することができる。これにより、音声によるタスクの実行を促進させることができる。

また、入力された音声にタスクのスロットに入力するための文字列が含まれていたか否かに応じて発話例をユーザに提示することとしてもよい。この構成によっても、適切な発話例を確実に提示することができる。

また、ユーザがタスクのスロットに入力した文字列を発話例に含めることとしてもよい。この構成によれば、提示される発話例をユーザにより馴染みのあるものとすることができ、提示する発話例をより適切な発話例とすることができる。

なお、上述した実施形態では、音声認識やタスクの決定は、通信端末１０以外の装置で行われることとしたが、通信端末１０にそれらの機能が備えられており、通信端末１０において音声によるタスクの実行の処理の全てが行われてもよい。この構成によれば、本発明による、音声によるタスク実行及びそれに応じた発話例の提示を確実に実行することが可能となる。その場合、本発明に係る装置（本実施形態に係る通信端末１０に相当）は必ずしも通信機能を備えている必要はない。以上が第１実施形態の説明である。

（第２実施形態）
引き続いて、本発明の第２実施形態について説明する。図１に示すように、本実施形態に係る機能実行システムである通信端末１０ａは、基本的な構成について第１実施形態の通信端末１０ａと同様である。本実施形態においても、通信端末１０ａは、通信網を介して音声認識サーバ２０ａ及び意図解釈サーバ３０ａ等と通信を行うことができる。上述した第１実施形態では、ユーザが音声入力を行う前に実行しようとするタスクの発話例を示すものであったが、本実施形態では、ユーザが音声入力を行った後にユーザの意図と異なるタスクが実行される場合にタスクの発話例を示すものである。

以下の説明では、第１実施形態と相違する点について述べる。本実施形態では、意図解釈サーバ３０ａは、第１実施形態と同様に例えば、機械学習による方法で通信端末１０において実行されるタスクを決定する。その際、意図解釈サーバ３０ａは、決定対象の候補となる各タスクについて、入力される文章に対するスコアを算出する。このスコアは、例えば、機械学習によって得られた学習モデルを用いて算出することができる。このスコアは、入力される文章からどのタスクが実行されるべきかを示す優先度である。通常、スコアが最も高いタスクが実行されるタスクとして決定される。なお、スコア毎の優先度は、必ずしもスコアでなくてもよく順序が把握できるものであればよい。

意図解釈サーバ３０ａは、上記のタスク毎のスコアを示す情報を決定したタスクを示す情報と合わせて通信端末１０に送信する。なお、タスク毎のスコアを示す情報があれば通信端末１０ａ側でもどのタスクを実行すればよいか判断できるので、タスク毎のスコアを示す情報のみを通信端末１０ａに送信することとしてもよい。

本実施形態においても、通信端末１０ａは、音声入力部１１ａと、機能実行部１２ａと、履歴情報取得部１３ａと、発話例決定部１４ａと、発話例出力部１５ａとを備えて構成される。

機能実行部１２ａは、意図解釈サーバ３０ａにおいて決定されたタスクを実行する前に、当該タスクを実行する旨をユーザに通知する。ユーザへの通知は、例えば、通信端末１０ａが備えるディスプレイ等の表示装置にその旨を表示出力することで行われる。ユーザは、この通知に対してタスクを実行するか、あるいはタスクの実行をキャンセルするかの入力を行うことができる。ユーザの音声入力によるタスクの実行は、必ずしもユーザの意図する機能が実行されるとは限らないからである。例えば、横浜の地図や天気を知りたいという意図で「横浜に行きたい」とユーザが発話した場合、ユーザの意図とは異なり乗換案内のタスクが実行されるタスクとして決定されることがある。

この入力は、例えば、音声入力により行われてもよいし、通信端末１０ａが備えるボタン等の操作部に対するユーザの操作により行われてもよい。例えば、ユーザが「この結果違う」と発話することで、音声入力によってタスクの実行がキャンセルされる。機能実行部１２ａは、通知に対してタスクを実行する旨の入力があった場合には当該タスクを実行し、通知に対してタスクの実行をキャンセル旨の入力があった場合には当該タスクの実行を中止する。機能実行部１２ａは、タスクの実行がキャンセルされたことを示す情報を履歴情報取得部１３ａに出力する。

機能実行部１２ａは、意図解釈サーバ３０ａから送信されたタスク毎のスコアを示す情報を受信する。機能実行部１２ａは、タスクの実行がキャンセルされたことを示す情報を出力する場合に、上記のタスク毎のスコアを示す情報を合わせて履歴情報取得部１３ａに出力する。

履歴情報取得部１３ａは、履歴情報として、実行されるタスクとして決定されたタスクの実行がキャンセルされたことを示す情報及びタスク毎のスコアを示す情報を取得する。履歴情報取得部１３ａは、これらの情報を発話例決定部１４ａに出力する。

発話例決定部１４ａは、履歴情報取得部１３ａからタスクの実行がキャンセルされたことを示す情報が入力されると、その時点でユーザに提示すべきタスクに応じた発話例を示すテキストを決定する。発話例決定部１４ａは、タスク毎のスコアを示す情報に応じて発話例を示すテキストを決定する。具体的には、発話例決定部１４ａは、実行されるタスクとして決定されキャンセルされたタスクに次ぐスコアを有するタスクの発話例を示すテキストを、ユーザに提示する発話例として決定する。なお、ユーザに提示する発話例に係るタスクは、必ずしも１つでなくてもよく複数であってもよい。その場合、スコアの順番で発話例が提示されるタスクが決定される。

例えば、キャンセルされたタスクが乗換案内であり、それに次ぐスコアを有するタスクが地図検索及び天気検索であった場合には、発話例決定部１４ａは、地図検索及び天気検索のタスクの発話例を示すテキストを、ユーザに提示する発話例として決定する。

また、発話例決定部１４ａは、予め設定された回数（閾値）、連続してユーザから同じタスクの実行がキャンセルされた場合に上記の発話例の決定を行うこととしてもよい。タスクの実行がキャンセルされる毎に、発話例の提示があるとユーザにとって煩わしいと感じる場合もありえるからである。その場合、発話例決定部１４ａは、予め設定された一定時間内に同じタスクの実行がキャンセルされたか否か、キャンセルの回数をカウントして判断する。

発話例出力部１５ａは、上述した第１実施形態と同様に発話例決定部１４ａから入力された発話例を示すテキストを出力する。なお、発話例決定部１４ａによる発話例の決定、及び発話例出力部１５ａによる発話例の出力は、ユーザによってタスクの実行がキャンセルされたタイミングで行われる。なお、例えば、連続してユーザから同じタスクの実行がキャンセルされた場合に発話例の出力を行う場合には、ユーザによってタスクの実行がキャンセルされたタイミングで発話例決定部１４ａが当該条件（連続して同じタスクがキャンセルされた回数が予め設定された回数に達したという条件）を満たすか否かを判断する。そして、条件を満たしたと判断された場合に、発話例決定部１４ａによる発話例の決定、及び発話例出力部１５ａによる発話例の出力を行う。

引き続いて、図６のシーケンス図を用いて、本実施形態に係る通信端末１０ａで実行される処理である発話例出力方法を説明する。本処理では、まず、通信端末１０ａが、ユーザの操作等により音声に応じたタスクの実行を行うモードにされる。続いて、ユーザによってタスクを実行させるための発話が行われ、通信端末１０ａでは、音声入力部１１ａによって音声データ（発話）が入力される（Ｓ２１、機能実行ステップ）。なお、通信端末１０ａでは、音声に応じたタスクの実行を行うモードにされた際に第１実施形態と同様に発話例が表示出力されてもよい。

続いて、当該音声データが音声入力部１１ａから音声認識サーバ２０ａに送信される（Ｓ２２、機能実行ステップ）。音声認識サーバ２０ａでは、当該音声が受信されて入力される（Ｓ２２、機能実行ステップ）。続いて、音声認識サーバ２０ａでは、入力された音声に対して音声認識が行われる（Ｓ２３、機能実行ステップ）。音声認識結果である文章を示す情報が音声認識サーバ２０ａから通信端末１０に送信される（Ｓ２４、機能実行ステップ）。通信端末１０ａでは、機能実行部１２ａによって、その情報が受信されて（Ｓ２４、機能実行ステップ）、意図解釈サーバ３０ａに送信される（Ｓ２５、機能実行ステップ）。

意図解釈サーバ３０ａでは、音声認識結果である文章を示す情報が受信されて入力される（Ｓ２５、機能実行ステップ）。意図解釈サーバ３０ａでは、入力された文章に基づいて、通信端末１０ａにおいて実行されるタスクが決定される（Ｓ２６、機能実行ステップ）。決定したタスクを示す情報は、意図解釈サーバ３０ａから通信端末１０ａに送信される（Ｓ２７、機能実行ステップ）。

通信端末１０ａでは、機能実行部１２ａによって、決定したタスクを示す情報が受信される（Ｓ２７、機能実行ステップ）。続いて、機能実行部１２ａによって、当該タスクを実行する旨がユーザに通知される（Ｓ２８、機能実行ステップ）。続いて、機能実行部１２ａによってタスクの実行をキャンセルする旨が入力される。当該入力は、ユーザが当該タスクの実行をさせたくないと考えたときに、ユーザの通信端末１０ａに対する操作や音声入力により行われる。機能実行部１２ａによってタスクの実行をキャンセルする旨が入力されと機能実行部１２ａによって当該タスクの実行が中止される（Ｓ２９、機能実行ステップ）。なお、この時点で、機能実行部１２ａによってタスクを実行する旨が入力された場合には、当該タスクが実行される。

タスクの実行が中止されると、機能実行部１２ａからタスクの実行がキャンセルされたことを示す情報、及びタスク毎のスコアを示す情報が履歴情報取得部１３ａに出力され、履歴情報取得部１３ａによって当該情報が履歴情報として取得される（Ｓ３０、履歴情報取得ステップ）。履歴情報は、履歴情報取得部１３ａから発話例決定部１４ａに出力される。

続いて、発話例決定部１４ａによって入力された履歴情報に基づいて、発話例提示の条件を満たすか否かが判断される（Ｓ３１、発話例決定ステップ）。例えば、連続してユーザから同じタスクの実行がキャンセルされたか否かが判断される。発話例提示の条件を満たさないと判断された場合は、再度、ユーザからの音声の入力を待ち、ユーザの発話があると音声入力部１１ａによって音声データ（発話）が入力され、上記の処理が繰り返される（Ｓ２１〜）。

発話例提示の条件を満たすと判断された場合は、発話例決定部１４ａによって、タスク毎のスコアを示す情報に応じて発話例を示すテキストが決定される（Ｓ３２、発話例決定ステップ）。決定された発話例を示すテキストは、発話例出力部１５ａに出力される。続いて、発話例出力部１５ａよって、発話例決定部１４ａから入力された発話例を示すテキストが、ユーザに参照可能なように表示出力される（Ｓ３３、発話例出力ステップ）。ユーザは、その発話例を参照して、所望するタスクを実行するためにはどのような発話をすべきか把握することができる。その後、再度、ユーザからの音声の入力を待ち、ユーザの発話があると音声入力部１１ａによって音声データ（発話）が入力され、上記の処理が繰り返される（Ｓ２１〜）。以上が本実施形態に係る通信端末１０で実行される処理である発話例出力方法である。

上述したように本実施形態によれば、ユーザによる発話によりユーザが所望するタスクが実行されなかった場合、即ち、音声によるタスク実行が適切に行われなかった場合に、適切な発話例を確実に提示することができる。具体的には、ユーザが所望している可能性が高いタスクを実行するためのタスクの発話例をユーザに提示することができる。

１０，１０ａ…通信端末、１１，１１ａ…音声入力部、１２，１２ａ…機能実行部、１３，１３ａ…履歴情報取得部、１４，１４ａ…発話例決定部、１５，１５ａ…発話例出力部、１０１…ＣＰＵ、１０２…ＲＡＭ、１０３…ＲＯＭ、１０４…操作部、１０５…通信モジュール、１０６…アンテナ、１０７…マイク、１０８…ディスプレイ、２０，２０ａ…音声認識サーバ、３０，３０ａ…意図解釈サーバ。

Claims

音声を入力して、入力した音声に基づいて、実行される機能として決定された機能を示す実行機能情報を取得して音声による機能実行を行う機能実行手段と、
前記機能実行手段により行われる音声による機能実行の利用履歴を示す履歴情報を取得する履歴情報取得手段と、
前記履歴情報取得手段によって取得された履歴情報に応じて、前記機能に応じた発話例を示すテキストを決定する発話例決定手段と、
前記発話例決定手段によって決定された発話例を示すテキストを出力する発話例出力手段と、
を備える機能実行システム。
前記履歴情報取得手段は、前記履歴情報として前記音声による機能実行の利用回数を示す情報を取得し、
前記発話例決定手段は、前記履歴情報取得手段によって取得された履歴情報によって示される前記音声による機能実行の利用回数に応じて、前記機能に応じた発話例を示すテキストを決定する、請求項１に記載の機能実行システム。
前記履歴情報取得手段は、前記履歴情報として前記機能毎の前記音声による機能実行の利用回数を示す情報を取得し、
前記発話例決定手段は、前記履歴情報取得手段によって取得された履歴情報によって示される前記機能毎の前記音声による機能実行の利用回数に応じて、前記機能に応じた発話例を示すテキストを前記機能毎に決定する、請求項２に記載の機能実行システム。
前記履歴情報取得手段は、前記履歴情報として前記機能毎の前記音声による機能実行の利用回数を示す情報を取得し、
前記発話例決定手段は、前記履歴情報取得手段によって取得された履歴情報によって示される前記機能毎の前記音声による機能実行の利用回数に応じて、前記機能に応じた発話例を示すテキストの前記機能毎の順番を決定する、請求項２又は３に記載の機能実行システム。
前記発話例決定手段は、前記履歴情報取得手段によって取得された履歴情報によって示される前記機能毎の前記音声による機能実行の利用回数に基づいて前記機能毎の機能実行の利用割合を算出して、算出した割合と前記機能毎に予め設定された閾値との差に応じて、前記機能に応じた発話例を示すテキストの前記機能毎の順番を決定する請求項４に記載の機能実行システム。
前記機能実行手段によって実行される機能には、文字列を入力して実行する機能が含まれており、
前記履歴情報取得手段は、前記履歴情報として前記音声による機能実行の利用が入力した音声に基づく文字列の入力を伴うものであるか否かを示す情報を取得し、
前記発話例決定手段は、前記履歴情報取得手段によって取得された履歴情報によって示される、前記音声による機能実行の利用が文字列の入力を伴うものであるか否かに応じて、前記機能に応じた発話例を示すテキストを前記機能毎に決定する、請求項１〜５の何れか一項に記載の機能実行システム。
前記機能実行手段によって実行される機能には、文字列を入力して実行する機能が含まれており、
前記機能実行手段は、実行される機能として決定された機能を示す実行機能情報と共に当該機能に入力される文字列を示す情報を取得し、
前記発話例決定手段は、前記機能に応じた発話例を示すテキストに、前記機能実行手段によって取得された情報によって示される当該機能に入力される文字列を含める、請求項１〜６の何れか一項に記載の機能実行システム。
前記機能実行手段は、入力した音声に基づいて決定された、前記機能毎の優先度を示す情報を取得し、
前記履歴情報取得手段は、前記履歴情報として、実行される機能として決定された機能の実行がキャンセルされたことを示す情報を取得し、
前記発話例決定手段は、前記履歴情報取得手段によって、実行される機能として決定された機能の実行がキャンセルされたことを示す情報が取得された場合に、前記機能実行手段によって取得された情報によって示される前記機能毎の優先度に応じて、前記機能に応じた発話例を示すテキストを決定する、請求項１〜７の何れか一項に記載の機能実行システム。
前記機能実行手段は、入力した音声に対して音声認識を行って、音声認識を行った結果に基づいて実行される機能を決定する請求項１〜８の何れか一項に記載の機能実行システム。
音声を入力して、入力した音声に基づいて、実行される機能として決定された機能を示す実行機能情報を取得して音声による機能実行を行う機能実行ステップと、
前記機能実行ステップにおいて行われる音声による機能実行の利用履歴を示す履歴情報を取得する履歴情報取得ステップと、
前記履歴情報取得ステップにおいて取得された履歴情報に応じて、前記機能に応じた発話例を示すテキストを決定する発話例決定ステップと、
前記発話例決定ステップにおいて決定された発話例を示すテキストを出力する発話例出力ステップと、
を含む発話例出力方法。