以下、本発明の実施の形態について図面を参照して詳細に説明する。なお、以下図中の同一または相当部分には同一符号を付して、その説明は原則的に繰返さないものとする。
図1は、実施の形態に係る通信端末の全体構成を示すブロック図である。通信端末の一実施の形態として、携帯電話、スマートフォンおよびPDA(Personal Digital Assistant)などの携帯端末を想定するが、携帯型に限定されず、たとえば据置型コンピュータなどの端末であってもよい。
図1を参照して、通信端末1は、通信部10と、制御部14と、ROM(Read Only Memory)16と、RAM(Random Access Memory)18と、表示部20と、音声出力部22と、音声入力部24と、入力部26とを備える。
通信部10は、アンテナおよび通信モジュールなどから構成されており、ネットワーク上の種々の装置(図示せず)との間で情報を送受信する。具体的には、通信部10は、サーバ装置に対するデータの送信処理、およびサーバ装置から送信されたデータの受信処理を行なう。
制御部14は、主にCPU(Central Processing Unit)で構成され、通信端末1の各部を統括的に制御する。制御部14の主な制御構成については、後述する。
ROM16は、データを不揮発的に格納する。ROM16に格納されるデータは、通信端末1の各部を制御するためのプログラムの他、各種アプリケーション(たとえば、電話、電子メール、地図、スケジュール管理など)を含んでいる。本明細書では、「アプリケーション」を適宜「アプリ」と略す。また、「電子メール」を適宜「メール」と略す。
RAM18は、制御部14によるプログラムの実行の際、一時的に利用または生成されるデータを揮発的に格納する。
表示部20は、各種のデータを表示する。表示部20は、画像を表示するための画面を含んで構成されている。
音声出力部22は、スピーカを含む。音声出力部22は、制御部14から出力されるデータを表わす音のデータを出力する。音声出力部22が出力する音データには、人間の発する音声の周波数帯域に含まれる音のデータ(音声データ)が含まれる。
音声入力部24は、マイクを含む。音声入力部24は、外部からの音の入力を受け付ける。音声入力部24は、主に音声データの入力を受け付ける。音声入力部24は、入力された音声データを制御部14へ出力する。
入力部26は、通信端末1のユーザの入力操作を受け付けるための操作部に相当する。入力部26には、通信端末1の主電源をオンまたはオフするための操作キー、およびその他の各種の操作ボタンが含まれる。例えば、通信端末1がスマートフォンである場合には、表示部20と入力部26とは、タッチスクリーンのように、各種のデータの表示とともに、ユーザの入力操作を受け付ける、表示一体型入力装置で構成される。具体的には、タッチスクリーンは、ディスプレイとタッチパネルとにより構成される。
通信端末1における処理は、各ハードウェアおよび制御部14(CPU)により実行されるソフトウェアによって実現される。このようなソフトウェアは、ROM16に予め格納されている場合がある。また、ソフトウェアは、その他の記憶媒体に格納されて、プログラムプロダクトとして流通している場合もある。あるいは、ソフトウェアは、いわゆるインターネットに接続されている情報提供事業者によってダウンロード可能なプログラムプロダクトとして提供される場合がある。このようなソフトウェアは、読取装置によってその記憶媒体から読み取られて、あるいは通信部10等を介してダウンロードされた後、実行可能なプログラムの形式でROM16に格納される。制御部14は、ROM16からプログラムを読み出し、そのプログラムを実行する。
本実施の形態に係る通信端末1は、受信したメッセージを表示部20に表示する機能(メッセージ表示機能)に加えて、受信したメッセージの本文を音声で読上げる機能(メッセージ読上げ機能)を有している。メッセージは、電子メールの他、SMS(Short Message Service)によるメッセージ、SNS(Social Network Service)サービスを利用してユーザ間で送受信されるメッセージなどが含まれる。
ここで、通信端末1が受信するメッセージの中には、メッセージの本文中に、起動するアプリケーションを特定する宛先情報を含んだものが存在する。この宛先情報には、メッセージの送信者の電話番号やメールアドレス、および送信者以外の第三者の電話番号やメールアドレスが含まれる。宛先情報にはさらに、URL(Uniform Resource Locator)、イベントの開催日時といった日時に関する情報、イベントの開催場所といった場所に関する情報などが含まれる。なお、URLは、Webページのネットワーク上の記憶場所を示すアドレス、例えばHTTP(HyperText Transfer Protocol)アドレス等に相当する。
たとえば、メッセージの本文中に送信者の電話番号が含まれている場合、メッセージの受信者であるユーザによって電話番号が選択されると、電話を掛けるためのアプリケーション(電話アプリ)が起動する。これにより、ユーザは、送信者に電話を掛けることができるため、メッセージに対して即時に応答することが可能となる。
しかしながら、このような宛先情報を含んだメッセージがメッセージ読上げ機能によって読上げられた場合には、宛先情報はメッセージの内容を表す音声データの一部分に過ぎないため、ユーザはメッセージの本文から宛先情報を選択することが困難であった。特に、目の不自由なユーザにとっては、メッセージ本文のどの部分に宛先情報が表示されているかを認識することが難しいため、宛先情報を活用することが困難となっていた。このように、メッセージ読上げ機能が動作する場面において、メッセージ本文中に含まれる宛先情報は、必ずしもユーザにとって使い勝手の良いものとはなっていなかった。
そこで、本実施の形態では、メッセージ読上げ機能を有する通信端末1において、受信したメッセージの本文に宛先情報が含まれている場合には、メッセージ本文を読上げた後に、ユーザとの間で対話処理を実行する。この対話処理では、通信端末1は、メッセージの本文から抽出した宛先情報の選択を促すための音声案内をユーザに提供する。これにより、実質的に、ユーザがメッセージの本文から宛先情報を選択することを可能とし、宛先情報の有用性を向上させる。
次に、図2を用いて、本実施の形態に係る通信端末1の制御部14の制御構成について説明する。
図2は、本実施の形態に係る通信端末1におけるメッセージ読上げ機能および対話処理に関する制御構成の一例を示すブロック図である。以下の説明では、受信されるメッセージが電子メールである場合の、通信端末1の制御構成の一例について説明する。
図2を参照して、制御部14は、メッセージ処理部30と、メッセージ読上げ部32と、情報抽出部34と、対話処理部36とを含む。
通信部10は、ネットワーク上の種々の装置との間で情報の送受信処理を行なう。この処理は、サーバ装置(図示せず)から電子メールを受信する処理と、サーバ装置へ電子メールを送信する処理とを含む。
RAM18は、メッセージ処理部30に接続され、通信部10により受信される電子メールのデータや、メッセージ処理部30によるプログラムの実行に利用されるデータ等を格納する。
入力部26は、外部からの情報の入力をメッセージ処理部30へ入力する。メッセージ処理部30は、入力部26から入力された情報に基づいて、プログラムを実行する。メッセージ処理部30に入力される情報には、メッセージ読上げ機能を有効(オン)とするか無効(オフ)とするかの設定情報が含まれる。
メッセージ処理部30は、入力部26に対して電子メールのアプリケーション(メールアプリ)が起動する指示が入力されたことに応じて、メールアプリを起動する。メッセージ処理部30は、通信部10によって受信された複数の電子メールの中から、入力部26が一通の電子メールを表示対象に選択する操作を受け付けると、表示対象の電子メールを表示部20(ディスプレイ)に表示する。
メッセージ処理部30はさらに、入力部26からの入力情報に基づいて、メッセージ読上げ機能がオンに設定されているか、オフに設定されているかを判断する。メッセージ読上げ機能がオンに設定されている場合、メッセージ処理部30は、表示対象の電子メールのデータをメッセージ読上げ部32および情報抽出部34へ伝達する。一方、メッセージ読上げ機能がオフに設定されている場合、メッセージ処理部30は、表示対象の電子メールのデータを情報抽出部34へ伝達する。
メッセージ読上げ部32は、音声出力部22を通じて、表示対象の電子メールの本文を音声で読上げる。具体的には、メッセージ読上げ部32は、メッセージ処理部30から入力される電子メールの本文のデータをデジタルの音声信号に変換し、変換された音声信号にデコード処理およびデジタル/アナログ変換などを施す。そして、メッセージ読上げ部32は、変換後の電気信号を音声出力部22に出力する。音声出力部22は、メッセージ読上げ部32から電気信号が入力されると、スピーカを通じて電子メールの本文を表わす音声を出力する。
情報抽出部34は、表示対象の電子メールの本文から、起動するアプリケーションを特定する宛先情報を抽出する。情報抽出部34は、抽出した宛先情報を対話処理部36へ伝達する。
対話処理部36は、メッセージ読上げ部32による電子メールの本文の読上げが完了した後、情報抽出部34により抽出された宛先情報に基づいて、ユーザとの間でアプリケーションを起動するための対話処理を実行する。
具体的には、対話処理部36は、音声入力部24で検出された音声データを音声認識する音声認識部38を含む。電子メールの本文に宛先情報が含まれている場合、対話処理部36は、音声認識部38を起動する。
音声入力部24は、外部から入力される音声データを検出する。言い換えれば、音声入力部24は、外部から受信した音データから、人間の発する音声の周波数帯域を抽出することによって、音声データを検出する。音声入力部24は、検出した音声データを音声認識部38へ伝達する。対話処理部36は、音声認識部38における音声データの認識結果に基づいて、応答内容を設定する。そして、対話処理部36は、設定した応答内容を示す音声を、音声出力部22を介してユーザに出力する。対話処理部36はさらに、設定した応答内容を表示部20に表示する。
対話処理部36はさらに、メッセージ本文から抽出した宛先情報と、起動するアプリケーションとを対応付けるためのテーブル40を有している。図3は、テーブル40の一例を示す図である。
図3を参照して、テーブル40において、宛先情報と、宛先情報を選択することによって起動するアプリケーションとが対応付けられている。テーブル40では、宛先情報の種類に応じて、1つまたは複数のアプリケーションが対応付けられている。宛先情報に対応付けられるアプリケーションは、宛先情報に対してユーザがアクションをとるために起動する可能性のあるアプリケーションに相当する。
たとえば、図3に示すように、電話番号には、電話のアプリケーション(電話アプリ)、電話番号やメールアドレスなど連絡先のデータを管理するための電話帳のアプリケーション(電話帳アプリ)および、SMSのアプリケーション(SMSアプリ)が対応付けられる。電子メールの受信者であるユーザは、電話番号が示す連絡先に対して電話を発信する可能性がある。または、ユーザは、電話番号が示す連絡先を、電話帳に新規に登録する可能性がある。あるいは、ユーザは、電話番号が示す連絡先に対してショートメッセージを送信する可能性がある。
テーブル40ではさらに、宛先情報に対応付けられるアプリケーションの各々について、そのアプリケーションにおいてユーザがとり得るアクションが関連付けられている。図3では、アプリケーションとアクションとを併記している。たとえば、電話番号の場合には、電話アプリに対して「発信」が関連付けられ、電話帳アプリに対して「電話帳登録」が関連付けられ、SMSアプリに対して「SMS送信」が関連付けられている。
なお、1つの宛先情報に複数のアプリケーションが対応付けられる場合には、各アプリケーションに対して優先順位を付してもよい。たとえば、電話番号の場合、ユーザが連絡先に発信する可能性が最も高く、電話帳に連絡先を新規登録する可能性が次に高い。そのため、優先順位は「電話アプリ」、「電話帳アプリ」、「SMSアプリ」の順番とされる。この優先順位は、ユーザが任意に設定することができる。
また、メールアドレスには、電子メールのアプリケーション(メールアプリ)、SMSアプリ、および電話帳アプリが対応付けられる。各アプリケーションにおいてユーザがとり得るアクションとして、電子メールアプリには「E−mail送信」が関連付けられ、SMSアプリには「SMS送信」が関連付けられ、電話帳アプリには「電話帳登録」が関連付けられている。なお、ユーザは、メールアドレスが電子メールの送信者のメールアドレスである場合、送信者にメッセージを返信する可能性が高い。そのため、優先順位は、「メールアプリ」、「SMSアプリ」、「電話帳アプリ」の順番とされる。
URLには、Webページを閲覧するためのアプリケーションであるWebブラウザ、速やかにURLに接続できるように当該URLを登録(ブックマーク登録)するためのアプリケーション(ブックマークアプリ)、および電話帳アプリが対応付けられる。各アプリケーションにおいてユーザがとり得るアクションとして、Webブラウザには「ブラウザ起動」が関連付けられ、ブックマークアプリには「ブックマーク登録」が関連付けられ、電話帳アプリには「電話帳登録」が関連付けられている。なお、ユーザは、URLに接続してWebページを閲覧する可能性が高い。そのため、優先順位は、「Webブラウザ」、「ブックマークアプリ」、「電話帳アプリ」の順番とされる。
日時に関する情報には、カレンダーを表示するためのアプリケーション(カレンダーアプリ)、およびイベントのスケジュールを管理するためのアプリケーション(スケジュール管理アプリ)が対応付けられる。各アプリケーションにおいてユーザがとり得るアクションとして、カレンダーアプリには「カレンダー表示」が関連付けられ、スケジュール管理アプリには「スケジュール登録」が関連付けられている。
場所に関する情報には、指定された地域の地図を表示するためのアプリケーション(地図アプリ)が対応付けられる。地図アプリに対してユーザがとり得るアクションとして、「地図表示」が関連付けられている。
図2に戻って、対話処理部36は、対話処理において、電子メールの本文から抽出された宛先情報の選択を促すための案内を、音声出力部22を通じてユーザに対して提供する。ユーザが当該案内に応答して宛先情報を選択した場合、対話処理部36は、テーブル40(図3)を参照することにより、選択された宛先情報に対応付けられるアプリケーションを特定する。
ここで、ユーザにより選択された宛先情報に複数のアプリケーションが対応付けられる場合には、対話処理部36はさらに、複数のアプリケーションの中から1つのアプリケーションの選択を促すための案内を、音声出力部22を通じてユーザに提供する。このようにして、ユーザは、通信端末1から提供される音声案内に応答することにより、電子メールの本文に含まれる宛先情報を選択し、かつ、その選択した宛先情報に対応付けられる複数のアプリケーションの中から、起動するアプリケーションを選択することができる。
対話処理部36は、起動するアプリケーションが選択されたと判断すると、対話処理を終了し、選択されたアプリケーションを起動する。選択されたアプリケーションが起動すると、制御部14は、当該アプリケーションに関連付けられたアクションを実行する。
図4は、通信端末1において受信された電子メールが表示されるときの処理を示すフローチャートである。以下、当該処理において制御部14が実行する処理の流れを説明する。たとえば、受信された複数の電子メールの中から、一通の電子メールを表示対象に選択する操作を受け付けたことに応じて、制御部14は図4の処理を開始する。図4の処理は、メールアプリの一部として実装されてもよいし、メールアプリを補助するためのアプリとして実装されてもよい。
図4を参照して、ステップS01では、メッセージ処理部30は、表示対象のメールのデータをRAM18から読出す。
ステップS02では、メッセージ処理部30は、入力部26からの入力情報に基づいて、メッセージ読上げ機能がオンに設定されているか、オフに設定されているかを判断する。メッセージ読上げ機能がオフに設定されている場合(ステップS02のNO判定時)、ステップS03により、メッセージ処理部30は、表示対象のメールの本文を表示部20に表示する。
情報抽出部34は、ステップS04により、メールの本文から宛先情報を抽出する。ステップS05では、情報抽出部34は、抽出された宛先情報のリストを作成する。
情報抽出部34は、ステップS06により、ユーザがメールの読込みを終了したか否かを判断する。ステップS06における判断は、たとえば、ユーザがタッチスクリーン上で画面表示を上下方向に移動させる操作(スクロール)を停止してからの経過時間をカウントし、カウント値と所定時間とを比較することによって行なうことができる。情報抽出部34は、カウント値が所定時間に達したときに、ユーザが読込みを終了したと判断する。または、情報抽出部34は、表示部20にメールの本文が表示されてからの経過時間をカウントし、カウント値が所定時間に達したときに、ユーザが読込みを終了したと判断するようにしてもよい。
情報抽出部34は、ユーザがメールの読込みを終了したと判断するまでステップS06の処理で留まる。そして、ユーザがメールの読込みを終了したと判断すると(ステップS06のYES判定時)、情報抽出部34は、ステップS07に進み、ステップS05にて作成したリストを表示部20に表示する。
図5は、メッセージ読上げ機能がオフに設定されている場合の表示部20における画面遷移の一例を示す図である。
図5を参照して、図4のステップS03の処理により、表示部20の画面にはメールの本文が表示されている。メールの本文中には、電話番号、メールアドレスおよびURLといった複数の宛先情報が含まれている。図5では、メールの本文が表示部20の画面に収まりきらない場合を想定している。この場合、ユーザは、画面表示を上下方向に移動させる操作(スクロール)を行なうことにより、画面に表示しきれない部分を表示させることができる。
情報抽出部34は、図4のステップS04およびS05の処理により、メールの本文から宛先情報を抽出し、抽出した宛先情報のリスト(抽出リスト)を作成する。そして、ユーザがメールの読込みを終了したと判断すると(図4のステップS06のYES判定時)、読込みが終了したと判断してから一定時間が経過したタイミングで、情報抽出部34は、作成したリストを表示部20の画面に表示する。
リストが表示部20の画面に表示されている状態において、入力部26は、ユーザによる宛先情報を選択する操作を受け付ける。入力部26は、ユーザにより選択された宛先情報を検出し、検出した宛先情報をメッセージ処理部30へ出力する。たとえば、タッチスクリーンのディスプレイ(表示部20)にリストが表示されると、タッチパネル(入力部26)は、ディスプレイへのユーザによるタッチ操作を受け付ける。タッチパネルは、ユーザの指が触れたディスプレイ上の位置に対応する宛先情報を検出し、検出した宛先情報をメッセージ処理部30へ出力する。
メッセージ処理部30は、入力部26からの信号に基づいて宛先情報が選択されたと判断すると、選択された宛先情報に対応付けられるアプリケーションを起動する。たとえば、ユーザによってリストから電話番号が選択された場合には、電話アプリが起動する。これにより、ユーザは電話番号が示す連絡先に発信することができる。
図4に戻って、メッセージ読上げ機能がオンに設定されている場合(ステップS02のYES判定時)、メッセージ処理部30は、ステップS08により、メールの本文を表示部20に表示する。メッセージ処理部30はさらに、メールの本文のデータをメール読上げ部32へ伝達する。
ステップS09では、メール読上げ部32は、音声出力部22を通じて、メールの本文を音声で読上げる。情報抽出部34は、ステップS10により、メールの本文から宛先情報を抽出する。
対話処理部36は、ステップS11により、メッセージ読上げ部32における読上げが完了したか否かを判断する。メッセージ読上げ部32がメールの本文の読上げを完了したと判断すると(ステップS11のYES判定時)、対話処理部36は、ステップS12に進み、情報抽出部34からの入力情報に基づいて、メールの本文に宛先情報が含まれているか否かを判断する。メールの本文に宛先情報が含まれていない場合(ステップS12のNO判定時)、対話処理部36は処理を終了する。
これに対して、メールの本文に宛先情報が含まれている場合(ステップS12のYES判定時)には、対話処理部36は、ステップS13により、音声認識部38を起動する。音声認識部38が起動すると、対話処理部36は、ステップS14により、情報抽出部34により抽出された宛先情報に基づいて、ユーザとの間でアプリケーションを起動するための対話処理を実行する。
図6は、メッセージ読上げ機能がオンに設定されている場合の表示部20における画面遷移の一例を示す図である。図6では、表示部20における画面遷移とともに、対話処理においてユーザと通信端末1との間でやり取りされる音声の遷移の一例が示されている。
図6を参照して、図4のステップS08の処理により、表示部20の画面にはメールの本文が表示されている。図6においても、図5と同様に、メールの本文が表示部20の画面に収まりきらない場合を想定している。メールの本文中には、電話番号、メールアドレスおよびURLといった複数の宛先情報が含まれている。
図4のステップS09の処理により、メッセージ読上げ部32によってメールの本文が音声で読上げられる。表示部20においては、メッセージ読上げ部32が読上げている部分が画面に表示されるように、画面表示が自動的にスクロールされる。
図4のステップS10の処理により、情報抽出部34は、メールの本文から宛先情報を抽出する。情報抽出部34は、抽出した宛先情報を対話処理部36へ伝達する。
メールの本文の読上げが完了したと判断してから一定時間が経過すると(ステップS11のYES判定時)、メールの本文に宛先情報が含まれているときには(ステップS12のYES判定時)、対話処理部36は、音声認識部38を起動し(図4のステップS13)、ユーザとの間で対話処理(図4のステップS14)を実行する。
ユーザとの対話処理では、最初に、対話処理部36は、メールの本文から抽出された複数の宛先情報のうちの1つの宛先情報の選択を促すための案内を、音声出力部22を通じてユーザに対して提供する。ユーザに提供される案内は、たとえば、図6に示す第1から第3の音声案内で構成されている。対話処理部36は、案内内容を表わす音声を、音声出力部22を通じてユーザに出力するとともに、その案内内容を表示部20の画面に表示する。なお、表示部20の画面に案内内容を表示するか否かについては、ユーザが任意に選択することができる。
第1の音声案内では、宛先情報の種類の選択を促すための案内がユーザに提供される。図6の例では、メールの本文中に3種類の宛先情報(電話番号、メールアドレス、URL)が含まれている。したがって、対話処理部36は、「本文に、電話番号、メールアドレス、URLがあります。どれに対してアクションをしますか?『電話番号』、『メールアドレス』、『URL』」という質問フレーズを表わす音声を、音声出力部22を通じてユーザに出力する。
音声認識部38は、質問フレーズに対するユーザの応答内容(回答フレーズ)を音声認識する。対話処理部36は、音声認識部38により認識された応答内容から、ユーザが選択した宛先情報の種類を検出する。具体的には、ユーザの「電話番号」という回答フレーズを表わす音声が音声入力部24で検出され、検出された回答フレーズが音声認識部38で認識されることにより、対話処理部36は、ユーザが電話番号を選択したことを検出する。
次に、第2の音声案内では、選択された種類の宛先情報に対応付けられたアプリケーションを起動するか否かの選択を促すための案内がユーザに提供される。たとえば、第1の音声案内に応答して電話番号が選択された場合には、対話処理部36は、電話番号に対応付けられるアプリケーションを起動するか否かの選択を促すための案内をユーザに提供する。具体的には、対話処理部36は、「本文に電話番号が2つあります。『09012345678』、『09033444567』、これらの電話番号に対して何らかのアクションをしますか?『YES』、『NO』」という質問フレーズを表わす音声を、音声出力部22を通じてユーザに出力する。
なお、電話番号が電話帳に登録されている連絡先である場合には、電話番号を表わす音声に代えて、もしくは電話番号を表わす音声とともに連絡先を表わす音声を出力してもよい。
また、電子メールの本文から抽出された宛先情報が1種類(たとえば、電話番号のみ)である場合には、対話処理部36は、第1の音声案内をスキップすることができる。すなわち、対話処理部36は、対話処理の最初に第2の音声案内を提供することにより、宛先情報に対応付けられるアプリケーションを起動するか否かの選択をユーザに促す。
音声認識部38は、質問フレーズに対するユーザの応答内容(回答フレーズ)を音声認識する。対話処理部36は、音声認識部38により認識された応答内容から、選択した宛先情報に対応付けられるアプリケーションを起動するか否かを判断する。具体的には、ユーザの「YES」という回答フレーズを表わす音声が音声入力部24で検出され、検出された回答フレーズが音声認識部38で認識された場合、対話処理部36は、ユーザが電話番号に対応付けられるアプリケーションを起動することを選択したと判断する。
一方、ユーザの「NO」という回答フレーズが音声認識部38で認識された場合には、対話処理部36は、ユーザが電話番号に対応付けられるアプリケーションを起動しないことを選択したと判断する。この場合、対話処理部36は対話処理を終了する。
次に、第3の音声案内では、メール本文から抽出された宛先情報の中に、選択された種類の宛先情報が複数存在する場合、同一種類の複数の宛先情報のうちの1つの宛先情報の選択を促すための案内がユーザに提供される。具体的には、対話処理部36は、「どの電話番号にアクションをしますか?『09012345678』、『0903344567』、『キャンセル』」という質問フレーズを表わす音声を、音声出力部22を通じてユーザに出力する。なお、上述した第2の音声案内と同様に、電話番号が電話帳に登録されている連絡先である場合には、電話番号を表わす音声に代えて、もしくは電話番号を表わす音声とともに連絡先を表わす音声を出力してもよい。
音声認識部38は、質問フレーズに対するユーザの応答内容(回答フレーズ)を音声認識する。対話処理部36は、音声認識部38により認識された応答内容から、ユーザが選択した宛先情報を検出する。具体的には、ユーザの「09012345678」という回答フレーズを表わす音声が音声入力部24で検出され、検出された回答フレーズが音声認識部38で認識されることにより、対話処理部36は、ユーザが「09012345678」という電話番号を選択したことを検出する。あるいは、『09012345678』に対応する連絡先を含む回答フレーズを表わす音声が音声入力部24で検出され、検出された回答フレーズが音声認識部38で認識されることにより、対話処理部36は、ユーザが「09012345678」という電話番号を選択したことを検出する。
なお、ユーザの「キャンセル」という回答フレーズが音声認識部38で認識された場合、対話処理部36は、ユーザがいずれの電話番号に対してもアプリケーションを起動しないことを選択したと判断し、対話処理を終了する。
上記の第1から第3の音声案内に応答することによってユーザが宛先情報を選択すると、対話処理部36は、テーブル40(図3)を参照することにより、選択された宛先情報に対応付けられるアプリケーションを特定する。具体的には、対話処理部36は、「09012345678」という電話番号に対応付けられるアプリケーションとして、電話アプリ、電話帳アプリ、およびSMSアプリを特定する。
次に、対話処理部36は、ユーザによって選択された宛先情報に複数のアプリケーションが対応付けられる場合には、複数のアプリケーションの中から1つのアプリケーションの選択を促すための案内を、音声出力部22を通じてユーザに提供する。ユーザに提供される案内は、たとえば、図6に示す第4の音声案内により構成される。
第4の音声案内では、複数のアプリケーションにそれぞれ関連付けられる複数のアクションが提示され、これら複数のアクションの中から1つのアクションの選択を促すための案内がユーザに提供される。具体的には、対話処理部36は、テーブル40(図3)を参照することにより、「電話アプリ」、「電話帳アプリ」、「SMSアプリ」にそれぞれ関連付けられるアクションとして、「発信」、「電話帳登録」、「SMS送信」を特定する。そして、対話処理部36は、これらの特定されたアクションに基づいて、「どのアクションをしますか?『発信』、『電話帳登録』、『SMS送信』、『キャンセル』」という質問フレーズを表わす音声を、音声出力部22を通じてユーザに出力する。なお、第4の音声案内において、複数のアプリケーション(複数のアクション)を提示する順番は、テーブル40(図3)において各アプリケーションに付された優先順位に従って設定することができる。
音声認識部38は、質問フレーズに対するユーザの応答内容(回答フレーズ)を音声認識する。対話処理部36は、音声認識部38により認識された応答内容から、ユーザが選択したアプリケーションを検出する。具体的には、ユーザの「発信」という回答フレーズを表わす音声が音声入力部24で検出され、検出された回答フレーズが音声認識部38で認識されることにより、対話処理部36は、ユーザが「電話アプリ」を選択したことを検出する。
なお、ユーザの「キャンセル」という回答フレーズが音声認識部38で認識された場合、対話処理部36は、ユーザがいずれのアプリケーションも起動しないことを選択したと判断し、対話処理を終了する。
以上のようにして、対話処理部36は、受信したメールの本文から抽出された宛先情報に基づいて、ユーザとの間で対話処理を実行する。図6に示す対話処理の一例では、通信端末1から提供される第1から第3の音声案内にユーザが応答することにより、抽出された複数の宛先情報の中から1つの宛先情報(たとえば、「09012345678」)が選択される。そして、第4の音声案内にユーザが応答することにより、選択した宛先情報に対応付けられる複数のアプリケーションの中から、起動するアプリケーション(たとえば、電話アプリ)が選択される。
対話処理部36は、起動するアプリケーション(電話アプリ)が選択されたと判断すると、対話処理を終了し、選択されたアプリケーション(電話アプリ)を起動する。選択されたアプリケーションを起動すると、制御部14は、当該アプリケーション(電話アプリ)に関連付けられたアクション(発信)を実行する。
なお、第1〜第3の音声案内に応答して、ユーザがメールアドレス(たとえば、「FL@XXX.com」)を選択した場合には、対話処理部36は、テーブル40(図3)を参照して、メールアドレスに対応付けられる複数のアプリケーション(電子メールアプリ、SMSアプリ、電話帳アプリ)を特定する。そして、対話処理部36は、第4の音声案内において、電子メールアプリ、SMSアプリ、電話帳アプリのうち、どのアプリケーションを起動するかの選択をユーザに促す。具体的には、対話処理部36は、「どのアクションをしますか?『E−mail送信』、『SMS送信』、『電話帳登録』、『キャンセル』」という質問フレーズを表わす音声を、音声出力部22を通じてユーザに出力する。なお、第4の音声案内に応答してユーザが電子メールアプリを選択した場合には、電子メールアプリが既に起動しているため、直ちにアクション(E−mail送信)が実行される。
また、第1〜第3の音声案内に応答して、ユーザがURL(たとえば、「http://aaa.bbb.com」)を選択した場合には、対話処理部36は、テーブル40(図3)を参照して、URLに対応付けられる複数のアプリケーション(Webブラウザ、ブックマークアプリ、電話帳アプリ)を特定する。そして、対話処理部36は、第4の音声案内において、Webブラウザ、ブックマークアプリ、電話帳アプリのうち、どのアプリケーションを起動するかの選択をユーザに促す。具体的には、対話処理部36は、「どのアクションをしますか?『ブラウザ起動』、『ブックマーク登録』、『電話帳登録』、『キャンセル』」という質問フレーズを表わす音声を、音声出力部22を通じてユーザに出力する。
以上説明したように、本実施の形態に係る通信端末によれば、メッセージ読上げ機能によって受信メッセージの本文が音声で読上げられた後、受信メッセージの本文から抽出した宛先情報に基づいてユーザとの間で対話処理が実行されることにより、ユーザは、受信メッセージの本文から宛先情報を選択することができる。これにより、メッセージ読上げ機能が動作する場面においても宛先情報を有効活用できるため、ユーザの使い勝手を向上させることができる。
また、本実施の形態に係る通信端末によれば、メッセージ読上げ機能がオフに設定されている場合には、受信メッセージの本文から抽出した宛先情報のリストが表示される。これにより、ユーザにとって宛先情報の選択が容易となる。
なお、上記の実施の形態では、メールの本文の読み上げが完了してから選択された宛先情報に対応付けられるアプリケーションを起動するまでの間、対話処理を実行する構成を例示したが、本実施の形態における「アプリケーションを起動するための対話処理」には、上記構成以外に、メールの本文の読み上げが完了してからアプリケーションを起動するまでの間の一部分において対話処理を実行する構成も含まれることを確認的に記載する。
(変形例1)
上記の実施の形態では、メッセージ読上げ機能がオンに設定されている場合には、メッセージの本文を表示部20の画面に表示した状態で、メッセージ読上げ部32によりメッセージの本文を音声で読上げる構成について説明したが、表示部20がタッチスクリーンのディスプレイである場合には、メッセージの本文の読上げ中に、ユーザの指が誤ってディスプレイ上の宛先情報が表示された位置を触れてしまう可能性がある。このような場合、タッチパネル(入力部26)がユーザの指が触れた宛先情報を検出することによって、検出した宛先情報に対応付けられるアプリケーションが誤って起動するという不具合が起きてしまう。
そこで、本実施の形態の変形例1に係る通信端末では、メッセージ読上げ部32によるメッセージの本文の読上げ中は、タッチパネル(入力部26)への入力操作の受け付けを無効とする。
図7は、実施の形態の変形例1に係る通信端末において受信された電子メールが表示されるときの処理を示すフローチャートである。図7を参照して、通信端末1の制御部14は、図4と同様のステップS01〜S14により、メッセージ読上げ機能のオン/オフに応じて、受信メールの本文の表示および宛先情報のリストの表示、または、受信メールの本文の表示、メール本文の読上げおよび対話処理を実行する。
さらに、制御部14は、メッセージ読上げ機能がオンに設定されている場合には、図4と同様のステップS08により、受信メールの本文をディスプレイ(表示部20)に表示すると、ステップS081により、タッチパネル(入力部26)への入力操作の受け付けを無効とする。これにより、メール本文の読上げ中にユーザの指がディスプレイを触れたことによって、アプリケーションが誤って起動するのを防止することができる。
(変形例2)
図7の変形例1では、メッセージの本文の読上げ中はタッチパネル(入力部26)を無効としたが、図8に示すように、メッセージの本文の読上げ中にメッセージの本文を表示部20に表示しない構成としても同様の効果を得ることができる。
図8は、実施の形態の変形例2に係る通信端末において受信された電子メールが表示されるときの処理を示すフローチャートである。図8を参照して、通信端末1の制御部14は、メッセージ読上げ機能がオフに設定されている場合(ステップS02のNO判定時)には、図4と同様のステップS03〜S07により、受信メールの表示および宛先情報のリストの表示を実行する。
一方、メッセージ読上げ機能がオンに設定されている場合(ステップS02のYES判定時)には、制御部14は、メッセージの本文をディスプレイ(表示部20)に表示することなく、図4のステップS09〜S14により、メール本文の読上げおよび対話処理を実行する。このように、メール本文の読上げ中、ディスプレイにはメール本文が表示されないため、たとえユーザの指がディスプレイを触れた場合であっても、アプリケーションが誤って起動するのを防止することができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。