以下、電話システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、留守番電話の音声を蓄積し、電話機に送信するサーバ装置と、留守番電話の音声を出力する電話機を有する電話システムであって、電話機で留守番電話の音声の話者の感情を示すアイコン等を表示できる電話システムについて説明する。
図1は、本実施の形態における電話システムの概念図である。電話システムは、留守番電話の音声を入力する第二電話機11、留守番電話の音声を蓄積し、電話機13に送信するサーバ装置12、留守番電話を出力する電話機13を有する。電話システムは、通常、1以上の第二電話機11、1以上の電話機13を有する。電話システムが有するサーバ装置12は、通常、一つであるが、2以上のサーバ装置12で分散処理しても良い。
図2は、本実施の形態における電話システムのブロック図である。第二電話機11は、通常の電話機能を有する電話機であり、いわゆる携帯電話機であっても、固定式の電話機であっても良い。第二電話機11は公知の電話機であるので、詳細な説明を省略する。
サーバ装置12は、音声格納部1201、音声情報受信部1202、音声蓄積部1203、音声解析部1204、話者情報蓄積部1205、不在着信情報送信部1206、出力指示受信部1207、留守番電話音声送信部1208を具備する。
電話機13は、いわゆる携帯電話機であっても、固定式の電話機であっても良い。また、電話機13は、Lモード(登録商標)機能を有する電話機であっても良い。電話機13は、不在着信情報格納部1301、不在着信情報受信部1302、不在着信情報蓄積部1303、表示情報構成部1304、留守電情報表示部1305、受付部1306、出力指示送信部1307、留守番電話音声受信部1308、留守番電話音声出力部1309を具備する。
表示情報構成部1304は、アイコン格納手段13041、アイコン取得手段13042、表示情報構成手段13043を具備する。
音声格納部1201は、電話機13を識別する情報である電話機識別子と、留守番電話の音声と、話者の感情を示す情報である感情情報と、第二電話機11を識別する情報である第二電話機識別子と、留守番電話を受け付けた時刻を示す時刻情報を対に有する留守番電話情報を1以上、格納し得る。留守番電話情報は、留守番電話の音声と感情情報のみを有しても良い。留守番電話情報は、電話機識別子、音声、感情情報、第二電話機識別子および時刻情報以外の情報を有しても良い。電話機識別子と第二電話機識別子は、例えば、電話番号であるが、IPアドレスやMACアドレスなどの電話機を特定する他の情報でも良い。また、電話機識別子や第二電話機識別子は、電話を受ける人や、電話をした人を特定する情報でも良い。電話を受ける人や、電話をした人を特定する情報は、例えば、指紋や虹彩や顔認識などの人体認証により取得した情報でも良い。感情情報における感情とは、例えば、「怒り」「困惑」「喜び」「悲しみ」などの感情を識別する感情識別情報である。また、感情情報は、例えば、感情識別情報と、「怒り」「困惑」「喜び」「悲しみ」などの感情の度合いを示す度合情報を有する情報である。例えば、「怒り」が大きい時には、感情情報は、例えば、「A,10」である。「A」は「怒り」を示す。各感情の程度は、例えば、「1〜10」で示される。また、例えば、「困惑」「喜び」「悲しみ」は、それぞれ「B」「C」「D」に対応する。従って、例えば、感情情報が「C,8」である場合、かなり喜びが大きい、ということになる。また、感情情報は、「怒り」「困惑」「喜び」「悲しみ」を識別する情報だけでも良い。例えば、「A」は「怒り」、「B」「C」「D」はそれぞれ「困惑」「喜び」「悲しみ」を示す。また、感情情報は、感情を視覚的に示すアイコンなどの図柄や、第二電話機識別子で識別されるユーザの写真などでも良い。なお、写真は、例えば、電話機13がカメラ付携帯電話で、当該カメラで撮影した写真が自動的に登録されることが望ましい。また、感情情報は、アイコンと感情識別情報の組でも良い。また、感情情報のデータ構造は問わない。また、第二電話機識別子が空の場合、第二電話機11のユーザが非通知で通話したことを示す。音声格納部1201は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
音声情報受信部1202は、話者が保有する第二電話機11から、電話機13の電話機識別子と留守番電話の音声と第二電話機11を識別する第二電話機識別子を受信する。なお、第二電話機11から電話機13への通話の要求を受け付け、一定時間以上、電話機13からの応答がない場合に、留守番電話のモードに変更される等、留守番電話機能が動作する処理は公知技術であるので、詳細な説明を省略する。また、音声情報受信部1202が受信する音声は、アナログでもデジタルでも良い。アナログの音声を受信する場合、通常、音声解析のためにデジタルデータに変換する。また、音声情報受信部1202は、電話機識別子と留守番電話の音声のみを受信しても良い。さらに、音声情報受信部1202における音声の受信と、電話機識別子や第二電話機識別子の受信のタイミングは問わない。音声情報受信部1202は、無線の通信手段(携帯電話網を利用した無線通信)が好適であるが、有線の通信手段でも実現可能である。
音声蓄積部1203は、音声情報受信部1202が受信した情報(例えば、電話機識別子と音声と第二電話機識別子)を音声格納部1201に蓄積する。電話機識別子と音声等は、対応付けられて蓄積される。ただし、電話機識別子と音声等の対応付けの手段は、リンクや一のバッファへの格納等、問わない。音声蓄積部1203は、音声情報受信部1202が音声等を受信した時刻を示す時刻情報をも音声格納部1201に蓄積することは好適である。なお、音声蓄積部1203は、図示しない時計を保持しており、当該時計から時刻情報を取得し、音声格納部1201に蓄積する。音声蓄積部1203は、通常、MPUやメモリ等から実現され得る。音声蓄積部1203の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROMやフラッシュメモリ等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
音声解析部1204は、音声情報受信部1202が受信した音声を解析し、話者の感情を示す情報である感情情報を取得する。「音声情報受信部1202が受信した音声を解析する」とは、音声格納部1201に存在する音声を読み出して、解析することも含む。つまり、音声解析部1204における解析処理は、音声蓄積部1203のおける音声の蓄積後でも、蓄積前でも良い。ここで、「解析」とは、例えば、音声の特徴抽出である。音声の特徴抽出とは、発話された音声のピッチ、音声の基本周波数(F0)、第二フォルマント周波数(F2)、第三フォルマント周波数(F3)、スペクトラム、音の強さ、音圧、発話速度、会話の間、イントネーション、レスポンスタイプなどの情報(特徴量)を取得することである。音声解析部1204が、音声を解析し、如何なる音声の特徴量を取得するかは問わない。通常、音声解析部1204は、音声をフレームに分割し、フレームごとに音声解析を行い、フレームごとに取得した複数の特徴量(特徴ベクトル)の列(特徴ベクトル系列)から、音声の感情のカテゴリー(例えば、「怒り」「困惑」「喜び」「悲しみ」のうちの、どのカテゴリーかを示す情報)を得る。なお、この音声の感情のカテゴリーは、感情識別情報である。また、音声解析部1204は、感情識別情報と、その度合いを示す度合情報を得る。例えば、音声解析部1204は、解析によって得た音声の時系列波形において、振幅が強く、時間長が短い場合に、「怒り」の感情であると判断する。また、怒り時の音の強さは、平静時と比べ、通常、10dB程度は高い。これは、他の感情とも著しく異なっており、音の強さは、怒りの感情を判別する特徴ベクトルとして用いられる。音声解析部1204の処理は公知技術(上記特許文献1や非特許文献2など)であるので、詳細な説明を省略する。音声解析部1204は、通常、MPUやメモリ等から実現され得る。音声解析部1204の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROMやフラッシュメモリ等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、音声解析部1204は、実施の形態4で詳述するように、無声の音声を認識しても良い。
話者情報蓄積部1205は、音声解析部1204が取得した感情情報を、音声に対応付けて音声格納部1201に蓄積する。ここで、対応付ける音声は、音声解析部1204における解析対象の音声である。話者情報蓄積部1205は、通常、MPUやメモリ等から実現され得る。話者情報蓄積部1205の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
不在着信情報送信部1206は、電話機13に不在着信を示す情報であり、感情情報を有する1以上の不在着信情報を、感情情報と対になる電話機識別子で識別される電話機13に送信する。不在着信情報送信部1206は、例えば、電話機13からの要求(この要求は、例えば、電話機識別子を含む)に応じて、電話機識別子をキーとして、音声格納部1201を検索し、音声格納部1201から電話機識別子と対になる感情情報と、第二電話機識別子と、留守番電話を受け付けた時刻を示す時刻情報を読み出し、不在着信情報を構成する。本電話機識別子と対になる留守番電話が2件以上格納されている場合、不在着信情報送信部1206は、2以上の不在着信情報(不在着信情報のリスト)を構成する。そして、不在着信情報送信部1206は、1以上の不在着信情報を電話機識別子で識別される電話機13に送信する。不在着信情報送信部1206は、無線または有線の通信手段等で実現され得る。
出力指示受信部1207は、電話機13からの留守番電話の音声の出力指示を受信する。出力指示は、通常、出力する音声を識別する情報を含む。出力指示受信部1207は、無線の通信手段が好適であるが、有線の通信手段でも実現可能である。無線または有線の通信手段等で実現され得る。通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
留守番電話音声送信部1208は、出力指示受信部1207が出力指示を受信した場合、当該出力指示に対応する留守番電話の音声を音声格納部1201から読み出し、当該読み出した留守番電話の音声を、出力指示を送信した電話機13に送信する。留守番電話音声送信部1208は、無線または有線の通信手段等で実現され得る。
不在着信情報格納部1301は、1以上の不在着信情報を格納し得る。この不在着信情報は、不在着信情報蓄積部1303が蓄積した情報である。不在着信情報格納部1301は、ハードディスク等の不揮発性の記録媒体が好適であるが、RAM等の揮発性の記録媒体でも実現可能である。
不在着信情報受信部1302は、サーバ装置12から、感情情報を有する1以上の不在着信情報を受信する。不在着信情報の受信について、電話機13のユーザからの指示の入力に応じて、サーバ装置12に不在着信情報の送信を指示し、その結果、1以上の不在着信情報を受信しても良いし、サーバ装置12から通信可能な状態にある電話機13へ自動的に1以上の不在着信情報を送信し、不在着信情報受信部1302が1以上の不在着信情報を受信しても良い。不在着信情報受信部1302が自動的に1以上の不在着信情報を受信するために、例えば、不在着信情報受信部1302は、定期的にサーバ装置12を検索しに行っても良いし、サーバ装置12が留守番電話の音声等を第二電話機11から受信した場合に、対応する電話機13に不在着信情報を送信しても良い。不在着信情報受信部1302は、無線の通信手段が好適であるが、有線の通信手段でも実現可能である。
表示情報構成部1304は、不在着信情報受信部1302が受信した1以上の不在着信情報を取得し、各不在着信情報に対応する1以上の表示情報を構成する。表示情報とは、電話機13が有する表示手段(図示しない)に表示する情報(表示する元になる情報)であり、感情を識別する情報を含む情報である。感情を識別する情報とは、例えば、感情を視覚的に示すアイコンである。アイコンとは、顔を示す図柄でも良いし、第二電話機11の話者の顔写真や、感情を示す文字列や、感情を示す動画等でも良く、広く解する。感情を識別する情報とは、感情情報と同じでも良いし、感情情報を用いて取得される情報(上記、アイコンなど)でも良い。また、表示情報構成部1304は、各表示情報を構成する元になった感情情報をキーとして、2以上の表示情報をソートして、2以上の表示情報のリストを構成することは好適である。表示情報構成部1304は、感情識別情報ごとに不在着信リストの項目をカテゴライズして表示できるように2以上の表示情報を構成することは好適である。表示情報の構成とは、表示するためのバッファに書き込む処理でも良いし、表示のための画面を構築する処理でも良い。表示情報構成部1304は、通常、MPUやメモリ等から実現され得る。表示情報構成部1304の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
アイコン格納手段13041は、感情情報、または感情情報と話者属性に対応するアイコンを格納し得る。ここでのアイコンは、上記の感情を識別する情報に該当する。アイコン格納手段13041は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
アイコン取得手段13042は、1以上の不在着信情報ごとに、各不在着信情報が有する感情情報、または各不在着信情報が有する感情情報と話者属性をキーとして、アイコン格納手段13041からアイコンを取得する。アイコン取得手段13042は、通常、MPUやメモリ等から実現され得る。アイコン取得手段13042の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
表示情報構成手段13043は、1以上の不在着信情報ごとに、アイコン取得手段13042が取得したアイコンを有する1以上の表示情報を構成する。表示情報は、例えば、アイコンと、不在着信情報が有する第二電話機識別子と、留守番電話を受け付けた時刻を示す時刻情報を有する。なお、表示情報構成手段13043は、第二電話機識別子をキーとして、電話機13が保持している電話帳情報を図示しない手段により検索し、第二電話機識別子と対になる氏名やニックネームを表示情報に含めても良い。第二電話機識別子から氏名を検索する技術は公知技術であるので詳細な説明を省略する。表示情報構成手段13043は、通常、MPUやメモリ等から実現され得る。表示情報構成手段13043の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
留守電情報表示部1305は、表示情報構成部1304が構成した1以上の表示情報を表示手段(図示しない)に表示する。なお、表示手段は、通常、液晶ディスプレイであるが、他の表示媒体(例えば、CRT、有機EL、PDP、プロジェクター等)でも良い。留守電情報表示部1305は、外部のディスプレイ(例えば、テレビ)に、通信手段を用いて1以上の表示情報を送信する処理を行っても良い。かかる送信処理も、表示手段に表示する処理である。留守電情報表示部1305は、通常、ディスプレイのドライバーソフトまたは、ディスプレイのドライバーソフトとディスプレイ等で実現され得る。
受付部1306は、留守電情報表示部1305が表示した1以上の表示情報のうちの一の表示情報の選択の入力であり、当該選択された表示情報に対応する留守番電話の音声の出力指示の入力を、ユーザから入力手段により、受け付ける。ユーザは、表示手段に表示された留守番電話のリスト(例えば、感情を示すアイコンを含むリスト)から、音声出力する留守番電話を、十字カーソルやテンキー等の入力手段を用いて選択する。そして、受付部1306は、かかる選択を受け付ける。かかる選択の結果、生じる指示は、ここでは、出力指示である。出力指示は、例えば、「send 音声ID」である。「send」は、留守番電話の音声を送信せよ、との指示であり、「音声ID」は送信を要求した留守番電話の音声を識別するIDである。受付部1306は、他の指示やデータなどを受け付けても良いことは言うまでもない。他の指示とは、例えば、不在着信リストを出力させる指示である不在着信リストの出力指示である。出力指示等の入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。受付部1306は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
出力指示送信部1307は、受付部1306が受け付けた出力指示を、サーバ装置12に送信する。出力指示送信部1307は、無線または有線の通信手段等で実現され得る。
留守番電話音声受信部1308は、出力指示送信部1307における出力指示の送信に対応して、サーバ装置12から留守番電話の音声を受信する。留守番電話音声受信部1308は、無線の通信手段が好適であるが、有線の通信手段でも実現可能である。
留守番電話音声出力部1309は、留守番電話音声受信部1308が受信した留守番電話の音声を出力する。留守番電話音声出力部1309は、例えば、留守番電話音声受信部1308が受信した留守番電話の音声を、一度、記憶媒体(図示しない)に記録し、当該記憶媒体上の音声を読み出しながら、スピーカーから音声出力する。
留守番電話音声出力部1309は、スピーカーを含むと考えても含まないと考えても良い。留守番電話音声出力部1309は、スピーカーのドライバーソフトまたは、スピーカーのドライバーソフトとスピーカー等で実現され得る。
次に、電話システムの動作について説明する。まず、第二電話機11は、留守番電話の音声を入力し、サーバ装置12に留守番電話の音声と、第二電話機識別子、電話機識別子を送信する処理を行う。第二電話機11は、公知の装置であるので、詳細な説明を省略する。なお、第二電話機識別子で識別される第二電話機11は、電話をかけた話者が保持している電話機である。電話機識別子で識別される電話機13は、電話をかけられた方の電話機である。
次に、サーバ装置12の動作について図3のフローチャートを用いて説明する。なお、図3のフローチャートにおいて、留守番電話の音声を音声格納部1201に蓄積する処理は公知技術であるので、説明を省略する。音声情報受信部1202が、第二電話機11から、留守番電話の音声、第二電話機11の第二電話機識別子、電話機13の電話機識別子を受信し、音声蓄積部1203が留守番電話の音声、第二電話機識別子、電話機識別子、および時刻情報を対にして蓄積する。なお、音声蓄積部1203は、図示しない時計から時刻情報を取得するものとする。
次に、サーバ装置12における音声の感情判断の処理、不在着信情報の送信処理等について、図3のフローチャートを用いて説明する。
(ステップS301)不在着信情報送信部1206は、不在着信情報を送信するタイミングか否かを判断する。不在着信情報を送信するタイミングであればステップS302に行き、不在着信情報を送信するタイミングでなければステップS305に行く。なお、不在着信情報を送信するタイミングであるとは、例えば、電話機13から不在着信情報の送信指示を受信した場合である。また、不在着信情報を送信するタイミングであるとは、例えば、定期的に不在着信情報を送信することとしており、保持している時計から取得した時刻が、その送信時になったことである。
(ステップS302)不在着信情報送信部1206は、不在着信情報を送信する電話機識別子を取得する。電話機13から不在着信情報の送信指示を受信する場合、電話機識別子は、例えば、不在着信情報の送信指示に含まれている。また、定期的に不在着信情報を送信する場合、電話機識別子は、音声格納部1201に格納されている情報である。
(ステップS303)不在着信情報送信部1206は、ステップS302で取得した電話機識別子をキーとして、音声格納部1201を検索し、電話機識別子と対になる感情情報、第二電話機識別子、時刻情報などを取得する。かかる感情情報、第二電話機識別子、時刻情報などが、ここでは、不在着信情報である。また、不在着信情報送信部1206は、通常、電話機識別子と対になる感情情報を含む不在着信情報をすべて取得し、メモリ上に配置する。なお、このすべての不在着信情報は、適宜、不在着信リストとも言う。
(ステップS304)不在着信情報送信部1206は、ステップS303で取得した1以上の不在着信情報を、ステップS302で取得した電話機識別子で識別される電話機13に送信する。ステップS301に戻る。
(ステップS305)出力指示受信部1207は、電話機13から出力指示を受信したか否かを判断する。出力指示を受信すればステップS306に行き、出力指示を受信しなければステップS309に行く。
(ステップS306)留守番電話音声送信部1208は、ステップS305で受信した出力指示を読み出し、当該出力指示に含まれる音声ID(送信する音声を識別する情報)、電話機識別子を取得し、メモリ上に配置する。
(ステップS307)留守番電話音声送信部1208は、ステップS306で取得した音声IDをキーとして、音声格納部1201を検索し、音声IDに対応する留守番電話の音声を読み出す。
(ステップS308)留守番電話音声送信部1208は、ステップS307で読み出した音声を、ステップS306で取得した電話機識別子で識別される電話機13に送信する。ステップS301に戻る。
(ステップS309)音声解析部1204は、カウンタiに1を代入する。
(ステップS310)音声解析部1204は、i番目の留守番電話の音声が、音声格納部1201に存在するか否かを判断する。i番目の留守番電話の音声が存在すればステップS311に行き、i番目の留守番電話の音声が存在しなければステップS301に戻る。
(ステップS311)音声解析部1204は、音声格納部1201から、i番目の音声に対応する感情情報(i番目の感情情報)を読み出す。
(ステップS312)音声解析部1204は、i番目の感情情報が空であるか否か(i番目の音声に対する感情判断の処理が未処理か否か)を判断する。感情判断が未処理であればステップS313に行き、感情判断が未処理でなければステップS317に行く。なお、感情判断が未処理か否かの判断方法は、感情情報が空であるか否かを判断する以外に、感情判断処理の完了/未完了を示すフラグ(例えば、完了は「1」、未完了は「0」など)を読み出して判断するなど、他の判断方法でも良い。
(ステップS313)音声解析部1204は、音声格納部1201からi番目の音声を読み出し、メモリ上に配置する。
(ステップS314)音声解析部1204は、i番目の音声を解析し、特徴ベクトルを抽出し、メモリ上に配置する。
(ステップS315)音声解析部1204は、ステップS314で抽出したi番目の音声の特徴ベクトルを用いて、感情を判定し、感情情報を取得する。
(ステップS316)話者情報蓄積部1205は、ステップS315で取得した感情情報を、i番目の音声に対応付けて音声格納部1201に蓄積する。
(ステップS317)音声解析部1204は、カウンタiを1、インクリメントする。ステップS310に戻る。
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
また、図3のフローチャートにおいて、新しく蓄積された音声の順に蓄積されており、音声の解析処理は、新たに蓄積された音声から行い、解析済みの音声が出てきたところで解析処理を終了することが望ましい。
次に、電話機13の動作について、図4のフローチャートを用いて説明する。
(ステップS401)不在着信情報受信部1302は、不在着信情報を受信したか否かを判断する。不在着信情報を受信すればステップS402に行き、不在着信情報を受信しなければステップS403に行く。なお、不在着信情報受信部1302は、1以上の不在着信情報をリストで受信しても良いし、不在着信情報を一つずつ受信しても良い。
(ステップS402)不在着信情報蓄積部1303は、ステップS401で受信した1以上、または一の不在着信情報を不在着信情報格納部1301に蓄積する。ステップS401に戻る。
(ステップS403)受付部1306は、不在着信リストの出力指示を受け付けたか否かを判断する。出力指示を受け付ければステップS404に行き、出力指示を受け付けなければステップS415に行く。
(ステップS404)表示情報構成部1304は、カウンタiに1を代入する。
(ステップS405)表示情報構成部1304が具備するアイコン取得手段13042は、不在着信情報格納部1301にi番目の不在着信情報が存在するか否かを判断する。i番目の不在着信情報が存在すればステップS405に行き、i番目の不在着信情報が存在しなければステップS412に行く。なお、「不在着信情報」は、「不在着信リスト項目」と同意義である。
(ステップS406)アイコン取得手段13042は、i番目の不在着信情報を、不在着信情報格納部1301から読み出す。
(ステップS407)アイコン取得手段13042は、ステップS405で読み出したi番目の不在着信情報から感情情報を取得し、メモリ上に配置する。
(ステップS408)アイコン取得手段13042は、ステップS406で取得した感情情報をキーとして、アイコン格納手段13041を検索し、アイコンをメモリ上に読み出す。
(ステップS409)表示情報構成手段13043は、i番目の不在着信情報から、第二電話機識別子や時刻情報やなどの他の情報を取得し、メモリ上に配置する。
(ステップS410)表示情報構成手段13043は、ステップS408で取得したアイコン、ステップS409で取得した第二電話機識別子や時刻情報などの情報を用いて、表示する元になる表示情報を構成する。ここでの表示情報の構成とは、例えば、所定のバッファに、感情情報(ステップS407で取得)やアイコンや第二電話機識別子や時刻情報などの情報を書き込むことである。
(ステップS411)表示情報構成手段13043は、カウンタiを1、インクリメントする。ステップS405に戻る。
(ステップS412)表示情報構成手段13043は、2以上の表示情報について、各表示情報を構成する元になった感情情報をキーとして、2以上の表示情報をソートして、2以上の表示情報のリストを構成する。このソート処理により、例えば、喜びを示すアイコンに対応する留守番電話の情報と、悲しみを示すアイコンに対応する留守番電話の情報が分離される。つまり、ソート処理により、蓄積されている留守番電話のリストが、電話をかけた話者の感情に応じてカテゴリー分けされる。
(ステップS413)表示情報構成手段13043は、出力する表示情報のリスト(不在着信リスト)を構成する。
(ステップS414)留守電情報表示部1305は、ステップS413で構成した不在着信リストを表示手段に表示する。ステップS401に戻る。
(ステップS415)受付部1306は、留守番電話の音声の出力指示を受け付けたか否かを判断する。出力指示を受け付ければステップS416に行き、出力指示を受け付けなければステップS401に戻る。なお、ステップS415の前には、不在着信リストがディスプレイに表示されている状態である、とする。
(ステップS416)出力指示送信部1307は、サーバ装置12に送信する出力指示を構成する。なお、出力指示送信部1307は、例えば、格納している電話機13の電話機識別子を読み出し、指示された留守番電話の音声を識別する音声IDを取得し、電話機識別子および音声IDを有する出力指示を構成する。出力指示は、例えば、「send_message 音声ID,電話機識別子」である。
(ステップS417)出力指示送信部1307は、ステップS416で構成した出力指示をサーバ装置12に送信する。なお、出力指示送信部1307は、予めサーバ装置12と通信するための情報(サーバ装置12のIPアドレスや電話番号など)を保持している、とする。
(ステップS418)留守番電話音声受信部1308は、サーバ装置12から留守番電話の音声を受信したか否かを判断する。音声を受信すればステップS419に行き、音声を受信しなければステップS421に行く。
(ステップS419)留守番電話音声出力部1309は、ステップS418で受信した音声をメモリ上に読み出し、スピーカーに音声出力する。
(ステップS420)留守番電話音声出力部1309は、出力した音声に対応する不在着信情報であり、不在着信情報格納部1301の不在着信情報を削除する。また、留守番電話音声出力部1309は、不在着信情報を削除する代わりに、不在着信情報に対応する音声を出力したことを示すフラグ(例えば、「1」)を不在着信情報格納部1301に書き込んでも良いし、不在着信情報の音声の未出力を示すアイコンを削除しても良いし、不在着信情報の音声を出力済みであることを示すアイコンを追記しても良い。ステップS401に戻る。
(ステップS421)留守番電話音声受信部1308は、タイムアウトか否かを判断する。タイムアウトであればステップS401に戻り、タイムアウトでなければステップS418に戻る。なお、タイムアウトとは、出力指示をサーバ装置12に送信してから、所定時間以上、音声を受信しなかったことである。
なお、図4のフローチャートにおいて、表示情報をソートする処理(ステップS412の処理)は行わなくても良い。
なお、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
以下、本実施の形態における電話システムの具体的な動作について説明する。電話システムの概念図は図1である。
今、電話機13の表示情報構成部1304のアイコン格納手段13041は、図5に示すアイコン管理表を保持している、とする。アイコン管理表は、「感情情報」と「アイコン」を有するレコードを複数保持している。このアイコンは、感情情報に対応して表示されるアイコンである。
また、サーバ装置12は、多数の第二電話機11からの留守番電話の音声や第二電話機識別子や電話機識別子や時刻情報等を音声格納部1201に蓄積していく。なお、留守番電話の音声を蓄積する技術は公知技術であるので、詳細な説明を省略する。そして、音声格納部1201は、図6に示す留守番電話情報管理表を保持することとなる、とする。留守番電話情報管理表は、「ID」「電話機識別子」「第二電話機識別子」「時刻情報」「感情情報」「音声」を有する。「ID」は、レコードを識別する情報であり、表におけるレコード管理のために存在する。「電話機識別子」は、電話の相手先を識別する情報を示す属性であり、ここでは、電話機13の電話番号を示す属性である。また、「第二電話機識別子」は、電話をかけた者の電話機を識別する情報を示す属性であり、ここでは、第二電話機11の電話番号を示す属性である。「時刻情報」は、サーバ装置12が留守番電話を蓄積した時刻を格納する属性である。時刻情報は、サーバ装置12が保持している時計(図示しない)から、サーバ装置12内の図示しない手段が取得して、蓄積する情報である。「感情情報」は、音声解析部1204が音声を解析し、取得した感情情報であり、話者情報蓄積部1205が蓄積した感情情報を格納する属性である。「音声」は、ここでは、ファイルで保持されているが、保持されるデータ構造や形式は問わない。なお、図6における留守番電話情報管理表は、音声の解析前の管理表であり、感情情報が空となっている。
かかる状況で、音声解析部1204は、留守番電話情報管理表内の音声の解析を開始する、とする。つまり、まず、音声解析部1204は、例えば、1番目の留守番電話の音声から、感情情報が空である音声を、音声格納部1201に存在する留守番電話情報管理表から読み出し、メモリ上に配置する。そして、音声解析部1204は、まず、1番目の音声を解析し、特徴ベクトル系列を抽出し、メモリ上に配置する。音声解析部1204は、抽出した1番目の音声の特徴ベクトル系列を用いて、感情を、例えば、「悲しみ」と判定し、感情情報「悲しみ」を取得する。そして、話者情報蓄積部1205は、取得した感情情報「悲しみ」を、1番目の音声に対応付けて音声格納部1201の留守番電話情報管理表の属性「感情情報」の属性値として蓄積する。かかる処理を、すべての属性「感情情報」の属性値が埋まるまで繰り返す。なお、音声解析部1204が取得した特徴ベクトル系列から感情が鑑定できない場合は、「感情情報」は「空」としても良い。なお、かかる感情判定の技術は、上述したように公知技術であるので詳細な説明を省略する。
そして、話者情報蓄積部1205は、留守番電話情報管理表のすべてのレコードの属性「感情情報」の属性値を書き込む(上述したように、感情判定できなかった場合は、空でも良い)。そして、図7に示す留守番電話情報管理表が得られる。
次に、電話機識別子「090−1234−5678」で識別される電話機13を保有するユーザが、電話機13を操作し、不在着信情報の送信指示(電話機識別子「090−1234−5678」を含む送信指示)をサーバ装置12に送信した、とする。または、サーバ装置12は、設定された時刻やタイミングが到来し、不在着信情報の送信タイミングになった、と判断した、とする。
次に、サーバ装置12の不在着信情報送信部1206は、不在着信情報を送信する電話機識別子「090−1234−5678」を取得する。そして、不在着信情報送信部1206は、取得した電話機識別子「090−1234−5678」をキーとして、音声格納部1201の留守番電話情報管理表を検索し、電話機識別子「090−1234−5678」と対になる第二電話機識別子、時刻情報、感情情報を取得する、とする。そして、不在着信情報送信部1206は、図8に示す不在着信情報管理表を構成する。次に、不在着信情報送信部1206は、電話機識別子「090−1234−5678」で識別される電話機13に、図8に示す不在着信情報管理表を送信する。不在着信情報管理表のデータは、不在着信リストである。
次に、電話機識別子「090−1234−5678」で識別される電話機13の不在着信情報受信部1302は、図8に示す不在着信情報管理表を受信する。そして、不在着信情報蓄積部1303は、受信した図8に示す不在着信情報管理表を不在着信情報格納部1301に蓄積する。
次に、ユーザは、電話機13を操作し、不在着信リストの出力指示を入力した、とする。不在着信リストの出力指示の入力方法は問わない。メニュー画面からの入力でも、十字カーソルを用いての入力等でも良い。そして、電話機13の受付部1306は、不在着信リストの出力指示を受け付ける。なお、電話機13は、ユーザからの不在着信リストの出力指示を受けつけなくても、不在着信情報管理表を受信した場合に、直ちに、不在着信リストを表示する処理を行っても良い。
そして、表示情報構成部1304が具備するアイコン取得手段13042は、不在着信情報格納部1301から図8に示す不在着信情報管理表を読み出し、メモリ上に配置する。そして、不在着信情報管理表の1番目のレコードが有する感情情報をキーとして、図5のアイコン管理表を検索し、感情情報と対になるアイコンを読み出し、第二電話機識別子、時刻情報と対にメモリ上に配置する。また、表示情報構成手段13043は、各第二電話機識別子をキーとして、図示しない電子電話帳を検索し、氏名(ニックネームでも良い)の情報を取得し、アイコン、時刻情報と対にメモリ上に配置する。そして、以上の処理を、2番目以降のレコードに対しても繰り返し行う。以上の処理により、表示情報構成手段13043は、アイコン、時刻情報、氏名(ニックネームでも良い)の情報を対に有するレコードを1以上、メモリ上に保持することとなる。なお、第二電話機識別子を氏名(ニックネームでも良い)の情報に変換する技術は公知技術であるので、詳細な説明を省略する。
次に、留守電情報表示部1305は、表示情報構成手段13043がメモリ上に構成した不在着信リストを表示手段に表示する。かかる不在着信リストの表示例を図9に示す。図9において、カセットテープのアイコンは、留守番電話の音声を未だ出力していないことを示す。なお、音声出力後は、例えば、対応するカセットテープのアイコンの表示は消える。
次に、ユーザが、図9に示す感情を示すアイコンが付与された不在着信リストを見て、「ゆいちゃん」の喜びの音声を、「楽しいお誘いかな!」と考えて、一番優先して、当該「ゆいちゃん」の不在着信リスト項目を選択した、とする。つまり、本ユーザは、図9に示す不在着信リストの表示画面から、一番上の留守番電話の音声の出力指示を入力した、とする。すると、電話機13の受付部1306は、留守番電話の音声の出力指示を受け付ける。そして、出力指示送信部1307は、サーバ装置12に送信する出力指示(例えば、「送信指示_音声 548,090−1234−5678」)を構成する。「送信指示_音声」は、留守番電話の音声の送信を指示する命令である。「548」は、サーバ装置12における不在着信リストの項目を特定するIDである。「090−1234−5678」は、電話機13の電話機識別子である。そして、出力指示送信部1307は、出力指示(例えば、「送信指示_音声 548,090−1234−5678」)を送信する。なお、「090−1234−5678」は、電話機13が予め保持しており、出力指示送信部1307が読み出す情報である。
次に、サーバ装置12の出力指示受信部1207は、「090−1234−5678」で識別される電話機13から出力指示(例えば、「送信指示_音声 548,090−1234−5678」)を受信する。次に、留守番電話音声送信部1208は、受信した出力指示を読み出し、当該出力指示に含まれる音声ID(ここでは、例えば、「548」)、電話機識別子(例えば、「090−1234−5678」)を取得し、メモリ上に配置する。留守番電話音声送信部1208は、取得した音声ID(例えば、「548」)をキーとして、音声格納部1201の留守番電話情報管理表を検索し、音声ID「548」と同一の「ID」を有するレコードに含まれる留守番電話の音声(属性値「音声」)を読み出す。そして、留守番電話音声送信部1208は、読み出した音声を、取得した電話機識別子「090−1234−5678」で識別される電話機13に送信する。
次に、留守番電話音声受信部1308は、サーバ装置12から留守番電話の音声を受信する。そして、留守番電話音声出力部1309は、受信した音声をメモリ上に読み出し、スピーカーに音声出力する。
また、次に、ユーザは、困惑している「やっ君」の音声を聞こうと、当該リスト項目に対して出力指示を入力する。そして、上記と同様に、電話機13のユーザは、「やっ君」の留守番電話を聞くことができる。
そして、例えば、電話機13のユーザの気分が優れない場合、怒っている鈴木先輩の声を聞くのが躊躇われるので、気分転換に一杯飲みに行った後、鈴木先輩の留守番電話を聞こうと、決心する。
また、電話機13のユーザは、非通知で、無声の音声について、「非通知で、会話なしか。無視だな。」と考え、例えば、サーバ装置12に当該音声の削除、または当該不在着信リスト項目の削除を指示する。つまり、例えば、ユーザは、非通知で、無声の不在着信リスト項目を指示し、削除コマンドを入力する、とする。そして、電話機13は、例えば、「削除 8」という命令(例えば、「削除 ID」という構造を有する)を構成し、サーバ装置12に送信する。そして、サーバ装置12は「削除 8」という命令を受信し、「ID=8」で特定される不在着信リスト項目(図8参照)を削除する。
なお、上記の図9の不在着信リストの表示に変えて、図10に示すように、感情情報に基づいて不在着信リスト項目をソートして、不在着信リストを表示しても良い。かかる場合、表示情報構成手段13043は、2以上の表示情報(不在着信リスト項目)について、各表示情報を構成する元になった感情情報をキーとして、2以上の表示情報をソートして、2以上の表示情報のリストを構成する。ソートする順序は、例えば、「喜び」「困惑」「悲しみ」「怒り」「無声」の順にソートする。但し、ソートの順序は問わない。
以上、本実施の形態によれば、留守番電話を聞く前に、話者の感情が分かる電話システム等を提供できる。その結果、例えば、ユーザの現在の心理状態に応じて、聞きたくないであろう留守番電話を聞かずに済むための仕組みを提供できる。また、早く聞きたい電話の内容を容易に選択できる。また、感情情報に基づいて不在着信リスト項目をソートして、不在着信リストを表示した場合、早く聞きたい電話の内容をさらに容易に選択でき、また、聞きたくない複数の不在着信リスト項目も一目して判断できる。
なお、本実施の形態によれば、アイコンは、人の写真(特に、顔写真)でも良い。また、かかる場合、例えば、アイコン格納手段13041のアイコン管理表は、図11に示すように、第二電話機識別子(または電話の話者(氏名やニックネーム))ごとに、かつ感情情報ごとにアイコン(写真を含む)を管理していても良い。かかる場合、アイコン取得手段13042は、1以上の不在着信情報ごとに、各不在着信情報が有する感情情報、および第二電話機識別子をキーとして、アイコン格納手段13041からアイコンを取得する。なお、アイコン取得手段13042は、1以上の不在着信情報ごとに、各不在着信情報が有する感情情報、または各不在着信情報が有する感情情報と話者属性と、第二電話機識別子をキーとして、アイコン格納手段13041からアイコンを取得しても良い。話者属性が含まれる態様について、実施の形態2等で説明する。かかることは、他の実施の形態においても同様である。
また、本実施の形態の具体例によれば、感情情報は、「怒り」「困惑」「喜び」「悲しみ」であったが、感情情報は、感情を識別する情報と、感情の程度を示す情報を有しても良い。かかる場合、感情情報は、例えば、「怒り,10」「困惑,3」「喜び,8」「悲しみ,4」などである。表示情報構成手段13043は、かかる感情情報が有する程度情報(程度を示す情報)を取得し、程度情報に応じて、アイコンのサイズを変更したり(程度が大きいほどアイコンを大きくするなど)、アイコンの背景色を変更したり(程度が大きいほど、背景色を暖色[赤に近づく]にする、など)、アイコンの輪郭線の太さを変更したり(程度が大きいほど、線を太くする、など)でも良い。かかることも、他の実施の形態においても同様である。
また、本実施の形態において、アイコンは、電話機13が有するので、電話機13ごとにカスタマイズが可能となる。したがって、電話をかけてくる友人の顔写真などをアイコンとして登録しておけば、非常に興味深い、楽しい留守番電話システムとなる。
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態におけるサーバ装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、記憶媒体に、電話機を識別する情報である電話機識別子と、留守番電話の音声と、話者の感情を示す情報である感情情報を対にして格納しており、コンピュータを、話者が保有する第二電話機から、前記電話機識別子と留守番電話の音声を受信する音声情報受信部と、前記音声情報受信部が受信した電話機識別子と音声を前記記憶媒体に蓄積する音声蓄積部と、前記音声情報受信部が受信した音声を解析し、前記話者の感情を示す情報である感情情報を取得する音声解析部と、前記音声解析部が取得した感情情報を、前記音声に対応付けて前記記憶媒体に蓄積する話者情報蓄積部と、前記電話機に不在着信を示す情報であり、前記感情情報を有する1以上の不在着信情報を、前記感情情報と対になる電話機識別子で識別される電話機に送信する不在着信情報送信部と、前記電話機からの留守番電話の音声の出力指示を受信する出力指示受信部と、前記出力指示受信部が出力指示を受信した場合、当該出力指示に対応する留守番電話の音声を前記記憶媒体から読み出し、当該読み出した留守番電話の音声を、前記出力指示を送信した電話機に送信する留守番電話音声送信部、として機能させるためのプログラム、である。
また、上記サーバ装置のプログラムにおいて、コンピュータを、前記表示情報構成部は、2以上の表示情報について、各表示情報を構成する元になった感情情報をキーとして、前記2以上の表示情報をソートして、前記2以上の表示情報のリストを構成するものとして機能させるためのプログラム、であることは好適である。
また、本実施の形態における電話機を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、前記サーバ装置から、感情情報を有する1以上の不在着信情報を受信する不在着信情報受信部と、前記不在着信情報受信部が受信した1以上の不在着信情報を取得し、各不在着信情報に対応し、前記電話機が有する表示手段に表示する情報であり、感情を識別する情報を含む1以上の表示情報を構成する表示情報構成部と、前記表示情報構成部が構成した1以上の表示情報を前記表示手段に表示する留守電情報表示部と、前記留守電情報表示部が表示した1以上の表示情報のうちの一の表示情報の選択の入力であり、当該選択された表示情報に対応する留守番電話の音声の出力指示の入力を、ユーザから受け付ける受付部と、前記受付部が受け付けた出力指示を、前記サーバ装置に送信する出力指示送信部と、前記出力指示の送信に対応して、前記サーバ装置から留守番電話の音声を受信する留守番電話音声受信部と、前記留守番電話音声受信部が受信した留守番電話の音声を出力する留守番電話音声出力部として機能させるためのプログラム、である。
また、上記電話機のプログラムにおいて、コンピュータを、前記表示情報構成部は、前記感情情報、または前記感情情報と前記話者属性に対応するアイコンを格納し得るアイコン格納手段と、前記1以上の不在着信情報ごとに、前記各不在着信情報が有する前記感情情報、または前記各不在着信情報が有する前記感情情報と前記話者属性をキーとして、前記アイコン格納手段からアイコンを取得するアイコン取得手段と、前記1以上の不在着信情報ごとに、前記アイコン取得手段が取得したアイコンを有する1以上の表示情報を構成する表示情報構成手段を具備するものとして機能させるためのプログラム、であっても良い。
(実施の形態2)
本実施の形態において、実施の形態1と比較して、性別や年齢などの、留守番電話の音声を解析して得られた話者の属性値と感情情報を用いて、留守番電話の音声を示すアイコン等を表示できる点が異なる。
図12は、本実施の形態における電話システムのブロック図である。本電話システムは、第二電話機11、サーバ装置122、電話機123を具備する。
サーバ装置122は、音声格納部1201、音声情報受信部1202、音声蓄積部1203、音声解析部12204、話者情報蓄積部12205、不在着信情報送信部12206、出力指示受信部1207、留守番電話音声送信部1208を具備する。
電話機123は、不在着信情報格納部1301、不在着信情報受信部12302、不在着信情報蓄積部1303、表示情報構成部12304、留守電情報表示部1305、受付部1306、出力指示送信部1307、留守番電話音声受信部1308、留守番電話音声出力部1309を具備する。
表示情報構成部12304は、アイコン格納手段13041、アイコン取得手段123042、表示情報構成手段13043を具備する。
音声解析部12204は、音声情報受信部1202が受信した音声を解析し、感情情報と、話者の属性を示す情報である話者属性情報を取得する。音声の解析については、実施の形態1で説明した通りである。なお、音声解析部12204は、音声の音響分析を行い(音声を解析し)、音声の特徴ベクトル系列を取得し、特徴ベクトル系列が有する、例えば、周波数の平均値または中央値が所定値より高ければ音声(電話)の主は女性であり、所定値より低ければ音声(電話)の主は男性である、と判断する。また、音声解析部12204は、基本周波数等により性別を推定しても良い。なお、音声を解析し、性別や年齢を推定する技術は公知技術であり、詳細な説明を省略する。また、感情情報の取得方法は、実施の形態1で説明した通りである。音声解析部12204は、通常、MPUやメモリ等から実現され得る。音声解析部12204の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、音声解析部12204は、実施の形態4で詳述するように、無声の音声を認識しても良い。
話者情報蓄積部12205は、音声解析部12204が取得した感情情報と話者属性情報を、音声に対応付けて音声格納部1201に蓄積する。話者情報蓄積部12205は、通常、MPUやメモリ等から実現され得る。話者情報蓄積部12205の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
不在着信情報送信部12206は、電話機123に不在着信を示す情報であり、感情情報と話者属性情報を有する1以上の不在着信情報を、感情情報と対になる電話機識別子で識別される電話機123に送信する。不在着信情報送信部12206は、無線または有線の通信手段等で実現され得る。
不在着信情報受信部12302は、サーバ装置122から、感情情報と話者属性情報を有する1以上の不在着信情報を受信する。不在着信情報の受信について、電話機123のユーザからの指示の入力に応じて、サーバ装置122に不在着信情報の送信を指示し、その結果、1以上の不在着信情報を受信しても良いし、サーバ装置122から、自動的に1以上の不在着信情報を送信し、不在着信情報受信部12302が1以上の不在着信情報を受信しても良い。不在着信情報受信部12302は、無線の通信手段が好適であるが、有線の通信手段でも実現可能である。
表示情報構成部12304は、不在着信情報受信部12302が受信した1以上の不在着信情報を取得し、各不在着信情報に対応し、電話機123が有する表示手段に表示する情報(表示する元になる情報)であり、感情と話者属性を識別する情報を含む1以上の表示情報を構成する。感情と話者属性を識別する情報とは、例えば、感情と話者属性(性別や年齢など)を視覚的に示すアイコンである。感情と話者属性を識別する情報とは、感情情報と話者属性情報と同じでも良いし、感情情報と話者属性情報を用いて取得される情報(上記、アイコンなど)でも良い。また、表示情報構成部12304は、各表示情報を構成する元になった感情情報をキーとして、2以上の表示情報をソートして、2以上の表示情報のリストを構成することは好適である。表示情報構成部12304は、通常、MPUやメモリ等から実現され得る。表示情報構成部12304の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
アイコン取得手段123042は、1以上の不在着信情報ごとに、各不在着信情報が有する感情情報と話者属性情報をキーとして、アイコン格納手段13041からアイコンを取得する。アイコン取得手段123042は、通常、MPUやメモリ等から実現され得る。アイコン取得手段123042の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
次に、電話システムを構成するサーバ装置122の動作について説明する。サーバ装置122の動作は、図3のフローチャートを用いて説明したサーバ装置の動作に対して、以下が異なる。まず、ステップS303において、サーバ装置122の不在着信情報送信部12206は、電話機識別子をキーとして、音声格納部1201を検索し、電話機識別子と対になる感情情報、話者属性情報、第二電話機識別子、時刻情報などを取得する。つまり、不在着信情報は、話者属性情報を有する。
そして、ステップS314からステップS316において、音声解析部12204は、音声を解析し、感情情報と話者属性情報を取得し、話者情報蓄積部1205は、取得した感情情報と話者属性情報を、音声に対応付けて音声格納部1201に蓄積する。
次に、電話システムを構成する電話機123の動作について説明する。本電話機123の動作は、図4のフローチャートにおける動作と比較して、以下が異なる。
つまり、ステップS407、ステップS408において、アイコン取得手段123042は、感情情報と話者属性情報をキーとしてアイコンを取得する。
以下、本実施の形態における電話システムの具体的な動作について説明する。電話システムの概念図は図1である。
今、電話機123の表示情報構成部12304のアイコン格納手段13041は、図13に示すアイコン管理表を保持している、とする。アイコン管理表は、「感情情報」と「話者属性」と「アイコン」を有するレコードを複数保持している。このアイコンは、感情情報に対応して表示されるアイコンである。属性「話者属性」の属性値は、ここでは、「女性」または「男性」である。
また、サーバ装置12は、多数の第二電話機11からの留守番電話の音声を音声格納部1201に蓄積していく。そして、音声格納部1201は、留守番電話情報管理表を保持することとなる、とする。留守番電話情報管理表の各レコードは、図6の留守番電話情報管理表のレコードと比較して、属性「話者属性情報」をさらに有する。つまり、ここでの留守番電話情報管理表は、「ID」「電話機識別子」「第二電話機識別子」「時刻情報」「感情情報」「話者属性情報」「音声」を有する。
かかる状況で、音声解析部12204は、留守番電話情報管理表内の音声の解析を開始する、とする。つまり、まず、音声解析部12204は、例えば、1番目の留守番電話の音声から、感情情報および話者属性情報が空である音声を、音声格納部1201に存在する留守番電話情報管理表から読み出し、メモリ上に配置する。そして、音声解析部12204は、まず、1番目の音声を解析し、特徴ベクトルを抽出し、メモリ上に配置する。音声解析部12204は、抽出した1番目の音声の特徴ベクトルを用いて、感情を、例えば、「悲しみ」と判定し、感情情報「悲しみ」を取得する。また、音声解析部12204は、抽出した1番目の音声の特徴ベクトルを用いて、話者属性情報を、例えば、「女性」と判定し、話者属性情報「女性」を取得する。そして、話者情報蓄積部12205は、取得した感情情報「悲しみ」と話者属性情報「女性」を、1番目の音声に対応付けて音声格納部1201の留守番電話情報管理表の属性「感情情報」「話者属性」の属性値として蓄積する。かかる処理を、すべての属性「感情情報」「話者属性情報」の属性値が埋まるまで繰り返す。なお、音声解析部12204が取得した特徴ベクトルから感情や話者属性(ここでは、性別)が判定できない場合は、「感情情報」と「話者属性情報」は「空」としても良い。
そして、話者情報蓄積部12205は、留守番電話情報管理表のすべてのレコードの属性「感情情報」と「話者属性情報」の属性値を書き込む(上述したように、感情判定や話者属性の判定ができなかった場合は、空でも良い)。そして、図14に示す留守番電話情報管理表が得られる。
次に、電話機識別子「090−1234−5678」で識別される電話機123を保有するユーザが、電話機123を操作し、不在着信情報の送信指示(電話機識別子「090−1234−5678」を含む送信指示)をサーバ装置122に送信した、とする。または、サーバ装置122は、設定された時刻やタイミングが到来し、不在着信情報の送信タイミングになった、と判断した、とする。
次に、サーバ装置122の不在着信情報送信部12206は、不在着信情報を送信する電話機識別子「090−1234−5678」を取得する。そして、不在着信情報送信部12206は、取得した電話機識別子「090−1234−5678」をキーとして、音声格納部1201の留守番電話情報管理表を検索し、電話機識別子「090−1234−5678」と対になる第二電話機識別子、時刻情報、感情情報、話者属性情報を取得する、とする。そして、不在着信情報送信部1206は、図15の不在着信情報管理表を構成する。次に、不在着信情報送信部12206は、電話機識別子「090−1234−5678」で識別される電話機123に、構成した不在着信情報管理表を送信する。なお、この不在着信情報管理表は、図8の不在着信情報管理表と比較して、「話者属性情報」を有する。
次に、電話機識別子「090−1234−5678」で識別される電話機123の不在着信情報受信部12302は、図15に示す不在着信情報管理表を受信する。そして、不在着信情報蓄積部1303は、受信した図15に示す不在着信情報管理表を不在着信情報格納部1301に蓄積する。
次に、ユーザは、電話機123を操作し、不在着信リストの出力指示を入力した、とする。不在着信リストの出力指示の入力方法は問わない。そして、電話機123の受付部1306は、不在着信リストの出力指示を受け付ける。
そして、表示情報構成部12304が具備するアイコン取得手段123042は、不在着信情報格納部1301から図15に示す不在着信情報管理表を読み出し、メモリ上に配置する。そして、不在着信情報管理表の1番目のレコードが有する感情情報と話者属性情報をキーとして、図13のアイコン管理表を検索し、感情情報と話者属性情報の組と対になるアイコンを読み出し、第二電話機識別子、時刻情報と対にメモリ上に配置する。また、表示情報構成手段13043は、各第二電話機識別子をキーとして、図示しない電子電話帳を検索し、氏名(ニックネームでも良い)の情報を取得し、アイコン、時刻情報と対にメモリ上に配置する。以上の処理を、不在着信情報管理表の2番目以降のレコードに対しても行う。そして、以上の処理により、表示情報構成手段13043は、アイコン、時刻情報、氏名(ニックネームでも良い)の情報を対に有するレコードを1以上、メモリ上に保持することとなる。
次に、留守電情報表示部1305は、表示情報構成手段13043がメモリ上に構成した不在着信リストを表示手段に表示する。かかる不在着信リストの表示例を図16に示す。図16において、カセットテープのアイコンは、留守番電話の音声を未だ出力していないことを示す。
次に、電話機123のユーザが、図16の不在着信リストを見て、現在の自分の気分に応じて、項目を選択して、留守番電話の音声を聞くことができる点、実施の形態1の具体例において述べたことと同様である。
以上、本実施の形態によれば、留守番電話を聞く前に、話者の感情や属性(性別など)が分かる電話システム等を提供できる。その結果、例えば、ユーザの現在の心理状態に応じて、聞きたくないであろう留守番電話を聞かずに済むための仕組みを提供できる。また、早く聞きたい電話の内容を容易に選択できる。また、感情情報に基づいて不在着信リスト項目をソートして、不在着信リストを表示した場合、早く聞きたい電話の内容をさらに容易に選択でき、また、聞きたくない複数の不在着信リスト項目も一目して判断できる。特に、不在着信リスト項目が第二電話機11の第二電話機識別子を有しない場合(話者が電話番号非通知で留守番電話を入れた場合)など、話者属性の情報は重要である。つまり、話者属性が男性か女性か、または年齢が高齢か青年か等により、電話機123のユーザのリスト項目の選択順序が変わってくる。つまり、留守番電話の音声を残した話者の属性に応じて、電話機123のユーザは、適切な優先度で音声を聞くことができる。さらに、本実施の形態によれば、電話機でアイコンを保持しており、電話機ごとに出力するアイコンをカスタマイズできる。そのため、アイコンを話者の写真とするなどの工夫ができる。
さらに、本実施の形態におけるサーバ装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、記憶媒体に、電話機を識別する情報である電話機識別子と、留守番電話の音声と、話者の感情を示す情報である感情情報を対にして格納しており、コンピュータを、話者が保有する第二電話機から、前記電話機識別子と留守番電話の音声を受信する音声情報受信部と、前記音声情報受信部が受信した電話機識別子と音声を前記記憶媒体に蓄積する音声蓄積部と、前記音声情報受信部が受信した音声を解析し、感情情報と、前記話者の属性を示す情報である話者属性情報を取得する音声解析部と、前記音声解析部が取得した感情情報と話者属性情報を、前記音声に対応付けて前記記憶媒体に蓄積する話者情報蓄積部と、前記電話機に不在着信を示す情報であり、前記感情情報と前記話者属性情報を有する1以上の不在着信情報を、前記感情情報と対になる電話機識別子で識別される電話機に送信する不在着信情報送信部と、前記電話機からの留守番電話の音声の出力指示を受信する出力指示受信部と、前記出力指示受信部が出力指示を受信した場合、当該出力指示に対応する留守番電話の音声を前記記憶媒体から読み出し、当該読み出した留守番電話の音声を、前記出力指示を送信した電話機に送信する留守番電話音声送信部、として機能させるためのプログラム、である。
また、上記サーバ装置のプログラムにおいて、コンピュータを、前記表示情報構成部は、2以上の表示情報について、各表示情報を構成する元になった感情情報をキーとして、前記2以上の表示情報をソートして、前記2以上の表示情報のリストを構成するものとして機能させるためのプログラム、である。
また、本実施の形態における電話機を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、前記サーバ装置から、感情情報と話者属性情報を有する1以上の不在着信情報を受信する不在着信情報受信部と、前記不在着信情報受信部が受信した1以上の不在着信情報を取得し、各不在着信情報に対応し、前記電話機が有する表示手段に表示する情報であり、感情と話者属性を識別する情報を含む1以上の表示情報を構成する表示情報構成部と、前記表示情報構成部が構成した1以上の表示情報を前記表示手段に表示する留守電情報表示部と、前記留守電情報表示部が表示した1以上の表示情報のうちの一の表示情報の選択の入力であり、当該選択された表示情報に対応する留守番電話の音声の出力指示の入力を、ユーザから受け付ける受付部と、前記受付部が受け付けた出力指示を、前記サーバ装置に送信する出力指示送信部と、前記出力指示の送信に対応して、前記サーバ装置から留守番電話の音声を受信する留守番電話音声受信部と、前記留守番電話音声受信部が受信した留守番電話の音声を出力する留守番電話音声出力部として機能させるためのプログラム、である。
また、上記電話機のプログラムにおいて、コンピュータを、前記表示情報構成部は、前記感情情報、または前記感情情報と前記話者属性に対応するアイコンを格納し得るアイコン格納手段と、前記1以上の不在着信情報ごとに、前記各不在着信情報が有する前記感情情報、または前記各不在着信情報が有する前記感情情報と前記話者属性をキーとして、前記アイコン格納手段からアイコンを取得するアイコン取得手段と、前記1以上の不在着信情報ごとに、前記アイコン取得手段が取得したアイコンを有する1以上の表示情報を構成する表示情報構成手段を具備するものとして機能させるためのプログラム、であっても良い。
(実施の形態3)
本実施の形態において、実施の形態1、実施の形態2における電話システムに対して、アイコンはサーバ装置から送信され、留守番電話の音声を出力する電話機は受信したアイコンを表示する、という電話システムについて説明する。
図17は、本実施の形態における電話システムのブロック図である。本電話システムは、第二電話機11、サーバ装置172、電話機173を具備する。
サーバ装置172は、音声格納部1201、音声情報受信部1202、音声蓄積部1203、音声解析部17204、話者情報蓄積部12205、不在着信情報送信部12206、出力指示受信部1207、留守番電話音声送信部1208を具備する。
音声解析部17204は、アイコン格納手段172041、音声解析手段172042、アイコン取得手段172043を具備する。
電話機173は、不在着信情報格納部1301、不在着信情報受信部12302、不在着信情報蓄積部1303、表示情報構成部17304、留守電情報表示部1305、受付部1306、出力指示送信部1307、留守番電話音声受信部1308、留守番電話音声出力部1309を具備する。
アイコン格納手段172041は、感情情報、または感情情報と話者属性情報に対応するアイコンを格納し得る。アイコン格納手段172041は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
音声解析手段172042は、音声情報受信部1202が受信した音声を解析し、当該音声の解析結果が示す感情情報、または当該音声の解析結果が示す感情情報と話者属性情報を得る。なお、音声解析手段172042は、無声の音声を認識しても良い。音声解析手段172042は、通常、MPUやメモリ等から実現され得る。音声解析手段172042の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
アイコン取得手段172043は、音声解析手段172042が得た感情情報、または感情情報と話者属性情報と対になるアイコンを、アイコン格納手段172041から取得する。なお、アイコン取得手段172043が取得したアイコンは、ここでは、電話機173に送信する感情情報、または感情情報と話者属性情報である。アイコン取得手段172043は、通常、MPUやメモリ等から実現され得る。アイコン取得手段172043の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
表示情報構成部17304は、不在着信情報受信部12302が受信した1以上の不在着信情報を取得し、各不在着信情報に対応し、電話機173が有する表示手段(図示しない)に表示する情報(表示する元になる情報)であり、感情を識別する情報を含む1以上の表示情報を構成する。表示情報は、不在着信情報受信部12302が受信した不在着信情報が有するアイコンを含む。このアイコンは、留守番電話の話者の感情を示すアイコン、または留守番電話の話者の感情と話者属性示すアイコンである。
次に、電話システムを構成するサーバ装置172の動作について図18のフローチャートを用いて説明する。図18のフローチャートにおいて、図3のフローチャートと異なるステップのみ説明する。
(ステップS1801)音声解析手段172042は、i番目の音声を解析して、感情情報と話者属性情報を取得し、メモリ上に一時記憶する。
(ステップS1802)アイコン取得手段172043は、ステップS1801で得た感情情報と話者属性情報をキーとして、アイコン格納手段172041を検索する。そして、アイコン取得手段172043は、アイコン格納手段172041からアイコンを読み出す。ステップS316に行く。
(ステップS1803)話者情報蓄積部12205は、ステップS1801で取得した感情情報と話者属性情報を、i番目の音声に対応付けて音声格納部1201に蓄積する。
なお、図18のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
また、図18のフローチャートにおいて、不在着信情報が有する感情情報等は、ここではアイコンである。
次に、電話システムを構成する電話機173の動作について図19のフローチャートを用いて説明する。図19のフローチャートにおいて、図4のフローチャートの差は、ステップS407、S408、S409が存在しない点である。なお、図19のフローチャートのS410において、表示情報構成部17304は、不在着信情報が有するアイコン等を利用して、表示情報を構成する点、図4のフローチャートにおける動作とは異なる。また、図19のS412におけるソートを行うためには、例えば、不在着信情報はアイコンの他にアイコンを識別するID(例えば、「喜び」は「1」、「悲しみ」は「2」など)を有しており、例えば、このIDをキーとして不在着信情報をソートする。
なお、図19のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
なお、本実施の形態における電話システムは、実施の形態1、2の電話システムと比較して、アイコンを保持している装置が異なるに過ぎない。つまり、実施の形態1、2の電話システムにおいて、感情や話者属性に対応するアイコンは、電話機が保持していた。しかし、本実施の形態における電話システムは、感情や話者属性に対応するアイコンは、サーバ装置が保持している。
以上、本実施の形態によれば、留守番電話を聞く前に、話者の感情や属性(性別など)が分かる電話システム等を提供できる。その結果、例えば、ユーザの現在の心理状態に応じて、聞きたくないであろう留守番電話を聞かずに済むための仕組みを提供できる。また、早く聞きたい電話の内容を容易に選択できる。また、感情情報に基づいて不在着信リスト項目をソートして、不在着信リストを表示した場合、早く聞きたい電話の内容をさらに容易に選択でき、また、聞きたくない複数の不在着信リスト項目も一目して判断できる。特に、不在着信リスト項目が第二電話機11の第二電話機識別子を有しない場合(話者が電話番号非通知で留守番電話を入れた場合)など、話者属性の情報は重要である。つまり、話者属性が男性か女性か、または年齢が高齢か青年か等により、電話機173のユーザのリスト項目の選択順序が変わってくる。つまり、留守番電話の音声を残した話者の属性に応じて、電話機173のユーザは、適切な優先度で音声を聞くことができる。さらに、本実施の形態によれば、電話機でアイコンを保持する必要はなく、電話機の記憶容量は節約できる。
なお、本実施の形態におけるサーバ装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、記憶媒体に、電話機を識別する情報である電話機識別子と、留守番電話の音声と、話者の感情を示す情報である感情情報を対にして格納しており、コンピュータを、話者が保有する第二電話機から、前記電話機識別子と留守番電話の音声を受信する音声情報受信部と、前記音声情報受信部が受信した電話機識別子と音声を前記記憶媒体に蓄積する音声蓄積部と、前記音声情報受信部が受信した音声を解析し、前記話者の感情を示す情報である感情情報を取得する音声解析部と、前記音声解析部が取得した感情情報を、前記音声に対応付けて前記記憶媒体に蓄積する話者情報蓄積部と、前記電話機に不在着信を示す情報であり、前記感情情報を有する1以上の不在着信情報を、前記感情情報と対になる電話機識別子で識別される電話機に送信する不在着信情報送信部と、前記電話機からの留守番電話の音声の出力指示を受信する出力指示受信部と、前記出力指示受信部が出力指示を受信した場合、当該出力指示に対応する留守番電話の音声を前記記憶媒体から読み出し、当該読み出した留守番電話の音声を、前記出力指示を送信した電話機に送信する留守番電話音声送信部、として機能させるためのプログラムであり、前記音声解析部は、前記音声の解析結果である感情情報、または前記音声の解析結果である感情情報と話者属性情報に対応するアイコンを格納し得るアイコン格納手段と、前記音声情報受信部が受信した音声を解析し、前記音声の解析結果である感情情報、または前記音声の解析結果である感情情報と話者属性情報を得る音声解析手段と、前記音声解析手段が得た感情情報、または感情情報と話者属性情報と対になるアイコンを、前記アイコン格納手段から取得するアイコン取得手段を具備し、前記アイコンは、感情情報、または感情情報と話者属性情報であるプログラム、である。
また、上記サーバ装置のプログラムにおいて、コンピュータを、前記表示情報構成部は、2以上の表示情報について、各表示情報を構成する元になった感情情報をキーとして、前記2以上の表示情報をソートして、前記2以上の表示情報のリストを構成するものとして機能させるためのプログラム、であることは好適である。
また、本実施の形態における電話機を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、前記サーバ装置から、感情情報を有する1以上の不在着信情報を受信する不在着信情報受信部と、前記不在着信情報受信部が受信した1以上の不在着信情報を取得し、各不在着信情報に対応し、前記電話機が有する表示手段に表示する情報であり、感情を識別する情報を含む1以上の表示情報を構成する表示情報構成部と、前記表示情報構成部が構成した1以上の表示情報を前記表示手段に表示する留守電情報表示部と、前記留守電情報表示部が表示した1以上の表示情報のうちの一の表示情報の選択の入力であり、当該選択された表示情報に対応する留守番電話の音声の出力指示の入力を、ユーザから受け付ける受付部と、前記受付部が受け付けた出力指示を、前記サーバ装置に送信する出力指示送信部と、前記出力指示の送信に対応して、前記サーバ装置から留守番電話の音声を受信する留守番電話音声受信部と、前記留守番電話音声受信部が受信した留守番電話の音声を出力する留守番電話音声出力部として機能させるためのプログラム、である。なお、ここで、不在着信情報は、話者の感情や話者属性を示すアイコンを有する。
(実施の形態4)
本実施の形態において、実施の形態1から実施の形態3と比較して、音声解析部は、無音声を検知し、無音声の場合は、音声を電話機に送信しない、または、無音声の音声を蓄積しない、または削除する構成を有する電話システムである。
図20は、本実施の形態における電話システムのブロック図である。本電話システムは、第二電話機11、サーバ装置202、電話機123を具備する。
サーバ装置202は、音声格納部1201、音声情報受信部1202、音声蓄積部1203、音声解析部20204、留守電音声削除部20201、話者情報蓄積部12205、不在着信情報送信部12206、出力指示受信部1207、留守番電話音声送信部1208を具備する。
音声解析部20204は、音声情報受信部1202が受信した音声を解析し、感情情報と、話者の属性を示す情報である話者属性情報を取得する。また、音声解析部20204は、留守番電話の音声が無声であることを判断する。音声の解析については、実施の形態1等で説明した通りである。音声解析部20204は、通常、MPUやメモリ等から実現され得る。音声解析部20204の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、音声解析部20204は、留守番電話の音声が無声であることを判断した場合、音声蓄積部1203は当該音声を音声格納部1201に蓄積しない、または留守番電話音声送信部1208は当該音声を電話機123に送信しないことは好適である。無声音声を蓄積しない、または送信しない場合、後述する留守電音声削除部20201は不要である。なお、音声を解析し、無声か否かを判断する技術は公知技術であるので、詳細な説明を省略する。音声解析部20204は、通常、MPUやメモリ等から実現され得る。音声解析部20204の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
留守電音声削除部20201は、音声格納部1201に蓄積された無声の音声を削除する。音声が無声か否かは、音声解析部20204が判断したものである。留守電音声削除部20201は、通常、MPUやメモリ等から実現され得る。留守電音声削除部20201の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
次に、電話システムの動作について説明する。本電話システムにおいて、実施の形態1、2、3の電話システムと比較して、無声音声は、電話機123で出力されない点が異なるだけである。無声音声を電話機123で出力されないために、サーバ装置202は、上述した留守電音声削除部20201を有しても良い。また、無声音声を電話機123で出力されないために、音声蓄積部1203は無声音声を音声格納部1201に蓄積しない構成としても良い。また、無声音声を電話機123で出力されないために、留守番電話音声送信部1208は電話機123からの要求があった場合でも、音声を電話機123に送信しない構成としても良い。さらに、電話機123は、無声音声を出力しない構成としても良い。かかる場合、不在着信情報受信部12302が受信した不在着信情報に、無声音声であることを示す情報を含むこととなり、留守番電話音声出力部1309は、かかる無声音声であることを示す情報を読み出した場合に、音声を出力しない、という構成である。そして、かかる場合、電話機123のユーザが要求した項目に対応する音声が無声音声である旨を、表示手段に表示しても良い。
以上、本実施の形態によれば、電話機のユーザは、無声音声を聞くことを回避できる。したがって、無駄な時間を費やすことがない。
なお、本実施の形態によれば、サーバ装置202が留守電音声削除部20201を有したが、電話機123が、留守電音声削除部を有しても良い。また、電話機123で無声音声を判定し、その旨を出力する構成でも良い。
さらに、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、記憶媒体に、電話機を識別する情報である電話機識別子と、留守番電話の音声と、話者の感情を示す情報である感情情報を対にして格納しており、コンピュータを、話者が保有する第二電話機から、前記電話機識別子と留守番電話の音声を受信する音声情報受信部と、前記音声情報受信部が受信した電話機識別子と音声を前記記憶媒体に蓄積する音声蓄積部と、前記音声情報受信部が受信した音声を解析し、前記話者の感情を示す情報である感情情報を取得し、かつ、留守番電話の音声が無声であることを判断する音声解析部と、前記音声解析部が取得した感情情報を、前記音声に対応付けて前記記憶媒体に蓄積する話者情報蓄積部と、前記電話機に不在着信を示す情報であり、前記感情情報を有する1以上の不在着信情報を、前記感情情報と対になる電話機識別子で識別される電話機に送信する不在着信情報送信部と、前記電話機からの留守番電話の音声の出力指示を受信する出力指示受信部と、前記出力指示受信部が出力指示を受信した場合、当該出力指示に対応する留守番電話の音声を前記記憶媒体から読み出し、当該読み出した留守番電話の音声を、前記出力指示を送信した電話機に送信する留守番電話音声送信部、として機能させるためのプログラム、であり、前記音声解析部が留守番電話の音声が無声であることを判断した場合、前記音声蓄積部は前記音声を前記音声格納部に蓄積しない、または前記留守番電話音声送信部は前記音声を電話機に送信しない、または前記音声格納部に蓄積された音声を削除する留守電音声削除部としてさらに機能させるためのプログラム、である。
(実施の形態5)
本実施の形態において、留守番電話の音声を出力する電話機が音声を解析し、感情や話者属性(性別や年齢など)を判定し、留守番電話の音声を示すアイコン等を表示する。
本実施の形態において、上記の各実施の形態に対して、音声の解析する装置が異なる。また、本電話機は、留守番電話の音声を蓄積しているサーバ装置から音声を受信しても良いし、一の留守番電話の音声ごとに、第二電話機から音声を受信しても良い。
図21は、本実施の形態における電話システムのブロック図である。電話システムは、少なくとも第二電話機11と電話機213を具備する。本実施の形態における電話機213は、音声格納部1201、音声情報受信部1202、音声蓄積部1203、音声解析部12204、話者情報蓄積部12205、表示情報構成部21304、留守電情報表示部1305、受付部1306、出力指示送信部1307、留守番電話音声受信部1308、留守番電話音声出力部1309を具備する。
表示情報構成部21304は、アイコン格納手段123041、アイコン取得手段123042、表示情報構成手段213043を具備する。
ここで、音声情報受信部1202が音声を受信する経路やタイミングは問わない。音声情報受信部1202は、電話機のユーザの指示により、サーバ装置等から音声を受信しても良いし、1以上の第二電話機11からの留守番電話の音声の送信ごとに、留守番電話の音声を蓄積しても良い。
表示情報構成部21304は、不在着信を示す情報であり、感情情報を有する情報である不在着信情報を1以上、音声格納部1201から読み出し、各不在着信情報に対応する情報であり、電話機213が有する表示手段に表示する情報であり、感情を識別する情報を含む1以上の表示情報を構成する。また、表示情報構成部21304は、感情情報と話者属性情報を有する1以上の不在着信情報を音声格納部1201から読み出し、各不在着信情報に対応する情報であり、電話機213が有する表示手段に表示する情報であり、感情と話者属性を識別する情報を含む1以上の表示情報を構成する。表示情報構成部21304は、通常、MPUやメモリ等から実現され得る。表示情報構成部21304の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
表示情報構成手段213043は、不在着信情報を1以上、音声格納部1201から読み出し、かつ、アイコン取得手段123042が取得したアイコンを取得し、1以上の不在着信情報ごとに、不在着信情報とアイコンを用いて、感情を識別する情報または感情と話者属性を識別する情報を含む1以上の表示情報を構成する。表示情報構成手段213043は、通常、MPUやメモリ等から実現され得る。表示情報構成手段213043の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
次に、本電話システムの動作について説明する。本電話システムの電話機213は、1以上の第二電話機11から送信された留守番電話の音声を蓄積し、ユーザの指示により、または自動的に、不在着信情報のリストを表示手段に表示する。その際、電話機213が有する音声解析部12204が、音声格納部1201に格納している音声を読み出し、当該音声を解析し、話者の感情を示す感情情報、または感情情報と話者属性情報を取得し、話者情報蓄積部12205はメモリ上または音声格納部1201に一時記憶する。
そして、受付部1306が不在着信リストの出力指示を受け付けた場合、上記の実施の形態で述べた処理と同様の処理により、表示情報構成部21304のアイコン取得手段123042は、アイコン格納手段123041から、感情情報、または感情情報と話者属性情報をキーとしてアイコンを検索し、アイコンを取得する。そして、表示情報構成手段213043は、音声格納部1201に格納されている他の情報(第二電話機識別子や受信時刻の時刻情報など)を読み出し、アイコンとともに表示情報を構成する。
そして、留守電情報表示部1305は、不在着信リストを表示する。不在着信リストの表示例は、図9、図10、図16である。
さらに、受付部1306が音声の出力指示を受け付けた場合、留守番電話音声出力部1309は、出力指示に対応する音声を、音声格納部1201から読み出し、出力する。
以上、本実施の形態によれば、留守番電話を聞く前に、話者の感情が分かる電話システム等を提供できる。その結果、例えば、ユーザの現在の心理状態に応じて、聞きたくないであろう留守番電話を聞かずに済むための仕組みを提供できる。また、早く聞きたい電話の内容を容易に選択できる。
また、本実施の形態において、上記の他の実施の形態における電話システムと同様、感情情報に基づいて不在着信リスト項目をソートしても良い。かかるソートした不在着信リストを表示した場合、早く聞きたい電話の内容をさらに容易に選択でき、また、聞きたくない複数の不在着信リスト項目も一目して判断できる。
なお、本実施の形態において、上記の他の実施の形態における電話システムと同様、アイコンは図柄だけであえるとは限らず、1以上の文字、動画、写真等でも良い。つまり、アイコンは感情を認識できる、または感情と話者属性を認識できる情報であれば良い。したがって、不在着信リストの表示は、例えば、図22に示すようなものでも良い。図22において、アイコンは、文字となっている。
さらに、本実施の形態における電話機を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、留守番電話の音声を蓄積し、留守番電話の音声を出力する電話機であって、留守番電話の音声と、話者の感情を示す情報である感情情報を対にして格納し得る記憶媒体を具備している電話機を、第二電話機から、留守番電話の音声を受信する音声情報受信部と、前記音声情報受信部が受信した音声を記憶媒体に蓄積する音声蓄積部と、前記音声情報受信部が受信した音声を解析し、前記話者の感情を示す情報である感情情報を取得する音声解析部と、前記音声解析部が取得した感情情報を、前記音声に対応付けて前記記憶媒体に蓄積する話者情報蓄積部と、不在着信を示す情報であり、感情情報を有する情報である不在着信情報を1以上、前記記憶媒体から読み出し、各不在着信情報に対応する情報であり、前記電話機が有する表示手段に表示する情報であり、感情を識別する情報を含む1以上の表示情報を構成する表示情報構成部と、前記表示情報構成部が構成した1以上の表示情報を前記表示手段に表示する留守電情報表示部と、前記留守電情報表示部が表示した1以上の表示情報のうちの一の表示情報の選択の入力であり、当該選択された表示情報に対応する留守番電話の音声の出力指示の入力を、ユーザから受け付ける受付部と、前記受付部が受け付けた出力指示を用いて、当該出力指示に対応する留守番電話の音声を前記記憶媒体から読み出す留守番電話音声取得部と、前記留守番電話音声取得部が取得した留守番電話の音声を出力する留守番電話音声出力部として機能させるためのプログラム、である。
また、上記の電話機のプログラムにおいて、前記音声解析部は、前記音声情報受信部が受信した音声を解析し、前記話者の属性を示す情報である話者属性情報をも取得し、前記話者情報蓄積部は、前記音声解析部が取得した感情情報と話者属性情報を、前記音声に対応付けて前記音声格納部に蓄積し、前記表示情報構成部は、感情情報と話者属性情報を有する1以上の不在着信情報を前記音声格納部から読み出し、各不在着信情報に対応する情報であり、前記電話機が有する表示手段に表示する情報であり、感情と話者属性を識別する情報を含む1以上の表示情報を構成するプログラム、である。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
また、図23は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態のサーバ装置を実現するコンピュータの外観の例を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図23は、このコンピュータシステム340の概観図であり、図24は、コンピュータシステム340のブロック図である。また、本明細書で述べた電話機も、図24に示すようなハードウェア構成に加え、電話機能を実現するためのマイクとスピーカーを具備している。
図23において、コンピュータシステム340は、FD(Flexible Disk)ドライブ、CD−ROM(Compact Disk Read Only Memory)ドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
図24において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、CPU(Central Processing Unit)3413と、CPU3413、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM(Read−Only Memory)3415と、CPU3413に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM(Random Access Memory)3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム340に、上述した実施の形態のサーバ装置の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ341に、上述した実施の形態の情報処理装置の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段(出力指示送信部や留守番電話音声受信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。