JP2015176058A

JP2015176058A - 電子機器、方法及びプログラム

Info

Publication number: JP2015176058A
Application number: JP2014053778A
Authority: JP
Inventors: 熊谷　明; Akira Kumagai; 明熊谷
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2014-03-17
Filing date: 2014-03-17
Publication date: 2015-10-05

Abstract

【課題】過去に存在した人又は動物に関する情報をインタラクティブに出力する電子機器、方法及びプログラムを提供すること。
【解決手段】実施形態によれば、記憶手段と、音声認識手段と、伝言生成手段と、音声合成手段と、を具備する。記憶手段は、過去に存在した人又は動物に関する情報を記憶する。音声認識手段は、ユーザの発話の内容を識別する。伝言生成手段は、他のユーザに向けた、音成認識手段が識別した発話の内容を伝えるための伝言を生成する。音声合成手段は、記憶手段に記憶した情報と伝言に基づいて、人又は動物の音声を合成する。
【選択図】図５

Description

本発明の実施形態は、音声や画像を処理する電子機器、及び該機器に適用される方法及びプログラムに関する。

情報処理技術を応用して、過去に存在した人又は動物に関する情報を出力する電子機器が提案されている。一例として、故人情報を記憶保持し、表示器への接近物を検出すると故人情報を出力する電子式位牌が開発されている。故人情報は、戒名、命日、遺影、経歴、生前の動画及び静止画、並びに、音声のうち、少なくとも１つを含む。

特許第４６８２２６５号公報

従来の電子機器は、記憶保持された故人情報しか出力できないという課題があった。親族が亡くなった場合、残された家族が、仏壇に向かって亡くなった家族を供養することはできたとしても、残された家族（特に、一人暮らしの高齢者）の孤独感や悲しみを軽減することは仏壇に向かうだけでは難しい。また、最近は、家族同然のペットも多く、ペットが死んだ場合も同様（ペットロスの問題がある）である。したがって、残された家族の孤独感や悲しみを軽減するために、過去に存在した人又は動物（ペット）とのインタラクティブなコミュニケーションを実現することが期待される場合がある。

本発明の目的は過去に存在した人又は動物に関する情報をインタラクティブに出力する電子機器、方法及びプログラムを提供することである。

実施形態によれば、記憶手段と、音声認識手段と、伝言生成手段と、音声合成手段と、を具備する。記憶手段は、過去に存在した人又は動物に関する情報を記憶する。音声認識手段は、ユーザの発話の内容を識別する。伝言生成手段は、他のユーザに向けた、音成認識手段が識別した発話の内容を伝えるための伝言を生成する。音声合成手段は、記憶手段に記憶した情報と伝言に基づいて、人又は動物の音声を合成する。

図１は実施形態のシステム構成の一例を示す図である。図２は電子機器１６、１８、２０の構成の一例を示すブロック図である。図３はサーバ１４の構成の一例を示すブロック図である。図４は会話アプリケーションプログラムのソフトウェアモジュール構成の一例を示す図である。図５は伝言機能の一例の概念を示す図である。図６は第１の動作例を示すフローチャートである。図７は第１の動作例を示すフローチャートである。図８は第２の動作例を示すフローチャートである。図９は電子機器の他の例を示す図である。

第１の実施形態
以下、第１の実施形態について図面を参照して説明する。
図１は、第１の実施形態のシステム構成を示す。このシステムは、ネットワーク１２に接続されるクラウドサーバ（以下、単にサーバと称する）１４と、１台以上、ここでは３台の電子機器１６、１８、２０からなる。必ずしも複数の電子機器がネットワークに接続される必要は無く、１台の電子機器だけがネットワーク１２に接続されていてもよい。種々のデータ処理を電子機器だけで行わせるのではなくサーバ１４でも行わせることを想定し、ネットワーク１２にサーバ１４を接続しているが、電子機器単独でデータ処理を行って、サーバ１４を省略しても良い。電子機器１６、１８、２０は、例えば、タブレットコンピュータ、ノートブック型のパーソナルコンピュータ、スマートフォン、ＰＤＡ、デジタルテレビジョン受信機、または各種電子機器に内蔵される組み込みシステムとして実現され得る。本実施形態では、電子機器１６、１８、２０は、タブレットコンピュータとして実現される例を説明する。

電子機器１６、１８、２０は、ＬＣＤパネルの前面にカメラモジュール１６Ａ、１８Ａ、２０Ａ、マイク１６Ｂ、１８Ｂ、２０Ｂ、スピーカ１６Ｃ、１８Ｃ、２０Ｃを含む。電子機器１６、１８はほぼ同じ大きであり、縦長で使用することを想定している。電子機器２０はやや大きいサイズであり、横長で使用することを想定している。電子機器１６、１８は上側の短辺の中央部にカメラモジュール１６Ａ、１８Ａを備え、カメラモジュール１６Ａ、１８Ａの左右にマイク１６Ｂ、１８Ｂを備え、左右の側部の中央部にスピーカ１６Ｃ、１８Ｃを備える。電子機器２０は上側の長辺の中央部にカメラ２０Ａを備え、カメラ２０Ａの左右にマイク２０Ｂを備え、左右の側部の中央部にスピーカ２０Ｃを備える。カメラモジュール１６Ａ、１８Ａ、２０ＡはＬＣＤパネルの前にいる人間の顔を含む顔画像を撮影する。マイク１６Ｂ、１８Ｂ、２０ＢはＬＣＤパネルの前にいる人間の音声を集音する。

電子機器１６、１８は離れて暮らしている親と子が所有し、電子機器２０は菩提寺の僧侶が所有することを想定する。電子機器１６は親の住宅内の仏壇２４内に設けられた収納部に、電子機器１８は子の住宅内の仏壇２２の収納部に縦長にセットされていてもよい。仏壇に収納されないことが想定される電子機器２０は自立できるようにスタンド２０Ｄを付けても良い。仏壇２２、２４内に収納される電子機器１６、１８は収納部から取り外し可能であってもよい。すなわち、電子機器１６、１８は仏壇２２、２４内に収納されなくてもよい。収納部の位置は、扉を開くと見える中央部でもよい。収納部はＡＣ電源に接続され、電子機器１６、１８が収納部にセットされると、電子機器が充電されるようにしても良い。しかし、仏壇は、収納部を有する特殊な仏壇に限らず、既存の仏壇でもよい。その場合は、電子機器は別途充電され、充電後、仏壇内に配置される。一般的に、仏壇２２、２４内には位牌、常花、茶湯器、具足、りん等の仏具が収納されるが、これらの少なくとも幾つかは電子機器１６、１８の画面に仮想的に表示して、実物を省略することもできる。

実施形態では、仏壇２２、２４の近傍に電動りん２６、２８が配置される。電動りん２６、２８は電子機器１６、１８に接続される。接続媒体はＵＳＢケーブルでも良いし、ブルートゥース（登録商標）、赤外線通信等の無線でもよい。電動りん２６、２８は、通常のりんと同様に人が叩くと鳴るが、電子機器１６、１８からの制御により仏壇近くの人間に何か（例えば、後述する伝言の受信）を知らせるために鳴らせることもできる。

電子機器１６、１８、２０は同一構成であり、一例として、電子機器１６のシステム構成の一例を図２に示す。電子機器１６は薄い板状の本体（図示せず）と、本体の上面を覆うタッチスクリーンディスプレイ３０とを備える。タッチスクリーンディスプレイ３０には、フラットパネルディスプレイとしての液晶表示装置（ＬＣＤパネル）３０Ａと、ＬＣＤパネルの画面上の指の接触位置を検出するように構成されたセンサとが組み込まれている。センサとしては、例えば、静電容量方式のタッチパネル３０Ｂを使用することができる。タッチパネルタッチ３０Ｂは、ＬＣＤパネル３０Ａの画面を覆うように設けられる。タッチスクリーンディスプレイ３０は、指を使用した画面に対するタッチ操作を検出することができる。タッチ操作は、電子機器に対する種々の指示入力に用いられることができる。ＬＣＤパネル３０Ａは表示コントローラ１０４に接続され、タッチパネル３０Ｂはタッチコントローラ１０２に接続される。

電子機器１６は、ＣＰＵ１００に接続されるシステムコントローラ１０１を含む。システムコントローラ１０１には主メモリ１０３、ＢＩＯＳ−ＲＯＭ１０５、ｅＭＭＣ（embedded Multi Media Card）１０６、カメラモジュール１６Ａ、カードコントローラ１１４、ＵＳＢコネクタ１１５、ＰＭＩＣ（Power Management IC）１０８、表示コントローラ１０４、タッチコントローラ１０２、オーディオコーデック１１０、３Ｇ／ＬＴＥモジュール１１１、ＬＡＮモジュール１１２、ＢＴ（ブルートゥース（登録商標））モジュール１１３、人感センサ１１６、受光モジュール１１８が接続される。

ＣＰＵ１００は、電子機器１６内の各種モジュールの動作を制御するプロセッサである。ＣＰＵ１００は、ストレージデバイスであるｅＭＭＣ１０６内のＮＡＮＤフラッシュメモリから主メモリ１０３にロードされたソフトウェアを実行する。ｅＭＭＣ１０６は、組み込み機器向けの外部記憶装置であり、マルチメディアカード（ＭＭＣ）と同一のインタフェースで外部と接続される。ソフトウェアには、オペレーティングシステム（ＯＳ）２０１、およびアプリケーションプログラムが含まれている。アプリケーションプログラムには、会話アプリケーションプログラム２０２、ライブカメラアプリケーションプログラム２０３等が含まれている。会話アプリケーションプログラム２０２はＬＣＤパネルに過去に存在した人又は動物の仮想の合成画像が表示され、電子機器１６の前にいるユーザが過去に存在した人又は動物と仮想的に会話する機能を有している。なお、会話アプリケーションプログラム２０２の全て、あるいは一部をサーバ１４が実行するようにしてもよい。すなわち、電子機器１６、１８、２０は、カメラ・マイクで入力した顔画像・音声をサーバ１４に送信し、サーバ１４で処理された顔画像・音声を受信し、ＬＣＤパネルで顔画像を表示し、スピーカで音声を出力するようにしてもよい。ライブカメラアプリケーションプログラム２０３は電子機器間のテレビ電話を実施するものであり、お互いの映像を相手のＬＣＤモニタ３０Ａに表示させる。

ＣＰＵ１００は、ＢＩＯＳ−ＲＯＭ１０５に格納された基本入出力システム（ＢＩＯＳ）も実行する。ＢＩＯＳは、ハードウェア制御のためのプログラムである。

システムコントローラ１０１は、ＣＰＵ１００のローカルバスと各種コンポーネントとの間を接続するデバイスである。システムコントローラ１０１には、主メモリ１０３をアクセス制御するメモリコントローラも内蔵されている。システムコントローラ１０１は、ＰＣＩＥＸＰＲＥＳＳ規格のシリアルバスなどを介して表示コントローラ１０４との通信を実行する機能も有している。表示コントローラ１０４は、ＬＣＤ３０Ａを制御する表示コントローラである。表示コントローラ１０４によって生成される表示信号はＬＣＤ３０Ａに送られる。ＬＣＤ３０Ａは、表示信号に基づいて画面イメージを表示する。

システムコントローラ１０１は、オーディオコーデック１１０との通信を実行する機能も有している。オーディオコーデック１１０は、マイク１６Ｂによって検出された音声（例えば、ユーザが発話したことによる音声）を符号化することによって、所定の形式のオーディオデータを生成する。また、オーディオコーデック１１０は、再生対象のオーディオデータを復号し、復号された音声をスピーカ１６Ｃから出力する。システムコントローラ１０１は、ＵＳＢコネクタ１１５に接続されたＵＳＢ２．０規格のケーブルを介して外部機器との通信を実行するためのＵＳＢコントローラも内蔵している。

ＰＭＩＣ１０８は、ＡＣ又はバッテリー１０８Ａから供給される電力を管理するためのワンチップマイクロコンピュータである。ＰＭＩＣ１０８は、ユーザによるパワーボタンの操作に応じて電子機器１６を電源オン又は電源オフする機能を有している。ＰＭＩＣ１０８にはＡＣアダプタ／バッテリー１０８Ａが接続される。バッテリーはＡＣアダプタが商用電源に接続されている間に充電される。

カメラモジュール１６は、画像を撮影し、撮影された画像のデータをシステムコントローラ１０１に出力する。カメラモジュール１６は、動画像（映像）のような、連続した複数の画像を撮影することもできる。

３Ｇ／ＬＴＥモジュール１１１は、アンテナ１１１Ａを介して、３Ｇ移動通信又はＬＴＥ通信を実行し、ネットワーク１２に接続されるように構成されている。ＬＡＮモジュール１１２は、アンテナ１１２Ａを介して、例えばＩＥＥＥ８０２．１１ｇ規格の無線通信や、ＩＥＥＥ８０２．３規格の有線通信を実行し、ネットワーク１２に接続されるように構成されている。ＢＴモジュール１１０は、アンテナ１１３Ａを介してＢＴ規格による無線通信を実行し、他の機器(例えば、電動りん２６、２８)と接続されるように構成されている。なお、電動りん２６はＵＳＢケーブルを介して電子機器１６に接続されてもよい。

カードコントローラ１１４は、コンピュータ本体１１に設けられたカードスロットに挿入される、ＳＤカードのようなメモリカードに対するデータの書き込み及び読み出しを実行する。人感センサ１１６は、例えば、タブレットコンピュータ２の画面の前方に人が存在するか否かを検出するセンサである。

受光モジュール１１８は、リモートコントローラ１２２から送出される操作信号を受ける。システムコントローラ１０１は、受光モジュール１１８が受信した操作信号に応じて
各モジュールを制御する。

図３はサーバ１４の構成の一例を示す。サーバ１４は、図２に示した電子機器の会話アプリケーションプログラムを実行するものであり、電子機器の構成のうち、ＣＰＵ１００、システムコントローラ１０１、主メモリ１０３、ＢＩＯ−ＲＯＭ１０５、ＰＭＩＣ１０８からなる。電子機器のＬＡＮモジュール１１２は有線ＬＡＮによる通信を行なうＬＡＮモジュール１１２Ａに変更され、ＡＣアダプタ／バッテリ１０８ＡはＡＣアダプタ１０８Ｂに変更され、ｅＭＭＣ１０６は大容量のストレージ１０６Ａに変更されている。ＣＰＵ１００は、ストレージ１０６Ａから主メモリ１０３にロードされたソフトウェアを実行する。会話アプリケーションプログラム２０２Ａは、電子機器のプログラム２０２に対応しているが、データベースの容量が大容量化されたり、認識部・合成部等の機能が高機能となっており、過去に存在した人又は動物との仮想の会話がより現実に近くすることができる。

図４を参照して、会話アプリケーションプログラム２０２、２０２Ａのソフトウェアモジュール構成を説明する。上述したように、会話アプリケーションプログラム２０２は、電子機器を使用するユーザ（例えば、仏壇２２、２４にお参りする人）に、過去に存在した人又は動物との擬似的な会話を提供する機能等を有する。会話は、故人との対話のみならず、他のユーザへの用件を直接伝えるのではなく、過去に存在した人又は動物に対して伝言を頼むことも含む。対話アプリケーションプログラム２０２は、音声認識部３０２、意図理解部３０３、顔・人物認識部３０５、表情認識部３０６、会話制御部３０７、音声合成部３０８、顔生成部３１０、表情合成部３１１、等を備える。マイク１６Ｂからの音声入力３０１は、音声認識部３０２に入力される。

声声認識部３０２は、音声認識辞書４０１を用いて、入力音声に対して音声認識処理を施す。音声認識辞書４０１には、例えば、言葉の音の最小単位である音素と特徴量との対応を示す情報と、音素列と単語との対応を示す情報とが含まれている。音声認識処理の一例では、先ず、入力音声から雑音を除去し、識別の手がかりとなる特徴を抽出する。次に、音声信号を、音素を表わす記号に置き換える。例えば、「おはよう」という単語の音声は「ｏ」「ｈ」「ａ」「ｙ」「ｏ」「ｕ」という音素で構成される。各音素は、それぞれ異なる波形の特徴を有する。各音素の特徴を表わす音響モデルを参照して、入力された音声にどのような音素が含まれているかを判断する。ただし、音声の波形は話者によって異なるし、同一話者でも毎回変化する。そこで、１つの入力音声に対して複数の変換候補を作成し、確からしさのスコアを付ける。次に、数百万から１０００万の単語を登録できる認識辞書を用いて、音素列を単語に変換する。ここでも、複数の変換候補が作成される。最後に、言語モデルを参照して、変換候補の中から最も妥当性の高いものを選択し、入力音声に対応するテキストとして出力する。

音声認識部３０２から出力されたテキストは意図理解部３０３に入力される。意図理解部３０３は、知識データベース４０２、意図理解データベース４０３を用いて、入力テキストの内容、すなわち意図を理解する。知識データベース４０２は、単語に対応する内容や特徴のような知識を示す情報を含む。意図理解データベース４０３は、単語に対応する知識を示す情報から、テキスト（単語列）の内容（意図）を決定するための情報を含む。意図理解部３０３は、例えば、生成されたテキストが、挨拶の言葉であることや、故人や動物の名前の呼びかけであることを検出する。例えば、「おはよう」というテキストは、挨拶の一種であり、返事を求めているということが意図である。また、「おばちゃんに…を伝えて」というテキストは、おばあちゃんという第３者が含まれており、しかも「に伝えて」というキーワードが入っているので、おばあちゃん宛の伝言であるということが分かる。

一方、カメラモジュール１６Ａからの画像入力３０４は、顔・人物認識部３０５に入力される。顔・人物認識部３０５は、顔／表情データベース４０４を用いて、顔画像から顔領域を特定し、顔領域の画像から話者の人物（例えば、小さい男の子、若い女性等）を特定する。顔領域の画像は、表情認識部３０６に入力され、表情認識部３０６は、顔／表情データベース４０４を用いて、話者の表情（喜び、怒り、悲しみ等）を特定する。顔／表情データベース４０４には、例えば、電子機器１６、１８、２０を使用する１以上の人物に対応する顔画像を示す情報と表情を識別するための情報とが格納されている。これら情報は、画像自体ではなく、例えば特徴量として格納されている。

より具体的には、顔・人物認識部３０２は、ユーザの顔画像を用いて、人物を認識するための特徴量を算出する。そして、顔・人物認識部３０２は、算出された特徴量と、顔／表情データベース４０４に格納された人物の顔画像に対応する特徴量との類似度を算出し、顔／表情データベース４０４に顔画像が格納されている人物から、最も高い類似度を有する顔画像の人物を決定する。

表情認識部３０６は、ユーザの顔画像に対応する表情を識別する。識別される表情には、例えば、喜び、驚き、恐怖、嫌悪、怒り、悲しみ、無表情、等の複数の表情が含まれる。表情認識部３０６は、ユーザの顔画像を用いて、表情を認識するための特徴量を算出する。表情認識部３０６は、ユーザの顔画像に対応する特徴量と、各表情に対応する特徴量との類似度を算出し、複数の表情から、最も高い類似度を有する表情を決定する。

意図理解部３０３、顔・人物認識部３０５、表情認識部３０６の出力が会話制御部３０７に入力される。会話制御部３０７は、家族／人物データベース４０５、故人嗜好データベース４０６、故人経験データベース４０７、雑談用データベース４０８、会話履歴データベース４０９、会話人物データベース４１０の少なくとも一つを用いて、意図理解部３０３、顔・人物認識部３０５、表情認識部３０６の出力から、話者からの入力音声、話者の表情に適した会話テキストを生成する。

家族／人物データベース４０５は故人を中心とした家系図情報と友人関係とを示す情報や、過去に存在した動物（ペット）と家族等との関係を示す情報を含み、これに基づいて話者が故人に対してどういう関係（孫Ａ、孫Ｂ、息子、娘なのか等）かを特定することができる。故人嗜好データベース４０６は、故人の趣味、好きなもの、嫌いなもの、等を示す情報や、過去に存在した動物の好きなもの、嫌いなもの、等を示す情報を含む。故人経験データベース４０７は、故人が経験した出来事（何時、誰と、何処に旅行した、何時、どのような体験をした等）や過去に存在した動物との思い出を示す情報を含む。

発言の中には、例えば「この近くで安くて美味しいレストランを知らない？」のような答を求めている明確な質問ばかりではなく、「今日、どう？」のような漠然とした意味・意図のはっきりしない呟きのようなものもある。このような漠然とした発言に応答するためのデータが雑音用データベース４０８に格納される。

会話履歴データベース４０９は、故人との会話の履歴を示す情報や、過去に存在した動物に話しかけた言葉の履歴を示す情報を保存する。この履歴により、話者の発言頻度や、前回発言してからの時間を知ることができる。この情報は、会話テキストを作成する際に利用できる。会話人物データベース４１０は、ユーザ（すなわち、過去に存在した人又は動物と対話する人）に関する情報（例えば、年齢、性別、職業、趣味、等）を保存する。

なお、会話制御部３０７は、ニュースや天気のような新たな情報や、現在の日付（例えば、日付に対応する季節、日付に対応するイベント）をさらに用いて、ユーザとの会話テキストを生成してもよい。

会話テキストは音声合成部３０８、顔生成部３１０に入力される。音声合成部３０８は、先ず合成辞書４１１を用いて、会話テキストから標準的な合成音声を生成する。合成辞書４１１は、単語と音素列との対応を示す情報と、音素と音声信号（音声データ）との対応を示す情報とを含む。次に、似声データベース４１２、話方データベース４１３を用いて、合成音声を故人の音質、喋り方に似た音声に変換し、恰も故人が喋っているような話し方の音声出力３０９としてスピーカ１６Ｃから出力する。似声データベース４１２は、故人の音質や、過去に存在した動物の鳴き声の声質をモデル化した音声合成辞書(似声辞書)である。話方データベース４１３は、故人の抑揚、リズム、くせや、過去に存在した動物の鳴き方のリズムをモデル化した音声合成辞書(似声辞書)である。このように、音声合成部３０８は、ユーザが発した音声に対応するテキストと、過去に存在した人又は動物に関する情報とに基づいて、過去に存在した人又は動物をエミュレーションする合成音声を生成する。

顔生成部３１０は、故人顔／表情データベース４１４を用いて、会話テキストを発音している故人の顔画像を合成する。故人顔／表情データベース４１４は、故人の顔画像と様々な表情（例えば、喜び、驚き、恐怖、嫌悪、怒り、悲しみ、無表情、等）とを示す情報や、過去に存在した動物の画像と様々な表情や仕種とを示す情報を含む。表情合成部３１１は、合成された顔画像の表情を故人の表情に似せて、恰も故人が喋っているような表情の顔出力３１２としてＬＣＤパネル３０Ａで表示する。このように、顔生成部３１０と表情合成部３１１は、ユーザの発した音声に対応するテキストと、ユーザの顔画像に対応する人物と、ユーザの顔画像に対応する表情と、過去に存在した人又は動物に関する情報とに基づいて、過去に存在した人又は動物をエミュレーションする合成画像を生成する。

なお、顔生成部３１０及び表情合成部３１１は、故人顔／表情データベース４１４を用いて、生成された文章と、決定された人物及び表情とに基づいて、合成された音声に応じて変化する故人の動画像（顔の動画像）を合成してもよい。顔生成部３１０及び表情合成部３１１は、例えば、合成された音声の抑揚やリズム、当該音声で話される内容に応じて、表情が変化する動画像を合成する。

スピーカ１６Ｃを用いた音声出力３０９によって、合成された故人の音声がスピーカ１６Ｃから出力され、ＬＣＤパネル３０Ａを用いた顔出力（画像出力）３１２によって、合成された故人の顔画像がＬＣＤパネル３０Ａの画面に表示される。

上述した家族／人物データベース４０５、故人嗜好データベース４０６、故人経験データベース４０７、会話履歴データベース４０９、会話人物データベース４１０、似声データベース４１２、話方データベース４１３、故人顔／表情データベース４１４は、例えば、人が亡くなる前や動物が死ぬ前に予め収集された画像、音声（会話の音声）、テキスト等を含むライフログや、その人が回答したアンケート結果等を用いて作成される。ライフログでは、例えば、日付、イベント、画像、一緒にいた人、場所、等が関連付けて記録されていることがある。このような情報を用いて、故人の思い出や経験、特徴を表す情報、又は過去に存在した動物との思い出や特徴を表す情報が格納されたデータベース４０５〜４０７、４０９、４１０、４１２〜４１４を構築することができる。

また、これらデータベース４０５〜４０７、４０９、４１０、４１２〜４１４は、人が亡くなった後や動物が死んだ後に、その人や動物（又は動物の飼い主）に関連するソーシャルネットワーキングサービス（ＳＮＳ）のサイト（例えば、Ｆａｃｅｂｏｏｋ（登録商標）、Ｔｗｉｔｔｅｒ（登録商標）、各種のブログ、等）、ローカルやネットワーク上のストレージ、等に保存された画像、映像、音声、テキスト、等の情報を用いて作成されてもよい。ソーシャルネットワーキングサービスのサイトでも、例えば、日付、イベント、画像、一緒にいた人、場所、等が関連付けて記録されていることがあり、このような情報を用いてデータベース４０５〜４０７、４０９、４１０、４１２〜４１４を構築することができる。
このようなデータベースを用いることにより、過去に存在した人又は動物とのより現実的な会話（コミュニケーション）を実現するができる。

また、過去に存在した動物とユーザが対話しようとする場合、会話制御部３０７は、家族／人物データベース４０５、故人嗜好データベース４０６、故人経験データベース４０７、雑談用データベース４０８、会話履歴データベース４０９、及び会話人物データベース４１０の少なくとも一つを用いて、意図理解部３０３によって検出されたテキストの意図と、ユーザの顔画像から決定された人物及び表情とに基づいて、ユーザに応答するための鳴き声（鳴き方）や仕種を決定する。そして、音声合成部３０８は、似声データベース４１２及び話方データベース４１３を用いて、会話制御部３０７によって決定された鳴き声を音声出力するための、過去に存在した動物の鳴き声を合成する。

また、顔生成部３１０及び表情合成部３１１は、故人顔／表情データベース４１４を用いて、決定された鳴き声及び仕種と、決定された人物及び表情とに応じた、過去に存在した動物の画像を合成する。顔生成部３１０及び表情合成部３１１は、故人顔／表情データベース４１４を用いて、生成された文章と、決定された人物及び表情とに基づいて、合成された音声に応じて変化する動物の動画像を合成してもよい。顔生成部３１０及び表情合成部３１１は、例えば、合成された音声の抑揚やリズム、当該音声の内容に応じて、表情や仕種が変化する動画像を合成する。

スピーカ１６Ｃを用いた音声出力３０９によって、合成された動物の音声がスピーカ１６Ｃから出力され、ＬＣＤパネル３０Ａを用いた顔出力（画像出力）３１２によって、合成された動物の画像がＬＣＤパネル３０Ａの画面上に表示される。

なお、１つの仏壇で、複数の過去に存在した人又は動物のそれぞれとの対話が行われる場合も想定される。その場合、会話制御部３０７は、対話しようとするユーザに応じて、対話の相手となる過去に存在した人又は動物を決定するようにしてもよい。会話制御部３０７、音声合成部３０８、顔生成部３１０、及び表情合成部３１１は、決定された過去に存在した人又は動物に対応する合成された音声をスピーカ１６Ｃから出力し、合成された画像をＬＣＤパネル３０Ａの画面に表示する。

このように、会話アプリケーションプログラム２０２は、故人に関するデータを保持し、電子機器１６、１８、２０の前にいる人、特に電子機器１６、１８の場合は仏壇２２、２４の前で故人を偲ぶ・尊ぶ人が故人と仮想的に会話する場面を提供する。会話は、単に故人と対話すること以外に、故人に伝言を託すことを含む。一般的に、仏壇は生前には購入しないが、本実施例の場合は、先に亡くなる可能性が高い高齢者本人が遺族のために（残された家族が自分と擬似的に会話し、悲しみを和らげるために）、仏壇あるいは電子機器を購入することが考えられる。購入時に、１０００位の質問に対して回答してもらい、音声を入力したり、顔画像を撮影し、データベース４０６、４０７、４０８、４１２、４１３、４１４に故人データとして格納し、学習させてから、納品してもよい。また、購入後ライフログ、楽しい思い出のテキスト、写真、映像等を都度入力して、故人嗜好データベース４０６や故人経験データベース４０７を更新することもできる。さらに、近年のソーシャルネットワークの流行に伴い、故人の画像、音声や、故人の行動等がネットワークから得られるようになっているので、亡くなった後でも、データベース４０６、４０７、４０８、４１２、４１３、４１４を更新してもよい。ソーシャルネットワークのタグや写真から、故人が誰と一緒に何をしていたかも判り、亡くなった後に故人データを収集することも可能である。

以上のような構成の電子機器は多くの動作例を含むが、代表的な幾つかの動作例を以下に説明する。

（第１の動作例）
第１の動作例の背景は、少なくとも２世代の家族を対象とし、祖父母の家（実家）に仏壇（以下、親仏壇とも称する）２４があり、子供夫婦（祖父母の孫がいる）の家に仏壇（以下、子仏壇とも称する）２２があり、現在は故人である祖父が生前に仏壇、電子機器を購入していたとする。図５に示すように、子仏壇２２の前で祖父を偲ぶ・尊ぶ孫が祖母に伝えたい用件があるが、直接伝えるのではなく、電子機器１６、１８を使って祖父に用件を擬似的に伝言してもらう動作例を説明する。

図６、図７は第１の動作例のフローチャートである。孫が子仏壇２２の前に来て、電子機器１６の人感センサ６４が人物を検出する（ブロックＢ１２のイエス）と、ブロックＢ１４で会話アプリケーションプログラム２０２が起動される。電子機器１６は常時はスタンバイ状態であり、必要最低限のモジュールのみ電源がオンされ、アプリケーションプログラム、ＬＣＤパネル等は電源オフされている。電子機器がスタンバイ状態でもカメラ１６Ａがオンしている場合は、カメラ１６Ａが人物を検出すると、会話アプリケーションプログラム２０２が起動されるようにしてもよい。同様に、電子機器がスタンバイ状態でもマイク１６Ｂがオンしている場合は、孫が子仏壇２２に向かって話しかける声をマイク１６Ｂが集音すると、会話アプリケーションプログラム２０２が起動されるようにしてもよい。さらに、子仏壇２２の扉に開閉検知センサを設けて、扉が開いたら、会話アプリケーションプログラム２０２が起動されるようにしてもよい。さらに、電動りん２６、２８を鳴らすと、その情報が無線で電子機器１６、１８へ送信され、それに応じて会話アプリケーションプログラム２０２が起動されてもよい。電子機器２０は設置位置に制限はないので、電源スイッチをオンすることにより、会話アプリケーションプログラム２０２が起動されるようにしてもよい。

この後、子仏壇の前にいる孫は故人である祖父と仮想の会話を行なう。会話の間、祖父の合成映像が電子機器１６で表示される。会話の一部に、孫から祖母への伝言が含まれる。

会話例１
孫「ねえ、おじいちゃん！」
祖父「○○ちゃん、こんばんは（時間帯により変わる）。なぁに？」
孫「おじいちゃんに頼みがあるんだけど…。おばあちゃんに今度の日曜日に遊びに行くね！と伝えてくれないかなぁ？」
祖父「はい、わかった。おばあちゃんに必ず伝えとくよ。日曜日までに宿題を済ませておきなさい。」
孫「はぁい。」
ブロックＢ１６で、カメラ１６Ａが電子機器１６の前にいる人物を撮影し、マイク１８Ｂが音を集め、画像、音声信号が入力される。画像は全身画像である必要は無く、顔を中心とした画像である。入力された画像、音声信号はブロックＢ１８でサーバ１４に送信される。

サーバ１４は、電子機器１８から送信された画像、音声信号をブロックＢ２０で受信する。ブロックＢ２２で、音声認識部３０２は、音声認識辞書４０１を用いて音声信号に対して認識処理を施し、音声に対応するテキストを生成する。ブロックＢ２４で、意図理解部３０３は知識データベース４０２、意図理解データベース４０３を用いてテキストの意図を理解する。意図を理解することにより、話者の発言が単なる会話なのか、伝言なのかを知ることができる。

顔画像については、ブロックＢ２８で、顔・人物認識部３０５は、顔／表情データベース４０４を用いて顔領域の画像に対して認識処理を施し、顔領域の画像に対応する話者の人物（例えば、小さい男の子、若い女性等）を決定する。ブロックＢ３０で、表情認識部３０６は、話者の表情（喜び、怒り、悲しみ等）を決定する。このように話者の人物、表情を知ることにより、話者に適した会話テキストを生成することができ、より自然な会話が可能となる。

ブロックＢ３４で、会話制御部３０７は、意図理解部３０３、顔・人物認識部３０５、表情認識部３０６の出力に基づいて、話者の発言が伝言か否か（通常の会話）を判定する。上の会話例のように「伝えて」というキーワードが含まれている場合は、その発言は伝言であると判定できる。

通常の対話の場合は、ブロックＢ３６で、話者が誰で、どのような表情をしているか、及びテキストの意図に応じてどのような応答を返すかを決める。孫が悲しんでいるような場面では、「どうしたの？元気だしなよ。」と勇気づけるような応答テキストを生成したり、孫が歌好きな場合は、「最近歌っている？」という問いかけや、会話履歴が１年位更新されていない場合は、「久しぶり、１年ぶりだね。元気だった？」のような応答テキストを生成する。あるいは、「最近、仕事はどうなの？」のような雑談的な応答の場合もある。また、インターネットからニュース等の情報を雑談用データベース４０８に保存しておくことにより、時事ネタの会話も可能である。

ブロックＢ３８で、音声合成部３０８は、応答テキストを故人の音質、喋り方に似た合成音声に変換する。ブロックＢ４０で、顔生成部３１０、表情合成部３１１は、応答テキストを、恰も故人が喋っているような表情の顔画像に変換する。対話の内容、あるいは相手の言葉に合わせて、故人の表情を泣き顔、笑い顔等に変える。ブロックＢ４２で、合成音声・顔画像を電子機器１６へ送信する。

電子機器１６は、サーバ１４から送信された合成音声・顔画像をブロックＢ４４で受信する。ブロックＢ４６で、ＬＣＤパネル３０Ａで顔画像を表示し、スピーカ１６Ｃから合成音声を出力する。この後、ブロックＢ４８で終了か否か判定する。終了しない場合は、ブロックＢ１６に戻る。

伝言の場合は、ブロックＢ５２で、話者が誰で、どのような表情をしているか、及びテキストの意図に応じて、仲介者（祖母）宛ての伝言テキストを生成する。伝言テキストの例は、「おばあさん！。○○ちゃんが今度の日曜日に遊びに来ると言っていたよ。」である。

ブロックＢ５４で、音声合成部３０８は、伝言テキストを故人の音質、喋り方に似た合成音声に変換する。ブロックＢ５６で、顔生成部３１０、表情合成部３１１は、伝言テキストを、恰も故人が喋っているような表情の顔画像に変換する。ブロックＢ５８で、合成音声・顔画像を伝言宛先（祖母）の電子機器１８へ送信する。

祖母の電子機器１８も孫の電子機器１６と同様に、人感センサ６４が人物を検出する（ブロックＢ１１２のイエス）と、ブロックＢ１１４で会話アプリケーションプログラム２０２が起動される。上述した孫の電子機器１６と同様に、祖母の電子機器１８の会話アプリケーションプログラム２０２も多種多様なトリガで起動することができる。

ブロックＢ１１３でサーバ１４に問い合わせがされ、サーバ１４のストレージ１０６Ａ内に電子機器１８宛の未視聴の伝言があるか否か判定される。

伝言が無い場合は、電子機器１６と同様に、ブロックＢ１１６で、カメラ１８Ａが電子機器１８の前にいる人物の顔を撮影し、マイク１８Ｂが音を集め、画像、音声信号が入力される。入力された画像、音声信号はブロックＢ１１８でサーバ１４に送信される。

伝言がある場合は、ブロックＢ１４４でサーバ１４から伝言テキストの合成音声・顔画像を受信すると、ブロックＢ１４６で、ＬＣＤパネル３０Ａで顔画像を表示し、スピーカ１６Ｃから合成音声を出力する。この後、ブロックＢ１４８で終了か否か判定する。終了しない場合は、ブロックＢ１１６に戻る。

電子機器１８（親仏壇２４）の前にいる祖母は孫からの伝言を仮想の祖父から聞いて、祖父に返答を伝言依頼することも可能である。例えば、「おじいさん。うれしい話をありがとう。○○ちゃんの好きな××を作っておくよ。気をつけてきなさい！と伝えておいて下さい」と祖父と対話すると、その発言を伝言として、電子機器１６（子仏壇２２）の前にいる孫に伝えることができる。

以下、同様に、子仏壇の電子機器のユーザの孫と親仏壇の電子機器のユーザの祖母との間で用件を擬似的に祖父が伝言する形で会話が行なわれる。

なお、電子機器１６、１８がスタンバイ状態で伝言を受信すると、電動りん２６、２８を鳴らすようにしてもよい。これを聞いて、人が仏壇の前に来ると、電子機器の電源がオンされ、図６、図７の動作が開始されるように構成してもよい。

故人が複数いる場合は、子仏壇の前の人、例えば孫を認識して、その人に適した故人、例えば祖父の顔画像が表示され、「○○ちゃん、こんばんは（時間帯により変わる）。なぁに？」という合成音声が出力されるようにしてもよい。あるいは、仏壇の前の人を認識しないで、孫が「おじいちゃん」と故人を特定する呼びかけをすると、故人が特定されるようにしてもよい。

第１の動作例によれば、ネットワークに接続された電子機器を含む仏壇に向かって故人を偲ぶ・尊ぶ際に別の家庭に住んでいる身内に故人の合成音声、合成画像を通して伝言することができる。これにより、故人や祖先を供養する機会が増えるので、遠く離れた家族のつながり、家族の絆を強めることができる。故人を介した伝言により、遠く離れた家族の状況を知ることができるので、やはり家族のつながり、家族との絆を強めることができる。また、故人と思い出話しができるので、家族が亡くなった時の残された家族、特に一人暮らしの高齢者の孤独感を軽減することができる。伝言の際の会話を通じて、過去に存在した人又は動物との出来事を思い出すことができる。伝えたい用件の中には、電話する程のこともないものもあり、その場合、仏壇内の電子機器に向かって「つぶやく」だけで、故人が代わって伝えてくれるので、コミュニケーションの一助になる。

伝言を伝える際は、故人の映像しか表示していないが、子仏壇に向かって話しかけている孫の様子も子画面であるいは切り替えて表示できるようにしてもよい。

上述の説明は電子機器１６から電子機器１８への１対１の伝言に関するが、これに限らず、１対多の伝言も可能である。例えば、祖母が複数の孫に対する用件「例えば、今度の日曜日に遊びに来ない？」を祖父に伝言して貰うことも可能である。サーバ１４は、ブロックＢ５２で１対多の伝言であることを判断すると、複数の送信先を指定した伝言テキストを生成し、ブロックＢ５８で、伝言テキストを複数の電子機器へ送信すればよい。

また、子仏壇が複数ある場合、親仏壇と第１の子仏壇の電子機器間の伝言を含む会話の途中で、親仏壇と第２の子仏壇間の会話を開始してもよい。例えば、会話例１で祖母が他の孫に「○○ちゃんが今度の日曜日に遊びに来ると言っていたけど、○○君も来てくれないかなぁ。」という伝言を祖父に頼んでもよい。

祖父が祖母の伝言を単に伝えるのではなく、サーバ１４は祖母の表情を認識しているので、伝言に祖母の様子を付け加えてもよい。例えば、サーバ１４が祖母の表情のデータベースを保存し、画像認識処理を利用して、その微妙な変化を検出することもできる。この場合、例えば「おばあちゃん。最近、具合悪そうだよ。」という祖父からのメッセージを孫からの伝言に付け足すと、高齢者の見守りもできる。

また、サーバ１４は、会話履歴データベース４０９に基づいて親仏壇２４に祖母がお参りする履歴を知ることが出来るので、何日もお参りしない状態を検出することができる。この場合、例えば、「おばあちゃん。○日、お参りしていないよ。」という祖父からのメッセージを孫からの伝言に付け足すことによっても、高齢者の見守りができる。あるいは、緊急時には、身内のスマートトフォン、携帯電話等に緊急連絡をするように構成してもよい。

（第２の動作例）
第２の動作例の背景も第１の動作例の背景と同じである。しかし、第２の例の伝言は、孫から祖母への伝言という他の電子機器のユーザ向けではなく、同じ電子機器のユーザ向けである。例えば、子供が悪戯をして母親に叱られたが、子供が謝りの気持ちを母親に直接には伝えられず、祖父に頼んで母親に伝えたい場合がある。

会話例２
孫「ねえ、おじいちゃん！」
祖父「○○ちゃん、こんばんは（時間帯により変わる）。なぁに？」
孫「おじいちゃんに頼みがあるんだけど…。おかあさんに悪戯をしてごめんなさいって伝えてくれないかなぁ？」
祖父「はい、わかった。おかあさんに必ず伝えとくよ。でも、もう悪戯をしちゃ駄目だよ。」
孫「うん。」
この場合、先ず子供が電子機器１６に対して伝言を登録する。その後、会話アプリケーションプログラムはオフされ、電子機器１６はスタンバイ状態となる。その後、母親が電子機器１６の前に来て、会話アプリケーションプログラムが起動されると、伝言を視聴することができる。

図８は第２の動作例のフローチャートであり、図６、図７と対応するブロックは同一の参照数字を付して説明は省略する。ブロックＢ１４で会話アプリケーションプログラムが起動されると、ブロックＢ２０２でサーバ１４に問い合わせがされ、サーバ１４のストレージ１０６Ａ内に電子機器１６宛の未視聴の伝言があるか否か判定される。

伝言が無い場合は、第１の動作例と同様に、ブロックＢ１６で画像、音声信号が入力され、ブロックＢ１８でサーバ１４に送信される。サーバ１４は、ブロックＢ２０で画像、音声信号を受信し、ブロックＢ２２で音声に対応するテキストを生成し、ブロックＢ２４でテキストの意図を理解し、ブロックＢ２８で話者人物を決定し、ブロックＢ３０で話者人物の表情を認識する。ブロックＢ３４で、話者の発言が伝言であると判定されると、サーバ１４は、ブロックＢ５２で伝言テキストを生成し、ブロックＢ５４で故人の音声を合成し、ブロックＢ５６で故人の顔画像を合成し、ブロックＢ５８で合成音声・顔画像を電子機器１６へ送信する。この場合の伝言テキスト例は、「△△子。孫の○○ちゃんが悪戯してごめんなさいって言ってたよ。許してあげたらどうだ。」がある。次に、ブロックＢ６２で電子機器１６の電源がオンしている（会話アプリケーションプログラムが起動している）か否かを判定する。電子機器１６の電源がオンしている場合は、ブロック５８で送信した伝言が視聴されることが予想されるので、動作は終了する。

電源がオンしていない場合、すなわち、電子機器１６のユーザが現在は伝言を視聴しないことが想定される場合は、ブロックＢ６４で、その未視聴伝言をストレージ１０６Ａに保存する。

ブロックＢ２０２で未視聴の伝言があると判定された場合は、ブロックＢ４４でサーバ１４から伝言テキストの合成音声・顔画像を受信し、ブロックＢ４６でＬＣＤパネル３０Ａで顔画像を表示し、スピーカ１６Ｃから合成音声を出力する。これにより、子供が祖父に託した自分宛の伝言を祖父との擬似的な会話の中で知ることができる。この後、ブロックＢ４８で終了か否か判定する。終了しない場合は、ブロックＢ２０２に戻る。

同様に、母親は祖父から聞いた子供からの伝言に対する応答を祖父に伝言し、祖父から子供に用件を伝えることもできる。

第２の動作例によれば、ネットワークに接続された電子機器を含む仏壇に向かって故人を偲ぶ・尊ぶ際に、同じ家庭に住んでいる身内に故人の合成音声、合成画像を通して伝言することができる。これにより、故人や祖先を供養する機会が増え、遠く離れた家族のつながり、家族の絆を強めることができる。また、伝言の際の会話を通じて、過去に存在した人又は動物との出来事を思い出すことができる。

（第３の動作例）
第３の動作例は、伝言機能ではなくライブカメラ機能を説明する。これは、１つの電子機器で撮影した映像を他の電子機器へ送信するものである。この動作は、関係する各電子機器のリモートコントローラ１２２あるいはタッチパネル３０Ｂの操作によりライブカメラモードを指定して、ライブカメラアプリケーションプログラム２０３を起動することにより実現できる。例えば、寺の本堂で行なう法事の様子を寺の電子機器２０で撮影し、その映像を法事に参加できない遠方の身内の電子機器へ送信する。遠方の身内は、その映像を視聴することにより読経を聞くことができ、仮想的に法事に参加した気持ちになることができ、家族のつながり、家族の絆を強めることができる。ライブで見ることが出来ない場合は、この映像をサーバ１４に保存して、再生画像を視聴してもよい。あるいは、親仏壇で祖母がお参りしている様子を撮影した映像を子仏壇の電子機器へ送信するとともに、子仏壇で孫がお参りしている様子を撮影した映像を親仏壇の電子機器へ送信することもできる。これにより、離れた場所に居る祖母と孫が同時に一緒に祖父をお参りする気持ちになることができ、やはり家族のつながり、家族の絆を強めることができる。実家に頻繁に帰ることが出来ない家族も、恰も実家の仏壇に向かってお参りしている気持ちになることができ、先祖を敬う気持ちが強まる。

（第４の動作例）
第４の動作例は、仏壇内の電子機器が故人の写真をスライドショーのように表示する、あるいは映像を出力する例である。例えば、法事等で家族が集まった際に、映像があると故人を偲ぶ気持ちが強くなる。この動作も、電子機器のリモートコントローラ１２２あるいはタッチパネル３０Ｂの操作によりを用いてスライドショーモードを指定して、スライドショーアプリケーションプログラム（図２には図示していないが、主メモリ１０３にロードされる）を起動することにより実現できる。静止画のみならず、音声も一緒に出力しても良いし、動画を再生しても良い。

なお、上述した説明では、故人による伝言処理の例について記載したが、ペット等の過去に存在した動物が伝言を仲介することをエミュレーションするように構成してもよい。

電子機器の形態はタブレットコンピュータとして説明したが、スマートフォン、デスクトップ型のパーソナルコンピュータ（表示部のみを仏壇内に収納）等でも良い。

電子機器は仏壇内に収納される形態を説明したが、実物の仏壇は必須ではなく、仏壇自体を仮想的に画面に表示してもよい。この場合は、画面が大きい方が好ましいので、ネットワークに接続されるテレビジョン受信器を利用して、その前面にカメラ、マイクを取り付けてもよい。

図９にテレビジョン受信機５０として実現された電子機器を示す。テレビジョン受信機５０に設けられるＬＣＤ５８の画面には、過去に存在した人又は動物の画像だけでなく、仏壇の画像や、位牌、花立、火立、香炉、供物、花仏水器、りん、等の仏具の画像が表示されてもよい。

デジタルテレビジョン受信機５０は、薄い箱形の筐体を有している。デジタルテレビジョン受信機５０の前面には、この箱形の筐体に重ね合わせるように、ＬＣＤ５８が設けられている。デジタルテレビジョン受信機５０の前面下部には、受光部５１、ＬＥＤ５２、人感センサ５４、マイク５５などが配置されている。受光部５１は、リモートコントローラによって送信される信号を受信する。ＬＥＤ５２は、電源のオン／オフ、待機状態等を示す。人感センサ５４は、テレビジョン受信機５０の前方に人が存在することを検出する。マイク５５は、テレビジョン受信機５０を使用する人（例えば、テレビジョン受信機５０に画面に表示される仏壇にお参りする人）の発声による音声を取得する。また、デジタルテレビジョン受信機５０の前面上部には、テレビジョン受信機５０を使用する人の画像（顔画像）を撮影するカメラモジュール５３が設けられている。

さらに、デジタルテレビジョン受信機５０の側面には、操作部５６とスピーカ５７とが設けられている。操作部５６には、テレビジョン受信機５０を操作するための各種のボタンが設けられる。操作部５６は、例えば、デジタルテレビジョン受信機５０を電源オン／電源オフするための主電源ボタン、チャンネルを切り替えるためのチャンネルボタン等を備える。スピーカ５６は音声を出力する。

デジタルテレビジョン受信機５０で上述の伝言機能を実現する場合、例えば、このデジタルテレビジョン受信機５０内に設けられるプロセッサーによって、会話アプリケーションプログラム２０２やライブカメラアプリケーションプログラム２０３が実行される。これにより、マイク５５によって取得されるユーザの発声による音声と、カメラモジュール５３によって取得されるユーザの顔画像とに基づいて、スピーカ５７から故人の合成された（人工的な）音声が出力され、ＬＣＤ５８の画面に故人の合成された画像が表示される。
したがってユーザは、テレビジョン受信機５０を用いて、故人に対して伝言を依頼することができる。

以上説明したように、本実施形態によれば、過去に存在した人又は動物が伝言を伝えているようなユーザインターフェースが実現できる。これにより、故人や祖先を供養する機会が増えるので、遠く離れた家族のつながり、家族の絆を強めることができる。故人を介した伝言により、遠く離れた家族の状況を知ることができるので、やはり家族のつながり、家族との絆を強めることができる。また、故人に話し掛けられることにより、家族が亡くなった時の残された家族、特に一人暮らしの高齢者の孤独感を軽減することができる。伝言の際の会話を通じて、過去に存在した人又は動物との出来事を思い出すことができる。

電子機器は仏壇に限らず、墓石に取り付けてもよい。墓参りすると、「お参りしてくれて、ありがとう。」のような故人の発言を伝言に含めと、故人や祖先を供養する機会が増えることが期待される。

さらに、この伝言機能は、仏壇や墓石の新たな機能として、仏具、墓石を製造・販売する業界のビジネスの機会を広げることに貢献できる。また、タブレットコンピュータやスマートフォン上で実行される会話アプリケーションプログラム２０２により、過去に存在した人又は動物に対する供養の新たな機会をユーザに提供することができる。

なお、本実施形態の処理はコンピュータプログラムによって実現することができるので、このコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体を通じてこのコンピュータプログラムをコンピュータにインストールして実行するだけで、本実施形態と同様の効果を容易に実現することができる。

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。

１４…サーバ、１６、１８、２０…電子機器、１６Ａ、１８Ａ、２０Ａ…カメラモジュール、１６Ｂ、１８Ｂ、２０Ｂ…マイク、１６Ｃ、１８Ｃ、２０Ｃ…スピーカ、２２、２４…仏壇、１０１…システムコントローラ、１１２…ＬＡＮモジュール、１１６…人感センサ、２０２…会話アプリケーションプログラム。

Claims

過去に存在した人又は動物に関する情報を記憶する記憶手段と、
ユーザの発話の内容を識別する音声認識手段と、
他のユーザに向けた、前記音成認識手段が識別した発話の内容を伝えるための伝言を生成する伝言生成手段と、
前記記憶手段に記憶した情報と前記伝言に基づいて、前記人又は動物の音声を合成する音声合成手段と、
を具備する電子機器。
前記人又は動物が発した音に関する第１特徴情報を記憶する手段をさらに具備し、
前記音声合成手段は、前記記憶手段に記憶した情報と前記伝言と前記第１特徴情報とに基づいて、前記人又は動物の音声を生成する請求項１記載の電子機器。
前記記憶手段に記憶した情報と前記伝言に基づいて、前記人又は動物の画像を合成する画像合成手段をさらに具備する請求項１記載の電子機器。
前記人又は動物が発した音に関する第１特徴情報を記憶する手段と、
前記人又は動物の画像に関する第２特徴情報を記憶する手段と、をさらに具備し、
前記音声合成手段は、前記記憶手段に記憶した情報と前記伝言と前記第１特徴情報とに基づいて、前記人又は動物の音声を生成し、
前記画像合成手段は、前記記憶手段に記憶した情報と前記伝言と前記第２特徴情報とに基づいて、前記人又は動物の画像を合成する請求項３記載の電子機器。
入力画像を分析する画像認識手段をさらに具備し、
前記伝言生成手段は、前記画像認識手段の認識結果に基づいて、前記伝言を生成する請求項１記載の電子機器。
前記伝言生成手段により生成された伝言を他の機器へ送信する送信手段をさらに具備する請求項１記載の電子機器。
前記音声合成手段は、他の機器から送信された伝言に基づいて、前記人又は動物の音声を合成する請求項１記載の電子機器。
ユーザの発話の内容を識別し、
他のユーザに向けた、前記識別した発話の内容を伝えるための伝言を生成し、
記憶手段から読み出した過去に存在した人又は動物に関する情報と前記伝言に基づいて、前記人又は動物の音声を合成する方法。
コンピュータにより実行されるプログラムであって、前記プログラムは、ユーザの発話の内容を識別し、他のユーザに向けた、前記識別した発話の内容を伝えるための伝言を生成し、記憶手段から読み出した過去に存在した人又は動物に関する情報と前記伝言に基づいて、前記人又は動物の音声を合成するものであるプログラム。