WO2015060290A1

WO2015060290A1 - 対話システム及び対話方法

Info

Publication number: WO2015060290A1
Application number: PCT/JP2014/077919
Authority: WO
Inventors: 貴司折目; 広沢　建二; 矢島　浩之; 博之吉田; 吏中野
Original assignee: 大和ハウス工業株式会社
Priority date: 2013-10-22
Filing date: 2014-10-21
Publication date: 2015-04-30
Also published as: JP2015082727A; US9560313B2; US20160249014A1

Abstract

　対話者同士がお互いの映像を見ながら対話を行うのに複雑な操作を要さず、非対話時には映像の表示画面の存在を気付かせないようにする。　対話者の第１ユニットは、対話者の映像を示す第１データを生成して送信し、相手側対話者の第２ユニットは、通信回線を通じて受信した第１データを展開することで対話者の映像を表示画面に映し出すとともに、表示画面の前に居る相手側対話者の映像を示す第２データを生成して送信する。また、第２ユニットは、相手側対話者が宅内の所定位置に居ることを検知する人感センサと、姿見として機能するとともに表示画面を形成するディスプレイ兼用ミラー２５とを有する。そして、ディスプレイ兼用ミラー２５は、相手側対話者が所定位置に居ることを人感センサが検知していない期間には表示画面を形成せずに姿見の一部分としての外観を現し、人感センサが検知している期間にのみ表示画面を形成する。

Description

対話システム及び対話方法

　本発明は、遠隔地にいる対話者同士が対話を行うために構築された対話システム、及び、同システムにより実現される対話方法であって、特に、対話者同士がお互いの映像を見ながら対話を行うための対話システム及び対話方法に関する。

　互いに遠隔地にいる者同士が対話を行うための通信技術は、既に周知であり、その一例としてビデオチャットやテレビ電話等が挙げられる。また、近年では、より臨場感のある対話を実現するための技術も開発されている（例えば、特許文献１及び２参照）。

　特許文献１には、対話者同士がお互いの映像を見ながらコミュニケーションを取る映像コミュニケーションに関する技術が記載されている。当該技術によれば、ディスプレイを１枚の窓に見立てて、対話者があたかも対話相手の空間を窓越しに互いに覗いているかのように、対話者の視点位置に応じて、その位置から見える対話相手の空間の映像をディスプレイに表示すること（運動視差）を実現し奥行き表現を行うことが可能である。

　特許文献２には、ネットワークを介して異なる地点間のコミュニケーションを可能とするコミュニケーションシステムが記載されている。当該システムでは、異なる地点の間においてコミュニケーションをとっている対話者の位置を判定し、その判定結果に基づいて、当該位置の音声に対するマイクロフォンの感度を変更する動作、又は当該位置に対してスピーカーから出力される音声を大きくする動作の少なくとも何れかの動作を実行する。これにより、異なる地点間で対話をする者同士の声が聞こえ易くなる。

特開２０１１－１１３２０６号公報特開２００９－６０２２０号公報

　以上のように臨場感のある対話を実現する遠隔通信技術については、既に開発されてきている一方で、より操作性に優れた技術、分かり易くは、ユーザ（対話者）にとって利用し易い技術であることが求められている。特に、パソコン等の通信端末において複雑な設定作業を要する場合には、例えば児童や高齢者にとって扱い難いシステムとなってしまう。これに対して、前述の特許文献１及び２では、対話を開始する上で対話者がどのような操作を行うのかについての記載がなく、当該操作の難しさ次第では、同特許文献に開示された技術がユーザにとって利用し難いものとなっている可能性もある。

　また、対話者同士がお互いの映像をディスプレイにて見ながら対話を行う場合、対話が行われていない期間中はディスプレイに映像が表示されず、このように映像が表示されていない状態のディスプレイが設置されているスペースについては無用なスペースになってしまう。

　さらに、対話における臨場感を更に向上させる上で、対話者同士があたかも同じ空間に居るかのように感じられる技術が求められている。ここで、特許文献１に記載の技術によれば、対話者同士が互いにディスプレイ越しに覗き合っているような感覚を持つものの、ディスプレイ越しであるので異なる空間（部屋）に居るような感覚を持ってしまう。

　そこで、本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、対話者同士がお互いの映像を見ながら対話を行うにあたり複雑な操作を要さず、かつ、対話を行っていない期間には映像の表示画面の存在を対話者に気付かせない対話システム及び対話方法を提供することである。
　また、本発明の他の目的は、上記の対話システムにおいて、対話者同士が同じ空間（室内）に居るように感じさせることで臨場感のある対話を実現することである。

　前記課題は、本発明の対話システムによれば、対話者が保有する第１ユニットと、相手側対話者が保有する第２ユニットと、を有し、前記対話者と前記相手側対話者との間の対話を実行するために構築された対話システムであって、（Ａ）前記第１ユニットは、（ａ１）前記対話者を撮像した際の映像を示す第１データを生成する第１データ生成部と、（ａ２）前記第１データを前記第２ユニットに向けて送信する第１データ送信部と、を備え、（Ｂ）前記第２ユニットは、（ｂ１）通信回線を通じて前記第１データを受信する第１データ受信部と、（ｂ２）受信した前記第１データを展開することで前記対話者の映像を表示画面に映し出す第１データ展開部と、（ｂ３）前記相手側対話者が行う動作、前記相手側対話者が居る位置、前記相手側対話者の姿勢及び前記相手側対話者が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす前記検知対象を検知する検知部と、（ｂ４）前記相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分を構成し、前記表示画面を形成する表示画面形成部と、（ｂ５）該表示画面形成部が形成した前記表示画面の前に居る前記相手側対話者を撮像した際の映像を示す第２データを生成する第２データ生成部と、（ｂ６）前記第２データを前記第１ユニットに向けて送信する第２データ送信部と、を備え、（Ｃ）前記表示画面形成部は、前記検知部が前記条件を満たす前記検知対象を検知していない期間には前記表示画面を形成せずに前記一部分としての外観を現し、前記検知部が前記条件を満たす前記検知対象を検知している期間にのみ前記表示画面を形成することにより解決される。

　上記の対話システムでは、対話者同士はお互いの映像を見ながら対話を行うこととし、対話者の映像を相手側対話者が見るにあたっては、相手側対話者が保有する表示画面形成部に表示画面を形成させることになる。一方、表示画面の形成については、相手側対話者が行う動作、相手側対話者が居る位置、相手側対話者の姿勢及び相手側対話者が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす検知対象を検知することをトリガーとする。このように上記の対話システムでは、表示画面の形成に要する操作として特段複雑な操作を要さず、相手側対話者は、簡便な方法で対話者の映像を見ることが可能となる。
　また、上記の対話システムでは、予め設定された条件を満たす上記の検知対象を検知していない期間中、換言すると、対話者と相手側対話者との間の対話が行われていない間、表示画面形成部は表示画面を形成せず、その代わりに、相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分としての外観を現すようになる。これにより、対話が行われていない期間中には、表示画面形成部が建築材料等として機能するため、表示画面については、建物内で目立ち難くなる結果、その存在が気付き難くなる。

　また、上記の対話システムにおいて、前記第１データ生成部は、前記対話者の映像と前記対話者の音声を示す前記第１データを生成し、前記第１データ受信部が前記第１データを受信すると、前記第１データ展開部が前記第１データを展開して前記対話者の音声を再生し、前記第１データ展開部が前記対話者の音声を再生している間に前記検知部が前記条件を満たす前記検知対象を検知すると、前記表示画面形成部が前記表示画面を形成した上で、前記第１データ展開部が前記対話者の映像を前記表示画面に映し出すと、好適である。
　上記の構成では、第１データ受信部が第１データを受信すると、先ず、第１データ展開部が第１データを展開することで対話者の音声を再生する。この音声を聞いた相手側対話者は、その反応として所定の動作を行ったり、所定位置に移動したり、所定の姿勢を取ったり、所定の音を発するように行動する。この行為が条件を満たす検知対象として検知部により検知されると、これをトリガーとして表示画面形成部が表示画面を形成する。以上のように上記の構成では、対話者が相手側対話者に呼び掛けた音声をデータ化して送信し、相手側対話者側で上記の音声を再生し、当該音声に反応して相手側対話者が行動すると、これに連動する形で表示画面が形成されるようになる。以上の手順により、対話に係る処理は、円滑に開始されるようになる。

　また、上記の対話システムにおいて、前記第１ユニットは、前記通信回線を通じて前記第２データを受信する第２データ受信部と、受信した前記第２データを展開することで前記相手側対話者の映像を第１ユニット側表示画面に映し出す第２データ展開部と、前記対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分を構成し、前記第１ユニット側表示画面を形成する第１ユニット側表示画面形成部と、予め設定された画面形成条件が満たされていないとき、前記第１ユニット側表示画面形成部は、前記第１ユニット側表示画面を形成せずに前記一部分としての外観を現し、前記画面形成条件が満たされているとき、前記第１ユニット側表示画面形成部は、前記第１ユニット側表示画面を形成すると、より好適である。
　上記の構成では、相手側対話者が保有する通信ユニットと同様、対話者が保有する通信ユニットについても表示画面形成部（第１ユニット側表示画面形成部）が備えられており、当該表示画面形成部は、対話が行われていない間には表示画面を形成せず、その代わりに、相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分としての外観を現す。したがって、対話が行われていない期間中、対話者と相手側対話者の双方において表示画面形成部が建築材料等として機能し、結果として、各表示画面については建物内で目立ち難くなり、その存在が気付き難くなる。

　また、上記の対話システムにおいて、前記第１ユニットは、前記相手側対話者となる候補者が複数いるときに前記対話者により前記相手側対話者として指定された前記候補者の前記第２ユニットを特定する特定部を更に備え、前記第１データ送信部は、前記特定部により特定された前記第２ユニットに向けて前記第１データを送信すると、より一層好適である。
　上記の構成において、対話者が有する通信ユニット（第１ユニット）は、相手側対話者となる複数の候補者の中から対話者が指定した候補者の通信ユニット（第２ユニット）を特定し、特定した当該ユニットと通信することになる。これにより、対話者は、候補者が複数人いるとしても、自己が指定した候補者を相手側対話者として対話をすることが可能となる。

　また、上記の対話システムにおいて、前記第１データ生成部は、前記対話者の全身像及び前記対話者の周辺空間の映像と前記対話者の音声とを示す前記第１データを生成し、前記第２データ生成部は、前記相手側対話者の全身像及び前記相手側対話者の周辺空間の映像と前記相手側対話者の音声とを示す前記第２データを生成すると、さらに好適である。
　上記の構成において、対話者同士は、お互いの全身像及び周辺空間の映像を見ながら会話をすることが可能となる。これにより、各対話者は、あたかも相手と同じ空間に居ると感じながら対話を行うことが可能となり、より臨場感のある対話を実現することが可能となる。

　また、前述の課題は、本発明の対話方法によれば、対話者が保有する第１ユニットと、相手側対話者が保有する第２ユニットと、によって前記対話者と前記相手側対話者との間の対話を実行する対話方法であって、（Ａ）前記第１ユニットが備える第１データ生成部が、前記対話者を撮像した際の映像を示す第１データを生成する工程と、（Ｂ）前記第１ユニットが備える第１データ送信部が、前記第１データを前記第２ユニットに向けて送信する工程と、（Ｃ）前記第２ユニットが備える第１データ受信部が、通信回線を通じて前記第１データを受信する工程と、（Ｄ）前記第２ユニットが備える第１データ展開部が、受信した前記第１データを展開することで前記対話者の映像を表示画面に映し出す工程と、（Ｅ）前記第２ユニットが備える検知部が、前記相手側対話者が行う動作、前記相手側対話者が居る位置、前記相手側対話者の姿勢及び前記相手側対話者が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす前記検知対象を検知する工程と、（Ｆ）前記第２ユニットが備える表示画面形成部が、前記表示画面を形成する工程と、（Ｇ）前記第２ユニットが備える第２データ生成部が、前記表示画面形成部が形成した前記表示画面の前に居る前記相手側対話者を撮像した際の映像を示す第２データを生成する工程と、（Ｉ）前記第２ユニットが備える第２データ送信部が、前記第２データを前記第１ユニットに向けて送信する工程と、を有し、（Ｊ）前記検知部が前記条件を満たす前記検知対象を検知していない期間、前記表示画面形成部が前記表示画面を形成する工程が実施されず、前記表示画面形成部は、前記相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分としての外観を現し、（Ｋ）前記検知部が前記条件を満たす前記検知対象を検知している期間にのみ、前記表示画面形成部が前記表示画面を形成する工程が実施されることにより解決される。

　上記の対話方法によれば、相手側対話者が行う動作、相手側対話者が居る位置、相手側対話者の姿勢及び相手側対話者が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす検知対象を検知することをトリガーとして、対話者の映像を表示する表示画面が形成されることになる。このように上記の対話方法では、表示画面の形成に際し、相手側対話者に対して特段複雑な操作を要することがない。また、上記の対話方法によれば、対話者と相手側対話者との間の対話が行われていない間、表示画面形成部は表示画面を形成せず、相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分としての外観を現すようになる。この結果、対話が行われていない期間には表示画面の存在が気付かれ難くなる。

　本発明によれば、対話者同士がお互いの映像を表示画面で見ながら対話を行うにあたり、特段複雑な操作を要さず、対話が行われていない期間には表示画面の存在を気付き難くさせることが可能である。また、本発明によれば、対話時に対話者同士が同じ空間に居るような感覚を持ち、これにより臨場感のある対話、具体的には対話者同士が同じ室内で対話をする状況を実現することが可能となる。
　以上の効果を奏する本発明によれば、例えば、家族と離れて暮らす単身者が当該家族の居住空間内で当該家族と擬似的に再会して会話することが可能になり、あるいは、医師が遠隔地に居る患者の家に擬似的に出向き当該患者に対して問診をすることが可能になる。つまり、本発明によれば、互いに離れた場所にいる者同士がお互いの映像を見ながら対話をする場合において、あたかも相手側対話者と同じ空間（部屋）で会話をしているような視聴覚効果を得ることが可能となる。

図１の（Ａ）、（Ｂ）は、本発明の対話方法に関するイメージ図である。本発明の対話システムについての概念図である。本発明の第１ユニットや第２ユニットの構成例を示すブロック図である。図４の（Ａ）、（Ｂ）は、本発明の表示画面形成部の一例を示す図である。本発明の対話システムによって実行される処理の流れを示す図である（その１）。本発明の対話システムによって実行される処理の流れを示す図である（その２）。相手側対話者を指定するための入力画面の一例を示す図である。

　以下、本発明の一実施形態（以下、本実施形態）に係る対話システム及び対話方法について図面を参照しながら説明する。なお、説明を分かり易くするために、以下では、対話者をＡさんとし、相手側対話者をＢさんとするケースを具体例に挙げて説明することとする。ここで、「対話者」とは、自らの発意により対話を開始し、相手側対話者に対して話し掛ける者である。これに対して、「相手側対話者」とは、対話者に話し掛けられた際に応答して対話を行う者である。このように「対話者」及び「相手側対話者」とは、話し掛ける側と話し掛けられる側との立場上の違いであり、ある時点で「対話者」であった者であっても、他の時点で他の者に話し掛けられた場合には「相手側対話者」となる。

　また、以下では、対話者（相手側対話者）が居る建物として自宅を例に挙げて説明することとする。ただし、自宅は、あくまでも建物の一例であり、自宅以外の建物としては、病院や学校等の公共施設、会社やオフィスビル、学習塾やカルチャースクール等の建物であってもよい。

　＜＜本発明の対話システム及び対話方法の構成例＞＞
　本実施形態において、Ａさん及びＢさんは、対話システム（以下、本システムＳ）を利用することで、図１に示すようにお互いの映像を見ながら対話を実行することが可能である。図１は、本発明の対話方法に関するイメージ図であり、同図の（Ａ）は、対話者であるＡさん側から見た図であり、同図の（Ｂ）は、相手側対話者であるＢさん側から見た図である。

　本実施形態に係る対話方法について図１を参照しながらより詳しく説明すると、Ａさんは、同図の（Ａ）に示すように、自宅に設置されたディスプレイに映し出されたＢさんの全身像及びその周辺空間（居住空間）の映像を見ながらＢさんと対話することが可能である。同様に、Ｂさんは、自宅に設置されたディスプレイに映し出されたＡさんの全身像及びその周辺空間（居住空間）の映像を見ながらＡさんと対話する。

　以上のように対話者同士は、各自の自宅に居ながらにして、お互いの全身像及びその周辺空間を見ながら対話をすることが可能となる。これにより、対話者同士は、あたかも同じ室内に居るような感覚を感じることができるので、臨場感のある対話が実現されるようになる。なお、「全身像」とは、頭部から足に亘る身体全体の姿であり、起立状態であっても着座状態であってもよく、また、前方に配置された物によって一部が隠れている状態の姿を含む概念である。

　ところで、本システムＳは、図２に示すように、Ａさん及びＢさんの各々の自宅に設置された通信ユニット１、２によって構成されており、通信ユニット１、２同士は、インターネット等の通信回線３を通じてデータ通信可能となっている。図２は、本システムＳについての概念図である。

　そして、通信ユニット１、２間でデータ通信が行われることにより、上述した臨場感ある対話が実現されることになる。すなわち、通信ユニット１、２を備える本システムＳは、対話者同士間で臨場感のある対話を実行するために構築されたシステムであると言える。なお、図２には不図示であるが、通信ユニット１、２の間には中継サーバ（プロキシサーバ）が介在しており、各通信ユニット１、２が送受信するデータについては当該サーバを中継することになっている。

　ちなみに、Ａさんの自宅に設置された通信ユニット１は、本発明の第１ユニットに相当し、Ｂさんの自宅に設置された通信ユニット２は、本発明の第２ユニットに相当する。また、両通信ユニット１、２は、いずれも同様の構成となっているので、以下では、一方の通信ユニット（具体的には、Ｂさん側の通信ユニット２）のみについて、その構成を説明することとする。

　通信ユニット２の構成について説明すると、図３に示すように、コントローラ１０、ルータ２０、集音装置２１、撮像装置２２、人感センサ２３、音声再生装置２４及びディスプレイが通信ユニット２の主たる構成要素である。図３は、通信ユニット２の構成例を示すブロック図である。

　コントローラ１０は、通信ユニット２の中枢を担う装置であり、図３に示すようにＣＰＵ１１、ＲＯＭやＲＡＭからなるメモリ１２、ハードディスクドライブ１３（図３中、ＨＤＤと表記）、通信用インターフェース１４（図３中、通信用Ｉ／Ｆ）及びＩ／Ｏポート１５を有する。コントローラ１０同士は、通信回線３に接続された外部の機器（通信端末）とルータ２０を介して通信し、当該機器から受信したデータについては、メモリ１２若しくはハードディスクドライブ１３に記憶されるようになっている。なお、コントローラ１０と通信する機器の中には、相手側の通信ユニット１に備えられたコントローラ１０が含まれている。

　また、メモリ１２には、対話に関する一連のデータ処理を実行するためのプログラム（以下、対話プログラム）が格納されている。この対話プログラムがＣＰＵ１１により読み出されて実行されることで、対話に要する各種データが生成されて送信先の通信ユニット１に向けて送信され、あるいは、送信元の通信ユニット１から受信したデータが展開されて同データが示す情報がユーザ（コントローラ１０の保有者）に通知されるようになる。コントローラ１０が実行する各種処理については、後の項で具体的に説明する。

　集音装置２１は、ユーザが話す声や発する音を集音する装置であり、マイクロフォン等の公知の装置により構成される。この集音装置２１は、集音した音声を示す音声信号を出力し、当該音声信号は、コントローラ１０に設けられたＩ／Ｏポート１５に入力される。

　撮像装置２２は、ユーザの姿を撮像する装置であり、ビデオカメラ等の公知の装置により構成される。本実施形態において、撮像装置２２は、ユーザの全体像とその周辺空間を撮像することが可能となる位置に配置されている。具体的に説明すると、本実施形態に係る撮像装置２２は、後述するディスプレイの前にユーザが立っているときに当該ユーザの全体像とその周辺空間を撮像可能な位置にセットされている。そして、撮像装置２２は、撮像した映像を示す映像信号を出力し、当該映像信号は、コントローラ１０に設けられたＩ／Ｏポート１５に入力される。

　人感センサ２３は、その検知エリア内にヒト（ユーザ）が位置していると、その者の存在を検知し、検出結果を示す信号をコントローラ１０に向けて出力する。すなわち、人感センサ２３は、本発明の検知部の一例に相当し、対話者（相手側対話者）が居る位置を検知対象とし、人感センサ２３の検知エリア内にある対話者（相手側対話者）の位置を検知する。なお、人感センサ２３については、公知の機器を利用することが可能である。また、本実施形態において、人感センサ２３は、その検知エリアが後述するディスプレイの前方に位置するように配置されている。

　音声再生装置２４は、音声を再生する装置であり、スピーカー等の公知の装置により構成される。この音声再生装置２４は、コントローラ１０が音声データを展開した際にコントローラ１０から出力される再生実行命令を受信し、当該命令に従って上記の音声データが示す音声を再生する。

　ディスプレイは、映像を表示する表示画面を形成する装置であり、より厳密に説明すると、Ｂさん側の通信ユニット２に設けられたディスプレイは、本発明の表示画面形成部に相当する。一方、Ａさん側の通信ユニット１に設けられたディスプレイは、本発明の第１ユニット側表示画面形成部に相当し、当該ディスプレイにより形成される表示画面は、第１ユニット側表示画面に相当する。
　そして、ディスプレイは、コントローラ１０が映像データを展開した際にコントローラ１０から出力される映像表示命令を受信し、これに伴って、上記の映像データが示す映像がディスプレイ上の表示画面に表示されるようになる。

　そして、本実施形態に係るディスプレイは、通常時には対話者（相手側対話者）の自宅内に配置された装飾品、具体的には姿見として機能し、対話が実行される時にのみ表示画面を形成するものとなっている。以下、既出の図３及び図４を参照しながら、本実施形態に係るディスプレイについて説明する。図４は、本実施形態に係るディスプレイを示す図であり、同図の（Ａ）は、対話が行われていない非対話時の状態を、同図の（Ｂ）は、対話が行われている対話時の状態を、それぞれ示している。

　本実施形態に係るディスプレイは、前述したように、対話者（相手側対話）が居る自宅内に配置された姿見の一部分、具体的には鏡面部分を構成しており、図４の（Ａ）に示す通り、非対話時には表示画面を形成せずに鏡面部分としての外観を現している。一方、本実施形態に係るディスプレイは、対話時になると、図４の（Ｂ）に示すように、表示画面を形成し、当該表示画面には映像が表示されるようになる。

　以上のように本実施形態に係るディスプレイは、ディスプレイ兼用ミラー２５により構成されており、表示画面の形成・消去が自在に切り替え可能となっている。より具体的に説明すると、ディスプレイ兼用ミラー２５は、図３に示すように、制御回路２５ａと発光部２５ｂを内蔵している。そして、制御回路２５ａが、コントローラ１０から出力される表示画面形成命令を受信し、当該命令に従って発光部２５ｂを点灯させると、ディスプレイ兼用ミラー２５の鏡面部分に表示画面が形成されるようになる。

　一方、表示画面形成命令の出力がない期間には、制御回路２５ａは、発光部２５ｂを消灯状態のままで保持し、これにより、ディスプレイ兼用ミラー２５の鏡面部分は、その本来の外観を現すようになる。このように、対話時には表示画面を形成するディスプレイ兼用ミラー２５が、対話が行われていない非対話時には姿見として機能することで、対話者（相手側対話者）の自宅内で目立ち難くなり、結果として表示画面の存在が気付かれ難くなる。なお、ディスプレイ兼用ミラー２５の構成については、例えば国際公開第２００９／１２２７１６号に記載された構成のように公知の構成が利用可能である。

　＜＜コントローラが実行する処理について＞＞
　次に、対話者同士が対話を行うにあたって前述のコントローラ１０が実行する各種処理について説明する。
　コントローラ１０が実行する処理は、ＣＰＵ１１がメモリ１２に記憶された対話プログラムを読み出して実行することによって実現され、具体的には下記（１）～（５）の処理となる。
（１）対話データ生成処理
（２）対話データ送信処理
（３）対話データ受信処理
（４）対話データ展開処理
（５）表示画面形成命令処理
　以下、各処理について個別に説明する。

　（１）対話データ生成処理について
　対話データ生成処理は、コントローラ１０がＩ／Ｏポート１５を介して集音装置２１及び撮像装置２２から受信した信号、具体的には音声信号と映像信号をそれぞれデジタル化してからエンコードすることで音声データと映像データを生成し、これら２つのデータを多重化して対話データを生成する処理である。なお、生成された対話データは、コントローラ１０が有するメモリ１２の所定領域に一時的に記憶される。

　ここで、対話データについて説明すると、対話者であるＡさん側のコントローラ１０によって生成される対話データは、本発明の第１データに相当し、撮像装置２２が撮像したＡさんの映像と、集音装置２１が集音したＡさんの音声（話し声）と、を示すデータとなっている。つまり、Ａさん側のコントローラ１０において、ＣＰＵ１１とメモリ１２は、対話プログラムと協働することにより、第１データに相当する対話データを生成する第１データ生成部を構成している。

　一方、相手側対話者であるＢさん側のコントローラによって生成される対話データは、本発明の第２データに相当し、撮像装置２２が撮像したＢさんの映像と、集音装置２１が集音したＢさんの音声（話し声）と、を示すデータとなっている。つまり、Ｂさん側のコントローラ１０において、ＣＰＵ１１とメモリ１２は、対話プログラムと協働することにより、第２データに相当する対話データを生成する第２データ生成部を構成している。

　なお、前述したように、本実施形態に係る撮像装置２２は、ディスプレイ兼用ミラー２５が形成した表示画面の前でＡさん又はＢさんが立っている状態にあるとき、Ａさん又はＢさんの全身像及びその周辺空間を撮像する。したがって、上記の対話データは、ディスプレイ兼用ミラー２５が形成した表示画面の前に居るＡさん又はＢさんの全身像及びその周辺空間の映像を示すデータとなる。

　（２）対話データ送信処理について
　対話データ送信処理は、上述の対話データ生成処理にて生成された対話データを、送信先の通信ユニット１、２に向けて送信する処理である。すなわち、本処理では、ＣＰＵ１１がメモリ１２に記憶された対話データを読み出し、通信用インターフェース１４及びルータ２０を介して当該対話データを送信することになる。換言すると、ＣＰＵ１１、メモリ１２、通信用インターフェース１４及びルータ２０は、対話プログラムと協働することでデータ送信部を構成している。より厳密に説明すると、Ａさん側のコントローラ１０のＣＰＵ１１、メモリ１２及び通信用インターフェース１４は、ルータ２０とともに第１データ送信部を構成し、Ｂさん側のコントローラ１０のＣＰＵ１１、メモリ１２及び通信用インターフェース１４は、ルータ２０とともに第２データ送信部を構成している。

　（３）対話データ受信処理について
　対話データ受信処理は、送信元の通信ユニット１、２から送られてきた対話データを、通信回線３を通じて受信する処理である。すなわち、本処理では、ＣＰＵ１１が通信用インターフェース１４及びルータ２０を介して通信回線３から対話データを受信する。このようにＣＰＵ１１、メモリ１２、通信用インターフェース１４及びルータ２０は、対話プログラムと協働することでデータ受信部を構成しており、より厳密に説明すると、Ｂさん側のコントローラ１０のＣＰＵ１１、メモリ１２及び通信用インターフェース１４がルータ２０とともに第１データ送信部を構成し、Ａさん側のコントローラ１０のＣＰＵ１１、メモリ１２及び通信用インターフェース１４がルータ２０とともに第２データ受信部を構成している。

　なお、受信した対話データは、コントローラ１０のメモリ１２の所定領域、若しくはハードディスクドライブ１３に保存される。

　（４）対話データ展開処理について
　対話データ展開処理は、上述の対話データ受信処理にて受信した対話データから映像データと音声データとを抽出し、音声データが示す音声を音声再生装置２４に再生させるとともに、映像データが示す映像をディスプレイ兼用ミラー２５に形成された表示画面に表示させる処理である。本処理は、コントローラ１０が対話プログラムの機能により音声再生装置２４やディスプレイ兼用ミラー２５を制御することによって実行される。すなわち、ＣＰＵ１１、メモリ１２、音声再生装置２４及びディスプレイ兼用ミラー２５は、対話プログラムと協働することでデータ展開部を構成している。

　より厳密に説明すると、Ｂさん側のコントローラ１０において、ＣＰＵ１１、メモリ１２、音声再生装置２４及びディスプレイ兼用ミラー２５は、対話プログラムと協働することにより、第１データに相当する対話データを展開する第１データ展開部を構成し、Ａさんの全身像及びその周辺空間の映像を表示画面に映し出すとともに、Ａさんの音声を音声再生装置２４により再生させる。
　同様に、Ａさん側のコントローラ１０において、ＣＰＵ１１、メモリ１２、音声再生装置２４及びディスプレイ兼用ミラー２５は、対話プログラムと協働することにより、第２データに相当する対話データを展開する第２データ展開部を構成し、Ｂさんの全身像及びその周辺空間の映像を表示画面に映し出すとともに、Ｂさんの音声を音声再生装置２４により再生させる。

　対話データ展開処理についてより詳しく説明すると、ＣＰＵ１１がメモリ１２若しくはハードディスクドライブ１３に記憶された対話データを読み出した後、対話プログラムの機能によって上記の対話データを分割し、映像データと音声データとを抽出する。抽出された映像データ及び音声データは、それぞれ対話プログラムの機能によってデコードされる。その後、ＣＰＵ１１は、デコードされた音声データを展開することで、当該音声データが示す音声、具体的には対話者（相手側対話者）の話し声を再生させる再生実行命令を生成する。そして、ＣＰＵ１１は、生成した再生実行命令を音声再生装置２４に向けて出力し、音声再生装置２４は、当該命令に従って上記の音声データが示す音声を再生する。

　また、ＣＰＵ１１は、デコードされた映像データを展開することで、当該映像データが示す映像（すなわち、対話者（相手側対話者）の全身像及びその周辺空間の映像）を、ディスプレイ兼用ミラー２５に形成された表示画面に表示する。具体的に説明すると、ＣＰＵ１１は、上記の映像に関する表示命令（映像表示命令）を生成し、当該命令をディスプレイ兼用ミラー２５に向けて出力する。ディスプレイ兼用ミラー２５では、上記の映像表示命令を受信すると、制御回路２５ａが同命令に従って発光部２５ｂを制御する。これにより、ディスプレイ兼用ミラー２５に形成された表示画面に、対話者（相手側対話者）の全身像及びその周辺空間の映像が表示されるようになる。

　（５）表示画面形成命令処理について
　表示画面形成命令処理は、ディスプレイ兼用ミラー２５が表示画面を形成していない状態において、画面形成条件が満たされたことをトリガーとして表示画面形成命令を生成してディスプレイ兼用ミラー２５に向けて出力する処理である。ここで、画面形成条件とは、ディスプレイ兼用ミラー２５に表示画面を形成させる条件として予め設定されたものであり、本実施形態では、人感センサ２３がその検知エリア内に居る対話者（相手側対話者）の位置を検知することを画面形成条件としている。

　より具体的に説明すると、人感センサ２３の検知エリアは、ディスプレイ兼用ミラー２５の前方位置、例えば、ディスプレイ兼用ミラー２５を姿見として利用する時にユーザが立つ位置よりも幾分近付いた位置に設定されている。そのため、図４の（Ｂ）に示すように、ディスプレイ兼用ミラー２５に対して通常時よりも近付いた位置に対話者（相手側対話者）が位置していると、人感センサ２３は、その検知エリア内に居る対話者（相手側対話者）の位置を検知し、その検知結果を示す信号（以下、検知信号）をコントローラ１０に向けて出力する。検知信号をＩ／Ｏポート１５を介して受信したコントローラ１０では、ＣＰＵ１１が対話プログラムを実行し、ディスプレイ兼用ミラー２５に表示画面を形成させる命令（表示画面形成命令）を生成し、当該命令をディスプレイ兼用ミラー２５に向けて出力する。

　そして、表示画面形成命令を受信したディスプレイ兼用ミラー２５では、制御回路２５ａが上記の表示画面形成命令に従って発光部２５ｂを点灯させる。これにより、それまで姿見としての外観を呈していたディスプレイ兼用ミラー２５の鏡面部分に、表示画面が形成されるようになる。

　以上のようにコントローラ１０のＣＰＵ１１及びメモリ１２は、対話プログラムと協働して、表示画面形成命令出力部を構成し、人感センサ２３がその検知エリア内に居る対話者（相手側対話者）の位置を検知することをトリガーとして、表示画面形成命令を生成してディスプレイ兼用ミラー２５に向けて出力する。

　ちなみに、本実施形態において、ディスプレイ兼用ミラー２５は、人感センサ２３がその検知エリア内に居る対話者（相手側対話者）の位置を検知し続けている間、表示画面を形成した状態で保持される。一方で、人感センサ２３が検知エリア内で対話者（相手側対話者）を検知しなくなると、ディスプレイ兼用ミラー２５は、表示画面を消去し、鏡面部分に姿見としての外観を現すようになる。すなわち、本実施形態では、人感センサ２３が検知エリア内に居る対話者（相手側対話者）の位置を検知していない期間中、ディスプレイ兼用ミラー２５が表示画面を形成することはなく、その鏡面部分が姿見の一部分としての外観を現すことになる。換言すると、人感センサ２３が検知エリア内に居る対話者（相手側対話者）の位置を検知している期間にのみ、ディスプレイ兼用ミラー２５は、表示画面を形成することとしている。

　なお、本実施形態では、ディスプレイ兼用ミラー２５に表示画面が形成されると、当該ミラー２５の前方に位置する対話者（相手側対話者）の全身像及びその周辺空間の映像を撮像し始め、上記対話者（相手側対話者）が発する音声を集音し始めることになっている。すなわち、本実施形態では、人感センサ２３がその検知エリア内に居る対話者（相手側対話者）の位置を検知することをトリガーとして、撮像装置２２による撮像及び集音装置２１による集音が開始される。また、これに連動する形でコントローラ１０が対話データ生成処理を実行し、撮像装置２２や集音装置２１からの出力信号を基に対話データを生成する。さらに、対話データの生成完了後、コントローラ１０は、対話データ送信処理を実行し、生成した対話データを相手側の通信ユニット１、２に向けて送信する。

　＜＜本実施形態に係る対話方法についての手順例＞＞
　次に、本実施形態に係る対話方法について、より詳細に説明する。なお、以下の説明においても、上記までの説明と同様に対話者をＡさんとし、相手側対話者をＢさんとするケースを具体例に挙げることとする。
　本実施形態に係る対話方法は、本システムＳにて実行される対話処理にて実現され、具体的には、対話者及び相手側対話者の通信ユニット１、２が図５及び６に示す流れにてデータ処理を順次進めることで実現される。図５及び６は、本システムＳによって実行される対話処理の流れを示す図である。

　以下、対話処理について、図５及び６を参照しながら具体的な流れを説明する。
　対話処理は、先ず、Ａさんが自宅内に設置されたディスプレイ兼用ミラー２５の前方に移動し、人感センサ２３がその検知エリア内に居るＡさんの位置を検知するところから開始される（Ｓ００１）。そして、Ａさん側の通信ユニット１に設けられたコントローラ１０は、Ｉ／Ｏポート１５を介して、上記の人感センサ２３による検知結果を示す信号を受信すると（Ｓ００１でＹｅｓ）、表示画面形成命令処理を実行する。これにより、Ａさん宅内のディスプレイ兼用ミラー２５は、その鏡面部分が姿見の外観を現している状態から遷移し、上記の鏡面部分に表示画面が形成されるようになる（Ｓ００２）。なお、Ａさん宅内のディスプレイ兼用ミラー２５に表示画面が形成された時点では、当該表示画面が所定の待ち受け画面となっている。

　一方、表示画面形成命令の実行に伴って集音装置２１及び撮像装置２２が作動し、これにより、Ａさんの全身像及びその周辺空間の映像が撮像され、Ａさんの話し声が集音されるようになる（Ｓ００３）。その後、Ａさん側の通信ユニット１に設けられたコントローラ１０は、対話データ生成処理を実行し、集音装置２１及び撮像装置２２からの出力信号を基に対話データを生成し、さらに、対話データ送信処理を実行して、生成した対話データをＢさん側の通信ユニット２に向けて送信する（Ｓ００４）。

　Ｂさん側の通信ユニット２では、コントローラ１０が通信用インターフェース１４を介して上記の対話データを受信し（Ｓ００５）、これに連動して対話データ展開処理を実行する。かかる処理では、先ず、対話データの中から音声データが抽出され、当該音声データが示す音声が音声再生装置２４によって再生される（Ｓ００６）。この結果、Ｂさん宅内ではＡさんの音声、例えば、ＡさんがＢさんを呼び掛ける声が再生される。Ｂさんは、その声に反応する形で、Ｂさんの自宅内に設置されたディスプレイ兼用ミラー２５の前方に移動する。

　そして、Ｂさん宅内において、コントローラ１０がＡさんの音声を再生している間に人感センサ２３がその検知エリア内に居るＢさんの位置を検知すると（Ｓ００７）、コントローラ１０がＩ／Ｏポート１５を介して上記の人感センサ２３による検知結果を示す信号を受信し、これに伴って表示画面形成命令処理を実行する。これにより、Ｂさん宅内のディスプレイ兼用ミラー２５は、その鏡面部分が姿見としての外観を現している状態から遷移し、上記の鏡面部分に表示画面が形成されるようになる（Ｓ００８）。

　表示画面の形成後、Ｂさん側の通信ユニット２に設けられたコントローラ１０は、対話データ展開処理を続行する。この際、コントローラ１０は、対話データから音声データと映像データを抽出し両データを展開する。すなわち、コントローラ１０は、抽出した音声データが示す音声を音声再生装置２４により再生するとともに、抽出した映像データが示す映像を表示画面に映し出す（Ｓ００９）。これにより、Ｂさん宅内ではＡさんの音声が再生されるとともに、Ａさんの全身像及びその周辺空間の映像が上記の表示画面に表示されるようになる。

　一方、表示画面形成命令の実行に伴って、Ｂさん宅内でも集音装置２１及び撮像装置２２が作動し、これにより、Ｂさんの全身像及びその周辺空間の映像が撮像され、Ｂさんの話し声が集音されるようになる（Ｓ０１０）。その後、Ｂさん側の通信ユニット２に設けられたコントローラ１０は、対話データ生成処理を実行し、集音装置２１及び撮像装置２２からの出力信号を基に対話データを生成し、さらに、対話データ送信処理を実行して、生成した対話データをＡさん側の通信ユニット１に向けて送信する（Ｓ０１１）。

　そして、Ａさん側の通信ユニット１に設けられたコントローラ１０は、通信用インターフェース１４を介して上記の対話データを受信すると（Ｓ０１２）、これに連動して対話データ展開処理を実行する。かかる処理において、コントローラ１０は、受信した対話データから音声データと映像データとを抽出し、両データを展開する。すなわち、コントローラ１０は、抽出した音声データが示す音声を音声再生装置２４により再生し、抽出した映像データが示す映像を表示画面に映し出す（Ｓ０１３）。これにより、Ａさん宅内ではＢさんの音声が再生されるとともに、それまで待ち受け状態にあった表示画面に、Ｂさんの全身像及びその周辺空間の映像が表示されるようになる。

　その後、対話者同士の対話が継続する間、上述した対話データの生成、送受信、展開に係る処理が各通信ユニット１、２において繰り返されることになる。そして、Ａさん若しくはＢさんのいずれか一方の自宅において、人感センサ２３がその検知エリア内でヒトを検知しなくなったときに（Ｓ０１４、Ｓ０１５）、対話処理は終了することになる。より具体的には、人感センサ２３がヒトを検知しなくなった側の自宅では、ディスプレイ兼用ミラー２５に形成されていた表示画面が消去され、集音装置２１及び撮像装置２２が停止する。また、対話の終了により、もう一方の自宅においてもディスプレイ兼用ミラー２５の前に立っていたヒトが居なくなって人感センサ２３がその検知エリア内でヒトを検知しなくなると、これに連動して、ディスプレイ兼用ミラー２５に形成されていた表示画面が消去され、集音装置２１及び撮像装置２２が停止する。

　＜＜その他の実施形態＞＞
　上記の実施形態では、本発明の対話システム及び対話方法について、一例を挙げて説明した。ただし、上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることは勿論である。

　また、上記の実施形態では、検知部の一例として、対話者（相手側対話者）の位置を検知する人感センサ２３を挙げ、人感センサ２３の検知結果に応じて表示画面の形成・消去を切り替えることとした。ただし、検知部については、人感センサ２３以外の機器を利用することとしてもよい。つまり、本発明を実現するための構成として、検知部は、対話者（相手側対話者）が行う動作、対話者（相手側対話者）が居る位置、対話者（相手側対話者）の姿勢、及び対話者（相手側対話者）が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす検知対象を検知するものであればよい。例えば、ヒトの足音や話し声に反応する音センサを検知部として採用し、所定の音量以上の音を検知したときに表示画面を形成することとしてもよい。このように音を検知対象とする構成については、例えば特開２０１３－７３５０５号公報や特開２００５－７８３４７号公報に記載された構成のように公知の構成を利用することが可能である。

　また、上記の実施形態では、通常時（非対話時）には姿見として機能するディスプレイ兼用ミラー２５を表示画面形成部の一例として挙げたが、これに限定されるものではない。すなわち、表示画面形成部については、姿見以外のものであってもよく、各自の自宅内に配置された建築材料、家具若しくは装飾品の一部分を構成するとともに、検知部の検知結果に応じて表示画面の形成・消去を自在に切り替えることが可能なものであればよい。例えば、宅内のドアや内壁を構成する建築材料、あるいは、タンス等の家具を表示画面形成部として採用することとしてもよい。

　また、上記の実施形態では、対話処理の開始時点において、対話者側のディスプレイ兼用ミラー２５は、表示画面を形成するものの、相手側対話者から対話データが送信されてくるまでの間、上記の表示画面は、相手側対話者の映像が表示されない待ち受け画面になっていることとした。ただし、これに限定されるものではなく、相手側対話者の対話データが送信されてくるまでの間についても、過去に受信した対話データ中の映像データを展開する等して相手側対話者の映像を表示画面に表示させることとしてもよい。

　また、ディスプレイ兼用ミラー２５に形成された表示画面に映し出される映像については、対話を行う上では、リアルタイムの映像（データ送受信の都合上で数秒程度の遅れを伴う映像も含む）を映し出すのが一般的であるが、これに限定されるものではない。すなわち、上述したように、過去に受信した対話データ中の映像データを展開することにより、過去に撮像された映像を表示画面に表示させることとしてもよい。

　また、上記の実施形態では、対話者が予め相手側対話者として指定した一人の者と対話するケースを例に挙げて説明することとした。ただし、これに限定されるものではなく、相手側対話者の候補が複数人いるケースに対しても、本発明は適用可能である。かかるケースについて説明すると、相手側対話者となる候補者が複数（例えば４人）いるときに、対話者は、その中からいずれか一人の候補者を相手側対話者として指定し、その指定結果が対話者の通信ユニット１に記憶される。

　具体的に説明すると、対話者は、自己が保有する不図示のＰＣ、スマートフォンあるいはタブレット端末（以下、入力端末）にて所定のアプリケーションソフトを起動させる。当該アプリケーションソフトの機能により、入力端末の画面には、図７に図示の設定画面が描画されるようになる。そして、上記の設定画面にて対話者がいずれか一人の候補者を指定すると、その指定結果を示すデータが入力端末によって生成され、宅内ネットワークを通じて当該データが通信ユニット１に向けて送信される。

　通信ユニット１のコントローラ１０は、入力端末から受信したデータに基づき、対話者が相手側対話者として指定した候補者の通信ユニット２を特定し、厳密には、当該通信ユニット２に割り当てられたＭＡＣアドレスを特定する。かかる処理については、コントローラ１０に備えられたＣＰＵ１１、メモリ１２及び通信用インターフェース１４が関与しており、対話プログラムの機能によって実現される。換言すると、対話者側の通信ユニット１に設けられたコントローラ１０のＣＰＵ１１、メモリ１２及び通信用インターフェース１４は、対話プログラムと協働して、対話者により相手側対話者として指定された候補者が備える通信ユニット２を特定する特定部を構成している。

　そして、通信ユニット１のコントローラ１０は、特定した通信ユニット２に向けて、生成した対話データを送信する。以降、上記の実施形態と同様の手順にて通信ユニット１、２間でのデータ通信が行われ、これによって対話に係る一連の処理（対話処理）が実行される。以上の構成であれば、対話者は、対話を行うにあたり、自己が指定した候補者を確実に相手側対話者として設定することが可能となる。なお、相手側対話者の指定については、図７に図示した設定画面を通じて行う場合には限定されず、他の方法（例えば、音声入力を採用して相手側対話者を指定する等の方法）を利用することとしてもよい。

Ｓ　本システム
１，２　通信ユニット（第１ユニット、第２ユニット）
３　通信回線
１０　コントローラ
１１　ＣＰＵ、１２　メモリ、１３　ハードディスクドライブ
１４　通信用インターフェース、１５　Ｉ／Ｏポート
２０　ルータ
２１　集音装置、２２　撮像装置
２３　人感センサ（検知部）、２４　音声再生装置
２５　ディスプレイ兼用ミラー（表示画面形成部）
２５ａ　制御回路、２５ｂ　発光部

Claims

　対話者が保有する第１ユニットと、相手側対話者が保有する第２ユニットと、を有し、前記対話者と前記相手側対話者との間の対話を実行するために構築された対話システムであって、
　前記第１ユニットは、
　前記対話者を撮像した際の映像を示す第１データを生成する第１データ生成部と、
　前記第１データを前記第２ユニットに向けて送信する第１データ送信部と、を備え、
　前記第２ユニットは、
　通信回線を通じて前記第１データを受信する第１データ受信部と、
　受信した前記第１データを展開することで前記対話者の映像を表示画面に映し出す第１データ展開部と、
　前記相手側対話者が行う動作、前記相手側対話者が居る位置、前記相手側対話者の姿勢及び前記相手側対話者が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす前記検知対象を検知する検知部と、
　前記相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分を構成し、前記表示画面を形成する表示画面形成部と、
　該表示画面形成部が形成した前記表示画面の前に居る前記相手側対話者を撮像した際の映像を示す第２データを生成する第２データ生成部と、
　前記第２データを前記第１ユニットに向けて送信する第２データ送信部と、を備え、
　前記表示画面形成部は、前記検知部が前記条件を満たす前記検知対象を検知していない期間には前記表示画面を形成せずに前記一部分としての外観を現し、前記検知部が前記条件を満たす前記検知対象を検知している期間にのみ前記表示画面を形成することを特徴とする対話システム。
　前記第１データ生成部は、前記対話者の映像と前記対話者の音声を示す前記第１データを生成し、
　前記第１データ受信部が前記第１データを受信すると、前記第１データ展開部が前記第１データを展開して前記対話者の音声を再生し、
　前記第１データ展開部が前記対話者の音声を再生している間に前記検知部が前記条件を満たす前記検知対象を検知すると、前記表示画面形成部が前記表示画面を形成した上で、前記第１データ展開部が前記対話者の映像を前記表示画面に映し出すことを特徴とする請求項１に記載の対話システム。
　前記第１ユニットは、
　前記通信回線を通じて前記第２データを受信する第２データ受信部と、
　受信した前記第２データを展開することで前記相手側対話者の映像を第１ユニット側表示画面に映し出す第２データ展開部と、
　前記対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分を構成し、前記第１ユニット側表示画面を形成する第１ユニット側表示画面形成部と、
　予め設定された画面形成条件が満たされていないとき、前記第１ユニット側表示画面形成部は、前記第１ユニット側表示画面を形成せずに前記一部分としての外観を現し、
　前記画面形成条件が満たされているとき、前記第１ユニット側表示画面形成部は、前記第１ユニット側表示画面を形成することを特徴とする請求項２に記載の対話システム。
　前記第１ユニットは、
　前記相手側対話者となる候補者が複数いるときに前記対話者により前記相手側対話者として指定された前記候補者の前記第２ユニットを特定する特定部を更に備え、
　前記第１データ送信部は、前記特定部により特定された前記第２ユニットに向けて前記第１データを送信することを特徴とする請求項３に記載の対話システム。
　前記第１データ生成部は、前記対話者の全身像及び前記対話者の周辺空間の映像と前記対話者の音声とを示す前記第１データを生成し、
　前記第２データ生成部は、前記相手側対話者の全身像及び前記相手側対話者の周辺空間の映像と前記相手側対話者の音声とを示す前記第２データを生成することを特徴とする請求項２乃至４のいずれか一項に記載の対話システム。
　対話者が保有する第１ユニットと、相手側対話者が保有する第２ユニットと、によって前記対話者と前記相手側対話者との間の対話を実行する対話方法であって、
　前記第１ユニットが備える第１データ生成部が、前記対話者を撮像した際の映像を示す第１データを生成する工程と、
　前記第１ユニットが備える第１データ送信部が、前記第１データを前記第２ユニットに向けて送信する工程と、
　前記第２ユニットが備える第１データ受信部が、通信回線を通じて前記第１データを受信する工程と、
　前記第２ユニットが備える第１データ展開部が、受信した前記第１データを展開することで前記対話者の映像を表示画面に映し出す工程と、
　前記第２ユニットが備える検知部が、前記相手側対話者が行う動作、前記相手側対話者が居る位置、前記相手側対話者の姿勢及び前記相手側対話者が発する音のうちの少なくとも一つを検知対象としたときに、予め設定された条件を満たす前記検知対象を検知する工程と、
　前記第２ユニットが備える表示画面形成部が、前記表示画面を形成する工程と、
　前記第２ユニットが備える第２データ生成部が、前記表示画面形成部が形成した前記表示画面の前に居る前記相手側対話者を撮像した際の映像を示す第２データを生成する工程と、
　前記第２ユニットが備える第２データ送信部が、前記第２データを前記第１ユニットに向けて送信する工程と、を有し、
　前記検知部が前記条件を満たす前記検知対象を検知していない期間、前記表示画面形成部が前記表示画面を形成する工程が実施されず、前記表示画面形成部は、前記相手側対話者が居る建物内に配置された建築材料、家具若しくは装飾品の一部分としての外観を現し、
　前記検知部が前記条件を満たす前記検知対象を検知している期間にのみ、前記表示画面形成部が前記表示画面を形成する工程が実施されることを特徴とする対話方法。