JP2006121158A - テレビ電話システム - Google Patents

テレビ電話システム Download PDF

Info

Publication number
JP2006121158A
JP2006121158A JP2004304010A JP2004304010A JP2006121158A JP 2006121158 A JP2006121158 A JP 2006121158A JP 2004304010 A JP2004304010 A JP 2004304010A JP 2004304010 A JP2004304010 A JP 2004304010A JP 2006121158 A JP2006121158 A JP 2006121158A
Authority
JP
Japan
Prior art keywords
image data
mouth
information terminal
image
videophone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004304010A
Other languages
English (en)
Inventor
Masako Okazaki
理子 岡崎
Tetsuya Ishii
哲也 石井
Toru Nakamura
透 中村
Hideki Osada
英喜 長田
Kentaro Sekiyama
健太郎 関山
Takehiro Yoshida
剛洋 吉田
Takahiro Amauchi
隆裕 天内
Tokuyoshi Shimamoto
篤義 嶋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2004304010A priority Critical patent/JP2006121158A/ja
Publication of JP2006121158A publication Critical patent/JP2006121158A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】携帯情報端末を用い、通信する情報量を低減し、かつ使用者の表情等の情感を高効率に伝達できるテレビ電話システムを提供すること。
【解決手段】少なくとも画像による通信を行なうテレビ電話システムであって、携帯情報端末100と、携帯情報端末100と通信を行なう他のテレビ電話200とを含み、携帯情報端末100は、携帯情報端末100の使用者OBSの顔画像600のうち少なくとも特定領域を撮像する撮像部104と、撮像された画像から特定領域の画像を抽出する抽出部109と、抽出された画像をテレビ電話へ送信するための入出力部103とを有する。
【選択図】 図4

Description

本発明は、テレビ電話システム、特に携帯情報端末を用いるテレビ電話システムに関するものである。
近年、一人の人間が複数のコンピュータを使用するネットワーク社会、いわゆるユビキタス・ネットワーク社会が提唱されている。ユビキタス・ネットワーク社会では、インターネット等の情報ネットワークに、いつでも、どこからでもアクセスできる環境が実現できる。このようなアクセスに使う情報端末は、パソコンに限られず、例えば携帯電話等も用いることができる。
また、携帯電話も通話とディスプレイ認識とを同時に行なえる表示機能付き携帯情報装置としての構成が提案されている(例えば、特許文献1参照。)。特許文献1に開示されている構成では、小型のディスプレイをホログラム素子により遠方に拡大投影する。これにより、例えば通話をしながら表示画像情報を見ることができる。さらに、ホログラム素子を介して遠方の物体の透過像を同時に観察できる。この表示機能付き携帯情報装置は、実視野の像に重畳させてデジタル情報を表示する、いわゆるシースルービュアー(see−through viewer)として用いることができる。
特開2001−308997号公報
近年、情報化社会の発達に伴い、音声に加えて画像の通信を行なうことができるテレビ電話システムのニーズが高まってきている。テレビ電話システムでは、例えば通信している相手の表情等を見ることで、情感豊かなコミュニケーションを行なうことができる。ここで、例えば携帯可能な小型な情報端末により画像通信を行なうときは、情報端末の処理能力に応じて、できるだけ少ない情報量で、効率良く「表情」等の情報を通信することが望ましい。
本発明は、上記に鑑みてなされたものであって、携帯情報端末を用い、通信する情報量を低減し、かつ使用者の表情等の情感を高効率に伝達できるテレビ電話システムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明によれば、少なくとも画像による通信を行なうテレビ電話システムであって、携帯情報端末と、前記携帯情報端末と通信を行なう他の情報端末とを含み、前記携帯情報端末は、前記携帯情報端末の使用者の顔画像のうち少なくとも特定領域を撮像する撮像部と、撮像された画像から前記特定領域の画像を抽出する抽出部と、前記抽出された画像を前記他の情報端末へ送信するための送信部とを有することを特徴とするテレビ電話システムを提供できる。
また、本発明の好ましい態様によれば、前記携帯情報端末は、さらに、所定の情報を表示する情報表示部と、前記情報表示部に表示された情報を実視野に重畳的に表示する半透過光学素子とを有することが望ましい。
また、本発明の好ましい態様によれば、前記特定領域は前記顔画像のうち眼近傍の領域であることが望ましい。
また、本発明の好ましい態様によれば、前記特定領域は前記顔画像のうち一方の眼近傍の領域であることが望ましい。
また、本発明の好ましい態様によれば、前記特定領域は前記顔画像のうち一方の眼のさらに略半分の近傍の領域であることが望ましい。
また、本発明の好ましい態様によれば、前記顔画像のうち、少なくとも2つの異なる状態の口元の画像データを格納する口画像データ格納部をさらに有し、前記口画像データ格納部は、前記携帯情報端末と前記他の情報端末とのいずれか一方に設けられていることが望ましい。
また、本発明の好ましい態様によれば、前記携帯情報端末は、さらに前記使用者の音声を検出する音声センサを有し、前記音声センサの出力に基づいて前記口画像データ格納部に格納されている口元の画像データを選択して前記他の情報端末に表示することが望ましい。
また、本発明の好ましい態様によれば、前記口元の画像データは、口が開いた状態の画像データと、口が閉じた状態の画像データとからなることが望ましい。
また、本発明の好ましい態様によれば、前記口元の画像データは、日本語についての5つの母音を発声しているときのそれぞれの口元の形状を示す画像データであることが望ましい。
また、本発明の好ましい態様によれば、前記口元の画像データは、口元の略半分の領域の画像データであることが望ましい。
また、本発明の好ましい態様によれば、前記送信部は、前記抽出された前記特定領域の画像データを、前記他の情報端末に逐次送信することが望ましい。
また、本発明の好ましい態様によれば、前記特定領域は、さらに口元の近傍を含み、
前記送信部は、眼近傍の画像データに加えて口元の画像データを前記他の情報端末へ逐次送信することが望ましい。
本発明に係るテレビ電話システムでは、携帯情報端末を用いる。そして、携帯情報端末が備える撮像部は、携帯情報端末の使用者の顔画像の全体ではなく、顔画像の一部である少なくとも特定領域を含む領域を撮像する。また、抽出部は、撮像された画像データから特定領域の部分を抽出する。「特定領域」とは、例えば、顔画像のうちの眼近傍の領域をいう。そして、送信部は、抽出された画像データを、通信相手側の装置である他の情報端末へ送信する。ここで、特定領域を除いた顔全体の画像データは、例えば、他の情報端末内に格納されている。本発明によれば、携帯情報端末、例えばシースルービュアーを用いたテレビ電話システムを提供できる。また、送信部は、使用者の顔全体の画像データのうちの一部の特定領域の画像データを送信する。このため、携帯情報端末の使用者の顔全体の画像データを常時送信する必要はない。これにより、できるだけ少ない情報量で、効率良く「表情」等の情報を通信できるという効果を奏する。
以下に、本発明に係るテレビ電話システムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、本発明の実施例1に係るテレビ電話システムの概略構成を示す図である。使用者OBSは、携帯情報端末100を用いて観察物OBJを観察する。携帯情報端末100は、撮像部104と、電子情報表示部101と、半透過光学素子102とを有する。撮像部104として、小型カメラを用いることができる。電子情報表示部101として、液晶表示パネルや有機ELパネルを用いることができる。また、半透過光学素子102は、ホログラム素子、ハーフミラーを用いることができる。これにより、携帯情報端末100は、いわゆるシースルービュアーを構成する。
また、携帯情報端末100は、相手側のテレビ電話200と通信を行なう。テレビ電話200は、他の情報端末に対応する。テレビ電話200は、画像表示部201と、撮像部202と、音声通話部203とを備える。画像表示部201は、通信相手である使用者OBSの顔画像データを表示する。撮像部202は、テレビ電話200を使用している者(不図示)の、例えば顔画像を撮像する。音声通話部203は、使用者OBSからの音声データの出力、及びテレビ電話200を使用している者の音声データの入力を行なう。
図2−1、図2−2は、携帯情報端末100の斜視図である。半透過光学素子102は、観察物OBJからの光を透過し、電子情報表示部101からの光を使用者OBSの方向へ反射する。これにより、半透過光学素子102は、電子情報表示部101に表示された所定の情報を観察物OBJの実視野に重畳的に表示する。また、携帯情報端末100は、テン(10)キー130を備えている。使用者OBSは、テンキー130により、数字、アルファベット、記号等を入力できる。テンキー130の下部には、音声センサ105が設けられている。音声センサ105は、例えばマイクロフォンである。音声センサ105は、使用者OBSの音声データを検出する。なお、音声センサは、破線で示す音声センサ105の位置に設けても良い。使用者OBSが携帯情報端末100をシースルービュアーとして使用するときは、破線で示す音声センサ105を設ける。使用者OBSが携帯情報端末100を携帯電話機として使用するときは、実線で示す音声センサ105を設ける。また、これら2つの音声センサ105を同時に設けても良い。以下、全ての実施例について同様である。
図3−1は、携帯情報端末100を上面からみた構成を示す。図3−2は、携帯情報端末100の断面構成を示す。図3−3は、携帯情報端末100を底面から見た構成を示す。図3−2に示すように、使用者OBSは、半透過光学素子102を透過して観察物OBJを実視野で観察する。同時に、電子情報表示部101に表示された情報の像は、半透過光学素子102により使用者OBSの方向へ反射される。これにより、使用者OBSは、観察物OBJを実視野で観察しつつ、重畳して情報を認識できる。また、撮像部104は、使用者OBSの顔画像のうち、少なくとも特定領域を撮像する位置に設けられている。「特定領域」の詳細に関しては後述する。
図4は、本実施例に係るテレビ電話システムの機能ブロック図である。図4において、携帯情報端末100とテレビ電話200とは無線通信可能に構成されている。携帯情報端末100の撮像部104は、使用者OBSの顔画像のうち少なくとも特定領域を撮像する。ここで、図6−1、6−2に、使用者OBSの顔画像600の例を示す。図6−1は、使用者OBSが口を閉じて話をしていない状態、即ち音声を発していない状態を示す。また、図6−2は、使用者OBSが微笑みながら、口を開けて音声を発している状態を示す。図6−1、6−2から明らかなように、使用者OBSの表情、感情を表すとき、顔画像のうち眼近傍の画像データey1、ey2が寄与する割合が大きい。また、使用者OBSが、音声を発しているか、否かに対応して、口元の画像データm1、m2が異なる状態となる。画像データm1は、口元を閉じている状態である。また、画像データm2は、口元を開いている状態である。顔画像のその他の部分、例えば、耳、鼻、額、顎、頭髪等の部分に関しては、使用者OBSの感情表現に寄与する割合は、眼近傍の画像データey1、ey2に比較して少ない。このため、「特定領域」として、顔画像のうち眼近傍の領域を用いる。これにより、携帯情報端末100は、眼近傍の画像データのみをテレビ電話200側へ逐次送信、即ちリアルタイムで送信する。この結果、通信する情報量を低減しつつ、使用者の表情等の情感を効率良く伝達できる。
図4に戻って説明を続ける。抽出部109は、撮像部104が撮像した画像データから特定領域の画像データを抽出する。例えば、撮像部104は、使用者OBSの眼近傍の領域をやや広めに撮像する。そして、抽出部109は、送信に必要な特定領域の画像データ、例えば図6−3に示すような一方の目近傍の画像データeyRを抽出する。また、撮像部104は、当初から送信に必要な特定領域の画像データを撮像しても良い。この時、抽出部109は、撮像部104が撮像した画像データを、そのまま用いる。
また、音声センサ105は、上述したように、使用者OBSの音声情報を検出する。音声認識部106は、音声センサ105からの音声データの有無、または音声データの内容の認識を行なう。口画像データ格納部107は、使用者OBSの顔画像のうち、少なくとも2つの異なる状態の口元の画像データを格納する。本実施例では、口画像データ格納部107は、図6−3に示すような、口が開いた状態の画像データmopと、口を閉じた状態の画像データmcとを格納している。
また、基本画像データ格納部108には、図6−3に示すような基本画像データ610が予め格納されている。基本画像データ610は、眼近傍の画像データを除いた顔画像データである。基本画像データ610は、使用者OBSの顔の輪郭、頭髪部分、鼻、耳等を含んでいる固定の静止画像である。なお、本実施例では、基本画像データ610は、口を閉じた状態の画像データmcを予め含んでいるものとする。
図4に示す入出力部103は、後述する手順に従って、基本画像データ610と、抽出された眼近傍の画像データeyRと、必要に応じて口画像データmoとをテレビ電話200に対して送信する。テレビ電話200の画像データ合成部210は、基本画像データ610と、眼近傍の画像データeyRと、必要に応じて口画像データmoとを合成する。ここで、眼近傍の画像データeyRは、一方の眼の画像データである。このため、画像データ合成部210は、画像データeyRを2つ並べて表示する。このとき、顔画像の中心を軸とする線対称になるように画像データeyRを表示することが望ましい。テレビ電話200の画像表示部201は、使用者OBSの合成された画像データを表示する。また、音声通話部203は、使用者OBSの音声データを出力する。なお、基本画像データ610には、他方の眼の静止画像を予め含ませておいても良い。このとき、画像データ合成部210は、一方の眼の画像データeyRのみを合成する。
次に、テレビ電話システムの送信手順について説明する。図5は、送信手順を示すフローチャートである。ステップS501において、携帯情報端末100の電源をONにする。そして、使用者OBSは、携帯情報端末100からテレビ電話200へ電話をかける。これにより、携帯情報端末100とテレビ電話200との通信が開始される。
ステップS502において、携帯情報端末100の基本画像データ格納部108に格納されている基本画像データ610がテレビ電話200へ送信される。基本画像データ610は、一度だけ送信すればよい。このため、基本画像データ610の送信は、逐次行なう必要はない。
ステップS503において、撮像部104と抽出部109とにより、特定領域の画像データ、例えば一方の眼近傍の画像データeyRが得られる。そして、ステップS504において、入出力部103は、特定領域の画像データをテレビ電話200へ送信する。
また、ステップS505において、音声センサ105の出力結果に基づいて音声データがあるか、否かが判断される。ステップS505の判断結果が真(Yes)のときは、ステップS507において、口画像データ格納部107に格納されている口が開いた状態の画像データmoが選択される。選択された画像データmoは、入出力部103を介して、テレビ電話200へ送信される。これに対して、ステップS505の判断結果が偽(No)のときは、ステップS506へ進む。ステップS506において、口画像データの切替えを行なわない。
ステップS508において、音声データが有るときは、画像データ合成部210は、基本画像データ610と、一方の眼近傍の画像データeyRと、口画像データmoとの合成を行なう。また、上述したように、基本画像データ610には、口を閉じた状態の画像データmcが予め表示されている。このため、音声データが無いときは、ステップ505で口画像データの切替えを行なわない。この結果、そのままの口を閉じた状態の画像データmcが維持される。このとき、画像データ合成部210は、口を閉じた状態の基本画像データ610に対して、一方の眼近傍の画像データeyRの合成を行なう。これにより、情報携帯端末100は、所定の静止画像である口元の画像データmopを適宜送信すれば良い。このように、口元に関する画像データは、使用者の口元の画像データをリアルタイムで撮像して送信する必要がない。この結果、通信する情報量を低減できる。また、テレビ電話200を見ている人は、使用者OBSが口を開けている画像が表示されているとき、使用者OBSの音声を聞くことができる。従って、テレビ電話による自然な会話を行なうことができる。
ここで、撮像部104は、使用者OBSの眼近傍の領域を、単位時間あたり所定のコマ数でリアルタイムの撮像を行なっている。そして、入出力部103は、特定領域の画像である一方の眼近傍の画像データeyRを逐次送信する。これにより、テレビ電話200に対して、通信する情報量を低減して、かつ使用者OBSの表情、情感をリアルタイムに送信できる。また、本実施例では、基本画像データ610を通信の開始時に1回送信するだけで良い。そして、特定領域の画像、例えば、眼近傍の画像データのみを逐次送信している。この結果、低減された情報送信量で、効率良く使用者OBSの表情等を伝達できる。
なお、本実施例の携帯情報端末100によれば、半透過光学素子102に重畳される情報は使用者OBSのみが見ることができる。このため、使用者OBSの周辺にいる第三者が半透過光学素子102に表示されている情報を認識することを防止できる。従って、携帯情報端末100では、周囲の第三者から表示されている情報を覗かれることを低減できる。従って、情報保護の観点から使用者OBSのプライバシーを保護できる。
(変形例)
図7は、本実施例の第1の変形例のテレビ電話システムの機能ブロックを示す図である。本変形例では、テレビ電話200が、口画像データ格納部107を有している点が実施例1と異なる。実施例1と同一の部分には同一の符号を付し、重複する説明は省略する。口画像データ格納部107がテレビ電話200側に設けられていると、情報携帯端末100のメモリ容量を低減できる。さらに、画像データ合成部210は、音声認識部106の認識結果に基づいて、口画像データ格納部107に格納されている口元の画像データmoを適宜選択する。このため、音声データがあるときに、携帯情報端末100はテレビ電話200へ口元の画像データmoを送信する必要がない。この結果、実施例1に比較して、さらに通信する情報量を低減できる。
図8は、本実施例の第2の変形例のテレビ電話システムの機能ブロックを示す図である。本変形例では、テレビ電話200は、口画像データ格納部107に加えて、さらに、音声認識部106を備えている。このとき、携帯情報端末100の入出力部103は、音声センサ105による検出結果のみをテレビ電話200へ送信する。このため、携帯情報端末100の構成を簡素化できる。
図9は、本発明の実施例2に係るテレビ電話システムにおける基本画像データ610を示す。本実施例では、撮像部104は、顔画像のうち両方の眼近傍を含む画像データを撮像する。抽出部109は、特定領域の画像データeyR、eyLを抽出する。また、口画像データ格納部107は、日本語についての5つの母音を発声しているときのそれぞれの口元の形状を示す画像データを格納する。画像データmaは、使用者OBSが音声「あ」を発音するときの口元の形状を示す。画像データmiは、使用者OBSが音声「い」を発音するときの口元の形状を示す。画像データmuは、使用者OBSが音声「う」を発音するときの口元の形状を示す。画像データmeは、使用者OBSが音声「え」を発音するときの口元の形状を示す。画像データmoは、使用者OBSが音声「お」を発音するときの口元の形状を示す。
図10は、本実施例の携帯情報端末100の機能ブロックを示す。本実施例は、テレビ電話システム200が基本画像データ格納部108を備えている点が上記実施例1と異なる。実施例1と同一の部分には同一の符号を付し、重複する説明は省略する。
携帯情報端末100の音声センサ105は、使用者OBSからの音声データを検出する。音声認識部106は、音声データの出力に基づいて、音声データの発音内容を認識する。例えば、音声認識部106は、使用者OBSが発した音声データに含まれる日本語の母音を認識する。そして、口画像データ格納部107に格納されている異なる5つの口元の画像データma、mi、mu、me、moのうち、音声認識部106により認識された母音に対応するデータが選択される。日本語の母音の情報と、この母音に対応する口元の画像データとの対応関係は予めテーブル(不図示)に格納されている。例えば、音声認識部106が、音声データに基づいて、母音「あ」を認識したときは、口元の画像データmaが選択される。入出力部103は、選択された口元の画像データmaをテレビ電話200へ送信する。
本実施例では、テレビ電話200が基本画像データ格納部108を備えている。基本画像データ格納部108には、実施例1で説明したような顔全体の画像データ610が予め格納されている。これにより、基本画像データ610をテレビ電話200へ送信する必要がない。従って、本実施例では、通信する情報量をさらに低減できる。また、実施例1では、2種類の口元の画像データmop、mcを用いている。これに対して、本実施例では、5種類の口元の画像データma、mi、mu、me、moを用いる。従って、本実施例では、さらに使用者OBSの表情等の情感を正確に表現できる。
(変形例)
図11は、本実施例の第1の変形例のテレビ電話システムの機能ブロックを示す図である。本変形例では、テレビ電話200が、口画像データ格納部107を有している点が実施例2と異なる。実施例1と同一の部分には同一の符号を付し、重複する説明は省略する。口画像データ格納部107がテレビ電話200側に設けられていると、情報携帯端末100のメモリ容量を低減できる。さらに、画像データ合成部210は、音声認識部106の認識結果に基づいて、口画像データ格納部107に格納されている口元の画像データma、mi、mu、me、moを適宜選択する。このため、音声データがあるときに、携帯情報端末100はテレビ電話200へ口元の画像データma、mi、mu、me、moのいずれか一つを送信する必要がない。この結果、実施例2に比較して、さらに通信する情報量を低減できる。なお、口元の画像データは、日本語の5つの母音に限られず、基本音声とすることができるものであれば良い。さらに、5つの母音に加えて、さらに子音に対応する口元の画像データを用いることもできる。
図12は、本実施例の第2の変形例のテレビ電話システムの機能ブロックを示す図である。本変形例では、テレビ電話200は、口画像データ格納部107に加えて、さらに、音声認識部106を備えている。このとき、携帯情報端末100の入出力部103は、音声センサ105による検出結果のみをテレビ電話200へ送信する。このため、携帯情報端末100の構成を簡素化できる。
図13は、本発明の実施例3に係るテレビ電話システムにおける基本画像データ610を示す。本実施例では、撮像部104は、顔画像のうち一方の眼のさらに半分の領域近傍を含む画像データを撮像する。このとき、抽出部109は、画像データeyRの半分の領域を抽出する。例えば、抽出部109は、一方の眼近傍の画像データのうち図13で斜線を付した半分の領域は用いずに、残りの半分の画像データeyRを抽出する。
また、本実施例では、眼近傍の画像データに加え、口元の画像データもリアルタイムに送信する構成である。図14−1、14−2は、本実施例に係る携帯情報端末400の斜視構成を示す。本実施例の携帯情報端末400の機能ブロックは、例えば図4に示すような実施例1の機能ブロックと同一である。実施例1と異なり、撮像部104が、半透過光学素子102の端部近傍に設けられている。これにより、撮像部104は、使用者OBSの顔画像のより広い領域を撮像できる。撮像部104は、使用者OBSの眼近傍と口元とを含んだ領域を撮像する。そして、抽出部109は、眼近傍の画像データに加えて、口元の画像データを抽出する。入出力部103は、一方の眼のさらに半分の領域の画像データeyRと、口元の画像データmrとを逐次、リアルタイムに送信する。なお、本実施例では、撮像部104が撮像した口元の画像データmrを、そのまま送信している。このため、図4で示したような、音声認識部106、口画像データ格納部107等は不要である。
画像データ合成部210は、基本画像データ610に対して、眼近傍の画像データeyRを合成する。ここで、画像データeyRは、一方の眼の半分の領域の画像データである。このため、2つの画像データeyRを合成して一方の眼近傍の画像データを作成する。さらに、実施例1と同様に、顔画像の中心を軸とする線対称になるように画像データeyRを表示する。また、画像データ構成部210は、逐次送信されてくる口元の画像データmrも基本画像データ610に合成する。これにより、通信する情報量を低減し、かつテレビ電話200側に使用者OBSの表情等の情感をさらに正確に伝達できる。
さらに、本実施例において、口元の画像データmrの半分の領域を送信する構成でも良い。図13において、口元の画像データmrhは、口元の画像データmrのうち斜線を付した領域を用いない例を示す。このとき、画像データ合成部210は、口元の画像データmrhを2つ分合成して、一つの口元の画像データを作成する。これによれば、一つの口元の画像データmrをリアルタイムで送信するときに比較して、略半分の通信情報量とすることができる。
(変形例)
図15−1、15−2は、実施例3の変形例に係る携帯情報端末400の斜視構成を示す。実施例3と異なり、撮像部104は、半透過光学素子102により反射する使用者OBSの顔画像を撮像できる位置に設けられている。これにより、撮像部104は、使用者OBSの顔画像のより広い領域を撮像できる。
以上説明した実施例1、実施例2、実施例3では、携帯情報端末とテレビ電話との間で通信する例を説明している。しかしながら、本発明はこれに限られない。例えば、図16に示すように、携帯情報端末100と、テレビ電話200との間にサーバーコンピュータ500を設ける構成でも良い。そして、上述した音声認識部106、口画像データ格納部107、抽出部109、画像データ合成部210、基本画像データ格納部108の機能を適宜サーバーコンピュータ500が備える。これにより、携帯情報端末100、テレビ電話200の構成を簡素化できる。また、携帯情報端末100側で画像データ合成を行なうこともできる。
また、特定領域は眼近傍の画像データに限られない。使用者OBSの表情等を効率良く伝達できる部分であれば顔画像のどこの領域でも良い。例えば、眼近傍に領域に加えて、眉近傍の領域でも良い。さらに、顔画像のうち、感情表現に従って変化した領域部分の画像データを送信する構成とすることもできる。
また、携帯情報端末とテレビ電話との通信形態は、PHS回線、携帯電話回線、有線LAN、無線LAN、赤外線通信等のデータ転送を行なえるものであれば良い。さらに、上記各実施例では、使用者が携帯情報端末を手で把持して使用する例を説明している。しかしながら、本発明は、携帯情報端末に限られず、例えば公知のヘッドマウントディスプレイに上述した携帯情報端末の機能を持たせても良い。このように、本発明は、その趣旨を逸脱しない範囲で、適宜変形が可能である。
以上のように、本発明に係るテレビ電話システムは、携帯情報端末を用い、通信する情報量を低減し、かつ使用者の表情等の情感を高効率に伝達できるシステムに適している。
実施例1に係るテレビ電話システムの概略構成を示す図である。 実施例1の携帯情報端末の斜視構成を示す図である。 実施例1の携帯情報端末の斜視構成を示す他の図である。 携帯情報端末の上面図である。 携帯情報端末の断面図である。 携帯情報端末の底面図である。 実施例1のテレビ電話システムの機能ブロック図である。 実施例1において情報を表示する手順を示すフローチャートである。 使用者の顔画像を示す図である。 使用者の顔画像を示す他の図である。 基本画像データ等を示す図である。 実施例1の第1の変形例のテレビ電話システムの機能ブロック図である。 実施例1の第2の変形例のテレビ電話システムの機能ブロック図である。 実施例2における基本画像データ等を示す図である。 実施例2のテレビ電話システムの機能ブロック図である。 実施例2の第1の変形例のテレビ電話システムの機能ブロック図である。 実施例2の第2の変形例のテレビ電話システムの機能ブロック図である。 実施例2における基本画像データ等を示す図である。 実施例3の携帯情報端末の斜視構成を示す図である。 実施例3の携帯情報端末の斜視構成を示す他の図である。 実施例3の変形例の携帯情報端末の斜視構成を示す図である。 実施例3の変形例の携帯情報端末の斜視構成を示す他の図である。 変形例に係るテレビ電話システムの概略構成を示す図である。
符号の説明
101 電子情報表示部
102 半透過光学素子
103 入出力部
104 撮像部
105 音声センサ
106 音声認識部
107 口画像データ格納部
108 基本画像データ格納部
109 抽出部
200 テレビ電話
201 画像表示部
202 撮像部
203 音声通話部
210 画像データ合成部
300 携帯情報端末
400 携帯情報端末
500 サーバーコンピュータ
600 顔画像
610 基本画像データ
OBS 使用者
OBJ 観察物

Claims (12)

  1. 少なくとも画像による通信を行なうテレビ電話システムであって、
    携帯情報端末と、
    前記携帯情報端末と通信を行なう他の情報端末とを含み、
    前記携帯情報端末は、
    前記携帯情報端末の使用者の顔画像のうち少なくとも特定領域を撮像する撮像部と、
    撮像された画像から前記特定領域の画像を抽出する抽出部と、
    前記抽出された画像を前記他の情報端末へ送信するための送信部とを有することを特徴とするテレビ電話システム。
  2. 前記携帯情報端末は、さらに、
    所定の情報を表示する電子情報表示部と、
    前記情報表示部に表示された情報を実視野に重畳的に表示する半透過光学素子とを有することを特徴とする請求項1に記載のテレビ電話システム。
  3. 前記特定領域は前記顔画像のうち眼近傍の領域であることを特徴とする請求項1乃至請求項2に記載のテレビ電話システム。
  4. 前記特定領域は前記顔画像のうち一方の眼近傍の領域であることを特徴とする請求項1乃至請求項3のいずれか1項に記載のテレビ電話システム。
  5. 前記特定領域は前記顔画像のうち一方の眼のさらに略半分の近傍の領域であることを特徴とする請求項4に記載のテレビ電話システム。
  6. 前記顔画像のうち、少なくとも2つの異なる状態の口元の画像データを格納する口画像データ格納部をさらに有し、
    前記口画像データ格納部は、前記携帯情報端末と前記他の情報端末とのいずれか一方に設けられていることを特徴とする請求項1乃至請求項5のいずれか1項に記載のテレビ電話システム。
  7. 前記携帯情報端末は、さらに前記使用者の音声を検出する音声センサを有し、
    前記音声センサの出力に基づいて前記口画像データ格納部に格納されている口元の画像データを選択して前記他の情報端末に表示することを特徴とする請求項6に記載のテレビ電話システム。
  8. 前記口元の画像データは、口が開いた状態の画像データと、口が閉じた状態の画像データとからなることを特徴とする請求項7に記載のテレビ電話システム。
  9. 前記口元の画像データは、日本語についての5つの母音を発声しているときのそれぞれの口元の形状を示す画像データであることを特徴とする請求項7に記載のテレビ電話システム。
  10. 前記口元の画像データは、口元の略半分の領域の画像データであることを特徴とする請求項7に記載のテレビ電話システム。
  11. 前記送信部は、前記抽出された前記特定領域の画像データを、前記他の情報端末に逐次送信することを特徴とする請求項1乃至請求項10のいずれか1項に記載のテレビ電話システム。
  12. 前記特定領域は、さらに口元の近傍を含み、
    前記送信部は、眼近傍の画像データに加えて口元の画像データを前記他の情報端末へ逐次送信することを特徴とする請求項3に記載のテレビ電話システム。

JP2004304010A 2004-10-19 2004-10-19 テレビ電話システム Withdrawn JP2006121158A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004304010A JP2006121158A (ja) 2004-10-19 2004-10-19 テレビ電話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004304010A JP2006121158A (ja) 2004-10-19 2004-10-19 テレビ電話システム

Publications (1)

Publication Number Publication Date
JP2006121158A true JP2006121158A (ja) 2006-05-11

Family

ID=36538669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004304010A Withdrawn JP2006121158A (ja) 2004-10-19 2004-10-19 テレビ電話システム

Country Status (1)

Country Link
JP (1) JP2006121158A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010507954A (ja) * 2006-10-26 2010-03-11 シーリアル テクノロジーズ ソシエテ アノニム ホログラフィック・ディスプレイを備える携帯電話システム
JP2011504239A (ja) * 2007-05-16 2011-02-03 シーリアル テクノロジーズ ソシエテ アノニム 通信を行うホログラフィック・ディスプレイ
CN103905773A (zh) * 2012-12-28 2014-07-02 联想(北京)有限公司 一种信息处理的方法及电子设备
JP2014230282A (ja) * 2013-05-22 2014-12-08 ソニー株式会社 等身大イメージを用いるテレビ会議のための携帯型透明ディスプレイ

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010507954A (ja) * 2006-10-26 2010-03-11 シーリアル テクノロジーズ ソシエテ アノニム ホログラフィック・ディスプレイを備える携帯電話システム
US8416276B2 (en) 2006-10-26 2013-04-09 Seereal Technologies S.A. Mobile telephony system comprising holographic display
JP2011504239A (ja) * 2007-05-16 2011-02-03 シーリアル テクノロジーズ ソシエテ アノニム 通信を行うホログラフィック・ディスプレイ
JP2015064593A (ja) * 2007-05-16 2015-04-09 シーリアル テクノロジーズ ソシエテ アノニムSeereal Technologies S.A. 通信を行うホログラフィック・ディスプレイ
JP2017097370A (ja) * 2007-05-16 2017-06-01 シーリアル テクノロジーズ ソシエテ アノニムSeereal Technologies S.A. 通信を行うホログラフィック・ディスプレイ
CN103905773A (zh) * 2012-12-28 2014-07-02 联想(北京)有限公司 一种信息处理的方法及电子设备
CN103905773B (zh) * 2012-12-28 2018-08-10 联想(北京)有限公司 一种信息处理的方法及电子设备
JP2014230282A (ja) * 2013-05-22 2014-12-08 ソニー株式会社 等身大イメージを用いるテレビ会議のための携帯型透明ディスプレイ

Similar Documents

Publication Publication Date Title
WO2020203999A1 (ja) コミュニケーション支援システム、コミュニケーション支援方法、および画像制御プログラム
KR101777807B1 (ko) 수화 번역기, 시스템 및 방법
US20140171036A1 (en) Method of communication
EP1480425B1 (en) Portable terminal and program for generating an avatar based on voice analysis
US11482134B2 (en) Method, apparatus, and terminal for providing sign language video reflecting appearance of conversation partner
JP2004289254A (ja) テレビ電話端末
WO2013077110A1 (ja) 翻訳装置、翻訳システム、翻訳方法およびプログラム
JPWO2004028162A1 (ja) 手話映像提示装置、手話映像入出力装置、および手話通訳システム
KR101835235B1 (ko) 시각 장애인 보조장치 및 그 제어방법
KR20110059349A (ko) 휴대 단말기 및 그 동작 제어방법
KR20100026701A (ko) 수화 번역기 및 그 방법
JP2019208138A (ja) 発話認識装置、及びコンピュータプログラム
WO2018061173A1 (ja) Tv会議システム、tv会議方法、およびプログラム
JP2003037826A (ja) 代理画像表示装置およびテレビ電話装置
WO2018158852A1 (ja) 通話システム及びコミュニケーションシステム
JP2006121158A (ja) テレビ電話システム
JP6882797B2 (ja) 会議システム
JP2004015478A (ja) 音声通信端末装置
KR20060102651A (ko) 피사체의 감정 상태에 대응하는 메시지 출력 기능을 갖는무선 통신 단말기 및 이를 이용한 메시지 출력 방법
JP2006185329A (ja) 画像合成装置
WO2023015862A1 (zh) 基于图像的多媒体数据合成方法及装置
KR20190002386A (ko) 캐릭터 서비스 시스템에서의 캐릭터 서비스를 제공하기 위한 장치
JP2008021058A (ja) 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体
JP2006048352A (ja) キャラクタ映像表示機能付き通信端末およびその制御方法
WO2006106671A1 (ja) 画像処理装置、画像表示装置、受信装置、送信装置、通信システム、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080108