JP2001357414A - アニメーション通信方法およびシステム並びにそれに用いる端末装置 - Google Patents

アニメーション通信方法およびシステム並びにそれに用いる端末装置

Info

Publication number
JP2001357414A
JP2001357414A JP2000176678A JP2000176678A JP2001357414A JP 2001357414 A JP2001357414 A JP 2001357414A JP 2000176678 A JP2000176678 A JP 2000176678A JP 2000176678 A JP2000176678 A JP 2000176678A JP 2001357414 A JP2001357414 A JP 2001357414A
Authority
JP
Japan
Prior art keywords
animation
image data
terminal device
operation control
control data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000176678A
Other languages
English (en)
Inventor
Tokio Kamimura
時男 上村
Yuzuru Tanaka
譲 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2000176678A priority Critical patent/JP2001357414A/ja
Priority to US09/878,207 priority patent/US6943794B2/en
Publication of JP2001357414A publication Critical patent/JP2001357414A/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Digital Computer Display Output (AREA)
  • Machine Translation (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】通信量を軽減させ、且つ自然に近いスムーズな
相手のアニメーションを見ながら会話を行うことを可能
にすること。 【解決手段】ホストコンピュータ3と複数の端末装置2
とを有し、端末装置2には、音声を送受信する手段と、
3次元の画像データを受信する手段と、画像データを動
作させるための動作制御データを受信する手段と、動作
制御データに基づいて画像データを動作させて生成され
る3次元のアニメーションを表示する手段とが設けら
れ、ホストコンピュータ3には、音声を送受信する手段
と、受信した音声に基づいて動作制御データを生成する
手段と、通信の一方の端末装置に係る画像データおよび
動作制御データを通信の他方の端末装置に送信する手段
とが設けられる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、相手のアニメーシ
ョンを見ながら会話を行うためのアニメーション通信方
法およびシステム、並びにそれに用いる端末装置および
ホストコンピュータに関する。
【0002】
【従来の技術】従来より、テレビ電話またはテレビ会議
システムなどのように、各端末装置間において音声と画
像を送受信することにより、相手の顔を見ながら会話を
行うことのできる通信システムが実用化されている。
【0003】しかし、画像はデータ量が多いため、画像
の送受信を行うには通信容量の大きな通信回線が必要で
ある。そのため、一般の電話回線を介して画像の送受信
を行った場合には、毎秒数コマ程度の画像の送受信しか
行うことができず、満足のいく動画を表示することがで
きない。高速の専用線を介した場合には、自然な動きに
近い動画を表示することが可能であるが、通信コストが
高くつくため一般の家庭に普及するには至っていない。
【0004】そこで、通信量を軽減するために、顔の全
体および一部分の画像を低解像度で予め作成してデータ
ベースに登録しておき、会話の開始時に顔の全体の画像
を相手の端末装置の表示面に表示し、表情の変化のあっ
た部分に対応する顔の一部分の画像のみをデータベース
から端末装置へダウンロードして表示する方法が提案さ
れている(特開平10−200882号)。
【0005】
【発明が解決しようとする課題】しかし、上に述べた従
来の方法では、通信量の軽減を図ることはできるが、画
像が低解像度であることと、複数の2次元画像を連続的
に組み合わせて表示していることから、人の表情などの
自然な動きを表現することが困難である。
【0006】また、通信システムを用いて会話を行う者
同士が共通の言語を理解できる必要であるので、言語の
異なる者同士では上のような通信システムを用いること
ができない。
【0007】本発明は、通信量を軽減させ、且つ自然に
近いスムーズな相手のアニメーションを見ながら会話を
行うことを可能にすることを目的とする。また、言語の
異なる者同士であっても、自然に近いスムーズな相手の
アニメーションを見ながら会話を行うことを可能にする
ことを他の目的とする。
【0008】
【課題を解決するための手段】本発明に係る方法は、相
手のアニメーションを見ながら会話を行うためのアニメ
ーション通信方法であって、ネットワークを介して接続
された相手の端末装置から送信される音声に基づいて、
画像データを動作させるための動作制御データを生成す
るステップと、受信した音声を再生するとともに、前記
動作制御データに基づいて画像データを動作させて生成
される3次元のアニメーションを表示するステップと、
を有してなる。
【0009】本発明に係るシステムは、ホストコンピュ
ータと複数の端末装置とを有し、前記端末装置には、音
声を送受信する手段と、3次元の画像データを受信する
手段と、前記画像データを動作させるための動作制御デ
ータを受信する手段と、前記動作制御データに基づいて
前記画像データを動作させて生成される3次元のアニメ
ーションを表示する手段とが設けられ、前記ホストコン
ピュータには、音声を送受信する手段と、受信した音声
に基づいて前記動作制御データを生成する手段と、通信
の一方の端末装置に係る前記画像データおよび前記動作
制御データを通信の他方の端末装置に送信する手段とが
設けられてなる。
【0010】本発明の他の形態によると、ホストコンピ
ュータには、受信された音声を他の自然言語に翻訳する
手段と、翻訳された音声を送信する手段と、翻訳された
音声に基づいて前記動作制御データを生成する手段とが
設けられる。
【0011】本発明の他の形態によると、端末装置に
は、画像データを記憶した記憶手段が設けられ、その記
憶手段から選択された画像データが通信の相手の端末装
置に送信される。
【0012】本発明において、端末装置として、電話
機、携帯電話機、モバイル端末、テレビ電話端末、パー
ソナルコンピュータなど、画像の表示と通信を行うこと
のできる種々の装置を用いることができる。
【0013】
【発明の実施の形態】以下に示す2つの実施形態では、
通信の相手の実物の顔画像の代わりに、相手のアバター
(身代わり)である顔のアニメーションを見ながら会話
を行う通信システム1を例として説明する。通信システ
ム1では、端末装置としてパーソナルコンピュータを用
いているが、電話機、携帯電話機、モバイル機器など、
他の種々の通信機器を用いることが可能である。 〔第一の実施形態〕図1は本発明に係る第一の実施形態
の通信システム1の全体の構成を示すブロック図、図2
は第一の実施形態における端末装置2の側に記憶されて
いるプログラムおよびデータの例を示す図、図3は第一
の実施形態におけるホストコンピュータ3の側に記憶さ
れているプログラムおよびデータの例を示す図、図4は
アバターとなる顔画像データFGDの例を示す図であ
る。
【0014】図1に示すように、通信システム1は、端
末装置2、ホストコンピュータ3、およびネットワーク
4などから構成される。端末装置2は複数設けられてお
り、図1においてはそのうちの2つの端末装置2A,2
Bが示されている。
【0015】端末装置2は、処理装置21、表示装置2
2a、スピーカ22b、マウス23a、キーボード23
b、マイク23c、通信制御装置24、CD−ROM装
置25、フロッピィディスク装置26、および磁気ディ
スク装置27などから構成される。
【0016】処理装置21は、CPU21a、RAM2
1b、およびROM21cなどから構成され、端末装置
2における一連の処理を実行する。RAM21bにはプ
ログラムまたはデータなどが一時的に記憶され、ROM
21cには、プログラム、および端末装置2のハードウ
ェアの設定情報などが記憶される。CPU21aは、そ
れらのプログラムを実行する。
【0017】表示装置22aは、顔のアニメーションな
どを表示する。スピーカ22bは、会話の相手の音声を
出力する。マウス23aおよびキーボード23bは、端
末装置2の操作などに用いられる。マイク23は音声を
入力する。
【0018】通信制御装置24は、顔の3次元データで
ある顔画像データFGD、音声が出力されるタイミング
に合わせて顔画像データFGDが動作するように制御す
る動作制御データDSD、音声をディジタル変換した音
声データSND、その他のデータの送受信を制御する。
CD−ROM装置25、フロッピィディスク装置26、
および磁気ディスク装置27は、データおよびプログラ
ムを記憶する。
【0019】ホストコンピュータ3は、処理装置31、
表示装置32、マウス33a、キーボード33b、通信
制御装置34、CD−ROM装置35、フロッピィディ
スク装置36、および磁気ディスク装置37などから構
成される。
【0020】処理装置31は、CPU31a、RAM3
1b、およびROM31cなどから構成される。処理装
置31それ自体の構成および機能は上に述べた処理装置
21と同様である。
【0021】ネットワーク4は、公衆回線、専用線、L
AN、無線回線、またはインターネットなどによって構
成される。端末装置2とホストコンピュータ3は、ネッ
トワーク4を介して接続される。
【0022】図2に示すように、端末装置2の磁気ディ
スク装置27には、端末装置の基本プログラムであるO
S2s、通信システム1の端末装置側のアプリケーショ
ンプログラムである端末通信プログラム2p、その他必
要なプログラムおよびデータが記憶されている。
【0023】端末通信プログラム2pは、基本処理プロ
グラム2pk、表示処理プログラム2phなどのプログ
ラムまたはモジュールを含んでいる。基本処理プログラ
ム2pkは、OS2sとの連携、顔画像データFGDの
選択などのユーザの操作に関する処理などを行う。表示
処理プログラム2phは、動作制御データDSDに基づ
いて顔画像データFGDを動作させ、アニメーションを
生成する。
【0024】これらのプログラムは、適宜、RAM21
bにロードされ、CPU21aによって実行される。ま
た、受信した顔画像データFGD、動作制御データDS
D、および音声データSNDなどのデータは、RAM2
1bに記憶される。また、必要に応じて磁気ディスク装
置27に記憶される。
【0025】このように、種々のプログラムがRAM2
1b上で実行されることによって、アニメーションの表
示を行うための一連のシステムである表示制御部EM1
が実現される。
【0026】図3に示すように、ホストコンピュータ3
の磁気ディスク装置37には、ホストコンピュータ3の
基本プログラムであるOS3s、通信システム1のホス
トコンピュータ側のアプリケーションプログラムである
ホスト通信プログラム3p、その他必要なプログラムお
よびデータが記憶されている。また、顔画像データFG
Dを蓄積する顔画像データベースFDBが設けられてい
る。
【0027】ホスト通信プログラム3pは、基本処理プ
ログラム3pk、動作制御プログラム3pd、翻訳プロ
グラム3pyなどのプログラムまたはモジュールを含ん
でいる。基本処理プログラム3pkは、OS3sとの連
携、アニメーションエンジンEM2、および翻訳エンジ
ンEM3などを統括して制御する。動作制御プログラム
3pは、音声データSNDに基づいて動作制御データD
SDを生成する。動作制御データDSDとは、音声デー
タSNDに基づく音声が出力されるタイミングに合わせ
て、顔画像データFGDが動作するように制御するため
の制御情報である。翻訳プログラム3pyは、ある自然
言語の音声データSNDを他の自然言語の音声データS
NDに翻訳する。
【0028】これらのプログラムは、適宜、RAM31
bにロードされ、CPU31aによって実行される。ま
た、受信した音声データSNDなどのデータはRAM3
1bに記憶される。
【0029】このように、種々のプログラムがRAM3
1b上で実行されることによって、動作制御データDS
Dを生成する一連のシステムであるアニメーションエン
ジンEM2、および、音声データSNDを他の言語に翻
訳する一連のシステムである翻訳エンジンEM3が実現
される。
【0030】なお、翻訳元の音声データを「音声データ
SND1」とし、翻訳後の音声データを「音声データS
ND2」として、これらを区別することがある。言語の
自動翻訳に関しては、例えば特開平1−211799号
を参照することができる。
【0031】図4に示すように、顔画像データFGD
は、人の頭部などを、口、目、鼻、耳などの構成部分、
および皮膚、筋肉、骨格などが動作可能なように構造化
された3次元モデルによって表現したデータである。図
4においては、皮膚を表現する多数のポリゴンと、顔の
動きを制御するための複数の制御点PNTが示されてい
る。顔画像データFGDは、図4で示される皮膚のモデ
ルと、図示しない筋肉および骨格のモデルとによって構
造化されている。
【0032】顔画像データFGDとして、自分の顔の
他、芸能人またはスポーツ選手などの有名人、歴史上の
人物、動物、漫画の登場人物(キャラクタ)など、実在
または架空の種々のものを用いることができる。
【0033】このような顔画像データFGDを作成する
方法として、2次元で撮影された通常の顔写真に基づい
て構造化顔画像を推定する方法、3次元計測装置を用い
て人物または像を3次元測定し、得られた3次元データ
に基づいて顔画像データFGDを作成する方法など、種
々の公知の方法を用いることができる。
【0034】なお、これらの方法の例が、特開平8−2
97751号、特開平11−328440号、および本
出願人が提案する特願2000−90629号などに示
されている。
【0035】次に、一方の端末装置2Aのユーザと他方
の端末装置2Bのユーザとの会話に際し、通信システム
1で行われる処理および操作について、フローチャート
を参照して説明する。
【0036】図5は第一の実施形態における通信システ
ム1の処理の流れを示すフローチャート、図6は端末装
置2の処理の流れを示すフローチャート、図7はホスト
コンピュータ3の処理の流れを示すフローチャートであ
る。
【0037】まず、端末装置2Aと2Bとの間で通信を
確立する(#10)。通信を確立するに当たり、例え
ば、一方の端末装置2Aからホストコンピュータ3に対
し、他方の端末装置2Bへの接続要求を送る。ホストコ
ンピュータ3は、端末装置2Aから接続要求のあったこ
とを端末装置2Bに通知する。端末装置2Bは、接続を
許可する場合に、それに応じた通知を行う。その他、公
知の種々のプロトコルを用いることができる。
【0038】通信が確立すると、図5に示すように、ホ
ストコンピュータ3から各端末装置2に対し、それぞれ
の相手の顔画像データFGDを送信する(#11)。つ
まり、端末装置2Aに対しては、端末装置2Bのユーザ
の選択した顔画像データFGDを、端末装置2Bに対し
ては、端末装置2Aのユーザの選択した顔画像データF
GDを、それぞれ送信する。各ユーザは、顔画像データ
ベースFDBの中から、または予め各ユーザ用に登録し
たものの中から、自分の好みの顔画像データFGDを選
択する。そのような選択に際し、選択可能な顔画像デー
タFGDの一覧表を各ユーザの表示面に表示させるよう
にしてもよいし、ユーザが番号などで指定するようにし
てもよい。また、各ユーザが予め指定した1つの顔画像
データFGDが送信されるようにしてもよい。
【0039】各ユーザは会話を開始する(#12)。会
話が行われると、一方の端末装置2から他方の端末装置
2に向けて音声データSNDが送信される。このとき、
ユーザは、自分の発する言語および聞き取りに使う言語
をホストコンピュータ3に対して指定することができ
る。例えば、英語で会話を行いたい場合には、話し言語
および聞き取り言語とも英語を指定する。日本語で話
し、英語で音声を聞くように指定することもできる。会
話の途中で言語の指定を変更することも可能である。
【0040】ホストコンピュータ3は、端末装置2から
の言語の指定に応じて、これらの間の会話において翻訳
を行う必要があるか否かを判断する(#13)。一方の
話す言語と他方の聞く言語とが異なっている場合に、翻
訳が必要であると判断する。なお、ユーザからの言語の
指定がない場合には、特定の言語、例えば日本語である
と判断する。
【0041】翻訳が必要な場合には、ホストコンピュー
タ3は、翻訳エンジンEM3によって翻訳を行う(#1
4)。翻訳によって、音声データSND1から音声デー
タSND2が生成される。
【0042】音声データSNDに基づいて、動作制御デ
ータDSDが生成される(#15)。翻訳が行われた場
合は、翻訳後の音声データSND2に基づいて動作制御
データDSDが生成される。
【0043】動作制御データDSDの生成に当たって、
例えば、音声データSNDから音素などの情報を抽出
し、単語または感情などを求め、顔画像データFGDの
各制御点PNTの動きを計算して動作制御データDSD
を生成する。
【0044】なお、ユーザの感情を受信した音声データ
SNDから抽出するのではなく、ユーザが端末装置のキ
ーボード23bなどを操作して直接に指定してもよい。
その場合には、端末装置2からは、例えば「微笑む」
「怒る」などの感情を表す制御データを送信することと
なる。このようにすると、ユーザが疲れているときで
も、会話の相手には元気な様子のアニメーションを表示
することができる。
【0045】ホストコンピュータ3から端末装置2に対
し、音声データSNDおよび動作制御データDSDを送
信する(#16)。端末装置2では、受信した音声デー
タSNDをスピーカ22bから出力するとともに、受信
した動作制御データDSDに基づいて、最初に受信した
顔画像データFGDを動作させ、これによってアニメー
ションを生成し、生成したアニメーションを表示装置2
2aに表示する。(#17)。
【0046】例えば、端末装置2Aのユーザが「おはよ
う」と言うと、ホストコンピュータ3は顔画像データF
GDに「おはよう」の口の動きをさせるための動作制御
データDSDを生成して端末装置2Bに送信する。端末
装置2Bでは、端末装置2Aのユーザの「おはよう」の
声がスピーカ22bから聞こえ、表示装置22aには
「おはよう」の声に合わせて端末装置2Aのユーザの顔
画像データFGDが「おはよう」の形に開閉する。
【0047】また、ホストコンピュータ3は、「おはよ
う」のトーンなどから端末装置2Aのユーザの感情を分
析する。そこで、例えば端末装置2Aのユーザがにこや
かな雰囲気であることが分かると、顔画像データFGD
の目および顔全体を動かして微笑ませる動作制御データ
DSDを生成し、端末装置2Bに送信する。端末装置2
Bの表示装置22aには、端末装置2Aのユーザが微笑
みながら「おはよう」と言っているアニメーションが表
示される。
【0048】このように、各ユーザは、互いに相手の話
した音声を聞き、且つ相手の話に基づいて表情の変化す
るアニメーションを見ることができる。ユーザが通信の
切断を要求するまで(#18)、上に述べた処理が繰り
返され、ユーザ間においてアニメーションを見ながらの
会話が行われる。
【0049】図6に示すように、各端末装置2において
は、ホストコンピュータ3から相手のユーザの顔画像デ
ータFGDを受信する(#21)。各ユーザが話をする
と(#22でイエス)、音声データSNDをホストコン
ピュータ3へ送信する(#23)。動作制御データDS
Dおよび音声データSNDを受信すると(#24でイエ
ス)、それらによる音声を出力しアニメーションを表示
する(#25)。
【0050】図7に示すように、ホストコンピュータ3
においては、各端末装置2に相手のユーザの顔画像デー
タFGDを送信する(#31)。端末装置2から音声デ
ータSNDを受信すると(#32)、翻訳の必要がある
場合に翻訳を行った後(#33,34)、動作制御デー
タDSDを生成し(#35)、動作制御データDSDお
よび音声データSNDを相手側の端末装置2へ送信する
(#36)。
【0051】なお、3つ以上の端末装置2の間で通信を
行うことも可能である。その場合には、各ユーザに対し
て、他の全てのユーザの顔画像データFGDを送信す
る。各ユーザの音声は、それに基づく動作制御データD
SDとともに、他の全てのユーザの端末装置2に送信さ
れる。各端末装置2では、受信した複数の顔画像データ
FGDに基づくアニメーションの中から、話をしている
ユーザに対応するアニメーションのみを選択して表示す
ればよい。また、全てのユーザのアニメーションを同時
に表示するようにしてもよい。それらを切り換えるよう
にしてもよい。
【0052】第一の実施形態の通信システム1による
と、データ量の多い顔画像データFGDは最初に1回の
み送信され、その後は動作制御データDSDのみが送信
されるので、通信量が軽減するとともに、自然に近いス
ムーズな相手のアニメーションを見ながら会話を行うこ
とが可能となる。
【0053】顔画像データFGDが構造化された3次元
モデルによって表現されたデータであり、表示面には3
次元のアニメーションが表示されるので、実物の画像に
近いリアルな画像が表示される。
【0054】ホストコンピュータ3にアニメーションエ
ンジンEM2が設けられているので、端末装置2におけ
る処理の負荷が軽減される。また、ホストコンピュータ
3による翻訳サービスを仲介させることで、他国語を話
す相手との間でも違和感のない会話を行うことができ
る。
【0055】特に、翻訳後の音声データSNDに基づい
て動作制御データDSDを生成するので、翻訳された音
声とアニメーションの動きとを旨く一致させることがで
きる。
【0056】例えば、言語の違いによって唇や顔の動き
が異なるので、実物の顔画像を表示した場合には音声は
翻訳されても顔の動きはそのままであるが、本実施形態
によれば、翻訳後の音声に唇や顔の動きを合わせること
ができるので、翻訳された音声とともに表情を正確に表
現した自然なアニメーションを会話の相手に表示するこ
とができる。
【0057】また、外国映画の吹替えに見られるよう
に、異なる言語間の画像の動きと音声の響きの不一致か
らくる不自然さ、または音声の長さの違いからくる不自
然さが解消される。
【0058】第一の実施形態において、翻訳後の音声デ
ータSND2とともに、翻訳前の音声データSND1を
送信してもよい。これにより、音声の多重化を図ること
ができ、原文を確認しながら翻訳された音声を聞くこと
ができる。
【0059】また、翻訳後の音声データSND2ととも
に、そのテキストデータを送信してもよい。これによ
り、端末装置2において、アニメーションの表示ととも
に、翻訳文を表示することができる。
【0060】なお、翻訳を行う必要が全くない場合に
は、ホストコンピュータ3の翻訳プログラム3pyおよ
び翻訳エンジンEM3などを削除しておけばよい。 〔第二の実施形態〕図8は第二の実施形態における端末
装置2の側に記憶されているプログラムおよびデータの
例を示す図、図9は第二の実施形態におけるホストコン
ピュータ3の側に記憶されているプログラムおよびデー
タの例を示す図である。
【0061】第二の実施形態において、通信システムの
全体の構成は第一の実施形態の場合と同様である。しか
し、端末装置2およびホストコンピュータ3に記憶され
るプログラムおよびデータと、各処理装置21、31に
よる処理内容とが、第一の実施形態の場合と異なる。
【0062】すなわち、第一の実施形態では、顔画像デ
ータベースFDB、動作制御プログラム3pd、および
アニメーションエンジンEM2がホストコンピュータ3
に設けられているが、第二の実施形態では、図8に示す
ように、端末装置2に設けられている。したがって、図
9に示すように、ホストコンピュータ3には、これら顔
画像データベースFDB、動作制御プログラム3pd、
およびアニメーションエンジンEM2は設けられていな
い。
【0063】図10は第二の実施形態における通信シス
テム1の処理の流れを示すフローチャート、図11は端
末装置2の処理の流れを示すフローチャート、図12は
ホストコンピュータ3の処理の流れを示すフローチャー
トである。
【0064】図10に示すように、まず、端末装置2A
と2Bとの間で通信を確立する(#40)。各端末装置
2の間において、互いの相手の顔画像データFGDを交
換する(#41)。
【0065】各ユーザは会話を開始するに当たり、翻訳
が必要か否かを判断する(#42)。この判断は、第一
の実施形態ではホストコンピュータ3によって行われる
が、第二の実施形態では端末装置2が行う。例えば、ス
テップ#41において、各端末装置2は、顔画像データ
とともに、自分の話す言語の情報を相手に送信する。こ
れに基づいて、相手の各端末装置2は翻訳が必要か否か
を判断する。
【0066】会話が行われると、翻訳が必要な場合に
は、音声データSNDがホストコンピュータ3に送信さ
れる(#43)。ホストコンピュータ3は、それを翻訳
し(#44)、翻訳した音声データSNDを相手の端末
装置2に送信する(#45)。翻訳が必要でない場合に
は、音声データSNDは相手の端末装置2に送信される
(#46)。
【0067】端末装置2は、受信した音声データSND
に基づいて、動作制御データDSDを生成する(#4
7)。受信した音声を出力し、生成した動作制御データ
DSDに基づいて顔画像データFGDを動作させ、生成
したアニメーションを表示する。(#48)。
【0068】図11に示すように、各端末装置2におい
ては、相手のユーザの顔画像データFGDを受信し(#
51)、自分の顔画像データFGDを相手に送信する
(#52)。
【0069】このとき、受信した顔画像データFGDを
顔画像データベースFDBに保存し、再度同じ相手と会
話をするときに利用してもよい。翻訳の必要がある場合
には(#53でイエス)、音声データSNDをホストコ
ンピュータ3に送信する(#54)。翻訳が必要でない
場合には、音声データSNDを相手の端末装置2に送信
する(#55)。
【0070】相手の端末装置2またはホストコンピュー
タ3から音声データSNDを受信すると(#56でイエ
ス)、動作制御データDSDを生成し(#57)、それ
らによる音声を出力しアニメーションを表示する(#5
8)。
【0071】図12に示すように、ホストコンピュータ
3においては、端末装置2から音声データSNDを受信
すると(#61)、翻訳を行い(#62)、翻訳された
音声データSND2を相手側の端末装置2に送信する
(#63)。
【0072】第二の実施形態によると、動作制御データ
DSDをホストコンピュータ3ではなく端末装置2で生
成するので、動作制御データDSDの送受信が不要であ
る。これにより、通信量をさらに軽減することができ
る。
【0073】第二の実施形態において、翻訳を行う必要
が全くない場合には、ステップ#53の判断を行うこと
なく、音声データSNDを常に相手の端末装置2に送信
すればよい。その場合に、ホストコンピュータ3を介す
る必要はない。したがって、この場合には、ホストコン
ピュータ3を用いることなく、簡易なネットワークにお
いても通信システムを構築することができる。
【0074】上に説明したいずれの実施形態において
も、会話を開始するに当たり、各端末装置2において顔
画像データFGDを予め取得しておき、会話中において
は動作制御データDSDに基づいてアニメーションを生
成するので、通信量が軽減し、自然な動きのアニメーシ
ョンを表示することができる。
【0075】また、上に述べたように、音声データSN
Dに対応するテキストデータをユーザに対して出力する
ことにより、アニメーション、音声、文字データのマル
チメディアを構成することができる。
【0076】その他、端末装置2、ホストコンピュータ
3、または通信システム1の全体または各部の構成、回
路、処理内容、処理順序、通信の手順などは、本発明の
趣旨に沿って適宜変更することができる。
【0077】
【発明の効果】本発明によると、通信量を軽減させ、か
つ、自然に近いスムーズな相手のアニメーションを見な
がら会話を行うことが可能となる。
【0078】請求項2,4,5の発明によると、言語の
異なる者同士であっても、自然に近いスムーズな相手の
アニメーションを見ながら会話を行うことが可能とな
る。請求項5の発明によると、動作制御データの送受信
を行わないので、通信量をさらに軽減することができ
る。
【0079】請求項6の発明によると、複数の端末装置
をネットワークを介して接続することにより、アニメー
ションを見ながら会話を行うことのできる通信システム
を簡単に構成することができる。
【図面の簡単な説明】
【図1】本発明に係る第一の実施形態の通信システムの
全体の構成を示すブロック図である。
【図2】端末装置の側に記憶されているプログラムおよ
びデータの例を示す図である。
【図3】ホストコンピュータの側に記憶されているプロ
グラムおよびデータの例を示す図である。
【図4】アバターとなる顔画像データの例を示す図であ
る。
【図5】通信システムの処理の流れを示すフローチャー
トである。
【図6】端末装置の処理の流れを示すフローチャートで
ある。
【図7】ホストコンピュータの処理の流れを示すフロー
チャートである。
【図8】第二の実施形態における端末装置の側に記憶さ
れているプログラムおよびデータの例を示す図である。
【図9】ホストコンピュータの側に記憶されているプロ
グラムおよびデータの例を示す図である。
【図10】通信システムの処理の流れを示すフローチャ
ートである。
【図11】端末装置の処理の流れを示すフローチャート
である。
【図12】ホストコンピュータの処理の流れを示すフロ
ーチャートである。
【符号の説明】
1 通信システム 2 端末装置 3 ホストコンピュータ 21 処理装置(音声を送受信する手段、3次元の画像
データを受信する手段、動作制御データを受信する手
段) 22a 表示装置(アニメーションを表示する手段) 24 通信制御装置(送受信する手段) 31 処理装置(動作制御データを生成する手段、送信
する手段) 34 通信制御装置(送信する手段) 37 磁気ディスク装置(記憶手段) EM1 表示制御部(アニメーションを表示する手段) EM2 アニメーションエンジン(動作制御データを生
成する手段) EM3 翻訳エンジン(翻訳する手段)
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06T 11/60 200 G06T 11/60 200 5E501 G10L 15/00 H04N 7/14 H04N 7/14 G10L 3/00 551C Fターム(参考) 5B050 AA08 BA08 BA09 BA12 CA07 CA08 EA24 FA02 FA10 5B069 AA01 AA20 DD06 DD16 HA19 KA02 LA03 LA07 5B091 AA03 BA03 CB12 CB24 CB32 CD03 CD15 5C064 AA01 AA02 AB06 AC06 AC08 AC13 AC16 AD08 5D015 KK01 KK02 5E501 AA02 AA04 AA13 AB01 AB02 AB03 AC16 BA20 CA06 CB15 DA03 EA21 FA15 FA27 FA46

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信方法であって、 ネットワークを介して接続された相手の端末装置から送
    信される音声に基づいて、画像データを動作させるため
    の動作制御データを生成するステップと、 受信した音声を再生するとともに、前記動作制御データ
    に基づいて画像データを動作させて生成される3次元の
    アニメーションを表示するステップと、 を有してなることを特徴とするアニメーション通信方
    法。
  2. 【請求項2】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムに用いられる端末
    装置であって、 ネットワークを介して接続された相手の端末装置から送
    信される音声を受信する手段と、 受信した音声に基づいて、画像データを動作させるため
    の動作制御データを生成する手段と、 受信した音声を再生するとともに、前記動作制御データ
    に基づいて画像データを動作させて生成される3次元の
    アニメーションを表示する手段と、 を有してなることを特徴とする端末装置。
  3. 【請求項3】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムであって、 ホストコンピュータと複数の端末装置とを有し、 前記端末装置には、音声を送受信する手段と、3次元の
    画像データを受信する手段と、前記画像データを動作さ
    せるための動作制御データを受信する手段と、前記動作
    制御データに基づいて前記画像データを動作させて生成
    される3次元のアニメーションを表示する手段とが設け
    られ、 前記ホストコンピュータには、音声を送受信する手段
    と、受信した音声に基づいて前記動作制御データを生成
    する手段と、通信の一方の端末装置に係る前記画像デー
    タおよび前記動作制御データを通信の他方の端末装置に
    送信する手段とが設けられ、 てなることを特徴とするアニメーション通信システム。
  4. 【請求項4】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムであって、 ホストコンピュータと複数の端末装置とを有し、 前記端末装置には、音声を送受信する手段と、画像デー
    タを受信する手段と、前記画像データを動作させるため
    の動作制御データを受信する手段と、前記動作制御デー
    タに基づいて前記画像データを動作させて生成されるア
    ニメーションを表示する手段とが設けられ、 前記ホストコンピュータには、音声を受信する手段と、
    受信された音声を他の自然言語に翻訳する手段と、翻訳
    された音声を送信する手段と、翻訳された音声に基づい
    て前記動作制御データを生成する手段と、通信の一方の
    端末装置に係る前記画像データおよび前記動作制御デー
    タを通信の他方の端末装置に送信する手段とが設けら
    れ、 てなることを特徴とするアニメーション通信システム。
  5. 【請求項5】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムに用いられる端末
    装置であって、 音声を送受信する手段と、 3次元の画像データを受信する手段と、 前記画像データを動作させるための動作制御データを受
    信する手段と、 前記動作制御データに基づいて前記画像データを動作さ
    せて生成されるアニメーションを表示する手段と、 が設けられてなることを特徴とする端末装置。
  6. 【請求項6】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムに用いられるホス
    トコンピュータであって、 音声を送受信する手段と、 受信された音声を他の自然言語に翻訳する手段と、 翻訳された音声を送信する手段と、 翻訳された音声に基づいて、画像データを動作させるた
    めの動作制御データを生成する手段と、 通信の一方の端末装置に係る前記画像データおよび前記
    動作制御データを通信の他方の端末装置に送信する手段
    と、 が設けられてなることを特徴とするホストコンピュー
    タ。
  7. 【請求項7】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムであって、 ホストコンピュータと複数の端末装置とを有し、 前記端末装置には、音声を送受信する手段と、画像デー
    タを記憶する記憶手段と、画像データを送受信する手段
    と、受信した音声に基づいて受信した画像データを動作
    させるための動作制御データを生成する手段と、前記動
    作制御データに基づいて受信した画像データを動作させ
    て生成されるアニメーションを表示する手段とが設けら
    れ、 前記ホストコンピュータには、音声を受信する手段と、
    受信された音声を他の自然言語に翻訳する手段と、翻訳
    された音声を送信する手段とが設けられ、 てなることを特徴とするアニメーション通信システム。
  8. 【請求項8】相手のアニメーションを見ながら会話を行
    うためのアニメーション通信システムに用いられる端末
    装置であって、 音声を送受信する手段と、 3次元の画像データを記憶する記憶手段と、 画像データを送受信する手段と、 受信した音声に基づいて受信した画像データを動作させ
    るための動作制御データを生成する手段と、 生成した動作制御データに基づいて受信した画像データ
    を動作させて生成されるアニメーションを表示する手段
    と、 が設けられてなることを特徴とする端末装置。
  9. 【請求項9】前記画像データは、動作可能に構造化され
    た3次元モデルであり、 前記動作制御データに基づいて3次元モデルの構造化さ
    れた部分を動作させる、 請求項2ないし8のいずれかに記載のシステム、ホスト
    コンピュータ、または端末装置。
JP2000176678A 2000-06-13 2000-06-13 アニメーション通信方法およびシステム並びにそれに用いる端末装置 Pending JP2001357414A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000176678A JP2001357414A (ja) 2000-06-13 2000-06-13 アニメーション通信方法およびシステム並びにそれに用いる端末装置
US09/878,207 US6943794B2 (en) 2000-06-13 2001-06-12 Communication system and communication method using animation and server as well as terminal device used therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000176678A JP2001357414A (ja) 2000-06-13 2000-06-13 アニメーション通信方法およびシステム並びにそれに用いる端末装置

Publications (1)

Publication Number Publication Date
JP2001357414A true JP2001357414A (ja) 2001-12-26

Family

ID=18678376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000176678A Pending JP2001357414A (ja) 2000-06-13 2000-06-13 アニメーション通信方法およびシステム並びにそれに用いる端末装置

Country Status (1)

Country Link
JP (1) JP2001357414A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003063483A1 (fr) * 2002-01-18 2003-07-31 Matsushita Electric Industrial Co., Ltd. Dispositif de communication
CN1328908C (zh) * 2004-11-15 2007-07-25 北京中星微电子有限公司 一种视频通信的方法
JP2007287177A (ja) * 2002-12-11 2007-11-01 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2009241166A (ja) * 2008-03-28 2009-10-22 Advanced Telecommunication Research Institute International ロボット遠隔操作システム
CN102438068A (zh) * 2011-10-26 2012-05-02 深圳市五巨科技有限公司 一种移动终端视频聊天的方法及移动终端
JP2016502157A (ja) * 2012-09-18 2016-01-21 チョル キム,サン 単語自動翻訳に基づく唇形状変更装置および方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003063483A1 (fr) * 2002-01-18 2003-07-31 Matsushita Electric Industrial Co., Ltd. Dispositif de communication
JP2007287177A (ja) * 2002-12-11 2007-11-01 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP4525712B2 (ja) * 2002-12-11 2010-08-18 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
CN1328908C (zh) * 2004-11-15 2007-07-25 北京中星微电子有限公司 一种视频通信的方法
JP2009241166A (ja) * 2008-03-28 2009-10-22 Advanced Telecommunication Research Institute International ロボット遠隔操作システム
CN102438068A (zh) * 2011-10-26 2012-05-02 深圳市五巨科技有限公司 一种移动终端视频聊天的方法及移动终端
JP2016502157A (ja) * 2012-09-18 2016-01-21 チョル キム,サン 単語自動翻訳に基づく唇形状変更装置および方法

Similar Documents

Publication Publication Date Title
US6943794B2 (en) Communication system and communication method using animation and server as well as terminal device used therefor
CN110446000B (zh) 一种生成对话人物形象的方法和装置
US6909453B2 (en) Virtual television phone apparatus
US20060079325A1 (en) Avatar database for mobile video communications
US20040114731A1 (en) Communication system
US20030163315A1 (en) Method and system for generating caricaturized talking heads
US20030149569A1 (en) Character animation
EP1912175A1 (en) System and method for generating a video signal
CN113592985B (zh) 混合变形值的输出方法及装置、存储介质、电子装置
JP2002150317A (ja) 映像表示装置
US20230047858A1 (en) Method, apparatus, electronic device, computer-readable storage medium, and computer program product for video communication
WO2008087621A1 (en) An apparatus and method for animating emotionally driven virtual objects
KR100733772B1 (ko) 이동통신 가입자를 위한 립싱크 서비스 제공 방법 및 이를위한 시스템
CN113194203A (zh) 一种用于听障人士的沟通系统、接听拨打方法及通讯系统
JP2003037826A (ja) 代理画像表示装置およびテレビ電話装置
KR20220109373A (ko) 발화 영상 제공 방법
JP2001357414A (ja) アニメーション通信方法およびシステム並びにそれに用いる端末装置
CN115767206A (zh) 基于扩展现实的数据处理方法以及系统
KR100395491B1 (ko) 아바타 기반 음성 언어 번역 시스템에서의 화상 통신 방법
JP2002215180A (ja) 通信装置
JPH08307841A (ja) 擬似動画tv電話装置
KR102510892B1 (ko) 발화 영상 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치
KR102546532B1 (ko) 발화 영상 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치
JP2001357413A (ja) アニメーション会話システムおよびそれに用いられるサーバ
JP3073176U (ja) 音声ドライブ動画面用イメージデータ生成装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050613

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050704