JPH11149285A - 映像音響システム - Google Patents

映像音響システム

Info

Publication number
JPH11149285A
JPH11149285A JP9315381A JP31538197A JPH11149285A JP H11149285 A JPH11149285 A JP H11149285A JP 9315381 A JP9315381 A JP 9315381A JP 31538197 A JP31538197 A JP 31538197A JP H11149285 A JPH11149285 A JP H11149285A
Authority
JP
Japan
Prior art keywords
attribute information
program
information
still image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9315381A
Other languages
English (en)
Inventor
Koshin Shimada
康臣 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9315381A priority Critical patent/JPH11149285A/ja
Publication of JPH11149285A publication Critical patent/JPH11149285A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Studio Circuits (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】 【課題】 ユーザの顔や姿を原画に登場する人の顔、姿
とを容易に置き換えた映像の再生を可能とする映像音響
システムを提供する。 【解決手段】 動画プログラム101中の所定部分の属
性情報を動画プログラム101に付与する属性情報付与
手段102を設け、属性情報をもつ動画プログラム10
1を取り込む属性情報付動画プログラム取り込み手段1
03を設け、動画プログラム101とは異なる静止画1
04の情報を取り込む静止画情報取り込み手段105を
設け、静止画情報取り込み手段105で得られた静止画
04を属性情報付動画プログラムの所定部分と置き換え
かつ所定部分の属性情報に基づき静止画を制御する静止
画動画変換制御手段106を設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、動画の中の所定部
分を他の静止画の一部または全部と置き換えるとともに
動画中の所定部分の位置、動きなどの属性情報に従って
静止画を制御する映像音響システムに関するものであ
る。
【0002】
【従来の技術】従来、動画のなかの一部を置き換えるに
は、背景を青色で撮影したオブジェクトを原画に合成す
るという、いわゆるクロマキー技術によっていた。これ
によると、オブジェクトの動作変化に関連した制御デー
タがないため、オブジェクトを撮影した後あるいはオブ
ジェクトと原画とを合成した後に、撮影したオブジェク
トの形、様子、照明、あるいは音声などを制御変化させ
た合成映像を作成することは困難であるという欠点があ
った。
【0003】また、コンピュータグラフィックス(以下
CGと呼ぶ)技術においては、対象物の所定部分の動き
をセンサにより直接的または間接的に測定して、CG中
の対象物を上記対象物の所定部分の動き情報で制御する
ものがある。具体的には、リアルタイムに人の発声に合
わせて映像をリップシンクさせる例として、演技者の口
の周りにマーカーをつけて、これの動きをもとに顔など
の多角形ポリゴンデータを使って制御するCGがある。
【0004】ところが、このようなCGには、既に映像
化された後の動画像の各フレームと連動して変化するオ
ブジェクトの動作に関連した制御データを保存する手
段、あるいは生成される制御信号を出力させ他のオブジ
ェクトの動作を変化させる手段、あるいは他のオブジェ
クトと置き換えるなどの制御手段がないため、オブジェ
クトを撮影した後あるいはオブジェクトと原画とを合成
などで映像化した後に、オブジェクトの動作に合わせて
そのオブジェクトの種類、大きさ、明るさ、あるいは音
声などを制御変化させた他のオブジェクトを原画のオブ
ジェクトと置き換えたり、または両者を重ね合わせるこ
とによる合成映像を作成することは困難であるという欠
点があった。
【0005】また、ポリゴンデータを使った3次元CG
を原画像にする場合には、多角形ポリゴン座標の数が多
い。したがって、3次元CGをリアルタイムに制御して
2次元映像にレンダリングするには、高速でかつ専用の
画像演算生成手段が必要であるため、コストがかさんだ
り、画像の再生速度や画質が制限されたり、開発期間が
長期にわたるなどの問題がある。さらに、一度再生され
た動画映像の中のオブジェクトの動作に関連した制御デ
ータを保存し出力する場合は、より画像の再生速度や画
質が制限されるなどの欠点があった。
【0006】
【発明が解決しようとする課題】上記したように、従来
の動画プログラム中の部分的な置き換えを実現する手段
は、非常に高度な技術を必要とし、かつ高価である。す
なわち、従来の動画プログラムは、各フレーム毎に動画
中の置き換え対象となる静止画を制御するような属性情
報がないため、置き換え素材として静止画を使えず非常
にシステムが複雑になるという課題があった。
【0007】具体的に説明すると、従来の動画像は、い
ずれも各映像の一こま一こまがフレームデータとして加
工済みのデータであるために、各フレーム内のデータを
制御可変する手段がなく、後加工は困難であったという
ことである。もう少し分かりやすく説明すると、以下の
ようになる。従来の映画ソフトは、俳優が出演するのみ
で、一般の人が自分で映画に登場するということは、実
写を使う以上、自分自身がその撮影現場にいなければ不
可能であった。また、撮影後に配役を置き換えたりする
ことも不可能であった。また、CGなどで合成した顔の
形を自由に変形して遊ぶことができても、これを映画な
どの予め完成された映像に自動的に取り入れる手段がな
いために、1こま、1こま別途静止画を作成し映画など
の動画に手動で背景合成する必要があり、手軽にユーザ
が楽しむことができなかった。
【0008】本発明の目的は、動画の中の所定部分を他
の静止画と置き換えるとともに動画中の所定部分の位
置、動きなどの属性情報に従って静止画を制御すること
ができ、しかもその静止画の置き換えおよび制御が容易
で安価に実現可能な映像音響システムを提供することで
ある。具体的に説明すると、ユーザの顔や姿を原画に登
場する人の顔、姿とを容易に置き換えた映像の再生を可
能とする映像音響システムを容易にかつ安価に提供する
ということである。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、本発明の映像音響システムは、動画プログラム中の
所定部分の属性情報を前記動画プログラムに付与する属
性情報付与手段と、前記属性情報を持つ動画プログラム
を取り込む属性情報付動画プログラム取り込み手段と、
前記属性情報付動画プログラムとは異なる静止画の情報
を取り込む静止画情報取り込み手段と、前記静止画情報
取り込み手段で得られた静止画を前記属性情報付動画プ
ログラムの所定部分と置き換えかつ所定部分の属性情報
に基づき前記静止画を制御する静止画動画変換制御手段
とを具備するものである。
【0010】上記の属性情報付与手段は、動画中の所定
部分、例えば口部分の位置や角度、大きさ、向きなどの
情報をフレーム単位で付与するものである。なお、属性
情報をもつ動画プログラムが外部から入力される場合に
は、属性情報付与手段は省くこともできる。また、置き
換える手段としては、動画の中の置き換え対象となる元
オブジェクトの上に、置き換える対象の新オブジェクト
を重ねあわせる方法、元々の原画である動画の中の置き
換え対象となる元オブジェクトが存在しないが、その上
に置き換える対象の新オブジェクトを重ねあわせる方
法、および元々の原画である動画の中の置き換え対象と
なる元オブジェクトが存在していても、置き換える対象
の新オブジェクトと入れ替える方法などのいずれでもか
まわない。
【0011】さらには、あらかじめ3次元化された置き
換える対象の顔または、口部分の形状の3次元モデルか
ら2次元変換することによって得られた2次元の映像情
報を置き換える対象の新オブジェクトの口部分の形状と
して出力し、必要に応じて2次元の映像情報を置き換え
る対象の新オブジェクトの被選択信号として選択的に表
示する方法でもかまわない。この方法によると、複数の
角度のオブジェクトの選択表示も可能となり、複数の角
度から撮影する必要がなくなるという利点を有するもの
である。上記の3次元モデルからの2次元変換は、奥行
き、高さ、幅などの3方向軸に座標をもつ3次元モデル
を座標原点であるカメラポイントから眺めた時、カメラ
に映った映像が2次元の高さと幅の2方向軸に座標デー
タをもつモデルとして変換するレンダリングという処理
によって実現される。
【0012】また、動画の中の置き換え対象となる元オ
ブジェクトが複数であってもよいし、置き換える対象の
新オブジェクトが複数であってもよい。さらには、置き
換える対象の新オブジェクトの属性情報を使って置き換
える対象の新オブジェクトとは異なる第n新オブジェク
トと置き換えることも任意に行うことが可能である。な
お、第nという表現は、多数個の新オブジェクトのうち
のn番目(nは正整数)の新オブジェクトのことを意味
する。
【0013】
【発明の実施の形態】以下の実施の形態の説明に先立っ
て、本発明の映像音響システムの基本的な構成について
説明する。本発明の映像音響システムでは、動画映像の
各フレームと連動して変化する原画のオブジェクトの動
作に関連した制御データを保存する手段として、光ディ
スクや半導体メモリなどの保存メディアを用い、この保
存メディアに記録された前記制御データを読み出すよう
にしている。また、生成される制御データを読み取り、
あるいは半導体メモリから出力させ、他のオブジェクト
の動作を変化させる手段、あるいは他のオブジェクトと
置き換えるなどの編集をする際に、置き換えあるいは動
作制御する対象のオブジェクトの口部分の形状が原画の
中の原画のオブジェクトが発声する内容、またはユーザ
ーが発声する内容に関連付けられた選択信号に基づいて
選択表示する手段を備えることによって、置き換え対象
の新オブジェクトの動作制御データを生成し、一般ユー
ザが、既に記録が完了している原画であっても、前記の
動作制御データを使って簡単に置き換える対象となるユ
ーザデータを選択処理できるものである。
【0014】以下の実施の形態では、制御データを保存
し、その後読み出す手段としては光ディスクや半導体メ
モリなどの記録再生手段を用いて処理が行われるが、こ
のような記録再生手段について周知であるので、説明は
省く。本発明の映像音響システムは、各フレーム毎に動
画中の置き換えられる対象となる所定部分の属性情報を
利用するため、置き換え素材として静止画を使うことが
できる。したがって、特別な技術を有しない者でも、映
画の主人公を自分や他の俳優の映像に簡単に置き換える
ことが可能である。また、原画の中の主人公の口の動き
を自分や他の俳優の声に合わせることができるので、自
分の声を話す俳優を鑑賞することも可能である。
【0015】また、紙芝居で使われる原画と無関係な音
声の進行に合わせて紙絵を鑑賞することも可能である。
このように楽しみ方は登場オブジェクトの数の組み合わ
せだけ広がり、その楽しみかたはほぼ無限に存在するも
のである。特に、動画などの連続して変化する情報をも
つ原画の場合は、その効果が大きいものである。
【0016】もちろん、動画像の中から一つのフレーム
を切り出した場合は、静止画の置き換えとして、例えば
表面に静止画を印刷したプリントシールとしての利用も
可能である。つぎに、図面を参照しながら、本発明の映
像音響システムの実施の形態について説明する。
【0017】図1は、本発明の第1の実施の形態におけ
る映像音響システムの構成を示すブロック図である。図
1において、101は映画やCGなどで、既に記録が完
了した動画プログラムで原画となるものである。102
は動画プログラム101を取り込み、動画プログラム1
01の所定部分の属性を動画プログラム101に付与す
る属性情報付与手段である。この実施の形態では、動画
プログラム1の顔の部分の目の中心位置、鼻の中心位
置、口の中心位置、耳の位置、顔の上下長さ、顔の横方
向幅を抽出し、それらを動画プログラム101とともに
所定の個所に所定のフォーマットに従って格納する。こ
れらの属性情報付動画プログラムは、この段階でCD−
ROMなどのパソコンソフトとして記録され販売するこ
ともできる。あるいは、ネットワーク通信等で配信する
ことも考えられる。
【0018】106は静止画動画変換制御手段である。
103は属性情報付与手段102の出力情報を静止画動
画変換制御手段106に取り込むための属性情報付動画
プログラム取り込み手段である。104は電子スチルカ
メラなどの手段でとった複数の静止画(情報)である。
105は複数の静止画104を静止画動画変換制御手段
106に取り込むための静止画情報取り込み手段であ
る。
【0019】先に述べた静止画動画変換制御手段106
では、静止画情報取り込み手段105で取り込まれた静
止画の所定個所を属性情報付動画プログラムの属性情報
である顔の部分の目の中心位置、鼻の中心位置、口の中
心位置、耳の位置、顔の上下長さ、顔の横方向幅に対応
するように指定し、動画プログラム101上に下地が見
えない不透明画像としてフレーム毎に貼り付ける。この
ようにすることにより、動画プログラムの所定部分の一
連の動きに対応して上記の貼り付けた静止画が自動的に
動く。上記の静止画の所定個所という表現は、例えば人
物の顔を、写真等の四角形の静止画から顔だけ、あるい
口先だけ切り出す場合を意味するが、例えば四角形の風
景動画に、その風景とは異なる場所の丸形の静止風景画
を入れる場合は、丸形の静止画全体を貼り付けることに
なる。
【0020】つぎに、シーンが変わったり、対象人物を
変化させたい時には、複数の静止画104の中の上記と
は異なる所望の静止画を選び、上記したのと同じ方法で
動画プログラムの所定部分の属性情報との対応を指定し
て貼り付ける。図2は、本発明の第2の実施の形態にお
ける映像音響システムの構成を示すブロック図である。
図2において、図1と同じものは同一番号で示し説明を
省略する。図2において、201は画像中に人物の口の
動きのある映画などの動画プログラムである。
【0021】202は動画プログラム201を取り込
み、動画プログラム201の口部分の属性を動画プログ
ラム201に付与する属性情報付与手段である。この実
施の形態では、動画プログラム201の口の部分の中心
位置、上唇を等間隔で3分割する点位置、下唇を等間隔
で3分割する点位置、口の横方向幅を抽出し、それらを
動画プログラムとともに所定の個所に所定のフォーマッ
トに従って格納する。
【0022】207は音声信号であり、動画プログラム
201において属性情報をもつ所定部分の一つである人
物の口の動き(あるいは口から発せられる音声)に同期
して他の人物が発生した音声である。この音声は動画プ
ログラム201の中の言葉と異なった内容のものがしば
しば使われる。すなわち、同期するといっても所定の時
間に収まる内容ならどのようなものでもよい。
【0023】208は音声信号207を入力とし、その
音声から母音を抽出しそれを口の形の情報に変換して所
定の個所に所定のフォーマットで格納する。この場合、
口の形の情報としては、上記の属性情報付与手段202
と同じように、口の部分の中心位置、上唇を等間隔で3
分割する点位置、下唇を等間隔で3分割する点位置、口
の横方向幅がある。
【0024】属性情報付与手段202の出力は属性情報
付動画プログラム取り込み手段203により静止画動画
変換制御手段106に取り込まれる。また、口動き属性
情報変換手段208の出力も静止画動画変換制御手段1
06に取り込まれる。つぎに図1で用いたと同じ静止画
104が静止画情報取り込み手段105により静止画動
画変換制御手段106に取り込まれる。
【0025】静止画動画変換制御手段106では、上記
の静止画情報取り込み手段105で取り込まれた静止画
の所定部分を属性情報付動画プログラムの属性情報であ
る口の部分の中心位置、上唇を等間隔で3分割する点位
置、下唇を等間隔で3分割する点位置、口の横方向幅に
対応するように指定するか、もしくは口動き属性情報変
換手段208により変換された口の部分の中心位置、上
唇を等間隔で3分割する点位置、下唇を等間隔で3分割
する点位置、口の横方向幅に対応するように指定するか
を選択し、動画プログラム201上に下地が見えない不
透明画像としてフレーム毎に貼り付ける。このようにす
ることにより、動画プログラムの所定部分の一連の動き
に対応して上記の貼り付けた静止画が自動的に動く。
【0026】つぎに、シーンが変わったり、対象人物を
変化させたい時には、複数の静止画104の中の上記と
は異なる所望の静止画を選び、上記したのと同じ方法で
動画プログラムの所定部分の属性情報との対応を指定し
て貼り付ける。このようにすることにより、映画の顔の
部分をまったく異なった人物で置き換えられるととも
に、まったく異なった言葉に置き換えられることにな
り、口の動きは音声情報から推論して変換するので自然
なものとなる。
【0027】ここで、属性情報付与手段102,20
2、口動き属性情報変換手段208、および静止画動画
変換制御手段106の具体的な構成を示す実施の形態を
図面を用いて説明する。なお、属性情報付動画プログラ
ム取り込み手段103,203については図示を省略し
ているが、この属性情報付動画プログラム取り込み手段
103,203は、図3の例では、GIデータ出力部3
07の出力信号と原画301とを、各々ユーザーオブジ
ェクト写真選択部309と合成部312に振り分けて取
り出すようにしている。また、他の実施の形態は、属性
情報付動画プログラム取り込み手段103,203が属
性情報と動画が記録された光ディスクなどの記録メディ
アから信号を読み取り、静止画動画変換制御手段106
に入力するようにすればよい。
【0028】図3は、本発明の実施の形態の映像音響シ
ステムの具体的なブロック図を示している。なお、この
図3は、図2の実施の形態を図示しているが、図3から
口動き属性情報変換手段に相当するブロックを省いたも
のが図1の実施の形態に対応する。本発明の映像音響シ
ステムの実施の形態は、原画の中の顔の部分を原画オブ
ジェクトと考えたときに、属性情報付動画プログラムに
おける属性情報として原画オブジェクトの目の中心位
置、鼻の中心位置、口の中心位置、耳の位置などの位置
情報を、顔の向きという1つのオブジェクト選択情報で
現し、これに近い顔の向きのユーザの顔写真を複数の静
止画から選び、顔の上下長さ、顔の横方向幅は前記静止
画を拡大縮小するように構成している。
【0029】同様に、この実施の形態は、口部分の属性
を付与する属性情報として動画プログラムの口の部分の
中心位置、上唇を等間隔で3分割した点位置、下唇を等
間隔で3分割した点位置、口の横方向幅等を、オブジェ
クト選択情報で現し、これに近い顔の向きの顔写真を複
数の静止画から選ぶように構成している。図1および図
2の属性情報付与手段102,202は、図3におい
て、データ入力ソースとしての動画プログラムである原
画301と、原画301の中のオブジェクトを置き換え
る仮のユーザオブジェクトの写真として用意されたダミ
ーオブジェクト写真群302と、ダミーオブジェクト選
択部303および原画オブジェクトの属性情報生成部3
04と、属性情報のうちの原画オブジェクトの位置をあ
らわすX座標,Y座標、大きさSと原画オブジェクトの
顔の向きや口の形状を表わすダミーオブジェクト選択情
報Dおよび映像フレーム番号Fなどのオブジェクトを選
択制御する情報であるグラフィックインタラクティブデ
ータ(以下、GIデータと呼ぶ)を出力するGIデータ
出力部307で構成されている。
【0030】また、図2の口動き属性情報変換手段20
8は、原画301の中に含まれるサウンド305およ
び、原画オブジェクトの音声認識部306と原画オブジ
ェクトの属性情報生成部304で構成されている。静止
画情報取り込み手段105は、置き換えの対象となるユ
ーザオブジェクト写真群308とユーザオブジェクト写
真選択部309で構成されている。
【0031】静止画動画変換制御手段106は、ユーザ
オブジェクト映像処理部310、ユーザオブジェクトマ
スク生成部311、合成部312および出力部313で
構成されている。図3で、原画301の中の原画オブジ
ェクトの位置をあらわすX座標,Y座標、大きさSと原
画オブジェクトの顔の向きや口の形状を表わすダミーオ
ブジェクト選択情報Dおよび原画のサウンド305の中
の原画オブジェクトの発声する音声を認識する音声認識
部306からの音声選択情報Aが、原画オブジェクトの
属性情報生成部304で原画のなかの原画オブジェクト
の動きを見ながら設定され、前述のX座標,Y座標,大
きさS,ダミーオブジェクト選択情報D,音声選択情報
Aおよび映像フレーム番号Fが、オブジェクトの選択制
御情報とする属性情報として対応付けされ、GIデータ
出力部307へグラフィックインタラクティブデータと
して出力される。この段階で既に、原画オブジェクトの
顔の向きや口の形状によく似たダミーオブジェクトが対
応付けされている構成になっている。
【0032】つぎに、ユーザオブジェクト写真群308
からGIデータ出力部307のGIデータに基づいて、
原画オブジェクトの位置、顔の向き、口の形状に対応す
るユーザオブジェクトを予め対応付けされているユーザ
オブジェクト写真選択部309で選択する。ここでも、
上記のダミーオブジェクトと同様に原画オブジェクトの
顔の向きや口の形状によく似たユーザオブジェクトが対
応付けされている構成になっている。
【0033】つぎに、選ばれたユーザオブジェクトの映
像処理として、ユーザオブジェクト映像処理部310で
ユーザオブジェクトの位置座標を上記のX座標,Y座標
で設定し、同様にユーザオブジェクトの大きさを前記の
大きさSで設定するとともに、画面の中のユーザオブジ
ェクト以外の部分が原画に対して透明になる透明マスク
をマスク生成部311で生成する。
【0034】この際に、透明マスクの透明領域を設定す
るためにユーザオブジェクトの画素がある領域以外の画
素を単一色にしてこの画素のみ除去するという処理が必
要なことは言うまでもない。こうして得られたユーザオ
ブジェクトと、画面の中のユーザオブジェクト以外の部
分が原画に対して透明になる透明マスクを原画301の
上に合成部312で重ね合わせることによって、原画の
原画オブジェクトとユーザオブジェクトとが見かけ上置
き換えられた映像として出力部313に出力される。
【0035】図4は、以上の時間軸の様子をタイムシー
ケンスで示している。原画の各映像フレームをG1,G
2,…とし、各映像のフレームG1,G2,…間で原画
の中のオブジェクトの顔の向き、表情や口の形状が変化
が小さく、置き換えるユーザオブジェクト写真の選択を
変える必要がない区間を区切り、それぞれT1,T2,
…としてこれに対応するダミーオブジェクト選択情報を
D1,D2,…とする。
【0036】つぎに、原画オブジェクトの属性情報シー
ケンスのうち原画オブジェクトの位置座標および大きさ
をそれぞれフレーム毎に、X1,X2,…、Y1,Y
2,…、S1,S2,…とする。同様に、原画オブジェ
クトの音声認識部306では、ダミーオブジェクトの選
択情報シーケンスD1のうちの音声選択情報で、母音で
変化するフレームシーケンスは、ダミーオブジェクトの
詳細選択情報として原画オブジェクトの属性情報生成部
304へ出力し、それぞれA1,A2,…として原画オ
ブジェクト属性情報シーケンスのうちの音声選択情報と
する。
【0037】こうして得られた各フレーム毎のGIデー
タのうち、音声選択情報A1,A2,…に対応してユー
ザオブジェクト写真選択部309で選択されたユーザオ
ブジェクト写真の大きさを大きさ情報S1,S2,…に
よって合わせる。同様に位置座標についてもX1,X
2,…になるよう座標を設定する。こうして映像処理さ
れたユーザオブジェクトの各フレームはE1,E2,…
として設定される。また、原画に対して透明になる透明
マスクも同様にして、画面E1,E2,…の中で設定さ
れたユーザオブジェクトの残りの領域に設定され、それ
ぞれ、M1,M2,…として設定される。
【0038】以上のようにして得られたユーザオブジェ
クトEとマスクMが原画Gの上に重ね合わされて各フレ
ーム毎にそれぞれG+M+Eとして出力される。図5
は、ダミーオブジェクトで「あ」、「う、え、お」と発
音しているものそれぞれ501,502,503,50
4とこれに対応するようにユーザオブジェクト写真群3
08の中から選ばれるユーザオブジェクト505,50
6,507,508との関連付けを示すユーザオブジェ
クト写真選択部である。
【0039】ユーザは、ユーザオブジェクト写真群30
8の中からダミーオブジェクトにできるだけ似た写真を
選択部309で選択し、ダミーオブジェクトで「あ」と
発音しているものに似た写真をユーザオブジェクト写真
群の中から選んでユーザオブジェクトとしてダミーオブ
ジェクトの「あ」と発音しているオブジェクトの横に並
べ写真番号「1」、あるいは、写真文字記号「a」とす
る。
【0040】同様にしてダミーオブジェクトで「う、
え、お」と発音しているユーザオブジェクトをユーザオ
ブジェクト写真群の中から選びそれぞれダミーオブジェ
クトが発音しているダミーオブジェクトの横に並べ写真
番号「2,3,4」、あるいは、写真記号「u,e,
o」とする。表1は、以上のようにして、原画オブジェ
クトの音声情報も含めてオブジェクトを選択するように
したオブジェクト制御情報として構成したGIデータの
例を表したもので、連続した各静止画フレーム番号Fに
対しダミーオブジェクトの写真番号D、ユーザオブジェ
クトの写真記号A、オブジェクトを置く位置として縦、
横座標をそれぞれX,Y、オブジェクトの大きさSを例
として示している。
【0041】
【表1】
【0042】以上の説明では、ユーザーオブジェクト写
真群が、人物であれば、男性のAさんだけ写真群として
いるが、ユーザーオブジェクト写真群の中に男性のAさ
ん以外に、その他の男性Bさんや、女性のCさん、Dさ
ん、Eさん、あるいは犬やある人物の服装だけや、髪型
あるいは風景などの写真群として含ませておき、ダミー
オブジェクトと直接関連のない写真をオブジェクトとし
て合成すると、視聴者の興味をそそるような面白い効果
(映像の特殊効果)が得られるという特徴も有してい
る。
【0043】図6は、本発明の実施の形態におけるGI
データ作成の各工程を示し、701は原画取り込み部、
702は動画編集部、703は原画フレーム作成部、7
04は画像処理ファイル設定部、705はダミーオブジ
ェクト選択部、706はGIデータ編集部、707はプ
レビュー部、708はGIデータ出力部である。連続し
た動画である原画が原画取り込み部701で取り込ま
れ、動画編集部702でオブジェクト置き換えの対象と
なる部分やその周辺などの最終完成映像音響に必要な部
分をつなぎ、その他を切り捨てる。こうして編集された
動画は、原画フレーム作成部703で静止画である各フ
レームファイルに分解変換される。この際に、原画に含
まれるサウンドは上記各フレームの編集に合わせてサウ
ンドも編集されている必要があることはいうまでもな
い。
【0044】一方、ダミーオブジェクト選択部705
で、置き換えられる原画オブジェクトの代わりとして設
定されるダミーオブジェクトをダミーオブジェクト群の
中から原画オブジェクトの複数の顔の向きに似た写真を
それぞれ複数選択して、画像処理ファイル設定部704
に予め設定しておく。また、画像処理ファイル設定部7
04では、後述の写真番号D、座標X,座標Y、大きさ
SなどのGIデータがGIデータ編集部706からフィ
ードバックされ、これらD,X,Y,Sのデータに基づ
いて写真番号Dの中のオブジェクト(ダミーオブジェク
トは予めブルーバック処理窓の抜き処理されオブジェク
トのみになっている)が座標X,Yと大きさSのオブジ
ェクトに画像処理され、GIデータ編集部706で原画
フレームと合成され、プレビュー部707の画像を確認
することができる。
【0045】GIデータ編集部706では、プレビュー
部707の画面を見ながら、画面にふさわしい置き換え
の編集対象をダミーオブジェクト写真のうちどれにする
か決めるために、そのダミーオブジェクト番号Dを選
び、オブジェクトを置く位置として縦、横座標であるそ
れぞれX,Y(CGの場合は奥行き座標Zも含まれる)
および、オブジェクトの大きさSを設定する。このよう
にして設定した写真番号D、座標X,Y、大きさSが原
画フレームとともにGIデータ編集部706で原画フレ
ーム番号と対応付けて編集できるようにGIデータ編集
部706が構成されている。
【0046】GIデータ編集部706では、写真番号
D、座標X,Y、大きさSが原画フレーム番号とともに
GIデータとしてファイル化されるとともに所定の座標
X,Y、大きさSに画像処理されたダミーオブジェクト
と原画フレームの合成映像がプレビュー部707へ出力
される。この結果をプレビュー部707で動画として確
認し、変更なければGIデータ出力部708へ出力され
る。
【0047】こうして得られたダミーオブジェクト番号
D、座標X,Y、大きさS、および原画フレーム番号F
などの一連の出力データをディスクなどの記録メディア
に保存することによって、後から他の第nオブジェクト
を使った合成や複数のオブジェクトを重ねて合成するこ
とも可能になる。なお、GIデータは、声、ストーリ、
面白さにあわせて作成する。
【0048】以上、上記実施の形態では、属性情報付動
画プログラムの属性情報として顔の部分の目の中心位
置、鼻の中心位置、口の中心位置、耳の位置などの位置
情報を顔の向きという1つのオブジェクト選択情報で現
し、これに近い顔の向きの顔写真を複数の静止画から選
択し、位置と大きさを制御する方法で説明したが、この
他には、原画と静止画のなじみをよくするため、あるい
は、いろいろな角度の静止画を撮影しなくても静止画の
種類を増やして変化を豊富にするために、それぞれ静止
画の明るさや、色合い、あるいは、陰影を変化させる制
御データや顔の片側の写真を水平方向や垂直方向に反転
した映像を一般的な映像の演算処理によって作成し、こ
れらを動画プログラムの属性情報となるGIデータにす
ることも、上記実施の形態で説明した静止画を選択し、
位置や大きさ等を制御する方法と同様の方法を用いるこ
とで、図3のオブジェクト映像処理部310において処
理され実現するものである。
【0049】また、前記の静止画の明るさや、色合い、
あるいは、陰影を変化させたり顔の片側の写真を水平方
向や垂直方向に反転した映像を作成する方法(モーフィ
ング)は、ユーザオブジェクトの大きさを縮小拡大する
とき、それぞれオブジェクトを構成する画素を間引いた
り、補間画素を作成して画素の不足領域を補間するなど
の方法と同様であり、それぞれ、色のヒストグラム関数
の係数を変えたり画素を左右上下に反転させることによ
って実現されるものである。こうした処理を静止画に加
えることによって、対象とする新オブジェクトの写真枚
数が少ない場合でも、動画化ができるという特徴を有し
ている。
【0050】こうした画像処理は、GIデータ編集のと
きには、図6の画像処理ファイル設定部704で、また
合成動画作成のときには、図8、図9のGIファイル画
像処理部911でそれぞれ実施されるものである。図7
は、原画を背景画としてユーザオブジェクトと合成画を
生成する工程を図示したものである。図7では、ユーザ
オブジェクト802で、顔の領域805を原画801の
中の顔の領域804に重ね合わせるために、ユーザオブ
ジェクト802で顔の領域805以外の領域を原画80
1に対して透明にした透明マスク803を示している。
透明マスクとは、ビットマップ形式ファイルの中で画素
データを置かずフレームのみ存在するものを指し、これ
を1つの独立したレイヤとしてファイルにする場合と、
独立したレイヤを設定しないで、画像メモリなどのフレ
ームメモリへユーザオブジェクト802の顔の領域80
5以外の領域に原画801の画素データを直接書き込む
場合がある。
【0051】いずれにしても、上記のようにして設定さ
れたユーザオブジェクトの顔の領域805以外の領域を
みかけ上透明にするようにした透明マスクの上にユーザ
オブジェクト805、下に原画801を重ね合わせる
と、原画オブジェクトの体の部分806を含む合成画8
07が生成される。また、図5のプレビュー部507で
は合成結果を確認するだけでよいため、透明マスクを各
フレーム毎に保存する必要がないので、GI編集する効
率を高くするためには、透明マスクを設定することなく
画像メモリなどのフレームメモリへ直接書き込む合成手
段を用いる方法が望ましい。
【0052】CGの場合は、原画801の中で顔804
だけが表示されず、原画の中に体806が表示されるの
で、テクスチャーマッピングなどの貼り付け時に原画8
01の中の顔の領域804とユーザオブジェクト802
の顔の領域805の貼り付けを置き換えるだけでよい。
図8は、本発明の実施の形態における具体的な画像作成
の各工程を示し、ブルーバック901、ユーザ902、
カメラ903、背景抜き部904、窓処理部905、窓
画生成部906、俳優のショット907、モニタ90
8、ユーザオブジェクトの設定部909、原画入力部9
10、GIファイル画像処理部911、合成部913、
動画化設定部914、AVデータ作成部917、サウン
ド入力部918、出力モニタ部919で構成されてい
る。
【0053】ブルーバック901は青色などの1色の背
景であり、ユーザ902の背景が青色などの1色に撮影
され背景抜き部904で背景色である青の画素データの
み抜いて背景を透明にするためのものである。窓処理部
905では、ユーザの顔の部分を抜き出すために体の部
分を除去するための窓を予め用意しておき、これと背景
抜き部904のユーザ写真を画像合成するとともに、モ
ニタ908に映像を出力する。また、モニタ908には
ユーザのオブジェクト設定部909で予め設定された撮
影目標としてのダミーオブジェクト907が表示され、
ユーザ902は、ダミーオブジェクト907の顔の向
き、表情に合わせて自分の顔の向き表情を調整する。調
整が完了すると、ユーザ902はシャッタ920を押
す。この際にダミーオブジェクト907の代わりに原画
の中のオブジェクトである俳優のショットをモニタ90
8へ表示したほうがユーザにとってやりやすいことも考
えられるが、いずれでもよい。
【0054】こうして得られたユーザ写真は顔の部分だ
けが抜き出され、かつ目標であるダミーオブジェクト9
07あるいは、原画の中のオブジェクトである俳優の表
情、顔の向きに合った状態にある。以上のようにして合
成の際に使われる枚数だけユーザのオブジェクト設定部
909からモニタ908へ表示される1枚以上のダミー
オブジェクト907とこれに合うユーザ写真とがユーザ
のオブジェクト設定部909から出力されると、予め図
6で生成保存されていたGIデータがGIデータ入力部
912から入力され、GIファイル画像処理部911で
各フレーム毎にファイルに設定される。
【0055】合成部913では、こうして得られたファ
イルをメモリから読み出すとともに、図6の原画フレー
ム作成部703で編集されフレーム化された原画が原画
入力部910から入力され、GIデータの中の各フレー
ム番号に合わせて図7で述べたように映像合成され、動
画化設定部914で各合成フレームが連続する1つの動
画ファイルとして生成され、AVデータ作成部917
で、サウンド入力部918から入力される原画に含まれ
た音とともに合成される。
【0056】こうして、合成された動画が1つの映像音
響データとして生成され、出力モニタ部919にサウン
ドとともに出力される。こうした一連のファイル設定
や、メモリなどへの書き込みによる合成、あるいは音響
とのデータ合成のための圧縮演算などは、現在一般的な
パーソナルコンピュータなどの演算処理装置、あるいは
専用合成演算処理回路や半導体メモリやディスクなどの
記録メディアを用いて実行されるものである。
【0057】また、複数の記録層を有する記録ディスク
の1層目に背景となる元画像を記録し、2層目にGIデ
ータを記録することによって、従来のプレーヤでは、1
層目のみの再生とし、本発明の機能を有するプレーヤで
は、1層目を再生するときに2層目のデータを利用でき
るようにすることで、従来の再生ディスクプレーヤとの
互換性を確保できるという特徴を有する構成となしうる
ものである。
【0058】また、サウンドとして原画のサウンドや音
声をそのまま使う場合は動画化設定部914で動画化と
サウンド合成を同時に行えばよいことは言うまでもな
い。また、実施の形態では、出力モニタ部919はテレ
ビモニタなどを指しているが、完成した合成動画の一部
を複数の静止画としてプリントし、ある程度連続して紙
芝居のようにみる方法でもかまわない。
【0059】つぎに、他の実施の形態としてユーザの音
声を入力し、その声で静止画撮影を制御し、かつ原画に
含まれる原音の声とユーザの声とを置き換える場合につ
いて説明する。図9では、図8の構成と同様のものは同
じ番号を付しているが、この図9は図8の構成の全てと
ユーザの音声を入力するためのマイク921および音声
認識部922とで構成されている。以下、ユーザの音声
を認識する部分以外は、図8の構成と同様であるのでユ
ーザの音声の処理についてのみ図面とともに説明する。
【0060】図9で音声認識部922は、既にパソコン
ソフトで販売されているような音声認識ソフトウェアあ
るいは、音声認識ボードなどのハードウェアである。ユ
ーザ902が「あ」と発音すると、マイク921を介し
て音声認識部922で、「あ」と認識され、ユーザオブ
ジェクト設定部909へ「a」という記号を入力し、予
め設定されている「あ」という発音したダミーオブジェ
クト907をモニタ908に表示するとともにユーザが
シャッタ920を押して撮影された映像がユーザオブジ
ェクトとして背景抜き、窓処理によって「あ」という発
音の顔のみの映像としてGIファイル画像処理部911
へ出力される。
【0061】こうしてユーザの声によってモニタ908
へのダミーオブジェクトの提示を制御しながらユーザの
静止画撮影を行うようにしたものである。以降は、図8
の実施の形態と同様にして、映像合成および動画化され
る。この際に「あ」という発音したダミーオブジェクト
が含まれる原画フレームで、ユーザの声による「あ」と
いう発音がAVデータ作成部917でサウンド入力部9
18を介してユーザの音声がGIデータのフレーム番号
に対応した映像とともに合成され、原画に含まれる原音
の声とユーザの声とを置き換えられる。
【0062】また、ユーザの実録音信号をそのまま利用
しないでテキスト信号やMIDI(Musical Instrument
Digital Interface)信号で入力し、これを音声合成で
人工の音声を生成し映像を合成したものでもかまわな
い。また、実施の形態では、顔の置き換えについて説明
したが、体全体の動きを現した人の姿の場合や模型、工
作物などのオブジェクトであっても同様である。
【0063】なお、上記の実施の形態では、動画プログ
ラムに属性情報を付与する属性情報付与手段を設けてい
たが、外部から所定部分(口部分等)の属性情報をもつ
動画プログラムを取り込む場合には、属性情報付与手段
はなくてもよい。
【0064】
【発明の効果】本発明の映像音響システムによれば、動
画の中の所定部分を他の静止画と置き換えるとともに動
画中の所定部分の位置、動きなどの属性情報に従って静
止画を制御することができ、しかもその静止画の置き換
えおよび制御が容易で安価に実現可能となる。したがっ
て、予め用意された動画の属性情報を使ってユーザが選
んだ任意の写真などの静止画を動画の中のオブジェクト
と置き換えて楽しむことが可能になり、一つの映画など
の作品をいろいろな属性情報、あるいは、表情の異なる
静止画を選び変えることによって何度も楽しむことが可
能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における映像音響シ
ステムの構成を示すブロック図である。
【図2】本発明の第2の実施の形態における映像音響シ
ステムの構成を示すブロック図である。
【図3】本発明の第1および第2の実施の形態を具体的
に実施した映像音響システムのブロック図である。
【図4】本発明の第1および第2の実施の形態を具体的
に実施した映像音響システムのタイムシーケンス図であ
る。
【図5】本発明の第1および第2の実施の形態を具体的
に実施した映像音響システムのユーザオブジェクト選択
部を示す模式図である。
【図6】本発明の第1および第2の実施の形態を具体的
に実施した映像音響システムのGIデータ作成工程を示
す概略図である。
【図7】本発明の第1および第2の実施の形態を具体的
に実施した映像音響システムの合成画を生成する工程を
示す概略図である。
【図8】本発明の第1の実施の形態を具体的に実施した
映像音響システムの画像作成工程を示す概略図である。
【図9】本発明の第2の実施の形態を具体的に実施した
他の映像音響システムの画像作成工程を示す概略図であ
る。
【符号の説明】
101 動画プログラム 102 属性情報付与手段 103 属性情報付動画プログラム取り込み手段 105 静止画情報取り込み手段 106 静止画動画変換制御手段 208 口動き属性情報変換手段 704 画像処理ファイル設定部 707 GIデータ編集部 708 GIデータ出力部 910 原画入力部 911 GIファイル画像処理設定部 912 GIデータ入力部 913 合成部 917 AVデータ作成部 918 サウンド入力部 919 出力モニタ部 921 マイク 922 音声認識部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04N 5/265 G06F 15/66 450

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 動画プログラム中の所定部分の属性情報
    を前記動画プログラムに付与する属性情報付与手段と、
    前記属性情報をもつ属性情報付動画プログラムを取り込
    む属性情報付動画プログラム取り込み手段と、前記属性
    情報付動画プログラムとは異なる静止画の情報を取り込
    む静止画情報取り込み手段と、前記静止画情報取り込み
    手段で得られた前記静止画を前記属性情報付動画プログ
    ラムの前記所定部分と置き換えかつ前記所定部分の属性
    情報に基づき前記静止画を制御する静止画動画変換制御
    手段とを備えた映像音響システム。
  2. 【請求項2】 動画プログラム中の口部分の属性情報を
    前記動画プログラムに付与する付与する属性情報付与手
    段と、前記口部分の属性情報をもつ属性情報付動画プロ
    グラムを取り込む属性情報付動画プログラム取り込み手
    段と、前記属性情報付動画プログラムとは異なる口部分
    の静止画の情報を取り込む静止画情報取り込み手段と、
    前記静止画情報取り込み手段で得られた前記口部分の静
    止画を前記属性情報付動画プログラムの口部分と置き換
    えかつ前記口部分の属性情報に基づき前記口部分の静止
    画を制御する静止画動画変換制御手段とを備えた映像音
    響システム。
  3. 【請求項3】 動画プログラム中の口部分の属性情報を
    前記動画プログラムに付与する付与する属性情報付与手
    段と、前記口部分の属性情報をもつ属性情報付動画プロ
    グラムを取り込む属性情報付動画プログラム取り込み手
    段と、外部から音声信号を取り込み前記音声信号から口
    の動きの情報を抽出する口動き属性情報変換手段と、前
    記属性情報付動画プログラムとは異なる口部分の静止画
    の情報を取り込む静止画情報取り込み手段と、前記静止
    画情報取り込み手段で得られた前記口部分の静止画を前
    記属性情報付動画プログラムの口部分と置き換えかつ前
    記属性情報付動画プログラムの属性情報と前記口動き属
    性変換手段で得られた属性情報とを選択的に用いて前記
    口部分の静止画を制御する静止画動画変換制御手段とを
    備えた映像音響システム。
  4. 【請求項4】 外部から所定部分の属性情報をもつ属性
    情報付動画プログラムを取り込む属性情報付動画プログ
    ラム取り込み手段と、前記動画プログラムとは異なる静
    止画の情報を取り込む静止画情報取り込み手段と、前記
    静止画情報取り込み手段で得られた前記静止画を前記属
    性情報付動画プログラムの前記所定部分と置き換えかつ
    前記所定部分の属性情報に基づき前記静止画を制御する
    静止画動画変換制御手段とを備えた映像音響システム。
  5. 【請求項5】 外部から口部分の属性情報をもつ属性情
    報付動画プログラムを取り込む属性情報付動画プログラ
    ム取り込み手段と、前記属性情報付動画プログラムとは
    異なる口部分の静止画の情報を取り込む静止画情報取り
    込み手段と、前記静止画情報取り込み手段で得られた前
    記口部分の静止画を前記属性情報付動画プログラムの口
    部分と置き換えかつ前記口部分の属性情報に基づき前記
    口部分の静止画を制御する静止画動画変換制御手段とを
    備えた映像音響システム。
  6. 【請求項6】 外部から口部分の属性情報をもつ属性情
    報付動画プログラムを取り込む属性情報付動画プログラ
    ム取り込み手段と、外部から音声信号を取り込み前記音
    声信号から口の動きの情報を抽出する口動き属性情報変
    換手段と、前記属性情報付動画プログラムとは異なる口
    部分の静止画の情報を取り込む静止画情報取り込み手段
    と、前記静止画情報取り込み手段で得られた前記口部分
    の静止画を前記属性情報付動画プログラムの口部分と置
    き換えかつ前記属性情報付動画プログラムの属性情報と
    前記口動き属性変換手段で得られた属性情報とを選択的
    に用いて前記口部分の静止画を制御する静止画動画変換
    制御手段とを備えた映像音響システム。
JP9315381A 1997-11-17 1997-11-17 映像音響システム Pending JPH11149285A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9315381A JPH11149285A (ja) 1997-11-17 1997-11-17 映像音響システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9315381A JPH11149285A (ja) 1997-11-17 1997-11-17 映像音響システム

Publications (1)

Publication Number Publication Date
JPH11149285A true JPH11149285A (ja) 1999-06-02

Family

ID=18064729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9315381A Pending JPH11149285A (ja) 1997-11-17 1997-11-17 映像音響システム

Country Status (1)

Country Link
JP (1) JPH11149285A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222719A (ja) * 1999-12-01 2001-08-17 Matsushita Electric Ind Co Ltd 顔抽出装置及び顔抽出方法並びに顔抽出プログラムの記録媒体
JP2002125209A (ja) * 2000-10-16 2002-04-26 Sony Corp 動画像受注システム及び方法
JP2007058614A (ja) * 2005-08-25 2007-03-08 Fujifilm Corp スライドショー生成装置およびスライドショー用データ生成装置ならびにそれらの制御方法ならびにそれらを制御するプログラム
JP2008083672A (ja) * 2006-09-27 2008-04-10 Compal Electronic Inc 表情影像を表示する方法
JP2011003057A (ja) * 2009-06-19 2011-01-06 Casio Computer Co Ltd 画像合成装置、画像特定方法、画像合成方法及びプログラム
JP2022526148A (ja) * 2019-09-18 2022-05-23 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド ビデオ生成方法、装置、電子機器及びコンピュータ記憶媒体
JP2022185096A (ja) * 2021-10-29 2022-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 仮想アイドルの生成方法、装置及び電子機器

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222719A (ja) * 1999-12-01 2001-08-17 Matsushita Electric Ind Co Ltd 顔抽出装置及び顔抽出方法並びに顔抽出プログラムの記録媒体
JP2002125209A (ja) * 2000-10-16 2002-04-26 Sony Corp 動画像受注システム及び方法
JP2007058614A (ja) * 2005-08-25 2007-03-08 Fujifilm Corp スライドショー生成装置およびスライドショー用データ生成装置ならびにそれらの制御方法ならびにそれらを制御するプログラム
US7840090B2 (en) 2005-08-25 2010-11-23 Fujifilm Corporation Slideshow generating apparatus, slideshow-data generating apparatus, control methods therefor and programs for controlling same
JP4726577B2 (ja) * 2005-08-25 2011-07-20 富士フイルム株式会社 スライドショー生成装置およびスライドショー用データ生成装置ならびにそれらの制御方法ならびにそれらを制御するプログラム
JP2008083672A (ja) * 2006-09-27 2008-04-10 Compal Electronic Inc 表情影像を表示する方法
JP2011003057A (ja) * 2009-06-19 2011-01-06 Casio Computer Co Ltd 画像合成装置、画像特定方法、画像合成方法及びプログラム
JP2022526148A (ja) * 2019-09-18 2022-05-23 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド ビデオ生成方法、装置、電子機器及びコンピュータ記憶媒体
JP2022185096A (ja) * 2021-10-29 2022-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 仮想アイドルの生成方法、装置及び電子機器

Similar Documents

Publication Publication Date Title
US6556775B1 (en) Image and sound reproduction system
US6351265B1 (en) Method and apparatus for producing an electronic image
JP4310916B2 (ja) 映像表示装置
US5623587A (en) Method and apparatus for producing an electronic image
US6919892B1 (en) Photo realistic talking head creation system and method
US7027054B1 (en) Do-it-yourself photo realistic talking head creation system and method
US8553037B2 (en) Do-It-Yourself photo realistic talking head creation system and method
US20100079491A1 (en) Image compositing apparatus and method of controlling same
KR102215290B1 (ko) 컴퓨터 그래픽 합성 시스템 및 방법
JP3538263B2 (ja) 画像生成方法
JPH11149285A (ja) 映像音響システム
JPH10126687A (ja) すり替え編集システム
Perng et al. Image talk: a real time synthetic talking head using one single image with chinese text-to-speech capability
CN116152888A (zh) 一种基于超短视频样本快速生成虚拟人动态名片的方法
CN113221840B (zh) 一种人像视频处理方法
JP2015141441A (ja) 手話cg合成装置及びそのプログラム
KR20020067088A (ko) 3차원 동화상 모델 얼굴 대체 방법 및 장치
JP7011728B2 (ja) 画像データ出力装置、コンテンツ作成装置、コンテンツ再生装置、画像データ出力方法、コンテンツ作成方法、およびコンテンツ再生方法
KR100448914B1 (ko) 실사 합성 애니메이션 제작 방법 및 그 제공 방법
KR20060040118A (ko) 맞춤형 3차원 애니메이션 제작 방법 및 장치와 그 배포시스템
KR20070098361A (ko) 2차원 배경 이미지를 3차원 공간에 합성시키는 영상 합성장치 및 방법
JP4266154B2 (ja) 自動写真作成装置および自動写真作成方法
CN114741541B (zh) 基于模板化编辑的ai数字人对ppt的交互控制方法及装置
JP2003346180A (ja) 3d画像合成システム
KR100810649B1 (ko) 동영상 파일과 멀티미디어 파일을 합성하는 시스템 및 그방법