JP4188224B2 - 画像処理方法 - Google Patents

画像処理方法 Download PDF

Info

Publication number
JP4188224B2
JP4188224B2 JP2003431353A JP2003431353A JP4188224B2 JP 4188224 B2 JP4188224 B2 JP 4188224B2 JP 2003431353 A JP2003431353 A JP 2003431353A JP 2003431353 A JP2003431353 A JP 2003431353A JP 4188224 B2 JP4188224 B2 JP 4188224B2
Authority
JP
Japan
Prior art keywords
image
terminal
mirror
processing
external terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003431353A
Other languages
English (en)
Other versions
JP2005191964A (ja
Inventor
秀則 竹島
孝 井田
善啓 大盛
信幸 松本
安則 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003431353A priority Critical patent/JP4188224B2/ja
Publication of JP2005191964A publication Critical patent/JP2005191964A/ja
Application granted granted Critical
Publication of JP4188224B2 publication Critical patent/JP4188224B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Processing (AREA)
  • Studio Circuits (AREA)

Description

本発明は、例えば、複数の参加者が1つの合成画像を共有しながらコミュニケーションを行うための画像処理方法に関する。
離れた場所にいるユーザ同士でのコミュニケーションを支援するために、テレビ会議やビデオチャット等のシステムが提案されたが、これらのシステムでは親近感や一体感を感じることができないため、広く普及するにはいたっていない。そこで、親近感や一体感が感じられるシステムを目指し、参加者の画像を1つの画面に合成し、合成画像を共有しながらコミュニケーションを行うシステムが検討されている。
非特許文献1では、図19のようにカメラ(S1206、S1208)、鏡像反転装置(S1204、S1207)、クロマキー装置(S1202、S1203)、画面(S1201、S1205)を接続し、離れた場所に設置した複数のカメラで撮影し、ネットワークを介して撮影画像を送受信し、前景となる撮影映像の背景部分をクロマキー法(予めカメラの撮影範囲に青や緑等単色の背景を準備しておき、動作時には撮影画像から背景色と異なる部分を被写体とみなし、別の画像上に合成する画像処理方法)で除去して1つの画像として合成し、得られた合成画像を大画面のスクリーンやプロジェクタ装置を用いて等身大に近い大きさで各参加者に提示する。この際、カメラを2つに制限し、図18のフローチャートに示すように自身の撮影映像については鏡像反転を行い(S1202)、相手の撮影映像については鏡像反転を行わずに合成を行い(S1203)、その合成画像を提示する(S1204)ことで、鏡を見るように自然で、一体感が感じられるコミュニケーションシステムが構築できる。このシステムの構築にあたっては、クロマキー法のために単色の背景という特殊な環境を準備する必要がある。
一方、非特許文献2では、クロマキー法ではなく背景差分法(予めカメラの撮影範囲を撮影・記憶しておき、動作時には撮影画像から記憶した背景と異なる部分を被写体とみなし、別の画像上に合成する画像処理方法)を使って被写体の切り出しと合成を行い、合成画像を共有するシステムを構築している。背景差分法を使えば単色の背景を用意する必要がないため、特殊な環境を用意しなくても同様のコミュニケーションを行うことが可能となる。
ところが、背景差分のみでは被写体の正確な切り出しが難しい。そのため、さらに、正確に被写体の輪郭を抽出するために、背景差分で抽出した被写体の形状を利用して、非特許文献3のフラクタル輪郭抽出法で正確な輪郭の抽出を行っている。
このフラクタル輪郭抽出法について図20のフローチャートに基づいて説明する。
まず、入力する情報は、画像データと、正確ではないが輪郭に近い形状データである概略形状データとである。なお、出力される情報は、より正確な形状データである。
S1309:ブロックサイズから決定でき、かつ、正確に抽出できる写像回数Mを設定する。なお、Mは、縦横の画素数Xに、ブロック倍率AのM乗をかけた値が1以下になるような値である。すなわち、X×A=<1を満たす値である。
S1302:概略形状データを参照しながら、その輪郭に複数の処理ブロック(例えば縦横各32画素の正方形)を配置する。
S1303:画像データを参照しながら、各処理ブロックについて、その処理ブロックをA倍した大きさ(例えばA=2.0)を持ち、最もその誤差(例えば画素毎の誤差絶対値の総和値)が小さいブロックであるペアレントブロックを探索する。この探索は探索ステップが1画素である全探索か、はじめに大きな探索ステップで探索を行い、その解の近傍でのみ小さな探索ステップで探索を行うことを、探索ステップが1になるまで数回繰り返す階層的探索で行う。
S1304:次に、各ブロックで、形状データについてペアレントブロックから処理ブロックへの写像を行う。
S1305:M回の写像が完了するまで、S1304の処理を繰り返す。
S1306〜S1307:処理ブロックのサイズが十分に小さい(例えば縦横各4画素の正方形)なら、形状データを出力し画像処理を終了する。そうでなければ、処理ブロックをより小さなもの(例えば縦横それぞれが半分の長さをもつブロック)に変えてS1302に戻る。
フラクタル輪郭抽出法は図17に示すように、処理ブロックのサイズが大きいほど、対応可能範囲は大きく、計算量は多く、得られる輪郭の精度は低くなるという特性をもつ。そこで、S1306〜S1307の処理では、対応可能範囲を大きく、かつ、得られる輪郭の精度を高くするために、始めに大きな処理ブロックのサイズで輪郭抽出処理を行った後、前の輪郭抽出処理の結果を次の入力として、段階的に対応可能範囲を小さくしながら輪郭抽出処理を繰り返す処理を行っている。このため対応可能範囲を大きくすると、その計算量は多くなる。
このような画像処理を行うことで、処理前に比べ真の形状に近い形状データが得られる。
森川治,「超鏡:魅力あるビデオ対話方式をめざして」情報処理学会論文誌,Vol.41-3,pp.815-822,2000. 竹島秀則,井田孝,堀修,「参加者の切りだし画像を実時間で共有するチャットシステムの開発」,2002年電子情報通信学会総合大会講演論文集,SD-3-10,pp.391-392,早稲田大学,Mar.2002. T. Ida and Y. Sambonsugi, ``Self-affine mapping system and its application to object contour extraction,'' IEEE Trans. Image Processing., vol.9, no.11, pp.1926-1936, Nov. 2000.
背景技術で述べた技術を用いて、カメラを2つに制限して自画像の鏡像反転を行い、背景差分法を用いて被写体の切り出しと合成を行えば、単色の背景という特殊な環境を用意しなくても、鏡を見るように自然で、一体感が感じられるコミュニケーションシステムが構築できる。
しかし、このシステムでは3地点以上の通信ができないという問題点がある。
そこで、本発明は、3人以上の参加者が1つの合成画像を共有しながらコミュニケーションを行うことができる画像処理方法を提供する。
また、上記で説明した非特許文献3のフラクタル輪郭抽出法は計算コストのかかる画像処理であり、例えば、非特許文献2の方法でシステムを構成するとLAN接続での遅延時間は0.5秒程度となる。
そこで、本発明は、また、フラクタル輪郭抽出法を用いて後処理を行う場合に高速に処理できる画像処理方法を提供する。
本発明は、2つの端末グループの中の第1の端末グループに属する自端末の撮影手段によって撮影された自画像を入力する自画像入力ステップと、前記第1の端末グループに属する外部端末及び前記第1の端末グループに属さない第2の端末グループに属する外部端末において撮影された各外部端末画像をネットワークを介して入力する外部端末画像入力ステップと、前記自端末と前記第1の端末グループに属する外部端末から入力された各画像を、鏡像反転する画像反転ステップと、前記鏡像反転された前記第1の端末グループの各画像と、前記第2の端末グループの外部端末画像を重ね合わせて合成し、合成画像を生成する合成ステップと、を具備することを特徴とする画像処理方法である。
発明では、3地点以上でもユーザにとって自然な画像の共有が実現できる。
(実施形態1)
以下、本発明の実施形態1の画像処理方法について説明する。本実施形態では、3つ以上の端末10(例えば、4つの端末10)の接続に関するものであり、図1〜図5を用いて説明する。
図1は、本実施形態の画像処理方法を実現する場合のフローチャートであり、図2は画像入力、被写体抽出、鏡像反転、画像合成を行う際の画像データの流れであり、図3は本実施形態におけるシステム構成の例、図4はシステムにおける端末10内部の構成の例である。図5は鏡像反転状態を示す説明図である。
(1)システムの概要
図3に示すシステムは多地点テレビ会議の一種である。ネットワークに接続された複数の端末10のそれぞれは、図4に示すように、まずカメラから画像を逐次撮影し、すなわち、所定時間毎に撮影して取り込むと同時に、ネットワークを介して接続された他の端末10(外部端末10)で撮影されたカメラ画像を取り込む。
次に、取り込まれた複数の画像を重ねて合成し、画面(例えば、端末画面やテレビ画面、プロジェクタ)に表示する。
ここで、表示された自画像を自然な画像とするためには、鏡像反転処理をする必要がある。なぜなら、ユーザが左右に移動すると表示される画面上では逆方向に移動するように見えるため使いにくいからである。なお、非特許文献1では、2地点間では自画像を鏡像反転したうえで合成することが可能であるが、3地点以上の通信では鏡像反転処理を行うことはできない。
そこで、本実施形態では、4つの端末10を2つの端末グループのいずれかに所属させておき、各端末10の画像処理においては、図5に示すように、自分の端末10が属する端末グループ(以下、「自端末グループ」という)の画像を鏡像反転の対象とし、自分の端末10が属しない端末グループ(以下、「相手グループ」という)の画像は鏡像反転の対象としない。自画像は、自端末グループ内の端末10では鏡像反転されて表示され、相手グループ内の端末10では鏡像反転をうけずに表示される。
(2)端末10の構成
図2及び図4に基づいて端末10の構成について説明する。
端末10は、モニタ12、カメラ14が接続され、ネットワークを介して他の3個の端末と接続されている。
端末10内部には、画像合成部16、3個の切り出し部18、18,18と2個の鏡像反転部20,20とキャプチャー部22を有している。なお、図4において、矢印の方向は画像データの流れを示している。
カメラ14で撮影した画像(すなわち、自画像)は、キャプチャー部22を介して鏡像反転部20に入力されて画像の左右が反転し、鏡像反転した画像は切り出し部18に入力され背景画像から被写体のみが切り出される。この切り出し方法は背景技術で説明した技術を用いる。この被写体のみが切り出された画像が画像合成部16に入力される。また、ネットワークを介して撮影した画像は他の3個の外部端末10に送信される。
第1の外部端末10は、自端末グループに属するものであり、第1の外部端末10から送信された画像は、鏡像反転部20、切り出し部18を通して、鏡像反転され被写体のみが切り出された画像が画像合成部16に入力される。
第2の外部端末10は、相手グループに属するものであり、第2の外部端末10から送信された画像は、鏡像反転は行わず切り出し部18で被写体のみが切り出された画像が画像合成部16に入力される。
第3の外部端末10は相手グループに属するものであり、この第3の外部端末10から送信された画像は、鏡像反転は行わず、また、背景画像からの切り出しも行わず、そのままの画像が画像合成部16に入力される。
画像合成部16は、自端末グループの自端末10と第1外部端末の鏡像反転され切り出された被写体と、相手グループの第2外部端末の鏡像反転されない切り出された被写体と、第3外部端末の背景画像を含む画像とを合成してモニタ12に表示する。
なお、このグループ分けは、予め設定されているか、システムを動作するときに設定する。
(2)処理方法
本実施形態の画像処理方法のフローチャートを図1に示す。
各端末10に通しの端末番号kをつけて管理する。端末番号kを1から端末数(上記の場合には端末数4)の各画像に対し、以下で説明するS102〜S107の処理を行い、得られた複数の出力画像を用いて画像合成を行い(S108)、表示手段(例えばディスプレイやプロジェクタ)で提示する(S109)。なお、各鏡像反転処理は各画像毎に独立であるため、並列処理を行うことも可能である。
ここで、S104とS105では、自端末の属する端末グループであれば、入力画像に対し鏡像反転を行い出力画像とする。そうでなければ、入力画像をそのまま出力画像とするものである。
ここで具体例として、教師がホワイトボードを使いながら、生徒に対し授業を行う場合を考える。
この場合、教師の端末10で撮影された画像は、ホワイトボードに書かれた文字を含む。したがって、生徒の端末10においては鏡像反転されないことが望ましい。そこで本実施形態のもつ2グループ構成を生かし、第1のグループに教師を、第2のグループに生徒を所属させる。図4の構成では、第3外部端末10が教師の端末であることが望ましい。
これにより、生徒の端末10ではホワイトボードを含む教師の画像が鏡像反転されることはない。なお、教師の端末10においては、教師自身の画像は鏡像反転の対象となるため、文字も鏡像反転される。この問題の解決方法は次の実施形態2で述べる。
以上により、本実施形態では、3地点以上でもユーザにとって自然な画像の共有が実現できる。
(3)変更例
文字が画像中に存在しない場合は、グループ分けを行わずに全部の端末10を1つのグループとみなしてもよく、この場合は全端末10で鏡像画像を表示する。
(実施形態2)
以下、本発明の実施形態2の画像処理方法について説明する。本実施形態では画像中の一部の領域を鏡像反転領域から除外するものであり、図6から図9を用いて説明する。
鏡像反転を行わないで画面に合成する場合は、その画像は図6の501のようになり、文字は正しく表示される。
しかし、実施形態1で述べたように、鏡像画像の表示は、図7の601のようになり、文字は認識できない。
そのため、従来では、例えば、電子的な仮想ホワイトボード(電子ホワイトボード)を用意しておき、ホワイトボードに書かれた文字や図形を、通信路を介して共有し表示画像に重ねて合成することで対応していた。しかし、電子機器に不慣れなユーザは、電子ホワイトボードに対し抵抗感があることも多い。また画像に対し無条件に鏡像反転を行っているため、電子ホワイトボード以外では文字を共有することができず、例えば紙に印刷された文字を見せたいとユーザが考えても、その部分は鏡像反転されたままである。
そこで、本実施形態では、この問題点を解決するものであり、以下、その画像処理方法を、図8と図9のフローチャートに基づいて説明する。
鏡像反転した画像内の、左右対称な領域をユーザに選択させる方法を用意しておく。少なくとも2端末における画像を逐次入力した後、そのうちのいくつかの画像はそのまま画像合成入力とし、いくつかの画像は鏡像反転を行ってから画像合成入力とする。
鏡像反転(S802)された画像に対してユーザによって画像内の領域が選択されている場合は(S803)、鏡像反転を行った後の画像に対し指定領域のみ鏡像反転を行って(S804:再鏡像反転を行う代わりに指定領域のみ鏡像反転前の画像をはり付けても良い)、画像合成部16に入力する。
領域が選択されていない場合は、通常の鏡像反転のみを行う。
その後、得られた鏡像画像及びを用いて図8に示すように画像合成(S805)及び画像提示(S806)を行う。
これによって、選択された領域にユーザがいない限り、自画像は鏡像反転し、かつ文字の鏡像反転を避けることができる。
本実施形態は、2個の端末であっても、多端末の構成であっても適用可能である。
また、2つのグループに分ける構成を用いる場合は、通信回線を介して鏡像反転領域を共有すれば、鏡像反転領域を指定するユーザ操作は1箇所で行えばすむ。
本実施形態により、自画像等の鏡像画像においても、鏡像とすべきでない文字等の領域を自然にユーザに提示することが可能となる。
(実施形態3)
以下、本発明の実施形態3の画像処理方法について説明する。本実施形態では、合成画像の背景を含む画像を撮影する端末(以下、「背景側端末」という)において、被写体領域の算出及び重ねあわせを行うものであり、図10を用いて説明する。なお、図4においては、背景側端末としては第3外部端末10が該当する。
従来、背景側端末のユーザは常に他の端末のユーザによって重ね合わせられていた。しかし、例えば教師が生徒を指導するために使う場合は、教師が重ねあわせによって見えなくなると都合が悪いことも多い。従って、ユーザの指示によって、背景側端末のユーザを上に重ね合わせる機能を提供することは有用である。
ここで、非特許文献1のようにクロマキー法を用いてシステムを構成する場合は、背景側端末では通常、単色の背景は用意しないため被写体を切り出せない。この理由は、単色の背景を合成することはユーザにあまり好まれないためである。
しかし、背景差分法を用いてシステムを構成する場合は、背景が単色でなくても被写体を切り出すことができるため、背景側端末の被写体を切り出すことができる。従って、背景側端末の被写体を他の端末で撮影した被写体の上に重ねて表示できる。これを利用して、ユーザの指示により背景側端末のユーザを上に重ね合わせる機能を提供する方法の一例を、図10に示すフローチャートに従って説明する。
まず、別途指定された順序を重ねあわせ順序として設定する(S902)。例えば、端末番号1の画像上に、端末番号2、4、3の画像を順番に重ね合わせるなどである。
次に、k番目の端末で撮影された画像に対し被写体の切り出しを行う(S904,S905)。これを、1から端末数までの各端末番号kに対して行う(S903〜S907)。なお、S903〜S907の処理は逐次処理であるが、各画像に対する被写体の切り出しは独立した処理であり、並列処理を行うことも可能である。
次に、背景画像に対し、前記重ね合わせ順序を用いて、切り出された被写体画像を重ねていく(S908)。このとき、背景側端末で撮影された画像も重ねることで、背景側端末の被写体を他の端末で撮影された被写体よりも上に重ねて合成することができ、先の状況の要求にこたえることができる。
S902で設定する背景側端末の被写体と他の被写体との上下関係は別途用意した設定やボタン操作等で静的に決定することが可能である。また、被写体の領域(形状データ)から得られる被写体の大きさ(大きさとは例えば面積、バウンディングボックス)を用いてフレームごとに決定してもよい。例えば、被写体の大きさが大きいほど上に重ね合わせられるように重ねあわせ順序を決定すれば、ユーザがカメラに近づくほど上に重ねあわせられるため、奥行き情報を持たない2次元画像を用いていても奥行きを擬似的に実現することができ、システムが提供するコミュニケーション空間の自然さに寄与する
(実施形態4)
以下、本発明の実施形態4の画像処理方法について説明する。本実施形態では、別途撮影された参照画像を用いて背景差分法を行う方法について図11と図12に従って説明する。ここで、「参照画像」とは背景差分法を用いて、例えば背景と一緒に写った被写体の画像から被写体のみを切り出す場合に、その差分の基礎となる背景のみが写った画像をいう。
図11は、外部端末から画像を入力し、背景差分法及び画像合成を行う端末(自端末)のフローチャートを示し、図12は入力画像を送信する外部端末のフローチャートを示す。
(1)自端末の処理
自端末は参照画像を保存する記憶する機能(参照画像メモリ)を持ち、図11のフローチャートに示された画像処理を逐次行う。
画像処理においては、まず、外部端末からの画像及び画像付加情報を受信する(S1002)。この画像付加情報は、通常の撮影画像であるか参照画像であるかを識別するための情報(例えば、0を撮影画像、1を参照画像とする2値の情報)を含むものとする。
自端末は受信された画像付加情報を参照して入力画像であるか参照画像であるかを調べる(S1003)。
画像が参照画像であったときには、参照画像メモリに保存する(S1007)。既に参照画像がメモリに保存されていれば、それを更新する(S1007)。
画像が入力画像であったときには、参照画像メモリと入力画像との差分領域を検出し(S1004)、他の画像との合成(S1005)を行う。
(2)外部端末の処理
次に、外部端末における処理の流れを図12に従って説明する。
外部端末は画像を撮影する手段、及び参照画像の更新をユーザに指示させる手段を持っており、逐次画像の入力(S1102)を行っている。
通信開始直後やユーザの指示による参照画像入力の指示(S1103)があったときには、画像付加情報に参照画像であるという情報を付与し(S1106)、画像及び画像付加情報を送信する。
それ以外のときには、画像付加情報に入力画像であるという情報を付与し(S1104)、画像及び画像付加情報を送信する。
(3)実施形態4の効果
一般のテレビ会議システムでは背景差分法のための参照画像を送信する手段を持っていないが、背景差分法は背景が変化するたびに参照画像の更新が必要となることが多い。そこで、このような構成にして外部端末はいつでも参照画像の更新を行えるようにすることで、カメラの移動や照明条件の著しい変化といった背景差分法に悪影響を与える現象が起きた場合に、参照画像の更新が行えるようになり、コミュニケーションの継続ができる。
(4)変更例
なお、被写体抽出を行う前の画像をいつでも見られるようにすれば、例えば背景差分法におけるパラメータ(例えば、前景であると判断するしきい値)の調整に有用である。
また、例えば参照画像の取り込みを行うといった端末の状態変化を送信し、外部端末の状況を受信側に表示しておけば、外部端末の被写体が参照画像の取り込みのために突然合成されなくなり受信側のユーザが戸惑うという問題を避けることができる。
また、機器の調整を画像送受信の開始時に行う場合、合成画像を共有する通信を行う前に、音声通信や合成前の画像を送受信することで、参照画像機器の調整をスムーズに行うことができる。
(実施形態5)
以下、本発明の実施形態5の画像処理方法について説明する。
背景差分で抽出した被写体の形状を利用して正確な輪郭の抽出を行うフラクタル輪郭抽出法を高速に画像処理する方法について図13〜図17を用いて説明する。
(1)本実施形態のフラクタル輪郭抽出法の内容
以下、図14〜図16に基づいて本実施形態のフラクタル輪郭抽出法の内容について説明する。
図14、図15におけるX1702は真の輪郭線、X1703は与えられた大まかな輪郭線とする。輪郭抽出処理では、大まかな輪郭線(すなわち、概略的な輪郭線)に基づいて複数の処理ブロックが配置される。X1701、X1801は処理ブロックの1つを表している。
図14のX1701のように真の輪郭線が処理ブロックに含まれていれば、輪郭抽出処理は正しく行われる。一方、図15のX1801のように真の輪郭線が処理ブロックに含まれていないと、輪郭抽出処理は失敗する。つまり、与えられた大まかな輪郭線に許容されるずれの程度は、処理ブロックが配置された場合に真の輪郭線が処理ブロックに含まれる程度である。
従来のフラクタル輪郭抽出法では、輪郭抽出処理を毎回高い計算精度で行ってきた。しかし、前の輪郭抽出処理の結果を次の入力として再び輪郭抽出処理を行っているのであるから、前の輪郭抽出処理では次の輪郭抽出処理(対応範囲は前より小さいが、精度は前より高い)の対応範囲に入ってさえいれば良いため高い計算精度はいらない。最後の輪郭抽出処理だけは高い計算精度で行う必要があるが、フラクタル輪郭抽出法の特性(図17)を考えると、最後の輪郭抽出処理で使う処理ブロックは小さいためいまいちよくわからないので加筆高い精度で計算を行ってもその計算量は少なくてすむ。
このことを使えばフラクタル輪郭抽出法はより高速になる。
まず、図14に示す方法で、図16のように大まかな輪郭線X1703が与えられたとする。その現段階で行う輪郭抽出処理の結果である次の大まかな輪郭線X1902に基づき、次の輪郭抽出処理の処理ブロックX1901が配置されたとする。この場合に、真の輪郭線が処理ブロックX1901に含まれていれば良い。処理ブロックX1901が真の輪郭線を含むように現段階の輪郭抽出処理の計算量を落とせば高速になる。
(3)フラクタル輪郭抽出法の処理のフローチャートによる説明
本実施形態のフラクタル輪郭抽出法の処理を図13のフローチャートに基づいて説明する。
S1301において探索ステップ及び写像回数Mを、ブロックサイズに応じて適切に設定する。そして、ブロックマッチング(S1303)の探索をS画素(Sは自然数)毎に行うことや、縮小写像(S1304)の回数を減らすことにより、高速になる。
但し、S1302〜S1305の処理が最後の処理である場合は、S1301では全探索(ステップ=1)で誤差が1未満となるようなM(例えば縦横4画素であればM=3とする)を設定する。
(3−1)ブロックマッチングの探索
まず、S1303におけるブロックマッチングの探索を高速に行うことについて説明する。
処理ブロックは与えられた大まかな輪郭線の中心におかれるから、与えられた大まかな輪郭線と真の輪郭線とのずれは、処理ブロックの大きさの1/2を超えてはいけない。
また、現段階の処理ブロックと次の処理ブロックの大きさ(処理ブロックの各軸の長さ)の比は1/2である。真の輪郭線を次の処理ブロックのなかに含めるためには、現段階の輪郭抽出処理によって得られる輪郭線のずれが、現段階の処理ブロックの1/4以下になっていれば良い。つまり、現段階の処理ブロックのサイズをBとしたときに、現段階の輪郭抽出処理における許容誤差はB/4である。
ペアレントブロックと処理ブロックの大きさの比がr(但し、r>1である)であるとき、ペアレントブロックの位置が1画素ずれると、得られる輪郭線はほぼ(1/(r−1))画素ずれる。そして、このずれの値は、ペアレントブロックから処理ブロックへの写像の不動点が、ペアレントブロックを1画素ずらした場合の前記不動点のずれにほぼ等しくなることから求められる。なお、「ペアレントブロック」とは、背景技術で説明したように、各処理ブロックについて、その処理ブロックをA倍した大きさ(例えばA=2.0)を持ち、最もその誤差(例えば画素毎の誤差絶対値の総和値)が小さいブロックをいう。
S画素毎に探索した場合に、1画素毎に探索した場合のペアレントブロックに最も近いペアレントブロックが常に得られると仮定する。つまり、ペアレントブロックのずれが最大S/2画素であると仮定する。
すると、(1/(r−1))×(S/2)が許容されるずれを超えないようにSを決めればよい。
(3−2)縮小写像の処理
次に、S1304における縮小写像の処理について説明する。
本実施形態では、非特許文献3のように縮小写像が収束するまで行わずに、M回で打ち切ることで高速に行うものである。
縮小写像を1回行う毎に輪郭の誤差が(1/r)になることにより、M回行うと輪郭の誤差は(1/r)のM乗に初期許容誤差B/2を掛けた値になる。
従って、探索をS画素おきに行ったために発生する誤差と、縮小写像をM回で打ち切ったことによる誤差があわせてB/4以下である限り、輪郭抽出結果に影響を与えずに高速に輪郭抽出を行うことができる。この条件は、例えばS=B/4、M=3とすれば満たされる。
(4)効果
以上により、処理ブロックのサイズBが大きくてもMを増やす必要はなく、また処理ブロックのサイズが大きいほどSも大きくできることがわかる。
また、先に述べたように処理ブロックのサイズBが大きいほど輪郭抽出処理に多くの時間を必要とするから、本実施形態によって処理ブロックのサイズBが大きいときに必要な時間を短縮できれば、フラクタル輪郭抽出法を高速化できる。
そして、本実施形態により、時間のかかる後処理であるフラクタル輪郭抽出法を高速に行うことができ、クロマキーに比べて計算量の多い処理を導入することによる円滑なコミュニケーションの阻害を解決することができる。
(5)変更例
上記では、2次元のフラクタル輪郭抽出法の高速化方法について説明したが、この方法は、例えばMRIで得られる3次元画像、時系列に従う2次元画像である3次元の時空間画像、時系列に従う3次元画像である4次元の時空間画像のように3次元以上の画像であっても適用可能である。
例えば、非特許文献4(竹島秀則,井田孝,堀修,松本信幸,「時空間画像の自己相似性を用いたオブジェクト輪郭の抽出」,電子情報通信学会技術研究報告(信学技報)、Vol.103、No.325、IE2003-62、Sept.2003.)の時空間の3次元のフラクタル輪郭抽出法に適用できる。
すなわち、非特許文献4では時間方向において、現段階の処理ブロックの大きさと次の処理ブロックの大きさが同じ場合がある。この場合は同様に考えると、探索をS画素おきに行ったために発生する誤差と、縮小写像をM回で打ち切ったことによる誤差があわせてB/2以下である限り、輪郭抽出結果に影響を与えずに高速に輪郭抽出を行えることがわかる。
本発明は、例えば、複数の参加者が1つの合成画像を共有しながらコミュニケーションを行うための画像処理方法に好適である。
本発明の実施形態1の自端末グループに対してのみ鏡像反転を行う方法のフローチャートである。 4つの端末からの画像に対し画像処理を行う場合の画像データの例である。 本実施形態を利用したシステム構成例である。 本実施形態を利用したシステムの端末の構成例である。 鏡像反転の関係を示す説明図である。 実施形態2の鏡像反転しない画面の例である。 全体を鏡像反転した画面の例である。 文字領域のみを鏡像反転の対象から除外した画面の例である。 実施形態3の一部の領域を鏡像反転の対象からはずす方法のフローチャートである。 実施形態4の自端末の画像を上に重ねることが可能な画像処理方法のフローチャートである。 付加情報を利用して参照画像と対象画像を分離して処理する方法である。 参照画像と対象画像を区別するための情報を付加して送信する方法である。 実施形態5の高速なフラクタル輪郭抽出法のフローチャートである。 真の輪郭線が処理ブロックに含まれているときの説明図である。 真の輪郭線が処理ブロックに含まれていないときの説明図である。 次の輪郭抽出処理の処理ブロックが配置された説明図である。 処理ブロックのサイズが大きいほど、対応可能範囲は大きく、計算量は多く、得られる輪郭の精度は低くなるという特性を示す説明図である。 従来のシステムにおける画像処理方法のフローチャートである。 従来のシステムの構成例である。 従来のフラクタル輪郭抽出法のフローチャートである。
符号の説明
10 端末
12 モニタ
14 カメラ
16 画像合成部
18 切り出し部
20 鏡像反転部
22 キャプチャー部

Claims (4)

  1. 2つの端末グループの中の第1の端末グループに属する自端末の撮影手段によって撮影された自画像を入力する自画像入力ステップと、
    前記第1の端末グループに属する外部端末及び前記第1の端末グループに属さない第2の端末グループに属する外部端末において撮影された各外部端末画像をネットワークを介して入力する外部端末画像入力ステップと、
    前記自端末と前記第1の端末グループに属する外部端末から入力された各画像を、鏡像反転する画像反転ステップと、
    前記鏡像反転された前記第1の端末グループの各画像と、前記第2の端末グループの外部端末画像を重ね合わせて合成し、合成画像を生成する合成ステップと、
    を具備することを特徴とする画像処理方法。
  2. 前記画像反転ステップは、
    前記画像を鏡像反転させる鏡像反転ステップと、
    前記鏡像反転させた画像の中で指定された反転処理除外領域のみを鏡像反転していない画像に置き換える画像置き換えステップと、
    を具備することを特徴とする請求項1記載の画像処理方法。
  3. 2つの端末グループの中の第1の端末グループに属する自端末の撮影手段によって撮影された自画像を入力する自画像入力手段と、
    前記第1の端末グループに属する外部端末及び前記第1の端末グループに属さない第2の端末グループに属する外部端末において撮影された各外部端末画像をネットワークを介して入力する外部端末画像入力手段と、
    前記自端末と前記第1の端末グループに属する外部端末から入力された各画像を、鏡像反転する画像反転手段と、
    前記鏡像反転された前記第1の端末グループの各画像と、前記第2の端末グループの外部端末画像を重ね合わせて合成し、合成画像を生成する合成手段と、
    を具備することを特徴とする画像処理装置。
  4. 前記画像反転手段は、
    前記画像を鏡像反転させる鏡像反転手段と、
    前記鏡像反転させた画像の中で指定された反転処理除外領域のみを鏡像反転していない画像に置き換える画像置き換え手段と、
    を具備することを特徴とする請求項3記載の画像処理装置。
JP2003431353A 2003-12-25 2003-12-25 画像処理方法 Expired - Fee Related JP4188224B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003431353A JP4188224B2 (ja) 2003-12-25 2003-12-25 画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003431353A JP4188224B2 (ja) 2003-12-25 2003-12-25 画像処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007242107A Division JP2008054331A (ja) 2007-09-19 2007-09-19 画像処理方法及びその装置

Publications (2)

Publication Number Publication Date
JP2005191964A JP2005191964A (ja) 2005-07-14
JP4188224B2 true JP4188224B2 (ja) 2008-11-26

Family

ID=34789403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003431353A Expired - Fee Related JP4188224B2 (ja) 2003-12-25 2003-12-25 画像処理方法

Country Status (1)

Country Link
JP (1) JP4188224B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008001441A1 (fr) * 2006-06-28 2008-01-03 Fujitsu Limited Dispositif vidéo portatif
US8542266B2 (en) * 2007-05-21 2013-09-24 Polycom, Inc. Method and system for adapting a CP layout according to interaction between conferees
US20110210970A1 (en) * 2008-06-18 2011-09-01 Kazu Segawa Digital mirror apparatus
JP5113781B2 (ja) * 2009-02-17 2013-01-09 シャープ株式会社 テレビ電話装置
JP2011040924A (ja) * 2009-08-10 2011-02-24 Nippon Telegr & Teleph Corp <Ntt> コンテンツ変換装置、方法およびプログラム
KR20120017670A (ko) 2010-08-19 2012-02-29 삼성전자주식회사 화상 통신 방법 및 장치
JP6313666B2 (ja) * 2014-06-06 2018-04-18 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置、画像処理方法及び画像処理プログラム
WO2015186402A1 (ja) * 2014-06-06 2015-12-10 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法及び画像処理プログラム
US10600169B2 (en) 2015-03-26 2020-03-24 Sony Corporation Image processing system and image processing method
JP7012631B2 (ja) * 2018-11-14 2022-02-14 Kddi株式会社 オブジェクト識別装置、識別システムおよび識別方法
CN114286009A (zh) * 2021-12-29 2022-04-05 维沃移动通信有限公司 倒影图像拍摄方法、装置、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07154763A (ja) * 1993-11-26 1995-06-16 Fujitsu Ltd 在席テレビ会議装置
JPH08149436A (ja) * 1994-11-19 1996-06-07 Casio Comput Co Ltd テレビ電話装置
FR2731819B1 (fr) * 1995-03-17 1997-04-11 Alsthom Cge Alcatel Methode d'extraction de contours utilisant une analyse multi-fractale
JP3610423B2 (ja) * 1997-03-19 2005-01-12 独立行政法人産業技術総合研究所 映像表示システムおよびその臨場感向上方法
JP3612227B2 (ja) * 1998-01-07 2005-01-19 株式会社東芝 物体抽出装置
JP2000122767A (ja) * 1998-10-14 2000-04-28 Nippon Telegr & Teleph Corp <Ntt> 同室感を持つ共有空間作成方法及び装置ならびに通信システム
JP2001211436A (ja) * 2000-01-26 2001-08-03 Matsushita Electric Ind Co Ltd ディジタル画像処理装置
JP2001268078A (ja) * 2000-03-17 2001-09-28 Sony Corp 通信制御装置、その方法およびその提供媒体と通信装置
JP3860560B2 (ja) * 2003-05-30 2006-12-20 日本電信電話株式会社 表示インタフェース方法および装置

Also Published As

Publication number Publication date
JP2005191964A (ja) 2005-07-14

Similar Documents

Publication Publication Date Title
JP6471780B2 (ja) 深層畳み込みニューラルネットワークを用いる新ビュー合成
US6747610B1 (en) Stereoscopic image display apparatus capable of selectively displaying desired stereoscopic image
JP4463215B2 (ja) 立体化処理装置及び立体情報端末
KR101818778B1 (ko) 실감 파노라마 영상 생성을 위한 3d 데이터 포맷 생성/소비 장치 및 방법
CN101689292B (zh) Banana多媒体数字信号编解码器
CN111402399B (zh) 人脸驱动和直播方法、装置、电子设备及存储介质
CN113206971B (zh) 一种图像处理方法及显示设备
US20090257730A1 (en) Video server, video client device and video processing method thereof
JP4188224B2 (ja) 画像処理方法
WO2010075726A1 (zh) 立体全景视频流生成方法、设备及视频会议方法和设备
JP2005079719A (ja) 撮影画像処理装置及びその方法
CN104641625B (zh) 图像处理装置、摄像装置及图像处理方法
US6014163A (en) Multi-camera virtual set system employing still store frame buffers for each camera
KR101723210B1 (ko) 3차원 리얼타임 가상입체 스튜디오 장치에서의 가상입체 스튜디오 영상 생성 방법
CN112492231B (zh) 远程交互方法、装置、电子设备和计算机可读存储介质
JP2005020607A (ja) 合成画像出力装置および合成画像出力処理プログラム
JP5596844B2 (ja) 画像処理装置、画像処理システム及び画像処理方法
JP2001236521A (ja) 画像分割方式による仮想現実システム
JP2008054331A (ja) 画像処理方法及びその装置
JP4136838B2 (ja) 画像表示方法および画像表示装置
KR20180124539A (ko) 크로마키 원격 합성 동기화 시스템 및 방법
KR20120035321A (ko) 증강 현실 컨텐츠 재생 시스템 및 방법
US20210297649A1 (en) Image data output device, content creation device, content reproduction device, image data output method, content creation method, and content reproduction method
JP2020150517A (ja) 画像処理装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP2019033437A (ja) 画像処理装置及び画像処理装置の制御方法、記憶媒体、プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070807

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080910

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees