JP2015011496A - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP2015011496A
JP2015011496A JP2013136022A JP2013136022A JP2015011496A JP 2015011496 A JP2015011496 A JP 2015011496A JP 2013136022 A JP2013136022 A JP 2013136022A JP 2013136022 A JP2013136022 A JP 2013136022A JP 2015011496 A JP2015011496 A JP 2015011496A
Authority
JP
Japan
Prior art keywords
mesh
image
vertex
feature point
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013136022A
Other languages
English (en)
Inventor
慧吾 廣川
Keigo Hirokawa
慧吾 廣川
快勢 櫻井
Kaisei Sakurai
快勢 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2013136022A priority Critical patent/JP2015011496A/ja
Publication of JP2015011496A publication Critical patent/JP2015011496A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】動画像における認識対象の変形情報を取得し、メッシュを生成することが可能な画像処理装置等を提供する。【解決手段】画像入力部21は、メディア入出力部13、通信制御部14、または周辺機器I/F(インターフェイス)部17を介して、動画像を入力する。特徴点抽出部23は、ノイズ除去部22でノイズが除去された動画像中における非剛体の柄から、FAST法を用いて各画像中の特徴点を抽出する。メッシュ生成部24は、抽出された特徴点を頂点とする2次元のメッシュを、ドロネー三角形分割法を用いて生成する。頂点推定部25は、オプティカルフロー追跡アルゴリズムを用いて、動画像中における特徴点の移動を追跡(推定)する。メッシュ変形部27は、特徴点の追跡位置に基づいて、メッシュ生成部24で生成された2次元のメッシュを変形(適用)する。【選択図】図2

Description

本発明は、動画像における認識対象を追跡し、表面形状の変形情報を取得する技術に関し、特に、非剛体の表面の柄などの表面形状の変形情報を取得する技術に関する。
従来、動画像における認識対象の表面形状を、多角形の集まりであるメッシュ(ポリゴンメッシュ)により表現する技術が知られている。
これに関して、例えば、1台のカメラで撮影された動画像から特徴点を抽出し、作成済みの2次元のメッシュを、その特徴点に重畳して近似する技術が知られている(非特許文献1)。
また例えば、1台のカメラで撮影された動画像の特徴点を抽出し、その特徴点と予め用意した学習データとの比較により、3次元のメッシュを近似する技術が知られている(非特許文献2、非特許文献3)。
また例えば、1台のカメラで撮影された動画像において、予め用意した複数のデータセットから主成分分析により特徴点を推定し、3次元のメッシュを近似する技術が知られている(非特許文献4)。
また例えば、多数のカメラで撮影された動画像から特徴点を抽出し、マーカーにより3次元のメッシュを近似する技術が知られている(非特許文献5、非特許文献6)。
また例えば、1台のカメラで撮影された動画像において、Linear Programmingにより3次元のメッシュを近似する技術が知られている(非特許文献7)。
Hilsmann,et al., "Realistic cloth augmentation in single view video underocclusions", Computers & Graphics, 34(5), pp. 567-574, October 2010. Perriollat,et al., "Monocular Template-based Reconstruction of Inextensible Surfaces",2011. Wang,et al., "A fast approach to deformable surface 3D tracking", PatternRecognition, 44(12), pp. 2915-2925, December 2011. Salzmann,et al., "Surface Deformation Models for Nonrigid 3D Shape Recovery",IEEE Transactions on Pattern Analysis and Machine Intelligence, 29(8), August 2007. Scholz,et al., "Garment Motion Capture Using Color Coded Patterns",EUROGRAPHICS, 24(3), 2005. White,et al., "Capturing and Animating Occluded Cloth", 2007. Wang,et al, "Deformable surface 3D tracking using Linear Programming",2009.
しかし、非特許文献1の手法では、特徴点が多いマークや画像が必要であり、使用するマークや画像に制限があるという問題があった。また、近似を行うため、パラメータが多くパラメータの調整が難しいという問題があった。
非特許文献2、3の手法では、学習データが必須であり、実行前に試行が多数必要であるという問題があった。
また、非特許文献4の手法では、主成分分析によって特徴点を推定するため、複数のデータセットが必要であるという問題があった。
また、非特許文献5、6の手法では、多数のカメラが必要なため、調整が必要であったり設置が大変であるという問題があった。
また、非特許文献7の手法では、処理時間がかかりすぎるという問題があった。
本発明は、前述した問題点に鑑みてなされたもので、動画像における認識対象を画像処理技術で追跡し、低負荷で高速に表面形状の変形情報を取得することを目的とする。
前述した目的を達成するための第1の発明は、動画像に含まれる認識対象に対して、多角形の集合であるメッシュを生成する画像処理装置であって、初期画像から、複数の特徴点を抽出する特徴点抽出手段と、抽出した前記複数の特徴点から選択されたものを頂点として、前記多角形の集合であるメッシュを生成するメッシュ生成手段と、対象画像に含まれる前記メッシュの頂点から、画素値または色情報に基づいて、次の画像の対応する頂点を推定する頂点推定手段と、推定した前記頂点に基づいて、前記次の画像において前記メッシュを変形するメッシュ変形手段と、を備えることを特徴とする画像処理装置である。
第1の発明によって、動画像中に含まれる非剛体の表面の柄などの変形情報である2次元のメッシュをリアルタイムに生成することができる。
前記多角形は三角形であることが望ましい。
また、前記メッシュ生成手段は、前記頂点から1つの三角形分割を求め、前記三角形分割の辺に対して、隣接する2つの三角形の和が凸四角形で、一方の前記三角形の外接円が他の前記三角形の共有していない頂点を含む場合、前記凸四角形において前記辺とは異なる対角線を前記辺と交換して前記三角形分割に含めるという、ドロネー三角形分割法を用いて、前記メッシュを生成することが望ましい。
これによって、メッシュ生成処理を高速に行うことができる。
また、前記認識対象は、非剛体であることが望ましい。
これによって、動画像中に含まれる非剛体の表面の柄などの変形情報を取得することができる。
また、前記特徴点抽出手段は、FAST(Features from Accelerated Segment Test)法によって、前記初期画像の任意の画素pについて、当該画素pを中心とする所定半径の円周上の画素cに対して、画素pの画素値と画素cの画素値との差が閾値以上である画素cが所定数以上連続する場合、又は、画素pの画素値と画素cの画素値との差が閾値以下である画素cが所定数以上連続する場合、当該画素pを特徴点として抽出することが望ましい。
これによって、特徴点抽出処理を高速に行うことができる。
また、前記頂点推定手段は、Lucas-Kanade法によって、前記対象画像及び前記次の画像から、それぞれの画像の数段階の解像度の異なる画像を作成し、前記対象画像の前記頂点について、解像度の異なる対象画像の対応する頂点を求め、最も解像度の低い画像間においてオプティカルフローを計算し、その結果に基づいて、順に解像度の高い画像間においてオプティカルフローを計算し、前記次の画像の対応する頂点を推定することが望ましい。
これによって、頂点推定処理を高速に行うことができる。
前記動画像に含まれる各画像のノイズを除去するノイズ除去手段を、さらに備える。
これによって、高精度にメッシュを生成することができる。
前記メッシュ変形手段により変形された前記メッシュにテクスチャを貼り付けるテクスチャ貼り付け手段を、さらに備える。
これによって、貼り付けられたテクスチャが、動画像の動きに伴い自然に見えるように再現することができる。
第2の発明は、動画像に含まれる認識対象に対して、多角形の集合であるメッシュを生成する画像処理方法であって、初期画像から、複数の特徴点を抽出する特徴点抽出ステップと、抽出した前記複数の特徴点から選択されたものを頂点として、前記多角形の集合であるメッシュを生成するメッシュ生成ステップと、対象画像に含まれる前記メッシュの頂点から、画素値または色情報に基づいて、次の画像の対応する頂点を推定する頂点推定ステップと、推定した前記頂点に基づいて、前記次の画像において前記メッシュを変形するメッシュ変形ステップと、を含むことを特徴とする画像処理方法である。
第2の発明によって、動画像中に含まれる非剛体の表面の柄などの変形情報である2次元のメッシュをリアルタイムに生成することができる。
第3の発明は、コンピュータを、動画像に含まれる認識対象に対して、多角形の集合であるメッシュを生成する画像処理装置として機能させるためのプログラムであって、前記コンピュータを、初期画像から、複数の特徴点を抽出する特徴点抽出手段、抽出した前記複数の特徴点から選択されたものを頂点として、前記多角形の集合であるメッシュを生成するメッシュ生成手段、対象画像に含まれる前記メッシュの頂点から、画素値または色情報に基づいて、次の画像の対応する頂点を推定する頂点推定手段、推定した前記頂点に基づいて、前記次の画像において前記メッシュを変形するメッシュ変形手段、として機能させることを特徴とするプログラムである。
第3の発明のプログラムを汎用のコンピュータにインストールすることによって、第1の発明を得て、第2の発明を実施することができる。
本発明により、動画像における認識対象を画像処理技術で追跡し、低負荷で高速に表面形状の変形情報を取得することが可能となる。
本発明の実施の形態に係る画像処理装置のハードウェアの構成例を示す図である。 画像処理装置の機能構成例を示すブロック図である。 FAST法を用いた特徴点抽出の手法について説明する図である。 ドロネー三角形分割法を用いた2次元のメッシュ生成の手法について説明する図である。 Lucas-Kanade法で用いるピラミッド画像の構造について説明する図である。 メッシュ生成処理を説明するフローチャートである。 図6のステップS1において入力される動画像の一枚分のフレーム画像、ステップS2において抽出される特徴点、ステップS4において生成されるメッシュの一例を示す図である。 図6のステップS1において入力される動画像の次フレームのフレーム画像、ステップS5において追跡される特徴点、ステップS7において変形されるメッシュの一例を示す図である。
以下、図面に基づいて、本発明の実施の形態を詳細に説明する。
[本発明の実施の形態]
図1は、本発明の実施の形態に係る画像処理装置1のハードウェアの構成例を示す図である。尚、図1のハードウェア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
画像処理装置1は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、画像処理装置1が行う後述する処理を実現する。ROMは、不揮発性メモリであり、画像処理装置1のブートプログラムやBIOS(Basic Input/Output System)等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
記憶部12は、HDD(ハードディスクドライブ)等であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理を画像処理装置1に実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(-ROM、-R、-RW等)、DVDドライブ(-ROM、-R、-RW等)等のメディア入出力装置を有する。
通信制御部14は、通信制御装置、通信ポート等を有し、画像処理装置1とネットワーク間の通信を媒介する通信インターフェイスであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、画像処理装置1に対して、操作指示、動作指示、データ入力等を行うことができる。
表示部16は、CRTモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携して画像処理装置1のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
周辺機器I/F(インターフェイス)部17は、画像処理装置1に周辺機器を接続させるためのポートであり、周辺機器I/F部17を介して画像処理装置1は周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB(Universal Serial Bus)やIEEE(The Institute of Electrical and
Electronics Engineers)1394やRS−235C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
図2は、画像処理装置1の機能構成例を示すブロック図である。図2に示す機能部のうちの少なくとも一部は、図1の制御部11により所定のプログラムが実行されることによって実現される。
画像入力部21は、メディア入出力部13、通信制御部14、または周辺機器I/F(インターフェイス)部17を介して、動画像を入力する。入力される動画像は、複数のフレームで構成される。入力される動画像は、複数のフレームがまとめて入力されても、1枚ごとに入力されてもよい。
なお、動画像は、カメラで撮影した動画像のほか、CGで作られた動画像等であってもよい。
ノイズ除去部22は、画像入力部21に入力された動画像のノイズを、平滑化フィルタ等を用いて除去する。平滑化フィルタは、近傍の画素に重み付けを行い足し込むフィルタなど、周知のものを利用すればよい。
特徴点抽出部23は、ノイズ除去部22でノイズが除去された動画像の初期フレームにおける認識対象(例えば、布などの非剛体の表面の柄)から、FAST(Features from Accelerated Segment Test)法を用いて、特徴点を抽出する。
図3は、FAST法を用いた特徴点抽出の手法について説明する図である。なお、FAST法を用いた特徴点抽出の手法は、公知技術であり(非特許文献8)、ここでは、概略を説明する。
<非特許文献8>Edward
Rosten and Tom Drummond, Machine learning for high-speed corner detection.
まず、特徴点抽出部23は、動画像の初期フレームにおける認識対象を、ユーザが入力部15を用いて領域指定するか、あるいは、予め用意したパターンとの比較によるパターンマッチング法を用いて認識対象だけを抽出して領域指定する。次に、特徴点抽出部23は、図3に示すように、指定領域S内において、画像上の任意の点pを決定し、その画素値をIと設定する。
そして、特徴点抽出部23は、画像中の任意の画素pを中心とした所定の半径Rの円周上に存在する各画素(図3の例では、16個)に対し、円の中心に位置する画素pの画素値Iとの差が、閾値T以上の画素が所定数N(例えば、12)以上連続する場合、あるいは、円の中心に位置する画素pの画素値Iとの差が、閾値T以下の画素が所定数N以上連続する場合、円の中心pを特徴点と判定する。FAST法は、このような処理を全ての画素について調べることで、特徴点を抽出する手法である。
なお、特徴点抽出部23は、抽出した特徴点に特徴点IDを付けて、特徴点の座標を、初期フレームであることを示すフレームID(例えば1)、及び、特徴点IDに対応させて、記憶部12又はRAMに記憶する。
図2の説明に戻る。
メッシュ生成部24は、特徴点抽出部23で抽出された特徴点を頂点とする2次元のメッシュ(三角形の集合)を、公知技術のドロネー三角形分割法を用いて生成する。
メッシュ生成部24は、特徴点抽出部23で抽出された特徴点を、ドロネー三角形分割法の入力である頂点とするため、特徴点座標から頂点座標への変換処理等が必要なく高速化を図ることができる。
ドロネー三角形分割法とは、複数の頂点から1つの三角形分割を求め、求めた三角形分割の辺に対して、隣接する2つの三角形の和が凸四角形で、一方の三角形の外接円が他の三角形の共有していない頂点を含む場合、凸四角形において辺とは異なる対角線を辺と交換して三角形分割に含める手法である。ドロネー三角形分割法では、比較的隣接した特徴点による三角形が生成される。
図4は、ドロネー三角形分割法を用いた2次元のメッシュ生成の手法について説明する図である。
図4(A)は、「ABC」という柄(ロゴ)が印刷されたTシャツを着用した人物の動画像の一枚分のフレーム画像Q1の一例を示している。
図4(B)は、図4(A)に示したフレーム画像Q1の領域Aを部分的に拡大しており、認識対象(Tシャツの表面に印刷された「ABC」)から、特徴点抽出部23によって抽出された特徴点K1〜K9を示している。
まず、メッシュ生成部24は、2次元のメッシュ生成にあたり、認識対象(図4(A)の例では、Tシャツの表面に印刷された「ABC」)が写っている画面上に凸多角形を形成する。この凸多角形は、次の条件を満たすように形成される。
まず、認識対象に凸多角形を形成する場合、特徴点抽出部23によって抽出された認識対象を写した画像の特徴点、または、それ以外の仮の特徴点(例えば、画像の四隅部)を頂点として凸多角形を形成する。そして、抽出された特徴点の全てが、凸多角形の内部か周上にあるようにする。
ドロネー三角形分割法では、この凸多角形内部のすべての特徴点に対し、複数の三角形を求めるが、それぞれの形の外接円が他の特徴点を含まないように、三角形が分割される。そして、メッシュ生成部24は、図4(C)に示すように、認識対象に形成された凸多角形の頂点または複数の特徴点を頂点とする複数の三角形の領域に分割し、2次元のメッシュM1を生成する。
なお、メッシュ生成部24は、生成した2次元メッシュの各三角形を、構成する特徴点の特徴点IDによって指定し、記憶部12又はRAMに記憶する。
図2の説明に戻る。
頂点推定部25は、オプティカルフロー追跡アルゴリズムを用いて、直前フレームに含まれる特徴点から、直前フレームの次のフレーム(以下、対象フレームともいう。)の特徴点を追跡(推定)する。以下では、この追跡(推定)した特徴点を追跡特徴点ともいう。
頂点推定部25は、最初の処理では、メッシュ生成部24から入力される(特徴点が抽出され、メッシュが生成された)初期フレームを用いて、画像入力部21から入力される初期フレームの次のフレームに対して、特徴点の推定を行い、次回以降の処理では、後述するメッシュ変形部27から入力される(特徴点が推定され、メッシュが生成された)フレームを用いて、画像入力部21から入力される当該フレームの次のフレームに対して、特徴点の推定を行う。
頂点推定部25が用いるオプティカルフローとは、連続する2つの画像において、これらの画像を構成する画素毎の動きを表すベクトルを意味する。すなわち、オプティカルフローは、画像の動きを表す画素毎の移動ベクトルであり、オプティカルフローを算出することによって、画像に含まれる対象を追跡することができる。
ここで、オプティカルフローを用いた特徴点の移動を追跡する手法について説明する。本実施の形態では、オプティカルフローの算出方法として、ピラミッド画像を用いたLucas-Kanade法を適用する。なお、ピラミッド画像を用いたLucas-Kanade法は、公知技術であり(非特許文献9)、ここでは、概略を説明する。
<非特許文献9>Jean-Yves
Bouguet, Pyramidal Implementation of the Lucas Kanade Feature Tracker Description
of the algorithm.
まず、ある時刻tの画像座標P=(x,y)の濃淡パターンI(x,y,t)が、ある微小時間後(δt)に座標(x+δx,y+δy)に、その濃淡分布を一定に保ったまま移動した時、次式(1)に示すようなオプティカルフロー拘束式が成り立つ。なお、濃淡パターンは、色情報(画素値等)に基づくものである。
Figure 2015011496
2次元画像でオプティカルフロー{v=(δx/δt,δy/δt)=(u,w)}を計算するには、未知パラメータ数が2個であるため、もう一つ拘束式が必要である。そこで、同一物体の局所領域では、同一のオプティカルフローを持つと仮定することにする。
例えば、画像上の局所領域ω内で、オプティカルフローが一定である場合、最小化したい濃淡パターンの二乗誤差Eは、I(p)=I(x,y,t),I(p+v)=I(x+u,y+w,t+δt)と書き改めると、次式(2)に示すように定義できる。
Figure 2015011496
ここで、vが微小な場合には、テーラー展開の2次以上の項を無視できるため、次式(3)の関係が成り立つ。g(p)は、I(p)の一次微分である。
Figure 2015011496
誤差Eが最小になるのは、Eのvに対する微分値が0の時であるため、次式(4)の関係が成り立つ。
Figure 2015011496
従って、オプティカルフローvは、次式(5)で求められる。
Figure 2015011496
さらに、次式(6)に示すように、ニュートン・ラフソン法の反復演算によって精度良く求めることができる。
Figure 2015011496
本実施の形態では、以上の計算を、解像度の異なる複数の画像からなるピラミッド画像構造を用いて行う。
まず、頂点推定部25は、2枚の連続したフレーム(直前フレームと対象フレーム)から、予め、それぞれの画像の数段階の解像度の異なる画像をピラミッド階層型に作成する。例えば、図5に示すように、原画像Q11が階層レベル1の画像、階層レベル1より低解像度の画像が階層レベル2の画像、階層レベル2より低解像度の画像が階層レベル3の画像、階層レベル3より低解像度の画像が階層レベル4の画像として作成される。
次に、頂点推定部25は、最も解像度の低い画像間(図5の例では、階層レベル4の画像間)において、上述したオプティカルフローを計算し、各特徴点の大まかな次フレームでの移動ベクトルを決定する。頂点推定部25は、この結果を参考にして、一段解像度の高い画像間(図5の例では、階層レベル3の画像間)において、低解像度時の移動ベクトル付近を探索する。
頂点推定部25は、以上の処理を最も解像度の高い画像間まで順次繰り返し、最終的な移動ベクトルを得る。このような処理によって、無駄な計算ステップを省く事ができる。
そして、頂点推定部25は、直前フレームの特徴点の対象フレームにおける対応する点を、求めた移動ベクトルによって移動させて、対象フレームにおける特徴点(追跡特徴点)と推定する。頂点推定部25は、特徴点を推定した対象フレームを、追跡特徴点のノイズ除去部26へ出力する。
なお、頂点推定部25は、対象フレームにおいて推定した特徴点の座標を、対応する特徴点ID(直前フレームの対応する特徴点の有する特徴点ID)、及び、対象フレームのフレームIDに対応させて、記憶部12又はRAMに記憶する。
図2の説明に戻る。
追跡特徴点のノイズ除去部26は、頂点推定部25によって推定された追跡特徴点を、閾値でフィルタリングすることによってノイズ除去し、特徴点の追跡位置(座標)を補正する。これは、頂点推定部25の処理により発生するノイズによって、移動ベクトルが著しく大きくなることがあるためである。
追跡特徴点のノイズ除去部26は、フレーム間の特徴点の変位量(移動ベクトルの長さ)に所定の閾値を定め、対象フレームの特徴点の変位量が当該閾値を超えた場合、直前フレームの対応する特徴点の移動ベクトルを対象フレームにおいても移動ベクトルとし、特徴点の位置の補正を行う。
なお、追跡特徴点のノイズ除去部26は、特徴点の座標を補正した場合には、当該補正した特徴点に係る特徴点座標を、記憶部12又はRAMに記憶し直す。
メッシュ変形部27は、追跡特徴点のノイズ除去部26でノイズが除去された特徴点の追跡位置に基づいて、メッシュ生成部24で生成された2次元のメッシュを変形(適用)する。
具体的には、メッシュ生成部24により、メッシュを構成する三角形ごとに、頂点の特徴点IDは確定しており、頂点推定部25、及び、追跡特徴点のノイズ除去部26により、対象フレームにおける特徴点IDの座標が確定しているため、メッシュ変形部27は、これらの情報を用いて、2次元メッシュを構成する三角形の座標を算出する。
テクスチャ貼り付け部28は、メッシュ変形部27で変形されたメッシュ上に、予め用意したテクスチャを貼り付ける。つまり、生成された2次元のメッシュ上にテクスチャマッピング法を適用することで、テクスチャを貼り付ける。こうすることで、貼り付けられたテクスチャが、動画像の動きに伴い自然に見えるように再現することができる。
(メッシュ生成処理)
図6は、画像処理装置1が実行する、動画像における認識対象の表面形状のメッシュを生成する処理を説明するフローチャートである。なお、図6の説明に当たり、図7、図8を参照し、具体的な処理内容も説明する。
ステップS1において、画像処理装置1の制御部11(画像入力部21)は、通信制御部14、または周辺機器I/F(インターフェイス)部17を介して、動画像の初期フレームを入力する。これにより、例えば、図7(A)に示すような動画像の一枚分のフレーム画像Q21が入力される。
ステップS2において、画像処理装置1の制御部11(ノイズ除去部22)は、ステップS1の処理で入力された初期フレームのノイズを、平滑化フィルタを用いて除去する。
ステップS3において、画像処理装置1の制御部11(特徴点抽出部23)は、ステップS2の処理でノイズが除去された初期フレームにおける認識対象(例えば、布などの非剛体の表面の柄)を、ユーザが入力部15を用いて領域指定するか、あるいは、パターンマッチング法により領域指定する。そして、画像処理装置1の制御部11(特徴点抽出部23)は、指定された領域内の特徴点を、FAST法を用いて抽出する。これにより、例えば、図7(B)に示すように、認識対象(Tシャツの表面に印刷された「ABC」)から、特徴点K11〜K19が抽出される。図7(C)は、抽出された特徴点K11〜K19のみを示す図である。
ステップS4において、画像処理装置1の制御部11(メッシュ生成部24)は、ステップS3の処理で抽出された特徴点を頂点とする2次元のメッシュを、ドロネー三角形分割法を用いて生成する。これにより、例えば、図7(D)に示すように、2次元のメッシュM11が生成される。
また、2次元のメッシュM11の生成によって、各三角形を構成する特徴点の組み合わせが決定する。図7(D)の例の場合、以下に示すような特徴点の組み合わせが決定される。
・特徴点K11、K12、K16の組み合わせ
・特徴点K11、K14、K16の組み合わせ
・特徴点K12、K13、K17の組み合わせ
・特徴点K12、K16、K17の組み合わせ
・特徴点K13、K18、K19の組み合わせ
・特徴点K13、K17、K18の組み合わせ
・特徴点K14、K15、K16の組み合わせ
・特徴点K15、K16、K17の組み合わせ
ステップS5において、画像処理装置1の制御部11(画像入力部21)は、通信制御部14、または周辺機器I/F(インターフェイス)部17を介して、動画像の次のフレーム(以下、対象フレームともいう。)を入力する。
ステップS6において、画像処理装置1の制御部11(頂点推定部25)は、動画像の対象フレームにおける特徴点の移動を、ピラミッド画像を用いたLucas-Kanade法を用いて追跡(推定)する。
例えば、入力された動画像の対象フレームが、図8(A)に示すようなフレーム画像Q22であった場合、図8(B)に示すように、そのフレーム画像Q22における特徴点の移動ベクトルが探索される。図8(C)は、探索された特徴点K11´〜K19´、および、ステップS4の処理で生成された2次元のメッシュM11のみを示す図である。
ステップS7において、追跡特徴点のノイズ除去部26は、ステップS5の処理で推定された追跡特徴点を、閾値でフィルタリングすることによってノイズ除去し、特徴点の追跡位置を補正する。
ステップS8において、メッシュ変形部27は、ノイズが除去された特徴点の追跡位置に基づいて、ステップS4の処理で生成された2次元のメッシュM11を変形し、図8(D)のように、2次元メッシュM12を生成する。つまり、始めに生成された2次元のメッシュの特徴点の組み合わせに対し、追跡特徴点の座標位置が適用されることで、2次元メッシュM11が、2次元メッシュM12の形状に変形される。
ステップS9において、制御部11は、特徴点の追跡終了であるか否か、つまり、入力された動画像において、処理すべきフレームがなくなったか否かを判定し、まだ特徴点の追跡中であると判定した場合、ステップS5に戻り、上述した処理を繰り返し実行する。そして、ステップS8において、特徴点の追跡終了と判定された場合、メッシュ生成処理を終了する。
本実施形態は上述のものに限られず、その趣旨を逸脱しない範囲で変更可能である。
例えば、ノイズ除去部22は、動画像の初期フレームに対してのみノイズを除去しても、動画像の全てのフレームに対してノイズを除去してもよい。
また、例えば、画像処理装置1は、ノイズ除去部22、又は、追跡特徴点のノイズ除去部26のいずれか一方、又は、その両方を備えなくてもよい。
[本発明の実施の形態における効果]
1.動画像中に含まれる認識対象(例えば、布などの非剛体の表面の柄)の変形情報である2次元のメッシュをリアルタイムに生成することができる。
2.動画像の初期フレームから、FAST法を用いて、画像中の特徴点を抽出することで、高速に処理を行うことができる。
3.動画像の初期フレームにおいて抽出された特徴点を頂点として、ドロネー三角形分割法を用いて、ダイレクトに2次元のメッシュを生成することで、高速に処理を行うことができる。
4.動画像の直前フレームにおいて抽出された特徴点を用いて、ピラミッド画像を用いたLucas-Kanade法によって、対象フレームの特徴点を追跡するため、計算ステップ数を減らし、高速に処理を行うことができる。
5.生成された2次元のメッシュ上に、テクスチャマッピング法を適用することで、貼り付けられたテクスチャが動画像の動きに伴い自然に見えるように再現することができる。
以上、添付図面を参照しながら、本発明に係る画像処理装置等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………画像処理装置
11………制御部
21………画像入力部
22………ノイズ除去部
23………特徴点抽出部
24………メッシュ生成部
25………頂点推定部
26………追跡特徴点のノイズ除去部
27………メッシュ変形部
28………テクスチャ貼り付け部

Claims (10)

  1. 動画像に含まれる認識対象に対して、多角形の集合であるメッシュを生成する画像処理装置であって、
    初期画像から、複数の特徴点を抽出する特徴点抽出手段と、
    抽出した前記複数の特徴点から選択されたものを頂点として、前記多角形の集合であるメッシュを生成するメッシュ生成手段と、
    対象画像に含まれる前記メッシュの頂点から、画素値または色情報に基づいて、次の画像の対応する頂点を推定する頂点推定手段と、
    推定した前記頂点に基づいて、前記次の画像において前記メッシュを変形するメッシュ変形手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記多角形は三角形である
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記メッシュ生成手段は、前記頂点から1つの三角形分割を求め、前記三角形分割の辺に対して、隣接する2つの三角形の和が凸四角形で、一方の前記三角形の外接円が他の前記三角形の共有していない頂点を含む場合、前記凸四角形において前記辺とは異なる対角線を前記辺と交換して前記三角形分割に含めるという、ドロネー三角形分割法を用いて、前記メッシュを生成する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記認識対象は、非剛体である
    ことを特徴とする請求項1乃至請求項3のいずれかに記載の画像処理装置。
  5. 前記特徴点抽出手段は、FAST(Features from Accelerated Segment Test)法によって、前記初期画像の任意の画素pについて、当該画素pを中心とする所定半径の円周上の画素cに対して、画素pの画素値と画素cの画素値との差が閾値以上である画素cが所定数以上連続する場合、又は、画素pの画素値と画素cの画素値との差が閾値以下である画素cが所定数以上連続する場合、当該画素pを特徴点として抽出する
    ことを特徴とする請求項1乃至請求項4のいずれかに記載の画像処理装置。
  6. 前記頂点推定手段は、Lucas-Kanade法によって、前記対象画像及び前記次の画像から、それぞれの画像の数段階の解像度の異なる画像を作成し、前記対象画像の前記頂点について、解像度の異なる対象画像の対応する頂点を求め、最も解像度の低い画像間においてオプティカルフローを計算し、その結果に基づいて、順に解像度の高い画像間においてオプティカルフローを計算し、前記次の画像の対応する頂点を推定する
    ことを特徴とする請求項1乃至請求項5のいずれかに記載の画像処理装置。
  7. 前記動画像に含まれる各画像のノイズを除去するノイズ除去手段を、さらに備える
    ことを特徴とする請求項1乃至請求項6のいずれかに記載の画像処理装置。
  8. 前記メッシュ変形手段により変形された前記メッシュにテクスチャを貼り付けるテクスチャ貼り付け手段を、さらに備える
    ことを特徴とする請求項1乃至請求項7のいずれかに記載の画像処理装置。
  9. 動画像に含まれる認識対象に対して、多角形の集合であるメッシュを生成する画像処理方法であって、
    初期画像から、複数の特徴点を抽出する特徴点抽出ステップと、
    抽出した前記複数の特徴点から選択されたものを頂点として、前記多角形の集合であるメッシュを生成するメッシュ生成ステップと、
    対象画像に含まれる前記メッシュの頂点から、画素値または色情報に基づいて、次の画像の対応する頂点を推定する頂点推定ステップと、
    推定した前記頂点に基づいて、前記次の画像において前記メッシュを変形するメッシュ変形ステップと、
    を含むことを特徴とする画像処理方法。
  10. コンピュータを、動画像に含まれる認識対象に対して、多角形の集合であるメッシュを生成する画像処理装置として機能させるためのプログラムであって、
    前記コンピュータを、
    初期画像から、複数の特徴点を抽出する特徴点抽出手段、
    抽出した前記複数の特徴点から選択されたものを頂点として、前記多角形の集合であるメッシュを生成するメッシュ生成手段、
    対象画像に含まれる前記メッシュの頂点から、画素値または色情報に基づいて、次の画像の対応する頂点を推定する頂点推定手段、
    推定した前記頂点に基づいて、前記次の画像において前記メッシュを変形するメッシュ変形手段、
    として機能させることを特徴とするプログラム。
JP2013136022A 2013-06-28 2013-06-28 画像処理装置、画像処理方法、およびプログラム Pending JP2015011496A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013136022A JP2015011496A (ja) 2013-06-28 2013-06-28 画像処理装置、画像処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013136022A JP2015011496A (ja) 2013-06-28 2013-06-28 画像処理装置、画像処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2015011496A true JP2015011496A (ja) 2015-01-19

Family

ID=52304616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013136022A Pending JP2015011496A (ja) 2013-06-28 2013-06-28 画像処理装置、画像処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2015011496A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230095570A (ko) * 2021-12-22 2023-06-29 고려대학교 산학협력단 역방향 광류를 이용한 멀미 저감 장치, 방법 및 이를 위한 컴퓨터 판독가능 프로그램

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010259087A (ja) * 2005-03-31 2010-11-11 Euclid Discoveries Llc ビデオデータを処理する装置および方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010259087A (ja) * 2005-03-31 2010-11-11 Euclid Discoveries Llc ビデオデータを処理する装置および方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230095570A (ko) * 2021-12-22 2023-06-29 고려대학교 산학협력단 역방향 광류를 이용한 멀미 저감 장치, 방법 및 이를 위한 컴퓨터 판독가능 프로그램
KR102563321B1 (ko) * 2021-12-22 2023-08-04 고려대학교 산학협력단 역방향 광류를 이용한 멀미 저감 장치, 방법 및 이를 위한 컴퓨터 판독가능 프로그램

Similar Documents

Publication Publication Date Title
Habermann et al. Real-time deep dynamic characters
Dou et al. Scanning and tracking dynamic objects with commodity depth cameras
Kolev et al. Turning mobile phones into 3D scanners
US9619704B2 (en) Fast articulated motion tracking
Kumar et al. Monocular dense 3d reconstruction of a complex dynamic scene from two perspective frames
Li et al. Robust single-view geometry and motion reconstruction
US9036898B1 (en) High-quality passive performance capture using anchor frames
Li et al. Markerless shape and motion capture from multiview video sequences
US8824801B2 (en) Video processing
US20200380711A1 (en) Method and device for joint segmentation and 3d reconstruction of a scene
CN107958446B (zh) 信息处理设备和信息处理方法
JP2007000205A (ja) 画像処理装置及び画像処理方法並びに画像処理プログラム
JP2007310707A (ja) 姿勢推定装置及びその方法
CN113012293A (zh) 石刻模型构建方法、装置、设备及存储介质
KR102158390B1 (ko) 영상 처리 방법 및 장치
Li et al. 3d human avatar digitization from a single image
CN111353069A (zh) 一种人物场景视频生成方法、系统、装置及存储介质
JP7003617B2 (ja) 推定装置、推定方法、及び推定プログラム
JP6806160B2 (ja) 3次元運動評価装置、3次元運動評価方法、及びプログラム
CN115222895B (zh) 图像生成方法、装置、设备以及存储介质
Li et al. Robust 3D human motion reconstruction via dynamic template construction
CN111179281A (zh) 人体图像提取方法及人体动作视频提取方法
Klose et al. Flowlab-an interactive tool for editing dense image correspondences
Cushen et al. Markerless real-time garment retexturing from monocular 3d reconstruction
JP2015011496A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170905