JP5560925B2 - 3次元形状検索装置、3次元形状検索方法、及びプログラム - Google Patents

3次元形状検索装置、3次元形状検索方法、及びプログラム Download PDF

Info

Publication number
JP5560925B2
JP5560925B2 JP2010132612A JP2010132612A JP5560925B2 JP 5560925 B2 JP5560925 B2 JP 5560925B2 JP 2010132612 A JP2010132612 A JP 2010132612A JP 2010132612 A JP2010132612 A JP 2010132612A JP 5560925 B2 JP5560925 B2 JP 5560925B2
Authority
JP
Japan
Prior art keywords
dimensional shape
dimensional
histogram
image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010132612A
Other languages
English (en)
Other versions
JP2011258036A (ja
Inventor
祐樹 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2010132612A priority Critical patent/JP5560925B2/ja
Publication of JP2011258036A publication Critical patent/JP2011258036A/ja
Application granted granted Critical
Publication of JP5560925B2 publication Critical patent/JP5560925B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、コンピュータグラフィックスにおける3次元形状モデルの制作を支援する3次元形状検索装置等に関する。
従来より、ゲームや映画等にコンピュータグラフィックス(CG;Computer Graphics)が多用されており、CG制作のニーズが高まっている。写実的な3次元CGを制作するためには、実物に忠実な形状をモデリングする必要がある。しかし、市販されている高機能なモデリングソフトを用いて3次元CGの形状モデリングを行うためには、ソフトウエアの操作を習熟する必要がある。そのため、3次元CGコンテンツ用の形状をモデリングできる人は一部の専門的なスキルを持つ制作者に限定される傾向にあった。
これに対し、近年、3次元CGの3次元形状モデリングや3次元形状モデル検索を直感的な操作で簡単に行えるようにするための研究が行われている。
例えば、非特許文献1には、ユーザにより手書き入力されたスケッチ(輪郭線情報)を基に3次元形状モデリングを行う技術が提案されている。非特許文献1に示すTeddyと呼ばれるシステムでは、タブレットやマウス等を利用して平面に手書き自由曲線(2次元の多角形)を描くと、描かれた多角形の芯線を見つけて上下に持ち上げ、元の多角形の周と持ち上げられた芯線とを包み込むようなポリゴンメッシュを生成することにより3次元形状を生成することが可能となっている。
また、CG制作を効率よく行なうために、既に生成した3次元形状のモデルをデータベースに保存しておき、これらの中から所望の形状に類似した3次元モデルを容易に検索する技術が提案されている。
例えば特許文献1には、データベースに多種類の3次元モデルのメッシュモデルデータの影画像を生成して、影画像用の特徴量であるGFD(Generic Fourier Description;特許文献1の段落[0025])、及び特徴稜線画像用の特徴量であるLBP(Local Binary Pattern;特許文献1の段落[0037])と対応付けて保持しておくとともに、デザイナが描く3面図やアイソメ図をもとに14方向の視点からデザインスケッチデータを描画して(特許文献1の段落[0023])、上述と同様にそれらの影画像を生成し、影画像のGFDを算出し、算出されたGFDを基にデータベース内から類似する3次元モデルを検索し、更に、LBPの類似性に基づいて絞込み検索する技術が開示されている。しかし、特許文献1では、GFDのように方向に依存する特徴量を用いて類似検索を行うので、データベースに登録された影画像と同一方向についてのスケッチを描かない限り、精度のよい検索が行われない。
これに対し、特許文献2には、検索の対象となる3次元モデルについて互いに異なる視点から見た複数の2次元画像を生成し、生成された2次元画像それぞれの特徴量を抽出してデータベースに保持しておき、検索キーとなる二次元画像が入力されると入力された二次元画像から特徴量を抽出し、この特徴量と、データベース内に保持されている3次元モデルから抽出した特徴量との類似検索を行なって、類似する3次元モデルを出力する方法が記載されている。そして、類似性の判定の規準とする特徴量については、2次元画像から算出可能なものとして、RGB、HSV、Lab等の色情報毎の値を量子化したヒストグラム、エッジ微分を量子化した形状ヒストグラム等が挙げられ(特許文献2の段落[0053])、また、3次元画像から算出可能なものとしては上述のものに加え、3次元オブジェクトの体積や表面積、頂点分布、ポリゴン分布等が挙げられている(特許文献2の段落[0045])。
"Teddy:A Sketching Interface for 3D Freedom Design",T.Igarashi,S.matsuoka,H.tanaka.SIGGRAPH99Conference Proceedings.
特開2006−285627号公報 特開2004−164503号公報
しかしながら、上述の特許文献1及び特許文献2では、2次元画像が正確に入力されないと精度のよい検索が行なえない。そのため、検索の精度はユーザの画力に依存することとなり、誰でも簡単に所望の検索結果を得られるものではない。
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、手書きの2次元画像から容易かつ高精度に、類似する3次元形状モデルを検索可能な3次元形状検索装置、3次元形状検索方法、及びプログラムを提供することである。
前述した課題を解決するため第1の発明は、複数の3次元形状モデルと、前記3次元形状モデルの2次元投影画像から算出される2種類の特徴量として、前記2次元投影画像の輪郭線上の注目画素に隣接する複数の方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である画素連結性ヒストグラム、及び前記2次元投影画像の輪郭線内を塗りつぶした画像の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数を集積した度数分布である半径ヒストグラムとを予め記憶するデータベースと、任意の物体の手書き画像を入力する入力手段と、前記入力手段により入力された手書き画像について、前記画素連結性ヒストグラム及び前記半径ヒストグラムを抽出する特徴量抽出手段と、前記特徴量抽出手段により抽出される前記画素連結性ヒストグラム及び前記半径ヒストグラムに基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを検索する検索手段と、前記検索手段による検索結果を提示する提示手段と、を備えることを特徴とする3次元形状検索装置である。
画素連結性ヒストグラムとは、輪郭線の連結方向の傾向を示す特徴量である。すなわち、輪郭線上の画素に隣接する例えば8方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である。
半径ヒストグラムとは、2次元投影画像のシルエット画像(輪郭線内を塗りつぶした画像)の重心からシルエット画像内の各画素までの距離について、距離毎に該当する画素の数(度数)を示した度数分布である。
第1の発明の3次元形状検索装置は、データベースに複数の3次元形状モデルと、それらの3次元形状モデルについての形状に関する少なくとも2種類の特徴量と、を予め記憶しておき、任意の物体の手書き画像が入力されると、入力された手書き画像について形状に関する少なくとも2種類の特徴量を抽出し、抽出した特徴量に基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを検索して検索結果を提示する。
これにより、手書き画像及び3次元形状モデルからそれぞれ抽出される形状に関する少なくとも2種類の特徴量に基づいて、類似する3次元形状モデルを検索できるので、手書きの2次元画像からの3次元形状モデルの検索を容易かつ高精度に行える。特に、形状について精度よく類似検索を行える。
また、第1の発明の3次元形状検索装置において、前記入力手段は、前記物体を含む2次元画像データを取り込む2次元画像データ取り込み手段と、前記2次元画像データ取り込み手段により取り込まれた2次元画像データを基に前記物体の輪郭線をなぞり書き入力する輪郭線入力手段と、前記輪郭線入力手段により入力された輪郭線を、前記2次元画像データから抽出されるエッジ形状に沿うように補正する補正手段と、を更に備えることが望ましい。
これにより、例えば、デジタルカメラやスキャナ等から取り込んだ写真や絵画等の2次元画像データから、輪郭線をなぞり書きするという簡単かつユーザの画力に依存しない方法で、検索キーとなる2次元画像を入力できる。また、輪郭線は元の2次元画像から抽出されるエッジ形状に沿うように補正されるので、正確な輪郭線を入力でき、検索の精度を向上させることができる。
また、第1の発明の3次元形状検索装置において、前記入力手段により入力された手書き画像に基づいて3次元形状モデルを生成する3次元形状モデル生成手段と、前記3次元形状モデル生成手段により生成された3次元形状モデルについて、前記3次元形状モデルをボクセル変換したボクセルモデルの重心から前記3次元形状モデル領域内の各ボクセルまでの距離について、距離毎に該当する画素の数を集積したヒストグラムである3次元形状特徴量を抽出する3次元形状特徴量抽出手段と、を更に備え、前記データベースは、更に、複数の前記3次元形状モデルの前記3次元形状特徴量を予め記憶し、前記検索手段は、前記画素連結性ヒストグラム及び前記半径ヒストグラムに加え、更に、前記3次元形状特徴量抽出手段により抽出された前記3次元形状特徴量に基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを検索することが望ましい。
これにより、手書き画像から抽出される2次元の形状に関する少なくとも2種類の特徴量に加え、3次元形状に関する特徴量を考慮して類似する3次元形状モデルを検索できるので、検索の精度が向上し、CG制作の作業効率が向上する。例えば、手書きの2次元画像を入力した後に、簡単な3次元形状モデルを生成すれば、2次元の特徴量と3次元の特徴量とを組み合わせて、データベース内の完成された3次元形状モデルが類似検索されるため、所望の検索結果に速く到達できる。
また、第1の発明の3次元形状検索装置において、前記提示手段により提示された3次元形状モデルのうち、ユーザにより選択された3次元形状モデルについて、前記3次元形状モデルをボクセル変換したボクセルモデルの重心から前記3次元形状モデル領域内の各ボクセルまでの距離について、距離毎に該当する画素の数を集積したヒストグラムである3次元形状特徴量を抽出する3次元形状特徴量抽出手段を更に備え、前記データベースは、更に、複数の前記3次元形状モデルの前記3次元形状特徴量を予め記憶し、前記検索手段は、前記画素連結性ヒストグラム及び前記半径ヒストグラムに加え、更に、前記3次元形状特徴量抽出手段により抽出された前記3次元形状特徴量に基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを再検索することが望ましい。
これにより、手書きの2次元画像から形状に関する少なくとも2種類の特徴量を用いて検索された3次元形状モデルのうち、ユーザにより選択されたものについて、更に3次元形状に関する特徴量を算出し、2次元の形状に関する少なくとも2つの特徴量と、3次元形状に関する特徴量とを組み合わせてデータベース内の類似する3次元形状モデルを再検索するので、検索の精度が向上し、かつ効率よく所望の検索結果を導出できる。
第2の発明は、コンピュータにより実行される3次元形状検索方法であって、コンピュータの制御部が、任意の物体の手書き画像を入力する入力ステップと、前記制御部が、入力された手書き画像について、前記手書き画像の輪郭線上の注目画素に隣接する複数の方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である画素連結性ヒストグラム、及び前記手書き画像の輪郭線内を塗りつぶした画像の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数を集積した度数分布である半径ヒストグラムを抽出する特徴量抽出ステップと、前記制御部が、複数の3次元形状モデルと、前記3次元形状モデルの2次元投影画像から算出される2種類の特徴量として、前記画素連結性ヒストグラム及び前記半径ヒストグラムとを予め記憶したデータベースから、前記画素連結性ヒストグラム及び前記半径ヒストグラムに基づいて、前記手書き画像に類似する3次元形状モデルを検索する検索ステップと、前記制御部が、検索結果を提示する提示ステップと、を含むことを特徴とする3次元形状検索方法である。
第2の発明によれば、任意の物体の手書き画像が入力されると、入力された手書き画像について形状に関する少なくとも2種類の特徴量を抽出し、3次元形状モデルについての形状に関する少なくとも2種類の特徴量を予め記憶したデータベースから、前記少なくとも2種類の特徴量に基づいて、前記手書き画像に類似する3次元形状モデルを検索して検索結果を提示する。
これにより、手書き画像及び3次元形状モデルから抽出される形状に関する少なくとも2種類の特徴量に基づいて類似する3次元モデルを検索できるので、手書きの2次元画像からの3次元形状モデルの検索を容易かつ高精度に行える。
第3の発明は、コンピュータにより読み取り可能な形式で記述されたプログラムであって、任意の物体の手書き画像を入力する入力ステップと、入力された手書き画像について、前記手書き画像の輪郭線上の注目画素に隣接する複数の方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である画素連結性ヒストグラム、及び前記手書き画像の輪郭線内を塗りつぶした画像の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数を集積した度数分布である半径ヒストグラムを抽出する特徴量抽出ステップと、複数の3次元形状モデルと、前記3次元形状モデルの2次元投影画像から算出される2種類の特徴量として、前記画素連結性ヒストグラム及び前記半径ヒストグラムとを予め記憶したデータベースから、前記画素連結性ヒストグラム及び前記半径ヒストグラムに基づいて、前記手書き画像に類似する3次元形状モデルを検索する検索ステップと、検索結果を提示する提示ステップと、を含む処理をコンピュータに実行させるためのプログラムである。
第3の発明によれば、コンピュータを第1の発明の3次元形状検索装置として機能させることが可能となる。
本発明によれば、手書きの2次元画像から容易かつ高精度に、類似する3次元形状モデルを検索可能な3次元形状検索装置、3次元形状検索方法、及びプログラムを提供できる。
3次元形状検索装置1のハードウエアブロック図 データベース5のデータ構成を示す図 3次元形状検索処理の流れを説明するフローチャート 2次元画像の入力処理について説明するフローチャート 輪郭線補正について説明する図 2次元形状の特徴量抽出について説明するフローチャート 画素連結性ヒストグラムについて説明する図 半径ヒストグラムについて説明する図 3次元形状の特徴量抽出について説明するフローチャート
以下、図面に基づいて本発明の好適な実施形態について詳細に説明する。
まず、図1〜図2を参照して本発明の構成について説明する。
図1は、本発明に係る3次元形状検索装置1のハードウエア構成を示す図であり、図2は、データベース5のデータ構成を示す図である。
3次元形状検索装置1は、例えば一般的なコンピュータ等であり、図1に示すように、制御部11、記憶部12、メディア入出力部13、入力部14、表示部15、通信部16、周辺機器I/F部17、データベース5等がバス18を介して接続されて構成される。また、通信部16は、ネットワーク3に接続される。なお、データベース5は、ネットワーク3を介して通信接続される構成としてもよい。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Accsess Memory)等により構成される。
CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各部を駆動制御する。ROMは、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部11が後述する各種処理を行うために使用するワークエリアを備える。
記憶部12は、HDD(ハードディスクドライブ)であり、制御部11が実行するプログラムや、プログラム実行に必要なデータ、OS(オペレーティング・システム)等が格納されている。これらのプログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行される。
メディア入出力部13は、例えば、フロッピー(登録商標)ディスクドライブ、PDドライブ、CDドライブ、DVDドライブ、MOドライブ等のメディア入出力装置であり、データの入出力を行う。
入力部14は、例えば、キーボード、マウス、タッチパネル、タブレット等のポインティング・デバイス、テンキー等の入力装置であり、入力されたデータを制御部11へ出力する。本実施の形態では、マウス、タッチパネル、またはタブレット等のポインティング・デバイスを利用して、手書き画像が入力される。特に、後述するように、なぞり書き画像を入力する際には、入力装置と表示装置とが一体的に設けられているタッチパネルが好適である。
表示部15は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部11の制御により入力された表示情報をディスプレイ装置上に表示させる。
周辺機器I/F(インタフェース)部17は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部17を介してコンピュータは周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USBやIEEE1394やRS−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
通信部17は、通信制御装置、通信ポート等を有し、ネットワーク3との通信を媒介する通信インタフェースであり、通信制御を行う。
バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
データベース5は、複数の3次元形状モデル50と、それらの各3次元形状モデル50の形状に関する少なくとも2種類の特徴量と、が記憶される。また、必要に応じて、特徴量抽出のために用いられる各3次元形状モデル50の2次元投影画像51や、その投影角度情報52を格納するようにしてもよい。後述する類似検索の精度を向上するために、各3次元形状モデル50の2次元形状特徴量53,54は、複数の投影方向から投影された2次元画像を元に算出され、格納されることが望ましい。
図2に示すように、本実施の形態のデータベース5は、各3次元形状モデル50の形状に関する少なくとも2種類の特徴量として、2種類の2次元形状特徴量53,54を少なくとも保持する。より好適には、2次元形状特徴量53,54に加え、3次元形状特徴量55を保持する。
具体的には、2次元形状特徴量53,54には、3次元形状モデル50の2次元投影画像51から算出される画素連結性ヒストグラム53及び半径ヒストグラム54が含まれる。
画素連結性ヒストグラム53とは、2次元投影画像51の輪郭線の連結方向の傾向を表す特徴量である。すなわち、画素連結性ヒストグラム53は、輪郭線上の注目画素に隣接する例えば8方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である(図7参照)。
半径ヒストグラム54とは、2次元投影画像51の全体形状の特徴を表す量である。2次元投影画像51のシルエット画像(輪郭線内を塗りつぶした画像)の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数(度数)を集積した度数分布である(図8参照)。
画素連結性ヒストグラム53及び半径ヒストグラム54については後述する。
3次元形状特徴量55には、3次元形状モデル50をボクセル変換したボクセルモデルの重心から3次元形状モデル領域内の各ボクセルまでの距離について、距離毎に該当する画素の数(度数)を集積したヒストグラムを用いる。このヒストグラムは、上述の半径ヒストグラム54を3次元に拡張した量であり、3次元形状モデル50の全体形状の特徴を表すものである。
なお、データベース5に予め記憶される各特徴量53,54,55は、後述する3次元形状モデル検索処理において、手書き画像との類似度の算出に用いられるため、正規化されて記憶されていることが望ましい。
次に、3次元形状検索装置1の実行する3次元形状モデル検索処理について図3〜図9を参照して説明する。
なお、以下のフローチャートに含まれる処理は、コンピュータにより読み取り可能なプログラムの形式で記述される。すなわち、3次元形状検索装置1の制御部11は、制御部12から当該プログラムを読み込み、以下の各処理を実行する。
まず、全体の流れとして、本実施の形態の3次元形状検索装置1は、以下の3つの流れの検索処理を行う。
第1の流れは、検索キーとなる2次元画像が手書き入力されると(ステップS1)、制御部11は、入力された2次元画像から形状に関する少なくとも2種類の2次元形状特徴量(画素連結性ヒストグラム、半径ヒストグラム)を抽出し(ステップS2)、抽出した2次元形状特徴量に基づいて、データベース5内に予め記憶されている全て、或いは所定の絞込み検索条件で絞り込まれた3次元形状モデル50から、入力された2次元画像と類似する特徴量を有するものを検索し(ステップS3;No→ステップS4)、検索結果を表示する(ステップS5)ものである。
第2の流れは、第1の流れの処理に加え、更に、手書き入力された2次元画像を元にユーザが3次元形状モデルを生成すると(ステップS3;Yes→ステップS7)、制御部11は、生成された3次元形状モデルについての3次元形状特徴量を求め(ステップS8)、3次元形状特徴量と上述の少なくとも2種類の2次元形状特徴量とを用いて、データベース5から、手書き入力された2次元画像及び生成された3次元形状モデルと類似する3次元形状モデルを検索し(ステップS4)、表示する(ステップS5)ものである。
第3の流れは、第1の流れのステップS5にて表示された検索結果から、ユーザにより選択された3次元形状モデル(ステップS6)を、更に検索キーに加え、再検索を行うものである。すなわち、ステップS6にて選択された3次元形状モデルについて、制御部11は更に3次元形状に関する特徴量を抽出し(ステップS8)、抽出した3次元形状に関する特徴量と、上述の少なくとも2つの2次元形状特徴量と、に基づいて、データベース5内に予め記憶されている全て、或いは所定の絞込み検索条件で絞り込まれた3次元形状モデル50の中から、選択された3次元形状モデルと類似するものを再検索し(ステップS4)、検索結果を表示する(ステップS5)。
以下、各ステップの処理を詳細に説明する。
まず、ステップS1の2次元画像の入力処理について、図4及び図5を参照して説明する。図4に示すように、2次元画像の入力方法は、デジタルカメラやスキャナ等の周辺機器または記憶部12から写真等の2次元画像データを取り込んで、2次元画像データ内の所望の物体の輪郭線をなぞり書き入力する手法(ステップS11〜S14)、またはユーザが自由に線を入力する手法(ステップS15)のいずれを用いてもよい。
輪郭線をなぞり書き入力する場合、まず、ユーザにより画像データの取り込みが選択される(ステップS11;Yes)。すると制御部11は、デジタルカメラ等にて撮影した画像データやスキャナにて読み込んだ画像データを記憶部12または周辺機器I/F部17から取り込み(ステップS12)、表示部15に表示する。その後、タッチパネル等の入力装置を用いて、取り込まれた画像の輪郭線がなぞり書き入力されると(ステップS13)、制御部11は、入力された輪郭線の補正処理を行う(ステップS14)。
図5に、取り込まれた画像60と、なぞり書き入力された輪郭線65とを示す。
ステップS14の輪郭線補正処理において、制御部11は、まず、取り込んだ画像60のエッジ抽出処理を行う。エッジとは、隣り合う画素の画素値の差が所定の基準値より大きい画素である。例えば、図5に示す画像では、テーブルとメガネ62との境界、メガネ62のレンズとフレームとの境界、テーブルとキーボード61との境界等がエッジ抽出処理により抽出される。
制御部11は、手書きにてなぞり書き入力された線65の各点を、抽出したエッジのうち最も近いエッジ(画素)に一致するように移動して、輪郭線補正する。
また、ユーザが自由に線を入力する場合は(ステップS11;No)、タブレットやマウス等の入力機器を用いて任意の物体の輪郭線65が手書き入力される(ステップS15)。
次に、ステップS2の2次元形状特徴抽出処理について、図6〜図8を参照して説明する。図6は2次元形状特徴抽出処理の流れを示すフローチャート、図7は画素連結性ヒストグラムについて説明する図、図8は半径ヒストグラムについて説明する図である。
図6に示す2次元形状特徴抽出処理では、制御部11は、まず入力された画像である輪郭線65内の領域を塗りつぶし、シルエット画像81を生成する(ステップS21;図8参照)。また、制御部11は、輪郭線65について輪郭線追跡処理を行って画素連結性ヒストグラムCHを求める(ステップS22;図7参照)。また、ステップS31にて生成したシルエット画像81から半径ヒストグラムRHを求める(ステップS23;図8参照)。
手書き入力された画像から求められる画素連結性ヒストグラムCH及び半径ヒストグラムRHは、データベース5に保持されている画素連結性ヒストグラム53及び半径ヒストグラム54と同様の方法で求められるものであるが、手書き入力画像から算出されたものか、3次元形状モデル50から算出されデータベース5内に保持されているものかを区別するため、以下の説明では異なる符号を付すものとする。
画素連結性ヒストグラムCHは、ステップS1の入力処理にて入力された画像の輪郭線65を任意の開始点P1から追跡することにより求められる。すなわち、制御部11は、図7(a)に示すように輪郭線65上に設定される任意の開始点P1から、輪郭線65上の着目画素の隣接する例えば8方向(図7(b)のv1,v2,v3,v4,v5,v6,v7,v8)の画素について、いずれの方向に次の輪郭線65上の画素が出現するかを調べ(図7(c))、その出現度数Iを方向別(v1,v2,v3,v4,v5,v6,v7,v8)に集積することにより、図7(d)に示すような画素連結性ヒストグラムCHを求める。
入力された輪郭線65が太く、複数画素にまたがるような場合には、線入力時においてタッチパネル上で指示した画素を輪郭線65の太さの中心(芯)として細線化すればよい。
半径ヒストグラムRHは、ステップS1の入力処理にて入力された画像のシルエット画像81(輪郭線65内を塗りつぶした画像;図8(a))に対して重心を中心とするRing Transformを実行し(図8(b))、塗りつぶされた画素の存在する範囲を調べることにより求められる。すなわち、制御部11は、シルエット画像81内の各画素とシルエット画像81の重心との距離rを求め、距離別(1,2,3,・・・,n−1,n)の画素数(度数)を集積することにより、図8(c)に示すような半径ヒストグラムRHを求める。
なお、後の処理で類似度を計算するため、ステップS2にて算出される2次元形状特徴量CH,RHは正規化される。
ステップS2(図6のステップS21〜ステップS23)の2次元形状特徴抽出処理により、手書き入力された輪郭線65(2次元画像)について、形状に関する少なくとも2種類の2次元形状特徴量(上述の画素連結性ヒストグラムCH及び半径ヒストグラムRH)が求められると、この段階で、制御部11は、ユーザに3次元形状モデルを生成するか否かを選択させる(ステップS3)。
3次元形状モデルを生成しない場合は(ステップS3;No(第1の流れ))、制御部11は、データベース5内に格納されている3次元形状モデル50から、算出した2次元形状特徴量CH,RHと類似する2次元形状特徴量53,54を有する3次元形状モデル50を検索する(ステップS4)。
すなわち、制御部11は、ステップS2にて算出した2次元形状特徴量(画素連結性ヒストグラムCH及び半径ヒストグラムRH)と、データベース5に格納されている各3次元形状モデル50についての2次元形状特徴量(画素連結性ヒストグラム53,半径ヒストグラム54)との類似度を算出する。そして、類似度の大きい3次元形状モデル50を1つ以上提示する(ステップS5)。
検索対象は、データベース5内の全ての3次元形状モデル50としてもよいし、例えばモデル形状カテゴリ、モデル登録日時等の絞込み検索条件を設定して、その条件に合致する3次元形状モデル50としてもよい。
また、類似度は、一般に用いられている類似度の算出法を用いて算出できる。例えば、特徴量である画素連結性ヒストグラムや半径ヒストグラムの各度数を各次元の値として表現したベクトル(以下、特徴ベクトルという)を、入力画像とデータベース5内の比較対象となる全ての3次元形状モデル50とについてそれぞれ生成し、入力画像の特徴ベクトルと、各3次元形状モデル50の特徴ベクトルとのベクトル間距離を演算することにより類似度が計算される。この場合、算出したベクトル間距離が小さいものが、類似度が大きいものとなる。
手書き入力された2次元画像を元とする3次元形状モデルを生成した後に類似検索を行う場合は(ステップS3;Yes(第2の流れ))、ステップS7の3次元形状モデル生成処理へ移行する。
手書き入力された輪郭線65から3次元形状モデルを生成する方法については、周知の手法を用いればよい。例えば、特開平6−149943号公報に示すように、輪郭線の各部に断面形状を設定して3次元形状を生成したり、上述の非特許文献1に示すように、輪郭線の芯線を求め、その芯線を持ち上げて輪郭線と芯線とを包む図形を生成する手法を用いたりすればよい。
ステップS7の処理により3次元形状モデルが生成されると、制御部11は選択された3次元形状モデルについて、3次元形状に関する特徴量(以下、3次元形状特徴量)を抽出する(ステップS8)。
図9に、3次元形状特徴量を抽出する処理の流れを示す。
図9に示すように、3次元形状特徴量を抽出する際、制御部11は、入力された3次元形状モデル(ステップS81)について、ボクセル変換を行う(ステップS82)。3次元形状モデルはサーフェスモデルにて生成、格納されるため、このボクセル変換処理により、表面形状のみが定義された3次元形状モデルを、3次元形状モデル内部の各ボクセルを塗りつぶしたボクセルモデルとする。そして、ボクセルモデルの重心から塗りつぶされた各ボクセルまでの距離を算出し(ステップS83)、距離毎のボクセル数を度数とするヒストグラムを求める(Sphere Transform)。このヒストグラムを3次元形状特徴量とする。
そして、制御部11は、ステップS2にて算出した2次元形状特徴量(画素連結性ヒストグラムCH及び半径ヒストグラムRH)及びステップS8にて算出した3次元形状特徴量と、データベース5に格納されている各3次元形状モデル50についての2次元形状特徴量(画素連結性ヒストグラム53,半径ヒストグラム54)及びその3次元形状モデル50の3次元形状特徴量55との類似度を算出する。そして、類似度の大きい3次元形状モデル50を1つ以上提示する(ステップS5)。類似度は、上述のように特徴ベクトルの距離を算出することにより求められる。
次に、ステップS5にて提示された検索結果となる3次元形状モデルから再検索のキーとする3次元形状モデルが選択されると(ステップS6;Yes;第3の流れ)、制御部11は選択された3次元形状モデルについて、3次元形状に関する特徴量(以下、3次元形状特徴量)を抽出する(ステップS8)。
3次元形状特徴量を抽出する処理は上述のステップS81〜ステップS83の処理と同様である。
そして、制御部11は、ステップS2にて算出した2次元形状特徴量(画素連結性ヒストグラムCH及び半径ヒストグラムRH)及びステップS8にて算出した3次元形状特徴量と、データベース5に格納されている各3次元形状モデル50の各投影画像についての2次元形状特徴量(画素連結性ヒストグラム53,半径ヒストグラム54)及びその3次元形状モデル50についての3次元形状特徴量55との類似度を算出する。そして、類似度の大きい3次元形状モデル50を1つ以上提示する(ステップS5)。類似度は、上述のように特徴ベクトルを算出することにより求められる。
検索結果について再検索を行わない場合は(ステップS6;No)、一連の3次元形状モデル検索処理を終了する。
以上説明したように、本実施の形態の3次元形状検索装置1は、データベース5に複数の3次元形状モデル50と、その形状に関する少なくとも2種類の特徴量(画素連結性ヒストグラム53、半径ヒストグラム54)とを記憶しておき、任意の物体の手書き画像65(輪郭線65や自由線)が入力されると、入力された手書き画像65の形状に関する少なくとも2種類の特徴量(画素連結性ヒストグラムCH、半径ヒストグラムRH)を算出し、これらの特徴量に基づいて、データベース5から手書き画像65に類似する3次元形状モデル50を検索して検索結果を表示する。
従って、形状に関する少なくとも2種類の特徴量に基づいて、類似する3次元形状モデルを検索し、提示するので、手書きの2次元画像から容易かつ高精度に、類似する3次元モデルを検索できる。特に、形状について精度よく検索できる。
また、手書き画像65は、デジタルカメラやスキャナ等から取り込まれた画像の輪郭をなぞり書きしたなぞり書き画像でもよく、なぞり書きした輪郭線65については、元の画像(取り込まれた写真等の画像)から抽出されるエッジ形状に沿うように補正処理を施すようにしてもよい。この場合は、デジタルカメラ等から取り込んだ写真や元となる絵画等の2次元画像から、輪郭線65をなぞり書きするという簡単かつユーザの画力に依存しない方法で、検索キーとなる2次元画像を入力できる。また、輪郭線65は元の2次元画像のエッジ形状に沿うように補正されるので、正確な輪郭線を入力でき、検索の精度を向上させることができる。
また、取り込まれた画像の輪郭をなぞり書きすることで、様々な物体画像が含まれる例えばスナップ写真のような一般に入手しやすい画像データから、所望の物体画像のみを簡単かつ効率よく入力することができる。
また、3次元形状検索装置1において、入力された手書き画像に基づいて3次元形状モデルを生成し、生成された3次元形状モデルについて3次元形状に関する特徴量を抽出し、上述の少なくとも2種類の2次元形状特徴量に加え、更に、3次元形状に関する特徴量に基づいて、データベース5から手書き画像に類似する3次元形状モデル50を検索することも可能である。
これにより、手書きの2次元画像に基づいて簡単な3次元形状モデルを生成した後に、2次元及び3次元の形状に関する特徴量を考慮して、データベース5内の類似する完成された3次元形状モデルを検索できるので、検索の精度が向上し、CG制作の作業効率が向上する。
また、3次元形状検索装置1において、検索結果として提示された3次元形状モデルのうち、ユーザにより選択された3次元形状モデルについて3次元形状に関する特徴量を抽出し、上述の少なくとも2種類の特徴量に加え、更に、3次元形状に関する特徴量に基づいて、データベース5から手書き画像に類似する3次元形状モデルを再検索することも可能である。
これにより、手書きの画像に類似する3次元形状モデルを更に検索キーに加えることが可能となり、また、2次元及び3次元の形状に関する特徴量を考慮してデータベース5内から類似する3次元モデルを再検索するので、検索の精度が向上し、所望の検索結果を効率よく導出できる。
以上、本発明に係る3次元形状検索装置について説明したが、本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態では、3次元形状検索装置がコンピュータにより実現される例を示したが、これに限定されず、ゲーム機、PDA、携帯電話等の電子機器により実現されるものとしてもよい。その他、当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1・・・・3次元形状検索装置
5・・・・データベース
50・・・3次元形状モデル
51・・・3次元形状モデルの2次元投影画像
52・・・投影角度情報
53・・・画素連結性ヒストグラム(データベース5に格納されたもの)
54・・・半径ヒストグラム(データベース5に格納されたもの)
55・・・3次元形状特徴量
60・・・入力画像
62・・・手書き入力したい物体
65・・・手書き輪郭線
81・・・シルエット画像
11・・・制御部
12・・・記憶部
13・・・メディア入出力部
14・・・入力部
15・・・表示部
16・・・通信部
17・・・周辺機器1/F部
18・・・バス
CH・・・画素連結性ヒストグラム(入力画像から算出されるもの)
RH・・・半径ヒストグラム(入力画像から算出されるもの)

Claims (6)

  1. 複数の3次元形状モデルと、前記3次元形状モデルの2次元投影画像から算出される2種類の特徴量として、前記2次元投影画像の輪郭線上の注目画素に隣接する複数の方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である画素連結性ヒストグラム、及び前記2次元投影画像の輪郭線内を塗りつぶした画像の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数を集積した度数分布である半径ヒストグラムとを予め記憶するデータベースと、
    任意の物体の手書き画像を入力する入力手段と、
    前記入力手段により入力された手書き画像について、前記画素連結性ヒストグラム及び前記半径ヒストグラムを抽出する特徴量抽出手段と、
    前記特徴量抽出手段により抽出される前記画素連結性ヒストグラム及び前記半径ヒストグラムに基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを検索する検索手段と、
    前記検索手段による検索結果を提示する提示手段と、
    を備えることを特徴とする3次元形状検索装置。
  2. 前記入力手段は、
    前記物体を含む2次元画像データを取り込む2次元画像データ取り込み手段と、
    前記2次元画像データ取り込み手段により取り込まれた2次元画像データを基に前記物体の輪郭線をなぞり書き入力する輪郭線入力手段と、
    前記輪郭線入力手段により入力された輪郭線を、前記2次元画像データから抽出されるエッジ形状に沿うように補正する補正手段と、
    を更に備えることを特徴とする請求項1に記載の3次元形状検索装置。
  3. 前記入力手段により入力された手書き画像に基づいて3次元形状モデルを生成する3次元形状モデル生成手段と、
    前記3次元形状モデル生成手段により生成された3次元形状モデルについて、前記3次元形状モデルをボクセル変換したボクセルモデルの重心から前記3次元形状モデル領域内の各ボクセルまでの距離について、距離毎に該当する画素の数を集積したヒストグラムである3次元形状特徴量を抽出する3次元形状特徴量抽出手段と、を更に備え、
    前記データベースは、更に、複数の前記3次元形状モデルの前記3次元形状特徴量を予め記憶し、
    前記検索手段は、前記画素連結性ヒストグラム及び前記半径ヒストグラムに加え、更に、前記3次元形状特徴量抽出手段により抽出された前記3次元形状特徴量に基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを検索することを特徴とする請求項1に記載の3次元形状検索装置。
  4. 前記提示手段により提示された3次元形状モデルのうち、ユーザにより選択された3次元形状モデルについて、前記3次元形状モデルをボクセル変換したボクセルモデルの重心から前記3次元形状モデル領域内の各ボクセルまでの距離について、距離毎に該当する画素の数を集積したヒストグラムである3次元形状特徴量を抽出する3次元形状特徴量抽出手段を更に備え、
    前記データベースは、更に、複数の前記3次元形状モデルの前記3次元形状特徴量を予め記憶し、
    前記検索手段は、前記画素連結性ヒストグラム及び前記半径ヒストグラムに加え、更に、前記3次元形状特徴量抽出手段により抽出された前記3次元形状特徴量に基づいて、前記データベースから前記手書き画像に類似する3次元形状モデルを再検索することを特徴とする請求項1に記載の3次元形状検索装置。
  5. コンピュータにより実行される3次元形状検索方法であって、
    コンピュータの制御部が、任意の物体の手書き画像を入力する入力ステップと、
    前記制御部が、入力された手書き画像について、前記手書き画像の輪郭線上の注目画素に隣接する複数の方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である画素連結性ヒストグラム、及び前記手書き画像の輪郭線内を塗りつぶした画像の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数を集積した度数分布である半径ヒストグラムを抽出する特徴量抽出ステップと、
    前記制御部が、複数の3次元形状モデルと、前記3次元形状モデルの2次元投影画像から算出される2種類の特徴量として、前記画素連結性ヒストグラム及び前記半径ヒストグラムとを予め記憶したデータベースから、前記画素連結性ヒストグラム及び前記半径ヒストグラムに基づいて、前記手書き画像に類似する3次元形状モデルを検索する検索ステップと、
    前記制御部が、検索結果を提示する提示ステップと、
    を含むことを特徴とする3次元形状検索方法。
  6. コンピュータにより読み取り可能な形式で記述されたプログラムであって、
    任意の物体の手書き画像を入力する入力ステップと、
    入力された手書き画像について、前記手書き画像の輪郭線上の注目画素に隣接する複数の方向の画素のうち、いずれの方向に次の輪郭線上の画素が出現するかを示した度数分布である画素連結性ヒストグラム、及び前記手書き画像の輪郭線内を塗りつぶした画像の重心から輪郭線内の各画素までの距離について、距離毎に該当する画素の数を集積した度数分布である半径ヒストグラムを抽出する特徴量抽出ステップと、
    複数の3次元形状モデルと、前記3次元形状モデルの2次元投影画像から算出される2種類の特徴量として、前記画素連結性ヒストグラム及び前記半径ヒストグラムとを予め記憶したデータベースから、前記画素連結性ヒストグラム及び前記半径ヒストグラムに基づいて、前記手書き画像に類似する3次元形状モデルを検索する検索ステップと、
    検索結果を提示する提示ステップと、
    を含む処理をコンピュータに実行させるためのプログラム。
JP2010132612A 2010-06-10 2010-06-10 3次元形状検索装置、3次元形状検索方法、及びプログラム Expired - Fee Related JP5560925B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010132612A JP5560925B2 (ja) 2010-06-10 2010-06-10 3次元形状検索装置、3次元形状検索方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010132612A JP5560925B2 (ja) 2010-06-10 2010-06-10 3次元形状検索装置、3次元形状検索方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011258036A JP2011258036A (ja) 2011-12-22
JP5560925B2 true JP5560925B2 (ja) 2014-07-30

Family

ID=45474134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010132612A Expired - Fee Related JP5560925B2 (ja) 2010-06-10 2010-06-10 3次元形状検索装置、3次元形状検索方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5560925B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6511959B2 (ja) * 2015-05-26 2019-05-15 大日本印刷株式会社 立体物造形用データ出力規制装置
JP6540238B2 (ja) * 2015-06-02 2019-07-10 大日本印刷株式会社 立体物造形用データ出力規制装置
JP6942330B2 (ja) * 2017-03-06 2021-09-29 国立大学法人豊橋技術科学大学 画像特徴量及びそれを用いる三次元形状検索システム
CN108021683B (zh) * 2017-12-11 2021-06-22 首都航天机械公司 一种基于三维标注的相似模型检索实现方法
CN109242978B (zh) * 2018-08-21 2023-07-07 百度在线网络技术(北京)有限公司 三维模型的视角调整方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737107A (ja) * 1993-06-29 1995-02-07 Ge Yokogawa Medical Syst Ltd 輪郭線修正方法および装置
JP2002288687A (ja) * 2001-03-22 2002-10-04 Olympus Optical Co Ltd 特徴量算出装置および方法
JP2004164503A (ja) * 2002-11-15 2004-06-10 Olympus Corp 三次元モデル検索方法、三次元モデル検索装置、三次元モデル検索プログラム、及び三次元モデル検索システム
JP2006285627A (ja) * 2005-03-31 2006-10-19 Hokkaido Univ 3次元モデルの類似検索装置及び方法
JP4946878B2 (ja) * 2008-01-10 2012-06-06 株式会社豊田中央研究所 画像識別装置及びプログラム

Also Published As

Publication number Publication date
JP2011258036A (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
WO2021036059A1 (zh) 图像转换模型训练方法、异质人脸识别方法、装置及设备
US10268917B2 (en) Pre-segment point cloud data to run real-time shape extraction faster
CN109960742B (zh) 局部信息的搜索方法及装置
CN110019914B (zh) 一种支持三维场景交互的三维模型数据库检索方法
EP3992919B1 (en) Three-dimensional facial model generation method and apparatus, device, and medium
AU2018202767B2 (en) Data structure and algorithm for tag less search and svg retrieval
US20140047367A1 (en) Image processing apparatus, image processing method, and program
JP5560925B2 (ja) 3次元形状検索装置、3次元形状検索方法、及びプログラム
US20130148849A1 (en) Image processing device and method
US20190066311A1 (en) Object tracking
CN112927353A (zh) 基于二维目标检测和模型对齐的三维场景重建方法、存储介质及终端
JP2002288687A (ja) 特徴量算出装置および方法
CN110598715A (zh) 图像识别方法、装置、计算机设备及可读存储介质
CN110910433A (zh) 一种基于深度学习的点云匹配方法
WO2023056835A1 (zh) 视频封面生成方法、装置、电子设备及可读介质
CN107203962B (zh) 一种利用2d图片制作伪3d图像的方法及电子设备
KR101296734B1 (ko) 가우시안 혼합 모델 및 알지비 클러스터링을 이용한 오브젝트 분할방법
CN113688261B (zh) 图像数据清理方法、装置、电子设备及可读存储介质
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
CN113343987B (zh) 文本检测处理方法、装置、电子设备及存储介质
JP5051671B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2015184743A (ja) 画像処理装置および物体認識方法
CN103164504A (zh) 一种智能手机精细化图片搜索系统及方法
EP3115927A1 (en) Method and apparatus for processing a scene
US11508083B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140526

R150 Certificate of patent or registration of utility model

Ref document number: 5560925

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees