JP2005044211A - 奥行情報を含んだ画像の分類・検索方法および装置ならびにプログラム - Google Patents

奥行情報を含んだ画像の分類・検索方法および装置ならびにプログラム Download PDF

Info

Publication number
JP2005044211A
JP2005044211A JP2003278937A JP2003278937A JP2005044211A JP 2005044211 A JP2005044211 A JP 2005044211A JP 2003278937 A JP2003278937 A JP 2003278937A JP 2003278937 A JP2003278937 A JP 2003278937A JP 2005044211 A JP2005044211 A JP 2005044211A
Authority
JP
Japan
Prior art keywords
image
depth information
matrix
identifier
template matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003278937A
Other languages
English (en)
Other versions
JP4205517B2 (ja
Inventor
Masahiro Yuguchi
昌宏 湯口
Yoshinobu Tonomura
佳伸 外村
Ken Tsutsuguchi
拳 筒口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003278937A priority Critical patent/JP4205517B2/ja
Publication of JP2005044211A publication Critical patent/JP2005044211A/ja
Application granted granted Critical
Publication of JP4205517B2 publication Critical patent/JP4205517B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 奥行情報が付加された画像の分類を容易に行なう。
【解決手段】 画像入力部101は、奥行情報を含む画像を画像記憶部102に保存する。領域分割部103は保存された画像を複数の領域に区分する。領域代表値決定部104は各領域に含まれる奥行情報と画像全体での奥行情報とを比較することで、各領域に対する代表値を決定する。相関性検出部105は、各領域の代表値を行列の要素とみなし、画像全体に対する奥行特徴行列を算出することで、テンプレート行列との相関性を検出する。識別子付与部107は、相関性が最も高いテンプレート行列の有する一意的なIDレコードまたはテンプレート行列そのものを画像の識別子として、入力された画像に付与する。画像出力部108は、識別子が付与された画像を出力する。
【選択図】 図1

Description

本発明は、奥行情報を含んだ画像の分類および検索を行う方法、装置に関する。
従来、画像の分類方法としては色情報が主に用いられている(特許文献1)。また、他の手段としては、ファイル形式やメタデータ等が利用されている。しかしながら、画像の奥行という構造的な面からの分類方法は、従来手法では複雑な処理が必要となり、簡易な分類を行うことは困難であった。
特開2003−067764号公報
本発明の目的は、従来の方法では複雑な処理が必要であった画像の構造的な側面からの画像分類の奥行方向の凹凸分布での画像分類が容易な画像分類方法および装置を提供することにある。
本発明の他の目的は、上記画像分類方法を用いた画像検索方法および装置を提供することにある。
本明細書において、以下の記述を簡易化するために、画像をいくつかの領域に分割し、その領域の代表値としてある値を与え、前記分割された領域を行列と見なし、代表値を行列の要素とするとき、この要素によって構成される行列を画像の「特徴行列」と称し、画像を風景画像や人物画像などに分類を行う際、それらのカテゴリで代表的となる特徴行列を「テンプレート行列」と称する。
本発明の画像分類方法は、
奥行情報を含んだ画像をメモリに保存するステップと、
保存されたデータを、複数の領域に分割するステップと、
各領域に含まれる画像全体での奥行情報を比較することで、各領域に対する代表値を決定するステップと、
各領域の代表値を行列の要素として見なし、画像全体に対する奥行特徴行列を算出し、該奥行特徴行列各テンプレート行列との相関を検出するステップと、
相関性が最も高いテンプレート行列の有する一意的なIDコードまたは該テンプレート行列そのものを画像の識別子として、入力された画像に付加する識別子付与ステップと、
識別子が付与された画像を出力するステップを有する。
本発明の画像検索方法は、
画像を入力するし、上記画像分類方法によりテンプレート行列に一意に定まる識別子を求めるステップと、
求められた識別子に基づいて画像データベースから類似画像を検索するステップと、
検索結果を出力するステップを有する。
本発明の他の画像検索方法は、
テンプレート行列を入力し、該テンプレート行列に対して一意に定まる識別子を求めるステップと、
求められた識別子に基づいて画像データベースから類似画像を検索するステップと、
結果を出力するステップを有する。
請求項1と4と7の発明は、従来は色やメタデータによって分類を行っていた奥行情報のついた画像を、奥行情報を利用することによって、より容易に分類することが可能となる。
また、請求項2、3、5〜7の発明は、従来、画像の検索を行う場合、画像データに付加されたメタデータや色、形状、ファイル形式によって検索を行っていたため、ユーザは求めたい画像を取得するまでに検索のキーワードを選択したり、大量の画像を見る必要があり、時間や手間がかかっていたが、本発明を利用することによって、色や形だけでなく、画像の構造という情報を含んだ検索が可能となり、従来よりも容易に、ユーザの求めるものに近い画像を検索することが可能となる。
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明の一実施形態の画像分類装置の構成図である。本実施形態の画像分類装置は画像入力部101と画像記憶部102と領域区分部103と領域代表値決定部104と相関性検出部105とテンプレート行列記憶部106と識別子付与部107と画像出力部108とから構成されている。
画像入力部101は、色情報のみならず奥行情報を含む画像を入力し、画像記憶部102に保存する。たとえば、色の情報として、赤、緑、青の3色の輝度に関する値がR、G、Bと与えられるとき、画素ごとに[R,G,B]として表される。この表現のように色情報に奥行の値Zを付加して、[R,G,B,Z]と表すことが可能であるとする。
領域区分部103は保存された画像を複数の領域に分割する。画像の分割の方法としては、図2に示すように複数の分割方法が考えられる。201のように、縦横に複数の四角形の領域に分割する方法や、202のように画像に対して斜め方向に複数の四角形の領域に分割する方法、また、203のように複数の六角形の領域に分割する方法が考えられるが、分割方法は画像の入力を行う以前に決定されているものとする。また、分割数に関しても、同様に複数の方法が考えられるが、この分割数も分割領域と同じく、画像入力以前に決定されているものとする。計算上のコストを考慮すると、領域の分割数は画像のピクセル数に対して十分小さいものが望ましく、簡易な分割を行うためには、縦横に3×3や3×5などに大まかに分割することが望ましい。また、分割数は、画像の大きさに関わらず一定とする。
領域代表値決定部104は分割された領域に対して代表値を決定する。図3は代表値を決定する方法を示した図である。ここでは、奥行情報のヒストグラム分布を利用した代表値決定方法について説明する。301に示されるように、画像全体の奥行のヒストグラムを形成し、その平均値をZavとしたとき、その値を求める。ここで、例として奥行情報はカメラのレンズ中心からの距離を取るものとし、単位としてmの値を持ち、常に正値を取るものとする。よって奥行値は、カメラレンズ中心から0mの位置から、Zの取りうる最大値までもつものとする。次に、各分割された領域に関して、302に示されるように、奥行ヒストグラムを形成する。形成された奥行ヒトグラムを画像全体の奥行ヒストグラムの平均値Zavとを比較し、領域内の奥行ヒストグラムの平均値がZavよりも大きい値となるときには、領域の代表値として−1の値を与える。また、領域の平均値がZavの値に近い値である場合、領域の代表値として0を与える。そして、領域の平均値がZavよりも小さい値である場合は、代表値として1を与えるものとする。もしくは、撮影点から10mまでの範囲、10mから100mまでの範囲、それ以上の範囲というように、前記分割された領域における奥行方向の閾値を画像を入力する以前に決定しておき、これを利用して奥行情報を分類し、前記分割領域の代表値を決定してもよい。
相関性検出部105は図4に示すように、領域代表値決定部104で決定された各領域の代表値から画像の奥行特徴行列を作成し、テンプレート行列記憶部106中のテンプレート行列との相関を求める。テンプレート行列と、奥行特徴行列の行、列における要素数は同じものであるとする。この要素数は、画像を入力する以前に決定されているものとする。奥行特徴行列とテンプレート行列との相関を求める手法としては、多数考えられるが、例としては、奥行特徴行列とテンプレート行列との差を求めた後、この行列式を求める、という手法でもよい。このとき、値が0に近いほど、奥行特徴行列とテンプレート行列とが類似した行列であるということができる。ここでは、奥行特徴行列とテンプレート行列とがどれだけ似ているか、ということを計算結果として求められる方法であればよい。
識別子付与部107は図5に示すように、相関性検出部105にて検出された、相似性が最も高いテンプレート行列を画像の識別子として、入力された画像に付加する。この際、テンプレート行列そのものを画像に付加してもよいし、テンプレート行列に対して一意となるIDのようなものを画像に付加してもよい。付加する手法としては、電子透かしのように画素そのものに埋め込むという方法も考えられ、また、画像そのものの構造を壊さないような方法でデータを付加するという方法も考えられる。例えば、データのヘッダ部分にデータを付与したり、XML(eXtensibe Markup Language)を用いて別ファイルのようにデータを画像に関連付けを行えば、画像そのものは変質することなく、分類に関する情報を付加することが可能となる。このようにして付加された情報は画像のメタデータの一部として利用してもよい。この結果、付加された識別子によって、入力された画像がどのような奥行情報を含んだ画像であるか分類することが可能となる。
画像出力部108は、識別子が付与された画像をディスプレイ、プリンタ等の出力装置に出力する。
次に、本発明の他の実施形態として、構造的に類似する画像を検索する画像検索装置を図6に示す。画像検索装置は画像/テンプレート行列入力部601と画像分類装置602と識別子決定部603と類似画像検索部603と検索結果出力部605と画像データベース606とから構成されている。
画像/テンプレート行列入力部601を用いて、ユーザは、検索したい画像の構造に類似した、奥行情報を含んだ画像を選択するか、または、ユーザが検索しようとする画像の構造に近いテンプレート行列を選択する。
ユーザが奥行情報を含んだ画像を入力した場合、図1の画像分類装置602を用いて画像の分類を行い、識別子付与までを行い、ユーザが入力した画像を表すテンプレート行列に一意に対応する識別子が出力される。画像/テンプレート行列入力部601にてテンプレート行列が入力された場合は、テンプレート行列に一意に対応する識別子が決まっているため、画像分類装置602の処理は行わなくともよい。
識別子決定部603にて、入力された画像に対する識別子、または、ユーザが入力したテンプレート行列の識別子が決定される。
類似画像検索部604では、識別子決定部603にて決定された識別子に一致する識別子が付けられている画像を、画像データベース606中から検索する。このとき、検索の基準として画像の奥行方向だけでなく、色の分布に関する情報も利用することによって、ユーザの求める画像の検索精度を上げることも可能である。
他にも、ユーザが選択したテンプレート行列の識別子に一致するもののみを検索対象にするだけではなく、類似したものも含めて検索対象としてもよい。なぜなら、テンプレート行列が含まれている空間を考えた場合、画像に含まれる構造が類似したテンプレート行列が偏りをもって存在していると考えられるため、この分布の偏りを参考として、ユーザが選択したテンプレート行列に近い空間に分布する他のテンプレート行列も検索の対象とすることができるため、画像の検索対象を広げることが可能となる。
検索結果出力部605にて、類似画像検索部604で検索された結果をディスプレイ、プリンタ等に出力する。
なお、本発明の画像分類方法、画像検索方法は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フロッピーディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。
本発明の一実施形態の画像分類装置の構成図である。 領域分割の例を示す図である。 領域代表値決定の手順を示す図である。 相関性検出の手順を示す図である。 識別子付与の説明図である。 本発明の他の実施形態の画像検索装置の構成図である。
符号の説明
101 画像入力部
102 画像記憶部
103 領域分割部
104 領域代表値決定部
105 相関性検出部
106 テンプレート行列記憶部
107 識別子付与部
108 画像出力部
201〜203 領域分割例
301 画像全体での奥行ヒストグラム
302 各領域の奥行ヒストグラム
303 領域代表値
601 画像/テンプレート行列入力部
602 画像分類装置
603 識別子決定部
604 類似画像検索部
605 検索結果出力部
606 画像データベース

Claims (7)

  1. 奥行情報を含んだ画像を、その奥行情報を元にして分類する方法であって、
    奥行情報を含む画像をメモリに保存するステップと、
    該画像を複数の領域に分割するステップと、
    前記各領域に含まれる奥行情報と、画像全体での奥行情報とを比較することで、各領域に対する代表値を決定するステップと、
    各領域の代表値を行列の要素として見なし、画像全体に対する奥行特徴行列を算出し、該奥行特徴行列と各テンプレート行列との相関性を検出するステップと、
    相関性が最も高いテンプレート行列の有する一意的なIDコード、または該テンプレート行列そのものを画像の識別子として、入力された画像に付与するステップと、
    識別子が付与された画像を出力するステップを有する、奥行情報を含んだ画像の分類方法。
  2. 奥行情報を含んだ画像を、その奥行情報を元にして画像データベースから検索する方法であって、
    画像を入力し、請求項1の分類方法によりテンプレート行列に一意に定まる識別子を求めるステップと、
    前記求められた識別子に基づいて画像データベースから類似画像を検索するステップと、
    検索結果を出力するステップを有する、奥行情報を含んだ画像の検索方法。
  3. 奥行情報を含んだ画像を、その奥行情報を元にして画像データベースから検索する方法であって、
    テンプレート行列を入力し、該テンプレート行列に対して一意に定まる識別子を求めるステップと、
    前記求められた識別子に基づいて画像データベースから類似画像を検索するステップと、
    検索結果を出力するステップを有する、奥行情報を含んだ画像の検索方法。
  4. 奥行情報を含んだ画像を、その奥行情報を元にして分類する装置であって、
    画像メモリと、
    奥行情報を含む画像を入力し、前記画像メモリに保存する手段と、
    画像を複数の領域に区分する手段と、
    前記各領域に含まれる奥行情報と、画像全体での奥行情報とを比較することで、区分された領域に対する代表値を決定する手段と、
    テンプレート行列を記憶したメモリと、
    各領域の代表値を行列の要素として見なし、画像全体に対する奥行特徴行列を算出し、該奥行特徴行列と各テンプレート行列との相関性を検出する手段と、
    相関性が最も高いテンプレート行列の有する一意的なIDコード、または該テンプレート行列そのものを画像の識別子として、入力された画像に付与する手段と、
    識別子が付与された画像を出力する手段を有する、奥行情報を含んだ画像の分類装置。
  5. 奥行情報を含んだ画像を、その奥行情報を元にして画像データベースから検索する装置であって、
    画像を請求項4の装置に入力して、テンプレート行列に一意に定まる識別子を求める手段と、
    前記求められた識別子に基づいて画像データベースから類似画像を検索する手段と、
    検索結果を出力する手段を有する、奥行情報を含んだ画像の検索装置。
  6. 奥行情報を含んだ画像を、その奥行情報を元にして画像データベースから検索する装置であって、
    テンプレート行列を入力することでテンプレート行列に対して一意に定まる識別子を求める手段と、
    前記求められた識別子に基づいて画像データベースから類似画像を検索する手段と、
    検索結果を出力する手段を有する、奥行情報を含んだ画像の検索装置。
  7. 請求項1から3のいずれかの方法をコンピュータで実行するためのプログラム。
JP2003278937A 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム Expired - Fee Related JP4205517B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003278937A JP4205517B2 (ja) 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003278937A JP4205517B2 (ja) 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2005044211A true JP2005044211A (ja) 2005-02-17
JP4205517B2 JP4205517B2 (ja) 2009-01-07

Family

ID=34265196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003278937A Expired - Fee Related JP4205517B2 (ja) 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4205517B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244424A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 映像シーン分類方法及び装置及びプログラム
JP2009220498A (ja) * 2008-03-18 2009-10-01 Fuji Xerox Co Ltd 連続紙給紙装置、画像形成装置およびプログラム
JP2012078942A (ja) * 2010-09-30 2012-04-19 Toshiba Corp デプス補正装置及び方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244424A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 映像シーン分類方法及び装置及びプログラム
JP2009220498A (ja) * 2008-03-18 2009-10-01 Fuji Xerox Co Ltd 連続紙給紙装置、画像形成装置およびプログラム
JP2012078942A (ja) * 2010-09-30 2012-04-19 Toshiba Corp デプス補正装置及び方法
US8761492B2 (en) 2010-09-30 2014-06-24 Kabushiki Kaisha Toshiba Depth correction apparatus and method

Also Published As

Publication number Publication date
JP4205517B2 (ja) 2009-01-07

Similar Documents

Publication Publication Date Title
US8107689B2 (en) Apparatus, method and computer program for processing information
JP4139615B2 (ja) 前景/背景セグメント化を用いた画像のイベント・クラスタリング
CN108881947B (zh) 一种直播流的侵权检测方法及装置
KR100799557B1 (ko) 동영상의 비주얼 특징을 이용한 유해 동영상 판별함수 생성및 판별 방법 그리고 그 장치
US8094935B2 (en) Representative color extracting method and apparatus based on human color sense and data histogram distributions
US8755603B2 (en) Information processing apparatus performing character recognition and correction and information processing method thereof
JP2005510775A (ja) コンテンツをカテゴリ化するためのカメラメタデータ
JP2010072708A (ja) 顔識別特徴量登録装置、顔識別特徴量登録方法、顔識別特徴量登録プログラム及び記録媒体
JP2008217428A (ja) 画像検索プログラム、方法及び装置
JP2003141540A (ja) 類似性判定装置及び類似性判定方法並びにプログラム
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
JP2004341940A (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
JP5634075B2 (ja) 画像のシーケンスを処理する方法および装置、画像データを処理する装置、ならびにコンピュータプログラム製品
JP2010250637A (ja) 画像サーバー、画像検索システム、画像検索方法および画像管理方法
WO2014112449A1 (ja) 情報処理装置および方法、並びにプログラム
JP2006338620A (ja) 画像データ検索装置及び方法、並びにプログラム
JP2006217046A (ja) 映像インデックス画像生成装置及び映像のインデックス画像を生成するプログラム
JP2010250630A (ja) 画像サーバー、画像検索システムおよび画像検索方法
JP2004021430A (ja) 画像検索装置、画像検索方法及び画像検索プログラム
JP2004538555A (ja) デジタル画像を分類する方法
JP4205517B2 (ja) 奥行情報を含んだ画像の分類装置およびプログラム
JP2010250636A (ja) 画像検索端末装置および画像検索要求方法
KR102121534B1 (ko) 시퀀스 간의 유사성을 결정하는 방법 및 디바이스
US20220414393A1 (en) Methods and Systems for Generating Composite Image Descriptors

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050726

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050726

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080806

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081008

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081016

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees