JP4205517B2 - 奥行情報を含んだ画像の分類装置およびプログラム - Google Patents

奥行情報を含んだ画像の分類装置およびプログラム Download PDF

Info

Publication number
JP4205517B2
JP4205517B2 JP2003278937A JP2003278937A JP4205517B2 JP 4205517 B2 JP4205517 B2 JP 4205517B2 JP 2003278937 A JP2003278937 A JP 2003278937A JP 2003278937 A JP2003278937 A JP 2003278937A JP 4205517 B2 JP4205517 B2 JP 4205517B2
Authority
JP
Japan
Prior art keywords
image
depth information
matrix
depth
template matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003278937A
Other languages
English (en)
Other versions
JP2005044211A (ja
Inventor
昌宏 湯口
佳伸 外村
拳 筒口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003278937A priority Critical patent/JP4205517B2/ja
Publication of JP2005044211A publication Critical patent/JP2005044211A/ja
Application granted granted Critical
Publication of JP4205517B2 publication Critical patent/JP4205517B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、奥行情報を含んだ画像の分類および検索を行う方法、装置に関する。
従来、画像の分類方法としては色情報が主に用いられている(特許文献1)。また、他の手段としては、ファイル形式やメタデータ等が利用されている。しかしながら、画像の奥行という構造的な面からの分類方法は、従来手法では複雑な処理が必要となり、簡易な分類を行うことは困難であった。
特開2003−067764号公報
本発明の目的は、従来の方法では複雑な処理が必要であった画像の構造的な側面からの画像分類の奥行方向の凹凸分布での画像分類が容易な画像分類方法および装置を提供することにある。
本発明の他の目的は、上記画像分類方法を用いた画像検索方法および装置を提供することにある。
本明細書において、以下の記述を簡易化するために、画像をいくつかの領域に分割し、その領域の代表値としてある値を与え、前記分割された領域を行列と見なし、代表値を行列の要素とするとき、この要素によって構成される行列を画像の「特徴行列」と称し、画像を風景画像や人物画像などに分類を行う際、それらのカテゴリで代表的となる特徴行列を「テンプレート行列」と称する。
本発明の画像分類装置は、
画素単位に奥行情報を含んだ画像を、その奥行情報を元にして分類する装置であって、
画像メモリと、
奥行情報を含む画像を入力し、前記画像メモリに保存する保存手段と、
該画像を複数の領域に区分する区分手段と、
前記各領域に含まれる各画素の奥行情報の平均値と、画像全体での各画素の奥行情報の平均値とを比較することで、区分された領域に対する代表値を決定する決定手段と、
テンプレート行列を記憶したメモリと、
各領域の代表値を行列の要素として見なし、画像全体に対する奥行特徴行列を算出し、該奥行特徴行列と各テンプレート行列との相関性を検出する検出手段と、
相関性が最も高いテンプレート行列の有する一意的なIDコードを入力された画像に付与する付与手段とを有する。
本発明の画像分類装置は、
テンプレート行列の有する一意的なIDコードを有する画像を格納した画像データベースと、
前記付与手段で付与されたIDコードに基づいて、前記入力された画像の類似画像を前記画像データベースから検索する検索手段と、
検索結果を出力する出力手段とを有する。
請求項1との発明は、従来は色やメタデータによって分類を行っていた奥行情報のついた画像を、奥行情報を利用することによって、より容易に分類することが可能となる。
また、請求項2と3の発明は、従来、画像の検索を行う場合、画像データに付加されたメタデータや色、形状、ファイル形式によって検索を行っていたため、ユーザは求めたい画像を取得するまでに検索のキーワードを選択したり、大量の画像を見る必要があり、時間や手間がかかっていたが、本発明を利用することによって、色や形だけでなく、画像の構造という情報を含んだ検索が可能となり、従来よりも容易に、ユーザの求めるものに近い画像を検索することが可能となる。
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明の一実施形態の画像分類装置の構成図である。本実施形態の画像分類装置は画像入力部101と画像記憶部102と領域区分部103と領域代表値決定部104と相関性検出部105とテンプレート行列記憶部106と識別子付与部107と画像出力部108とから構成されている。
画像入力部101は、色情報のみならず奥行情報を含む画像を入力し、画像記憶部102に保存する。たとえば、色の情報として、赤、緑、青の3色の輝度に関する値がR、G、Bと与えられるとき、画素ごとに[R,G,B]として表される。この表現のように色情報に奥行の値Zを付加して、[R,G,B,Z]と表すことが可能であるとする。
領域区分部103は保存された画像を複数の領域に分割する。画像の分割の方法としては、図2に示すように複数の分割方法が考えられる。201のように、縦横に複数の四角形の領域に分割する方法や、202のように画像に対して斜め方向に複数の四角形の領域に分割する方法、また、203のように複数の六角形の領域に分割する方法が考えられるが、分割方法は画像の入力を行う以前に決定されているものとする。また、分割数に関しても、同様に複数の方法が考えられるが、この分割数も分割領域と同じく、画像入力以前に決定されているものとする。計算上のコストを考慮すると、領域の分割数は画像のピクセル数に対して十分小さいものが望ましく、簡易な分割を行うためには、縦横に3×3や3×5などに大まかに分割することが望ましい。また、分割数は、画像の大きさに関わらず一定とする。
領域代表値決定部104は分割された領域に対して代表値を決定する。図3は代表値を決定する方法を示した図である。ここでは、奥行情報のヒストグラム分布を利用した代表値決定方法について説明する。301に示されるように、画像全体の奥行のヒストグラムを形成し、その平均値をZavとしたとき、その値を求める。ここで、例として奥行情報はカメラのレンズ中心からの距離を取るものとし、単位としてmの値を持ち、常に正値を取るものとする。よって奥行値は、カメラレンズ中心から0mの位置から、Zの取りうる最大値までもつものとする。次に、各分割された領域に関して、302に示されるように、奥行ヒストグラムを形成する。形成された奥行ヒトグラムを画像全体の奥行ヒストグラムの平均値Zavとを比較し、領域内の奥行ヒストグラムの平均値がZavよりも大きい値となるときには、領域の代表値として−1の値を与える。また、領域の平均値がZavの値に近い値である場合、領域の代表値として0を与える。そして、領域の平均値がZavよりも小さい値である場合は、代表値として1を与えるものとする。もしくは、撮影点から10mまでの範囲、10mから100mまでの範囲、それ以上の範囲というように、前記分割された領域における奥行方向の閾値を画像を入力する以前に決定しておき、これを利用して奥行情報を分類し、前記分割領域の代表値を決定してもよい。
相関性検出部105は図4に示すように、領域代表値決定部104で決定された各領域の代表値から画像の奥行特徴行列を作成し、テンプレート行列記憶部106中のテンプレート行列との相関を求める。テンプレート行列と、奥行特徴行列の行、列における要素数は同じものであるとする。この要素数は、画像を入力する以前に決定されているものとする。奥行特徴行列とテンプレート行列との相関を求める手法としては、多数考えられるが、例としては、奥行特徴行列とテンプレート行列との差を求めた後、この行列式を求める、という手法でもよい。このとき、値が0に近いほど、奥行特徴行列とテンプレート行列とが類似した行列であるということができる。ここでは、奥行特徴行列とテンプレート行列とがどれだけ似ているか、ということを計算結果として求められる方法であればよい。
識別子付与部107は図5に示すように、相関性検出部105にて検出された、相似性が最も高いテンプレート行列を画像の識別子として、入力された画像に付加する。この際、テンプレート行列そのものを画像に付加してもよいし、テンプレート行列に対して一意となるIDのようなものを画像に付加してもよい。付加する手法としては、電子透かしのように画素そのものに埋め込むという方法も考えられ、また、画像そのものの構造を壊さないような方法でデータを付加するという方法も考えられる。例えば、データのヘッダ部分にデータを付与したり、XML(eXtensibe Markup Language)を用いて別ファイルのようにデータを画像に関連付けを行えば、画像そのものは変質することなく、分類に関する情報を付加することが可能となる。このようにして付加された情報は画像のメタデータの一部として利用してもよい。この結果、付加された識別子によって、入力された画像がどのような奥行情報を含んだ画像であるか分類することが可能となる。
画像出力部108は、識別子が付与された画像をディスプレイ、プリンタ等の出力装置に出力する。
次に、本発明の他の実施形態として、構造的に類似する画像を検索する画像検索装置を図6に示す。画像検索装置は画像/テンプレート行列入力部601と画像分類装置602と識別子決定部603と類似画像検索部603と検索結果出力部605と画像データベース606とから構成されている。
画像/テンプレート行列入力部601を用いて、ユーザは、検索したい画像の構造に類似した、奥行情報を含んだ画像を選択するか、または、ユーザが検索しようとする画像の構造に近いテンプレート行列を選択する。
ユーザが奥行情報を含んだ画像を入力した場合、図1の画像分類装置602を用いて画像の分類を行い、識別子付与までを行い、ユーザが入力した画像を表すテンプレート行列に一意に対応する識別子が出力される。画像/テンプレート行列入力部601にてテンプレート行列が入力された場合は、テンプレート行列に一意に対応する識別子が決まっているため、画像分類装置602の処理は行わなくともよい。
識別子決定部603にて、入力された画像に対する識別子、または、ユーザが入力したテンプレート行列の識別子が決定される。
類似画像検索部604では、識別子決定部603にて決定された識別子に一致する識別子が付けられている画像を、画像データベース606中から検索する。このとき、検索の基準として画像の奥行方向だけでなく、色の分布に関する情報も利用することによって、ユーザの求める画像の検索精度を上げることも可能である。
他にも、ユーザが選択したテンプレート行列の識別子に一致するもののみを検索対象にするだけではなく、類似したものも含めて検索対象としてもよい。なぜなら、テンプレート行列が含まれている空間を考えた場合、画像に含まれる構造が類似したテンプレート行列が偏りをもって存在していると考えられるため、この分布の偏りを参考として、ユーザが選択したテンプレート行列に近い空間に分布する他のテンプレート行列も検索の対象とすることができるため、画像の検索対象を広げることが可能となる。
検索結果出力部605にて、類似画像検索部604で検索された結果をディスプレイ、プリンタ等に出力する。
なお、本発明の画像分類方法、画像検索方法は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フロッピーディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。
本発明の一実施形態の画像分類装置の構成図である。 領域分割の例を示す図である。 領域代表値決定の手順を示す図である。 相関性検出の手順を示す図である。 識別子付与の説明図である。 本発明の他の実施形態の画像検索装置の構成図である。
符号の説明
101 画像入力部
102 画像記憶部
103 領域分割部
104 領域代表値決定部
105 相関性検出部
106 テンプレート行列記憶部
107 識別子付与部
108 画像出力部
201〜203 領域分割例
301 画像全体での奥行ヒストグラム
302 各領域の奥行ヒストグラム
303 領域代表値
601 画像/テンプレート行列入力部
602 画像分類装置
603 識別子決定部
604 類似画像検索部
605 検索結果出力部
606 画像データベース

Claims (3)

  1. 画素単位に奥行情報を含んだ画像を、その奥行情報を元にして分類する装置であって、
    画像メモリと、
    奥行情報を含む画像を入力し、前記画像メモリに保存する保存手段と、
    画像を複数の領域に区分する区分手段と、
    前記各領域に含まれる各画素の奥行情報の平均値と、画像全体での各画素の奥行情報の平均値とを比較することで、区分された領域に対する代表値を決定する決定手段と、
    テンプレート行列を記憶したメモリと、
    各領域の代表値を行列の要素として見なし、画像全体に対する奥行特徴行列を算出し、該奥行特徴行列と各テンプレート行列との相関性を検出する検出手段と、
    相関性が最も高いテンプレート行列の有する一意的なIDコード入力された画像に付与する付与手段とを有する、奥行情報を含んだ画像の分類装置。
  2. テンプレート行列の有する一意的なIDコードを有する画像を格納した画像データベースと、
    前記付与手段で付与されたIDコードに基づいて、前記入力された画像の類似画像を前記画像データベースから検索する検索手段と、
    検索結果を出力する出力手段を有する、請求項1に記載の奥行情報を含んだ画像の分類装置。
  3. 請求項1または請求項2に記載の奥行情報を含んだ画像の分類装置を構成する各手段としてコンピュータを機能させるプログラム。
JP2003278937A 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム Expired - Fee Related JP4205517B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003278937A JP4205517B2 (ja) 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003278937A JP4205517B2 (ja) 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2005044211A JP2005044211A (ja) 2005-02-17
JP4205517B2 true JP4205517B2 (ja) 2009-01-07

Family

ID=34265196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003278937A Expired - Fee Related JP4205517B2 (ja) 2003-07-24 2003-07-24 奥行情報を含んだ画像の分類装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4205517B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244424A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 映像シーン分類方法及び装置及びプログラム
JP5007824B2 (ja) * 2008-03-18 2012-08-22 富士ゼロックス株式会社 連続紙給紙装置、画像形成装置およびプログラム
JP5150698B2 (ja) * 2010-09-30 2013-02-20 株式会社東芝 デプス補正装置及び方法

Also Published As

Publication number Publication date
JP2005044211A (ja) 2005-02-17

Similar Documents

Publication Publication Date Title
KR102403964B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
JP4337064B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US6915011B2 (en) Event clustering of images using foreground/background segmentation
KR100799557B1 (ko) 동영상의 비주얼 특징을 이용한 유해 동영상 판별함수 생성및 판별 방법 그리고 그 장치
US8094935B2 (en) Representative color extracting method and apparatus based on human color sense and data histogram distributions
US20070195344A1 (en) System, apparatus, method, program and recording medium for processing image
JP2005510775A (ja) コンテンツをカテゴリ化するためのカメラメタデータ
US8755603B2 (en) Information processing apparatus performing character recognition and correction and information processing method thereof
US8345742B2 (en) Method of processing moving picture and apparatus thereof
JP2008217428A (ja) 画像検索プログラム、方法及び装置
CN101286230B (zh) 图像处理设备和图像处理方法
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
JP2008225692A (ja) 画像検索方法、装置およびプログラム
WO2014112449A1 (ja) 情報処理装置および方法、並びにプログラム
JP2004021430A (ja) 画像検索装置、画像検索方法及び画像検索プログラム
JP4205517B2 (ja) 奥行情報を含んだ画像の分類装置およびプログラム
CN113255423A (zh) 从视频提取配色方案的方法及装置
US20220414393A1 (en) Methods and Systems for Generating Composite Image Descriptors
JP2010250634A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP2005208977A (ja) 文書ファイリング装置および文書ファイリング方法
JP2007102286A (ja) 特定画像検出装置、特定画像検出方法および特定画像検出プログラム
KR100981125B1 (ko) 동영상 처리 방법 및 그 장치
JP6031566B1 (ja) 特徴抽出装置、画像検索装置、方法、及びプログラム
WO2022107635A1 (ja) 撮影装置、画像の生産方法、および記録媒体
WO2022264370A1 (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050726

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050726

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080806

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081008

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081016

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees