JP2007034613A - Image processing apparatus and method thereof - Google Patents

Image processing apparatus and method thereof Download PDF

Info

Publication number
JP2007034613A
JP2007034613A JP2005215976A JP2005215976A JP2007034613A JP 2007034613 A JP2007034613 A JP 2007034613A JP 2005215976 A JP2005215976 A JP 2005215976A JP 2005215976 A JP2005215976 A JP 2005215976A JP 2007034613 A JP2007034613 A JP 2007034613A
Authority
JP
Japan
Prior art keywords
image
block
search
information
shape information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005215976A
Other languages
Japanese (ja)
Inventor
Hiroshi Tojo
洋 東條
Masahiro Matsushita
昌弘 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005215976A priority Critical patent/JP2007034613A/en
Publication of JP2007034613A publication Critical patent/JP2007034613A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform high-speed and accurate retrieval for an image of optional shape. <P>SOLUTION: Optional shape images having optional shapes are preliminarily registered in a database with image characteristic quantities for each block thereof, and a retrieval image is input with image characteristic quantities for each block (S401). An optional shape image as a retrieval object is narrowed in the database based on the image characteristic quantities for each block of the optional shape images and the retrieval image (S402), and the similarity of image characteristic quantity between the retrieval image and the narrowed optional shape image is calculated for each block(S403). Based on the calculated similarities, retrieval results are output (S404 and S405). <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は画像処理装置およびその方法に関し、特に、任意形状の類似画像を検索する画像処理装置およびその方法に関する。   The present invention relates to an image processing apparatus and method, and more particularly, to an image processing apparatus and method for searching for similar images having an arbitrary shape.

近年、画像を解析して、色、エッジ、テクスチャなどの特徴量を抽出し、特徴量同士の比較によって、2枚の画像の類似性を判定する技術が発達しており、類似画像の検索や、動画像のカット点検出等に利用されている。   In recent years, technology has been developed to analyze images, extract features such as colors, edges, and textures, and determine the similarity between two images by comparing features. It is used for detecting cut points of moving images.

このような類似性を判定する技術は、矩形画像に対して有効なものを中心に発達してきたが、任意形状の画像に適用可能な技術も提案されている。   A technique for determining such similarity has been developed centering on a technique effective for rectangular images, but a technique applicable to an image having an arbitrary shape has also been proposed.

例えば特許文献1によれば、任意形状を含む矩形画像を生成し、任意形状の画像部分から得られる代表値で背景領域部分を補完し、その矩形画像に対して従来の画像特徴抽出を適用することによって、類似性を判定している。   For example, according to Patent Document 1, a rectangular image including an arbitrary shape is generated, the background region portion is complemented with a representative value obtained from the arbitrary shape image portion, and conventional image feature extraction is applied to the rectangular image. Thus, the similarity is determined.

また、例えば特許文献2によれば、任意形状の注目領域外に相当する背景領域部分については、他のあらゆる特徴量との距離が0となるような特別な特徴量を設定し、距離計算への影響を排除している。
特開2002-245456公報 特開平11-312248号公報
Also, for example, according to Patent Document 2, a special feature amount is set such that a distance from any other feature amount is set to 0 for the background region portion outside the attention region of arbitrary shape, and the distance calculation is performed. The influence of is eliminated.
JP 2002-245456 JP Japanese Patent Laid-Open No. 11-312248

しかしながら、上記特許文献1に開示された技術においては、以下のような問題があった。   However, the technique disclosed in Patent Document 1 has the following problems.

すなわち、形状によらず矩形画像を生成してから画像を登録するので、検索元画像であるクエリ画像がどのような形状であってもまず、予め検索先画像として登録されている全ての画像との比較が必要となる。したがって、登録画像数が増えれば増えるほど、検索速度が低下してしまう。   In other words, since a rectangular image is generated regardless of the shape, and the image is registered, first, regardless of the shape of the query image that is the search source image, all the images registered in advance as the search destination image Comparison is required. Therefore, the search speed decreases as the number of registered images increases.

また、任意形状の画像部分から得られる代表値で背景領域部分を補完するため、任意形状の画像の差が背景領域部分にも積み重なって距離計算されてしまい、高精度な検索ができない。   Further, since the background region portion is complemented with the representative value obtained from the image portion having an arbitrary shape, the difference between the images of the arbitrary shape is accumulated also on the background region portion, and the distance is calculated, so that high-precision search cannot be performed.

一方、上記特許文献2に開示された技術においても、以下のような問題があった。   On the other hand, the technique disclosed in Patent Document 2 also has the following problems.

すなわち、画像ごとに最頻の特徴量をキーとして検索対象を絞り込めるが、背景領域のみのブロックについても、通常どおりに特徴量を抽出して登録しているため、検索対象の絞り込みは、注目領域に対する検索時には有効ではない。従って、登録画像数が増えるほど、任意形状の画像(注目領域)についての検索速度は低下してしまう。   In other words, the search target can be narrowed down using the most frequent feature amount for each image as a key, but the feature amount is extracted and registered as usual for the block of only the background region, so the search target narrowing down It is not valid when searching for an area. Therefore, as the number of registered images increases, the search speed for an arbitrarily shaped image (region of interest) decreases.

また、任意形状の画像が含まれるブロックについては、背景領域部分も含めて特徴量が抽出されるため、背景領域部分が多い場合には、有効な特徴量が抽出されず、高精度な検索ができない。   In addition, for blocks that contain images of arbitrary shape, feature values are extracted including the background region part. If there are many background region parts, effective feature values are not extracted, and high-precision search is performed. Can not.

本発明は上述した問題を個々にまたはまとめて解決するためになされたものであり、任意形状の画像についての高速な検索を可能とする画像処理装置及びその方法を提供することを目的とする。   The present invention has been made to solve the above-described problems individually or collectively, and an object thereof is to provide an image processing apparatus and method capable of performing high-speed search for an image having an arbitrary shape.

また、任意形状の画像についての高精度な検索を可能とする画像処理装置及びその方法を提供することを目的とする。   It is another object of the present invention to provide an image processing apparatus and method capable of performing high-precision search for an image having an arbitrary shape.

上記目的を達成するための一手段として、本発明の画像処理装置は以下の構成を備える。   As a means for achieving the above object, an image processing apparatus of the present invention comprises the following arrangement.

すなわち、任意形状の画像を入力する画像入力手段と、前記画像に対して外接矩形を作成する外接矩形作成手段と、前記外接矩形をブロックに分割するブロック分割手段と、前記ブロックの画像特徴量を抽出する画像特徴量抽出手段と、前記ブロック内の形状情報を抽出するブロック内形状情報抽出手段と、前記画像特徴量と前記ブロック内形状情報を前記画像と関連付けて登録する登録手段と、前記画像特徴量と前記ブロック内形状情報を用いて画像を検索する画像検索手段とを有することを特徴とする。   That is, an image input unit that inputs an image of an arbitrary shape, a circumscribed rectangle creating unit that creates a circumscribed rectangle for the image, a block dividing unit that divides the circumscribed rectangle into blocks, and an image feature amount of the block Image feature quantity extracting means for extracting, intra-block shape information extracting means for extracting shape information in the block, registration means for registering the image feature quantity and the in-block shape information in association with the image, and the image Image search means for searching for an image using the feature quantity and the in-block shape information is provided.

また、本発明の画像処理方法は以下の構成を備える。   The image processing method of the present invention has the following configuration.

すなわち、任意形状の画像を入力する画像入力ステップと、前記画像に対して外接矩形を作成する外接矩形作成ステップと、前記外接矩形をブロックに分割するブロック分割ステップと、前記ブロックの画像特徴量を抽出する画像特徴量抽出ステップと、前記ブロック内の形状情報を抽出するブロック内形状情報抽出ステップと、前記画像特徴量と前記ブロック内形状情報を前記画像と関連付けて登録する登録ステップと、前記画像特徴量と前記ブロック内形状情報を用いて画像を検索する画像検索ステップとを有することを特徴とする。   That is, an image input step for inputting an image of an arbitrary shape, a circumscribed rectangle creating step for creating a circumscribed rectangle for the image, a block dividing step for dividing the circumscribed rectangle into blocks, and an image feature amount of the block An image feature amount extraction step to extract, an in-block shape information extraction step to extract shape information in the block, a registration step to register the image feature amount and the in-block shape information in association with the image, and the image And an image search step of searching for an image using the feature amount and the in-block shape information.

以上の構成からなる本発明によれば、画像のブロック単位に抽出した画像特徴量に基づいて類似度算出前の絞り込みを高速に行うことによって、任意形状の類似画像を高速に検索することが可能となる。   According to the present invention having the above-described configuration, it is possible to quickly search for similar images of arbitrary shapes by performing narrowing down before similarity calculation based on image feature amounts extracted in units of image blocks. It becomes.

また、画像のブロック単位に抽出した画像特徴量に基づいて類似度算出を行うことによって、任意形状の類似画像を高精度に検索することが可能となる。   Further, by calculating the similarity based on the image feature amount extracted for each block of the image, it is possible to search for a similar image having an arbitrary shape with high accuracy.

以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。   Hereinafter, the present invention will be described in detail based on preferred embodiments with reference to the accompanying drawings.

<第1実施形態>
●システム構成
図1は、本実施形態における画像処理装置の構成を示すブロック図である。同図において、101はCPUであり、本実施形態の画像処理装置における各種制御を実行する。102はROMであり、本装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。
<First Embodiment>
System Configuration FIG. 1 is a block diagram showing the configuration of the image processing apparatus according to this embodiment. In the figure, reference numeral 101 denotes a CPU which executes various controls in the image processing apparatus of the present embodiment. Reference numeral 102 denotes a ROM which stores a boot program executed when the apparatus is started up and various data.

103はRAMであり、CPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の作業領域を提供する。104はキーボード、105はマウスであり、ユーザによる各種入力操作環境を提供する。
106は外部記憶装置であり、ハードディスクやフレキシブルディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード等で構成される。107は表示器であり、ディスプレイなどで構成され、結果等をユーザに対して表示する。108はネットワークインターフェースであり、ネットワーク上の各機器との通信を可能とする。109はIEEE1394,USBなどのインターフェースであり、スキャナ110やデジタルカメラ111などの機器と通信を行う。また、112は上記の各構成を接続するバスである。
A RAM 103 stores a control program for processing by the CPU 101 and provides a work area when the CPU 101 executes various controls. A keyboard 104 and a mouse 105 provide various input operation environments for the user.
Reference numeral 106 denotes an external storage device, which includes a hard disk, a flexible disk, an optical disk, a magnetic disk, a magneto-optical disk, a magnetic tape, a nonvolatile memory card, and the like. Reference numeral 107 denotes a display, which includes a display or the like, and displays the result and the like to the user. A network interface 108 enables communication with each device on the network. Reference numeral 109 denotes an interface such as IEEE1394 or USB, which communicates with devices such as the scanner 110 and the digital camera 111. Reference numeral 112 denotes a bus connecting the above-described components.

なお、上記構成において外部記憶装置106、スキャナ110、デジタルカメラ111は、ネットワーク上に配置されたもので代用することができる。   In the above configuration, the external storage device 106, the scanner 110, and the digital camera 111 can be replaced with those arranged on the network.

図2は、図1に示す構成からなる画像処理装置の機能構成を示すブロック図である。同図において、201は画像入力部であり、スキャナ110、デジタルカメラ111などの機器で取得した画像を、インターフェース109を介して、或いは、インターネットやLAN等のネットワーク上に存在する画像を、ネットワークインターフェース108を介して入力する。202は領域抽出部であり、画像入力部201で入力された画像から登録する画像領域を抽出する。203は正規化部であり、領域抽出部202で抽出された画像領域の正規化を行う。204は特徴抽出部であり、正規化部203で正規化された画像領域から、画像特徴量を抽出する。   FIG. 2 is a block diagram showing a functional configuration of the image processing apparatus having the configuration shown in FIG. In the figure, reference numeral 201 denotes an image input unit. An image acquired by a device such as the scanner 110 or the digital camera 111 is displayed via an interface 109 or an image existing on a network such as the Internet or a LAN. Enter via 108. An area extracting unit 202 extracts an image area to be registered from the image input by the image input unit 201. A normalization unit 203 normalizes the image area extracted by the area extraction unit 202. A feature extraction unit 204 extracts an image feature amount from the image area normalized by the normalization unit 203.

205は画像DB部であり、外部記憶装置106によって構成され、画像領域と画像特徴量を関連付けて記憶する。206は操作部であり、キーボード104、マウス105等で構成され、ユーザからの検索指示等を可能にする。207は距離計算部であり、検索元画像の特徴量と画像DB部205中の検索先画像の特徴量との距離を計算する。208は表示部であり、表示器107から構成され、距離計算部207の結果に基づいて検索候補を表示し、ユーザに提示する。   An image DB unit 205 is configured by the external storage device 106 and stores an image region and an image feature amount in association with each other. An operation unit 206 includes a keyboard 104, a mouse 105, and the like, and enables a search instruction from the user. A distance calculation unit 207 calculates the distance between the feature amount of the search source image and the feature amount of the search destination image in the image DB unit 205. Reference numeral 208 denotes a display unit, which includes the display unit 107, displays search candidates based on the results of the distance calculation unit 207, and presents them to the user.

●画像登録処理
以下、本実施形態における画像登録処理について、図3のフローチャートを用いて説明する。
Image Registration Processing The image registration processing in this embodiment will be described below using the flowchart in FIG.

まず、画像入力部201により登録対象となる画像を入力する(S301)。入力画像としては、登録対象となるクリップアートなどの1枚の画像であってもよいし、文書画像のように複数画像が配置されているものであってもよい。なお、本実施形態では後者の文書画像が入力されたものとして、以降の説明を行う。   First, an image to be registered is input by the image input unit 201 (S301). The input image may be a single image such as a clip art to be registered, or a plurality of images arranged like a document image. In the present embodiment, the following description will be given assuming that the latter document image is input.

次に、領域抽出部202において入力画像に対する領域抽出を行い、登録対象となるクリップアートなどの画像領域を抽出する(S302)。なお、この領域抽出処理の詳細については後述する。   Next, the region extraction unit 202 performs region extraction on the input image, and extracts an image region such as a clip art to be registered (S302). Details of this region extraction processing will be described later.

次に、正規化部204において、ステップS302で登録対象として抽出された画像領域を正規化する(S303)。これは例えば、文書画像にクリップアートを貼り付ける際に、回転などの処理が施されていることがあるため、この影響を排除するために行う。なお、この正規化処理の詳細については後述する。   Next, the normalizing unit 204 normalizes the image area extracted as a registration target in step S302 (S303). For example, when clip art is pasted on a document image, processing such as rotation may be performed. Details of the normalization process will be described later.

次に、特徴抽出部204において、正規化された画像領域からブロック情報を抽出する(S304)。ブロック情報は、画像特徴量とブロック占有率、ブロック形状情報からなる。画像特徴量としては、ベクトル表現を可能とするものであれば特に限定しないが、ここでは画像上の色の配置を表すカラーラベルであるとする。なお、ブロック占有率、ブロック形状情報については後述する。抽出されたブロック情報は、画像と関連付けられて画像DB部205へ登録される(S305)。なお、カラーラベル抽出処理の詳細、および画像DB部205におけるインデックスの詳細については後述する。   Next, the feature extraction unit 204 extracts block information from the normalized image region (S304). The block information includes an image feature amount, a block occupation rate, and block shape information. The image feature amount is not particularly limited as long as it allows vector expression, but here it is assumed to be a color label representing the arrangement of colors on the image. The block occupation ratio and block shape information will be described later. The extracted block information is associated with the image and registered in the image DB unit 205 (S305). Details of the color label extraction process and details of the index in the image DB unit 205 will be described later.

次に、入力画像中の登録対象となる全領域について、ステップS302〜S305の処理を行ったか否かを確認し(S306)、全領域について処理が行われていれば本登録処理を終了するが、未処理の領域が残っていればステップS302へ戻る。   Next, it is confirmed whether or not the processing in steps S302 to S305 has been performed for all regions to be registered in the input image (S306). If the processing has been performed for all regions, this registration processing is terminated. If an unprocessed area remains, the process returns to step S302.

●領域抽出処理(S302)
以下、ステップS302における領域抽出処理について、図4を用いて詳細に説明する。ここで領域抽出処理とは、例えば図4に示すラスタ画像901を、領域分類画像902に示すように意味のあるブロック毎の塊として認識し、各ブロックを属性ごとに分類することによって、それぞれの領域を抽出する処理である。ここでブロック属性としては領域分類画像902に示すように、文字(TEXT),図画(PICTURE),写真(PHOTO),線(LINE),表(TABLE)、等である。
Area extraction process (S302)
Hereinafter, the region extraction processing in step S302 will be described in detail with reference to FIG. Here, the region extraction processing is, for example, by recognizing the raster image 901 shown in FIG. 4 as a block for each meaningful block as shown in the region classification image 902 and classifying each block for each attribute. This is a process of extracting an area. Here, as shown in the region classification image 902, the block attributes include text (TEXT), drawing (PICTURE), photograph (PHOTO), line (LINE), table (TABLE), and the like.

具体的には、まず入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出し、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。   Specifically, first, the input image is binarized to black and white, and contour tracking is performed to extract a block of pixels surrounded by a black pixel contour. For a black pixel block with a large area, the white pixel block is extracted by tracing the outline of the white pixel inside, and the black pixel block is recursively extracted from the white pixel block with a certain area or more. Extract a block of pixels.

このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つ領域へ分類していく。例えば、まず縦横比が1に近く、大きさが一定の範囲の領域は文字相当の画素塊とする。そしてさらに、近接する文字が整列良くグループ化可能な部分を文字領域、扁平な画素塊を線領域、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域とする。また、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域、と分類する。本実施形態では、例えばクリップアート等、任意形状の図画(PICTURE)領域が登録対象として抽出される。   The black pixel blocks thus obtained are classified by size and shape, and are classified into regions having different attributes. For example, first, an area having an aspect ratio close to 1 and a constant size is assumed to be a pixel block corresponding to a character. In addition, the area where adjacent characters can be grouped in a well-aligned area is the character area, the flat pixel block is a line region, and the area occupied by the black pixel block that is a certain size or larger and includes a rectangular white pixel block aligned is shown. This is an area. Also, an area where irregular shaped pixel clusters are scattered is classified as a photographic area, and a pixel cluster of any other shape is classified as a graphic area. In the present embodiment, for example, a pictorial area having an arbitrary shape such as clip art is extracted as a registration target.

●正規化処理(S303)
以下、ステップS303における正規化処理について、図5のフローチャートを用いて詳細に説明する。
Normalization processing (S303)
Hereinafter, the normalization process in step S303 will be described in detail with reference to the flowchart of FIG.

まずステップS501において、図6に示すように、登録対象である任意形状画像に対して外接矩形を作成する。水平に対して時計回りに0度から80度まで10度ずつ傾けた矩形を、任意形状画像に外接するように配置するようにすることにより、9つの外接矩形を作成する。図6においては、これらの外接矩形のうち、0度および60,70,80度の矩形の例を示す。なお、本実施形態では10度ずつに傾けた9つの外接矩形を作成しているが、本発明は特にこの例に限定されるものではない。   First, in step S501, a circumscribed rectangle is created for an arbitrary shape image to be registered as shown in FIG. Nine circumscribed rectangles are created by arranging rectangles tilted by 10 degrees from 0 degrees to 80 degrees clockwise with respect to the horizontal so as to circumscribe the arbitrary shape image. FIG. 6 shows examples of rectangles of 0 degrees and 60, 70, and 80 degrees among these circumscribed rectangles. In this embodiment, nine circumscribed rectangles tilted by 10 degrees are created, but the present invention is not particularly limited to this example.

このようにして得られた9種類の外接矩形のうち、面積が最小になる最小外接矩形をステップS502において選択する。図6の例では、80度の外接矩形が最小外接矩形である。   Of the nine circumscribed rectangles obtained in this way, the smallest circumscribed rectangle having the smallest area is selected in step S502. In the example of FIG. 6, the circumscribed rectangle of 80 degrees is the minimum circumscribed rectangle.

次にステップS503において、最小外接矩形の傾斜角度が0度の場合は任意形状画像に対して手を加えずに処理を終了する。最小外接矩形の傾斜角度が10〜40度の場合はステップS504において、任意形状画像を反時計回りに傾斜角度分回転し、処理を終了する。最小外接矩形の傾斜角度が50〜80度の場合はステップS505において、任意形状画像を時計回りに(90-傾斜角度)分回転し、処理を終了する。   In step S503, if the inclination angle of the minimum circumscribed rectangle is 0 degree, the process is terminated without modifying the arbitrary shape image. When the inclination angle of the minimum circumscribed rectangle is 10 to 40 degrees, in step S504, the arbitrary shape image is rotated counterclockwise by the inclination angle, and the process ends. When the inclination angle of the minimum circumscribed rectangle is 50 to 80 degrees, in step S505, the arbitrary shape image is rotated clockwise (90-inclination angle), and the process ends.

こうして正規化された外接矩形を、以下では正規化外接矩形と呼ぶこととする。また、任意形状の画像の正規化外接矩形における、任意形状の画像の部分を有効領域、それ以外の部分を無効領域と呼ぶこととする。   The circumscribed rectangle thus normalized is hereinafter referred to as a normalized circumscribed rectangle. Also, in the normalized circumscribed rectangle of an arbitrary shape image, the portion of the arbitrary shape image is called an effective region, and the other portion is called an invalid region.

●画像DB部におけるインデックス
ここで、画像DB部205におけるインデックスについて、詳細に説明する。図7は、画像DB部205におけるインデックスのデータ格納状態を説明する図である。同図において、画像IDは登録順に採番される。また、画像のフルパスのファイル名、ブロック占有率行列、ブロック形状行列、カラーラベル行列は、画像データとして画像IDとともに図7に示されるデータ形態で格納される。なお、ブロック占有率行列、ブロック形状行列およびカラーラベル行列についての詳細は後述する。
● Index in Image DB Unit Here, the index in the image DB unit 205 will be described in detail. FIG. 7 is a diagram for explaining the data storage state of the index in the image DB unit 205. In the figure, image IDs are numbered in the order of registration. Also, the file name of the full path of the image, the block occupancy matrix, the block shape matrix, and the color label matrix are stored as image data in the data format shown in FIG. 7 together with the image ID. Details of the block occupancy matrix, the block shape matrix, and the color label matrix will be described later.

●ブロック情報抽出処理(S304)
以下、ステップS304におけるブロック情報抽出処理について、図8のフローチャートを用いて詳細に説明する。
Block information extraction process (S304)
Hereinafter, the block information extraction processing in step S304 will be described in detail with reference to the flowchart of FIG.

尚、この処理では、処理対象である任意形状の画像の正規化外接矩形を複数のブロックに分割した、各ブロックの色ヒストグラム中の最頻色を有する色のラベルと各ブロックの位置情報を対応づけた情報を、色特徴量(カラーラベル)として抽出する。また、各ブロック内における有効領域の割合を各ブロックの位置情報と対応付けた情報を、ブロック占有率として抽出する。また、各ブロック内における有効領域の近似形状をラベル化して、各ブロックの位置情報と対応付けてブロック形状情報として抽出する。   In this process, the normalized circumscribed rectangle of the image of the arbitrary shape to be processed is divided into a plurality of blocks, and the color label having the most frequent color in the color histogram of each block is associated with the position information of each block. The attached information is extracted as a color feature amount (color label). In addition, information in which the proportion of the effective area in each block is associated with the position information of each block is extracted as a block occupancy rate. Further, the approximate shape of the effective area in each block is labeled, and extracted as block shape information in association with the position information of each block.

まずステップS1020において、画像を複数のブロックに分割する。本実施形態では図9に示すように、画像の縦横をそれぞれ9ブロックに分割する。なお本実施形態では、表記の都合上9×9=81ブロックに分割する例を示すが、本発明は特にこの例に限定されるものではない。   First, in step S1020, the image is divided into a plurality of blocks. In this embodiment, as shown in FIG. 9, the vertical and horizontal directions of an image are each divided into 9 blocks. In this embodiment, an example of dividing into 9 × 9 = 81 blocks is shown for convenience of description, but the present invention is not particularly limited to this example.

次にステップS1030において、処理対象となる着目ブロックを左上端のブロックに設定する。尚、この着目ブロックの設定は、例えば図10に示すように、予め処理順序が決定された順序決定テーブルを参照して行う。   In step S1030, the target block to be processed is set as the upper left block. Note that the block of interest is set with reference to an order determination table in which the processing order is determined in advance as shown in FIG. 10, for example.

そしてステップS1040において、未処理の着目ブロックの有無を判定する。未処理の着目ブロックがない場合には処理を終了するが、未処理の着目ブロックがある場合にはステップS1050に進む。   In step S1040, the presence / absence of an unprocessed block of interest is determined. If there is no unprocessed target block, the process ends. If there is an unprocessed target block, the process proceeds to step S1050.

ステップS1050では、着目ブロック内の有効領域全画素の各濃度値を、図11に示すような色空間を分割して作成した部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。なお本実施形態では図11に示すように、RGB色空間を3×3×3=27に分割した色ビンへ着目ブロックの全画素の濃度値を射影する場合を示すが、本発明は特にこの例に限定されるものではない。   In step S1050, the density values of all pixels in the effective area in the block of interest are projected onto a color bin that is a partial space created by dividing the color space as shown in FIG. 11, and a color histogram for the color bin is generated. . In this embodiment, as shown in FIG. 11, the density value of all the pixels of the block of interest is projected onto a color bin obtained by dividing the RGB color space into 3 × 3 × 3 = 27. It is not limited to examples.

次にステップS1060では、色ヒストグラムの最頻色ビンの色ビンのラベルをその着目ブロックの代表色として決定し、該代表色をその着目ブロックとその位置に対応づけて、RAM103に一時記憶する。   In step S1060, the color bin label of the most frequent color bin in the color histogram is determined as the representative color of the target block, and the representative color is temporarily stored in the RAM 103 in association with the target block and its position.

次にステップS1070において、着目ブロックにおける有効領域の割合(%)の1の位を四捨五入して0〜100%まで10%刻みの割合にし、0〜10の11種類のラベルに変換し、着目ブロックとその位置に対応づけてブロック占有率としてRAM103に一時記憶する。なお本実施形態では割合を11段階に分割する例を示すが、本発明はこの例に限定されない。例えば極端な例として、0%とそれ以外もしくは100%とそれ以外の2種類に分割してもよいし、0%と100%とそれ以外の3種類に分割してもよい。また、刻みをより細かくもしくは粗くしてもよいし、刻み幅が均等でなくてもよい。   Next, in step S1070, the 1st place of the effective area ratio (%) in the target block is rounded to 10% increments from 0 to 100%, and converted into 11 types of labels from 0 to 0. The block occupancy is temporarily stored in the RAM 103 in association with the position. In this embodiment, an example in which the ratio is divided into 11 stages is shown, but the present invention is not limited to this example. For example, as an extreme example, it may be divided into two types of 0% and the other or 100% and the other, or may be divided into three types of 0%, 100% and the other. Further, the step may be finer or coarser, and the step width may not be uniform.

そしてステップS1080では、着目ブロックにおける有効領域の形状をラベル化し、着目ブロックとその位置に対応付けてブロック形状情報としてRAM103に一時記憶する。形状のラベル化は、図12に示すブロック近似図形(a)〜(j)のいずれに最も似ているかを判断し、それぞれ0から9のラベルを付与することによって行う。なお本実施形態では、近似図形として10種類を用意する例を示したが、本発明はこの例に限定されるものではない。   In step S1080, the shape of the effective area in the block of interest is labeled, and temporarily stored in the RAM 103 as block shape information in association with the block of interest and its position. The labeling of the shape is performed by determining which one of the block approximate figures (a) to (j) shown in FIG. 12 is most similar and assigning labels 0 to 9 respectively. In the present embodiment, an example in which ten types of approximate figures are prepared has been shown, but the present invention is not limited to this example.

いずれの形状に最も似ているかの判断手法としては、着目ブロックが有効領域でかつ近似図形が無効領域である領域の面積と、着目ブロックが無効領域でかつ近似図形が有効領域である領域の面積の総和が、最小になる図形を選ぶ手法を用いる。なお、面積を用いずに、各辺における着目ブロックの有効領域の占有率を考慮して決定することもできる。   To determine which shape most closely resembles the area of the area where the target block is an effective area and the approximate figure is an invalid area, and the area of the area where the target block is an invalid area and the approximate figure is an effective area A method is used to select a figure that minimizes the sum of. Instead of using the area, it can be determined in consideration of the occupancy ratio of the effective area of the target block on each side.

次にステップS1090では、図10に示す順序決定テーブルを参照して次の処理対象となる着目ブロックを設定する。このとき、RAM103に一時記憶されていた、カラーラベル情報、ブロック占有率情報、およびブロック形状情報が、図7に示すようにブロック情報行列として画像DB部205へ格納される。   Next, in step S1090, the target block to be processed next is set with reference to the order determination table shown in FIG. At this time, color label information, block occupancy information, and block shape information temporarily stored in the RAM 103 are stored in the image DB unit 205 as a block information matrix as shown in FIG.

その後、ステップS1040に戻り、未処理の着目ブロックがなくなるまで、ステップS1040〜S1080の処理を再帰的に繰り返す。   Thereafter, the process returns to step S1040, and the processes of steps S1040 to S1080 are recursively repeated until there is no unprocessed block of interest.

●類似画像検索処理
以上説明した画像登録処理によって、画像DB部205には図7に示すような形式で複数画像のブロック情報行列が登録されている。
Similar Image Search Processing Through the image registration processing described above, a block information matrix of a plurality of images is registered in the image DB unit 205 in the format shown in FIG.

以下、本実施形態の画像処理装置における類似画像の検索処理について、図13のフローチャートを用いて説明する。   Hereinafter, similar image search processing in the image processing apparatus of this embodiment will be described with reference to the flowchart of FIG.

まず、検索元画像を指定する(S401)。検索元画像を指定する方法としては例えば、画像DB部205中の画像をランダムに選び出して表示部208に表示し、ユーザがその中から所望する画像に近いものを操作部206により指示して、対応するブロック情報行列を読み出す方法がある。また、ユーザが所望の画像に類似した画像そのものを画像入力部201より入力する方法も有効であるが、この場合、入力された検索元画像についての画像特徴量が、上述した画像登録処理と全く同様なステップで抽出される。   First, a search source image is designated (S401). As a method for designating the search source image, for example, an image in the image DB unit 205 is randomly selected and displayed on the display unit 208, and the user specifies an image close to a desired image from the operation unit 206, There is a method of reading the corresponding block information matrix. In addition, a method in which an image itself similar to a desired image is input from the image input unit 201 by the user is also effective. In this case, the image feature amount for the input search source image is completely the same as that in the image registration process described above. Extracted in similar steps.

このように指定された検索元画像の特徴量と、画像DB部205に格納されている検索先画像の特徴量との距離を計算することによって、類似画像を検索することができる。しかしながら本実施形態ではこの距離計算に先立って、検索先画像を、検索元画像の特徴量に近い特徴量を有するもののみに絞込む、プリサーチを行うことを特徴とする(S402)。なお、距離計算部207におけるプリサーチ処理の詳細については、後述する。   A similar image can be searched for by calculating the distance between the feature amount of the specified search source image and the feature amount of the search destination image stored in the image DB unit 205. However, in the present embodiment, prior to this distance calculation, presearch is performed by narrowing down the search destination image to only those having a feature amount close to the feature amount of the search source image (S402). Details of the pre-search process in the distance calculation unit 207 will be described later.

次に距離計算部207において、プリサーチによって画像DB部205から検索対象として抽出された検索先画像の特徴量と、検索元画像の特徴量との距離を計算し、その計算結果を画像IDと距離のリストとしてRAM103に一時保存する(S403)。なお、距離計算の詳細については後述する。   Next, the distance calculation unit 207 calculates the distance between the feature amount of the search destination image extracted as the search target from the image DB unit 205 by the pre-search and the feature amount of the search source image, and the calculation result is set as the image ID. A distance list is temporarily stored in the RAM 103 (S403). Details of the distance calculation will be described later.

次に距離計算部207は、前記リストを距離の昇順にソートした後、順に画像IDからインデックス(フルパスのファイル名)を参照して画像DB部205より画像を読み出し、縮小してサムネイル画像を生成する(S404)。   Next, the distance calculation unit 207 sorts the list in ascending order of distance, and then sequentially reads the image from the image DB unit 205 by referring to the index (full path file name) from the image ID, and generates a thumbnail image by reducing the image. (S404).

次に表示部208に、検索結果として該サムネイル画像を、算出された距離と共にマトリックス上に並べて表示する(S405)。例えば、第一候補から順に、列の左から右へ、上の列から下の列へ、という風に距離の昇順に並べて表示する。この表示によりユーザは、所望の画像が検索されたかどうかを確認することができる。   Next, the thumbnail images are displayed as a search result side by side on the matrix together with the calculated distance on the display unit 208 (S405). For example, the first candidates are displayed in order of increasing distance from the left to the right of the column and from the upper column to the lower column. With this display, the user can confirm whether or not a desired image has been searched.

●プリサーチ処理(S402)
以下、ステップS402におけるプリサーチ処理について詳細に説明する。
● Presearch processing (S402)
Hereinafter, the pre-search process in step S402 will be described in detail.

上述したように、画像DB部205に格納されたブロック占有率情報によって、各ブロックが有効領域であるか、無効領域であるか、両方の領域を含むものであるか、を判定することができる。これはすなわち、任意形状画像の(ブロック単位で)おおよその形状を反映したものである。本実施形態ではこのことを利用して、画像DB部205内の検索先画像群を、そのおおよその形状が検索元画像と同じであるもののみに絞り込む。   As described above, it is possible to determine whether each block is an effective area, an invalid area, or both areas based on the block occupancy rate information stored in the image DB unit 205. That is, it reflects the approximate shape (in blocks) of the arbitrarily shaped image. In this embodiment, this is utilized to narrow down the search destination image group in the image DB unit 205 to only those whose approximate shape is the same as that of the search source image.

そこで、まず、検索元画像と全ての検索先画像のブロック占有率行列のみを比較する。比較の方法としては例えば、検索先画像のブロック占有率行列のうち、ブロック内の有効領域が0%のブロックを0、それ以外のブロックを1に変換した上で、検索元画像のブロック占有率行列との論理積をとる方法がある。これにより、検索元画像のブロック占有率行列が変化していなければ、次の距離計算の対象としてRAM103に画像IDを一時保存し、変化していれば、距離計算の対象から外してしまうことができる。なお、これは無効領域が同じである画像に絞り込む方法であるが、逆に、有効領域が同じである画像に絞り込む方法も可能である。いずれにしても、論理積など、演算コストの小さい方法で比較を行うことができるため、全ての検索先画像との比較を行っても、距離計算に比べて極めて高速な演算が可能となる。   Therefore, first, only the block occupancy matrices of the search source image and all the search destination images are compared. As a comparison method, for example, in the block occupancy matrix of the search destination image, after converting the block with 0% of the effective area in the block to 0 and the other blocks to 1, the block occupancy of the search source image There is a method of taking a logical product with a matrix. As a result, if the block occupancy matrix of the search source image has not changed, the image ID is temporarily stored in the RAM 103 as the next distance calculation target, and if it has changed, it may be excluded from the distance calculation target. it can. Note that this is a method of narrowing down to images having the same invalid area, but conversely, a method of narrowing down to images having the same valid area is also possible. In any case, since the comparison can be performed by a method with a low calculation cost such as logical product, even if the comparison with all the search destination images is performed, the calculation can be performed at a very high speed as compared with the distance calculation.

●距離計算(S403)
以下、ステップS403における距離計算について詳細に説明する。
Distance calculation (S403)
Hereinafter, the distance calculation in step S403 will be described in detail.

本実施形態では、ステップS402のプリサーチで絞り込まれた画像の画像IDを参照して、そのブロック情報占有率行列、ブロック形状行列、ラベル行列(ここではカラーラベル行列)を取得し、検索元画像との距離を式1を使用して求める。

Figure 2007034613
…(式1) In this embodiment, the block ID occupancy matrix, block shape matrix, and label matrix (here, color label matrix) are acquired with reference to the image IDs of the images narrowed down by the pre-search in step S402, and the search source image Is calculated using Equation 1.
Figure 2007034613
... (Formula 1)

式1は、ラベル行列間の距離(最終解)を得るための式である。ここで、Distkは、検索元画像のk番目のブロックのラベルと、検索先画像のk番目のブロックのラベルとのラベル間の距離である。また、WeightPPkは、検索元画像のk番目のブロック内における有効領域の割合と、検索先画像のk番目のブロック内における有効領域の割合に対する重みである。また、WeightSSkは、検索元画像のk番目のブロックのブロック形状と、検索先画像のk番目のブロックのブロック形状とのブロック形状の差に対する重みである。   Expression 1 is an expression for obtaining a distance (final solution) between the label matrices. Here, Distk is the distance between the label of the kth block of the search source image and the label of the kth block of the search destination image. Further, WeightPPk is a weight for the ratio of the effective area in the kth block of the search source image and the ratio of the effective area in the kth block of the search destination image. WeightSSk is a weight for a block shape difference between the block shape of the kth block of the search source image and the block shape of the kth block of the search destination image.

図14は、ラベル行列を比較して距離を求める際に用いる、ラベル間のペナルティマトリックスの一例を示す図である。マトリックス中の値(ペナルティ)が小さい程、ラベルの類似度が高いことを示し、すなわち、ペナルティの値がラベル間の距離を示す。例えば、ラベル2とラベル6のペナルティは"7"である。また、同じラベル同士のペナルティは当然のことながら"0"となっている。本マトリックスの使用目的は、ラベルの類似に応じた距離判定を行うことにある。すなわち本実施形態では、特徴量空間としてRGBカラー空間を用いているので、色の類似度に応じた距離判定が行えることになる。   FIG. 14 is a diagram illustrating an example of a penalty matrix between labels used when the distances are obtained by comparing the label matrices. The smaller the value (penalty) in the matrix, the higher the similarity of the labels, that is, the penalty value indicates the distance between the labels. For example, the penalty for label 2 and label 6 is “7”. Also, the penalty between the same labels is naturally "0". The purpose of using this matrix is to perform distance determination according to the similarity of labels. That is, in the present embodiment, since the RGB color space is used as the feature amount space, the distance can be determined according to the color similarity.

例えば、検索元画像と検索先画像のラベル行列中において、それぞれ対応する位置(ブロック)のラベル値から、図14のペナルティマトリクスを参照してラベル間の距離を求める。   For example, in the label matrix of the search source image and the search destination image, the distance between the labels is obtained from the label value of the corresponding position (block) with reference to the penalty matrix of FIG.

ブロックの割合に対する重みは、検索元画像のk番目のブロック内における有効領域の割合と、検索先画像のk番目のブロック内における有効領域の割合の平均を求め、平均値に対しリニアな重みを与えることにより得られる。平均値に対しリニアな重みを与えるとは、すなわち、平均値(0〜100%)を一次関数で0〜1に変換することである。なお本実施形態においては、ブロック内における有効領域の割合の平均を用いる例を示したが、本発明はこの例に限定されるものではなく、割合の大きい方の値を用いたり、割合の小さいほうの値を用いたり、二乗平均を用いたりしてもよい。また、そのような値を重みに変換するに際し、0%から100%の値に対しリニアな重みを与える例を示したが、本発明はこの例に限定されるものではなく、0%から100%の値に対し二次関数を用いることによって重みに変換してもよい。   The weight for the block ratio is obtained by calculating the average of the ratio of the effective area in the k-th block of the search source image and the ratio of the effective area in the k-th block of the search destination image. It is obtained by giving. Giving a linear weight to the average value means that the average value (0 to 100%) is converted to 0 to 1 by a linear function. In the present embodiment, an example is shown in which the average of effective area ratios in a block is used. However, the present invention is not limited to this example, and a value with a larger ratio is used or a ratio is smaller. Alternatively, the square value may be used. Moreover, when converting such values into weights, an example in which linear weights are given to values from 0% to 100% has been shown, but the present invention is not limited to this example, and 0% to 100%. You may convert into a weight by using a quadratic function with respect to the value of%.

ブロック形状の差に対する重み付けは、図15に示すような表を作成することによって行う。図15において、表の縦軸および横軸に記された(a)〜(j)の文字は、図12に示すブロック近似形状(a)〜(j)にそれぞれ対応する。例えば、検索元のブロック形状が(c)であり、検索先のブロック形状が(g)であった場合は、"1.2"倍の重みが乗じられることになる。重みは、ブロック近似形状情報の重なりの面積に応じて決定されている。なお、図15の表に示した重みは一例に過ぎず、本発明はこの例に限定されるものではない。   The weighting for the block shape difference is performed by creating a table as shown in FIG. In FIG. 15, the letters (a) to (j) written on the vertical and horizontal axes of the table correspond to the block approximate shapes (a) to (j) shown in FIG. For example, if the block shape of the search source is (c) and the block shape of the search destination is (g), the weight is multiplied by “1.2”. The weight is determined according to the overlapping area of the block approximate shape information. The weights shown in the table of FIG. 15 are merely examples, and the present invention is not limited to this example.

ここで図16に、ラベル比較の具体例を示す。図16においては、検索元画像のラベル行列が"11231344X"であり、検索先画像のラベル行列が"11322445X"である。なお最後のブロックについては、ブロック占有率行列の値が0(ブロック内全領域が無効領域)であるため、ラベルの値は未定義である。このようなラベル行列に対し、図14に示すペナルティマトリクスおよび式(1)を用いたマッチングを行うことにより、Dist,WeightP,WeightSが定まり、距離(最終解)が求まる。   FIG. 16 shows a specific example of label comparison. In FIG. 16, the label matrix of the search source image is “11231344X”, and the label matrix of the search destination image is “11322445X”. For the last block, since the value of the block occupancy matrix is 0 (all areas in the block are invalid areas), the label value is undefined. For such a label matrix, Dist, WeightP, and WeightS are determined by performing matching using the penalty matrix shown in FIG. 14 and Equation (1), and the distance (final solution) is obtained.

以上のように本実施形態の距離計算においては、ブロックの近似図形の形状の違いに応じて重みを変えられるよう、図15に示すような重み付けテーブルを導入したことを特徴とする。また、ブロック内における有効領域の割合を距離計算の重みとして使用することを特徴とする。また、ラベル間のパターンマッチングの際に、隣接するセル同士ではペナルティ(距離)を小さくし、遠いものには大きなペナルティを与えるために、図14に示すようなラベル間でのペナルティマトリックスを導入することを特徴とする。   As described above, the distance calculation of this embodiment is characterized in that a weighting table as shown in FIG. 15 is introduced so that the weight can be changed according to the difference in the shape of the approximate figure of the block. Further, the ratio of the effective area in the block is used as a weight for distance calculation. Also, when pattern matching between labels, a penalty matrix between labels as shown in Fig. 14 is introduced to reduce the penalty (distance) between adjacent cells and to give a large penalty to distant cells. It is characterized by that.

以上説明したように本実施形態によれば、任意形状の画像を検索する際に、ブロック内の有効領域の割合に応じたプリサーチを行うことによって、任意形状画像の高速な検索処理が可能となる。   As described above, according to the present embodiment, when searching for an image of an arbitrary shape, it is possible to perform a high-speed search process for an arbitrary shape image by performing pre-search according to the proportion of the effective area in the block. Become.

また、任意形状の画像を検索する際に、ブロック内の有効領域の割合もしくは/および近似形状情報に応じて距離計算の重みを設定することによって、任意形状画像高精度な検索が可能となる。   In addition, when searching for an image having an arbitrary shape, a high-precision search for an arbitrary shape image can be performed by setting a weight for distance calculation in accordance with the ratio of effective areas in blocks or / and approximate shape information.

<変形例>
本実施形態のプリサーチ処理においては、検索元画像のブロック占有率行列と全ての検索先画像のブロック占有率行列との比較を行う例を示した。ここで、画像DB部205のインデックスを図17のように構成することによって、更に高速、かつ、少ないメモリ容量で、同様の検索処理を実現することができる。
<Modification>
In the pre-research processing of this embodiment, an example is shown in which the block occupancy matrix of the search source image is compared with the block occupancy matrices of all the search destination images. Here, by configuring the index of the image DB unit 205 as shown in FIG. 17, it is possible to realize a similar search process at a higher speed and with a smaller memory capacity.

すなわち、画像登録時に、既に登録済みである画像のブロック占有率行列と、登録対象画像のブロック占有率行列とを前述の方法で比較する。そして、ほぼ同じ形状であると判定できる場合に、そのカラーラベルをひとまとめにして保持しておくことによって、図17に示すようなインデックスが作成される。   That is, at the time of image registration, the block occupancy matrix of an already registered image is compared with the block occupancy matrix of the registration target image by the above-described method. Then, when it can be determined that the shapes are almost the same, the color labels are held together to create an index as shown in FIG.

図17において、ブロック占有率行列キーとは、ブロック占有率行列の比較の際に用いた、ブロック内の有効領域が0%のブロックを0、それ以外のブロックを1に変換した行列である。そして、同じブロック占有率行列キーとなる画像ID、ブロック占有率行列、カラーラベル行列のセット(以下、ラベル行列群と称する)をひとまとめにして、インデックスとする。   In FIG. 17, the block occupancy matrix key is a matrix that is used when comparing the block occupancy matrices and is obtained by converting a block whose effective area in the block is 0% to 0 and other blocks to 1. A set of an image ID, a block occupancy matrix, and a color label matrix (hereinafter referred to as a label matrix group) that is the same block occupancy matrix key is collectively used as an index.

従って検索時には、検索元画像のブロック占有率行列とブロック占有率行列キーの論理積をとり、検索元画像のブロック占有率行列が変化しない場合のみ、対応するラベル行列群をRAM203に読み込むことによって、検索対象画像の絞り込みを行う。そして、RAM203上に絞りこまれたラベル行列群中の画像に対してのみ、距離演算を行うようにする。   Therefore, at the time of search, the logical product of the block occupancy matrix of the search source image and the block occupancy matrix key is taken, and only when the block occupancy matrix of the search source image does not change, the corresponding label matrix group is read into the RAM 203, Narrow down the search target image. Then, the distance calculation is performed only on the images in the label matrix group narrowed down on the RAM 203.

このようにすれば、ブロック占有率行列の比較数が少なくなるので、上述した本実施形態で説明した方法よりもさらに高速な処理が可能となる。なお、画像IDとフルパスのファイル名のセットは、別なインデックスとして作成しておき、検索結果を表示する際など、画像ファイル本体を読み出す際には、画像IDに基づいてフルパスファイル名の情報を利用するようにすればよい。もちろん、フルパスファイル名の情報をラベル行列群に含めてもよいが、その場合はメモリの消費量が増えることになる。   In this way, since the number of comparisons of the block occupancy matrix is reduced, processing faster than the method described in the present embodiment described above can be performed. The set of image ID and full path file name is created as a separate index, and when reading the image file itself, such as when displaying search results, the full path file name information is based on the image ID. Use it. Of course, the full path file name information may be included in the label matrix group, but in this case, the memory consumption increases.

また、プリサーチを可能とすることのみを目的とするならば、上述したブロック占有率行列キーのみを使用すればよく、ブロック占有率行列、ブロック形状行列は記録しておく必要がなくなるので、このとき、最も小さなインデックスにより本発明を実現することが可能となる。   If the purpose is only to enable pre-search, only the block occupancy matrix key described above may be used, and the block occupancy matrix and block shape matrix need not be recorded. Sometimes it is possible to implement the present invention with the smallest index.

また、検索時間が長くなっても構わなければ、プリサーチを行はない公正も可能である。このときは、もちろん、インデックスは図7のようになる。また、画像特徴量の距離計算においては、ブロック占有率とブロック形状情報それぞれから求めた重みの両方を使用したが、検索精度が許容範囲であれば、ブロック占有率から求めた重みのみ、或いは、ブロック形状情報から求めた重みのみを用いても良い。もちろん、ブロック占有率から求めた重みのみ使用する場合は、ブロック形状情報の抽出・記録は必要なく、また、ブロック形状情報から求めた重みのみ使用する場合は、ブロック占有率の抽出・記録は必要ない。   Also, if the search time can be long, fairness without pre-search is also possible. In this case, of course, the index is as shown in FIG. In the distance calculation of the image feature amount, both the block occupancy rate and the weight obtained from each of the block shape information are used. If the search accuracy is within an allowable range, only the weight obtained from the block occupancy rate, or Only the weight obtained from the block shape information may be used. Of course, if only the weights obtained from the block occupancy are used, it is not necessary to extract and record the block shape information. If only the weights obtained from the block shape information are used, the block occupancy must be extracted and recorded. Absent.

<他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
<Other embodiments>
Although the embodiments have been described in detail above, the present invention can take embodiments as, for example, a system, an apparatus, a method, a program, or a storage medium (recording medium). The present invention may be applied to a system composed of a single device or an apparatus composed of a single device.

尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。   In the present invention, a software program (in the embodiment, a program corresponding to the flowchart shown in the figure) that realizes the functions of the above-described embodiment is directly or remotely supplied to the system or apparatus, and the computer of the system or apparatus Is also achieved by reading and executing the supplied program code.

従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。   Accordingly, since the functions of the present invention are implemented by computer, the program code installed in the computer also implements the present invention. In other words, the present invention includes a computer program itself for realizing the functional processing of the present invention.

その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。   In that case, as long as it has the function of a program, it may be in the form of object code, a program executed by an interpreter, script data supplied to the OS, or the like.

プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD-ROM、CD-R、CD-RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD-ROM,DVD-R)などがある。   As a recording medium for supplying the program, for example, floppy (registered trademark) disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, CD-RW, magnetic tape, nonvolatile memory card , ROM, DVD (DVD-ROM, DVD-R).

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。   As another program supply method, a client computer browser is used to connect to an Internet homepage, and the computer program of the present invention itself or a compressed file including an automatic installation function is downloaded from the homepage to a recording medium such as a hard disk. Can also be supplied. It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, a WWW server that allows a plurality of users to download a program file for realizing the functional processing of the present invention on a computer is also included in the present invention.

また、本発明のプログラムを暗号化してCD-ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。   In addition, the program of the present invention is encrypted, stored in a storage medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. It is also possible to execute the encrypted program by using the key information and install the program on a computer.

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。   In addition to the functions of the above-described embodiments being realized by the computer executing the read program, the OS running on the computer based on the instructions of the program is a part of the actual processing. Alternatively, the functions of the above-described embodiment can be realized by performing all of them and performing the processing.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。   Furthermore, after the program read from the recording medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion board or The CPU or the like provided in the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are also realized by the processing.

本発明に係る一実施形態における画像処理装置の構成を示すブロック図である。It is a block diagram which shows the structure of the image processing apparatus in one Embodiment which concerns on this invention. 本実施形態における画像処理装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the image processing apparatus in this embodiment. 画像登録処理を示すフローチャートであるIt is a flowchart which shows an image registration process. 領域抽出処理の一例を示す図である。It is a figure which shows an example of an area | region extraction process. 画像の正規化処理を示すフローチャートである。It is a flowchart which shows the normalization process of an image. 任意形状に対する外接矩形の作成例を示す図である。It is a figure which shows the example of creation of the circumscribed rectangle with respect to arbitrary shapes. 画像DB部におけるインデックスのデータ格納形式を示す図である。It is a figure which shows the data storage format of the index in an image DB part. ブロック情報抽出処理を示すフローチャートである。It is a flowchart which shows a block information extraction process. 画像のブロック分割例を示す図である。It is a figure which shows the example of a block division of an image. 順序決定テーブルの一例を示す図である。It is a figure which shows an example of an order determination table. 色空間上の色ビンの構成例を示す図である。It is a figure which shows the structural example of the color bin on color space. ブロック近似図形の一例を示す図である。It is a figure which shows an example of a block approximate figure. 画像検索処理を示すフローチャートであるIt is a flowchart which shows an image search process ラベル間におけるペナルティマトリックスの一例を示す図である。It is a figure which shows an example of the penalty matrix between labels. ブロック近似図形間の差に対する重み付けテーブルの一例を示す図である。It is a figure which shows an example of the weighting table with respect to the difference between block approximate figures. ラベル比較処理の具体例を示す図である。It is a figure which shows the specific example of a label comparison process. 画像DB部におけるインデックスのデータ格納形式を示す図である。It is a figure which shows the data storage format of the index in an image DB part.

Claims (13)

任意形状の画像を入力する画像入力手段と、
前記画像に対して外接矩形を与え作成する外接矩形作成手段と、
前記外接矩形をブロックに分割するブロック分割手段と、
前記ブロックの画像特徴量を抽出する画像特徴量抽出手段と、
前記ブロック内の形状情報を抽出するブロック内形状情報抽出手段と、
前記画像特徴量と前記ブロック内形状情報を前記画像と関連付けて登録する登録手段と、
前記画像特徴量と前記ブロック内形状情報を用いて画像を検索する画像検索手段と、
を有することを特徴とする画像検索処理装置。
An image input means for inputting an image of an arbitrary shape;
Circumscribed rectangle creating means for creating a circumscribed rectangle for the image;
Block dividing means for dividing the circumscribed rectangle into blocks;
Image feature amount extraction means for extracting the image feature amount of the block;
In-block shape information extracting means for extracting shape information in the block;
Registration means for registering the image feature quantity and the in-block shape information in association with the image;
Image search means for searching for an image using the image feature quantity and the shape information in the block;
An image search processing apparatus comprising:
前記画像検索手段は、
前記ブロック内形状情報からブロックごと毎の重みを決定する重み決定手段と、
前記ブロックごと毎の画像特徴量の距離に前記重みによる重み付けを行うことにより、画像間の類似度を算出する類似度算出手段と、
を有することを特徴とする請求項1に記載の画像検索処理装置。
The image search means includes
Weight determining means for determining a weight for each block from the in-block shape information;
Similarity calculation means for calculating the similarity between images by weighting the distance of the image feature amount for each block by the weight;
The image search processing apparatus according to claim 1, further comprising:
前記画像検索手段は、
前記ブロック内形状情報を用いて絞込検索を行う絞込検索手段と
を更に有することを特徴とする請求項1から2のいずれかに記載の画像検索処理装置。
The image search means includes
The image search processing apparatus according to claim 1, further comprising a narrowing search unit that performs a narrowing search using the in-block shape information.
前記ブロック内形状情報は、ブロックにおける前記画像の占有情報を含むことを特徴とする請求項1から3のいずれかに記載の画像検索処理装置。   The image search processing device according to claim 1, wherein the intra-block shape information includes occupancy information of the image in the block. 前記占有情報は、ブロックにおける前記画像の占有率を含むことを特徴とする請求項4に記載の画像検索処理装置。   The image search processing apparatus according to claim 4, wherein the occupancy information includes an occupancy rate of the image in a block. 前記ブロック内形状情報は、ブロックにおける前記画像の近似形状情報を含むことを特徴とする請求項1から5のいずれかに記載の画像検索処理装置。   6. The image search processing device according to claim 1, wherein the in-block shape information includes approximate shape information of the image in the block. 前記占有情報は、ブロックが前記画像を含んでいるかを0か1で示すことを含み、
前記絞込検索手段は、検索元画像の前記占有情報と検索先画像の前記占有情報とを論理積で計算することにより絞込みを行う
ことを特徴とする請求項1から6のいずれかに記載の画像検索処理装置。
The occupancy information includes indicating by 0 or 1 whether a block includes the image;
The narrow-down search unit performs the narrow-down by calculating the occupancy information of the search source image and the occupancy information of the search destination image by a logical product. Image search processing device.
前記占有情報は、ブロックが前記画像を含んでいるかを0か1で示すことを含み、
前記登録手段は、
0か1を用いて表された占有情報が同一である画像特徴量とブロック内形状情報とをまとめ、占有情報をキーとして登録し、
前記絞込検索手段は、検索元画像の前記占有情報と前記キーが一致する画像特徴量とブロック内形状情報を取り出すことにより絞込みを行う
ことを特徴とする請求項1から6のいずれかに記載の画像処理検索装置。
The occupancy information includes indicating by 0 or 1 whether a block includes the image;
The registration means includes
The feature information and the in-block shape information having the same occupation information represented by using 0 or 1 are collected, and the occupation information is registered as a key.
7. The narrowing-down search unit performs narrowing-down by extracting an image feature amount and shape information in a block that match the occupancy information of the search source image and the key. Image processing search device.
前記外接矩形作成手段は、正規化された外接矩形を与え作成する
ことを特徴とする請求項1から8のいずれかに記載の画像検索処理装置。
The image search processing apparatus according to claim 1, wherein the circumscribed rectangle creating unit gives and creates a normalized circumscribed rectangle.
前記画像特徴量抽出手段は、各ブロックにおいて、前記画像を含んでいる範囲のみから画像特徴量を抽出する
ことを特徴とする請求項1から9のいずれかに記載の画像検索処理装置。
The image search processing device according to claim 1, wherein the image feature amount extraction unit extracts an image feature amount from only a range including the image in each block.
任意形状の画像を入力する画像入力ステップと、
前記画像に対して外接矩形を作成する外接矩形作成ステップと、
前記外接矩形をブロックに分割するブロック分割ステップと、
前記ブロックの画像特徴量を抽出する画像特徴量抽出ステップと、
前記ブロック内の形状情報を抽出するブロック内形状情報抽出ステップと、
前記画像特徴量と前記ブロック内形状情報を前記画像と関連付けて登録する登録ステップと、
前記画像特徴量と前記ブロック内形状情報を用いて画像を検索する画像検索ステップと、
を有することを特徴とする画像処理方法。
An image input step for inputting an image of an arbitrary shape;
A circumscribed rectangle creating step for creating a circumscribed rectangle for the image;
A block dividing step of dividing the circumscribed rectangle into blocks;
An image feature amount extracting step for extracting an image feature amount of the block;
In-block shape information extraction step for extracting shape information in the block;
A registration step of registering the image feature quantity and the in-block shape information in association with the image;
An image search step of searching for an image using the image feature amount and the shape information in the block;
An image processing method comprising:
情報処理装置で実行されることによって、該情報処理装置を請求項1乃至10の何れかに記載された情報処理装置として動作するように制御することを特徴とするプログラム。   A program that, when executed by an information processing apparatus, controls the information processing apparatus to operate as the information processing apparatus according to any one of claims 1 to 10. 請求項12に記載されたプログラムが記録されたことを特徴とする記録媒体。   A recording medium on which the program according to claim 12 is recorded.
JP2005215976A 2005-07-26 2005-07-26 Image processing apparatus and method thereof Withdrawn JP2007034613A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005215976A JP2007034613A (en) 2005-07-26 2005-07-26 Image processing apparatus and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005215976A JP2007034613A (en) 2005-07-26 2005-07-26 Image processing apparatus and method thereof

Publications (1)

Publication Number Publication Date
JP2007034613A true JP2007034613A (en) 2007-02-08

Family

ID=37793807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005215976A Withdrawn JP2007034613A (en) 2005-07-26 2005-07-26 Image processing apparatus and method thereof

Country Status (1)

Country Link
JP (1) JP2007034613A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266964A (en) * 2009-05-12 2010-11-25 Canon Inc Image retrieval device, its control method, and program
JP2011118790A (en) * 2009-12-07 2011-06-16 Nippon Telegr & Teleph Corp <Ntt> Similar image retrieval device, similar image retrieval method and similar image retrieval program
JP2017227993A (en) * 2016-06-20 2017-12-28 日本電信電話株式会社 Image normalization device, method, and recording medium capable of reading computer
JP2018073250A (en) * 2016-11-01 2018-05-10 ヤフー株式会社 Retrieval device, retrieval method, and retrieval program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266964A (en) * 2009-05-12 2010-11-25 Canon Inc Image retrieval device, its control method, and program
JP2011118790A (en) * 2009-12-07 2011-06-16 Nippon Telegr & Teleph Corp <Ntt> Similar image retrieval device, similar image retrieval method and similar image retrieval program
JP2017227993A (en) * 2016-06-20 2017-12-28 日本電信電話株式会社 Image normalization device, method, and recording medium capable of reading computer
JP7037875B2 (en) 2016-06-20 2022-03-17 日本電信電話株式会社 Image normalization equipment, methods, and computer-readable recording media
JP2018073250A (en) * 2016-11-01 2018-05-10 ヤフー株式会社 Retrieval device, retrieval method, and retrieval program

Similar Documents

Publication Publication Date Title
JP4920928B2 (en) Image processing apparatus, control method therefor, and program
JP4533273B2 (en) Image processing apparatus, image processing method, and program
JP4266695B2 (en) Image processing apparatus and image processing method
JP4366108B2 (en) Document search apparatus, document search method, and computer program
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
JP5134628B2 (en) Media material analysis of consecutive articles
US7620247B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP4781924B2 (en) White space graph and tree for content adaptive scaling of document images
JP5665125B2 (en) Image processing method and image processing system
JP2004240750A (en) Picture retrieval device
JP2004348591A (en) Document search method and device thereof
JP2011008752A (en) Document operation system, document operation method and program thereof
JP2001202523A (en) Method and device for image processing
JP4785655B2 (en) Document processing apparatus and document processing method
JP2007148677A (en) Image processor and image processing method
JP2005236646A (en) Image display device, method, and program
JP3952592B2 (en) Image search apparatus and method
JPH10260983A (en) Device and method for image retrieval
JP2007034613A (en) Image processing apparatus and method thereof
US11869127B2 (en) Image manipulation method and apparatus
JP2010102502A (en) Image processing device, image processing method, and program
JP6931168B2 (en) Information processing device, control method, program
JP2005208977A (en) Document filing device and method
JP2004240751A (en) Picture retrieval device
JP2005149323A (en) Image processing system, image processing apparatus, and image processing method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007