JP2006023834A - Image processor and its control method, and program - Google Patents

Image processor and its control method, and program Download PDF

Info

Publication number
JP2006023834A
JP2006023834A JP2004199409A JP2004199409A JP2006023834A JP 2006023834 A JP2006023834 A JP 2006023834A JP 2004199409 A JP2004199409 A JP 2004199409A JP 2004199409 A JP2004199409 A JP 2004199409A JP 2006023834 A JP2006023834 A JP 2006023834A
Authority
JP
Japan
Prior art keywords
image
block
feature information
similarity
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004199409A
Other languages
Japanese (ja)
Inventor
Hirotaka Shiiyama
弘隆 椎山
Masahiro Matsushita
昌弘 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004199409A priority Critical patent/JP2006023834A/en
Publication of JP2006023834A publication Critical patent/JP2006023834A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image processor and its control method, and a program for executing the similar image retrieval of images including a document image with high precision. <P>SOLUTION: A comparison origin image is divided into a plurality of blocks. Whether or not any character image is present in each of the divided block images is decided on the basis of the image characteristic information of the divided block images. When it is decided that any character image is present in either of the block image and the block image of the comparison destination image corresponding to the block image, predetermined similarity is acquired as the similarity of them, and when it is decided that any character image is not present in either the block image and the block image of the comparison destination image corresponding to the block image, the similarity based on the image characteristic information of them is acquired. Then, an image being a retrieval result is outputted on the basis of cumulative similarity to be acquired by cumulatively adding the similarity to each block image. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置及びその制御方法、プログラムに関するものである。   The present invention relates to an image processing apparatus that performs a similar image search based on the similarity between a comparison source image serving as a search condition and a comparison destination image, a control method thereof, and a program.

従来、類似画像検索処理においては、登録処理において画像を縦横の複数のブロックに分割し、そのブロックに対する平均色や最頻色等のブロック代表色を算出して、それを画像と対応づけて記憶しておく。そして、検索処理においては、対応する分割ブロックの代表色の差異を積算することにより、類似度を示す距離計算を行い、その計算結果に基づいて、類似画像をソートして出力するものが主流であった(例えば、特許文献1参照)。
特開平7−239856号公報
Conventionally, in a similar image search process, an image is divided into a plurality of vertical and horizontal blocks in a registration process, block representative colors such as an average color and a most frequent color for the block are calculated, and stored in association with the image. Keep it. In the search process, a distance calculation indicating the similarity is performed by accumulating the differences in the representative colors of the corresponding divided blocks, and based on the calculation result, the similar images are sorted and output. (For example, see Patent Document 1).
JP-A-7-239856

上記のような類似画像検索方法は、自然画のような画像全体に色情報が存在する画像においては有用であったが、文書画像のように白地バックグラウンドに画像を貼り込み、その余白に文字が存在するような場合に、白地のバックグラウンドに文字があっても無くとも平均色あるいは最頻色には影響が現れず、文字のある分割ブロックと白地のバックグラウンドとの区別がつかず、ユーザにとって違和感のある検索結果となっていた。特に、平均色あるいは最頻色には影響が現れない理由は、文字画像中の実際の文字画素の占める割合が少ないためである。   The similar image search method as described above was useful for an image in which color information exists in the entire image such as a natural image, but an image is pasted on a white background like a document image, and characters are placed in the margin. If there is a character on the white background, even if there is a character on the white background, the average color or the most frequent color will not be affected, and it is not possible to distinguish between the divided block with the character and the white background, The search result was uncomfortable for the user. In particular, the reason why the average color or the most frequent color has no effect is that the ratio of the actual character pixels in the character image is small.

そこで、このような問題を補うために、予め文書画像を文字領域と画像領域に分離する技術を用い、分離したもの同士の特徴を求める方法がある。この方法によれば、検索精度は高くなるものの、文字領域あるいは画像領域を抽出し損ねた場合には、所望とする画像を検索できなくなる可能性がある。   Therefore, in order to compensate for such a problem, there is a method for obtaining the characteristics of the separated objects by using a technique for separating the document image into a character area and an image area in advance. According to this method, although the search accuracy is improved, there is a possibility that a desired image cannot be searched if the character area or the image area is not extracted.

本発明は上記の課題を解決するためになされたものであり、より精度良く文書画像を含む画像の類似画像検索を実行することができる画像処理装置及びその制御方法、プログラムを提供することを目的とする。   The present invention has been made to solve the above-described problem, and an object thereof is to provide an image processing apparatus, a control method thereof, and a program capable of executing a similar image search of an image including a document image with higher accuracy. And

上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置であって、
前記比較元画像を複数のブロックに分割する分割手段と、
前記分割手段で分割されたブロック画像の画像特徴情報に基づいて、該ブロック画像に文字画像が存在するか否かを判定する判定手段と、
前記判定手段の判定の結果、前記ブロック画像及びそれに対応する前記比較先画像のブロック画像のどちらかに文字画像が存在する場合、両者の類似度として所定の類似度を取得し、一方、前記ブロック及びそれに対応する前記比較先画像のブロック画像のどちらにも文字画像が存在しない場合、その両者の画像特徴情報に基づく類似度を取得する取得手段と、
前記取得手段によって取得される前記分割手段で分割した各ブロック画像に対する類似度を累積加算して得られる累積類似度に基づいて、検索結果となる画像を出力する出力手段と
を備える。
In order to achieve the above object, an image processing apparatus according to the present invention comprises the following arrangement. That is,
An image processing apparatus that performs a similar image search based on a similarity between a comparison source image serving as a search condition and a comparison destination image,
Dividing means for dividing the comparison source image into a plurality of blocks;
Determination means for determining whether a character image exists in the block image based on image feature information of the block image divided by the dividing means;
As a result of the determination by the determination means, when a character image exists in either the block image or the block image corresponding to the comparison target image, a predetermined similarity is acquired as the similarity between the two, while the block image And when there is no character image in either of the block images of the comparison target image corresponding thereto, acquisition means for acquiring the similarity based on the image feature information of both,
Output means for outputting an image as a search result based on a cumulative similarity obtained by cumulatively adding similarities to the respective block images divided by the dividing means acquired by the acquiring means.

また、好ましくは、前記比較手段は、前記比較元画像と前記比較先画像間の画像特徴情報に応じた類似度を管理する管理テーブルを備え、
前記管理テーブルは、前記比較元画像及び前記比較先画像のどちらかに文字画像が存在する場合の該比較元画像と該比較先画像間の画像特徴情報に基づく所定の類似度として、前記比較元画像に文字画像が存在しない場合の該比較元画像と該比較先画像間の画像特徴情報に基づく類似度よりも十分異なる固定値を管理している。
Preferably, the comparison unit includes a management table for managing a similarity according to image feature information between the comparison source image and the comparison destination image,
The management table includes the comparison source as a predetermined similarity based on image feature information between the comparison source image and the comparison destination image when a character image exists in either the comparison source image or the comparison destination image. A fixed value that is sufficiently different from the similarity based on the image feature information between the comparison source image and the comparison target image when no character image exists in the image is managed.

また、好ましくは、前記判定手段は、前記ブロック画像の前記画像特徴情報が示す画像特徴量が所定値以上であるか否かを判定し、前記画像特徴量が所定値以上である場合、該処理対象画像に文字画像が存在すると判定する。   Preferably, the determination unit determines whether or not an image feature amount indicated by the image feature information of the block image is equal to or greater than a predetermined value. If the image feature amount is equal to or greater than a predetermined value, the processing is performed. It is determined that a character image exists in the target image.

また、好ましくは、前記画像特徴情報は、前記ブロック画像の輝度に関する輝度特徴情報である。   Preferably, the image feature information is luminance feature information related to the luminance of the block image.

また、好ましくは、前記輝度特徴情報は、前記ブロック画像の平均輝度あるいは最頻輝度である。   Preferably, the luminance feature information is an average luminance or a mode luminance of the block image.

また、好ましくは、前記輝度特徴情報は、前記ブロック画像中の最も輝度の高い画素の色近傍範囲の平均輝度あるいは最頻輝度である。   Preferably, the luminance feature information is an average luminance or a mode luminance in a color vicinity range of a pixel having the highest luminance in the block image.

上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
類似画像検索の検索対象となる画像の画像登録処理を行う画像処理装置であって、
画像を入力する入力手段と、
前記画像を複数のブロックに分割する分割手段と、
前記分割手段で分割された各ブロック画像の画像特徴情報に基づいて、各ブロック画像に文字画像が存在するか否かを判定する判定手段と、
前記判定手段の判定の結果、前記ブロック画像に文字画像が存在する場合、それを示す情報を画像特徴情報として記憶し、一方、前記ブロック画像に文字画像が存在しない場合、そのブロック画像の画像特徴情報を記憶する記憶手段と
を備える。
In order to achieve the above object, an image processing apparatus according to the present invention comprises the following arrangement. That is,
An image processing apparatus that performs image registration processing of an image to be searched for similar image search,
An input means for inputting an image;
Dividing means for dividing the image into a plurality of blocks;
Determination means for determining whether or not a character image exists in each block image based on image feature information of each block image divided by the dividing means;
If a character image exists in the block image as a result of the determination by the determining means, information indicating the character image is stored as image feature information. On the other hand, if a character image does not exist in the block image, the image feature of the block image is stored. Storage means for storing information.

上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置の制御方法であって、
前記比較元画像を複数のブロックに分割する分割工程と、
前記分割工程で分割されたブロック画像の画像特徴情報に基づいて、該ブロック画像に文字画像が存在するか否かを判定する判定工程と、
前記判定工程の判定の結果、前記ブロック画像及びそれに対応する前記比較先画像のブロック画像のどちらかに文字画像が存在する場合、両者の類似度として所定の類似度を取得し、一方、前記ブロック及びそれに対応する前記比較先画像のブロック画像のどちらにも文字画像が存在しない場合、その両者の画像特徴情報に基づく類似度を取得する取得工程と、
前記取得工程によって取得される前記分割工程で分割した各ブロック画像に対する類似度を累積加算して得られる累積類似度に基づいて、検索結果となる画像を出力する出力工程と
を備える。
In order to achieve the above object, a method for controlling an image processing apparatus according to the present invention comprises the following arrangement. That is,
A control method of an image processing apparatus that performs a similar image search based on a similarity between a comparison source image serving as a search condition and a comparison target image,
A dividing step of dividing the comparison source image into a plurality of blocks;
A determination step of determining whether or not a character image exists in the block image based on image feature information of the block image divided in the division step;
As a result of the determination in the determination step, when a character image exists in either the block image or the block image of the comparison target image corresponding thereto, a predetermined similarity is obtained as the similarity between the two, while the block And when there is no character image in either of the block images of the comparison target image corresponding thereto, an acquisition step of acquiring the similarity based on the image feature information of both,
An output step of outputting an image as a search result based on the cumulative similarity obtained by cumulatively adding the similarity to each block image divided in the division step acquired in the acquisition step.

上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
類似画像検索の検索対象となる画像の画像登録処理を行う画像処理装置の制御方法であって、
画像を入力する入力工程と、
前記画像を複数のブロックに分割する分割工程と、
前記分割工程で分割された各ブロック画像の画像特徴情報に基づいて、各ブロック画像に文字画像が存在するか否かを判定する判定工程と、
前記判定工程の判定の結果、前記ブロック画像に文字画像が存在する場合、それを示す情報を画像特徴情報として記憶し、一方、前記ブロック画像に文字画像が存在しない場合、そのブロック画像の画像特徴情報を記憶部に記憶する記憶工程と
を備える。
In order to achieve the above object, a method for controlling an image processing apparatus according to the present invention comprises the following arrangement. That is,
A control method of an image processing apparatus that performs image registration processing of an image to be searched for similar image search,
An input process for inputting an image;
A dividing step of dividing the image into a plurality of blocks;
A determination step of determining whether or not a character image exists in each block image based on image feature information of each block image divided in the division step;
As a result of the determination in the determination step, if a character image exists in the block image, information indicating it is stored as image feature information. On the other hand, if a character image does not exist in the block image, the image feature of the block image A storage step of storing information in the storage unit.

上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置の制御を実現するプログラムであって、
前記比較元画像を複数のブロックに分割する分割工程のプログラムコードと、
前記分割工程で分割されたブロック画像の画像特徴情報に基づいて、該ブロック画像に文字画像が存在するか否かを判定する判定工程のプログラムコードと、
前記判定工程の判定の結果、前記ブロック画像及びそれに対応する前記比較先画像のブロック画像のどちらかに文字画像が存在する場合、両者の類似度として所定の類似度を取得し、一方、前記ブロック及びそれに対応する前記比較先画像のブロック画像のどちらにも文字画像が存在しない場合、その両者の画像特徴情報に基づく類似度を取得する取得工程のプログラムコードと、
前記取得工程によって取得される前記分割工程で分割した各ブロック画像に対する類似度を累積加算して得られる累積類似度に基づいて、検索結果となる画像を出力する出力工程のプログラムコードと
を備える。
In order to achieve the above object, a program according to the present invention comprises the following arrangement. That is,
A program that realizes control of an image processing apparatus that performs a similar image search based on a similarity between a comparison source image that is a search condition and a comparison target image,
A program code of a dividing step of dividing the comparison source image into a plurality of blocks;
Based on the image feature information of the block image divided in the division step, a program code of a determination step for determining whether or not a character image exists in the block image;
As a result of the determination in the determination step, when a character image exists in either the block image or the block image of the comparison target image corresponding thereto, a predetermined similarity is obtained as the similarity between the two, while the block And when there is no character image in either of the block images of the comparison target image corresponding thereto, the program code of the obtaining step for obtaining the similarity based on the image feature information of both,
Program code of an output step for outputting an image as a search result based on the cumulative similarity obtained by cumulatively adding the similarity to each block image divided in the division step acquired in the acquisition step.

上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
類似画像検索の検索対象となる画像の画像登録処理を行う画像処理装置の制御を実現するプログラムであって、
画像を入力する入力工程と、
前記画像を複数のブロックに分割する分割工程と、
前記分割工程で分割された各ブロック画像の画像特徴情報に基づいて、各ブロック画像に文字画像が存在するか否かを判定する判定工程と、
前記判定工程の判定の結果、前記ブロック画像に文字画像が存在する場合、それを示す情報を画像特徴情報として記憶し、一方、前記ブロック画像に文字画像が存在しない場合、そのブロック画像の画像特徴情報を記憶部に記憶する記憶工程と
を備える。
In order to achieve the above object, a program according to the present invention comprises the following arrangement. That is,
A program that realizes control of an image processing apparatus that performs image registration processing of an image to be searched for similar image search,
An input process for inputting an image;
A dividing step of dividing the image into a plurality of blocks;
A determination step of determining whether or not a character image exists in each block image based on image feature information of each block image divided in the division step;
As a result of the determination in the determination step, if a character image exists in the block image, information indicating it is stored as image feature information. On the other hand, if a character image does not exist in the block image, the image feature of the block image A storage step of storing information in the storage unit.

以上説明したように、本発明によれば、より精度良く文書画像を含む画像の類似画像検索を実行することができる画像処理装置及びその制御方法、プログラムを提供できる。   As described above, according to the present invention, it is possible to provide an image processing apparatus, a control method thereof, and a program capable of executing a similar image search of an image including a document image with higher accuracy.

以下、本発明の実施の形態について図面を用いて詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は本発明の実施形態の画像処理装置のプロック構成図である。   FIG. 1 is a block diagram of an image processing apparatus according to an embodiment of the present invention.

本発明では、画像を登録する画像登録処理、登録されている画像群から所望の画像を検索する画像検索処理について順に説明する。   In the present invention, an image registration process for registering an image and an image search process for searching for a desired image from a registered image group will be described in order.

画像登録処理は、登録対象の画像を入力し、その入力画像の画像特徴量を抽出して、その入力画像と画像特徴量とを対応づけて記憶する処理である。   The image registration process is a process of inputting an image to be registered, extracting an image feature amount of the input image, and storing the input image and the image feature amount in association with each other.

また、画像検索処理は、いわゆる類似画像検索処理であり、検索条件となる比較元画像の画像特徴量の抽出(あるいは登録済みの画像を比較元画像とする場合は、その画像に対応する画像特徴量の読出)を実行し、その画像特徴量と登録済みの比較先画像の画像特徴量との比較を行い、その比較結果に基づいて、比較元画像に類似する画像を検索する。   The image search process is a so-called similar image search process. Extraction of image feature amounts of a comparison source image serving as a search condition (or an image feature corresponding to the image when a registered image is used as a comparison source image) The image feature value is compared with the image feature value of the registered comparison target image, and an image similar to the comparison source image is searched based on the comparison result.

尚、画像登録処理時の画像特徴量の抽出は、本実施形態では、処理対象画像を複数の領域に分割し、各領域ごとに画像特徴量を抽出するが、その領域の縦横ブロック数は、処理対象画像のアスペクト比や大きさに関わらず同一とする。また、同様に、画像検索処理時の画像特徴量の抽出も、画像登録処理時の画像特徴量の抽出と同様の条件とする。また、ここでいう画像特徴量は、画像の色に関する色特徴情報、画像の輝度に関する輝度特徴情報の両方を含む。   In this embodiment, the image feature amount extraction at the time of the image registration process is performed by dividing the processing target image into a plurality of regions and extracting the image feature amount for each region. It is the same regardless of the aspect ratio and size of the processing target image. Similarly, the extraction of the image feature amount during the image search process is performed under the same conditions as the extraction of the image feature amount during the image registration process. The image feature amount here includes both color feature information relating to the color of the image and luminance feature information relating to the luminance of the image.

図1において、101はユーザインターフェース(UI)部であり、本発明に係る画像登録処理及び画像検索処理を含む各種処理を実行するためのユーザインターフェースである。このユーザインタフェースは、例えば、グラフィックユーザインターフェース及び入力デバイスによって実現される。ユーザは、このUI部101によって、画像登録処理及び画像検索処理を適宜実行することができる。   In FIG. 1, reference numeral 101 denotes a user interface (UI) unit, which is a user interface for executing various processes including an image registration process and an image search process according to the present invention. This user interface is realized by, for example, a graphic user interface and an input device. The user can appropriately execute the image registration process and the image search process by using the UI unit 101.

102は画像入力処理部であり、画像登録処理による登録対象の画像を入力する。103は画像蓄積処理部であり、入力した画像を画像蓄積部103aに蓄積する。104は画像管理情報処理部であり、入力した画像を管理するための管理情報を生成し、画像管理DB104aに蓄積する。105は輝度特徴情報抽出処理部であり、入力した画像の輝度に関する輝度特徴情報を抽出し、抽出した輝度特徴情報を輝度特徴情報インデックステーブル105aに登録する。106は色特徴情報抽出処理部であり、入力した画像の色に関する色特徴情報を抽出し、抽出した色特徴情報を色特徴情報インデックステーブル106aに登録する。   An image input processing unit 102 inputs an image to be registered by the image registration process. An image accumulation processing unit 103 accumulates the input image in the image accumulation unit 103a. Reference numeral 104 denotes an image management information processing unit that generates management information for managing the input image and stores it in the image management DB 104a. A luminance feature information extraction processing unit 105 extracts luminance feature information related to the luminance of the input image, and registers the extracted luminance feature information in the luminance feature information index table 105a. A color feature information extraction processing unit 106 extracts color feature information related to the color of the input image and registers the extracted color feature information in the color feature information index table 106a.

107は比較元画像入力部処理部であり、画像検索処理による検索条件となる画像(類似画像検索での比較元画像)を入力する。108は判定処理部であり、入力した比較元画像の色情報が十分であるか否かを判定する。   Reference numeral 107 denotes a comparison source image input unit processing unit, which inputs an image (a comparison source image in a similar image search) that is a search condition by the image search process. A determination processing unit 108 determines whether or not the input color information of the comparison source image is sufficient.

109は色特徴情報比較処理部であり、色特徴情報による比較元画像と比較先画像との類似比較を行う。110は輝度特徴情報比較処理部であり、輝度特徴情報による比較元画像と比較先画像との類似比較を行う。   A color feature information comparison processing unit 109 performs similarity comparison between the comparison source image and the comparison destination image based on the color feature information. A luminance feature information comparison processing unit 110 performs similarity comparison between the comparison source image and the comparison destination image based on the luminance feature information.

111は検索結果表示処理部であり、色特徴情報比較処理部109あるいは輝度特徴情報比較処理部110の処理結果に基づいて、検索結果となる画像を表示する。また、この検索結果表示処理部111においては、検索結果となる画像をプリンタによって印刷するように構成しても良い。特に、検索結果となる画像が1つだけで、その画像を印刷したい場合には、処理の迅速化を図ることができる。   A search result display processing unit 111 displays an image as a search result based on the processing result of the color feature information comparison processing unit 109 or the luminance feature information comparison processing unit 110. In addition, the search result display processing unit 111 may be configured to print an image as a search result by a printer. In particular, when there is only one image as a search result and it is desired to print the image, the processing can be speeded up.

尚、画像処理装置を構成する各種構成要素が実行する処理の詳細については、以下順に説明して行く。   Note that details of processes executed by various components constituting the image processing apparatus will be described in the following order.

また、画像処理装置は、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、メモリ(RAM、ROM)、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。   The image processing apparatus has standard components (for example, a CPU, a memory (RAM, ROM), a hard disk, an external storage device, a network interface, a display, a keyboard, a mouse, etc.) mounted on a general-purpose computer. Yes.

更に、図1に示される各種構成要素のすべてあるいはその一部は、専用のハードウエアで実現されても良いし、CPUの制御によって実行されるソフトウェアで実現されても良い。   Further, all or some of the various components shown in FIG. 1 may be realized by dedicated hardware, or may be realized by software executed under the control of the CPU.

まず、UI部101を介して画像登録処理を実行する場合について説明する。   First, a case where image registration processing is executed via the UI unit 101 will be described.

[画像登録処理]
画像登録処理では、まず、画像入力処理部102で、登録対象の画像を入力する。この登録対象の画像の入力は、例えば、スキャナ等の入力デバイスを用いて行ったり、外部記憶装置に記憶されている画像を読み込むことで実現される。入力した画像は、一旦、メモリ上に記憶され、このメモリに記憶された画像のデータフォーマットから、その画像の種類が、カラー、モノクロ、グレースケール画像のいずれであるかを判定することができる。
[Image registration process]
In the image registration process, first, the image to be registered is input by the image input processing unit 102. The registration target image is input using, for example, an input device such as a scanner or by reading an image stored in an external storage device. The input image is temporarily stored in the memory, and from the data format of the image stored in the memory, it can be determined whether the image type is a color, monochrome, or grayscale image.

次に、画像蓄積処理部103は、メモリ上の画像を画像蓄積部103aへ記憶格納し、その画像とのファイル名を対応づけて記憶する。   Next, the image storage processing unit 103 stores and stores the image on the memory in the image storage unit 103a, and stores the file name in association with the image.

次に、画像管理情報処理部104は、画像に対して固有の画像IDを発番し、その画像IDとその画像のファイル名(その格納先(アドレス)を示すフルパス情報を含むファイル名)、画像入力時の日付を対応づけた情報を管理情報として画像管理データベース(DB)104aに記憶する。   Next, the image management information processing unit 104 issues a unique image ID to the image, the image ID and the file name of the image (file name including full path information indicating the storage location (address)), Information associated with the date at the time of image input is stored as management information in the image management database (DB) 104a.

尚、画像管理DB104aの構成の一例を示すと、図2のようになる。   An example of the configuration of the image management DB 104a is shown in FIG.

次に、輝度特徴情報抽出処理部105で、画像の輝度に関する輝度特徴情報を抽出し、その抽出した輝度特徴情報と画像IDとを対応づけて輝度特徴情報インデックステーブル105aに登録する。また、色特徴情報抽出処理部106で、画像の色に関する色特徴情報を抽出し、その抽出した色特徴情報と画像IDとを対応づけて色特徴情報インデックステーブル106aに登録する。   Next, the luminance feature information extraction processing unit 105 extracts luminance feature information related to the luminance of the image, and registers the extracted luminance feature information and the image ID in the luminance feature information index table 105a in association with each other. Further, the color feature information extraction processing unit 106 extracts color feature information relating to the color of the image, and associates the extracted color feature information with the image ID and registers them in the color feature information index table 106a.

尚、輝度特徴情報インデックステーブル105a及び色特徴情報インデックステーブル106aの構成の一例を示すと、それぞれ図3及び図4のようになる。これらのインデックステーブルでは、各種特徴情報と画像IDとを対にして記憶管理することで、画像管理DB104aのレコードと、画像IDを仲立ちにして対応をとることが可能となっている。   An example of the configuration of the luminance feature information index table 105a and the color feature information index table 106a is shown in FIGS. 3 and 4, respectively. In these index tables, various feature information and image IDs are stored and managed in pairs, so that correspondence can be established by intermediating records in the image management DB 104a with image IDs.

また、色特徴情報抽出処理部106では、処理対象画像の種類がモノクロあるいはグレースケール画像である場合でも、その色特徴情報を抽出する。これは、特に、比較元画像がカラー画像である場合には、その色特徴情報を用いた類似画像検索処理を実行することになるが、その際に比較先画像がモノクロあるいはグレースケール画像のような色情報がない場合には、そのことを示す色特徴情報も極めて重要な情報となり得るからである。   Further, the color feature information extraction processing unit 106 extracts the color feature information even when the type of the processing target image is a monochrome or gray scale image. In particular, when the comparison source image is a color image, a similar image search process using the color feature information is executed. At this time, the comparison destination image is a monochrome or grayscale image. This is because if there is no color information, the color feature information indicating this can be extremely important information.

例えば、比較元画像が、薄い色、例えば、パステルカラー等で構成される場合には、比較先画像がモノクロ、グレースケール画像であるとしても、比較元画像の色特徴情報と比較先画像(検索対象画像)の色特徴情報との間で高い類似度が算出される期待があるからである。   For example, when the comparison source image is composed of a light color, for example, pastel color, even if the comparison destination image is a monochrome or grayscale image, the color feature information of the comparison source image and the comparison destination image (search This is because there is an expectation that a high degree of similarity is calculated with the color feature information of the target image.

次に、輝度特徴情報抽出処理部105が実行する処理の詳細について説明する。   Next, details of processing executed by the luminance feature information extraction processing unit 105 will be described.

<輝度特徴情報抽出処理>
ここでは、処理対象画像を複数のブロックに分割した各ブロックの平均輝度に対応する輝度階級と各ブロックの位置情報を対応付けた情報を輝度特徴情報として抽出する。
<Luminance feature information extraction processing>
Here, information associating the luminance class corresponding to the average luminance of each block obtained by dividing the processing target image into a plurality of blocks and the position information of each block is extracted as luminance feature information.

以下、この処理の詳細について、図5を用いて説明する。   Details of this processing will be described below with reference to FIG.

図5は本発明の実施形態の輝度特徴情報抽出処理の詳細を示すフローチャートである。   FIG. 5 is a flowchart showing details of the luminance feature information extraction processing according to the embodiment of the present invention.

まず、ステップS501で、処理対象画像がカラー画像であるか否かを判定する。   First, in step S501, it is determined whether or not the processing target image is a color image.

この判定は、処理対象画像のデータフォーマットに基づいて実行する。   This determination is performed based on the data format of the processing target image.

例えば、マイクロソフト社が提供するオペレーティングシステムであるWindows(登録商標)で用いられる汎用的な画像データフォーマットであるDIBフォーマットにおいては、データヘッダ中の構造体BITMAPINFOHEADERのメンバーであるbiBitCountは、画像中の1ピクセルを表現するのに用いるビット数を示している。   For example, in the DIB format which is a general-purpose image data format used in Windows (registered trademark) which is an operating system provided by Microsoft, biBitCount which is a member of the structure BITMAPINFOHEADER in the data header is 1 in the image. The number of bits used to represent a pixel is shown.

特に、このbiBitCountが24である場合にはフルカラー画像を示し、biBitCountが1の場合にはモノクロ2値画像を示し、biBitCountが8の場合には256色カラーあるいはグレースケール画像を示している。   In particular, when the biBitCount is 24, a full color image is shown, when the biBitCount is 1, a monochrome binary image is shown, and when the biBitCount is 8, a 256 color or grayscale image is shown.

また、biBitCountが8の場合には、データヘッダ中の構造体BITMAPINFOのメンバーbmiColorsの内容を参照することで、画像が256色カラーあるいはグレースケール画像であるかを判定することができる。つまり、メンバーbmiColorsでは、その内容として、グレースケール表現のカラーパレットであるか、256色に減色するカラーパレットであるかが示されているので、その内容に基づいて、画像が256色カラーあるいはグレースケール画像であるかを判定することができる。   When biBitCount is 8, it is possible to determine whether the image is a 256 color image or a gray scale image by referring to the contents of the member bmiColors of the structure BITMAPINFO in the data header. In other words, the member bmiColors indicates whether the content is a gray scale expression color palette or a color palette that is reduced to 256 colors, and based on the content, the image is displayed in 256 colors or gray. Whether the image is a scale image can be determined.

ステップS501において、処理対象画像がカラー画像でない場合(ステップS501でNO)、ステップS503に進む。一方、処理対象画像がカラー画像である場合(ステップS501でYES)、ステップS502に進み、カラー画像をグレースケール画像(8ビット:256階調)に変換する。   In step S501, when the processing target image is not a color image (NO in step S501), the process proceeds to step S503. On the other hand, if the processing target image is a color image (YES in step S501), the process advances to step S502 to convert the color image into a grayscale image (8 bits: 256 gradations).

尚、この変換は、公知のRGBカラーマトリックスを用いて実行する。例えば、YCbCr色空間を用いると、グレースケール値を示す輝度Yの値と、RGB値(各8ビットの計24ビット)との関係は、
Y=0.29900*R+0.58700*G+0.11400*B (1)
と表現される。従って、(1)式により、輝度Yの値を算出することができる。
This conversion is performed using a known RGB color matrix. For example, when the YCbCr color space is used, the relationship between the luminance Y value indicating the gray scale value and the RGB value (8 bits each, 24 bits in total) is
Y = 0.29900 * R + 0.58700 * G + 0.11400 * B (1)
It is expressed. Therefore, the value of the luminance Y can be calculated by the equation (1).

次に、ステップS503で、画像を複数のブロックに分割する。   Next, in step S503, the image is divided into a plurality of blocks.

尚、本実施形態では、図6に示すように、画像を縦横それぞれ9ブロックに分割する。特に、本実施形態では、表記の都合上9×9=81ブロックに分割している例を示しているが、実際には、8から16ブロック前後が好ましい。   In the present embodiment, as shown in FIG. 6, the image is divided into 9 blocks vertically and horizontally. In particular, in the present embodiment, an example is shown in which 9 × 9 = 81 blocks are divided for convenience of description, but actually 8 to 16 blocks are preferable.

次に、ステップS504で、処理対象となる着目ブロックを左上端のブロックに設定する。尚、この着目ブロックの設定は、例えば、図7に示すように、予め処理順序が決定された順序決定テーブルを参照して行う。本例では、左上端から1つ右へ走査し、そのブロックから左斜め下へ走査を行う。これを繰返し行うことによりスキャンする走査例を示している。   In step S504, the target block to be processed is set as the upper left block. For example, as shown in FIG. 7, the block of interest is set with reference to an order determination table in which the processing order is determined in advance. In this example, scanning is performed one right from the upper left corner, and scanning is performed obliquely from the block to the lower left. The scanning example which scans by repeating this is shown.

ステップS505で、未処理の着目ブロックの有無を判定する。未処理の着目ブロックがない場合(ステップS505でNO)、処理を終了する。一方、未処理の着目ブロックがある場合(ステップS505でYES)、ステップS506に進む。   In step S505, it is determined whether there is an unprocessed block of interest. If there is no unprocessed block of interest (NO in step S505), the process ends. On the other hand, if there is an unprocessed block of interest (YES in step S505), the process proceeds to step S506.

ステップS506で、着目ブロックの全画素の輝度の平均輝度を算出する。ステップS507で、算出した平均輝度が輝度閾値Th_G以上であるか否かを判定する。平均輝度が輝度閾値Th_G未満である場合(ステップS507でNO)、ステップS508に進む。   In step S506, the average brightness of the brightness of all the pixels in the block of interest is calculated. In step S507, it is determined whether or not the calculated average luminance is equal to or higher than a luminance threshold Th_G. If the average luminance is less than the luminance threshold Th_G (NO in step S507), the process proceeds to step S508.

そして、ステップS508で、図8の輝度階級テーブルを参照して、平均輝度に対応する輝度階級IDをその着目ブロックの代表輝度として決定し、その着目ブロックとその位置に対応づけて輝度特徴情報インデックステーブル105aに記憶する。   In step S508, the brightness class ID corresponding to the average brightness is determined as the representative brightness of the target block with reference to the brightness class table of FIG. 8, and the brightness feature information index is associated with the target block and its position. Store in table 105a.

尚、図8の輝度階級テーブルは、8ビットの輝度信号を、所定輝度範囲毎に設定した各種輝度階級と、文字ブロックであることを示す輝度階級で構成されている。   Note that the luminance class table of FIG. 8 is composed of various luminance classes in which an 8-bit luminance signal is set for each predetermined luminance range, and luminance classes indicating character blocks.

ステップS509で、図7の順序決定テーブルを参照して、次の処理対象となる着目ブロックを設定する。その後、ステップS505に戻り、未処理の着目ブロックがなくなるまで、ステップS505〜ステップS512の処理を再帰的に繰り返す。   In step S509, the next block of interest is set with reference to the order determination table of FIG. Thereafter, the process returns to step S505, and the processes in steps S505 to S512 are recursively repeated until there is no unprocessed block of interest.

尚、ステップS507において、平均輝度が輝度閾値Th_G以上であるか否かを判定する理由は、通常、印刷文書画像のバックグラウンドは白であり、印刷の無い部分で白色を表現しているため、適切な閾値Th_G以上の部分が無地背景か文字のある背景と仮定して差し支えないからである。この閾値Th_Gに関しては、例えば、再生紙のように無地であるが、スキャンしたときに輝度が低いものも考慮に入れておく必要がある。   Note that the reason why it is determined in step S507 whether or not the average brightness is equal to or higher than the brightness threshold Th_G is that the background of the print document image is usually white and white is expressed in a non-printed portion. This is because it may be assumed that the portion above the appropriate threshold Th_G is a plain background or a background with characters. Regarding this threshold Th_G, for example, it is plain like recycled paper, but it is necessary to take into account the low brightness when scanned.

一方、ステップS507において、算出した平均輝度が輝度閾値Th_G以上である場合(ステップS507でYES)、ステップS510で、着目ブロック内に文字があるか否かの検証を実行する。そして、ステップS511で、その検証結果に基づいて、文字の有無を判定する。文字がない場合(ステップS511でNO)、ステップS508に進む。   On the other hand, if the calculated average brightness is equal to or greater than the brightness threshold Th_G in step S507 (YES in step S507), it is verified in step S510 whether there is a character in the block of interest. In step S511, the presence / absence of characters is determined based on the verification result. If there is no character (NO in step S511), the process proceeds to step S508.

一方、文字がある場合(ステップS511でYES)、ステップS512で、着目ブロックが文字ブロックであることを示す特殊な輝度階級ID、図8では、輝度階級ID17を着目ブロックとその位置に対応づけて輝度特徴情報インデックステーブル105aに記憶する。   On the other hand, if there is a character (YES in step S511), in step S512, a special luminance class ID indicating that the block of interest is a character block, in FIG. 8, the luminance class ID 17 is associated with the block of interest and its position. Stored in the luminance feature information index table 105a.

以上の処理によって、処理対象画像のブロック毎の平均輝度に対応する代表輝度あるいは文字ブロックを示す情報と、各ブロックの位置情報が対応付けられた情報を輝度特徴情報として抽出することができる。   Through the above processing, information indicating the representative luminance or character block corresponding to the average luminance for each block of the processing target image and the information in which the position information of each block is associated can be extracted as luminance feature information.

次に、ステップS510の着目ブロック内の文字の有無の判定処理の詳細について、図9を用いて説明する。   Next, details of the process for determining whether or not there is a character in the block of interest in step S510 will be described with reference to FIG.

<着目ブロック内の文字情報の有無の判定処理>
図9は本発明の実施形態のステップS510の着目ブロック内の文字の有無の判定処理の詳細を示すフローチャートである。
<Determining whether or not there is character information in the block of interest>
FIG. 9 is a flowchart showing details of the process for determining whether or not there is a character in the block of interest in step S510 according to the embodiment of the present invention.

ステップS601で、ステップS502で既に取得しているグレースケール画像から、着目ブロックのグレースケール画像を取得する。ステップS602で、閾値Th_Charを用いて、この閾値Th_Charを超える画素のランレングス分布を水平方向と鉛直方向の両方向で取得する。   In step S601, a grayscale image of the block of interest is acquired from the grayscale image already acquired in step S502. In step S602, using the threshold value Th_Char, the run length distribution of pixels exceeding the threshold value Th_Char is obtained in both the horizontal direction and the vertical direction.

尚、ランレングス分布を取得する範囲は、想定している文字サイズを少し超える程度の範囲までで構わない。また、閾値Th_Charに関しては、着目ブロックの平均輝度を用いると良く、簡易的には、閾値Th_Gを代用しても構わない。   The range for obtaining the run-length distribution may be a range that slightly exceeds the assumed character size. As for the threshold value Th_Char, the average luminance of the block of interest may be used. For simplicity, the threshold value Th_G may be used instead.

更に、ある程度の濃度の色地文書画像に対応するために、予め文書画像の最も輝度の高い画素とその輝度を取得しておき、その値に、閾値Th_Gを加算した値を新たなTh_Gとして用いても良い。   Further, in order to correspond to a color ground document image of a certain density, the highest luminance pixel of the document image and its luminance are acquired in advance, and a value obtained by adding a threshold value Th_G to the value is used as a new Th_G. May be.

一般に、文字が存在する領域をランレングス分布で統計解析すると、図10のような文字フォントの大きさ近傍で急激にピークを持ち、文字フォントの大きさを越えた付近で急激に分布が激減する特徴のある分布が得られる。   In general, when a region where characters exist is statistically analyzed with a run-length distribution, the distribution has a sharp peak near the size of the character font as shown in FIG. 10, and the distribution sharply decreases near the size of the character font. A characteristic distribution is obtained.

この性質を用いて、ランレングス分布のピークの分散と急激な負の分布の傾き勾配を検出することにより、文字の有無を推定することが可能である。   By using this property, it is possible to estimate the presence or absence of characters by detecting the dispersion of the peak of the run-length distribution and the slope of the steep negative distribution.

そこで、まず、ステップS603で、水平・鉛直方向の両方向のランレンレングス分布のピークの分散を算出する。ステップS604で、水平・鉛直方向の両方向におけるランレングス分布の最頻値に相当するランレングスより長い領域において、最も急激な頻度減少勾配を算出する。   Therefore, first, in step S603, the dispersion of the peak of the run-len length distribution in both the horizontal and vertical directions is calculated. In step S604, the steepest frequency decrease gradient is calculated in a region longer than the run length corresponding to the mode value of the run length distribution in both the horizontal and vertical directions.

ステップS605で、算出した分散が閾値以上で、かつ算出した減少勾配が閾値以上であるか否かを判定する。算出した分散が閾値以上で、かつ算出した減少勾配が閾値以上でない場合(ステップS605でNO)、ステップS606に進み、着目ブロック内に文字がないと判定する。一方、算出した分散が閾値以上で、かつ算出した減少勾配が閾値以上である場合(ステップS605でYES)、ステップS607に進み、着目ブロック内に文字があると判定する。   In step S605, it is determined whether or not the calculated variance is greater than or equal to a threshold and the calculated decrease gradient is greater than or equal to the threshold. If the calculated variance is equal to or greater than the threshold and the calculated decrease gradient is not equal to or greater than the threshold (NO in step S605), the process proceeds to step S606, and it is determined that there are no characters in the block of interest. On the other hand, when the calculated variance is equal to or greater than the threshold and the calculated decrease gradient is equal to or greater than the threshold (YES in step S605), the process proceeds to step S607, and it is determined that there is a character in the block of interest.

以上の処理によって、大まかに着目ブロック内に、ある程度の文字があるか否かを判定することができるが、更に、着目ブロックの縦横方向の輝度累積情報を生成し、上記文字フォントの大きさの推定値の数倍の値を上限とする自己相関関数を算出すると、文字列がある場合には文字の段組幅に相当する値で顕著なピークを検出することが可能となるので、文字の有無の判定精度を向上させることができる。   Through the above processing, it is possible to roughly determine whether or not there is a certain amount of characters in the block of interest. Furthermore, the accumulated luminance information in the vertical and horizontal directions of the block of interest is generated, and the size of the character font is determined. If an autocorrelation function with an upper limit of several times the estimated value is calculated, if there is a character string, it becomes possible to detect a significant peak at a value corresponding to the column width of the character. The presence / absence determination accuracy can be improved.

次に、色特徴情報抽出処理部106が実行する処理の詳細について説明する。   Next, details of processing executed by the color feature information extraction processing unit 106 will be described.

尚、色特徴情報抽出は、直感的には、上述の輝度特徴情報抽出を3次元に拡張したものと考えればよい。例えば、輝度特徴情報抽出では、図8の1次元の輝度階級テーブルを用いて、各着目ブロックの代表輝度を決定したが、色特徴情報抽出では、図11のようなRGB色空間を立体的に複数の部分空間(いわゆる、色ビン)に分割し、この色ビン毎に色特徴情報を抽出することになる。   Intuitively, the color feature information extraction may be considered as an extension of the above-described luminance feature information extraction to three dimensions. For example, in the luminance feature information extraction, the representative luminance of each block of interest is determined using the one-dimensional luminance class table of FIG. 8, but in the color feature information extraction, the RGB color space as shown in FIG. It is divided into a plurality of partial spaces (so-called color bins), and color feature information is extracted for each color bin.

以下、この処理の詳細について、図12を用いて説明する。   Details of this processing will be described below with reference to FIG.

図12は本発明の実施形態の色特徴情報抽出処理の詳細を示すフローチャートである。   FIG. 12 is a flowchart showing details of the color feature information extraction processing according to the embodiment of the present invention.

まず、ステップS1201で、処理対象画像がカラー画像であるか否かを判定する。尚、この判定は、図5のステップS501と同様にして行う。   First, in step S1201, it is determined whether or not the processing target image is a color image. This determination is performed in the same manner as step S501 in FIG.

ステップS1201において、処理対象画像がカラー画像である場合(ステップS1201でYES)、ステップS1203に進む。一方、処理対象画像がカラー画像でない場合(ステップS1201でNO)、ステップS1202に進み、グレースケール画像をカラー画像に変換する。   In step S1201, when the processing target image is a color image (YES in step S1201), the process proceeds to step S1203. On the other hand, if the processing target image is not a color image (NO in step S1201), the process proceeds to step S1202, and the grayscale image is converted into a color image.

尚、このグレースケール画像からカラー画像への変換は、例えば、輝度値aの画素を、RGB値(a,a,a)とし、DIBフォーマットのバディングを考慮してデータ並びを整えればよい。このパディングとは、WINDOWS(登録商標)のDIBフォーマット(ファイルとして実在するビットマップファイル(*.BMP))におけるカラー画像データを格納する際の画像データ表現仕様である。   In this conversion from a grayscale image to a color image, for example, the pixels having the luminance value a may be RGB values (a, a, a), and the data arrangement may be adjusted in consideration of the DIB format padding. This padding is an image data expression specification for storing color image data in the WINDOWS (registered trademark) DIB format (bitmap file (* .BMP) that exists as a file).

次に、ステップS1203で、画像を複数のブロックに分割する。本実施形態では、図6に示すように、画像を縦横をそれぞれ9ブロックに分割する。特に、本実施形態では、表記の都合上9×9=81ブロックに分割している例を示しているが、実際には、15×15=225ブロック程度であることが好ましい。   In step S1203, the image is divided into a plurality of blocks. In the present embodiment, as shown in FIG. 6, the image is divided into 9 blocks in the vertical and horizontal directions. In particular, in the present embodiment, an example in which it is divided into 9 × 9 = 81 blocks for convenience of description is shown, but actually, it is preferable that there are about 15 × 15 = 225 blocks.

次に、ステップS1204で、処理対象となる着目ブロックを左上端のブロックに設定する。尚、この着目ブロックの設定は、図5のステップS1204と同様にして行う。   In step S1204, the target block to be processed is set as the upper left block. The target block is set in the same manner as step S1204 in FIG.

ステップS1205で、未処理の着目ブロックの有無を判定する。未処理の着目ブロックがない場合(ステップS1205でNO)、処理を終了する。一方、未処理の着目ブロックがある場合(ステップS1205でYES)、ステップS1206に進む。   In step S1205, the presence / absence of an unprocessed block of interest is determined. If there is no unprocessed block of interest (NO in step S1205), the process ends. On the other hand, if there is an unprocessed block of interest (YES in step S1205), the process advances to step S1206.

ステップS1206で、着目ブロックが文字ブロックであるか否かを判定する。着目ブロックが文字ブロックでない場合(ステップS1206でNO)、ステップS1207に進む。   In step S1206, it is determined whether the block of interest is a character block. If the block of interest is not a character block (NO in step S1206), the process proceeds to step S1207.

尚、この判定は、着目ブロックの輝度階級IDを参照して判定する。   This determination is made with reference to the luminance class ID of the block of interest.

ステップS1207で、着目ブロック内の全画素の色の平均色を算出する。ステップS1208で、算出した平均色を、図11の色空間を分割して作った部分空間である色ビンへ射影し、対応する色ビンIDを、その着目ブロックの代表色と決定する。そして、その色ビンIDと、着目ブロックとをその位置に対応づけて色特徴情報インデックステーブル106aに記憶する。   In step S1207, an average color of the colors of all pixels in the block of interest is calculated. In step S1208, the calculated average color is projected onto a color bin which is a partial space created by dividing the color space of FIG. 11, and the corresponding color bin ID is determined as the representative color of the block of interest. Then, the color bin ID and the block of interest are associated with the position and stored in the color feature information index table 106a.

尚、本実施形態では、図11に示すように、RGB色空間を3×3×3=27に分割した色ビンへ着目ブロックの全画素の濃度値を射影する場合を示しているが、実際には、RGB色空間を6×6×6=216に分割した色ビンへ着目ブロックの平均色を射影するほうが好ましい。   In the present embodiment, as shown in FIG. 11, the density value of all the pixels of the block of interest is projected onto a color bin obtained by dividing the RGB color space into 3 × 3 × 3 = 27. For this, it is preferable to project the average color of the block of interest onto a color bin obtained by dividing the RGB color space into 6 × 6 × 6 = 216.

ステップS1209で、図7の順序決定テーブルを参照して、次の処理対象となる着目ブロックを設定する。その後、ステップS1205に戻り、未処理の着目ブロックがなくなるまで、ステップS1205〜ステップS1210の処理を再帰的に繰り返す。   In step S1209, the target block to be processed next is set with reference to the order determination table of FIG. Thereafter, the process returns to step S1205, and the processes in steps S1205 to S1210 are recursively repeated until there is no unprocessed block of interest.

一方、ステップS1206において、着目ブロックが文字ブロックである場合(ステップS1206でYES)、ステップS1210で、文字ブロックを示す色ビンIDを、着目ブロックとをその位置に対応づけて色特徴情報インデックステーブル106aに記憶する。   On the other hand, if the block of interest is a character block in step S1206 (YES in step S1206), in step S1210, the color bin ID indicating the character block is associated with the block of interest and the color feature information index table 106a. To remember.

尚、6×6×6=216の色ビンを用いている場合には、例えば、文字ブロックを示す色ビンIDとして、色ビンID217を用いればよい。   If 6 × 6 × 6 = 216 color bins are used, for example, a color bin ID 217 may be used as a color bin ID indicating a character block.

以上の処理によって、処理対象画像のブロック毎の平均色に対応する代表色あるいは文字ブロックを示す情報と、各ブロックの位置情報が対応付けられた情報を色特徴情報として抽出することができる。   Through the above processing, information indicating the representative color or character block corresponding to the average color of each block of the processing target image and the position information of each block can be extracted as color feature information.

[画像検索処理]
画像検索処理では、まず、比較元画像入力部107で、検索条件となる比較元画像を入力する。この比較元画像の入力は、例えば、スキャナ等の入力デバイスを用いて行ったり、外部記憶装置に記憶されている画像を読み込むことで実現される。入力した画像は、一旦、メモリ上に記憶され、このメモリに記憶された画像のデータフォーマットから、その画像の種類が、カラー画像、モノクロ、グレースケール画像のいずれであるかを判定することができる。
[Image search processing]
In the image search process, first, the comparison source image input unit 107 inputs a comparison source image serving as a search condition. The input of the comparison source image is realized, for example, by using an input device such as a scanner or by reading an image stored in an external storage device. The input image is temporarily stored in a memory, and from the data format of the image stored in the memory, it can be determined whether the image type is a color image, a monochrome image, or a grayscale image. .

尚、本実施形態の画像検索処理は、比較元画像の色情報が十分であるかどうかだけに着目し、比較元画像の色情報が十分である場合には、その色特徴情報で比較先画像の色特徴情報との類似比較を行い、一方、比較元画像の色情報が不十分である場合には、その輝度特徴情報と比較先画像の輝度特徴情報との類似比較を行う類似画像検索を行う場合を例に挙げて説明する。   Note that the image search processing of the present embodiment focuses only on whether or not the color information of the comparison source image is sufficient, and if the color information of the comparison source image is sufficient, the color feature information indicates the comparison target image. If the color information of the comparison source image is insufficient, a similar image search is performed to perform a similarity comparison between the luminance feature information and the luminance feature information of the comparison destination image. The case where it is performed will be described as an example.

そこで、まず、判定処理部108で、メモリ上の画像の色情報が十分であるか否かを判定する。   Therefore, first, the determination processing unit 108 determines whether the color information of the image on the memory is sufficient.

色情報が十分である場合、色特徴情報比較処理部109で、比較元画像の色特徴情報を用いて、画像蓄積部103aに記憶されている検索対象画像(比較先画像)の色特徴情報との比較を行うことで類似画像検索を行う。   When the color information is sufficient, the color feature information comparison processing unit 109 uses the color feature information of the comparison source image and the color feature information of the search target image (comparison target image) stored in the image storage unit 103a. Similar image search is performed by comparing the two.

一方、色情報が不十分である場合、輝度特徴情報比較処理部110で、比較元画像の輝度特徴情報を用いて、画像蓄積部103aに記憶されている検索対象画像(比較先画像)の輝度特徴情報との比較を行うことで類似画像検索を行う。   On the other hand, when the color information is insufficient, the luminance feature information comparison processing unit 110 uses the luminance characteristic information of the comparison source image to determine the luminance of the search target image (comparison target image) stored in the image storage unit 103a. Similar image retrieval is performed by comparing with feature information.

これにより、比較元画像の画像の種類(モノクロやグレースケール画像、あるいはカラー画像)に適した方法で類似比較処理を行うことができる。   Accordingly, the similarity comparison process can be performed by a method suitable for the type of image of the comparison source image (monochrome, grayscale image, or color image).

尚、判定処理部108の判定は、最も簡単な方法としては、上述の画像登録処理で説明した方法と同様な方法で、比較元画像のデータフォーマットを解析し、比較元画像がモノクロあるいはグレースケール画像である場合には、色情報はないので、比較元画像の色情報が不十分であると判定する。   The simplest method of determination by the determination processing unit 108 is to analyze the data format of the comparison source image in the same manner as described in the above image registration process, and the comparison source image is monochrome or grayscale. In the case of an image, there is no color information, so it is determined that the color information of the comparison source image is insufficient.

一方、比較元画像がカラー画像である場合には、その比較元画像の色情報が十分であると判定すれば良いが、データフォーマット自体はカラー画像であるのに、その中はグレースケール画像である場合もある。そこで、このような場合には、データフォーマットがカラー画像である場合でも、比較元画像の色情報が十分であるか否かを厳密に判定する必要があり、その判定方法としては、比較元画像の色に関する解析を利用する方法がある。   On the other hand, if the comparison source image is a color image, it may be determined that the color information of the comparison source image is sufficient. However, although the data format itself is a color image, a grayscale image is included therein. There can be. Therefore, in such a case, even when the data format is a color image, it is necessary to strictly determine whether or not the color information of the comparison source image is sufficient. There is a method of using the analysis on the color of.

この解析の趣旨は、比較元画像に占める色情報の割合を解析するものであり、比較元画像に占める色情報の割合が予め定められた閾値以上である場合に色情報が十分であると判定し、閾値未満である場合に色情報が不十分であると判定する。   The purpose of this analysis is to analyze the ratio of color information in the comparison source image and determine that the color information is sufficient when the ratio of color information in the comparison source image is equal to or greater than a predetermined threshold. If it is less than the threshold, it is determined that the color information is insufficient.

ここで、判定処理部108において、比較元画像に占める色情報の割合を解析する解析方法には、2種類存在する。そこで、以下、この2種類の解析方法について説明する。   Here, there are two types of analysis methods for analyzing the ratio of the color information in the comparison source image in the determination processing unit 108. Therefore, these two types of analysis methods will be described below.

<色解析方法1>
図13は本発明の実施形態の第1の色解析方法を示すフローチャートである。
<Color analysis method 1>
FIG. 13 is a flowchart showing a first color analysis method according to the embodiment of the present invention.

まず、ステップS1301で、比較元画像がカラー画像であるか否かを判定する。比較元画像がカラー画像でない場合(ステップS1301でNO)、ステップS1302に進み、比較元画像の色情報が不十分であると判定する。一方、比較元画像がカラー画像である場合(ステップS1301でYES)、ステップS1303に進む。   First, in step S1301, it is determined whether or not the comparison source image is a color image. If the comparison source image is not a color image (NO in step S1301), the process proceeds to step S1302, and it is determined that the color information of the comparison source image is insufficient. On the other hand, if the comparison source image is a color image (YES in step S1301), the process advances to step S1303.

ステップS1303で、比較元画像の画素数が閾値以上であるか否かを判定する。閾値未満である場合(ステップS1303でNO)、ステップS1309に進む。一方、閾値以上である場合(ステップS1303でYES)、ステップS1304に進む。   In step S1303, it is determined whether the number of pixels of the comparison source image is equal to or greater than a threshold value. If it is less than the threshold (NO in step S1303), the process proceeds to step S1309. On the other hand, if it is equal to or greater than the threshold (YES in step S1303), the process proceeds to step S1304.

ステップS1304で、総画素数をその数より少ない所定値に近くなるような相似比(縮小率)を算出する。   In step S1304, a similarity ratio (reduction ratio) is calculated such that the total number of pixels is close to a predetermined value smaller than that number.

例えば、目的の画素数をGp、比較元画像の縦サイズをH、横サイズをWとすると、
相似比S=Int(sqrt(H*W/Gp))
となる。
For example, if the target number of pixels is Gp, the vertical size of the comparison source image is H, and the horizontal size is W,
Similarity ratio S = Int (sqrt (H * W / Gp))
It becomes.

但し、関数Int(x)は、xより大きく、かつ整数と成る値を選ぶものを意味する。   However, the function Int (x) means a value that is larger than x and selects an integer value.

従って、比較元画像の縮小画像は、縦H2=H/S[画素]、横W2=W/S[画素]となる。   Therefore, the reduced image of the comparison source image is vertical H2 = H / S [pixel] and horizontal W2 = W / S [pixel].

次に、ステップS1305で、比較元画像の画素サイズ縦横S×Sブロックの処理対象ブロックの平均色を算出し、これを縮小画像の対応する画素の画素値とし、以降、縦横S×Sブロックの処理対象ブロックが重ならないように移動して、この処理を繰り返すことにより比較元画像の縮小画像を生成する。   Next, in step S1305, the average color of the processing target block of the pixel size of the comparison source image in the vertical and horizontal S × S blocks is calculated, and this is used as the pixel value of the corresponding pixel in the reduced image. The processing target blocks are moved so as not to overlap, and a reduced image of the comparison source image is generated by repeating this processing.

尚、ステップS1305で比較元画像の縮小画像を生成する理由は、以下のステップS1306で比較元画像の色ヒストグラムを生成する場合に、処理対象画像の画素数が非常に大きいと色ヒストグラムを生成する処理の負荷が大きくなるので、処理の負荷が軽減されるように、比較元画像の画素数を所望の数にするためである。もちろん、処理対象画像の画素数が少ない場合には、そのまま色ヒストグラムを生成するようにしても良い。   The reason why the reduced image of the comparison source image is generated in step S1305 is that when the color histogram of the comparison source image is generated in the following step S1306, the color histogram is generated when the number of pixels of the processing target image is very large. This is because the processing load increases, so that the number of pixels of the comparison source image is set to a desired number so that the processing load is reduced. Of course, when the number of pixels of the processing target image is small, a color histogram may be generated as it is.

次に、ステップS1306で、縮小画像を構成する全画素の各濃度値を、図11の色空間を分割して作った部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。   Next, in step S1306, the density values of all the pixels constituting the reduced image are projected onto a color bin, which is a partial space created by dividing the color space of FIG. 11, and a color histogram for the color bin is generated.

次に、ステップS1307で、各色ビンに対するヒストグラム情報からグレースケール方向の色ビンに属する画素数をカウントする。ステップS1308で、縮小画像の全画素数に対するグレースケール方向の色ビンに属する画素数の割合を算出する。   In step S1307, the number of pixels belonging to the color bin in the gray scale direction is counted from the histogram information for each color bin. In step S1308, the ratio of the number of pixels belonging to the color bin in the grayscale direction to the total number of pixels of the reduced image is calculated.

ステップS1312で、算出された割合が予め定められた閾値以上であるか否かを判定する。閾値以上である場合(ステップS1312でYES)、ステップS1302に進む。一方、閾値未満である場合(ステップS1312でNO)、ステップS1313に進み、比較元画像の色情報が十分であると判定する。   In step S1312, it is determined whether the calculated ratio is equal to or greater than a predetermined threshold. If it is equal to or greater than the threshold (YES in step S1312), the process proceeds to step S1302. On the other hand, if it is less than the threshold (NO in step S1312), the process advances to step S1313 to determine that the color information of the comparison source image is sufficient.

一方、ステップS1303において、比較元画像の画素数が閾値未満である場合には、ステップS1309で、比較元画像を構成する全画素の各濃度値を、図11の色空間を分割して作った部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。ステップS1310で、各色ビンに対するヒストグラム情報からグレースケール方向の色ビンに属する画素数をカウントする。ステップS1311で、全画素数に対するグレースケール方向の色ビンに属する画素数の割合を算出する。その後、ステップS1312に進む。   On the other hand, if the number of pixels of the comparison source image is less than the threshold value in step S1303, the density values of all the pixels constituting the comparison source image are created by dividing the color space of FIG. 11 in step S1309. Project to a color bin which is a subspace, and generate a color histogram for the color bin. In step S1310, the number of pixels belonging to the color bin in the gray scale direction is counted from the histogram information for each color bin. In step S1311, the ratio of the number of pixels belonging to the color bin in the grayscale direction to the total number of pixels is calculated. Thereafter, the process proceeds to step S1312.

<色解析方法2>
図14は本発明の実施形態の第2の色解析方法を示すフローチャートである。
<Color analysis method 2>
FIG. 14 is a flowchart showing a second color analysis method according to the embodiment of the present invention.

まず、ステップS1401で、比較元画像がカラー画像であるか否かを判定する。比較元画像がカラー画像でない場合(ステップS1401でNO)、ステップS1402に進み、比較元画像の色情報が不十分であると判定する。一方、比較元画像がカラー画像である場合(ステップS1401でYES)、ステップS1403に進む。   First, in step S1401, it is determined whether or not the comparison source image is a color image. If the comparison source image is not a color image (NO in step S1401), the process proceeds to step S1402, and it is determined that the color information of the comparison source image is insufficient. On the other hand, if the comparison source image is a color image (YES in step S1401), the process advances to step S1403.

ステップS1403で、比較元画像を構成する全画素の色の平均色を算出する。ステップS1404で、平均色を輝度成分と色差成分に変換する。次に、ステップS1405で、輝度成分値に対する色差成分値の割合Rを算出する。   In step S1403, an average color of all the pixels constituting the comparison source image is calculated. In step S1404, the average color is converted into a luminance component and a color difference component. In step S1405, the ratio R of the color difference component value to the luminance component value is calculated.

ここで、色を輝度成分と色差成分に分離する分離方法については、公知の方法を用いる。   Here, a known method is used as a separation method for separating a color into a luminance component and a color difference component.

例えば、YCbCr色空間を用いると、24ビットRGB値との関連は、
Y =0.29900*R+0.58700*G+0.11400*B
Cb=-0.16874*R−0.33126*G+0.50000*B+128
Cr=0.50000*R−0.41869*G+(-0.08131)*B+128 (2)
と表現される。
For example, using the YCbCr color space, the association with a 24-bit RGB value is
Y = 0.29900 * R + 0.58700 * G + 0.11400 * B
Cb = -0.16874 * R-0.33126 * G + 0.50000 * B + 128
Cr = 0.50000 * R-0.41869 * G + (-0.08131) * B + 128 (2)
It is expressed.

式(2)に従って、算出した平均色を輝度成分Yaveと色差成分Cbave及びCraveに分離し、
割合R=sqrt(Cbave*Cbave+Crave*Crave)/Yave (3)
を計算する。
According to the equation (2), the calculated average color is separated into a luminance component Yave and color difference components Cbave and Crave,
Ratio R = sqrt (Cbave * Cbave + Crave * Crave) / Yave (3)
Calculate

そして、ステップS1406で、この割合Rが予め定めた閾値以上であるか否かを判定する。閾値以上である場合(ステップS1406でYES)、ステップS1402に進む。一方、閾値未満である場合(ステップS1406でNO)、ステップS1407に進み、比較元画像の色情報が十分であると判定する。   In step S1406, it is determined whether the ratio R is equal to or greater than a predetermined threshold. If it is equal to or greater than the threshold (YES in step S1406), the process advances to step S1402. On the other hand, if it is less than the threshold (NO in step S1406), the process advances to step S1407 to determine that the color information of the comparison source image is sufficient.

次に、色特徴情報比較処理部109が実行する処理の詳細について説明する。   Next, details of processing executed by the color feature information comparison processing unit 109 will be described.

尚、色特徴情報比較処理部109では、比較元対象画像の色特徴情報を抽出するために、上述の色特徴情報抽出処理を用いる。   The color feature information comparison processing unit 109 uses the above-described color feature information extraction processing in order to extract the color feature information of the comparison source target image.

図15は本発明の実施形態の色特徴情報比較処理の詳細を示すフローチャートである。   FIG. 15 is a flowchart showing details of the color feature information comparison processing according to the embodiment of the present invention.

まず、ステップS1501で、図12のフローチャートで説明した処理によって、比較元画像の色特徴情報をブロック毎に抽出する。但し、比較元画像が既に画像蓄積部103aに登録済みの画像である場合には、対応する色特徴情報を色特徴インデックステーブル106aから読み出す。   First, in step S1501, the color feature information of the comparison source image is extracted for each block by the processing described in the flowchart of FIG. However, if the comparison source image is already registered in the image storage unit 103a, the corresponding color feature information is read from the color feature index table 106a.

次に、ステップS1502で、比較元画像と未比較の比較先画像(画像蓄積部103aに蓄積されている)の有無を判定する。未比較の比較先画像がない場合(ステップS1502でNO)、ステップS1511に進む。一方、未比較の比較先画像がある場合(ステップS1502でYES)、ステップS1503に進む。   Next, in step S1502, the presence / absence of a comparison source image and an uncompared comparison destination image (stored in the image storage unit 103a) is determined. If there is no uncompared comparison destination image (NO in step S1502), the process advances to step S1511. On the other hand, if there is an uncompared comparison destination image (YES in step S1502), the process advances to step S1503.

ステップS1503で、色特徴情報インデックステーブル106aを参照して、処理対象画像の画像IDと各ブロックの色特徴情報を読み出す。ステップS1504で、処理対象とする画像中の着目ブロックを先頭に設定する。ステップS1505で、比較元画像の色特徴情報と、比較対象の色特徴情報の類似度を示す類似距離を0にリセットする。   In step S1503, with reference to the color feature information index table 106a, the image ID of the processing target image and the color feature information of each block are read. In step S1504, the target block in the image to be processed is set at the head. In step S1505, the similarity distance indicating the similarity between the color feature information of the comparison source image and the color feature information to be compared is reset to zero.

ステップS1506で、未比較の着目ブロックの有無を判定する。未比較の着目ブロックがない場合(ステップS1506でNO)、ステップS1510に進む。一方、未比較の着目ブロックがある場合(ステップS1506でYES)、ステップS1507に進む。   In step S1506, it is determined whether there is an uncompared block of interest. If there is no uncompared block of interest (NO in step S1506), the process advances to step S1510. On the other hand, if there is an uncompared block of interest (YES in step S1506), the process advances to step S1507.

ステップS1507で、比較元画像と比較先画像のそれぞれの色特徴情報から、それぞれの着目ブロックの色ビンIDを取得する。   In step S1507, the color bin ID of each block of interest is acquired from the color feature information of each of the comparison source image and the comparison destination image.

ステップS1508で、図16の色ビンペナルティマトリックスを参照して、取得した色ビンID間に対応する着目ブロックの局所的類似距離を取得し、これを直前の処理で取得している類似距離に累積加算する。そして、この累積類似距離はメモリに記憶する。   In step S1508, referring to the color bin penalty matrix of FIG. 16, the local similarity distance of the block of interest corresponding to the acquired color bin ID is acquired, and this is accumulated in the similar distance acquired in the immediately preceding process. to add. The accumulated similarity distance is stored in the memory.

ここで、色ビンペナルティマトリックスについて、図16を用いて説明する。   Here, the color bin penalty matrix will be described with reference to FIG.

図16は本発明の実施形態の色ビンペナルティマトリックスの構成を示す図である。   FIG. 16 is a diagram showing the configuration of the color bin penalty matrix according to the embodiment of the present invention.

色ビンペナルティマトリックスは、色ビンID同士の局所的類似距離を管理するマトリックスである。図16によれば、色ビンペナルティマトリックスは、同一色ビンIDではその類似距離は0となり、色ビンID同士の差が大きくなるほど、つまり、類似度が低くなるほど、その類似距離は大きくなるように構成されている。また、同一色ビンIDの対角位置は全て、その類似距離は0で、それを境に対称性を持っている。   The color bin penalty matrix is a matrix that manages the local similarity distance between the color bin IDs. According to FIG. 16, the similarity distance of the color bin penalty matrix is 0 for the same color bin ID, and the similarity distance increases as the difference between the color bin IDs increases, that is, as the similarity decreases. It is configured. In addition, all the diagonal positions of the same color bin ID have a similarity distance of 0 and have symmetry with respect to the boundary.

但し、文字ブロックに相当する色ビンIDについては、この例では、色ビンID217を設定している。この色ビンID217は、その他の色ビンID間のペナルティに関しては性質が異なるため、比較的大きな、例えば、真っ白と真っ黒間のペナルティを設定している。このようにすると、文字ブロックに関しては極めて厳しく差異を考慮する類似比較処理となる。つまり、図16の色ビンペナルティマトリックスでは、文字ブロックを示す所定色ビンIDと、文字ブロック以外のブロックの色ビンIDとの類似距離は、その所定色ビンID以外の色ビンID同士の類似距離よりも十分異なる(この場合、大きく)なるように管理されている。   However, in this example, the color bin ID 217 is set for the color bin ID corresponding to the character block. Since this color bin ID 217 has different properties with respect to the penalty between the other color bin IDs, a relatively large penalty, for example, between white and black is set. If it does in this way, it will become a similar comparison process which considers a difference very severely regarding a character block. That is, in the color bin penalty matrix of FIG. 16, the similar distance between the predetermined color bin ID indicating the character block and the color bin ID of the block other than the character block is the similar distance between the color bin IDs other than the predetermined color bin ID. Are managed to be sufficiently different (in this case, large).

逆に、文字ブロックに相当する色ビンIDと、その他の色ビンID間のペナルティを小さくすると、文字ブロックに関しては緩く差異を考慮する類似比較処理となる。従って、必要に応じて、このペナルティ値を調整することで、より用途や目的に応じた類似比較処理を実現することができる。   Conversely, if the penalty between the color bin ID corresponding to the character block and the other color bin IDs is reduced, similar comparison processing is performed in which a difference is loosely considered for the character block. Therefore, by adjusting the penalty value as necessary, it is possible to realize a similar comparison process that is more suitable for the purpose and purpose.

このように、本実施形態では、色ビンペナルティマトリックスを参照するだけで、色ビンID同士の類似距離を取得することができるので、処理の高速化を図ることができる。   Thus, in this embodiment, the similarity distance between the color bin IDs can be acquired only by referring to the color bin penalty matrix, so that the processing can be speeded up.

そして、ステップS1509で、次の処理対象となる着目ブロックを設定する。   In step S1509, the target block to be processed next is set.

一方、ステップS1506で、未比較の着目ブロックがない場合(ステップS1506でNO)、ステップS1510に進み、メモリに記憶されている累積類似距離を画像IDに対応づけてメモリに記憶する。   On the other hand, if there is no uncompared block of interest in step S1506 (NO in step S1506), the process proceeds to step S1510, and the accumulated similarity distance stored in the memory is stored in the memory in association with the image ID.

そして、ステップS1502で、未比較の比較先画像がない場合(ステップS1502でNO)、ステップS1511に進み、メモリに記憶されている各画像IDに対応する累積類似距離の昇順で、画像IDをソートし、ソートした画像IDと累積類似距離の対を検索結果として出力する。   If there is no uncompared comparison target image in step S1502 (NO in step S1502), the process proceeds to step S1511, and the image IDs are sorted in ascending order of the cumulative similarity distance corresponding to each image ID stored in the memory. Then, the sorted image ID and cumulative similarity distance pair is output as a search result.

次に、輝度特徴情報比較処理部110が実行する処理の詳細について説明する。   Next, details of processing executed by the luminance feature information comparison processing unit 110 will be described.

尚、輝度特徴情報比較処理部110では、比較元対象画像の輝度特徴情報を抽出するために、上述の輝度特徴情報抽出処理を用いる。   The luminance feature information comparison processing unit 110 uses the above-described luminance feature information extraction processing in order to extract the luminance feature information of the comparison source target image.

図17は本発明の実施形態の輝度特徴情報比較処理の詳細を示すフローチャートである。   FIG. 17 is a flowchart showing details of the luminance feature information comparison processing according to the embodiment of the present invention.

まず、ステップS1701で、図5のフローチャートで説明した処理によって、比較元画像の輝度特徴情報として輝度階級IDを抽出する。但し、比較元画像が既に画像蓄積部103aに登録済みの画像である場合には、対応する輝度特徴情報を輝度特徴インデックステーブル105aから読み出す。   First, in step S1701, the luminance class ID is extracted as the luminance feature information of the comparison source image by the processing described in the flowchart of FIG. However, if the comparison source image is an image that has already been registered in the image storage unit 103a, the corresponding luminance feature information is read from the luminance feature index table 105a.

次に、ステップS1702で、比較元画像と未比較の比較先画像(画像蓄積部103aに蓄積されている)の有無を判定する。未比較の比較先画像がない場合(ステップS1702でNO)、ステップS1711に進む。一方、未比較の比較先画像がある場合(ステップS1702でYES)、ステップS1703に進む。   Next, in step S1702, it is determined whether there is a comparison source image and an uncompared comparison destination image (stored in the image storage unit 103a). If there is no uncompared comparison destination image (NO in step S1702), the process advances to step S1711. On the other hand, if there is an uncompared comparison destination image (YES in step S1702), the process advances to step S1703.

ステップS1703で、輝度特徴情報インデックステーブル105aを参照して、処理対象画像の画像IDと各ブロックの輝度特徴情報を読み出す。ステップS1704で、処理対象とする画像中の着目ブロックを先頭に設定する。ステップS1705で、比較元画像の輝度特徴情報と、比較対象の輝度特徴情報の類似度を示す類似距離を0にリセットする。   In step S1703, the luminance feature information index table 105a is referred to, and the image ID of the processing target image and the luminance feature information of each block are read out. In step S1704, the target block in the image to be processed is set at the head. In step S1705, the similarity distance indicating the similarity between the luminance feature information of the comparison source image and the luminance feature information to be compared is reset to zero.

ステップS1706で、未比較の着目ブロックの有無を判定する。未比較の着目ブロックがない場合(ステップS1706でNO)、ステップS1710に進む。一方、未比較の着目ブロックがある場合(ステップS1706でYES)、ステップS1707に進む。   In step S1706, it is determined whether there is an uncompared block of interest. If there is no uncompared block of interest (NO in step S1706), the process advances to step S1710. On the other hand, if there is an uncompared block of interest (YES in step S1706), the process proceeds to step S1707.

ステップS1707で、比較元画像と比較先画像のそれぞれの輝度特徴情報から、着目ブロックの輝度に関する輝度階級IDを取得する。   In step S1707, the brightness class ID related to the brightness of the block of interest is acquired from the brightness feature information of each of the comparison source image and the comparison destination image.

ステップS1708で、図18の輝度階級IDペナルティマトリックスを参照して、取得した輝度階級ID間に対応する着目ブロックの局所的類似距離を取得し、これを直前の処理で取得している類似距離に累積加算する。そして、この累積類似距離はメモリに記憶する。   In step S1708, referring to the luminance class ID penalty matrix in FIG. 18, the local similarity distance of the target block corresponding to the acquired luminance class ID is acquired, and this is used as the similar distance acquired in the immediately preceding process. Cumulative addition. The accumulated similarity distance is stored in the memory.

ここで、輝度階級IDペナルティマトリックスについて、図18を用いて説明する。   Here, the luminance class ID penalty matrix will be described with reference to FIG.

図18は本発明の実施形態の輝度階級IDペナルティマトリックスの構成を示す図である。   FIG. 18 is a diagram showing a configuration of a luminance class ID penalty matrix according to the embodiment of the present invention.

輝度階級IDペナルティマトリックスは、輝度階級ID同士の局所的類似距離を管理するマトリックスである。図18によれば、輝度階級IDペナルティマトリックスは、同一輝度階級IDではその類似距離は0となり、輝度階級ID同士の差が大きくなるほど、つまり、類似度が低くなるほど、その類似距離は大きくなるように構成されている。また、同一輝度階級IDの対角位置は全て、その類似距離は0で、それを境に対称性を持っている。   The luminance class ID penalty matrix is a matrix that manages the local similarity distance between luminance class IDs. According to FIG. 18, the luminance class ID penalty matrix has a similarity distance of 0 for the same luminance class ID, and the similarity distance increases as the difference between the luminance class IDs increases, that is, as the similarity decreases. It is configured. Further, all the diagonal positions of the same luminance class ID have a similarity distance of 0 and have symmetry with respect to the boundary.

但し、文字ブロックに相当する輝度階級ID、この例では、輝度階級ID17を設定する。この輝度階級ID17は、その他の輝度階級ID間のペナルティに関しては性質が異なるため、比較的大きな、例えば、真っ白と真っ黒間のペナルティを設定している。このようにすると、文字ブロックに関しては極めて厳しく差異を考慮する類似比較処理となる。つまり、図18の輝度階級IDペナルティマトリックスでは、文字ブロックを示す所定輝度階級IDと、文字ブロック以外のブロックの輝度階級IDとの類似距離は、その所定輝度階級ID以外の輝度階級ID同士の類似距離よりも十分異なる(この場合、大きく)なるように管理されている。   However, the luminance class ID corresponding to the character block, in this example, the luminance class ID 17 is set. This luminance class ID 17 has a different characteristic with respect to the penalty between other luminance class IDs, and therefore, a relatively large penalty, for example, between white and black is set. If it does in this way, it will become a similar comparison process which considers a difference very severely regarding a character block. That is, in the luminance class ID penalty matrix of FIG. 18, the similarity distance between the predetermined luminance class ID indicating a character block and the luminance class ID of a block other than the character block is similar to the luminance class IDs other than the predetermined luminance class ID. It is managed to be sufficiently different (in this case, larger) than the distance.

逆に、文字ブロックに相当する輝度階級IDとその他の輝度階級ID間のペナルティを小さくすると、文字ブロックに関しては緩く差異を考慮する類似比較処理となる。従って、必要に応じて、このペナルティ値を調整することで、より用途や目的に応じた類似比較処理を実現することができる。   Conversely, if the penalty between the luminance class ID corresponding to the character block and the other luminance class IDs is reduced, similar comparison processing is performed in which the difference is loosely considered for the character block. Therefore, by adjusting the penalty value as necessary, it is possible to realize a similar comparison process that is more suitable for the purpose and purpose.

このように、本実施形態では、輝度階級IDペナルティマトリックスを参照するだけで、輝度階級ID同士の類似距離を取得することができるので、処理の高速化を図ることができる。   As described above, in this embodiment, the similarity distance between the luminance class IDs can be acquired only by referring to the luminance class ID penalty matrix, so that the processing speed can be increased.

そして、ステップS1709で、次の処理対象となる着目ブロックを設定する。   In step S1709, the target block to be processed next is set.

一方、ステップS1706で、未比較の着目ブロックがない場合(ステップS1706でNO)、ステップS1710に進み、メモリに記憶されている累積類似距離を画像IDに対応づけてメモリに記憶する。   On the other hand, if there is no uncompared block of interest in step S1706 (NO in step S1706), the process proceeds to step S1710, and the accumulated similarity distance stored in the memory is stored in the memory in association with the image ID.

そして、ステップS1702で、未比較の画像がない場合(ステップS1702でNO)、ステップS1711に進み、メモリに記憶されている各画像IDに対応する累積類似距離の昇順で、画像IDをソートし、ソートした画像IDと累積類似距離の対を検索結果として出力する。   If there is no uncompared image in step S1702 (NO in step S1702), the process proceeds to step S1711, and the image IDs are sorted in ascending order of the cumulative similarity distance corresponding to each image ID stored in the memory. The sorted image ID and cumulative similarity distance pair is output as a search result.

以上説明した画像登録処理と画像検索処理を実行することにより、比較先画像の種類がモノクロやグレースケールであっても、あるいはカラー画像であっても、その画像の種類に適した画像特徴量を用いて、画像を登録あるいは画像を検索することができる。   By executing the image registration process and the image search process described above, an image feature amount suitable for the type of image can be obtained regardless of whether the type of the comparison target image is monochrome, grayscale, or a color image. Use to register images or search for images.

次に、検索結果表示部処理部111が実行する検索結果表示処理について説明する。   Next, search result display processing executed by the search result display unit processing unit 111 will be described.

[検索結果表示処理]
検索結果表示処理では、類似度が高い順、即ち、類似距離の昇順に画像IDとその類似度の対がソートされた情報を元に、画像管理DB104aを参照し、該当するレコードから画像の格納先であるアドレス情報(ファイルフルパス情報)を取得して、画像蓄積部103aから対応する画像を読み出し、表示する。
[Search result display processing]
In the search result display process, the image management DB 104a is referred to based on information in which the pairs of image IDs and similarities are sorted in descending order of similarity, that is, in ascending order of similarity distances, and images are stored from corresponding records. The previous address information (file full path information) is acquired, and the corresponding image is read from the image storage unit 103a and displayed.

以下、検索結果表示処理について、図19を用いて説明する。   The search result display process will be described below with reference to FIG.

図19は本発明の実施形態の検索結果表示処理を示すフローチャートである。   FIG. 19 is a flowchart showing search result display processing according to the embodiment of the present invention.

ステップS1801で、画像検索処理によって得られた検索結果数である検索ヒット個数Mと、比較元画像と検索結果として得られる比較先画像との類似度が高い順、即ち、類似距離の昇順に対応する画像IDとその類似度の対を取得する。   In step S1801, the number of search hits M, which is the number of search results obtained by the image search process, corresponds to the descending order of similarity between the comparison source image and the comparison destination image obtained as the search result, that is, the ascending order of the similarity distance. A pair of the image ID and its similarity is acquired.

次に、ステップS1802で、表示画面の表示可能な画像の個数Nを取得する。   In step S1802, the number N of images that can be displayed on the display screen is acquired.

尚、この個数Nは、検索結果として表示する画像の縮小画像のサイズと、表示画面上の検索結果表示領域のサイズによって決定される。   This number N is determined by the size of the reduced image of the image to be displayed as the search result and the size of the search result display area on the display screen.

ステップS1803で、検索ヒット個数Mと個数Nの小さいほうを画像表示個数Rに設定する。   In step S1803, the smaller of the search hit number M and the number N is set as the image display number R.

ステップS1804で、検索結果として表示する画像の順位(読出画像順位)を示す変数Kを1に初期化する。ステップS1805で、K≦Rであるか否かを判定する。K≦Rでない場合(ステップS1805でNO)、処理を終了する。一方、K≦Rである場合(ステップS1806でYES)、ステップS1806に進む。   In step S1804, a variable K indicating the order of images to be displayed as a search result (read image order) is initialized to 1. In step S1805, it is determined whether K ≦ R. If K ≦ R is not satisfied (NO in step S1805), the process ends. On the other hand, if K ≦ R (YES in step S1806), the process proceeds to step S1806.

ここで、ステップS1806〜ステップS1808の処理は、類似画像検索結果である画像を表示画面に表示する処理となる。   Here, the processing from step S1806 to step S1808 is processing for displaying an image as a similar image search result on the display screen.

ここで、類似画像検索結果の表示例について、図20を用いて説明する。   Here, a display example of the similar image search result will be described with reference to FIG.

図20は本発明の実施形態の類似画像検索結果の表示例を示す図である。   FIG. 20 is a diagram showing a display example of similar image search results according to the embodiment of the present invention.

図20に示されるように、表示画面上の検索結果表示領域には、検索結果とする画像の縮小画像を類似距離の昇順に左上端から順に右隣へ順に並べて表示し、右上端まで到達したら、次の行の左端に移り、そこからまた右隣に順に右端まで並べて表示したら、以下、同様に、検索結果表示領域の終わりとなる右下端まで並べて表示して行く。また、表示する縮小画像の下には、対応する類似距離を併せて表示する。   As shown in FIG. 20, in the search result display area on the display screen, the reduced images of the search results are displayed side by side in order of increasing similarity distance from the upper left to the right next to the upper right. Then, after moving to the left end of the next line and then displaying the next right next to the right end in sequence, the display is similarly performed until the lower right end at the end of the search result display area. A corresponding similar distance is also displayed below the reduced image to be displayed.

ステップS1806で、読出画像順位Kにより、表示対象の画像の表示位置を決定する。ステップS1807で、読出画像順位Kの画像IDに対応する画像のアドレス情報(フルパス情報)を画像管理DB104aから取得する。ステップS1808で、アドレス情報で示される画像を読み出し、決定した表示位置にその縮小画像を表示する。その後、変数Kを1インクリメントして、ステップS1805に進む。   In step S1806, the display position of the display target image is determined based on the read image rank K. In step S1807, image address information (full path information) corresponding to the image ID of the read image rank K is acquired from the image management DB 104a. In step S1808, the image indicated by the address information is read, and the reduced image is displayed at the determined display position. Thereafter, the variable K is incremented by 1, and the process proceeds to step S1805.

尚、本実施形態の画像検索処理では、比較元画像の色情報が十分であるかどうかだけに着目し、比較元画像の色情報が十分である場合にはその色特徴情報で比較先画像の色特徴情報との類似比較を行い、比較元画像の色情報が不十分である場合にはその輝度特徴情報と比較先画像の輝度特徴情報との類似比較を行う類似画像検索の例を示したが、これに限定されない。   Note that the image search process of the present embodiment focuses only on whether the color information of the comparison source image is sufficient, and if the color information of the comparison source image is sufficient, the color feature information of the comparison target image is used. Similarity search with color feature information is performed, and when the color information of the comparison source image is insufficient, an example of a similar image search is performed in which the similarity comparison between the luminance feature information and the luminance feature information of the comparison destination image is performed. However, it is not limited to this.

例えば、比較先画像の色情報が十分であるか否かについても考慮し、比較する画像の双方の色情報が十分である場合に、双方の色特徴情報で類似比較を行い、どちらか片方あるいは双方の色情報が不十分である場合に、双方の輝度特徴情報で類似比較を行う類似画像検索を行うようにしても良い。   For example, considering whether or not the color information of the comparison target image is sufficient, if the color information of both images to be compared is sufficient, a similarity comparison is performed using both color feature information, and either one or When both pieces of color information are insufficient, a similar image search may be performed in which similarity comparison is performed using both luminance feature information.

上記実施形態では、着目ブロック中の平均輝度に基づいて、その着目ブロック内に文字画像が存在するか否かを判定する構成としているが、これに限定されるものではない。例えば、着目ブロック中の最頻輝度、あるいは着目ブロック中の最も輝度の高い画素の色近傍範囲の平均輝度あるいは最頻輝度に基づいて、その着目ブロック内に文字画像が存在するか否かを判定する構成としても良い。   In the above embodiment, it is configured to determine whether or not a character image exists in the target block based on the average luminance in the target block. However, the present invention is not limited to this. For example, whether or not a character image exists in the target block is determined based on the mode luminance in the block of interest, or the average luminance or mode luminance of the color neighborhood range of the pixel with the highest luminance in the block of interest. It is good also as composition to do.

この構成の場合、輝度特徴情報抽出処理の前に、着目ブロックに対して輝度ヒストグラムに関する前処理を行い、輝度値0から255までに正規化を行ってから、輝度特徴情報抽出処理を実行すると、より処理の簡素化を図ることができる。   In the case of this configuration, before performing the luminance feature information extraction processing, preprocessing related to the luminance histogram is performed on the block of interest, normalization is performed from luminance values 0 to 255, and then the luminance feature information extraction processing is executed. Further simplification of processing can be achieved.

これにより、例えば、再生紙のような予め紙に色が付いており、インクやトナーがのっていない無地背景は輝度値255に正規化され、本実施形態を適応しても、的確に無地背景に印刷された文字を抽出することが可能となる。   Thus, for example, a plain background such as recycled paper that is pre-colored and has no ink or toner on it is normalized to a luminance value of 255, and even if this embodiment is applied, it is accurately plain. It becomes possible to extract characters printed on the background.

また、画像登録処理は、画像入力処理、画像蓄積処理、画像管理情報処理、輝度特徴情報抽出処理、色特徴情報抽出処理の順番で処理を行ったが、画像入力処理以降の処理に関してはその順序は問わない。   The image registration processing is performed in the order of image input processing, image storage processing, image management information processing, luminance feature information extraction processing, and color feature information extraction processing. Does not matter.

一方、画像検索処理においては、比較元画像が既に画像蓄積部103aへ登録済みの画像であるならば、既にその色特徴情報及び輝度特徴情報も登録されているので、かかる画像に対する色特徴情報抽出処理及び輝度特徴情報抽出処理は不要となる。   On the other hand, in the image search processing, if the comparison source image is an image that has already been registered in the image storage unit 103a, the color feature information and luminance feature information have already been registered. Processing and luminance feature information extraction processing are not required.

また、画像管理DB104a、輝度特徴情報インデックステーブル105a、色特徴情報インデックステーブル106aを別々に構成し、画像IDを仲立ちとして互いの情報に対応を取る構成例を示したが、これらのDB及びテーブル群を一体にして構成しても良い。   In addition, the image management DB 104a, the luminance feature information index table 105a, and the color feature information index table 106a are configured separately, and the configuration example in which the image ID is used as an intermediary to correspond to each other's information has been shown. May be configured integrally.

また、処理対象となる着目ブロックの設定は、図7の順序決定テーブルで示される走査順序に限定されるものではなく、水平走査及び垂直走査あるいはジグザグ走査等の他の走査順序、つまり、画像の各ブロックを着目ブロックとして設定できるような走査順序であれば、どのような走査順序であっても良い。   Further, the setting of the target block to be processed is not limited to the scanning order shown in the order determination table of FIG. 7, but other scanning orders such as horizontal scanning and vertical scanning or zigzag scanning, that is, image Any scanning order may be used as long as each block can be set as a target block.

以上説明したように、本実施形態によれば、予め文書画像を文字領域と画像領域に分離する技術を用いて、分離したものどうしの特徴を求めて画像検索を実現する方法のような領域の抽出し損ねによる検索漏れの恐れのある負荷の重い処理を行うことなく、大まかな文字検出処理結果をプリミティブな画像特徴量に加味した文書画像比較処理を実現する。   As described above, according to the present embodiment, an area like a method for realizing image search by obtaining features of separated objects using a technique for separating a document image into a character area and an image area in advance. A document image comparison process in which a rough character detection result is added to a primitive image feature amount is realized without performing a heavy load process that may cause a search omission due to failure to extract.

これにより、特に、文書画像のように、白地バックグラウンドに画像を貼り込み、その余白に文字が存在するような画像に対しても、より精度良く目的とする画像を検索することができる。   This makes it possible to search for a target image with higher accuracy, especially for an image in which an image is pasted on a white background and characters are present in the margin, such as a document image.

つまり、白地のバックグラウンドに文字があっても無くとも平均色あるいは最頻色には影響が現れず、文字のある分割ブロックと白地のバックグラウンドとの区別がつかず、ユーザにとって違和感のある検索結果となることを防止することができる。   In other words, even if there is a character on the white background, the average color or the most frequent color is not affected, and the divided block with the character cannot be distinguished from the white background, making the search uncomfortable for the user. It is possible to prevent the result.

以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。   Although the embodiments have been described in detail above, the present invention can take an embodiment as, for example, a system, an apparatus, a method, a program, or a storage medium, and specifically includes a plurality of devices. The present invention may be applied to a system that is configured, or may be applied to an apparatus that includes a single device.

尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。   In the present invention, a software program (in the embodiment, a program corresponding to the flowchart shown in the figure) that realizes the functions of the above-described embodiment is directly or remotely supplied to the system or apparatus, and the computer of the system or apparatus Is also achieved by reading and executing the supplied program code.

従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。   Accordingly, since the functions of the present invention are implemented by computer, the program code installed in the computer also implements the present invention. In other words, the present invention includes a computer program itself for realizing the functional processing of the present invention.

その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。   In that case, as long as it has the function of a program, it may be in the form of object code, a program executed by an interpreter, script data supplied to the OS, or the like.

プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。   As a recording medium for supplying the program, for example, floppy (registered trademark) disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, CD-RW, magnetic tape, nonvolatile memory card ROM, DVD (DVD-ROM, DVD-R) and the like.

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。   As another program supply method, a client computer browser is used to connect to an Internet homepage, and the computer program of the present invention itself or a compressed file including an automatic installation function is downloaded from the homepage to a recording medium such as a hard disk. Can also be supplied. It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, a WWW server that allows a plurality of users to download a program file for realizing the functional processing of the present invention on a computer is also included in the present invention.

また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。   In addition, the program of the present invention is encrypted, stored in a storage medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. It is also possible to execute the encrypted program by using the key information and install the program on a computer.

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。   In addition to the functions of the above-described embodiments being realized by the computer executing the read program, the OS running on the computer based on an instruction of the program is a part of the actual processing. Alternatively, the functions of the above-described embodiment can be realized by performing all of them and performing the processing.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。   Furthermore, after the program read from the recording medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion board or The CPU or the like provided in the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.

本発明の実施形態の画像処理装置のプロック構成図である。1 is a block diagram of an image processing apparatus according to an embodiment of the present invention. 本発明の実施形態の画像管理DBの構成の一例を示す図である。It is a figure which shows an example of a structure of image management DB of embodiment of this invention. 本発明の実施形態の輝度特徴情報テーブルの構成の一例を示す図である。It is a figure which shows an example of a structure of the brightness | luminance characteristic information table of embodiment of this invention. 本発明の実施形態の色特徴情報テーブルの構成の一例を示す図である。It is a figure which shows an example of a structure of the color characteristic information table of embodiment of this invention. 本発明の実施形態の輝度特徴情報抽出処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the brightness | luminance feature information extraction process of embodiment of this invention. 本発明の実施形態の画像ブロック分割の一例を示す図である。It is a figure which shows an example of the image block division | segmentation of embodiment of this invention. 本発明の実施形態の順序決定テーブルの一例を示す図である。It is a figure which shows an example of the order determination table of embodiment of this invention. 本発明の実施形態の輝度階級テーブルの一例を示す図である。It is a figure which shows an example of the brightness class table of embodiment of this invention. 本発明の実施形態のステップS510の着目ブロック内の文字の有無の判定処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the determination process of the presence or absence of the character in the attention block of step S510 of embodiment of this invention. 本発明の実施形態のランレングス分布の一例を示す図である。It is a figure which shows an example of the run length distribution of embodiment of this invention. 本発明の実施形態の色空間上の色ビンの構成の一例を示す図である。It is a figure which shows an example of a structure of the color bin on the color space of embodiment of this invention. 本発明の実施形態の色特徴情報抽出処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the color feature information extraction process of embodiment of this invention. 本発明の実施形態の第1の色解析方法を示すフローチャートである。It is a flowchart which shows the 1st color analysis method of embodiment of this invention. 本発明の実施形態の第2の色解析方法を示すフローチャートである。It is a flowchart which shows the 2nd color analysis method of embodiment of this invention. 本発明の実施形態の色特徴情報比較処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the color characteristic information comparison process of embodiment of this invention. 本発明の実施形態の色ビンペナルティマトリックスの構成の一例を示す図である。It is a figure which shows an example of a structure of the color bin penalty matrix of embodiment of this invention. 本発明の実施形態の輝度特徴情報比較処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the brightness | luminance feature information comparison process of embodiment of this invention. 本発明の実施形態の輝度階級IDペナルティマトリックスの構成の一例を示す図である。It is a figure which shows an example of a structure of the brightness class ID penalty matrix of embodiment of this invention. 本発明の実施形態の検索結果表示処理を示すフローチャートである。It is a flowchart which shows the search result display process of embodiment of this invention. 本発明の実施形態の類似画像検索結果の表示例を示す図である。It is a figure which shows the example of a display of the similar image search result of embodiment of this invention.

符号の説明Explanation of symbols

101 ユーザインタフェース部
102 画像入力処理部
103 画像蓄積処理部
103a 画像蓄積部
104 画像管理情報処理部
104a 画像管理DB
105 輝度特徴情報抽出処理部
105a 輝度特徴情報インデックステーブル
106 色特徴情報抽出処理部
106a 色特徴情報インデックステーブル
107 比較元画像入力部処理部
108 判定処理部
109 色特徴情報比較処理部
110 輝度特徴情報比較処理部
111 検索結果表示処理部
DESCRIPTION OF SYMBOLS 101 User interface part 102 Image input process part 103 Image storage process part 103a Image storage part 104 Image management information processing part 104a Image management DB
105 Luminance Feature Information Extraction Processing Unit 105a Luminance Feature Information Index Table 106 Color Feature Information Extraction Processing Unit 106a Color Feature Information Index Table 107 Comparison Source Image Input Unit Processing Unit 108 Judgment Processing Unit 109 Color Feature Information Comparison Processing Unit 110 Luminance Feature Information Comparison Processing unit 111 Search result display processing unit

Claims (11)

検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置であって、
前記比較元画像を複数のブロックに分割する分割手段と、
前記分割手段で分割されたブロック画像の画像特徴情報に基づいて、該ブロック画像に文字画像が存在するか否かを判定する判定手段と、
前記判定手段の判定の結果、前記ブロック画像及びそれに対応する前記比較先画像のブロック画像のどちらかに文字画像が存在する場合、両者の類似度として所定の類似度を取得し、一方、前記ブロック及びそれに対応する前記比較先画像のブロック画像のどちらにも文字画像が存在しない場合、その両者の画像特徴情報に基づく類似度を取得する取得手段と、
前記取得手段によって取得される前記分割手段で分割した各ブロック画像に対する類似度を累積加算して得られる累積類似度に基づいて、検索結果となる画像を出力する出力手段と
を備えることを特徴とする画像処理装置。
An image processing apparatus that performs a similar image search based on a similarity between a comparison source image serving as a search condition and a comparison destination image,
Dividing means for dividing the comparison source image into a plurality of blocks;
Determination means for determining whether a character image exists in the block image based on image feature information of the block image divided by the dividing means;
As a result of the determination by the determination means, when a character image exists in either the block image or the block image corresponding to the comparison target image, a predetermined similarity is acquired as the similarity between the two, while the block image And when there is no character image in either of the block images of the comparison target image corresponding thereto, acquisition means for acquiring the similarity based on the image feature information of both,
Output means for outputting an image as a search result on the basis of a cumulative similarity obtained by cumulatively adding similarities to the respective block images divided by the dividing means obtained by the obtaining means. An image processing apparatus.
前記比較手段は、前記比較元画像と前記比較先画像間の画像特徴情報に応じた類似度を管理する管理テーブルを備え、
前記管理テーブルは、前記比較元画像及び前記比較先画像のどちらかに文字画像が存在する場合の該比較元画像と該比較先画像間の画像特徴情報に基づく所定の類似度として、前記比較元画像に文字画像が存在しない場合の該比較元画像と該比較先画像間の画像特徴情報に基づく類似度よりも十分異なる固定値を管理している
ことを特徴とする請求項1に記載の画像処理装置。
The comparison unit includes a management table that manages similarity according to image feature information between the comparison source image and the comparison destination image,
The management table includes the comparison source as a predetermined similarity based on image feature information between the comparison source image and the comparison destination image when a character image exists in either the comparison source image or the comparison destination image. 2. The image according to claim 1, wherein a fixed value that is sufficiently different from a similarity based on image feature information between the comparison source image and the comparison destination image when no character image exists in the image is managed. Processing equipment.
前記判定手段は、前記ブロック画像の前記画像特徴情報が示す画像特徴量が所定値以上であるか否かを判定し、前記画像特徴量が所定値以上である場合、該処理対象画像に文字画像が存在すると判定する
ことを特徴とする請求項1に記載の画像処理装置。
The determination unit determines whether or not an image feature amount indicated by the image feature information of the block image is equal to or greater than a predetermined value. If the image feature amount is equal to or greater than a predetermined value, a character image is included in the processing target image. The image processing apparatus according to claim 1, wherein the image processing apparatus is determined to exist.
前記画像特徴情報は、前記ブロック画像の輝度に関する輝度特徴情報である
ことを特徴とする請求項3に記載の画像処理装置。
The image processing apparatus according to claim 3, wherein the image feature information is luminance feature information related to the luminance of the block image.
前記輝度特徴情報は、前記ブロック画像の平均輝度あるいは最頻輝度である
ことを特徴とする請求項4に記載の画像処理装置。
The image processing apparatus according to claim 4, wherein the luminance feature information is an average luminance or a mode luminance of the block image.
前記輝度特徴情報は、前記ブロック画像中の最も輝度の高い画素の色近傍範囲の平均輝度あるいは最頻輝度である
ことを特徴とする請求項4に記載の画像処理装置。
The image processing apparatus according to claim 4, wherein the luminance feature information is an average luminance or a mode luminance in a color vicinity range of a pixel having the highest luminance in the block image.
類似画像検索の検索対象となる画像の画像登録処理を行う画像処理装置であって、
画像を入力する入力手段と、
前記画像を複数のブロックに分割する分割手段と、
前記分割手段で分割された各ブロック画像の画像特徴情報に基づいて、各ブロック画像に文字画像が存在するか否かを判定する判定手段と、
前記判定手段の判定の結果、前記ブロック画像に文字画像が存在する場合、それを示す情報を画像特徴情報として記憶し、一方、前記ブロック画像に文字画像が存在しない場合、そのブロック画像の画像特徴情報を記憶する記憶手段と
を備えることを特徴とする画像処理装置。
An image processing apparatus that performs image registration processing of an image to be searched for similar image search,
An input means for inputting an image;
Dividing means for dividing the image into a plurality of blocks;
Determination means for determining whether or not a character image exists in each block image based on image feature information of each block image divided by the dividing means;
If a character image exists in the block image as a result of the determination by the determining means, information indicating the character image is stored as image feature information. On the other hand, if a character image does not exist in the block image, the image feature of the block image is stored. An image processing apparatus comprising: storage means for storing information.
検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置の制御方法であって、
前記比較元画像を複数のブロックに分割する分割工程と、
前記分割工程で分割されたブロック画像の画像特徴情報に基づいて、該ブロック画像に文字画像が存在するか否かを判定する判定工程と、
前記判定工程の判定の結果、前記ブロック画像及びそれに対応する前記比較先画像のブロック画像のどちらかに文字画像が存在する場合、両者の類似度として所定の類似度を取得し、一方、前記ブロック及びそれに対応する前記比較先画像のブロック画像のどちらにも文字画像が存在しない場合、その両者の画像特徴情報に基づく類似度を取得する取得工程と、
前記取得工程によって取得される前記分割工程で分割した各ブロック画像に対する類似度を累積加算して得られる累積類似度に基づいて、検索結果となる画像を出力する出力工程と
を備えることを特徴とする画像処理装置の制御方法。
A control method of an image processing apparatus that performs a similar image search based on a similarity between a comparison source image serving as a search condition and a comparison target image,
A dividing step of dividing the comparison source image into a plurality of blocks;
A determination step of determining whether or not a character image exists in the block image based on image feature information of the block image divided in the division step;
As a result of the determination in the determination step, when a character image exists in either the block image or the block image of the comparison target image corresponding thereto, a predetermined similarity is obtained as the similarity between the two, while the block And when there is no character image in either of the block images of the comparison target image corresponding thereto, an acquisition step of acquiring the similarity based on the image feature information of both,
An output step of outputting an image as a search result based on a cumulative similarity obtained by cumulatively adding the similarity to each block image divided in the division step acquired by the acquisition step. For controlling an image processing apparatus.
類似画像検索の検索対象となる画像の画像登録処理を行う画像処理装置の制御方法であって、
画像を入力する入力工程と、
前記画像を複数のブロックに分割する分割工程と、
前記分割工程で分割された各ブロック画像の画像特徴情報に基づいて、各ブロック画像に文字画像が存在するか否かを判定する判定工程と、
前記判定工程の判定の結果、前記ブロック画像に文字画像が存在する場合、それを示す情報を画像特徴情報として記憶し、一方、前記ブロック画像に文字画像が存在しない場合、そのブロック画像の画像特徴情報を記憶部に記憶する記憶工程と
を備えることを特徴とする画像処理装置の制御方法。
A control method of an image processing apparatus that performs image registration processing of an image to be searched for similar image search,
An input process for inputting an image;
A dividing step of dividing the image into a plurality of blocks;
A determination step of determining whether or not a character image exists in each block image based on image feature information of each block image divided in the division step;
As a result of the determination in the determination step, if a character image exists in the block image, information indicating it is stored as image feature information. On the other hand, if a character image does not exist in the block image, the image feature of the block image And a storage step of storing information in a storage unit.
検索条件となる比較元画像と、その比較先画像との類似度に基づいて、類似画像検索を行う画像処理装置の制御を実現するプログラムであって、
前記比較元画像を複数のブロックに分割する分割工程のプログラムコードと、
前記分割工程で分割されたブロック画像の画像特徴情報に基づいて、該ブロック画像に文字画像が存在するか否かを判定する判定工程のプログラムコードと、
前記判定工程の判定の結果、前記ブロック画像及びそれに対応する前記比較先画像のブロック画像のどちらかに文字画像が存在する場合、両者の類似度として所定の類似度を取得し、一方、前記ブロック及びそれに対応する前記比較先画像のブロック画像のどちらにも文字画像が存在しない場合、その両者の画像特徴情報に基づく類似度を取得する取得工程のプログラムコードと、
前記取得工程によって取得される前記分割工程で分割した各ブロック画像に対する類似度を累積加算して得られる累積類似度に基づいて、検索結果となる画像を出力する出力工程のプログラムコードと
を備えることを特徴とするプログラム。
A program that realizes control of an image processing apparatus that performs a similar image search based on a similarity between a comparison source image that is a search condition and a comparison target image,
A program code of a dividing step of dividing the comparison source image into a plurality of blocks;
Based on the image feature information of the block image divided in the division step, a program code of a determination step for determining whether or not a character image exists in the block image;
As a result of the determination in the determination step, when a character image exists in either the block image or the block image of the comparison target image corresponding thereto, a predetermined similarity is obtained as the similarity between the two, while the block And when there is no character image in either of the block images of the comparison target image corresponding thereto, the program code of the obtaining step for obtaining the similarity based on the image feature information of both,
A program code of an output step for outputting an image as a search result based on a cumulative similarity obtained by cumulatively adding the similarity to each block image divided in the division step acquired by the acquisition step. A program characterized by
類似画像検索の検索対象となる画像の画像登録処理を行う画像処理装置の制御を実現するプログラムであって、
画像を入力する入力工程と、
前記画像を複数のブロックに分割する分割工程と、
前記分割工程で分割された各ブロック画像の画像特徴情報に基づいて、各ブロック画像に文字画像が存在するか否かを判定する判定工程と、
前記判定工程の判定の結果、前記ブロック画像に文字画像が存在する場合、それを示す情報を画像特徴情報として記憶し、一方、前記ブロック画像に文字画像が存在しない場合、そのブロック画像の画像特徴情報を記憶部に記憶する記憶工程と
を備えることを特徴とするプログラム。
A program that realizes control of an image processing apparatus that performs image registration processing of an image to be searched for similar image search,
An input process for inputting an image;
A dividing step of dividing the image into a plurality of blocks;
A determination step of determining whether or not a character image exists in each block image based on image feature information of each block image divided in the division step;
As a result of the determination in the determination step, if a character image exists in the block image, information indicating it is stored as image feature information. On the other hand, if a character image does not exist in the block image, the image feature of the block image A storage step of storing information in a storage unit.
JP2004199409A 2004-07-06 2004-07-06 Image processor and its control method, and program Withdrawn JP2006023834A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004199409A JP2006023834A (en) 2004-07-06 2004-07-06 Image processor and its control method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004199409A JP2006023834A (en) 2004-07-06 2004-07-06 Image processor and its control method, and program

Publications (1)

Publication Number Publication Date
JP2006023834A true JP2006023834A (en) 2006-01-26

Family

ID=35797087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004199409A Withdrawn JP2006023834A (en) 2004-07-06 2004-07-06 Image processor and its control method, and program

Country Status (1)

Country Link
JP (1) JP2006023834A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286767A (en) * 2006-04-13 2007-11-01 Canon Inc Image retrieval system, image retrieval server, control method therefor, computer program and computer-readable storage medium
JP2010097609A (en) * 2008-10-15 2010-04-30 Xerox Corp Method and apparatus for representing document with runlength histogram
CN103049512A (en) * 2012-12-14 2013-04-17 杭州淘淘搜科技有限公司 Blocking, weighting and matching retrieval method based on commodity image saliency map
CN104331513A (en) * 2014-11-24 2015-02-04 中国科学技术大学 High-efficiency prediction method for image retrieval performance
CN111552829A (en) * 2020-05-07 2020-08-18 北京海益同展信息科技有限公司 Method and apparatus for analyzing image material
CN114998607A (en) * 2022-05-11 2022-09-02 北京医准智能科技有限公司 Ultrasonic image feature extraction method and device, electronic equipment and storage medium

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286767A (en) * 2006-04-13 2007-11-01 Canon Inc Image retrieval system, image retrieval server, control method therefor, computer program and computer-readable storage medium
US8203732B2 (en) 2006-04-13 2012-06-19 Canon Kabushiki Kaisha Searching for an image utilized in a print request to detect a device which sent the print request
JP2010097609A (en) * 2008-10-15 2010-04-30 Xerox Corp Method and apparatus for representing document with runlength histogram
CN103049512A (en) * 2012-12-14 2013-04-17 杭州淘淘搜科技有限公司 Blocking, weighting and matching retrieval method based on commodity image saliency map
CN103049512B (en) * 2012-12-14 2015-06-17 杭州淘淘搜科技有限公司 Blocking, weighting and matching retrieval method based on commodity image saliency map
CN104331513A (en) * 2014-11-24 2015-02-04 中国科学技术大学 High-efficiency prediction method for image retrieval performance
CN111552829A (en) * 2020-05-07 2020-08-18 北京海益同展信息科技有限公司 Method and apparatus for analyzing image material
CN111552829B (en) * 2020-05-07 2023-06-27 京东科技信息技术有限公司 Method and apparatus for analyzing image material
CN114998607A (en) * 2022-05-11 2022-09-02 北京医准智能科技有限公司 Ultrasonic image feature extraction method and device, electronic equipment and storage medium
CN114998607B (en) * 2022-05-11 2023-01-31 北京医准智能科技有限公司 Ultrasonic image feature extraction method and device, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
JP4353503B2 (en) Image processing device
JP4850652B2 (en) Image search apparatus, control method therefor, program, and storage medium
US7623712B2 (en) Image processing method and apparatus
US8023147B2 (en) Image processing method and image processing apparatus
US7272269B2 (en) Image processing apparatus and method therefor
US8494280B2 (en) Automated method for extracting highlighted regions in scanned source
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8396298B2 (en) Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
CN100414550C (en) Image processing apparatus for image retrieval and control method therefor
US8244035B2 (en) Image processing apparatus and control method thereof
CN100595781C (en) Image processing apparatus and image processing method
CN100502454C (en) Image processing apparatus and method thereof
JP2007286767A (en) Image retrieval system, image retrieval server, control method therefor, computer program and computer-readable storage medium
JP4632443B2 (en) Image processing apparatus, image processing method, and program
US7126612B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP2006023834A (en) Image processor and its control method, and program
JP2007272457A (en) Image processing method and apparatus
JP2004334337A (en) Image processor
JP4179977B2 (en) Stamp processing apparatus, electronic approval system, program, and recording medium
JP2005208977A (en) Document filing device and method
Al-Hashim et al. Benchmark database and GUI environment for printed Arabic text recognition research
JP2008257537A (en) Information registration device, information retrieval device, information retrieval system, information registration program, and information retrieval program
JP2007011762A (en) Area extraction apparatus and area extraction method
JP5012551B2 (en) Information processing apparatus and program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071002