JP4116377B2 - Image processing method and image processing apparatus - Google Patents

Image processing method and image processing apparatus Download PDF

Info

Publication number
JP4116377B2
JP4116377B2 JP2002272293A JP2002272293A JP4116377B2 JP 4116377 B2 JP4116377 B2 JP 4116377B2 JP 2002272293 A JP2002272293 A JP 2002272293A JP 2002272293 A JP2002272293 A JP 2002272293A JP 4116377 B2 JP4116377 B2 JP 4116377B2
Authority
JP
Japan
Prior art keywords
color
area
region
photographic
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002272293A
Other languages
Japanese (ja)
Other versions
JP2004110434A (en
Inventor
忍 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002272293A priority Critical patent/JP4116377B2/en
Publication of JP2004110434A publication Critical patent/JP2004110434A/en
Application granted granted Critical
Publication of JP4116377B2 publication Critical patent/JP4116377B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、文字、写真、図、表などが混在する文書画像から、特に写真の領域を識別する画像処理方法および画像処理装置に関する。
【0002】
【従来の技術】
近年、文書画像において、カラーやグレースケールといった多値画像で扱うことが増えてきているため、従来から主に二値の文書画像に対して実行されてきた、領域識別、タイトル文字列の抽出、表処理、OCRなどの処理においても、多値の画像に対して実行する要望がある。二値の文書画像に対しては、既にさまざまな方法が存在するため、多値の文書画像を上手に二値化すれば、二値画像に対する既存の処理が適用可能と考えられる。
【0003】
図6は、文書画像を示す図である。文書画像20上には文字領域21,表領域22,図領域(図示せず),写真領域23など、異なった属性をもつ領域が混在している。これらのうち、文字領域21,表領域22,図領域においては、それらを記述するのに用いられている色は少数であることが多い。一つの文字そのものが多色で記述されていたり、表の一つのセルが多色であったりすることはまれである。したがって、これらの領域に関しては、部分的に適切なしきい値を見つけて二値化し、二値画像に対する既存の処理を用いることができる。
【0004】
しかしながら、写真領域23においては、写真の内容によっては、画素の色の種類がはるかに多くなる。この写真領域23を他の領域と同様のしきい値処理で二値化すれば、写真の内容が判別不能になるだけでなく、二値化した後の画像を処理する中で、誤って他の領域に分類してしまうことがあった。
【0005】
このような、多値画像に対する領域分類の方法として、背景色を抽出し、その他の色で構成される部分領域を罫線、文字の領域と順次分類していき、最終的にどちらにも分類されない残った領域をその他領域とし、この、その他領域を図または写真領域として扱う方法がある(例えば、特許文献1参照。)。
【0006】
また、特許文献2は、後述する画像の背景色を特定する技術に関するものである。
【0007】
【特許文献1】
特開2001−297303号公報
【特許文献2】
特開2001−222717号公報
【0008】
【発明が解決しようとする課題】
しかしながら、上記従来技術では、写真領域の中に文字列に似通った形の矩形の並びがあると文字領域と分類されてしまうので、写真を抽出するという目的には向いたものではなかった。
【0009】
この発明は、上述した従来技術による問題点を解消するため、多値画像に対して画素色の情報に加え、領域を構成する成分の形状情報を有効に利用することにより、識別誤りが少ない写真領域の識別が可能な画像処理方法および画像処理装置を提供することを目的とする。
【0010】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、この発明にかかる画像処理方法は、多値画像として入力された文書画像から写真領域を識別する機能を有した画像処理方法であって、前記文書画像の背景色を特定する背景色特定工程と、前記背景色と異なる色の画素が連結した部分領域を抽出する部分領域抽出工程と、前記抽出した部分領域に隣接した同色の画素の連なりを等色連結成分として抽出する等色連結成分抽出工程と、前記部分領域内における等色連結成分の外接矩形を求め、複数の該外接矩形の重なりを求める連結成分特徴抽出工程と、前記外接矩形の重なりに基づき前記部分領域が写真領域であるか否かを識別する写真領域判定工程とを含むことを特徴とする。
【0011】
また、前記写真領域判定工程により写真領域と識別された部分領域に対して、該部分領域を入力画像とみなして前記一連の処理を所定回数実行させる工程を含み、再帰的に写真領域を識別することを特徴とする。
【0012】
また、この発明にかかる画像処理装置は、多値画像として入力された文書画像から写真領域を識別する機能を有した画像処理装置であって、前記文書画像の背景色を特定する背景色特定手段と、前記背景色と異なる色の画素が連結した部分領域を抽出する部分領域抽出手段と、前記抽出した部分領域に隣接した同色の画素の連なりを等色連結成分として抽出する等色連結成分抽出手段と、前記部分領域内における等色連結成分の外接矩形を求め、複数の該外接矩形の重なりを求める連結成分特徴抽出手段と、前記外接矩形の重なりに基づき前記部分領域が写真領域であるか否かを識別する写真領域判定手段と、を備えたことを特徴とする。
【0017】
【発明の実施の形態】
以下に添付図面を参照して、この発明にかかる画像処理方法および画像処理装置の好適な実施の形態を詳細に説明する。図1は、本発明の画像処理装置の実施の形態の構成を示すブロック図である。
【0018】
画像処理装置は、カラースキャナ等の画像入力装置を用いて多値の文書画像を入力する画像入力部1と、入力された多値文書画像の背景色を特定する背景色抽出部2と、背景色と異なる画素が連結した領域を抽出する部分領域抽出部3と、部分領域において隣接した同色の画素の連なりを抽出する等色連結成分抽出部4と、等色連結成分の色や形状などの特徴を抽出する連結成分特徴抽出部5と、得られた連結成分の特徴から部分領域画像が写真領域かどうか判定する写真領域判定部6と、抽出したデータを保存しておくメモリ7と、処理の流れを制御する制御部8からなる。
【0019】
(実施の形態1)
図2は、実施の形態1による画像処理の流れを示すフローチャートである。まず、画像入力を行い(ステップS1)、入力された文書画像に対して背景色を特定する(ステップS2)。背景色の特定は、例えば特許文献2に開示されている方法を用いて行える。
【0020】
次に、背景色以外の画素が連結した部分領域を抽出する(ステップS3)。連結した画素の抽出は従来から広く知られた処理であり各種手法を用いることができる。次に、部分領域から等色連結成分を抽出する(ステップS4)。等色連結成分は、隣接する画素色が色空間上においてある一定の距離内にあれば同色とみてグループ化する操作を繰り返して得られる。こうして、部分領域内の画素はいずれかの連結成分に属することになる。
【0021】
そして、この部分領域における等色連結成分の特徴を抽出する(ステップS5)。特徴としては、部分領域を構成する等色連結成分の色の種類の数を求める。この色の種類の数を予め定めてあったしきい値と比較し、しきい値よりも大きければ、当該部分領域を写真領域と判定する(ステップS6)。しきい値は、実験的に求めておけばよい。
【0022】
一般に、文字を構成する画素色は1種類、ないしアウトラインや影つき文字であったとしても数種類程度であることが多い。一方、写真は、はるかに多くの種類の画素色で構成されている。また、セルに色がついたような表なども、文字を構成する画素の色よりは多いが、ベタな色の組み合わせであることが多く、写真領域ほど画素色の種類が多くはならない。このように、部分領域を構成する等色連結成分の色の数を用いれば、簡単に高精度で多値画像から写真領域を抽出することができる。
【0023】
(実施の形態2)
実施の形態2では、実施の形態1で説明した部分領域における等色連結成分の特徴(ステップS5)において、等色連結成分の数も求めて写真領域の判定に利用する。一般に、写真領域は、文字や文字の背景に比べ、等色連結成分が細かく分かれることが多い。
【0024】
例えば、都市部の航空写真などでは、ビルや車ごとに等色連結成分が抽出されると、非常に多くの等色連結成分が存在することになる。これらの各等色連結成分の色の種類が似通っていれば、色の種類の数としては少ないものの等色連結成分の数が膨大になるため、他の領域と区別することができる。このように、部分領域を構成する等色連結成分の数を併せて用いることで、色の種類数が少ないような写真領域でも、簡単に抽出することができる。
【0025】
(実施の形態3)
実施の形態3では、実施の形態2で説明した部分領域における等色連結成分の特徴(ステップS5)において、等色連結成分の外接矩形の重なりに関する特徴も求めて写真領域の判定に利用する。図3は、等色連結成分の外接矩形の分布を説明するための図である。
【0026】
一般に、図3(c)に示す写真領域は、文字や文字の背景に比べ、等色連結成分の形が矩形状でないことが多い。したがって、図3(d)に示すように隣接した等色連結成分の外接矩形同士は大きく重なり合うことになる。一方、図3(a)に示す文字領域においては、文字を構成する等色連結成分は、ある程度重なることがあるが隣り合った文字同士が重なることは殆どないため、図3(b)に示すように外接矩形の重なりは少ない。
【0027】
図4は、外接矩形の重なり状態を説明するための図である。ただし、文字などの背景に相当する等色連結成分とは必ず重なるため、背景との重なりは排除する必要がある。これは、図4(a)に示すように、背景の等色連結成分の外接矩形との重なりが、完全な包含関係となるため、そのような場合を除けばよい。したがって、図4(b)の如く、完全に包含関係にない等色連結成分の外接矩形同士の重なりを調べ、重なり部分の面積の合計と部分領域の面積との比があるしきい値を超えれば写真として他の領域と区別することができる。
【0028】
このように、部分領域を構成する等色連結成分の外接矩形の重なりを併せて用いることで、色の種類数が少なく、等色連結成分の数も文字領域と似通っているような写真領域でも、簡単に抽出することができる。
【0029】
(実施の形態4)
実施の形態4では、実施の形態3で説明した部分領域における等色連結成分の特徴(ステップS5)において、等色連結成分の大きさの分布に関する特徴も求めて写真領域の判定に利用する。一般に、写真領域は、文字の含まれる領域に比べ、等色連結成分の大きさがバラバラに分布することが多い。例えば、人間の顔写真では、顔の輪郭と目,口,髪,洋服,背景などに分かれるが、それらの大きさは、文字列のようにある範囲に収まるような分布にはならない。
【0030】
したがって、等色連結成分の外接矩形の面積の分散値を求め、この値があるしきい値を超えれば写真として他の領域と区別することができる。面積の代わりに、外接矩形の長辺もしくは短辺の長さの分散を用いることもできる。このように、部分領域を構成する等色連結成分の大きさの分布を併せて用いることで、色の種類数が少なく、外接矩形同士の重なりが少ないような写真領域でも、簡単に抽出することができる。
【0031】
(実施の形態5)
図5は、実施の形態5における処理の流れを示すフローチャートである。前述した実施の形態1〜4の処理によりステップS6で写真領域が判定した後、判断子(ステップS7)では新たに入力された画像とみなして、ステップS1に復帰させ、再帰的に写真領域を識別させる。ステップS7における再帰処理の回数については、例えば2回などと予め決めておけばよい。これによって、文書画像上で、写真領域が背景と異なる他の領域に包含されているような場合でも、正しく写真領域のみを抽出できるようになる。
【0033】
以上説明したように、本実施の形態にかかる画像処理方法によれば、多値画像に対して画素色の情報のみならず、領域を構成する成分の形状情報を有効に利用することにより、識別誤りが少ない写真領域の識別が可能となる。
【0034】
なお、本実施の形態で説明した画像処理方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【0035】
【発明の効果】
以上説明したように、この発明によれば、多値画像に対して画素色の情報に加え、領域を構成する成分の形状情報を有効に利用することにより、識別誤りが少ない写真領域の識別が可能であるという効果を奏する。この形状情報としては、部分領域の等色連結成分の色の種類数や、部分領域の等色連結成分の数、部分領域の等色連結成分の外接矩形の重なり状態、部分領域の等色連結成分の大きさの分布を用いて行う。
【0036】
また、再帰的に写真領域を識別したり、画像に応じて再帰的に写真領域を抽出する回数を変化させることによって、写真領域が他の領域に包含されているような場合でも、正しく写真領域のみを抽出できるという効果を奏する。
【図面の簡単な説明】
【図1】 本発明の画像処理装置の実施の形態の構成を示すブロック図である。
【図2】 実施の形態1による画像処理の流れを示すフローチャートである。
【図3】 等色連結成分の外接矩形の分布を説明するための図である。
【図4】 外接矩形の重なり状態を説明するための図である。
【図5】 実施の形態5における処理の流れを示すフローチャートである。
【図6】 文書画像を示す図である。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing method and an image processing apparatus for identifying, in particular, a photograph area from a document image in which characters, photographs, diagrams, tables, and the like are mixed.
[0002]
[Prior art]
In recent years, document images are increasingly handled with multi-valued images such as color and gray scale, so area identification, title character string extraction, which has been performed mainly for binary document images, In processes such as table processing and OCR, there is a demand to execute on multi-valued images. Since various methods already exist for binary document images, it is considered that existing processing for binary images can be applied if the multi-value document image is binarized well.
[0003]
FIG. 6 shows a document image. On the document image 20, areas having different attributes such as a character area 21, a table area 22, a figure area (not shown), and a photograph area 23 are mixed. Among these, in the character area 21, the table area 22, and the figure area, the number of colors used for describing them is often small. It is rare that one character itself is described in multiple colors, or one cell of a table is multicolored. Therefore, for these regions, it is possible to partially find an appropriate threshold value, binarize, and use the existing processing for the binary image.
[0004]
However, in the photo area 23, depending on the content of the photo, the types of pixel colors are much larger. If this photo area 23 is binarized by the same threshold processing as other areas, not only will the contents of the photo be indistinguishable, but other errors may occur while processing the binarized image. It was sometimes classified into the area of.
[0005]
As a method of area classification for such a multi-valued image, a background color is extracted, partial areas composed of other colors are sequentially classified into ruled lines and character areas, and finally they are not classified as either. There is a method in which the remaining area is set as the other area, and this other area is handled as a figure or photo area (see, for example, Patent Document 1).
[0006]
Patent Document 2 relates to a technique for specifying a background color of an image to be described later.
[0007]
[Patent Document 1]
JP 2001-297303 A [Patent Document 2]
JP 2001-222717 A
[Problems to be solved by the invention]
However, the conventional technique described above is not suitable for the purpose of extracting a photograph because if there is an array of rectangles in a shape similar to a character string in the photograph region, it is classified as a character region.
[0009]
In order to solve the above-described problems caused by the prior art, the present invention effectively utilizes the shape information of the components constituting the region in addition to the pixel color information for the multi-valued image, thereby reducing the number of identification errors. An object of the present invention is to provide an image processing method and an image processing apparatus capable of identifying a region.
[0010]
[Means for Solving the Problems]
In order to solve the above-described problems and achieve the object, an image processing method according to the present invention is an image processing method having a function of identifying a photographic region from a document image input as a multi-valued image. A background color specifying step for specifying a background color of an image, a partial region extracting step for extracting a partial region in which pixels of a color different from the background color are connected, a series of pixels of the same color adjacent to the extracted partial region, etc. Color matching connected component extraction step for extracting as a color connected component, circumscribed rectangle of the equal color connected component in the partial area, a connected component feature extracting step for obtaining a plurality of circumscribed rectangles overlapping, and overlapping of the circumscribed rectangles And a photographic region determination step for identifying whether or not the partial region is a photographic region.
[0011]
In addition, the method includes recursively identifying a photographic area with respect to a partial area identified as a photographic area in the photographic area determination step, by regarding the partial area as an input image and executing the series of processes a predetermined number of times. It is characterized by that.
[0012]
The image processing apparatus according to the present invention is an image processing apparatus having a function of identifying a photographic region from a document image input as a multi-valued image, and a background color specifying means for specifying a background color of the document image And a partial area extracting means for extracting a partial area in which pixels of a color different from the background color are connected, and a uniform color connected component extraction for extracting a series of pixels of the same color adjacent to the extracted partial area as a uniform color connected component Means for obtaining a circumscribed rectangle of the same color connected component in the partial area and obtaining a plurality of circumscribed rectangles overlapping, and whether the partial area is a photographic area based on the overlapping of the circumscribed rectangles Photographic area determination means for identifying whether or not.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Exemplary embodiments of an image processing method and an image processing apparatus according to the present invention are explained in detail below with reference to the accompanying drawings. FIG. 1 is a block diagram showing the configuration of an embodiment of an image processing apparatus of the present invention.
[0018]
The image processing apparatus includes an image input unit 1 that inputs a multivalued document image using an image input device such as a color scanner, a background color extraction unit 2 that specifies a background color of the input multivalued document image, and a background A partial region extraction unit 3 that extracts a region in which pixels different from color are connected, a color matching component extraction unit 4 that extracts a series of adjacent pixels of the same color in the partial region, and colors and shapes of the color matching connected components A connected component feature extracting unit 5 for extracting features, a photo region determining unit 6 for determining whether a partial region image is a photo region from the obtained connected component features, a memory 7 for storing the extracted data, and processing It consists of the control part 8 which controls the flow of this.
[0019]
(Embodiment 1)
FIG. 2 is a flowchart showing a flow of image processing according to the first embodiment. First, an image is input (step S1), and a background color is specified for the input document image (step S2). The background color can be specified using a method disclosed in Patent Document 2, for example.
[0020]
Next, a partial region in which pixels other than the background color are connected is extracted (step S3). Extraction of connected pixels is a widely known process, and various methods can be used. Next, a uniform color connected component is extracted from the partial region (step S4). The uniform color connected component is obtained by repeating the operation of grouping the adjacent pixel colors as the same color if they are within a certain distance in the color space. Thus, the pixels in the partial area belong to any connected component.
[0021]
Then, the feature of the color matching connected component in this partial region is extracted (step S5). As a feature, the number of color types of the equal color connected components constituting the partial area is obtained. The number of color types is compared with a predetermined threshold value, and if it is greater than the threshold value, the partial area is determined as a photographic area (step S6). The threshold value may be obtained experimentally.
[0022]
In general, there are often only one type of pixel color that constitutes a character, or several types even if it is an outline or a shaded character. On the other hand, a photograph is composed of far more kinds of pixel colors. Also, a table in which a cell has a color is more than the color of a pixel constituting a character, but is often a solid color combination, and the number of pixel colors is not so large as in a photographic area. As described above, if the number of colors of the equal color connected components constituting the partial area is used, a photograph area can be easily extracted from a multi-value image with high accuracy.
[0023]
(Embodiment 2)
In the second embodiment, in the feature of the color matching connected component in the partial area described in the first embodiment (step S5), the number of the color matching connected components is also obtained and used for the determination of the photographic area. In general, in a photographic region, color matching components are often finely divided compared to characters and character backgrounds.
[0024]
For example, in an aerial photograph of an urban area, if a color matching component is extracted for each building or car, a very large number of color matching components exist. If the color types of these color matching components are similar, the number of color matching components becomes enormous, although the number of color types is small, it can be distinguished from other regions. In this way, by using together the number of color matching components constituting the partial area, it is possible to easily extract even a photographic area having a small number of color types.
[0025]
(Embodiment 3)
In the third embodiment, in the feature of the color matching connected component in the partial area described in the second embodiment (step S5), the feature regarding the overlapping of the circumscribed rectangles of the color matching connected component is also obtained and used for the determination of the photographic area. FIG. 3 is a diagram for explaining the circumscribed rectangle distribution of the equal color connected components.
[0026]
In general, in the photographic region shown in FIG. 3C, the shape of the color matching connected component is often not rectangular compared to characters and the background of characters. Therefore, as shown in FIG. 3D, the circumscribed rectangles of adjacent color matching connected components greatly overlap each other. On the other hand, in the character region shown in FIG. 3A, the color matching components constituting the character may overlap to some extent, but adjacent characters hardly overlap each other. Thus, there is little overlap of circumscribed rectangles.
[0027]
FIG. 4 is a diagram for explaining the overlapping state of circumscribed rectangles. However, since it overlaps with the same color connected components corresponding to the background such as characters, it is necessary to eliminate the overlap with the background. As shown in FIG. 4 (a), the overlap of the background color matching components with the circumscribed rectangle is a complete inclusion relationship. Therefore, as shown in FIG. 4B, the overlapping of circumscribed rectangles of the equal color connected components that are not completely inclusive is examined, and the ratio of the total area of the overlapping portions to the area of the partial regions exceeds a certain threshold value. It can be distinguished from other areas as a photograph.
[0028]
In this way, even in a photographic area where the number of types of colors is small and the number of equal color connected components is similar to that of a character area by using the overlapping of circumscribed rectangles of the same color connected components constituting the partial area. Can be easily extracted.
[0029]
(Embodiment 4)
In the fourth embodiment, in the feature of the color matching connected component in the partial region described in the third embodiment (step S5), the feature relating to the distribution of the size of the color matching connected component is also obtained and used for the determination of the photographic region. In general, photographic areas often have different sizes of equal color connected components as compared to areas containing characters. For example, a human face photograph is divided into face outlines, eyes, mouths, hair, clothes, backgrounds, etc., but their sizes are not distributed within a certain range like character strings.
[0030]
Accordingly, the variance value of the area of the circumscribed rectangle of the equal color connected component is obtained, and if this value exceeds a certain threshold value, it can be distinguished from other regions as a photograph. Instead of the area, dispersion of the length of the long side or the short side of the circumscribed rectangle can also be used. In this way, by using together the distribution of the sizes of the equal color connected components constituting the partial area, it is possible to easily extract even a photographic area where the number of color types is small and the circumscribed rectangles are not overlapped. Can do.
[0031]
(Embodiment 5)
FIG. 5 is a flowchart showing the flow of processing in the fifth embodiment. After the photographic area is determined in step S6 by the processing of the first to fourth embodiments described above, the determiner (step S7) regards it as a newly input image, returns to step S1, and recursively sets the photographic area. Let them be identified. The number of recursive processes in step S7 may be determined in advance, for example, twice. This makes it possible to correctly extract only the photographic area even when the photographic area is included in another area different from the background on the document image.
[0033]
As described above, according to the image processing method according to the present embodiment, not only the pixel color information but also the shape information of the components constituting the region is effectively used for the multi-valued image, so that the identification is performed. Photo areas with few errors can be identified.
[0034]
The image processing method described in the present embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.
[0035]
【The invention's effect】
As described above, according to the present invention, it is possible to identify a photographic region with few identification errors by effectively using shape information of components constituting the region in addition to pixel color information for a multi-valued image. There is an effect that it is possible. The shape information includes the number of types of color of the same color connected component of the partial area, the number of the same color connected component of the partial area, the overlapping state of the circumscribed rectangles of the same color connected component of the partial area, and the same color connected of the partial area. This is done using the component size distribution.
[0036]
Also, by recursively identifying the photo area or changing the number of times the photo area is extracted recursively according to the image, even if the photo area is included in other areas, the photo area is correctly The effect is that only can be extracted.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment of an image processing apparatus of the present invention.
FIG. 2 is a flowchart showing a flow of image processing according to the first embodiment.
FIG. 3 is a diagram for explaining a circumscribed rectangle distribution of equal color connected components;
FIG. 4 is a diagram for explaining an overlapping state of circumscribed rectangles.
FIG. 5 is a flowchart showing a flow of processing in the fifth embodiment.
FIG. 6 is a diagram illustrating a document image.

Claims (3)

多値画像として入力された文書画像から写真領域を識別する機能を有した画像処理方法であって、
前記文書画像の背景色を特定する背景色特定工程と、
前記背景色と異なる色の画素が連結した部分領域を抽出する部分領域抽出工程と、
前記抽出した部分領域に隣接した同色の画素の連なりを等色連結成分として抽出する等色連結成分抽出工程と、
前記部分領域内における等色連結成分の外接矩形を求め、複数の該外接矩形の重なりを求める連結成分特徴抽出工程と、
前記外接矩形の重なりに基づき前記部分領域が写真領域であるか否かを識別する写真領域判定工程と、
を含むことを特徴とする画像処理方法。
An image processing method having a function of identifying a photographic region from a document image input as a multi-valued image,
A background color specifying step for specifying a background color of the document image;
A partial region extraction step of extracting a partial region in which pixels of a color different from the background color are connected;
A color matching connected component extraction step for extracting a series of pixels of the same color adjacent to the extracted partial region as a color matching connected component;
Obtaining a circumscribed rectangle of equal-color connected components in the partial region, and obtaining a connected component feature extracting step for obtaining an overlap of the circumscribed rectangles ;
A photograph region determining step of identifying whether the partial area based on the overlap of the circumscribed rectangle is a photograph region,
An image processing method comprising:
前記写真領域判定工程により写真領域と識別された部分領域に対して、該部分領域を入力画像とみなして前記一連の処理を所定回数実行させる工程を含み、再帰的に写真領域を識別することを特徴とする請求項1に記載の画像処理方法。 Recursively identifying a photographic area with respect to a partial area identified as a photographic area by the photographic area determination step, including the step of considering the partial area as an input image and executing the series of processes a predetermined number of times. The image processing method according to claim 1, wherein: 多値画像として入力された文書画像から写真領域を識別する機能を有した画像処理装置であって、An image processing apparatus having a function of identifying a photographic region from a document image input as a multivalued image,
前記文書画像の背景色を特定する背景色特定手段と、Background color specifying means for specifying the background color of the document image;
前記背景色と異なる色の画素が連結した部分領域を抽出する部分領域抽出手段と、Partial area extraction means for extracting a partial area in which pixels of a color different from the background color are connected;
前記抽出した部分領域に隣接した同色の画素の連なりを等色連結成分として抽出する等色連結成分抽出手段と、Color matching connected component extraction means for extracting a series of pixels of the same color adjacent to the extracted partial area as a color matching connected component;
前記部分領域内における等色連結成分の外接矩形を求め、複数の該外接矩形の重なりを求める連結成分特徴抽出手段と、A connected component feature extracting means for obtaining a circumscribed rectangle of the equal color connected component in the partial region and obtaining an overlap of the circumscribed rectangle;
前記外接矩形の重なりに基づき前記部分領域が写真領域であるか否かを識別する写真領域判定手段と、Photographic area determination means for identifying whether the partial area is a photographic area based on the overlap of the circumscribed rectangles;
を備えたことを特徴とする画像処理装置。An image processing apparatus comprising:
JP2002272293A 2002-09-18 2002-09-18 Image processing method and image processing apparatus Expired - Fee Related JP4116377B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002272293A JP4116377B2 (en) 2002-09-18 2002-09-18 Image processing method and image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002272293A JP4116377B2 (en) 2002-09-18 2002-09-18 Image processing method and image processing apparatus

Publications (2)

Publication Number Publication Date
JP2004110434A JP2004110434A (en) 2004-04-08
JP4116377B2 true JP4116377B2 (en) 2008-07-09

Family

ID=32269345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002272293A Expired - Fee Related JP4116377B2 (en) 2002-09-18 2002-09-18 Image processing method and image processing apparatus

Country Status (1)

Country Link
JP (1) JP4116377B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4329821B2 (en) 2007-01-31 2009-09-09 ブラザー工業株式会社 Face detection device, face detection method, and face detection program
JP4960897B2 (en) 2008-01-30 2012-06-27 株式会社リコー Image processing apparatus, image processing method, program, and storage medium
JP4821869B2 (en) * 2009-03-18 2011-11-24 富士ゼロックス株式会社 Character recognition device, image reading device, and program
JP5598146B2 (en) * 2010-08-05 2014-10-01 セイコーエプソン株式会社 Print control program and print control apparatus
US8977044B2 (en) 2011-02-18 2015-03-10 Fuji Xerox Co., Ltd. Image processing apparatus for area separation of images, image processing method, and computer readable medium

Also Published As

Publication number Publication date
JP2004110434A (en) 2004-04-08

Similar Documents

Publication Publication Date Title
US5434953A (en) Use of fast textured reduction for discrimination of document image components
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US7437002B2 (en) Image recognition system utilizing an edge image and a binary image
JP2008085695A (en) Electronic watermark embedding apparatus and detection apparatus
JPH0863546A (en) Information extracting method, method and system for recovering picture
JPH05225378A (en) Area dividing system for document image
JP2001266068A (en) Method and device for recognizing table, character- recognizing device, and storage medium for recording table recognizing program
JP2000207489A (en) Character extracting method and device and record medium
JP4116377B2 (en) Image processing method and image processing apparatus
JP4049560B2 (en) Halftone dot removal method and system
JP2010074342A (en) Image processing apparatus, image forming apparatus, and program
CN108388898A (en) Character identifying method based on connector and template
JP4060559B2 (en) Image processing apparatus and image processing method
JP2005275854A (en) Image processor, image processing method, image processing program and recording medium with this program stored thereon
JP2004127203A (en) Image processor, image processing method, program for causing computer to execute the method, and computer readable recording medium with the program recorded thereon
JP4001446B2 (en) Method, apparatus and computer-readable recording medium for specifying image background color
JP3090070B2 (en) Form identification method and device
US7899255B2 (en) Method for recognizing and indexing digital media
JP2004062459A (en) Image processor, image processing method, image processing program, and computer readable recording medium recorded with the program
JP4228905B2 (en) Image processing apparatus and program
CN112991470B (en) Certificate photo background color checking method and system under complex background
KR100259804B1 (en) Letter cognition method for guidepost shape
JPH06301775A (en) Picture processing method, picture identification method and picture processor
JP2002236921A (en) Document image recognition method, document image recognition device and recording medium
Elmore et al. A morphological image preprocessing suite for ocr on natural scene images

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080417

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140425

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees