JP4001446B2 - Method, apparatus and computer-readable recording medium for specifying image background color - Google Patents

Method, apparatus and computer-readable recording medium for specifying image background color Download PDF

Info

Publication number
JP4001446B2
JP4001446B2 JP2000032294A JP2000032294A JP4001446B2 JP 4001446 B2 JP4001446 B2 JP 4001446B2 JP 2000032294 A JP2000032294 A JP 2000032294A JP 2000032294 A JP2000032294 A JP 2000032294A JP 4001446 B2 JP4001446 B2 JP 4001446B2
Authority
JP
Japan
Prior art keywords
color
cluster
background color
document image
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000032294A
Other languages
Japanese (ja)
Other versions
JP2001222717A (en
Inventor
司 幸地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000032294A priority Critical patent/JP4001446B2/en
Publication of JP2001222717A publication Critical patent/JP2001222717A/en
Application granted granted Critical
Publication of JP4001446B2 publication Critical patent/JP4001446B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、文書画像認識方法に関し、特に、カラー文書画像の背景色を特定するための文書画像認識方法に関する。
【0002】
【従来の技術】
文書画像認識の結果として最終的に必要なものは、文字(コンテンツ)、表や罫線、図、写真、及び読み順を正しく認識するためのレイアウト構成であるので、通常カラー文書画像の背景色を厳密に再現する必要はない。それゆえ、カラー文書画像の背景色を精度よく特定することは従来あまり考慮されてはいなかった。
【0003】
しかし、文書の背景色を除去することで、必要な文書要素の抽出が可能になる場合があり、また、背景色は画像特徴を利用した文書検索のための重要な特徴の1つとなり得る。従って、カラー文書画像の背景色を特定する技術は重要である。
【0004】
カラー文書画像の背景色を特定する従来の技術として、特開平06−348758「文書情報検索装置及び方法」に、文書の外観を表す情報を検索キーとして所望の文書を検索できる文書情報検装置装が開示されており、そこでは文書の背景色が検索キーの一つとして検出・保持されている。
【0005】
【発明が解決しようとする課題】
上記の従来技術では、文書の背景色は単純に文書中に最も多く現れた色として定義している。従って、単純で高速な処理が可能だが、文書に大きな図・写真が存在する場合に誤った色を背景色としてしてしまう可能性があった。
【0006】
このように、文書に大きな図・写真が存在する場合、色クラスタリングした結果、背景色クラスタサイズよりも別の色のクラスタサイズが大きくなって、それを背景色としてしまうという問題点があった。
【0007】
本発明は、上記の点に鑑みてなされたものであり、文書内に大きな図・写真が存在する場合でも正確に背景色を特定する方法及び装置を提供することを目的とする。
【0008】
また、カラー文書画像の背景色特定は、文書画像認識の結果を得るための前処理であることを踏まえて、単純で、かつ高速に処理を行うことができる背景色特定のための方法及び装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記の課題を解決するために、本発明は次のように構成される。
【0010】
請求項に記載の発明は、デジタル画像として入力された文書画像の背景色を特定するための装置が実行する方法であって、前記文書画像における色をクラスタリングするクラスタリングステップと、前記クラスタリングステップにより得られた複数のクラスタの中で最も多くの画素数を有する第1のクラスタの色と、前記複数のクラスタの中で画素数が2番目に多いクラスタである第2のクラスタの色を決定する決定ステップと、前記第1のクラスタと前記第2のクラスタの画素数の差が所定の値より小さく、前記第2のクラスタの色が前記文書画像全体に亘り分布している場合に、当該第2のクラスタの色を前記文書画像の背景色とする背景色特定ステップとを有する。
【0011】
背景色は文書全体に分布しているという観点から、第2の色が文書中の広範囲に分布している場合にそれを背景色とするので、本発明によれば、文書中に大きな図や写真がある場合でも背景色を精度良く求めることができる。上記の条件を満たさない場合は、最大クラスタを背景色とすればよく、背景色を高速に求めることができる。
【0014】
請求項に記載の発明は、上記の方法の実施に適した装置であり、上記の作用効果と同様の作用効果を有する。
【0015】
請求項に記載の発明は、コンピュータ上で上記の方法を実施することに適したプログラムを記録した記録媒体であり、上記の作用効果と同様の作用効果を有する。
【0016】
【発明の実施の形態】
以下、図を参照して本発明における実施例を説明する。図1は本発明の実施例における文書画像認識装置の構成図である。同図に示すように、本発明の文書画像認識装置は、CPU(中央処理装置)100、メモリ101、スキャナ102、通信装置103、表示装置104、ハードディスク105、キーボード106、CD−ROMドライブ107を有する。ハードディスク105は文書画像認識装置の外部装置として接続してもよいし、内部装置として有していてもよい。CPU100は文書画像認識装置の全体を制御する。メモリ101はCPU100で処理するデータやプログラムを保持する。通信装置103は文書画像認識装置をLAN等のネットワークに接続するための制御を行う。キーボード106はデータを入力する装置である。CD−ROMドライブ107はCD−ROM等を駆動し、読み書きを行う。スキャナ102は文書画像認識装置の外部装置として接続され、文書をカラーデジタル画像として入力する機能を有する。CD−ROMドライブ107の他、MOドライブ、FDドライブ、DVDドライブ等でもよい。
【0017】
本発明の実施例において後述する処理を実行するプログラムは、例えばCD−ROMに格納され、CD−ROMドライブ107を介してハードディスク105にロードされる。プログラムが起動されると、所定のプログラムがメモリ101に展開され、処理が実行される。動作の概要は次の通りである。
【0018】
まず、スキャナ102を介して紙文書の内容がカラーデジタル画像として入力され、メモリ101又はハードディスク105に格納される。次に、以下で詳述する背景色の特定を含む領域識別処理がCPU100により行われ、領域識別結果に対して、例えばOCR処理が行われる。
【0019】
次に、背景色を特定する処理について、図2のフローチャートを参照して詳細に説明する。
【0020】
ステップS1において、紙文書をスキャナ102で、あるいはネットワークを介してカラーデジタル画像として文書画像認識装置に入力する。本実施例では色数を24bitフルカラーと仮定するが、他の色数や解像度でもよい。本発明では、基本的に画像の色数や解像度には依存しない。ステップS2において平滑化を行い、ステップS3にて画像圧縮を行う。平滑化と画像圧縮の処理の順序は逆でもよい。
【0021】
平滑化と画像圧縮は、文書中の大まかな色分布を調べるための色クラスタリング(ステップS4)の前処理として行う処理である。カラー画像の一部は異なる色の網点で構成されており、これら網点構成はプリンターやカラーコピーなどの機種によってそれぞれ異なるものである。このようなカラー出力系の特性を均一にするために、画像全体に対して平滑化を施す。従って、必要がなければ平滑化を行わなくてもよい。また、一般に平滑化は時間がかかる処理なので、速度が問題になる場合にも行わなくてよい。画像圧縮は、画像へのアクセスコストを削減するために行う処理であり、画像圧縮のための圧縮率は、運用時に動的に変更することが可能である。平滑化と同様、画像圧縮を行わなくてもよい。
【0022】
次に、ステップS4として、適当な色座標系(例えばRGB)のもとで色量子化を行い、大まかな色分布を調べるために、画像全体に対して色クラスタリングを行う。この色クラスタリングは、最終クラスタ数を2〜10程度に設定し、画像処理分野での一般的な手法によって行う。
【0023】
ステップS5において、最大クラスタ(Aとする)及び、第2位のクラスタ(Bとする)の代表色をそれぞれ決定する。クラスタの代表色の決定の方法には次の2種類がある。
【0024】
(1)RGB各プレーンの平均値を求めて代表色とする。
【0025】
(2)輝度のヒストグラムをとって、その中央値(メディアン)に相当する色を代表色とする。
【0026】
一般に、(1)の平均値を求める方法は速度の点で有利であり、(2)の中央値を求める方法は、精度の点で有利である。
【0027】
次に、背景色を特定する(ステップS6〜S10)。一般に、背景画素数は他の色画素数よりも十分に大きいので、属する画素数が最も多いクラスタの代表色を、当該文書の背景色とする。
【0028】
しかしながら、図3に示すように、背景より大きな図・写真が文書存在する場合には、背景色に相当する色クラスタに属する画素数よりも、別の色クラスタに属する画素数の方が大きくなることがある。このような場合にも精度良く対応するために、本発明では、最大クラスタC1のサイズをS1、第2位のクラスタC2のサイズをS2とおくとき、S1とS2の差があるしきい値よりも小さい場合に、C1とC2が特定の条件を満たせば、第2位のクラスタC2の代表色を文書の背景色とする。
【0029】
すなわち、あるクラスタXに属する画素数をクラスタXのサイズと呼び、それをN(X)と記述することとすると、ステップS6において、N(A)がN(B)よりも十分に大きい場合は、クラスタAの代表色を該文書の背景色と決定して(ステップS7)処理を終了する。ここで、「十分に大きい」とは具体的には、例えば、1.5倍以上の開きがある場合である。すなわち、N(A)>N(B)×1.5の場合である。
【0030】
ステップS6において、N(A)がN(B)よりも十分に大きくない場合、それぞれのクラスタに属する画素の文書中における分布具合いを調べる。ステップ8において、クラスタBに属する画素が大きな連結成分として文書中に存在する場合、すなわち、クラスタBの代表色が文書の広範囲に分布している場合、該クラスタの代表色を該文書の背景色と決定することが可能である(ステップS8からS10への点線)。図4は図3の文書における色の分布を示した図であり、色Bが広範囲に分布している場合の例である。逆に、クラスタBの代表色が文書に広範囲に分布していない場合、すなわち、クラスタBに属する画素が非連結な多数の小さな塊として存在するならば、クラスタBの代表色は該文書の背景色とはなり得ないと判断して、クラスタAの代表色を該文書の背景色と決定する(ステップS7)。ここで、「クラスタBの代表色は文書の広範囲に分布している」とは具体的には、例えば、横方向のライン毎にクラスタBの代表色のヒストグラムを取ったとき、頻度0の区間が50%以下の場合であるとすることができる。
【0031】
ステップS8にて、クラスタBの代表色が文書の広範囲に分布している場合であっても、背景色の判断がつかない場合は、ステップ9にてクラスタBがクラスタAより白っぽいかどうかを調べ、より白っぽいクラスタの代表色を該文書の背景色と決定する(ステップS7、又はステップS10)。これは、背景色のほうが背景以外の色より白っぽいと考えられるからである。ここで、「色Bは色Aよりも白っぽい」とは、具体的には、色Bの輝度が色Aの輝度よりも大きいとする。RGB系では白を(255、255、255)、黒を(0、0、0)と表すので、例えばGreen値が大きい方をより白っぽいと定義することができる。
【0032】
なお、上記の説明において、クラスタBは第2位のクラスタとしたが、クラスタAよりサイズが小さいクラスタであれば、第2位である必要はない。上記のステップS6でNO、S8でYES、S9でYESの条件を満たす限り、Bが背景色として選択される。
【0033】
ステップS6において、N(A)がN(B)よりも十分に大きくない場合、それ以降の処理を行わず、この時点でユーザーに背景色の自動特定が困難である旨の警告を発してもよい。例えば、「背景色自動特定に失敗しました」等の警告を発する。
【0034】
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内で種々変更・応用が可能である。
【0035】
【発明の効果】
上述の通り、本発明によれば、カラー文書画像の背景色を高速に精度よく求めることができる。また、文書中に大きな図・写真が存在する場合でも正確に背景色を特定できる。従って、背景色を利用する画像認識処理を効率良く行うことができるようになる。
【図面の簡単な説明】
【図1】本発明の一実施例における文書画像認識装置の構成図である。
【図2】本発明の一実施例における背景色特定処理のフローチャートである。
【図3】背景より大きい写真が含まれた文書の例を示す図である。
【図4】図3の文書における色の分布を示した図
【符号の説明】
100 CPU
101 メモリ
102 スキャナ
103 通信装置
104 表示装置
105 ハードディスク
106 キーボード
107 CD−ROMドライブ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a document image recognition method, and more particularly to a document image recognition method for specifying a background color of a color document image.
[0002]
[Prior art]
What is ultimately required as a result of document image recognition is a layout configuration for correctly recognizing characters (contents), tables and ruled lines, diagrams, photographs, and reading order. There is no need to reproduce exactly. Therefore, it has not been so much considered in the past to accurately specify the background color of a color document image.
[0003]
However, by removing the background color of the document, it may be possible to extract a necessary document element, and the background color can be one of important features for document search using image features. Therefore, a technique for specifying the background color of a color document image is important.
[0004]
As a conventional technique for specifying the background color of a color document image, Japanese Patent Application Laid-Open No. 06-348758 “Document Information Retrieval Apparatus and Method” discloses a document information inspection apparatus capable of retrieving a desired document using information representing the appearance of the document as a retrieval key. In this document, the background color of the document is detected and held as one of the search keys.
[0005]
[Problems to be solved by the invention]
In the above prior art, the background color of the document is simply defined as the color that appears most frequently in the document. Therefore, although simple and high-speed processing is possible, there is a possibility that an erroneous color is set as a background color when a large figure / photo is present in the document.
[0006]
As described above, when a large figure / photo is present in the document, there is a problem that the cluster size of another color becomes larger than the background color cluster size as a result of color clustering, and this is used as the background color.
[0007]
The present invention has been made in view of the above points, and an object thereof is to provide a method and apparatus for accurately specifying a background color even when a large figure / photograph exists in a document.
[0008]
Further, in consideration of the fact that the background color specification of a color document image is a preprocessing for obtaining the result of document image recognition, a method and apparatus for specifying a background color that can be processed simply and at high speed The purpose is to provide.
[0009]
[Means for Solving the Problems]
In order to solve the above problems, the present invention is configured as follows.
[0010]
The invention according to claim 1 is a method executed by an apparatus for specifying a background color of a document image input as a digital image, the clustering step for clustering colors in the document image, and the clustering step. The color of the first cluster having the largest number of pixels among the plurality of obtained clusters and the color of the second cluster having the second largest number of pixels among the plurality of clusters are determined. The determination step, and the difference between the number of pixels of the first cluster and the second cluster is smaller than a predetermined value, and the color of the second cluster is distributed over the entire document image. A background color specifying step in which the color of the two clusters is used as the background color of the document image.
[0011]
From the viewpoint that the background color is distributed over the entire document, when the second color is distributed over a wide range in the document, the background color is used as the background color. Even when there is a photo, the background color can be obtained with high accuracy. If the above condition is not satisfied, the maximum cluster may be used as the background color, and the background color can be obtained at high speed.
[0014]
The invention according to claim 2 is an apparatus suitable for carrying out the above method, and has the same effect as the above effect.
[0015]
The invention described in claim 3 is a recording medium on which a program suitable for executing the above method on a computer is recorded, and has the same effect as the above effect.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram of a document image recognition apparatus according to an embodiment of the present invention. As shown in the figure, the document image recognition apparatus of the present invention includes a CPU (central processing unit) 100, a memory 101, a scanner 102, a communication device 103, a display device 104, a hard disk 105, a keyboard 106, and a CD-ROM drive 107. Have. The hard disk 105 may be connected as an external apparatus of the document image recognition apparatus or may be included as an internal apparatus. The CPU 100 controls the entire document image recognition apparatus. The memory 101 holds data and programs processed by the CPU 100. The communication device 103 performs control for connecting the document image recognition device to a network such as a LAN. The keyboard 106 is a device for inputting data. The CD-ROM drive 107 drives a CD-ROM or the like to read / write. The scanner 102 is connected as an external device of the document image recognition device and has a function of inputting a document as a color digital image. In addition to the CD-ROM drive 107, an MO drive, an FD drive, a DVD drive, or the like may be used.
[0017]
A program for executing processing to be described later in the embodiment of the present invention is stored in, for example, a CD-ROM and loaded onto the hard disk 105 via the CD-ROM drive 107. When the program is activated, a predetermined program is expanded in the memory 101 and processing is executed. The outline of the operation is as follows.
[0018]
First, the content of a paper document is input as a color digital image via the scanner 102 and stored in the memory 101 or the hard disk 105. Next, a region identification process including background color specification described in detail below is performed by the CPU 100, and for example, an OCR process is performed on the region identification result.
[0019]
Next, processing for specifying the background color will be described in detail with reference to the flowchart of FIG.
[0020]
In step S1, a paper document is input to the document image recognition apparatus as a color digital image by the scanner 102 or via a network. In this embodiment, it is assumed that the number of colors is 24 bit full color, but other colors and resolutions may be used. The present invention basically does not depend on the number of colors or resolution of an image. Smoothing is performed in step S2, and image compression is performed in step S3. The order of the smoothing and image compression processes may be reversed.
[0021]
Smoothing and image compression are processes performed as preprocessing for color clustering (step S4) for examining a rough color distribution in a document. A part of the color image is composed of halftone dots of different colors, and these halftone dot configurations are different depending on models such as printers and color copies. In order to make the characteristics of the color output system uniform, the entire image is smoothed. Therefore, smoothing may not be performed if not necessary. Further, since smoothing is generally a time-consuming process, it may not be performed even when speed is a problem. Image compression is processing performed to reduce the access cost to images, and the compression rate for image compression can be changed dynamically during operation. Similar to smoothing, image compression may not be performed.
[0022]
In step S4, color quantization is performed under an appropriate color coordinate system (for example, RGB), and color clustering is performed on the entire image in order to examine a rough color distribution. This color clustering is performed by a general technique in the image processing field with the final number of clusters set to about 2 to 10.
[0023]
In step S5, representative colors of the largest cluster (referred to as A) and the second highest cluster (referred to as B) are determined. There are the following two methods for determining the representative color of the cluster.
[0024]
(1) The average value of each RGB plane is obtained and used as a representative color.
[0025]
(2) Taking a histogram of luminance, a color corresponding to the median value is set as a representative color.
[0026]
In general, the method of obtaining the average value of (1) is advantageous in terms of speed, and the method of obtaining the median value of (2) is advantageous in terms of accuracy.
[0027]
Next, a background color is specified (steps S6 to S10). In general, since the number of background pixels is sufficiently larger than the number of other color pixels, the representative color of the cluster having the largest number of belonging pixels is set as the background color of the document.
[0028]
However, as shown in FIG. 3, when a document having a figure / photo larger than the background exists, the number of pixels belonging to another color cluster is larger than the number of pixels belonging to the color cluster corresponding to the background color. Sometimes. In order to deal with such a case with high accuracy, in the present invention, when the size of the maximum cluster C1 is S1 and the size of the second-ranked cluster C2 is S2, a threshold value having a difference between S1 and S2 is used. If C1 and C2 satisfy a specific condition, the representative color of the second highest cluster C2 is set as the background color of the document.
[0029]
That is, if the number of pixels belonging to a certain cluster X is called the size of the cluster X and is described as N (X), if N (A) is sufficiently larger than N (B) in step S6, The representative color of cluster A is determined as the background color of the document (step S7), and the process ends. Here, “sufficiently large” specifically means, for example, a case where there is an opening of 1.5 times or more. That is, N (A)> N (B) × 1.5.
[0030]
In step S6, when N (A) is not sufficiently larger than N (B), the distribution degree of the pixels belonging to each cluster in the document is examined. In step 8, if the pixels belonging to cluster B exist in the document as large connected components, that is, if the representative color of cluster B is distributed over a wide range of the document, the representative color of the cluster is set as the background color of the document. (Dotted line from step S8 to S10). FIG. 4 is a diagram showing the color distribution in the document of FIG. 3, and is an example when the color B is distributed over a wide range. On the other hand, if the representative color of cluster B is not widely distributed in the document, that is, if the pixels belonging to cluster B exist as a large number of unconnected small clusters, the representative color of cluster B is the background of the document. Since it is determined that it cannot be a color, the representative color of cluster A is determined as the background color of the document (step S7). Here, “the representative color of the cluster B is distributed over a wide range of the document” specifically means that, for example, when a histogram of the representative color of the cluster B is taken for each line in the horizontal direction, the interval of the frequency 0 Can be assumed to be 50% or less.
[0031]
In step S8, if the background color cannot be determined even if the representative color of cluster B is distributed over a wide range of the document, it is checked in step 9 whether cluster B is whitish than cluster A. The representative color of the more whitish cluster is determined as the background color of the document (step S7 or step S10). This is because the background color is considered whitish than the colors other than the background. Here, “color B is whitish than color A” specifically means that the luminance of color B is larger than the luminance of color A. In the RGB system, white is represented as (255, 255, 255), and black is represented as (0, 0, 0). Therefore, for example, a larger Green value can be defined as more whitish.
[0032]
In the above description, the cluster B is the second-ranked cluster. However, if the cluster is smaller than the cluster A, the cluster B need not be the second-ranked cluster. B is selected as the background color as long as the conditions of NO in step S6, YES in S8, and YES in S9 are satisfied.
[0033]
In step S6, if N (A) is not sufficiently larger than N (B), the subsequent processing is not performed, and even if a warning is given to the user that it is difficult to automatically specify the background color at this time. Good. For example, a warning such as “Failed to specify background color automatically” is issued.
[0034]
The present invention is not limited to the above-described embodiments, and various modifications and applications can be made within the scope of the claims.
[0035]
【The invention's effect】
As described above, according to the present invention, the background color of a color document image can be obtained at high speed and with high accuracy. In addition, the background color can be accurately specified even when a large figure or photograph exists in the document. Therefore, the image recognition process using the background color can be performed efficiently.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a document image recognition apparatus according to an embodiment of the present invention.
FIG. 2 is a flowchart of background color specifying processing according to an embodiment of the present invention.
FIG. 3 is a diagram illustrating an example of a document including a photograph larger than the background.
FIG. 4 is a diagram showing color distribution in the document of FIG.
100 CPU
101 Memory 102 Scanner 103 Communication Device 104 Display Device 105 Hard Disk 106 Keyboard 107 CD-ROM Drive

Claims (3)

デジタル画像として入力された文書画像の背景色を特定するための装置が実行する方法であって、
前記文書画像における色をクラスタリングするクラスタリングステップと、
前記クラスタリングステップにより得られた複数のクラスタの中で最も多くの画素数を有する第1のクラスタの色と、前記複数のクラスタの中で画素数が2番目に多いクラスタである第2のクラスタの色を決定する決定ステップと、
前記第1のクラスタと前記第2のクラスタの画素数の差が所定の値より小さく、前記第2のクラスタの色が前記文書画像全体に亘り分布している場合に、当該第2のクラスタの色を前記文書画像の背景色とする背景色特定ステップと
を有することを特徴とする方法。
A method performed by an apparatus for specifying a background color of a document image input as a digital image , comprising:
A clustering step of clustering colors in the document image;
The color of the first cluster having the largest number of pixels among the plurality of clusters obtained by the clustering step, and the second cluster having the second largest number of pixels among the plurality of clusters. A decision step to determine the color;
When the difference in the number of pixels between the first cluster and the second cluster is smaller than a predetermined value and the color of the second cluster is distributed over the entire document image, the second cluster And a background color specifying step of setting a color as a background color of the document image.
デジタル画像として入力された文書画像の背景色を特定するための装置であって、
前記文書画像における色をクラスタリングするクラスタリング手段と、
前記クラスタリング手段により得られた複数のクラスタの中で最も多くの画素数を有する第1のクラスタの色と、前記複数のクラスタの中で画素数が2番目に多いクラスタである第2のクラスタの色を決定する決定手段と、
前記第1のクラスタと前記第2のクラスタの画素数の差が所定の値より小さく、前記第2のクラスタの色が前記文書画像全体に亘り分布している場合に、当該第2のクラスタの色を前記文書画像の背景色とする背景色特定手段と
を有することを特徴とする装置。
An apparatus for specifying a background color of a document image input as a digital image ,
Clustering means for clustering colors in the document image;
The color of the first cluster having the largest number of pixels among the plurality of clusters obtained by the clustering means, and the second cluster having the second largest number of pixels among the plurality of clusters. A determining means for determining a color;
When the difference in the number of pixels between the first cluster and the second cluster is smaller than a predetermined value and the color of the second cluster is distributed over the entire document image, the second cluster And a background color specifying means for setting a color as a background color of the document image.
コンピュータにデジタル画像として入力された文書画像の背景色を特定する処理を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記文書画像における色をクラスタリングするクラスタリング手順と、
前記クラスタリング手順により得られた複数のクラスタの中で最も多くの画素数を有する第1のクラスタの色と、前記複数のクラスタの中で画素数が2番目に多いクラスタである第2のクラスタの色を決定する決定手順と、
前記第1のクラスタと前記第2のクラスタの画素数の差が所定の値より小さく、前記第2のクラスタの色が前記文書画像全体に亘り分布している場合に、当該第2のクラスタの色を前記文書画像の背景色とする背景色特定手順と
をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
A computer-readable recording medium recording a program for executing processing for specifying a background color of a document image input as a digital image to a computer,
A clustering procedure for clustering colors in the document image;
The color of the first cluster having the largest number of pixels among the plurality of clusters obtained by the clustering procedure, and the second cluster having the second largest number of pixels among the plurality of clusters. A decision procedure to determine the color;
When the difference in the number of pixels between the first cluster and the second cluster is smaller than a predetermined value and the color of the second cluster is distributed over the entire document image, the second cluster A computer-readable recording medium storing a program for causing a computer to execute a background color specifying procedure for setting a color as a background color of the document image.
JP2000032294A 2000-02-09 2000-02-09 Method, apparatus and computer-readable recording medium for specifying image background color Expired - Fee Related JP4001446B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000032294A JP4001446B2 (en) 2000-02-09 2000-02-09 Method, apparatus and computer-readable recording medium for specifying image background color

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000032294A JP4001446B2 (en) 2000-02-09 2000-02-09 Method, apparatus and computer-readable recording medium for specifying image background color

Publications (2)

Publication Number Publication Date
JP2001222717A JP2001222717A (en) 2001-08-17
JP4001446B2 true JP4001446B2 (en) 2007-10-31

Family

ID=18556916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000032294A Expired - Fee Related JP4001446B2 (en) 2000-02-09 2000-02-09 Method, apparatus and computer-readable recording medium for specifying image background color

Country Status (1)

Country Link
JP (1) JP4001446B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096355A (en) * 2014-05-08 2015-11-25 腾讯科技(深圳)有限公司 Image processing method and system

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252862A (en) * 2007-03-05 2008-10-16 Ricoh Co Ltd Image processing apparatus, image processing method, and image processing program
JP5127739B2 (en) * 2009-02-06 2013-01-23 キヤノン株式会社 Image processing method, image processing apparatus, and program
JP5127738B2 (en) * 2009-02-06 2013-01-23 キヤノン株式会社 Image processing method, image processing apparatus, and program
JP5123870B2 (en) * 2009-02-10 2013-01-23 キヤノン株式会社 Image processing method, image processing apparatus, and program
CN113742025A (en) * 2021-09-17 2021-12-03 北京字跳网络技术有限公司 Page generation method, device, equipment and storage medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096355A (en) * 2014-05-08 2015-11-25 腾讯科技(深圳)有限公司 Image processing method and system

Also Published As

Publication number Publication date
JP2001222717A (en) 2001-08-17

Similar Documents

Publication Publication Date Title
JP3809404B2 (en) Image processing method, apparatus and system
US7428331B2 (en) Page background estimation using color, texture and edge features
JP2001109895A (en) Processing method for digital images
JP2001297303A (en) Method and device for recognizing document image and computer readable recording medium
US8611658B2 (en) Image processing apparatus and image processing method
JP3972751B2 (en) Image processing device
US7317835B2 (en) Image processing method and apparatus
US20050047660A1 (en) Image processing apparatus, image processing method, program, and storage medium
US6360006B1 (en) Color block selection
US8229214B2 (en) Image processing apparatus and image processing method
JP4001446B2 (en) Method, apparatus and computer-readable recording medium for specifying image background color
JP4920814B2 (en) Image processing method, apparatus, and recording medium
JP5335581B2 (en) Image processing apparatus, image processing method, and program
JP4441300B2 (en) Image processing apparatus, image processing method, image processing program, and recording medium storing the program
JP2010074342A (en) Image processing apparatus, image forming apparatus, and program
JP4060559B2 (en) Image processing apparatus and image processing method
JP2004304469A (en) Regional division of original image, compression program, and regional division and compression method
JP2002342710A (en) Character segmenting device and character segmenting method used for the same device and its program
JP4116377B2 (en) Image processing method and image processing apparatus
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP4569162B2 (en) Image processing method, image processing program, and image processing apparatus
JP3711770B2 (en) Image processing apparatus, image processing method, and recording medium recording image processing program
Konya et al. Adaptive methods for robust document image understanding
JPH08237404A (en) Selection of optical character recognition mode
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070525

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070814

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100824

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110824

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110824

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120824

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120824

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130824

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees