JPH07264397A - Image picture processor - Google Patents
Image picture processorInfo
- Publication number
- JPH07264397A JPH07264397A JP6050621A JP5062194A JPH07264397A JP H07264397 A JPH07264397 A JP H07264397A JP 6050621 A JP6050621 A JP 6050621A JP 5062194 A JP5062194 A JP 5062194A JP H07264397 A JPH07264397 A JP H07264397A
- Authority
- JP
- Japan
- Prior art keywords
- white
- black
- block
- value
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、画像処理装置に関し、
より詳細には、多値画像上の領域が文字か画像か、文字
ならば白地に黒字なのか、あるいは黒地に白字なのかを
識別して適応的に二値化する画像処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus,
More specifically, the present invention relates to an image processing apparatus that adaptively binarizes by identifying whether an area on a multi-valued image is a character or an image, and if it is a character, it is black on a white background or white on a black background.
【0002】[0002]
【従来の技術】従来の画像処理装置として、画像を、文
字部と写真部と網点部などに分離するものが提案されて
いる。例えば、特開昭62−147860号公報のもの
は、入力画素をブロックに分割し、ブロック内の最大値
と最小値の差が、ある閾値T1より大きければ文字・網
点部、小さければ写真部とする。また、連続する2画素
の差の正/負の変化回数が閾値T2より大きければ網点
部、小さければ文字部とするものである。また、特開平
4−335773号公報のものは、注目画素と周囲の画
素との濃度差をパターンとし、あらかじめ作成されたパ
ターンテーブルで参照し、文字部と写真部とを分離する
ものである。2. Description of the Related Art As a conventional image processing device, a device has been proposed in which an image is separated into a character portion, a photograph portion, a halftone dot portion, and the like. For example, in Japanese Patent Laid-Open No. 62-147860, the input pixels are divided into blocks, and if the difference between the maximum value and the minimum value in the block is larger than a certain threshold value T1, the character / halftone dot portion is displayed. And If the number of positive / negative changes in the difference between two consecutive pixels is larger than the threshold value T2, the halftone dot portion is selected, and if it is smaller, the character portion is selected. In Japanese Patent Laid-Open No. 4-335773, the density difference between the pixel of interest and the surrounding pixels is used as a pattern, and a pattern table created in advance is used as a reference to separate the character portion and the photograph portion.
【0003】また、特開平4−304776号公報のも
のは、階調分布および/または階調変化を演算し、演算
された階調分布および/または階調変化に基づき、画像
データの種類を判定する。このように、濃度の変化状況
から得られる特微量をもとにファジイ推論をすることに
より、網点、写真、文字など画像の種類に対する適合を
求めることにより、読み込まれた画像が網点、文字、写
真などが混在したようなものであってもそれを分離して
判断することができるものである。In Japanese Patent Laid-Open No. 4-304776, gradation distribution and / or gradation change are calculated, and the type of image data is determined based on the calculated gradation distribution and / or gradation change. To do. In this way, fuzzy inference is performed based on the characteristic amount obtained from the change state of the density, and the suitability for the type of image such as halftone dot, photograph, and character is obtained, and the read image becomes halftone dot and character. Even if a photograph and the like are mixed, it is possible to judge them separately.
【0004】また、文字が白地の背景中の黒い文字でな
く、黒地の背景に白い文字の場合、紙などに印刷する際
に白黒反転させて印刷した方が読み易く、トナーやイン
クなどの節約になる。しかし、画像を反転させて印刷す
る際に、画像を自動判別することはせず、利用者がボタ
ンなどで意識的に反転モードにするなどといった操作が
必要であるFurther, when the character is not a black character on a white background but a white character on a black background, it is easier to read by black-and-white reversal when printing on paper or the like, and toner and ink are saved. become. However, when the image is reversed and printed, the image is not automatically discriminated, and the user needs to perform an operation such as intentionally switching to the reverse mode with a button or the like.
【0005】[0005]
【発明が解決しようとする課題】前述のように、従来の
画像処理装置においては、ブロック内の最大値と最小値
の差を文字網点と写真の分離に利用した場合、写真部中
の物体の輪郭などの濃度変化が激しい部分が文字網点と
誤認識されてしまう。パターンテーブルを利用する場合
においても同様の誤認識は起こり得る。As described above, in the conventional image processing apparatus, when the difference between the maximum value and the minimum value in the block is used for separating the character halftone dot and the photograph, the object in the photograph part is Areas such as the contours of which the density changes drastically are mistakenly recognized as character halftone dots. Similar erroneous recognition may occur even when the pattern table is used.
【0006】本発明は、このような実情に鑑みてなされ
たもので、写真部中の濃度変化が激しい部分なども誤認
識せずに文字部と写真部を分離し、文字部が白地に黒字
か、あるいは黒地に白字かを識別するようにした画像処
理装置を提供することを目的としている。The present invention has been made in view of such a situation, and the character portion and the photograph portion are separated without erroneously recognizing a portion of the photograph portion where the density changes drastically, and the character portion is black on a white background. It is an object of the present invention to provide an image processing device which is capable of discriminating whether a character is white or black on a black background.
【0007】[0007]
【課題を解決するための手段】本発明は、上記目的を解
決するために、(1)ブロックに分割した多値画像のブ
ロック毎に白画素の代表値と黒画素の代表値を求めるブ
ロック白黒代表画素値検出手段と、該ブロック白黒代表
画素値検出手段により求めた白画素と黒画素の代表値の
ブロック間の差の和を計算するブロック間偏差積算手段
と、該ブロック間偏差積算手段により求めたブロック間
の白画素と黒画素の代表値の差の和の値より、当該ブロ
ックが文字か画像かを表す特徴量を得る文字画像識別手
段を有すること、更には、(2)前記文字画像識別手段
によって文字と判別されたブロックに対して、白地の背
景中の黒い文字なのか、黒地の背景に白い文字なのかを
識別する文字背景識別手段を有することを特徴としたも
のである。In order to solve the above-mentioned problems, the present invention provides (1) a block black-and-white for obtaining a representative value of white pixels and a representative value of black pixels for each block of a multivalued image divided into blocks. The representative pixel value detecting means, the inter-block deviation integrating means for calculating the sum of the differences between the blocks of the representative values of the white pixels and the black pixels obtained by the block black and white representative pixel value detecting means, and the inter-block deviation integrating means And a character image identifying means for obtaining a feature amount indicating whether the block is a character or an image, based on the sum of the differences between the representative values of the white pixels and the black pixels between the obtained blocks, and (2) the character. It is characterized in that it has a character background identifying means for identifying whether a block determined to be a character by the image identifying means is a black character in a white background or a white character on a black background.
【0008】[0008]
【作用】前記構成を有する本発明の画像処理装置は、ブ
ロックに分割した多値画像のブロック毎に白画素の代表
値と黒画素の代表値を求め、求めた白画素と黒画素の代
表値のブロック間の差の和を計算する。ブロック間の白
画素と黒画素の代表値の差の和の値より、当該ブロック
が文字か画像かを表す特徴量を得る。また、文字と判別
されたブロックに対して、白地の背景中の黒い文字なの
か、黒地の背景に白い文字なのかを識別する。このよう
に、画像をブロックに分割し、ブロック毎に白画素/黒
画素代表値を求め、白画素/黒画素代表値のブロック間
の変化量を見ることで、文字画像と写真画像を識別し、
写真度を計算し、文字画像では背景が黒か白かを識別す
ることができる。According to the image processing apparatus of the present invention having the above-described structure, the representative value of the white pixels and the representative value of the black pixels are obtained for each block of the multi-valued image divided into blocks, and the obtained representative value of the white pixels and the black pixels. Calculate the sum of the differences between the blocks. A feature amount indicating whether the block is a character or an image is obtained from the sum of the differences between the representative values of white pixels and black pixels between blocks. In addition, the block determined to be a character is identified as a black character in a white background or a white character in a black background. In this way, the image is divided into blocks, the white pixel / black pixel representative value is obtained for each block, and the amount of change between blocks of the white pixel / black pixel representative value is checked to identify the character image and the photographic image. ,
By calculating the photographic degree, it is possible to identify whether the background is black or white in the character image.
【0009】[0009]
【実施例】実施例について、図面を参照して以下に説明
する。まず、図1〜図9に基づき、文字画像と写真画像
の識別について以下に説明する。図1は、細かい文字の
画像の輝度とヒストグラムを示す図、図2は、太い文字
の画像の輝度とヒストグラムを示す図、図3は、文字を
含まない空白部分の画像の輝度とヒストグラムを示す
図、図4は、白紙に黒い文字で書かれた文書画像の各ブ
ロックの黒画素代表値を示したグラフを示す図、図5
は、白紙に黒い文字で書かれた文書画像の各ブロックの
白画素代表値を示したグラフを示す図、図6は、写真画
像の各ブロックの黒画素代表値を示したグラフを示す
図、図7は、写真画像の各ブロックの白画素代表値を示
したグラフを示す図、図8は、黒板に白い文字で書かれ
た文書画像の各ブロックの黒画素代表値を示したグラフ
を示す図、図9は、黒板に白い文字で書かれた文書画像
の各ブロックの白画素代表値を示したグラフを示す図で
ある。Embodiments will be described below with reference to the drawings. First, the discrimination between a character image and a photographic image will be described below with reference to FIGS. FIG. 1 is a diagram showing luminance and a histogram of an image of a fine character, FIG. 2 is a diagram showing luminance and a histogram of an image of a thick character, and FIG. 3 is a luminance and histogram of an image of a blank portion which does not include a character. FIG. 4 and FIG. 4 are graphs showing the black pixel representative value of each block of the document image written in black characters on a white paper, FIG.
Is a graph showing a white pixel representative value of each block of a document image written in black characters on a white paper, and FIG. 6 is a graph showing a black pixel representative value of each block of a photographic image, FIG. 7 is a graph showing a white pixel representative value of each block of a photographic image, and FIG. 8 is a graph showing a black pixel representative value of each block of a document image written in white characters on a blackboard. FIG. 9 and FIG. 9 are graphs showing the white pixel representative value of each block of the document image written in white characters on the blackboard.
【0010】文字画像の画素を背景画素と文字画素に分
けた場合、文字の細い線分などは潰れてしまうため、文
字画素の輝度は安定しない。図1は、白い紙面上の細か
い文字の画像の輝度ヒストグラムを示す図である。横軸
は輝度(256階調)、縦軸は度数である。図1によれ
ば、背景である紙面の白い画素は、ある固まりをもった
山状の分布であるのに対し、文字の黒い画素の分布は、
はっきりした固まりをもたない。これは、文字の細い線
分が潰れてしまっているために起こる。もし線分が潰れ
ずにエッジがくっきりしたものならば、ヒストグラムの
黒画素の分布はもっとはっきりした固まりをもった分布
をする。太い線分ならば多小エッジがぼけてしまって
も、線分の中心部分は本来の文字の黒さを表すことがで
きるので、ヒストグラムの黒画素の分布ははっきりした
固まりを有する。When the pixels of the character image are divided into the background pixels and the character pixels, the thin line segment of the character is crushed, so that the brightness of the character pixel is not stable. FIG. 1 is a diagram showing a luminance histogram of an image of fine characters on a white paper surface. The horizontal axis represents luminance (256 gradations), and the vertical axis represents frequency. According to FIG. 1, the white pixels on the paper, which is the background, have a mountain-shaped distribution with a certain mass, whereas the distribution of black pixels of the character is
It has no clear mass. This occurs because the thin line segment of the character has been crushed. If the line segment does not collapse and the edge is sharp, the distribution of black pixels in the histogram has a more distinct cluster. Even if many small edges are blurred for a thick line segment, the central portion of the line segment can represent the original blackness of the character, and therefore the distribution of black pixels in the histogram has a clear cluster.
【0011】細い線分が潰れてしまう原因としては、主
に二つあるが、一つは入力デバイスの解像度、もう一つ
はフォーカスぼけである。例えば、紙面をスキャナや電
子スチルカメラなどにCCDを使った光学系を使って入
力する場合、解像度が低いと背景の紙面の白と平均化し
た輝度になってしまう。また、フォーカスがあってない
と、ある細い線分の画素を見た場合、フォーカスがあっ
ていれば周囲の画素に入力されるべき光が、線分の画素
に入力されてしまうため、紙面の白と平均化した輝度に
なってしまうためでもある。There are mainly two causes of the thin line segment being crushed. One is the resolution of the input device, and the other is the focus blur. For example, when inputting a paper surface to a scanner, an electronic still camera, or the like using an optical system using a CCD, if the resolution is low, the brightness will be averaged with the white of the background paper surface. Also, when there is no focus, when a pixel of a certain thin line segment is viewed, the light that should be input to the surrounding pixels will be input to the pixels of the line segment if the pixel is in focus. This is also because the brightness is averaged with white.
【0012】細い線分を持つ文字は、以上のような理由
で潰れてしまい、文字画素の輝度は安定しない。一般に
照明条件などが同じならば、例えば、印刷された紙面の
背景の白い輝度値も、文字の黒インクの輝度値も画面の
どこでも同じような値をとる。ここで画像をある大きさ
のブロックに分割し、例えば、ブロック中の画素の最小
輝度値を「文字の輝度」、最大輝度値を「背景の輝度」
と定義する、ブロック白黒代表画素値検出部によってこ
の値は求められる。A character having a thin line segment is crushed for the above reason, and the brightness of the character pixel is not stable. In general, if the lighting conditions are the same, for example, the white brightness value of the background of the printed paper surface and the brightness value of the black ink of the character are the same values anywhere on the screen. Here, the image is divided into blocks of a certain size, and for example, the minimum luminance value of the pixels in the block is “character luminance” and the maximum luminance value is “background luminance”.
This value is obtained by the block black and white representative pixel value detection unit, which is defined as
【0013】図1で説明すれば、文字の輝度値はb1
(=40)、背景の輝度値はW1(=137)となる。
文字の輝度は、上述した線の潰れの原理で線の太さなど
によって様々な値を取り得る。従って、隣のブロックの
文字の輝度と比較すると、差が大きなものとなる可能性
が高い。一方、背景の白紙部分は、文字間の空白、行間
の空白などがあるため、固まって分布しているので、文
字部分のように潰れてしまうことはなく、隣のブロック
と背景の輝度値を比較しても、差は文字の輝度値ほどは
大きくならない。Referring to FIG. 1, the brightness value of a character is b1.
(= 40), and the brightness value of the background is W1 (= 137).
The brightness of a character can take various values depending on the thickness of the line based on the above-described principle of line collapse. Therefore, the difference is likely to be large as compared with the brightness of the character in the adjacent block. On the other hand, the white paper part of the background has spaces between characters, spaces between lines, etc., so it is distributed as a group, so it will not be crushed like the character part and the brightness value of the adjacent block and background will be Even when compared, the difference is not as large as the luminance value of the character.
【0014】図2は、図1の隣のブロックの、ブロック
中の輝度ヒストグラムを示す図である。図2のブロック
中には、図1よりも太い文字が含まれているので、線の
潰れの影響が小なく、そのためヒストグラムでみると、
図1に比べて文字部分の山の分布がはっきりしており、
背景部分の山と合わせて双状の山の分布となっている。FIG. 2 is a diagram showing a luminance histogram in a block of the block adjacent to FIG. Since the block in FIG. 2 contains a thicker character than that in FIG. 1, the influence of the line collapse is not so small.
Compared to Fig. 1, the distribution of mountains in the letters is clearer,
The distribution of twin mountains is combined with the mountains in the background.
【0015】図2によれば、文字の輝度値はb2(=1
8)、背景の輝度値はW2(=139)である。ここで
文字の輝度のブロック間の差を計算してみると、b2−
b1=18−40=−22、背景の輝度の差は、w2−
w1=139−137=2となる。差の絶対値で比較し
てみると、22>2、で、文字の輝度の方が差が大き
い。さらに、通常の文書画像では、画像一面に文字が存
在するとは限らず、空白の部分が存在するのが普通であ
るが、ブロック中に文字が存在しない場合は、ブロック
中の画素の輝度ヒストグラムは背景の白紙の輝度値のみ
である。According to FIG. 2, the brightness value of the character is b2 (= 1
8), the brightness value of the background is W2 (= 139). Here, when the difference between the blocks of the brightness of the character is calculated, b2-
b1 = 18-40 = -22, and the difference in background brightness is w2-
w1 = 139-137 = 2. Comparing the absolute values of the differences, 22> 2, and the difference in the brightness of the character is larger. Furthermore, in a normal document image, characters do not always exist on the entire surface of the image and there are usually blank parts. However, when there are no characters in the block, the luminance histogram of the pixels in the block is Only the brightness value of the blank white background.
【0016】図3は、図1の隣のブロックで文字が含ま
れない空白のブロックのヒストグラムを示す図である。
空白のブロックの場合、図3に示すように、単一の山状
の分布を取り、図1及び図2の様に、山の部分より黒い
部分(左側)に画素が分布していない。強引に文字の輝
度の定義でブロックの文字の輝度を求めると、背景の輝
度値と近い値を取らざるを得ず、図3のb3(=11
9)の値となる。背景の輝度値は文字の輝度より小し大
きめの値w3(=137)となる。図3のブロックは、
図1のブロックの隣の空白部分から取っているが、背景
の輝度値の差はw3−w1=137−137=0、文字
の輝度値の差は、b3−b1=119−40=79とな
る。差の絶対値で比較してみると、79>0、で文字の
輝度の方が差が断然大きい。FIG. 3 is a diagram showing a histogram of a blank block containing no characters in the adjacent block of FIG.
In the case of a blank block, as shown in FIG. 3, a single mountain-shaped distribution is taken, and as shown in FIGS. 1 and 2, pixels are not distributed in the black portion (left side) of the mountain portion. When the brightness of the character of the block is forcibly obtained by the definition of the brightness of the character, a value close to the brightness value of the background cannot be avoided, and the value of b3 (= 11 in FIG.
It becomes the value of 9). The brightness value of the background is a value w3 (= 137) which is smaller than and larger than the brightness of the character. The blocks in Figure 3 are
Although taken from the blank part next to the block in FIG. 1, the difference in the background brightness value is w3-w1 = 137-137 = 0, and the difference in the character brightness value is b3-b1 = 119-40 = 79. Become. Comparing the absolute values of the differences, 79> 0, and the difference in the luminance of the character is definitely larger.
【0017】主にこの二点により、文字の輝度と背景の
輝度のブロック間の差を絶対値で比較すると、文字の輝
度の差の方が大きくなる。また、この比較は隣接するブ
ロック間で行っているので、画像に明るさむらや影など
があったとしても、ブロックが明るさやむらや影に比べ
て充分小さければ局所的にみているといえるので、背景
の輝度はブロック間で大きく変化することはない。Mainly due to these two points, when the difference between the blocks of the luminance of the character and the luminance of the background is compared in absolute value, the difference in the luminance of the character becomes larger. In addition, since this comparison is performed between adjacent blocks, even if there are uneven brightness or shadows in the image, it can be said that if the blocks are sufficiently smaller than the brightness, unevenness, or shadows, they are viewed locally. The background brightness does not change significantly between blocks.
【0018】図4は、ある文書画像をブロックに分割し
て文字の輝度を求め、高さ方向に文字の輝度、縦軸・横
軸は文書中のブロックの位置を表した3次元グラフを示
す図である。なお、データは各格子点上の値だが、変化
の様子が分かり易いように、各格子点を直線で結んであ
る。後述する図5〜図9もグラフの読み方は同様であ
る。図5は、図4と同じ画像で、同様にブロックで背景
の輝度を求め、高さ方向に背景の輝度、縦軸・横軸は文
書中のブロックの位置を表した3次元グラフを示す図で
ある。FIG. 4 shows a three-dimensional graph in which a certain document image is divided into blocks to obtain the luminance of a character, the luminance of the character in the height direction, and the vertical and horizontal axes represent the position of the block in the document. It is a figure. The data is the value on each grid point, but each grid point is connected by a straight line so that the state of change can be easily understood. The way to read the graphs is the same in FIGS. 5 to 9 described later. FIG. 5 is a diagram showing the same image as that of FIG. 4, showing a background luminance in the same manner in a block, the background luminance in the height direction, and a vertical axis / horizontal axis showing a three-dimensional graph showing the positions of blocks in a document. Is.
【0019】図4と図5を比較してみると一見して分か
るように、図4に示す文字の輝度の方のグラフはでこぼ
こしているが、図5に示す背景の輝度の方のグラフはな
だらかである。図5のグラフでは、特に周辺部などで、
急激に高くなっている部分があるが、これは文字が存在
しない空白のブロックの部分であり、周囲の文字の存在
するブロックとの差が大きいことを示している。また、
図5のグラフは、縦軸「Yブロック」の値が35の付近
で全体的に少し落ち込んでいるが、これは撮影時にこの
部分に影が生じて幾分暗くなって、明るさむらが生じて
いるためである。しかし、図4のように、周囲のブロッ
クと激しい差はなく、なだらかに変化しており、明るさ
むらが存在しても、適当な大きさのブロックならば、背
景の輝度のブロック間の変化は小ないことを示してい
る。As can be seen at a glance by comparing FIGS. 4 and 5, the graph of the luminance of the characters shown in FIG. 4 is uneven, but the graph of the luminance of the background shown in FIG. It is gentle. In the graph of FIG. 5, especially in the peripheral part,
Although there is a sharply high portion, this is the portion of the blank block where there are no characters, indicating that there is a large difference from the block where the surrounding characters are present. Also,
In the graph of FIG. 5, the value on the vertical axis “Y block” is slightly depressed in the vicinity of 35, but this is caused by a shadow in this part during shooting, which makes it somewhat dark, and uneven brightness occurs. This is because However, as shown in FIG. 4, there is no significant difference from the surrounding blocks, and there is a smooth change, and even if there is uneven brightness, if the block is of an appropriate size, the change in background brightness between blocks is large. Indicates that it is not small.
【0020】以上は、文書画像について説明したが、写
真画像では、前述の文書画像のように一様輝度の背景は
必ずしも存在しない。文書画像は通常紙などに印刷され
たものの画像であるから、紙という一様背景が存在した
が、写真画像では、様々な物体が様々な輝度分布を持っ
て撮影されており、文書画像の紙に相当するような一様
背景は存在しない。Although the document image has been described above, a photographic image does not necessarily have a background of uniform brightness unlike the document image described above. Since a document image is an image that is usually printed on paper or the like, there was a uniform background called paper, but in a photographic image, various objects were photographed with various brightness distributions, and the paper of the document image There is no uniform background equivalent to.
【0021】図6は、写真画像の文字の輝度3次元グラ
フを示す図で、図7は、写真画像の背景の輝度の3次元
グラフを示す図である。図6及び図7とも図5のように
なだらかな分布をしていない。従って、文字の輝度と背
景の輝度の分布を見て、なだらかな分布をしていれば文
書画像であり、どちらもブロック間の変化が激しいなら
ば写真画像の可能性が高いと言える。変化が激しいかど
うかを判定するには、文字の輝度、背景の輝度の隣接ブ
ロック間の差の絶対値を各ブロックで求め、その和をと
ることで定量化する。その和の値はブロック数に影響さ
れないように、ブロック間の計算数で割り、正規化して
おく。これによって一般化された値となる。ブロック間
偏差積算部によってこの値が求められる。FIG. 6 is a diagram showing a three-dimensional luminance graph of characters in a photographic image, and FIG. 7 is a diagram showing a three-dimensional luminance graph of the background of the photographic image. 6 and 7 do not have a gentle distribution as shown in FIG. Therefore, looking at the distributions of the brightness of the characters and the brightness of the background, it can be said that the document image has a smooth distribution, and the possibility of a photographic image is high if the change between blocks is large. In order to determine whether the change is drastic, the absolute value of the difference between the adjacent blocks of the luminance of the character and the luminance of the background is obtained for each block, and the sum is taken to quantify. The value of the sum is divided by the number of calculations between blocks and normalized so that it is not affected by the number of blocks. This gives a generalized value. This value is obtained by the inter-block deviation integration unit.
【0022】この値が大きい時は変化が激しく、小さい
ときは変化が小さいといえるが、その閾値は統計的に決
めることになる。閾値を1個に限らずに、2個設定する
ことで、文書画像か写真画像かはっきりしないものに
は、どちらに近いかを計算することができる。正規化さ
れたブロック間変化の値が、ある閾値T1より大きけれ
ば、変化が激しいとして写真画像と判断し、ある閾値T
2より小さければ、文書画像と判断し、その間ならば、
閾値T2とT1の間の比較にすれば、どちらにどのくら
い近いかを定量的に表すことができる。また、これまで
は文書画像を白い紙に黒い文字で印刷されたものに限定
して説明してきたが、黒板のような黒い背景に白いチョ
ークで文字が書かれたような画像でも、文字の輝度が
白、背景の輝度が黒になっていると考えれば原理は同じ
である。It can be said that when this value is large, the change is large, and when it is small, the change is small, but the threshold value is statistically determined. By setting not only one threshold value but two threshold values, it is possible to calculate which is closer to a document image or a photographic image, which is not clear. If the normalized inter-block change value is larger than a certain threshold value T1, it is determined that the change is severe and it is determined that the image is a photographic image, and the certain threshold value T1
If it is smaller than 2, it is judged as a document image, and if it is in between,
A comparison between the threshold values T2 and T1 makes it possible to quantitatively represent which and how close. Up to now, the explanation has been limited to the case where the document image is printed with black characters on white paper, but the brightness of the characters can be changed even for images such as blackboard with white chalk on which the characters are written. The principle is the same, assuming that is white and the background brightness is black.
【0023】図8は、黒板の文字の輝度(白)3次元グ
ラフを示す図で、図9は、背景の輝度(黒)の3次元グ
ラフを示す図である。図8と図9を比較すれば、背景の
輝度のブロック間の変化が、文字の輝度の変化よりも小
さいことが分かる。ここで、文書画像でも、白紙に黒字
の印刷物なのか、黒板に白字なのかにより、文字の輝
度、背景の輝度の定義が白黒で変ってしまう。しかし、
その定義は言葉の上の問題のみであり、実際の作業とし
ては、ブロック中の最大輝度値と最小輝度値のブロック
間の変化を調べるのであるから、どちらが背景でどちら
が文字であるかを気にする必要はなく、変化の激しい方
を文字の輝度、変化の小ない方を背景の輝度とすれば良
い。これによって、文書画像の場合、背景が白なのか黒
なのかを判別することができる。FIG. 8 is a diagram showing a luminance (white) three-dimensional graph of characters on a blackboard, and FIG. 9 is a diagram showing a background luminance (black) three-dimensional graph. Comparing FIG. 8 and FIG. 9, it can be seen that the change in background brightness between blocks is smaller than the change in character brightness. Here, even in the case of a document image, the definition of the brightness of the character and the brightness of the background are changed to black and white depending on whether the printed matter is a black print on a white paper or a white print on the blackboard. But,
The definition is only a linguistic problem, and the actual work is to examine the change between the maximum brightness value and the minimum brightness value in the block between blocks, so it is important to know which is the background and which is the character. It is not necessary to set the brightness of the character, and the brightness of the character having a large change and the brightness of the background having a small change. With this, in the case of a document image, it is possible to determine whether the background is white or black.
【0024】背景が白であるか黒であるかを判別するこ
とができると、画像を二値化する際に印字する際に有用
である。例えば、FAX(ファクシミリ)、スキャナ、
コピー機などでは、閾値を求める際に、計算で求めた閾
値よりも少し低めの輝度値に閾値を設定してやるという
ことが良く行なわれているが、これを行なうと白紙部分
のノイズが減り、見た目に良好である。しかし、黒地に
白い字の場合、全く同じ方法で閾値を低くしてしまう
と、逆にノイズを増やす結果になってしまう。また、背
景が黒地なので、見にくく、コピー機などではトナーを
大量に消費してしまう。本発明の手法を用いて、背景が
黒であることが分かれば、閾値を逆に小し高めにてノイ
ズを減らしたり、あるいは、印刷の際に白黒反転して出
力して見易く、トナーの消費量を減らしたりする利点が
生まれる。If it is possible to determine whether the background is white or black, it is useful in printing when binarizing an image. For example, fax, scanner,
In copying machines and the like, when obtaining the threshold value, it is often practiced to set the threshold value to a luminance value that is slightly lower than the calculated threshold value, but if this is done, noise in the blank area will be reduced and the appearance will be reduced. Is very good. However, in the case of white letters on a black background, lowering the threshold value by the same method will result in increasing noise. Further, since the background is black, it is difficult to see, and a large amount of toner is consumed in a copier or the like. If it is known that the background is black by using the method of the present invention, the threshold value is reduced to a higher value to reduce noise, or black-and-white reversal is output at the time of printing for easy viewing, and toner consumption is low. The advantage of reducing the amount is born.
【0025】従って、画像をブロックに分け、ブロック
中の白画素と黒画素を代表するような値、例えば、最大
輝度値と最小輝度値のブロック間での変化を見、どちら
かの変化が小さければそちらが背景の文書画像の可能性
が高く、両方とも変化が大きければ写真画像である可能
性が高いことが分かる。判定する領域の大きさは、背景
の輝度や文字の輝度の隣接ブロック間の変化の絶対値を
計算し、その和を計算する際の使ったブロックの領域と
なる。Therefore, the image is divided into blocks, and the value representing the white pixels and the black pixels in the block, for example, the maximum luminance value and the minimum luminance value between the blocks is observed, and one of them is small. It can be seen that there is a high possibility that it is a background document image, and if there is a large change in both, it is likely that it is a photographic image. The size of the area to be determined is the area of the block used when the absolute values of the changes in the background brightness and the character brightness between adjacent blocks are calculated and the sum thereof is calculated.
【0026】従来のような、ブロック中の最大輝度値と
最小輝度値のコントラストや隣の画素の輝度値の変化の
回数を使う場合では、写真画像中の文字画像らしき部
分、例えば、物体の輪郭などで文字部と誤認識すること
がある。また、文書画像でも文字のない空白部分は、文
字領域なのか画像領域なのか判別することができない。
しかし、本発明の手法では、周囲のブロックとの変化を
見ており、コントラストの大きさ自体は問題にしていな
いので、写真画像中の文字画像らしき部分、例えば、物
体の輪郭などで文字部と誤認識することはない。When the contrast between the maximum brightness value and the minimum brightness value in a block and the number of changes in the brightness value of an adjacent pixel are used as in the conventional case, a character image-like portion in a photographic image, for example, the outline of an object is used. May be erroneously recognized as a character part. Further, even in a document image, it is impossible to determine whether a blank portion having no character is a character area or an image area.
However, in the method of the present invention, since the change from the surrounding blocks is observed and the size of the contrast itself is not a problem, the character image-like portion in the photographic image, for example, the character portion in the outline of the object and the like. There is no false recognition.
【0027】また、調べる領域の大きさも、従来の手法
ではブロックの大きさに限界があり、細かいブロック毎
に判定し、判定結果をブロック間で補正し直すことで対
応する必要がある。しかし、本発明の手法では、周囲の
ブロックとの変化を調べた後に正規化しているので、ブ
ロック数の増減は影響を与えない。また、画像の内容を
人間のように認識して判断している訳ではないので、本
発明の手法でも誤認識することはありえるが、閾値を二
つ設定することで、はっきり識別しにくいものでも、文
書と写真とどちらに近いかの比率を求めることができる
ので、写真部は誤差拡散、文字部は固定閾値などで二値
化する際に、その比率に応じて誤差の拡散を調節した
り、固定閾値と誤差拡散を写真度に応じて両者をミック
スするといったことが可能である。Also, regarding the size of the region to be examined, there is a limit to the size of the block in the conventional method, and it is necessary to make a judgment for each fine block and correct the judgment result between the blocks. However, in the method of the present invention, since the change from the surrounding blocks is examined and then normalized, the increase or decrease in the number of blocks does not affect. Further, since the contents of the image are not recognized and judged like humans, the method of the present invention may cause misrecognition, but by setting two threshold values, even if it is difficult to clearly distinguish them. , It is possible to obtain the ratio of which is closer to the document or the photo. Therefore, when binarizing the photo part with error diffusion and the character part with a fixed threshold value, the error diffusion can be adjusted according to the ratio. It is possible to mix the fixed threshold value and the error diffusion according to the photographic degree.
【0028】また、文字の輝度値及び背景の輝度値を文
書画像と写真画像の識別のために検出しているが、これ
を先に提案した特願平5−299609号に記載されて
いるような手法で、二値化する際の閾値を算出すること
にも利用できる利点もある。すなわち、多値画像より輝
度値のヒストグラムを求め、求められたヒストグラムよ
り画像中の白画素値、黒画素値を代表する値を求め、求
められた白画素代表値、黒画素代表値より二値化のため
の閾値を求める。また、ブロックに分割した多値画像の
ブロック毎に二値化の閾値を求め、ブロック中に、文字
や図形が含まれるかどうかを検出し、文字や図形が含ま
れないと判断されたブロックの二値化の閾値を、周囲の
ブロックの閾値から算出する。ブロック毎に求められた
二値化の閾値から1画素毎の閾値に変換し、求められた
1画素毎の二値化閾値を用いて元の多値画像を二値化す
る。Further, the brightness value of the character and the brightness value of the background are detected for distinguishing the document image and the photographic image, which is described in Japanese Patent Application No. 5-299609 previously proposed. There is also an advantage that it can be used to calculate a threshold value for binarization by any method. That is, a histogram of luminance values is obtained from a multi-valued image, a value that represents the white pixel value and the black pixel value in the image is obtained from the obtained histogram, and a binary value is obtained from the obtained white pixel representative value and black pixel representative value. The threshold for conversion is calculated. In addition, the threshold of binarization is calculated for each block of the multi-valued image divided into blocks, and it is detected whether or not a character or figure is included in the block. The threshold for binarization is calculated from the thresholds of surrounding blocks. The binarization threshold value obtained for each block is converted into a threshold value for each pixel, and the original multi-valued image is binarized using the obtained binarization threshold value for each pixel.
【0029】図10は、本発明による画像処理装置の一
実施例(請求項1,請求項2)を説明するための構成図
で、図中、1はブロック白黒代表画素値検出部、2はブ
ロック間偏差積算部、3は文字画像識別部である。ブロ
ック白黒代表画素値検出部1は、ブロックに分割した多
値画像のブロック毎に白画素の代表値と黒画素の代表値
を求める。ブロック間偏差積算部2は、前記ブロック白
黒代表画素値検出部1により求めた白画素,黒画素の代
表値のブロック間の差の和を計算する。文字画像識別部
3は、前記ブロック間偏差積算部2により求めたブロッ
ク間の白画素,黒画素の代表値の差の和の値より、当該
ブロックが文字か画像かを表す特徴量を得る。また、該
文字画像識別部3によって文字と判別されたブロックに
対して、白地の背景中の黒い文字なのか、黒地の背景に
白い文字なのかを識別する文字背景識別部を有してい
る。FIG. 10 is a block diagram for explaining one embodiment (claims 1 and 2) of the image processing apparatus according to the present invention. In the figure, 1 is a block black-and-white representative pixel value detection unit, and 2 is The block-to-block deviation integration unit 3 is a character image identification unit. The block monochrome representative pixel value detection unit 1 obtains a representative value of white pixels and a representative value of black pixels for each block of a multi-valued image divided into blocks. The inter-block deviation integration unit 2 calculates the sum of the differences between the blocks of the representative values of the white pixels and the black pixels obtained by the block monochrome representative pixel value detection unit 1. The character image identification unit 3 obtains a feature amount indicating whether the block is a character or an image, based on the sum of the differences between the representative values of the white pixels and the black pixels between the blocks obtained by the inter-block deviation integration unit 2. In addition, the block that is determined to be a character by the character image identification unit 3 has a character background identification unit that identifies whether the block is a black character in a white background or a white character on a black background.
【0030】原画像より得る多階調の輝度値aは、ブロ
ック白黒代表画素値検出部1の入力となり、該ブロック
白黒代表画素値検出部1によりブロック毎に白画素代表
値b,黒画素代表値cが出力される。ブロックの大きさ
は固定にしても、画像によって適応的に変えても良い。
ブロックの位置は、隣合って並ぶように取っても良い
し、ブロックが重なり合うように取っても良い。The multi-grayscale luminance value a obtained from the original image is input to the block monochrome representative pixel value detection unit 1, and the block monochrome representative pixel value detection unit 1 inputs the white pixel representative value b and the black pixel representative value for each block. The value c is output. The block size may be fixed or may be adaptively changed depending on the image.
The blocks may be arranged side by side, or the blocks may overlap each other.
【0031】図11は、ブロックが重なり合うように取
る例を示す図である。ある画面中から画素が縦5画素、
横5画素並んでいる部分を取り出してきたものである。
説明のため、画素の縦方向を行、横方向を列と呼び、行
は上から1,2,3,4,5、列は左からa,b,c,d,eと
する。3画素×3画素の大きさのブロックに分けると
き、隣のブロックと1行,1列ずつ重なり合うようにと
るとする。FIG. 11 is a diagram showing an example in which blocks are taken so as to overlap each other. 5 pixels vertically from a certain screen,
This is the part where five horizontal pixels are arranged.
For the sake of explanation, the vertical direction of pixels is called a row, and the horizontal direction is called a column. Rows are 1, 2, 3, 4, 5 from the top, and columns are a, b, c, d, and e from the left. When the block is divided into blocks each having a size of 3 pixels × 3 pixels, it is assumed that the adjacent blocks are overlapped by one row and one column.
【0032】ブロックpは、行3,4,5中の列c,d,e
の部分を占める。上のブロックqは、ブロックpは行
1,2,3中の列c,d,eの部分を占める。従って、上の
ブロックqとは、行3の列c,d,eの画素が重なり合っ
ている。左のブロックqは、ブロックpは行3,4,5中
のa,b,cの部分を占める。従って、左のブロックrと
は、列cの行3,4,5の画素が重なり合っている。下,
右も同様に重なり合うようにとる。このように重なった
ブロックの取り方をすることで、ブロックの大きさより
も小さい単位で,文書画像と写真画像の判定などを行う
ことができる。Block p has columns c, d and e in rows 3, 4, and 5.
Occupy part of. As for the upper block q, the block p occupies the part of the columns c, d, and e in the rows 1, 2, and 3. Therefore, the pixels in the columns c, d, and e of row 3 overlap with the upper block q. In the left block q, the block p occupies the part of a, b, and c in the rows 3, 4, and 5. Therefore, the pixels in rows 3, 4, and 5 of column c overlap the left block r. under,
Repeat on the right as well. By taking the overlapping blocks in this way, it is possible to determine the document image and the photographic image in units smaller than the size of the block.
【0033】白画素代表値と黒画素代表値とは、ブロッ
ク内の白画素と黒画素を表す値で、前述した二値化方法
に述べられているものと同じである。簡単な求めるに
は、例えば、ブロック内の最大輝度値と最小輝度値でも
よいが、ノイズに影響を受けにくい良い値を求めようと
するならば、前述した二値化方法に述べられているもの
と同じ方法で求めた方が良い。The white pixel representative value and the black pixel representative value are values representing the white pixel and the black pixel in the block, and are the same as those described in the above-mentioned binarization method. For simple calculation, for example, the maximum brightness value and the minimum brightness value in the block may be used, but if a good value that is not easily affected by noise is to be obtained, the one described in the binarization method described above is used. It is better to obtain it in the same way as.
【0034】図12及び図13は、ブロック白黒代表画
素値検出部の構成図で、図12は白画素の代表画素値検
出部で、図13は黒画素の代表画素値検出部を示してい
る。図12において、11は白レジスタ、12はデコー
ダ、13-1〜13-nはレジスタ、14はコンパレータ、
15はインバータ、16は白レベルカウンタ、17はコ
ンパレータ、18はセレクタである。12 and 13 are block diagrams of the block monochrome representative pixel value detecting unit. FIG. 12 shows a representative pixel value detecting unit for white pixels, and FIG. 13 shows a representative pixel value detecting unit for black pixels. . In FIG. 12, 11 is a white register, 12 is a decoder, 13-1 to 13-n are registers, 14 is a comparator,
Reference numeral 15 is an inverter, 16 is a white level counter, 17 is a comparator, and 18 is a selector.
【0035】図10の原画像から送られてきた画素値a
は、セレクタ18に送られ、画素値aの値によってイン
クリメント信号jを発生する。0の時はレジスタ0(10
01)のインクリメント信号のみが発生し、画素値aが1
の時はレジスタ1(1002)のインクリメント信号のみが
発生し、以降、画素値aが255までそれぞれレジスタ
255が振り分けられる。これによって、レジスタ上に
ヒストグラムが作成される。白レジスタ11の初期値は
最大輝度値(この場合255)であり、以下に説明する
ループ処理が開始される前に与えられる。ループ処理終
了後の値が白画素の代表値206となる。Pixel value a sent from the original image of FIG.
Is sent to the selector 18, and the increment signal j is generated according to the value of the pixel value a. When 0, register 0 (10
Only the increment signal of 01) is generated and the pixel value a is 1
In the case of, only the increment signal of the register 1 (1002) is generated, and thereafter, the registers 255 are allotted up to the pixel value a of 255. This creates a histogram on the register. The initial value of the white register 11 is the maximum brightness value (255 in this case), and is given before the loop processing described below is started. The value after the loop processing is the representative value 206 of white pixels.
【0036】ループ処理の最初は、白レジスタ11の値
のデコードから始まる。白レジスタ11の値は、デコー
ダ12によってデコードされ、白レジスタ11の輝度値
のヒストグラム値が収められているレジスタ13-1〜1
3-nのいずれか一つが選択されるように制御信号fが決
まる。該制御信号fによって唯一選択されたレジスタか
ら読み出されたヒストグラム値gは、コンパレータ14
に送られ、0と比較される。ヒストグラム値gが0と等
しいならば、コンパレータ14によりデクリメント信号
hが有効になり、白レジスタ11の値が1減る。0でな
いならば、コンパレータ14とインバータ15によって
デクリメント信号iが有効になり、ヒストグラムレジス
タ13-1〜13-nと白レベルカウンタ16に送られる。The beginning of the loop processing starts with the decoding of the value of the white register 11. The value of the white register 11 is decoded by the decoder 12, and registers 13-1 to 13 in which the histogram value of the brightness value of the white register 11 is stored.
The control signal f is determined so that any one of 3-n is selected. The histogram value g read out from the register selected only by the control signal f is stored in the comparator 14
Sent to and compared with 0. If the histogram value g is equal to 0, the decrement signal h becomes valid by the comparator 14 and the value of the white register 11 is decremented by 1. If it is not 0, the decrement signal i is validated by the comparator 14 and the inverter 15 and sent to the histogram registers 13-1 to 13-n and the white level counter 16.
【0037】ヒストグラムレジスタに送られたデクリメ
ント信号iは、制御信号fによって唯一選択されたレジ
スタにのみ有効となり、選択されたレジスタの値が1減
る。白レベルカウンタ16の値はコンパレータ17に送
られ、0と比較される。白レベルカウンタ16の値が0
と等しいならば、白画素の代表値が求まることになり、
白レジスタ11の値eが、白画素の代表値として出力さ
れる。白レベルカウンタ16の値が0でないならば、再
び最初に戻り、白レジスタ11の値がデコーダ12によ
ってデコードされることから始まるループ処理が繰り返
される。白レベルカウンタ16の初期値はパラメータで
あり、画素を輝度順に並べた時に、明るい方から何番目
の画素の輝度値を、白画素の代表輝度値にするかを表し
ている。通常は、ブロック中の全画素数の数パーセント
程度の値でよい。The decrement signal i sent to the histogram register is valid only for the register selected by the control signal f, and the value of the selected register is decreased by one. The value of the white level counter 16 is sent to the comparator 17 and compared with 0. The value of the white level counter 16 is 0
If it is equal to, the representative value of white pixels will be obtained,
The value e of the white register 11 is output as a representative value of white pixels. If the value of the white level counter 16 is not 0, the process returns to the beginning again, and the loop process starting from the value of the white register 11 being decoded by the decoder 12 is repeated. The initial value of the white level counter 16 is a parameter and represents, when the pixels are arranged in the order of brightness, which brightness value of the brightest pixel is used as the representative brightness value of the white pixels. Generally, the value may be about several percent of the total number of pixels in the block.
【0038】図13は、黒画素の代表画素値検出部の構
成図で、図中、21は黒レジスタ、22はデコーダ、2
3-1〜23-nはレジスタ、24はコンパレータ、25は
インバータ、26は黒レベルカウンタ、27はコンパレ
ータ、28はセレクタである。図13において、レジス
タ0(23-1)〜255(23-n)は、ヒストグラム値
が収められている。この値は、図2のヒストグラムレジ
スタと同じものか、あるいはデータをコピーした別のレ
ジスタである。同じヒストグラムレジスタを使用する場
合は、同時にヒストグラムレジスタにアクセスにいかな
いようにする必要がある。黒レジスタ21の初期値は最
小輝度値(この場合0)であり、以下に説明するループ
処理が開始される前に与えられる。ループ処理終了後の
値が黒画素の代表値e′となる。FIG. 13 is a block diagram of a representative pixel value detection unit for black pixels. In the figure, 21 is a black register, 22 is a decoder, and 2 is a decoder.
3-1 to 23-n are registers, 24 is a comparator, 25 is an inverter, 26 is a black level counter, 27 is a comparator, and 28 is a selector. In FIG. 13, the histogram values are stored in registers 0 (23-1) to 255 (23-n). This value is the same as the histogram register in FIG. 2 or another register in which data is copied. When using the same histogram register, it is necessary to prevent access to the histogram register at the same time. The initial value of the black register 21 is the minimum brightness value (0 in this case), and is given before the loop processing described below is started. The value after the loop processing is the representative value e ′ of the black pixel.
【0039】ループ処理の最初は、黒レジスタ21の値
のデコードから始まる。黒レジスタ21の値は、デコー
ダ22によってデコードされ、黒レジスタ21の輝度値
のヒストグラム値が収められているレジスタ23-1〜2
3-nのいずれか一つが選択されるように制御信号f′が
決まる。該制御信号f′によって唯一選択されたレジス
タから読み出されたヒストグラム値g′は、コンパレー
タ24に送られ、0と比較される。ヒストグラム値g′
が0と等しいならば、コンパレータ24によりデクリメ
ント信号h′が有効になり、黒レジスタ21の値が1減
る。0でないならば、コンパレータ24とインバータ2
5によってデクリメント信号i′が有効になり、ヒスト
グラムレジスタ23-1〜23-nと黒レベルカウンタ26
に送られる。The beginning of the loop processing starts with the decoding of the value of the black register 21. The value of the black register 21 is decoded by the decoder 22, and the registers 23-1 to 2-2 in which the histogram value of the brightness value of the black register 21 is stored.
The control signal f'is determined so that any one of 3-n is selected. The histogram value g'read from the register selected only by the control signal f'is sent to the comparator 24 and compared with 0. Histogram value g '
Is equal to 0, the decrement signal h'is enabled by the comparator 24 and the value of the black register 21 is decremented by 1. If not 0, comparator 24 and inverter 2
5, the decrement signal i'becomes valid, and the histogram registers 23-1 to 23-n and the black level counter 26 are activated.
Sent to.
【0040】ヒストグラムレジスタに送られたデクリメ
ント信号i′は、制御信号f′によって唯一選択された
レジスタにのみ有効となり、選択されたレジスタの値が
1減る。黒レベルカウンタ26の値はコンパレータ27
に送られ、0と比較される。黒レベルカウンタ26の値
が0と等しいならば、黒画素の代表値が求まったことに
なり、黒レジスタ21の値e′が黒画素の代表値として
出力される。黒レベルカウンタ26の値が0でないなら
ば、再び最初に戻り、黒レジスタ21の値がデコーダ2
2によってデコードされることから始まるループ処理が
繰り返される。The decrement signal i'transmitted to the histogram register is valid only for the register selected by the control signal f ', and the value of the selected register is decreased by one. The value of the black level counter 26 is the comparator 27
Sent to and compared with 0. If the value of the black level counter 26 is equal to 0, it means that the representative value of the black pixel has been obtained, and the value e ′ of the black register 21 is output as the representative value of the black pixel. If the value of the black level counter 26 is not 0, it returns to the beginning again, and the value of the black register 21 is set to the decoder 2
The loop process starting from being decoded by 2 is repeated.
【0041】黒レベルカウンタ26の初期値はパラメー
タであり、画素を輝度順に並べた時に、暗い方から何番
目の画素の輝度値を、黒画素の代表輝度値にするかを表
している。通常は、全画素数の数パーセント程度の値で
よい。ブロック白黒代表画素値検出部1より得た白画素
代表値bと黒画素代表値cは、ブロック間偏差積算部2
の入力となり、ブロック間偏差積算部2によりブロック
間白画素偏差積算値d,ブロック間黒画素偏差積算値e
を得る。注目ブロックの白画素代表値bと周囲のブロッ
クの白画素代表値bの差の絶対値を画像の種類を識別し
たい領域中の複数ブロック間で計算し、その和をブロッ
ク間白画素偏差積算値dとする。ブロック間黒画素偏差
積算値eも黒画素代表値cより同様に計算する。The initial value of the black level counter 26 is a parameter, and represents, when the pixels are arranged in the order of luminance, the luminance value of the darkest pixel to be the representative luminance value of the black pixels. Generally, the value may be about several percent of the total number of pixels. The white pixel representative value b and the black pixel representative value c obtained from the block black-and-white representative pixel value detection unit 1 are stored in the inter-block deviation integration unit 2
The inter-block deviation integration unit 2 inputs the inter-block white pixel deviation integrated value d and the inter-block black pixel deviation integrated value e.
To get The absolute value of the difference between the white pixel representative value b of the target block and the white pixel representative value b of the surrounding blocks is calculated between a plurality of blocks in the region where the image type is to be identified, and the sum is calculated as the inter-block white pixel deviation integrated value. d. The inter-block black pixel deviation integrated value e is calculated in the same manner from the black pixel representative value c.
【0042】図14は、ブロック間白画素偏差積算部の
計算方法を説明するための図である。ブロックが縦にm
個、横にm個並んでいるとする。説明のため、上からi
個目、左からj個目のブロックをブロック(i,j)と
呼び、そのブロックの白画素代表値をw(i,j)、黒
画素代表値をb(i,j)とする。ブロック((i,j)
に隣接するブロックは、ブロック(i-1,j),ブロック
(i+1,j),ブロック(i,j-1),ブロック(i,j+1)
の4つである。これらのブロックとの白画素代表値の偏
差は、abs(w(i,j)−w(i-1,j)),abs(w(i,j)−
w(i+1,j)),abs(w(i,j)−w(i,j-1)),abs(w
(i,j)−w(i,j+1))である。abs( )は絶対値の意であ
る。これを全隣接ブロック間で計算すればよい。その総
和Sは、以下のとおりである。FIG. 14 is a diagram for explaining the calculation method of the white pixel deviation integration unit between blocks. Block vertically m
It is assumed that there are m and side by side m. For explanation, i from above
The block from the left and the jth block from the left is called a block (i, j), and the white pixel representative value of the block is w (i, j) and the black pixel representative value is b (i, j). Block ((i, j)
Blocks adjacent to are block (i-1, j), block (i + 1, j), block (i, j-1), block (i, j + 1)
It is four. The deviations of the white pixel representative values from these blocks are abs (w (i, j) -w (i-1, j)), abs (w (i, j)-
w (i + 1, j)), abs (w (i, j) -w (i, j-1)), abs (w
(i, j) -w (i, j + 1)). abs () means absolute value. This may be calculated between all adjacent blocks. The sum S is as follows.
【0043】[0043]
【数1】 [Equation 1]
【0044】ブロック間数numで割ると、1ブロック間
当たりの値に正規化され、ブロック間白画素偏差積算値
dが求められる。 num=(m−1)*(n−1) d=S/num 1ブロック間当たりの値に正規化しておけば、計算する
ブロック数を増やしたり、ブロックの集まりの領域の形
を長方形だけでなく、円など様々な形にしても、文字画
像識別部3で同じ閾値を利用することができる。ブロッ
クの集まりの領域の形を長方形以外にするときは、ブロ
ック間数numの求め方が上式とは変わるが、ブロック間
の数を数えればよいのだから任意の形をとれる。ブロッ
ク間黒画素偏差値eもブロック間白画素偏差dと同様に
計算できる。ブロック間偏差積算部2より得られたブロ
ック間白画素偏差積算値d,ブロック間黒画素偏差積算
値eは、文字画像識別部3の入力となり、文字か画像か
をあらわす特徴量fを得る。When divided by the number of blocks between blocks, num, it is normalized to a value per block, and the inter-block white pixel deviation integrated value d is obtained. num = (m-1) * (n-1) d = S / num By normalizing to a value per block, the number of blocks to be calculated can be increased, or the area of a block group can be formed only by a rectangle. Alternatively, the same threshold value can be used in the character image identification unit 3 even if the shape is various such as a circle. When the shape of the area of a group of blocks is other than a rectangle, the calculation method of the number num between blocks is different from the above expression, but it can take any shape as long as the number between blocks is counted. The black pixel deviation value e between blocks can be calculated similarly to the white pixel deviation d between blocks. The inter-block white pixel deviation integrated value d and the inter-block black pixel deviation integrated value e obtained from the inter-block deviation integrating section 2 are input to the character image identifying section 3 to obtain a feature amount f representing a character or an image.
【0045】図15は、文字画像識別部の説明図であ
る。横軸はブロック間白/黒画素偏差積算値d,eであ
り、右にいくほど大きく、左にいくほど小さくなるとす
る。まず、ブロック間白画素偏差積算値dとブロック間
黒画素偏差積算値eの小さい方の値gを得る。図に示す
ように、gが閾値T1以下ならば文字部とし、閾値T2
以上ならば写真部とする。gが閾値T1と閾値T2の間
にある場合は、写真度hを、 h=(g−T1)/(T2−T1) より求める。FIG. 15 is an explanatory diagram of the character image identifying section. The horizontal axis represents the inter-block white / black pixel deviation integrated values d and e, which are larger toward the right and smaller toward the left. First, the smaller value g of the inter-block white pixel deviation integrated value d and the inter-block black pixel deviation integrated value e is obtained. As shown in the figure, if g is less than or equal to the threshold T1, the character portion
If it is above, it will be the photo department. When g is between the threshold value T1 and the threshold value T2, the photograph degree h is calculated by h = (g-T1) / (T2-T1).
【0046】写真度hは、0から1までの値で0に近い
ほど文字である確率が高く、1に近いほど写真である確
率が高くなる。文字か画像かをあらわす特徴量fは、g
が閾値T1以下ならばf=0、閾値T2以上ならばf=
1とし、閾値T1とT2の間ならば、f=hとする。ま
た、文字部または文字部の可能性があると識別された領
域は、dとeのどちらの値が小さいかにより文字部の背
景が白地か黒地かを識別する。dの方が小さければ背景
は白地で文字が黒であり、eの方が小さければ背景は黒
地で文字が白である。The degree of photograph h is a value from 0 to 1, and the closer it is to 0, the higher the probability of being a character, and the closer it is to 1, the higher the probability of being a photograph. The feature amount f representing a character or an image is g
Is less than or equal to the threshold T1, f = 0, and more than or equal to the threshold T2 is f =
1, and if between the threshold values T1 and T2, f = h. In addition, the character portion or the area identified as the possibility of the character portion identifies whether the background of the character portion is a white background or a black background depending on which of d and e is smaller. If d is smaller, the background is white and the characters are black, and if e is smaller, the background is black and the characters are white.
【0047】[0047]
【発明の効果】以上の説明から明らかなように、本発明
によると、ブロックに分割した多値画像のブロック毎に
白画素の代表値と黒画素の代表値を求めるブロック白黒
代表画素値検出手段と、該ブロック白黒代表画素値検出
手段により求めた白画素,黒画素の代表値のブロック間
の差の和を計算するブロック間偏差積算手段と、該ブロ
ック間偏差積算手段により求めたブロック間の白画素,
黒画素の代表値の差の和の値より、当該ブロックが文字
か画像かを表す特徴量を得る文字画像識別手段を有して
いるので、画像をブロックに分割し、ブロック毎に白画
素/黒画素代表値を求め、白画素/黒画素代表値のブロ
ック間の変化量をみることで、文字画像と写真画像を識
別し、写真度を計算し、文字画像では背景が黒か白かを
識別することができる。As is apparent from the above description, according to the present invention, the block black and white representative pixel value detecting means for obtaining the representative value of the white pixels and the representative value of the black pixels for each block of the multivalued image divided into blocks And an inter-block deviation accumulating means for calculating the sum of the differences between the blocks of the representative values of the white pixel and the black pixel obtained by the block black and white representative pixel value detecting means, and between the blocks obtained by the inter-block deviation integrating means White pixel,
Since the image processing unit has a character image identifying unit that obtains a feature amount indicating whether the block is a character or an image based on the sum of the differences between the representative values of the black pixels, the image is divided into blocks and white pixels / By determining the black pixel representative value and observing the amount of change between blocks of the white pixel / black pixel representative value, the character image and the photographic image are identified, the photographic degree is calculated, and the background of the character image is black or white. Can be identified.
【図1】 本発明における細かい文字の画像の輝度のヒ
ストグラムを示す図である。FIG. 1 is a diagram showing a luminance histogram of an image of a fine character according to the present invention.
【図2】 本発明における太い文字の画像の輝度のヒス
トグラムを示す図である。FIG. 2 is a diagram showing a luminance histogram of an image of a thick character according to the present invention.
【図3】 本発明における文字を含まない空白部分の画
像の輝度とヒストグラムを示す図である。FIG. 3 is a diagram showing a luminance and a histogram of an image of a blank portion which does not include a character in the present invention.
【図4】 本発明における白紙に黒い文字で書かれた文
書画像の各ブロックの黒画素代表値を示したグラフを示
す図である。FIG. 4 is a diagram showing a graph showing a black pixel representative value of each block of a document image written in black characters on a white paper according to the present invention.
【図5】 本発明における白紙に黒い文字で書かれた文
書画像の各ブロックの白画素代表値を示したグラフを示
す図である。FIG. 5 is a diagram showing a graph showing a white pixel representative value of each block of a document image written in black characters on a white paper according to the present invention.
【図6】 本発明における写真画像の各ブロックの黒画
素代表値を示したグラフを示す図である。FIG. 6 is a diagram showing a graph showing a black pixel representative value of each block of a photographic image in the present invention.
【図7】 本発明における写真画像の各ブロックの白画
素代表値を示したグラフを示す図である。FIG. 7 is a diagram showing a graph showing a white pixel representative value of each block of a photographic image in the present invention.
【図8】 本発明における黒板に白い文字で書かれた文
書画像の各ブロックの黒画素代表値を示したグラフを示
す図である。FIG. 8 is a diagram showing a graph showing a black pixel representative value of each block of a document image written in white characters on a blackboard according to the present invention.
【図9】 本発明における黒板に白い文字で書かれた文
書画像の各ブロックの白画素代表値を示したグラフを示
す図である。FIG. 9 is a diagram showing a graph showing a white pixel representative value of each block of a document image written in white characters on a blackboard according to the present invention.
【図10】 本発明による画像処理装置の一実施例を説
明するための構成図である。FIG. 10 is a configuration diagram for explaining an embodiment of an image processing apparatus according to the present invention.
【図11】 本発明における重なり合ってブロックを取
る場合の一例の図である。FIG. 11 is a diagram showing an example of a case where blocks are overlapped and taken in the present invention.
【図12】 本発明における白画素の代表画素値検出部
の構成図である。FIG. 12 is a configuration diagram of a representative pixel value detection unit for white pixels in the present invention.
【図13】 本発明における黒画素の代表画素値検出部
の構成図である。FIG. 13 is a configuration diagram of a representative pixel value detection unit of a black pixel according to the present invention.
【図14】 本発明におけるブロック間白画素偏差積算
部の説明図である。FIG. 14 is an explanatory diagram of an inter-block white pixel deviation integration unit according to the present invention.
【図15】 本発明における文字画像識別部の説明図で
ある。FIG. 15 is an explanatory diagram of a character image identifying unit according to the present invention.
1…ブロック白黒代表画素値検出部、2…ブロック間偏
差積算部、3…文字画像識別部。1 ... Block black-and-white representative pixel value detection unit, 2 ... Inter-block deviation integration unit, 3 ... Character image identification unit.
Claims (2)
毎に白画素の代表値と黒画素の代表値を求めるブロック
白黒代表画素値検出手段と、該ブロック白黒代表画素値
検出手段により求めた白画素と黒画素の代表値のブロッ
ク間の差の和を計算するブロック間偏差積算手段と、該
ブロック間偏差積算手段により求めたブロック間の白画
素と黒画素の代表値の差の和の値より、当該ブロックが
文字か画像かを表す特徴量を得る文字画像識別手段を有
することを特徴とする画像処理装置。1. A block black and white representative pixel value detecting means for obtaining a representative value of white pixels and a representative value of black pixels for each block of a multi-valued image divided into blocks, and a white obtained by the block black and white representative pixel value detecting means. Inter-block deviation integrating means for calculating a sum of differences between blocks of representative values of pixels and black pixels, and a value of sum of differences of representative values of white pixels and black pixels between blocks obtained by the inter-block deviation integrating means Further, the image processing apparatus is provided with a character image identification unit that obtains a characteristic amount indicating whether the block is a character or an image.
別されたブロックに対して、白地の背景中の黒い文字な
のか、黒地の背景に白い文字なのかを識別する文字背景
識別手段を有することを特徴とする請求項1記載の画像
処理装置。2. A character background identification means for identifying whether the block determined as a character by the character image identification means is a black character in a white background or a white character on a black background. The image processing apparatus according to claim 1, which is characterized in that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6050621A JPH07264397A (en) | 1994-03-22 | 1994-03-22 | Image picture processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6050621A JPH07264397A (en) | 1994-03-22 | 1994-03-22 | Image picture processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07264397A true JPH07264397A (en) | 1995-10-13 |
Family
ID=12864058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6050621A Pending JPH07264397A (en) | 1994-03-22 | 1994-03-22 | Image picture processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07264397A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8401303B2 (en) | 2009-12-28 | 2013-03-19 | Canon Kabushiki Kaisha | Method and apparatus for identifying character areas in a document image |
-
1994
- 1994-03-22 JP JP6050621A patent/JPH07264397A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8401303B2 (en) | 2009-12-28 | 2013-03-19 | Canon Kabushiki Kaisha | Method and apparatus for identifying character areas in a document image |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5293430A (en) | Automatic image segmentation using local area maximum and minimum image signals | |
JPS59106079A (en) | Binary-coding device of pattern collating device | |
JPH0666884B2 (en) | Halftone photo area identification method | |
JPH10294862A (en) | Image processor | |
EP0870276B1 (en) | A method for transforming a gray-level image into a black-and-white image | |
JPH07264397A (en) | Image picture processor | |
JP2874592B2 (en) | Image processing device for distinguishing text / photo / dot area | |
JP3183787B2 (en) | Halftone area determination device | |
JP2877548B2 (en) | Document image attribute discrimination method | |
JP3358133B2 (en) | Image processing device | |
JP3725255B2 (en) | Digital image processing device | |
KR940010474B1 (en) | Picture improvement for fax | |
JP3792402B2 (en) | Image processing apparatus, binarization method, and machine-readable recording medium recording a program for causing a computer to execute the binarization method | |
JP3216165B2 (en) | Image region identification device and image region identification method | |
JPH04304776A (en) | Picture processor | |
JPH053542A (en) | Image area discriminating device | |
JPH05136999A (en) | Edge emphasis processing device for picture information | |
JP2507948B2 (en) | Image area identification device | |
JPH03153167A (en) | Character area separation system | |
JPH0530349A (en) | Binary picture generating method for document picture | |
JPH06274691A (en) | Character recognizing device | |
US8213056B2 (en) | Image processing apparatus and line pair pattern identification method | |
JPH02195774A (en) | Multilevel image binarizing system | |
JPH0946516A (en) | Image processing unit | |
JPH07115541A (en) | Image reader |