JPH03207165A - Character area separation system - Google Patents

Character area separation system

Info

Publication number
JPH03207165A
JPH03207165A JP2001085A JP108590A JPH03207165A JP H03207165 A JPH03207165 A JP H03207165A JP 2001085 A JP2001085 A JP 2001085A JP 108590 A JP108590 A JP 108590A JP H03207165 A JPH03207165 A JP H03207165A
Authority
JP
Japan
Prior art keywords
pixel
block
character
interest
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001085A
Other languages
Japanese (ja)
Other versions
JP3161715B2 (en
Inventor
Kaoru Imao
今尾 薫
Satoshi Ouchi
敏 大内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP00108590A priority Critical patent/JP3161715B2/en
Publication of JPH03207165A publication Critical patent/JPH03207165A/en
Application granted granted Critical
Publication of JP3161715B2 publication Critical patent/JP3161715B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Abstract

PURPOSE:To securely separate even a thick character by combining a character area separating method which uses a density gradient with a character area separating method which utilizes the presence of black group picture elements on a white background. CONSTITUTION:A white background detection part 2 detects an aimed picture element as a white background picture element and sends it to an AND circuit 4 when there are white group picture elements within a certain constant distance in both the right and left main-scanning directions of the aimed picture element. A black group picture element detection part 3, on the other hand, detects the center picture elements of a matrix as black group picture elements when all picture elements are black picture elements and outputs them to the AND circuit 4, and also outputs the aimed picture element as an active picture element when all the picture elements are black group picture elements, and an expansion processing part 5 expands the aimed picture element according to the active picture element. A character area extraction part 6 which uses ridge picture elements separates a character area and sends the separation result to an OR circuit 7. Consequently, even the thick character is accurately separated as the character area.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字と絵柄(文字以外の写真など)の混在し
たディジタル多階調入力画像から文字領域を分離するた
めの文字領域分離方式に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a character region separation method for separating character regions from a digital multi-gradation input image containing a mixture of characters and pictures (such as photographs other than text). .

〔従来の技術〕[Conventional technology]

例えば、ディジタル式複写機やファクシミリなどの2値
画像再生装置において、文字と絵柄の混在する画像を再
生する場合、再生画像の画質向上を図るには、それぞれ
の領域に応じて最も適した画像処理を適応的に施すこと
が望ましい。このような画像処理を施すには、その前処
理として、画像中の文字領域とそれ以外の絵柄領域とを
正確に分離する必要がある。
For example, when playing back an image containing a mixture of text and pictures on a binary image playback device such as a digital copying machine or facsimile, in order to improve the quality of the playback image, it is necessary to perform the most appropriate image processing according to each area. It is desirable to apply it adaptively. In order to carry out such image processing, it is necessary to accurately separate character areas and other picture areas in the image as pre-processing.

従来、このような画像中の文字領域を分離するための方
法として、例えば、鉄谷らの方法(鉄谷、越智:“2値
画像と濃淡画像の混在する原稿の2値化処理法”、電子
通信学会論文誌、’84/7 Vol.J67−BNo
.7、pp.781−788)がある。この方法は、原
稿を所定サイズのブロックに分割し、ブロック内に存在
する画素中の最大濃度値と最小濃度値を求め、この最大
濃度値と最小濃度値の差分値が所定の基準値よりも大き
いときには当該ブロックを2値画像領域(文字領域)と
判定し、また基準値よりも小さい時には濃淡画像領域(
写真領域)と判定し、さらに、主走査方向または副走査
方向に連続するブロックにおいて、外側のブロックが2
値画像領域の場合にはその内側のブロックを2値画像領
域に補正するようにしたものである。
Conventionally, as a method for separating character areas in such an image, for example, the method of Tetsuya et al. Journal of the Institute of Electronics and Communication Engineers, '84/7 Vol. J67-BNo.
.. 7, pp. 781-788). This method divides the original into blocks of a predetermined size, determines the maximum and minimum density values of pixels in the block, and determines the difference between the maximum and minimum density values when the difference is greater than a predetermined reference value. If it is larger than the reference value, the block is determined to be a binary image area (character area), and if it is smaller than the reference value, it is determined to be a grayscale image area (
Furthermore, in the blocks that are continuous in the main scanning direction or the sub-scanning direction, the outer block is determined to be 2
In the case of a value image area, the blocks inside it are corrected to a binary image area.

一方、本出願人は、先に特願昭63−276000号に
より、連続階調写真部と文字・線図などの線画部とを分
離するための線画領域分離方式について出願した。この
出願に係る線画領域分離方0は、予め用意した二次元の
尾根画素検出パターンを入力画像に適用することにより
画像中の尾根画素(最大濃度画素)を検出し、この検出
した尾根O素の数を予め定めた領域を単位として計数し
、その計数値の大小から注目画素または注目ブロックが
線画領域であるか否かを判定するようにしたものである
On the other hand, the present applicant previously filed an application in Japanese Patent Application No. 63-276000 regarding a line drawing area separation method for separating continuous tone photographic areas from line drawing areas such as characters and line drawings. Line drawing area separation method 0 according to this application detects ridge pixels (maximum density pixels) in an image by applying a two-dimensional ridge pixel detection pattern prepared in advance to an input image, and The number is counted using a predetermined area as a unit, and it is determined whether the pixel of interest or block of interest is a line drawing area based on the magnitude of the count value.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

前記した方法は、いずれも、基本的に画像の濃度勾配を
利用して領域分離するものである。このためO例えば、
鉄谷らの方法の場合には、文字の内部を絵柄領域に、ま
た反対に、絵柄のエッジ部を文字領域に誤判定する可能
性がある。これを回避するために、鉄谷らの方法では、
主走査方向または副走査方向に連続するブロックにおい
て、外側のブロックが2値画像領域の場合にはその内側
のブロックを21画像N域に補正するようにしているが
、ある程度の太さの文字までしか対応できないという問
題があった。
All of the above-mentioned methods basically separate regions using the density gradient of the image. For this reason, for example,
In the case of Tetsuya et al.'s method, there is a possibility that the inside of a character is mistakenly determined to be a picture region, and conversely, the edge of a picture may be mistakenly determined to be a character region. To avoid this, Tetsuya et al.'s method uses
In blocks that are continuous in the main scanning direction or sub-scanning direction, if the outer block is a binary image area, the inner block is corrected to the 21 image N area, but up to characters of a certain thickness. There was a problem that could only be addressed.

また、本出願人の先願に係る特願昭63−276000
号の方法の場合も、太い文字の内部は濃度的にフラット
であるため、文字中の尾根画素を検出することができず
、太い文字については絵柄領域として誤判断する恐れが
あった。
In addition, patent application No. 63-276000 related to the applicant's earlier application
In the case of the above method as well, since the inside of a thick character is flat in terms of density, ridge pixels within the character cannot be detected, and there is a risk that the thick character may be misjudged as a picture area.

本発明は上記事情の下になされたもので、その目的とす
るところは、太い文字を含む画像であっても文字領域と
絵柄領域に正確に分離することのできる文字領域分離方
式を提供することである。
The present invention was made under the above circumstances, and its purpose is to provide a character area separation method that can accurately separate an image including bold characters into a character area and a picture area. It is.

〔課題を解決するための手段〕[Means to solve the problem]

上記目的を達成するため、本発明の第1の領域分離方式
は、文字と絵柄の混在したディジタル多階調入力画像信
号の文字領域を分離する方式において、前記入力画像信
号中から濃度勾配により文字のエッジ部を文字領域とし
て分離し、前記入力画像信号を低レベルで二値化し、N
XNのマトリクス内の全画素が白画素のとき、該マトリ
クスの中心画素を白塊画素とし、注目画素または注目ブ
ロックの少なくとも1つ以上の所定の対称方向において
所定の距離以内に白塊画素が存在するとき、当該注目画
素または注目ブロックを白地背景画素とし、前記入力画
像信号を高レベルで二値化し、MXMのマトリクス内の
全画素が黒画素のとき該マトリクスの中心画素を黒塊画
素とし、前記注目画素が白地背景画素で、かつ黒塊画素
であるとき、または、前記注目ブロックが白地背景画素
で、かつその一部が黒塊画素であるとき、該注目画素ま
たは注目ブロックを膨張処理して文字領域とし、該膨張
された文字領域と前記濃度勾配により分離された文字領
域の両者を文字領域として出力するようにしたものであ
る。
In order to achieve the above object, a first region separation method of the present invention is a method for separating character regions of a digital multi-tone input image signal containing a mixture of characters and pictures. The edge part of is separated as a character area, the input image signal is binarized at a low level, and N
When all pixels in a matrix of When doing so, the pixel or block of interest is a white background pixel, the input image signal is binarized at a high level, and when all pixels in the MXM matrix are black pixels, the center pixel of the matrix is set as a black block pixel, When the pixel of interest is a white background pixel and a black block pixel, or when the block of interest is a white background pixel and part of it is a black block pixel, the pixel of interest or the block of interest is subjected to expansion processing. The expanded character area and the character area separated by the density gradient are both output as the character area.

さらに、本発明の第2の文字領域分離方式は、文字と絵
柄の混在したディジタル多階調入力画像信号の文字領域
を分離する方式において、前記入力画像信号中から濃度
勾配により文字のエッジ部を文字領域として分離し、前
記入力画像信号を低レベルで二値化し、NXNのマトリ
クス内の全画素が白画素のとき、該マトリクスの中心画
素を白塊画素とし、注目画素または注目ブロックの少な
くとも1つ以上の所定の対称方向において所定の距離以
内に白塊画素が存在するとき、当該注目画素または注目
ブロックを白地背景画素とし、前記入力画像信号を高レ
ベルで二値化し、MXMのマトリクス内の全画素が黒画
素のとき該マトリクスの中心画素を黒塊画素とし、該黒
塊画素を膨張処理し、前記入力画像信号を低レベルで二
値化し、LXLのマトリクス内の白画素の数が所定の値
以上のとき、該マトリクスの中心画素を白地画素として
膨張処理し、前記注目画素が白地背景画素で、かつ膨張
処理された後の黒塊画素で、かつ膨張処理された後の白
地画素であるとき、または、前記注目ブロックが白地背
景画素で、かつその一部が膨張処理された後の黒塊画素
で、かつその一部が膨張処理された後の白地画素である
とき、該注目画素または注目ブロックを文字領域と判定
し、該判定された文字領域と前記濃度勾配により分離さ
れた文字領域との両者を文字領域として出力するように
した。
Furthermore, a second character region separation method of the present invention is a method for separating character regions of a digital multi-tone input image signal containing a mixture of characters and pictures, in which edge portions of characters are separated from the input image signal using a density gradient. The input image signal is binarized at a low level, and when all pixels in the NXN matrix are white pixels, the center pixel of the matrix is defined as a white lump pixel, and at least one of the pixel of interest or block of interest is separated as a character region, and the input image signal is binarized at a low level. When a white mass pixel exists within a predetermined distance in two or more predetermined symmetrical directions, the pixel of interest or block of interest is set as a white background pixel, the input image signal is binarized at a high level, and the pixel in the MXM matrix is When all pixels are black pixels, the center pixel of the matrix is set as a black block pixel, the black block pixel is subjected to expansion processing, and the input image signal is binarized at a low level, so that the number of white pixels in the LXL matrix is a predetermined number. When the value is greater than or equal to the value of When the block of interest is a white background pixel, a part of which is a black block pixel that has been subjected to dilation processing, and a part of which is a white background pixel that has been subjected to dilation processing, the pixel of interest Alternatively, the block of interest is determined to be a character area, and both the determined character area and the character area separated by the density gradient are output as the character area.

〔作 用〕[For production]

前述したように、一般的には濃度勾配により画像中の文
字領域を分離することができる。しかし、この濃度勾配
による場合には、前述したように、文字の内部、特に太
い文字の内部が絵柄領域に誤判定され、また絵柄のエッ
ジ部が文字領域に誤判定される恐れがある。そこで、本
発明は、従来の濃度勾配による文字領域分離方法と、白
地背景上の黒塊画素の存在による文字領域分離方法とを
組み合わせることにより、画像中の文字領域を分離する
ようにしたものである。この結果、従来の濃度勾配によ
る方法では分離困難であった太い文字についても確実に
分離することができる。
As described above, character areas in an image can generally be separated using a density gradient. However, in the case of this density gradient, as described above, the inside of a character, especially the inside of a thick character, may be erroneously determined to be a picture area, and the edge portion of a picture may be erroneously determined to be a character area. Therefore, the present invention separates character regions in an image by combining the conventional method of character region separation using density gradients and the method of character region separation using the presence of black block pixels on a white background. be. As a result, it is possible to reliably separate thick characters, which were difficult to separate using the conventional concentration gradient method.

〔実施例〕〔Example〕

以下、本発明の実施例につき図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.

第1図は、本発明の第1の文字領域分離方式を適用して
構威した文字領域分離装置の一例である。
FIG. 1 is an example of a character region separation device to which the first character region separation method of the present invention is applied.

図中、1は白塊画素検出部、2は白地背景検出部、3は
黒塊画素検出部、4はAND回路、5は膨張処理部、6
は前記した本出願人の先順に係る特願昭63−2760
00号の尾根画素検出による文字領域抽出部、7はOR
回路である。
In the figure, 1 is a white block pixel detection section, 2 is a white background detection section, 3 is a black block pixel detection section, 4 is an AND circuit, 5 is an expansion processing section, and 6
is the patent application No. 63-2760 related to the above-mentioned applicant's prior order.
Character area extraction unit using ridge pixel detection No. 00, 7 is OR
It is a circuit.

白塊画素検出部lは、ディジタル多階調入力画像信号を
ローレベルのしきい値で二値化した後、NXNのマトリ
クス、例えば5×5のマトリクスにおいて、全画素が白
画素のとき該マトリクスの中心画素を白塊画素として検
出し、白地背景検出部2へ送る。
The white block pixel detection unit 1 binarizes the digital multi-gradation input image signal using a low-level threshold, and then converts it into an NXN matrix, for example, a 5×5 matrix, when all pixels are white pixels. The center pixel of is detected as a white block pixel and sent to the white background detection section 2.

白地背景検出部2は、第3図に例示するように、注目画
素の主走査方向の左右両方向に対し、或る一定距離以内
に白塊画素が両方向に存在するとき当該注目画素を白地
背景画素して検出し、AND回路4へ送る。この白塊画
素検出部1と白地背景検出部2の処理により、注目画素
の周囲が白地背景であることが推定される。
As illustrated in FIG. 3, the white background detection unit 2 detects a pixel of interest as a white background pixel when there are white block pixels within a certain distance in both left and right directions of the main scanning direction of the pixel of interest. It is detected and sent to the AND circuit 4. Through the processing of the white block pixel detection unit 1 and the white background detection unit 2, it is estimated that the area around the pixel of interest is a white background.

一方、黒塊画素検出部3は、ディジタル多階調入力画像
信号をハイレベルのしきい値で二値化した後、MXMの
マトリクス、例えば3×3のマトリクスにおいて、全画
素が黒画素のとき該マトリクスの中心画素を黒塊画素と
して検出し、AND回路4へ送る。この黒塊画素検出部
3の処理により、注目画素が文字を構成する画素である
ことが推定される。
On the other hand, the black block pixel detection unit 3 binarizes the digital multi-gradation input image signal using a high-level threshold, and then converts it into an MXM matrix, for example, a 3×3 matrix, when all pixels are black pixels. The center pixel of the matrix is detected as a black block pixel and sent to the AND circuit 4. Through this processing by the black block pixel detection unit 3, it is estimated that the pixel of interest is a pixel forming a character.

AND回路4は白地背景検出部4から送られてくる検出
結果と、黒塊画素検出部3から送られてくる検出結果の
ANDをとり、注目画素が白地背景画素であり、かつ黒
塊画素であるときに、注目画素をアクティブ画素として
出力する。これにより、注目画素が白地背景上に存在す
る黒画素、すなわち文字であると判定される。
The AND circuit 4 ANDs the detection result sent from the white background detection section 4 and the detection result sent from the black block pixel detection section 3, and determines whether the pixel of interest is a white background pixel and a black block pixel. At some point, the pixel of interest is output as an active pixel. This determines that the pixel of interest is a black pixel on a white background, that is, a character.

膨張処理部5は、前記膨張処理部5から送られてくるア
クティブ画素に基づいて、注目画素の膨張処理を行う。
The expansion processing section 5 performs expansion processing on the pixel of interest based on the active pixels sent from the expansion processing section 5.

例えば、5×5のマトリクスにおいてlつでもアクティ
ブ画素が存在すれば、注目画素を文字領域として判定し
、OR回路7へ送る。
For example, if there is even one active pixel in a 5×5 matrix, the pixel of interest is determined to be a character area and sent to the OR circuit 7.

この膨張処理によって、太い文字の内部画素が文字領域
として補正される。
Through this dilation process, internal pixels of a thick character are corrected as a character area.

一方、尾根画素による文字領域抽出部6は次のようにし
て文字領域分離し、その分離結果をOR回路7へ送る。
On the other hand, the character region extracting section 6 using ridge pixels separates character regions as follows, and sends the separation results to the OR circuit 7.

まず最初に、入力画像に対して、例えば5×5のマトリ
クスを順次適用し、このマトリクス内で下記の条件式が
或立するとき、中心画素を文字の尾根画素として検出す
る。すなわち、マトリクスの中心画素の濃度レベルをL
c、この中心画素Lcを中に挟んで任意の点対称位置に
ある画素対の濃度レベルをL.,L,とするとき、 Lc−L.≧LTN、かっLe−L.≧L?)ILTH
:しきい値 を満足する画素対が1組でも存在するとき、注目画素L
cを第4図に例示したごとき文字の尾根画素として検出
する。
First, a 5×5 matrix, for example, is sequentially applied to an input image, and when the following conditional expression is satisfied within this matrix, a central pixel is detected as a ridge pixel of a character. In other words, the density level of the center pixel of the matrix is L.
c, the density level of a pixel pair located at an arbitrary point symmetrical position with this center pixel Lc in between. , L, then Lc-L. ≧LTN, Ka Le-L. ≧L? )ILTH
: When there is at least one pixel pair that satisfies the threshold, the pixel of interest L
c is detected as a ridge pixel of a character as illustrated in FIG.

次いで、上記のようにして検出された尾根画素の数を所
定サイズのマトリクス、例えば9×9のマトリクス単位
で計数する。そして、この計数した尾根画素の個数が所
定個以上ある場合、注目画素を文字領域として判定して
OR回路7へ送る。
Next, the number of ridge pixels detected as described above is counted in units of a matrix of a predetermined size, for example, a 9×9 matrix. If the counted number of ridge pixels is greater than or equal to a predetermined value, the pixel of interest is determined to be a character area and sent to the OR circuit 7.

OR回路7は、文字領域抽出部6と膨張処理部5の出力
のORをとり、文字領域として出力する。
The OR circuit 7 performs an OR operation on the outputs of the character area extraction section 6 and the expansion processing section 5, and outputs the result as a character area.

したがって、通常の太さの文字については、文字領域抽
出部6において、尾根画素を用いた方法により領域分離
され、また、尾根画素を検出できないような太い文字に
ついては、符号1〜5からなる回路において、白地背景
上の黒塊画素の存在から文字領域を分離されるので、ど
のような線の太さの文字を含む画像であっても、確実に
領域分離することかできる。
Therefore, for characters of normal thickness, the character region extracting section 6 separates the regions by a method using ridge pixels, and for thick characters where ridge pixels cannot be detected, the circuit consisting of symbols 1 to 5 is used. Since character regions are separated based on the presence of black block pixels on a white background, regions can be reliably separated no matter what line thickness the image contains.

第2図は、本発明の第2の文字領域分離方式を適用して
構威した文字領域分離装置の一例である。
FIG. 2 is an example of a character region separation device to which the second character region separation method of the present invention is applied.

第2図例が第1図例と異なる点は、黒塊画素検出部3の
後に膨張処理部8を設けるとともに、白地検出部9と膨
張処理部10を付加し、白地背景検出部2,膨張処理部
8および膨張処理部9の各出力のANDをとった後、O
R回路7へ送るようにした点である。なお、第1図と同
一の回路には同一の符号を付してその説明を省略する。
The example in FIG. 2 differs from the example in FIG. After ANDing the outputs of the processing section 8 and the expansion processing section 9, O
The point is that the signal is sent to the R circuit 7. Note that circuits that are the same as those in FIG. 1 are given the same reference numerals and their explanations will be omitted.

膨張処理部8は、黒塊画素検出部3で得られた黒塊画素
を膨張させる。例えば、5×5のマトリクスにおいて1
つでも黒塊画素が存在すれば、注目画素を黒塊画素とす
る。
The expansion processing unit 8 expands the black block pixels obtained by the black block pixel detection unit 3. For example, in a 5x5 matrix, 1
If a black block pixel exists at any time, the pixel of interest is determined to be a black block pixel.

一方、白地検出部9は、入力画像信号をローレベルで二
値化し、LXLのマトリクス、例えば5×5のマトリク
ス内の白画素の数が所定の値以上(例えば3個以上)あ
れば、該マトリクスの中心画素を白地画素と判定する。
On the other hand, the white background detection unit 9 binarizes the input image signal at a low level, and if the number of white pixels in the LXL matrix, for example, a 5×5 matrix is a predetermined value or more (for example, 3 or more), the The center pixel of the matrix is determined to be a white background pixel.

そして、膨張処理部10は、この白地検出部9で得られ
た白地画素を膨張させる。例えば、5×5のマトリクス
において1つでも白地が存在すれば、注目画素を白地と
する。
Then, the expansion processing unit 10 expands the white background pixels obtained by the white background detection unit 9. For example, if even one white background exists in a 5×5 matrix, the pixel of interest is set as a white background.

上記白地検出部9と膨張処理部10の処理により、前述
した白塊画素検出部1および白地背景検出部2による白
地背景の検出とは別に、更に異なる判定手法により背景
が白地であるか否かが推定される。
Through the processing of the white background detection unit 9 and the expansion processing unit 10, in addition to the detection of the white background by the white block pixel detection unit 1 and the white background detection unit 2 described above, a different determination method is used to determine whether the background is white or not. is estimated.

したがって、第2図例の場合、最終的に、白地検出部9
による白地画素の検出結果が文字領域の判断条件として
更に加わる結果、AND回路4は、注目画素が白地背景
画素で、かつ黒塊画素で、かつ白地画素であるときに出
力を発生し、当該注目画素が白地背景上の黒塊画素、す
なわち文字領域であると判定する。このため、第2図例
の場合には、更に確実に領域分離を行うことができる。
Therefore, in the case of the example in FIG. 2, the white background detection section 9
As a result, the AND circuit 4 generates an output when the pixel of interest is a white background pixel, a black block pixel, and a white pixel, and It is determined that the pixel is a black block pixel on a white background, that is, a character area. Therefore, in the case of the example shown in FIG. 2, region separation can be performed more reliably.

以上述べた実施例は、いずれも画素単位で分離処理を行
う場合の例について述べたが、ブロック単位で処理する
こともできる。
In the above-described embodiments, separation processing is performed pixel by pixel, but processing can also be performed block by block.

また、文字領域検出部6として、本出願人の先願に係る
特願昭63−276000号の方法を利用したが、これ
に限らず、前述した鉄谷らの方法を含む従来公知の濃度
勾配による方法を利用できることは当然である。
In addition, as the character area detection unit 6, the method disclosed in Japanese Patent Application No. 63-276000 related to the applicant's earlier application was used; Of course, the method can be used.

また、白地背景検出部2は、第3図に示したように主走
査方向において処理を行ったが、これと直交する副走査
方向において処理を行うこともできるし、さらに、主走
査方向と副走査方向の2方向の処理を同時に行い、その
処理結果のORをとれば、更に精度を向上することがで
きる。
Further, although the white background detection unit 2 performs processing in the main scanning direction as shown in FIG. 3, it can also perform processing in the sub-scanning direction orthogonal thereto, The accuracy can be further improved by performing processing in two directions in the scanning direction simultaneously and ORing the processing results.

〔発明の効果〕〔Effect of the invention〕

以上述べたところから明らかなように、本発明の文字領
域分離方式によるときは、太い文字であっても正確に文
字領域として分離することができ、画像領域に応じて適
応的に最適処理を施すことが可能となり、再生画像の画
質を向上することができる。さらに、白地背景上の黒塊
画素の存在により注目画素が文字領域に属するか否かを
検出しているため、絵柄部を文字部として誤分離するこ
とも少なくなる。
As is clear from the above, when using the character area separation method of the present invention, even thick characters can be accurately separated as character areas, and optimal processing can be applied adaptively depending on the image area. This makes it possible to improve the quality of reproduced images. Furthermore, since it is detected whether a pixel of interest belongs to a text area based on the presence of black block pixels on a white background, it is less likely that a picture area will be mistakenly separated as a text area.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の第1の文字領域分離方式を適用して構
威した文字領域分離装置の実施例のブロック図、 第2図は本発明の第2の文字領域分離方式を適用して構
威した文字領域分離装置の実施例のブロック図、 第3図は背景白地画素の検出説明図、 第4図は尾根画素の検出説明図である。 ■・・・白塊画素検出部、2・・・白地背景検出部、3
・・・黒塊画素検出部、4・・・AND回路、5,8.
10・・・膨張処理部、6・・・濃度勾配による文字領
域抽出部、7・・・OR回路、9・・・白地検出部。 賃果Sχti4朱の謄1 第 3 図 CG)ブタ (b)A−A斯147!l+!罐 L様,!l禾、破1 第4 図
FIG. 1 is a block diagram of an embodiment of a character region separation device configured by applying the first character region separation method of the present invention, and FIG. 2 is a block diagram of an embodiment of a character region separation device configured by applying the first character region separation method of the present invention. FIG. 3 is a block diagram of an embodiment of the constructed character area separation device; FIG. 3 is an explanatory diagram of detection of white background pixels; FIG. 4 is an explanatory diagram of detection of ridge pixels. ■...White block pixel detection unit, 2...White background detection unit, 3
. . . Black block pixel detection unit, 4 . . . AND circuit, 5, 8.
DESCRIPTION OF SYMBOLS 10... Expansion processing unit, 6... Character area extraction unit based on density gradient, 7... OR circuit, 9... White background detection unit. Renguo Sχti4 Vermilion's Transcription 1 Figure 3 CG) Pig (b) A-A 斯147! l+! Mr. Can L! Figure 4

Claims (2)

【特許請求の範囲】[Claims] (1)文字と絵柄の混在したディジタル多階調入力画像
信号の文字領域を分離する方式において、前記入力画像
信号中から濃度勾配により文字のエッジ部を文字領域と
して分離し、 前記入力画像信号を低レベルで二値化し、N×Nのマト
リクス内の全画素が白画素のとき、該マトリクスの中心
画素を白塊画素とし、 注目画素または注目ブロックの少なくとも1つ以上の所
定の対称方向において所定の距離以内に白塊画素が存在
するとき、当該注目画素または注目ブロックを白地背景
画素とし、前記入力画像信号を高レベルで二値化し、M
×Mのマトリクス内の全画素が黒画素のとき該マトリク
スの中心画素を黒塊画素とし、 前記注目画素が白地背景画素で、かつ黒塊画素であると
き、または、前記注目ブロックが白地背景画素で、かつ
その一部が黒塊画素であるとき、該注目画素または注目
ブロックを膨張処理して文字領域とし、 該膨張された文字領域と前記濃度勾配により分離された
文字領域の両者を文字領域として出力すること を特徴とする文字領域分離方式。
(1) In a method for separating character regions of a digital multi-gradation input image signal containing a mixture of characters and pictures, the edge portions of characters are separated as character regions from the input image signal using a density gradient, and the input image signal is separated into character regions. When binarized at a low level and all pixels in an N×N matrix are white pixels, the center pixel of the matrix is defined as a white block pixel, and a predetermined value is set in at least one predetermined symmetrical direction of the pixel of interest or block of interest. When a white block pixel exists within a distance of
When all pixels in the ×M matrix are black pixels, the center pixel of the matrix is a black block pixel, and when the pixel of interest is a white background pixel and a black block pixel, or the block of interest is a white background pixel. , and a part of the pixel is a black block pixel, the pixel of interest or the block of interest is expanded to form a character area, and both the expanded character area and the character area separated by the density gradient are formed into a character area. A character area separation method characterized by outputting as .
(2)文字と絵柄の混在したディジタル多階調入力画像
信号の文字領域を分離する方式において、前記入力画像
信号中から濃度勾配により文字のエッジ部を文字領域と
して分離し、 前記入力画像信号を低レベルで二値化し、N×Nのマト
リクス内の全画素が白画素のとき、該マトリクスの中心
画素を白塊画素とし、 注目画素または注目ブロックの少なくとも1つ以上の所
定の対称方向において所定の距離以内に白塊画素が存在
するとき、当該注目画素または注目ブロックを白地背景
画素とし、前記入力画像信号を高レベルで二値化し、M
×Mのマトリクス内の全画素が黒画素のとき該マトリク
スの中心画素を黒塊画素とし、該黒塊画素を膨張処理し
、 前記入力画像信号を低レベルで二値化し、L×Lのマト
リクス内の白画素の数が所定の値以上のとき、該マトリ
クスの中心画素を白地画素として膨張処理し、 前記注目画素が白地背景画素で、かつ膨張処理された後
の黒塊画素で、かつ膨張処理された後の白地画素である
とき、または、前記注目ブロックが白地背景画素で、か
つその一部が膨張処理された後の黒塊画素で、かつその
一部が膨張処理された後の白地画素であるとき、該注目
画素または注目ブロックを文字領域と判定し、該判定さ
れた文字領域と前記濃度勾配により分離された文字領域
との両者を文字領域として出力すること を特徴とする文字領域分離方式。
(2) In a method for separating character regions of a digital multi-gradation input image signal containing a mixture of characters and pictures, the edge portions of characters are separated as character regions from the input image signal using a density gradient, and the input image signal is separated into character regions. When binarized at a low level and all pixels in an N×N matrix are white pixels, the center pixel of the matrix is defined as a white block pixel, and a predetermined value is set in at least one predetermined symmetrical direction of the pixel of interest or block of interest. When a white block pixel exists within a distance of
When all pixels in the xM matrix are black pixels, the center pixel of the matrix is set as a black block pixel, the black block pixel is expanded, the input image signal is binarized at a low level, and the L x L matrix is When the number of white pixels in the matrix is greater than or equal to a predetermined value, the center pixel of the matrix is subjected to dilation processing as a white background pixel, and the pixel of interest is a white background pixel, is a black block pixel after dilation processing, and is dilated. When the block of interest is a white background pixel after being processed, or when the block of interest is a white background pixel and a part of it is a black block pixel that has been subjected to dilation processing, and a part of it is a white background pixel that has been subjected to dilation processing. When the pixel is a pixel, the pixel of interest or the block of interest is determined to be a character region, and both the determined character region and the character region separated by the density gradient are output as the character region. Separation method.
JP00108590A 1990-01-09 1990-01-09 Character area judgment device Expired - Fee Related JP3161715B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00108590A JP3161715B2 (en) 1990-01-09 1990-01-09 Character area judgment device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00108590A JP3161715B2 (en) 1990-01-09 1990-01-09 Character area judgment device

Publications (2)

Publication Number Publication Date
JPH03207165A true JPH03207165A (en) 1991-09-10
JP3161715B2 JP3161715B2 (en) 2001-04-25

Family

ID=11491665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00108590A Expired - Fee Related JP3161715B2 (en) 1990-01-09 1990-01-09 Character area judgment device

Country Status (1)

Country Link
JP (1) JP3161715B2 (en)

Also Published As

Publication number Publication date
JP3161715B2 (en) 2001-04-25

Similar Documents

Publication Publication Date Title
JPH08228282A (en) Processing method of document picture and binary picture picture element processor
JP3088010B2 (en) Line drawing separation method and apparatus
JPH03207165A (en) Character area separation system
JPH10108012A (en) Image area separating device
JPH05136994A (en) Image area separation circuit
JPH03133262A (en) Character area separation system
JP2507948B2 (en) Image area identification device
JP2777378B2 (en) Halftone area detection method
JP2853140B2 (en) Image area identification device
JPH02274173A (en) Character separating device
JP2674083B2 (en) Image area identification device
JP3086243B2 (en) Halftone dot area detection device
JP2853141B2 (en) Image area identification device
JP3564216B2 (en) Image processing device
JP3596962B2 (en) Image processing device
JPS6197788A (en) Noise removing method
JPH04339471A (en) Device for identifying image area
JPH04157872A (en) Picture processing unit
JPH01168164A (en) Picture processing unit
JPH0785271A (en) Image processor
JPS62165477A (en) Image processor
JPS63189047A (en) Binary picture signal processor
JPH0253185A (en) Dot area deciding system
JPH02248160A (en) Dot area separation system
JPH02288668A (en) Picture element density conversion processor

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080223

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees