JP2005072858A - Image processing apparatus - Google Patents

Image processing apparatus Download PDF

Info

Publication number
JP2005072858A
JP2005072858A JP2003298713A JP2003298713A JP2005072858A JP 2005072858 A JP2005072858 A JP 2005072858A JP 2003298713 A JP2003298713 A JP 2003298713A JP 2003298713 A JP2003298713 A JP 2003298713A JP 2005072858 A JP2005072858 A JP 2005072858A
Authority
JP
Japan
Prior art keywords
image
character
character region
unit
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003298713A
Other languages
Japanese (ja)
Inventor
Hiroomi Nakatsuji
弘臣 仲辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Mita Corp filed Critical Kyocera Mita Corp
Priority to JP2003298713A priority Critical patent/JP2005072858A/en
Publication of JP2005072858A publication Critical patent/JP2005072858A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image processing apparatus capable of accurately reproducing faint letters in the case of binarizing an original image including the light letters. <P>SOLUTION: The image processing apparatus is provided with: a character region extract section 11 for extracting a character region from an original image; a filter processing section 16 for applying smoothing processing to the extracted character region; a multi-value processing section 12 for converting the character region subjected to smoothing processing into an m-value processed image; a threshold value determining section 13 for discriminating whether or not a prescribed number (e.g., one) of pixels configuring the character region exists with respect to each of m classes and determining a threshold on the basis of a result of the discrimination; a binary processing section 14 for binarizing the character region on the basis of the determined threshold; and an output section 15 for generating a print image on the basis of the binarized character region and printing out the image on recording paper. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、原稿画像を2値化する画像処理装置に関する。   The present invention relates to an image processing apparatus that binarizes a document image.

原稿読み取り部で読み取られた原稿の画像を2値化し、記録紙に印刷する画像処理装置では、予め定められた閾値と、各画素の輝度(濃度)とが比較されて白、黒の判定が行われ、記録紙に印刷される。そのため、鉛筆で書かれた文字や朱肉等の薄文字を含む原稿の画像は、閾値をうまく設定しなければ、正確に2値化されないという問題がある。   In an image processing apparatus that binarizes an image of a document read by a document reading unit and prints it on a recording sheet, a predetermined threshold value is compared with the luminance (density) of each pixel to determine white or black. Done and printed on recording paper. For this reason, there is a problem that an image of a document including characters written with a pencil or thin characters such as vermilion cannot be binarized accurately unless the threshold value is set well.

そこで、原稿画像のヒストグラムを作成し、それを基に閾値を決定する手法が開示されている(特許文献1)。
特開平10−65915号公報
Therefore, a technique for creating a histogram of a document image and determining a threshold based on the histogram is disclosed (Patent Document 1).
JP-A-10-65915

しかしながら、特許文献1の手法では、印刷文字に対して薄文字が少ない場合、閾値が高く設定され、薄文字が再現されないおそれがある。   However, in the method of Patent Document 1, when there are few thin characters with respect to the printed characters, the threshold is set high, and there is a possibility that the thin characters may not be reproduced.

本発明は上記課題を解決するためになされたものであり、薄文字が含まれる原稿画像を2値化した場合、当該薄文字を正確に再現することができる画像処理装置を提供することを目的とする。   The present invention has been made to solve the above problems, and an object of the present invention is to provide an image processing apparatus capable of accurately reproducing a thin character when a document image including the thin character is binarized. And

上記課題を解決するために本発明に係る画像処理装置は、n(n≧4の整数)階調で表された原稿画像を2値化する画像処理装置であって、前記原稿画像から、各画素の輝度を基に、文字を表す画素より構成される文字領域を抽出する文字領域抽出手段と、抽出された文字領域を、階調数がm(m≧3、かつ、m<n)であるm値化画像に変換する多値化手段と、前記m値化画像の各画素が、各階調に対して所定個数存在するか否かを判定し、当該判定結果を基に、前記文字領域を2値化するための閾値を決定する閾値決定手段と、決定された閾値を基に、前記文字領域を2値化する2値化手段とを備えることを特徴とする。   In order to solve the above-described problem, an image processing apparatus according to the present invention is an image processing apparatus that binarizes an original image represented by n (n ≧ 4) gradations. Based on the luminance of the pixel, the character area extracting means for extracting a character area composed of pixels representing the character, and the extracted character area is divided into m (m ≧ 3 and m <n). Multi-value conversion means for converting into a certain m-valued image and whether or not a predetermined number of each pixel of the m-valued image exists for each gradation, and based on the determination result, the character region Threshold value determining means for determining a threshold value for binarizing the character area, and binarizing means for binarizing the character area based on the determined threshold value.

また、前記文字領域を平滑化フィルタを用いて平滑化させる平滑化手段をさらに備え、前記多値化手段は、前記平滑化手段により平滑化された文字領域をm値化画像に変換することが好ましい。   The image processing apparatus may further include a smoothing unit that smoothes the character region using a smoothing filter, and the multi-value conversion unit may convert the character region smoothed by the smoothing unit into an m-valued image. preferable.

また、前記文字領域に対し、エッジ抽出フィルタを用いてエッジ抽出処理を行うエッジ抽出手段をさらに備え、前記多値化手段は、前記エッジ抽出手段によりエッジ抽出された文字領域をm値化画像に変換することが好ましい。   Further, the image processing apparatus further includes an edge extraction unit that performs edge extraction processing on the character region using an edge extraction filter, and the multi-value conversion unit converts the character region extracted by the edge extraction unit into an m-valued image. It is preferable to convert.

請求項1記載の発明によれば、n階調で表された原稿画像は、m(m<n)階調からなるm値化画像に多値化され、m値化画像の各画素が各階調に対し所定個数存在するか否かが判定され、当該判定結果を基に、閾値が決定されて文字領域が2値化される。鉛筆等による薄文字とインク等で印刷された印刷文字とが含まれる文字領域をm階調に多値化した場合、薄文字の最低階調以上の階調において、多値化画像のいずれかの画素が属することから、原稿の文字部分と、原稿の地肌部分との境界の階調が明確に分かり、当該階調を閾値として2値化すれば、薄文字の頻度に関わらず、薄文字を抽出することができる。その結果、従来のようにヒストグラムを基に閾値を決定する場合に比べ、原稿に含まれる薄文字の頻度が低い場合であっても、薄文字を正確に再現することができる。さらに、ヒストグラムを作成する必要がないため、処理を簡略化することができる。   According to the first aspect of the present invention, an original image represented by n gradations is multi-valued into an m-valued image having m (m <n) gradations, and each pixel of the m-valued image is assigned to each floor. It is determined whether or not there is a predetermined number for the key, and based on the determination result, a threshold is determined and the character area is binarized. If a character area containing thin characters such as a pencil and printed characters printed with ink is multi-valued to m gradations, any of the multi-valued images is displayed at gradations above the minimum gradation of the thin characters. Therefore, if the gradation of the boundary between the character portion of the document and the background portion of the document is clearly understood and binarized using the gradation as a threshold value, the light character Can be extracted. As a result, it is possible to accurately reproduce thin characters even when the frequency of thin characters included in a document is low compared to the case where the threshold value is determined based on a histogram as in the past. Furthermore, since it is not necessary to create a histogram, the processing can be simplified.

請求項2記載の発明によれば、文字領域は、メジアンフィルタや、平均化フィルタ等の平滑化フィルタを用いて平滑化された後、多値化されるため、ノイズの影響により文字領域が誤って多値化されることを防止することができる。その結果、より正確に薄文字を再現することができる。   According to the second aspect of the present invention, since the character area is smoothed using a smoothing filter such as a median filter or an averaging filter and then multivalued, the character area is erroneously affected by noise. Therefore, it is possible to prevent multi-values. As a result, thin characters can be reproduced more accurately.

請求項3記載の発明によれば、文字領域は、微分フィルタ等のエッジ抽出フィルタによりエッジ抽出処理が施された後、多値化されるため、文字領域に含まれる文字の部分を正確に多値化することができる。   According to the third aspect of the present invention, since the character area is subjected to edge extraction processing by an edge extraction filter such as a differential filter and then multivalued, the character area included in the character area is accurately increased. Can be priced.

図1は、本発明に係る画像処理装置を複写機に適用したときの当該複写機の機械的構成を主に示す側面概略図である。画像処理装置は、本体部200と、本体部200の左側に配設された用紙後処理部300と、ユーザが種々の操作指令等を入力するための操作部400と、本体部200の上部に配設された原稿読み取り部500と、原稿読み取り部500の上方に配設された原稿給送部600とから構成される。   FIG. 1 is a schematic side view mainly showing a mechanical configuration of the copying machine when the image processing apparatus according to the present invention is applied to the copying machine. The image processing apparatus includes a main unit 200, a sheet post-processing unit 300 disposed on the left side of the main unit 200, an operation unit 400 for a user to input various operation commands and the like, and an upper part of the main unit 200. The document reading unit 500 is disposed, and the document feeding unit 600 is disposed above the document reading unit 500.

操作部400は、タッチパネル401、スタートキー402及びテンキー403等を備える。タッチパネル401は、種々の操作画面を表示するとともに、ユーザが種々の操作指令を入力するための種々の操作ボタン等を表示する。スタートキー402は、ユーザが印刷実行指令等を入力するために用いられ、テンキー403は、印刷部数等を入力するために用いられる。   The operation unit 400 includes a touch panel 401, a start key 402, a numeric keypad 403, and the like. The touch panel 401 displays various operation screens and various operation buttons for the user to input various operation commands. The start key 402 is used for the user to input a print execution command and the like, and the ten key 403 is used for inputting the number of copies to be printed.

原稿給送部600は、原稿載置部601、原稿排出部602、給紙ローラ603及び原稿搬送部604等を備え、原稿読み取り部500は、スキャナ501等を備える。給紙ローラ603は、原稿載置部601にセットされた原稿を繰り出し、原稿搬送部604は、繰り出される原稿を1枚ずつ順にスキャナ501上に搬送する。スキャナ501は搬送される原稿を順次読み取り、読み取られた原稿は原稿排出部602に排出される。   The document feeding unit 600 includes a document placement unit 601, a document discharge unit 602, a paper feed roller 603, a document transport unit 604, and the like, and the document reading unit 500 includes a scanner 501 and the like. The paper feed roller 603 feeds out the original set on the original placement unit 601, and the original transport unit 604 transports the fed originals one by one on the scanner 501. The scanner 501 sequentially reads the conveyed document, and the read document is discharged to the document discharge unit 602.

本体部200は、複数の給紙カセット201、複数の給紙ローラ202、転写ローラ203、中間転写体ローラ204、感光体ドラム205、露光装置206、イエロー、マゼンタ、シアン、ブラックの各色用の現像装置207Y,207M,207C,207K、定着ローラ208、排出口209、及び排出トレイ210等を備える。   The main body 200 includes a plurality of paper feed cassettes 201, a plurality of paper feed rollers 202, a transfer roller 203, an intermediate transfer body roller 204, a photosensitive drum 205, an exposure device 206, and development for each color of yellow, magenta, cyan, and black. Devices 207Y, 207M, 207C, and 207K, a fixing roller 208, a discharge port 209, a discharge tray 210, and the like are provided.

感光体ドラム205は、矢印方向に回転しながら帯電装置(図示省略)によって一様に帯電される。露光装置206は、原稿読み取り部500において読み取られた原稿の画像データに基づいて生成された変調信号をレーザ光に変換して出力し、感光体ドラム205に各色別に静電潜像を形成する。現像装置207Y,207M,207C,207Kは、各色の現像剤を感光体ドラム205に供給して各色別のトナー像を形成する。なお、原稿の画像データの各画素は、R(赤),G(緑),B(青)の色成分からなり、各色成分は、0〜255の階調をとる。   The photosensitive drum 205 is uniformly charged by a charging device (not shown) while rotating in the direction of the arrow. The exposure device 206 converts the modulation signal generated based on the image data of the original read by the original reading unit 500 into a laser beam and outputs it, and forms an electrostatic latent image on the photosensitive drum 205 for each color. The developing devices 207Y, 207M, 207C, and 207K supply each color developer to the photosensitive drum 205 to form a toner image for each color. Each pixel of the document image data is composed of R (red), G (green), and B (blue) color components, and each color component has a gradation of 0 to 255.

中間転写体ローラ204は、感光体ドラム205から各色のトナー像が転写され、中間転写体ローラ204上にカラーのトナー像が形成される。   The intermediate transfer roller 204 transfers the color toner images from the photosensitive drum 205, and forms a color toner image on the intermediate transfer roller 204.

一方、給紙ローラ202は、記録紙が収納された給紙カセット201から記録紙を引き出し、転写ローラ203まで給送する。転写ローラ203は、搬送された記録紙に中間転写体ローラ204上のトナー像を転写させ、定着ローラ208は、転写されたトナー像を加熱して記録紙に定着させる。その後、記録紙は、本体部200の排出口209から用紙後処理部300に搬入される。また、記録紙は、必要に応じて排出トレイ210へも排出される。   On the other hand, the paper feed roller 202 pulls out the recording paper from the paper feed cassette 201 in which the recording paper is stored, and feeds the recording paper to the transfer roller 203. The transfer roller 203 transfers the toner image on the intermediate transfer body roller 204 onto the conveyed recording paper, and the fixing roller 208 heats and fixes the transferred toner image on the recording paper. Thereafter, the recording paper is carried into the paper post-processing section 300 from the discharge port 209 of the main body section 200. The recording paper is also discharged to the discharge tray 210 as necessary.

用紙後処理部300は、搬入口301、記録紙搬送部302、搬出口303及びスタックトレイ304等を備える。記録紙搬送部302は、排出口209から搬入口301に搬入された記録紙を順次搬送し、最終的に搬出口303からスタックトレイ304へ記録紙を排出する。スタックトレイ304は、搬出口303から搬出された記録紙の集積枚数に応じて矢印方向に上下動可能に構成されている。   The paper post-processing unit 300 includes a carry-in port 301, a recording paper transport unit 302, a carry-out port 303, a stack tray 304, and the like. The recording paper transport unit 302 sequentially transports the recording paper carried into the carry-in port 301 from the discharge port 209 and finally ejects the recording paper from the carry-out port 303 to the stack tray 304. The stack tray 304 is configured to move up and down in the direction of the arrow in accordance with the number of recording sheets stacked from the carry-out port 303.

図2は、図1に示す複写機の電気的構成を示したブロック図である。画像形成部30は、図1に示す転写ローラ203、中間転写体ローラ204、感光体ドラム205、露光装置206、イエロー、マゼンタ、シアン、ブラックの各色用の現像装置207Y,207M,207C,207K、定着ローラ208が相当する。   FIG. 2 is a block diagram showing an electrical configuration of the copying machine shown in FIG. The image forming unit 30 includes a transfer roller 203, an intermediate transfer member roller 204, a photosensitive drum 205, an exposure device 206, and developing devices 207Y, 207M, 207C, and 207K for yellow, magenta, cyan, and black colors illustrated in FIG. The fixing roller 208 corresponds.

制御部10は、CPU(中央処理装置)、RAM(ランダムアクセスメモリ)、ROM(リードオンリーメモリ)及び専用のハードウェア回路から構成されている。ROMには、画像処理装置を制御するための制御プログラムが記憶されており、CPUは、この制御プログラムを実行することにより、制御部10を文字領域抽出部11、多値化部12、閾値決定部13、2値化処理部14、出力部15及びフィルタ処理部16として機能させる。   The control unit 10 includes a CPU (Central Processing Unit), a RAM (Random Access Memory), a ROM (Read Only Memory), and a dedicated hardware circuit. The ROM stores a control program for controlling the image processing apparatus, and the CPU executes the control program, whereby the control unit 10 is changed to the character area extraction unit 11, the multi-value conversion unit 12, and the threshold value determination. Unit 13, binarization processing unit 14, output unit 15, and filter processing unit 16.

文字領域抽出部11は、原稿読み取り部500により読み取られた原稿画像から、文字を構成する画素からなる領域である文字領域を抽出する。ここで、文字領域抽出部11は、注目画素と、注目画素に隣接する8近傍画素との各々の輝度の差分値を算出し、所定の閾値よりも大きな値を有する差分値が、一定個数以上(例えば4個以上)ある場合、その注目画素は、文字を構成する画素であると判定し、文字領域を抽出する。ここで、輝度は、例えば式(1)で表される。
Y=0.299R+0.587G+0.114B・・・式(1)
但し、Yは輝度、Rは赤成分の階調、Gは緑成分の階調、Bは青成分の階調を示している。式(1)で表される輝度を用いることにより、人間の視覚を考慮して文字領域を抽出することができる。
The character area extraction unit 11 extracts a character area, which is an area composed of pixels constituting a character, from the document image read by the document reading unit 500. Here, the character area extraction unit 11 calculates a difference value of luminance between the target pixel and eight neighboring pixels adjacent to the target pixel, and the difference value having a value larger than a predetermined threshold is equal to or greater than a certain number. If there are (for example, four or more), it is determined that the target pixel is a pixel constituting a character, and a character region is extracted. Here, the luminance is expressed by, for example, Expression (1).
Y = 0.299R + 0.587G + 0.114B Formula (1)
However, Y represents luminance, R represents the gradation of the red component, G represents the gradation of the green component, and B represents the gradation of the blue component. By using the luminance represented by the expression (1), it is possible to extract a character region in consideration of human vision.

フィルタ処理部16は、文字領域抽出部11により抽出された文字領域を多値化する前の前処理として、当該文字領域に対し、例えばメジアンフィルタ又は平均化フィルタ等の平滑化フィルタを用いた平滑化処理を施し、文字領域に含まれるノイズを除去する。これにより、多値化部12は、文字領域をより正確に多値化することができる。   The filter processing unit 16 performs smoothing using, for example, a smoothing filter such as a median filter or an averaging filter on the character region as pre-processing before multi-value conversion of the character region extracted by the character region extraction unit 11. The noise included in the character area is removed. Thereby, the multi-value conversion part 12 can multi-value a character area more correctly.

多値化部12は、各画素の輝度を、0〜15(0階調)、16〜31(1階調)、・・・、239〜255(15階調)というように等間隔に16個の階調に分け、文字画像を16値化する。   The multi-value conversion unit 12 sets the luminance of each pixel to 16 at regular intervals such as 0 to 15 (0 gradation), 16 to 31 (1 gradation),... 239 to 255 (15 gradations). The character image is converted into 16 values by dividing into gradations.

閾値決定部13は、0〜255を16等分して得られる各階級に対して、その階級に属する階調を有する16値化された文字領域の画素が所定個数存在するか否かを判定し、その判定結果に基づいて、原稿画像を2値化するための閾値を決定する。図3は、閾値決定部13の判定結果を例示したテーブルであり、0〜256を16等分して得られる各階級(階調)と、各階級に対し16値化された文字領域の画素の存在の有無と、2値化した結果とが記載されている。このテーブルでは、ある階級に対し、16値化された文字領域の画素が所定個数(例えば1個)存在すれば「○」、所定個数未満(例えば0個)ならば「×」が記載されている。閾値決定部13は、例えばある階級に属する画素が文字領域に存在するか否かを順次調べていき、所定個数存在した時点で、その階級に対する画素は存在するとして当該階級の判定を終了し、次の階級に対する判定を行うというようにして、各階調に対する「○」、「×」の判定を行っていく。   The threshold value determination unit 13 determines, for each class obtained by dividing 0 to 255 into 16 equal parts, whether or not there are a predetermined number of pixels in a 16-valued character area having gradations belonging to that class. Then, based on the determination result, a threshold for binarizing the document image is determined. FIG. 3 is a table exemplifying the determination result of the threshold value determination unit 13. Each class (gradation) obtained by dividing 0 to 256 into 16 equal parts, and pixels in the character region 16-valued for each class. Presence / absence of the presence and the binarized result are described. In this table, “◯” is described when a predetermined number (for example, 1) of 16-valued character area pixels exist for a certain class, and “X” is described when the number is less than the predetermined number (for example, 0). Yes. For example, the threshold value determination unit 13 sequentially checks whether or not pixels belonging to a certain class exist in the character area, and when there is a predetermined number of pixels, determines that there is a pixel for the class and ends the determination of the class. The determination of “◯” and “×” for each gradation is performed in such a manner that the determination for the next class is performed.

例1の場合では、8階調まで「×」であり、9階調から15階調までが「○」であるため、閾値決定部13は、9階調目を閾値として決定している。例2の場合では、2階調目で「○」が現れているが、3階調から4階調まで再び「×」が現れた後、5階調から15階調まで「○」が連続して現れているため、2階調目の「○」はノイズであると判定し、5階調目を閾値として決定している。   In the case of Example 1, since “x” is obtained up to the 8th gradation and “◯” is obtained from the 9th gradation to the 15th gradation, the threshold determination unit 13 determines the ninth gradation as the threshold. In the case of Example 2, “◯” appears in the second gradation, but “X” appears again from the third gradation to the fourth gradation, and then “◯” continues from the fifth gradation to the 15th gradation. Therefore, “◯” in the second gradation is determined to be noise, and the fifth gradation is determined as a threshold value.

2値化処理部14は、閾値決定部13により決定された閾値以上の階調の画素は、文字部分であるとして、「1」を割り当て、閾値未満の階調の画素は、原稿の地肌部分として、「0」を割り当て、文字領域を2値化する。図3に示す例1では、9階調目が閾値として決定されているため、2値化処理部14は、0〜8階調に「0」を、9〜15階調に「1」を割り当て、文字領域を2値化している。例2では、5階調目が閾値として決定されているため、2値化処理部14は、0〜4階調目に「0」を、5〜15階調目に「1」を割り当て、文字領域を2値化している。   The binarization processing unit 14 assigns “1”, assuming that pixels having a gradation equal to or higher than the threshold determined by the threshold determination unit 13 are character parts, and pixels having a gradation lower than the threshold are background portions of the document. “0” is assigned and the character area is binarized. In Example 1 shown in FIG. 3, since the ninth gradation is determined as the threshold value, the binarization processing unit 14 sets “0” to 0 to 8 gradations and “1” to 9 to 15 gradations. Allocation and binarization of character area. In Example 2, since the fifth gradation is determined as the threshold, the binarization processing unit 14 assigns “0” to the 0th to 4th gradations and “1” to the 5th to 15th gradations, The character area is binarized.

出力部15は、文字領域抽出部11によって文字領域として抽出されなかった領域を原稿の地肌部分として「0」を割り当て、当該領域と、2値化された文字領域とを合成して印刷画像を作成し、画像形成部30を制御することにより、記録紙に印刷画像を印刷する。   The output unit 15 assigns “0” as the background portion of the document that has not been extracted as the character region by the character region extraction unit 11, and combines the region and the binarized character region to generate a print image. By creating and controlling the image forming unit 30, the print image is printed on the recording paper.

次に、図4に示すフローチャートに従って、本画像処理装置の処理について説明する。まず、画像読み取り部500により、原稿画像が読み取られ(ステップS1)、文字領域抽出部11により、原稿画像から文字領域が抽出され(ステップS2)、抽出された文字領域は、フィルタ処理部16により、平滑化されノイズが除去される(ステップS3)。   Next, processing of the image processing apparatus will be described according to the flowchart shown in FIG. First, a document image is read by the image reading unit 500 (step S1), a character region is extracted from the document image by the character region extraction unit 11 (step S2), and the extracted character region is filtered by the filter processing unit 16. Then, it is smoothed and noise is removed (step S3).

ステップS4において、多値化部12により、ステップS3で平滑化された文字領域が、0階調〜15階調の16個の階調に多値化される。ステップS5において、閾値決定部13により、0階調〜15階調の各階調に対し、16値化された文字領域の画素の存在の有無が判定され、その判定結果を基に、閾値が決定される。ステップS6において、2値化処理部14により、ステップS5で決定された閾値以上の階調の画素に「1」、閾値未満の画素に「0」が割り当てられ、16値化された文字領域が2値化される。   In step S4, the multi-value quantization unit 12 multi-values the character area smoothed in step S3 into 16 gradations of 0 gradation to 15 gradations. In step S5, the threshold value determination unit 13 determines the presence / absence of a 16-valued character area pixel for each of the gradation levels 0 to 15, and determines the threshold value based on the determination result. Is done. In step S6, the binarization processing unit 14 assigns “1” to pixels having a gradation equal to or higher than the threshold determined in step S5 and “0” to pixels less than the threshold. It is binarized.

ステップS7において、ステップS5で2値化された文字領域を基に、印刷画像が生成され、記録紙に印刷される。ここで、出力部15は、印刷画像を記録紙に印刷する前に、印刷画像をタッチパネル401にプレビュー表示させ、操作部400を介して入力されるユーザからの印刷許可指令を受け付けた後、印刷画像を記録紙に印刷してもよい。   In step S7, a print image is generated based on the character region binarized in step S5 and printed on a recording sheet. Here, the output unit 15 displays a preview of the print image on the touch panel 401 before printing the print image on the recording paper, receives a print permission instruction from the user input via the operation unit 400, and then prints the print image. An image may be printed on recording paper.

また、図3の例2で示すように、2階調目で「○」が現れた後、「×」が連続して現れ、5階調目から再び「○」が現れるというように、閾値の候補が複数ある場合(例2では2階調目と5階調目)、2値化処理部14は、各候補を閾値として文字領域を2値化し、出力部15は、閾値毎に2値化された文字領域のそれぞれに対応する印刷画像のサムネイル画像を生成し、タッチパネル401に各印刷画像のサムネイル画像をプレビュー表示してもよい。そして、出力部15は、操作部400を介して入力されたユーザからの選択指令によって選択された印刷画像を記録紙に印刷させてもよい。   Further, as shown in Example 2 of FIG. 3, after “◯” appears in the second gradation, “×” appears continuously, and “◯” appears again from the fifth gradation. When there are a plurality of candidates (in the second example, the second gradation and the fifth gradation), the binarization processing unit 14 binarizes the character area using each candidate as a threshold, and the output unit 15 outputs 2 for each threshold. A thumbnail image of a print image corresponding to each of the digitized character areas may be generated, and a thumbnail image of each print image may be displayed on the touch panel 401 as a preview. Then, the output unit 15 may cause the print image selected by the selection command from the user input via the operation unit 400 to be printed on the recording paper.

以上説明したように、本画像処理装置によれば、文字領域を一旦16値化し、16値化された文字領域の画素が、各階調に対し所定個数存在するか否かを判定し、当該判定結果を基に、文字領域に含まれる文字の部分の最低輝度を判定して、閾値を決定しているため、従来のようにヒストグラムを基に閾値を決定する場合に比べ、鉛筆等の薄文字の頻度が低い場合であっても、当該薄文字をより正確に検出することができる。また、閾値決定部13は、各階調について、画素が存在するか否かにより閾値を決定しているため、従来の装置のように閾値を決定するためのヒストグラムを作成する必要が無く、簡略化された処理により高速に2値化処理を行うことができる。   As described above, according to the present image processing apparatus, the character region is temporarily converted into 16 values, and it is determined whether or not a predetermined number of pixels in the 16-valued character region exist for each gradation. Since the threshold value is determined by determining the minimum brightness of the character part included in the character area based on the result, a thin character such as a pencil is compared to the case where the threshold value is determined based on the histogram as in the past. Even if the frequency of is low, the thin character can be detected more accurately. Further, since the threshold value determination unit 13 determines the threshold value for each gradation depending on whether or not there is a pixel, it is not necessary to create a histogram for determining the threshold value as in the conventional device, and simplification. The binarization processing can be performed at high speed by the processed processing.

なお、上記実施形態では、多値化部12は、文字領域を16値化していたが、これに限定されず、16以外(例えば、4、8、32、64・・・等)の階調に多値化してもよい。図5は、多値化部12が文字領域を0〜4階調に4値化したときにおける閾値決定部13の判定結果を例示したテーブルである。例1の場合では、1階調目で「○」が現れているため、閾値決定部13は、1階調目を閾値として決定している。そして、2値化処理部14は、閾値以上の階調である1〜3階調に「1」を割り当て、閾値未満の階調である0階調に「0」を割り当て文字領域を2値化している。   In the above embodiment, the multi-value conversion unit 12 converts the character area into 16 values. However, the present invention is not limited to this, and gradations other than 16 (for example, 4, 8, 32, 64...) It may be multi-valued. FIG. 5 is a table exemplifying the determination result of the threshold value determination unit 13 when the multi-value conversion unit 12 converts the character area into four levels of 0 to 4 gradations. In the case of Example 1, since “◯” appears at the first gradation, the threshold determination unit 13 determines the first gradation as the threshold. Then, the binarization processing unit 14 assigns “1” to 1 to 3 gradations which are gradations equal to or higher than the threshold, and assigns “0” to 0 gradation which is less than the threshold, and binarizes the character area. It has become.

例2の場合、2階調目で「○」が現れているため、閾値決定部13は、閾値を2階調目に決定している。そして、2値化処理部14は、閾値以上の階調である2及び3階調に「1」を割り当て、閾値未満の階調である0及び1階調に「0」を割り当て、文字領域を2値化している。   In the case of Example 2, since “◯” appears at the second gradation, the threshold determination unit 13 determines the threshold at the second gradation. Then, the binarization processing unit 14 assigns “1” to the 2nd and 3rd gradations that are the gradations equal to or higher than the threshold, and assigns “0” to the 0th and 1st gradations that are less than the threshold. Is binarized.

また、上記実施形態では、原稿の画像データのR,G,Bの色成分は、それぞれ0〜255の階調をとる、すなわち、8ビットのビット列で表されるものとしたが、これに限定されず、10、16ビット等の他のビット列で表されるものを採用してもよい。   In the above embodiment, the R, G, and B color components of the image data of the document have gradations of 0 to 255, that is, are represented by an 8-bit bit string. However, the present invention is not limited to this. Instead, the one represented by another bit string such as 10, 16 bits may be adopted.

さらに、上記実施形態では、明示しなかったが、出力部15は、2値化された薄文字の背景の部分に網掛けを施したり、当該薄文字の行間に「メモ」又は「memo」等の2値化したことを示すコメントを表示したりして印刷画像を作成し、2値化した薄文字部分をユーザに明示するようにしてもよい。   Furthermore, although not explicitly shown in the above-described embodiment, the output unit 15 shades the binarized background portion of the thin character, or “memo” or “memo” or the like between the thin character lines. It is also possible to create a print image by displaying a comment indicating that it has been binarized, and to indicate to the user the binarized thin character portion.

上記実施形態では、フィルタ処理部16は、文字領域に対し、平滑化フィルタを用いて平滑化処理を施したが、これに代えて、例えば微分フィルタ等のエッジ抽出フィルタを用いてエッジ抽出処理を行ってもよい。この場合、文字領域に含まれる文字の部分と文字以外の部分との階調の差が顕著に現れることとなり、多値化部12は、より正確に文字領域をm値化することができる。   In the above embodiment, the filter processing unit 16 performs the smoothing process on the character region using the smoothing filter, but instead performs the edge extraction process using an edge extraction filter such as a differential filter. You may go. In this case, the difference in gradation between the character portion included in the character region and the portion other than the character appears remarkably, and the multi-value conversion unit 12 can convert the character region to m-value more accurately.

本発明に係る画像処理装置を複写機に適用したときの当該複写機の機械的構成を主に示す側面概略図である。FIG. 2 is a schematic side view mainly showing a mechanical configuration of the copying machine when the image processing apparatus according to the present invention is applied to the copying machine. 図1に示す複写機の電気的構成を示したブロック図である。FIG. 2 is a block diagram showing an electrical configuration of the copying machine shown in FIG. 1. 閾値決定部による判定結果を例示したテーブルである。It is the table which illustrated the determination result by the threshold value determination part. 本画像処理装置の処理を示したフローチャートである。It is the flowchart which showed the process of this image processing apparatus. 4値化された文字領域に対する閾値決定部の判定結果を例示したテーブルである。It is the table which illustrated the determination result of the threshold value determination part with respect to the quaternarized character area.

符号の説明Explanation of symbols

10 制御部
11 文字領域抽出部
12 多値化部
13 閾値決定部
14 値化処理部
15 出力部
16 フィルタ処理部
30 画像形成部
500 原稿読み取り部
DESCRIPTION OF SYMBOLS 10 Control part 11 Character area extraction part 12 Multi-value conversion part 13 Threshold value determination part 14 Value conversion process part 15 Output part 16 Filter process part 30 Image formation part 500 Original reading part

Claims (3)

n(n≧4の整数)階調で表された原稿画像を2値化する画像処理装置であって、
前記原稿画像から、各画素の輝度を基に、文字を表す画素より構成される文字領域を抽出する文字領域抽出手段と、
抽出された文字領域を、階調数がm(m≧3、かつ、m<n)であるm値化画像に変換する多値化手段と、
前記m値化画像の各画素が、各階調に対して所定個数存在するか否かを判定し、当該判定結果を基に、前記文字領域を2値化するための閾値を決定する閾値決定手段と、
決定された閾値を基に、前記文字領域を2値化する2値化手段とを備えることを特徴とする画像処理装置。
An image processing apparatus for binarizing a document image represented by n (n ≧ 4 integer) gradations,
A character area extracting means for extracting a character area composed of pixels representing characters from the original image based on the luminance of each pixel;
Multi-value conversion means for converting the extracted character area into an m-value image having a gradation number of m (m ≧ 3 and m <n);
Threshold determination means for determining whether or not a predetermined number of each pixel of the m-valued image exists for each gradation and determining a threshold for binarizing the character area based on the determination result When,
An image processing apparatus comprising: binarizing means for binarizing the character area based on the determined threshold value.
前記文字領域に対し、平滑化フィルタを用いて平滑化処理を行う平滑化手段をさらに備え、
前記多値化手段は、前記平滑化手段により平滑化された文字領域をm値化画像に変換することを特徴とする請求項1記載の画像処理装置。
Further comprising a smoothing means for performing a smoothing process on the character region using a smoothing filter,
The image processing apparatus according to claim 1, wherein the multi-value conversion unit converts the character region smoothed by the smoothing unit into an m-valued image.
前記文字領域に対し、エッジ抽出フィルタを用いてエッジ抽出処理を行うエッジ抽出手段をさらに備え、
前記多値化手段は、前記エッジ抽出手段によりエッジ抽出された文字領域をm値化画像に変換することを特徴とする請求項1記載の画像処理装置。
The character area further comprises edge extraction means for performing an edge extraction process using an edge extraction filter,
The image processing apparatus according to claim 1, wherein the multi-value conversion unit converts the character region extracted by the edge extraction unit into an m-valued image.
JP2003298713A 2003-08-22 2003-08-22 Image processing apparatus Withdrawn JP2005072858A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003298713A JP2005072858A (en) 2003-08-22 2003-08-22 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003298713A JP2005072858A (en) 2003-08-22 2003-08-22 Image processing apparatus

Publications (1)

Publication Number Publication Date
JP2005072858A true JP2005072858A (en) 2005-03-17

Family

ID=34404137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003298713A Withdrawn JP2005072858A (en) 2003-08-22 2003-08-22 Image processing apparatus

Country Status (1)

Country Link
JP (1) JP2005072858A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141790A (en) * 2007-12-07 2009-06-25 Seiko Epson Corp Image processing program and image processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141790A (en) * 2007-12-07 2009-06-25 Seiko Epson Corp Image processing program and image processor

Similar Documents

Publication Publication Date Title
US6965695B2 (en) Method and system for processing character edge area data
JP2008017051A (en) Image processor, image processing method, and program
JPS62220072A (en) Processing method for halftone digital color image
JP2005094397A (en) Image forming device
US8004731B2 (en) Image forming apparatus
JP2007043394A (en) Apparatus and method for image processing, and program making computer implement same method
US8913298B2 (en) Image processing apparatus that sets a spatial frequency of a chromatic foreground image of a watermark to be lower than a spatial frequency of an achromatic foreground image of a comparable watermark, associated image forming apparatus, image processing method and recording medium
JP5020777B2 (en) Image processing apparatus, image processing method, and program
JP2005072858A (en) Image processing apparatus
JP5103074B2 (en) Image processing apparatus and image forming apparatus
US20120121122A1 (en) Image processing apparatus, image forming apparatus, recording medium and image processing method
JP2005079750A (en) Image forming apparatus
JP5593769B2 (en) Image processing apparatus and image processing method
JP4545165B2 (en) Image processing apparatus, image forming apparatus, line area specifying method, document type determining method, computer program, and recording medium
JP2005059444A (en) Color image forming device
JP2005072862A (en) Image forming apparatus
JP4101188B2 (en) Image processing apparatus, image processing method, and computer program
JP4930094B2 (en) Image forming apparatus and image forming method
JP2009065378A (en) Base region detecting method, image processor, image forming apparatus, computer program, and recording medium
JP6935708B2 (en) Image processing equipment, image forming equipment, and programs
JP2001036733A (en) Color image processor
JP2007115133A (en) Image processor, image former, image reader, image processing method and program
JP3355885B2 (en) Image processing device
JP4078268B2 (en) Image processing apparatus, image processing method, and computer program
JP2010109636A (en) Image processing apparatus, image forming apparatus, image processing method, computer program, and recording medium with the program recorded thereon

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061107