JP2003250046A - Image processing apparatus - Google Patents
Image processing apparatusInfo
- Publication number
- JP2003250046A JP2003250046A JP2002048635A JP2002048635A JP2003250046A JP 2003250046 A JP2003250046 A JP 2003250046A JP 2002048635 A JP2002048635 A JP 2002048635A JP 2002048635 A JP2002048635 A JP 2002048635A JP 2003250046 A JP2003250046 A JP 2003250046A
- Authority
- JP
- Japan
- Prior art keywords
- line
- density
- density value
- image
- background
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 85
- 238000009499 grossing Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 abstract description 40
- 238000000034 method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010034719 Personality change Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、文書清書、文書変
換、組み込み系画像処理機器等の画像処理装置に関し、
特に、地肌除去を行なう画像処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus such as document copy, document conversion, embedded image processing equipment,
In particular, the present invention relates to an image processing device that removes the background.
【0002】[0002]
【従来の技術】文書のディジタル化が進み、紙面に書か
れた文字情報を画像情報として保存することが多くなっ
た。しかしビットマップ等の画像情報では、容量が大き
くさらに文書の編集が困難なために、文字コードに変換
することが望まれてきた。そこで、文字画像を読み取っ
て文字コードに変換するOCR(Optical Character Rea
der :光学式読取装置) が利用される。正しくOCRに
文字コードを変換させるには、OCRで行なわれる二値
化処理で文字領域と背景領域を正しく分離することが必
要である。2. Description of the Related Art With the progress of digitization of documents, the character information written on paper is often stored as image information. However, since image information such as a bitmap has a large capacity and it is difficult to edit the document, it has been desired to convert it into a character code. Therefore, OCR (Optical Character Rea) that reads character images and converts them into character codes
der: optical reader) is used. In order to correctly convert the character code into OCR, it is necessary to correctly separate the character area and the background area by the binarization processing performed in OCR.
【0003】しかし、特に新聞などの全体的に背景の濃
度値が高い画像は、このOCRで行なわれる二値化処理
で正しく文字と背景画素に分離できないことがあり、そ
の結果OCR認識率は低下する。そのためOCRにかけ
る前に前段の処理として背景の濃度値が特に高い画像に
対しては、OCR認識率を向上させるために地肌除去を
行なう必要がある。However, an image having a high background density value, such as a newspaper, may not be correctly separated into characters and background pixels by the binarization process performed by the OCR, resulting in a lower OCR recognition rate. To do. Therefore, it is necessary to remove the background in order to improve the OCR recognition rate for an image having a particularly high density value of the background as a previous process before applying the OCR.
【0004】地肌除去をするアルゴリズムの従来手法と
して、特開平7−262348号公報の「画像処理にお
ける地肌色除去処理方法及び装置」、特許第28866
93号公報の「画像記憶装置の地肌除去方式」、特許第
3134292号公報の「画像処理装置」がある。これ
らの手法は、縦軸頻度、横軸濃度値の濃度ヒストグラム
を地肌除去処理の特徴量として用いている。As a conventional method of an algorithm for removing the background, Japanese Patent Laid-Open No. 7-262348, "Method and apparatus for removing background color in image processing", Japanese Patent No. 28866.
There is "Background Removal Method of Image Storage Device" in Japanese Patent No. 93, and "Image Processing Device" in Japanese Patent No. 3134292. These methods use the density histogram of the vertical axis frequency and the horizontal axis density value as the feature amount of the background removal processing.
【0005】図9(a)で示された一般的なOCR認識
率向上のための地肌除去装置は、紙面に書かれた文字情
報をディジタル化して読み取るスキャナ部901、スキ
ャナ部で取り込んだ画像情報や画像処理後の画像情報を
保存する画像記憶部902、入力された多値のディジタ
ル画像を二値化する信号処理部903で構成されてい
る。A general background removal apparatus for improving the OCR recognition rate shown in FIG. 9A is a scanner unit 901 that digitizes and reads character information written on a paper, and image information captured by the scanner unit. And an image storage unit 902 that stores image information after image processing, and a signal processing unit 903 that binarizes an input multivalued digital image.
【0006】また、図9の矢印は画像情報の流れを示し
ている。スキャナ部901で読み込んだ多値画像を、い
ったん画像記憶部902に保存する。次に、その取り込
んだ多値画像に対し、信号処理部903で背景の濃度値
を検出し地肌除去処理を行なう。この地肌除去処理の結
果、画像を再び画像記憶部902に保存する。画像記憶
部902に地肌除去処理後の画像を保存した後、OCR
904は、この信号処理部903で処理された画像を入
力として文字認識処理を行なう。OCR104で単純閾
値によって二値化するので、文字領域の濃度値をほとん
ど変えず、背景領域の濃度値を低く地肌を除去した画像
を文字認識の対象画像としてOCR904に送る。Arrows in FIG. 9 show the flow of image information. The multi-valued image read by the scanner unit 901 is temporarily stored in the image storage unit 902. Then, the signal processing unit 903 detects the density value of the background and performs background removal processing on the captured multi-valued image. As a result of this background removal process, the image is stored again in the image storage unit 902. After storing the image after the background removal processing in the image storage unit 902, the OCR is performed.
904 receives the image processed by the signal processing unit 903 as input and performs character recognition processing. Since binarization is performed by the OCR 104 using a simple threshold value, the density value of the character area is hardly changed, and the background area of which the density value is low and the background is removed is sent to the OCR 904 as a character recognition target image.
【0007】また、リアルタイム性が要求される組み込
み系の画像処理機器では、画像処理速度を追及したアル
ゴリズムと、使用メモリ量の削減が要求される。 画像情
報をいったん画像メモリに蓄積した後、逐次処理を行な
っていくのではく、画像を走査する回数をできるだけ減
らしかつ、1ラインの情報を保存することができるFI
FOを何ライン分かの情報を記憶するために用いて地肌
除去することにも対応したアルゴリズムが望まれてい
る。[0007] In addition, in an embedded image processing apparatus that requires real-time processing, it is required to reduce the amount of memory used and an algorithm that pursues image processing speed. It is possible to reduce the number of times of scanning an image as much as possible and store the information of one line without storing the image information in the image memory and then performing the sequential processing.
There is a demand for an algorithm that is compatible with removing the background by using FO to store information for several lines.
【0008】一般的な組み込み系リアルタイム画像処理
機器のための地肌除去装置の構成を図9(b)に示す。
図9(a)との違いは、画像読み取り部905から入力
された画像データに対し、1画素または1ラインごとに
信号処理部903で処理を行なっていくことと、膨大な
画像記憶部902のかわりに1ライン分の画像データを
記憶できる1ライン分の画像記憶FIFO906を用い
て画像データや特徴量を記憶して、信号処理部903が
画像処理を行ない、画像出力部907に処理後の画像デ
ータを出力することである。FIG. 9B shows the structure of a background removing apparatus for a general built-in real-time image processing apparatus.
The difference from FIG. 9A is that the image data input from the image reading unit 905 is processed by the signal processing unit 903 on a pixel-by-pixel basis or a line-by-line basis. Instead, the image data and the feature amount are stored by using the image storage FIFO 906 for one line capable of storing the image data for one line, the signal processing unit 903 performs the image processing, and the image output unit 907 processes the processed image. Outputting data.
【0009】[0009]
【発明が解決しようとする課題】しかしながらOCRで
文字認識が望まれるようになり、認識率が向上するよう
な地肌除去アルゴリズムが望まれている。本発明は上記
事情に鑑みてなされたものであり、リアルタイム画像処
理実現可能なアルゴリズムと処理に用いる記憶メモリ量
を減らすことができる画像処理装置を提供することを目
的とする。However, since character recognition is desired in OCR, a background removal algorithm that improves the recognition rate is desired. The present invention has been made in view of the above circumstances, and an object thereof is to provide an algorithm capable of realizing real-time image processing and an image processing apparatus capable of reducing the amount of storage memory used for processing.
【0010】また、入力画像から1ラインごとの出現頻
度が最大の濃度ヒストグラムを求めることによって、効
率的に背景の濃度値を特定し、その背景の濃度値を除去
することを1ライン分のFIFOを用いることができる
画像処理装置を提供することを目的とする。Further, by obtaining a density histogram having the maximum appearance frequency for each line from the input image, it is possible to efficiently specify the density value of the background and remove the density value of the background by using the FIFO for one line. It is an object of the present invention to provide an image processing device that can use the.
【0011】さらに、1ラインごとの出現頻度が、最大
の濃度ヒストグラムを平滑化することによって画像全体
に対し地肌除去を行なった処理後の画像に対し、背景の
濃度値が入力画像の濃度値を反映しかつ均一になるよう
にすることを数ライン分のFIFOを用いることができ
る画像処理装置を提供することを目的とする。Further, the background density value is the density value of the input image for the processed image in which the background is removed by smoothing the density histogram having the maximum appearance frequency for each line. It is an object of the present invention to provide an image processing apparatus capable of using a FIFO for several lines so as to reflect and make uniform.
【0012】さらに、1ラインごとの出現頻度が、最大
の濃度ヒストグラムを求める前に濃度値を正規化するこ
とによって、全体的に濃度値が高い画像は特に中間の濃
度値の画素を高くし、その後の処理に対し背景の濃度値
の特定を容易にし、効率的に地肌除去することを1ライ
ン分のFIFOを用いることができる画像処理装置を提
供することを目的とする。Further, by normalizing the density value before obtaining the density histogram in which the appearance frequency of each line is the maximum, an image having a high density value as a whole has pixels of an intermediate density value increased, An object of the present invention is to provide an image processing apparatus that can use a FIFO for one line to easily identify a background density value for subsequent processing and efficiently remove the background.
【0013】さらに、1ラインごとの出現頻度が、最大
の濃度ヒストグラムと入力画像の濃度値の情報を用い、
地肌を除去するための濃度変換式を換えることによっ
て、出力画像は文字画素に対して濃度値の変化を少な
く、背景画素に対し地肌除去の影響が高くなることを1
ライン分のFIFOを用いることができる画像処理装置
を提供することを目的とする。Further, by using the density histogram having the maximum appearance frequency for each line and the density value of the input image,
By changing the density conversion formula for removing the background, the output image has a small change in the density value with respect to the character pixels, and the effect of removing the background with respect to the background pixels is high.
It is an object of the present invention to provide an image processing device that can use a line FIFO.
【0014】[0014]
【課題を解決するための手段】かかる目的を達成するた
めに、請求項1記載の画像処理装置は、文字情報をディ
ジタル化して取り込む画像入力部と、画像処理演算を行
なう画像信号処理部と、処理結果を格納する記憶部を持
つシステムにおいて、主走査方向に1ラインごとの濃度
ヒストグラムを作成する手段と、主走査方向に1ライン
ごとの出現頻度が最大の濃度値を探索する手段と、主走
査方向に1ラインごとの出現頻度が最大の濃度値情報を
もとに画像の濃度値を変換する手段とを有することを特
徴としている。In order to achieve the above object, an image processing apparatus according to a first aspect of the present invention comprises an image input section for digitizing and capturing character information, an image signal processing section for performing image processing calculation, and In a system having a storage unit for storing the processing result, a means for creating a density histogram for each line in the main scanning direction, a means for searching for a density value having the maximum appearance frequency for each line in the main scanning direction, And a means for converting the density value of the image based on the density value information having the maximum appearance frequency for each line in the scanning direction.
【0015】また、請求項2記載の発明は請求項1記載
の発明において、主走査方向に1ラインごとの出現頻度
が最大の濃度値を求める手段によって得られる数ライン
分の1ラインごとの出現頻度が最大の濃度値に対し、平
滑化を行なう手段を有することを特徴としている。According to a second aspect of the present invention, in the first aspect of the present invention, the appearance for each line for several lines obtained by the means for obtaining the density value having the maximum appearance frequency for each line in the main scanning direction. It is characterized in that it has means for smoothing the density value having the maximum frequency.
【0016】さらに、請求項3記載の発明は請求項1記
載の発明において、主走査方向に1ラインごとの出現頻
度が最大の濃度値を求める手段の前に濃度値の正規化を
する手段を有することを特徴としている。Further, in the invention according to claim 3, in the invention according to claim 1, means for normalizing the density value is provided before the means for obtaining the density value having the maximum appearance frequency for each line in the main scanning direction. It is characterized by having.
【0017】なお、請求項4記載の発明は請求項1記載
の発明において、主走査方向に1ラインごとの出現頻度
が最大の濃度値情報をもとに画像の濃度値を変換する手
段に対し、濃度の情報を用いて変換する手段を換える手
段を有することを特徴としている。According to the invention of claim 4, in the invention of claim 1, the means for converting the density value of the image based on the density value information having the maximum appearance frequency for each line in the main scanning direction It is characterized in that it has means for changing the means for converting using the density information.
【0018】[0018]
【発明の実施の形態】図1に図9の信号処理部903で
行なう請求項1記載の地肌除去処理の流れを示す。 図1
の処理順に入力する多値文書画像101に対し、主走査
方向のライン単位で、濃度ヒストグラムの作成(ステッ
プS103)を行ない、この濃度ヒストグラムより1ラ
インごとの出現頻度が最大の濃度値の探索(ステップS
104)を行ない、このラインごとの最大頻度の濃度情
報をもとにそのラインに分布する画素に対し1ラインの
濃度変換式による地肌除去(ステップS105)を行な
う。全主走査方向で前記の処理を行なって、地肌が除去
された文書画像102を出力する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 shows a flow of background removal processing according to claim 1 performed by a signal processing unit 903 of FIG. Figure 1
The density histogram is created for each line in the main scanning direction for the multi-valued document image 101 to be input in the processing order (step S103), and the density value with the highest appearance frequency for each line is searched from this density histogram ( Step S
104) is performed, and based on the density information of the maximum frequency for each line, the background distribution is removed for the pixels distributed in that line by the density conversion formula of one line (step S105). The above-described processing is performed in all main scanning directions to output the document image 102 from which the background is removed.
【0019】まず、多値文書画像101に対し、主走査
方向に1ライン分濃度値を探索し、濃度ヒストグラムの
作成(ステップS103)を行なって1ライン分の濃度
ヒストグラムを作成する。 これにより主走査方向の1ラ
インの濃度分布情報として保存しておく。First, the multi-valued document image 101 is searched for density values for one line in the main scanning direction, and a density histogram is created (step S103) to create a density histogram for one line. Thereby, the density distribution information of one line in the main scanning direction is stored.
【0020】次に、主走査1ラインの濃度ヒストグラム
に対し、1ラインごとの出現頻度が最大の濃度値探索
(ステップS104)を行なう。 濃度ヒストグラムの作
成(ステップS103)で求めた主走査1ラインの濃度
ヒストグラムを探索し、1ラインの出現頻度が最大の濃
度値を保存する。この値を次処理の濃度変換式に用い
る。 1ラインの出現頻度が最大の濃度値を保存したら、
1ラインの濃度変換式による地肌除去(ステップS10
5)を行ない、地肌を除去する。 1ラインの出現頻度が
最大の濃度値と、この処理の前に全主走査方向での画像
全体での最小濃度値を探索しておき、この2つの値を用
いて入力画像の注目画素の濃度値を変換式に用いて変換
する。 1主走査方向に属する画素に対し、そのラインの
出現頻度が最大の濃度値を全主走査方向の1ラインごと
の出現頻度が最大の濃度値と画像全体での最小濃度値を
用いて、その1ラインに対し濃度値変換を行ない地肌除
去する。 ラインごとで濃度値変換処理が終れば次のライ
ンに対し再び、1ラインごとの濃度ヒストグラムの作成
(ステップS103)、1ラインごとの出現頻度が最大
の濃度値の探索(ステップS104)、1ラインの濃度
変換式による地肌除去(ステップS105)を行なって
いく。全ライン処理をし終えたら、地肌除去処理を終了
して処理後の画像を出力する。文字領域の画素は処理前
から濃度値が低いのであまり濃度値の変化がないが、背
景領域の画素は変換式によって濃度値が低くなる。Next, the density histogram of one line in the main scanning is searched for the density value with the maximum appearance frequency for each line (step S104). The density histogram of one line in the main scan obtained in the creation of the density histogram (step S103) is searched for, and the density value with the maximum appearance frequency of one line is stored. This value is used in the density conversion formula of the next process. If you save the density value with the maximum appearance frequency of one line,
Background removal by one-line density conversion formula (step S10
Perform 5) to remove the background. The density value with the highest appearance frequency of one line and the minimum density value of the entire image in all main scanning directions are searched before this process, and the density of the pixel of interest of the input image is used by using these two values. Convert using the value in the conversion formula. For pixels belonging to one main scanning direction, the density value with the highest appearance frequency of the line is used, and the density value with the highest appearance frequency for each line in all the main scanning directions and the minimum density value for the entire image are used. The density value is converted for one line to remove the background. When the density value conversion processing is completed for each line, a density histogram for each line is created again for the next line (step S103), and a density value with the highest appearance frequency for each line is searched (step S104), one line. The background removal is performed by the density conversion formula (step S105). When all line processing is completed, the background removal processing is completed and the processed image is output. Since the density value of the pixel in the character area is low before the processing, the density value does not change so much, but the density value of the pixel in the background area becomes low by the conversion formula.
【0021】図2に地肌除去を行なう前の文書画像と地
肌除去を行なった画像の例を示す。図2はスキャナで読
み取った新聞の1部を切り抜いた画像で、上図(a)で
は新聞はもともと背景の濃度値が高い。それに対し図2
の下図(b)では効果的に背景の濃度値が低く変換され
も字領域はあまり変化していない。FIG. 2 shows an example of a document image before background removal and an image after background removal. FIG. 2 is an image obtained by cutting out a part of a newspaper read by a scanner. In the upper part (a), the newspaper originally has a high density value in the background. In contrast, Figure 2
In the lower diagram (b), the character area does not change much even if the background density value is effectively converted to a low value.
【0022】図3に図2(a)、(b)の画像の濃度ヒ
ストグラムを示す。 この両方のヒストグラムを見ても明
らかであるが、(a)で中間の濃度値100辺りに背景
として多く分布している画素が、(b)では濃度値25
辺りにシフトしている。 また、(a)の濃度値150以
上の画素に対しては(b)ではほとんど濃度値の変化が
見られない。FIG. 3 shows a density histogram of the images of FIGS. 2 (a) and 2 (b). As is clear from both of these histograms, in (a), the number of pixels having a large distribution around the intermediate density value of 100 as the background is 25%.
It is shifting around. Further, for the pixels having a density value of 150 or more in (a), there is almost no change in the density value in (b).
【0023】図4に図9の信号処理部903で行なう請
求項2記載の地肌除去処理の流れを示す。 図4では処理
順に入力する多値文書画像101に対し、濃度ヒストグ
ラムの作成(ステップS103)を行ない、その濃度ヒ
ストグラム情報をもとに1ラインごとの出現頻度が最大
の濃度値の探索(ステップS104)を行なう。ここ
で、このラインごとの出現頻度が、最大の濃度値を次処
理の平滑化に用いるライン分探索できたか調べ、まだ保
存できていない場合、今までのラインの画像データをF
IFOに保存し、次のラインを探索する。 平滑化に用い
るライン分探索できたか調べ保存できた場合、その数ラ
イン分の1ラインごとの出現頻度が最大の濃度値をもと
に、ラインでの出現頻度最大の濃度値の平滑化をする。
平滑化された1ラインごとの出現頻度が、最大の濃度値
情報をもとにそのラインに分布する画素に対し濃度変換
式による地肌除去105を行ない地肌が除去された文書
画像102を出力する。FIG. 4 shows a flow of background removal processing according to claim 2 performed by the signal processing unit 903 of FIG. In FIG. 4, a density histogram is created (step S103) for the multi-valued document image 101 to be input in the processing order, and based on the density histogram information, a density value having the maximum appearance frequency for each line is searched (step S104). ). Here, it is checked whether or not the appearance frequency of each line can search the maximum density value for the line used for smoothing in the next process. If it has not been saved yet, the image data of the line so far is F
Save to IFO and search for next line. When the line part used for smoothing can be searched and saved, the density value having the maximum appearance frequency in the line is smoothed based on the density value having the maximum appearance frequency for each one of the several lines. .
Based on the maximum density value information, the smoothed appearance frequency of each line is subjected to the background removal 105 by the density conversion formula for the pixels distributed in the line, and the document image 102 from which the background is removed is output.
【0024】まず、多値文書画101に対し、主走査方
向に1ライン分濃度値を探索し、濃度ヒストグラムの作
成(ステップS103)を行なって、1ライン分の濃度
ヒストグラムを作成する。 これにより主走査方向の1ラ
インの濃度分布情報として保存しておく。 次に、主走査
1ラインの濃度ヒストグラムに対し、1ラインごとの出
現頻度が最大の濃度値の探索(ステップS104)を行
なう。 濃度ヒストグラムの作成(ステップS103)で
求めた主走査1ラインの濃度ヒストグラムを探索し、1
ラインの出現頻度が最大の濃度値を保存する。ここで、
この1ラインの出現頻度が最大の濃度値を平滑化するた
めに数ライン分の出現頻度が最大の濃度値情報を必要す
るので、数ライン分の情報が保存されているかどうか調
べる。 まだ保存されていない場合、次の主走査を探索
し、濃度ヒストグラムの作成(ステップS103)を行
なってそのラインの出現頻度が最大の濃度値を求める。
この濃度ヒストグラムの作成(ステップS103)を繰
り返し行ない平滑化に必要な数ライン分の出現頻度が最
大の濃度値情報が保存できたら、その数ライン分の出現
頻度が最大の濃度値情報を用いて、ラインでの出現頻度
最大の濃度値の平滑化(ステップS201)を行なう。First, the multi-valued document image 101 is searched for a density value for one line in the main scanning direction, and a density histogram is created (step S103) to create a density histogram for one line. Thereby, the density distribution information of one line in the main scanning direction is stored. Then, the density histogram of one line in the main scanning is searched for the density value having the highest appearance frequency for each line (step S104). The density histogram of one main scanning line obtained in the density histogram creation (step S103) is searched for, and 1
The density value with the highest line appearance frequency is saved. here,
Since the density value information with the maximum appearance frequency for several lines is required to smooth the density value with the maximum appearance frequency of one line, it is checked whether or not the information for several lines is stored. If not stored yet, the next main scan is searched for, and a density histogram is created (step S103) to find the density value with the highest appearance frequency of the line.
This density histogram is repeatedly created (step S103), and if the density value information with the maximum appearance frequency for several lines necessary for smoothing can be saved, the density value information with the maximum appearance frequency for several lines is used. , The density value with the maximum appearance frequency on the line is smoothed (step S201).
【0025】具体的には、図5に示したように、注目し
ている頻度量aに対し、近傍の平均値を取って平滑化す
る。 図5のように3近傍で平滑化する場合、前後の頻度
値がそれぞれbとcであるならば、注目している頻度量
aを(b+c)/2と平均をとった値に、注目している
頻度量aを置き換える出現頻度の最大濃度値の平滑化処
理を行なう。 ラインでの出現頻度最大の濃度値の平滑化
(ステップS201)を終えたら最後に、1ラインの濃
度変換式による地肌除去(ステップS105)を行な
い、地肌を除去する。 1ラインの出現頻度が最大の濃度
値とこの処理の前に全主走査方向での画像全体での最小
濃度値を探索しておき、この2つの値を用いて入力画像
の注目画素の濃度値を変換式に用いて変換する。 1主走
査方向に属する画素に対し、そのラインの出現頻度が最
大の濃度値を全主走査方向の1ラインごとの出現頻度が
最大の濃度値と画像全体での最小濃度値を用いて、その
1ラインに対し濃度値変換を行ない地肌除去する。 ライ
ンごとで濃度値変換処理が終れば次のラインに対し再
び、1ラインごとの濃度ヒストグラムの作成(ステップ
S103)、1ラインごとの出現頻度が最大の濃度値の
探索(ステップS104)、1ラインの濃度変換式によ
る地肌除去(ステップS105)を行なっていく。全ラ
イン処理をし終えたら、地肌除去処理を終了して処理後
の画像を出力する。文字領域の画素は処理前から濃度値
が低いのであまり濃度値の変化がないが、背景領域の画
素は変換式によって濃度値が低くなる。Specifically, as shown in FIG. 5, the frequency value a of interest is smoothed by taking the average value of its neighborhood. In the case of smoothing in the vicinity of 3 as shown in FIG. 5, if the frequency values before and after are b and c, respectively, pay attention to the value obtained by averaging the frequency amount a of interest (b + c) / 2. The smoothing process of the maximum density value of the appearance frequency that replaces the existing frequency amount a is performed. After the smoothing of the density value having the maximum appearance frequency on the line (step S201) is finished, the background is removed by the density conversion formula for one line (step S105) to remove the background. The density value with the highest appearance frequency of one line and the minimum density value of the entire image in all main scanning directions are searched before this processing, and the density value of the target pixel of the input image is used by using these two values. Is converted into the conversion formula. For pixels belonging to one main scanning direction, the density value with the highest appearance frequency of the line is used, and the density value with the highest appearance frequency for each line in all the main scanning directions and the minimum density value for the entire image are used. The density value is converted for one line to remove the background. When the density value conversion processing is completed for each line, a density histogram for each line is created again for the next line (step S103), and a density value with the highest appearance frequency for each line is searched (step S104), one line. The background removal is performed by the density conversion formula (step S105). When all line processing is completed, the background removal processing is completed and the processed image is output. Since the density value of the pixel in the character area is low before the processing, the density value does not change so much, but the density value of the pixel in the background area decreases due to the conversion formula.
【0026】図6に平滑化処理無しと、ありの結果画像
を示す。 平滑化処理無し(a)では、1ラインごとで、
濃度変換式が最大頻度の濃度値によって大きく異なる場
合があるので画像の中央のように、不自然なエッジが生
じる場合がある。 それに対し、平滑化処理あり(b)で
は、ライン近傍の平均値を取っているのでそのラインだ
け大きく違う濃度変換式になることがないので主走査方
向に不自然なエッジが生じにくい。FIG. 6 shows a result image with and without smoothing processing. Without smoothing processing (a), for each line,
Since the density conversion formula may vary greatly depending on the density value of the maximum frequency, an unnatural edge may occur at the center of the image. On the other hand, in the smoothing process (b), since the average value in the vicinity of the line is taken, the density conversion formulas for the lines are not significantly different, and thus an unnatural edge is less likely to occur in the main scanning direction.
【0027】図7に図9の信号処理部903で行なう請
求項3記載の地肌除去処理の流れを示す。 図7の処理順
に入力する多値文書画像101に対し、濃度値の正規化
(ステップS701)を行ない、入力画像の最小濃度値
を0に正規化した後に、主走査方向のライン単位で、濃
度ヒストグラムの作成(ステップS103)を行ない、
この濃度ヒストグラムより1ラインごとの出現頻度が最
大の濃度値の探索(ステップS104)を行なう。さら
に、このラインごとの最大頻度の濃度情報をもとにその
ラインに分布する画素に対し1ラインの濃度変換式によ
る地肌除去(ステップS105)を行なう。全主走査方
向で前記の処理を行なって、地肌が除去された文書画像
102を出力する。FIG. 7 shows a flow of background removal processing according to claim 3 performed by the signal processing unit 903 of FIG. The density value is normalized (step S701) with respect to the multi-valued document image 101 input in the processing order of FIG. 7, the minimum density value of the input image is normalized to 0, and then the density is increased line by line in the main scanning direction. Create a histogram (step S103),
From this density histogram, the density value with the maximum appearance frequency for each line is searched (step S104). Further, based on the density information of the maximum frequency for each line, the background distribution is removed from the pixels distributed in that line by the density conversion formula of one line (step S105). The above-described processing is performed in all main scanning directions to output the document image 102 from which the background is removed.
【0028】入力画像は地肌の背景の濃度値が高くま
た、文字領域の濃度値もさらに低いので濃度ヒストグラ
ムは背景領域の濃度値と文字領域の濃度値の差が少なく
全体的な幅が狭い。 この濃度の範囲が狭いヒストグラム
に対し、主走査1ラインごとに濃度値の正規化(ステッ
プS701)を行なう。 正規化は注目画素の濃度値情報
を探索すればできるので画素ごとに行なう。 正規化式
は、正規化後の濃度値=(入力画像の最大階調値−( 正
規化前の明度値×入力画像の最大階調値)/入力画像の最
大明度値) で正規化を行ない、文字領域と背景領域の濃
度値の差を広げる。この後は、濃度のヒストグラムの作
成(ステップS103)、1ラインごとの出現頻度が最
大の濃度値の探索(ステップS104)、1ラインの濃
度変換式による地肌除去(ステップS105)を行なっ
て同様な地肌除去処理をする。Since the input image has a high background density value of the background and a lower density value of the character area, the density histogram has a small difference between the background area density value and the character area density value, and the overall width is narrow. The density value is normalized for each main scanning line for the histogram having a narrow density range (step S701). Since normalization can be performed by searching the density value information of the pixel of interest, it is performed for each pixel. The normalization formula is as follows: Normalized density value = (maximum gradation value of input image- (brightness value before normalization x maximum gradation value of input image) / maximum brightness value of input image) , Widen the difference in density between the text area and background area. After that, the density histogram is created (step S103), the density value having the highest appearance frequency for each line is searched (step S104), and the background is removed by the density conversion formula for one line (step S105). Perform background removal processing.
【0029】図8に図9の信号処理部903で行なう請
求項4記載の地肌除去処理の流れを示す。 図8の処理順
に入力する多値文書画像101に対し、主走査方向のラ
イン単位で、濃度ヒストグラムの作成(ステップS10
3)を行ない、この濃度ヒストグラムより1ラインごと
の出現頻度が最大の濃度値の探索(ステップS104)
を行ない、このラインごとの最大頻度の濃度情報をもと
にそのラインに分布する画素に対し1ラインの濃度変換
式による地肌除去(ステップS105)を行なう。その
ラインに分布する画素に対し、注目する画素の濃度値に
よって濃度変換式をa、またはbと換えて地肌除去を行
なう。全主走査方向で前記の処理を行なって、地肌が除
去された文書画像102を出力する。FIG. 8 shows a flow of background removal processing according to claim 4 performed by the signal processing unit 903 of FIG. With respect to the multi-valued document image 101 input in the processing order of FIG. 8, a density histogram is created for each line in the main scanning direction (step S10).
3) is performed, and the density value having the maximum appearance frequency for each line is searched from this density histogram (step S104).
Based on the density information of the maximum frequency for each line, the background distribution is removed from the pixels distributed in that line by the density conversion formula of one line (step S105). For the pixels distributed in that line, the density conversion formula is changed to a or b depending on the density value of the pixel of interest to remove the background. The above-described processing is performed in all main scanning directions to output the document image 102 from which the background is removed.
【0030】まず、多値文書画像101に対し、主走査
方向に1ライン分濃度値を探索し、濃度ヒストグラムの
作成(ステップS103)を行なって1ライン分の濃度
ヒストグラムを作成する。 これにより主走査方向の1ラ
インの濃度分布情報として保存しておく。 これは、その
主走査1ラインに分布する画素領域に対する濃度変換の
情報として用いる。First, the multi-valued document image 101 is searched for a density value for one line in the main scanning direction, and a density histogram is created (step S103) to create a density histogram for one line. Thereby, the density distribution information of one line in the main scanning direction is stored. This is used as information of density conversion for pixel regions distributed in one main scanning line.
【0031】次に、主走査1ラインの濃度ヒストグラム
に対し、1ラインごとの出現頻度が最大の濃度値の探索
(ステップS104)を行なう。 濃度ヒストグラムの作
成(ステップS103)で求めた主走査1ラインの濃度
ヒストグラムを探索し、1ラインの出現頻度が最大の濃
度値を保存する。この値を次処理の濃度変換式に用い
る。 主走査方向に1ラインの出現頻度が最大の濃度値を
保存したら、注目している画素の濃度値ごとに濃度変換
の式を換え濃度値変換式による地肌除去(ステップS8
01、S802)を行ない、地肌を除去する。 文書画像
は背景領域の方が多く分布するので、1ラインごとの出
現頻度が最大の濃度値をそのラインの背景の濃度値と仮
定してこの値を閾値として大小関係で濃度値が低い場合
文字領域用の濃度値変換式a、濃度値が高い場合背景領
域用の濃度値変換式bに分けて処理を行なっていく。 1
ラインの出現頻度が最大の濃度値とこの処理の前に全主
走査方向での画像全体での最小濃度値を探索しておき、
この2つの値を用いて入力画像の注目画素の濃度値を変
換式に用いて変換する。 1主走査方向に属する画素に対
し、そのラインの出現頻度が最大の濃度値を全主走査方
向の1ラインごとの出現頻度が最大の濃度値と画像全体
での最小濃度値を用いて、その1ラインに対し濃度値変
換を行ない地肌除去する。 ラインごとで濃度値変換処理
が終れば次のラインに対し再び、1ラインごとの濃度ヒ
ストグラムの作成(ステップS103)、1ラインごと
の出現頻度が最大の濃度値の探索(ステップS10
4)、1ラインの濃度変換式による地肌除去(ステップ
S105)を行なっていく。全ライン処理をし終えた
ら、地肌除去処理を終了して処理後の画像を出力する。
文字領域の画素は処理前から濃度値が低く、かつ文字領
域用の濃度変換式aで濃度変換を行なうのであまり濃度
値の変化が少ないが、背景領域の画素は背景領域用の濃
度変換式bによって変換されるので変換前の濃度値より
さらに濃度値が低くなる。Next, the density histogram of one line in the main scanning is searched for the density value having the maximum appearance frequency for each line (step S104). The density histogram of one line in the main scan obtained in the creation of the density histogram (step S103) is searched for, and the density value with the maximum appearance frequency of one line is stored. This value is used in the density conversion formula of the next process. When the density value having the highest appearance frequency of one line in the main scanning direction is stored, the density conversion formula is changed for each density value of the pixel of interest, and the background removal by the density value conversion formula (step S8).
01, S802) to remove the background. Since the document image is more distributed in the background area, the density value with the highest appearance frequency for each line is assumed to be the background density value of that line, and this value is used as a threshold to determine whether the density value is low. The density value conversion equation a for the area and the density value conversion equation b for the background area when the density value is high are separately processed. 1
The density value with the maximum line appearance frequency and the minimum density value in the entire image in all main scanning directions are searched before this processing,
Using these two values, the density value of the pixel of interest of the input image is used in the conversion formula for conversion. For pixels belonging to one main scanning direction, the density value with the highest appearance frequency of the line is used, and the density value with the highest appearance frequency for each line in all the main scanning directions and the minimum density value for the entire image are used. The density value is converted for one line to remove the background. When the density value conversion process is completed for each line, the density histogram for each line is created again for the next line (step S103), and the density value with the highest appearance frequency for each line is searched (step S10).
4) The background removal is performed by the density conversion formula for one line (step S105). When all line processing is completed, the background removal processing is completed and the processed image is output.
Pixels in the character area have a low density value before processing, and since density conversion is performed using the density conversion equation a for the character area, the density value changes little, but the pixels in the background area do Since it is converted by, the density value becomes lower than the density value before conversion.
【0032】上記の実施形態によれば、本発明の地肌除
去アルゴリズムは、縦軸主走査1ラインの最大頻度の濃
度値、横軸副走査のライン数のヒストグラムを地肌除去
の特徴量とし、主走査1ラインごとに濃度変換式を用い
て、特徴量にあわせて地肌を除去する。さらに、従来手
法のように画像全体の情報を一度走査しなくてもライン
単位で処理することが可能である。また、地肌濃度が一
様でない場合でも、局所的な情報のみを用いているので
全体の濃度情報に左右されることはなく、局所的な領域
でその領域にあった地肌除去を行なうことが可能であ
る。なお、このような背景の濃度値が高い文書画像から
文字情報を読み取る際も、文字領域と背景領域の濃度値
の差が高い画像の方がはっきりしているので読み取りや
すい。According to the above-described embodiment, the background removal algorithm of the present invention uses the density value of the maximum frequency of one line on the vertical axis main scanning and the histogram of the number of lines on the horizontal axis sub-scanning as the feature amount of background removal, The density conversion formula is used for each scanning line to remove the background according to the feature amount. Furthermore, it is possible to process the information of the entire image line by line without scanning once as in the conventional method. Also, even if the background density is not uniform, only the local information is used, so it is not affected by the overall density information, and the background can be removed in a local area. Is. Even when reading character information from a document image having a high background density value, an image having a high difference in density value between the character area and the background area is clearer and easier to read.
【0033】[0033]
【発明の効果】請求項1記載の発明によれば、1ライン
ごとの出現頻度が最大の濃度ヒストグラムを用いること
によって入力画像の背景の濃度値を特定できるので、そ
の情報をもとに背景の濃度値を低く変換することができ
る。さらに、1ラインごとで処理を行なうことが可能な
ので、画像処理に用いる使用メモリ量が削減する。According to the invention described in claim 1, since the density value of the background of the input image can be specified by using the density histogram having the maximum appearance frequency for each line, the background value of the background can be specified based on the information. The density value can be converted to a low value. Furthermore, since it is possible to perform processing line by line, the amount of memory used for image processing is reduced.
【0034】請求項2記載の発明によれば、1ラインご
との出現頻度が最大の濃度ヒストグラムを平滑化するこ
とによって、近傍領域の差が平滑化されるので、出力画
像の地肌が除去された画像は近傍の濃度値の差が少なく
なり、不自然なエッジが生じにくくなる。また、濃度変
換式によって背景の濃度値が低くなり地肌除去される。
さらに、数ラインごとで処理を行なうことが可能なの
で、画像処理に用いる使用メモリ量が削減する。According to the second aspect of the present invention, the density histogram having the maximum appearance frequency for each line is smoothed to smooth the difference between the neighboring areas, so that the background of the output image is removed. In the image, the difference between the density values in the vicinity is small, and an unnatural edge is less likely to occur. Further, the density conversion formula lowers the density value of the background and removes the background.
Furthermore, since it is possible to perform processing every few lines, the amount of memory used for image processing is reduced.
【0035】請求項3記載の発明によれば、最初に入力
画像の最小濃度値を階調の最小濃度値に正規化すること
によって、最小濃度値が原点に近づくので背景の濃度値
が高い画像で効果的に背景の濃度値を低く設定できるの
で出力画像の地肌が除去される。さらに、1ラインごと
で処理を行なうことが可能なので、画像処理に用いる使
用メモリ量が削減する。According to the third aspect of the present invention, by first normalizing the minimum density value of the input image to the minimum density value of the gradation, the minimum density value approaches the origin, so that an image with a high background density value. Since the background density value can be effectively set to a low level, the background of the output image is removed. Furthermore, since it is possible to perform processing line by line, the amount of memory used for image processing is reduced.
【0036】請求項4記載の発明によれば、1ラインご
との出現頻度が最大の濃度ヒストグラムと、入力画像の
濃度値の情報を用いて濃度変換式を換えることによっ
て、背景の濃度値を低く、文字の濃度は変化が少なく濃
度変換できるので、出力画像の地肌が除去されかつ文字
の濃度は入力画像と変わらない画像を出力することがで
きる。さらに、1ラインごとで処理を行なうことが可能
なので、画像処理に用いる使用メモリ量が削減する。According to the fourth aspect of the present invention, the background density value is lowered by changing the density conversion equation using the density histogram having the maximum appearance frequency for each line and the information of the density value of the input image. Since the density of the character changes little and the density can be converted, it is possible to output the image in which the background of the output image is removed and the density of the character is the same as the input image. Furthermore, since it is possible to perform processing line by line, the amount of memory used for image processing is reduced.
【図1】本発明の請求項1記載の地肌除去処理を示すフ
ローチャートである。FIG. 1 is a flowchart showing a background removal process according to claim 1 of the present invention.
【図2】本発明の地肌除去を行なう前の文書画像と地肌
除去を行なった画像を示す図である。FIG. 2 is a diagram showing a document image before background removal according to the present invention and an image after background removal.
【図3】本発明の図3(a)、(b)の画像の濃度ヒス
トグラム示すグラフである。FIG. 3 is a graph showing a density histogram of the images of FIGS. 3 (a) and 3 (b) according to the present invention.
【図4】本発明の請求項2記載の地肌除去処理を示すフ
ローチャートである。FIG. 4 is a flowchart showing a background removal process according to claim 2 of the present invention.
【図5】本発明の1 ラインごとの出現頻度が最大の濃度
値の一部を示した図である。FIG. 5 is a diagram showing a part of the density values having the maximum appearance frequency for each line according to the present invention.
【図6】本発明の平滑化処理の有無の比較を示す図であ
る。FIG. 6 is a diagram showing comparison of the presence or absence of smoothing processing of the present invention.
【図7】本発明の請求項3 記載の地肌除去処理を示すフ
ローチャートである。FIG. 7 is a flowchart showing a background removal process according to claim 3 of the present invention.
【図8】本発明の請求項4 の地肌除去処理を示すフロー
チャートである。FIG. 8 is a flowchart showing a background removal process according to claim 4 of the present invention.
【図9】地肌除去処理装置の構成を示した図である。FIG. 9 is a diagram showing a configuration of a background removal processing device.
101 多値文書画像 102 地肌が除去された文書画像 103 1ラインごとの濃度ヒストグラムの作成 104 1ラインごとの出現頻度が最大の濃度値 105 1ラインの濃度変換ごと濃度変換式 101 Multi-valued document image 102 Document image with background removed 103 Creating a density histogram for each line 104 Density value with the highest appearance frequency per line 105 Concentration conversion formula for each one-line density conversion
Claims (4)
像入力部と、画像処理演算を行なう画像信号処理部と、
処理結果を格納する記憶部を有するシステムにおいて、
主走査方向に1ラインごとの濃度ヒストグラムを作成す
る手段と、前記主走査方向の1ラインごとに出現頻度が
最大の濃度値を探索する手段と、前記主走査方向の1ラ
インごとに出現頻度が最大の濃度値情報をもとに画像の
濃度値を変換する手段とを有することを特徴とする画像
処理装置。1. An image input section for digitizing and capturing character information, and an image signal processing section for performing image processing calculation,
In a system having a storage unit for storing processing results,
A means for creating a density histogram for each line in the main scanning direction, a means for searching for a density value having a maximum appearance frequency for each line in the main scanning direction, and an appearance frequency for each line in the main scanning direction An image processing apparatus comprising: means for converting a density value of an image based on maximum density value information.
度が最大の濃度値を求める手段によって得られる数ライ
ン分の1ラインごとの出現頻度が最大の濃度値に対し、
平滑化を行なう手段を有することを特徴とする請求項1
記載の画像処理装置。2. The density value having the maximum appearance frequency for several lines obtained by the means for obtaining the density value having the maximum appearance frequency for each line in the main scanning direction,
A means for performing smoothing is provided.
The image processing device described.
度が最大の濃度値を求める手段の前に濃度値の正規化を
する手段を有することを特徴とする請求項1記載の画像
処理装置。3. The image processing apparatus according to claim 1, further comprising a unit for normalizing the density value before the unit for obtaining the density value having the maximum appearance frequency for each line in the main scanning direction. .
度が最大の濃度値情報をもとに画像の濃度値を変換する
手段に対し、濃度の情報を用いて変換する手段を換える
手段を有することを特徴とする請求項1記載の画像処理
装置。4. A means for converting a density value of an image based on density value information having the maximum appearance frequency for each line in the main scanning direction, and a means for changing the means for converting the density value using the density information. The image processing apparatus according to claim 1, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002048635A JP2003250046A (en) | 2002-02-25 | 2002-02-25 | Image processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002048635A JP2003250046A (en) | 2002-02-25 | 2002-02-25 | Image processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003250046A true JP2003250046A (en) | 2003-09-05 |
Family
ID=28661376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002048635A Pending JP2003250046A (en) | 2002-02-25 | 2002-02-25 | Image processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003250046A (en) |
-
2002
- 2002-02-25 JP JP2002048635A patent/JP2003250046A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3768052B2 (en) | Color image processing method, color image processing apparatus, and recording medium therefor | |
JP4219542B2 (en) | Image processing apparatus, image processing method, and recording medium storing image processing program | |
US8200012B2 (en) | Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program | |
US8384964B2 (en) | Image processing apparatus and image processing method | |
JP4189506B2 (en) | Apparatus, method and recording medium for image processing | |
JP4261005B2 (en) | Region-based image binarization system | |
US7437002B2 (en) | Image recognition system utilizing an edge image and a binary image | |
EP1173003A2 (en) | Image processing method and image processing apparatus | |
JP3886727B2 (en) | Image processing device | |
JP4441300B2 (en) | Image processing apparatus, image processing method, image processing program, and recording medium storing the program | |
JP4132766B2 (en) | Image processing apparatus and method | |
JPH0879517A (en) | Method for identifying type of image | |
JP2003250046A (en) | Image processing apparatus | |
JP4035696B2 (en) | Line segment detection apparatus and image processing apparatus | |
JP2000022945A (en) | Image processor and image processing method | |
JP4742632B2 (en) | Image processing apparatus, image processing method, and program | |
JP2003244437A (en) | Image processor | |
Boiangiu et al. | Bitonal image creation for automatic content conversion | |
KR100537827B1 (en) | Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges | |
JPH11288453A (en) | Method and system for detecting skew angle and black boundary line of original image in scan environment for reproduction | |
JPH08221515A (en) | Image processor | |
KR100514734B1 (en) | Method and apparatus for improvement of digital image quality | |
JP3020293B2 (en) | Attribute determination method | |
JPH08315140A (en) | Image processor and its method | |
JPH05211607A (en) | Device and method for image processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050125 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080729 |