JP4049560B2 - 網点除去方法及びシステム - Google Patents

網点除去方法及びシステム Download PDF

Info

Publication number
JP4049560B2
JP4049560B2 JP2001253294A JP2001253294A JP4049560B2 JP 4049560 B2 JP4049560 B2 JP 4049560B2 JP 2001253294 A JP2001253294 A JP 2001253294A JP 2001253294 A JP2001253294 A JP 2001253294A JP 4049560 B2 JP4049560 B2 JP 4049560B2
Authority
JP
Japan
Prior art keywords
pattern
halftone dot
connection pattern
halftone
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001253294A
Other languages
English (en)
Other versions
JP2003067738A (ja
Inventor
敦子 小原
克仁 藤本
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001253294A priority Critical patent/JP4049560B2/ja
Priority to EP02251265A priority patent/EP1296283A3/en
Priority to US10/083,125 priority patent/US7130085B2/en
Priority to KR1020020010781A priority patent/KR20030017304A/ko
Priority to CNB021058032A priority patent/CN1207673C/zh
Publication of JP2003067738A publication Critical patent/JP2003067738A/ja
Application granted granted Critical
Publication of JP4049560B2 publication Critical patent/JP4049560B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/36Applying a local operator, i.e. means to operate on image points situated in the vicinity of a given point; Non-linear local filtering operations, e.g. median filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Nonlinear Science (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識装置などにおける、網点のある画像から正確に文字を抽出するための網点除去方法及びシステムに関する。
【0002】
【従来の技術】
以下の説明においては、文書の文字認識に関する説明をするが、一般に以下に記載する技術は、文書だけではなく、図面認識における文字認識などのように、広い意味での網点のある画像からの文字抽出を行う技術に関するものであって、網掛け文字から文字を抽出する技術に限定されない。
【0003】
近年、スキャナ等の入力機器の普及に伴って、画像を取り扱う機会が増加しており、それに伴って、文字認識装置(またはソフト)OCRの需要が増加している。
【0004】
以下に、従来技術における網点の除去方法について述べる。
従来法1)網点によって網掛けされた網点領域(以下同じ)を含む画像を文字認識する場合には、従来は網点領域として、パターンの密度の高い部分を検出し、その領域を網点領域とする。しかし、網点を含む領域の文字は正確に認識できないため、網点領域は文字認識対象外として文字認識は行われない。
従来法2)網点密度等により網点が存在すると判断された領域に対して、ある一定値以下のサイズを持つパターンを消去し、その結果を文字認識を行う。
【0005】
【発明が解決しようとする課題】
従来法1においては、文字認識を全く行うことができない。また、従来法2においては、一定サイズのパターンを消去しているため、網点のサイズに変動があった場合には網点を除去することができない。また、網点どうしが接触し、縦横サイズが大きくなった場合には網点を除去することができない。また、網点を除去できた場合にも、網点に文字が接触することによりおこる、文字の変形により正確に文字認識ができない。そのため、従来法においては、予め設定されている閾値が、対象の網点サイズに適合し、網点の文字の接触による文字の変形が、文字認識に影響の無い場合に限り処理が可能となり、それ以外の場合には処理できないという問題があった。
【0006】
本発明の課題は、文字認識に適した文字を抽出することができる網点除去方法及びシステムを提供することである。
【0007】
【課題を解決するための手段】
本発明の網点除去方法は、網点により網掛けされた画像から網点による網掛けを取り除く網点除去方法であって、処理対象の領域の黒画素の連結パターンの密度から網掛け領域を特定する網掛け領域特定ステップと、該網掛け領域に含まれる黒画素の連結パターンのサイズの統計から所定のサイズ以下の連結パターンを取り除く連結パターン除去ステップとを備えることを特徴とする。
【0008】
本発明の網点除去システムは、網点により網掛けされた画像から網点による網掛けを取り除く網点除去システムであって、処理対象の領域の黒画素の連結パターンの密度から網掛け領域を特定する網掛け領域特定手段と、該網掛け領域に含まれる黒画素の連結パターンのサイズの統計から所定のサイズ以下の連結パターンを取り除く連結パターン除去手段とを備えることを特徴とする。
【0009】
本発明によれば、網点により網掛けされた領域にある文字などの有意の画像を、網点を効率的かつ有効に取り除くことによって、抽出することができる。従って、文字を抽出した場合には、より精度の良い文字認識結果を得ることができる。
【0010】
【発明の実施の形態】
本発明の実施形態においては、文書中からパターンの密度を用いて網点領域を検出し、網点除去、文字に接触した網点による突起の除去の順番で処理を行う。網点領域を抽出した後、網点領域内に存在するパターンの縦横サイズの平均値及び、標準偏差を算出する。網点領域の点パターンの数は、文字パターンと比較して極めて多いため、平均値、標準偏差の値は、点パターンの大きさ、及び、大きさのばらつきに影響を受ける。標準偏差が小さい場合には、点パターンの大きさのばらつきが小さく、大きさがほぼ一定しているとみなし、平均値に小さい値を加えたものを文字パターンと点パターンの大きさを分ける閾値として用い、標準偏差が大きい場合には、点パターンの大きさのばらつきが大きいとして、大きい値を平均値に加えたものを閾値として用いる。求められた閾値より小さいものを網点パターンとして除去を行う。
【0011】
または、網点領域と判定された領域内のすべてのパターンのサイズからヒストグラムをつくり、ヒストグラムの谷部分を閾値として設定し、閾値より小さいパターンを網点として除去することでも可能である。
【0012】
また、パターンの縦横サイズは大きい場合であっても、他の文字パターンと比較してパターンが細かったり、また黒画素が固まって存在せず、ばらけているような場合は、網点同士の接触した結果のノイズである。そのような網点を除去するために、個々のパターンの輪郭長/パターンの黒画素数がある一定以上の値をとる場合には、文字パターンではないと判断し、除去を行う。
【0013】
次に、文字に接触した網点による突起の除去を行う。網点を除去した文字パターンを二値画像から多値画像へ変換し、その画像に対してぼかし処理を行う。画像をぼかすことで細かい突起部分の変動を吸収し、その後、再度二値化を行うことで突起部分の除去を行う。
【0014】
または、除去された網点サイズから、除去する突起の幅、長さを算出し、それに従って、除去を行う。
例として、罫線による表構造を持つ文書中のセル内に網点を持つ場合を例示して示す。文書中から罫線で囲まれたセル領域を抽出することが可能で有れば、如何なる方法でもかまわないが、一例として文書から罫線を抽出し、罫線で4方を囲まれたセルを抽出する方法を示す。
【0015】
図1は、罫線による表構造を有する文書の例を示す図である。
同図では、表の中の「住所」と書かれている部分に網掛けがされており、この網掛けの中から「住所」という文字を抽出する必要がある。この場合、「住所」が含まれるセルを1つの処理単位として設定する。なお、ここでは、表構造の文書についてセルを1つの処理単位とするとしたが、表構造以外の文書では、任意の処理単位を決定して処理して良い。
【0016】
入力画像
入力する画像は、(極端な傾きのない)2値画像であるとする。ここで、「極端な傾きの無い」という要件は、表構造の文書において、表の存在とセルを特定することが容易であるようにするための要件であり、本実施形態の主な処理とは直接は関係がない。従って、一般に入力する画像は、単なる2値画像であってよい。
【0017】
連結パターン抽出
複数の枠が配置される位置の相対的な関係に依存することなく、各パターンに安定にピックアップするために、連結パターン抽出部では、8連結でつながっているパターンをラベリングにより抽出する(特願平7−203259号参照)。
マスク処理
マスク処理は画像から極端な斜め成分を省き、枠だけに存在する長い直線を抽出しやすくするために、縦横方向の成分の細線化を行う。直線成分候補を正確に抽出するために、処理は100dpi相当の低解像度画像を用いる(特願平7−203259号参照)。
【0018】
線分抽出
マスク処理画像に対して隣接投影値(隣接投影:ある行または列の投影値に、その周囲の行または列の投影値を足し合わせ、その値を投影値とする投影法。周囲を大局的にとらえることが可能である(特願平5−103257号参照)。縦横方向に関して、直線あるいは直線の一部を矩形近似して検出する。縦横両方向同様の処理を行う。本処理においては、マスク処理の結果画像を使用する。
【0019】
直線抽出
線分抽出部において抽出された矩形近似された線分のうち、近隣の線分同士を統合して長い直線を検出する。検出された直線は矩形近似を行う(特願平7−203259号参照)。
【0020】
セル抽出
前記の処理で罫線候補と判断されたものを用いて、セルの抽出を行う。直線で4方を囲まれた領域であるセルの抽出を行う方法は、如何なる方法でもかまわない(特願平7−203259号参照)。
【0021】
網点除去/網点による文字の突起除去
この処理が本実施形態の主な処理である。まず、セル抽出した後、セル毎に網点領域の判定、網点除去、網点による文字の突起除去を行う。このとき、連結パターンを抽出することで、個々のパターンのサイズ、個数を算出するが、連結パターンとして4連結でつながっている部分を抽出する。4連結でつながった部分を抽出することで、網点どうしが斜めに接触した場合であっても、まとめて1つのパターンとすることなく、別の網点であるとして認識できる。
【0022】
セル抽出した後、セル毎に網点領域を含むか否かの判定を行う。セル内に含まれる一定サイズ以下のパターン数の密度が一定以上の値である場合には、網点領域を含むセルと判断し、一定以下の場合には文字パターンのみのセル領域であると判断する。パターン数の密度は、(パターンの数/領域の面積)で演算する。
【0023】
網点を含むセルであると判断された場合には、セル毎に網点除去を行う。
まず、セル内に存在するパターンの縦横サイズの平均値及び、標準偏差を算出する。網点領域内の点パターンの数は文字パターンと比較して極めて多いため、平均値、標準偏差の値は、点パターンの大きさ、及び大きさのバラツキに影響を受ける。標準偏差が小さい場合には、点パターンの大きさのバラツキが小さく大きさがほぼ一定しているとみなし、網点の大きさは平均値からの変動が少ないものとして、平均値に小さい値を加えたものをも文字パターンと点パターンの大きさを分ける閾値とし、標準偏差が大きい場合には点パターンの大きさのばらつきは大きいとして、網点の大きさは平均値からの変動が大きい場合があるとし、大きい値を平均値に加えたものを閾値とする。閾値=平均値+標準偏差*αと書くことができ、αは一定値とする。求められた閾値より小さいサイズのパターンを網点パターンとして除去を行う。
【0024】
または、網点領域と判定された領域内のすべてのパターンのサイズからヒストグラムをつくり、ヒストグラムの谷部分を閾値として設定し、閾値より小さいパターンを網点として除去する方法でも可能である。ヒストグラムから閾値を求める方法としては、濃淡画像を二値化する際に用いられる大津の二値化の方式と同様な処理を行うことで可能となる。
【0025】
大津の二値化については以下の文献を参照されたい。
N. Otsu:" A Threshold selection methodfrom gray level histograms," IEEE trans. Systems, Man, and Cybernetics,Vol. 9, No. 1, pp.62-66,1979.
パターンの縦横サイズは、大きい場合であっても、文字パターンと比較してパターンが細かったり、また黒画素が固まって存在せず、ばらけているような場合は、網点どうしの接触した結果であり除去対象である。そのような網点を除去するために、個々のパターンの(輪郭長/パターンの黒画素数)がある一定以上の値をとる場合には、文字パターンではないと判断し除去を行う。(輪郭長/パターンの黒画素数)が大きいと言うことは、パターンの幅が狭いということと等しくなり、値が小さい場合には、パターンの幅が大きいことを示す。
【0026】
図2は、パターンの大きさと輪郭長の違いの例を示す図である。
左側のパターンと右側のパターンは同じ黒画素数(同じパターンの大きさ)で構成されている。しかし、黒画素が固まって存在する左図の方が右図より輪郭が短くなることが分かる。文字パターンの場合は、網点パターンと比較してパターンの幅が大きいため、(輪郭長/パターンの黒画素数)の値が大きくなり、判別を行うことが可能となる。また、輪郭長の代わりに、パターンの外接矩形の辺の長さを使用することも可能である。また、網点以外のノイズに関しても除去することが可能である。
【0027】
文字に接触した網点は、上記の網点除去では除去することができず、文字パターンは網点による突起によって変形している。そのままの画像を文字認識を行うと、文字の変形により認識率が低下する。そこで、突起の除去を行い、文字パターンを整形する。
【0028】
文字の突起は文字パターンの本来の形状と比較して小さい変動である。そのため、突起による変動を吸収することができる程度に画像をぼかすことで突起の除去を行う。まず、対象領域を二値画像から多値画像へ変換し、ガウシアンフィルタなどのぼかしフィルタをかけることで画像をぼかす処理を行う。その後、二値化処理を行うことで突起の無いパターンを得る。
【0029】
または、除去した網点サイズから、文字の突起の幅、長さを推測し、推測されたサイズの突起の除去を全て除去する処理を行う。
図3は、ガウンシアンフィルタの動作の概略を説明する図である。
【0030】
同図右に示されているような形の黒画素のパターンがあったとすると、ガウシアンフィルタは、パターンに含まれている各画素毎に、各画素の近傍にわたって、濃度の平均値を取り、この値を当該画素の値とする。したがって、パターンの周辺領域にある画素の値は、パターンの黒画素の値と白紙部分の画素値との平均となるので、値が小さくなり、黒よりも薄い、灰色となる。このような処理を繰り返すことにより、同図左に示されるように、パターンの内部は黒いが、周辺部が灰色にぼけた画像が得られる。
【0031】
このような処理を抽出すべき文字に施すことにより、文字の周辺に付いた突起の形状及び色がぼやかされる。従って、文字を再び2値化する場合に、突起が及ぼす影響を小さくすることができる。すなわち、綺麗な文字が2値化の結果得られることになる。
【0032】
文字認識
最後に、必要な場合には、セル毎に網点除去及び、網点による文字の突起除去を行った画像を対象に文字認識を行う。文字認識は、必ずしも本実施形態に必須の処理ではない。すなわち、文字認識を行わなくても、網点を除去し、綺麗な文字抽出ができた時点で、文字データとして格納しておけば、後に、印刷などをした場合にも、綺麗な文字が得られると言う効果があるからである。
【0033】
図4は、本実施形態と従来技術の網点除去能力の差を示す図である。
図4(a)は、原画像であり、「住」という文字に網掛けがなされている。これに、一定サイズ以下の小さい網点を除去する方法を採用した従来技術によって、網点を除去すると、図4(b)のようになる。図4(b)から明らかなように、網点が十分には除去されておらず、文字認識などを使用とする場合にも、必ずしも良い結果がえられないと予想される。これに対し、上記で説明した本実施形態によれば、「住」という文字の周りの網点が完全に除去されており、文字認識する場合にも良い結果が得られると予想される。
【0034】
図5は、本実施形態の処理の流れを示すフローチャートである。
まず、ステップS1において、入力画像を入力する。ステップS2において、入力画像から連結パターンを抽出する。そして、ステップS3でマスク処理し、ステップS4で、線分抽出、ステップS5において、直線抽出、ステップS6において、セル抽出を行う。そして、ステップS7において、処理対象セル選択を行う。処理対象セルが無いと判断された場合には、処理を終了する。
【0035】
処理対象セルが決定されると、ステップS8において、セル内連結パターンを抽出する。ここでは、4連結成分を抽出する。そして、ステップS9において、(連結パターンの内、一定以下のサイズを持つパターン数/セル面積)が一定閾値より大きいか否かを判定し、判断がNOである場合には、ステップS7に戻る。ステップS9の判断がYESの場合には、網点セルであると判断して、ステップS10に進む。
【0036】
ステップS10においては、連結パターンの縦横サイズの平均値、標準偏差の算出を行う。ステップS11においては、平均値+標準偏差*α(αは定数)より、小さいサイズのパターンを除去する。ここで、ステップS10においては、パターンのサイズから作られたヒストグラムの谷部分を閾値として設定し、それより小さいサイズのパターンを除去するようにしても良い。
【0037】
そして、ステップS12においては、連結パターンの輪郭長/パターンの黒画素数が一定値以上のパターンを除去する。ステップS11とステップS12の処理により、多くの網点が除去される。ステップS13においては、除去した網点サイズを突起サイズとしてもつ突起をパターンから除去する。これにより、文字パターンから突起が除去される。ただし、ステップS13においては、ぼかし処理及び、再2値化によって突起を除去するようにしてもよい。
【0038】
そして、ステップS14において文字認識を行い、ステップS15において、次のセルを選択し、未処理セルがある場合には、ステップS7に戻り、全てのセルが処理済みである場合には、処理を終了する。
【0039】
前述したように、ステップS14の文字認識処理は本実施形態においては、必須処理ではない。
図6は、本実施形態の網点除去方法を適用した場合の網点の除去の様子を示す図である。
【0040】
まず、原画像に対して、パターンのサイズの平均(x軸、y軸を適当に定めた場合のx軸方向及びy軸方向の平均の大きさ、sizex ave、sizey ave)及び、標準偏差(x軸方向及びy軸方向の標準偏差、hx、hy)を求める。そして、平均値及び標準偏差から閾値(x軸、y軸方向の閾値、thx=sizex ave+hx、thy=sizey ave+hy)を求める。そして、それぞれのパターンの縦横長さが閾値以下である場合(sizex<thx、かつ、sizey<thy)となるを網点として除去する。この処理を施した後の画像が図6の網点除去1の図である。
【0041】
次に、除去されなかったパターンについて、(輪郭長/黒画素数)が一定以上のパターンを除去する。これにより得られる画像が図6の網点除去2の図である。そして、最後に、除去した網点サイズを用いて突起サイズを推定し(または、ぼかし処理により)、突起除去を行う。これにより得られる画像が図6の突起除去の図である。
【0042】
図6から分かるように、本実施形態の網点除去を完全に行うことにより、網点がほとんど除去され、文字認識に適している文字が抽出される。
図7は、本実施形態をプログラムで実現する場合のプログラムを実行するコンピュータのハードウェア環境を示す図である。
【0043】
CPU10は、バス16に接続されており、ROM11、RAM12からプログラムを読み取って、実行する。プログラムは、フロッピーディスク、CD−ROM、DVDなどの可搬記録媒体19あるいはハードディスクなどの記憶装置17に通常格納されている。読み取り装置18を使って、可搬記録媒体19から読み取られたプログラム、あるいは、記憶装置17から読み取られたプログラムは、RAM12に展開されてCPU10によって実行される。
【0044】
入出力装置20は、バス16を介してユーザの指示をCPU10に伝えたり、CPU10の演算結果をユーザに提示したりするためのものであり、ディスプレイ、キーボード、マウス、テンプレートなどからなる。
【0045】
通信インターフェース13は、ネットワーク14を介して、情報提供者15のデータベースにアクセスし、当該プログラムをダウンロードしてCPU10が実行可能とすることができる。あるいは、情報提供者15に接続したまま、ネットワーク環境下で、当該プログラムを実行することが可能である。
【0046】
以上、本発明の実施形態によれば、白黒二値画像から網点パターンを除去する方式において、パターンの密度により網点の存在する領域を抽出し、小さいパターンを除去する手段として、個々のパターンの縦横サイズを算出し、閾値より小さいサイズを持つパターンを消去することで、網点サイズが画像毎に変動がある場合でも正確に網点の除去を行うことが可能となる。
【0047】
網点パターンを除去する手段について、個々のパターンの輪郭長/パターンの黒画素数がある一定以上の値をとる場合んは、文字パターンではないと判断し、除去を行う。または、パターンの輪郭長の代わりにパターンの外接矩形サイズを用いることで、網点同士が接触し、外接矩形サイズが大きくなった場合や、文字パターンと比較して細かいノイズパターンを除去することが可能となる。
【0048】
網点パターンを除去する手段について、網点領域と判定された領域内のすべてのパターンのサイズからヒストグラムをつくり、ヒストグラムの谷部分を閾値として設定し、閾値より小さいパターンを網点として除去することで、網点サイズが画像毎に変動がある場合でも正確に網点の除去を行うことが可能となる。
【0049】
文字に接触した網点による文字の突起を除去する手段について、白黒二値画像を多値画像に変換し、文字パターンをぼかしフィルタによりぼかし処理を行い、ぼかし画像に対して再度二値化を行うことで文字突起を除去することで、文字認識への悪影響を削減し、認識精度を向上させることができる。
【0050】
文字に接触した網点による文字の突起を除去する手段について、除去した網点サイズから突起サイズを推定し、推定された幅、長さに従って、パターンから突起状の部分を除去することで、文字認識への悪影響を削減し、認識精度を向上させることができる。
【0051】
【発明の効果】
本発明によれば、網点を効果的に除去し、効率的にな文字認識に耐える文字の抽出を行うことができる。
【図面の簡単な説明】
【図1】罫線による表構造を有する文書の例を示す図である。
【図2】パターンの大きさと輪郭長の違いの例を示す図である。
【図3】ガウンシアンフィルタの動作の概略を説明する図である。
【図4】本実施形態と従来技術の網点除去能力の差を示す図である。
【図5】本実施形態の処理の流れを示すフローチャートである。
【図6】本実施形態の網点除去方法を適用した場合の網点の除去の様子を示す図である。
【図7】本実施形態をプログラムで実現する場合のプログラムを実行するコンピュータのハードウェア環境を示す図である。
【符号の説明】
10 CPU
11 ROM
12 RAM
13 通信インターフェース
14 ネットワーク
15 情報提供者
16 バス
17 記憶装置
18 読み取り装置
19 可搬記録媒体
20 入出力装置

Claims (8)

  1. 網点によって網掛けされた画像から網点による網掛けを取り除く網点除去方法であって、
    処理対象の領域の黒画素の連結パターンの密度から網掛け領域を特定する網掛け領域特定ステップと、
    該網掛け領域に含まれる黒画素の連結パターンの縦横サイズの平均値と標準偏差を算出し、(該平均値+該標準偏差×所定の定数)より小さいサイズの連結パターンを除去すると共に、(該連結パターンの輪郭長/該連結パターンに含まれる黒画素数)が所定値以上の連結パターンを取り除く連結パターン除去ステップと、
    を備えることを特徴とする網点除去方法。
  2. 前記輪郭長は、連結パターンの外接矩形の辺の長さを利用することを特徴とする請求項1に記載の網点除去方法。
  3. 前記網掛け領域に含まれる網点以外の画像に付いている突起を取り除く突起除去ステップを更に備えることを特徴とする請求項1に記載の網点除去方法。
  4. 前記突起除去ステップは、前記連結パターン除去ステップにおいて除去された連結パターンのサイズ以下のサイズを有する突起を除去することを特徴とする請求項3に記載の網点除去方法。
  5. 前記突起除去ステップは、二値画像を多値画像に変換し、前記網掛け領域にぼかし処理を施し、更に、ぼかし処理後の画像に対して2値化を行うことを特徴とする請求項3に記載の網点除去方法。
  6. 前記連結パターン除去ステップにおいては、連結パターンのサイズの平均値を標準偏差から決定された閾値に基づいて、処理を行うことを特徴とする請求項1に記載の網点除去方法。
  7. 網点により網掛けされた画像から網点による網掛けを取り除く網点除去システムであって、
    処理対象の領域の黒画素の連結パターンの密度から網掛け領域を特定する網掛け領域特定手段と、
    該網掛け領域に含まれる黒画素の連結パターンの縦横サイズの平均値と標準偏差を算出し、(該平均値+該標準偏差×所定の定数)より小さいサイズの連結パターンを除去すると共に、(該連結パターンの輪郭長/該連結パターンに含まれる黒画素数)が所定値以上の連結パターンを取り除く連結パターン除去手段と、
    を備えることを特徴とする網点除去システム。
  8. 網点により網掛けされた画像から網点による網掛けを取り除く網点除去方法であって、
    処理対象の領域の黒画素の連結パターンの密度から網掛け領域を特定する網掛け領域特定ステップと、
    該網掛け領域に含まれる黒画素の連結パターンの縦横サイズの平均値と標準偏差を算出し、(該平均値+該標準偏差×所定の定数)より小さいサイズの連結パターンを除去すると共に、(該連結パターンの輪郭長/該連結パターンに含まれる黒画素数)が所定値以上の連結パターンを取り除く連結パターン除去ステップと、
    を備えることを特徴とする網点除去方法をコンピュータに実現させるプログラム。
JP2001253294A 2001-08-23 2001-08-23 網点除去方法及びシステム Expired - Fee Related JP4049560B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2001253294A JP4049560B2 (ja) 2001-08-23 2001-08-23 網点除去方法及びシステム
EP02251265A EP1296283A3 (en) 2001-08-23 2002-02-25 Half-tone dot elimination method and system thereof
US10/083,125 US7130085B2 (en) 2001-08-23 2002-02-27 Half-tone dot elimination method and system thereof
KR1020020010781A KR20030017304A (ko) 2001-08-23 2002-02-28 망점 제거 방법 및 시스템
CNB021058032A CN1207673C (zh) 2001-08-23 2002-04-10 半色调点消除方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001253294A JP4049560B2 (ja) 2001-08-23 2001-08-23 網点除去方法及びシステム

Publications (2)

Publication Number Publication Date
JP2003067738A JP2003067738A (ja) 2003-03-07
JP4049560B2 true JP4049560B2 (ja) 2008-02-20

Family

ID=19081646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001253294A Expired - Fee Related JP4049560B2 (ja) 2001-08-23 2001-08-23 網点除去方法及びシステム

Country Status (5)

Country Link
US (1) US7130085B2 (ja)
EP (1) EP1296283A3 (ja)
JP (1) JP4049560B2 (ja)
KR (1) KR20030017304A (ja)
CN (1) CN1207673C (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983446B2 (en) * 2003-07-18 2011-07-19 Lockheed Martin Corporation Method and apparatus for automatic object identification
JP4123267B2 (ja) * 2005-10-31 2008-07-23 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP4555212B2 (ja) * 2005-11-10 2010-09-29 株式会社沖データ 透かし情報埋め込み装置,透かし情報埋め込み方法,およびコンピュータプログラム
JP4835470B2 (ja) * 2007-03-01 2011-12-14 富士ゼロックス株式会社 画像検査装置および画像形成装置
JP5149034B2 (ja) * 2008-02-27 2013-02-20 大日本スクリーン製造株式会社 線画処理装置、プログラムおよび線画処理方法
JP2010020463A (ja) * 2008-07-09 2010-01-28 Dainippon Screen Mfg Co Ltd 線画処理装置、線画処理方法およびプログラム
JP5397468B2 (ja) * 2009-05-19 2014-01-22 日本電気株式会社 パタンノイズ除去装置、パタンノイズ除去方法、パタンノイズ除去プログラム
JP6296726B2 (ja) * 2012-11-16 2018-03-20 キヤノン株式会社 ディザパタン作成方法および画像処理装置
CN104156694B (zh) * 2014-07-18 2019-03-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备
WO2017141802A1 (ja) * 2016-02-15 2017-08-24 日本電気株式会社 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体
JP7088661B2 (ja) * 2017-10-30 2022-06-21 株式会社インフォディオ 紙帳票データ化システム、ocrエンジン学習用画像生成装置および画像分析装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03122785A (ja) * 1989-10-05 1991-05-24 Toshiba Corp 光学的文字読取装置
US5109432A (en) * 1989-12-27 1992-04-28 Fujitsu Limited Character recognition method
US5594815A (en) * 1992-10-19 1997-01-14 Fast; Bruce B. OCR image preprocessing method for image enhancement of scanned documents
US6005976A (en) 1993-02-25 1999-12-21 Fujitsu Limited Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
JP2951814B2 (ja) 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
JP3420864B2 (ja) 1995-08-09 2003-06-30 富士通株式会社 枠抽出装置及び矩形抽出装置
JPH09149241A (ja) * 1995-11-24 1997-06-06 Kokusai Electric Co Ltd 画像拡大方法及び画像拡大装置
JP3936039B2 (ja) * 1997-10-30 2007-06-27 富士通株式会社 網がけ領域抽出装置
US6393161B1 (en) * 1999-04-26 2002-05-21 Xerox Corporation Software system for minimizing image defects in a hard-copy input scanner

Also Published As

Publication number Publication date
CN1207673C (zh) 2005-06-22
JP2003067738A (ja) 2003-03-07
EP1296283A3 (en) 2005-04-20
CN1403937A (zh) 2003-03-19
US20030038975A1 (en) 2003-02-27
EP1296283A2 (en) 2003-03-26
US7130085B2 (en) 2006-10-31
KR20030017304A (ko) 2003-03-03

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7054485B2 (en) Image processing method, apparatus and system
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2002298085A (ja) 文字認識装置、文字認識方法、及び記録媒体
JP4049560B2 (ja) 網点除去方法及びシステム
JP3411472B2 (ja) パターン抽出装置
JP2004272798A (ja) 画像読み取り装置
JP3837193B2 (ja) 文字行抽出方法および装置
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
JP4116377B2 (ja) 画像処理方法および画像処理装置
JP2871590B2 (ja) 画像抽出方式
JP2008225654A (ja) 画像処理方法、画像処理装置、及び、プログラム、プログラム記憶媒体
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP4259950B2 (ja) 画像認識装置、画像認識プログラムおよび記録媒体
JP7543014B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2003317107A (ja) 罫線抽出方法及び装置
JP3960756B2 (ja) 文書画像レイアウト識別方法および装置
JP7402931B2 (ja) 方法、コンピュータ可読プログラムおよびシステム
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
US20220021787A1 (en) Apparatus, method, and storage medium for removing shading dots
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP4732626B2 (ja) 帳票処理方法および装置並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071127

R150 Certificate of patent or registration of utility model

Ref document number: 4049560

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131207

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees