JP4857173B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP4857173B2
JP4857173B2 JP2007114988A JP2007114988A JP4857173B2 JP 4857173 B2 JP4857173 B2 JP 4857173B2 JP 2007114988 A JP2007114988 A JP 2007114988A JP 2007114988 A JP2007114988 A JP 2007114988A JP 4857173 B2 JP4857173 B2 JP 4857173B2
Authority
JP
Japan
Prior art keywords
color
information
image
pixel
specific target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007114988A
Other languages
English (en)
Other versions
JP2008269509A (ja
Inventor
峰伸 関
英輔 浅野
洋登 永吉
健 永崎
広 新庄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Terminal Solutions Corp
Original Assignee
Hitachi Omron Terminal Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Terminal Solutions Corp filed Critical Hitachi Omron Terminal Solutions Corp
Priority to JP2007114988A priority Critical patent/JP4857173B2/ja
Priority to TW097103726A priority patent/TWI350997B/zh
Priority to KR1020080013550A priority patent/KR101461233B1/ko
Priority to CN2008100058810A priority patent/CN101295359B/zh
Publication of JP2008269509A publication Critical patent/JP2008269509A/ja
Application granted granted Critical
Publication of JP4857173B2 publication Critical patent/JP4857173B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、例えば帳票などの文書を光学的文字読取装置(OCR:Optical Character Reader)、スキャナ、デジタルカメラなどで撮像し、生成された文書画像から記入文字、印影、マークなど特定対象を抽出する画像処理装置、画像処理方法及び画像処理プログラムに関する。
金融機関や自治体では、OCR等のスキャナ装置を用いて、帳票などの文書処理業務の効率化を行っている。OCRの主な機能は、文書画像の生成、文書画像中の文字の抽出、文字認識である。生成される文書画像の種類として、2値画像、輝度画像、カラー画像がある。
2値画像を用いた処理は、データ量が少ないため、処理時間が少なくなる。しかし、2値画像処理では、帳票に予め印刷されているプレ印刷と呼ばれる罫線、桁線、ガイド文字、ハッチングと、手書き或いは後から印刷される記入文字が大きく重なる場合に、それらを区別することが難しい。そのため、文字の抽出結果にノイズが発生する場合や、抽出した文字の一部が欠けてしまう場合があり、文字認識を誤ってしまうという問題がある。
輝度画像を用いた処理は、白黒の濃淡画像処理である。輝度画像処理では、プレ印刷と記入文字の輝度値が異なることを利用してそれらを区別するため、プレ印刷と記入文字が重なっていた場合に、それらを区別することが2値画像処理に比べて容易になる。ただし、プレ印刷と記入文字の輝度値が近い場合には、それらの判別精度は低くなってしまう。
カラー画像を用いた処理では、プレ印刷と記入文字を色の違いにより区別することができるため、それらを区別することが輝度画像処理に比べて容易になる。カラー画像処理では、プレ印刷の色をドロップアウトすることで記入文字、印影、マークなどを抽出する。
その方法には、「特許文献3」のように帳票入力前に指定されたドロップアウト色をドロップアウトするものと、「特許文献1」や「特許文献2」のように入力された帳票内にある罫線のような特定の形状部分を抽出し、その抽出された部分の色と同じ色をドロップアウトするものがある。
特開2003-196592 特開2005-258683 特開2006-134355 特開2004-336106 特開2005-18810
前記カラー画像処理では、OCR、スキャナ、デジタルカメラから生成される画像に色ずれが発生することにより、記入文字や印影などの特定対象を正しく抽出できず、プレ印刷の一部が残ってしまったり、特定対象の一部が欠けてしまったりするという問題がある。
色ずれとは、センシングされる3原色の色成分、赤色成分となるR値、緑色成分となるG値及び青色成分となるB値のうち少なくとも1つの値の位置がずれることである。色ずれの発生要因としては、レンズの色収差、センサの配置位置、搬送速度等が挙げられる。特に、スタンド型スキャナやデジタルカメラなどの2次元CCDを用いたスキャナでは、色収差による色ずれが多く発生する。
色ずれにより、プレ印刷や記入文字などの特定対象の輪郭部分に、特定対象の本来の色とは異なる偽色が発生することになる。例えば、黒い文字の輪郭には、赤色と青色の偽色が発生する場合や、青色の罫線の輪郭に薄赤色の偽色が発生する場合等がある。そのため、色の情報によって、記入文字とプレ印刷などを区別するカラー画像処理に誤りが生じてしまう。
これに対し、「特許文献4」はレンズの色収差、「特許文献5」はセンサの配置位置による色ずれをなくすることを試みている。
しかしながら、ずれ量を計測し補正する方法を行ったとしても、画像から完全に色ずれをなくすことは困難である。また、より高精度な色ずれ補正は罫線時間が多くかかる問題も出てくる。
また、前記カラー画像処理や輝度画像処理では、画像中に色ぼけが発生した場合に、記入文字や印影などの特定対象を正しく抽出できず、プレ印刷の一部が残ってしまったり、文字の一部が欠けてしまったりするという問題がある。
色ぼけとは、罫線や記入文字の輪郭部分の色がぼやけて、薄い色が発生するものである。色ぼけにより、プレ印刷や記入文字の赤色成分、青色成分、赤色成分、明度、彩度、色相、輝度などの色情報の分散が大きくなるため、記入文字とプレ印刷とを区別することが難しくなる。
本発明はこれらの問題に鑑みてなされたものであり、色ずれや色ぼけを含む文書画像から、記入文字、印影、マークなどの特定対象を高精度に抽出する画像処理方法および画像処理装置を提供することにある。
上述の目的の達成のため、本発明は、帳票などの文書をスキャナやデジタルカメラで読取ったカラー画像或いは輝度画像から記入文字、印影、マークなどの特定対象を抽出する画像処理方法において、カラー画像或いは輝度画像から背景を除去し、背景以外の部分を表す背景除去データを生成する背景除去データ生成処理と、カラー画像或いは輝度画像中の前記背景以外部分において、背景以外部分の輪郭の色情報を背景以外部分の輪郭の内側にある画素の色情報に変換したデータを生成する輪郭色変換データ生成処理と、特定対象部分を抽出する特定対象抽出処理と、を有することを特徴とする。
また、前記輪郭色変換データ生成処理は、カラー画像或いは輝度原画像内の着目画素に対し、その近傍にある複数の画素である近傍画素を参照し、着目画素の赤色成分、青色成分、赤色成分、明度、彩度、色相、輝度などの色情報が、近傍画素と着目画素の中で最も輝度値の低い画素の色情報に変換された低輝度色膨張輝度データを生成することを特徴とする。
前記特定対象判別処理は、罫線抽出と、特定対象候補抽出と、罫線の色情報と特定対象の色情報の推定と特定対象の判別とを行うことを特徴とする。
本発明によれば、色ずれや色ぼけがあるカラー画像或いは輝度画像であっても、プレ印刷、記入文字、印影、マーク等の特定対象を精度良く区別し、例えば記入文字のみを精度良く抽出することが可能となる。記入文字に限らず、印影やマークなど、文書画像内にある特定対象を精度良く抽出することが可能となる。
以下、本発明を適用した画像処理方法及び画像処理装置について、図面を用いて詳細に説明する。
図2は、本発明の画像処理装置の一実施形態を表す図である。
これは、通信装置201と画像取得装置202と表示装置203と外部記憶装置204とメモリ205とCPU(Central Processing Unit)206とキーボードやマウスなどの入力装置207がPCIバスなどの通信線で接続されている画像処理装置208である。
図1に示す特定対象抽出処理の構成を持つプログラムは、外部記憶装置204やメモリ205等の記憶装置に格納され、CPU205によって実行される。
CPUに入力される文書のカラー画像や輝度画像は、スキャナ、OCRなどの画像取得装置202や通信装置201から入力されてもよく、外部記憶装置204に記憶されていてもよい。
特定対象抽出処理の結果は、表示装置203に出力される場合や通信装置201を経て外部に出力される場合や画像取得処理装置208内にある他のプログラムに用いられる場合などがある。他のプログラムの例として、文字認識を行うプログラムがある。
図27は、画像取得装置202や通信装置201から入力される、或いは外部記憶装置204に記憶されているカラー画像を表示装置203上の表示ウインドウ2701に表示した例である。また、図28は、特定対象抽出処理の結果を表示203上の表示ウインドウ2702に表示した例である。
図1は、本発明を適用した特定対象抽出処理プログラムの構成を表す図である。特定対象抽出処理プログラムは、画像取得モジュール101、背景除去データ生成モジュール102、輪郭色変換データ生成モジュール103、特定対象判別モジュール104及び制御モジュール105で構成されている。
画像取得モジュール101は、スキャナやOCR等により、紙文書等を画像化したカラー画像又は輝度画像を取得する画像取得処理をする。
背景除去データ生成モジュール102は、CPU206に入力されたカラー画像或いは輝度画像から、背景除去データを生成する背景除去データ生成処理をする。
例えば、図3のような罫線301と桁線302とハッチング303のプレ印刷と記入文字304を含むカラー画像を取得した場合、背景除去データ生成モジュール102は、図4に示す罫線と桁線と記入文字部分を表すデータを生成する。
背景除去データ生成処理は、画像中の背景部分を除去し、罫線と桁線のプレ印刷部分と記入文字部分を抽出する処理である。これを実現するには様々な方法があるが、図6に示す方法をとる。
はじめに、輝度値データ生成処理601で、RGBの3原色(R値、G値、B値)で表されるカラー画像から輝度で表される輝度画像を生成する。次に、ブロック分割処理602で、輝度画像を複数のブロックに分割する。最後に、2値化処理603で、ブロック毎にブロック内で輝度値が低い画素を黒、輝度値が高い画素を白にする2値データを生成する。これにより生成された2値データは、図4のように、黒い画素が背景以外の部分を示す、背景除去データである。
輪郭色変換データ生成モジュール103は、カラー画像604及び背景除去データ605が入力され、罫線と桁線と記入文字の輪郭の色を輪郭の内側部分の色に変換した輪郭色変換データ1303を生成する輪郭色変換データ生成処理をする。なお、カラー画像604は輝度画像であってもよい。
特定対象判別モジュール104は、CPU206に入力された背景除去データ605について、輪郭色変換データ1303を参照して、図5に示す記入文字部分を表すデータを生成する特定対象の判定処理を行い、特定対象判別結果706を出力する。
ここで、図7を用いて従来の特定対象判別処理の説明をする。従来の特定対象判別処理では、背景除去データが入力されて、カラー画像を参照して、特定対象の判別結果を出力していた。
従来の特定対象判別処理を図7に示す。まず、罫線抽出処理701’において、罫線部分を抽出する。この処理では、背景除去データ内にある黒画素が長く直線的に連結する部分を抽出することによって罫線部分を抽出する。その結果は図8になる。
次に、罫線除去処理702’において、背景除去データから罫線部分を除去した罫線除去データを生成する。その結果は図9になる。
次に、特定対象候補抽出処理703’において、罫線除去データの中から、矩形の大きさや位置の情報を用いて、特定対象となる記入文字部分の候補となる記入文字部分候補を抽出する。その結果は図10になる。
次に、罫線色と特定対象色の推定処理704’において、カラー画像604を参照することによって罫線部分の色情報である罫線部分色情報と記入文字候補部分の色情報である記入文字候補部分色情報を推定する。
次に、特定対象の判別処理705’において、罫線部分色情報と記入文字候補部分色情報を用いて、背景除去データ中の黒画素部分の各画素が、記入文字の画素であるかどうかを判別する。この処理は、背景除去データにある黒画素部分の各画素の位置において、カラー画像の色情報が罫線部分色情報に属するのか、それとも記入文字候補部分色情報に属するのかを判別する処理である。
具体的には、背景除去データ605にある黒画素部分の画素毎に次の処理を行う。背景除去データ605中のある黒画素位置(Xa,Xb)の処理では、カラー画像604の(Xa,Xb)にある色情報が、罫線色と特定対象色の推定処理704’で出力された罫線部分色情報と記入文字候補部分色情報のどちらに近いかを判定する。そして、(Xa,Xb)の色情報が罫線部分色情報に近ければ、(Xa,Xb)の位置は罫線部分であり、(Xa,Xb)の色情報が記入文字候補部分色情報に近ければ、(Xa,Xb)の位置は記入文字部分であると判定する。
このカラー画像604の色情報としては、RGB3原色のR値、G値、B値を用いても良いし、それらを変換した色情報、例えば輝度値やHSV空間の色相、彩度、明度であっても良い。またそららの中から1つの値だけを用いても良いし、複数の値を用いても良い。また、判別方法には、教師データを用いる様々な判別アルゴリズムを使うことができる。例えば、ニューラルネットワーク、線形識別器、マハラノビス距離等を用いる。
次に、カラー画像604を参照して、特定対象の判定処理を行い、特定対象判別結果706’を出力することで、特定対象判別処理が終了する。
しかしながら、従来の特定対象判別処理の場合、入力されたカラー画像604に色ずれがあると、カラー画像604中の色情報もずれるので、罫線部分色情報と記入文字候補部分色情報のどちらに近いかという色情報に基づく判定自体がずれる虞があり、プレ印刷と記入文字を色情報で区別することができなくなるという問題があった。このため、従来方法で得られた特定対象判別結果では、本願発明の判別結果、例えば図5のような出力を得られないことがあった。
ここで、図11は、色ずれのある画像(記入文字)の例である。図11では、本来は黒色の記入文字の輪郭に青い偽色と赤い偽色が発生している。
また、図12も色ずれのある画像(罫線)の例である。図12では、本来は青色の罫線の輪郭に薄赤色の偽色が発生している。黒色の記入文字と青色の罫線を含む画像から色情報を用いて記入文字のみを抽出する場合を考える。
記入文字と罫線に色ずれがない場合には、従来の特定対象判別処理で記入文字のみを抽出することができる。しかし、図11と図12のように色ずれがある画像では、記入文字の輪郭と罫線の輪郭のどちらにも赤色成分が存在するため、罫線の輪郭部分がノイズとして発生する場合や文字の一部が欠けてしまうことがある。このように色ずれが発生している場合、プレ印刷と記入文字を色情報で区別することができなくなるという問題がある。
図11、12のような画像に対して、本発明を適用した画像処理装置では、輪郭色変換データ生成処理を行い、輪郭色変換データを参照して特定対象判別処理を行う。
上述した輪郭色変換データ生成モジュール103は、輪郭色変換データ生成処理をする。具体的には、カラー画像604中の背景以外部分において、背景以外部分の輪郭の色を、背景以外部分の輪郭の内側にある画素の色に変換したデータを生成させる。すなわち、カラー画像中の罫線と桁線と記入文字の輪郭の色情報を、その輪郭の内側部分の色情報に変換したデータを生成する。
図13は、輪郭色変換データ生成処理の具体的な処理フローの例である。
輪郭色変換データ生成処理では、通信装置201や画像取得装置202や外部記憶装置204からメモリ205を介して、カラー画像604と背景除去データ605が入力される。
そして、近傍輝度値生成処理1301と低輝度色膨張処理1302において、カラー画像中の背景以外の領域にある画素が一つずつ選択され(選択された画素を着目画素と呼ぶ)、その着目画素の色情報が変換される。この2つの処理は、カラー画像中の背景以外の領域にあるすべての画素が処理されるまで繰り返される。
近傍輝度値生成処理1302では、着目画素の近傍を囲うフィールド内の画素(図14の例では着目画素を中心とする3×3の範囲としたフィールド内の9画素)の輝度値をそれぞれ生成する。以下、フィールド内の着目画素以外の画素を近傍画素と証する。前記フィールドは、3×3に限られず、例えば2×2又は4×4であってもよい。また、着目画素は、フィールド内において中心に限定されず、フィールド内の何れかの位置に位置するようフィールドを設定して良い。
次に、低輝度色膨張処理1302では、着目画素の色情報(例えばR値とG値とB値)を、着目画素と近傍画素の中で最も輝度値が低い画素の色情報に変換する。これは、R値、G値、B値がずれてしまった輪郭部の色情報を、輪郭部の内側の色情報に変換することであり、擬似的に偽色を本来の色情報に変換する処理となる。
より具体的には、フィールド内の着目画素及び近傍画素の輝度値を算出し、最も低い輝度値を持つ画素を抽出し、着目画素の色情報を最も低い輝度値を持つ画素の色情報に変換する。もし、着目画素の輝度値が最も低い輝度値ならば、着目画素の色情報は、そのまま維持される。このようにして、カラー画像604中の罫線と桁線と記入文字の部分において、色情報が変換されたデータである輪郭色変換データ1303を生成する。
輪郭色変換データ生成処理によれば、例えば記入文字の場合、図14に示すように、図11に示される記入文字の輪郭部にある輝度の高い赤色と青色の偽色が、輪郭の内側にある輝度の低い黒色に変換される。
また、輪郭色変換データ生成処理によれば、例えば罫線の場合、図15に示すように、図12に示される罫線の輪郭部にある輝度の高い薄赤色の偽色が、本輪郭の内側にある輝度の低い青色に変換される。
図16は、本実施例1における特定対象判別処理の具体的な処理フローの図である。
まず、背景除去データが入力され、罫線部分を抽出する罫線抽出処理701をする。
次に、背景除去データから罫線部分を除去した罫線除去データを生成する罫線除去処理702をする。
次に、罫線除去データの中から、矩形の大きさや位置の情報を用いて、特定対象となる記入文字部分の候補となる記入文字部分候補を抽出する特定対象候補抽出処理703をする。
次に、本発明の特定対象判別処理では、罫線色と特定対象色の推定処理1601と特定対象の判別処理1602において、輪郭色変換データ1303のRGB値を参照する。
背景色除去データの黒画素領域に相当する輪郭色変換データ1303の領域には、色ずれにより発生した偽色を持つ画素が少なくなっているため、特定対象色と罫線色の推定が精度良くなり、結果として、罫線と特定対象の判別の精度も向上する。
このように、本発明を適用した画像処理装置208では、罫線色と特定対象色の推定1601と特定対象の判別処理1602において、記入文字部を黒色として、罫線部を青色として扱うことができるため、記入文字部分を正しく判別することができる。
以上、画像処理装置208によれば、輪郭色変換処理後のRGB値を含む輪郭色変換データを参照しているので、色ずれを含むカラー画像から、特定対象となる記入文字を高精度に抽出することができる。また、この画像処理装置の出力である記入文字抽出結果を入力とする文字認識装置は、より高精度な認識結果を得ることができる。そして、記入文字を抽出することを例に用いたが、印影やマークを抽出する場合も同じように高精度な抽出が可能である。
次に、本発明の他の実施形態について説明する。
図17に示すように、特定対象判別部104において、罫線色の推定のみを用いて特定対象の判別を行う、特定対象抽出処理としてもよい。
図17に示す処理は、罫線色の推定処理1701において、輪郭色変換データを参照し、罫線の色情報のみを推定する。次に、罫線色部分の除去処理1702において、罫線の色情報を用いて、背景除去データ605から罫線色部分を除去することによって、特定対象となる記入文字部分を判別する。
図18に示すように、特定対象判別部104において、特定対象色の推定のみを用いて、特定対象判別処理を行う、特定対象抽出処理としてもよい。
図18に示す処理は、特定対象色の推定処理1801において、輪郭色変換データ1303を参照し、特定対象候補の色情報のみを推定する。次に、特定対象色部分の抽出処理1702において、特定対象の色情報を用いて、背景除去データ605から特定対象となる記文字部分を抽出する。
図19に示すように、特定対象判別部104においてクラスタリングを用いて、特定対象判別処理を行う、特定対象抽出処理としてもよい。
図19に示す処理は、罫線抽出の結果を用いずに、背景以外部分の色情報のみを用いて判別を行う。まずクラスタリング処理1901では、背景以外部分の輪郭色変換データ1303をクラスタリングする。クラスタリングには、RGB3原色のR値、G値、B値を用いても良いし、それらを変換した色情報、例えば輝度値やHSV空間の色相、彩度、明度であっても良い。またそららの中から1つの値だけを用いても良いし、複数の値を用いても良い。クラスタリングの方法には、k-means法や領域拡張法や判別分析などの方法がある。
次に、特定対象のクラスタの選択処理1902において、クラスタリングにより得られた複数のクラスタの中から特定対象のクラスタを選択する。選択の方法には様々な方法があるが、例えば輝度値の高い値を持つクラスタを選択するなどの方法がある。
そして、特定対象クラスタ色部分の抽出1903において、背景除去データの黒画素部分の中から前記選択したクラスタの色情報を持つ画素を抽出することで、特定対象となる記入文字を抽出する。
図1に示した特定対象抽出処理プログラムの構成に、更に、色ずれ補正モジュール2001を加えた特定対象抽出処理としてもよい。
この特定対象抽出処理プログラムは、図20に示すような構成となり、次に説明する処理以外は図1に示した実施例と同じ処理を行う。
色ずれ補正モジュール2001は、色ずれ補正処理を実行する。色ずれ補正処理は、文書画像取得処理によって取得されたカラー画像604のR値、G値、B値をシフトさせる、或いは拡大縮小するなどによって、色のずれを軽減したデータである色ずれ補正データを生成する。
そして、図1に示した構成では、背景除去データ生成処理、輪郭色変換データ生成処理に入力されるデータはカラー画像604を用いていたのに対し、図20の実施例では、背景除去データ生成処理、輪郭色変換データ生成処理に入力されるデータは色ずれ補正データとなる。これにより、色ずれのずれ量が多い画像においても、記入文字などの特定対象を精度良く抽出することが可能となる。
図1に示した特定対象抽出処理プログラムの構成に、更に、指定色取得モジュール2101を加えた特定対象抽出処理としてもよい。
この特定対象抽出処理は、図21に示すような構成となり、次に説明する処理以外は図1に示した実施例と同じ処理を行う。
指定色取得モジュールでは、指定色取得処理を行う。指定色取得処理は、抽出する特定対象として指定された色である指定抽出対象色情報2203を取得する。この指定抽出対象色情報は、ユーザが予めプログラムで指定しているものやキーボードやマウスなどの入力装置から入力されるものなどがある。そして、その色情報は、RGBのR値、G値、B値を用いても良いし、それらを変換した色情報、例えば輝度値やHSV空間の色相、彩度、明度であっても良い。またそららの中から1つの値だけを用いても良いし、複数の値を用いても良い。また、1つの色を示す値ものであってもよいし、色の値の範囲を示すものであっても良い。
そして、特定対象判別処理が図22や図23のように指定抽出対象色情報2203を入力に含む処理となる。
図22は、図16の特定対象判別処理において、指定抽出対象色情報2203と、罫線色と特定対象色の推定1601の結果を用いて、特定対象の判別2201を行う。
図23は、図19のクラスタリング1901を用いた特定対象判別処理において、指定抽出対象色情報2203を用いて特定対象のクラスタの特定2301を行う。
これまで説明してきた実施例は、色ずれの問題に対してだけでなく、色ぼけの問題に対しても有効である。図24は、記入文字の輪郭部分が薄い色になっている色ぼけの例である。図24の画像に対し、輪郭色変換データ生成処理を行うと図25に示す輪郭色変換データ1303が生成される。輪郭色変換データ1303では、入力されるカラー画像604中のぼけて薄い色の部分が、濃い色に変換されている。これにより、色ぼけがある画像に対しても高精度に特定対象を抽出することが可能となる。
また、これまで説明してきた実施例は、カラー文書が入力された場合だけでなく、色ぼけが発生する輝度画像が入力された場合に対しても有効である。輝度画像が入力された場合は、図1の実施例において、輪郭色変換データ生成処理を図26に示す処理とすることによって対応できる。
図26は、輝度画像2604と背景除去データ605が入力され、輝度画像の低輝度色膨張処理2601の処理を、輝度画像2604中の背景以外の部分で1画素ずつ行っていく。そして、背景以外の部分、すなわち罫線と桁線と記入文字の部分において、輝度画像2604中の輝度値が変換されたデータである輪郭色変換データ1303を生成する。
輝度画像の低輝度色膨張処理2601では、着目画素と近傍画素の中で最も輝度値が低い画素の輝度値を着目画素の輝度値に変換する。
特定対象抽出処理の構成を表す図。 画像処理装置を表す図。 カラー画像の例。 背景除去データ。 特定対象の判別結果。 背景除去データ生成処理の例を表す図。 従来の特定対象判別処理を表す図。 罫線抽出結果。 罫線除去結果。 特定対象候補抽出結果。 記入文字の色ずれの例。 罫線の色ずれの例。 輪郭色変換データ生成処理の例を表す図。 図11の画像の輪郭色変換データ生成処理を表す図。 図12の画像の輪郭色変換データ生成処理を表す図。 特定対象判別処理を表す図。 罫線色の推定のみを用いた特定対象判別処理を表す図。 特定対象色の推定のみを用いた特定対象判別処理を表す図。 クラスタリングを用いた特定対象判別処理を表す図。 色ずれ補正を加えた特定対象抽出処理プログラムの構成を表す図。 抽出対象色指定機能を備えた特定対象抽出処理プログラムの構成を表す図。 指定抽出対象色を含む従特定対象判別処理プログラムを表す図。 指定抽出対象色を含むクラスタリングを用いた特定対象判別処理を表す図。 色ぼけの例を表す図。 色ぼけのある画像に対する輪郭色変換データ生成処理の様子を表す図。 輝度画像入力の輪郭色変換データ生成処理の例を表す図。 カラー画像の表示例。 特定対象の判別結果の表示例。
符号の説明
101…画像取得モジュール
102…背景除去データ生成モジュール
103…輪郭色変換データ生成モジュール
104…特定対象判別モジュール
105…制御モジュール。

Claims (11)

  1. 入力された画像情報から背景を除去し、背景以外の領域を表す背景除去データを生成する手段と、
    入力された画像情報の背景以外の領域において、前記画像情報上の着目画素を設定し、着目画素の近傍を囲うフィールド内の画素である近傍画素を参照して、前記着目画素の色情報が、近傍画素と着目画素の中で最も輝度値の低い画素の色情報に変換された色変換データを生成する手段と、
    前記背景除去データ及び前記色変換データを記憶する手段と、
    前記背景除去データから特定対象候補を選択し、前記色変換データを参照し、特定対象部分と罫線の少なくとも一方の色情報を推定することによって、前記特定対象部分を出力する特定対象判別の手段と
    を備えることを特徴とする画像処理装置。
  2. 前記画像情報は、画像のカラー画像情報又は輝度情報であることを特徴とする請求項1記載の画像処理装置。
  3. 前記画像情報は、外部記憶装置に記憶された情報、画像取得装置により取得された情報、又は通信装置から入力された情報の何れかであることを特徴とする請求項1記載の画像処理装置。
  4. 前記色情報は、赤色成分、青色成分、赤色成分、明度、彩度、色相、輝度のうち少なくとも何れか1以上であることを特徴とする請求項1記載の画像処理装置。
  5. 更に、
    前記背景除去データから罫線情報を抽出する手段と、
    前記背景除去データから抽出した罫線情報を除去する手段とを有し、
    前記特定対象判別の手段では、前記罫線情報が除去された背景除去データから特定対象候補を選択することを特徴とする請求項1記載の画像処理装置。
  6. 記憶手段と、画像取得手段と、演算手段と、表示手段とを備える処理装置を用い、
    前記画像取得手段から入力された画像情報から背景を除去し、背景以外の領域を表す背景除去データを生成する工程と、
    入力された画像情報の背景以外の領域において、フィールド内の着目画素に対し、フィールド内の着目画素以外の画素である近傍画素を参照し、前記着目画素の色情報が、近傍画素と着目画素の中で最も輝度値の低い画素の色情報に変換された色変換データを生成する工程と、
    前記背景除去データ及び色変換データを記憶手段に記憶する工程と、
    前記記憶手段に記憶された背景除去データから特定対象候補を選択し、前記色変換データを参照して、特定対象部分と罫線の少なくとも一方の色情報を推定することによって、特定対象部分を前記表示手段に出力する特定対象判別の工程とを備えることを特徴とする画像処理方法。
  7. 前記画像情報は、画像のカラー画像情報又は輝度情報であることを特徴とする請求項6記載の画像処理方法。
  8. 前記画像情報は、外部記憶装置に記憶された情報、画像取得装置により取得された情報、又は通信装置から入力された情報の何れかであることを特徴とする請求項6記載の画像処理方法。
  9. 前記色情報は、赤色成分、青色成分、赤色成分、明度、彩度、色相、輝度のうち少なくとも何れか1以上であることを特徴とする請求項6記載の画像処理方法。
  10. 更に、
    前記背景除去データから罫線情報を抽出する工程と、
    前記背景除去データから抽出した罫線情報を除去する工程とを有し、
    前記特定対象判別の工程では、前記罫線情報が除去された背景除去データから特定対象候補を選択することを特徴とする請求項6記載の画像処理方法。
  11. 画像処理をするためにコンピューターを、
    画像取得手段から入力された画像情報から背景を除去し、背景以外の領域を表す背景除去データを生成する手段、
    入力された画像情報の背景以外の領域において、前記画像情報上の着目画素を設定し、着目画素の近傍を囲うフィールド内の画素である近傍画素を参照し、前記着目画素の色情報が、近傍画素と着目画素の中で最も輝度値の低い画素の色情報に変換された色変換データを生成する手段、
    前記背景除去データ及び色変換データを記憶手段に記憶する手段、
    前記記憶手段に記憶された背景除去データから特定対象候補を選択し、前記色変換データを参照して、特定対象部分と罫線の少なくとも一方の色情報を推定することによって、特定対象部分を前記表示手段に出力する特定対象判別の手段、
    として機能させるための画像処理プログラム。
JP2007114988A 2007-04-25 2007-04-25 画像処理装置、画像処理方法及び画像処理プログラム Expired - Fee Related JP4857173B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007114988A JP4857173B2 (ja) 2007-04-25 2007-04-25 画像処理装置、画像処理方法及び画像処理プログラム
TW097103726A TWI350997B (en) 2007-04-25 2008-01-31 Image processing program and image processing device
KR1020080013550A KR101461233B1 (ko) 2007-04-25 2008-02-14 화상 처리 장치, 화상 처리 방법 및 기록 매체
CN2008100058810A CN101295359B (zh) 2007-04-25 2008-02-15 图像处理装置及图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007114988A JP4857173B2 (ja) 2007-04-25 2007-04-25 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2008269509A JP2008269509A (ja) 2008-11-06
JP4857173B2 true JP4857173B2 (ja) 2012-01-18

Family

ID=40048876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007114988A Expired - Fee Related JP4857173B2 (ja) 2007-04-25 2007-04-25 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (4)

Country Link
JP (1) JP4857173B2 (ja)
KR (1) KR101461233B1 (ja)
CN (1) CN101295359B (ja)
TW (1) TWI350997B (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5127739B2 (ja) * 2009-02-06 2013-01-23 キヤノン株式会社 画像処理方法および画像処理装置およびプログラム
JP5337563B2 (ja) * 2009-04-08 2013-11-06 日立コンピュータ機器株式会社 帳票認識方法および装置
CN101916327B (zh) * 2010-07-09 2011-11-09 北京商纳科技有限公司 一种生成错题本的方法及系统
JP5867045B2 (ja) * 2011-12-12 2016-02-24 富士ゼロックス株式会社 画像処理装置及びプログラム
RU2534005C2 (ru) * 2013-02-01 2014-11-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система преобразования моментального снимка экрана в метафайл
US10083364B2 (en) 2014-04-16 2018-09-25 Glory Ltd. Method and apparatus for removing character background from colored image
JP6779688B2 (ja) * 2016-07-25 2020-11-04 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
CN106228157B (zh) * 2016-07-26 2018-03-27 江苏鸿信系统集成有限公司 基于图像识别技术的彩色图像文字段落分割与识别方法
CN106599818B (zh) * 2016-12-07 2020-10-27 广州视源电子科技股份有限公司 一种基于图片生成笔迹格式的文件的方法及装置
US10602026B2 (en) * 2017-06-20 2020-03-24 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and non-transitory computer readable medium
JP6958096B2 (ja) * 2017-08-10 2021-11-02 富士フイルムビジネスイノベーション株式会社 情報処理装置、及びプログラム
JP7059799B2 (ja) * 2018-05-23 2022-04-26 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置
CN113083804A (zh) * 2021-04-25 2021-07-09 中国铁建重工集团股份有限公司 激光智能除锈方法、系统及可存读介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58142675A (ja) * 1982-02-18 1983-08-24 Sanyo Electric Co Ltd カラ−画像処理方式
JP3048158B2 (ja) * 1988-10-04 2000-06-05 キヤノン株式会社 カラー画像処理装置
JP2746692B2 (ja) * 1989-10-09 1998-05-06 富士通株式会社 色画像データ処理装置
JPH0414960A (ja) * 1990-05-09 1992-01-20 Fujitsu Ltd カラー読取装置
JPH06266816A (ja) * 1993-03-12 1994-09-22 Fujitsu Ltd カラー画像処理方法及びカラー画像処理装置
JP3923293B2 (ja) * 2000-11-22 2007-05-30 シャープ株式会社 画像処理方法および画像処理装置ならびに画像形成装置
JP4141310B2 (ja) * 2003-04-16 2008-08-27 株式会社リコー 画像処理装置、画像処理方法、およびコンピュータが実行するためのプログラム
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
JP2006042267A (ja) * 2004-07-30 2006-02-09 Canon Inc 画像処理方法、画像処理装置、およびプログラム
JP4127691B2 (ja) * 2004-10-04 2008-07-30 株式会社東芝 文字認識装置及びその方法
TWI309026B (en) * 2005-04-12 2009-04-21 Newsoft Technology Corp Method for auto-cropping image objects and method for detecting image object contour
KR20060109211A (ko) * 2005-04-15 2006-10-19 삼성전자주식회사 에이브이 시스템 및 에이브이 시스템의 비트맵 폰트 외곽선생성 방법

Also Published As

Publication number Publication date
TW200842734A (en) 2008-11-01
TWI350997B (en) 2011-10-21
KR20080095743A (ko) 2008-10-29
KR101461233B1 (ko) 2014-11-12
CN101295359A (zh) 2008-10-29
JP2008269509A (ja) 2008-11-06
CN101295359B (zh) 2010-09-29

Similar Documents

Publication Publication Date Title
JP4857173B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US8619278B2 (en) Printed matter examination apparatus, printed matter examination method, and printed matter examination system
WO2022142611A1 (zh) 文字识别方法及装置、存储介质、计算机设备
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
JP2005309819A (ja) 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN102737240B (zh) 分析数字文档图像的方法
EP3407589B1 (en) Image processing apparatus, image processing method, and storage medium
US20140086473A1 (en) Image processing device, an image processing method and a program to be used to implement the image processing
RU2603495C1 (ru) Классификация изображений документов на основе параметров цветовых слоев
US8254693B2 (en) Image processing apparatus, image processing method and program
JP5929282B2 (ja) 画像処理装置及び画像処理プログラム
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
CN111445402A (zh) 一种图像去噪方法及装置
JP2003087562A (ja) 画像処理装置および画像処理方法
KR20100011187A (ko) 문자 인식 방법
JP4936250B2 (ja) 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JP2010039624A (ja) 色彩認識方法及びプログラム
JP4571758B2 (ja) 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体
JP2001109842A (ja) 光学文字読取装置
JP2022167414A (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111031

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4857173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees