JP2014071556A - 画像処理装置、画像処理方法、及びプログラム - Google Patents

画像処理装置、画像処理方法、及びプログラム Download PDF

Info

Publication number
JP2014071556A
JP2014071556A JP2012215486A JP2012215486A JP2014071556A JP 2014071556 A JP2014071556 A JP 2014071556A JP 2012215486 A JP2012215486 A JP 2012215486A JP 2012215486 A JP2012215486 A JP 2012215486A JP 2014071556 A JP2014071556 A JP 2014071556A
Authority
JP
Japan
Prior art keywords
color
image
image processing
background
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012215486A
Other languages
English (en)
Other versions
JP5887242B2 (ja
Inventor
Hiroshi Shinjo
広 新庄
Juichi Takahashi
寿一 高橋
Eisuke Asano
英輔 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Terminal Solutions Corp
Original Assignee
Hitachi Omron Terminal Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Terminal Solutions Corp filed Critical Hitachi Omron Terminal Solutions Corp
Priority to JP2012215486A priority Critical patent/JP5887242B2/ja
Publication of JP2014071556A publication Critical patent/JP2014071556A/ja
Application granted granted Critical
Publication of JP5887242B2 publication Critical patent/JP5887242B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

【課題】 記載文字色とプレ印刷色が背景色に近い場合でも、文字や罫線のかすれや潰れがない安定した2値画像を生成する。
【解決手段】 本発明は、被写体を撮像部130で撮像して得られたカラー画像からプレ印刷文字と記載文字を黒化する2値画像を生成する画像処理装置100である。画像処理部152では、まず入力された画像に対してレイアウト解析を行い、背景色、プレ印刷色、文字色を求める。次に、背景色とプレ印刷色、背景色と文字色、プレ印刷色と文字色とを分離する基準をそれぞれ算出する。最後に、レイアウト情報と色情報を用いて、画像中の1画素ごとに3種類の色分離基準を切り替えて2値画像を生成する。
【選択図】 図1

Description

本発明は、OCR(Optical Character Reader:光学式文字読取装置)等の画像の処理技術に関し、特に文字と背景が同形色でコントラストが低い場合でも、文字と背景を分離する2値化技術に関する。
カラー画像から2値画像を生成する2値化処理は、OCRの前処理として基本的な処理である。OCRの主要な読取り対象である帳票には、プレ印刷と呼ばれる予め印刷された罫線や文字がある。プレ印刷が読取対象の文字と近接している場合には文字認識の障害となることがある。したがって、従来の帳票OCRにおける2値化処理では、記載文字を黒に(黒化)、プレ印刷と背景を白に(白化)する2値化が一般的である。濃淡画像を入力とする2値化処理の従来技術としては、大津法やNiblack法などを用いて輝度値の2値化閾値を求める手法が知られている。
カラー画像を入力とする2値化処理の従来技術として、特許文献1には、カラー画像を撮像し、RBG(赤青緑)の3色のうち、プレ印刷などの記載文字以外の画素の輝度が最も高くなる色を選択した後、その色における画素の濃淡値から閾値を決めて2値化する方式が記載されている。特許文献2には、文字色を推定した後、文字色のみを抽出することで文字色とプレ印刷色を分離する方式が記載されている。特許文献3には、レイアウト解析処理を用いて2値化対象の領域を限定し、その領域内のプレ印刷等の位置が定義された書式情報を参照して背景と罫線の色を抽出することにより、プレ印刷や背景と文字を分離する2値化方式が記載されている。
一方、2値化の後段の処理にあたる帳票認識の技術においては、認識対象の文字の属性(例:金額、日付、氏名)を特定することと、記載文字を高精度に認識することが課題である。従来では、特許文献3に記載されているように、文字の位置や属性が事前に定義された帳票の書式情報を用いて認識対象の文字領域を切り出して認識することが一般的である。これに対し、特許文献4には、帳票全面の文字を認識し、互いに隣接する項目名(例:金額)とデータ(例:10000円)のペアを抽出することにより、事前定義の書式情報なしで記載文字の属性を認識する技術が記載されている。
特開2003−196592号公報 特開2010−244372号公報 特開2005−258683号公報 特開2011−248609号公報
特許文献4の技術では、項目名を認識する必要があるため、プレ印刷の文字を認識しなければならない。したがって、記載文字に加えて、プレ印刷文字も正しく黒化する必要がある。しかし、一般的な帳票上のプレ印刷文字は、背景色と同系色かつ濃淡差や色差が小さい色で印刷されていることが多い。これは、2値化処理で背景色と同時に白化することを目的としているためである。したがって、特許文献1から3の方式の2値化処理ではプレ印刷文字を正しく黒化することは困難である。
特許文献4の帳票認識技術の読取り対象の例として、振込伝票を用いてプレ印刷の2値化の課題を説明する。振込伝票にはプレ印刷罫線やプレ印刷文字等があり、活字文字や手書き文字が記載されている。記載文字やプレ印刷、および紙の地色(背景色)は伝票の種類ごとに異なっている。このような帳票では、通常の2値化手法で適切な2値画像を得ることは困難である。具体的には、色の薄い文字やプレ印刷を黒化するために2値化の閾値を下げると、濃い背景色の帳票では文字部分と背景の両方が黒になる。一方、濃い背景色を白化するために閾値を上げると、薄い文字やプレ印刷も白化されてしまう。さらに、文字や背景の濃淡値が異なる複数の帳票が混在している場合は、さらに困難となる。
特許文献1に記載の方法では、文字とプレ印刷が異なる色であることを前提としているため、文字とプレ印刷が同系色の場合には、プレ印刷が白化されてしまう。特許文献2に記載の方法では、推定した文字色以外を白化するため、プレ印刷が白化されてしまう。特許文献3に記載の方法では、あらかじめ定義された帳票の書式情報が必要であるため、多様な帳票が混在している場合には対応できない。
上述したような従来技術における問題点に鑑み、本発明の目的は、記載文字やプレ印刷と背景色の濃淡差の大小にかかわらず、文字やプレ印刷を正しく黒化すること、さらに、適切に2値化して文字認識することにある。
前記課題を解決するために、本発明は、スキャナで撮像して得られたカラー画像から2値画像を生成する画像処理装置であって、前記カラー画像、および、2値画像を生成するための所定の判定基準を記憶する記憶部と、前記カラー画像のレイアウトを解析し、前記レイアウト解析の結果を用いて、色クラスタリングにより背景色とプレ印刷色と文字色の代表色を求め、文字色と背景色の分離基準と、プレ印刷色と背景色の分離基準と、文字色とプレ印刷色の分離基準を算出し、前記カラー画像における各画素の色情報とレイアウト情報に基づいて、前期色分離基準を切り替えて2値化処理を行い、前記2値化を行った画素値を前記記憶部に格納する画像処理部と、を備えることを特徴とする。
本発明における2値化では、記載文字とプレ印刷、および背景色の濃淡差の大小にかかわらず、正しく記載文字やプレ印刷を抽出することができる。この結果、記載文字とプレ印刷文字の両方を高精度に認識することができる。
第1実施形態の画像処理装置の構成図である。 入力対象の帳票画像の例である。 本発明が目的とする2値画像の例である。 従来技術による2値画像の例を示す図である。 従来技術による2値画像の例を示す図である。 本発明の実施形態の2値化処理の概略を示す図である。 本発明の実施形態のレイアウト解析処理の概略を示す図である。 色クラスタリングの例を示す図である。 HSV色空間の概略を示す図である。 入力画像と本発明による2値画像の例を示す図である。 本発明の第2実施形態の2値化処理の概略を示す図である。 図2の入力画像から背景色を検出した例を示す図である。 本発明の第3実施形態の2値化処理の概略を示す図である。 本発明の第4実施形態の2値化処理の概略を示す図である。 本発明の第5実施形態の2値化処理の概略を示す図である。 本発明の第6実施形態の2値化処理の概略を示す図である。 背景色の輝度と分離基準の関係を示す図である。 本発明の第6実施形態における、分離基準を切り替えて2値化する処理の概略を示す図である。 本発明の第6実施形態における、画素のクラス分けの概略を示す図である。 本発明の第6実施形態における、クラス分け結果に基づく再2値化処理の概略を示す図である。 記載文字を黒化する再2値化の例を示す図である。 プレ印刷を黒化する再2値化の例を示す図である。 ノイズを白化する再2値化の例を示す図である。 2値化と文字認識をする画像処理装置の構成図である。 営業店窓口端末の構成図である。
以下、図面を参照(言及図以外の図面も適宜参照)して、本発明を実施するための形態(以下、実施形態と称する。)について、第1実施形態〜第8実施形態に分けて説明する。
(第1実施形態)
まず、第1実施形態に係る画像処理装置の構成について説明する。図1に示すように、画像処理装置100は、帳票や書面等を撮像して取得したカラー画像から2値画像を生成するコンピュータ装置であり、操作部110と、表示部120と、撮像部130と、記憶部140と、制御部150とを備える。
操作部110は、ユーザが数字や文字の入力操作を行う際に利用するキーボードや、スキャンの開始を指示するためのボタン等からなる操作部である。表示部120は、入力画像や2値画像等を表示する液晶ディスプレイ等からなる表示部である。撮像部130は、フラットベッドスキャナやオートシートフィーダ付きのスキャナ、およびCCD(Charge Coupled Device)等の撮像素子を用いて画像を撮像するデジタルカメラ等の撮像部である。
記憶部140は、メモリやハードディスク装置等からなる記憶デバイスであり、撮像部130で撮像された画像や各種内部処理用プログラム、および各種設定データを記憶する。また、例えば、記憶部140は、複数の代表色から被写体(書面など)の背景色を検出するための所定の判定基準として、求めた各クラスタの代表色のうち輝度が最も高い色を被写体の背景色とするという基準を記憶する。また、記憶部140は、2値化のための設定値や判定基準などを記憶する。
制御部150は、画像の撮像処理と入力画像の2値化処理等の画像処理を行う制御部であり、撮像処理部151と画像処理部152を有する。
撮像処理部151は、撮像部130を用いて被写体の撮像制御を行う制御部であり、画像データを入力画像としてメモリ上に展開して一時的に保持するとともに、この画像データをファイルとして記憶部140に格納することができる。
画像処理部152は、撮像処理部151で作成された入力画像から背景を除去して2値化する手段であり、第1実施形態の画像処理装置100における特徴部分である。具体的には、画像処理部152では、まず撮像処理部151で作成され入力された画像に対してレイアウト解析を行い、背景色、プレ印刷色、文字色を求める。次に、背景色とプレ印刷色、背景色と文字色、プレ印刷色と文字色とを分離する基準をそれぞれ算出する。最後に、レイアウト情報と色情報を用いて、画像中の1画素ごとに3種類の色分離基準を切り替えて2値画像を生成する。この処理フローについては、図6を用いて後述する。
本発明で実現する2値化方式の具体例を示す前に、図2から図6を用いて従来の2値化の処理結果と本発明の処理結果の概要を示す。
図2は2値化対象の入力画像である。白い紙の帳票200上に、罫線210で囲まれた白い背景色の領域、濃い罫線220で囲まれた濃い背景色の領域、薄い罫線230で囲まれた薄い背景色の領域が存在し、それぞれの領域には「金額」と記載されたプレ印刷文字240から260が存在する。さらに、270等の枠内に認識対象の文字が記載されている。250や260のプレ印刷文字の色は、背景色と同系色であり、背景色よりも若干輝度が低いものとする。本発明の目的は、図2の画像から、図3に示すように記載文字、プレ印刷文字、および、罫線を黒化、それ以外の背景領域を白化する2値化画像を生成することである。
図2の画像を従来の2値化手法での処理した結果が図4および図5である。図4は、薄いプレ印刷を黒化することを目的として、帳票200全体を低い閾値で2値化した結果である。罫線430やプレ印刷文字460は黒化できているものの、プレ印刷文字450も含めた濃い背景の領域が全て黒化されている。一方、図5は、濃い背景領域を白化することを目的として、帳票200全体を高い閾値で2値化した結果である。罫線530とプレ印刷文字560が閾値以上となるため白化されている。図4と図5から、帳票全面を一律の基準で2値化すると、記載文字とプレ印刷文字の両方を高精度に認識することは困難であることがわかる。この問題に対応するため、局所領域毎に閾値を算出して2値化する従来方式もある。しかし、図2のように背景色とプレ印刷文字の色相や輝度が近い場合には、背景の一部を黒化することで生じるノイズや、文字の一部を白化することで生じる文字のかすれ等が頻発する。このように、背景色とプレ印刷の濃淡差が大きい帳票から記載文字とプレ印刷文字の両方を抽出する2値化画像を生成することは困難であった。これは、プレ印刷文字が薄い帳票と濃い帳票が混在する場合でも同様である。本発明における課題の解決策についての詳細については図6以降で説明する。
本発明における画像処理部152で実行される2値化処理フローの一例を図6に示す。各ステップの処理の内容は次のとおりである。なお、以降の記載はカラー画像の入力を前提としているが、グレー画像においても画素の濃淡値(輝度値、明度値)を用いることにより適用可能である。
図6のステップ600では、帳票上の罫線や枠、文字行の位置を検出するためのレイアウト解析を行う。
画像処理部152で実行されるレイアウト解析処理の詳細を図7に示す。まず、ステップ700で帳票画像を2値化する。この2値化処理では、図3のようにプレ印刷文字と記載文字の両方を黒化するのではなく、少なくとも罫線を黒化することを目的としているため、多少のノイズや潰れは許容でき、図3の2値化画像を生成するよりも閾値の設定が容易となる。この点については、ステップ720の枠抽出の際に詳述する。次にステップ710で、ステップ700で生成した2値化画像から罫線を抽出する。罫線抽出方式の一例としては、縦方向、横方向の黒画素の連続性から縦罫線と横罫線を抽出する方式がある。ステップ720では、抽出された罫線から枠を抽出する。枠抽出方式の一例としては、罫線の交点付近の特徴を用いて枠を抽出する特開平11−53466号公報に記載の方式等がある。この方式では、罫線にかすれやノイズが発生しても高精度に枠を抽出することができる。正確に罫線を抽出する必要がないため、ステップ700の2値化処理の閾値設定が容易となる。しかし、あらかじめ決められた2値化閾値では枠を抽出できないと判断した場合、ステップ700に戻り2値化の閾値を変更してから再度ステップ710以降の処理を行うことも可能である。最後に、ステップ730では、ステップ700で生成した2値化画像から文字行を抽出する。この処理の従来手法としては、連結成分融合法と呼ばれる方式がある。この方式は、黒画素の連結する領域を連結成分とし、連結成分の上下・左右方向の整列性から文字行を検出するものである。文字行の概略の位置を検出することが目的であるため、文字にかすれやノイズが発生している2値画像を対象としてもよい。このことからも、ステップ700の閾値設定は容易となることがわかる。なお、ステップ600で罫線や文字の画素を抽出する際に、図7の方式ではなく、入力のカラー画像をグレー画像に変換したのち、ラプラシアンフィルタ等の輪郭を検出するフィルタを用いてもよい。ラプラシアンフィルタは輝度の差分の変化量が極端に大きくなっている部分を抽出するフィルタであり、3×3のフィルタの係数は
で与えられる。
図6のステップ610では帳票の背景色を求める。背景色の抽出方式の一例として、特開2012−95002号公報に記載の方式等がある。この方式に記載の背景色検出は、帳票画像を複数の部分領域に分割した後、部分領域内の各画素をRGB等の色空間上にマッピングしてクラスタリングし、得られたクラスタの中から記憶部140に格納された所定の判定基準を用いて背景色のクラスタを選定し、このクラスタの代表色を部分領域の背景色とする処理である。
図8は、RGB色空間を示した例である。RGB色空間はR(red)、G(green)、B(blue)それぞれの値を軸に持つ3次元空間であり、RGBの各軸の値は0から255をとる。原点(0,0,0)は黒を表し、(255,255,255)は白を表す。処理対象領域内の各画素はRGB色空間上の一点にマッピングできる。領域内の画素をマッピングすると、代表的な色を中心とした複数の分布がでる。図8では、白い背景色(800)に、赤いプレ印刷(810)や緑のプレ印刷(820)が印刷されており、黒い文字(840)が記載されている領域を色クラスタリングした例である。色クラスタリングとは、処理領域中の各画素を色空間上でクラスタリングする処理である。具体的には、ボロノイ分割やユークリッド距離の閾値などを用いて近い色同士を同じクラスタとして色空間内を領域分割することにより実現する。各クラスタにおいて、クラスタの中心に位置する色や最も頻度が高い色を、クラスタの代表色とする。空間内のクラスタの中から背景色のクラスタ(800)を選定するには、クラスタの代表色の輝度が最も高い、明度が最も高い、クラスタの度数が最も高い(面積が広い)等の基準を用いる。なお、明度については、ステップ630の文字色検出において後述する。
なお、色クラスタリングは、領域内の全ての画素を利用しても、一部の画素を利用してもよい。例えば、一定間隔でサンプリングした画素を色クラスタリングに用いてもよい。さらに、この例では画素の値を直接クラスタリングの対象にしているが、CCDの特性上発生する偽色やノイズ等の影響を軽減するために、周辺の画素との平均値や重み付き平均値を求め、この値を色クラスタリングに用いてもよい。
図6のステップ620では帳票画像の罫線の色を求める。この処理は、罫線抽出710で罫線であると抽出された画素を色クラスタリングすることで求めることができる。色クラスタリングの結果、背景色と異なる色のクラスタが得られた場合に、このクラスタの代表色を罫線の色とする。罫線の色は複数であってもよい。一般に、帳票上の罫線の色とプレ印刷文字の色は同じであることが多いため、ここで得られた罫線の色はプレ印刷の色とみなすことも可能である。なお、ステップ620の処理対象の画素を、罫線抽出710で罫線であると抽出された画素でなく、枠抽出処理720で枠罫線と判定された罫線の画素にしてもよい。罫線として抽出された画素の中には、罫線と同系色のノイズ成分も含まれるのに対し、抽出された枠を構成する罫線はノイズを含む確率が低いため、より正確に罫線の色を求めることができる。
ステップ630では文字の色を求める。この処理は、文字行抽出730で文字行であると抽出された領域内の画素を色クラスタリングすることで求めることができる。色クラスタリングの結果、背景色と異なる色のクラスタが得られた場合に、このクラスタの代表色を文字の色とする。文字の色は複数であってもよい。文字色のクラスタを選定するための基準の一例としては、クラスタ代表色の輝度が最も低い、明度が最も低い、彩度が最も低い、背景やプレ印刷と異なる色相である等がある。
ここで、色相(H),彩度(S)、明度(V)の指標で色を表現するHSV色空間について、図9と数2から数5を用いて説明する。
RGB色空間はRGBの3色を用いて色を表現するため計算機で扱いやすい。一方、人間はRGB値ではなく色相(Hue:色の種類)、彩度(Saturation:鮮やかさ)、明度(Value:明るさ) の指標で色を知覚していることが分かっている。そこで、本発明の色クラスタリングや色判別処理では、RGB色空間だけでなく、人間の近くに近いHSV色空間の指標を利用してもよい。HSV色空間は図9に示す下向きの円錐形で視覚化できる。HSVの各指標の詳細は次のとおりである。
色相(H):色の種類(赤、青、黄、緑など)。0〜360°の範囲(円周上で変化する)
彩度(S):色の鮮やかさ。0.0〜1.0 (もしくは0〜255)の範囲(水平軸上で変化する)
明度(V):色の明るさ。 0.0〜1.0 (もしくは0〜255)の範囲(垂直軸上で変化する)
RGB色空間からHSV色空間へは、数2から数5を用いて変換できる。人間の知覚は、明度や彩度の変化に比べて、色相の変化に最も敏感であることが、実験によりわかっている。なお、HSV色空間のかわりに、HSL色空間等を用いてもよい。
図6のステップ640では、2値化の際の色の分離基準を求める。ステップ640はステップ650から670の3つから構成されている。
ステップ650では、ステップ610で求めた背景色に関する情報とステップ630で求めた文字色に関する情報に基づいて、文字色と背景色を分離する基準を求める。文字色と背景色との分離基準は、RGB色空間やHSV色空間での各クラスタ同士を分離する平面もしくは曲面を求める方法、輝度、明度のヒストグラムから閾値を求める方法がある。少なくとも一方がある程度以上の彩度を持つ有彩色(白〜グレー〜黒など、図9のV軸付近ではない色)である場合には、色相や彩度の範囲を限定することにより、色を分離する方法などがある。これらは単独で用いても、複数を組み合わせてもよい。一般的に、有彩色同士の判別には色相を最優先にして分離し、色相が近い場合には明度や彩度を用いて分離する。
ステップ660ではプレ印刷色と背景色の分離基準を、ステップ670では文字色とプレ印刷色の分離基準を、ステップ650と同様にして求める。本発明では、「文字色」は読み取り対象である記載文字の色を指し、「プレ印刷色」は罫線やプレ印刷文字の色を指している。両者は異なることを前提としているものの、同じであってもよい。この場合でも、記載文字とプレ印刷を黒化し、背景を白化することは可能である。なお、用途によっては、650から670の処理のうち、1種類もしくは2種類のみを用いてもよい。
図6のステップ680では、画素のRGB値やHSV値、ステップ610,620,630で得られた背景、プレ印刷、文字のRGB値やHSV値などの色情報と、ステップ600で得られたレイアウト情報と、を用いて、画素ごとに、ステップ640で求めた2値化の分離基準を切り替えて2値化を行う。この処理においては、生成する2値画像の種類に応じて利用する基準が異なる。
図10を用いて3種類の2値画像の例を説明する。図10(a)は入力画像であり、背景色付きの領域に背景色と同系色のプレ印刷文字や罫線が印刷されており、認識対象として輝度の低い数字が記載されている。
図10(a)の画像を、背景を白化し、記載文字とプレ印刷文字、罫線を黒化した2値画像が図10(b)である。この2値画像は、プレ印刷文字と記載文字の両方を認識することを目的とする場合に生成される。この2値画像を生成するには、ステップ650の文字色―背景色の分離基準とステップ660のプレ印刷色―背景色の分離基準の両方を用いる。分離基準の具体的な利用例としては、少なくともどちらか一方の分離基準で背景でないと判定された画素のみを黒化する方法がある。
図10(c)は、図10(a)の画像を、背景とプレ印刷文字、プレ印刷罫線を白化し、記載文字を黒化した2値画像である。この2値画像は、記載文字の認識の際に、プレ印刷による悪影響を低減することを目的とする場合に生成される。特に、プレ印刷と記載文字が接触している場合に有効である。この2値画像を生成するには、ステップ650の文字色―背景色の分離基準とステップ670の文字色―プレ印刷色の分離基準の両方を用いる。分離基準の具体的な利用例としては、両方の分離基準で文字色と判定された画素を黒化する方法がある。
図10(d)は、図10(a)の画像を、記載文字と背景を白化し、プレ印刷文字と罫線を黒化した2値画像である。プレ印刷文字のみを認識することを目的とする場合に生成される。この2値画像を生成するには、ステップ660のプレ印刷色―背景色の分離基準とステップ670の文字色―プレ印刷色の分離基準の両方を用いる。分離基準の具体的な利用例としては、両方の分離基準でプレ印刷色と判定された画素を黒化する方法がある。
例えば、ユーザは操作部等から図10(b)、(c)、(d)のうちのいづれの形式で出力するかを選択し、画像処理部は、操作部等から指定された形式で出力するようステップ680の処理を実行する。
ステップ680では、画素の色に基づいて分離基準を切り替えるだけでなく、画素の座標とレイアウト解析結果に基づいて分離基準を変更することができる。これは、レイアウト解析結果を利用することにより、おおまかに記載文字、プレ印刷、背景の判別ができるからである。具体的には、ステップ710で罫線と判定された画素では、プレ印刷色すなわち罫線色であることを前提としてプレ印刷色の判定基準を緩和する。文字行領域内の画素では、文字色の判定基準を緩和する。この処理により、文字や罫線のかすれを防ぐことができる。さらに、プレ印刷色と背景色、および文字色と背景色の差が小さい場合には、分離基準を厳しくすることができる。この処理により、プレ印刷文字や罫線と背景が同系色の場合でもかすれを防ぐことができ、濃い背景上の文字が潰れることを防ぐことができる。
このように、図6の処理により、複数の分離基準を切り替えることにより、目的に応じた高精度な2値画像を生成することができる。
(第2実施形態)
図11を用いて第2実施形態を説明する。第2実施形態は、第1実施形態における図6のレイアウト解析(ステップ600)と背景色検出(ステップ610)の順序と処理内容が異なる。
まずステップ610において帳票画像全面を部分領域に分割して背景色検出を行う。次に、ステップ1100において、検出した背景色の情報を用いてレイアウト解析を行う。ステップ620以降は図6と同じである。
この第2実施形態では、ステップ1100のレイアウト解析処理の2値画像生成処理が第1実施形態のステップ700と異なる。具体的には、背景色に応じて画素ごとに2値化の閾値を変更する。すなわち、背景色が明るい(薄い)場合には2値化閾値を高くし、背景色が暗い(濃い)場合には2値化閾値を低くする。この処理は、図2のように異なる背景色が混在する帳票でのレイアウト解析の精度を向上させることを目的としている。第1実施形態において、図7のステップ700の2値化処理の閾値設定は図3の2値化閾値設定よりも容易であると説明した。しかし、背景色とプレ印刷色の濃淡差によっては、全ての領域の罫線やプレ印刷文字を抽出できない場合がある。
図12は図2の入力画像の背景色を検出した結果である。図2の220の領域の背景色が図12の1210に、230の領域が1220として検出されている。この背景色よりも暗い色の画素を黒化することにより、上記の課題を解決するレイアウト解析用の2値画像を生成することができる。
(第3実施形態)
図13を用いて第3実施形態を説明する。第3実施形態は、第1実施形態における図6のレイアウト解析(ステップ600)の後にステップ1300で領域分割を行い、ステップ610の背景色検出以降の処理は領域毎に実施する(ステップ1310)。この処理は、部分的に背景色やプレ印刷色の色相や濃淡が異なる帳票での2値化の精度を向上させることを目的としている。プレ印刷色や背景色が複数混在した状況で分離基準を設定することが困難であるため、色数を限定できる領域に分けてから分離基準を求める。領域限定の具体的な例としては、ステップ720の枠抽出で検出された枠単位で領域を分割する手法がある。枠内では背景色が同じであり、プレ印刷文字や罫線の色数も少ないという仮定に基づく。この手法では、枠外は全て同じ領域として扱う。領域分割の他の例としては、M×N画素の矩形領域に分割する手法がある。
(第4実施形態)
図14を用いて第4実施形態を説明する。第4実施形態は、第2実施形態のステップ1100の後にステップ1300の領域分割を行う。ステップ620のプレ印刷色検出以降の処理は領域毎に実施する(ステップ1400)。この処理は、レイアウト解析の精度向上に加えて、部分的に背景色やプレ印刷色の色相や濃淡が異なる帳票での2値化の精度向上を目的としている。なお、本実施形態においても図13と同様に領域毎に背景色を求め直してもよい。
(第5実施形態)
図15を用いて第5実施形態を説明する。第5実施形態は、第2実施形態のステップ1100の後にステップ620のプレ印刷色検出とステップ630の文字色検出を行い、色情報とレイアウト情報を用いてステップ1500で領域分割を行う。ステップ640の分離基準生成以降の処理は領域毎に実施する(ステップ1510)。領域限定の具体的な例としては、背景色、プレ印刷色、文字色の組み合わせが同一である枠を全て同じ領域とする手法がある。枠外についても、上記の色の組み合わせに応じて領域を分割する。なお、本実施形態においても図13と同様に領域毎に再度色検出を実施してもよい。
(第6実施形態)
図16から図23を用いて第6実施形態を説明する。第6実施形態は、背景色の画素を白化し、文字色とプレ印刷色の画素を黒化することのみを目的としている。第1から第5実施形態では、図10(a)の入力に対して、図10(b)から図10(d)の2値画像を生成できるのに対し、第6実施例では、図10(b)の2値画像の生成のみを行う。本実施形態では、背景色とその他の色とを分離する基準を複数算出し、これらの基準を切り替えて2値化を実行する。
第6実施形態に係る画像処理装置の構成は、第1実施形態と同じ図1になる。ただし、画像処理部152の機能が図16の処理フローをもつことが第1実施形態とは異なる。以降、第6実施形態の画像処理部152の機能の詳細について説明する。
第6実施形態における2値化処理フローの一例を図16に示す。まず、図6のステップ610と同じ処理を用いて、分割した部分領域ごとに背景色を検出する。次に、図6のステップ640に相当する処理であるステップ1640にて背景色の画素とそれ以外の画素を分離する基準を算出する。最後に、図6のステップ680に相当する処理であるステップ1680にて、画素ごとに分離基準を切り替えて2値化する。ステップ1640については図17を用いて、ステップ1680については図18から図20を用いて後述する。
図16のステップ1640は、背景色とそれ以外(文字色やプレ印刷色)を分離するための基準を算出する処理である。分離基準は2値化処理対象の全ての画素について算出される。分離基準の算出には、輝度や明度、彩度、色相等を用いる。本実施形態では、背景色の輝度を用いる例を示す。まず、画素の輝度がα以下であれば2値化処理で必ず黒化し、β以上であれば必ず白化するという基準値αとβを事前に設定しておく。次に、重みpとq(0.0から1.0)を設定し、輝度に基づく3つの分離基準(T1からT3)を数6から数8を用いて算出する。T1からT3の具体的な説明は次のとおりである。T1は、強制的に黒化する値である定数αとする
。T2とT3は背景色の輝度に応じて変化する値であり、背景色に近いプレ印刷色やノイズを判定するために用いる。T3は、処理対象画素の位置での背景色の輝度(Yb)に重みpを乗算した値とβのうち、小さい方の値とする
。T2は、T1とT3をq:(1−q)で内分する値である
。一例として、α=160、β=220、p=0.9、q=0.5の場合のT1からT3を、図17にて示す。なお、なお、重みpとqは、定数でも関数でもよい。さらに、T3の値をβ等の背景色に依存しない定数にしてもよい。
図16のステップ1680は、図18に示すように3つのステップで構成される。
図18のステップ1800の画素のクラス分けの処理フローを図19に示す。図19の処理は、入力画像の2値化対象領域内の全ての画素について実行される(ステップ1900、1905)。ステップ1910の判定にて、当該画素の輝度値がT1未満の場合には、ステップ1920にて黒化する画素としてC1(黒化確定)に分類する。ステップ1930の判定にて、輝度値がT1以上T2未満の場合には、ステップ1940にてC2(黒化候補1)に分類する。ステップ1950の判定にて、輝度値がT2以上T3未満の場合には、ステップ1960にてさらに他の分離基準を満たすかどうかを判定し、基準を満たす場合にはステップ1970にてC3(黒化候補2)に分類する。いずれの基準も満たさない場合には、ステップ1980にて白化する画素としてC4(白化確定)に分類する。ステップ1960の判定の具体的な例としては、背景色の明度(Vb)と画素の明度(Vi)の差を用いることができる。
基準:Vb−Vi>γ
ただし、γは定数である。これは、一般的に、背景色の方がプレ印刷色より明度が高い場合が多いからである。その他の条件としては、背景色の色相(Hb)と画素の色相(Hi)の差、背景色の彩度(Sb)と画素の彩度(Si)の差、および画素の明度(Vi)や彩度(Si)の上限値等も利用することができる。これらの条件は単数でも複数の組み合わせでも良い。
図18のステップ1810では、ステップ1800での分類結果に基づいて2値化する。2値化の一例としては、C1からC3に分類された画素を黒化、C4に分類された画素を白化する。その他の例としては、C1とC2に分類された画素を黒化、C3とC4に分類された画素を白化する。なお、1画素ごとに、クラス分けの直後に2値化(黒化白化の判定)を行うことにより、ステップ1800と1810を同時に実行してもよい。図18のステップ1820では、各クラスの画素の比率に基づいて、ステップ1810で2値化した結果を別の基準で評価して再2値化する。
図20を用いて再2値化の処理フローを説明する。図20の例では、ステップ1810にてC1からC3の画素を黒化していることを前提として説明している。図20の処理では、画像の処理対象領域をMb×Nb画素の矩形領域に分割したうえで、全ての領域内の画素について実行する(ステップ2000、2005)。ここで、分割した矩形領域のサイズは、背景検出時のサイズと同じでも異なっていてもよい。ステップ2010では、領域内のC1からC3に分類された画素の数をカウントする。カウントした数は、下記のように定義する。
n1:C1(黒化確定)に分類された画素の数
n2:C2(黒化候補1)に分類された画素の数
n3:C3(黒化候補2)に分類された画素の数
n = n1+n2+n3(C1、C2、C3の画素数の合計)
n0= Mb・Nb (領域内の全画素数)
ステップ2020では、領域内において、下記の比率を計算する。これらの比率は、ステップ2030の条件1やステップ2050条件2で用いられる。
R = n/n0
R1 = n1/n
R12 =(n1+n2)/n
ステップ2030の条件1の例を下記に示す。
条件1:(R>t1)AND(R1>t2)
ただし、t1とt2は事前に定めた定数
条件1では、領域内でC1(黒化確定)の比率が高いことを意味している。したがって、領域内の文字画素の輝度は十分低く、C2とC3の輝度が高い画素はノイズとみなすことができる。このため、条件1を満たす場合には、ステップ2040において、C1に分類された画素のみを黒化し、C2とC3の画素を白化する再2値化処理を行う。
図21を用いて、条件1を具体的に説明する。図21は、8×8(Mb=Nb=8)の領域に「田」の文字が記載されている例である。図21(a)は、画素2100等のC3に分類された輝度の高い背景色の領域に、画素2110等のC1に分類された文字の画素が存在する例である。その他に、C2と分類された画素として、背景上のノイズ(2120)や、他の背景色よりも輝度値が低い背景(2130)が存在する。画素2130が他の背景色よりも低い輝度値になるのは、隣接する画素との色の差が大きいためである。このような場合、撮像素子の量子化誤差等から、隣接する画素の影響を受けて実際とは異なる輝度値になることがある。図21(a)を、条件1を用いてC1のみ黒化する再2値化した結果が図21(c)である。さらに、図21(b)に示すように、輝度が高い背景領域(C4)中に輝度が低い文字(C1)が記載されている場合の再2値化結果も図21(c)となる。
ステップ2050の条件2の例を下記に示す。
条件2: ((R>t3)AND(R2>t4))
OR((R<t5)AND(n1=0))
ただし、t3からt5は事前に定めた定数
条件2の1行目は、領域内のC1とC2の比率が高いことを意味している。2行目は、輝度の低いC1の画素がなく、C2とC3の比率が低いことを意味している。そこで、C2の画素は、背景色に近い色のプレ印刷文字や罫線であり黒化対象とみなすことができ、C3の輝度が高い画素は、ノイズであり白化対象とみなすことができる。このため、条件2を満たす場合には、ステップ2060において、C1とC2に分類された画素を黒化し、C3の画素を白化する再2値化処理を行う。
図22と図23を用いて、条件2を具体的に説明する。図22は条件2の1行目が適用される例である。図22(a)は、画素2200等のC3に分類された輝度の高い背景色の領域に、画素2210等のC2に分類された文字の画素が存在する例である。C2の画素は、背景色に近いプレ印刷文字とみなすことができる。図22(b)は、画素2220等のC4に分類された背景色の領域に、画素2230等のC2に分類された文字の画素と、C3に分類された輝度値が低い背景(2240)が存在する例である。条件2の1行目を用いて図22(a)や図22(b)を再2値化した結果は図21(c)になる。図23は条件2の2行目が適用される例である。図23(a)は、画素2300等のC4に分類された背景色の領域に、画素2310等のC2に分類されたプレ印刷文字の一部と、C3に分類されたノイズ(2320)が存在する例である。条件2の2行目を用いてC1とC2を黒化する再2値化結果が図23(b)である。図23(c)は画素2330等のC4に分類された背景色の領域に、C3に分類されたノイズが存在する例である。図23(c)を再2値化した結果が図23(d)となる。
条件1、条件2ともに満たさない領域では、C1、C2、C3の画素は黒化したままである。なお、この条件1と条件2は例であり、領域内の輝度や色相、彩度、明度等の平均や分散、個々の画素値等、他の条件を用いることが可能である。さらに、条件数も変更してもよい。
以上で示したように、第6実施形態では、背景色との差分と小領域内での輝度の分布を用いて、背景色のみを白化する2値化を実現することができる。
なお、図18において、ステップ1810で2値化処理を終了してもよい。また、図6、図11、図13、図14、図15のステップ640とステップ680のかわりに、本実施形態のステップ1640とステップ1680を用いてもよい。
(第7実施形態)
第7実施形態では、2値化だけでなく文字認識も行うことができる画像処理装置の例を説明する。図24は、第1実施形態から第6実施形態のいずれかの画像処理装置100の機能を持つ画像処理装置2400を示す構成図の例である。
図24に示すように、画像処理装置2400は、制御部2410に文字認識部2411が追加されている以外は、図1に示す画像処理装置100と同様の構成であるので、重複説明を適宜省略する。文字認識部2411は、2値化によって生成した画像から文字認識処理をする。
文字認識部2411は、例えば、図2の画像から、2値化処理を行い、文字として「金額」、「1」、「2」、「3」、「4」、「5」等を認識する。個々の文字を認識する処理は、パターン認識の既存手法を用いることができる。
(第8実施形態)
第8実施形態では、第1実施形態から第6実施形態のいずれかの画像処理装置100を利用した、金融機関の営業店窓口に設置される営業店窓口端末装置について説明する。金融機関などでは、営業店窓口に設置された端末装置に接続されたスキャナによって、顧客が記入した取引帳票の画像を撮像し、得られた画像データを保存したり、画像データについて文字認識を行ったりしている。図25に示すように、営業店窓口端末装置2500は、操作部110(図1と同様)と、表示部120(図1と同様)と、スタンド型スキャナなどの撮像部130(図1と同様)と、利用者との授受のための現金を取り扱う現金入出金部2510と、通帳に取引内容を印字する通帳プリンタ部2520と、レシートなどに印字するプリンタ部2530と、端末記憶部2540とこれらを制御する端末制御部2550とを有する。なお、端末制御部2550は図1の制御部150に対応し、端末記憶部2540は図1の記憶部140に対応する。
以下、営業店窓口端末装置2500を利用した業務フローについて説明する。営業店窓口端末装置2500は、利用者から取引科目別の取引帳票を受け取ったオペレータが、帳票と対応する取引データ入力画面を呼び出すための画面番号を操作部110から入力し、表示部120である端末画面に表示された取引画面の各入力フィールドに取引金額等、帳票上の記入データをキーボード入力することにより、目的の取引を実行する。
さらに、端末制御部2550は、撮像部130であるスキャナによって採取した取引帳票の画像を採取し、その画像に基づいてOCR(Optical Character Recognition)機能により記載内容を読取り、取引内容の確認画面を表示部120に表示する。この場合、取引内容の確認画面には、帳票からOCRで読取られた各データ項目の内容、例えば、店番、口座番号、入金額などが表示され、確認画面の表示データに問題がなければ、これらのデータが記録データとして管理装置に送信処理される。なお、認識結果の確認を容易にするために、確認画面に図10(a)の入力画像と図10(b)から(d)のうちの1つもしくは2つ以上の2値画像を表示してもよい。
このように、営業店窓口端末装置2500によれば、撮像部130によって採取した画像上からOCR処理を実行することができる。
100 画像処理装置
110 操作部
120 表示部
130 撮像部
140 記憶部
150 制御部
151 撮像処理部
152 画像処理部
2400 画像処理装置
2410 制御部
2411 文字認識部
2500 営業店窓口端末装置
2510 現金入出金部
2520 通帳プリンタ部
2530 プリンタ部
2540 端末記憶部
2550 端末制御部

Claims (14)

  1. スキャナで撮像して得られたカラー画像から2値画像を生成する画像処理装置であって、
    前記2値画像を生成するための色分離基準を記憶する記憶部と、
    色クラスタリングにより前記カラー画像の複数の色の色情報を求め、
    前記求めた複数の色の色情報に基づいて、2以上の色分離基準を算出し、
    前記求めた複数の色の色情報と前記色分離基準に基づいて、前記色分離基準を切り替えて前記カラー画像の2値化処理を行い、
    前記2値化された画素値を前記記憶部に格納する画像処理部と、
    を備えることを特徴とする画像処理装置。
  2. 前記色情報は、前記色クラスタリングにより算出された前記カラー画像の背景色、プレ印刷色、及び、文字色の代表色であり、
    前記画像処理部は、
    前記色情報に基づいて、前記文字色と前記背景色の色分離基準、前記プレ印刷色と前記背景色の色分離基準、及び、前記文字色と前記プレ印刷色の色分離基準を算出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記画像処理部は、
    前記カラー画像のレイアウトを解析し、
    前記レイアウト解析の結果を用いて、色クラスタリングにより背景色、プレ印刷色、及び、文字色の代表色を求め、
    前記カラー画像における各画素の色情報とレイアウト情報に基づいて、前記色分離基準を切り替えて2値化処理を行うことを特徴とする請求項2に記載の画像処理装置。
  4. 前記画像処理部は、
    前記カラー画像を部分領域に分割し、
    色クラスタリングにより各領域の背景色を求め、
    前記背景色とそれ以外の色との色分離基準を複数算出し、
    前記色分離基準を切り替えて2値化処理を行うことを特徴とする請求項1の画像処理装置。
  5. 前記画像処理部は、
    各画素の色と前記背景色との差分に基づいて複数の分離基準を算出し、
    前記複数の分離基準を用いて画素を複数のクラスに分類し、
    前記領域を部分領域に分割し、各部分領域内で、前記の各クラスに属する画素数をカウントして、存在比率を求め、
    前記存在比率に基づいて黒化するクラスを決定することを特徴とする請求項4記載の画像処理装置。
  6. 前記画像処理部は、
    プレ印刷文字と記載文字の両方を認識することを目的とする場合には、
    前記文字色―背景色の分離基準と前記プレ印刷色―背景色の分離基準の少なくともどちらか一方の分離基準で背景でないと判定された画素のみを黒化し、
    記載文字のみを認識することを目的とする場合には、
    前記文字色―背景色の分離基準と前記文字色―プレ印刷色の分離基準の両方の分離基準で文字と判定された画素を黒化し、
    プレ印刷文字のみを認識することを目的とする場合には、
    前記プレ印刷色―背景色の分離基準と前記文字色―プレ印刷色の分離基準の両方の分離基準で罫線すなわち罫線と判定された画素を黒化する画像処理部と、
    を備えることを特徴とする請求項1に記載の画像処理装置。
  7. 前記画像処理部は、
    前記カラー画像を色クラスタリングすることにより背景色を求め、
    前記背景色を用いて前記カラー画像のレイアウトを解析し、
    前記レイアウト解析の結果を用いて、色クラスタリングにより前記プレ印刷色と前記文字色の代表色を求める、
    ことを特徴とする請求項2記載の画像処理装置。
  8. 前記画像処理部は、
    前記カラー画像のレイアウトを解析し、
    前記レイアウト解析の結果を用いて、前記カラー画像を領域分割し、
    分割した領域ごとに、前記レイアウト解析の結果を用いて、色クラスタリングにより背景色、プレ印刷色、及び、文字色の代表色を求め、
    ことを特徴とする請求項2記載の画像処理装置。
  9. 前記画像処理部は、
    前記カラー画像を色クラスタリングすることにより背景色を求め、
    前記背景色を用いて前記カラー画像のレイアウトを解析し、
    前記レイアウト解析の結果を用いて、前記カラー画像を領域分割し、
    分割した領域ごとに、前記レイアウト解析の結果を用いて、色クラスタリングによりプレ印刷色と文字色の代表色を求めることを特徴とする請求項2記載の画像処理装置。
  10. 前記画像処理部は、
    前記カラー画像を色クラスタリングすることにより背景色を求め、
    前記背景色を用いて前記カラー画像のレイアウトを解析し、
    前記レイアウト解析の結果を用いて、色クラスタリングによりプレ印刷色と文字色の代表色を求め、
    前記背景色、プレ印刷色、文字色の代表色に関する情報と、前記レイアウト解析の結果を用いて、前記カラー画像を領域分割し、
    分割した領域ごとに、文字色と背景色の色分離基準と、プレ印刷色と背景色の色分離基準と、文字色とプレ印刷色の色分離基準を算出し、
    前記カラー画像における各画素の色情報とレイアウト情報に基づいて、前記色分離基準を切り替えて2値化処理を行う
    ことを特徴とする請求項2記載の画像処理装置。
  11. 前記記憶部に格納した画素値に基づいて文字認識を行う文字認識部、
    を備えることを特徴とする請求項1に記載の画像処理装置。
  12. スキャナで撮像して得られたカラー画像から2値画像を生成する画像処理装置であって、
    前記2値画像を生成するための色分離基準を記憶する記憶部と、
    色クラスタリングにより前記カラー画像の複数の色の色情報を求め、
    前記求めた複数の色の色情報に基づいて、2以上の色分離基準を算出し、
    前記求めた複数の色の色情報と前記色分離基準に基づいて、前記色分離基準を切り替えて前記カラー画像の2値化処理を行い、
    前記2値化された画素値を前記記憶部に格納する画像処理方法
    を備えることを特徴とする画像処理方法。
  13. 前記カラー画像を部分領域に分割し、
    色クラスタリングにより各領域の背景色を求め、
    前記背景色とそれ以外の色との色分離基準を複数算出し、
    前記色分離基準を切り替えて2値化処理を行うことを特徴とする請求項12の画像処理方法。
  14. スキャナで撮像して得られたカラー画像から2値画像を生成するためのプログラムであって、
    色クラスタリングにより入力されるカラー画像の複数の色の色情報を求めるステップと、
    前記求めた複数の色の色情報に基づいて、2以上の色分離基準を算出するステップと、
    前記求めた複数の色の色情報と前記色分離基準に基づいて、前記色分離基準を切り替えて前記カラー画像の2値化処理を行うステップと、
    前記2値化された画素値を記憶部に格納するステップと、
    を計算機に実行させることを特徴とするプログラム。
JP2012215486A 2012-09-28 2012-09-28 画像処理装置、画像処理方法、及びプログラム Active JP5887242B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012215486A JP5887242B2 (ja) 2012-09-28 2012-09-28 画像処理装置、画像処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012215486A JP5887242B2 (ja) 2012-09-28 2012-09-28 画像処理装置、画像処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014071556A true JP2014071556A (ja) 2014-04-21
JP5887242B2 JP5887242B2 (ja) 2016-03-16

Family

ID=50746725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012215486A Active JP5887242B2 (ja) 2012-09-28 2012-09-28 画像処理装置、画像処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5887242B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6294524B1 (ja) * 2017-02-15 2018-03-14 ソフネック株式会社 画像処理方法、及びコンピュータプログラム
CN111045617A (zh) * 2019-12-27 2020-04-21 湖南鼎一致远科技发展有限公司 一种图片灰阶的打印方法、系统、控制芯片及打印机
JP2020137096A (ja) * 2019-02-26 2020-08-31 京セラドキュメントソリューションズ株式会社 情報処理装置及び画像形成装置
JP2021060875A (ja) * 2019-10-08 2021-04-15 株式会社コミチ コマ抽出方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094427A (ja) * 2002-08-30 2004-03-25 Hitachi Ltd 帳票画像処理装置及び該装置を実現するためのプログラム
JP2005258683A (ja) * 2004-03-10 2005-09-22 Fujitsu Ltd 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2010219848A (ja) * 2009-03-17 2010-09-30 Toshiba Corp 文書画像処理装置および文書画像処理方法
JP2010244372A (ja) * 2009-04-08 2010-10-28 Hitachi Computer Peripherals Co Ltd 帳票認識方法および装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094427A (ja) * 2002-08-30 2004-03-25 Hitachi Ltd 帳票画像処理装置及び該装置を実現するためのプログラム
JP2005258683A (ja) * 2004-03-10 2005-09-22 Fujitsu Ltd 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2010219848A (ja) * 2009-03-17 2010-09-30 Toshiba Corp 文書画像処理装置および文書画像処理方法
JP2010244372A (ja) * 2009-04-08 2010-10-28 Hitachi Computer Peripherals Co Ltd 帳票認識方法および装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6294524B1 (ja) * 2017-02-15 2018-03-14 ソフネック株式会社 画像処理方法、及びコンピュータプログラム
JP2018132953A (ja) * 2017-02-15 2018-08-23 ソフネック株式会社 画像処理方法、及びコンピュータプログラム
JP2020137096A (ja) * 2019-02-26 2020-08-31 京セラドキュメントソリューションズ株式会社 情報処理装置及び画像形成装置
JP7205292B2 (ja) 2019-02-26 2023-01-17 京セラドキュメントソリューションズ株式会社 情報処理装置及び画像形成装置
JP2021060875A (ja) * 2019-10-08 2021-04-15 株式会社コミチ コマ抽出方法及びプログラム
JP7370574B2 (ja) 2019-10-08 2023-10-30 株式会社コミチ コマ抽出方法及びプログラム
CN111045617A (zh) * 2019-12-27 2020-04-21 湖南鼎一致远科技发展有限公司 一种图片灰阶的打印方法、系统、控制芯片及打印机
CN111045617B (zh) * 2019-12-27 2023-12-08 湖南鼎一致远科技发展有限公司 一种图片灰阶的打印方法、系统、控制芯片及打印机

Also Published As

Publication number Publication date
JP5887242B2 (ja) 2016-03-16

Similar Documents

Publication Publication Date Title
US10455117B2 (en) Image processing apparatus, method, and storage medium
CN102469234B (zh) 图像处理装置、图像读取装置、图像形成装置和图像处理方法
CN110008954B (zh) 一种基于多阈值融合的复杂背景文本图像提取方法及系统
US20070253040A1 (en) Color scanning to enhance bitonal image
TWI467515B (zh) 掃描文件之彩色捨去
KR100339691B1 (ko) 코드인식을 위한 장치 및 그 방법
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
JP4857173B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
KR100542365B1 (ko) 영상 화질 개선 장치 및 그 방법
JP5337563B2 (ja) 帳票認識方法および装置
KR101597739B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
US11983910B2 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
JP5701181B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP6874387B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2008252862A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4423333B2 (ja) 背景領域特定方法、背景領域特定システム、背景色決定方法、制御プログラム、および、記録媒体
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP5608511B2 (ja) 画像補正装置および画像補正方法
Fernández-Caballero et al. Display text segmentation after learning best-fitted OCR binarization parameters
US20140293353A1 (en) Document file output apparatus, document file output method, and computer program
JP5929282B2 (ja) 画像処理装置及び画像処理プログラム
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JP2003087562A (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5887242

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350