JP5222776B2 - 画像処理装置及び方法 - Google Patents

画像処理装置及び方法 Download PDF

Info

Publication number
JP5222776B2
JP5222776B2 JP2009095125A JP2009095125A JP5222776B2 JP 5222776 B2 JP5222776 B2 JP 5222776B2 JP 2009095125 A JP2009095125 A JP 2009095125A JP 2009095125 A JP2009095125 A JP 2009095125A JP 5222776 B2 JP5222776 B2 JP 5222776B2
Authority
JP
Japan
Prior art keywords
character
processing unit
identification
noise
run
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009095125A
Other languages
English (en)
Other versions
JP2010244472A (ja
Inventor
峰伸 関
健 永崎
英輔 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Terminal Solutions Corp
Original Assignee
Hitachi Omron Terminal Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Terminal Solutions Corp filed Critical Hitachi Omron Terminal Solutions Corp
Priority to JP2009095125A priority Critical patent/JP5222776B2/ja
Publication of JP2010244472A publication Critical patent/JP2010244472A/ja
Application granted granted Critical
Publication of JP5222776B2 publication Critical patent/JP5222776B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Description

本発明は画像処理装置及び方法に関し、例えば、文字認識処理を実行する前の前処理に関するものである。
複合機などのスキャン装置には、予め用意された複数の設定により、画質を調整することが可能である。例えば、解像度、濃度、シャープネスの値を変更できる。これらの値の設定、スキャンする紙文書の状態、スキャン回数などにより、文書中の文字が掠れる、潰れる、ノイズが発生するなどの劣化が生じる。
文字認識をする際、掠れ、潰れ、ノイズは障害となり、認識率の低下に繋がる。そのため、これらの悪影響を軽減する処理がある。例えば、入力画像から微小な小さい黒画素の塊を除去することによるノイズ除去や、特許文献1や特許文献2にあるように、文字行内にある黒画素の連なりである連結成分の幅や頻度を用いて文字の潰れや掠れがあるかどうかを判定することによる文字切り出し精度向上がある。
特開平10−69522号公報 第285314号公報
Katsumi Marukawa、外2名,"Online Recognition of Unconstrained Handwritten Japanese Text Using Statistical Information",2006年 10th International Workshop on Frontiers in Handwriting Recognition
しかしながら、特許文献1及び2の技術を用いたとしても、認識対象に潰れ、掠れ及びノイズに加えて、画像中に斑状のノイズ(例えば、文字周辺に現れる斑点状のノイズ及び文字のストローク内部に現れる網状のノイズ)が含まれる場合、認識精度が大きく低下するという問題は解決することができない。
例えば、複合機などのスキャン装置には、文字のみを含む紙文書をスキャンする場合と写真や図を含む紙文書をスキャンする場合の切り換えスイッチがある。仮に、この切り替えスイッチを文写切り換えスイッチ、写真や図を含む文書をスキャンする場合を写真モード、文字を含む文書をスキャンする場合を文字モード、文字と写真を含む文書をスキャンする場合を文字写真モードと呼ぶ。文字写真モード、写真モードで生成される2値画像は、薄い色、濃い色の濃淡値を2値画像で表現するために、誤差拡散法などの処理が施される。この処理は文字記載部分にも施され、斑状のノイズが発生する。この斑状のノイズは、解像度、濃度、文字のサイズが異なると、ノイズの発生の仕方が変わる。具体的には、大量のノイズが発生する、ノイズのサイズが異なる、文字ストロークの周りに発生する場合と文字ストロークの内側に発生する場合がある。このような斑状ノイズが発生してしまうと、文字行を抽出することができなくなる場合がある。また、文字自体も変形しているため、文字識別の精度が低下してしまう。上述の特許文献1及び2に開示の技術はこのような場合に対応できていない。
本発明はこのような状況に鑑みてなされたものであり、入力された画像中から文字を認識する際、多様な斑状ノイズが発生した場合にも高精度な文字認識結果を得ることができる技術を提供するものである。
上記課題を解決するために、本発明では、文字認識処理を実行する前に、入力画像における斑状ノイズを検出して、斑状のノイズを除去等する画質補正処理を実行する。
より具体的には、本発明による画像処理装置は、斑状ノイズ画質判定処理部と、画質補正処理部を備えている。斑状ノイズ画質判定処理部は、入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、当該ランの長さ毎に計測したランの頻度分布であるラン長頻度分布を生成し、当該ラン長頻度分布を用いて、複数種類ある斑状のノイズを検出する。また、画質補正処理部は、斑状ノイズ画質判定処理部によって検出された複数の斑状ノイズ判定結果に応じて、入力画像に対して画質の補正を行う。
文字認識処理を行う場合には、さらに、文字行抽出処理部と、文字切り出し処理部と、文字識別処理部とを設ければよい。文字行抽出処理部は、入力画像内において、文字が並んでいる領域である文字行領域を抽出する。また、文字切り出し処理部は、文字行領域から個々の文字を表す文字パタンを生成する。そして、文字識別処理部は、生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する。
さらに具体的には、斑状ノイズ画質判定処理部は、ラン長頻度分布の各頻度、或いは各頻度を足した値を予め定められた複数の閾値を用いて、閾値処理することによって、複数の斑状ノイズを検出する。また、画質補正処理部は、予め定められたラン除去用閾値Tp以下の長さであるランを除去するラン除去処理部と、隣り合う2つのランを入力とし、それらの距離が予め定められたラン結合用閾値Tq以下である場合にその2つのランを結合するラン結合処理部と、を備えている。そして、斑状ノイズ画質判定処理部によって検出された斑状ノイズの種類に応じて、ラン除去処理部によるラン除去処理とラン結合処理部によるラン結合処理の実行順番と実行回数を変えながら、入力画像の画質を補正する。
文字識別処理部は、文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、文字サイズが所定サイズより大きい場合には基本識別処理の結果を識別結果とする。
別の態様による本発明の画像処理装置は、文字行抽出処理部と、斑状ノイズ判定処理部と、画質補正処理部と、を備えている。文字行抽出処理部は、入力画像から文字が並んでいる領域である文字行領域を抽出する。斑状ノイズ判定処理部は、文字を含む入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、長さが1の水平方向又は垂直方向のランである孤立ランを選出し、上下左右の何れかにのみランが隣接する孤立ランである孤立突起を選出し、当該孤立突起の数を用いて、前記入力画像中に斑状のノイズが含まれるか否かを判定する。さらに、画質補正処理部は、斑状ノイズ判定処理部による判定結果を用いて、文字パタン毎に画質補正を行う。
文字認識処理を行う場合には、さらに、前記文字行領域から個々の文字を表す文字パタンを生成する文字切り出し処理部と、生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別処理部と、を設ければよい。
さらに、具体的には、画質補正処理部は、斑状ノイズ判定処理部の判定結果に応じて、ぼかし処理を実施するか決定し、当該ぼかし処理を行う場合にはぼかしの度合いを調整して前記文字パタンの画像にぼかし処理を施す。そして、文字識別処理部は、ぼかし処理が施された文字パタンに対して文字識別処理を実行する。なお、文字識別処理部は、文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、文字サイズが所定サイズより大きい場合には前記基本識別処理の結果を識別結果とする。
さらなる本発明の特徴は、以下本発明を実施するための最良の形態および添付図面によって明らかになるものである。
本発明によれば、入力された画像中から文字を認識する際、多様な斑状ノイズが発生した場合にも高精度な文字認識結果を得ることが可能となる。
本発明の実施の形態の文字認識処理の全体を示すフローチャートである。 本発明の実施の形態の文字認識装置の構成の一例を示すブロック図である。 本発明の実施の形態の文字認識装置の構成の一例を示すブロック図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態の斑状ノイズの例を示す図である。 本発明の実施の形態のランの長さの頻度分布を示す図である。 本発明の実施の形態のランによる斑状ノイズ画質の判定のフローチャートである。 本発明の実施の形態のランの結合を示す図である。 本発明の実施の形態のランの除去を示す図である。 本発明の実施の形態の入力画像の画質補正のフローチャートである。 本発明の実施の形態のランによる画質判定結果に基づく画質補正の例を示す図である。 本発明の実施の形態のランによる画質判定結果に基づく画質補正の例を示す図である。 本発明の実施の形態の孤立突起を示す図である。 本発明の実施の形態の文字パタン毎の画質補正のフローチャートである。 本発明の実施の形態のガウスフィルタによるぼかし処理のフローチャートである。 本発明の実施の形態のガウスフィルタを示す図である。 本発明の実施の形態のガウスフィルタによるぼかし処理の例を示す図である。 本発明の実施の形態の文字パタン毎の画質補正のフローチャートである。 一般的な文字認識処理の全体を示すフローチャートである。 一般的な文字切り出しネットワークの例を示す図である。 一般的な文字識別のフローチャートである。 ランの長さの頻度割合分布による斑状ノイズ画質判定結果(1)を示す図である。 ランの長さの頻度割合分布による斑状ノイズ画質判定結果(2)を示す図である。
本発明は、文字認識処理を高精度に行うための前処理であって、特に、入力画像に斑状ノイズが含まれる場合の画像処理(前処理)に関するものである。
以下、添付図面を参照して本発明の実施形態について説明する。ただし、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。また、各図において共通の構成については同一の参照番号が付されている。
<文字認識装置の構成>
図2は、本発明の実施形態の一態様に係る文字認識装置の概略構成例を示すブロック図である。図2による文字認識装置208は、通信装置201と、画像取得装置202と、表示装置203と、外部記憶装置204と、メモリ205と、CPU(Central Processing Unit)206と、キーボードやマウスなどの入力装置207とを備え、これらの各構成はPCIバスなどの通信線で接続されている。図2の装置の代表例として、PC(Personal Computer)にスキャナやOCRが接続されたものがある。
本実施形態の文字認識方法を実行するプログラムは、外部記憶装置204及び/又はメモリ205等の記憶装置に格納され、CPU206によって実行される。CPU206に入力される文字を含む画像は、複合機、スキャナ、OCR又はデジタルカメラなどの画像取得装置202又は通信装置201から入力されてもよい。また、文字を含む画像は外部記憶装置204に記憶されてもよい。代表的な装置の例として、パーソナルコンピュータとディスプレイと複合機が接続されている装置がある。
文字認識の結果は、表示装置203に出力される。また、文字認識の結果は、通信装置201を経由して外部に出力されてもよく、文字認識装置208で実行される他のプログラムに用いられてもよい。
図3は、本発明の実施形態の他の形態に係る文字認識装置の概略構成を示すブロック図である。図3による文字認識装置307は、通信装置301と、画像スキャン装置302と、表示装置303と、メモリ304と、CPU(Central Processing Unit)305と、ボタンなどの入力装置306とを備え、これらの各構成はPCIバスなどの通信線で接続されている。図3の装置の代表例として複合機がある。
文字認識方法を実行するプログラムは、メモリ304の記憶装置に格納され、CPU305によって実行される。CPU305に入力される文字を含む画像は、ラインスキャナなどの画像スキャン装置302から取得される。文字認識の結果は、通信装置301を経由して外部に出力される。また、文字認識の結果は、表示装置303に出力されてもよく、文字認識装置307で実行される他のプログラムに用いられてもよい。
<斑状のノイズの例>
図4乃至8は、斑状ノイズを含む文書画像の例である。斑状ノイズは、その様式の違いにより複数の種類に分けて考えることができる。例えば、図4及び5では文字の大きさが異なるため、個々の文字に発生する斑状ノイズの量が異なる。また、図4及び5では文字を構成するストロークの外部に斑状ノイズが発生しているが、図6及び7では文字を構成するストロークの内部に斑状ノイズが発生している。
図7及び8は、文字を構成するストロークの内部に斑状ノイズが発生している点では同じである。ただし、図7では文字の輪郭にもノイズが含まれているのに対し、図8では文字の輪郭にはノイズが含まれていない。
また、図4や図5で発生している斑状ノイズは高さ或いは幅が1ピクセルであることが多いのに対し、図9の例では高さ或いは幅は3ピクセル以上のものも存在し、図10の例では高さ或いは幅が2ピクセルとなっている。
以上のような多様な斑状ノイズを含む文書画像から文字を高精度に認識することは、従来の方法ではできない。
<一般的な文字認識処理の内容>
本発明の実施形態による文字認識処理を説明する前に、一般的な文字認識処理について説明する。図24は、一般的な文字認識処理の全体を示すフローチャートである。特に断らない限り、各ステップの動作主体はCPU206又は305のような制御部とする。
図24において、文字行抽出処理(S2402)では、入力画像2401が入力され、文字が並んでいる領域となる文字行領域が複数抽出される。ここでは、はじめに水平方向の連続する黒画素の連なりであるランが生成され、上下に接するランが結合される連結成分が生成され、水平方向或いは垂直方向に連続して並んでいる連結成分の領域が抽出され、得られた領域が文字行領域として出力される。そして、この文字行抽出処理(S2402)以降の処理は、文字行領域毎に順番に処理される。
罫線除去処理(S2403)では、文字行領域の画像と連結成分が入力され、画像内にある罫線が除去された画像と、罫線が除去された画像から生成された連結成分が出力される。
孤立点ノイズ除去処理(S2404)では、罫線除去された画像とその連結成分が入力され、画像内にある孤立したノイズが除去された画像とノイズが除去された画像から生成された連結成分が出力される。
文字切り出し処理(S2405)では、ノイズが除去された連結成分が入力される。そして、複数の連結成分を纏める、連結成分を切断することが行われ、図25に示す複数の文字パタン2402が生成される。そして、文字パタンがネットワーク化された文字切り出しネットワーク2501が出力される。
さらに、基本文字識別処理(S2406)では、文字切り出しネットワークが入力され、個々の文字パタンの識別候補が出力される。文字識別の方法には様々な方法があるが、図26に基本的な例を示す。
図26を用いて文字識別の処理を説明すると、はじめに、特徴抽出処理(S2602)において、文字パタン2601が入力され、文字パタンの特徴が抽出される。特徴は、n次元のベクトルとして出力され、これを特徴ベクトルと呼ぶ。
次に、距離計算処理(S2603)において、特徴ベクトルと辞書が入力され、文字パタンの識別候補が出力される。辞書には予め識別対象となる文字種毎の特徴ベクトルが格納されており、距離計算処理(S2603)では、文字パタン2601の特徴ベクトルと辞書の中にある文字種数の特徴ベクトルとの距離値がそれぞれ計算される。そして、距離値が小さい文字種が順にn個選出され、文字候補2605となる。nは一般に1〜20くらいに収まる。また、距離値が小さいほど値が大きくなる変換を行い、距離値を変換した値である識別尤度が、文字候補には含まれる。整理すると、文字候補2605には、文字種と文字種に対応する識別尤度がn個含まれる。識別尤度が高い文字種が、文字パタンの正しい文字種である確率が高い。
図24に戻り、知識処理(S2407)では、識別候補が付加された文字切り出しネットワークが入力され、ネットワーク上で、識別尤度の平均値が高くなるように文字パタンと文字種のパスが選択され、その文字種の並びが認識結果2408として出力される。この際、予め用意された単語のリスト中にある単語と文字種の並びが照合される場合に、照合された文字種が優先して出力されるようにする方法などもある。これは非特許文献1に詳しく記載されている。
<本発明による文字認識処理の全体>
図1は、本発明の実施形態による文字認識処理の全体を示すフローチャートである。特に断らない限り、各ステップの動作主体はCPU206又は305のような制御部とする。
図1において、ランによる斑状ノイズ画質判定処理(S102)では、入力画像101から複数種類の斑状ノイズが検出される。当該処理の詳細内容については後述する。
入力画像の画質補正処理(S103)では、入力画像のランが入力され、ランによる斑状ノイズ画質判定処理(S102)の判定結果に基づき、入力画像101の画質が補正された画像が出力される。当該処理の詳細内容については後述する。
そして、文字行抽出処理(S104)では、一般的な文字認識処理(図24参照)の文字行抽出処理(S2402)と同じ処理が行われる。
さらに、罫線除去処理(S105)では、一般的な文字認識処理(図24参照)の罫線除去(S2403)と同じ処理が行われる。
また、孤立点ノイズ除去処理(S106)では、一般的な文字認識処理(図24参照)の孤立点ノイズ除去処理(S2404)と同じ処理が行われる。
文字切り出し処理(S107)では、一般的な文字認識処理(図24参照)の文字切り出し処理(S2405)と同じ処理が行われる。
続いて、孤立突起による斑状ノイズ画質判定処理(S108)では、文字行領域の画像と文字行領域内のランと連結成分が入力され、ランによる斑状ノイズ画質判定とは異なるアプローチで斑状ノイズの検出が行われる。当該処理の詳細内容については後述する。
また、文字パタン毎の画質補正処理(S109)では、文字パタンと孤立突起による斑状ノイズ画質判定処理(S108)の結果が入力され、図19のように画像縮小処理或いはぼかし処理が適時実行される。当該処理の詳細内容については後述する。
孤立突起による斑状ノイズ画質判定処理(S108)と文字パタン画質補正処理(S109)の処理が行われることにより、斑状ノイズを含む場合に文字パタンにぼかし処理を施して斑状ノイズの影響を軽減することができる。
さらに、画質補正がなされた文字パタンに対して、文字識別処理(S110)が実行される。当該処理の詳細内容については後述する。
最後に、知識処理(S111)が実行される。知識処理では、一般的な文字認識処理の知識処理(S2407)と同じ処理が行われる。
<斑状のノイズ画質判定処理(S102)の詳細>
斑状のノイズ画質判定処理では、まず、水平方向に連続に連なる黒画素であるランが抽出される。また、垂直方向に連続に連なる黒画素であるランが抽出される。水平方向に辿って生成されたランを水平方向ラン、垂直方向に辿って生成されたランを垂直方向ランと呼ぶ。
次に、図11に示すように、抽出された水平方向ランと垂直方向ランを合わせて、ランの長さを横軸とする頻度分布であるランの頻度分布が生成される。次にランの頻度分布中の各頻度を、すべての水平方向ランとすべての垂直方向ランを足した数で割った分布である、ランの頻度割合分布が生成される。
そして、図12に示すランによる斑状ノイズ画質の判定ルールにより、3種類の斑状ノイズ画質であるかどうかが判定される。図12は、斑状ノイズの画質(斑状ノイズの種類)を判定する処理を説明するためのフローチャートである。
はじめに、単位面積当たりのランの数が予め定められた値THqpnum以上であるかどうかを判定(S1202)し、Thpqnum以上であれば次に進む。Thqpnum未満であれば斑状ノイズが存在しないとして終了する。以下では、各判断ステップでNoの場合は、当てはまる斑状ノイズが存在しないと判断される。なお、以降のプロセスは頻度割合分布を用いて判定される。判定する斑状ノイズの種類毎に分かれており、斑状ノイズの種類は3種類あるものとして説明するが、3種類に限定されるものではないのは勿論のことである。
i)まず1種類目の斑状ノイズの判定処理について説明する。はじめに、ランの長さ1の頻度割合が閾値TH1_1以上かどうか判定され(S1203)、閾値TH1_1以上であれば次に進む。
次に、ランの長さ9の頻度割合が閾値TH1_2以上かどうか判定され(S1204)、閾値TH1_2以上であれば次に進む。最後に、ランの長さが4以上7以下の頻度割合が閾値TH1_3以下かどうか判定され(S1205)、閾値TH1_3以下であれば、斑状ノイズ画質1(S1206)と判定される。
S1203、S1204、及びS1205で用いるランの長さを変更することで検出する斑状ノイズの種類は変更することができる。また、閾値の値を変更することによっても検出する斑状ノイズの種類を変更することができる。
図9の部分画像では、文字のサイズが大きく、ノイズのサイズも大きく、ストロークの周囲に大量のノイズが発生している。このような部分画像を含む画像の頻度割合分布は図27のようになる。ランの長さが短いランの数が多く、中間的な長さのランが少なく、長いランの数が多くなるため、これに合わせたパラメタを設定することで、図9の斑状ノイズが検出することができる。例えば上記パラメタをTH1_1=0.4、TH1_2=0.04、TH1_3=0.1とすることで、図9のような斑状ノイズを検出することができる。
ii)2種類目以降の斑状ノイズについても1種類目の斑状ノイズと同じように判定する。2種類目の斑状ノイズの判定処理では、はじめに、ランの長さ1の頻度割合が閾値TH2_1以上かどうか判定され(S1207)、閾値TH2_1以上であれば次に進む。次に、ランの長さ9の頻度割合が閾値TH2_2以上かどうか判定され(S1208)、閾値TH2_2以上であれば次に進む。
最後に、ランの長さが3以上5以下の頻度割合が閾値TH2_3以上かどうか判定され(S1209)、閾値TH2_3以上であれば、斑状ノイズ画質2と判定される(S1210)。
図6の部分画像では、文字のサイズが小さく、ノイズのサイズも小さく、ストロークの内部にノイズが発生している。このような部分画像を含む画像の頻度割合分布は図28のようになる。ランの長さが短いランの数が多く、中間的な長さのランも多く、長いランの数がわずかにあるため、これに合わせたパラメタを設定することで、図6の斑状ノイズが検出することができる。ここでの閾値の値は、TH2_1=0.2、TH2_2=0.04、TH2_3=0.3とすることで、図6のような斑状ノイズを検出することができる。
iii)3種類目の斑状ノイズ判定処理では、はじめに、ランの長さ1の頻度割合が閾値TH3_1以上かどうか判定され(S1211)、閾値TH3_1以上であれば次に進む。
次に、ランの長さ9の頻度割合が閾値TH3_2以上かどうか判定され(1212)、閾値TH3_2以上であれば次に進む。
最後に、ランの長さが3以上5以下の頻度割合が閾値TH3_3以上かどうか判定され(S1213)、閾値TH3_3以上であれば、斑状ノイズ画質3と判定される(1214)。この判定は、閾値が異なるだけで2つ目の斑状ノイズ画質2の判定と同じである。
なお、ここでの閾値の値は、TH3_1=0.3、TH3_2=0.04、TH3_3=0.2とする。斑状ノイズ画質2の判定と比較し、ランの長さ1の頻度割合に対する閾値を大きくし、中間的な長さのランの頻度割合の閾値を小さくしている。図6の画像ではストロークの内部にノイズが発生していたのに対し、この閾値にすることにより、ストロークの周囲にノイズが発生した場合を検出できる。
<入力画像の画質補正処理(S103)の詳細>
画質の補正処理では、図13に示すランの結合による補正と図14に示すランの除去による補正が実行される。
図13は、水平方向のランに対するランの結合について説明するための図である。1つのラン1301とそれに隣り合うラン1302の距離がWp1303以下であれば、ラン1301とラン1302の隙間を埋めるようにランが結合され、ラン1304が出力される。垂直方向へも同様の処理が行われる。これにより、Wpの値を調整することができる。
一方、図14は、水平方向のランに対するランの除去を説明するための図である。1つのラン1401の幅がWq1402以下であれば、ラン1401は除去される。垂直方向へも同様の処理が行われる。これにより、Wqの値を調整することができる。
図15は、ランによる斑状ノイズ画質判定処理(S102)の判定結果に基づき、ランの結合処理とランの除去処理がどのように起動するかを説明するためのフローチャートである。入力画像のラン1502とランによる斑状ノイズ判定結果1502が入力され、これに基づいて画質補正処理が実行される。
はじめに、斑状ノイズ画質1であるか否か判断される(S1503)。斑状ノイズ画質1であるならば、ラン除去処理[Wp=2](S1507)が行われ、さらにラン除去処理[Wq=2](S1508)が行われる。Wp=2は、Wp1303の値が2であることを示す。また、Wq=2は、Wq1402の値が2であることを示す。2つの処理が行われたランが入力画像の画質補正の出力結果となる。
一方、斑状ノイズ画質1でない場合、斑状ノイズ画質2であるか否か判断される(S1504)。斑状ノイズ2であるならば、ラン除去処理[Wp=1](S1509)が行われ、さらにラン除去処理[Wq=1](S1510)が行われる。2つの処理が行われたランが入力画像の画質補正の出力結果となる。
さらに、斑状ノイズ画質2でない場合、次に斑状ノイズ画質3であるか否か判断される(S1505)。斑状ノイズ3であるならば、ラン除去処理[Wp=1](S1511)のみが行われる。この処理が行われたランが入力画像の画質補正の出力結果となる。
以上のように、パラメータを変えてラン除去処理とラン結合処理を利用することにより、複数種類の斑状ノイズ画質の補正を行うことができる。なお、ラン除去処理とラン結合処理の実行順番を変える、即ち、ラン除去処理[Wp=1]を行い、ラン結合処理[Wq=2]を行い、さらにラン除去処理[Wq=3]を行うことも考えられる。このように、ラン除去処理のWqとラン結合処理のWqと実行順番と実行回数を変えることで、様々な斑状ノイズ画質の補正を行うことができる。
図16は、ランによる画質判定処理(S102)により斑状ノイズ画質1と判定され、画質補正された場合の例を示す図である。1601が入力画像であり、画質補正後の画像が1602である。
図17は、ランによる画質判定処理(S102)により斑状ノイズ画質2と判定され、画質補正された場合の例を示す図である。1701が入力画像であり、画質補正後の画像が1702である。
ランによる斑状ノイズ画質判定処理(S102)と入力画像画質補正処理(S103)の処理が行われることにより、図4乃至10のような斑状ノイズが減少するため、文字を高精度に認識することが可能となる。
<孤立突起による斑状ノイズ画質判定処理(S108)の詳細>
孤立突起による斑状ノイズ画質判定処理(S108)では、文字行領域の画像と文字行領域内のランと連結成分が入力され、ランによる斑状ノイズ画質判定とは異なるアプローチで斑状ノイズの検出が行われる。
ここでは、図18に示す孤立突起1801の検出処理について説明する。本明細書では、長さが1のランを孤立ランと呼ぶが、孤立突起とは、上下どちらかにのみ他のランが隣接する水平方向の孤立ランと、左右どちらかにのみ他のランが隣接する垂直方向の孤立ランである。補足として、上下どちらにもほかのランが隣接しない水平方向の孤立ランと、左右どちらにも他のランが隣接しない垂直方向のランを孤立点1802と呼ぶ。
図4及び6の例に示されるような斑状ノイズの場合、孤立突起が多く存在する。そのため、これを利用して次の数式により斑状ノイズの検出を行う。文字行ないの孤立突起の数をNnum、文字行の高さをLh、文字行の幅をLwとする。また、連結成分を垂直方向に投影してヒストグラムを作成し、そのヒストグラム中の頻度が0の部分の割合をHist0rateとする。このとき、以下の(式1)を満たす場合は、斑状ノイズがあると判定する。
Figure 0005222776
以上のような処理を行うことにより、孤立突起についても検出することができるようになる。
<文字パタン毎の画質補正処理(S109)の詳細>
文字パタン毎の画質補正処理(S109)では、文字パタンと孤立突起による斑状ノイズ画質判定処理(S108)の結果が入力され、図19のように画像縮小(S1902)とぼかし処理(S1904)が適時実行される。
図19は、文字パタン毎の画質補正処理の詳細を説明するためのフローチャートである。はじめに、入力された文字パタンの高さ或いは幅が80ピクセル以上であるか否かを判定される(S1901)。入力文字パタンの高さ或いは幅が80ピクセル以上であれば、文字パタンは画像縮小処理が実行される(S1902)。そして画像縮小された文字パタンが出力される。画像の縮小方法には様々な方法を適用できるが、例えば1/2にOR縮小する。1/2縮小とは、2x2の4画素の領域を1画素に縮小する処理である。OR縮小とは、4画素中に1画素以上黒画素があれば縮小画素を黒にし、全てが白である場合のみ縮小画素を白にする縮小方式である。大きな文字パタンの場合、画像縮小しても文字がつぶれずに斑状ノイズを削減できる。
一方、文字パタンの高さ或いは幅が80ピクセル未満の場合、処理はS1903に進む。ここでは、「文字パタンの高さ或いは幅が40ピクセル以上であること」及び「孤立突起による斑状ノイズ判定により斑状ノイズありと判定されていること」の2つの条件をいずれか満たす場合に、文字パタンはぼかし処理が実行される(S1904)。
なお、S1903では、3種類目のランによる斑状ノイズ判定により斑状ノイズありと判定されている場合を加えて、3つのいずれかを満たす場合に、文字パタンがぼかし処理(S1904)が実行されるようにしても良い。
ぼかし処理(S1904)の方法には様々な方法が適用できるが、例としてガウスフィルタを用いた処理(図20参照)が挙げられる。図20では、はじめに、文字パタンの2値画像が多階調化される(S2001)。多階調化とは、各画素を0から255の値で表現することであり、ここでは2値画像の黒画素を0、白画素を255へ変換する。
次に、ガウスフィルタ処理(S2002)において、多階調化された画像にガウスフィルタによってぼかしがかけられる。ガウスフィルタとは、平滑化フィルタの1つである。一番単純な平滑化は周囲の画素値の平均値を取ることであるが、これに対してガウスフィルタは画素の空間的配置を考慮して、対象画素に近い画素に大きな重みを、対象画素から遠い画素には小さい重みをつけた加重平均を取る。この重み付けにガウス関数を用いているものである。2次元のガウス関数は、(式2)のように表される。
Figure 0005222776
このフィルタの大きさを3×3、σ=1にして整数化したフィルタを図21に示す。このガウスフィルタ2101をすべての画素に対してかけることによってぼかし処理が行われる。補足として、フィルタ処理前の画像をI、フィルタをBとすると、フィルタ処理後の画像IBは次の(式3)のように表される。
Figure 0005222776
最後に、ガウスフィルタ処理後の画像について2値化処理が実行される(S2003)。2値化の方法には様々な方法があるが、例えば、pタイル法や大津の方法などがある。そして、2値化された画像が出力される。
図22は、入力文字パタンの画像2201とガウスフィルタ後の画像2202と2値化後の画像2203を示す図である。図22に示されるように、ぼかし処理を行った後に2値化すると、文字パタンがより鮮明になり、この後に行われる文字認識が高精度に実行可能となる。
なお、図19の処理では、S1903の判定により、ぼかし処理を行うか否かを決定している。これに加えて、斑状ノイズの判定結果の種類により、ぼかし処理(S1904)の度合いを変化させることもできる。例えば、斑状ノイズの1つの種類である斑状ノイズ画質1と判定された画像の場合は、前記がガウスフィルタのサイズを5×5にして、σ=2とすることにより、より広範囲に大きなぼかしをかけることができる。
<文字識別処理(S110)の詳細>
文字識別処理(S110)は、図1に示されるように、小サイズ斑状ノイズパタン選択処理(1101)と基本文字識別処理(1102)と小サイズ斑状ノイズ用文字識別処理(1103)と識別結果統合処理(1104)とから構成される。
斑状ノイズを含む文字パタンのうちサイズが小さい文字パタンは、通常、画質が特に劣化している場合が多い。そのため、入力画像画質補正処理(S103)や文字パタン画質補正処理(S109)において画質補正により画質が改善したとしても、文字を読み取りにくい場合がある。このような場合、ノーマルな文字識別である基本識別(1102)が出力する識別候補(例えば上位15個)に正解が入らない場合がある。識別候補に正しい候補が入っていれば、後段の処理にある知識処理(S111)の中で、予め備えてある単語リストと照合し、正しい候補を決定することができるが、識別候補に入っていなければ正しい結果を得ることができない。
これに対し、劣化した文字パタンを予め学習しておくことで認識精度を高めることが考えられる。ただし、劣化度合いが大きくなければ識別器の認識ロバスト性は向上するが、大きく劣化した文字パタンを学習すると、通常のきれいな文字パタンの認識精度が低下してしまう。
そこで、本発明の実施形態では、ノーマルな文字や劣化度合いの低い文字を学習した辞書を参照する基本文字識別処理(1102)とノーマルな文字と大きく劣化した文字を学習した辞書を参照する小サイズ斑状ノイズ用文字識別処理(1103)を実行できるようにしておき、斑状ノイズを含む小さい文字パタンに対してのみ大きく劣化した文字パタンを学習した文字識別の識別結果を使う。ただし、必ずしも斑状ノイズの判定結果が正しいとは限らない、必ずしも小さい文字パタンだからといって認識が困難な文字とは限らない。そのため、斑状ノイズを含む小さい文字パタンと判定された際には、基本文字識別処理(1102)による識別結果と小サイズ斑状ノイズ用文字識別処理(1103)の識別結果の両方を用いて識別候補とする。これによって、正しい候補が識別候補に含まれるようになるため、認識精度が向上する。
図23は、文字識別処理の詳細を説明するためのフローチャートである。はじめに、小サイズ斑状ノイズ文字かどうか判定される(S2308)。この判定は、文字行の高さとランによる斑状ノイズ判定の結果と孤立突起による斑状ノイズ判定の結果が入力され、文字行の高さが予め定められた閾値THh以下であり、いずれかの斑状ノイズと判定されている場合にYES、それ以外はNOである。
YESの場合、基本文字識別処理(S2309)と斑状ノイズ用文字識別処理(S2311)の両方が実行される。基本文字識別処理(S2309)は、ノーマルな文字と劣化の度合いの低い文字を学習した辞書2310を参照して実行される。斑状ノイズ用文字識別処理(S2311)は、ノーマルな文字と大きく劣化した文字を学習した辞書2312を参照して実行される。
そして、認識結果統合処理(S2313)において、基本文字識別結果のうち上位5位の文字種と、斑状ノイズ文字識別結果のうち上位10位の文字種とを合わせて15個の文字種が出力される。この際、基本文字識別結果の上位5個と斑状ノイズ用文字識別結果の上位10位に重複する文字種がある場合には、同じ文字種の一つが削除され、斑状ノイズ用文字識別結果のうち上位10位に続く識別候補が追加される。これを重複がなくなるまで行う。基本識別の上位n個と斑状ノイズ用文字識別の上位m個を合わせて出力する際、nとmは変更可能である。
一方、S2308でNOの場合、基本文字識別処理(S2309)のみが実行され、基本識別の上位15個の文字種が出力される。
<その他>
本発明は、文字認識処理のための前処理だけでなく、画像に斑状ノイズが存在する場合に画質を改善した後に行われるあらゆる処理の前処理として用いることができる。
なお、本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
また、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
101・・・入力画像
102・・・ランによる斑状ノイズ゛画質判定
103・・・入力画像の画質補正
104・・・文字行抽出
105・・・罫線除去
106・・・孤立点ノイズ除去
107・・・文字切り出し
108・・・孤立突起による斑状ノイズ゛画質判定
109・・・文字パタン毎の画質補正
110・・・小サイズ斑状ノイズパタン選択
111・・・基本文字識別
112・・・小サイズ斑状ノイズ用文字識別
113・・・識別結果統合
114・・・知識処理
115・・・認識結果

Claims (7)

  1. 入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、当該ランの長さ毎に計測したランの頻度分布であるラン長頻度分布を生成し、当該ラン長頻度分布を用いて、複数種類ある斑状のノイズを検出する斑状ノイズ画質判定処理部と、
    斑状ノイズ画質判定処理部によって検出された複数の斑状ノイズ判定結果に応じて、前記入力画像に対して画質の補正を行う画質補正処理部と、
    前記入力画像内において、文字が並んでいる領域である文字行領域を抽出する文字行抽出処理部と、
    前記文字行領域から個々の文字を表す文字パタンを生成する文字切り出し処理部と、
    前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別処理部と、を備え
    前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理装置。
  2. 前記斑状ノイズ画質判定処理部は、前記ラン長頻度分布の各頻度、或いは各頻度を足した値を予め定められた複数の閾値を用いて、閾値処理することによって、前記複数の斑状ノイズを検出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記画質補正処理部は、
    予め定められたラン除去用閾値Tp以下の長さであるランを除去するラン除去処理部と、
    隣り合う2つのランを入力とし、それらの距離が予め定められたラン結合用閾値Tq以下である場合にその2つのランを結合するラン結合処理部と、を備え、
    前記斑状ノイズ画質判定処理部によって検出された斑状ノイズの種類に応じて、前記ラン除去処理部によるラン除去処理と前記ラン結合処理部によるラン結合処理の実行順番と実行回数を変えながら、前記入力画像の画質を補正することを特徴とする請求項1に記載の画像処理装置。
  4. 入力画像から文字が並んでいる領域である文字行領域を抽出する文字行抽出処理部と、
    文字を含む前記入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、長さが1の水平方向又は垂直方向のランである孤立ランを選出し、上下左右の何れかにのみランが隣接する孤立ランである孤立突起を選出し、当該孤立突起の数を用いて、前記入力画像中に斑状のノイズが含まれるか否かを判定する斑状ノイズ判定処理部と、
    前記斑状ノイズ判定処理部による判定結果を用いて、文字パタン毎に画質補正を行う画質補正処理部と、
    前記文字行領域から個々の文字を表す文字パタンを生成する文字切り出し処理部と、
    前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別処理部と、を備え
    前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理装置。
  5. 前記画質補正処理部は、前記斑状ノイズ判定処理部の判定結果に応じて、ぼかし処理を実施するか決定し、当該ぼかし処理を行う場合にはぼかしの度合いを調整して前記文字パタンの画像にぼかし処理を施し、
    前記文字識別処理部は、前記ぼかし処理が施された文字パタンに対して文字識別処理を実行することを特徴とする請求項に記載の画像処理法装置。
  6. 画像処理装置における画像処理方法であって、
    前記画像処理装置は、斑状ノイズ画質判定処理部と、画質補正処理部と、文字行抽出処理部と、文字切り出し処理部と、文字識別処理部と、を備え、
    前記画質処理方法は、
    前記斑状ノイズ画質判定処理部が、入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、当該ランの長さ毎に計測したランの頻度分布であるラン長頻度分布を生成し、当該ラン長頻度分布を用いて、複数種類ある斑状のノイズを検出する工程と、
    前記画質補正処理部が、前記斑状ノイズ画質判定処理部によって検出された複数の斑状ノイズ判定結果に応じて、前記入力画像に対して画質の補正を行う工程と、
    前記文字行抽出処理部が、前記入力画像内において、文字が並んでいる領域である文字行領域を抽出する工程と、
    前記文字切り出し処理部が、前記文字行領域から個々の文字を表す文字パタンを生成する工程と、
    前記文字識別処理部が、前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する工程と、を備え
    前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理方法。
  7. 画像処理装置における画像処理方法であって、
    前記画像処理装置は、文字行抽出処理部と、斑状ノイズ判定処理部と、画質補正処理部と、文字切り出し処理部と、文字識別処理部と、を備え、
    前記画質処理方法は、
    前記文字行抽出処理部が、入力画像から文字が並んでいる領域である文字行領域を抽出する工程と、
    前記斑状ノイズ判定処理部が、文字を含む前記入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、長さが1の水平方向又は垂直方向のランである孤立ランを選出し、上下左右の何れかにのみランが隣接する孤立ランである孤立突起を選出し、当該孤立突起の数を用いて、前記入力画像中に斑状のノイズが含まれるか否かを判定する工程と、
    前記画質補正処理部が、前記斑状ノイズ判定処理部による判定結果を用いて、文字パタン毎に画質補正を行う工程と、
    前記文字切り出し処理部が、前記文字行領域から個々の文字を表す文字パタンを生成すると、
    前記文字識別処理部が、前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する工程と、を備え
    前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理方法。
JP2009095125A 2009-04-09 2009-04-09 画像処理装置及び方法 Expired - Fee Related JP5222776B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009095125A JP5222776B2 (ja) 2009-04-09 2009-04-09 画像処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009095125A JP5222776B2 (ja) 2009-04-09 2009-04-09 画像処理装置及び方法

Publications (2)

Publication Number Publication Date
JP2010244472A JP2010244472A (ja) 2010-10-28
JP5222776B2 true JP5222776B2 (ja) 2013-06-26

Family

ID=43097390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009095125A Expired - Fee Related JP5222776B2 (ja) 2009-04-09 2009-04-09 画像処理装置及び方法

Country Status (1)

Country Link
JP (1) JP5222776B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5830996B2 (ja) 2011-07-19 2015-12-09 富士ゼロックス株式会社 画像処理装置及びプログラム
JP7267854B2 (ja) * 2019-06-26 2023-05-02 日立チャネルソリューションズ株式会社 帳票認識装置、帳票認識方法、及び帳票認識システム
CN111508017B (zh) * 2020-04-08 2023-11-03 中导光电设备股份有限公司 一种弱对比度定位标记中心的方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0390971A (ja) * 1989-09-01 1991-04-16 Oki Electric Ind Co Ltd 文字背景処理装置
JPH05120488A (ja) * 1991-10-29 1993-05-18 Ricoh Co Ltd 線図形認識方法
JP3163698B2 (ja) * 1991-12-24 2001-05-08 松下電器産業株式会社 文字認識方法
JP3449392B2 (ja) * 1996-08-27 2003-09-22 日本電信電話株式会社 識別関数学習方法
JPH1196296A (ja) * 1997-09-19 1999-04-09 Nippon Telegr & Teleph Corp <Ntt> 帳票イメージ処理方法および装置
JP4050677B2 (ja) * 2003-05-29 2008-02-20 株式会社リコー 画像処理装置、画像処理方法及びプログラム並びに記録媒体

Also Published As

Publication number Publication date
JP2010244472A (ja) 2010-10-28

Similar Documents

Publication Publication Date Title
JP5624004B2 (ja) ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法
JP5566811B2 (ja) プリントアンドスキャン文書の画像評価のためのボケ除去および監視適応的スレッショルディング
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7623712B2 (en) Image processing method and apparatus
US8594431B2 (en) Adaptive partial character recognition
JP4469873B2 (ja) 画像文書の検索装置、プログラム、及び記録媒体
US8384964B2 (en) Image processing apparatus and image processing method
WO2007127085A1 (en) Generating a bitonal image from a scanned colour image
JP2007504719A (ja) 組み込みアプリケーションに適した、画像における赤目の検出と補正を行うシステム及び方法
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US8611658B2 (en) Image processing apparatus and image processing method
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
US20210192262A1 (en) Apparatus for processing image, storage medium, and image processing method
US8229214B2 (en) Image processing apparatus and image processing method
JP5222776B2 (ja) 画像処理装置及び方法
CN114863431A (zh) 一种文本检测方法、装置及设备
US20230062113A1 (en) Information processing apparatus, information processing method and non-transitory storage medium
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
JP2008147712A (ja) 画像処理装置および画像処理方法
JP3830350B2 (ja) カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体
JP5517028B2 (ja) 画像処理装置
Sherkat et al. Use of colour for hand-filled form analysis and recognition
KR20140063378A (ko) 화상형성장치, 화상형성방법 및 컴퓨터 판독가능 기록매체
Konya et al. Adaptive methods for robust document image understanding
US20220415025A1 (en) Information processing apparatus, information processing method, non-transitory computer-readable storage medium storing program, and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130311

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees