JP2015046001A - 文字認識装置、文字認識システム、文字認識方法および文字認識プログラム - Google Patents

文字認識装置、文字認識システム、文字認識方法および文字認識プログラム Download PDF

Info

Publication number
JP2015046001A
JP2015046001A JP2013176829A JP2013176829A JP2015046001A JP 2015046001 A JP2015046001 A JP 2015046001A JP 2013176829 A JP2013176829 A JP 2013176829A JP 2013176829 A JP2013176829 A JP 2013176829A JP 2015046001 A JP2015046001 A JP 2015046001A
Authority
JP
Japan
Prior art keywords
color
character
image
pixels
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013176829A
Other languages
English (en)
Inventor
青木 勝彦
Katsuhiko Aoki
勝彦 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013176829A priority Critical patent/JP2015046001A/ja
Publication of JP2015046001A publication Critical patent/JP2015046001A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

【課題】多色で構成される帳票画像から、当該帳票に記入された文字の色を分別して、文字認識をする文字認識装置、文字認識方法および文字認識プログラムを提供する。【解決手段】文字認識装置は、文字記入位置に関する図形が文字記入色と異なる色で形成された帳票の画像データが入力されて、当該帳票に記入された文字の文字認識を行う文字認識装置において、入力された画像データから得られる帳票画像に対し二値化により黒画素となる画素の情報を少なくとも含む二値化データを生成する画像二値化部(31)と、二値化データにおける黒色の黒画素を特定し、黒画素と同じ位置の帳票画像の対象画素に対して色の判定を行い、対象画素を文字記入色の画素と文字記入色以外の色の画素に分別する処理を行う色分別処理部(32)と、文字記入色の画素で形成される文字画像データの画像に対して文字認識を行う文字認識処理部(33)とを備える。【選択図】図1

Description

本発明は、文字認識装置、文字認識システム、文字認識方法および文字認識プログラムに関し、特に、帳票に印刷された記入枠に記入された文字を認識する技術に関する。
特許文献1に記載の画像処理装置は、画像データに減色処理を行って、減色後の各色の領域を抽出し、領域を構成する画素から複数の特徴量を取得して、「図又は写真領域」であるのか、「それ以外(背景)」であるのかを判定する。
特許文献2に記載の画像領域分割装置は、輝度や彩度が閾値以上の画素が多い領域を分割し、高彩度領域、低彩度領域、グラデーション領域に分割する。
特許文献3に記載の光学文字読取装置は、抽出した各画素の色情報のうち、彩度および輝度が閾値以下のものは無彩色として除外し、残りの色情報から特徴量を抽出して色を識別する。
特許文献4に記載の帳票読み取り装置は、カラー画像を次のステップで処理して、記入枠を除去し文字だけの画像を生成し、その文字画像に文字認識を行う。
(1)印刷された文字記入枠を残すような二値化閾値を決めて、カラー画像を二値画像に変換する。
(2)二値画像を用いて、記入枠部分を抽出し、記入枠の枠線の位置座標などの情報を取得する。
(3)記入枠の枠線の位置座標を用いて、カラー画像から枠線の色を求め、その色をドロップアウトカラーとする。
(4)カラー画像から、求めたドロップアウトカラーを除去した画像を作成する。
(5)ドロップアウトカラー除去後の画像を用いて、文字抽出を行い、文字画像を作成する。
特開2009−182662号公報 特開平10−066100号公報 特開2001−109842号公報 特開2004−318588号公報(段落〔0016〕〜〔0030〕)
しかしながら、特許文献1〜3には、背景色以外の画素に注目することは記載されているものの、これらの技術では画像から文字を構成する画素を抽出できなかった。
一方、特許文献4には、二値化処理を行うことで、カラー画像から読み取り対象である文字画像を抽出することができるものの、記入枠の枠線に重なって文字が記入されている場合に、(3)の処理で、枠線の色だけでなく、文字の色(文字記入色)もドロップアウトカラーとされた。そのため、(4)の処理で、枠線だけでなく文字もカラー画像から除去されてしまうという問題があった。
本発明は、以上のような問題を解決するためになされたものであり、多色で構成される帳票画像から、当該帳票に記入された文字の色(文字記入色)を分別して、文字認識をする文字認識装置、文字認識システム、文字認識方法および文字認識プログラムを提供することを課題とする。
前記課題を解決するために、本発明の文字認識装置は、文字記入位置に関する図形が文字記入色と異なる色で形成された帳票の画像データが入力されて、当該帳票に記入された文字の文字認識を行う文字認識装置において、前記入力された画像データから得られる帳票画像に対し二値化により黒画素となる画素の情報を少なくとも含む二値化データを生成する画像二値化部と、前記二値化データにおける黒色の黒画素を特定し、前記黒画素と同じ位置の前記帳票画像の対象画素に対して色の判定を行い、前記対象画素を前記文字記入色の画素と前記文字記入色以外の色の画素に分別する処理を行う色分別処理部と、前記文字記入色の画素で形成される文字画像データの画像に対して文字認識を行う文字認識処理部とを備える構成とした。
本発明によれば、多色で構成される帳票画像から文字記入色を分別することができるため、文字記入色に分別された画素に注目して文字認識処理を行うことで、高い文字認識率を期待することができる。
例えば、帳票に印刷された文字枠に文字が重なって記入されたとしても、二値化処理を行った場合に黒色となる画素の領域に注目しつつ、帳票画像に対して色分析を行って文字記入色を分別し、その文字記入色の画素で形成される画像に対して文字認識を行うため、その文字を認識することができる。
このように、帳票画像を二値化した状態を考慮することで、帳票画像に含まれるノイズの影響が除去されるだけでなく、帳票画像で表現される色を文字色とプレ印刷色とに絞り込むことができる。
本発明に係る文字認識装置を備える画像処理装置と帳票読取装置とを含むシステムの全体構成図である。 (a)プレ印刷色が緑色の文字枠に、文字色が黒色のインクで数字の羅列が記入された帳票の画像である。(b)最適二値化処理を行って得られた二値画像である。(c)単純二値化処理を行って得られた二値画像である。 (a)プレ印刷色が緑色の文字および選択肢の上に、文字色が黒色のインクで選択を示す図形が記入された帳票画像である。(b)最適二値化処理を行って得られた二値画像である。(c)単純二値化処理を行って得られた二値画像である。 (a)プレ印刷色が緑色の枠と枠内の選択肢の上に、文字色が黒色のインクで選択を示す図形が記入された画像である。(b)最適二値化処理を行って得られた二値画像である。(c)単純二値化処理を行って得られた二値画像である。 画像処理動作のフローチャートである。 画像処理動作を補足説明する簡単な図面である。(a)帳票画像データの画像、(b)二値画像データの画像、(c)文字色以外のカラー画素と同一座標に位置する、二値画像データの画像の画素を除去する処理を説明する図面である。 画像処理動作を補足説明する簡単な図面である。(d)文字画像データの画像、(e)文字色以外のカラー画素をドロップアウトカラーとして、帳票画像データの画像からドロップアウトする処理を説明する図面である。
以下、図面を参照して、本発明の実施の形態(以下、「本実施形態」と称する)につき詳細に説明する。なお、各図は、本発明について概略的に示してあるに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
図1に示すように、文字認識システム20は、コンピュータである画像処理装置10と、非接触型スキャナである帳票読取装置2とを備える。
≪画像処理装置10≫
画像処理装置10は、内部に文字認識装置1を備え、帳票読取装置2とデータ受信可能に接続される装置であり、例えば、PC(Personal Computer)や携帯情報端末、スマートフォン(smartphone)等である。この画像処理装置10は、帳票読取装置2が帳票Pを撮像して(読み取って)生成した帳票画像データを受信し、文字認識装置1がその帳票画像データの画像に文字認識処理を行い、画像に含まれる文字を取得する。
この画像処理装置10は、図1に示すように、操作入力部6と表示部7とを備えてもよい。
操作入力部6は、例えば、キーボードやマウス等であり、利用者からの入力や要求を受け付ける機能を有する。例えば、画像処理装置10は、不図示の制御線を介して帳票読取装置2と接続され、帳票読取装置2からの入力に応じて後記する制御部3(入力処理部34)が帳票読取装置2を制御する指示を送ることで、帳票Pの画像を撮像させることができる。
表示部7は、例えば、LCD(Liquid Crystal Display)等であり、利用者が操作入力部6を介して入力した入力内容や、後記する制御部3(画面処理部35)が生成した画面データを画面に表示する機能を有する。
≪帳票読取装置2≫
帳票読取装置2は、利用者が記入した帳票Pの記載面を撮像して、帳票画像データを生成する機能を有する。この帳票読取装置2は、例えば、非接触型スキャナであり、ダイレクトスキャナ、帳票載置台等を備える。また、一般的な、原稿(帳票P)を覆うカバー付きのスキャナであってもよい。
また、本実施形態において、帳票読取装置2は文字認識装置1に含まれない構成としているが、文字認識装置1が帳票読取装置2を備えてもよい。
≪帳票P≫
帳票Pは、予めロゴや背景、文字枠、選択肢等の図形が印刷(プレ印刷)された用紙である。帳票読取装置2に撮像される帳票Pは、利用者が帳票Pに予め印刷された図形の色(以下、プレ印刷色と称する)とは異なる色(以下、文字色と称する)の筆記具(ボールペン等)で、文字枠に記入したり、選択肢を塗りつぶしたりしたものである。これにより、帳票Pの色は、プレ印刷色と文字色、そして帳票P自体の紙の色(以下、背景色と称する)とで表現されることになる。
図2(a)は、プレ印刷色が緑色の文字枠に、文字色が黒色のインクで数字の羅列が記入された帳票Pが、帳票読取装置2に撮像された画像の一例である。
ここで、文字色は、筆記具のインクの色としたが、スタンプされたインクの色や印鑑の朱肉の色でもよい。すなわち、文字色は、単に、帳票Pにおいてプレ印刷色とは異なる色であることと、文字認識処理対象であることとを示しているだけである。
この帳票Pは、画像処理装置10が銀行に設置されている場合、例えば、CIF新規帳票、普通預金新規申込書、カード発行申込書、インターネットバンキング申込書等がある。
≪文字認識装置1≫
文字認識装置1は、制御部3と、記憶部4と、画像データ入力部5とを備える。
(制御部3)
制御部3は、文字認識装置1の全体を制御する構成部であり、例えば、CPU(Central Processing Unit)で構成され、CPUが記憶部4に格納されるプログラム(不図示)を展開し実行することによって文字認識装置1の各機能が実現される。
この制御部3は、画像二値化部31と、文字分離部32と、文字認識部33と、入力処理部34と、画面処理部35とを備える。これら各構成部の機能については詳細を後記する。
(記憶部4)
記憶部4は、データやプログラムを記憶する構成部であり、例えば、HDD(Hard Disc Drive)、RAM(Random Access Memory)、光ディスク等の記憶手段である。
この記憶部4は、入力画像記憶部41と、二値画像記憶部42と、文字画像記憶部43とを備える。
入力画像記憶部41は、画像データ入力部5を介して入力された画像データ(帳票画像データ)を記憶する。
二値画像記憶部42は、画像二値化部31により二値化された画像データ(二値画像データ)を記憶する。
文字画像記憶部43は、文字分離部32により分離された文字を含む画像データ(文字画像データ)を記憶する。
(画像データ入力部5)
画像データ入力部5は、データの入力を受け付ける機能を有し、帳票読取装置2が帳票Pを撮像して生成した帳票画像データ(RGBデータ)が入力される。
この画像データ入力部5は、例えば、帳票読取装置2と有線/無線を介してデータ送受信可能に接続され、帳票読取装置2からデータが入力される通信接続部や、USBメモリ等の媒体に記録されたデータが入力される媒体接続部で構成される。
≪制御部3≫
制御部3が備える各構成部の機能について説明する。
(画像二値化部31)
画像二値化部31は、入力画像記憶部41に格納された帳票画像データ(帳票Pの画像データ)を二値化処理して、その二値画像データを二値画像記憶部42に格納する。
この画像二値化部31は、特開2007−274596号公報に記載された二値化処理(以下、最適二値化処理と称する)を実行する。これにより、一般的な二値化処理(以下、単純二値化処理と称する)よりもエッジが鮮明に検出される。
本実施形態では、文字認識処理を行う前処理において、画像二値化部31が最適二値化処理を行うことが望ましいが、単純二値化処理を行ってもよい。
特開2007−274596号公報に記載された最適二値化処理は、単純二値化処理を行う前に、画素の濃度に着目して、文字画素と背景画素とを分けて文字の輪郭を強調する処理や、1画素とその隣接する画素との濃度変化量を算出する処理、濃度毎の画素数を示す濃度分布データを生成して二値化するための二値化閾値を決める処理をする。
(単純二値化処理と最適二値化処理)
ここで、単純二値化処理と最適二値化処理とについて説明する。
帳票画像データの一部を、図2(a)、図3(a)、図4(a)に示す。これら帳票画像データの一部に対して、最適二値化処理を行って得られた二値画像データを、図2(b)、図3(b)、図4(b)に示す。一方、単純二値化処理を行って得られた二値画像データを、図2(c)、図3(c)、図4(c)に示す。
図2(a)は、数字が記入された画像である。単純二値化処理後の図2(c)の画像は、最適二値化処理後の図2(b)の画像に比べて、数字「5」の一部が欠損しているが、この程度であれば、正しく文字認識が行われる。すなわち、文字認識処理後であれば、最適二値化処理後の図2(b)の画像と、単純二値化処理後の図2(c)の画像とでは、大きな差異は見られない。
図3(a)は、プレ印刷された文字および選択肢の上に、選択を示す図形が記入された画像である。最適二値化処理後の図3(b)の画像では、プレ印刷された文字が鮮明であるのに対して、単純二値化処理後の図3(c)の画像では、プレ印刷された文字が太って潰れているため、誤認識されやすい状態である。
図4(a)は、プレ印刷された枠内の選択肢の上に、選択を示す図形が記入された画像である。最適二値化処理後の図4(b)の画像では、プレ印刷された枠線が鮮明であるのに対して、単純二値化処理後の図4(c)の画像では、プレ印刷された枠線が掠れているため、破線として誤認識されやすい状態である。
また、単純二値化処理の場合は色を黒または白に分別する閾値の設定が必要であるが、最適二値化処理の場合は閾値を設定する必要がない。
また、単純二値化処理を行った場合、若干濃い色に撮像されてエッジとして残ってしまった箇所において偽色等のノイズが発生してしまい、白色と判定されるべき画素が、黒色と判定されてしまうことがある。これに対して、最適二値化処理を行った場合、単純二値化処理で問題となる上記ノイズが除去されるため、正しく白色または黒色に判定される。
また、最適二値化処理を行った場合、帳票自体の紙の色を除去(無視)することができるので、上記ノイズの影響を低減することができる。
また、二値化処理を行うことで色の絞り込みをすることができる。例えば、枠線の色や文字の色よりも白に近い色を除去することができるため、可能な限り色を文字色とプレ印刷色とに絞ることができる。
(シェーディング補正)
また、画像二値化部31は、二値化処理を行う前にシェーディング補正を行う。
例えば、帳票読取装置2が図1に示すような(カメラと原稿とが離れている)非接触型スキャナである場合、帳票読取装置2を設置した場所にある照明等により、帳票Pの表面に影等が現れ、撮像された画像に明るさにばらつき(明るさムラ)ができてしまうことがある。このように画像に明るさムラがある場合、二値化処理後に白色となるべき画素が、その明るさムラにより暗くなったために、黒色になってしまうという問題がある。この問題を解決するため、画像二値化部31は、二値化処理をする前に、シェーディング補正を行って、明るさムラのある画像を補正して明るさを均一にする。このようにシェーディング補正を行うことで、周辺環境による影響を排除することができる。
画像二値化部31は、例えば、特開2005−94686号公報に記載されたシェーディング補正を行うことが望ましい。
(文字分離部32)
文字分離部32は、入力画像記憶部41に格納された帳票画像データと、二値画像記憶部42に格納された二値画像データを用いて、プレ印刷色と文字色とを分別し、文字色の画素で構成される文字画像データを生成する。そして、その文字画像データを文字画像記憶部43に格納する。
(文字認識部33)
文字認識部33は、文字画像記憶部43に格納された文字画像データに対して文字認識処理を実行する。
(入力処理部34)
入力処理部34は、操作入力部6からの入力データを受け付けて、制御部3(CPU)に処理をさせる。この入力データに応じて制御部3は、記憶部4に記憶された不図示のプログラムを展開させて各機能を実現する。
(画面処理部35)
画面処理部35は、表示部7の画面に表示可能な画面データを生成する。本実施形態において、画面処理部35は、他構成部の処理に応じて、文字認識処理結果を画面データにする。これにより、利用者は表示部7の画面を見て文字認識結果の確認をすることができる。
≪画像処理動作≫
次に、図5〜図7を参照して、画像処理動作について説明する(適宜、図1〜図4を参照)。図5は、画像処理動作のフローチャートであり、図6〜図7は、画像処理動作を補足説明する簡単な図面である。ここで、帳票には、背景色が白色の用紙に、プレ印刷色が赤色の4つの文字枠が印刷され、それぞれの文字枠に、文字色が黒色のインクで1,2,3,7の数字が1つずつ記入されたとする。それぞれの数字は文字枠の一部に重なっている。
まず、画像処理装置10が備える操作入力部6を介して、利用者が帳票読取装置2に帳票Pを撮像させる操作を入力する。これにより、入力処理部34は、記憶部4に記憶された不図示の帳票読取装置2を制御するプログラムを実行し、帳票読取装置2に撮像を指示する。これにより、帳票読取装置2は、帳票載置台に置かれた帳票Pをダイレクトスキャナが撮像し、帳票画像データを生成する。そして、帳票読取装置2は、帳票画像データを画像処理装置10に送信する。
以上により、帳票読取装置2と通信可能に接続された文字認識装置1の画像データ入力部5に帳票画像データが入力される(ステップS101,図5)。制御部3は、画像データ入力部5から入力された帳票画像データを入力画像記憶部41に格納する(ステップS102)。この帳票画像データの画像を図6(a)に示す。
画像二値化部31は、帳票画像データから得られる画像(帳票画像)にシェーディング補正を行って(ステップS103)、明るさムラのある画像を補正して明るさを均一にする。
次に、画像二値化部31は、シェーディング補正後の帳票画像に二値化処理(ここでは最適二値化処理)を行って(ステップS104)、二値画像データを生成し(ステップS105)、生成された二値画像データを二値画像記憶部42に格納する(ステップS106)。この二値画像データの画像を図6(b)に示す。
文字分離部32は、二値画像データの画像(二値画像)の各画素を、黒色または白色に分別する(ステップS107)。そして、文字分離部32は、二値画像データから、黒色に分別した画素(黒画素)の画像上の座標位置を抽出する。これにより、黒画素座標が抽出される(ステップS108)。
ここで、文字分離部32は、例えば、二値画像の左上の座標を(x,y)=(0,0)とし、その原点からの相対位置から座標位置を求める。
そして、文字分離部32は、入力画像記憶部41から帳票画像データを取得し、帳票画像データの画像を参照して、黒画素座標と同一座標に位置する画素(カラー画素)を抽出する(ステップS109)。
文字分離部32は、カラー画素色分類処理を行って、抽出したカラー画素に対してヒストグラムを用いて解析し(ステップS110)、そのカラー画素の色を分類(分別)する(ステップS111)。
(カラー画素色分類処理)
カラー画素色分類処理は、次の(1)〜(4)のステップで行われる。ここでは、文字色が「黒色」と予め決まっているとする。
(1)抽出した全てのカラー画素から色成分(RGB値)を取得する。
(2)抽出した全てのカラー画素で構成される画像に対して、ヒストグラムを用いて、R、G、Bそれぞれの値を解析し、ピークの出た色に着目する。この着目される色はピークの値が所定値以上であったものとする(画素数の多い色を特定)。
(3)黒色、すなわち、R、G、Bそれぞれの値が0に近い色を文字色に分類する。
(4)一方、R、G、Bのうちいずれかの値が所定値以上で、R、G、Bそれぞれの値が異なる色を文字色以外の色を、ここでは、プレ印刷色に分類する。
再び図5のフローチャートの説明に戻る。
次に、文字分離部32は、図6(c)に示すように、帳票画像データの画像で文字色以外に分類された色(プレ印刷色)のカラー画素と同一座標に位置する、二値画像データの画像の画素、すなわち黒画素座標に位置する画素(黒画素)を除去する(ステップS112)。このとき、文字分離部32は、黒色を白色にする処理をして画素を除去する。
そして、文字分離部32は、ステップS108で抽出した全ての黒画素に対して、ステップS109〜ステップS112の処理を行う(ステップS113)。これにより、帳票画像で文字色以外に分類された色(プレ印刷色)の画素が、二値画像からひとつひとつ除去され、二値画像には、文字色に分類された画素(黒画素)だけが黒色の画素として残ることになる。
文字分離部32は、ステップS113後の二値画像データを文字画像データとして、文字画像記憶部43に格納する(ステップS114)。この文字画像データの画像を図7(d)に示す。
そして、文字認識部33が文字画像データの画像に対して文字認識処理を行う(ステップS115)。
その後、画面処理部35が文字認識処理結果を画面データにして、表示部7に出力することで、利用者は表示部7の画面を見て文字認識結果の確認をすることができる。
以上のように文字認識処理を行うことで、帳票に印刷された文字枠に文字が重なって記入されたとしても、文字色(文字記入色)と、文字枠の色(プレ印刷色)とを分別し、その文字色の画素で形成される画像に対して文字認識を行うため、その文字を認識することができる。
従来、帳票画像データに対して文字認識処理を行う場合、次の問題点が発生した。例えば、帳票P自体の紙が白以外の色である、すなわち帳票Pの背景色を含んでいる場合や、非接触型スキャナで帳票Pを撮像したために、帳票画像の色の再現性が悪い場合、得られる帳票画像にはノイズが多い。そのため、ノイズの多い帳票画像データそのままで文字認識処理を行うと、偽色等により文字枠の色を正しく検出できなかったり、エッジが不明瞭であったりするために文字の誤認識率が高くなった。
これに対して、本発明の文字認識装置1によれば、図5に示すように文字認識処理を行うことで、帳票画像に二値化処理をして二値画像データを生成するため、二値画像データの画像(二値画像)の各画素を黒色または白色に分別することができる。これにより、背景色の画素を白色に分別した、すなわち、文字色とプレ印刷色以外の色である、背景色や文字認識の際にノイズとなる色を除去(無視)した画像データ(二値画像データ)を生成することができる。
さらに、本発明の文字認識装置1によれば、この二値画像の黒画素の座標と同一座標に位置する、帳票画像の画素(カラー画素)をカラー画素色分類処理の対象画素とするため、カラー画素色分類処理において、帳票画像から文字色の画素とプレ印刷色の画素とを容易に分類することができる。
また、従来の帳票画像から文字枠を検出して、文字枠内の画素全てを解析してから文字認識処理を行うよりも、本発明の文字認識装置1は高速に文字認識処理を行うことができる。
以上、本発明の実施形態について説明したが、本発明は、前記した実施形態に限定されることなく、本発明の要旨を逸脱しない範囲で種々の変更や変形を行うことができる。
≪変形例1:ステップS105の処理≫
本実施形態における図5のステップS105にて、画像二値化部31により生成される二値画像データは、画像そのものでなくてもよく、二値化処理後の画素の色と、その画素の画像上の位置を示す座標とが分かるデータが生成されればよい。すなわち、少なくともステップS108にて、二値化処理後に黒色となった画素(黒画素)のみの座標データが二値画像データから抽出されればよい。あるいは、二値画像そのものの生成を省略し、各画素について二値化を行った場合に黒画素となるか否かの情報のみを抽出するようにしてもよい。この場合、二値画像データには、少なくとも二値化により黒画素となる画素の座標データ(位置情報)が含まれていればよい。
≪変形例2:ステップS111のカラー画素色分類処理(1)≫
本実施形態において、図5のステップS111のカラー画素色分類処理で、文字色は「黒色」と予め決めていたが、決めておかなくてもよい。
カラー画素色分類処理は、文字色が不明の場合、カラー画素色分類処理において、次の(1)〜(6)のステップを行うことで、文字色とプレ印刷色とを分類することができる。
(1)全てのカラー画素から色成分(RGB値)を取得する。
(2)全てのカラー画素で構成される画像に対して、ヒストグラムを用いて、R、G、Bそれぞれの値を解析し、ピークの出た色に着目する(画素数の多い色を特定)。
(3)単色の画素で形成される図形から、直線成分を検出する。
(4)複数の直線により形成される枠があるかを判定する。
(5)枠が形成されるのであれば、その画素の色をプレ印刷色(文字色以外の色)とする。
(6)他方の画素の色を文字色とする。
特許文献4に記載された方法では、印刷された文字記入枠を残すような二値化閾値を決める必要があるため、文字記入枠の色についての最低限の情報を事前に把握する必要がある上に、文字色は文字記入枠の色よりも高濃度である必要があった。本発明によれば、上記のカラー画素色分類処理を行うことで、文字記入枠の色が不明であるだけでなく、文字色が不明であっても、文字色と(文字記入枠の色を含む)プレ印刷色とを分類することができる。
≪変形例3:ステップS111のカラー画素色分類処理(2)≫
また、帳票画像はカラー(多色)でなくてもよく、二値画像にしたときに、文字色とプレ印刷色とを分別できればよい。例えば、明度や彩度等が異なればよい。
例えば、文字色「黒色」、プレ印刷色「灰色」である場合、図5のステップS105において、灰色が黒色に分別されるように二値画像を生成する。これにより、ステップS108において、二値画像データの画像から「黒色」または「灰色」の画素が黒画素として抽出される。
ステップS111にて、帳票画像データの画像から、黒画素座標と同一座標の画素(カラー画素)の色を分析することで、カラー画素が「黒色」または「灰色」を分類でき、帳票画像から文字色の画素だけを抽出することができる。
≪変形例4:ステップS112の文字色以外に分類された色の画素除去≫
本実施形態において、ステップS112の処理で、文字分離部32は、二値画像データの画像から、文字色以外に分類された色の画素を除去することで、二値画像データの画像において、文字色に分類された画素(黒画素)が残り、文字画像データが作成されるが、他の方法を用いてもよい。
例えば、文字分離部32は、図7(e)に示すように、文字色以外に分類された色のカラー画素をドロップアウトカラーとして、帳票画像データの画像からドロップアウトして画素除去を行ってもよい。これにより、帳票画像データの画像からは、文字色以外に分類された色が除去され、帳票画像データの画像には、文字色に分類された画素(黒画素)だけが画素として残ることになる(図7(d))。
そして、ステップS114において、文字分離部32は、二値画像データではなく、ドロップアウト処理後の帳票画像データを文字画像データとして、文字画像記憶部43に格納すればよい。
以上のように、一旦、二値化処理して、カラー画素の色を、文字色と文字色以外に分類された色とに色の絞り込みをしてから、文字色以外に分類された色のカラー画素をドロップアウトカラーにしている。この方法を用いることで、文字色が不明の場合、複数のドロップアウトカラー候補の色から、容易に色の絞り込みができる。
≪変形例5:濃度補正処理の適用≫
また、帳票読取装置2として非接触型スキャナを用いた場合、制御部3は、入力画像記憶部41に格納された帳票画像データを、画像二値化部31が二値化処理する前に、特開2009−50032号公報に記載された輝度補正処理を適用し、色の再現性を向上させてもよい。
1 文字認識装置
2 帳票読取装置
3 制御部
4 記憶部
5 画像データ入力部
6 操作入力部
7 表示部
10 画像処理装置
20 文字認識システム
31 画像二値化部
32 文字分離部(色分別処理部)
33 文字認識部
34 入力処理部
35 画面処理部
41 入力画像記憶部
42 二値画像記憶部
43 文字画像記憶部
P 帳票

Claims (10)

  1. 文字記入位置に関する図形が文字記入色と異なる色で形成された帳票の画像データが入力されて、当該帳票に記入された文字の文字認識を行う文字認識装置において、
    前記入力された画像データから得られる帳票画像に対し二値化により黒画素となる画素の情報を少なくとも含む二値化データを生成する画像二値化部と、
    前記二値化データにおける黒色の黒画素を特定し、前記黒画素と同じ位置の前記帳票画像の対象画素に対して色の判定を行い、前記対象画素を前記文字記入色の画素と前記文字記入色以外の色の画素に分別する処理を行う色分別処理部と、
    前記文字記入色の画素で形成される文字画像データの画像に対して文字認識を行う文字認識処理部と
    を備えることを特徴とする文字認識装置。
  2. 前記色分別処理部は、
    前記二値化データから、前記黒画素の座標位置を抽出し、
    前記帳票画像から、前記黒画素と同一座標に位置する前記対象画素を抽出し、
    前記対象画素に対してヒストグラム解析を行い取得した色に基づき、当該対象画素を前記文字記入色の画素と前記文字記入色以外の色の画素に分別し、
    前記文字記入色の画素で形成される前記文字画像データを生成する
    ことを特徴とする請求項1に記載された文字認識装置。
  3. 前記色分別処理部は、前記二値化データの画像から、前記文字記入色以外の色の画素を除去して、前記文字画像データを生成することを特徴とする請求項1または請求項2に記載された文字認識装置。
  4. 前記色分別処理部は、前記文字記入色以外の色をドロップアウトカラーとして、前記帳票画像の対象画素からドロップアウトして、前記文字画像データを生成することを特徴とする請求項1または請求項2に記載された文字認識装置。
  5. 前記色分別処理部は、前記対象画素に対する色の判定において、黒色であれば、前記対象画素を前記文字記入色の画素に分別することを特徴とする請求項1ないし請求項4のいずれか一項に記載された文字認識装置。
  6. 前記色分別処理部は、前記対象画素に対する色の判定において、前記対象画素全てで構成される画像に対してヒストグラム解析して画素数の多い色を取得し、取得した各単色の画素で形成される枠の有無を判定し、枠が形成されない当該単色の色をもつ前記対象画素を前記文字記入色の画素に分別することを特徴とする請求項1ないし請求項4のいずれか一項に記載された文字認識装置。
  7. 前記画像二値化部は、最適二値化処理を行うことを特徴とする請求項1ないし請求項6のいずれか一項に記載された文字認識装置。
  8. 帳票読取装置と、文字認識装置とを備える文字認識システムにおいて、
    前記帳票読取装置は、
    文字記入位置に関する図形が文字記入色と異なる色で形成された帳票を読み取って前記画像データを出力し、
    前記文字認識装置は、
    前記帳票読取装置から前記帳票の画像データが入力された画像データから得られる帳票画像に対し二値化により黒画素となる画素の情報を少なくとも含む二値化データを生成し、
    前記二値化データにおける黒色の黒画素を特定し、前記黒画素と同じ位置の前記帳票画像の対象画素に対して色の判定を行い、前記対象画素を前記文字記入色の画素と前記文字記入色以外の色の画素に分別する処理を行い、
    前記文字記入色の画素で形成される文字画像データの画像に対して文字認識を行う
    ことを特徴とする文字認識システム。
  9. 文字記入位置に関する図形が文字記入色と異なる色で形成された帳票の画像データが入力された文字認識装置が、当該帳票に記入された文字の文字認識を行う文字認識方法であって、
    前記入力された画像データから得られる前記帳票画像に対し二値化により黒画素となる画素の情報を少なくとも含む二値化データを生成するステップと、
    前記二値化データにおける黒色の黒画素を特定し、前記黒画素と同じ位置の前記帳票画像の対象画素に対して色の判定を行い、前記対象画素を前記文字記入色の画素と前記文字記入色以外の色の画素に分別する処理を行うステップと、
    前記文字記入色の画素で形成される文字画像データの画像に対して文字認識を行うステップと
    を備えることを特徴とする文字認識方法。
  10. 文字記入位置に関する図形が文字記入色と異なる色で形成された帳票の画像データが入力された文字認識装置のコンピュータを、
    前記入力された画像データから得られる帳票画像に対し二値化により黒画素となる画素の情報を少なくとも含む二値化データを生成する画像二値化手段、
    前記二値化データにおける黒色の黒画素を特定し、前記黒画素と同じ位置の前記帳票画像の対象画素に対して色の判定を行い、前記対象画素を前記文字記入色の画素と前記文字記入色以外の色の画素に分別する処理を行う色分別手段、および、
    前記文字記入色の画素で形成される文字画像データの画像に対して文字認識を行う文字認識手段、
    として機能させるための文字認識プログラム。
JP2013176829A 2013-08-28 2013-08-28 文字認識装置、文字認識システム、文字認識方法および文字認識プログラム Pending JP2015046001A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013176829A JP2015046001A (ja) 2013-08-28 2013-08-28 文字認識装置、文字認識システム、文字認識方法および文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013176829A JP2015046001A (ja) 2013-08-28 2013-08-28 文字認識装置、文字認識システム、文字認識方法および文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2015046001A true JP2015046001A (ja) 2015-03-12

Family

ID=52671460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013176829A Pending JP2015046001A (ja) 2013-08-28 2013-08-28 文字認識装置、文字認識システム、文字認識方法および文字認識プログラム

Country Status (1)

Country Link
JP (1) JP2015046001A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295648A (zh) * 2016-07-29 2017-01-04 湖北工业大学 一种基于多光谱成像技术的低质量文档图像二值化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295648A (zh) * 2016-07-29 2017-01-04 湖北工业大学 一种基于多光谱成像技术的低质量文档图像二值化方法
CN106295648B (zh) * 2016-07-29 2019-03-19 湖北工业大学 一种基于多光谱成像技术的低质量文档图像二值化方法

Similar Documents

Publication Publication Date Title
US20210383150A1 (en) Iterative recognition-guided thresholding and data extraction
US9754164B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
US9241102B2 (en) Video capture of multi-faceted documents
US9965871B1 (en) Multi-binarization image processing
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
US20210064859A1 (en) Image processing system, image processing method, and storage medium
JP2009265751A (ja) 文字認識装置、光学式文字認識システム及び文字認識プログラム
JP4821663B2 (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
JP5337563B2 (ja) 帳票認識方法および装置
US20210357674A1 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
TW200842734A (en) Image processing program and image processing device
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP4423333B2 (ja) 背景領域特定方法、背景領域特定システム、背景色決定方法、制御プログラム、および、記録媒体
CN102737240B (zh) 分析数字文档图像的方法
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US20140086473A1 (en) Image processing device, an image processing method and a program to be used to implement the image processing
CN103617423B (zh) 基于色彩参数的图像拆分识别方法
JP2007072642A (ja) 画像処理装置および画像処理装置の制御方法
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
JP2015046001A (ja) 文字認識装置、文字認識システム、文字認識方法および文字認識プログラム
JP6883199B2 (ja) 画像処理装置、画像読み取り装置、および、プログラム
JP4300083B2 (ja) 帳票読取り装置
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JP2009200794A (ja) 文書の改竄検出プログラム及び改竄検出装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20160425