JP4935459B2 - 文字認識方法、文字認識プログラムおよび文字認識装置 - Google Patents

文字認識方法、文字認識プログラムおよび文字認識装置 Download PDF

Info

Publication number
JP4935459B2
JP4935459B2 JP2007085290A JP2007085290A JP4935459B2 JP 4935459 B2 JP4935459 B2 JP 4935459B2 JP 2007085290 A JP2007085290 A JP 2007085290A JP 2007085290 A JP2007085290 A JP 2007085290A JP 4935459 B2 JP4935459 B2 JP 4935459B2
Authority
JP
Japan
Prior art keywords
label information
image data
character recognition
area
read image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007085290A
Other languages
English (en)
Other versions
JP2008243016A (ja
Inventor
智也 井木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2007085290A priority Critical patent/JP4935459B2/ja
Publication of JP2008243016A publication Critical patent/JP2008243016A/ja
Application granted granted Critical
Publication of JP4935459B2 publication Critical patent/JP4935459B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、帳票に記入された文字を文字認識する際に、誤認識等を引き起こす、文字認識の対象とならない文字等を消去する技術に関するものである。
文字認識に係る技術は、氏名や住所等が手書きで書き込まれた帳票を、OCR(Optical Character Reader)によって読み取り、効率的にデータベースを作成するなどの処理に用いられている。その際に、手書きの文字部分だけを文字認識の対象とするために、文字認識の対象領域を矩形で大まかに読み取って、その読み取った矩形から文字認識に不要な領域を設定した小さな矩形を削除し、文字認識の対象領域を決定する方法が開示されている(例えば、特許文献1)。
特開平10−269312号公報
その開示されている内容について、図10、図11を用いて説明する。図10は、帳票の一例を示す図である。図11の(a)は、文字の読取領域を示す図であり、(b)は、文字認識に不要な領域を示す図であり、(c)は、文字認識の対象領域を示す図である。
図10に示すように、帳票801には、氏名や住所等を書き込む欄802,803が印刷により表示されている。そして、それぞれの欄802,803には、それぞれ記入する内容を特定するために、「お名前」「ご住所」が印刷により表示されている。
例えば、図11(a)に示すように、「ご住所」欄に文字が書かれる。そして、この「ご住所」欄を、まず、大まかに読み取って、読取領域901とする。次に、図11(b)に示すように、印刷されている「ご住所」という文字は、文字認識には不要であるため、この「ご住所」という文字を含むように削除領域902を設定する。そして、図11(c)に示すように、読取領域901から削除領域902を削除することによって、文字認識の対象領域として、認識対象領域903を決定する方法である。
しかしながら、前述の方法を用いた場合には、削除領域に含まれた手書き文字が削除されてしまい、手書き文字の一部等が欠落してしまうといった問題が懸念される。これらの例を、図12、図13を用いて説明する。図12の(a)は、削除領域1001に記入した文字が入った例を示す図であり、(b)は、認識対象領域1003では、記入した文字が欠落することを示す図である。図13の(a)は、削除領域1101に記入した文字が入り、かつ、印刷文字と記入した文字が重なった例を示す図であり、(b)は、認識対象領域1103では、記入した文字が欠落することを示す図である。
例えば、図12(a)に示すように、「ご住所」という印刷文字を削除するために設定した削除領域1001に、文字の一部が含まれて、図12(b)に示すように、認識対象領域1003では、欠けた手書き文字となってしまうという問題がある。
また、図13(a)に示すように、「ご住所」という印刷文字と手書き文字が重なってしまった場合にも、図13(b)に示すように、認識対象領域1103では、欠けた手書き文字となってしまうという問題がある。
そこで、本発明は前述のような問題点に鑑みて、帳票に記入された文字を文字認識する際に、誤認識等を引き起こす、文字認識の対象とならない文字等を消去する技術を提供するものである。
前記した課題を解決するため、本発明の一の手段は、処理部および記憶部を備え、帳票上の所定領域に記載された文字を読み取って、文字認識を行う文字認識装置であって、前記記憶部が、記入者により記載された文字がない状態の原帳票を読み取った参照用画像データ、および文字認識対象となる帳票を読み取った読取画像データを記憶し、前記処理部によって、前記参照用画像データおよび前記読取画像データに対して、文字認識の対象となる矩形の領域および前記読取領域内で文字認識の対象としない矩形の領域が、それぞれ読取領域および削除領域として読み取られ、前記処理部が、前記削除領域内の文字に相当する部分の画素が隣り合って一塊になっている画素の物理量と前記一塊になっている画素の位置とを関連付けて、前記記憶部に記憶し、前記記憶部から読み出した、前記参照用画像データおよび前記読取画像データにおける前記一塊になっている画素の物理量前記一塊になっている画素の位置、または前記物理量および前記位置の双方のいずれかが一致する前記一塊になっている画素を抽出し、前記読取画像データから、前記一致する前記一塊になっている画素を消去し、前記一致する前記一塊になっている画素を消去した前記読取画像データの前記読取領域を対象として文字認識を行うこと、を特徴とする。
本発明によれば、帳票に記入された文字を文字認識する際に、誤認識等を引き起こす、文字認識の対象とならない文字等を消去することが可能である。
次に、本発明を実施するための最良の形態(以降、「実施形態」と称す)について、適宜図面を参照しながら詳細に説明する。
(実施形態)
本発明の実施形態に係る文字認識装置のハードウェア構成について、図1を用いて説明する。図1は、本発明の実施形態に係る文字認識装置100のハードウェア構成を示す図である。
文字認識装置100は、図1に示すように、処理部200、入出力部300および記憶部400によって構成される。
処理部200は、演算処理を実行するCPU(Central Processing Unit)201と、このCPU201が演算処理に用いる記憶部であるメインメモリ202とを備える。メインメモリ202は、RAM(Random Access Memory)等により実現される。そして、図示しないROM(Read Only Memory)やハードディスクなどの記憶部400に格納されたアプリケーションプログラムがRAMに展開され、CPU201が、それを実行することにより種々の処理を具現化する。
また、入出力部300は、画像入力部301と入出力インタフェース302とを備える。画像入力部301は、帳票をスキャナ(OCR等)によって読み取って、その読み取った内容を画像データに変換し、処理部200を介して、記憶部400に記憶する。入出力インタフェース302は、文字認識装置100に接続されるキーボードやマウス等の入力装置からの入力を受け付け、また、処理部200によって演算処理される文字認識の結果等の各種データを、出力表示装置30(図2参照)に出力する。
記憶部400は、CPU201が演算処理に用いる各種データや演算結果、または、入出力部300によって送受信されるデータを記憶する。記憶部400はハードディスク装置等により実現される。
次に、本発明の実施形態に係る文字認識装置100の機能について、図2を用いて説明する。図2は、文字認識装置100を機能展開して示した図である。
文字認識装置100は、図2に示すように、処理部200、入出力部300および記憶部400によって構成される。
まず、入出力部300は、帳票10を読み取って、その読み取った内容を画像データとして取得する画像入力部301と、文字認識装置100に接続される入力装置20からの入力を受け付け、および処理部200によって演算処理される文字認識の結果等の各種データを出力表示装置30に出力する、入出力インタフェース302を備える。
なお、以降では、取得した画像データの種類について区別をする必要がある場合には、画像入力部301が取得する、記入者によって記入されていない原帳票10aに対する画像データを参照用画像データと称し、また、記入者によって記入された記入済帳票10bに対する画像データを読取画像データと称して説明に用いる。
処理部200は、レイアウト解析部210、文字認識部220、出力形成部230で構成される。
レイアウト解析部210は、画像入力部301が取得した画像データに対して、文字認識を実行する領域である認識対象領域(図6(b)、図8(c)参照)を作成する。特に、本発明の課題である、誤認識等を引き起こす、文字認識の対象とならない文字等を消去する処理を実行する。
文字認識部220は、レイアウト解析部210によって認識対象領域と判断された領域内の画像データに対して、文字認識を行う。
出力形成部230は、文字認識部220によって実行される文字認識の結果を、帳票上の認識対象領域内に記載された文字としてテキストデータ等に形成して、入出力部300を介して出力表示装置30に出力する。
レイアウト解析部210は、さらに、読取領域矩形座標設定部211、削除領域矩形座標設定部212、フォーマットDB作成部213、フォーマットDB解析部214、認識対象領域作成部215、ラベリング処理部216、ラベル情報外接矩形サイズ比較部217およびラベル情報パタンテンプレートマッチング部218とで構成される。
読取領域矩形座標設定部211は、画像入力部301が帳票10を読み取って取得した画像データに対して、操作者によって入力装置20を介して指定される、矩形の読取領域の位置(座標)を読み取る。
削除領域矩形座標設定部212は、画像入力部301が帳票10を読み取って取得した画像データに対して、操作者によって入力装置20を介して指定される、矩形の削除領域の位置(座標)を読み取る。
ラベリング処理部216は、画像入力部301が取得した画像データに対して、4近傍(画素の縦横方向の4方向について隣接関係を調べる)および8近傍(画素の縦横斜めの8方向について隣接関係を調べる)のラベリング処理を行う。ここで、ラベリング処理とは、例えば、白地に黒で書かれた文字に対して、文字に相当する部分の黒画素が隣り合って一塊になっている画素に同じラベルを付けることをいう。そして、ラベリング処理部216は、さらに、同じラベルを付された一塊になっている画素に外接する矩形の座標とサイズを読み取る。なお、同じラベルを付された一塊になっている画素に外接する矩形を、ラベル情報外接矩形という。また、ラベル情報外接矩形の領域内でラベルが付された画素の集合をラベル情報パタンという。このラベル情報パタンは、例えば、画素ごとに、輝度、彩度および色相のいずれか一つ、またはそれらの組み合わせ等の物理量によって表現されてもよい。
フォーマットDB作成部213は、参照用画像データを対象として、読取領域矩形座標設定部211によって読み取られた読取領域の矩形座標、削除領域矩形座標設定部212によって読み取られた削除領域の矩形座標、ラベリング処理部216によって読み取られたラベル情報外接矩形の座標とサイズ、ラベル情報パタンおよびラベリング処理により付されたラベル番号(ラベル識別情報)とを関連付けて、記憶部400のフォーマットDB401に記憶する。なお、ラベル情報外接矩形の座標とサイズおよびラベル情報パタンをラベル情報と称す。
フォーマットDB解析部214は、フォーマットDB作成部213がフォーマットDB401に記憶した、参照用画像データに係る読取領域の矩形座標、削除領域の矩形座標、ラベル情報外接矩形の座標とサイズ、ラベル情報パタンおよびラベル番号(ラベル識別情報)を読み出して、ラベル情報外接矩形サイズ比較部217にそれらのデータを入力する。
ラベル情報外接矩形サイズ比較部217は、フォーマットDB解析部214から入力される参照用画像データに係るラベル情報と、読取画像データに係るラベル情報とを、ラベル情報外接矩形の座標とサイズおよびラベル情報パタンに関して比較し、両者が一致するラベル情報を抽出する。そして、一致するラベル情報に対応するラベル情報パタンの文字を、読取画像データから消去する。
ラベル情報パタンテンプレートマッチング部218は、まず、ラベル情報外接矩形サイズ比較部217において不一致とされた、参照用画像データに係るラベル情報を取得する。次に、その不一致とされた参照用画像データに係るラベル情報のラベル情報パタンをテンプレートとして、読取画像データの削除領域に対してテンプレートマッチング処理を実行する。そして、そのテンプレートと一致する箇所を特定し、テンプレートと一致した箇所の読取画像データから、テンプレートのラベル情報パタンの文字を消去する。
認識対象領域作成部215は、読取領域矩形座標設定部211が読み取った読取領域の矩形座標と、削除領域矩形座標設定部212が読み取った削除領域の矩形座標とを用いて、読取領域から削除領域を削除した領域と、ラベル情報パタンテンプレートマッチング部218によって作成された削除領域とを足し合わせて、認識対象領域を作成する。または、ラベル情報外接矩形サイズ比較部217によって抽出された参照用画像データに係るラベル情報パタンが読取画像データからすべて消去された場合には、読取領域から削除領域を削除した領域と、ラベル情報外接矩形サイズ比較部217によって作成された削除領域とを足し合わせて、認識対象領域を作成する。
記憶部400のフォーマットDB401には、画像入力部301が取得した帳票10に対する画像データが記憶される。
また、フォーマットDB作成部213が作成した、参照用画像データに係る読取領域の矩形座標、削除領域の矩形座標、ラベル情報外接矩形の座標とサイズおよびラベル情報パタンが、ラベリング処理により付されたラベル番号(ラベル識別情報)と関連付けて記憶される。また、読取画像データに係るラベル情報外接矩形の座標とサイズおよびラベル情報パタンも、ラベリング処理により付されたラベル番号(ラベル識別情報)と関連付けて、記憶される。
さらに、認識対象領域作成部215が作成した、認識対象領域の画像データも、記憶される。
次に、文字認識部220は、記憶部400から読み出した認識対象領域の画像データに対して、文字認識を行う。
そして、出力形成部230は、文字認識部220によって処理された文字認識の結果を、テキストデータ等に形成して、入出力部300を介して出力表示装置30に出力する。
次に、レイアウト解析部210における処理の流れについて、図3、図4、図5を用いて説明する。図3は、レイアウト解析部210における、参照用画像データに対する処理を示す図である。図4は、ラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号(ラベル識別情報)とを関連付けたデータベースの一例を示す図である。また、図5は、レイアウト解析部210における、読取画像データから文字認識に不要な文字等を消去する処理を示す図である。
レイアウト解析部210における処理は、大きく2つのフェーズに分けられる。第1フェーズでは、読取画像データから文字認識に不要な文字を消去するために、参照用画像データを取得して、参照用画像データに含まれる、文字認識に不要な文字を抽出して、記憶部400に記憶する。第2フェーズは、読取画像データを取得して、読取画像データから、第1フェーズで抽出した文字認識に不要な文字を消去し、認識対象となる画像データを作成し、記憶部400に記憶する。
図3を用いて、参照用画像文字認識に不要な文字を、参照用画像データから抽出する、第1フェーズの処理の流れについて説明する(適宜図2参照)。
まず、記入者によって記載された文字がない状態の原帳票10aを、画像入力部301が読み取って、参照用画像データを取得する(ステップS311)。
次に、参照用画像データは、入力装置20の表示部に表示され、操作者によって入力装置20を介して読取領域の矩形が設定され、読取領域矩形座標設定部211によって、その読取領域の矩形座標が読み取られる(ステップS312)。
そして、入力装置20の表示部に表示された参照用画像データに対して、操作者によって入力装置20を介して削除領域の矩形が設定され、削除領域矩形座標設定部212によって、その削除領域の矩形座標が読み取られる(ステップS313)。
続いて、ラベリング処理部216は、参照用画像データに対して、4近傍および8近傍のラベリング処理を行う(ステップS314)。また、同じラベルを付された一塊になっている画素に外接するラベル情報外接矩形の座標とサイズを読み取り、ラベル情報外接矩形の領域内でラベルが付された画素の集合であるラベル情報パタンを抽出する(ステップS315)。
そして、データベースDB作成部213が、図4に示すように、読取領域矩形座標設定部211によって読み取られた読取領域の矩形座標、削除領域矩形座標設定部212によって読み取られた削除領域の矩形座標、ラベリング処理部216によって抽出されたラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号(ラベル識別情報)とを関連付けたものを、フォーマットDB401に記憶する。すなわち、フォーマットDBを作成する(ステップS316)。なお、参照用画像データに係るラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号は、請求項に記載の第1のラベル情報である。また、本発明の実施形態では、記入者によって記載された文字がない状態の原帳票10aを、画像入力部301が読み取って、参照用画像データを取得するステップから説明したが、予め参照用画像データに係るラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号をフォーマットDB401に記憶しておくことにするようにしてもよい。このようにしておくことにより、複数の同じ読取画像データを取得し処理する場合には、処理する都度、参照用画像データを取得するということを行わなくて済む。
図4に示すように、ラベル情報外接矩形に係るラベル情報は、ラベル番号501によって、ラベル情報外接矩形サイズ502、ラベル情報外接矩形の座標503およびラベル情報パタン504が関連付けられて、データベース化される。
なお、ラベル情報外接矩形の座標は、例えば、矩形の四隅のうちのいずれか1点の座標であればよい。また、ラベル情報パタン504は、例えば、画素ごとに、輝度、彩度および色相のいずれか一つ、またはそれらの組み合わせ等の物理量によって表現されてもよい。
次に、図5を用いて、読取画像データを取得して、読取画像データから、第1フェーズで抽出した文字認識に不要な文字を消去し、認識対象となる画像データを作成する、第2フェーズの処理の流れについて説明する(適宜図2参照)。
まず、記入者によって記入された記入済帳票10bを、画像入力部301が読み取って、読取画像データを取得する(ステップS411)。
続いて、フォーマットDB解析部214が、ステップS316においてフォーマットDB401に記憶された、読取領域の矩形座標、削除領域の矩形座標、参照用画像データの削除領域に係るラベル情報外接矩形の座標とサイズおよびラベル情報パタンとを読み出す(ステップS412)。
そして、ラベリング処理部216は、読取画像データに対して、4近傍および8近傍のラベリング処理を行う(ステップS413)。また、同じラベルが付された一塊になっている画素に外接するラベル情報外接矩形の座標とサイズを読み取り、ラベル情報外接矩形の領域内でラベルが付された画素の集合であるラベル情報パタンを抽出する(ステップS414)。そして、読み取り画像データに係るラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号は、記憶部400に記憶される。なお、読み取り画像データに係るラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号は、請求項に記載の第2のラベル情報である。
ところで、ステップS412は、ステップS413とステップS414の後に行われてもよい。
次に、ラベル情報外接矩形サイズ比較部217は、ステップS412においてフォーマットDB401から読み出された、参照用画像データに係るラベル情報外接矩形(請求項における第1のラベル情報外接矩形)の座標とサイズおよびラベル情報パタンと、ステップS414において抽出された読取画像データに係るラベル情報外接矩形(請求項における第2のラベル情報外接矩形)の座標とサイズおよびラベル情報パタンとを比較する(ステップS415)。そして、比較により、両者が一致するラベル情報パタンを読取画像データから消去する(ステップS416)。
次に、ステップS416において、すべての参照用画像データに係るラベル情報(請求項における第1のラベル情報)が、読取画像データから消去されたか否かを判定する(ステップS417)。そして、すべての参照用画像データに係るラベル情報パタンが消去された場合(ステップS417でYes)には、ステップS420へ進む。また、ステップS416において、読取画像データから消去されていない参照用画像データに係るラベル情報パタンがある場合(ステップS417でNo)には、ステップS418へ進む。
ステップS418では、ラベル情報パタンテンプレートマッチング部218が、ステップS416において、読取画像データから消去されていない参照用画像データに係るラベル情報パタンを取得する。そして、その消去されていない参照用画像データに係るラベル情報パタンをテンプレートとして、読取画像データの削除領域に対してテンプレートマッチング処理を実行し、そのテンプレートと一致する箇所を特定する。
次に、テンプレートマッチングにより、テンプレートと一致した箇所の読取画像データから、テンプレートのラベル情報パタンの文字を消去する(ステップS419)。
なお、テンプレートマッチングは、参照用画像データに係るラベル情報パタンをテンプレートとして、読取画像データに係るラベル情報パタンと重なっている部分の類似度等を計算し、類似度が最大になる位置を決定する手法である。例えば、類似度の計算には、画素の振幅の平均時二乗誤差を計算する方法が用いられるが、類否が判断できる方法であれば、別の方法を用いてもよい。
次に、認識対象領域作成部215は、読取領域矩形座標設定部211が読み取った読取領域の矩形座標と、削除領域矩形座標設定部212が読み取った削除領域の矩形座標を用いて、読取領域から削除領域を削除した領域と、ステップS417でYesの場合に作成された削除領域、または、ステップS419で作成された削除領域とを足し合わせて、認識対象領域を作成する(ステップS420)。
そして、文字認識部220は、記憶部400から読み出した認識対象領域の画像データに対して、文字認識を行う(ステップS421)。
続けて、出力形成部230は、文字認識部220によって処理された文字認識の結果を、テキストデータ等に形成して、入出力部300を介して出力表示装置30に出力する(ステップS422)。
ここで、ラベル情報外接矩形サイズ比較部217による処理(ステップS415とステップS416)について、図6、図7を用いてより詳細に説明する。図6の(a)は、削除領域601に文字の一部が入り込んだ場合の例を示す図であり、(b)は、ラベル情報外接矩形サイズ比較217による処理結果を示す図である。図7の(a)は、参照用画像データに係るラベリング処理の結果を示す図であり、(b)は、読取画像データに係るラベリング処理の結果を示す図であり、(c)は、(a)と(b)のラベルに係る情報について比較した結果を示す図である。
図6(a)に示すように、削除領域601に手書き文字の一部が入り込むことが起こる。その場合、読取領域602から削除領域601を削除すると、手書き文字の一部が欠けてしまう。
そこで、ラベル情報外接矩形サイズ比較部217によって、読取領域602から、手書き文字が欠けないようにして、「ご住所」の文字を消去した結果が、図6(b)に示される認識対象領域603である。
この処理過程について、図7を用いて、より詳細に説明する(適宜図2,3,4参照)。
図7(a)は、参照用画像データに係る削除領域604を示している。ラベリング処理部216におけるラベリング処理(ステップS314)の結果、ラベル1〜9が抽出され、それぞれのラベルに対して、ラベル情報外接矩形が決定される。
一方、図7(b)は、読取画像データに係る削除領域605を示している。ラベリング処理部216におけるラベリング処理(ステップS413)の結果、ラベル1〜13が抽出され、それぞれのラベルに対して、ラベル情報外接矩形が決定される。
ラベル情報外接矩形サイズ比較部217は、図7(a)のラベル情報外接矩形の座標とサイズおよびラベル情報パタンと、図7(b)のラベル情報外接矩形の座標とサイズおよびラベル情報パタンとを比較して、完全に一致するか否かを判断する。
その結果が、図7(c)に示されている。図7(a)の参照用画像データに係るラベル1〜9は、図7(b)の読取画像データに係るラベルと一致するものが存在すると判断される。そして、一致すると判断された、図7(a)のラベル情報パタンが、図7(b)の読取画像データから消去される。
一方、図7(b)のラベル5,11〜13(符号625,符号631〜633)は、不一致と判断されるので、消去されずに削除領域に残される。そして、認識対象領域作成部215によって、この消去処理が行われた削除領域が、図6(a)の削除領域601と置き換えられて、図6(b)の認識対象領域603が作成される。
別の例として、削除領域に手書き文字が入り込んだ上に、原帳票に印刷されている文字と重なる場合も想定される。その際に、ラベル情報パタンテンプレートマッチング部218による処理(ステップS418とステップS419)について、図8、図9を用いてより詳細に説明する。図8の(a)は、削除領域701に文字の一部が入り込んだ場合の例を示す図であり、(b)は、ラベル情報外接矩形サイズ比較部217による処理結果を示す図であり、(c)は、ラベル情報パタンテンプレートマッチング部218による処理結果を示す図である。図9の(a)は、ラベル情報外接矩形サイズ比較部217の処理で消去されなかった参照用画像データに係るラベルを示す図であり、(b)は、ラベル情報外接矩形サイズ比較部217の処理後の読取画像データに係る削除領域のラベルを示す図であり、(c)は、(a)と(b)のラベルに係る情報について比較した結果を示す図である。
図8(a)に示すように、削除領域701に手書き文字の一部が入り込み、さらに、原帳票に印刷されている文字に重なることが起きる。この図8(a)では、「埼」と「ご」が重なっている例を示している。この場合、読取領域702から削除領域701を削除すると、手書き文字の一部が欠けてしまう。
さらに、図8(b)に示すように、ラベル情報外接矩形サイズ比較部217(ステップS415とステップS416)では、ラベルが一致しない部分は消去されないため、「ご」の下の部分が消去されずに残される。すなわち、「埼」と「ご」の重なっている部分が消去されない。
そこで、ラベル情報パタンテンプレートマッチング部218によって、ラベル情報外接矩形サイズ比較部217による処理後の認識対象領域703から、「埼」と重なっている「ご」の下の部分を消去した結果が、図8(c)に示される認識対象領域705である。
この処理過程について、図9を用いてより詳細に説明する(適宜図2,3,4参照)。
図9(a)は、参照用画像データに係る削除領域706を示している。ラベル情報外接矩形サイズ比較部217におけるラベル情報外接矩形サイズ比較(ステップS415)の結果、ラベル1(符号711)が不一致として残されている。
一方、図9(b)は、読取画像データに係る削除領域707を示している。ラベル情報外接矩形サイズ比較部217におけるラベル情報パタン消去(ステップS416)の結果、ラベル4,10〜14(符号724,符号730〜733)が残されている。
ラベル情報パタンテンプレートマッチング部218は、図9(a)のラベル1(符号711)のラベル情報パタンをテンプレートとして、読取画像データの削除領域707に対してテンプレートマッチング処理を実行し、そのテンプレートと一致する箇所を特定する。その際に、ラベル情報外接矩形の座標を初期値として用いると、演算量が少なくて済む。
その結果が、図9(c)に示されている。図9(a)の参照用画像データに係るラベル1は、図9(b)の読取画像データに係るラベル4(符号724)の一部に一致すると判断される。そして、一致すると判断された、図9(a)のラベル1(符号711)のラベル情報パタンが、図9(b)の読取画像データから消去される。
そして、認識対象領域作成部215によって、この消去処理がなされた削除領域が、図8(b)の削除領域704と置き換えられて、図8(c)の認識対象領域705が作成される。
このように、本発明の実施形態によれば、帳票に記入された文字を文字認識する際に、まず、文字認識の対象とならない文字等を含む削除領域を設定することにより、ラベリング処理やテンプレートマッチングの処理を行う演算量を低減することが可能となる。そして、消去すべき文字と記入された文字とが重なっていない場合については、ラベル情報外接矩形サイズ比較部217によって、文字認識の対象となる読取画像データから、参照用画像データのラベル情報パタンと一致するラベル情報パタンの文字を消去することによって、誤認識等を引き起こす文字認識の対象とならない文字を消去することが可能となる。 さらに、消去すべき文字と記入された文字とが重なっている場合については、ラベル情報パタンテンプレートマッチング部218によって、消去すべき文字に該当する部分が特定され、文字認識の対象とならない文字を消去することが可能となる。なお、本発明の実施形態では削除領域に手書き文字が入り込んだ上に、原帳票に印刷されている文字と重なる場合にラベル情報パタンテンプレートマッチング部218による処理を行うように説明したが、ラベル情報外接矩形サイズ比較部217の処理を経ずに初めからラベル情報パタンテンプレートマッチング部218による処理を行ってもよい。本発明の実施形態のように、ラベル情報外接矩形サイズ比較部217の処理を行った後にラベル情報パタンテンプレートマッチング部218による処理を行うようにしたことにより、消去すべき文字と記入された文字とが重なっていない場合については、ラベル情報外接矩形サイズ比較部217の処理を行うだけでいいので処理時間の高速化を図ることができる。
本発明の実施形態に係る文字認識装置のハードウェア構成を示す図である。 文字認識装置を機能展開して示した図である。 レイアウト解析部における、参照用画像データに対する処理を示す図である。 ラベル情報外接矩形の座標とサイズとラベル情報パタンとラベル番号とを関連付けたデータベースの一例を示す図である。 レイアウト解析部における、読取画像データから文字認識に不要な文字等を消去する処理を示す図である。 (a)は、削除領域に文字の一部が入り込んだ場合の例を示す図であり、(b)は、ラベル情報外接矩形サイズ比較による処理結果を示す図である。 参照用画像データに係るラベリング処理の結果を示す図であり、(b)は、読取画像データに係るラベリング処理の結果を示す図であり、(c)は、(a)と(b)のラベルに係る情報について比較した結果を示す図である。 (a)は、削除領域に文字の一部が入り込んだ場合の例を示す図であり、(b)は、ラベル情報外接矩形サイズ比較部による処理結果を示す図であり、(c)は、ラベル情報パタンテンプレートマッチング部による処理結果を示す図である。 (a)は、ラベル情報外接矩形サイズ比較部の処理で消去されなかった参照用画像データに係るラベルを示す図であり、(b)は、ラベル情報外接矩形サイズ比較部の処理後の読取画像データに係る削除領域のラベルを示す図であり、(c)は、(a)と(b)のラベルに係る情報について比較した結果を示す図である。 帳票の一例を示す図である。 (a)は、文字の読取領域を示す図であり、(b)は、文字認識に不要な領域を示す図であり、(c)は、文字認識の対象領域を示す図である。 (a)は、削除領域に記入した文字が入った例を示す図であり、(b)は、認識対象領域では、記入した文字が欠落することを示す図である。 (a)は、削除領域に記入した文字が入り、かつ、印刷文字と記入した文字が重なった例を示す図であり、(b)は、認識対象領域では、記入した文字が欠落することを示す図である。
符号の説明
10 帳票
10a 原帳票
10b 記入済帳票
100 文字認識装置
200 処理部
210 レイアウト解析部
211 読取領域矩形座標設定部
212 削除領域矩形座標設定部
213 フォーマットDB作成部
214 フォーマットDB解析部
215 認識対象領域作成部
216 ラベリング処理部
217 ラベル情報外接矩形サイズ比較部
218 ラベル情報パタンテンプレートマッチング部
300 入出力部
400 記憶部
401 フォーマットDB

Claims (6)

  1. 帳票上の所定領域に記載された文字を読み取って、文字認識を行う文字認識装置において用いられる文字認識方法であって、
    前記文字認識装置は、処理部、記憶部および入力部を備え、
    記入者により記載された文字がない状態の原帳票を読み取った参照用画像データおよび文字認識対象となる帳票を読取った読取画像データに対し、前記入力部によって、文字認識の対象となる矩形の領域が読取領域として設定され、および前記読取領域内で文字認識の対象としない矩形の領域が削除領域として設定され、
    前記処理部は、前記削除領域内の文字に相当する部分の画素が隣り合って一塊になっている画素に同じラベルを付けるラベリング処理を実行し、そのラベリング処理により同じラベルが付された一塊の画素に外接するラベル情報外接矩形とその矩形内でラベルが付された画素を表すラベル情報パタンとを関連付けて、前記参照用画像データに対しては第1のラベル情報として、および前記読取画像データに対しては第2のラベル情報として、前記記憶部に記憶し、
    さらに、前記処理部は、前記記憶部から読み出した、前記第1のラベル情報と前記第2のラベル情報とを比較して、少なくとも両者のラベル情報外接矩形サイズが一致するラベル情報を抽出し、前記読取画像データから、前記一致するラベル情報に対応するラベル情報パタンを消去し、前記一致するラベル情報に対応するラベル情報パタンを消去した前記読取画像データの前記読取領域を対象として文字認識を行うこと、
    を特徴とする文字認識方法。
  2. 前記第1のラベル情報と前記第2のラベル情報との比較において、一致しない第1のラベル情報が存在する場合には、
    前記処理部は、その一致しなかった第1のラベル情報に対応するラベル情報パタンをテンプレートとして、前記読取画像データの削除領域に対してテンプレートマッチング処理を実行して、そのテンプレートと一致する箇所を特定し、前記読取画像データの前記テンプレートと一致した箇所から、前記テンプレートのラベル情報パタンを消去し、前記テンプレートのラベル情報パタンを消去した前記読取画像データの前記読取領域を対象として文字認識を行うこと、
    を特徴とする請求項1に記載の文字認識方法。
  3. 帳票上の所定領域に記載された文字を読み取って、文字認識を行う文字認識装置において用いられる文字認識方法であって、
    前記文字認識装置は、処理部、記憶部および入力部を備え、
    記入者により記載された文字がない状態の原帳票を読み取った参照用画像データおよび文字認識対象となる帳票を読取った読取画像データに対し、前記入力部によって、文字認識の対象となる矩形の領域が読取領域として設定され、および前記読取領域内で文字認識の対象としない矩形の領域が削除領域として設定され、
    前記処理部は、前記削除領域内の文字に相当する部分の画素が隣り合って一塊になっている画素に同じラベルを付けるラベリング処理を実行し、そのラベリング処理により同じラベルが付された一塊の画素に外接するラベル情報外接矩形とその矩形内でラベルが付された画素を表すラベル情報パタンとを関連付けて、前記参照用画像データに対しては第1のラベル情報として、および前記読取画像データに対しては第2のラベル情報として、前記記憶部に記憶し、
    さらに、前記処理部は、前記記憶部から読み出した、前記第1のラベル情報と前記第2のラベル情報とを用いて、前記第1のラベル情報に対するラベル情報パタンをテンプレートとして、前記第2のラベル情報に対するラベル情報パタンに対してテンプレートマッチング処理を実行して、そのテンプレートと一致する箇所を特定し、一致した箇所の前記読取画像データから、前記テンプレートのラベル情報パタンを消去し、前記テンプレートのラベル情報パタンを消去した前記読取画像データの前記読取領域を対象として文字認識を行うこと、
    を特徴とする文字認識方法。
  4. 帳票上の所定領域に記載された文字を読み取って、処理部、記憶部および入力部を備えるコンピュータに文字認識させる文字認識プログラムであって、
    記入者により記載された文字がない状態の原帳票を読み取った参照用画像データおよび文字認識対象となる帳票を読取った読取画像データに対し、前記入力部によって、文字認識の対象となる矩形の領域を読取領域として設定させ、および前記読取領域内で文字認識の対象としない矩形の領域を削除領域として設定させ、
    前記処理部に、前記削除領域内の文字に相当する部分の画素が隣り合って一塊になっている画素に同じラベルを付けるラベリング処理を実行させ、そのラベリング処理により同じラベルが付された一塊の画素に外接するラベル情報外接矩形とその矩形内でラベルが付された画素を表すラベル情報パタンとを関連付けて、前記参照用画像データに対しては第1のラベル情報として、および前記読取画像データに対しては第2のラベル情報として、前記記憶部に記憶させ、
    さらに、前記処理部に、前記記憶部から読み出した、前記第1のラベル情報と前記第2のラベル情報とを比較させて、少なくとも両者のラベル情報外接矩形のサイズが一致するラベル情報を抽出させ、前記読取画像データから、前記一致するラベル情報に対応するラベル情報パタンを消去させ、
    前記第1のラベル情報と前記第2のラベル情報との比較において、一致しない第1のラベル情報が存在する場合には、
    前記処理部に、その一致しなかった第1のラベル情報に対応するラベル情報パタンをテンプレートとして、前記読取画像データの削除領域に対してテンプレートマッチング処理を実行させて、そのテンプレートと一致する箇所を特定させ、前記読取画像データの前記テンプレートと一致した箇所から、前記テンプレートのラベル情報パタンを消去させ、前記テンプレートのラベル情報パタンを消去した前記読取画像データの前記読取領域を対象として前記コンピュータに文字認識させること、
    を特徴とする文字認識プログラム。
  5. 処理部および記憶部を備え、帳票上の所定領域に記載された文字を読み取って、文字認識を行う文字認識装置であって、
    前記記憶部は、記入者により記載された文字がない状態の原帳票を読み取った参照用画像データ、および文字認識対象となる帳票を読み取った読取画像データを記憶し、
    前記処理部によって、前記参照用画像データおよび前記読取画像データに対して、文字認識の対象となる矩形の領域および前記読取領域内で文字認識の対象としない矩形の領域が、それぞれ読取領域および削除領域として読み取られ、
    前記処理部は、前記削除領域内の文字に相当する部分の画素が隣り合って一塊になっている画素の物理量と前記一塊になっている画素の位置とを関連付けて、前記記憶部に記憶し、
    前記記憶部から読み出した、前記参照用画像データおよび前記読取画像データにおける前記一塊になっている画素の物理量と前記一塊になっている画素の位置前記物理量および前記位置とのいずれかが一致する前記一塊になっている画素を抽出し、前記読取画像データから、前記一致する前記一塊になっている画素を消去し、前記一致する前記一塊になっている画素を消去した前記読取画像データの前記読取領域を対象として文字認識を行うこと、
    を特徴とする文字認識装置。
  6. 帳票上の所定領域に記載された文字を読み取って、文字認識を行う文字認識装置であって、
    前記文字認識装置は、処理部、記憶部および入力部を備え、
    記入者により記載された文字がない状態の原帳票を読み取った参照用画像データおよび文字認識対象となる帳票を読取った読取画像データに対し、前記入力部によって、文字認識の対象となる矩形の領域が読取領域として設定され、および前記読取領域内で文字認識の対象としない矩形の領域が削除領域として設定され、
    前記処理部は、前記削除領域内の文字に相当する部分の画素が隣り合って一塊になっている画素に同じラベルを付けるラベリング処理を実行し、そのラベリング処理により同じラベルが付された一塊の画素に外接するラベル情報外接矩形とその矩形内でラベルが付された画素を表すラベル情報パタンとを関連付けて、前記参照用画像データに対しては第1のラベル情報として、および前記読取画像データに対しては第2のラベル情報として、前記記憶部に記憶し、
    さらに、前記処理部は、前記記憶部から読み出した、前記第1のラベル情報と前記第2のラベル情報とを比較して、少なくとも両者のラベル情報外接矩形のサイズが一致するラベル情報を抽出し、前記読取画像データから、前記一致するラベル情報に対応するラベル情報パタンを消去し、
    前記第1のラベル情報と前記第2のラベル情報との比較において、一致しない第1のラベル情報が存在する場合には、
    前記処理部は、その一致しなかった第1のラベル情報に対応するラベル情報パタンをテンプレートとして、前記読取画像データの削除領域に対してテンプレートマッチング処理を実行して、そのテンプレートと一致する箇所を特定し、前記読取画像データの前記テンプレートと一致した箇所から、前記テンプレートのラベル情報パタンを消去し、前記テンプレートのラベル情報パタンを消去した前記読取画像データの前記読取領域を対象として文字認識を行うこと、
    を特徴とする文字認識装置。
JP2007085290A 2007-03-28 2007-03-28 文字認識方法、文字認識プログラムおよび文字認識装置 Active JP4935459B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007085290A JP4935459B2 (ja) 2007-03-28 2007-03-28 文字認識方法、文字認識プログラムおよび文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007085290A JP4935459B2 (ja) 2007-03-28 2007-03-28 文字認識方法、文字認識プログラムおよび文字認識装置

Publications (2)

Publication Number Publication Date
JP2008243016A JP2008243016A (ja) 2008-10-09
JP4935459B2 true JP4935459B2 (ja) 2012-05-23

Family

ID=39914245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007085290A Active JP4935459B2 (ja) 2007-03-28 2007-03-28 文字認識方法、文字認識プログラムおよび文字認識装置

Country Status (1)

Country Link
JP (1) JP4935459B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157107A (ja) * 2008-12-26 2010-07-15 Hitachi Software Eng Co Ltd 業務文書処理装置
CN104200204B (zh) * 2014-09-02 2017-10-03 福建富士通信息软件有限公司 一种图片处理装置及方法
CN109409395A (zh) * 2018-07-29 2019-03-01 国网上海市电力公司 在电力监控中采用模板匹配法识别目标物体区域电气符号的方法
CN111563512B (zh) * 2020-04-30 2024-03-08 广东小天才科技有限公司 一种答案自动涂抹的方法、装置、电子设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58184685A (ja) * 1982-04-21 1983-10-28 Omron Tateisi Electronics Co 文字読取装置におけるノイズ除去方式
JPH0713996A (ja) * 1993-06-25 1995-01-17 Hitachi Ltd 文字認識装置
JPH07105312A (ja) * 1993-10-07 1995-04-21 Fujitsu Ltd 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP3294995B2 (ja) * 1996-06-21 2002-06-24 三菱電機株式会社 帳票読取装置
JPH10233930A (ja) * 1997-02-21 1998-09-02 Oki Electric Ind Co Ltd 画像処理装置
JPH10269312A (ja) * 1997-03-28 1998-10-09 Oki Electric Ind Co Ltd 文字読取領域指定方法
JP3645403B2 (ja) * 1997-09-29 2005-05-11 株式会社東芝 文字読取装置および文字読取方法
JP4830331B2 (ja) * 2005-03-28 2011-12-07 富士ゼロックス株式会社 文字画像切出装置およびプログラム

Also Published As

Publication number Publication date
JP2008243016A (ja) 2008-10-09

Similar Documents

Publication Publication Date Title
JPS6159568A (ja) 文書処理装置
JP2000090195A (ja) 表認識方法及び装置
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
JPH08255236A (ja) 画像のファイリング装置及びファイリング方法
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
JP5661549B2 (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
JP2008234291A (ja) 文字認識装置及び文字認識方法
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2008282094A (ja) 文字認識処理装置
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP5483467B2 (ja) 帳票読取装置、角印検出方法、および、角印検出プログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2009025856A (ja) 帳票識別プログラム及び帳票識別装置
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
JP2012146147A (ja) 文書処理装置、及び文書処理プログラム
CN113111881A (zh) 信息处理装置及记录媒体
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
CN109598649B (zh) 一种专利文件的处理方法、装置及存储介质
JPH01292586A (ja) 文字認識支援装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090617

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120206

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4935459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150