JP3575969B2 - セル領域の決定方法、セル領域の決定装置 - Google Patents
セル領域の決定方法、セル領域の決定装置 Download PDFInfo
- Publication number
- JP3575969B2 JP3575969B2 JP33711497A JP33711497A JP3575969B2 JP 3575969 B2 JP3575969 B2 JP 3575969B2 JP 33711497 A JP33711497 A JP 33711497A JP 33711497 A JP33711497 A JP 33711497A JP 3575969 B2 JP3575969 B2 JP 3575969B2
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- area
- information
- divided
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【発明の属する技術分野】
この発明は、文字認識装置などに適用して好適なセル領域の決定方法およびセル領域の決定装置に関するものである。
【0002】
【従来の技術】
文字認識分野では、表形式の帳票に書かれた文字の認識も行われている。表形式の帳票として、典型的には、例えば以下の2種類の帳票がある。第1は、縦横の罫線で区分けされるセルの寸法や、帳票の基準点(例えば左上端点)に対する各セルの位置が、所定通りに固定されている帳票(以下、書式固定帳票という)である。第2は、各セルの寸法や、各セルの、帳票の基準点に対する絶対的な位置は、固定されていないが、各セルの並び順等、各セルの論理的な位置関係が所定通りとされている帳票(以下、様式固定帳票という)である。具体的には、○○項目欄の下には△△項目欄があり、かつ、これら項目欄の右側にはそれぞれ記入欄があるというように、論理的な位置関係が所定通りとされている帳票である。
【0003】
これら表形式の帳票では、該帳票内の特定の1又は複数のセルが文字記入欄とされることが多い。そのため、文字認識を行うためには、この特定の1又は複数のセルを帳票から検出する必要がある。
【0004】
書式固定帳票から特定のセルを検出する従来方法として、例えば文献1(「文字認識概論」、橋本新一郎 編著、昭和57年3月20日、オーム社、p.203〜206)に開示の方法がある。
【0005】
この方法では、種々の書式固定帳票ごとの読み取り制御データを用いて、帳票の画像データから文字を切り出し、そして文字認識をしている。具体的には、帳票の左端点からの、特定のセルの位置等を、読み取り制御データとして用意しておいて(文献1の第204頁)、これに基づき読み取りフィールドを特定する。次に、この特定した読み取りフィールドから文字を切り出して文字認識をしている。
【0006】
【発明が解決しようとする課題】
しかしながら、上述した従来の文字認識方法では、例えば様式固定帳票上の文字を読み取ることが出来ない場合がある。なぜなら、様式固定帳票は、既に説明したように、各セルの論理的な位置関係が規定されているのみで、各セルの寸法や絶対的な位置関係までは規定されていない。従って、様式は同じであるが、各セルの寸法やセル間の距離などが自由に作製される場合があるので、そのような場合は、上述した読み取り制御データを用意しても、読み取り領域を特定できないからである。
【0007】
また、上述した従来の文字認識方法では、固定書式帳票であっても、例えば、罫線の印刷ずれ等が生じて読み取りフィールドの絶対的な位置がずれた場合は、文字を読み取ることが出来ない場合も生じる。
【0008】
ただし、印刷ずれなどを補正するために、読み取りフィールドが位置している行の一端にラインマークを設けておき、このマークによって読み取り行を特定する方法がある(文献1の第205頁)。しかし、その場合、ラインマーク形成領域が必要である。また、ラインマークのない帳票はやはり読み取りフィールドを特定できない。
【0009】
従って、様式固定帳票であっても、また、セルの位置が印刷ずれ等によってずれている書式固定帳票であっても、該帳票の画像データ上の特定のセル領域を決定できる新規な方法が望まれる。また、このような方法の実施に好適な装置が望まれる。
【0010】
【課題を解決するための手段】
(1)そこで、この出願のセル領域の決定方法の発明によれば、罫線で区分けされている多数のセルを含む表の画像データから、特定の1又は複数のセルに対応する領域を決定するに当たり、決定対象の表に対応する表(これを「基準の表」という。)の表領域情報、基準の表の階層構造情報、基準の表のセルの位置情報、および特定の1又は複数のセルに関する情報を、予め辞書に格納しておく。また、前記基準の表の表領域情報に基づいて、前記決定対象の表の画像データ上の最初の罫線探索対象領域を設定し、前記最初の罫線探索対象領域において、前記基準の表のセルの位置情報に基づいて前記決定対象の表の画像データ上に罫線位置を仮定することにより罫線の検出領域を設定して該検出領域を走査することにより罫線を検出し、前記検出した罫線により区分けされる複数の領域のそれぞれをさらに走査することにより該複数の領域のそれぞれにおいて罫線を検出し、前記罫線の検出動作を、前記基準の表の階層構造情報に基づいて罫線検出ができないと判断できるまで繰り返す。そして、検出した罫線により区分けされる領域の中から、前記辞書中の前記特定の1又は複数のセルに関する情報に基づいて、前記特定のセル領域を決定する。
【0011】
なお、この発明において、決定対象の表とは、文字認識の例で考えれば、文字認識の対象としている表形式の帳票である。また、基準の表とは、文字認識の例で考えれば、上記の文字認識対象の帳票と同様の様式で書かれている様式固定帳票または、上記の認識対象の帳票と同様の書式固定帳票である。また、特定の1又は複数のセルとは、文字認識の例で考えれば、表形式の帳票上の文字認識対象となる1又は複数のセル(読み取りフィールドともいう)である。
【0012】
このセル領域の決定方法の発明によれば、決定対象の表から罫線を検出し、この罫線により決定対象の画像データを区分けすることができる。そのため、決定対象の表の画像データ上に、決定対象の表上の多数のセルに相当すると思われる分割領域を、仮定することができる。
【0013】
然も、この発明では、基準の表の特定の1又は複数のセルに関する情報を辞書に予め格納してある。そして、前記決定対象の画像データ上に仮定した分割領域のうちのいずれが、前記特定の1又は複数のセル領域に対応するかを、この特定の1又は複数のセルに関する情報に基づいて決定できる。
【0014】
ここで、辞書に予め格納しておく罫線情報および又はセル情報は、基準の表での特定の1又は複数のセルの位置を示す情報であって、かつ、罫線数、各罫線の配置関係、セル数、各セルの配置関係(後述する階層構造による配置関係)等のように、相対的な情報とすることが出来る。すなわち、従来のような、絶対的な位置情報ではなく、相対的な情報とすることができる。
【0015】
従って、決定対象の表が、様式固定帳票のようにセルの論理的な位置関係(セルの相対的な位置関係)のみが規定されている帳票の場合や、印刷ズレなどが原因でセル位置がずれてしまっている書式固定帳票の場合であっても、罫線情報および又はセル情報を、前記決定対象の画像データ上に仮定されている分割領域に照らすことによって、該決定対象の画像データ上に仮定されている分割領域の中から、前記基準の表での特定の1又は複数のセルに対応する領域を決定することができる。結局、検出対象の表の画像データから、特定の1又は複数のセルに対応する領域を決定できる。
【0016】
(2)なお、このセル領域の決定方法の発明を実施するに当たり、決定対象の表から検出した罫線の情報と、前記辞書に格納してある罫線情報および又はセル情報とを照合して、決定対象の表と基準の表との対応関係を判定するのが好ましい。例えば、決定対象の表と基準の表との、罫線の数、罫線の配置、セルの数およびセルの配置から選ばれた1又は複数の情報を比較することで、これら表同士の対応関係を判定するのが好ましい。こうすると、決定対象の表にふさわしくない罫線情報および又はセル情報によりセル領域が決定されるのを、回避しやすく出来るので、処理の無駄を省くことができる。
【0017】
なお、上記の対応関係が得られなかった場合はリジェクトの通知をする等の方法をとるのが良い。こうすると、例えば、手動的に又は自動的に、別の基準の表についての罫線情報および又はセル情報を用いて、セル検出を開始できる等、効率的な処理ができる。
【0018】
(3)なお、このセル領域の決定方法の発明を実施するに当たり、罫線情報および又はセル情報として、以下の情報を前記辞書に少なくとも格納するのが良い。
【0019】
すなわち、前記基準の表の最外側の罫線で囲われる領域の、垂直方向または水平方向両端まで罫線によって分割されている各領域を第1階層の分割領域と称し、該罫線を第1階層の罫線と称し、該第1階層の各分割領域ごとの、第1階層の罫線が水平方向である場合は垂直方向両端まで、また、第1階層の罫線が垂直方向である場合は水平方向両端まで罫線によって分割されている各領域を第2階層の分割領域と称し、該罫線を第2階層の罫線と称し、以下同様に、第n階層の分割領域および第n階層の罫線と称し、第n階層の罫線が水平方向である場合は、第n+1階層の罫線は垂直方向であるとし、また、第n階層の罫線が垂直方向である場合は、第n+1階層の罫線は水平方向であるとしたとき、該階層構造での、各階層の罫線情報および又は分割領域情報(例えば図5(C)参照)と、前記基準の表での前記特定のセルの位置を示す情報とを、前記辞書に少なくとも格納し、前記罫線情報および又はセル情報として、前記基準の表と罫線の位置を指定して、前記決定対象の表の画像データ上の罫線探査対象領域を設定するのが良い。
【0020】
このような階層構造データを用いると、特定の1又は複数のセルの位置を示す情報として、階層構造における、例えば、第何階層の左側(または右側)から第何番目というような相対的な情報を用いることができる。そのため、特定の1又は複数のセルの位置を示す情報として、絶対的な位置情報を用いずに済むので、様式固定帳票や、印刷ズレによりセル位置がずれている書式固定帳票の画像データから、特定の1又は複数のセルに対応する領域を決定できる。
【0021】
(4)また、上記の(3)にて説明した階層構造に関する情報の代わりに、該階層構造での、前記特定の1又は複数のセルに至るに必要な罫線情報および又は分割領域情報のみ(例えば図8参照)と、前記基準の表での前記特定のセルの位置を示す情報とを、前記辞書に格納し、前記罫線情報および又はセル情報に基づいて、特定のセルを含む分割領域を罫線探索対象領域として設定しても良い。
【0022】
このようにした場合は、辞書に階層構造全体の情報を格納させる場合に比べて、辞書に格納させる情報量を削減できる。
【0023】
(5)なお、上記のように階層構造に関する情報を辞書に記憶させる場合は、次のような処理を実施するのが良い。
【0024】
すなわち、階層構造での罫線情報および又は分割領域情報からみて下位の階層があるにもかかわらず、決定対象の表の画像データから罫線が検出できない場合、または罫線が検出できても該検出した罫線情報が前記辞書に格納してある情報に対応しない場合は、セル領域の決定処理を打ち切り、かつ、リジェクトの通知をするのが良い。こうすると、無駄な処理を省くことができるからである。
【0025】
(6)また、このセル領域決定方法の発明を実施するに当たり、決定対象の表の画像データからの罫線の検出を以下のようにして行うのが好ましい。
【0026】
すなわち、決定対象の表の画像データの、前記表領域の座標で指定される領域を、垂直方向または水平方向両端まで分割できる罫線を、前記画像データ上の第1階層の罫線として検出する第1の処理と、該第1の処理で罫線が検出された場合、該罫線で分割される各領域(画像データ上の第1階層の分割領域)を、前記第1階層の罫線が水平方向である場合は垂直方向両端まで、また、前記第1階層の罫線が垂直方向である場合は水平方向両端まで、分割できる罫線を、前記画像データ上の第2階層の罫線として検出する第2の処理と、以下、同様に、第nの処理で、第n階層の罫線が検出された場合、前記画像データ上の第n階層の分割領域を、前記第n階層の罫線が水平方向である場合は垂直方向両端まで、また、前記第n階層の罫線が垂直方向である場合は水平方向両端まで、分割できる罫線を前記画像データ上の第n+1階層の罫線として検出する第n+1の処理とによって、決定対象の表の画像データから罫線を検出するのがよい。
【0027】
こうすると、表領域の座標を用いて罫線検出を開始できる。そのため、罫線検出作業を効率的に開始することが出来る。然も、決定対象の表から罫線を階層的に検出できる。これは、辞書に罫線情報および又はセル情報として、上記の(3)や(4)にて説明した階層構造に関する情報を格納してある場合に、この辞書の情報に対応する罫線情報を検出できることを意味するので、好ましい。
【0028】
(7)また、決定対象の表の画像データから罫線を検出する際に、上記の(6)で述べたように表領域の座標を用いて処理を開始する場合は、次のような手順とするのが良い。
【0029】
すなわち、決定対象の表の画像データから前記表領域と同じかそれに近い大きさを持つ領域を先ず抽出する。そして、この抽出した領域の座標と前記表領域の座標とのズレ分だけ、前記罫線情報および又はセル情報の座標に関する情報を補正する。その後に、前記罫線検出を行う。こうすると、座標の補正がなされた分、罫線検出の走査領域が正確になる。また、検出した罫線の情報と辞書に格納してある罫線情報および又はセル情報とを照合するに当たり、正確な情報同士を照合できる。これらのため、セル領域の決定を精度良く行える。
【0030】
(8)なお、上述のセル領域の決定方法の発明を容易に実施するために、以下の様な構成のセル領域決定装置を用意するのが好ましい。
【0031】
すなわち、罫線で区分けされている多数のセルを含む表の画像データから、特定の1又は複数のセルに対応する領域を決定するための装置において、
決定対象の表に対応する基準の表の表領域情報、基準の表の階層構造情報、基準の表のセルの位置情報、および特定の1又は複数のセルに関する情報を格納している辞書と、
前記基準の表の表領域情報に基づいて、前記決定対象の表の画像データ上の最初の罫線探索対象領域を設定し、前記罫線探索対象領域において、前記基準の表のセルの位置情報に基づいて前記決定対象の表の画像データ上に罫線位置を仮定することにより罫線の検出領域を設定して該検出領域を走査することにより罫線を検出し、前記検出した罫線により区分けされる複数の領域のそれぞれをさらに走査することにより該複数の領域のそれぞれにおいて罫線を検出し、前記罫線の検出動作を、前記基準の表の階層構造情報に基づいて罫線検出ができないと判断できるまで繰り返す罫線検出手段と、
前記辞書中の前記特定の1又は複数のセルに関する情報に基づいて、前記罫線検出手段が検出した罫線により区分けされる領域の中から、前記特定のセル領域を決定するセル領域決定手段とを具えた装置を用意するのがこの好ましい。
【0032】
【発明の実施の形態】
以下、図面を参照して、この出願のセル領域の決定方法およびセル領域の決定装置の各発明の実施の形態について併せて説明する。なお、以下の説明に用いる各図は、これらの発明を理解できる程度に概略的に示してある。また、説明に用いる各図において、同様な構成成分については同一の番号を付して示し、その重複する説明を省略することもある。
【0033】
1.第1の実施の形態
1−1.装置の全体構成の説明
図1は、この発明のセル領域決定装置の実施の形態を説明する図である。特に文字認識装置10に、この実施の形態のセル領域決定装置20を適用した例を示した図である。
【0034】
この文字認識装置10は、セル領域決定装置20と、文字認識手段30と、CPU40と、メモリ50とを具える。
【0035】
このセル領域決定装置20は、罫線により区分けされている多数のセルを含む表(すなわち決定対象の表)の画像データから、特定の1又は複数のセルに対応する領域を決定する。なお、ここでいう決定対象の表とは、帳票全体がこのような表の場合と、帳票の一部がこのような表の場合いずれでも良い。
【0036】
この実施の形態のセル領域決定装置20は、辞書21と、罫線検出手段23と、セル領域決定手段25と、対応関係判定手段27とを具える。
【0037】
この辞書21は、基準の表の罫線情報および又はセル情報を格納している。なお、基準の表は2以上の場合もあり得る。また、罫線検出手段23は、決定対象の表の画像データから罫線を検出する。また、セル領域決定手段25は、罫線検出手段23が検出した罫線により区分けされる前記画像データ上の各領域から、辞書21に格納してある罫線情報および又はセル情報に基づいて、特定のセル領域を決定する。
【0038】
この辞書21は、メモリ50の一部で構成されている。また、罫線検出手段23、セル領域決定手段25および対応関係判定手段27それぞれは、実際はコンピュータプログラムにより構成されている。これらプログラムは、メモリ50に格納されている。このセル領域決定装置20の詳細は後の動作説明において説明する。
【0039】
また、文字認識手段30は、媒体上の文字を認識する。この場合は、決定対象の表の特定の1又は複数のセル内に記入されている文字を認識する。
【0040】
この文字認識手段30は、公知の手段で構成できる。例えば、認識対象の文字列から文字を切り出し、該切り出した文字の特徴を抽出する。そして、該抽出した認識対象文字の特徴を、予め用意した辞書内の各文字の特徴と照合して、候補文字を決めるという手段で構成できる。
【0041】
このような文字認識手段は、図示は省略するが、認識部と認識用辞書とで構成されている。そして、この認識部は、コンピュータプログラムで構成されている。また、この認識用辞書はメモリ50の一部で構成されている。認識部を構成するプログラムは、メモリ50に格納されている。
【0042】
また、CPU40は、セル領域決定装置20および文字認識手段30を制御する。
【0043】
また、メモリ50は、ハードディスク等、任意好適な記憶媒体で構成されている。
【0044】
また、この文字認識装置10には、帳票の画像データを該帳票から読み取るための画像データ入力手段60が、接続されている。この画像データ入力手段60は、この実施の形態の場合、スキャナ61と、スキャナ61で読んだイメージを格納する帳票イメージメモリ63とで、構成されている。
【0045】
なお、図1では、画像データ入力手段60を、文字認識装置10の外付け装置的に示しているが、文字認識装置10が、画像データ入力手段60を内蔵する場合があっても良い。
【0046】
1−2.辞書に格納する情報について
次に、辞書21に格納する罫線情報および又はセル情報について、説明する。この第1の実施の形態では、辞書21に格納する罫線情報および又はセル情報を、基準の表についての以下に説明する階層構造に関する情報と、該基準の表での、特定の1又は複数のセルの位置を示す情報と、基準の表での表領域の位置を示す情報としてある。
【0047】
すなわち、基準の表の画像データの最外側の罫線で囲まれる領域(表領域)の、垂直方向両端または水平方向両端まで罫線によって分割されている各領域を、第1階層の分割領域と称し、該第1階層の各分割領域ごとの、垂直方向両端または水平方向両端まで罫線によって分割されている各領域を、第2階層の分割領域と称し、以下同様に、第n階層の分割領域と称するとしたとき、該基準の表の、上記階層構造に関する情報と、該階層構造中のどの分割領域が、前記特定の1又は複数のセルであるかという情報と、表領域の位置情報とを、辞書21にそれぞれ格納してある。
【0048】
図2は、上記の階層構造に関する情報等の理解を容易にするため、基準の表として、帳票200の例を示した図である。この帳票200は、表領域210を含んでいる。表領域210は、該帳票200の、最外側の罫線で囲まれる領域である。この表領域210内の多数のセルのうちの、セル230が、特定のセル(これを「読み取りフィールド」ともいう。)に当たる例を示してある。
【0049】
この帳票200の場合は、詳細は後述するが、階層構造として、例えば、図5(C)に示すような構造が得られる。また、この階層構造での読み取りフィールドに対応する領域は、詳細は後述するが、分割領域T221になる。
【0050】
階層構造に関する情報は、例えば、各階層ごとの分割領域の左上点座標および右下点座標で表される情報とできる。また、特定の1又は複数のセルの位置を示す情報は、例えば、左上点座標などの位置座標でも良いし、または、前記階層構造での第n階層の右から(左から)数えて第m番目のセルというような情報でも良い。
【0051】
この帳票200(基準の表)の、上記のような階層構造に関する情報および特定の1又は複数のセルの位置を示す情報は、任意好適な方法により予め求めておく。
【0052】
この任意好適な方法の第1の方法として、次の方法がある。すなわち、文字認識装置の使用者は、基準の表の構造を知っているので、上記階層構造に関する情報と、特定の1又は複数のセルについての情報とを、該使用者が辞書21に登録する方法がある。
【0053】
また、第2の方法として、上記基準の表を含む帳票200の画像データを、任意好適な画像処理装置により走査して罫線を検出し、そして、上記の階層構造を求める方法がある。なお、この任意好適な画像処理装置とは、別途に用意した装置でも良いし、または、図1に示した罫線検出手段23を利用しても良い。
【0054】
さらに、第3の方法として、予め文字認識装置の使用者が基準の表と罫線の位置とを指定しておき、その情報を用いて上記階層構造を求める方法がある。この第3の方法について、以下、図3〜図5を参照して説明する。
【0055】
この第3の方法では、先ず、予め指定された表領域210の位置座標を読み込む(登録する)(図3のステップS301)。
【0056】
次に、階層を示す変数aを1に初期化する(ステップS302)。
【0057】
次に、第a階層(ここでは第1階層)の罫線探索対象領域を設定する(ステップS303)。第1階層の対象領域は、この例の場合、上記の表領域210になる。
【0058】
次に、予め指定された罫線の中で、この対象領域の、左端から右端まで渡っている罫線、すなわち水平罫線を探索する(ステップS304)。
【0059】
次に、水平罫線があったか否かの判定がなされる(ステップS305)。あった場合は、ステップS306へ、また、なかった場合はステップ310へ移る。
【0060】
図2に例示した帳票200の場合は、罫線220bと罫線220dとが、上記の水平罫線として検出されるので、ステップS306へ移る。水平罫線がなかった場合は、ステップS310にて、対象領域の、上端から下端まで渡っている罫線、すなわち垂直罫線を探索する。もちろん、罫線探索を、上記の説明とは逆に、先ず、垂直罫線の探索から開始しても良い。
【0061】
水平罫線または垂直罫線が検出されたなら、この検出した罫線で、対象領域を、分割する。この例の場合は、表領域210を、水平罫線220bと、水平罫線220dとで、分割する。これにより、第1階層の分割領域として、図5(A)に示したように、分割領域T1〜T3が得られる。これら第1階層の分割領域T1〜T3それぞれの位置情報を、罫線情報および又はセル情報の一部として、辞書21に格納する(ステップS306)。
【0062】
なお、この実施の形態の場合、各分割領域の位置情報を、各分割領域の左上端点座標および右下端点座標とする。
【0063】
次に、階層を示す変数aを、インクリメントする(ステップS307)。
【0064】
次に、前階層で行った領域分割が、縦分割であったか、横分割であったかを、判定する(図4のステップS321)。なお、この実施の形態の場合、縦分割とは、水平罫線により領域を分割することであり、横分割とは、垂直罫線により領域を分割することである。
【0065】
前階層での領域分割が縦分割であった場合は、分割された領域T1〜T3のうちの先ず1つの領域に着目して、該領域内に垂直罫線があるか否かの探索処理に移る(ステップS322)。また、前階層での領域分割が横分割であった場合は、分割された領域T1〜T3のうちの先ず1つの領域に着目して、該領域内に水平罫線があるか否かの探索処理に移る(ステップS323)。すなわち、いずれの場合も、前階層での罫線と直交する方向の罫線探索に移る。この例の場合では、表領域210が縦分割されて、第1階層の領域T1〜T3を得たので、第2階層ではステップS322の処理に移る。
【0066】
第1階層の分割領域T1〜T3のうちの1つの領域の分割が済むと、第1階層の分割領域として別の領域が残っていないかどうかが判定される(ステップS352,またはS353)。こうして、第1階層の分割領域T1〜T3それぞれについて、これら領域内の罫線探索が行われる。
【0067】
次に、第1階層の各分割領域T1〜T3それぞれを、上記探索で得られた罫線で分割する(ステップS325)。こうすることで、第2階層の分割領域が得られる。図2に例示した帳票200の場合は、第2階層の分割領域として、図5(A)に示したように、T11、T12、T21およびT22という4つの分割領域が得られる。この第2階層の分割領域それぞれの位置情報を、罫線情報および又はセル情報としての一部として、辞書21に格納する(ステップS325)。なお、これら位置情報も、この実施の形態の場合、各分割領域の左上点座標および右下点座標とする。
【0068】
次に、階層を示す変数aをインクリメントして(ステップS326)、その後、ステップS321の処理から実行する。この一連の処理を、予め指定された罫線によって領域分割が出来なくなるまで繰り返す。
【0069】
図2に例示した帳票200の場合は、最下位の階層は第3階層となる。そして、第3階層の分割領域として、図5(B)に示したように、T221およびT222という2つの分割領域が得られる。この第3階層の分割領域それぞれの位置情報を、罫線情報および又はセル情報の一部として、辞書21に格納する(ステップS325)。
【0070】
図5(C)は、帳票200の表領域210から求まる階層構造に関する情報の概念図である。ツリー上のイメージの階層構造に関する情報が得られる。
【0071】
次に、上記の階層構造中のどの分割領域が、読み取りフィールドに相当する領域かを探索する(図4のステップS340)。この場合は、基準の表での読み取りフィールドの位置情報が予め判っている。そこで、この位置情報と、上記階層構造の各分割領域の位置情報とを照合し、そして、階層構造中の各分割領域の中で、読み取りフィールドの位置情報に最も近い位置情報を持つ分割領域を、読み取りフィールドとする。図2に例示の帳票200の場合は、第3階層の分割領域T221が、読み取りフィールドに対応する領域になる。そこで、分割領域T221については、その位置情報と共に、この領域が読み取りフィールドに対応する旨の情報も、辞書21に格納する。この情報は、既に述べたように、分割領域T221の例えば位置座標そのものでも良いし、または、分割領域T221が第○○階層の左から△△番目にある等の情報でも良い。好ましくは後者が良い。
【0072】
1−3.決定対象の表に対する処理について
次に、決定対象の表を含む帳票の画像データから、該表中の特定の1又は複数のセルに対応する領域を決定する処理について、説明する。この説明を図6に示したフローチャートと、図7と、図1とを参照して説明する。ここで、図7(A)は、基準の表を示した図、図7(B)は、図7(A)に示した基準の表と同じ様式で書かれた検出対象の表を示した図である。また、図7(C)および(D)は、第2階層及び第3階層の罫線検出の説明図である。基準の表と決定対象の表とは、同じ様式ではあるが、図7(A)および(B)を比較することで判るように、両者の罫線の位置が多少ずれている。
【0073】
決定対象の表を含む帳票の画像データを、画像データ入力手段60により、読み込む。この画像データは、帳票イメージメモリ63に格納される。
【0074】
罫線検出手段23は、階層を示す変数aを1にする(図6のステップS601)。
【0075】
次に、この画像データの所定領域を、罫線検出対象領域として設定する(図6のステップS602)。
【0076】
この所定の領域を、例えば帳票イメージメモリ63内の全域としてもよい。しかし、この実施の形態の場合は、この所定領域を、基準の帳票200の表領域210と対応する領域とする。そのため、辞書21から、基準の帳票200の表領域210の位置情報、すなわち図2の表領域210の位置情報を読み出して、この位置情報で画像データ上の罫線検出対象領域を特定する。図7(B)中の、表領域610が、対象領域に当たる。
【0077】
次に、この対象領域内の罫線を検出する処理に移る。罫線検出は、表領域610の全面を走査する方法で行ってもよい。しかし、この場合は、罫線検出手段23は、辞書21に格納してある、基準の表の第1階層の分割領域の位置情報を、読み込む。そして、この位置情報に基づいて、検出対象の表の画像データ上に、罫線位置を仮定する。さらに、この仮定した罫線位置およびその近傍を走査して前記画像データ上での第1階層の罫線を検出する(ステップS603)。こうすると、領域610全体を走査する場合に比べて、罫線検出のための走査領域を狭くできるので、処理時間の短縮化が図れる。
【0078】
この実施の形態の表の例の場合、図7(B)中の、罫線620a、620bが、検出された罫線である。また、これら罫線620a、620bで分割される領域として、領域t1〜t3が得られる。
【0079】
なお、罫線検出は、罫線検出領域を走査して得られる黒画素数や黒ラン(黒画素の連続する部分)の長さなどを判断基準とする、公知の罫線検出手法で行える(以下の各罫線検出において同じ。)。
【0080】
また、仮定した罫線位置に対してどの程度の近傍領域を走査領域とするかは、設計に応じて決める。この近傍領域を広くするほど、基準の表に対して決定対象の表のセル位置がずれても罫線検出を行える。
【0081】
なお、この発明を実施するに当たり、決定対象の表の画像データから、基準の表の分割領域T1〜T3に対応する領域t1〜t3が、抽出できたか否かを、対応関係判定手段27によってチェックするのが良い。すなわち、領域T1〜T3と、領域t1〜t3とを照合して、両表の対応関係をチェックするのが良い。この照合は、例えば、対応関係判定手段27によって、両表上の各分割領域の座標同士の比較または領域数の比較等で行う。領域T1〜T3と、領域t1〜t3との対応がとれなかった場合は、今用いている罫線情報および又はセル情報が、決定対象の表に適合していないと判断出来る。その場合は、リジェクト処理をして、別の基準の表の罫線情報および又はセル情報を用いて罫線検出処理を行うのが良い。このような照合処理は、以下の各階層ごとでも行うのが良い。
【0082】
次に、階層を示す変数aをインクリメントする(ステップS604)。
【0083】
次に、罫線検出対象領域を設定する(図6のステップS605)。
【0084】
この場合の罫線検出対象領域は、前階層で検出した罫線によって分割される各領域t1〜t3である(図7(B)参照)。そこで、これら領域t1〜t3のうちのある1つの領域を罫線検出対象領域とする。
【0085】
次に、前階層での領域分割が縦分割であったか、横分割であったかを判定する(ステップS606)。前階層での領域分割が縦分割であった場合、ステップS605で設定された罫線対象検出領域を、垂直罫線検出領域として、再設定する(ステップS607)。一方、前階層での領域分割が横分割であった場合、ステップS605で設定された罫線対象検出領域を、水平罫線検出領域として、再設定する(ステップS620)。そして、画像データ上の、この罫線検出対象領域を走査して第2階層の罫線を検出する(ステップS608またはS621)。
【0086】
次に、同一階層に、罫線検出対象の分割領域が残っていないかどうかを判定する(ステップS609またはS622)。残っている場合は、ステップS607またはS620に戻り、そこから処理を繰り返す。一方、同一階層に、罫線検出対象の分割領域がもう残っていない場合は、次に、もうこれ以上罫線検出が出来ない階層まで処理が進んでいるか否かを判定する(ステップS610)。この判定は、辞書21に格納してある階層構造に関する情報から、まだ下位の階層があるか否かで、行える。
【0087】
そして、もう罫線検出が出来ない場合、すなわちもう下位の階層がない場合、罫線検出手段23は動作を終了する。一方、罫線検出が出来る場合、すなわち、まだ下位の階層がある場合、階層を示す変数aをインクリメントし(ステップS611)、そして、ステップS605にもどり、そこからの処理を繰り返す。このようにして、決定対象の表の画像データから、複数の分割領域を求めることができる。
【0088】
次に、セル領域決定手段25は、罫線検出手段23が求めた複数の分割領域の中から、辞書21に格納してある罫線情報および又はセル情報に基づいて、読み取りフィールドを決定する。辞書21に読み取りフィールドの位置座標が格納されている場合ならば、この決定は、罫線検出手段23が求めた複数の分割領域の中から、辞書21に格納してある、読み取りフィールドの位置座標に、最も近い位置の分割領域を、読み取り領域と決定することで行える。また、読み取りフィールドの位置を示す情報として、階層構造の第n階層の左から第m番目という情報を辞書21に格納してある場合は、この情報に基づいて、決定対象の表の各分割領域中から該当する領域を検出して、この領域を読み取りフィールドと決定する。
【0089】
次に、文字認識手段30は、決定対象の表の画像データの、上記決定された読み取りフィールドに当たる部分から、公知の方法で文字を切り出し、さらに公知の方法で文字認識をする。
【0090】
この第1の実施の形態によれば、基準の表の階層構造に関する情報と、基準の表での特定の1又は複数のセルの位置を示す情報とを、罫線情報および又はセル情報として、予め辞書に格納してある。また、決定対象の表の画像データから罫線を検出してこれら罫線で分割される複数の分割領域を抽出する。この複数の分割領域の中から、上記の辞書に格納してある罫線情報および又はセル情報に基づいて、読み取りフィールドと思われる領域を決定する。そのため、基準の表に対してセルの位置がずれている決定対象の表からも、読み取りフィールドを正確に決定できる。
【0091】
2.第2の実施の形態
上述の第1の実施の形態では、階層構造に関する情報を各階層の分割領域の位置情報としていた。これに対して、この第2の実施の形態では、階層構造に関する情報を、階層ごとの分割領域の数とする。具体的な例で説明すると、例えば図5(C)に示した階層構造の例では、第1階層の分割領域数が3、第2階層の分割領域数が4、第3階層の分割領域数が2であるので、これら各階層の分割領域数を階層構造に関する情報として用いる。辞書21には、階層構造に関する情報として、この各階層の分割領域の数を予め格納しておく。
【0092】
なお、このような階層構造に関する情報の辞書21への格納は、文字認識装置10の使用者が人為的に行っても良いし、または、好適な画像処理装置が基準の表を走査して各階層の分割領域数を検出し、これを辞書21に格納しても良い。後者の方法をとる場合は、第1の実施の形態で図3および図4を参照して説明した処理中の、ステップS306およびステップS325の各処理を変更する。すなわち、第1の実施の形態では分割領域の位置情報を登録していたのに対し、この第2の実施の形態では、これらステップそれぞれで、その階層での分割領域の数を、辞書21に格納する。
【0093】
また、この第2の実施の形態の場合、決定対象の表の画像データから罫線を検出する処理を、第1の実施の形態に対して、次のように変更する。
【0094】
第1の実施の形態では、決定対象の表の画像データから第1階層の罫線を検出する場合、辞書21から第1階層の分割領域の位置情報を読み込み、この情報で仮罫線位置を決め、この仮罫線位置及びその近傍を走査していた。これに対し、この第2の実施の形態では、画像データから第1階層の罫線を検出する場合、所定領域(上記の例では表領域)を全部走査する。そして、この第2の実施の形態で階層構造に関する情報としている分割領域の数に応じた数の分割領域を、走査範囲内から検出する。第2階層以降についても、分割領域数に応じた数の罫線を検出する。ただし、分割領域数に応じた数の罫線が検出出来なかった場合は、該階層では罫線が検出出来なかったと判定する。そしてこの場合は、例えば、基準帳票が適正でない等と判断して、例えばリジェクト処理をする。それ以外は、第1の実施の形態と同様に処理をする。
【0095】
この第2の実施の形態の場合、辞書21に格納させる情報が各階層の分割領域数で済む。このため、各分割領域の位置情報を階層構造に関する情報として用いていた第1の実施の形態に比べて、辞書21に格納する情報の容量を少なくできるという効果が得られる。また、画像データ上の、第1の階層の分割領域を決める際の走査範囲を、第1の実施の形態に比べて広くできる。その分、帳票上の罫線位置ずれ検出許容度を大きくできる。
【0096】
3.第3の実施の形態
上述の第1の実施の形態では、階層構造に関する情報として、各階層のかつ各分割領域それぞれの位置情報を用いていた。すなわち、階層構造の全体についての情報を用いていた。これに対して、この第3の実施の形態では、階層構造に関する情報として、前記特定のセルに至るに必要な罫線情報および又はセル情報で示される階層構造情報のみと、前記基準の表での前記特定のセルの位置を示す情報とを、前記辞書21に格納してある。これについて具体的に説明する。
【0097】
図8はこの第3の実施の形態の思想を適用して得られる階層構造の概念図である。この階層構造を抽出する対象とした帳票は、図2を用いて説明した帳票200である。この図8と、第1の実施の形態で抽出された図5(C)に示した階層構造の概念図とを、比較すると、第1の実施の形態に対する第3の実施の形態の違いが理解出来る。
【0098】
すなわち、この第3の実施の形態では、階層構造に関する情報として、先ず、第1の階層の各分割領域の位置情報を用いる。図8の例でいえば、分割領域T1〜T3それぞれの位置情報を階層構造に関する情報として用いる。
【0099】
またさらに、この第3の実施の形態では、第1階層の分割領域のうちの読み取りフィールドを含む領域のみに着目する。第1階層の分割領域のうちどれが読み取りフィールドを含む領域かの探索は、第1階層の各分割領域の位置情報と、辞書21に格納してある読み取りフィールドの位置情報とを比較することで、行うことが出来る。
【0100】
図2の帳票の例では、読み取りフィールドはT221であるので、図8の第1階層の分割領域T1〜T3のうちで、読み取りフィールドT221を含むのは分割領域T2となる。そこで、このT2からさらに下位の階層を辿る。すると、図2の帳票200の例では、第2の階層の分割領域としてT21,T22が得られる。これらT21,T22の位置情報も、階層構造に関する情報として用いる。
【0101】
次に、これらT21,T22では、前記読み取りフィ−ルドを含む分割領域はT22である。そこで、このT22からさらに下位の階層を辿る。すると、図2の帳票の例では、第3の階層の分割領域としてT221,T222が得られる。これらT221,T222の位置情報も、階層構造に関する情報として用いる。このようにして、図8に示したような読み取りフィールドに相当する分割領域のみを辿る階層構造情報が得られる。これは辞書21に格納される。
【0102】
図9および図10は、図8のような階層構造に関する情報を得るための処理手順を示したフローチャートである。基本的には、図3および図4に示したフローチャートに、読み取りフィールドを含む分割領域のみを辿れるようにする処理を追加してある。具体的には、ステップS320、S362およびS363を追加してある。
【0103】
この追加された処理につき以下簡単に説明する。この処理手順によれば、階層構造に関する情報を作成する処理において第1階層の分割領域を抽出し終えたら、第1階層の分割領域の中のどれが読み取りフィールドを含む分割領域かの探索が行われる(ステップS320)。また、垂直罫線探索処理(ステップS322)または水平罫線探索処理(ステップS323)を開始する前に、罫線探索対象領域が読み取りフィールドを含む領域か否かの判定がされる(ステップS362またはステップS363)。そうであった場合は、罫線探索をし(ステップS322またはステップS323)、そうでない場合は、同一階層に分割領域がまだ残っているか否かの判定がなされる。
【0104】
第2階層以降についても、上記と同様に、読み取りフィールドを含む領域についてのみ、罫線探索がなされるように処理される。
【0105】
それ以外の各処理は、第1の実施の形態と同様であるのでその説明を省略する。
【0106】
この第3の実施の形態によれば、辞書21に格納する階層構造に関する情報として、読み取りフィールドを含む領域を辿るのに必要な最小限度の階層構造情報を用意すれば済む。そのため、辞書に格納する階層構造に関する情報量を、第1の実施の形態に比べて少なくできるという効果が得られる。なお、最小限度の構造情報といえど、特徴的な階層構造情報は確保できている。したがって、決定対象の表から抽出された分割領域を辞書21中の階層構造に関する情報と対応させて、今用いている階層構造に関する情報(すなわち罫線情報および又はセル情報)が決定対象の表の読み取りフィールドの決定に適したものか否かを判断することも、十分にできる。
【0107】
4.第4の実施の形態
罫線情報および又はセル情報として基準の表上の分割領域の位置情報を利用する場合、基準の表上の表領域の位置と、決定対象の表の画像データ上の表領域の位置とがずれている程、基準の表上の分割領域の位置座標は、画像データ上の読み取りフィールド決定のための情報として、精度の悪いものとなる。
【0108】
すなわち、例えば図11に示したように、決定対象の表の画像データ300上の、辞書21に格納してある表領域の情報で指定される表領域310と、実際にこの画像データ300から検出される表領域320とが、Δx、Δyずれているとする。すると、第1の実施の形態や第3の実施の形態での、第1階層の罫線検出では、仮の罫線検出位置がΔx、Δyずれてしまう。そうすると、罫線検出ができなかったり、仮の罫線検出位置の近傍に設定する走査領域を広くする必要が生じるという各問題が生じる。
【0109】
そこで、この第4の実施の形態では、画像デ−タ300から、基準の表の表領域310と同じかまたはそれに近い大きさを持つ領域(図11では領域320)を、抽出する。なお、どの程度近い大きさまでを比較対照とするかは、設計に応じて決める。
【0110】
そして、この抽出した領域320の座標と基準の表の表領域310の座標とのずれ分(図11ではΔx、Δy)だけ、辞書21の各分割領域の位置情報を補正する。その後に、例えば、第1の実施の形態で説明した様に罫線検出を行う。
【0111】
この第4の実施の形態によれば、画像データから、基準の表上の表領域に相当すると思われる領域を検出し、該検出した領域の位置と、基準の表上での表領域の位置とを比較する。そして、両者の位置ズレ分だけ、辞書21の位置情報を補正する。このため、画像データ上に、罫線検出位置をより正確に設定できる。したがって、画像データから、読み取りフィールドをより正確に決定することが出来る。また、入力帳票上の表領域位置が基準帳票上の表領域に対してずれていた場合での罫線検出許容度が向上する。
【0112】
【発明の効果】
上述した説明から明らかなように、この出願のセル領域の決定方法の発明によれば、罫線で区分けされている多数のセルを含む表の画像データから、特定の1又は複数のセルに対応する領域を決定するに当たり、基準の表の罫線情報および又はセル情報を予め辞書に格納しておく。そして、決定対象の表の画像データから罫線を検出する。そして、該画像データの、前記検出した罫線により区分けされる領域から、前記罫線情報および又はセル情報に基づいて、前記特定のセル領域を決定する。
【0113】
ここで、罫線情報および又はセル情報は、基準の表での特定の1又は複数のセルの位置を示す情報であって、かつ、罫線数、各罫線の配置関係、セル数、各セルの配置関係(後述する階層構造による配置関係)等のように、相対的な情報とすることが出来る。すなわち、従来のような、絶対的な位置情報ではなく、相対的な情報とすることができる。
【0114】
従って、この罫線情報および又はセル情報を、決定対象の表の画像データに照らすと、決定対象の表が、様式固定帳票のようにセルの論理的な位置関係(セルの相対的な位置関係)のみが規定されている帳票の場合や、印刷ズレなどが原因でセル位置がずれてしまっている書式固定帳票の場合であっても、特定の1又は複数のセルに対応する領域を決定できる。
【0115】
また、この出願のセル領域の決定装置によれば、所定の辞書と、罫線検出手段とセル領域決定手段とを具える。そのため、この出願のセル領域決定方法の発明を容易に実施することができる。
【図面の簡単な説明】
【図1】第1の実施の形態の説明図であり、この発明のセル領域決定装置を文字認識装置に適用した例を説明する図である。
【図2】実施の形態の説明図であり、帳票とそのフォーマット例の説明図である。
【図3】第1の実施の形態の説明図であり、階層構造に関する情報の求め方の一例を説明する図である。
【図4】第1の実施の形態の説明図であり、階層構造に関する情報の求め方の一例を説明する図である。
【図5】罫線情報および又はセル情報の一例の説明図である。
【図6】第1の実施の形態の説明図であり、罫線検出手段を説明するためのフローチャートである。
【図7】第1の実施の形態の説明図であり、罫線検出手段の動作説明図である。
【図8】第3の実施の形態の説明図であり、第3の実施の形態で用いる階層構造に関する情報の説明図である。
【図9】第3の実施の形態の説明図であり、罫線検出手段の動作説明のためのフローチャートである。
【図10】第3の実施の形態の説明図であり、罫線検出手段の動作説明のための図9に続くフローチャートである。
【図11】第4の実施の形態の説明図である。
【符号の説明】
10:文字認識装置
20:セル領域決定装置
21:辞書
23:罫線検出手段
25:セル領域決定手段
27:対応関係判定手段
30:文字認識手段
40:CPU
50:メモリ
60:画像データ入力手段
61:スキャナ
63:帳票イメージメモリ
200:帳票
210:表領域
220a〜220d:罫線
230:読み取りフィールド
Claims (12)
- 罫線で区分けされている多数のセルを含む表の画像データから、特定の1又は複数のセルに対応する領域を決定するに当たり、
決定対象の表に対応する基準の表の表領域情報、基準の表の階層構造情報、基準の表のセルの位置情報、および特定の1又は複数のセルに関する情報を、予め辞書に格納しておき、
前記基準の表の表領域情報に基づいて、前記決定対象の表の画像データ上の最初の罫線探索対象領域を設定し、
前記最初の罫線探索対象領域において、前記基準の表のセルの位置情報に基づいて前記決定対象の表の画像データ上に罫線位置を仮定することにより罫線の検出領域を設定して該検出領域を走査することにより罫線を検出し、
前記検出した罫線により区分けされる複数の領域のそれぞれをさらに走査することにより該複数の領域のそれぞれにおいて罫線を検出し、
前記罫線の検出動作を、前記基準の表の階層構造情報に基づいて罫線検出ができないと判断できるまで繰り返し、
前記検出した罫線により区分けされる領域の中から、前記辞書中の前記特定の1又は複数のセルに関する情報に基づいて、前記特定のセル領域を決定することを特徴とするセル領域の決定方法。 - 請求項1に記載のセル領域の決定方法において、
前記検出した罫線についての情報を、前記辞書中の罫線情報および又はセル情報と照合して、前記決定対象の表と前記基準の表との対応関係を判定し、
該対応関係が得られた場合に、前記セル領域の決定をすることを特徴とするセル領域の決定方法。 - 請求項1に記載のセル領域の決定方法において、
前記基準の表の表領域の、垂直方向又は水平方向両端まで罫線によって分割されている各領域を第1階層の分割領域と称し、該罫線を第1階層の罫線と称し、該第1階層の分割領域ごとの、第1階層の罫線が水平方向である場合は垂直方向両端まで、また、第1階層の罫線が垂直方向である場合は水平方向両端まで罫線によって分割されている各領域を第2階層の分割領域と称し、該罫線を第2階層の罫線と称し、以下同様に、第n階層の分割領域および第n階層の罫線と称し、第n階層の罫線が水平方向である場合は、第n+1階層の罫線は垂直方向であるとし、また、第n階層の罫線が垂直方向である場合は、第n+1階層の罫線は水平方向であるとしたとき、
各階層の罫線情報および又は分割領域情報を、前記罫線情報および又はセル情報として、前記辞書に格納しておき、
前記罫線情報および又はセル情報として、前記基準の表と罫線の位置を指定して、前記決定対象の表の画像データ上の罫線探索対象領域を設定することを特徴とするセル領域の決定方法。 - 請求項1に記載のセル領域の決定方法において、
前記基準の表の最外側の罫線で囲われる領域の、垂直方向又は水平方向両端まで罫線によって分割されている各領域を第1階層の分割領域と称し、該罫線を第1階層の罫線と称し、該第1階層の分割領域ごとの、第1階層の罫線が水平方向である場合は垂直方向両端まで、また、第1階層の罫線が垂直方向である場合は水平方向両端まで罫線によって分割されている各領域を第2階層の分割領域と称し、該罫線を第2階層の罫線と称し、以下同様に、第n階層の分割領域および第n階層の罫線と称し、第n階層の罫線が水平方向である場合は、第n+1階層の罫線は垂直方向であるとし、また、第n階層の罫線が垂直方向である場合は、第n+1階層の罫線は水平方向であるとしたとき、
該階層構造での、前記特定のセルに至るに必要な罫線情報および又は分割領域情報を、前記罫線情報および又はセル情報として、前記辞書に格納しておき、
前記罫線情報および又はセル情報に基づいて、特定のセルを含む分割領域を罫線探索対象領域として設定することを特徴とするセル領域の決定方法。 - 請求項1に記載のセル領域の決定方法において、
前記罫線の検出は、
前記画像データの、前記表領域の座標で指定される領域を、垂直方向または水平方向両端まで分割できる罫線を、前記画像データ上の第1階層の罫線として検出する第1の処理と、
該第1の処理で罫線が検出された場合、該罫線で分割される各領域(画像データ上の第1階層の分割領域)を、前記第1階層の罫線が水平方向である場合は垂直方向両端まで、また、前記第1階層の罫線が垂直方向である場合は水平方向両端まで、分割できる罫線を、前記画像データ上の第2階層の罫線として検出する第2の処理と、
以下、同様に、第nの処理で、第n階層の罫線が検出された場合、前記画像データ上の第n階層の分割領域を、前記第n階層の罫線が水平方向である場合は垂直方向両端まで、また、前記第n階層の罫線が垂直方向である場合は水平方向両端まで、分割できる罫線を前記画像データ上の第n+1階層の罫線として検出する第n+1の処理とにより行うことを特徴とするセル領域の決定方法。 - 請求項1、3及び4のいずれか一項に記載のセル領域の決定方法において、
前記画像データから前記表領域と同じかそれに近い大きさを持つ領域を抽出し、該抽出した領域の座標と前記表領域の座標とのズレ分だけ、前記罫線情報および又はセル情報の座標に関する情報を補正し、その後に、前記罫線検出を行うことを特徴とするセル領域の決定方法。 - 罫線で区分けされている多数のセルを含む表の画像データから、特定の1又は複数のセルに対応する領域を決定するための装置において、
決定対象の表に対応する基準の表の表領域情報、基準の表の階層構造情報、基準の表のセルの位置情報、および特定の1又は複数のセルに関する情報を格納している辞書と、
前記基準の表の表領域情報に基づいて、前記決定対象の表の画像データ上の最初の罫線探索対象領域を設定し、前記罫線探索対象領域において、前記基準の表のセルの位置情報に基づいて前記決定対象の表の画像データ上に罫線位置を仮定することにより罫線の検出領域を設定して該検出領域を走査することにより罫線を検出し、前記検出した罫線により区分けされる複数の領域のそれぞれをさらに走査することにより該複数の領域のそれぞれにおいて罫線を検出し、前記罫線の検出動作を、前記基準の表の階層構造情報に基づいて罫線検出ができないと判断できるまで繰り返す罫線検出手段と、
前記辞書中の前記特定の1又は複数のセルに関する情報に基づいて、前記罫線検出手段が検出した罫線により区分けされる領域の中から、前記特定のセル領域を決定するセル領域決定手段とを具えたことを特徴とするセル領域決定装置。 - 請求項7に記載のセル領域決定装置において、
前記罫線検出手段が検出した罫線についての情報を、前記辞書中の罫線情報および又はセル情報と照合して、前記決定対象の表と前記基準の表との対応関係を判定する対応関係判定手段をさらに具え、
前記セル領域決定手段は、該対応関係が得られた場合に、前記セル領域の決定をする手段であることを特徴とするセル領域の決定装置。 - 請求項7に記載のセル領域の決定装置において、
前記基準の表の最外側の罫線で囲われる領域の、垂直方向又は水平方向両端まで罫線によって分割されている各領域を第1階層の分割領域と称し、該罫線を第1階層の罫線と称し、該第1階層の分割領域ごとの、第1階層の罫線が水平方向である場合は垂直方向両端まで、また、第1階層の罫線が垂直方向である場合は水平方向両端まで罫線によって分割されている各領域を第2階層の分割領域と称し、該罫線を第2階層の罫線と称し、以下同様に、第n階層の分割領域および第n階層の罫線と称し、第n階層の罫線が水平方向である場合は、第n+1階層の罫線は垂直方向であるとし、また、第n階層の罫線が垂直方向である場合は、第n+1階層の罫線は水平方向であるとしたとき、
該階層構造での、各階層の罫線情報および又は分割領域情報と、前記基準の表での前記特定のセルの位置を示す情報とを、前記罫線情報および又はセル情報として、前記辞書に格納してあり、
前記罫線検出手段は、前記罫線情報および又はセル情報として、前記基準の表と罫線の位置を指定して、前記決定対象の表の画像データ上の罫線探索対象領域を設定することを特徴とするセル領域の決定装置。 - 請求項7に記載のセル領域の決定装置において、
前記基準の表の最外側の罫線で囲われる領域の、垂直方向又は水平方向両端まで罫線によって分割されている各領域を第1階層の分割領域と称し、該罫線を第1階層の罫線と称し、該第1階層の分割領域ごとの、第1階層の罫線が水平方向である場合は垂直方向両端まで、また、第1階層の罫線が垂直方向である場合は水平方向両端まで罫線によって分割されている各領域を第2階層の分割領域と称し、該罫線を第2階層の罫線と称し、以下同様に、第n階層の分割領域および第n階層の罫線と称し、第n階層の罫線が水平方向である場合は、第n+1階層の罫線は垂直方向であるとし、また、第n階層の罫線が垂直方向である場合は、第n+1階層の罫線は水平方向であるとしたとき、
該階層構造での、前記特定のセルに至るに必要な罫線情報および又は分割領域情報を、前記罫線情報および又はセル情報として、前記辞書に格納してあり、
前記罫線検出手段は、前記罫線情報および又はセル情報に基づいて、特定のセルを含む分割領域を罫線探索対象領域として設定することを特徴とするセル領域の決定装置。 - 請求項7に記載のセル領域の決定装置において、
前記罫線の検出手段は、
前記画像データの、前記表領域の座標で指定される領域を、垂直方向または水平方向両端まで分割できる罫線を、前記画像データ上の第1階層の罫線として検出する第1の処理と、
該第1の処理で罫線が検出された場合、該罫線で分割される各領域(画像データ上の第1階層の分割領域)を、前記第1階層の罫線が水平方向である場合は垂直方向両端まで、また、前記第1階層の罫線が垂直方向である場合は水平方向両端まで、分割できる罫線を、前記画像データ上の第2階層の罫線として検出する第2の処理と、
以下、同様に、第nの処理で、第n階層の罫線が検出された場合、前記画像データ上の第n階層の分割領域を、前記第n階層の罫線が水平方向である場合は垂直方向両端まで、また、前記第n階層の罫線が垂直方向である場合は水平方向両端まで、分割できる罫線を前記画像データ上の第n+1階層の罫線として検出する第n+1の処理とを行う手段であることを特徴とするセル領域の決定装置。 - 請求項7、9及び10のいずれか一項に記載のセル領域の決定装置において、
前記罫線検出手段は、前記画像データから前記表領域と同じかそれに近い大きさを持つ領域を抽出し、該抽出した領域の座標と前記表領域の座標とのズレ分だけ、前記罫線情報および又はセル情報の座標に関する情報を補正し、その後に、前記罫線検出を行う手段であることを特徴とするセル領域の決定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33711497A JP3575969B2 (ja) | 1997-12-08 | 1997-12-08 | セル領域の決定方法、セル領域の決定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33711497A JP3575969B2 (ja) | 1997-12-08 | 1997-12-08 | セル領域の決定方法、セル領域の決定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11175654A JPH11175654A (ja) | 1999-07-02 |
JP3575969B2 true JP3575969B2 (ja) | 2004-10-13 |
Family
ID=18305578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33711497A Expired - Fee Related JP3575969B2 (ja) | 1997-12-08 | 1997-12-08 | セル領域の決定方法、セル領域の決定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3575969B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003030583A (ja) * | 2001-07-11 | 2003-01-31 | Oki Electric Ind Co Ltd | 表種別識別方法および表種別識別装置、フォーマット種別識別方法およびフォーマット種別識別装置 |
JP2006127451A (ja) * | 2004-09-30 | 2006-05-18 | Oki Electric Ind Co Ltd | 帳票処理装置 |
-
1997
- 1997-12-08 JP JP33711497A patent/JP3575969B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11175654A (ja) | 1999-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7149347B1 (en) | Machine learning of document templates for data extraction | |
JP4170441B2 (ja) | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 | |
US7561734B1 (en) | Machine learning of document templates for data extraction | |
JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
US6014458A (en) | System for designating document direction | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JP4395188B2 (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JPH08190604A (ja) | ラスタ画像表示用ハイブリッドデータ構造生成方法及び装置 | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
JP2002324236A (ja) | 帳票識別方法及び帳票登録方法 | |
JP2008077454A (ja) | タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム | |
JPH08167000A (ja) | 文字認識装置および方法 | |
JP5906788B2 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP3575969B2 (ja) | セル領域の決定方法、セル領域の決定装置 | |
JPH09319824A (ja) | 帳票認識方法 | |
JPH0950527A (ja) | 枠抽出装置及び矩形抽出装置 | |
JP2006253842A (ja) | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP3179280B2 (ja) | 表を含む帳票処理装置 | |
JP2000076378A (ja) | 文字認識方法 | |
JP3083609B2 (ja) | 情報処理装置及びそれを用いた文字認識装置 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
JP3133797B2 (ja) | 文字認識方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040514 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040706 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080716 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090716 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100716 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110716 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120716 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130716 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |