JP2020135671A - 帳票認識装置、帳票認識方法およびプログラム - Google Patents

帳票認識装置、帳票認識方法およびプログラム Download PDF

Info

Publication number
JP2020135671A
JP2020135671A JP2019031031A JP2019031031A JP2020135671A JP 2020135671 A JP2020135671 A JP 2020135671A JP 2019031031 A JP2019031031 A JP 2019031031A JP 2019031031 A JP2019031031 A JP 2019031031A JP 2020135671 A JP2020135671 A JP 2020135671A
Authority
JP
Japan
Prior art keywords
ruled line
extracted
ruled
recognition device
extraction unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019031031A
Other languages
English (en)
Inventor
正典 中林
Masanori Nakabayashi
正典 中林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2019031031A priority Critical patent/JP2020135671A/ja
Publication of JP2020135671A publication Critical patent/JP2020135671A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

【課題】帳票に記入された文字の一部が罫線として誤って判断されることを抑止することで、文字認識精度の向上を図ること。【解決手段】帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置3において、帳票の電子化された帳票画像を取得する画像取得部31と、画像取得部31が取得した帳票画像上に存在する罫線を抽出する罫線抽出部32と、罫線抽出部32が抽出した罫線の周囲に存在する画素の量に基づいて、罫線抽出部32が抽出した罫線が矩形を構成する罫線であるか否かを判定する罫線判定部35と、を備えることを特徴とする。【選択図】図3

Description

本発明は、帳票認識装置、帳票認識方法およびプログラムに関する。
従来、OCR(Optical Character Reader)などの文字認識装置は、帳票などに書かれている文字を自動的に読み取って、文字を自動入力していた。
文字認識装置として、帳票内の表構造の矩形情報を利用することにより文字認識を行う位置を特定する帳票認識装置の技術が提案されている(例えば、特許文献1参照)。
特開2010−3155号公報
しかしながら、特許文献1に記載の技術では、縦方向の線分と横方向の線分およびその交点情報により矩形を抽出している。そのため、帳票に記入された文字が、罫線と接触することで、文字の一部を罫線として誤って判断してしまう問題があり、結果的に文字認識精度が低下する場合があった。
本発明は、上記課題に鑑み、帳票に記入された文字の一部が罫線として誤って判断されることを抑止することで、文字認識精度の向上を図ることができる帳票認識装置を提供することを目的とする。
本発明の第1の側面である帳票認識装置は、帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置において、前記帳票の電子化された帳票画像を取得する画像取得部と、前記画像取得部が取得した前記帳票画像上に存在する罫線を抽出する罫線抽出部と、前記罫線抽出部が抽出した罫線の周囲に存在する画素の量に基づいて、前記罫線抽出部が抽出した罫線が矩形を構成する罫線であるか否かを判定する罫線判定部と、を備えることを特徴とする。
本発明の第2の側面である帳票認識方法は、帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置の帳票認識方法であって、前記帳票認識装置が、前記帳票の電子化された帳票画像を取得し、前記取得した前記帳票画像上に存在する罫線を抽出し、前記抽出した罫線の周囲に存在する画素の量に基づいて、前記抽出した罫線が矩形を構成する罫線であるか否かを判定することを特徴とする。
本発明の第3の側面であるプログラムは、帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置のコンピュータに、前記帳票の電子化された帳票画像を取得し、前記取得した前記帳票画像上に存在する罫線を抽出し、前記抽出した罫線の周囲に存在する画素の量に基づいて、前記抽出した罫線が矩形を構成する罫線であるか否かを判定する処理を実行させることを特徴とする。
本発明の一態様によれば、帳票に記入された文字の一部が罫線として誤って判断されることを抑止することで、文字認識精度の向上を図ることができる。
本実施の形態における帳票認識装置を備える帳票認識処理システムのシステム構成図である。 本実施の形態における帳票認識装置のハードウェア構成図である。 本実施の形態における帳票認識装置の機能ブロック図である。 画像取得部が取得した帳票画像上に存在する罫線を抽出する一例を示す図である。 画像取得部が取得した帳票画像上に存在する罫線を抽出する別の一例を示す図である。 罫線抽出部が抽出した罫線が矩形を構成する罫線であるか否かを判定する一例を示す図である。 本実施の形態における帳票認識処理の流れを示すフローチャートである。
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
図1は、本実施の形態における帳票認識装置を備える帳票認識処理システムのシステム構成図である。
図1に示すように、帳票認識処理システム1は、画像読取装置2、画像読取装置2と接続された帳票認識装置3を備える。ここで、本実施の形態の帳票認識処理システム1は、例えば金融機関や公共機関等に設置されている。また、本実施の形態の帳票認識処理システム1は、携帯通信端末に内蔵された機能としての画像読取装置2および帳票認識装置3で構成されることも可能である。
画像読取装置2は、例えば、オーバーヘッドスキャナであり、帳票を光学的に読み取り、帳票認識装置3に送出する。読み取りの対象となる帳票は、例えば、振込依頼書、入出金伝票など、各種手書き入力する書類である。
帳票認識装置3は、例えば、ワークステーション、サーバ、パーソナルコンピュータ等のコンピュータの機能を備えており、帳票認識方法に基づく後述する帳票認識処理を実行する。
図2は、本実施の形態における帳票認識装置のハードウェア構成図である。
図2に示すように、帳票認識装置3は、制御部201、入力装置202、出力装置203、記憶部204、インターフェース(I/F)205がバス206に接続されて構成されている。また、帳票認識装置3は、図2に示していない他のハードウェア構成を備えていてもよい。
制御部201は、帳票認識装置3全体を統括的に制御するもので、プログラムを読み込んで帳票認識処理を実行するCPU(Central Processing Unit)を有する。
入力装置202は、例えば、キーボード、ジョイスティック、ライトペン、マウス、タッチパッド、タッチパネル、トラックボール等、各種のデータや信号等を入力する。
出力装置203は、例えば、LCD(Liquid Crystal Display)等の各種ディスプレイ、プリンタ等、画像やその他の情報を出力する。
記憶部204は、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)等を有する。記憶部204は、帳票認識装置3が帳票認識処理を実行するプログラムの他、帳票認識装置3の各機能を制御し実行するための制御プログラム、画面データなどを記憶する。記憶部204は、帳票認識装置3がプログラムを実行する際の作業領域を提供する。また、記憶部204は、他のデータを記憶してもよい。
インターフェース205は、USB(Universal Serial Bus)等のシリアルインターフェースやイーサネット(登録商標)等のパラレルインターフェース等、画像読取装置2や図示しない外部機器と接続するためのユニットである。
本実施の形態における帳票認識処理は、前述した帳票認識装置3によって実行される。
図3は、本実施の形態における帳票認識装置の機能ブロック図である。図3に示すように、帳票認識装置3は、画像取得部31、罫線抽出部32、範囲抽出部33、画素検出部34、罫線判定部35を備える。また、帳票認識装置3は、図3に示していない記憶部や後述の文字認識処理を行う文字認識部など他の機能構成を備えていてもよい。帳票認識装置3は、コンピュータの機能を備えており、帳票認識プログラムにしたがって後述する帳票認識処理を実行する。
画像取得部31は、画像読取装置2を制御して画像読取装置2に画像を読み取らせる。画像取得部31は、画像読取装置2により読み取られて電子化された帳票画像を取得する。例えば、画像取得部31は、画像読取装置2から振込依頼書、入出金伝票など、各種手書き入力する書類の帳票画像を取得する。
罫線抽出部32は、画像取得部31が取得した帳票画像上に存在する罫線を抽出する。例えば、罫線抽出部32は、縦方向の線分と横方向の線分およびその交点情報により、当該線分が罫線か否かを判断する。そして、罫線抽出部32は、抽出した互いに平行する二本の罫線と、抽出した互いに平行する二本の罫線に対し直交する方向に延設される平行する二本の罫線に囲まれた表構造の罫線の集合を矩形として抽出する。
図4は、画像取得部31が取得した帳票画像上に存在する罫線を抽出する一例を示す図である。図5は、画像取得部31が取得した帳票画像上に存在する罫線を抽出する別の一例を示す図である。図4(1)、図5(1)は、画像取得部31により取得された電子化された帳票画像101の一例を示す図である。図4(2)、図5(2)は、罫線抽出部32により抽出された罫線102の一例を示す図である。
図4(1)に示すように帳票画像101には、表構造で存在する複数の罫線102が含まれている。そして、各罫線102により囲まれた複数の矩形104が構成されている。各罫線102により囲まれた各矩形104には、それぞれ文字103が含まれている。
図4(1)に示すように帳票画像101には、複数の罫線102および複数の文字103が含まれている。例えば、図4(1)、図5(1)に示すように、帳票画像101の依頼人の本人氏名欄を構成する表構造の矩形104aには、「大下中道」の氏名が手書きで記入されている。本人氏名欄を構成する表構造の矩形104aは、左右方向に沿って延設された互いに平行な上側罫線102aおよび下側罫線102bを含む。
図4(1)では、「大下中道」の氏名のうち「中」の文字103aの一部を構成する上下方向に伸びる罫線(線分)102cが、矩形104aの上側罫線102aおよび下側罫線102bにそれぞれ接触していない。この場合には、罫線抽出部32は、図4(2)に示すように、「中」の文字103aの一部を構成する上下方向に伸びる罫線(線分)102cを、矩形を構成する罫線として抽出しない。
これに対し、図5(1)では、「大下中道」の氏名のうち「中」の文字103aの一部を構成する上下方向に伸びる罫線(線分)102cが、本人氏名欄を構成する表構造の矩形104aの上側罫線102aおよび下側罫線102bにそれぞれ接触している。この場合には、罫線抽出部32は、図5(2)に示すように、「中」の文字103aの一部を構成する上下方向に伸びる罫線(線分)102cを、矩形を構成する罫線として誤って抽出してしまう。なお、罫線抽出部32は、上下方向に伸びる罫線(線分)のみならず、左右方向に伸びる罫線(線分)に対しても同様の処理を実行する。
そこで、本実施形態の帳票認識装置3は、罫線抽出部32が抽出した罫線の周囲に存在する画素の量に基づいて、罫線抽出部32が抽出した罫線が矩形を構成する罫線であるか否かを判定する。これにより、帳票に記入された文字が誤って罫線として判断されることを抑止することで、正しい矩形を抽出することができ、結果として文字認識精度の向上を図ることができる。
詳しくは、範囲抽出部33は、罫線抽出部32が抽出した罫線の周囲の範囲を抽出する。画素検出部34は、範囲抽出部33が抽出した範囲に密集した画素が存在するか否かを検出する。罫線判定部35は、罫線抽出部32が抽出した罫線の周囲に存在する画素の量に基づいて、罫線抽出部32が抽出した罫線が矩形を構成する罫線であるか否かを判定する。具体的には、罫線判定部35は、画素検出部34により密集した画素が検出されない場合には、罫線抽出部32により抽出された罫線が矩形を構成する罫線であると判定する。
帳票認識装置3により、罫線抽出部32が抽出した罫線が矩形を構成する罫線であるか否かを判定例について図6を参照して説明する。例えば、図5(1)に示す罫線102cを罫線抽出部32が抽出した罫線(判定対象)として、当該罫線が矩形を構成する罫線であるか否かを判定する例について説明する。図6は、罫線抽出部32が抽出した罫線が矩形を構成する罫線であるか否かを判定する一例を示す図である。
図6(1)は、範囲抽出部33により、抽出した罫線の周囲の範囲を抽出する一例を示す図である。図6(2)は、画素検出部34により、密集した画素を検出する一例を示す図である。図6(3)は、罫線判定部35により、画素検出部34により検出された密集した画素はノイズであると判定する一例である。図6(4)は、画素検出部34により検出された密集した画素は帳票の汚れであると判定する一例である。
はじめに、範囲抽出部33は、図6(1)に示すように、罫線抽出部32が抽出した罫線102cの長さL1を算出する。そして、範囲抽出部33は、罫線抽出部32が抽出した罫線102cの長さL1と、罫線102cと直交する方向の長さL2と、により構成される範囲R1を罫線102cの周囲の範囲として抽出する。罫線102cの長さL1と、罫線102cと直交する方向の長さL2と、は同等の長さに構成される。また、範囲R1内の罫線102cの位置は、図6(1)に示すように、罫線102cを境とした左右の範囲が略同一になるよう左右方向略中央の位置に配置される。なお、範囲R1内の罫線102cの位置は、罫線102cを境とした左右の範囲が左右方向略中央の位置に限らず、左端側又は右端側のどちらか一方に偏っていてもよい。
画素検出部34は、図6(2)、図6(3)、図6(4)に示すように、範囲抽出部33が抽出した範囲R1に密集した画素106a,106b,106c,106d,106eが存在するか否かを検出する。密集した画素とは、二値画像において、少なくとも2ドット以上連続した罫線または文字を表す値の画素の固まりをいう。本実施形態において、画素106a、106b、106c、106d,106eは、少なくとも2ドット以上連続した画素の一例である。
この場合、画素検出部34は、範囲R1内における罫線102cの左右両側に密集した画素が存在する場合のみならず、罫線102cの左側または右側のみ存在する場合も検出する。これにより、「中」の文字や、「小」の文字など、罫線102cの左右両側に密集した画素が存在する文字のみならず、「旧」の文字や、「d」の文字など、罫線102cの左側または右側のみに密集した画素が存在する文字も検出対象とすることができる。また、画素検出部34は、左右方向のみならず、上下方向に対しても同様の処理を実行する。
図6(1)に示すように、画素検出部34により密集した画素が検出されない場合には、罫線判定部35は、罫線抽出部32により抽出された罫線102cが矩形を構成する罫線であると判定する。
すなわち、画素検出部34により密集した画素が検出されない場合には、罫線抽出部32により抽出された罫線102cは、文字を構成する一部の線分である可能性は低い。したがって、この場合罫線判定部35は、当該罫線102cについて矩形を構成する罫線とすることにより、罫線抽出部32が抽出した矩形における帳票内の表構造と対応する正しい矩形を抽出することができ、結果として文字認識精度の向上を図ることができる。
これに対し、図6(2)に示すように、画素検出部34により密集した画素106aが検出された場合には、罫線判定部35は、罫線抽出部32により抽出された罫線102cが文字を構成する線分であると判定する。
すなわち、画素検出部34により密集した画素が検出された場合には、罫線抽出部32により抽出された罫線102cは、文字を構成する一部の線分である可能性が高い。したがって、この場合罫線判定部35は、当該罫線102cについて文字を構成する線分とすることにより、罫線抽出部32が抽出した矩形における帳票内の表構造と対応する正しい矩形を抽出することができ、結果として文字認識精度の向上を図ることができる。
図6(3)に示すように、罫線判定部35は、画素検出部34により検出された密集した画素106b、106c、106dが所定のドットとして3ドット以下の連続した画素であるか否かを判定する。密集した画素106b、106c、106dが所定のドット以下の連続した画素である場合には、罫線判定部35は、画素検出部34により検出された密集した画素106b、106c、106dはノイズであると判定する。
すなわち、所定のドットとして3ドット以下の連続した画素106b、106c、106dは、文字を構成する可能性は低い。したがって、この場合罫線判定部35は、当該画素106b、106c、106dをノイズとして除外することにより、帳票内の罫線と対応する正しい罫線を、文字を構成する線分と誤判定してしまうことを防げる。このため、帳票内の表構造と対応する正しい矩形を抽出することができ、結果として文字認識精度の向上を図ることができる。
図6(4)に示すように、罫線判定部35は、画素検出部34により検出された密集した画素106eが範囲抽出部33により抽出された範囲R1を超えて断続的に所定の範囲に存在するか否かを判定する。図6(4)では、画素検出部34により検出された密集した画素106eの横方向の長さL3は、罫線抽出部32が抽出した罫線102cと直交する同等の長さL2を超えていることから、密集した画素106eが範囲R1を超えて所定の範囲に存在すると判定される。密集した画素106eが範囲抽出部33により抽出された所定の範囲R1を超えて断続的に広範囲に存在する場合には、罫線判定部35は、画素検出部34により検出された密集した画素106eは帳票の汚れであると判定する。
すなわち、範囲抽出部33により抽出された範囲R1を超えて断続的に所定の範囲に存在する画素106eは、文字を構成する可能性は低い。したがって、この場合罫線判定部35は、当該画素106eを帳票の汚れとして除外することにより、帳票内の罫線と対応する正しい罫線を、文字を構成する線分と誤判定してしまうことを防げる。このため、帳票内の表構造と対応する正しい矩形を抽出することができ、結果として文字認識精度の向上を図ることができる。
図7は、本実施の形態における帳票認識処理の流れを示すフローチャートである。
本実施の形態における帳票認識処理は、図1〜3を用いて説明した帳票認識装置3が帳票認識処理プログラムにしたがって実行する。
帳票認識処理プログラムは、図7に示した帳票認識処理のフローのようにして実行される。帳票認識処理の対象となる帳票は、上述したように、振込依頼書、入出金伝票など、各種手書き入力する書類である。
はじめに、画像取得部31は、画像読取装置2により読み取られて電子化された帳票画像を取得する。そして、罫線抽出部32は、画像取得部31が取得した帳票画像上に存在する罫線を抽出する。また、罫線抽出部32は、抽出した互いに平行する二本の罫線と、抽出した互いに平行する二本の罫線に対し直交する方向に延設される平行する二本の罫線に囲まれた表構造の罫線の集合を矩形として抽出する(ステップS11)。
帳票認識装置3は、ステップS11で抽出した矩形の数分、ステップS13のループ処理を繰り返し実行する(ステップS12)。また、帳票認識装置3は、矩形を構成する左側の罫線、右側の罫線、上側の罫線および下側の罫線の数分、後述のステップS14〜S22の処理を繰り返し実行する(ステップS13)。範囲抽出部33は、罫線抽出部32が抽出した罫線のうち現在ループ処理(ステップS13)の対象となっている罫線は30mm以上であるか否かを判定する(ステップS14)。この処理では、範囲抽出部33は、帳票に記入された文字の大きさは、文字として記入されるサイズを超えているか否かが判定される。
罫線抽出部32が抽出した罫線は30mm以上であると判定された場合、すなわち、帳票に記入された文字の大きさは、文字として記入されるサイズを超えていると判定された場合(ステップS14のYES)には、罫線判定部35は、現在ループ処理の対象となっている罫線は矩形を構成する罫線であると判定する(ステップS21)。この処理が終了すると、処理はステップS13に戻る。上述の実施形態では、文字として記入されるサイズとして30mmを採用しているがこの限りではなく、罫線により構成される矩形のサイズによって文字として記入されるサイズは適宜変更してもよい。
罫線抽出部32が抽出した罫線は30mm未満であると判定された場合、すなわち、帳票に記入された文字の大きさは、文字として記入されるサイズ内であると判定された場合(ステップS14のNO)には、範囲抽出部33は、現在ループ処理の対象となっている罫線の周囲の範囲を抽出する(ステップS15)。対象となっている罫線が、罫線102cである場合、範囲抽出部33は、図6(1)に示すように、罫線抽出部32が抽出した罫線102cの長さL1と、罫線102cと直交する方向の長さL2と、に基づいて、罫線抽出部32が抽出した罫線102cの周囲の範囲R1を抽出する。
画素検出部34は、ステップS15において範囲抽出部33が抽出した範囲R1内に密集した画素が存在するか否かを検出する(ステップS16)。
範囲抽出部33が抽出した範囲R1内に密集した画素が存在しない場合(ステップS16のNO)には、罫線判定部35は、罫線抽出部32が抽出した罫線のうち現在ループ処理の対象となっている罫線は矩形を構成する罫線であると判定する(ステップS21)。この処理が終了すると、処理はステップS13に戻る。
図6(2)〜(4)に示したように、範囲抽出部33が抽出した範囲R1内に密集した画素が存在する場合(ステップS16のYES)には、罫線判定部35は、ステップS16において画素検出部34により検出された密集した画素に3ドットを超える連続した画素が含まれるか否かを判定する(ステップS17)。
図6(3)に示すように、画素検出部34により検出された密集した画素が3ドット以下の連続した画素106b、106c、106dだけで構成される場合(ステップS17のYES)には、罫線判定部35は、画素検出部34により検出された密集した画素106b、106c、106dはノイズであると判定する(ステップS18)。そして、罫線判定部35は、現在ループ処理の対象となっている罫線は矩形を構成する罫線であると判定する(ステップS21)。この処理が終了すると、処理はステップS13に戻る。
画素検出部34により検出された密集した画素に3ドットより大きい連続した画素が含まれる場合(ステップS17のNO)には、罫線判定部35は、ステップS16において画素検出部34により検出された密集した画素が範囲抽出部33により抽出された範囲R1を超えて断続的に広範囲に存在するか否かを判定する(ステップS19)。
図6(4)に示すように、密集した画素106eが範囲抽出部33により抽出された範囲R1を超えて断続的に広範囲に存在する場合(ステップS19のYES)には、罫線判定部35は、画素検出部34により検出された密集した画素106eは帳票の汚れであると判定する(ステップS20)。そして、罫線判定部35は、現在ループ処理の対象となっている罫線は矩形を構成する罫線であると判定する(ステップS21)。この処理が終了すると、処理はステップS13に戻る。
密集した画素が範囲抽出部33により抽出された範囲R1を超えて断続的に広範囲に存在しない場合(ステップS19のNO)には、罫線判定部35は、罫線抽出部32が抽出した罫線のうち現在ループ処理の対象となっている罫線は文字を構成する線分の一部であると判定する。罫線判定部35は、罫線抽出部32が抽出した罫線(例えば、図5(2)の罫線102c)について矩形を構成する罫線から削除する(ステップS22)。この処理が終了すると、処理はステップS13に戻る。
ステップS13のループ処理が終了条件を満たして終了し、また、ステップS12のループ処理が終了条件を満たして終了した場合、罫線抽出部32は、ステップS22において、文字を構成する線分の一部として判断した罫線を削除した罫線情報で、再度、罫線を抽出するとともに、抽出した罫線の情報に基づいて矩形を抽出する(ステップS23)。
制御部201は、ステップS23において再度罫線および矩形が抽出された帳票画像に基づき、文字認識処理を実行する(ステップS24)。ステップS24の文字認識処理については、例えば特許文献1に記載の技術を採用することができるため、説明を省略する。この処理が終了すると帳票認識処理は終了となる。
以上の実施形態によれば、罫線判定部35は、罫線抽出部32が抽出した罫線の周囲に存在する二値画像において罫線や文字を表す画素の量に基づいて、罫線抽出部32が抽出した罫線が帳票内の矩形を構成する罫線と対応する矩形を構成する罫線であるのか、文字を構成する線分なのかを判定する。このため、帳票に記入された線分が、罫線と接触した場合であっても、帳票認識装置3において文字の一部を罫線として誤って判断されることを抑止することができる。その結果、文字認識精度の向上を図ることができる。
なお、本発明は上述した実施形態そのままに限定されるものではなく、実施段階でのその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素を適宜組み合わせても良い。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。このような、発明の趣旨を逸脱しない範囲内において種々の変形や応用が可能である。
1 :帳票認識処理システム
2 :画像読取装置
3 :帳票認識装置
31 :画像取得部
32 :罫線抽出部
33 :範囲抽出部
34 :画素検出部
35 :罫線判定部
101 :帳票画像
102,102c :罫線
102a :上側罫線
102b :下側罫線
103,103a :文字
104,104a :矩形
106a,106b,106c,106d,106e :画素
201 :制御部
202 :入力装置
203 :出力装置
204 :記憶部
205 :インターフェース
206 :バス
R1 :範囲

Claims (8)

  1. 帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置において、
    前記帳票の電子化された帳票画像を取得する画像取得部と、
    前記画像取得部が取得した前記帳票画像上に存在する罫線を抽出する罫線抽出部と、
    前記罫線抽出部が抽出した罫線の周囲に存在する画素の量に基づいて、前記罫線抽出部が抽出した罫線が矩形を構成する罫線であるか否かを判定する罫線判定部と、
    を備えることを特徴とする帳票認識装置。
  2. 請求項1に記載の帳票認識装置において、
    前記罫線抽出部が抽出した前記罫線の周囲の範囲を抽出する範囲抽出部と、
    前記範囲抽出部が抽出した前記範囲に密集した画素が存在するか否かを検出する画素検出部と、を更に備え、
    前記罫線判定部は、
    前記画素検出部により前記密集した画素が検出されない場合には、前記罫線抽出部により抽出された前記罫線が矩形を構成する罫線であると判定する
    ことを特徴とする帳票認識装置。
  3. 請求項2に記載の帳票認識装置において、
    前記罫線判定部は、前記画素検出部により検出された前記密集した画素が所定のドット以下の連続した画素が含まれると判定した場合には、前記画素検出部により検出された前記密集した画素はノイズであると判定する
    ことを特徴とする帳票認識装置。
  4. 請求項2または3に記載の帳票認識装置において、
    前記範囲抽出部は、前記罫線抽出部が抽出した罫線と直交する同等の長さの範囲を前記罫線の周囲の範囲として抽出する
    ことを特徴とする帳票認識装置。
  5. 請求項2〜4のうちいずれかに記載の帳票認識装置において、
    前記罫線判定部は、前記画素検出部により検出された前記密集した画素が前記範囲抽出部により抽出された前記範囲を超えて断続的に所定の範囲に存在する場合には、前記画素検出部により検出された前記密集した画素は前記帳票の汚れであると判定する
    ことを特徴とする帳票認識装置。
  6. 請求項1〜5のうちいずれかに記載の帳票認識装置において、
    前記画素の量は、前記帳票画像の二値画像において、少なくとも2ドット以上連続した罫線または文字を表す画素の量であることを特徴とする帳票認識装置。
  7. 帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置の帳票認識方法であって、前記帳票認識装置が、
    前記帳票の電子化された帳票画像を取得し、
    前記取得した前記帳票画像上に存在する罫線を抽出し、
    前記抽出した罫線の周囲に存在する画素の量に基づいて、前記抽出した罫線が矩形を構成する罫線であるか否かを判定する
    ことを特徴とする帳票認識方法。
  8. 帳票上に任意の表構造で存在する罫線の認識を行う帳票認識装置のコンピュータに、
    前記帳票の電子化された帳票画像を取得し、
    前記取得した前記帳票画像上に存在する罫線を抽出し、
    前記抽出した罫線の周囲に存在する画素の量に基づいて、前記抽出した罫線が矩形を構成する罫線であるか否かを判定する
    処理を実行させることを特徴とするプログラム。
JP2019031031A 2019-02-22 2019-02-22 帳票認識装置、帳票認識方法およびプログラム Pending JP2020135671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019031031A JP2020135671A (ja) 2019-02-22 2019-02-22 帳票認識装置、帳票認識方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019031031A JP2020135671A (ja) 2019-02-22 2019-02-22 帳票認識装置、帳票認識方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2020135671A true JP2020135671A (ja) 2020-08-31

Family

ID=72263301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019031031A Pending JP2020135671A (ja) 2019-02-22 2019-02-22 帳票認識装置、帳票認識方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2020135671A (ja)

Similar Documents

Publication Publication Date Title
US6043823A (en) Document processing system which can selectively extract and process regions of a document
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
JP5132438B2 (ja) 画像処理装置および画像処理方法
JP3943638B2 (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
JP2000194850A (ja) ユ―ザ囲み領域の抽出装置及び抽出方法
JP7244223B2 (ja) 電子文書における強調テキストの識別
US20130136360A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP2008234291A (ja) 文字認識装置及び文字認識方法
CA2790210C (en) Resolution adjustment of an image that includes text undergoing an ocr process
WO2024140094A1 (zh) 数字文档的段落确定方法、装置、电子设备及存储介质
JP3837193B2 (ja) 文字行抽出方法および装置
JP2009212555A (ja) 紙文書処理装置及びプログラム
JP2020135671A (ja) 帳票認識装置、帳票認識方法およびプログラム
JP2009031937A (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2018067096A (ja) 文字認識装置及び文字認識方法
JP4309881B2 (ja) 身分証認識装置及び身分証認識方法
JPH11265422A (ja) マーク認識方法及び装置並びに記録媒体
JPH04352295A (ja) 文字列方向判別装置
CN110390323A (zh) 信息处理装置以及计算机可读介质
JP4866184B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP2015176522A (ja) 情報処理装置及び情報処理プログラム
JP2021022261A (ja) 補正候補決定装置、補正候補決定方法およびプログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP2013157968A (ja) 画像処理装置
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム