JP2007279828A - 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム - Google Patents

帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム Download PDF

Info

Publication number
JP2007279828A
JP2007279828A JP2006102063A JP2006102063A JP2007279828A JP 2007279828 A JP2007279828 A JP 2007279828A JP 2006102063 A JP2006102063 A JP 2006102063A JP 2006102063 A JP2006102063 A JP 2006102063A JP 2007279828 A JP2007279828 A JP 2007279828A
Authority
JP
Japan
Prior art keywords
area
region
unit
pattern
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006102063A
Other languages
English (en)
Inventor
Tomohisa Suzuki
智久 鈴木
Hiroyuki Mizutani
博之 水谷
Akihiro Uda
明弘 宇田
Naoaki Kodaira
直朗 小平
Toshimasa Dobashi
外志正 土橋
Akio Furuhata
彰夫 古畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006102063A priority Critical patent/JP2007279828A/ja
Priority to US11/727,983 priority patent/US7926732B2/en
Priority to CNA2007100922752A priority patent/CN101051305A/zh
Publication of JP2007279828A publication Critical patent/JP2007279828A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Abstract

【課題】処理対象領域が帳票紙面において占める位置を帳票様式から得られる情報をもとに判定することのできる帳票処理装置を提供する。
【解決手段】帳票1には、処理対象の情報が配置される領域2と、この領域2の位置を特定するための基準位置を示すとともに、領域2のサイズ情報を少なくとも表現したパターンが設けられている。帳票処理装置は、入力した帳票画像中のパターンにおける基準位置を検出すると共に領域2のサイズ情報を認識する。さらに帳票処理装置は、基準位置と領域2のサイズ情報とから領域2の全体の位置を求め、求めた領域内の画像に対する処理を行う。
【選択図】図1

Description

本発明は、帳票の紙面において処理対象の情報が配置された領域を検出して、その領域内の情報に対して文字認識などの処理を行う帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラムに関する。
帳票処理装置は、帳票の紙面の画像(以下「帳票画像」と記述)において、処理対象である文字などの情報がどこの領域に配置されているかを判定し、その領域(以下「処理対象領域」と記述)の画像情報を対して文字認識などの処理を行っている。
帳票画像の中の処理対象領域を判定する手段としては、処理対象領域に対して一定の関係をもつ位置にパターン識別が容易なマークを配置しておき、検出されたマークの位置を基準に処理対象領域の位置を判定する方法が知られている。たとえば、特許文献1においては、処理対象領域が存在する行の位置を特定のマークによって表す方式が開示されている。
特開2001−195541号公報(段落0013、図2)
しかしながら、検出されたマークの位置から処理対象領域の位置を特定する方法では、処理対象領域のサイズが帳票処理装置にとって不明である場合に、その処理対象領域が帳票紙面において占める位置情報までは得られない。したがって、帳票上にサイズの異なる複数の処理対象領域が混在し、それぞれの処理対象領域を判定してその中の画像に対して文字認識などを行う運用を考えた場合、それぞれの処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式が求められる。
本発明は、かかる事情を鑑み、処理対象領域が帳票紙面において占める位置を帳票様式から得られる情報をもとに判定することのできる帳票処理装置、さらには、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することのできる帳票様式作成装置、さらには、その帳票、帳票処理用のプログラム、帳票様式作成用のプログラムを提供することを目的としている。
上記の目的を達成するために、本発明の帳票処理装置は、処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部とを具備することを特徴とする。
前記領域は矩形の領域であり、前記領域特定部は、前記基準位置をもとに前記矩形の領域のあらかじめ決められた角の位置を特定し、この角の位置と前記領域のサイズ情報をもとに前記矩形の領域の全体の位置を求めるものであってもよい。
本発明によれば、処理対象領域が帳票紙面において占める位置を、帳票様式から得られるパターンをもとに判定することができる。
前記マークは、異なる回転角度では形状が一致しないパターンであってもよい。これにより、検出したマークの形状をもとに二次元空間での帳票画像の回転角度を判定し、帳票画像が正規の向きに対して回転した角度にある場合には回転補正を行うことができる。
また、本発明の別の観点に基づく帳票様式作成装置は、処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部とを具備することを特徴とする。
前記定義情報は、前記領域の位置およびサイズの情報を含むものであってもよい。
また、本発明の帳票様式作成装置は、前記領域のサイズ情報を含む属性情報をライブラリとして記憶し、このライブラリとして記憶された前記領域の属性情報をユーザからの選択に応じて読み出し、新規の領域の作成のために再利用する領域情報再利用部をさらに具備するものとしてもよい。
本発明の帳票様式作成装置によれば、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することができる。
本発明によれば、処理対象領域が帳票紙面において占める位置を、帳票様式から得られる情報をもとに判定することができる。また、本発明の帳票様式作成装置によれば、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することができる。
以下、本発明の実施の形態を図面を用いて説明する。
図1は本発明の実施形態である帳票処理装置によって読み取られる帳票の様式の例を示す図である。
同図に示すように、この帳票1には、1以上の処理対象領域2(2−1,2−2,2−3)が設けられている。処理対象領域2とは、処理対象である文字(文字列)や画像などが記入される領域であり、後述する本実施形態の帳票処理装置によって文字認識や画像抽出などの処理が行われる対象の領域である。個々の処理対象領域2の近傍には、処理対象領域2の位置を特定するための基準位置を示すとともに、処理対象領域2のサイズ情報を少なくとも表現したパターンとして、基準位置マーク3(3−1,3−2,3−3)と属性情報パターン4(4−1,4−2,4−3)が配置されている。すなわち、帳票1には、個々の処理対象領域2(2−1,2−2,2−3)ごとに、基準位置マーク3(3−1,3−2,3−3)と属性情報パターン4(4−1,4−2,4−3)とからなるパターンが設けられている。ここで基準位置マーク3は、それぞれ近傍にある処理対象領域2および属性情報パターン4の帳票画像中の位置を特定するための基準位置を示すものである。属性情報パターン4は、処理対象領域2のサイズ情報を少なくとも表現したパターンである。
図2は上記の基準位置マーク3と属性情報パターン4とからなるパターンの詳細を示している。
基準位置マーク3は帳票画像の回転角度および基準位置を知るために最初に検出されるべきパターンであり、帳票処理装置が保有している標準パターンとのマッチングによって検出される。また、基準位置マーク3には、異なる回転角度では形状が一致しないパターンが採用されており、すなわち、二次元空間における基準位置マーク3の形状によって帳票画像の正規の向きを判定することができるパターンが採用されている。この実施形態では、たとえば、矩形(正方形)の領域を縦横均等に3×3の9個の領域に区分し、上記のパターン条件を満足するように、その中のいくつかを所定の色で塗り潰し、他の区分領域を白抜きとしたものが用いられている。
この帳票1の様式の上記パターンにおいては、基準位置マーク3と属性情報パターン4との位置関係が規定されている。たとえば、基準位置マーク3の外接矩形3aの右下角P1から右に10mmオフセットした位置に属性情報パターン4の左下角P2があることが規定されている。上述したように基準位置マーク3には二次元空間における形状によって正規の向きを判定することができるパターンが採用されているので、基準位置マーク3の外接矩形3aの右下角P1とは、二次元空間において正規の向きに基準位置マーク3を配した場合の外接矩形の右下端を意味する。このように基準位置マーク3と属性情報パターン4との位置関係が規定されているので、基準位置マーク3の位置を基準に属性情報パターン4の位置を特定することができる。なお、基準位置マーク3は必ずしも本例のようなものに限らず、異なる回転角度では形状が一致しないパターンであればよい。また、基準位置マーク3と属性情報パターン4は必ずしも別々に設けられる必要はなく、たとえば、属性情報パターンが基準位置マークとしての機能を備えるものとしてもよい。
属性情報パターン4は、等間隔に並んだそれぞれのビット記録領域4aの塗り潰しの有無によって二進数のビット値を表現したものである。たとえば、塗り潰されたビット記録領域4aのビット値を”1”、塗り潰されていないビット記録領域4aのビット値を”0”としている。なお、属性情報パターン4には、上記のほかに、バーコード、二次元コード、文字なども利用できる。また、これらを併用することも可能である。
属性情報パターン4によって表現された処理対象領域2に関する属性情報としては、処理対象領域2の縦横のサイズ、記入内容の種別などがある。また、処理対象領域2に関する属性情報以外の情報、たとえば、様式の作成日時、作成者、関連する他の処理対象領域の識別子、その関連内容などを属性情報パターン4に含めるようにしてもよい。
次に、基準位置マーク3と処理対象領域2との位置関係について説明する。
本帳票1の様式においては、基準位置マーク3と処理対象領域2との位置関係が規定されている。たとえば、図2に示したように、基準位置マーク3の左下角P3から左に5mm、下に5mmの位置が処理対象領域2の左上角P4としてあらかじめ規定されている。基準位置マーク3は二次元空間における形状によって正規の向きを判定することのできるパターンであるため、基準位置マーク3の左下角P3とは、二次元空間において正規の向きに基準位置マーク3を配した場合の左下端を意味する。このように基準位置マーク3と処理対象領域2との位置関係が規定されているので、基準位置マーク3の特定の位置(左下角P3)を基準に処理対象領域2の特定の角(左上角P4)の位置を特定することができる。
また、基準位置マーク3と処理対象領域2との位置関係を規定しておくのではなく、その位置関係を示す情報を属性情報として属性情報パターン4に付加しておき、この属性情報をもとに基準位置マーク3の位置を基準とする処理対象領域2の位置の特定を行うようにしてもよい。
さらには、基準位置マーク3の位置を処理対象領域2の位置を特定するための基準とするのではなく、たとえば、図3に示すように、帳票1の左上角P5から処理対象領域2の左上角P6までの二軸方向の長さの値を属性情報パターン4に付加しておき、この情報をもとに、処理対象領域2の位置を特定するようにしてもよい。図3の例では、申請者の名前が記入される処理対象領域2(2−1)について、帳票1の左上角P5から右へ10mm、下へ30mmの位置がその処理対象領域2の左上角P6としている。他の処理対象領域2(2−2,2−3)についても同様である。
次に、たとえば図4に示すように、一つの属性情報パターン4で複数の処理対象領域2(2−11,2−12,2−13,2−14,2−15)の属性情報を表現する方法について説明する。
図5は一つの属性情報パターン4で表現された複数の処理対象領域2の属性情報を表形式で示した図である。実際には、この表の中の点線で囲まれた部分の情報(領域数、処理対象領域ごとの属性情報)が属性情報パターン4によって表現される。このように、複数の処理対象領域2(2−11,2−12,2−13,2−14,2−15)それぞれの、縦横のサイズ、記入内容の種別、基準位置マーク3の左下角P3の位置に対する左上角P11,P12,P13,P14,P15の位置の縦横のオフセット値(単位:mm)が一つの属性情報パターン4で表現されている。これにより、帳票処理装置では、一つの属性情報パターン4を検出してこれを認識すれば、複数の処理対象領域2の位置をそれぞれ特定することができ、処理の高速化を図ることができる。
また、属性情報パターン4によって表現される情報に、他の処理対象領域2を特定する情報(識別番号、座標)を加えてもよい。たとえば、漢字とそのフリガナが別々に記入される複数の処理対象領域がある場合に、それぞれの処理対象領域に付随する属性情報パターンに、他方の処理対象領域を特定する情報を付加する。これによって帳票処理装置にて帳票が処理される際に、漢字とフリガナのそれぞれの文字認識結果を突き合わせて、文字認識結果の妥当性をチェックしたり、修正したりすることが可能になる。また、金額とその小計・合計が記入される複数の処理対象領域についても、関連する他の処理対象領域を特定する情報を属性情報パターンに追加しておくことによって、帳票処理装置にて帳票が処理される際に、金額の小計・合計のチェックを行うことができる。
次に、帳票様式におけるパターンの変形例を説明する。
図6は帳票様式におけるパターンの別の表現方法を示す図であり、処理対象領域の境界の罫線6に基準位置マーク3および属性情報パターン4を埋め込んだものである。
ここで、基準位置マーク3は、縦と横の2本の罫線6,6の交点とこの交点から縦横それぞれの罫線6,6の切れ目6a,6b,6cまでの距離によって特徴付けられている。本例では、罫線6,6の交点から上に1mmの位置、左に1mmの位置、下に2mmの位置にそれぞれ罫線6の切れ目6a,6b,6cを設けたパターンを基準位置マーク3としている。
一方、属性情報パターン4は横の罫線6の切れ目6dの配置によって表現されている。すなわち、横の罫線6に沿って等間隔に並んだそれぞれのビット記録領域61内での切れ目6dの有無で二進数のビット値が表現されている。たとえば、切れ目有りのビット記録領域61のビット値を”0”、切れ目無しのビット記録領域61のビット値を”1”としている。
このようなパターンを採用することで、基準位置マーク3および属性情報パターン4のための専用の画像を用いることなく、帳票様式に基準位置マーク3および属性情報パターン4を含むパターンを付加することができる。
次に、上記の帳票1を処理する帳票処理装置について説明する。
本実施形態の帳票処理装置は、たとえば、CPU、記憶装置(ROM、RAM)、入力装置(キーボード、マウスなど)、表示装置などを含む典型的なコンピュータのハードウェア資源と、帳票処理のためのプログラムなどのソフトウェア資源とで構成される。あるいは、通信媒体を通じて接続された複数のコンピュータ上で帳票処理のためのプログラムによる処理を分散して行う構成としてもよい。あるいは、帳票処理の一部または全てを専用のハードウェアに置き換えて実現するようにしてもよい。本実施形態の帳票処理装置は、コンピュータに接続されたスキャナ装置(画像取り込み装置)によって読み込まれた帳票の画像を入力して処理するものであってもよいし、外部のスキャナ装置によって読み込まれた帳票の画像を伝送媒体や記憶媒体を通じて取り込んで処理するものであってもよい。
図7は本実施形態の帳票処理装置の構成を示す機能ブロック図である。
同図に示すように、本実施形態の帳票処理装置10は、帳票画像入力部11、記憶部12、処理対象領域特定部13、領域処理部14を有している。以上の各部は、コンピュータとこれを機能させるプログラムによって実現されている。
帳票画像入力部11は、たとえばコンピュータに接続されたスキャナ装置によって読み込まれた帳票画像のデータ、あるいは伝送媒体や記憶媒体を通じて取得した帳票画像のデータを入力してRAMなどの記憶部12に記憶する部分である。
処理対象領域特定部13は、記憶部12に記憶された帳票画像中のパターンを認識して帳票画像中の処理対象領域2の位置を特定する部分である。処理対象領域特定部13は、より具体的には、基準位置マーク検出部131、属性情報パターン認識部132、領域特定部133を備えている。ここで、基準位置マーク検出部131と属性情報パターン認識部132は、本発明のパターン認識部に相当する。基準位置マーク検出部131は、帳票画像の中からパターンにおける基準位置マーク3を検出する部分である。属性情報パターン認識部132は、基準位置マーク3と属性情報パターン4との間であらかじめ規定された位置関係をもとに、基準位置マーク検出部131により検出された基準位置マーク3の位置を基準に属性情報パターン4の位置を判定し、この属性情報パターン4を認識して処理対象領域2に関する属性情報を取得する部分である。基準位置マーク3と処理対象領域2との二軸方向の距離は一律に決められてので、領域特定部133は、基準位置マーク検出部131により検出された基準位置マーク3の位置と、属性情報パターン認識部132により得られた処理対象領域2に関する属性情報に含まれる当該処理対象領域のサイズ情報とから処理対象領域2の位置を特定することができる。
領域処理部14は、処理対象領域特定部13によって判定された処理対象領域2の画像情報に対する所定の情報処理、たとえば文字認識処理や画像抽出処理などを行う部分である。
次に、本実施形態の帳票処理装置10の動作を説明する。図8はこの動作の流れを示すフローチャートである。
まず、帳票画像入力部11は図1および図2に示した様式を有する帳票画像を入力して記憶部12に記憶する(ステップS501)。次に、処理対象領域特定部13は、まず基準位置マーク検出部131にて、記憶部12に記憶された帳票画像中のパターンから基準位置マーク3を検出する(ステップS502)。ここで、基準位置マーク3には、異なる回転角度では形状が一致しないパターンが採用されている。したがって、処理対象領域特定部13は、検出した基準位置マーク3の形状をもとに二次元空間での帳票画像の回転角度を判定し、帳票画像が正規の向きに対して回転した角度にある場合には回転補正を行う。なお、この帳票画像の回転補正は、入力される帳票画像が回転補正された状態で入力される場合には無条件にスキップされる。
次に、属性情報パターン認識部132は、記憶部12に記憶された帳票画像について、基準位置マーク3の位置を基準に属性情報パターン4の位置を特定する(ステップS503)。すなわち、属性情報パターン認識部132は、図2に示したように、基準位置マーク3の外接矩形3aの右下端P1から右に10mmオフセットした位置を属性情報パターン4の左下端P2として属性情報パターン4の位置を特定する。属性情報パターン4の左下端P2が分かれば属性情報パターン4の全体の位置を特定できる。属性情報パターン認識部132は、属性情報パターン4の位置を特定した後、属性情報パターン4を認識して処理対象領域に関する属性情報を取得して(ステップS504)、処理対象領域特定部13へ出力する。
次に、処理対象領域特定部13は、基準位置マーク検出部131により検出された基準位置マーク3の位置と、属性情報パターン認識部132より取得した処理対象領域2に関する属性情報の中の処理対象領域2のサイズ情報とをもとに、帳票画像中の処理対象領域2の位置を判定して(ステップS505)、この判定結果を領域処理部14へ通知する。すなわち、本例では、図2に示したように、基準位置マーク3の左下端P3から左に5mm、下に5mmの位置が処理対象領域2の左上端P4として規定されているので、処理対象領域特定部13は、まずその処理対象領域2の左上端P4の座標を求める。続いて、処理対象領域特定部13は、この処理対象領域2の左上端P4の座標と、属性情報パターン認識部132より取得した処理対象領域2に関する属性情報の中の処理対象領域2のサイズ情報をもとに処理対象領域2の全体の位置を求める。そして処理対象領域特定部13は、求めた処理対象領域全体の座標位置を領域処理部14へ通知する。
領域処理部14は、処理対象領域特定部13にて判定された処理対象領域2内の帳票画像について文字認識、画像抽出などの処理を行い(ステップS506)、その結果を出力する。
以上の処理は、帳票1に存在するすべての処理対象領域2について繰り返される(ステップS507)。
以上説明したように、本実施形態の帳票処理装置10によれば、帳票紙面において処理対象領域2が占める全体の位置を、帳票1の様式から得られる情報をもとに求めることができる。これにより、帳票1に様々なサイズの処理対象領域を混在させても、帳票処理装置10では個々の処理対象領域を正しく判断してそれぞれの領域内の画像情報に対する文字認識などの処理を行うことができる。
次に、本実施形態の帳票様式を作成する装置について説明する。
本実施形態の帳票様式作成装置は、たとえば、CPU、記憶装置(ROM、RAMなど)、入力装置(キーボード、マウスなど)、表示装置などを含む典型的なコンピュータのハードウェア資源と、帳票様式作成処理のためのプログラムなどのソフトウェア資源とで構成される。通信媒体を通じて接続された複数のコンピュータ上で帳票処理のためのプログラムによる処理を分散して行う構成としてもよい。あるいは、帳票処理の一部または全てを専用のハードウェアに置き換えて実現するようにしてもよい。本実施形態の帳票様式作成装置によって作成された帳票様式のデータは、コンピュータに接続された記録装置によって、着脱自在な記憶媒体に記録することが可能である。あるいは、伝送媒体を通じて他のコンピュータに伝送することも可能である。
図9は本実施形態の帳票様式作成装置の構成を示す機能ブロック図である。
本実施形態の帳票様式作成装置20は、ユーザによって作成された処理対象領域の定義情報を取得する領域指定部21と、領域指定部21にて取得された処理対象領域の定義情報をもとに当該処理対象領域を生成する領域生成部22と、処理対象領域の定義情報をもとに基準位置マークおよび属性情報パターンを含むパターンを生成するパターン生成部23と、領域生成部22にて生成された処理対象領域とパターン生成部23にて生成されたパターンとを組み合わせた帳票様式データを生成する様式データ生成部24と、様式データ生成部24にて生成された帳票様式データを汎用的なコンピュータとオペレーティングシステム上で印刷可能な形式のデータ(画像データ、ベクトルデータなど)に変換して出力する帳票様式データ出力部25とを備えている。
次に、本実施形態の帳票様式作成装置20の動作を詳細を説明する。
まず、ユーザによって作成された処理対象領域の定義情報を領域指定部21にて取得する。処理対象領域の定義情報は、表題、位置、サイズ、記入内容の種別などからなる。ユーザによって作成された処理対象領域の定義情報を取得する方法としては、たとえば、処理対象領域の定義情報をテキストデータの形式で記述したファイルをユーザに作成させ、そのテキストファイルを読み込むことによって行う方法などがある。
図10は処理対象領域の定義情報が記述されたテキストファイルの例である。このテキストファイルでは、行の単位で個々の処理対象領域の定義情報31,32,33が記述される。たとえば処理対象領域の定義情報31において、「申請者」は表題、「10,30」は位置、「90,25」はサイズ、「氏名」は記入内容の種別を意味する。ここで、位置は、図3に示したように、帳票1の左上角P5から処理対象領域2の左上角P6までの二軸(Y軸,X軸)方向のオフセット値(単位:mm)である。サイズは二軸(Y軸,X軸)方向それぞれの長さ(単位:mm)である。
また、処理対象領域の定義情報を入力には、次のようなGUI(グラフィカル・ユーザ・インターフェース)を利用してもよい。
図11は処理対象領域の表題および記入内容の種別をユーザに指定させるためのGUIであるウィンドウ(ダイアログボックス)34の例である。このウィンドウ34には、処理対象領域の表題を入力可能なテキストボックス35と、記入内容の種別をプルダウンメニュー36の中から指定できるプルダウンボックス37とが設けられている。図12は処理対象領域2の位置とサイズをユーザに指定させるためのGUIである様式編集画面38の例である。この様式編集画面38でユーザはマウスなどの入力装置を操作することによってマウスカーソルを移動させて、処理対象領域2の位置とサイズを指定することができる。領域指定部21は、これらのGUIでユーザによって指定された処理対象領域の表題、記入内容の種別、位置、サイズを取得する。
次に、領域生成部22は、領域指定部21にて取得された処理対象領域の定義情報をもとに、処理対象領域を生成して表示装置の画面に描画する。図13は図10に示した処理対象領域の定義情報をもとに3つの処理対象領域2(2−1,2−2,2−3)を生成した結果を示している。この際、各々の処理対象領域2(2−1,2−2,2−3)に対して表題5(5−1,5−2,5−3)が同時に付加される。
次に、パターン生成部23は、処理対象領域の定義情報をもとに基準位置マーク3および属性情報パターン4を含むパターンを生成する。ここで、基準位置マーク3と処理対象領域2との位置関係は固定で規定されているので、処理対象領域2の位置をもとに基準位置マーク3の位置が決定される。また、基準位置マーク3の位置が決まれば、この基準位置マーク3との位置関係が固定で規定されている属性情報パターン4の位置も決まる。これにより、図14に示すように、図13に示した処理対象領域2(2−1,2−2,2−3)と、基準位置マーク3(3−1,3−2,3−3)および属性情報パターン4(4−1,4−2,4−3)を含むパターンとを合成した帳票様式が得られる。
次に、帳票様式作成装置の別の実施形態を説明する。
図15は本実施形態の帳票様式作成装置30の構成を示す機能ブロック図である。
同図に示すように、本実施形態の帳票様式作成装置30は、図9に示した帳票様式作成装置20に領域情報再利用部26を加えたものである。その他の構成は図9に示した帳票様式作成装置20と同じである。領域情報再利用部26は、既に作成された帳票様式データを再利用して領域指定部21に対して新たに作成する処理対象領域の定義情報を提供するものである。
次に、この領域情報再利用部26の具体的な機能について説明する。
領域情報再利用部26は、既に作成された帳票様式データを取り込んで表示装置の画面にテンプレートとして表示させる。ここでユーザは、図16に示すように、表示装置の画面に表示された帳票様式の中の所望の処理対象領域2をマウス操作などによって選択することができる。所望の処理対象領域2が選択された状態でマウスの右クリック操作などが行われると、図17に示すように、選択された処理対象領域2に対して実施することの可能な処理コマンドのメニュー41が現れる。このメニュー41の中で所望の処理コマンドの実行がユーザによって指定されると、領域情報再利用部26はその指定された処理コマンドを実行する。
メニュー41の中の「コピー」の実行が指定された場合、領域情報再利用部26は、図18に示すように、その処理対象領域2のコピーをユーザによって指定された場所に新しい処理対象領域42として追加する。これにより、処理対象領域2の表題、サイズ、記入内容の種別が同一の処理対象領域42が追加され、2つの処理対象領域2、42に関す定義情報が作成されたことになる。メニュー41の中の「削除」の実行が指定された場合には、領域情報再利用部26は選択状態にある処理対象領域を削除する。
メニュー41の中の「属性変更」の実行が指定された場合には、領域情報再利用部26は、選択状態にある処理対象領域に関する属性情報(記入内容の種別、サイズなど)の変更内容を設定するためのダイアログボックスを表示して、このダイアログボックスにおいてユーザより入力された変更内容で、当該処理対象領域に関する属性情報の変更を行う。
メニュー41の中の「ライブラリに追加」の実行が指定された場合、領域情報再利用部26は、選択状態にある処理対象領域に関する表題、サイズ、記入内容の種別をライブラリに登録する。ここで、ライブラリとは、再利用可能な処理対象領域に関する表題、サイズ、記入内容の種別を読み出し可能なように蓄積するデータベースである。このライブラリは、たとえばコンピュータに接続されたハードディスクドライブなどの外部記憶装置に格納されている。
領域情報再利用部26には、ライブラリの内容を表示するコマンドが用意されている。ユーザによりこのコマンドの実行が指定された場合、領域情報再利用部26はライブラリに登録されているすべての処理対象領域に関する情報を表示装置に表示させる。図19はこのライブラリの登録情報の表示例を示す図である。ユーザは、このようなライブラリの登録情報の中から、所望の処理対象領域に関する情報を再利用の対象として選択することができる。
また、このライブラリにおいては、処理対象領域に関する情報の一部が未定義であっても登録が許されている。たとえば、図20に示す例においては、処理対象領域のサイズと記入内容の種別がライブラリに登録されているものの、表題が登録されておらず未定義である。領域情報再利用部26は、ライブラリから未定義の情報を含む処理対象領域に関する情報がユーザによって選択された場合には、図21に示すように、ダイアログボックス43を表示して、その未定義の情報をユーザに埋めさせることができる。図19および図20の例では、表題が未指定である場合について示したが、縦横のサイズや記入内容の種別の場合も同様である。
なお、上記の領域情報再利用部26の説明では、既存の帳票様式データからライブラリに登録する処理対象領域に関する情報をユーザが指定することとしたが、ライブラリにはいくつかの処理対象領域に関する情報がデフォルトで登録されていてもよい。
本発明は、上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
本発明の実施形態にかかる帳票の様式の例を示す図である。 図1の帳票様式上のパターンの詳細を示す図である。 基準位置マークと処理対象領域との位置関係の例を示す図である。 一つの属性情報パターンで複数の処理対象領域の属性情報を表現する方法を示す図である。 一つの属性情報パターンで表現された複数の処理対象領域の属性情報を表形式で示す図である。 帳票様式におけるパターンの別の表現方法を示す図である。 本発明の実施形態にかかる帳票処理装置の機能ブロック図である。 図7の帳票処理装置の動作を説明するフローチャートである。 本発明の実施形態にかかる帳票様式作成装置の機能ブロック図である。 処理対象領域の定義情報が記述されたテキストファイルの例を示す図である。 処理対象領域の表題および記入内容の種別をユーザに指定させるためのGUIを示す図である。 処理対象領域の位置とサイズをユーザに指定させるためのGUIを示す図である。 図10の定義情報に基づいて生成された処理対象領域を示す図である。 図10の定義情報に基づいて生成された帳票様式を示す図である。 本発明の別の実施形態にかかる帳票様式作成装置の構成を示す機能ブロック図である。 領域情報再利用部の機能である処理対象領域の選択を説明するための図である。 領域情報再利用部の機能である処理コマンドのメニュー表示を示す図である。 領域情報再利用部の機能である処理対象領域のコピー処理を示す図である。 ライブラリの登録情報の表示例を示す図である。 未定義の情報を含むライブラリの登録情報の例を示す図である。 未定義の情報をユーザに埋めさせるGUIを示す図である。
符号の説明
1…帳票、2…処理対象領域、3…基準位置マーク、4…属性情報パターン、10…帳票処理装置、11…帳票画像入力部、12…記憶部、13…処理対象領域特定部、14…領域処理部、20…帳票様式作成装置、21…領域指定部、22…領域生成部、23…パターン生成部、24…様式データ生成部、25…帳票様式データ出力部、26…領域情報再利用部、131…基準位置マーク検出部、132…属性情報パターン認識部、133…領域特定部。

Claims (10)

  1. 処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、
    前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、
    前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、
    前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、
    前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部と
    を具備することを特徴とする帳票処理装置。
  2. 前記領域は矩形の領域であり、
    前記領域特定部は、前記基準位置をもとに前記矩形の領域のあらかじめ決められた角の位置を判定し、この角の位置と前記領域のサイズ情報をもとに前記矩形の領域の全体の位置を求めることを特徴とする請求項1に記載の帳票処理装置。
  3. 前記マークは、異なる回転角度では形状が一致しないパターンであることを特徴とする請求項1または2に記載の帳票処理装置。
  4. 処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、
    前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、
    前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、
    前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部と
    を具備することを特徴とする帳票様式作成装置。
  5. 前記定義情報は、前記領域の位置およびサイズの情報を含むことを特徴とする請求項4に記載の帳票様式作成装置。
  6. 前記領域のサイズ情報を含む属性情報をライブラリとして記憶し、このライブラリとして記憶された前記領域の属性情報をユーザからの選択に応じて読み出し、新規の領域の作成のために再利用する領域情報再利用部をさらに具備することを特徴とする請求項4または5に記載の帳票様式作成装置。
  7. 処理対象の情報が配置される領域と、
    前記領域の位置を特定するための基準位置を示すとともに前記領域のサイズ情報を少なくとも表現したパターンとが配置されていることを特徴とする帳票。
  8. 前記パターンが、前記領域の境界の罫線に埋め込まれていることを特徴とする請求項6に記載の帳票。
  9. コンピュータを、
    処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、
    前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、
    前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、
    前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、
    前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部として機能させることを特徴とする帳票処理用のプログラム。
  10. コンピュータを、
    処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、
    前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、
    前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、
    前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部として機能させることを特徴とする帳票様式作成用のプログラム。
JP2006102063A 2006-04-03 2006-04-03 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム Pending JP2007279828A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006102063A JP2007279828A (ja) 2006-04-03 2006-04-03 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
US11/727,983 US7926732B2 (en) 2006-04-03 2007-03-29 OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
CNA2007100922752A CN101051305A (zh) 2006-04-03 2007-04-03 用于光学字符识别的页单输入设备、页单以及相关程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006102063A JP2007279828A (ja) 2006-04-03 2006-04-03 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム

Publications (1)

Publication Number Publication Date
JP2007279828A true JP2007279828A (ja) 2007-10-25

Family

ID=38557369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006102063A Pending JP2007279828A (ja) 2006-04-03 2006-04-03 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム

Country Status (3)

Country Link
US (1) US7926732B2 (ja)
JP (1) JP2007279828A (ja)
CN (1) CN101051305A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079711A (ja) * 2008-09-26 2010-04-08 Ricoh Co Ltd 多角形型コード、情報登録装置及び情報出力装置
JP2015179484A (ja) * 2014-03-20 2015-10-08 富士通フロンテック株式会社 帳票読取プログラム、帳票読取方法、および帳票読取システム
JP2015184815A (ja) * 2014-03-20 2015-10-22 株式会社Pfu 帳票定義作成装置、帳票定義作成方法、および、プログラム
JP2016001363A (ja) * 2014-06-11 2016-01-07 富士通株式会社 表生成方法、プログラム及び装置、並びに帳票生成方法、プログラム及び装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2946773A1 (fr) * 2009-06-12 2010-12-17 Bertrand Labaye Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.
JP5479083B2 (ja) * 2009-12-25 2014-04-23 キヤノン株式会社 画像処理装置及びその制御方法並びにプログラム
JP5561856B2 (ja) * 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
JP5556524B2 (ja) * 2010-09-13 2014-07-23 株式会社リコー 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体
KR101292916B1 (ko) * 2010-09-21 2013-08-02 가부시끼가이샤 킹 짐 화상 처리 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체, 휴대 단말, 및 화상 처리 방법
US20120200742A1 (en) 2010-09-21 2012-08-09 King Jim Co., Ltd. Image Processing System and Imaging Object Used For Same
JP2012194879A (ja) * 2011-03-17 2012-10-11 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
CN102710978B (zh) * 2012-04-12 2016-06-29 深圳Tcl新技术有限公司 电视机的光标移动方法及装置
CN102724578B (zh) * 2012-05-10 2016-12-14 深圳Tcl新技术有限公司 电视频道导航的方法及装置
CN102710632B (zh) * 2012-05-29 2016-03-30 华为终端有限公司 注册信息处理方法及终端设备和交互式系统
JP5586705B2 (ja) 2012-07-05 2014-09-10 株式会社東芝 オブジェクトにデータを埋め込む装置及び方法、並びに埋め込まれたデータを抽出する装置及び方法
TW201413628A (zh) * 2012-09-28 2014-04-01 Kun-Li Zhou 謄本解析系統
CN105373791B (zh) * 2015-11-12 2018-12-14 中国建设银行股份有限公司 信息处理方法及信息处理装置
US9865038B2 (en) * 2015-11-25 2018-01-09 Konica Minolta Laboratory U.S.A., Inc. Offsetting rotated tables in images
CN113191131A (zh) * 2021-05-10 2021-07-30 重庆中科云从科技有限公司 用于文本识别的表格模板建立方法、文本识别方法、系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS647274A (en) * 1987-06-30 1989-01-11 Toshiba Corp Character reader
JPH06139419A (ja) 1992-10-23 1994-05-20 Matsushita Electric Ind Co Ltd 記号構造およびその処理装置
JPH06342481A (ja) 1993-05-31 1994-12-13 Nippon Arugo Rizumu Kk 帳票読み取りシステム
JPH08305791A (ja) 1995-04-28 1996-11-22 Fuji Xerox Co Ltd 画像認識装置及び制御シート
JP3712578B2 (ja) 2000-01-11 2005-11-02 エヌ・ティ・ティ・アドバンステクノロジ株式会社 文字認識制御方法および装置
JP2001229312A (ja) 2000-02-16 2001-08-24 Oki Electric Ind Co Ltd イメージ切り出し方法及びイメージ切り出し装置
US20020050982A1 (en) * 2000-04-05 2002-05-02 Petter Ericson Data form having a position-coding pattern detectable by an optical sensor
JP4603658B2 (ja) * 2000-07-07 2010-12-22 キヤノン株式会社 画像処理装置及び画像処理方法並びに記憶媒体
US7392472B2 (en) * 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
JP4594638B2 (ja) 2004-03-30 2010-12-08 富士通株式会社 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票
US7607078B2 (en) * 2005-07-06 2009-10-20 International Business Machines Corporation Paper and electronic recognizable forms
JP4670658B2 (ja) * 2006-01-25 2011-04-13 富士ゼロックス株式会社 画像処理装置、画像処理方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079711A (ja) * 2008-09-26 2010-04-08 Ricoh Co Ltd 多角形型コード、情報登録装置及び情報出力装置
JP2015179484A (ja) * 2014-03-20 2015-10-08 富士通フロンテック株式会社 帳票読取プログラム、帳票読取方法、および帳票読取システム
JP2015184815A (ja) * 2014-03-20 2015-10-22 株式会社Pfu 帳票定義作成装置、帳票定義作成方法、および、プログラム
JP2016001363A (ja) * 2014-06-11 2016-01-07 富士通株式会社 表生成方法、プログラム及び装置、並びに帳票生成方法、プログラム及び装置

Also Published As

Publication number Publication date
US7926732B2 (en) 2011-04-19
US20070228168A1 (en) 2007-10-04
CN101051305A (zh) 2007-10-10

Similar Documents

Publication Publication Date Title
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
KR101334483B1 (ko) 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체
JP2008145611A (ja) 情報処理装置、プログラム
JP4591229B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2021043775A (ja) 情報処理装置及びプログラム
JP2009116825A (ja) 情報処理装置、及び情報処理方法
JP2002182914A (ja) 画面遷移表示装置、画面遷移表示方法および記憶媒体
JP2012190434A (ja) 帳票定義装置、帳票定義方法、プログラム及び記録媒体
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2008108114A (ja) 文書処理装置および文書処理方法
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP2018036794A (ja) 画像処理装置及びプログラム
JP4741363B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP6481204B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP4693167B2 (ja) 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
JP6918252B2 (ja) インクデータ生成装置、方法及びプログラム
JP5361315B2 (ja) 情報処理装置及び情報処理方法
JP6795770B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP5063207B2 (ja) 色変換処理装置、方法、記録媒体及びプログラム
JP2005184261A (ja) 色修正装置
JP2011135322A (ja) 画像処理装置及びその制御方法並びにプログラム
US20090241063A1 (en) Information processing apparatus, information processing method, and computer readable medium for designing a gui
JP2007286822A (ja) Gui仕様書生成方法およびgui仕様書生成システム
JP2005190439A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2005122543A (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080616

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080805