JP3898645B2 - 帳票書式編集装置および帳票書式編集プログラム - Google Patents

帳票書式編集装置および帳票書式編集プログラム Download PDF

Info

Publication number
JP3898645B2
JP3898645B2 JP2003007209A JP2003007209A JP3898645B2 JP 3898645 B2 JP3898645 B2 JP 3898645B2 JP 2003007209 A JP2003007209 A JP 2003007209A JP 2003007209 A JP2003007209 A JP 2003007209A JP 3898645 B2 JP3898645 B2 JP 3898645B2
Authority
JP
Japan
Prior art keywords
cell
cells
entry
item
ruled lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003007209A
Other languages
English (en)
Other versions
JP2004220340A (ja
Inventor
悦伸 堀田
敦子 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003007209A priority Critical patent/JP3898645B2/ja
Publication of JP2004220340A publication Critical patent/JP2004220340A/ja
Application granted granted Critical
Publication of JP3898645B2 publication Critical patent/JP3898645B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票上の記入セルを項目セルにリンク付けおよび記入セルの属性を設定する帳票書式編集装置および帳票書式編集プログラムに関するものである。
【0002】
【従来の技術】
従来、帳票中に、項目名を記入した項目セルおよびユーザなどにデータを入力させる記入セルを設け、ユーザに当該記入セルにデータを入力させて取りこむことが行われている。この際、記入セルがいずれの項目セルに対応するものかをリンク付け(特許文献1)、当該記入セルに入力されたデータを項目セル中の項目名に対応付けることが行われている。
【0003】
また、表中の項目セルと記入セルのリンク付けを行い、更に、リンク付けした項目セルの項目名を記入セルのフィールド名とするものがある(特許文献2)。
【0004】
【特許文献1】
特開平06−052156号公報の特許請求の範囲、および〔0005〕、〔0006〕など参照。
【特許文献2】
特開平03−179570号公報の特許請求の範囲、および明細書第6頁の〔課題を解決するための手段〕の欄などを参照。
【0005】
【発明が解決しようとする課題】
上述した前者では、記入セルと項目セルの関係が互いに接することが条件であり、記入セルが升目状に配置され、記入セルと項目セルとが互いに接していない場合にはリンク付けすることができないという問題があった。
【0006】
また、上述した後者では、項目セルと記入セルのリンク付けを行うものの項目セルが階層的になっている場合のリンク付け方法が記載されていなく不可であり、更に、記入セルのフィールド名に項目名をそのままつけているため、記入セルが一方向の項目セルのみとリンクしている場合などに、複数の記入セルのフィールド名が同一になるという問題があった。
【0007】
本発明は、これらの問題を解決するため、帳票から抽出した項目セルおよび記入セルのうち記入セルに注目して左側および上側に探索して項目セルを見つけてリンク付けすると共に、リンク情報を用いて属性(フィールド名、単位などの属性)を設定し、帳票中の記入セルを項目セルに自動的にリンク付けを行うと共にその属性を自動設定することを目的としている。
【0008】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0009】
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、罫線抽出手段2、文字認識手段3、セル識別手段4、リンク付け手段5、属性設定手段6などから構成されるものである。
【0010】
罫線抽出手段2は、帳票から縦罫線および横罫線を抽出するものである。
文字認識手段3は、帳票から抽出された縦罫線および横罫線で区切られたセル毎に文字認識を行うものである。
【0011】
セル識別手段4は、セル毎の文字認識結果をもとに項目セルおよび記入セルを識別するものである。
【0012】
リンク付け手段5は、帳票中の記入セルに注目して左側および上側に探索して項目セルを見つけてリンク付けなどするものである。
【0013】
属性設定手段6は、セルの属性を設定するものである。
次に、動作を説明する。
【0014】
罫線抽出手段2が帳票から縦罫線および横罫線を抽出し、文字認識手段3が抽出された帳票の縦罫線および横罫線で囲まれたセル毎に文字認識を行い、セル識別手段4がセル毎の文字認識結果をもとに項目セルおよび記入セルを識別し、リンク付け手段4が識別された記入セルに注目して、左側および上側に探索して項目セルを見つけたときにリンク付けを行い、属性設定手段6がセルに属性(フィールド名、単位など)を設定するようにしている。
【0015】
この際、リンク付け手段5が識別した記入セルに注目して、左側および上側に探索し、項目セルが階層的に並んでいることが判明したときに、当該各階層の項目セルに多重にリンク付けするようにしている。
【0016】
また、抽出した縦罫線および横罫線のうち他の縦罫線および横罫線と異なる罫線で囲まれた領域に分割し、当該分割した領域単位に、項目セルおよび記入セルを識別してリンク付けおよび属性の設定を行うようにしている。
【0017】
また、抽出したセルの縦罫線あるいは横罫線が他の罫線と異なる場合に、当該異なる縦罫線あるいは横罫線を越えたリンク付けを抑止するようにしている。
【0018】
また、属性設定手段6がリンク付けした情報を用いて記入セルのフィールド名を設定する際に当該記入セルのフィールド名が重複するときは当該フィールド名を識別する識別番号あるいは識別記号を付加するようにしている。
【0019】
従って、帳票から抽出した項目セルおよび記入セルのうち記入セルに注目して左側および上側に探索して項目セルを見つけてリンク付けすると共に、リンク情報を用いて属性(フィールド名、単位などの属性)を設定することにより、帳票中の記入セルを項目セルに自動的にリンク付けを行うと共にその属性を自動設定することが可能となる。
【0020】
【発明の実施の形態】
次に、図1から図11を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0021】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、図示外の外部記憶装置あるいは記録媒体から読込んだプログラムを主記憶にローディングして起動し、当該プログラムに従い各種処理を実行するものであって、ここでは、罫線抽出手段2、文字認識手段3、セル識別手段4、リンク付け手段5、属性設定手段6、セル属性テーブル7、および罫線テーブル8などから構成されるものである。
【0022】
罫線抽出手段2は、帳票データあるいは紙に印刷された帳票から読取った画像から縦罫線および横罫線を抽出するものである。
【0023】
文字認識手段3は、帳票から抽出された縦罫線および横罫線で区切られたセル毎に文字認識を行うものである。
【0024】
セル識別手段4は、セル毎の文字認識結果をもとに項目セル(項目名が認識されたセル)および記入セル(文字が認識されない空白のセルあるいは単位(例えば円)などの文字のみが認識されたセル)を識別するものである。
【0025】
リンク付け手段5は、帳票中の記入セルに注目して左側および上側に探索して項目セルを見つけてリンク付けなどするものである(図2から図11を用いて後述する)。
【0026】
属性設定手段6は、セルの属性を設定するものである(図2から図11を用いて後述する)。
【0027】
セル属性テーブル7は、セルの属性などを設定するものである(図6、図9参照)。
【0028】
罫線テーブル8は、帳票から抽出された罫線情報を設定したものである(図7参照)。
【0029】
入力装置11は、データ、指示、画像などを入力するものであって、キーボード、マウス、スキャナなどである。
【0030】
出力装置12は、データ、指示、結果などを表示、印字、ファイル出力などするものである。
【0031】
次に、図2のフローチャートの順番に従い、図1の構成の全体の動作を説明する。
【0032】
図2は、本発明の動作説明フローチャートを示す。
図2において、S1は、スキャナ読み取りする。これは、帳票をスキャナによって読み取り、帳票のドットイメージの画像を生成する。
【0033】
S2は、罫線を抽出する。これは、例えばS1で帳票から読み取った帳票の画像イメージから、連結黒画素の長さが閾値以上のものを縦方向、および横方向に抽出し、縦罫線および横罫線として抽出する。
【0034】
S3は、セルを抽出する。これは、S2で抽出した縦罫線および横罫線で区切られるセルにIDを付与し、当該セルの左上座標および右下座標、更に、当該セルの上下、左右に接する罫線ID、罫線の種別などを抽出し、後述する例えば図6のセル属性テーブル7に示すように設定する。
【0035】
S4は、セル毎に文字認識する。これは、S3で抽出したセル毎に当該セル内の文字認識を行う。
【0036】
S5は、項目セル、記入セルを識別する。これは、S4でセル毎に当該セル内の文字認識を行い、項目名が認識されたセルは項目セル、文字が認識されないセルおよび単位(例えば円)などの文字のみが認識されたセルを記入セルとして識別する。例えば図5の帳票中の、セル01は文字”申請者”という項目名が認識されたので項目セルと識別し、セル04は文字が認識されなかったので記入セルと識別する、また、図8のセル04は単位”円”のみが認識されたので記入セルと識別する。
【0037】
S6は、記入セルから左側の項目セルを探索しリンク付けする。これは、例えば図5の表示中のセル04の記入セルから左側の項目セル02を探索し、当該記入セル04から見つけた項目セル02をリンク付け(図6の▲2▼、▲2▼’、▲2▼’’を参照)、および更に左側の上位の階層の項目セル01を探索し当該記入セル04から見つけた項目セル01をリンク付け(図6の▲1▼、▲1▼’、▲1▼’’を参照)することを繰り返す。
【0038】
S7は、記入セルから上側の項目セルを探索しリンク付けする。これは、S6と同様に、上側についてリンク付けする。
【0039】
S8は、リンク情報を用いた記入セルの属性(フィールド名、単位など)を設定する。これは、S6、S7でリンク付けしたリンク情報を用いて記入セルの属性として、ここでは、フィールド名、単位などを設定、例えば後述する図8の記入セル03にフィールド名”商品名1”(上の項目セルの項目名”商品名”が通常はフィールド名とするが、ここでは、セル05、セル07・・・も同一の項目名”商品名”とリンク付けられるのでこれらを識別するために,当該記入セル03のフィールド名は”商品1”(図9の▲3▼参照)、記入セル05のフィールド名は”商品2”・・・というように、識別番号1,2・・・などを付加したフィールド名にする。また、付加したフィールド名に加えて、プレプリントされた後述する図8の記入セル04の単位”円”が認識されたので、同一の項目セル02”金額”をリンクする他の項目セル06,8・・・にプレプリントされた単位”円”を伝播して設定する(図9の▲5▼参照)。
【0040】
以上によって、帳票から抽出したセル毎に文字認識して項目セルおよび記入セルを識別し、記入セルについて左側および上側に項目セルを探索してリンク付けすると共に、リンク情報を用いて記入セルの属性を設定(フィールド名に識別番号を付加、単位などを伝播)することにより、帳票の記入セルのリンク付けおよび属性を自動的に設定することが可能となる。以下順次詳細に説明する。
【0041】
図3は、本発明のセル抽出フローチャートを示す。
図3において、S11は、最上部の横罫線に着目する。これは、例えば後述する図5の帳票例中の最上部の横罫線01に着目する。
【0042】
S12は、下に見ていき、ほぼ同じ長さで一番距離の近い横罫線を抽出する。これは、S11で例えば図5の横罫線01に着目し、当該横罫線01から下に見ていき、ほぼ同じ長さで一番距離の近い横罫線、ここでは、横罫線02を抽出する。
【0043】
S13は、抽出した罫線間の領域で縦罫線を抽出する。これは、例えばS11とS12で抽出した図5の横罫線01と横罫線02の間の領域で縦罫線、ここでは、縦罫線08、10を抽出する。
【0044】
S14は、縦罫線で囲まれた領域に横罫線があるか判別する。これは、例えば、S13で抽出した図5の縦罫線08で囲まれた領域(即ち、横罫線01と横罫線02と縦罫線08で囲まれた領域)は、ここでは、横罫線がないので、NOとなり、S16に進む。一方、例えば、S13で抽出した図5の縦罫線10で囲まれた領域(即ち、横罫線01と横罫線02、縦罫線08と縦罫線10で囲まれた領域)は、ここでは、横罫線05があるので、YESとなり、S15で内部の罫線を抽出、ここでは、横罫線05を抽出し、S14に同様に戻り繰り返し、領域の内部に罫線が無くなるまで繰り返す。
【0045】
S16は、セル領域を決定しセル属性を登録する。これは、S14からS15を繰り返すことにより、セル内部に罫線がないと判明したので、当該領域(セル領域)にセルIDを付与して当該領域(セル)の左上座標、右下座標、上下・左右に接する罫線ID、罫線の種別(太い、細い、二重線など)などを図6に示すように登録する。
【0046】
S18は、内部に罫線ありか判別する。YESの場合には、S11に戻り繰り返す。NOの場合には、S19に進む。
【0047】
S19は、下の罫線を最上部罫線としてS11からS18を繰り返す。
S20は、横罫線が終りか判別する。YESの場合には、終了する。NOの場合には、次の横罫線についてS11以降を繰り返す。
【0048】
以上によって、最上部の横罫線に着目し、これとほぼ同じ長さで一番距離の近い横罫線を抽出して当該横罫線間の領域内について、縦罫線を抽出、更に、横罫線を抽出してセル(内部に罫線のない領域)を決定して当該セル(領域)の左上座標、右下座標、接する罫線番号、罫線種別などを図6のセル属性テーブル7に自動登録することが可能となる。
【0049】
図4は、本発明のセルのリンク付けフローチャートを示す。
図4において、S31は、最初の記入セルに着目する。これは、例えば後述する図5のセル04(記入セル04)に着目する。
【0050】
S32は、着目セルと左右の罫線番号が同じで着目セルの上側の罫線番号を下側の罫線番号として持つ項目セルを探索する。例えば後述する図8の着目した記入セル03(着目セル)と、左右の罫線番号07.08が同じで着目セル03の上側の罫線02を下側の罫線番号として持つ項目セル、ここでは、項目セル01を探索する。
【0051】
S33は、存在するか判別する。YESの場合には、S34に進む。NOの場合には、着目セルに着目して上方向に項目セルが見つからなかったので、S35に進む。
【0052】
S34は、リンク付けを行う。ここでは、S32で探索して見つけた例えば図8の項目セル01を、着目した記入セル03にリンク付けする(図9の▲6▼参照)。
【0053】
S35は、次の記入セルに着目する。
S36は、次の記入セルがなしか判別する。YESの場合には、終了する。NOの場合には、次の記入セルがあったので、S32以降を繰り返す。
【0054】
以上によって、記入セルに着目して上側に同じ階層の項目セルが見つかったときに当該見つけた項目セルを当該着目した記入セルからリンクすることが可能となる(例えば図9の▲6▼参照)。同様に、更に、上位の階層の項目セル(着目した記入セルの左右の罫線を含む領域を持つ上側の項目セル)を探索して見つかればリンク付けすることを繰り返す。また、同様に、上側の代りに左側に探索することにより、着目セルから左方向の項目セルについて探索してリンク付けすることが可能となる。
【0055】
図5は、本発明の帳票例を示す。図示の帳票中で、( )内は罫線番号およびセル番号を表す。例えば左上の(罫線01)は図示の位置の横罫線の番号”01”を表す。また、(セル01)はセルID”01”である旨を表し、当該矩形で囲まれたセルのIDを表す。”申請者”、”姓”、”名”などは、セル内に印刷された文字を表す。
【0056】
以上の帳票について、既述した図2のフローチャートのS1からS8に従い処理すると、図6のセル属性テーブル7に示すように、セルIDに対応づけてリンク情報および属性などが自動的に登録されることとなる。
【0057】
図6は、本発明のセル属性テーブル例(プレプリントなし)を示す。これは、既述した図5の帳票(プレプリントなし)を、図2のフローチャートに従い登録したものであって、図示の項目を対応づけて登録したものである。
【0058】
・セルID:
・左上座標:
・右下座標:
・上の罫線番号:
・下の罫線番号:
・左の罫線番号:
・右の罫線番号:
・文字認識結果:
・左へのリンク数:
・左にリンクする項目セル番号:
・上へのリンク数:
・上にリンクする項目セル番号:
・プレプリント文字情報:
・フィールド名:
・グループ属性:
・その他:
ここで、「セルID」はセルに付与した一意の番号である。「左上座標、右下座標」はセルの左上座標、右下座標である。「上の罫線番号、下の罫線番号、左の罫線番号、右の罫線番号」はセルに接する上、下、左、右の罫線番号である。「文字認識結果」はセル内の文字認識結果である。「左へのリンク数、左にリンクする項目セル番号」はセルが左方向へリンクする項目セル数(項目セルの階層数)、リンクする項目セルの番号である。「上へのリンク数、上にリンクする項目セル番号」はセルが上方向へリンクする項目セル数(項目セルの階層数)、リンクする項目セルの番号である。「プレプリント文字情報」は記入セルにプレプリントされた文字情報を文字認識した結果(例えば単位を表す「円」、「個数」など)である。「フィールド名」はセルに付与したフィールド名であって、ここでは、リンクする項目名(例えば商品名)が重複するときは識別番号を付加した例えば「商品名1」、「商品名2」・・・などである。「グループ属性」は帳票中のセルが例えば後述する図11の(b)に示すように、丸角付きの罫線で囲まれた領域毎に分割してこれをグループとし、当該グループ内でリンク付けなどを行うためのものである。
【0059】
以上のセル属性テーブル7に図2のフローチャートに従い帳票からセル抽出、リンク付け、属性を作成して登録し管理することが可能となる。
【0060】
図7は、本発明の罫線テーブル例を示す。図示の罫線テーブルは、既述した図5の帳票について、図2のフローチャートのS1からS2によって抽出した罫線と、当該罫線に付与した罫線IDを登録したものであって、図示の下記の項目を対応づけて登録したものである。
【0061】
・罫線ID:
・始点座標:
・終点座標:
・線種:
・太さ:
・その他:
ここで、「罫線ID」は帳票から抽出した縦罫線、横罫線に付与した一意のID(番号)である。「始点座標、終点座標」は罫線の始点と終点の座標である。「線種、太さ」は罫線の線種(実線、二重線、点線などの線種)、太さ(太い、普通、細いなど)である。
【0062】
図8は、本発明の帳票例(プレプリントあり)を示す。図示の帳票は、記入セルに単位などのプレプリント(ここでは、「円」)が印刷されている例を示す。プレプリントがある場合には、当該プレプリント「円」が伝播し、ここでは、同一のリンク先(項目セル03)を持つ他の記入セル06,08・・・などに当該プレプリント「円」を伝播する(後述する図9のセル属性テーブル7の▲5▼参照)。
【0063】
図9は、本発明のセル属性テーブル例(プレプリントあり)を示す。これは、既述した図8の帳票(プレプリントあり)について、既述した図2のフローチャートに従い罫線検出、セル抽出、項目セルと記入セルの識別、リンク付け、属性の作成し、既述した図6のセル属性テーブル(プレプリントなし)と同様に登録したものであって、ここでは、プレプリント文字情報の欄に、伝播された単位のプレプリントされた文字情報「円」が▲5▼に示すように伝播されて登録されている。尚、記入セル03の▲3▼のフィールド名「商品名1」は、記入セル03のリンク先の項目セル01(項目名「商品名」)をリンク先とする記入セルが複数(記入セル05,07・・・)あるため、これらの間の識別番号1を付加して登録したものである。
【0064】
図10は、本発明の説明図(リンク付制限、その1)を示す。
図10の(a)は、フローチャートを示す。
【0065】
図10の(a)において、S41は、ある記入セルに着目する。
S42は、全体を構成する罫線のうち頻度の少ない特別な罫線(例えば二重線)があるか判別する。これらS41、S42は、図10の(b)に示す帳票中の例えば▲7▼の記入セルに着目し、当該▲7▼の記入セルから左方向を探索したときに、帳票の全体を構成する罫線のうち頻度の少ない特別な罫線、ここでは、図示の二重罫線があるか判別する。YESの場合には、S43に進む。NOの場合には、S43をスキップし、S44で通常のリンク付け(既述した図3のリンク付け)を行い、終了する。
【0066】
S43は、S42のYESで記入セルから左方向あるいは上方向に項目セルを探索してリンク付けしようとしたときに、帳票の全体を構成する罫線のうち頻度の少ない特別な罫線である、例えば二重線が見つかったので、ここでは、当該二重線の方向へのリンク付け処理を中止し、終了する。
【0067】
以上によって、帳票中に二重線などの特別な罫線を描画することにより、当該特別な罫線を越えたリンク付けを自動的に制限することが可能となる。
【0068】
図10の(b)は、特別な罫線の例を示す。ここでは、帳票の全体を構成する罫線のうち頻度の少ない特別な罫線として、二重線を帳票中に描画して当該二重線を越えた記入セルの項目セルへのリンク付けえを制限した例を示す。
【0069】
図11は、本発明の説明図(リンク付制限、その2)を示す。
図11の(a)は、フローチャートを示す。
【0070】
図11の(a)において、S51は、全てのセルをグループ分けする。これは、例えば図11の(b)に示すように、帳票中に罫線として丸角を持つ罫線が描画されて当該丸角の罫線の領域内を1つのグループに分割する。尚、グループにセルを分割する罫線として、丸角の罫線を用いたが、他の罫線でグループに分割してもよい(例えば二重線で囲んだ領域内のセルをグループに分割する)。
【0071】
S52は、同一グループ内のみでリンク付けを行う。これは、S51で帳票内のセルをグループ分けし、当該グループ分けした各グループ内のセルについて既述したように、記入セルから左方向、上方向に探索して項目セルを見つけてリンク付けなどを行う。
【0072】
以上によって、丸角の罫線などで帳票中のセルをグループに分割させて当該グループ内で自動的に記入セルのリンク付け、更に、属性の設定を行うことが可能となる。
【0073】
図11の(b)は、グループ分けする罫線の例を示す。ここでは、帳票中のセルをグループ分けするために丸角の罫線を使用した例を示す。図示の丸角の罫線で囲まれた領域内のセルについて、既述した項目セル、記入セルを識別して記入セルからリンクする項目セルを探索してリンク付け、および属性(フィールド名、単位などのプレプリント文字)を作成し、セル属性テーブル7に登録することが可能となる。
【0074】
(付記1)
帳票上の記入セルを項目セルにリンク付けおよび記入セルの属性を設定する帳票書式編集装置において、
帳票上から縦罫線および横罫線を抽出する手段と、
前記抽出した縦罫線および横罫線をもとにセルを抽出する手段と、
前記抽出したセル毎に文字認識を行って項目セルと記入セルを識別する手段と、
前記識別した記入セルに注目して、左側および上側に探索して項目セルが見つかったときにリンク付けを行うリンク付け手段と、
前記リンク付けした情報を用いて記入セルの属性を設定する手段と
を備えたことを特徴とする帳票書式編集装置。
【0075】
(付記2)
前記識別した記入セルに注目して、左側および上側に探索して項目セルが階層的に並んでいることが判明したときに、当該各階層の項目セルに多重にリンク付けするリンク付け手段を備えたことを特徴とする付記1記載の帳票書式編集装置。
【0076】
(付記3)
前記抽出した縦罫線および横罫線のうち他の縦罫線および横罫線と異なる罫線で囲まれた領域に分割し、当該分割した領域単位に、前記項目セルおよび記入セルを識別してリンク付けおよび属性の設定を行うことを特徴とする付記1あるいは付記2に記載の帳票書式編集装置。
【0077】
(付記4)
上記抽出したセルの縦罫線あるいは横罫線が他の罫線と異なる場合に、当該異なる縦罫線あるいは横罫線を越えたリンク付けを抑止することを特徴とする付記1から付記3のいずれかに記載の帳票書式編集装置。
【0078】
(付記5)
前記リンク付けした情報を用いて記入セルのフィールド名を設定する際に当該記入セルのフィールド名が重複するときは当該フィールド名を識別する識別番号あるいは識別記号を付加したことを特徴とする付記1から付記4のいずれかに記載の帳票書式編集装置。
【0079】
(付記6)
帳票上の記入セルを項目セルにリンク付けおよび記入セルの属性を設定する帳票書式編集プログラムにおいて、
コンピュータに、
帳票上から縦罫線および横罫線を抽出するステップと、
前記抽出した縦罫線および横罫線をもとにセルを抽出するステップと、
前記抽出したセル毎に文字認識を行って項目セルと記入セルを識別するステップと、
前記識別した記入セルに注目して、左側および上側に探索して項目セルが見つかったときにリンク付けを行うリンク付けステップと、
前記リンク付けした情報を用いて記入セルの属性を設定するステップと
して実行させるための帳票書式編集プログラム。
【0080】
(付記7)
前記識別した記入セルに注目して、左側および上側に探索して項目セルが階層的に並んでいることが判明したときに、当該各階層の項目セルに多重にリンク付けするリンク付けステップを有することを特徴とする付記6記載の帳票書式編集プログラム。
【0081】
【発明の効果】
以上説明したように、本発明によれば、帳票から抽出した項目セルおよび記入セルのうち記入セルに注目して左側および上側に探索して項目セルを見つけてリンク付けすると共に、リンク情報を用いて属性(フィールド名、単位などの属性)を設定する構成を採用しているため、帳票中の記入セルを項目セルに自動的にリンク付けを行うと共にその属性を自動設定することが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明のセル抽出フローチャートである。
【図4】本発明のリンク付けフローチャートである。
【図5】本発明の帳票例(プレプリントなし)である。
【図6】本発明のセル属性テーブル(プレプリントなし)である。
【図7】本発明の罫線テーブルである。
【図8】本発明の帳票例(プレプリントあり)である。
【図9】本発明のセル属性テーブル(プレプリントあり)である。
【図10】本発明の説明図(リンク付制限、その1)である。
【図11】本発明の説明図(リンク付制限、その2)である。
【符号の説明】
1:処理装置
2:罫線抽出装置
3:文字認識手段
4:セル識別手段
5:リンク付手段
6:属性設定手段
7:セル属性テーブル
8:罫線テーブル
11:入力装置
12:出力装置

Claims (3)

  1. 帳票上の記入セルを項目セルにリンク付けおよび記入セルの属性を設定する帳票書式編集装置において、
    帳票上から縦罫線および横罫線を抽出する手段と、
    前記抽出した縦罫線および横罫線をもとにセルを抽出する手段と、
    前記抽出したセル毎に文字認識を行って項目セルと記入セルを識別する手段と、
    前記識別した記入セルに注目して、左側および上側に探索して項目セルが階層的に並んていることが判明したときに、当該各階層の項目セルに多重にリンク付けするリンク付け手段と、
    前記リンク付けした情報を用いて記入セルの属性を設定する手段と
    を備えたことを特徴とする帳票書式編集装置。
  2. 前記リンク付けした情報を用いて記入セルのフィールド名を設定する際に当該記入セルのフィールド名が重複するときは当該フィールド名を識別する識別番号あるいは識別記号を付加したことを特徴とする請求項1記載の帳票書式編集装置。
  3. 帳票上の記入セルを項目セルにリンク付けおよび記入セルの属性を設定する帳票書式編集プログラムを、
    スキャナで読み取られた帳票のドットイメージを生成して、生成されたドットイメージ
    の帳票上から縦罫線および横罫線を抽出する手段、
    前記抽出した縦罫線および横罫線をもとにセルを抽出する手段、
    前記抽出したセル毎に文字認識を行って項目セルと記入セルを識別する手段、
    前記識別した記入セルに注目して、左側および上側に探索して項目セルが階層的に並んていることが判明したときに、当該各階層の項目セルに多重にリンク付けするリンク付け手段、
    前記リンク付けした情報を用いて記入セルの属性を設定し、セル属性テーブルに記憶する手段、
    として機能させるための帳票書式編集プログラム。
JP2003007209A 2003-01-15 2003-01-15 帳票書式編集装置および帳票書式編集プログラム Expired - Fee Related JP3898645B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003007209A JP3898645B2 (ja) 2003-01-15 2003-01-15 帳票書式編集装置および帳票書式編集プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003007209A JP3898645B2 (ja) 2003-01-15 2003-01-15 帳票書式編集装置および帳票書式編集プログラム

Publications (2)

Publication Number Publication Date
JP2004220340A JP2004220340A (ja) 2004-08-05
JP3898645B2 true JP3898645B2 (ja) 2007-03-28

Family

ID=32897376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003007209A Expired - Fee Related JP3898645B2 (ja) 2003-01-15 2003-01-15 帳票書式編集装置および帳票書式編集プログラム

Country Status (1)

Country Link
JP (1) JP3898645B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4686339B2 (ja) * 2005-11-14 2011-05-25 大日本印刷株式会社 汎用バリアブルプリント多面割付編集方法、装置
JP4996940B2 (ja) * 2007-02-21 2012-08-08 日立コンピュータ機器株式会社 帳票認識装置およびそのプログラム
JP5402099B2 (ja) * 2008-03-06 2014-01-29 株式会社リコー 情報処理システム、情報処理装置、情報処理方法およびプログラム
CN102194123B (zh) * 2010-03-11 2015-06-03 株式会社理光 表格模板定义方法和装置
JP2012190434A (ja) * 2011-02-24 2012-10-04 Ricoh Co Ltd 帳票定義装置、帳票定義方法、プログラム及び記録媒体
US10084939B2 (en) 2016-03-18 2018-09-25 Ricoh Company, Ltd. Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Also Published As

Publication number Publication date
JP2004220340A (ja) 2004-08-05

Similar Documents

Publication Publication Date Title
US9613267B2 (en) Method and system of extracting label:value data from a document
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
WO2007117334A2 (en) Document analysis system for integration of paper records into a searchable electronic database
JP4785655B2 (ja) 文書処理装置及び文書処理方法
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
JP5661549B2 (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
JP2021043478A (ja) 情報処理装置、その制御方法及びプログラム
EP2884425B1 (en) Method and system of extracting structured data from a document
JP2004258706A (ja) 帳票定義データ作成方法および帳票処理装置
WO2000062243A1 (fr) Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP2008108114A (ja) 文書処理装置および文書処理方法
JP4518212B2 (ja) 画像処理装置及びプログラム
Wu et al. A machine-learning approach for analyzing document layout structures with two reading orders
JP7351159B2 (ja) 情報処理装置及びプログラム
JP2011070529A (ja) 文書処理装置
JP4517822B2 (ja) 画像処理装置及びプログラム
Gupta et al. Table detection and metadata extraction in document images
Yamashita et al. A document recognition system and its applications
Lu et al. Retrieving imaged documents in digital libraries based on word image coding
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
JP2009182530A (ja) 業務処理遂行支援装置
JP3768738B2 (ja) 電子ファイリングシステム,表紙識別処理装置およびそれらのプログラム記録媒体
Cao et al. Automatic recognition of tables in construction tender documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060721

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060914

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20061116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061221

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110105

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110105

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120105

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130105

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130105

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140105

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees