JP4183527B2 - 帳票定義データ作成方法および帳票処理装置 - Google Patents

帳票定義データ作成方法および帳票処理装置 Download PDF

Info

Publication number
JP4183527B2
JP4183527B2 JP2003045406A JP2003045406A JP4183527B2 JP 4183527 B2 JP4183527 B2 JP 4183527B2 JP 2003045406 A JP2003045406 A JP 2003045406A JP 2003045406 A JP2003045406 A JP 2003045406A JP 4183527 B2 JP4183527 B2 JP 4183527B2
Authority
JP
Japan
Prior art keywords
definition
area
definition data
data
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003045406A
Other languages
English (en)
Other versions
JP2004258706A (ja
Inventor
英輔 浅野
広 新庄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Terminal Solutions Corp
Original Assignee
Hitachi Omron Terminal Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Terminal Solutions Corp filed Critical Hitachi Omron Terminal Solutions Corp
Priority to JP2003045406A priority Critical patent/JP4183527B2/ja
Priority to TW092132932A priority patent/TW200416583A/zh
Priority to KR1020040002535A priority patent/KR100570224B1/ko
Priority to CNA2004100006610A priority patent/CN1525378A/zh
Publication of JP2004258706A publication Critical patent/JP2004258706A/ja
Application granted granted Critical
Publication of JP4183527B2 publication Critical patent/JP4183527B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41BWEAPONS FOR PROJECTING MISSILES WITHOUT USE OF EXPLOSIVE OR COMBUSTIBLE PROPELLANT CHARGE; WEAPONS NOT OTHERWISE PROVIDED FOR
    • F41B11/00Compressed-gas guns, e.g. air guns; Steam guns
    • F41B11/80Compressed-gas guns, e.g. air guns; Steam guns specially adapted for particular purposes
    • F41B11/89Compressed-gas guns, e.g. air guns; Steam guns specially adapted for particular purposes for toys
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41BWEAPONS FOR PROJECTING MISSILES WITHOUT USE OF EXPLOSIVE OR COMBUSTIBLE PROPELLANT CHARGE; WEAPONS NOT OTHERWISE PROVIDED FOR
    • F41B11/00Compressed-gas guns, e.g. air guns; Steam guns
    • F41B11/50Magazines for compressed-gas guns; Arrangements for feeding or loading projectiles from magazines
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41BWEAPONS FOR PROJECTING MISSILES WITHOUT USE OF EXPLOSIVE OR COMBUSTIBLE PROPELLANT CHARGE; WEAPONS NOT OTHERWISE PROVIDED FOR
    • F41B11/00Compressed-gas guns, e.g. air guns; Steam guns
    • F41B11/70Details not provided for in F41B11/50 or F41B11/60

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票の処理技術に係り、特に文字認識処理を行う際に用いられる帳票定義データの自動作成技術に関する。
【0002】
【従来の技術】
帳票の金額欄等の文字列を認識する際には、文字認識要求領域の位置や文字数等の情報を予め登録している帳票定義データを用いて文字認識を行う。この帳票定義データ作成について、これまでに様々な手法が考案されており、それら手法は主に負担が大きい定義データ作成をより容易にするために工夫されたものである。
【0003】
例えば、特許文献1に記載されている帳票定義作成方法では、データが記入されていない帳票に対して、罫線抽出及び枠抽出から定義データを自動抽出する。また、プレ印刷の文字を認識し、予め登録しているキーワード辞書と照合することにより、罫線で囲まれていない文字記入枠を設定したり、キーワードに対応した位置に存在する枠の文字種を設定することができる。さらに、全面のプレ印刷文字を読むことにより、人手で枠を指定することなく、全ての定義作成に関する作業を自動で行う手法について説明している。
【0004】
【特許文献1】
特開2001−126010号公報(第8−9頁、図7)
【0005】
【発明が解決しようとする課題】
しかし前記の定義作成方法では、枠を指定した場合、指定枠内にプレ印刷がなければ文字種等の定義データは作成できない。また、全面プレ印刷文字を認識するには現状では非常に時間がかかるため実用的でない。さらに、キーワードに対する位置は帳票により異なるため、キーワード辞書を様々な帳票に対して汎用的に使用するのは不可能である。
【0006】
本発明の目的は、かかる課題を解決するためになされたものであり、特定の帳票あるいは記入済み、未記入に関わらず、様々な帳票でも帳票定義データの自動作成を可能にすることである。
【0007】
【課題を解決するための手段】
上記目的を達成するために本発明では、指定された読取り領域周辺あるいは内部のプレ印刷文字、記入文字と定義画像データ入力時に自動抽出した枠、罫線等のレイアウト情報を基にして定義データの自動作成を行う。この定義データ作成方法は、読取り領域の内部にプレ印刷がなくても、読取り領域の周辺に存在する文字列を認識し、その認識結果を定義データに変換することにより定義データの抽出が可能である。また、読取り領域周辺に複数の文字列が存在する場合でも、文字列の位置やサイズ、枠の有無、枠サイズに対する文字列サイズの割合等から、読取り領域に対するキーワード(本発明では以後項目名と称することにする)としての妥当性を数値化し、最も妥当である文字列の認識結果を定義データに変換することにより定義データの抽出が可能である。
【0008】
以上の処理を行う本発明の帳票処理装置により、記入帳票/未記入帳票、読取り領域に対する項目名の位置、指定領域内部のプレ印刷の有無に関わらず、帳票定義データを自動作成することが可能である。
【0009】
本発明は、さらに種々の態様を採ることができ、例えば、上述した帳票処理における自動定義データ作成方法として構成しても良いし、かかる機能をコンピュータに実現させるためのコンピュータプログラムとして構成してもよい。ここで、記憶媒体としては、フレキシブルディスク、CD−ROM、DVD、光磁気ディスク、ICカード、ICチップ、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置など光学的、磁気的、電気的にコンピュータが読取り可能な種々の媒体を利用できる。また、本発明について、上述した種々の特徴は、適宜、組み合わせることが可能である。
【0010】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について、以下の項目に分けて説明する。
【0011】
A.システム構成
B.帳票定義データの構成
C.帳票定義データの作成
C1.項目名−定義データ変換処理
A.システム構成:
図1は帳票定義データの作成を支援する帳票処理装置の構成を示すブロック図である。なお、以下では、帳票106のイメージデータに基づいて新規に帳票定義データを自動作成する場合を例にとって説明するが、本帳票処理装置は、既に作成された帳票定義データに新たに別の読取り領域の定義データを追加登録することが可能である。
【0012】
この帳票処理装置は、図示する通り、ハードウェアとしては、汎用のパーソナルコンピュータ101及びディスプレイ102、キーボード103、マウス104、スキャナ105とを接続して構成される。パーソナルコンピュータ101には、帳票処理装置の機能を実現するためのアプリケーションソフトがインストールされている。図中に、帳票処理装置としての機能ブロック107〜113を示してある。これらの機能ブロックは、上述のアプリケーションソフトによって構成される。もちろん、ハードウェアで構成することも可能である。
【0013】
画像入力部107は、スキャナ105を制御して、帳票定義データを作成するサンプルとなる帳票106のイメージデータを入力する機能を奏する。帳票定義データ作成部108は、キーボード103やマウス104の入力装置から定義領域を指定されることにより、このイメージデータに基づいて帳票定義データを自動抽出する機能を奏する。この際には、文字認識用辞書110、項目名照合用知識辞書111、項目名−定義情報変換辞書112などの各データベースが参照される。文字認識用辞書110は、イメージデータの形状と文字とを各文字単位で照合するための辞書である。項目名照合用知識辞書111は、文字列と項目名となりうる単語とを照合することにより、文字認識率を向上させるための辞書である。項目名−定義情報変換辞書112は、上記項目名照合により得られた項目名から読取り対象となる属性や文字数等の定義データに変換するための辞書である。
【0014】
帳票定義データ出力部109は、帳票定義データ作成部108により抽出した定義データを出力する。自動作成した定義データは、帳票定義データ用のデータベース113に登録される。
【0015】
B.帳票定義データの構成:
図2は帳票イメージと帳票定義データの構成を示す図である。図の上方に定義したい帳票イメージ201を例示し、下方に定義データ202の構成の一例を示した。帳票イメージ201には、左上の角を原点として、図示する方向にx、y軸が定義されている。
【0016】
帳票定義データ202の一例としては、認識要求領域座標、枠形状、知識辞書種、文字数、手書・活字等から構成される。例えば、帳票イメージ201の右上の依頼日の文字認識定義データは定義データ202の左上にある定義データと対応している。定義データでは、この認識要求領域について、文字認識処理を行うべき矩形範囲が左上(スタート位置)および右下(エンド位置)の各頂点の(x,y)座標で定義されている。図中の例では、左上の頂点が(1200,100)、右下の頂点が(1400,150)と設定されている。また、枠は存在するため、枠形状は「枠有り」で設定されている。知識辞書種に関しては、読取り対象の属性は日付であるため、「日付」と、文字数は「12文字」と、文字の種別としては「活字」と設定されている。
【0017】
ただし、ここで挙げた定義データは一例であり、これら以外に様々な情報を定義データとして設定してもよい。例えば、認識要求領域が活字であり、文字ピッチが一定であることが事前にわかっている場合、文字ピッチを定義データに設定し、文字認識時にその情報を使用することで認識率を向上することが可能である。
【0018】
C.帳票定義データの作成:
図3は定義データ自動作成処理のフローチャートである。コンピュータ101のCPUがユーザのコマンドに応じて実行する処理である。処理が開始されると、CPUはまず帳票のイメージデータを画像入力部107で入力し(ステップS100)、帳票全面に対してレイアウト解析処理を実行する(ステップS200)。即ち、入力されたイメージデータから、表枠、罫線などのレイアウト情報を抽出するとともに、文字行と認識される部分も文字情報として抽出する。この処理により得られたレイアウト情報及び文字情報をコンピュータ101のディスプレイ102等の表示装置によりユーザに提示する。例えば、図4(a)の例では、レイアウト解析により得られた枠抽出結果をウィンドウ405に表示している。この例では簡単化のために枠抽出結果のみを表示しているが、実際にはボタンやコマンド等により罫線、文字行情報の表示を切り替えることが可能である。
【0019】
これから定義する予定の領域の罫線や枠が誤抽出の場合に、誤抽出したレイアウト情報をユーザが修正する(ステップ300)。修正処理は、ディスプレイ102等の表示装置に表示された枠や罫線等をコンピュータ101のマウス104等のポインティングデバイスを利用して行う。例えば、図4(b)の例では、レイアウト解析により得られた枠406を誤抽出しているため、修正ボタン401をオンにし、マウス104で修正枠を選択した後にドラッグすることにより枠を修正する(407)。レイアウト情報に修正処理が加わったことをCPUが検知すると、CPUは修正した情報を基にして再度レイアウト解析を行い、定義する予定の領域に関するレイアウト情報を正しく設定する。
【0020】
この処理は、定義領域に枠や罫線などのレイアウト情報に誤抽出がある場合のみ行う。したがって、誤抽出が確認できない場合や、定義する領域以外の部分で誤抽出がおきている場合などは、この処理をスキップすることも可能であるので、定義データ作成時間の短縮につながる。
【0021】
レイアウト情報の修正は、枠や罫線等のレイアウト情報に対して追加/削除/修正/統合/分割等の処理により行う。また、内部で保持しているレイアウト情報抽出に関する閾値を変更することにより、一度にレイアウト情報を修正することも可能である。例えば、内部で保持している抽出可能な枠の最小サイズ・最大サイズの閾値を変更し、再度レイアウト解析処理を行うことにより、閾値変更前では抽出できなかった枠を一度に抽出できるようにすることも可能である。
【0022】
この処理により必要なレイアウト情報が得られると、次に、CPUは定義領域設定処理を行う(ステップS400)。この処理では、得られたレイアウト情報をディスプレイ102等の表示装置によりユーザに提示して、どの領域を定義するかをマウス104等のポインティングデバイスを利用して指定してもらう。この処理は得られた枠を選択してもよいし、枠が無い領域を定義したい場合は読取る文字列が書かれる部分をマウスドラッグ等により領域を囲むことで選択してもよい。例えば、図4(d)の例では、枠408を定義領域とする場合、選択ボタン402をオンに、マウス104で枠408を選択することにより定義領域の設定を行う。
【0023】
ユーザに定義領域を指定してもらうと、CPUは、レイアウト情報−定義データ変換処理を行う(ステップS500)。定義領域設定処理により、レイアウト情報として抽出された枠を選択した場合は、選択した枠に該当する情報をレイアウト情報テーブルから取得し、これを基に定義データに変換する。枠が無い領域を定義した場合は、囲んだ枠を仮想枠と見なし、定義データを作成する。ここでいう定義データとは、認識要求領域の矩形座標や枠の有無等のレイアウト情報により抽出可能な定義項目のことを指す。
【0024】
また、定義領域内に複数の枠が存在し、かつ各枠の縦幅・横幅サイズから全枠が1文字枠であると判断されれば、枠数を基にして文字数の設定を行うことも可能である。例えば、金額欄には桁線により区切られた1文字枠が存在することが多々ある。この領域を定義する際には、前記の方法により認識要求領域の矩形座標や枠の有無、文字数等の定義データが抽出可能である。
【0025】
CPUはこの処理と前後して、項目名−定義データ変換処理も行う(ステップS600)。詳細な処理内容は後述するが、この処理では、指定した定義領域の周辺の文字を認識することにより、読取り属性や文字数等の定義データを抽出する処理である。
【0026】
これらの処理により定義データが得られると、次にCPUは定義データを整理し、ディスプレイ等の表示装置102により定義データをユーザに提示する。提示した定義データに誤りがある場合や設定されていない項目がある場合は、ユーザが定義データを修正したり、追加したりする(ステップS700)。ユーザに定義データを提示する際に、自動設定されている項目や未設定項目等を色分けすることにより、ユーザにわかりやすくさせることも可能である。また、自動で設定した項目の中で、あいまい性が高い項目も同様に色分けすることで、ユーザに注意を促すことも可能である。ここでは定義データのユーザ提示方法の一例を挙げたが、この他にも様々な提示方法が考えられる。
【0027】
例えば、図4(e)の例では、レイアウト解析及び項目名から抽出した定義データを整理してウィンドウ409に表示している。ユーザは表示されている定義データを確認し、全ての定義データが正しいならば定義データに修正を加えずに、誤っているならば各定義データをユーザが修正しOKボタン410を押すことにより枠408に対する定義領域設定が完了する。定義領域として設定しない場合はキャンセルボタン411を押すことで、選択した枠の定義領域設定は無効となる。
【0028】
図4(d)の例では、表形式となっているため、各枠における定義データの属性は列単位で同じ値を持つ。例えば、「銀行名」の下にある枠は全て「銀行名」の属性が入り、「支店名」も同様である。このように、列単位で定義データの属性が等しい領域を定義領域として設定する場合は定義領域のコピー機能を使用することにより、定義作業を効率良く行うことが可能である(ステップ800)。
【0029】
例えば、図5(f)の例では、定義領域として、「銀行名」、「支店名」、「口座番号」の全領域を定義する場合、各項目の真下に存在する領域412を上記で説明した手順により設定する。次にコピーボタン403を押した後に図5(g)に示すようにコピーしたい領域413をマウス104でドラッグすることにより囲む。CPUはコピーしたい領域413に対して、設定済みの定義領域を検出する処理および設定済みの定義領域412と縦幅・横幅が等しい枠を検出する処理を行う。この処理では、設定済みの定義領域412に対してコピーしたい領域413内で上下方向を探索し、縦幅・横幅が等しい枠を検出する。次にCPUは、図5(h)に示すように設定済みの定義属性値を検出した枠にコピーする(414)。ここでいう定義属性値とは、座標情報以外の文字数や知識辞書種等の定義データを指すものである。スタート位置やエンド位置などの座標情報は各枠で異なるので、これらの定義データはレイアウト解析により得られた枠情報から抽出する。
【0030】
この例では、列に対するコピーについて説明したが、行に対するコピーも同様にして実現することが可能である。またこれ以外に、縦幅・横幅が等しい枠を検出した時点でディスプレイ102でユーザに提示し、定義属性コピーを行いたい枠のみをユーザがマウス104で選択し、定義属性コピーを実行させることも可能である。
【0031】
以上の処理により、設定された帳票定義データを出力して(ステップS900)、帳票定義データの自動作成処理を終了する。作成された帳票定義データは、先に説明した通り、帳票処理装置に記憶され、帳票の文字認識に活用される。例えば、図4の例では、すべての帳票定義データが正確に設定されていることを確認した後に保存ボタン404を押すことにより帳票定義データを保存することが可能である。
【0032】
C1.項目名−定義データ変換処理:
図6は項目名−定義データ変換処理600のフローチャートである。この処理では、ユーザが指定した定義領域に対して、上方向、左方向に隣接する枠を検出する(ステップS601)。ここでは、CPUは予め帳票全面で抽出したレイアウト情報の枠情報テーブルを参照し、該当する枠情報を検出する。例えば、図7の例では、「平成14年12月1日」という領域705を定義領域として指定した場合、領域705に対する隣接枠は、領域706に該当する。
【0033】
次に、CPUは、該当する隣接枠内に存在する文字行に対して文字認識処理を行い(ステップS602)、得られた認識結果が存在するかのチェックを行う(ステップS603)。ここでは、CPUは先に説明した文字認識用辞書110を参照し、切り出したラスタイメージと文字との照合を行う。また、得られた文字列を項目名照合用知識辞書111と照合することによって単語として確定する知識照合処理を実行する。
【0034】
例えば、図7の例では、指定した定義領域705に対する隣接枠706内の文字行707を、文字認識用辞書110及び項目名照合知識辞書111を参照し、項目名認識結果「振込指定日」を得る。得られた認識結果が存在しないというのは、該当する隣接枠が無い場合や隣接枠内に文字行が存在しない場合、また、文字行は存在したが知識照合で失敗した場合のことを指す。例えば、図7の例では、領域701に対する隣接枠は存在せず、隣接する文字行702のみが存在する。また、領域703に対しても隣接枠は存在せず、領域703の内部に文字行704が存在する。なお、隣接枠が2つ以上存在し、項目名認識結果が2つ以上存在した場合は、文字認識処理から得られた確信度が高い方を優先する。また、この場合、ユーザに提示することにより正しい項目名を選択させることも可能である。
【0035】
隣接枠内に対する項目名認識結果が得られた場合、CPUは認識結果の項目名を定義データに変換する(ステップS609)。この処理では、先に説明した項目名−定義情報変換辞書11を参照することにより、項目名に対する定義データに変換する。図8に項目名−定義情報変換辞書11の一例を示す。図7の領域706内の「振込指定日」を例にとって説明すると、この項目名は項目名−定義情報変換辞書11に存在し、この項目名に該当する知識辞書種は「日付」、文字数は「12文字」である。このようにして、項目名から定義データを抽出する。なお、項目名に付随した定義データは知識辞書種や文字数に関わらず、様々な情報を設定してもよい。例えば、知識辞書種や文字数以外では文字種等が考えられる。
【0036】
ステップ603において、隣接枠に対する項目名認識結果が得られなかった場合には、指定した定義領域内の文字行抽出処理を行う。ここでは、CPUは予め帳票全面で抽出したレイアウト情報の文字行情報テーブルを参照し、指定した領域内に存在する文字行情報を検出する。抽出した文字行に対して文字認識処理を行い(ステップS604)、得られた認識結果が存在するかのチェックを行う(ステップS605)。ここでは、CPUは上記と同様に、文字認識用辞書110、項目名照合用知識辞書111を利用して文字認識を行う。
【0037】
例えば、図7の例では、「依頼日 年 月」という領域703を定義領域として指定した場合、指定した定義領域703の内部に存在する文字行704を、文字認識用辞書110及び項目名照合知識辞書111を参照し、項目名認識結果「依頼日」を得る。内部文字行に対する項目名認識結果が得られた場合、CPUは認識結果の項目名を定義データに変換する(ステップS609)。
【0038】
内部文字行に対する項目名認識結果が得られなかった場合には、指定した定義領域に対して、上方向、左方向に隣接する文字行を検出する(ステップS606)。ここでは、CPUは予め帳票全面で抽出したレイアウト情報の枠情報テーブルを参照し、該当する文字行情報を検出する。例えば、図7の例では、「 殿」という領域701を定義領域として指定した場合、領域701に対する隣接文字行は、領域702に該当する。
【0039】
次に、CPUは、該当する隣接文字行に対して文字認識処理を行い(ステップS607)、得られた認識結果が存在するかのチェックを行う(ステップS608)。ここでは、CPUは上記と同様に、文字認識用辞書110、項目名照合用知識辞書111を利用して文字認識を行う。例えば、図7の例では、指定した定義領域701に対する隣接文字行702を、文字認識用辞書110及び項目名照合知識辞書111を参照し、項目名認識結果「依頼人」を得る。
【0040】
隣接文字行に対する項目名認識結果が得られた場合、CPUは認識結果の項目名を定義データに変換する(ステップS609)。隣接文字行に対する項目名認識結果が得られなかった場合は、指定した定義領域が項目名を持たない領域と見なして、知識辞書種や文字数等の定義データは未設定として終了する。
【0041】
CPUは以上の処理を、全指定定義領域に対して実行する。なお、今回の項目名抽出処理において、隣接枠内文字行、指定定義領域内文字行、隣接文字行の順番で優先度を設定したが、帳票種によっては優先度を変更してもよい。また、3つの文字行を使用せず、例えば隣接枠内文字行のみを使用してもよい。こうすることで、項目名が出現する位置が限定されている帳票などは、より正確な項目名抽出、定義データ作成を行うことが可能となる。
【0042】
以上の説明のとおり本発明の一実施例によれば、帳票定義データの作成をできるだけ自動化し、自動化できない処理に関しては部分的に人手の介入を行うことで、より円滑に帳票定義データ作成を支援することができる。
【0043】
ユーザが定義データを修正したり追加したりする際に、自動設定されている項目や未設定項目等を表示装置で色分けすることにより、ユーザにわかりやすい画面構成にすることができる。また、自動で設定した項目の中で、あいまい性が高い項目も同様に色分けすることで、ユーザに注意を促すことができる。
【0044】
さらに、特定の帳票あるいは記入済み、未記入に関わらず、様々な帳票でも帳票定義データの自動作成を可能にすることができる。
【0045】
以上、本発明の実施例について説明したが、本発明は実施例に限定されず、その趣旨を逸脱しない範囲で種々の構成をとることはいうまでもない。例えば、以上の制御処理はソフトウェアで実現する他、ハードウェアで実現するものとしてもよい。また、帳票定義データの作成を帳票処理装置の文字認識手段が実施するように構成することも可能である。
【0046】
【発明の効果】
本発明によれば、特定の帳票あるいは記入済み、未記入に関わらず、様々な帳票でも帳票定義データの自動作成を可能にすることができる。
【図面の簡単な説明】
【図1】本発明の一実施例による帳票処理装置の概略構成図である。
【図2】帳票イメージおよび帳票定義データの構成を示す図である。
【図3】本発明の一実施例による帳票定義データ自動作成処理のフローチャートである。
【図4】本発明の一実施例による帳票定義データの作成を説明するための表示例を示す図である。
【図5】本発明の一実施例による帳票定義データ作成を説明するための表示例を示す図である。
【図6】本発明の一実施例による帳票定義データ作成の項目名−定義データ変換処理のフローチャートである。
【図7】本発明の一実施例による帳票定義データ作成における指定された定義領域に対する項目名の位置を示す図である。
【図8】本発明の一実施例による帳票定義データ作成における項目名−定義データ変換辞書の一例を示す図である。
【符号の説明】
101…コンピュータ 102…ディスプレイ
103…キーボード 104…マウス
105…スキャナ
106…帳票(定義データ作成用画像)
107…画像入力部 107…帳票定義データ作成部
109…帳票定義データ出力部 110…文字認識用辞書
111…項目名照合用知識辞書
112…項目名−定義情報変換辞書
113…帳票定義データ
201…帳票イメージ 202…帳票定義データ
401…修正ボタン 402…選択ボタン
403…コピーボタン 404…保存ボタン
405…レイアウト解析結果画面 406…誤抽出枠
407…修正後のレイアウト解析結果画面
408…定義領域設定枠 409…定義情報表示画面
410…OKボタン 411…キャンセルボタン
412…定義設定ずみ領域 413…コピー範囲
414…コピー結果画面
600、602、604、607、610…指定した定義領域
701…指定した定義領域の隣接文字行
704…指定した定義領域内部文字行
706、709、712…指定した定義領域隣接枠
707、710、713…指定した定義領域隣接枠内部文字行

Claims (4)

  1. 未記入帳票あるいは記入済み帳票から帳票のイメージデータを取得し、該イメージデータから表、枠、罫線等のレイアウト情報を抽出し、ユーザによって入力装置にて指定された定義領域に対応する前記レイアウト情報から当該定義領域の位置に関する第1の定義データを抽出し、前記定義領域の上方向及び左方向に位置する枠内、当該定義領域内、当該定義領域の上方向及び左方向に位置する枠外、の順序で各々文字認識の処理を行い、前記各々の文字認識処理において認識結果が得られた場合、以降の文字認識処理を打ち切り、認識結果と、キーワードとなりうる単語を照合し、得られたキーワードを当該定義領域の属性に関する第2の定義データに変換することを特徴とする帳票定義データ作成方法。
  2. 前記定義領域が列方向あるいは行方向に連続し、さらに各定義領域の縦幅及び横幅が等しい場合、前記各定義領域に対応する前記レイアウト情報から当該各定義領域の位置に関する第1の定義データを抽出し、前記第2の定義データを前記各定義領域の属性に関する第2の定義データとしてコピーすることを特徴とする請求項1記載の帳票定義データ作成方法。
  3. 帳票のイメージデータに基づいて記入された内容の文字認識処理を行う際に用いられる帳票定義データの作成を行う帳票処理装置であって、
    未記入帳票あるいは記入済み帳票から帳票のイメージデータを取得する手段と、前記イメージデータについて表、枠、罫線等のレイアウト情報を抽出する手段と、ユーザが前記帳票定義データとして認識したい領域を指定する入力手段と、前記入力手段にて指定された定義領域に対応する前記レイアウト情報から当該定義領域の位置に関する第1の定義データを抽出する手段と、前記定義領域の上方向及び左方向に位置する枠内、当該定義領域内、当該定義領域の上方向及び左方向に位置する枠外、の順序で各々文字認識の処理を行う手段と、前記各々の文字認識処理において認識結果が得られた場合、以降の文字認識処理を打ち切る処理装置と、前記認識結果をキーワードとなりうる単語と照合する手段と、前記照合結果から得られたキーワードを当該定義領域の属性を示す第2の定義データに変換する手段と、前記第1の定義データと第2の定義データを整理して帳票定義データファイルに出力する手段とを備えることを特徴とする帳票処理装置。
  4. 前記定義領域が列方向あるいは行方向に連続し、さらに各定義情報の縦幅及び横幅が等しい場合、前記文字認識手段は前記各定義領域に対応する前記レイアウト情報から当該各定義領域の位置に関する第1の定義データを抽出し、前記第2の定義データを前記各定義領域の属性に関する第2の定義データとしてコピーすることを特徴とする請求項3記載の帳票処理装置。
JP2003045406A 2003-02-24 2003-02-24 帳票定義データ作成方法および帳票処理装置 Expired - Fee Related JP4183527B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003045406A JP4183527B2 (ja) 2003-02-24 2003-02-24 帳票定義データ作成方法および帳票処理装置
TW092132932A TW200416583A (en) 2003-02-24 2003-11-24 Definition data generation method of account book voucher and processing device of account book voucher
KR1020040002535A KR100570224B1 (ko) 2003-02-24 2004-01-14 전표정의데이터 작성방법 및 전표처리장치
CNA2004100006610A CN1525378A (zh) 2003-02-24 2004-01-15 票据定义数据生成方法以及票据处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003045406A JP4183527B2 (ja) 2003-02-24 2003-02-24 帳票定義データ作成方法および帳票処理装置

Publications (2)

Publication Number Publication Date
JP2004258706A JP2004258706A (ja) 2004-09-16
JP4183527B2 true JP4183527B2 (ja) 2008-11-19

Family

ID=33112215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003045406A Expired - Fee Related JP4183527B2 (ja) 2003-02-24 2003-02-24 帳票定義データ作成方法および帳票処理装置

Country Status (4)

Country Link
JP (1) JP4183527B2 (ja)
KR (1) KR100570224B1 (ja)
CN (1) CN1525378A (ja)
TW (1) TW200416583A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930174A (zh) * 2012-11-20 2013-02-13 江苏省疾病预防控制中心 居民健康信息采集系统及采集方法
US8564846B2 (en) 2010-09-13 2013-10-22 Ricoh Company, Ltd. Form processing apparatus, form processing method, and storage medium for updating definition data

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4973063B2 (ja) * 2006-08-14 2012-07-11 富士通株式会社 表データ処理方法及び装置
CN101464951B (zh) * 2007-12-21 2012-05-30 北大方正集团有限公司 图像识别方法及系统
JP2012009005A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP2012009000A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP5561856B2 (ja) 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
JP5583542B2 (ja) 2010-05-24 2014-09-03 株式会社Pfu 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP2012083951A (ja) * 2010-10-12 2012-04-26 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
JP2013109690A (ja) * 2011-11-24 2013-06-06 Oki Electric Ind Co Ltd 帳票データ入力装置及び帳票データ入力方法
WO2014061081A1 (ja) * 2012-10-15 2014-04-24 富士通株式会社 帳票作成支援装置、帳票作成支援方法、及び帳票作成支援プログラム
CN103092625B (zh) * 2013-01-28 2016-01-20 中国航空结算有限责任公司 一种基于.NET Framework平台的处理民航客运客票票证数据的方法和装置
JP6109688B2 (ja) * 2013-09-06 2017-04-05 株式会社東芝 帳票読取装置およびプログラム
CN104391830A (zh) * 2014-10-24 2015-03-04 华迪计算机集团有限公司 单据页面动态布局的方法及装置
CN107533651B (zh) * 2015-05-11 2021-05-04 株式会社东芝 识别装置、识别方法及计算机可读取的记录介质
JP7235269B2 (ja) * 2017-03-13 2023-03-08 日本電気株式会社 データ項目名推定装置、データ項目名推定プログラム、及びデータ項目名推定方法
JP6445645B1 (ja) * 2017-09-21 2018-12-26 株式会社東芝 帳票情報認識装置および帳票情報認識方法
CN109634606A (zh) * 2018-12-10 2019-04-16 山东浪潮通软信息科技有限公司 一种定义功能菜单的方法及装置
JP7259468B2 (ja) 2019-03-25 2023-04-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2020167618A (ja) * 2019-03-29 2020-10-08 キヤノン株式会社 画像処理装置、その制御方法及びプログラム
CN111931473A (zh) * 2019-05-13 2020-11-13 阿里巴巴集团控股有限公司 票据的处理方法及装置
JP7468004B2 (ja) 2020-03-11 2024-04-16 富士フイルムビジネスイノベーション株式会社 帳票処理装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8564846B2 (en) 2010-09-13 2013-10-22 Ricoh Company, Ltd. Form processing apparatus, form processing method, and storage medium for updating definition data
CN102930174A (zh) * 2012-11-20 2013-02-13 江苏省疾病预防控制中心 居民健康信息采集系统及采集方法
CN102930174B (zh) * 2012-11-20 2015-07-01 江苏省疾病预防控制中心 居民健康信息采集系统及采集方法

Also Published As

Publication number Publication date
CN1525378A (zh) 2004-09-01
KR20040078046A (ko) 2004-09-08
JP2004258706A (ja) 2004-09-16
KR100570224B1 (ko) 2006-04-11
TW200416583A (en) 2004-09-01

Similar Documents

Publication Publication Date Title
JP4183527B2 (ja) 帳票定義データ作成方法および帳票処理装置
KR100228321B1 (ko) 문자데이타 입력 시스템
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
US20070136660A1 (en) Creation of semantic objects for providing logical structure to markup language representations of documents
JP3294995B2 (ja) 帳票読取装置
JP6755926B2 (ja) 帳票情報認識装置および帳票情報認識方法
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2008108114A (ja) 文書処理装置および文書処理方法
CN116682118A (zh) 一种古文字识别方法、系统、终端及介质
JPH08320914A (ja) 表認識方法および装置
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP3484446B2 (ja) 光学文字認識装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP6190549B1 (ja) 文書処理システム
JPH10207981A (ja) 帳票認識方法
JP4521377B2 (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP6994727B1 (ja) 読取システム、読取プログラムおよび読取方法
JP6960646B6 (ja) 読取システム、読取プログラムおよび読取方法
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
JP2682873B2 (ja) 表形式文書の認識装置
JPH0689330A (ja) 画像ファイリングシステム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050704

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080805

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080902

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees