JP2005100079A - 帳票データ入力装置およびプログラム - Google Patents

帳票データ入力装置およびプログラム Download PDF

Info

Publication number
JP2005100079A
JP2005100079A JP2003332733A JP2003332733A JP2005100079A JP 2005100079 A JP2005100079 A JP 2005100079A JP 2003332733 A JP2003332733 A JP 2003332733A JP 2003332733 A JP2003332733 A JP 2003332733A JP 2005100079 A JP2005100079 A JP 2005100079A
Authority
JP
Japan
Prior art keywords
record
item
data
definition information
detail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003332733A
Other languages
English (en)
Other versions
JP4396205B2 (ja
Inventor
Takehiko Mizoguchi
岳彦 溝口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2003332733A priority Critical patent/JP4396205B2/ja
Publication of JP2005100079A publication Critical patent/JP2005100079A/ja
Application granted granted Critical
Publication of JP4396205B2 publication Critical patent/JP4396205B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】 OCRより得られた帳票データを項目としたデータレコードを作成することができるようにした装置およびプログラムの提供。
【解決手段】 OCR制御部22は、記憶部28に記憶するイメージ入力部27からの帳票イメージデータを認識辞書29を参照してOCR認識処理を行ない、その認識結果をファイル30に格納する。そして定義情報ファイル26内の該帳票定義に明細領域があれば、該帳票定義の明細行数に相当するデータレコードを展開ファイル31に形成する。形成された各データレコードに該帳票定義の項目定義に基づいて項目を形成する。次に、レコードのヘッダ部に属する項目には同一の認識結果を、明細部の項目には明細行に対応する認識結果を認識結果ファイル30から入力設定を行なう。この処理を明細行数分繰り返す。
【選択図】 図2

Description

本発明は、データベース構築機能を有するアプリケーション・プログラムに、OCR(Optical Character Reader:光学式文字読み取り装置)を用いてデータの入力を行なうシステムに関し、さらに詳しくは、OCRによって帳票から読取ったデータを、これらのアプリケーション・プログラムに適した態様で該プログラムに入力を行なう装置およびプログラムに関する。
従来からOCRを用いた帳票データ入力システムにおいては、OCRによって認識された帳票データは1伝票上に存在する項目データの集合として扱われる。
OCRによって入力された帳票項目データを業務アプリケーション・ソフトウェアが利用するには、定義されたOCR帳票定義体に格納されている項目名称の指定をデータ項目単位に順次繰り返して、一時的に格納されているOCRからの認識データのうち対応するデータの獲得を行なった後、それら認識データを帳票の共通な項目データ(以下、ヘッダ部データと称する)と、取引の明細を繰り返し記述する項目データ(以下、明細部データと称する)とを組み合わせたデータベース形式に適合するようにレコード処理が行なわれているものもある(例えば、特許文献1参照。)。
特開平8−339418号公報
しかしながら、ヘッダ部、明細部、および集計部の各項目からなる伝票形式のデータ入力を行なう業務アプリケーション・ソフトウェアにあっては、OCRによって認識された各項目データを項目単位で獲得するために、データレコードの明細繰り返し行に対応する項目数分に応じた共通項目のヘッダ部項目および集計部項目データの獲得要求を複数回分に亘って行なうような複雑なプログラミングが必要となり、プログラマの作業負担を増大させるという問題があった。
また、複数葉の枚数に亘る伝票の項目データを獲得する際は、2枚目以降の伝票の項目に共通項目のヘッダ部および/または集計部が存在しないため、2枚目以降の明細繰り返し部にヘッダ部および/または集計部を付加する処理を伝票間で行なわなければならず、プログラミングの記述内容が複雑になって、さらにプログラマの作業負担を増大させていた。
以上の事情を鑑み、OCRを用いた帳票データ入力において、OCRより認識された帳票データを、定義された帳票フォーマットに従って、1入力伝票処理単位で二次正規化を行なうことにより業務アプリケーション・ソフトウェアで容易に扱うことが可能なデータレコード形式に配列する帳票データ入力装置およびプログラムを提供することが本発明が解決しようとする課題である。
本発明の態様のひとつである帳票データ入力装置は、少なくともヘッダ部と明細部を有する帳票を光学的に読み取って帳票イメージを生成するイメージ読取手段と、該帳票のヘッダ部、明細部に含まれる項目それぞれの定義情報を記憶している帳票定義情報記憶手段と、前記イメージ読取手段によって生成された帳票イメージから、前記定義情報記憶手段に記憶されている項目定義情報に基づいて、読み取り対象のフィールド領域内のイメージを文字認識する文字認識手段と、前記文字認識手段による認識結果をデータベースにて利用可能のデータレコード形式のレコードに項目データとして形成するレコード形成手段と、を備えることによって上述した課題を特徴とする。
こうすることによって、OCRによって認識された帳票データをその帳票定義情報に従って、データベースにて利用可能な形式のデータレコードが形成されるので、業務アプリケーションソフトにて容易に認識データを利用することが可能となる。
なお、上述した本発明に係わる帳票データ入力装置において、前記レコード形成手段は、前記帳票定義記憶手段に記憶された明細部項目の定義情報として示される明細行数に相当する数分のデータレコード領域を確保するレコード領域確保手段と、前記レコード領域確保手段によって確保された各データレコード領域に、前記帳票定義記憶手段に記憶された各項目定義に基づいた項目を夫々に割り当てるレコード項目割当手段と、前記レコード項目割当手段によってヘッダ部項目として割り当てられた各レコード項目には帳票共通の認識結果を入力し、明細部として割り当てられた各レコード項目には明細行の夫々に対応する認識結果を入力させるデータ入力手段と、をさらに備えることができる。
こうすることにより、データベースにおけるレコード形式と同一なレコード形式を形成することができるので、あたかもデータベースからデータを検索するが如く、容易にアプリケーションソフトにおいてOCRによって入力された帳票データを利用することが可能となる。
さらに、前記レコード形成手段によって形成されたレコードをデータベース構築機能を有するアプリケーションソフトからの要求に応じて該アプリケーションソフトにおけるデータ格納空間に送出する送出手段を、さらに備えることができる。
こうすることにより、あたかもデータベースからデータを検索するが如く、容易にアプリケーションソフトにおいてOCRによって入力された帳票データを利用することが可能となる。
また、前述した本発明に係わる帳票データ入力装置に相当する処理をコンピュータに行なわせるプログラムであっても、そのプログラムをコンピュータに読み込ませて実行させることによって、前述した本発明に係わる帳票データ入力装置と同様な作用・効果が得られる。
本発明は、明細繰り返し部の定義を含む帳票フォーム定義情報に基づいて、OCRからの帳票データをヘッダ部、明細部の各項目データとするレコードを形成することができる。
こうすることにより、帳票フォーム定義情報に明細繰り返し行を定義するだけで、OCRより得られたデータをデータレコードとして作成することができるので、あたかもデータベースからデータを検索するが如く、容易にOCRによって読み取られた帳票データを扱うことが可能となる効果を奏する。
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本発明に係わるOCRとコンピュータシステムとからなるOCR帳票データ入力システム構成を示すブロック図である。
本システムは、図1に示すように、CPU1、メインメモリ2、イメージ入力部3、入力部4、マウス6を含む表示部5、プリンタ7、および記憶媒体81を含む記憶装置8とを有する。
CPU(Central Processing Unit)1は、イメージ入力部3により入力されたイメージデータに基づいて、文字認識処理や本実施形態に係わる帳票データ入力処理を実行する。メインメモリ2は、CPU1の各種処理に必要なアプリケーション・プログラムを含むプログラムおよびデータを一時的に格納を行なう。
イメージ入力部3は、帳票あるいは伝票上を光学的に走査して、帳票あるいは伝票に記録された文字や図形(フィールド領域を示す枠など)をイメージに変換してデジタルデータとしてCPU1に入力を行なう。
入力部4は、カーソルキー、数字入力キーおよび各種操作キーなどを備え、押下されたキーの押下信号をCPU1に出力を行なう。
表示部5は、イメージ入力部3により入力されたイメージデータやマウス6または入力部4により入力されたデータの表示を行なう。この実施形態は、表示された入力メニュ−画面を使用して、マウス6により入力操作が行われる。
プリンタ7は、CPU1の印刷処理によって制御される例えばページプリンタである。
記憶装置8は、システムの外部記憶装置であり、本実施形態に関するイメージデータや定義情報ファイルを格納する。
図2は、前述のハードウェアシステム構成における本実施形態に係わる機能ブロック図である。図2に示すように、制御部21およびOCR制御部22とそれらの周辺構成要素23乃至32からなる。
制御部21は、CPU1がプログラム記憶部23から選択的に読み出される業務アプリケーション・プログラムに従って実行する帳票定義管理部211と画面処理部212とで構成される。プログラム記憶部23は様々な業務処理の実行を行なうアプリケーション・プログラムを業務処理に対応して記憶する。
帳票定義管理部211は、図3に示すように、帳票画面定義情報、帳票フォーム定義情報を含むデータ処理定義情報に含まれる各属性項目を定義する定義情報の作成を行なう。この帳票定義情報の入力処理は表示部24に表示されるプロパティシートの各属性項目(図示せず)に従って操作される入力部25からの指令に基づいて実行される。
この帳票定義情報は、図4に示すように、帳票の名称、用紙、余白などの帳票全体に係わる属性情報を示す全体定義項目、帳票共通項目からなるヘッダ部、繰り返し項目からなる明細部を定義する属性情報からなる。また、明細部定義情報は明細項目の他に明細部の大きさ、位置を示す明細部領域、繰り返し行を示す明細行数からなる明細部定義を含んでいる。
定義情報ファイル記憶部26は、制御部21により作成された画面制御定義情報、帳票フォーム定義情報を含むデータ処理定義情報からなる定義ファイルの記憶を行なう。
画面処理部212は、帳票定義情報管理部211により作成されて定義情報ファイル記憶部25に格納された定義ファイルの画面制御定義情報と帳票フォーム定義情報とに基づいて表示部27の画面の表示処理を実行する。
一方、OCR制御部22は、帳票データ取り込みの実行を行なうアプリケーション・プログラムに従った制御部21からのデータ取得要求により帳票のOCR読取処理を実行するイメージ入力処理部221と処理結果を制御部21に渡す認識データ処理部222とで構成される。
イメージ入力処理部221は、イメージ入力部27から入力されるイメージデータをイメージデータ記憶部28に記憶を行ない、そのイメージデータから、定義情報ファイル26の帳票定義情報に基づいて読取対象のフィールド内の文字認識などの各種処理を認識辞書29を参照して行なう。そして、イメージ入力処理部221はイメージの文字認識結果を認識結果ファイル30に記憶を行なう。
認識辞書29は文字単語の特徴を見出し語とし、それに対応する文字コードを1対とする多数の単語を収録されているものである。
認識結果ファイル30は、定義ファイル記憶部26に記憶された帳票定義情報に従って、イメージ入力処理部221から認識結果の文字コードが出力される毎に、図5に示すような帳票の対応する伝票項目領域に従って、図7に示すように、置き換えられるセル領域に格納可能な表形式のセル構造を有している。認識結果ファイル30は記憶装置8に収納される記憶媒体81内の記憶領域に相当する。
認識データ処理部222は、認識結果ファイル30の認識結果から明細繰り返し項目に対応するヘッダ項目を付加させたデータレコードを明細行数に相当する回数分繰り返し形成して展開ファイル31に格納を行なう。そして、認識結果のレコード配列が終わると展開ファイル31の内容であるデータレコードを制御部21に渡す。
そして、制御部21は、渡されたデータレコードを現在実行中の業務アプリケーション・プログラムでから指定されるデータファイル32に格納を行なう。
本実施形態の帳票データ入力システムは以上のように構成されている。
以下、本実施の形態の動作を説明する。
図6は本実施形態のOCR帳票データ入力システムで行われる帳票入力処理の処理内容を示すフローチャートである。
なお、本実施形態の帳票データ入力システムは、帳票データ入力システムの起動がなされ、表示部24の画面に表示される業務項目メニュー選択ウインドウ上で業務処理対象の業務項目の選択がマスス6操作などにより行われると、該選択された業務項目に対応する業務アプリーション・プログラムを記憶媒体81からRAM2内の所定領域であるアプリケーション・プログラム記憶部23内に読み込まれるものとする。
以下の説明においては、処理対象の業務としてOCR売上伝票入力業務が選択されて対応する業務アプリケーション・プログラムがプログラム記憶部23内に読み込みているものとする。
まず、S101では、プログラム記憶部23内の売上伝票入力処理アプリケーション・プログラムが指令したOCR帳票入力処理要求を受け付けた制御部21は、そのOCR帳票入力要求をOCR制御部22に渡し、イメージ入力処理部221によってOCR帳票入力処理が開始され、イメージ入力部27のイメージスキャナ(図示せず)から伝票のイメージが入力されて、そのイメージデータがイメージデータ記憶部28に格納される。図5に示す伝票は、イメージスキャナによってイメージが取り込まれる伝票の例を示す。この伝票は売上伝票であり、伝票名、得意先コード、および得意先名などの伝票共通項目からなるヘッダ部と、商品コード、商品名、数量、単価、および金額などの繰り返し項目からなる明細部と、明細部の各金額の合計などの伝票共通項目である集計部から構成される。
S102では、イメージデータ記憶部28に格納されている帳票イメージから定義情報ファイル26内のOCR帳票定義情報の項目範囲にて示されるフィールド領域の抽出をイメージ入力処理部221によって行われる。
S103では、抽出されたフィールド領域内のイメージデータの文字認識を文字の特徴を見出しとした認識辞書29を用いてイメージ入力処理部221によって行われる。
上述したS102とS103の各処理は定義情報ファイル26内に格納されているOCR帳票定義情報のうち現行の業務処理対象である帳票定義情報に基づいて行われる。ここでは帳票定義情報は売上伝票に対するものである。なお、帳票定義情報は帳票設計者と会話形式にて制御部21内の帳票定義情報管理部211によって作成されてファイル26に予め登録されている。
S104では、前述したS103の文字認識処理によってフィールド内の文字が認識されると、座標およびサイズによるフィールド位置情報に対応させて、図7に示すように表形式のセル領域に置き換えて、そして各セル領域に対応する認識結果データを図8に示す構造を有する認識結果ファイル30に登録をイメージ入力処理部221によって行われる。この場合、セルA1、セルB1がヘッダ部であり、セルC1〜G1、セルC2〜G2、セルC3〜G3、およびセルC4〜G4が明細部であり、そしてセルH1が集計部である。
S105では、前述したS103の文字認識処理がフィールド領域の全てに対して行われたか否かが判別される。そして、結果がYesならばS106に処理が進み、NoならばS103に処理が戻って上述した処理が繰り返される。
S106では、上述したS104の認識結果データ登録処理によって認識結果ファイル30に登録された認識結果が認識データ管理部222によって制御部21に渡される。そして、制御部21は、認識結果ファイル30の認識結果を項目データとして受け取ると、それら項目データの夫々を、定義情報ファイル26内の売上伝票に対応する画面制御定義情報に基づいた伝票に組み入れたイメージを、画面処理部212によって表示部24に表示させる。
S107では、定義情報ファイル26に登録されている読込対象のOCR帳票、本実施態様では売上伝票に明細領域があるか否かの判別を、該売上伝票に対応する帳票定義情報内の明細行数の有無によって、認識データ処理部222が行なう。その判別結果がYesならばS108の処理に進み、NoならばS112の処理に進む。
S108では、伝票の明細行数に応じた連続する領域を展開ファイル31に確保し、それら確保した夫々のデータレコードを伝票項目に対応するフィールドに分割するデータレコード作成処理が行われる。このデータレコード作成処理の詳細は後述する。
S109では、前述したS108のレコード作成処理によって分割されたデータ構造体であるレコードの各フィールドにそれに対応する認識結果の登録するデータ登録処理を行なう。このデータ登録処理の詳細は後述する。
ところでS107の判別処理の結果がNoであるときには、S110においては認識結果を項目フィールドが連続する単一のレコードの形成を行った後に、展開ファイル31にそのレコードを登録する1レコード・エントリ処理が行なわれる。
このS110の処理を終えた後はS111の処理に進む。
S111では、上述したS109とS110の処理によって認識結果がレコード形式で展開ファイル31に登録された後、アプリケーションからの帳票データ取得要求が制御部21から出されたか否かがOCR制御部22内の認識データ管理部222によって判別される。その結果がYesであればS112の処理に進み、NoであればYesになるまでS111の判別処理を繰り返す。
S112では、展開ファイル31内に登録された認識データをデータベースレコードとして制御部21のデータベースに格納して、本処理を終了する。
以上までの処理が帳票データ入力処理である。
次に、図6に示した帳票データ入力処理におけるS108の処理において行なわれる伝票レコード生成処理の詳細について説明する。この処理は、OCR帳票フォームに繰り返し項目からなる明細領域が存在する場合には、予め作成された該帳票の帳票定義情報上の明細行数に応じて確保したレコードそれぞれに、ヘッダ部/明細部/集計部それぞれに含まれる項目に対する項目定義情報を基に項目フィールドの割り当てを行なうものである。
図9は伝票レコード生成処理の処理内容を示すフローチャートである。
まず、S201では、図4に示されるような、定義情報ファイル26に格納されている帳票定義情報から明細部項目の明細定義の明細行数Nを取得する。
S202では、認識データ管理部222において変数Rに初期値である「1」が代人される。
S203では、認識データ管理部222において定義情報ファイル26に格納されている読み取り対象の帳票のヘッダ部/明細部/集計部における各項目定義から項目範囲の項目の大きさ(項目サイズ長)を全て読み出してその総和の算出を行なう。その算出された総和がレコード長である。
S204では、前述したS203の処理によって算出されたレコード長に相当するメモリ領域をレコード番号Rとして展開ファイル31に確保される。
S205では、変数Rの現在の値に「1」が加算され、その結果が改めて変数Rに代入される。
S206では、変数Rの現在の値が、前述したS201の処理によって取得されている明細行数Lの値よりも大きいか否かが判別され、この判別結果がYesとなるまで上述したS203乃至S205の処理が繰り返される。このS203乃至S205の処理によって、図10(a)に示されるように、展開ファイル31には明細行数に応じて配列されたデータレコード領域が確保される。
S207では、認識データ管理部222において変数Rに初期値である「1」が代人される。ここでの変数Rは、上述したS203乃至S205の処理によって、展開ファイル31に確保されたレコード番号を示すポインタである。
S208では、認識データ管理部222において定義情報ファイル26から読み取り対象の帳票のヘッダ部情報に含まれる項目定義のフィールド長を基に、変数Rで示されるレコード番号に該当するレコードに項目を割り当てる。
S209とS210では、上述したS208の項目割当て処理を明細部、集計部に含まれる項目を同じレコードに割当てを行なう。
S211では、上述したS208乃至S210の処理によって、レコード番号Rで示されるレコードにヘッダ部、明細部、集計部に含まれる項目が割り当てられると、変数Rの現在の値に「1」が加算され、その結果が改めて変数Rに代入される。
S212では、変数Rの現在の値が、前述したS201の処理によって取得されている明細行数Lの値よりも大きいか否かが判別され、この判別結果がYesとなるまで上述したS208乃至S211の処理が繰り返される。このS208乃至S211の処理によって、図10(b)に示されるように、展開ファイル31には読み取り対象の帳票の明細行数、項目サイズに応じた少なくとも1つのデータレコードが生成されるようになる。
S212の判別結果がYesとなると、この帳票レコード生成処理は終了して元の処理へ戻る。
以上までの処理が帳票レコード生成処理である。
次に、図6に示した帳票データ入力処理におけるS109の処理において行なわれるデータ登録処理の詳細について説明する。この処理は、図10(b)に示されるような構造を持つ展開ファイル31に配列されたデータレコードに認識結果ファイル30のデータの登録を行なう処理である。
図11はデータ登録処理の処理内容を示すフローチャートである。
まず、S301において、認識データ管理部222において変数Nに初期値である「1」が代人される。
S302では、図12(a)に示されるように、表形式の構造を持つ認識結果ファイル30内の変数Nの値で特定される行に含まれ、そして、定義情報ファイル26に格納されている項目定義情報に基づいて特定される明細項目に該当するセル領域にデータが格納されているか否かの判別が行われる。その判別結果がYesならばS303の処理に進む。
S303では、定義情報ファイル26の帳票の共通項目を示すヘッダ部に含まれる項目定義それぞれから位置情報を取得し、それら位置情報に対応する認識結果ファイル30のセル領域内の値を展開ファイルにおけるN番目のレコードの対応するヘッダ項目に登録が行われる。
S304では、定義情報ファイル26の繰り返し項目を示す明細部に含まれる項目定義それぞれから位置情報を取得し、それら位置情報に対応する認識結果ファイル30のセル領域内の値を展開ファイルにおけるN番目のレコードの対応する明細項目に登録が行われる。
S305では、定義情報ファイル26の共通項目を示す集計部に含まれる項目定義それぞれから位置情報を取得し、それら位置情報に対応する認識結果ファイル30のセル領域内の値を展開ファイルにおけるN番目のレコードの対応する集計項目に登録が行われる。
S306では、上述したS302乃至S305の処理によって、レコード番号Rで示されるレコードのヘッダ部、明細部、集計部に含まれる項目に認識結果ファイル30からの対応する値が設定登録されると、変数Nの現在の値に「1」が加算され、その結果が改めて変数Nに代入される。
S307では、変数Nの現在の値が、前述したS201の処理によって取得されている明細行数Lの値よりも大きいか否かが判別され、この判別結果がYesとなるまで上述したS302乃至S306の処理が繰り返される。このS302乃至S306の処理によって、図12(b)に示されるように、展開ファイル31に配列された各レコード間のヘッダ部と集計部の項目の夫々には同じ値が設定登録され、明細部の項目の夫々には繰り返される値が設定登録された各データレコードが生成される。
このS307の判別結果がYesになると、このデータ登録処理が終了し、元の処理へ戻る。
以上までの処理がデータ登録処理である。
以上までに説明した図6、図9、および図11の処理を行なうことによりOCRによって読み取られた読み取り対象の項目の値をデータレコード形式に配列することが実現できる。
なお、今までに説明した伝票処理は1取引単位が単葉の伝票処理における処理であったが、1取引単位における同一帳票定義の連続する複数葉の伝票処理を行なうときであっても、帳票データ入力システムは、定義情報ファイル26の明細部における明細行数情報として複数枚に渡る伝票明細行の総計の値を設定しておくだけで、図6、図9、および図11の処理を行なえばよい。
また、前述した図6、図9、および図11に示した各種の処理を標準的な構成を有するコンピュータに行わせるための制御プログラムを作成し、その制御プログラムに読み込ませて実行させることにより、本実施の態様におけるOCR帳票データ入力処理システムに相当する機能をそのようなコンピュータに行わせることも可能である。また、このような制御プログラムをコンピュータで読み取り可能な記憶媒体に記録させ、そのプログラムを記録媒体からコンピュータに読み出させて実行させることによって本実施の形態におけるOCR帳票データ入力システムに相当する機能をこのようなコンピュータに行わせることも可能である。
上述した記録媒体としては、例えば、コンピュータに内蔵若しくは外付けの付属装置として備えられるROMやハードディスク装置などの記録装置、あるいはフレキシブルディスク、MO(光磁気ディスク)、CD―RON、DVD―ROMなどといった携帯可能記録媒体などが利用できる。また、記録媒体はネットワークを介してコンピュータと接続される、プログラムサーバとして機能するコンピュータが備えている記録媒体であってもよい。この場合には、制御プログラムを表現するデータ信号で搬送波を変調して得られる伝送信号を、プログラムサーバから伝送媒体であるネットワークを通じて伝送するようにし、コンピュータでは受信した伝送信号を復調して制御プログラムを再生することで当該制御プログラムを実行できるようになる。
本発明を実施するOCR帳票データ入力処理システムのハードウェア構成を示すブロック図である。 本実施を実施するOCR帳票データ入力処理システムの機能ブロック図を示す図である。 定義情報ファイルの構造を示す図である。 定義情報ファイル内の帳票フォーム定義情報の内容を示す図である。 本実施の形態において処理される伝票構成の一例を示す図である。 帳票データ入力処理の処理内容を示すフローチャートである。 本実施の形態において処理される帳票の読み取りフィールドと入力先のセル番号との対応を示す図である。 認識結果ファイルの構造を示す図である。 帳票レコード生成処理の処理内容を示すフローチャートである。 展開ファイルにおけるレコード構造を示す図であり、(a)は明細行数に応じて確保されたレコード領域を示し、(b)は項目が割り当てられたレコード構成を示す。 データ登録処理の処理内容を示すフローチャートである。 認識結果ファイル項目と展開ファイル項目との対応を示す図であり、(a)は認識結果ファイルのセルに認識結果のデータ値が入力された状態を示し、(b)は展開ファイルの項目に対応する認識結果ファイルのデータ値が入力された状態を示す。
符号の説明
1 CPU
2 RAM
3 イメージ読取装置
4 入力装置
5 表示装置
6 マウス
7 プリンタ
8 記憶装置
81 記憶媒体
21 制御部
211 帳票定義情報管理部
212 画面処理部
22 OCR制御部
221 イメージ入力処理部
222 認識データ処理部
23 アプリケーション・プログラム記憶部
24 表示部
25 入力部
26 定義情報ファイル
27 イメージ入力部
28 イメージデータ記憶部
29 認識辞書
30 認識結果ファイル
31 展開ファイル
32 データファイル

Claims (4)

  1. 少なくともヘッダ部と明細部を有する帳票を光学的に読み取って帳票イメージを生成するイメージ読取手段と、
    該帳票のヘッダ部、明細部に含まれる項目それぞれの定義情報を記憶している帳票定義情報記憶手段と、
    前記イメージ読取手段によって生成された帳票イメージから、前記定義情報記憶手段に記憶されている項目定義情報に基づいて、読み取り対象のフィールド領域内のイメージを文字認識する文字認識手段と、
    前記文字認識手段による認識結果をデータベースにて利用可能のデータレコード形式のレコードに項目データとして形成するレコード形成手段と、
    を備えることを特徴とする帳票データ入力装置。
  2. 前記レコード形成手段は、
    前記帳票定義記憶手段に記憶された明細部項目の定義情報として示される明細行数に相当する数分のデータレコード領域を確保するレコード領域確保手段と、
    前記レコード領域確保手段によって確保された各データレコード領域に、前記帳票定義記憶手段に記憶された各項目定義に基づいた項目を夫々に割り当てるレコード項目割当手段と、
    前記レコード項目割当手段によってヘッダ部項目として割り当てられた各レコード項目には帳票共通の認識結果を入力し、明細部として割り当てられた各レコード項目には明細行の夫々に対応する認識結果を入力させるデータ入力手段と、
    を備えることを特徴とする請求項1に記載の帳票データ入力装置。
  3. 前記レコード形成手段によって形成されたレコードをデータベース構築機能を有するアプリケーションソフトからの要求に応じて該アプリケーションソフトにおけるデータ格納空間に送出する送出手段を、さらに備える請求項1に記載の帳票データ入力装置。
  4. コンピュータに、
    少なくともヘッダ部と明細部を有する帳票を光学的に読み取って帳票イメージを生成する機能と、
    該帳票のヘッダ部、明細部に含まれる項目それぞれの定義情報を記憶する機能と、
    前記生成された帳票イメージから、前記記憶されている項目定義情報に基づいて、読み取り対象のフィールド領域内のイメージを文字認識する機能と、
    前記文字認識の認識結果をデータベースにて利用可能のデータレコード形式のレコードに項目データとして形成する機能と、
    を実現させるためのプログラム。
JP2003332733A 2003-09-25 2003-09-25 帳票データ入力装置およびプログラム Expired - Fee Related JP4396205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003332733A JP4396205B2 (ja) 2003-09-25 2003-09-25 帳票データ入力装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003332733A JP4396205B2 (ja) 2003-09-25 2003-09-25 帳票データ入力装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2005100079A true JP2005100079A (ja) 2005-04-14
JP4396205B2 JP4396205B2 (ja) 2010-01-13

Family

ID=34460950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003332733A Expired - Fee Related JP4396205B2 (ja) 2003-09-25 2003-09-25 帳票データ入力装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4396205B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309611A (ja) * 2005-04-28 2006-11-09 Canon Marketing Japan Inc 解析装置、プログラム及び記録媒体
KR100707943B1 (ko) * 2005-04-27 2007-04-18 최철규 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템
JP2008027094A (ja) * 2006-07-20 2008-02-07 Mitsubishi Electric Corp 設備仕様入力装置
JP2009282745A (ja) * 2008-05-22 2009-12-03 Internatl Business Mach Corp <Ibm> ウェブページの入力項目への入力を支援する方法、コンピュータ・プログラム及び端末
JP2012226402A (ja) * 2011-04-15 2012-11-15 Fujitsu Marketing Ltd レシートデータ認識装置およびそのプログラム
US20140369602A1 (en) * 2013-06-14 2014-12-18 Lexmark International Technology S.A. Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data
JP2021086479A (ja) * 2019-11-29 2021-06-03 株式会社リコー 情報処理システム、情報処理方法及びプログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100707943B1 (ko) * 2005-04-27 2007-04-18 최철규 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템
JP4646300B2 (ja) * 2005-04-28 2011-03-09 キヤノンマーケティングジャパン株式会社 繰り返し行決定装置、繰り返し行決定方法、プログラム及び記録媒体
JP2006309611A (ja) * 2005-04-28 2006-11-09 Canon Marketing Japan Inc 解析装置、プログラム及び記録媒体
JP2008027094A (ja) * 2006-07-20 2008-02-07 Mitsubishi Electric Corp 設備仕様入力装置
US10095675B2 (en) 2008-05-22 2018-10-09 International Business Machines Corporation Inputting data to a web page
JP2009282745A (ja) * 2008-05-22 2009-12-03 Internatl Business Mach Corp <Ibm> ウェブページの入力項目への入力を支援する方法、コンピュータ・プログラム及び端末
US11222169B2 (en) 2008-05-22 2022-01-11 International Business Machines Corporation Inputting data to a web page
JP2012226402A (ja) * 2011-04-15 2012-11-15 Fujitsu Marketing Ltd レシートデータ認識装置およびそのプログラム
US20140369602A1 (en) * 2013-06-14 2014-12-18 Lexmark International Technology S.A. Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data
US9251413B2 (en) * 2013-06-14 2016-02-02 Lexmark International Technology, SA Methods for automatic structured extraction of data in OCR documents having tabular data
US9785830B2 (en) * 2013-06-14 2017-10-10 Kofax International Switzerland Sarl Methods for automatic structured extraction of data in OCR documents having tabular data
JP2021086479A (ja) * 2019-11-29 2021-06-03 株式会社リコー 情報処理システム、情報処理方法及びプログラム
JP7456131B2 (ja) 2019-11-29 2024-03-27 株式会社リコー 情報処理システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP4396205B2 (ja) 2010-01-13

Similar Documents

Publication Publication Date Title
US8547561B2 (en) Information processing apparatus, printing processing method, and program therefor
US8386923B2 (en) Document generation apparatus, method, and storage medium
JP4796830B2 (ja) 情報処理方法及び情報処理装置
CN101739224A (zh) 略图创建方法以及图像形成装置
CN102129357B (zh) 信息处理装置及信息处理装置控制方法
CN101135957A (zh) 计算机可读介质、指示装置、图像处理方法和图像处理系统
US5887088A (en) Inputting device and inputting method for information processing system
US6600498B1 (en) Method, means, and device for acquiring user input by a computer
JP4396205B2 (ja) 帳票データ入力装置およびプログラム
US7580149B2 (en) Method and system for identification of repeat print jobs using object level hash tables
JP2012123672A (ja) 情報処理装置、情報処理方法及びプログラム
JP2019023793A (ja) 仕訳情報処理装置、仕訳情報処理方法、およびプログラム
JP7375325B2 (ja) 管理装置、端末装置、及び印刷システム
JP2007331312A (ja) 印刷装置、印刷制御方法、プログラム、記憶媒体
JP6190549B1 (ja) 文書処理システム
JP2001256256A (ja) 電子文書検索装置および電子文書検索方法
JP2002236677A (ja) データ提示方法、情報処理システム、コンピュータ読み取り可能な記録媒体、及びプログラム
JPH07114610A (ja) 情報処理システムの入力装置及び情報処理システムの入力方法
JP2007128325A (ja) 印刷制御装置およびその手段
JP7323138B2 (ja) 技術マップ出力装置、技術マップ出力方法、およびプログラム
JP2008118489A (ja) ファクシミリ配信システム及びファクシミリ装置
JP2024084452A (ja) 情報処理装置とその制御方法、及びプログラム
JP2010009130A (ja) ネットワークocrシステムおよびクライアント装置
JPH08138007A (ja) 情報の記録・読み取り方法及び文書情報処理装置
CN114970483A (zh) 信息生成系统、工作流系统以及记录介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees