JP2009122722A - 帳票認識プログラム、帳票認識装置および帳票認識方法 - Google Patents

帳票認識プログラム、帳票認識装置および帳票認識方法 Download PDF

Info

Publication number
JP2009122722A
JP2009122722A JP2007292618A JP2007292618A JP2009122722A JP 2009122722 A JP2009122722 A JP 2009122722A JP 2007292618 A JP2007292618 A JP 2007292618A JP 2007292618 A JP2007292618 A JP 2007292618A JP 2009122722 A JP2009122722 A JP 2009122722A
Authority
JP
Japan
Prior art keywords
character string
logical
form data
logical structure
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007292618A
Other languages
English (en)
Other versions
JP4998219B2 (ja
Inventor
Hiroaki Takebe
浩明 武部
Noriaki Ozawa
憲秋 小澤
Akihiro Minagawa
明洋 皆川
Yusaku Fujii
勇作 藤井
Yoshinobu Hotta
悦伸 堀田
Hiroshi Tanaka
宏 田中
Katsuto Fujimoto
克仁 藤本
Junichi Hirai
淳一 平井
Seiji Takahashi
清治 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007292618A priority Critical patent/JP4998219B2/ja
Priority to US12/265,753 priority patent/US8015203B2/en
Priority to CN2008101741091A priority patent/CN101430758B/zh
Publication of JP2009122722A publication Critical patent/JP2009122722A/ja
Application granted granted Critical
Publication of JP4998219B2 publication Critical patent/JP4998219B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)

Abstract

【課題】認識した帳票データの訂正作業において、訂正作業者の負担を軽減することを課題とする。
【解決手段】この帳票認識装置は、各種の帳票に対応付けて、当該帳票を構成する複数の文字列それぞれを示す論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、入力された帳票を認識し、論理構造雛形記憶部に記憶される論理要素と一致する文字列と、論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせとを抽出して格納し、格納された帳票データと、認識された帳票画像とをそれぞれ表示部に出力し、表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を特定して、特定した文字列を他の文字列と区別して表示部に表示出力するとともに、帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する。
【選択図】 図1

Description

この発明は、各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識する帳票認識プログラム、帳票認識装置および帳票認識方法に関する。
従来より、帳票のフォームごとに抽出したいデータの位置情報を記したレイアウト定義体を用意し、帳票のフォームを識別したあとにレイアウト定義体を使ってタグ付きデータをOCRで認識する帳票のデータ入力システムがある。具体的には、タグ名と帳票上の矩形領域を表す2点の座標の組が複数個記されており、例えば、データ「富士通太郎」に対するタグは「本人氏名」である(図3参照)。
この帳票のデータ入力システムは、入力された帳票画像とレイアウト定義体を用いて認識した認識結果とを並べて表示し、ユーザは、帳票画像と認識結果を見比べて認識結果が正しいかどうかを判断する。そして、ユーザは、認識結果が誤っていれば、認識結果をいったん削除し、正しい値をキーボード等で入力する。
ところが、このような手法では、帳票画像と認識結果を見比べて認識結果が正しいかどうかを判断するため、読み込んだデータの訂正作業において、ユーザの負担が大きく、さらには、人為的なミスを防ぐことができない。そこで、このようなデータ入力システムにおいて、読み込んだ帳票にエラーがある場合に、データ訂正作業の負担を軽減する様々な技術が開示されている。
例えば、特許文献1(特開平7−93469号公報)では、帳票認識処理の際に発生したエラー箇所に対応する帳票のレイアウトイメージを自動で生成するデータ入力システムが開示されている。具体的には、データ入力システムは、読取対象の帳票のレイアウトを指定するレイアウト情報に従って、読み込んだ帳票の帳票イメージのレイアウトを解析し、このレイアウト解析によって決定された各読取対象の文字認識を行う。そして、データ入力システムは、この文字認識結果データとレイアウト情報とからレイアウト解析エラーを検出し、そのエラー発生箇所に対応する帳票イメージを画面表示する。
特開平7−93469号公報
しかしながら、上記した従来の技術では、データ訂正作業の負担を必ずしも軽減することができず、却って負担が大きくなる場合があるという課題があった。
具体的には、エラー発生箇所のみに対応する帳票イメージが表示されるため、この帳票イメージが拡大されて表示されている場合、エラー箇所が帳票上のどこにある文字列なのかがわからないことがあり、特に、帳票内で同じ文字列の見出しが存在するときは、それらの文字列を区別しなければならない。その結果、ユーザは周辺の画像を確認できるようにいったん拡大されたイメージを縮小表示しなければならならず、却ってユーザの負担が大きくなる。
また、従来の技術では、帳票を読み込んだ際のエラーをユーザに表示するだけで、表示したエラーが正しく修正されたか否かをユーザに表示することができない。つまり、エラー発生箇所のみに対応する帳票イメージに基づいて、当該エラー箇所をユーザが手動で修正したとしても、当該修正内容が必ずしも正しいとは限らず、その修正内容をユーザ自身が目視で確認する必要があるため、データ訂正作業の負担を軽減することができるとは言い難い。
そこで、この発明は、上述した従来技術の課題を解決するためになされたものであり、認識した帳票データの訂正作業において、訂正作業者の負担を軽減することが可能である帳票認識プログラム、帳票認識装置および帳票認識方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本装置は、各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することをコンピュータに実行させる帳票認識プログラムであって、前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納手順と、前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する。
本発明によれば、認識した帳票データの訂正作業において、訂正作業者の負担を軽減することが可能である。また、ユーザが認識結果を修正するたびにデータ文字列候補の順位を変え、修正結果と矛盾するところがあればユーザに注意を喚起することができる結果、ユーザは、修正を正確かつ迅速に行うことが可能である。
以下に添付図面を参照して、この発明に係る帳票認識プログラム、帳票認識装置および帳票認識方法の実施例を詳細に説明する。なお、以下では、本実施例に係る帳票認識装置の概要および特徴、帳票認識装置の構成および処理の流れを順に説明し、最後に本実施例に対する種々の変形例を説明する。
[帳票認識装置の概要および特徴]
まず最初に、図1を用いて、本実施例に係る帳票認識装置の概要および特徴を説明する。図1は、実施例1に係る帳票認識装置の全体構成を示すシステム構成図である。
図1に示す帳票認識装置は、各種の帳票(例えば、決算帳票、会計帳票、人事帳票など)における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形DBと、活字の文書の画像をコンピュータが編集できる形式(文字コードの列)に変換するOCR(Optical Character Recognition)とを備える。
論理構造雛形DBに記憶される情報の例を具体的に説明すると、論理構造雛形DBは、帳票の種類に応じて、論理要素と論理要素間の関係、さらに論理要素には文字列を記憶する。ここで記憶される論理要素は、見出しとデータの属性を持ち、見出しとデータの対応関係や、見出し間の階層関係などがツリー構造で表現される(図1の(a)参照)。また、論理要素には帳票上で表現される文字列が登録される。図1の(a)に示される「A」と「B」とは論理要素の見出しであり、「C」〜「H」は論理要素のデータである。
そして、この帳票認識装置は、OCRにより読み込んだ帳票画像とイメージスキャンした元々の帳票画像とを並べてディスプレイなどの表示部に表示出力して、ユーザに読み込んだデータが正しいか否かを確認させ、正しい場合には、当該帳票データを取り込んで各種処理を実行する。なお、本実施例で対象とする帳票とは、OCRで読み込まれる紙媒体だけでなく、ネットワークや記憶媒体などから受け付ける電子ファイル(電子データ)などについても、同様の処理を行うことができる。
このような構成において、実施例1に係る帳票認識装置は、上記したように、各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形DBを備え、論理構造雛形DBに記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することを概要とするものであり、特に、認識した帳票データの訂正作業において、訂正作業者の負担を軽減することが可能である点に主たる特徴がある。
この主たる特徴を具体的に説明すると、帳票認識装置は、帳票上の文字列と、当該帳票上の文字列と論理構造雛形DBに記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データDBを備える。具体的に例を挙げると、帳票データDBは、入力された帳票上の文字列を、論理構造雛形DBに記憶される論理要素間の関係に対応付けた情報を記憶する。
そして、帳票認識装置は、入力された帳票を認識し、論理構造雛形DBに記憶される論理要素と一致する文字列を抽出して帳票データDBに格納するとともに、論理構造雛形DBに記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と論理構造雛形DBに記憶される論理要素間の関係との対応付けを帳票データDBに格納する(図1の(1)〜(3)参照)。
上記した例で具体的に説明すると、帳票認識装置は、図1の(b)に示すようなレイアウト要素の見出し文字列「A1」、「B1」と、レイアウト要素のデータ文字列「C1」〜「H1」とから構成される入力帳票を受け付けた場合、入力帳票の見出し文字列「A1」、「B1」とデータ文字列「C1」〜「H1」とを抽出して帳票データDBに格納する。続いて、帳票認識装置は、論理構造雛形DBに記憶される論理要素の見出しおよびデータを満たす帳票上の文字列の組み合わせを抽出して、図1の(c)に示すように、帳票上の文字列と論理構造雛形DBに記憶される論理要素間の関係(図1の(a)参照)との対応付けを帳票データDBに格納する。
そして、帳票認識装置は、帳票データDBに記憶される帳票データと、認識された帳票画像とをそれぞれ表示部に出力する(図1の(4)と(5)参照)。上記した例で具体的に説明すると、ここでは、帳票認識装置は、図1の(d)に示すように、帳票データDBに記憶される帳票データと、認識された帳票画像とをそれぞれ表示部に出力したとする。
その後、帳票認識装置は、表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を帳票データDBから特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域(画像)を表示部に表示出力する(図1の(6)〜(8)参照)。
上記した例で具体的に説明すると、帳票認識装置は、図1の(d)の画面において、ユーザにより認識結果の「F1」の場所がクリックされた場合、選択された文字列「F1」に関係する見出し「A1」および見出しのデータ「F1」を帳票データDBから特定する。そして、帳票認識装置は、図1の(e)に示すように、特定した「A1、F1」を他の文字列「B1」と区別した帳票データを表示部に表示出力するとともに、帳票画像のうち当該特定された帳票データの「A1、F1」を含む最低限の画像を表示部に表示出力する。
このように、実施例1に係る帳票認識装置は、ユーザが確認または修正したい文字列を選択した場合に、当該選択された文字列に関係する文字列が含まれる場所のみを特定して表示することができる結果、上記した主たる特徴のごとく、認識した帳票データの訂正作業において、訂正作業者の負担を軽減することが可能である。
[帳票認識装置の構成]
次に、図2を用いて、図1に示した帳票認識装置の構成を説明する。図2は、実施例1に係る帳票認識装置の構成を示すブロック図である。図2に示すように、この帳票認識装置10は、入力受付部11と、表示部12と、記憶部20と、制御部30とから構成される。
入力受付部11は、OCRなどを備え、各種の帳票を受け付ける。具体的に例を挙げると、入力受付部11は、紙媒体の帳票画像を受け付けてOCRで読み込んだり、ファイル形式の帳票画像データをネットワークや各種記憶媒体などを受け付けたりして、その受け付けたデータを後述するインターフェース制御部31に出力する。
表示部12は、モニタ(若しくはディスプレイ、タッチパネル)やスピーカを備えて構成され、各種の情報を出力する。例えば、表示部12は、後述するインターフェース制御部31や論理構造解析部35の指示制御により、図3に示す入力受付部11により受け付けられた帳票データなどを表示出力する。なお、図3は、表示される帳票画像と帳票データとを示す図である。
記憶部20は、制御部30による各種処理に必要なデータおよびプログラムを格納するとともに、特に本発明に密接に関連するものとしては、レイアウト情報DB21と、論理構造雛形DB22と、帳票データDB23とを備える。
レイアウト情報DB21は、文字コードと座標からなる文字情報と、罫線・セルの座標などから構成されるレイアウト情報を記憶する。具体的に例を挙げれば、レイアウト情報DB21は、図4に示すように、文字情報、罫線情報、セル情報から構成されるレイアウト情報を記憶する。ここで、文字情報には、文字数と各文字の情報が記され、各文字の情報には、文字コードと座標、および、その文字が包含されているセルへのポインタが記され、罫線情報には、罫線数と各罫線情報が記される。また、各罫線情報には、実線・点線などの罫線種別と座標、および、その罫線が構成するセルへのポインタが記されており、セル情報にはセル数と各セルの情報が記される。各セルの情報には座標と、そのセルが包含する文字へのポインタとそのセルを構成する罫線へのポインタが記される。なお、図4は、レイアウト情報DBに記憶される情報の例を示す図である。
論理構造雛形DB22は、各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する。具体的に例を挙げれば、論理構造雛形DB22は、図5に示すように、見出しとデータの属性を持ち、帳票上で表現される複数の文字列からなる論理要素と、見出しとデータの対応関係や、見出し間の階層関係などをツリー構造で表現した論理構造を記憶する。
また、図5に示した各論理要素は、図6に示すデータ構造を持つ。「種別」は、見出しかデータを表し、「代表文字列」は、例えば、(本人)、(氏名)などである。また、論理要素IDは、論理構造雛形である論理構造において一意に割り当てられたIDであり、表現文字列は、登録された帳票上で表現される文字列を表し、親は、論理構造雛形の論理構造を表すツリー構造における上位の論理要素であり、子は、下位の論理要素である。例えば、論理要素「本人」を例にして説明すると、論理構造雛形DB22は、論理要素「本人」のデータ構造「種別、代表文字列、論理要素ID、表現文字列、表現文字列の個数、親へのポインタ、子へのポインタ、子の個数」を「見出し、本人、1、本人・ご本人・御本人、3、00、01・02・03・04、4」などと記憶する。なお、図5は、論理構造雛形DBに記憶される論理構造を示す図であり、図6は、論理構造雛形DBに記憶される論理構造を構成する各論理要素のデータ構造を示す図である。
帳票データDB23は、帳票上の文字列と、当該帳票上の文字列と論理構造雛形DB22に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する。具体的に例を挙げれば、帳票データDB23は、論理構造雛形DB22に記憶されるツリー構造の論理構造(図5参照)と帳票上の文字列とを対応付けを行い、図7に示すような論理構造対応付け結果22aを記憶する。また、帳票データDB23は、対応付けられた各論理要素に対して図8〜図11のデータ構造を記憶する。
それぞれについて具体的に説明する。まず、帳票データDB23は、帳票上のレイアウト要素(文字列)と、図5に示した論理構造における各論理要素との対応結果として、図8に示す論理結果データ23bを記憶する。この論理結果データ23bは、論理要素に一意に割り当てられた「論理要素ID」と、当該論理要素に対応付けられた帳票上のレイアウト要素を特定する「領域候補へのポインタ」と、当該論理要素に対応付けられた帳票上の領域候補の個数を示す「領域候補の個数」とから構成される。図7を例にして説明すると、帳票データDB23は、論理結果データ23bとして「論理要素ID、領域候補へのポインタ、領域候補の個数」を「01(本人)、00a、1」や「001(住所)、00b・00k、2」などと記憶する。図7の例では、帳票上のひとつの領域が複数の論理要素に対する領域候補に対応することとなり、17個の論理要素に対して22個の領域候補データが対応することになる。なお、領域候補へのポインタは、論理要素を特定するアドレスなどの情報であり、ここでは一例を挙げただけであり、これに限定されるわけではない。
次に、図9に示すデータ構造について説明する。帳票データDB23は、図7で対応付けられた各論理要素に対応付けた、図9に示すような領域情報23cを記憶する。領域情報23cは、論理情報が含まれる帳票上の領域に対して一意に割り当てられた「領域ID」、当該論理要素が存在する帳票上の位置を示す「座標」、当該論理要素を示す「文字列」、当該論理要素を示す文字列に関する情報を示す「文字情報」、当該論理要素を構成する「文字の個数」、当該論理要素が対応付けられた論理要素である可能性を示す「候補順位」などを記憶する。「候補順位」とは、例えば、図7の構成要素「本人」の配下にある「住所」や「電話番号」などのように、読み込まれた帳票画像上に、この「住所」や「電話番号」に該当する候補が複数ある場合に設定される。例えば、帳票データDB23は領域情報23cとして「領域ID、座標、文字列、文字情報、文字の個数、候補順位」を「01、100.120、本人、本(0x967B),人(0x906C)、2、1」などと記憶する。
そして、帳票データDB23は、図7で対応付けられた各論理要素に対応付けて、図10に示すような制御情報22dをさらに記憶する。この制御情報22dは、論理要素に一意に割り当てられた「論理要素ID」と、当該論理要素に対応付けられた帳票上の論理要素を特定する「領域候補へのポインタ」と、当該論理要素に対応付けられた帳票上の領域候補の個数を示す「領域候補の個数」と、ユーザが選択したかどうかを表すフラグであり値としてONまたはOFFを持つ「選択フラグ」と、領域候補を選択したかどうかを表すフラグであり値としてONまたはOFFを持つ「サブ選択フラグ」と、選択された領域候補が何番目の選択候補であるかを表す「サブ選択番号」と、認識結果を変更したことを表すフラグであり値としてNOW、PAST、OFFを持つ「候補変更フラグ」と、画面に表示するかどうかを表すフラグであり値としてONまたはOFFを持つ「表示フラグ」と、矛盾があるかどうかを表すフラグで値としてONまたはOFFを持つ「矛盾フラグ」とを備える。例えば、帳票データDB23は、制御情報22dとして「論理要素ID、領域候補へのポインタ、領域候補の個数、選択フラグ、サブ選択フラグ、サブ選択番号、候補変更フラグ、表示フラグ、矛盾フラグ」を「01(本人)、00a、1、ON、ON、1、ON、OFF、ON」などと記憶する。
そして、帳票データDB23は、図7で対応付けられた各論理要素に対応付けて、図11に示すような表示情報22eをさらに記憶する。この表示情報22eは、ルートを除く最上位の論理要素を論理要素IDで表した「最上位の論理要素」と、読み込まれた帳票画像における表示領域が座標で表現された「画像表示領域」、読み込まれた帳票データを表示する修正ウインドウの表示項目を論理要素IDの集合で表現される「修正ウインドウ表示項目」とから構成される。例えば、帳票データDB23は、表示情報22eとして「最上位の論理要素、画像表示領域、修正ウインドウ表示項目」を「01(本人)、300×200、01(本人).001(001)」などと記憶する。
なお、図7は、帳票データDB23に記憶される論理構造対応付け結果22aの例を示す図であり、図8は、論理結果データ23bに記憶される情報の例を示す図であり、図9は、領域情報23cに記憶される情報の例を示す図であり、図10は、制御情報22dに記憶される情報の例を示す図であり、図11は、表示情報22eに記憶される情報の例を示す図である。
制御部30は、OS(Operating System)などの制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有するとともに、特に本発明に密接に関連するものとしては、インターフェース制御部31と、レイアウト認識部32と、文字認識部33と、論理構造認識部34と、論理構造解析部35とを備え、これらによって種々の処理を実行する。なお、制御部30における各機能部の詳細な処理については、図14以降で具体的に説明するので、ここでは各機能部の概要について説明する。
インターフェース制御部31は、表示部12からユーザの操作を受け付けたり、後述する論理構造解析部35による論理構造の解析結果を表示部12に表示出力したりする。具体的には、インターフェース制御部31は、入力受付部11により受け付けられた帳票を帳票画像としてレイアウト認識部32に出力したり、論理構造認識部34により認識された帳票の認識結果を修正ウインドウとして表示部12に表示出力したり、表示部12からクリックなどのユーザの操作を受け付けて操作内容を論理構造解析部35に出力したり、受け付けたユーザの操作結果により変更された表示内容を表示部12に表示出力したりする。
レイアウト認識部32は、入力受付部11により受け付けられた帳票のレイアウトを認識する。具体的には、レイアウト認識部32は、入力受付部11により受け付けられた帳票をインターフェース制御部31を介して受け付け、当該受け付けた帳票の種類を識別し、識別した帳票の種類に対応するレイアウトをレイアウト情報DB21に記憶されるレイアウト情報を特定し、特定したレイアウト情報に基づいて解析する。そして、レイアウト認識部32は、解析した結果を後述する文字認識部33に出力する。
文字認識部33は、入力受付部11により受け付けられた帳票上の文字列を認識する。具体的には、文字認識部33は、レイアウト認識部32により認識されたレイアウト認識結果を受け付けると、レイアウト認識部32により特定されたレイアウト情報DB21に記憶されるレイアウト情報とレイアウト認識部32により特定された帳票の種類に対応する論理構造雛形DB22に記憶される論理構造とに基づいて、入力受付部11により受け付けられた帳票上の文字列を抽出し、抽出結果を帳票データDB23に格納する。
論理構造認識部34は、入力受付部11により受け付けられた帳票上の文字列の論理構造を認識する。具体的には、論理構造認識部34は、レイアウト認識部32により認識されたレイアウト認識結果を受け付けると、論理構造雛形DB22に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、図12や図13に示すように、帳票上の文字列と論理構造雛形DB22に記憶される論理要素間の関係との対応付けを帳票データDB23に格納する。なお、論理構造認識結果で複数の候補を出力する手法としては、例えば、特願2006−209065では、論理要素(i1、j1)に対して算出された事後確率pp1(i1、j1、k1)をk1毎に大きさの順番に並べ替えて出力する手法を用いてもよく、また、特願2007−024125では、論理構造雛形DB22に記憶される論理要素間の関係とのマッチング結果で出力されるクリークを評価値の順番に並べ、2位以下を候補とする手法を用いてもよい。なお、図12と図13とは、論理要素の対応関係の例を示す図である。
論理構造解析部35は、表示部12に表示する帳票の認識結果を修正ウインドウとして表示制御する。具体的には、論理構造解析部35は、帳票データDB23に格納された入力受付部11により受け付けられた帳票上の文字列と対応付けられた論理要素間の関係とに基づいて、帳票認識結果を修正ウインドウとして表示制御指示をインターフェース制御部31に出力する。また、論理構造解析部35は、インターフェース制御部31に受け付けられたユーザの操作(ユーザアクション)に基づいて、論理要素間の関係を解析して、受け付けられたユーザの操作による帳票認識結果の修正内容を修正ウインドウとして表示制御指示をインターフェース制御部31に出力する。
[帳票認識装置による処理]
次に、図14〜図18を用いて、帳票認識装置による処理を説明する。図14は、実施例1に係る帳票認識装置における全体的な処理の流れを示すフローチャートである。
(全体的な処理の流れ)
図14に示すように、帳票が入力されると(ステップS101肯定)、帳票認識装置10は、文書解析処理を実施する(ステップS102)。具体的には、入力受付部11により帳票が受け付けられると、帳票認識装置10のレイアウト認識部32と文字認識部33は、レイアウト情報DB21に記憶されるレイアウト情報に基づいて、入力された帳票のレイアウトと帳票上の文字列とをそれぞれ認識する。そして、帳票認識装置10の論理構造認識部34は、受け付けられた帳票上の文字列の論理構造を認識して帳票データDB23に格納する。
続いて、帳票認識装置10は、入力された帳票の表示処理を行って、ユーザアクション待機状態に遷移する(ステップS103とステップS104)。具体的には、帳票認識装置10の論理構造解析部35は、帳票データDB23に格納された入力受付部11により受け付けられた帳票上の文字列と対応付けられた論理要素間の関係とに基づいて、帳票認識結果を修正ウインドウとして表示制御指示をインターフェース制御部31に出力し、インターフェース制御部31は、受け付けた表示制御指示に基づいて、入力された帳票を表示部12に表示出力して、ユーザアクションを受け付ける状態に遷移する。
その後、ユーザアクションを受け付けた帳票認識装置10は、ユーザアクション取得処理を行って、論理情報解析を行い、解析結果を表示する(ステップS105〜ステップS107)。具体的には、表示部12に表示出力された修正ウインドウ(読み込んだ帳票データ)のある領域(文字列)がユーザ操作により修正された場合、インターフェース制御部31は、この修正内容を論理構造解析部35に出力し、論理構造解析部35は、受け付けた修正内容と帳票データDB23に記憶される帳票上の文字列と論理要素間の関係(帳票の論理構造)とに基づいて、帳票データDB23に帳票の論理構造を修正する。そして、論理構造解析部35は、修正した帳票の論理構造をインターフェース制御部31に出力し、インターフェース制御部31は、受け付けた修正した帳票の論理構造を表示部12に表示出力する。
そして、ユーザアクションで処理終了が選択されるまで(ステップS108否定)、帳票認識装置10は、上記したステップS104〜ステップS107の処理を繰り返し、ユーザアクションで処理終了が選択されると(ステップS108肯定)、帳票認識装置10は、処理を終了する。
(表示項目決定処理の流れ)
次に、図15を用いて、表示項目決定処理について説明する。図15は、実施例1に係る帳票認識装置における表示項目決定処理の流れを示すフローチャートである。
この表示項目決定処理は、図14のステップS107に該当し、入力された帳票の論理構造が表示部12に表示出力された後に、ユーザアクションを受け付けた場合に、当該ユーザアクションに基づいて表示項目を決定する処理である。
具体的には、帳票認識装置10は、表示項目決定処理において、ユーザがある項目を選択すると、その項目の選択フラグのみがONになった論理要素がインターフェース制御部31から論理構造解析部35に送られてくる。そこで、論理構造解析部35では、帳票データDB23に記憶されている論理要素をサーチして選択フラグがONになっているものを見つけ、その論理要素IDを用いて論理構造雛形DB21を参照し、対応する論理要素と、その親、および、さらにその親というようにして上位の論理要素をたどってすべての上位の論理要素を列挙する。そして、論理構造解析部35では、列挙した論理要素を対応する論理要素を帳票データDB23からサーチして見つけて、それらの表示フラグをONにする。ただし、選択フラグがONになっている論理要素の候補変更フラグがNOWになっているときは、そのすぐ上位の論理要素の表示フラグはOFFにする。
ここで、論理構造雛形DB22に基づいて、抽出されて対応付けられた論理要素全てに変数「i(i=0〜M)」を割り振って(論理要素Li)、上記した処理の流れをフローを用いて説明する。ユーザによりある項目が選択されて、その項目の選択フラグのみがONになった論理構造をインターフェース制御部31から受け付けた論理構造解析部35は、変数「i」に「0」を代入する(ステップS201)。
そして、論理構造解析部35は、変数「i」が「M」よりも小さい場合(ステップS202肯定)、帳票データDB23に記憶されている論理要素「Li」の選択フラグがONか否かを判定する(ステップS203)。
そして、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の選択フラグがONである場合(ステップS203肯定)、論理構造解析部35は、当該論理要素「Li」の表示フラグをONにするとともに(ステップS204)、論理構造雛形DB22に記憶される論理要素のデータ構造を参照して、当該論理要素「Li」の上位の論理要素を求めてそれらの表示フラグをONにし(ステップS205)、当該論理要素「Li」の候補選択フラグがONであるか否かを判定する(ステップS206)。
その後、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の候補選択フラグがONである場合には(ステップS206肯定)、論理構造解析部35は、当該論理要素「Li」の1つ上位の論理要素の表示フラグをOFFにして処理を終了し(ステップS207)、当該論理要素「Li」の候補選択フラグがONでない場合には(ステップS206否定)、そのまま処理を終了する。
一方、ステップS203に戻り、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の選択フラグがONでない場合(ステップS203否定)、論理情報解析部35は、変数「i」を「1」増加させた次の論理要素「Li+1」に対して(ステップS208)、ステップS202〜ステップS207の処理を実施する。
(矛盾項目発見処理の流れ)
次に、図16と図17とを用いて、矛盾項目発見処理について説明する。図16は、実施例1に係る帳票認識装置における矛盾項目発見処理の流れを示すフローチャートであり、図17は、実施例1に係る矛盾項目発見処理における候補フラグ変更処理の流れを示すフローチャートである。
この矛盾項目発見処理は、図14のステップS106とテップS107とに該当し、修正などのユーザアクションを受け付けた場合に、当該ユーザアクションによる修正内容において発生する矛盾項目を発見する処理である。
具体的には、帳票認識装置10は、矛盾項目発見処理において、論理構造をサーチして、領域IDに対して、領域IDに対応する領域が領域候補になっている論理要素を求め、論理要素IDとその候補順位を列挙する。ここで、ひとつの領域IDに対して、第1位候補が複数あるときは、それに対応する論理要素と親の情報の矛盾フラグをONにする。また、選択フラグがONになっている論理要素の候補変更フラグがNOWになっているときは、その第1位候補が領域候補になっている論理要素に関して、それが第1位候補ではないときには最下位候補に順位を下げ、それ以外の順位を上げて、候補変更フラグをPASTにする。
ここで、論理構造雛形DB21に基づいて、抽出されて対応付けられた論理要素全てに変数「i(i=0〜M)」(論理要素Li)と「j」(論理要素Lj)とを割り振って、上記した処理の流れをフローを用いて説明する。ユーザによりある項目が選択されて、帳票データDB23の制御情報22dに記憶されている選択フラグのみがONになった論理情報をインターフェース制御部31から受け付けた論理情報解析部35は、変数「i」に「0」、「Lj=NULL」、「j=1〜N」とする変数の初期化を行う(ステップS301)。
そして、論理情報解析部35は、変数「i」が「M」よりも小さい場合(ステップS302肯定)、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の第r位領域候補のIDを「s」としてL(s)に(i、r)を追加して(ステップS303)、変数「i」を「1」増加させて(ステップS304)、ステップS302に戻る。つまり、一つの論理要素「Li」について複数の候補がある場合に、一つの論理要素の候補「L(i、r)」としてそれぞれを対応付ける。
その後、変数「i」が「M」よりも大きくなった場合(ステップS302否定)、論理構造解析部35は、辺「j」に「0」を代入して(ステップS305)、変数「j」が「N」よりも小さいか否かを判定する(ステップS306)。
変数「j」が「N」よりも小さい場合(ステップS306肯定)、論理構造解析部35は、帳票データDB23の制御情報22dを参照して「Lj」に第1位候補が複数あるときに、第1位候補に対応する論理要素の矛盾フラグをONにし(ステップS307)、変数「j」を「1」増加させて(ステップS308)、ステップS306以降の処理を繰り返す。そして、変数「j」が「N」よりも大きくなった場合(ステップS306否定)、論理構造解析部35は、処理を終了する。
つまり、帳票データDB23の制御情報22dを参照し、ユーザにより変更された論理要素「Li」が他の領域の論理要素「Lj」として使用されている場合には矛盾が発生していることとなるため、ユーザにより変更された論理要素「Li」に一致する他の論理要素「Lj」があるか否かを判定し、ある場合には、他の論理要素「Lj」の矛盾フラグをONにする。
また、図17を用いて、実施例1に係る矛盾項目発見処理における候補フラグ変更処理の流れを説明する。図17に示すように、論理構造解析部35は、ユーザによりある項目が選択されて、帳票データDB23の制御情報22dに記憶されている選択フラグのみがONになった論理情報をインターフェース制御部31から受け付けた論理構造解析部35は、変数「i」に「0」を代入する(ステップS401)。
そして、変数「i」が「M」よりも小さい場合(ステップS402肯定)、論理構造解析部35は、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の選択フラグをON、論理要素「Li」の候補変更フラグをON、論理要素「Li」の第1位候補のIDを「s」として論理要素L(s)のうち第1位候補でないものを対応する論理湯祖の中で最下位候補へ落とす(ステップS403〜ステップS405)。その後、論理構造解析部35は、変数「i」を「1」増加させて(ステップS406)、次の論理要素「Li+1」に対して、ステップS402〜ステップS405の処理を実施し、変数「i」が「M」より大きくなると(ステップS402否定)、処理を終了する。
(表示情報設定処理の流れ)
次に、図18を用いて、表示情報設定処理について説明する。図18は、実施例1に係る帳票認識装置における表示情報設定処理の流れを示すフローチャートである。この表示情報設定処理は、図14のステップS107に該当し、上記した矛盾項目発見処理の後に、表示項目を決定するとともに、表示する画像の領域を決定する処理である。
具体的には、帳票認識装置10は、表示情報設定処理において、表示フラグがONになっている論理要素に関して、ルートを除く最上位の論理要素を求めて表示情報の最上位論理要素に設定する。また、表示情報設定処理では、表示フラグがONになっている論理要素と矛盾フラグがONになっている論理要素を修正ウインドウ表示項目に記す。そして、これらの領域候補第1位の領域とサブ選択フラグがONになっている論理要素(サブ選択番号をxとする)で領域候補第x位の領域に関し、帳票画像上でそれらを囲む外接矩形を求める。そして、その外接矩形の周りにあらかじめ決めておく大きさのマージンを付け加え、画像からはみ出さすときははみ出さないように修正して、帳票画像上での表示領域を決め、その座標を画像表示領域に設定する。
ここで、論理構造雛形DB22に基づいて、抽出されて対応付けられた論理要素全てに変数「i(i=0〜M)」を割り振って(論理要素Li)、上記した処理の流れをフローを用いて説明する。ユーザによりある項目が選択されて、その項目の選択フラグのみがONになった論理情報をインターフェース制御部31から受け付けた論理構造解析部35は、変数「i」に「0」を代入する(ステップS501)。
そして、論理構造解析部35は、変数「i」が「M」よりも小さい場合(ステップS502肯定)、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の表示フラグがONか否かを判定する(ステップS503)。
帳票データDB23の制御情報22dに記憶されている論理要素「Li」の表示フラグがONでない場合には(ステップS503否定)、論理構造解析部35は、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の矛盾フラグがONか否かを判定し(ステップS504)、矛盾フラグがONである場合(ステップS504肯定)、論理要素「Li」の第1位領域候補を領域リストへ追加し、領域候補「Li」を修正ウインドウ項目へ追加する(ステップS505)。
そして、論理構造解析部35は、帳票データDB23の制御情報22dに記憶されている論理要素「Li」のサブ選択フラグがONである場合には(ステップS506肯定)、論理要素「Li」のサブ選択番号xを、論理要素「Li」の第x位領域候補として領域リストへ追加し(ステップS507)、その後に変数「i」を「1」増加させて(ステップS508)、ステップS502〜ステップS508までの処理を繰り返す。
一方、帳票データDB23の制御情報22dに記憶されている論理要素「Li」のサブ選択フラグがONでない場合には(ステップS506否定)、論理構造解析部35は、その後に変数「i」を「1」増加させて(ステップS508)、ステップS502〜ステップS508までの処理を繰り返す。
ステップS503に戻り、論理情報解析部35は、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の表示フラグがONである場合には(ステップS503肯定)、ステップS505の処理を行い、帳票データDB23の制御情報22dに記憶されている論理要素「Li」の矛盾フラグがONでない場合(ステップS504否定)、ステップS506の処理を実施する。
その後、変数「i」が「M」よりも大きくなった場合(ステップS502否定)、論理構造解析部35は、領域リストの領域について座標を用いて外接矩形を算出し、算出した外接矩形に予め定めたマージン分を出して表示情報の画像表示領域として、帳票データDB23の表示情報22eに格納する(ステップS509とステップS510)。
(画面表示を用いた説明)
次に、図19〜図25を用いて、帳票認識装置による処理を画面表示例を用いて説明する。図19は、表示される画面例を示す図であり、図20は、ユーザに選択された画面を示す図であり、図21は、論理要素候補が例示された画面を示す図であり、図22は、ユーザにより論理要素が修正された例を示す図であり、図23は、矛盾項目が見つかった例を示す図であり、図24は、矛盾項目が修正された例を示す図であり、図25は、修正が完了した例を示す図である。
論理情報の修正画面は、認識対象の画像と修正ウインドウが並置される(図19参照)。修正ウインドウには、論理情報が表示されており、このうちデータ部分はユーザが自由に書き込めるようになっている。データ入力部分の右下にはボタンがあり、データ入力部分を選択したときにアクティブになり、それを押すと候補が表示される。帳票認識装置10は、ユーザが選択したときに、制御情報22dをなどを参照して、選択した論理要素に関連する上位の論理要素とそれらに対応する帳票上の領域をわかるように表示する。これにより、同じ言葉でも異なる意味の見出しを判別できるようになり、修正が確実になり効率化される。
具体的に例を挙げて説明すると、図14に示したステップS101〜ステップS103の処理を実施すると、帳票認識装置10は、図19に示したように、読み込んだ元の帳票のデータである帳票画像(a)と読み込んだ帳票から論理構造を取得して作成した修正ウインドウ(b)を表示部12に表示する。なお、帳票認識装置10は、ここで表示されている各論理要素(例えば、本人、電話番号など)に対応付けて、図8〜図10に示した各データを備えていることとなる。
この例では、本人の電話番号と勤務先の電話番号を誤って認識した。修正画面の本人の電話番号欄がユーザによりクリックして選択されると、帳票認識装置10は、これに対応する見出し−上位見出しがハイライト表示されると同時に、左の帳票画像においても対応する文字列を矩形で表示し、これらが映し出されるサイズで電話番号(044−777−1111のところ)が中央に表示される。ユーザはこれを見て、文字列の対応が誤っていることを一瞬で察知する(図20参照)。
また、帳票認識装置10は、ルートを除く見出しの論理要素の最上位が変化しなければ帳票画像の表示も変えないようにすることで、確認のたびごとに左の帳票画像が移動せず、見出しの論理要素の最上位が変化して初めて帳票画像が移動する。これにより、確認の際のユーザの視点移動をスムーズにできる。例えば、図7のように論理構造認識結果がすべて合っていたとして、帳票認識装置10は、修正ウインドウの上から順番に確認していき、本人氏名、本人住所、本人電話番号の確認では、帳票画像の本人の表がクローズアップされて表示されそのまま動かないが、勤務先住所を確認しようとして初めて勤務先の表がクローズアップされるように画面を移動させる。
その後、帳票認識装置10は、ユーザが一度修正したら、その修正結果を基にして、矛盾するところや確認すべきところをユーザに提示する。ユーザが修正したところが関連する部分で、修正した部分が誤っているならば誤っている可能性が高いところを提示する。
例えば、帳票認識装置10は、ユーザは本人の電話番号が誤っているのに気づいたので、右下のグレーのボタンがユーザによりクリックされると、他の文字列候補を表示する(図21参照)。そして、第2候補にユーザがカーソルを合わせると、帳票認識装置10は、その文字列候補に対応する文字列が帳票画像上で矩形によって表示する(図22参照)。その後、ユーザは確認してそれを選択する。すると、帳票認識装置10は、勤務先の電話番号が重複して対応することになるので、矛盾するところを修正画面で表示して、ユーザに確認するよう促す(図23参照)。同様にして、右下のグレーのボタンがクリックされると、帳票認識装置10は、他の文字列候補を表示し(図24参照)、ユーザは、第2候補にカーソルを合わせて選択する(図25参照)。
その後、帳票認識装置10は、ユーザが修正を行うたびに、修正結果と認識結果候補を比較して、認識結果候補の順位を更新する(図26、図27参照)。図26では、本人と勤務先に親権者の欄が加わった画面例を示し、図27では、論理構造認識結果の一部を示す図である。本人住所の認識候補が「1.K」、「2.C」、「3.Q」であり、勤務先の認識候補が「1.Q」、「2.C」、「3.K」であるとする。ここで、帳票認識装置10は、本人住所を修正してCとすると、勤務先の認識候補でCの可能性はほぼないと判断できるので、勤務先の認識候補を「1.Q」、「2.K」、「3.C」と変更する。
(全体的な処理の流れのまとめ)
上記した処理の流れについて、このような表示画面では、ユーザの操作により、修正ウインドウにおいて、見出しの文字列とデータ入力部をクリックで選択できるとともに、データ部分の文字列を変更できるようになっている。また、ユーザ側は、データ部分の変更として、認識候補の選択と直接文字列を書き込む2つの手段がある。
具体的には、ユーザが修正ウインドウにおいて、見出しの文字列とデータ入力部のいずれかをクリックすると、帳票認識装置10は、どこをクリックしたかを求め、対応する論理情報の選択フラグをONにする。そして、修正ウインドウにおいて、データ文字列の認識候補を第2位以降表示させてカーソル(マウス)がユーザにより合わせられると、帳票認識装置10は、サブ選択フラグをONにして、カーソルを合わされた候補の候補順位をサブ選択番号に設定する。カーソルが合わされた候補が変わるたびに同様の処理を行う。さらに、ユーザにより候補が選択されると、帳票認識装置10は、対応する論理情報において、選択したものを第1位にして、それ以降を下位にずらすようにして認識候補の順位を更新し、さらに候補変更フラグをNOWにする。また、帳票認識装置10は、直接文字列を書き込んだときは、論理情報の第1位候補の文字列をそれに置き換え、文字情報をクリアして文字の個数を0にし、領域IDと座標をクリアする。
また、図19に示したように、帳票認識装置10が表示する画面には、帳票画像を表示するウインドウと、修正画面を表示するウインドウがある。帳票認識装置10は、帳票画像の表示において、表示情報の画像表示領域によって帳票画像の該当する領域を表示し、修正ウインドウにおいては、帳票から入力したいデータをその見出しと上位見出しとともに表示するようになっており、あらかじめ論理構造雛形DB22のどのデータを入力するかということと、どのような順番で表示するかを設定できるようになっている。帳票認識装置10は、初期状態ではそれらがすべて表示するが、ユーザの修正作業が始まると、それらのうちで、表示情報の修正ウインドウ表示項目に記されている論理要素が含まれるように部分的に表示される。
具体的には、論理構造解析部35は、インターフェース制御部31から論理情報と表示情報を受けたら、表示情報22eの最上位の論理要素と画像表示領域を参照し、直前の最上位の論理要素と画像表示領域と比較して、最上位の論理要素が直前のものと同じであり、かつ、画像表示領域が直前のものに包含されているならば、表示領域は直前のものと変えないようにする。それ以外の場合は、論理情報解析部35は、与えられた画像表示領域を表示領域として決定して、表示情報22eに格納する。
そして、論理構造解析部35は、帳票画像上で画像表示領域を、修正ウインドウ上で修正ウインドウ表示項目に記されている論理要素が含まれるように表示する。さらに、論理構造解析部35は、制御情報22dにおいて、表示フラグがONになっている論理要素に関して領域候補第1位の領域を矩形で表示し、修正ウインドウ上では論理要素が見出しならば文字列の色を変えて(例えば青)表示し、データならば入力部の色を変えて(例えば赤)表示する。同様に、論理構造解析部35は、制御情報22dにおいて、選択フラグがON、サブ選択フラグがONになっている論理要素に関しては、サブ選択番号をxとすると、領域候補第x位の領域について色を変えた矩形(例えばオレンジ)で表示する。また、論理構造解析部35は、制御情報22dにおいて、表示フラグがOFFで矛盾フラグがONになっている論理要素に関して、論理要素の文字列の色を変えて(例えば緑)表示し、種別がデータのとき領域候補第1位の領域について色を変えた矩形(例えば緑)で表示する。
[実施例1による効果]
このように、実施例1によれば、帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶手段に記憶される論理要素間の関係との対応付けとを帳票データとして帳票データDB23に記憶し、入力された帳票を認識し、論理構造雛形DB22に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶手段に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と論理構造雛形DB22に記憶される論理要素間の関係との対応付けを帳票データDB23に格納し、帳票データDB23に記憶される帳票データと、認識された帳票画像とをそれぞれ表示部に出力し、表示部12に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を帳票データDB23から特定して、特定した文字列を他の文字列と区別した帳票データを表示部12に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の画像を表示部12に表示出力するので、認識した帳票データの訂正作業において、訂正作業者の負担を軽減することが可能である。
また、実施例1によれば、入力された帳票を認識し、論理構造雛形DB22に記憶される論理要素の候補となる帳票上の文字列を抽出して帳票データDB23に格納するとともに、論理構造雛形DB22に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを複数抽出して、帳票上の文字列と論理構造雛形DB22に記憶される論理要素間の関係との対応付けを帳票データDB23に格納し、表示部12に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列の候補となる他の文字列を帳票データDB23からさらに特定して、特定した候補となる他の文字列をユーザにより選択された文字列に対応付けてさらに表示部12に表示出力するので、訂正作業者(ユーザ)は、文字列の対応が誤っていることを一瞬で察知することが可能である。
また、実施例1によれば、入力された帳票を認識し、論理構造雛形DB22に記憶される論理要素の候補となる帳票上の文字列に対応付けて、それぞれ候補となる文字列の順位を抽出して帳票データDB23に格納するとともに、論理構造雛形DB22に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを複数抽出して、帳票上の文字列と論理構造雛形DB22に記憶される論理要素間の関係との対応付けを帳票データDB23に格納し、表示部12に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列の候補となる他の文字列と順位とを帳票データDB23からさらに特定して、特定した候補となる順位の高い他の文字列をユーザにより選択された文字列に対応付けてさらに表示部12に表示出力するので、訂正作業者(ユーザ)は、文字列の対応が誤っていることを一瞬で察知することが可能であるとともに、新たな文字列候補を簡単に選択することが可能である。
また、実施例1によれば、表示部12に表示された帳票データの文字列がユーザにより修正された場合に、当該修正された文字列と論理要素間の関係が他の文字列を帳票データDB23から特定し、特定した論理要素間の関係がある他の文字列を特定されていない他の文字列と区別した帳票データを表示部12に表示出力するとともに、帳票画像のうち当該特定された帳票データの文字列を含む最低限の画像を表示部12に表示出力するので、ユーザが認識結果を修正するたびにデータ文字列候補の順位を変え、修正結果と矛盾するところがあればユーザに注意を喚起することができる結果、ユーザは、修正を正確かつ迅速に行えるようになる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下に示すように、(1)帳票画像形式、(2)システム構成等、(3)プログラム、にそれぞれ区分けして異なる実施例を説明する。
(1)帳票画像形式
例えば、本発明は、紙媒体の帳票画像だけでなく、ネットワーク、各種記憶媒体、電子メールなどから受け付けた電子ファイルの帳票画像についても上記した同様の処理を行うことができる。
(2)システム構成等
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
(3)プログラム
ところで、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータシステムを他の実施例として説明する。
図28は、帳票認識プログラムを実行するコンピュータシステムの例を示す図である。図28に示すように、コンピュータシステム100は、RAM101と、HDD102と、ROM103と、CPU104とから構成される。ここで、ROM103には、上記の実施例と同様の機能を発揮するプログラム、つまり、図28に示すように、帳票データ格納プログラム103aと、表示制御プログラム103bとがあらかじめ記憶されている。
そして、CPU104には、これらのプログラム103aと103bを読み出して実行することで、図28に示すように、帳票データ格納プロセス104aと、表示制御プロセス104bとなる。なお、帳票データ格納プロセス104aは、図2に示した、文字認識部33と論理構造認識部34とに対応し、同様に、表示制御プロセス104bは、インターフェース制御部31と論理構造解析部35に対応する。
また、HDD102には、各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形テーブル102aと、帳票上の文字列と、当該帳票上の文字列と論理構造雛形テーブル102aに記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データテーブル102bとが設けられる。なお、論理構造雛形テーブル102aは、図2に示した、論理構造雛形DB22に対応し、帳票データテーブル102bは、同様に、帳票データDB23に対応する。
ところで、上記したプログラム103aと103bとは、必ずしもROM103に記憶させておく必要はなく、例えば、コンピュータシステム100に挿入されるフレキシブルディスク(FD)、CD−ROM、MOディスク、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」の他に、コンピュータシステム100の内外に備えられるハードディスクドライブ(HDD)などの「固定用の物理媒体」、さらに、公衆回線、インターネット、LAN、WANなどを介してコンピュータシステム100に接続される「他のコンピュータシステム」に記憶させておき、コンピュータシステム100がこれらからプログラムを読み出して実行するようにしてもよい。
(付記1)各種の帳票に対応付けて、当該帳票を構成する複数の文字列それぞれを示す論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することをコンピュータに実行させる帳票認識プログラムであって、
前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、
前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納手順と、
前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する表示制御手順と、
をコンピュータに実行させることを特徴とする帳票認識プログラム。
(付記2)前記帳票データ格納手順は、前記入力された帳票を認識し、前記論理構造雛形記憶部に記憶される論理要素の候補となる帳票上の文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを複数抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納し、
前記表示制御手順は、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列の候補となる他の文字列を前記帳票データ記憶手段からさらに特定して、特定した候補となる他の文字列をユーザにより選択された文字列に対応付けてさらに表示部に表示出力することを特徴とする付記1に記載の帳票認識プログラム。
(付記3)前記帳票データ格納手順は、前記入力された帳票を認識し、前記論理構造雛形記憶部に記憶される論理要素の候補となる帳票上の文字列に対応付けて、それぞれ候補となる文字列の順位を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを複数抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納し、
前記表示制御手順は、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列の候補となる他の文字列と順位とを前記帳票データ記憶手段からさらに特定して、特定した候補となる順位の高い他の文字列をユーザにより選択された文字列に対応付けてさらに表示部に表示出力することを特徴とする付記1に記載の帳票認識プログラム。
(付記4)前記表示制御手順は、前記表示部に表示された帳票データの文字列がユーザにより修正された場合に、当該修正された文字列と論理要素間の関係が他の文字列を前記帳票データ記憶手段から特定し、特定した論理要素間の関係がある他の文字列を特定されていない他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力することを特徴とする付記1に記載の帳票認識プログラム。
(付記5)各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識する帳票認識装置であって、
前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、
前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納手段と、
前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する表示制御手段と、
を備えたことを特徴とする帳票認識装置。
(付記6)各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することに適した帳票認識方法であって、
前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、
前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納工程と、
前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する表示制御工程と、
を含んだことを特徴とする帳票認識方法。
以上のように、本発明に係る帳票認識プログラムおよび帳票認識装置は、各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することに有用であり、特に、認識した帳票データの訂正作業において、訂正作業者の負担を軽減することに適する。
実施例1に係る帳票認識装置の全体構成を示すシステム構成図である。 実施例1に係る帳票認識装置の構成を示すブロック図である。 表示される帳票画像と帳票データとを示す図である。 レイアウト情報DBに記憶される情報の例を示す図である。 論理構造雛形DBに記憶される論理構造を示す図である。 論理構造雛形DBに記憶される論理構造を構成する各論理要素のデータ構造を示す図である。 帳票データDB23に記憶される論理構造対応付け結果22aの例を示す図である。 論理結果データ23bに記憶される情報の例を示す図である。 領域情報23cに記憶される情報の例を示す図である。 制御情報22dに記憶される情報の例を示す図である。 表示情報22eに記憶される情報の例を示す図である。 論理要素の対応関係の例を示す図である。 論理要素の対応関係の例を示す図である。 実施例1に係る帳票認識装置における全体的な処理の流れを示すフローチャートである。 実施例1に係る帳票認識装置における表示項目決定処理の流れを示すフローチャートである。 実施例1に係る帳票認識装置における矛盾項目発見処理の流れを示すフローチャートである。 実施例1に係る矛盾項目発見処理における候補フラグ変更処理の流れを示すフローチャートである。 実施例1に係る帳票認識装置における表示情報設定処理の流れを示すフローチャートである。 表示される画面例を示す図である。 ユーザに選択された画面を示す図である。 論理要素候補が例示された画面を示す図である。 ユーザにより論理要素が修正された例を示す図である。 矛盾項目が見つかった例を示す図である。 矛盾項目が修正された例を示す図である。 修正が完了した例を示す図である。 本人と勤務先に親権者の欄が加わった画面例を示す図である。 論理構造認識結果の一部を示す図である 帳票認識プログラムを実行するコンピュータシステムの例を示す図である。
符号の説明
10 帳票認識装置
11 入力受付部
12 表示部
20 記憶部
21 レイアウト情報DB
22 論理構造雛形DB
23 帳票データDB
30 制御部
31 インターフェース制御部
32 レイアウト認識部
33 文字認識部
34 論理構造認識部
35 論理構造解析部
100 コンピュータシステム
101 RAM
102 HDD
102a 論理構造雛形テーブル
102b 帳票データテーブル
103 ROM
103a 帳票データ格納プログラム
103b 表示制御プログラム
104 CPU
104a 帳票データ格納プロセス
104b 表示制御プロセス

Claims (6)

  1. 各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することをコンピュータに実行させる帳票認識プログラムであって、
    前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、
    前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納手順と、
    前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する表示制御手順と、
    をコンピュータに実行させることを特徴とする帳票認識プログラム。
  2. 前記帳票データ格納手順は、前記入力された帳票を認識し、前記論理構造雛形記憶部に記憶される論理要素の候補となる帳票上の文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを複数抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納し、
    前記表示制御手順は、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列の候補となる他の文字列を前記帳票データ記憶手段からさらに特定して、特定した候補となる他の文字列をユーザにより選択された文字列に対応付けてさらに表示部に表示出力することを特徴とする請求項1に記載の帳票認識プログラム。
  3. 前記帳票データ格納手順は、前記入力された帳票を認識し、前記論理構造雛形記憶部に記憶される論理要素の候補となる帳票上の文字列に対応付けて、それぞれ候補となる文字列の順位を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを複数抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納し、
    前記表示制御手順は、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列の候補となる他の文字列と順位とを前記帳票データ記憶手段からさらに特定して、特定した候補となる順位の高い他の文字列をユーザにより選択された文字列に対応付けてさらに表示部に表示出力することを特徴とする請求項1に記載の帳票認識プログラム。
  4. 前記表示制御手順は、前記表示部に表示された帳票データの文字列がユーザにより修正された場合に、当該修正された文字列と論理要素間の関係が他の文字列を前記帳票データ記憶手段から特定し、特定した論理要素間の関係がある他の文字列を特定されていない他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力することを特徴とする請求項1に記載の帳票認識プログラム。
  5. 各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識する帳票認識装置であって、
    前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、
    前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納手段と、
    前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する表示制御手段と、
    を備えたことを特徴とする帳票認識装置。
  6. 各種の帳票における論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、前記論理構造雛形記憶部に記憶される論理構造に従って、入力されて認識された帳票の論理構造を認識することに適した帳票認識方法であって、
    前記帳票上の文字列と、当該帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けとを帳票データとして記憶する帳票データ記憶手段と、
    前記入力された帳票を認識した帳票画像に対して、前記論理構造雛形記憶部に記憶される論理要素と一致する文字列を抽出して前記帳票データ記憶手段に格納するとともに、前記論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせを抽出して、帳票上の文字列と前記論理構造雛形記憶部に記憶される論理要素間の関係との対応付けを前記帳票データ記憶手段に格納する帳票データ格納工程と、
    前記帳票データ記憶手段に記憶される帳票データと、前記認識された帳票画像とをそれぞれ表示部に出力し、前記表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を前記帳票データ記憶手段から特定して、特定した文字列を他の文字列と区別した帳票データを表示部に表示出力するとともに、前記帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する表示制御工程と、
    を含んだことを特徴とする帳票認識方法。
JP2007292618A 2007-11-09 2007-11-09 帳票認識プログラム、帳票認識装置および帳票認識方法 Expired - Fee Related JP4998219B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007292618A JP4998219B2 (ja) 2007-11-09 2007-11-09 帳票認識プログラム、帳票認識装置および帳票認識方法
US12/265,753 US8015203B2 (en) 2007-11-09 2008-11-06 Document recognizing apparatus and method
CN2008101741091A CN101430758B (zh) 2007-11-09 2008-11-07 文档识别装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007292618A JP4998219B2 (ja) 2007-11-09 2007-11-09 帳票認識プログラム、帳票認識装置および帳票認識方法

Publications (2)

Publication Number Publication Date
JP2009122722A true JP2009122722A (ja) 2009-06-04
JP4998219B2 JP4998219B2 (ja) 2012-08-15

Family

ID=40624721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007292618A Expired - Fee Related JP4998219B2 (ja) 2007-11-09 2007-11-09 帳票認識プログラム、帳票認識装置および帳票認識方法

Country Status (3)

Country Link
US (1) US8015203B2 (ja)
JP (1) JP4998219B2 (ja)
CN (1) CN101430758B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011198285A (ja) * 2010-03-23 2011-10-06 Hitachi Solutions Ltd 文書処理システム、及びプログラム
WO2019193923A1 (ja) 2018-04-02 2019-10-10 日本電気株式会社 画像処理装置、画像処理方法および記録媒体
CN112449071A (zh) * 2019-08-30 2021-03-05 富士施乐株式会社 信息处理装置以及记录媒体
JP2021131593A (ja) * 2020-02-18 2021-09-09 キヤノン株式会社 データ入力支援装置、データ入力支援方法、表示装置、及びプログラム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4998237B2 (ja) * 2007-12-06 2012-08-15 富士通株式会社 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法
JP2010157107A (ja) * 2008-12-26 2010-07-15 Hitachi Software Eng Co Ltd 業務文書処理装置
CN102034081B (zh) * 2009-09-25 2016-06-22 神基科技股份有限公司 使用影像作为数据来源的计算器装置
CN102236782A (zh) * 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
EP2584515B1 (en) * 2010-06-15 2020-06-10 Navitime Japan Co., Ltd. Navigation system, terminal apparatus, navigation server, navigation apparatus, navigation method, and program
CN102479037B (zh) * 2010-11-30 2014-02-26 汉王科技股份有限公司 电子阅读器及电子阅读器的屏幕内容选取方法
US8347391B1 (en) * 2012-05-23 2013-01-01 TrustPipe LLC System and method for detecting network activity of interest
DE102012025351B4 (de) * 2012-12-21 2020-12-24 Docuware Gmbh Verarbeitung eines elektronischen Dokuments
US8856324B2 (en) 2013-01-28 2014-10-07 TrustPipe LLC System and method for detecting a compromised computing system
US10067921B2 (en) * 2014-03-20 2018-09-04 Nec Corporation Information processing apparatus, information processing method, and information processing program
US10049269B2 (en) * 2015-09-30 2018-08-14 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium
JP7501012B2 (ja) * 2020-03-16 2024-06-18 富士フイルムビジネスイノベーション株式会社 文書処理装置、文書管理サーバ及びプログラム
JP2022097259A (ja) * 2020-12-18 2022-06-30 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
CN113221886A (zh) * 2021-05-17 2021-08-06 广西安怡臣信息技术有限公司 一种基于图文识别后的文字学习校对系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05158984A (ja) * 1991-12-05 1993-06-25 Ricoh Co Ltd 文字列抽出装置
JPH0668300A (ja) * 1991-12-18 1994-03-11 Internatl Business Mach Corp <Ibm> 文書画像のレイアウトモデルを作成する方法及び装置
JPH07134750A (ja) * 1993-11-11 1995-05-23 Nec Corp 文書画像認識装置
JPH11353411A (ja) * 1998-06-08 1999-12-24 Oki Electric Ind Co Ltd 文字認識装置
JP2002007951A (ja) * 2000-06-19 2002-01-11 Hitachi Ltd 帳票入力方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP2003223610A (ja) * 2002-01-28 2003-08-08 Toshiba Corp 文字認識装置及び文字認識方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930009639B1 (ko) * 1989-07-09 1993-10-08 가부시끼가이샤 히다찌세이사꾸쇼 화상데이타를 이용하는 문서데이타 처리방법 및 장치
JP3268084B2 (ja) 1993-09-21 2002-03-25 株式会社東芝 帳票読取システム
US5574802A (en) * 1994-09-30 1996-11-12 Xerox Corporation Method and apparatus for document element classification by analysis of major white region geometry
JPH10222612A (ja) 1997-02-07 1998-08-21 Hitachi Ltd 文書認識装置
US6356903B1 (en) * 1998-12-30 2002-03-12 American Management Systems, Inc. Content management system
US6754654B1 (en) * 2001-10-01 2004-06-22 Trilogy Development Group, Inc. System and method for extracting knowledge from documents

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05158984A (ja) * 1991-12-05 1993-06-25 Ricoh Co Ltd 文字列抽出装置
JPH0668300A (ja) * 1991-12-18 1994-03-11 Internatl Business Mach Corp <Ibm> 文書画像のレイアウトモデルを作成する方法及び装置
JPH07134750A (ja) * 1993-11-11 1995-05-23 Nec Corp 文書画像認識装置
JPH11353411A (ja) * 1998-06-08 1999-12-24 Oki Electric Ind Co Ltd 文字認識装置
JP2002007951A (ja) * 2000-06-19 2002-01-11 Hitachi Ltd 帳票入力方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP2003223610A (ja) * 2002-01-28 2003-08-08 Toshiba Corp 文字認識装置及び文字認識方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011198285A (ja) * 2010-03-23 2011-10-06 Hitachi Solutions Ltd 文書処理システム、及びプログラム
WO2019193923A1 (ja) 2018-04-02 2019-10-10 日本電気株式会社 画像処理装置、画像処理方法および記録媒体
US11482029B2 (en) 2018-04-02 2022-10-25 Nec Corporation Image processing device, image processing method, and recording medium
CN112449071A (zh) * 2019-08-30 2021-03-05 富士施乐株式会社 信息处理装置以及记录媒体
JP2021039428A (ja) * 2019-08-30 2021-03-11 富士ゼロックス株式会社 情報処理装置、及び情報処理プログラム
JP7354697B2 (ja) 2019-08-30 2023-10-03 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP2021131593A (ja) * 2020-02-18 2021-09-09 キヤノン株式会社 データ入力支援装置、データ入力支援方法、表示装置、及びプログラム
JP7458816B2 (ja) 2020-02-18 2024-04-01 キヤノン株式会社 データ入力支援装置、データ入力支援方法、表示装置、及びプログラム

Also Published As

Publication number Publication date
CN101430758A (zh) 2009-05-13
US8015203B2 (en) 2011-09-06
US20090125509A1 (en) 2009-05-14
CN101430758B (zh) 2012-10-10
JP4998219B2 (ja) 2012-08-15

Similar Documents

Publication Publication Date Title
JP4998219B2 (ja) 帳票認識プログラム、帳票認識装置および帳票認識方法
JP3425408B2 (ja) 文書読取装置
US20070098263A1 (en) Data entry apparatus and program therefor
US10963717B1 (en) Auto-correction of pattern defined strings
JP4998220B2 (ja) 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
JP2009110444A (ja) 画像認識プログラム、画像認識装置および画像認識方法
RU2571396C2 (ru) Способ и система для верификации в процессе чтения
US9811565B2 (en) Error identification, indexing and reporting construction documents
TW200416583A (en) Definition data generation method of account book voucher and processing device of account book voucher
JP2005216203A (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
JPWO2014068770A1 (ja) データ抽出方法、データ抽出装置及びそのプログラム
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
US9292510B2 (en) Systems and methods for indexing and linking electronic documents
JP3484446B2 (ja) 光学文字認識装置
WO2019087593A1 (ja) 文書検索装置および方法
JPH0660222A (ja) 文字認識装置
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
JP7127365B2 (ja) 文字切り出し装置、文字切り出し方法、及びプログラム
AU2013200005B2 (en) Method and apparatus for analyzing abbreviations in a document
KR102632771B1 (ko) 카탈로그 이미지의 데이터 추출 시스템 및 카탈로그 이미지의 데이터 추출 방법
JP3507720B2 (ja) オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体
JP4633773B2 (ja) 文書画像処理装置および方法
JP2010134766A (ja) 文書データ処理装置およびそのプログラム
JPH0562008A (ja) 文字認識方法
JP3355289B2 (ja) 文字データの自動校正方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120430

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees