JP2010157107A - 業務文書処理装置 - Google Patents

業務文書処理装置 Download PDF

Info

Publication number
JP2010157107A
JP2010157107A JP2008335216A JP2008335216A JP2010157107A JP 2010157107 A JP2010157107 A JP 2010157107A JP 2008335216 A JP2008335216 A JP 2008335216A JP 2008335216 A JP2008335216 A JP 2008335216A JP 2010157107 A JP2010157107 A JP 2010157107A
Authority
JP
Japan
Prior art keywords
imprint
character string
business document
character
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008335216A
Other languages
English (en)
Inventor
Mitsuharu Ohazama
光晴 大峡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2008335216A priority Critical patent/JP2010157107A/ja
Priority to PCT/JP2009/006889 priority patent/WO2010073540A1/en
Priority to US13/057,207 priority patent/US20110135209A1/en
Priority to EP09834354.4A priority patent/EP2370933A4/en
Priority to CN2009801387856A priority patent/CN102171708A/zh
Publication of JP2010157107A publication Critical patent/JP2010157107A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】グレースケールで保管された業務文書に対してOCRを適用する際に、文字列と印影が重なっている場合であっても、文字列の情報を残しつつ印影だけを除去するための技術を提供する。
【解決手段】印影の近傍に存在する文字列を、データベースと照合することにより、印影と重なった文字列を推定する。より具体的には、まず、グレースケールで入力された業務文書における印影領域を除去する。次に、除去された印影領域の近傍に存在する文字情報であって、一部の文字が印影領域によって不明確となっている文字情報を印影関連情報として抽出する。そして、抽出された印影関連情報の属性を特定し、文字列候補を格納する取引先の情報を格納する取引先データベースを参照して、属性毎に分類された印影関連情報を基に、印影領域と重複して不明確となっている文字列を推定する。
【選択図】図1

Description

本発明は、業務文書処理装置に関し、例えば、業務文書中の印影を除去するための技術に関するものである。
近年、組織内に蓄積された膨大な紙の業務文書に対して、スキャン及びOCRによる文字認識を行い、文書データを文書管理システムで管理することで、検索性向上、紙文書の安全な保管、知識の共有を図ろうとする動きがある。
現状のOCRは、ノイズのない文書に対する文字列の認識精度は高いが、文字列の上に、例えば、社印などの印影が重なっていると、その部分を誤認識してしまうという問題がある。誤認識すると、その部分の文字情報を取得できないだけでなく無意味な文字情報がノイズとなり残ってしまい検索時の障害となる。業務文書に存在する印影は、取引先名、取引先代表社名などの取引先に関する情報の上に重ねて押印されていることが多いという特徴がある。これらの情報は、その文書を特定する上で不可欠な情報であることが多い。そのため、これらの情報を認識できないと、検索時にこの文書を絞り込むことができず、登録されている文書データをすべてチェックしなければならない。そのため、OCRを適用する際には、印影と重複した文字列も高精度で文字認識を行う必要がある。
このようなOCRによる認識精度を高めるため、文字列と重なった印影を分離する手法が提案されている。例えば、特許文献1及び特許文献2では、印影の色と文書に書かれている文字の色との違いを利用して、文字と区別して印影を認識・除去する技術が提案されている。これにより、文字と印影が重なっている場合でも、重なった文字を残したまま印影のみを除去することができる。
また、特許文献3では、印影の輪郭形状が正多角形となることが多いことを利用して印影を認識・除去する技術が提案されている。これにより、文字と印影が重なっている場合、印影及び印影と重なった文字列を除去することで、OCRによる誤認識を防ぐことができる。
特開2008−176521号公報 特開2006−309781号公報 特開平9−229646号公報
しかしながら、既に電子的に蓄積された業務文書はグレースケールで保管されていることもあるため、カラーの印影を認識するための技術である特許文献1及び2の技術では対応できない。つまり、図2はグレースケールでスキャンされた業務文書の例を示す図であるが、その右上の位置に、会社情報の一部と重複して社印が押されている。この文書は、グレースケールでスキャンされているため、色情報を利用して印影を認識する特許文献1及び2の技術を適用しても印影部分を認識することができない。
また、図3は、図2の業務文書に対して特許文献3の技術で印影を除去し、残った文字をOCRで認識した結果を示す図である。特許文献3の技術で印影を除去した場合、図3のように、印影と共に重なった文字列まで除去してしまう。そのため、除去された文字列の情報は失われてしまう。また、文字が中途半端に残ってしまうため、残った文字が、検索時にノイズとなる可能性がある。
本発明はこのような状況に鑑みてなされたものであり、グレースケールで保管された業務文書に対してOCRを適用する際に、文字列と印影が重なっている場合であっても、文字列の情報を残しつつ印影だけを除去するための技術を提供するものである。
上記課題を解決するために、本発明による業務文書処理装置は、グレースケールで入力された業務文書における印影領域を検出し、業務文書から印影領域を除去する印影検出処理部と、印影領域が除去された業務文書において、除去された印影領域の近傍に存在する文字情報であって、一部の文字が印影領域によって不明確となっている文字情報を印影関連情報(例えば、取引先に関連する情報)として抽出する印影関連情報抽出処理部と、抽出された印影関連情報の属性を特定する属性分類処理部と、文字列候補を格納する文字列候補データベース(例えば、取引先の情報を格納する取引先データベース)を参照して、属性毎に分類された印影関連情報を基に、印影領域と重複して不明確となっている文字列を推定する文字推定処理部と、を備える。
また、文字推定処理部は、推定して得られた文字列を印影領域によって不明確となっている部分に補完し、文字列が補完された業務文書データを、グレースケールで入力された業務文書と対にして文書データベースに登録する。
さらに、業務文書処理装置は、文字列が補完された業務文書データを表示部に表示する表示処理部を備える。この場合、表示処理部は、補完すべき文字列候補が複数ある場合には、当該複数の候補が補完された複数の業務文書データを前記表示部に表示し、文字列推定処理部は、複数の業務文書データのうち、ユーザによって選択された業務文書データを文書データベースに登録する。
また、文字推定処理部は、文字列候補データベースに格納された情報と、属性毎に分類された印影関連情報とのマッチ度を算出し、当該マッチ度が所定値より大きい場合に補完すべき文字列候補とする。一方、マッチ度が所定値以下であった場合には、文字を印影領域に補完せずに、処理を終了する。
さらなる本発明の特徴は、以下本発明を実施するための最良の形態および添付図面によって明らかになるものである。
本発明によれば、グレースケールで入力された文書に存在する文字列が社印などの印影と重複している場合であっても当該文書を認識することが可能となる。これにより、業務文書の検索性が向上し、文書管理システムの効果がさらに高まる。
以下、添付図面を参照しながら、本発明の業務文書処理装置を実施するための最良の形態を詳細に説明する。図1〜図10は、本発明の実施形態を例示する図である、これらの図において、同一の符号を付した部分は同一物を表し、基本的な構成及び動作は同様であるものとする。尚、本発明の実施形態において、使用される機器、手法等は一例であり、本発明はこれらに限定されるものではないことは勿論である。
<業務文書処理装置の構成>
図1は、本発明の実施形態による業務文書処理装置の概略構成を示す機能ブロック図である。この業務文書処理装置は、顧客との取引などに関する業務文書及びそれに対して構築されたインデックスを保存した文書データベース51と、取引先の法人名、住所、代表電話番号などを含む取引先情報及びそれに対して構築されたインデックスを保存した取引先データベース52と、文字列の属性の定義データが保存された属性データベース53と、データの入出力を行うための入出力装置30と、必要な演算処理及び制御処理等を行う中央処理装置10と、中央処理装置10での処理に必要なプログラムを格納するプログラムメモリ40と、中央処理装置10での処理に必要なデータを格納するデータメモリ20と、を備えている。
入出力装置30は、データを表示するための表示装置32やプリンタ(図示せず)等で構成される出力部と、表示されたデータに対してメニューを選択するなどの操作を行うためのキーボード31、マウスなどのポインティングデバイス33や文書を取り込むためのスキャナ34等で構成される入力部と、を有している。
プログラムメモリ40は、文書中に存在する社印などの印影を検出する印影検出処理部41と、文書中の文字認識を行うOCR処理部42と、印影の周囲に存在する文字列ブロックを切り出す印影関連情報領域抽出処理部43と、文字列ブロック中の文字列の属性を分類する属性分類処理部44と、文字補完処理部45と、を含んでいる。なお、各処理部は、プログラムコードとしてプログラムメモリ40に格納されており、中央処理装置10が各プログラムコードを実行するによって各処理部が実現される。
データメモリ20は、紙文書をグレースケールでスキャンしたグレー画像データ21と、グレー画像データ21に対してOCRを適用することによって生成されるOCR結果データ22と、OCR結果データ22内の、印影領域の近傍の文字列ブロックの情報が格納される印影関連データ23と、を含んでいる。
図2は、データメモリ20に含まれるグレー画像データ21の例を示す図である。右上の位置に、社名の一部と重複して社印が押されている。原本では、印影は朱色、文字色は黒色であり、印影と文字色の色が異なるが、グレースケールでスキャンしているため文字と印影が同色となっている。このデータに対して、カラー印影を認識・分離する特許文献1及び2の技術を適用しても印影と文字を分離することができない。また、特許文献3の技術を適用した場合、印影と文字とを区別することはできないため、図2の画像データにこの技術を適用すると、図3のように印影及び印影と重なった文字列が除去される。
図3は、データメモリ20に含まれるOCR結果データ22の例を示す図である。印影が押されている領域内は、印影除去技術により、文字列も含めて除去されている。また、OCR適用により、文字の太字設定、下線などは除去され、フォントは統一される。一般にOCRは下線や太字情報などを認識できないためである。
図4は、データメモリ20に含まれる印影関連データ23の例を示す図である。OCR結果データ22における、除去された印影が存在した近傍の領域を切り出したデータである。図4(a)は、印影関連領域及び印影領域を明示的に示した図である。図4(b)は、OCR結果データ22から、印影関連領域のみを切り出した図である。図4(c)は、印影関連データ23に含まれる文字列に、各文字列が該当する属性を付与した状態を示す図である。図4(d)及び(e)は、印影関連データ23に含まれる文字列に対して、文字間隔を解析し、印影によって欠損した文字数を推測した例を示す図である。OCR処理によって文字列のフォントサイズが分かるので、不明な文字が存在するスペースの大きさから何文字存在するかが判明する。
図5は、文書データベース51に含まれる文書データの例を示す図である。文書データは、図5(a)に示されるスキャンされた業務文書と、図5(b)に示されるインデックスデータ(印影認識処理がなされ印影部分に適切な文字が補充され、登録されたデータ)からなる。文書データには、一意に識別可能な文書IDが付与されている。また、全文テキストの情報を持っており全文検索が可能となっている。
図6は、取引先データベース52に含まれる取引先に関するデータの例を示す図である。取引先を一意に示す取引先番号、取引先名、住所などの情報が格納されている。
図7は、属性データベース53に含まれる属性の定義データの例を示す図である。図7には、文字列を、郵便番号、都道府県名、及び区市町村名などに分類するための定義が記載されている。図7の例では、一行目に「文字パターン:属性」で表記されている。これは例えば、「〒xxx−xxxx:“郵便番号”」は、文字列中に「〒xxx−xxxx」(xは0〜9の任意の数字)という記述があれば、その文字列の属性は郵便番号であることを意味する。
<業務文書処理装置における処理>
次に、上述の構成を有する業務文書処理装置において行われる処理について説明する。図8は、業務文書処理装置による処理の流れを概略的に示すフローチャートである。
図8において、まず、中央処理装置10は、印影検出処理部41を用いて、スキャナ34によって入力された業務文書中から印影を検出及び除去を行う(ステップS801)。次に、OCR処理部42が、業務文書に対してOCRを適用し、文書内の文字情報を認識する(ステップS802)。また、印影関連情報領域抽出処理部43が、OCR結果データ22における印影が存在した近傍の領域を切り出して印影関連データ23を抽出する(ステップS803)。続いて、属性分類処理部44が、印影関連データ23上に存在する文字列の属性を決定する(ステップS804)。最後に、文字補完処理部45が、印影関連データ23を取引先データベース52に格納されている各取引先のデータとマッチングし、該当する取引先の推定を行う(ステップS805)。それぞれのステップにおける処理について、以下詳細に説明する。
<印影検出処理>
図8における、業務文書内に含まれる印影を検出する処理(ステップS801)の詳細について説明する。
まず、印影検出処理部41は、業務文書をグレースケールでスキャンして得られたグレー画像データ21を読み込み、グレー画像データ21内における印影の領域を探索する。この際、印影は特許文献3の技術などの従来技術を適用して探索される。そして、印影検出部41は、印影探索後、その印影の輪郭を含む多角形の領域を除去する。この際、特許文献3の技術では、印影と、文字列を分離して認識することはできないため、印影領域を除去すると文字列も含めて除去される。この時除去された文字列は、後述するように、文字補完処理部45によって周囲の文字列から推測することで補完される。
<印影関連情報領域抽出処理>
次に、図8における、業務文書内に含まれる取引先情報を含む領域を抽出する処理(ステップ803)の詳細について説明する。この処理では、図3に示すようなOCR結果データ22から、図4(b)に示すような印影領域及び印影領域の近傍に存在する取引先に関する文字列ブロックを切り出す処理を行う。
まず、印影関連情報領域抽出処理部43は、印影領域(印影検出処理によって印影が検出された領域)を、印影関連情報領域の初期値として設定し、近傍に存在する文字列を含むように印影関連情報領域を拡大する。具体的には、印影関連情報領域抽出処理部43は、印影関連情報領域の周囲の文字列を探索する。例えば、OCR処理によって印影の周辺部に存在する文字列のフォントサイズが判るので、そのフォントサイズよりも小さい幅(距離)で繋がっている一連の文字を1つの文字列として判断するようにしてもよい。そして、印影関連情報領域抽出処理部43は、その文字列を含む矩形領域を、印影関連情報領域の一部として、印影関連情報領域を拡大し、印影関連データ23としてデータメモリに保存する。
<属性分類処理>
図8における、印影関連データ23に含まれる文字列の属性を付与する処理(ステップS804)の詳細について説明する。
まず、属性分類処理部44は、印影関連データ23を読み込み、印影関連データ23内の文字列を一行ずつ分割し、各行の文字列の属性を付与する。具体的には、属性分類処理部44が、各行の文字列を、属性データベース53を用いて形態素解析し、それぞれの文字列に合った属性を判定する。
本実施形態では、属性データベース53が、「(文字パターン):(属性)」のフォーマットで記述された場合の例で説明する。例えば、属性データベース53に「〒xxxーxxxx:”郵便番号”」と記述されている場合(xは0〜9の任意の数字)、対象文字列が「〒100−0000」であれば、この文字列は郵便番号のフォーマットに合致したとし、この文字列には郵便番号の属性が付与される。また、「電話:”電話番号”」と記述されている場合、対象文字列が「電話(03)1234−5678」のように“電話”(或いは”TEL”)という文字列を含むため電話番号の属性が付与される。さらに、「“都道府県名”+“区市町村名”:“住所”」のように指定されている場合もある。これは、都道府県名属性の文字列と区市町村名属性の文字列が連結していた場合、住所属性となることを表す。このようにして、各文字列に対して属性が付与される。なお、各属性の定義は互いに独立しており、定義が衝突することはない。また、同じ属性を表すパターンは複数のパターンが登録されており、表記の揺れを吸収することができるものとする。
<文字補完処理>
図8における、印影との重複により欠損した文字を補完する処理の詳細について、図9に示す詳細フローチャートを参照しながら説明する。以下、各ステップにおける動作主体は、特に断らない限り文字補完処理部とする。
まず、印影関連データ23を読み込む(ステップS901)。次に、変数Mmaxとnを初期化する(ステップS902)。また、可変長配列max_idを空にする(ステップS903)。
その後、ステップS904からステップS911までの処理で、印影関連データに含まれる取引先情報に対して最も一致していると思われる取引先を選定する。まず、取引先データベース52から未処理の取引先のデータを読み込む(ステップS904)。次に、印影関連データ23内の各文字列のレイアウトを設定する(ステップS905)。具体的には、図4(d)及び(e)に示すように、各文字列上に存在する、印影により欠損した領域に含まれる文字数を推定する。これはフォントサイズ、空白領域の大きさによって推定される。図4(d)及び(e)では、文字が存在すると判定した領域を「?」で示している。
そして、ステップS904で選択した取引先のデータと、印影関連データ23上のデータとを照合し、マッチ度Mnを算出する(ステップS906)。Mnは、一致した文字数が多ければ大きく、一致しなかった文字数が多い場合や、文字数が合わない場合に小さく計算される。マッチ度の算出には、例えばアライメントスコアなどの既存技術を用いることができる。図4の例では、ステップS804で郵便番号・住所・取引先名・代表者・電話番号の属性が付与されているので、図6に示す取引先に関する各情報のうち、点線の四角で囲まれた属性の値(実線の四角で囲まれた値)とのマッチ度をそれぞれ算出することになる。
続いて、Mnが最大値Mmaxより等しいかまたは大きいか否かを判定し(ステップS907)、大きければMmaxをMnで更新する(ステップS908)。また、そのときのnすなわち取引先を示すIDをmax_idに追加する(ステップS909)。この際、ステップS903の比較において等しかった場合はmax_idにnを追加し、ステップS903の比較においてMnがMmaxより大きかった場合はmax_idが保持していた内容はいったん破棄し、max_idはnのみを含むようにする。
その後、nをインクリメントする(ステップS910)。そして、すべての取引先のデータと照合したか否かを判定し(ステップS911)、未処理の取引先のデータがあるならステップ904からステップ910までの処理を繰り返す。未処理の取引先のデータがなければステップS912に進み、Mmaxが閾値Tより大きいか否かを判定する(ステップS912)。Tはあらかじめ決定された定数であり、照合の結果が十分に確からしいか否かを判定する際の閾値である。
MmaxがTより大きい場合は、Mmaxをとるときの取引先のデータ、すなわちmax_idに対応する取引先データで、印影除去による欠損した文字列を補完する(ステップS913)。MmaxがT以下の場合は、一致率が不十分であることを意味するため、該当する取引先のデータは存在しないと判定し、印影関連データ23内の文字列を全て除去する(ステップS914)。この場合、中央処理装置10は、例えば認識処理が失敗したことを図10のGUI上に表示するようにしても良い。これにより中途半場に残った文字列が検索時にノイズとなることを防ぐことが可能となる。
最後に、図10に示すような確認画面を表示し、補完あるいは除去した結果をユーザに確認させる(ステップS915)。画面の上部には、印影関連データ23とmax_idに保持されている取引先IDに該当する取引先のデータを、各属性の値ごとに並べた表で表示する。これにより、ユーザは、文書の画像で印影の周辺にある文字列と補完する候補として選ばれたマッチ度が最大であった取引先の各属性の値である文字列とが、どの程度マッチしているかを確認することができる。例えば、文書の画像では取引先名は中央に不明文字が3文字入った文字列「○×ソフ???会社」であり、候補1の取引先名はこれにマッチする文字列「○×ソフト株式会社」であることが分かる。
また、確認画面上では、補完する候補として選ばれた取引先のうち、ユーザが指定したものが強調表示されている(図10の例では候補1が網掛けで表示されている)。この指定した取引先の情報を画像に埋め込んだ結果が画面下部に表示されており、ユーザは文書画像全体と併せて確認することができる。
さらに、画面上部の表に表示されている他の取引先をユーザが指定すると、指定された取引先が強調表示され、同時に画面下部の文書画像と合わせて表示されている取引先の情報も切り替わる。このような表示から、ユーザはどの候補が補完するのに適切であるかを判断することができる。補完するのに適切な候補が表示されているとユーザが判断した場合は、ユーザはダイアログの「はい」ボタンを押下することで了承を指示することができる。ユーザの了承が得られた場合は、処理結果を取引先データベースに反映させる。ユーザの了承が得られなかった場合は、処理をキャンセルする。
<まとめ>
本発明の実施形態では、図2のようなグレースケールでスキャンされた業務文書に対して、まず特許文献3の技術を適用し文書の中から印影の領域を認識し、その領域を除去する。印影が文字列と重複して押印されている場合は、文字列まで含めて除去する。その後、残った文字列(印影と重複していなかった文字列)をOCRにより認識する。その結果図3のようなデータが得られる。
次に、図4(a)のように、除去した印影の周囲に存在する文字列のブロックを、除去した印影に関連する情報を持つ領域として切り分ける。そして切り分けた領域内の文字列を、その文字列と関連する情報が格納されたデータベースと照合し、どのデータに関する情報かを判定する。照合の際には、切り分けた文字列を、例えば図4(c)のように、郵便番号、住所、取引先名などの属性に分け、それぞれの属性情報をデータベースと比較する。データベースは、例えば図6のようなデータ形式で構成される。照合の結果、各文字列の情報が最も合致しているデータを、その業務文書に関連するデータと判断する。そして、印影領域を除去したことにより欠損した文字を、データベース上の該当するデータで補う。
このような処理を実行することにより、文書内に取引先情報を持つ文字列と重複して印影が存在する場合でも、その文字列の周囲の情報を利用することにより、その文書の取引先情報を自動的かつ高精度に取得することができるようになる。
なお、本実施形態では、印影と重複した文字列が取引先の情報を持つ文字列の場合について述べている。しかし、本発明は、印影と重複した文字列が、取引先に関する情報を持つ文字列に限定されるものではなく、あらゆる文字列に対して処理を実行しても良い。つまり、欠損した文字列をデータベースと照合することにより推定可能であれば、あらゆる文書に対して適用可能である。
また、本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
また、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
本発明の実施形態による業務文書処理装置の構成を概略的に示す機能ブロック図である。 図1に示すデータメモリ内に記憶されているグレー画像データの例を示す図である。 図1に示すデータメモリ内に記憶されているOCR結果データの例を示す図である。 図1に示すデータメモリ内に記憶されている印影情報データの例を示す図である。 図1に示す文書データベース内に含まれている文書データの例を示す図である。 図1に示す文書データベース内に含まれている文書データの例を示す図である。 図1に示す取引先データベース内に含まれている取引先データの例を示す図である。 図1に示す属性データベース内に含まれている属性データの例を示す図である。 本発明の実施形態による業務文書処理装置における処理を説明するためのフローチャートである。 業務文書処理プログラムの文字補完処理部による処理(ステップS805)の詳細を説明するためのフローチャートである。 印影により欠損した文字列を補完した結果を示す確認画面の例を示す図である。
符号の説明
10・・・中央処理装置
20・・・データメモリ
21・・・グレー画像データ
22・・・OCR結果データ
23・・・印影関連データ
30・・・入出力装置
31・・・キーボード
32・・・表示装置
33・・・ポインティングデバイス
40・・・業務文書処理プログラム
41・・・印影検出処理部
42・・・OCR処理部
43・・・印影関連情報領域抽出処理部
44・・・属性分類処理部
45・・・文字補完処理部
51・・・文書データベース
52・・・取引先データベース
53・・・属性データベース

Claims (6)

  1. 業務文書を取り込んで認識処理するための業務文書処理装置であって、
    グレースケールで入力された業務文書における印影領域を検出し、前記業務文書から前記印影領域を除去する印影検出処理部と、
    前記印影領域が除去された前記業務文書において、前記除去された印影領域の近傍に存在する文字情報であって、一部の文字が前記印影領域によって不明確となっている文字情報を印影関連情報として抽出する印影関連情報抽出処理部と、
    前記抽出された印影関連情報の属性を特定する属性分類処理部と、
    文字列候補を格納する文字列候補データベースを参照して、前記属性毎に分類された印影関連情報を基に、前記印影領域と重複して不明確となっている文字列を推定する文字推定処理部と、
    を備えることを特徴とする業務文書処理装置。
  2. 前記文字推定処理部は、前記推定して得られた文字列を前記印影領域によって不明確となっている部分に補完し、文字列が補完された業務文書データを、前記グレースケールで入力された業務文書と対にして文書データベースに登録することを特徴とする請求項1に記載の業務文書処理装置。
  3. さらに、前記文字列が補完された業務文書データを表示部に表示する表示処理部を備え、
    前記表示処理部は、補完すべき文字列候補が複数ある場合には、当該複数の候補が補完された複数の業務文書データを前記表示部に表示し、
    前記文字推定処理部は、前記複数の業務文書データのうち、ユーザによって選択された業務文書データを前記文書データベースに登録することを特徴とする請求項2に記載の業務文書処理装置。
  4. 前記印影関連情報抽出処理部は、前記印影関連情報として、取引先に関連する情報を抽出し、
    前記文字推定処理部は、取引先の情報を格納する取引先データベースを参照することを特徴とする請求項1に記載の業務文書処理装置。
  5. 前記文字推定処理部は、前記文字列候補データベースに格納された情報と、前記属性毎に分類された印影関連情報とのマッチ度を算出し、当該マッチ度が所定値より大きい場合に前記補完すべき文字列候補とすることを特徴とする請求項3に記載の業務文書処理装置。
  6. 前記文字推定処理部は、前記マッチ度が所定値以下であった場合には、文字を前記印影領域に補完せずに、処理を終了することを特徴する請求項5に記載の業務文書処理装置。
JP2008335216A 2008-12-26 2008-12-26 業務文書処理装置 Pending JP2010157107A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008335216A JP2010157107A (ja) 2008-12-26 2008-12-26 業務文書処理装置
PCT/JP2009/006889 WO2010073540A1 (en) 2008-12-26 2009-12-15 Business document processor
US13/057,207 US20110135209A1 (en) 2008-12-26 2009-12-15 Business document processor
EP09834354.4A EP2370933A4 (en) 2008-12-26 2009-12-15 DEVICE FOR PROCESSING COMMERCIAL DOCUMENTS
CN2009801387856A CN102171708A (zh) 2008-12-26 2009-12-15 商业文档处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008335216A JP2010157107A (ja) 2008-12-26 2008-12-26 業務文書処理装置

Publications (1)

Publication Number Publication Date
JP2010157107A true JP2010157107A (ja) 2010-07-15

Family

ID=42287197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008335216A Pending JP2010157107A (ja) 2008-12-26 2008-12-26 業務文書処理装置

Country Status (5)

Country Link
US (1) US20110135209A1 (ja)
EP (1) EP2370933A4 (ja)
JP (1) JP2010157107A (ja)
CN (1) CN102171708A (ja)
WO (1) WO2010073540A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6646308B1 (ja) * 2019-03-07 2020-02-14 ファーストアカウンティング株式会社 証憑解析装置、会計処理システム、証憑解析方法、証憑解析プログラム
JP2021099752A (ja) * 2019-12-23 2021-07-01 キヤノン株式会社 画像を処理するための装置、プログラム、画像処理方法
WO2021181704A1 (ja) * 2020-03-13 2021-09-16 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933859B1 (en) 2010-05-25 2011-04-26 Recommind, Inc. Systems and methods for predictive coding
JP5225348B2 (ja) * 2010-09-27 2013-07-03 シャープ株式会社 印刷システム、プリンタドライバ、画像形成装置、及び印刷方法
US9785634B2 (en) 2011-06-04 2017-10-10 Recommind, Inc. Integration and combination of random sampling and document batching
CN103164388B (zh) * 2011-12-09 2016-07-06 北大方正集团有限公司 一种版式文件中结构化信息获取的方法及装置
US9465801B2 (en) * 2013-01-29 2016-10-11 Transbit Technologies Software Private Limited Method and system for automatic processing and management of technical digital documents and drawings
US9361536B1 (en) * 2014-12-16 2016-06-07 Xerox Corporation Identifying user marks using patterned lines on pre-printed forms
CN107408214B (zh) 2015-01-30 2021-07-09 惠普发展公司,有限责任合伙企业 M进制循环编码
US10902066B2 (en) 2018-07-23 2021-01-26 Open Text Holdings, Inc. Electronic discovery using predictive filtering
JP2021157375A (ja) * 2020-03-26 2021-10-07 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN114694154A (zh) * 2022-04-11 2022-07-01 平安国际智慧城市科技股份有限公司 文件解析方法、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01181177A (ja) * 1988-01-14 1989-07-19 Toshiba Corp 文字検出切出装置
JPH11272804A (ja) * 1998-03-25 1999-10-08 Hitachi Ltd 文字認識方法および装置
JP2004280530A (ja) * 2003-03-17 2004-10-07 Oki Electric Ind Co Ltd 帳票処理システム及び帳票処理方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW222337B (ja) * 1992-09-02 1994-04-11 Motorola Inc
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JP2000251012A (ja) * 1999-03-01 2000-09-14 Hitachi Ltd 帳票処理方法およびシステム
US20050185225A1 (en) * 2003-12-12 2005-08-25 Brawn Dennis E. Methods and apparatus for imaging documents
US7415171B2 (en) * 2005-03-28 2008-08-19 United States Postal Service Multigraph optical character reader enhancement systems and methods
JP2007140703A (ja) * 2005-11-15 2007-06-07 Oki Electric Ind Co Ltd 保険証読取方法、そのシステム及び保険証認識装置
JP4443576B2 (ja) * 2007-01-18 2010-03-31 富士通株式会社 パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
JP4935459B2 (ja) * 2007-03-28 2012-05-23 沖電気工業株式会社 文字認識方法、文字認識プログラムおよび文字認識装置
JP4998219B2 (ja) * 2007-11-09 2012-08-15 富士通株式会社 帳票認識プログラム、帳票認識装置および帳票認識方法
US8467614B2 (en) * 2007-11-28 2013-06-18 Lumex As Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01181177A (ja) * 1988-01-14 1989-07-19 Toshiba Corp 文字検出切出装置
JPH11272804A (ja) * 1998-03-25 1999-10-08 Hitachi Ltd 文字認識方法および装置
JP2004280530A (ja) * 2003-03-17 2004-10-07 Oki Electric Ind Co Ltd 帳票処理システム及び帳票処理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG199900107002; 杉山淳一 外5名: '文書画像理解における単語情報と論理構造の援用法' 電子情報通信学会技術研究報告 第89巻 第389号, 19900125, 第9〜16頁, 社団法人電子情報通信学会 *
JPN6012033781; 杉山淳一 外5名: '文書画像理解における単語情報と論理構造の援用法' 電子情報通信学会技術研究報告 第89巻 第389号, 19900125, 第9〜16頁, 社団法人電子情報通信学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6646308B1 (ja) * 2019-03-07 2020-02-14 ファーストアカウンティング株式会社 証憑解析装置、会計処理システム、証憑解析方法、証憑解析プログラム
WO2020179055A1 (ja) * 2019-03-07 2020-09-10 ファーストアカウンティング株式会社 証憑解析装置、会計処理システム、証憑解析方法、証憑解析プログラム
JP2021099752A (ja) * 2019-12-23 2021-07-01 キヤノン株式会社 画像を処理するための装置、プログラム、画像処理方法
JP7433887B2 (ja) 2019-12-23 2024-02-20 キヤノン株式会社 画像を処理するための装置、プログラム、画像処理方法
WO2021181704A1 (ja) * 2020-03-13 2021-09-16 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JPWO2021181704A1 (ja) * 2020-03-13 2021-09-16
JP7282257B2 (ja) 2020-03-13 2023-05-26 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Also Published As

Publication number Publication date
US20110135209A1 (en) 2011-06-09
EP2370933A1 (en) 2011-10-05
EP2370933A4 (en) 2015-03-25
WO2010073540A1 (en) 2010-07-01
CN102171708A (zh) 2011-08-31

Similar Documents

Publication Publication Date Title
JP2010157107A (ja) 業務文書処理装置
JP5357612B2 (ja) 下線除去装置
US20100303356A1 (en) Method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
US7796817B2 (en) Character recognition method, character recognition device, and computer product
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
JP7433887B2 (ja) 画像を処理するための装置、プログラム、画像処理方法
CN1525378A (zh) 票据定义数据生成方法以及票据处理装置
JP2000293626A (ja) 文字認識方法及び装置ならびに記憶媒体
JP2006301695A (ja) 文書処理装置およびプログラム
JP2007058304A (ja) 文字認識装置及び文字認識方法
JP2004046325A (ja) データ入力装置、データ入力プログラムおよびデータ入力プログラムを記録した記録媒体
JP2012190434A (ja) 帳票定義装置、帳票定義方法、プログラム及び記録媒体
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2008108114A (ja) 文書処理装置および文書処理方法
JP5096989B2 (ja) 文書処理装置及び文書処理方法
JP2008282094A (ja) 文字認識処理装置
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP4518212B2 (ja) 画像処理装置及びプログラム
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
US20110033114A1 (en) Image processing apparatus and computer readable medium
JP2009182530A (ja) 業務処理遂行支援装置
JP4083723B2 (ja) 画像処理装置
JP7552113B2 (ja) 情報処理装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120830

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121113