JP2011060219A - 文書分類システム、文書分類方法、及びプログラム - Google Patents
文書分類システム、文書分類方法、及びプログラム Download PDFInfo
- Publication number
- JP2011060219A JP2011060219A JP2009212212A JP2009212212A JP2011060219A JP 2011060219 A JP2011060219 A JP 2011060219A JP 2009212212 A JP2009212212 A JP 2009212212A JP 2009212212 A JP2009212212 A JP 2009212212A JP 2011060219 A JP2011060219 A JP 2011060219A
- Authority
- JP
- Japan
- Prior art keywords
- document
- specific item
- metadata
- image data
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【課題】様々な様式で記入される文書から読み出した入力内容を業務システムに連動させる。
【解決手段】文書に含まれる特定の項目の位置を示す位置情報等を、特定の項目毎に様式メタデータとして、文書毎に様式メタデータ保存部14に保存する。文書を読み取って得た画像データより、特定の項目の位置に基づく位置情報を求め、様式メタデータと照合して、画像データとして入力された文書に含まれる特定の項目が様式メタデータに登録されているか否かを判断する。画像データとして入力された文書に含まれる特定の項目が様式メタデータに合致しない場合に、特定の項目の位置情報を、新たな様式メタデータとして様式メタデータ保存部に登録し、合致する場合に、特定の項目に含まれる内容を文字データに変換する。そして、文字データを所定のフォーマットに整えて文字データを処理する業務システムに連動する連動データを作成し、連動データを出力する。
【選択図】図1
【解決手段】文書に含まれる特定の項目の位置を示す位置情報等を、特定の項目毎に様式メタデータとして、文書毎に様式メタデータ保存部14に保存する。文書を読み取って得た画像データより、特定の項目の位置に基づく位置情報を求め、様式メタデータと照合して、画像データとして入力された文書に含まれる特定の項目が様式メタデータに登録されているか否かを判断する。画像データとして入力された文書に含まれる特定の項目が様式メタデータに合致しない場合に、特定の項目の位置情報を、新たな様式メタデータとして様式メタデータ保存部に登録し、合致する場合に、特定の項目に含まれる内容を文字データに変換する。そして、文字データを所定のフォーマットに整えて文字データを処理する業務システムに連動する連動データを作成し、連動データを出力する。
【選択図】図1
Description
本発明は、例えば、証憑の項目内容に基づいて証憑を分類する場合に適用して好適な文書分類システム、文書分類方法、及びプログラムに関する。
従来、仕訳入力された大量の会計データを処理するため、様々な会計システムが利用されている。会計システムで処理される会計データは、一般的に紙媒体に記入された数値をユーザが仕訳入力して得られる。
証憑は、得意先に送る請求書や、仕入れ先から受け取る請求書、支払依頼書、自動引き落としの明細等、多くの種類が存在する。対象となる証憑がどの種類のどの様式の証憑であるかを特定するため、ユーザは手元に置いた証憑を目視して確認していた。
特許文献1には、テンプレートを使って請求書のデータ領域を識別し、パラメータを読み取る技術が開示されている。
ところで、ユーザが目視により証憑を確認しながら仕訳入力する場合、より確実性を担保するためには、入力した数値等が誤っていないか否かを、第三者を介してダブルチェックしなければならない。このため、データの入力作業が完了するまで多くの時間を費やしていた。また、入力内容を目視で確認することは、誤入力を見逃す要因となっていた。
また、特許文献1に記載された技術を用いても、予め決まったテンプレートが使用可能な請求書でなければデータ領域を識別できない。このため、取引先が増えて、様々な証憑が使用されると、その都度新たなテンプレートを作り直さなくてはならない。しかし、テンプレートを追加することは、ユーザにプログラムを変更するための専門知識が必要とされるので、必ずしも容易ではなく、結果として請求書以外の文書については、ユーザの入力作業に多大な負荷がかかっていた。
本発明はこのような状況に鑑みて成されたものであり、様々な様式で記入される文書から読み出した入力内容を業務システムに連動させる、文書分類システム、文書分類方法、及びプログラムを提供することを目的とする。
本発明は、文書に含まれる特定の項目が文書内の所定の位置に配されて文書の様式が定められる場合に、特定の項目の位置を示す位置情報及び特定の項目に記される文字又は画像に関する情報を、特定の項目毎に様式メタデータとして、文書毎に様式メタデータ保存部に保存する。
次に、文書に入力された特定の項目が含まれる画像データより、特定の項目の位置に基づく位置情報を求め、様式メタデータ保存部から読み出した様式メタデータと照合することによって、画像データとして入力された文書に含まれる特定の項目が様式メタデータに登録されているか否かを判断する。
次に、画像データとして入力された文書に含まれる特定の項目が様式メタデータに合致しない場合に、特定の項目の位置情報を、新たな様式メタデータとして様式メタデータ保存部に登録する。
次に、画像データとして入力された文書に含まれる特定の項目が様式メタデータに合致する場合に、特定の項目に含まれる内容を文字データに変換する。
そして、文字データを所定のフォーマットに整えて文字データを処理する業務システムに連動する連動データを作成し、連動データを出力する。
次に、文書に入力された特定の項目が含まれる画像データより、特定の項目の位置に基づく位置情報を求め、様式メタデータ保存部から読み出した様式メタデータと照合することによって、画像データとして入力された文書に含まれる特定の項目が様式メタデータに登録されているか否かを判断する。
次に、画像データとして入力された文書に含まれる特定の項目が様式メタデータに合致しない場合に、特定の項目の位置情報を、新たな様式メタデータとして様式メタデータ保存部に登録する。
次に、画像データとして入力された文書に含まれる特定の項目が様式メタデータに合致する場合に、特定の項目に含まれる内容を文字データに変換する。
そして、文字データを所定のフォーマットに整えて文字データを処理する業務システムに連動する連動データを作成し、連動データを出力する。
本発明によれば、様式メタデータに合致しない文書の画像データが入力されても、この文書の様式に合わせた様式メタデータを自動的に生成できる。そして、その文書が取込まれた際には、業務システムに連動データを出力することが可能となる。このため、ユーザが個別に文書の様式メタデータを登録し、連動データを生成する場合に比べて、手間が少なくなると共に、作業効率が向上するという効果がある。
以下、本発明の第1の実施の形態例について、図1〜図4を参照して説明する。本実施の形態例では、入力された証憑1の画像イメージから特定の項目を抽出して、会計システムに連動する会計連動データを出力する文書分類システムの一例として、証憑分類システム10に適用した例について説明する。
図1は、本例の証憑分類システム10の構成例を示す。
証憑分類システム10は、例えば、不図示のコンピュータ装置内で動作する。そして、コンピュータ装置は、画像を表示する表示部21と、ユーザの操作によって文字入力等が可能な操作部22を備える。
証憑分類システム10は、例えば、不図示のコンピュータ装置内で動作する。そして、コンピュータ装置は、画像を表示する表示部21と、ユーザの操作によって文字入力等が可能な操作部22を備える。
また、紙媒体の証憑1は、光学読取り部2によって読み取られ、画像データとして出力される。画像データは、例えば、PDF(Portable Document Format)、JPEG(Joint Photographic Experts Group)フォーマットで生成される。この画像データは、証憑分類システム10に入力される。
証憑分類システム10は、画像データより、証憑1の罫線等を認識して証憑1の様式を照合する様式照合部11と、証憑1毎の様式を様式メタデータとして保存する様式メタデータ保存部14を備える。ここで、事前に光学読取り部2が読み取った証憑1の画像データに含まれる特定の項目の位置情報が、証憑1の様式の基礎情報として用いる「様式メタデータ」に登録される。特定の項目としては、後述するものの、例えば、「証憑名称」、「請求日付」等がある。
また、証憑分類システム10は、様式メタデータ保存部14から読み出した様式メタデータに基づいて、証憑1内の所定の位置に配置された特定の項目に含まれる文字画像を文字データに変換する文字データ変換部12と、文字データを後続の会計システム20に連動させる会計連動データに変換する連動データ出力部13を備える。連動データ出力部13から出力された会計連動データは、業務システムの一例として挙げる、会計システム20に連動される。
また、証憑分類システム10は、入力された画像データが、新たな様式の証憑1を光学読取り部2が読み取って生成した画像データである場合に、この証憑1の様式から生成される様式メタデータを様式メタデータ保存部14に自動的に登録する様式メタデータ登録部15を備える。
様式メタデータ登録部15は、表示部21に新たな様式の証憑1からなる画像データを表示させ、操作部22から入力された内容を受け取って、様式メタデータ保存部14に登録する様式メタデータを編集する場合もある。様式メタデータの登録処理の詳細は後述する(図3、図4を参照)。
次に、証憑分類システム10の各機能ブロックの動作例を説明する。
まず、証憑1の様式は、証憑1に含まれる特定の項目が証憑1内の所定の位置に配されることによって定められる。そして、様式メタデータ保存部14は、証憑1における特定の項目の位置を示す位置情報を、特定の項目毎に様式メタデータとして、証憑1毎に保存する。様式メタデータは、複数のレコードが集まって様式メタファイルとして管理される。
まず、証憑1の様式は、証憑1に含まれる特定の項目が証憑1内の所定の位置に配されることによって定められる。そして、様式メタデータ保存部14は、証憑1における特定の項目の位置を示す位置情報を、特定の項目毎に様式メタデータとして、証憑1毎に保存する。様式メタデータは、複数のレコードが集まって様式メタファイルとして管理される。
ここで、様式メタデータは、証憑1の画像イメージから作成されるため、例えば、証憑1に印字されている文字の大きさ、フォントに関する情報も様式メタデータに含まれる。このため、様式照合部11は、単に特定の項目に印字された文字だけを照合するだけでなく、文字の大きさ、フォント又は色についても画像をパターンマッチングすることで照合している。パターンマッチングの処理の詳細については後述する。
様式照合部11は、証憑1に入力された内容が含まれる画像データより、特定の項目の位置に基づく位置情報を求める。この位置情報は、例えば、証憑1の上辺から1cm〜2cm、左辺から1cm〜4cmの範囲のように、特定の項目が入力される領域を特定する情報であり、様式メタデータ30(後述する図2参照)に位置情報が含まれる。複数の様式メタデータ30は様式メタファイルとして、様式メタデータ保存部14に保存されている。
そして、様式照合部11は、様式メタデータ保存部14から読み出した様式メタデータ30と、光学読取り部2が読み取った画像データを照合することによって、画像データとして入力された証憑1に含まれる特定の項目が様式メタデータとして登録されているか否かを判断する。このとき、様式照合部11は、少なくとも、証憑1の用紙サイズ、証憑1の名称、証憑1の発行元名称、証憑1の宛先名称について、画像データとして入力された証憑1に含まれる特定の項目が様式メタデータに含まれる特定の項目に一致するか否かを判断する。
様式照合部11が照合した結果、画像データが様式メタデータに一致する場合、画像データと様式メタデータを文字データ変換部12に出力する。一方、画像データが様式メタデータに一致しない場合、様式メタデータ保存部14に管理されている様式メタファイルより別の様式メタデータを読み出す。なお、様式メタデータ保存部14に保存されている全ての様式メタデータが画像データに一致しない場合、新しい様式の証憑1を読み取った画像データが入力されたと認識し、この画像データを様式メタデータ登録部15に出力する。
様式メタデータ登録部15は、画像データとして入力された証憑1に含まれる特定の項目が様式メタデータに合致しない場合に、特定の項目の位置情報を、新たな様式メタデータとして様式メタデータ保存部14に登録する。これにより、新たな様式の証憑1が取込まれる度に、この証憑1の画像データから生成された様式メタデータが様式メタデータ保存部14に自動的に蓄積される。ただし、ユーザが、後述する様式メタデータ登録画面40を見ながら特定の項目に該当する証憑1の様式を入力することによって、様式メタデータ保存部14に様式メタデータを登録することもできる。
文字データ変換部12は、画像データとして入力された証憑1に含まれる特定の項目が様式メタデータに合致する場合に、入力された様式メタデータと画像データに基づいて特定の項目に含まれる内容を文字データに変換する。そして、文字データ変換部12は、文字データを連動データ出力部13に出力する。
連動データ出力部13は、入力された文字データを所定のフォーマットに整えて、文字データを処理する業務システム(本例では、会計システム20)に連動する会計連動データを作成し、会計連動データを出力する。これにより、会計システム20に証憑1に記入された内容が連動され、会計処理が行われる。
図2は、様式メタデータ30の構成例を示す。
様式メタデータ30は、各項目が入力される項目フィールドと、画像データと様式メタデータの内容を比較するために参照される比較項目フィールドと、会計連動データを生成する際に出力の有無を指定する出力項目フィールドと、証憑1の各項目の位置を位置情報として記録する位置情報フィールドを備える。
様式メタデータ30は、各項目が入力される項目フィールドと、画像データと様式メタデータの内容を比較するために参照される比較項目フィールドと、会計連動データを生成する際に出力の有無を指定する出力項目フィールドと、証憑1の各項目の位置を位置情報として記録する位置情報フィールドを備える。
比較項目フィールドにおいて「必須」とされる項目は、用紙サイズ、証憑名称、発行元名称、及び宛先名称であり、画像データと様式メタデータの内容で必ず比較しなければならない。
同様に、出力項目フィールドにおいて「必須」とされる、請求日付、金額、証憑区分、及び取引先コードの項目は、必ず会計連動データに含めて出力されなければならない。
しかし、出力項目フィールドにおいて「任意」とされる、支払予定日、適用、基幹、及び対象月の項目は、会計連動データに含めるか否かは任意である。このため、会計連動データに含めない場合もある。これらの出力項目は、所定のフォーマットとして、例えば、CSV(Comma Separated Values)形式のレコードに編集される。
しかし、出力項目フィールドにおいて「任意」とされる、支払予定日、適用、基幹、及び対象月の項目は、会計連動データに含めるか否かは任意である。このため、会計連動データに含めない場合もある。これらの出力項目は、所定のフォーマットとして、例えば、CSV(Comma Separated Values)形式のレコードに編集される。
そして、位置情報フィールドにおいて、位置情報が「なし」とされている、証憑区分、取引先コード以外の項目は、位置情報が「あり」とされている。このため、画像データにおける各項目の具体的な位置が判明する。
図3は、様式メタデータ登録画面40の構成例を示す。
様式メタデータ登録画面40は、証憑分類システム10に新たな様式の証憑1から生成された画像データが取込まれた際に、表示部21に表示されるGUI(Graphical User Interface)である。様式メタデータ登録画面40は、画像データを表示する画像データ表示部41と、様式メタデータ30の項目フィールドに対応する項目を登録するための項目登録部42を備える。
様式メタデータ登録画面40は、証憑分類システム10に新たな様式の証憑1から生成された画像データが取込まれた際に、表示部21に表示されるGUI(Graphical User Interface)である。様式メタデータ登録画面40は、画像データを表示する画像データ表示部41と、様式メタデータ30の項目フィールドに対応する項目を登録するための項目登録部42を備える。
様式メタデータ登録部15(図1参照)は、画像データを表示する表示部21に画像データ及び特定の項目の内容を登録するための領域を表示させる。このとき、画像データ表示部41には、図2に示した様式メタデータ30の各項目番号に対応する項目の位置を明示する項目表示部43が表示される。また、項目登録部42には、項目番号毎に、項目名と、文字を入力するための入力領域44が表示される。ここで、「ドラッグして下さい」と表示される12番目の項目は、ユーザが操作部22のドラッグ操作によって、取引先コードが入力される領域を指定しなければならないことを示している。このドラッグ操作によって、取引先コードの位置情報が登録される。
様式メタデータ保存部14に保存されていない新たな様式の証憑1から得られる画像データが証憑分類システム10に入力されると、画像データ表示部41は、この画像データを表示する。そして、ユーザは、画像データ表示部41に表示された画像データを確認しながら、操作部22を操作して、この証憑の様式を項目登録部42に記入する。そして、様式メタデータ登録部15は、操作部22によって指定された証憑1内における特定の項目の位置情報、及び特定の項目の内容を様式メタデータ保存部14に登録する。こうすることにより、新たな様式の証憑1の様式メタデータを容易に様式メタデータ保存部14に登録することができる。
また、様式メタデータ登録部15は、新たな様式の証憑1からなる画像データが入力された際には、自動的に項目を判定し、この項目に含まれる入力内容を様式メタデータに変換し、様式メタデータ保存部14に保存することもできる。この場合、ユーザは、証憑1の様式の違いを意識しなくても、自動的に新たな様式の証憑1で示される様式メタデータが登録されるため、データの入力作業を効率化することができる。
図4は、証憑分類システム10の処理例を示す。
始めに、ユーザによって、光学読取り部2に証憑1がセットされると(ステップS1)、光学読取り部2は、証憑1を取り込んで(ステップS2)、画像データに変換する(ステップS3)。
始めに、ユーザによって、光学読取り部2に証憑1がセットされると(ステップS1)、光学読取り部2は、証憑1を取り込んで(ステップS2)、画像データに変換する(ステップS3)。
次に、様式照合部11は、様式メタデータ保存部14に保存される様式メタファイルを読み込んで(ステップS4)、取込んだ証憑1の用紙サイズに一致する様式メタデータを確認する(ステップS5)。
次に、様式照合部11は、証憑1の用紙サイズが様式メタデータに登録されている場合、様式メタファイルから様式メタデータを検索し(ステップS6)、様式メタデータから画像データの特定の項目を比較する比較項目を取り出す。そして、様式照合部11は、「必須」の比較項目について、様式メタデータと画像データを比較し、項目が一致するか否かを照合する(ステップS7)。
ここで、様式メタデータには、証憑1に含まれる特定の項目の画像情報も記録される。例えば、証憑1に印字された「発行元名称」という特定の項目が会社名を表す場合、この会社名に重ねるようにして社印が押されることがある。このような社印の画像イメージに対して文字変換を行うと、意味をなさない文字が出力される場合がある。このため、様式メタデータには、予め「発行元名称」という特定の項目に、社印に関する画像情報(画像パターンとも呼ぶ。)も含ませておく。
そして、様式照合部11が証憑1の画像イメージと、様式メタデータに含まれる画像情報から得た画像パターンとをパターンマッチングする際には、証憑1の画像イメージに含まれる文字、図形等より、マッチング用の輪郭線を抽出する。次に、この輪郭線の折れ曲がり角等の画像パターンが、様式メタデータに含まれる画像パターンと一致するか否かを調べる。そして、輪郭線が様式メタデータから得た画像パターンに一致すると、証憑1の画像イメージが様式メタデータ保存部14に保存された様式の証憑であることが判明する。一方、輪郭線が様式メタデータから得た画像パターンに一致しなければ、新たな様式で作成された証憑が画像イメージとして取込まれたことが判明する。
また、様式メタデータには、証憑1に印字された文字や社印等の色情報も含まれる。このため、証憑1を読み取った光学読取り部2がカラーの画像イメージを出力した場合、様式照合部11は、画像イメージから特定の項目の範囲内における色情報も抽出する。これらの色情報は、例えば、RGBによって表される。そして、様式照合部11は、特定の項目に用いられる色の色情報を様式メタデータから取り出して、光学読取り部2が出力したカラーの画像イメージから抽出した色情報と照合する。このようにして、様式照合部11が証憑1を分類する処理の精度が高まる。
次に、様式照合部11は、様式メタファイル中の、ある様式メタデータについて比較項目が一部でも一致しない場合、様式メタファイルから次の様式メタデータを読み出す。様式照合部11は、この処理を、様式メタファイルに含まれる最後の様式メタデータに至るまで繰り返す。そして、画像データに一致する様式メタデータが見つかると、様式照合部11は、該当する様式メタデータに含まれる位置情報に基づいて、画像データによって表現される文字画像を文字データに変換し、連動データ出力部13に引き渡す。
連動データ出力部13は、受け取った文字データを所定のフォーマットに整形して会計連動データを生成し(ステップS8)、会計システム20に会計連動データを連動させる(ステップS9)。
一方、ステップS5の処理において、画像データに一致する様式メタデータが様式メタファイルにない場合、又は、ステップS7の処理において、画像データに比較項目が一致する様式メタデータが様式メタファイルにない場合、様式照合部11は、新たな様式の画像データが取込まれたと判断し、様式メタデータ登録部15に画像データを出力する。
様式メタデータ登録部15は、表示部21に様式メタデータ登録画面40を表示させる(ステップS10)。ユーザの操作部22の操作によって指定された、画像データに対する比較項目と出力項目の「必須」、「任意」の区別、各項目の位置情報に基づいて、様式メタデータを作成する(ステップS11)。続いて、様式メタデータ登録部15は、様式メタデータを様式メタファイルに追加する(ステップS12)。その後、ステップS8,S9の処理を経て、会計連動データを会計システム20に連動させる。
以上説明した第1の実施の形態例に係る証憑分類システム10によれば、新たな様式の証憑1から生成された画像データが入力されても、画像データと、様式メタデータの「必須」とされた比較項目を互いに比較することによって、証憑1が新たな様式で生成されたことを容易に把握できる。また、新たな様式の証憑1から作成された画像データについては、様式メタデータ登録部15が自動的に登録し、又は、様式メタデータ登録画面40に表示して、ユーザの入力操作によって登録することができる。このように、新たな様式の証憑1であっても、様式メタデータの登録が容易であるため、ユーザは、仕訳の入力作業から開放され、この時間をより生産性の高い作業に振り向けることができるという効果がある。
次に、本発明の第2の実施の形態例について、図5〜図7を参照して説明する。
本実施の形態例においては、入力された文書51の種類に対応するシステムを起動する文書分類システム50に適用した例について説明する。以下の説明において、既に第1の実施の形態例で説明した図1に対応する部分には同一符号を付し、詳細な説明を省略する。
本実施の形態例においては、入力された文書51の種類に対応するシステムを起動する文書分類システム50に適用した例について説明する。以下の説明において、既に第1の実施の形態例で説明した図1に対応する部分には同一符号を付し、詳細な説明を省略する。
本例の文書51には、会計システム20で用いられる証憑によるものの他、名刺管理システム54で用いられる名刺によるもの、旅費精算システム57で用いられる旅費伝票によるものがある。
光学読取り部2は、文書51を光学的に読み取り、画像データを生成する。本例では、文書51として、証憑の他に、名刺等の文書が用いられる。光学読取り部2で生成された画像データは、文書分類システム50に出力される。
文書分類システム50は、様式照合部11,文字データ変換部12,連動データ出力部13,様式メタデータ保存部14,様式メタデータ登録部15に加えて、名刺に記載された情報を管理する名刺管理システム54を起動する名刺管理システム起動部52と、名刺管理システム54に連動する名刺管理連動データを出力する名刺管理データ出力部53と、旅費の精算を行う旅費精算システム57を起動する旅費精算システム起動部55と、旅費精算システム57に連動する旅費精算連動データを出力する旅費精算データ出力部56を備える。
名刺は、一般に4号サイズ(91mm×55mm)であるため、文字データ変換部12が作成した画像データから判明する文書51のサイズが名刺サイズであれば、様式照合部11は、文書51が名刺であることを判別できる。
また、旅費伝票には所定のマーク等が付されている。このため、様式照合部11は、文書51が旅費伝票であることを判別できる。
さらに、文書51の名称等によって、証憑、名刺、旅費伝票を判別することもできる。
また、旅費伝票には所定のマーク等が付されている。このため、様式照合部11は、文書51が旅費伝票であることを判別できる。
さらに、文書51の名称等によって、証憑、名刺、旅費伝票を判別することもできる。
様式照合部11は、画像データが名刺であることを判断すると、名刺管理システム54を起動するためのシステム起動命令を発行する。そして、文字データを名刺管理システム起動部52に出力する。
本例においても、様式照合部11は、新たな様式の文書51から生成された画像データが入力された場合に、文書51の様式メタデータを登録する。この登録処理は自動的に行われるが、ユーザが明示的に登録することも可能である。この場合、様式メタデータ登録部15は、上述した様式メタデータ登録画面40を表示部21に表示させる前に、文書51の種類を判別し、起動する業務システムを識別するための業務システム選択画面60を表示部21に表示させる(後述する図6参照)。そして、起動する業務システムが選択された後、様式メタデータ登録画面40が表示部21に表示され、項目を個別に入力できるようにする。
また、様式照合部11は、画像データとして入力された文書51を、会計システム20と異なる名刺管理システム54が処理する文書(本例では、名刺)であると判断した場合に、名刺管理システム54を起動するシステム起動命令を発行する。名刺管理システム起動部52は、文字データ変換部12を介してシステム起動命令を受け取ると、名刺管理システム54を起動する。そして、名刺管理データ出力部53は、受け取った文字データを所定のフォーマットに整えて、名刺管理システム54に連動するための名刺管理連動データを作成し、名刺管理システム54に名刺管理連動データを出力する。
また、様式照合部11は、画像データとして入力された文書51を、会計システム20と異なる旅費精算システム起動部55が処理する文書(本例では、旅費伝票)であると判断した場合に、旅費精算システム起動部55を起動するシステム起動命令を発行する。旅費精算システム起動部55は、文字データ変換部12を介してシステム起動命令を受け取ると、旅費精算システム57を起動する。そして、旅費精算データ出力部56は、受け取った文字データに基づいて、旅費精算システム57に連動するための旅費精算連動データを作成し、旅費精算システム57に旅費精算連動データを出力する。
図6は、業務システム選択画面60の表示例を示す。
図6Aは、各業務システムが表示された業務システム選択画面60の表示例を示す。
ユーザが操作部22を用いて、起動させる業務システムを選択すると、選択された業務システムの番号には○印が付される。
図6Aは、各業務システムが表示された業務システム選択画面60の表示例を示す。
ユーザが操作部22を用いて、起動させる業務システムを選択すると、選択された業務システムの番号には○印が付される。
図6Bは、文書51の種類に応じて起動させる業務システムを登録する業務システム選択画面60の表示例を示す。
ユーザは、文書51の様式に基づいて、起動させる業務システムを選択し、登録することができる。これにより、今後、入力された文書51の画像データを処理する場合に適切な業務システムを自動的に起動することができる。
ユーザは、文書51の様式に基づいて、起動させる業務システムを選択し、登録することができる。これにより、今後、入力された文書51の画像データを処理する場合に適切な業務システムを自動的に起動することができる。
図7は、起動する業務システムを登録する場合の処理例を示す。
始めに、ユーザ操作によって、光学読取り部2が文書51を読込ませると、様式照合部11は、光学読取り部2から画像データの供給を受ける(ステップS21)。
始めに、ユーザ操作によって、光学読取り部2が文書51を読込ませると、様式照合部11は、光学読取り部2から画像データの供給を受ける(ステップS21)。
次に、様式照合部11は、受け取った画像データの様式メタデータが様式メタファイルにあるか否かを、様式メタデータ保存部14を検索して判断する(ステップS22)。
様式メタファイルに該当する様式メタデータがない場合、この文書51に対応して起動する業務システムを様式メタデータとして登録する(ステップS23)。その後、登録した様式メタデータに基づいて、該当する業務システムを起動し、連動データを連動させる。
様式メタファイルに該当する様式メタデータがない場合、この文書51に対応して起動する業務システムを様式メタデータとして登録する(ステップS23)。その後、登録した様式メタデータに基づいて、該当する業務システムを起動し、連動データを連動させる。
一方、様式メタファイルに該当する様式メタデータがある場合、様式照合部11は、様式メタファイルに定義された業務システムのシステム起動命令を発行する(ステップS24)。システム起動命令を受け取った、名刺管理システム起動部52又は旅費精算システム起動部55は、該当する業務システムを起動し、連動データを連動させる。
以上説明した第2の実施の形態例に係る文書分類システム50によれば、文書51に証憑と名刺が混在していても、会計システム20又は名刺管理システム54に連動するための連動データを適切に作成し、各システムに連動することができる。このため、ユーザは、文書51に含まれる書類の様式を意識する必要がなくなり、文書51の取込みから、各システムへのデータ連動までの処理を滞りなく進めることができ、入力作業の効率が改善されるという効果がある。
なお、名刺管理システム54が管理する名刺管理連動データを会計システム20に出力することで、会計システム20が行う会計処理において、会計連動データと名刺管理連動データを紐付けても良い。これにより、会計システム20は、会計連動データに含まれる宛先等の項目に対して、最新の情報(例えば、住所、電話番号)を紐付けて管理することが可能となる。
また、上述した第1及び第2の実施の形態例には、文書分類システムに入力される文書の例として、証憑又は名刺について説明したが、その他の種類の文書を分類しても良い。また、上述した第2の実施の形態例では、名刺の画像データが入力されている際に、名刺管理システム54を起動するようにしたが、他の種類の文書が入力された際に、その他の種類の文書を管理するためのシステム、プログラム等を起動するようにしても良い。また、文書分類システムは、入力された文書が証憑である場合に、会計システム20を起動するようにしてもよい。
また、上述した第1及び第2の実施の形態例において、文書分類システムに入力される画像データは、光学読取り部2を用いて文書を光学的に読み込んで得られる画像データとしたが、その他の文書作成ソフトウェアによって作成される電子データが文書分類システムに入力されてもよい。
また、上述した第1及び第2の実施の形態例における一連の処理は、ソフトウェアにより実行させる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムを、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで各種の機能を実行することが可能である。例えば汎用のパーソナルコンピュータなどに所望のソフトウェアを構成するプログラムをインストールして実行させればよい。
また、上述した実施の形態例の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システムあるいは装置に供給してもよい。また、そのシステムあるいは装置のコンピュータ(またはCPU等の制御装置)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、機能が実現されることは言うまでもない。
この場合のプログラムコードを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態例の機能が実現される。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部又は全部を行う。その処理によって上述した実施の形態例の機能が実現される場合も含まれる。
また、本発明は上述した実施の形態例に限られるものではなく、本発明の要旨を逸脱することなくその他種々の構成を取り得ることは勿論である。
1…証憑、2…光学読取り部、10…証憑分類システム、11…様式照合部、12…文字データ変換部、13…連動データ出力部、14…様式メタデータ保存部、15…様式メタデータ登録部、20…会計システム、21…表示部、22…操作部、30…様式メタデータ、40…様式メタデータ登録画面、41…画像データ表示部、42…項目登録部、43…項目表示部、44…入力領域、50…文書分類システム、51…文書、52…名刺管理システム起動部、53…名刺管理データ出力部、54…名刺管理システム、55…旅費精算システム起動部、56…旅費精算データ出力部、57…旅費精算システム、60…業務システム選択画面
Claims (6)
- 文書に含まれる特定の項目が前記文書内の所定の位置に配されて前記文書の様式が定められる場合に、前記特定の項目の位置を示す位置情報及び前記特定の項目に記される文字又は画像に関する情報を、前記特定の項目毎に様式メタデータとして、前記文書毎に保存する様式メタデータ保存部と、
前記文書を読み取って得た画像データより、前記特定の項目の位置に基づく位置情報を求め、前記様式メタデータ保存部から読み出した前記様式メタデータと照合することによって、前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに登録されているか否かを判断する様式照合部と、
前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに合致しない場合に、前記特定の項目の位置情報を、新たな様式メタデータとして前記様式メタデータ保存部に登録する様式メタデータ登録部と、
前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに合致する場合に、前記特定の項目に含まれる内容を文字データに変換する文字データ変換部と、
前記文字データを所定のフォーマットに整えて、前記文字データを処理する業務システムに連動する連動データを作成し、前記連動データを出力する連動データ出力部と、を備える
文書分類システム。 - 更に、前記様式照合部が、前記画像データとして入力された前記文書を、前記業務システムと異なる第2の業務システムが処理する文書であると判断した場合に、前記様式照合部が発行するシステム起動命令に基づいて、前記第2の業務システムを起動する業務システム起動部と、
前記文字データを所定のフォーマットに整えて前記文字データを処理する業務システムに連動する連動データを作成し、前記連動データを出力する第2の連動データ出力部と、を備える
請求項1記載の文書分類システム。 - 前記様式メタデータ登録部は、前記画像データを表示する表示部に前記画像データ及び前記特定の項目の内容を登録するための領域を表示させ、
操作部によって指定された前記文書内における前記特定の項目の位置情報、及び前記特定の項目の内容を前記様式メタデータ保存部に登録する
請求項1又は2記載の文書分類システム。 - 前記様式照合部は、
少なくとも、前記文書の用紙サイズ、前記文書の名称、前記文書の発行元名称、前記文書の宛先名称を、前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに含まれる特定の項目に一致するか否かを判断する
請求項1〜3のいずれか1項に記載の文書分類システム。 - 文書に含まれる特定の項目が前記文書内の所定の位置に配されて前記文書の様式が定められる場合に、前記特定の項目の位置を示す位置情報及び前記特定の項目に記される文字又は画像に関する情報を、前記特定の項目毎に様式メタデータとして、前記文書毎に様式メタデータ保存部に保存するステップと、
前記文書を読み取って得た画像データより、前記特定の項目の位置に基づく位置情報を求め、前記様式メタデータ保存部から読み出した前記様式メタデータと照合することによって、前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに登録されているか否かを判断するステップと、
前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに合致しない場合に、前記特定の項目の位置情報を、新たな様式メタデータとして前記様式メタデータ保存部に登録するステップと、
前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに合致する場合に、前記特定の項目に含まれる内容を文字データに変換するステップと、
前記文字データを所定のフォーマットに整えて前記文字データを処理する業務システムに連動する連動データを作成し、前記連動データを出力するステップと、を含む
文書分類方法。 - 文書に含まれる特定の項目が前記文書内の所定の位置に配されて前記文書の様式が定められる場合に、前記特定の項目の位置を示す位置情報及び前記特定の項目に記される文字又は画像に関する情報を、前記特定の項目毎に様式メタデータとして、前記文書毎に様式メタデータ保存部に保存する手順、
前記文書を読み取って得た画像データより、前記特定の項目の位置に基づく位置情報を求め、前記様式メタデータ保存部から読み出した前記様式メタデータと照合することによって、前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに登録されているか否かを判断する手順、
前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに合致しない場合に、前記特定の項目の位置情報を、新たな様式メタデータとして前記様式メタデータ保存部に登録する手順、
前記画像データとして入力された前記文書に含まれる特定の項目が前記様式メタデータに合致する場合に、前記特定の項目に含まれる内容を文字データに変換する手順、
前記文字データを所定のフォーマットに整えて前記文字データを処理する業務システムに連動する連動データを作成し、前記連動データを出力する手順と、を
コンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009212212A JP2011060219A (ja) | 2009-09-14 | 2009-09-14 | 文書分類システム、文書分類方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009212212A JP2011060219A (ja) | 2009-09-14 | 2009-09-14 | 文書分類システム、文書分類方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011060219A true JP2011060219A (ja) | 2011-03-24 |
Family
ID=43947739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009212212A Pending JP2011060219A (ja) | 2009-09-14 | 2009-09-14 | 文書分類システム、文書分類方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011060219A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013164740A (ja) * | 2012-02-10 | 2013-08-22 | Hiroaki Ono | 会計情報読取りシステム、会計情報読取り方法、及びプログラム |
JP2018073028A (ja) * | 2016-10-27 | 2018-05-10 | 株式会社 Kagホールディングズ | 会計サーバ及び明細データ取得方法 |
JP2018073323A (ja) * | 2016-11-04 | 2018-05-10 | セイコーエプソン株式会社 | 財務帳票作成システム、財務帳票作成端末、及び財務帳票作成プログラム |
JP2018081530A (ja) * | 2016-11-17 | 2018-05-24 | セイコーエプソン株式会社 | 財務帳票作成システム、財務帳票作成端末、及び財務帳票作成プログラム |
JP2019016045A (ja) * | 2017-07-04 | 2019-01-31 | 株式会社 Kagホールディングズ | 会計装置及びプログラム |
JP2019159534A (ja) * | 2018-03-09 | 2019-09-19 | 株式会社フロンティア・フィールド | 入力システム及び入力プログラム |
KR20190110873A (ko) * | 2018-03-21 | 2019-10-01 | 주식회사 피앤피소프트 | 비정형 텍스트 이미지에서 텍스트 데이터를 추출하는 방법 및 장치 |
JP6683377B1 (ja) * | 2018-12-26 | 2020-04-22 | ファーストアカウンティング株式会社 | 書類分類システム、書類分類装置、書類分類方法、書類分類プログラム |
JP2020144636A (ja) * | 2019-03-07 | 2020-09-10 | セイコーエプソン株式会社 | 情報処理装置、学習装置及び学習済モデル |
JP2022013524A (ja) * | 2020-06-30 | 2022-01-18 | Arithmer株式会社 | 帳票情報生成装置、方法及びプログラム |
-
2009
- 2009-09-14 JP JP2009212212A patent/JP2011060219A/ja active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013164740A (ja) * | 2012-02-10 | 2013-08-22 | Hiroaki Ono | 会計情報読取りシステム、会計情報読取り方法、及びプログラム |
JP2018073028A (ja) * | 2016-10-27 | 2018-05-10 | 株式会社 Kagホールディングズ | 会計サーバ及び明細データ取得方法 |
JP2018073323A (ja) * | 2016-11-04 | 2018-05-10 | セイコーエプソン株式会社 | 財務帳票作成システム、財務帳票作成端末、及び財務帳票作成プログラム |
JP2018081530A (ja) * | 2016-11-17 | 2018-05-24 | セイコーエプソン株式会社 | 財務帳票作成システム、財務帳票作成端末、及び財務帳票作成プログラム |
JP7000052B2 (ja) | 2017-07-04 | 2022-01-19 | 株式会社 Kagホールディングズ | 会計装置及びプログラム |
JP2019016045A (ja) * | 2017-07-04 | 2019-01-31 | 株式会社 Kagホールディングズ | 会計装置及びプログラム |
JP2022031395A (ja) * | 2017-07-04 | 2022-02-18 | 株式会社 Kagホールディングズ | 会計装置及びプログラム |
JP7348944B2 (ja) | 2017-07-04 | 2023-09-21 | 株式会社フォーバルラボコミュニケーションズ | 会計装置及びプログラム |
JP2019159534A (ja) * | 2018-03-09 | 2019-09-19 | 株式会社フロンティア・フィールド | 入力システム及び入力プログラム |
KR20190110873A (ko) * | 2018-03-21 | 2019-10-01 | 주식회사 피앤피소프트 | 비정형 텍스트 이미지에서 텍스트 데이터를 추출하는 방법 및 장치 |
KR102039989B1 (ko) * | 2018-03-21 | 2019-11-05 | 주식회사 피앤피소프트 | 비정형 텍스트 이미지에서 텍스트 데이터를 추출하는 방법 및 장치 |
JP6683377B1 (ja) * | 2018-12-26 | 2020-04-22 | ファーストアカウンティング株式会社 | 書類分類システム、書類分類装置、書類分類方法、書類分類プログラム |
WO2020136778A1 (ja) * | 2018-12-26 | 2020-07-02 | ファーストアカウンティング株式会社 | 書類分類システム、書類分類装置、書類分類方法、書類分類プログラム |
JP2020144636A (ja) * | 2019-03-07 | 2020-09-10 | セイコーエプソン株式会社 | 情報処理装置、学習装置及び学習済モデル |
JP7077998B2 (ja) | 2019-03-07 | 2022-05-31 | セイコーエプソン株式会社 | 情報処理装置 |
JP2022013524A (ja) * | 2020-06-30 | 2022-01-18 | Arithmer株式会社 | 帳票情報生成装置、方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011060219A (ja) | 文書分類システム、文書分類方法、及びプログラム | |
JP2013164740A (ja) | 会計情報読取りシステム、会計情報読取り方法、及びプログラム | |
JP5204208B2 (ja) | レシートデータ照合支援装置およびレシートデータ照合支援プログラム | |
US10552525B1 (en) | Systems, methods and apparatuses for automated form templating | |
JP2010510563A (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US10719887B2 (en) | Non-transitory computer-readable medium, data management system and data management server | |
CN101847212B (zh) | 条形码数据管理装置、打印装置 | |
JP2008145611A (ja) | 情報処理装置、プログラム | |
US8049921B2 (en) | System and method for transferring invoice data output of a print job source to an automated data processing system | |
JP2016192223A (ja) | 会計情報読取りシステム及びプログラム | |
US20130063769A1 (en) | Information management apparatus and method, information management system, and non-transitory computer readable medium | |
JP2009093389A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5145799B2 (ja) | 文書処理システム、文書入出力装置、文書入出力プログラム | |
US7844138B2 (en) | History control apparatus | |
JP3766854B2 (ja) | データ処理装置 | |
JP2019101802A (ja) | データ表示装置、データ表示方法およびデータ表示プログラム | |
CN110413659B (zh) | 通用购物小票数据精准提取方法 | |
JP2019061406A (ja) | 仕訳データ作成装置、仕訳データ作成方法および仕訳データ作成プログラム | |
JP7160432B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2002157545A (ja) | ドキュメント読取転送方法 | |
CN105308554B (zh) | 数据传输系统、传输数据的方法、以及系统 | |
JP4867229B2 (ja) | 情報処理装置及びプログラム | |
JP5846378B2 (ja) | 情報管理方法及び情報管理システム | |
JP2008165497A (ja) | 情報処理装置及びプログラム | |
JP4845287B2 (ja) | フォーム編集装置及び方法及びコンピュータ読取り可能なプログラムが格納された記憶媒体 |