JP5481965B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP5481965B2
JP5481965B2 JP2009152314A JP2009152314A JP5481965B2 JP 5481965 B2 JP5481965 B2 JP 5481965B2 JP 2009152314 A JP2009152314 A JP 2009152314A JP 2009152314 A JP2009152314 A JP 2009152314A JP 5481965 B2 JP5481965 B2 JP 5481965B2
Authority
JP
Japan
Prior art keywords
document
item
code
contents
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009152314A
Other languages
English (en)
Other versions
JP2011008584A (ja
Inventor
勝彦 糸乘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2009152314A priority Critical patent/JP5481965B2/ja
Publication of JP2011008584A publication Critical patent/JP2011008584A/ja
Application granted granted Critical
Publication of JP5481965B2 publication Critical patent/JP5481965B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、ワークフローと対応する文書ファイルを自動的にデータベースに登録することを課題とし、一致度計算部によって、予め定められた計算基準にしたがって、文書ファイルと各ワークフロー内の各タスクとの一致度を求め、登録判断部によって、一致度のうち、最も一致度が高いタスクとの一致度が閾値よりも低くない場合には、タスクを特定する既登録の文書ファイルの有無を調査し、既登録の文書ファイルが存在しない場合、登録判断部は、新たな登録候補の文書ファイルをタスクとして登録し、既登録の文書ファイルが存在する場合には、既登録の文書ファイルの一致度と、新たな登録候補の文書ファイルの一致度とを比較して、新たな登録候補の文書ファイルの一致度が、既登録の文書ファイルの一致度よりも高い場合には、既登録の文書ファイルに代えて新たな登録候補の文書ファイルを登録することが開示されている。
特開2007−034428号公報
本発明は、業務を構成する一連の処理で用いられない文書の出力を防ぐことができないという問題を防止する情報処理装置及び情報処理プログラムを提供することを目的とする。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、処理を一意に特定する処理符号と、該処理に用いられる第1の文書内に記載されており、業務を構成する処理の順番における該処理の前又は後の処理で用いられる第2の文書に記載されている項目とを処理定義として対応付けて記憶する処理定義記憶手段と、処理に用いられた文書を一意に特定する文書符号と、該文書内に記載されている項目の内容とを対応付けて記憶する文書項目記憶手段と、前記処理定義を用いて、前記文書項目記憶手段に記憶されている文書に対応付けられている項目の内容を抽出する項目内容抽出手段と、前記項目内容抽出手段によって抽出された項目の内容に基づいて、前記文書項目記憶手段に記憶されている項目の内容を検索し、該項目の内容に対応付けられている文書符号を抽出する文書符号抽出手段と、前記文書符号抽出手段によって抽出できた文書符号を、業務を構成する一連の処理で用いられた文書の文書符号として出力する出力手段を具備し、前記文書は画像であり、前記項目に対して、前記画像内の該項目の内容を認識する場合の難易度に応じた値を対応付けて記憶する難易度記憶手段をさらに具備し、前記難易度に応じた値は、前記項目に用いられる可能性のある文字種の数に応じて定められており、前記文書項目記憶手段が記憶する項目の内容は、前記第1の文書内の項目の内容を認識した結果であり、前記文書符号抽出手段は、前記項目ごとに、該項目の内容と前記文書項目記憶手段に記憶されている項目の内容とで一致する文字数を計算し、該項目ごとに一致した文字数と難易度に応じた値をかけ合わせた値を合計してスコアを算出し、該スコアが高い文書符号を抽出することを特徴とする情報処理装置である。
請求項2の発明は、前記文書符号抽出手段は、前記業務における最終の処理が終了した後に、該最終の処理で用いられた文書を起点として、該業務に関連する文書を抽出することを特徴とする請求項1に記載の情報処理装置である。
請求項の発明は、前記文書符号抽出手段は、前記項目内容抽出手段によって抽出された項目の内容と前記文書項目記憶手段に記憶されている項目の内容のうち、予め定められた部分が同じ場合は、前記文書項目記憶手段に記憶されている項目の内容に対応する文書符号を抽出することを特徴とする請求項1または2に記載の情報処理装置である。
請求項の発明は、コンピュータを、処理を一意に特定する処理符号と、該処理に用いられる第1の文書内に記載されており、業務を構成する処理の順番における該処理の前又は後の処理で用いられる第2の文書に記載されている項目とを処理定義として対応付けて記憶する処理定義記憶手段と、処理に用いられた文書を一意に特定する文書符号と、該文書内に記載されている項目の内容とを対応付けて記憶する文書項目記憶手段と、前記処理定義を用いて、前記文書項目記憶手段に記憶されている文書に対応付けられている項目の内容を抽出する項目内容抽出手段と、前記項目内容抽出手段によって抽出された項目の内容に基づいて、前記文書項目記憶手段に記憶されている項目の内容を検索し、該項目の内容に対応付けられている文書符号を抽出する文書符号抽出手段と、前記文書符号抽出手段によって抽出できた文書符号を、業務を構成する一連の処理で用いられた文書の文書符号として出力する出力手段として機能させ、前記文書は画像であり、前記項目に対して、前記画像内の該項目の内容を認識する場合の難易度に応じた値を対応付けて記憶する難易度記憶手段としてさらに機能させ、前記難易度に応じた値は、前記項目に用いられる可能性のある文字種の数に応じて定められており、前記文書項目記憶手段が記憶する項目の内容は、前記第1の文書内の項目の内容を認識した結果であり、前記文書符号抽出手段は、前記項目ごとに、該項目の内容と前記文書項目記憶手段に記憶されている項目の内容とで一致する文字数を計算し、該項目ごとに一致した文字数と難易度に応じた値をかけ合わせた値を合計してスコアを算出し、該スコアが高い文書符号を抽出することを特徴とする情報処理プログラムである。
請求項1の情報処理装置によれば、業務を構成する一連の処理で用いられない文書の出力を防ぐことができる。そして、誤認識による影響を小さくできる。
請求項2の情報処理装置によれば、業務が終了した場合に、その業務に関連する文書を出力することができる。
請求項の情報処理装置によれば、文書間で項目の内容の部分が不一致であったとしても、業務を構成する一連の処理で用いられた文書を出力できる。
請求項の情報処理プログラムによれば、業務を構成する一連の処理で用いられない文書の出力を防ぐことができる。そして、誤認識による影響を小さくできる。
本実施の形態の構成例についての概念的なモジュール構成図である。 購買プロセスの一例を示す説明図である。 購買プロセスにおいて、各処理で用いられる文書の例を示す説明図である。 業務プロセス定義テーブルのデータ構造例を示す説明図である。 本実施の形態による文書の登録処理例を示すフローチャートである。 本実施の形態による文書の抽出処理例を示すフローチャートである。 文書項目テーブルのデータ構造例を示す説明図である。 検索結果テーブルのデータ構造例を示す説明図である。 業務プロセス定義テーブルのデータ構造例を示す説明図である。 重み付けテーブルのデータ構造例を示す説明図である。 レコード群のデータ構造の印刷例を示す説明図である。 業務プロセス定義テーブルのデータ構造例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
本実施の形態である情報処理装置は、業務を構成する一連の処理で用いられた文書の文書符号を出力するものであって、図1に示すように、文書受付モジュール110、文書検索モジュール120、業務プロセス定義モジュール130、文書読込モジュール140、文書保存モジュール150は、それぞれ接続されている。
まず、業務、処理、文書について説明する。
業務とは、一連の処理によって構成される。そして、その処理では、文書が用いられる。文書とは、画像又はテキストデータ等によって構成されており、場合によっては動画、音声等の電子データを含み、又はこれらの組み合わせであり、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。より具体的には、画像の文書とは、スキャナによって読み込まれたものであり、テキストデータとは、レコード構造となっているもの、文書作成装置(プログラム)等によって作成されたもの等である。また、文書の内容として、業務に用いられるものであればよいが、例えば、稟議書、注文書、納品書、請求書等が該当する。
例えば、業務(以下、業務プロセスともいう)として、購買プロセスがある。図2は、購買プロセスの一例を示す説明図である。購買プロセスは、稟議処理210、発注処理220、納品処理230の各処理によって構成されており、その順序(稟議処理210、発注処理220、納品処理230の順序)も定められている。
また、各処理では、文書が用いられる。図3は、購買プロセスにおいて、各処理で用いられる文書の例を示す説明図である。例えば、稟議処理210では稟議書310(図3(a))、発注処理220では注文書320(図3(b))、納品処理230では納品書330(図3(c))が用いられる。
そして、文書には、その文書を一意に特定する文書符号が記載されている。例えば、図3の例では、稟議書310には稟議番号欄311があり、注文書320には注文番号欄321があり、納品書330には納品番号欄331がある。
また、文書には、その文書が用いられる処理の前又は後の処理で用いられる文書を特定するための項目がある。例えば、図3の例では、注文書320には稟議番号欄322があり、この内容は稟議書310の稟議番号欄311を示しており、納品書330には注文番号欄332があり、この内容は注文書320の注文番号欄321を示している。なお、この例では、その文書が用いられた処理の前の処理において用いられた文書の文書符号が記載されている。
図1を用いて、各モジュールを説明する。
業務プロセス定義モジュール130は、処理を一意に特定する処理符号と、その処理Aに用いられる第1の文書内に記載されており、業務を構成する処理の順番におけるその処理Aの前又は後の処理で用いられる第2の文書に記載されている項目とを処理定義として対応付けて記憶する。例えば、業務プロセス内で発生する処理、各処理で発生する文書名、各文書を登録する場所、前後の処理との関連する項目名を記憶する。より具体的には、例えば、前述の購買プロセスでは、稟議処理210、発注処理220、納品処理230という処理が発生する。各処理では、稟議書310、注文書320、納品書330という文書が必要とされる。注文書320は、稟議番号により稟議書310を対応付け、納品書330は、注文番号により注文書320を対応付ける。これを実現するために業務プロセス定義モジュール130は、例えば業務プロセス定義テーブル400を生成し、記憶する。
図4は、業務プロセス定義テーブル400のデータ構造例を示す説明図である。業務プロセス定義テーブル400は、業務プロセス名欄410、処理識別子欄420、処理名欄430、文書名欄440、登録先欄450、前処理との関連項目欄460、後処理との関連項目欄470を有している。
業務プロセス名欄410は、業務プロセスを一意に特定する業務プロセス名を記憶する。
処理識別子欄420は、その業務プロセスを構成する処理を一意に特定する処理符号を記憶する。
処理名欄430は、その処理の名称を記憶する。
文書名欄440は、その処理で用いられる文書の文書名を記憶する。
登録先欄450は、その文書を登録する登録先(記憶場所)を記憶する。例えば、フォルダー名である。
前処理との関連項目欄460は、その処理に用いられる文書内に記載されており、前の処理で用いられる文書に記載されている項目を記憶する。つまり、その処理の前の処理において用いられる文書を特定する項目を記憶する。なお、その業務において最初の処理では、その前の処理はないので、空白とする。
後処理との関連項目欄470は、その処理に用いられる文書内に記載されており、後の処理で用いられる文書に記載されている項目を記憶する。つまり、その処理の後の処理において用いられる文書を特定する項目を記憶する。なお、その業務において最後の処理では、その後の処理はないので、空白とする。
文書受付モジュール110は、文書を受け付けて、その文書を文書読込モジュール140へ渡す。文書がテキストデータを主とする文書である場合は、例えば、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている文書を読み出すこと等が含まれる。文書の画像を受け付けるとは、前述の他に、例えば、スキャナ、カメラ等で画像を読み取ること、ファックス等で通信回線を介して外部機器から画像を受信すること、CCD(Charge−Coupled Device)等で映像を撮影すること等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。
文書読込モジュール140は、処理において文書の登録における利用者の操作を受け付けるユーザインタフェースを有しており、例えば、キーボード、マウス、ディスプレイ等を有している。そして、文書受付モジュール110によって受け付けられた文書を業務プロセス定義テーブル400に基づいて解析して、その解析結果を文書保存モジュール150に登録する。
文書保存モジュール150は、文書読込モジュール140によって解析された文書を記憶し、その解析結果を記憶する。解析結果として、処理に用いられた文書を一意に特定する文書符号と、その文書内に記載されている項目の内容とを対応付けて記憶する。具体的には、例えば、文書項目テーブル700を記憶する。図7は、文書項目テーブル700のデータ構造例を示す説明図である。文書項目テーブル700は、文書欄710、項目名欄720、項目の内容欄730、項目名欄740、項目の内容欄750を有している。
文書欄710は、処理に用いられた文書を一意に特定する文書符号を記憶する。
項目名欄720は、その文書内に記載されている項目名を記憶する。
項目の内容欄730は、その文書内に記載されている項目の内容を記憶する。
なお、文書項目テーブル700の行は、文書ごとに作成される。そして、その文書内の項目数に応じて、項目名欄720と項目の内容欄730の組がある。また、文書が画像である場合、文書項目テーブル700が記憶する項目の内容は、文書内の項目の内容を認識した結果である。文書項目テーブル700として、項目名欄(720、740)を不要とし、項目の内容欄(730、750)だけで構成してもよい。
文書検索モジュール120は、業務プロセス定義モジュール130内の業務プロセス定義テーブル400に記憶されている処理定義を用いて、文書保存モジュール150内の文書項目テーブル700に記憶されている対象としている文書に対応付けられている項目の内容を抽出する。そして、抽出した項目の内容に基づいて、文書保存モジュール150内の文書項目テーブル700に記憶されている項目の内容を検索し、その項目の内容に対応付けられている文書符号を抽出する。次に、抽出できた文書符号を、業務を構成する一連の処理で用いられた文書の文書符号として出力する。なお、出力する文書符号としては、その文書を一意に特定できる文書名であってもよいし、稟議書等のように一般的な文書名の場合は、その文書名と文書符号を組み合わせたものであってもよい。
より具体的には、業務プロセス定義テーブル400の前処理との関連項目欄460又は後処理との関連項目欄470にしたがって、文書項目テーブル700内の対象としている文書の項目の内容を抽出する。そして、その項目の内容が記憶されている文書項目テーブル700の他の文書を抽出する。これを次々に行い、その業務における文書を抽出し終わったら、抽出した文書をその業務において用いられる文書として出力する。つまり、その文書群の文書名をリストとして出力してもよいし、各文書そのものを出力してもよい。また、対象としている文書が抽出できたか否かの情報、抽出できなかった場合(つまり、前述の業務プロセス定義テーブル400と文書項目テーブル700を用いた文書抽出処理において、途中でたどれなくなった場合)に、どこまで抽出できたのか、抽出できなかった箇所(業務プロセス内の処理)はどこなのか等の情報を出力するようにしてもよい。なお、出力するとは、例えば、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で文書を送信すること、文書データベース等の文書記憶装置へ文書を書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと等が含まれる。
また、文書検索モジュール120は、業務における最終の処理が終了した後に、その最終の処理で用いられた文書を起点として、その業務に関連する文書を抽出するようにしてもよい。これは、業務プロセス内の処理を前方向(逆方向)にさかのぼりながら、文書を抽出することとなる。
また、文書が画像である場合、文書検索モジュール120は、項目に対して、画像内の該項目の内容を認識する場合の難易度に応じた値を対応付けて記憶するようにしてもよい。そして、難易度に応じた値に基づいて、文書符号を抽出するようにしてもよい。
また、文書検索モジュール120は、抽出された項目の内容と文書保存モジュール150内の文書項目テーブル700に記憶されている項目の内容のうち、予め定められた部分が同じ場合は、その項目の内容に対応する文書符号を抽出するようにしてもよい。予め定められた部分として、具体的には、先頭部分、後方部分等がある。例えば、番号の後に枝番を付すような場合には先頭部分(枝番以外の部分)が同じであれば、同じ業務を構成する処理に用いられた文書であると判断する。
文書読込モジュール140、文書保存モジュール150、文書検索モジュール120の処理内容については、図5、図6等を用いて詳述する。
図5は、本実施の形態による文書の登録処理例を示すフローチャートである。
ステップS502では、文書読込モジュール140が、利用者の操作に応じて、現在の業務プロセスの種類を指定する。
ステップS504では、文書受付モジュール110が、その業務における処理で用いられる文書を受け付ける。
ステップS506では、文書読込モジュール140が、受け付けられた文書を解析して、文書名を抽出する。例えば、文書が画像であった場合は、画像を解析し、文字認識処理を行って、文書名を抽出する。文書名は、画像中の上部に位置し、他の文字より大きい文字で書かれているというルールを用いて抽出する。ここで、文字認識処理で誤認識で正しい文書名を抽出できない場合があるので、ディスプレイ、キーボードなどを使用して文書名を修正するようにしてもよい。
ステップS508では、文書読込モジュール140が、抽出した文書名と、指定した業務プロセスから処理を特定する。処理の特定は、業務プロセス定義モジュール130に記憶されている業務プロセス定義テーブル400を参照して行う。
ステップS510では、文書読込モジュール140が、業務プロセス定義モジュール130に記憶されている業務プロセス定義テーブル400によって定義された項目を文書中から検索する。例えば、注文書では、稟議番号や注文番号で前後の処理と関連があるので、これらの項目を文書中から探し、対応する値を抽出する。このような項目の抽出方法は、例えば、特開2007−233913号公報に開示されている技術を用いてもよい。
ステップS512では、文書読込モジュール140が、業務プロセス定義モジュール130に記憶されている業務プロセス定義テーブル400(登録先欄450)にしたがって、文書とその文書の解析結果である項目名、その項目の内容を文書保存モジュール150へ記憶させる。そして、文書保存モジュール150が、文書とその文書の解析結果である項目名、その項目の内容を記憶する。
図6は、本実施の形態の文書検索モジュール120による文書の抽出処理例を示すフローチャートである。
処理が発生するごとに、文書検索モジュール120は、文書の検索を行ってもよいが、ここでは、業務プロセス中で発生する最後の文書が登録されたことをきっかけとして、関連する文書の検索を行う。
ステップS602では、図5の例に示したフローチャートの処理によって文書が登録される。
ステップS604では、業務プロセス定義モジュール130に記憶された業務プロセス定義テーブル400に基づいて、業務プロセス内の最終の処理における最後の文書の登録であったか否かを判断する。すなわち、業務プロセス定義テーブル400を参照して、後処理との関連項目欄470が空白である行の文書を最後の文書であると判断する。最後の文書であった場合はステップS606へ進み、それ以外の場合はステップS602へ戻る。
ステップS606では、最初の処理(ステップS604の直後の処理)では、その業務プロセス内の最後の文書を対象文書とする。そして、2回目以降の処理(ステップS614から戻ってきたときの処理)では、ステップS612での検索結果の文書を対象文書とする。
ステップS608では、業務プロセス定義モジュール130に記憶された業務プロセス定義テーブル400(前処理との関連項目欄460)に基づいて、前の処理と関連する項目を取り出す。
ステップS610では、前の処理で発生した文書が登録されている登録場所(登録先欄450)から、ステップS608で取り出した項目を有している文書を検索する。
ステップS612では、その検索結果を保存する。例えば、検索結果テーブル800のように保存する。図8は、検索結果テーブル800のデータ構造例を示す説明図である。検索結果テーブル800は、業務プロセス名欄810、文書1欄820、文書2欄830、文書3欄840、文書n欄890等を有している。つまり、次々に検索した結果を、そのプロセスに対応する文書1欄820等に記憶させる。この検索結果テーブル800内の各行が完成すると、業務プロセスに関連する文書を取り出すことができる。
ステップS614では、業務プロセス定義モジュール130に記憶された業務プロセス定義テーブル400に基づいて、業務プロセス内の最初の処理における文書を検索したか否かを判断する。すなわち、業務プロセス定義テーブル400を参照して、前処理との関連項目欄460が空白であるか否かを判断する。最初の文書であった場合は終了(ステップS699)し、それ以外の場合はステップS606へ戻る。
前述の業務プロセス定義テーブル400は、前後の処理と関係して項目を1つとしているが、業務プロセス定義テーブル900のように複数定義してもよい。図9は、業務プロセス定義テーブル900のデータ構造例を示す説明図である。業務プロセス定義テーブル900は、業務プロセス名欄910、処理識別子欄920、処理名欄930、文書名欄940、登録先欄950、前処理との関連項目1欄960、前処理との関連項目2欄970、後処理との関連項目1欄980、後処理との関連項目2欄990を有している。業務プロセス定義テーブル400と異なるところは、前処理との関連項目2欄970、後処理との関連項目2欄990を定義していることである。例えば、注文書と納品書では、書かれている内容はほとんど同じなので、品名などの項目を定義しておく。
このとき、定義した項目名ごとに重み付けをしておくようにしてもよい。重み付けの例として重み付けテーブル1000がある。図10は、重み付けテーブル1000のデータ構造例を示す説明図である。重み付けテーブル1000は、項目名欄1010、重み欄1020を有している。
項目名欄1010は、重み付けの対象となる項目名を記憶している。
重み欄1020は、難易度に応じた値である重み付けを記憶している。
例えば、注文書番号は英数字が主であり、文字認識の難易度は低くなるので、高い重みを設定する。品名は、多くの文字種(英数字の他にひらがな、漢字等)を使用するので、文字認識の難易度も高く、誤認識が発生する確率も高くなるので、低い重みを付けておく。検索の際に、複数の項目で検索し、これらの重み付けを使ってスコアを計算し、他のものよりも高いスコアの文書を抽出する。例えば、項目ごとに一致する文字数を計算し、項目ごとに一致した文字数と重みをかけ合わせた値を合計してスコアを算出するようにしてもよい。つまり、文字認識処理の誤認識による影響を小さくしたい場合に用いる。
1つの文書から複数の関連文書が発生することがある。例えば、1つの注文書から複数の品物が納品される場合がある。このような場合には、注文番号に枝番が付与されることになる。このような状況に対応するため、項目の検索では、文字列の先頭からの予め定められた文字数の部分文字列の比較により、一致する項目を探すようにしてもよい。もちろん、文字列の先頭だけでなく、後方からの文字を対象としてもよい。
業務プロセス内で、電子化された処理が存在する場合がある。例えば、発注処理が電子化され、システムから発注書が発行されている場合には、システム内で稟議番号と注文書番号が対応付けられている。したがって、このような場合には、検索先を発注処理を行うシステム内のデータベースとして、データベース内に登録されているレコードを検索することで同等の処理を行うようにしてもよい。
例えば、発注処理を行う場合に、稟議書とシステムが発行した注文番号を対応させて、レコード内に登録して、注文書を印刷する。図11は、レコード群1100のデータ構造の印刷例を示す説明図である。レコード群1100は、日付欄1110、稟議番号欄1120、注文番号欄1130、品名欄1140を有しており、レコード構造となっている。注文書には、発行された注文番号が記載されている。業務プロセス定義テーブル400の代わりとなる業務プロセス定義テーブル1200では、発注処理において、前の処理と関連する項目として、注文番号が登録されている(図12に例示した業務プロセス定義テーブル1200参照)。前の処理は、集中処理を行うシステムなので、システム内に記録されているレコードを注文番号をキーとして検索を行う。注文書発行処理では、前の処理と関連する項目は、稟議番号となっているので、稟議番号を検索したレコードから取り出し、前の処理で登録先と指定されているデータベース内を稟議番号をキーとして検索を行う。
図13を参照して、本実施の形態の情報処理システムのハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1301は、前述の実施の形態において説明した各種のモジュール、すなわち、文書受付モジュール110、文書検索モジュール120、業務プロセス定義モジュール130等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、文書、認識結果(その文書内の項目の内容)などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図13に示す情報処理システムのハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前記実施の形態においては、図4、図7等で示したデータ構造は、これらのデータ構造に限られず、他のデータ構造であってもよい。例えば、テーブル構造はリンク構造等であってもよい。また、データ項目は、これらに図示したものに限られず、他のデータ項目を有していてもよい。
なお、前述の実施の形態のうち、登録処理を行う構成と検索処理を行う構成に分けてもよい。また、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…文書受付モジュール
120…文書検索モジュール
130…業務プロセス定義モジュール
140…文書読込モジュール
150…文書保存モジュール

Claims (4)

  1. 処理を一意に特定する処理符号と、該処理に用いられる第1の文書内に記載されており、業務を構成する処理の順番における該処理の前又は後の処理で用いられる第2の文書に記載されている項目とを処理定義として対応付けて記憶する処理定義記憶手段と、
    処理に用いられた文書を一意に特定する文書符号と、該文書内に記載されている項目の内容とを対応付けて記憶する文書項目記憶手段と、
    前記処理定義を用いて、前記文書項目記憶手段に記憶されている文書に対応付けられている項目の内容を抽出する項目内容抽出手段と、
    前記項目内容抽出手段によって抽出された項目の内容に基づいて、前記文書項目記憶手段に記憶されている項目の内容を検索し、該項目の内容に対応付けられている文書符号を抽出する文書符号抽出手段と、
    前記文書符号抽出手段によって抽出できた文書符号を、業務を構成する一連の処理で用いられた文書の文書符号として出力する出力手段
    を具備し、
    前記文書は画像であり、
    前記項目に対して、前記画像内の該項目の内容を認識する場合の難易度に応じた値を対応付けて記憶する難易度記憶手段
    をさらに具備し、
    前記難易度に応じた値は、前記項目に用いられる可能性のある文字種の数に応じて定められており、
    前記文書項目記憶手段が記憶する項目の内容は、前記第1の文書内の項目の内容を認識した結果であり、
    前記文書符号抽出手段は、前記項目ごとに、該項目の内容と前記文書項目記憶手段に記憶されている項目の内容とで一致する文字数を計算し、該項目ごとに一致した文字数と難易度に応じた値をかけ合わせた値を合計してスコアを算出し、該スコアが高い文書符号を抽出する
    ことを特徴とする情報処理装置。
  2. 前記文書符号抽出手段は、前記業務における最終の処理が終了した後に、該最終の処理で用いられた文書を起点として、該業務に関連する文書を抽出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記文書符号抽出手段は、前記項目内容抽出手段によって抽出された項目の内容と前記文書項目記憶手段に記憶されている項目の内容のうち、予め定められた部分が同じ場合は、前記文書項目記憶手段に記憶されている項目の内容に対応する文書符号を抽出する
    ことを特徴とする請求項1または2に記載の情報処理装置。
  4. コンピュータを、
    処理を一意に特定する処理符号と、該処理に用いられる第1の文書内に記載されており、業務を構成する処理の順番における該処理の前又は後の処理で用いられる第2の文書に記載されている項目とを処理定義として対応付けて記憶する処理定義記憶手段と、
    処理に用いられた文書を一意に特定する文書符号と、該文書内に記載されている項目の内容とを対応付けて記憶する文書項目記憶手段と、
    前記処理定義を用いて、前記文書項目記憶手段に記憶されている文書に対応付けられている項目の内容を抽出する項目内容抽出手段と、
    前記項目内容抽出手段によって抽出された項目の内容に基づいて、前記文書項目記憶手段に記憶されている項目の内容を検索し、該項目の内容に対応付けられている文書符号を抽出する文書符号抽出手段と、
    前記文書符号抽出手段によって抽出できた文書符号を、業務を構成する一連の処理で用いられた文書の文書符号として出力する出力手段
    として機能させ
    前記文書は画像であり、
    前記項目に対して、前記画像内の該項目の内容を認識する場合の難易度に応じた値を対応付けて記憶する難易度記憶手段
    としてさらに機能させ、
    前記難易度に応じた値は、前記項目に用いられる可能性のある文字種の数に応じて定められており、
    前記文書項目記憶手段が記憶する項目の内容は、前記第1の文書内の項目の内容を認識した結果であり、
    前記文書符号抽出手段は、前記項目ごとに、該項目の内容と前記文書項目記憶手段に記憶されている項目の内容とで一致する文字数を計算し、該項目ごとに一致した文字数と難易度に応じた値をかけ合わせた値を合計してスコアを算出し、該スコアが高い文書符号を抽出する
    ことを特徴とする情報処理プログラム。
JP2009152314A 2009-06-26 2009-06-26 情報処理装置及び情報処理プログラム Expired - Fee Related JP5481965B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009152314A JP5481965B2 (ja) 2009-06-26 2009-06-26 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009152314A JP5481965B2 (ja) 2009-06-26 2009-06-26 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2011008584A JP2011008584A (ja) 2011-01-13
JP5481965B2 true JP5481965B2 (ja) 2014-04-23

Family

ID=43565151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009152314A Expired - Fee Related JP5481965B2 (ja) 2009-06-26 2009-06-26 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP5481965B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5683749B1 (ja) 2014-02-04 2015-03-11 株式会社Ubic 文書分析システム、文書分析方法、および、文書分析プログラム
JP5829768B2 (ja) * 2015-01-13 2015-12-09 株式会社Ubic 電子メール分析システム、電子メール分析方法、および、電子メール分析プログラム
JP6729124B2 (ja) * 2016-07-21 2020-07-22 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991339A (ja) * 1995-09-20 1997-04-04 Fujitsu Ltd プロセス整理支援システム
JPH1139292A (ja) * 1997-07-15 1999-02-12 Toshiba Corp 文書管理方法、文書検索方法、及び文書検索装置
JP2000250922A (ja) * 1999-02-26 2000-09-14 Fuji Xerox Co Ltd 文書検索システム、文書検索装置、文書検索方法および記録媒体
JP2000251011A (ja) * 1999-03-01 2000-09-14 Toshiba Corp バーコード認識装置および帳票認識装置
JP2002169802A (ja) * 2000-12-01 2002-06-14 Jekku:Kk 公共事業支援統合情報システムにおける電子納品データ作成支援システム及び記録媒体
JP2007183819A (ja) * 2006-01-06 2007-07-19 Toshiba Corp 文書ファイル検索システム
JP4983028B2 (ja) * 2006-01-30 2012-07-25 富士ゼロックス株式会社 財務統制支援プログラムおよび財務統制支援システム
JP4871659B2 (ja) * 2006-07-10 2012-02-08 クラリオン株式会社 ライセンス発行装置、ライセンス検証装置、ライセンス発行方法、およびプログラム
JP4469818B2 (ja) * 2006-07-18 2010-06-02 株式会社東芝 データ管理装置、データプログラム及びデータ管理方法
JP5082326B2 (ja) * 2006-08-07 2012-11-28 コニカミノルタビジネステクノロジーズ株式会社 文書処理装置、文書処理方法及び文書処理プログラム
JP2008234503A (ja) * 2007-03-23 2008-10-02 Fuji Xerox Co Ltd 情報処理システム及び情報処理プログラム

Also Published As

Publication number Publication date
JP2011008584A (ja) 2011-01-13

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
JP2010510563A (ja) ハード・コピーの書式からの書式定義の自動発生
US11501344B2 (en) Partial perceptual image hashing for invoice deconstruction
JP2009224958A (ja) 業務手順推定システム及びプログラム
US20090257653A1 (en) Image processor and computer readable medium
JP2013164740A (ja) 会計情報読取りシステム、会計情報読取り方法、及びプログラム
JP5481965B2 (ja) 情報処理装置及び情報処理プログラム
JP2011028370A (ja) 画像処理装置及び画像処理プログラム
JP2012043334A (ja) 画像処理装置及び画像処理プログラム
JP2016192223A (ja) 会計情報読取りシステム及びプログラム
JP5357711B2 (ja) 文書処理装置
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP2014078203A (ja) 画像処理装置及び画像処理プログラム
JP5440043B2 (ja) 画像処理装置及び画像処理プログラム
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
JP6623547B2 (ja) 情報処理装置及び情報処理プログラム
JP5510221B2 (ja) 情報処理装置及び情報処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP4793429B2 (ja) 画像処理装置及び画像処理プログラム
US20150043832A1 (en) Information processing apparatus, information processing method, and computer readable medium
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
JP7445364B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
US20230055042A1 (en) Partial Perceptual Image Hashing for Document Deconstruction
JP6303531B2 (ja) 画像処理装置及び画像処理プログラム
JP5928714B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140203

R150 Certificate of patent or registration of utility model

Ref document number: 5481965

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees