JP2009031959A - 文書分類装置及び文書分類プログラム - Google Patents

文書分類装置及び文書分類プログラム Download PDF

Info

Publication number
JP2009031959A
JP2009031959A JP2007194063A JP2007194063A JP2009031959A JP 2009031959 A JP2009031959 A JP 2009031959A JP 2007194063 A JP2007194063 A JP 2007194063A JP 2007194063 A JP2007194063 A JP 2007194063A JP 2009031959 A JP2009031959 A JP 2009031959A
Authority
JP
Japan
Prior art keywords
classification
rule
document
module
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007194063A
Other languages
English (en)
Other versions
JP5023865B2 (ja
Inventor
Reiko Aoyama
礼子 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2007194063A priority Critical patent/JP5023865B2/ja
Priority to US12/056,714 priority patent/US8195587B2/en
Priority to CNA2008100945246A priority patent/CN101354709A/zh
Publication of JP2009031959A publication Critical patent/JP2009031959A/ja
Application granted granted Critical
Publication of JP5023865B2 publication Critical patent/JP5023865B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】予め完全には分類するための規則を特定せずとも、文書を分類できないという事態を抑制するようにした文書分類装置を提供する。
【解決手段】文書分類装置の文書受付手段は、文書を受け付け、規則記憶手段は、文書を分類するための規則である分類規則を記憶し、判断手段は、前記文書受付手段によって受け付けられた文書が前記規則記憶手段に記憶されている分類規則を満たすか否かを判断し、生成条件記憶手段は、分類規則を生成するための条件である生成条件を記憶し、生成手段は、前記判断手段によって分類規則を満たしていないと判断した場合は、前記生成条件記憶手段に記憶されている生成条件に基づいて分類規則を生成し、該分類規則を前記規則記憶手段に記憶させる。
【選択図】図1

Description

本発明は、文書分類装置及び文書分類プログラムに関する。
予め作成された条件に基づき、受信した電子ファイルを分類する技術がある。
これに関連する技術として、例えば、特許文献1には、ネットワーク経由でデータを送信した際に、データの受け取り側で、受け取ったデータが自動的に分類されて格納されるシステムを提供することを課題とし、第1のコンピュータにおいて、送信対象データとそのデータに関するキーワード等とを含んだ電子ファイルを作成して第2のコンピュータに送信し、第2のコンピュータにおいて、その電子ファイルを受け取り、キーワード等を抽出し、そのキーワードを用いてデータベースから該当するディレクトリを検出し、ハードディスクにおけるそのディレクトリにデータを保存し、これにより、送信者がハードディスクのディレクトリ構造を意識しなくても、ネットワーク経由でデータを自動的に分類された状態で保存させられることが開示されている。
特開2003−223383号公報
ところで、条件に基づいて文書を分類する場合、分類するための規則を予め完全には特定できない場合がある。
そこで、本発明は、予め分類するための規則を特定せずとも、文書を分類できないという事態を抑制するようにした文書分類装置及び文書分類プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文書を受け付ける文書受付手段と、文書を分類するための規則である分類規則を記憶する規則記憶手段と、前記文書受付手段によって受け付けられた文書が前記規則記憶手段に記憶されている分類規則を満たすか否かを判断する判断手段と、分類規則を生成するための条件である生成条件を記憶する生成条件記憶手段と、前記判断手段によって分類規則を満たしていないと判断した場合は、前記生成条件記憶手段に記憶されている生成条件に基づいて分類規則を生成する生成手段と、前記生成手段により生成された分類規則を前記規則記憶手段に記憶するよう制御する記憶制御手段を具備することを特徴とする文書分類装置である。
請求項2の発明は、前記生成手段によって生成された分類規則に基づいて、前記文書受付手段によって受け付けられた文書を分類する第1の分類手段と、前記第1の分類手段による分類の履歴を記憶する履歴記憶手段と、前記第1の分類手段によって分類された後に、操作者の操作に応じて、前記生成手段によって生成された分類規則が修正された場合は、前記履歴記憶手段に記憶されている分類の履歴及び該修正された分類規則に基づいて、前記文書受付手段によって受け付けられた文書を分類する第2の分類手段を具備することを特徴とする請求項1に記載の文書分類装置である。
請求項3の発明は、前記第1の分類手段によってなされた分類処理を修復する修復手段を具備することを特徴とする請求項2に記載の文書分類装置である。
請求項4の発明は、コンピュータを、文書を受け付ける文書受付手段と、文書を分類するための規則である分類規則を記憶装置に記憶させる規則記憶手段と、前記文書受付手段によって受け付けられた文書が前記規則記憶手段に記憶されている分類規則を満たすか否かを判断する判断手段と、分類規則を生成するための条件である生成条件を記憶装置に記憶させる生成条件記憶手段と、前記判断手段によって分類規則を満たしていないと判断した場合は、前記生成条件記憶手段に記憶されている生成条件に基づいて分類規則を生成する生成手段と、前記生成手段により生成された分類規則を前記規則記憶手段に記憶するよう制御する記憶制御手段として機能させることを特徴とする文書分類プログラムである。
請求項1記載の文書分類装置によれば、予め分類するための規則を特定せずとも、文書を分類できないという事態を抑制することができる。
請求項2記載の文書分類装置によれば、生成された分類規則に基づいて文書を分類した後にその分類規則を修正した場合であっても、分類の履歴に基づいて、修正された分類規則による分類ができる。
請求項3記載の文書分類装置によれば、修正前の分類規則による分類に伴う影響を、本構成を有していない場合と比較して抑制しつつ、修正された分類規則による分類ができる。
請求項4記載の文書分類プログラムによれば、予め分類するための規則を特定せずとも、文書を分類できないという事態を抑制することができる。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させること、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
第1の実施の形態は、図1に示すように、文書受付モジュール101、判断モジュール102、ルール記憶モジュール103、分類モジュール104、文書DB105、他システム106、生成モジュール107、生成条件記憶モジュール108を有している。
文書受付モジュール101は、判断モジュール102と接続されており、分類の対象となる文書を受け付ける。ここで、文書とは、コンピュータの処理対象であり、例えば、具体的にはファイル、文書作成ソフトウェアによって作成された電子文書、画像データ等であり、複数であってもよい。これらの文書には文字データの他に、画像データ、音声データ、動画像データ等が含まれていてもよい。また、文書を受け付けるとは、例えば、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている文書を読み出すこと、スキャナ等で入力した画像(文書)を受け付けること、FAXによって画像(文書)を受信すること等がある。
判断モジュール102は、文書受付モジュール101、分類モジュール104、生成モジュール107と接続されており、ルール記憶モジュール103へアクセスする。判断モジュール102は、文書受付モジュール101によって受け付けられた文書がルール記憶モジュール103に記憶されている分類ルールを満たすか否かを判断し、その判断結果に応じて、分類モジュール104又は生成モジュール107へ制御を渡す。つまり、分類ルール(分類規則)を満たす場合は、文書受付モジュール101によって受け付けられた文書を分類モジュール104へ渡し、分類ルールに沿って分類させる。一方、分類ルールを満たさない場合は、生成モジュール107に新たな分類ルールを生成させる。
ルール記憶モジュール103は、判断モジュール102、生成モジュール107からアクセスされ、文書を分類するための規則である分類ルールを記憶する。
分類モジュール104は、判断モジュール102、文書DB105A、文書DB105B、文書DB105C、他システム106と接続されている。分類モジュール104は、判断モジュール102によって分類ルールを満たしていると判断された場合は、文書受付モジュール101によって受け付けられた文書及び分類ルールを判断モジュール102から受け取り、その分類ルールに応じて文書DB105、他システム106等へ文書を渡す。
文書DB105A、文書DB105B、文書DB105C、他システム106は、それぞれ分類モジュール104と接続されている。文書DB105、他システム106等は、分類モジュール104から文書を受け取り、記憶する。
生成モジュール107は、判断モジュール102と接続されており、ルール記憶モジュール103、生成条件記憶モジュール108へアクセスする。生成モジュール107は、判断モジュール102によって分類ルールを満たしていないと判断された場合は、生成条件記憶モジュール108に記憶されている生成条件に基づいて分類ルールを生成し、その分類ルールをルール記憶モジュール103に記憶させる。
生成条件記憶モジュール108は、生成モジュール107からアクセスされ、分類ルールを生成するための条件である生成条件を記憶する。
図2を用いて、第1の実施の形態をより具現化したものを説明する。ここでは、文書として、画像データを一例として取り扱うものとし、コンピュータ200に実装した場合について説明する。
コンピュータ200は、画像入力モジュール201、文書配信モジュール202、処理モジュール203、ルール生成モジュール204、ルール生成条件記憶モジュール205、ルール記憶モジュール206、ルール表示モジュール207を有している。
画像入力モジュール201は、処理モジュール203と接続され、また、通信回線220を介してPC210と接続されている。この画像入力モジュール201は、図1で示した文書受付モジュール101に対応する。より具体的には、処理モジュール203で処理すべき分類ルールに基づいて監視先を監視する。監視先に画像データが入力されると処理モジュール203へ画像データを渡す。
文書配信モジュール202は、処理モジュール203と接続され、また、通信回線220を介してPC210と接続されている。この文書配信モジュール202は、図1で示した分類モジュール104に対応する。より具体的には、処理モジュール203により指定された配信先に、画像データを配信する。
処理モジュール203は、画像入力モジュール201、文書配信モジュール202、ルール生成モジュール204、ルール記憶モジュール206と接続されている。この処理モジュール203は、図1で示した判断モジュール102に対応する。より具体的には、投入されたジョブを分類ルールの内容に基づき処理する。また、処理時に抽出されたジョブの属性情報を保持する。そして、配信条件に一致しないジョブが入力された場合は、取得したジョブ属性をルール生成モジュール204に渡して、ルール追加処理後の条件でジョブ処理を行う。
ルール生成モジュール204は、処理モジュール203、ルール生成条件記憶モジュール205、ルール記憶モジュール206、ルール表示モジュール207と接続されている。このルール生成モジュール204は、図1で示した生成モジュール107に対応する。より具体的には、画像入力モジュール201の監視先、処理方法、配信方法、配信時の条件、ジョブ処理時に抽出する属性内容を、ルール生成条件記憶モジュール205が記憶しているルール生成条件に基づいて、分類ルールとして生成し、ルール記憶モジュール206へ保存する。すなわち、登録されているルールの配信条件に一致しないジョブが入力された場合に、ルール生成条件記憶モジュール205が記憶しているルール生成条件に基づいて、条件を追加して分類ルールを修正し、ルール記憶モジュール206へ保存する。条件に一致しないジョブが入力された場合は、処理モジュール203から受信したジョブ属性を基に、ルール生成条件記憶モジュール205が記憶しているルール生成条件に基づいて、分類ルールを生成する。
ルール生成条件記憶モジュール205は、ルール生成モジュール204からアクセスされ、ルール生成モジュール204が分類ルールを生成するための条件を記憶している。
ルール記憶モジュール206は、処理モジュール203、ルール生成モジュール204からアクセスされ、受け付けた画像を分類するための分類ルールを記憶している。また、ルール生成モジュール204によって新たに生成された分類ルールを記憶する。
ルール表示モジュール207は、ルール生成モジュール204と接続されており、ルール生成モジュール204によって生成された分類ルールを操作者に提示する。より具体的には、コンピュータ200に接続されたディスプレイ等への表示を制御する。
PC210は、通信回線220を介して、コンピュータ200の画像入力モジュール201及び文書配信モジュール202と接続されている。このPC210は、図1で示した文書DB105又は他システム106に対応する。より具体的には、コンピュータ200の画像入力モジュール201へ画像データを送信する、又はコンピュータ200の文書配信モジュール202から画像データを受信する。送信する画像データは、PC210内の文書DBに記憶されている。また、受信した画像データは、PC210内の文書DBに記憶する。
次に作用・働き(動作)を説明する。
まず、本実施の形態において、画像データを処理するにあたっての前準備の段階の処理について説明する。
(1)ルール生成モジュール204で、条件に一致しない場合に生成するルール生成条件を設定する。この設定は、操作者の操作に応じて行う。
(2)ルール生成条件は、優先順位の高い順に設定し、条件の対象である属性に対して作成するルール内容を設定する。なお、このルール生成条件は、分類ルールを生成するためのルールであることから、いわゆるメタルールになる。
ルール追加条件のデータ構造及び具体例について、図3を用いて説明する。
ルール生成条件テーブル300は、第1条件欄310、演算欄315、第2条件欄320、設定内容欄330を有している。第1条件欄310は、属性欄311、条件欄312を有している。第2条件欄320は、属性欄321、条件欄322を有している。設定内容欄330は、配信先欄331、配信内容欄332を有している。なお、ルール生成条件テーブル300内の最初にある行は優先順位が高く、以下順番に優先順位が低くなる。
第1条件欄310及び第2条件欄320の内容は、生成ルールを適用する際の条件である。もちろんのことながら、他の条件である第3条件等を付加してもよいし、第1条件のみであってもよい。また、演算欄315の内容は、第1条件と第2条件を適用する場合の関係(論理演算)である。属性欄311、属性欄321の内容として、FAX番号(電話番号)、FAXID(送信してきたFAXの機器を識別できる識別子)、文字認識結果、メールアドレス、添付ファイル等が指定される。そして、条件欄312、条件欄322の内容として、対応する属性欄311、属性欄321の内容の状態が指定される。
また、設定内容欄330の内容は、第1条件欄310、第2条件欄320の内容に合致した場合に、分類ルールを生成するためのルールである。つまり、配信先欄331の内容によって、画像データの分類先である配信先が指定され、配信内容欄332の内容によって、どのような配信を行うかが指定される。配信先欄331の内容として、メール送信、フォルダ保存、通知等が指定され、配信内容欄332の内容として、メール送信先、メール送信の際に画像データを添付ファイルとすること、フォルダ名を指定して格納すること、通知する内容、画像データの変換処理等が指定される。
例えば、ルール生成条件テーブル300内の1番目のルール生成条件は、条件として第1条件と第2条件があり、第1条件の内容として、属性がFAX番号であり、条件がFAX番号があること、そして、第2条件との演算はANDであり、第2条件の内容として、属性が文字認識結果(画像データを文字認識した結果)であり、条件が「至急」という文字が含まれていること、である。そして、その条件に合致した場合は、分類ルールの設定内容として、配信先がメール送信であり、配信内容はbbb@xxxへ画像データを添付してメール送信、FAX番号でサブフォルダを作成して画像データを格納すること、となる。
ルール記憶モジュール206に記憶されている分類ルールの例について、図4を用いて説明する。
図4(A)は、ルール記憶モジュール206内の分類ルールの一例であり、予め操作者によって作成された分類ルールである。分類ルールは、木構造をなしており、条件とその条件に合致した場合の処理からなっている。図4(A)の例では、条件である配信条件401と処理であるフォルダ保存402、メール通知403からなっている。図4(A)は、分類ルールを適用する場合の条件として「配信条件:FAX番号が12−345−6789」であり、その条件に合致した場合は「フォルダ保存:FAX番号でサブフォルダを作成し格納」及び「メール通知:abc@xxxへ通知」を行うという分類ルールを表している。
図4(B)は、図4(A)の状態から、ルール生成モジュール204によって新たに分類ルールが生成された後のルール記憶モジュール206内の状態を表している。配信条件401〜メール通知403の分類ルールの他に配信条件411〜メール通知413からなる分類ルールがある。つまり、条件である配信条件411とその条件に合致した場合の処理であるフォルダ保存412、メール通知413の分類ルールが新たに追加された状態である。
以下、第1の実施の形態における処理(主に、分類ルールを生成する処理を中心としたもの)について、図5に示すフローチャートを用いて説明する。
まず、画像入力モジュール201が、通信回線220を介して他のシステムから画像データを受信し、処理モジュール203へ渡す。処理モジュール203は、その画像データに対して、ルール記憶モジュール206に記憶されている分類ルールに基づいて処理を行う場面である。
ステップS501では、処理モジュール203は、分類ルールに基づく処理時に、その分類ルールに設定されている配信条件に一致するか否かを判断する。
かかる判断において一致している(YES)ならばステップS502へ進み、それ以外である(NO)ならばステップS503へ進む。
一致しないジョブであったならば、取得できた属性と処理中のルールIDをルール生成モジュール204に渡す。取得できた属性として、例えば、FAX番号、文字認識結果として「至急」が含まれた文字列、文書名等である。
なお、ここでジョブとは、利用者によって定義されるものであって、コンピュータ(本実施の形態による装置を含む)によって実施される仕事(分類処理)の単位をいう。ジョブの表現は、コンピュータプログラム、ファイル、オペレーティングシステム制御文などの集合からなる。
ステップS502では、処理モジュール203は、その分類ルールに基づいて処理を行う。つまり、ステップS501で判断された条件に付随する配信先へ、文書配信モジュール202を用いて画像データを配信する。例えば、送信元のFAX番号の名前のサブフォルダをPC210内に作成し、そのサブフォルダに画像データを格納する。そして、画像データを受信し格納したことをabc@xxxへ電子メールを用いて通知する。
ステップS503では、処理モジュール203は、次の分類ルールの一部である配信条件があるか否かを判断する。配信条件がある場合(YES)はステップS501へ戻り、それ以外である(NO)ならばステップS504へ進む。つまり、ステップS504へ進む場合は、適用できる分類ルールがルール記憶モジュール206内にはなかった場合である。
ステップS504では、ルール生成モジュール204は、ルール追加条件の設定があるか否かを判断する。つまり、ルール生成条件記憶モジュール205内にルール生成条件テーブル300があるか否かを判断する。ある場合(YES)はステップS506へ進み、それ以外の場合(NO)はステップS505へ進む。
ステップS505では、適用すべき分類ルールがなかったこと及び新しい分類ルールを作成することもできなかったことを操作者に提示する。例えば、コンピュータ200に接続されたディスプレイにその旨を表示するようにしてもよい。
ステップS506では、ルール生成モジュール204は、ステップS501で取得した属性を用いて、ルール生成条件記憶モジュール205内のルール生成条件テーブル300の条件と優先順位の高い順に比較する。かかる比較によって一致する条件がある(YES)ならばステップS507へ進み、それ以外の場合(NO)はステップS505へ進む。
属性と一致する分類ルール追加条件(具体的には第1条件欄310、演算欄315、第2条件欄320内の条件)を発見したならば、ステップS501で取得したルールIDに対応する分類ルールをルール記憶モジュール206から読み込む。読み込んだ分類ルールに、一致する条件の設定内容(具体的には設定内容欄330内の内容)を適用して新たな分類ルールを生成する。
例えば、生成する分類ルールとして、配信条件は「FAX番号が11−222−3333 AND 文字認識結果が「至急」を含む」であり、配信先は「フォルダ格納 「11−222−3333」という名前のサブフォルダを作成して保存。bbb@xxxへ添付してメール送信」等がある。
ステップS507では、ルール生成モジュール204は、ルール記憶モジュール206内に生成した新たな分類ルールを追加する。そして、ルール生成モジュール204は、分類ルールの追加後、処理モジュール203へルール変更通知を送信する。処理モジュール203は、追加された分類ルールをルール記憶モジュール206から読み込み、その追加された分類ルールの部分から分類処理を実行する。
また、ルール表示モジュール207は、分類ルールの一覧を表示する場合に、旧来の分類ルールと区別できるようにするために、生成した分類ルールについてマークを付与して、コンピュータ200によって生成したことがわかるように表示する。
図6は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。
第2の実施の形態は、第1の実施の形態に処理履歴記憶モジュール601、修正モジュール602、修復モジュール603を付加したものである。なお、第1の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略するが、処理履歴記憶モジュール601、修正モジュール602、修復モジュール603と係わるモジュールについては、その説明を行う。
第2の実施の形態は、図6に示すように、文書受付モジュール101、判断モジュール102、ルール記憶モジュール103、分類モジュール104、文書DB105、他システム106、生成モジュール107、生成条件記憶モジュール108、処理履歴記憶モジュール601、修正モジュール602、修復モジュール603を有している。
分類モジュール104は、判断モジュール102、文書DB105A、文書DB105B、文書DB105C、他システム106、処理履歴記憶モジュール601、修正モジュール602と接続されている。分類モジュール104は、生成モジュール107によって生成された分類ルールに基づいて、文書受付モジュール101によって受け付けられた文書を分類する。そして、その分類処理の履歴を処理履歴記憶モジュール601に記憶させる。また、前述のように分類モジュール104によって分類された後に、修正モジュール602によって分類ルールが修正された場合は、処理履歴記憶モジュール601に記憶されている分類の履歴及びその修正された分類ルールに基づいて、文書受付モジュール101によって受け付けられた文書を分類し直す。
ルール記憶モジュール103は、判断モジュール102、生成モジュール107、修正モジュール602と接続されており、修正モジュール602によって修正された分類ルールを記憶する。
処理履歴記憶モジュール601は、分類モジュール104、修正モジュール602と接続されており、分類モジュール104による分類処理の履歴及び修正モジュール602による分類ルールの修正履歴を記憶する。
修正モジュール602は、ルール記憶モジュール103、分類モジュール104、処理履歴記憶モジュール601、修復モジュール603と接続されており、操作者の操作に応じて、生成モジュール107によって生成された分類ルールを修正する。そして、その修正後の分類ルールをルール記憶モジュール103に格納する。さらに、その修正履歴を処理履歴記憶モジュール601に格納する。
修復モジュール603は、文書DB105、他システム106、修正モジュール602と接続されており、修正前の分類ルールに基づく分類モジュール104による分類処理を修復する。つまり、修復するために、文書DB105、他システム106等に文書の削除等の指令を出す。
第2の実施の形態をより具現化したものは、図2を用いて説明したものと同様である。つまり、処理モジュール203は、処理履歴記憶モジュール601、修正モジュール602、修復モジュール603のモジュールも含んだ処理を行う。
次に図7、図8に示すフローチャートを用いて、第2の実施の形態による作用・働き(動作)を説明する。
まず、コンピュータ200により生成された分類ルールを修正する前の処理について、図7に示すフローチャートを用いて説明する。
ステップS701では、処理モジュール203は、分類ルールの配信条件に一致するか否かを判断する。一致する場合(YES)はステップS702へ進み、それ以外の場合(NO)は終了(ステップS705)する。
ステップS702では、処理モジュール203は、分類ルールに基づいて、分類処理を実行する。つまり、条件に付随する配信先へ画像を配信する。
ステップS703では、処理モジュール203は、ルール生成モジュール204によってコンピュータ200により生成された分類ルールであって、操作者の操作によってその分類ルールが確定していないものであるか否かを判断する。確定していない場合(YES)はステップS704へ進み、それ以外の場合(NO)は終了(ステップS705)する。
ステップS704では、処理モジュール203は、ルール生成モジュール204によって生成された分類ルールで処理したジョブのジョブID等を処理履歴記憶モジュール601に記憶する。
ここで、処理履歴として処理履歴記憶モジュール601に記憶されるデータを、図9を用いて説明する。処理履歴記憶モジュール601には、保存IDテーブル900が記憶されている。
保存IDテーブル900は、追加したが確定していないルールID欄901、ユニットID欄902、ジョブID欄903、文書ID欄904、配信先欄905、配信時の文書欄906を有している。追加したが確定していないルールID欄901の内容は、ルール生成モジュール204によって生成された分類ルールの識別子であり、修正モジュール602による修正又は確認が終了していない分類ルールである。ユニットID欄902の内容は、フォルダ保存、メール送信などの機能単位で割り当てられる識別子であり、ルールID一つに対し複数のユニットIDがあってもよい。ジョブID欄903の内容は、その分類ルールを実施したジョブの識別子である。文書ID欄904の内容は、その分類ルールで処理の対象となった文書の識別子である。配信先欄905の内容は、その分類ルールによって文書が配信された配信先である。例えば、PC210内のフォルダ等が該当する。配信時の文書欄906の内容は、その分類ルールによって配信された文書の配信先における文書名である。修復の際に用いるものである。
次に、コンピュータ200により生成された分類ルールを修正した後の再処理について、図8に示すフローチャートを用いて説明する。
まず、操作者の操作によって、修正モジュール602は、その分類ルールが確定していないことを示すマークが付いている分類ルールを修正する。ここでの修正の対象は、フォルダ保存402、メール通知403等の機能である。例えば、サブフォルダの名称変更等を行う。そして、操作者は再実行を指示する。
ステップS801では、処理モジュール203は、再実行する修正された分類ルールのルールID(追加したが確定していないルールID欄901)と変更した機能の関連するユニットID(ユニットID欄902)から処理したジョブ識別子を処理履歴記憶モジュール601から読み出す。つまり、追加したが確定していないルールIDとユニットIDによって、特定されるジョブIDを抽出する。そして、再処理すべき箇所を特定する。
ステップS802では、処理モジュール203は、ステップS801で抽出したジョブIDから文書ID欄904の内容である識別子により特定されるオリジナル文書(最初に画像入力モジュール201によって入力された画像データ)を取得する。
ステップS803では、処理モジュール203は、ステップS802で取得したオリジナル文書に対して修正した分類ルールに基づいて、分類処理を再実行する。
ステップS804では、修復モジュール603は、処理したジョブIDやユニットID等に基づき以前に分類処理である配信を行った文書を文書DB105、他システム106等から検索して、その文書を削除する。つまり、いったん処理したものを取り消す処理である。例えば、旧サブフォルダ名(修正前の分類ルールに設定されていたサブフォルダの名称)のフォルダにある文書等を削除する等である。
そして、ルール表示モジュール207は、設定内容の確認・変更を行った後は、その分類ルールが確定されたとみなせるため、分類ルールに付したマークを消す。
なお、ステップS803およびステップS804の処理の順序は逆でもよい。すなわち、いったん処理したものを取り消してから、修正した分類ルールに基づいて、分類処理を再実行してもよい。
また、ルール生成モジュール204によって新たに生成された分類ルールのジョブは、確認が実施されるまで一時停止状態にしてもよい。その場合は、ステップS804の処理は不要となる。
図10を参照して、前述の実施の形態のハードウェア構成例について説明する。図10に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1017と、プリンタなどのデータ出力部1018を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1001は、前述の実施の形態において説明した各種のモジュール、すなわち、判断モジュール102、生成モジュール107、修正モジュール602、修復モジュール603等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1002は、CPU1001が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1003は、CPU1001の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1004により相互に接続されている。
ホストバス1004は、ブリッジ1005を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1006に接続されている。
キーボード1008、マウス等のポインティングデバイス1009は、操作者により操作される入力デバイスである。ディスプレイ1010は、液晶表示装置又はCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1011は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1001によって実行するプログラムや情報を記録又は再生させる。ハードディスクは、文書受付モジュール101が受け付けた文書や文字認識した結果の文字列データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1012は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1013に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1007、外部バス1006、ブリッジ1005、及びホストバス1004を介して接続されているRAM1003に供給する。リムーバブル記録媒体1013も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1014は、外部接続機器1015を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1014は、インタフェース1007、及び外部バス1006、ブリッジ1005、ホストバス1004等を介してCPU1001等に接続されている。通信部1016は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1017は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1018は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図10に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図10に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図10に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、FAX、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、FAX等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前記実施の形態においては、図3、図4、図9で示したデータ構造は、これらのデータ構造に限られず、他のデータ構造であってもよい。例えば、テーブル構造のものはリンク構造等であってもよい。また、データ項目は、これらに図示したものに限られず、他のデータ項目を有していてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態をより具現化した場合のモジュール構成図である。 ルール生成条件テーブルのデータ構造の一例を示す説明図である。 分類ルールのデータ構造の一例を示す説明図である。 第1の実施の形態による処理例を示すフローチャートである。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示すフローチャートである。 保存IDテーブルのデータ構造の一例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
符号の説明
101…文書受付モジュール
102…判断モジュール
103…ルール記憶モジュール
104…分類モジュール
105A、105B、105C…文書DB
106…他システム
107…生成モジュール
108…生成条件記憶モジュール
200…コンピュータ
201…画像入力モジュール
202…文書配信モジュール
203…処理モジュール
204…ルール生成モジュール
205…ルール生成条件記憶モジュール
206…ルール記憶モジュール
207…ルール表示モジュール
210…PC
220…通信回線
601…処理履歴記憶モジュール
602…修正モジュール
603…修復モジュール

Claims (4)

  1. 文書を受け付ける文書受付手段と、
    文書を分類するための規則である分類規則を記憶する規則記憶手段と、
    前記文書受付手段によって受け付けられた文書が前記規則記憶手段に記憶されている分類規則を満たすか否かを判断する判断手段と、
    分類規則を生成するための条件である生成条件を記憶する生成条件記憶手段と、
    前記判断手段によって分類規則を満たしていないと判断した場合は、前記生成条件記憶手段に記憶されている生成条件に基づいて分類規則を生成する生成手段と、
    前記生成手段により生成された分類規則を前記規則記憶手段に記憶するよう制御する記憶制御手段
    を具備することを特徴とする文書分類装置。
  2. 前記生成手段によって生成された分類規則に基づいて、前記文書受付手段によって受け付けられた文書を分類する第1の分類手段と、
    前記第1の分類手段による分類の履歴を記憶する履歴記憶手段と、
    前記第1の分類手段によって分類された後に、操作者の操作に応じて、前記生成手段によって生成された分類規則が修正された場合は、前記履歴記憶手段に記憶されている分類の履歴及び該修正された分類規則に基づいて、前記文書受付手段によって受け付けられた文書を分類する第2の分類手段
    を具備することを特徴とする請求項1に記載の文書分類装置。
  3. 前記第1の分類手段によってなされた分類処理を修復する修復手段
    を具備することを特徴とする請求項2に記載の文書分類装置。
  4. コンピュータを、
    文書を受け付ける文書受付手段と、
    文書を分類するための規則である分類規則を記憶装置に記憶させる規則記憶手段と、
    前記文書受付手段によって受け付けられた文書が前記規則記憶手段に記憶されている分類規則を満たすか否かを判断する判断手段と、
    分類規則を生成するための条件である生成条件を記憶装置に記憶させる生成条件記憶手段と、
    前記判断手段によって分類規則を満たしていないと判断した場合は、前記生成条件記憶手段に記憶されている生成条件に基づいて分類規則を生成する生成手段と、
    前記生成手段により生成された分類規則を前記規則記憶手段に記憶するよう制御する記憶制御手段
    として機能させることを特徴とする文書分類プログラム。
JP2007194063A 2007-07-26 2007-07-26 文書分類装置及び文書分類プログラム Expired - Fee Related JP5023865B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007194063A JP5023865B2 (ja) 2007-07-26 2007-07-26 文書分類装置及び文書分類プログラム
US12/056,714 US8195587B2 (en) 2007-07-26 2008-03-27 Method and apparatus for classifying and transmitting electronic documents by storing priorities and classifying rules pertaining to a distribution method
CNA2008100945246A CN101354709A (zh) 2007-07-26 2008-04-18 信息分类装置和信息分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007194063A JP5023865B2 (ja) 2007-07-26 2007-07-26 文書分類装置及び文書分類プログラム

Publications (2)

Publication Number Publication Date
JP2009031959A true JP2009031959A (ja) 2009-02-12
JP5023865B2 JP5023865B2 (ja) 2012-09-12

Family

ID=40296252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007194063A Expired - Fee Related JP5023865B2 (ja) 2007-07-26 2007-07-26 文書分類装置及び文書分類プログラム

Country Status (3)

Country Link
US (1) US8195587B2 (ja)
JP (1) JP5023865B2 (ja)
CN (1) CN101354709A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013142955A (ja) * 2012-01-10 2013-07-22 Fuji Xerox Co Ltd 文書処理装置及びプログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9355355B2 (en) * 2010-07-02 2016-05-31 Hewlett Packard Enterprise Development Lp Rule based automation
US10228913B2 (en) * 2013-09-10 2019-03-12 Oracle International Corporation Functional rule and component storage
CN104199814A (zh) * 2014-02-24 2014-12-10 无锡天脉聚源传媒科技有限公司 一种资源分拣方法及装置
CN104993965A (zh) * 2015-07-15 2015-10-21 柳州六品科技有限公司 采用虹膜加密的基于网络的数据恢复系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05233706A (ja) * 1992-02-25 1993-09-10 Hitachi Ltd 文書分類保管システム
JPH09190447A (ja) * 1996-01-10 1997-07-22 Nec Corp 電子メール分類装置
JPH11203302A (ja) * 1998-01-09 1999-07-30 Nec Corp 文書分類装置、方法及び記録媒体
JP2002117046A (ja) * 2000-10-05 2002-04-19 Just Syst Corp 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004152327A (ja) * 2002-10-28 2004-05-27 Sony Corp 音楽記録再生装置及び方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885705A (en) * 1988-02-25 1989-12-05 Eastman Kodak Company Expert system shell for building photofinishing diagnostic systems
US5121496A (en) * 1988-07-25 1992-06-09 Westinghouse Electric Corp. Method for creating, maintaining and using an expert system by recursively modifying calibration file and merging with standard file
US5367619A (en) * 1990-04-27 1994-11-22 Eaton Corporation Electronic data entry system employing an expert system to facilitate generation of electronic data forms with complex interrelationships between fields and subforms
US5579472A (en) * 1994-11-09 1996-11-26 Novalink Technologies, Inc. Group-oriented communications user interface
US20020046047A1 (en) * 2000-07-07 2002-04-18 Budd Jeffrey R. Patient care management system and method
AU2001288919A1 (en) * 2000-09-07 2002-03-22 Hnc Software, Inc. Mechanism and method for dynamic question handling through an electronic interface
US20050144114A1 (en) * 2000-09-30 2005-06-30 Ruggieri Thomas P. System and method for providing global information on risks and related hedging strategies
JP2003223383A (ja) 2002-01-30 2003-08-08 Matsushita Electric Ind Co Ltd データ送信方法およびデータ格納方法、情報処理装置、並びにプログラム
CN1659589A (zh) * 2002-04-19 2005-08-24 电脑联合想象公司 用于提供推理服务的系统和方法
US7672940B2 (en) * 2003-12-04 2010-03-02 Microsoft Corporation Processing an electronic document for information extraction
US20070115497A1 (en) * 2005-10-28 2007-05-24 Ingenia Holdings (Uk) Limited Document Management System
US8451475B2 (en) * 2007-05-01 2013-05-28 Kofax, Inc. Systems and methods for routing a facsimile confirmation based on content

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05233706A (ja) * 1992-02-25 1993-09-10 Hitachi Ltd 文書分類保管システム
JPH09190447A (ja) * 1996-01-10 1997-07-22 Nec Corp 電子メール分類装置
JPH11203302A (ja) * 1998-01-09 1999-07-30 Nec Corp 文書分類装置、方法及び記録媒体
JP2002117046A (ja) * 2000-10-05 2002-04-19 Just Syst Corp 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004152327A (ja) * 2002-10-28 2004-05-27 Sony Corp 音楽記録再生装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013142955A (ja) * 2012-01-10 2013-07-22 Fuji Xerox Co Ltd 文書処理装置及びプログラム

Also Published As

Publication number Publication date
CN101354709A (zh) 2009-01-28
US8195587B2 (en) 2012-06-05
US20090030866A1 (en) 2009-01-29
JP5023865B2 (ja) 2012-09-12

Similar Documents

Publication Publication Date Title
US9875465B2 (en) Process control device, process control method, and non-transitory computer-readable medium
CN107766009B (zh) 信息处理装置和信息处理方法
US20170017912A1 (en) Work assistance device, work assistance method, and non-transitory computer-readable medium
JP5023865B2 (ja) 文書分類装置及び文書分類プログラム
JP2010170298A (ja) 情報管理プログラム及び情報管理システム
US8812467B2 (en) Information processing apparatus and computer readable medium for performing history cancellation processing
JP4259588B2 (ja) 情報処理システム及び情報処理プログラム
JP2009232265A (ja) イメージログ管理装置及びイメージログ管理プログラム
US20130246566A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP2007312225A (ja) データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム
US10438011B2 (en) Information processing apparatus and non-transitory computer readable medium
JP5440043B2 (ja) 画像処理装置及び画像処理プログラム
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
US20110041130A1 (en) Information processing appartus, information processing method and computer readable medium
JP2007004383A (ja) 文書管理装置、文書管理方法、文書管理プログラム及び記録媒体
JP6943113B2 (ja) 情報処理装置及び情報処理プログラム
US9959249B2 (en) Information processing apparatus, document processing apparatus, information processing system, information processing method, and document processing method
JP2009181267A (ja) 情報処理プログラム及び情報処理装置
JP6617472B2 (ja) 情報処理装置及び情報処理プログラム
US9661179B2 (en) Image processing device, information processing method, and non-transitory computer-readable medium
JP6421568B2 (ja) 情報処理装置及び情報処理プログラム
JP6623547B2 (ja) 情報処理装置及び情報処理プログラム
JP7388176B2 (ja) 情報処理装置及び情報処理プログラム
JP4925711B2 (ja) 一括登録情報生成装置及び一括登録情報生成方法及び一括登録情報生成プログラム
JP2007011472A (ja) 情報処理方法及びその装置、プログラム、コンピュータ可読メモリ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120604

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees