JP2004164584A - 電子文書を分類するための方法およびシステム - Google Patents
電子文書を分類するための方法およびシステム Download PDFInfo
- Publication number
- JP2004164584A JP2004164584A JP2003202081A JP2003202081A JP2004164584A JP 2004164584 A JP2004164584 A JP 2004164584A JP 2003202081 A JP2003202081 A JP 2003202081A JP 2003202081 A JP2003202081 A JP 2003202081A JP 2004164584 A JP2004164584 A JP 2004164584A
- Authority
- JP
- Japan
- Prior art keywords
- recipient
- electronic document
- classification
- document
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Computer Hardware Design (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】電子文書のクラスの分類に従って電子文書を取り扱うシステムにおいて電子文書を処理するシステムおよび方法を提供する。
【解決手段】電子文書に分類ツールが補足され、該分類ツールは文書の受信者が電子文書を特定のクラスの文書として手動で分類することを可能にする。次いで補足付き電子文書は受信者に送信される。受信者と分類ツールとの対話に応答して、電子文書の分類情報がシステムに提供される。該分類情報は受信者の対話に対応付けられる特定のクラスを表す。
【選択図】 図1
【解決手段】電子文書に分類ツールが補足され、該分類ツールは文書の受信者が電子文書を特定のクラスの文書として手動で分類することを可能にする。次いで補足付き電子文書は受信者に送信される。受信者と分類ツールとの対話に応答して、電子文書の分類情報がシステムに提供される。該分類情報は受信者の対話に対応付けられる特定のクラスを表す。
【選択図】 図1
Description
【技術分野】
【0001】
本発明は一般的に、電子文書を分類する方法およびシステムに関し、特に、電子メールのためのユーザ分類方法およびシステムに関する。
【背景技術】
【0002】
インターネットサービスの可用性の向上およびインターネットサービスプロバイダの数の永続的な増加と共に、インターネットへのアクセスは非常に簡単になってきた。コンピューティング装置およびインターネットへの通信のコストが低下するにつれて、インターネットで様々なアプリケーションを使用する参加者の数はますます重要になる。現在、インターネットは、ワールドワイドウェブ、ゴーファー、または電子メッセージングのようなサービスの提供における情報および通信資源として使用される。
【0003】
最初、電子メッセージングや電子文書へのアクセスは本質的に、研究者が情報やノウハウを交換するために使用していた。現在、電子メッセージングはもはや研究者専用ではなく、企業や私的エンドユーザに広く使用されている。
【0004】
電子メッセージングアプリケーションおよび電子文書にアクセスするアプリケーションは効率的で簡単に使用できるので、経験の無いエンドユーザでも電子メッセージを送信および受信することができる。
【0005】
今日の電子メッセージングおよび電子文書アクセスのユーザの大きな問題の1つは、望まれない電子メッセージおよび文書の受信、ならびに電子メッセージおよび文書の望まれない送信にある。望まれないメッセージおよび文書の受信としては、非請求メッセージおよび文書、例えば広告を含むメッセージやいわゆるチェーンメッセージに該当するメッセージの受信、望まれない内容の添付ファイル、例えばポルノ写真やビデオを含むメッセージまたは文書の受信、あるいはウィルスに感染した添付ファイルを含むメッセージまたは文書の受信がある。
【0006】
非請求メッセージの場合、エンドユーザはこれらのメッセージを見て、それらが望まれないものであると判断し、削除しなければならないので、しばしば煩わされる。これは時間と神経を費し、そのようなメッセージを受信する全てのエンドユーザにとって絶え間ない迷惑を意味する。さらに、そのような非請求メッセージは今日のネットワークのネットワーク帯域幅を使い果たし、かつ毎年数十億米ドルのコストを浪費している。
【0007】
ウィルスの場合、コストも莫大である。現在インターネット内を循環しているウィルスは帯域幅も浪費しており、さらに企業およびエンドユーザにそのようなウィルスから防御するために高価なセキュリティサービスを買うことを強いている。ウィルスに感染してしまったコンピューティング装置は大きく損傷することがあり、最悪の場合、ウィルスはコンピュータシステムの全データを破壊するだけでなく、他の装置に伝搬され、私的情報を他の装置に伝搬することがある。自動的に他のコンピューティング装置に自己を伝搬させるそのようなウィルスはワームと呼ばれる。
【0008】
コンピュータワームは、感染したコンピューティング装置に常駐する電子アドレスブックを使用し、あるいはそのようなコンピューティング装置の電子メッセージトラフィックを評価してエンドユーザの電子アドレスを突き止め、そこに自己を伝搬させることができる。そのようなワームは、ワームによって送信される発信メッセージが対応するエンドユーザには見えないようにそれ自体の電子メッセージングクライアントを持ち、感染したコンピューティング装置の電子メッセージングソフトウェアクライアントのアウトボックスには現れないので、認識することが難しいかもしれない。したがって、エンドユーザは、自分のコンピューティング装置がコンピュータウィルスまたはワームによって感染していることに気付きさえしないかもしれない。
【0009】
ワームは一般的に、他のエンドユーザの私用データを、あるいは企業の場合はこの企業の外部のユーザ向けでない機密データを送信することがあるので、エンドユーザにとって非常に迷惑である。
【0010】
米国特許第6,161,130号は、着信メッセージストリームで所定の受信者が「くず」とみなしそうな電子メールメッセージを検出するためのシステムを開示している。該システムは、以前の内容分類に基づいて訓練される確率的クラシファイアを通して、その受信者に対するメッセージ内容を弁別する。各メッセージに対してクラシファイアによって生成され、その後予め定められた閾値に照らして比較される、結果として得られる定量的確率尺度を通して、そのメッセージはスパムまたは適正メッセージとして容易に分類され、次いで、その後のユーザによる検索またはユーザへの表示のために対応するフォルダに格納される。しかし、このシステムは受信者毎に訓練が必要であり、したがってその初期セットアップ時の取扱いが特に複雑である。
【特許文献1】
米国特許第6,161,130号
【考案の開示】
【発明が解決しようとする課題】
【0011】
上記の問題に鑑み、本発明の目的は、新しい環境におけるシステムの高速セットアップを達成する、電子文書の分類のための改善された方法およびシステムを提供することである。
【課題を解決するための手段】
【0012】
この目的は、独立請求項の内容によって解決される。従属請求項は発明の好適な実施形態を記載する。
本発明では、電子文書の受信者が電子文書を特定のクラスの文書として手動的に分類することを可能にする分類ツールを電子文書に補足する。補足付き電子文書は受信者に送信される。その後、受信者と分類ツールの対話に応答して電子文書の分類情報が受信される。分類情報とは受信者の対話に対応付けられる特定のクラスを表す。受信した分類情報は次いで、分類情報が格納された電子文書に対応するその後の電子文書を分類情報に従って取り扱うことを可能にするために格納される。
【0013】
そのような方法は訓練段階を必要とせず、したがって追加参加者に対して容易にインストールすることができる。さらに、該方法は特定の受信者に対して自動的に適応されないので、受信した分類情報は単独受信者に使用されるだけでなく、複数の受信者に対しても使用することができる。
【0014】
好適な実施形態では、受信者は、分類ツールの起動可能な部分を起動させることによって電子文書を分類する。起動可能な部分とは、可能な文書クラスの1つに対応付けられる。したがって受信者は、文書をどのクラスに所属させるか、理解しやすい方法で、自分の選択を提供することができる。さらなる実施形態では、分類ツールの起動可能な部分の起動が分類情報の送信をさらに自動的にトリガする場合、受信者の選択プロセスは受信者の単一動作に短縮することができる。
【0015】
分類ツールを電子文書の内容と共に受信者に自動的に表示するように適応させると、特に有利である。このようにして、受信者がeメールソフトウェアと分類ソフトウェアとの間で切り換える必要性を回避することができる。さらに、受信者は、電子文書のクラスを選択するための単一起動を除き、それ以上の動作を行う必要がない。
【0016】
本発明に係る方法のさらなる実施形態では、分類ツールは電子文書に挿入される少なくとも1つのリンクによって形成される。少なくとも1つのリンクの起動は、受信者が電子文書に対してどのクラスを選択したかを識別し、さらに、対応する分類情報の送信をトリガする。この種の分類ツールはその挙動が受信者に理解しやすく、さらに、実現が簡単である。特に、HTMLリンクを使用する場合、そのような分類ツールは一般的に、様々な受信者プラットフォームまたは受信者メールシステムに対するいかなる適応も必要ない。
【0017】
本発明のさらなる有利な実施形態では、ボーナス情報がボーナスマネージャに送信される。ボーナス情報は受信者を識別し、受信者が文書を分類したことを示す。それによって、例えば既存のボーナスシステムを使用して、受信者にボーナスを提供することができる。
【0018】
本発明に係る方法は受信者の分類に依存するので、各受信者が受信した文書をさらに分類するように動機付ける必要がある。ボーナスマネージャが受信したボーナスデータを格納し、くじ引きを実行し、最も積極的に参加する受信者のランク付けを発表し、現金または製品を償還することによって受信者に確実なフィードバックを提供すると、受信者はシステムにさらに参加するように動機付けられる。
【0019】
さらに改善された実施形態では、補足付き電子文書を受信者に送信する前に、電子文書にボーナスデータが補足される。次いで、受信者の分類ツールとの対話により、受信者に即座に確実なフィードバックを提供するために、受信者に与えられるボーナスデータがトリガされる。この方法は、システムのための分類を提供するときに、受信者を直接動機付ける。したがって参加度の向上が達成される。
【0020】
以下で、図面を参照しながら、本発明について説明する。
【発明を実施するための最良の形態】
【0021】
図1は、本発明に係るシステムの実施形態およびそこでの情報の一般的流れを示す。該システムでは、送信者ユニット11、分類マネージャ12、受信者ユニット13、およびボーナスマネージャ14がインターネット10に接続されている。受信者ユニット13は、電子メッセージサーバおよびそれに接続された受信者の端末を含むことができる。以下では、電子メッセージまたはeメールをメッセージとも言う。
【0022】
送信者ユニット11は、インターネット10を介して受信者ユニット13に電子メッセージまたはeメール15を送信する。しかしeメール15は受信者ユニット13に直接送信されず、受信者ユニット13への送信のために事前に分類マネージャ12によって処理され、準備される。
【0023】
分類マネージャで実行されるeメール準備プロセスのステップ50ないし55は、図5に示されている。電子メッセージは最初にステップ51で受信され、その後、ステップ52で分類ツールを補足される。分類ツールは、受信者が受信したメッセージを、複数のメッセージクラスのうちの特定のクラスのメッセージとして分類することを可能にする。最後に、ステップ53で、メッセージは受信者に転送される。
【0024】
さらに、分類マネージャ12に関して、以下で図6および7を参照しながら、自動eメール分類プロセスについてさらに詳しく説明する。
今、図1に戻ると、メッセージは補足付きメッセージ16として分類マネージャ12から受信者ユニット13に転送される。受信者は受信したメッセージの内容を読み、受信したメッセージの分類として特定のクラスを選択するために、分類ツールと対話する。
【0025】
対話に対応して、分類情報17が受信者ユニット13から分類マネージャ12に送信される。分類情報17は電子メッセージ15の識別子を含み、受信者の対話に対応付けられる特定のクラスを示す。単に任意選択的にであるが、対話によってトリガされて、ボーナス情報18がボーナスマネージャ14に送信される。
【0026】
分類マネージャ12は、さらなる電子メッセージを処理するときにこの情報を使用するために、受信した分類情報17、または少なくともそこから導出可能な本質的な情報を格納する。特に、その後の電子メッセージが、分類情報がすでに格納されている電子メッセージに対応することが識別されたときに、この後続メッセージは、以前に例えば同一電子メッセージに対して受信されたクラスに従って取り扱われる。したがって、スパムメッセージがひとたびスパムクラスのメッセージとして識別されると、どの受信者への同じメッセージがさらに送信されることを回避することができる。特に、同じメッセージはさらなる受信者に送信されず、代わりに中止され、それ以上処理されない。
【0027】
図1にさらに示す通り、受信者ユニット13はボーナス情報18をボーナスマネージャ14に送信することがある。ボーナスマネージャ14は、受信者が電子メッセージを分類することによってボーナス点を集めることを可能にする、独立ボーナスシステムの一部とすることができる。ボーナスマネージャ14のそのような独立ボーナスシステムは、例えばインターネットに関係しない他の製品またはサービスにも使用することができる。ボーナスシステムは一般的に、ボーナスをいかに受け取るか、可能な形態のリストからの受信者の選択に従って、現金または製品の形で償還を提供する。しかし、ボーナスマネージャ14は少なくとも部分的に分類マネージャ12に組み込むこともできる。
【0028】
図2は、受信者の端末で彼の電子メッセージソフトウェアによって受信者に表示される電子メッセージ20の図を示す。電子メッセージ20は、見出し領域21、内容領域22、および分類ツール23を含む。
【0029】
見出し領域21は、送信者から受信者に送信された電子文書20が項目「電子メッセージ」に関するものであり、かつ受信者の端末上に表示するのに適した画像を形成する添付ファイル「figure.tif」を含むことを示す。
【0030】
内容領域22内に、メッセージテキストと同様に分類ツール23も表示される。分類ツール23は、受信者が分類ツール23とすぐに対話できるような仕方で、電子メッセージ20と一緒に表示される。
【0031】
分類ツール23は3つの起動可能な領域または起動可能な部分24、25、および26を含む。これらの起動可能な領域の各々は、受信した電子メッセージ20を特定のクラスのメッセージと分類するために、受信者によって起動される。第1の起動可能な領域24はスパムクラスに対応付けられ、第2の起動可能な領域25はいたずらクラスに対応付けられ、第3の起動可能な領域26はアダルト問題クラスに対応付けられる。起動可能な領域24ないし26のうちの1つの起動は、対応する分類情報の分類マネージャへの送信をトリガする。
【0032】
上記および分類ツールの機能から明らかな通り、分類ツールは幾つかの技術によって実現することができる。
例えば、図2の起動可能な領域はHTMLリンクによって形成することができる。そのようなHTMLリンクは、HTMLリンクの起動後にリンク宛先に転送されるメッセージの識別子を含むことができる。さらに、HTMLリンクに対応付けられるクラスは、全てのクラスに1つのリンク宛先を使用する場合にメッセージの識別子と共に転送するか、または各クラスに1つのリンク宛先を使用する場合にリンク宛先によって識別するかのいずれかとすることができる。
【0033】
さらに、分類ツールは、電子メッセージに補足されるJAVA(登録商標)、ActiveX、またはスクリプトをベースとするソフトウェアによって形成することもできる。ウィンドウをベースとするオペレーティングシステムでは、分類ツールはメッセージのウィンドウ内に表示する必要さえなく、別個のウィンドウで受信者に表示することもできる。分類ツールは、受信者に追加的に繰返し転送しなければならないので、そのデザインが単純であり、かつ所用バイト量が小さいことが好ましい。大抵の場合、分類ツールはメッセージ内に挿入される。
【0034】
電子メッセージが第三者に転送される場合、分類ツールを自動的に電子メッセージから削除するか、または電子メッセージ内で不活化することができる。同一受信者による複数回の分類またはすでに分類されその後に転送されたメッセージの複数回の分類を回避するために、削除または不活化は受信者の分類入力に応答して実行することもできる。
【0035】
可能なメッセージクラスの例として、スパムメッセージクラス、非請求メッセージクラス、いたずらメッセージクラス、ウィルスメッセージクラス、チェーンメッセージクラス、アダルト問題クラス、子供問題クラス、またはIT関連ニュースクラスなどのさらなる特殊関心クラスがある。
【0036】
図3は、図1に示した分類マネージャ、ボーナスマネージャ、送信者ユニット、または受信者ユニットのハードウェア構成要素を示す。しかし、以下では分類マネージャにのみ言及する。それはCPU31、一次格納ユニット32、および二次格納ユニット33を含むことができる。さらに、インタフェースユニット34ないし36は分類マネージャをインターネットまたはデータベースに接続し、オペレータがマネージャと対話することを可能にする。オペレータ入力/出力ユニット35はディスプレイ、キーボード、およびマウスを含むことができる。一次格納ユニットはRAM、EEPROM、およびROMを含むことができる。二次格納ユニット33は、ハードディスクまたは光もしくは磁気ディスクドライブによって形成することができる。
【0037】
分類マネージャの機能ユニットを図4に示す。
メッセージ入力ユニット401は着信メッセージを受け取る。メッセージ準備ユニット405に分類ツールを補足された後、補足付きメッセージはメッセージ出力ユニット410を介して受信者に送信することができる。
【0038】
メッセージデータベース411、クラスデータベース412、および送信者/受信者データベース413に格納された情報に基づいて、受信したメッセージを自動的に分類するために、メッセージ識別ユニット402、パターン認識ユニット403、および評価ユニット404が分類マネージャ内に配設される。
【0039】
送信者/受信者データベース413は、例えば受信者が特定の送信者からのメッセージを受信しないことを選択するか、あるいは私的または広告メッセージを私的メールアカウントに転送することを選択するかどうかを示す、受信者の選好を含むことができる。
【0040】
受信者が受信した電子メッセージを分類ツールによって分類すると、分類結果は分類結果入力420によって受け取られる。
クラス管理ユニット408は、以下で図8に関連してさらに詳しく説明するプロセスに従って、分類データベース412における受信クラスの管理を制御する。
【0041】
ボーナス管理ユニット409およびボーナスデータベース413は追加的に使用するか、または図1に示したボーナスマネージャに取って代わるかのいずれかとすることができる。最後に、スパム保護ユニット406およびウィルス保護ユニット407は、システムの能力を増強するために、分類マネージャに組み込まれる。
【0042】
以下の例によって明らかでありかつ説明する通り、図4に示す分類マネージャは、幾つかの任意選択的ユニットを含む実施形態を形成し、それは物理的に別個に配設することもできる。
【0043】
図4の分類マネージャで実行される自動分類のプロセス60ないし68を図6に示す。
自動分類プロセス60ないし68は、ステップ61の電子メッセージの受信から始まる。受信した電子メッセージはステップ62で識別される。メッセージを識別するために、メッセージ識別ユニットは例えば現在処理されている電子メッセージをメッセージデータベースに格納されている電子メッセージと比較する。このデータベースに格納されるデータの量を最適化するために、電子メッセージは、電子メッセージの構造プロファイルおよび/または内容プロファイルによって識別することができる。さらに、電子キーを電子メッセージに適用することによって達成される電子キーシグネチャを、電子メッセージの識別のために使用することができる。
【0044】
電子メッセージの識別は、メッセージを全体として識別するのではなく、電子メッセージを重要な部分に縮小し、それを識別することによってさらに改善することができる。特に、電子メッセージの添付は別個に識別することができる。
【0045】
図6のステップ63で、識別された電子メッセージの関連情報が決定される。したがって、成功裏に識別された電子メッセージに対応付けられるクラスがクラスデータベースに含まれるかどうかが検査される。
【0046】
しかし、未知の電子メッセージの場合、メッセージデータベースに格納されたデータでは、電子メッセージの識別ができない。さらに、電子メッセージが複数の受信者に送信される場合、そのメッセージは、受信者の一人によってまだ手動で分類されていなくても、すでにメッセージデータベースに格納されているかもしれない。そのような場合、およびさらに以前に格納された手動分類結果から導出可能な情報が充分でなく、電子メッセージをさらにどのように処理するかを決定できない場合には、追加ステップ64および65が実行される。
【0047】
メッセージデータベースおよび/または送信者/受信者データベースに格納され、かつスパム保護ユニットおよびウィルス保護ユニットによって任意選択的にサポートされる情報に基づいて、認識ステップ64で、電子メッセージ内のパターンが認識される。認識されるパターンに対応付けられる情報がステップ65で決定される。
【0048】
その後、決定されたパターンおよび分類情報がさらなるステップ66で評価される。最後に、ステップ66の評価結果に従って、電子メッセージが処理67される。
決定された情報を評価するステップ66および評価結果に従ってメッセージを処理するステップ67を、図7にさらに詳しく示す。
【0049】
評価プロセス70ないし78は最初にステップ71で、電子メッセージに対して確認済みクラスがすでに存在するかどうかを検査する。確認済みクラスとは、電子文書の信頼できる分類とみなされるクラスデータベースに格納されたクラスに対応付けられる。確認済みクラスがある場合には、プロセスは、そのクラスに従ってメッセージをさらにどのように取り扱うかを決定するステップ73に続く。
【0050】
しかし、分類データベースに格納されている確認済みクラスが無い場合、クラスを導出するステップ72で、決定されたパターン情報に基づいて電子メッセージをクラスに対応付けることができるかどうかが検査される。未確認クラスは、クラスを導出または推定するステップ72への入力を形成することができる。例えば、一人の受信者によってすでにスパムメッセージとして分類された電子文書については、メッセージが事実上スパムメッセージであることがメッセージ内のさらなるパターンで示された場合にのみ、メッセージは自動的にスパムメッセージに分類される。しかし、メッセージがスパムメッセージであるかもしれないことを示すパターンがメッセージに含まれなければ、メッセージは未分類メッセージまたは未分類文書のクラスのメッセージとしてさらに取り扱われる。
【0051】
決定プロセス73では、導出または格納されたクラスを使用して、メッセージを受信者に直接転送77するかどうかが決定される。例えばメッセージが受信者の以前のメッセージに対する簡単な返事である場合、および送信者が送信者/受信者データベースに受信者に関して登録されている場合、メッセージは直接転送することができる。
【0052】
場合によっては、例えばメッセージが私用メッセージと分類され、その結果として受信者の私的メールアカウントに再転送しなければならない場合には、メッセージを再転送する必要がある。これらのメッセージに対しては、その後ステップ75でメッセージを分類ツール付きで、またはそれ無しで転送すべきかどうかを検査するために、ステップ74で宛先が変更される。
【0053】
分類が未知であるメッセージ、または充分に分類できなかったメッセージは、メッセージを準備するステップ76で分類ツールを補足される。
最後に、決定プロセス73の結果として、例えばスパムメッセージまたはいたずらメッセージは、プロセス70ないし78の終了78に続くことによって、メッセージを転送するステップ77を実行することなく終了することができる。
【0054】
メッセージを処理するための以下の代替法は、図7には示されていない。特に、例えばそれらのパターン情報に基づく未分類メッセージは、受信者らまたは特定の受信者によって望まれないと仮定することができる。
【0055】
そのようなメッセージは、要求があった場合にのみ受信者に送信するために、中間的に格納することができる。潜在的に望まれないメッセージを受信し、即座に格納したことを受信者に通知するために、分類マネージャは中間的に格納されたメッセージのリストを例えば週1回転送する。しかし、これに関して、受信者が頻繁にアクセスすることのできる受信者のリモートメッセージフォルダを使用することもできる。
【0056】
代替的に、特にメッセージが潜在的にスパムメッセージである場合、中間的に格納されたメッセージは、メッセージの送信者からこのメッセージを転送する承認を受け取った後で受信者に送信される。
【0057】
図8は、分類結果を受け取った後で分類マネージャで実行されるプロセス80ないし86を示す。最初にステップ81で、ボーナス情報が分類マネージャで処理および/または格納され、ボーナスマネージャに転送される。
【0058】
受け取ったクラスが電子メッセージの第1の手動分類結果または初期クラスを形成する場合、プロセスはステップ82で、受け取ったクラスを格納してこの初期クラスの確認を待つステップ85に分岐する。前の分類結果がすでに分類マネージャに格納されている場合、前のクラスと現在のクラスがステップ83で比較される。両方のクラスが等しく、かつ前のクラスが未確認であった場合、クラスは今確認済みクラスとして使用される。対応するステップ84で、格納されたクラスの状態が変更される。しかし、前のクラスが現在のクラスと一致しない場合には、ステップ85で現在の分類結果が格納される。前のクラスの状態によって、それはさらに未確認クラスまたは確認済みクラスとして使用される。
【0059】
別個のユニットとして、または分類ユニットの一体化ユニットの組み合わせとして形成することのできるボーナスマネージャの例に関してすでに上述した通り、本発明に係るシステムの幾つかの実施形態およびしたがって図4に示した分類マネージャが可能である。
【0060】
分類マネージャ12の機能ユニットの一部は、受信者のローカルエリアネットワーク(LAN)に実現することができる。自動分類およびメッセージ準備は受信者のLANで局所的に実行する一方、クラス管理、ボーナス管理、およびデータベース機能は、ローカルエリアネットワークのユーザだけでなく、第三者もアクセスできるサーバに実現されることが好ましい。
【0061】
例えば、メッセージ準備ユニット405は、受信者の端末に局所的にインストールするか、あるいは受信者のローカルeメールシステムのeメールサーバにアドオンとしてインストールすることができる。
【0062】
本発明に係る上述した方法およびシステムの手法は、受信者の対話に依存する。しかし、受信者は一般的に、システムに分類情報を提供することに関心を持たない。したがって、受信者は電子メッセージの分類に対してボーナスを受け取る。
【0063】
例えば、図1に示したボーナスマネージャ14は、幾つかのサービスおよびシステムに使用される共用ボーナスシステムとすることができる。ボーナスマネージャは、受信者を識別する識別子を含みかつ受信者が電子メッセージの分類を実行したことを示すボーナス情報を受け取る。受信者がボーナスシステムの登録ユーザである場合、ボーナスマネージャ14は特定の点数を受信者のアカウントに追加する。そのようなボーナスシステムは特に、ユーザが彼らのボーナスを現金または製品の形で受け取ることを希望するかどうかをユーザに選択させる。
【0064】
受信者にボーナスを提供するさらなる一般的可能性は、分類システムに最も積極的に参加した受信者のランキングを発表すること、またはくじ引きを実行することである。
受信者とボーナスマネージャとの間の情報の流れを回避するさらに高度なシステムでは、図4に示したボーナス管理ユニット409は受け取った分類結果を評価し、対応するボーナス情報をボーナスマネージャに送信するか、またはボーナスデータベース414におけるボーナス情報の格納を制御するかのいずれかである。ボーナス管理ユニット409は例えば、ボーナスデータベース414に格納されたボーナスデータに基づいてくじ引きを実行することができる。
【0065】
さらに、ボーナス管理ユニット409は、システム内部の値または受信情報の信頼性に基づいて、受け取った分類結果に対するボーナスを増加または減少することができる。例えば、スパムメッセージを分類した最初の受信者である場合、受信者は高いボーナス値を受け取る。しかし、分類結果が確認される代わりに、同一メッセージのさらなる受信者による分類と矛盾する場合には、ボーナス値を低減することもできる。
【0066】
メッセージ準備ユニット405は、受信者がもっと積極的になるように動機付けるために、参加受信者のランキングにおける受信者の個々のランクを電子メッセージに補足することができる。さらに、例えば複数の同一メールのさらなる送信を回避するために、以前に受け取った分類を確認する2回目の分類が必要である場合、特定の電子メッセージを分類することへの受信者の動機付けを高めるように、分類マネージャを適応させることができる。そのような場合、分類ツールは、現在分類が望まれているこの電子メッセージを分類すると特別ボーナスが受け取れることを受信者に示す。
【0067】
受信者が電子文書を分類した後即座に確実なフィードバックを受け取ると、さらなる改善が達成される。したがって、メッセージ準備ユニット405は、受信者に対して提供することのできるボーナスデータを電子メッセージに補足することができる。これに関して、分類ツールは、受信者が起動可能な領域の1つを起動させた場合に、受信者へのボーナスデータの提供をトリガするように適応される。ボーナスデータは例えば、テキスト、画像、または動画として受信者に表示される冗談を含むことができる。ボーナスデータの型は無作為に、または受信者の選好に従って、選択することができる。そのような即座の確実なフィードバックは、上述したボーナスシステムに追加して、またはその代わりとして使用することができる。
【図面の簡単な説明】
【0068】
【図1】分類マネージャおよび任意のボーナスマネージャを含むシステムの略図である。
【図2】分類ツールとして3つの分類リンクを含む、受信者のメールシステムによって表示される電子文書の略図である。
【図3】例えば送信者端末、受信者端末、分類マネージャ、またはボーナスマネージャを形成するハードウェアユニットの一般構成要素の略図である。
【図4】図1の分類マネージャの機能ユニットの略図である。
【図5】図1の分類マネージャで実行されるメッセージ準備プロセスの流れ図である。
【図6】図1の分類マネージャで実行される自動分類プロセスの流れ図である。
【図7】分類マネージャで実行される評価プロセスの詳細流れ図である。
【図8】分類マネージャで実行された受信分類結果を評価するプロセスの流れ図である。
【0001】
本発明は一般的に、電子文書を分類する方法およびシステムに関し、特に、電子メールのためのユーザ分類方法およびシステムに関する。
【背景技術】
【0002】
インターネットサービスの可用性の向上およびインターネットサービスプロバイダの数の永続的な増加と共に、インターネットへのアクセスは非常に簡単になってきた。コンピューティング装置およびインターネットへの通信のコストが低下するにつれて、インターネットで様々なアプリケーションを使用する参加者の数はますます重要になる。現在、インターネットは、ワールドワイドウェブ、ゴーファー、または電子メッセージングのようなサービスの提供における情報および通信資源として使用される。
【0003】
最初、電子メッセージングや電子文書へのアクセスは本質的に、研究者が情報やノウハウを交換するために使用していた。現在、電子メッセージングはもはや研究者専用ではなく、企業や私的エンドユーザに広く使用されている。
【0004】
電子メッセージングアプリケーションおよび電子文書にアクセスするアプリケーションは効率的で簡単に使用できるので、経験の無いエンドユーザでも電子メッセージを送信および受信することができる。
【0005】
今日の電子メッセージングおよび電子文書アクセスのユーザの大きな問題の1つは、望まれない電子メッセージおよび文書の受信、ならびに電子メッセージおよび文書の望まれない送信にある。望まれないメッセージおよび文書の受信としては、非請求メッセージおよび文書、例えば広告を含むメッセージやいわゆるチェーンメッセージに該当するメッセージの受信、望まれない内容の添付ファイル、例えばポルノ写真やビデオを含むメッセージまたは文書の受信、あるいはウィルスに感染した添付ファイルを含むメッセージまたは文書の受信がある。
【0006】
非請求メッセージの場合、エンドユーザはこれらのメッセージを見て、それらが望まれないものであると判断し、削除しなければならないので、しばしば煩わされる。これは時間と神経を費し、そのようなメッセージを受信する全てのエンドユーザにとって絶え間ない迷惑を意味する。さらに、そのような非請求メッセージは今日のネットワークのネットワーク帯域幅を使い果たし、かつ毎年数十億米ドルのコストを浪費している。
【0007】
ウィルスの場合、コストも莫大である。現在インターネット内を循環しているウィルスは帯域幅も浪費しており、さらに企業およびエンドユーザにそのようなウィルスから防御するために高価なセキュリティサービスを買うことを強いている。ウィルスに感染してしまったコンピューティング装置は大きく損傷することがあり、最悪の場合、ウィルスはコンピュータシステムの全データを破壊するだけでなく、他の装置に伝搬され、私的情報を他の装置に伝搬することがある。自動的に他のコンピューティング装置に自己を伝搬させるそのようなウィルスはワームと呼ばれる。
【0008】
コンピュータワームは、感染したコンピューティング装置に常駐する電子アドレスブックを使用し、あるいはそのようなコンピューティング装置の電子メッセージトラフィックを評価してエンドユーザの電子アドレスを突き止め、そこに自己を伝搬させることができる。そのようなワームは、ワームによって送信される発信メッセージが対応するエンドユーザには見えないようにそれ自体の電子メッセージングクライアントを持ち、感染したコンピューティング装置の電子メッセージングソフトウェアクライアントのアウトボックスには現れないので、認識することが難しいかもしれない。したがって、エンドユーザは、自分のコンピューティング装置がコンピュータウィルスまたはワームによって感染していることに気付きさえしないかもしれない。
【0009】
ワームは一般的に、他のエンドユーザの私用データを、あるいは企業の場合はこの企業の外部のユーザ向けでない機密データを送信することがあるので、エンドユーザにとって非常に迷惑である。
【0010】
米国特許第6,161,130号は、着信メッセージストリームで所定の受信者が「くず」とみなしそうな電子メールメッセージを検出するためのシステムを開示している。該システムは、以前の内容分類に基づいて訓練される確率的クラシファイアを通して、その受信者に対するメッセージ内容を弁別する。各メッセージに対してクラシファイアによって生成され、その後予め定められた閾値に照らして比較される、結果として得られる定量的確率尺度を通して、そのメッセージはスパムまたは適正メッセージとして容易に分類され、次いで、その後のユーザによる検索またはユーザへの表示のために対応するフォルダに格納される。しかし、このシステムは受信者毎に訓練が必要であり、したがってその初期セットアップ時の取扱いが特に複雑である。
【特許文献1】
米国特許第6,161,130号
【考案の開示】
【発明が解決しようとする課題】
【0011】
上記の問題に鑑み、本発明の目的は、新しい環境におけるシステムの高速セットアップを達成する、電子文書の分類のための改善された方法およびシステムを提供することである。
【課題を解決するための手段】
【0012】
この目的は、独立請求項の内容によって解決される。従属請求項は発明の好適な実施形態を記載する。
本発明では、電子文書の受信者が電子文書を特定のクラスの文書として手動的に分類することを可能にする分類ツールを電子文書に補足する。補足付き電子文書は受信者に送信される。その後、受信者と分類ツールの対話に応答して電子文書の分類情報が受信される。分類情報とは受信者の対話に対応付けられる特定のクラスを表す。受信した分類情報は次いで、分類情報が格納された電子文書に対応するその後の電子文書を分類情報に従って取り扱うことを可能にするために格納される。
【0013】
そのような方法は訓練段階を必要とせず、したがって追加参加者に対して容易にインストールすることができる。さらに、該方法は特定の受信者に対して自動的に適応されないので、受信した分類情報は単独受信者に使用されるだけでなく、複数の受信者に対しても使用することができる。
【0014】
好適な実施形態では、受信者は、分類ツールの起動可能な部分を起動させることによって電子文書を分類する。起動可能な部分とは、可能な文書クラスの1つに対応付けられる。したがって受信者は、文書をどのクラスに所属させるか、理解しやすい方法で、自分の選択を提供することができる。さらなる実施形態では、分類ツールの起動可能な部分の起動が分類情報の送信をさらに自動的にトリガする場合、受信者の選択プロセスは受信者の単一動作に短縮することができる。
【0015】
分類ツールを電子文書の内容と共に受信者に自動的に表示するように適応させると、特に有利である。このようにして、受信者がeメールソフトウェアと分類ソフトウェアとの間で切り換える必要性を回避することができる。さらに、受信者は、電子文書のクラスを選択するための単一起動を除き、それ以上の動作を行う必要がない。
【0016】
本発明に係る方法のさらなる実施形態では、分類ツールは電子文書に挿入される少なくとも1つのリンクによって形成される。少なくとも1つのリンクの起動は、受信者が電子文書に対してどのクラスを選択したかを識別し、さらに、対応する分類情報の送信をトリガする。この種の分類ツールはその挙動が受信者に理解しやすく、さらに、実現が簡単である。特に、HTMLリンクを使用する場合、そのような分類ツールは一般的に、様々な受信者プラットフォームまたは受信者メールシステムに対するいかなる適応も必要ない。
【0017】
本発明のさらなる有利な実施形態では、ボーナス情報がボーナスマネージャに送信される。ボーナス情報は受信者を識別し、受信者が文書を分類したことを示す。それによって、例えば既存のボーナスシステムを使用して、受信者にボーナスを提供することができる。
【0018】
本発明に係る方法は受信者の分類に依存するので、各受信者が受信した文書をさらに分類するように動機付ける必要がある。ボーナスマネージャが受信したボーナスデータを格納し、くじ引きを実行し、最も積極的に参加する受信者のランク付けを発表し、現金または製品を償還することによって受信者に確実なフィードバックを提供すると、受信者はシステムにさらに参加するように動機付けられる。
【0019】
さらに改善された実施形態では、補足付き電子文書を受信者に送信する前に、電子文書にボーナスデータが補足される。次いで、受信者の分類ツールとの対話により、受信者に即座に確実なフィードバックを提供するために、受信者に与えられるボーナスデータがトリガされる。この方法は、システムのための分類を提供するときに、受信者を直接動機付ける。したがって参加度の向上が達成される。
【0020】
以下で、図面を参照しながら、本発明について説明する。
【発明を実施するための最良の形態】
【0021】
図1は、本発明に係るシステムの実施形態およびそこでの情報の一般的流れを示す。該システムでは、送信者ユニット11、分類マネージャ12、受信者ユニット13、およびボーナスマネージャ14がインターネット10に接続されている。受信者ユニット13は、電子メッセージサーバおよびそれに接続された受信者の端末を含むことができる。以下では、電子メッセージまたはeメールをメッセージとも言う。
【0022】
送信者ユニット11は、インターネット10を介して受信者ユニット13に電子メッセージまたはeメール15を送信する。しかしeメール15は受信者ユニット13に直接送信されず、受信者ユニット13への送信のために事前に分類マネージャ12によって処理され、準備される。
【0023】
分類マネージャで実行されるeメール準備プロセスのステップ50ないし55は、図5に示されている。電子メッセージは最初にステップ51で受信され、その後、ステップ52で分類ツールを補足される。分類ツールは、受信者が受信したメッセージを、複数のメッセージクラスのうちの特定のクラスのメッセージとして分類することを可能にする。最後に、ステップ53で、メッセージは受信者に転送される。
【0024】
さらに、分類マネージャ12に関して、以下で図6および7を参照しながら、自動eメール分類プロセスについてさらに詳しく説明する。
今、図1に戻ると、メッセージは補足付きメッセージ16として分類マネージャ12から受信者ユニット13に転送される。受信者は受信したメッセージの内容を読み、受信したメッセージの分類として特定のクラスを選択するために、分類ツールと対話する。
【0025】
対話に対応して、分類情報17が受信者ユニット13から分類マネージャ12に送信される。分類情報17は電子メッセージ15の識別子を含み、受信者の対話に対応付けられる特定のクラスを示す。単に任意選択的にであるが、対話によってトリガされて、ボーナス情報18がボーナスマネージャ14に送信される。
【0026】
分類マネージャ12は、さらなる電子メッセージを処理するときにこの情報を使用するために、受信した分類情報17、または少なくともそこから導出可能な本質的な情報を格納する。特に、その後の電子メッセージが、分類情報がすでに格納されている電子メッセージに対応することが識別されたときに、この後続メッセージは、以前に例えば同一電子メッセージに対して受信されたクラスに従って取り扱われる。したがって、スパムメッセージがひとたびスパムクラスのメッセージとして識別されると、どの受信者への同じメッセージがさらに送信されることを回避することができる。特に、同じメッセージはさらなる受信者に送信されず、代わりに中止され、それ以上処理されない。
【0027】
図1にさらに示す通り、受信者ユニット13はボーナス情報18をボーナスマネージャ14に送信することがある。ボーナスマネージャ14は、受信者が電子メッセージを分類することによってボーナス点を集めることを可能にする、独立ボーナスシステムの一部とすることができる。ボーナスマネージャ14のそのような独立ボーナスシステムは、例えばインターネットに関係しない他の製品またはサービスにも使用することができる。ボーナスシステムは一般的に、ボーナスをいかに受け取るか、可能な形態のリストからの受信者の選択に従って、現金または製品の形で償還を提供する。しかし、ボーナスマネージャ14は少なくとも部分的に分類マネージャ12に組み込むこともできる。
【0028】
図2は、受信者の端末で彼の電子メッセージソフトウェアによって受信者に表示される電子メッセージ20の図を示す。電子メッセージ20は、見出し領域21、内容領域22、および分類ツール23を含む。
【0029】
見出し領域21は、送信者から受信者に送信された電子文書20が項目「電子メッセージ」に関するものであり、かつ受信者の端末上に表示するのに適した画像を形成する添付ファイル「figure.tif」を含むことを示す。
【0030】
内容領域22内に、メッセージテキストと同様に分類ツール23も表示される。分類ツール23は、受信者が分類ツール23とすぐに対話できるような仕方で、電子メッセージ20と一緒に表示される。
【0031】
分類ツール23は3つの起動可能な領域または起動可能な部分24、25、および26を含む。これらの起動可能な領域の各々は、受信した電子メッセージ20を特定のクラスのメッセージと分類するために、受信者によって起動される。第1の起動可能な領域24はスパムクラスに対応付けられ、第2の起動可能な領域25はいたずらクラスに対応付けられ、第3の起動可能な領域26はアダルト問題クラスに対応付けられる。起動可能な領域24ないし26のうちの1つの起動は、対応する分類情報の分類マネージャへの送信をトリガする。
【0032】
上記および分類ツールの機能から明らかな通り、分類ツールは幾つかの技術によって実現することができる。
例えば、図2の起動可能な領域はHTMLリンクによって形成することができる。そのようなHTMLリンクは、HTMLリンクの起動後にリンク宛先に転送されるメッセージの識別子を含むことができる。さらに、HTMLリンクに対応付けられるクラスは、全てのクラスに1つのリンク宛先を使用する場合にメッセージの識別子と共に転送するか、または各クラスに1つのリンク宛先を使用する場合にリンク宛先によって識別するかのいずれかとすることができる。
【0033】
さらに、分類ツールは、電子メッセージに補足されるJAVA(登録商標)、ActiveX、またはスクリプトをベースとするソフトウェアによって形成することもできる。ウィンドウをベースとするオペレーティングシステムでは、分類ツールはメッセージのウィンドウ内に表示する必要さえなく、別個のウィンドウで受信者に表示することもできる。分類ツールは、受信者に追加的に繰返し転送しなければならないので、そのデザインが単純であり、かつ所用バイト量が小さいことが好ましい。大抵の場合、分類ツールはメッセージ内に挿入される。
【0034】
電子メッセージが第三者に転送される場合、分類ツールを自動的に電子メッセージから削除するか、または電子メッセージ内で不活化することができる。同一受信者による複数回の分類またはすでに分類されその後に転送されたメッセージの複数回の分類を回避するために、削除または不活化は受信者の分類入力に応答して実行することもできる。
【0035】
可能なメッセージクラスの例として、スパムメッセージクラス、非請求メッセージクラス、いたずらメッセージクラス、ウィルスメッセージクラス、チェーンメッセージクラス、アダルト問題クラス、子供問題クラス、またはIT関連ニュースクラスなどのさらなる特殊関心クラスがある。
【0036】
図3は、図1に示した分類マネージャ、ボーナスマネージャ、送信者ユニット、または受信者ユニットのハードウェア構成要素を示す。しかし、以下では分類マネージャにのみ言及する。それはCPU31、一次格納ユニット32、および二次格納ユニット33を含むことができる。さらに、インタフェースユニット34ないし36は分類マネージャをインターネットまたはデータベースに接続し、オペレータがマネージャと対話することを可能にする。オペレータ入力/出力ユニット35はディスプレイ、キーボード、およびマウスを含むことができる。一次格納ユニットはRAM、EEPROM、およびROMを含むことができる。二次格納ユニット33は、ハードディスクまたは光もしくは磁気ディスクドライブによって形成することができる。
【0037】
分類マネージャの機能ユニットを図4に示す。
メッセージ入力ユニット401は着信メッセージを受け取る。メッセージ準備ユニット405に分類ツールを補足された後、補足付きメッセージはメッセージ出力ユニット410を介して受信者に送信することができる。
【0038】
メッセージデータベース411、クラスデータベース412、および送信者/受信者データベース413に格納された情報に基づいて、受信したメッセージを自動的に分類するために、メッセージ識別ユニット402、パターン認識ユニット403、および評価ユニット404が分類マネージャ内に配設される。
【0039】
送信者/受信者データベース413は、例えば受信者が特定の送信者からのメッセージを受信しないことを選択するか、あるいは私的または広告メッセージを私的メールアカウントに転送することを選択するかどうかを示す、受信者の選好を含むことができる。
【0040】
受信者が受信した電子メッセージを分類ツールによって分類すると、分類結果は分類結果入力420によって受け取られる。
クラス管理ユニット408は、以下で図8に関連してさらに詳しく説明するプロセスに従って、分類データベース412における受信クラスの管理を制御する。
【0041】
ボーナス管理ユニット409およびボーナスデータベース413は追加的に使用するか、または図1に示したボーナスマネージャに取って代わるかのいずれかとすることができる。最後に、スパム保護ユニット406およびウィルス保護ユニット407は、システムの能力を増強するために、分類マネージャに組み込まれる。
【0042】
以下の例によって明らかでありかつ説明する通り、図4に示す分類マネージャは、幾つかの任意選択的ユニットを含む実施形態を形成し、それは物理的に別個に配設することもできる。
【0043】
図4の分類マネージャで実行される自動分類のプロセス60ないし68を図6に示す。
自動分類プロセス60ないし68は、ステップ61の電子メッセージの受信から始まる。受信した電子メッセージはステップ62で識別される。メッセージを識別するために、メッセージ識別ユニットは例えば現在処理されている電子メッセージをメッセージデータベースに格納されている電子メッセージと比較する。このデータベースに格納されるデータの量を最適化するために、電子メッセージは、電子メッセージの構造プロファイルおよび/または内容プロファイルによって識別することができる。さらに、電子キーを電子メッセージに適用することによって達成される電子キーシグネチャを、電子メッセージの識別のために使用することができる。
【0044】
電子メッセージの識別は、メッセージを全体として識別するのではなく、電子メッセージを重要な部分に縮小し、それを識別することによってさらに改善することができる。特に、電子メッセージの添付は別個に識別することができる。
【0045】
図6のステップ63で、識別された電子メッセージの関連情報が決定される。したがって、成功裏に識別された電子メッセージに対応付けられるクラスがクラスデータベースに含まれるかどうかが検査される。
【0046】
しかし、未知の電子メッセージの場合、メッセージデータベースに格納されたデータでは、電子メッセージの識別ができない。さらに、電子メッセージが複数の受信者に送信される場合、そのメッセージは、受信者の一人によってまだ手動で分類されていなくても、すでにメッセージデータベースに格納されているかもしれない。そのような場合、およびさらに以前に格納された手動分類結果から導出可能な情報が充分でなく、電子メッセージをさらにどのように処理するかを決定できない場合には、追加ステップ64および65が実行される。
【0047】
メッセージデータベースおよび/または送信者/受信者データベースに格納され、かつスパム保護ユニットおよびウィルス保護ユニットによって任意選択的にサポートされる情報に基づいて、認識ステップ64で、電子メッセージ内のパターンが認識される。認識されるパターンに対応付けられる情報がステップ65で決定される。
【0048】
その後、決定されたパターンおよび分類情報がさらなるステップ66で評価される。最後に、ステップ66の評価結果に従って、電子メッセージが処理67される。
決定された情報を評価するステップ66および評価結果に従ってメッセージを処理するステップ67を、図7にさらに詳しく示す。
【0049】
評価プロセス70ないし78は最初にステップ71で、電子メッセージに対して確認済みクラスがすでに存在するかどうかを検査する。確認済みクラスとは、電子文書の信頼できる分類とみなされるクラスデータベースに格納されたクラスに対応付けられる。確認済みクラスがある場合には、プロセスは、そのクラスに従ってメッセージをさらにどのように取り扱うかを決定するステップ73に続く。
【0050】
しかし、分類データベースに格納されている確認済みクラスが無い場合、クラスを導出するステップ72で、決定されたパターン情報に基づいて電子メッセージをクラスに対応付けることができるかどうかが検査される。未確認クラスは、クラスを導出または推定するステップ72への入力を形成することができる。例えば、一人の受信者によってすでにスパムメッセージとして分類された電子文書については、メッセージが事実上スパムメッセージであることがメッセージ内のさらなるパターンで示された場合にのみ、メッセージは自動的にスパムメッセージに分類される。しかし、メッセージがスパムメッセージであるかもしれないことを示すパターンがメッセージに含まれなければ、メッセージは未分類メッセージまたは未分類文書のクラスのメッセージとしてさらに取り扱われる。
【0051】
決定プロセス73では、導出または格納されたクラスを使用して、メッセージを受信者に直接転送77するかどうかが決定される。例えばメッセージが受信者の以前のメッセージに対する簡単な返事である場合、および送信者が送信者/受信者データベースに受信者に関して登録されている場合、メッセージは直接転送することができる。
【0052】
場合によっては、例えばメッセージが私用メッセージと分類され、その結果として受信者の私的メールアカウントに再転送しなければならない場合には、メッセージを再転送する必要がある。これらのメッセージに対しては、その後ステップ75でメッセージを分類ツール付きで、またはそれ無しで転送すべきかどうかを検査するために、ステップ74で宛先が変更される。
【0053】
分類が未知であるメッセージ、または充分に分類できなかったメッセージは、メッセージを準備するステップ76で分類ツールを補足される。
最後に、決定プロセス73の結果として、例えばスパムメッセージまたはいたずらメッセージは、プロセス70ないし78の終了78に続くことによって、メッセージを転送するステップ77を実行することなく終了することができる。
【0054】
メッセージを処理するための以下の代替法は、図7には示されていない。特に、例えばそれらのパターン情報に基づく未分類メッセージは、受信者らまたは特定の受信者によって望まれないと仮定することができる。
【0055】
そのようなメッセージは、要求があった場合にのみ受信者に送信するために、中間的に格納することができる。潜在的に望まれないメッセージを受信し、即座に格納したことを受信者に通知するために、分類マネージャは中間的に格納されたメッセージのリストを例えば週1回転送する。しかし、これに関して、受信者が頻繁にアクセスすることのできる受信者のリモートメッセージフォルダを使用することもできる。
【0056】
代替的に、特にメッセージが潜在的にスパムメッセージである場合、中間的に格納されたメッセージは、メッセージの送信者からこのメッセージを転送する承認を受け取った後で受信者に送信される。
【0057】
図8は、分類結果を受け取った後で分類マネージャで実行されるプロセス80ないし86を示す。最初にステップ81で、ボーナス情報が分類マネージャで処理および/または格納され、ボーナスマネージャに転送される。
【0058】
受け取ったクラスが電子メッセージの第1の手動分類結果または初期クラスを形成する場合、プロセスはステップ82で、受け取ったクラスを格納してこの初期クラスの確認を待つステップ85に分岐する。前の分類結果がすでに分類マネージャに格納されている場合、前のクラスと現在のクラスがステップ83で比較される。両方のクラスが等しく、かつ前のクラスが未確認であった場合、クラスは今確認済みクラスとして使用される。対応するステップ84で、格納されたクラスの状態が変更される。しかし、前のクラスが現在のクラスと一致しない場合には、ステップ85で現在の分類結果が格納される。前のクラスの状態によって、それはさらに未確認クラスまたは確認済みクラスとして使用される。
【0059】
別個のユニットとして、または分類ユニットの一体化ユニットの組み合わせとして形成することのできるボーナスマネージャの例に関してすでに上述した通り、本発明に係るシステムの幾つかの実施形態およびしたがって図4に示した分類マネージャが可能である。
【0060】
分類マネージャ12の機能ユニットの一部は、受信者のローカルエリアネットワーク(LAN)に実現することができる。自動分類およびメッセージ準備は受信者のLANで局所的に実行する一方、クラス管理、ボーナス管理、およびデータベース機能は、ローカルエリアネットワークのユーザだけでなく、第三者もアクセスできるサーバに実現されることが好ましい。
【0061】
例えば、メッセージ準備ユニット405は、受信者の端末に局所的にインストールするか、あるいは受信者のローカルeメールシステムのeメールサーバにアドオンとしてインストールすることができる。
【0062】
本発明に係る上述した方法およびシステムの手法は、受信者の対話に依存する。しかし、受信者は一般的に、システムに分類情報を提供することに関心を持たない。したがって、受信者は電子メッセージの分類に対してボーナスを受け取る。
【0063】
例えば、図1に示したボーナスマネージャ14は、幾つかのサービスおよびシステムに使用される共用ボーナスシステムとすることができる。ボーナスマネージャは、受信者を識別する識別子を含みかつ受信者が電子メッセージの分類を実行したことを示すボーナス情報を受け取る。受信者がボーナスシステムの登録ユーザである場合、ボーナスマネージャ14は特定の点数を受信者のアカウントに追加する。そのようなボーナスシステムは特に、ユーザが彼らのボーナスを現金または製品の形で受け取ることを希望するかどうかをユーザに選択させる。
【0064】
受信者にボーナスを提供するさらなる一般的可能性は、分類システムに最も積極的に参加した受信者のランキングを発表すること、またはくじ引きを実行することである。
受信者とボーナスマネージャとの間の情報の流れを回避するさらに高度なシステムでは、図4に示したボーナス管理ユニット409は受け取った分類結果を評価し、対応するボーナス情報をボーナスマネージャに送信するか、またはボーナスデータベース414におけるボーナス情報の格納を制御するかのいずれかである。ボーナス管理ユニット409は例えば、ボーナスデータベース414に格納されたボーナスデータに基づいてくじ引きを実行することができる。
【0065】
さらに、ボーナス管理ユニット409は、システム内部の値または受信情報の信頼性に基づいて、受け取った分類結果に対するボーナスを増加または減少することができる。例えば、スパムメッセージを分類した最初の受信者である場合、受信者は高いボーナス値を受け取る。しかし、分類結果が確認される代わりに、同一メッセージのさらなる受信者による分類と矛盾する場合には、ボーナス値を低減することもできる。
【0066】
メッセージ準備ユニット405は、受信者がもっと積極的になるように動機付けるために、参加受信者のランキングにおける受信者の個々のランクを電子メッセージに補足することができる。さらに、例えば複数の同一メールのさらなる送信を回避するために、以前に受け取った分類を確認する2回目の分類が必要である場合、特定の電子メッセージを分類することへの受信者の動機付けを高めるように、分類マネージャを適応させることができる。そのような場合、分類ツールは、現在分類が望まれているこの電子メッセージを分類すると特別ボーナスが受け取れることを受信者に示す。
【0067】
受信者が電子文書を分類した後即座に確実なフィードバックを受け取ると、さらなる改善が達成される。したがって、メッセージ準備ユニット405は、受信者に対して提供することのできるボーナスデータを電子メッセージに補足することができる。これに関して、分類ツールは、受信者が起動可能な領域の1つを起動させた場合に、受信者へのボーナスデータの提供をトリガするように適応される。ボーナスデータは例えば、テキスト、画像、または動画として受信者に表示される冗談を含むことができる。ボーナスデータの型は無作為に、または受信者の選好に従って、選択することができる。そのような即座の確実なフィードバックは、上述したボーナスシステムに追加して、またはその代わりとして使用することができる。
【図面の簡単な説明】
【0068】
【図1】分類マネージャおよび任意のボーナスマネージャを含むシステムの略図である。
【図2】分類ツールとして3つの分類リンクを含む、受信者のメールシステムによって表示される電子文書の略図である。
【図3】例えば送信者端末、受信者端末、分類マネージャ、またはボーナスマネージャを形成するハードウェアユニットの一般構成要素の略図である。
【図4】図1の分類マネージャの機能ユニットの略図である。
【図5】図1の分類マネージャで実行されるメッセージ準備プロセスの流れ図である。
【図6】図1の分類マネージャで実行される自動分類プロセスの流れ図である。
【図7】分類マネージャで実行される評価プロセスの詳細流れ図である。
【図8】分類マネージャで実行された受信分類結果を評価するプロセスの流れ図である。
Claims (20)
- 電子文書のクラス分類に従って電子文書を取り扱うシステムで電子文書を処理する方法であって、
前記電子文書の受信者が前記電子文書を特定のクラスの文書として手動で分類することを可能にする分類ツールを前記電子文書に補足するステップと、
前記補足付き電子文書を前記受信者に送信するステップと、
前記受信者の前記分類ツールとの対話に応答して、前記受信者の前記対話に対応付けられる特定のクラスを表す、前記電子文書の分類情報を受信するステップと、
分類情報が格納された電子文書に対応するその後の電子文書を、格納された分類情報に従って取り扱うことを可能にするために、前記受信した分類情報を格納するステップと
を含む方法。 - 前記受信者が前記分類ツールの起動可能な部分を起動することによって前記電子文書を分類し、前記起動可能な部分が可能な文書クラスの1つに対応付けられることを特徴とする、請求項1に記載の方法。
- 前記分類ツールの前記起動可能な部分の起動が前記分類情報の送信を自動的にトリガすることを特徴とする、請求項2に記載の方法。
- 前記分類情報が前記電子文書に対して選択されたクラスおよび前記電子文書を識別する識別子を含むことを特徴とする、請求項1ないし3のいずれか1項に記載の方法。
- 処理される電子文書の各々に対して文書情報を格納し、処理済み文書の格納済み文書情報が現在処理されている電子文書の文書情報に一致するか否かを決定することを特徴とする、請求項1ないし4のいずれか1項に記載の方法。
- 前記格納される文書情報が、前記電子文書または少なくともその主要部分の電子キーシグネチャ、構造プロファイル、または内容プロファイルを含むことを特徴とする、請求項5に記載の方法。
- グループクラスが可能な文書クラスの1つであり、それは文書を特定の受信者グループのみに関して分類するときに使用されることを特徴とする、請求項1ないし6のいずれか1項に記載の方法。
- 前記可能な文書クラスがスパム文書クラス、非請求文書クラス、いたずら文書クラス、ウィルス/ワーム文書クラス、年齢評価クラス、または特殊関心クラスの少なくとも1つを含むことを特徴とする、請求項1ないし7のいずれか1項に記載の方法。
- 前記分類ツールが前記電子文書に挿入される少なくとも1つのリンクによって形成され、前記少なくとも1つのリンクの起動により、前記受信者が前記電子文書に対してどのクラスを選択したかが識別され、かつ前記対応する分類情報の前記送信がトリガされることを特徴とする、請求項1ないし7のいずれか1項に記載の方法。
- 前記分類ツールが各々の可能な文書クラスに対し1つのリンクを含むことを特徴とする、請求項1ないし9のいずれか1項に記載の方法。
- 前記分類ツールが前記電子文書の内容と共に自動的に前記受信者に表示されるように適応されることを特徴とする、請求項1ないし10のいずれか1項に記載の方法。
- 前記受信者を識別しかつ彼が前記文書を分類したことを示すボーナス情報がボーナスマネージャに送信されることを特徴とする、請求項1ないし11のいずれか1項に記載の方法。
- 前記ボーナスマネージャが受信したボーナスデータを格納し、かつくじ引きを実行し、最も積極的な参加受信者のランキングを発表し、現金または製品を償還することによって前記受信者に確実なフィードバックを提供することを特徴とする、請求項12に記載の方法。
- 前記電子文書にボーナスデータが補足された後で前記補足付き電子文書が前記受信者に送信され、前記受信者が前記分類ツールと対話することにより、前記受信者に即座に確実なフィードバックを提供するために前記受信者に提供されるボーナスデータがトリガされることを特徴とする、請求項1ないし13のいずれか1項に記載の方法。
- その後の電子文書に関連する前記格納された分類情報に応じて、前記その後の電子文書が終了され、別の宛先アドレスに転送され、または前記受信者の要求または電子文書送信者の承認があった場合にのみ送信するために中間的に格納されることを特徴とする、請求項1ないし14のいずれか1項に記載の方法。
- 電子文書のクラス分類に従って電子文書を取り扱うシステムで電子文書を処理する方法であって、
前記電子文書の受信者が前記電子文書を特定のクラスの文書として手動で分類することを可能にする分類ツールを前記電子文書に補足するステップと、
前記補足付き電子文書を前記受信者に送信するステップと、
前記受信者の前記分類ツールとの対話に応答して、前記受信者を識別しかつ彼が電子文書の分類を実行したことを示すボーナス情報を受信するステップと
を含む方法。 - 電子文書のクラス分類に従って電子文書を取り扱うシステムで電子文書を処理する方法であって、
前記電子文書の受信者が前記電子文書を特定のクラスの文書として手動で分類することを可能にする分類ツールを前記電子文書に補足するステップと、
前記補足付き電子文書を前記受信者に送信するステップと
を含み、
前記受信者の前記分類ツールとの対話に応答して、前記電子文書の分類情報を提供することができ、前記分類情報が前記受信者の対話に対応付けられる特定のクラスを表すように構成された方法。 - 請求項17に記載の方法を実行するように適応された電子文書準備ユニット。
- 請求項1ないし16のいずれか1項に記載の方法を実行するように適応された分類マネージャユニット。
- 請求項1または17に記載の方法を実行するように適応されたシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02013566A EP1376420A1 (en) | 2002-06-19 | 2002-06-19 | Method and system for classifying electronic documents |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004164584A true JP2004164584A (ja) | 2004-06-10 |
Family
ID=29716788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003202081A Pending JP2004164584A (ja) | 2002-06-19 | 2003-06-19 | 電子文書を分類するための方法およびシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20030236845A1 (ja) |
EP (1) | EP1376420A1 (ja) |
JP (1) | JP2004164584A (ja) |
CN (1) | CN1265303C (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7032023B1 (en) * | 2000-05-16 | 2006-04-18 | America Online, Inc. | Throttling electronic communications from one or more senders |
US20040073617A1 (en) | 2000-06-19 | 2004-04-15 | Milliken Walter Clark | Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail |
US9699129B1 (en) * | 2000-06-21 | 2017-07-04 | International Business Machines Corporation | System and method for increasing email productivity |
US6408277B1 (en) | 2000-06-21 | 2002-06-18 | Banter Limited | System and method for automatic task prioritization |
US7644057B2 (en) * | 2001-01-03 | 2010-01-05 | International Business Machines Corporation | System and method for electronic communication management |
WO2004061698A1 (en) * | 2002-12-30 | 2004-07-22 | Activestate Corporation | Method and system for feature extraction from outgoing messages for use in categorization of incoming messages |
US20040133574A1 (en) * | 2003-01-07 | 2004-07-08 | Science Applications International Corporaton | Vector space method for secure information sharing |
GB2405229B (en) * | 2003-08-19 | 2006-01-11 | Sophos Plc | Method and apparatus for filtering electronic mail |
US7676739B2 (en) * | 2003-11-26 | 2010-03-09 | International Business Machines Corporation | Methods and apparatus for knowledge base assisted annotation |
US7548956B1 (en) * | 2003-12-30 | 2009-06-16 | Aol Llc | Spam control based on sender account characteristics |
US10257164B2 (en) | 2004-02-27 | 2019-04-09 | International Business Machines Corporation | Classifying e-mail connections for policy enforcement |
US8176004B2 (en) | 2005-10-24 | 2012-05-08 | Capsilon Corporation | Systems and methods for intelligent paperless document management |
WO2007050646A2 (en) | 2005-10-24 | 2007-05-03 | Capsilon Fsg, Inc. | A business method using the automated processing of paper and unstructured electronic documents |
US8380696B1 (en) * | 2005-12-20 | 2013-02-19 | Emc Corporation | Methods and apparatus for dynamically classifying objects |
AU2006235845A1 (en) * | 2006-10-13 | 2008-05-01 | Titus Inc | Method of and system for message classification of web email |
US8024304B2 (en) | 2006-10-26 | 2011-09-20 | Titus, Inc. | Document classification toolbar |
AU2008202534B2 (en) | 2007-06-08 | 2012-05-31 | Titus Inc | Method and system for e-mail management of e-mails having embedded classification metadata |
US8060577B1 (en) * | 2009-06-25 | 2011-11-15 | Symantec Corporation | Method and system for employing user input for file classification and malware identification |
US8364776B1 (en) * | 2009-09-15 | 2013-01-29 | Symantec Corporation | Method and system for employing user input for website classification |
US8612526B2 (en) * | 2010-07-21 | 2013-12-17 | At&T Intellectual Property I, L.P. | System and method for prioritizing message transcriptions |
US8543652B2 (en) | 2010-07-22 | 2013-09-24 | At&T Intellectual Property I, L.P. | System and method for efficient unified messaging system support for speech-to-text service |
US8879695B2 (en) | 2010-08-06 | 2014-11-04 | At&T Intellectual Property I, L.P. | System and method for selective voicemail transcription |
US9471882B2 (en) | 2011-07-25 | 2016-10-18 | International Business Machines Corporation | Information identification method, program product, and system using relative frequency |
TWI473474B (zh) * | 2012-01-06 | 2015-02-11 | Univ Nat Central | 電子郵件分類方法 |
US9245115B1 (en) | 2012-02-13 | 2016-01-26 | ZapFraud, Inc. | Determining risk exposure and avoiding fraud using a collection of terms |
TW201349157A (zh) * | 2012-05-18 | 2013-12-01 | Richplay Information Co Ltd | 電子書分級之方法 |
CN103577766A (zh) * | 2012-08-09 | 2014-02-12 | 董靖 | 电子文档的安全管理方法和系统 |
US10277628B1 (en) | 2013-09-16 | 2019-04-30 | ZapFraud, Inc. | Detecting phishing attempts |
CN103488955B (zh) * | 2013-10-17 | 2017-02-08 | 上海中信信息发展股份有限公司 | 电子文件移交一体机 |
US10694029B1 (en) | 2013-11-07 | 2020-06-23 | Rightquestion, Llc | Validating automatic number identification data |
US10721195B2 (en) | 2016-01-26 | 2020-07-21 | ZapFraud, Inc. | Detection of business email compromise |
US11936604B2 (en) | 2016-09-26 | 2024-03-19 | Agari Data, Inc. | Multi-level security analysis and intermediate delivery of an electronic message |
US10880322B1 (en) | 2016-09-26 | 2020-12-29 | Agari Data, Inc. | Automated tracking of interaction with a resource of a message |
US10805270B2 (en) | 2016-09-26 | 2020-10-13 | Agari Data, Inc. | Mitigating communication risk by verifying a sender of a message |
US10805314B2 (en) | 2017-05-19 | 2020-10-13 | Agari Data, Inc. | Using message context to evaluate security of requested data |
US11722513B2 (en) | 2016-11-30 | 2023-08-08 | Agari Data, Inc. | Using a measure of influence of sender in determining a security risk associated with an electronic message |
US11044267B2 (en) | 2016-11-30 | 2021-06-22 | Agari Data, Inc. | Using a measure of influence of sender in determining a security risk associated with an electronic message |
US10715543B2 (en) | 2016-11-30 | 2020-07-14 | Agari Data, Inc. | Detecting computer security risk based on previously observed communications |
US11019076B1 (en) | 2017-04-26 | 2021-05-25 | Agari Data, Inc. | Message security assessment using sender identity profiles |
US11102244B1 (en) | 2017-06-07 | 2021-08-24 | Agari Data, Inc. | Automated intelligence gathering |
US11757914B1 (en) | 2017-06-07 | 2023-09-12 | Agari Data, Inc. | Automated responsive message to determine a security risk of a message sender |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6081829A (en) * | 1996-01-31 | 2000-06-27 | Silicon Graphics, Inc. | General purpose web annotations without modifying browser |
US6418432B1 (en) * | 1996-04-10 | 2002-07-09 | At&T Corporation | System and method for finding information in a distributed information system using query learning and meta search |
US6453327B1 (en) * | 1996-06-10 | 2002-09-17 | Sun Microsystems, Inc. | Method and apparatus for identifying and discarding junk electronic mail |
US6122632A (en) * | 1997-07-21 | 2000-09-19 | Convergys Customer Management Group Inc. | Electronic message management system |
US7051277B2 (en) * | 1998-04-17 | 2006-05-23 | International Business Machines Corporation | Automated assistant for organizing electronic documents |
US6161130A (en) * | 1998-06-23 | 2000-12-12 | Microsoft Corporation | Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set |
GB2347053A (en) * | 1999-02-17 | 2000-08-23 | Argo Interactive Limited | Proxy server filters unwanted email |
US6826596B1 (en) * | 1999-09-07 | 2004-11-30 | Roy Satoshi Suzuki | System for categorizing and displaying reply messages in computer facilitated discussions |
US20010034647A1 (en) * | 2000-02-03 | 2001-10-25 | Marks Michael B. | Providing benefits by the internet to minimally identified users |
US6519580B1 (en) * | 2000-06-08 | 2003-02-11 | International Business Machines Corporation | Decision-tree-based symbolic rule induction system for text categorization |
US6748422B2 (en) * | 2000-10-19 | 2004-06-08 | Ebay Inc. | System and method to control sending of unsolicited communications relating to a plurality of listings in a network-based commerce facility |
US7072943B2 (en) * | 2000-11-01 | 2006-07-04 | Buyerleverage Email Solutions Llc | System and method for granting deposit-contingent E-mailing rights |
-
2002
- 2002-06-19 EP EP02013566A patent/EP1376420A1/en not_active Withdrawn
- 2002-10-23 US US10/278,022 patent/US20030236845A1/en not_active Abandoned
-
2003
- 2003-06-19 CN CNB031524516A patent/CN1265303C/zh not_active Expired - Fee Related
- 2003-06-19 JP JP2003202081A patent/JP2004164584A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1475935A (zh) | 2004-02-18 |
EP1376420A1 (en) | 2004-01-02 |
CN1265303C (zh) | 2006-07-19 |
US20030236845A1 (en) | 2003-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004164584A (ja) | 電子文書を分類するための方法およびシステム | |
JP4708466B2 (ja) | 望ましくない電子メッセージの送信または受信を妨害するための方法 | |
JP4689921B2 (ja) | 分配された内容を識別するシステム | |
US7421498B2 (en) | Method and system for URL based filtering of electronic communications and web pages | |
US7653606B2 (en) | Dynamic message filtering | |
EP1597645B1 (en) | Adaptive junk message filtering system | |
RU2355018C2 (ru) | Инфраструктура для обеспечения интеграции антиспамовых технологий | |
US7516182B2 (en) | Practical techniques for reducing unsolicited electronic messages by identifying sender's addresses | |
JP4335582B2 (ja) | 迷惑電子メールを検出するシステムおよび方法 | |
US7197539B1 (en) | Automated disablement of disposable e-mail addresses based on user actions | |
US20050015626A1 (en) | System and method for identifying and filtering junk e-mail messages or spam based on URL content | |
US8364766B2 (en) | Spam filtering based on statistics and token frequency modeling | |
JP4387205B2 (ja) | アンチスパム技術の統合を可能にするフレームワーク | |
USRE41411E1 (en) | Method and system for filtering electronic messages | |
US20150081825A1 (en) | Method for Automatically Unsubscribing an Address from a Subscription | |
US8069128B2 (en) | Real-time ad-hoc spam filtering of email | |
US20050050150A1 (en) | Filter, system and method for filtering an electronic mail message | |
US20090019126A1 (en) | Authorized email control system | |
WO2004013796A1 (en) | Practical techniques for reducing unsolicited electronic messages by identifying sender’s addresses | |
JP2004206722A (ja) | コンピューターネットワーク及び関連するメッセージの分類方法 | |
JP2003218945A (ja) | 迷惑メール抑止システム | |
EP1965547B1 (en) | A computer implemented system and a method for detecting abuse of an electronic mail infrastructure in a computer network | |
Al Abid | Designing Spam Filtering by Analyzing User and Email Behaviour |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061010 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070306 |