JP4828411B2 - スパム防止のためのフィードバックループ - Google Patents

スパム防止のためのフィードバックループ Download PDF

Info

Publication number
JP4828411B2
JP4828411B2 JP2006508818A JP2006508818A JP4828411B2 JP 4828411 B2 JP4828411 B2 JP 4828411B2 JP 2006508818 A JP2006508818 A JP 2006508818A JP 2006508818 A JP2006508818 A JP 2006508818A JP 4828411 B2 JP4828411 B2 JP 4828411B2
Authority
JP
Japan
Prior art keywords
spam
message
user
polling
messages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006508818A
Other languages
English (en)
Other versions
JP2006521635A5 (ja
JP2006521635A (ja
Inventor
エル.ラウンスウェイト ロバート
イー.ヘッカーマン デビッド
ディー.メアー ジョン
ディー.ハウエル ネーザン
シー.ルパーズバーグ ミカ
エー.スローソン ディーン
ティー.グッドマン ジョシュア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006521635A publication Critical patent/JP2006521635A/ja
Publication of JP2006521635A5 publication Critical patent/JP2006521635A5/ja
Application granted granted Critical
Publication of JP4828411B2 publication Critical patent/JP4828411B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • G06Q50/40
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、正当なメール(たとえば、善良なメール)と望ましくない情報(たとえば、ジャンクメール)を共に識別するためのシステムおよび方法に関し、より詳細には、スパム防止のために電子メール通信文を分類することに関する。
インターネットなど地球規模の通信ネットワークの出現により、膨大な数の潜在顧客に到達する商業機会が提供された。電子メッセージング、特に電子メール(eメール)は、(「スパム」とも呼ばれる)望ましくない広告およびプロモーションをネットワークユーザにまき散らすための手段として、ますます広まりつつある。
コンサルティング/市場調査会社であるRadicati Group,Inc.は、2002年8月現在、毎日20億通のジャンク電子メールメッセージが送られており、この数は2年ごとに3倍になることが予想されると見積もっている。個人および団体(たとえば、会社、政府機関)はますます、ジャンクメッセージによって迷惑を受け、しばしば不快な思いをさせられつつある。したがって、ジャンク電子メールは、今まさに、信頼できるコンピューティングに対する大きな脅威になるであろう。
ジャンク電子メールを阻止するために使用される主な技法は、フィルタリングシステム/方法を使用することである。1つの実証済みのフィルタリング技法は、機械学習手法に基づくものであり、機械学習フィルタが、着信メッセージに対し、そのメッセージがジャンクである確率を割り当てる。この手法では、一般に2種類の事例メッセージ(たとえば、ジャンクメッセージと非ジャンクメッセージ)から特徴が抽出され、この2つの種類間を確率的に弁別するために学習フィルタが適用される。多数のメッセージの特徴は内容(たとえば、メッセージの件名および/または本文内の単語および句)に関係するため、そのようなタイプのフィルタは、一般に「コンテンツベースのフィルタ」と呼ばれる。
いくつかのジャンク/スパムフィルタは適応型であり、これは、多言語ユーザや稀少言語を話すユーザが、自分たちの特定のニーズに適応することができるフィルタを必要とする点において重要である。さらに、何がジャンク/スパムであり何がジャンク/スパムでないかについて、すべてのユーザが一致しているわけではない。したがって、(たとえば、ユーザ挙動を観察することを介して)暗黙のうちにトレーニングすることができるフィルタを使用することにより、それぞれのフィルタを動的に調整し、ユーザ特定のメッセージ識別のニーズを満たすことができる。
フィルタリング適応のための1つの手法は、ジャンクまたは非ジャンクとしてメッセージに標識を付けるようにユーザに要求することである。残念ながら、そのような手動の集中トレーニング技法は、そのようなトレーニングを適正に行うために必要とされる時間の量は言うまでもなく、そのようなトレーニングに関連する複雑さのため、多数のユーザにとって望ましくない。さらに、そのような手動トレーニング技法は、しばしば個々のユーザによって損なわれる。たとえば、無料メーリングリストに対して加入していることは、ユーザによってしばしば忘れさられ、したがって、誤ってジャンクメールとして標識が付けられる。その結果、正当なメールがユーザのメールボックスから無期限に遮断される。別の適応型フィルタトレーニング手法は、暗黙のトレーニングキューを使用することである。たとえば、ユーザがメッセージに回答し、またはそれを転送した場合、この手法では、メッセージが非ジャンクであると仮定される。しかし、この種のメッセージキューだけを使用することは、統計上の偏りをトレーニングプロセス内に導入し、フィルタの各々の精度が低くなる。
さらに別の手法は、全ユーザ電子メールをトレーニングのために使用することであり、この場合、初期標識は、既存のフィルタによって割り当てられ、ユーザが時々、明示的なキュー(たとえば、「ユーザ訂正(user−correction)」メソッド)−たとえば、「ジャンクとして削除する(delete as junk)」や「ジャンクでない(not junk)」などオプションを選択すること−および/または暗黙のキューを用いてこれらの割り当てを無効にする。そのような手法は、先に論じた技法より良いが、依然として、以下で述べられている、また特許請求の範囲に記載された本発明に比べて不十分である。
以下、本発明のいくつかの態様を基本的に理解するために、本発明について簡単にまとめる。この概要は、本発明の広範な全体像ではない。本発明の主な/重大な要素を特定すること、あるいは本発明の範囲を述べることは意図されていない。後から提供されるより詳しい説明の序文として、本発明のいくつかの概念を簡単な形態で示すことを目的とするにすぎない。
本発明は、スパム防止に関連してアイテムを分類することを容易にするフィードバックループシステムおよび方法を提供する。本発明は、スパムフィルタに適用される機械学習手法を利用し、特に、トレーニングデータの集合を生成するために正当なメールとジャンク/スパムメール双方の例が得られるように、着信電子メールメッセージをランダムにサンプリングする。予め選択された個人がスパムファイタ(spam fighters)として働き、そのサンプルの(任意選択でわずかに修正することができる)それぞれの複製を類別する際に参加する。
一般に、ポーリング用に選択されたメッセージは、ポーリングメッセージとして見えるように様々な態様で修正される。本発明の独自の態様は、ポーリング用に選択された着信メッセージのコピーが作られ、その結果、何人かのユーザ(たとえば、スパムファイタ)が(たとえば、メッセージ内容の点において)同じメッセージを2回、すなわち1回はポーリングメッセージの形態で、また再度その元の形態で受信することになる。本発明の他の独自の態様は、既存のフィルタによってスパムとして標識が付けられているものを含めて、メッセージすべてがポーリングすることを考慮される。スパムと標識が付けられたメッセージは、ポーリングすることを考慮され、選択された場合、既存のフィルタの指定に従ってスパムとして処理される(たとえば、ジャンクフォルダに移動、削除など)ものでなくなる。
従来のスパムフィルタと異なり、善良なメールとスパムとを区別することを学習し、それにより、偏った不正確なフィルタリングを軽減するように、本発明のフィードバック技法によるトレーニングスパムフィルタによって、より正確なスパムフィルタを作成することができる。フィードバックは、少なくとも一部には、任意の適切な数のユーザにポーリングし、それらの着信電子メールについてフィードバックを得ることによって行われる。スパムファイタとして識別されたユーザは、着信メッセージの選択されたものが正当なメールか、それともジャンクメールかについて投票するというタスクを負う。着信電子メールの肯定的分類と否定的分類は共に、ユーザ向けの善良な(たとえば、スパムでない)ものであるメールをスパムメールとして不適切にフィルタして除去することを軽減するために望ましいものである。それぞれの分類は、各メールトランザクションに関連する任意の他の情報と共に、スパムフィルタのトレーニングを容易にするためにデータベースに移動される。データベースおよび関連構成要素は、機械学習システム用トレーニングデータの集合を生成するために、ユーザプロパティ、ユーザ投票情報/履歴、またはメッセージプロパティ、たとえば各選択されたメッセージに割り当てられた一意の識別番号、メッセージ分類、メッセージ内容の概要、または上記のいずれかに関連する統計データを含む、選択されたメッセージ(または選択されたメールトランザクション)のためのプロパティを編集および記憶することができる。機械学習システム(たとえば、ニューラルネットワーク、サポートベクタマシン(SVM)、ベイジアン信念ネットワーク(Bayesian Belief Networks))は、正当なメールとスパムメールを共に認識し、さらにそれらを区別するようにトレーニングされる改良型スパムフィルタを作成することを容易にする。新しいスパムフィルタは、本発明に従ってトレーニングされた後に、メールサーバ、およびクライアント電子メールソフトウェアプログラムに配布することができる。さらに、この新しいスパムフィルタは、個別化されたフィルタの性能を改善するために、特定のユーザに関してトレーニングすることができる。新しいトレーニングデータ集合が構築されたとき、スパムフィルタは、その性能と精度を最適化するために、機械学習を介してさらにトレーニングを受けることができる。また、メッセージ分類によるユーザフィードバックを使用し、スパムフィルタ性能をテストするために、かつ/またはスパム発信元を識別するために、スパムフィルタおよび保護者による規制(parenatal control)のリストを生成することができる。
本発明の他の態様は、交差検定法を介して、かつ/または結果が既知のテストメッセージによって、信頼できないユーザを検出する方法を提供する。交差検定は、何人かのユーザのポーリング結果が除外されフィルタをトレーニングすることを必要とする。すなわち、このフィルタは、ユーザの部分集合からのポーリング結果を使用してトレーニングされる。概して、このユーザの部分集合は、いくつかの間違いがある場合でさえも、そのユーザの部分集合とほとんどの場合に一致していないユーザを検出するのに十分良好に機能することになる。除外されたユーザからのポーリング結果は、トレーニング済みフィルタのものと比較される。この比較により、本質的に、トレーニング用部分集合からのユーザが、除外されたユーザに属するメッセージに対してどのように投票したかが判定される。除外されたユーザの投票とフィルタとの一致が低い場合には、そのユーザからのポーリング結果を廃棄する、または手動検査のためにマークをすることができる。この技法は、望むなら、毎回異なるユーザからのデータを除外して繰り返すことができる。
フィルタとユーザ投票がひどく一致しないメッセージなど、個々のメッセージに対する誤りもまた検出することができる。これらのメッセージは、自動除去および/または手動検査のためにフラグ付けをすることができる。交差検定の代替として、すべての、または実質的にすべてのユーザについてフィルタをトレーニングすることができる。フィルタと一致しないユーザ投票および/またはメッセージは、廃棄することができる。交差検定の別の代替は、その結果が既知である場合にユーザがメッセージに対して投票するように依頼される、結果が既知のテストメッセージを必要とする。ユーザによるメッセージの正確な分類(たとえば、ユーザ投票がフィルタアクションに一致する)により、そのユーザの信頼性が検証され、そのユーザの分類をトレーニングから除去するかどうか、また、そのユーザを今後のポーリングから除去するかどうか判定される。
本発明の他の態様は、着信メールをスパムとして識別するために、かつ/または特定の商用電子メールアドレス処理を追跡するために、既知のスパムターゲット(たとえば、ハニーポット)を作成することを可能にする。既知のスパムターゲットまたはハニーポットは、正当なメールの集合を決定することができ、他のメールすべてをスパムと考えることができる電子メールアドレスである。たとえば、人に見つけられそうにない制限的な形で、その電子メールアドレスをウェブサイト上で開示することができる。したがって、このアドレスに送信されるどのメールも、スパムと考えることができる。別法として、その電子メールアドレスは、そこから正当なメールを受信することが予想されるマーチャントだけに開示しておくことができる。したがって、そのマーチャントから受信されたメールは正当なメールであるが、受信された他のメールはすべて、安全にスパムであると考えることができる。ハニーポットおよび/または他のソース(たとえば、ユーザ)から引き出されたスパムデータは、フィードバックループシステム内に一体化することができるが、ハニーポットを用いたスパム分類の実質的な増大により、以下でより詳しく述べるように、そのようなデータを減量し、偏ったポーリング結果を得ることを軽減すべきである。
本発明の他の態様は、フィードバックループシステムによって、またはフィルタによって不確実とみなされるメッセージを隔離することを可能にする。そのようなメッセージは、廃棄または分類されるのではなく、任意の適切な時間の間、保持される。この時間は予め設定することができ、または、たとえば同じIPアドレスからの、または類似の内容を有するそのメッセージに似た、所定の数の得票結果を受信するまでそのメッセージを保持することができる。
前述のおよび関連の目的を達成するために、本明細書では、本発明のある種の例示的な態様が、以下の説明および添付の図面と共に述べられている。しかし、これらの態様は、本発明の原理を使用することができる様々な方法のいくつかを示すものにすぎず、本発明は、そのような態様とそれらの均等物すべてを含むものとする。図面と共に考察し、以下の本発明の詳細な説明により、本発明の他の利点および新規の特徴は明らかになるだろう。
次に、本発明について図面を参照しながら述べる。図面では、全体を通して同じ要素を参照するために同じ符号が使用される。以下の説明では、説明する目的で、本発明を十分理解するために、多数の特定の詳細が述べられている。しかし、これらの特定の詳細なしに本発明を実施することができることは自明である。場合によっては、本発明について説明するのを容易にするために、周知の構造およびデバイスがブロック図の形態で示される。
本願では、「構成要素」および「システム」という用語は、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、または、実行中のソフトウェアであるコンピュータ関連のエンティティを指すものとする。たとえば、構成要素は、それだけには限らないが、プロセッサ上で動作するプロセス、プロセッサ、オブジェクト、実行可能物、実行のスレッド、プログラム、および/またはコンピュータとすることができる。例示のために、サーバ上で動作するアプリケーションもそのサーバも共に構成要素とすることができる。プロセスおよび/または実行のスレッド内に1つまたは複数の構成要素が常駐することができ、構成要素は、1つのコンピュータ上に存在し、および/または2つ以上のコンピュータ間で分散することができる。
本発明は、機械学習式スパムフィルタリング用のトレーニングデータを生成することに関連して、様々な推論スキームおよび/または技法を組み込むことができる。本明細書では、「推論」という用語は、概して、事象および/またはデータを介して取り込まれた観察結果の集合から、システムの状態、環境、および/またはユーザについて推論し、または推理するプロセスを指す。推論は、たとえば、特定の内容または動作を識別するために使用することができ、あるいは、状態全体にわたって確率分布を生成することができる。推論は、確率的なもの、すなわち、データおよび事象の考察に基づいた当該の状態全体にわたる確率分布の計算とすることができる。推論はまた、事象および/またはデータの集合から、より高いレベルの事象を構成するために使用される技法を指す場合がある。そのような推論により、事象群が時間の近接性で相関されていようとなかろうと、また、事象やデータが1つの、あるいは複数の事象源やデータ源に由来していようと、観察された事象および/または記憶された事象データの集合から新しい事象またはアクションが構築される。
本明細書全体にわたって「メッセージ」という用語が広く使用されるが、そのような用語は、電子メールそれ自体に限定されず、任意の好適な通信アーキテクチャを介して配布することができるどの形態の電子メッセージングをも含むように適切になすことができることを理解されたい。たとえば、2名以上の人同士の会議を容易にする会議アプリケーション(たとえば、対話型チャットプログラムおよびインスタントメッセージングプログラム)もまた、本明細書に開示されているフィルタリングの利益を利用することができる。というのは、望ましくないテキストは、ユーザがメッセージを交換しているとき、通常のチャットメッセージ内に電子的にばらまかれ、および/または、リードオフメッセージ、クロージングメッセージ、もしくは上記のすべてとして挿入される可能性があるからである。この特定のアプリケーションでは、望ましくない内容(たとえば、コマーシャル、プロモーション、または広告)を取り込み、ジャンクとしてタグ付けするために、特定のメッセージ内容(テキストおよび画像)を自動的にフィルタするようにフィルタをトレーニングすることができる。
本発明では、「受信者」という用語は、着信メッセージまたはアイテムのアドレスを指す。「ユーザ」という用語は、本明細書に述べられているフィードバックループシステムおよびプロセスに、受動的に、または積極的に参加するように選択された受信者を指す。
次に図1Aを参照すると、本発明の一態様によるフィードバックトレーニングシステム10の全体的なブロック図が示されている。メッセージ受信構成要素12は、(IMと呼ばれる)着信メッセージを受信し、対象となる受信者14に送達する。メッセージ受信構成要素12は、望ましくないメッセージ(たとえば、スパム)の送達を軽減するために、多数のメッセージ受信構成要素の場合に通例であるように、少なくとも1つのフィルタ16(たとえば、ジャンクメールフィルタ)を含むことができる。メッセージ受信構成要素12は、フィルタ16と共に、メッセージ(IM)を処理し、メッセージのフィルタ済み部分集合(IM’)を対象となる受信者14に送る。
本発明のフィードバック態様の一部として、ポーリング構成要素18は、着信メッセージ(IM)をすべて受信し、それぞれの対象となる受信者14を識別する。ポーリング構成要素18は、たとえば(IM’’と呼ばれる)着信メッセージの部分集合をスパム、またはスパムでないものとして分類するために、(スパムファイタ20と呼ばれる)対象となる受信者14の部分集合を選択する。(VOTING INFOと呼ばれる)分類関連情報がメッセージストア/投票ストア22に送信され、メッセージストア/投票ストア22において、投票情報、並びにそれぞれのIM’’のコピーが、フィードバック構成要素24によってなど、後で使用するために記憶される。具体的には、フィードバック構成要素24は、投票情報を利用する機械学習技法(たとえば、ニューラルネットワーク、SVM、ベイジアンネットワーク、または、本発明と共に使用するのに適した任意の機械学習システム)を使用し、たとえばスパムメールを識別することに関してフィルタ16をトレーニングおよび/または改善する(および/または、新しいフィルタを構築する)。着信メッセージの新しいストリームが、新たにトレーニングされたフィルタ16を介して処理されるにつれて、スパムがより少なく、より多くの(IM’と呼ばれる)正当なメッセージが対象となる受信者14に送達される。したがって、システム10は、スパムファイタ20によって生成されるフィードバックを使用することによって、スパムの識別と、改善されたスパムフィルタのトレーニングとを容易にする。本発明のそのようなフィードバック態様は、スパム検出システムを洗練するための豊かな、非常に動的なスキームを提供する。本発明のより細かい態様に関する様々な詳細について、下記で論じる。
次に図1Bを参照すると、本発明による、スパムファイティングおよびスパム防止に関連するフィードバックループトレーニングの流れ図100が示されている。トレーニングプロセスの準備の際に、および/またはトレーニングプロセスの前に、(たとえば、すべての電子メールユーザを含むマスタ集合から)スパムファイタとすべきユーザが選択され、この選択は、ランダムサンプリング、または信頼レベル、または本発明による任意の好適な選択スキーム/基準に基づくことができる。たとえば、選択されたユーザの部分集合は、すべてのユーザ、ランダムに選択されたユーザの集合、スパムファイタとしてオプトインしているユーザ、またはオプトアウトしなかったユーザ、および/またはそれらの任意の組合せを含み、および/または、一部にはそれらの人口学的場所および関連情報に基づくことができる。
別法として、選択された電子メールユーザのマスタ集合は、スパム送信者が本発明を無力化することがよりコストの掛かるものとなるよう、有料ユーザに制限することができる。したがって、スパムファイティングに参加するように選択されたユーザの部分集合は、有料ユーザだけを含むことができることになる。次いで、選択されたユーザ(たとえば、スパムファイタ)の名前およびプロパティを含むリストまたは顧客表を作成することができる。
メッセージの着信ストリーム102が受信されたとき、各メッセージの受信者は、104で、すべてのスパムファイタのリストに突き合わせてチェックされる。受信者がリスト上にある場合には、そのメッセージポーリングのために考慮される。次に、ポーリング用のメッセージを選択すべきかどうか判定される。従来のスパムフィルタと異なり、本発明は、少なくとも着信メールすべてがポーリングのために考慮されるまで、どのメッセージ(たとえば、スパム)をも削除しない。すなわち、メールは、任意の標識(たとえば、スパム、非スパム)の対象となる前に分類され、これは、ユーザポーリングに使用可能な、偏らないメッセージのサンプルを得るのを容易にする。
メッセージ選択用の構成要素(図示せず)を使用し、データの偏りを軽減するために、何らかのランダムな確率を用いてメッセージを選択することができる。別の手法は、人口学的情報、並びに他のユーザ/受信者属性およびプロパティを使用することを必要とする。したがって、少なくとも一部にはユーザ/受信者に基づいて、メッセージを選択することができる。メッセージを選択するための他の代替アルゴリズムも存在する。しかし、ユーザ当たり、もしくはある時間当たりのユーザ当たり選択されるメッセージの数に対して、もしくは、任意の所与のユーザからのメッセージを選択する確率に対して制限がある可能性がある。そのような制限がないと、スパム送信者は、アカウントを作成し、そこに数百万のスパムメッセージを送信し、そのようなメッセージすべてを善良として分類することができることになり、これによりスパム送信者は、誤って標識が付けられたメッセージによってトレーニングデータベースを改悪することが可能になるであろう。
いくつかの形態のスパムフィルタリング、特にブラックホールリストと呼ばれるものは、スキップ可能でない可能性がある。ブラックホールリストは、サーバが、インターネットプロトコル(IP)アドレスのあるリストからメールを受信するのを防止する。したがって、メッセージの選択は、ブラックホールリストからのものでないメールの集合から選ぶことができる。
本発明の独自の態様は、現在実施されているフィルタによってスパムとしてマークされた、ポーリング用に選択されたメッセージが、削除されることも、ジャンクメールフォルダに移動されることもないことである。その代わりに、それらは、他のメッセージすべてが受信されてポーリングを考慮される通常の受信箱またはメールボックス内に配置される。しかし、そのメッセージのコピーが2つあり、そのメッセージがフィルタによってスパムと考えられた場合には、一方のコピーがスパムフォルダに送達され、そうでない場合には、設定されたパラメータに従って処理される(たとえば、削除され、または特別にマークされ、またはジャンクフォルダに移動される)。
メッセージは、選択されたとき、ユーザに転送され、それがポーリングメッセージであることを示すように何らかの特別な方法でマーク付けされる。具体的には、選択されたメッセージは、メッセージ修正構成要素106によって修正することができる。メッセージ修正の例には、それだけには限らないが、別個のフォルダ内にポーリングメッセージを置くこと、「発信元(from)」アドレスまたは件名行を変更すること、および/またはそのメッセージをそのユーザに対するポーリングメッセージとして識別する特別なアイコンまたは特別な色を使用することが含まれる。選択されたメッセージはまた、別のメッセージ内でカプセル化することができ、その別のメッセージは、カプセル化されたメッセージに対してどのように投票し、および/または分類するかについてユーザに使用説明(または指示:instruction)を送ることになる。これらの使用説明は、たとえば、そのメッセージをスパムとして投票するためのものと、そのメッセージをスパムでないものとして投票するためのものという少なくとも2つのボタンまたはリンクを含むことができる。
投票用ボタンは、ポーリングメッセージのコピーをユーザに送信する前に、メッセージの内容を修正することによって実装することができる。本発明が(メールサーバではなく)クライアント電子メールソフトウェアに関連して使用されるとき、ユーザインターフェースは、投票用ボタンを含むように修正することができる。
さらに、ポーリングメッセージは、使用説明と投票用ボタン、並びに、そこに添付された、選択されたメッセージを含むことができる。また、ポーリングメッセージは、件名行、発信元(from)アドレス、送信および/または受信された日付、テキストまたはテキストの少なくとも最初の数行など、選択されたメッセージの概要を含むことができる。別の手法は、投票用使用説明および投票用ボタンがその先頭に追加された状態でメッセージを送信することを必要とする。実際には、ユーザがポーリングメッセージのコピーを開いた、および/またはダウンロードしたとき、それだけには限らないが「スパム」ボタンおよび「スパムでない」ボタンを含むボタン(またはリンク)を、ユーザインターフェース上でポップアップさせることができ、もしくは、ポーリングメッセージ内に組み込むことができる。したがって、各ポーリングメッセージが1組の使用説明および好適な投票用ボタンを含むことが可能である。おそらくは(使用説明またはボタンのテキストを不明瞭にする可能性がある)HTMLのbackground命令を削除することを含めて、他の修正が必要となる場合がある。
望ましい情報のタイプに応じて、「送信請求型商業電子メール」ボタンなど別のボタンを設けることもできる。このメッセージはまた、今後のポーリングからオプトアウトするためのボタン/リンクを含むことができる。使用説明は、ユーザの好ましい言語にローカライズされ、また、ポーリングメッセージ内に埋め込むことができる。
さらに、ポーリング用に選択されたメッセージは、メッセージ修正構成要素106によって、または何らかの他の好適なウィルススキャン構成要素(図示せず)によって、ウィルスがあるかどうかスキャンすることができる。ウィルスが見つかった場合、そのウィルスを除去することも、そのメッセージを廃棄することもできる。ウィルス除去は、そのメッセージが選択されたとき、また、ユーザがそのメッセージをダウンロードする直前を含めて、システム100の任意の時点で行うことができる。
メッセージの修正の後で、メッセージ送達構成要素108は、投票のために、ポーリングメッセージをユーザに送達する。ユーザフィードバック(たとえば、ポーリングメッセージ、ユーザの投票とそれに関連付けられた任意のユーザプロパティ)には、固有の識別子(ID)110(たとえば、メタデータ)が割り当てられる。ID110および/またはそれに対応する情報は、ユーザ分類/投票が編集および記憶されるメッセージストア/投票ストア112(たとえば、中央データベース)に送信される。
データベースレベルでは、ポーリングに使用可能な選択されたメッセージを、後でポーリングしまたは使用するために、保持することができる。さらに、データベースは、特定のユーザが過剰にサンプリングされていないように、もしくは、そのユーザによって指定された制限内である量のデータがそのユーザから確実に収集されつつあるようにするために、指定時刻ごとに頻度分析を実行することができる。具体的には、フィードバックシステム100は、サンプリングとデータ双方の偏りを軽減するために、ユーザのメールの割合制限、並びにサンプリング期間を監視する。これは、使用量の少ないユーザと使用量の多いユーザを共に含めて、ユーザが、利用可能なユーザすべてから選択される場合、特に重要である。たとえば、使用量の少ないユーザは、一般に、使用量の多いユーザに比べて、非常に少ないボリュームのメールを送受信する。したがって、システム100は、選択されたメッセージが、確実に、そのユーザによって受信されたメッセージのT個ごとに約1つとなるように、並びに、そのユーザによってZ時間ごとに1つ以下のメッセージが受信されるように、メッセージ選択プロセスを監視する。したがって、例えば、システムは、サンプリングすべき(たとえば、ポーリングするかどうかが考察される)着信メッセージ10個ごとに1つ、ただし、2時間ごとに1つ以下をポーリングすることができる。頻度制限、または割合制限は、使用量の多いユーザに比べて、使用量の少ないユーザに対して、不釣り合いな量のメッセージをサンプリングすることを軽減し、また、ユーザを過剰に煩わせるのを緩和する。
中央データベース112は、ある頻度ごとに、ポーリングのためにシステム100によってサンプリングされた、しかし分類されていないメッセージがあるかどうかスキャンする。データベースは、これらのメッセージを引き出し、それぞれのユーザの人口学的プロパティに対してそれらをローカライズし、ユーザに投票するように、またメッセージを分類するように要求するためにポーリングメッセージを作成する。しかし、スパムフィルタは、あらゆる新しい着信分類を受信した直後に、修正またはトレーニングを受けることができない。逆に、オフライントレーニングでは、指定スケジュールごとに、または継続的に、または日ごとに、データベース112内に受信されるデータをトレーナが連続的に調べることが可能になる。すなわち、トレーナは、規定された開始点から、または、過去における設定された量の時間で開始し、フィルタをトレーニングするために、その時点以降、すべてのデータを調べる。たとえば、規定された時間は、午前0時から午前6時とすることができる。
新しいスパムフィルタは、機械学習技法114(たとえば、ニューラルネットワーク、サポートベクタマシン(SVM))により、データベース112内で維持されているメッセージ分類を分析することによって、継続的にトレーニングすることができる。機械学習技法は、学習のために善良なメールとスパムの両方の例を必要とし、これにより、それらを区別するように学習することができる。スパムの既知のサンプルをマッチングすることに基づく技法であっても、誤って善良なメールが捕捉されないようにすることができるよう、善良なメールの例を有することは役立つ。
したがって、単なる苦情だけではなく、スパムの肯定的例と否定的例を共に有することが重要である。フリーメーリングリストなど、スパムと正当なメールを共に大量に送信するいくつかのドメインがある。苦情だけに基づいてシステムを構築した場合、これらのドメインからのメールすべてがフィルタされる可能性があり、間違いが多数に上る。したがって、そのドメインは大量の善良なメールをも送信することを認識していることは重要である。さらに、ユーザは、しばしば、フリーメーリングリストに対してサインアップしたことを忘れることなど、間違いを犯す。たとえば、New York Timesなど大規模な合法プロバイダは、定期的に正当なメールを送信する。数人のユーザは、サインアップしていたことを忘れて苦情を言い、これらのメッセージをスパムとして分類する。このメールが本物であることを大抵のユーザが理解しているというデータがない場合、このサイトからのメールは、他の方法で阻止することができる。
新しいフィルタ116は、参加しているインターネットサービスプロバイダ(ISP)全体にわたって、および/または電子メールもしくはメッセージサーバに対して、および/または個々の電子メールクライアントに対して、および/または更新サーバに対して、および/または個々の企業の中央データベースに対して、配布構成要素118によって継続的に配布されることができる。さらに、フィードバックシステム100は、考慮されてポーリングするのに使用されたメッセージのサンプルが、システム100によって受信された電子メールの実際の配布に従うことができるように、継続的に機能する。その結果、新しいスパムフィルタをトレーニングするために使用されたトレーニングデータ集合は、適応スパム送信者に対して最新に保たれる。新しいフィルタが構築されたとき、ポーリングデータは、それがどれだけ過去に得られたかに基づいて、廃棄するか、もしくは少なく重み付けする(たとえば、軽視する)ことができる。
システム100は、ゲートウェイサーバ、電子メールサーバ、および/またはメッセージサーバなど、サーバ部でメールが受信されたとき実装することができる。たとえば、メールが電子メールサーバ内に来たとき、サーバは、対象となる受信者のプロパティをルックアップし、その受信者がシステム100にオプトインしているかどうか判定する。受信者のプロパティがそのように示している場合、その受信者のメールは、ポーリングに使用できる可能性がある。クライアントだけのアーキテクチャも存在する。たとえば、クライアント電子メールソフトウェアは、単一のユーザについてポーリング判断を下し、電子メールを中央データベースに送達し、または、個別化されたフィルタの性能を改善するためにポーリング情報を使用することができる。これら本明細書に述べられているものに加えて、このシステム100のための他の代替的な構成が存在し、それらが本発明の範囲内に入ることが企図されている。
次に図2を参照すると、本発明の一態様による基本的なフィードバックループプロセス200の流れ図が示されている。説明を簡単にするために、本方法は、一連の動作として示され、述べられているが、本発明によれば、いくつかの動作は、本明細書に示され述べられているものと異なる順序で、および/または他の動作と同時に行われる可能性があるため、本発明は動作の順序によって制限されないことを理解されたい。たとえば、方法は、別法として、状態図内でなどの一連の相互に関係のある状態または事象として表すことができることを、当業者なら理解するであろう。さらに、本発明による方法を実施するために図中の動作すべてを必要とするわけではない。
プロセス200は、プロセス202において、サーバなど構成要素内にメールが到来し、受信されたことによって始まる。メールがサーバに到着したとき、サーバは、(プロセス204において)対象となる受信者のプロパティを識別し、ポーリングのために、対象となる受信者が先にスパムファイタとしてオプトインしているかどうか判定する。したがって、プロセス200は、受信者がフィードバックシステムにオプトインしているかどうか示すことができるユーザプロパティフィールドを使用するか、もしくは、オプトインしているユーザのリストを調べる。ユーザがフィードバックシステムの参加者であると判定され、プロセス206においてポーリング用に選択されている場合、フィードバックシステムは、(プロセス208において)どのメッセージがポーリング用に選択されるか判定することによって、アクションを起こす。そうでない場合、プロセス200は、着信メッセージの少なくとも1人の対象となる受信者がユーザ(たとえば、スパムファイタ)であると決定されるまで、プロセス202に戻る。
実際には、現在使用されているフィルタ(たとえば、パーソナライズ化されたフィルタ、Brightmailフィルタ)によってスパムとして指定される(またはスパムであるはずの)メッセージを含めて、メッセージすべてがポーリングのために考慮される。したがって、メッセージは、ポーリングのために考慮される前に削除されることも、廃棄されることも、ジャンクフォルダに送られることもない。
サーバによって受信された各メッセージまたはメールアイテムは、そのメールトランザクションに対応する1組のプロパティを有する。サーバは、これらのプロパティを編集し、ポーリングメッセージと共に中央データベースに送る。プロパティの例には、(たとえば、「To:」「cc:」および/または「bcc:」フィールド内にリストされる)受信者リスト、現在使用されているフィルタの判断(たとえば、フィルタがメッセージをスパムとして識別したかどうか)、別の任意選択のスパムフィルタ(たとえば、Brightmailフィルタ)の判断、およびユーザ情報(たとえば、ユーザ名、パスワード、実名、ポーリングされるメッセージの頻度、使用量データなど)が含まれる。ポーリングメッセージおよび/またはその内容、並びに対応するユーザ/受信者には、それぞれ固有の識別子が割り当てられる。識別子は、データベースに送り、必要に応じて後で更新することもできる。
プロセス214において、ポーリング用に選択されたメッセージ(たとえば、元のメッセージ1-M、ただし、Mは1以上の整数)は、メッセージ1-MがポーリングメッセージP1-PMであることをユーザに示すように修正され、次いで、(プロセス216において)ポーリングのためにユーザに送達される。たとえば、ポーリングメッセージは、添付ファイルとして投票を受ける元のメッセージと、そのメッセージに対してどのように投票するかについての1組の使用説明とを含むことができる。その1組の使用説明は、たとえば「善良なメール」ボタンと「スパム」ボタンなど、少なくとも2つのボタンを含む。ユーザが、メッセージを善良なメールまたはスパムとして分類するために(プロセス218において)1つのボタン上でクリックしたとき、ユーザは、そのユーザが送信している分類のための固有の識別子に対応するユニフォームリソースロケータ(URL)に導かれる。この情報は掲示され、その元のメッセージ1-Mに対して中央データベース内の関連レコードが更新される。
プロセス216において、またはプロセス200中における任意の他の適切な時間に、元のメッセージをオプションでユーザに送達することができる。したがって、ユーザは、メッセージを2回、すなわち1回はその元の形態で、また再度その修正されたポーリング形態で受信する。
さらに後のある時間には、新しいスパムフィルタが、少なくとも一部にはユーザフィードバックに基づいて、プロセス220において作成およびトレーニングされる。新しいスパムフィルタが作成およびトレーニングをされた後で、そのフィルタは、(222において)直ちに電子メールサーバ上で使用することができ、および/またはクライアントサーバ、クライアント電子メールソフトウェアなどに配布することができる。新しい、または更新されたスパムフィルタをトレーニングおよび配布することは、継続的な活動である。したがって、プロセス200は、着信メッセージの新しいストリームが受信されたとき204において継続される。新しいフィルタが構築されたとき、より古いデータは、それらがどれだけ過去に得られたかに基づいて、廃棄され、または、少なく重み付けされる。
フィードバックシステム100およびプロセス200は、その参加しているユーザのフィードバックに依拠する。残念ながら、何人かのユーザは信頼することができないか、あるいは単に怠惰であり、一貫して正確な分類を提供することができない。中央データベース112(図1a)は、ユーザ分類の履歴を保持する。したがって、フィードバックシステム100は、矛盾の数、そのユーザの気が変わった回数、既知の善良なメールまたは既知のスパムに対するそのユーザの応答、並びに、ポーリングメッセージに対するユーザ回答の数もしくは頻度を追跡することができる。
これらの数のいずれか1つが、規定された閾値を超えたとき、または単にシステムのあらゆるユーザについて、フィードバックシステム100は、1つの、またはいくつかの妥当性検査技法を呼び出し、特定の1人または複数のユーザの信頼性を査定することができる。1つの手法は、本発明の他の態様による、図3に示されている交差検定法300である。
交差検定技法は、302において、中央データベースが、ポーリング結果およびそれぞれのユーザ情報など着信データを受信して始まる。次に、304において、適切な数のユーザをテストするために交差検定をするのが望ましいかどうかを判定しなければならない。望ましい場合には、306において、着信データの何らかの部分を使用して、新しいスパムフィルタがトレーニングされる。すなわち、テストされているユーザからのデータは、トレーニングから除外される。たとえば、フィルタは、(90%フィルタと呼ばれる)ポーリングされたユーザデータの約90%を用いてトレーニングされ、それによって、テストされているユーザによって送信されたデータに対応する(10%テストユーザと呼ばれる)データの約10%を除外する。
308において、90%ユーザが、テストユーザのメッセージに対してどのように投票したかどうかを判定するために、90%フィルタは、残りの10%テストユーザデータに対して実行される。(310において)90%フィルタと10%テストユーザデータとの不一致の量が、規定された閾値を超えた場合には、312において、ユーザの分類を手動で検査することができる。別法で、またはそれに加えて、テストメッセージを疑わしいまたは信頼できないユーザに送信することができ、および/または、これらの特定のユーザを今後のポーリングから除外することができ、あるいは/または、これらの過去のデータを廃棄することができる。しかし、閾値を超えない場合には、プロセスは306に戻る。交差検定技法300は、投票/分類データの信頼性を判定および維持するために、必要に応じて様々なユーザを除外して、テストユーザの任意の適切な集合と共に使用することができる。
ユーザ忠実度および信頼度を査定するための第2の手法は、所与の期間内で収集されたデータすべてに対してフィルタをトレーニングし、次いで、そのフィルタを使用して、トレーニングデータに対してテストすることを含む。この技法は、テスト・オン・トレーニング(test−on−training)として知られている。あるメッセージがトレーニングに含まれていた場合、フィルタは、その評価を学習しているべきであった。たとえば、学習済みフィルタは、ユーザが行ったのと同じ方法でそのメッセージを分類すべきである。しかし、フィルタは、ユーザが「スパムでない」として標識を付けたときスパムとして標識を付けることによって、引き続き間違いを犯す可能性があり、逆も同様である。フィルタがそのトレーニングデータと一致しないためには、メッセージは、他のメッセージとひどく一致しないことを必要とする。そうでない場合、トレーニング済みフィルタは、ほぼ確実に、何らかの方法で正しく分類しているはずである。したがって、そのメッセージは、信頼できない標識を有するものとして廃棄することができる。この技法または交差検定のどちらかを使用することができる。すなわち、交差検定は、分類において、より多くの誤りを生み出し、信頼度があまり高くない可能性があり、逆に、テスト・オン・トレーニングは、誤りがより少なく、より信頼度が高い。
テスト・オン・トレーニングと交差検定技法300は共に、個々のメッセージに適用することができ、個々のユーザの分類またはメッセージの評価は、(たとえば、多数評価(majority rating)に従って)一般的な一致によって除外される。別法として、両技法を使用し、潜在的に信頼可能でないユーザを識別することができる。
さらに、または交差検定技法および/もしくはテスト・オン・トレーニング技法の代わりに、「結果が既知の」技法を使用し、ユーザ信頼性を検証することができる(図4への314に引き続く)。図3および図4の技法は別々に示されているが、両手法を同時に使用することができることを理解されたい。すなわち、既知の善良なメッセージと既知のスパムメッセージからの情報を交差検定またはテスト・オン・トレーニングの結果と組合せ、どのユーザを廃棄すべきか判定することができる。
図4を参照すると、本発明の一態様による、投票するユーザの忠実度を妥当性検査するためのプロセス400の流れ図が示されている。プロセス400は、図3に示されている314から参照される。402において、結果が既知のテストメッセージが、疑わしいユーザ(またはすべてのユーザ)に送信される。たとえば、テストメッセージを着信メールに注入し、次いで、データベースが「既知の」結果を受信するように手分類することができる。そうでない場合、プロセス400は、既知の結果メッセージが第三者によって送信されるまで待つことができる。ユーザは、同じテストメッセージに対して投票することが許される。投票結果は、404において、既知の結果と比較される。406において、ユーザの投票が一致しない場合には、一貫性と信頼度を実証するまで、それらの現在および/または今後および/または過去の分類を(408において)適切な時間の間、手検査することができる。別法として、それらの現在または今後または過去の分類を、廃棄または除去することができる。最後に、そのユーザを今後のポーリングから除去することができる。しかし、それらの投票結果がテストメッセージ結果と一致する場合には、410においてそのユーザを信頼できるものと考えることができる。プロセス400は、412で図3に戻り、疑わしいユーザの次のグループについてどのタイプの妥当性の検査技法が望ましいか判定する。
ユーザ信頼度を査定するための第4の手法(図示せず)は、能動学習(active learning)である。能動学習の場合、メッセージはランダムに拾い上げられない。その代わりに、フィードバックシステムは、そのメッセージがシステムにとってどれだけ有用になるか推定することができる。たとえば、フィルタがスパムの確率を返す場合、ポーリングのために、現在のフィルタによって、もっとも不確実に分類されるメッセージ、すなわち、そのスパムの確率が50%に最も近いものを優先的に選択することができる。メッセージを選択するための別の方法は、メッセージがどれだけ一般的であるか判定することである。メッセージが一般的であるほど、ポーリングするためにより有用である。独特の各メッセージは、あまり一般的でないため、あまり有用でない。既存のフィルタの信頼レベル(confidence level)を使用すること、メッセージの特徴がどれだけ一般的であるかを使用すること、並びに、既存のフィルタのその設定または内容の信頼レベル(たとえば、メタコンフィデンス(metaconfidence))を使用することによって、能動学習を用いることができる。機械学習の当業者に周知のQBC(query−by−committee)など、多数の他の能動学習技法があり、これらの技法のいずれも使用することもできる。
次に、図5を参照すると、本発明の一態様による、ユーザフィードバックに加えてハニーポットフィードバックをスパムフィルタトレーニングに組み込むためのプロセス500の流れ図が示されている。ハニーポットは、それらに誰が電子メールを送信しつつあるべきかが知られている電子メールアドレスである。たとえば、(502において)新たに作成される電子メールアドレスを私的なものに保ち、選択された個人だけに開示することができる。また、公に、しかし(たとえば、メールインクとして白い背景上に白い書体を置いて、)人に見られない制限された方法で開示することもできる。ハニーポットは、スパム送信者による辞書攻撃において特に有用である。辞書攻撃は、おそらくは辞書内のアドレスすべて、あるいは、辞書内の単語の対、または有効なアドレスを見出すための類似の技法で作成された非常に大量のアドレスに、スパム送信者が電子メールを送信しようと試みるものである。(504において)ハニーポットに送信される電子メール、または(506において)何人かの選択された個人からのものでない電子メールは、(508において)スパムと考えられる。また、電子メールアドレスは、疑わしいマーチャントとサインアップさせることができる。したがって、そのマーチャントから受信するどの電子メールも(510において)善良なメールと考えられるが、他のメールすべてはスパムと考えられる。スパムフィルタは、(512において)それに応じてトレーニングにすることができる。さらに、疑わしいマーチャントがユーザの情報(たとえば、少なくとも電子メールアドレス)を第三者に販売する、または他の方法で開示することが決定される。これは、他の疑わしいマーチャントを用いて繰り返すことができ、ユーザの情報がスパム送信者に配布される可能性があることをユーザに警告するために、リストを生成することができる。これらは、安全にスパムと考えることができるハニーポットに電子メールを送信させるいくつかの技法にすぎない。実際には、安全にスパムと考えることができるハニーポットに電子メールを送信させるための他の代替的な方法がある。
ハニーポットはスパムの良いソースであり、しかし正当なメールの非常に不十分なソースであるため、ハニーポットからのデータは、フィードバックループシステム(図1)からのデータと組み合わせて、新しいスパムフィルタをトレーニングすることができる。異なるソースまたは異なる分類からのメールは、異なるように重み付けすることができる。たとえば、それらのメールの10%に対してポーリングされる10個のハニーポットおよび10人のユーザがある場合、ポーリングからのものの約10倍と同程度のものをハニーポットから予想すべきである。したがって、この差を埋め合わせるために、ポーリングからの正当なメールをスパムの10倍または11倍と同程度で重み付けすることができる。別法として、ハニーポットデータは、選択的に減じて重み付けすることができる。たとえば、ユーザのメールの約50%が善良なメールであり、約50%がスパムである。同じボリュームのスパムがハニーポットに届く。したがって、ハニーポットは100%のスパムを有するように思われ、10%だけでなくそのすべてがサンプリングされる。組み合わされたシステム内で正しい比率のスパムと善良なメールでトレーニングするために、ハニーポットデータは95%だけ減じて重み付けされ、ユーザスパムは50%だけ減じて重み付けされ、1:1の全体的な比率を得る。
スパムレポートの他のソースには、フィードバックループシステムの参加者として含まれないユーザが含まれる。たとえば、フィルタを通過したスパムをレポートするために、全メールのすべてのユーザに対して「スパムをレポート(Report Spam)」ボタンを使用可能にすることができる。このデータは、フィードバックループシステムからのデータを組み合わせることができる。この場合も、スパムのこのソースは、様々な側面で偏っているか、または、信頼できない可能性があるため、様々に減じて重み付け、または重み付けすべきである。また、再重み付けを行い、フィルタされなかったメールだけ「スパムとしてレポート(Report−as−spam)」ボタンによるレポートの対象となることを反映すべきである。
スパムフィルタに加えて、フィードバックループシステムによって隔離フィルタを作成および使用することができる。隔離フィルタは、肯定的なメール特徴と否定的なメール特徴を共に利用する。たとえば、人気のあるオンラインマーチャントからのメールは、ほぼ常に善良である。スパム送信者は、自分のスパム内で善良なマーチャントのメールの側面を真似ることによってシステムを利用する。別の例は、スパム送信者が、意図的に、あるIPアドレスを介して少量の善良なメールを送信することによってフィードバックシステムをだますことである。フィードバックループシステムは、このメールを善良なメールとして分類することを学習し、そのようなとき、スパム送信者は、同じIPアドレスからスパムの送信を開始する。
したがって、隔離フィルタは、履歴データに基づいて、システムがそのために使用されるよりはるかに大量に、特定の肯定的な特徴が受信されつつあることに気付く。これにより、システムは、そのメッセージに疑問を抱き、したがって、そのメールをスパムとして送達またはマークするために選ぶ前に、十分な得票結果が得られるまでそのメッセージを隔離する。また、隔離フィルタは、メールがスパムか否か知られておらず、または確実でなく、そのことがしばらくの間わからない新しいIPアドレスからメールが受信されたときに使用することができる。隔離は、暫定的にそのメールをスパムとしてマークし、スパムフォルダに移動することを含めて、あるいは、ユーザに送達しないで、またはメールが見られなくなるようどこかに保存することによって、いくつかの方法で実行することができる。隔離は、スパムフィルタ閾値に近いメッセージについて行うことができる。すなわち、ポーリングからの追加の情報が正しい判断をする助けとなると想定することができる。また、隔離は、多数の同様なメッセージが受信されたときに行うことができる。すなわち、そのメッセージのいくつかを、フィードバックループを用いてポーリングのために送信することができ、トレーニング済みフィルタを使用し、そのメッセージを正しく分類することができる。
フィルタを構築することに加えて、本明細書で述べられているフィードバックループシステムは、フィルタを評価するためにも使用することができる。すなわち、スパムフィルタのパラメータを必要に応じて調整することができる。たとえば、フィルタは、昨夜の午前0時を介してトレーニングされる。午前0時の後に、データベース内に入るデータを取り、ユーザの分類に比べて、スパムフィルタの誤り率を決定する。さらに、フィードバックループを使用し、スパムフィルタのフォールスポジティブ/捕捉率(false positive and catch rates)を決定する。たとえば、ユーザ投票を取ることができ、メールを潜在的フィルタに通し、フォールスポジティブ/捕捉率を決定することができる。次いで、この情報を使用し、フィルタを調整および最適化することができる。最も低いフォールスポジティブ/捕捉率を得るために、それぞれが異なる設定またはアルゴリズムを使用するいくつかのフィルタを構築することによって、様々なパラメータ設定または様々なアルゴリズムを手動または自動で試みることができる。したがって、結果同士を比較し、最良の、または最適なフィルタパラメータを選択することができる。
フィードバックループは、常にスパムとして投票される、または、常に善良として投票される、または、少なくとも90%善良と投票される、などのIPアドレスもしくはドメインもしくはURLのリストを構築およびポピュレートするために使用することができる。これらのリストは、他の方法でのスパムフィルタリングのために使用することができる。たとえば、少なくとも90%スパムと投票されたIPアドレスのリストは、メールを受け入れないアドレスのブラックホールリストを構築するために使用することができる。フィードバックループはまた、スパム送信者のアカウントを打ち切るために使用することもできる。たとえば、あるISPの特定のユーザがスパムを送信していると思われる場合、そのISPに自動的に通知することができる。同様に、特定のドメインが大量のスパムに責任があると思われる場合、そのドメインの電子メールプロバイダに自動的に通知することができる。
フィードバックループシステムを実装するために使用することができるいくつかのアーキテクチャがある。1つの例示的なアーキテクチャは、図7で述べることになるように、サーブドベースであり、選択プロセスは、メールが電子メールサーバに到達したとき発生する。代替のアーキテクチャは、図6で述べられているように、クライアントをベースとするものである。クライアントをベースとするフィードバックループでは、ポーリング情報を使用し、個別化されたフィルタの性能を改善することができ、あるいは、ここで示されている例示的な実装では、その情報を(たとえば、全社的、またはグローバルな)共用フィルタ用のトレーニングデータとして共用リポジトリに送信することができる。下記に述べられている以下のアーキテクチャは単に例示的なものであり、示されていない追加の構成要素および特徴を含むことができることを理解されたい。
次に図6を参照すると、クライアントをベースとするアーキテクチャにおけるフィードバックループ技法の例示的、一般的なブロック図が示されている。ネットワーク600は、(クライアント1、クライアント2...クライアントNとも呼ばれ、ただし、Nは1以上の整数の)1つまたは複数のクライアント602、604、606との間で電子メールの送信を容易にするために設けられる。ネットワークは、インターネットなど地球規模の通信ネットワーク(GCN)、またはWAN(広域ネットワーク)、LAN(ローカルエリアネットワーク)、あるいは任意の他のネットワーク構成とすることができる。この特定の実装では、SMTP(簡易メール転送プロトコル)ゲートウェイサーバ608がネットワーク600とインターフェースし、LAN610にSMTPサービスを提供する。LAN610上で動作可能に配置された電子メールサーバ612は、ゲートウェイ608とインターフェースし、クライアント602、604、606の着信電子メールおよび発信電子メールを制御および処理する。そのようなクライアント602、604、606もまたLAN610上に配置され、少なくともそこで提供されるメールサービスにアクセスする。
クライアント1602は、クライアントプロセスを制御する中央処理装置(CPU)614を含む。CPU614は、複数のプロセッサを備えることができる。CPU614は、上述の1つまたは複数のデータ収集/フィードバック機能のいずれかを提供することと関連して、命令を実行する。命令には、それだけには限らないが、少なくとも上述の基本的なフィードバックループ方法、クライアント/メッセージ選択に対処するためにそれと組み合わせて使用することができる手法の少なくともいくつかもしくは全部、ポーリングメッセージ修正、データ保持、クライアント信頼度/分類の妥当性検査、フィードバックループシステムを含む複数のソースからのデータの再重み付け、スパムフィルタ最適化/調整、隔離フィルタ、スパムリストの作成、並びに、それぞれのISPや電子メールプロバイダに対するスパム送信者についての自動通知を実行する符号化命令が含まれる。ユーザインターフェース616は、CPU614およびクライアントオペレーティングシステムとの通信を容易にするために設けられる。クライアント1が対話し、電子メールにアクセスし、および、ポーリングメッセージに対して投票することができるようにする。
サーバ612から取り出されたクライアントメッセージのサンプリングは、メッセージセレクタ620によってポーリング用に選択することができる。対象となる受信者(クライアント)が先に参加することに合意している場合、メッセージがポーリング用に選択および修正される。メッセージ修正器622は、ポーリングメッセージになるようにメッセージを修正する。たとえば、メッセージは、上記のメッセージ修正説明に従って、投票用の使用説明と、投票用ボタンおよび/またはリンクとを含むように修正することができる。投票用ボタンおよび/またはリンクは、クライアント電子メールソフトウェアのユーザインターフェース616を修正することによって実装される。さらに、メッセージ修正器622は、クライアント602によって、閲覧するのに開かれ、または、ダウンロードされる前に、メッセージ(ポーリングメッセージおよび非ポーリングメッセージ)内のどのウィルスをも除去することができる。
一実装においては、スパムファイティングクライアント602のユーザは、各メッセージを1回だけ見ており、いくつかのメッセージはポーリングメッセージとして特別にマークされ、投票用ボタンなどを含む。本実装では、スパムファイティングクライアント602のユーザは、いくつかのメッセージを2回見ることもあり、一方は通常のメッセージであり、他方はポーリングメッセージである。これは、いくつかの方法で実施することができる。たとえば、ポーリングメッセージは、サーバ612に返され、ポーリング済みメッセージストアに記憶することができる。別法として、クライアント602は、追加のメッセージを電子メール(E−Mail)サーバ612に記憶することができる。別法として、クライアント602は、ユーザに各メッセージを2回、すなわち1回は通常のメッセージとして、1回は修正された形態で示すことができる。
ポーリング結果626は、CPU614に次いでデータベース630に送信することができ、データベース630は、クライアントフィードバックアーキテクチャの特定の構成に応じて1つのクライアントからの、または、複数のクライアントからのデータを記憶するように構成することができる。中央データベース630は、ポーリングメッセージ、ポーリング結果、並びにそれぞれのクライアントユーザ情報を記憶する。関連構成要素を使用し、ポーリング頻度、クライアントユーザ信頼性(たとえば、ユーザの妥当性検査632)、並びに、他のクライアント統計を決定するためなど、そのような情報を解析することができる。妥当性の検査技法は、クライアントの投票の信頼度が疑わしいとき特に使用することができる。疑いは、矛盾の数、心変わりの数、並びに、特定の1人もしくは複数のユーザについてポーリングされた数を解析することにより発生する可能性があり、別法として、妥当性の検査技法は、あらゆるユーザについて使用することができる。中央データベース630内に記憶された任意の適切な量のデータを機械学習技法634において使用し、新しい、かつ/または改善されたスパムフィルタのトレーニングを容易にすることができる。
クライアント604および606は、特定のクライアントに対してパーソナライズ化されたフィルタを得て、トレーニングするために、上述のような同様の構成要素を含む。記載されているものに加えて、ポーリング済みメッセージスクラバ628は、データ集約、データ圧縮など様々な理由のためにポーリング済みメッセージの諸側面を除去することができるように、CPU614と中央データベース630の間でインターフェースすることができる。ポーリング済みメッセージスクラバ628は、ポーリング済みメッセージの関係のない部分、並びに、それに関連する任意の望ましくないユーザ情報を一掃することができる。
次に、図7を参照すると、マルチユーザログインを容易にし、ポーリングデータを得る、本発明のフィードバックループ技法による例示的なサーバベースのフィードバックループシステム700が示されている。ネットワーク702は、(ユーザ17041、ユーザ27042...ユーザN704Nとも呼ばれ、ただし、Nは1以上の整数の)1つまたは複数のユーザ704との間で電子メールの送信を容易にするために設けられる。ネットワーク702は、インターネットなど地球規模の通信ネットワーク(GCN)、またはWAN(広域ネットワーク)、LAN(ローカルエリアネットワーク)、あるいは任意の他のネットワーク構成とすることができる。この特定の実装では、SMTP(簡易メール転送プロトコル)ゲートウェイサーバ710がネットワーク702とインターフェースし、LAN712にSMTPサービスを提供する。LAN712上で動作できるように配置された電子メールサーバ714は、ゲートウェイ710とインターフェースし、ユーザ704の着信電子メール並びに発信電子メールを制御し、処理する。
システム700は、メッセージ選択716、メッセージ修正718、メッセージポーリング(720、722、724)が、システム700にログインする各異なるユーザについて行われるように、マルチログイン機能を提供する。したがって、コンピュータオペレーティングシステムのブートアッププロセスの一部として、ログイン画面を提示する、または、必要に応じて、ユーザ704が自分の着信メッセージにアクセスできるようになる前に、関連ユーザプロフィルを保証するために、ユーザインターフェース726が提供される。したがって、第1のユーザ7041(ユーザ1)がメッセージにアクセスすることを選んだとき、第1のユーザ7041は、典型的にはユーザ名およびパスワードの形態でアクセス情報を入力することによって、ログイン画面728を介してシステムにログインする。CPU730は、アクセス情報を処理し、メッセージ通信アプリケーション(たとえば、電子メールクライアント)を介して第1のユーザ受信箱ロケーション732だけにユーザアクセスを許す。
着信メールがメッセージサーバ714上で受信されたとき、メッセージはランダムにポーリング用に選択され、これは、メッセージのうち少なくとも1つがポーリング用にタグ付けされることを意味する。タグ付けされたメッセージの対象となる受信者は、その受信者の誰か1人もまた、指定されたスパムファイティングユーザであるかどうか判定するために調べられる。そのような情報を示す受信者プロパティは、必要に応じて、メッセージサーバ714上で、またはシステム700における任意の他の構成要素上で保持することができる。対象となる受信者の誰がスパムファイタでもあるか判定された後で、そのそれぞれのメールのコピーは、メールトランザクションに関する任意の他の情報とともに、記憶するために中央データベース734に送信することができる。ポーリング用にタグ付けされたメッセージは、メッセージ修正器718によって、上述した任意の数の方法によって修正される。ポーリング用に選択されたメッセージもまた、ユーザ704特有のものとすることができる。たとえば、ユーザ704は、いくつかのタイプのメッセージだけポーリングのために利用可能であることを示すことができる。これによりデータのサンプリングが偏る可能性があるため、そのようなデータは、他のクライアントデータに対して再重み付けし、不適切なトレーニングデータセットを構築するのを緩和することができる。
ポーリングメッセージのウィルススキャンもまた、この時点で、または、ポーリングメッセージがユーザ704によってダウンロードされ、かつ/または開かれる前の任意の他の時点で行うことができる。メッセージは、適切な形で修正された後で、受信箱1732、受信箱2736、受信箱N738と呼ばれるそれぞれのユーザの受信箱に送達され、そこでポーリングのためにメッセージを開くことができる。ポーリングプロセスを容易にするために、各ポーリングメッセージは、ユーザによって選択されたときポーリングメッセージおよびポーリング結果に関する情報を生成する2つ以上の投票用ボタンまたはリンクを含む。各ポーリングメッセージのテキストは、投票用ボタンまたはリンクを組み込むように修正することができる。
分類に起因する任意の情報(たとえば、ポーリングメッセージまたはそれに関連付けられたID、ユーザプロパティ)を含む(メッセージ得票1720、メッセージ得票2722、メッセージ得票N724と呼ばれる)メッセージ得票結果は、LAN712上のネットワークインターフェース740を介して、中央データベース734に送信される。中央データベース734は、機械学習技法に適用し、新しく、かつ/または改善されたスパムフィルタ742を構築もしくは最適化するために、それぞれのユーザからのポーリング/ユーザ情報(720、722、724)を記憶することができる。しかし、プライバシーおよび/またはセキュリティの理由で、秘密情報は、中央データベース714に送信される前に、情報から除去し、または、取り去ることができる。ポーリングを介してユーザ704によって生成された情報もまた、統計データ内に集約することができる。したがって、情報を送信するためにあまり帯域幅は使用されない。
次いで、新たにトレーニングされたスパムフィルタ742は、新しいフィルタが使用可能であるときなど継続的に、特定の要求によってまたは自動的に、他のサーバ(図示せず)、並びに、LAN712とインターフェースするクライアント電子メールソフトウェア(図示せず)に、配布することができる。たとえば、最も新しいスパムフィルタは、自動的にサーバなどに送り出し、かつ/またはウェブサイトを介してダウンロードするために、使用可能にすることができる。より新しいスパムフィルタを構築するために新しいトレーニングデータセットが生成されたとき、より古いデータセット(たとえば、先に得られ、および/またはフィルタをトレーニングするために使用された情報)は、データの寿命に応じて、廃棄または無視することができる。
次に、スパムファイティングを投入している組織が、多数の異なるフィルタの使用組織によって共用されるフィルタを使用できるようにする、代替的なシナリオを考えてみる。本発明の一態様では、フィルタプロバイダはまた、非常に大規模な電子メールサービス(たとえば、有料および/または無料電子メールアカウント)のプロバイダである。それ自体の組織からの電子メールに排他的に頼るのではなく、フィルタプロバイダは、善良なメールとスパムの範囲をより良く取り込むように、いくつかのフィルタ使用組織からのいくつかのデータをも使用することを選ぶ。上述のようなフィードバックループシステムもまた、サーバまたはクライアントをベースとするアーキテクチャにおいて、そのような組織横断シナリオにおいて使用することができる。データをそれ自体のユーザからおよび様々なフィルタ使用組織から集約するフィルタプロバイダを、「内部」組織と呼び、参加しているフィルタ使用組織の1つに常駐する構成要素を「外部」と呼ぶことにする。一般に、組織横断システムは、それだけには限らないがHotmailなど、フィルタプロバイダ部のメールデータベースサーバ(内部)並びに、1つもしくは複数の個々の企業内に常駐することができるものなどの1つもしくは複数のメッセージサーバ(外部)とを含む。この場合には、内部メールデータベースサーバはまた、それ自体の顧客からの実質的な電子メールフィードバックを記憶する。本発明のこの態様によれば、トレーニングデータセットは、内部データベース(たとえば、HotmailまたはMSNサーバ上の無料電子メール/メッセージング)上で記憶された情報、並びに、それぞれの外部サーバに関連付けられた1つもしくは複数の外部データベース上で記憶された情報に基づいて生成することができる。外部データベース上で保持されている情報は、たとえば、機械学習技法において使用するために、インターネットなどネットワークを介して内部サーバに通信することができる。最終的には、外部データベースからのデータを使用することによって、新しいスパムフィルタをトレーニングし、および/または、外部に位置し(たとえば、それぞれの企業内の)、もしくは、内部メールサーバに関連付けられた既存のスパムフィルタを改善することができる。
外部データベースの1つまたは複数からのデータは、ポーリングメッセージ、ポーリング結果(分類)、ユーザ情報/プロパティ、並びに、ユーザ当たりの、もしくはユーザのグループ当たりの、もしくは各企業について平均した投票統計データのうち少なくとも1つを含むべきである。投票統計データは、それぞれの企業によって生成された情報の信頼度を決定し、外部データの偏りを軽減するのを容易にする。したがって、1つまたは複数の外部データベース(企業)からのデータは、再重み付けされ、または、他の外部データベースの1つもしくは複数と異なるように重み付けするされ得る。さらに、外部エンティティは、上述のように同様な妥当性の検査技法を使用して、信頼度および信頼性に関してテストをすることができる。
企業セキュリティ、プライバシー、および機密性のために、たとえば各企業から電子メールサーバに、インターネットを渡って通信される情報またはデータは、その元の形態からスクラブ(scrub)し、および/または短縮し、および/または圧縮することができる。元の形態は、それぞれの外部データベース上で維持され、かつ/または他の方法によって、各企業の嗜好に従って処理される。したがって、電子メールサーバまたは任意の他の内部メールサーバは、スパム分類、送信側ドメイン、送信側名、スパムに分類されたメッセージの内容など、トレーニングデータを生成するために必要な関連情報だけを受信する。
次に図8を参照すると、例示的な組織横断フィードバックシステム800が示されている。このシステム800は、内部データベースサーバおよび外部メールサーバがネットワークを介してデータベース情報を通信および交換し、改善されたスパムフィルタを構築するために機械学習技法で使用されるトレーニングデータセットの生成を容易にすることができる。システム800は、(たとえば、少なくとも1つの企業に関連する)少なくとも1つの外部メッセージサーバ802、並びに、内部データベースサーバ804を含む。組織横断システムの性質により、外部サーバ802および内部電子メールサーバ804は、それぞれ、それ自体のデータベースを維持する。すなわち、電子メールサーバ804は、やはり新しいスパムフィルタ808をトレーニングするために使用することができる内部データベース806に関連付けられる。同様に、外部サーバ802は、少なくとも1つの新しいスパムフィルタ812、並びに、電子メールサーバ804に対して内部に位置するスパムフィルタ808をトレーニングするために使用することができる外部データベース810に関連付けられる。したがって、外部データベース810上において記憶された情報を使用し、電子メールサーバ上に位置するスパムフィルタ808をトレーニングすることができる。
GCN814は、内部電子メールサーバ804および1つもしくは複数の外部メッセージサーバ802の間で、情報の通信を容易にするために設けられる。組織横断システムの外部サーバ構成要素は、サーバをベースとするフィードバックループシステム(たとえば、上記図7)と同様な形で動作する。たとえば、メッセージサーバ802、外部データベース810、フィルタ812は、LAN815上に位置することができる。さらに、コンピュータオペレーティングシステムのブートアッププロセスの一部としてログイン画面818を提示する、または、必要に応じて、ユーザが自分の着信メッセージにアクセスできるようになる前に関連ユーザプロフィルを保証するために、ユーザインターフェース816が提供される。
このサーバをベースとするシステムにおいては、(ユーザ1820、ユーザ2822、ユーザN824と呼ばれる)1人または複数のユーザが、利用可能なメールサービスを使用するために、同時にシステムにログインすることができる。実際には、第1のユーザ820(ユーザ1)がメッセージにアクセスすることを選んだとき、第1のユーザ820は、典型的にはユーザ名およびパスワードの形態でアクセス情報を入力することによって、ログイン画面818を介してシステムにログインする。CPU826は、アクセス情報を処理し、メッセージ通信アプリケーション(たとえば、電子メールクライアント)を介して第1のユーザ受信箱ロケーション828だけにユーザアクセスを許す。
着信メールがメッセージサーバ802上で受信されたとき、メッセージは、ランダムに、または、具体的に、ポーリングのための対象とされる。メッセージをポーリング用に選択することができるようになる前に、そのような目標をしぼったメッセージの対象となる受信者はスパムファイタユーザリストと比較され、その受信者の誰かもまた、指定されたスパムファイティングユーザであるかどうかを判定する。そのような情報を示す受信者プロパティは、メッセージサーバ802、データベース810上で、または、必要に応じて、システム800における任意の他の構成要素上で保持することができる。対象となる受信者の誰がやはりスパムファイタであるかを判定された後に、メッセージはポーリング用に選択され、ポーリングメッセージのコピー、並びに、メールトランザクションに関連する任意の他の情報を、データベース810に送信することができる。
ポーリング用に選択されたメッセージは、メッセージ修正器830によって、上述した任意の数の方法によって修正される。実際には、固有の識別(ID)を、各ポーリングメッセージに、および/またはスパムファイタに、および/または各ポーリング結果に割り当て、データベース810内に記憶することができる。先に述べたように、ポーリング用に選択されるメッセージは、ランダムに選ぶことができ、または、それぞれのユーザ(820、822、824)特有のものとすることができる。たとえば、ユーザ1820は、あるタイプのメッセージ(たとえば、企業の外から送信されたメッセージ)だけがポーリング用に使用可能であることを示すことができる。そのような特定のメッセージから生成されたデータは、データのサンプリングが偏るのを緩和するために、再重み付けおよび/または軽視される。
ポーリングメッセージのウィルススキャンもまた、この時点において、または、ポーリングメッセージがユーザによってダウンロードされ、および/または開かれる前の、任意の他の時点において行うことができる。メッセージは、適切な形で修正された後に、受信箱1828、受信箱2832、受信箱N834と呼ばれるそれぞれのユーザの受信箱に送達され、そこでポーリングのためにメッセージを開くことができる。ポーリングプロセスを容易にするために、各ポーリングメッセージは、ユーザによって選択されたときポーリングメッセージおよびポーリング結果に関する情報を生成する、2つ以上の投票用ボタンまたはリンクを含む。各ポーリングメッセージのテキストは、投票用ボタンまたはリンクを組み込むように修正することができる。
分類に起因する任意の情報(たとえば、ポーリングメッセージまたはそれに関連付けられたID、ユーザプロパティ)を含む(メッセージ得票1836、メッセージ得票2838、メッセージ得票N840と呼ばれる)メッセージ得票結果は、LAN815上に位置するネットワークインターフェース842を介して、データベース810に送信される。データベース810は、後に、新しい、および/または改善されたスパムフィルタ812、808を構築および/または最適化するために使用される機械学習技法で使用するために、それぞれのユーザからのポーリング/ユーザ情報を記憶する。
プライバシーの理由で、各企業は、ポーリング済みメッセージおよび/またはユーザ情報を、それ自体のデータベース810に、および/または、たとえばGCN814を介して電子メールデータベース806に送信する前に、重要な情報を取り去りたいと望む場合がある。1つの手法は、スパムメッセージについてだけデータベース(806および/または810)にフィードバックを送り、それによって正当なメールについてのフィードバックを除外することである。別の手法は、送信側および送信側のIPアドレスなど、正当なメールに関する情報の一部の部分集合だけ送ることである。別の手法は、フィルタによって悪質とマークされるはずのユーザによって善良とマークされたもの、またはその逆など、選択されたメッセージについて、それらをフィルタに送信する前に、明示的にユーザ許可を依頼することである。これらの手法のいずれか、または、それらの組合せは、参加しているクライアントについて秘密情報のプライバシーを維持し、一方、スパムフィルタ(808および/または812)をトレーニングするためにデータを連続的に提供することを容易にする。
上述のものなどユーザ妥当性の検査スキームもまた、各企業に、並びに、企業内の各ユーザに適用することができる。たとえば、ユーザは、個々に疑わしいユーザの分類がフィルタトレーニングから除外される交差検定技法にかけることができる。フィルタは、残りのユーザからのデータを使用してトレーニングすることができる。次いで、トレーニングされたフィルタが、除外されたユーザからのメッセージを調べ、そのメッセージをどのように分類しているか判定する。不一致の数が閾値レベルを超えた場合には、その疑わしいユーザは信頼できないものと考えられる。さらに、信頼できないユーザからのメッセージ分類は、データベースおよび/またはフィルタによって受け入れられる前に、手動で検査することができる。そうでない場合は、そのユーザを今後のポーリングから除去することができる。
次に、図9を参照すると、本発明の様々な態様を実施するための例示的な環境910は、コンピュータ912を含んでいる。コンピュータ912は、処理装置914、システムメモリ916、システムバス918を含む。システムバス918は、それだけには限らないが、システムメモリ916を含むシステム構成要素を処理装置914に結合する。処理装置914は、様々な使用可能なプロセッサのいずれかとすることができる。デュアルマイクロプロセッサおよび他のマルチプロセッサアーキテクチャもまた、処理装置914として使用することができる。
システムバス918は、メモリバスもしくはメモリコントローラ、周辺機器バスもしくは外部バス、および/または任意の様々な使用可能なバスアーキテクチャを使用するローカルバスを含めて、いくつかのタイプのバス構造のうち、いずれかとすることができ、バスアーキテクチャには、それだけには限らないが、11ビットバス、ISA、MSA、EISA(Extended ISA)、IDE、VESAローカルバス(VLB)、PCI、USB、AGP、PCMCIAバス、SCSIが含まれる。
システムメモリ916には、揮発性メモリ920および不揮発性メモリ922が含まれる。起動中などにコンピュータ912内の要素間で情報を転送するための基本ルーチンを含む基本入出力システム(BIOS)は、不揮発性メモリ922内に記憶される。限定ではなく例を挙げると、不揮発性メモリ922には、読出し専用メモリ(ROM)、プログラム可能なROM(PROM)、電気的プログラム可能なROM(EPROM)、電気的消去可能なROM(EEPROM)、またはフラッシュメモリが含まれる。揮発性メモリ920には、外部キャッシュメモリとして動作するランダムアクセスメモリ(RAM)が含まれる。限定ではなく例を挙げると、RAMは、シンクロナスRAM(SRAM)、ダイナミックRAM(DRAM)、シンクロナスDRAM(SDRAM)、ダブルデータレートSDRAM(DDR SDRAM)、ESDRAM(enhanced SDRAM)、SLDRAM(Synchlink DRAM)、ダイレクトラムバスRAM(DRRAM)など、多数の形態で使用可能である。
コンピュータ912はまた、取外し式/非取外し式、揮発性/不揮発性コンピュータ記憶媒体を含む。図9は、たとえば、ディスクストレージ924を示す。ディスクストレージ924には、それだけには限らないが、磁気ディスクドライブ、フロッピー(登録商標)ディスクドライブ、テープドライブ、Jazドライブ、Zipドライブ、LS−100ドライブ、フラッシュメモリカード、メモリースティックのようなデバイスが含まれる。さらに、ディスクストレージ924には、それだけには限らないが、コンパクトディスクROMデバイス(CD−ROM)、記録可能なCDドライブ(CD−Rドライブ)、再書込み可能なCDドライブ(CD−RWドライブ)、またはデジタル多用途ディスクROMドライブ(DVD−ROM)など光ディスクドライブを含めて、記憶媒体が別個に、または他の記憶媒体との組合せで含まれる可能性がある。ディスク記憶装置924の、システムバス918に対する接続を容易にするために、インターフェース926など取外し式または非取外し式インターフェースが一般に使用される。
図9は、ユーザと、好適な動作環境910に述べられている基本的なコンピュータ資源との間の媒介物として動作するソフトウェアについて述べていることを理解されたい。そのようなソフトウェアには、オペレーティングシステム928が含まれる。オペレーティングシステム928は、ディスクストレージ924に記憶することができ、コンピュータシステム912の資源を制御し、割り当てるように動作する。システムアプリケーション930は、システムメモリ916内またはディスクストレージ924に記憶されたプログラムモジュール932およびプログラムデータ934を介して、オペレーティングシステム928による資源の管理を利用する。本発明は、様々なオペレーティングシステムまたはオペレーティングシステムの組合せと共に実施することができることを理解されたい。
ユーザは、入力デバイス936を介してコンピュータ912にコマンドまたは情報を入力する。入力デバイス936には、それだけには限らないが、マウスなどポインティングデバイス、トラックボール、スタイラス、タッチパッド、キーボード、マイクロフォン、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナ、TV同調器カード、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどが含まれる。これら、および他の入力デバイスは、インターフェースポート938を介して、システムバス918を通じて処理装置914に接続する。インターフェースポート938には、たとえば、シリアルポート、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)が含まれる。出力デバイス940は、入力デバイス936と同じタイプのポートのいくつかを使用する。したがって、たとえばUSBポートは、コンピュータ912に入力を送るために、また、コンピュータ912から出力デバイス940に情報を出力するために使用することができる。出力アダプタ942は、出力デバイス940の中でも、特別なアダプタを必要とするモニタ、スピーカ、プリンタのようないくつかの出力デバイス940があることを示すために提供されている。限定ではなく例を挙げると、出力アダプタ942には、出力デバイス940とシステムバス918の間で接続手段を提供するビデオカードおよびサウンドカードが含まれる。他のデバイスおよび/またはデバイスのシステムは、リモートコンピュータ944など、入力機能と出力機能を共に提供することに留意されたい。
コンピュータ912は、リモートコンピュータ944など、1つまたは複数のリモートコンピュータに対する論理接続を使用してネットワーク環境内で動作することができる。リモートコンピュータ944は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ワークステーション、マイクロプロセッサをベースとする家電、ピアデバイスまたは他の共通ネットワークノードなどとすることができ、一般に、コンピュータ912に関して述べられている要素の多数または全部を含む。簡潔にするために、メモリ記憶装置946だけがリモートコンピュータ944と共に示されている。リモートコンピュータ944は、ネットワークインターフェース948を介してコンピュータ912に論理的に接続され、次いで、通信接続950を介して物理的に接続される。ネットワークインターフェース948は、ローカルエリアネットワーク(LAN)および広域ネットワーク(WAN)など、通信ネットワークを含む。LAN技術には、光ファイバ分散データインターフェース(FDDI)、より線FDDI(CDDI)、イーサネット(登録商標)/IEEE1102.3、トークンリング/IEEE1102.5などが含まれる。WAN技術には、それだけには限らないが、ポイント・トゥ・ポイント・リンク、ISDNとその変形形態のような回路交換ネットワーク、パケット交換ネットワーク、およびデジタル加入者回線(DSL)が含まれる。
通信接続950は、ネットワークインターフェース948をバス918に接続するために使用されるハードウェア/ソフトウェアを指す。通信接続950は、図が見やすいようにコンピュータ912の内側で示されているが、コンピュータ912の外側とすることもできる。例示する目的にすぎないが、ネットワークインターフェース948に対する接続に必要なハードウェア/ソフトウェアには、通常の電話級モデム、ケーブルモデムおよびDSLモデムを含むモデム、ISDNアダプタ、並びにイーサネット(登録商標)カードなど、内部技術および外部技術が含まれる。
図10は、本発明が相互作用することができるコンピューティング環境例1000の概略ブロック図である。システム1000は、1つまたは複数のクライアント1010を含む。クライアント1010は、ハードウェアおよび/またはソフトウェアとすることができる(たとえば、スレッド、プロセス、コンピューティングデバイス)。また、システム1000は、1つまたは複数のサーバ1030を含む。サーバ1030もまた、ハードウェアおよび/またはソフトウェアとすることができる(たとえば、スレッド、プロセス、コンピューティングデバイス)。サーバ1030は、たとえば、本発明を使用することによって変換を実行するためのスレッドを収容することができる。クライアント1010とサーバ1030の間の、1つの可能な通信は、2つ以上のコンピュータプロセス間で伝送されるように適合されたデータパケットの形態にあるものとすることができる。システム1000は、クライアント1010とサーバ1030の間の通信を容易にするために使用することができる通信フレームワーク1050を含む。クライアント1010は、クライアント1010のローカルな情報を記憶するために使用することができる1つまたは複数のクライアントデータストア1060に動作可能に接続される。同様に、サーバ1030は、サーバ1030のローカルな情報を記憶するために使用することができる1つまたは複数のサーバデータストア1040に動作可能に接続される。
上述したものには、本発明の諸例が含まれる。当然ながら、本発明について述べるために構成要素または方法の考えられるあらゆる組合せについて述べることは可能でなく、本発明に関する多数の他の組合せおよび変形が可能であることを、当業者なら理解することができる。したがって、本発明は、添付した特許請求の範囲の精神および範囲内に入るそのような変更、修正、並びに変形形態をすべて包含するものとする。さらに「includes(含む)」という用語が詳細な説明または特許請求の範囲で使用されている限り、そのような用語は、「comprising(含む、備える)」が特許請求の範囲内で移行句として使用されたとき解釈されるように「comprising」という用語と同様に包括的であるものとする。
本発明の一態様によるフィードバックループトレーニングシステムのブロック図である。 本発明の一態様による例示的なフィードバックループトレーニングプロセスの流れ図である。 本発明の一態様による、スパムフィルタを作成するためにユーザによるメール分類を容易にする例示的な方法の流れ図である。 本発明の一態様による、図2の方法に参加するユーザの交差検定を容易にする例示的な方法の流れ図である。 本発明の一態様による、ユーザが信頼できないかどうか判定することを容易にする例示的な方法の流れ図である。 本発明の一態様による、スパムを捕らえ、スパム発信元を決定するのを容易にする例示的な方法の流れ図である。 本発明の一態様による、クライアントをベースとするフィードバックループアーキテクチャのブロック図である。 本発明の一態様による、トレーニングデータを生成する1人または複数のユーザを有する、サーバをベースとするフィードバックループシステムのブロック図である。 本発明の一態様による、外部ユーザデータベースに記憶されたトレーニングデータを引き出すために、それ自体のデータベースを有する内部サーバをシステムが含む、組織横断サーバベースフィードバックループシステムのブロック図である。 本発明の様々な態様を実施するための例示的な環境を示す図である。 本発明による例示的な通信環境の概略ブロック図である。
符号の説明
14 受信者
610、712、815 LAN
700、800 フィードバックシステム

Claims (30)

  1. スパム防止に関連して、電子メール(eメール)およびメッセージの内の少なくとも1つから成るアイテムを分類することを容易にするシステムであって、
    1組の前記アイテムを受け取る構成要素と、
    前記アイテムの対象とする受信者を識別し、およびポーリングされる前記アイテムの部分集合にタグ付けをする構成要素であって、前記アイテムの部分集合は、スパムファイティングユーザと知られかつランダムに選択された、前記受信者の部分集合に対応し、ポーリングされる前記アイテムの部分集合は、前記アイテムがスパムまたは非スパムと分類される前に決定され、現在使用されているスパムフィルタによってスパムと指定されるアイテムを含んだ全てのアイテムに対してポーリングが考慮されるタグ付けをする構成要素と
    前記ポーリングされたアイテムの前記スパムファイティングユーザの分類に関する情報を受信し、スパムフィルタをトレーニングすることおよびスパムリストをポピュレートすることに関連して前記情報を使用する、機械学習法を採用したフィードバック構成要素と、
    ポーリングアイテムとして識別するため、ポーリングのためにタグ付けされたアイテムを修正する構成要素であって、前記修正されたアイテムは、投票指示ならびに少なくとも2つの投票ボタンおよび前記ユーザによって前記アイテムの分類を容易にする少なくとも2つのアイテムクラスにそれぞれ対応するリンクの内のいずれか1つを含み、前記投票ボタンは前記それぞれのリンクに対応しており、ユーザによって前記投票ボタンのいずれか一方が選択されるとき、前記投票ボタン、前記それぞれのユーザおよび割り当てられた固有のIDに関する情報が記憶データベースに送られる、修正する構成要素と
    を備えことを特徴とするシステム。
  2. 前記1組の前記アイテムを受信する構成要素は、電子メールサーバ、メッセージサーバおよびクライアント電子メールソフトウェアのうちいずれか1つであることを特徴とする請求項1に記載のシステム。
  3. 前記ポーリングされる前記アイテムの部分集合は、すべての受信された前記アイテムを含むことを特徴とする請求項1に記載のシステム。
  4. 前記受信者の部分集合は、すべての受信者を含むことを特徴とする請求項1に記載のシステム。
  5. 前記ポーリング用にタグ付けされた前記アイテムの部分集合は、
    ユーザ当たりに選択された前記アイテムの数と、
    ある時間当たりおよびユーザ当たりに選択される前記アイテムの数と、
    既知のユーザに対応するアイテムにタグ付けする確率と
    のうち少なくとも1つに基づいて限定されることを特徴とする請求項1に記載のシステム。
  6. 前記ポーリングアイテムは、前記タグ付けされたアイテムの要約を含んでおり、前記要約は、件名、日付、メッセージのテキストおよびテキストの最初の数行のうちの少なくとも1つを含むことを特徴とする請求項1に記載のシステム。
  7. 前記データベースは、ユーザプロパティ、タグ付けされたアイテムに関連付けられたアイテムコンテンツおよびプロパティ、ユーザ分類および投票統計データ、ユーザ当たりのポーリングおよびある時間当たりおよびユーザ当たりのポーリングの頻度分析データ、スパムリスト、正当なメールリスト、並びに、ブラックホールリストに関する情報並びにデータを記憶することを特徴とする請求項1に記載のシステム。
  8. 複数のスパムファイティング集団全体にわたって分布され、その結果、各集団からのフィードバックは、各集団と動作可能にインターフェースされた中央データベースに送信され、前記フィードバックの何らかの部分は、プライバシーの理由によって除去されることを特徴とする請求項1に記載のシステム。
  9. ユーザ信頼度および信頼性をテストするユーザ分類妥当性の検査構成要素をさらに備え、前記ユーザ分類妥当性の検査構成要素は、1つまたは複数の疑わしいユーザに適用できることを特徴とする請求項1に記載のシステム。
  10. 前記フィードバック構成要素は、ユーザフィードバック、ハニーポットフィードバックおよび、任意選択で、受信されたアイテムのユーザ受信者フィードバックに関する情報を受信することを特徴とする請求項に記載のシステム。
  11. 前記アイテムの対象とする受信者を識別し、およびポーリングされる前記アイテムの部分集合にタグ付けをする構成要素は、それぞれのユーザがその元の形態による前記メッセージの第1のコピーおよびポーリングのための形態による前記メッセージの第2のコピーを受信するように、元々受信された各タグ付けされたメッセージのコピーを作成することを特徴とする請求項1に記載のシステム。
  12. 電子メールサーバ、メッセージサーバおよびクライアント電子メールソフトウエアを実行するクライアントコンピュータを含む、着信メッセージを受信するコンピュータによって実行され、スパム防止に関連してメッセージを分類することを容易にする方法であって、前記コンピュータが、
    1組の前記メッセージを受け取るステップと、
    前記メッセージの対象の受信者を識別するステップと、
    既知のスパムファイティングユーザと知られかつランダムに選択された前記受信者の部分集合に対応する、ポーリングされる前記メッセージの部分集合にタグ付けをするステップであって、ポーリングされる前記メッセージの部分集合は、前記メッセージがスパムまたは非スパムと分類される前に決定され、現在使用されているスパムフィルタによってスパムと指定されるメッセージを含んだ全てのメッセージに対してポーリングが考慮されるステップと、
    前記ポーリングメッセージの前記スパムファイティングユーザの分類に関する情報を受信するステップと、
    スパムフィルタをトレーニングすることおよびスパムリストをポピュレートすることに関連して、前記情報を使用するステップであって、前記スパムフィルタをトレーニングすることは機械学習法を経由して使用されるステップと、
    ポーリングメッセージとして識別するため、ポーリングのためにタグ付けされたメッセージを修正するステップであって、前記修正されたメッセージは、投票指示ならびに少なくとも2つの投票ボタンおよび前記ユーザによって前記メッセージの分類を容易にする少なくとも2つのメッセージクラスにそれぞれ対応するリンクの内のいずれか1つを含み、前記投票ボタンは前記それぞれのリンクに対応しており、ユーザによって前記投票ボタンのいずれか一方が選択されるとき、前記投票ボタン、前記それぞれのユーザおよび割り当てられた固有のIDに関する情報が、前記コンピュータ内にまたは外部に備えられた記憶データベースに送られるステップと
    を備えることを特徴とする方法
  13. 既知のスパムファイティングユーザである前記受信者の部分集合は、
    新しいスパムフィルタをトレーニングするのを容易にするように、メッセージに対してフィードバックを提供するためにオプトインすることと、
    オプトアウトしないことによって、メッセージに対してフィードバックを提供するために消極的にオプトインすることと、
    参加しているメッセージサーバによって提供される電子メール/メッセージサービスに対して料金を支払うことと、
    参加しているメッセージサーバで電子メールアカウントを開くことと
    のうち少なくとも1つを実施する各受信者によって決定されることを特徴とする請求項12に記載の方法
  14. タグ付けされたメッセージを修正する前記ステップは、
    前記タグ付けされたメッセージを、ポーリングメッセージ用の別個のフォルダに移動することと、
    前記タグ付けされたメッセージの「from」アドレスを修正することと、
    前記タグ付けされたメッセージの件名行を修正することと、
    前記タグ付けされたメッセージ上のポーリングアイコンを使用し、それをポーリングメッセージとして識別することと、
    固有の色を使用し、前記タグ付けされたメッセージをポーリングメッセージとして識別することと
    のうち少なくとも1つを実施することを含むことを特徴とする請求項12に記載の方法
  15. それぞれのユーザがその元の形態による前記メッセージの第1のコピーおよびポーリングのための形態による前記メッセージの第2のコピーを受信するように、元々受信された各タグ付けされたメッセージのコピーを作成するステップをさらに備えることを特徴とする請求項12に記載の方法
  16. 前記トレーニングされたスパムフィルタを1つまたは複数のサーバに配布するステップをさらに備え、前記配布は、自動的に、および/または、電子メールメッセージおよびダウンロードするためのウェブサイト上のポスティングのうちの少なくとも1つによる要求によって行われることを特徴とする請求項12に記載の方法
  17. 前記スパムフィルタをトレーニングすることおよび前記スパムリストをポピュレートすることは、ユーザ分類フィードバックに基づくデータ、ならびに、任意選択で1つまたは複数の追加ソースによって生成されたデータを使用して機械学習法によって実施され、前記1つまたは複数のソースは、ハニーポット、受信者非ユーザ分類フィードバックおよび能動学習法を含むことを特徴とする請求項12に記載の方法
  18. 偏らないデータのサンプリングを得るのを容易にするために、データの前記1つまたは複数のソースによって生成されたデータは、前記ソースによって生成されたデータのタイプに対しておよび前記ユーザ分類データに対して比例して再重み付けされることを特徴とする請求項17に記載の方法。
  19. 着信メッセージのそれぞれの1つまたは複数の肯定的な特徴について前記着信メッセージを監視するステップと、
    受信された肯定的な特徴の頻度を決定するステップと、
    受信された1つまたは複数の肯定的な特徴が、少なくとも一部には履歴データに基づいて閾値頻度を超えているかどうか判定するステップと、
    疑わしいメッセージがスパムであるかどうか判定するために他の分類データが使用可能になるまで、前記閾値頻度を超える前記1つまたは複数の肯定的な特徴に対応する疑わしいメッセージを隔離するステップと
    をさらに備えることを特徴とする請求項12に記載の方法。
  20. 使用された前記特徴は、前記送信側のIPアドレスおよびドメインのうち少なくとも1つを含む前記送信側についての情報であることを特徴とする請求項19に記載の方法。
  21. 疑わしいメッセージを隔離する前記ステップは、
    暫定的にスパムとして前記疑わしいメッセージに標識を付け、それらをスパムフォルダに移動する動作と、
    他の分類データが使用可能になるまで、前記疑わしいメッセージを前記ユーザに送達することを遅らせる動作と、
    前記疑わしいメッセージを、前記ユーザには見えないフォルダに保存する動作と
    のうち少なくとも1つによって実施されることを特徴とする請求項19に記載の方法。
  22. 前記スパムフィルタの最適化を容易にするために、前記スパムフィルタのフォールスポジティブ/捕捉率を決定するステップをさらに備え、前記フォールスポジティブ/捕捉率を決定するステップは、
    ポーリング結果の第1の集合を含むトレーニングデータ集合を使用して、前記スパムフィルタをトレーニングすることと、
    ユーザフィードバックを使用してポーリングメッセージの第2の集合を分類し、ポーリング結果の第2の集合を生み出すことと、
    前記ポーリングメッセージの第2の集合を、前記トレーニングされたスパムフィルタに通すことと、
    前記ポーリング結果の第2の集合を前記トレーニングされたスパムフィルタ結果に比較して、前記フィルタのフォールスポジティブ/捕捉率を決定し、それによって、最適なフィルタ性能に従ってフィルタパラメータを評価および調整することと
    を含むことを特徴とする請求項12に記載の方法。
  23. 各々が様々なパラメータを有し、各々が前記同じトレーニングデータセット上でトレーニングされる複数のスパムフィルタが構築され、その結果、スパムフィルタリング用の最適なパラメータを決定するために、各スパムフィルタの前記フォールスポジティブ/捕捉率が、少なくとも1つの他のスパムフィルタと比較されることを特徴とする請求項22に記載の方法。
  24. 着信メッセージの追加の組を使用して、改善されたスパムフィルタを構築するステップであって、前記着信メッセージの部分集合は、前記改善されたスパムフィルタをトレーニングすることに関連して新しい情報を生み出すためにポーリングを受け、少なくとも一部には先に得られた情報がどれだけ過去に得られたかに基づいて、前記先に得られた情報が再重み付けされるステップをさらに備えることを特徴とする請求項12に記載の方法。
  25. 正当な送信側リストを構築するために、前記情報を使用するステップをさらに備えることを特徴とする請求項12に記載の方法。
  26. スパム送信者のアカウントを終了させるのを容易にするために、前記情報を使用するステップをさらに備えることを特徴とする請求項12に記載の方法。
  27. ISPを使用しているスパム送信者を識別するステップ、および、前記スパミングについて前記ISPに自動的に通知するステップをさらに備えることを特徴とする請求項26に記載の方法。
  28. スパムを送信する責任を負うドメインを識別するステップ、および、前記スパミングについて、前記ドメインの電子メールプロバイダの少なくとも1つに自動的に通知するステップとをさらに備えることを特徴とする請求項26に記載の方法。
  29. 前記スパムフィルタおよび前記スパムリストのうち少なくとも1つを、メールサーバ、電子メールサーバ、および、クライアント電子メールソフトウェアのうちいずれか1つに配布するステップをさらに備え、前記配布するステップは、
    ウェブサイト上で通知を掲示し、前記スパムフィルタおよびスパムリストがダウンロードのために使用可能であることを通知することと、
    前記スパムフィルタおよびスパムリストを、メールサーバ、電子メールサーバ、および、クライアント電子メールソフトウェアに自動的に送り出すことと、
    前記スパムフィルタおよびスパムリストを、メールサーバ、電子メールサーバ、および、クライアント電子メールソフトウェアに手動で送り出すことと
    のうち少なくとも1つを含むことを特徴とする請求項12に記載の方法。
  30. 請求項12乃至29いずれかに記載の方法をコンピュータに実行させるためのコンピュータ実行命令を記憶したコンピュータ読取り可能記憶媒体
JP2006508818A 2003-03-03 2004-02-25 スパム防止のためのフィードバックループ Expired - Fee Related JP4828411B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/378,463 US7219148B2 (en) 2003-03-03 2003-03-03 Feedback loop for spam prevention
US10/378,463 2003-03-03
PCT/US2004/005501 WO2004079514A2 (en) 2003-03-03 2004-02-25 Feedback loop for spam prevention

Publications (3)

Publication Number Publication Date
JP2006521635A JP2006521635A (ja) 2006-09-21
JP2006521635A5 JP2006521635A5 (ja) 2010-04-22
JP4828411B2 true JP4828411B2 (ja) 2011-11-30

Family

ID=32926496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006508818A Expired - Fee Related JP4828411B2 (ja) 2003-03-03 2004-02-25 スパム防止のためのフィードバックループ

Country Status (18)

Country Link
US (2) US7219148B2 (ja)
EP (1) EP1599781A4 (ja)
JP (1) JP4828411B2 (ja)
KR (1) KR101021395B1 (ja)
CN (1) CN100472484C (ja)
AU (1) AU2004216772B2 (ja)
BR (1) BRPI0407045A (ja)
CA (2) CA2513967C (ja)
CO (1) CO6141494A2 (ja)
EG (1) EG23988A (ja)
IL (2) IL170115A (ja)
MX (1) MXPA05008303A (ja)
NO (1) NO20053733L (ja)
NZ (1) NZ541628A (ja)
RU (1) RU2331913C2 (ja)
TW (2) TWI331869B (ja)
WO (1) WO2004079514A2 (ja)
ZA (1) ZA200506085B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10061989B2 (en) 2015-03-30 2018-08-28 Nec Corporation Information transfer apparatus and method for image recognition

Families Citing this family (292)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097654A1 (en) * 1998-06-05 2003-05-22 Franken Kenneth A. System and method of geographic authorization for television and radio programming distributed by multiple delivery mechanisms
US6252547B1 (en) 1998-06-05 2001-06-26 Decisionmark Corp. Method and apparatus for limiting access to signals delivered via the internet
US9928508B2 (en) 2000-08-04 2018-03-27 Intellectual Ventures I Llc Single sign-on for access to a central data repository
US8566248B1 (en) 2000-08-04 2013-10-22 Grdn. Net Solutions, Llc Initiation of an information transaction over a network via a wireless device
US7257581B1 (en) 2000-08-04 2007-08-14 Guardian Networks, Llc Storage, management and distribution of consumer information
US8010981B2 (en) 2001-02-08 2011-08-30 Decisionmark Corp. Method and system for creating television programming guide
US7640305B1 (en) 2001-06-14 2009-12-29 Apple Inc. Filtering of data
US7849141B1 (en) * 2001-06-14 2010-12-07 Apple Inc. Training a computer storage system for automatic filing of data using graphical representations of storage locations
US7913287B1 (en) 2001-06-15 2011-03-22 Decisionmark Corp. System and method for delivering data over an HDTV digital television spectrum
JP2003333096A (ja) * 2002-05-08 2003-11-21 Nec Corp メール着信拒否システム,メール着信拒否方法およびメール着信拒否プログラム
WO2003104947A2 (en) 2002-06-06 2003-12-18 Hardt Dick C Distributed hierarchical identity management
AU2003248736A1 (en) * 2002-06-25 2004-01-06 Abs Software Partners Llc System and method for online monitoring of and interaction with chat and instant messaging participants
US8046832B2 (en) * 2002-06-26 2011-10-25 Microsoft Corporation Spam detector with challenges
US7590696B1 (en) 2002-11-18 2009-09-15 Aol Llc Enhanced buddy list using mobile device identifiers
US7428580B2 (en) 2003-11-26 2008-09-23 Aol Llc Electronic message forwarding
WO2004077710A2 (en) * 2003-02-27 2004-09-10 Businger, Peter, A. Minimizing unsolicited e-mail based on prior communications
US7219148B2 (en) * 2003-03-03 2007-05-15 Microsoft Corporation Feedback loop for spam prevention
US7543053B2 (en) 2003-03-03 2009-06-02 Microsoft Corporation Intelligent quarantining for spam prevention
US20050091320A1 (en) * 2003-10-09 2005-04-28 Kirsch Steven T. Method and system for categorizing and processing e-mails
US20060168006A1 (en) * 2003-03-24 2006-07-27 Mr. Marvin Shannon System and method for the classification of electronic communication
US7680886B1 (en) * 2003-04-09 2010-03-16 Symantec Corporation Suppressing spam using a machine learning based spam filter
US7546348B2 (en) * 2003-05-05 2009-06-09 Sonicwall, Inc. Message handling with selective user participation
US20050132197A1 (en) * 2003-05-15 2005-06-16 Art Medlar Method and apparatus for a character-based comparison of documents
US7484096B1 (en) 2003-05-28 2009-01-27 Microsoft Corporation Data validation using signatures and sampling
US7457791B1 (en) * 2003-05-30 2008-11-25 Microsoft Corporation Using invariants to validate applications states
US7272853B2 (en) * 2003-06-04 2007-09-18 Microsoft Corporation Origination/destination features and lists for spam prevention
US20040254988A1 (en) * 2003-06-12 2004-12-16 Rodriguez Rafael A. Method of and universal apparatus and module for automatically managing electronic communications, such as e-mail and the like, to enable integrity assurance thereof and real-time compliance with pre-established regulatory requirements as promulgated in government and other compliance database files and information websites, and the like
US7376652B2 (en) * 2003-06-17 2008-05-20 The Hayes-Roth Family Trust Personal portal and secure information exchange
US7882179B2 (en) * 2003-06-20 2011-02-01 Compuware Corporation Computer system tools and method for development and testing
US7711779B2 (en) 2003-06-20 2010-05-04 Microsoft Corporation Prevention of outgoing spam
US7519668B2 (en) * 2003-06-20 2009-04-14 Microsoft Corporation Obfuscation of spam filter
US8533270B2 (en) * 2003-06-23 2013-09-10 Microsoft Corporation Advanced spam detection techniques
US7051077B2 (en) * 2003-06-30 2006-05-23 Mx Logic, Inc. Fuzzy logic voting method and system for classifying e-mail using inputs from multiple spam classifiers
US20050015626A1 (en) * 2003-07-15 2005-01-20 Chasin C. Scott System and method for identifying and filtering junk e-mail messages or spam based on URL content
US20050015455A1 (en) * 2003-07-18 2005-01-20 Liu Gary G. SPAM processing system and methods including shared information among plural SPAM filters
US8214437B1 (en) 2003-07-21 2012-07-03 Aol Inc. Online adaptive filtering of messages
US7653693B2 (en) * 2003-09-05 2010-01-26 Aol Llc Method and system for capturing instant messages
US7814545B2 (en) * 2003-07-22 2010-10-12 Sonicwall, Inc. Message classification using classifiers
GB2405229B (en) * 2003-08-19 2006-01-11 Sophos Plc Method and apparatus for filtering electronic mail
US20050065906A1 (en) * 2003-08-19 2005-03-24 Wizaz K.K. Method and apparatus for providing feedback for email filtering
US8200761B1 (en) 2003-09-18 2012-06-12 Apple Inc. Method and apparatus for improving security in a data processing system
US9338026B2 (en) * 2003-09-22 2016-05-10 Axway Inc. Delay technique in e-mail filtering system
US7840646B2 (en) * 2003-10-08 2010-11-23 Yahoo! Inc. Learned upload time estimate module
US7181498B2 (en) * 2003-10-31 2007-02-20 Yahoo! Inc. Community-based green list for antispam
US7373385B2 (en) * 2003-11-03 2008-05-13 Cloudmark, Inc. Method and apparatus to block spam based on spam reports from a community of users
US7181764B2 (en) * 2003-11-04 2007-02-20 Yahoo! Inc. System and method for a subscription model trusted email database for use in antispam
US20050102638A1 (en) * 2003-11-10 2005-05-12 Jiang Zhaowei C. Navigate, click and drag images in mobile applications
US7797529B2 (en) * 2003-11-10 2010-09-14 Yahoo! Inc. Upload security scheme
WO2005048544A1 (en) * 2003-11-17 2005-05-26 Hardt Dick C Method and system for pseudonymous email address
US20050120019A1 (en) * 2003-11-29 2005-06-02 International Business Machines Corporation Method and apparatus for the automatic identification of unsolicited e-mail messages (SPAM)
US20050120118A1 (en) * 2003-12-01 2005-06-02 Thibadeau Robert H. Novel network server for electronic mail filter benchmarking
US20050160144A1 (en) * 2003-12-24 2005-07-21 Rishi Bhatia System and method for filtering network messages
JP4386261B2 (ja) * 2004-01-15 2009-12-16 株式会社エヌ・ティ・ティ・ドコモ 移動通信端末及び課金制御装置
US7590694B2 (en) * 2004-01-16 2009-09-15 Gozoom.Com, Inc. System for determining degrees of similarity in email message information
US7693943B2 (en) * 2004-01-23 2010-04-06 International Business Machines Corporation Classification of electronic mail into multiple directories based upon their spam-like properties
CA2554915C (en) * 2004-02-17 2013-05-28 Ironport Systems, Inc. Collecting, aggregating, and managing information relating to electronic messages
US10257164B2 (en) 2004-02-27 2019-04-09 International Business Machines Corporation Classifying e-mail connections for policy enforcement
US8214438B2 (en) * 2004-03-01 2012-07-03 Microsoft Corporation (More) advanced spam detection features
US20050198508A1 (en) * 2004-03-04 2005-09-08 Beck Stephen H. Method and system for transmission and processing of authenticated electronic mail
US8918466B2 (en) * 2004-03-09 2014-12-23 Tonny Yu System for email processing and analysis
US7631044B2 (en) 2004-03-09 2009-12-08 Gozoom.Com, Inc. Suppression of undesirable network messages
US7644127B2 (en) * 2004-03-09 2010-01-05 Gozoom.Com, Inc. Email analysis using fuzzy matching of text
US20050223074A1 (en) * 2004-03-31 2005-10-06 Morris Robert P System and method for providing user selectable electronic message action choices and processing
US7913302B2 (en) 2004-05-02 2011-03-22 Markmonitor, Inc. Advanced responses to online fraud
US7992204B2 (en) * 2004-05-02 2011-08-02 Markmonitor, Inc. Enhanced responses to online fraud
US7457823B2 (en) 2004-05-02 2008-11-25 Markmonitor Inc. Methods and systems for analyzing data related to possible online fraud
US7870608B2 (en) 2004-05-02 2011-01-11 Markmonitor, Inc. Early detection and monitoring of online fraud
US9203648B2 (en) 2004-05-02 2015-12-01 Thomson Reuters Global Resources Online fraud solution
US8769671B2 (en) 2004-05-02 2014-07-01 Markmonitor Inc. Online fraud solution
US8041769B2 (en) * 2004-05-02 2011-10-18 Markmonitor Inc. Generating phish messages
US7912905B2 (en) * 2004-05-18 2011-03-22 Computer Associates Think, Inc. System and method for filtering network messages
US8037144B2 (en) * 2004-05-25 2011-10-11 Google Inc. Electronic message source reputation information system
US7461063B1 (en) * 2004-05-26 2008-12-02 Proofpoint, Inc. Updating logistic regression models using coherent gradient
US7552365B1 (en) * 2004-05-26 2009-06-23 Amazon Technologies, Inc. Web site system with automated processes for detecting failure events and for selecting failure events for which to request user feedback
US7756930B2 (en) * 2004-05-28 2010-07-13 Ironport Systems, Inc. Techniques for determining the reputation of a message sender
US7917588B2 (en) 2004-05-29 2011-03-29 Ironport Systems, Inc. Managing delivery of electronic messages using bounce profiles
US8527752B2 (en) 2004-06-16 2013-09-03 Dormarke Assets Limited Liability Graduated authentication in an identity management system
US8504704B2 (en) 2004-06-16 2013-08-06 Dormarke Assets Limited Liability Company Distributed contact information management
US7748038B2 (en) * 2004-06-16 2010-06-29 Ironport Systems, Inc. Method and apparatus for managing computer virus outbreaks
US9245266B2 (en) 2004-06-16 2016-01-26 Callahan Cellular L.L.C. Auditable privacy policies in a distributed hierarchical identity management system
US7565445B2 (en) 2004-06-18 2009-07-21 Fortinet, Inc. Systems and methods for categorizing network traffic content
US8353028B2 (en) * 2004-06-21 2013-01-08 Ebay Inc. Render engine, and method of using the same, to verify data for access and/or publication via a computer system
US8484295B2 (en) 2004-12-21 2013-07-09 Mcafee, Inc. Subscriber reputation filtering method for analyzing subscriber activity and detecting account misuse
US7953814B1 (en) * 2005-02-28 2011-05-31 Mcafee, Inc. Stopping and remediating outbound messaging abuse
US7680890B1 (en) 2004-06-22 2010-03-16 Wei Lin Fuzzy logic voting method and system for classifying e-mail using inputs from multiple spam classifiers
US7552186B2 (en) * 2004-06-28 2009-06-23 International Business Machines Corporation Method and system for filtering spam using an adjustable reliability value
US7664819B2 (en) * 2004-06-29 2010-02-16 Microsoft Corporation Incremental anti-spam lookup and update service
US8819142B1 (en) * 2004-06-30 2014-08-26 Google Inc. Method for reclassifying a spam-filtered email message
US7904517B2 (en) 2004-08-09 2011-03-08 Microsoft Corporation Challenge response systems
US7660865B2 (en) 2004-08-12 2010-02-09 Microsoft Corporation Spam filtering with probabilistic secure hashes
FI20041159A0 (fi) * 2004-09-07 2004-09-07 Nokia Corp Menetelmä viestien suodattamiseksi tietoverkossa
US7555524B1 (en) * 2004-09-16 2009-06-30 Symantec Corporation Bulk electronic message detection by header similarity analysis
US8180834B2 (en) * 2004-10-07 2012-05-15 Computer Associates Think, Inc. System, method, and computer program product for filtering messages and training a classification module
US7849506B1 (en) * 2004-10-12 2010-12-07 Avaya Inc. Switching device, method, and computer program for efficient intrusion detection
US8433768B1 (en) * 2004-10-14 2013-04-30 Lockheed Martin Corporation Embedded model interaction within attack projection framework of information system
US7711781B2 (en) * 2004-11-09 2010-05-04 International Business Machines Corporation Technique for detecting and blocking unwanted instant messages
US20060112430A1 (en) * 2004-11-19 2006-05-25 Deisenroth Jerrold M Method and apparatus for immunizing data in computer systems from corruption
EP1828919A2 (en) * 2004-11-30 2007-09-05 Sensoy Networks Inc. Apparatus and method for acceleration of security applications through pre-filtering
US20060123478A1 (en) * 2004-12-02 2006-06-08 Microsoft Corporation Phishing detection, prevention, and notification
US7634810B2 (en) * 2004-12-02 2009-12-15 Microsoft Corporation Phishing detection, prevention, and notification
US8291065B2 (en) * 2004-12-02 2012-10-16 Microsoft Corporation Phishing detection, prevention, and notification
US7653812B2 (en) * 2004-12-09 2010-01-26 Microsoft Corporation Method and system for evaluating confidence in a sending domain to accurately assign a trust that a communication is not unwanted
US7577984B2 (en) * 2004-12-09 2009-08-18 Microsoft Corporation Method and system for a sending domain to establish a trust that its senders communications are not unwanted
EP1672936B1 (en) * 2004-12-16 2018-12-05 Sony Mobile Communications Inc. Prevention of unsolicited messages
US9160755B2 (en) 2004-12-21 2015-10-13 Mcafee, Inc. Trusted communication network
US8738708B2 (en) * 2004-12-21 2014-05-27 Mcafee, Inc. Bounce management in a trusted communication network
US8396927B2 (en) * 2004-12-21 2013-03-12 Alcatel Lucent Detection of unwanted messages (spam)
US9015472B1 (en) 2005-03-10 2015-04-21 Mcafee, Inc. Marking electronic messages to indicate human origination
US20060168030A1 (en) * 2004-12-21 2006-07-27 Lucent Technologies, Inc. Anti-spam service
US7716743B2 (en) * 2005-01-14 2010-05-11 Microsoft Corporation Privacy friendly malware quarantines
US8087068B1 (en) 2005-03-08 2011-12-27 Google Inc. Verifying access to a network account over multiple user communication portals based on security criteria
US8103868B2 (en) * 2005-04-20 2012-01-24 M-Qube, Inc. Sender identification system and method
EP1877905B1 (en) * 2005-05-05 2014-10-22 Cisco IronPort Systems LLC Identifying threats in electronic messages
JP4559295B2 (ja) * 2005-05-17 2010-10-06 株式会社エヌ・ティ・ティ・ドコモ データ通信システム及びデータ通信方法
US7600126B2 (en) * 2005-05-27 2009-10-06 Microsoft Corporation Efficient processing of time-bounded messages
US20060277259A1 (en) * 2005-06-07 2006-12-07 Microsoft Corporation Distributed sender reputations
US7552230B2 (en) * 2005-06-15 2009-06-23 International Business Machines Corporation Method and apparatus for reducing spam on peer-to-peer networks
US7823200B2 (en) * 2005-07-01 2010-10-26 Symantec Corporation Methods and systems for detecting and preventing the spread of malware on instant messaging (IM) networks by analyzing message traffic patterns
US7577993B2 (en) * 2005-07-01 2009-08-18 Symantec Corporation Methods and systems for detecting and preventing the spread of malware on instant messaging (IM) networks by using Bayesian filtering
US7822818B2 (en) * 2005-07-01 2010-10-26 Symantec Corporation Methods and systems for detecting and preventing the spread of malware on instant messaging (IM) networks by using automated IM users
US7600258B2 (en) * 2005-07-01 2009-10-06 Symantec Corporation Methods and systems for detecting and preventing the spread of malware on instant messaging (IM) networks by using fictitious buddies
US7610345B2 (en) 2005-07-28 2009-10-27 Vaporstream Incorporated Reduced traceability electronic message system and method
US9282081B2 (en) 2005-07-28 2016-03-08 Vaporstream Incorporated Reduced traceability electronic message system and method
US7930353B2 (en) * 2005-07-29 2011-04-19 Microsoft Corporation Trees of classifiers for detecting email spam
US20070124582A1 (en) * 2005-08-07 2007-05-31 Marvin Shannon System and Method for an NSP or ISP to Detect Malware in its Network Traffic
US7577994B1 (en) * 2005-08-25 2009-08-18 Symantec Corporation Detecting local graphic password deciphering attacks
US20070061402A1 (en) * 2005-09-15 2007-03-15 Microsoft Corporation Multipurpose internet mail extension (MIME) analysis
CN100490426C (zh) * 2005-09-27 2009-05-20 腾讯科技(深圳)有限公司 一种反垃圾邮件的方法和系统
WO2007045150A1 (fr) * 2005-10-15 2007-04-26 Huawei Technologies Co., Ltd. Procede et systeme de controle de la securite d'un reseau
CN1852268B (zh) * 2005-10-19 2012-02-29 华为技术有限公司 防垃圾邮件方法及系统
CN100459798C (zh) * 2005-10-15 2009-02-04 华为技术有限公司 一种向移动终端提供安全服务的方法及系统
US8065370B2 (en) 2005-11-03 2011-11-22 Microsoft Corporation Proofs to filter spam
US20070106734A1 (en) * 2005-11-10 2007-05-10 Motorola, Inc. Incentive driven subscriber assisted spam reduction
US8713122B2 (en) * 2005-11-10 2014-04-29 International Business Machines Corporation Message value indicator
US20070136428A1 (en) * 2005-12-08 2007-06-14 International Business Machines Corporation Methods, systems, and computer program products for implementing community messaging services
US7565366B2 (en) * 2005-12-14 2009-07-21 Microsoft Corporation Variable rate sampling for sequence analysis
US20070180031A1 (en) * 2006-01-30 2007-08-02 Microsoft Corporation Email Opt-out Enforcement
US20070192490A1 (en) * 2006-02-13 2007-08-16 Minhas Sandip S Content-based filtering of electronic messages
US8291066B2 (en) * 2006-02-21 2012-10-16 Trading Systems Associates (Ts-A) (Israel) Limited Method and system for transaction monitoring in a communication network
ES2345996T3 (es) * 2006-03-06 2010-10-07 Alcatel Lucent Control de condicion para la transmision de mensajes.
US7685271B1 (en) * 2006-03-30 2010-03-23 Symantec Corporation Distributed platform for testing filtering rules
US20070256133A1 (en) * 2006-04-27 2007-11-01 Garbow Zachary A Blocking processes from executing based on votes
US7680891B1 (en) 2006-06-19 2010-03-16 Google Inc. CAPTCHA-based spam control for content creation systems
US8023927B1 (en) 2006-06-29 2011-09-20 Google Inc. Abuse-resistant method of registering user accounts with an online service
US20080077704A1 (en) * 2006-09-24 2008-03-27 Void Communications, Inc. Variable Electronic Communication Ping Time System and Method
US7945627B1 (en) 2006-09-28 2011-05-17 Bitdefender IPR Management Ltd. Layout-based electronic communication filtering systems and methods
US8224905B2 (en) 2006-12-06 2012-07-17 Microsoft Corporation Spam filtration utilizing sender activity data
US8290203B1 (en) * 2007-01-11 2012-10-16 Proofpoint, Inc. Apparatus and method for detecting images within spam
US8510467B2 (en) * 2007-01-11 2013-08-13 Ept Innovation Monitoring a message associated with an action
US8364617B2 (en) * 2007-01-19 2013-01-29 Microsoft Corporation Resilient classification of data
US8209381B2 (en) * 2007-01-19 2012-06-26 Yahoo! Inc. Dynamic combatting of SPAM and phishing attacks
US7873583B2 (en) * 2007-01-19 2011-01-18 Microsoft Corporation Combining resilient classifiers
US20080177843A1 (en) * 2007-01-22 2008-07-24 Microsoft Corporation Inferring email action based on user input
WO2008101165A2 (en) * 2007-02-15 2008-08-21 Void Communications, Inc. Electronic messaging recordlessness warning and routing system and method
US8006191B1 (en) 2007-03-21 2011-08-23 Google Inc. Chat room with thin walls
US8015246B1 (en) 2007-03-21 2011-09-06 Google Inc. Graphical user interface for chat room with thin walls
US7899869B1 (en) 2007-03-22 2011-03-01 Google Inc. Broadcasting in chat system without topic-specific rooms
US7904500B1 (en) 2007-03-22 2011-03-08 Google Inc. Advertising in chat system without topic-specific rooms
US7860928B1 (en) * 2007-03-22 2010-12-28 Google Inc. Voting in chat system without topic-specific rooms
US7865553B1 (en) * 2007-03-22 2011-01-04 Google Inc. Chat system without topic-specific rooms
US7853589B2 (en) * 2007-04-30 2010-12-14 Microsoft Corporation Web spam page classification using query-dependent data
US20080313285A1 (en) * 2007-06-14 2008-12-18 Microsoft Corporation Post transit spam filtering
US20090006532A1 (en) * 2007-06-28 2009-01-01 Yahoo! Inc. Dynamic phishing protection in instant messaging
US8239460B2 (en) * 2007-06-29 2012-08-07 Microsoft Corporation Content-based tagging of RSS feeds and E-mail
US20090012965A1 (en) * 2007-07-01 2009-01-08 Decisionmark Corp. Network Content Objection Handling System and Method
US20090006211A1 (en) * 2007-07-01 2009-01-01 Decisionmark Corp. Network Content And Advertisement Distribution System and Method
US7937468B2 (en) * 2007-07-06 2011-05-03 Yahoo! Inc. Detecting spam messages using rapid sender reputation feedback analysis
US8849909B2 (en) * 2007-07-06 2014-09-30 Yahoo! Inc. Real-time asynchronous event aggregation systems
US8689330B2 (en) * 2007-09-05 2014-04-01 Yahoo! Inc. Instant messaging malware protection
US9363231B2 (en) * 2007-09-13 2016-06-07 Caterpillar Inc. System and method for monitoring network communications originating in monitored jurisdictions
US8230025B2 (en) * 2007-09-20 2012-07-24 Research In Motion Limited System and method for delivering variable size messages based on spam probability
US8572184B1 (en) 2007-10-04 2013-10-29 Bitdefender IPR Management Ltd. Systems and methods for dynamically integrating heterogeneous anti-spam filters
US8428367B2 (en) * 2007-10-26 2013-04-23 International Business Machines Corporation System and method for electronic document classification
US8010614B1 (en) 2007-11-01 2011-08-30 Bitdefender IPR Management Ltd. Systems and methods for generating signatures for electronic communication classification
US8171388B2 (en) * 2007-11-15 2012-05-01 Yahoo! Inc. Trust based moderation
US8239537B2 (en) 2008-01-02 2012-08-07 At&T Intellectual Property I, L.P. Method of throttling unwanted network traffic on a server
WO2009102117A2 (en) * 2008-02-14 2009-08-20 Lg Electronics Inc. Terminal, server and method for determining and processing contents as spams
US7849146B2 (en) * 2008-02-21 2010-12-07 Yahoo! Inc. Identifying IP addresses for spammers
US8401968B1 (en) * 2008-03-27 2013-03-19 Amazon Technologies, Inc. Mobile group payments
US20090282112A1 (en) * 2008-05-12 2009-11-12 Cloudmark, Inc. Spam identification system
US8108323B2 (en) * 2008-05-19 2012-01-31 Yahoo! Inc. Distributed spam filtering utilizing a plurality of global classifiers and a local classifier
US8131655B1 (en) 2008-05-30 2012-03-06 Bitdefender IPR Management Ltd. Spam filtering using feature relevance assignment in neural networks
WO2010008825A1 (en) * 2008-06-23 2010-01-21 Cloudmark, Inc. Systems and methods for re-evaluating data
CN101616101B (zh) 2008-06-26 2012-01-18 阿里巴巴集团控股有限公司 一种用户信息过滤方法及装置
US8490185B2 (en) * 2008-06-27 2013-07-16 Microsoft Corporation Dynamic spam view settings
US8825769B2 (en) * 2008-06-30 2014-09-02 Aol Inc. Systems and methods for reporter-based filtering of electronic communications and messages
US8181250B2 (en) * 2008-06-30 2012-05-15 Microsoft Corporation Personalized honeypot for detecting information leaks and security breaches
CN101330476B (zh) * 2008-07-02 2011-04-13 北京大学 一种垃圾邮件动态检测方法
CN101321365B (zh) * 2008-07-17 2011-12-28 浙江大学 一种利用短信回复频率的垃圾短信发送用户识别方法
US8291024B1 (en) * 2008-07-31 2012-10-16 Trend Micro Incorporated Statistical spamming behavior analysis on mail clusters
US10354229B2 (en) 2008-08-04 2019-07-16 Mcafee, Llc Method and system for centralized contact management
US8069128B2 (en) * 2008-08-08 2011-11-29 Yahoo! Inc. Real-time ad-hoc spam filtering of email
US8826450B2 (en) 2008-09-19 2014-09-02 Yahoo! Inc. Detecting bulk fraudulent registration of email accounts
WO2010033784A2 (en) * 2008-09-19 2010-03-25 Mailrank, Inc. Ranking messages in an electronic messaging environment
US8069210B2 (en) * 2008-10-10 2011-11-29 Microsoft Corporation Graph based bot-user detection
US8365267B2 (en) * 2008-11-13 2013-01-29 Yahoo! Inc. Single use web based passwords for network login
CN101415159B (zh) * 2008-12-02 2010-06-02 腾讯科技(深圳)有限公司 对垃圾邮件进行拦截的方法和装置
US8364766B2 (en) * 2008-12-04 2013-01-29 Yahoo! Inc. Spam filtering based on statistics and token frequency modeling
US8886728B2 (en) * 2008-12-12 2014-11-11 At&T Intellectual Property I, L.P. Method and apparatus for reclassifying e-mail or modifying a spam filter based on users' input
US20100161537A1 (en) * 2008-12-23 2010-06-24 At&T Intellectual Property I, L.P. System and Method for Detecting Email Spammers
US8195753B2 (en) * 2009-01-07 2012-06-05 Microsoft Corporation Honoring user preferences in email systems
US8255468B2 (en) * 2009-02-11 2012-08-28 Microsoft Corporation Email management based on user behavior
US20100211641A1 (en) * 2009-02-16 2010-08-19 Microsoft Corporation Personalized email filtering
US20100211645A1 (en) * 2009-02-18 2010-08-19 Yahoo! Inc. Identification of a trusted message sender with traceable receipts
US8443447B1 (en) * 2009-08-06 2013-05-14 Trend Micro Incorporated Apparatus and method for detecting malware-infected electronic mail
US8874663B2 (en) * 2009-08-28 2014-10-28 Facebook, Inc. Comparing similarity between documents for filtering unwanted documents
CN101656923B (zh) * 2009-09-15 2012-09-05 中兴通讯股份有限公司 判断垃圾消息的方法和系统
EP2348424A1 (en) 2009-12-21 2011-07-27 Thomson Licensing Method for recommending content items to users
US8370902B2 (en) * 2010-01-29 2013-02-05 Microsoft Corporation Rescuing trusted nodes from filtering of untrusted network entities
US9098459B2 (en) * 2010-01-29 2015-08-04 Microsoft Technology Licensing, Llc Activity filtering based on trust ratings of network
US8959159B2 (en) 2010-04-01 2015-02-17 Microsoft Corporation Personalized email interactions applied to global filtering
SG177015A1 (en) * 2010-06-07 2012-01-30 Boxsentry Pte Ltd In situ correction of false-positive errors in messaging security systems (lagotto)
US8639773B2 (en) * 2010-06-17 2014-01-28 Microsoft Corporation Discrepancy detection for web crawling
US8635289B2 (en) 2010-08-31 2014-01-21 Microsoft Corporation Adaptive electronic message scanning
US8464342B2 (en) * 2010-08-31 2013-06-11 Microsoft Corporation Adaptively selecting electronic message scanning rules
US10574630B2 (en) * 2011-02-15 2020-02-25 Webroot Inc. Methods and apparatus for malware threat research
CN102760130B (zh) * 2011-04-27 2016-11-16 腾讯科技(深圳)有限公司 处理信息的方法和装置
WO2013050837A1 (en) * 2011-05-06 2013-04-11 Quojax Corp. System and method for giving users control of information flow
RU2472308C1 (ru) * 2011-05-19 2013-01-10 Владимир Алексеевич Небольсин Предотвращение несанкционированной массовой рассылки электронной почты
US9519682B1 (en) 2011-05-26 2016-12-13 Yahoo! Inc. User trustworthiness
US9519883B2 (en) 2011-06-28 2016-12-13 Microsoft Technology Licensing, Llc Automatic project content suggestion
IL214360A (en) * 2011-07-31 2016-05-31 Verint Systems Ltd System and method for identifying main pages in decoding network traffic
US9442881B1 (en) 2011-08-31 2016-09-13 Yahoo! Inc. Anti-spam transient entity classification
US8682990B2 (en) 2011-10-03 2014-03-25 Microsoft Corporation Identifying first contact unsolicited communications
US9276930B2 (en) 2011-10-19 2016-03-01 Artashes Valeryevich Ikonomov Device for controlling network user data
CN103166830B (zh) * 2011-12-14 2016-02-10 中国电信股份有限公司 一种智能选择训练样本的垃圾邮件过滤系统和方法
CN103220262A (zh) * 2012-01-19 2013-07-24 北京千橡网景科技发展有限公司 用于在网站中检测垃圾消息发送方的方法和设备
US9130778B2 (en) * 2012-01-25 2015-09-08 Bitdefender IPR Management Ltd. Systems and methods for spam detection using frequency spectra of character strings
RU2510982C2 (ru) 2012-04-06 2014-04-10 Закрытое акционерное общество "Лаборатория Касперского" Система и способ оценки пользователей для фильтрации сообщений
US20140310616A1 (en) * 2012-05-18 2014-10-16 Artashes Valeryevich Ikonomov System for interactive communication
US9660947B1 (en) * 2012-07-27 2017-05-23 Intuit Inc. Method and apparatus for filtering undesirable content based on anti-tags
CN103595614A (zh) * 2012-08-16 2014-02-19 无锡华御信息技术有限公司 一种基于用户反馈的垃圾邮件检测方法
US8938796B2 (en) 2012-09-20 2015-01-20 Paul Case, SR. Case secure computer architecture
WO2014058349A1 (ru) 2012-10-10 2014-04-17 Ikonomov Artashes Valeryevich Электронная платежная система
CN102946383B (zh) * 2012-10-24 2015-11-18 珠海市君天电子科技有限公司 一种基于第三方公用接口的远程查询、修改病毒特征的方法和系统
CN103078753B (zh) * 2012-12-27 2016-07-13 华为技术有限公司 一种邮件的处理方法、装置和系统
US10346411B1 (en) * 2013-03-14 2019-07-09 Google Llc Automatic target audience suggestions when sharing in a social network
US20140279734A1 (en) * 2013-03-15 2014-09-18 Hewlett-Packard Development Company, L.P. Performing Cross-Validation Using Non-Randomly Selected Cases
US8997232B2 (en) 2013-04-22 2015-03-31 Imperva, Inc. Iterative automatic generation of attribute values for rules of a web application layer attack detector
RU2541123C1 (ru) * 2013-06-06 2015-02-10 Закрытое акционерное общество "Лаборатория Касперского" Система и способ определения рейтинга электронных сообщений для борьбы со спамом
CN103607339B (zh) * 2013-09-11 2016-08-17 北京京东尚科信息技术有限公司 基于内容自动调节邮件发送策略的方法和系统
JP5572252B1 (ja) * 2013-09-11 2014-08-13 株式会社Ubic デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム
WO2015060854A1 (en) * 2013-10-24 2015-04-30 Hewlett-Packard Development Company, L.P. Real-time inter-personal communication
CN103634201B (zh) * 2013-11-12 2017-09-12 新浪网技术(中国)有限公司 电子邮件系统及其隔离邮件处理方法
US11568280B1 (en) * 2019-01-23 2023-01-31 Amdocs Development Limited System, method, and computer program for parental controls and recommendations based on artificial intelligence
US10778618B2 (en) * 2014-01-09 2020-09-15 Oath Inc. Method and system for classifying man vs. machine generated e-mail
US9942182B2 (en) * 2014-11-17 2018-04-10 At&T Intellectual Property I, L.P. System and method for cloud based IP mobile messaging spam detection and defense
US9160680B1 (en) 2014-11-18 2015-10-13 Kaspersky Lab Zao System and method for dynamic network resource categorization re-assignment
US20170222960A1 (en) * 2016-02-01 2017-08-03 Linkedin Corporation Spam processing with continuous model training
US10397256B2 (en) * 2016-06-13 2019-08-27 Microsoft Technology Licensing, Llc Spam classification system based on network flow data
US9749360B1 (en) * 2017-01-05 2017-08-29 KnowBe4, Inc. Systems and methods for performing simulated phishing attacks using social engineering indicators
KR20180081444A (ko) * 2017-01-06 2018-07-16 삼성전자주식회사 콘텐츠를 처리하는 장치 및 방법
WO2018128403A1 (en) * 2017-01-06 2018-07-12 Samsung Electronics Co., Ltd. Apparatus and method for processing content
EP3367261A1 (de) 2017-02-28 2018-08-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum klassifizieren von information und klassifizierungsprozessor
CN108694202A (zh) * 2017-04-10 2018-10-23 上海交通大学 基于分类算法的可配置垃圾邮件过滤系统及过滤方法
US20180337840A1 (en) * 2017-05-18 2018-11-22 Satori Worldwide, Llc System and method for testing filters for data streams in publisher-subscriber networks
US11232369B1 (en) * 2017-09-08 2022-01-25 Facebook, Inc. Training data quality for spam classification
US10635813B2 (en) 2017-10-06 2020-04-28 Sophos Limited Methods and apparatus for using machine learning on multiple file fragments to identify malware
AU2018358228A1 (en) 2017-10-31 2020-05-07 GoSecure, Inc Analysis and reporting of suspicious email
CN110089076B (zh) * 2017-11-22 2021-04-09 腾讯科技(深圳)有限公司 实现信息互动的方法和装置
US11003858B2 (en) * 2017-12-22 2021-05-11 Microsoft Technology Licensing, Llc AI system to determine actionable intent
CN108073718A (zh) * 2017-12-29 2018-05-25 长春理工大学 一种基于主动学习和否定选择的邮件二类分类算法
WO2019140685A1 (zh) * 2018-01-22 2019-07-25 北京小米移动软件有限公司 进行最小化路测测量的方法、装置和系统
WO2019145912A1 (en) 2018-01-26 2019-08-01 Sophos Limited Methods and apparatus for detection of malicious documents using machine learning
US11941491B2 (en) 2018-01-31 2024-03-26 Sophos Limited Methods and apparatus for identifying an impact of a portion of a file on machine learning classification of malicious content
WO2019153199A1 (zh) 2018-02-08 2019-08-15 北京小米移动软件有限公司 Mdt配置方法及装置
US11270205B2 (en) 2018-02-28 2022-03-08 Sophos Limited Methods and apparatus for identifying the shared importance of multiple nodes within a machine learning model for multiple tasks
US20190327127A1 (en) * 2018-04-23 2019-10-24 Entit Software Llc Information technology event management
KR102117543B1 (ko) * 2018-04-26 2020-06-01 주식회사 슈퍼브에이아이 컴퓨팅 장치 및 이를 이용한 인공 지능 기반 영상 처리 서비스 시스템
CN110213152B (zh) * 2018-05-02 2021-09-14 腾讯科技(深圳)有限公司 识别垃圾邮件的方法、装置、服务器及存储介质
US20220012510A1 (en) * 2018-05-17 2022-01-13 Hasan Mirjan Methods and systems of handwriting recognition in virtualized-mail services
US20200371988A1 (en) * 2018-05-31 2020-11-26 Microsoft Technology Licensing, Llc Distributed Computing System with a Synthetic Data as a Service Frameset Package Generator
US11281996B2 (en) * 2018-05-31 2022-03-22 Microsoft Technology Licensing, Llc Distributed computing system with a synthetic data as a service feedback loop engine
US11012500B2 (en) * 2018-07-27 2021-05-18 Vmware, Inc. Secure multi-directional data pipeline for data distribution systems
US11521108B2 (en) 2018-07-30 2022-12-06 Microsoft Technology Licensing, Llc Privacy-preserving labeling and classification of email
US11212312B2 (en) 2018-08-09 2021-12-28 Microsoft Technology Licensing, Llc Systems and methods for polluting phishing campaign responses
US10601868B2 (en) 2018-08-09 2020-03-24 Microsoft Technology Licensing, Llc Enhanced techniques for generating and deploying dynamic false user accounts
US10922097B2 (en) * 2018-09-18 2021-02-16 International Business Machines Corporation Collaborative model execution
US11947668B2 (en) 2018-10-12 2024-04-02 Sophos Limited Methods and apparatus for preserving information between layers within a neural network
CN109471920A (zh) * 2018-11-19 2019-03-15 北京锐安科技有限公司 一种文本标识的方法、装置、电子设备及存储介质
US11574052B2 (en) 2019-01-31 2023-02-07 Sophos Limited Methods and apparatus for using machine learning to detect potentially malicious obfuscated scripts
JP6992774B2 (ja) * 2019-02-13 2022-01-13 セイコーエプソン株式会社 情報処理装置、学習装置及び学習済モデル
CN111815306B (zh) * 2019-04-11 2024-03-26 深圳市家家分类科技有限公司 上门服务下单方法及相关设备
RU2717721C1 (ru) * 2019-09-20 2020-03-25 Антон Борисович Ёркин Способ создания автоматизированных систем управления информационной безопасностью и система для его осуществления
CN110598157B (zh) * 2019-09-20 2023-01-03 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质
US11347572B2 (en) 2019-09-26 2022-05-31 Vmware, Inc. Methods and apparatus for data pipelines between cloud computing platforms
US11757816B1 (en) * 2019-11-11 2023-09-12 Trend Micro Incorporated Systems and methods for detecting scam emails
US11722503B2 (en) * 2020-05-05 2023-08-08 Accenture Global Solutions Limited Responsive privacy-preserving system for detecting email threats
US11438370B2 (en) * 2020-07-16 2022-09-06 Capital One Services, Llc Email security platform
US11966469B2 (en) * 2020-10-29 2024-04-23 Proofpoint, Inc. Detecting and protecting against cybersecurity attacks using unprintable tracking characters
CN114040409B (zh) * 2021-11-11 2023-06-06 中国联合网络通信集团有限公司 短信识别方法、装置、设备及存储介质
CN115952207B (zh) * 2022-12-21 2024-02-20 北京中睿天下信息技术有限公司 一种基于StarRocks数据库的威胁邮件存储方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074172A (ja) * 1996-06-10 1998-03-17 Sun Microsyst Inc ジャンク電子メールを識別し廃棄するための方法および装置
US6421709B1 (en) * 1997-12-22 2002-07-16 Accepted Marketing, Inc. E-mail filter and method thereof

Family Cites Families (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8918553D0 (en) 1989-08-15 1989-09-27 Digital Equipment Int Message control system
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5619648A (en) 1994-11-30 1997-04-08 Lucent Technologies Inc. Message filtering techniques
US5638487A (en) 1994-12-30 1997-06-10 Purespeech, Inc. Automatic speech recognition
WO1996035994A1 (en) 1995-05-08 1996-11-14 Compuserve Incorporated Rules based electronic message management system
US5845077A (en) 1995-11-27 1998-12-01 Microsoft Corporation Method and system for identifying and obtaining computer software from a remote computer
US6101531A (en) 1995-12-19 2000-08-08 Motorola, Inc. System for communicating user-selected criteria filter prepared at wireless client to communication server for filtering data transferred from host to said wireless client
US5704017A (en) 1996-02-16 1997-12-30 Microsoft Corporation Collaborative filtering utilizing a belief network
US5884033A (en) 1996-05-15 1999-03-16 Spyglass, Inc. Internet filtering system for filtering data transferred over the internet utilizing immediate and deferred filtering actions
US6072942A (en) 1996-09-18 2000-06-06 Secure Computing Corporation System and method of electronic mail filtering using interconnected nodes
DE69607166T2 (de) * 1996-10-15 2000-12-14 St Microelectronics Srl Elektronische Anordnung zur Durchführung von Konvolutionsoperationen
US5805801A (en) 1997-01-09 1998-09-08 International Business Machines Corporation System and method for detecting and preventing security
US5905859A (en) 1997-01-09 1999-05-18 International Business Machines Corporation Managed network device security method and apparatus
US6122657A (en) 1997-02-04 2000-09-19 Networks Associates, Inc. Internet computer system with methods for dynamic filtering of hypertext tags and content
US6742047B1 (en) * 1997-03-27 2004-05-25 Intel Corporation Method and apparatus for dynamically filtering network content
DE69724235T2 (de) 1997-05-28 2004-02-26 Siemens Ag Computersystem und Verfahren zum Schutz von Software
US7117358B2 (en) 1997-07-24 2006-10-03 Tumbleweed Communications Corp. Method and system for filtering communication
US6199102B1 (en) 1997-08-26 2001-03-06 Christopher Alan Cobb Method and system for filtering electronic messages
US6041324A (en) 1997-11-17 2000-03-21 International Business Machines Corporation System and method for identifying valid portion of computer resource identifier
US6003027A (en) 1997-11-21 1999-12-14 International Business Machines Corporation System and method for determining confidence levels for the results of a categorization system
US6393465B2 (en) 1997-11-25 2002-05-21 Nixmail Corporation Junk electronic mail detector and eliminator
US6351740B1 (en) * 1997-12-01 2002-02-26 The Board Of Trustees Of The Leland Stanford Junior University Method and system for training dynamic nonlinear adaptive filters which have embedded memory
US6023723A (en) 1997-12-22 2000-02-08 Accepted Marketing, Inc. Method and system for filtering unwanted junk e-mail utilizing a plurality of filtering mechanisms
US6052709A (en) 1997-12-23 2000-04-18 Bright Light Technologies, Inc. Apparatus and method for controlling delivery of unsolicited electronic mail
GB2334116A (en) 1998-02-04 1999-08-11 Ibm Scheduling and dispatching queued client requests within a server computer
US6484261B1 (en) 1998-02-17 2002-11-19 Cisco Technology, Inc. Graphical network security policy management
US6504941B2 (en) 1998-04-30 2003-01-07 Hewlett-Packard Company Method and apparatus for digital watermarking of images
US6314421B1 (en) * 1998-05-12 2001-11-06 David M. Sharnoff Method and apparatus for indexing documents for message filtering
US6074942A (en) * 1998-06-03 2000-06-13 Worldwide Semiconductor Manufacturing Corporation Method for forming a dual damascene contact and interconnect
US6308273B1 (en) 1998-06-12 2001-10-23 Microsoft Corporation Method and system of security location discrimination
US6192360B1 (en) 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
US6161130A (en) 1998-06-23 2000-12-12 Microsoft Corporation Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set
US6167434A (en) * 1998-07-15 2000-12-26 Pang; Stephen Y. Computer code for removing junk e-mail messages
US6112227A (en) 1998-08-06 2000-08-29 Heiner; Jeffrey Nelson Filter-in method for reducing junk e-mail
US6434600B2 (en) 1998-09-15 2002-08-13 Microsoft Corporation Methods and systems for securely delivering electronic mail to hosts having dynamic IP addresses
US6732273B1 (en) 1998-10-21 2004-05-04 Lucent Technologies Inc. Priority and security coding system for electronic mail messages
GB2343529B (en) 1998-11-07 2003-06-11 Ibm Filtering incoming e-mail
US6546416B1 (en) 1998-12-09 2003-04-08 Infoseek Corporation Method and system for selectively blocking delivery of bulk electronic mail
US6477531B1 (en) * 1998-12-18 2002-11-05 Motive Communications, Inc. Technical support chain automation with guided self-help capability using active content
US6643686B1 (en) * 1998-12-18 2003-11-04 At&T Corp. System and method for counteracting message filtering
US6857051B2 (en) 1998-12-23 2005-02-15 Intel Corporation Method and apparatus for maintaining cache coherence in a computer system
US6615242B1 (en) 1998-12-28 2003-09-02 At&T Corp. Automatic uniform resource locator-based message filter
US6266692B1 (en) 1999-01-04 2001-07-24 International Business Machines Corporation Method for blocking all unwanted e-mail (SPAM) using a header-based password
US6330590B1 (en) 1999-01-05 2001-12-11 William D. Cotten Preventing delivery of unwanted bulk e-mail
US6424997B1 (en) 1999-01-27 2002-07-23 International Business Machines Corporation Machine learning based electronic messaging system
US6449634B1 (en) 1999-01-29 2002-09-10 Digital Impact, Inc. Method and system for remotely sensing the file formats processed by an E-mail client
US6477551B1 (en) 1999-02-16 2002-11-05 International Business Machines Corporation Interactive electronic messaging system
US7032030B1 (en) 1999-03-11 2006-04-18 John David Codignotto Message publishing system and method
US6732149B1 (en) 1999-04-09 2004-05-04 International Business Machines Corporation System and method for hindering undesired transmission or receipt of electronic messages
US6370526B1 (en) 1999-05-18 2002-04-09 International Business Machines Corporation Self-adaptive method and system for providing a user-preferred ranking order of object sets
DE19923093A1 (de) * 1999-05-20 2000-11-23 Mann & Hummel Filter Flüssigkeitsabscheider, insbesondere für die Reinigung von Kurbelgehäusegasen mit Abscheidepatrone
US6592627B1 (en) 1999-06-10 2003-07-15 International Business Machines Corporation System and method for organizing repositories of semi-structured documents such as email
US6449636B1 (en) 1999-09-08 2002-09-10 Nortel Networks Limited System and method for creating a dynamic data file from collected and filtered web pages
US6321267B1 (en) * 1999-11-23 2001-11-20 Escom Corporation Method and apparatus for filtering junk email
US6728690B1 (en) 1999-11-23 2004-04-27 Microsoft Corporation Classification system trainer employing maximum margin back-propagation with probabilistic outputs
US6701440B1 (en) * 2000-01-06 2004-03-02 Networks Associates Technology, Inc. Method and system for protecting a computer using a remote e-mail scanning device
US6633855B1 (en) 2000-01-06 2003-10-14 International Business Machines Corporation Method, system, and program for filtering content using neural networks
US7822977B2 (en) 2000-02-08 2010-10-26 Katsikas Peter L System for eliminating unauthorized electronic mail
US6691156B1 (en) 2000-03-10 2004-02-10 International Business Machines Corporation Method for restricting delivery of unsolicited E-mail
US6684201B1 (en) 2000-03-31 2004-01-27 Microsoft Corporation Linguistic disambiguation system and method using string-based pattern training to learn to resolve ambiguity sites
US7210099B2 (en) 2000-06-12 2007-04-24 Softview Llc Resolution independent vector display of internet content
US20040073617A1 (en) * 2000-06-19 2004-04-15 Milliken Walter Clark Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail
JP2004531780A (ja) 2000-06-22 2004-10-14 マイクロソフト コーポレーション 分散型コンピューティングサービスプラットフォーム
US7003555B1 (en) 2000-06-23 2006-02-21 Cloudshield Technologies, Inc. Apparatus and method for domain name resolution
US6779021B1 (en) 2000-07-28 2004-08-17 International Business Machines Corporation Method and system for predicting and managing undesirable electronic mail
US6842773B1 (en) * 2000-08-24 2005-01-11 Yahoo ! Inc. Processing of textual electronic communication distributed in bulk
US6757830B1 (en) 2000-10-03 2004-06-29 Networks Associates Technology, Inc. Detecting unwanted properties in received email messages
US6971023B1 (en) 2000-10-03 2005-11-29 Mcafee, Inc. Authorizing an additional computer program module for use with a core computer program
US6748422B2 (en) 2000-10-19 2004-06-08 Ebay Inc. System and method to control sending of unsolicited communications relating to a plurality of listings in a network-based commerce facility
US7243125B2 (en) 2000-12-08 2007-07-10 Xerox Corporation Method and apparatus for presenting e-mail threads as semi-connected text by removing redundant material
JP3554271B2 (ja) 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US6775704B1 (en) 2000-12-28 2004-08-10 Networks Associates Technology, Inc. System and method for preventing a spoofed remote procedure call denial of service attack in a networked computing environment
US20020129111A1 (en) * 2001-01-15 2002-09-12 Cooper Gerald M. Filtering unsolicited email
US8219620B2 (en) * 2001-02-20 2012-07-10 Mcafee, Inc. Unwanted e-mail filtering system including voting feedback
US20020124025A1 (en) 2001-03-01 2002-09-05 International Business Machines Corporataion Scanning and outputting textual information in web page images
GB2373130B (en) 2001-03-05 2004-09-22 Messagelabs Ltd Method of,and system for,processing email in particular to detect unsolicited bulk email
US6928465B2 (en) 2001-03-16 2005-08-09 Wells Fargo Bank, N.A. Redundant email address detection and capture system
US6751348B2 (en) * 2001-03-29 2004-06-15 Fotonation Holdings, Llc Automated detection of pornographic images
US8949878B2 (en) 2001-03-30 2015-02-03 Funai Electric Co., Ltd. System for parental control in video programs based on multimedia content information
US6920477B2 (en) 2001-04-06 2005-07-19 President And Fellows Of Harvard College Distributed, compressed Bloom filter Web cache server
US8095597B2 (en) 2001-05-01 2012-01-10 Aol Inc. Method and system of automating data capture from electronic correspondence
US7188106B2 (en) 2001-05-01 2007-03-06 International Business Machines Corporation System and method for aggregating ranking results from various sources to improve the results of web searching
US6768991B2 (en) * 2001-05-15 2004-07-27 Networks Associates Technology, Inc. Searching for sequences of character data
US7103599B2 (en) 2001-05-15 2006-09-05 Verizon Laboratories Inc. Parsing of nested internet electronic mail documents
US20030009698A1 (en) 2001-05-30 2003-01-09 Cascadezone, Inc. Spam avenger
US7502829B2 (en) 2001-06-21 2009-03-10 Cybersoft, Inc. Apparatus, methods and articles of manufacture for intercepting, examining and controlling code, data and files and their transfer
US7328250B2 (en) * 2001-06-29 2008-02-05 Nokia, Inc. Apparatus and method for handling electronic mail
US20030009495A1 (en) 2001-06-29 2003-01-09 Akli Adjaoute Systems and methods for filtering electronic content
TW533380B (en) * 2001-07-23 2003-05-21 Ulead Systems Inc Group image detecting method
US6769016B2 (en) 2001-07-26 2004-07-27 Networks Associates Technology, Inc. Intelligent SPAM detection system using an updateable neural analysis engine
US7146402B2 (en) * 2001-08-31 2006-12-05 Sendmail, Inc. E-mail system providing filtering methodology on a per-domain basis
US20060036701A1 (en) 2001-11-20 2006-02-16 Bulfer Andrew F Messaging system having message filtering and access control
AU2002366933A1 (en) * 2001-12-13 2003-07-09 Youn-Sook Lee System and method for preventing spam mail
US6785820B1 (en) 2002-04-02 2004-08-31 Networks Associates Technology, Inc. System, method and computer program product for conditionally updating a security program
US20030204569A1 (en) 2002-04-29 2003-10-30 Michael R. Andrews Method and apparatus for filtering e-mail infected with a previously unidentified computer virus
US20030229672A1 (en) * 2002-06-05 2003-12-11 Kohn Daniel Mark Enforceable spam identification and reduction system, and method thereof
US8046832B2 (en) 2002-06-26 2011-10-25 Microsoft Corporation Spam detector with challenges
US8924484B2 (en) 2002-07-16 2014-12-30 Sonicwall, Inc. Active e-mail filter with challenge-response
US7363490B2 (en) 2002-09-12 2008-04-22 International Business Machines Corporation Method and system for selective email acceptance via encoded email identifiers
US7188369B2 (en) 2002-10-03 2007-03-06 Trend Micro, Inc. System and method having an antivirus virtual scanning processor with plug-in functionalities
US20040083270A1 (en) 2002-10-23 2004-04-29 David Heckerman Method and system for identifying junk e-mail
US7149801B2 (en) 2002-11-08 2006-12-12 Microsoft Corporation Memory bound functions for spam deterrence and the like
US6732157B1 (en) * 2002-12-13 2004-05-04 Networks Associates Technology, Inc. Comprehensive anti-spam system, method, and computer program product for filtering unwanted e-mail messages
WO2004059506A1 (en) 2002-12-26 2004-07-15 Commtouch Software Ltd. Detection and prevention of spam
US7533148B2 (en) 2003-01-09 2009-05-12 Microsoft Corporation Framework to enable integration of anti-spam technologies
US7171450B2 (en) 2003-01-09 2007-01-30 Microsoft Corporation Framework to enable integration of anti-spam technologies
US7249162B2 (en) * 2003-02-25 2007-07-24 Microsoft Corporation Adaptive junk message filtering system
US7543053B2 (en) * 2003-03-03 2009-06-02 Microsoft Corporation Intelligent quarantining for spam prevention
US7219148B2 (en) * 2003-03-03 2007-05-15 Microsoft Corporation Feedback loop for spam prevention
US7366761B2 (en) * 2003-10-09 2008-04-29 Abaca Technology Corporation Method for creating a whitelist for processing e-mails
US20040177120A1 (en) 2003-03-07 2004-09-09 Kirsch Steven T. Method for filtering e-mail messages
US7320020B2 (en) * 2003-04-17 2008-01-15 The Go Daddy Group, Inc. Mail server probability spam filter
US7653698B2 (en) * 2003-05-29 2010-01-26 Sonicwall, Inc. Identifying e-mail messages from allowed senders
US7293063B1 (en) 2003-06-04 2007-11-06 Symantec Corporation System utilizing updated spam signatures for performing secondary signature-based analysis of a held e-mail to improve spam email detection
US7263607B2 (en) 2003-06-12 2007-08-28 Microsoft Corporation Categorizing electronic messages based on trust between electronic messaging entities
US7051077B2 (en) 2003-06-30 2006-05-23 Mx Logic, Inc. Fuzzy logic voting method and system for classifying e-mail using inputs from multiple spam classifiers
US7155484B2 (en) 2003-06-30 2006-12-26 Bellsouth Intellectual Property Corporation Filtering email messages corresponding to undesirable geographical regions
US20050015455A1 (en) * 2003-07-18 2005-01-20 Liu Gary G. SPAM processing system and methods including shared information among plural SPAM filters
US7451487B2 (en) * 2003-09-08 2008-11-11 Sonicwall, Inc. Fraudulent message detection
US20050102366A1 (en) * 2003-11-07 2005-05-12 Kirsch Steven T. E-mail filter employing adaptive ruleset
US7359941B2 (en) * 2004-01-08 2008-04-15 International Business Machines Corporation Method and apparatus for filtering spam email
US7640322B2 (en) * 2004-02-26 2009-12-29 Truefire, Inc. Systems and methods for producing, managing, delivering, retrieving, and/or tracking permission based communications
US20050204159A1 (en) * 2004-03-09 2005-09-15 International Business Machines Corporation System, method and computer program to block spam
WO2006002076A2 (en) 2004-06-15 2006-01-05 Tekelec Methods, systems, and computer program products for content-based screening of messaging service messages

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074172A (ja) * 1996-06-10 1998-03-17 Sun Microsyst Inc ジャンク電子メールを識別し廃棄するための方法および装置
US6421709B1 (en) * 1997-12-22 2002-07-16 Accepted Marketing, Inc. E-mail filter and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10061989B2 (en) 2015-03-30 2018-08-28 Nec Corporation Information transfer apparatus and method for image recognition

Also Published As

Publication number Publication date
EG23988A (en) 2008-03-05
TWI331869B (en) 2010-10-11
CA2799691A1 (en) 2004-09-16
IL206121A (en) 2012-03-29
CA2513967A1 (en) 2004-09-16
WO2004079514A3 (en) 2006-03-30
TW200507576A (en) 2005-02-16
AU2004216772A2 (en) 2004-09-16
ZA200506085B (en) 2006-11-29
US7558832B2 (en) 2009-07-07
KR20060006769A (ko) 2006-01-19
MXPA05008303A (es) 2006-03-21
AU2004216772A1 (en) 2004-09-16
CA2799691C (en) 2014-09-16
RU2005124681A (ru) 2006-01-20
US20070208856A1 (en) 2007-09-06
KR101021395B1 (ko) 2011-03-14
EP1599781A4 (en) 2011-12-07
CA2513967C (en) 2014-04-15
CO6141494A2 (es) 2010-03-19
WO2004079514A2 (en) 2004-09-16
US7219148B2 (en) 2007-05-15
NO20053733L (no) 2005-08-24
AU2004216772B2 (en) 2009-12-17
CN1809821A (zh) 2006-07-26
NZ541628A (en) 2007-12-21
EP1599781A2 (en) 2005-11-30
IL170115A (en) 2010-12-30
US20040177110A1 (en) 2004-09-09
RU2331913C2 (ru) 2008-08-20
BRPI0407045A (pt) 2006-01-17
JP2006521635A (ja) 2006-09-21
TW201036399A (en) 2010-10-01
CN100472484C (zh) 2009-03-25

Similar Documents

Publication Publication Date Title
JP4828411B2 (ja) スパム防止のためのフィードバックループ
US7543053B2 (en) Intelligent quarantining for spam prevention
US7660865B2 (en) Spam filtering with probabilistic secure hashes
US9143476B2 (en) Real-time classification of email message traffic
KR101201045B1 (ko) 발신 스팸의 감소를 용이하게 하기 위한 시스템 및 방법, 스패머가 아닌 것 같은 활동의 주기적 확인을 용이하게 하는 시스템 및 방법, 스팸 감소 방법, 및 컴퓨터 판독가능한 기록 매체
US20080184366A1 (en) Reputation based message processing
US20070088789A1 (en) Method and system for indicating an email sender as spammer
US8135778B1 (en) Method and apparatus for certifying mass emailings
US11916873B1 (en) Computerized system for inserting management information into electronic communication systems
Park et al. Spam Detection: Increasing Accuracy with A Hybrid Solution.
De Oliveira et al. A Trust Model for a Group of E-mail Servers
Dalkilic et al. A simple yet effective spam blocking method
Islam Designing Spam Mail Filtering Using Data Mining by Analyzing User and Email Behavior
Johansen Email Communities of Interest and Their Application

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20100226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100423

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20100824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140922

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees