JP4598774B2 - 類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法および装置 - Google Patents

類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法および装置 Download PDF

Info

Publication number
JP4598774B2
JP4598774B2 JP2006533134A JP2006533134A JP4598774B2 JP 4598774 B2 JP4598774 B2 JP 4598774B2 JP 2006533134 A JP2006533134 A JP 2006533134A JP 2006533134 A JP2006533134 A JP 2006533134A JP 4598774 B2 JP4598774 B2 JP 4598774B2
Authority
JP
Japan
Prior art keywords
character
message
spam
references
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006533134A
Other languages
English (en)
Other versions
JP2007503660A5 (ja
JP2007503660A (ja
Inventor
グレッソン,マット
ホーグストレイト,デイビッド
ジェンセン,サンディ
マンテル,エリ
メドラー,アート
シュナイダー,ケン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gen Digital Inc
Original Assignee
Symantec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Symantec Corp filed Critical Symantec Corp
Publication of JP2007503660A publication Critical patent/JP2007503660A/ja
Publication of JP2007503660A5 publication Critical patent/JP2007503660A5/ja
Application granted granted Critical
Publication of JP4598774B2 publication Critical patent/JP4598774B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/063Content adaptation, e.g. replacement of unsuitable content

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Description

関連出願
本出願は、参照により全体が本明細書に組み込まれている、2003年5月15日に出願した米国仮出願第60/471242号の優先権を主張する。
本発明は、電子メール(email)をフィルタ処理することに関し、より詳細には、本発明は、類似性測度に基づいて電子メール・スパムをフィルタ処理することに関する。
インターネットの普及が進んでおり、ますます多くの人々が、電子的大量メールを生成し、送信することによって製品やサービスを宣伝して、インターネットを介してビジネスを行っている。それらの電子メッセージ(電子メール)は、普通、求められておらず、受信者によって迷惑と見られている。というのは、それらのメッセージが、必要で重要なデータ処理のために必要とされる記憶スペースの多くを占有するからである。例えば、メール・サーバは、そのサーバの記憶容量が、宣伝を含む不要な電子メールで最大限度までいっぱいになった場合、重要で、かつ/または所望される電子メールを受け入れることを拒否しなければならなくなる。さらに、セットトップ・ボックス、PDA、ネットワーク・コンピュータ、ポケットベルなどのシン・クライアント・システムはすべて、限られた記憶容量を有する。そのようなシステムのいずれにおける不要な電子メールも、ユーザのための有限なリソースを縛りつけることになる。さらに、通常のユーザは、大量であるが、無用な宣伝情報をダウンロードすることによって、時間を浪費する。それらの不要な電子メールは、一般にスパムと呼ばれる。
現在、不要なメッセージをフィルタにかけて除くことができる製品が存在する。例えば、すべてのスパム・エージェント(すなわち、大量の求められていない電子メールを生成する企業)の索引リストを保持し、そのリスト上の企業から送信された電子メールをブロックする手段を提供するスパム・ブロック方法が存在する。
現在、入手可能な別の「ジャンク・メール」フィルタは、事前定義された語や、前述したパターンに基づくフィルタ群を使用する。着信メールは、件名が既知のスパム・パターンを含む場合、不要なメールと指定される。
しかし、スパム・フィルタ処理が高度になるにつれ、フィルタを回避するスパム発信者の技術も高度になる。最近の世代のスパム発信者によって採り入れられている戦術の例には、ランダム化、発信元隠蔽、HTMLを使用したフィルタ回避が含まれる。
類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法とシステムを説明する。一態様によれば、方法は、着信電子メール・メッセージを受信し、着信電子メール・メッセージのコンテンツに基づいて、着信電子メール・メッセージを特徴付けるデータを生成し、その生成されたデータを、スパム・メッセージを特徴付けるデータのセットと比較することを含む。方法は、着信電子メール・メッセージを特徴付けるデータと、スパム・メッセージを特徴付けるデータのセットからのいずれかのデータ項目の間の類似が、閾値を超えるかどうかを判定することをさらに含む。
本発明のその他の特徴は、添付の図面、および以下の詳細な説明から明白となろう。
本発明は、以下に提供する詳細な説明や、本発明の様々な実施形態の添付の図面からより完全に理解されるが、説明と図面は、本発明を特定の実施形態に限定するものと解釈されるべきではなく、単に説明および理解を目的とする。
類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法とシステムを説明する。以下の説明では、多数の詳細を提示する。しかし、本発明は、それらの特定の詳細なしに実施することもできることが、当業者には理解されよう。その他、周知の構造やデバイスは、本発明を不明瞭にするのを避けるため、詳細にではなく、ブロック図の形態で示す。
以下の詳細な説明のいくつかの部分は、コンピュータ・メモリ内のデータ・ビットに対するオペレーションのアルゴリズムと記号表現として提示する。それらのアルゴリズム記述やアルゴリズム表現は、データ処理分野の業者が、自らの作業の内容を他の同業者に最も効果的に伝えるのに使用する手段である。アルゴリズムは、本明細書では、また、一般に、所望の結果をもたらす、自己矛盾のない一連のステップであると考えられる。ステップは、物理的量の物理的な操作を要するステップである。通常、ただし必然的にではなく、それらの量は、格納されること、転送されること、結合されること、比較されること、それ以外の形で操作されることが可能な、電気信号または磁気信号の形態をとる。ときとして、主に、一般的な用法の理由で、それらの信号をビット、値、要素、シンボル、文字、項目、数などと呼ぶのが好都合であることが分かっている。
しかし、それらの用語や類似する用語のすべては、適切な物理的量に関連付けられるべきであり、それらの量に適用された便利なラベルに過ぎないことに留意されたい。特に明記しない限り、以下の説明から明白なとおり、説明全体で、「処理する」または「演算する」または「計算する」または「算出する」または「表示する」などの用語を利用する説明は、コンピュータ・システムのレジスタ内やメモリ内の物理的(電子的)量として表されるデータを操作し、変換して、コンピュータ・システムのメモリまたはレジスタ、あるいは他のそのような情報記憶デバイス、情報伝送デバイス、または情報表示デバイスの内部の物理的量として同様に表される他のデータにする、コンピュータ・システム、または類似の電子コンピューティング・デバイスのアクションやプロセスを指すものと理解されるべきである。
また、本発明は、本明細書のオペレーションを実行するための装置にも関する。この装置は、要求される目的のために特別に構築されることも、コンピュータの中に格納されたコンピュータ・プログラムによって選択的に起動される、または再構成される汎用コンピュータを含むことも可能である。そのようなコンピュータ・プログラムは、フロッピー・ディスク、光ディスク、CD−ROM、光磁気ディスクを含む任意のタイプのディスク、読み取り専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、EPROM、EEPROM、磁気カードまたは光カード、あるいは電子命令を格納するのに適した任意のタイプの媒体などの、ただし、それらには限定されない、コンピュータ可読記憶媒体の中に格納されることが可能であり、各媒体は、コンピュータ・システム・バスに結合される。
本明細書で提示するアルゴリズムと表示は、いずれの特定のコンピュータ、またはその他の装置にも本質的に関連していない。様々な汎用システムを、本明細書の教示によるプログラムとともに使用することができ、あるいは、要求される方法ステップを実行する、より特殊化された装置を構築することが好都合であると判明する。様々なそれらのシステムの要求される構造は、以下の説明から明らかとなる。さらに、本発明は、いずれの特定のプログラミング言語に関連しても説明しない。様々なプログラミング言語を使用して、本明細書で説明する本発明の教示を実施することができることが理解されよう。
マシン可読媒体には、マシン(例えば、コンピュータ)による読み取りが可能な形態で情報を格納する、または伝送するための任意の機構が含まれる。例えば、マシン可読媒体には、読み取り専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリ・デバイス、電気、光、音響、またはその他の形態の伝搬される信号(例えば、搬送波、赤外線信号、デジタル信号など)、その他が含まれる。
類似性測度に基づいて電子メール・スパムをフィルタ処理すること
図1は、スパム電子メール(email)の配信を制御するためのシステムの一実施形態のブロック図である。システムは、公共ネットワーク(例えば、インターネット、無線ネットワークなど)、または私設ネットワーク(例えば、LAN、イントラネットなど)などの通信ネットワーク100に結合された制御センタ102を含む。制御センタ102は、ネットワーク100を介して複数のネットワーク・サーバ104と通信する。各サーバ104は、私設ネットワークまたは公共ネットワークを使用して、ユーザ端末装置106と通信する。
制御センタ102は、スパムと識別されたメッセージを分析し、スパムを検出するためのフィルタ処理規則を開発し、フィルタ処理規則をサーバ群104に配信することを担うスパム対策設備である。メッセージは、既知のスパム源(例えば、「スパム・プローブ」、すなわち、可能な限り多くのスパム発信者メーリング・リストに入り込むように特別に選択された電子メール・アドレスを使用して特定された)によって送信されれば、スパムとして識別される。
サーバ104は、送信された対応するユーザ端末装置のユーザにアドレス指定されたメッセージを受信し、格納するメール・サーバである。代替として、サーバ104は、メール・サーバ104に結合された、異なるサーバであってもよい。サーバ群104は、制御センタ102から受け取られたフィルタ処理規則に基づいて、着信メッセージをフィルタ処理することを担う。
一実施形態では、制御センタ102は、スパム攻撃に関連するコンテンツを特徴付けるデータを生成し、そのデータをサーバ群104に送信することを担うスパム・コンテンツ準備モジュール108を含む。各サーバ104は、制御センタ102から受信されたスパム・データを格納し、格納されたデータを使用して、スパム・コンテンツに類似する着信電子メール・メッセージを識別することを担う、類似度算出モジュール110を含む。
代替の実施形態では、各サーバ104は、スパム攻撃に関連するコンテンツを特徴付けるデータを生成するスパム・コンテンツ準備モジュール108と、生成されたデータを使用して、スパム・コンテンツに類似する電子メール・メッセージを識別する類似度算出モジュール110をともにホストする。
図2は、スパム・コンテンツ準備モジュール200の一実施形態のブロック図である。スパム・コンテンツ準備モジュール200は、スパム・コンテンツ・パーサ202、スパム・データ・ジェネレータ206、スパム・データ・トランスミッタ208を含む。
スパム・コンテンツ・パーサ202は、スパム攻撃による電子メール・メッセージの本文(スパム・メッセージと呼ぶ)を解析することを担う。
スパム・データ・ジェネレータ206は、スパム・メッセージを特徴付けるデータを生成することを担う。一実施形態では、スパム・メッセージを特徴付けるデータには、スパム・メッセージを構成するトークン(例えば、文字、語、行など)のセットに関して計算されたハッシュ値のリストが含まれる。スパム・メッセージ、または他の任意の電子メール・メッセージを特徴付けるデータを本明細書では、メッセージ・シグネチャと呼ぶ。スパム・メッセージ、または他の任意の電子メール・メッセージのシグネチャは、メッセージ・コンテンツを識別する様々なデータを含むことが可能であり、異なる電子メール・メッセージのシグネチャを比較する際に類似性測度の使用を可能にする、様々なアルゴリズムを使用して作成される。
一実施形態では、スパム・コンテンツ準備モジュール200は、雑音を示すデータを検出すること、さらに、スパム・メッセージのシグネチャを生成するのに先立って、スパム・メッセージからその雑音を除去することを担う雑音低減アルゴリズム204も含む。雑音は、スパムの性質を隠すようにスパム・メッセージに追加されている、受信者には見えないデータを表す。
一実施形態では、スパム・コンテンツ準備モジュール200は、単一のスパム攻撃を元とするメッセージをグループ化することを担うメッセージ・グループ化アルゴリズム(図示せず)も含む。グループ化は、スパム・メッセージの指定された特性(例えば、含まれるURL、メッセージ部分など)に基づいて実行される。グループ化が使用される場合、スパム・データ・ジェネレータ206は、それぞれの個別メッセージに関してではなく、スパム・メッセージのグループに関するシグネチャを生成することができる。
スパム・データ・トランスミッタ208は、スパム・メッセージのシグネチャを、図1のサーバ群104のような、参加するサーバ群に配信することを担う。一実施形態では、各サーバ104は、コール・センタ102に対する接続(例えば、セキュリティで保護されたHTTPS接続)を定期的に(例えば、5分毎に)開始する。このプル・ベースの接続を使用して、シグネチャは、コール・センタ102から妥当なサーバ106に伝送される。
図3は、類似度算出モジュール300の一実施形態のブロック図である。類似度算出モジュール300は、着信メッセージ・パーサ302と、スパム・データ・レシーバ306と、メッセージ・データ・ジェネレータ310と、類似アイデンティファイア312と、スパム・データベース304とを含む。
着信メッセージ・パーサ302は、着信電子メール・メッセージの本文を解析することを担う。
スパム・データ・レシーバ306は、スパム・メッセージのシグネチャを受信して、そのシグネチャをスパム・データベース304の中に格納することを担う。
メッセージ・データ・ジェネレータ310は、着信電子メール・メッセージのシグネチャを生成することを担う。一部の実施形態では、着信電子メール・メッセージのシグネチャは、その着信電子メール・メッセージを構成するトークン(例えば、文字、語、行など)のセットに関して計算されたハッシュ値のリストを含む。他の諸実施形態では、着信電子メール・メッセージのシグネチャは、電子メール・メッセージのコンテンツ(例えば、着信電子メール・メッセージを構成するトークン・セットのサブセット)を特徴付ける、他の様々なデータを含む。前述したとおり、電子メール・メッセージのシグネチャは、異なる電子メール・メッセージのシグネチャを比較する際に類似性測度の使用を可能にする、様々なアルゴリズムを使用して作成される。
一実施形態では、類似度算出モジュール300は、以下により詳細に説明するとおり、雑音を示すデータを検出することと、着信電子メール・メッセージから、そのメッセージのシグネチャを生成するのに先立って、その雑音を除去することを担う、着信メッセージ・クリーニング・アルゴリズム308も含む。
類似アイデンティファイア312は、各着信電子メール・メッセージのシグネチャを、スパム・データベース304の中に格納されたスパム・メッセージのシグネチャと比較することと、その比較に基づき、着信電子メール・メッセージが、何らかのスパム・メッセージに類似しているかどうかを判定することを担う。
一実施形態では、スパム・データベース304は、スパム・メッセージが雑音低減プロセスを受ける前のスパム・メッセージ(すなわち、雑音のあるスパム・メッセージ)に対して生成されたシグネチャと、スパム・メッセージが雑音低減プロセスを受けた後のスパム・メッセージ(すなわち、低減された雑音を有するスパム・メッセージ)に対して生成されたシグネチャを格納する。この実施形態では、メッセージ・データ・ジェネレータ310がまず、雑音低減に先立って、着信電子メール・メッセージのシグネチャを生成し、類似アイデンティファイア312が、そのシグネチャを、雑音のあるスパム・メッセージのシグネチャと比較する。この比較により、着信電子メール・メッセージが、それらのスパム・メッセージの1つに類似していることが示された場合、類似アイデンティファイア312が、その着信電子メール・メッセージにスパムとしてマークを付ける。代替として、類似アイデンティファイア312は、着信メッセージ・クリーニング・アルゴリズム308を呼び出して、着信電子メール・メッセージから雑音を除去する。次に、メッセージ・データ・ジェネレータ310が、その変更された着信メッセージに関するシグネチャを生成し、このシグネチャが、次に、類似アイデンティファイア312によって、低減された雑音を有するスパム・メッセージのシグネチャと比較される。
図4は、スパム・メッセージを扱うためのプロセス400の一実施形態を示す流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。一実施形態では、処理論理は、図1の制御センタ102に存在する。
図4を参照すると、プロセス400は、処理論理が、スパム・メッセージを受け取ることから始まる(処理ブロック402)。
処理ブロック404で、処理論理は、スパム・メッセージを変更して、雑音を低減させる。雑音低減アルゴリズムの一実施形態は、図9と図10に関連して、以下により詳細に説明する。
処理ブロック406で、処理論理はスパム・メッセージのシグネチャを生成する。一実施形態では、スパム・メッセージのシグネチャは、図6Aに関連して以下により詳細に説明するとおり、着信電子メール・メッセージを構成するトークン(例えば、文字、語、行など)のセットに関して計算されたハッシュ値のリストを含む。他の諸実施形態では、着信電子メール・メッセージのシグネチャは、電子メール・メッセージのコンテンツを特徴付ける、他の様々なデータを含む。
処理ブロック408で、処理論理は、スパム・メッセージのシグネチャをサーバ(例えば、図1のサーバ104)に転送し、サーバは、スパム・メッセージのそのシグネチャを使用して、そのスパム・メッセージに類似する着信電子メール・メッセージを探し出す(ブロック410)。
図5は、類似性測度に基づいて電子メール・スパムをフィルタ処理するためのプロセス500の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。一実施形態では、処理論理は、図1のサーバ104に存在する。
図5を参照すると、プロセス500は、処理論理が着信電子メール・メッセージを受け取ることから始まる(処理ブロック502)。
処理ブロック504で、処理論理は、着信メッセージを変更して、雑音を低減させる。雑音低減アルゴリズムの一実施形態は、図9と図10に関連して、以下により詳細に説明する。
処理ブロック506で、処理論理は、着信メッセージのコンテンツに基づき、着信メッセージのシグネチャを生成する。一実施形態では、着信電子メール・メッセージのシグネチャは、図6Aに関連して以下により詳細に説明するとおり、着信電子メール・メッセージを構成するトークン(例えば、文字、語、行など)のセットに関して計算されたハッシュ値のリストを含む。他の諸実施形態では、着信電子メール・メッセージのシグネチャは、電子メール・メッセージのコンテンツを特徴付ける、他の様々なデータを含む。
処理ブロック508で、処理は、着信メッセージのシグネチャをスパム・メッセージのシグネチャと比較する。
処理ブロック510で、着信メッセージのシグネチャと何らかのスパム・メッセージのシグネチャの間の類似が、閾値類似性測度を超えている、と処理論理が判定する。2つのメッセージ間の類似を判定するためのプロセスの一実施形態は、図6Bに関連して以下により詳細に説明する。
処理ブロック512で、処理論理は、着信電子メール・メッセージにスパムとしてマークを付ける。
図6Aは、電子メール・メッセージのシグネチャを作成するためのプロセス600の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。一実施形態では、処理論理は、図1のサーバ104に存在する。
図6Aを参照すると、プロセス600は、処理論理が、電子メール・メッセージをトークン・セットに分割することから始まる(処理ブロック602)。各トークン・セットは、電子メール・メッセージからの事前定義された数の順次ユニットを含む。事前定義された数は、1以上である。ユニットは、電子メール・メッセージの中の文字、語、または行を表わす。一実施形態では、各トークン・セットは、電子メール・メッセージの中のそのトークン・セットの出現の回数と組み合わせられる。
処理ブロック604で、処理論理は、それらのトークン・セットに関するハッシュ値を計算する。一実施形態では、ハッシュ値は、トークン・セットと対応するトークン出現回数との各組み合わせにハッシュ関数を適用することによって計算される。
処理ブロック606で、処理論理は、計算されたハッシュ値を使用して、電子メール・メッセージに関するシグネチャを作成する。一実施形態では、シグネチャは、計算されたハッシュ値のサブセットを選択し、電子メール・メッセージを特徴付けるパラメータを、計算されたハッシュ値の選択されたサブセットに加えることによって作成される。パラメータは、例えば、電子メール・メッセージのサイズ、計算されるハッシュ値の数、電子メール・メッセージに関連するキーワード、添付ファイルの名前などを指定することが可能である。
一実施形態では、電子メール・メッセージに関するシグネチャは、図7と図8に関連して以下により詳細に説明する、文字ベースのドキュメント比較機構を使用して作成される。
図6Bは、電子メール・メッセージのシグネチャを使用してスパムを検出するためのプロセス650の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。一実施形態では、処理論理は、図1のサーバ104に存在する。
図6Bを参照すると、プロセス650は、着信電子メール・メッセージのシグネチャの中のデータを、各スパム・メッセージのシグネチャの中のデータと比較する。シグネチャ・データは、電子メール・メッセージのコンテンツを特徴付けるパラメータと、電子メール・メッセージの中に含まれるトークンに関して生成されたハッシュ値のサブセットとを含む。パラメータは、例えば、電子メール・メッセージのサイズ、電子メール・メッセージの中のトークンの数、電子メール・メッセージに関連するキーワード、添付ファイルの名前などを指定する。
処理論理は、着信電子メール・メッセージのシグネチャの中のパラメータを、各スパム・メッセージのシグネチャの中の対応するパラメータと比較することから始まる(処理ブロック652)。
判定ボックス654で、処理論理は、いずれかのスパム・メッセージ・シグネチャが、着信メッセージ・シグネチャのパラメータに類似するパラメータを含むかどうかを判定する。類似性は、例えば、2つのパラメータ間の許容される差、または2つのパラメータの許容される比に基づいて判定される。
スパム・メッセージ・シグネチャのいずれも、着信メッセージ・シグネチャのパラメータに類似するパラメータを含まない場合、処理論理は、その着信電子メール・メッセージが正当である(すなわち、スパムではない)と判定する(処理ブロック662)。
代替として、1つまたは複数のスパム・メッセージ・シグネチャが、類似するパラメータを有する場合、処理論理は、最初のスパム・メッセージのシグネチャが、着信電子メールのシグネチャの中のハッシュ値に類似するハッシュ値を有するかどうかを判定する(判定ボックス656)。類似性閾値に基づき、ハッシュ値は、例えば、ある数のハッシュ値が一致する場合、または一致するハッシュ値と一致しないハッシュ値の比が、指定された閾値を超えた場合、類似していると見る。
最初のスパム・メッセージ・シグネチャが、着信電子メール・シグネチャのハッシュ値に類似するハッシュ値を有する場合、処理論理は、着信電子メールはスパムであると判定する(処理ブロック670)。それ以外の場合、処理論理は、類似するパラメータを有する、さらなるスパム・メッセージ・シグネチャが存在するかどうかをさらに判定する(判定ブロック658)。存在する場合、処理論理は、次のスパム・メッセージ・シグネチャが、着信電子メール・シグネチャのハッシュ値に類似するハッシュ値を有するかどうかを判定する(判定ボックス656)。類似するハッシュ値を有する場合、処理論理は、その着信電子メール・メッセージはスパムであると判定する(処理ブロック670)。類似するハッシュ値を有さない場合、処理論理は、処理ブロック658に戻る。
処理論理は、類似するパラメータを有する他のスパム・メッセージ・シグネチャが全く存在しないと判定した場合、その着信メール・メッセージはスパムではないと判定する(処理ブロック662)。
文字ベースのドキュメント比較機構
図7は、ドキュメントの文字ベースの比較のためのプロセス700の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。
図7を参照すると、プロセス700は、処理論理がドキュメントを前処理することから始まる(処理ブロック702)。一実施形態では、ドキュメントは、ドキュメント内のそれぞれの大文字の英字を小文字の英字に変更することによって前処理される。例えば、「I am Sam,Sam I am」というメッセージが前処理されて、「i.am.sam.sam.i.am」という表現になる。
処理ブロック704で、処理論理は、ドキュメントをトークンに分割し、各トークンが、ドキュメントからの所定の数の順次の文字を含む。一実施形態では、各トークンは、そのトークンの出現回数と組み合わせられる。この組み合わせは、ラベル付きシングル(shingle)と呼ばれる。例えば、トークン内の順次の文字の所定の数が3に等しい場合、上記に規定した表現は、ラベル付きシングルの以下のセットを含む。
Figure 0004598774
一実施形態では、シングルは、ヒストグラムとして表される。
処理ブロック706で、処理論理は、トークンに関するハッシュ値を計算する。一実施形態では、ハッシュ値は、ラベル付きシングルに関して計算される。例えば、上記の各ラベル付きシングルにハッシュ関数H(x)が適用された場合、以下の結果がもたらされる。すなわち、
Figure 0004598774
一実施形態では、処理論理は、ハッシュ値を以下のとおり並べ替える。すなわち、
Figure 0004598774
処理ブロック708で、処理論理は、計算されたハッシュ値からハッシュ値のサブセットを選択する。一実施形態では、処理論理は、並べ替えられたハッシュ値から、小さい方からX個の値を選択し、それらの値から、ドキュメントの「スケッチ」を作成する。例えば、X=4の場合、スケッチは、以下のとおり表現される。すなわち、
[163393269 200404023 220443033 244485639]
処理ブロック710で、処理論理は、スケッチに、ドキュメントのトークンに関するパラメータを加えることによって、ドキュメントのシグネチャを作成する。一実施形態では、パラメータは、ドキュメントの中における最初のトークンの数を指定する。前述の例では、最初のトークンの数は、15である。したがって、ドキュメントのシグネチャは、以下のとおり表現される。すなわち、
[15 163393269 200404023 220443033 244485639]
代替として、パラメータは、ドキュメントのコンテンツの他の任意の特性(例えば、ドキュメントのサイズ、ドキュメントに関連するキーワードなど)を指定してもよい。
図8は、2つのドキュメントが類似しているかどうかを判定するためのプロセス800の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。
図8を参照すると、プロセス800は、処理論理が、ドキュメント1のシグネチャの中で指定されたトークン数と、ドキュメント2のシグネチャの中で指定されたトークン数を比較して、第1のシグネチャの中のトークン数が、第2のシグネチャからのトークン数に対して、許容される範囲内にあるかどうかを判定することから始まる(判定ブロック802)。例えば、許容される範囲は、1つ以内の違い、または90パーセント以上の比である。
第1のシグネチャの中のトークン数が、第2のシグネチャからのトークン数に対して、許容される範囲外である場合、処理論理は、ドキュメント1とドキュメント2は異なると判定する(処理ブロック808)。そうではなく、第1のシグネチャの中のトークン数が、第2のシグネチャからのトークン数に対して、許容される範囲内にある場合、処理論理は、シグネチャ1の中のハッシュ値と、シグネチャ2の中のハッシュ値の間の類似が閾値を超えている(例えば、95パーセントを超えるハッシュ値が同一である)かどうかを判定する(判定ボックス804)。超えている場合、処理論理は、2つのドキュメントは類似していると判定する(処理ブロック806)。超えていない場合、処理論理は、ドキュメント1とドキュメント2は異なると判定する(処理ブロック808)。
雑音低減を使用する電子メールスパムフィルタ処理
図9は、電子メール・メッセージの中の雑音を低減するためのプロセス900の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。
図9を参照すると、プロセス900は、処理論理が、電子メール・メッセージの中で、雑音を示すデータを検出することから始まる(処理ブロック902)。前述したとおり、雑音は、メール・メッセージの受信者に見えず、スパム・フィルタ処理を回避するために電子メール・メッセージに追加されているデータを表す。そのようなデータには、例えば、フォーマット・データ(例えば、HTMLタグ)、数値文字参照、文字エンティティ参照、事前定義されたカテゴリのURLデータなどが含まれる。数値文字参照は、ドキュメント文字セットのなかの文字のコード位置を指定する。文字エンティティ参照は、シンボリック名を使用して、作成者が、コード位置を憶えている必要がないようにする。例えば、&aringという文字エンティティ参照は、ringリングの上に置かれた小文字「a」を指す。
処理ブロック904で、処理論理は、電子メール・メッセージのコンテンツを変更して、雑音を低減する。一実施形態では、コンテンツ変更には、フォーマット・データを除去することや、数値文字参照や文字エンティティ参照をASCII等価物に変換すること、URLデータを変更することが含まれる。
処理ブロック906で、処理論理は、電子メール・メッセージの変更されたコンテンツをスパム・メッセージのコンテンツと比較する。一実施形態では、比較は、厳密な一致を識別するように実行される。代替として、比較は、2つのドキュメントが類似しているかどうかを判定するように実行される。
図10は、電子メール・メッセージを変更して、雑音を低減させるためのプロセス1000の一実施形態の流れ図である。プロセスは、ハードウェア(例えば、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(汎用コンピュータ・システム上、または専用マシン上で実行されるような)、またはそれらの組み合わせを含む処理論理によって実行される。
図10を参照すると、プロセス1000は、処理論理が、フォーマット・データ(例えば、HTMLタグ)を求めて、電子メール・メッセージを調べることから始まる(処理ブロック1002)。
判定ボックス1004で、処理論理は、見つかったフォーマット・データが、例外として適格であるかどうかを判定する。通常、HTMLフォーマットは、メッセージの情報コンテンツに何も追加しない。しかし、いくつかの例外が存在する。それらの例外は、メッセージのさらなる処理のための有用な情報を含むタグ(例えば、<BODY>、<A>、<IMG>、<FONT>などのタグ)である。例えば、<FONT>タグと<BODY>タグは、「白地に白(white on white)」のテキストを無くすために必要とされ、<A>タグと<IMG>タグは、通常、データをシステムの他のコンポーネントに渡すために使用されるリンク情報を含む。
フォーマット・データが、例外として適格でない場合、そのフォーマット・データは、電子メール・メッセージから抜き取られる(処理ブロック1006)。
次に、処理論理は、各数値文字参照と各文字エンティティ参照を、対応するASCII文字に変換する(処理ブロック1008)。
HTMLでは、数値文字参照は、以下の2つの形態をとる。すなわち、
1.Dが10進数である、「&#D;」という構文が、ISO10646の10進文字番号Dを指し、
2.Hが16進数である「&#xH;」または「&#XH;」という構文が、ISO10646の16進文字番号Hを指す。数値文字参照における16進数字は、大文字と小文字の区別がない。
例えば、本文中のランダム化された文字は、以下の表現のとおり現れる。すなわち、
Figure 0004598774
この表現は、「The SavingsRegister wants you」という句の意味を有する。
ときとして、処理ブロック1008において実行される変換は、繰り返される必要がある。例えば、「&」という文字列は、ASCIIにおいて「&」という文字列に対応し、「#」という文字列は、ASCIIにおいて「#」という文字列に対応し、「3」という文字列は、ASCIIにおいて3に対応し、「#56;」という文字列は、ASCIIにおいて8に対応し、「#59;」は、ASCIIにおいて「;」という文字列に対応する。このため、結合された文字列、「&#3#56;#59;」は、変換されると、変換される必要がある「&」という文字列をもたらす。
したがって、処理ブロック1008における最初の変換オペレーションの後、処理論理は、変換済みのデータが、数値文字参照または文字エンティティ参照を依然として含むかどうかを調べる(判定ボックス1010)。検査が肯定的であった場合、処理論理は、処理ブロック1008において変換オペレーションを繰り返す。肯定的ではなかった場合、処理論理は、処理ブロック1012に進む。
処理ブロック1012で、処理論理は、事前定義されたカテゴリのURLデータを変更する。それらのカテゴリには、例えば、処理論理によって、対応するASCII文字に変換される、URLの中に含まれる数値文字参照が含まれる。さらに、URL「パスワード」構文を使用して、URLホスト名の中で「@」の前に文字を追加することができる。それらの文字は、目標のWebサーバによって無視されるが、相当な量の雑音情報を各URLに追加する。処理論理は、それらの追加の文字を除去することによってURLデータを変更する。最後に、処理論理は、URLの終端における「?」という文字列の後に続く、URLの「クエリ」部分を除去する。
URLの例は、以下のとおりである。すなわち、
http%3a%2f%2flotsofjunk@www.foo.com%2fbar.html?muchmorejunk
処理論理は、上記のURLデータをhttp://www.foo.com/bar.htmlに変更する。
例示的なコンピュータ・システム
図11は、本明細書で説明するオペレーションの1つまたは複数を実行するのに使用することができる例示的なコンピュータ・システム1100のブロック図である。代替の実施形態では、マシンは、ネットワーク・ルータ、ネットワーク・スイッチ、ネットワーク・ブリッジ、パーソナル・デジタル・アシスタント(PDA)、セルラー電話、Web機器、あるいはそのマシンによって行われるアクションを指定する一連の命令を実行することができる任意のマシンを含む。
コンピュータ・システム1100は、バス1108を介して互いに通信する、プロセッサ1102、メイン・メモリ1104、スタティック・メモリ1106を含む。コンピュータ・システム1100は、ビデオ・ディスプレイ・ユニット1110(例えば、液晶ディスプレイ(LCD)または陰極線管(CRT))をさらに含むことが可能である。また、コンピュータ・システム1100は、英数字入力デバイス1112(例えば、キーボード)、カーソル制御デバイス1114(例えば、マウス)、ディスク・ドライブ・ユニット1116、信号生成デバイス1120(例えば、スピーカ)、ネットワーク・インタフェース・デバイス1122も含む。
ディスク・ドライブ・ユニット1116は、前述した方法のいずれか1つ、またはすべてを実施する命令セット(すなわち、ソフトウェア)1126が格納されているコンピュータ可読媒体1124を含む。ソフトウェア1126は、メイン・メモリ1104内、および/またはプロセッサ1102内にも、完全に、または部分的に存在するように図示されている。ソフトウェア1126は、ネットワーク・インタフェース・デバイス1122を介して、さらに送信、または受信される。本明細書では、「コンピュータ可読媒体」という用語は、コンピュータによる実行のための、コンピュータが、本発明の方法のいずれか1つを実行するようにさせる一連の命令を格納する、または符号化することができる任意の媒体を含むと解釈される。したがって、「コンピュータ可読媒体」には、ソリッドステート・メモリ、光ディスクや磁気ディスク、搬送波信号が含まれるが、これらに限定されない。
以上の説明を読んだ後、本発明の多くの代替形態および変更形態が当業者には明白となるに違いないが、例示として図示し、説明したいずれの特定の実施形態も、限定するものと見なされることは全く意図していないことを理解されたい。したがって、様々な実施形態の詳細についての言及は、本発明に不可欠であると見なされる特徴だけを記載する特許請求の範囲を限定することを意図していない。
スパム電子メールの配信を制御するためのシステムの一実施形態を示すブロック図である。 スパム・コンテンツ準備モジュールの一実施形態を示すブロック図である。 類似度算出モジュールの一実施形態を示すブロック図である。 スパム・メッセージを扱うためのプロセスの一実施形態を示す流れ図である。 類似点測度に基づいて電子メール・スパムをフィルタ処理するためのプロセスの一実施形態を示す流れ図である。 電子メール・メッセージのシグネチャを作成するためのプロセスの一実施形態を示す流れ図である。 電子メール・メッセージのシグネチャを使用してスパムを検出するためのプロセスの一実施形態を示す流れ図である。 ドキュメントの文字ベースの比較のためのプロセスの一実施形態を示す流れ図である。 2つのドキュメントが類似しているかどうかを判定するためのプロセスの一実施形態を示す流れ図である。 電子メール・メッセージの中の雑音を低減するためのプロセスの一実施形態を示す流れ図である。 電子メール・メッセージを変更して雑音を低減するためのプロセスの一実施形態を示す流れ図である。 例示的なコンピュータ・システムを示すブロック図である。

Claims (24)

  1. 電子メール・メッセージを受信するための受信手段と、
    前記電子メール・メッセージに、第1の文字セット内の文字の位置を示す文字参照が一つ以上含まれているか否かを検出する検出手段と、
    前記検出した一つ以上の文字参照の内の少なくとも一つを前記第1の文字セット内の位置に対応する文字に変更することによって、前記電子メール・メッセージのコンテンツを修正する修正手段と、
    前記電子メール・メッセージの修正されたコンテンツに基づいて、前記電子メール・メッセージを特徴付けるデータを生成するデータ生成手段と、
    前記電子メール・メッセージを特徴付ける前記データを、複数のスパム・メッセージを特徴付けるデータのセットと比較する比較手段と、
    前記電子メール・メッセージを特徴付ける前記データと、前記複数のスパム・メッセージを特徴付けるデータの前記セット内のいずれかのデータ項目の間の類似が、閾値を超えるかどうかを判定する判定手段と
    を含む装置。
  2. 前記一つ以上の文字参照は、「&#<数値>」の構文を持つHTML文字参照(ただし、「<数値>」は10進文字番号または16進文字番号)である請求項1に記載の装置。
  3. スパム・メッセージを受信するための受信手段と、
    前記スパム・メッセージに、第1の文字セット内の文字の位置を示す文字参照が一つ以上含まれているか否かを検出するための検出手段と、
    前記検出した一つ以上の文字参照の内の少なくとも一つを前記第1の文字セット内の位置に対応する文字に変更することによって、前記スパム・メッセージのコンテンツを修正する修正手段と、
    前記スパム・メッセージの修正されたコンテンツに基づいて、前記スパム・メッセージを特徴付けるデータを生成する生成手段と、
    前記スパム・メッセージに類似する着信メッセージを探し出すのに後に使用される、前記スパム・メッセージを特徴付ける前記データを、サーバに転送する転送手段と
    を含む装置。
  4. 前記第1の文字セットがASCII文字セットである請求項3に記載の装置。
  5. 前記一つ以上の文字参照の内の少なくとも一つは、スパム・メッセージ内のURL内にある請求項3に記載の装置。
  6. 処理システム上で実行されると、
    前記処理システムの受信手段が、電子メール・メッセージを受信すること、
    前記電子メール・メッセージに、第1の文字セット内の文字の位置を示す文字参照が一つ以上含まれているか否かを、前記処理システムの検出手段が検出すること、
    前記検出した一つ以上の文字参照の内の少なくとも一つを前記第1の文字セット内の位置に対応する文字に変更することによって、前記電子メール・メッセージのコンテンツを、前記処理システムの修正手段が修正すること、
    前記電子メール・メッセージの修正されたコンテンツに基づいて、前記電子メール・メッセージを特徴付けるデータを、前記処理システムの生成手段が生成すること、
    前記処理システムの比較手段が、前記電子メール・メッセージを特徴付ける前記データを、複数のスパム・メッセージを特徴付けるデータのセットと比較すること、
    前記処理システムの判定手段が、前記電子メール・メッセージを特徴付ける前記データと、前記複数のスパム・メッセージを特徴付けるデータの前記セット内のいずれかのデータ項目の間の類似が、閾値を超えるかどうかを判定すること
    を含む方法を実行するようにさせる実行可能命令を含むコンピュータ可読媒体。
  7. 前記第1の文字セットがASCII文字セットである請求項6に記載のコンピュータ可読媒体。
  8. 前記一つ以上の文字参照は数値文字参照または文字エンティティ参照を含む請求項6に記載のコンピュータ可読媒体。
  9. 処理システム上で実行されると、
    前記処理システムの受信手段が、スパム・メッセージを受信すること、
    前記スパム・メッセージに、第1の文字セット内の文字の位置を示す文字参照が一つ以上含まれているか否かを、前記処理システムの検出手段が検出すること、
    前記処理システムの修正手段が、前記検出した一つ以上の文字参照の内の少なくとも一つを前記第1の文字セット内の位置に対応する文字に変更することによって、前記スパム・メッセージのコンテンツを修正すること、
    前記処理システムの生成手段が、前記スパム・メッセージの修正されたコンテンツに基づいて、前記スパム・メッセージを特徴付けるデータを生成すること、
    前記処理システムの転送手段が、前記スパム・メッセージに類似する着信メッセージを探し出すのに後に使用される、前記スパム・メッセージを特徴付ける前記データを、サーバに転送すること
    を含む方法を実行するようにさせる実行可能命令を含むコンピュータ可読媒体。
  10. 前記第1の文字セットがASCII文字セットである請求項9に記載のコンピュータ可読媒体。
  11. 前記スパム・メッセージのコンテンツを修正することが、
    前記スパム・メッセージ内の第1のグループの文字参照を前記第1の文字セット内の対応する文字に、前記修正手段が変更すること、
    前記変更された第1のグループの文字参照が新たなグループの文字参照を形成するとの決定を、前記修正手段がなすこと、
    前記決定に応答して、前記新たなグループの文字参照を前記第1の文字セット内の対応する文字に、前記修正手段が変更すること
    を含む請求項9に記載のコンピュータ可読媒体。
  12. 電子メール・メッセージの中で、スパム・フィルタ処理を回避するように前記電子メール・メッセージに追加された雑音を示すデータを検出し、前記電子メール・メッセージのコンテンツを変更して、前記雑音を低減させるメッセージ・クリーニング手段であって
    前記電子メール・メッセージ内の一つ以上の文字参照を検出するための文字参照検出手段と、
    前記一つ以上の文字参照の少なくとも一つを、第1の文字セット内の対応する文字に変更する文字参照変更手段と
    を有したメッセージ・クリーニング手段と、
    前記電子メール・メッセージの前記変更されたコンテンツをスパム・メッセージのコンテンツと比較する類似アイデンティファイア手段
    を含むシステム。
  13. 前記一つ以上の文字参照は数値文字参照を含む請求項12に記載のシステム。
  14. 前記メッセージ・クリーニング手段は、例外として適格でないフォーマット・データを前記電子メール・メッセージから抜き取ることによって、前記電子メール・メッセージの前記コンテンツを変更することを含む請求項12に記載のシステム。
  15. 前記一つ以上の文字参照は文字エンティティ参照を含む請求項12に記載のシステム。
  16. 前記文字参照検出手段が、変更された第1のグループの文字参照が新たなグループの文字参照を形成するとの決定をなす手段をさらに含み、
    前記文字参照変更手段が、前記決定に応答して、前記新たなグループの文字参照を前記第1の文字セット内の対応する文字に変更する手段をさらに含む請求項12に記載のシステム。
  17. 前記第1の文字セットがASCII文字セットである請求項12に記載のシステム。
  18. 前記メッセージ・クリーニング手段は、URLから、事前定義されたカテゴリの一意識別子データを除去することによって、前記電子メール・メッセージの前記コンテンツを変更する手段を含む請求項12に記載のシステム。
  19. 前記メッセージ・クリーニング手段は、URLから、事前定義されたカテゴリのクエリ・データを除去することによって、前記電子メール・メッセージの前記コンテンツを変更する手段を含む請求項12に記載のシステム。
  20. 前記類似アイデンティファイア手段は、前記電子メール・メッセージの前記変更されたコンテンツが、前記スパム・メッセージの前記コンテンツに類似しているかどうかを判定することによって、前記電子メール・メッセージの前記変更されたコンテンツを、前記スパム・メッセージの前記コンテンツと比較する手段を含む請求項12に記載のシステム。
  21. 電子メール・メッセージの中で、スパム・フィルタ処理を回避するために前記電子メール・メッセージに追加された一つ以上の文字参照であって数値文字参照または文字エンティティ参照を含む文字参照を検出する検出手段と、
    前記一つ以上の文字参照の少なくとも一つを、第1の文字セット内の対応する文字に変更することによって、前記電子メール・メッセージのコンテンツを変更する変更手段と、
    前記電子メール・メッセージの前記変更されたコンテンツを、スパム・メッセージのコンテンツと比較する比較手段と
    を含む装置。
  22. 前記第1の文字セットがASCII文字セットである請求項21に記載の装置。
  23. 処理システム上で実行されると、
    前記処理システムの検出手段が、電子メール・メッセージの中で、スパム・フィルタ処理を回避するために前記電子メール・メッセージに追加された一つ以上の文字参照であって数値文字参照または文字エンティティ参照を含む文字参照を検出すること、
    前記処理システムの変更手段が、前記一つ以上の文字参照の少なくとも一つを、第1の文字セット内の対応する文字に変更することによって、前記電子メール・メッセージのコンテンツを変更ること、
    前記処理システムの比較手段が、前記電子メール・メッセージの前記変更されたコンテンツを、スパム・メッセージのコンテンツと比較すること
    を含む方法を実行するようにさせる実行可能命令を含むコンピュータ可読媒体。
  24. 前記一つ以上の文字参照の内の少なくとも一つは、前記電子メール・メッセージ内のURL内にある請求項23に記載のコンピュータ可読媒体。
JP2006533134A 2003-05-15 2004-05-14 類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法および装置 Expired - Fee Related JP4598774B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US47124203P 2003-05-15 2003-05-15
PCT/US2004/015383 WO2004105332A2 (en) 2003-05-15 2004-05-14 Method and apparatus for filtering email spam based on similarity measures

Publications (3)

Publication Number Publication Date
JP2007503660A JP2007503660A (ja) 2007-02-22
JP2007503660A5 JP2007503660A5 (ja) 2007-06-21
JP4598774B2 true JP4598774B2 (ja) 2010-12-15

Family

ID=33476818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006533134A Expired - Fee Related JP4598774B2 (ja) 2003-05-15 2004-05-14 類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法および装置

Country Status (5)

Country Link
US (4) US7831667B2 (ja)
EP (1) EP1649645A2 (ja)
JP (1) JP4598774B2 (ja)
TW (1) TWI348851B (ja)
WO (1) WO2004105332A2 (ja)

Families Citing this family (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7487232B1 (en) 2000-09-13 2009-02-03 Fortinet, Inc. Switch management system and method
US7389358B1 (en) * 2000-09-13 2008-06-17 Fortinet, Inc. Distributed virtual system to support managed, network-based services
US7272643B1 (en) * 2000-09-13 2007-09-18 Fortinet, Inc. System and method for managing and provisioning virtual routers
US7444398B1 (en) * 2000-09-13 2008-10-28 Fortinet, Inc. System and method for delivering security services
US7574495B1 (en) 2000-09-13 2009-08-11 Fortinet, Inc. System and method for managing interworking communications protocols
US8056131B2 (en) * 2001-06-21 2011-11-08 Cybersoft, Inc. Apparatus, methods and articles of manufacture for intercepting, examining and controlling code, data and files and their transfer
US7181547B1 (en) 2001-06-28 2007-02-20 Fortinet, Inc. Identifying nodes in a ring network
US7376125B1 (en) * 2002-06-04 2008-05-20 Fortinet, Inc. Service processing switch
US7177311B1 (en) * 2002-06-04 2007-02-13 Fortinet, Inc. System and method for routing traffic through a virtual router-based network switch
US7203192B2 (en) 2002-06-04 2007-04-10 Fortinet, Inc. Network packet steering
US7161904B2 (en) 2002-06-04 2007-01-09 Fortinet, Inc. System and method for hierarchical metering in a virtual router based network switch
US7116665B2 (en) * 2002-06-04 2006-10-03 Fortinet, Inc. Methods and systems for a distributed provider edge
US8046832B2 (en) * 2002-06-26 2011-10-25 Microsoft Corporation Spam detector with challenges
US7096383B2 (en) 2002-08-29 2006-08-22 Cosine Communications, Inc. System and method for virtual router failover in a network routing system
AU2003260489A1 (en) 2002-09-04 2004-03-29 Novartis Ag Treatment of neurological disorders by dsrna adminitration
US7266120B2 (en) * 2002-11-18 2007-09-04 Fortinet, Inc. System and method for hardware accelerated packet multicast in a virtual routing system
AU2003293501A1 (en) * 2002-12-13 2004-07-09 Wholesecurity, Inc. Method, system, and computer program product for security within a global computer network
US7831667B2 (en) * 2003-05-15 2010-11-09 Symantec Corporation Method and apparatus for filtering email spam using email noise reduction
US8145710B2 (en) 2003-06-18 2012-03-27 Symantec Corporation System and method for filtering spam messages utilizing URL filtering module
US7711779B2 (en) 2003-06-20 2010-05-04 Microsoft Corporation Prevention of outgoing spam
US7451487B2 (en) 2003-09-08 2008-11-11 Sonicwall, Inc. Fraudulent message detection
US8271588B1 (en) 2003-09-24 2012-09-18 Symantec Corporation System and method for filtering fraudulent email messages
US20050131876A1 (en) * 2003-12-10 2005-06-16 Ahuja Ratinder Paul S. Graphical user interface for capture system
US7814327B2 (en) 2003-12-10 2010-10-12 Mcafee, Inc. Document registration
US8548170B2 (en) 2003-12-10 2013-10-01 Mcafee, Inc. Document de-registration
US7899828B2 (en) 2003-12-10 2011-03-01 Mcafee, Inc. Tag data structure for maintaining relational data over captured objects
US7984175B2 (en) 2003-12-10 2011-07-19 Mcafee, Inc. Method and apparatus for data capture and analysis system
US7774604B2 (en) 2003-12-10 2010-08-10 Mcafee, Inc. Verifying captured objects before presentation
US8656039B2 (en) 2003-12-10 2014-02-18 Mcafee, Inc. Rule parser
JP4297345B2 (ja) * 2004-01-14 2009-07-15 Kddi株式会社 マスメイル検出方式およびメイルサーバ
US8301702B2 (en) * 2004-01-20 2012-10-30 Cloudmark, Inc. Method and an apparatus to screen electronic communications
US7930540B2 (en) 2004-01-22 2011-04-19 Mcafee, Inc. Cryptographic policy enforcement
US8886727B1 (en) * 2004-01-27 2014-11-11 Sonicwall, Inc. Message distribution control
US9471712B2 (en) * 2004-02-09 2016-10-18 Dell Software Inc. Approximate matching of strings for message filtering
US20050204005A1 (en) * 2004-03-12 2005-09-15 Purcell Sean E. Selective treatment of messages based on junk rating
US8171549B2 (en) * 2004-04-26 2012-05-01 Cybersoft, Inc. Apparatus, methods and articles of manufacture for intercepting, examining and controlling code, data, files and their transfer
US7941490B1 (en) * 2004-05-11 2011-05-10 Symantec Corporation Method and apparatus for detecting spam in email messages and email attachments
US7912905B2 (en) * 2004-05-18 2011-03-22 Computer Associates Think, Inc. System and method for filtering network messages
US7434058B2 (en) * 2004-06-07 2008-10-07 Reconnex Corporation Generating signatures over a document
US7962591B2 (en) 2004-06-23 2011-06-14 Mcafee, Inc. Object classification in a capture system
US9154511B1 (en) 2004-07-13 2015-10-06 Dell Software Inc. Time zero detection of infectious messages
US7343624B1 (en) * 2004-07-13 2008-03-11 Sonicwall, Inc. Managing infectious messages as identified by an attachment
US7660865B2 (en) * 2004-08-12 2010-02-09 Microsoft Corporation Spam filtering with probabilistic secure hashes
US8560534B2 (en) 2004-08-23 2013-10-15 Mcafee, Inc. Database for a capture system
US7949849B2 (en) 2004-08-24 2011-05-24 Mcafee, Inc. File system for a capture system
US7523098B2 (en) * 2004-09-15 2009-04-21 International Business Machines Corporation Systems and methods for efficient data searching, storage and reduction
US8725705B2 (en) * 2004-09-15 2014-05-13 International Business Machines Corporation Systems and methods for searching of storage data with reduced bandwidth requirements
US7499419B2 (en) * 2004-09-24 2009-03-03 Fortinet, Inc. Scalable IP-services enabled multicast forwarding with efficient resource utilization
US8495144B1 (en) * 2004-10-06 2013-07-23 Trend Micro Incorporated Techniques for identifying spam e-mail
US20060095966A1 (en) * 2004-11-03 2006-05-04 Shawn Park Method of detecting, comparing, blocking, and eliminating spam emails
US7808904B2 (en) * 2004-11-18 2010-10-05 Fortinet, Inc. Method and apparatus for managing subscriber profiles
US8396897B2 (en) * 2004-11-22 2013-03-12 International Business Machines Corporation Method, system, and computer program product for threading documents using body text analysis
US7596700B2 (en) * 2004-12-22 2009-09-29 Storage Technology Corporation Method and system for establishing trusting environment for sharing data between mutually mistrusting entities
US20060149820A1 (en) * 2005-01-04 2006-07-06 International Business Machines Corporation Detecting spam e-mail using similarity calculations
CA2493442C (en) * 2005-01-20 2014-12-16 Certicom Corp. Method and system of managing and filtering electronic messages using cryptographic techniques
WO2006108989A2 (fr) * 2005-04-13 2006-10-19 France Telecom Procede de lutte contre l'envoi d'information vocale non sollicitee
GB2425855A (en) * 2005-04-25 2006-11-08 Messagelabs Ltd Detecting and filtering of spam emails
US8135778B1 (en) 2005-04-27 2012-03-13 Symantec Corporation Method and apparatus for certifying mass emailings
US7516130B2 (en) * 2005-05-09 2009-04-07 Trend Micro, Inc. Matching engine with signature generation
JP4559295B2 (ja) * 2005-05-17 2010-10-06 株式会社エヌ・ティ・ティ・ドコモ データ通信システム及びデータ通信方法
EP1891782B1 (en) * 2005-05-26 2018-08-22 XConnect Global Networks Ltd. Detection of spit in voip calls
US7739337B1 (en) * 2005-06-20 2010-06-15 Symantec Corporation Method and apparatus for grouping spam email messages
US8010609B2 (en) 2005-06-20 2011-08-30 Symantec Corporation Method and apparatus for maintaining reputation lists of IP addresses to detect email spam
US7930353B2 (en) * 2005-07-29 2011-04-19 Microsoft Corporation Trees of classifiers for detecting email spam
US7907608B2 (en) 2005-08-12 2011-03-15 Mcafee, Inc. High speed packet capture
US7818326B2 (en) 2005-08-31 2010-10-19 Mcafee, Inc. System and method for word indexing in a capture system and querying thereof
US7730011B1 (en) 2005-10-19 2010-06-01 Mcafee, Inc. Attributes of captured objects in a capture system
US8065370B2 (en) 2005-11-03 2011-11-22 Microsoft Corporation Proofs to filter spam
US7657104B2 (en) * 2005-11-21 2010-02-02 Mcafee, Inc. Identifying image type in a capture system
CN1987909B (zh) * 2005-12-22 2012-08-15 腾讯科技(深圳)有限公司 一种提纯贝叶斯垃圾邮件的方法、系统及装置
US20070180031A1 (en) * 2006-01-30 2007-08-02 Microsoft Corporation Email Opt-out Enforcement
US7760684B2 (en) 2006-02-13 2010-07-20 Airwide Solutions, Inc. Measuring media distribution and impact in a mobile communication network
US7748022B1 (en) * 2006-02-21 2010-06-29 L-3 Communications Sonoma Eo, Inc. Real-time data characterization with token generation for fast data retrieval
US7668920B2 (en) * 2006-03-01 2010-02-23 Fortinet, Inc. Electronic message and data tracking system
US7627641B2 (en) 2006-03-09 2009-12-01 Watchguard Technologies, Inc. Method and system for recognizing desired email
JP2007257308A (ja) * 2006-03-23 2007-10-04 Canon Inc 文書管理装置、文書管理システム、及びその制御方法、プログラム、記憶媒体
US8504537B2 (en) 2006-03-24 2013-08-06 Mcafee, Inc. Signature distribution in a document registration system
US8010689B2 (en) 2006-05-22 2011-08-30 Mcafee, Inc. Locational tagging in a capture system
US7958227B2 (en) 2006-05-22 2011-06-07 Mcafee, Inc. Attributes of captured objects in a capture system
US7689614B2 (en) 2006-05-22 2010-03-30 Mcafee, Inc. Query generation for a capture system
US8028335B2 (en) 2006-06-19 2011-09-27 Microsoft Corporation Protected environments for protecting users against undesirable activities
KR100809416B1 (ko) * 2006-07-28 2008-03-05 한국전자통신연구원 보안 시스템을 위한 최적 시그니처 자동 생성 장치 및 방법
US7730316B1 (en) * 2006-09-22 2010-06-01 Fatlens, Inc. Method for document fingerprinting
CN101166159B (zh) * 2006-10-18 2010-07-28 阿里巴巴集团控股有限公司 一种确定垃圾信息的方法及系统
US8577968B2 (en) * 2006-11-14 2013-11-05 Mcafee, Inc. Method and system for handling unwanted email messages
US8224905B2 (en) 2006-12-06 2012-07-17 Microsoft Corporation Spam filtration utilizing sender activity data
FI123303B (fi) * 2007-07-17 2013-02-15 Airwide Solutions Oy Sisällön seuranta
FI20075547L (fi) * 2007-07-17 2009-01-18 First Hop Oy Mainosten toimittaminen mobiilissa mainostamisjärjestelmässä
US7765204B2 (en) * 2007-09-27 2010-07-27 Microsoft Corporation Method of finding candidate sub-queries from longer queries
US8037145B2 (en) * 2007-09-30 2011-10-11 Symantec Operating Corporation System and method for detecting email content containment
US20090089383A1 (en) * 2007-09-30 2009-04-02 Tsuen Wan Ngan System and method for detecting content similarity within emails documents employing selective truncation
US8275842B2 (en) * 2007-09-30 2012-09-25 Symantec Operating Corporation System and method for detecting content similarity within email documents by sparse subset hashing
US20090300012A1 (en) * 2008-05-28 2009-12-03 Barracuda Inc. Multilevel intent analysis method for email filtration
CN101594312B (zh) * 2008-05-30 2012-12-26 电子科技大学 一种基于人工免疫与行为特征的垃圾邮件识别方法
US20090319506A1 (en) * 2008-06-19 2009-12-24 Tsuen Wan Ngan System and method for efficiently finding email similarity in an email repository
US8028031B2 (en) * 2008-06-27 2011-09-27 Microsoft Corporation Determining email filtering type based on sender classification
US8205242B2 (en) 2008-07-10 2012-06-19 Mcafee, Inc. System and method for data mining and security policy management
US9253154B2 (en) 2008-08-12 2016-02-02 Mcafee, Inc. Configuration management for a capture/registration system
US8473455B2 (en) 2008-09-03 2013-06-25 Microsoft Corporation Query-oriented message characterization
US8099498B2 (en) * 2008-09-03 2012-01-17 Microsoft Corporation Probabilistic mesh routing
US9704177B2 (en) * 2008-12-23 2017-07-11 International Business Machines Corporation Identifying spam avatars in a virtual universe (VU) based upon turing tests
US9697535B2 (en) * 2008-12-23 2017-07-04 International Business Machines Corporation System and method in a virtual universe for identifying spam avatars based upon avatar multimedia characteristics
US8850591B2 (en) 2009-01-13 2014-09-30 Mcafee, Inc. System and method for concept building
US8706709B2 (en) 2009-01-15 2014-04-22 Mcafee, Inc. System and method for intelligent term grouping
US8473442B1 (en) 2009-02-25 2013-06-25 Mcafee, Inc. System and method for intelligent state management
US8447722B1 (en) 2009-03-25 2013-05-21 Mcafee, Inc. System and method for data mining and security policy management
US8667121B2 (en) 2009-03-25 2014-03-04 Mcafee, Inc. System and method for managing data and policies
KR20100107801A (ko) * 2009-03-26 2010-10-06 삼성전자주식회사 무선 통신 시스템에서 안테나 선택을 위한 장치 및 방법
CN101853260B (zh) * 2009-04-01 2015-02-18 赛门铁克公司 检测电子邮件内容包含的系统和方法
US8656476B2 (en) 2009-05-28 2014-02-18 International Business Machines Corporation Providing notification of spam avatars
US8925087B1 (en) * 2009-06-19 2014-12-30 Trend Micro Incorporated Apparatus and methods for in-the-cloud identification of spam and/or malware
US20110015939A1 (en) * 2009-07-17 2011-01-20 Marcos Lara Gonzalez Systems and methods to create log entries and share a patient log using open-ended electronic messaging and artificial intelligence
US8874663B2 (en) * 2009-08-28 2014-10-28 Facebook, Inc. Comparing similarity between documents for filtering unwanted documents
US8316094B1 (en) * 2010-01-21 2012-11-20 Symantec Corporation Systems and methods for identifying spam mailing lists
US8458268B1 (en) * 2010-02-22 2013-06-04 Symantec Corporation Systems and methods for distributing spam signatures
US8806615B2 (en) 2010-11-04 2014-08-12 Mcafee, Inc. System and method for protecting specified data combinations
US9450781B2 (en) * 2010-12-09 2016-09-20 Alcatel Lucent Spam reporting and management in a communication network
US9384471B2 (en) * 2011-02-22 2016-07-05 Alcatel Lucent Spam reporting and management in a communication network
CN102655480B (zh) * 2011-03-03 2015-12-02 腾讯科技(深圳)有限公司 相似邮件处理系统和方法
US9419928B2 (en) 2011-03-11 2016-08-16 James Robert Miner Systems and methods for message collection
US8819156B2 (en) 2011-03-11 2014-08-26 James Robert Miner Systems and methods for message collection
US9559868B2 (en) 2011-04-01 2017-01-31 Onavo Mobile Ltd. Apparatus and methods for bandwidth saving and on-demand data delivery for a mobile device
US9116879B2 (en) 2011-05-25 2015-08-25 Microsoft Technology Licensing, Llc Dynamic rule reordering for message classification
US9407463B2 (en) * 2011-07-11 2016-08-02 Aol Inc. Systems and methods for providing a spam database and identifying spam communications
US8954458B2 (en) 2011-07-11 2015-02-10 Aol Inc. Systems and methods for providing a content item database and identifying content items
US8700913B1 (en) 2011-09-23 2014-04-15 Trend Micro Incorporated Detection of fake antivirus in computers
US8612436B1 (en) 2011-09-27 2013-12-17 Google Inc. Reverse engineering circumvention of spam detection algorithms
US20130246336A1 (en) 2011-12-27 2013-09-19 Mcafee, Inc. System and method for providing data protection workflows in a network environment
US8935783B2 (en) * 2013-03-08 2015-01-13 Bitdefender IPR Management Ltd. Document classification using multiscale text fingerprints
GB2513885B (en) * 2013-05-08 2021-04-07 Xyratex Tech Limited Methods of clustering computational event logs
RU2013144681A (ru) 2013-10-03 2015-04-10 Общество С Ограниченной Ответственностью "Яндекс" Система обработки электронного сообщения для определения его классификации
US20150295869A1 (en) * 2014-04-14 2015-10-15 Microsoft Corporation Filtering Electronic Messages
US9928465B2 (en) 2014-05-20 2018-03-27 Oath Inc. Machine learning and validation of account names, addresses, and/or identifiers
WO2015196414A1 (en) 2014-06-26 2015-12-30 Google Inc. Batch-optimized render and fetch architecture
JP6211722B2 (ja) 2014-06-26 2017-10-11 グーグル インコーポレイテッド 最適化されたブラウザレンダリング処理
CN106462561B (zh) 2014-06-26 2020-06-09 谷歌有限责任公司 优化浏览器渲染过程
US10002256B2 (en) * 2014-12-05 2018-06-19 GeoLang Ltd. Symbol string matching mechanism
US10229219B2 (en) * 2015-05-01 2019-03-12 Facebook, Inc. Systems and methods for demotion of content items in a feed
TWI569608B (zh) * 2015-10-08 2017-02-01 網擎資訊軟體股份有限公司 用於管制網路傳輸電子郵件之電腦程式產品及其電子郵件傳輸方法
US10049208B2 (en) * 2015-12-03 2018-08-14 Bank Of America Corporation Intrusion assessment system
EP3398301B1 (en) 2015-12-31 2021-02-03 Axon Enterprise, Inc. Systems and methods for filtering messages
CN106372202B (zh) * 2016-08-31 2020-04-17 北京奇艺世纪科技有限公司 文本相似度计算方法及装置
US10657182B2 (en) 2016-09-20 2020-05-19 International Business Machines Corporation Similar email spam detection
JP6533823B2 (ja) * 2017-05-08 2019-06-19 デジタルア−ツ株式会社 情報処理装置、情報処理システム、プログラム、記録媒体及び情報処理方法
US11249965B2 (en) * 2018-05-24 2022-02-15 Paypal, Inc. Efficient random string processing
JP6758542B2 (ja) * 2018-06-01 2020-09-23 三菱電機株式会社 不審メール検知装置、不審メール検知方法および不審メール検知プログラム
US11430244B2 (en) 2020-12-23 2022-08-30 Cylance Inc. Statistical data fingerprinting and tracing data similarity of documents

Family Cites Families (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0240649A (ja) 1988-07-30 1990-02-09 Konica Corp ハロゲン化銀カラー写真感光材料
CA1321656C (en) 1988-12-22 1993-08-24 Chander Kasiraj Method for restricting delivery and receipt of electronic message
GB8918553D0 (en) * 1989-08-15 1989-09-27 Digital Equipment Int Message control system
JPH03117940A (ja) 1989-09-25 1991-05-20 Internatl Business Mach Corp <Ibm> 電子メールの管理方法
US5822527A (en) * 1990-05-04 1998-10-13 Digital Equipment Corporation Method and apparatus for information stream filtration using tagged information access and action registration
GB2271002B (en) 1992-09-26 1995-12-06 Digital Equipment Int Data processing system
US5634005A (en) * 1992-11-09 1997-05-27 Kabushiki Kaisha Toshiba System for automatically sending mail message by storing rule according to the language specification of the message including processing condition and processing content
TW237588B (ja) * 1993-06-07 1995-01-01 Microsoft Corp
JP2837815B2 (ja) * 1994-02-03 1998-12-16 インターナショナル・ビジネス・マシーンズ・コーポレイション 対話型ルール・ベース・コンピュータ・システム
US5675507A (en) * 1995-04-28 1997-10-07 Bobo, Ii; Charles R. Message storage and delivery system
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5619648A (en) 1994-11-30 1997-04-08 Lucent Technologies Inc. Message filtering techniques
CA2220491C (en) * 1995-05-08 2001-07-24 Compuserve Incorporated Rules based electronic message management system
US5678041A (en) * 1995-06-06 1997-10-14 At&T System and method for restricting user access rights on the internet based on rating information stored in a relational database
US5696898A (en) * 1995-06-06 1997-12-09 Lucent Technologies Inc. System and method for database access control
US5845263A (en) * 1995-06-16 1998-12-01 High Technology Solutions, Inc. Interactive visual ordering system
US5826269A (en) * 1995-06-21 1998-10-20 Microsoft Corporation Electronic mail interface for a network server
US5889943A (en) * 1995-09-26 1999-03-30 Trend Micro Incorporated Apparatus and method for electronic mail virus detection and elimination
US5862325A (en) 1996-02-29 1999-01-19 Intermind Corporation Computer-based communication system and method using metadata defining a control structure
US5870548A (en) * 1996-04-05 1999-02-09 Sun Microsystems, Inc. Method and apparatus for altering sent electronic mail messages
US5826022A (en) * 1996-04-05 1998-10-20 Sun Microsystems, Inc. Method and apparatus for receiving electronic mail
US5809242A (en) * 1996-04-19 1998-09-15 Juno Online Services, L.P. Electronic mail system for displaying advertisement at local computer received from remote system while the local computer is off-line the remote system
US5884033A (en) * 1996-05-15 1999-03-16 Spyglass, Inc. Internet filtering system for filtering data transferred over the internet utilizing immediate and deferred filtering actions
US5864684A (en) * 1996-05-22 1999-01-26 Sun Microsystems, Inc. Method and apparatus for managing subscriptions to distribution lists
WO1997046962A1 (en) * 1996-06-07 1997-12-11 At & T Corp. Finding an e-mail message to which another e-mail message is a response
US6453327B1 (en) * 1996-06-10 2002-09-17 Sun Microsystems, Inc. Method and apparatus for identifying and discarding junk electronic mail
US5909677A (en) * 1996-06-18 1999-06-01 Digital Equipment Corporation Method for determining the resemblance of documents
US5926812A (en) * 1996-06-20 1999-07-20 Mantra Technologies, Inc. Document extraction and comparison method with applications to automatic personalized database searching
US5790789A (en) * 1996-08-02 1998-08-04 Suarez; Larry Method and architecture for the creation, control and deployment of services within a distributed computer environment
US5978837A (en) * 1996-09-27 1999-11-02 At&T Corp. Intelligent pager for remotely managing E-Mail messages
US5930479A (en) * 1996-10-21 1999-07-27 At&T Corp Communications addressing system
US5796948A (en) * 1996-11-12 1998-08-18 Cohen; Elliot D. Offensive message interceptor for computers
US6146026A (en) * 1996-12-27 2000-11-14 Canon Kabushiki Kaisha System and apparatus for selectively publishing electronic-mail
JPH10240649A (ja) 1996-12-27 1998-09-11 Canon Inc 電子メール処理装置及びシステム
US5995597A (en) * 1997-01-21 1999-11-30 Woltz; Robert Thomas E-mail processing system and method
CA2282502A1 (en) 1997-02-25 1998-08-27 Intervoice Limited Partnership E-mail server for message filtering and routing
US6189026B1 (en) * 1997-06-16 2001-02-13 Digital Equipment Corporation Technique for dynamically generating an address book in a distributed electronic mail system
US6023700A (en) * 1997-06-17 2000-02-08 Cranberry Properties, Llc Electronic mail distribution system for integrated electronic communication
JPH1115756A (ja) * 1997-06-24 1999-01-22 Omron Corp 電子メール判別方法及び装置並びに記憶媒体
JP3148152B2 (ja) * 1997-06-27 2001-03-19 日本電気株式会社 電子メールシステムを用いた同報メールの配送方法
US7117358B2 (en) * 1997-07-24 2006-10-03 Tumbleweed Communications Corp. Method and system for filtering communication
US6073165A (en) * 1997-07-29 2000-06-06 Jfax Communications, Inc. Filtering computer network messages directed to a user's e-mail box based on user defined filters, and forwarding a filtered message to the user's receiver
US5999967A (en) * 1997-08-17 1999-12-07 Sundsted; Todd Electronic mail filtering by electronic stamp
US6199102B1 (en) * 1997-08-26 2001-03-06 Christopher Alan Cobb Method and system for filtering electronic messages
JP3439330B2 (ja) * 1997-09-25 2003-08-25 日本電気株式会社 電子メールサーバ
US6195686B1 (en) * 1997-09-29 2001-02-27 Ericsson Inc. Messaging application having a plurality of interfacing capabilities
US6393465B2 (en) * 1997-11-25 2002-05-21 Nixmail Corporation Junk electronic mail detector and eliminator
US6381592B1 (en) * 1997-12-03 2002-04-30 Stephen Michael Reuning Candidate chaser
AU1907899A (en) * 1997-12-22 1999-07-12 Accepted Marketing, Inc. E-mail filter and method thereof
US6023723A (en) * 1997-12-22 2000-02-08 Accepted Marketing, Inc. Method and system for filtering unwanted junk e-mail utilizing a plurality of filtering mechanisms
US6052709A (en) * 1997-12-23 2000-04-18 Bright Light Technologies, Inc. Apparatus and method for controlling delivery of unsolicited electronic mail
US5999932A (en) * 1998-01-13 1999-12-07 Bright Light Technologies, Inc. System and method for filtering unsolicited electronic mail messages using data matching and heuristic processing
US5968117A (en) * 1998-01-20 1999-10-19 Aurora Communications Exchange Ltd. Device and system to facilitate accessing electronic mail from remote user-interface devices
US6157630A (en) * 1998-01-26 2000-12-05 Motorola, Inc. Communications system with radio device and server
US6119124A (en) * 1998-03-26 2000-09-12 Digital Equipment Corporation Method for clustering closely resembling data objects
US6161130A (en) * 1998-06-23 2000-12-12 Microsoft Corporation Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set
US6192360B1 (en) * 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
US6314454B1 (en) * 1998-07-01 2001-11-06 Sony Corporation Method and apparatus for certified electronic mail messages
US6226630B1 (en) * 1998-07-22 2001-05-01 Compaq Computer Corporation Method and apparatus for filtering incoming information using a search engine and stored queries defining user folders
US6275850B1 (en) * 1998-07-24 2001-08-14 Siemens Information And Communication Networks, Inc. Method and system for management of message attachments
US6112227A (en) * 1998-08-06 2000-08-29 Heiner; Jeffrey Nelson Filter-in method for reducing junk e-mail
US6654787B1 (en) * 1998-12-31 2003-11-25 Brightmail, Incorporated Method and apparatus for filtering e-mail
US6732149B1 (en) * 1999-04-09 2004-05-04 International Business Machines Corporation System and method for hindering undesired transmission or receipt of electronic messages
US6804667B1 (en) * 1999-11-30 2004-10-12 Ncr Corporation Filter for checking for duplicate entries in database
US6460050B1 (en) * 1999-12-22 2002-10-01 Mark Raymond Pace Distributed content identification system
US20040073617A1 (en) * 2000-06-19 2004-04-15 Milliken Walter Clark Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail
US6965919B1 (en) * 2000-08-24 2005-11-15 Yahoo! Inc. Processing of unsolicited bulk electronic mail
US6931433B1 (en) * 2000-08-24 2005-08-16 Yahoo! Inc. Processing of unsolicited bulk electronic communication
US8219620B2 (en) * 2001-02-20 2012-07-10 Mcafee, Inc. Unwanted e-mail filtering system including voting feedback
US7275089B1 (en) * 2001-03-15 2007-09-25 Aws Convergence Technologies, Inc. System and method for streaming of dynamic weather content to the desktop
US20040044791A1 (en) * 2001-05-22 2004-03-04 Pouzzner Daniel G. Internationalized domain name system with iterative conversion
US7076527B2 (en) * 2001-06-14 2006-07-11 Apple Computer, Inc. Method and apparatus for filtering email
US7080123B2 (en) * 2001-09-20 2006-07-18 Sun Microsystems, Inc. System and method for preventing unnecessary message duplication in electronic mail
US20040204988A1 (en) * 2001-11-16 2004-10-14 Willers Howard Francis Interactively communicating selectively targeted information with consumers over the internet
US20030195937A1 (en) * 2002-04-16 2003-10-16 Kontact Software Inc. Intelligent message screening
US8046832B2 (en) * 2002-06-26 2011-10-25 Microsoft Corporation Spam detector with challenges
US20040083270A1 (en) * 2002-10-23 2004-04-29 David Heckerman Method and system for identifying junk e-mail
US6732157B1 (en) * 2002-12-13 2004-05-04 Networks Associates Technology, Inc. Comprehensive anti-spam system, method, and computer program product for filtering unwanted e-mail messages
US8266215B2 (en) * 2003-02-20 2012-09-11 Sonicwall, Inc. Using distinguishing properties to classify messages
US7219148B2 (en) * 2003-03-03 2007-05-15 Microsoft Corporation Feedback loop for spam prevention
US20060168006A1 (en) * 2003-03-24 2006-07-27 Mr. Marvin Shannon System and method for the classification of electronic communication
US7320020B2 (en) * 2003-04-17 2008-01-15 The Go Daddy Group, Inc. Mail server probability spam filter
US7483947B2 (en) * 2003-05-02 2009-01-27 Microsoft Corporation Message rendering for identification of content features
US7831667B2 (en) * 2003-05-15 2010-11-09 Symantec Corporation Method and apparatus for filtering email spam using email noise reduction
US8145710B2 (en) 2003-06-18 2012-03-27 Symantec Corporation System and method for filtering spam messages utilizing URL filtering module
US7941490B1 (en) 2004-05-11 2011-05-10 Symantec Corporation Method and apparatus for detecting spam in email messages and email attachments
JP2006293573A (ja) * 2005-04-08 2006-10-26 Yaskawa Information Systems Co Ltd 電子メール処理装置および電子メールフィルタリング方法および電子メールフィルタリングプログラム
US7739337B1 (en) 2005-06-20 2010-06-15 Symantec Corporation Method and apparatus for grouping spam email messages
US8010609B2 (en) * 2005-06-20 2011-08-30 Symantec Corporation Method and apparatus for maintaining reputation lists of IP addresses to detect email spam

Also Published As

Publication number Publication date
TW200527863A (en) 2005-08-16
TWI348851B (en) 2011-09-11
WO2004105332A9 (en) 2005-12-15
US20050108340A1 (en) 2005-05-19
US20110055343A1 (en) 2011-03-03
WO2004105332A2 (en) 2004-12-02
EP1649645A2 (en) 2006-04-26
US8402102B2 (en) 2013-03-19
US20050108339A1 (en) 2005-05-19
US20050132197A1 (en) 2005-06-16
JP2007503660A (ja) 2007-02-22
WO2004105332A3 (en) 2005-03-10
US7831667B2 (en) 2010-11-09

Similar Documents

Publication Publication Date Title
JP4598774B2 (ja) 類似性測度に基づいて電子メール・スパムをフィルタ処理するための方法および装置
US7739337B1 (en) Method and apparatus for grouping spam email messages
US10042919B2 (en) Using distinguishing properties to classify messages
US8145710B2 (en) System and method for filtering spam messages utilizing URL filtering module
US10178115B2 (en) Systems and methods for categorizing network traffic content
US8935348B2 (en) Message classification using legitimate contact points
US7668921B2 (en) Method and system for phishing detection
US7930351B2 (en) Identifying undesired email messages having attachments
US7941490B1 (en) Method and apparatus for detecting spam in email messages and email attachments
US20110238770A1 (en) Method and apparatus to screen electronic communications
US7257773B1 (en) Method and system for identifying unsolicited mail utilizing checksums
US20130275384A1 (en) System, method, and computer program product for determining whether an electronic mail message is unwanted based on processing images associated with a link in the electronic mail message
Shi et al. Cooperative anti-spam system based on multilayer agents
Shi et al. A Service-Oriented Spam Filtering System Using Shared Fingerprints

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070502

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070502

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20070502

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091208

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100924

R150 Certificate of patent or registration of utility model

Ref document number: 4598774

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350