JP4780684B2 - Mass mail detection method and mail server - Google Patents

Mass mail detection method and mail server Download PDF

Info

Publication number
JP4780684B2
JP4780684B2 JP2009053823A JP2009053823A JP4780684B2 JP 4780684 B2 JP4780684 B2 JP 4780684B2 JP 2009053823 A JP2009053823 A JP 2009053823A JP 2009053823 A JP2009053823 A JP 2009053823A JP 4780684 B2 JP4780684 B2 JP 4780684B2
Authority
JP
Japan
Prior art keywords
mail
electronic mail
mass
feature
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2009053823A
Other languages
Japanese (ja)
Other versions
JP2009187558A (en
Inventor
克之 山崎
裕充 藤川
昭浩 中島
輝彰 本間
健一 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2009053823A priority Critical patent/JP4780684B2/en
Publication of JP2009187558A publication Critical patent/JP2009187558A/en
Application granted granted Critical
Publication of JP4780684B2 publication Critical patent/JP4780684B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

本発明は電子メイルのスパム処理に係わり,特に携帯電話やISPなど、大規模な電子メイルサーバを運用する事業者が電子メイルサーバを経由して配送される電子メイルに含まれている未承諾広告などの迷惑メイルを検出するのに好適なマスメイル検出方式およびマスメイル検出方式を備えたメイルサーバに関する。   The present invention relates to spam processing of electronic mail, and in particular, unsolicited advertisements included in electronic mail delivered via electronic mail servers by operators operating large-scale electronic mail servers such as mobile phones and ISPs. The present invention relates to a mass mail detection method suitable for detecting a junk mail such as a mail server equipped with a mass mail detection method.

電子メイルの普及に従い電子メイルを搬送手段とした迷惑メイルが増加し、社会問題となっている。従来、このような迷惑メイルを防止する手段としては、電子メイルの受信者が受信に用いる端末に迷惑メイルを検知する仕組を用意し、その仕組によって迷惑メイルを自動的に削除するなどの方法が一般的であった。   With the spread of electronic mails, annoying mails that use electronic mails as a means of transport have increased and have become a social problem. Conventionally, as a means for preventing such annoying mail, there is a method of preparing a mechanism for detecting annoying mail in a terminal used for reception by an electronic mail recipient and automatically deleting the annoying mail by the mechanism. It was general.

例えば、SpamAssassinはルールベース方式を用いたソフトであり、bogofilterは機械学習方式を用いたソフトであり、どちらも主としてPCユーザの間で有効な仕組として使われている。なお、これらのソフトは、それぞれ、非特許文献1,2に示されている。   For example, SpamAssassin is a rule-based software, and bogofilter is a machine-learning software, both of which are mainly used as an effective mechanism among PC users. These softwares are shown in Non-Patent Documents 1 and 2, respectively.

http://www.au.spamassassin.org/presentations/SAGE_IE_2002/http://www.au.spamassassin.org/presentations/SAGE_IE_2002/ http://bogofilter.sourceforge.net/bogofilter_man.htmlhttp://bogofilter.sourceforge.net/bogofilter_man.html

上記した従来技術は、電子メイルの受信者がPCのように一定の水準以上の情報処理能力を持つ受信端末を使用することが前提であり、携帯電話などのような比較的低い能力の受信端末には不向きである。携帯電話などのような比較的低い能力の受信端末を支援するには、事業者側のメイルサーバにマスメイルを検出する手段を備える事が望ましかった。   The above-described prior art is based on the premise that the recipient of electronic mail uses a receiving terminal having a certain level of information processing capability such as a PC, and a receiving terminal having a relatively low ability such as a mobile phone. Not suitable for. In order to support a relatively low-capacity receiving terminal such as a mobile phone, it is desirable to provide a mail server on the provider side with means for detecting mass mail.

しかし、上記の従来技術は、サーバで用いるには処理速度が遅く大規模な設備を必要とするという問題点があった。また、大人数のユーザに共通したマスメイルの検知ルールや機械学習結果を作成するのが困難であり、かつ、新種のスパムに対応するための維持管理のコストが膨大であるといった問題点もあった。   However, the above-described conventional technique has a problem in that a processing speed is low and a large-scale facility is required for use in a server. In addition, it is difficult to create mass mail detection rules and machine learning results that are common to a large number of users, and the maintenance costs for dealing with new types of spam are enormous. .

本発明の目的は、前記した問題点を解決するために、事前のルール作成や学習が不要で、かつ、高速に動作するマスメイル検出方式および該マスメイル検出方式を備えたメイルサーバを提供することにある。   SUMMARY OF THE INVENTION An object of the present invention is to provide a mass-mail detection method that does not require prior rule creation or learning and that operates at high speed, and a mail server equipped with the mass-mail detection method in order to solve the above-described problems. is there.

上記した目的を達成するために、本発明は、配送対象の電子メイルを収集する電子メイル収集手段と、該電子メイル受信者に表示されるときの仕様に従って、該電子メイルの前処理を行う前処理手段と、該前処理された電子メイルを特徴量に変換する特徴量変換手段と、該変換した特徴量を使ってマスメイルを検出するマスメイル検出手段とを具備し、前記特徴量変換手段は電子メイルの本文から部分文字列を抽出し、その部分文字列から計算したハッシュ値の集まりを特徴量として用い、前記マスメイル検出手段は、特徴量データベースと該特徴量データベースへのポインタを具備し、エントリされている特徴量のハッシュ値が該ポインタにエントリされているか否かを判断し、エントリされている場合には、該ポインタを用いて特徴量データベースをアクセスし、該特徴量データベースに既に登録されている電子メイルのハッシュ値と比較することにより、新規電子メイルと既登録の電子メイルとの類似度を判定し、一定数以上のハッシュ値が一致した電子メイルを類似電子メイルと判定し、該類似電子メイルが所定数検出された時に該類似電子メイルをマスメイルと判定するようにした点に特徴がある。 In order to achieve the above-described object, the present invention performs electronic mail pre-processing in accordance with electronic mail collection means for collecting electronic mail to be delivered and specifications when the electronic mail is displayed to a recipient. Pre-processing means, feature quantity conversion means for converting the pre-processed electronic mail into feature quantities, and mass mail detection means for detecting mass mail using the converted feature quantities, wherein the feature quantity conversion means is A partial character string is extracted from the body of the electronic mail, and a collection of hash values calculated from the partial character string is used as a feature amount.The mass mail detecting means includes a feature amount database and a pointer to the feature amount database. It is determined whether or not the hash value of the entered feature value is entered in the pointer. If it is entered, the feature value is used using the pointer. Accesses the database by comparing the hash value of the electronic mail that has already been registered in the feature database, to determine the similarity between the electronic mail of the new e-mail and registered, the hash value of more than a certain number of The matching electronic mail is determined as a similar electronic mail, and the similar electronic mail is determined as a mass mail when a predetermined number of similar electronic mails are detected.

本発明によれば,携帯電話やISPなど、大規模な電子メイルサーバを運用する事業者が電子メイルサーバを経由して配送される電子メイルに含まれている未承諾広告などの迷惑メイルを検出するのに好適なマスメイル検出方式を提供できる。   According to the present invention, an operator operating a large-scale electronic mail server such as a mobile phone or an ISP detects an unsolicited mail such as an unsolicited advertisement contained in the electronic mail delivered via the electronic mail server. Therefore, it is possible to provide a mass mail detection method suitable for the above.

本発明を含むシステム構成を示すブロック図である。1 is a block diagram showing a system configuration including the present invention. 電子メイル収集手段の処理手続きの一例を示すフローチャートである。It is a flowchart which shows an example of the process procedure of an electronic mail collection means. 特徴量変換手段の処理の一例を示す説明図である。It is explanatory drawing which shows an example of the process of a feature-value conversion means. 特徴量変換手段の処理手続きの一例を示すフローチャートである。It is a flowchart which shows an example of the process procedure of a feature-value conversion means. マスメイル検出手段が利用するデータ構造の一例であるDirected Mapped Cacheを示す。A Directed Mapped Cache, which is an example of a data structure used by mass mail detection means, is shown. マスメイル検出手段の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process of a massmail detection means. 図6のステップS30の一具体例を示すフローチャートである。It is a flowchart which shows one specific example of step S30 of FIG. 図6のステップS35およびS38の一具体例を示すフローチャートである。It is a flowchart which shows one specific example of step S35 and S38 of FIG. 順次抽出されるメイル1、2、3、4の特徴量の説明図である。It is explanatory drawing of the feature-value of the mail 1, 2, 3, 4 extracted sequentially. メイル1に対するDirected Mapped Cacheのデータ例を示す説明図である。It is explanatory drawing which shows the data example of Directed Mapped Cache with respect to the mail 1. FIG. メイル1、2に対するDirected Mapped Cacheのデータ例を示す説明図である。It is explanatory drawing which shows the data example of Directed Mapped Cache with respect to the mails 1 and 2. FIG. メイル1、2、3に対するDirected Mapped Cacheのデータ例を示す説明図である。It is explanatory drawing which shows the data example of Directed Mapped Cache with respect to mail 1, 2, and 3. FIG. メイル1、2、3、4に対するDirected Mapped Cacheのデータ例を示す説明図である。It is explanatory drawing which shows the data example of Directed Mapped Cache with respect to mail 1, 2, 3, 4. 本発明の他の実施形態の要部を示すブロック図である。It is a block diagram which shows the principal part of other embodiment of this invention.

以下に、図面を参照して本発明を詳細に説明する。図1は、本発明が適用されるシステム構成の一例を示すブロック図である。   Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing an example of a system configuration to which the present invention is applied.

図において、1は例えば通信事業者(プロバイダ)のメイルサーバ群、2はインターネット、3はこれらの間のデータ配送に用いられるスイッチングハブであり、メイルサーバ群1はユーザ端末4と接続されている。また、スイッチングハブ3には、本発明のマスメイル検出装置5が接続されている。   In the figure, 1 is, for example, a mail server group of a telecommunications carrier (provider), 2 is the Internet, 3 is a switching hub used for data distribution between them, and the mail server group 1 is connected to a user terminal 4. . Further, the mass mail detection device 5 of the present invention is connected to the switching hub 3.

本実施形態は、メイルサーバ群1とインターネット2の間でSMTPプロトコルを用いて配送される電子メイルの中から、前記マスメイル検出装置5を用いてマスメイルを検出するものである。   In the present embodiment, mass mail is detected using the mass mail detection device 5 from electronic mail distributed between the mail server group 1 and the Internet 2 using the SMTP protocol.

該マスメイル検出装置5は、電子メイル収集手段51,特徴量変換手段52およびマスメイル検出手段53から構成されている。電子メイル収集手段51は配送対象の電子メイルを収集するものであり適切な計算機上のプログラムで良い。特徴量変換手段52は電子メイル収集手段51で収集した電子メイルを特徴量に変換するものであり適切な計算機上のプログラムで良い。マスメイル検出手段53は変換した特徴量を使ってマスメイルを検出するものであり適切な計算機上のプログラムで良い。55は検出結果のマスメイルである。   The mass mail detection device 5 includes an electronic mail collection means 51, a feature amount conversion means 52 and a mass mail detection means 53. The electronic mail collecting means 51 collects electronic mail to be delivered, and may be an appropriate computer program. The feature quantity conversion means 52 converts the electronic mail collected by the electronic mail collection means 51 into a feature quantity, and may be an appropriate computer program. The mass mail detection means 53 detects mass mail using the converted feature quantity, and may be an appropriate computer program. Reference numeral 55 denotes a detection result mass mail.

次に、本実施形態の動作を説明する。電子メイル収集手段51は、ネットワーク上に流れる電子メイル配送プロトコルを解析し、ネットワーク上に流れる電子メイルトラフィックから電子メイル本文を抽出する。次に、特徴量変換手段52が電子メイル本文から、例えば幾つかのハッシュ値を計算し該メイルの特徴量とする。最後に、マスメイル検出手段53が記憶しておいた過去の電子メイルと新たに受信した電子メイルとを、前記特徴量を用いて比較し、特定の基準に従って類似度を判定し、類似している場合はマスメイルの候補(類似メイル)として判定し、一定数以上の類似メイルが検出されるとこれをマスメイルと判定する。   Next, the operation of this embodiment will be described. The electronic mail collecting means 51 analyzes the electronic mail delivery protocol flowing on the network, and extracts the electronic mail text from the electronic mail traffic flowing on the network. Next, the feature amount conversion means 52 calculates, for example, several hash values from the electronic mail text, and sets it as the feature amount of the mail. Finally, the past electronic mail stored by the mass mail detecting means 53 and the newly received electronic mail are compared using the feature amount, the similarity is determined according to a specific criterion, and they are similar. In this case, it is determined as a mass mail candidate (similar mail), and when a certain number of similar mails are detected, it is determined as a mass mail.

図2は、前記電子メイル収集手段51の処理手続きの一例を示すフローチャートである。メイルサーバ群1とインターネット2の間では複数のメイルが並行して配送されている。そこで、ステップS10では、電子メイル収集手段51は、スイッチングハブ3でタッピングすることでTCPパケットを受信する。該受信したTCPパケットは、複数の電子メイルの情報が混ったものである。ステップS15では、電子メイル収集手段51は、パケットの種類を判断する。すなわち、パケットがメイルであるか否か、メイルであれば、新規メイルのパケットであるか、処理中メイルのパケットであるか、あるいは処理中メイルの終了パケットであるかの判断をする。   FIG. 2 is a flowchart showing an example of the processing procedure of the electronic mail collecting means 51. A plurality of mails are delivered in parallel between the mail server group 1 and the Internet 2. Therefore, in step S10, the electronic mail collection means 51 receives a TCP packet by tapping with the switching hub 3. The received TCP packet is a mixture of a plurality of electronic mail information. In step S15, the electronic mail collection means 51 determines the type of packet. That is, it is determined whether the packet is a mail, if it is a mail, whether it is a new mail packet, a processing mail packet, or a processing mail end packet.

そして、受信したパケットが新規メイルのものであれば、ステップS11に進んで、新規メイル用記憶領域を初期設定する。一方、受信したパケットが処理中のメイルの終了を意味するパケットであれば、ステップS13に進み、処理中のメイル本文を特徴量変換手段52に送信し、次にステップS14に進んで、処理中のメイル用記憶領域を廃棄/解放する。また、受信したパケットが終了以外の処理中のメイルパケットであれば、ステップS12に進んで、処理中のメイル用記憶領域にTCPパケットに含まれるメイルの内容を記録する。前記ステップS15で、メイル以外のパケットであると判断された場合には、何も処理を行わず終了する。図2では便宜的にエンド(終了)と記したが、実際の処理は終了することなく、ステップS10〜S14の処理が継続的に繰り返されることは明らかである。   If the received packet is for a new mail, the process proceeds to step S11 to initialize a new mail storage area. On the other hand, if the received packet is a packet that means the end of the mail being processed, the process proceeds to step S13, the mail text being processed is transmitted to the feature amount conversion means 52, and then the process proceeds to step S14 to be processed. Discard / release the mail storage area. If the received packet is a mail packet being processed other than the end, the process proceeds to step S12, and the contents of the mail included in the TCP packet are recorded in the mail storage area being processed. If it is determined in step S15 that the packet is other than mail, the process ends without performing any processing. In FIG. 2, the end (end) is described for the sake of convenience, but it is apparent that the processes in steps S10 to S14 are continuously repeated without ending the actual process.

図3は前記特徴量変換手段52の処理の一例を示す説明図であり、図4は該特徴量変換手段52の処理手続きの一例を示すフローチャートである。   FIG. 3 is an explanatory diagram showing an example of processing of the feature quantity conversion means 52, and FIG. 4 is a flowchart showing an example of processing procedures of the feature quantity conversion means 52.

本実施形態においては、メイル本文の特徴量として、事前に定めた長さLの文字列(例えば、4文字)のハッシュ値の集合を用いる。具体的には、図4の手順に従い、始にステップS21にて、メイル本文100の先頭から順番にL文字づつ取り出し、そのハッシュ値を計算する。次に、ステップS22に進み、計算したハッシュ値をソートし、始めのN個(例えば100個)を特徴量としてマスメイル検出手段53に送信する。   In the present embodiment, a set of hash values of a character string (for example, 4 characters) having a predetermined length L is used as the feature amount of the mail text. Specifically, according to the procedure of FIG. 4, first, in step S21, L characters are extracted sequentially from the beginning of the mail body 100, and the hash value is calculated. Next, the process proceeds to step S22, where the calculated hash values are sorted, and the first N (for example, 100) values are transmitted to the mass mail detection means 53 as feature quantities.

例えば、図3に示されているように、長さLが4で、メイル本文100が「メイル本文の文章」であったとすれば、「メイル本」(図3の101)、「イル本文」、「ル本文の」、「本文の文」(図3の102)などのハッシュ値201〜202を計算する(図4のステップS21)。次いで、該ハッシュ値201〜202をソートした後、始めのN個を特徴量200としてマスメイル検出手段53に送信する(図4のステップS22)。該ハッシュ値としては、例えば64ビットの整数で表すことができる。   For example, as shown in FIG. 3, if the length L is 4 and the mail text 100 is “text of mail text”, “mail book” (101 in FIG. 3), “il text” , Hash values 201 to 202 such as “le text” and “text of text” (102 in FIG. 3) are calculated (step S21 in FIG. 4). Next, after the hash values 201 to 202 are sorted, the first N pieces are transmitted as the feature quantity 200 to the mass mail detection means 53 (step S22 in FIG. 4). The hash value can be represented by a 64-bit integer, for example.

図5は前記マスメイル検出手段53が利用するデータ構造の例である。300は、頻繁に配送される電子メイルを特徴量データベース310の中に優先的に記憶するためのデータ構造Directed Map Cache(以下、DMC)、すなわち管理マップキャッシュ方式を示す。該DMC300は、特徴量データベース310と、該特徴量データベース310へのポインタ311を有する。特徴量データベース310は、電子メイル毎に、特徴量(ハッシュ値1〜N)、該当電子メイルの類似メイル数、およびポインタ311のエントリで該当メイルを参照しているポインタの数(DMC被参照数)を記憶した計算機上のデータ構造である。該ポインタ311の各々は、例えば64ビットで表現することができる。   FIG. 5 shows an example of the data structure used by the mass mail detection means 53. Reference numeral 300 denotes a data structure Directed Map Cache (hereinafter referred to as DMC), that is, a management map cache method for preferentially storing electronic mail that is frequently delivered in the feature amount database 310. The DMC 300 includes a feature quantity database 310 and a pointer 311 to the feature quantity database 310. For each electronic mail, the feature quantity database 310 stores the feature quantity (hash value 1 to N), the number of similar mails of the corresponding electronic mail, and the number of pointers referring to the corresponding mail in the entry of the pointer 311 (the number of DMC references). ) Is a data structure on a computer. Each of the pointers 311 can be expressed by 64 bits, for example.

電子メイル収集手段51が電子メイルを抽出すると、特徴量変換手段52がその電子メイル本文から特徴量200(図3参照)を計算し、最後にマスメイル検出手段53が図6に例示した手順に従い、多量に配送されている類似したメイルをマスメイルとして検知する。具体的には、1通の電子メイルに対して特徴量変換手段52が計算する特徴量200はN個(Nは、正の整数)のハッシュ値を持つが、マスメイル検出手段53は各メイルに対して図6の手順に従いステップS31からステップS41までの処理を最大N回繰り返す。   When the electronic mail collecting means 51 extracts the electronic mail, the feature amount converting means 52 calculates the feature amount 200 (see FIG. 3) from the electronic mail text, and finally the mass mail detecting means 53 follows the procedure illustrated in FIG. Similar mails that are delivered in large quantities are detected as mass mail. Specifically, the feature quantity 200 calculated by the feature quantity conversion means 52 for one electronic mail has N hash values (N is a positive integer), but the mass mail detection means 53 is assigned to each mail. On the other hand, the processing from step S31 to step S41 is repeated at most N times according to the procedure of FIG.

ステップS30では、前記特徴量200を基に、前記電子メイル収集手段51で収集された電子メイルに類似するメイルが既にあるか否かの判定が行われる。この処理の一具体例を、図7のフローチャートを参照して説明する。   In step S <b> 30, based on the feature amount 200, it is determined whether there is already a mail similar to the electronic mail collected by the electronic mail collection means 51. A specific example of this process will be described with reference to the flowchart of FIG.

ステップS301では、前記特徴量200の番号を示す数mを1と置き、ステップS302では新規のメイルの特徴量200の中のm番目のハッシュ値を抽出する。ステップS303では、該ハッシュ値がポインタ311にエントリされているか否かの判断がなされる。この判断が肯定の場合にはステップS304に進んで、現在のポインタ311から参照されている特徴量データベース310中のエントリと類似度の判定を行う。そして、例えば80%の類似があれば類似メイル、80%より小さければ非類似メイルと判定する。ステップS305では、m=Nが成立したか否かの判断がなされ、否定の場合には、ステップS306に進んでmに1が加算される。次に、ステップS302に戻って、2番目のハッシュ値が抽出される。以下、同様にして、前記した処理が繰り返し行われ、ステップS305の判断が肯定になると、前記ステップS30の処理は終了する。   In step S301, the number m indicating the number of the feature quantity 200 is set to 1, and in step S302, the m-th hash value in the feature quantity 200 of the new mail is extracted. In step S303, it is determined whether or not the hash value is entered in the pointer 311. If this determination is affirmative, the process proceeds to step S304 to determine the similarity to the entry in the feature amount database 310 referenced from the current pointer 311. For example, if there is 80% similarity, it is determined that the mail is similar, and if it is less than 80%, it is determined that the mail is dissimilar. In step S305, it is determined whether or not m = N is established. If the determination is negative, the process proceeds to step S306, and 1 is added to m. Next, returning to step S302, the second hash value is extracted. Hereinafter, similarly, the above-described processing is repeatedly performed, and when the determination in step S305 becomes affirmative, the processing in step S30 ends.

前記ステップS304の類似度判定は、例えば新規の電子メイルのハッシュ値200(図3参照)と特徴量データベース310内のハッシュ値が一致した数を利用する。例えば、特徴量の数Nが100個、類似度の閾値が80%の時、80個のハッシュ値が一致すると類似のメイルと判断する。一致した数の計測処理を速めるために、予め前記ハッシュ値はソートしておくと好適である。なお、図7ではN個のハッシュ値について類似度を判定したが、必ずしもN個のハッシュ値について類似度を判定する必要はなく、N個より少ないハッシュ値で類似度を判定しても良い。   The similarity determination in step S304 uses, for example, the number of new electronic mail hash values 200 (see FIG. 3) and the hash values in the feature amount database 310 that match. For example, when the number N of feature quantities is 100 and the similarity threshold is 80%, it is determined that the mails are similar if 80 hash values match. It is preferable to sort the hash values in advance in order to speed up the number of coincidence measurement processes. In FIG. 7, the similarity is determined for N hash values. However, it is not always necessary to determine the similarity for N hash values, and the similarity may be determined using fewer hash values.

図6に戻って説明を続けると、ステップS31において前記mを再度m=1とし、ステップS32において、特徴量200中のm番目のハッシュ値を抽出する。次いで、ステップS33に進み、該m番目のハッシュ値が類似メイルのハッシュ値であるか否かの判断がなされる。この判断が否定、すなわち新規の電子メイル(非類似メイル)の場合には、類似メイルは特徴量データベース310に記憶されていないので、ステップS34に進んで、該当メイルの特徴量が特徴量データベース310の新規エントリとして登録される。具体的には、新規電子メイルの特徴量200(図3参照)を特徴量データベース310のハッシュ値1〜ハッシュ値Nとして記憶する。次に、ステップS35に進み、特徴量のベクトル値でDMC300の内容を更新する。   Returning to FIG. 6, the description is continued. In step S31, m is set to m = 1 again, and in step S32, the m-th hash value in the feature amount 200 is extracted. Next, the process proceeds to step S33, where it is determined whether or not the m-th hash value is a hash value of similar mail. If this determination is negative, that is, a new electronic mail (non-similar mail), the similar mail is not stored in the feature quantity database 310, so the process proceeds to step S 34, and the feature quantity of the corresponding mail is the feature quantity database 310. Is registered as a new entry. Specifically, the feature quantity 200 (see FIG. 3) of the new electronic mail is stored as hash value 1 to hash value N of the feature quantity database 310. In step S35, the contents of the DMC 300 are updated with the vector value of the feature amount.

前記ステップS33の判断が肯定の場合、すなわち類似メイルがある場合には、ステップS37に進む。該ステップS37では、特徴量データベース310に既に記憶されているメイルの類似メイル数(図5参照)を1加算する。次に、ステップS38に進んで、該特徴量データベース310に記憶されたベクトル値でDMC300の内容を更新する。なお、該ステップS38は前記ステップS35と同一の処理であり、その具体例を図8を参照して後述する。   If the determination in step S33 is affirmative, that is, if there is a similar mail, the process proceeds to step S37. In step S37, 1 is added to the number of similar mails (see FIG. 5) already stored in the feature amount database 310. In step S38, the contents of the DMC 300 are updated with the vector values stored in the feature amount database 310. The step S38 is the same process as the step S35, and a specific example thereof will be described later with reference to FIG.

ステップS39では、前記類似メイル数が予め定められた値S以上になったか否かの判断がなされ、S以上になった場合にはステップS40に進んで該当メイルをスパムと判定する。一方、ステップS39の判断が否定の時にはステップS36に進む。ステップS36では、m=Nになったか否かの判断がなされ、この判断が否定の時には、ステップS41に進んで、mに1が加算される。そして、再度ステップS32からの動作が繰り返される。   In step S39, it is determined whether or not the number of similar mails is greater than or equal to a predetermined value S. If it is greater than or equal to S, the process proceeds to step S40 and the corresponding mail is determined to be spam. On the other hand, when the determination in step S39 is negative, the process proceeds to step S36. In step S36, it is determined whether or not m = N. If this determination is negative, the process proceeds to step S41, and 1 is added to m. Then, the operation from step S32 is repeated again.

図8は図6のステップS35、S38のDMC更新処理の手順を例示したものである。マスメイル検出手段53は各電子メイルの処理にあたり、まずステップS351の判断をする。すなわち、当該ハッシュ値は、現在のポインタ311から特徴量データベース310の古いエントリを参照しているか否かの判断をする。この判断が否定の時には、ステップS352に進んで、ポインタ311の対応エントリが新しい特徴量データベース310のエントリを指すように設定し、該特徴量データベースの被参照数に1を加算する。   FIG. 8 illustrates the procedure of the DMC update process in steps S35 and S38 in FIG. The mass mail detecting means 53 first determines in step S351 when processing each electronic mail. That is, it is determined whether or not the hash value refers to an old entry in the feature amount database 310 from the current pointer 311. When this determination is negative, the process proceeds to step S352, where the corresponding entry of the pointer 311 is set so as to point to the entry of the new feature quantity database 310, and 1 is added to the number of references in the feature quantity database.

一方、前記ステップS351の判断が肯定の時、すなわち当該ハッシュ値が現在のポインタ311から特徴量データベース310の古いエントリを参照している時には、ステップS353に進んで、該ハッシュ値が自分自身のエントリを参照しているか否かの判断をする。すなわち、当該ハッシュ値が前記類似メイルの中に含まれているか否かの判断をする。この判断が肯定の時には、何の処理も行わずに図6の処理に抜ける。   On the other hand, when the determination in step S351 is affirmative, that is, when the hash value refers to an old entry in the feature amount database 310 from the current pointer 311, the process proceeds to step S353, where the hash value is an entry of its own. It is determined whether or not it is referenced. That is, it is determined whether or not the hash value is included in the similar mail. If this determination is affirmative, no processing is performed and the processing of FIG.

ステップS353の判断が否定の時、すなわち当該ハッシュ値が前記類似メイルの中に含まれていない時には、ステップS354に進み、現在のポインタ311から参照されている特徴量データベース310中の古いエントリのDMC被参照数を1減算する。次いで、ステップS355に進み、DMC被参照数が0であるか否かの判断がなされる。この判断が肯定の時には、ステップS356に進んで、DMC被参照数が0になった過去のメイルのエントリを、特徴量データベース310から削除する。前記ステップS355の判断が否定の時には前記ステップS352に進み、ポインタ311の対応エントリが新しい特徴量データベース310のエントリを指すように設定すると共に、該特徴量データベースの被参照数を1加算する。   When the determination in step S353 is negative, that is, when the hash value is not included in the similar mail, the process proceeds to step S354, and the DMC of the old entry in the feature amount database 310 referenced from the current pointer 311 is obtained. Subtract 1 from the number of references. Next, the process proceeds to step S355, where it is determined whether or not the DMC referenced number is zero. When this determination is affirmative, the process proceeds to step S356, and the previous mail entry whose DMC reference count is 0 is deleted from the feature amount database 310. When the determination in step S355 is negative, the process proceeds to step S352, where the corresponding entry of the pointer 311 is set so as to point to the entry of the new feature quantity database 310, and the number of reference in the feature quantity database is incremented by one.

以上の処理によると、類似したメイルが多いメイルは頻繁に図6のステップS38から起動されて図8の更新処理(より具体的には、ステップS352)が動くのでDMC被参照数は0になりにくいが、類似メイルがないものはハッシュ値がぶつかったデータを上書きする事で時間の経過とともにDMC被参照数が減少し、前記ステップS356で最終的には削除される。   According to the above processing, mails with many similar mails are frequently started from step S38 in FIG. 6 and the update process in FIG. 8 (more specifically, step S352) moves, so the DMC reference count becomes zero. Although it is difficult, if there is no similar mail, the number of DMC referenced is reduced with the lapse of time by overwriting the data hit by the hash value, and finally deleted in step S356.

次に、前記した図6〜図8の動作を具体例を、図9〜図13を参照して参照して説明する。今、インターネットを介して新規のメイルが図9に示されているように、メイル1、2、3、4の順に収集されたものとし、該メイルの特徴量(前記図3の特徴量200)が、メイル1に関してはハッシュ値h1,h2,h3,h4、メイル2に関してはハッシュ値h2,h3,h6,h7、メイル3に関してはハッシュ値h4,h8,h9,h0、メイル4に関してはハッシュ値h1,h2,h3,h0であるとする。ここで、類似メイルと判定する基準を75%以上の一致とすると、メイル4はメイル1と類似になる。この判定は図7の処理により行われる。なお、ここでは、説明を簡単にするために、各メイルの特徴量が4個であるとした。   Next, specific examples of the operations shown in FIGS. 6 to 8 will be described with reference to FIGS. 9 to 13. Now, it is assumed that new mails are collected in the order of mails 1, 2, 3, and 4 as shown in FIG. 9 through the Internet, and the feature amount of the mail (feature amount 200 in FIG. 3). However, for mail 1, hash values h1, h2, h3, and h4, for mail 2, hash values h2, h3, h6, and h7, for mail 3, hash values h4, h8, h9, h0, and for hash 4 are hash values. Assume that h1, h2, h3, and h0. Here, if the criterion for determining similar mail is 75% or more, Mail 4 is similar to Mail 1. This determination is performed by the process of FIG. Here, in order to simplify the description, it is assumed that each mail has four feature amounts.

さて、まずインターネットを介してメイル1が抽出されると、図6のステップS33の判断は否定になるので、ステップS34,S35の処理が行われる。ステップS34の処理により特徴量データベース310は図10(b)のハッシュ値1〜4にh1〜h4が登録され、ステップS35の処理によりDMC300のポインタ311は同図(a)のようになると共に、DMC被参照数が4となる。   First, when the mail 1 is extracted via the Internet, the determination in step S33 in FIG. 6 is negative, and the processing in steps S34 and S35 is performed. As a result of the process in step S34, h1 to h4 are registered in the hash values 1 to 4 in FIG. 10B in the feature amount database 310, and the pointer 311 of the DMC 300 becomes as shown in FIG. The number of DMC referenced is 4.

次に、メイル2が抽出されると、前記ステップS33の判断は否定になるので、ステップS34,S35の処理に進む。ステップS34の処理により特徴量データベース310は図11(b)のメイル2のハッシュ値1〜4にh2、h3、h6、h7が登録され、ステップS35の処理によりDMC300のポインタ311は同図(a)のようになると共に、メイル1のDMC被参照数が2となり、メイル2のDMC被参照数が4となる。   Next, when the mail 2 is extracted, the determination in step S33 is negative, so the process proceeds to steps S34 and S35. The feature database 310 registers h2, h3, h6, and h7 in the hash values 1 to 4 of the mail 2 in FIG. 11B by the process of step S34, and the pointer 311 of the DMC 300 is updated by the process of step S35. ), The number of DMC references in Mail 1 is 2, and the number of DMC references in Mail 2 is 4.

続いて、メイル3が抽出されると、前記ステップS33の判断は否定になるので、ステップS34,S35の処理が行われる。ステップS34の処理により特徴量データベース310は図12(b)のように、メイル3のハッシュ値1〜4にh4、h8、h9、h0が登録され、ステップS35の処理によりDMC300のポインタは同図(a)のようになると共に、メイル1,2,3のDMC被参照数がそれぞれ、1,4,4となる。   Subsequently, when the mail 3 is extracted, the determination in step S33 is negative, so that the processes in steps S34 and S35 are performed. As shown in FIG. 12B, h4, h8, h9, h0 are registered in the hash values 1 to 4 of the mail 3 by the process of step S34, and the pointer of the DMC 300 is obtained by the process of step S35. As shown in (a), the DMC referenced numbers of the mails 1, 2, and 3 are 1, 4, and 4, respectively.

さらに、メイル4が抽出されると、このメイル4は既登録のメイル1と類似するものであるので、前記ステップS33の判断は肯定になり、ステップS37,S38の処理が行われる。ステップS37の処理により特徴量データベース310のメイル1の類似メイル数に1が加算され、図13(b)のようになる。また、ステップS38の処理により、DMC300のポインタは同図(a)のようになると共に、メイル1,2,3のDMC被参照数はそれぞれ、4,2,3となる。   Further, when the mail 4 is extracted, the mail 4 is similar to the registered mail 1, so that the determination in step S33 is affirmative and the processes in steps S37 and S38 are performed. By the process of step S37, 1 is added to the number of similar mails of mail 1 in the feature quantity database 310, and the result is as shown in FIG. Further, by the processing of step S38, the pointer of the DMC 300 becomes as shown in FIG. 5A, and the DMC reference numbers of the mails 1, 2, and 3 are 4, 2, and 3, respectively.

つまり、類似メイルが到着すると、前記ステップS37でメイル1の類似メイル数に1が加算される。次に、ステップS38の処理、つまり図8の処理において、ハッシュ値h1はポインタ31が自分自身のメイル1を指しているのでステップS353の判断は肯定になり図8の処理を抜ける。次のハッシュ値h2,h3は、ポインタが共にメイル2を指しているので、ステップS353の判断は否定となり、ステップS354以下の処理に移る。そして、ステップS354でメイル2のDMC被参照数が1減算され、ステップS352でメイル1のDMC被参照数が1加算される。次のハッシュ値h0についても、同様に処理される。   That is, when a similar mail arrives, 1 is added to the number of similar mails of mail 1 in step S37. Next, in the process of step S38, that is, the process of FIG. 8, the hash value h1 indicates that the pointer 31 points to its own mail 1, so the determination in step S353 is affirmative and the process of FIG. Since the pointers of the next hash values h2 and h3 both point to mail 2, the determination in step S353 is negative, and the process proceeds to step S354 and subsequent steps. Then, 1 is subtracted from the DMC referenced number of Mail 2 in Step S354, and 1 is added to the DMC referenced number of Mail 1 in Step S352. The next hash value h0 is similarly processed.

以上のようにして、類似したメイルが多いメイルは頻繁に図6のステップS38から起動されて図8の更新処理が起動され、DMC被参照数が増加する。一方では、メイル2を見れば明らかなように、類似メイルがないものはハッシュ値がぶつかったデータを上書きする事で時間の経過とともにDMC被参照数が減少する。   As described above, a mail having many similar mails is frequently started from step S38 in FIG. 6 and the update process in FIG. 8 is started, and the number of DMC referenced is increased. On the other hand, as is apparent from Mail 2, the number of DMC references decreases with the passage of time by overwriting the data that has been hit by the hash value if there is no similar mail.

なお、本発明は前記実施形態に限定されることなく、次のように変形することも可能である。上記の実施形態においては、電子メイル収集手段51はネットワーク上に流れる電子メイルをスイッチングハブ3でタッピングする事で収集していたが、メイルサーバのソフトを変更し、メイルサーバが配送対象のメイルを直接特徴量変換手段52に送信するようにしてもよい。またメイルの配送プロトコルはSMTPを想定していたが、HTTPを用いたWWWメイルのような別の配送形態であってもかまわない。   In addition, this invention is not limited to the said embodiment, It is also possible to deform | transform as follows. In the above embodiment, the electronic mail collecting means 51 collects the electronic mail flowing on the network by tapping the switching hub 3, but the mail server software is changed so that the mail server selects the mail to be delivered. You may make it transmit to the feature-value conversion means 52 directly. The mail delivery protocol is assumed to be SMTP, but other delivery forms such as WWW mail using HTTP may be used.

また、メイルサーバが配送対象のメイルを特徴量変換手段52に送信する時に既にスパムと判定したメイルについてはスパムであるとのマークをつけて送り、その情報を使ってマスメイル検出手段53が、マークのついたメイルと類似したメイルは即座にスパムと判定してもかまわない。また、メイルサーバは前記特徴量変換手段52までを含むように構成し、該特徴量変換手段52にて変換された特徴量がネットワーク経由でマスメイル検出手段53に送信される構成にしてもよい。   In addition, when the mail server sends the mail to be delivered to the feature amount conversion means 52, the mail that has already been determined to be spam is sent with a mark as spam, and using the information, the mass mail detection means 53 Mails similar to those marked with may be immediately identified as spam. In addition, the mail server may be configured to include up to the feature amount conversion unit 52, and the feature amount converted by the feature amount conversion unit 52 may be transmitted to the mass mail detection unit 53 via a network.

また、上記の実施形態においては、マスメイル検出手段53が、記憶領域に頻繁に配送される電子メイルを優先的に記憶するための仕組みとしてDMC300(図5参照)を利用していたが、LRU方式のような別の仕組みを利用するのでもかまわない。LRUを使う場合、具体的には特徴量データベース310のエントリを管理するLRUリストを作成し、前記ステップS37(図6参照)で処理対象とした特徴量データベース310のエントリをLRUの先頭に移動する処理までステップS37に含める。また、ステップS34で特徴量データベース310に新規のエントリを作る時に必要な記憶領域はLRUの最後のエントリを廃棄して確保し、新規のエントリをLRUの先頭に加える。   In the above embodiment, the mass mail detection means 53 uses the DMC 300 (see FIG. 5) as a mechanism for preferentially storing electronic mails that are frequently delivered to the storage area. You can use another mechanism such as. When using an LRU, specifically, an LRU list for managing entries in the feature quantity database 310 is created, and the entry in the feature quantity database 310 to be processed in step S37 (see FIG. 6) is moved to the head of the LRU. The process is included in step S37. In addition, the storage area required when creating a new entry in the feature amount database 310 in step S34 is secured by discarding the last entry of the LRU, and the new entry is added to the head of the LRU.

また、上記の実施形態においては、特徴量変換手段52の前処理については説明しなかったが、図1の電子メイル収集手段51と特徴量変換手段52との間に前処理手段を設けても良い。この前処理手段は、文字列を抽出する手段であってもよく、この前処理手段により、メールアドレス、電話番号などを抽出するようにしてもよい。また、その他の何らかの前処理を行う手段でもかまわない。この前処理は、電子メイルが受信者に表示されるときの仕様に従って行うものであってもかまわない。この前処理は、例えば受信者の端末の初めの部分(例えば、始めの2頁分)に表示される文字を処理の対象として選択するのでもかまわない。この時に想定される仕様としては、表示に影響を与えるHTMLやMIMEの処理などが上げられるが、これ以外でもかまわない。また、表示の時に大文字と小文字、全角文字と半角文字などを似た文字として扱い、同じ特徴量が計算される仕組みを持つ(例えば、事前に全ての全角大文字を半角小文字に変換する仕組みを持つ)ものでもかまわない。   In the above embodiment, the preprocessing of the feature amount conversion unit 52 has not been described. However, a preprocessing unit may be provided between the electronic mail collection unit 51 and the feature amount conversion unit 52 of FIG. good. This pre-processing means may be a means for extracting a character string, and an e-mail address, a telephone number, etc. may be extracted by this pre-processing means. Also, any other means for preprocessing may be used. This pre-processing may be performed according to the specifications when the electronic mail is displayed to the recipient. In this pre-processing, for example, a character displayed in the first part (for example, the first two pages) of the receiver's terminal may be selected as a processing target. The specifications assumed at this time include HTML and MIME processing that affect the display, but other specifications are also acceptable. Also, when displaying, uppercase and lowercase letters, full-width characters and half-width characters are treated as similar characters, and the same feature amount is calculated (for example, all double-byte uppercase characters are converted into half-width lowercase characters in advance) ) It doesn't matter.

また、上記の実施形態においては、特徴量として電子メイル本文に含まれる文字列のハッシュ値を用いたが、バイグラムや単語の出現頻度など、その他の特徴量を用いてもかまわない。   In the above embodiment, the hash value of the character string included in the text of the electronic mail is used as the feature quantity. However, other feature quantities such as bigram and word appearance frequency may be used.

図14は、本発明の他の実施形態の構成を示すブロック図であり、本発明をメイルサーバに組み込んだ構成例である。なお、図14において図1と同一または同等物には同じ符号が付されており、図1と重複する説明は省略する。   FIG. 14 is a block diagram showing a configuration of another embodiment of the present invention, which is a configuration example in which the present invention is incorporated in a mail server. In FIG. 14, the same reference numerals are given to the same or equivalent parts as in FIG. 1, and the description overlapping with FIG. 1 is omitted.

図14(a)のメイルサーバ群1が複数のメイルサーバ1a、1b、1cなどから構成されているとすると、本実施形態は、同図(b)に示されているように、電子メイル収集手段51、特徴量変換手段52、マスメイル検出手段53およびメイル処理手段57を、各メイルサーバ1a、1b、1cに組み込んだ点に特徴がある。   Assuming that the mail server group 1 in FIG. 14 (a) is composed of a plurality of mail servers 1a, 1b, 1c, etc., this embodiment is configured to collect electronic mail as shown in FIG. 14 (b). The feature 51, the feature amount conversion means 52, the mass mail detection means 53, and the mail processing means 57 are characterized in that they are incorporated in each mail server 1a, 1b, 1c.

本実施形態では、マスメイルであるか否かの検出結果は、メイル処理手段57へ送られる。メイル処理手段57の行う処理は、マスメイル検出結果に基づいて、当該マスメイルの削除、メイル表題部へのマスメイルの表示などを行う。また、メイルサーバ運用者へのマスメイルの通知であってもかまわない。   In the present embodiment, the result of detection as to whether the mail is mass mail is sent to the mail processing means 57. The processing performed by the mail processing means 57 performs deletion of the mass mail, display of the mass mail in the mail title section, and the like based on the mass mail detection result. It may also be a mass mail notification to the mail server operator.

以上の説明から明らかなように、本発明によれば、事前のルール作成や学習が不要である。また、単に電子メイルの特徴量を比較することにより類似メイルを検出し、該類似メイルが一定数に達するとマスメイルと判定するので、高速にマスメイル検出動作を行うことができる。   As is clear from the above description, according to the present invention, prior rule creation and learning are unnecessary. In addition, similar mail is detected simply by comparing feature quantities of electronic mail, and when the number of similar mail reaches a certain number, it is determined as mass mail, so that mass mail detection operation can be performed at high speed.

1・・・メイルサーバ群、2・・・インターネット、3・・・スイッチングハブ、5・・・マスメイル検出装置、51・・・電子メイル収集手段、52・・・特徴量変換手段、53・・・マスメイル検出手段、55・・・マスメイル検出結果、300・・・Directed Mapped Cache、310・・・特徴量データベース、311・・・ポインタ。 DESCRIPTION OF SYMBOLS 1 ... Mail server group, 2 ... Internet, 3 ... Switching hub, 5 ... Mass-mail detection apparatus, 51 ... Electronic mail collection means, 52 ... Feature-value conversion means, 53 ... Mass mail detection means, 55... Mass mail detection result, 300... Directed Mapped Cache, 310... Feature amount database, 311.

Claims (7)

配送対象の電子メイルを収集する電子メイル収集手段と、
該電子メイル受信者に表示されるときの仕様に従って、該電子メイルの前処理を行う前処理手段と、
該前処理された電子メイルを特徴量に変換する特徴量変換手段と、
該変換した特徴量を使ってマスメイルを検出するマスメイル検出手段とを具備し、
前記特徴量変換手段は電子メイルの本文から部分文字列を抽出し、その部分文字列から計算したハッシュ値の集まりを特徴量として用い、
前記マスメイル検出手段は、特徴量データベースと該特徴量データベースへのポインタを具備し、エントリされている特徴量のハッシュ値が該ポインタにエントリされているか否かを判断し、エントリされている場合には、該ポインタを用いて特徴量データベースをアクセスし、該特徴量データベースに既に登録されている電子メイルのハッシュ値と比較することにより、新規電子メイルと既登録の電子メイルとの類似度を判定し、一定数以上のハッシュ値が一致した電子メイルを類似電子メイルと判定し、該類似電子メイルが所定数検出された時に該類似電子メイルをマスメイルと判定することを特徴とするマスメイル検出方式。
Electronic mail collecting means for collecting electronic mail to be delivered;
Pre-processing means for pre-processing the electronic mail according to a specification when the electronic mail is displayed to the recipient;
A feature amount conversion means for converting the preprocessed electronic mail into a feature amount;
Comprising mass mail detecting means for detecting mass mail using the converted feature quantity;
The feature amount conversion means extracts a partial character string from the body of the electronic mail, uses a set of hash values calculated from the partial character string as a feature amount,
The mass mail detection means includes a feature quantity database and a pointer to the feature quantity database, and determines whether or not a hash value of the entered feature quantity is entered in the pointer. Determines the similarity between a new electronic mail and a registered electronic mail by accessing the feature database using the pointer and comparing it with the hash value of the electronic mail already registered in the feature database. A mass-mail detection method characterized in that an electronic mail having a hash value equal to or greater than a predetermined number is determined as a similar electronic mail, and the similar electronic mail is determined as a mass mail when a predetermined number of the similar electronic mails are detected.
前記前処理手段、初めの部分に表示される文字を優先することを特徴とする請求項1に記載のマスメイル検出方式。 The mass mail detection method according to claim 1, wherein the preprocessing unit gives priority to a character displayed in an initial part. 前記前処理手段、全角文字とこれに対応する半角文字を似た文字とし、該似た文字を同じ文字として扱うことを特徴とする請求項1に記載のマスメイル検出方式。 The pretreatment means, a character-like double-byte characters and single-byte characters corresponding thereto, Masumeiru detection method according to claim 1, wherein the handle with the same characters該似was characters. 前記前処理手段、大文字とこれに対応する小文字を似た文字とし、該似た文字を同じ文字として扱うことを特徴とする請求項1に記載のマスメイル検出方式。 The pretreatment means, Masumeiru detection method of claim 1, a character resembling the corresponding lowercase to uppercase and this, and wherein the handle and the same character a該似was characters. 前記前処理手段、HTMLの処理を含むことを特徴とする請求項1に記載のマスメイル検出方式。 The mass mail detection method according to claim 1, wherein the preprocessing means includes HTML processing. 前記前処理手段、MIMEの処理を含むことを特徴とする請求項1に記載のマスメイル検出方式。 The mass mail detection method according to claim 1, wherein the preprocessing means includes MIME processing. 前記請求項1ないしのいずれかに記載のマスメイル検出方式を備えたメイルサーバ。 Mail server with a Masumeiru detection method according to any one of claims 1 to 6.
JP2009053823A 2009-03-06 2009-03-06 Mass mail detection method and mail server Expired - Lifetime JP4780684B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009053823A JP4780684B2 (en) 2009-03-06 2009-03-06 Mass mail detection method and mail server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009053823A JP4780684B2 (en) 2009-03-06 2009-03-06 Mass mail detection method and mail server

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004006918A Division JP4297345B2 (en) 2004-01-14 2004-01-14 Mass mail detection method and mail server

Publications (2)

Publication Number Publication Date
JP2009187558A JP2009187558A (en) 2009-08-20
JP4780684B2 true JP4780684B2 (en) 2011-09-28

Family

ID=41070667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009053823A Expired - Lifetime JP4780684B2 (en) 2009-03-06 2009-03-06 Mass mail detection method and mail server

Country Status (1)

Country Link
JP (1) JP4780684B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6250921B2 (en) 2012-09-14 2017-12-20 株式会社東芝 battery

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6460050B1 (en) * 1999-12-22 2002-10-01 Mark Raymond Pace Distributed content identification system
JP2003208388A (en) * 2002-01-16 2003-07-25 Sony Corp Electronic mail system and electronic mail transmission method

Also Published As

Publication number Publication date
JP2009187558A (en) 2009-08-20

Similar Documents

Publication Publication Date Title
US7853654B2 (en) Mass mail detection system and mail server
US7543068B2 (en) Filtering information at a data network based on filter rules associated with consumer processing devices
US8055078B2 (en) Filter for blocking image-based spam
CN108259415B (en) Mail detection method and device
US8914355B1 (en) Display-content alteration for user interface devices
US7996000B1 (en) Managing page sizes for a mobile device using estimation of content customizer techniques
CN106603734B (en) CDN service IP detection method and system
US20150101046A1 (en) Systems and methods for categorizing network traffic content
CN108984553B (en) Caching method and device
CN104933363A (en) Method and device for detecting malicious file
US20090240669A1 (en) Method of managing locations of information and information location management device
CN106649617B (en) Method for analyzing data structure of Windows Phone short message
JP4007893B2 (en) Server device, program, and recording medium
WO2014029318A1 (en) Method and apparatus for identifying webpage type
RU2701040C1 (en) Method and a computer for informing on malicious web resources
US8364666B1 (en) Method and system for context-aware data prioritization using a common scale and logical transactions
US8473556B2 (en) Apparatus, a method, a program and a system for processing an e-mail
CN101251853A (en) System and method for digging user attribute based on user interactive records
US20060047729A1 (en) Method for viewing document information on a mobile communication device
JP4780684B2 (en) Mass mail detection method and mail server
KR20140040120A (en) Method and device for extracting data from a data stream travelling around an ip network
JP2005284454A (en) Junk e-mail distribution preventive system, and information terminal and e-mail server in the system
US7127494B1 (en) Information delivery system, method for information delivery, service product and use of the service product
JP6749865B2 (en) INFORMATION COLLECTION DEVICE AND INFORMATION COLLECTION METHOD
JP2007233468A (en) Information processor and information processing method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110630

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4780684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term