JP2007265368A - Spam eliminating method - Google Patents

Spam eliminating method Download PDF

Info

Publication number
JP2007265368A
JP2007265368A JP2006094346A JP2006094346A JP2007265368A JP 2007265368 A JP2007265368 A JP 2007265368A JP 2006094346 A JP2006094346 A JP 2006094346A JP 2006094346 A JP2006094346 A JP 2006094346A JP 2007265368 A JP2007265368 A JP 2007265368A
Authority
JP
Japan
Prior art keywords
registered
message
link destination
link
spam
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006094346A
Other languages
Japanese (ja)
Other versions
JP4500285B2 (en
Inventor
Hirotaka Mori
浩貴 森
Yu Miyazaki
祐 宮崎
Taisei Yoshida
大成 吉田
Takeshi Yamoto
豪 矢本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2006094346A priority Critical patent/JP4500285B2/en
Publication of JP2007265368A publication Critical patent/JP2007265368A/en
Application granted granted Critical
Publication of JP4500285B2 publication Critical patent/JP4500285B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To effectively eliminate a spam message or the like including an unauthorized link. <P>SOLUTION: A method of processing transmission messages in message distribution service, e-mail service or electronic bulletin board service comprises processes for extracting a link from received message contents, determining whether the link is a link destination registered in a black list when the link is included in the message contents, determining the appearance frequency of the link destination when the link is a link destination not registered in the black list, analyzing the page contents of the link destination to determine whether words and phrases registered in a forbidden word list are included when the appearance frequency is a predetermined value or more, and canceling the corresponding transmission message when the link destination is registered in the black list and when the words and phrases registered in the forbidden word list are included in the page contents of the link destination. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、不正なリンクを含むスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等を除去するスパム除去方法に関する。   The present invention relates to a spam removal method that removes spam messages, spam mails, spam posts, spam trackbacks, and the like that contain illegal links.

インターネットを利用したメッセージ配信サービス(メッセンジャーと呼ばれるアプリケーションにより特定の相手にリアルタイムにメッセージを配信するサービス)、電子メールサービス、電子掲示板サービス等が提供されており、ユーザの利用度は高い。   A message delivery service using the Internet (a service for delivering a message to a specific party in real time by an application called a messenger), an e-mail service, an electronic bulletin board service, and the like are provided, and the user's usage is high.

ところで、相手の会員ID、メールアドレス、掲示板ID、トラックバックURL(Uniform Resource Locator)等を何らかの方法で入手し、あるいは英数字等を適当に組み合わせることで自動生成し、アダルトサイトや有害ブログ(ブログ:Web Logの簡略呼称であり、日記風サイトのこと)等へのURLによるリンクを含めた、いわゆるスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等がサーバに大量に送りつけられることが問題となっている。なお、トラックバックとは、他のブログの記事との関連付けを行う機能であり、トラックバック機能を持つシステムは、トラックバックを受け付ける記事に対してトラックバックURLを発行しており、その記事(親記事)を参考に自分のブログで記事(子記事)を書いた場合、親記事のトラックバックURLに対してトラックバックPINGを送信することで、親記事側のシステムにおいて親記事と関連付けられた状態で子記事の要約やURLリンク等が掲載されるものである。   By the way, the other party's member ID, e-mail address, bulletin board ID, trackback URL (Uniform Resource Locator), etc. are obtained by some method, or automatically generated by appropriately combining alphanumeric characters, etc., and adult sites and harmful blogs (blog: It is a simple name for Web Log, and it is a problem that so-called spam messages, spam mails, spam posts, spam trackbacks, etc. including URL links to diary-like sites) are sent to the server in large quantities. ing. Trackback is a function that associates with other blog articles. A system with a trackback function issues a trackback URL for an article that accepts a trackback, and refers to that article (parent article). If you write an article (child article) on your blog, you can send a trackback PING to the trackback URL of the parent article, so that you can A URL link or the like is posted.

従来、このような場合に対処すべく、例えばメッセージ配信サーバにおいては、メッセージに含まれるリンク先をリアルタイムに集計し、その頻度が極端に高いものをスパムメッセージとして自動的に破棄するようにしていた。   Conventionally, in order to deal with such a case, for example, in a message distribution server, link destinations included in a message are totaled in real time, and an extremely high frequency is automatically discarded as a spam message. .

一方、特許文献1には、電子メールシステムにおいて、SPAM判定ワードを含むメールおよび所定の流量を超える同一送信元IP(Internet Protocol)アドレスのメールを迷惑メールと判定し、配信を拒否するようにした技術が開示されている。
特開2005−208780号公報
On the other hand, in Patent Document 1, in an e-mail system, a mail including a SPAM determination word and a mail with the same source IP (Internet Protocol) address exceeding a predetermined flow rate are determined to be spam mails, and distribution is rejected. Technology is disclosed.
JP 2005-208780 A

上述したように、従来のメッセージ配信サーバにおける、メッセージに含まれるリンクの頻度が極端に高いものをスパムメッセージとして自動的に破棄する手法では、頻度が高いだけで破棄されることから、多人数を対象とした正常なメッセージであっても破棄されてしまうこととなり、伝えたい相手にメッセージが届かず、サービス性が低下するという問題があった。   As described above, in the conventional message delivery server, the method of automatically discarding a message with extremely high frequency of links included in a message as a spam message is discarded only with high frequency. Even if the target normal message is discarded, the message is not delivered to the other party who wants to convey it, and there is a problem that the serviceability deteriorates.

一方、特許文献1に記載される技術では、所定の流量(上述した頻度に相当)を超える同一送信元IPアドレスのメールを迷惑メールと判定している点では、上述したものと同様の問題を有している。また、SPAM判定ワードを含むメールを迷惑メールと判定する点が追加されているが、一般にアダルトサイト等へのリンクを含めたメール等は文字数も少ないとともに、意図的に言葉を選んでいる可能性も高く、SPAM判定ワードに該当する確率もそれほど高くはない。   On the other hand, the technique described in Patent Document 1 has the same problem as that described above in that mail with the same source IP address exceeding a predetermined flow rate (corresponding to the above-described frequency) is determined as spam mail. Have. In addition, it has been added that e-mails containing SPAM judgment words are determined to be spam mails, but in general, e-mails that contain links to adult sites, etc. have a small number of characters and the possibility of intentionally selecting words The probability of being a SPAM determination word is not so high.

本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、不正なリンクを含むスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等を有効に除去することのできるスパム除去方法を提供することにある。   The present invention has been proposed in view of the above-described conventional problems, and the object of the present invention is to effectively remove spam messages, spam mails, spam posts, spam trackbacks, and the like containing illegal links. It is to provide a spam removal method.

上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理方法であって、受け付けたメッセージ内容からリンクを抽出する工程と、上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する工程と、ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する工程と、出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する工程と、上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する工程とを備えるスパム除去方法を要旨としている。   In order to solve the above problems, according to the present invention, there is provided a processing method for a transmission message in a message distribution service, an e-mail service, an electronic bulletin board service, or the like, as described in claim 1. A step of extracting a link from the message content, a step of determining whether or not a link destination is registered in the black list when the link is included in the message content, and a link not registered in the black list. A step of determining the appearance frequency of the link destination if it is the destination, and a phrase registered in the prohibited word list by analyzing the page contents of the link destination if the appearance frequency is a predetermined value or more Determining whether or not the link destination is registered in the black list, and the phrase registered in the prohibited word list If included in the page content of the link destination, spam removal method and a discarding step of transmitting a message corresponding is the gist.

また、請求項2に記載されるように、請求項1に記載のスパム除去方法において、上記メッセージ内容にリンクが含まれていない場合、上記出現頻度が所定値以上でない場合、および、上記禁止語リストに登録された語句が含まれていない場合、対応する伝達メッセージを通常処理として配信、送信、もしくは、掲示する工程を備えるようにすることができる。   Further, as described in claim 2, in the spam removal method according to claim 1, when the message content does not include a link, the appearance frequency is not equal to or higher than a predetermined value, and the prohibited word If the list does not include a registered phrase, a process for delivering, transmitting, or posting the corresponding transmission message as a normal process can be provided.

また、請求項3に記載されるように、請求項1または2のいずれか一項に記載のスパム除去方法において、上記禁止語リストに登録された語句が含まれているリンク先を、上記ブラックリストに追加登録する工程を備えるようにすることができる。   Further, as described in claim 3, in the spam removal method according to claim 1 or 2, the link destination including a word / phrase registered in the prohibited word list is changed to the black address. A step of additionally registering in the list can be provided.

また、請求項4に記載されるように、請求項1乃至3のいずれか一項に記載のスパム除去方法において、上記メッセージ内容にリンクが含まれる場合、処理する複数の伝達メッセージにおける当該リンク先へのリンクの出現頻度をリスティングする工程を備えるようにすることができる。   Further, as described in claim 4, in the spam removal method according to any one of claims 1 to 3, when a link is included in the message content, the link destination in a plurality of transmission messages to be processed The step of listing the appearance frequency of the link to can be provided.

また、請求項5に記載されるように、請求項1乃至4のいずれか一項に記載のスパム除去方法において、対象とするサービスは、表示対象となる全ての記事に対して代理トラックバックURLを発行し、記事の代理トラックバックURL宛のトラックバックPINGを受け付け、受け付けたトラックバックPINGに基づいて送信側ブログの記事を対応する親記事に関連付けて表示する電子掲示板サービスであり、全ての記事に対してスパムであるか否かを判定するようにすることができる。   Further, as described in claim 5, in the spam removal method according to any one of claims 1 to 4, the target service sets a proxy trackback URL for all articles to be displayed. This is an electronic bulletin board service that issues and receives trackback PING addressed to the proxy trackback URL of an article, displays an article on the sending blog in association with the corresponding parent article based on the received trackback PING, and spams all articles It can be determined whether or not.

また、請求項6に記載されるように、メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理を行うサーバであって、受け付けたメッセージ内容からリンクを抽出する手段と、上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段とを備えたサーバとして構成することができる。   Further, as described in claim 6, a server for processing a transmission message in a message delivery service, an e-mail service, an electronic bulletin board service or the like, and means for extracting a link from the received message content; When a link is included in the message content, a means for determining whether or not the link destination is registered in the black list, and when the link destination is not registered in the black list, the link destination appears. Means for determining the frequency, means for analyzing whether or not the word registered in the prohibited word list is included by analyzing the contents of the linked page when the appearance frequency is a predetermined value or more, and the black If the link destination is registered in the list, and the phrase registered in the prohibited word list is included in the page contents of the link destination If there are, it may be configured as and a means for discarding the corresponding transmission message server.

また、請求項7に記載されるように、メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理を行うプログラムであって、コンピュータを、受け付けたメッセージ内容からリンクを抽出する手段と、上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段として機能させるプログラムとして構成することができる。   According to a seventh aspect of the present invention, there is provided a program for processing a transmission message in a message distribution service, an e-mail service, an electronic bulletin board service or the like, and the computer extracts a link from the received message content. Means, if the message content contains a link, means for determining whether the link destination is registered in the black list, and if the link destination is not registered in the black list, the link Means for determining the appearance frequency of the destination, and means for determining whether or not the word registered in the prohibited word list is included by analyzing the page contents of the link destination when the appearance frequency is equal to or higher than a predetermined value. When the link destination is registered in the black list, and the phrase registered in the prohibited word list is the link destination If included in the page content may be configured as a program to function as a means for discarding the corresponding transmission message.

本発明のスパム除去方法にあっては、不正なリンクを含むスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等を有効に除去することができる。   According to the spam removal method of the present invention, it is possible to effectively remove spam messages, spam mails, spam posts, spam trackbacks, and the like including illegal links.

以下、本発明の好適な実施形態につき説明する。   Hereinafter, preferred embodiments of the present invention will be described.

図1は本発明の一実施形態にかかるメッセージ配信システムの構成例を示す図である。なお、メッセージ配信サービスを例として説明するが、電子メールサービスや電子掲示板サービス等においても同様に適用が可能である。   FIG. 1 is a diagram showing a configuration example of a message delivery system according to an embodiment of the present invention. Although the message distribution service will be described as an example, the present invention can be similarly applied to an electronic mail service, an electronic bulletin board service, and the like.

図1において、メッセージ配信システムは、インターネット等のネットワーク2に接続されたメッセージ管理サーバ1と、ネットワーク2に有線もしくは無線によりアクセス可能なPC(Personal Computer)、PDA(Personal Digital Assistant)、携帯電話等の複数のクライアント3を含んでいる。あるクライアント3から相手の会員ID等を指定してメッセージを送信すると、メッセージ管理サーバ1を経由して相手先のクライアント3にメッセージが配信される。   In FIG. 1, a message distribution system includes a message management server 1 connected to a network 2 such as the Internet, a PC (Personal Computer), a PDA (Personal Digital Assistant), a mobile phone, etc. that can access the network 2 by wire or wirelessly. A plurality of clients 3 are included. When a message is transmitted from a certain client 3 specifying the member ID of the other party, the message is delivered to the client 3 of the other party via the message management server 1.

図2はメッセージ管理サーバ1の構成例を示す図である。   FIG. 2 is a diagram illustrating a configuration example of the message management server 1.

図2において、メッセージ管理サーバ1は、ネットワーク2との通信を制御する通信制御部101と、この通信制御部101で受信したメッセージを一時的に蓄積するメッセージバッファ部102と、所定の条件下でメッセージバッファ部102に蓄積されたメッセージを相手先に転送するメッセージ転送部103とを備えている。   In FIG. 2, the message management server 1 includes a communication control unit 101 that controls communication with the network 2, a message buffer unit 102 that temporarily stores messages received by the communication control unit 101, and a predetermined condition. And a message transfer unit 103 that transfers the message stored in the message buffer unit 102 to the other party.

また、メッセージ管理サーバ1は、メッセージバッファ部102に蓄積されたメッセージを1件単位に受け付けるメッセージ受付部104と、このメッセージ受付部104で受け付けたメッセージの本文からURL等のリンク先の情報を抽出するリンク抽出部105と、リンク抽出部105で抽出されたリンク先の出現頻度をリスティングテーブル107に登録してリスティング(出現頻度の高い順に管理)する出現頻度リスティング部106とを備えている。リスティングテーブル107は、リンク先の情報と出現回数とを一対として、複数のリンク先についての情報が格納されている。   The message management server 1 also extracts a message receiving unit 104 that receives messages stored in the message buffer unit 102 in units of one message, and extracts link destination information such as a URL from the body of the message received by the message receiving unit 104. And an appearance frequency listing unit 106 that registers the appearance frequency of the link destination extracted by the link extraction unit 105 in the listing table 107 and manages the listing (in order of appearance frequency). The listing table 107 stores information about a plurality of link destinations with a pair of link destination information and the number of appearances.

また、メッセージ管理サーバ1は、リンク抽出部105で抽出されたリンク先がブラックリスト109に登録されているか照合するブラックリスト照合部108と、このブラックリスト照合部108においてブラックリスト109に登録されていなかったリンク先につき出現頻度リスティング部106から出現頻度を取得して所定値を超えるか否か判断する出現頻度判定部110とを備えている。なお、ブラックリスト109には、過去のスパムメッセージ等から抽出したリンク先の情報が複数登録されている。   Further, the message management server 1 includes a black list collating unit 108 for collating whether the link destination extracted by the link extracting unit 105 is registered in the black list 109, and the black list collating unit 108 registering the link destination in the black list 109. An appearance frequency determining unit 110 that acquires the appearance frequency from the appearance frequency listing unit 106 for each link destination and determines whether or not a predetermined value is exceeded is provided. In the black list 109, a plurality of link destination information extracted from past spam messages and the like are registered.

また、メッセージ管理サーバ1は、出現頻度判定部110において出現頻度が所定値を超えるリンク先に対してページリクエストを行うことでページアクセスを行うリンク先ページアクセス部111と、アクセスしたページのHTML(Hyper Text Markup Language)等で記述された内容を解析して語句を抽出するページ解析部112と、このページ解析部112において抽出された語句が禁止語リスト114に登録されているか照合する禁止語照合部113と、所定の条件下でメッセージバッファ部102に蓄積されたメッセージを破棄するメッセージ破棄部115とを備えている。なお、禁止語リスト114には、アダルトサイト等で使用される可能性の高い猥褻な語句等が複数登録されている。   The message management server 1 also includes a link destination page access unit 111 that performs page access by making a page request to a link destination whose appearance frequency exceeds a predetermined value in the appearance frequency determination unit 110, and HTML ( Hypertext Markup Language) is used to analyze the contents described in the page analysis unit 112 to extract words and phrases, and prohibited word matching to check whether the words extracted in the page analysis unit 112 are registered in the prohibited word list 114 Unit 113 and a message discard unit 115 that discards the message stored in the message buffer unit 102 under a predetermined condition. In the forbidden word list 114, a plurality of obscene words and the like that are likely to be used on adult sites and the like are registered.

図3は上記のメッセージ管理サーバ1におけるメッセージ受付時の処理例を示すフローチャートである。   FIG. 3 is a flowchart showing a processing example when receiving a message in the message management server 1.

図3において、メッセージ受付部104がメッセージを受け付けると(ステップS1)、リンク抽出部105はそのメッセージの本文からリンク先を抽出する(ステップS2)。そして、メッセージがリンクを含んでいるか否か判断し(ステップS3)、メッセージがリンクを含まない場合(ステップS3のNo)、メッセージ転送部103は通常処理としてメッセージバッファ部102に格納された対象メッセージを通信制御部101を介して転送し(ステップS4)、処理を終了する(ステップS16)。   In FIG. 3, when the message reception unit 104 receives a message (step S1), the link extraction unit 105 extracts a link destination from the message body (step S2). Then, it is determined whether or not the message includes a link (step S3). When the message does not include a link (No in step S3), the message transfer unit 103 stores the target message stored in the message buffer unit 102 as a normal process. Is transferred via the communication control unit 101 (step S4), and the process is terminated (step S16).

また、メッセージがリンクを含んでいる場合(ステップS3のYes)、リンク抽出部105は出現頻度リスティング部106にリスティング対象とすべく登録を行い(ステップS5)、出現頻度リスティング部106はリスティングテーブル107の更新を行う。すなわち、出現頻度リスティング部106は、初めてのリンク先については出現回数1回としてリスティングテーブル107の最下位にリンク先を登録し、複数回目の場合は該当するリンク先の出現回数をインクリメントし、出現回数に応じて出現頻度を把握する。   If the message includes a link (Yes in step S3), the link extraction unit 105 registers the appearance frequency listing unit 106 to be a listing target (step S5), and the appearance frequency listing unit 106 lists the listing table 107. Update. That is, the appearance frequency listing unit 106 registers the link destination at the lowest position of the listing table 107 as the number of appearances for the first link destination, and increments the number of appearances of the corresponding link destination in the case of multiple times. The appearance frequency is grasped according to the number of times.

次いで、ブラックリスト照合部108はそのリンク先をブラックリスト109と照合し(ステップS6)、ブラックリスト109に登録されているか否か判断する(ステップS7)。ここで、ブラックリスト109に登録されている場合(ステップS7のYes)、メッセージ破棄部115によりメッセージバッファ部102に蓄積された対象メッセージを破棄し(ステップS15)、処理を終了する(ステップS16)。   Next, the blacklist collating unit 108 collates the link destination with the blacklist 109 (step S6), and determines whether or not it is registered in the blacklist 109 (step S7). If the message is registered in the black list 109 (Yes in step S7), the message discard unit 115 discards the target message stored in the message buffer unit 102 (step S15), and the process ends (step S16). .

また、ブラックリスト109に登録されていない場合(ステップS7のNo)、出現頻度判定部110は出現頻度リスティング部106から対象リンク先の出現頻度を参照し(ステップS8)、上位所定順位内であるか否か判断する(ステップS9)。ここで、上位所定順位内でない場合(ステップS9のNo)、メッセージ転送部103は通常処理としてメッセージバッファ部102に格納された対象メッセージを通信制御部101を介して転送し(ステップS4)、処理を終了する(ステップS16)。   If not registered in the black list 109 (No in step S7), the appearance frequency determination unit 110 refers to the appearance frequency of the target link destination from the appearance frequency listing unit 106 (step S8) and is within the upper predetermined order. Whether or not (step S9). Here, when it is not in the upper predetermined order (No in step S9), the message transfer unit 103 transfers the target message stored in the message buffer unit 102 as a normal process via the communication control unit 101 (step S4), and the process Is finished (step S16).

また、上位所定順位内に入っている場合(ステップS9のYes)、リンク先ページアクセス部111はリンク先に対してページリクエストを行うことでページアクセスを行い(ステップS10)、ページ解析部112はアクセスしたページの内容を解析して語句を抽出する(ステップS11)。   In addition, when it is within the upper predetermined order (Yes in Step S9), the link destination page access unit 111 performs page access by making a page request to the link destination (Step S10), and the page analysis unit 112 The contents of the accessed page are analyzed and words are extracted (step S11).

次いで、禁止語照合部113は抽出した語句を禁止語リスト114と照合し(ステップS12)、禁止語リスト114に登録されているか否か判断する(ステップS13)。ここで、禁止語リスト114に登録されていない場合(ステップS13のNo)、メッセージ転送部103は通常処理としてメッセージバッファ部102に格納された対象メッセージを通信制御部101を介して転送し(ステップS4)、処理を終了する(ステップS16)。   Next, the prohibited word collating unit 113 collates the extracted word with the prohibited word list 114 (step S12), and determines whether it is registered in the prohibited word list 114 (step S13). Here, when not registered in the prohibited word list 114 (No in step S13), the message transfer unit 103 transfers the target message stored in the message buffer unit 102 as a normal process via the communication control unit 101 (step S13). S4), the process ends (step S16).

また、禁止語リスト114に登録されている場合(ステップS13のYes)、禁止語照合部113はその語句を含んでいたリンク先をブラックリスト109に登録するとともに(ステップS14)、メッセージ破棄部115によりメッセージバッファ部102に蓄積された対象メッセージを破棄し(ステップS15)、処理を終了する(ステップS16)。   When the prohibited word list 114 is registered in the prohibited word list 114 (Yes in step S13), the prohibited word collating unit 113 registers the link destination including the word in the black list 109 (step S14) and the message discarding unit 115. Thus, the target message stored in the message buffer unit 102 is discarded (step S15), and the process is terminated (step S16).

このように、受け付けたメッセージに対し、リンクの有無、ブラックリスト該当の有無、リンク先の出現頻度、禁止語該当の有無により、メッセージを転送するか破棄するかを制御しているため、多人数を対象とした正常なメッセージを不当に破棄してしまうことがなく、スパムメッセージ等を有効に除去することができる。   In this way, because the received message controls whether to forward or discard the message depending on the presence or absence of a link, the presence or absence of a blacklist, the appearance frequency of a link destination, the presence or absence of a prohibited word, a large number of people It is possible to effectively remove a spam message and the like without unjustly discarding a normal message targeted at.

次に、本発明を掲示板システムに適用した実施形態について説明する。   Next, an embodiment in which the present invention is applied to a bulletin board system will be described.

図4は掲示板システムの例を示す図であり、掲示板サーバ10において、主テーマのトラックバックURL(代理トラックバックURL)にトラックバックPINGを送信したブログ記事A、Cが主テーマの子記事として表示され、ブログ記事AのトラックバックURLにトラックバックPINGを送信したブログ記事Bがブログ記事Aの子記事(主テーマの孫記事)として表示され、ブログ記事CのトラックバックURLにトラックバックPINGを送信したブログ記事D、Eがブログ記事Cの子記事(主テーマの孫記事)として表示され、ブログ記事EのトラックバックURLにトラックバックPINGを送信したブログ記事Fがブログ記事Eの子記事(主テーマの曾孫記事)として表示された状態を示している。親記事のみではなく、全ての記事に対して代理トラックバックURLを発行し、トラックバックPINGを受け付けた記事をその記事の子記事として階層的に表示するようにしており、親記事、子記事、孫記事・・・と複数の世代のトラックバック受信表示が可能で、一つの主テーマから発展した記事の連続性・一体性を損なうことなく表示を行うことができるようになっている。   FIG. 4 is a diagram showing an example of the bulletin board system. In the bulletin board server 10, the blog articles A and C that have transmitted the track back PING to the track back URL (proxy track back URL) of the main theme are displayed as child articles of the main theme. Blog article B that sent trackback PING to the trackback URL of article A is displayed as a child article (grandchild article of the main theme) of blog article A, and blog articles D and E that sent trackback PING to the trackback URL of blog article C A blog article F that is displayed as a child article of the blog article C (a grandchild article of the main theme) and that sends a trackback PING to the trackback URL of the blog article E is displayed as a child article of the blog article E (a grandchild article of the main theme) Indicates the state. In addition to the parent article, proxy trackback URLs are issued for all articles, and the articles that have received the trackback PING are hierarchically displayed as child articles of the article. Parent article, child article, grandchild article ... and multiple generations of trackback reception display are possible, and display can be performed without impairing the continuity and integrity of articles developed from one main theme.

図5は掲示板システムの構成例を示す図であり、掲示板サーバ10はインターネット等のネットワーク2に接続され、ネットワーク2にはPC等のクライアント31、32・・と、他のブログシステム41、42・・とが接続される。   FIG. 5 is a diagram showing a configuration example of the bulletin board system. The bulletin board server 10 is connected to a network 2 such as the Internet, and the network 2 includes clients 31, 32... And other blog systems 41, 42.・ And are connected.

掲示板サーバ10は、掲示板への書き込みデータの受け付け、トラックバックPINGの受け付け、掲示板表示データの出力、データ保存部12とのデータ入出力等を行うデータ処理部11と、掲示板への書き込みデータ等の保存を行うデータ保存部12と、掲示板上の記事に対して代理トラックバックURLを発行する代理トラックバックURL発行部13と、掲示板上の記事に対してトラックバックPINGを送信してきた元記事のブログシステムにアクセスし、その元記事のトラックバックURLを抽出するトラックバックURL抽出部14と、トラックバックにより掲示板上に掲載された他のブログの記事に対してトラックバックPINGを受け付けた場合に、保存してある元記事のトラックバックURLに対してトラックバックPINGを送信するトラックバックPING代理送信部15と、掲示板サーバ10に対してクライアント31、32等により書き込まれた記事もしくはブログシステム41、42等によりトラックバックされてきた元記事についてスパムであるか否か判定し、スパムである場合にその除去を行うスパム除去部16とを備えている。   The bulletin board server 10 accepts write data to the bulletin board, accepts trackback PING, outputs bulletin board display data, inputs / outputs data to / from the data storage unit 12, and saves write data to the bulletin board, etc. Access to the data storage unit 12 that performs the processing, the proxy trackback URL issuing unit 13 that issues the proxy trackback URL to the article on the bulletin board, and the blog system of the original article that has transmitted the trackback PING to the article on the bulletin board The trackback URL extracting unit 14 for extracting the trackback URL of the original article and the trackback URL of the original article stored when the trackback PING is received for the article of another blog posted on the bulletin board by the trackback. Trackback P against Whether the trackback PING proxy transmission unit 15 that transmits NG and the article written by the clients 31, 32, etc. to the bulletin board server 10 or the original article tracked back by the blog system 41, 42, etc. is spam And a spam removing unit 16 for removing the spam if it is spam.

スパム除去部16の内部構成としては、前述した図2のメッセージ受付部104、リンク抽出部105、出現頻度リスティング部106、リスティングテーブル107、ブラックリスト照合部108、ブラックリスト109、出現頻度判定部110、リンク先ページアクセス部111、ページ解析部112、禁止語照合部113、禁止語リスト114、メッセージ破棄部115の部分と同じである。なお、図5におけるデータ保存部12は図2のメッセージバッファ部102に相当し、図5におけるデータ処理部11は図2の通信制御部101およびメッセージ転送部103に相当する(掲示板システムであるため、メッセージの転送は行わず、メッセージ(記事)の表示を行う点が異なる)。   The internal configuration of the spam removal unit 16 includes the message reception unit 104, the link extraction unit 105, the appearance frequency listing unit 106, the listing table 107, the black list matching unit 108, the black list 109, and the appearance frequency determination unit 110 shown in FIG. , The linked page access unit 111, the page analysis unit 112, the prohibited word collating unit 113, the prohibited word list 114, and the message discarding unit 115. The data storage unit 12 in FIG. 5 corresponds to the message buffer unit 102 in FIG. 2, and the data processing unit 11 in FIG. 5 corresponds to the communication control unit 101 and message transfer unit 103 in FIG. , Except that the message (article) is displayed without forwarding the message).

図6は掲示板サーバ10のデータ保存部12に記録される保存データの構造例を示す図である。保存データとしては、掲示板サーバ10内の記事を識別する「記事ID」フィールドと、当該記事に親記事が存在する場合に親記事を識別する「親記事ID」フィールドと、書き込み記事もしくはブログ記事の要約が記録される「記事データ」フィールドと、当該記事が他のブログシステムからトラックバックされた場合における元記事のトラックバックURLが記録される「トラックバックURL」フィールドと、当該記事に対して発行された代理トラックバックURLが記録される「代理トラックバックURL」フィールドとが設けられている。   FIG. 6 is a diagram showing an example of the structure of stored data recorded in the data storage unit 12 of the bulletin board server 10. As stored data, an “article ID” field for identifying an article in the bulletin board server 10, a “parent article ID” field for identifying a parent article when a parent article exists in the article, a written article or a blog article An “article data” field in which the summary is recorded, a “trackback URL” field in which the trackback URL of the original article when the article is tracked back from another blog system, and a proxy issued for the article A “proxy trackback URL” field in which the trackback URL is recorded is provided.

図7は掲示板サーバ10における記事書き込み時の処理例を示すフローチャートである。   FIG. 7 is a flowchart showing an example of processing at the time of article writing in the bulletin board server 10.

図7において、データ処理部11はクライアント(31、32等)から記事データを受信すると(ステップS101)、データ保存部12に記事データを保存する(ステップS102)。具体的には、図6のデータ構造において、ユニークな記事IDを付して記事データを保存する。また、特定の親記事についての子記事として書き込まれた場合は、親記事と関連付けてデータ保存部12に保存する。具体的には、図6のデータ構造において、親記事の記事IDを「親記事ID」フィールドに設定することで親記事との関連付けを行う。   In FIG. 7, when the data processing unit 11 receives article data from a client (31, 32, etc.) (step S101), the data processing unit 11 stores the article data in the data storage unit 12 (step S102). Specifically, the article data is stored with a unique article ID in the data structure of FIG. Further, when it is written as a child article for a specific parent article, it is stored in the data storage unit 12 in association with the parent article. Specifically, in the data structure of FIG. 6, the article ID of the parent article is set in the “parent article ID” field to associate with the parent article.

図7に戻り、スパム除去部16は書き込まれた記事についてスパムであるか否か判定し(ステップS103)、スパムであると判定した場合(ステップS104のYes)はデータ保存部12から記事データの破棄を行い(ステップS105)、処理を終了する。スパムであるか否かの判定は図3に示した処理(ステップS2、S3、S5〜S14)と同様である。   Returning to FIG. 7, the spam removal unit 16 determines whether or not the written article is spam (step S103). If it is determined that the article is spam (Yes in step S104), the data storage unit 12 reads the article data. Discard it (step S105) and end the process. The determination of whether or not it is spam is the same as the processing shown in FIG. 3 (steps S2, S3, S5 to S14).

図7に戻り、スパムでないと判定した場合(ステップS104のNo)、代理トラックバックURL発行部13は書き込まれた記事に対して代理トラックバックURLを発行し(ステップS106)、その代理トラックバックURLを記事データと関連付けてデータ保存部12に保存する(ステップS107)。具体的には、図6のデータ構造において、発行された代理トラックバックURLを該当するレコードの「代理トラックバックURL」フィールドに設定する。   Returning to FIG. 7, when it is determined that it is not spam (No in step S104), the proxy trackback URL issuing unit 13 issues a proxy trackback URL to the written article (step S106), and the proxy trackback URL is set as article data. And stored in the data storage unit 12 (step S107). Specifically, in the data structure of FIG. 6, the issued proxy trackback URL is set in the “proxy trackback URL” field of the corresponding record.

図7に戻り、データ処理部11はデータ保存部12のデータに従い、最新状態の記事を階層的に表示する(ステップS108)。   Returning to FIG. 7, the data processing unit 11 hierarchically displays the latest articles according to the data stored in the data storage unit 12 (step S108).

このように、掲示板に書き込まれる記事がスパムである場合、それを有効に除去することができる。   Thus, if an article written on the bulletin board is spam, it can be effectively removed.

図8は掲示板サーバ10におけるトラックバック受信時の処理例を示すフローチャートである。   FIG. 8 is a flowchart showing an example of processing at the time of trackback reception in the bulletin board server 10.

図8において、データ処理部11はブログシステム(41、42等)からトラックバックPINGを受信すると(ステップS201)、親記事と関連付けて記事データをデータ保存部12に保存する(ステップS202)。図9はトラックバックPINGに含まれるデータの例を示す図であり、Title(ブログ記事のタイトル)、Excerpt(ブログ記事の要約)、url(ブログ記事のpermalink)、blog_name(ブログの名前)を含んでおり、これらを図6のデータ構造の「記事データ」フィールドに記録する。なお、permalinkとは記事内容を更新しても変化しないURI(Uniform
Resource Indicator)であり、一つの記事に一つのURIが存在する。
In FIG. 8, when the data processing unit 11 receives the trackback PING from the blog system (41, 42, etc.) (step S201), the data processing unit 11 stores the article data in the data storage unit 12 in association with the parent article (step S202). FIG. 9 is a diagram showing an example of data included in the trackback PING, including Title (blog article title), Excerpt (blog article summary), url (blog article permalink), and blog_name (blog name). These are recorded in the “article data” field of the data structure of FIG. Permalink is a URI (Uniform) that does not change even if the article content is updated.
Resource Indicator), and one URI exists in one article.

図8に戻り、スパム除去部16は書き込まれた記事についてスパムであるか否か判定し(ステップS203)、スパムであると判定した場合(ステップS204のYes)はデータ保存部12から記事データの破棄を行い(ステップS205)、処理を終了する。スパムであるか否かの判定は図3に示した処理(ステップS2、S3、S5〜S14)と同様である。なお、メッセージ(記事)に含まれるリンクとしては、トラックバックしてきた元記事へのURLリンクと、記事の要約中に含まれるURLリンクとがある。   Returning to FIG. 8, the spam removal unit 16 determines whether or not the written article is spam (step S203). If it is determined that the article is spam (Yes in step S204), the data storage unit 12 reads the article data. Discard it (step S205) and end the process. The determination of whether or not it is spam is the same as the processing shown in FIG. 3 (steps S2, S3, S5 to S14). The links included in the message (article) include a URL link to the original article that has been tracked back and a URL link included in the summary of the article.

図8に戻り、スパムでないと判定した場合(ステップS204のNo)、トラックバックURL抽出部14はトラックバックPINGを送信してきたブログシステムにアクセスし、元記事のトラックバックURLを抽出する(ステップS206)。すなわち、図9に示したurlにアクセスすることで図10に示すような元記事のHTMLデータを取得し、その中に記述されるRDF(Resource
Description Framework)データから要素型名「trackback:ping」に記述されるトラックバックURL(この例では「http://xxxx.jp/yyyyyy/tb/1234567890」)を抽出する。
Returning to FIG. 8, when it is determined that the message is not spam (No in step S204), the trackback URL extraction unit 14 accesses the blog system that has transmitted the trackback PING and extracts the trackback URL of the original article (step S206). That is, by accessing the url shown in FIG. 9, the HTML data of the original article as shown in FIG. 10 is acquired, and the RDF (Resource
Description Framework) A trackback URL (“http://xxxx.jp/yyyyyy/tb/1234567890” in this example) described in the element type name “trackback: ping” is extracted from the data.

図8に戻り、代理トラックバックURL発行部13はトラックバックしてきた記事に対して代理トラックバックURLを発行し(ステップS207)、既に抽出した元記事のトラックバックURLと発行した代理トラックバックURLを記事データと関連付けてデータ保存部12に保存する(ステップS208)。具体的には、図6のデータ構造において、元記事のトラックバックURLを該当するレコードの「トラックバックURL」フィールドに設定し、発行された代理トラックバックURLを「代理トラックバックURL」フィールドに設定する。   Returning to FIG. 8, the proxy trackback URL issuing unit 13 issues a proxy trackback URL for the article that has been tracked back (step S207), and associates the trackback URL of the original article that has already been extracted and the issued proxy trackback URL with the article data. The data is stored in the data storage unit 12 (step S208). Specifically, in the data structure of FIG. 6, the trackback URL of the original article is set in the “trackback URL” field of the corresponding record, and the issued proxy trackback URL is set in the “proxy trackback URL” field.

図8に戻り、トラックバックの対象となる親記事がブログ記事である場合(ステップS209のYes)、トラックバックPING代理送信部15はデータ保存部12に保存されている元記事のトラックバックURLに対してトラックバックPINGを送信する(ステップS210)。これは、掲示板サーバ10上のトラックバックにより掲載されたブログ記事に対してあるユーザがトラックバックPINGを送信した場合、本来のブログ記事のあるブログシステムにも当該ユーザはトラックバックPINGを送信すべきところ、重ねてトラックバックPINGを送信するのは面倒であるため、それを掲示板サーバ10において自動的に代行するものである。   Returning to FIG. 8, when the parent article to be tracked back is a blog article (Yes in step S209), the trackback PING proxy transmission unit 15 tracks back the trackback URL of the original article stored in the data storage unit 12. PING is transmitted (step S210). This is because, when a user sends a trackback PING to a blog article posted by a trackback on the bulletin board server 10, the user should send the trackback PING to the blog system with the original blog article. Since it is troublesome to transmit the trackback PING, the bulletin board server 10 automatically substitutes it.

そして、データ処理部11はデータ保存部12のデータに従い、最新状態の記事を階層的に表示する(ステップS211)。   Then, the data processing unit 11 hierarchically displays the latest articles according to the data stored in the data storage unit 12 (step S211).

このように、掲示板にトラックバックされてくる記事がスパムである場合、親記事についてのみならず、子記事についても、それらを有効に除去することができる。   Thus, when the articles tracked back on the bulletin board are spam, not only the parent articles but also the child articles can be effectively removed.

以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。   The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.

本発明の一実施形態にかかるメッセージ配信システムの構成例を示す図である。It is a figure which shows the structural example of the message delivery system concerning one Embodiment of this invention. メッセージ管理サーバの構成例を示す図である。It is a figure which shows the structural example of a message management server. メッセージ受付時の処理例を示すフローチャートである。It is a flowchart which shows the process example at the time of message reception. 掲示板システムの例を示す図である。It is a figure which shows the example of a bulletin board system. 本発明の他の実施形態にかかる掲示板システムの構成例を示す図である。It is a figure which shows the structural example of the bulletin board system concerning other embodiment of this invention. 保存データの構造例を示す図である。It is a figure which shows the example of a structure of preserve | saved data. 記事書き込み時の処理例を示すフローチャートである。It is a flowchart which shows the process example at the time of article writing. トラックバック受信時の処理例を示すフローチャートである。It is a flowchart which shows the process example at the time of trackback reception. トラックバックPINGに含まれるデータの例を示す図である。It is a figure which shows the example of the data contained in track back PING. HTMLデータに含まれるRDFデータの例を示す図である。It is a figure which shows the example of the RDF data contained in HTML data.

符号の説明Explanation of symbols

1 メッセージ管理サーバ
101 通信制御部
102 メッセージバッファ部
103 メッセージ転送部
104 メッセージ受付部
105 リンク抽出部
106 出現頻度リスティング部
107 リスティングテーブル
108 ブラックリスト照合部
109 ブラックリスト
110 出現頻度判定部
111 リンク先ページアクセス部
112 ページ解析部
113 禁止語照合部
114 禁止語リスト
115 メッセージ破棄部
10 掲示板サーバ
11 データ処理部
12 データ保存部
13 代理トラックバックURL発行部
14 トラックバックURL抽出部
15 トラックバックPING代理送信部
16 スパム除去部
2 ネットワーク
3、31、32 クライアント
41、42 ブログシステム
DESCRIPTION OF SYMBOLS 1 Message management server 101 Communication control part 102 Message buffer part 103 Message transfer part 104 Message reception part 105 Link extraction part 106 Appearance frequency listing part 107 Listing table 108 Blacklist collation part 109 Blacklist 110 Appearance frequency judgment part 111 Link destination page access Unit 112 page analysis unit 113 prohibited word collating unit 114 prohibited word list 115 message discarding unit 10 bulletin board server 11 data processing unit 12 data storage unit 13 proxy trackback URL issuing unit 14 trackback URL extracting unit 15 trackback PING proxy transmission unit 16 spam removing unit 2 Network 3, 31, 32 Client 41, 42 Blog system

Claims (7)

メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理方法であって、
受け付けたメッセージ内容からリンクを抽出する工程と、
上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する工程と、
ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する工程と、
出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する工程と、
上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する工程とを備えたことを特徴とするスパム除去方法。
A method of processing a transmission message in a message delivery service, an e-mail service, or an electronic bulletin board service,
Extracting a link from the received message content;
A step of determining whether or not a link destination is registered in a black list when a link is included in the message content;
A step of determining an appearance frequency of the link destination when the link destination is not registered in the black list;
When the appearance frequency is a predetermined value or more, analyzing the link destination page content and determining whether or not a word or phrase registered in the prohibited word list is included;
And a step of discarding a corresponding transmission message when a link destination is registered in the black list, and when a phrase registered in the prohibited word list is included in the page content of the link destination. Spam removal method characterized by this.
請求項1に記載のスパム除去方法において、
上記メッセージ内容にリンクが含まれていない場合、上記出現頻度が所定値以上でない場合、および、上記禁止語リストに登録された語句が含まれていない場合、対応する伝達メッセージを通常処理として配信、送信、もしくは、掲示する工程を備えたことを特徴とするスパム除去方法。
The spam removal method according to claim 1,
When the message content does not include a link, when the appearance frequency is not equal to or higher than a predetermined value, and when a word or phrase registered in the prohibited word list is not included, a corresponding transmission message is delivered as a normal process. A spam removal method comprising a step of transmitting or posting.
請求項1または2のいずれか一項に記載のスパム除去方法において、
上記禁止語リストに登録された語句が含まれているリンク先を、上記ブラックリストに追加登録する工程を備えたことを特徴とするスパム除去方法。
In the spam removal method according to any one of claims 1 and 2,
A spam removing method comprising a step of additionally registering a link destination including a phrase registered in the prohibited word list in the black list.
請求項1乃至3のいずれか一項に記載のスパム除去方法において、
上記メッセージ内容にリンクが含まれる場合、処理する複数の伝達メッセージにおける当該リンク先へのリンクの出現頻度をリスティングする工程を備えたことを特徴とするスパム除去方法。
In the spam removal method according to any one of claims 1 to 3,
A spam removal method comprising a step of listing the frequency of appearance of a link to a link destination in a plurality of transmission messages to be processed when a link is included in the message content.
請求項1乃至4のいずれか一項に記載のスパム除去方法において、
対象とするサービスは、表示対象となる全ての記事に対して代理トラックバックURLを発行し、記事の代理トラックバックURL宛のトラックバックPINGを受け付け、受け付けたトラックバックPINGに基づいて送信側ブログの記事を対応する親記事に関連付けて表示する電子掲示板サービスであり、
全ての記事に対してスパムであるか否かを判定することを特徴とするスパム除去方法。
In the spam removal method according to any one of claims 1 to 4,
The target service issues a proxy trackback URL for all articles to be displayed, accepts a trackback PING addressed to the proxy trackback URL of the article, and responds to an article on the transmitting blog based on the received trackback PING. An electronic bulletin board service that displays in association with the parent article,
A spam removal method characterized by determining whether or not all articles are spam.
メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理を行うサーバであって、
受け付けたメッセージ内容からリンクを抽出する手段と、
上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、
ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、
出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、
上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段とを備えたことを特徴とするサーバ。
A server for processing a transmission message in a message distribution service, an e-mail service, or an electronic bulletin board service,
Means for extracting links from the received message content;
Means for determining whether a link destination is registered in the blacklist when a link is included in the message content;
Means for determining the appearance frequency of the link destination when the link destination is not registered in the blacklist;
Means for analyzing whether or not the word registered in the prohibited word list is included by analyzing the contents of the linked page when the appearance frequency is a predetermined value or more;
Means for discarding a corresponding transmission message when a link destination is registered in the black list, and when a phrase registered in the prohibited word list is included in the page content of the link destination; A server characterized by
メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理を行うプログラムであって、
コンピュータを、
受け付けたメッセージ内容からリンクを抽出する手段と、
上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、
ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、
出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、
上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段として機能させることを特徴とするプログラム。
A program for processing a transmission message in a message delivery service, an e-mail service, or an electronic bulletin board service,
Computer
Means for extracting links from the received message content;
Means for determining whether a link destination is registered in the blacklist when a link is included in the message content;
Means for determining the appearance frequency of the link destination when the link destination is not registered in the blacklist;
Means for analyzing whether or not the word registered in the prohibited word list is included by analyzing the contents of the linked page when the appearance frequency is a predetermined value or more;
When the link destination is registered in the black list, and when the phrase registered in the prohibited word list is included in the page content of the link destination, it is made to function as a means for discarding the corresponding transmission message. A featured program.
JP2006094346A 2006-03-02 2006-03-30 Spam removal method Expired - Fee Related JP4500285B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006094346A JP4500285B2 (en) 2006-03-02 2006-03-30 Spam removal method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006056756 2006-03-02
JP2006094346A JP4500285B2 (en) 2006-03-02 2006-03-30 Spam removal method

Publications (2)

Publication Number Publication Date
JP2007265368A true JP2007265368A (en) 2007-10-11
JP4500285B2 JP4500285B2 (en) 2010-07-14

Family

ID=38638248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006094346A Expired - Fee Related JP4500285B2 (en) 2006-03-02 2006-03-30 Spam removal method

Country Status (1)

Country Link
JP (1) JP4500285B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157510A (en) * 2007-12-25 2009-07-16 Nec Corp System, method and program for identifying spam information
JP2009237949A (en) * 2008-03-27 2009-10-15 Nomura Research Institute Ltd Communication repeater, web terminal, mail server device, e-mail terminal and site check program
JP2009289245A (en) * 2008-05-27 2009-12-10 Yahoo Japan Corp Message determining device, method and program
JP2009289246A (en) * 2008-05-27 2009-12-10 Yahoo Japan Corp Message determining apparatus, method and program
JP2014109794A (en) * 2012-11-30 2014-06-12 Ntt Docomo Inc Spam account extraction device and spam account extraction method
JP2018190374A (en) * 2017-05-08 2018-11-29 デジタルア−ツ株式会社 Information processing device, information processing system, program, storage medium, and information processing method
JP2023510833A (en) * 2020-01-20 2023-03-15 北京字節跳動網絡技術有限公司 Message processing method, device and electronic equipment

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004010662A1 (en) * 2002-07-22 2004-01-29 Fujitsu Limited Electronic mail server, electronic mail delivery relaying method, and computer program
JP2004038498A (en) * 2002-07-02 2004-02-05 Kenwood Corp Information processing terminal, e-mail system, e-mail processing method and program
JP2005135328A (en) * 2003-10-31 2005-05-26 Nec Corp E-mail server, e-mail management method, and e-mail management program
JP2005250826A (en) * 2004-03-04 2005-09-15 Nec Corp Information provision system, information provision method and information provision processing program
JP2005284454A (en) * 2004-03-29 2005-10-13 Tatsuya Koshi Junk e-mail distribution preventive system, and information terminal and e-mail server in the system
JP2006331348A (en) * 2005-05-30 2006-12-07 Nippon Telegr & Teleph Corp <Ntt> Method, apparatus, program for collecting comment trackback of trackback source

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004038498A (en) * 2002-07-02 2004-02-05 Kenwood Corp Information processing terminal, e-mail system, e-mail processing method and program
WO2004010662A1 (en) * 2002-07-22 2004-01-29 Fujitsu Limited Electronic mail server, electronic mail delivery relaying method, and computer program
JP2005135328A (en) * 2003-10-31 2005-05-26 Nec Corp E-mail server, e-mail management method, and e-mail management program
JP2005250826A (en) * 2004-03-04 2005-09-15 Nec Corp Information provision system, information provision method and information provision processing program
JP2005284454A (en) * 2004-03-29 2005-10-13 Tatsuya Koshi Junk e-mail distribution preventive system, and information terminal and e-mail server in the system
JP2006331348A (en) * 2005-05-30 2006-12-07 Nippon Telegr & Teleph Corp <Ntt> Method, apparatus, program for collecting comment trackback of trackback source

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157510A (en) * 2007-12-25 2009-07-16 Nec Corp System, method and program for identifying spam information
JP2009237949A (en) * 2008-03-27 2009-10-15 Nomura Research Institute Ltd Communication repeater, web terminal, mail server device, e-mail terminal and site check program
JP2009289245A (en) * 2008-05-27 2009-12-10 Yahoo Japan Corp Message determining device, method and program
JP2009289246A (en) * 2008-05-27 2009-12-10 Yahoo Japan Corp Message determining apparatus, method and program
JP2014109794A (en) * 2012-11-30 2014-06-12 Ntt Docomo Inc Spam account extraction device and spam account extraction method
JP2018190374A (en) * 2017-05-08 2018-11-29 デジタルア−ツ株式会社 Information processing device, information processing system, program, storage medium, and information processing method
JP2023510833A (en) * 2020-01-20 2023-03-15 北京字節跳動網絡技術有限公司 Message processing method, device and electronic equipment
US11936605B2 (en) 2020-01-20 2024-03-19 Beijing Bytedance Network Technology Co., Ltd. Message processing method, apparatus and electronic device
JP7467644B2 (en) 2020-01-20 2024-04-15 北京字節跳動網絡技術有限公司 Message processing method, device and electronic device

Also Published As

Publication number Publication date
JP4500285B2 (en) 2010-07-14

Similar Documents

Publication Publication Date Title
US10904186B1 (en) Email processing for enhanced email privacy and security
US11595353B2 (en) Identity-based messaging security
US8584233B1 (en) Providing malware-free web content to end users using dynamic templates
JP4250300B2 (en) Computer-readable recording medium having recorded thereon a program for preventing transmission or reception of an undesirable electronic message
US8090782B2 (en) Electronic messaging system and method
US7359941B2 (en) Method and apparatus for filtering spam email
US7882189B2 (en) Using distinguishing properties to classify messages
US8095602B1 (en) Spam whitelisting for recent sites
JP4500285B2 (en) Spam removal method
US8321512B2 (en) Method and software product for identifying unsolicited emails
KR100628623B1 (en) Spam mail filtering system and method capable of recognizing and filtering spam mail in real time
US8122025B2 (en) Method of managing locations of information and information location management device
US20080177848A1 (en) System and method of sharing and dissemination of electronic information
JP3929464B2 (en) E-mail server, e-mail delivery relay method, and computer program
US20060264204A1 (en) Method for sending a message waiting indication
US9232018B2 (en) System and method of creating and rating items for social interactions
US20100161748A1 (en) Apparatus, a Method, a Program and a System for Processing an E-Mail
JPH11252158A (en) Electronic mail information management method and device and storage medium recording electronic mail information management processing program
JP2004240945A (en) Automatic shutoff method of spam mail through dynamic url connection
JP4704413B2 (en) Transmission content monitoring device
JP2007115173A (en) Server system, its control method, and control program
JP2004523046A (en) System for transmitting message to target and method of operating the same
JP4364899B2 (en) E-mail server, e-mail delivery relay method, and computer program
JP2005284955A (en) Electronic mail transmitting/receiving system
JP2000227900A (en) Device and method for supporting information communication and computer-readable recording medium where information communication supporting program is recored

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100416

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4500285

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees