JP2007265368A - Spam eliminating method - Google Patents
Spam eliminating method Download PDFInfo
- Publication number
- JP2007265368A JP2007265368A JP2006094346A JP2006094346A JP2007265368A JP 2007265368 A JP2007265368 A JP 2007265368A JP 2006094346 A JP2006094346 A JP 2006094346A JP 2006094346 A JP2006094346 A JP 2006094346A JP 2007265368 A JP2007265368 A JP 2007265368A
- Authority
- JP
- Japan
- Prior art keywords
- registered
- message
- link destination
- link
- spam
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、不正なリンクを含むスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等を除去するスパム除去方法に関する。 The present invention relates to a spam removal method that removes spam messages, spam mails, spam posts, spam trackbacks, and the like that contain illegal links.
インターネットを利用したメッセージ配信サービス(メッセンジャーと呼ばれるアプリケーションにより特定の相手にリアルタイムにメッセージを配信するサービス)、電子メールサービス、電子掲示板サービス等が提供されており、ユーザの利用度は高い。 A message delivery service using the Internet (a service for delivering a message to a specific party in real time by an application called a messenger), an e-mail service, an electronic bulletin board service, and the like are provided, and the user's usage is high.
ところで、相手の会員ID、メールアドレス、掲示板ID、トラックバックURL(Uniform Resource Locator)等を何らかの方法で入手し、あるいは英数字等を適当に組み合わせることで自動生成し、アダルトサイトや有害ブログ(ブログ:Web Logの簡略呼称であり、日記風サイトのこと)等へのURLによるリンクを含めた、いわゆるスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等がサーバに大量に送りつけられることが問題となっている。なお、トラックバックとは、他のブログの記事との関連付けを行う機能であり、トラックバック機能を持つシステムは、トラックバックを受け付ける記事に対してトラックバックURLを発行しており、その記事(親記事)を参考に自分のブログで記事(子記事)を書いた場合、親記事のトラックバックURLに対してトラックバックPINGを送信することで、親記事側のシステムにおいて親記事と関連付けられた状態で子記事の要約やURLリンク等が掲載されるものである。 By the way, the other party's member ID, e-mail address, bulletin board ID, trackback URL (Uniform Resource Locator), etc. are obtained by some method, or automatically generated by appropriately combining alphanumeric characters, etc., and adult sites and harmful blogs (blog: It is a simple name for Web Log, and it is a problem that so-called spam messages, spam mails, spam posts, spam trackbacks, etc. including URL links to diary-like sites) are sent to the server in large quantities. ing. Trackback is a function that associates with other blog articles. A system with a trackback function issues a trackback URL for an article that accepts a trackback, and refers to that article (parent article). If you write an article (child article) on your blog, you can send a trackback PING to the trackback URL of the parent article, so that you can A URL link or the like is posted.
従来、このような場合に対処すべく、例えばメッセージ配信サーバにおいては、メッセージに含まれるリンク先をリアルタイムに集計し、その頻度が極端に高いものをスパムメッセージとして自動的に破棄するようにしていた。 Conventionally, in order to deal with such a case, for example, in a message distribution server, link destinations included in a message are totaled in real time, and an extremely high frequency is automatically discarded as a spam message. .
一方、特許文献1には、電子メールシステムにおいて、SPAM判定ワードを含むメールおよび所定の流量を超える同一送信元IP(Internet Protocol)アドレスのメールを迷惑メールと判定し、配信を拒否するようにした技術が開示されている。
上述したように、従来のメッセージ配信サーバにおける、メッセージに含まれるリンクの頻度が極端に高いものをスパムメッセージとして自動的に破棄する手法では、頻度が高いだけで破棄されることから、多人数を対象とした正常なメッセージであっても破棄されてしまうこととなり、伝えたい相手にメッセージが届かず、サービス性が低下するという問題があった。 As described above, in the conventional message delivery server, the method of automatically discarding a message with extremely high frequency of links included in a message as a spam message is discarded only with high frequency. Even if the target normal message is discarded, the message is not delivered to the other party who wants to convey it, and there is a problem that the serviceability deteriorates.
一方、特許文献1に記載される技術では、所定の流量(上述した頻度に相当)を超える同一送信元IPアドレスのメールを迷惑メールと判定している点では、上述したものと同様の問題を有している。また、SPAM判定ワードを含むメールを迷惑メールと判定する点が追加されているが、一般にアダルトサイト等へのリンクを含めたメール等は文字数も少ないとともに、意図的に言葉を選んでいる可能性も高く、SPAM判定ワードに該当する確率もそれほど高くはない。
On the other hand, the technique described in
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、不正なリンクを含むスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等を有効に除去することのできるスパム除去方法を提供することにある。 The present invention has been proposed in view of the above-described conventional problems, and the object of the present invention is to effectively remove spam messages, spam mails, spam posts, spam trackbacks, and the like containing illegal links. It is to provide a spam removal method.
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理方法であって、受け付けたメッセージ内容からリンクを抽出する工程と、上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する工程と、ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する工程と、出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する工程と、上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する工程とを備えるスパム除去方法を要旨としている。
In order to solve the above problems, according to the present invention, there is provided a processing method for a transmission message in a message distribution service, an e-mail service, an electronic bulletin board service, or the like, as described in
また、請求項2に記載されるように、請求項1に記載のスパム除去方法において、上記メッセージ内容にリンクが含まれていない場合、上記出現頻度が所定値以上でない場合、および、上記禁止語リストに登録された語句が含まれていない場合、対応する伝達メッセージを通常処理として配信、送信、もしくは、掲示する工程を備えるようにすることができる。
Further, as described in
また、請求項3に記載されるように、請求項1または2のいずれか一項に記載のスパム除去方法において、上記禁止語リストに登録された語句が含まれているリンク先を、上記ブラックリストに追加登録する工程を備えるようにすることができる。
Further, as described in
また、請求項4に記載されるように、請求項1乃至3のいずれか一項に記載のスパム除去方法において、上記メッセージ内容にリンクが含まれる場合、処理する複数の伝達メッセージにおける当該リンク先へのリンクの出現頻度をリスティングする工程を備えるようにすることができる。
Further, as described in
また、請求項5に記載されるように、請求項1乃至4のいずれか一項に記載のスパム除去方法において、対象とするサービスは、表示対象となる全ての記事に対して代理トラックバックURLを発行し、記事の代理トラックバックURL宛のトラックバックPINGを受け付け、受け付けたトラックバックPINGに基づいて送信側ブログの記事を対応する親記事に関連付けて表示する電子掲示板サービスであり、全ての記事に対してスパムであるか否かを判定するようにすることができる。
Further, as described in claim 5, in the spam removal method according to any one of
また、請求項6に記載されるように、メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理を行うサーバであって、受け付けたメッセージ内容からリンクを抽出する手段と、上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段とを備えたサーバとして構成することができる。
Further, as described in
また、請求項7に記載されるように、メッセージ配信サービス、電子メールサービス、もしくは、電子掲示板サービス等における伝達メッセージの処理を行うプログラムであって、コンピュータを、受け付けたメッセージ内容からリンクを抽出する手段と、上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段として機能させるプログラムとして構成することができる。 According to a seventh aspect of the present invention, there is provided a program for processing a transmission message in a message distribution service, an e-mail service, an electronic bulletin board service or the like, and the computer extracts a link from the received message content. Means, if the message content contains a link, means for determining whether the link destination is registered in the black list, and if the link destination is not registered in the black list, the link Means for determining the appearance frequency of the destination, and means for determining whether or not the word registered in the prohibited word list is included by analyzing the page contents of the link destination when the appearance frequency is equal to or higher than a predetermined value. When the link destination is registered in the black list, and the phrase registered in the prohibited word list is the link destination If included in the page content may be configured as a program to function as a means for discarding the corresponding transmission message.
本発明のスパム除去方法にあっては、不正なリンクを含むスパムメッセージ、スパムメール、スパム投稿、スパムトラックバック等を有効に除去することができる。 According to the spam removal method of the present invention, it is possible to effectively remove spam messages, spam mails, spam posts, spam trackbacks, and the like including illegal links.
以下、本発明の好適な実施形態につき説明する。 Hereinafter, preferred embodiments of the present invention will be described.
図1は本発明の一実施形態にかかるメッセージ配信システムの構成例を示す図である。なお、メッセージ配信サービスを例として説明するが、電子メールサービスや電子掲示板サービス等においても同様に適用が可能である。 FIG. 1 is a diagram showing a configuration example of a message delivery system according to an embodiment of the present invention. Although the message distribution service will be described as an example, the present invention can be similarly applied to an electronic mail service, an electronic bulletin board service, and the like.
図1において、メッセージ配信システムは、インターネット等のネットワーク2に接続されたメッセージ管理サーバ1と、ネットワーク2に有線もしくは無線によりアクセス可能なPC(Personal Computer)、PDA(Personal Digital Assistant)、携帯電話等の複数のクライアント3を含んでいる。あるクライアント3から相手の会員ID等を指定してメッセージを送信すると、メッセージ管理サーバ1を経由して相手先のクライアント3にメッセージが配信される。
In FIG. 1, a message distribution system includes a
図2はメッセージ管理サーバ1の構成例を示す図である。
FIG. 2 is a diagram illustrating a configuration example of the
図2において、メッセージ管理サーバ1は、ネットワーク2との通信を制御する通信制御部101と、この通信制御部101で受信したメッセージを一時的に蓄積するメッセージバッファ部102と、所定の条件下でメッセージバッファ部102に蓄積されたメッセージを相手先に転送するメッセージ転送部103とを備えている。
In FIG. 2, the
また、メッセージ管理サーバ1は、メッセージバッファ部102に蓄積されたメッセージを1件単位に受け付けるメッセージ受付部104と、このメッセージ受付部104で受け付けたメッセージの本文からURL等のリンク先の情報を抽出するリンク抽出部105と、リンク抽出部105で抽出されたリンク先の出現頻度をリスティングテーブル107に登録してリスティング(出現頻度の高い順に管理)する出現頻度リスティング部106とを備えている。リスティングテーブル107は、リンク先の情報と出現回数とを一対として、複数のリンク先についての情報が格納されている。
The
また、メッセージ管理サーバ1は、リンク抽出部105で抽出されたリンク先がブラックリスト109に登録されているか照合するブラックリスト照合部108と、このブラックリスト照合部108においてブラックリスト109に登録されていなかったリンク先につき出現頻度リスティング部106から出現頻度を取得して所定値を超えるか否か判断する出現頻度判定部110とを備えている。なお、ブラックリスト109には、過去のスパムメッセージ等から抽出したリンク先の情報が複数登録されている。
Further, the
また、メッセージ管理サーバ1は、出現頻度判定部110において出現頻度が所定値を超えるリンク先に対してページリクエストを行うことでページアクセスを行うリンク先ページアクセス部111と、アクセスしたページのHTML(Hyper Text Markup Language)等で記述された内容を解析して語句を抽出するページ解析部112と、このページ解析部112において抽出された語句が禁止語リスト114に登録されているか照合する禁止語照合部113と、所定の条件下でメッセージバッファ部102に蓄積されたメッセージを破棄するメッセージ破棄部115とを備えている。なお、禁止語リスト114には、アダルトサイト等で使用される可能性の高い猥褻な語句等が複数登録されている。
The
図3は上記のメッセージ管理サーバ1におけるメッセージ受付時の処理例を示すフローチャートである。
FIG. 3 is a flowchart showing a processing example when receiving a message in the
図3において、メッセージ受付部104がメッセージを受け付けると(ステップS1)、リンク抽出部105はそのメッセージの本文からリンク先を抽出する(ステップS2)。そして、メッセージがリンクを含んでいるか否か判断し(ステップS3)、メッセージがリンクを含まない場合(ステップS3のNo)、メッセージ転送部103は通常処理としてメッセージバッファ部102に格納された対象メッセージを通信制御部101を介して転送し(ステップS4)、処理を終了する(ステップS16)。
In FIG. 3, when the
また、メッセージがリンクを含んでいる場合(ステップS3のYes)、リンク抽出部105は出現頻度リスティング部106にリスティング対象とすべく登録を行い(ステップS5)、出現頻度リスティング部106はリスティングテーブル107の更新を行う。すなわち、出現頻度リスティング部106は、初めてのリンク先については出現回数1回としてリスティングテーブル107の最下位にリンク先を登録し、複数回目の場合は該当するリンク先の出現回数をインクリメントし、出現回数に応じて出現頻度を把握する。
If the message includes a link (Yes in step S3), the
次いで、ブラックリスト照合部108はそのリンク先をブラックリスト109と照合し(ステップS6)、ブラックリスト109に登録されているか否か判断する(ステップS7)。ここで、ブラックリスト109に登録されている場合(ステップS7のYes)、メッセージ破棄部115によりメッセージバッファ部102に蓄積された対象メッセージを破棄し(ステップS15)、処理を終了する(ステップS16)。
Next, the
また、ブラックリスト109に登録されていない場合(ステップS7のNo)、出現頻度判定部110は出現頻度リスティング部106から対象リンク先の出現頻度を参照し(ステップS8)、上位所定順位内であるか否か判断する(ステップS9)。ここで、上位所定順位内でない場合(ステップS9のNo)、メッセージ転送部103は通常処理としてメッセージバッファ部102に格納された対象メッセージを通信制御部101を介して転送し(ステップS4)、処理を終了する(ステップS16)。
If not registered in the black list 109 (No in step S7), the appearance
また、上位所定順位内に入っている場合(ステップS9のYes)、リンク先ページアクセス部111はリンク先に対してページリクエストを行うことでページアクセスを行い(ステップS10)、ページ解析部112はアクセスしたページの内容を解析して語句を抽出する(ステップS11)。
In addition, when it is within the upper predetermined order (Yes in Step S9), the link destination
次いで、禁止語照合部113は抽出した語句を禁止語リスト114と照合し(ステップS12)、禁止語リスト114に登録されているか否か判断する(ステップS13)。ここで、禁止語リスト114に登録されていない場合(ステップS13のNo)、メッセージ転送部103は通常処理としてメッセージバッファ部102に格納された対象メッセージを通信制御部101を介して転送し(ステップS4)、処理を終了する(ステップS16)。
Next, the prohibited
また、禁止語リスト114に登録されている場合(ステップS13のYes)、禁止語照合部113はその語句を含んでいたリンク先をブラックリスト109に登録するとともに(ステップS14)、メッセージ破棄部115によりメッセージバッファ部102に蓄積された対象メッセージを破棄し(ステップS15)、処理を終了する(ステップS16)。
When the prohibited
このように、受け付けたメッセージに対し、リンクの有無、ブラックリスト該当の有無、リンク先の出現頻度、禁止語該当の有無により、メッセージを転送するか破棄するかを制御しているため、多人数を対象とした正常なメッセージを不当に破棄してしまうことがなく、スパムメッセージ等を有効に除去することができる。 In this way, because the received message controls whether to forward or discard the message depending on the presence or absence of a link, the presence or absence of a blacklist, the appearance frequency of a link destination, the presence or absence of a prohibited word, a large number of people It is possible to effectively remove a spam message and the like without unjustly discarding a normal message targeted at.
次に、本発明を掲示板システムに適用した実施形態について説明する。 Next, an embodiment in which the present invention is applied to a bulletin board system will be described.
図4は掲示板システムの例を示す図であり、掲示板サーバ10において、主テーマのトラックバックURL(代理トラックバックURL)にトラックバックPINGを送信したブログ記事A、Cが主テーマの子記事として表示され、ブログ記事AのトラックバックURLにトラックバックPINGを送信したブログ記事Bがブログ記事Aの子記事(主テーマの孫記事)として表示され、ブログ記事CのトラックバックURLにトラックバックPINGを送信したブログ記事D、Eがブログ記事Cの子記事(主テーマの孫記事)として表示され、ブログ記事EのトラックバックURLにトラックバックPINGを送信したブログ記事Fがブログ記事Eの子記事(主テーマの曾孫記事)として表示された状態を示している。親記事のみではなく、全ての記事に対して代理トラックバックURLを発行し、トラックバックPINGを受け付けた記事をその記事の子記事として階層的に表示するようにしており、親記事、子記事、孫記事・・・と複数の世代のトラックバック受信表示が可能で、一つの主テーマから発展した記事の連続性・一体性を損なうことなく表示を行うことができるようになっている。
FIG. 4 is a diagram showing an example of the bulletin board system. In the
図5は掲示板システムの構成例を示す図であり、掲示板サーバ10はインターネット等のネットワーク2に接続され、ネットワーク2にはPC等のクライアント31、32・・と、他のブログシステム41、42・・とが接続される。
FIG. 5 is a diagram showing a configuration example of the bulletin board system. The
掲示板サーバ10は、掲示板への書き込みデータの受け付け、トラックバックPINGの受け付け、掲示板表示データの出力、データ保存部12とのデータ入出力等を行うデータ処理部11と、掲示板への書き込みデータ等の保存を行うデータ保存部12と、掲示板上の記事に対して代理トラックバックURLを発行する代理トラックバックURL発行部13と、掲示板上の記事に対してトラックバックPINGを送信してきた元記事のブログシステムにアクセスし、その元記事のトラックバックURLを抽出するトラックバックURL抽出部14と、トラックバックにより掲示板上に掲載された他のブログの記事に対してトラックバックPINGを受け付けた場合に、保存してある元記事のトラックバックURLに対してトラックバックPINGを送信するトラックバックPING代理送信部15と、掲示板サーバ10に対してクライアント31、32等により書き込まれた記事もしくはブログシステム41、42等によりトラックバックされてきた元記事についてスパムであるか否か判定し、スパムである場合にその除去を行うスパム除去部16とを備えている。
The
スパム除去部16の内部構成としては、前述した図2のメッセージ受付部104、リンク抽出部105、出現頻度リスティング部106、リスティングテーブル107、ブラックリスト照合部108、ブラックリスト109、出現頻度判定部110、リンク先ページアクセス部111、ページ解析部112、禁止語照合部113、禁止語リスト114、メッセージ破棄部115の部分と同じである。なお、図5におけるデータ保存部12は図2のメッセージバッファ部102に相当し、図5におけるデータ処理部11は図2の通信制御部101およびメッセージ転送部103に相当する(掲示板システムであるため、メッセージの転送は行わず、メッセージ(記事)の表示を行う点が異なる)。
The internal configuration of the
図6は掲示板サーバ10のデータ保存部12に記録される保存データの構造例を示す図である。保存データとしては、掲示板サーバ10内の記事を識別する「記事ID」フィールドと、当該記事に親記事が存在する場合に親記事を識別する「親記事ID」フィールドと、書き込み記事もしくはブログ記事の要約が記録される「記事データ」フィールドと、当該記事が他のブログシステムからトラックバックされた場合における元記事のトラックバックURLが記録される「トラックバックURL」フィールドと、当該記事に対して発行された代理トラックバックURLが記録される「代理トラックバックURL」フィールドとが設けられている。
FIG. 6 is a diagram showing an example of the structure of stored data recorded in the
図7は掲示板サーバ10における記事書き込み時の処理例を示すフローチャートである。
FIG. 7 is a flowchart showing an example of processing at the time of article writing in the
図7において、データ処理部11はクライアント(31、32等)から記事データを受信すると(ステップS101)、データ保存部12に記事データを保存する(ステップS102)。具体的には、図6のデータ構造において、ユニークな記事IDを付して記事データを保存する。また、特定の親記事についての子記事として書き込まれた場合は、親記事と関連付けてデータ保存部12に保存する。具体的には、図6のデータ構造において、親記事の記事IDを「親記事ID」フィールドに設定することで親記事との関連付けを行う。
In FIG. 7, when the
図7に戻り、スパム除去部16は書き込まれた記事についてスパムであるか否か判定し(ステップS103)、スパムであると判定した場合(ステップS104のYes)はデータ保存部12から記事データの破棄を行い(ステップS105)、処理を終了する。スパムであるか否かの判定は図3に示した処理(ステップS2、S3、S5〜S14)と同様である。
Returning to FIG. 7, the
図7に戻り、スパムでないと判定した場合(ステップS104のNo)、代理トラックバックURL発行部13は書き込まれた記事に対して代理トラックバックURLを発行し(ステップS106)、その代理トラックバックURLを記事データと関連付けてデータ保存部12に保存する(ステップS107)。具体的には、図6のデータ構造において、発行された代理トラックバックURLを該当するレコードの「代理トラックバックURL」フィールドに設定する。
Returning to FIG. 7, when it is determined that it is not spam (No in step S104), the proxy trackback
図7に戻り、データ処理部11はデータ保存部12のデータに従い、最新状態の記事を階層的に表示する(ステップS108)。
Returning to FIG. 7, the
このように、掲示板に書き込まれる記事がスパムである場合、それを有効に除去することができる。 Thus, if an article written on the bulletin board is spam, it can be effectively removed.
図8は掲示板サーバ10におけるトラックバック受信時の処理例を示すフローチャートである。
FIG. 8 is a flowchart showing an example of processing at the time of trackback reception in the
図8において、データ処理部11はブログシステム(41、42等)からトラックバックPINGを受信すると(ステップS201)、親記事と関連付けて記事データをデータ保存部12に保存する(ステップS202)。図9はトラックバックPINGに含まれるデータの例を示す図であり、Title(ブログ記事のタイトル)、Excerpt(ブログ記事の要約)、url(ブログ記事のpermalink)、blog_name(ブログの名前)を含んでおり、これらを図6のデータ構造の「記事データ」フィールドに記録する。なお、permalinkとは記事内容を更新しても変化しないURI(Uniform
Resource Indicator)であり、一つの記事に一つのURIが存在する。
In FIG. 8, when the
Resource Indicator), and one URI exists in one article.
図8に戻り、スパム除去部16は書き込まれた記事についてスパムであるか否か判定し(ステップS203)、スパムであると判定した場合(ステップS204のYes)はデータ保存部12から記事データの破棄を行い(ステップS205)、処理を終了する。スパムであるか否かの判定は図3に示した処理(ステップS2、S3、S5〜S14)と同様である。なお、メッセージ(記事)に含まれるリンクとしては、トラックバックしてきた元記事へのURLリンクと、記事の要約中に含まれるURLリンクとがある。
Returning to FIG. 8, the
図8に戻り、スパムでないと判定した場合(ステップS204のNo)、トラックバックURL抽出部14はトラックバックPINGを送信してきたブログシステムにアクセスし、元記事のトラックバックURLを抽出する(ステップS206)。すなわち、図9に示したurlにアクセスすることで図10に示すような元記事のHTMLデータを取得し、その中に記述されるRDF(Resource
Description Framework)データから要素型名「trackback:ping」に記述されるトラックバックURL(この例では「http://xxxx.jp/yyyyyy/tb/1234567890」)を抽出する。
Returning to FIG. 8, when it is determined that the message is not spam (No in step S204), the trackback
Description Framework) A trackback URL (“http://xxxx.jp/yyyyyy/tb/1234567890” in this example) described in the element type name “trackback: ping” is extracted from the data.
図8に戻り、代理トラックバックURL発行部13はトラックバックしてきた記事に対して代理トラックバックURLを発行し(ステップS207)、既に抽出した元記事のトラックバックURLと発行した代理トラックバックURLを記事データと関連付けてデータ保存部12に保存する(ステップS208)。具体的には、図6のデータ構造において、元記事のトラックバックURLを該当するレコードの「トラックバックURL」フィールドに設定し、発行された代理トラックバックURLを「代理トラックバックURL」フィールドに設定する。
Returning to FIG. 8, the proxy trackback
図8に戻り、トラックバックの対象となる親記事がブログ記事である場合(ステップS209のYes)、トラックバックPING代理送信部15はデータ保存部12に保存されている元記事のトラックバックURLに対してトラックバックPINGを送信する(ステップS210)。これは、掲示板サーバ10上のトラックバックにより掲載されたブログ記事に対してあるユーザがトラックバックPINGを送信した場合、本来のブログ記事のあるブログシステムにも当該ユーザはトラックバックPINGを送信すべきところ、重ねてトラックバックPINGを送信するのは面倒であるため、それを掲示板サーバ10において自動的に代行するものである。
Returning to FIG. 8, when the parent article to be tracked back is a blog article (Yes in step S209), the trackback PING
そして、データ処理部11はデータ保存部12のデータに従い、最新状態の記事を階層的に表示する(ステップS211)。
Then, the
このように、掲示板にトラックバックされてくる記事がスパムである場合、親記事についてのみならず、子記事についても、それらを有効に除去することができる。 Thus, when the articles tracked back on the bulletin board are spam, not only the parent articles but also the child articles can be effectively removed.
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。 The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.
1 メッセージ管理サーバ
101 通信制御部
102 メッセージバッファ部
103 メッセージ転送部
104 メッセージ受付部
105 リンク抽出部
106 出現頻度リスティング部
107 リスティングテーブル
108 ブラックリスト照合部
109 ブラックリスト
110 出現頻度判定部
111 リンク先ページアクセス部
112 ページ解析部
113 禁止語照合部
114 禁止語リスト
115 メッセージ破棄部
10 掲示板サーバ
11 データ処理部
12 データ保存部
13 代理トラックバックURL発行部
14 トラックバックURL抽出部
15 トラックバックPING代理送信部
16 スパム除去部
2 ネットワーク
3、31、32 クライアント
41、42 ブログシステム
DESCRIPTION OF
Claims (7)
受け付けたメッセージ内容からリンクを抽出する工程と、
上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する工程と、
ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する工程と、
出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する工程と、
上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する工程とを備えたことを特徴とするスパム除去方法。 A method of processing a transmission message in a message delivery service, an e-mail service, or an electronic bulletin board service,
Extracting a link from the received message content;
A step of determining whether or not a link destination is registered in a black list when a link is included in the message content;
A step of determining an appearance frequency of the link destination when the link destination is not registered in the black list;
When the appearance frequency is a predetermined value or more, analyzing the link destination page content and determining whether or not a word or phrase registered in the prohibited word list is included;
And a step of discarding a corresponding transmission message when a link destination is registered in the black list, and when a phrase registered in the prohibited word list is included in the page content of the link destination. Spam removal method characterized by this.
上記メッセージ内容にリンクが含まれていない場合、上記出現頻度が所定値以上でない場合、および、上記禁止語リストに登録された語句が含まれていない場合、対応する伝達メッセージを通常処理として配信、送信、もしくは、掲示する工程を備えたことを特徴とするスパム除去方法。 The spam removal method according to claim 1,
When the message content does not include a link, when the appearance frequency is not equal to or higher than a predetermined value, and when a word or phrase registered in the prohibited word list is not included, a corresponding transmission message is delivered as a normal process. A spam removal method comprising a step of transmitting or posting.
上記禁止語リストに登録された語句が含まれているリンク先を、上記ブラックリストに追加登録する工程を備えたことを特徴とするスパム除去方法。 In the spam removal method according to any one of claims 1 and 2,
A spam removing method comprising a step of additionally registering a link destination including a phrase registered in the prohibited word list in the black list.
上記メッセージ内容にリンクが含まれる場合、処理する複数の伝達メッセージにおける当該リンク先へのリンクの出現頻度をリスティングする工程を備えたことを特徴とするスパム除去方法。 In the spam removal method according to any one of claims 1 to 3,
A spam removal method comprising a step of listing the frequency of appearance of a link to a link destination in a plurality of transmission messages to be processed when a link is included in the message content.
対象とするサービスは、表示対象となる全ての記事に対して代理トラックバックURLを発行し、記事の代理トラックバックURL宛のトラックバックPINGを受け付け、受け付けたトラックバックPINGに基づいて送信側ブログの記事を対応する親記事に関連付けて表示する電子掲示板サービスであり、
全ての記事に対してスパムであるか否かを判定することを特徴とするスパム除去方法。 In the spam removal method according to any one of claims 1 to 4,
The target service issues a proxy trackback URL for all articles to be displayed, accepts a trackback PING addressed to the proxy trackback URL of the article, and responds to an article on the transmitting blog based on the received trackback PING. An electronic bulletin board service that displays in association with the parent article,
A spam removal method characterized by determining whether or not all articles are spam.
受け付けたメッセージ内容からリンクを抽出する手段と、
上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、
ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、
出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、
上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段とを備えたことを特徴とするサーバ。 A server for processing a transmission message in a message distribution service, an e-mail service, or an electronic bulletin board service,
Means for extracting links from the received message content;
Means for determining whether a link destination is registered in the blacklist when a link is included in the message content;
Means for determining the appearance frequency of the link destination when the link destination is not registered in the blacklist;
Means for analyzing whether or not the word registered in the prohibited word list is included by analyzing the contents of the linked page when the appearance frequency is a predetermined value or more;
Means for discarding a corresponding transmission message when a link destination is registered in the black list, and when a phrase registered in the prohibited word list is included in the page content of the link destination; A server characterized by
コンピュータを、
受け付けたメッセージ内容からリンクを抽出する手段と、
上記メッセージ内容にリンクが含まれる場合に、ブラックリストに登録されているリンク先であるか否かを判定する手段と、
ブラックリストに登録されていないリンク先である場合に、当該リンク先の出現頻度を判定する手段と、
出現頻度が所定値以上である場合に、リンク先のページ内容を解析して禁止語リストに登録された語句が含まれているか否かを判定する手段と、
上記ブラックリストにリンク先が登録されている場合、および、上記禁止語リストに登録された語句がリンク先のページ内容に含まれている場合、対応する伝達メッセージを破棄する手段として機能させることを特徴とするプログラム。
A program for processing a transmission message in a message delivery service, an e-mail service, or an electronic bulletin board service,
Computer
Means for extracting links from the received message content;
Means for determining whether a link destination is registered in the blacklist when a link is included in the message content;
Means for determining the appearance frequency of the link destination when the link destination is not registered in the blacklist;
Means for analyzing whether or not the word registered in the prohibited word list is included by analyzing the contents of the linked page when the appearance frequency is a predetermined value or more;
When the link destination is registered in the black list, and when the phrase registered in the prohibited word list is included in the page content of the link destination, it is made to function as a means for discarding the corresponding transmission message. A featured program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006094346A JP4500285B2 (en) | 2006-03-02 | 2006-03-30 | Spam removal method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006056756 | 2006-03-02 | ||
JP2006094346A JP4500285B2 (en) | 2006-03-02 | 2006-03-30 | Spam removal method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007265368A true JP2007265368A (en) | 2007-10-11 |
JP4500285B2 JP4500285B2 (en) | 2010-07-14 |
Family
ID=38638248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006094346A Expired - Fee Related JP4500285B2 (en) | 2006-03-02 | 2006-03-30 | Spam removal method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4500285B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009157510A (en) * | 2007-12-25 | 2009-07-16 | Nec Corp | System, method and program for identifying spam information |
JP2009237949A (en) * | 2008-03-27 | 2009-10-15 | Nomura Research Institute Ltd | Communication repeater, web terminal, mail server device, e-mail terminal and site check program |
JP2009289245A (en) * | 2008-05-27 | 2009-12-10 | Yahoo Japan Corp | Message determining device, method and program |
JP2009289246A (en) * | 2008-05-27 | 2009-12-10 | Yahoo Japan Corp | Message determining apparatus, method and program |
JP2014109794A (en) * | 2012-11-30 | 2014-06-12 | Ntt Docomo Inc | Spam account extraction device and spam account extraction method |
JP2018190374A (en) * | 2017-05-08 | 2018-11-29 | デジタルア−ツ株式会社 | Information processing device, information processing system, program, storage medium, and information processing method |
JP2023510833A (en) * | 2020-01-20 | 2023-03-15 | 北京字節跳動網絡技術有限公司 | Message processing method, device and electronic equipment |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004010662A1 (en) * | 2002-07-22 | 2004-01-29 | Fujitsu Limited | Electronic mail server, electronic mail delivery relaying method, and computer program |
JP2004038498A (en) * | 2002-07-02 | 2004-02-05 | Kenwood Corp | Information processing terminal, e-mail system, e-mail processing method and program |
JP2005135328A (en) * | 2003-10-31 | 2005-05-26 | Nec Corp | E-mail server, e-mail management method, and e-mail management program |
JP2005250826A (en) * | 2004-03-04 | 2005-09-15 | Nec Corp | Information provision system, information provision method and information provision processing program |
JP2005284454A (en) * | 2004-03-29 | 2005-10-13 | Tatsuya Koshi | Junk e-mail distribution preventive system, and information terminal and e-mail server in the system |
JP2006331348A (en) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | Method, apparatus, program for collecting comment trackback of trackback source |
-
2006
- 2006-03-30 JP JP2006094346A patent/JP4500285B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004038498A (en) * | 2002-07-02 | 2004-02-05 | Kenwood Corp | Information processing terminal, e-mail system, e-mail processing method and program |
WO2004010662A1 (en) * | 2002-07-22 | 2004-01-29 | Fujitsu Limited | Electronic mail server, electronic mail delivery relaying method, and computer program |
JP2005135328A (en) * | 2003-10-31 | 2005-05-26 | Nec Corp | E-mail server, e-mail management method, and e-mail management program |
JP2005250826A (en) * | 2004-03-04 | 2005-09-15 | Nec Corp | Information provision system, information provision method and information provision processing program |
JP2005284454A (en) * | 2004-03-29 | 2005-10-13 | Tatsuya Koshi | Junk e-mail distribution preventive system, and information terminal and e-mail server in the system |
JP2006331348A (en) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | Method, apparatus, program for collecting comment trackback of trackback source |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009157510A (en) * | 2007-12-25 | 2009-07-16 | Nec Corp | System, method and program for identifying spam information |
JP2009237949A (en) * | 2008-03-27 | 2009-10-15 | Nomura Research Institute Ltd | Communication repeater, web terminal, mail server device, e-mail terminal and site check program |
JP2009289245A (en) * | 2008-05-27 | 2009-12-10 | Yahoo Japan Corp | Message determining device, method and program |
JP2009289246A (en) * | 2008-05-27 | 2009-12-10 | Yahoo Japan Corp | Message determining apparatus, method and program |
JP2014109794A (en) * | 2012-11-30 | 2014-06-12 | Ntt Docomo Inc | Spam account extraction device and spam account extraction method |
JP2018190374A (en) * | 2017-05-08 | 2018-11-29 | デジタルア−ツ株式会社 | Information processing device, information processing system, program, storage medium, and information processing method |
JP2023510833A (en) * | 2020-01-20 | 2023-03-15 | 北京字節跳動網絡技術有限公司 | Message processing method, device and electronic equipment |
US11936605B2 (en) | 2020-01-20 | 2024-03-19 | Beijing Bytedance Network Technology Co., Ltd. | Message processing method, apparatus and electronic device |
JP7467644B2 (en) | 2020-01-20 | 2024-04-15 | 北京字節跳動網絡技術有限公司 | Message processing method, device and electronic device |
Also Published As
Publication number | Publication date |
---|---|
JP4500285B2 (en) | 2010-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10904186B1 (en) | Email processing for enhanced email privacy and security | |
US11595353B2 (en) | Identity-based messaging security | |
US8584233B1 (en) | Providing malware-free web content to end users using dynamic templates | |
JP4250300B2 (en) | Computer-readable recording medium having recorded thereon a program for preventing transmission or reception of an undesirable electronic message | |
US8090782B2 (en) | Electronic messaging system and method | |
US7359941B2 (en) | Method and apparatus for filtering spam email | |
US7882189B2 (en) | Using distinguishing properties to classify messages | |
US8095602B1 (en) | Spam whitelisting for recent sites | |
JP4500285B2 (en) | Spam removal method | |
US8321512B2 (en) | Method and software product for identifying unsolicited emails | |
KR100628623B1 (en) | Spam mail filtering system and method capable of recognizing and filtering spam mail in real time | |
US8122025B2 (en) | Method of managing locations of information and information location management device | |
US20080177848A1 (en) | System and method of sharing and dissemination of electronic information | |
JP3929464B2 (en) | E-mail server, e-mail delivery relay method, and computer program | |
US20060264204A1 (en) | Method for sending a message waiting indication | |
US9232018B2 (en) | System and method of creating and rating items for social interactions | |
US20100161748A1 (en) | Apparatus, a Method, a Program and a System for Processing an E-Mail | |
JPH11252158A (en) | Electronic mail information management method and device and storage medium recording electronic mail information management processing program | |
JP2004240945A (en) | Automatic shutoff method of spam mail through dynamic url connection | |
JP4704413B2 (en) | Transmission content monitoring device | |
JP2007115173A (en) | Server system, its control method, and control program | |
JP2004523046A (en) | System for transmitting message to target and method of operating the same | |
JP4364899B2 (en) | E-mail server, e-mail delivery relay method, and computer program | |
JP2005284955A (en) | Electronic mail transmitting/receiving system | |
JP2000227900A (en) | Device and method for supporting information communication and computer-readable recording medium where information communication supporting program is recored |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100416 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4500285 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |