JP2006221586A - 報告型迷惑メールフィルタリングシステム - Google Patents

報告型迷惑メールフィルタリングシステム Download PDF

Info

Publication number
JP2006221586A
JP2006221586A JP2005064593A JP2005064593A JP2006221586A JP 2006221586 A JP2006221586 A JP 2006221586A JP 2005064593 A JP2005064593 A JP 2005064593A JP 2005064593 A JP2005064593 A JP 2005064593A JP 2006221586 A JP2006221586 A JP 2006221586A
Authority
JP
Japan
Prior art keywords
mail
spam
past
determined
hash value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005064593A
Other languages
English (en)
Inventor
Umi Nishida
海 西田
Yoshinori Hijikata
嘉徳 土方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Priority to JP2005064593A priority Critical patent/JP2006221586A/ja
Publication of JP2006221586A publication Critical patent/JP2006221586A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】過去に迷惑メールと判断されたメールの情報を元に、新たに受信したメールが過去に迷惑メールであったか否かを検索する。
【解決手段】受信メールの本文から記載されているURI、メールアドレスを抽出し、その抽出されたURIへアクセスし、メール本文に記載されているURIとは異なるURIへ誘導された場合にはそのURIも記憶する。本文に対し別途保有している単語データベースに存在する単語を抽出し、それらを事前に定めた方法によって単語を複数抽出し文字列を生成し記憶する。記号や空白、空白行、重なっている文字を削除し、そこから事前に定めた方法によって、行や文字を複数抽出し文字列を生成し記憶する。これらの記憶した文字列のハッシュ値を計算し、別途他の複数のユーザと共有している迷惑メールデータベースに登録されている迷惑メールの情報から同じものを検索し、受信したメールが過去に迷惑メールとして判定されたかを確認する。
【選択図】図1

Description

本発明は、インターネットを主とするコンピュータネットワーク上のメール受信において、迷惑メールを合理的に確認できるプログラムに関するものである。
現在では、インターネットや携帯電話などのメールのやり取りが一般的に広く普及している。メールはその通信費用の安さと手軽さにより、日常生活や業務の様々な場面で活用されている。その反面これらのメリットを利用し、受信者が望まない迷惑メールが蔓延している事実も存在する。
これらの迷惑メールは、受信者に不快感を及ぼすものから、クレジットカード番号や住所などの個人情報を不正に取得しようとするものまで様々なものが存在している。また、これらの蔓延により被害にあう人は後を絶たない。そのため、これらの迷惑メールを排除するために、現在は以下のような方法が用いられている。
1つ目は、全文一致を用いた方法である。これは、過去に送られてきた迷惑メールの文面を記憶しておき、再び同じメールがあった場合にそれを迷惑メールとして判定する方法である。有用なメールを迷惑メールと誤って認識しない特徴を持っている。
2つ目は、ルールベースを用いた方法である。これは、事前に迷惑メールと判定できるキーワードを設定しておき、これらのキーワードがサブジェクトや本文に含まれていた場合にそれを迷惑メールと判定する方法である。過去に受け取ったことのない文面のメールでも、柔軟に認識できる特徴を持っている。
3つ目は、パターン認識を用いた方法である。これは、送られてきた迷惑メールからその迷惑メールの特徴を学習し、その特徴に酷似した文面のメールがあった場合にそれを迷惑メールと判定る方法である。過去に受け取ったことのない文面のメールでも、柔軟に認識できる特徴を持っている。
4つ目は、全文一致、パターン認識を用いた複数ユーザにおける情報共有化を用いた方法である。これは、複数のユーザから、迷惑メールと判定したメールの情報を送ってもらい、その情報と上記の全文一致並びにパターン認識の方法を用いて迷惑メールを判定する方法である。複数のユーザから情報を収集することにより。ユーザが単独で行うよりも迷惑メールを判定する手がかりが数多く得られるという特徴を持っている。
特開2000−010880号公報 特開2003−173314号公報 特開2003−249964号公報 特開2003−263391号公報 特開2003−348161号公報 特開2003−348162号公報 特開2004−133508号公報 特開2004−254034号公報 特開2004−030626号公報
背景技術で記載した方法を用いて、迷惑メールの認識及び排除を行った場合にいくつかの問題点が存在する。具体的には、以下のものがあげられる。
わずかな文面の違いにより、過去に受信した迷惑メールの文面と、新たに受信した迷惑メールの文面が一致しない場合に、正しく認識できないという問題点が存在する。この問題点は、全文一致を用いた方法が該当する。
ユーザが迷惑メールと判定しないメールでも、たまたま設定したルールのキーワードを含んでいたり、メールの特徴が似ていたために、誤って迷惑メールと判定されてしまう場合があるという問題点が存在する。この問題点は、ルールベース及びパターン認識を用いた方法が該当する。
単語などの母音や子音を連続して表記し、視認性をあまり劣化させずにキーワードによる認識を免れる迷惑メールは、正しく認識できない場合がある。例えば、「Drugs」や「Viaga」を含んでいるメールを迷惑メールとして認識する場合に、受信したメール内の表記が「Druuuugs」や「Viaaaagra」の場合には、そのメールが迷惑メールに該当すると判定できないという問題点が存在する。この問題点は、ルールベース、パターン認識を用いた方法が該当する。
httpリダイレクト、CGI、JavaScript、ドメインネームサーバなどの機能を用いて、メール本文に表記されているURIとは異なるURIへ誘導する迷惑メールには対処できない場合があるという問題点が存在する。最終的に誘導されるURIは同じでも、メール本文に記載されているURIは迷惑メールごとに異なる表記がしてある場合があるためである。この問題点は、全文一致、ルールベース、パターン認識を用いた方法が該当する。
情報共有化を行う場合に、ユーザは迷惑メールと判定したメールを、複数ユーザで情報共有しているデータベースへ登録する必要がある。ここで登録された情報は、他のユーザも閲覧可能である。そのため、メール内に個人情報が記載されたものを登録した際に、他のユーザにその個人情報を公開してしまうことになるという問題点が存在する。この問題点は、全文一致、パターン認識を用いた複数ユーザにおける情報共有化を用いた方法が該当する。
この発明では、ユーザ(図1の6、図2の22)が使用しているクライアント(図1の3、図2の10)から、他のユーザ(図1の7、8)のクライアント(図1の4、5)と共有で使用している迷惑メールデータベースサーバ(図1の2、図2の21)より定期的に最新の迷惑メールの情報を、ユーザが使っているクライアントへ取り込む(図2の16、17)。メールサーバ(図1の1、図2の9)に自分宛のメールを受信した場合には、そのメールをユーザのクライアントへ取り込む(図2の11)。取り込んだメール本文から複数の文字列の情報を抽出し、ハッシュ値を計算する(図2の12)。計算したハッシュ値と、迷惑メールデータベースに登録されているハッシュ値を比較し、ユーザのクライアントに取り込んだメールが迷惑メールとして登録されているかどうか検索し結果を出力する(図2の15)。迷惑メールとして登録されていた場合には、メールサーバ及びクライアントから該当メールを削除する(図2の14)。迷惑メールとして登録されていない場合に、ユーザはそのメールを読むことになる(図2の19)。ただし、迷惑メールデータベースに登録されていなくても、受信したメールが迷惑メールであるとユーザが判定した場合には、その判定をクライアント(図1の3、図2の18)に入力する。入力された情報を元に、メール本文から抽出、計算されたハッシュ値をクライアントから共有迷惑メールデータベースサーバへ登録する(図2の20)。ここでは、他のユーザ(図1の7,8)も同様の処理をしているものとする。
本文に記載されているURIを抽出し、実際にそのURIへ接続を行う。httpリダイレクトやJavaScript、CGI、ドメインネームサーバなどの機能を用いることにより、本文に記載されたURIとは異なるサイトへ誘導された場合に、その誘導先のURIも抽出する(図3)。
アルファベットやひらがな、カタカナ、ハングル文字などの音標文字以外の文字や記号、数字を削除する。その後、同じ文字が重なっている場合に、それを1つの文字に置き換える(図4)。
メール本文を全部結合し生成した文字列、もしくは本文を行、単語、文字の最小構成単位として分割しそこから複数の事前に定めた位置にある行、単語、文字を抽出、結合し生成された文字列、メール本文から単語の出現回数を計算し単語を文字コード順に並べ、そこから複数の事前に定めた位置にある単語と出現回数を抽出し、それらの単語と出現回数を結合し生成された文字列、メール本文及びアクセスした際に誘導されたサイトにて抽出されたURI、本文に記載されているメールアドレス、メールに添付されているファイルなどから事前に定めたハッシュ関数を用いハッシュ値を計算し、記憶する。
登録された過去の迷惑メールから計算されたハッシュ値と、新規にユーザに届いたメールから計算されたハッシュ値を比較する。同じ計算方法にて一致及び不一致のハッシュ値の数を出力する。どの程度の割合で一致したら迷惑メールであるのかという判定をユーザは事前に設定しておき、その設定に従い新規にユーザに届いたメールが迷惑メールかどうかを判定する。迷惑メールと判定された場合に、そのメールを排除する。
過去に迷惑メールとして判定されたものと同一のメールを、迷惑メール作成者が仕掛けた記述のわずかな違いの影響をうけることなく、迷惑メールと判定することが可能になる。そのため、パターン認識を用いた迷惑メールフィルターのように誤った判定を起こすことは少なくなる。
新規にユーザに届いたメールと過去に迷惑メールとして登録されたデータベースの情報との比較に、ハッシュ値を用いるため、非常に速い計算で判定することが可能である。
過去に登録されたことのないURIが迷惑メールの本文に記載されている場合でも、httpリダイレクトやJavaScript、CGI、ドメインネームサーバなどによって最終的に同じURIのサイトに誘導されるメールは、過去に存在した迷惑メールと判定することができる。
迷惑メールの情報をハッシュ値で迷惑メールデータベースに登録するため、メール受信者の個人情報が記載されたメールを登録しても、その個人情報が他のユーザに知られることはない。
新たなメールがユーザに届き、過去の迷感メールの情報と比較する際に、メール本文に記載されているわずかな違いによる影響を受けることなく、受信したメールが過去に迷惑メールとして判定されたか否かを確認することを可能にした。
図6のフローチャートにおいて、ユーザはクライアントからメールサーバに対し、自分宛に新しいメールが届いているか確認する。新しいメールが届いていた場合には、そのメールを受信する(ステップS1)。受信したメールの本文から複数のハッシュ値を計算する(ステップS2、図7)。ユーザのクライアントには、他のユーザと共有している迷惑メールデータベースサーバから事前に最新の迷惑メールデータベース(図2の16)の情報を取得してある。また、この迷惑メールデータベースには、抽出元データ種類、数列・一般項、ハッシュ値のテーブルが存在する(図11)。ステップS32、S34、S36、S37でのハッシュ値の計算においては、このデータベースの抽出元データ種類と数列・一般項とを参照し、その情報に従って文字列を生成しハッシュ値を計算する。
図7のフローチャートにおいて、メール本文の内容からURIを抽出し、そのハッシュ値を計算する(ステップS9)。この時、単純に「http://」が含まれている文字列を探すだけでなく、「http://」と表記されていなくてもURIと推測される文字列の抽出を行う。また、メールにhtmlファイルを含むテキストファイルが添付されている場合には、その添付ファイルについてもメール本文と同じ処理を行う。(図8)。
図8のフローチャートにおいて、メールの本文から「http://」や「https://」などのスキーム名が表記されている文字列を検索し、そのURIを抽出し記憶する(ステップS19、図12)。
図8のフローチャートにおいて、メール本文からトップレベルドメイン名を含む文字列、及びトップレベルドメイン名とセカンドレベルドメイン名を含む文字列を検索し、そのURIを抽出し記憶する(ステップS20、図13)。
図8のフローチャートにおいて、メール本文からグローバルIPアドレスの範囲が記載されているIPアドレスを含む文字列を検索し、そのURIを抽出し記憶する(ステップS21、図14)。
図8のフローチャートにおいて、メール本文や添付ファイルがhtmlで記載されていた場合に、その本文から「<a>」や「<A>」などのリンクタグを含む文字列を検索し、そのURIを抽出し記憶する(ステップS22、図15)。
図8のS19からS22において記憶したURIの中から、ドメイン名の前方に「@」がある場合にはそのURIを記憶から削除する(ステップS23、図16)。
図8のS19からS23において記憶したURIの中から、URIの最後尾の文字が「/」でディレクトリを示している場合には、その「/」の文字を削除し、記憶し直す(ステップS24、図17)。
図8のS19からS24において記憶したURIの中から、メールアドレスに該当する文字列などが含まれている場合には、そのメールアドレスに該当する文字列を削除し、記憶し直す(ステップS25、図18)。
図8のS19からS25において記憶したURIの中から、スキーム名が記載されていない場合には「http://」をURIの前方に追加し、記憶し直す(ステップS26、図19)。
図8のS19から26において記憶したURIの中から、文字列の最後尾にファイル名やCGIの引数などが記載されている場合には、それが存在するディレクトリの位置のURIを抽出し記憶する(ステップS27、図20)。
図8のS19からS27において記憶したURIを用いて、実際にそのURIへアクセスを行う。この時、httpリダイレクトやJavaScript、CGI、ドメインネームサーバなどによって記憶されたURIとは異なるURIを持つサイトに誘導された場合には、その誘導先のサイトのURIも記憶する(ステップS28、図5)。
図8のS19からS28において記憶したURIの文字列を、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、ステップS29の処理であることを示した情報と共に記憶する。(ステップS29、図11)。
図7のフローチャートにおいて、メール本文からトップレベルドメイン名を含む文字列、及びトップレベルドメイン名とセカンドレベルドメイン名を含む文字列で、かつドメイン名の前方に「@」の文字があるものを検索し、そのメールアドレスを抽出し、記憶する。また、htmlなどで記載されている場合には、「mailto:」の文字列を検索し、その後に記載されているメールアドレスを記憶する。これらの記憶したメールアドレスからMD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、ステップS10の処理であることを示した情報と共に記憶する(ステップS10、図11、図21、図22)。
図7のフローチャートにおいて、メール本文及びメールに添付されているテキストファイル等から、メールヘッダに含まれているメールアドレスや名前、ステップS9で抽出したURI及びステップS10で抽出したメールアドレスを削除する(ステップS11)。
図7のフローチャートにおいて、メールにバイナリファイルが添付されている場合には、その添付ファイルそのものをMD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、ステップS12の処理であることを示した情報と共に記憶する(ステップS12、図11)。
図7のフローチャートにおいて、メール本文に記載されている記号や数字以外の文字が、英文などのように音標文字だけで構成されているかどうかを調べる。もし、音標文字だけで構成されている場合には、ステップS14へ飛ぶ。漢字が入っている日本語の文のように音標文字だけで構成されていない場合には、ステップS16へ飛ぶ(ステップS13)。
図7のフローチャートにおいて、メール本文が音標文字だけで構成されている場合に、「A」と「a」や、「あ」と「ア」の様な、その音標文字の種類において同音文字が存在するか調べる。もし、同音文字が存在する場合には、ステップS15へ飛ぶ。同音文字が存在しない場合にはステップS16へ飛ぶ(ステップS14)。
図7のフローチャートにおいて、ステップS14でメール本文に複数の同音文字が存在する種類の文字であると判定された場合に、「Makoto」を「MAKOTO」にする様に、1種類の文字に統一するようにメール本文を変換する(ステップS15)。
図7のフローチャートにおいて、メール本文から認識できる単語を抽出し、それらの単語を組み合わせた文字列のハッシュ値を計算し、記憶する(ステップS16)。この時、単純に認識できる単語を抽出するだけでなく、単語の出現順序や出現回数を考慮して文字列を生成し、そのハッシュ値を計算する(図9)。
図9のフローチャートにおいて、メール本文の単語と、別途プログラムが保持している一般的な単語のデータベース情報と比較し、単語データベースに存在する単語だけを出現順序通りに抽出し、新たなテキストを生成する。(ステップS30)。
ステップS30を図23にあるようなメール本文の1行目で処理を行う場合を説明する。1行目は「WE WILL R E F INANCE YOUR CURRENT M O RTAGE」と書かれており、ここから一般的に単語として認識できる「WE」「WILL」「YOUR」「CURRENT」を抽出する。これが図24の1行目に該当する。この様な処理を全ての行に対して行う(図24)。
図9のステップS30で生成したテキストから、それらの単語を出現順序通りに結合し1つの文字列を生成する。この生成した文字列からハッシュ値を計算し、ステップS31の処理であることを示した情報と共に記憶する(ステップS31、図11)。
ステップS31を図24にあるようなテキストで処理を行う場合を説明する。図24のテキストの1行目では「WE」「WILL」「YOUR」「CURRENT」の単語が記載されているため、これをそのまま出現順序通りに「WEWILLYOURCURRENT」と結合する。この様な処理を全てのテキストに対して行う(図25)。ここで生成された文字列からMD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、ステップS31の処理であることを示した情報と共に記憶する。
図9のステップS30で抽出した単語一覧から、事前に定めた方法で単語を複数抽出する。その抽出した複数の単語を抽出順に結合し1つの文字列を作成する。この事前に定めた単語を複数抽出する方法の1つとして、数列を利用する方法がある。この数列は、迷惑メールデータベースに登録してある抽出元データ種類に対応する1つ以上の数列もしくは1つ以上の数列の一般項を用いたものである。ステップS30で記憶した単語一覧の出現位置と、数列に出現する数値とが一致するものを抽出し、それらの単語を結合し1つの文字列を生成する。これを異なる複数の数列に対して行い、そこから生成された複数の文字列のハッシュ値を各々計算し、その各々のハッシュ値と、ステップS32の処理であることを示した情報と、各々の抽出に用いられた数列を共に記憶する(ステップS32、図11)。
ステップS32を図24にあるようなテキストで処理を行う場合を説明する。事前に迷惑メールデータベースから参照した数列{a}、ここでは仮に一般項a=4(n−1)+1とし、ここからn=1,2,3,4,5,6,…にて数列を計算する。数列{a}={1,5,9,13,17,21…}となるので、図24にテキストにある単語の位置を前から順番に1,2,3,4…とし、数列{a}にある数値の位置にある単語を抽出する。ここでは、数列にある1に対し「WE」、5に対し「AT」、9に対し「FOR」、13に対し「DAYS」、17に対し「ON」、21に対し「GET」が該当する。このようにして、単語が抽出できなくなるまで行い、抽出した順に結合し「WEATFORDAYSONGETCANFAMILYGIFTSWIFESOMEYEAR」といった文字列を生成する(図26)。ここで生成された文字列から、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、その各々のハッシュ値と、ステップS32の処理であることを示した情報と、各々の抽出にどのような一般項、もしくは数列を用いて計算したのかを共に記憶する。
図9のステップS30で記憶した単語一覧から、同じ単語の出現回数を計算する。単語を文字コード順に並び替え、各々の単語の出現回数を文字列として単語の後ろに結合する。それらの単語を全て結合し1つの文字列を生成する。その文字列からハッシュ値を計算、そのハッシュ値と、ステップS33の処理であることを示した情報と共に記憶する(ステップS33、図11)。
ステップS33を図24にあるようなテキストで処理を行う場合を説明する。図24のテキストの単語を文字コード順に並び替えたとき、一番最初の単語は「AND」であり、この単語は2回登場する。次の単語は「AT」であり、この単語は1回登場する。このように単語の出現回数をテキストの中の全ての単語において計算を行う。単語と出現回数を結合するとき、「AND」は2回登場するので「AND2」という文字列が生成される。「AT」は1回登場するので「AT1」となる。この様に文字コード順に並び替えられたテキストに登場する全ての単語とその出現回数を結合すると「AND2AT1BUY1CAN1CASH1…」の文字列が生成される(図27)。ここで生成された文字列から、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、そのハッシュ値と、ステップS33の処理であることを示した情報と共に記憶する。
ステップS33で計算した単語の出現回数と文字コード順に並び替えられた単語一覧から、事前に定めた方法で単語と出現回数の組み合わせを複数抽出する。その抽出した複数の組み合わせを抽出順に結合し、1つの文字列を生成する。この事前に定めた単語と出現回数の組み合わせを複数抽出する方法の1つとして、数列を利用する方法がある。この数列は、迷惑メールデータベースに登録してある抽出元データ種類に対応する1つ以上の数列もしくは1つ以上の数列の一般項を用いたものである。ステップS33で計算した文字コード順に並び替えられた単語一覧の位置と、数列に出現する数値とが一致するものを抽出する。抽出された単語とその単語の出現回数を単語の後に結合する。抽出された単語を全て結合し1つの文字列を生成する。これを異なる複数の数列に対して行い、そこから生成された複数の文字列のハッシュ値を各々計算し、その各々のハッシュ値と、ステップS34の処理であることを示した情報と、各々の抽出に用いられた数列を共に記憶する(ステップS34、図11)。
ステップS34を図27にあるようなテキストで処理を行う場合を説明する。事前に迷惑メールデータベースから参照した数列{a}、ここでは仮に一般項a=(n−1)+1から、n=1,2,3,4,5,6,…にて数列を計算する。数列{a}={1,2,5,10,17,26…}となるので、図27のテキストにある単語の位置を前から順番に1,2,3,4…とし、数列{a}にある数値の位置にある単語とその単語の出現回数が結合された文字列を抽出する。ここでは、数列にある1に対し「AND2」、2に対し「AT1」、5に対し「CASH1」、10に対し「GET3」、17に対し「MONEY1」、26に対し「THIS1」が該当する。このようにして、単語が抽出できなくなるまで行い、抽出した順に結合し「AND2AT1CASH1GET3MONEY1THIS1」の文字列が生成される(図28)。ここで生成された文字列から、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、その各々のハッシュ値と、ステップS34の処理であることを示した情報と、各々の抽出にどのような一般項、もしくは数列を用いて計算したのかを共に記憶する。
図7のフローチャートにおいて、メール本文から、改行や空白だけが存在する行を削除し、さらに文字が書かれている行でも、空白、記号、数字などの音標文字以外の文字を削除しテキストを生成する(ステップS17)。
ステップS17を図29にあるようなメール本文の1行目で処理を行う場合を説明する。1行目は「THE L0WEST PRICE OF ALL MED‘S IS HERE.」と書かれており、ここから空白、記号、数字などの音標文字以外の文字を削除すると「THELWESTPRICEOFALMEDSISHERE」になる。2行目は、空白の行であるためそのまま行ごと削除される。この様な処理を全ての行に対して行う(図30)。
図7のステップS17で生成したテキストを元に、メール本文のハッシュ値を計算し、記憶する(ステップS18)。この時、単純にそのままハッシュ値を計算するだけでなく、行の出現位置や文字の出現位置を考慮し文字列を生成し、そのハッシュ値を計算する(図10)。
図10のフローチャートにおいて、図7のステップS17で生成したテキストを元に、全ての行を結合し、1つの文字列を生成する。その文字列からハッシュ値を計算、そのハッシュ値と、ステップS33の処理であることを示した情報と共に記憶する(ステップS35、図11)。
ステップS35を図30にあるようなテキストで処理を行う場合を説明する。1行目の「THELWESTPRICEOFALMEDSISHERE」という文字列の後方に、2行目の「VICODIN」という文字列を結合する。1行目と2行目から生成された文字列の後方に、3行目の「CODEINE」という文字列を結合する。これを最後の行まで行い、「THELWESTPRICEOFALMEDSISHEREVICODINCODEINEVAGRA…」という文字列を生成する(図31)。ここで生成された文字列から、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、そのハッシュ値と、ステップS35の処理であることを示した情報を共に記憶する。
図10のフローチャートにおいて、図7のステップS17で生成したテキストを元に、事前に定めた方法で行を複数抽出する。その抽出した複数の行を抽出順に結合し1つの文字列を生成する。この事前に定めた行を複数抽出する方法の1つとして、数列を利用する方法がある。この数列は、迷惑メールデータベースに登録してある抽出元データ種類に対応する1つ以上の数列もしくは1つ以上の数列の一般項を用いたものである。ステップS17で生成したテキストを元に、その行の出現位置と数列に出現する数値が一致する行を抽出し、それらの行を結合し1つの文字列を生成する。これを異なる複数の数列に対して行い、そこから生成された複数の文字列のハッシュ値を各々計算し、その各々のハッシュ値と、ステップS36の処理であることを示した情報と、各々の抽出に用いられた数列を共に記憶する(ステップS36、図11)。
ステップS36を図30にあるようなテキストで処理を行う場合を説明する。事前に迷惑メールデータベースから参照した数列{a}、ここでは仮に一般項a=2(n−1)+1とし、ここからn=1,2,3,4…にて数列を計算する。数列{a}={1,3,5,7…}となるので、図30のテキストにある行の位置を前から順番に1,2,3,4…とし、数列{a}にある数値の位置にある行を抽出する。ここでは、数列にある1に対し「THELWESTPRICEOFALMEDSISHERE」、3に対し「CODEINE」、5に対し「VAIUM」、7に対し「XANAX」が該当する。このようにして、行が抽出できなくなるまで行い、抽出した順に結合し「THELWESTPRICEOFALMEDSISHERECODEINE…」といった文字列を生成する(図32)。ここで生成された文字列から、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、その各々のハッシュ値と、ステップS36の処理であることを示した情報と、各々の抽出にどのような一般項、もしくは数列を用いて計算したのかを共に記憶する。
図10のフローチャートにおいて、図10のステップS35で生成したテキストを元に、事前に定めた方法で文字を複数抽出する。その抽出した複数の文字を抽出順に結合し1つの文字列を生成する。この事前に定めた文字を複数抽出する方法の1つとして、数列を利用する方法がある。この数列は、迷惑メールデータベースに登録してある抽出元データ種類に対応する1つ以上の数列もしくは1つ以上の数列の一般項を用いたものである。ステップS35で生成したテキストを元に、その文字の出現位置と数列に出現する数値が一致する文字を抽出し、それらの文字を結合し1つの文字列を生成する。これを異なる複数の数列に対して行い、そこから生成された複数の文字列のハッシュ値を各々計算し、その各々のハッシュ値と、ステップS37の処理であることを示した情報と、各々の抽出に用いられた数列を共に記憶する(ステップS37、図11)。
ステップS37を図31にあるようなテキストで処理を行う場合を説明する。事前に迷惑メールデータベースから参照した数列{a}、ここでは仮に一般項a=(n−1)+1とし、ここからn=1,2,3,4…にて数列を計算する。数列{a}={1,2,5,10…}となるので、図31のテキストにある文字の位置を前から順番に1,2,3,4…とし、数列{a}にある数値の位置にある文字を抽出する。ここでは、数列にある1に対し「T」、2に対し「H」、5に対し「W」、10に対し「R」が該当する。このようにして、文字が抽出できなくなるまで行い、抽出した順に結合し「THWRLRDUDES」といった文字列を生成する(図33)。ここで生成された文字列から、MD5やSHA−1などのハッシュ関数を用いてハッシュ値を計算し、その各々のハッシュ値と、ステップS37の処理であることを示した情報と、各々の抽出にどのような一般項、もしくは数列を用いて計算したのかを共に記憶する。
図6のフローチャートにおいて、複数ユーザと迷惑メールの情報を共有しているデータベースから定期的に新しい情報を取得しておいたクライアントにあるデータベースの情報と、図7のステップS9からステップS18における計算手法にて計算した情報を比較する(ステップS3)。ステップS9〜S10、ステップS12、ステップS31〜S34、ステップS35〜S37のどの抽出元データ種類及び数列を用いて計算したのかという情報とハッシュ値の情報が共に記憶されているため、同じ抽出元データ種類及び数列を用いて計算されたハッシュ値を迷惑メールデータベースから検索する。ステップS1にて受信したメール本文から生成された全てのハッシュ値に対し、迷惑メールデータベースに存在するかどうかという情報を計算、記憶する。ここで検索する情報は、本文に記載されているURI、メールアドレス、添付ファイル、本文の事前に定めた箇所を抽出した文字列、及びリダイレクト先のURIのハッシュ値を計算したものである。
図6のフローチャートにおいて、本文に記載されているURI、メールアドレス、添付ファイル、及びリダイレクト先のURIのどれが一致したら迷惑メールであるか、本文の事前に定めた箇所を抽出した文字列のハッシュ値のうちどの程度の割合が一致したら迷惑メールであるかという判定基準を、ユーザは事前に設定しておく。この基準で、ステップS4にて、記憶した情報を元にステップS1にて受け取ったメールが迷惑メールと判定された場合にステップS8へ飛び、迷惑メールと判定されなかった場合にステップS5へ飛ぶ(ステップS4)。
図6のフローチャートにおいて、ステップS4にて迷惑メールと判定されなかったメールを、ユーザは実際に目を通してみる。そして、ユーザ自身がその受信したメールを迷惑メールであるか否か判定する(ステップS5、S6)。ユーザ自身が迷惑メールであると判定した場合には、そのメール本文に記載されているURI、メールアドレス、添付ファイル、本文の事前に定めた箇所を抽出した文字列、及びリダイレクト先のURIのハッシュ値を計算したものを、他のユーザと迷惑メールの情報を共有しているデータベースへ新しい迷惑メールの情報として登録する(ステップS7)。ステップS6にて迷惑メールと判定されない場合には、そのまま処理を終了する。
図6のフローチャートにおいて、ステップS4にて迷惑メールと判定されたメール、及びステップS5にてユーザ自身が迷惑メールと判定したメールをクライアント及びメールサーバから排除する(ステップS8)。
報告型迷惑メールフィルタリングシステムの他のユーザとの関係を示したブロック図である。(課題を解決するための手段) 報告型迷惑メールフィルタリングシステムの機能を説明したブロック図である。(課題を解決するための手段) 記載とは異なるサイトへの誘導を示した説明図である。(課題を解決するための手段) 文字列処理の例を示した説明図である。(発明が解決しようとする課題) メール本文から文字列を抽出、生成しハッシュ値を計算することを示した説明図である。(実施例1) 報告型迷惑メールフィルタリングシステムの動作フローチャート図である。(実施例1) 受信したメールのハッシュ値を計算する機能の動作フローチャート図である。(実施例1) 受信したメールからURIを抽出しハッシュ値を計算する機能の動作フローチャート図である。(実施例1) 受信したメールから単語を抽出しハッシュ値を計算する機能の動作フローチャート図である。(実施例1) 受信したメールから行、文字を抽出しハッシュ値を計算する動作フローチャート図である。(実施例1) 迷惑メールデータベースのデータ構造例を示した説明図である。(実施例1) スキーム名が含まれたURIの例を示した説明図である。(実施例1) ドメイン名が含まれたURIの例を示した説明図である。(実施例1) IPアドレスが含まれたURIの例を示した説明図である。(実施例1) リンクタグにURIが含まれた文字列の例を示した説明図である。(実施例1) メールアドレスの例を示した説明図である。(実施例1) 最後尾の「/」を削除したURIの例を示した説明図である。(実施例1) URIに含まれるメールアドレスの文字列を削除したURIの例を示した説明図である。(実施例1) スキーム名を追加したURIの例を示した説明図である。(実施例1) 上位ディレクトリのURIの例を示した説明図である。(実施例1) メールアドレスの例を示した説明図である。(実施例1) リンクタグにメールアドレスが含まれる文字列の例を示した説明図である。(実施例1) 迷惑メールの本文の例を示した説明図である。(実施例1) 迷惑メールの本文から、認識できる単語だけを抽出した例を示した説明図である。(実施例1) 単語を1つの文字列に結合した例を示した説明図である。(実施例1) 数列に従い単語を抽出し、結合して1つの文字列を生成した例を示した説明図である。(実施例1) 単語とその出現回数を抽出、計算し、結合して1つの文字列を生成した例を示した説明図である。(実施例1) 数列に従い単語とその出現回数を抽出し、結合して1つの文字列を生成した例を示した説明図である。(実施例1) 迷惑メールの本文の例を示した説明図である。(実施例1) 迷惑メールの本文から、空白や記号、数字を削除した例を示した説明図である。(実施例1) 全ての行を結合し、1つの文字列を生成した例を示した説明図である。(実施例1) 数列に従い行を抽出し、結合して1つの文字列を生成した例を示した説明図である。(実施例1) 数列に従い文字を抽出し、結合して1つの文字列を生成した例を示した説明図である。(実施例1)
符号の説明
1 メール送受信にユーザ1が使用しているメールサーバ1
2 他のユーザと共有で使用している迷惑メールデータベースサーバ
3 ユーザ1が使用しているクライアントコンピュータ1
4 ユーザ2が使用しているクライアントコンピュータ2
5 ユーザ3が使用しているクライアントコンピュータ3
6 ユーザ1
7 ユーザ2
8 ユーザ3
9 メール送受信にユーザが使用しているメールサーバ
10 ユーザが使用しているクライアントコンピュータ
11 メールサーバからメールを受信する機能
12 受信したメールから文字列を生成し、ハッシュ値を計算する機能
13 一般的な単語一覧のデータベース
14 クライアント、及びメールサーバで保存されているメールを削除する機能
15 過去に迷惑メールとして判定されたメールより生成されたハッシュ値一覧から、クライアントが受信したメールより生成されたハッシュ値を検索する機能
16 過去に迷惑メールとして判定されたメールより生成されたハッシュ値一覧のデータベース
17 共有で使用されている迷惑メールデータベースサーバより、最新の情報を取得する機能
18 ユーザからの入力機能
19 ユーザへの出力機能
20 新たな迷惑メールのハッシュ値を共有で使用されている迷惑メールデータベースサーバへ登録する機能
21 ユーザ

Claims (21)

  1. 受信したメール本文から抽出されたURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIへアクセスした場合に、httpリダイレクト、CGI、ドメインネームサーバなどによりメール本文の表記とは異なるURIへ誘導された先のURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認する方法。
  2. 受信したメール本文から抽出されたURIへアクセスを行い、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された場合にその誘導された先のURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認する方法。
  3. 受信したメール本文から抽出されたURIへアクセスを行い、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された場合にその誘導された先のURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIへアクセスした場合に、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された先のURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認する方法。
  4. 受信したメール本文から、単語データベースに存在する単語を抽出し、その中からさらに数列を用いて単語を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、単語データベースに存在する単語が抽出され、その中からさらに同じ数列を用いて単語が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認する方法。
  5. 受信したメール本文から、単語データベースに存在する単語を抽出し、抽出された単語を一定の規則で並び替えその出現回数を計算し、その中からさらに数列を用いて単語を複数抽出し、それらの単語とその単語の出現回数を文字列として組み合わせ結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、単語データベースに存在する単語が抽出され、抽出された単語が同じ一定の規則で並び替えられその出現回数が計算され、その中からさらに同じ数列を用いて単語が複数抽出され、それらの単語とその単語の出現回数が文字列として組み合わされ結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールと判定されたと確認する方法。
  6. 受信したメール本文から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行を削除し、その中から数列を用いてこれらの行を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行が削除され、その中から同じ数列を用いてこれらの行が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認する方法。
  7. 受信したメール本文から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行を削除し、その中から数列を用いてこれらの文字を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行が削除され、その中から同じ数列を用いてこれらの文字が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認する方法。
  8. 受信したメール本文から抽出されたURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIへアクセスした場合に、httpリダイレクト、CGI、ドメインネームサーバなどによりメール本文の表記とは異なるURIへ誘導された先のURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラム。
  9. 受信したメール本文から抽出されたURIへアクセスを行い、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された場合にその誘導された先のURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラム。
  10. 受信したメール本文から抽出されたURIへアクセスを行い、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された場合にその誘導された先のURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIへアクセスした場合に、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された先のURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラム。
  11. 受信したメール本文から、単語データベースに存在する単語を抽出し、その中からさらに数列を用いて単語を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、単語データベースに存在する単語が抽出され、その中からさらに同じ数列を用いて単語が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラム。
  12. 受信したメール本文から、単語データベースに存在する単語を抽出し、抽出された単語を一定の規則で並び替えその出現回数を計算し、その中からさらに数列を用いて単語を複数抽出し、それらの単語とその単語の出現回数を文字列として組み合わせ結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、単語データベースに存在する単語が抽出され、抽出された単語が同じ一定の規則で並び替えられその出現回数が計算され、その中からさらに同じ数列を用いて単語が複数抽出され、それらの単語とその単語の出現回数が文字列として組み合わされ結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールと判定されたと確認することを実行させるためのプログラム。
  13. 受信したメール本文から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行を削除し、その中から数列を用いてこれらの行を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行が削除され、その中から同じ数列を用いてこれらの行が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラム。
  14. 受信したメール本文から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行を削除し、その中から数列を用いてこれらの文字を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行が削除され、その中から同じ数列を用いてこれらの文字が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラム。
  15. 受信したメール本文から抽出されたURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIへアクセスした場合に、httpリダイレクト、CGI、ドメインネームサーバなどによりメール本文の表記とは異なるURIへ誘導された先のURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  16. 受信したメール本文から抽出されたURIへアクセスを行い、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された場合にその誘導された先のURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  17. 受信したメール本文から抽出されたURIへアクセスを行い、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された場合にその誘導された先のURIのハッシュ値情報が、過去に迷惑メールとして判定されたメールのデータベースから、URIのハッシュ値情報を検索し、過去に迷惑メールとして判定された文面に記載されているURIへアクセスした場合に、httpリダイレクト、CGI、ドメインネームサーバなどにより表記とは異なるURIへ誘導された先のURIのハッシュ値情報と一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  18. 受信したメール本文から、単語データベースに存在する単語を抽出し、その中からさらに数列を用いて単語を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、単語データベースに存在する単語が抽出され、その中からさらに同じ数列を用いて単語が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  19. 受信したメール本文から、単語データベースに存在する単語を抽出し、抽出された単語を一定の規則で並び替えその出現回数を計算し、その中からさらに数列を用いて単語を複数抽出し、それらの単語とその単語の出現回数を文字列として組み合わせ結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、単語データベースに存在する単語が抽出され、抽出された単語が同じ一定の規則で並び替えられその出現回数が計算され、その中からさらに同じ数列を用いて単語が複数抽出され、それらの単語とその単語の出現回数が文字列として組み合わされ結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールと判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  20. 受信したメール本文から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行を削除し、その中から数列を用いてこれらの行を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行が削除され、その中から同じ数列を用いてこれらの行が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  21. 受信したメール本文から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行を削除し、その中から数列を用いてこれらの文字を複数抽出し、それらを結合し生成した文字列のハッシュ値情報を、過去に迷惑メールとして判定されたメールのデータベースから検索し、過去に迷惑メールとして判定された文面から、音標文字以外の文字、隣り合わせで同じ文字が重なっている文字や空白行が削除され、その中から同じ数列を用いてこれらの文字が複数抽出され、それらを結合し生成された文字列のハッシュ値情報と、一致するものがあった場合には、この受信したメールが過去に迷惑メールとして判定されたと確認することを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005064593A 2005-02-08 2005-02-08 報告型迷惑メールフィルタリングシステム Pending JP2006221586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005064593A JP2006221586A (ja) 2005-02-08 2005-02-08 報告型迷惑メールフィルタリングシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005064593A JP2006221586A (ja) 2005-02-08 2005-02-08 報告型迷惑メールフィルタリングシステム

Publications (1)

Publication Number Publication Date
JP2006221586A true JP2006221586A (ja) 2006-08-24

Family

ID=36983863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005064593A Pending JP2006221586A (ja) 2005-02-08 2005-02-08 報告型迷惑メールフィルタリングシステム

Country Status (1)

Country Link
JP (1) JP2006221586A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234403A (ja) * 2007-03-22 2008-10-02 Fujitsu Ltd データ検索方法、プログラム及び装置
JP2010506247A (ja) * 2006-09-30 2010-02-25 アリババ グループ ホールディング リミテッド 迷惑情報をフィルタリングするネットワークベースの方法および装置
JP2011523130A (ja) * 2008-06-02 2011-08-04 コーポレーション ド レコール ポリテクニーク ド モントリオール ファイルの存在検出とモニタリング

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010506247A (ja) * 2006-09-30 2010-02-25 アリババ グループ ホールディング リミテッド 迷惑情報をフィルタリングするネットワークベースの方法および装置
US8326776B2 (en) 2006-09-30 2012-12-04 Alibaba Group Holding Limited Network-based method and apparatus for filtering junk messages
JP2008234403A (ja) * 2007-03-22 2008-10-02 Fujitsu Ltd データ検索方法、プログラム及び装置
JP2011523130A (ja) * 2008-06-02 2011-08-04 コーポレーション ド レコール ポリテクニーク ド モントリオール ファイルの存在検出とモニタリング
US9264434B2 (en) 2008-06-02 2016-02-16 Polyvalor, Limited Partnership File presence detection and monitoring

Similar Documents

Publication Publication Date Title
CN102521734B (zh) 在基于对话的电子邮件系统中显示扩展的消息
US8065152B2 (en) Platform for enabling voice commands to resolve phoneme based domain name registrations
US20050198180A1 (en) Method and system for providing automatic email address book
EP2896162B1 (en) Determining additional information associated with geographic location information
CN105991398A (zh) 一种即时通信im聊天记录的保存方法及装置
US20170068740A1 (en) Method and system for web searching
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
CN104919452A (zh) 使用图像来改善人搜索
WO2013085409A1 (ru) Способ анимации sms-сообщений
KR100751052B1 (ko) 네트워크 기반의 실시간 지도 및 위치정보 제공방법 및시스템
JP4445243B2 (ja) 迷惑メール遮断方法
US20040267895A1 (en) Search system using real name and method thereof
JP2006221586A (ja) 報告型迷惑メールフィルタリングシステム
US11615164B2 (en) Dynamic website creation system and method
JP2009093325A (ja) 情報編集装置及びプログラム
JP2006338494A (ja) 正当サイト検証方法、装置、およびプログラム
KR100459379B1 (ko) 유사 전자문서 판단을 위한 기초데이터 생성방법 및 그시스템
JP5182767B2 (ja) 商標サーバ装置および商標抽出方法
JP2004040304A (ja) 電子メールアドレス管理方法およびプログラム、電子メール端末装置
JP5657259B2 (ja) 情報処理装置、通信端末、興味情報提供方法および興味情報提供プログラム
US20230004619A1 (en) Providing smart web links
JP2009003744A (ja) 事例検索システムおよび事例検索方法
JP2005515555A (ja) 特定電話番号を構成する数個の番号を順番に組合せて合成する数字列により特定の電子メールアドレスを検索する方法
JP2017157023A (ja) 情報処理装置、及び、情報処理システム
JP2008191894A (ja) Webサーバ