JP2007233468A

JP2007233468A - 情報処理装置、及び、情報処理方法

Info

Publication number: JP2007233468A
Application number: JP2006051089A
Authority: JP
Inventors: Akinori Furuta; 明徳古田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2006-02-27
Filing date: 2006-02-27
Publication date: 2007-09-13

Abstract

【課題】最新の迷惑メールにも対応した即応性があり、多言語にも対応した汎用性の高い迷惑メールのフィルタリングを行う。
【解決手段】迷惑メール分析部１２は、受信したメールを句読点、空白、改行を区切りとして分割する。検索サイトアクセス部１３は、メールを分割して得られた検索文字列（Ｉ）を検索サイト５に送信する。検索サイト５は、検索文字列（Ｉ）と同じ文字列を含むＷｅｂページを検索する。迷惑メール判定部１４は、検索サイト５の検索結果をもとに、受信したメールと迷惑メールサイト４に公開された迷惑メールとが同じものであるか否かを判断する。
【選択図】図４

Description

本発明は、電子メールが迷惑メールか否かを判定する情報処理装置、及び、情報処理方法に関する。

従来、不特定多数のユーザに対して営利目的のメールを無差別に大量配信する、いわゆる、スパムメール（以下、迷惑メールと記す）が問題となっている。迷惑メールは、ユーザに不快感を与えるだけではなく、メールサーバでは大量のメールの処理に追われてサーバがダウンしたり、他のメールの配送が遅延したりといった被害を被ることがある。

迷惑メールに対処するため、現在、ネットワークを用いたメールフィルタリングシステム、発信元ＩＰ（Internet Protocol）アドレスでフィルタするフィルタリング装置、パターンファイルを用いたアンチウィルスソフトなどが開発されている。

ネットワーク用いたメールフィルタリングシステムは、システムに登録しているユーザから迷惑メールを収集し、メールヘッダの構造など迷惑メールに見られる特徴を解析する。そして、受信したメールが迷惑メールの特徴を備えている場合、受信したメールを迷惑メールと判定する（例えば、特許文献１）。

発信元ＩＰアドレスでフィルタするフィルタリング装置は、迷惑メールを発信するＩＰアドレスの範囲を記憶し、特定のＩＰアドレスのメールを迷惑メールと判定する。フィルタリング装置は、ＩＰパケット、ＳＭＴＰ（Simple Mail Transfer Protocol）トランザクションなどによりフィルタリングするＩＰアドレスのデータベースを更新している。

パターンファイルを用いたアプリケーションソフトは、メールの文面を解析する高度な言語分析能力を利用し、特定の語句（性的、暴力的、恐喝的）の辞書を更新し、特定のキーワードや文の構造から迷惑メールか否かを判定している（例えば、特許文献２）。

特開２００４−２４８１３５号公報特開２００４−２２０６１３号公報

しかしながら、ネットワークを用いたメールフィルタリングシステムは、システム登録したユーザから構成される閉じたシステムである。迷惑メールに関する情報は、限られたユーザからしか入手することができない。また、ネットワークを用いたメールフィルタリングシステムは、迷惑メールを収集し、迷惑メールの特徴を解析するまでのタイムラグが発生するため最新の迷惑メールに対応した即応性があるとはいえない。

また、発信元ＩＰアドレスでフィルタするフィルタリング装置は、ロボットや大人数の広告宣伝請負要員などにより、メールアカウントが分散されると、送信元のＩＰアドレスが広域に渡り、データベースの範囲外におよぶことがある。

さらに、パターンファイルを用いたアプリケーションソフトは、パターンファイルの更新周期の短縮化に限界があり、新しい迷惑メールを検出できないという問題がある。さらに、欧米で開発されたアプリケーションソフトの多くが欧米の言語に対応しているため、他言語の迷惑メールに対する判定確度が低い。

本発明は、上述した課題に鑑みてなされたものであり、最新の迷惑メールにも対応した即応性があり、多言語にも対応した汎用性の高いフィルタリング装置、及び、フィルタリング方法を提供することを目的とする。

上述した目的を達成するため、本発明は、受信した電子メールを複数の文字列に分割し、電子メールを分割して得られる文字列の少なくとも１つをキーワードとしてインターネット上に存在する検索サイトに送信することにより、上記キーワードを含むＷｅｂページの検索を当該検索サイトに依頼し、検索サイトの検索結果をもとに、電子メールが迷惑メールであるか否かを判定する。

本発明によれば、電子メールを分割して得られる文字列の少なくとも１つの文字列を含むＷｅｂページの検索を、検索サイトに依頼し、検索サイトの検索結果に応じて、電子メールが迷惑メールか否かを判定する。本発明は、電子メールの分割、検索サイトへのアクセスなど単純な処理の組み合わせで実現でき判定アルゴリズムが明確である。また、インターネットは、多数のユーザによって更新されており、最新の迷惑メールに対応した即応性がある。検索サイトは、世界全体のＷｅｂページが検索でき、多言語にも対応している。

以下、図面を参照して本発明を適用した迷惑メール識別システムについて説明する。図１は、迷惑メール識別システム１の構成を示す模式図である。迷惑メール識別システム１では、メールを受信するユーザ端末２、ユーザ端末２に回線を提供するプロバイダ３、迷惑メールの文面を書き込んだ迷惑メールサイト４、ユーザ端末２が送信したメールと一致するＷｅｂページを検索する検索サイト５とを備える。

プロバイダ３は、インターネット接続業者であり、電話回線やデータ通信専用回線などを通じて、顧客である企業や家庭のコンピュータをインターネットに接続させる。プロバイダ３は、メールサーバ３１を備え、顧客サービスとして、メールアドレスの貸し出しを行う。メールサーバ３１はインターネットに常時接続され、自ネットワーク内のユーザのメールの送信や受信を行う。メールサーバ３１は、自ネットワーク内のユーザ宛てに送られてきたメールをメールボックスに保管し、ユーザからの問い合わせに対応して、メールボックスに保管した新規到着メールをユーザ端末２に転送する。

迷惑メールサイト４は、迷惑メールの被害者によって登録された迷惑メールの文面が公開されている。迷惑メールサイト４は、ウェブログ（以下、ブログと記す）や掲示板などのＷｅｂページからなり、不特定多数のユーザによって頻繁に更新されている。

検索サイト５は、インターネット上に存在し、指定されたキーワードを含むＷｅｂページを検索する。代表的な検索サイト５としては、検索エンジンを備えたポータルサイトがある。検索サイト５は、一般に公開されており、ＲＰＣ（Remote Procedure Call）などを用いてアクセスすることができる。

ユーザ端末２は、受信したメールが迷惑メールか否かを識別する迷惑メール識別部６と、電子メールの作成や送受信、受信したメールの保存・管理を行うＭＵＡ７（Mail User Agent）を備える。ＭＵＡ７は、受信メールを発信元などの情報に基づいて自動的に複数の受信箱に振り分けたり、メールアドレスを実名やあだ名に変換するアドレス帳管理機能を持つ。

図２に迷惑メール識別部６の構成を示す。迷惑メール識別部６は、プロバイダ３のメールサーバ３１に新規到着メールを問い合わせるメールサーバ接続部１１、メールサーバ３１から受信したメールの文面を検索文字列に分解する迷惑メール分析部１２、検索文字列を含むＷｅｂページの検索を検索サイト５に依頼する検索サイトアクセス部１３、検索サイト５の検索結果を元に受信したメールが迷惑メールか否かを判定する迷惑メール判定部１４、信頼できる発信元メールアドレスを記憶した信頼リスト１５を備える。

メールサーバ接続部１１は、プロバイダ３のメールサーバ３１に問い合わせ、ユーザのメールボックスに保管されたメールを受信する。

信頼リスト１５とは、信頼できる発信元メールアドレスを一覧できるリストである。発信元が信頼リスト１５に存在する場合、メールは迷惑メールの分析対象とならない。分析対象から外すことで、メールの内容が外部に漏れることを防止する。機密文書を送信すると想定されるメールアドレスを信頼リスト１５に登録すると、機密文書の盗聴を防止することができる。信頼リスト１５としての具体例として、ＭＵＡ７のアドレス帳、ＭＵＡ７の送信履歴などがある。

迷惑メール分析部１２は、受信したメールの発信元アドレスを読み出し、メールの発信元が信頼リスト１５に含まれるか検索する。メールの発信元が信頼リスト１５に含まれる場合、メールサーバ接続部１１は、受信したメールをＭＵＡ７に転送する。迷惑メール分析部１２は、このように受信したメールをＭＵＡ７に転送することにより、受信したメールの内容が検索対象として検索サイト５に送信されることを禁止する。

一方、メールの発信元がＭＵＡ７の信頼リスト１５に含まれない場合、迷惑メール分析部１２は、受信したメールの文面を検索文字列に分解する。図３を参照してメールの分割手順を説明する。迷惑メール分析部１２は、メール文書全体を文字配列ｂに代入する（ステップＳ２０）。このフローチャートにおいて、メールを構成する文字をｂ［ｉ］と表現する。ｉは、文字の位置を表す。例えば、メールの先頭文字はｂ［０］、２番目の文字はｂ［１］と表現する。

次いで、迷惑メール分析部１２は、検索文字列を格納する文字配列ｓに空文文字列“”を代入し（ステップＳ２１）、カウンタｉに０を代入する（ステップＳ２２）。

迷惑メール分析部１２は、ｂ［ｉ］が句読点でなく、ｂ［ｉ］が記号でなく、かつ、ｉがメールの終端でない場合（ステップＳ２３；ＮＯ）、文字配列ｓにｂ［ｉ］を加える（ステップＳ２４）。そして、ｉを１インクリメントする（ステップＳ２５）。

迷惑メール分析部１２は、ｂ［ｉ］が句読点、ｂ［ｉ］が記号、または、ｉがメールの終端である場合（ステップＳ２３；ＹＥＳ）、ｓが空文文字列か否か判別する（ステップＳ２６）。ｓが空文文字列でない場合（ステップＳ２６；ＮＯ）、ｓに代入された文字列を検索文字列とし出力する（ステップＳ２７）。そして、迷惑メール分析部１２は、ｓに空文文字列“”を代入して（ステップＳ２８）、ｉがメールの終端であるか否か判別する（ステップＳ２９）。ｉがメールの終端である場合（ステップＳ２９；ＹＥＳ）、メールの分割処理を終了する。一方、ｉがメールの終端でない場合（ステップＳ２９；ＮＯ）、ステップＳ２５に移行する。

迷惑メール分析部１２の動作を具体的に説明する。ユーザが「有名人とお友達になろう！超有名人・歌手・アイドル・タレントとお知り合いになれる。参加資格があるのは、このメールを受け取った貴方です。参加希望の方は、以下のＵＲＬにアクセスしてね(^ -)☆」というメールを受信したとする。

ステップＳ２０において、文字配列ｂには、メール文書全体が代入される。ｂ［０］は、メールの先頭文字“有”である。ｂ［０］は、句読点でなく、記号でなく、さらに、ｉはメール終端でもないので、ステップＳ２３の分岐はＹＥＳとなる。そこで、ステップＳ２４に移行し、ｓに“有”が代入される。ステップＳ２５において、ｉを１インクリメントすると、ｉは１となる。ｂ［ｉ］は、メールの２番目の文字“名”である。ｂ［１］は、句読点でなく、記号でなく、さらに、ｉはメールの終端でもないので、ステップＳ２３の分岐はＹＥＳとなる。そこで、ステップＳ２４に移行し、“有”の後に“名”が加えられる。ｓの内容は“有名”となる。

ステップＳ２３〜ステップＳ２５の処理を１２回繰り返すとｓに“有名人とお友達になろう”という文字が格納される。このとき、ｂ［１１］が“！”、すなわち記号となるため、ステップＳ２３の分岐がＮＯとなる。ｓは空文文字列ではないので、ステップＳ２６の分岐がＮＯとなり、“有名人とお友達になろう”が検索文字列として出力される。

本実施の形態では、句読点、空白、改行を区切りとして文面を分解している。メールの分解するには、この方法に限定されず、単語ごと、１文ごと、文字数ごと（例えば、５文字）で分解してもよい。

また、本実施の形態では、説明のため、メールの先頭から検索文字列（１）、検索文字列（２）、検索文字列（３）、検索文字列（４）、・・・・と検索文字列に番号を付す。特に、Ｗｅｂページ検索のキーワードとして使用する検索文字列を検索文字列（Ｉ）と記す。

検索サイトアクセス部１３は、検索文字列（Ｉ）を含むＷｅｂページの検索を検索サイト５に依頼する。検索サイト５とは、キーワードを入力すると、そのキーワードを含むＷｅｂページを検索するサイトである。検索サイト５は、一般に公開されており、ＲＰＣ（Remote Procedure Call）などを用いてアクセスすることができる。

検索サイト５は、検索サイトアクセス部１３から検索文字列（Ｉ）を入力すると、検索結果をユーザ端末２に送信する。検索結果には、検索文字列（Ｉ）と同じ文字列を含むＷｅｂページのＵＲＬ（Uniform Resource Locator）、キャッシュ内容、関連度合い、更新日時などが含まれる。キャッシュ内容は、検索されたＷｅｂページから検索文字列の前後３行程度を抜き出したものである。検索サイトアクセス部１３は、検索結果を迷惑メール判定部１４に出力する。

迷惑メール判定部１４は、検索結果を元に受信したメールが迷惑メールか否かを判定する。迷惑メールの判定には、検索一致数、キャッシュ内容などを利用する。検索一致数とは、ヒットしたＷｅｂページの数である。迷惑メール判定部１４は、受信したメールに含まれる検索文字列（Ｉ）と同じ文字列が多数のＷｅｂページに公開されている場合、受信したメールを迷惑メールである可能性が高いメールであると判定する。

また、迷惑メール判定部１４は、キャッシュ内容と検索文字列とを照合し、検索文字列（Ｉ）、検索文字列（Ｉ＋１）、検索文字列（Ｉ＋２）・・・というように、受信したメールと同じ検索文字列が複数含まれるとき、受信したメールを迷惑メールである可能性が高いメールであると判定する。

さらに、迷惑メール判定部１４は、キャッシュ内容と検索文字列とを照合し、検索文字列（Ｉ）、検索文字列（Ｉ＋１）、検索文字列（Ｉ＋２）・・・というように、受信したメールと同じ順序で検索文字列が並んでいるとき、受信したメールを迷惑メールである可能性が高いメールであると判定する。

迷惑メール判定部１４は、上述した判定方法を組み合わせて迷惑メールの判定確度を上げたり、判定条件を高くして判定確度を上げたりする。

例えば、迷惑メール判定部１４は、検索一致数を計数し、検索一致数と所定の閾値Ｔｈ_１とを比較する。そして、検索一致数が所定の閾値Ｔｈ_１を超えている場合、迷惑メール判定部１４は、検索文字列（Ｉ）、検索文字列（Ｉ＋１）、検索文字列（Ｉ＋２）、・・・、検索文字列（Ｍ）など複数の文字列がキャッシュ内容に含まれるか否かを検索し、検索した文字列が全てキャッシュ内容に含まれる場合には、受信したメールを迷惑メールと判定する。この判定方法では、検索一致数と、文字列の数との２つの判定方法を組み合わせることにより、判定の確度を上げている。

また、迷惑メール判定部１４は、検索サイト５から受信したキャッシュ内容と検索文字列とを照合し、検索文字列（Ｉ）、検索文字列（Ｉ＋１）、検索文字列（Ｉ＋２）、・・・、検索文字列（Ｎ）というように、Ｎ個の検索文字列が受信したメールと同じ順序で並んでいるとき、受信したメールを迷惑メールであると判定する。この場合、Ｎの値を十分大きくすることにより判定の確度を上げている。

検索一致数の閾値Ｔｈ_１、検索文字列の個数Ｍ、Ｎは、検索文字列の長さなどに応じて異なる。検索文字列の文字数が長い場合、閾値Ｔｈ_１、Ｍ、Ｎの値を小さく設定したほうがよく、逆に、検索文字列の文字数が短い場合、閾値Ｔｈ_１、Ｍ、Ｎの値を大きく設定したほうがよい。

迷惑メール判定部１４は、判定結果をＭＵＡ７に出力する。ＭＵＡ７は、迷惑メールと判定されたメールには、受信したメールが迷惑メールであることを示す接頭辞、例えば、「迷惑メール」をメールの題名に付けたり、受信したメールを迷惑メール専用フォルダに転送する。

本発明を適用した迷惑メール識別システム１では、受信したメールの一部である検索文字列をキーワードとして、検索文字列と同じ文字列を含むＷｅｂページを検索する。そして、Ｗｅｂページの文面と受信したメールの文面とが一致したり、受信したメールに含まれる検索文字列と同じ文字列を含むＷｅｂページが多数存在したりする場合には、受信したメールを迷惑メールと判定する。

なお、本実施の形態では、１つの検索文字列（Ｉ）をキーワードとして、Ｗｅｂページを検索したが、複数の検索文字列をキーワードとすることもできる。複数の検索文字列をキーワードとした場合、キーワードとした全ての検索文字列と同じ文字列を含むＷｅｂページが検索される。

次いで、図４のフローチャートを参照して迷惑メール識別システム１の動作を説明する。ユーザは、ＭＵＡ７を操作してメールの取得を指示する。ＭＵＡ７は、メールの取得要求をメールサーバ接続部１１に出力する（ステップＳ１）。メールサーバ接続部１１は、プロバイダ３のメールサーバ３１に新規到着メールを問い合わせる（ステップＳ２）。プロバイダ３のメールサーバ３１は、ユーザのメールボックスに保存された新規到着メールをメールサーバ接続部１１に転送する（ステップＳ３）。メールサーバ接続部１１は、受信したメールを迷惑メール分析部１２に出力する（ステップＳ４）。迷惑メール分析部１２は、受信したメールの送信元が信頼リスト１５に含まれるか否かをチェックし（ステップＳ５）、含まれる場合には（ステップＳ５；ＹＥＳ）、受信したメールを迷惑メールでないと判断する（ステップＳ６）。

受信したメールの送信元が信頼リスト１５に含まれない場合（ステップＳ５；ＮＯ）、迷惑メール分析部１２は、受信したメールを検索文字列に分解し（ステップＳ７）、キーワードとなる検索文字列（Ｉ）を検索サイト５に送信する（ステップＳ８）。検索サイト５は、検索文字列（Ｉ）と同じ文字列を含むＷｅｂページを検索し（ステップＳ９）、検索結果をユーザ端末２に送信する（ステップＳ１０）。

迷惑メール判定部１４は、検索サイトアクセス部１３から受信した検索結果をもとに、受信したメールが迷惑メールか否かを判定する（ステップＳ１１）。メールサーバ接続部１１は、受信したメールと迷惑メール判定部１４の判定結果をＭＵＡ７に出力する（ステップＳ１２）。ＭＵＡ７は、受信したメールが迷惑メールと判定された場合（ステップＳ１３；ＹＥＳ）、このメールの表題に「迷惑メール」という接頭辞を付し、迷惑メールであることをユーザに通知する（ステップＳ１４）。一方、受信したメールが迷惑メールでないと判断した場合、ＭＵＡ７は、受信したメールを通常のメールとして処理する（ステップＳ１５）。

以上説明したように、本発明を適用した迷惑メール識別システム１は、受信したメールを適当な検索文字列に分割し、検索文字列（Ｉ）をキーワードとして、このキーワードを含むＷｅｂページを検索する。受信したメールが迷惑メールである場合、迷惑メールサイト４に公開された迷惑メールの文面と検索文字列（Ｉ）とが一致する。迷惑メール判定部１４は、検索サイト５の検索結果をもとに、受信したメールと迷惑メールサイト４に公開された迷惑メールとが同じものであるか否かを判断する。

従来の迷惑メール識別ソフトには、発信元ＩＰアドレスでフィルタするもの、メールヘッダ解析を行うもの、パターンファイルを用いて特定のキーワードや文の構造から迷惑メールか否かを判定しているものなどがある。

パターンファイルを利用した迷惑メール識別ソフトは、パターンファイルが更新されるまでは全く無力であるが、本発明を適用した迷惑メール識別システム１は、一般の検索サイト５を利用しているため更新が不要である。また、本発明を適用した迷惑メール識別システム１は、迷惑メールと判定する過程が非常に単純で、迷惑メールと判断した根拠をユーザが確かめることができる。

パターンファイルを利用した迷惑メール識別ソフトやメールヘッダ解析を行うアプリケーションソフトでは、メールの文面を解析する高度な言語分析能力を必要とし、特定の語句（性的、暴力的、恐喝的）の辞書を更新し、分析結果を蓄積するデータベースを維持する必要がある。本発明を適用した迷惑メール識別システム１では、メールの文面を句読点など分かりやすい文字で区切るだけであり、ユーザ端末２の演算能力や記憶容量に負担をかけない。

また、発信元ＩＰアドレスで迷惑メールを識別する迷惑メール識別ソフトは、プロバイダ３のような通信インフラを管理できる立場でないと使用できない仕組みであり、ユーザが管理することができない。本発明を適用した迷惑メール識別システム１は、ユーザサイドで管理可能である。

さらに、従来の迷惑メール識別ソフトには、欧米で開発されたものが多く、日本語の迷惑メールの判定確度が低かった。本発明を適用した迷惑メール識別システム１では、検索サイト５を利用しているため言語に依存せず、多言語に対応している。

また、本発明を適用した迷惑メール識別システム１では、信頼リスト１５に基づいて、信頼できる発信元のメールアドレスから送信されたメールについては分析対象から除外することができるため、機密文書等の内容が外部に漏れることを防止することができ、セキュリティを向上させることができる。

次いで、本発明を適用した他の迷惑メール識別システム１００について説明する。図５に示す迷惑メール識別システム１００は、迷惑メール識別システム１００のユーザにのみ公開されたプライベート検索サイト２１、迷惑メール識別システム１００のユーザが迷惑メールを登録する迷惑メール管理サイト２２、迷惑メール管理サイト２２に迷惑メール情報を提供する情報提供部２３、迷惑メール情報を提供したユーザにポイントなどのサービスを提供する提供情報整理サイト２４、迷惑メールの収集を行う囮サイト２５とを備える。なお、図１の迷惑メール識別システム１と同じ構成は、同符号を付して説明を省略する。

プライベート検索サイト２１は、検索サイト５にセキュリティ機能を付加したものである。プライベート検索サイト２１とユーザ端末２との間は、ＳＳＬ通信などの安全なプロトコルを用いる。プライベート検索サイト２１は、キーワードとなる検索文字列（Ｉ）やユーザのＩＰ（Internet Protocol）アドレスなどを外部に漏らさないセキュリティ機能を備えている。プライベート検索サイト２１を有料で運営することにより、プライベート検索サイト２１の運営者は、利益を得ることができる。

情報提供部２３は、ユーザ端末２に設けられており、ユーザが受信した迷惑メールを迷惑メール管理サイト２２に登録する。迷惑メール管理サイト２２は、迷惑メールを収集、整理して迷惑メールを公開する。

提供情報整理サイト２４は、迷惑メールを報告したユーザに対してポイントを付与する。ポイントは、例えば、プライベート検索サイト２１のアクセス権に還元される。これは、プライベート検索サイト２１の運営者とユーザとの両方の利益となる。

囮サイト２５は、囮用の囮メールアドレスをＷｅｂページに公開する。そして、囮メールアドレス宛てのメールを自動的に回収する。囮メールアドレス宛てのメールは、迷惑メールである可能性が高い。迷惑メール管理サイト２２は、囮サイト２５が自動回収したメールとユーザから提供された迷惑メールとを照合して、迷惑メールの確度を上げる。

以上説明したように、迷惑メール識別システム１００は、検索サイト５のセキュリティを向上させるとともに、迷惑メール識別システム１００のユーザからの迷惑メール情報を促すような構成になっている。また、迷惑メールを提供したユーザには、ポイントなどのサービスを還元し、迷惑メール識別システム１００とユーザとの両方が利益を得る。

迷惑メール識別システムの構成を示す模式図である。迷惑メール識別部の構成を示すブロック図である。受信メールの分割処理の手順を説明するフローチャートである。迷惑メール識別システムの動作を説明するフローチャートである。迷惑メール識別システムの構成を示すブロック図である。

符号の説明

１，１００迷惑メール識別システム、２ユーザ端末、３プロバイダ、４迷惑メールサイト、５検索サイト、６迷惑メール識別部、７ＭＵＡ、１１メールサーバ接続部、１２迷惑メール分析部、１３検索サイトアクセス部、１４迷惑メール判定部、１５信頼リスト、２１プライベート検索サイト、２２迷惑メール管理サイト、２３情報提供部、２４提供情報整理サイト、２５囮サイト

Claims

電子メールを受信する電子メール受信部と、
上記電子メールを複数の文字列に分割する電子メール分析部と、
上記電子メールを分割して得られる文字列の少なくとも１つをキーワードとしてインターネット上に存在する検索サイトに送信することにより、上記キーワードを含むＷｅｂページの検索を当該検索サイトに依頼する検索サイトアクセス部と、
上記検索サイトの検索結果をもとに、上記電子メールが迷惑メールであるか否かを判定する迷惑メール判定部と
を備えることを特徴とする情報処理装置。
上記迷惑メール判定部は、上記キーワードと同じ文字列を含むＷｅｂページが存在するか否かによって、上記電子メールは迷惑メールであるか否かを判定することを特徴とする請求項１記載の情報処理装置。
上記迷惑メール判定部は、上記キーワードと同じ文字列を含むＷｅｂページの数をもとに、上記電子メールが迷惑メールであるか否かを判定することを特徴とする請求項１記載の情報処理装置。
上記迷惑メール判定部は、上記検索サイトの検索結果として取得したキャッシュ内容に上記電子メールを分割して得られる文字列が複数存在するか否かによって、上記電子メールが迷惑メールであるか否かを判定することを特徴とする請求項１記載の情報処理装置。
上記迷惑メール判定部は、上記検索サイトの検索結果として取得したキャッシュ内容に、上記電子メールと同じ順序で文字列が並んでいるか否かによって、上記電子メールが迷惑メールであるか否かを判定することを特徴とする請求項１記載の情報処理装置。
信頼できる電子メールの送信元アドレスを記憶する信頼リスト記憶部を有し、
上記電子メール分析部は、上記電子メールの送信元アドレスが信頼リスト記憶部に存在する場合、当該電子メールを迷惑メールでないと判定し、上記検索サイトへの上記キーワードの送信を禁止する
ことを特徴する請求項１記載の情報処理装置。
電子メールを受信する電子メール受信工程と、
上記電子メールを複数の文字列に分割する電子メール分割工程と、
上記電子メールを分割して得られる文字列の少なくとも１つをキーワードとしてインターネット上に存在する検索サイトに送信することにより、上記キーワードを含むＷｅｂページの検索を当該検索サイトに依頼する検索サイトアクセス工程と、
上記検索サイトの検索結果をもとに、上記電子メールが迷惑メールであるか否かを判定する迷惑メール判定工程と
を有することを特徴とする情報処理方法。