JP2005072672A - Feedback learning system for electronic mail classification distributing apparatus, and feedback learning program thereof - Google Patents

Feedback learning system for electronic mail classification distributing apparatus, and feedback learning program thereof Download PDF

Info

Publication number
JP2005072672A
JP2005072672A JP2003209000A JP2003209000A JP2005072672A JP 2005072672 A JP2005072672 A JP 2005072672A JP 2003209000 A JP2003209000 A JP 2003209000A JP 2003209000 A JP2003209000 A JP 2003209000A JP 2005072672 A JP2005072672 A JP 2005072672A
Authority
JP
Japan
Prior art keywords
mail
classification
information
learning
feedback learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003209000A
Other languages
Japanese (ja)
Other versions
JP3804017B2 (en
Inventor
Romero Tim
ティム・ロメロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VANGUARD KK
Original Assignee
VANGUARD KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VANGUARD KK filed Critical VANGUARD KK
Priority to JP2003209000A priority Critical patent/JP3804017B2/en
Publication of JP2005072672A publication Critical patent/JP2005072672A/en
Application granted granted Critical
Publication of JP3804017B2 publication Critical patent/JP3804017B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a feedback learning system for electronic mail classification distributing apparatus and a feedback learning program thereof, capable of properly classifying and distributing electronic mails using simple operations. <P>SOLUTION: Upon the receipt of distributed electronic mails, the electronic mail classification distribution apparatus 1 creates feedback learning information and stores the information to a database 13 and makes classification criteria of the information on the basis of a prescribed algorithm. When the server classification criteria of the distributed electronic mails, received from the apparatus 1, differ from recipient classification criteria, an electronic mail reception terminal 4 creates learning mail and returns the learning mail attached with the recipient classification criteria to the electronic mail classification distributing apparatus 1. The electronic mail classification distributing apparatus 1 extracts the feedback learning information from the database 13, on the basis of the learning mail and carries out feedback learning of a classification criteria means 14, by using the server classification criteria information and the recipient classification criteria information. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、電子メール分類配信装置のフィードバック学習システム及びそのフィードバック学習プログラムに関する。
【0002】
【従来技術】
従来より、電子メールのヘッダ情報や、キーワード、文章パターン等の所定のルールに基づいて、電子メールが必要なメールであるか、それともジャンクメール(スパムメール)などの不要なメールであるかを判断するフィルタリングソフトや、電子メールの内容に基づいて適切に分類するソフトが存在する。
【0003】
そして更に、ユーザからのフィードバックを受けて学習を行い、不要メールであるか否かの判断や分類をより正確に行うことを目的としたものがある(例えば、特許文献1参照)。
【0004】
このような電子メールの分類ソフトは、主としてクライアントサイド方式とサーバサイド方式に分けることができる。クライアントサイド方式は、電子メールのフィルタリングが電子メール受信クライアントのメールソフト、もしくはメールソフトに連携して行われ、ユーザ自身がグラフィカルなインターフェースを使用してフィルタリングソフトにフィードバック情報を与えて学習させている。一方、サーバサイド方式は、サーバ内で電子メールのフィルタリングを行うものである。ユーザは、サーバに接続し、インターフェースを使用してフィルタリングソフトにフィードバック情報を与えて学習させている。
【0005】
【特許文献1】
特開2003−67304号公報
【0006】
【発明が解決しようとする課題】
しかしながら、上記の従来技術の場合、通常のメール画面に加えて、その分類ソフト専用の操作を習熟する必要があり、また、キーワードや文章パターンなどのルールをユーザ自身が考えなければならず、適切に使用するには大変な労力が必要であった。
【0007】
また、サーバサイド方式の場合には、サーバにログインする操作を行わなければならず、専用のログインパスワードを覚える必要もあり、操作が煩雑で使い勝手がよくないという問題があった。また、フィードバック学習させるために、ジャンクメールを電子メール受信クライアントから電子メールサーバに転送すると、電子メールのヘッダ情報が変更されてしまい、正確な情報をフィードバックすることができないという問題があった。
【0008】
本発明は、上述の点に鑑みてなされたものであり、その目的は、簡単な操作で電子メールを適切に分類して配信することができる電子メール分類配信装置のフィードバック学習システム及びそのフィードバック学習プログラムを提供することにある。
【0009】
【課題を解決するための手段】
上記課題を解決する請求項1に記載の発明による電子メール分類配信装置のフィードバック学習システムは、電子メール送信端末から送信された電子メールを受け取り、その電子メールが予め設定されている複数の分類のいずれに属するかのサーバ分類判断を行い、そのサーバ分類判断の結果をサーバ分類判断情報として電子メールに付して電子メール受信端末に配信する電子メール分類配信装置のフィードバック学習システムにおいて、電子メール分類配信装置は、電子メール送信端末から電子メールを受け取ると、その電子メールが有する情報に基づいてフィードバック学習情報を作成してデータベースに格納し、電子メール受信端末は、電子メール分類配信装置から電子メールの配信を受けると、電子メールが有する情報に基づいてデータベースを検索するための検索情報を内容とする学習用メールを作成し、電子メール受信端末を操作する受信者によって行われた電子メールが複数の分類のいずれに属するかの分類判断の結果を受信者分類判断情報として学習用メールに付して電子メール分類配信装置に返信し、電子メール分類配信装置は、学習用メールを受け取ると、学習用メールの内容に基づきデータベース内を検索して電子メールのフィードバック学習情報を取り出し、そのフィードバック学習情報と、サーバ分類判断情報及び受信者分類判断情報とを用いて分類判断のフィードバック学習を行うことを特徴とする。
【0010】
この発明によれば、電子メール受信端末から電子メール分類配信装置に学習用メールを返信すると、その学習用メールをトリガとして電子メール分類配信装置がサーバ分類判断のフィードバック学習を行う。したがって、電子メール受信端末の操作者である受信者は、学習用メールを返信するだけでよく、従来のように、メールソフトの他にフィルタリングソフト専用の操作を習熟する必要がない。また、従来のサーバサイド方式のように、ログイン手続やログインパスワードを覚える必要もない。
【0011】
また、電子メール分類配信装置は、学習用メールの内容に基づいてデータベースからフィードバック学習情報を取り出し、そのフィードバック学習情報を使用してフィードバック学習を行うので、正確な情報を用いてフィードバック学習することができる。したがって、従来のように、電子メールの転送によってヘッダ情報が変更されて正確な情報をフィードバックすることができないという問題は生じない。
【0012】
請求項2に記載の発明は、請求項1に記載の電子メール分類配信装置のフィードバック学習システムにおいて、フィードバック学習情報は、電子メールのコピーであることを特徴とする。
【0013】
この発明によると、電子メール分類配信装置は、フィードバック学習情報の作成処理において、電子メールのコピーを作成するだけでよい。したがって、簡単にフィードバック学習情報を作成することができ、装置全体の処理速度を早くすることができる。また、学習用メールの内容に基づいてデータベースを検索する際に、より多くの検索要素を得ることができ、検索を容易に行うことができる。
【0014】
請求項3に記載の発明は、請求項1に記載の電子メール分類配信装置のフィードバック学習システムにおいて、フィードバック学習情報は、電子メールが有する情報に含まれている所定のキーワードとその登場回数からなることを特徴とする。
【0015】
この発明によると、データベースには、所定のキーワードとその登場回数を内容とするフィードバック学習情報を格納するだけでよく、データベースに格納する情報量を少なくすることができる。したがって、データベースの容量を小さくすることができ、設備の低コスト化を図ることができる。
【0016】
また、電子メールのコピーをそのまま格納した場合と比較して、データの流出などが生じた場合にも、キーワードとその登場回数から電子メールの内容までをも把握することはできず、セキュリティー面で安心である。
【0017】
更に、サーバ分類判断のアルゴリズムがキーワードとその登場回数に基づいて判断するものである場合には、電子メールの受信時に作成したフィードバック学習情報をサーバ分類判断時に再利用することができ、サーバ分類判断の処理速度を向上させることができる。
【0018】
請求項4に記載の発明は、請求項1〜3のいずれかに記載の電子メール分類配信装置のフィードバック学習システムにおいて、検索情報は、電子メールのヘッダ情報のうち、Fromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダの少なくとも一つに記載されている情報を含むことを特徴とする。
【0019】
この発明は、検索情報の内容を特定したものであり、これによれば、検索情報は、電子メールのヘッダ情報のうち、Fromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダの少なくとも一つに記載されている情報を含む。
【0020】
一般的に電子メールのヘッダ情報は転送によって変更され、その変更内容も、メールソフトに応じて個々に異なり、規則性はない。しかし、ヘッダ情報のうち、Fromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダは、そのままコピーされて転送される場合が多い。したがって、検索情報として、これらの情報を用いることによって、データベースの検索時に、該当するフィードバック学習情報を容易に見つけることができる。
【0021】
請求項5に記載の発明は、請求項1〜3のいずれかに記載の電子メール分類配信装置のフィードバック学習システムにおいて、検索情報は、電子メールのコンテンツのコピーを含むことを特徴とする。
【0022】
この発明は、検索情報の内容を特定したものであり、これによれば、検索情報は、電子メールのコンテンツのコピーを含むので、データベースの検索時に、コンテンツの内容に基づいた検索を行うことができ、該当するフィードバック学習情報を確実に見つけることができる。
【0023】
請求項6に記載の発明は、請求項1〜5のいずれかに記載の電子メール分類配信装置のフィードバック学習システムにおいて、学習用メールは、電子メールを電子メール受信端末から電子メール分類配信装置に転送する場合に作成される転送メールであることを特徴とする。
【0024】
この発明は、上述の請求項1〜5に記載した発明における学習用メールの具体的な一例を示したものである。これによれば、電子メールを電子メール受信端末から電子メール分類配信装置に転送する場合に作成される転送メールを学習用メールとするので、学習用メールを容易に作成することができる。
【0025】
請求項7に記載の発明は、請求項1〜5のいずれかに記載の電子メール分類配信装置のフィードバック学習システムにおいて、学習用メールは、複数の電子メールのコピーを添付ファイルとして作成した転送メールであることを特徴とする。
【0026】
この発明は、上述の請求項1〜5に記載した発明における学習用メールの具体的な一例を示したものである。これによれば、学習用メールは、複数の電子メールのコピーを添付ファイルとしたものとして作成されるので、一の学習用メールで複数の電子メールのコピーをまとめて電子メール分類配信装置に返信することができる。したがって、1通ずつメール毎に転送する手間を省くことができ、受信者による電子メール受信端末の操作負担を軽減することができる。
【0027】
請求項8に記載の発明は、請求項1〜7のいずれかに記載の電子メール分類配信装置のフィードバック学習システムにおいて、複数の分類は、電子メールがジャンクメールであるか否かによって分類されていることを特徴とする。
【0028】
この発明は、上述の請求項1〜7に記載した発明の具体的な一例を示したものであり、これによれば、電子メールがジャンクメールであるか否かのサーバ分類判断のフィードバック学習を、より正確な情報であるフィードバック学習情報を用いて行うことができる。したがって、電子メール分類配信装置によるジャンクメールであるか否かの判断を受信者分類判断に一致するように、適切にフィードバック学習させることができる。
【0029】
請求項9に記載の発明は、請求項1〜7のいずれかに記載の電子メール分類配信装置のフィードバック学習システムにおいて、複数の分類は、電子メールが企業内に設定されている複数の部署のいずれに属するかによって分類されていることを特徴とする。
【0030】
この発明は、上述の請求項1〜7に記載した発明の具体的な一例を示したものであり、これによれば、電子メールが複数の部署のいずれに該当するものであるかのサーバ分類判断のフィードバック学習を、より正確な情報であるフィードバック学習情報を用いて行うことができる。したがって、電子メール分類配信装置によるサーバ分類判断を受信者分類判断に一致するように、適切にフィードバック学習することができる。
【0031】
請求項10に記載の発明による電子メール分類配信装置のフィードバック学習プログラムは、電子メール送信端末から送信された電子メールを受け取り、その電子メールが予め設定されている複数の分類のいずれに属するかのサーバ分類判断を行い、そのサーバ分類判断の結果をサーバ分類判断情報として電子メールに付して電子メール受信端末に配信する電子メール分類配信装置にサーバ分類判断についてのフィードバック学習を行わせるフィードバック学習プログラムであって、電子メール送信端末から受け取った電子メールが有する情報に基づいてフィードバック学習情報を作成してデータベースに格納し、電子メール受信端末によって前記電子メールに基づいて作成されデータベースを検索するための検索情報を内容とし電子メール受信端末を操作する受信者が行った電子メールが複数の分類のいずれに属するかの分類判断の結果である受信者分類判断情報が付された学習用メールを電子メール受信端末から受け取り、学習用メールの内容に基づきデータベース内を検索して電子メールのフィードバック学習情報を取り出し、フィードバック学習情報と、サーバ分類判断情報及び受信者分類判断情報とを用いて、電子メール分類配信装置にサーバ分類判断についてのフィードバック学習を行わせることを特徴とする。
【0032】
この発明によれば、電子メール受信端末から電子メール分類配信装置に学習用メールが返信されると、その学習用メールをトリガとして電子メール分類配信装置にサーバ分類判断についてのフィードバック学習を行わせる。したがって、電子メール受信端末の操作者である受信者は、学習用メールを返信するだけでよく、従来のように、メールソフトの他にフィルタリングソフト専用の操作を習熟する必要がない。また、従来のサーバサイド方式のように、ログイン手続やログインパスワードを覚える必要もない。
【0033】
また、フィードバック学習プログラムは、学習用メールの内容に基づいてデータベースからフィードバック学習情報を取り出し、そのフィードバック学習情報を使用して電子メール分類配信装置にサーバ分類判断についてのフィードバック学習を行わせるので、正確な情報を用いたフィードバック学習を行わせることができる。したがって、従来のように、電子メールの転送によってヘッダ情報が変更されて正確な情報をフィードバックすることができないという問題は生じない。
【0034】
【発明の実施の形態】
次に、本発明の実施の形態について図に基づいて説明する。
【0035】
図1及び図2は、本実施の形態を示すシステム概略図、図3は、データベースに格納されるフィードバック学習情報の一例を示す図、図4は、電子メール分類判断手段によって電子メールから抽出したキーワードとその登場回数を示すデータ、図5は、学習用メールのデータの一例を示す図である。
【0036】
本実施の形態における電子メール分類配信装置1は、電子メールの内容に基づいて電子メールを分類して配信するものであり、図1及び図2に示すように、インターネットなどのネットワーク2を介して電子メール送信端末3と電子メール受信端末4の両方にそれぞれ接続されている。
【0037】
電子メール送信端末3と電子メール受信端末4は、いわゆるパーソナルコンピュータによって構成されている。尚、電子メール送信端末3と電子メール受信端末4は、図1では各1個のみを記載しているが、少なくとも一以上であればよく、一般的には複数が存在している。
【0038】
電子メール受信端末4には、電子メールの作成及び送受信が可能な電子メールソフトが起動可能な状態でインストールされている。この電子メールソフトは、電子メール受信端末4から電子メール分類配信装置1に電子メールの配信を要求することによって電子メール分類配信装置1のユーザアカウント内に格納されている電子メールの配信を受ける電子メール受信手段5と、電子メール分類配信装置1にフィードバック学習させるための学習用メールを作成する学習用メール作成手段6と、電子メール受信手段5によって受信した電子メールが、例えば、red、green、blueなどの予め設定されている複数の分類のいずれに属するかを受信者自身が判断した結果である受信者分類判断情報を学習用メールに付して電子メール分類配信装置1に返信するメール返信手段7を有している。
【0039】
学習用メールは、電子メールが有する情報に基づいて電子メール分類配信装置1のデータベースを検索するための検索情報を内容とするものであり、例えば電子メールのヘッダ情報から抜き出したDateヘッダ、Fromヘッダ、Toヘッダ、Subjectヘッダとメール本文等のコンテンツのコピーとを内容とする。そして、受信者が受信した電子メールからフィードバック学習に用いることを希望する任意の電子メールを選択し、電子メール受信端末4のモニター上に表示されている複数の分類ボタン(例えばred、green、blue)のうち、該当する分類ボタンをクリックすることによって作成される。そして、その作成された学習用メールには、選択された分類ボタンに対応する受信者分類判断情報(例えばredの分類ボタンを選択した場合にはred)が付されるように構成されている。
【0040】
電子メール分類配信装置1は、電子メール送信端末3から送信された電子メールを受け取る受信手段11と、その電子メールが有する情報に基づいてフィードバック学習情報を作成するフィードバック学習情報作成手段12と、そのフィードバック学習情報を格納するデータベース13を有する。
【0041】
そして、受信手段11によって受信した電子メールが複数の分類(red、green、blue)のいずれに属するかについて電子メールが有する情報を判断要素として所定のアルゴリズムに基づき分類判断する電子メール分類判断手段14と、そのサーバ分類判断の結果をサーバ分類判断情報として電子メールに付して格納するユーザアカウント15と、電子メール受信端末4からの要求に応じてユーザアカウント15内の電子メールを電子メール受信端末4に送信する送信手段16を有する。
【0042】
また、電子メール分類配信装置1は、電子メール受信端末4からフィードバック学習のために送られてきた学習用メールを受け取る学習用メール受信手段17と、その学習用メールに付されている受信者分類判断情報に応じて学習用メールを分類して格納する複数のフィードバックアカウント(red−fb、green−fb、blue−fb)18と、これらのフィードバックアカウント18内を監視し、新たな学習用メールの格納を認識すると、その学習用メールの内容に基づいてデータベース13内を検索し、電子メール受信端末4が学習用メールを作成するために使用した電子メールのフィードバック学習情報をデータベース13から取り出す電子メール検索手段19と、電子メール検索手段19によって取り出したフィードバック学習情報と、サーバ分類判断情報及び受信者分類判断情報とを用いて電子メール分類配信装置による分類判断のフィードバック学習を行うフィードバック学習手段20とを有している。これらの各手段は、電子メール分類配信装置1にインストールされたソフトウエアプログラムによって実現されている。
【0043】
次に、上記システムのフィードバック学習方法について、以下に説明する。まず、電子メールの送信者が受信者に電子メールを送信するために、受信者のメールアドレス「username1」に宛てて電子メール送信端末3から電子メールを送ると、その電子メールは、図1に示すように、電子メール分類配信装置1に送信される。電子メール分類配信装置1は、電子メールが有する情報に基づいてフィードバック学習情報を作成し、データベース13に格納する。フィードバック学習情報は、例えば図3に示すように、メール本文等のコンテンツ及びヘッダ情報等の全ての情報を含む。
【0044】
データベース13への格納方法は、例えば、テキストファイル形式や暗号化されたものでもよく、また、商用のリレーショナルデータベースを用いた方法でも良い。また、データ検索の容易化を図るべく、ヘッダ情報の「To」「From」「Date」の部分の情報でインデックスを作成して格納してもよい。
【0045】
データベース13に電子メールのコピーが格納されると、電子メール分類判断手段14によって、その電子メールが分析され、予め設定された複数の分類(red、green、blue)のいずれに属するかのサーバ分類判断が行なわれる。サーバ分類判断のアルゴリズムは、一般的には、ベイジアン分析や分類の精度を上げるためにユーザのフィードバック情報を用いるような統計的手法が採用されるが、これに限定されるものではなく、任意のものを採用してよい。
【0046】
本実施の形態では、メール本文の他、メタ情報やヘッダ情報など電子メールに含まれている全ての情報から、予め設定されているキーワードが含まれているか否かを確認し、含まれている場合にはその登場回数をカウントする。そして、電子メール分類配信装置1内のメモリに格納されている判断基準と比較していずれの分類に属するかの判断を行うアルゴリズムを採用している。
【0047】
サーバ分類判断がされると、その判断結果はサーバ分類判断情報として電子メールに付される。例えばredに属すると判断された場合には、redに属することを示す文字や記号等が電子メールの題名やヘッダ情報に追加される。そして、その電子メールは受信者のユーザアカウント15「username」に格納される。
【0048】
電子メール分類配信装置1から電子メール受信端末4への電子メールの配信は、一般的な方法により行われる。例えば、受信者が電子メール受信端末4から電子メール分類配信装置1に対して電子メールの配信を要求し、この要求を受けた電子メール分類配信装置1が、その受信者のユーザアカウント内に存在する電子メールを電子メール受信端末4に配信する。
【0049】
電子メール受信端末4は、電子メール分類配信装置1から電子メールの配信を受けると、予め設定された所定のホルダに電子メールを格納する。受信者は、電子メール受信端末4によって受信した電子メールの題名やヘッダ情報に、分類を示す文字や記号等が記載されているので、電子メール分類配信装置1によってその電子メールがどの分類に属すると判断されたことを容易に認識することができる。
【0050】
そして、受信者は、サーバ分類判断情報とは別個に、例えば電子メールの題名、内容、送り主等に基づき、その電子メールがいずれの分類に属するか否かの分類判断を行う。そして、その受信者分類判断が電子メールに付されたサーバ分類判断と同じであるか否かを確認する。ここで、サーバ分類判断情報と受信者分類判断情報とが相違する場合、例えば、サーバ分類判断情報ではredに属すると判断されているにもかかわらず、受信者がgreenに属すると判断した場合には、サーバ分類判断を受信者分類判断に一致させる必要があるため、受信者は、電子メール分類判断手段14にフィードバック学習をさせる。また、サーバ分類判断と受信者分類判断とが一致する場合であっても、判断の確実性を向上させるために電子メール分類判断手段14のトレーニング目的でフィードバック学習させてもよい。
【0051】
電子メール分類判断手段14にフィードバック学習させる場合、受信者は、受信者分類判断とサーバ分類判断とが異なる電子メールを選択し、電子メール受信端末4のモニタに表示されている分類ボタンのうち、受信者分類判断に一致する分類ボタン(例えばred)をクリックする。これにより、電子メール受信端末4は、選択された電子メールのコンテンツをそっくりそのままコピーしかつ電子メールのヘッダ情報からFromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダを抜き出した学習用メールを新規に作成し、電子メールがその分野に属することを示す受信者分類判断情報を付して電子メール分類配信装置1に返信する。尚、学習用メールは、その分野に属すると判断した電子メールを、添付ファイルとして添付したものであってもよく、これによれば、複数の電子メールを一度に送信することができ、操作の煩雑さを解消し、通信時間の短縮による通信コストの低減にも寄与できる。
【0052】
電子メール分類配信装置1の学習用メール受信手段17は、電子メール受信端末4から学習用メールの返信を受けると、学習用メールに付されている受信者分類判断情報に基づいて学習用メールを、該当するフィードバックアカウント18に格納する。
【0053】
電子メール検索手段19は、フィードバックアカウント18に新たな学習用メールの格納を認識すると、学習用メールの内容に基づいてデータベース13内を検索し、該当するフィードバック学習情報を取り出す。データベース13内の検索は、まず最初に、検索情報として電子メールから抜き出されたFromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダの情報に基づいて行われる。メールソフトは、種類やバージョンによってヘッダ情報の記述内容が異なるが、一般的にヘッダ情報には、Fromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダのうちの少なくとも一つが含まれている。したがって、元の電子メールのFromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダを検索情報として学習用メールの内容とすることによって、データベース13内を検索する際にインデックスとすることができ、容易に検索することができる。
【0054】
そして次に、上記のヘッダ情報ではフィードバック学習情報を見つけることができなかった場合は、検索情報として学習用メールにコピーされた電子メールのコンテンツを用いてデータベース13内のテキスト検索を行う。これにより、より詳細な検索を行うことができ、確実に元の電子メールを見つけることができる。
【0055】
電子メール検索手段19は、上記の検索方法によって、フィードバック学習情報をデータベース13内に見つけると、それをデータベース13から取り出して、受信者分類判断情報を書き込み、フィードバック学習手段20に送る処理を行う。尚、受信者分類判断情報の変わりに、学習用メールが格納されていたフィードバックアカウント18の情報を書き込んでもよい。
【0056】
図6は、上記の電子メール検索手段19による電子メール検索方法の一例を説明するフローチャートである。電子メール検索手段19は、フィードバックアカウント18に新たな学習用メールの格納を確認すると(ステップS1)、その学習用メールの中身を取り出す(ステップS2)。学習用メールが複数の電子メールを添付した形式の場合には、添付されている電子メールごとに中身を取り出す。
【0057】
そして、その取り出した学習用メールの中身である電子メールのコピーに、ヘッダ情報のDateヘッダが含まれており(ステップS3でYes)、更にヘッダ情報のToヘッダが含まれている場合には(ステップS4でYes)、DateヘッダとToヘッダの項目に検索用索引を付して、その検索用索引に基づいてデータベース13内の検索を行う(ステップS6)。また、ヘッダ情報のToヘッダが含まれていないが(ステップS4でNo)、Fromヘッダが含まれている場合には(ステップS8)、DateヘッダとFromヘッダの項目に検索用索引を付して、その検索用索引に基づいてデータベース13内の検索を行う(ステップS7)。そして、検索の結果、ヒットした場合には(ステップS8でYes)、そのヒットした電子メールのコピーをデータベース13から取り出し、受信者分類判断情報を書き込み、フィードバック学習手段20に送る(ステップS9)。
【0058】
また、電子メールのコピーにDateヘッダが含まれていない場合(ステップS3でNo)、或いはDateヘッダ等の検索用索引によるデータベース13内の検索の結果、ヒットしなかった場合には(ステップS8でNo)、学習用メールから電子メールのメール本文を取り出し、電子メールのメール本文の内容(テキストデータ)に基づいてデータベース13内を検索する(ステップS10)。そして、検索の結果、ヒットした場合には(ステップS11でYes)、そのヒットした電子メールのコピーをデータベース13から取り出し、受信者分類判断情報を書き込み、フィードバック学習手段20に送る(ステップS9)。また、メール本文の内容に基づく検索の結果、ヒットしなかった場合には(ステップS11でNo)、フィードバック学習の処理は行わない(ステップS12)。
【0059】
フィードバック学習手段20は、電子メール検索手段19によってデータベース13からフィードバック学習情報を受け取ると、そのフィードバック学習情報に含まれている種々の情報と、サーバ分類判断情報及び受信者分類判断情報に基づいて電子メール分類判断手段14のアルゴリズムを修正する処理を行う。
【0060】
これによれば、例えば電子メール分類配信装置1から電子メール受信端末4に送信された電子メールや、電子メール受信端末4から電子メール分類配信装置1に返信された返信メールの情報を使用してフィードバック学習を行うとすると、電子メールのヘッダ情報が書き換えられてしまうため、適切な分類判断が困難となる。しかし、本実施の形態では、転送前の情報であるフィードバック学習情報を使用してサーバ分類判断のフィードバック学習を行うので、重要な要素となる元の電子メールが有する情報(フィードバック学習情報)を用いてフィードバック学習することができ、より適切な分類判断を行うことができる。
【0061】
(第1の実施例)
次に、上記システムを用いた第1の実施例について以下に説明する。
【0062】
本実施例におけるシステムは、電子メールが受信者にとって不要なメール(以下、スパムメールという)であるか否かを分類して受信者に配信するものである。図7及び図8は、本実施例におけるシステム構成図である。
【0063】
電子メール受信端末4にインストールされている電子メールソフトは、電子メール受信端末4から電子メール分類配信装置1に電子メールの配信を要求することによって電子メールを受信するメール受信手段11と、電子メール分類配信装置1にフィードバック学習させるための学習用メールを作成する学習用メール作成手段12と、受信した電子メールがスパムメールであるか否かを受信者によって判断した受信者分類判断情報を学習用メールに付して電子メール分類配信装置に返信するメール返信手段13を有している。
【0064】
学習用メールは、電子メール受信端末のモニター上に表示されているスパム用ボタンと非スパム用ボタンのいずれか一方をクリックすることによって作成される。そして、その作成された学習用メールには、スパム用ボタンを選択したときには、その電子メールがスパムメールであることを示す受信者分類判断情報が付され、非スパム用ボタンを選択したときには、その電子メールが非スパムメールであることを示す受信者分類判断情報が付されるように構成されている。
【0065】
電子メール分類配信装置1は、電子メール送信端末3から送信された電子メールを受け取る受信手段11と、フィードバック学習情報として電子メールのコピーを作成するフィードバック学習情報作成手段12と、その作成された電子メールのコピーを格納するデータベース13と、受信手段11によって受信した電子メールが、スパムメール又は非スパムメールのいずれに属するかについて電子メールに含まれている情報を判断要素として所定のアルゴリズムに基づき判断する電子メール分類判断手段14と、その分類判断の結果をサーバ分類判断情報として電子メールに付して格納するユーザアカウント15と、電子メール受信端末4からの要求に応じてユーザアカウント15内の電子メールを電子メール受信端末4に送信する送信手段16を有する。
【0066】
また、電子メール分類配信装置1は、電子メール受信端末4によって返信された学習用メールを受け取る学習用メール受信手段17と、その学習用メールに付されている受信者分類判断情報がスパムメールとの判断である場合にその学習用メールを格納するスパムメール用フィードバックアカウント18dと、その学習用メールに付されている受信者分類判断情報が非スパムメールとの判断である場合にその学習用メールを格納する非スパムメール用フィードバックアカウント18eと、スパムメール用フィードバックアカウント18dと非スパムメール用フィードバックアカウント18eを監視し、新たな学習用メールの格納を認識すると、その学習用メールの内容に基づいてデータベース13内を検索し、電子メール受信端末4が学習用メールを作成するために使用した元の電子メールのコピーであるフィードバック学習情報を取り出す電子メール検索手段19と、フィードバック学習情報と、サーバ分類判断情報及び受信者分類判断情報とを用いてサーバ分類判断のフィードバック学習を行うフィードバック学習手段20とを有している。
【0067】
上記システムのフィードバック学習方法について、以下に説明する。まず、電子メールの送信者が受信者に電子メールを送信すべく、受信者のメールアドレス「username」に宛てて電子メール送信端末3から電子メールを送ると、その電子メールは、電子メール分類配信装置1に送信される。電子メール分類配信装置1は、メール本文等のコンテンツやヘッダ情報等の全ての情報を含む電子メールのコピーを作成し、データベース13に格納する。
【0068】
データベース13に電子メールのコピーが格納されると、電子メール分類判断手段14によって、その電子メールが分析され、スパムメールであるか否かの分類判断が行なわれる。
【0069】
所定のアルゴリズムに基づいてスパムメールであるか否かの分類判断がされると、その判断結果がサーバ分類判断情報として電子メールに付される。例えばスパムメールであると判断した場合には、スパムメールであることを示す文字や記号等が電子メールの題名やヘッダ情報に追加される。そして、その電子メールを受信者のユーザアカウント15に格納する。
【0070】
電子メール受信端末4は、電子メール分類配信装置1に電子メールの配信を要求し、電子メール分類配信装置1からの配信を受けると、予め設定された所定のホルダに電子メールを格納する。その際、電子メールの題名やヘッダ情報に追加されたスパムメールであることを示す文字等に基づいて、予め作成されているスパムメール用ホルダに格納してもよい。
【0071】
受信者は、電子メール受信端末4によって電子メールを受信すると、サーバ分類判断情報とは別個に、例えば電子メールの題名、内容、送り主等に基づき、その電子メールがスパムメールであるか否かの分類判断を行う。そして、その受信者分類判断が電子メールに付されたサーバ分類判断情報の判断と同じであるか否かを確認する。ここで、サーバ分類判断情報と受信者分類判断情報とが相違する場合、例えば、サーバ分類判断情報ではスパムメールと判断されているにもかかわらず、受信者がスパムメールではないと判断した場合、或いは、サーバ分類判断情報ではスパムメールではないと判断されているにもかかわらず、受信者がスパムメールであると判断した場合には、サーバ分類判断を受信者分類判断に一致させる必要があるため、受信者は、電子メール分類判断手段14にフィードバック学習させる。また、サーバ分類判断と受信者分類判断とが一致する場合であっても、判断の確実性を向上させるために電子メール分類判断手段14のトレーニング目的でフィードバック学習させてもよい。
【0072】
電子メール分類判断手段14にフィードバック学習させる場合、受信者は、電子メール受信端末4のモニタ上でスパムメールであると判断した電子メールを選択し、モニタに表示されているスパム用ボタンをクリックする。また、電子メール分類判断手段14に非スパムメールをトレーニングさせる場合には、非スパムメールと判断した電子メールを選択し、非スパム用ボタンをクリックする。これにより、電子メール受信端末4は、選択された電子メールのメール本文の内容をそっくりそのままコピーしかつ電子メールのヘッダ情報からFromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダを抜き出した学習用メールを新規に作成し、スパムメール若しくは非スパムメールであることを示す受信者分類判断情報を付して電子メール分類配信装置1に返信する。
【0073】
電子メール分類配信装置1の学習用メール受信手段17は、電子メール受信端末4から学習用メールの返信を受けると、学習用メールに付されている受信者分類判断情報に基づいて学習用メールをスパムメール用フィードバックアカウント18d若しくは非スパムメール用フィードバックアカウント18eに格納する。
【0074】
電子メール検索手段19は、スパムメール用フィードバックアカウント18d若しくは非スパムメール用フィードバックアカウント18eに新たな学習用メールの格納を認識すると、学習用メールの内容に基づいてデータベース13内を検索し、電子メール受信端末4が学習用メールを作成するために使用した元の電子メールのコピー(フィードバック学習情報)を取り出す。データベース13内の検索は、まず最初に、電子メール受信端末4によって学習用メールにコピーされた元の電子メールのFromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダの情報に基づいて行われる。
【0075】
そして次に、上記のヘッダ情報では元の電子メールのコピーをデータベース内に見つけることができなかった場合は、学習用メールにコピーされた電子メールのメール本文を用いてデータベース内のテキスト検索を行う。
【0076】
電子メール検索手段は、上記の検索方法によって、元の電子メールのコピーをデータベース内に見つけると、それをデータベースから取り出して、スパムメール若しくは非スパムメールであるとの受信者分類判断情報を書き込み、フィードバック学習手段20に送る処理を行う。
【0077】
フィードバック学習手段20は、電子メール検索手段19によってデータベース13から電子メールのコピーを受け取ると、その電子メールのコピーに含まれている種々の情報と、その電子メールに付されている受信者分類判断情報及びサーバ分類判断情報とに基づいて電子メール分類判断手段14のアルゴリズムを修正する処理を行う。本実施の形態では、キーワードとその登場回数とからなる電子メール分類判断手段14の判断基準を変更する処理を行う。
【0078】
(第2の実施例)
次に、本発明の第2の実施例について以下に説明する。本システムは、企業などが顧客からの問い合わせに対応するために設けているメールアドレス宛に送信された電子メールを、その内容に応じて該当する部署に配信するものである。図9及び図10は、本実施例におけるシステム構成図である。尚、第1実施例と同様の構成要素には同一の符号を付することでその詳細な説明を省略する。
【0079】
電子メール分類配信装置1は、総務、営業、人事、庶務、技術などの各部署ごとのユーザアカウント15f、15g、15h、・・・・と、それに対応するフィードバックアカウン18f、18g、18h、・・・・を有しており、また、データベース13内に、各部署ごとのユーザファイルを有している。
【0080】
上記システムのフィードバック学習方法について以下に説明する。電子メール分類配信装置1は、電子メール送信端末3から電子メールを受け取ると、電子メールのコピー(フィードバック学習情報)を作成し、データベース13に格納する。また、電子メール分類配信装置1は、電子メール分類判断手段14によって電子メールの分類判断を行い、電子メールが属すると判断される分類のユーザアカウント15に格納する。例えば、電子メールが総務宛であると分類判断すると、総務のユーザカウント15fに格納する。
【0081】
総務は、電子メール受信端末4を操作して電子メール分類配信装置1に電子メールの配信を要求することによって、総務のユーザアカウント15f内にある電子メールの配信を受けることができる。そして、配信を受けた電子メールが総務宛ではないと判断した場合には、電子メール分類判断手段14にフィードバック学習を行わせる。
【0082】
ここでは、まず、誤って分類されて総務に配信された電子メールが、正規にはどの部署宛のものであるかを総務が判断する。例えば、ここでは営業宛の売り込みの電子メールであったとすると、総務は、その電子メールをフィードバック学習のために電子メール分類配信装置1に転送すべく、モニタ上の営業ボタンをクリックする。
【0083】
これにより、電子メール受信端末4は、その電子メールのコンテンツをそっくりそのままコピーしかつ電子メールのヘッダ情報からFromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダを抜き出した学習用メールを新規に作成し、営業宛の電子メールであることを示す受信者分類判断情報を付して電子メール分類配信装置1に返信する。
【0084】
電子メール分類配信装置1の学習用メール受信手段17は、電子メール受信端末4から学習用メールの返信を受けると、学習用メールに付されている受信者分類判断情報に基づいて学習用メールを営業のフィードバックアカウント18gに格納する。
【0085】
電子メール検索手段19は、営業のフィードバックアカウント18gに新たな学習用メールの格納を認識すると、学習用メールの内容に基づいてデータベース13内を検索し、電子メール受信端末4が学習用メールを作成するために使用した元の電子メールのコピー(フィードバック学習情報)を取り出す。データベース13内の検索方法は、第1の実施例と同様であるのでその説明を省略する。
【0086】
電子メール検索手段19は、上記の検索方法によって、元の電子メールのコピーをデータベース13内に見つけると、それをデータベース13から取り出して、営業宛である旨の受信者分類判断情報を書き込み、フィードバック学習手段20に送る処理を行う。
【0087】
フィードバック学習手段20は、電子メール検索手段19によってデータベース13から電子メールのコピーを受け取ると、その電子メールのコピー(フィードバック学習情報)に含まれている種々の情報と、その電子メールに付されている受信者分類判断情報に基づいて電子メール分類判断手段14のアルゴリズムを修正する処理を行う。
【0088】
本発明は上述の実施の形態及び各実施例に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々の変更が可能である。例えば、第1実施例のように電子メール分類判断手段14のアルゴリズムが電子メールに含まれているキーワードとその登場回数に基づいてスパムメールであるか否かを判断している場合には、フィードバック学習情報として、電子メール分類配信装置のコピーを作成する代わりに、電子メールに含まれているキーワードとその登場回数の情報からなるフィードバック学習情報を作成してデータベースに格納してもよい。
【0089】
これによれば、電子メール分類判断手段14において、再度、電子メールのコピーに含まれているキーワードとその登場回数をカウントする必要がなく、フィードバック学習情報作成手段12によって作成したフィードバック学習情報を用いて分類判断を行うことができる。したがって、分類判断の処理速度を向上させることができる。
【0090】
また、データベース13には、キーワードとその登場回数からなるフィードバック学習情報が格納されているだけで、電子メールのコンテンツ自体は格納しないので、データベース13内を閲覧しただけでは電子メールの内容を理解することはできない。したがって、セキュリティー面で安心であるというメリットがある。
【0091】
また、上述の第1及び第2の実施例では、電子メール分類配信装置1の構成として、電子メール送信端末4から受け取った電子メールをコピーし、データベース13に格納してから電子メール分類判断手段14に渡す場合を例に説明したが、これに限定されるものではなく、電子メール送信端末3から受け取った電子メールを、まず最初にユーザアカウント15に格納し、電子メール受信端末4からの要求に応じて電子メールを配信する際に電子メール分類判断手段14により分類判断するものであってもよい。
【0092】
【発明の効果】
以上説明したように、本発明に係る電子メール分類配信システムのフィードバック学習システム及びそのフィードバック学習プログラムによれば、電子メール受信端末から電子メール分類配信装置に学習用メールを返信すると、その学習用メールをトリガとして電子メール分類配信装置がサーバ分類判断のフィードバック学習を行う。したがって、電子メール受信端末の操作者である受信者は、学習用メールを返信するだけでよく、従来のように、メールソフトの他にフィルタリングソフト専用の操作を習熟する必要がない。また、従来のサーバサイド方式のように、ログイン手続やログインパスワードを覚える必要もない。
【0093】
また、電子メール分類配信装置は、学習用メールの内容に基づいてデータベースからフィードバック学習情報を取り出し、そのフィードバック学習情報を使用してフィードバック学習を行うので、正確な情報を用いてフィードバック学習することができる。したがって、従来のように、電子メールの転送によってヘッダ情報が変更されて正確な情報をフィードバックすることができないという問題は生じない。
【図面の簡単な説明】
【図1】本実施の形態を示すシステム概略図である。
【図2】本実施の形態を示すシステム概略図である。
【図3】データベースに格納されるフィードバック学習情報の一例を示す図である。
【図4】電子メール分類判断手段によって電子メールから抽出したキーワードとその登場回数を示す表である。
【図5】学習用メールのデータの一例を示す図である。
【図6】電子メール検索手段による電子メール検索方法の一例を説明するフローチャートである。
【図7】第1実施例を示すシステム概略図である。
【図8】第1実施例を示すシステム概略図である。
【図9】第2実施例を示すシステム概略図である。
【図10】第2実施例を示すシステム概略図である。
【符号の説明】
1 電子メール分類配信装置
2 ネットワーク
3 電子メール送信端末
4 電子メール受信端末
11 受信手段
12 フィードバック学習情報作成手段
13 データベース
14 電子メール分類判断手段
15 ユーザアカウント
16 送信手段
17 学習用メール受信手段
18 フィードバックアカウント
19 電子メール検索手段
20 フィードバック学習手段
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a feedback learning system for an electronic mail classification and distribution apparatus and a feedback learning program thereof.
[0002]
[Prior art]
Conventionally, it is determined whether it is an email that requires email or junk email (spam email), etc., based on predetermined rules such as email header information, keywords, sentence patterns, etc. Filtering software and software that classifies appropriately based on the content of e-mail.
[0003]
Further, there is a method for learning by receiving feedback from the user and more accurately determining whether or not the mail is unnecessary and for classifying it (for example, see Patent Document 1).
[0004]
Such e-mail classification software can be mainly divided into a client-side method and a server-side method. In the client-side method, e-mail filtering is performed in cooperation with the e-mail receiving client's e-mail software or e-mail software, and the user himself / herself gives feedback information to the e-mail filtering software using a graphical interface for learning. . On the other hand, the server side method performs filtering of e-mails in the server. The user connects to the server and gives feedback information to the filtering software using the interface to learn.
[0005]
[Patent Document 1]
JP 2003-67304 A
[0006]
[Problems to be solved by the invention]
However, in the case of the above prior art, in addition to the normal mail screen, it is necessary to master the operation dedicated to the classification software, and rules such as keywords and sentence patterns must be considered by the user himself. It took a lot of effort to use it.
[0007]
Further, in the case of the server side method, it is necessary to perform an operation for logging in to the server, and it is necessary to memorize a dedicated login password, which causes a problem that the operation is complicated and not easy to use. In addition, when junk mail is transferred from the e-mail receiving client to the e-mail server for feedback learning, there is a problem that header information of the e-mail is changed and accurate information cannot be fed back.
[0008]
The present invention has been made in view of the above points, and an object of the present invention is to provide a feedback learning system for an e-mail classification and distribution device capable of appropriately classifying and distributing e-mails with a simple operation and the feedback learning thereof. To provide a program.
[0009]
[Means for Solving the Problems]
The feedback learning system of the electronic mail classification and distribution apparatus according to claim 1 that solves the above problem receives an electronic mail transmitted from an electronic mail transmitting terminal, and the electronic mail has a plurality of classifications set in advance. In a feedback learning system of an e-mail classification and distribution device that performs a server classification determination and belongs to the e-mail as server classification determination information and distributes the result to the e-mail receiving terminal. When the distribution device receives the e-mail from the e-mail transmission terminal, the distribution device creates feedback learning information based on the information of the e-mail and stores it in the database. The e-mail reception terminal receives the e-mail from the e-mail classification distribution device. Is received based on information contained in the e-mail. Create a learning email with the search information for searching the database, and receive the classification judgment result of which of the multiple categories the email sent by the recipient operating the email receiving terminal Is attached to the learning mail as the person classification judgment information and sent back to the e-mail classification and distribution device. Upon receiving the learning e-mail, the e-mail classification and distribution device searches the e-mail by searching the database based on the contents of the learning e-mail. The feedback learning information is extracted, and feedback learning of classification determination is performed using the feedback learning information, server classification determination information, and recipient classification determination information.
[0010]
According to the present invention, when a learning mail is returned from the e-mail receiving terminal to the e-mail classification and distribution device, the e-mail classification and distribution device performs feedback learning of server classification determination using the learning mail as a trigger. Therefore, the recipient who is the operator of the electronic mail receiving terminal only has to return the learning mail, and it is not necessary to master the operation dedicated to the filtering software in addition to the mail software as in the past. Moreover, it is not necessary to memorize a login procedure and a login password as in the conventional server-side method.
[0011]
In addition, since the e-mail classification and distribution device extracts feedback learning information from the database based on the content of the learning mail and performs feedback learning using the feedback learning information, feedback learning can be performed using accurate information. it can. Therefore, unlike the conventional case, there is no problem that the header information is changed by the transfer of the electronic mail and accurate information cannot be fed back.
[0012]
According to a second aspect of the present invention, in the feedback learning system of the electronic mail classification and delivery apparatus according to the first aspect, the feedback learning information is a copy of an electronic mail.
[0013]
According to the present invention, the electronic mail classification and distribution device only needs to create a copy of the electronic mail in the feedback learning information creation processing. Therefore, feedback learning information can be created easily, and the processing speed of the entire apparatus can be increased. Further, when searching the database based on the content of the learning mail, more search elements can be obtained, and the search can be easily performed.
[0014]
According to a third aspect of the present invention, in the feedback learning system of the electronic mail classification and distribution apparatus according to the first aspect, the feedback learning information includes a predetermined keyword included in information included in the electronic mail and the number of appearances thereof. It is characterized by that.
[0015]
According to the present invention, the database only needs to store the feedback learning information including the predetermined keyword and the number of appearances thereof, and the amount of information stored in the database can be reduced. Therefore, the capacity of the database can be reduced, and the cost of the equipment can be reduced.
[0016]
Also, in the case of data leakage, it is not possible to grasp the keywords and the number of appearances to the contents of the e-mail as compared to the case where a copy of the e-mail is stored as it is. It is safe.
[0017]
Furthermore, when the server classification determination algorithm is based on the keyword and the number of appearances thereof, the feedback learning information created when the e-mail is received can be reused when determining the server classification. The processing speed can be improved.
[0018]
According to a fourth aspect of the present invention, in the feedback learning system of the electronic mail classification and distribution device according to any one of the first to third aspects, the search information includes a From header, a To header, and a Date among the header information of the electronic mail. Information including at least one of a header and a Subject header is included.
[0019]
The present invention specifies the content of search information. According to this, the search information is described in at least one of a From header, a To header, a Date header, and a Subject header in the header information of an email. Contains information.
[0020]
In general, the header information of an electronic mail is changed by transfer, and the content of the change varies depending on the mail software, and there is no regularity. However, in the header information, the From header, To header, Date header, and Subject header are often copied and transferred as they are. Therefore, by using these pieces of information as search information, the corresponding feedback learning information can be easily found when searching the database.
[0021]
According to a fifth aspect of the present invention, in the feedback learning system of the electronic mail classification and distribution apparatus according to any one of the first to third aspects, the search information includes a copy of the content of the electronic mail.
[0022]
According to the present invention, the content of the search information is specified. According to this, since the search information includes a copy of the content of the e-mail, it is possible to perform a search based on the content of the content when searching the database. Yes, it is possible to reliably find relevant feedback learning information.
[0023]
According to a sixth aspect of the present invention, in the feedback learning system for the electronic mail classification and delivery apparatus according to any one of the first to fifth aspects, the learning mail is an electronic mail sent from the electronic mail receiving terminal to the electronic mail classification and distribution apparatus. It is a forwarding mail created when forwarding.
[0024]
The present invention shows a specific example of the learning mail in the inventions described in claims 1 to 5 described above. According to this, since the transfer mail created when the e-mail is transferred from the e-mail receiving terminal to the e-mail classification and distribution device is used as the learning mail, the learning mail can be easily created.
[0025]
A seventh aspect of the present invention is the feedback learning system of the electronic mail classification and delivery apparatus according to any one of the first to fifth aspects, wherein the learning mail is a transfer mail in which a plurality of copies of the electronic mail are created as attached files. It is characterized by being.
[0026]
The present invention shows a specific example of the learning mail in the inventions described in claims 1 to 5 described above. According to this, the learning mail is created as an attachment with a copy of a plurality of e-mails. Thus, a plurality of e-mail copies are collected and returned to the e-mail classification and distribution device with one learning e-mail. can do. Therefore, it is possible to save the trouble of transferring each mail one by one, and it is possible to reduce the operation burden on the electronic mail receiving terminal by the recipient.
[0027]
According to an eighth aspect of the present invention, in the feedback learning system for the electronic mail classification and delivery apparatus according to any one of the first to seventh aspects, the plurality of classifications are classified depending on whether or not the electronic mail is junk mail. It is characterized by being.
[0028]
The present invention shows a specific example of the invention described in claims 1 to 7 described above, and according to this, feedback learning of server classification determination as to whether or not the e-mail is junk mail is performed. The feedback learning information that is more accurate information can be used. Therefore, it is possible to appropriately perform feedback learning so that the determination as to whether or not it is junk mail by the electronic mail classification distribution apparatus matches the determination of the recipient classification.
[0029]
The invention according to claim 9 is the feedback learning system of the e-mail classification and delivery apparatus according to any one of claims 1 to 7, wherein the plurality of classifications are a plurality of departments in which the e-mail is set in the company. It is classified according to which it belongs to.
[0030]
The present invention shows a specific example of the invention described in claims 1 to 7 described above, and according to this, the server classification of which of the plurality of departments the e-mail corresponds to Judgment feedback learning can be performed using feedback learning information, which is more accurate information. Therefore, it is possible to appropriately perform feedback learning so that the server classification determination by the electronic mail classification distribution device matches the recipient classification determination.
[0031]
A feedback learning program of an e-mail classification and delivery apparatus according to claim 10 receives an e-mail transmitted from an e-mail transmission terminal, and the e-mail belongs to any of a plurality of preset categories A feedback learning program for making an e-mail classification distribution device for making a server classification determination and attaching the result of the server classification determination to an e-mail as server classification determination information and distributing it to an e-mail receiving terminal for feedback learning about the server classification determination And creating feedback learning information based on information contained in the email received from the email sending terminal and storing it in the database, and for searching the database created based on the email by the email receiving terminal. Email with search information A learning email with a recipient classification judgment information, which is a result of a classification judgment as to which of a plurality of classifications an email sent by a recipient operating the receiving terminal, is received from the email receiving terminal and used for learning. Search the database based on the contents of the mail to retrieve the feedback learning information of the e-mail, and use the feedback learning information, the server classification determination information and the recipient classification determination information to determine the server classification in the e-mail classification distribution device. The feedback learning is performed.
[0032]
According to the present invention, when a learning mail is returned from the e-mail receiving terminal to the e-mail classification and distribution apparatus, the e-mail classification and distribution apparatus is caused to perform feedback learning about server classification determination using the learning mail as a trigger. Therefore, the recipient who is the operator of the electronic mail receiving terminal only has to return the learning mail, and it is not necessary to master the operation dedicated to the filtering software in addition to the mail software as in the past. Moreover, it is not necessary to memorize a login procedure and a login password as in the conventional server-side method.
[0033]
Also, the feedback learning program retrieves feedback learning information from the database based on the contents of the learning mail, and uses the feedback learning information to cause the e-mail classification and distribution device to perform feedback learning on server classification determination. Feedback learning using simple information can be performed. Therefore, unlike the conventional case, there is no problem that the header information is changed by the transfer of the electronic mail and accurate information cannot be fed back.
[0034]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described with reference to the drawings.
[0035]
1 and 2 are system schematic diagrams showing the present embodiment, FIG. 3 is a diagram showing an example of feedback learning information stored in a database, and FIG. 4 is extracted from an email by an email classification determination unit. Data showing keywords and the number of appearances thereof, FIG. 5 is a diagram showing an example of learning mail data.
[0036]
The electronic mail classification / distribution apparatus 1 according to the present embodiment classifies and distributes electronic mail based on the contents of the electronic mail, and, as shown in FIGS. 1 and 2, via a network 2 such as the Internet. The electronic mail transmitting terminal 3 and the electronic mail receiving terminal 4 are both connected.
[0037]
The e-mail sending terminal 3 and the e-mail receiving terminal 4 are constituted by so-called personal computers. Although only one e-mail sending terminal 3 and one e-mail receiving terminal 4 are shown in FIG. 1, at least one e-mail sending terminal 3 and e-mail receiving terminal 4 are generally required.
[0038]
In the e-mail receiving terminal 4, e-mail software capable of creating and sending / receiving e-mails is installed in a startable state. This e-mail software receives an e-mail distributed from the e-mail receiving terminal 4 to the e-mail classification distribution device 1 by requesting the distribution of the e-mail from the user account of the e-mail classification distribution device 1. The email receiving means 5, the learning email creating means 6 for creating a learning email for causing the email classification and distribution apparatus 1 to perform feedback learning, and the email received by the email receiving means 5 are, for example, red, green, Mail reply that replies to the e-mail classification distribution apparatus 1 with the recipient classification judgment information, which is a result of the judgment of the recipient himself / herself, belonging to a plurality of preset classifications such as blue Means 7 are provided.
[0039]
The learning mail contains search information for searching the database of the electronic mail classification / distribution device 1 based on information contained in the electronic mail. For example, a Date header and a From header extracted from the header information of the electronic mail. , To header, Subject header, and copy of content such as mail text. Then, the receiver selects an arbitrary email desired to be used for feedback learning from the received email, and a plurality of classification buttons (for example, red, green, blue) displayed on the monitor of the email receiving terminal 4. ), By clicking the corresponding classification button. Then, the created learning mail is configured so that recipient classification determination information corresponding to the selected classification button (for example, red when the red classification button is selected) is attached.
[0040]
The e-mail classification and distribution apparatus 1 includes a receiving unit 11 that receives an e-mail transmitted from the e-mail transmitting terminal 3, a feedback learning information generating unit 12 that generates feedback learning information based on information included in the e-mail, It has a database 13 for storing feedback learning information.
[0041]
Then, an e-mail classification determination unit 14 that performs classification determination based on a predetermined algorithm using information held by the e-mail as to which of a plurality of classifications (red, green, blue) the e-mail received by the reception unit 11 belongs to. And a user account 15 for storing the server classification determination result as an e-mail as server classification determination information, and an e-mail in the user account 15 in response to a request from the e-mail receiving terminal 4 4 has a transmission means 16 for transmitting to 4.
[0042]
The e-mail classification distribution device 1 also includes a learning e-mail receiving unit 17 that receives a learning e-mail sent from the e-mail receiving terminal 4 for feedback learning, and a recipient classification attached to the learning e-mail. A plurality of feedback accounts (red-fb, green-fb, blue-fb) 18 for classifying and storing learning emails according to the judgment information, and monitoring these feedback accounts 18, new learning emails When the storage is recognized, the database 13 is searched based on the contents of the learning mail, and the e-mail receiving terminal 4 uses the e-mail feedback learning information used for creating the learning e-mail to retrieve from the database 13 Search means 19 and feedback taken out by e-mail search means 19 It has a learning information, and feedback learning means 20 for performing feedback learning classification determined by the e-mail classifier delivery device with a server classification judgment information and the recipient classification determination information. Each of these means is realized by a software program installed in the electronic mail classification and distribution apparatus 1.
[0043]
Next, the feedback learning method of the above system will be described below. First, when an e-mail sender sends an e-mail from the e-mail sending terminal 3 to the e-mail address “username1” of the recipient in order to send an e-mail to the recipient, the e-mail is shown in FIG. As shown, it is sent to the electronic mail classification and distribution apparatus 1. The electronic mail classification and distribution apparatus 1 creates feedback learning information based on the information included in the electronic mail and stores it in the database 13. For example, as shown in FIG. 3, the feedback learning information includes content such as a mail text and all information such as header information.
[0044]
The storage method in the database 13 may be, for example, a text file format or an encrypted one, or a method using a commercial relational database. Further, in order to facilitate data search, an index may be created and stored using information of the “To”, “From”, and “Date” portions of the header information.
[0045]
When a copy of the e-mail is stored in the database 13, the e-mail classification determination unit 14 analyzes the e-mail, and the server classification of which one of a plurality of preset classifications (red, green, blue) belongs to Judgment is made. The server classification judgment algorithm generally employs a statistical method using user feedback information in order to improve the accuracy of Bayesian analysis or classification, but is not limited to this. You may adopt one.
[0046]
In the present embodiment, it is confirmed whether or not a preset keyword is included from all information included in the e-mail such as meta information and header information in addition to the mail text. If so, count the number of appearances. Then, an algorithm is adopted that determines which category it belongs to in comparison with the criterion stored in the memory within the electronic mail category distribution device 1.
[0047]
When the server classification is determined, the determination result is attached to the electronic mail as server classification determination information. For example, when it is determined that it belongs to red, characters, symbols, and the like indicating belonging to red are added to the title and header information of the electronic mail. The electronic mail is stored in the user account 15 “username” of the recipient.
[0048]
Distribution of electronic mail from the electronic mail classification distribution apparatus 1 to the electronic mail receiving terminal 4 is performed by a general method. For example, a recipient requests email delivery from the email receiving terminal 4 to the email classification and distribution device 1, and the email classification and delivery device 1 that has received this request exists in the user account of the recipient. The electronic mail to be delivered is distributed to the electronic mail receiving terminal 4.
[0049]
When the e-mail receiving terminal 4 receives e-mail distribution from the e-mail classification and distribution apparatus 1, the e-mail receiving terminal 4 stores the e-mail in a predetermined holder set in advance. Since the recipient has the characters and symbols indicating the classification in the title and header information of the email received by the email receiving terminal 4, the email belongs to which category by the email classification distribution device 1. Can be easily recognized.
[0050]
Then, separately from the server classification determination information, the recipient makes a classification determination as to which class the email belongs to, for example, based on the title, content, sender, etc. of the email. Then, it is confirmed whether or not the recipient classification determination is the same as the server classification determination attached to the e-mail. Here, when the server classification determination information is different from the recipient classification determination information, for example, when it is determined that the receiver belongs to green although the server classification determination information is determined to belong to red. Since it is necessary to match the server classification judgment with the recipient classification judgment, the recipient causes the e-mail classification judgment means 14 to perform feedback learning. Further, even when the server classification determination and the recipient classification determination match, feedback learning may be performed for the purpose of training the e-mail classification determination means 14 in order to improve the certainty of the determination.
[0051]
When the e-mail classification determination unit 14 performs feedback learning, the receiver selects an e-mail having a different recipient classification determination and server classification determination, and among the classification buttons displayed on the monitor of the e-mail receiving terminal 4, Click a classification button (eg, red) that matches the recipient classification decision. As a result, the e-mail receiving terminal 4 creates a new learning e-mail that copies the selected e-mail contents as they are and extracts the From header, To header, Date header, and Subject header from the e-mail header information. Then, the receiver class determination information indicating that the e-mail belongs to the field is attached and sent back to the e-mail class distribution device 1. The learning e-mail may be an e-mail that is determined to belong to the field attached as an attached file. According to this, a plurality of e-mails can be transmitted at one time. Complexity can be eliminated and communication costs can be reduced by shortening communication time.
[0052]
When the learning mail receiving means 17 of the electronic mail classification distribution device 1 receives the reply of the learning mail from the electronic mail receiving terminal 4, the learning mail receiving means 17 sends the learning mail based on the recipient classification judgment information attached to the learning mail. And stored in the corresponding feedback account 18.
[0053]
When the e-mail search means 19 recognizes the storage of the new learning mail in the feedback account 18, the e-mail searching means 19 searches the database 13 based on the contents of the learning mail and takes out the corresponding feedback learning information. A search in the database 13 is first performed based on information of a From header, a To header, a Date header, and a Subject header extracted from an electronic mail as search information. In the mail software, the description contents of the header information differ depending on the type and version. Generally, the header information includes at least one of a From header, a To header, a Date header, and a Subject header. Therefore, by using the From header, To header, Date header, and Subject header of the original e-mail as the contents of the learning mail as search information, it can be used as an index when searching in the database 13 and can be easily searched. can do.
[0054]
Next, when feedback learning information cannot be found with the above header information, a text search in the database 13 is performed using the contents of the e-mail copied to the learning mail as search information. As a result, a more detailed search can be performed and the original electronic mail can be surely found.
[0055]
When the electronic mail search means 19 finds feedback learning information in the database 13 by the above search method, it retrieves it from the database 13, writes the recipient classification judgment information, and sends it to the feedback learning means 20. Instead of the recipient classification determination information, information of the feedback account 18 in which the learning mail is stored may be written.
[0056]
FIG. 6 is a flowchart for explaining an example of an e-mail search method by the e-mail search means 19 described above. When the e-mail search means 19 confirms the storage of the new learning mail in the feedback account 18 (step S1), the electronic mail searching means 19 takes out the contents of the learning mail (step S2). When the learning mail is in a format in which a plurality of e-mails are attached, the contents are taken out for each attached e-mail.
[0057]
Then, in the copy of the e-mail that is the contents of the retrieved learning mail, the Date header of the header information is included (Yes in step S3), and when the To header of the header information is further included ( In step S4, Yes), a search index is attached to the items of Date header and To header, and the database 13 is searched based on the search index (step S6). If the To header of the header information is not included (No in step S4), but the From header is included (step S8), a search index is added to the items of the Date header and the From header. Then, the database 13 is searched based on the search index (step S7). If the search results in a hit (Yes in step S8), a copy of the hit electronic mail is taken out from the database 13, the recipient classification determination information is written, and sent to the feedback learning means 20 (step S9).
[0058]
In addition, when the date header is not included in the copy of the e-mail (No in step S3), or as a result of the search in the database 13 by the search index such as the Date header, there is no hit (in step S8). No), the e-mail body of the e-mail is taken out from the learning e-mail, and the database 13 is searched based on the content (text data) of the e-mail body (step S10). If the search results in a hit (Yes in step S11), a copy of the hit electronic mail is taken out from the database 13, the recipient classification determination information is written, and sent to the feedback learning means 20 (step S9). Further, if no hit is found as a result of the search based on the contents of the mail body (No in step S11), the feedback learning process is not performed (step S12).
[0059]
When the feedback learning means 20 receives the feedback learning information from the database 13 by the e-mail search means 19, the feedback learning means 20 performs electronic processing based on various information included in the feedback learning information, the server classification determination information, and the recipient classification determination information. Processing for correcting the algorithm of the mail classification judging means 14 is performed.
[0060]
According to this, for example, using the information of the e-mail transmitted from the e-mail classification distribution device 1 to the e-mail receiving terminal 4 or the reply e-mail returned from the e-mail receiving terminal 4 to the e-mail classification distribution device 1 If feedback learning is performed, the header information of the e-mail is rewritten, making it difficult to make an appropriate classification decision. However, in this embodiment, since feedback learning for server classification determination is performed using feedback learning information that is information before transfer, information (feedback learning information) included in the original e-mail that is an important element is used. Feedback learning, and more appropriate classification judgment can be made.
[0061]
(First embodiment)
Next, a first embodiment using the above system will be described below.
[0062]
The system in the present embodiment classifies whether or not an electronic mail is unnecessary mail for the recipient (hereinafter referred to as spam mail) and distributes it to the recipient. 7 and 8 are system configuration diagrams in the present embodiment.
[0063]
The e-mail software installed in the e-mail receiving terminal 4 includes e-mail receiving means 11 for receiving e-mail by requesting e-mail distribution from the e-mail receiving terminal 4 to the e-mail classification and distribution device 1, e-mail Learning email creation means 12 for creating a learning email for causing the classification distribution device 1 to perform feedback learning, and recipient classification judgment information that is judged by the recipient as to whether or not the received email is a spam email A mail reply means 13 is provided for sending a reply to the electronic mail classification and distribution apparatus.
[0064]
The learning mail is created by clicking one of the spam button and the non-spam button displayed on the monitor of the e-mail receiving terminal. When the spam button is selected for the created learning email, recipient classification judgment information indicating that the email is spam email is attached. When the non-spam button is selected, Recipient classification determination information indicating that the e-mail is a non-spam mail is added.
[0065]
The e-mail classification and distribution apparatus 1 includes a receiving unit 11 that receives an e-mail transmitted from the e-mail transmitting terminal 3, a feedback learning information creating unit 12 that creates a copy of the e-mail as feedback learning information, and the created electronic A database 13 for storing a copy of mail and whether the email received by the receiving means 11 belongs to spam mail or non-spam mail is determined based on a predetermined algorithm using information contained in the email as a determination element E-mail classification determining means 14 for performing the determination, a user account 15 for storing the classification determination result as e-mail as server classification determination information, and an e-mail in the user account 15 in response to a request from the e-mail receiving terminal 4 Transmission means for transmitting mail to the e-mail receiving terminal 4 With a 6.
[0066]
Further, the e-mail classification distribution device 1 includes a learning e-mail receiving unit 17 that receives the learning e-mail returned by the e-mail receiving terminal 4, and the recipient classification determination information attached to the learning e-mail is spam mail. The spam mail feedback account 18d for storing the learning mail and the recipient classification determination information attached to the learning mail is the non-spam mail. Are monitored, and the feedback account 18e for spam mail, the feedback account 18d for spam mail, and the feedback account 18e for non-spam mail are monitored, and when the storage of a new learning mail is recognized, it is based on the contents of the learning mail. Search database 13 and e-mail receiving terminal 4 is for learning Server classification using the e-mail search means 19 for retrieving feedback learning information that is a copy of the original e-mail that was used to create the rules, feedback learning information, server classification determination information, and recipient classification determination information And feedback learning means 20 for performing judgment feedback learning.
[0067]
The feedback learning method of the above system will be described below. First, when an e-mail sender sends an e-mail from the e-mail transmission terminal 3 to the e-mail address “username” of the e-mail in order to send an e-mail to the recipient, the e-mail is distributed by e-mail classification. Sent to the device 1. The e-mail classification and distribution apparatus 1 creates a copy of an e-mail including all information such as contents such as a mail text and header information, and stores the copy in the database 13.
[0068]
When a copy of the e-mail is stored in the database 13, the e-mail classification determination unit 14 analyzes the e-mail and determines whether it is spam mail.
[0069]
When a classification determination is made as to whether or not the mail is spam mail based on a predetermined algorithm, the determination result is attached to the electronic mail as server classification determination information. For example, when it is determined that the mail is spam mail, characters or symbols indicating spam mail are added to the title or header information of the electronic mail. Then, the electronic mail is stored in the user account 15 of the recipient.
[0070]
When the e-mail receiving terminal 4 requests the e-mail classification and distribution device 1 to distribute e-mail, and receives the distribution from the e-mail classification and distribution device 1, the e-mail receiving terminal 4 stores the e-mail in a predetermined holder. At that time, it may be stored in a spam mail holder prepared in advance based on the e-mail title or characters indicating spam mail added to the header information.
[0071]
When the recipient receives the email by the email receiving terminal 4, whether or not the email is spam mail based on the title, content, sender, etc. of the email, for example, separately from the server classification determination information. Make a classification decision. Then, it is confirmed whether the recipient classification determination is the same as the determination of the server classification determination information attached to the e-mail. Here, when the server classification determination information is different from the recipient classification determination information, for example, when the server classification determination information is determined to be spam mail even though it is determined to be spam mail, Alternatively, if it is determined by the server classification determination information that the mail is not spam mail but the receiver determines that the mail is spam mail, it is necessary to match the server classification determination with the receiver classification determination. The recipient causes the e-mail classification determination unit 14 to perform feedback learning. Further, even when the server classification determination and the recipient classification determination match, feedback learning may be performed for the purpose of training the e-mail classification determination means 14 in order to improve the certainty of the determination.
[0072]
When the e-mail classification determining unit 14 performs feedback learning, the recipient selects an e-mail that is determined to be spam mail on the monitor of the e-mail receiving terminal 4 and clicks a spam button displayed on the monitor. . When e-mail classification determination means 14 trains non-spam mail, an e-mail determined to be non-spam mail is selected and a non-spam button is clicked. As a result, the e-mail receiving terminal 4 copies the contents of the selected e-mail body of the e-mail as it is and extracts the learning e-mail from which the From header, To header, Date header, and Subject header are extracted from the e-mail header information. It is newly created and attached with recipient classification judgment information indicating spam mail or non-spam mail, and is sent back to the electronic mail classification distribution apparatus 1.
[0073]
When the learning mail receiving means 17 of the electronic mail classification distribution device 1 receives the reply of the learning mail from the electronic mail receiving terminal 4, the learning mail receiving means 17 sends the learning mail based on the recipient classification judgment information attached to the learning mail. It is stored in the spam mail feedback account 18d or the non-spam mail feedback account 18e.
[0074]
When the e-mail search means 19 recognizes the storage of the new learning mail in the spam mail feedback account 18d or the non-spam mail feedback account 18e, it searches the database 13 based on the contents of the learning mail, A copy (feedback learning information) of the original electronic mail used by the receiving terminal 4 to create the learning mail is taken out. The search in the database 13 is first performed based on the information of the From header, To header, Date header, and Subject header of the original email copied to the learning email by the email receiving terminal 4.
[0075]
Then, if the above header information fails to find a copy of the original e-mail in the database, a text search is performed in the database using the e-mail body of the e-mail copied to the learning e-mail. .
[0076]
When the e-mail search means finds a copy of the original e-mail in the database by the above search method, it retrieves it from the database and writes the recipient classification judgment information that it is spam mail or non-spam mail, Processing to send to the feedback learning means 20 is performed.
[0077]
When the feedback learning means 20 receives a copy of the e-mail from the database 13 by the e-mail search means 19, various information included in the copy of the e-mail and the recipient classification determination attached to the e-mail. Based on the information and the server classification determination information, a process for correcting the algorithm of the electronic mail classification determination means 14 is performed. In the present embodiment, processing for changing the judgment criteria of the e-mail classification judgment means 14 consisting of the keyword and the number of appearances thereof is performed.
[0078]
(Second embodiment)
Next, a second embodiment of the present invention will be described below. This system distributes an e-mail sent to an e-mail address provided by a company or the like to respond to an inquiry from a customer to the corresponding department according to the contents. 9 and 10 are system configuration diagrams in the present embodiment. The same components as those in the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
[0079]
The electronic mail classification and distribution device 1 includes user accounts 15f, 15g, 15h,... For each department such as general affairs, sales, human resources, general affairs, and technology, and corresponding feedback accounts 18f, 18g, 18h,. , And the database 13 has a user file for each department.
[0080]
The feedback learning method of the above system will be described below. When receiving an e-mail from the e-mail transmission terminal 3, the e-mail classification and distribution apparatus 1 creates a copy of the e-mail (feedback learning information) and stores it in the database 13. In addition, the electronic mail classification distribution device 1 makes an electronic mail classification determination by the electronic mail classification determination means 14 and stores it in the user account 15 of the classification determined to belong to the electronic mail. For example, if the electronic mail is classified and determined to be addressed to the general affairs, it is stored in the general affairs user count 15f.
[0081]
The general affairs can receive the distribution of the electronic mail in the general affairs user account 15f by operating the electronic mail receiving terminal 4 and requesting the electronic mail classification and distribution apparatus 1 to distribute the electronic mail. When it is determined that the delivered e-mail is not addressed to general affairs, the e-mail classification determining unit 14 is caused to perform feedback learning.
[0082]
Here, first, the general affairs determines to which department the e-mail that has been erroneously classified and delivered to the general affairs is addressed. For example, here, assuming that the email is a sales email addressed to a sales person, the general affairs clicks a sales button on the monitor in order to transfer the email to the email classification and distribution device 1 for feedback learning.
[0083]
As a result, the e-mail receiving terminal 4 creates a new learning e-mail that copies the e-mail content as it is and extracts the From header, To header, Date header, and Subject header from the e-mail header information. Recipient classification judgment information indicating that it is an e-mail addressed to a business is attached and sent back to the e-mail classification distribution device 1.
[0084]
When the learning mail receiving means 17 of the electronic mail classification distribution device 1 receives the reply of the learning mail from the electronic mail receiving terminal 4, the learning mail receiving means 17 sends the learning mail based on the recipient classification judgment information attached to the learning mail. Store in the business feedback account 18g.
[0085]
When the e-mail search means 19 recognizes the storage of the new learning mail in the sales feedback account 18g, it searches the database 13 based on the contents of the learning mail, and the e-mail receiving terminal 4 creates the learning mail. A copy (feedback learning information) of the original e-mail used to do so is taken out. Since the search method in the database 13 is the same as that of the first embodiment, its description is omitted.
[0086]
When the e-mail search means 19 finds a copy of the original e-mail in the database 13 by the above search method, the e-mail search means 19 takes it out from the database 13 and writes the recipient classification judgment information indicating that the e-mail is addressed to sales. Processing to send to the learning means 20 is performed.
[0087]
When the e-mail search unit 19 receives a copy of the e-mail from the database 13, the feedback learning unit 20 adds various information included in the e-mail copy (feedback learning information) and the e-mail. Based on the recipient classification determination information, the algorithm of the email classification determination means 14 is corrected.
[0088]
The present invention is not limited to the above-described embodiments and examples, and various modifications can be made without departing from the spirit of the present invention. For example, as in the first embodiment, when the algorithm of the e-mail classification determination unit 14 determines whether the e-mail is spam mail based on the keyword included in the e-mail and the number of appearances thereof, feedback As learning information, instead of creating a copy of the e-mail classification distribution device, feedback learning information including information on keywords included in the e-mail and the number of appearances thereof may be created and stored in the database.
[0089]
According to this, it is not necessary to count the keywords included in the copy of the e-mail and the number of appearances again in the e-mail classification judgment unit 14, and the feedback learning information created by the feedback learning information creation unit 12 is used. Classification decision can be made. Therefore, the processing speed of classification determination can be improved.
[0090]
Further, the database 13 stores only feedback learning information including keywords and the number of appearances thereof, and does not store the contents of the e-mail. Therefore, the contents of the e-mail can be understood only by browsing the database 13. It is not possible. Therefore, there is a merit that security is safe.
[0091]
In the above-described first and second embodiments, as the configuration of the electronic mail classification and distribution apparatus 1, the electronic mail received from the electronic mail transmission terminal 4 is copied and stored in the database 13, and then the electronic mail classification determination means However, the present invention is not limited to this. The e-mail received from the e-mail transmission terminal 3 is first stored in the user account 15 and the request from the e-mail reception terminal 4 is received. Accordingly, the electronic mail classification determining means 14 may determine the classification when distributing the electronic mail.
[0092]
【The invention's effect】
As described above, according to the feedback learning system of the email classification and delivery system and the feedback learning program thereof according to the present invention, when a learning email is returned from the email receiving terminal to the email classification and delivery device, the learning email As a trigger, the e-mail classification distribution device performs feedback learning for server classification determination. Therefore, the recipient who is the operator of the electronic mail receiving terminal only has to return the learning mail, and it is not necessary to master the operation dedicated to the filtering software in addition to the mail software as in the past. Moreover, it is not necessary to memorize a login procedure and a login password as in the conventional server-side method.
[0093]
In addition, since the e-mail classification and distribution device extracts feedback learning information from the database based on the content of the learning mail and performs feedback learning using the feedback learning information, feedback learning can be performed using accurate information. it can. Therefore, unlike the conventional case, there is no problem that the header information is changed by the transfer of the electronic mail and accurate information cannot be fed back.
[Brief description of the drawings]
FIG. 1 is a system schematic diagram showing an embodiment of the present invention.
FIG. 2 is a system schematic diagram showing the present embodiment.
FIG. 3 is a diagram illustrating an example of feedback learning information stored in a database.
FIG. 4 is a table showing keywords extracted from an e-mail by an e-mail classification determination unit and the number of appearances thereof.
FIG. 5 is a diagram illustrating an example of learning mail data.
FIG. 6 is a flowchart for explaining an example of an e-mail search method by e-mail search means.
FIG. 7 is a system schematic diagram showing the first embodiment.
FIG. 8 is a system schematic diagram showing the first embodiment.
FIG. 9 is a system schematic diagram showing a second embodiment;
FIG. 10 is a system schematic diagram showing a second embodiment;
[Explanation of symbols]
1 E-mail classification and distribution device
2 network
3 E-mail sending terminal
4 e-mail receiving terminals
11 Receiving means
12 Feedback learning information creation means
13 Database
14 E-mail classification judgment means
15 User account
16 Transmission means
17 Learning mail receiving means
18 Feedback Account
19 E-mail search means
20 Feedback learning means

Claims (10)

電子メール送信端末から送信された電子メールを受け取り、該電子メールが予め設定されている複数の分類のいずれに属するかのサーバ分類判断を行い、そのサーバ分類判断の結果をサーバ分類判断情報として前記電子メールに付して電子メール受信端末に配信する電子メール分類配信装置のフィードバック学習システムにおいて、
前記電子メール分類配信装置は、前記電子メール送信端末から電子メールを受け取ると、該電子メールが有する情報に基づいてフィードバック学習情報を作成してデータベースに格納し、
前記電子メール受信端末は、前記電子メール分類配信装置から前記電子メールの配信を受けると、前記電子メールが有する情報に基づいて前記データベースを検索するための検索情報を内容とする学習用メールを作成し、前記電子メール受信端末を操作する受信者によって行われた前記電子メールが前記複数の分類のいずれに属するかの分類判断の結果を受信者分類判断情報として前記学習用メールに付して前記電子メール分類配信装置に返信し、
前記電子メール分類配信装置は、前記学習用メールを受け取ると、前記学習用メールの内容に基づき前記データベース内を検索して前記電子メールの前記フィードバック学習情報を取り出し、該フィードバック学習情報と、前記サーバ分類判断情報及び前記受信者分類判断情報とを用いて前記分類判断のフィードバック学習を行うことを特徴とする電子メール分類配信装置のフィードバック学習システム。
The electronic mail transmitted from the electronic mail transmitting terminal is received, a server classification determination is made as to which of the plurality of preset classifications the electronic mail is, and the server classification determination result is used as the server classification determination information. In the feedback learning system of the e-mail classification and distribution device that distributes the e-mail to the e-mail receiving terminal,
The electronic mail classification and distribution device, upon receiving an electronic mail from the electronic mail transmitting terminal, creates feedback learning information based on information contained in the electronic mail and stores it in a database;
When the e-mail receiving terminal receives the e-mail distribution from the e-mail classification and distribution device, the e-mail receiving terminal creates a learning e-mail containing search information for searching the database based on information included in the e-mail. Then, the result of classification judgment as to which of the plurality of classifications the electronic mail performed by a recipient operating the electronic mail receiving terminal is attached to the learning mail as recipient classification judgment information. Reply to the e-mail classification delivery device,
Upon receiving the learning mail, the electronic mail classification and distribution device retrieves the feedback learning information of the electronic mail by searching the database based on the content of the learning mail, the feedback learning information, and the server A feedback learning system for an e-mail classification and distribution apparatus, which performs feedback learning of the classification determination using the classification determination information and the recipient classification determination information.
前記フィードバック学習情報は、
前記電子メールのコピーであることを特徴とする請求項1に記載の電子メール分類配信装置のフィードバック学習システム。
The feedback learning information is
The feedback learning system for an electronic mail classification and distribution apparatus according to claim 1, wherein the electronic mail is a copy of the electronic mail.
前記フィードバック学習情報は、
前記電子メールが有する情報に含まれている所定のキーワードとその登場回数からなることを特徴とする請求項1に記載の電子メール分類配信装置のフィードバック学習システム。
The feedback learning information is
The feedback learning system for an e-mail classification and distribution apparatus according to claim 1, comprising a predetermined keyword included in information included in the e-mail and the number of appearances thereof.
前記検索情報は、
前記電子メールのヘッダ情報のうち、Fromヘッダ、Toヘッダ、Dateヘッダ、Subjectヘッダの少なくとも一つに記載されている情報を含むことを特徴とする請求項1〜3のいずれかに記載の電子メール分類配信装置のフィードバック学習システム。
The search information is
The e-mail according to any one of claims 1 to 3, comprising information described in at least one of a From header, a To header, a Date header, and a Subject header among the header information of the e-mail. A feedback learning system for classification distribution devices.
前記検索情報は、
前記電子メールのコンテンツのコピーを含むことを特徴とする請求項1〜3のいずれかに記載の電子メール分類配信装置のフィードバック学習システム。
The search information is
4. The feedback learning system for an electronic mail classification and distribution apparatus according to claim 1, further comprising a copy of the content of the electronic mail.
前記学習用メールは、
前記電子メールを前記電子メール受信端末から前記電子メール分類配信装置に転送する場合に作成される転送メールであることを特徴とする請求項1〜5のいずれかに記載の電子メール分類配信装置のフィードバック学習システム。
The learning email is
The email classification and delivery device according to any one of claims 1 to 5, wherein the email is a transfer email created when the email is transferred from the email receiving terminal to the email classification and delivery device. Feedback learning system.
前記学習用メールは、
複数の電子メールのコピーを添付ファイルとして作成した転送メールであることを特徴とする請求項1〜5のいずれかに記載の電子メール分類配信装置のフィードバック学習システム。
The learning email is
6. The feedback learning system for an e-mail classification and distribution apparatus according to claim 1, wherein the e-mail classification and distribution apparatus is a transfer e-mail in which copies of a plurality of e-mails are created as attached files.
前記複数の分類は、
前記電子メールがジャンクメールであるか否かによって分類されていることを特徴とする請求項1〜7のいずれかに記載の電子メール分類配信装置のフィードバック学習システム。
The plurality of classifications are:
8. The feedback learning system for an e-mail classification and distribution apparatus according to claim 1, wherein the e-mail is classified according to whether or not it is junk mail.
前記複数の分類は、
前記電子メールが企業内に設定されている複数の部署のいずれに属するかによって分類されていることを特徴とする請求項1〜7のいずれかに記載の電子メール分類配信装置のフィードバック学習システム。
The plurality of classifications are:
8. The feedback learning system for an electronic mail classification and distribution apparatus according to claim 1, wherein the electronic mail is classified according to which of a plurality of departments set in a company.
電子メール送信端末から送信された電子メールを受け取り、該電子メールが予め設定されている複数の分類のいずれに属するかのサーバ分類判断を行い、そのサーバ分類判断の結果をサーバ分類判断情報として前記電子メールに付して電子メール受信端末に配信する電子メール分類配信装置に前記サーバ分類判断についてのフィードバック学習を行わせるフィードバック学習プログラムであって、
前記電子メール送信端末から受け取った電子メールが有する情報に基づいてフィードバック学習情報を作成してデータベースに格納し、
前記電子メール受信端末によって前記電子メールに基づいて作成され、前記データベースを検索するための検索情報を内容とし、前記電子メール受信端末を操作する受信者が行った前記電子メールが前記複数の分類のいずれに属するかの分類判断の結果である受信者分類判断情報が付された学習用メールを前記電子メール受信端末から受け取り、
該学習用メールの内容に基づき前記データベース内を検索して前記電子メールの前記フィードバック学習情報を取り出し、該フィードバック学習情報と、前記サーバ分類判断情報及び前記受信者分類判断情報とを用いて、前記電子メール分類配信装置に前記サーバ分類判断についてのフィードバック学習を行わせることを特徴とする電子メール分類配信装置のフィードバック学習プログラム。
The electronic mail transmitted from the electronic mail transmitting terminal is received, a server classification determination is made as to which of the plurality of preset classifications the electronic mail is, and the server classification determination result is used as the server classification determination information. A feedback learning program that causes an e-mail classification and distribution device that attaches to an e-mail to distribute to an e-mail receiving terminal to perform feedback learning about the server classification determination,
Creating feedback learning information based on information contained in the email received from the email sending terminal and storing it in a database;
The e-mail received by the recipient operating the e-mail receiving terminal is created based on the e-mail by the e-mail receiving terminal and contains search information for searching the database. Receiving from the e-mail receiving terminal an e-mail for learning with recipient classification determination information as a result of classification determination as to which belongs,
Retrieve the feedback learning information of the email by searching the database based on the content of the learning email, and using the feedback learning information, the server classification determination information and the recipient classification determination information, A feedback learning program for an e-mail classification and distribution apparatus, which causes the e-mail classification and distribution apparatus to perform feedback learning on the server classification determination.
JP2003209000A 2003-08-27 2003-08-27 E-mail system Expired - Fee Related JP3804017B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003209000A JP3804017B2 (en) 2003-08-27 2003-08-27 E-mail system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003209000A JP3804017B2 (en) 2003-08-27 2003-08-27 E-mail system

Publications (2)

Publication Number Publication Date
JP2005072672A true JP2005072672A (en) 2005-03-17
JP3804017B2 JP3804017B2 (en) 2006-08-02

Family

ID=34402071

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003209000A Expired - Fee Related JP3804017B2 (en) 2003-08-27 2003-08-27 E-mail system

Country Status (1)

Country Link
JP (1) JP3804017B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116680A (en) * 2007-11-07 2009-05-28 National Institute Of Information & Communication Technology Data kind detector and data kind detection method
US8442926B2 (en) 2008-01-08 2013-05-14 Mitsubishi Electric Corporation Information filtering system, information filtering method and information filtering program
JP2014220817A (en) * 2013-05-10 2014-11-20 走著▲焦▼股▲分▼有限公司 Server and communication behavior identification method used for server
US11032229B2 (en) 2015-07-31 2021-06-08 International Business Machines Corporation System and method for visual classification of email participants

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240105346A1 (en) * 2022-09-22 2024-03-28 Providence St. Joseph Health Optimizing messaging to service principals using machine learning

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116680A (en) * 2007-11-07 2009-05-28 National Institute Of Information & Communication Technology Data kind detector and data kind detection method
US8442926B2 (en) 2008-01-08 2013-05-14 Mitsubishi Electric Corporation Information filtering system, information filtering method and information filtering program
JP2014220817A (en) * 2013-05-10 2014-11-20 走著▲焦▼股▲分▼有限公司 Server and communication behavior identification method used for server
US11032229B2 (en) 2015-07-31 2021-06-08 International Business Machines Corporation System and method for visual classification of email participants

Also Published As

Publication number Publication date
JP3804017B2 (en) 2006-08-02

Similar Documents

Publication Publication Date Title
US10706060B2 (en) Systems and methods for re-ranking displayed conversations
US7406506B1 (en) Identification and filtration of digital communications
US8150926B2 (en) Organizing electronic mail messages into conversations
EP1447765B1 (en) Method, apparatus, and user interface for managing electronic mail and alert messages
US9794207B2 (en) Email conversation management system
KR101109339B1 (en) Schema hierarchy for electronic messages
US9015257B2 (en) Labeling messages with conversation labels and message labels
US9137190B2 (en) System and method for content-based message distribution
US6963904B2 (en) Method for correlating an electronic mail message with related messages
US20060031358A1 (en) System and method for managing mail messages
JP3799907B2 (en) Document management method and apparatus
JP3804017B2 (en) E-mail system
JP2002014903A (en) Method and device for retrieving electronic mail information
JP2005182154A (en) Message processing system and method
JP4802523B2 (en) Electronic message analysis apparatus and method
JP2006345331A (en) E-mail system
JP5909932B2 (en) Mail program, mail device, and mail display method
JP6061010B2 (en) Mail display program, mail display device, and mail display method
JP4807251B2 (en) Mail gateway apparatus, mail system, and mail reception status presentation method
JP2936665B2 (en) Information distribution system
JP2001125842A (en) Method and device for displaying result of retrieval
JP2004078623A (en) Junk mail check method and system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060427

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees